东风汽车集团有限公司是中央直管的特大型汽车企业,是中国汽车行业内产业链最齐全、产品阵营最丰富的汽车企业之一,产品覆盖高档、中档、经济型各区隔,业务涵盖全系列商用车、乘用车、军车、新能源汽车、关键汽车总成和零部件、汽车装备、出行服务、汽车金融等。
(资料图)
东风集团智能网联专业副总师别韦苇博士以《人机共驾策略中的驾驶状态及交互研究》为主题展开演讲,以下是演讲内容整理:
东风集团智能网联专业副总师别韦苇博士
本次演讲主要分为以下四个部分:智能驾驶领域的人机共驾概念;人机共驾策略中的驾驶员状态分析;典型驾驶状态的交互研究;最后是小结与展望。
智能驾驶领域的人机共驾概念
首先讲一下智能驾驶领域的人机共驾概念,人机共驾在广义上的概念是“驾驶员与智能驾驶系统以一种持续协同合作的方式共同控制车辆,完成驾驶任务”。根据有自主权的控制主体,第一是自然驾驶人,第二是自动驾驶系统,根据控制主体分工方式的差别,相应的研究将人机共驾分为单驾双控、串联型双驾单控、并联型双驾双控三种常见类型。
第一个是单驾双控,此时车辆控制只能有驾驶人员进行单向的控制权的移交以及回收。第二种是串联型的双驾单控,此时控制主体对于车辆的控制是分时交替的,也就是说同一时间段内,参与驾驶操作的只能是人和系统中的任意一个。系统独立驾驶的时候,驾驶人要处于驾驶任务下发、引导或监管的角色范围内,第二种结构也是目前量产车型里面应用的比较多的结构。
最后就是并联型双驾双控结构,此时是由驾驶人和智驾系统共享策略协同决策的驾驶模式。也就是说,驾驶过程当中是同时分权的,比如说系统发现驾驶员分心了,就会向驾驶员发出驾驶权移交的请求,总的来说是采取最小的风险策略以确保行车的安全。
图片来源:东风集团 别韦苇
从无人车架构的角度看,人机共驾系统跟单车智能模块的组成比较类似,分为感知、决策以及控制三个层次。当前条件下,无人车的自动驾驶系统局限性主要是技术以及场景的局限性,这一点也决定了人机共驾的必要性。
首先,数据级对于真实环境的概括不一定是全面的,包括现在非常热的数据闭环的概念,它也涉及到需要大量的人力、物力以及投资的投入,是一个建设时间非常长的过程。同时在算法的训练过程当中,也会出现一些过渡拟合的情况,这些都会导致感知环境和真实环境之间存在一定的偏差。
第二,算法本身对于特征提取和归纳的能力局限也会影响到预测的准确性,同时,在决策模块当中,机器决策如果不和人类专家的经验相结合,相关的博弈也很难引入。这是因为人类对于环境的理解、认知以及对于未来状态的预测,跟个人状态的不同密切相关。比如在疲劳、情绪非常不好的情况下,人类对于环境的理解以及预期都会受到影响。相应的决策、评估的准确性也和本人的能力、经验、受过的训练密切相关,为了实现对于车辆的有效控制,必须要求人和系统组成的团队都必须共同保持对于外界环境感知的充分性和准确性。
第三,再从SOTIF预期功能安全的角度说一下人机共驾的必要性。功能安全主要解决的是电子电气系统内部故障和失效的问题,一般涉及部件、模块参数的永久性改变。但是SOTIF预期功能安全解决的是系统在特定条件下非预期行为导致的功能安全不足的问题,比如人为的误操作、环境干扰、恶劣天气的影响。这其中人为的操作是指用户对于功能本身、功能的行为、功能的限制,所呈现功能的理解存在相关的偏差,以至于误操作。这些都是SOTIF预期功能安全需要考虑的范畴,通过一些相关的特定的场景中对于SOTIF的验证以及策略的确认,最终可以证明剩余的风险在可接受的范围当中。
人机共驾领域主要的研究内容主要分为以下五个部分:首先是如何根据车辆智能化的等级、智能汽车所处的驾驶环境确认人机共驾的结构(单驾、双驾),意义在于厘清驾驶员和系统在人机共驾的过程中分别扮演了什么样的角色,是控制权切换的关系还是控制权实时动态分享的关系。
第二,如何根据两个驾驶主体的能力状态和驾驶环境进行驾驶权限和责任的实时分配。第三,如何确定不同车辆智能化等级下,自然驾驶人最大注意力分散的程度。美国高速公路局建议视线离开道路的时间是要小于等于2秒的,要完成整个驾驶任务,人类驾驶员的视线离开道路的累计时间应该小于12秒。
第四,如何提高系统对于自然驾驶人状态监测以及驾驶意图识别的准确性,现在在量产车型里面应用比较多的也就是对驾驶人员的正常驾驶状态、非正常驾驶状态、极端状态的识别,同时基于对驾驶员的行为分析进一步明确其驾驶意图,从而提升人机共驾权责分配的准确性。
第五,如何通过驾驶人建模,来模拟自然驾驶人不同驾驶操作和驾驶意图,这里以“即将靠边停车”为例,这个意图由以下三步骤构成,首先是驾驶员视线向后视镜观察一秒,同时驾驶人在前5秒油门踩踏的力度下降,结合地图和定位,车辆已经进入了驾驶人通常的停靠区域。通过以上的行为拆解,可以建立人脑意图的认知模型,进行驾驶意图的推理。
人机共驾策略中的驾驶员状态分析
第二部分是人机共驾策略中驾驶员状态的分析,目前,量产车型搭载的技术主要还是通过视觉跟踪和动作识别技术来检测驾驶员的驾驶行为以及相应的生理状态,一旦判断出驾驶员处于非正常驾驶状态,系统就会发出报警,执行一些其他的安全策略保证车辆的安全运行。
在判断分析驾驶员状态的过程当中,对驾驶员接管能力的判断是一个难点。主要是基于驾驶员面部、眼部信号,通过对驾驶员生理信号的客观评价来确保评价和分级的准确性。现在非正常驾驶状态的研究主要是以下几个部分:分心驾驶、疲劳驾驶以及情绪异常的驾驶。危险行为状态的研究主要是饮酒、打电话以及吸烟的动作。
图片来源:东风集团 别韦苇
在非正常驾驶状态的识别过程中,首先要建立非正常驾驶状态分析和检测所需的样本数据库,同时构建有效识别非正常驾驶状态分类器的模型,最终达到识别的结果。
首先以疲劳驾驶单模态状态分析为例,首先通过车内摄像头的原始图片进行人脸的相关检测,通过边框回归进行面部重点区域的抓取,对目标点进行定位,对关键特征点进行识别,最终确认驾驶员的状态是不是满足手动驾驶条件,由系统发出相应的接管请求。
分心驾驶主要是分析两大块,一个是计算头部姿态,主要从三个向量进行头部姿态分析,在人的面部旋转角度较大的情况下,计算头部姿态很容易出现人脸的特征点丢失,这时系统会同样认为其已经超出姿态阈值,并判断驾驶员是出于分心的状态。与此同时,还要计算通过虹膜的目标点的定位,进行特征点识别,最终确认驾驶员状态不满足手动驾驶条件。
典型驾驶状态的交互研究
第三部分是典型驾驶状态相关的交互研究,首先要陈述下系统确定性这个概念,这表示系统能够完成目前的驾驶任务,认为目前的驾驶任务在ODD的设计范围之内,可以执行自动驾驶的任务。此外,在系统确认有故障的时候,会进行功能的退出、降级,或者向人类驾驶员发出接管请求。
而驾驶员确定性的意思是,如果驾驶员认为系统是可以处理目前的场景以及任务,那么驾驶员就主要处于监管员的状态下,由系统完成驾驶任务。当驾驶员认为系统无法完成目前的驾驶任务时,就会直接干预,进行横向以及纵向控制。或者是说,当系统发出接管请求的时候,驾驶员确定可以接管,就会把控制权接管过来,这个过程中,系统必须要进行最小风险的操作。
无论是系统确定性还是驾驶员的确定性,这之间都存在第三个维度,也就是驾驶员和系统双方的主观确定性。所以要考虑以下几种方向:如何保证系统以及驾驶员确定性的准确性;如何保证切换后操作的有效性;如何确保最终驾驶动作的最佳性;这些都是目前考虑比较多的问题。
再回到最初所讲的目前人机共驾系统研究的几种典型架构,其中串联型双驾单控切换是目前大多数量产车型所用的结构,业内重点研究切换时间和切换后的接管效果。我们主要研究两个重点,一个是接管时间,也就是从系统发出接管请求到驾驶人操作方向盘、踏板来实现手动接管,这个过程所用时间的总和。还有一个就是请求发送的时机:如果驾驶人不接管控制,从系统发出接管请求到发出预警之间的紧急时间应该设定为多少。
图片来源:东风集团 别韦苇
介绍下人类驾驶员主动干预、横向干预、纵向干预的相关研究。一般情况下,对于自动驾驶控制而言,检测到有碰撞危险的时候,系统可以通过紧急制动或紧急转向功能进行避撞。实际的过程中,需要权衡两者之间避撞的权重来进行决策。在这个过程当中,系统一定要通过算法来进行充分的检测,进而判断驾驶员如何去接管,是进行横向干预还是纵向干预。尤其在高速场景下,随着速度的增加,驾驶员对于前方危险的预判能力会越来越弱,反应时间也会非常滞后,为了保证驾驶员和车辆控制系统的稳定性,必须要缩短驾驶员干预的延迟时间来进行补偿。
小结和展望
总的来说,串联双控的人机共驾结构是量产车型用的比较多的,驾驶员状态检测与分析方面,量产车型中多数采用驾驶员面部检测系统的模式进行。在智能驾驶相关功能的同质化比较严重的情况下,目前的研究重点更多还是在研究共驾策略个性化上,比如说根据不同的驾驶员的驾驶习惯,反应水平、对驾驶的体验追求来定制共驾策略,以达到个性化的目的。此外,还可以从基础可视化面板、HMI人机交互界面设计入手,为驾驶员提供更有温度的驾驶体验。
(以上内容来自东风集团智能网联专业副总师别韦苇博士于2022年9月16日由盖世汽车主办的2022第五届自动驾驶与人机共驾论坛发表的《人机共驾策略中的驾驶状态及交互研究》主题演讲。)