CN112348198A - 一种人机混合决策的机器行为在冲突中的协调方法 - Google Patents

一种人机混合决策的机器行为在冲突中的协调方法 Download PDF

Info

Publication number
CN112348198A
CN112348198A CN202011193756.4A CN202011193756A CN112348198A CN 112348198 A CN112348198 A CN 112348198A CN 202011193756 A CN202011193756 A CN 202011193756A CN 112348198 A CN112348198 A CN 112348198A
Authority
CN
China
Prior art keywords
machine
overtaking
man
decision
conflict
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011193756.4A
Other languages
English (en)
Inventor
刘峰
齐佳音
李志斌
杨峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai University Of International Business And Economics
East China Normal University
Original Assignee
Shanghai University Of International Business And Economics
East China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai University Of International Business And Economics, East China Normal University filed Critical Shanghai University Of International Business And Economics
Priority to CN202011193756.4A priority Critical patent/CN112348198A/zh
Publication of CN112348198A publication Critical patent/CN112348198A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W40/00Estimation or calculation of non-directly measurable driving parameters for road vehicle drive control systems not related to the control of a particular sub unit, e.g. by using mathematical models
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B60VEHICLES IN GENERAL
    • B60WCONJOINT CONTROL OF VEHICLE SUB-UNITS OF DIFFERENT TYPE OR DIFFERENT FUNCTION; CONTROL SYSTEMS SPECIALLY ADAPTED FOR HYBRID VEHICLES; ROAD VEHICLE DRIVE CONTROL SYSTEMS FOR PURPOSES NOT RELATED TO THE CONTROL OF A PARTICULAR SUB-UNIT
    • B60W60/00Drive control systems specially adapted for autonomous road vehicles

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mechanical Engineering (AREA)
  • Automation & Control Theory (AREA)
  • Mathematical Physics (AREA)
  • Transportation (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Traffic Control Systems (AREA)

Abstract

本发明涉及人工智能技术领域,具体涉及一种人机混合决策的机器行为在冲突中的协调方法,包括机器计算的超车收益Rvehicle以及人认为的超车收益Rhuman,Rvehicle=△t·v‑p·L,Rhuman=△t·v‑p·L‑M‑E,实施超车动作时的预期奖励为:r(s,a)=E[rt+1|st=s,at=a,st+1=s’],此时,最优策略π*=argmaxπE[R|π],得到的最大回报R=Σγr‑1t=0’rt+1,遵循策略的预期回报为:Vπ(s)=E[Rt|st=s]=Eπ[Σγk∞k=0rt+k+1|st=s,at=a],其中,γk为折扣因子,t为当前时点,k为远期步长,本发明通过上述基于大数据下人机混合决策的机器行为在人‑机决策冲突中的协调方法,可以使得在自动驾驶的过程中,能够有效区分人或机器槽孔,从而有效提升国内的自动驾驶技术,以及整体的行业水平。

Description

一种人机混合决策的机器行为在冲突中的协调方法
技术领域
本发明涉及人工智能技术领域,具体涉及一种人机混合决策的机器行为在冲突中的协调方法。
背景技术
目前的人工智能技术常常应用于汽车的自动驾驶行业,其中,所谓的人-机混合智能决策系统的输出,就包含了决策等机器行为,因此,其不可避免地会在一些具体场景中出现人的经验决策与机器在大数据下以数据驱动的方式进行推断时的决策相矛盾,因此,机器具体的“物理”场景中,最终决策时其“机理”要素与“人力”要素和“事理”要素三者之间如何更加透明的决策,同时又能够有效对机器实现某种决策要素的“增强”或“切段”的干预,就显得尤为重要。
就目前来讲,通常的人机混合决策还十分容易混淆机器指令,发生操作紊乱的情况,同时,人机混合决策还容易对机器本身的协调性产生影响,因此,行业里亟待研究出一种在冲突中协调的方法。
发明内容
针对现有技术中存在的不足,本发明提供了一种人机混合决策的机器行为在冲突中的协调方法,所要解决的技术问题是通过什么样的设计能够使得在自动驾驶的过程中,人或机器的操控能被有效地区分,并达到协调,从而有效提升行业水平和自动驾驶技术。
为解决上述技术问题,本发明提供的技术方案是:一种人机混合决策的机器行为在冲突中的协调方法,包括机器计算的超车收益Rvehicle以及人认为的超车收益Rhuman,还包括超车相对于不超车节约的时间△t、单位时间的价值v、超车事故发生的概率p、超车事故发生的损失L、承担礼让的成本M和人的预期收益E,Rvehicle=△t·v-p·L,Rhuman=△t·v-p·L-M-E;
将车辆动作的集合即人的干预作为A,A=a1,a2,a3,...,ak,将车辆行驶环境的集合作为S,S=s1,s2,…,st,st+1,车辆的超车策略π为S→A的集合映射过程,该动态过程为Pr{rt+1=r,st+1=s|s0,a,r1,…,st-1,at-1,rt,st,at},该过程具有马尔可夫性并简化为p(s’,r|s,a)=Pr{rt+1=r,st+1=s’|st,at},实施超车动作时的预期奖励为:r(s,a)=E[rt+1|st=s,at=a,st+1=s’],此时,最优策略π*=argmaxπE[R|π],得到的最大回报R=Σγr-1t=0’rt+1,遵循策略的预期回报为:Vπ(s)=E[Rt|st=s]=Eπ[Σγk∞k=0rt+k+1|st=s,at=a],其中,γk为折扣因子,t为当前时点,k为远期步长。
本技术方案所带来的有益效果是:通过上述基于大数据下人机混合决策的机器行为在人-机决策冲突中的协调方法,可以使得在自动驾驶的过程中,能够有效区分人或机器槽孔,从而有效提升国内的自动驾驶技术,以及整体的行业水平。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明一种人机混合决策的机器行为在冲突中的协调方法在实施方式中的推断原理图。
具体实施方式
以下结合附图对本发明的优选实例进行说明,应当理解,此处所描述的优选实例仅用于说明和解释本发明,并不用于限定本发明。
如图1所示,本发明一种人机混合决策的机器行为在冲突中的协调方法,有三种典型的决策推断过程:
Type1:对于处于“物理”环境中的车A决策需要满足“事理”、“机理”、“人理”三大要素,如车A对车B实施“超车”的决策,在“机理”要素和“人理”要素下可判定执行的可行性,执行方式通过满足“事理”要素来判定实时决策的方式方法;
Type2:在车A继续跟随车C实施“跟车”决策时,根据动态变化的“物理”环境来决策,从“事理”要素与“机理”要素来判断具备继续行驶的可行性(行车雷达监测直行道上并无障碍,且老人并没有移动)。人-机混合决策系统此时同时需耦合“人理”要素进行决策,如考虑道德等要素则会对车A实施“制动”的决策;
Type3:在车A继续跟随车C实施“跟车”决策时,根据动态变化的“物理”环境来决策,从“事理”要素与“机理”要素来判断具备继续行驶的可行性(行车雷达监测直行道上并无障碍,且老人并没有移动)。人-机混合决策系统此时根据历史数据(机器根据等待行人的动作特征分析历次在同样路口形成都是给车让人,并无任何意图走人行道的经验)进行学习后的策略,“人理”判定实施“行车”。但在汽车上的司机决策仍然存在危险进行“紧急制动”时,人-机混合决策系统能够有效对机器实现对“人理”增强的干预。
因此,根据上述三种典型的推断过程,我们可以得出人-机混合决策系统的形式化判定如下:机器计算的超车收益Rvehicle=△t·v-p·L,人认为的超车收益Rhuman=△t·v-p·L-M-E,判定条件为Rvehicle>0时实施超车,Rhuman>0时实施超车,其中△t为超车相对于不超车节约的时间,v是单位时间的价值,p是超车事故发生的概率,L是超车事故发生的损失,M为愿意承担礼让的成本,E代表人的预期收益。
由于人相对汽车更加复杂,因此人会受到文化环境和社交习惯的影响,会考虑道德因素或情感因素,更倾向于采取礼让的思维习惯而放弃超车行为,M在式中作为减项可以理解为超车会引发一定的道德风险或心里损失。此外,人具有一定的惰性,收益过小的事情可能不愿意去实施,达到一定的临界值才能激发人的行动,因此在人的决策模型中加入了期望收益E,而在机器决策中只考虑了收益是否大于成本,作为决定行动的依据。
将车辆动作的集合即人的干预作为A,A=a1,a2,a3,...,ak,将车辆行驶环境的集合作为S,S=s1,s2,…,st,st+1,车辆的超车策略π为S→A的集合映射过程,该动态过程为Pr{rt+1=r,st+1=s|s0,a,r1,…,st-1,at-1,rt,st,at},该过程具有马尔可夫性并简化为p(s’,r|s,a)=Pr{rt+1=r,st+1=s’|st,at},实施超车动作时的预期奖励为:r(s,a)=E[rt+1|st=s,at=a,st+1=s’],此时,最优策略π*=argmaxπE[R|π],得到的最大回报R=Σγr-1t=0’rt+1,遵循策略的预期回报为:Vπ(s)=E[Rt|st=s]=Eπ[Σγk∞k=0rt+k+1|st=s,at=a],其中,γk为折扣因子,t为当前时点,k为远期步长。
综上所述,通过上述基于大数据下人机混合决策的机器行为在人-机决策冲突中的协调方法,可以使得在自动驾驶的过程中,能够有效区分人或机器槽孔,从而有效提升国内的自动驾驶技术,以及整体的行业水平。
最后应说明的是:以上所述仅为本发明的优选实例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (1)

1.一种人机混合决策的机器行为在冲突中的协调方法,其特征在于:包括机器计算的超车收益Rvehicle以及人认为的超车收益Rhuman,还包括超车相对于不超车节约的时间△t、单位时间的价值v、超车事故发生的概率p、超车事故发生的损失L、承担礼让的成本M和人的预期收益E,Rvehicle=△t·v-p·L,Rhuman=△t·v-p·L-M-E;
将车辆动作的集合即人的干预作为A,A=a1,a2,a3,...,ak,将车辆行驶环境的集合作为S,S=s1,s2,…,st,st+1,车辆的超车策略π为S→A的集合映射过程,该动态过程为Pr{rt+1=r,st+1=s|s0,a,r1,…,st-1,at-1,rt,st,at},该过程具有马尔可夫性并简化为p(s’,r|s,a)=Pr{rt+1=r,st+1=s’|st,at},实施超车动作时的预期奖励为:r(s,a)=E[rt+1|st=s,at=a,st+1=s’],此时,最优策略π*=argmaxπE[R|π],得到的最大回报R=Σγr-1t=0’rt+1,遵循策略的预期回报为:Vπ(s)=E[Rt|st=s]=Eπ[Σγk∞k=0rt+k+1|st=s,at=a],其中,γk为折扣因子,t为当前时点,k为远期步长。
CN202011193756.4A 2020-10-30 2020-10-30 一种人机混合决策的机器行为在冲突中的协调方法 Pending CN112348198A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011193756.4A CN112348198A (zh) 2020-10-30 2020-10-30 一种人机混合决策的机器行为在冲突中的协调方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011193756.4A CN112348198A (zh) 2020-10-30 2020-10-30 一种人机混合决策的机器行为在冲突中的协调方法

Publications (1)

Publication Number Publication Date
CN112348198A true CN112348198A (zh) 2021-02-09

Family

ID=74356787

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011193756.4A Pending CN112348198A (zh) 2020-10-30 2020-10-30 一种人机混合决策的机器行为在冲突中的协调方法

Country Status (1)

Country Link
CN (1) CN112348198A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874597A (zh) * 2017-02-16 2017-06-20 北理慧动(常熟)车辆科技有限公司 一种应用于自动驾驶车辆的高速公路超车行为决策方法
CN107161155A (zh) * 2017-04-27 2017-09-15 大连理工大学 一种基于人工神经网络的车辆协同换道方法及其系统
CN110111605A (zh) * 2019-06-12 2019-08-09 吉林大学 基于动态博弈的自动驾驶车辆出入口匝道行驶决策方法
CN110298131A (zh) * 2019-07-05 2019-10-01 西南交通大学 一种混合驾驶环境下自动驾驶换道决策模型建立方法
CN110969848A (zh) * 2019-11-26 2020-04-07 武汉理工大学 一种对向双车道下基于强化学习的自动驾驶超车决策方法
US20200269871A1 (en) * 2019-02-27 2020-08-27 Zf Automotive Germany Gmbh Method and system for determining a driving maneuver
CN111717207A (zh) * 2020-07-09 2020-09-29 吉林大学 一种考虑人车冲突的协同转向控制方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874597A (zh) * 2017-02-16 2017-06-20 北理慧动(常熟)车辆科技有限公司 一种应用于自动驾驶车辆的高速公路超车行为决策方法
CN107161155A (zh) * 2017-04-27 2017-09-15 大连理工大学 一种基于人工神经网络的车辆协同换道方法及其系统
US20200269871A1 (en) * 2019-02-27 2020-08-27 Zf Automotive Germany Gmbh Method and system for determining a driving maneuver
CN110111605A (zh) * 2019-06-12 2019-08-09 吉林大学 基于动态博弈的自动驾驶车辆出入口匝道行驶决策方法
CN110298131A (zh) * 2019-07-05 2019-10-01 西南交通大学 一种混合驾驶环境下自动驾驶换道决策模型建立方法
CN110969848A (zh) * 2019-11-26 2020-04-07 武汉理工大学 一种对向双车道下基于强化学习的自动驾驶超车决策方法
CN111717207A (zh) * 2020-07-09 2020-09-29 吉林大学 一种考虑人车冲突的协同转向控制方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
SIMON ULBRICH等: "Probabilistic online POMDP decision making for lane changes in fully automated driving", 《16TH INTERNATIONAL IEEE CONFERENCE ON INTELLIGENT TRANSPORTATION SYSTEM》, pages 2064 - 2070 *
VOLKAN SEZER: "Intelligent decision making for overtaking maneuver using mixed observable Markov decision process", 《JOURNAL OF INTELLIGENT TRANSPORTATION SYSTEMS》, vol. 22, no. 03, pages 201 - 207 *
徐优志: "自动驾驶车辆高速道路环境下超车行为决策研究", 《中国优秀硕士学位论文全文数据库 (工程科技Ⅱ辑)》, no. 2018, pages 034 - 414 *
李志斌等: "机非物理分隔道路上自行车超车事件模型", 《东南大学学报(自然科学版)》, vol. 42, no. 01, pages 156 - 160 *
梁文斌: "网联环境下自主车的换道决策研究", ,《中国优秀硕士学位论文全文数据库 (工程科技Ⅱ辑)》, no. 2019, pages 034 - 441 *

Similar Documents

Publication Publication Date Title
Noh et al. Decision-making framework for automated driving in highway environments
Mirchevska et al. High-level decision making for safe and reasonable autonomous lane changing using reinforcement learning
CN109213148B (zh) 一种基于深度强化学习的车辆低速跟驰决策方法
CN111222630B (zh) 一种基于深度强化学习的自主驾驶规则学习方法
Czubenko et al. Autonomous driver based on an intelligent system of decision-making
Bian et al. An advanced lane-keeping assistance system with switchable assistance modes
CN114013443B (zh) 一种基于分层强化学习的自动驾驶车辆换道决策控制方法
US11934957B2 (en) Methods, systems, and apparatuses for user-understandable explainable learning models
JP6924629B2 (ja) 自動制御装置およびその制御方法
CN112937590B (zh) 一种智能车辆动态人机交互系统和方法
CN111653125B (zh) 一种无人驾驶汽车斑马线礼让行人模式的确定方法
CN112560277B (zh) 一种基于领域特定建模语言adsml的汽车自动驾驶场景建模方法
CN112365710B (zh) 一种基于概率输出模型的智能车辆换道决策方法
Criado et al. Human-inspired model for norm compliance decision making
Škugor et al. Analysis of a game theory-based model of vehicle-pedestrian interaction at uncontrolled crosswalks
CN112348198A (zh) 一种人机混合决策的机器行为在冲突中的协调方法
CN112068542B (zh) 一种基于模糊控制的自动驾驶行为规划方法
Xiao et al. Accident liability determination of autonomous driving systems based on artificial intelligence technology and its impact on public mental health
CN115515837A (zh) 用于机动车的全自动引导方法和系统以及机动车
CN114503133A (zh) 信息处理设备、信息处理方法和程序
Eilers et al. The learning of longitudinal human driving behavior and driver assistance strategies
CN108898284B (zh) 一种车联网管理控制策略评估方法及系统
Taourarti et al. Towards Cross-Cultural Intelligent Vehicles: A Review
Kulicki et al. Virtue ethics for autonomous cars (short version)
Kulicki et al. Judging actions on the basis of prima facie duties. The case of self-driving cars

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination