CN114932552A - 协作机器人主动动作决策方法、系统、设备及存储介质 - Google Patents

协作机器人主动动作决策方法、系统、设备及存储介质 Download PDF

Info

Publication number
CN114932552A
CN114932552A CN202210611684.3A CN202210611684A CN114932552A CN 114932552 A CN114932552 A CN 114932552A CN 202210611684 A CN202210611684 A CN 202210611684A CN 114932552 A CN114932552 A CN 114932552A
Authority
CN
China
Prior art keywords
robot
fuzzy set
human
intuitive fuzzy
person
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210611684.3A
Other languages
English (en)
Other versions
CN114932552B (zh
Inventor
杜慧龙
王雯
傅卫平
刘波
李睿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian University of Technology
Original Assignee
Xian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian University of Technology filed Critical Xian University of Technology
Priority to CN202210611684.3A priority Critical patent/CN114932552B/zh
Publication of CN114932552A publication Critical patent/CN114932552A/zh
Application granted granted Critical
Publication of CN114932552B publication Critical patent/CN114932552B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1674Programme controls characterised by safety, monitoring, diagnostic
    • B25J9/1676Avoiding collision or forbidden zones
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1656Programme controls characterised by programming, planning systems for manipulators
    • B25J9/1664Programme controls characterised by programming, planning systems for manipulators characterised by motion, path, trajectory planning
    • B25J9/1666Avoiding collision or forbidden zones
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Robotics (AREA)
  • Mechanical Engineering (AREA)
  • Feedback Control In General (AREA)
  • Manipulator (AREA)

Abstract

本发明属于机器人控制领域,公开了一种协作机器人主动动作决策方法、系统、设备及存储介质,包括:获取人和机器人的当前位置、当前速度以及目标点位置,并通过预设的效率直觉模糊集模型,得到人和机器人的效率直觉模糊集;获取人的当前心理安全场场强,得到人的舒适度梯形直觉模糊集;获取人和机器人之间的距离,得到机器人的安全性直觉模糊集;加权人的效率直觉模糊集和舒适度梯形直觉模糊集,得到人的动作意图的直觉模糊集;加权人的动作意图的直觉模糊集、机器人的效率直觉模糊集以及机器人的安全性直觉模糊集,得到避碰直觉模糊集;根据避碰直觉模糊集,得到机器人是否采取避让的动作决策,有效提高预测准确性,降低碰撞情况的发生。

Description

协作机器人主动动作决策方法、系统、设备及存储介质
技术领域
本发明属于机器人控制领域,涉及一种协作机器人主动动作决策方法、系统、设备及存储介质。
背景技术
协作机器人的自主决策能力,是降低与工人碰撞的风险、提高合作效率的有效手段,是实现机器人安全自主和灵活性的重要能力,但当前协作机器人的决策能力并不满足复杂的工业制造领域,在有人存在的复杂动态系统中,缺乏综合考虑工作效率、碰撞风险及工人的非理性等因素对机器人避碰决策行为的相关研究。
为了做出最优的行为决策,协作机器人需要预判人要通过潜在碰撞区域的意愿有多大,需要可以实时准确监测人机间碰撞距离的设备和算法,需要估计自身的工作效率,并结合三种因素来综合判断并在极短的时间内做出安全合理的决策。而人做出的判断和决策往往是主观的、有限理性的,当协作机器人与人近距离工作在具有潜在碰撞风险的场景时,频繁判断碰撞风险会极大增加人对工作的认知负荷,且由于协作机器人较低的决策分析能力,极易造成判断的失误,进而导致协作机器人与人之间的碰撞风险增大。
发明内容
本发明的目的在于克服上述现有技术中,由于协作机器人较低的决策分析能力,导致协作机器人与人之间的碰撞风险增大的缺点,提供一种协作机器人主动动作决策方法、系统、设备及存储介质。
为达到上述目的,本发明采用以下技术方案予以实现:
本发明第一方面,一种协作机器人主动动作决策方法,包括:
获取人和机器人的当前位置、当前速度以及目标点位置,并通过预设的效率直觉模糊集模型,得到人和机器人的效率直觉模糊集;
获取人的当前心理安全场场强,并通过预设的舒适度直觉模糊集模型,得到人的舒适度梯形直觉模糊集;
获取人机之间的距离,计算人和机器人以当前速度移动到潜在碰撞区域的时间,以及机器人以预设最大加速度减速到停止的时间,利用评估碰撞风险方法,得到机器人的安全性直觉模糊集;
加权人的效率直觉模糊集和舒适度梯形直觉模糊集,得到人的动作意图的直觉模糊集;
加权人的动作意图的直觉模糊集、机器人的效率直觉模糊集以及机器人的安全性直觉模糊集,得到避碰直觉模糊集;
根据避碰直觉模糊集,得到机器人是否采取避让的动作决策。
可选的,所述通过预设的效率直觉模糊集模型,得到人和机器人的效率直觉模糊集包括:
通过下式得到人的效率直觉模糊集
Figure BDA0003673242710000021
Figure BDA0003673242710000022
Figure BDA0003673242710000023
Figure BDA0003673242710000024
Figure BDA0003673242710000025
Figure BDA0003673242710000026
通过下式得到机器人的效率直觉模糊集
Figure BDA0003673242710000027
Figure BDA0003673242710000028
Figure BDA0003673242710000029
其中,
Figure BDA00036732427100000210
为人的效率直觉模糊集,μH(t)和υH(t)分别为人的效率直觉模糊集随时间t变化的隶属度和非隶属度函数,
Figure BDA00036732427100000211
为机器人的效率直觉模糊集,μR(t)和υR(t)分别为机器人的效率直觉模糊集随时间t变化的隶属度和非隶属度函数,t0为当前位置人以当前速度到达目标点所需的时间,ts为人以最大速度1.8m/s到达目标点所需的时间,tl为人以(ts,1)和
Figure BDA0003673242710000031
确定的直线与X轴相交点的X轴坐标,S为当价值函数的值为零时对应的时间,f(t)为价值函数,w+(p)和w-(p)分别为决策权重函数在收益区域和损失区域的值,γ、δ、α和β为预设参数,0<γ,δ<1,λ是损失厌恶系数,当λ>1时,人类被建模为损失厌恶者,对损失的重视程度高于收益,p表示以时间t到达目标点位置的概率,tsr为机器人以最大速度运动到目标点所需的时间;tr为机器人以当前速度到达目标点所需的时间;tlr为以(tsr,1)和
Figure BDA0003673242710000032
确定的直线与X轴相交点的X轴坐标,机器人效率价值函数在tlr时刻的效率为零。
可选的,所述获取人的当前心理安全场场强,通过预设的舒适度直觉模糊集模型,得到人的舒适度梯形直觉模糊集包括:
根据机器人的当前速度,通过下式的心理安全场场强公式得到人的当前心理安全场场强:
SEp=SEI+SEV
Figure BDA0003673242710000033
Figure BDA0003673242710000034
其中,SEP为心理安全场,SEI为静态障碍物产生的势能场,SEV为机器人运动对人造成的心理压力情绪形成的动能场,Mo为障碍物的质量,单位是kg;dI为障碍物与周围环境的距离标量,ko是心理安全场常数,单位是N·m2/kg2,qo是障碍物的危险程度,根据障碍物的性质、体积、尖锐程度等的不同而取值不同,kr表示人对机器人运动危险程度的认知,单位是N·m2/kg2,决定于个人的性别、性格和经验等,qr是机器人及其夹持物体的危险程度,根据机器人外形、体积和夹持的物品等的不同取值不同,Mr是机器人的质量,单位是kg;dV为机器人基座中心点周围环境之间的标量距离,Sp(dr,v)代表了机器人不同的运动方式对人造成的心理压力情绪的影响规律,当机器人与人最近的运动部件以不同的最小间距dr、速度v和接近方向接近人时,对人造成的心理压力情绪不同,首先判断机器人距离人体最近的部位是头部、胸部还是腹部,再根据最接近的部位选用影响规律方程:
Sh=z0h+ah·dr+bh·v+ch·dr 2+dh·v2+eh·dr·v
Sc=z0c+ac·dr+bc·v+cc·dr 2+dc·v2+ec·dr·v
Sa=z0a+aa·dr+ba·v+ca·dr 2+da·v2+ea·dr·v
Sh、Sc、Sa分别为机器人靠近人体头部、胸部和腹部时对人造成的心理压力情绪Sp(dr,v),z0h、z0c、z0a、ah、ac、aa、bh、bc、ba、ch、cc、ca、eh、ec和ea均为拟合参数,dr为机器人与人最近的运动部件和人之间的间距、v为机器人接近人的速度。
通过下式得到人的舒适度梯形直觉模糊集
Figure BDA0003673242710000041
Figure BDA0003673242710000042
Figure BDA0003673242710000043
其中,
Figure BDA0003673242710000044
为人的舒适度梯形直觉模糊集,μSE(x)和νSE(x)分别为人的舒适度梯形直觉模糊集的隶属度和非隶属度函数,SEPh为机器人当前动作对人的心理影响的大小,h为机器人当前动作速度,SEP0.3,SEP0.5,SEP0.8,SEP1为机器人速度分别在0.3m/s、0.5m/s、0.8m/s和1m/s时的SEPh,wa和ua分别为预设的人感到最舒适的隶属度和对应的非隶属度;
可选的,所述获取人和机器人之间的距离,计算人和机器人以当前速度移动到潜在碰撞区域的时间,以及机器人以预设最大加速度减速到停止的时间,利用评估碰撞风险方法,得到机器人的安全性直觉模糊集包括:
获取人和机器人之间的距离,计算人和机器人以当前速度移动到潜在碰撞区域的时间TTRh和TTRr,以及机器人以预设最大加速度减速到停止的时间TTSr,通过下式得到:
Figure BDA0003673242710000051
Figure BDA0003673242710000052
Figure BDA0003673242710000053
其中,TTRh和TTRr分别为人和机器人以当前速度移动到潜在碰撞区域的时间,TTSr为机器人以预设最大加速度减速到停止的时间,ph为人的当前位置,pc为潜在碰撞区域的位置,ae为机器人的加速度,pr为机器人的当前位置,vh为人的当前速度,vr为机器人的当前速度。
通过下式得到机器人的安全性直觉模糊集
Figure BDA0003673242710000054
Figure BDA0003673242710000055
μS(x)=1-νS(x)
其中,
Figure BDA0003673242710000056
为机器人的安全性直觉模糊集,μS(x)和νS(x)分别为机器人的安全性直觉模糊集的隶属度和非隶属度函数,
Figure BDA0003673242710000057
为机器人在到达碰撞区域的剩余时间,
Figure BDA0003673242710000058
TTRh和TTRr分别为人和机器人以当前速度移动到潜在碰撞区域的时间,TTSr为机器人以预设最大加速度减速到停止的时间,vh为人的当前速度,vr为机器人的当前速度。
可选的,所述加权人的效率直觉模糊集和舒适度梯形直觉模糊集,得到人的动作意图的直觉模糊集包括:
获取人对于效率和舒适度的重要性权重;
根据人对于效率和舒适度的重要性权重,通过下式加权人的效率直觉模糊集和舒适度梯形直觉模糊集,得到人的动作意图的直觉模糊集
Figure BDA0003673242710000059
Figure BDA00036732427100000510
其中,
Figure BDA00036732427100000511
为人的动作意图的直觉模糊集,μK(x)和νK(x)分别为人的动作意图的直觉模糊集的隶属度和非隶属度函数,wE和wSE分别为人对于效率和舒适度的重要性权重,
Figure BDA0003673242710000061
为人的效率直觉模糊集,
Figure BDA0003673242710000062
为人的舒适度梯形直觉模糊集。
可选的,所述加权人的动作意图的直觉模糊集、机器人的效率直觉模糊集以及机器人的安全性直觉模糊集,得到避碰直觉模糊集包括:
获取机器人对安全性、人的动作意图和工作效率的重要性权重;
根据机器人对安全性、人的动作意图和工作效率的重要性权重,通过下式加权人的动作意图的直觉模糊集、机器人的效率直觉模糊集以及机器人的安全性直觉模糊集,得到避碰直觉模糊集
Figure BDA0003673242710000063
Figure BDA0003673242710000064
其中,
Figure BDA0003673242710000065
为避碰直觉模糊集,μC(x)和νC(x)分别为避碰直觉模糊集的隶属度和非隶属度函数,wS,wK
Figure BDA0003673242710000066
分别为机器人对安全性、人的动作意图和工作效率的重要性权重,
Figure BDA0003673242710000067
为机器人感知的安全性直觉模糊集,
Figure BDA0003673242710000068
为人的动作意图的直觉模糊集,
Figure BDA0003673242710000069
为机器人的效率直觉模糊集。
可选的,所述根据避碰直觉模糊集,得到机器人是否采取避让的动作决策包括:
当人采取通过潜在碰撞区域而机器人暂时屈服时,将避碰直觉模糊集记作
Figure BDA00036732427100000610
当人采取暂时屈服而机器人采取通过潜在碰撞区域动作时,将避碰直觉模糊集记作
Figure BDA00036732427100000611
其中,
Figure BDA00036732427100000612
Figure BDA00036732427100000613
分别为当人采取通过潜在碰撞区域而机器人暂时屈服时避碰直觉模糊集
Figure BDA00036732427100000614
的隶属度和非隶属度函数,
Figure BDA00036732427100000615
Figure BDA00036732427100000616
分别为当人采取暂时屈服而机器人采取通过潜在碰撞区域动作时避碰直觉模糊集
Figure BDA00036732427100000617
的隶属度和非隶属度函数;
通过预设的直觉模糊集排序方法,比较
Figure BDA00036732427100000618
Figure BDA00036732427100000619
的大小,当
Figure BDA00036732427100000620
大于
Figure BDA00036732427100000621
时,人采取通过潜在碰撞区域而机器人暂时屈服;否则,人采取暂时屈服而机器人采取通过潜在碰撞区域动作;
其中,预设的直觉模糊集排序方法包括:
Figure BDA00036732427100000622
Figure BDA00036732427100000623
依次作为模糊集
Figure BDA00036732427100000624
通过下述方式得到
Figure BDA00036732427100000625
Figure BDA00036732427100000626
的排序结果:
Figure BDA00036732427100000627
的得分值和精确值分别为:
Figure BDA00036732427100000628
Figure BDA00036732427100000629
时,
Figure BDA0003673242710000071
大于
Figure BDA0003673242710000072
Figure BDA0003673242710000073
时,如果
Figure BDA0003673242710000074
Figure BDA0003673242710000075
等于
Figure BDA0003673242710000076
如果
Figure BDA0003673242710000077
Figure BDA0003673242710000078
小于
Figure BDA0003673242710000079
如果
Figure BDA00036732427100000710
Figure BDA00036732427100000711
大于
Figure BDA00036732427100000712
其中,μ和ν分别为模糊集
Figure BDA00036732427100000713
的隶属度和非隶属度函数,
Figure BDA00036732427100000714
为模糊集
Figure BDA00036732427100000715
的得分值,
Figure BDA00036732427100000716
为模糊集
Figure BDA00036732427100000717
的精确值。
本发明第二方面,一种协作机器人主动动作决策系统,包括:
效率处理模块,用于获取人和机器人的当前位置、当前速度以及目标点位置,并通过预设的效率直觉模糊集模型,得到人和机器人的效率直觉模糊集;
舒适度处理模块,用于获取人的当前心理安全场场强,并通过预设的舒适度直觉模糊集模型,得到人的舒适度梯形直觉模糊集;
安全性处理模块,用于获取人和机器人之间的距离,计算人和机器人以当前速度移动到潜在碰撞区域的时间,以及机器人以预设最大加速度减速到停止的时间,利用评估碰撞风险方法,得到机器人的安全性直觉模糊集;
第一加权模块,用于加权人的效率直觉模糊集和舒适度梯形直觉模糊集,得到人的动作意图的直觉模糊集;
第二加权模块,用于加权人的动作意图的直觉模糊集、机器人的效率直觉模糊集以及机器人的安全性直觉模糊集,得到避碰直觉模糊集;
决策模块,用于根据避碰直觉模糊集,得到机器人是否采取避让的动作决策。
本发明第三方面,一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述协作机器人主动动作决策方法的步骤。
本发明第四方面,一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述协作机器人主动动作决策方法的步骤。
与现有技术相比,本发明具有以下有益效果:
本发明协作机器人主动动作决策方法,基于获取的人和机器人的当前位置、当前速度以及目标点位置,通过预设的效率直觉模糊集模型,得到人和机器人的效率直觉模糊集,并且获取人的当前心理安全场场强,并通过预设的舒适度直觉模糊集模型,得到人的舒适度梯形直觉模糊集,通过获取人机之间的距离,分别计算人和机器人以当前速度移动到潜在碰撞区域的时间,以及机器人以预设最大加速度减速到停止的时间,得到机器人的安全性直觉模糊集,然后加权人的效率直觉模糊集和舒适度梯形直觉模糊集,得到人的动作意图的直觉模糊集,考虑到了人对工作效率的判断存在着主观情绪影响,使得对人类意图的建模更加贴近现实,最终加权人的动作意图的直觉模糊集、机器人的效率直觉模糊集以及机器人的安全性直觉模糊集,得到避碰直觉模糊集,融合人的意图、安全性和效率三者,有效提高预测人在具有潜在碰撞风险情形下的主观动作决策意图的准确性,降低机器人与人之间的碰撞情况的发生。
附图说明
图1是本发明实施例的人和机器人在狭小空间近距离协同装配时在同一位置拾取或者放置零件交互场景的具体描述示意图;
图2是本发明实施例的协作机器人主动动作决策方法的整体流程图;
图3是本发明实施例的人认为的决策权重函数曲线图;
图4是本发明实施例的期望效用函数和累积前景函数的关系图;
图5是本发明实施例的人的效率的直觉模糊集曲线图;
图6是本发明实施例的机器人的效率的直觉模糊集曲线图;
图7是本发明实施例的人的舒适度直觉模糊数的隶属度和非隶属度函数曲线图;
图8是本发明实施例的人机双方同时趋向潜在碰撞区域时人和机器人的决策结果统计图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
针对背景技术中所介绍的,协作机器人的自主决策能力,是降低与工人碰撞的风险、提高合作效率的有效手段,是实现机器人安全自主和灵活性的重要能力,但当前协作机器人的决策能力并不满足复杂的工业制造领域,在有人存在的复杂动态系统中,缺乏综合考虑工作效率、碰撞风险、工人的非理性等因素对机器人避碰决策行为的相关研究。因此,目前缺乏一种可以衡量人的模糊决策意图并制定决策的方法来解决协作机器人的主动动作决策问题,以提高协作机器人工作效率、人机安全性、降低人的认知负荷、提高舒适度和信任感。
针对这一问题,本发明提出了一种协作机器人主动动作决策方法,允许机器人在近距离合作时,实时根据人类同事的动作选择适当的行动。所提出的协作机器人主动动作决策方法以人机协作场景中,人机同时趋向同一目标或动作轨迹产生重合的场景作为研究对象,综合考虑安全性、工人的意图和机器人工作效率因素,评价静态斗鸡博弈中出现的两种纳什均衡的得分值和精度值,实现协作机器人主动动作决策。下面对上述方案进行详细阐述。
下面结合附图对本发明做进一步详细描述:
参见图1,图中的场景给出人机在共享空间中相互配合中遇到的挑战:人和机器人都在同一位置拾取零件完成装配,此时,机器人无法通过改变轨迹的方式避开人,有限的空间必须让机器人在极短的时间内做出继续运行或者加速通过潜在碰撞区域以获取零件保证工作效率或暂时停止保证人机安全的选择,而人和机器人在共享空间有冲突和不便躲避的场景也类似给出的场景。在这种情况下,由于人对安全性、效率和完成工作的渴望等因素的综合判断往往是非常主观的,并在极短的时间内做出是否通过潜在碰撞区域的决定,这就为机器人的行为决策提出了非常大的挑战,且随着人机之间的距离的缩短,最佳行为决策的挑战就越大。
而造成这种挑战的主要原因是,为了做出最优的行为决策,机器人需要预判人要通过潜在碰撞区域的意愿有多大,需要可以实时准确监测人机间碰撞距离的设备和算法,需要估计自身的工作效率,并结合三种因素来综合判断并在极短的时间内做出安全合理的决策。而对三种因素的判断本身就是不准确和模糊的,尤其针对人的意图的判断往往是模糊的、概率的,这是由于人不是一个完全理性的智能单位,人做出的判断和决策往往是主观的、有限理性的,而当人机近距离工作在具有潜在碰撞风险的场景下,长时间判断碰撞风险会极大增加人对工作的认知负荷,造成判断的失误导致碰撞风险增大。所以急需要一种可以衡量人的模糊决策意图并制定决策的方法来解决机器人决策问题,提高机器人工作效率,人机安全性,降低人的认知负荷、提高舒适度和信任感。人机协作中无法通过轨迹优化避免的具有潜在碰撞风险的场景。
本实施例主要是针对上述场景进行机器人动作决策:当人和机器人在狭小空间近距离协同装配时,人和机器人在同一位置拾取或者放置零件,人和机器人之间没有语言等方式的信息沟通,不能规划人和机器人之间的动作顺序,两者在拾取零件的过程中会产生潜在的碰撞风险,而且由于空间的限制无法通过优化机器人轨迹的方法避碰,人和机器人必须有一方采取暂时屈服的策略才能避免碰撞。
本实例关注的这种场景更加符合智能协作机器人在应用时实际遇到的情况,因为在实验中发现,当人在坐姿工作或者不能随意移动当前位置的工作状态下,遇到上面描述的具有潜在碰撞风险且无法通过优化轨迹避碰的情况更喜欢加速通过潜在碰撞区域,抢在机器人之前完成工作提高工作效率或者暂时停止以保证自身安全,而且人也希望机器人可以采取类似的动作策略。这是因为这样的动作策略更符合人-人协作的行为模式,而不是让机器人从人手上方穿过,虽然这种方式确实可以避碰并减少时间的浪费,但是却让人感到不舒适或不安全。
这类场景与博弈论中提出的“斗鸡博弈”类似,当双方都希望通过独木桥的双方相遇时,如果双方都选择通过,则会出现两败俱伤的结果,而都选择屈服则双方都不能通过,只有一方通过另一方暂时屈服才能安全的让两方顺利过桥,但是对于选择屈服的一方通过桥的时间延长,效率降低。博弈论认为博弈的双方是非合作的,有限策略的,非零和的博弈。对于静态斗鸡博弈有两个纳什均衡解,如表1所示,即博弈的双方都完全清楚对方的所有策略并同时进行选择时,只有这两种方式可以达到战略平衡。如果允许混合策略的存在,则双方会以概率的形式选择各自的策略达成均衡,使双方的收益达到平衡,双方不能通过改变各自的策略使另一方收益降低。所以为了解决此情景还需要比较不同策略的成本函数,找到成本最小的一个作为纳什均衡的解,作为各自采取的策略。
表1斗鸡博弈与纳什均衡表
Figure BDA0003673242710000111
参见图2,发明一实施例中,提供一种协作机器人主动动作决策方法,有效解决现有技术中的无法综合考虑人的有限理性意图动作和机器人自身工作效率的问题,该协作机器人主动动作决策方法包括以下步骤:
S1:获取人和机器人的当前位置、当前速度以及目标点位置,并通过预设的效率直觉模糊集模型,得到人和机器人的效率直觉模糊集。
S2:获取人的当前心理安全场场强,并通过预设的舒适度直觉模糊集模型,得到人的舒适度梯形直觉模糊集。
S3:获取人和机器人之间的距离,计算人和机器人以当前速度移动到潜在碰撞区域的时间,以及机器人以预设最大加速度减速到停止的时间,利用评估碰撞风险方法,得到机器人的安全性直觉模糊集。
S4:加权人的效率直觉模糊集和舒适度梯形直觉模糊集,得到人的动作意图的直觉模糊集。
S5:加权人的动作意图的直觉模糊集、机器人的效率直觉模糊集以及机器人的安全性直觉模糊集,得到避碰直觉模糊集。
S6:根据避碰直觉模糊集,得到机器人是否采取避让的动作决策。
本发明协作机器人主动动作决策方法,基于获取的人和机器人的当前位置、当前速度以及目标点位置,通过预设的效率直觉模糊集模型,得到人和机器人的效率直觉模糊集,并且获取人的当前心理安全场场强,并通过预设的舒适度直觉模糊集模型,得到人的舒适度梯形直觉模糊集,通过获取人和机器人之间的距离,计算人和机器人以当前速度移动到潜在碰撞区域的时间,以及机器人以预设最大加速度减速到停止的时间,利用评估碰撞风险方法,得到机器人的安全性直觉模糊集,然后加权人的效率直觉模糊集和舒适度梯形直觉模糊集,得到人的动作意图的直觉模糊集,考虑到了人对工作效率的判断存在着主观情绪影响,使得对人类意图的建模更加贴近现实,最终加权人的动作意图的直觉模糊集、机器人的效率直觉模糊集以及机器人的安全性直觉模糊集,得到避碰直觉模糊集,融合人的意图、安全性和效率三者,有效提高预测人在具有潜在碰撞风险情形下的主观动作决策意图的准确性,降低机器人与人之间的碰撞情况的发生。
在一种可能的实施方式中,本发明协作机器人主动动作决策方法,具体按照以下步骤实施:
步骤1,交互场景的描述,当人和机器人的目标点相同,并同时趋向目标点拾取或放置零件时,将此时的人机协作场景描述为人-机博弈场景:博弈的局中人P1和P2分别代表人和机器人,博弈双方采取的策略A1和A2分别代表保持和屈服
Figure BDA0003673242710000121
Figure BDA0003673242710000122
分别表示双方选择保持和屈服的成本函数,i始终代表局中人Pi,每个局中人可以选择不同的策略。
步骤2,针对步骤1中的人-机博弈场景,获取人和机器人的当前位置、当前速度以及目标点位置,并通过预设的效率直觉模糊集模型,得到人和机器人的效率直觉模糊集。
步骤3,将人认为的舒适度设置为直觉模糊集,通过心理安全场场强公式实时计算此时人的心理安全场场强SEPh,得到人的舒适度梯形直觉模糊集。
步骤4,获取人机之间的距离,分别计算人和机器人以当前速度移动到潜在碰撞区域的时间,以及机器人以预设最大加速度减速到停止的时间,得到机器人的安全性直觉模糊集。
步骤5,根据人对于效率和舒适度重要性的判断不同,给出两者之间的重要性权重因子,给定直觉模糊集的加权集结方法对人的效率直觉模糊集和舒适度直觉模糊集进行加权集结,得到人对于当前情况是否选择通过潜在碰撞区域继续向目标点移动的动作意图的直觉模糊集。
步骤6,对机器人综合考虑安全性、人的动作意图和工作效率三个因素做出的动作决策进行加权集结得到避碰直觉模糊集,通过对比得分值
Figure BDA0003673242710000123
Figure BDA0003673242710000124
相应的精确值可以得到机器人是否采取避让的动作决策。
在一种可能的实施方式中,步骤2具体按照以下步骤实施:
步骤2.1,构建中性态度的期望效用函数,具体为:假设人单独自主完成装配任务的过程中,以最大速度1.8m/s所需的时间ts记为效率最大点,此时效率为1。从当前位置以当前速度到达目标点所需的时间t0为参考点,此时效率为
Figure BDA0003673242710000131
若人对于效率的认识是完全理性的,对于效率随到达时间的增加而降低结果认识清楚,即对于效率与速度的关系保持中性态度,以此两点构建中性态度的期望效用函数:
Figure BDA0003673242710000132
步骤2.2,构建人认为的效率价值函数和决策权重函数,具体为:根据累计前景理论中对于价值函数的表达,确定人认为的效率价值函数:
Figure BDA0003673242710000133
人认为的决策权重函数:
Figure BDA0003673242710000134
Figure BDA0003673242710000135
其中,t0为当前位置人以当前速度到达目标点所需的时间,ts为人以最大速度到达目标点所需的时间,tl为人以(ts,1)和
Figure BDA0003673242710000136
确定的直线与X轴相交点的X轴坐标,S为当人的效率价值函数的值为零时对应的时间,f(t)为价值函数,w+(p)和w-(p)分别为决策权重函数在收益区域和损失区域的值,决策权重函数呈倒“S”形,如图3所示。γ、δ、α和β为预设参数,α、β反映了决策者的风险偏好水平,参数γ、δ(0<γ,δ<1)越小函数形态越弯曲,决策者越倾向于高估小概率事件而低估大概率事件,λ是损失厌恶系数,当λ>1时,人类被建模为损失厌恶者,对损失的重视程度高于收益,tsr为机器人以最大速度运动到目标点所需的时间;tr为机器人以当前速度到达目标点所需的时间;tlr为以(tsr,1)和
Figure BDA0003673242710000137
Figure BDA0003673242710000138
确定的直线与X轴相交点的X轴坐标,机器人效率价值函数在tlr时刻的效率为零。
步骤2.3,构建人对效率的认知模型,具体为:
根据累积前景理论,人和机器人在目标点相同的条件下,人在以当前速度接近目标点的前景,即人对效率的认知模型可以表示为:
Figure BDA0003673242710000141
其中,w+(p)和w-(p)分别为决策权重函数在收益区域和损失区域的值,f(t)为价值函数,t0为当前位置人以当前速度到达目标点所需的时间,ts为人以最大速度到达目标点所需的时间,tl为人以(ts,1)和
Figure BDA0003673242710000142
确定的直线与X轴相交点的X轴坐标,α和β为预设参数,α、β反映了决策者的风险偏好水平,λ是损失厌恶系数,当λ>1时,人类被建模为损失厌恶者,对损失的重视程度高于收益。
步骤2.4,构建人和机器人的效率直觉模糊集,具体为:从图4中可以看出期望效用函数和累积前景函数的关系,以累积前景函数作为隶属度函数,人的效率直觉模糊集
Figure BDA0003673242710000143
的隶属度和非隶属度函数分别为:
Figure BDA0003673242710000144
Figure BDA0003673242710000145
而机器人是完全理性的智能单位,所以机器人的效率直觉模糊集
Figure BDA0003673242710000146
隶属度和非隶属度函数分别为:
Figure BDA0003673242710000147
Figure BDA0003673242710000148
其中,
Figure BDA0003673242710000149
为人的效率直觉模糊集,μH(t)和υH(t)分别为人的效率直觉模糊集随时间t变化的隶属度和非隶属度函数,
Figure BDA00036732427100001410
为机器人的效率直觉模糊集,μR(t)和υR(t)分别为机器人的效率直觉模糊集随时间t变化的隶属度和非隶属度函数,t0为当前位置人以当前速度到达目标点所需的时间,ts为人以最大速度到达目标点所需的时间,tl为人以(ts,1)和
Figure BDA0003673242710000151
确定的直线与X轴相交点的X轴坐标,S为当人的效率价值函数的值为零时对应的时间,f(t)为价值函数,w+(p)和w-(p)分别为决策权重函数在收益区域和损失区域的值,p表示以时间t到达目标点位置的概率,tsr为机器人以最大速度运动到目标点所需的时间;tr为机器人以当前速度到达目标点所需的时间;tlr为以(tsr,1)和
Figure BDA0003673242710000152
确定的直线与X轴相交点的X轴坐标,机器人效率价值函数在tlr时刻的效率为零。
参见图5和6,示出了人和机器人的效率直觉模糊集。
在一种可能的实施方式中,步骤3具体按照以下步骤实施:
建立了一种心理安全场模型,将心理安全场场强记作SEP,衡量机器人以一定的速度、最小分离距离和方向接近人体不同部位对人产生的心理影响。当心理安全场场强足够大时,人认为如果碰撞风险超出了心理能够承受的阈值,则会选择避让机器人。
具体为:人可以接受的协作机器人运动速度范围在0.3m/s到1m/s之间,认为舒适的速度范围在0.5m/s到0.8m/s之间,此时利用心理安全场经验公式SEP可以实时计算机器人当前动作对人的心理影响的大小SEPh,再通过计算可以得出机器人速度分别在0.3m/s、0.5m/s、0.8m/s和1m/s时的SEPj(j=0.3,0.5,0.8,1m/s)。
SEp=SEI+SEV
Figure BDA0003673242710000153
Figure BDA0003673242710000154
其中,SEP为心理安全场,SEI为静态障碍物产生的势能场,SEV为机器人运动对人造成的心理压力情绪形成的动能场,Mo为障碍物的质量,单位是kg;dI为障碍物与周围环境的距离标量,ko是心理安全场常数,单位是N·m2/kg2,qo是障碍物的危险程度,根据障碍物的性质、体积、尖锐程度等的不同而取值不同,kr表示人对机器人运动危险程度的认知,单位是N·m2/kg2,决定于个人的性别、性格和经验等,qr是机器人及其夹持物体的危险程度,根据机器人外形、体积和夹持的物品等的不同取值不同,Mr是机器人的质量,单位是kg;dV为机器人基座中心点周围环境之间的标量距离,Sp(dr,v)代表了机器人不同的运动方式对人造成的心理压力情绪的影响规律,当机器人与人最近的运动部件以不同的最小间距dr、速度v和接近方向接近人时,对人造成的心理压力情绪不同,首先判断机器人距离人体最近的部位是头部、胸部还是腹部,再根据最接近的部位选用影响规律方程:
Sh=z0h+ah·dr+bh·v+ch·dr 2+dh·v2+eh·dr·v
Sc=z0c+ac·dr+bc·v+cc·dr 2+dc·v2+ec·dr·v
Sa=z0a+aa·dr+ba·v+ca·dr 2+da·v2+ea·dr·v
Sh、Sc、Sa分别为机器人靠近人体头部、胸部和腹部时对人造成的心理压力情绪Sp(dr,v),z0h、z0c、z0a、ah、ac、aa、bh、bc、ba、ch、cc、ca、eh、ec和ea均为拟合参数,具体数值如表2所示,dr为机器人与人最近的运动部件和人之间的间距、v为机器人接近人的速度。
表2心理安全场中各拟合参数取值
参数 参数 参数
z<sub>0c</sub> 0.20524 z<sub>0c</sub> 0.20524 z<sub>0a</sub> 0.0914
a<sub>c</sub> -0.03063 a<sub>c</sub> -0.03063 a<sub>a</sub> -0.47717
b<sub>c</sub> -0.115 b<sub>c</sub> -0.115 b<sub>a</sub> 0.31549
c<sub>c</sub> 0.0126 c<sub>c</sub> 0.0126 c<sub>a</sub> 0.4543
d<sub>c</sub> 0.18031 d<sub>c</sub> 0.18031 d<sub>a</sub> -0.13909
e<sub>c</sub> -0.10197 e<sub>c</sub> -0.10197 e<sub>a</sub> 0.15166
利用梯形直觉模糊集的定义计算出此时人对于机器人危险程度的判断,参见图7,即人的舒适度直觉模糊数
Figure BDA0003673242710000161
的隶属度和非隶属度函数。
Figure BDA0003673242710000162
Figure BDA0003673242710000171
其中,
Figure BDA0003673242710000172
为人的舒适度梯形直觉模糊集,μSE(x)和νSE(x)分别为人的舒适度梯形直觉模糊集的隶属度和非隶属度函数,SEPh为机器人当前动作对人的心理影响的大小,h为机器人当前动作速度,SEP0.3,SEP0.5,SEP0.8,SEP1为机器人速度分别在0.3m/s、0.5m/s、0.8m/s和1m/s时的SEPh
Figure BDA0003673242710000173
Figure BDA0003673242710000174
分别为预设的人感到最舒适的隶属度和对应的非隶属度:
Figure BDA0003673242710000175
将人感到最舒适的隶属度设置为0.7,对应的非隶属度设置为0.2,犹豫度为0.1,表示人对此时的舒适程度的判断有0.1的犹豫程度。
通过比较SEPh与SEPj的值计算出相应的隶属度和非隶属度,最终得到人的舒适度直觉模糊集。
在一种可能的实施方式中,步骤4具体按照以下步骤实施:
计算机器人的安全性直觉模糊集。具体为:分别计算人和机器人以当前速度移动到潜在碰撞区域的时间TTRh和TTRr,因为人机协作的距离往往在0m到1.5m之间,由于人突然的动作很可能发生减速不及时造成的碰撞,因此一旦减速则使用最大加速度进行减速,设置机器人最大加速度为ae=1.8m/s2,则机器人以最大加速度减速到停止的时间为TTSr
Figure BDA0003673242710000176
Figure BDA0003673242710000177
Figure BDA0003673242710000178
其中,TTRh和TTRr分别为人和机器人以当前速度移动到潜在碰撞区域的时间,TTSr为机器人以预设最大加速度减速到停止的时间,ph为人的当前位置,pc为潜在碰撞区域的位置,ae为机器人的加速度,pr为机器人的当前位置,vh为人的当前速度,vr为机器人的当前速度。
所以机器人感知的安全性直觉模糊集
Figure BDA0003673242710000181
非隶属度和隶属度函数为:
Figure BDA0003673242710000182
μS(x)=1-νS(x)。
其中,
Figure BDA0003673242710000183
为机器人的安全性直觉模糊集,μS(x)和νS(x)分别为机器人的安全性直觉模糊集的隶属度和非隶属度函数,
Figure BDA0003673242710000184
为机器人在到达碰撞区域的剩余时间,
Figure BDA0003673242710000185
TTRh和TTRr分别为人和机器人以当前速度移动到潜在碰撞区域的时间,TTSr为机器人以预设最大加速度减速到停止的时间,vh为人的当前速度,vr为机器人的当前速度。
在一种可能的实施方式中,步骤5具体按照以下步骤实施:
步骤5.1,wE和wSE分别为人对于效率和舒适度的重要性权重,人为的确定人对于效率和舒适度的重要性权重分别是wE=<0.6,0.3>和wSE=<0.5,0.4>。
步骤5.2,对人的效率直觉模糊集和舒适度直觉模糊集进行加权集结,得到人对于当前情况是否选择通过潜在碰撞区域继续向目标点移动的动作意图的直觉模糊集
Figure BDA0003673242710000186
Figure BDA0003673242710000187
其中,
Figure BDA0003673242710000188
为人的动作意图的直觉模糊集,μK(x)和νK(x)分别为人的动作意图的直觉模糊集的隶属度和非隶属度函数,wE和wSE分别为人对于效率和舒适度的重要性权重,
Figure BDA0003673242710000189
为人的效率直觉模糊集,
Figure BDA00036732427100001810
为人的舒适度梯形直觉模糊集。
在一种可能的实施方式中,步骤6具体按照以下步骤实施:
步骤6.1,对机器人综合考虑安全性、人的动作意图和工作效率三因素做出的动作决策进行加权集结,得到机器人避碰直觉模糊集,具体为:将机器人对安全性、人的动作意图和工作效率的重要性权重分别设置为wS=<0.95,0.05>,wK=<0.8,0.1>,
Figure BDA00036732427100001811
再对机器人综合考虑三因素做出的动作决策进行加权集结得到避碰直觉模糊集
Figure BDA00036732427100001812
Figure BDA00036732427100001813
其中,
Figure BDA0003673242710000191
为避碰直觉模糊集,μC(x)和νC(x)分别为避碰直觉模糊集的隶属度和非隶属度函数,wS,wK
Figure BDA0003673242710000192
分别为机器人对安全性、人的动作意图和工作效率的重要性权重,
Figure BDA0003673242710000193
为机器人感知的安全性直觉模糊集,
Figure BDA0003673242710000194
为人的动作意图的直觉模糊集,
Figure BDA0003673242710000195
为机器人的效率直觉模糊集。
当人采取通过潜在碰撞区域而机器人暂时屈服时,将避碰直觉模糊集记作
Figure BDA0003673242710000196
当人采取暂时屈服而机器人采取通过潜在碰撞区域动作时,将避碰直觉模糊集记作
Figure BDA0003673242710000197
其中,
Figure BDA0003673242710000198
Figure BDA0003673242710000199
分别为当人采取通过潜在碰撞区域而机器人暂时屈服时避碰直觉模糊集
Figure BDA00036732427100001910
的隶属度和非隶属度函数,
Figure BDA00036732427100001911
Figure BDA00036732427100001912
分别为当人采取暂时屈服而机器人采取通过潜在碰撞区域动作时避碰直觉模糊集
Figure BDA00036732427100001913
的隶属度和非隶属度函数。
步骤6.2,给出直觉模糊集排序的方法,从而判断
Figure BDA00036732427100001914
Figure BDA00036732427100001915
的大小,具体为:
记模糊集
Figure BDA00036732427100001916
的得分值和精确值分别为:
Figure BDA00036732427100001917
(1)如果
Figure BDA00036732427100001918
Figure BDA00036732427100001919
大于
Figure BDA00036732427100001920
记作
Figure BDA00036732427100001921
(2)如果
Figure BDA00036732427100001922
如果
Figure BDA00036732427100001923
Figure BDA00036732427100001924
等于
Figure BDA00036732427100001925
记作
Figure BDA00036732427100001926
如果
Figure BDA00036732427100001927
Figure BDA00036732427100001928
小于
Figure BDA00036732427100001929
记作
Figure BDA00036732427100001930
如果
Figure BDA00036732427100001931
Figure BDA00036732427100001932
大于
Figure BDA00036732427100001933
记作
Figure BDA00036732427100001934
其中,μ和ν分别为模糊集
Figure BDA00036732427100001935
的隶属度和非隶属度函数,
Figure BDA00036732427100001936
为模糊集
Figure BDA00036732427100001937
的得分值,
Figure BDA00036732427100001938
为模糊集
Figure BDA00036732427100001939
的精确值。
步骤6.3,通过对比得分值
Figure BDA00036732427100001940
Figure BDA00036732427100001941
和相应的精确值可以得到机器人是否采取避让的动作决策。
在一种可能的实施方式中,为了验证本发明协作机器人主动动作决策方法的有效性,本实例利用蒙特卡洛法生成了1000组数据对避碰算法进行验证,假设人手的初始位置在x轴负半轴,本实例以-0.85m为平均值,0.2125为方差生成数据,人手的速度以0.75m/s为均值,0.1875为方差生成数据;机器人末端执行器的位置在y轴负半轴,以-0.45m为均值,0.1125为方差生成数据,机器人的速度同样以0.75m/s为均值,0.1875为方差生成数据。而潜在碰撞区域设置在中心点为(0,0)边长为0.1m的正方形区域。
为了贴近真实场景,本实例认为人机双方同时趋向潜在碰撞区域,并且人机双方为了完成任务,以潜在碰撞区域为拾取零件的目标点,在到达目标点后必须停留2s以完成抓取工作。而且为了增加工作效率,本实例认为人机双方地位是均等的,不会认为机器人没有生命而下等级的地位,即必须给人让出工作空间,人机双方可以平等的争夺共享空间。本实例特别关注两种情形:
1.当机器人以原速可以先到目标点,而人在机器人到达目标点后但未完成抓取工作离开碰撞区域之前到达,而通过加速人可以在机器人之前抢先到达潜在碰撞区域,此时,为了减少效率的损失,人极有可能采取加速的方式抢先到达碰撞区域使机器人不得不采取暂时屈服停止的动作而造成碰撞风险显著增加的情形。
2.当人以原速可以先到达碰撞区域,但是人机之间的到达时间差距不大,如果此时机器人加速赶在人之前到达潜在碰撞区域迫使人采取屈服暂停的动作,不仅可以提高效率,同时保证安全性的情形。
参见图8,实验后统计到对于情形1总共出现584次,其中决策机器人屈服动作的有159次,而决策加速通过的有425次。情形2总共出现85次,其中决策机器人暂时屈服的有83次,加速通过的有2次。而对于情形2中,只有2次机器人决策选择通过的原因是:为了保证人的安全,本实例将安全性、人的动作意图的直觉模糊集权重设置的较高,而效率的直觉模糊集权重设置的较低。对此可以通过计算权重因子的灵敏度来判断在什么范围内通过改变权重不会改变直觉模糊集的排序方案。
综上所述,本发明协作机器人主动动作决策方法,相较于现有的协作机器人主动动作决策方法至少具有以下几点优势:(1)基于累计前景理论建立了人主观评价自身工作效率的算法,考虑到了人对工作效率的判断存在着主观情绪影响,使得对人类意图的建模更加贴近现实;(2)基于舒适度模型建立了人判断碰撞风险的算法,同时表示支持、反对和中立3种状态,能够更细腻、全面的描述客观现象的自然属性;(3)基于直觉模糊多属性决策算法建立了融合人的意图、安全性和效率的机器人动作决策算法,为机器人提供最优的动作决策;(4)通过蒙特卡洛法生成的数据验证了决策算法的有效性,同时该算法可以准确预测人在具有潜在碰撞风险情形下的主观动作决策意图,并让人感到满意。
基于人机交互中机器人越来越多的动作决策需要考虑人的有限理性意图和动作,人的此类属性是造成近距离人机交互碰撞的重要原因。本发明公开的基于直觉模糊多属性决策算法建立了融合人的意图、安全性和效率的机器人动作决策算法,可以产生类似人类的决策方式。所提出的决策方法综合考虑了人的有限理性行为,利用累计前景理论和直觉模糊集建立了人对于效率和舒适度的主观意图,利用直觉模糊集计算静态斗鸡博弈两个纳什均衡的得分值和精度值为机器人提供最优的动作决策,通过蒙特卡洛法生成的数据验证了决策算法的有效性,同时通过实验,该方法可以以6%的准确率预测人在具有潜在碰撞风险情形下的主观动作决策意图,同时实验参与者认为机器人的动作决策让人感到满意。
下述为本发明的装置实施例,可以用于执行本发明方法实施例。对于装置实施例中未披露的细节,请参照本发明方法实施例。
本发明再一实施例中,提供一种协作机器人主动动作决策系统,能够用于实现上述的协作机器人主动动作决策方法,该协作机器人主动动作决策系统包括效率处理模块、舒适度处理模块、安全性处理模块、第一加权模块、第二加权模块及决策模块。
其中,效率处理模块用于获取人和机器人的当前位置、当前速度以及目标点位置,并通过预设的效率直觉模糊集模型,得到人和机器人的效率直觉模糊集;舒适度处理模块用于获取人的当前心理安全场场强,并通过预设的舒适度直觉模糊集模型,得到人的舒适度梯形直觉模糊集;安全性处理模块用于获取人和机器人之间的距离,计算人和机器人以当前速度移动到潜在碰撞区域的时间,以及机器人以预设最大加速度减速到停止的时间,利用评估碰撞风险方法,得到机器人的安全性直觉模糊集;第一加权模块用于加权人的效率直觉模糊集和舒适度梯形直觉模糊集,得到人的动作意图的直觉模糊集;第二加权模块用于加权人的动作意图的直觉模糊集、机器人的效率直觉模糊集以及机器人的安全性直觉模糊集,得到避碰直觉模糊集;决策模块用于根据避碰直觉模糊集,得到机器人是否采取避让的动作决策。
前述的协作机器人主动动作决策方法的实施例涉及的各步骤的所有相关内容均可以援引到本发明施例中的协作机器人主动动作决策系统所对应的功能模块的功能描述,在此不再赘述。
本发明实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,另外,在本发明各个实施例中的各功能模块可以集成在一个处理器中,也可以是单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
本发明再一个实施例中,提供了一种计算机设备,该计算机设备包括处理器以及存储器,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器用于执行所述计算机存储介质存储的程序指令。处理器可能是中央处理单元(CentralProcessing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其是终端的计算核心以及控制核心,其适于实现一条或一条以上指令,具体适于加载并执行计算机存储介质内一条或一条以上指令从而实现相应方法流程或相应功能;本发明实施例所述的处理器可以用于协作机器人主动动作决策方法的操作。
本发明再一个实施例中,本发明还提供了一种存储介质,具体为计算机可读存储介质(Memory),所述计算机可读存储介质是计算机设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机可读存储介质既可以包括计算机设备中的内置存储介质,当然也可以包括计算机设备所支持的扩展存储介质。计算机可读存储介质提供存储空间,该存储空间存储了终端的操作系统。并且,在该存储空间中还存放了适于被处理器加载并执行的一条或一条以上的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机可读存储介质可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。可由处理器加载并执行计算机可读存储介质中存放的一条或一条以上指令,以实现上述实施例中有关协作机器人主动动作决策方法的相应步骤。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

Claims (10)

1.一种协作机器人主动动作决策方法,其特征在于,包括:
获取人和机器人的当前位置、当前速度以及目标点位置,并通过预设的效率直觉模糊集模型,得到人和机器人的效率直觉模糊集;
获取人的当前心理安全场场强,并通过预设的舒适度直觉模糊集模型,得到人的舒适度梯形直觉模糊集;
获取人和机器人之间的距离,计算人和机器人以当前速度移动到潜在碰撞区域的时间,以及机器人以预设最大加速度减速到停止的时间,利用评估碰撞风险方法,得到机器人的安全性直觉模糊集;
加权人的效率直觉模糊集和舒适度梯形直觉模糊集,得到人的动作意图的直觉模糊集;
加权人的动作意图的直觉模糊集、机器人的效率直觉模糊集以及机器人的安全性直觉模糊集,得到避碰直觉模糊集;
根据避碰直觉模糊集,得到机器人是否采取避让的动作决策。
2.根据权利要求1所述的协作机器人主动动作决策方法,其特征在于,所述通过预设的效率直觉模糊集模型,得到人和机器人的效率直觉模糊集包括:
通过下式得到人的效率直觉模糊集
Figure FDA0003673242700000011
Figure FDA0003673242700000012
Figure FDA0003673242700000013
Figure FDA0003673242700000014
Figure FDA0003673242700000015
Figure FDA0003673242700000016
通过下式得到机器人的效率直觉模糊集
Figure FDA0003673242700000017
Figure FDA0003673242700000021
Figure FDA0003673242700000022
其中,
Figure FDA0003673242700000023
为人的效率直觉模糊集,μH(t)和υH(t)分别为人的效率直觉模糊集随时间t变化的隶属度和非隶属度函数,
Figure FDA0003673242700000024
为机器人的效率直觉模糊集,μR(t)和υR(t)分别为机器人的效率直觉模糊集随时间t变化的隶属度和非隶属度函数,t0为当前位置人以当前速度到达目标点所需的时间,ts为人以最大速度到达目标点所需的时间,tl为人以(ts,1)和
Figure FDA0003673242700000025
确定的直线与X轴相交点的X轴坐标,S为当人的效率价值函数的值为零时对应的时间,f(t)为价值函数,w+(p)和w-(p)分别为决策权重函数在收益区域和损失区域的值,γ、δ、α和β为预设参数,0<γ,δ<1,λ是损失厌恶系数,当λ>1时,人类被建模为损失厌恶者,对损失的重视程度高于收益,p表示以时间t到达目标点位置的概率,tsr为机器人以最大速度运动到目标点所需的时间;tr为机器人以当前速度到达目标点所需的时间;tlr为以(tsr,1)和
Figure FDA0003673242700000026
确定的直线与X轴相交点的X轴坐标,机器人效率价值函数在tlr时刻的效率为零。
3.根据权利要求2所述的协作机器人主动动作决策方法,其特征在于,所述获取人的当前心理安全场场强,通过预设的舒适度直觉模糊集模型,得到人的舒适度梯形直觉模糊集包括:
根据机器人的当前速度,通过下式得到人的当前心理安全场场强:
SEp=SEI+SEV
Figure FDA0003673242700000027
Figure FDA0003673242700000028
其中,SEP为心理安全场,SEI为静态障碍物产生的势能场,SEV为机器人运动对人造成的心理压力情绪形成的动能场,Mo为障碍物的质量,dI为障碍物与周围环境的距离标量,ko是心理安全场常数,qo是障碍物的危险程度,kr表示人对机器人运动危险程度的认知,qr是机器人及其夹持物体的危险程度,Mr是机器人的质量,dV为机器人基座中心点周围环境之间的标量距离,Sp(dr,v)代表了机器人不同的运动方式对人造成的心理压力情绪的影响规律,首先判断机器人距离人体最近的部位是头部、胸部还是腹部,再根据最接近的部位选用影响规律方程:
Sh=z0h+ah·dr+bh·v+ch·dr 2+dh·v2+eh·dr·v
Sc=z0c+ac·dr+bc·v+cc·dr 2+dc·v2+ec·dr·v
Sa=z0a+aa·dr+ba·v+ca·dr 2+da·v2+ea·dr·v
Sh、Sc、Sa分别为机器人靠近人体头部、胸部和腹部时对人造成的心理压力情绪Sp(dr,v),z0h、z0c、z0a、ah、ac、aa、bh、bc、ba、ch、cc、ca、eh、ec和ea均为拟合参数,dr为机器人与人最近的运动部件和人之间的间距、v为机器人接近人的速度;
通过下式得到人的舒适度梯形直觉模糊集
Figure FDA0003673242700000031
Figure FDA0003673242700000032
Figure FDA0003673242700000033
其中,
Figure FDA0003673242700000034
为人的舒适度梯形直觉模糊集,μSE(x)和νSE(x)分别为人的舒适度梯形直觉模糊集的隶属度和非隶属度函数,SEPh为机器人当前动作对人的心理影响的大小,h为机器人当前动作速度,SEP0.3,SEP0.5,SEP0.8,SEP1为机器人速度分别在0.3m/s、0.5m/s、0.8m/s和1m/s时的SEPh
Figure FDA0003673242700000035
Figure FDA0003673242700000036
分别为预设的人感到最舒适的隶属度和对应的非隶属度。
4.根据权利要求3所述的协作机器人主动动作决策方法,其特征在于,获取人和机器人之间的距离,计算人和机器人以当前速度移动到潜在碰撞区域的时间,以及机器人以预设最大加速度减速到停止的时间,利用评估碰撞风险方法,得到机器人的安全性直觉模糊集包括:
获取人和机器人之间的距离,计算人和机器人以当前速度移动到潜在碰撞区域的时间TTRh和TTRr,以及机器人以预设最大加速度减速到停止的时间TTSr,通过下式得到:
Figure FDA0003673242700000041
Figure FDA0003673242700000042
Figure FDA0003673242700000043
其中,TTRh和TTRr分别为人和机器人以当前速度移动到潜在碰撞区域的时间,TTSr为机器人以预设最大加速度减速到停止的时间,ph为人的当前位置,pc为潜在碰撞区域的位置,ae为机器人的最大加速度,pr为机器人的当前位置,vh为人的当前速度,vr为机器人的当前速度;
通过下式得到机器人的安全性直觉模糊集
Figure FDA0003673242700000044
Figure FDA0003673242700000045
μS(x)=1-νS(x)
其中,
Figure FDA0003673242700000046
为机器人的安全性直觉模糊集,μS(x)和νS(x)分别为机器人的安全性直觉模糊集的隶属度和非隶属度函数,
Figure FDA0003673242700000047
为机器人在到达碰撞区域的剩余时间,
Figure FDA0003673242700000048
TTRh和TTRr分别为人和机器人以当前速度移动到潜在碰撞区域的时间,TTSr为机器人以预设最大加速度减速到停止的时间,vh为人的当前速度,vr为机器人的当前速度。
5.根据权利要求4所述的协作机器人主动动作决策方法,其特征在于,所述加权人的效率直觉模糊集和舒适度梯形直觉模糊集,得到人的动作意图的直觉模糊集包括:
获取人对于效率和舒适度的重要性权重;
根据人对于效率和舒适度的重要性权重,通过下式加权人的效率直觉模糊集和舒适度梯形直觉模糊集,得到人的动作意图的直觉模糊集
Figure FDA0003673242700000051
Figure FDA0003673242700000052
其中,
Figure FDA0003673242700000053
为人的动作意图的直觉模糊集,μK(x)和νK(x)分别为人的动作意图的直觉模糊集的隶属度和非隶属度函数,wE和wSE分别为人对于效率和舒适度的重要性权重,
Figure FDA0003673242700000054
为人的效率直觉模糊集,
Figure FDA0003673242700000055
为人的舒适度梯形直觉模糊集。
6.根据权利要求5所述的协作机器人主动动作决策方法,其特征在于,所述加权人的动作意图的直觉模糊集、机器人的效率直觉模糊集以及机器人的安全性直觉模糊集,得到避碰直觉模糊集包括:
获取机器人对安全性、人的动作意图和工作效率的重要性权重;
根据机器人对安全性、人的动作意图和工作效率的重要性权重,通过下式加权人的动作意图的直觉模糊集、机器人的效率直觉模糊集以及机器人的安全性直觉模糊集,得到避碰直觉模糊集
Figure FDA0003673242700000056
Figure FDA0003673242700000057
其中,
Figure FDA0003673242700000058
为避碰直觉模糊集,μC(x)和νC(x)分别为避碰直觉模糊集的隶属度和非隶属度函数,wS,wK
Figure FDA0003673242700000059
分别为机器人对安全性、人的动作意图和工作效率的重要性权重,
Figure FDA00036732427000000510
为机器人感知的安全性直觉模糊集,
Figure FDA00036732427000000511
为人的动作意图的直觉模糊集,
Figure FDA00036732427000000512
为机器人的效率直觉模糊集。
7.根据权利要求6所述的协作机器人主动动作决策方法,其特征在于,所述根据避碰直觉模糊集,得到机器人是否采取避让的动作决策包括:
当人采取通过潜在碰撞区域而机器人暂时屈服时,将避碰直觉模糊集记作
Figure FDA00036732427000000513
当人采取暂时屈服而机器人采取通过潜在碰撞区域动作时,将避碰直觉模糊集记作
Figure FDA00036732427000000514
其中,
Figure FDA00036732427000000515
Figure FDA00036732427000000516
分别为当人采取通过潜在碰撞区域而机器人暂时屈服时避碰直觉模糊集
Figure FDA00036732427000000517
的隶属度和非隶属度函数,
Figure FDA00036732427000000518
Figure FDA00036732427000000519
分别为当人采取暂时屈服而机器人采取通过潜在碰撞区域动作时避碰直觉模糊集
Figure FDA00036732427000000520
的隶属度和非隶属度函数;
通过预设的直觉模糊集排序方法,比较
Figure FDA00036732427000000521
Figure FDA00036732427000000522
的大小,当
Figure FDA00036732427000000523
大于
Figure FDA00036732427000000524
时,人采取通过潜在碰撞区域而机器人暂时屈服;否则,人采取暂时屈服而机器人采取通过潜在碰撞区域动作;
其中,预设的直觉模糊集排序方法包括:
Figure FDA0003673242700000061
Figure FDA0003673242700000062
依次作为模糊集
Figure FDA0003673242700000063
通过下述方式得到
Figure FDA0003673242700000064
Figure FDA0003673242700000065
的排序结果:
Figure FDA0003673242700000066
的得分值和精确值分别为:
Figure FDA0003673242700000067
Figure FDA0003673242700000068
时,
Figure FDA0003673242700000069
大于
Figure FDA00036732427000000610
Figure FDA00036732427000000611
时,如果
Figure FDA00036732427000000612
Figure FDA00036732427000000613
等于
Figure FDA00036732427000000614
如果
Figure FDA00036732427000000615
Figure FDA00036732427000000616
小于
Figure FDA00036732427000000617
如果
Figure FDA00036732427000000618
Figure FDA00036732427000000619
大于
Figure FDA00036732427000000620
其中,μ和ν分别为模糊集
Figure FDA00036732427000000621
的隶属度和非隶属度函数,
Figure FDA00036732427000000622
为模糊集
Figure FDA00036732427000000623
的得分值,
Figure FDA00036732427000000624
为模糊集
Figure FDA00036732427000000625
的精确值。
8.一种协作机器人主动动作决策系统,其特征在于,包括:
效率处理模块,用于获取人和机器人的当前位置、当前速度以及目标点位置,并通过预设的效率直觉模糊集模型,得到人和机器人的效率直觉模糊集;
舒适度处理模块,用于获取人的当前心理安全场场强,并通过预设的舒适度直觉模糊集模型,得到人的舒适度梯形直觉模糊集;
安全性处理模块,用于获取人和机器人之间的距离,计算人和机器人以当前速度移动到潜在碰撞区域的时间,以及机器人以预设最大加速度减速到停止的时间,利用评估碰撞风险方法,得到机器人的安全性直觉模糊集;
第一加权模块,用于加权人的效率直觉模糊集和舒适度梯形直觉模糊集,得到人的动作意图的直觉模糊集;
第二加权模块,用于加权人的动作意图的直觉模糊集、机器人的效率直觉模糊集以及机器人的安全性直觉模糊集,得到避碰直觉模糊集;
决策模块,用于根据避碰直觉模糊集,得到机器人是否采取避让的动作决策。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述协作机器人主动动作决策方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述协作机器人主动动作决策方法的步骤。
CN202210611684.3A 2022-05-31 2022-05-31 协作机器人主动动作决策方法、系统、设备及存储介质 Active CN114932552B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210611684.3A CN114932552B (zh) 2022-05-31 2022-05-31 协作机器人主动动作决策方法、系统、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210611684.3A CN114932552B (zh) 2022-05-31 2022-05-31 协作机器人主动动作决策方法、系统、设备及存储介质

Publications (2)

Publication Number Publication Date
CN114932552A true CN114932552A (zh) 2022-08-23
CN114932552B CN114932552B (zh) 2024-03-26

Family

ID=82867375

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210611684.3A Active CN114932552B (zh) 2022-05-31 2022-05-31 协作机器人主动动作决策方法、系统、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114932552B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030037063A1 (en) * 2001-08-10 2003-02-20 Qlinx Method and system for dynamic risk assessment, risk monitoring, and caseload management
US20030225479A1 (en) * 2002-05-30 2003-12-04 El-Houssaine Waled Method and control device for avoiding collisions between cooperating robots
CN103425738A (zh) * 2013-07-03 2013-12-04 西安理工大学 基于模糊合作博弈的网络重叠社区发现方法
CN104812027A (zh) * 2014-01-23 2015-07-29 北京邮电大学 基于直觉模糊集多属性决策的网络选择方法
WO2018107488A1 (zh) * 2016-12-16 2018-06-21 深圳大学 基于提升直觉模糊树的目标跟踪方法及装置
CN110244715A (zh) * 2019-05-23 2019-09-17 西安理工大学 一种基于超宽带技术的多移动机器人高精度协同跟踪方法
CN110561432A (zh) * 2019-08-30 2019-12-13 广东省智能制造研究所 一种基于人机共融的安全协作方法及装置
CN110750877A (zh) * 2019-09-27 2020-02-04 西安理工大学 一种Apollo平台下的车辆跟驰行为预测方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030037063A1 (en) * 2001-08-10 2003-02-20 Qlinx Method and system for dynamic risk assessment, risk monitoring, and caseload management
US20030225479A1 (en) * 2002-05-30 2003-12-04 El-Houssaine Waled Method and control device for avoiding collisions between cooperating robots
CN103425738A (zh) * 2013-07-03 2013-12-04 西安理工大学 基于模糊合作博弈的网络重叠社区发现方法
CN104812027A (zh) * 2014-01-23 2015-07-29 北京邮电大学 基于直觉模糊集多属性决策的网络选择方法
WO2018107488A1 (zh) * 2016-12-16 2018-06-21 深圳大学 基于提升直觉模糊树的目标跟踪方法及装置
CN110244715A (zh) * 2019-05-23 2019-09-17 西安理工大学 一种基于超宽带技术的多移动机器人高精度协同跟踪方法
CN110561432A (zh) * 2019-08-30 2019-12-13 广东省智能制造研究所 一种基于人机共融的安全协作方法及装置
CN110750877A (zh) * 2019-09-27 2020-02-04 西安理工大学 一种Apollo平台下的车辆跟驰行为预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
万树平: "直觉模糊多属性决策方法综述", 控制与决策, vol. 25, no. 11, pages 1601 - 1606 *
徐选华;蔡晨光;杜志娇;王佩;: "基于区间直觉模糊数的多属性多阶段冲突型大群体应急决策方法", 运筹与管理, vol. 25, no. 04, 31 August 2016 (2016-08-31), pages 12 - 22 *

Also Published As

Publication number Publication date
CN114932552B (zh) 2024-03-26

Similar Documents

Publication Publication Date Title
Zhang et al. Mobile robot path planning based on improved localized particle swarm optimization
Yang et al. Extended PSO based collaborative searching for robotic swarms with practical constraints
Rios-Martinez et al. Understanding human interaction for probabilistic autonomous navigation using Risk-RRT approach
CN105717929B (zh) 一种多分辨率障碍物环境下移动机器人混合路径规划方法
Kinugawa et al. Adaptive task scheduling for an assembly task coworker robot based on incremental learning of human's motion patterns
Pan et al. Research for path planning based on improved astart algorithm
Al Dabooni et al. Heuristic dynamic programming for mobile robot path planning based on Dyna approach
Deepak et al. Target seeking behaviour of an intelligent mobile robot using advanced particle swarm optimization
CN109991963A (zh) 速度规划方法及终端设备
CN112344945A (zh) 室内配送机器人路径规划方法、系统及室内配送机器人
Obo et al. Intelligent fuzzy controller for human-aware robot navigation
Wang et al. Metrics for evaluating social conformity of crowd navigation algorithms
CN109740192B (zh) 基于阿诺德情绪模型的人群疏散仿真方法及系统
Truc et al. Khaos: a kinematic human aware optimization-based system for reactive planning of flying-coworker
Lei et al. A fuzzy behaviours fusion algorithm for mobile robot real-time path planning in unknown environment
Wang et al. A Bio-inspired trajectory planning method for robotic manipulators based on improved bacteria foraging optimization algorithm and tau theory
Liu et al. Research on Cobot Action Decision-Making Method Based on Intuitionistic Fuzzy Set and Game Theory
Li et al. Robot path planning using improved artificial bee colony algorithm
Johora et al. Dynamic path planning and movement control in pedestrian simulation
CN114932552A (zh) 协作机器人主动动作决策方法、系统、设备及存储介质
Panda et al. Autonomous mobile robot path planning using hybridization of particle swarm optimization and Tabu search
CN116562332A (zh) 一种人机共融环境下的机器人社交性运动规划方法
Gorkavyy et al. Human factor modelling in the collaborative robotic process control system
Sisbot et al. A mobile robot that performs human acceptable motions
Okunevich et al. Human-centered benchmarking for socially-compliant robot navigation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant