CN107491085A - 一种有人机对无人机威胁规避的监督控制方法 - Google Patents
一种有人机对无人机威胁规避的监督控制方法 Download PDFInfo
- Publication number
- CN107491085A CN107491085A CN201710553623.5A CN201710553623A CN107491085A CN 107491085 A CN107491085 A CN 107491085A CN 201710553623 A CN201710553623 A CN 201710553623A CN 107491085 A CN107491085 A CN 107491085A
- Authority
- CN
- China
- Prior art keywords
- unmanned plane
- threat
- action
- value
- man
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 22
- 230000009471 action Effects 0.000 claims abstract description 137
- 230000007613 environmental effect Effects 0.000 claims abstract description 34
- 238000004891 communication Methods 0.000 claims abstract description 22
- 230000003993 interaction Effects 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 6
- 230000009467 reduction Effects 0.000 claims description 4
- 230000007704 transition Effects 0.000 claims description 3
- 238000011084 recovery Methods 0.000 claims description 2
- 238000004458 analytical method Methods 0.000 abstract description 2
- 238000007726 management method Methods 0.000 description 29
- 235000013399 edible fruits Nutrition 0.000 description 3
- 238000000465 moulding Methods 0.000 description 3
- 230000019771 cognition Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 240000002853 Nelumbo nucifera Species 0.000 description 1
- 235000006508 Nelumbo nucifera Nutrition 0.000 description 1
- 235000006510 Nelumbo pentapetala Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004886 process control Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/10—Simultaneous control of position or course in three dimensions
- G05D1/101—Simultaneous control of position or course in three dimensions specially adapted for aircraft
Landscapes
- Engineering & Computer Science (AREA)
- Aviation & Aerospace Engineering (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
- Catching Or Destruction (AREA)
Abstract
本发明提供了一种有人机对无人机威胁规避的监督控制,涉及无人机领域,本发明定义监督控制模式、环境因素和威胁规避动作,并定义对应的取值,对于可选威胁规避动作进行推理判断,然后根据判断结果对最终威胁规避动作进行判断,完成威胁规避,本发明对于已知威胁,无人机充分发挥其自主能力独立完成威胁规避,或者在有人机的指导下完成作业;对于未知威胁,无人机在有人机的指导下完成规避,充分发挥无人机的自主执行和有人机操作员的分析判断能力;对于通信中断等极端情况,无人机通过对监督控制模式的调节,保证自身的安全;可变自主监督控制模式结合无人机和有人机的特点,对不同的威胁类型和环境状况有较好的应变能力。
Description
技术领域
本发明涉及无人机领域,尤其是一种规避判断方法。
背景技术
在面对突发状况时,有人机操作员与无人机交互,保证无人机完成预定的任务。监督控制是指有人机间歇地与无人机进行交互,接收反馈并且给出指令以对处于任务环境中的无人机进行过程控制。
然而,在无人机系统威胁规避的实际应用中,传统的方法一般采用操作员手动操作进行威胁规避、或是通过计算代价函数(一般以航程和威胁为主要因素)采用路径规划、规则或自动机的方式进行威胁规避。这样会出现两个问题:①由复杂多变的环境赋予操作员过多的任务造成的“超负荷”现象;②由于无人系统拥有过高的权限,使操作员丧失对整体态势的感知能力造成的“人不在回路”(Out-of-the-Loop,OOTL)现象。两个问题说明,有人机对无人机威胁规避的监督控制需按照实际情况动态调节。
因此,非常有必要研究一种既能够充分发挥有人机操作员高层次认知决策能力和无人机高效执行任务能力,同时保持有人机操作员对作业环境的态势认知和适当的工作负荷的无人机威胁规避监督控制方法。
发明内容
为了克服现有技术在平衡态势认知和工作负载方面的缺陷,本发明提出一种威胁规避监督控制方法,既可以有效提高有人机-无人机系统在复杂多变的环境下执行任务的性能,又可以减轻操作员的工作负担,同时能够保证操作员对整体态势的感知能力,避免“人不在回路”的出现,而且充分发挥无人机自主能力,实现威胁规避的目的。
本发明提出的威胁规避监督控制方法,是一种依据环境变化,有人机调整不同监督控制模式,无人机完成对应的威胁规避动作,以实现威胁规避目的的方法。
本发明解决其技术问题所采用的技术方案包括如下步骤:
Step1:定义监督控制模式、环境因素和威胁规避动作
无人机遇到突发威胁时有6种威胁规避动作,包括作业决策A1、规避A2、减速等待指令A3、盘旋等待指令A4、应激规避A5和返回A6;
其中,作业决策A1和规避A2为高等级的动作;减速等待指令A3和盘旋等待指令A4为中等级的动作;应激规避A5和返回A6为低等级的动作;
监督控制模式为3个模式,无人机的自主能力由高到低分别为例外管理模式L3、同意管理模式L2、和指令控制模式L1,无人机初始模式为例外管理模式L3;
定义无人机监督控制模式如表1所示:
表1
动作执行方式是指无人机在有人机监督控制下,完成对应的威胁规避动作的方式,如表2所示;
表2
1)环境因素包括威胁源的价值、威胁距离、威胁源是否为已知和通信情况,定义如下:
①威胁源的价值V7包括高价值威胁源和低价值威胁源,其中威胁价值如表3所定义;
表3
②威胁距离包括威胁距离远V4、威胁距离中等V2和威胁距离近V1;
相对于无人机,威胁源的位置表示为
式(1)中,P(t)为t时刻威胁源i的位置,t为时间,P(0)为威胁源i的初始位置,vi为威胁源i的速度,vu(τ)为无人机u的速度,其中:
式(2)中为无人机的偏航角,无人机威胁距离的远近由无人机飞抵威胁源i所在位置的时间T按照如下公式定义:
③威胁源分为已知威胁V6和未知威胁V3,已知威胁指已知作业区域的威胁源的图像信息,位置信息以及雷达波段信息;未知威胁是指作业区域的威胁源的图像信息,位置信息以及雷达波段信息至少缺少一个;
④通信情况指通信中断V5,指到达无人机接收机的信号强度小于有人机接收机的灵敏度,有人机与无人机间无法正常通信的情况;
2)环境因素和威胁规避动作的取值的值域为{-1,0,1},其物理意义如表4所示:
表4
①对于威胁源的价值V7,高价值表示为1,即V7=1;低价值表示为0,即V7=0;价值未知表示为-1,即V7=-1;
②对于威胁距离,威胁距离远表示为V4=1且V2=0且V1=0,威胁距离中等表示为V4=0且V2=1且V1=0,威胁距离近表示为V4=0且V2=0且V1=1;
③对于威胁源是否已知,分为已知威胁表示为1,即V6=1且V3=0;未知威胁表示为1,即V3=1且V6=0;
对于未知威胁V3=1的情况,威胁源的价值一定为未知,即V7=-1,可表示如下:
if(V3=1),then(V7=-1) (4)
④对于通信情况,通信正常则V5=0,通信中断即V5=1;
⑤对于作业决策A1表示为A1=1且A2=A3=A4=A5=A6=0;
⑥对于规避A2表示为A2=1且A1=A3=A4=A5=A6=0;
⑦对于减速等待指令A3表示为A3=1且A1=A2=A4=A5=A6=0;
⑧对于盘旋等待指令A4表示为A4=1且A1=A2=A3=A5=A6=0;
⑨对于应激规避A5表示为A5=1且A1=A2=A3=A4=A6=0;
⑩对于返回A6表示为A6=1且A1=A2=A3=A4=A5=0;
Step2:可选威胁规避动作的推理判断
1)由Step1写出状态向量
状态向量用C(k)表示,其中k表示次数,C(0)表示初始状态向量,状态向量包括威胁规避动作和环境因素,格式为:
其中,没有规避动作时,默认无人机A1~A6值全为0,即
V1~V7为Step1得到的值,在Step2中始终为定值;
2)利用状态向量C(k)进行推理,推理过程如下:
①用状态向量C(k)乘邻接权值矩阵W得到中间向量X(k)
X(k)=C(k)W (7)
其中,节点之间的邻接权值矩阵W如下:
②对中间向量X(k)用状态转移函数f(x)处理中间向量X(k)的每个分量x,状态转移函数f(x)为二值阶跃函数:
其中,x为中间向量X(k)的分量,向量X(k)维度为6,分量x的值域为{0,1};
③用中间向量X(k)更新状态向量C(k),即
④不断重复步骤①、步骤②和步骤③,即不断更新状态向量用C(k),直至状态向量C(k+n+1)=C(k+n),其中,n表示次数,即第(k+n+1)次状态向量的值与第(k+n)次状态向量的值相同;
C(k+n+1)=C(k+n)=[a1,a2,a3,a4,a5,a6|V1,V2,V3,V4,V5,V6,V7],其中a1、a2、a3、a4、a5和a6分别表示威胁规避动作A1、A2、A3、A4、A5和A6对应的取值,取值为0或者1,a1、a2、a3、a4、a5、a6中取值为1的项,对应威胁规避动为可选威胁规避动作;
⑤无人机提供可选威胁规避动作结果给有人机;
Step3:最终威胁规避动作判断
判断如下:
1)满足如下判断条件a)、b)、c)的其中一条,则无人机需要与有人机交互:
a)环境因素中包含高价值V7项值为“1”,即V=(*,*,*,*,*,*,1),其中,*表示无关项,无关项表示取值为“0”或“1”;
b)环境因素中包含未知威胁V3项值为“1”,即V=(*,*,1,*,*,0,-1),其中,*表示无关项,无关项表示取值为“0”或“1”;
c)可选威胁规避动作不符合无人机当前监督控制模式对应的动作等级;
在当前监督控制模式中动作执行方式如下:
①当无人机的监督控制模式为例外管理模式L3,无人机需要交互时,如15s内无人机无法提供的威胁规避动作推理结果,即威胁源未知,则无人机降低监督控制模式到同意管理模式L2;如无人机向有人机提供威胁规避动作推理结果,无人机采用智能结合方式主动反馈,操作员在15s内不否定即执行无人机提供的威胁规避动作推理结果,反之,操作员在15s内否定则不执行,并降低监督控制模式到同意管理模式L2;
②当无人机的监督控制模式为同意管理模式L2,则无人机需要交互时,如15s内无人机无法提供的威胁规避动作推理结果,即威胁源未知,无人机降低监督控制模式到操作员决策模式L1;如无人机向有人机提供威胁规避动作推理结果,无人机采用智能结合方式主动反馈,等待操作员的认可,15s内没有得到操作员的认可则不执行无人机提供的威胁规避动作推理结果,并降低监督控制模式到操作员决策模式L1;
③当无人机的监督控制模式为指令控制模式L1,则无人机需要交互时,无人机向有人机提供威胁源的图像信息,位置信息以及雷达波段信息,并提供状态向量C(k)和威胁规避动作推理结果,有人机采用接管方式并结合如下规则执行:
通过命令给出无人机威胁规避动作,无人机15s内等待操作员的决策,按照决策结果执行,超时无决策,则返回基地;
2)当可选威胁规避动作符合无人机当前监督控制模式对应动作等级,且环境因素不符合step3的步骤1)中判断条件a)和b)的其中一条,则无人机不需与有人机交互,可选威胁规避动作按照如下优先级执行:
A1>A2>A3>A4>A5>A6 (11)
对应监督控制模式中动作执行方式如下:
①无人机不需要交互时,当在例外管理模式L3下,则允许执行的动作为作业决策A1、规避A2、减速等待指令A3、盘旋等待指令A4、应激规避A5和返回A6,无人机按照式(11)优先级采用自主执行方式;
②无人机不需要交互时,当在同意管理模式L2下,允许执行的动作为减速等待指令A3、盘旋等待指令A4、应激规避A5和返回A6,无人机按照式(11)优先级采用自主执行方式;
③无人机不需要交互时,在指令控制模式L1下,允许执行的动作为应激规避A5和返回A6,无人机按照式(11)优先级采用自主执行方式;
Step4:每30s更新一次Step1的环境因素和威胁规避动作的数值,当无人机监督控制模式降低,则更新无人机监督控制模式为降低后的模式,按照Step1~Step3循环往复,无人机执行最终得到的威胁规避动作,完成威胁规避,当无人机成功规避威胁后,无人机监督控制模式恢复为例外管理模式L3模式。
本发明的有益效果在于对于已知威胁,无人机可以充分发挥其自主能力,独立完成威胁规避,或者在有人机的指导下完成作业;对于未知威胁,无人机必须在有人机的指导下完成规避,可变自主监督控制方法可以充分发挥无人机的自主执行和有人机操作员的分析判断能力;对于通信中断等极端情况,无人机可以通过对监督控制模式的调节,在等待通信恢复的同时保证自身的安全;可变自主监督控制模式可以结合无人机和有人机的特点,对不同的威胁类型和环境状况有较好的应变能力。
附图说明
图1是本发明无人机威胁规避推理模型框架。
图2是本发明实施例1规避过程图。
图3是本发明实施例2规避过程图。
图4是本发明实施例3规避过程图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。图1是本发明无人机威胁规避推理模型框架。
Step1:定义监督控制模式、环境因素和威胁规避动作
无人机遇到突发威胁时有6种威胁规避动作,包括作业决策A1、规避A2、减速等待指令A3、盘旋等待指令A4、应激规避A5和返回A6;
其中,作业决策A1和规避A2为高等级的动作;减速等待指令A3和盘旋等待指令A4为中等级的动作;应激规避A5和返回A6为低等级的动作;
监督控制模式为3个模式,无人机的自主能力由高到低分别为例外管理模式L3、同意管理模式L2、和指令控制模式L1,无人机初始模式为例外管理模式L3;
定义无人机监督控制模式如表1所示:
表1
动作执行方式是指无人机在有人机监督控制下,完成对应的威胁规避动作的方式,如表2所示;
表2
1)环境因素包括威胁源的价值、威胁距离、威胁源是否为已知和通信情况,定义如下:
①威胁源的价值V7包括高价值威胁源和低价值威胁源,其中威胁价值如表3所定义;
表3
②威胁距离包括威胁距离远V4、威胁距离中等V2和威胁距离近V1;
相对于无人机,威胁源的位置表示为
式(1)中,P(t)为t时刻威胁源i的位置,t为时间,P(0)为威胁源i的初始位置,vi为威胁源i的速度,vu(τ)为无人机u的速度,其中:
式(2)中为无人机的偏航角,无人机威胁距离的远近由无人机飞抵威胁源i所在位置的时间T按照如下公式定义:
③威胁源分为已知威胁V6和未知威胁V3,已知威胁指已知作业区域的威胁源的图像信息,位置信息以及雷达波段信息;未知威胁是指作业区域的威胁源的图像信息,位置信息以及雷达波段信息至少缺少一个;
④通信情况指通信中断V5,指到达无人机接收机的信号强度小于有人机接收机的灵敏度,有人机与无人机间无法正常通信的情况;
2)环境因素和威胁规避动作的取值的值域为{-1,0,1},其物理意义如表4所示:
表4
①对于威胁源的价值V7,高价值表示为1,即V7=1;低价值表示为0,即V7=0;价值未知表示为-1,即V7=-1;
②对于威胁距离,威胁距离远表示为V4=1且V2=0且V1=0,威胁距离中等表示为V4=0且V2=1且V1=0,威胁距离近表示为V4=0且V2=0且V1=1;
③对于威胁源是否已知,分为已知威胁表示为1,即V6=1且V3=0;未知威胁表示为1,即V3=1且V6=0;
对于未知威胁V3=1的情况,威胁源的价值一定为未知,即V7=-1,可表示如下:
if(V3=1),then(V7=-1) (4)
④对于通信情况,通信正常则V5=0,通信中断即V5=1;
⑤对于作业决策A1表示为A1=1且A2=A3=A4=A5=A6=0;
⑥对于规避A2表示为A2=1且A1=A3=A4=A5=A6=0;
⑦对于减速等待指令A3表示为A3=1且A1=A2=A4=A5=A6=0;
⑧对于盘旋等待指令A4表示为A4=1且A1=A2=A3=A5=A6=0;
⑨对于应激规避A5表示为A5=1且A1=A2=A3=A4=A6=0;
⑩对于返回A6表示为A6=1且A1=A2=A3=A4=A5=0;
Step2:可选威胁规避动作的推理判断
1)由Step1写出状态向量
状态向量用C(k)表示,其中k表示次数,C(0)表示初始状态向量,状态向量包括威胁规避动作和环境因素,格式为:
其中,没有规避动作时,默认无人机A1~A6值全为0,即
V1~V7为Step1得到的值,在Step2中始终为定值;
2)利用状态向量C(k)进行推理,推理过程如下:
①用状态向量C(k)乘邻接权值矩阵W得到中间向量X(k)
X(k)=C(k)W (7)
其中,节点之间的邻接权值矩阵W如下:
②对中间向量X(k)用状态转移函数f(x)处理中间向量X(k)的每个分量x,状态转移函数f(x)为二值阶跃函数:
其中,x为中间向量X(k)的分量,向量X(k)维度为6,分量x的值域为{0,1};
③用中间向量X(k)更新状态向量C(k),即
④不断重复步骤①、步骤②和步骤③,即不断更新状态向量用C(k),直至状态向量C(k+n+1)=C(k+n),其中,n表示次数,即第(k+n+1)次状态向量的值与第(k+n)次状态向量的值相同;
C(k+n+1)=C(k+n)=[a1,a2,a3,a4,a5,a6|V1,V2,V3,V4,V5,V6,V7],其中a1、a2、a3、a4、a5和a6分别表示威胁规避动作A1、A2、A3、A4、A5和A6对应的取值,取值为0或者1,a1、a2、a3、a4、a5、a6中取值为1的项,对应威胁规避动为可选威胁规避动作;
⑤无人机提供可选威胁规避动作结果给有人机;
Step3:最终威胁规避动作判断
判断如下:
1)满足如下判断条件a)、b)、c)的其中一条,则无人机需要与有人机交互:
a)环境因素中包含高价值V7项值为“1”,即V=(*,*,*,*,*,*,1),其中,*表示无关项,无关项表示取值为“0”或“1”;
b)环境因素中包含未知威胁V3项值为“1”,即V=(*,*,1,*,*,0,-1),其中,*表示无关项,无关项表示取值为“0”或“1”;
c)可选威胁规避动作不符合无人机当前监督控制模式对应的动作等级;
在当前监督控制模式中动作执行方式如下:
①当无人机的监督控制模式为例外管理模式L3,无人机需要交互时,如15s内无人机无法提供的威胁规避动作推理结果,即威胁源未知,则无人机降低监督控制模式到同意管理模式L2;如无人机向有人机提供威胁规避动作推理结果,无人机采用智能结合方式主动反馈,操作员在15s内不否定即执行无人机提供的威胁规避动作推理结果,反之,操作员在15s内否定则不执行,并降低监督控制模式到同意管理模式L2;
②当无人机的监督控制模式为同意管理模式L2,无人机需要交互时,如15s内无人机无法提供的威胁规避动作推理结果,即威胁源未知,无人机降低监督控制模式到操作员决策模式L1;如无人机向有人机提供威胁规避动作推理结果,无人机采用智能结合方式主动反馈,等待操作员的认可,15s内没有得到操作员的认可则不执行无人机提供的威胁规避动作推理结果,并降低监督控制模式到操作员决策模式L1;
③当无人机的监督控制模式为指令控制模式L1,则无人机需要交互时,无人机向有人机提供威胁源的图像信息,位置信息以及雷达波段信息,并提供状态向量C(k)和威胁规避动作推理结果,有人机采用接管方式并结合如下规则执行:
通过命令给出无人机威胁规避动作,无人机15s内等待操作员的决策,按照决策结果执行,超时无决策,则返回基地;
2)当可选威胁规避动作符合无人机当前监督控制模式对应动作等级,且环境因素不符合step3的步骤1)中判断条件a)和b)的其中一条,则无人机不需与有人机交互,可选威胁规避动作按照如下优先级执行:
A1>A2>A3>A4>A5>A6 (11)
对应监督控制模式中动作执行方式如下:
④无人机不需要交互时,当在例外管理模式L3下,则允许执行的动作为作业决策A1、规避A2、减速等待指令A3、盘旋等待指令A4、应激规避A5和返回A6,无人机按照式(11)优先级采用自主执行方式;
⑤无人机不需要交互时,当在同意管理模式L2下,允许执行的动作为减速等待指令A3、盘旋等待指令A4、应激规避A5和返回A6,无人机按照式(11)优先级采用自主执行方式;
⑥无人机不需要交互时,在指令控制模式L1下,允许执行的动作为应激规避A5和返回A6,无人机按照式(11)优先级采用自主执行方式;
Step4:每30s更新一次Step1的环境因素和威胁规避动作的数值,当无人机监督控制模式降低,则更新无人机监督控制模式为降低后的模式,按照Step1~Step3循环往复,无人机执行最终得到的威胁规避动作,完成威胁规避,当无人机成功规避威胁后,无人机监督控制模式恢复为例外管理模式L3模式。
无人机在威胁规避时的案例可以按通信正常和通信中断分为两大类,同时,通信正常时又可以分为面对已知威胁和未知威胁两种情况,下面分别对上述三种情况的过程进行仿真,如表5所示:
表5无人机威胁规避任务
实施例1:
Step1:定义监督控制模式、环境因素和威胁规避动作
由表5可知,威胁类型为已知威胁,则V6=1且V3=0;威胁价值高,则V7=1;威胁距离中等,则V4=0且V2=1且V1=0;通信正常,则V5=0。此外,A1~A6初始为0,初始监督控制模式为例外管理模式L3;
Step2:可选威胁规避动作的推理判断
状态向量为:
将其迭代,输出的状态向量为:
输出结果表明无人机在实施例1的可选择动作为规避A2和盘旋等待A4。
无人机提供可选威胁规避动作结果规避A2和盘旋等待A4给有人机。
Step3:最终威胁规避动作判断
由表1,可选威胁规避动作规避A2和盘旋等待A4,符合无人机当前例外管理模式L3对应动作等级;无人机需要与有人机交互的情况判断条件a)成立,即环境因素中包含高价值V7项值为“1”,对应监督控制模式动作执行方式为:当无人机的监督控制模式为例外管理模式L3时,无人机需要交互时,无人机向有人机提供威胁规避动作推理结果:规避A2和盘旋等待A4,无人机采用智能结合方式主动反馈,操作员在15s内不否定即执行。反之,操作员在15s内否定则不执行,并降低监督控制模式到同意管理模式L2。
无人机提供Step2得到的威胁规避A2的动作策略等待有人机操作员判断,根据公式(10)的规则:
if(威胁已知并且高价值),then(选择作业决策)
有人机操作员否定可选威胁规避动作,命令无人机选择作业决策A1,无人机执行命令,并降低监督控制模式到同意管理模式L2。直至30s后威胁信息数据更新Step1,无人机再次重复步骤Step2、Step3,过程如图2所示。
实施例2:
Step1:定义监督控制模式、环境因素和威胁规避动作
由表5可知,威胁类型为未知威胁,则V3=1且V6=0;威胁价值未知,则V7=-1;威胁距离近,则V4=0且V2=0且V1=1;通信正常,有V5=0。此外,A1~A6初始为0,初始监督控制模式为例外管理模式L3。
Step2:可选威胁规避动作的推理判断
状态向量为:
考虑威胁价值未知(V7=-1),信息不全,无人机无法做出判断,需要与有人机进行交互。
Step3:最终威胁规避动作判断
无人机需要与有人机交互的情况判断条件b)成立,即环境因素中包含未知威胁V3项值为“1”,此时由于无人机无法做出判断,不能及时向有人机提供威胁规避动作推理结果,15s内无人机无法提供的威胁规避动作推理结果,无人机降低监督控制模式到同意管理模式L2。同样,下一个15s内无人机仍然无法提供的威胁规避动作推理结果,无人机降低监督控制模式到操作员决策模式L1。
无人机的监督控制模式为指令控制模式L1,无人机不能自主完成威胁规避决策,需要与有人机进行交互,同时传回威胁源的图像信息,位置信息,以及雷达波段信息,有人机操作员根据威胁源的信息判断出威胁价值低(V7=0),更新威胁数据;
30s后,更新Step1的监督控制模式、环境因素和威胁规避动作。
有人机操作员更新了威胁数据:威胁类型为已知威胁,有V6=1且V3=0;威胁价值低,有V7=0;由于无人机没有得到规避动作,A1~A6仍为初始值0;由于无人机监督控制模式降低,无人机监督控制模式更新为操作员决策模式L1。
更新Step2的可选威胁规避动作的推理判断
状态向量为:
将其迭代,输出的状态向量为:
输出结果表明无人机在实施例2中可选择的动作为应激规避A5。
更新Step3的最终威胁规避动作判断
由判断:当可选威胁规避动作符合无人机当前监督控制模式对应动作等级,且环境因素不符合step2的步骤1)中判断条件a)和b)的其中一条,则无人机不需与有人机交互。
在指令控制模式L1下,允许执行的动作为应激规避A5和返回A6,故无人机执行应激规避A5。直至30s后威胁信息数据更新Step1,无人机继续步骤Step2、Step3,过程如图3所示。
实施例3:
Step1:定义监督控制模式、环境因素和威胁规避动作
由表5可知,威胁类型为未知威胁,则V3=1且V6=0;威胁价值未知,则V7=-1(-1表示威胁价值未知);威胁距离远,则V4=1且V2=0且V1=0;通信正常,有V5=0。此外,A1~A6初始为0,初始监督控制模式为例外管理模式L3。
Step2:可选威胁规避动作的推理判断
状态向量为:
考虑威胁价值未知(V7=-1),信息不全,无人机无法做出判断,需要与有人机进行交互。
Step3:最终威胁规避动作判断
无人机不能自主完成威胁规避决策,同时由于通信中断,又无法与有人机交互,此时无人机降低监督控制模式,15s后降低监督控制模式到同意管理模式L2,此后15s仍然通信中断,无法交互,无人机降低监督控制模式到指令控制模式L1,此后15s仍然通信中断,无法交互,无人机根据指令控制模式L1,选择自保行为,返回基地,即规避动作A6,过程如图4所示。
Claims (1)
1.一种有人机对无人机威胁规避的监督控制方法,其特征在于包括下述步骤:
Step1:定义监督控制模式、环境因素和威胁规避动作
无人机遇到突发威胁时有6种威胁规避动作,包括作业决策A1、规避A2、减速等待指令A3、盘旋等待指令A4、应激规避A5和返回A6;
其中,作业决策A1和规避A2为高等级的动作;减速等待指令A3和盘旋等待指令A4为中等级的动作;应激规避A5和返回A6为低等级的动作;
监督控制模式为3个模式,无人机的自主能力由高到低分别为例外管理模式L3、同意管理模式L2、和指令控制模式L1,无人机初始模式为例外管理模式L3;
定义无人机监督控制模式如表1所示:
表1
动作执行方式是指无人机在有人机监督控制下,完成对应的威胁规避动作的方式,如表2所示;
表2
1)环境因素包括威胁源的价值、威胁距离、威胁源是否为已知和通信情况,定义如下:
①威胁源的价值V7包括高价值威胁源和低价值威胁源,其中威胁价值如表3所定义;
表3
②威胁距离包括威胁距离远V4、威胁距离中等V2和威胁距离近V1;
相对于无人机,威胁源的位置表示为
<mrow>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mi>P</mi>
<mrow>
<mo>(</mo>
<mn>0</mn>
<mo>)</mo>
</mrow>
<mo>+</mo>
<msub>
<mi>v</mi>
<mi>i</mi>
</msub>
<mi>t</mi>
<mo>-</mo>
<msubsup>
<mo>&Integral;</mo>
<mn>0</mn>
<mi>t</mi>
</msubsup>
<msub>
<mi>v</mi>
<mi>u</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>&tau;</mi>
<mo>)</mo>
</mrow>
<mi>d</mi>
<mi>&tau;</mi>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
式(1)中,P(t)为t时刻威胁源i的位置,t为时间,P(0)为威胁源i的初始位置,vi为威胁源i的速度,vu(τ)为无人机u的速度,其中:
式(2)中为无人机的偏航角,无人机威胁距离的远近由无人机飞抵威胁源i所在位置的时间T按照如下公式定义:
③威胁源分为已知威胁V6和未知威胁V3,已知威胁指已知作业区域的威胁源的图像信息,位置信息以及雷达波段信息;未知威胁是指作业区域的威胁源的图像信息,位置信息以及雷达波段信息至少缺少一个;
④通信情况指通信中断V5,指到达无人机接收机的信号强度小于有人机接收机的灵敏度,有人机与无人机间无法正常通信的情况;
2)环境因素和威胁规避动作的取值的值域为{-1,0,1},其物理意义如表4所示:
表4
①对于威胁源的价值V7,高价值表示为1,即V7=1;低价值表示为0,即V7=0;价值未知表示为-1,即V7=-1;
②对于威胁距离,威胁距离远表示为V4=1且V2=0且V1=0,威胁距离中等表示为V4=0且V2=1且V1=0,威胁距离近表示为V4=0且V2=0且V1=1;
③对于威胁源是否已知,分为已知威胁表示为1,即V6=1且V3=0;未知威胁表示为1,即V3=1且V6=0;
对于未知威胁V3=1的情况,威胁源的价值一定为未知,即V7=-1,可表示如下:
if(V3=1),then(V7=-1) (4)
④对于通信情况,通信正常则V5=0,通信中断即V5=1;
⑤对于作业决策A1表示为A1=1且A2=A3=A4=A5=A6=0;
⑥对于规避A2表示为A2=1且A1=A3=A4=A5=A6=0;
⑦对于减速等待指令A3表示为A3=1且A1=A2=A4=A5=A6=0;
⑧对于盘旋等待指令A4表示为A4=1且A1=A2=A3=A5=A6=0;
⑨对于应激规避A5表示为A5=1且A1=A2=A3=A4=A6=0;
⑩对于返回A6表示为A6=1且A1=A2=A3=A4=A5=0;
Step2:可选威胁规避动作的推理判断
1)由Step1写出状态向量
状态向量用C(k)表示,其中k表示次数,C(0)表示初始状态向量,状态向量包括威胁规避动作和环境因素,格式为:
其中,没有规避动作时,默认无人机A1~A6值全为0,即
V1~V7为Step1得到的值,在Step2中始终为定值;
2)利用状态向量C(k)进行推理,推理过程如下:
①用状态向量C(k)乘邻接权值矩阵W得到中间向量X(k)
X(k)=C(k)W (7)
其中,节点之间的邻接权值矩阵W如下:
②对中间向量X(k)用状态转移函数f(x)处理中间向量X(k)的每个分量x,状态转移函数f(x)为二值阶跃函数:
<mrow>
<mi>f</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mn>0</mn>
</mtd>
<mtd>
<mrow>
<mi>x</mi>
<mo>&le;</mo>
<mn>0</mn>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mn>1</mn>
</mtd>
<mtd>
<mrow>
<mi>x</mi>
<mo>></mo>
<mn>0</mn>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>8</mn>
<mo>)</mo>
</mrow>
</mrow>
其中,x为中间向量X(k)的分量,向量X(k)维度为6,分量x的值域为{0,1};
③用中间向量X(k)更新状态向量C(k),即
④不断重复步骤①、步骤②和步骤③,即不断更新状态向量用C(k),直至状态向量C(k+n+1)=C(k+n),其中,n表示次数,即第(k+n+1)次状态向量的值与第(k+n)次状态向量的值相同;
C(k+n+1)=C(k+n)=[a1,a2,a3,a4,a5,a6|V1,V2,V3,V4,V5,V6,V7],其中a1、a2、a3、a4、a5和a6分别表示威胁规避动作A1、A2、A3、A4、A5和A6对应的取值,取值为0或者1,a1、a2、a3、a4、a5、a6中取值为1的项,对应威胁规避动为可选威胁规避动作;
⑤无人机提供可选威胁规避动作结果给有人机;
Step3:最终威胁规避动作判断
判断如下:
1)满足如下判断条件a)、b)、c)的其中一条,则无人机需要与有人机交互:
a)环境因素中包含高价值V7项值为“1”,即V=(*,*,*,*,*,*,1),其中,*表示无关项,无关项表示取值为“0”或“1”;
b)环境因素中包含未知威胁V3项值为“1”,即V=(*,*,1,*,*,0,-1),其中,*表示无关项,无关项表示取值为“0”或“1”;
c)可选威胁规避动作不符合无人机当前监督控制模式对应的动作等级;
在当前监督控制模式中动作执行方式如下:
①当无人机的监督控制模式为例外管理模式L3,无人机需要交互时,如15s内无人机无法提供的威胁规避动作推理结果,即威胁源未知,则无人机降低监督控制模式到同意管理模式L2;如无人机向有人机提供威胁规避动作推理结果,无人机采用智能结合方式主动反馈,操作员在15s内不否定即执行无人机提供的威胁规避动作推理结果,反之,操作员在15s内否定则不执行,并降低监督控制模式到同意管理模式L2;
②当无人机的监督控制模式为同意管理模式L2,则无人机需要交互时,如15s内无人机无法提供的威胁规避动作推理结果,即威胁源未知,无人机降低监督控制模式到操作员决策模式L1;如无人机向有人机提供威胁规避动作推理结果,无人机采用智能结合方式主动反馈,等待操作员的认可,15s内没有得到操作员的认可则不执行无人机提供的威胁规避动作推理结果,并降低监督控制模式到操作员决策模式L1;
③当无人机的监督控制模式为指令控制模式L1,则无人机需要交互时,无人机向有人机提供威胁源的图像信息,位置信息以及雷达波段信息,并提供状态向量C(k)和威胁规避动作推理结果,有人机采用接管方式并结合如下规则执行:
通过命令给出无人机威胁规避动作,无人机15s内等待操作员的决策,按照决策结果执行,超时无决策,则返回基地;
2)当可选威胁规避动作符合无人机当前监督控制模式对应动作等级,且环境因素不符合step3的步骤1)中判断条件a)和b)的其中一条,则无人机不需与有人机交互,可选威胁规避动作按照如下优先级执行:
A1>A2>A3>A4>A5>A6 (11)
对应监督控制模式中动作执行方式如下:
①无人机不需要交互时,当在例外管理模式L3下,则允许执行的动作为作业决策A1、规避A2、减速等待指令A3、盘旋等待指令A4、应激规避A5和返回A6,无人机按照式(11)优先级采用自主执行方式;
②无人机不需要交互时,当在同意管理模式L2下,允许执行的动作为减速等待指令A3、盘旋等待指令A4、应激规避A5和返回A6,无人机按照式(11)优先级采用自主执行方式;
③无人机不需要交互时,在指令控制模式L1下,允许执行的动作为应激规避A5和返回A6,无人机按照式(11)优先级采用自主执行方式;
Step4:每30s更新一次Step1的环境因素和威胁规避动作的数值,当无人机监督控制模式降低,则更新无人机监督控制模式为降低后的模式,按照Step1~Step3循环往复,无人机执行最终得到的威胁规避动作,完成威胁规避,当无人机成功规避威胁后,无人机监督控制模式恢复为例外管理模式L3模式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710553623.5A CN107491085B (zh) | 2017-07-08 | 2017-07-08 | 一种有人机对无人机威胁规避的监督控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710553623.5A CN107491085B (zh) | 2017-07-08 | 2017-07-08 | 一种有人机对无人机威胁规避的监督控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107491085A true CN107491085A (zh) | 2017-12-19 |
CN107491085B CN107491085B (zh) | 2020-02-14 |
Family
ID=60644646
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710553623.5A Active CN107491085B (zh) | 2017-07-08 | 2017-07-08 | 一种有人机对无人机威胁规避的监督控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107491085B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109765909A (zh) * | 2019-03-07 | 2019-05-17 | 北京主线科技有限公司 | V2x系统应用在港口的方法 |
CN110738872A (zh) * | 2018-07-20 | 2020-01-31 | 极光飞行科学公司 | 用于空中交通工具的飞行控制系统和相关方法 |
CN111045360A (zh) * | 2019-11-29 | 2020-04-21 | 中国电子科技集团公司第二十研究所 | 一种支持无人系统互操作的通用任务指令处理方法 |
CN112068587A (zh) * | 2020-08-05 | 2020-12-11 | 北京航空航天大学 | 基于欧椋鸟通信机制的有人/无人机共融集群交互方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5581250A (en) * | 1995-02-24 | 1996-12-03 | Khvilivitzky; Alexander | Visual collision avoidance system for unmanned aerial vehicles |
EP2674723A2 (en) * | 2012-06-11 | 2013-12-18 | Honeywell International Inc. | Systems and methods for unmanned aircraft system collision avoidance |
CN103592948A (zh) * | 2013-12-04 | 2014-02-19 | 成都纵横自动化技术有限公司 | 无人机飞行防撞方法 |
CN103699132A (zh) * | 2013-12-05 | 2014-04-02 | 中国航空无线电电子研究所 | 一种用于辅助目视盘旋进近的装置及方法 |
CN106094569A (zh) * | 2016-07-06 | 2016-11-09 | 西北工业大学 | 多传感器融合无人机感知与规避仿真系统及其仿真方法 |
US20170102241A1 (en) * | 2014-03-15 | 2017-04-13 | Aurora Flight Sciences Corporation | Autonomous Vehicle Navigation System and Method |
CN106647810A (zh) * | 2017-01-10 | 2017-05-10 | 山东科技大学 | 一种基于负比例导引的无人机自动避撞方法 |
-
2017
- 2017-07-08 CN CN201710553623.5A patent/CN107491085B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5581250A (en) * | 1995-02-24 | 1996-12-03 | Khvilivitzky; Alexander | Visual collision avoidance system for unmanned aerial vehicles |
EP2674723A2 (en) * | 2012-06-11 | 2013-12-18 | Honeywell International Inc. | Systems and methods for unmanned aircraft system collision avoidance |
CN103592948A (zh) * | 2013-12-04 | 2014-02-19 | 成都纵横自动化技术有限公司 | 无人机飞行防撞方法 |
CN103699132A (zh) * | 2013-12-05 | 2014-04-02 | 中国航空无线电电子研究所 | 一种用于辅助目视盘旋进近的装置及方法 |
US20170102241A1 (en) * | 2014-03-15 | 2017-04-13 | Aurora Flight Sciences Corporation | Autonomous Vehicle Navigation System and Method |
CN106094569A (zh) * | 2016-07-06 | 2016-11-09 | 西北工业大学 | 多传感器融合无人机感知与规避仿真系统及其仿真方法 |
CN106647810A (zh) * | 2017-01-10 | 2017-05-10 | 山东科技大学 | 一种基于负比例导引的无人机自动避撞方法 |
Non-Patent Citations (1)
Title |
---|
魏瑞轩、李学仁: "《先进无人机系统与作战运用》", 31 December 2014 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110738872A (zh) * | 2018-07-20 | 2020-01-31 | 极光飞行科学公司 | 用于空中交通工具的飞行控制系统和相关方法 |
CN109765909A (zh) * | 2019-03-07 | 2019-05-17 | 北京主线科技有限公司 | V2x系统应用在港口的方法 |
CN109765909B (zh) * | 2019-03-07 | 2022-03-08 | 北京主线科技有限公司 | V2x系统应用在港口的方法 |
CN111045360A (zh) * | 2019-11-29 | 2020-04-21 | 中国电子科技集团公司第二十研究所 | 一种支持无人系统互操作的通用任务指令处理方法 |
CN112068587A (zh) * | 2020-08-05 | 2020-12-11 | 北京航空航天大学 | 基于欧椋鸟通信机制的有人/无人机共融集群交互方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107491085B (zh) | 2020-02-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107491085A (zh) | 一种有人机对无人机威胁规避的监督控制方法 | |
CN103119529A (zh) | 移动体 | |
Lovato et al. | A fuzzy modeling approach to optimize control and decision making in conflict management in air traffic control | |
Palatti et al. | Planning for safe abortable overtaking maneuvers in autonomous driving | |
Ikidid et al. | A Fuzzy Logic Supported Multi-Agent System For Urban Traffic And Priority Link Control. | |
Guzzi et al. | A model of artificial emotions for behavior-modulation and implicit coordination in multi-robot systems | |
Mavrogiannis et al. | B-gap: Behavior-guided action prediction for autonomous navigation | |
CN110806758B (zh) | 一种基于情景模糊认知图的无人机群自主等级自适应调整方法 | |
Sathyan et al. | Decentralized cooperative driving automation: a reinforcement learning framework using genetic fuzzy systems | |
Zhang et al. | Autonomous vehicle with communicative driving for pedestrian crossing: Trajectory optimization | |
Piccoli et al. | Optimal control of a collective migration model | |
Shi et al. | Efficient Lane-changing Behavior Planning via Reinforcement Learning with Imitation Learning Initialization | |
Rabby et al. | A learning-based adjustable autonomy framework for human–robot collaboration | |
Ole et al. | Towards concept based software engineering for intelligent agents | |
Ye et al. | Counterfactual evolutionary reasoning for virtual driver reinforcement learning in safe driving | |
CN107943066B (zh) | 一种有人机对无人机障碍规避的监督控制方法 | |
Kalweit et al. | Q-learning with long-term action-space shaping to model complex behavior for autonomous lane changes | |
Xie et al. | A distributed multi-agent formation control method based on deep Q learning | |
Taylor | Cognition and autonomy in distributed intelligent systems | |
Faruffini et al. | Vehicle autonomous navigation with context awareness | |
Rothfuß | Human-machine cooperative decision making | |
Liang et al. | A framework of intelligent environment with smart-active objects (IESAO) for flexible and efficient crowd simulation | |
Canh et al. | Design of Deep Reinforcement Learning Approach for Traffic Signal Control at Three-way Crossroads | |
Lotzmann et al. | A TRASS-based agent model for traffic simulation | |
Gomez-Correa et al. | Adaptive Tracking Controller with Exponential Restrictions for Robotic Manipulators |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20210601 Address after: No. 113, Zhichun Road, Haidian District, Beijing 100080 Patentee after: Hangzi Technology (Beijing) Co.,Ltd. Address before: 710072 No. 127 Youyi West Road, Shaanxi, Xi'an Patentee before: Northwestern Polytechnical University |
|
TR01 | Transfer of patent right |