CN109657868B

CN109657868B - 一种任务时序逻辑约束的概率规划识别方法

Info

Publication number: CN109657868B
Application number: CN201811599707.3A
Authority: CN
Inventors: 方浩; 宇文涛; 陈杰; 田戴荧; 刘得明
Original assignee: Beijing Institute of Technology BIT
Current assignee: Beijing Institute of Technology BIT
Priority date: 2018-12-26
Filing date: 2018-12-26
Publication date: 2021-02-09
Anticipated expiration: 2038-12-26
Also published as: CN109657868A

Abstract

本发明公开了一种任务时序逻辑约束的概率规划识别方法，以智能体、任务集、环境为已知信息，对任务集用线性时序逻辑语言描述并转换成相应Büchi自动机，对环境用有限状态转移系统进行建模，将两者合并形成规划库，规划器以智能体的观测信息和规划库为输入，形成规划结果集；以目标智能体的观测信息和规划库为输入，综合考虑智能体当前位置，姿态，历史轨迹以及任务进程，其中，智能体的姿态计算以智能体与目标点的朝向角为基准，在乘积式Büchi自动机的基础上，设计基于Dijkstra算法的规划器，得出规划结果集，由规划器计算出规划结果集和对应整体代价集，在满足观测序列的情况下对目标智能体的意图和行为的预测，根据设计概率计算公式得出目标概率和任务概率。

Description

一种任务时序逻辑约束的概率规划识别方法

技术领域

本发明属于人工智能技术领域，具体涉及一种任务时序逻辑约束的概率规划识别方法。

背景技术

规划识别(plan recognition)在人工智能领域中是一个很有研究前景和具有一定热度的研究方向，是指根据通过各种途径获得的目标智能体的轨迹、动作等信息，预测/辨识该智能体目标/规划的过程。能够设计出合适的规划识别器推理出的预测/辨识结果，一方面填补在实际环境中已经发生但是未能观测到的信息，另一方面可以对目标智能体的未来目标和当前行为进行预测和辨识，推断出智能体未来可能的行为。规划识别应用在多个不同领域，例如:军事指挥、对手规划/敌意规划/应对规划、自然语言理解、智能帮助系统以及多智能体系统协作等。因此，针对规划识别这一类问题的研究具有很高的研究意义和实际价值，吸引着大量研究人员参与进来。

针对实际应用中的任务时序逻辑和规划识别问题，已有的解决方案有如下几种：

方案1：文献(Guo M,Dimos D V.Multi-agent plan reconfiguration underlocal LTL specifications[J].International Journal of Robotics Research, 2015,34(2):218—235.)提出了一种分层的分布式多智能体系统混合决策-控制架构，并提出了一种具有时序逻辑任务的多智能体系统协同任务规划策略，每个智能体分配一个线性时序逻辑公式作为一个任务，对智能体的工作环境、运动和动作进行建模，多智能体间通过实时的请求和响应完善模型并完成协同任务。

方案2：文献(Ramirez M,Geffner H.Plan Recognition As Planning[C], theIEEE International Joint Conference on Artificial Intelligence,2009, 38(4):1778—1783.)在基于规划执行的规划识别思路上，提出了Plan recognition as planning的思想。不同于之前的规划识别算法，该算法不需要规划库作为输入，通过使用智能体当前状态和周围环境作为输入，利用规划器模拟出多种规划结果，根据智能体当前位置与各目标点之间的距离，利用贝叶斯推理得出目标概率和规划概率，并且该算法在观测数据不可靠情况下同样具有较高的准确性，具有一定的鲁棒性。

方案3：文献(Shirin S,Anton V R,Octavian U.Plan recognition as planningrevisited[C],the IEEE International Joint Conference on ArtificialIntelligence,2016:3258—3264.)在方案2基础上，将多种规划结果与观察得到的智能体移动轨迹进行比较，选取符合历史轨迹的规划结果，再利用贝叶斯推理进行目标概率和规划概率计算，相比于方案2的方法，提高了规划识别的准确性。

发明内容

有鉴于此，本发明的目的是提供一种任务时序逻辑约束的概率规划识别方法，

一种任务时序逻辑约束的概率规划识别方法，包括如下步骤：

步骤一，建立面向实际环境的时序逻辑任务模型：利用有限状态转移系统对实际环境建模，再利用线性时序逻辑语言对任务进行描述并转换成对应Büchi 自动机，将两者相结合建立同时具有环境信息和任务信息的乘积式Büchi自动机；将任务集中的所有任务建立形成对应乘积式Büchi自动机，组成规划库；

步骤二，根据对目标智能体的观测信息和规划库信息，综合考虑智能体当前位置、姿态、历史轨迹以及任务进程，基于Dijkstra算法设计规划器，并得出规划结果集和整体代价集，其中，智能体的姿态计算以智能体与目标点的朝向角为基准；

步骤三，将规划和规划识别相结合形成统一的整体，对于非合作智能体的未来目标和当前执行任务进行预测和辨识，提取规划器的规划结果集中反映的目标和任务，以规划器的整体代价集为衡量标准，计算目标概率和任务概率。

进一步的，所述步骤三中，计算得到目标概率和任务概率后，得到预测目标准确率和辨识任务准确率，给出针对所设计概率规划识别算法的评价标准。

较佳的，所述步骤一中，具体包括如下步骤：

(1)带权的有限状态转移系统：

针对智能体的实际环境建模问题，采用带权的有限状态转移系统WFTS进行描述，定义如下：

定义1.带权的有限状态转移系统(WFTS)由一个多元组组成：

Τ_c＝(Π,→_c,Π₀,AP,L_c,W_c)

其中：

Π＝{π₁,π₂,...,π_N}表示栅格化后实际环境的各个区域；

→_c：表示两两栅格区域之间的路径连通关系；

Π₀：表示智能体在初始时刻的实际位置；

AP:表示描述不可再划分任务的原子命题；

L_c:表示栅格区域对应的标签函数，即栅格区域对应的任务原子命题的属性；

W_c:表示权重，即智能体在栅格区域之间互相转移所需的代价；

状态π_i可到达的状态表示为Post(π_i)＝{π_j∈Π|π_i→_cπ_j}；将待观察目标智能体的移动轨迹用一个无穷状态序列表示，τ＝π₁→π₂...，其中，π_i∈Post(π_i-1)；

(2)非确定性Büchi自动机：

利用线性时序逻辑LTL语言对原子命题AP进行描述，形成表达式

相对于表达式

存在一个与其对应的非确定性Büchi自动机NBA，记为

定义2.

定义为五元组：

其中，Q表示由自动机中的各个状态q₁,q₂,...,q_n组成的有限状态集合；

表示由自动机中的初始状态组成的初始状态集合；2^AP表示由任务原子命题组成的字母表；δ表示自动机中各状态之间的转移关系，

表示由自动机中的可接受状态组成的可接受集合；

(3)利用LTL语言对每个待辨识任务进行描述，并转换成相应Büchi自动机；将WFTS和NBA相结合形成面向实际环境的时序逻辑任务模型：

定义3.带权的乘积式Büchi自动机PBA表示为

其中：

δ′＝Q′→2^Q′.<π_j,q_n>∈δ′(<π_i,q_m>)当且仅当(π_i,π_j)∈→_c并且q_n∈δ(q_m,L_c(π_i))；

Q₀′＝{<π,q>|π∈Π₀,q∈Q₀}，是初始状态集；

F′＝{<π,q>|π∈Π₀,q∈F}，是可接受集；

是权重函数：

W_p(<π_i,q_m>,<π_j,q_n>)＝W_c(π_i,π_j)

其中<π_j,q_n>∈δ′(<π_i,q_m>)；

所述步骤二具体步骤包括：

定义4.针对时序逻辑任务的规划问题定义为Pl＝{A_p,π_c,Q_c,Rs}，其中，A_p表示任务对应的乘积式自动机，π_c表示智能体的当前位置，Q_c表示当前时刻智能体可能对应的自动机中的状态集，Rs表示以q′_c∈Q′_c为起始点的A_p的所有可接受序列组成的集合，

根据定义4，设定可接受序列的结构为:

R＝<R_pre,R_suf>＝q′_cq′_c+1…q′_f[q′_fq′_f+1…q′_n]

其中q_f′＝<π_f,q_f>∈F′；

定义整体代价：

式中，第一个累加部分表示沿前缀部分的累积，第一个累加部分表示沿后缀部分的累积；γ≥0是一个常数，表示前缀代价与后缀代价的相对权重系数；

定义5.针对时序逻辑任务的概率规划识别问题定义为 Pr＝{A_p,π_c,Q_c,Rs,Os,Gs,Ps}，其中：

Os表示智能体的历史移动轨迹；

表示目标概率集，

表示智能体下一步目标是π_i的概率，Π_g表示待预测目标集；

表示任务概率集，

表示当前执行任务是

的概率，

表示所有任务的集合；

当构建完成A_p之后，以A_p作为输入参数，计算可接受序列集Rs，获取多种规划路径；使用Dijkstra算法，计算带权图中从单点出发到一组目标点的路径，具体步骤如下:

①对于用线性时序逻辑语言描述的任务集

将其中每个任务

转换成对应Büchi自动机

利用FTS对目标智能体工作环境建模形成T_c，并确定待预测目标集Π_g；利用PBA对

和T_c进行乘积操作构成

并建立规划库

②通过观测获取目标智能体历史移动轨迹Os＝π₀,...,π_c，对于π_i，0≤i＜c，有；

当i＝c时，π_c表示目标智能体当前位置信息，有:

③考虑历史移动轨迹Os的影响：

1)、令i＝1

2)、对于

如果

则保留q′_i；否则，将q′_i从集合Q′_i中删除；

3)、i＝i+1

4)、判断i＞c是否成立：如果成立，结束步骤3)，得到经过处理后Q′_c；否则返回2)；

④

使用Dijkstra算法计算从当前状态q′_c∈Q′_c到一个可接受状态

的最短路径，

是

的可接受状态集，记为

⑤使用Dijkstra算法计算

中每一个可接受状态

回到自身的最短循环路径，记为

⑥对于

定义：

定义规划结果

序列中第一个属于待识别目标集Π_g的π_i为

下的智能体下一步目标，记为

规划器根据观测所得目标智能体的信息，计算出符合实际环境和任务集的规划结果集R_sum为：

根据所得规划结果集R_sum，得出智能体下一步目标集Π_gsum为：

根据整体代价R计算公式得到

的整体代价

整体代价集Cost_sum为：

其中，在设计规划器过程中，考虑智能体朝向与目标之间夹角的影响，则令X_i表示第i时刻智能体X的位置，朝向由

表示，则在第i时刻，智能体X 朝向与目标A之间的夹角为：

所述步骤四具体包括如下步骤：

①对

作处理，定义：

其中，exp{x}表示e^x，

是正则化惩罚系数，由智能体姿态决定，λ是常数，

②在规划结果集R_sum中，将所有规划目标为π_k且任务为

的规划结果对应的整体代价相加，得到：

将所有规划目标任务为

的规划结果对应的整体代价相加，得到：

将规划结果集所有规划对应的整体代价相加，有：

③针对目标智能体当前执行任务的辨识，根据观测轨迹Os计算任务集Φ中的任务概率

规划结果集中符合

的整体代价所占比重，即为后验概率

首先，假设任务集Φ中的任务

相互独立，计算在任务

的情况下，目标为π_k的后验概率

之后，根据观测轨迹Os计算待预测目标集Π_g中的目标概率

即后验概率 P(π_k|Os)：

进一步的，还包括对预测目标准确率和辨识任务准确率的计算，具体为：

智能体的实际目标集为G_true(i)＝{g_t(0),...,～g_t(i)}，预测目标集为 G_pred(i)＝{max(Gs(0)),...,max(Gs(i))}，其中，g_t(i)，max(Gs(i))分别表示第i时刻智能体的实际目标和预测目标概率最大的目标，g_t(i),max(Gs(i))∈Π_g。智能体的实际执行任务集为

预测执行任务集为Φ_pred(i)＝{max(Ps(0)),..., max(Ps(i))}，其中，

max(Ps(i))表示第i时刻智能体的实际执行任务和预测任务概率最大的任务，

第i时刻，目标预测准确率GA(i)为：

GA(i)＝plen(G_true(i)∩G_pred(i))/len(G_true(i))

其中，len(G)表示集合G的长度。

第i时刻，任务辨识准确率TA(i)为

TA(i)＝len(Φ_true(i)∩Φ_pred(i))/len(Φ_true(i))。

本发明具有如下有益效果：

本发明针对如何将时序逻辑任务和目标/任务的预测/辨识置于统一的规划识别框架，并给出概率规划识别结果，其创新点主要体现在以下几方面：

一，任务时序逻辑约束的概率规划识别框架。以智能体、任务集、环境为已知信息，对任务集用线性时序逻辑语言描述并转换成相应Büchi自动机，对环境用有限状态转移系统进行建模，将两者合并形成规划库。规划器以智能体的观测信息和规划库为输入，形成规划结果集。规划识别器接受规划结果集得出目标概率和任务概率。

二，规划器的设计。以目标智能体的观测信息和规划库为输入，综合考虑智能体当前位置，姿态，历史轨迹以及任务进程。其中，智能体的姿态计算以智能体与目标点的朝向角为基准。在乘积式Büchi自动机的基础上，设计基于 Dijkstra算法的规划器，得出规划结果集。

三，规划识别器的设计。由规划器计算出规划结果集和对应整体代价集。在满足观测序列的情况下对目标智能体的意图和行为的预测，根据设计概率计算公式得出目标概率和任务概率。并给出了针对所设计概率规划识别算法的评价标准，包括预测目标准确率和辨识任务准确率。

附图说明

图1为本发明任务时序逻辑约束的概率规划识别方法流程图；

图2为本发明智能体朝向与目标之间夹角示意图。

具体实施方式

下面结合附图并举实施例，对本发明进行详细描述。

首先，建立面向实际环境的时序逻辑任务模型，利用有限状态转移系统对实际环境建模，再利用线性时序逻辑语言对任务进行描述并转换成对应Büchi 自动机，将两者相结合建立同时具有环境信息和任务信息的乘积式Büchi自动机。将任务集中的所有任务建立形成对应乘积式Büchi自动机，组成规划库。

其次，根据对目标智能体的观测信息和规划库信息，综合考虑智能体当前位置，姿态，历史轨迹以及任务进程。其中，智能体的姿态计算以智能体与目标点的朝向角为基准。设计基于Dijkstra算法的规划器，并得出规划结果集和整体代价集。

然后，将规划和规划识别相结合形成统一的整体，对于非合作智能体的未来目标和当前执行任务进行预测和辨识，提取规划器的规划结果集中反映的目标和任务，以规划器的整体代价集为衡量标准，设计概率计算公式计算目标概率和任务概率。

最后，给出了针对所设计概率规划识别算法的评价标准，包括预测目标准确率和辨识任务准确率。

本发明提出了一种针对任务时序逻辑约束的基于规划的规划识别方法，如图1所示。将规划和规划识别统一起来，规划识别器根据观测信息利用规划器得出规划结果集并计算目标概率和任务概率。其中，任务时序逻辑约束下的规划识别问题可以描述为:已知目标智能体的任务集，任务集中含有智能体可能会执行的，多个相互之间独立且具有时序逻辑特性的任务，根据实时观测得到的智能体轨迹，对智能体的未来目标和当前执行任务进行预测和辨识。因此，需要对实际环境和执行任务进行建模。

步骤一、面向实际环境的时序逻辑任务建模：

(1)带权的有限状态转移系统：

针对智能体的实际环境建模问题，采用带权的有限状态转移系统(weightedfinite-state transition system，WFTS)进行描述，定义如下：

定义1.带权的有限状态转移系统(WFTS)由一个多元组组成：

Τ_c＝(Π,→_c,Π₀,AP,L_c,W_c)

其中：

Π＝{π₁,π₂,...,π_N}表示栅格化后实际环境的各个区域；

→_c：(其中

)表示两两栅格区域之间的路径连通关系；

Π₀：(其中

)表示智能体在初始时刻的实际位置；

AP表示描述不可再划分任务的原子命题；

L_c:(Π→2^AP)表示栅格区域对应的标签函数，即栅格区域对应的任务原子命题的属性；

W_c:

表示权重，即智能体在栅格区域之间互相转移所需的代价。

状态π_i可到达的状态表示为Post(π_i)＝{π_j∈Π|π_i→_cπ_j}。待观察目标智能体的移动轨迹可以用一个无穷状态序列表示，τ＝π₁→π₂...，其中，π_i∈Post(π_i-1)。

(2)非确定性Büchi自动机

利用线性时序逻辑(Linear Temporal Logic，LTL)语言对原子命题AP进行描述，形成表达式

相对于表达式

存在一个与其对应的非确定性Büchi自动机(Nondeterministic Büchi automaton，NBA)，记为

定义2.

定义为五元组：

其中，Q表示由自动机中的各个状态(q₁,q₂,...,q_n)组成的有限状态集合；

表示由自动机中的初始状态组成的初始状态集合；2^AP表示由任务原子命题组成的字母表；δ:(Q×2^AP→2^Q)表示自动机中各状态之间的转移关系，

表示由自动机中的可接受状态组成的可接受集合。

(3)带权的乘积式Büchi自动机

本发明为有库的规划识别，需要预先描述任务以形成规划库，作为规划识别的依据。利用LTL语言对每个待辨识任务进行描述，并转换成相应Büchi自动机。由WFTS和NBA的定义可以得知，WFTS具有环境信息而不具有任务信息，NBA具有任务信息而不具有环境信息，需要将两者相结合形成面向实际环境的时序逻辑任务模型。

定义3.带权的乘积式Büchi自动机(weighted product Büchi automation， PBA)表示为

其中：

Q₀′＝{<π,q>|π∈Π₀,q∈Q₀}，是初始状态集；

F′＝{<π,q>|π∈Π₀,q∈F}，是可接受集；

W_p:

是权重函数：

W_p(<π_i,q_m>,<π_j,q_n>)＝W_c(π_i,π_j)

其中<π_j,q_n>∈δ′(<π_i,q_m>)。

步骤二、规划器的设计

由定义4可知，时序逻辑任务规划问题的目标是找到同时满足实际环境转移条件和时序逻辑约束的路径，也就是A_p的可接受序列，根据定义4，设定可接受序列的结构为:

R＝<R_pre,R_suf>＝q′_cq′_c+1…q′_f[q′_fq′_f+1…q′_n]

其中q_f′＝<π_f,q_f>∈F′。

在这种前缀后缀结构形式的基础上，我们定义整体代价：

式中，第一个累加部分表示沿前缀部分的累积，第一个累加部分表示沿后缀部分的累积。γ≥0是一个常数，表示前缀代价与后缀代价的相对权重系数。

定义5.针对时序逻辑任务的概率规划识别问题定义为 Pr＝{A_p,π_c,Q_c,Rs,Os,Gs,Ps}，其中

A_p,π_c,Q_c,Rs的定义与定义5相同；

Os表示智能体的历史移动轨迹；

表示目标概率集，

表示任务概率集，

表示当前执行任务是

的概率，

表示所有任务的集合。

当构建完成A_p之后，以A_p作为输入参数，计算可接受序列集Rs，获取多种规划路径。A_p的本质是一个带权的有向图，考虑使用Dijkstra算法，计算带权图中从单点出发到一组目标点的路径。具体步骤如下:

①对于用线性时序逻辑语言描述的任务集

将其中每个任务

转换成对应Büchi自动机

利用FTS对目标智能体工作环境建模形成T_c，并确定待预测目标集Π_g。利用PBA对

和T_c进行乘积操作构成

并建立规划库

②通过观测获取目标智能体历史移动轨迹Os＝π₀,...,π_c，对于π_i，0≤i＜c，有

特殊的，当i＝c时，π_c表示目标智能体当前位置信息，有

③考虑历史移动轨迹Os的影响。

1)、令i＝1

2)、对于

如果

则保留q′_i；否则，将q′_i从集合Q′_i中删除。

3)、i＝i+1

4)、判断i＞c是否成立：如果成立，结束步骤3)，得到经过处理后Q′_c；否则返回2。

④

的最短路径，

是

的可接受状态集，记为

⑤同样使用Dijkstra算法计算

中每一个可接受状态

回到自身的最短循环路径，记为

⑥对于

定义：

定义规划结果

序列中第一个属于待识别目标集Π_g的π_i为

下的智能体下一步目标，记为

根据整体代价R计算公式可以得到

的整体代价

整体代价集Cost_sum为：

步骤三、智能体姿态：

在实际环境中，目标智能体的姿态往往蕴含着意图和行为信息。为提高概率规划识别算法的准确性，本发明将智能体姿态作为影响因素。因为涉及对二维平面的规划识别，所以考虑智能体朝向与目标之间夹角的影响。如图2所示， X_i表示第i时刻智能体X的位置，智能体X的朝向由

表示，则在第i时刻，智能体X朝向与目标A之间的夹角为：

当-90°≤α≤90°，即Cos(X_i，A)≥0，表示目标处在智能体前方，且

智能体靠近目标A，去向A的可能性较大；当90°＜α＜270°，即Cos(X_i,A)＜0，表示目标处在智能体后方，且

智能体远离目标A，去向A的可能性较小。

在图2中，尽管

智能体Y比智能体X更加接近目标A，但是， cosα≥0，cosβ＜0，因此，Y的目标概率g_A小于X。

步骤四、设计概率规划识别器：

对于非合作性目标智能体，根据观测轨迹信息由规划器计算出规划结果集 R_sum和整体代价集Cost_sum，R_sum是在满足观测序列的情况下对目标智能体的意图和行为的预测，根据Cost_sum设计概率计算公式得出目标概率和任务概率。规划识别器算法具体步骤如下:

①规划结果

对应的整体代价

越小，则更有可能被执行，即整体代价与被执行可能性成反比。对

作处理，定义：

其中，exp{x}表示e^x，

是正则化惩罚系数，由智能体姿态决定，λ是常数，

②在规划结果集R_sum中，将所有规划目标为π_k且任务为

的规划结果对应的整体代价相加，得到：

将所有规划目标任务为

的规划结果对应的整体代价相加，得到：

将规划结果集所有规划对应的整体代价相加，有：

规划结果集中符合

的整体代价所占比重，即为后验概率

对于智能体下一步目标的预测，不同任务对应的目标可能相同。

首先，假设任务集Φ中的任务

相互独立，计算在任务

的情况下，目标为π_k的后验概率

之后，根据观测轨迹Os计算待预测目标集Π_g中的目标概率

即后验概率 P(π_k|Os)。

④智能体的实际目标集为G_true(i)＝{g_t(0)，...，～g_t(i)}，预测目标集为 G_pred(i)＝{max(Gs(0))，...，max(Gs(i))}，其中，g_t(i)，max(Gs(i))分别表示第i时刻智能体的实际目标和预测目标概率最大的目标，g_t(i),max(Gs(i))∈Π_g。智能体的实际执行任务集为

预测执行任务集为Φ_pred(i)＝{max(Ps(0)),.. max(Ps(i))}，其中，

第i时刻，目标预测准确率GA(i)为：

GA(i)＝plen(G_true(i)∩G_pred(i))/len(G_true(i))

其中，len(G)表示集合G的长度。

第i时刻，任务辨识准确率TA(i)为

TA(i)＝len(Φ_true(i)∩Φ_pred(i))/len(Φ_true(i))

综上所述，以上仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种任务时序逻辑约束的概率规划识别方法，其特征在于，包括如下步骤：

步骤一，建立面向实际环境的时序逻辑任务模型：利用有限状态转移系统对实际环境建模，再利用线性时序逻辑语言对任务进行描述并转换成对应Büchi自动机，将两者相结合建立同时具有环境信息和任务信息的乘积式Büchi自动机；将任务集中的所有任务建立形成对应乘积式Büchi自动机，组成规划库；

步骤三，将规划和规划识别相结合形成统一的整体，对于非合作智能体的未来目标和当前执行任务进行预测和辨识，提取规划器的规划结果集中反映的目标和任务，以规划器的整体代价集为衡量标准，计算目标概率和任务概率；

其中，所述步骤三中，计算得到目标概率和任务概率后，得到预测目标准确率和辨识任务准确率，给出针对所设计概率规划识别算法的评价标准；

所述步骤一中，具体包括如下步骤：

(1)带权的有限状态转移系统：

定义1.带权的有限状态转移系统(WFTS)由一个多元组组成：

T_c＝(Π,→_c,Π₀,AP,L_c,W_c)

其中：

Π＝{π₁,π₂,...,π_N}表示栅格化后实际环境的各个区域；

→_c：表示两两栅格区域之间的路径连通关系；

Π₀：表示智能体在初始时刻的实际位置；

AP:表示描述不可再划分任务的原子命题；

(2)非确定性Büchi自动机：

相对于表达式

存在一个与其对应的非确定性Büchi自动机NBA，记为

定义2.

定义为五元组：

表示由自动机中的可接受状态组成的可接受集合；

定义3.带权的乘积式Büchi自动机PBA表示为

其中：

δ'＝Q'→2^Q'.<π_j,q_n>∈δ'(<π_i,q_m>)当且仅当(π_i,π_j)∈→_c并且q_n∈δ(q_m,L_c(π_i))；

Q₀'＝{<π,q>|π∈Π₀,q∈Q₀}，是初始状态集；

F'＝{<π,q>|π∈Π₀,q∈F}，是可接受集；

W_p:

是权重函数：

W_p(<π_i,q_m>,<π_j,q_n>)＝W_c(π_i,π_j)

其中<π_j,q_n>∈δ'(<π_i,q_m>)；

所述步骤二具体步骤包括：

根据定义4，设定可接受序列的结构为:

R＝<R_pre,R_suf>＝q'_cq'_c+1…q'_f[q'_fq'_f+1…q'_n]

其中q_f'＝<π_f,q_f>∈F'；

定义整体代价：

定义5.针对时序逻辑任务的概率规划识别问题定义为Pr＝{A_p,π_c,Q_c,Rs,Os,Gs,Ps}，其中：

Os表示智能体的历史移动轨迹；

表示目标概率集，

表示任务概率集，

表示当前执行任务是

的概率，

表示所有任务的集合；

①对于用线性时序逻辑语言描述的任务集

将其中每个任务

转换成对应Büchi自动机

和T_c进行乘积操作构成

并建立规划库

当i＝c时，π_c表示目标智能体当前位置信息，有:

③考虑历史移动轨迹Os的影响：

1)、令i＝1

2)、对于

q′_i∈Q′_i，如果

则保留q′_i；否则，将q′_i从集合Q′_i中删除；

3)、i＝i+1

④

的最短路径，

是

的可接受状态集，记为

⑤使用Dijkstra算法计算

中每一个可接受状态

回到自身的最短循环路径，记为

⑥对于

定义：

定义规划结果

序列中第一个属于待识别目标集Π_g的π_i为

下的智能体下一步目标，记为

根据整体代价R计算公式得到

的整体代价

整体代价集Cost_sum为：

表示，则在第i时刻，智能体X朝向与目标A之间的夹角为：

所述步骤四具体包括如下步骤：

①对

作处理，定义：

其中，exp{x}表示e^x，

是正则化惩罚系数，由智能体姿态决定，λ是常数，

②在规划结果集R_sum中，将所有规划目标为π_k且任务为

的规划结果对应的整体代价相加，得到：

将所有规划目标任务为

的规划结果对应的整体代价相加，得到：

将规划结果集所有规划对应的整体代价相加，有：

规划结果集中符合

的整体代价所占比重，即为后验概率

首先，假设任务集Φ中的任务

相互独立，计算在任务

的情况下，目标为π_k的后验概率

之后，根据观测轨迹Os计算待预测目标集Π_g中的目标概率

即后验概率P(π_k|Os)：

2.如权利要求1所述的一种任务时序逻辑约束的概率规划识别方法，其特征在于，还包括对预测目标准确率和辨识任务准确率的计算，具体为：

智能体的实际目标集为G_true(i)＝{g_t(0),...,～g_t(i)}，预测目标集为G_pred(i)＝{max(Gs(0)),...,max(Gs(i))}，其中，g_t(i)，max(Gs(i))分别表示第i时刻智能体的实际目标和预测目标概率最大的目标，g_t(i),max(Gs(i))∈Π_g；智能体的实际执行任务集为

预测执行任务集为Φ_pred(i)＝{max(Ps(0)),...,max(Ps(i))}，其中，

max(Ps(i))∈Φ；

第i时刻，目标预测准确率GA(i)为：

GA(i)＝plen(G_true(i)∩G_pred(i))/len(G_true(i))

其中，len(G)表示集合G的长度；

第i时刻，任务辨识准确率TA(i)为

TA(i)＝len(Φ_true(i)∩Φ_pred(i))/len(Φ_true(i))。