CN110737268B

CN110737268B - 一种基于Viterbi算法的确定指令的方法

Info

Publication number: CN110737268B
Application number: CN201910971882.9A
Authority: CN
Inventors: 苏丽; 迟泰宇; 张智; 朱齐丹; 秦绪杰
Original assignee: Harbin Engineering University
Current assignee: Harbin Engineering University
Priority date: 2019-10-14
Filing date: 2019-10-14
Publication date: 2022-07-15
Anticipated expiration: 2039-10-14
Also published as: CN110737268A

Abstract

本发明公开了一种基于Viterbi算法的确定指令的方法，包括步骤一：将指令库与模型中的标号进行映射并利用指令库集合训练出模型；步骤二：根据序列的实际情况将模型的初始值转换为Viterbi算法需要的首步值；步骤三：根据首步的初始值进行递推并更新路径信息；步骤四：递推终止并回溯最优路径；步骤五：根据解码得到的状态序列推断下一刻的状态。本发明利用Viterbi算法进行指令推理，任务的切入与切出没有明显的边界，该算法可靠性高、适应性强，且能够完成多任务切换的系统，更符合服务机器人的指令控制特性。

Description

一种基于Viterbi算法的确定指令的方法

技术领域

本发明涉及一种确定指令的方法，特别是一种基于Viterbi算法的确定指令的方法，属于指令推理领域。

背景技术

随着智能家居市场的快速发展，对服务机器人的需求也与日俱增，服务机器人需要稳定可靠的执行任务且要对环境有相当的适应性，这对机器人的指令解析部分提出了很高的要求。实际的生活环境极其复杂，目前的服务机器人难以适应这种复杂的状况，在执行任务指令时，因为环境的复杂性和当前人工智能的有限性，经常遇到任务执行失败的情况。因此研究指令推理方法使服务机器人满足当下的使用情况具有很深的现实意义。

一种通用的做法是为需要完成的单个任务，制定对应的指令库。针对每一个独立的任务，建立一个与之相对应的指令库，此指令库收录该任务可能要用到的指令。最终形成一个包含所有需要执行任务的指令库集合，在指令库与指令库之间设置明显的切入与切出边界。目前这种方法已广泛应用在智能音箱等领域上，并且在一些领域上取得不错的效果。但是此种方法存在着对复杂的环境适应性差且需要大量的人工维护，服务机器人的指令解析需要面对大量复杂的实际情况，且设置明显的切入与切出边界会给任务的切换带来大量使用不便。

发明内容

针对上述现有技术，本发明要解决的技术问题是提供一种能够进行快速搜寻指令路径进而预测指令库的基于Viterbi算法的确定指令的方法。

为解决上述技术问题，本发明的一种基于Viterbi算法的确定指令的方法，包括以下步骤：

步骤一：将指令库与模型中的标号进行映射并利用指令库集合训练出模型；

步骤二：根据序列的实际情况将模型的初始值转换为Viterbi算法需要的首步值；

步骤三：根据首步的初始值进行递推并更新路径信息；

步骤四：递推终止并回溯最优路径；

步骤五：根据解码得到的状态序列推断下一刻的状态。

本发明还包括：

1.步骤一：将指令库与模型中的标号进行映射并利用指令库集合训练出模型，包括：

根据任务要求构建一个指令集合，此指令集合包含三个指令库，每个指令库包含该任务所有可能用到的指令；对隐马尔可夫模型进行初始化，即赋初值给π＝(π_i)，其中π为初始概率矩阵，i为第i状态；

利用Baum-Welch算法对人工构建的指令集合进行训练，得到隐马尔可夫的模型λ＝(A,B,π)，其中A＝[a_ij]_N*N为状态转移概率矩阵，N是可能的状态数，a_ij为第i个状态转移到第j个状态的概率，B＝[b_j(k)]_N*M为观测概率矩阵，M为是可能的观测数，加上一个具体的状态集合Q＝{q₁,q₂,q₃,...,q_N}和观测序列V＝{v₁,v₂,v₃,...,v_M}，则构成了隐马尔可夫模型的五元组，即λ＝(A,B,π,Q,V)，其中Q对应指令库集合，q_i(1<i<N)对应具体的指令库，N为指令库长度；V对应观测到的具体的指令集合，v_j(1<j<M)对应具体的指令，M为具体的指令长度；

I＝(i₁,i₂,...,i_T)指令库顺序，是长度为T的状态序列；O＝(o₁,o₂,...,o_T)是对应的观测序列即具体的指令顺序，π_i＝P(i₁＝q_i),i＝1,2,...,N是时刻t＝1处于状态q_i的概率，a_ij＝P(i_t+1＝q_j|i_t＝q_i),i＝1,2...N；j＝1,2,...,N是在时刻t处于状态q_i的条件下在时刻t+1转移到状态q_j的概率，b_j(k)＝P(o_t＝v_k|i_t＝q_j),k＝1,2...,M；j＝1,2,...,N是在时刻t处于状态q_j的条件下生成观测到的具体的指令集合V中的第k个指令v_k的概率。

2.步骤二：根据序列的实际情况将模型的初始值转换为Viterbi算法需要的首步值：具体包括：

将步骤一得到的隐马尔可夫模型利用Viterbi进行解码：首先构建二维数组V用于存储每步的选择概率，利用初始概率π＝(π_i)对第一时刻状态为i的路径进行初始化，具体公式如下：

δ₁(i)＝π_ib_i(o₁),i＝1,2,...,N

3.步骤三：根据首步的初始值进行递推并更新路径信息，具体包括：

以步骤二得到的序列初始值作为递推起点，利用公式

进行递推，具体为：首先计算第一步所有可能值，设置一个中间变量Prob并赋予初值零，保留每一步的计算结果，并在此过程中选择前一状态的最优概率，并将此概率保存到数组V中；

新建二维数组path其中行数为状态的个数，列数为序列的长度，该数组保存历史的最优隐序列，在每步求解时均新建二维数组newpath，newpath的列数和维数与path相同，该数组保存当前步骤解的隐状态即指令库的序号，其初值来自于数组path，根据上一步计算的概率值确定当前的较优解，并以此修改path中的隐状态。

4.步骤四：递推终止并回溯最优路径，具体包括：

利用公式

求得T时刻最优概率：正向计算每一步的概率取出其优选值保存并保存其路径，所有步骤计算完毕后进行最优路径回溯，对t＝T-1,T-2,...,1求得其最优路径I＝(i₁,i₂,...,i_T)。

5.步骤五：根据解码得到的状态序列推断下一刻的状态，具体包括：在执行预测时使用公式P_N＝V[T-1][i-1]*tran[i-1][i_max]*tran[i_max][k_N]来挑选出下一刻出现概率最大的隐状态，将这些隐状态即指令库添加到待识别列表里。

本发明的有益效果：本发明针对传统的指令系统在服务机器人中存在的问题与不足。将隐马尔可夫模型用于指令系统，本专利介绍其中利用Viterbi算法进行指令推理。应用Viterbi算法设计出可靠性高、适应性强，且能够完成多任务切换的系统。具体方法是将输入的指令映射到模型内的观察序列标号，将指令库映射为模型内的隐状态序列。运用Viterbi算法确定一条概率最大的路径，并以此预测下一步的指令库，通过此种方法缩小指令的范围进而提高识别指令的准确率。

根据服务机器人指令推理的实际需求，利用Viterbi算法进行指令库预测进而提高指令识别的准确率。区别于传统的有明确切入切出边界的指令库切换方法，这种方法不需要人为的切换指令库，任务的切入与切出没有明显的边界，而是利用算法来推断可能的指令库，此种方法更符合人类向服务机器人下达指令的特点。另外使用Viterbi解码可以极大的减少空间搜索的复杂度，进而提高搜索效率。

附图说明

图1是Viterbi算法指令推理效果图。

图2是Viterbi算法指令推理流程图。

具体实施方式

下面结合附图对本发明做进一步说明。

如图2所示，本发明的步骤如下：

步骤1、将指令库与模型中的标号进行映射并利用指令库集合训练出模型。根据指令库的实际情况将问题转化为程序的内部表示标号，使用Baum-Welch算法训练出隐马尔可夫的模型即λ＝(A,B,π)。

步骤2、根据序列的实际情况将模型的初始值转换为Viterbi算法需要的首步值。构建一个二维数组V，其存储每步的多个优选概率，并新建二维数组path存储首步的路径信息。

步骤3、根据首步的初始值进行递推并更新路径信息。通过比较前一时刻到到当前时刻的概率值，进而得出到达当前序列的最大可能路径。进而更新path。

步骤4、递推终止并回溯最优路径。正向计算完所有的步骤后且将各步的优选值保存。回溯最优路径并返回最优序列。

步骤5、根据解码得到的状态序列推断下一刻的状态。根据已有的状态序列计算下一状态的概率并取出概率最大的4个指令库加入到待识别列表。

步骤1具体为：使用人工构建的指令库集合训练出隐马尔可夫模型

在本发明中，首先根据任务要求人工的构建一个指令集合，此指令集合包含三个指令库，每个指令库包含该任务所有用到的指令。根据经验值对隐马尔可夫模型进行初始化，即赋初值给π＝(π_i)，其中π为初始概率矩阵i为第i状态。将之前人工构建的指令集利用Baum-Welch算法等训练得到隐马尔可夫的模型即λ＝(A,B,π)，其中A＝[a_ij]_N*N为状态转移概率矩阵，N是可能的状态数，a_ij为第i个状态转移到第j个状态的概率；B＝[b_j(k)]_N*M为观测概率矩阵，其中N为可能的状态数M为是可能的观测数，加上具体的状态序列Q＝{q₁,q₂,q₃,...,q_N}和观测序列V＝{v₁,v₂,v₃,...,v_M}，其中Q对应指令库集合，q_i(1<i<N)对应具体的指令库,N为指令库长度；V对应观测到的具体的指令集合,v_j(1<j<M)对应具体的指令M为具体的指令长度，至此构成了隐马尔可夫模型的五元组，即λ＝(A,B,π,Q,V)，隐马尔可夫模型构建完毕。

针对本文所解决的问题，I＝(i₁,i₂,...,i_T)是长度为T(T为大于0的正整数)的状态序列即指令库顺序，O＝(o₁,o₂,...,o_T)是对应的观测序列即具体的指令顺序。

π_i＝P(i₁＝q_i),i＝1,2,...,N是时刻t＝1处于状态q_i(q_i为指令库集合Q的第i个指令库，i₁为I中的第1个指令库，以下类似)的概率，a_ij＝P(i_t+1＝q_j|i_t＝q_i)，i＝1,2...N；j＝1,2,...,N是在时刻t处于状态q_i的条件下在时刻t+1转移到状态q_j的概率，b_j(k)＝P(o_t＝v_k|i_t＝q_j),k＝1,2...,M；j＝1,2,...,N是在时刻t处于状态q_j的条件下生成观测v_k(观测到的具体的指令集合V中的第k个)的概率。

步骤2具体为：根据模型λ＝(A,B,π)和o₁进行初始化：

将上个步骤得到的隐马尔可夫模型利用Viterbi进行解码。利用初始概率π＝(π_i)对第一时刻状态为i的路径进行初始化，具体公式如下：

δ₁(i)＝π_ib_i(o₁),i＝1,2,...,N

步骤3具体为：根据序列的初始值进行递推：

以上一步得到的序列初始值为递推起点利用公式：

进行递推。首先计算第一步所有可能值，设置一个中间变量Prob并赋予初值零，保留每一步的多个计算结果，并在此过程中选择前一状态的最优概率，并将此概率保存到数组中。各步依此类推。

历史路径的保存与修改：

Viterbi算法是多步骤每步多选择模型的最优解算法，因此在求解全局最优解时需要保存历史最优的多个路径。在算法求解之初，新建二维数组path其中行数为状态的个数，列数为序列的长度，该数组保存历史的数个最优隐序列。在每步求解时均需要新建二维数组newpath(列数和维数与path同)该数组保存当前步骤解的隐状态即指令库的序号，其初值来自于数组path，根据上一步计算的概率值确定当前的较优解，并以此修改path中的隐状态。

步骤4具体为：递推终止条件和最优路径回溯：

利用公式

求得T时刻最优概率。在具体执行时，正向计算每一步的概率取出其优选值保存并保存其路径，所有步骤计算完毕后进行最优路径回溯。对t＝T-1,T-2,...,1求得其最优路径I＝(i₁,i₂,...,i_T)

步骤5具体为：根据Viterbi解码求得的状态序列推断下一时刻可能的状态

在执行预测时使用公式P_N＝V[T-1][i-1]*tran[i-1][i_max]*tran[i_max][k_N]来挑选出下一刻出现概率最大的隐状态，为了增加系统的可靠性，在此选择4个出现概率最大的隐状态。将这些隐状态即指令库添加到待识别列表里进而提高指令识别的准确率。

用Viterbi算法进行指令推理，包含以下几个步骤：

1.首先将指令库与模型中的标号进行映射，根据经验值对隐马尔可夫模型进行初始化，再使用人工构建的指令库集合训练出隐马尔可夫模型，即λ＝(A,B,π)。

2.根据模型λ＝(A,B,π)和o₁进行初始化。构建二维数组V以存储每步的多个优选概率，利用初始概率π＝(π_i)进行初始化，将隐马尔可夫模型的初始值处理成序列的首值，此时数组保存第一步的概率值。

3.根据序列的初始值进行递推并保存相应的序列。新建数组path用于保存历史路径，利用递推公式来不断地更新二维数组V，并保存更新后的路径于path。

4.递推终止条件和最优路径回溯。待正向计算完所有的步骤后且将各步的优选值保存后。回溯最优路径并返回最优序列。

5.根据Viterbi解码求得的状态序列推断下一时刻可能的状态。在上一步的结果下进行下一时状态的预测，并将这些隐状态即指令库添加到待识别列表里进而提高指令识别的准确率，以满足实际的需求。

Claims

1.一种基于Viterbi算法的确定指令的方法，其特征在于，包括以下步骤：

步骤一：将指令库与模型中的标号进行映射并利用指令库集合训练出模型，包括：根据任务要求构建一个指令集合，此指令集合包含三个指令库，每个指令库包含该任务所有可能用到的指令；对隐马尔可夫模型进行初始化，即赋初值给π＝(π_i)，其中π为初始概率矩阵，i为第i状态；

利用Baum-Welch算法对人工构建的指令集合进行训练，得到隐马尔可夫的模型λ＝(A,B,π)，其中A＝[a_ij]_N*N为状态转移概率矩阵，N是可能的状态数，a_ij为第i个状态转移到第j个状态的概率，B＝[b_j(k)]_N*M为观测概率矩阵，M为是可能的观测数，加上一个具体的状态集合Q＝{q₁,q₂,q₃,...,q_N}和观测序列V＝{v₁,v₂,v₃,...,v_M}，则构成了隐马尔可夫模型的五元组，即λ＝(A,B,π,Q,V)，其中Q对应指令库集合，q_i对应具体的指令库，其中1<i<N，N为指令库长度；V对应观测到的具体的指令集合，v_j对应具体的指令，其中1<j<M，M为具体的指令长度；

I＝(i₁,i₂,...,i_T)指令库顺序，是长度为T的状态序列；O＝(o₁,o₂,...,o_T)是对应的观测序列即具体的指令顺序，π_i＝P(i₁＝q_i),i＝1,2,...,N是时刻t＝1处于状态q_i的概率，a_ij＝P(i_t+1＝q_j|i_t＝q_i),i＝1,2...N；j＝1,2,...,N是在时刻t处于状态q_i的条件下在时刻t+1转移到状态q_j的概率，b_j(k)＝P(o_t＝v_k|i_t＝q_j),k＝1,2...,M；j＝1,2,...,N是在时刻t处于状态q_j的条件下生成观测到的具体的指令集合V中的第k个指令v_k的概率；

步骤三：根据首步的初始值进行递推并更新路径信息，包括：

以步骤二得到的序列初始值作为递推起点，利用公式

新建二维数组path其中行数为状态的个数，列数为序列的长度，该数组保存历史的最优隐序列，在每步求解时均新建二维数组newpath，newpath的列数和维数与path相同，该数组保存当前步骤解的隐状态即指令库的序号，其初值来自于数组path，根据上一步计算的概率值确定当前的较优解，并以此修改path中的隐状态；

步骤四：递推终止并回溯最优路径；

步骤五：根据解码得到的状态序列推断下一刻的状态。

2.根据权利要求1所述的一种基于Viterbi算法的确定指令的方法，其特征在于：步骤二具体包括：

δ₁(i)＝π_ib_i(o₁),i＝1,2,...,N。

3.根据权利要求1所述的一种基于Viterbi算法的确定指令的方法，其特征在于：步骤四具体包括：

利用公式

4.根据权利要求1所述的一种基于Viterbi算法的确定指令的方法，其特征在于：步骤五具体包括：在执行预测时使用公式P_N＝V[T-1][i-1]*tran[i-1][i_max]*tran[i_max][k_N]来挑选出下一刻出现概率最大的隐状态，将这些隐状态即指令库添加到待识别列表里。