CN112034853A

CN112034853A - 一种家庭监护机器人的工作方法

Info

Publication number: CN112034853A
Application number: CN202010920779.4A
Authority: CN
Inventors: 张雯晓; 温可
Original assignee: Nanjing Linghua Microelectronics Technology Co ltd
Current assignee: Nanjing Linghua Microelectronics Technology Co ltd
Priority date: 2020-09-04
Filing date: 2020-09-04
Publication date: 2020-12-04

Abstract

一种家庭监护机器人的工作方法。本发明涉及智能机器人技术领域，尤其涉及基于家庭监护机器人关键技术的研究与实现。提出了一种通过“优化的动态时间归整算法”实现的家庭服务机器人设计的语音识别后，控制机器人自主移动，从而为老人提供服务的家庭监护机器人及其工作方法。按以下步骤进行工作：S1、语音识别；S2、根据步骤S1.5中识别结果所表示的指令，控制机器人前往目标位置。本发明从整体上更精准、更高效的实现了语音的识别，并可以根据语音识别结果所表示的指令，控制机器人更稳定、更快速的前往目标位置。

Description

一种家庭监护机器人的工作方法

技术领域

本发明涉及智能机器人技术领域，尤其涉及基于家庭监护机器人关键技术的研究与实现。

背景技术

如今由于科技不断发展，许多家庭监护机器人已经具有语音交互和人脸识别、自主运动等功能，为家庭成员提供简单且重要的监护服务，行动不便者可以通过语音话语发出相关任务命令,机器人能根据命令内容做出相应动作，并根据基于轨迹规划技术,实现室内移动的功能，为智慧生活的带来了新的方式。

同时，服务机器人也可用于图书馆、银行、商场和政务服务大厅等特定场所，可以起到吸引用户并完成身份校验，通过“面对面”语音交互，实现服务咨询并辅助完成特定业务的作用，用户体验、办事效率大大提升。但在现阶段中服务机器人仍然存在部分问题：例如，服务机器人的语音交互功能不完善。部分机器人由于技术不成熟，不能有效识别用户的提问语音，因此无法给出确切的答案；而某些机器人即使完整地识别了语音，因为缺乏正确的匹配策略，给出的答案往往答非所问。这种问题使得服务机器人的交互性下降，用户得不到良好的体验。

目前，家庭服务机器人主要功能是要实现照顾老人、打扫卫生的功能，还是要实现家庭的安防功能，家庭服务机器人在室内的移动避障以及路径规划都是需要解决的关键技术。家庭服务机器人只有能够自主移动，才能提供这些服务。因此，研究家庭服务机器人的路径规划技术以及避障方法具有实际意义。

发明内容

本发明针对以上问题，提出了一种通过“优化的动态时间归整算法”实现的家庭服务机器人设计的语音识别后，控制机器人自主移动，从而为老人提供服务的家庭监护机器人及其工作方法。

本发明的技术方案为：按以下步骤进行工作：

S1、语音识别；

S1.1、将M帧数据的参考矢量模板R与N帧数据的待测矢量模板T，分别在垂直方向上展开构成一个二维坐标系，将参考模板R的各帧数据按照m＝1,2,…,M在纵坐标上展开，将待测模板T的各帧数据按照n＝1,2,…,N在横坐标上展开，通过各个帧号的横纵坐标画线构成网格，其中每一个交叉点(n,m)都对应测试模板中某一帧数据与待测模板中数据的交汇；

S1.2、设计好系统的约束条件，即路径搜索规则；

S1.3、在保证语音信号连贯性的基础上，对语音信号的特征匹配都是从第一帧(1,1)出发到点(M,N)点结束，若当前交汇点坐标是(i_n,i_m)，可达到的前一个格点只可能是(i_n-1,i_m)、(i_n-1,i_m-1)和(i_n-1,i_m-2)，如公式(2)所示，

在匹配期间通过约束路径的斜率求取两组特征矢量的匹配距离最小值；

S1.4、在满足约束条件的匹配路径上各个交汇点距离累加后得到匹配距离，在完成整个路径规划后，所获得的累加距离即为信号整体失真度，通过公式(3)计算；

D(i_n,i_m)＝d(T(i_n),R(i_m))+min{D(i_n-1,i_m),D(i_n-1,i_m-1),D(i_n-1,i_m-2)} (3)

其中，d(T(i_n),R(i_m))表示T中第i_n帧特征与R中i_m帧特征之间的距离；这样，从(1,1)点出发(令D(1,1)＝0)搜索，反复递推，直到(N,M)就可以得到最优路径，而且D(N,M)就是最佳匹配路径所对应的匹配距离；

S1.5、在进行语音识别时，将语音信号与所有参考模板进行匹配，得到的最小匹配距离D_min(N,M)所对应语音即为识别结果；

S2、根据步骤S1.5中识别结果所表示的指令，控制机器人前往目标位置；

S2.1、对室内环境建立环境栅格地图，机器人进行环境建模的过程中，行驶路径为S形，当障碍物距离d＜50cm时，根据机器人位姿向障碍物相反方向行驶，直至d＞50cm；

S2.2、根据建立的栅格地图进行全局路径规划，使用蚁群算法规划一条从出发点到目的地的最优路径；

S2.3、对于机器人移动路径中的障碍物或者在距离机器人d_min范围内的障碍物，使用“模拟力合成”方法对障碍物进行避障；

S2.4、根据算法仿真得出的从当前位置到目标点的规划路径。

步骤S1在实际设计中可以删除靠近两个坐标轴的区域，当匹配路径向两个坐标轴之间的某一侧靠近时，说明两组特征矢量的长度差异十分明显，也就意味着说话人的语速变化极其剧烈；而相对特定人而言，语速一般不会出现太大的波动，会有一个较为稳定的范围，因此靠近坐标轴的区域可以认定为无效匹配区域并予以删除。

步骤S1中算法设计的斜率约束为范围为[1/2,2]，匹配时起点包括一个固定起点(1,1)和两个松弛起点：(1,2)、(2,1)，终点处同样分为一个固定终点(N,M)两个松弛终点(N-1,M)、(M-1,N)。

步骤S1中在实际匹配过程中，长度为N的模板作为特征模板，长度为M的模板作为匹配模板，由于M＜N，在匹配时将曲线进行弯折，弯折后的特征向量分为三段即初始段(1,X_a)，中间段(X_a+1,X_b)以及信号末段(X_b+1,N)，其中

如果待测模板长度不在公式(4)的限制范围内，

则对该模板直接判定为不匹配，以减少运算量。

步骤S2中“模拟力合成”方法是通过模拟物体的受力来进行路径规划的算法，障碍物对机器人产生一个排斥力，目标点对机器人产生一个吸引力，排斥力与吸引力的合力决定了机器人的运动方向；

“模拟力合成”方法需要对机器人所在的位置构造引力场以及斥力场，设引力场为U_att，斥力场为U_rep；则引力势场相当于异性电荷的吸引即可用二次函数表示为：

其中，k是正比例位置增益系数，X代表机器人在工作环境地图中的当前位置，X_g代表目标点在环境地图上的位置；ρ(X,X_g)＝||X_g-X||是机器人与目标点的距离关系；机器人受到的引力方向为其本身当前所在位置与目标点的连线，并指向目标点；

引力场产生的引力为引力场的梯度函数，如下式(6)：

F_att(X)＝k(X_g-X) (6)

斥力势场模拟同性电荷相斥的原理可用二次函数表示为：

其中，η表示斥力势场常量；X表示机器人当前所处位置；X_o表示障碍物所处位置；ρ₀为斥力场的作用距离；ρ(X,X_o)表示机器人到障碍物的距离；

斥力F_att(X)可用式(8)表示，

合力场是斥力场与引力场的和场，

U(X)＝U_att(X)+U_rep(X) (9)

F(X)＝F_att(X)+F_rep(X) (10)

合力是斥力与引力的合力。

本发明在语音识别过程中，通过将复杂的全局优化问题转换为可以轻松解决的局部优化问题，在提高语音识别能力的同时也降低运算的难度进而提升系统的运行效率；通过优化动态时间归整算法设置约束条件提高了实时性要求。而在解决语音识别问题后，本发明中的家庭机器人根据传感器采集的环境信息规划出一条从出发点到目的地的无障碍路径，并选用“模拟力合成”方法进行局部路径规划。本发明从整体上更精准、更高效的实现了语音的识别，并可以根据语音识别结果所表示的指令，控制机器人更稳定、更快速的前往目标位置。

附图说明

图1是三种匹配模式失真度对比的示意图，

图2是局部约束路径的原理图，

图3是优化动态时间归整算法约束平行四边形的示意图，

图4是机器人在某一位置“模拟力合成”的受力示意图，

图5是机器人通过“模拟力合成”方法避障后的行径路线示意图。

具体实施方式

为能清楚说明本专利的技术特点，下面通过具体实施方式，并结合其附图，对本专利进行详细阐述。

基于动态时间归整算法实现的语音识别算法本质上属于模板匹配方法，需要解决的关键说话人对同一个词的两次发音的差异的，这些差异包括语音强度的大小、语速原因导致的频谱偏移以及发音音节的长短不同等，因此在实际的匹配过程中两次发音之间往往不存在线性对应关系。

假设语音模板特征的矢量序列为R＝{R(1),R(2),…,R(M)}，待匹配语音信号的矢量特征序列为T＝{T(1),T(2),…,T(N)}，其中M，N分别表示两者的语音帧数，R(m)，T(n)分别表示两者对应的语音帧矢量，两者之间的相似度通过欧氏距离d(T(i_n),R(i_m))来体现；二者之间欧氏距离越小则对应的相似度越高，反之相似度越低，当阈值低于一定值时可以判定两个语音为不相干语音。

其中直接匹配是假设待测模板与参考模板长度相等，即i_m＝i_n；线性时间规整技术是假设说话速度是按照发音长度等比例分布的，即

由于这通常不能够完整的描述实际语音发音情况，因此，采用非线性匹配技术。

如图1所示，上述三种匹配模式对同一词汇两次发音之间的匹配距离，阴影部分即为匹配失真，从图中明显可以看出，三种方法中非线性匹配方法的整体失真度最小。

把时间规整和距离测度计算结合起来的一种非线性规整技术，是通过寻找一个规整函数i_m＝Φ(i_n)，将测试矢量的时间轴n非线性地映射到参考模板的时间轴m上，并使该函数满足公式(1)：

其中D为满足最优时间规整下的两矢量距离。

通过将复杂的全局优化问题转换为可以轻松解决的局部优化问题，在提高语音识别能力的同时也降低运算的难度进而提升系统的运行效率。

根据其算法思想，将M帧数据的参考矢量模板R与N帧数据的待测矢量模板T，分别在垂直方向上展开构成一个二维坐标系，将参考模板R的各帧数据按照m＝1,2,…,M在纵坐标上展开，将待测模板T的各帧数据按照n＝1,2,…,N在横坐标上展开，通过各个帧号的横纵坐标画线构成网格，其中每一个交叉点(n,m)都对应测试模板中某一帧数据与待测模板中数据的交汇。

d(T(i_n),R(i_m))表示T中第i_n帧特征与R中i_m帧特征之间的距离，通过对规划路径所经过的交汇点语音失真度累加求和即可得到信号的整体失真度。

在进行算法匹配时，首先设计好系统的约束条件，即路径搜索规则，在保证语音信号连贯性的基础上，对语音信号的特征匹配都是从第一帧(1,1)出发到点(M,N)点结束，若当前交汇点坐标是(i_n,i_m)，可达到的前一个格点只可能是(i_n-1,i_m)、(i_n-1,i_m-1)和(i_n-1,i_m-2)，如公式(2)所示。在匹配期间通过约束路径的斜率求取两组特征矢量的匹配距离最小值。

其原理如图2所示，在满足约束条件的匹配路径上各个交汇点距离累加后得到匹配距离，在完成整个路径规划后，所获得的累加距离即为信号整体失真度，通过公式(3)计算。

这样从(1,1)点出发(令D(1,1)＝0)搜索，反复递推，直到(N,M)就可以得到最优路径，而且D(N,M)就是最佳匹配路径所对应的匹配距离。在进行语音识别时，将测试模板与所有参考模板进行匹配，得到的最小匹配距离D_min(N,M)所对应语音即为识别结果。该识别结构可以作为机器人的指令，例如命令机器人开灯、关灯、开始、移动，到客厅等语段，核心算法可以针对不同人群，达到85％以上较高的准确率。

基于以上分析提出一种优化的动态时间归整算法。虽然基本的动态时间归整算法可以实现目标，但实际运行时需要占用大量的存储空间，完成规整矩阵匹配，直接计算会增加大量的运算量，影响系统的处理效率，有悖于语音识别系统对于实时性的要求。为了避免冗余数据干扰系统运行，可以对匹配网格中的交汇点进行一定的取舍，在实际设计中可以删除靠近两个坐标轴的区域，当匹配路径向两个坐标轴之间的某一侧靠近时，说明两组特征矢量的长度差异十分明显，也就意味着说话人的语速变化极其剧烈。而相对特定人而言，语速一般不会出现太大的波动，会有一个较为稳定的范围，因此靠近坐标轴的区域可以认定为无效匹配区域并予以删除。基于上述原因，一般情况下针对语音信号的路径匹配约束范围一般设计为菱形，即“约束平行四边形”如图3所示。

此外，在路径中各点之间的斜率也必须进行约束，本发明中算法设计的斜率约束为范围为[1/2,2]，匹配时起点包括一个固定起点(1,1)和两个松弛起点：(1,2)、(2,1)，终点处同样分为一个固定终点(N,M)两个松弛终点(N-1,M)、(M-1,N)设置松弛起点和终点主要是为了克服端点检测不精确，导致起点终点不能对齐的问题。

在实际匹配过程中，长度为N的模板作为特征模板，长度为M的模板作为匹配模板，由于M＜N，在匹配时将曲线进行弯折，弯折后的特征向量分为三段即初始段(1,X_a)，中间段(X_a+1,X_b)以及信号末段(X_b+1,N)，其中

如果待测模板长度不在公式(4)的限制范围内，则对该模板直接判定为不匹配，以减少运算量。

优化动态时间归整算法的核心是模板匹配。因此在识别过程中会出现由于说话速率、语气等不同而导致的识别率出现差异的情况，因此在构建语音识别的指令库时，除了系统必须的指令库以外还需要增加一定的冗余词条，在检测到冗余词条时，放弃指令发送，直接跳出本次语音识别周期。

优化动态时间归整算法设置约束条件提高了实时性要求。

安静环境的测试结果如下表1所示，测试：开灯、关灯、开始、结束、暂停等参数语段，其中5人对相同指令测试三次1-3代表第一人，依次类推4-6、7-9、10-12、13-15分别代表第2、3、4、5位测试人员，表中Error代表识别失败，由表中可知优化的动态时间回归算法在识别过程中会出现由于说话速率、语气等不同而导致的识别率出现差异的情况，但总体还能达到较高的识别率。

表1

	开灯	关灯	开始	结束	暂停
						1
2			Error
						3
4		Error
						5			Error	Error
6	Error			Error
						7
8
						9		Error
10
						11	Error
12
						13				Error
14
						15		Error
整体识别率	86.7％	80％	86.7％	93.3％	86.7％

在解决语音识别问题后，还需要机器人实现室内自由移动。而路径规划是机器人实现室内自由移动的关键问题。路径规划是家庭机器人根据传感器采集的环境信息规划出一条从出发点到目的地的无障碍路径。

根据对环境信息的探测程度，可以将路径规划划分为全局路径规划与局部路径规划。进行全局路径规划需要已知整个环境信息，根据已知的环境信息建立全局环境地图；局部路径规划是在对环境信息局部未知或者完全未知的情况下，机器人在移动的过程中通过传感器对环境进行探测，然后根据探测的局部环境信息进行局部路径规划寻优。

局部路径规划不需要全部掌握运行环境信息，只需要探测机器人前进方向附近的环境信息。局部路径规划根据局部环境信息进行局部的路径寻优。局部路径规划选用“模拟力合成”方法。

“模拟力合成”是通过模拟物体的受力来进行路径规划的算法，障碍物对机器人产生一个排斥力，目标点对机器人产生一个吸引力，排斥力与吸引力的合力决定了机器人的运动方向。如图4是机器人在某一位置的受力示意图。

“模拟力合成”需要对机器人所在的位置构造引力场以及斥力场，设引力场为U_att，斥力场为U_rep。则引力势场相当于异性电荷的吸引即可用二次函数表示为：

其中，k是正比例位置增益系数，X代表机器人在工作环境地图中的当前位置，X_g代表目标点在环境地图上的位置。ρ(X,X_g)＝||X_g-X||是机器人与目标点的距离关系。机器人受到的引力方向为其本身当前所在位置与目标点的连线，并指向目标点。

引力场产生的引力为引力场的梯度函数，如下式(6)：

F_att(X)＝k(X_g-X) (6)

斥力势场模拟同性电荷相斥的原理可用二次函数表示为：

其中，η表示斥力势场常量；X表示机器人当前所处位置；X_o表示障碍物所处位置；ρ₀为斥力场的作用距离；ρ(X,X_o)表示机器人到障碍物的距离。

斥力F_att(X)可用式(8)表示。

合力场是斥力场与引力场的和场，合力是斥力与引力的合力。

U(X)＝U_att(X)+U_rep(X) (9)

F(X)＝F_att(X)+F_rep(X) (10)

同时，由于在家庭环境中，室内障碍物经常会发生变动，为了解决这个问题，本发明将构建环境特征点地图，建立室内环境的全局栅格地图，使用蚁群算法进行路径规划，对于室内环境变动的障碍物，使用“模拟力合成”进行避障。具体的算法步骤如下：

S2.1：对室内环境建立环境栅格地图。机器人进行环境建模的过程中，行驶路径为S形，当障碍物距离d＜50cm时，根据机器人位姿向障碍物相反方向行驶，直至d＞50cm。

S2.2：根据建立的栅格地图进行全局路径规划，使用改进的蚁群算法规划一条从出发点到目的地的最优路径。

全局路径规划是根据建立的栅格地图进行全局路径规划，栅格地图法将环境空间划分成大小相等的正方形，这些栅格在一起构成了连通图，并且每一个栅格都有属于自己的序号，这样就可以从起始栅格搜索出一条到达目标栅格的路径，该路径使用栅格序号便可以表示。栅格地图需要设定每一个栅格的形状，一般使用为矩形。整个环境可以被分成很多大小相等的矩形，矩形与矩形之间是相互连接的。黑色的栅格为障碍栅格，白色的为机器人的可移动栅格。而蚁群算法适用于复杂问题的求解与优化，我们这里用标准的蚁群算法，所以没有过多赘述。

S2.3：对于机器人移动路径中的障碍物或者在距离机器人d_min范围内的障碍物，使用“模拟力合成”对障碍物进行避障。

简单来讲是通过障碍物做一条力线，再通过目标点做一条力线，二者合称则为机器人的路径，如图5所示，根据算法仿真得出的从当前位置到目标点的规划路径，可以较好的达到预期目标。

本发明具体实施途径很多，以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以作出若干改进，这些改进也应视为本发明的保护范围。

Claims

1.一种家庭监护机器人的工作方法，其特征在于，按以下步骤进行工作：

S1、语音识别；

S1.2、设计好系统的约束条件，即路径搜索规则；

S2.4、根据算法仿真得出的从当前位置到目标点的规划路径。

2.根据权利要求1所述的一种家庭监护机器人的工作方法，其特征在于，步骤S1在实际设计中可以删除靠近两个坐标轴的区域，当匹配路径向两个坐标轴之间的某一侧靠近时，说明两组特征矢量的长度差异十分明显，也就意味着说话人的语速变化极其剧烈；而相对特定人而言，语速一般不会出现太大的波动，会有一个较为稳定的范围，因此靠近坐标轴的区域可以认定为无效匹配区域并予以删除。

3.根据权利要求1所述的一种家庭监护机器人的工作方法，其特征在于，步骤S1中算法设计的斜率约束为范围为[1/2,2]，匹配时起点包括一个固定起点(1,1)和两个松弛起点：(1,2)、(2,1)，终点处同样分为一个固定终点(N,M)两个松弛终点(N-1,M)、(M-1,N)。

4.根据权利要求1所述的一种家庭监护机器人的工作方法，其特征在于，步骤S1中在实际匹配过程中，长度为N的模板作为特征模板，长度为M的模板作为匹配模板，由于M＜N，在匹配时将曲线进行弯折，弯折后的特征向量分为三段即初始段(1,X_a)，中间段(X_a+1,X_b)以及信号末段(X_b+1,N)，其中

如果待测模板长度不在公式(4)的限制范围内，

则对该模板直接判定为不匹配，以减少运算量。

5.根据权利要求1所述的一种家庭监护机器人的工作方法，其特征在于，步骤S2中“模拟力合成”方法是通过模拟物体的受力来进行路径规划的算法，障碍物对机器人产生一个排斥力，目标点对机器人产生一个吸引力，排斥力与吸引力的合力决定了机器人的运动方向；

引力场产生的引力为引力场的梯度函数，如下式(6)：

F_att(X)＝k(X_g-X) (6)

斥力势场模拟同性电荷相斥的原理可用二次函数表示为：

斥力F_att(X)可用式(8)表示，

合力场是斥力场与引力场的和场，

U(X)＝U_att(X)+U_rep(X) (9)

F(X)＝F_att(X)+F_rep(X) (10)

合力是斥力与引力的合力。