CN108320739A

CN108320739A - 根据位置信息辅助语音指令识别方法和装置

Info

Publication number: CN108320739A
Application number: CN201711401062.3A
Authority: CN
Inventors: 景晖
Original assignee: Individual
Current assignee: Individual
Priority date: 2017-12-22
Filing date: 2017-12-22
Publication date: 2018-07-24
Anticipated expiration: 2037-12-22
Also published as: CN108320739B

Abstract

本发明公开了一种根据位置信息辅助语音指令识别方法，包括：根据语音信息进行语义识别，得到语义信息；确定发出语音的人员的位置信息，根据得到的人员的位置信息判断存在于被限定空间中的子区域，不同子区域设置有不同的操作范围和权限，结合语义信息得到交互意图，生成操作指令。可以对缺乏精确指向的语音交互信息进行加工，辅助判断人员的语音交互意图，可以快速有效的进行语音交互。

Description

根据位置信息辅助语音指令识别方法和装置

技术领域

本发明属于语音识别处理技术领域，具体地涉及一种根据位置信息辅助语音指令识别方法和装置，使用模糊的语句与交通工具内的设备进行精确交互。

背景技术

随着汽车工业的发展以及电子市场的成熟，车载智能终端逐渐成为汽车重要的配套设备。近年来，经济的繁荣也促使国内的汽车数量急剧增加，人们的出行习惯也随之发生变化，人车共处的时间越来越长。因此，车载智能终端的功能也从简单的行车导航向多功能的方向改变。

在新近发展出的众多功能中，语音指令的识别和执行十分引人注目。比如汽车等现代交通工具通常利用语音识别处理来接受来自驾驶员或其它乘员的可听见输入和指令。例如，人可以使用可听见指令来选择娱乐选项或参与移动电话对话。

然而，现有的车载语音识别处理技术中，使用模糊的语句(缺乏精确指向的语音)，一般无法得到乘员的语音交互意图。

中国专利文献CN 104244143公开了一种确定正在进行说话的乘员在被限定空间内的乘员位置的方法，通过分析座椅传感器的座椅传感器数据确定乘员的位置，通过搜索与被反射的波相对应的信号的时空和/或速率特征中的区别特征，来辨识正在进行说话的乘员的嘴部的运动，确定乘员正在进行说话，从而确定正在说话的乘员的位置。该方法确定的正在说话的乘员的位置的计算复杂度较高，存在一定的时延问题，无法快速的确定目标位置。

发明内容

针对现有技术中存在的上述技术问题，本发明提出了一种根据位置信息辅助语音指令识别方法和装置，对缺乏精确指向的语音交互信息进行加工，辅助判断人员的语音交互意图，可以快速有效的进行语音交互。

本发明的技术方案是：

一种根据位置信息辅助语音指令识别方法，包括以下步骤：

S01：根据语音信息进行语义识别，得到语义信息；

S02：确定发出语音的人员的位置信息，根据得到的人员的位置信息判断存在于被限定空间中的子区域，不同子区域设置有不同的操作范围，结合语义信息得到交互意图，生成操作指令。

优选的，所述步骤S02中生成操作指令之前，还包括，鉴定人员的角色及其对应的设备操作范围和权限，鉴定成功后生成操作指令。

优选的，所述操作范围和权限为预先定义的，预先定义操作范围和权限的方法包括，

S11：分析被限定空间中人员可能存在的区域，将区域信息划分为区域坐标；

S12：根据不同的区域坐标定义角色，为不同的角色定义不同的设备操作范围和权限。

优选的，所述步骤S02中，若语音信息包含位置指向信息，则根据判断得到的子区域，得到语音信息中位置指向信息的准确位置。

优选的，人员的角色通过人员的位置信息或者与角色绑定的人员的生物特征识别。

优选的，所述人员的位置信息的确定，包括：

S21：麦克风阵列根据接收到的语音确定信号向量；

S22：将所述信号向量与各语音来波方向角度对应的来波矢量进行匹配，得到相对应的匹配系数，所述语音来波方向角度根据麦克风阵列和被限定空间内的确定位置的相对位置的几何角度进行确定；

S23：根据匹配系数的值估计语音来波方向，确定人员的位置。

本发明又公开了一种根据位置信息辅助语音指令识别装置，包括，

一语音分析模块，根据语音信息进行语义识别，得到语义信息；

一位置确定模块，确定发出语音的人员的位置信息，根据得到的人员的位置信息判断存在于被限定空间中的子区域，不同子区域设置有不同的操作范围；

一指令生成模块，根据得到的人员的位置信息，结合语义信息得到交互意图，生成操作指令。

优选的，所述指令生成模块在生成操作指令之前，鉴定人员的角色及其对应的设备操作范围和权限，鉴定成功后生成操作指令。

优选的，所述人员的位置信息的确定，包括：

S21：麦克风阵列根据接收到的语音确定信号向量；

与现有技术相比，本发明的优点是：

1、对缺乏精确指向的语音交互信息进行加工，辅助判断人员的语音交互意图，本发明的语音来波方向估计方法计算复杂度低，语音来波方向估计精度高，延时小等，可以快速有效的进行语音交互。能很好的满足车载语音系统的要求，实用性强，具有很高的应用前景。

2、根据人员的不同位置识别出人员的角色，并与人员的生物特征绑定，辅助进行角色识别，当人员即使在后续过程中移动到其他位置的时候，也会继续被赋予相关的权限。

附图说明

下面结合附图及实施例对本发明作进一步描述：

图1为本发明根据位置信息辅助语音指令识别方法的流程图；

图2为本发明一区域操作范围的示意图；

图3为本发明另一区域操作范围的示意图；

图4为本发明一实施例的场景应用示意图；

图5为本发明另一实施例的场景应用示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明了，下面结合具体实施方式并参照附图，对本发明进一步详细说明。应该理解，这些描述只是示例性的，而并非要限制本发明的范围。此外，在以下说明中，省略了对公知结构和技术的描述，以避免不必要地混淆本发明的概念。

实施例：

下面结合附图，对本发明的较佳实施例作进一步说明。

本发明以交通工具为例进行说明，当然也可以为其他的被限定空间内的有确定位置的场景，例如会议室等。

实施例1：

如图1所示，一种根据位置信息辅助语音指令识别方法，包括以下步骤：

人员的语音交互内容预处理结果3.1.1，主要是根据语音信息进行语义识别，得到语义信息；

例如，人员发出“关闭车窗”的语音指令信息，该语音信息不排除已经预先处理过，例如去噪、放大等等。根据该语音信息进行语义识别，得到语义信息。语义识别的方法可以利用现有的语义识别方法得到，这里不再赘述。

判断出人员的位置信息3.1.2，通过外部系统会给出人员的位置信息。

如图2所示，设置好交通工具内人员的可能存在的空间区域并进行标识 3.2.1。

通过分析将交通工具中(如果是开放式的搭乘方式，将也会包含交通工具之上的位置)人员可能存在的区，将这些区域都抽象成具体的区域坐标，比如可以把五座家用轿车用最简单的一个数字或者字母等符号作为坐标，例如驾驶座为A号位置，副驾驶B号位置，后排C，D，E号位置，同时可能这个车的车顶被改装后可以站一个人，我把车顶就定义为交通工具座舱外的一个位置，但是还是属于交通工具上的位置，定义为F号位置，当我们说F 号位置就是指的是车顶位置。

对各个区域的可通过语音控制的设备操作范围和权限进行定义3.2.2。

根据区域坐标预先定义该区域内的人员语音交互可操控的操作范围和权限，如图2的E号位置可操控的操作范围为设备1-4，不同区域的操作范围可以是重合的比如图3，坐标C的交互区域包括了装置2，4，5，6，和之前E的交互区域交叉了装置2和4。

操作权限包括可操作的设备的范围以及对某一设备可执行的具体操作如开启、关闭、运行到某一程度等。当然，会根据一些特殊的位置定义该位置的人员的操作权限，比如驾驶座位的人员将会被赋予更加高的操作权限。例如，当人员处于左前驾驶位时，当人员发出的语音指令为“关闭右侧车窗”，会关闭右侧所有的窗户，当处于副驾驶位或者后排座位时，只会关闭靠近座位的窗户。

识别出以人员所在位置为坐标的相对位置信息3.2.4。

当输入的人员位置信息和系统内预设的区域坐标进行比对后判断出人员所在交通工具中/上的位置，也就是得到人员所在的区域坐标，以该人员位置作为一个参考坐标，判断人员语言中位置指向信息的准确位置。确定以该人员为相对位置的右侧位置，结合语义信息“关闭”，“车窗”，得到交互意图，生成操作指令。

上面介绍了语音信息中包含了位置指向信息(例如，左侧、右侧等)，然而更多的场景是语音信息中不保护位置指向信息，例如“开窗”，如果语义中未曾包含位置指向信息，系统直接根据人员的所在的区域坐标对应的操作范围和权限找到准确的操作设备，结合语义信息“开”，“窗”，得到交互意图，生成操作指令。

在生成操作指令之前，还需要鉴定人员的角色及其对应的设备操作范围和权限3.2.3，鉴定成功后生成操作指令。

根据不同的区域坐标定义角色，为不同的角色定义不同的设备操作范围和权限3.4。如某些飞机上前排两个位置，左侧驾驶位置是机长，右侧驾驶位置是大副，从而辅助交通工具对该人员进行正确的权限赋权。

在初始时，或者特定的设置模式时，当人员在一定位置完成和交通工具或者相关软件完成交互之后，人员在交通工具或者软件中被确认的身份以及权限将会被系统记录下来，当人员即使在后续过程中移动到其他位置的时候，也会继续被赋予相关的权限。并且在人员身份和权限的记录过程中，其相关的生物特征将会同时被记录下来，比如指纹，声纹，虹膜，面部特征等，其身份和权限也会和其生物特征绑定起来，当人员在过一段时间后再进入同一个交通工具或者其他交通工具时可以同时被识别出来并被赋予之前系统赋予的权限和身份。比如初始机长位置的驾驶员有机长权限，飞机将会记下这个位置的人员的生物特征或其他特征，即使其离开位置到休息区域后其仍然会通过特征识别被赋予机长权限。

根据得到的人员的位置信息分析语音信息中位置指向信息的准确位置，结合语义信息得到交互意图，生成操作指令3.3。例如，当人员处于左前驾驶位时，当人员发出的语音指令为“关闭右侧车窗”，只需要说出右侧一类语义的交互语音再加上本身带有关窗语义的交互信息，本发明将会识别出所关窗户是处于该人员右侧从而判断出其操作意图是关闭右侧的窗户。

通过外部系统会给出人员的位置信息的方法有很多种，该实施例主要描述通过语音确定发出语音的人员的位置信息的方法，具体如下：

如图4所示，以五座轿车为例，车内配置一个麦克风阵列，麦克风阵列一般设置在车头位置处。根据麦克风阵列的位置，以及五个座位的位置，在物理几何上计算相应的角度θ₁,θ₂,…,θ₅。

根据记录的角度，计算相应的来波矢量。对于第i个角度θ_i，对应的来波矢量为：

其中，K为麦克风数，d表示相邻麦克风之间的间距，λ表示声波的波长。

在第n个时刻，第j个座位上的乘客发出语音信号，麦克风阵列接收到的信号向量可以表示为：

y(n)＝η_jα(θ_j)+w(n)

其中，η_j表示从第j个座位到麦克风阵列的路径损耗，w(n)为噪声向量。

将接收信号与可能的角度矢量进行匹配操作，得到的匹配系数如下：

那么j的估计可以表示：

得到了j的估计，也就确定了乘客的语音来波方向，换句话说就确定为发出语音的乘客的位置。

实施例2：

因为精度问题，当一个麦克风阵列无法精确识别位置时，可增加一个或者多个麦克风整列进行辅助识别位置，根据不同麦克风阵列的匹配系数最终确定位置。比如图5所示是一个经典的2+2+3的商务车布局并且除了麦克风阵列1还另外增加了麦克风阵列2，可能处于系统性能的限制，麦克风阵列 1识别出的向量和图中θ₁和θ₂的相关性可能无法精确对比，则可以辅助于麦克风阵列2中识别出向量以及进行判断，从而精确定位语音声源是来自右中位置还是右后位置。

具体执行步骤如下：

根据麦克风阵列和被限定空间内的确定位置的相对位置，几何上确定相对于第p(P>＝1)个麦克风阵列可能的语音来波方向角度θ_p,1,…,θ_p,N，N为位置数，此处p＝2，N＝7；

计算第i个角度θ_i，对应的来波矢量为：

其中，K为麦克风数，d表示相邻麦克风之间的间距，λ表示声波的波长；

计算第p个麦克风阵列接收到的信号向量，为：

y_p(n)＝η_p,jα(φ_p,j)+w_p(n)；

其中，η_p,j表示语音从第j个位置到第p个麦克风阵列的路径损耗，φ_p,j表示从第j个位置到第p个麦克风阵列可能的入射角(语音来波方向角度)， w_p(n)为噪声向量；

将接收信号与来波矢量进行匹配操作，得到匹配系数为：

第p个麦克风阵列估计的语音来波方向的计算公式为：

根据多个确定待定位目标的位置。具体准则如下：

其中表示四舍五入操作。

此外，麦克风阵列的布局将会是一个比较灵活的布局形式，将可能是同一个阵列的麦克风分散在交通工具的相对较远的地方，例如一个麦克风阵列包括4个麦克风，其分布在车内四个非一个相对声源一个方向的位置上。也可以是多个阵列的子麦克风相互穿插分散分布。都可以适用于本发明的方法进行位置识别。

应当理解的是，本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理，而不构成对本发明的限制。因此，在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。此外，本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

Claims

1.一种根据位置信息辅助语音指令识别方法，其特征在于，包括以下步骤：

S01：根据语音信息进行语义识别，得到语义信息；

2.根据权利要求1所述的根据位置信息辅助语音指令识别方法，其特征在于，所述步骤S02中生成操作指令之前，还包括，鉴定人员的角色及其对应的操作范围和权限，鉴定成功后生成操作指令。

3.根据权利要求2所述的根据位置信息辅助语音指令识别方法，其特征在于，所述操作范围和权限为预先定义的，预先定义操作范围和权限的方法包括：

S11：分析被限定空间中人员可能存在的子区域，将将子区域的区域信息划分为区域坐标；

S12：根据不同的区域坐标定义角色，为不同的角色定义不同的设备操作范围和权限；

将得到的人员的位置信息与所在子区域的区域坐标相对应，将角色与所述人员的位置信息相关联。

4.根据权利要求1所述的根据位置信息辅助语音指令识别方法，其特征在于，所述步骤S02中，若语音信息包含位置指向信息，则根据判断得到的子区域，得到语音信息中位置指向信息的准确位置。

5.根据权利要求2所述的根据位置信息辅助语音指令识别方法，其特征在于，人员的角色通过人员的位置信息或者与角色绑定的人员的生物特征识别。

6.根据权利要求1所述的根据位置信息辅助语音指令识别方法，其特征在于，所述人员的位置信息的确定，包括：

S21：麦克风阵列根据接收到的语音确定信号向量；

7.一种根据位置信息辅助语音指令识别装置，其特征在于，包括，

8.根据权利要求7所述的根据位置信息辅助语音指令识别装置，其特征在于，所述指令生成模块在生成操作指令之前，鉴定人员的角色及其对应的设备操作范围和权限，鉴定成功后生成操作指令。

9.根据权利要求8所述的根据位置信息辅助语音指令识别装置，其特征在于，所述操作范围和权限为预先定义的，预先定义操作范围和权限的方法包括，

10.根据权利要求8所述的根据位置信息辅助语音指令识别装置，其特征在于，人员的角色通过人员的位置信息或者与角色绑定的人员的生物特征识别。