CN108132457A

CN108132457A - 一种确定位置的语音来波方向估计方法和装置

Info

Publication number: CN108132457A
Application number: CN201711401069.5A
Authority: CN
Inventors: 景晖
Original assignee: Individual
Current assignee: Individual
Priority date: 2017-12-22
Filing date: 2017-12-22
Publication date: 2018-06-08

Abstract

本发明公开了一种确定位置的语音来波方向估计方法，包括：麦克风阵列根据接收到的语音确定信号向量；将所述信号向量与各语音来波方向角度对应的来波矢量进行匹配，得到相对应的匹配系数，所述语音来波方向角度根据麦克风阵列和被限定空间内的确定位置的相对位置的几何角度进行确定；根据匹配系数的值估计语音来波方向，确定位置。可以有效降低计算复杂度和时延，更快的确定发声的目标位置。

Description

一种确定位置的语音来波方向估计方法和装置

技术领域

本发明属于声源定位技术领域，具体地涉及一种确定位置的语音来波方向估计方法和装置，尤其适用于交通工具内的语音系统。

背景技术

1986年美国科学家Schmidt R O等人发现了多重信号分类(MUSIC) 算法，它是现代超分辨率侧向技术领域的一次重大的飞跃，子空间分解类算法由此开始起步。子空间分解类算法的基本思路是把阵列所接收到的数据进行各种数学分解，这样数据就会变成两个相互正交的子空间。其中一个是和信号源阵列流型空间相对应的子空间，另外一个是和信号子空间相互正交的噪声子空间。子空间分解类算法在实际计算中分为两个大类：一是以旋转不变子空间(ESPRIT)算法为首的信号子空间类算法；一是以多重信号分类(MUSIC)算法为首的噪声子空间类算法。

无论是ESPRIT算法，还是MUSIC算计均需要计算接收信号的协方差矩阵，计算复杂度均较高，不适合车载语音系统低计算复杂度的要求。

另外，中国专利文献CN 104244143公开了一种用于接收所需声音的适应性波束形成方法，包括：确定正在进行说话的乘员在被限定空间内的乘员位置；以多个麦克风接收来自所述被限定空间内的声音；生成与在所述多个麦克风中的每个处的被接收声音相对应的多个音频信号；以及向音频信号应用波束形成器，来引导麦克风波束朝向所确定的乘员位置，并生成波束形成器输出信号。波束形成的定位方法和基于时延估计方法是传统的声源定位方法，存在定位方法使用不灵活、估计结果不稳定且精度较低、实用性不够好等问题。

发明内容

针对现有技术中存在的上述技术问题，本发明提出了一种确定位置的语音来波方向估计方法和装置，可以有效降低计算复杂度和时延，更快的确定目标位置。

本发明的技术方案是：

一种确定位置的语音来波方向估计方法，包括以下步骤：

S01：麦克风阵列根据接收到的语音确定信号向量；

S02：将所述信号向量与各语音来波方向角度对应的来波矢量进行匹配，得到相对应的匹配系数，所述语音来波方向角度根据麦克风阵列和被限定空间内的确定位置的相对位置的几何角度进行确定；

S03：根据匹配系数的值估计语音来波方向，确定位置。

优选的，所述来波矢量为预先存储的。

优选的，所述麦克风阵列至少为两组且分别执行步骤S01与S02。

优选的，根据不同麦克风阵列对同一位置的匹配系数的最大值的和的均值估计语音来波方向，确定位置。

优选的，所述步骤S02中得到的匹配系数为：

其中，α(θ_p,i)为来波矢量，p为麦克风阵列数，N为位置数，y_p(n)为信号向量。

本发明还公开了一种确定位置的语音来波方向估计装置，包括：

信号向量确定模块，通过麦克风阵列根据接收到的语音确定信号向量；

匹配模块，将得到的信号向量与各语音来波方向角度对应的来波矢量进行匹配，得到相对应的匹配系数，所述语音来波方向角度根据麦克风阵列和被限定空间内的确定位置的相对位置的几何角度进行确定；

位置确定模块，根据匹配系数的值估计语音来波方向，确定位置。

优选的，所述来波矢量为预先存储的。

优选的，所述麦克风阵列至少为两组，由匹配模块得到每组麦克风阵列的匹配系数。

优选的，还包括：

指令输出模块，根据确定的位置，发出与该位置相关一个操作指令。

与现有技术相比，本发明的优点是：

本发明的语音来波方向估计方法计算复杂度低，语音来波方向估计精度高，延时小。能很好的满足低计算的语音系统的要求，实用性强，具有很高的应用前景。

附图说明

下面结合附图及实施例对本发明作进一步描述：

图1为本发明确定位置的语音来波方向估计方法的流程图；

图2为本发明一实施例的场景应用示意图；

图3为本发明另一实施例的场景应用示意图；

图4为本发明一实施例的麦克风布置示意图；

图5为本发明又一实施例的麦克风布置示意图；

图6为本发明确定位置的语音来波方向估计装置的原理框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明了，下面结合具体实施方式并参照附图，对本发明进一步详细说明。应该理解，这些描述只是示例性的，而并非要限制本发明的范围。此外，在以下说明中，省略了对公知结构和技术的描述，以避免不必要地混淆本发明的概念。

实施例：

下面结合附图，对本发明的较佳实施例作进一步说明。

本发明以交通工具为例进行说明，当然也可以为其他的被限定空间内的有确定位置的场景，例如会议室等。

实施例1：

如图1、2所示，以五座轿车为例，车内配置一个麦克风阵列，麦克风阵列一般设置在车头位置处。根据麦克风阵列的位置，以及五个座位的位置，在物理几何上计算相应的角度θ₁,θ₂,…,θ₅。

根据记录的角度，计算相应的来波矢量。对于第i个角度θ_i，对应的来波矢量为：

其中，K为麦克风数，d表示相邻麦克风之间的间距，λ表示声波的波长。

在第n个时刻，第j个座位上的乘客发出语音信号，麦克风阵列接收到的信号向量可以表示为：

y(n)＝η_jα(θ_j)+w(n)

其中，η_j表示从第j个座位到麦克风阵列的路径损耗，w(n)为噪声向量。

将接收信号与可能的角度矢量进行匹配操作，得到的匹配系数如下：

那么j的估计可以表示：

得到了j的估计，也就确定了乘客的语音来波方向，换句话说就确定为发出语音的乘客的位置。

实施例2：

因为精度问题，当一个麦克风阵列无法精确识别位置时，可增加一个或者多个麦克风整列进行辅助识别位置，根据不同麦克风阵列的匹配系数最终确定位置。比如图3所示是一个经典的2+2+3的商务车布局并且除了麦克风阵列1还另外增加了麦克风阵列2，可能处于系统性能的限制，麦克风阵列 1识别出的向量和图中θ₁和θ₂的相关性可能无法精确对比，则可以辅助于麦克风阵列2中识别出向量以及进行判断，从而精确定位语音声源是来自右中位置还是右后位置。

具体执行步骤如下：

根据麦克风阵列和被限定空间内的确定位置的相对位置，几何上确定相对于第p(P>＝1)个麦克风阵列可能的语音来波方向角度θ_p,1,…,θ_p,N，N为位置数，此处p＝2，N＝7；

计算第i个角度θ_i，对应的来波矢量为：

其中，K为麦克风数，d表示相邻麦克风之间的间距，λ表示声波的波长；

计算第p个麦克风阵列接收到的信号向量，为：

y_p(n)＝η_p,jα(φ_p,j)+w_p(n)；

其中，η_p,j表示语音从第j个位置到第p个麦克风阵列的路径损耗，φ_p,j表示从第j个位置到第p个麦克风阵列可能的入射角(语音来波方向角度)， w_p(n)为噪声向量；

将接收信号与来波矢量进行匹配操作，得到匹配系数为：

第p个麦克风阵列估计的语音来波方向的计算公式为：

根据多个确定待定位目标的位置。具体准则如下：

其中表示四舍五入操作。

此外，麦克风阵列的布局将会是一个比较灵活的布局形式，将可能是同一个阵列的麦克风分散在交通工具的相对较远的地方，比如图4是一个典型的2+3轿车车内布局，一个麦克风阵列包括4个麦克风，其分布在车内四个非一个相对声源一个方向的位置上。也可以是多个阵列的子麦克风相互穿插分散分布，如图5所示。都可以适用于本发明的方法进行位置识别。

如图6所示，一种确定位置的语音来波方向估计装置，包括：

匹配模块，将得到的信号向量与各语音来波方向角度对应的来波矢量进行匹配，得到相对应的匹配系数，语音来波方向角度根据麦克风阵列和被限定空间内的确定位置的相对位置的几何角度进行确定；

位置确定模块，根据匹配系数的最大值估计语音来波方向，确定位置。

由于应用于特定的场景，针对不同的应用场景，可以将来波矢量为预先存储在装置内的存储模块内，操作时直接调用即可。

当一个麦克风阵列无法精确识别位置时，可增加一个或者多个麦克风整列进行辅助识别位置，由匹配模块得到每组麦克风阵列的匹配系数。然后根据不同麦克风阵列的匹配系数最终确定位置。具体的可根据不同麦克风阵列对同一位置的匹配系数的最大值的和的均值估计语音来波方向，确定位置。

该装置还可以连接外部系统的指令输出模块，该指令输出模块根据确定的位置，发出与该位置相关的操作指令，比如打开右侧的车窗等等。

应当理解的是，本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理，而不构成对本发明的限制。因此，在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。此外，本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。

Claims

1.一种确定位置的语音来波方向估计方法，其特征在于，包括以下步骤：

S01：麦克风阵列根据接收到的语音确定信号向量；

S03：根据匹配系数的值估计语音来波方向，确定位置。

2.根据权利要求1所述的确定位置的语音来波方向估计方法，其特征在于，所述来波矢量为预先存储的。

3.根据权利要求1所述的确定位置的语音来波方向估计方法，其特征在于，所述麦克风阵列至少为两组且各自独立执行步骤S01与S02。

4.根据权利要求3所述的确定位置的语音来波方向估计方法，其特征在于，根据不同麦克风阵列对同一位置的匹配系数的最大值的和的均值估计语音来波方向，确定位置。

5.根据权利要求1所述的确定位置的语音来波方向估计方法，其特征在于，所述步骤S02中得到的匹配系数为：

6.一种确定位置的语音来波方向估计装置，其特征在于，包括：

7.根据权利要求6所述的确定位置的语音来波方向估计装置，其特征在于，所述来波矢量为预先存储的。

8.根据权利要求1所述的确定位置的语音来波方向估计装置，其特征在于，所述麦克风阵列至少为两组，由匹配模块得到每组麦克风阵列的匹配系数。

9.根据权利要求8所述的确定位置的语音来波方向估计装置，其特征在于，根据不同麦克风阵列对同一位置的匹配系数的最大值的和的均值估计语音来波方向，确定位置。

10.根据权利要求6所述的确定位置的语音来波方向估计装置，其特征在于，还包括：

指令输出模块，根据确定的位置，发出与该位置相关的操作指令。