CN106782596A

CN106782596A - 一种基于麦克风阵列的声源定位跟随系统及方法

Info

Publication number: CN106782596A
Application number: CN201611028138.8A
Authority: CN
Inventors: 朱静波
Original assignee: Shenzhen Walker Robot Technology Co Ltd
Current assignee: Shenzhen Walker Robot Technology Co Ltd
Priority date: 2016-11-18
Filing date: 2016-11-18
Publication date: 2017-05-31

Abstract

本发明公开了一种基于麦克风阵列的声源定位跟随系统，包括信号接收模块、AD采样电路、信号预处理模块、算法处理模块和输出模块；信号接收模块为麦克风阵列，用于获取声源到各个麦克风的语音信号；AD采样电路，用于获取各麦克风的语音采样信号；信号预处理模块，用于预处理语音采样信号；算法处理模块，用于根据语音采样信号计算声源位置；输出模块，用于输出声源位置信息。本发明提供的声源定位系统通过蓝牙建立无线通信，获取声源信号并根据声源信号确定声源位置，可实现行走装置的实时定位跟随。本发明在行走装置近距离跟随情况下，可以准确确定声源位置，实时性强，并且算法简单，易于实现。

Description

一种基于麦克风阵列的声源定位跟随系统及方法

技术领域

本发明涉及语音信号处理领域，特别是一种基于麦克风阵列的声源定位跟随系统及方法。

背景技术

早在20世纪七八十年代，就开始将麦克风阵列应用于语音信号处理的研究中，进入90年代以来，基于麦克风阵列的语音信号处理算法逐渐成为一个新的研究热点。1995年flanagan在混响环境下用阵列信号处理对声音进行捕获。1996年silverman和brandstein开始将其应用于声源定位中，用于确定和实时跟踪说话人的位置。

目前，麦克风阵列系统已经应用于许多场合，包括视频会议、语音识别、说话人识别、汽车环境语音获取、混响环境声音拾取、声源定位和助听装置等。虽然基于麦克风阵列的语音处理技术正成为一个新的研究热点，但相关应用技术还不成熟。

因此，需要一种基于麦克风阵列的声源定位跟随系统及方法

发明内容

本发明的目的之一是提出一种基于麦克风阵列的声源定位跟随系统；本发明的目的之二是提出一种基于麦克风阵列的声源定位跟随方法。

本发明的目的之一是通过以下技术方案来实现的：

本发明提供的一种基于麦克风阵列的声源定位跟随系统，包括信号接收模块、AD采样电路、信号预处理模块、算法处理模块和输出模块；

所述信号接收模块为麦克风阵列，用于获取声源到各个麦克风的语音信号；

所述AD采样电路，用于获取各麦克风的语音采样信号；

所述信号预处理模块，用于预处理语音采样信号；

所述算法处理模块，用于根据语音采样信号计算声源位置；

所述输出模块，用于输出声源位置信息。

进一步，所述麦克风阵列包括相互垂直设置的均匀线性子阵列A、均匀线性子阵列B和参考点麦克风；所述参考点麦克风设置于相互垂直设置的均匀线性子阵列A、均匀线性子阵列B的中间点。

进一步，所述信号预处理模块对语音采样信号进行预处理是对采样信号进行加窗操作得到加窗处理信号。

进一步，所述算法处理模块按照以下步骤来计算声源位置：

根据加窗处理信号来判断声源位于采样位置的前后方向；

根据加窗处理信号来判断声源位于采样位置的左右方向；

根据声源位于采样位置的前后方向和左右方向来确定声源的位置。

进一步，所述算法处理模块中声源的位置是通过声源定位方法来确定的，具体步骤如下：

S631：按照以下公式对语音采样信号进行快速傅里叶变换得到声源信号的幅度谱：

S(k)＝FFT[s_w(n)]；

其中，S(k)为加窗信号s_w(n)的傅里叶变换；

S632：根据得声源信号的幅度谱按照以下公式计算声源信号到各麦克风间的波程差：

其中，d₁为一个周期内声源信号到麦克风M1与M2间的波程差；d₂为一个周期内声源信号到麦克风M1与M3间的波程差；λ为声源信号一个周期的波长，f为声源信号频率；β₁＝θ₂-θ₁为麦克风1与2间相位差；β₂＝θ₃-θ₁为麦克风1与3间相位差；θ₁表示麦克风M1接收的声源信号的相位；θ₂表示麦克风M2接收的声源信号的相位；θ₃表示麦克风M3接收的声源信号的相位；

S633：根据波程差按照以下公式计算声源位置坐标：

其中，(x，y)为声源坐标，a为相邻麦克风间距；

为声源距行走装置所载麦克风M1距离；

S634：根据声源位置坐标按照以下公式计算声源方位角：

声源方位角

其中，α声源方位角。

本发明的目的之二是通过以下技术方案来实现的：

本发明提供的一种基于麦克风阵列的声源定位跟随方法，包括以下步骤：

S1：设置麦克风阵列；

S2：通过麦克风阵列来获取声源到各个麦克风的语音信号；

S3：将语音采样信号转换为信号序列；

S4：对信号序列进行加窗操作得到加窗处理信号；

S5：对加窗处理信号判断声源位于采样位置的前后方向和左右方向；

S6：根据声源位于采样位置的前后方向和左右方向来确定声源的位置；

进一步，所述声源的位置是通过声源定位方法来确定的，具体步骤如下：

S(k)＝FFT[s_w(n)]；

其中，S(k)为加窗信号s_w(n)的傅里叶变换；

S633：根据波程差按照以下公式计算声源位置坐标：

其中，(x，y)为声源坐标，a为相邻麦克风间距；

为声源距行走装置所载麦克风M1距离；

S634：根据声源位置坐标按照以下公式计算声源方位角：

声源方位角

其中，α声源方位角。

进一步，所述声源位置按照以下步骤来计算：

S61：根据加窗处理信号来判断声源位于采样位置的前后方向；

S62：根据加窗处理信号来判断声源位于采样位置的左右方向；

S63：根据声源位于采样位置的前后方向和左右方向来确定声源的位置。

进一步，所述声源位于采样位置的前后方向是按照以下步骤来计算：

S611：获取均匀线性子阵列A中位于中间点前后的麦克风与参考点麦克风的间距为a；

S612：获取均匀线性子阵列A中位于中间点前后的麦克风的加窗处理信号；

S613：按照以下公式计算加窗处理信号的短时能量：

其中，N为窗函数的长度；x_w表示加窗处理信号；n表示第n个加窗处理信号；m表示第m个加窗处理信号；

S614：比较位于中间点前后的麦克风的短时能量，如果位于中间点前的麦克风的短时能量大于位于中间点后的麦克风的短时能量，则声源位于采样位置的前方；如果位于中间点前的麦克风的短时能量小于位于中间点后的麦克风的短时能量，则声源位于采样位置的后方；

所述声源位于采样位置的左右方向是按照以下步骤来计算：

S621：获取均匀线性子阵列B中各麦克风到参考点麦克风的间距为b；

S622：获取均匀线性子阵列B中位于中间点左右的麦克风的加窗处理信号；

S623：按照以下公式计算加窗处理信号的短时能量：

S624：比较位于中间点左右的麦克风的短时能量，如果位于中间点左的麦克风的短时能量大于位于中间点右的麦克风的短时能量，则声源位于采样位置的左方；如果位于中间点左的麦克风的短时能量小于位于中间点右后的麦克风的短时能量，则声源位于采样位置的右方。

由于采用了上述技术方案，本发明具有如下的优点：

本发明提供的基于麦克风阵列的声源定位跟随系统，通过手持设备与行走装置所载声源构成定位系统，该定位系统可以通过蓝牙建立无线通信，当手持设备发出声源信号时，即触发定位系统开始采样，当手持设备无声源信号发出时，定位系统关闭。采用这种方式，可以实现行走装置的实时定位跟随。本发明在行走装置近距离跟随情况下，可以准确确定声源位置，实时性强，并且算法简单，易于实现。

本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述，并且在某种程度上，基于对下文的考察研究对本领域技术人员而言将是显而易见的，或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。

附图说明

本发明的附图说明如下。

图1是本发明的硬件框图。

图2是本发明的麦克风阵列模型。

图3是本发明声源S与麦克风阵列的位置关系示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步说明。

实施例1

如图所示，本实施例提供的基于麦克风阵列的声源定位跟随系统，包括信号接收模块、AD采样电路、信号预处理模块、算法处理模块和输出模块；

所述AD采样电路，用于获取各麦克风的语音采样信号；

所述信号预处理模块，用于预处理语音采样信号；

所述算法处理模块，用于根据语音采样信号计算声源位置；

所述输出模块，用于输出声源位置信息。

所述麦克风阵列包括相互垂直设置的均匀线性子阵列A、均匀线性子阵列B和参考点麦克风；所述参考点麦克风设置于相互垂直设置的均匀线性子阵列A、均匀线性子阵列B的中间点。

所述信号预处理模块按照以下步骤对语音采样信号进行预处理：首先将语音采样信号转换为信号序列；然后对信号序列进行加窗操作得到加窗处理信号。

所述算法处理模块按照以下步骤来计算声源位置：

根据加窗处理信号来判断声源位于采样位置的前后方向；

根据加窗处理信号来判断声源位于采样位置的左右方向；

根据声源位于采样位置的前后方向和左右方向来确定声源的大致位置。

所述算法处理模块中声源的位置是通过声源定位方法来确定的，具体步骤如下：

S(k)＝FFT[s_w(n)]；

其中，S(k)为加窗信号s_w(n)的傅里叶变换；

S633：根据波程差按照以下公式计算声源位置坐标：

其中，(x，y)为声源坐标，a为相邻麦克风间距；

为声源距行走装置所载麦克风M1距离；

S634：根据声源位置坐标按照以下公式计算声源方位角：

声源方位角

其中，α声源方位角。

本发明还提供了一种基于麦克风阵列的声源定位跟随方法，包括以下步骤：

S1：设置麦克风阵列；

S2：通过麦克风阵列来获取声源到各个麦克风的语音信号；

S3：将语音采样信号转换为信号序列；

S4：对信号序列进行加窗操作得到加窗处理信号；

所述声源位置按照以下步骤来计算：

所述声源位于采样位置的前后方向是按照以下步骤来计算：

S613：按照以下公式计算加窗处理信号的短时能量：

S614：比较位于中间点前后的麦克风的短时能量，如果位于中间点前的麦克风的短时能量大于位于中间点后的麦克风的短时能量，则声源位于采样位置的前方；如果位于中间点前的麦克风的短时能量小于位于中间点后的麦克风的短时能量，则声源位于采样位置的后方。

所述声源位于采样位置的左右方向是按照以下步骤来计算：

S623：按照以下公式计算加窗处理信号的短时能量：

实施例2

本实施例提供的基于麦克风阵列的声源定位跟随方法，通过手持设备与行走装置所载声源构成进行定位的定位系统，该定位系统设置于行走装置，如助行装置和助行轮椅，如图1中虚线框所示，虚线框内表示行走装置，并通过蓝牙建立无线通信，当手持设备发出声源信号时，即触发定位系统开始采样，当手持设备无声源信号发出时，定位系统关闭。采用这种方式，可以实现行走装置的实时定位跟随。在行走装置近距离跟随情况下，可以准确确定声源位置，实时性强，并且算法简单，易于实现。

基于麦克风阵列的声源定位跟随系统示意图如图1所示：包括信号接收模块、信号预处理模块、算法处理模块以及结果输出模块。

信号接收模块为置于行走装置上的十字麦克风阵列，结构示意图如图2所示，用于获取声源到各个麦克风的语音信号，由均匀线性子阵列A和均匀线性子阵列B构成，两个子阵列相互垂直，共用中间麦克风1并将其作为参考点；麦克风M2、M3与麦克风M1间距为a；所述麦克风M4、M5与麦克风M1间距为b；本实施例中的M4位于前方，M5位于后方；麦克风M2位于麦克风M1左方，麦克风M3位于麦克风M1右方。

信号预处理模块包括AD采样电路，AD采样电路以20KHZ采样频率对各个麦克风获取的语音信号进行采样，将模拟信号转化为离散信号。

算法处理模块以及结果输出模块包括STM32F103ZE处理器及外围电路、音频输出电路，用于运行相关算法确定声源位置，并输出位置信息音频。

具体实现步骤如下：

手持设备发出单频声源信号s(t)，通过蓝牙与行走装置建立无线通信，触发定位系统开始采样；

行走装置利用麦克风阵列接收声源信号；

将接收到的声源信号进行AD采样，采样频率为20KHZ；将模拟信号s(t)转换为信号序列s(n)；

对麦克风所接收语音信号进行加窗操作。假设语音信号在10～30ms短时间内是平稳的，窗函数平滑地在语音信号上滑动，将语音信号分成帧。窗函数选用汉明窗

其中，N为窗口长度，也为一帧采样点数。加窗处理后的信号为s_w(n)：

s_w(n)＝s(n)*w(n)

判断声源信号基于行走装置的前后方向。窗函数的长度为N，短时能量可表示为：

比较麦克风M4和M5接收语音信号的强度大小，如果E_4n＞E_5n声源信号在行走装置前方；如果E_4n＜E_5n，声源信号在行走装置后方。

其中，E_4n表示麦克风4所接受语音信号的强度，E_5n表示麦克风5所接受语音信号的强度。

判断声源信号基于行走装置的左右方向。窗函数的长度为N，短时能量可表示为：

比较麦克风M2和M3接收语音信号的强度大小，如果E_2n＞E_3n声源信号在行走装置左方；如果E_2n＜E_3n声源信号在行走装置右方。

其中，E_2n表示麦克风2所接受语音信号的强度，E_3n表示麦克风3所接受语音信号的强度。

由声源定位方法定位声源的具体位置。

8)行走装置根据声源方位以及位置自主跟随。

步骤(6)具体包括如下步骤：

(6.1)对信号序列进行快速傅里叶变换。S(k)＝FFT[s_w(n)]；其中，S(k)为加窗信号s_w(n)的傅里叶变换。

(6.2)计算声源信号到各麦克风间的波程差。由FFT变换可求得声源信号的幅度谱，声源信号频率为f，该频率处所对应各麦克风接收语音信号的幅度与相位分别为：

M₁＝a₁+b₁j；相位：

M₂＝a₂+b₂j；相位：

M₃＝a₃+b₃j；相位：

麦克风1与2间相位差为：β₁＝θ₂-θ₁；麦克风1与3间相位差为：β₂＝θ₃-θ₁；

一个周期内声源信号到麦克风M1与M2、M1与M3间的波程差d₁和d₂分别为：

其中λ为声源信号一个周期的波长，f为声源信号的频率；

(6.3)建立平面直角坐标系，求声源位置到坐标系原点距离r；其中，声源坐标为(x，y)，a为相邻麦克风间距。建立方程组如下：

声源距行走装置所载麦克风M1距离为r：

(6.4)由已知平面坐标系，求声源方位角；

声源方位角

手持设备与行走装置所载声源定位系统可以通过蓝牙建立无线通信，当手持设备发出声源信号时，即触发定位系统开始采样，当手持设备无声源信号发出时，定位系统关闭。采用这种方式，可以实现行走装置的实时定位跟随。本发明在行走装置近距离跟随情况下，可以准确确定声源位置，实时性强，并且算法简单，易于实现。

最后说明的是，以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本技术方案的宗旨和范围，其均应涵盖在本发明的保护范围当中。

Claims

1.一种基于麦克风阵列的声源定位跟随系统，其特征在于：包括信号接收模块、AD采样电路、信号预处理模块、算法处理模块和输出模块；

所述AD采样电路，用于获取各麦克风的语音采样信号；

所述信号预处理模块，用于预处理语音采样信号；

所述算法处理模块，用于根据语音采样信号计算声源位置；

所述输出模块，用于输出声源位置信息。

2.如权利要求1所述的基于麦克风阵列的声源定位跟随系统，其特征在于：所述麦克风阵列包括相互垂直设置的均匀线性子阵列A、均匀线性子阵列B和参考点麦克风；所述参考点麦克风设置于相互垂直设置的均匀线性子阵列A、均匀线性子阵列B的中间点。

3.如权利要求1所述的基于麦克风阵列的声源定位跟随系统，其特征在于：所述信号预处理模块对语音采样信号进行预处理是对采样信号进行加窗操作得到加窗处理信号。

4.如权利要求1所述的基于麦克风阵列的声源定位跟随系统，其特征在于：所述算法处理模块按照以下步骤来计算声源位置：

根据加窗处理信号来判断声源位于采样位置的前后方向；

根据加窗处理信号来判断声源位于采样位置的左右方向；

5.如权利要求4所述的基于麦克风阵列的声源定位跟随系统，其特征在于：所述算法处理模块中声源的位置是通过声源定位方法来确定的，具体步骤如下：

S(k)＝FFT[s_w(n)]；

其中，S(k)为加窗信号s_w(n)的傅里叶变换；

d_{1} = \frac{β_{1}}{2 π} \times λ; d_{1} = \frac{β_{2}}{2 π} \times λ;

S633：根据波程差按照以下公式计算声源位置坐标：

\{\begin{matrix} \sqrt{{(x + a)}^{2} + y^{2}} = \sqrt{x^{2} + y^{2}} + d_{1} \\ \sqrt{{(a - x)}^{2} + y^{2}} = \sqrt{x^{2} + y^{2}} + d_{2} \end{matrix}; d_{1} > 0, d_{2} > 0

\{\begin{matrix} \sqrt{{(x + a)}^{2} + y^{2}} = \sqrt{x^{2} + y^{2}} + d_{1} \\ \sqrt{x^{2} + y^{2}} = \sqrt{{(a - x)}^{2} + y^{2}} + d_{2} \end{matrix}; d_{1} > 0, d_{2} < 0

其中，(x，y)为声源坐标，α为相邻麦克风间距；

为声源距行走装置所载麦克风M1距离；

S634：根据声源位置坐标按照以下公式计算声源方位角：

声源方位角

其中，α声源方位角。

6.一种基于麦克风阵列的声源定位跟随方法，其特征在于：包括以下步骤：

S1：设置麦克风阵列；

S2：通过麦克风阵列来获取声源到各个麦克风的语音信号；

S3：对语音信号进行加窗操作得到加窗处理信号；

S4：对加窗处理信号判断声源位于采样位置的前后方向和左右方向；

S5：根据声源位于采样位置的前后方向和左右方向来确定声源的位置。

7.如权利要求6所述的基于麦克风阵列的声源定位跟随系统，其特征在于：所述声源的位置是通过声源定位方法来确定的，具体步骤如下：

S(k)＝FFT[s_w(n)]；

其中，S(k)为加窗信号s_w(n)的傅里叶变换；

d_{1} = \frac{β_{1}}{2 π} \times λ; d_{1} = \frac{β_{2}}{2 π} \times λ;

S633：根据波程差按照以下公式计算声源位置坐标：

\{\begin{matrix} \sqrt{{(x + a)}^{2} + y^{2}} = \sqrt{x^{2} + y^{2}} + d_{1} \\ \sqrt{{(a - x)}^{2} + y^{2}} = \sqrt{x^{2} + y^{2}} + d_{2} \end{matrix}; d_{1} > 0, d_{2} > 0

\{\begin{matrix} \sqrt{{(x + a)}^{2} + y^{2}} = \sqrt{x^{2} + y^{2}} + d_{1} \\ \sqrt{x^{2} + y^{2}} = \sqrt{{(a - x)}^{2} + y^{2}} + d_{2} \end{matrix}; d_{1} > 0, d_{2} < 0

其中，(x，y)为声源坐标，α为相邻麦克风间距；

为声源距行走装置所载麦克风M1距离；

S634：根据声源位置坐标按照以下公式计算声源方位角：

声源方位角

其中，α声源方位角。

8.如权利要求6所述的基于麦克风阵列的声源定位跟随方法，其特征在于：所述麦克风阵列包括相互垂直设置的均匀线性子阵列A、均匀线性子阵列B和参考点麦克风；所述参考点麦克风设置于相互垂直设置的均匀线性子阵列A、均匀线性子阵列B的中间点。

9.如权利要求6所述的基于麦克风阵列的声源定位跟随方法，其特征在于：所述声源位置按照以下步骤来计算：

10.如权利要求7所述的基于麦克风阵列的声源定位跟随方法，其特征在于：所述声源位于采样位置的前后方向是按照以下步骤来计算：

S611：获取均匀线性子阵列A中位于中间点前后的麦克风与参考点麦克风的间距为α；

S613：按照以下公式计算加窗处理信号的短时能量：

E_{n} = Σ_{m = n}^{n + N - 1} x_{w}^{2} (m);

所述声源位于采样位置的左右方向是按照以下步骤来计算：

S623：按照以下公式计算加窗处理信号的短时能量：

E_{n} = Σ_{m = n}^{n + N - 1} x_{w}^{2} (m);