CN107592600B

CN107592600B - 一种基于分布式麦克风的拾音筛选方法及拾音装置

Info

Publication number: CN107592600B
Application number: CN201610527634.1A
Authority: CN
Inventors: 张岱宗; 刘志雄
Original assignee: Shenzhen 3nod Acousticlink Co ltd; Shenzhen 3Nod Digital Technology Co Ltd; Guangxi 3Nod Digital Technology Co Ltd
Current assignee: Shenzhen 3nod Acousticlink Co ltd; Shenzhen 3Nod Digital Technology Co Ltd; Guangxi 3Nod Digital Technology Co Ltd
Priority date: 2016-07-06
Filing date: 2016-07-06
Publication date: 2024-04-02
Anticipated expiration: 2036-07-06
Also published as: CN107592600A

Abstract

本发明公开了一种基于分布式麦克风的拾音筛选方法及拾音装置。该拾音筛选方法包括以下步骤：步骤a、初始化分布式麦克风，即对各麦克风及主控制器进行时间同步；各麦克风分别与主控制器无线通信连接；步骤b、各麦克风采集语音信息并转化成数字信号，将数字信号和时间特征值传输至主控制器；步骤c、主控制器根据各麦克风的时间特征值，预处理得到初筛的多个数字信号；步骤d、对初筛的多个数字信号采用最大似然估计法进行分析，取最大概率的数字信号作为语音输出。该拾音筛选方法将分布式麦克风作为拾音矩阵，使得麦克风更加靠近使用者，可以降低对于语音输入声压的需求，以提高语音识别准确率，同时提高用户的体验感。

Description

一种基于分布式麦克风的拾音筛选方法及拾音装置

技术领域

本发明涉及了拾音技术领域，特别是涉及了一种基于分布式麦克风的拾音筛选方法及拾音装置。

背景技术

我们所处的环境中常常伴随着各种噪声，例如，房间内的电视机声和风扇声、汽车内的发动机声、马路上的汽车行驶声、咖啡厅内的Babble噪声等。噪声对多种语音处理系统产生负面影响。而且，目前的语音采集系统无论是远场还是近场都需要足够的声压输入，特别是针对语音识别系统；在语音识别系统中，噪声及低的声压输入，使得语音识别率下降，甚至使识别系统完全失效，影响交互的体验感。

发明内容

为了解决上述现有技术的不足，本发明提供了一种基于分布式麦克风的拾音筛选方法及拾音装置。该拾音筛选方法通过分布式麦克风作为拾音矩阵，使得麦克风更加靠近使用者，可以降低对于语音输入声压的需求；对各麦克风采集的语音信息根据时间特征值进行初筛，并对初筛结果采用最大似然估计法进行分析，最后获得纯净且精确度高的语音输出，以提高语音识别准确率，同时提高用户的体验感。

本发明所要解决的技术问题通过以下技术方案予以实现：

一种基于分布式麦克风的拾音筛选方法，其包括以下步骤：

步骤a、初始化分布式麦克风，即对各麦克风及主控制器进行时间同步；各麦克风分别与所述主控制器无线通信连接；

步骤b、各麦克风采集语音信息并转化成数字信号，将数字信号和时间特征值传输至所述主控制器；

步骤c、所述主控制器根据各麦克风的时间特征值，预处理得到初筛的多个数字信号；

步骤d、对初筛的多个数字信号采用最大似然估计法进行分析，取最大概率的数字信号作为语音输出。

进一步地，各麦克风采集语音信息转化成数字信号前进行回声和降噪处理。

进一步地，所述麦克风包括音频采集模块、网络设备时钟及无线通信模块。

进一步地，所述麦克风还包括模数转换模块，其与所述音频采集模块连接。

进一步地，所述麦克风还包括回声降噪处理模块，其与所述音频采集模块连接。

一种基于分布式麦克风的拾音装置，包括：分布式麦克风、与各麦克风无线通信连接的主控制器；所述麦克风包括音频采集模块、模数转换模块、网络设备时钟及无线通信模块，所述音频采集模块经模数转换模块与无线通信模块连接，所述网络设备时钟与无线通信模块连接；所述主控制器包括初筛模块及数据分析模块，所述初筛模块用于根据各麦克风的时间特征值进行预处理得到初筛的多个数字信号；所述数据分析模块用于对初筛的多个数字信号采用最大似然估计法进行分析，取最大概率的数字信号作为语音输出；其中，所述各麦克风分别将各自的数字信号和时间特征值传输至所述主控制器。

进一步地，所述麦克风还包括回声降噪处理模块，其分别与所述音频采集模块和模数转换模块连接。

本发明具有如下有益效果：该拾音筛选方法通过分布式麦克风作为拾音矩阵，使得麦克风更加靠近使用者，可以降低对于语音输入声压的需求；对各麦克风采集的语音信息根据时间特征值进行初筛，并对初筛结果采用最大似然估计法进行分析，最后获得纯净且精确度高的语音输出，以提高语音识别准确率，同时提高用户的体验感。

附图说明

图1为本发明拾音筛选方法的流程示意图；

图2为本发明拾音装置的原理框图。

具体实施方式

下面结合附图和实施例对本发明进行详细的说明。

如图1所示，一种基于分布式麦克风的拾音筛选方法，具体包括以下步骤：

具体实现时，设置多个麦克风，建立由多个麦克风和主控制器构成的基于Ad-hoc网络(又称临时自组织网络)的分布式麦克风网络，各麦克风分别与主控制器相互通信。该主控制器设置在语音识别装置或电子设备内。

在麦克风网络中，网络节点为每一个麦克风；每一麦克风包括音频采集模块、回声降噪处理模块、模数转换模块、无线通信模块，所述音频采集模块经回声降噪处理模块、模数转换模块与无线通信模块连接；其中，音频采集模块用于采集所处环境中使用者的语音信息，所述回声降噪处理模块用于采集的语音信息进行回声降噪处理，所述模数转换模块用于将回声降噪处理后的语音信息转化成数字信号；还包括网络设备时钟，与无线通信模块连接，其用于同步各麦克风和主控制器模块的时间，基于NTP网络时间协议进行同步；该网络设备时钟优选设置在所述无线通信模块上，当音频采集模块开始采集音频时，读取该无线通信模块上的网络时钟，作为时间特征值；所述无线通信模块用于负责麦克风与主控制器之间的数据传输，该数据包括数字信号及时间特征值。

具体实现时，音频采集模块开始信号采样时会同步加入时间参数，即时间特征值，该时间参数和所述主控制器的时间参数是同步的，也就是说，所述主控制器与多个麦克风是统一使用一个时钟来采样数据。远离声源的麦克风的时间特征值与靠近声源的麦克风的时间特征值不同，而靠近声源的多个麦克风的时间特征值相近，则可通过接收到的若干个时间特征值，初步划定声源的位置，可以根据相应的算法选取最优化的多个初筛的数字信号。

所述算法是根据声音的传波时间差来判断声源和麦克风之间的距离；多个初筛的数字信号对应的麦克风离声源最近或较接近。

步骤d、对初筛的多个数字信号进行最大似然估计法分析，取最大概率的数字信号作为语音输出，完成拾音。

具体实现时，所述最大似然估计法具体为：多个初筛的数字信号进行比较，分析出背景噪音信号，然后滤除背景噪音，获取清晰的语音指令数据，再比较各路语音指令数据，从而获取最大似然估计的数字信号作为语音输出，完成拾音。

需要说明的是，所述最大似然估计法运算过程中，所采用的步骤算法均可由现有技术实现，在本发明中并没有特别的限制。

该拾音筛选方法通过分布式麦克风作为拾音矩阵，使得麦克风更加靠近使用者，可以降低对于语音输入声压的需求；对各麦克风采集的语音信息根据时间特征值进行初筛，并对初筛结果采用最大似然估计法分析，最后获得纯净且精确度高的语音输出，以提高语音识别准确率，同时提高用户的体验感。

如图2所示，一种基于分布式麦克风的拾音装置，包括：分布式麦克风、与各麦克风无线通信连接的主控制器；所述麦克风包括音频采集模块、模数转换模块、网络设备时钟及无线通信模块，所述音频采集模块经模数转换模块与无线通信模块连接，所述网络设备时钟与无线通信模块连接；所述主控制器包括初筛模块及数据分析模块，所述初筛模块用于根据各麦克风的时间特征值进行预处理得到初筛的多个数字信号；所述数据分析模块用于对初筛的多个数字信号进行最大似然估计法分析，取最大概率的数字信号作为语音输出；其中，所述各麦克风分别将各自的数字信号和时间特征值传输至所述主控制器。

所述主控制器还包括存储模块，分别与所述初筛模块及数据分析模块连接，用于储存分析前后的数据。所述主控制器优选设置在某一麦克风内，或设置在与所述拾音装置配合使用的电子设备上，如语音识别装置等等。

所述麦克风还包括回声降噪处理模块，其分别与所述音频采集模块和模数转换模块连接。

以上所述实施例仅表达了本发明的实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制，但凡采用等同替换或等效变换的形式所获得的技术方案，均应落在本发明的保护范围之内。

Claims

1.一种基于分布式麦克风的拾音筛选方法，其包括以下步骤：

步骤a、初始化分布式麦克风，即对各麦克风及主控制器进行时间同步；各麦克风分别与所述主控制器无线通信连接，建立由多个麦克风和所述主控制器构成的基于Ad-hoc网络的分布式麦克风网络；

步骤d、对初筛的多个数字信号采用最大似然估计法进行分析，取最大概率的数字信号作为语音输出；

所述步骤d具体包括：

基于所述数字信号获取语音指令数据集，所述语音指令数据集包含多个语音指令数据，一个所述语音指令数据对应一个所述数字信号；

将所述多个数字信号进行比较分析，得到背景噪音信号；

基于所述背景噪音信号对所述语音指令数据集进行过滤处理，得到清晰目标指令数据集合；

对所述清晰目标指令数据集合内的全部所述语音指令数据进行比较，得到最大概率的数字信号作为语音输出。

2.根据权利要求1所述的基于分布式麦克风的拾音筛选方法，其特征在于，各麦克风采集语音信息转化成数字信号前进行回声和降噪处理。

3.根据权利要求1所述的基于分布式麦克风的拾音筛选方法，其特征在于，所述麦克风包括音频采集模块、网络设备时钟及无线通信模块，所述音频采集模块和网络设备时钟分别与无线通信模块连接。

4.根据权利要求3所述的基于分布式麦克风的拾音筛选方法，其特征在于，所述麦克风还包括模数转换模块，其与所述音频采集模块连接。

5.根据权利要求3所述的基于分布式麦克风的拾音筛选方法，其特征在于，所述麦克风还包括回声降噪处理模块，其与所述音频采集模块连接。

6.一种基于分布式麦克风的拾音装置，其特征在于，包括：分布式麦克风、与各麦克风无线通信连接的主控制器，建立由多个麦克风和所述主控制器构成的基于Ad-hoc网络的分布式麦克风网络；所述麦克风包括音频采集模块、模数转换模块、网络设备时钟及无线通信模块，所述音频采集模块经模数转换模块与无线通信模块连接，所述网络设备时钟与无线通信模块连接；所述主控制器包括初筛模块及数据分析模块，所述初筛模块用于根据各麦克风的时间特征值进行预处理得到初筛的多个数字信号；所述数据分析模块用于对初筛的多个数字信号采用最大似然估计法进行分析，取最大概率的数字信号作为语音输出；所述数据分析模块还用于基于所述数字信号获取语音指令数据集，所述语音指令数据集包含多个语音指令数据，一个所述语音指令数据对应一个所述数字信号；将所述多个数字信号进行比较分析，得到背景噪音信号；基于所述背景噪音信号对所述语音指令数据集进行过滤处理，得到清晰目标指令数据集合；对所述清晰目标指令数据集合内的全部所述语音指令数据进行比较，得到最大概率的数字信号作为语音输出，其中，所述各麦克风分别将各自的数字信号和时间特征值传输至所述主控制器。

7.根据权利要求6所述的基于分布式麦克风的拾音装置，其特征在于，所述麦克风还包括回声降噪处理模块，其分别与所述音频采集模块和模数转换模块连接。