CN107592600B - 一种基于分布式麦克风的拾音筛选方法及拾音装置 - Google Patents

一种基于分布式麦克风的拾音筛选方法及拾音装置 Download PDF

Info

Publication number
CN107592600B
CN107592600B CN201610527634.1A CN201610527634A CN107592600B CN 107592600 B CN107592600 B CN 107592600B CN 201610527634 A CN201610527634 A CN 201610527634A CN 107592600 B CN107592600 B CN 107592600B
Authority
CN
China
Prior art keywords
microphone
digital signals
main controller
pickup
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610527634.1A
Other languages
English (en)
Other versions
CN107592600A (zh
Inventor
张岱宗
刘志雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen 3nod Acousticlink Co ltd
Shenzhen 3Nod Digital Technology Co Ltd
Guangxi 3Nod Digital Technology Co Ltd
Original Assignee
Shenzhen 3nod Acousticlink Co ltd
Shenzhen 3Nod Digital Technology Co Ltd
Guangxi 3Nod Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen 3nod Acousticlink Co ltd, Shenzhen 3Nod Digital Technology Co Ltd, Guangxi 3Nod Digital Technology Co Ltd filed Critical Shenzhen 3nod Acousticlink Co ltd
Priority to CN201610527634.1A priority Critical patent/CN107592600B/zh
Publication of CN107592600A publication Critical patent/CN107592600A/zh
Application granted granted Critical
Publication of CN107592600B publication Critical patent/CN107592600B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Telephonic Communication Services (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明公开了一种基于分布式麦克风的拾音筛选方法及拾音装置。该拾音筛选方法包括以下步骤:步骤a、初始化分布式麦克风,即对各麦克风及主控制器进行时间同步;各麦克风分别与主控制器无线通信连接;步骤b、各麦克风采集语音信息并转化成数字信号,将数字信号和时间特征值传输至主控制器;步骤c、主控制器根据各麦克风的时间特征值,预处理得到初筛的多个数字信号;步骤d、对初筛的多个数字信号采用最大似然估计法进行分析,取最大概率的数字信号作为语音输出。该拾音筛选方法将分布式麦克风作为拾音矩阵,使得麦克风更加靠近使用者,可以降低对于语音输入声压的需求,以提高语音识别准确率,同时提高用户的体验感。

Description

一种基于分布式麦克风的拾音筛选方法及拾音装置
技术领域
本发明涉及了拾音技术领域,特别是涉及了一种基于分布式麦克风的拾音筛选方法及拾音装置。
背景技术
我们所处的环境中常常伴随着各种噪声,例如,房间内的电视机声和风扇声、汽车内的发动机声、马路上的汽车行驶声、咖啡厅内的Babble噪声等。噪声对多种语音处理系统产生负面影响。而且,目前的语音采集系统无论是远场还是近场都需要足够的声压输入,特别是针对语音识别系统;在语音识别系统中,噪声及低的声压输入,使得语音识别率下降,甚至使识别系统完全失效,影响交互的体验感。
发明内容
为了解决上述现有技术的不足,本发明提供了一种基于分布式麦克风的拾音筛选方法及拾音装置。该拾音筛选方法通过分布式麦克风作为拾音矩阵,使得麦克风更加靠近使用者,可以降低对于语音输入声压的需求;对各麦克风采集的语音信息根据时间特征值进行初筛,并对初筛结果采用最大似然估计法进行分析,最后获得纯净且精确度高的语音输出,以提高语音识别准确率,同时提高用户的体验感。
本发明所要解决的技术问题通过以下技术方案予以实现:
一种基于分布式麦克风的拾音筛选方法,其包括以下步骤:
步骤a、初始化分布式麦克风,即对各麦克风及主控制器进行时间同步;各麦克风分别与所述主控制器无线通信连接;
步骤b、各麦克风采集语音信息并转化成数字信号,将数字信号和时间特征值传输至所述主控制器;
步骤c、所述主控制器根据各麦克风的时间特征值,预处理得到初筛的多个数字信号;
步骤d、对初筛的多个数字信号采用最大似然估计法进行分析,取最大概率的数字信号作为语音输出。
进一步地,各麦克风采集语音信息转化成数字信号前进行回声和降噪处理。
进一步地,所述麦克风包括音频采集模块、网络设备时钟及无线通信模块。
进一步地,所述麦克风还包括模数转换模块,其与所述音频采集模块连接。
进一步地,所述麦克风还包括回声降噪处理模块,其与所述音频采集模块连接。
一种基于分布式麦克风的拾音装置,包括:分布式麦克风、与各麦克风无线通信连接的主控制器;所述麦克风包括音频采集模块、模数转换模块、网络设备时钟及无线通信模块,所述音频采集模块经模数转换模块与无线通信模块连接,所述网络设备时钟与无线通信模块连接;所述主控制器包括初筛模块及数据分析模块,所述初筛模块用于根据各麦克风的时间特征值进行预处理得到初筛的多个数字信号;所述数据分析模块用于对初筛的多个数字信号采用最大似然估计法进行分析,取最大概率的数字信号作为语音输出;其中,所述各麦克风分别将各自的数字信号和时间特征值传输至所述主控制器。
进一步地,所述麦克风还包括回声降噪处理模块,其分别与所述音频采集模块和模数转换模块连接。
本发明具有如下有益效果:该拾音筛选方法通过分布式麦克风作为拾音矩阵,使得麦克风更加靠近使用者,可以降低对于语音输入声压的需求;对各麦克风采集的语音信息根据时间特征值进行初筛,并对初筛结果采用最大似然估计法进行分析,最后获得纯净且精确度高的语音输出,以提高语音识别准确率,同时提高用户的体验感。
附图说明
图1为本发明拾音筛选方法的流程示意图;
图2为本发明拾音装置的原理框图。
具体实施方式
下面结合附图和实施例对本发明进行详细的说明。
如图1所示,一种基于分布式麦克风的拾音筛选方法,具体包括以下步骤:
步骤a、初始化分布式麦克风,即对各麦克风及主控制器进行时间同步;各麦克风分别与所述主控制器无线通信连接;
步骤b、各麦克风采集语音信息并转化成数字信号,将数字信号和时间特征值传输至所述主控制器;
具体实现时,设置多个麦克风,建立由多个麦克风和主控制器构成的基于Ad-hoc网络(又称临时自组织网络)的分布式麦克风网络,各麦克风分别与主控制器相互通信。该主控制器设置在语音识别装置或电子设备内。
在麦克风网络中,网络节点为每一个麦克风;每一麦克风包括音频采集模 块、回声降噪处理模块、模数转换模块、无线通信模块,所述音频采集模块经回声降噪处理模块、模数转换模块与无线通信模块连接;其中,音频采集模块用于采集所处环境中使用者的语音信息,所述回声降噪处理模块用于采集的语音信息进行回声降噪处理,所述模数转换模块用于将回声降噪处理后的语音信息转化成数字信号;还包括网络设备时钟,与无线通信模块连接,其用于同步各麦克风和主控制器模块的时间,基于NTP网络时间协议进行同步;该网络设备时钟优选设置在所述无线通信模块上,当音频采集模块开始采集音频时,读取该无线通信模块上的网络时钟,作为时间特征值;所述无线通信模块用于负责麦克风与主控制器之间的数据传输,该数据包括数字信号及时间特征值。
步骤c、所述主控制器根据各麦克风的时间特征值,预处理得到初筛的多个数字信号;
具体实现时,音频采集模块开始信号采样时会同步加入时间参数,即时间特征值,该时间参数和所述主控制器的时间参数是同步的,也就是说,所述主控制器与多个麦克风是统一使用一个时钟来采样数据。远离声源的麦克风的时间特征值与靠近声源的麦克风的时间特征值不同,而靠近声源的多个麦克风的时间特征值相近,则可通过接收到的若干个时间特征值,初步划定声源的位置,可以根据相应的算法选取最优化的多个初筛的数字信号。
所述算法是根据声音的传波时间差来判断声源和麦克风之间的距离;多个初筛的数字信号对应的麦克风离声源最近或较接近。
步骤d、对初筛的多个数字信号进行最大似然估计法分析,取最大概率的数字信号作为语音输出,完成拾音。
具体实现时,所述最大似然估计法具体为:多个初筛的数字信号进行比较,分析出背景噪音信号,然后滤除背景噪音,获取清晰的语音指令数据,再比较各路语音指令数据,从而获取最大似然估计的数字信号作为语音输出,完成拾音。
需要说明的是,所述最大似然估计法运算过程中,所采用的步骤算法均可由现有技术实现,在本发明中并没有特别的限制。
该拾音筛选方法通过分布式麦克风作为拾音矩阵,使得麦克风更加靠近使用者,可以降低对于语音输入声压的需求;对各麦克风采集的语音信息根据时间特征值进行初筛,并对初筛结果采用最大似然估计法分析,最后获得纯净且精确度高的语音输出,以提高语音识别准确率,同时提高用户的体验感。
如图2所示,一种基于分布式麦克风的拾音装置,包括:分布式麦克风、与各麦克风无线通信连接的主控制器;所述麦克风包括音频采集模块、模数转换模块、网络设备时钟及无线通信模块,所述音频采集模块经模数转换模块与无线通信模块连接,所述网络设备时钟与无线通信模块连接;所述主控制器包括初筛模块及数据分析模块,所述初筛模块用于根据各麦克风的时间特征值进行预处理得到初筛的多个数字信号;所述数据分析模块用于对初筛的多个数字信号进行最大似然估计法分析,取最大概率的数字信号作为语音输出;其中,所述各麦克风分别将各自的数字信号和时间特征值传输至所述主控制器。
所述主控制器还包括存储模块,分别与所述初筛模块及数据分析模块连接,用于储存分析前后的数据。所述主控制器优选设置在某一麦克风内,或设置在与所述拾音装置配合使用的电子设备上,如语音识别装置等等。
所述麦克风还包括回声降噪处理模块,其分别与所述音频采集模块和模数转换模块连接。
以上所述实施例仅表达了本发明的实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制,但凡采用等同替换或等效变换的形式所获得的技术方案,均应落在本发明的保护范围之内。

Claims (7)

1.一种基于分布式麦克风的拾音筛选方法,其包括以下步骤:
步骤a、初始化分布式麦克风,即对各麦克风及主控制器进行时间同步;各麦克风分别与所述主控制器无线通信连接,建立由多个麦克风和所述主控制器构成的基于Ad-hoc网络的分布式麦克风网络;
步骤b、各麦克风采集语音信息并转化成数字信号,将数字信号和时间特征值传输至所述主控制器;
步骤c、所述主控制器根据各麦克风的时间特征值,预处理得到初筛的多个数字信号;
步骤d、对初筛的多个数字信号采用最大似然估计法进行分析,取最大概率的数字信号作为语音输出;
所述步骤d具体包括:
基于所述数字信号获取语音指令数据集,所述语音指令数据集包含多个语音指令数据,一个所述语音指令数据对应一个所述数字信号;
将所述多个数字信号进行比较分析,得到背景噪音信号;
基于所述背景噪音信号对所述语音指令数据集进行过滤处理,得到清晰目标指令数据集合;
对所述清晰目标指令数据集合内的全部所述语音指令数据进行比较,得到最大概率的数字信号作为语音输出。
2.根据权利要求1所述的基于分布式麦克风的拾音筛选方法,其特征在于,各麦克风采集语音信息转化成数字信号前进行回声和降噪处理。
3.根据权利要求1所述的基于分布式麦克风的拾音筛选方法,其特征在于,所述麦克风包括音频采集模块、网络设备时钟及无线通信模块,所述音频采集模块和网络设备时钟分别与无线通信模块连接。
4.根据权利要求3所述的基于分布式麦克风的拾音筛选方法,其特征在于,所述麦克风还包括模数转换模块,其与所述音频采集模块连接。
5.根据权利要求3所述的基于分布式麦克风的拾音筛选方法,其特征在于,所述麦克风还包括回声降噪处理模块,其与所述音频采集模块连接。
6.一种基于分布式麦克风的拾音装置,其特征在于,包括:分布式麦克风、与各麦克风无线通信连接的主控制器,建立由多个麦克风和所述主控制器构成的基于Ad-hoc网络的分布式麦克风网络;所述麦克风包括音频采集模块、模数转换模块、网络设备时钟及无线通信模块,所述音频采集模块经模数转换模块与无线通信模块连接,所述网络设备时钟与无线通信模块连接;所述主控制器包括初筛模块及数据分析模块,所述初筛模块用于根据各麦克风的时间特征值进行预处理得到初筛的多个数字信号;所述数据分析模块用于对初筛的多个数字信号采用最大似然估计法进行分析,取最大概率的数字信号作为语音输出;所述数据分析模块还用于基于所述数字信号获取语音指令数据集,所述语音指令数据集包含多个语音指令数据,一个所述语音指令数据对应一个所述数字信号;将所述多个数字信号进行比较分析,得到背景噪音信号;基于所述背景噪音信号对所述语音指令数据集进行过滤处理,得到清晰目标指令数据集合;对所述清晰目标指令数据集合内的全部所述语音指令数据进行比较,得到最大概率的数字信号作为语音输出,其中,所述各麦克风分别将各自的数字信号和时间特征值传输至所述主控制器。
7.根据权利要求6所述的基于分布式麦克风的拾音装置,其特征在于,所述麦克风还包括回声降噪处理模块,其分别与所述音频采集模块和模数转换模块连接。
CN201610527634.1A 2016-07-06 2016-07-06 一种基于分布式麦克风的拾音筛选方法及拾音装置 Active CN107592600B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610527634.1A CN107592600B (zh) 2016-07-06 2016-07-06 一种基于分布式麦克风的拾音筛选方法及拾音装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610527634.1A CN107592600B (zh) 2016-07-06 2016-07-06 一种基于分布式麦克风的拾音筛选方法及拾音装置

Publications (2)

Publication Number Publication Date
CN107592600A CN107592600A (zh) 2018-01-16
CN107592600B true CN107592600B (zh) 2024-04-02

Family

ID=61044864

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610527634.1A Active CN107592600B (zh) 2016-07-06 2016-07-06 一种基于分布式麦克风的拾音筛选方法及拾音装置

Country Status (1)

Country Link
CN (1) CN107592600B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110519676B (zh) * 2019-08-22 2021-04-09 云知声智能科技股份有限公司 一种去中心化的分布式麦克风拾音的方法
CN112786056A (zh) * 2021-02-04 2021-05-11 厦门科路德科技有限公司 一种声音气体复合检测方法及装置
CN113573212B (zh) * 2021-06-04 2023-04-25 成都千立智能科技有限公司 扩声系统、及麦克风通道数据选择方法
CN115631764A (zh) * 2022-10-21 2023-01-20 深圳看到科技有限公司 分布式麦克风的音频同步方法、装置和存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101957442A (zh) * 2010-06-04 2011-01-26 河北工业大学 一种声源定位装置
CN102033223A (zh) * 2010-12-29 2011-04-27 北京信息科技大学 使用麦克风阵列对声源定位的方法
CN102324237A (zh) * 2011-05-30 2012-01-18 深圳市华新微声学技术有限公司 麦克风阵列语音波束形成方法、语音信号处理装置及系统
CN203279149U (zh) * 2013-01-23 2013-11-06 武汉华博通讯有限公司 一种阵列麦克风系统
CN104360315A (zh) * 2014-10-16 2015-02-18 河北工业大学 基于LabVIEW的麦克风阵列声源定位方法及装置
CN104535965A (zh) * 2014-12-29 2015-04-22 江苏科技大学 基于嵌入式gpu系统的并行化声源定位系统及方法
CN204578759U (zh) * 2015-04-02 2015-08-19 钰太芯微电子科技(上海)有限公司 大屏幕移动终端的波束定位系统
EP2916321A1 (en) * 2014-03-07 2015-09-09 Oticon A/s Multi-microphone method for estimation of target and noise spectral variances for speech degraded by reverberation and optionally additive noise
WO2015184893A1 (zh) * 2014-11-21 2015-12-10 中兴通讯股份有限公司 移动终端通话语音降噪方法及装置
CN205987367U (zh) * 2016-07-06 2017-02-22 深圳市三诺声智联股份有限公司 一种基于分布式麦克风的拾音装置

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101957442A (zh) * 2010-06-04 2011-01-26 河北工业大学 一种声源定位装置
CN102033223A (zh) * 2010-12-29 2011-04-27 北京信息科技大学 使用麦克风阵列对声源定位的方法
CN102324237A (zh) * 2011-05-30 2012-01-18 深圳市华新微声学技术有限公司 麦克风阵列语音波束形成方法、语音信号处理装置及系统
CN203279149U (zh) * 2013-01-23 2013-11-06 武汉华博通讯有限公司 一种阵列麦克风系统
EP2916321A1 (en) * 2014-03-07 2015-09-09 Oticon A/s Multi-microphone method for estimation of target and noise spectral variances for speech degraded by reverberation and optionally additive noise
CN104360315A (zh) * 2014-10-16 2015-02-18 河北工业大学 基于LabVIEW的麦克风阵列声源定位方法及装置
WO2015184893A1 (zh) * 2014-11-21 2015-12-10 中兴通讯股份有限公司 移动终端通话语音降噪方法及装置
CN105611014A (zh) * 2014-11-21 2016-05-25 中兴通讯股份有限公司 移动终端通话语音降噪方法及装置
CN104535965A (zh) * 2014-12-29 2015-04-22 江苏科技大学 基于嵌入式gpu系统的并行化声源定位系统及方法
CN204578759U (zh) * 2015-04-02 2015-08-19 钰太芯微电子科技(上海)有限公司 大屏幕移动终端的波束定位系统
CN205987367U (zh) * 2016-07-06 2017-02-22 深圳市三诺声智联股份有限公司 一种基于分布式麦克风的拾音装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"Simultaneous asynchronous microphone array calibration and sound source localisation";Daobilige Su 等;《2015 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS)》;20151217;全文 *
"基于麦克风阵列的数字助听器语音增强技术";戴红霞等;《电子器件》;20150630;第38卷(第03期);全文 *
"基于麦克风阵列的语音增强与识别研究";李晓雪;《万方硕士论文全文库》;20101222;全文 *

Also Published As

Publication number Publication date
CN107592600A (zh) 2018-01-16

Similar Documents

Publication Publication Date Title
CN107799126B (zh) 基于有监督机器学习的语音端点检测方法及装置
CN107592600B (zh) 一种基于分布式麦克风的拾音筛选方法及拾音装置
CN107910011B (zh) 一种语音降噪方法、装置、服务器及存储介质
CN108352818B (zh) 用于增强声音信号的声音信号处理装置和方法
CN108899044A (zh) 语音信号处理方法及装置
WO2016112113A1 (en) Utilizing digital microphones for low power keyword detection and noise suppression
CN108109617A (zh) 一种远距离拾音方法
CN103871419A (zh) 一种信息处理方法及电子设备
CN205987367U (zh) 一种基于分布式麦克风的拾音装置
CN112786064A (zh) 一种端到端的骨气导语音联合增强方法
JP2010112995A (ja) 通話音声処理装置、通話音声処理方法およびプログラム
CN110765868A (zh) 唇读模型的生成方法、装置、设备及存储介质
CN111868823A (zh) 一种声源分离方法、装置及设备
CN110169082B (zh) 用于组合音频信号输出的方法和装置、及计算机可读介质
JPWO2014049944A1 (ja) 音声処理装置、音声処理方法、音声処理プログラムおよび雑音抑圧装置
CN112802490B (zh) 一种基于传声器阵列的波束形成方法和装置
JP4891805B2 (ja) 残響除去装置、残響除去方法、残響除去プログラム、記録媒体
CN113889135A (zh) 一种估计声源波达方向的方法、电子设备及芯片系统
JP5705190B2 (ja) 音響信号強調装置、音響信号強調方法、およびプログラム
US20210287674A1 (en) Voice recognition for imposter rejection in wearable devices
JP6285855B2 (ja) フィルタ係数算出装置、音声再生装置、フィルタ係数算出方法及びプログラム
CN111028857B (zh) 基于深度学习的多通道音视频会议降噪的方法及系统
CN114495909A (zh) 一种端到端的骨气导语音联合识别方法
JP6673861B2 (ja) 信号処理装置、信号処理方法及び信号処理プログラム
CN113744752A (zh) 语音处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant