CN107889001A - 可扩展麦克风阵列及其建立方法 - Google Patents
可扩展麦克风阵列及其建立方法 Download PDFInfo
- Publication number
- CN107889001A CN107889001A CN201710908924.5A CN201710908924A CN107889001A CN 107889001 A CN107889001 A CN 107889001A CN 201710908924 A CN201710908924 A CN 201710908924A CN 107889001 A CN107889001 A CN 107889001A
- Authority
- CN
- China
- Prior art keywords
- chip
- microphone
- master chip
- master
- expansible
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 230000001360 synchronised effect Effects 0.000 claims abstract description 20
- 230000008569 process Effects 0.000 claims abstract description 19
- 238000012545 processing Methods 0.000 claims abstract description 19
- 230000009467 reduction Effects 0.000 claims abstract description 17
- 238000005070 sampling Methods 0.000 claims abstract description 12
- 230000005540 biological transmission Effects 0.000 claims description 23
- 230000000630 rising effect Effects 0.000 claims description 15
- 238000012546 transfer Methods 0.000 claims description 10
- 238000005314 correlation function Methods 0.000 claims description 6
- 230000007246 mechanism Effects 0.000 abstract description 7
- 238000003491 array Methods 0.000 abstract description 6
- 238000004364 calculation method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 241000209140 Triticum Species 0.000 description 2
- 235000021307 Triticum Nutrition 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000004568 cement Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/08—Mouthpieces; Microphones; Attachments therefor
- H04R1/083—Special constructions of mouthpieces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/162—Interface to dedicated audio devices, e.g. audio drivers, interface to CODECs
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/02—Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Otolaryngology (AREA)
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Abstract
本发明提供了一种可扩展麦克风阵列及其建立方法,采用多芯片间同步采样机制,通过一个gpio来控制多个芯片的adc同步采样,保证了多路adc数据的相位差在1μs以内,保证多个芯片同步工作;每个芯片单独完成双麦克的降噪、回升消除或者波束形成算法,能够有效分散系统开销,降低整个系统的负荷;单个从芯片处理后的音频数据级联传送到主芯片完成麦克风阵列的算法处理,通过级联把系统扩展到任意多个麦克风阵列,同时使用多芯片组成麦克风阵列,比采用单芯片多adc的方案成本更低,扩展性也更灵活。
Description
技术领域
本发明涉及麦克风技术领域,特别涉及一种可扩展麦克风阵列及其建立方法。
背景技术
随着语音识别技术的发展,语音已经成为人机交互的基本方式,其便捷性和自然性是其它方式无法比拟的。许多人工智能领域的公司,都推出了人工智能的交互式产品,主要形式是网络音箱。音箱上的语音识别采用的是远场语音识别技术,即无论说话人站在房屋的哪个角落,音箱都可以收到说话人的语音指令,完成语音识别并执行指令。远程语音识别的主要技术难点是:环境噪声,多径反射和混响都会影响语音识别率。因此,利用麦克风阵列进行前端语音处理的方法应运而生。它可以完成消噪,去混响,声源定位和提取等多种功能。
麦克风阵列由一组按一定几何结构摆放的麦克风组成,对采集的不同空间方向的声音信号进行空时处理,实现噪声抑制,混响去除,人声干扰抑制,语音增强,声源定向等功能,进而提高语音信号处理的质量,以提高真是环境下的语音识别率。另外,麦克风阵列还仅是物理入口,完成了物理世界的声音信号处理,得到了语音识别想要的声音,但语音识别率是在云端测试得到的结果,因此,还应结合云端系统实现相应的功能。
现有的麦克风阵列常见的有2麦克,4麦克,6麦克等方案。2麦克方案的结构简单,可以去除某个范围内的噪声,但最大的弊端是声源定位的能力比较差,只能定位180°内的范围。对于智能音箱的应用,需要使用4麦克以上的方案,例如亚马逊的echo音箱采用的环形6+1麦克风阵列结构,可以做到360°全角度范围内的定位,噪声消除效果也更好。目前市面上8个麦克以及16个麦克的方案很少,一方面是因为成本的考虑,另一方面是因为单芯片支持的adc数目不高。市场2个adc或4个adc的芯片较多,8个adc的芯片很少,若要组成16个麦克的麦克风阵列,需要多个adc芯片联合工作。但如果芯片间没有同步机制,多个麦克的数据会存在随机的相位差,将严重影响麦克风阵列算法的功能。而这种同步机制需要在芯片内部实现,目前市场上的adc芯片几乎不具备这个功能。
因此,需要一种能够使多个芯片同步工作,把系统扩展到任意多个麦克风阵列,同时比采用单芯片多adc的方案成本更低的可扩展麦克风阵列及其建立方法。
发明内容
为了解决上述问题,本发明的目的在于提供一种可扩展麦克风阵列的建立方法,包括以下步骤:
步骤一:设置主芯片,其他为从芯片,所述主芯片通过gpio(通用输入/输出接口)的方式来控制所有从芯片的adc(模数转换器)同步采样;
步骤二:同步采样后,由单个芯片单独完成麦克风信号的降噪和回音消除,然后将数据级联传送到主芯片统一进行波束形成算法处理;或者同步采样后,单个芯片单独完成双麦克信号的降噪、回音消除和波束形成算法,再将单个芯片处理后的数据级联传送到主芯片,由主芯片再次进行处理;
步骤三:将主芯片的处理结果传送至云端实现相关功能。
其中,步骤一中所述gpio的方式具体步骤为:
首先:由系统软件从多个芯片中选择一个芯片并设置其为主芯片,设置其它芯片为从芯片;所述主芯片包括一个sync trigger(同步触发)接口,所述sync trigger接口通过导线同时并联连接到所有的从芯片,即所述从芯片通过sync trigger接口与主芯片并行连接;
然后,由主芯片发出控制信号,统一控制所有从芯片的麦克风同时开始采数;其中,所述控制信号为一个低电平到高电平的阶跃信号;具体过程为:所述主芯片通过synctrigger接口发出一个由低变高的上升沿信号,其他所有从芯片检测所述上升沿信号,检测到后,立刻打开从芯片内部的adc工作;其中采样的时钟很高,可认为所有从芯片同时看到上升沿,同时打开adc,即所有从芯片收到的麦克风信号是同时开始的,从而保证所有从芯片采集的多路音频数据的相位保持固定关系;本发明采用所述gpio同步的方式同步采样,可保持采集的多路adc数据相位差在1us以内。
其中,步骤二中每个芯片同步采数后,完成麦克风信号的降噪和回音消除,然后将处理后的麦克风信号级联传送到主芯片统一进行波束形成算法处理,能够实现有效分散系统开销,降低整个系统的负荷。
优选地,步骤二中每个芯片同步采数后,单独运行降噪、回音消除和波束形成算法,然后将数据级联传送到主芯片统一进行再次处理实现分布式计算,能够实现有效分散系统开销,降低整个系统的负荷。
其中,步骤二中各个从芯片之间通过数据传输接口进行串行连接,单个芯片处理后的音频数据,通过芯片间的所述数据传输接口,采用自定义的数据传送格式级联传送至主芯片,最后由主芯片统一完成最终的处理;
优选地,所述波束成形算法为常用的MVDR算法,MVDR是一种基于最大信噪比(SINR)准则的自适应波束形成算法。
优选地,所述芯片间的数据传输接口为i2s/spdif/sdio/uart。
优选地,所述自定义的数据传送格式为自定义的header格式。
步骤三中,主芯片将最终处理结果输送至云端实现相关功能,例如实现语音识别的功能。
根据本发明的另一方面,还提供一种可扩展麦克风阵列,包括N个芯片以及2N个麦克风,所述每个芯片包括至少两个adc,每个adc连接1个麦克风,即每个芯片通过导线连接有2个麦克风;相邻麦克风的距离为4cm,且不超过10cm,从而保证多路麦克风间足够的相位区分度;
其中,设置第N个芯片为主芯片,其他为从芯片,所述N为大于等于1的正整数;主芯片包括一个sync trigger接口,所述sync trigger接口通过导线同时并联连接到所有的从芯片,即所述从芯片通过数据传输接口与主芯片并行连接,从而保证所述主芯片通过gpio方式同步触发其他所有芯片同时开始采数;各个从芯片之间通过数据传输接口进行串行连接,所述从芯片的运算数据通过所述数据传输接口级联传送到所述主芯片。
优选地,所述麦克风采用的排列方式为线性排列或环形排列;所述麦克风用于采集空中声音的位置,麦克风之间的距离为拾音的距离,决定各路音频数据的相位关系,麦克风之间的距离越大,阵列拾音的能力越强,但麦克风之间的距离不能超过信号波长的一半。
优选地,所述芯片可选择包含2个、4个或8个adc的芯片。
本发明的一种可扩展麦克风阵列的有益效果是:
1、通过主芯片的gpio信号统一控制多芯片间麦克风同步采数,可使多个芯片同步工作,并且保证相位一致。
2、每个芯片单独完成双麦克的去噪和波束形成算法,实现分布式计算,算法扩展性好。
3、采用多芯片级联的可扩展模式,可扩至任意路麦克风,可扩展性好。
4、相比于单芯片的多路adc,多芯片的联合同步工作成本更低,运算能力更强。
应当理解,前述大体的描述和后续详尽的描述均为示例性说明和解释,并不应当用作对本发明所要求保护内容的限制。
附图说明
参考随附的附图,本发明更多的目的、功能和优点将通过本发明实施方式的如下描述得以阐明,其中:
图1示出了本发明的优选实施例以2个芯片4个麦克风阵列系统框图。
图2示出了本发明的优选实施例以4个芯片8个麦克风阵列系统框图。
图3示出了扩展至任意多个麦克风的结构框图,同时展示了同步触发机制以及数据传输接口。
图4(a)示出了本发明以2个芯片4个麦克风阵列的方案中4mic录到的原始音频信息;图4(b)示出了本发明以2个芯片4个麦克风阵列的方案中4mic录到的原始音频信息经过多麦克降噪算法后得到的音频。
具体实施方式
通过参考示范性实施例,本发明的目的和功能以及用于实现这些目的和功能的方法将得以阐明。然而,本发明并不受限于以下所公开的示范性实施例;可以通过不同形式来对其加以实现。说明书的实质仅仅是帮助相关领域技术人员综合理解本发明的具体细节。
在下文中,将参考附图描述本发明的实施例。在附图中,相同的附图标记代表相同或类似的部件,或者相同或类似的步骤。
实施例1
以2个芯片组成4个麦克风阵列为例,系统框图如图1所示。
一种可扩展麦克风阵列,包括2个芯片以及4个麦克风,所述每个芯片包括两个adc,每个adc接1个麦克风,即每个芯片通过导线连接有2个麦克风;
所述麦克风之间的距离为4cm,且不超过10cm,从而保证多路麦克风间足够的相位区分度;其中,所述麦克风之间采用线性排列的方式,所述麦克风之间的距离为拾音的距离,决定各路音频数据的相位关系,麦克风之间的距离越大,阵列拾音的能力越强,但麦克风之间的距离不能超过信号波长的一半。
所述步骤一中,设置第1个芯片为主芯片,其他为从芯片,主芯片包括一个synctrigger接口,所述sync trigger接口可通过导线同时并联连接到所有的从芯片,各个从芯片之间通过数据传输接口进行串行连接,所述从芯片通过数据传输接口与主芯片并行连接;所述主芯片通过gpio方式可同步触发其他所有芯片同时开始采数,具体过程为:通过主芯片N的sync trigger接口,发出一个由低变高的上升沿信号,其它所有的从芯片检测这个上升沿,检测到后,立刻打开内部的adc工作。其中采样的时钟很高,即可认为所有从芯片同时看到上升沿,同时打开adc,所有从芯片收到的麦克风信号是同时开始的,从而具有固定的相位差。
步骤二中,各个从芯片之间通过数据传输接口进行串行连接,每个芯片同步采数后,完成麦克风信号的降噪和回音消除;单个芯片处理后的音频数据,通过芯片间的所述数据传输接口,采用自定义的数据传送格式级联传送至主芯片,最后由主芯片统一进行波束形成处理,并得到最终处理结果;具体为:每个单独的芯片对采集到的数据进行回波消除,即利用参考源信号预测出回声,再从收集的麦克风信号中消除回声,然后将单独芯片处理后的麦克风信号级联传送到主芯片,在主芯片上首先确定声源的方向信息,进而通过波束成形算法来增强目标方向的声音,消除环境噪声。本发明能够实现有效分散系统开销,降低整个系统的负荷。
其中,两个芯片之间级联传送采用spdif数据传输接口,用户可根据需要任意选择,需要传输的数据包括音频数据、控制信息以及分布式运算的结果等;所述波束成形算法为常用的MVDR方法;所述自定义的数据传送格式为自定义的header格式。
具体地,所述Header的格式如下:
Header_id是header开头;chan num表示有几路音频数据;audio_len是音频数据的长度;info_len是其它补充信息的长度;audio_sample是音频数据;info是补充信息数据。
步骤三中:各个从芯片的经过处理的信号经过spdif数据传输接口级联传送到主芯片,主芯片将最终处理结果输送至云端实现相关功能,例如实现语音识别的功能。
根据本发明的另一个方面,本实施例的步骤二还包括以下情形,各个芯片同步采数后,单独运行降噪、回音消除和波束形成算法,然后将数据级联传送到主芯片统一进行再次处理,本系统可实现分布式计算,能够实现有效分散系统开销,降低整个系统的负荷。
实施例2
一种可扩展麦克风阵列,包括4个芯片以及8个麦克风,每个芯片支持2个麦克风,系统框图如图2所示。其中所述每个芯片包括两个adc,每个adc接1个麦克风,即每个芯片通过导线连接有2个麦克风。
所述相邻麦克风之间的距离为4cm,且不超过10cm,从而保证多路麦克风间足够的相位区分度;其中,所述麦克风之间采用线性排列的方式,所述麦克风之间的距离为拾音的距离,决定各路音频数据的相位关系,麦克风之间的距离越大,阵列拾音的能力越强,但麦克风之间的距离不能超过信号波长的一半。
参见图2,步骤一中,系统设置第3个芯片为主芯片,主芯片3包括一个synctrigger接口,所述主芯片3的所述sync trigger接口通过导线同时并联连接到所有的从芯片,即所述从芯片通过sync trigger接口与主芯片并行连接;
所述主芯片3通过gpio方式同步触发其他所有从芯片同时开始采数,具体过程为:通过主芯片3的sync trigger接口,发出一个由低变高的上升沿信号,从芯片1、2、4检测这个上升沿,检测到后,立刻打开从芯片内部的adc工作。其中采样的时钟很高,即可认为所有从芯片同时看到上升沿,同时打开adc,所有从芯片收到的麦克风信号是同时开始的,从而具有固定的相位差。
步骤二中,每个芯片同步采数后,可单独运行降噪、回音消除和beamforming算法,实现分布式计算;单个芯片处理后的音频数据,通过芯片间的所述数据传输接口,采用自定义的数据传送格式级联传送至主芯片,最后由主芯片统一进行再次处理,并得到最终处理结果;具体处理过程为:各个从芯片之间通过数据传输接口进行串行连接,每个芯片同步采数后,利用参考源信号预测出回声,再从收集的麦克风信号中消除回声,然后确定声源的方向信息,进而通过波束成形算法来增强目标方向的声音,消除环境噪声;最后将单个芯片处理后的音频数据级联传送至主芯片,最后由主芯片统一进行再次处理,并得到最终处理结果,本发明每个芯片单独完成双麦克的去噪、回音消除和波束形成算法,实现分布式计算的结构,能够实现有效分散系统开销,降低整个系统的负荷。
其中,两个芯片之间级联传送采用spdif数据传输接口,用户可根据需要任意选择,需要传输的数据包括音频数据、控制信息以及分布式运算的结果等;所述波束成形算法为常用的MVDR方法;所述自定义的数据传送格式为自定义的header格式。
步骤三中,各个从芯片的经过处理的信号经过spdif数据传输接口级联传送到主芯片,主芯片将最终处理结果输送至云端实现相关功能,例如实现语音识别的功能。
实施例3
组成16麦克或32麦克的系统采样类似的方式,图3示出了扩展至任意多个麦克风的结构框图,同时展示了同步触发机制以及数据传输接口。
其中,步骤一中的同步触发机制具体为:选择芯片N作为主芯片,其他为从芯片,所述主芯片N通过gpio方式可同步触发其他所有芯片同时开始采数;其中,每个芯片至少连接两路麦克风,通过多个芯片的级联,可扩展任意路麦克风。
其中,所述主芯片N包括一个sync trigger接口,所述sync trigger接口通过导线同时并联连接到所有的从芯片,即所述从芯片通过sync trigger接口与主芯片并行连接。其中,采用gpio方式同步采数的具体步骤为:主芯片N通过sync trigger接口,发出一个由低变高的上升沿信号,所有从芯片检测所述上升沿信号,检测到所述上升沿信号后,立刻打开所述从芯片内部的adc工作;其中采样的时钟很高,可认为所有从芯片同时看到上升沿,同时打开adc,所有从芯片收到的麦克风信号是同时开始的,从而保证具有固定的相位差。
步骤二中各个从芯片之间通过数据传输接口进行串行连接,每个芯片同步采数后,完成麦克风信号的降噪和回音消除,单个芯片处理后的音频数据,通过芯片间的所述数据传输接口,采用自定义的数据传送格式级联传送至主芯片,最后由主芯片统一完成波束形成算法,并得到最终处理结果;所述波束成形算法为常用的MVDR方法。所述芯片间的数据传输接口为sdio。所述自定义的数据传送格式为自定义的header格式。
根据本发明的两一个方面,步骤二中每个芯片同步采数后,单独运行降噪、回音消除和波束形成算法,然后将数据级联传送到主芯片统一进行再次处理,得到最终处理结果;每个芯片单独完成降噪、回音消除以及波束形成算法,实现分布式计算的结构,运算能力更强,算法扩展性好,能够有效分散系统开销,降低整个系统的负荷。
步骤三中,主芯片得到最终处理结果,并将该最终处理结果传送至云端实现相关功能,例如实现语音识别的功能。
参见图4(a)、图4(b),本发明以2个芯片4个麦克的方案进行实验验证,其中图4(a)为4mic录到的原始音频信息,可以看到噪声很大;图4(b)为经过多麦克降噪算法后得到的音频,可以看到噪声明显降低。实验说明:消噪的效果好,进一步验证了步骤一中多芯片gpio trigger方式工作正确,各路信号的相位固定,因此算法结果有效。
本发明提供一种多芯片间同步采样机制,通过一个gpio来控制多个芯片的adc同步采样,保证了多路adc数据的相位差在1μs以内,多个芯片同步工作;每个芯片单独完成双麦克的降噪、回升消除或者降噪、回升消除以及波束形成算法,能够有效分散系统开销,降低整个系统的负荷;单个芯片处理后的音频数据通过芯片间的数据接口级联传送到主芯片完成麦克风阵列的算法处理,通过级联把系统扩展到任意多个麦克风阵列,同时使用多芯片组成麦克风阵列,比采用单芯片多adc的方案成本更低,扩展性也更灵活。
结合这里披露的本发明的说明和实践,本发明的其他实施例对于本领域技术人员都是易于想到和理解的。说明和实施例仅被认为是示例性的,本发明的真正范围和主旨均由权利要求所限定。
Claims (8)
1.一种可扩展麦克风阵列的建立方法,包括以下步骤:
步骤一:设置主芯片,其他为从芯片,所述主芯片通过通用输入/输出的方式来控制所有从芯片的模数转换器同步采样;
步骤二:同步采样后,由单个芯片单独完成麦克风信号的降噪和回音消除,然后将数据级联传送到主芯片统一进行波束形成算法处理,得到最终处理结果;或者同步采样后,单个芯片单独完成双麦克信号的降噪、回音消除和波束形成算法,然后将单个芯片处理后的数据级联传送到主芯片,由主芯片再次进行处理,得到最终处理结果;
步骤三:将主芯片的最终处理结果传送至云端实现相关功能。
2.根据权利要求1所述的可扩展麦克风阵列的建立方法,其特征在于,步骤一中所述通用输入/输出的方式具体步骤为:
S1:由系统软件从多个芯片中选择一个芯片并设置其为主芯片,设置其它芯片为从芯片;所述主芯片包括一个同步触发接口,所述从芯片通过同步触发接口与主芯片并行连接;
S2:所述主芯片通过同步触发接口发出一个由低变高的上升沿信号,其他所有从芯片检测所述上升沿信号,检测到后,立刻打开从芯片内部的模数转换器工作,从而保证采集的多路模数转换器数据相位差在1us以内。
3.根据权利要求1所述的可扩展麦克风阵列的建立方法,其特征在于,步骤二中各个从芯片之间通过数据传输接口进行串行连接,单个芯片处理后的音频数据,通过芯片间的所述数据传输接口,采用自定义的数据传送格式级联传送至主芯片,最后由主芯片统一完成最终的处理。
4.根据权利要求1所述的可扩展麦克风阵列的建立方法,其特征在于,所述波束成形算法为常用的MVDR方法。
5.根据权利要求3所述的可扩展麦克风阵列的建立方法,其特征在于,所述芯片间的数据传输接口为i2s/spdif/sdio/uart,所述自定义的数据传送格式为自定义的header格式。
6.一种可扩展麦克风阵列,其特征在于:包括N个芯片以及2N个麦克风,所述每个芯片包括至少两个adc,每个adc连接1个麦克风;
设置第N个芯片为主芯片,其他为从芯片,所述N为大于等于1的正整数;主芯片包括一个同步触发接口,所述从芯片通过同步触发接口与主芯片并行连接,各个从芯片之间通过数据传输接口进行串行连接,所述从芯片的运算数据通过所述数据传输接口级联传送到所述主芯片。
7.根据权利要求6所述的可扩展麦克风阵列,其特征在于,所述麦克风用于采集空中声音的位置,麦克风之间的距离不能超过信号波长的一半,相邻麦克风的距离为4cm,且不超过10cm,从而保证多路麦克风间足够的相位区分度。
8.根据权利要求6所述的可扩展麦克风阵列,其特征在于,所述麦克风采用的排列方式为线性排列或环形排列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710908924.5A CN107889001B (zh) | 2017-09-29 | 2017-09-29 | 可扩展麦克风阵列及其建立方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710908924.5A CN107889001B (zh) | 2017-09-29 | 2017-09-29 | 可扩展麦克风阵列及其建立方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107889001A true CN107889001A (zh) | 2018-04-06 |
CN107889001B CN107889001B (zh) | 2020-02-18 |
Family
ID=61781038
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710908924.5A Active CN107889001B (zh) | 2017-09-29 | 2017-09-29 | 可扩展麦克风阵列及其建立方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107889001B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109660933A (zh) * | 2019-01-30 | 2019-04-19 | 北京视通科技有限公司 | 一种同时传输多路模拟音频的装置 |
CN110361695A (zh) * | 2019-06-06 | 2019-10-22 | 浙江省北大信息技术高等研究院 | 分置式声源定位系统和方法 |
CN111630876A (zh) * | 2019-01-07 | 2020-09-04 | 深圳声临奇境人工智能有限公司 | 音频设备和音频处理方法 |
EP3739443A1 (en) * | 2019-05-16 | 2020-11-18 | Beijing Xiaomi Mobile Software Co., Ltd. | Method and device for configuring controller in master control chip |
CN112562681A (zh) * | 2020-12-02 | 2021-03-26 | 腾讯科技(深圳)有限公司 | 语音识别方法和装置、存储介质 |
CN113014348A (zh) * | 2021-02-24 | 2021-06-22 | 阿里巴巴集团控股有限公司 | 分布式音频传输系统、音频主控电路及音频控制设备 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0591588A (ja) * | 1991-09-27 | 1993-04-09 | Railway Technical Res Inst | 指向方向可変指向性収音装置 |
US5581036A (en) * | 1993-05-24 | 1996-12-03 | Medison Co., Ltd. | Bandwidth sampling technique for digital focusing in array imaging systems |
CN1963916A (zh) * | 2005-11-09 | 2007-05-16 | 赫扬科技股份有限公司 | 声音输入阵列集音装置 |
US20080247567A1 (en) * | 2005-09-30 | 2008-10-09 | Squarehead Technology As | Directional Audio Capturing |
CN102347028A (zh) * | 2011-07-14 | 2012-02-08 | 瑞声声学科技(深圳)有限公司 | 双麦克风语音增强装置及方法 |
US20120148067A1 (en) * | 2008-12-05 | 2012-06-14 | Audioasics A/S | Wind noise detection method and system |
CN202794508U (zh) * | 2012-09-07 | 2013-03-13 | 南京理工大学 | 应用于救援的基于麦克风阵列的语音定位装置 |
CN103108271A (zh) * | 2011-11-14 | 2013-05-15 | 美国亚德诺半导体公司 | 具有菊花链式累加的麦克风阵列 |
CN104950770A (zh) * | 2015-06-24 | 2015-09-30 | 中国船舶重工集团公司第七二六研究所 | 可控的高速多通道信号采集控制电路系统及其控制方法 |
JP2016100787A (ja) * | 2014-11-21 | 2016-05-30 | パナソニックIpマネジメント株式会社 | 収音装置 |
CN205352443U (zh) * | 2015-11-13 | 2016-06-29 | 河南理工大学 | 一种矿用便携式仪器数据采集电路板 |
-
2017
- 2017-09-29 CN CN201710908924.5A patent/CN107889001B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0591588A (ja) * | 1991-09-27 | 1993-04-09 | Railway Technical Res Inst | 指向方向可変指向性収音装置 |
US5581036A (en) * | 1993-05-24 | 1996-12-03 | Medison Co., Ltd. | Bandwidth sampling technique for digital focusing in array imaging systems |
US20080247567A1 (en) * | 2005-09-30 | 2008-10-09 | Squarehead Technology As | Directional Audio Capturing |
CN1963916A (zh) * | 2005-11-09 | 2007-05-16 | 赫扬科技股份有限公司 | 声音输入阵列集音装置 |
US20120148067A1 (en) * | 2008-12-05 | 2012-06-14 | Audioasics A/S | Wind noise detection method and system |
CN102347028A (zh) * | 2011-07-14 | 2012-02-08 | 瑞声声学科技(深圳)有限公司 | 双麦克风语音增强装置及方法 |
CN103108271A (zh) * | 2011-11-14 | 2013-05-15 | 美国亚德诺半导体公司 | 具有菊花链式累加的麦克风阵列 |
CN202794508U (zh) * | 2012-09-07 | 2013-03-13 | 南京理工大学 | 应用于救援的基于麦克风阵列的语音定位装置 |
JP2016100787A (ja) * | 2014-11-21 | 2016-05-30 | パナソニックIpマネジメント株式会社 | 収音装置 |
CN104950770A (zh) * | 2015-06-24 | 2015-09-30 | 中国船舶重工集团公司第七二六研究所 | 可控的高速多通道信号采集控制电路系统及其控制方法 |
CN205352443U (zh) * | 2015-11-13 | 2016-06-29 | 河南理工大学 | 一种矿用便携式仪器数据采集电路板 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111630876A (zh) * | 2019-01-07 | 2020-09-04 | 深圳声临奇境人工智能有限公司 | 音频设备和音频处理方法 |
CN111630876B (zh) * | 2019-01-07 | 2021-08-13 | 深圳声临奇境人工智能有限公司 | 音频设备和音频处理方法 |
CN109660933A (zh) * | 2019-01-30 | 2019-04-19 | 北京视通科技有限公司 | 一种同时传输多路模拟音频的装置 |
EP3739443A1 (en) * | 2019-05-16 | 2020-11-18 | Beijing Xiaomi Mobile Software Co., Ltd. | Method and device for configuring controller in master control chip |
US11086799B2 (en) | 2019-05-16 | 2021-08-10 | Beijing Xiaomi Mobile Software Co., Ltd. | Method and device for configuring controller in master control chip |
CN110361695A (zh) * | 2019-06-06 | 2019-10-22 | 浙江省北大信息技术高等研究院 | 分置式声源定位系统和方法 |
CN112562681A (zh) * | 2020-12-02 | 2021-03-26 | 腾讯科技(深圳)有限公司 | 语音识别方法和装置、存储介质 |
CN112562681B (zh) * | 2020-12-02 | 2021-11-19 | 腾讯科技(深圳)有限公司 | 语音识别方法和装置、存储介质 |
CN113014348A (zh) * | 2021-02-24 | 2021-06-22 | 阿里巴巴集团控股有限公司 | 分布式音频传输系统、音频主控电路及音频控制设备 |
Also Published As
Publication number | Publication date |
---|---|
CN107889001B (zh) | 2020-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107889001A (zh) | 可扩展麦克风阵列及其建立方法 | |
JP7186769B2 (ja) | 対象音声検出方法及び装置 | |
CN110010147B (zh) | 一种麦克风阵列语音增强的方法和系统 | |
CN104936091B (zh) | 基于圆形麦克风阵列的智能交互方法及系统 | |
CN111445920B (zh) | 一种多声源的语音信号实时分离方法、装置和拾音器 | |
CN106531179B (zh) | 一种基于语义先验的选择性注意的多通道语音增强方法 | |
EP1983799B1 (en) | Acoustic localization of a speaker | |
JP3521914B2 (ja) | 超指向性マイクロホンアレイ | |
WO2020151133A1 (zh) | 一种分布式麦克风阵列拾音系统及方法 | |
CN111429939B (zh) | 一种双声源的声音信号分离方法和拾音器 | |
CN107621625B (zh) | 基于双微麦克风阵的声源定位方法 | |
CN104424953A (zh) | 语音信号处理方法与装置 | |
CN110610718B (zh) | 一种提取期望声源语音信号的方法及装置 | |
WO2015039439A1 (zh) | 音频信号处理方法及装置、差分波束形成方法及装置 | |
CN105812969A (zh) | 一种拾取声音信号的方法、系统及装置 | |
CN205139359U (zh) | 一种基于fpga麦克风阵列室内声源定位系统 | |
Saruwatari et al. | Blind source separation combining frequency-domain ICA and beamforming | |
CN105451151A (zh) | 一种处理声音信号的方法及装置 | |
CN106226739A (zh) | 融合子带分析的双声源定位方法 | |
CN104412616A (zh) | 基于麦克风阵列中的声音的相关性的噪声抑制 | |
CN106992010B (zh) | 无直达声条件下的麦克风阵列语音增强装置 | |
CN111918169B (zh) | 基于多波束成形麦克风阵列的会议音箱及其声波拾取方法 | |
CN107465970A (zh) | 用于语音通信的设备 | |
JP2005227512A (ja) | 音信号処理方法及びその装置、音声認識装置並びにプログラム | |
JP4519901B2 (ja) | 目的音抽出装置,目的音抽出プログラム,目的音抽出方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 201306 room 904, No. 800, Huanhu West 2nd Road, Lingang New Area, China (Shanghai) pilot Free Trade Zone, Pudong New Area, Shanghai Applicant after: Hengxuan Technology (Shanghai) Co., Ltd Address before: 200135 Shanghai 647 free trade pilot area, 171 Pudong New Area Road, 1 buildings, 6 rooms Applicant before: Heng Xuan Technology (Shanghai) Co., Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |