CN106954136A - 一种集成麦克风接收阵列的超声定向发射参量阵 - Google Patents
一种集成麦克风接收阵列的超声定向发射参量阵 Download PDFInfo
- Publication number
- CN106954136A CN106954136A CN201710344828.2A CN201710344828A CN106954136A CN 106954136 A CN106954136 A CN 106954136A CN 201710344828 A CN201710344828 A CN 201710344828A CN 106954136 A CN106954136 A CN 106954136A
- Authority
- CN
- China
- Prior art keywords
- array
- speaker
- microphone
- signal
- processing unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000005540 biological transmission Effects 0.000 title claims abstract description 21
- 238000012545 processing Methods 0.000 claims abstract description 21
- 238000004458 analytical method Methods 0.000 claims abstract description 5
- 238000012549 training Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 2
- 241000209140 Triticum Species 0.000 claims 1
- 235000021307 Triticum Nutrition 0.000 claims 1
- 238000005516 engineering process Methods 0.000 description 8
- 238000000034 method Methods 0.000 description 6
- 238000003491 array Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000003472 neutralizing effect Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000002463 transducing effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
本发明公开一种集成麦克风接收阵列的超声定向发射参量阵,包括收发一体的麦克风换能器阵列、信号处理单元,麦克风换能器阵列与信号处理单元电连接,麦克风换能器阵列包括若干个换能器和麦克风,信号处理单元用于发射信号的预处理以及接收信号的分析。本发明适用于手机等便携式设备,通过定向发声以便保护用户在设备使用过程中的个人信息,并且不影响他人。
Description
技术领域
本发明涉及电子技术领域,尤其涉及一种集成麦克风接收阵列的超声定向发射参量阵。
背景技术
参量阵是一种非线性声源,它可以采用小孔径发射阵列生成具有尖锐指向性的低频声波。Westervelt在1963年首次提出了参量阵的理论模型。Berktay发展了Westervelt的研究,并在1965年提出了宽带参量阵的理论模型。
波束合成是参量阵研究的重要部分。在早期参量阵声呐中,探测信号波束一般被设计为指向固定方向,然后由机械方式完成波束偏转。随后电控波束偏转被应用于参量阵声呐设计,其有效的降低了目标的搜索与跟踪时间。类似的研究也开展在空气介质中,Tan等提出采用声相控阵技术实现电控波束偏转,并通过仿真验证了其可行性。随后,Shi与Gan完成了参量阵波束的电控偏转实验。
说话人识别技术,是一项根据语音中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术。说话人识别基于语音,既包含了人的生理特征即解剖学上存在的差异,又包含了人的行为特征即后天的发音习惯上的不同。
发明内容
本发明旨在提供一种集成麦克风接收阵列的超声定向发射参量阵,适用于手机等便携式设备,通过定向发声以便保护用户在设备使用过程中的个人信息,并且不影响他人。
为达到上述目的,本发明是采用以下技术方案实现的:
本发明公开的集成麦克风接收阵列的超声定向发射参量阵,包括收发一体的麦克风换能器阵列、信号处理单元,所述麦克风换能器阵列与信号处理单元电连接,麦克风换能器阵列包括若干个换能器和麦克风,所述信号处理单元用于发射信号的预处理以及接收信号的分析。
优选的,所述信号处理单元包括:
声频定向发射模块,用于对信号进行调制和放大,输出到后级换能器上通过电声转换发射定向超声波;
相控驱动模块,用于控制换能器阵列的各个单元信号相位,使得换能器阵列在本身无机械偏转的情况下产生声束的偏转。
优选的,所述信号处理单元还包括:
说话人定位模块,通过麦克风换能器阵列中的麦克风阵列接收来自说话人的语音,通过对各阵元接收到的信号进行相位分析和处理,对说话人进行定位。
进一步的,所述信号处理单元还包括:
说话人识别模块,从语音信号中提取说话人语音特征的模型并与事先训练好的模型库进行匹配以确认说话人身份。
优选的,所述麦克风换能器阵列为直线形、矩形、圆形、环形或椭圆形。
优选的,所述信号处理单元包括DSP或FPGA。
优选的,所述说话人识别模块包括说话人模型库、特征提取模块、模型训练模块、模型识别模块和逻辑决策模块,所述说话人模型库包括多个说话人模型。
说话人鉴别时,取其与测试语音匹配距离最小的模型所对应的说话人,作为说话人鉴别的结果。在说话人确认时,用测试音的模型与所声称的说话人的模型进行比较,若匹配距离小于一个规定的阀值,则该说话人得到确认,否则,该说话人不是他所声称的那个身份。
优选的,本发明还包括智能手机,所述说话人定位模块和/或说话人识别模块包含在智能手机中。
本发明的有益效果在于:换能器阵列和麦克风阵列集成到一起,减小了空间占用。另外,利用信号处理技术对麦克风阵列信号进行处理,识别并定位用户,使换能器能够自适应地根据用户位置发出定向声束。本发明不仅能保护用户隐私使其他人免于干扰,还能够根据用户位置实时调整声束,使得设备使用更加便捷。
附图说明
图1示出了应用于手机的集成麦克风阵列的超声定向换能器系统。
图2示出了集成麦克风阵列的换能器结构示意图;
图3示出了消除声反馈的原理;
图4示出了人声识别体系;
图5示出了声阵列信号处理的基本模型;
图6示出了声学数字相控阵技术的原理
图7示出了N阵元均匀线性阵列实现波束电控偏转的结构。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进行进一步详细说明。
图1所示为集成麦克风接收阵列的超声定向换能器系统,换能器阵列位于手机屏幕所在平面并与之平行。信号处理模块利用手机中的信号处理硬件平台向超声定向换能器输出激励信号并处理麦克风阵列的接收信号以识别和定位说话人。
图2示出了集成麦克风和超声定向参量阵的换能器阵列结构。换能器1分时接收或者发射。单一阵元的发射具有一定的指向性,当组成正方形阵列后,指向性得到增强,功率也随之增大。而四个小型麦克风2置于超声换能器旁以均匀线阵排列,大大减小系统整体所占空间,同时减小定位难度,提高精度。
由于阵元跟阵元之间的作用,会产生旁瓣。因此,在每个阵元发声外部,用一层多孔疏松的材料进行对活塞换能器的进一步传播整形。
图3示出了PEM-AFROW(Prediction Error Method based Adaptive Filteringwith Row Operations)算法消除声反馈的原理。由于麦克风阵列距离超声定向换能器较近,难免会接收到来自换能器的发声,影响麦克风对人声的识别定位。其中K为扩声增益;q-1是延时因子;q-d表示d个样本的延迟;为反馈补偿信号;是抵消滤波器;F是信号从传声器到扬声器(即换能器阵)传递的声反馈路径。
关于手机内部冲激响应F的滤波器系数向量f(n)可以用nF+1阶的有限脉冲响应FIR滤波器表示:
F(q,n)=fT(n)q=[f0(n)f1(n)…fnF(n)][q0q1…qnF]T
将估计得到的冲激响应系数值在满足一定条件下有规律地复制到抵消滤波器中。这样传声信号x(n)减去经过抵消滤波器滤波后的扬声器信号,得到的反馈补偿信号d(n)就应该等于声源信号s(n)。这里声源信号s(n)为nA阶的时变自回归模型。如下表示:
这里e(n)为理想白噪声激励序列,b(n)=1。
传递函数H(q,n)可以用无限脉冲响应IIR滤波器形式写出如下:
图4出了人声识别体系。说话人识别系统的逻辑框图如图,包括特征提取、模型训练、模式匹配、以及逻辑决策四个主要模块。特征提取模块处理单通道麦克风信号,从语音信号中提取说话人语音特征以便建立说话人语音特征模型。模型训练模块是指建立说话人模型的过程。说话人模型可以是单一的模板模型、矢量量化模型、高斯混合模型、隐马尔可夫模型、人工神经网络模型、支持向量机、动态贝叶斯网络以及它们的混合模型。不论什么模型,模型的参数估计和优化都在这一步骤完成。模式匹配模块将事先采集的测试音特征与说话人模型进行匹配,计算匹配距离。说话人确认时,只与所声称的说话人模型进行匹配;说话人鉴别时,与所有人的模型进行匹配。逻辑决策模块根据匹配距离的计算结果,判决说话人是否是所声称的说话人或说话人到底是谁。
图5示出了声阵列信号处理的基本模型。由于识别人声后后利用分频2D-MUSIC算法进行人声定位,分频2D-MUSIC算法是一种基于子空间分解的定位算法,在建立麦克风阵列理论模型时,与普通MUSIC算法不同,引入时间因子,在时域上进行分时,进而达到频域分频,以此推导出频谱及相应的位置信息受目标声源的相干性、平稳性及信号带宽影响更小。
图6示出了声学数字相控阵技术的原理示意图。以线性阵列发射单频原波为例,若各阵元所发射的原波传播至与实际发射阵列成θ0角度的虚拟平面位置时具有相同相位,整个阵列合成波束即可获得θ0角度的波束偏转。声学数字相控阵技术中通过对各阵元发射信号加载不同初相φi来满足上述要求,而初相φi则采用信号延时方法获得。
图7示出了N阵元均匀线性阵列实现波束电控偏转的结构示意图。该阵列形状条件下波束偏转时相邻阵元所发信号的初相间具有等值相差φ0。φ0由相邻阵元到虚拟平面的垂直距离差决定,有φ0=d·sin(θ0)/λ(d为相邻阵元间距,λ为发射信号波长)。当需要完成θo角度波束偏转时,第i个阵元的发射信号初相为(i-1)·φ0,而阵元i所需信号延时τi的计算公式如下:
对于一原波组而言,波束偏转时,其所属的原波具有相同的延时。如此对原波组施加时延τi后,同组各原波将同步完成θo角度的波束偏转。而基于图2所示的方形换能器阵列,根据期望发射方位,利用此法算出各阵元所需延时,即可实现波束偏转,达到调节发射声波方向的目的。
当然,本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。
Claims (8)
1.一种集成麦克风接收阵列的超声定向发射参量阵,其特征在于,包括收发一体的麦克风换能器阵列、信号处理单元,所述麦克风换能器阵列与信号处理单元电连接,麦克风换能器阵列包括若干个换能器和麦克风,所述信号处理单元用于发射信号的预处理以及接收信号的分析。
2.根据权利要求1所述的集成麦克风接收阵列的超声定向发射参量阵,其特征在于,所述信号处理单元包括:
声频定向发射模块,用于对信号进行调制和放大,输出到后级换能器上通过电声转换发射定向超声波;
相控驱动模块,用于控制换能器阵列的各个单元信号相位,使得换能器阵列在本身无机械偏转的情况下产生声束的偏转。
3.根据权利要求2所述的集成麦克风接收阵列的超声定向发射参量阵,其特征在于,所述信号处理单元还包括:
说话人定位模块,通过麦克风换能器阵列中的麦克风阵列接收来自说话人的语音,通过对各阵元接收到的信号进行相位分析和处理,对说话人进行定位。
4.根据权利要求2或3所述的集成麦克风接收阵列的超声定向发射参量阵,其特征在于,所述信号处理单元还包括:
说话人识别模块,从语音信号中提取说话人语音特征的模型并与事先训练好的模型库进行匹配以确认说话人身份。
5.根据权利要求1所述的集成麦克风接收阵列的超声定向发射参量阵,其特征在于,所述麦克风换能器阵列为直线形、矩形、圆形、环形或椭圆形。
6.根据权利要求1所述的集成麦克风接收阵列的超声定向发射参量阵,其特征在于,所述信号处理单元包括DSP或FPGA。
7.根据权利要求4所述的集成麦克风接收阵列的超声定向发射参量阵,其特征在于,所述说话人识别模块包括说话人模型库、特征提取模块、模型训练模块、模型识别模块和逻辑决策模块,所述说话人模型库包括多个说话人模型。
8.根据权利要求4所述的集成麦克风接收阵列的超声定向发射参量阵,其特征在于,还包括智能手机,所述说话人定位模块和/或说话人识别模块包含在智能手机中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710344828.2A CN106954136A (zh) | 2017-05-16 | 2017-05-16 | 一种集成麦克风接收阵列的超声定向发射参量阵 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710344828.2A CN106954136A (zh) | 2017-05-16 | 2017-05-16 | 一种集成麦克风接收阵列的超声定向发射参量阵 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106954136A true CN106954136A (zh) | 2017-07-14 |
Family
ID=59478785
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710344828.2A Pending CN106954136A (zh) | 2017-05-16 | 2017-05-16 | 一种集成麦克风接收阵列的超声定向发射参量阵 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106954136A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108307268A (zh) * | 2017-12-12 | 2018-07-20 | 深圳依偎控股有限公司 | 一种基于多麦克风的直播方法及直播设备 |
CN108769868A (zh) * | 2018-04-10 | 2018-11-06 | 华南理工大学 | 基于频分超声参量阵的手机屏下听筒实现方法与装置 |
WO2020151317A1 (zh) * | 2019-01-24 | 2020-07-30 | 平安科技(深圳)有限公司 | 语音验证方法、装置、计算机设备及存储介质 |
CN111665422A (zh) * | 2020-06-08 | 2020-09-15 | 郑州精铖电力设备有限公司 | 基于fpga的麦克风阵列非侵入式宽频声波实时成像检测系统 |
WO2021214313A1 (fr) * | 2020-04-23 | 2021-10-28 | Akoustic Arts | Enceinte acoustique directionnelle pour la communication confidentielle et attenuateur ultrasonore |
CN113791323A (zh) * | 2021-09-14 | 2021-12-14 | 南京土星视界科技有限公司 | 基于智能声纹识别技术的便携式异常放电超声检测装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070172076A1 (en) * | 2004-02-10 | 2007-07-26 | Kiyofumi Mori | Moving object equipped with ultra-directional speaker |
US20110091055A1 (en) * | 2009-10-19 | 2011-04-21 | Broadcom Corporation | Loudspeaker localization techniques |
US20140003622A1 (en) * | 2012-06-28 | 2014-01-02 | Broadcom Corporation | Loudspeaker beamforming for personal audio focal points |
CN104782146A (zh) * | 2012-11-14 | 2015-07-15 | 高通股份有限公司 | 用于表示物理空间中的声音场的方法及设备 |
CN106054133A (zh) * | 2016-05-11 | 2016-10-26 | 北京地平线信息技术有限公司 | 远场声源定位系统和方法 |
-
2017
- 2017-05-16 CN CN201710344828.2A patent/CN106954136A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070172076A1 (en) * | 2004-02-10 | 2007-07-26 | Kiyofumi Mori | Moving object equipped with ultra-directional speaker |
US20110091055A1 (en) * | 2009-10-19 | 2011-04-21 | Broadcom Corporation | Loudspeaker localization techniques |
US20140003622A1 (en) * | 2012-06-28 | 2014-01-02 | Broadcom Corporation | Loudspeaker beamforming for personal audio focal points |
CN104782146A (zh) * | 2012-11-14 | 2015-07-15 | 高通股份有限公司 | 用于表示物理空间中的声音场的方法及设备 |
CN106054133A (zh) * | 2016-05-11 | 2016-10-26 | 北京地平线信息技术有限公司 | 远场声源定位系统和方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108307268A (zh) * | 2017-12-12 | 2018-07-20 | 深圳依偎控股有限公司 | 一种基于多麦克风的直播方法及直播设备 |
CN108769868A (zh) * | 2018-04-10 | 2018-11-06 | 华南理工大学 | 基于频分超声参量阵的手机屏下听筒实现方法与装置 |
WO2020151317A1 (zh) * | 2019-01-24 | 2020-07-30 | 平安科技(深圳)有限公司 | 语音验证方法、装置、计算机设备及存储介质 |
WO2021214313A1 (fr) * | 2020-04-23 | 2021-10-28 | Akoustic Arts | Enceinte acoustique directionnelle pour la communication confidentielle et attenuateur ultrasonore |
FR3109687A1 (fr) * | 2020-04-23 | 2021-10-29 | Akoustic Arts | Système Acoustique |
CN111665422A (zh) * | 2020-06-08 | 2020-09-15 | 郑州精铖电力设备有限公司 | 基于fpga的麦克风阵列非侵入式宽频声波实时成像检测系统 |
CN113791323A (zh) * | 2021-09-14 | 2021-12-14 | 南京土星视界科技有限公司 | 基于智能声纹识别技术的便携式异常放电超声检测装置 |
CN113791323B (zh) * | 2021-09-14 | 2023-09-19 | 南京土星视界科技有限公司 | 基于智能声纹识别技术的便携式异常放电超声检测装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106954136A (zh) | 一种集成麦克风接收阵列的超声定向发射参量阵 | |
US10978088B2 (en) | Methods and systems for improved measurement, entity and parameter estimation, and path propagation effect measurement and mitigation in source signal separation | |
US10957336B2 (en) | Systems and methods for source signal separation | |
Yoshioka et al. | Multi-microphone neural speech separation for far-field multi-talker speech recognition | |
EP2749042B1 (en) | Processing signals | |
CN106448722A (zh) | 录音方法、装置和系统 | |
CN109712611A (zh) | 联合模型训练方法及系统 | |
JP2017516131A (ja) | 源信号分離における改良された測定、エンティティ及びパラメータ推定、及び経路伝播効果測定及び軽減のための方法及びシステム | |
CN206894872U (zh) | 一种集成麦克风接收阵列的超声定向发射参量阵 | |
JP2017516131A5 (zh) | ||
CN112513983A (zh) | 可穿戴系统语音处理 | |
CN110109058A (zh) | 一种平面阵列反卷积声源识别方法 | |
Ryan et al. | Application of near-field optimum microphone arrays to hands-free mobile telephony | |
CN107170462A (zh) | 基于mvdr的隐声方法 | |
Kim | Hearing aid speech enhancement using phase difference-controlled dual-microphone generalized sidelobe canceller | |
Shi et al. | Multi-beam design method for a steerable parametric array loudspeaker | |
Sarabia et al. | Spatial LibriSpeech: An Augmented Dataset for Spatial Audio Learning | |
Shi et al. | Design of a constant beamwidth beamformer for the parametric array loudspeaker | |
Geng et al. | A speech enhancement method based on the combination of microphone array and parabolic reflector | |
Gomez et al. | Robustness to speaker position in distant-talking automatic speech recognition | |
Buerger et al. | The spatial coherence of noise fields evoked by continuous source distributions | |
Al-Ali et al. | Enhanced forensic speaker verification performance using the ICA-EBM algorithm under noisy and reverberant environments | |
Chang et al. | Array-based underwater acoustic signal recognition | |
Nakano et al. | Directional acoustic source's position and orientation estimation approach by a microphone array network | |
US20220262357A1 (en) | System and method for data augmentation and speech processing in dynamic acoustic environments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20170714 |