CN111863019A - 干扰声源方向获取方法及系统、目标声源位置获取方法及系统、电子设备控制方法及系统 - Google Patents
干扰声源方向获取方法及系统、目标声源位置获取方法及系统、电子设备控制方法及系统 Download PDFInfo
- Publication number
- CN111863019A CN111863019A CN202010718914.7A CN202010718914A CN111863019A CN 111863019 A CN111863019 A CN 111863019A CN 202010718914 A CN202010718914 A CN 202010718914A CN 111863019 A CN111863019 A CN 111863019A
- Authority
- CN
- China
- Prior art keywords
- sound source
- interference
- acquired
- microphone array
- interfering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 89
- 230000002452 interceptive effect Effects 0.000 claims description 54
- 241000712899 Lymphocytic choriomeningitis mammarenavirus Species 0.000 claims description 16
- 230000001629 suppression Effects 0.000 claims description 15
- 230000003044 adaptive effect Effects 0.000 claims description 9
- 230000005540 biological transmission Effects 0.000 claims description 6
- 230000003595 spectral effect Effects 0.000 claims description 6
- 230000003993 interaction Effects 0.000 claims description 4
- 230000000694 effects Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 230000004807 localization Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000003491 array Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B17/00—Monitoring; Testing
- H04B17/30—Monitoring; Testing of propagation channels
- H04B17/309—Measuring or estimating channel quality parameters
- H04B17/318—Received signal strength
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/80—Services using short range communication, e.g. near-field communication [NFC], radio-frequency identification [RFID] or low energy communication
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computational Linguistics (AREA)
- Electromagnetism (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明揭示了一种干扰声源方向获取方法及系统、目标声源位置获取方法及系统、电子设备控制方法及系统,所述方法包括:步骤S1、干扰声源方向获取步骤;干扰声源与麦克风阵列通过蓝牙连接,从所述麦克风阵列通过蓝牙接收的数据中获取干扰声源的方向信息;步骤S2、在干扰方向形成零陷或者/并且增加约束条件,对干扰声源进行抑制。本发明提出的干扰声源方向获取方法及系统、目标声源位置获取方法及系统、电子设备控制方法及系统,可准确获知声源方向,精度高;同时可以简化麦克风阵列,成本低,功耗低。
Description
技术领域
本发明属于电子信息技术领域,涉及一种干扰声源方向获取方法及系统、目标声源位置获取方法及系统、电子设备控制方法及系统。
背景技术
麦克风阵列是由一定数目的麦克风组成,对声场的空间特性进行采样并滤波的系统,基于麦克风阵列进行声源定位和语音降噪已经得到了广泛的应用。
然而,现有麦克风阵列仅使用麦克风阵列难以分离期望信号和干扰声源,为了提高麦克风阵列的定位精度,通常需要使用大量的麦克风,系统成本高,功耗大。
在实际应用中,很多电视配备的遥控器都部署了麦克风阵列进行拾音,因此,使用遥控器对智能电视进行操控,会越来越多依靠语音来进行。通过麦克风阵列的声源定位技术识别声源,并根据声音信号自动进行降噪处理,而后通过语音识别电视机开始执行命令。但是,在基于麦克风阵列进行声源定位的过程中,较难从电视机自身的声音(如电视节目中的人物对话),准确地定位出电视机应该接收的命令声源的方向,导致电视机无法准确的做出反应。
在电视遥控器这个场景中,基于麦克风阵列进行声源定位存在如下缺点:
(1)由于声波波长较长,并且实际产品尺寸较小,这样就导致麦克风的数量和间距受到限制,波束宽度无法做窄,空间分辨率差=>定位准确度不高;使用无线技术,可以在相同的尺寸下做到更高的定位精度;
(2)在实际应用中,无法从电视机自身的声音(如电视节目中的人物对话),其他人发出的声音以及其他噪声中,准确地分辨出电视机应该接收到的命令声源的方向,因而电视机无法准确的做出反应。
在现有麦克风阵列的另一种使用场景中,会议系统使用高指向性阵列(麦克风数量更多,麦克风之间间距更大,算法更复杂)(窄波束)进行说话人方向辨识和指向,这种情况下对指向估计的准确度要求很高。如果空间存在很强的音频干扰时(可能是投影仪或者其它设备在播放一段资料),影响声源定位的准确度,(如果阵列的波束很窄,当定位存在微小误差时)一旦指向错误反而抑制了当前说话人方向的信号。如果多麦克风阵列和干扰声源能够加入蓝牙设备使用其角度测量功能,能够准确识别出干扰方向,在滤除干扰声源的基础上就能更好地进行说话人定位和波束成形。该使用场景下,麦克风数量多,波束窄,指向性更好;麦克风间距大,波束窄,指向性更好;但更窄就需要声源估计更加准确,对误差就更敏感。
有鉴于此,如今迫切需要设计一种新的麦克风阵列控控制方式,以便克服现有麦克风阵列控控制方式存在的上述至少部分缺陷。
发明内容
本发明提供一种麦克风阵列控制方法及系统,可准确获知声源方向,精度高;同时可以简化麦克风阵列,成本低,功耗低。
为解决上述技术问题,根据本发明的一个方面,采用如下技术方案:
一种干扰声源方向获取方法,所述方法包括:
干扰声源与麦克风阵列通过蓝牙连接,从所述麦克风阵列通过蓝牙测向功能获取干扰声源的方向信息。
作为本发明的一种实施方式,所述方法进一步包括:干扰声源声音强度获取步骤;干扰声源与麦克风阵列通过蓝牙连接,使用蓝牙交互获取干扰声源音量信息。
作为本发明的一种实施方式,所述方法具体包括:
干扰声源的蓝牙模块通过广播或已建立的连接将音量信息传输给麦克风阵列上的蓝牙模块;
麦克风阵列上的蓝牙模块测量接收信号强度RSSI;
用电磁波距离-衰减模型从接收信号强度反推出干扰声源的距离;
用声波距离-衰减模型计算出干扰声源在麦克风阵列位置上产生的声音强度。
根据本发明的另一个方面,采用如下技术方案:一种目标声源位置获取方法,所述方法包括:
步骤S1、包括上述的干扰声源方向获取方法;
步骤S2、在获取的声音中抑制所述步骤S1获取的干扰声源方向,或者,在获取的声源中排除所述步骤S1获取的干扰声源;进一步获取目标声源的信息。
作为本发明的一种实施方式,步骤S2中,在干扰方向形成零陷或者/并且增加约束条件,对干扰声源进行抑制。
作为本发明的一种实施方式,所述方法进一步包括:干扰声源声音强度获取步骤;
步骤S2中,根据声源的音量大小控制干扰信号方向的零陷深度和约束条件。
作为本发明的一种实施方式,所述步骤S2进一步包括:波束成形步骤;
波束成形步骤中,利用线性约束最小方差LCMV自适应波束形成器,通过增加干扰方向的约束条件滤除干扰信号;如果存在方向已知的干扰信号,则这些方向上有:
wHg(θi)=0,i=1,…,K
其中,g(θi),i=1,…,K为K个干扰方向的导向矢量,w为权向量,则
C=[g(θ0),g(θ1),…,g(θK)]
F=[10…0]
上式中g(θ0)为期望信号方向的导向矢量;此时,权向量表示为:
wLCMV=RyyC(CHRyyC)F
其中,Ryy为输出信号的功率谱密度,通过线性约束最小方差LCMV自适应波束形成器在期望声源无失真传输的条件下抑制干扰方向的信号,同时最小化噪声的输出功率。
根据本发明的又一个方面,采用如下技术方案:一种电子设备控制方法,所述方法包括:
上述目标声源位置获取方法;
步骤S3、根据步骤S2获取的目标声源发出的声音,并对获取的声音进行语音识别,通过识别结果对设定电子设备进行控制。
根据本发明的又一个方面,采用如下技术方案:一种控制方法,所述控制方法包括:
步骤S1、包括上述的干扰声源方向获取方法;
步骤S2、抑制步骤S1获取的干扰声源。
根据本发明的又一个方面,采用如下技术方案:一种控制方法,所述控制方法包括:
上述目标声源位置获取方法;
步骤S3、将麦克风阵列的波束指向目标声源方向。
根据本发明的又一个方面,采用如下技术方案:一种干扰声源方向获取系统,所述系统包括:
干扰声源,设有蓝牙模块;
麦克风阵列,设有蓝牙模块,所述干扰声源与麦克风阵列通过蓝牙连接;
干扰声源方向获取模块,用以从所述麦克风阵列通过蓝牙测向功能获取干扰声源的方向信息。
根据本发明的又一个方面,采用如下技术方案:一种目标声源位置获取系统,所述系统包括:
干扰声源方向获取模块,用以根据所述麦克风阵列通过蓝牙测向功能获取干扰声源的方向信息;
干扰声源抑制模块,用以在获取的声音中抑制所述干扰声源方向获取模块获取的干扰声源方向,或者,在获取的声源中排除所述干扰声源方向获取模块获取的干扰声源;进一步获取目标声源的信息。
作为本发明的一种实施方式,所述干扰声源抑制模块具体包括:
波束成形单元,用以完成波束成形;
所述波束成形单元利用线性约束最小方差LCMV自适应波束形成器,通过增加干扰方向的约束条件滤除干扰信号;如果存在方向已知的干扰信号,则这些方向上有:
wHg(θi)=0,i=1,…,K
其中,g(θi),i=1,…,K为K个干扰方向的导向矢量,w为权向量,则
C=[g(θ0),g(θ1),…,g(θK)]
F=[10…0]
上式中g(θ0)为期望信号方向的导向矢量;此时,权向量表示为:
wLCMV=RyyC(CHRyyC)F
其中,Ryy为输出信号的功率谱密度,通过线性约束最小方差LCMV自适应波束形成器可以在期望声源无失真传输的条件下抑制干扰方向的信号,同时最小化噪声的输出功率。
根据本发明的又一个方面,采用如下技术方案:一种电子设备控制系统,所述系统包括:
上述目标声源位置获取系统;
目标声源声音获取模块,用以利用所述目标声源位置获取系统获取的位置信息获取目标声源声音;
语音识别模块,用以对所述目标声源声音获取模块获取的声音进行语音识别;
控制模块,用以通过所述语音识别模块的识别结果对设定电子设备进行控制。
本发明的有益效果在于:本发明提出的干扰声源方向获取方法及系统、目标声源位置获取方法及系统、电子设备控制方法及系统,可准确获知声源方向,精度高;同时可以简化麦克风阵列,成本低,功耗低。
本发明提出的干扰声源方向获取方法及系统,相比传统方式更可靠,电磁波波长远远小于声波,能够提供更高的分辨率。
本发明提出的目标声源位置获取方法及系统、电子设备控制方法及系统,干扰声源位置和强度已知,可以简化算法设计,减少计算量,降低整个系统的功耗。
此外,本发明可以取得更简单的语音处理获得更好的处理效果。在定位出干扰声源的方向后,基于麦克风阵列设计空间滤波器,在干扰方向形成零陷或增加约束条件,并且能够根据声源的音量大小控制干扰信号方向的零陷深度和约束条件,能够更加直接的对干扰声源进行抑制,得到更纯净的输出语音。
附图说明
图1为本发明一实施例中目标声源位置获取方法的流程图。
图2为本发明一实施例中目标声源位置获取系统的组成示意图。
图3为本发明一实施例中目标声源位置获取方法的原理示意图(获取干扰声源方向)。
图4为本发明一实施例中目标声源位置获取方法的原理示意图(估计期望方向角度误差)。
图5为本发明一实施例中LCMV未添加干扰方向约束(60°)的效果示意图(抑制比为13dB)。
图6为本发明一实施例中LCMV添加干扰方向约束(60°)的效果示意图(抑制比超过30dB)。
具体实施方式
下面结合附图详细说明本发明的优选实施例。
为了进一步理解本发明,下面结合实施例对本发明优选实施方案进行描述,但是应当理解,这些描述只是为进一步说明本发明的特征和优点,而不是对本发明权利要求的限制。
该部分的描述只针对几个典型的实施例,本发明并不仅局限于实施例描述的范围。相同或相近的现有技术手段与实施例中的一些技术特征进行相互替换也在本发明描述和保护的范围内。
说明书中的“连接”既包含直接连接,也包含间接连接。
本发明揭示一种干扰声源方向获取方法,所述方法包括:干扰声源与麦克风阵列通过蓝牙连接,从所述麦克风阵列通过蓝牙测向功能获取干扰声源的方向信息。在一实施例中,可以利用蓝牙技术联盟(SIG)发布的蓝牙5.1标准中的测向功能检测蓝牙信号的方向。
在本发明的一实施例中,所述方法进一步包括:干扰声源声音强度获取步骤;干扰声源与麦克风阵列通过蓝牙连接,使用蓝牙交互获取干扰声源音量信息。
在本发明的一实施例中,所述方法具体包括:干扰声源的蓝牙模块通过广播或已建立的连接将音量信息传输给麦克风阵列上的蓝牙模块;麦克风阵列上的蓝牙模块测量接收信号强度RSSI;用电磁波距离-衰减模型从接收信号强度反推出干扰声源的距离;用声波距离-衰减模型计算出干扰声源在麦克风阵列位置上产生的声音强度。
本发明揭示了一种目标声源位置获取方法,图1为本发明一实施例中目标声源位置获取方法的流程图;请参阅图1,所述方法包括:
【步骤S1】干扰声源方向获取步骤;
干扰声源与麦克风阵列通过蓝牙连接,从所述麦克风阵列通过蓝牙测向功能获取干扰声源的方向信息。
在本发明的一实施例中,可以利用蓝牙技术联盟(SIG)发布的蓝牙5.1标准中的测向功能检测蓝牙信号的方向。当然,还可以获取干扰声源声音强度信息。
在一实施例中,所述方法具体包括:干扰声源的蓝牙模块通过广播或已建立的连接将音量信息传输给麦克风阵列上的蓝牙模块;麦克风阵列上的蓝牙模块测量接收信号强度RSSI;用电磁波距离-衰减模型从接收信号强度反推出干扰声源的距离;用声波距离-衰减模型计算出干扰声源在麦克风阵列位置上产生的声音强度。
【步骤S2】在获取的声音中抑制所述步骤S1获取的干扰源方向,或者,在获取的声源中排除所述步骤S1获取的干扰声源;进一步获取目标声源的信息。
在本发明的一实施例中,在干扰方向形成零陷或者/并且增加约束条件,对干扰声源进行抑制。在一实施例中,所述方法还可以包括:干扰源声音强度获取步骤;根据声源的音量大小控制干扰信号方向的零陷深度和约束条件。
在一实施例中,所述步骤S2进一步包括:波束成形步骤。波束成形步骤中,利用线性约束最小方差LCMV自适应波束形成器,通过增加干扰方向的约束条件滤除干扰信号;如果存在方向已知的干扰信号,则这些方向上有:
wHg(θi)=0,i=1,…,K;
其中,g(θi),i=1,…,K为K个干扰方向的导向矢量,w为权向量,则
C=[g(θ0),g(θ1),…,g(θK)]
F=[10…0]
上式中g(θ0)为期望信号方向的导向矢量;此时,权向量表示为:
wLCMV=RyyC(CHRyyC)F;
其中,Ryy为输出信号的功率谱密度,通过线性约束最小方差LCMV自适应波束形成器在期望声源无失真传输的条件下抑制干扰方向的信号,同时最小化噪声的输出功率。
在本发明的一实施例中,步骤S2中,在声源定位时,在使用基于波束扫描(Beamscan)的方法时,扫描时避让干扰所在方向;在使用基于空间谱(SpatialSpectrum)的方法时,根据空间谱寻找声源角度时避开干扰所在方向;在使用基于波束空间(Beamspace)的方法时,避让干扰所在子空间。
在本发明的一实施例中,波束成形步骤中,在已知干扰声音准确位置的情况下,波束成形包括:
设计空间滤波器时在干扰方向形成零陷;如果麦克风阵列设备和干扰声源设备能够有进一步的命令交互,还能根据声源的音量大小控制干扰信号方向的零陷深度;
在自适应波束成形器(AdaptiveBeamformer)最优化条件中增加干扰方向的约束条件;同样,在约束条件中也能根据声源的音量大小控制干扰信号方向的抑制深度。
本发明还揭示一种控制方法,在本发明的一实施例中,所述控制方法包括:
【步骤S1】干扰声源方向获取步骤;
干扰声源与麦克风阵列通过蓝牙连接,从所述麦克风阵列通过蓝牙测向功能获取干扰声源的方向信息。
【步骤S2】抑制步骤S1获取的干扰声源。
在本发明的一实施例中,在获取干扰声源方向后,直接抑制干扰声源,不估计目标声源。已知干扰声源位置和强度,零陷:直接设计空间滤波器(麦克风阵列波束成型器)抑制干扰方向,抑制的深度可以根据强度灵活控制(如果没有强度信息,也可以预设一个固定值,因此强度不是必要的信息,有强度信息之后可以更加智能),直接输出抑制后的声音,这种方向最简单、功耗低,适合计算力不高的(物联网)端设备。
本发揭示一种控制方法,在本发明的一实施例中,所述控制方法包括:
【步骤S1】干扰声源方向获取步骤;
干扰声源与麦克风阵列通过蓝牙连接,从所述麦克风阵列通过蓝牙测向功能获取干扰声源的方向信息。
【步骤S2】在获取的声音中抑制所述步骤S1获取的干扰源方向,或者,在获取的声源中排除所述步骤S1获取的干扰声源;进一步获取目标声源的信息。
【步骤S3】将麦克风阵列的波束指向目标声源方向。
在本发明的一实施例转换,可以估计、分辨目标声源后,再自适应将麦克风阵列的波束指向目标声源方向。获取干扰声源位置和强度后,可以在声音定位和分离时排除干扰源方向,算法更加稳定可靠。在获取干扰声源位置和强度后,也可以自适应波束成形。通过步骤S3抑制其他方向的噪声和干扰,提高有用信号的信噪比,能够提高后级处理模块的效果(比如语音设别的准确率)。
本发明进一步揭示一种电子设备控制方法,所述方法包括:
【步骤S1】干扰声源方向获取步骤;
干扰声源与麦克风阵列通过蓝牙连接,从所述麦克风阵列通过蓝牙测向功能获取干扰声源的方向信息。
【步骤S2】在获取的声音中抑制所述步骤S1获取的干扰源方向,或者,在获取的声源中排除所述步骤S1获取的干扰声源;进一步获取目标声源的信息。
【步骤S3】根据步骤S2获取的目标声源发出的声音,并对获取的声音进行语音识别,通过识别结果对设定电子设备进行控制。
所述电子设备控制方法中,步骤S1、步骤S2可以参阅以上有关干扰声源方向获取方法、目标声源位置获取方法中的描述,这里不做赘述。
本发明揭示一种干扰声源方向获取系统,所述系统包括:干扰声源、麦克风阵列及干扰声源方向获取模块。干扰声源设有蓝牙模块;麦克风阵列设有蓝牙模块,所述干扰声源与麦克风阵列通过蓝牙连接;干扰声源方向获取模块用以从所述麦克风阵列通过蓝牙测向功能获取干扰声源的方向信息。
本发明还揭示一种目标声源位置获取系统,图2为本发明一实施例中目标声源位置获取系统的组成示意图;请参阅图2,所述系统包括:干扰声源方向获取模块1及干扰声源抑制模块2。
干扰声源方向获取模块1用以根据所述麦克风阵列通过蓝牙蓝牙侧向获取干扰声源的方向信息;干扰声源抑制模块2用以在获取的声音中抑制所述干扰源方向获取模块1获取的干扰源方向,或者,在获取的声源中排除所述干扰源方向获取模块1获取的干扰声源;进一步获取目标声源的信息。在一实施例中,干扰声源抑制模块2用以在干扰方向形成零陷或者/并且增加约束条件,对干扰声源进行抑制。
在本发明的一实施例中,所述干扰声源抑制模块2包括声源定位单元21,声源定位单元21用以定位声源。
在本发明的一实施例中,所述干扰声源抑制模块2包括波束成形单元22。波束成形单元22用以完成波束成形。
在一实施例中,所述波束成形单元22利用线性约束最小方差LCMV自适应波束形成器,通过增加干扰方向的约束条件滤除干扰信号;如果存在方向已知的干扰信号,则这些方向上有:
wHg(θi)=0,i=1,…,K
其中,g(θi),i=1,…,K为K个干扰方向的导向矢量,w为权向量,则
C=[g(θ0),g(θ1),…,g(θK)]
F=[10…0]
上式中g(θ0)为期望信号方向的导向矢量;此时,权向量表示为:
wLCMV=RyyC(CHRyyC)F
其中,Ryy为输出信号的功率谱密度,通过线性约束最小方差LCMV自适应波束形成器可以在期望声源无失真传输的条件下抑制干扰方向的信号,同时最小化噪声的输出功率。
在本发明一种使用场景中,麦克风阵列可以更可靠地进行声源分离。在空间环境存在着很强的干扰声源时,仅利用麦克风阵列的声源定位很难识别出期望的语音声源和干扰声源的方向。如果发出干扰声源的设备和部署麦克风阵列的设备通过蓝牙技术连接,使用蓝牙定位功能识别出干扰音源方向,将干扰音源方向信息提供给麦克风阵列波束成形器,能够简化麦克风阵列的处理,得到更可靠的结果。
本发明可以更准确的干扰声源定位。麦克风阵列的指向性由阵元数目和阵元间距决定。当使用的阵元数目更多或间距更大时,阵列的指向性就越好。理论上,指向性越好,声源定位的准确度也就越高。实际产品的尺寸较小,而声波波长较长,麦克风的数量和间距受到限制,波束宽度无法做窄,空间分辨率(指向性)差,定位准确度自然不好。而使用无线技术,可以在相同的物理尺寸下,摆放更多的阵元,阵元间距也可以更大,借助无线的阵列处理可以做到更高的定位精度(如图3、图4所示)。
图5为本发明一实施例中LCMV未添加干扰方向约束(60°)的效果示意图,图6为本发明一实施例中LCMV添加干扰方向约束(60°)的效果示意图;请参阅图5、图6,图5中,抑制比为13dB;图6中,抑制比超过30dB。由此可见,利用本发明方案的抑制效果明显。
综上所述,本发明提出的干扰声源方向获取方法及系统、目标声源位置获取方法及系统、电子设备控制方法及系统,可准确获知声源方向,精度高;同时可以简化麦克风阵列,成本低,功耗低。
此外,本发明可以取得更简单的语音处理获得更好的处理效果。在定位出干扰声源的方向后,基于麦克风阵列设计空间滤波器,在干扰方向形成零陷或增加约束条件,并且能够根据声源的音量大小控制干扰信号方向的零陷深度和约束条件,能够更加直接的对干扰声源进行抑制,得到更纯净的输出语音。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
这里本发明的描述和应用是说明性的,并非想将本发明的范围限制在上述实施例中。实施例中所涉及的效果或优点可因多种因素干扰而可能不能在实施例中体现,对于效果或优点的描述不用于对实施例进行限制。这里所披露的实施例的变形和改变是可能的,对于那些本领域的普通技术人员来说实施例的替换和等效的各种部件是公知的。本领域技术人员应该清楚的是,在不脱离本发明的精神或本质特征的情况下,本发明可以以其它形式、结构、布置、比例,以及用其它组件、材料和部件来实现。在不脱离本发明范围和精神的情况下,可以对这里所披露的实施例进行其它变形和改变。
Claims (14)
1.一种干扰声源方向获取方法,其特征在于,所述方法包括:
干扰声源与麦克风阵列通过蓝牙连接,从所述麦克风阵列通过蓝牙测向功能获取干扰声源的方向信息。
2.根据权利要求1所述的干扰声源方向获取方法,其特征在于:
所述方法进一步包括:干扰声源声音强度获取步骤;干扰声源与麦克风阵列通过蓝牙连接,使用蓝牙交互获取干扰声源音量信息。
3.根据权利要求2所述的干扰声源方向获取方法,其特征在于:
所述方法具体包括:
干扰声源的蓝牙模块通过广播或已建立的连接将音量信息传输给麦克风阵列上的蓝牙模块;
麦克风阵列上的蓝牙模块测量接收信号强度RSSI;
用电磁波距离-衰减模型从接收信号强度反推出干扰声源的距离;
用声波距离-衰减模型计算出干扰声源在麦克风阵列位置上产生的声音强度。
4.一种目标声源位置获取方法,其特征在于,所述方法包括:
步骤S1、包括权利要求1至4任一所述的干扰声源方向获取方法;
步骤S2、在获取的声音中抑制所述步骤S1获取的干扰声源方向,或者,在获取的声源中排除所述步骤S1获取的干扰声源;进一步获取目标声源的信息。
5.根据权利要求4所述的目标声源位置获取方法,其特征在于:
步骤S2中,在干扰方向形成零陷或者/并且增加约束条件,对干扰声源进行抑制。
6.根据权利要求4所述的目标声源位置获取方法,其特征在于:
所述方法进一步包括:干扰声源声音强度获取步骤;
步骤S2中,根据声源的音量大小控制干扰信号方向的零陷深度和约束条件。
7.根据权利要求4至6任一所述的目标声源位置获取方法,其特征在于:
所述步骤S2进一步包括:波束成形步骤;
波束成形步骤中,利用线性约束最小方差LCMV自适应波束形成器,通过增加干扰方向的约束条件滤除干扰信号;如果存在方向已知的干扰信号,则这些方向上有:
wHg(θi)=0,i=1,…,K
其中,g(θi),i=1,…,K为K个干扰方向的导向矢量,w为权向量,则
C=[g(θ0),g(θ1),…,g(θK)]
F=[10…0]
上式中g(θ0)为期望信号方向的导向矢量;此时,权向量表示为:
wLCMV=RyyC(CHRyyC)F
其中,Ryy为输出信号的功率谱密度,通过线性约束最小方差LCMV自适应波束形成器在期望声源无失真传输的条件下抑制干扰方向的信号,同时最小化噪声的输出功率。
8.一种控制方法,其特征在于,所述控制方法包括:
步骤S1、包括权利要求1至4任一所述的干扰声源方向获取方法;
步骤S2、抑制步骤S1获取的干扰声源。
9.一种控制方法,其特征在于,所述控制方法包括:
权利要求4至7任一所述目标声源位置获取方法;
步骤S3、将麦克风阵列的波束指向目标声源方向。
10.一种电子设备控制方法,其特征在于,所述方法包括:
权利要求4至7任一所述目标声源位置获取方法;
步骤S3、根据所述所述目标声源位置获取方法中步骤S2获取的目标声源发出的声音,并对获取的声音进行语音识别,通过识别结果对设定电子设备进行控制。
11.一种干扰声源方向获取系统,其特征在于,所述系统包括:
干扰声源,设有蓝牙模块;
麦克风阵列,设有蓝牙模块,所述干扰声源与麦克风阵列通过蓝牙连接;
干扰声源方向获取模块,用以从所述麦克风阵列通过蓝牙测向功能获取干扰声源的方向信息。
12.一种目标声源位置获取系统,其特征在于,所述系统包括:
干扰声源方向获取模块,用以根据所述麦克风阵列通过蓝牙测向功能获取干扰声源的方向信息;
干扰声源抑制模块,用以在获取的声音中抑制所述干扰声源方向获取模块获取的干扰声源方向,或者,在获取的声源中排除所述干扰声源方向获取模块获取的干扰声源;进一步获取目标声源的信息。
13.根据权利要求12所述的目标声源位置获取系统,其特征在于:
所述干扰声源抑制模块具体包括:
波束成形单元,用以完成波束成形;
所述波束成形单元利用线性约束最小方差LCMV自适应波束形成器,通过增加干扰方向的约束条件滤除干扰信号;如果存在方向已知的干扰信号,则这些方向上有:
wHg(θi)=0,i=1,…,K
其中,g(θi),i=1,…,K为K个干扰方向的导向矢量,w为权向量,则
C=[g(θ0),g(θ1),…,g(θK)]
F=[10…0]
上式中g(θ0)为期望信号方向的导向矢量;此时,权向量表示为:
wLCMV=RyyC(CHRyyC)F
其中,Ryy为输出信号的功率谱密度,通过线性约束最小方差LCMV自适应波束形成器可以在期望声源无失真传输的条件下抑制干扰方向的信号,同时最小化噪声的输出功率。
14.一种电子设备控制系统,其特征在于,所述系统包括:
权利要求12至13任一所述目标声源位置获取系统;
目标声源声音获取模块,用以利用所述目标声源位置获取系统获取的位置信息获取目标声源声音;
语音识别模块,用以对所述目标声源声音获取模块获取的声音进行语音识别;
控制模块,用以通过所述语音识别模块的识别结果对设定电子设备进行控制。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010718914.7A CN111863019A (zh) | 2020-07-23 | 2020-07-23 | 干扰声源方向获取方法及系统、目标声源位置获取方法及系统、电子设备控制方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010718914.7A CN111863019A (zh) | 2020-07-23 | 2020-07-23 | 干扰声源方向获取方法及系统、目标声源位置获取方法及系统、电子设备控制方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111863019A true CN111863019A (zh) | 2020-10-30 |
Family
ID=72949930
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010718914.7A Pending CN111863019A (zh) | 2020-07-23 | 2020-07-23 | 干扰声源方向获取方法及系统、目标声源位置获取方法及系统、电子设备控制方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111863019A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI806229B (zh) * | 2021-06-07 | 2023-06-21 | 美商惠普發展公司有限責任合夥企業 | 用於麥克風定向波束成形調整的運算裝置及非暫時性機器可讀儲存媒體 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101778330A (zh) * | 2009-12-30 | 2010-07-14 | 南京信息工程大学 | 基于手机平台的阵列麦克风助听器及其控制方法 |
CN107613390A (zh) * | 2017-10-20 | 2018-01-19 | 聚好看科技股份有限公司 | 一种控制开机广告音量的方法及装置 |
CN108919191A (zh) * | 2018-06-22 | 2018-11-30 | 安徽省久晟信息科技有限责任公司 | 图书馆阅览管理系统及管理方法 |
CN109308908A (zh) * | 2017-07-27 | 2019-02-05 | 深圳市冠旭电子股份有限公司 | 一种语音交互方法及装置 |
CN110673116A (zh) * | 2019-10-25 | 2020-01-10 | 海鹰企业集团有限责任公司 | 一种同频干扰抑制方法 |
CN110806560A (zh) * | 2019-09-24 | 2020-02-18 | 北京海益同展信息科技有限公司 | 一种物体定位方法、系统、电子设备及可读存储介质 |
-
2020
- 2020-07-23 CN CN202010718914.7A patent/CN111863019A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101778330A (zh) * | 2009-12-30 | 2010-07-14 | 南京信息工程大学 | 基于手机平台的阵列麦克风助听器及其控制方法 |
CN109308908A (zh) * | 2017-07-27 | 2019-02-05 | 深圳市冠旭电子股份有限公司 | 一种语音交互方法及装置 |
CN107613390A (zh) * | 2017-10-20 | 2018-01-19 | 聚好看科技股份有限公司 | 一种控制开机广告音量的方法及装置 |
CN108919191A (zh) * | 2018-06-22 | 2018-11-30 | 安徽省久晟信息科技有限责任公司 | 图书馆阅览管理系统及管理方法 |
CN110806560A (zh) * | 2019-09-24 | 2020-02-18 | 北京海益同展信息科技有限公司 | 一种物体定位方法、系统、电子设备及可读存储介质 |
CN110673116A (zh) * | 2019-10-25 | 2020-01-10 | 海鹰企业集团有限责任公司 | 一种同频干扰抑制方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI806229B (zh) * | 2021-06-07 | 2023-06-21 | 美商惠普發展公司有限責任合夥企業 | 用於麥克風定向波束成形調整的運算裝置及非暫時性機器可讀儲存媒體 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10979805B2 (en) | Microphone array auto-directive adaptive wideband beamforming using orientation information from MEMS sensors | |
CN110491403B (zh) | 音频信号的处理方法、装置、介质和音频交互设备 | |
US11081123B2 (en) | Microphone array-based target voice acquisition method and device | |
CN110089131B (zh) | 用于分布式音频捕获和混合控制的装置和方法 | |
CN107976651B (zh) | 一种基于麦克风阵列的声源定位方法及装置 | |
US10602267B2 (en) | Sound signal processing apparatus and method for enhancing a sound signal | |
CN107577449B (zh) | 唤醒语音的拾取方法、装置、设备及存储介质 | |
US9633651B2 (en) | Apparatus and method for providing an informed multichannel speech presence probability estimation | |
JP4690072B2 (ja) | マイクロフォン・アレイを使用するビーム・フォーミングのシステムおよび方法 | |
CN106653041B (zh) | 音频信号处理设备、方法和电子设备 | |
CN111044973B (zh) | 一种用于麦克风方阵的mvdr目标声源定向拾音方法 | |
US9100734B2 (en) | Systems, methods, apparatus, and computer-readable media for far-field multi-source tracking and separation | |
CN106872945B (zh) | 声源定位方法、装置和电子设备 | |
CN113281706B (zh) | 一种目标定位方法、装置及计算机可读存储介质 | |
CN110133579A (zh) | 适用于球面麦克风阵列声源定向的球谐波阶数自适应选择方法 | |
US11290809B2 (en) | Dynamic sensitivity matching of microphones in a microphone array | |
CN108008394B (zh) | 仿生声纳二维经历图绘制方法、存储介质及设备 | |
CN111627456A (zh) | 噪音排除方法、装置、设备及可读存储介质 | |
CN111681665A (zh) | 一种全向降噪方法、设备及存储介质 | |
CN111863019A (zh) | 干扰声源方向获取方法及系统、目标声源位置获取方法及系统、电子设备控制方法及系统 | |
US6894642B2 (en) | Doubly constrained robust capon beamformer | |
CN108692718A (zh) | 基于盲波束的稳健导航抗干扰方法及其系统 | |
CN109752707B (zh) | 基于正交匹配追踪的多基地声呐系统直达波干扰抑制方法 | |
CN114596848A (zh) | 用于机器人的语音识别方法、装置及机器人 | |
CN113450769B (zh) | 语音提取方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |