CN110992972A

CN110992972A - 基于多麦克风耳机的声源降噪方法、电子设备、计算机可读存储介质

Info

Publication number: CN110992972A
Application number: CN201911142348.3A
Authority: CN
Inventors: 胡中骥; 钟鑫; 张鑫
Original assignee: Cosonic Intelligent Technologies Co Ltd
Current assignee: Cosonic Intelligent Technologies Co Ltd
Priority date: 2019-11-20
Filing date: 2019-11-20
Publication date: 2020-04-10
Anticipated expiration: 2039-11-20
Also published as: CN110992972B

Abstract

本发明涉及一种基于多麦克风耳机的声源降噪方法、电子设备、计算机可读存储介质，用于实现剔除混合声音信号中的非用户本人语音，只保留用户本人语音，其中方法具体包括：步骤S11.采集外界混合声音信号并从中分离出多个声源信号；步骤S12.针对每个声源信号，获取声源信号的方位信息和距离信息；步骤S13.根据声源信号的方位信息和距离信息，区分出用户本人语音；步骤S14.根据区分结果，将非用户本人语音从混合声音信号中删除。

Description

基于多麦克风耳机的声源降噪方法、电子设备、计算机可读存储介质

技术领域

本发明涉及耳机降噪，尤其涉及一种基于多麦克风耳机的声源降噪方法、电子设备、计算机可读存储介质。

背景技术

耳机中对于语音通话消噪，需要将非人声的噪声以及并非用户本人语音都进行消除，以使得用户本人语音清晰。

对于如何将单一声源信号从混合声音信号中分离出来，现有技术已有多种方法可以实现。但一旦分离后，就存在一个问题，如何判决哪种声源信号是非人声的噪声，哪种声源信号是用户本人语音，哪种声源信号是他人的语音。

如果有一种方法，能对分离出的声源信号区分非人声的噪声以及他人的语音，那么就能将这些非用户本人语音的声源信号从混合声音信号中消除掉，从而只剩下用户本人语音，达到通信语音清晰的目的。

发明内容

本发明的目的在于实现剔除混合声音信号中的非用户本人语音，只保留用户本人语音。

为此，提供一种基于多麦克风耳机的声源降噪方法，包括以下步骤：

步骤S11.采集外界混合声音信号并从中分离出多个声源信号；

步骤S12.针对每个声源信号，获取声源信号的方位信息和距离信息；

步骤S13.根据声源信号的方位信息和距离信息，区分出用户本人语音；

步骤S14.根据区分结果，将非用户本人语音从混合声音信号中删除。

作为第一种实施方式，所述步骤S12具体是根据相交点来获取声源信号的方位信息和距离信息，其中相交点的获取方式包括：

获取声源相对于耳机中两个线性排列的麦克风M1、M2的位置双曲线；

获取声源相对于麦克风M1、M2的方位角；

以位置双曲线与方位角的交点作为所述相交点。

作为第二种实施方式，所述步骤S12具体是根据相交点来获取声源信号的方位信息和距离信息，其中相交点的获取方式包括：

获取声源到麦克风M1的距离d1，以麦克风M1为圆心、距离d1为半径获取声源的等距圆；

以等距圆与位置双曲线的交点中靠近人嘴部位的一处作为所述相交点。

作为第三种实施方式，所述步骤S12具体是根据相交点来获取声源信号的方位信息和距离信息，其中相交点的获取方式包括：

获取声源相对于耳机中两个线性排列的麦克风M1、M2的方位角；

以等距圆与方位角的交点作为所述相交点。

作为第四种实施方式，所述步骤S12具体是根据相交点来获取声源信号的方位信息和距离信息，其中相交点的获取方式包括：

获取声源相对于麦克风M1、M2的方位角；

以等距圆、位置双曲线与方位角三者的交点作为所述相交点。

上述各种实施方式中，所述位置双曲线的获取方式包括：

计算声源达到两个麦克风M1、M2的时延差T，根据时延差T计算声源到麦克风M1和麦克风M2的距离差值，根据距离差值获取所述位置双曲线。

进一步地，所述时延差T的计算方式包括：

在时间段T1-T2内，持续采集麦克风M1的信号M1(t)、麦克风M2的信号M2(t)送入互相关器；

根据互相关器输出的相关函数获取其函数曲线，从函数曲线中挑选出最大峰值Rmax；

根据最大峰值Rmax反向确定其对应的时延差T。

上述各种实施方式中，所述方位角的获取方式包括：

获取麦克风M1、M2之间的距离d和声波传播速度C；

计算声源达到两个麦克风M1、M2的时延差T，其中时延差T以上述方式获得，此处不再赘述；

根据时延差T、距离d及声波传播速度C三者换算声源相对于麦克风M1、M2的方位角。

上述各种实施方式中，所述距离d1的获取方式包括：

获取声源达到两个麦克风M1、M2的声强，计算两者的声强差值；

获取声源相对于麦克风M1、M2的方位角和麦克风M1、M2之间的距离d，其中方位角以上述方式获得，此处不再赘述；

根据声强差值、方位角及距离d三者换算声源到麦克风M1的距离d1。

进一步学，所述步骤S13包括：将方位信息位于设定方位区间内且距离信息位于设定距离区间内的声源，判定为用户本人语音。

还提供一种电子设备，其中，该电子设备包括：

控制器；以及，

被安排成存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述控制器执行上述的方法。

还提供一种计算机可读存储介质，其中，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被控制器执行时，实现上述的方法。

有益效果：

本发明通过分离混合声音信号，提取多个声源信号，对每个声源信号获取其方位信息和距离信息，根据声源信号的方位信息和距离信息，定位出该声源信号是否属于用户本人语音，对混合声音信号中的非用户本人语音予以剔除，从而保留干净的用户本人语音信息，达到通信语音清晰的目的。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了实施例1中声源降噪方法的具体实施流程；

图2示出了实施例1中步骤S12的具体实施流程；

图3示出了声源相对于两个麦克风M1、M2的位置双曲线；

图4示出了声源相对于两个麦克风M1、M2的声源方位角；

图5示出了实施例2中步骤S12的具体实施流程；

图6示出了基于双麦克风的差分声强信息得到的声源等距圆；

图7示出了声源到麦克风M1的距离d1的单调函数；

图8示出了实施例3中步骤S12的具体实施流程；

图9示出了本发明的电子设备的结构示意图；

图10示出了本发明的计算机可读存储介质的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

实施例1

本实施例采用双麦克风耳机，耳机中设有两个线性排列的麦克风M1、M2，当然也可以是更多数量，其中，在耳机被用户佩戴的状态下，麦克风M1较麦克风M2更接近人嘴部位。

依赖上述耳机结构，本实施例采用如图1所示的声源降噪方法，包括依序执行的以下步骤S101-S104：

S11.采集外界混合声音信号并从中分离出多个声源信号

具体地，麦克风M1和/或麦克风M2从外界采集混合声音信号传输给耳机中的控制器，控制器通过现有的声源分离技术将混合声音信号中的各个声源信号都分离出来，以待后续操作步骤使用。

S12.针对每个声源信号，获取声源信号的方位信息和距离信息

具体地，见图2，包括以下子步骤S1211-S1213：

S1211.基于双麦克风差分相位信息得到声源位置双曲线

该子步骤用于计算声源达到两个麦克风M1、M2的时延差T(即差分相位信息)，根据时延差T获得声源相对于两个麦克风M1、M2的位置双曲线，具体方法为：

在时间段T1-T2内，持续采集麦克风M1的信号M1(t)、麦克风M2的M2(t)送入下述公式(1)所述的互相关器：

根据互相关器输出的相关函数R(T)画出函数曲线，从曲线中挑选出最大峰值Rmax；

根据最大峰值Rmax反向确定其对应的时延差T，该时延差T意味着噪声传播到麦克风 M1和麦克风M2之间的时长差值；

假定声波传播的速度为C，则声源到麦克风M1和麦克风M2的距离差值即为T×C，由于d2-d1＝T×C，根据上述距离差值，即可以得到声源相对于两个麦克风M1、M2的如图3所示的位置双曲线，其中d1为声源到麦克风M1的距离，d2为声源到麦克风M2的距离。

S1212.基于双麦克风差分相位信息得到声源方位角

该子步骤依赖噪声源或者其它人的语音相对于用户本人语音属于远场声源这一特性，通过计算声源达到两个麦克风M1、M2的时延差T，根据时延差T计算出声源相对于麦克风 M1、M2的方位角，具体方法为：

见图4，考虑两个麦克风M1、M2线性排列的情况，假定原始噪声来自远场，原始噪声达到麦克风阵列时表现近似为平面波，假定其入射角度为θ，声波传播速度为C，麦克风 M1、M2之间的距离为d，则麦克风M1、M2之间接收到声波之间的时延差T为：

其中，T可以用上述互相关器和峰值检测进行测量，如此，可获得入射角为

其中θ即噪音的声源方位角。

S1213.计算声源方位角与位置双曲线的相交点，根据相交点，可以得到声源信号的方位信息和距离信息。

S13.根据声源信号的方位信息和距离信息，区分出用户本人语音

假定耳机结构使得佩戴耳机的用户，其人嘴部位离耳机双麦克风的方位角在方位区间 [Threshθ1，Threshθ2]内，比如为[45°,90°]，其人嘴部位离双麦克风中的近麦(本实施例中为麦克风M1)的距离在距离区间[0,Threshd]内,比如(0m，0.04m)，

则得到声源信号的方位信息和距离信息后，将方位信息不在上述方位区间内或距离信息不在上述距离区间内的声源，判定为非用户本人语音；将方位信息位于上述方位区间内且距离信息位于上述距离区间内的声源，判定为用户本人语音。

S14.根据区分结果，将非用户本人语音从混合声音信号中删除

具体地，将所有将方位信息不在上述方位区间内或距离信息不在上述距离区间内的声源从混合声音信号中删除，以获得干净的用户本人语音信息。

需要说明的是，对于如何将单一声源信号从混合声音信号中剔除，现有技术有多种方法实现，此处不作赘述。

本实施例根据耳机中的两个线性排列的麦克风M1、M2所收到声源的差分相位以及差分声压，获取声源信号的方位信息和距离信息，定位出该声源信息是否属于用户本人语音，对混合声音信号中的非用户本人语音予以剔除，从而保留干净的用户本人语音信息，达到通信语音清晰的目的。

实施例2

实施例2是在实施例1的基础上，见图5，将实施例1中的步骤S12中的子步骤改为如下子步骤S1221-S1223：

S1221.基于双麦克风差分相位信息得到声源位置双曲线

在时间段T1-T2内，持续采集信号M1(t)、M2(t)送入下述公式(1)所述的互相关器：

S1222.基于双麦克风的差分声强信息得到声源的等距圆

该子步骤依赖远场的噪声源或者其它人的人声近视可以当成点声源这一特性，通过获取声源达到两个麦克风M1、M2的声强，计算两者的声强差值(即差分声强信息)，根据声强差值得到声源的等距圆，具体方法为：

见图6，假定声源在麦克风M1处的声强为S1，声源在麦克风M2处的声强为S2，由于点声源传播一定距离后的声强和传播距离成平方反比关系，可以得到下述公式(2)、(3)

S1＝ P/d1^2 (2)

S2＝ P/d2^2 (3)

式中，P为声源的声强，d1为声源到麦克风M1的距离，d2为声源到麦克风M2的距离。

由于d2-d1＝d sinθ，可以进一步推导出下面公式(4)：

式中，ΔS是d1的单调函数，d为两个麦克风M1、M2之间的距离，

由于入射角度θ可由上述步骤S1212算出，d为已知值(可根据实物测量获得)，因而可以计算得到d sinθ，d sinθ一旦确定，则函数曲线确定，如假定d sinθ＝0.025m时的函数曲线如图7所示，图中，声强差值delta S即为ΔS，纵坐标对应20*log(delta S)，是声强差值的db值，而横坐标对应d1，

因此，根据ΔS即可求出d1，即声源到麦克风M1的距离，以麦克风M1为圆心，以d1为半径，即可得到声源的等距圆。

S1213.计算等距圆与位置双曲线的相交点，根据相交点，可以得到声源信号的方位信息和距离信息

具体地，等距圆与位置双曲线存在四个相交点，则：

由于离声源近的麦克风必然先收到语音，离声源远的麦克风必然后收到语音，基于此，可以去掉位于后收到语音的麦克风那一侧的两个相交点，

又由于当耳机佩戴时，人嘴部位偏向哪个方向是知道的，故在剩下的相交点中，将较为远离人嘴部位的相交点作为噪声排除，保留较为靠近人嘴部位的相交点，根据该相交点，得出声源信号的方位信息和距离信息。

获得方位信息和距离信息后，执行实施例中的步骤S13、S14即可获得干净的用户本人语音信息。

实施例3

实施例3是在实施例1的基础上，见图8，将实施例1中的步骤S12中的子步骤改为如下子步骤S1231-S1233：

S1231.基于双麦克风差分相位信息得到声源方位角

该子步骤依赖噪声源或者其它人的语音相对于用户本人语音属于远场声源这一特性，通过计算声源达到两个麦克风M1、M2的时延差T，根据时延差T计算出声源传递过来的方位角，具体方法为：

其中θ即噪音的声源方位角。

S1232.基于双麦克风的差分声强信息得到声源的等距圆

S1＝ P/d1^2 (2)

S2＝ P/d2^2 (3)

由于d2-d1＝d sinθ，可以进一步推导出下面公式(4)：

式中，ΔS是d1的单调函数，d为两个麦克风M1、M2之间的距离，

S1233.计算等距圆与声源方位角的相交点，根据相交点，可以得到声源信号的方位信息和距离信息。

实施例4

实施例4是在实施例1的基础上，将实施例1中的步骤S12改为计算位置双曲线、等距圆与声源方位角三者，利用这三者共同求取相交点，根据相交点，得到声源信号的方位信息和距离信息。

需要说明的是：

上述任一实施例所用的方法，可转化为可存储于计算机存储介质中的程序步骤及装置，通过被控制器调用执行的方式进行实施。

在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述，构造这类装置所要求的结构是显而易见的。此外，本发明也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明的内容，并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的检测电子设备的佩戴状态的装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

例如，图9示出了根据本发明一个实施例的电子设备的结构示意图。该电子设备传统上包括处理器91和被安排成存储计算机可执行指令(程序代码)的存储器92。存储器92可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。存储器92具有存储用于执行实施例中的任何方法步骤的程序代码94的存储空间93。例如，用于程序代码的存储空间93可以包括分别用于实现上面的方法中的各种步骤的各个程序代码94。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。这些计算机程序产品包括诸如硬盘，紧致盘(CD)、存储卡或者软盘之类的程序代码载体。这样的计算机程序产品通常为例如图10所述的计算机可读存储介质。该计算机可读存储介质可以具有与图9的电子设备中的存储器92类似布置的存储段、存储空间等。程序代码可以例如以适当形式进行压缩。通常，存储单元存储有用于执行根据本发明的方法步骤的程序代码101，即可以由诸如91之类的处理器读取的程序代码，当这些程序代码由电子设备运行时，导致该电子设备执行上面所描述的方法中的各个步骤。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims

1.基于多麦克风耳机的声源降噪方法，其特征在于，包括以下步骤：

步骤S11.采集外界混合声音信号并从中分离出多个声源信号；

2.根据权利要求1所述的方法，其特征在于，所述步骤S12具体是根据相交点来获取声源信号的方位信息和距离信息，其中相交点的获取方式包括：

获取声源相对于麦克风M1、M2的方位角；

以位置双曲线与方位角的交点作为所述相交点。

3.根据权利要求1所述的方法，其特征在于，所述步骤S12具体是根据相交点来获取声源信号的方位信息和距离信息，其中相交点的获取方式包括：

4.根据权利要求1所述的方法，其特征在于，所述步骤S12具体是根据相交点来获取声源信号的方位信息和距离信息，其中相交点的获取方式包括：

以等距圆与方位角的交点作为所述相交点。

5.根据权利要求1所述的方法，其特征在于，所述步骤S12具体是根据相交点来获取声源信号的方位信息和距离信息，其中相交点的获取方式包括：

获取声源相对于麦克风M1、M2的方位角；

6.根据权利要求2、3或5所述的方法，其特征在于，所述位置双曲线的获取方式包括：

7.根据权利要求6所述的方法，其特征在于，所述时延差T的计算方式包括：

根据最大峰值Rmax反向确定其对应的时延差T。

8.根据权利要求2、4或5所述的方法，其特征在于，所述方位角的获取方式包括：

获取麦克风M1、M2之间的距离d和声波传播速度C；

计算声源达到两个麦克风M1、M2的时延差T；

9.根据权利要求3、4或5所述的方法，其特征在于，所述距离d1的获取方式包括：

获取声源相对于麦克风M1、M2的方位角和麦克风M1、M2之间的距离d；

10.根据权利要求1所述的方法，其特征在于，所述步骤S13进一步包括：

将方位信息位于设定方位区间内且距离信息位于设定距离区间内的声源，判定为用户本人语音。

11.一种电子设备，其中，该电子设备包括：

控制器；以及，

被安排成存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述控制器执行根据权利要求1-10中任一项所述的方法。

12.一种计算机可读存储介质，其中，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被控制器执行时，实现权利要求1-10中任一项所述的方法。