CN104053107B - 一种用于噪声环境下声源分离和定位方法 - Google Patents

一种用于噪声环境下声源分离和定位方法 Download PDF

Info

Publication number
CN104053107B
CN104053107B CN201410249428.XA CN201410249428A CN104053107B CN 104053107 B CN104053107 B CN 104053107B CN 201410249428 A CN201410249428 A CN 201410249428A CN 104053107 B CN104053107 B CN 104053107B
Authority
CN
China
Prior art keywords
mrow
msub
mfrac
signal
sound source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410249428.XA
Other languages
English (en)
Other versions
CN104053107A (zh
Inventor
柴毅
屈剑锋
王坤朋
杨志敏
董勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University
Original Assignee
Chongqing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University filed Critical Chongqing University
Priority to CN201410249428.XA priority Critical patent/CN104053107B/zh
Publication of CN104053107A publication Critical patent/CN104053107A/zh
Application granted granted Critical
Publication of CN104053107B publication Critical patent/CN104053107B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Abstract

本发明涉及助听装置及方法,具体指一种用于噪声环境下声源分离和定位的助听装置及方法,包括麦克风阵列、声源位置显示器、声源分离与定位模块、信号采集器、模拟信号放大器和声源选择键盘,声源分离与定位模块采用互相关法对采集的麦克风信号进行处理,得到8个声源相对于麦克风阵列的初始方位,采用基于空间搜索的盲源分离方法对采集的麦克风信号进行处理,得到包含交谈对象和其他人说话声音的声源,用户通过声源选择键盘选择出属于交谈对象的声源,根据选择的声源计算出交谈对象相对于麦克风阵列的准确方位,并在声源位置显示器中显示该声源的方位;实现噪声环境下交谈双方语音信号自动分离,同时增加了语音信号源的定位功能,使用方便。

Description

一种用于噪声环境下声源分离和定位方法
技术领域
本发明涉及助听装置及方法,具体指一种用于噪声环境下声源分离和定位的助听装置及方法。
背景技术
在户外或工业现场等嘈杂环境的语音交流中,助听装置是增强语音品质提高沟通效果的重要设备。在嘈杂环境下用户所感兴趣的有用信号会受到环境噪音或其它语音干扰,有用信号的信噪比较低,进而严重影响用户之间的正常交流。现有的助听设备大多数仍采用简单的信号放大功能,少数具有语音清晰功能的设备也仅对环境背景噪声有效,对于交流现场中其它语音的干扰无能为力。
发明内容
针对现有技术存在的上述问题,本发明解决的技术问题是:实现噪声环境下交谈双方语音信号自动分离,同时增加了语音信号源的定位功能,操作方便。
解决该技术问题,本发明是这样实现的:一种用于噪声环境下声源分离和定位的助听装置,其特征在于:包括麦克风阵列(1006)、声源位置显示器(1001)、声源分离与定位模块(1002)、信号采集器(1003)、模拟信号放大器(1004)和声源选择键盘(1005);
所述麦克风阵列(1006)、模拟信号放大器(1004)、信号采集器(1003)、声源分离与定位模块(1002)和声源位置显示器(1001)依次连接;
所述声源选择键盘(1005)与声源分离与定位模块(1002)连接;
所述声源分离与定位模块(1002)采用互相关法对采集的麦克风信号进行处理,得到8个声源相对于麦克风阵列的初始方位;采用基于空间搜索的盲源分离方法对采集的麦克风信号进行处理,得到包含交谈对象(1009)和其他人(1010)说话声音的声源,用户通过声源选择键盘(1005)选择出属于交谈对象(1009)的声源,根据选择的声源计算出交谈对象(1009)相对于麦克风阵列(1006)的准确方位,并在声源位置显示器(1001)中显示该声源的方位。
进一步,所述麦克风阵列(1006)由微型麦克风(1007)构成;
所述麦克风阵列(1006)由8个独立的微型麦克风(1007)按照图中方式均匀排列在正方形的边上,正方形边长为10厘米,任意两个微型麦克风(1007)中心点之间的距离(1008)为5厘米;
所述微型麦克风(1007)的指向性为全向型(无指向),直径小于1厘米。
本发明噪声环境下声源分离和定位方法,其特征在于:包括如下步骤:
a.采用权利要求1所述的助听装置对交谈过程中的语音信号进行采集;
a1.所述助听装置采用模拟信号放大器(1004)对麦克风阵列(1006)中8个微型麦克风(1007)的语音信号进行放大,放大后的信号传输至信号采集器(1003);
a2.所述信号采集器(1003)对模拟信号放大器(1004)放大后的信号进行滤波、模/数转换和采集,采样频率为16KHz,采样精度为16位,并对采集的信号进行储存;
b.所述声源分离与定位模块(1002)采用基于空间搜索的盲源分离方法对采集的麦克风信号进行处理,具体步骤如下:
b1.信号采集器得到8路观测信号x(t)=[x1(t),x2(t),...,x8(t)]T,t为采样时刻;
b2.观测信号x(t)可以被建模为8个声源s(t)=[s1(t),s2(t),...,s8(t)]T的线性混合:
式(1)中v为空气中声音传播的速度,约为340米/秒;amn,m,n=1,2,...8为第n个声源到达第m个微型麦克风的距离,声源信号的幅值衰减与距离amn成反比关系,声源sn,n=1,2,...,8到达各微型麦克风的时间延迟与距离amn成正比关系;η(t)= (η1(t),η2(t),...,η8(t))T为微型麦克风的噪声;公式(1)可以简写为
x(t)=As(t)+η(t)(2)式(2)中A为8×8声源混合矩阵;
b3.采用互相关法对对采集的麦克风信号进行处理,计算得到声源相对于麦克风阵列的初始方位,具体如下:
b301:为了降低声源定位和分离算法的复杂度,构建一个栅格化的正方体,并存储每个柵格顶点至微型麦克风(2003)的距离。参见图2,将麦克风阵列正前方的正方体区域进行栅格化处理,正方体的边长为10厘米,栅格的边长为1厘米,最小栅格的边长为1厘米,记栅格顶点(2001)为gijk,i,j,k=1,2,...10;
b302:柵格顶点gijk距离第m个微型麦克风(2003)的距离(2002)为dm,将gijk至8个微型麦克风(2003)的距离写作列向量形式为d,将所有栅格顶点至微型麦克风的距离写作矩阵形式为D,矩阵的第1列表示第(k-1)×100+(j-1)×10+i个栅格点;
b303:由公式(1)可知,任意两路观测信号xm(t)与xm′(t),m,m′∈{1,2,...8} 进行延迟相关运算Cτ=xm(t)·xm′(t-τ),τ∈[-0.414v,0.414v],τ为延迟时间,必然存在8个极大值由于τ非采样时间间隔的整数倍,在计算时需要首先对观测信号x(t)进行自然三次样条插值,对于采样时刻t0,t1,...,tP,对应的采样点xm= [y0,y1,...,yP]T,P为采样点数目,插值计算后得到的观测信号为插值函数为:
hp=tp+1-t,0≤p≤P
系数b0,b1,...,bP可以通过求解式(4)所述方程得到。
b304:参见图3,分别计算微型麦克风(3001)与(3002)、(3003)、(3004)采集到观测信号之间的延迟相关系数Cτ的极大值,并利用极大值处对应的延迟时间可以计算出图3所示的声源相对于微型麦克风的方位;
b305:利用延迟时间τ与声速v相乘分别计算8个声源与4个微型麦克风 (3001)、(3002)、(3003)、(3004)的距离d1,d3,d6,d8,并通过计算求取与声源距离最近的栅格点gijk,进而得到8个声源距离8个微型麦克风的距离,即声源混合矩阵A;
b4.采用空间搜索的方法以最小化声源之间互信息I为目标函数,同时分离出混合在观测信号x(t)中的所有声源由于语音信号为短时平稳信号,通常认为在20毫秒的采样时长内可以等效为平稳信号,因此,以下过程需要在有限时间T内完成, T≤20ms,具体如下:
b401:初始化空间搜索次数r←0,声源混合矩阵A(0)←A,互信息最小值I*←+∞,时间tc←0;
b402:对声源混合矩阵A(r)进行求逆运算得到矩阵W(r),利用计算得到真实声源信号的估计信号并对其进行标准化处理,使得各声源估计信号均值为0方差为1;
b403:采用互信息度量声源信号之间的相互独立性,声源之间的互信息是一个非负指标,当且仅当各信号之间相互独立时互信息为零。分别记xn=(xm(1),…,xm(P))为第 m个观测信号,为真实声源信号的估计,P是采样点数目。由此,估计声源信号之间的互信息可以写为:
式中,为估计声源信号的边缘熵,表示估计声源信号的联合熵;
由于边缘熵中含有概率分布项,无法直接计算实际计算中采用多项式密度展开来近似熵,这种近似方法具有较高的计算效率,其形式为:
其中,是斜度,为规范化的峭度;估计声源信号的联合熵为:
若I(r)<I*,则置I*←I(r),否则,进入下一步;
b404:随机搜索8个声源附近的栅格点,得到一组新的栅格点及其对应的到达微型麦克风的距离,通过查询距离矩阵D,得到新的声源混合矩阵A;
b405:若计算时间tc<T,置迭代次数r←r+1,置下一次迭代的混合矩阵为 A(r)←A,返回b402进行迭代计算,否则,结束迭代过程。
相对于现有技术,本发明具有如下优点:
1、本发明中构成助听装置的麦克风阵列、模拟信号放大器、信号采集器、声源分离与定位模块和声源位置显示器依次连接,声源选择键盘与声源分离与定位模块连接,声源分离与定位模块采用互相关法和基于空间搜索的盲源分离方法对采集到的微型麦克风信号进行处理,可以得到8个声源的估计信号及其相对于阵列麦克风的方位。
2、由于本发明采用栅格化声源信号空间的方法,建立声源到达各微型麦克风的距离矩阵,利用随机搜索声源附近栅格点的方式,降低了声源信号分离算法的计算复杂度,提高了声源混合矩阵的估计效率,进而保证了声源信号分离的实时性。
3、由于本发明配置了声源选择键盘,用户可以通过键盘交互选择出交谈对象的声源,通过声源分离与定位模块实时计算交谈对象的准确方位,并在声源位置显示器中显示该声源的方位,提高了助听器的可配置性和可视化效果。
附图说明
图1-本发明的功能框图。
图2-本发明的柵格化正方体示意图。
图3-本发明的声源定位示意图。
图4-实施例的功能框图。
图中,1001-声源位置显示器、1002-声源分离与定位模块、1003-信号采集器、1004-模拟信号放大器、1005-声源选择键盘、1006-阵列麦克风、1007-微型麦克风、1008-微型麦克风中心距离、1009-交谈对象、1010-其他声源、2001-栅格顶点、2002-栅格顶点至微型麦克风的距离、2003-微型麦克风、3001-微型麦克风1、3002-微型麦克风3、 3003-微型麦克风6、3004-微型麦克风8、4001-麦克风阵列、4002-模拟放大器、4003-带通滤波器、4004-模拟开关、4005-模/数转换器、4006-微型处理器、4007-液晶显示器、 4008-键盘。
具体实施方式
下面结合具体实施例对本发明作进一步详细说明。
参见图1,一种用于噪声环境下声源分离和定位的助听装置,包括麦克风阵列(1006)、声源位置显示器(1001)、声源分离与定位模块(1002)、信号采集器(1003)、模拟信号放大器(1004)和声源选择键盘(1005);
所述麦克风阵列(1006)、模拟信号放大器(1004)、信号采集器(1003)、声源分离与定位模块(1002)和声源位置显示器(1001)依次连接;
所述声源选择键盘(1005)与声源分离与定位模块(1002)连接;
所述麦克风阵列(1006)由微型麦克风(1007)构成;
所述麦克风阵列(1006)由8个独立的微型麦克风(1007)按照图中方式均匀排列在正方形的边上,正方形边长为10厘米,任意两个微型麦克风(1007)中心点之间的距离(1008)为5厘米;
所述微型麦克风(1007)的指向性为全向型(无指向),直径小于1厘米。
声源分离与定位模块(1002)具有两个主要功能,一个功能是采用互相关法对采集的麦克风信号进行处理,得到8个声源相对于麦克风阵列的初始方位;另一个功能是采用基于空间搜索的盲源分离方法对采集的麦克风信号进行处理,得到包含交谈对象(1009) 和其他人(1010)说话声音的声源,用户可以通过声源选择键盘(1005)选择出属于交谈对象(1009)的声源,根据选择的声源计算出交谈对象(1009)相对于麦克风阵列(1006)的准确方位,并在声源位置显示器(1001)中显示该声源的方位。
噪声环境下声源分离和定位方法通过如下步骤实现:
a.语音信号进行采集,具体步骤如下:
a1.所述助听装置采用模拟信号放大器(1004)对麦克风阵列(1006)中8个微型麦克风(1007)的语音信号进行放大,放大后的信号传输至信号采集器(1003);
a2.所述信号采集器(1003)对模拟信号放大器(1004)放大后的信号进行滤波、模/数转换和采集,采样频率为16KHz,采样精度为16位,并对采集的信号进行储存;
b.所述声源分离与定位模块(1002)采用基于空间搜索的盲源分离方法对采集的麦克风信号进行处理,具体步骤如下:
b1.信号采集器得到8路观测信号x(t)=[x1(t),x2(t),...,x8(t)]T,t为采样时刻;
b2.观测信号x(t)可以被建模为8个声源s(t)=[s1(t),s2(t),...,s8(t)]T的线性混合:
式(1)中v为空气中声音传播的速度,约为340米/秒;amn,m,n=1,2,...8为第n个声源到达第m个微型麦克风的距离,声源信号的幅值衰减与距离amn成反比关系,声源sn,n=1,2,...,8到达各微型麦克风的时间延迟与距离amn成正比关系;η(t)= (η1(t),η2(t),...,η8(t))T为微型麦克风的噪声;公式(8)可以简写为
x(t)=As(t)+η(t)(9)式(9)中A为8×8声源混合矩阵;
b3.采用互相关法对对采集的麦克风信号进行处理,计算得到声源相对于麦克风阵列的初始方位,具体如下:
b301:为了降低声源定位和分离算法的复杂度,构建一个栅格化的正方体,并存储每个栅格顶点至微型麦克风(2003)的距离。参见图2,将麦克风阵列正前方的正方体区域进行柵格化处理,正方体的边长为10厘米,柵格的边长为1厘米,最小柵格的边长为1厘米,记栅格顶点(2001)为gijk,i,j,k=1,2,...10;
b302:栅格顶点gijk距离第m个微型麦克风(2003)的距离(2002)为dm,将gijk至 8个微型麦克风(2003)的距离写作列向量形式为d,将所有栅格顶点至微型麦克风的距离写作矩阵形式为D,矩阵的第1列表示第(k-1)×100+(j-1)×10+i个栅格点:
b303:由公式(8)可知,任意两路观测信号xm(t)与xm′(t),m,m′∈{1,2,...8} 进行延迟相关运算Ct=xm(t)·xm′(t-τ),τ∈[-0.414v,0.414v],τ为延迟时间,必然存在8个极大值由于τ非采样时间间隔的整数倍,在计算时需要首先对观测信号x(t)进行自然三次样条插值,对于采样时刻t0,t1,...,tP,对应的采样点xm= [y0,y1,...,yP]T,P为采样点数目,插值计算后得到的观测信号为插值函数为:
hp=tp+1-t,0≤p≤P
系数b0,b1,...,bP可以通过求解式(11)所述方程得到。
b304:参见图3,分别计算微型麦克风(3001)与(3002)、(3003)、(3004)采集到观测信号之间的延迟相关系数Cτ的极大值,并利用极大值处对应的延迟时间可以计算出图3所示的声源相对于微型麦克风的方位;
b305:利用延迟时间τ与声速v相乘分别计算8个声源与4个微型麦克风 (3001)、(3002)、(3003)、(3004)的距离d1,d3,d6,d8,并通过计算求取与声源距离最近的栅格点gijk,进而得到8个声源距离8个微型麦克风的距离,即声源混合矩阵A;
b4.采用空间搜索的方法以最小化声源之间互信息1为目标函数,同时分离出混合在观测信号x(t)中的所有声源由于语音信号为短时平稳信号,通常认为在20毫秒的采样时长内可以等效为平稳信号,因此,以下过程需要在有限时间T内完成, T≤20ms,具体如下:
b401:初始化空间搜索次数r←0,声源混合矩阵A(0)←A,互信息最小值I*←+∞,时间tc←0;
b402:对声源混合矩阵A(r)进行求逆运算得到矩阵W(r),利用计算得到真实声源信号的估计信号并对其进行标准化处理,使得各声源估计信号均值为0方差为1;
b403:采用互信息度量声源信号之间的相互独立性,声源之间的互信息是一个非负指标,当且仅当各信号之间相互独立时互信息为零。分别记xm=(xm(1),...,xm(P))为第m个观测信号,为真实声源信号的估计,P是采样点数目。由此,估计声源信号之间的互信息可以写为:
式中,为估计声源信号的边缘熵,表示估计声源信号的联合熵;
由于边缘熵中含有概率分布项,无法直接计算实际计算中采用多项式密度展开来近似熵,这种近似方法具有较高的计算效率,其形式为:
其中,是斜度,为规范化的峭度:估计声源信号的联合熵为:
若I(r)<I*,则置I*←I(r),否则,进入下一步;
b404:随机搜索8个声源附近的柵格点,得到一组新的栅格点及其对应的到达微型麦克风的距离,通过查询距离矩阵D,得到新的声源混合矩阵A:
b405:若计算时间tc<T,置迭代次数r←r+1,置下一次迭代的混合矩阵为 A(r)←A,返回b402进行迭代计算,否则,结束迭代过程。
实施例:如图4所示,麦克风阵列4001选用8个微型麦克风(CMA-4544PF-W)构成,微型麦克风的直径为9.7毫米,模拟放大器4002采用由运算放大器OP07构成的100倍固定级增益实现,带通滤波器4003由OP07构成的四阶高通滤波器和四阶低通滤波器组成,高通滤波器截止频率为20Hz,低通滤波器截止频率为20KHz,模拟开关4004和模/数转换器由LTC1867实现,LTC1867内部包含一个8通道模拟输入开关和一个16位的模/数转换器,通过串行接口与微型处理器4006进行通信,实现通道选择和数据采集,微型处理器4006采用16位25MHz的超低功耗微处理器(MSP430F5529),键盘采用3个独立按键实现声源选择和音量增加和减小控制功能,液晶显示器选用240×320分辨率的低功耗黑白液晶显示屏。在MSP430F5529上实现声源分离与定位模块的功能,采用互相关法对采集的麦克风信号进行处理,得到8个声源相对于麦克风阵列的初始方位;采用基于空间搜索的盲源分离方法对采集的麦克风信号进行处理,得到包含交谈对象(1009)和其他人(1010)说话声音的声源,用户可以通过声源选择键盘(4008)选择出属于交谈对象(1009)的声源,根据选择的声源计算出交谈对象(1009)相对于麦克风阵列(1006)的准确方位,并在声源位置显示器 (4007)中显示该声源的方位。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (1)

1.一种用于噪声环境下声源分离和定位方法,其特征在于:包括如下步骤:
a.采用助听装置对交谈过程中的语音信号进行采集;
所述助听装置包括麦克风阵列(1006)、声源位置显示器(1001)、声源分离与定位模块(1002)、信号采集器(1003)、模拟信号放大器(1004)和声源选择键盘(1005);
所述麦克风阵列(1006)、模拟信号放大器(1004)、信号采集器(1003)、声源分离与定位模块(1002)和声源位置显示器(1001)依次连接;
所述声源选择键盘(1005)与声源分离与定位模块(1002)连接;
所述声源分离与定位模块(1002)采用互相关法对采集的麦克风信号进行处理,得到8个声源相对于麦克风阵列的初始方位;采用基于空间搜索的盲源分离方法对采集的麦克风信号进行处理,得到包含交谈对象(1009)和其他人(1010)说话声音的声源,用户通过声源选择键盘(1005)选择出属于交谈对象(1009)的声源,根据选择的声源计算出交谈对象(1009)相对于麦克风阵列(1006)的准确方位,并在声源位置显示器(1001)中显示该声源的方位;
所述麦克风阵列(1006)由微型麦克风(1007)构成:
所述麦克风阵列(1006)由8个独立的微型麦克风(1007)均匀排列在正方形边上,正方形边长为10厘米,任意两个微型麦克风(1007)中心点之间的距离(1008)为5厘米;
所述微型麦克风(1007)的指向性为全向型,无指向,直径小于1厘米;
a1.所述助听装置采用模拟信号放大器(1004)对麦克风阵列(1006)中8个微型麦克风(1007)的语音信号进行放大,放大后的信号传输至信号采集器(1003);
a2.所述信号采集器(1003)对模拟信号放大器(1004)放大后的信号进行滤波、模/数转换和采集,采样频率为16KHz,采样精度为16位,并对采集的信号进行储存;
b.所述声源分离与定位模块(1002)采用基于空间搜索的盲源分离方法对采集的麦克风信号进行处理,具体步骤如下:
b1.信号采集器得到8路观测信号x(t)=[x1(t),x2(t),…,xs(t)]T,t为采样时刻;
b2.观测信号x(t)被建模为8个声源s(t)=[s1(t),s2(t),…,ss(t)]T的线性混合:
<mrow> <mtable> <mtr> <mtd> <mrow> <msub> <mi>x</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <msub> <mi>a</mi> <mn>11</mn> </msub> </mfrac> <mo>&amp;CenterDot;</mo> <msub> <mi>s</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mrow> <mi>t</mi> <mo>-</mo> <mfrac> <msub> <mi>a</mi> <mn>11</mn> </msub> <mi>v</mi> </mfrac> </mrow> <mo>)</mo> </mrow> <mo>+</mo> <mfrac> <mn>1</mn> <msub> <mi>a</mi> <mn>12</mn> </msub> </mfrac> <mo>&amp;CenterDot;</mo> <msub> <mi>s</mi> <mn>2</mn> </msub> <mrow> <mo>(</mo> <mrow> <mi>t</mi> <mo>-</mo> <mfrac> <msub> <mi>a</mi> <mn>12</mn> </msub> <mi>v</mi> </mfrac> </mrow> <mo>)</mo> </mrow> <mo>+</mo> <mn>...</mn> <mo>+</mo> <mfrac> <mn>1</mn> <msub> <mi>a</mi> <mn>18</mn> </msub> </mfrac> <mo>&amp;CenterDot;</mo> <msub> <mi>s</mi> <mn>8</mn> </msub> <mrow> <mo>(</mo> <mrow> <mi>t</mi> <mo>-</mo> <mfrac> <msub> <mi>a</mi> <mn>18</mn> </msub> <mi>v</mi> </mfrac> </mrow> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>&amp;eta;</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>x</mi> <mn>2</mn> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <msub> <mi>a</mi> <mn>21</mn> </msub> </mfrac> <mo>&amp;CenterDot;</mo> <msub> <mi>s</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mrow> <mi>t</mi> <mo>-</mo> <mfrac> <msub> <mi>a</mi> <mn>21</mn> </msub> <mi>v</mi> </mfrac> </mrow> <mo>)</mo> </mrow> <mo>+</mo> <mfrac> <mn>1</mn> <msub> <mi>a</mi> <mn>22</mn> </msub> </mfrac> <mo>&amp;CenterDot;</mo> <msub> <mi>s</mi> <mn>2</mn> </msub> <mrow> <mo>(</mo> <mrow> <mi>t</mi> <mo>-</mo> <mfrac> <msub> <mi>a</mi> <mn>22</mn> </msub> <mi>v</mi> </mfrac> </mrow> <mo>)</mo> </mrow> <mo>+</mo> <mn>...</mn> <mo>+</mo> <mfrac> <mn>1</mn> <msub> <mi>a</mi> <mn>28</mn> </msub> </mfrac> <mo>&amp;CenterDot;</mo> <msub> <mi>s</mi> <mn>8</mn> </msub> <mrow> <mo>(</mo> <mrow> <mi>t</mi> <mo>-</mo> <mfrac> <msub> <mi>a</mi> <mn>28</mn> </msub> <mi>v</mi> </mfrac> </mrow> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>&amp;eta;</mi> <mn>2</mn> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mtable> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> <mtr> <mtd> <mo>.</mo> </mtd> </mtr> </mtable> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>x</mi> <mn>8</mn> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <msub> <mi>a</mi> <mn>81</mn> </msub> </mfrac> <mo>&amp;CenterDot;</mo> <msub> <mi>s</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mrow> <mi>t</mi> <mo>-</mo> <mfrac> <msub> <mi>a</mi> <mn>81</mn> </msub> <mi>v</mi> </mfrac> </mrow> <mo>)</mo> </mrow> <mo>+</mo> <mfrac> <mn>1</mn> <msub> <mi>a</mi> <mn>82</mn> </msub> </mfrac> <mo>&amp;CenterDot;</mo> <msub> <mi>s</mi> <mn>2</mn> </msub> <mrow> <mo>(</mo> <mrow> <mi>t</mi> <mo>-</mo> <mfrac> <msub> <mi>a</mi> <mn>82</mn> </msub> <mi>v</mi> </mfrac> </mrow> <mo>)</mo> </mrow> <mo>+</mo> <mn>...</mn> <mo>+</mo> <mfrac> <mn>1</mn> <msub> <mi>a</mi> <mn>88</mn> </msub> </mfrac> <mo>&amp;CenterDot;</mo> <msub> <mi>s</mi> <mn>8</mn> </msub> <mrow> <mo>(</mo> <mrow> <mi>t</mi> <mo>-</mo> <mfrac> <msub> <mi>a</mi> <mn>88</mn> </msub> <mi>v</mi> </mfrac> </mrow> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>&amp;eta;</mi> <mn>8</mn> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> </mtable> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>
式(1)中v为空气中声音传播的速度,约为340米/秒;amn,m,n=1,2,…,8为第n个声源到达第m个微型麦克风的距离,声源信号的幅值衰减与距离amn成反比关系,声源sn,n=1,2,…,8到达各微型麦克风的时间延迟与距离amn成正比关系:η(t)=(η1(t),η2(t),…,η8(t))T为微型麦克风的噪声;公式(1)简写为
x(t)=As(t)+η(t)(2)式(2)中A为8×8声源混合矩阵;
b3.采用互相关法对采集的麦克风信号进行处理,计算得到声源相对于麦克风阵列的初始方位,具体如下:
b301:为了降低声源定位和分离算法的复杂度,构建一个栅格化的正方体,并存储每个栅格顶点至微型麦克风(2003)的距离;将麦克风阵列正前方的正方体区域进行栅格化处理,正方体的边长为10厘米,栅格的边长为1厘米,最小栅格的边长为1厘米,记栅格顶点(2001)为gijk,i,j,k=1,2,…,10;
b302:栅格顶点gijk距离第m个微型麦克风(2003)的距离(2002)为dm,将gijk至8个微型麦克风(2003)的距离写作列向量形式为d,将所有栅格顶点至微型麦克风的距离写作矩阵形式为D,矩阵的第l列表示第(k-1)×100+(j-1)×10+i个栅格点;
b303:由公式(1)知,任意两路观测信号xm(t)与xm'(t),m,m'∈{1,2,…,8}进行延迟相关运算Cτ=xm(t)·xm'(t-τ),τ∈[-0.414/v,0.414/v],τ为延迟时间,必然存在8个极大值n=1,2,…,8;由于τ非采样时间间隔的整倍数,在计算时需要首先对观测信号x(t)进行自然三次样条插值,对于采样时刻t0,t1,…,tp,对应的采样点xm=[y0,y1,…,yP]T,P为采样点数目,插值计算后得到的观测信号为插值函数为:
<mrow> <msub> <mi>z</mi> <mi>p</mi> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <msub> <mi>b</mi> <mrow> <mi>p</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mo>&amp;CenterDot;</mo> <msup> <mrow> <mo>(</mo> <mi>t</mi> <mo>-</mo> <msub> <mi>t</mi> <mi>p</mi> </msub> <mo>)</mo> </mrow> <mn>3</mn> </msup> <mo>+</mo> <msub> <mi>b</mi> <mi>p</mi> </msub> <mo>&amp;CenterDot;</mo> <msup> <mrow> <mo>(</mo> <msub> <mi>t</mi> <mrow> <mi>p</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mo>-</mo> <mi>t</mi> <mo>)</mo> </mrow> <mn>3</mn> </msup> </mrow> <mrow> <mn>6</mn> <msub> <mi>h</mi> <mi>p</mi> </msub> </mrow> </mfrac> <mo>+</mo> <mrow> <mo>(</mo> <mfrac> <msub> <mi>y</mi> <mrow> <mi>p</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> <msub> <mi>h</mi> <mi>p</mi> </msub> </mfrac> <mo>-</mo> <mfrac> <msub> <mi>h</mi> <mi>p</mi> </msub> <mn>6</mn> </mfrac> <msub> <mi>b</mi> <mrow> <mi>p</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mo>)</mo> </mrow> <mrow> <mo>(</mo> <mi>t</mi> <mo>-</mo> <msub> <mi>t</mi> <mi>p</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <mrow> <mo>(</mo> <mfrac> <msub> <mi>y</mi> <mi>p</mi> </msub> <msub> <mi>h</mi> <mi>p</mi> </msub> </mfrac> <mo>-</mo> <mfrac> <msub> <mi>h</mi> <mi>p</mi> </msub> <mn>6</mn> </mfrac> <msub> <mi>b</mi> <mi>p</mi> </msub> <mo>)</mo> </mrow> <mrow> <mo>(</mo> <msub> <mi>t</mi> <mrow> <mi>p</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mo>-</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>
hp=tp+1-t,0≤p≤P
系数b0,b1,…,bP通过求解式(4)得到;
<mrow> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>b</mi> <mn>0</mn> </msub> <mo>=</mo> <mn>0</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>h</mi> <mrow> <mi>p</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <msub> <mi>b</mi> <mrow> <mi>p</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>+</mo> <mn>2</mn> <mrow> <mo>(</mo> <msub> <mi>h</mi> <mrow> <mi>p</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>+</mo> <msub> <mi>h</mi> <mi>p</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>h</mi> <mi>p</mi> </msub> <msub> <mi>b</mi> <mrow> <mi>p</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mo>=</mo> <mn>6</mn> <mrow> <mo>(</mo> <mo>(</mo> <mrow> <msub> <mi>y</mi> <mrow> <mi>p</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mo>-</mo> <msub> <mi>y</mi> <mi>p</mi> </msub> </mrow> <mo>)</mo> <mo>/</mo> <msub> <mi>h</mi> <mi>p</mi> </msub> <mo>-</mo> <mo>(</mo> <mrow> <msub> <mi>y</mi> <mi>p</mi> </msub> <mo>-</mo> <msub> <mi>y</mi> <mrow> <mi>p</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> </mrow> <mo>)</mo> <mo>/</mo> <msub> <mi>h</mi> <mrow> <mi>p</mi> <mo>-</mo> <mn>1</mn> </mrow> </msub> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>b</mi> <mi>P</mi> </msub> <mo>=</mo> <mn>0</mn> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>
b304:分别计算微型麦克风(3001)与(3002)、(3003)、(3004)采集到观测信号之间的延迟相关系数Cτ的极大值,并利用极大值处对应的延迟时间 计算出声源相对于微型麦克风的方位;
b305:利用延迟时间τ与声速v相乘分别计算8个声源与4个微型麦克风(3001)、(3002)、(3003)、(3004)的距离d1,d3,d6,d8,并通过计算求取与声源距离最近的栅格点gijk,进而得到8个声源距离8个微型麦克风的距离,即声源混合矩阵A;
b4.采用空间搜索的方法以最小化声源之间互信息I为目标函数,同时分离出混合在观测信号x(t)中的所有声源n=1,2,…,8,由于语音信号为短时平稳信号,通常认为在20毫秒的采样时长内等效为平稳信号,因此,以下过程需要在有限时间T内完成,T≤20ms,具体如下:
b401:初始化空间搜索次数r←0,声源混合矩阵A(0)←A,互信息最小值I*←+∞,时间tc←0;
b402:对声源混合矩阵A(r)进行求逆运算得到矩阵W(r),利用计算得到真实声源信号的估计信号并对其进行标准化处理,使得各声源估计信号均值为0方差为1;
b403:采用互信息度量声源信号之间的相互独立性,声源之间的互信息是一个非负指标,当且仅当各信号之间相互独立时互信息为零;分别记xm=(xm(1),…,xm(P))为第m个观测信号,为真实声源信号的估计,P是采样点数目;由此,估计声源信号之间的互信息写为:
<mrow> <msup> <mi>I</mi> <mrow> <mo>(</mo> <mi>r</mi> <mo>)</mo> </mrow> </msup> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>n</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <mi>H</mi> <mrow> <mo>(</mo> <msub> <mover> <mi>s</mi> <mo>^</mo> </mover> <mi>n</mi> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mi>H</mi> <mrow> <mo>(</mo> <mover> <mi>s</mi> <mo>^</mo> </mover> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>5</mn> <mo>)</mo> </mrow> </mrow>
式中,为估计声源信号的边缘熵,为:
<mrow> <mi>H</mi> <mrow> <mo>(</mo> <mover> <mi>s</mi> <mo>^</mo> </mover> <mo>)</mo> </mrow> <mo>=</mo> <mi>H</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>)</mo> </mrow> <mo>+</mo> <mi>l</mi> <mi>o</mi> <mi>g</mi> <mo>|</mo> <mi>det</mi> <mi> </mi> <msup> <mi>A</mi> <mrow> <mo>(</mo> <mi>r</mi> <mo>)</mo> </mrow> </msup> <mo>|</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>7</mn> <mo>)</mo> </mrow> </mrow>
若I(r)<I*,则置I*←I(r),否则,进入下一步;
b404:随机搜索8个声源附近的栅格点,得到一组新的栅格点及其对应的到达微型麦克风的距离,通过查询距离矩阵D,得到新的声源混合矩阵A;
b405:若计算时间tc<T,置迭代次数r←r+1,置下一次迭代的混合矩阵为A(r)←A,返回b402进行迭代计算,否则,结束迭代过程。
CN201410249428.XA 2014-06-06 2014-06-06 一种用于噪声环境下声源分离和定位方法 Active CN104053107B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410249428.XA CN104053107B (zh) 2014-06-06 2014-06-06 一种用于噪声环境下声源分离和定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410249428.XA CN104053107B (zh) 2014-06-06 2014-06-06 一种用于噪声环境下声源分离和定位方法

Publications (2)

Publication Number Publication Date
CN104053107A CN104053107A (zh) 2014-09-17
CN104053107B true CN104053107B (zh) 2018-06-05

Family

ID=51505383

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410249428.XA Active CN104053107B (zh) 2014-06-06 2014-06-06 一种用于噪声环境下声源分离和定位方法

Country Status (1)

Country Link
CN (1) CN104053107B (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10181328B2 (en) * 2014-10-21 2019-01-15 Oticon A/S Hearing system
CN106205628B (zh) * 2015-05-06 2018-11-02 小米科技有限责任公司 声音信号优化方法及装置
CN105096956B (zh) * 2015-08-05 2018-11-20 百度在线网络技术(北京)有限公司 基于人工智能的智能机器人的多声源判断方法及装置
CN105575403A (zh) * 2015-12-25 2016-05-11 重庆邮电大学 一种融合听觉掩蔽与双耳信号帧的互相关声源定位方法
CN106448722B (zh) * 2016-09-14 2019-01-18 讯飞智元信息科技有限公司 录音方法、装置和系统
CN106872944B (zh) * 2017-02-27 2020-05-05 海尔优家智能科技(北京)有限公司 一种基于麦克风阵列的声源定位方法及装置
CN107293305A (zh) * 2017-06-21 2017-10-24 惠州Tcl移动通信有限公司 一种基于盲源分离算法改善录音质量的方法及其装置
CN109413543B (zh) * 2017-08-15 2021-01-19 音科有限公司 一种源信号提取方法、系统和存储介质
CN107644650B (zh) * 2017-09-29 2020-06-05 山东大学 一种基于渐进串行正交化盲源分离算法的改进声源定位方法及其实现系统
CN109951762B (zh) * 2017-12-21 2021-09-03 音科有限公司 一种用于听力设备的源信号提取方法、系统和装置
CN108648758B (zh) * 2018-03-12 2020-09-01 北京云知声信息技术有限公司 医疗场景中分离无效语音的方法及系统
CN109874096A (zh) * 2019-01-17 2019-06-11 天津大学 一种基于智能终端选择输出的双耳麦克风助听器降噪算法
CN110631691B (zh) * 2019-09-09 2021-06-11 国网湖南省电力有限公司 一种电力设备噪声分离效果验证方法、系统、分离设备及介质
CN115843433A (zh) * 2020-08-10 2023-03-24 谷歌有限责任公司 声环境控制系统和方法
CN112599144B (zh) * 2020-12-03 2023-06-06 Oppo(重庆)智能科技有限公司 音频数据处理方法、音频数据处理装置、介质与电子设备
CN114040308B (zh) * 2021-11-17 2023-06-30 郑州航空工业管理学院 一种基于情感增益的皮肤听声助听装置
CN116935883B (zh) * 2023-09-14 2023-12-29 北京探境科技有限公司 声源定位方法、装置、存储介质及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1830026A (zh) * 2001-01-30 2006-09-06 汤姆森特许公司 几何源分离的几何信号处理技术
CN1832633A (zh) * 2005-03-07 2006-09-13 华为技术有限公司 一种声源定位方法
CN103439689A (zh) * 2013-08-21 2013-12-11 大连理工大学 一种分布式麦克风阵列中麦克风位置估计系统
WO2014017134A1 (ja) * 2012-07-27 2014-01-30 ソニー株式会社 情報処理システムおよび記憶媒体

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1830026A (zh) * 2001-01-30 2006-09-06 汤姆森特许公司 几何源分离的几何信号处理技术
CN1832633A (zh) * 2005-03-07 2006-09-13 华为技术有限公司 一种声源定位方法
WO2014017134A1 (ja) * 2012-07-27 2014-01-30 ソニー株式会社 情報処理システムおよび記憶媒体
CN103439689A (zh) * 2013-08-21 2013-12-11 大连理工大学 一种分布式麦克风阵列中麦克风位置估计系统

Also Published As

Publication number Publication date
CN104053107A (zh) 2014-09-17

Similar Documents

Publication Publication Date Title
CN104053107B (zh) 一种用于噪声环境下声源分离和定位方法
CN107644650B (zh) 一种基于渐进串行正交化盲源分离算法的改进声源定位方法及其实现系统
CN103308889B (zh) 复杂环境下被动声源二维doa估计方法
CN103592628A (zh) 一种基于球谐域实值权重波束形成的多声源定位方法
WO2020024816A1 (zh) 音频信号处理方法、装置、设备和存储介质
CN102147458B (zh) 一种针对宽带声源的波达方向估计方法及其装置
CN106405499A (zh) 一种机器人定位声源的方法
CN102411138A (zh) 一种机器人声源定位方法
CN107221336A (zh) 一种增强目标语音的装置及其方法
CN110010147A (zh) 一种麦克风阵列语音增强的方法和系统
WO2019218725A1 (zh) 基于骨传导振动与机器学习的智能输入方法及系统
JP5123595B2 (ja) 近傍場音源分離プログラム、及びこのプログラムを記録したコンピュータ読取可能な記録媒体、並びに近傍場音源分離方法
CN104995679A (zh) 信号源分离
CN108318862A (zh) 一种基于神经网络的声源定位方法
CN104019885A (zh) 声场分析系统
CN102866385A (zh) 一种基于球麦克风阵列的多声源定位方法
CN105976827B (zh) 一种基于集成学习的室内声源定位方法
CN103278801A (zh) 一种变电站噪声成像侦测装置及侦测计算方法
CN110536245A (zh) 一种基于深度学习的室内无线定位方法及系统
CN105225672A (zh) 融合基频信息的双麦克风定向噪音抑制的系统及方法
CN107219512A (zh) 一种基于声传递函数的声源定位方法
CN107144818A (zh) 基于双向双耳匹配滤波器加权融合的双耳声源定位方法
CN103760520A (zh) 一种基于avs和稀疏表示的单语者声源doa估计方法
CN104637494A (zh) 基于盲源分离的双话筒移动设备语音信号增强方法
CN111273231A (zh) 基于不同麦克风阵列拓扑结构分析的室内声源定位方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant