CN104053107A - 用于噪声环境下声源分离和定位的助听装置及方法 - Google Patents
用于噪声环境下声源分离和定位的助听装置及方法 Download PDFInfo
- Publication number
- CN104053107A CN104053107A CN201410249428.XA CN201410249428A CN104053107A CN 104053107 A CN104053107 A CN 104053107A CN 201410249428 A CN201410249428 A CN 201410249428A CN 104053107 A CN104053107 A CN 104053107A
- Authority
- CN
- China
- Prior art keywords
- msub
- mrow
- mfrac
- sound source
- centerdot
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000000926 separation method Methods 0.000 claims abstract description 42
- 230000006870 function Effects 0.000 claims abstract description 15
- 239000011159 matrix material Substances 0.000 claims description 32
- 238000005070 sampling Methods 0.000 claims description 24
- 238000004364 calculation method Methods 0.000 claims description 13
- 230000004807 localization Effects 0.000 claims description 9
- 238000012804 iterative process Methods 0.000 claims description 3
- 230000005236 sound signal Effects 0.000 abstract 1
- 238000004891 communication Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
Abstract
本发明涉及助听装置及方法,具体指一种用于噪声环境下声源分离和定位的助听装置及方法,包括麦克风阵列、声源位置显示器、声源分离与定位模块、信号采集器、模拟信号放大器和声源选择键盘,声源分离与定位模块采用互相关法对采集的麦克风信号进行处理,得到8个声源相对于麦克风阵列的初始方位,采用基于空间搜索的盲源分离方法对采集的麦克风信号进行处理,得到包含交谈对象和其他人说话声音的声源,用户通过声源选择键盘选择出属于交谈对象的声源,根据选择的声源计算出交谈对象相对于麦克风阵列的准确方位,并在声源位置显示器中显示该声源的方位;实现噪声环境下交谈双方语音信号自动分离,同时增加了语音信号源的定位功能,使用方便。
Description
技术领域
本发明涉及助听装置及方法,具体指一种用于噪声环境下声源分离和定位的助听装置及方法。
背景技术
在户外或工业现场等嘈杂环境的语音交流中,助听装置是增强语音品质提高沟通效果的重要设备。在嘈杂环境下用户所感兴趣的有用信号会受到环境噪音或其它语音干扰,有用信号的信噪比较低,进而严重影响用户之间的正常交流。现有的助听设备大多数仍采用简单的信号放大功能,少数具有语音清晰功能的设备也仅对环境背景噪声有效,对于交流现场中其它语音的干扰无能为力。
发明内容
针对现有技术存在的上述问题,本发明解决的技术问题是:实现噪声环境下交谈双方语音信号自动分离,同时增加了语音信号源的定位功能,操作方便。
解决该技术问题,本发明是这样实现的:一种用于噪声环境下声源分离和定位的助听装置,其特征在于:包括麦克风阵列(1006)、声源位置显示器(1001)、声源分离与定位模块(1002)、信号采集器(1003)、模拟信号放大器(1004)和声源选择键盘(1005);
所述麦克风阵列(1006)、模拟信号放大器(1004)、信号采集器(1003)、声源分离与定位模块(1002)和声源位置显示器(1001)依次连接;
所述声源选择键盘(1005)与声源分离与定位模块(1002)连接;
所述声源分离与定位模块(1002)采用互相关法对采集的麦克风信号进行处理,得到8个声源相对于麦克风阵列的初始方位;采用基于空间搜索的盲源分离方法对采集的麦克风信号进行处理,得到包含交谈对象(1009)和其他人(1010)说话声音的声源,用户通过声源选择键盘(1005)选择出属于交谈对象(1009)的声源,根据选择的声源计算出交谈对象(1009)相对于麦克风阵列(1006)的准确方位,并在声源位置显示器(1001)中显示该声源的方位。
进一步,所述麦克风阵列(1006)由微型麦克风(1007)构成;
所述麦克风阵列(1006)由8个独立的微型麦克风(1007)按照图中方式均匀排列在正方形的边上,正方形边长为10厘米,任意两个微型麦克风(1007)中心点之间的距离(1008)为5厘米;
所述微型麦克风(1007)的指向性为全向型(无指向),直径小于1厘米。
本发明噪声环境下声源分离和定位方法,其特征在于:包括如下步骤:
a.采用权利要求1所述的助听装置对交谈过程中的语音信号进行采集;
a1.所述助听装置采用模拟信号放大器(1004)对麦克风阵列(1006)中8个微型麦克风(1007)的语音信号进行放大,放大后的信号传输至信号采集器(1003);
a2.所述信号采集器(1003)对模拟信号放大器(1004)放大后的信号进行滤波、模/数转换和采集,采样频率为16KHz,采样精度为16位,并对采集的信号进行储存;
b.所述声源分离与定位模块(1002)采用基于空间搜索的盲源分离方法对采集的麦克风信号进行处理,具体步骤如下:
b1.信号采集器得到8路观测信号x(t)=[x1(t),x2(t),...,x8(t)]T,t为采样时刻;
b2.观测信号x(t)可以被建模为8个声源s(t)=[s1(t),s2(t),...,s8(t)]T的线性混合:
式(1)中v为空气中声音传播的速度,约为340米/秒;amn,m,n=1,2,...8为第n个声源到达第m个微型麦克风的距离,声源信号的幅值衰减与距离amn成反比关系,声源sn,n=1,2,...,8到达各微型麦克风的时间延迟与距离amn成正比关系;η(t)=(η1(t),η2(t),...,η8(t))T为微型麦克风的噪声;公式(1)可以简写为
x(t)=As(t)+η(t) (2)式(2)中A∈□8×8为声源混合矩阵;
b3.采用互相关法对对采集的麦克风信号进行处理,计算得到声源相对于麦克风阵列的初始方位,具体如下:
b301:为了降低声源定位和分离算法的复杂度,构建一个栅格化的正方体,并存储每个栅格顶点至微型麦克风(2003)的距离。参见图2,将麦克风阵列正前方的正方体区域进行栅格化处理,正方体的边长为10厘米,栅格的边长为1厘米,最小栅格的边长为1厘米,记栅格顶点(2001)为gijk,i,j,k=1,2,...10;
b302:栅格顶点gijk距离第m个微型麦克风(2003)的距离(2002)为dm,将gijk至8个微型麦克风(2003)的距离写作列向量形式为d,将所有栅格顶点至微型麦克风的距离写作矩阵形式为D,矩阵的第l列表示第(k-1)×100+(j-1)×10+i个栅格点;
b303:由公式(1)可知,任意两路观测信号xm(t)与xm′(t),m,m′∈{1,2,...8}进行延迟相关运算Cτ=xm(t)·xm′(t-τ),τ∈[-0.414v,0.414v],τ为延迟时间,必然存在8个极大值由于τ非采样时间间隔的整数倍,在计算时需要首先对观测信号x(t)进行自然三次样条插值,对于采样时刻t0,t1,...,tP,对应的采样点xm=[y0,y1,...,yP]T,P为采样点数目,插值计算后得到的观测信号为插值函数为:
hp=tp+1-t,0≤p≤P
系数b0,b1,...,bP可以通过求解式(4)所述方程得到。
b304:参见图3,分别计算微型麦克风(3001)与(3002)、(3003)、(3004)采集到观测信号之间的延迟相关系数Cτ的极大值,并利用极大值处对应的延迟时间和可以计算出图3所示的声源相对于微型麦克风的方位;
b305:利用延迟时间τ与声速v相乘分别计算8个声源与4个微型麦克风(3001)、(3002)、(3003)、(3004)的距离d1,d3,d6,d8,并通过计算求取与声源距离最近的栅格点gijk,进而得到8个声源距离8个微型麦克风的距离,即声源混合矩阵A;
b4.采用空间搜索的方法以最小化声源之间互信息I为目标函数,同时分离出混合在观测信号x(t)中的所有声源由于语音信号为短时平稳信号,通常认为在20毫秒的采样时长内可以等效为平稳信号,因此,以下过程需要在有限时间T内完成,T≤20ms,具体如下:
b401:初始化空间搜索次数r←0,声源混合矩阵A(0)←A,互信息最小值I*←+∞,时间tc←0;
b402:对声源混合矩阵A(r)进行求逆运算得到矩阵W(r),利用计算得到真实声源信号的估计信号并对其进行标准化处理,使得各声源估计信号均值为0方差为1;
b403:采用互信息度量声源信号之间的相互独立性,声源之间的互信息是一个非负指标,当且仅当各信号之间相互独立时互信息为零。分别记xm=(xm(1),…,xm(P))为第m个观测信号,为真实声源信号的估计,P是采样点数目。由此,估计声源信号之间的互信息可以写为:
式中,为估计声源信号的边缘熵,表示估计声源信号的联合熵;
由于边缘熵中含有概率分布项,无法直接计算实际计算中采用多项式密度展开来近似熵,这种近似方法具有较高的计算效率,其形式为:
其中,是斜度,为规范化的峭度;估计声源信号的联合熵为:
若I(r)<I*,则置I*←I(r),否则,进入下一步;
b404:随机搜索8个声源附近的栅格点,得到一组新的栅格点及其对应的到达微型麦克风的距离,通过查询距离矩阵D,得到新的声源混合矩阵A;
b405:若计算时间tc<T,置迭代次数r←r+1,置下一次迭代的混合矩阵为A(r)←A,返回b402进行迭代计算,否则,结束迭代过程。
相对于现有技术,本发明具有如下优点:
1、本发明中构成助听装置的麦克风阵列、模拟信号放大器、信号采集器、声源分离与定位模块和声源位置显示器依次连接,声源选择键盘与声源分离与定位模块连接,声源分离与定位模块采用互相关法和基于空间搜索的盲源分离方法对采集到的微型麦克风信号进行处理,可以得到8个声源的估计信号及其相对于阵列麦克风的方位。
2、由于本发明采用栅格化声源信号空间的方法,建立声源到达各微型麦克风的距离矩阵,利用随机搜索声源附近栅格点的方式,降低了声源信号分离算法的计算复杂度,提高了声源混合矩阵的估计效率,进而保证了声源信号分离的实时性。
3、由于本发明配置了声源选择键盘,用户可以通过键盘交互选择出交谈对象的声源,通过声源分离与定位模块实时计算交谈对象的准确方位,并在声源位置显示器中显示该声源的方位,提高了助听器的可配置性和可视化效果。
附图说明
图1-本发明的功能框图。
图2-本发明的栅格化正方体示意图。
图3-本发明的声源定位示意图。
图4-实施例的功能框图。
图中,1001-声源位置显示器、1002-声源分离与定位模块、1003-信号采集器、1004-模拟信号放大器、1005-声源选择键盘、1006-阵列麦克风、1007-微型麦克风、1008-微型麦克风中心距离、1009-交谈对象、1010-其他声源、2001-栅格顶点、2002-栅格顶点至微型麦克风的距离、2003-微型麦克风、3001-微型麦克风1、3002-微型麦克风3、3003-微型麦克风6、3004-微型麦克风8、4001-麦克风阵列、4002-模拟放大器、4003-带通滤波器、4004-模拟开关、4005-模/数转换器、4006-微型处理器、4007-液晶显示器、4008-键盘。
具体实施方式
下面结合具体实施例对本发明作进一步详细说明。
参见图1,一种用于噪声环境下声源分离和定位的助听装置,包括麦克风阵列(1006)、声源位置显示器(1001)、声源分离与定位模块(1002)、信号采集器(1003)、模拟信号放大器(1004)和声源选择键盘(1005);
所述麦克风阵列(1006)、模拟信号放大器(1004)、信号采集器(1003)、声源分离与定位模块(1002)和声源位置显示器(1001)依次连接;
所述声源选择键盘(1005)与声源分离与定位模块(1002)连接;
所述麦克风阵列(1006)由微型麦克风(1007)构成;
所述麦克风阵列(1006)由8个独立的微型麦克风(1007)按照图中方式均匀排列在正方形的边上,正方形边长为10厘米,任意两个微型麦克风(1007)中心点之间的距离(1008)为5厘米;
所述微型麦克风(1007)的指向性为全向型(无指向),直径小于1厘米。
声源分离与定位模块(1002)具有两个主要功能,一个功能是采用互相关法对采集的麦克风信号进行处理,得到8个声源相对于麦克风阵列的初始方位;另一个功能是采用基于空间搜索的盲源分离方法对采集的麦克风信号进行处理,得到包含交谈对象(1009)和其他人(1010)说话声音的声源,用户可以通过声源选择键盘(1005)选择出属于交谈对象(1009)的声源,根据选择的声源计算出交谈对象(1009)相对于麦克风阵列(1006)的准确方位,并在声源位置显示器(1001)中显示该声源的方位。
噪声环境下声源分离和定位方法通过如下步骤实现:
a.语音信号进行采集,具体步骤如下:
a1.所述助听装置采用模拟信号放大器(1004)对麦克风阵列(1006)中8个微型麦克风(1007)的语音信号进行放大,放大后的信号传输至信号采集器(1003);
a2.所述信号采集器(1003)对模拟信号放大器(1004)放大后的信号进行滤波、模/数转换和采集,采样频率为16KHz,采样精度为16位,并对采集的信号进行储存;
b.所述声源分离与定位模块(1002)采用基于空间搜索的盲源分离方法对采集的麦克风信号进行处理,具体步骤如下:
b1.信号采集器得到8路观测信号x(t)=[x1(t),x2(t),...,x8(t)]T,t为采样时刻;
b2.观测信号x(t)可以被建模为8个声源s(t)=[s1(t),s2(t),...,s8(t)]T的线性混合:
式(1)中v为空气中声音传播的速度,约为340米/秒;amn,m,n=1,2,...8为第n个声源到达第m个微型麦克风的距离,声源信号的幅值衰减与距离amn成反比关系,声源sn,n=1,2,...,8到达各微型麦克风的时间延迟与距离amn成正比关系;η(t)=(η1(t),η2(t),...,η8(t))T为微型麦克风的噪声;公式(8)可以简写为
x(t)=As(t)+η(t) (9)式(9)中A∈□8×8为声源混合矩阵;
b3.采用互相关法对对采集的麦克风信号进行处理,计算得到声源相对于麦克风阵列的初始方位,具体如下:
b301:为了降低声源定位和分离算法的复杂度,构建一个栅格化的正方体,并存储每个栅格顶点至微型麦克风(2003)的距离。参见图2,将麦克风阵列正前方的正方体区域进行栅格化处理,正方体的边长为10厘米,栅格的边长为1厘米,最小栅格的边长为1厘米,记栅格顶点(2001)为gijk,i,j,k=1,2,...10;
b302:栅格顶点gijk距离第m个微型麦克风(2003)的距离(2002)为dm,将gijk至8个微型麦克风(2003)的距离写作列向量形式为d,将所有栅格顶点至微型麦克风的距离写作矩阵形式为D,矩阵的第l列表示第(k-1)×100+(j-1)×10+i个栅格点;
b303:由公式(8)可知,任意两路观测信号xm(t)与xm′(t),m,m′∈{1,2,...8}进行延迟相关运算Cτ=xm(t)·xm′(t-τ),τ∈[-0.414v,0.414v],τ为延迟时间,必然存在8个极大值由于τ非采样时间间隔的整数倍,在计算时需要首先对观测信号x(t)进行自然三次样条插值,对于采样时刻t0,t1,...,tP,对应的采样点xm=[y0,y1,...,yP]T,P为采样点数目,插值计算后得到的观测信号为插值函数为:
hp=tp+1-t,0≤p≤P
系数b0,b1,...,bP可以通过求解式(11)所述方程得到。
b304:参见图3,分别计算微型麦克风(3001)与(3002)、(3003)、(3004)采集到观测信号之间的延迟相关系数Cτ的极大值,并利用极大值处对应的延迟时间和可以计算出图3所示的声源相对于微型麦克风的方位;
b305:利用延迟时间τ与声速v相乘分别计算8个声源与4个微型麦克风(3001)、(3002)、(3003)、(3004)的距离d1,d3,d6,d8,并通过计算求取与声源距离最近的栅格点gijk,进而得到8个声源距离8个微型麦克风的距离,即声源混合矩阵A;
b4.采用空间搜索的方法以最小化声源之间互信息I为目标函数,同时分离出混合在观测信号x(t)中的所有声源由于语音信号为短时平稳信号,通常认为在20毫秒的采样时长内可以等效为平稳信号,因此,以下过程需要在有限时间T内完成,T≤20ms,具体如下:
b401:初始化空间搜索次数r←0,声源混合矩阵A(0)←A,互信息最小值I*←+∞,时间tc←0;
b402:对声源混合矩阵A(r)进行求逆运算得到矩阵W(r),利用计算得到真实声源信号的估计信号并对其进行标准化处理,使得各声源估计信号均值为0方差为1;
b403:采用互信息度量声源信号之间的相互独立性,声源之间的互信息是一个非负指标,当且仅当各信号之间相互独立时互信息为零。分别记xm=(xm(1),...,xm(P))为第m个观测信号,为真实声源信号的估计,P是采样点数目。由此,估计声源信号之间的互信息可以写为:
式中,为估计声源信号的边缘熵,表示估计声源信号的联合熵;
由于边缘熵中含有概率分布项,无法直接计算实际计算中采用多项式密度展开来近似熵,这种近似方法具有较高的计算效率,其形式为:
其中,是斜度,为规范化的峭度;估计声源信号的联合熵为:
若I(r)<I*,则置I*←I(r),否则,进入下一步;
b404:随机搜索8个声源附近的栅格点,得到一组新的栅格点及其对应的到达微型麦克风的距离,通过查询距离矩阵D,得到新的声源混合矩阵A;
b405:若计算时间tc<T,置迭代次数r←r+1,置下一次迭代的混合矩阵为A(r)←A,返回b402进行迭代计算,否则,结束迭代过程。
实施例:如图4所示,麦克风阵列4001选用8个微型麦克风(CMA-4544PF-W)构成,微型麦克风的直径为9.7毫米,模拟放大器4002采用由运算放大器OP07构成的100倍固定级增益实现,带通滤波器4003由OP07构成的四阶高通滤波器和四阶低通滤波器组成,高通滤波器截止频率为20Hz,低通滤波器截止频率为20KHz,模拟开关4004和模/数转换器由LTC1867实现,LTC1867内部包含一个8通道模拟输入开关和一个16位的模/数转换器,通过串行接口与微型处理器4006进行通信,实现通道选择和数据采集,微型处理器4006采用16位25MHz的超低功耗微处理器(MSP430F5529),键盘采用3个独立按键实现声源选择和音量增加和减小控制功能,液晶显示器选用240×320分辨率的低功耗黑白液晶显示屏。在MSP430F5529上实现声源分离与定位模块的功能,采用互相关法对采集的麦克风信号进行处理,得到8个声源相对于麦克风阵列的初始方位;采用基于空间搜索的盲源分离方法对采集的麦克风信号进行处理,得到包含交谈对象(1009)和其他人(1010)说话声音的声源,用户可以通过声源选择键盘(4008)选择出属于交谈对象(1009)的声源,根据选择的声源计算出交谈对象(1009)相对于麦克风阵列(1006)的准确方位,并在声源位置显示器(4007)中显示该声源的方位。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (3)
1.一种用于噪声环境下声源分离和定位的助听装置,其特征在于:包括麦克风阵列(1006)、声源位置显示器(1001)、声源分离与定位模块(1002)、信号采集器(1003)、模拟信号放大器(1004)和声源选择键盘(1005);
所述麦克风阵列(1006)、模拟信号放大器(1004)、信号采集器(1003)、声源分离与定位模块(1002)和声源位置显示器(1001)依次连接;
所述声源选择键盘(1005)与声源分离与定位模块(1002)连接;
所述声源分离与定位模块(1002)采用互相关法对采集的麦克风信号进行处理,得到8个声源相对于麦克风阵列的初始方位;采用基于空间搜索的盲源分离方法对采集的麦克风信号进行处理,得到包含交谈对象(1009)和其他人(1010)说话声音的声源,用户通过声源选择键盘(1005)选择出属于交谈对象(1009)的声源,根据选择的声源计算出交谈对象(1009)相对于麦克风阵列(1006)的准确方位,并在声源位置显示器(1001)中显示该声源的方位。
2.所述麦克风阵列(1006)由微型麦克风(1007)构成;
所述麦克风阵列(1006)由8个独立的微型麦克风(1007)按照图中方式均匀排列在正方形的边上,正方形边长为10厘米,任意两个微型麦克风(1007)中心点之间的距离(1008)为5厘米;
所述微型麦克风(1007)的指向性为全向型(无指向),直径小于1厘米。
3.噪声环境下声源分离和定位方法,其特征在于:包括如下步骤:
a.采用权利要求1所述的助听装置对交谈过程中的语音信号进行采集;
a1.所述助听装置采用模拟信号放大器(1004)对麦克风阵列(1006)中8个微型麦克风(1007)的语音信号进行放大,放大后的信号传输至信号采集器(1003);
a2.所述信号采集器(1003)对模拟信号放大器(1004)放大后的信号进行滤波、模/数转换和采集,采样频率为16KHz,采样精度为16位,并对采集的信号进行储存;
b.所述声源分离与定位模块(1002)采用基于空间搜索的盲源分离方法对采集的麦克风信号进行处理,具体步骤如下:
b1.信号采集器得到8路观测信号x(t)=[x1(t),x2(t),...,x8(t)]T,t为采样时刻;
b2.观测信号x(t)可以被建模为8个声源s(t)=[s1(t),s2(t),...,s8(t)]T的线性混合:
式(1)中v为空气中声音传播的速度,约为340米/秒;amn,m,n=1,2,...8为第n个声源到达第m个微型麦克风的距离,声源信号的幅值衰减与距离amn成反比关系,声源sn,n=1,2,...,8到达各微型麦克风的时间延迟与距离amn成正比关系;η(t)=(η1(t),η2(t),...,η8(t))T为微型麦克风的噪声;公式(1)可以简写为
x(t)=As(t)+η(t) (2)式(2)中A∈□8×8为声源混合矩阵;
b3.采用互相关法对对采集的麦克风信号进行处理,计算得到声源相对于麦克风阵列的初始方位,具体如下:
b301:为了降低声源定位和分离算法的复杂度,构建一个栅格化的正方体,并存储每个栅格顶点至微型麦克风(2003)的距离。参见图2,将麦克风阵列正前方的正方体区域进行栅格化处理,正方体的边长为10厘米,栅格的边长为1厘米,最小栅格的边长为1厘米,记栅格顶点(2001)为gijk,i,j,k=1,2,...10;
b302:栅格顶点gijk距离第m个微型麦克风(2003)的距离(2002)为dm,将gijk至8个微型麦克风(2003)的距离写作列向量形式为d,将所有栅格顶点至微型麦克风的距离写作矩阵形式为D,矩阵的第l列表示第(k-1)×100+(j-1)×10+i个栅格点;
b303:由公式(1)可知,任意两路观测信号xm(t)与xm′(t),m,m′∈{1,2,...8}进行延迟相关运算Cτ=xm(t)·xm′(t-τ),τ∈[-0.414/v,0.414/v],τ为延迟时间,必然存在8个极大值由于τ非采样时间间隔的整数倍,在计算时需要首先对观测信号x(t)进行自然三次样条插值,对于采样时刻t0,t1,...,tP,对应的采样点xm=[y0,y1,...,yP]T,P为采样点数目,插值计算后得到的观测信号为插值函数为:
hp=tp+1-t,0≤p≤P
系数b0,b1,...,bP可以通过求解式(4)所述方程得到。
b304:参见图3,分别计算微型麦克风(3001)与(3002)、(3003)、(3004)采集到观测信号之间的延迟相关系数Cτ的极大值,并利用极大值处对应的延迟时间和可以计算出图3所示的声源相对于微型麦克风的方位;
b305:利用延迟时间τ与声速v相乘分别计算8个声源与4个微型麦克风(3001)、(3002)、(3003)、(3004)的距离d1,d3,d6,d8,并通过计算求取与声源距离最近的栅格点gijk,进而得到8个声源距离8个微型麦克风的距离,即声源混合矩阵A;
b4.采用空间搜索的方法以最小化声源之间互信息I为目标函数,同时分离出混合在观测信号x(t)中的所有声源由于语音信号为短时平稳信号,通常认为在20毫秒的采样时长内可以等效为平稳信号,因此,以下过程需要在有限时间T内完成,T≤20ms,具体如下:
b401:初始化空间搜索次数r←0,声源混合矩阵A(0)←A,互信息最小值I*←+∞,时间tc←0;
b402:对声源混合矩阵A(r)进行求逆运算得到矩阵W(r),利用计算得到真实声源信号的估计信号并对其进行标准化处理,使得各声源估计信号均值为0方差为1;
b403:采用互信息度量声源信号之间的相互独立性,声源之间的互信息是一个非负指标,当且仅当各信号之间相互独立时互信息为零。分别记xm=(xm(1),…,xm(P))为第m个观测信号,为真实声源信号的估计,P是采样点数目。由此,估计声源信号之间的互信息可以写为:
式中,为估计声源信号的边缘熵,表示估计声源信号的联合熵;
由于边缘熵中含有概率分布项,无法直接计算实际计算中采用多项式密度展开来近似熵,这种近似方法具有较高的计算效率,其形式为:
若I(r)<I*,则置I*←I(r),否则,进入下一步;
b404:随机搜索8个声源附近的栅格点,得到一组新的栅格点及其对应的到达微型麦克风的距离,通过查询距离矩阵D,得到新的声源混合矩阵A;
b405:若计算时间tc<T,置迭代次数r←r+1,置下一次迭代的混合矩阵为A(r)←A,返回b402进行迭代计算,否则,结束迭代过程。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410249428.XA CN104053107B (zh) | 2014-06-06 | 2014-06-06 | 一种用于噪声环境下声源分离和定位方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410249428.XA CN104053107B (zh) | 2014-06-06 | 2014-06-06 | 一种用于噪声环境下声源分离和定位方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104053107A true CN104053107A (zh) | 2014-09-17 |
CN104053107B CN104053107B (zh) | 2018-06-05 |
Family
ID=51505383
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410249428.XA Active CN104053107B (zh) | 2014-06-06 | 2014-06-06 | 一种用于噪声环境下声源分离和定位方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104053107B (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105096956A (zh) * | 2015-08-05 | 2015-11-25 | 百度在线网络技术(北京)有限公司 | 基于人工智能的智能机器人的多声源判断方法及装置 |
CN105530580A (zh) * | 2014-10-21 | 2016-04-27 | 奥迪康有限公司 | 听力系统 |
CN105575403A (zh) * | 2015-12-25 | 2016-05-11 | 重庆邮电大学 | 一种融合听觉掩蔽与双耳信号帧的互相关声源定位方法 |
WO2016176951A1 (zh) * | 2015-05-06 | 2016-11-10 | 小米科技有限责任公司 | 声音信号优化方法及装置 |
CN106448722A (zh) * | 2016-09-14 | 2017-02-22 | 科大讯飞股份有限公司 | 录音方法、装置和系统 |
CN106872944A (zh) * | 2017-02-27 | 2017-06-20 | 海尔优家智能科技(北京)有限公司 | 一种基于麦克风阵列的声源定位方法及装置 |
CN107293305A (zh) * | 2017-06-21 | 2017-10-24 | 惠州Tcl移动通信有限公司 | 一种基于盲源分离算法改善录音质量的方法及其装置 |
CN107644650A (zh) * | 2017-09-29 | 2018-01-30 | 山东大学 | 一种基于渐进串行正交化盲源分离算法的改进声源定位方法及其实现系统 |
CN108648758A (zh) * | 2018-03-12 | 2018-10-12 | 北京云知声信息技术有限公司 | 医疗场景中分离无效语音的方法及系统 |
CN109413543A (zh) * | 2017-08-15 | 2019-03-01 | 音科有限公司 | 一种源信号提取方法、系统和存储介质 |
CN109874096A (zh) * | 2019-01-17 | 2019-06-11 | 天津大学 | 一种基于智能终端选择输出的双耳麦克风助听器降噪算法 |
CN109951762A (zh) * | 2017-12-21 | 2019-06-28 | 音科有限公司 | 一种用于听力设备的源信号提取方法、系统和装置 |
CN110631691A (zh) * | 2019-09-09 | 2019-12-31 | 国网湖南省电力有限公司 | 一种电力设备噪声分离效果验证方法、系统、分离设备及介质 |
CN112599144A (zh) * | 2020-12-03 | 2021-04-02 | Oppo(重庆)智能科技有限公司 | 音频数据处理方法、音频数据处理装置、介质与电子设备 |
CN114040308A (zh) * | 2021-11-17 | 2022-02-11 | 郑州航空工业管理学院 | 一种基于情感增益的皮肤听声助听装置 |
CN115843433A (zh) * | 2020-08-10 | 2023-03-24 | 谷歌有限责任公司 | 声环境控制系统和方法 |
CN116935883A (zh) * | 2023-09-14 | 2023-10-24 | 北京探境科技有限公司 | 声源定位方法、装置、存储介质及电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1830026A (zh) * | 2001-01-30 | 2006-09-06 | 汤姆森特许公司 | 几何源分离的几何信号处理技术 |
CN1832633A (zh) * | 2005-03-07 | 2006-09-13 | 华为技术有限公司 | 一种声源定位方法 |
CN103439689A (zh) * | 2013-08-21 | 2013-12-11 | 大连理工大学 | 一种分布式麦克风阵列中麦克风位置估计系统 |
WO2014017134A1 (ja) * | 2012-07-27 | 2014-01-30 | ソニー株式会社 | 情報処理システムおよび記憶媒体 |
-
2014
- 2014-06-06 CN CN201410249428.XA patent/CN104053107B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1830026A (zh) * | 2001-01-30 | 2006-09-06 | 汤姆森特许公司 | 几何源分离的几何信号处理技术 |
CN1832633A (zh) * | 2005-03-07 | 2006-09-13 | 华为技术有限公司 | 一种声源定位方法 |
WO2014017134A1 (ja) * | 2012-07-27 | 2014-01-30 | ソニー株式会社 | 情報処理システムおよび記憶媒体 |
CN103439689A (zh) * | 2013-08-21 | 2013-12-11 | 大连理工大学 | 一种分布式麦克风阵列中麦克风位置估计系统 |
Cited By (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105530580B (zh) * | 2014-10-21 | 2020-08-11 | 奥迪康有限公司 | 听力系统 |
CN105530580A (zh) * | 2014-10-21 | 2016-04-27 | 奥迪康有限公司 | 听力系统 |
WO2016176951A1 (zh) * | 2015-05-06 | 2016-11-10 | 小米科技有限责任公司 | 声音信号优化方法及装置 |
US20160330548A1 (en) * | 2015-05-06 | 2016-11-10 | Xiaomi Inc. | Method and device of optimizing sound signal |
CN106205628A (zh) * | 2015-05-06 | 2016-12-07 | 小米科技有限责任公司 | 声音信号优化方法及装置 |
US10499156B2 (en) * | 2015-05-06 | 2019-12-03 | Xiaomi Inc. | Method and device of optimizing sound signal |
CN106205628B (zh) * | 2015-05-06 | 2018-11-02 | 小米科技有限责任公司 | 声音信号优化方法及装置 |
CN105096956A (zh) * | 2015-08-05 | 2015-11-25 | 百度在线网络技术(北京)有限公司 | 基于人工智能的智能机器人的多声源判断方法及装置 |
CN105096956B (zh) * | 2015-08-05 | 2018-11-20 | 百度在线网络技术(北京)有限公司 | 基于人工智能的智能机器人的多声源判断方法及装置 |
CN105575403A (zh) * | 2015-12-25 | 2016-05-11 | 重庆邮电大学 | 一种融合听觉掩蔽与双耳信号帧的互相关声源定位方法 |
CN106448722A (zh) * | 2016-09-14 | 2017-02-22 | 科大讯飞股份有限公司 | 录音方法、装置和系统 |
CN106448722B (zh) * | 2016-09-14 | 2019-01-18 | 讯飞智元信息科技有限公司 | 录音方法、装置和系统 |
CN106872944A (zh) * | 2017-02-27 | 2017-06-20 | 海尔优家智能科技(北京)有限公司 | 一种基于麦克风阵列的声源定位方法及装置 |
CN107293305A (zh) * | 2017-06-21 | 2017-10-24 | 惠州Tcl移动通信有限公司 | 一种基于盲源分离算法改善录音质量的方法及其装置 |
CN109413543A (zh) * | 2017-08-15 | 2019-03-01 | 音科有限公司 | 一种源信号提取方法、系统和存储介质 |
CN109413543B (zh) * | 2017-08-15 | 2021-01-19 | 音科有限公司 | 一种源信号提取方法、系统和存储介质 |
CN107644650B (zh) * | 2017-09-29 | 2020-06-05 | 山东大学 | 一种基于渐进串行正交化盲源分离算法的改进声源定位方法及其实现系统 |
CN107644650A (zh) * | 2017-09-29 | 2018-01-30 | 山东大学 | 一种基于渐进串行正交化盲源分离算法的改进声源定位方法及其实现系统 |
CN109951762B (zh) * | 2017-12-21 | 2021-09-03 | 音科有限公司 | 一种用于听力设备的源信号提取方法、系统和装置 |
CN109951762A (zh) * | 2017-12-21 | 2019-06-28 | 音科有限公司 | 一种用于听力设备的源信号提取方法、系统和装置 |
CN108648758A (zh) * | 2018-03-12 | 2018-10-12 | 北京云知声信息技术有限公司 | 医疗场景中分离无效语音的方法及系统 |
CN108648758B (zh) * | 2018-03-12 | 2020-09-01 | 北京云知声信息技术有限公司 | 医疗场景中分离无效语音的方法及系统 |
CN109874096A (zh) * | 2019-01-17 | 2019-06-11 | 天津大学 | 一种基于智能终端选择输出的双耳麦克风助听器降噪算法 |
CN110631691A (zh) * | 2019-09-09 | 2019-12-31 | 国网湖南省电力有限公司 | 一种电力设备噪声分离效果验证方法、系统、分离设备及介质 |
CN110631691B (zh) * | 2019-09-09 | 2021-06-11 | 国网湖南省电力有限公司 | 一种电力设备噪声分离效果验证方法、系统、分离设备及介质 |
CN115843433A (zh) * | 2020-08-10 | 2023-03-24 | 谷歌有限责任公司 | 声环境控制系统和方法 |
US12067331B2 (en) | 2020-08-10 | 2024-08-20 | Google Llc | Systems and methods for control of an acoustic environment |
CN112599144A (zh) * | 2020-12-03 | 2021-04-02 | Oppo(重庆)智能科技有限公司 | 音频数据处理方法、音频数据处理装置、介质与电子设备 |
CN114040308A (zh) * | 2021-11-17 | 2022-02-11 | 郑州航空工业管理学院 | 一种基于情感增益的皮肤听声助听装置 |
CN116935883A (zh) * | 2023-09-14 | 2023-10-24 | 北京探境科技有限公司 | 声源定位方法、装置、存储介质及电子设备 |
CN116935883B (zh) * | 2023-09-14 | 2023-12-29 | 北京探境科技有限公司 | 声源定位方法、装置、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN104053107B (zh) | 2018-06-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104053107B (zh) | 一种用于噪声环境下声源分离和定位方法 | |
US7113605B2 (en) | System and process for time delay estimation in the presence of correlated noise and reverberation | |
KR101238362B1 (ko) | 음원 거리에 따라 음원 신호를 여과하는 방법 및 장치 | |
RU2642353C2 (ru) | Устройство и способ для обеспечения информированной оценки вероятности и присутствия многоканальной речи | |
US20170140771A1 (en) | Information processing apparatus, information processing method, and computer program product | |
JP5123595B2 (ja) | 近傍場音源分離プログラム、及びこのプログラムを記録したコンピュータ読取可能な記録媒体、並びに近傍場音源分離方法 | |
CN105976826A (zh) | 应用于双麦克风小型手持设备的语音降噪方法 | |
CN103428609A (zh) | 用于去除噪声的设备和方法 | |
Levin et al. | Near-field signal acquisition for smartglasses using two acoustic vector-sensors | |
US20140269198A1 (en) | Beamforming Sensor Nodes And Associated Systems | |
Fejgin et al. | BRUDEX database: Binaural room impulse responses with uniformly distributed external microphones | |
JP5451562B2 (ja) | 音響処理システム及びこれを用いた機械 | |
US20220417679A1 (en) | Speech-Tracking Listening Device | |
KR20030046727A (ko) | 서브밴드 씨피에스피 알고리듬을 이용한 음원위치추정방법및 그 시스템 | |
CN116343808A (zh) | 柔性麦克风阵列语音增强方法及装置、电子设备、介质 | |
US11823698B2 (en) | Audio cropping | |
JP2002062900A (ja) | 収音装置及び受信装置 | |
Hayashida et al. | Near field sound source localization based on cross-power spectrum phase analysis with multiple microphones. | |
JP2005227511A (ja) | 対象音検出方法、音信号処理装置、音声認識装置及びプログラム | |
Wang et al. | Robust distant speech recognition based on position dependent CMN | |
Naqvi et al. | A multimodal approach for frequency domain independent component analysis with geometrically-based initialization | |
WO2023001850A1 (en) | Audio signal separation and cropping | |
Ko et al. | Datasets for Detection and Localization of Speech Buried in Drone Noise | |
Takada et al. | Speech enhancement using square microphone array for mobile devices | |
Amerineni | Multi Channel Sub Band Wiener Beamformer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |