CN104167214A - 一种双麦克风盲声源分离的快速源信号重建方法 - Google Patents
一种双麦克风盲声源分离的快速源信号重建方法 Download PDFInfo
- Publication number
- CN104167214A CN104167214A CN201410412547.2A CN201410412547A CN104167214A CN 104167214 A CN104167214 A CN 104167214A CN 201410412547 A CN201410412547 A CN 201410412547A CN 104167214 A CN104167214 A CN 104167214A
- Authority
- CN
- China
- Prior art keywords
- signal
- source
- source signal
- time
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
该发明公开了一种双麦克风盲声源分离的快速源信号重建方法,该方法属于语音信号处理领域,特别是用于声源数目和周围环境都未知的双麦克风声源分离的快速源信号重建方法。该发明在不影响重建源信号时域包络的情况下,对重建信号的各频率成分都增加一个小的附加相位,通过近似计算每个源信号对时频点的贡献大小来模拟它在这个时频点中所占的比例从而恢复源信号,避免了通常的解欠定方程组的过程,简化了计算步骤,达到了快速的目的。从而具有相对于现有算法,计算量小,源数增多情况下信噪比高的优点。
Description
技术领域
本发明属于语音信号处理领域,特别是用于声源数目和周围环境都未知的双麦克风声源分离的快速源信号重建方法。
背景技术
盲声源分离是当前信号处理领域的一个热点,最初是为了解决“鸡尾酒会”问题,如今它已在通信系统、语音增强、遥感、医学成像,地震探测,地球物理,计量经济学,数据挖掘等领域都有广泛的应用。
所谓盲声源分离,是在传输信道和信号源未知的情况下仅依据观测到的混合信号来恢复原始信号的过程。根据量测信号数与声源数的大小关系,盲声源分离问题通常分为超定(含恰定)和欠定。超定(源数大于等于量测信号数)时,使用通常的独立分量分析(ICA)方法便可以很好的将源信号分离出来,目前发展已经很成熟;欠定情况时,系统通常是不可逆的,即使混合矩阵已知,源信号也不存在唯一解,此时独立分量分析方法不能使用。
1998年,Lewicki等人提出了信号的稀疏性概念,这为欠定盲分离问题提供了一个全新的解决途径,目前的时频域处理的双麦克风盲声源分离方法都利用了这个性质。2001年,Bofill和Zibulivsky基于信号稀疏分解理论提出了盲分离的著名的“两步法”,即第一步估计混合矩阵,第二步依据混合矩阵恢复源信号,并成功地从两路量测信号中分离出六路源信号。2004年,Yilmaz和Rickard在时频域利用二值时频掩蔽方法实现了欠定盲声源分离,尤其在2008年,Miehael Syskind Pedersen等人将2输入2输出的ICA和二值时频掩蔽结合使用成功从两路量测信号中分离出了多路信号。上述两种方法构成了双麦克风盲声源分离的两种思路,后来的很多国内外学者大都在这两种思路上做了大量研究,提出了各种改进的算法。
经典的“两步法”盲声源分离方法,先估计混合矩阵,再在混合矩阵基础上估计源信号。目前,用于双麦克风盲语音分离的源信号重建方法多是“最短路径法”和“子空间投影方法”以及“最优二值掩蔽方法”。“最短路径法”对欠定方程组(量测信号)增加约束条件,从而求得一组最优解来重建源信号。由于涉及矩阵求逆,运算量较大,而且随着源数目的增多,其设定的约束条件误差越来越大,恢复的源信号噪声也很多。“最短路径法”在只有两路观测信号情况下,相当于在所有可行解中找到两个分解矢量长度之和最小的一组解。而无论信号源数目多少,都默认一个时频点至多有两个信号源起作用。此方法法通过对每一个时频点求解一个复数的二元线性方程组来重建时频域的源信号,是非常耗时的,而且随着信号源数目增大,稀疏性变差,分离效果也逐渐变差。
发明内容
本发明针对背景技术存在的运算量大和源信号较多时噪声大的缺点,设计一种双麦克风盲声源分离的快速源信号重建方法,从而达到计算量小,运算速度快、恢复的源信号信噪比高的目的。
本发明的解决方案是一种双麦克风盲声源分离的快速源信号重建方法,该方法包括:
步骤1:对时域的双麦克风量测信号建立数学模型,并将该时域数学模型通过短时傅里叶变换变换到较为稀疏的时频域;
步骤1.1:设两个麦克风接收到的量测信号分别为x1(t),x2(t),则其数学模型为:
步骤1.2:对上述数学模型进行短时傅里叶变换变换到较为稀疏的时频域为:
其中为第i个麦克风接收到混合信号的短时傅里叶变换,为第l个源信号的短时傅里叶变换,aij,τij(i=1,2;j=1......n)是两路量测信号相对于源信号的衰减系数和时延,K为短时傅里叶变换选择的窗长,k=0,1...K-1为离散频率;
步骤2:接收两路两路量测信号,根据步骤1的数学模型,进行短时傅立叶变换,并选择出时频点中仅由一个源信号构成或占明显优势的单源主导点;
步骤3:针对步骤2选出的单源主导点,采用势函数法计算每个源信号对两个麦克风的幅值比和时延差,根据势函数峰值个数确定信号源个数,并将各信号源的幅值比和时延差一一对应;
步骤4:重建各源信号,
步骤4.1:对两路量测信号的傅里叶变换求比值得到下式:
根据量测信号,上式的已知量有:和其中(j=1...n),而是待估计的源信号;
步骤4.2:两路量测信号的时频点是由各源信号叠加而成,并且源信号的相角各不相同;
保证附加的相角引起的时域信号的时延不影响人的听觉效果的前提下,对施加一个相移,并假设各源信号与相角一致,于是有:
步骤4.3:为了简便,我们后面将表示时频点的符号(k,t)省略掉,默认之后的处理都是针对一个时频点的,得到步骤1.2中方程等价于下式:
对于源信号的恢复问题就转化为对d1,d2...dn的估计的问题;
步骤4.4:对步骤4.3方程组中两式相比得:
令: 其中(j=1...n)
对Rj和r求差值,得△j=|r-Rj|,j∈(1...n),△=△1+△2+...△n
对△j,j∈(1...n)进行下述处理:
对于某时频点,令所有norm△j值中最小值为0,其他norm△j保持不变,
步骤4.5:设置一非线性减函数f(x),使y=0是该函数的渐进线,且在x=1时,函数值已经很接近0。
将norm△j带入减函数f(x),令该减函数求得的值等于dj,重建时频域的源信号:
Sj=dj*(λ1*X1+λ2*X2)
步骤4.6:对每一个时频点做这样的处理,并经反傅里叶变换和去窗效应来重建时域信号。
其中所述步骤2的具体步骤为:
步骤2.1:对接收到的两路量测信号的每一个时频点的傅里叶变换值求比值:
步骤2.2:设uk,vk分别为Qk的幅值和相位,计算出同一频点中各时点的幅值ut和相位vt,若满足:
则该时频点为单源主导点,其中e1,e2为根据实测数据设定的阈值;
所述步骤3的具体步骤为:
步骤3.1:为方便描述设:
arg(yk)=-2πk(τ1l-τ2l)/K;
步骤3.2:计算两个麦克风对应单源主导点的幅值比mag(yk),
建立势函数:
其中:
其中,A为搜索变量,涵盖mag(yk)的所有可能取值;
势函数的每个峰值对应一个信号源,由此确定信号源个数,通过寻找峰值所在位置确定该源信号的幅值比
步骤3.3:计算两个麦克风对应单元主导点的时延差τ1-τ2,
为方便叙述令τ=τ1-τ2=-K*arg(yk)/(2πk),
势函数
其中:
其中,τ(t)为搜索变量,它需涵盖τ的所有可能取值,λ是任意取的一个正整数值,
势函数的每一个峰值对应一个信号源的时延,通过寻找峰值所在的位置来得到信号源对应的时延差τl,通过该峰值的个数来确定信号源个数,若此时求得的信号源个数与步骤3.2中求的不一致,则重新调整步骤2.2中的阈值,或者以时延差势函数峰值数目为源信号数目来重建源信号;
步骤3.4:将得到的同一个源信号的幅值比和时延差一一对应:以时延差为参考,分别将对应不同时延差的单源点的幅值比取平均值,得到对应于时延差值的幅值比的平均值,再将此平均值和步骤3.2估计得到的值进行比较,并用对应的后者的值替换前者,从而将时延差和幅值比对应起来;
所述步骤4.5中设减函数(ρ,λ,p是一个无量纲的正实数)将norm△j带入该减函数可得:
其中ρ,λ,p是三个无量纲的数,ρ控制恢复的源信号的幅度,λ,p在不同的层次控制恢复信号的信噪比。估计出dj之后,便可重建时频域的源信号:
Sj=dj*(λ1*X1+λ2*X2)。
本发明在不影响重建源信号时域包络的情况下,对重建信号的各频率成分都增加一个小的附加相位,通过近似计算每个源信号对时频点的贡献大小来模拟它在这个时频点中所占的比例从而恢复源信号,避免了通常的解欠定方程组的过程,简化了计算步骤,达到了快速的目的。从而具有相对于现有算法,计算量小,源数增多情况下信噪比高的优点。
附图说明:
图1为本发明的流程图;
图2为4路源信号信号波形图;
图3为两路量测信号波形图;
图4为本发明重建的源信号波形图;
图5为最短路径法重建的源信号波形图。
具体实施方式:
本发明是通过在MATLAB R2008a上对含有4路源信号的两路量测信号进行分离处理来验证的。4路源信号分别来自4种不同的语言,且有两个男声两个女声,所取的量测信号长度为5.03s,采样率为10000hz。具体实施步骤如下所述:
步骤1:读取量测信号并变换至时频域。
对两路量测信号进行分帧,加窗,再做nfft点的傅里叶变换从而得到量测信号的时频域表示。
其中:分帧帧长frame_len=512,帧移nmov=256,fft变换点数nfft=512,窗函数选择汉宁窗,表达式为:
步骤2:提取单源点。
将所有帧信号的同一频点4个一组进行分组(最后不足4个的单独做一组),计算每组内时频点的幅值比的差值及相位差的差值的最大值,并依此判定该组时频点是否是本算法需要的单源主导点;能量非常小(ξ<0.1ξmax,其中ξ表示时频点傅氏变换的平方)的时频点通常认为是噪声,也要将它去掉,从而得到最终的单源主导点。
步骤3:估计幅值比和时延差。
对单源主导点取幅值比和时延差,分别求解其势函数的值,并从中选择出对应的峰值的位置,从而得到每一个源对应的幅值比和时延差。
直接求解得到的两组值没有对应关系的。此时,以时延差为参考值,对单源点中时延差相同的时频点的幅值比进行统计分析,并与上文求解的幅值比一一对应。
步骤4:重建源信号
将估计得到的幅值比和相位差组合成Aej2πkτ/K(A为幅值比,τ为时延差)的形式,这是理想比值。计算每一个时频点傅氏变换比值和各个源信号的理想比值的差值并优化得到△j,将差值带入减函数中得到dj,此处取ρ=1,λ=4,p=15。按照公式Sj=dj*(0.5*X1+0.5*X2)恢复每个时频点的源信号。
步骤5:恢复时域源信号
对重建的源信号做逆短时傅里叶变换,再去除窗效应即可得到重建的时域的源信号。
通过上面的步骤,就可以较快速的在仅有两路量测信号的情况下恢复出多路源信号,如图2.1和3.1所示,分别是源信号和本专利算法重建的源信号。图3.1和图3.2分别是本发明和“最短路径算法”重建的源信号波形图,明显后者恢复的源信号有很多毛刺(噪声),本发明在重建源信号阶段仅用了1.3s左右,而相同条件下,后者至少需耗4s。而且通过对公式减函数(ρ,λ,p是一个无量纲的正实数)参数的调整,还可以提高重建信号信噪比和语音信号的质量。
Claims (4)
1.一种双麦克风盲声源分离的快速源信号重建方法,该方法包括:
步骤1:对时域的双麦克风量测信号建立数学模型,并将该时域数学模型通过短时傅里叶变换变换到较为稀疏的时频域;
步骤1.1:设两个麦克风接收到的量测信号分别为x1(t),x2(t),则其数学模型为:
步骤1.2:对上述数学模型进行短时傅里叶变换变换到较为稀疏的时频域为:
其中为第i个麦克风接收到混合信号的短时傅里叶变换,为第l个源信号的短时傅里叶变换,aij,τij(i=1,2;j=1......n)是两路量测信号相对于源信号的衰减系数和时延,K为短时傅里叶变换选择的窗长,k=0,1...K-1为离散频率;
步骤2:接收两路量测信号,根据步骤1的数学模型,进行短时傅立叶变换,并选择出时频点中仅由一个源信号构成或占明显优势的单源主导点;
步骤3:针对步骤2选出的单源主导点,采用势函数法计算每个源信号对两个麦克风的幅值比和时延差,根据势函数峰值个数确定信号源个数,并将各信号源的幅值比和时延差一一对应;
步骤4:重建各源信号,
步骤4.1:对两路量测信号的傅里叶变换求比值得到下式:
根据量测信号,上式的已知量有:和其中(j=1...n),而是待估计的源信号;
步骤4.2:两路量测信号的时频点是由各源信号叠加而成,并且源信号的相角各不相同;
保证附加的相角引起的时域信号的时延不影响人的听觉效果的前提下,对 施加一个相移,并假设各源信号与相角一致,于是有:
步骤4.3:为了简便,我们后面将表示时频点的符号(k,t)省略掉,默认之后的处理都是针对一个时频点的,得到步骤1.2中方程等价于下式:
对于源信号的恢复问题就转化为对d1,d2...dn的估计的问题;
步骤4.4:对步骤4.3方程组中两式相比得:
令:其中(j=1...n)
对Rj和r求差值,得△j=|r-Rj|,j∈(1...n),△=△1+△2+...△n
对△j,j∈(1...n)进行下述处理:
对于某时频点,令所有norm△j值中最小值为0,其他norm△j保持不变,
步骤4.5:设置一非线性减函数f(x),使y=0是该函数的渐进线,且在x=1时,函数值已经很接近0。
将norm△j带入减函数f(x),令该减函数求得的值等于dj,重建时频域的源信号:
Sj=dj*(λ1*X1+λ2*X2)
步骤4.6:对每一个时频点做这样的处理,并经反傅里叶变换和去窗效应来重建时域信号。
2.如权利要求1所述的一种双麦克风盲声源分离的快速源信号重建方法,其特征在于所述步骤2的具体步骤为:
步骤2.1:对接收到的两路量测信号的每一个时频点的傅里叶变换值求比值:
步骤2.2:设uk,vk分别为Qk的幅值和相位,计算出同一频点中各时点的幅值ut和相位vt,若满足:
则该时频点为单源主导点,其中e1,e2为根据实测数据设定的阈值。
3.如权利要求1所述的一种双麦克风盲声源分离的快速源信号重建方法,其特征在于所述步骤3的具体步骤为:
步骤3.1:为方便描述设:
arg(yk)=-2πk(τ1l-τ2l)/K;
步骤3.2:计算两个麦克风对应单源主导点的幅值比mag(yk),
建立势函数:
其中:
其中,A为搜索变量,涵盖mag(yk)的所有可能取值;
势函数的每个峰值对应一个信号源,由此确定信号源个数,通过寻找峰值所在位置确定该源信号的幅值比
步骤3.3:计算两个麦克风对应单元主导点的时延差τ1-τ2,
为方便叙述令τ=τ1-τ2=-K*arg(yk)/(2πk),
势函数
其中:
其中,τ(t)为搜索变量,它需涵盖τ的所有可能取值,λ是任意取的一个正整数值,
势函数的每一个峰值对应一个信号源的时延,通过寻找峰值所在的位置来得到信号源对应的时延差τl,通过该峰值的个数来确定信号源个数,若此时求得的信号源个数与步骤3.2中求的不一致,则重新调整步骤2.2中的阈值,或者以时延差势函数峰值数目为源信号数目来重建源信号;
步骤3.4:将得到的同一个源信号的幅值比和时延差一一对应:以时延差为参考,分别将对应不同时延差的单源点的幅值比取平均值,得到对应于时延差值的幅值比的平均值,再将此平均值和步骤3.2估计得到的值进行比较,并用对应的后者的值替换前者,从而将时延差和幅值比对应起来。
4.如权利要求1所述的一种双麦克风盲声源分离的快速源信号重建方法,其特征在于所述步骤4.5中设减函数(ρ,λ,p是一个无量纲的正实数)将norm△j带入该减函数可得:
其中ρ,λ,p是三个无量纲的数,ρ控制恢复的源信号的幅度,λ,p在不同的层次控制恢复信号的信噪比。估计出dj之后,便可重建时频域的源信号:
Sj=dj*(λ1*X1+λ2*X2)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410412547.2A CN104167214B (zh) | 2014-08-20 | 2014-08-20 | 一种双麦克风盲声源分离的快速源信号重建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410412547.2A CN104167214B (zh) | 2014-08-20 | 2014-08-20 | 一种双麦克风盲声源分离的快速源信号重建方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104167214A true CN104167214A (zh) | 2014-11-26 |
CN104167214B CN104167214B (zh) | 2017-06-13 |
Family
ID=51910995
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410412547.2A Expired - Fee Related CN104167214B (zh) | 2014-08-20 | 2014-08-20 | 一种双麦克风盲声源分离的快速源信号重建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104167214B (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105654963A (zh) * | 2016-03-23 | 2016-06-08 | 天津大学 | 频谱校正及数据密度聚类法语音欠定盲识别方法和装置 |
CN106057210A (zh) * | 2016-07-01 | 2016-10-26 | 山东大学 | 双耳间距下基于频点选择的快速语音盲源分离方法 |
CN106060834A (zh) * | 2016-07-26 | 2016-10-26 | 中国人民解放军理工大学 | 一种提高频谱利用率的无线通信系统的设计方法 |
CN106531181A (zh) * | 2016-11-25 | 2017-03-22 | 天津大学 | 一种基于谐波提取的欠定语音盲分离方法及装置 |
CN107017005A (zh) * | 2017-04-27 | 2017-08-04 | 同济大学 | 一种基于dft的双通道语声分离方法 |
CN108074580A (zh) * | 2016-11-17 | 2018-05-25 | 杭州海康威视数字技术股份有限公司 | 一种噪声消除方法及装置 |
CN109614943A (zh) * | 2018-12-17 | 2019-04-12 | 电子科技大学 | 一种用于盲源分离的特征提取方法 |
CN110060698A (zh) * | 2019-04-11 | 2019-07-26 | 哈尔滨工程大学 | 一种基于改进势函数的语音信号混合矩阵估计方法 |
CN110992977A (zh) * | 2019-12-03 | 2020-04-10 | 北京声智科技有限公司 | 一种目标声源的提取方法及装置 |
WO2020172790A1 (en) * | 2019-02-26 | 2020-09-03 | Harman International Industries, Incorporated | Method and system for voice separation based on degenerate unmixing estimation technique |
CN111986688A (zh) * | 2020-09-09 | 2020-11-24 | 北京小米松果电子有限公司 | 一种提高语音清晰度的方法、装置及介质 |
CN112331218A (zh) * | 2020-09-29 | 2021-02-05 | 北京清微智能科技有限公司 | 一种针对多说话人的单通道语音分离方法和装置 |
CN112349292A (zh) * | 2020-11-02 | 2021-02-09 | 深圳地平线机器人科技有限公司 | 信号分离方法和装置、计算机可读存储介质、电子设备 |
CN112599144A (zh) * | 2020-12-03 | 2021-04-02 | Oppo(重庆)智能科技有限公司 | 音频数据处理方法、音频数据处理装置、介质与电子设备 |
CN113096684A (zh) * | 2021-06-07 | 2021-07-09 | 成都启英泰伦科技有限公司 | 一种基于双麦克风阵列的目标语音提取方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005109951A1 (en) * | 2004-05-05 | 2005-11-17 | Deka Products Limited Partnership | Angular discrimination of acoustical or radio signals |
CN101727908A (zh) * | 2009-11-24 | 2010-06-09 | 哈尔滨工业大学 | 基于混合信号局部峰值方差检测的盲源分离方法 |
CN101828335A (zh) * | 2007-10-18 | 2010-09-08 | 摩托罗拉公司 | 稳健双麦克风噪声抑制系统 |
US20120148069A1 (en) * | 2010-12-14 | 2012-06-14 | National Chiao Tung University | Microphone array structure able to reduce noise and improve speech quality and method thereof |
-
2014
- 2014-08-20 CN CN201410412547.2A patent/CN104167214B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005109951A1 (en) * | 2004-05-05 | 2005-11-17 | Deka Products Limited Partnership | Angular discrimination of acoustical or radio signals |
CN101828335A (zh) * | 2007-10-18 | 2010-09-08 | 摩托罗拉公司 | 稳健双麦克风噪声抑制系统 |
CN101727908A (zh) * | 2009-11-24 | 2010-06-09 | 哈尔滨工业大学 | 基于混合信号局部峰值方差检测的盲源分离方法 |
US20120148069A1 (en) * | 2010-12-14 | 2012-06-14 | National Chiao Tung University | Microphone array structure able to reduce noise and improve speech quality and method thereof |
Non-Patent Citations (1)
Title |
---|
陆凤波,黄知涛,姜文利: "基于时频域单源区域的延迟欠定混合非平稳信号盲分离", 《电子学报》 * |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105654963A (zh) * | 2016-03-23 | 2016-06-08 | 天津大学 | 频谱校正及数据密度聚类法语音欠定盲识别方法和装置 |
CN106057210A (zh) * | 2016-07-01 | 2016-10-26 | 山东大学 | 双耳间距下基于频点选择的快速语音盲源分离方法 |
CN106057210B (zh) * | 2016-07-01 | 2017-05-10 | 山东大学 | 双耳间距下基于频点选择的快速语音盲源分离方法 |
CN106060834A (zh) * | 2016-07-26 | 2016-10-26 | 中国人民解放军理工大学 | 一种提高频谱利用率的无线通信系统的设计方法 |
CN106060834B (zh) * | 2016-07-26 | 2017-08-01 | 中国人民解放军理工大学 | 一种提高频谱利用率的无线通信系统的设计方法 |
CN108074580B (zh) * | 2016-11-17 | 2021-04-02 | 杭州海康威视数字技术股份有限公司 | 一种噪声消除方法及装置 |
CN108074580A (zh) * | 2016-11-17 | 2018-05-25 | 杭州海康威视数字技术股份有限公司 | 一种噪声消除方法及装置 |
CN106531181A (zh) * | 2016-11-25 | 2017-03-22 | 天津大学 | 一种基于谐波提取的欠定语音盲分离方法及装置 |
CN107017005B (zh) * | 2017-04-27 | 2020-03-24 | 同济大学 | 一种基于dft的双通道语声分离方法 |
CN107017005A (zh) * | 2017-04-27 | 2017-08-04 | 同济大学 | 一种基于dft的双通道语声分离方法 |
CN109614943A (zh) * | 2018-12-17 | 2019-04-12 | 电子科技大学 | 一种用于盲源分离的特征提取方法 |
WO2020172790A1 (en) * | 2019-02-26 | 2020-09-03 | Harman International Industries, Incorporated | Method and system for voice separation based on degenerate unmixing estimation technique |
US11783848B2 (en) | 2019-02-26 | 2023-10-10 | Harman International Industries, Incorporated | Method and system for voice separation based on degenerate unmixing estimation technique |
CN110060698A (zh) * | 2019-04-11 | 2019-07-26 | 哈尔滨工程大学 | 一种基于改进势函数的语音信号混合矩阵估计方法 |
CN110992977A (zh) * | 2019-12-03 | 2020-04-10 | 北京声智科技有限公司 | 一种目标声源的提取方法及装置 |
CN111986688A (zh) * | 2020-09-09 | 2020-11-24 | 北京小米松果电子有限公司 | 一种提高语音清晰度的方法、装置及介质 |
CN112331218A (zh) * | 2020-09-29 | 2021-02-05 | 北京清微智能科技有限公司 | 一种针对多说话人的单通道语音分离方法和装置 |
CN112349292A (zh) * | 2020-11-02 | 2021-02-09 | 深圳地平线机器人科技有限公司 | 信号分离方法和装置、计算机可读存储介质、电子设备 |
CN112349292B (zh) * | 2020-11-02 | 2024-04-19 | 深圳地平线机器人科技有限公司 | 信号分离方法和装置、计算机可读存储介质、电子设备 |
CN112599144A (zh) * | 2020-12-03 | 2021-04-02 | Oppo(重庆)智能科技有限公司 | 音频数据处理方法、音频数据处理装置、介质与电子设备 |
CN113096684A (zh) * | 2021-06-07 | 2021-07-09 | 成都启英泰伦科技有限公司 | 一种基于双麦克风阵列的目标语音提取方法 |
Also Published As
Publication number | Publication date |
---|---|
CN104167214B (zh) | 2017-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104167214A (zh) | 一种双麦克风盲声源分离的快速源信号重建方法 | |
Wang et al. | Selection of window length for singular spectrum analysis | |
CN104464750B (zh) | 一种基于双耳声源定位的语音分离方法 | |
CN103325381B (zh) | 一种基于模糊隶属函数的语音分离方法 | |
EP2355097B1 (en) | Signal separation system and method | |
Mimilakis et al. | Monaural singing voice separation with skip-filtering connections and recurrent inference of time-frequency mask | |
CN102565759B (zh) | 一种基于子带信噪比估计的双耳声源定位方法 | |
CN105654963B (zh) | 频谱校正及数据密度聚类法语音欠定盲识别方法和装置 | |
CN102222508A (zh) | 一种基于矩阵变换的欠定盲分离方法 | |
CN106226739A (zh) | 融合子带分析的双声源定位方法 | |
Mimilakis et al. | A recurrent encoder-decoder approach with skip-filtering connections for monaural singing voice separation | |
CN104808243B (zh) | 一种叠前地震贝叶斯反演方法和装置 | |
CN102799892A (zh) | 一种mfcc水下目标特征提取和识别方法 | |
EP2940687A1 (en) | Methods and systems for processing and mixing signals using signal decomposition | |
CN103281269B (zh) | 基于改进的排序算法的频域盲源分离算法 | |
JP4496378B2 (ja) | 定常雑音下における音声区間検出に基づく目的音声の復元方法 | |
Zhang et al. | Multi-Target Ensemble Learning for Monaural Speech Separation. | |
Yegnanarayana et al. | Determining mixing parameters from multispeaker data using speech-specific information | |
Baby | Supervised speech dereverberation in noisy environments using exemplar-based sparse representations | |
CN111091847A (zh) | 基于并改进的深度聚类语音分离方法 | |
US20230386492A1 (en) | System and method for suppressing noise from audio signal | |
Zohny et al. | Modelling interaural level and phase cues with Student's t-distribution for robust clustering in MESSL | |
Linhui et al. | Monaural speech separation using dual-output deep neural network with multiple joint constraint | |
Liang et al. | The analysis of the simplification from the ideal ratio to binary mask in signal-to-noise ratio sense | |
Adiloğlu et al. | A general variational Bayesian framework for robust feature extraction in multisource recordings |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170613 Termination date: 20200820 |
|
CF01 | Termination of patent right due to non-payment of annual fee |