CN111667846A - 一种盲源分离方法及装置 - Google Patents

一种盲源分离方法及装置 Download PDF

Info

Publication number
CN111667846A
CN111667846A CN202010408759.9A CN202010408759A CN111667846A CN 111667846 A CN111667846 A CN 111667846A CN 202010408759 A CN202010408759 A CN 202010408759A CN 111667846 A CN111667846 A CN 111667846A
Authority
CN
China
Prior art keywords
frequency
frequency domain
signals
signal
observation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010408759.9A
Other languages
English (en)
Other versions
CN111667846B (zh
Inventor
奚少亨
冯大航
陈孝良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing SoundAI Technology Co Ltd
Original Assignee
Beijing SoundAI Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing SoundAI Technology Co Ltd filed Critical Beijing SoundAI Technology Co Ltd
Priority to CN202010408759.9A priority Critical patent/CN111667846B/zh
Publication of CN111667846A publication Critical patent/CN111667846A/zh
Application granted granted Critical
Publication of CN111667846B publication Critical patent/CN111667846B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • G10L21/0308Voice signal separating characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques

Abstract

本发明公开了一种盲源分离方法及装置,用以解决现有的基于独立向量分析的盲源分离方法分离效率较低的问题。所述盲源分离方法,包括:获取M个观测信号,所述M个观测信号是由M个麦克风采集的N个源信号的混合信号;将所述观测信号从时域转换到频域,获得频域的观测信号;根据独立向量分析算法逐频点计算所述频域的观测信号在各滤波块的解混矩阵,所述滤波块为利用频域滤波器分块算法对频域的观测信号进行分块获得的;将所述频域的观测信号根据所述频域的观测信号在各滤波块的解混矩阵逐频点进行盲源分离,获得频域的分离信号;将所述频域的分离信号转换到时域,获得时域的分离信号。

Description

一种盲源分离方法及装置
技术领域
本发明涉及信号分离技术领域,尤其涉及一种盲源分离方法及装置。
背景技术
语音交互技术日益成熟,在语音交互过程中常会伴有干扰,这就需要通过盲源分离方法将目标语音提取出来。盲源分离是指从多个观测到的混合信号中分析出没有观测的原始信号,也就是在不知道源信号及信号混合参数的情况下,仅根据观测到的混合信号估计源信号,通常,观测信号来自多个传感器的输出。
独立向量分析(Independent Vector Analysis,IVA)是现有技术中一种常用的盲源分离方法,即将接收到的观测信号按照统计独立的原则分解为若干独立分量,将这些独立分量作为源信号的一种近似估计。然而,现有的基于独立向量分析的盲源分离方法,滤波器长度越长,分离效果越好,然而,同时带来的延迟也越高,使得分离效率较低,例如,滤波器长度至少要达到4096点,才能有较好的分离效果,假设采样频率为16000Hz,那么算法带来的延迟达到256ms。
发明内容
为了解决现有的基于独立向量分析的盲源分离方法分离效率较低的问题,本发明实施例提供了一种盲源分离方法及装置。
第一方面,本发明实施例提供了一种盲源分离方法,包括:
获取M个观测信号,所述M个观测信号是由M个麦克风采集的N个源信号的混合信号;
将所述观测信号从时域转换到频域,获得频域的观测信号;
根据独立向量分析算法逐频点计算所述频域的观测信号在各滤波块的解混矩阵,所述滤波块为利用频域滤波器分块算法对频域的观测信号进行分块获得的;
将所述频域的观测信号根据所述频域的观测信号在各滤波块的解混矩阵逐频点进行盲源分离,获得频域的分离信号;
将所述频域的分离信号转换到时域,获得时域的分离信号。
本发明实施例提供的盲源分离方法,服务器获取M个观测信号,所述M个观测信号是由M个麦克风采集的N个源信号的混合信号,将所述观测信号从时域转换到频域,获得相应的频域的观测信号,利用滤波器分块算法对所述频域的观测信号进行分块,根据独立向量分析算法逐频点计算所述频域的观测信号在各滤波块的解混矩阵,将所述频域的观测信号根据所述频域的观测信号在各滤波块的解混矩阵逐频点进行盲源分离,获得频域的分离信号,再将所述频域的分离信号转换到时域,获得相应的时域的分离信号,本发明实施例提供的上述盲源分离方法,在计算解混矩阵时,将独立向量分析算法和频域滤波器分块算法相结合,针对每一帧频域的观测信号,分块计算解混矩阵,在保证了分离效果的同时,大大降低了算法的延迟,提高了分离效率。
较佳地,根据独立向量分析算法逐频点计算所述频域的观测信号在各滤波块的解混矩阵,具体包括:
通过以下公式逐频点计算所述频域的观测信号在各滤波块的解混矩阵:
Wb(k,n)=[ω1,b(k,n),ω2,b(k,n),......,ωm,b(k,n),......ωM,b(k,n)]
其中,Wb(k,n)表示第n帧频域的观测信号在第k频率的第b+1个滤波块的解混矩阵,k表示频率索引,b=0,1,2,......,B-1,B表示滤波器块数;
ωm,b(k,n)表示Wb(k,n)的第m列,m=1,2,......,M,M表示观测信号的个数,ωm,b(k,n)=(Wb(k,n-1)Vm(k,n))-1em
Wb(k,n-1)表示第n-1帧频域的观测信号在第k频率的第b+1个滤波块的解混矩阵,
Figure BDA0002492326320000031
ωm,b(k,n-1)表示Wb(k,n-1)的第m列;
Vm(k,n)表示V(k,n)的第m列,V(k,n)表示第n帧第k个频率的加权协方差矩阵,V(k,n)=[V1(k,n),V2(k,n),......,Vm(k,n),......,VM(k,n)]。
较佳地,通过以下公式计算Vm(k,n):
Figure BDA0002492326320000032
其中,α表示平滑系数;
Vm(k,n-1)表示第n-1帧第k个频率的加权协方差矩阵V(k,n-1)的第m列;
X(k,n-b)表示第n-b帧频域的观测信号在第k个频率的集合;
X(k,n-b)=[x1(k,n-b),x1(k,n-b),......,xm(k,n-b),......,xM(k,n-b)],
xm(k,n-b)表示第n-b帧第k个频率的第m个频域的观测信号。
较佳地,初始时,即当n=1时,
Figure BDA0002492326320000033
Figure BDA0002492326320000034
可选地,所述方法,还包括:
通过以下公式对ωm,b(k,n)进行归一化:
Figure BDA0002492326320000035
较佳地,通过以下公式获得频域的分离信号:
Figure BDA0002492326320000041
其中,Y(k,n)表示第n帧频域的分离信号在k个频率的集合,Y1(k,n),Y2(k,n),......,YN(k,n)表示第n帧第k个频率的频域的分离信号,分别为Y(k,n)的第1~N列。
第二方面,本发明实施例提供了一种盲源分离装置,包括:
获取单元,用于获取M个观测信号,所述M个观测信号是由M个麦克风采集的N个源信号的混合信号;
第一转换单元,用于将所述观测信号从时域转换到频域,获得频域的观测信号;
计算单元,用于根据独立向量分析算法逐频点计算所述频域的观测信号在各滤波块的解混矩阵,所述滤波块为利用频域滤波器分块算法对频域的观测信号进行分块获得的;
分离单元,用于将所述频域的观测信号根据所述频域的观测信号在各滤波块的解混矩阵逐频点进行盲源分离,获得频域的分离信号;
第二转换单元,用于将所述频域的分离信号转换到时域,获得时域的分离信号。
较佳地,所述计算单元,具体用于通过以下公式逐频点计算所述频域的观测信号在各滤波块的解混矩阵:
Figure BDA0002492326320000042
其中,Wb(k,n)表示第n帧频域的观测信号在第k频率的第b+1个滤波块的解混矩阵,k表示频率索引,b=0,1,2,......,B-1,B表示滤波器块数;
ωm,b(k,n)表示Wb(k,n)的第m列,m=1,2,......,M,M表示观测信号的个数,ωm,b(k,n)=(Wb(k,n-1)Vm(k,n))-1em
Wb(k,n-1)表示第n-1帧频域的观测信号在第k频率的第b+1个滤波块的解混矩阵,
Figure BDA0002492326320000051
ωm,b(k,n-1)表示Wb(k,n-1)的第m列;
Vm(k,n)表示V(k,n)的第m列,V(k,n)表示第n帧第k个频率的加权协方差矩阵,V(k,n)=[V1(k,n),V2(k,n),......,Vm(k,n),......,VM(k,n)]。
较佳地,所述计算单元,具体用于通过以下公式计算Vm(k,n):
Figure BDA0002492326320000052
其中,α表示平滑系数;
Vm(k,n-1)表示第n-1帧第k个频率的加权协方差矩阵V(k,n-1)的第m列;
X(k,n-b)表示第n-b帧频域的观测信号在第k个频率的集合;
X(k,n-b)=[x1(k,n-b),x1(k,n-b),......,xm(k,n-b),......,xM(k,n-b)],
xm(k,n-b)表示第n-b帧第k个频率的第m个频域的观测信号。
较佳地,初始时,即当n=1时,
Figure BDA0002492326320000053
Figure BDA0002492326320000054
可选地,所述计算单元,还用于通过以下公式对ωm,b(k,n)进行归一化:
Figure BDA0002492326320000055
较佳地,所述分离单元,具体用于通过以下公式获得频域的分离信号:
Figure BDA0002492326320000061
其中,Y(k,n)表示第n帧频域的分离信号在k个频率的集合,Y1(k,n),Y2(k,n),......,YN(k,n)表示第n帧第k个频率的频域的分离信号,分别为Y(k,n)的第1~N列。
本发明提供的盲源分离装置的技术效果可以参见上述第一方面或第一方面的各个实现方式的技术效果,此处不再赘述。
第三方面,本发明实施例提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现本发明所述的盲源分离方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明所述的盲源分离方法中的步骤。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实施例提供的盲源分离方法的实施流程示意图;
图2为本发明实施例提供的盲源分离装置的结构示意图;
图3为本发明实施例提供的电子设备的结构示意图。
具体实施方式
为了解决现有的基于独立向量分析的盲源分离方法分离效率较低的问题,本发明提出了一种盲源分离方法及装置。
以下结合说明书附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明,并且在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
如图1所示,其为本发明实施例提供的盲源分离方法的实施流程示意图,可以包括以下步骤:
S11、获取M个观测信号。
具体实施时,服务器获取M个观测信号,其中,所述M个观测信号是由M个麦克风采集的N个源信号的混合信号,所述M个观测信号也可以由M个传感器采集,本发明实施例对此不作限定。如果观测信号由麦克风采集,则M即为麦克风通道数,如果观测信号由传感器采集,则M即为传感器个数。
具体地,假设第n帧的N个独立的源信号s1(n),s2(n),......,sN(n),经过房间冲击响应(即混合矩阵A,A是一个M×N维传递函数矩阵),由M个麦克风采集获得M个观测信号x1(n),x2(n),......,xM(n),由S(n)=[s1(n),s2(n),......,sN(n)]来表示第n帧源信号s1(n),s2(n),......,sN(n)的集合,由X(n)=[x1(n),x2(n),......,xM(n)]来表示第n帧观测信号的集合,则有:X(n)=AS(n)。
S12、将所述观测信号从时域转换到频域,获得频域的观测信号。
具体实施时,服务器将所述M个观测信号从时域转换到频域,获得相应的频域的观测信号。
具体地,可以但不限于利用短时傅里叶变换(Short-Time Fourier Transform,STFT)将所述观测信号从时域转换到频域,本发明实施例对此不作限定。
S13、根据独立向量分析算法逐频点计算所述频域的观测信号在各滤波块的解混矩阵,所述滤波块为利用频域滤波器分块算法对频域的观测信号进行分块获得的。
具体实施时,服务器根据独立向量分析算法逐频点计算所述频域的观测信号在各滤波块的解混矩阵,所述滤波块为利用频域滤波器分块算法对所述频域的观测信号进行分块获得的,其中,频域滤波器分块算法可以采用分块频域自适应滤波(Block FrequencyDomain Adaptive Filter,BFDAF)算法。
具体地,可以通过以下公式逐频点计算所述频域的观测信号在各滤波块的解混矩阵:
Wb(k,n)=[ω1,b(k,n),ω2,b(k,n),......,ωm,b(k,n),......ωM,b(k,n)]
其中,Wb(k,n)表示第n帧频域的观测信号在第k频率的第b+1个滤波块的解混矩阵,k表示频率索引,k=1,2,......,K,K表示频率个数,b=0,1,2,......,B-1,B表示滤波器块数;
ωm,b(k,n)表示Wb(k,n)的第m列,m=1,2,......,M,M表示观测信号的个数,ωm,b(k,n)=(Wb(k,n-1)Vm(k,n))-1em
Wb(k,n-1)表示第n-1帧频域的观测信号在第k频率的第b+1个滤波块的解混矩阵,
Figure BDA0002492326320000081
ωm,b(k,n-1)表示取Wb(k,n-1)的第m列;
Vm(k,n)表示V(k,n)的第m列,V(k,n)表示第n帧第k个频率的加权协方差矩阵,V(k,n)=[V1(k,n),V2(k,n),......,Vm(k,n),......,VM(k,n)]。
具体实施时,ωm,b(k,n)=(Wb(k,n-1)Vm(k,n))-1em中的em表示取矩阵(Wb(k,n-1)Vm(k,n))-1的第m列。
通过以下公式计算Vm(k,n):
Figure BDA0002492326320000082
其中,α表示平滑系数;
Vm(k,n-1)表示第n-1帧第k个频率的加权协方差矩阵V(k,n-1)的第m列;
Figure BDA0002492326320000091
表示ωm,b(k,n)的共轭转置矩阵;
X(k,n-b)表示第n-b帧频域的观测信号在第k个频率的集合;X(k,n-b)=[x1(k,n-b),x1(k,n-b),......,xm(k,n-b),......,xM(k,n-b)],xm(k,n-b)表示第n-b帧第k个频率的第m个频域的观测信号,当n-b≤0时,X(k,n-b)=0;
XH(k,n-b)表示X(k,n-b)的共轭转置矩阵。
具体实施时,α的取值可以根据需要自行设定,例如可以取值0.8、0.85或者0.9等,本发明实施例对此不作限定。
初始时,即n=1时,
Figure BDA0002492326320000092
即ωm,b(k,1)为M×1维单位矩阵;
Figure BDA0002492326320000093
即Vm(k,1)为M×1维单位矩阵。
进一步地,当计算出解混矩阵Wb(k,n)后,可以对Wb(k,n)中的每一ωm,b(k,n)进行归一化处理,获得归一化后的解混矩阵Wb(k,n)。
具体地,通过以下公式对ωm,b(k,n)进行归一化:
需要说明的是,上述加权协方差公式
Figure BDA0002492326320000101
Figure BDA0002492326320000102
rm(n)表示滤波后信号在频域的能量。
而现有技术中IVA算法的加权协方差公式为:
Figure BDA0002492326320000103
其中,
Figure BDA0002492326320000104
表示第n帧频域的观测信号在第k频率的解混矩阵W(k,n)的第m列ωm(k,n)的共轭转置矩阵,m=1,2,......,M,M表示观测信号的个数,X(k,n)表示第n帧频域的观测信号在第k个频率的集合,XH(k,n)表示X(k,n)的共轭转置矩阵,其中,
Figure BDA0002492326320000105
即滤波后信号在频域的能量。
相比于现有技术中的rm(n),本申请中,滤波后信号在频域的能量是分块滤波后的每次滤波后信号在频域的能量之和,由于预先分成B个滤波块,每次滤波后信号在频域的能量即相当于现有技术中rm(n)的1/B,从而使得每次滤波后信号在频域的能量消耗大大降低。
S14、将所述频域的观测信号根据所述频域的观测信号在各滤波块的解混矩阵逐频点进行盲源分离,获得频域的分离信号。
具体实施时,服务器将所述频域的观测信号根据所述频域的观测信号在各滤波块的解混矩阵逐频点进行盲源分离,获得频域的分离信号。
具体地,针对每一频率,可以通过以下公式获得频域的分离信号:
Figure BDA0002492326320000106
其中,Wb(k,n)为归一化后的第n帧频域的观测信号在第k频率的第b+1个滤波块的解混矩阵;
Y(k,n)表示第n帧频域的分离信号在k个频率的集合,Y1(k,n),Y2(k,n),......,YN(k,n)表示第n帧第k个频率的频域的分离信号,分别为Y(k,n)的第1~N列。
S15、将所述频域的分离信号转换到时域,获得时域的分离信号。
具体实施时,服务器将所述频域的分离信号转换到时域,获得时域的分离信号。
具体地,可以但不限于利用逆短时傅里叶变换(Inverse Short-Time FourierTransform,Inverse STFT)将所述频域的分离信号转换到时域,本发明实施例对此不作限定。
本发明实施例提供的盲源分离方法,服务器获取M个观测信号,所述M个观测信号是由M个麦克风采集的N个源信号的混合信号,将所述观测信号从时域转换到频域,获得相应的频域的观测信号,利用滤波器分块算法对所述频域的观测信号进行分块,根据独立向量分析算法逐频点计算所述频域的观测信号在各滤波块的解混矩阵,将所述频域的观测信号根据所述频域的观测信号在各滤波块的解混矩阵逐频点进行盲源分离,获得频域的分离信号,再将所述频域的分离信号转换到时域,获得相应的时域的分离信号,本发明实施例提供的上述盲源分离方法,在计算解混矩阵时,将独立向量分析算法和频域滤波器分块算法相结合,针对每一帧频域的观测信号,分块计算解混矩阵,在保证了分离效果的同时,大大降低了算法的延迟,提高了分离效率。例如,现有技术中利用IVA算法进行盲源分离时,假设滤波器长度为4096点,采样频率为16kHz,那么算法带来的延迟是256ms,而利用本发明提供的盲源分离方法带来的延迟将降低到1块滤波块的延迟,假设将滤波器分为16个滤波块,则每块的长度为4096/16=256点,则延迟为16ms,是现有的IVA算法延迟的1/16。
基于同一发明构思,本发明实施例还提供了一种盲源分离装置,由于上述盲源分离装置解决问题的原理与盲源分离方法相似,因此上述装置的实施可以参见方法的实施,重复之处不再赘述。
如图2所示,其为本发明实施例提供的盲源分离装置的结构示意图,可以包括:
获取单元21,用于获取M个观测信号,所述M个观测信号是由M个麦克风采集的N个源信号的混合信号;
第一转换单元22,用于将所述观测信号从时域转换到频域,获得频域的观测信号;
计算单元23,用于根据独立向量分析算法逐频点计算所述频域的观测信号在各滤波块的解混矩阵,所述滤波块为利用频域滤波器分块算法对频域的观测信号进行分块获得的;
分离单元24,用于将所述频域的观测信号根据所述频域的观测信号在各滤波块的解混矩阵逐频点进行盲源分离,获得频域的分离信号;
第二转换单元25,用于将所述频域的分离信号转换到时域,获得时域的分离信号。
较佳地,所述计算单元,具体用于通过以下公式逐频点计算所述频域的观测信号在各滤波块的解混矩阵:
Figure BDA0002492326320000121
其中,Wb(k,n)表示第n帧频域的观测信号在第k频率的第b+1个滤波块的解混矩阵,k表示频率索引,b=0,1,2,......,B-1,B表示滤波器块数;
ωm,b(k,n)表示Wb(k,n)的第m列,m=1,2,......,M,M表示观测信号的个数,ωm,b(k,n)=(Wb(k,n-1)Vm(k,n))-1em
Wb(k,n-1)表示第n-1帧频域的观测信号在第k频率的第b+1个滤波块的解混矩阵,
Figure BDA0002492326320000122
ωm,b(k,n-1)表示Wb(k,n-1)的第m列;
Vm(k,n)表示V(k,n)的第m列,V(k,n)表示第n帧第k个频率的加权协方差矩阵,V(k,n)=[V1(k,n),V2(k,n),......,Vm(k,n),......,VM(k,n)]。
较佳地,所述计算单元23,具体用于通过以下公式计算Vm(k,n):
Figure BDA0002492326320000131
其中,α表示平滑系数;
Vm(k,n-1)表示第n-1帧第k个频率的加权协方差矩阵V(k,n-1)的第m列;
X(k,n-b)表示第n-b帧频域的观测信号在第k个频率的集合;
X(k,n-b)=[x1(k,n-b),x1(k,n-b),......,xm(k,n-b),......,xM(k,n-b)],
xm(k,n-b)表示第n-b帧第k个频率的第m个频域的观测信号。
较佳地,初始时,即当n=1时,
Figure BDA0002492326320000132
Figure BDA0002492326320000133
可选地,所述计算单元23,还用于通过以下公式对ωm,b(k,n)进行归一化:
Figure BDA0002492326320000134
较佳地,所述分离单元24,具体用于通过以下公式获得频域的分离信号:
Figure BDA0002492326320000135
其中,Y(k,n)表示第n帧频域的分离信号在k个频率的集合,Y1(k,n),Y2(k,n),......,YN(k,n)表示第n帧第k个频率的频域的分离信号,分别为Y(k,n)的第1~N列。
基于同一技术构思,本发明实施例还提供了一种电子设备300,参照图3所示,电子设备300用于实施上述方法实施例记载的盲源分离方法,该实施例的电子设备300可以包括:存储器301、处理器302以及存储在所述存储器中并可在所述处理器上运行的计算机程序,例如盲源分离程序。所述处理器执行所述计算机程序时实现上述各个盲源分离方法实施例中的步骤,例如图1所示的步骤S11。或者,所述处理器执行所述计算机程序时实现上述各装置实施例中各模块/单元的功能,例如21。
本发明实施例中不限定上述存储器301、处理器302之间的具体连接介质。本申请实施例在图3中以存储器301、处理器302之间通过总线303连接,总线303在图3中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。所述总线303可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器301可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);存储器301也可以是非易失性存储器(non-volatilememory),例如只读存储器,快闪存储器(flash memory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD)、或者存储器301是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器301可以是上述存储器的组合。
处理器302,用于实现如图1所示的一种盲源分离方法,包括:
所述处理器302,用于调用所述存储器301中存储的计算机程序执行如图1中所示的步骤S11、获取M个观测信号,步骤S12、将所述观测信号从时域转换到频域,获得频域的观测信号,步骤S13、根据独立向量分析算法逐频点计算所述频域的观测信号在各滤波块的解混矩阵,所述滤波块为利用频域滤波器分块算法对频域的观测信号进行分块获得的,S14、将所述频域的观测信号根据所述频域的观测信号在各滤波块的解混矩阵逐频点进行盲源分离,获得频域的分离信号,和步骤S15、将所述频域的分离信号转换到时域,获得时域的分离信号。
本申请实施例还提供了一种计算机可读存储介质,存储为执行上述处理器所需执行的计算机可执行指令,其包含用于执行上述处理器所需执行的程序。
在一些可能的实施方式中,本发明提供的盲源分离方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在电子设备上运行时,所述程序代码用于使所述电子设备执行本说明书上述描述的根据本发明各种示例性实施方式的盲源分离方法中的步骤,例如,所述电子设备可以执行如图1中所示的步骤S11、获取M个观测信号,步骤S12、将所述观测信号从时域转换到频域,获得频域的观测信号,步骤S13、根据独立向量分析算法逐频点计算所述频域的观测信号在各滤波块的解混矩阵,所述滤波块为利用频域滤波器分块算法对频域的观测信号进行分块获得的,S14、将所述频域的观测信号根据所述频域的观测信号在各滤波块的解混矩阵逐频点进行盲源分离,获得频域的分离信号,和步骤S15、将所述频域的分离信号转换到时域,获得时域的分离信号。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
本发明的实施方式的用于盲源分离的程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在计算设备上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了装置的若干单元或子单元,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之,上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。
此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(装置)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (14)

1.一种盲源分离方法,其特征在于,包括:
获取M个观测信号,所述M个观测信号是由M个麦克风采集的N个源信号的混合信号;
将所述观测信号从时域转换到频域,获得频域的观测信号;
根据独立向量分析算法逐频点计算所述频域的观测信号在各滤波块的解混矩阵,所述滤波块为利用频域滤波器分块算法对频域的观测信号进行分块获得的;
将所述频域的观测信号根据所述频域的观测信号在各滤波块的解混矩阵逐频点进行盲源分离,获得频域的分离信号;
将所述频域的分离信号转换到时域,获得时域的分离信号。
2.如权利要求1所述的方法,其特征在于,根据独立向量分析算法逐频点计算所述频域的观测信号在各滤波块的解混矩阵,具体包括:
通过以下公式逐频点计算所述频域的观测信号在各滤波块的解混矩阵:
Wb(k,n)=[ω1,b(k,n),ω2,b(k,n),......,ωm,b(k,n),......ωM,b(k,n)]
其中,Wb(k,n)表示第n帧频域的观测信号在第k频率的第b+1个滤波块的解混矩阵,k表示频率索引,b=0,1,2,......,B-1,B表示滤波器块数;
ωm,b(k,n)表示Wb(k,n)的第m列,m=1,2,......,M,M表示观测信号的个数,ωm,b(k,n)=(Wb(k,n-1)Vm(k,n))-1em
Wb(k,n-1)表示第n-1帧频域的观测信号在第k频率的第b+1个滤波块的解混矩阵,
Figure FDA0002492326310000011
ωm,b(k,n-1)表示Wb(k,n-1)的第m列;
Vm(k,n)表示V(k,n)的第m列,V(k,n)表示第n帧第k个频率的加权协方差矩阵,V(k,n)=[V1(k,n),V2(k,n),......,Vm(k,n),......,VM(k,n)]。
3.如权利要求2所述的方法,其特征在于,
通过以下公式计算Vm(k,n):
Figure FDA0002492326310000021
其中,α表示平滑系数;
Vm(k,n-1)表示第n-1帧第k个频率的加权协方差矩阵V(k,n-1)的第m列;X(k,n-b)表示第n-b帧频域的观测信号在第k个频率的集合;X(k,n-b)=[x1(k,n-b),x1(k,n-b),......,xm(k,n-b),......,xM(k,n-b)],xm(k,n-b)表示第n-b帧第k个频率的第m个频域的观测信号。
4.如权利要求3所述的方法,其特征在于,
初始时,即当n=1时,
Figure FDA0002492326310000022
Figure FDA0002492326310000023
5.如权利要求3所述的方法,其特征在于,还包括:
通过以下公式对ωm,b(k,n)进行归一化:
Figure FDA0002492326310000024
6.如权利要求2或5所述的方法,其特征在于,
通过以下公式获得频域的分离信号:
Figure FDA0002492326310000025
其中,Y(k,n)表示第n帧频域的分离信号在k个频率的集合,Y1(k,n),Y2(k,n),......,YN(k,n)表示第n帧第k个频率的频域的分离信号,分别为Y(k,n)的第1~N列。
7.一种盲源分离装置,其特征在于,包括:
获取单元,用于获取M个观测信号,所述M个观测信号是由M个麦克风采集的N个源信号的混合信号;
第一转换单元,用于将所述观测信号从时域转换到频域,获得频域的观测信号;
计算单元,用于根据独立向量分析算法逐频点计算所述频域的观测信号在各滤波块的解混矩阵,所述滤波块为利用频域滤波器分块算法对频域的观测信号进行分块获得的;
分离单元,用于将所述频域的观测信号根据所述频域的观测信号在各滤波块的解混矩阵逐频点进行盲源分离,获得频域的分离信号;
第二转换单元,用于将所述频域的分离信号转换到时域,获得时域的分离信号。
8.如权利要求7所述的装置,其特征在于,
所述计算单元,具体用于通过以下公式逐频点计算所述频域的观测信号在各滤波块的解混矩阵:
Figure FDA0002492326310000031
其中,Wb(k,n)表示第n帧频域的观测信号在第k频率的第b+1个滤波块的解混矩阵,k表示频率索引,b=0,1,2,......,B-1,B表示滤波器块数;
ωm,b(k,n)表示Wb(k,n)的第m列,m=1,2,......,M,M表示观测信号的个数,ωm,b(k,n)=(Wb(k,n-1)Vm(k,n))-1em
Wb(k,n-1)表示第n-1帧频域的观测信号在第k频率的第b+1个滤波块的解混矩阵,
Figure FDA0002492326310000032
ωm,b(k,n-1)表示Wb(k,n-1)的第m列;
Vm(k,n)表示V(k,n)的第m列,V(k,n)表示第n帧第k个频率的加权协方差矩阵,V(k,n)=[V1(k,n),V2(k,n),......,Vm(k,n),......,VM(k,n)]。
9.如权利要求8所述的装置,其特征在于,
所述计算单元,具体用于通过以下公式计算Vm(k,n):
Figure FDA0002492326310000041
其中,α表示平滑系数;
Vm(k,n-1)表示第n-1帧第k个频率的加权协方差矩阵V(k,n-1)的第m列;X(k,n-b)表示第n-b帧频域的观测信号在第k个频率的集合;X(k,n-b)=[x1(k,n-b),x1(k,n-b),......,xm(k,n-b),......,xM(k,n-b)],xm(k,n-b)表示第n-b帧第k个频率的第m个频域的观测信号。
10.如权利要求9所述的装置,其特征在于,
初始时,即当n=1时,
Figure FDA0002492326310000042
Figure FDA0002492326310000043
11.如权利要求9所述的装置,其特征在于,
所述计算单元,还用于通过以下公式对ωm,b(k,n)进行归一化:
Figure FDA0002492326310000051
12.如权利要求8或11所述的装置,其特征在于,
所述分离单元,具体用于通过以下公式获得频域的分离信号:
Figure FDA0002492326310000052
其中,Y(k,n)表示第n帧频域的分离信号在k个频率的集合,Y1(k,n),Y2(k,n),......,YN(k,n)表示第n帧第k个频率的频域的分离信号,分别为Y(k,n)的第1~N列。
13.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1~6任一项所述的盲源分离方法。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1~6任一项所述的盲源分离方法中的步骤。
CN202010408759.9A 2020-05-14 2020-05-14 一种盲源分离方法及装置 Active CN111667846B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010408759.9A CN111667846B (zh) 2020-05-14 2020-05-14 一种盲源分离方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010408759.9A CN111667846B (zh) 2020-05-14 2020-05-14 一种盲源分离方法及装置

Publications (2)

Publication Number Publication Date
CN111667846A true CN111667846A (zh) 2020-09-15
CN111667846B CN111667846B (zh) 2023-06-16

Family

ID=72383637

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010408759.9A Active CN111667846B (zh) 2020-05-14 2020-05-14 一种盲源分离方法及装置

Country Status (1)

Country Link
CN (1) CN111667846B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112435685A (zh) * 2020-11-24 2021-03-02 深圳市友杰智新科技有限公司 强混响环境的盲源分离方法、装置、语音设备和存储介质
CN113951887A (zh) * 2021-12-22 2022-01-21 北京航空航天大学杭州创新研究院 一种频谱匹配独立成分分析方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101667425A (zh) * 2009-09-22 2010-03-10 山东大学 一种对卷积混叠语音信号进行盲源分离的方法
US20130297296A1 (en) * 2012-05-04 2013-11-07 Sony Computer Entertainment Inc. Source separation by independent component analysis in conjunction with source direction information
CN106887238A (zh) * 2017-03-01 2017-06-23 中国科学院上海微系统与信息技术研究所 一种基于改进独立向量分析算法的声信号盲分离方法
CN109616138A (zh) * 2018-12-27 2019-04-12 山东大学 基于分段频点选择的语音信号盲分离方法和双耳助听系统
CN110473565A (zh) * 2019-07-04 2019-11-19 中国人民解放军63892部队 一种无需源数估计的独立向量分析信号分离方法
CN111133511A (zh) * 2017-07-19 2020-05-08 音智有限公司 声源分离系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101667425A (zh) * 2009-09-22 2010-03-10 山东大学 一种对卷积混叠语音信号进行盲源分离的方法
US20130297296A1 (en) * 2012-05-04 2013-11-07 Sony Computer Entertainment Inc. Source separation by independent component analysis in conjunction with source direction information
CN106887238A (zh) * 2017-03-01 2017-06-23 中国科学院上海微系统与信息技术研究所 一种基于改进独立向量分析算法的声信号盲分离方法
CN111133511A (zh) * 2017-07-19 2020-05-08 音智有限公司 声源分离系统
CN109616138A (zh) * 2018-12-27 2019-04-12 山东大学 基于分段频点选择的语音信号盲分离方法和双耳助听系统
CN110473565A (zh) * 2019-07-04 2019-11-19 中国人民解放军63892部队 一种无需源数估计的独立向量分析信号分离方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
冯涛;朱立东;: "采用互补滤波器组进行频带分解的欠定盲源分离方法" *
刘鹏;胡剑凌;: "语音信号频域盲分离中一种频率对准方法" *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112435685A (zh) * 2020-11-24 2021-03-02 深圳市友杰智新科技有限公司 强混响环境的盲源分离方法、装置、语音设备和存储介质
CN112435685B (zh) * 2020-11-24 2024-04-12 深圳市友杰智新科技有限公司 强混响环境的盲源分离方法、装置、语音设备和存储介质
CN113951887A (zh) * 2021-12-22 2022-01-21 北京航空航天大学杭州创新研究院 一种频谱匹配独立成分分析方法及系统

Also Published As

Publication number Publication date
CN111667846B (zh) 2023-06-16

Similar Documents

Publication Publication Date Title
CN109074820B (zh) 使用神经网络进行音频处理
CN106233382B (zh) 一种对若干个输入音频信号进行去混响的信号处理装置
US8554818B2 (en) Signal processing method and data processing method and apparatus
WO2018223727A1 (zh) 识别声纹的方法、装置、设备及介质
US10818302B2 (en) Audio source separation
CN105788607A (zh) 应用于双麦克风阵列的语音增强方法
CN104053120A (zh) 一种立体声音频的处理方法和装置
CN104134444B (zh) 一种基于mmse的歌曲去伴奏方法和装置
CN111667846B (zh) 一种盲源分离方法及装置
EP3147900B1 (en) Method and device for processing audio signal
CN111739555B (zh) 基于端到端深度神经网络的音频信号处理方法及装置
CN113345465B (zh) 语音分离方法、装置、设备及计算机可读存储介质
CN110875037A (zh) 语音数据处理方法、装置及电子设备
CN113555031B (zh) 语音增强模型的训练方法及装置、语音增强方法及装置
JP2019054344A (ja) フィルタ係数算出装置、収音装置、その方法、及びプログラム
JP2018191255A (ja) 収音装置、その方法、及びプログラム
CN113643689B (zh) 一种数据滤波方法和相关设备
CN116959422B (zh) 多对多的实时语音变音方法、设备及存储介质
WO2017176968A1 (en) Audio source separation
Jiang et al. A Complex Neural Network Adaptive Beamforming for Multi-channel Speech Enhancement in Time Domain
CN104952455A (zh) 实现混响的方法和装置
CN116364103A (zh) 一种语音信号处理方法和装置及电子设备
Moussa et al. New Parametrization of Automatic Speech Recognition System Using Robust PCA
CN112634930A (zh) 多通道声音增强方法、装置及电子设备
CN113921032A (zh) 音频处理模型的训练方法及装置、音频处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant