CN113591537A - 一种双迭代非正交联合块对角化卷积盲源分离方法 - Google Patents
一种双迭代非正交联合块对角化卷积盲源分离方法 Download PDFInfo
- Publication number
- CN113591537A CN113591537A CN202110548008.1A CN202110548008A CN113591537A CN 113591537 A CN113591537 A CN 113591537A CN 202110548008 A CN202110548008 A CN 202110548008A CN 113591537 A CN113591537 A CN 113591537A
- Authority
- CN
- China
- Prior art keywords
- matrix
- convolution
- signal
- order
- aliasing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000926 separation method Methods 0.000 title claims abstract description 55
- 239000011159 matrix material Substances 0.000 claims abstract description 126
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 26
- 230000006870 function Effects 0.000 claims description 36
- 239000013598 vector Substances 0.000 claims description 21
- 239000000126 substance Substances 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 10
- 239000000654 additive Substances 0.000 claims description 9
- 230000000996 additive effect Effects 0.000 claims description 9
- 230000001934 delay Effects 0.000 claims description 6
- 230000003111 delayed effect Effects 0.000 claims description 5
- 238000009795 derivation Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims description 3
- 230000001419 dependent effect Effects 0.000 claims description 2
- 238000000034 method Methods 0.000 abstract description 55
- 238000002474 experimental method Methods 0.000 description 17
- 238000012545 processing Methods 0.000 description 10
- 238000005457 optimization Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 238000012887 quadratic function Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000002059 diagnostic imaging Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012889 quartic function Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/02—Preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
- G06F2218/08—Feature extraction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Signal Processing (AREA)
- General Engineering & Computer Science (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Quality & Reliability (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Complex Calculations (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明公开了一种双迭代非正交联合块对角化卷积盲源分离方法,包括:从M个传感器接收并记录源信号的观测信号,获得观测信号在指定时延下的二阶时延相关矩阵组,根据所述二阶时延相关矩阵组构造卷积对称拟合代价函数,利用双迭代算法求解所述卷积对称拟合代价函数,获得源信号的估计值。该方法直接在时域内迭代求解混叠矩阵和对角矩阵组,避免了频域算法存在比较严重的排列不定性问题,能够有效提高语音分离后语音识别精准率,且该方法收敛稳定且能做到快速收敛,同时时间复杂度较低。
Description
技术领域
本发明属于信号处理技术领域,具体涉及一种双迭代非正交联合块对角化卷积盲源分离方法,用于混叠方式为卷积混叠时的盲源信号分离,可应用于雷达信号处理、语音信号处理、生物医学信号处理、无线通信处理等领域。
背景技术
在无线电通信、医学成像等众多领域都要通过接收到的观测信号来分析源信号的各种性能特征,如何在混叠系统中分离或者说恢复出未知的源信号已逐渐成为信号处理技术领域的研究热点,比如在对雷达信号进行处理时,并不知道发射信号与传输信道,但希望利用接收天线接收到的观测数据信号来提取出原发射信号,采用盲信号处理技术可以最大程度地解决源信号的提取问题。盲源分离是盲信号处理的一个应用方面,具体是指在未知源信号和传输信道参数的情况下,根据输入源信号的统计特性,仅利用观测信号就能分离出各个统计独立的源信号的过程。
盲源分离问题通常使用多输入多输出系统来建立数学模型,其早期研究主要集中于瞬时混叠的情景,瞬时混叠的数学模型相对来说比较简单。但是在信号传播过程存在多径、时延等情况下,卷积混叠模型与该情况更加匹配。卷积混叠盲源分离算法应用非常广泛,存在混响的音视频会议室,存在多径反射的低仰角相控阵雷达站等都有卷积混叠盲源分离算法的“身影”。近年来,麦克风阵列在智能人机交互领域发挥出越来越重要的作用,成为了信号处理领域的研究热点之一。该技术的典型应用场景有音视频会议系统、人工智能音箱以及车载人机交互系统等等。语音增强技术研究早期,一般采用单麦克风传感器接收信号进行语音增强。为提高信号增益和空间分辨率,目前语音增强技术研究已由单通道转变为多通道语音增强技术。相比于单麦克风,麦克风阵列具备一定的空间分辨能力及丰富的谱信息,其性能得到了显著提升。
这类问题通常建模为有限阶冲激响应滤波器,通过估计滤波器系数实现卷积混叠盲源分离。目前卷积混叠盲源分离算法多为频域算法,主要是利用卷积混叠变换为瞬时混叠的思想。通过短时傅里叶变换将时域卷积混叠分解为子频带上的瞬时混叠,再利用瞬时混叠盲源分离算法进行源信号的分离。然而,这种方法存在严重的排列模糊问题,且运算复杂,时间复杂度高。
发明内容
为了解决现有技术中存在的上述问题,本发明提供了一种双迭代非正交联合块对角化卷积盲源分离方法。本发明要解决的技术问题通过以下技术方案实现:
本发明的一个方面提供了一种双迭代非正交联合块对角化卷积盲源分离方法,包括:
S1:从M个传感器接收并记录源信号的观测信号:
x(t)=[x1(t),x2(t),…,xM(t)],
其中,t是时间序列,第m个传感器接收的观测信号取窗长为Q+1的滑窗窗口,窗口内的采样点数据构成列矢量:
xm(t)=[xm(t),xm(t-1),…,xm(t-Q)],m=1,2,…,M,
其中,Q表示窗口长度;
S2:获得观测信号x(t)在指定时延τl下的二阶时延相关矩阵组:
其中,l=1,2,…,L,L为指定时延的总个数,[]H表示共轭转置,E{*}表示取期望,表示延时重组后源信号的二阶τl延时相关矩阵,Rnn(τl)表示噪声信号n(t)的二阶τl延时相关矩阵,是P阶FIR滤波器的系数矩阵组,其维度为M*NP;
S3:根据所述二阶时延相关矩阵组构造卷积对称拟合代价函数;
S4:利用双迭代算法求解所述卷积对称拟合代价函数,获得源信号的估计值。
在本发明的一个实施例中,所述S2包括:
S21:利用P阶FIR滤波器组成的卷积混叠模型描述观测信号:
其中,s(t)=[s1(t),s2(t),…,sN(t)]T为N维源信号加窗矢量,p为滤波器阶数,sn(t)=[s1(t),s2(t-1),…,sn(t-Q)]为第n个源信号加窗矢量,n(t)为加性噪声矢量,A(p)为P阶FIR滤波器的参数,是维数为M*N的矩阵,由amn(p)组成,amn(p)为矩阵A(p)中的元素;
S22:将所述卷积混叠模型表示为:
S23:获得观测信号x(t)的二阶τl延时相关矩阵:
在本发明的一个实施例中,所述S3包括:
S32:利用所述等效模型,获得τl时延下的二阶相关矩阵:
S33:将步骤S32所述的二阶相关矩阵简化为对角矩阵形式:
在本发明的一个实施例中,所述S4包括:
S41:利用所述卷积对称拟合代价函数估计所述块内对角化矩阵;
S42:利用所述卷积对称拟合代价函数估计混叠矩阵;
S43:根据所述混叠矩阵得到源信号的估计值。
在本发明的一个实施例中,所述S41包括:
令共轭导数为零,则存在:
其中,C1为λτ,n所在中的位置坐标的集合;为遍历C1中每一个坐标,取出行坐标作为取出列坐标作为C2为中每一个λ的位置坐标的集合;为遍历C2中每一个坐标,取出行坐标作为m,取出列坐标作为mod(m,N)为m对N取余的余数;
获得所述块内对角化矩阵Λ(l):
在本发明的一个实施例中,所述S42包括:
将所述卷积对称拟合代价函数JCSFF展开为:
求解函数JCSFF关于混叠矩阵H的共轭导数并令导数为零,得到混叠矩阵H的迭代式:
在本发明的一个实施例中,所述S43包括:
本发明的另一方面提供了一种存储介质,所述存储介质中存储有计算机程序,所述计算机程序用于执行上述实施例中任一项所述双迭代非正交联合块对角化卷积盲源分离方法的步骤。
本发明的又一方面提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时实现如上述实施例中任一项所述双迭代非正交联合块对角化卷积盲源分离方法的步骤。
与现有技术相比,本发明的有益效果在于:
1、本发明的双迭代非正交联合块对角化卷积盲源分离方法直接在时域内迭代求解混叠矩阵和对角矩阵组,避免了频域算法存在比较严重的排列不定性问题,避免陷入局部最优解,能够有效提高语音分离后语音识别精准率。同时推导双迭代算法,用于卷积对称拟合代价函数的优化求解,双迭代算法在优化过程中更容易收敛到全局最优点,且所需要的迭代收敛步骤更少。
2、该双迭代非正交联合块对角化卷积盲源分离方法收敛稳定且能做到快速收敛,同时算法的时间复杂度较低,表现出良好的性能。
以下将结合附图及实施例对本发明做进一步详细说明。
附图说明
图1是本发明实施例提供的一种双迭代非正交联合块对角化卷积盲源分离方法的流程图;
图2是本发明实施例提供的一种卷积混叠盲源分离的信号混叠和分离模型;
图3是50次独立实验后,本发明实施例的方法与现有ZJBD、TIA-JBD方法的GRL数值分布图;
图4是100次独立实验后,本发明实施例的方法与现有ZJBD、TIA-JBD方法迭代次数随NER的变化曲线图;
图5是100次独立实验后,本发明实施例的方法与现有ZJBD、TIA-JBD方法GRL随NER的变化曲线图;
图6是采集的源声音信号的波形图;
图7是源信号经过卷积混叠后得到的6路观测信号波形图;
图8是利用本发明实施例的方法处理后得到的分离信号波形图。
具体实施方式
为了进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及具体实施方式,对依据本发明提出的双迭代非正交联合块对角化卷积盲源分离方法进行详细说明。
有关本发明的前述及其他技术内容、特点及功效,在以下配合附图的具体实施方式详细说明中即可清楚地呈现。通过具体实施方式的说明,可对本发明为达成预定目的所采取的技术手段及功效进行更加深入且具体地了解,然而所附附图仅是提供参考与说明之用,并非用来对本发明的技术方案加以限制。
应当说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的物品或者设备中还存在另外的相同要素。
请参照图1,图1是本发明实施例提供的一种双迭代非正交联合块对角化卷积盲源分离方法的流程图。所述方法包括:
S1:从M个传感器接收并记录源信号的观测信号。
具体地,在实际的声学房间环境中,由于反射、混响的原因,声音源信号以不同的时间延迟被传感器阵列接收,得到观测信号,这种情景被称为多径或混响问题。需要说明的是,因为语音信号是宽带信号且是非平稳的,一般假设语音信号满足短时平稳特性。因此,对于语音信号,通常采用加窗的形式进行处理。对M个传感器组成的传感器阵列中第m个传感器接收的观测信号取窗长为Q+1的滑窗窗口,窗口内的采样点数据构成列矢量:
xm(t)=[xm(t),xm(t-1),…,xm(t-Q)],m=1,2,…,M (1)
将各传感器观测的信号数据排列在一起,定义观测信号:
x(t)=[x1(t),x2(t),…,xM(t)] (2)
S2:获得观测信号x(t)在指定时延τl下的二阶时延相关矩阵组。
具体地,请参见图2,图2是本发明实施例提供的一种卷积混叠盲源分离的信号混叠和分离模型。如图2所示,观测信号x(t)可以用P阶FIR(Finite Impulse Response,有限长单位冲激响应)滤波器组成的卷积混叠模型来描述:
其中,t是时间序列;s(t)=[s1(t),s2(t),…,sN(t)]T是N维源信号加窗矢量,sn(t)=[s1(t),s2(t-1),…,sn(t-Q)]为第n个源信号加窗矢量;n(t)为加性噪声矢量;A(p)为P阶FIR滤波器的参数,是维数为M*N的矩阵,由amn(p)组成,amn(p)为矩阵A(p)中的元素。
式(3)也可表示为:
需要说明的是,这里对源信号和混叠矩阵作如下假设:
(1)源信号s(t)中各个分量信号之间互不相关;
(2)源信号s(t)中各个分量信号为零均值的平稳信号;
(3)噪声信号为零均值、具有相同方差的白信号;
(4)混叠矩阵A为非奇异或者列满秩的。
随后,观测信号x(t)的二阶τl延时相关矩阵可以用下式描述:
其中,Rs(τl)表示真实源信号s(t)的二阶τl延时相关矩阵。
可以看出,该联合块对角化结构式为块间Toeplitz化,块内对角化结构。在实际应用中,需要采用滑窗方式构造观测信号的相关矩阵,因此矩阵组不可避免的存在一定的估计误差。一般地,当选取参数恰当时,该误差可忽略不计。
S3:根据所述二阶时延相关矩阵组构造卷积对称拟合代价函数。
显然,该代价函数是关于的四次函数。实验证明,对于四次函数的优化容易陷入周期解,即不能稳定收敛至全局最优解,随着迭代次数波动的解。通常情况下,周期解不为全局最优解。因此,本实施例通过广义置换矩阵变换方法将代价函数变换为三个待估计量二次函数的形式,具体如下。
根据盲源分离问题存在的排列不定性和尺度不定性,利用广义置换矩阵将观测信号做变换,经过广义置换矩阵变换后对可联合块对角化结构不会产生影响,此时的矩阵的尺寸与卷积混叠矩阵的尺寸相匹配。同样地,在不考虑加性噪声情况下,取观测信号x(t)=[x1(t),x2(t),…,xM(t)]T,并将其转换为如下的等效模型:
接着,将式(11)中的二阶相关矩阵简化为对角矩阵形式:
其中,块内对角化矩阵Λ(l)可表示为:
λl,n为τl延时情况下,广义置换后的第n通道源信号的自相关系数。
显然,该卷积对称拟合代价函数JCSFF不要求目标矩阵为对称矩阵,不要求混叠矩阵为酉正交矩阵。可以通过对混叠矩阵的每一列矢量做归一化约束,来减少算法因混叠矩阵列矢量忽大忽小而出现发散不收敛的情况。由于因此该卷积对称拟合代价函数JCSFF是两因子H和的二次函数。
S4:利用双迭代算法求解所述卷积对称拟合代价函数,获得源信号的估计值。
具体地,所述S4包括:
S41:利用所述卷积对称拟合代价函数估计所述块内对角化矩阵。
卷积对称拟合代价函数JCSFF的每个子函数不仅是Λ(l)的函数,还是Λ(l+p),p=-L+1,-L+2,…,L-1的函数,因此JCSFF关于对角矩阵组Λ(l)的最小值需要联合求解。因此代价函数JCSFF直接对求导公式为:
因此,
令共轭导数为零,则有:
则整理式(19)可得:
其中,
显然,对角矩阵Λ(l)可整理为下式:
S42:利用所述卷积对称拟合代价函数估计混叠矩阵。
将所述卷积对称拟合代价函数JCSFF展开为:
求解函数JCSFF关于矩阵H的共轭导数并令导数为零,得到混叠矩阵H的迭代式:
S43:根据所述混叠矩阵得到源信号的估计值。
接着,进行了时间复杂度分析,时间复杂度往往决定了该方法的应用与推广能力。低时间复杂度方法对硬件性能依赖更低,具备易部署、低成本的特点。在此详细分析了本发明实施例所提双迭代非正交联合块对角化卷积盲源分离方法的时间复杂度,为运算效率这一重要指标提供理论支持。本发明实施例所提方法复杂度分析如表1所示:
表1.本发明方法的时间复杂度分析
其中,N为源信号数目;P为阶FIR滤波器的阶数,即卷积混叠的阶数,一般情况下P数值较小。L为相关矩阵的个数。舍去时间复杂度低阶项,本发明实施例的方法每次迭代过程的时间复杂度为O(LN3P3)。表2对比了本发明方法和常见基于非正交联合块对角化的卷积盲源分离方法的计算复杂度。
表2.本发明方法和现有非正交联合块对角化卷积盲源分离方法的计算复杂度比较
JAJBD(jacobi-based joint block-diagonalization algorithm):基于jacobi旋转的联合块对角化算法;
ZJBD(Non-orthogonal joint block-diagonalization algorithm):非正交的联合块对角化算法;
QJBD(quadratic joint block-diagonalization algorithm):二次优化的联合块对角化算法;
TIA-JBD(Tri-Iterativejoint block-diagonalization algorithm):三迭代联合块对角化算法
通过对比可以看出,本发明方法的复杂度为O(LN3P3),远小于ZJBD和QJBD。因为JAJBD的时间复杂度系数较大,因此TIA-NOJBD和本发明方法的时间复杂度要小于JAJBD。而TIA-NOJBD和本发明方法时间复杂度基本一致。因此,本发明方法在非正交联合对角化卷积盲源分离方法中时间复杂度较低,实时性更好。
接着,通过以下性能指标,对本发明实施例的双迭代非正交联合块对角化卷积盲源分离方法的性能进行进一步分析。
(1)噪声扰动(Noise Expectation Ratio,NER):定义对角化矩阵组和误差矩阵的F-范数的平方比为NER,描述为下式:
(2)迭代次数:迭代过程中,如果GRL(全局拒噪水平)变化微小或者不变化时,视为优化过程已完成。实验中采用两次迭代的GRL之差小于0.0001来判断优化完成,然后停止优化并记录此刻迭代次数。因此,迭代次数反映了该方法优化过程所需的收敛时间,可以用来衡量方法的时间复杂度。
显然,当全局传输矩阵为广义置换矩阵时,GRL=0。因此,不考虑尺度不确定性和排列不确定性问题下,当GRL趋于0时,混叠矩阵的估计值H越接近于真实的混叠矩阵。GRL衡量混叠矩阵估计值H与真实的混叠矩阵的相似度。GRL越小,说明混叠矩阵越接近真实值,方法收敛性能越好;反之,说明方法收敛性能较差。
实验一:设置NER=10dB,产生扰动矩阵组R(l)=HΛ(l)HH+ΔR(l),l=1,2,…,L。然后进行50次独立实验,分别记录ZJBD、TIA-JBD以及本文提出方法(记为DBIA-JBD)的三种方法实验中的GRL值,根据GRL值分布分析方法的稳定收敛特性。请参见图3,图3是50次独立实验后,本发明实施例的方法与现有ZJBD、TIA-JBD方法的GRL数值分布图。可以看出,ZJBD方法在NER=10dB的情况下收敛效果不是很理想,约20次独立实验优化过程没有收敛,导致数值很高。而对比TIA-JBD和本发明方法可以发现,两者的稳定收敛性能差异不大,均达到了稳定收敛的效果
实验二:对比ZJBD、TIA-JBD以及本发明方法(记为DBIA-JBD)三种方法的盲源分离性能。通过变化NER来改变扰动矩阵组中扰动项的大小进行两组不同的试验:(1)对比ZJBD、TIA-JBD以及本发明方法三种方法,100次独立实验后,迭代次数随NER变化曲线;(2)对比ZJBD、TIA-JBD以及本发明方法三种方法,100次独立实验后,GRL随NER变化曲线。分析对比三种方法的收敛速度及盲源分离性能。从图4何图5中可以看出,ZJBD方法迭代次数在低扰动情况下表现明显好于高扰动情景,其GRL值随NER的增大而减小,但是整体上GRL值处于较高水平。TIA-JBD和本发明方法相比较:在高NER,即低扰动情况下,TIA-JBD的迭代次数与本发明方法差异较小,但是其GRL值比本发明方法更低,表现更优秀。反之,在低NER,即高扰动情况下,不管是在迭代次数指标上还是GRL指标上,本发明方法均占据优势,表现出色。实验验证了在高扰动的情况下,本发明的方法保证快速收敛的同时,盲源分离性能有一定的提升。
实验三:采集三段语音信号,设置P=5,产生一个卷积混叠矩阵。然后让语音信号经过卷积混叠矩阵后,由6个麦克风传感器接收,得到观测信号。这里我们取L=26,即26个目标矩阵进行本次实验。考虑加性噪声的影响,在观测信号中添加加性噪声。通过仿真实验验证方法在语音分离任务上的有效性。请参见图6和图8,图6是采集的源声音信号的波形图;图7是源信号经过卷积混叠后得到的6路观测信号波形图;图8是利用本发明实施例的方法处理后得到的分离信号波形图。从图中可以直观的看出,本发明提出的方法可以有效的进行卷积混叠语音信号的盲分离。如果使用音频播放设备将分离后的语音播放出来,利用同一个语音识别系统进行语音转文字。实验显示,在语音识别系统中,分离后的语音识别率大大改善。相比于语音分离前,语音分离后语音识别精准率指标提高了63%的性能。
本发明的双迭代非正交联合块对角化卷积盲源分离方法直接在时域内迭代求解混叠矩阵和对角矩阵组,避免了频域算法存在比较严重的排列不定性问题,避免陷入局部最优解,能够有效提高语音分离后语音识别精准率。同时推导双迭代算法,用于卷积对称拟合代价函数的优化求解,双迭代算法在优化过程中更容易收敛到全局最优点,且所需要的迭代收敛步骤更少。另外,该双迭代非正交联合块对角化卷积盲源分离方法收敛稳定且能做到快速收敛,同时算法的时间复杂度较低,表现出良好的性能。
本发明的又一实施例提供了一种存储介质,所述存储介质中存储有计算机程序,所述计算机程序用于执行上述实施例中所述双迭代非正交联合块对角化卷积盲源分离方法的步骤。本发明的再一方面提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时实现如上述实施例所述双迭代非正交联合块对角化卷积盲源分离方法的步骤。具体地,上述以软件功能模块的形式实现的集成的模块,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台电子设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
Claims (9)
1.一种双迭代非正交联合块对角化卷积盲源分离方法,其特征在于,包括:
S1:从M个传感器接收并记录源信号的观测信号:
x(t)=[x1(t),x2(t),…,xM(t)],
其中,t是时间序列,第m个传感器接收的观测信号取窗长为Q+1的滑窗窗口,窗口内的采样点数据构成列矢量:
xm(t)=[xm(t),xm(t-1),…,xm(t-Q)],m=1,2,…,M,
其中,Q表示窗口长度;
S2:获得观测信号x(t)在指定时延τl下的二阶时延相关矩阵组:
其中,l=1,2,…,L,L为指定时延的总个数,[]H表示共轭转置,E{*}表示取期望,表示延时重组后源信号的二阶τl延时相关矩阵,Rnn(τl)表示噪声信号n(t)的二阶τl延时相关矩阵,是P阶FIR滤波器的系数矩阵组,其维度为M*NP;
S3:根据所述二阶时延相关矩阵组构造卷积对称拟合代价函数;
S4:利用双迭代算法求解所述卷积对称拟合代价函数,获得源信号的估计值。
2.根据权利要求1所述的双迭代非正交联合块对角化卷积盲源分离方法,其特征在于,所述S2包括:
S21:利用P阶FIR滤波器组成的卷积混叠模型描述观测信号:
其中,s(t)=[s1(t),s2(t),…,sN(t)]T为N维源信号加窗矢量,p为滤波器阶数,sn(t)=[s1(t),s2(t-1),…,sn(t-Q)]为第n个源信号加窗矢量,n(t)为加性噪声矢量,A(p)为P阶FIR滤波器的参数,是维数为M*N的矩阵,由amn(p)组成,amn(p)为矩阵A(p)中的元素;
S22:将所述卷积混叠模型表示为:
S23:获得观测信号x(t)的二阶τl延时相关矩阵:
4.根据权利要求3所述的双迭代非正交联合块对角化卷积盲源分离方法,其特征在于,所述S4包括:
S41:利用所述卷积对称拟合代价函数估计所述块内对角化矩阵;
S42:利用所述卷积对称拟合代价函数估计混叠矩阵;
S43:根据所述混叠矩阵得到源信号的估计值。
8.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,所述计算机程序用于执行权利要求1至7中任一项所述双迭代非正交联合块对角化卷积盲源分离方法的步骤。
9.一种电子设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时实现如权利要求1至7任一项所述双迭代非正交联合块对角化卷积盲源分离方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110548008.1A CN113591537B (zh) | 2021-05-19 | 2021-05-19 | 一种双迭代非正交联合块对角化卷积盲源分离方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110548008.1A CN113591537B (zh) | 2021-05-19 | 2021-05-19 | 一种双迭代非正交联合块对角化卷积盲源分离方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113591537A true CN113591537A (zh) | 2021-11-02 |
CN113591537B CN113591537B (zh) | 2024-03-22 |
Family
ID=78243153
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110548008.1A Active CN113591537B (zh) | 2021-05-19 | 2021-05-19 | 一种双迭代非正交联合块对角化卷积盲源分离方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113591537B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113899948A (zh) * | 2021-12-08 | 2022-01-07 | 成都中星世通电子科技有限公司 | 一种电磁频谱目标特征数据快速提取系统及方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000025489A1 (de) * | 1998-10-27 | 2000-05-04 | Siemens Aktiengesellschaft | Signaltrennungsverfahren und -anordnung für nichtlineare mischungen unbekannter signale |
US20030204380A1 (en) * | 2002-04-22 | 2003-10-30 | Dishman John F. | Blind source separation utilizing a spatial fourth order cumulant matrix pencil |
WO2009083615A1 (en) * | 2008-01-03 | 2009-07-09 | Commissariat A L'energie Atomique | Method for separating mixed signals into a plurality of component signals |
CN102568493A (zh) * | 2012-02-24 | 2012-07-11 | 大连理工大学 | 一种基于最大矩阵对角率的欠定盲分离方法 |
CN103871422A (zh) * | 2014-01-08 | 2014-06-18 | 西安电子科技大学 | 基于三因子迭代联合块对角化的时域混叠盲信号分离方法 |
JP2015210512A (ja) * | 2014-04-24 | 2015-11-24 | 晋哉 齋藤 | ブラインド信号分離方法およびその装置 |
CN107290730A (zh) * | 2017-05-10 | 2017-10-24 | 长江大学 | 互耦条件下双基地mimo雷达角度估算方法 |
-
2021
- 2021-05-19 CN CN202110548008.1A patent/CN113591537B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000025489A1 (de) * | 1998-10-27 | 2000-05-04 | Siemens Aktiengesellschaft | Signaltrennungsverfahren und -anordnung für nichtlineare mischungen unbekannter signale |
US20030204380A1 (en) * | 2002-04-22 | 2003-10-30 | Dishman John F. | Blind source separation utilizing a spatial fourth order cumulant matrix pencil |
WO2009083615A1 (en) * | 2008-01-03 | 2009-07-09 | Commissariat A L'energie Atomique | Method for separating mixed signals into a plurality of component signals |
CN102568493A (zh) * | 2012-02-24 | 2012-07-11 | 大连理工大学 | 一种基于最大矩阵对角率的欠定盲分离方法 |
CN103871422A (zh) * | 2014-01-08 | 2014-06-18 | 西安电子科技大学 | 基于三因子迭代联合块对角化的时域混叠盲信号分离方法 |
JP2015210512A (ja) * | 2014-04-24 | 2015-11-24 | 晋哉 齋藤 | ブラインド信号分離方法およびその装置 |
CN107290730A (zh) * | 2017-05-10 | 2017-10-24 | 长江大学 | 互耦条件下双基地mimo雷达角度估算方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113899948A (zh) * | 2021-12-08 | 2022-01-07 | 成都中星世通电子科技有限公司 | 一种电磁频谱目标特征数据快速提取系统及方法 |
CN113899948B (zh) * | 2021-12-08 | 2022-03-04 | 成都中星世通电子科技有限公司 | 一种电磁频谱目标特征数据快速提取系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113591537B (zh) | 2024-03-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20180182410A1 (en) | Online dereverberation algorithm based on weighted prediction error for noisy time-varying environments | |
Giannakis et al. | Linear multichannel blind equalizers of nonlinear FIR Volterra channels | |
CN108447498B (zh) | 应用于麦克风阵列的语音增强方法 | |
US8737460B2 (en) | Equalizer and detector arrangement employing joint entropy-based calibration | |
KR20160095008A (ko) | 음향 에코 제거를 위한 룸 임펄스 응답을 추정하는 방법 | |
CN114785379A (zh) | 一种水声janus信号参数估计方法及系统 | |
CN110941980B (zh) | 一种密集环境中基于压缩感知的多径时延估计方法及装置 | |
CN113591537B (zh) | 一种双迭代非正交联合块对角化卷积盲源分离方法 | |
CN109799484B (zh) | 一种外辐射源雷达系统多径抑制方法、系统及存储介质 | |
Malik et al. | Double-talk robust multichannel acoustic echo cancellation using least-squares MIMO adaptive filtering: transversal, array, and lattice forms | |
CN108416105B (zh) | 脉冲和高斯噪声下稳健的自适应波束形成算法 | |
JP6815956B2 (ja) | フィルタ係数算出装置、その方法、及びプログラム | |
Santos et al. | On low rank MVDR beamforming using the conjugate gradient algorithm | |
Oliinyk et al. | Time delay estimation for noise-like signals embedded in non-Gaussian noise using pre-filtering in channels | |
CN114035157B (zh) | 一种基于期望最大化算法的分频带时延估计方法及其系统 | |
US11322169B2 (en) | Target sound enhancement device, noise estimation parameter learning device, target sound enhancement method, noise estimation parameter learning method, and program | |
Mazur et al. | Robust room equalization using sparse sound-field reconstruction | |
CN114755628A (zh) | 非均匀噪声下声矢量传感器阵列波达方向估计方法 | |
Liang et al. | Coherent LMS algorithms | |
Xu et al. | Convolutive blind source separation based on joint block Toeplitzation and block-inner diagonalization | |
CN106249204B (zh) | 基于鲁棒自适应盲系统辨识的多通道时延估计方法 | |
Zhou et al. | Blind identification of multichannel FIR systems based on linear prediction | |
Cengiz | Signal reconstruction with adaptive multi-rate signal processing algorithms | |
CN114220453B (zh) | 基于频域卷积传递函数的多通道非负矩阵分解方法及系统 | |
CN113655441B (zh) | 一种低复杂度折中预白化的鲁棒声源定位方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |