CN108091345A

CN108091345A - 一种基于支持向量机的双耳语音分离方法

Info

Publication number: CN108091345A
Application number: CN201711443394.8A
Authority: CN
Inventors: 周琳; 庄琰; 王立杰; 李楠
Original assignee: Southeast University
Current assignee: Southeast University
Priority date: 2017-12-27
Filing date: 2017-12-27
Publication date: 2018-05-29
Anticipated expiration: 2037-12-27
Also published as: CN108091345B

Abstract

本发明公布了一种基于支持向量机的双耳语音分离方法，该方法首先将双耳声信号经过Gammatone滤波器后，提取各个子带声信号的耳间时间差ITD和参数耳间强度差IID；在训练阶段，将包含两个声源的纯净混合双耳声信号提取的子带ITD、IID参数作为支持向量机SVM的输入特征，训练得到每个子带的SVM分类器，在测试阶段，在混响和噪声环境下，对包含两个声源的测试混合双耳声信号提取子带特征，利用各个子带的SVM分类器，对各个子带的特征参数进行分类，从而完成对混合语音中各个声源的分离。本发明基于支持向量机模型的分类能力，实现了复杂声学环境下鲁棒的双耳语音分离，同时有效解决了频点数据丢失的问题。

Description

一种基于支持向量机的双耳语音分离方法

技术领域

本发明涉及语音分离方法，尤其涉及一种基于支持向量机的双耳语音分离方法。

背景技术

支持向量机(Support Vector Machine，SVM)是一种二分类模型，它是定义在特征空间上的间隔最大的线性分类器，并且可以通过使用不同的核函数实现非线性分类。它在解决小样本、非线性及高维模式识别中表现出许多特有的优势。目前，常用的双耳语音分离方法在复杂声学环境下的性能表现仍然不能令人满意，并且存在分离语音频点丢失的现象。

发明内容

发明目的：本发明针对现有技术存在的问题，基于SVM高维、非线性分类能力，提出了一种基于支持向量机的双耳语音分离技术，在不同声学环境下的仿真测试表明，本发明算法显著提高语音分离算法的鲁棒性，并且有效解决了频点丢失的问题。

技术方案：本发明所述的基于支持向量机的双耳语音分离方法包括以下步骤：

(1)将训练单声源语音信号与不同方位角的与头相关脉冲响应函数HRIR卷积，生成多个不同方位的单声源双耳声信号；

(2)将两个不同方位的单声源双耳声信号进行混合，生成多个训练混合双耳声信号；

(3)将步骤(2)得到的训练混合双耳声信号通过Gammatone滤波器组，分解为各个子带的时域信号，其中每个子带对应不同的频域范围；

(4)对每个子带的时域信号进行半波整流、平方根处理，之后再经过预处理获得单帧信号，作为训练混合双耳声信号的T-F时频单元；

(5)计算每个T-F时频单元的耳间时间差ITD和耳间强度差IID，作为T-F单元的特征矢量；

(6)将同一子带的T-F单元的特征矢量作为对应子带SVM向量机的训练样本；

(7)将步骤(1)得到的单声源双耳声信号分别按照步骤(3)和(4)执行，得到单声源双耳声信号的T-F单元，根据不同声源在同一T-F单元的信号能量，标记步骤(2)对应的训练混合双耳声信号中每个T-F单元的理想二进制掩膜IBM；

(8)构建每个子带的SVM支持向量机模型，将步骤(6)对应的训练样本和步骤(7)得到的理想二值掩膜IBM，作为对应子带的支持向量机SVM的训练数据集，进行训练，从而得到每个子带的SVM模型；

(9)将测试混合双耳声信号按照步骤(3)～(5)处理，得到对应的T-F单元的特征矢量，作为测试样本；

(10)将测试样本作为步骤(8)训练完成的各子带SVM支持向量机的输入特征，利用训练完成的各子带SVM支持向量机进行分类，得到测试混合双耳声信号中不同方位声源对应的掩膜矩阵；

(11)对分离得到的每个方位声源的掩膜矩阵，利用Gammatone合成滤波器组，反向合成各个方位声源对应的时域信号，从而实现语音分离。

进一步的，所述步骤(1)中不同方位的单声源双耳声信号的计算公式为：

s_L(t)＝s(t)*h_L

s_R(t)＝s(t)*h_R

其中，s_L(t)、s_R(t)表示指定方位的单声源左、右耳声信号，s(t)为训练单声源语音信号，h_L、h_R分别表示不同方位角θ对应的左耳HRIR、右耳HRIR，*为卷积运算。

进一步的，步骤(2)中包含两个不同方位声源的训练混合双耳声信号的计算公式为：

其中，表示第一个方位的单声源双耳声信号的左、右耳信号，表示第2个方位的单声源双耳声信号的左、右耳信号，s_left(t)、s_right(t)为包含两个不同方位声源的训练混合双耳声信号的左、右耳信号。

进一步的，步骤(3)中经Gammatone滤波器组分解得到的各个子带的时域信号的计算公式为：

x_left(i,t)＝s_left(t)*g_i(t)

x_right(i,t)＝s_right(t)*g_i(t)

其中，x_left(i,t)、x_right(i,t)表示训练混合双耳声信号s_left(t)、s_right(t)经过Gammatone滤波器后，得到的第i个子带的时域信号，g_i(t)为第i个Gamatone滤波器的脉冲响应函数:

其中，i代表滤波器的序号；C是滤波器增益；n代表滤波器的阶数；b_i为滤波器的衰减因子；f_i表示第i个Gammatone滤波器的中心频率。

进一步的，步骤(4)中半波整流、平方根处理的计算公式为：

进一步的，步骤(4)中预处理步骤包括分帧和加窗，其中：

分帧方法为：采用预设分帧长度和帧移，将半波整流、平方根处理后的声信号x_L(i,t)、x_R(i,t)划分为多个单帧信号x_L(i,kN+m)、x_R(i,kN+m)，其中，k为帧序号，m表示一帧内采样序号0≤m＜N，N为帧长；

加窗方法为：

x_L(i,k,m)＝w_H(m)x_L(i,kN+m)

x_R(i,k,m)＝w_H(m)x_R(i,kN+m)

其中x_L(i,k,m)、x_R(i,k,m)分别为预处理后的第i个子带、第k帧的左、右耳声信号，作为训练混合双耳声信号的T-F时频单元；

为汉明窗。

进一步的，步骤(5)具体包括：

(5-1)计算

CCF(i,k,d)表示第i子带、第k帧的T-F单元时延为d的互相关值；x_L(i,k,m)、x_R(i,k,m)为第i个子带、第k帧的T-F单元；分别表示第i个子带、第k帧左、右耳声信号的均值；N为帧长；

(5-2)根据互相关值CCF(i,k,d)计算第i个子带、第k帧的ITD、IID：

进一步的，步骤(7)具体包括：

(7-1)将步骤(1)得到的单声源双耳声信号分别按照步骤(3)和(4)执行，得到单声源双耳声信号的T-F单元；

(7-2)计算步骤(2)混合时所采用的方位的单声源双耳声信号在不同T-F单元的信号能量：

式中，x¹ _L(i,k,m)、x¹ _R(i,k,m)表示混合时所采用的方位1的单声源双耳声信号，即声源1，对应的T-F单元，x² _L(i,k,m)、x² _R(i,k,m)表示混合时所采用的方位2的单声源双耳声信号，即声源2，对应的T-F单元，e¹(i,k)、e²(i,k)分别表示对应声源在各个T-F单元的能量；

(7-3)根据单声源双耳声信号在不同T-F单元的信号能量，将理想二值掩膜IBM标记为能量较大的T-F单元的语音标签；

其中，IBM标记为1，表示该T-F单元为声源1占主要成分，标记为0，表示该T-F单元为声源2占主要成分。

进一步的，步骤(8)具体包括：

(8-1)输入的训练集为：对应每一个子带，训练样本为子带内所有帧的ITD、IID特征参数和IBM，表示为：

T_i＝{((IID(i,1),ITD(i,1)),IBM(i,1)),···,((IID(i,K),ITD(i,K)),IBM(i,K))}

T_i为第i个支持向量机的训练集，则IID(i,·)、ITD(i,·)、IBM(i,·)分别表示第i个子带、第k帧的IID、ITD和IBM，K为帧数；

(8-2)构造约束最优化问题，

s.t.L_i(k)(wD_i(k)+b)≥1-ε_k

ε_k≥0 k＝1,2,···,K

其中，将二维特征矢量(IID(i,k),ITD(i,k))记为D_i(k)，将IBM(i,k)记为L_i(k)，w，b分别为第i个子带对应SVM模型分类超平面的法向量和截距，ε_k为对应于每个数据点(D_i(k),L_i(k))的松弛变量，C>0，表示惩罚系数，C值大小与误分类的惩罚代价正相关；

(8-3)基于最优化问题训练得到各个子带的支持向量机。

进一步的，步骤(11)具体包括：

(11-1)将步骤(10)得到的掩膜矩阵与步骤(9)得到的T-F单元相乘得到两个声源对应的时频域信号：

x_test1(i,k,m)＝Mask(i,k)×x_test(i,k,m)

其中x_test1(i,k,m)、x_test2(i,k,m)分别为声源1、2对应的时频域信号，Mask(i,k)表示掩膜矩阵中第i个子带、第k帧掩蔽值；为Mask(i,k)的取反，x_test(i,k,m)表示测试混合双耳声信号的T-F单元；

(11-2)将声源1和声源2的各个单帧信号进行合并，从而得到每个声源对应的各个子带声信号x_test1(i,t)和x_test2(i,t)：

其中N表示预处理的帧长，m表示一帧内采样序号0≤m＜N，w_H(m)为汉明窗；

(11-3)将各单声源的所有子带声信号经过合成Gammtone滤波器，从而合成各个声源的声信号，实现各个声源的分离，得到分离后的信号s_test1(t)和s_test2(t)

其中，g_i(t)与步骤(3)的滤波器相同，为第i个Gamatone滤波器的脉冲响应函数，DFT(·)表示离散傅里叶变换，IDFT(·)表示离散傅里叶逆变换。

有益效果：本发明与现有技术相比，其显著优点是：本发明与现有的双耳语音分离技术相比，由于本发明基于支持向量机的强大的分类能力，提取包含两个声源的混合双耳声信号经过处理后的T-F单元的耳间强度差IID和耳间时间差ITD作为特征参数，训练了一种支持向量机模型，从而实现了语音分离算法的鲁棒性。相比于以前的语音分离算法，有效地解决了频点丢失的问题；在SDR、SAR和SIR指标上，以及HIT-FA指标上表现优秀，并且，在复杂环境(低信噪比和高混响情形)也有较为明显的提升，算法鲁棒性更好。

附图说明

图1为本发明语音分离系统流程图；

图2为本发明双耳声信号生成图；

图3为基于DUET算法和本发明基于SVM的语音分离算法的分离后语音频谱比较图；

图4为基于DUET算法和本发明基于SVM的语音分离算法的HIT-FA指标比较图；

图5为基于DUET算法和本发明基于SVM的语音分离算法的准确率指标比较图；

图6为基于DUET算法和本发明基于SVM的语音分离算法的SDR指标比较图；

图7为基于DUET算法和本发明基于SVM的语音分离算法的SAR指标比较图；

图8为基于DUET算法和本发明基于SVM的语音分离算法的SIR指标比较图。

具体实施方式

如图1所示，本实施例提供的支持向量机SVM语音分离方法法包括以下步骤：

步骤一、将训练单声源语音信号与不同方位角的与头相关脉冲响应函数HRIR卷积，生成多个不同方位的单声源双耳声信号。其中，声源方位角由θ表示，定义水平面的正前方为0°，θ的范围为[-90°,90°]，间隔为10°，其中，-90°表示正左方，90°表示正右方；

与头相关冲击响应HRIR(Head-Related Impulse Response)是与头相关函数HRTF(Head-Related Transfer Function)的时域表示。本发明采用麻省理工学院的媒体实验室发布的HRTF数据库，该数据库包含不同仰角和不同方位角的HRIR数据，本发明对采用的HRTF数据不做任何限制。

图2为双耳信号合成模拟图，将特定方位的与头相关冲击响应函数HRIR，与单声源声信号卷积，从而得到特定方位的双耳声信号：

s_L(t)＝s(t)*h_L

s_R(t)＝s(t)*h_R

步骤二、将两个不同方位的单声源双耳声信号进行混合，生成多个训练混合双耳声信号。

计算公式为：

其中，表示第一个方位的单声源双耳声信号的左、右耳信号，表示第2个方位的单声源双耳声信号的左、右耳信号，均根据步骤一生成，s_left(t)、s_right(t)为包含两个不同方位声源的训练混合双耳声信号的左、右耳信号，本发明要求声源1和声源2的方位不同。

步骤三、将步骤二得到的训练混合双耳声信号通过Gammatone滤波器组，分解为各个子带的时域信号，其中每个子带对应不同的频域范围。

各个子带的时域信号的计算公式为：

x_left(i,t)＝s_left(t)*g_i(t)

x_right(i,t)＝s_right(t)*g_i(t)

由于Gammatone滤波器组分解的每个子带的频域是交叠的，因此同一帧的多个子带T-F单元相互叠加，构成一帧的连续频谱，有效地解决了频谱丢失的问题。本实施例中设定Gammatone滤波器阶数为64，i＝1,2,···,64，频率范围为[50Hz,8000Hz]。

步骤四、对每个子带的时域信号进行半波整流、平方根处理，之后再经过预处理获得单帧信号，作为训练混合双耳声信号的T-F时频单元。

半波整流、平方根处理的计算公式为：

预处理步骤包括分帧和加窗，其中：

分帧方法为：采用预设分帧长度和帧移，将半波整流、平方根处理后的声信号x_L(i,t)、x_R(i,t)划分为多个单帧信号x_L(i,kN+m)、x_R(i,kN+m)，其中，k为帧序号，m表示一帧内采样序号0≤m＜N，N为帧长；本实施例中，语音信号为16kHz，采取的分帧长度为20ms，帧移为10ms。

加窗方法为：

x_L(i,k,m)＝w_H(m)x_L(i,kN+m)

x_R(i,k,m)＝w_H(m)x_R(i,kN+m)

为汉明窗。

步骤五、计算每个T-F时频单元的耳间时间差ITD和耳间强度差IID，作为T-F单元的特征矢量。具体包括：

(5-1)计算

(5-2)根据互相关值CCF(i,k,d)计算第i个子带、第k帧的ITD、IID：

步骤六、将同一子带的T-F单元的特征矢量作为对应子带SVM向量机的训练样本。

步骤七、将步骤一得到的单声源双耳声信号分别按照步骤三和四执行，得到单声源双耳声信号的T-F单元，根据不同声源在同一T-F单元的信号能量，标记步骤二对应的训练混合双耳声信号中每个T-F单元的理想二进制掩膜IBM。

具体包括：

步骤八、构建每个子带的SVM支持向量机模型，将步骤六对应的训练样本和步骤七得到的理想二值掩膜IBM，作为对应子带的支持向量机SVM的训练数据集，进行训练，从而得到每个子带的SVM模型。

针对子带序号为i的SVM分类器的训练过程，下面进行详细描述：

T_i＝{((IID(i,1),ITD(i,1)),IBM(i,1)),···,((IID(i,K),ITD(i,K)),IBM(i,K))}

T_i为第i个支持向量机的训练集，K为训练双耳声信号的帧数。

(8-2)构造并求解约束最优化问题，

s.t.L_i(k)(wD_i(k)+b)≥1-ε_k

ε_k≥0 k＝1,2,···,K

其中，将二维特征矢量(IID(i,k),ITD(i,k))记为D_i(k)，将IBM(i,k)记为L_i(k)，w，b分别为第i个子带对应SVM模型分类超平面的法向量和截距，ε_k为对应于每个数据点(D_i(k),L_i(k))的松弛变量，C>0，表示惩罚系数，C值大小与误分类的惩罚代价正相关。

针对这个最优化问题，对不等式约束引进拉格朗日乘子α_i>＝0,i＝1,2,…,K，定义拉格朗日函数：

其中，α＝(α₁,α₂,…,α_K)为拉格朗日乘子向量。

最优化问题转化为：

0≤α_k≤C k＝1,2,···,K

用径向基核函数RBF(D_i(k),D_i(t))代替内积D_i(k)·D_i(t)。

求得最优解为α^*＝(α₁ ^*,α₂ ^*,…,α_K ^*)^T，由此得到w,b^*的最优解。

最终，决策函数，即分类超平面的函数表达式形式如下：

f(D)＝sign(w·D+b^*)

至此，各子带的支持向量机SVM模型训练完成。

本发明采用径向基函数RBF代替内积计算，实际上，SVM可以采用其它形式的基函数，本发明对SVM的基函数没有限制。

步骤九、将测试混合双耳声信号按照步骤三～五处理，得到对应的T-F单元的特征矢量，即(ITD_test(i,k),IID_test(i,k))，作为测试样本。

步骤十、将测试样本作为步骤八训练完成的各子带SVM支持向量机的输入特征，从而得到测试混合双耳声信号中不同方位声源对应的掩膜矩阵。

将(ITD_test(i,k),IID_test(i,k))输入到对应第i个子带的支持向量机中，通过支持向量机的分类效果，得到对每个T-F单元的分类，0和1代表了不同的声源，由此得到了二值掩膜矩阵Mask(i,k)。

步骤十一、对每个方位声源的掩膜矩阵，利用Gammatone合成滤波器组，反向合成各个方位声源对应的时域信号，从而实现语音分离。

具体包括：

x_test1(i,k,m)＝Mask(i,k)×x_test(i,k,m)

对以上方法进行仿真验证，最终的性能评估如下：

(1)SVM语音分离算法分离后语音频谱

从图3可以看出，经过SVM分离算法分离后的语音频谱有效解决了频点丢失的问题，频谱为连续谱，不存在频点丢失的现象，原因在于，Gammatone滤波器组分解的每个子带的频域是交叠的，虽然本章的T-F单元的掩膜矩阵采用二值掩膜，但同一帧的多个子带T-F单元相互叠加，构成一帧的连续频谱。

(2)SVM语音分离算法的各项指标评价

图4-图8展示了测试语音在不同信噪比和混响的环境下的分离效果，从图中可以看出SVM分离算法在低信噪比和高混响的环境下能有不错的正确率，并且在SDR、SAR和SIR指标上，均比DUET的表现优秀，说明了本算法的鲁棒性。

以上所述仅是本发明的优选实施方式，应当指出：对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种基于支持向量机的双耳语音分离方法，其特征在于，该方法包括以下步骤：

2.根据权利要求1所述的基于支持向量机的双耳语音分离方法，其特征在于：所述步骤(1)中不同方位的单声源双耳声信号的计算公式为：

s_L(t)＝s(t)*h_L

s_R(t)＝s(t)*h_R

3.根据权利要求1所述的基于支持向量机的双耳语音分离方法，其特征在于：所述步骤(2)中包含两个不同方位声源的训练混合双耳声信号的计算公式为：

4.根据权利要求1所述的基于支持向量机的双耳语音分离方法，其特征在于：所述步骤(3)中经Gammatone滤波器组分解得到的各个子带的时域信号的计算公式为：

x_left(i,t)＝s_left(t)*g_i(t)

x_right(i,t)＝s_right(t)*g_i(t)

5.根据权利要求1所述的基于支持向量机的双耳语音分离方法，其特征在于：所述步骤(4)中半波整流、平方根处理的计算公式为：

6.根据权利要求1所述的基于支持向量机的双耳语音分离方法，其特征在于：所述步骤(4)中预处理步骤包括分帧和加窗，其中：

加窗方法为：

x_L(i,k,m)＝w_H(m)x_L(i,kN+m)

x_R(i,k,m)＝w_H(m)x_R(i,kN+m)

为汉明窗。

7.根据权利要求1所述的基于支持向量机的双耳语音分离方法，其特征在于：所述步骤(5)具体包括：

(5-1)计算

(5-2)根据互相关值CCF(i,k,d)计算第i个子带、第k帧的ITD、IID：

<mrow> <mi>I</mi> <mi>I</mi> <mi>D</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>=</mo> <mn>20</mn> <mo>*</mo> <msub> <mi>log</mi> <mn>10</mn> </msub> <mfrac> <mrow> <munderover> <mo>&Sigma;</mo> <mrow> <mi>m</mi> <mo>=</mo> <mn>0</mn> </mrow> <mrow> <mi>N</mi> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <msubsup> <mi>x</mi> <mi>R</mi> <mn>2</mn> </msubsup> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>k</mi> <mo>,</mo> <mi>m</mi> <mo>)</mo> </mrow> </mrow> <mrow> <munderover> <mo>&Sigma;</mo> <mrow> <mi>m</mi> <mo>=</mo> <mn>0</mn> </mrow> <mrow> <mi>N</mi> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <msubsup> <mi>x</mi> <mi>L</mi> <mn>2</mn> </msubsup> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>k</mi> <mo>,</mo> <mi>m</mi> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow>

8.根据权利要求1所述的基于支持向量机的双耳语音分离方法，其特征在于：所述步骤(7)具体包括：

<mrow> <msubsup> <mi>e</mi> <mi>L</mi> <mn>1</mn> </msubsup> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mo>&Sigma;</mo> <mi>m</mi> </munder> <mo>|</mo> <msubsup> <mi>x</mi> <mi>L</mi> <mn>1</mn> </msubsup> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>k</mi> <mo>,</mo> <mi>m</mi> <mo>)</mo> </mrow> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>,</mo> <msubsup> <mi>e</mi> <mi>R</mi> <mn>1</mn> </msubsup> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mo>&Sigma;</mo> <mi>m</mi> </munder> <mo>|</mo> <msubsup> <mi>x</mi> <mi>R</mi> <mn>1</mn> </msubsup> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>k</mi> <mo>,</mo> <mi>m</mi> <mo>)</mo> </mrow> <msup> <mo>|</mo> <mn>2</mn> </msup> </mrow>

<mrow> <msubsup> <mi>e</mi> <mi>L</mi> <mn>2</mn> </msubsup> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mo>&Sigma;</mo> <mi>m</mi> </munder> <mo>|</mo> <msubsup> <mi>x</mi> <mi>L</mi> <mn>2</mn> </msubsup> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>k</mi> <mo>,</mo> <mi>m</mi> <mo>)</mo> </mrow> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>,</mo> <msubsup> <mi>e</mi> <mi>R</mi> <mn>2</mn> </msubsup> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mo>&Sigma;</mo> <mi>m</mi> </munder> <mo>|</mo> <msubsup> <mi>x</mi> <mi>R</mi> <mn>2</mn> </msubsup> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>k</mi> <mo>,</mo> <mi>m</mi> <mo>)</mo> </mrow> <msup> <mo>|</mo> <mn>2</mn> </msup> </mrow>

<mrow> <mi>I</mi> <mi>B</mi> <mi>M</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mn>1</mn> </mtd> <mtd> <mrow> <msubsup> <mi>e</mi> <mi>R</mi> <mn>1</mn> </msubsup> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>&GreaterEqual;</mo> <msubsup> <mi>e</mi> <mi>R</mi> <mn>2</mn> </msubsup> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <msubsup> <mi>e</mi> <mi>R</mi> <mn>1</mn> </msubsup> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo><</mo> <msubsup> <mi>e</mi> <mi>R</mi> <mn>2</mn> </msubsup> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>k</mi> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>

9.根据权利要求1所述的基于支持向量机的双耳语音分离方法，其特征在于：所述步骤(8)具体包括：

T_i＝{((IID(i,1),ITD(i,1)),IBM(i,1)),…,((IID(i,K),ITD(i,K)),IBM(i,K))}

(8-2)构造约束最优化问题，

<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <munder> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> <mrow> <mi>w</mi> <mo>,</mo> <mi>b</mi> <mo>,</mo> <mi>&epsiv;</mi> </mrow> </munder> </mtd> <mtd> <mrow> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <mo>|</mo> <mo>|</mo> <mi>w</mi> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>+</mo> <mi>C</mi> <munderover> <mo>&Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>K</mi> </munderover> <msub> <mi>&epsiv;</mi> <mi>k</mi> </msub> </mrow> </mtd> </mtr> </mtable> </mfenced>

s.t.L_i(k)(wD_i(k)+b)≥1-ε_k

ε_k≥0k＝1,2,…,K

(8-3)基于最优化问题训练得到各个子带的支持向量机。

10.根据权利要求1所述的基于支持向量机的双耳语音分离方法，其特征在于：所述步骤(11)具体包括：

x_test1(i,k,m)＝Mask(i,k)×x_test(i,k,m)

<mrow> <msub> <mi>x</mi> <mrow> <mi>t</mi> <mi>e</mi> <mi>s</mi> <mi>t</mi> <mn>2</mn> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>k</mi> <mo>,</mo> <mi>m</mi> <mo>)</mo> </mrow> <mo>=</mo> <mover> <mrow> <mi>M</mi> <mi>a</mi> <mi>s</mi> <mi>k</mi> </mrow> <mo>&OverBar;</mo> </mover> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>&times;</mo> <msub> <mi>x</mi> <mrow> <mi>t</mi> <mi>e</mi> <mi>s</mi> <mi>t</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>k</mi> <mo>,</mo> <mi>m</mi> <mo>)</mo> </mrow> </mrow>

<mrow> <msub> <mi>s</mi> <mrow> <mi>t</mi> <mi>e</mi> <mi>s</mi> <mi>t</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mo>&Sigma;</mo> <mi>i</mi> </munder> <mi>I</mi> <mi>D</mi> <mi>F</mi> <mi>T</mi> <mo>(</mo> <mfrac> <mrow> <mi>D</mi> <mi>F</mi> <mi>T</mi> <mrow> <mo>(</mo> <mrow> <msub> <mi>x</mi> <mrow> <mi>t</mi> <mi>e</mi> <mi>s</mi> <mi>t</mi> <mn>1</mn> </mrow> </msub> <mrow> <mo>(</mo> <mrow> <mi>i</mi> <mo>,</mo> <mi>t</mi> </mrow> <mo>)</mo> </mrow> </mrow> <mo>)</mo> </mrow> </mrow> <mrow> <mi>D</mi> <mi>F</mi> <mi>T</mi> <mrow> <mo>(</mo> <mrow> <msub> <mi>g</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> </mrow> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>)</mo> </mrow>

<mrow> <msub> <mi>s</mi> <mrow> <mi>t</mi> <mi>e</mi> <mi>s</mi> <mi>t</mi> <mn>2</mn> </mrow> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mo>&Sigma;</mo> <mi>i</mi> </munder> <mi>I</mi> <mi>D</mi> <mi>F</mi> <mi>T</mi> <mo>(</mo> <mfrac> <mrow> <mi>D</mi> <mi>F</mi> <mi>T</mi> <mrow> <mo>(</mo> <mrow> <msub> <mi>x</mi> <mrow> <mi>t</mi> <mi>e</mi> <mi>s</mi> <mi>t</mi> <mn>2</mn> </mrow> </msub> <mrow> <mo>(</mo> <mrow> <mi>i</mi> <mo>,</mo> <mi>t</mi> </mrow> <mo>)</mo> </mrow> </mrow> <mo>)</mo> </mrow> </mrow> <mrow> <mi>D</mi> <mi>F</mi> <mi>T</mi> <mrow> <mo>(</mo> <mrow> <msub> <mi>g</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> </mrow> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>)</mo> </mrow>