发明内容
本发明提供一种麦克风阵列的信号处理方法及装置,用以解决由于各麦克风之间一致性差异、间距差异以及真实环境中时变的混响导致的M-1路噪声/干扰参考信号中存在目标信号泄漏的问题,可以最大程度降低对目标信号的损伤。
第一方面,本发明提供一种麦克风阵列的信号处理方法,包括:
将麦克风阵列采集到的M路输入信号X(n)进行固定波束形成后得到参考目标信号d(n),将所述参考目标信号d(n)进行语音激活检测后得到语音激活检测结果,将所述M路输入信号进行目标出现概率分析后得到目标出现概率,将所述M路输入信号通过拥塞矩阵后得到M-1路参考干扰信号U(n);
根据所述语音激活检测结果和所述目标出现概率,确定进行滤波处理的滤波器组的滤波系数,并利用所述确定的滤波器组的滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号y(n);
将所述参考目标信号d(n)减去所述滤波处理后的参考干扰信号y(n),得到所述麦克风阵列的输出信号ABF(n)。
基于第一方面,在第一种可能的实现方式中,所述将所述M路输入信号进行目标出现概率分析后得到目标出现概率,包括:
根据所述M路输入信号的互相关函数,分别估算每相邻两个麦克风采集到的信号之间的时延差;
利用时延差与信号源入射角度的对应关系,根据所述估算的各时延差,分别估算各时延差对应的信号源入射角度;
将所述估算的各信号源入射角度取平均值得到信号源入射角度平均值;
根据预设的主瓣范围与旁瓣范围以及所述信号源入射角度平均值,估算目标出现概率。
基于第一方面,在第二种可能的实现方式中,所述将所述M路输入信号进行目标出现概率分析后得到目标出现概率,包括:
根据所述M-1路参考干扰信号U(n),分别计算对应的参考干扰信号的能量值i=1,2,…M-1,在计算得到的各能量值中取最小值作为参考干扰信号的能量最小值;
计算当前帧的参考目标信号的能量值Efbf,将所述当前帧的参考目标信号的能量值Efbf除以所述参考干扰信号的能量最小值,得到当前的目标干扰能量比值;
根据预设的目标干扰能量比例范围以及所述当前的目标干扰能量比值,估算目标出现概率。
基于第一或第二种可能的实现方式,在第三种可能的实现方式中,根据所述语音激活检测结果和所述目标出现概率,确定进行滤波处理的滤波器组的滤波系数,并利用所述确定的滤波器组的滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号y(n),包括:
若所述语音激活检测结果为背景噪声时,确定进行滤波处理的滤波器组的滤波系数为背景噪声滤波器组的滤波系数{Hi(n)|i=1,2,...M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为y(n)=ynoise(n);或者
若所述语音激活检测结果为语音帧时,且所述目标出现概率大于预设的目标信号阈值thtarget,确定进行滤波处理的滤波器组的滤波系数为背景噪声滤波器组的滤波系数{Hi(n)|i=1,2,…M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为y(n)=ynoise(n);或者
若所述语音激活检测结果为语音帧时,且所述目标出现概率小于预设的干扰标信号阈值thinter,确定进行滤波处理的滤波器组的滤波系数为干扰抑制滤波器组的滤波系数{H′i(n)|i=1,2,…M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为y(n)=yinter(n);或者
若所述语音激活检测结果为语音帧时,且所述目标出现概率小于预设的目标信号阈值thtarget并大于预设的干扰标信号阈值thinter,确定进行滤波处理的滤波器组的滤波系数为干扰抑制滤波器组的滤波系数{H′i(n)|i=1,2,…M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为y(n)=yinter(n)。
基于第一或第二种可能的实现方式,在第四种可能的实现方式中,根据所述语音激活检测结果和所述目标出现概率,确定进行滤波处理的滤波器组的滤波系数,并利用所述确定的滤波器组的滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号y(n),还包括:
若所述语音激活检测结果为语音帧时,且所述目标出现概率等于预设的目标信号阈值thtarget,则确定进行滤波处理的滤波器组的滤波系数为背景噪声滤波器组的滤波系数{Hi(n)|i=1,2,…M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为y(n)=ynoise(n);或者确定进行滤波处理的滤波器组的滤波系数为干扰抑制滤波器组的滤波系数{H′i(n)|i=1,2,…M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为y(n)=yinter(n);
若所述语音激活检测结果为语音帧时,且所述目标出现概率等于预设的干扰标信号阈值thinter,则确定进行滤波处理的滤波器组的滤波系数为干扰抑制滤波器组的滤波系数{H′i(n)|i=1,2,...M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为。
基于第一或第二种可能的实现方式,在第五种可能的实现方式中,根据所述语音激活检测结果和所述目标出现概率,确定进行滤波处理的滤波器组的滤波系数,并利用所述确定的滤波器组的滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号y(n),还包括:
利用背景噪声滤波器组的滤波系数{Hi(n)|i=1,2,…M-1},对所述M-1路参考干扰信号U(n)进行滤波处理,得到背景噪声抑制输出信号ynoise(n);
利用干扰抑制滤波器组的滤波系数{H′i(n)|i=1,2,…M-1},对所述M-1路参考干扰信号U(n)进行滤波处理,得到干扰抑制输出信号yinter(n);
根据所述目标出现概率计算混合比例因子β;
根据所述混合比例因子β,将所述背景噪声抑制输出信号ynoise(n)和干扰抑制输出信号yinter(n)进行混合得到滤波处理后的参考干扰信号y(n)。
基于第三种可能的实现方式,在第六种可能的实现方式中,将所述参考目标信号d(n)减去所述滤波处理后的参考干扰信号y(n),得到所述麦克风阵列的输出信号ABF(n)之后,包括:
若所述语音激活检测结果为背景噪声时,则利用所述M路输入信号X(n)和所述输出信号ABF(n),将所述背景噪声滤波器组的滤波系数更新为{Hi(n+1)|i=1,2,…M-1};或者
若所述语音激活检测结果为语音帧时,且所述目标出现概率大于预设的目标信号阈值thtarget,则不更新所述背景噪声滤波器组的滤波系数和所述干扰抑制滤波器组的滤波系数;或者
若所述语音激活检测结果为语音帧时,且所述目标出现概率小于预设的干扰标信号阈值thinter,利用所述M路输入信号X(n)和所述输出信号ABF(n),将所述干扰抑制滤波器组的滤波系数更新为{H′i(n+1)|i=1,2,…M-1};或者
若所述语音激活检测结果为语音帧时,且所述目标出现概率小于预设的目标信号阈值thtarget并大于预设的干扰标信号阈值thinter,则根据所述目标出现概率,计算所述干扰抑制滤波器组的更新步长step(n),利用所述更新步长step(n)、所述M路输入信号X(n)和所述输出信号ABF(n),将所述干扰抑制滤波器组的滤波系数更新为{H′i(n+1)|i=1,2,…M-1}。
基于第四种可能的实现方式,在第七种可能的实现方式中,将所述参考目标信号d(n)减去所述滤波处理后的参考干扰信号y(n),得到所述麦克风阵列的输出信号ABF(n)之后,包括:
若所述语音激活检测结果为语音帧时,且所述目标出现概率等于预设的目标信号阈值thtarget,则不更新所述背景噪声滤波器组的滤波系数和所述干扰抑制滤波器组的滤波系数;或者根据所述目标出现概率,计算所述干扰抑制滤波器组的更新步长step(n),利用所述更新步长step(n)、所述M路输入信号X(n)和所述输出信号ABF(n),将所述干扰抑制滤波器组的滤波系数更新为{H′i(n+1)|i=1,2,...M-1};
若所述语音激活检测结果为语音帧时,且所述目标出现概率等于预设的干扰标信号阈值thinter,利用所述M路输入信号X(n)和所述输出信号ABF(n),将所述干扰抑制滤波器组的滤波系数更新为{H′i(n+1)|i=1,2,…M-1};或者根据所述目标出现概率,计算所述干扰抑制滤波器组的更新步长step(n),利用所述更新步长step(n)、所述M路输入信号X(n)和所述输出信号ABF(n),将所述干扰抑制滤波器组的滤波系数更新为{H′i(n+1)|i=1,2,...M-1}。
基于第五种可能的实现方式,在第八种可能的实现方式中,将所述参考目标信号d(n)减去所述滤波处理后的参考干扰信号y(n),得到所述麦克风阵列的输出信号ABF(n)之后,包括:
若所述语音激活检测结果为背景噪声时,利用所述M路输入信号X(n)和所述输出信号ABF(n),将所述背景噪声滤波器组的滤波系数更新为{Hi(n+1)|i=1,2,…M-1};若所述语音激活检测结果为语音帧时,则不更新所述背景噪声滤波器组的滤波系数;
根据所述目标出现概率,计算所述干扰抑制滤波器组的更新步长step(n),利用所述更新步长step(n)、所述M路输入信号X(n)和所述输出信号ABF(n),将所述干扰抑制滤波器组的滤波系数更新为{H′i(n+1)|i=1,2,...M-1}。
第二方面,本发明提供一种麦克风阵列的信号处理装置,包括:
固定波束处理模块,用于将麦克风阵列采集到的M路输入信号X(n)进行固定波束形成后得到参考目标信号d(n);
语音激活检测模块,用于将所述固定波束处理模块得到的参考目标信号d(n)进行语音激活检测后得到语音激活检测结果;
目标出现概率分析模块,用于将所述M路输入信号进行目标出现概率分析后得到目标出现概率P;
拥塞矩阵处理模块,用于将所述M路输入信号通过拥塞矩阵后得到M-1路参考干扰信号U(n);
滤波模块,用于根据所述语音激活检测模块得到的语音激活检测结果和所述目标出现概率分析模块得到的目标出现概率,确定进行滤波处理的滤波器组的滤波系数,并利用所述确定的滤波器组的滤波系数对所述拥塞矩阵处理模块得到的M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号y(n);
消除模块,用于将所述固定波束处理模块得到的参考目标信号d(n)减去所述滤波模块滤波处理后的参考干扰信号y(n),得到所述麦克风阵列的输出信号ABF(n)。
基于第二方面,在第一种可能的实现方式中,所述目标出现概率分析模块具体用于:
根据所述M路输入信号的互相关函数,分别估算每相邻两个麦克风采集到的信号之间的时延差;
利用时延差与信号源入射角度的对应关系,根据所述估算的各时延差,分别估算各时延差对应的信号源入射角度;
将所述估算的各信号源入射角度取平均值得到信号源入射角度平均值;
根据预设的主瓣范围与旁瓣范围以及所述信号源入射角度平均值,估算目标出现概率。
基于第二方面,在第二种可能的实现方式中,所述目标出现概率分析模块具体用于:
根据所述M-1路参考干扰信号U(n),分别计算对应的参考干扰信号的能量值i=1,2,…M-1,在计算得到的各能量值中取最小值作为参考干扰信号的能量最小值;
计算当前帧的参考目标信号的能量值Efbf,将所述当前帧的参考目标信号的能量值Efbf除以所述参考干扰信号的能量最小值,得到当前的目标干扰能量比值;
根据预设的目标干扰能量比例范围以及所述当前的目标干扰能量比值,估算目标出现概率。
基于第二方面以及第二方面的第一或第二种可能的实现方式,在第三种可能的实现方式中,若所述语音激活检测模块得到的语音激活检测结果为背景噪声时,则所述滤波模块具体用于:
确定进行滤波处理的滤波器组的滤波系数为背景噪声滤波器组的滤波系数{Hi(n)|i=1,2,…M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为y(n)=ynoise(n);或者
若所述语音激活检测模块得到的语音激活检测结果为语音帧时,且所述目标出现概率分析模块得到的目标出现概率大于预设的目标信号阈值thtarget,则所述滤波模块具体用于:
确定进行滤波处理的滤波器组的滤波系数为背景噪声滤波器组的滤波系数{Hi(n)|i=1,2,…M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为y(n)=ynoise(n);或者
若所述语音激活检测模块得到的语音激活检测结果为语音帧时,且所述目标出现概率分析模块得到的目标出现概率小于预设的干扰标信号阈值thinter,则所述滤波模块具体用于:
确定进行滤波处理的滤波器组的滤波系数为干扰抑制滤波器组的滤波系数{H′i(n)|i=1,2,…M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为y(n)=yinter(n);或者
若所述语音激活检测模块得到的语音激活检测结果为语音帧时,且所述目标出现概率分析模块得到的目标出现概率小于预设的目标信号阈值thtarget并大于预设的干扰标信号阈值thinter,则所述滤波模块具体用于:
确定进行滤波处理的滤波器组的滤波系数为干扰抑制滤波器组的滤波系数{H′i(n)|i=1,2,…M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为y(n)=yinter(n)。
基于第二方面以及第二方面的第一或第二种可能的实现方式,在第四种可能的实现方式中,若所述语音激活检测结果为语音帧时,且所述目标出现概率等于预设的目标信号阈值thtarget,则所述滤波模块具体用于:
确定进行滤波处理的滤波器组的滤波系数为背景噪声滤波器组的滤波系数{Hi(n)|i=1,2,…M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为y(n)=ynoise(n);或者确定进行滤波处理的滤波器组的滤波系数为干扰抑制滤波器组的滤波系数{H′i(n)|i=1,2,…M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为y(n)=yinter(n);
若所述语音激活检测结果为语音帧时,且所述目标出现概率等于预设的干扰标信号阈值thinter,则所述滤波模块具体用于:
确定进行滤波处理的滤波器组的滤波系数为干扰抑制滤波器组的滤波系数{H′i(n)|i=1,2,…M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为。
基于第二方面以及第二方面的第一或第二种可能的实现方式,在第五种可能的实现方式中,所述滤波模块具体还用于:
利用背景噪声滤波器组的滤波系数{Hi(n)|i=1,2,…M-1},对所述M-1路参考干扰信号U(n)进行滤波处理,得到背景噪声抑制输出信号ynoise(n);
利用干扰抑制滤波器组的滤波系数{H′i(n)|i=1,2,…M-1},对所述M-1路参考干扰信号U(n)进行滤波处理,得到干扰抑制输出信号yinter(n);
根据所述目标出现概率分析模块得到的目标出现概率计算混合比例因子β;
根据所述混合比例因子β,将所述背景噪声抑制输出信号ynoise(n)和干扰抑制输出信号yinter(n)进行混合得到滤波处理后的参考干扰信号y(n)。
基于第二方面的第三种可能的实现方式,在第六种可能的实现方式中,系数更新模块;
若所述语音激活检测模块得到的语音激活检测结果为背景噪声时,则所述系数更新模块具体用于:
利用所述M路输入信号X(n)和所述输出信号ABF(n),将所述背景噪声滤波器组的滤波系数更新为{Hi(n+1)|i=1,2,…M-1};或者
若所述语音激活检测模块得到的语音激活检测结果为语音帧时,且所述目标出现概率分析模块得到的目标出现概率小于预设的干扰标信号阈值thinter,则所述系数更新模块具体用于:
利用所述M路输入信号X(n)和所述输出信号ABF(n),将所述干扰抑制滤波器组的滤波系数更新为{H′i(n+1)|i=1,2,…M-1};或者
若所述语音激活检测模块得到的语音激活检测结果为语音帧时,且所述目标出现概率小于等于预设的目标信号阈值thtarget并大于等于预设的干扰标信号阈值thinter,则所述系数更新模块具体用于:
根据所述目标出现概率,计算所述干扰抑制滤波器组的更新步长step(n),利用所述更新步长step(n)、所述M路输入信号X(n)和所述输出信号ABF(n),将所述干扰抑制滤波器组的滤波系数更新为{H′i(n+1)|i=1,2,...M-1}。
基于第二方面的第四种可能的实现方式,在第七种可能的实现方式中,若所述语音激活检测结果为语音帧时,且所述目标出现概率等于预设的目标信号阈值thtarget,则所述系数更新模块具体用于:
根据所述目标出现概率,计算所述干扰抑制滤波器组的更新步长step(n),利用所述更新步长step(n)、所述M路输入信号X(n)和所述输出信号ABF(n),将所述干扰抑制滤波器组的滤波系数更新为{H′i(n+1)|i=1,2,…M-1};
若所述语音激活检测结果为语音帧时,且所述目标出现概率等于预设的干扰标信号阈值thinter,则所述系数更新模块具体用于:
利用所述M路输入信号X(n)和所述输出信号ABF(n),将所述干扰抑制滤波器组的滤波系数更新为{H′i(n+1)|i=1,2,...M-1};或者根据所述目标出现概率,计算所述干扰抑制滤波器组的更新步长step(n),利用所述更新步长step(n)、所述M路输入信号X(n)和所述输出信号ABF(n),将所述干扰抑制滤波器组的滤波系数更新为{H′i(n+1)|i=1,2,…M-1}。
基于第二方面的第五种可能的实现方式,在第八种可能的实现方式中,所述系数更新模块具体还用于:
若所述语音激活检测结果为背景噪声时,利用所述M路输入信号X(n)和所述输出信号ABF(n),将所述背景噪声滤波器组的滤波系数更新为{Hi(n+1)|i=1,2,…M-1};
根据所述目标出现概率,计算所述干扰抑制滤波器组的更新步长step(n),利用所述更新步长step(n)、所述M路输入信号X(n)和所述输出信号ABF(n),将所述干扰抑制滤波器组的滤波系数更新为{H′i(n+1)|i=1,2,...M-1}。
本发明实施例通过将麦克风阵列采集到的M路输入信号进行固定波束形成后得到参考目标信号,将所述参考目标信号进行语音激活检测后得到语音激活检测结果,将所述M路输入信号进行目标出现概率分析后得到目标出现概率,将所述M路输入信号通过拥塞矩阵后得到M-1路参考干扰信号;根据得到的语音激活检测结果和目标出现概率,确定进行滤波处理的滤波器组的滤波系数,并利用所述确定的滤波器组的滤波系数对所述M-1路参考干扰信号进行滤波处理,得到滤波处理后的参考干扰信号;然后,将所述参考目标信号减去所述滤波处理后的参考干扰信号,得到所述麦克风阵列的输出信号。
由于本实施例采用将所述M路输入信号进行目标出现概率分析后得到目标出现概率,并进一步利用目标出现概率和语音激活检测结果确定进行滤波处理的滤波器组的滤波系数,并利用所述确定的滤波器组的滤波系数对所述M-1路参考干扰信号进行滤波处理,得到滤波处理后的参考干扰信号的技术手段,可以有效的克服麦克风之间一致性差异、间距差异以及真实环境中时变的混响导致的参考干扰信号中存在目标信号泄露,在不影响对旁瓣说话人干扰抑制的同时最大程度的降低了对目标信号的损伤。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明一实施例提供的麦克风阵列的信号处理方法的流程示意图;如图1所示,包括:
101、将麦克风阵列采集到的M路输入信号进行固定波束形成后得到参考目标信号,和将所述参考目标信号进行语音激活检测后得到语音激活检测结果,和将所述M路输入信号进行目标出现概率分析后得到目标出现概率,和将所述M路输入信号通过拥塞矩阵后得到M-1路参考干扰信号。
图2为图1所示实施例提供的麦克风阵列的信号处理方法的一种原理示意图;如图2所示,假设麦克风阵列采集到的M路输入信号为xi(n),i=1,2,…M,对M路输入信号进行分帧处理,例如,每20ms为一帧,当采样率为16KHz时,一帧信号的长度为N=320点。
在本发明的一个可选实施方式中,例如可以利用固定波束形成计算公式:
将麦克风阵列采集到的M路输入信号进行固定波束形成并得到参考目标信号d(n);
在本发明的一个可选实施方式中,例如可以将固定波束形成后得到的参考目标信号d(n)作为语音激活检测(英文:Voice Activity Detection,简称VAD)的输入信号,进行语音激活检测,并得到语音激活检测结果vad_flag。
在本实施例中,当vad_flag=1,表示当前帧为语音帧;当vad_flag=0,表示当前帧为背景噪声帧。
其中,VAD检测是语音信号处理中常用的一种技术,具体方法有很多种,本发明对此不作限定。
在本发明的一个可选实施方式中,例如可以利用拥塞矩阵计算公式:
U(n)=BX(n)
将M路输入信号通过拥塞矩阵后得到M-1路参考干扰信号U(n);
其中,B为拥塞矩阵,拥塞矩阵的形式是多样的;
例如: 或者
设代表拥塞矩阵中第m行元素向量,拥塞矩阵只要满足即可,T表示矩阵或向量的转置。
U(n)为M-1路参考干扰信号的矩阵:
X(n)为M路输入信号的矩阵:
在本发明的一个可选实施方式中,为了克服麦克风之间一致性差异、间距差异以及真实环境中时变的混响导致的参考干扰信号中存在目标信号泄露,能够实现在不影响对旁瓣说话人干扰抑制的同时最大程度的降低了对目标信号的损伤的发明目的,本实施例中,将所述M路输入信号进行目标出现概率分析并得到目标出现概率,具体实现时,例如:
首先,根据所述M路输入信号的互相关函数,分别估算每相邻两个麦克风采集到的信号之间的时延差;
其中,互相关函数例如为:
i,j∈1,2....M,i≠j,k=L1,L1+1,...L2-1;
其中L1为时延检测起始时延,L2为时延检测终止时延,L1和L2可以是正数也可以是负数。
或者,互相关函数例如还可以为互功率谱密度函数代替:
其中,Xi(ω),i=1,2...M,是将M路输入信号xi(n),i=1,2...M变换到频域,得到M路输入信号对应的频域信号。Yj(ω),j=1,2,...,M,j≠i,是将经过时延后的M路输入信号xj(n-k),j=1,2,...,M,j≠i变换到频域,得到时延后的M路输入信号对应的频域信号。
需要说明的是,通常情况下,只检测相邻两个麦克风采集到的信号之间的时延差,也就是说,只需要计算相邻两个麦克风之间的互相关函数即可。
在计算每相邻两个麦克风之间的互相关函数中,将每相邻两个麦克风之间的互相关函数最大值对应的时延差记做Kij。例如,搜索第1个麦克风与第2个麦克风的互相关函数R12(k)的最大值对应的时延差,记做K12;搜索第2个麦克风与第3个麦克风的互相关函数R23(k)的最大值对应的时延差,记做K23;以此类推,直到搜索到使第M-1个麦克风与第M个麦克风的互相关函数RMM-1(k)的最大值对应的时延差,记做KMM-1。
在本实施例中,为了提高时延差检测的精度,可以采用分数时延差,例如对M路输入信号或者计算出的互相关函数进行内插,然后在内插后得到的互相关函数中进行搜索,找到使相邻两个麦克风之间的互相关函数的最大值对应的时延差,需要说明的是,内插是信号处理算法中常用的一种技术,具体方法有很多种,本发明对此不作限定。
其次,利用时延差与信号源入射角度的对应关系,根据所述估算的各最大时延差,分别估算各时延差对应的信号源入射角度;
通常,相邻两麦克风输入信号之间的时延差与麦克风之间的距离、信号源的入射角度、采样率以及声音传播速度有关,假设相邻的第i个麦克风与第j个麦克风之间的时延差为Kij,第i个麦克风与第j个麦克风之间的距离为di,j,采样率为fs,声音传播速度c,则信号源的入射角度θ与时延差之间的关系为:
再次,将所述估算的各信号源入射角度取平均值得到信号源入射角度平均值;例如,可以先根据每相邻两个麦克风采集到的信号之间的时延差分别估算对应的信号源的入射角度,之后,将各信号源的入射角度的平均值作为最终的信号源入射角度θ。又例如,也可以先根据每相邻两个麦克风采集到的信号之间的时延差分别估计对应的信号源的入射角度,然后,在各信号源的入射角度中选取误差在ε之内的L个信号源的入射角度,取这L个信号源的入射角度的平均值作为最终的信号源入射角度θ。其中,误差ε是个常数,一般取一个较小的角度值,具体可以为10°。
最后,根据预设的主瓣范围与旁瓣范围以及所述信号源入射角度平均值,估算目标出现概率。例如,假设预设的主瓣范围为[θ1,θ2],旁瓣范围为[-π/2,θ1)∪(θ2,π/2],如果θ1≤θ≤θ2,则估算目标出现概率P=1,表示参考目标信号在主瓣范围内;如果θ<θ1或者θ2<θ,则估算目标出现概率P=0,表示参考目标信号在旁瓣范围内。又例如,假设预设的主瓣范围为[θ1,θ2],旁瓣范围为[-π/2,θ3]∪[θ4,π/2],主瓣范围与旁瓣范围的过渡区域为(θ3,θ1)∪(θ2,θ4),则目标出现概率P的计算方法如下:
在本发明的一个可选实施方式中,将所述M路输入信号进行目标出现概率分析后得到目标出现概率,具体实现时,又例如:
首先,根据所述M-1路参考干扰信号U(n),分别计算对应的参考干扰信号的能量值i=1,2,…M-1,在计算得到的各能量值中取最小值作为参考干扰信号的能量最小值;
其次,计算当前帧的参考目标信号的能量值Efbf,将所述当前帧的参考目标信号的能量值Efbf除以所述参考干扰信号的能量最小值,得到当前的目标干扰能量比值;
目标干扰能量比值为:其中,误差ε是常数,取一个非常小的值,一般为10-5,以防止除0现象的发生。
最后,根据预设的目标干扰能量比例范围以及所述当前的目标干扰能量比值,估算目标出现概率。假设目标干扰能量比例范围的最大阈值为thhigh,目标干扰能量比例范围的最小阈值为thlow;其中,thhigh和thlow可以根据经验设定,或者可以根据大量的数据训练得到;将目标干扰能量比值fac与预先设定的目标干扰能量比例范围的最大阈值thhigh和最小阈值为thlow进行比较,如果fac>thhigh,表示参考目标信号极有可能是目标信号,则目标出现概率P=1;如果fac<thlow,表示参考目标信号极有可能是干扰信号,则目标出现概率P=0;如果thhigh≥fac≥thlow,表示参考目标信号极有可能是混合信号,即干扰信号与目标信号同时出现,则目标出现概率为:
102、根据所述语音激活检测结果和所述目标出现概率,确定进行滤波处理的滤波器组的滤波系数,并利用所述确定的滤波器组的滤波系数对所述M-1路参考干扰信号进行滤波处理,得到滤波处理后的参考干扰信号。
在本发明的一个可选实施方式中,上述步骤102的具体实现方式,如图2所示,具体包括:
当所述语音激活检测结果为背景噪声时,确定进行滤波处理的滤波器组的滤波系数为背景噪声滤波器组的滤波系数{Hi(n)|i=1,2,…M-1},利用所述确定滤波系数{Hi(n)|i=1,2,…M-1}对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为:
其中,第i路参考干扰信号的矢量为Ui(n)={ui(n),ui(n-1),...ui(n-L)}T,T为矩阵或向量的转置;第i路背景噪声滤波器组的滤波系数为Hi(n)={hi(n),hi(n-1),...hi(n-L)}T,滤波器组的长度为L+1;
当所述语音激活检测结果为语音帧时,且所述目标出现概率大于预设的目标信号阈值thtarget,其中,thtarget可以根据经验设定,或者可以根据大量的数据训练得到,则确定进行滤波处理的滤波器组的滤波系数为背景噪声滤波器组的滤波系数{Hi(n)|i=1,2,…M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为
其中,第i路参考干扰信号的矢量为Ui(n)={ui(n),ui(n-1),...ui(n-L)}T,第i路背景噪声滤波器组的滤波系数为Hi(n)={hi(n),hi(n-1),...hi(n-L)}T,滤波器组的长度为L+1;
若所述语音激活检测结果为语音帧时,且所述目标出现概率小于预设的干扰标信号阈值thinter,其中,thinter可以根据经验设定,或者可以根据大量的数据训练得到,则确定进行滤波处理的滤波器组的滤波系数为干扰抑制滤波器组的滤波系数{H′i(n)|i=1,2,...M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为
其中,第i路参考干扰信号的矢量为Ui(n)={ui(n),ui(n-1),...ui(n-L)}T,第i路干扰抑制滤波器组的滤波系数为H′i(n)={h′i(n),h′i(n-1),...h′i(n-L)}T,滤波器组的长度为L+1。
当所述语音激活检测结果为语音帧时,且所述目标出现概率小于预设的目标信号阈值thtarget并大于预设的干扰标信号阈值thinter,则确定进行滤波处理的滤波器组的滤波系数为干扰抑制滤波器组的滤波系数{H′i(n)|i=1,2,…M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为
其中,第i路参考干扰信号的矢量为Ui(n)={ui(n),ui(n-1),...ui(n-L)}T,第i路干扰抑制滤波器组的滤波系数为H′i(n)={h′i(n),h′i(n-1),...h′i(n-L)}T,滤波器组的长度为L+1。
需要说明的是,在本发明的一个可选实施方式中,上述步骤102在具体实现时,还包括:
若所述语音激活检测结果为语音帧时,且所述目标出现概率等于预设的目标信号阈值thtarget,则确定进行滤波处理的滤波器组的滤波系数为背景噪声滤波器组的滤波系数{Hi(n)|i=1,2,…M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为y(n)=ynoise(n);或者确定进行滤波处理的滤波器组的滤波系数为干扰抑制滤波器组的滤波系数{H′i(n)|i=1,2,…M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为y(n)=yinter(n);
若所述语音激活检测结果为语音帧时,且所述目标出现概率等于预设的干扰标信号阈值thinter,则确定进行滤波处理的滤波器组的滤波系数为干扰抑制滤波器组的滤波系数{H′i(n)|i=1,2,...M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为。
图3为图1所示实施例提供的麦克风阵列的信号处理方法的又一种原理示意图,在本发明的一个可选实施方式中,上述步骤102的具体实现方式还可以如图3所示,具体包括:
首先,利用背景噪声滤波器组的滤波系数{Hi(n)|i=1,2,…M-1},对所述M-1路参考干扰信号U(n)进行滤波处理,得到背景噪声抑制输出信号ynoise(n)为:
其中,第i路参考干扰信号的矢量为Ui(n)={ui(n),ui(n-1),...ui(n-L)}T,第i路背景噪声滤波器组的滤波系数为Hi(n)={hi(n),hi(n-1),...hi(n-L)}T,滤波器组的长度为L+1;
其次,利用干扰抑制滤波器组的滤波系数{H′i(n)|i=1,2,...M-1},对所述M-1路参考干扰信号U(n)进行滤波处理,得到干扰抑制输出信号yinter(n)为:
其中,第i路参考干扰信号的矢量为Ui(n)={ui(n),ui(n-1),...ui(n-L)}T,第i路干扰抑制滤波器组的滤波系数为H′i(n)={h′i(n),h′i(n-1),...h′i(n-L)}T,滤波器组的长度为L+1;
再次,根据所述目标出现概率计算混合比例因子β:
P≥thtarget
如果,表示参考目标信号极有可能是目标信号,如果P≤thinter,表示参考目标信号极有可能是干扰信号。
最后,根据所述混合比例因子β,将所述背景噪声抑制输出信号ynoise(n)和干扰抑制输出信号yinter(n)进行混合,得到滤波处理后的参考干扰信号y(n)为:y(n)=βynoise(n)+(1-β)yinter(n)。
103、将所述参考目标信号减去所述滤波处理后的参考干扰信号,得到所述麦克风阵列的输出信号。
即ABF(n)=d(n)-y(n)。
在本发明的一个可选实施方式中,若步骤102采用图2所示的方法确定进行滤波处理的滤波器组的滤波系数,则在步骤103之后,包括:
若所述语音激活检测结果为背景噪声时,则利用所述M路输入信号和所述输出信号ABF(n),将所述背景噪声滤波器组的滤波系数更新为{Hi(n+1)|i=1,2,...,M-1},即Hi(n+1)=Hi(n)+2μXi(n)ABF(n);
其中,μ为常数,表示滤波器更新步长;第i路输入信号的矢量为Xi(n)={xi(n),xi(n-1),...,xi(n-L)}T;滤波器组的长度为L+1;T为矩阵或向量的转置。
若所述语音激活检测结果为语音帧时,且所述目标出现概率大于预设的目标信号阈值thtarget,表示参考目标信号很可能是目标信号,则不需要更新所述背景噪声滤波器组的滤波系数和所述干扰抑制滤波器组的滤波系数;
若所述语音激活检测结果为语音帧时,且所述目标出现概率小于预设的干扰标信号阈值thinter,表示参考目标信号很可能是干扰信号,利用所述M路输入信号和所述输出信号ABF(n),将所述干扰抑制滤波器组的滤波系数更新为H′i(n+1)=H′i(n)+2μXi(n)ABF(n);
其中,μ为滤波器更新步长;第i路输入信号的矢量为Xi(n)={xi(n),xi(n-1),...,xi(n-L)}T;滤波器组的长度为L+1;T为矩阵或向量的转置。
若所述语音激活检测结果为语音帧时,且所述目标出现概率小于预设的目标信号阈值thtarget并大于预设的干扰标信号阈值thinter,表示参考目标信号很可能是混合信号,则根据所述目标出现概率,计算所述干扰抑制滤波器组的更新步长step(n),即:
其中,thtarget≥Pmax>Pmin≥thinter。
利用上述计算得到的更新步长step(n)以及所述M路输入信号和所述输出信号ABF(n),将所述干扰抑制滤波器组的滤波系数更新为:H′i(n+1)=H′i(n)+2step(n)Xi(n)ABF(n);
其中,step(n)为滤波器更新步长;第i路输入信号的矢量为Xi(n)={xi(n),xi(n-1),...,xi(n-L)}T;滤波器组的长度为L+1;T为矩阵或向量的转置。
需要说明的是,在本发明的一个可选实施方式中,在步骤103之后,还包括:
若所述语音激活检测结果为语音帧时,且所述目标出现概率等于预设的目标信号阈值thtarget,则不更新所述背景噪声滤波器组的滤波系数和所述干扰抑制滤波器组的滤波系数;或者根据所述目标出现概率,计算所述干扰抑制滤波器组的更新步长step(n),利用所述更新步长step(n)、所述M路输入信号X(n)和所述输出信号ABF(n),将所述干扰抑制滤波器组的滤波系数更新为{H′i(n+1)|i=1,2,…M-1};
若所述语音激活检测结果为语音帧时,且所述目标出现概率等于预设的干扰标信号阈值thinter,利用所述M路输入信号X(n)和所述输出信号ABF(n),将所述干扰抑制滤波器组的滤波系数更新为{H′i(n+1)|i=1,2,…M-1};或者根据所述目标出现概率,计算所述干扰抑制滤波器组的更新步长step(n),利用所述更新步长step(n)、所述M路输入信号X(n)和所述输出信号ABF(n),将所述干扰抑制滤波器组的滤波系数更新为{H′i(n+1)|i=1,2,...M-1}。
在本发明的一个可选实施方式中,若步骤102采用图3所示的方法确定进行滤波处理的滤波器组的滤波系数,则在步骤103之后,包括:
若所述语音激活检测结果为背景噪声时,利用所述M路输入信号和所述输出信号ABF(n),将所述背景噪声滤波器组的滤波系数更新为{Hi(n+1)|i=1,2,...,M-1},即Hi(n+1)=Hi(n)+2μXi(n)ABF(n);
其中,μ为常数,表示滤波器更新步长;第i路输入信号的矢量为Xi(n)={xi(n),xi(n-1),...,xi(n-L)}T;滤波器组的长度为L+1;T为矩阵或向量的转置。
若所述语音激活检测结果为语音帧时,则不更新所述背景噪声滤波器组的滤波系数。
根据所述目标出现概率,计算所述干扰抑制滤波器组的更新步长step(n),即:
其中,thtarget≥Pmax>Pmin≥thinter。
利用上述计算得到的更新步长step(n)以及所述M路输入信号和所述输出信号ABF(n),将所述干扰抑制滤波器组的滤波系数更新为:H′i(n+1)=H′i(n)+2step(n)Xi(n)ABF(n);
其中,step(n)为滤波器更新步长;第i路输入信号的矢量为Xi(n)={xi(n),xi(n-1),...,xi(n-L)}T;滤波器组的长度为L+1;T为矩阵或向量的转置。
本发明实施例通过将麦克风阵列采集到的M路输入信号进行固定波束形成后得到参考目标信号,将所述参考目标信号进行语音激活检测后得到语音激活检测结果,将所述M路输入信号进行目标出现概率分析后得到目标出现概率,将所述M路输入信号通过拥塞矩阵后得到M-1路参考干扰信号;根据得到的语音激活检测结果和目标出现概率,确定进行滤波处理的滤波器组的滤波系数,并利用所述确定的滤波器组的滤波系数对所述M-1路参考干扰信号进行滤波处理,得到滤波处理后的参考干扰信号;然后,将所述参考目标信号减去所述滤波处理后的参考干扰信号,得到所述麦克风阵列的输出信号。
由于本实施例采用将所述M路输入信号进行目标出现概率分析后得到目标出现概率,并进一步利用目标出现概率和语音激活检测结果确定进行滤波处理的滤波器组的滤波系数,并利用所述确定的滤波器组的滤波系数对所述M-1路参考干扰信号进行滤波处理,得到滤波处理后的参考干扰信号的技术手段,可以有效的克服麦克风之间一致性差异、间距差异以及真实环境中时变的混响导致的参考干扰信号中存在目标信号泄露,在不影响对旁瓣说话人干扰抑制的同时最大程度的降低了对目标信号的损伤。
进一步,本发明实施例根据得到的语音激活检测结果和目标出现概率,利用M路输入信号和输出信号ABF(n),动态调整自适应滤波器组的滤波系数,能够减小自适应滤波器组的稳态误差,提高影响通话质量。
图4为本发明另一实施例提供的麦克风阵列的信号处理装置的结构示意图,如图4所示,包括:
固定波束处理模块41,用于将麦克风阵列采集到的M路输入信号X(n)进行固定波束形成后得到参考目标信号d(n);
语音激活检测模块42,用于将所述固定波束处理模块得到的参考目标信号d(n)进行语音激活检测后得到语音激活检测结果;
目标出现概率分析模块43,用于将所述M路输入信号进行目标出现概率分析后得到目标出现概率;
拥塞矩阵处理模块44,用于将所述M路输入信号通过拥塞矩阵后得到M-1路参考干扰信号U(n);
滤波模块45,用于根据所述语音激活检测模块得到的语音激活检测结果和所述目标出现概率分析模块得到的目标出现概率,确定进行滤波处理的滤波器组的滤波系数,并利用所述确定的滤波器组的滤波系数对所述拥塞矩阵处理模块得到的M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号y(n);
消除模块46,用于将所述固定波束处理模块得到的参考目标信号d(n)减去所述滤波模块滤波处理后的参考干扰信号y(n),得到所述麦克风阵列的输出信号ABF(n)。
在本发明的一个可选实施方式中,目标出现概率分析模块43具体用于:
根据所述M路输入信号的互相关函数,分别估算每相邻两个麦克风采集到的信号之间的时延差;
利用时延差与信号源入射角度的对应关系,根据所述估算的各时延差,分别估算各时延差对应的信号源入射角度;
将所述估算的各信号源入射角度取平均值得到信号源入射角度平均值;
根据预设的主瓣范围与旁瓣范围以及所述信号源入射角度平均值,估算目标出现概率。
在本发明的一个可选实施方式中,目标出现概率分析模块43具体用于:
根据所述M-1路参考干扰信号U(n),分别计算对应的参考干扰信号的能量值i=1,2,…M-1,在计算得到的各能量值中取最小值作为参考干扰信号的能量最小值;
计算当前帧的参考目标信号的能量值Efbf,将所述当前帧的参考目标信号的能量值Efbf除以所述参考干扰信号的能量最小值,得到当前的目标干扰能量比值;
根据预设的目标干扰能量比例范围以及所述当前的目标干扰能量比值,估算目标出现概率。
在本发明的一个可选实施方式中,若所述语音激活检测模块得到的语音激活检测结果为背景噪声时,则滤波模块45具体用于:
确定进行滤波处理的滤波器组的滤波系数为背景噪声滤波器组的滤波系数{Hi(n)|i=1,2,...M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为y(n)=ynoise(n);或者
若所述语音激活检测模块得到的语音激活检测结果为语音帧时,且所述目标出现概率分析模块得到的目标出现概率大于预设的目标信号阈值thtarget,则滤波模块45具体用于:
确定进行滤波处理的滤波器组的滤波系数为背景噪声滤波器组的滤波系数{Hi(n)|i=1,2,…M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为y(n)=ynoise(n);或者
若所述语音激活检测模块得到的语音激活检测结果为语音帧时,且所述目标出现概率分析模块得到的目标出现概率小于预设的干扰标信号阈值thinter,则滤波模块45具体用于:
确定进行滤波处理的滤波器组的滤波系数为干扰抑制滤波器组的滤波系数{H′i(n)|i=1,2,…M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为y(n)=yinter(n);或者
若所述语音激活检测模块得到的语音激活检测结果为语音帧时,且所述目标出现概率分析模块得到的目标出现概率小于预设的目标信号阈值thtarget并大于预设的干扰标信号阈值thinter,则滤波模块45具体用于:
确定进行滤波处理的滤波器组的滤波系数为干扰抑制滤波器组的滤波系数{H′i(n)|i=1,2,…M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为y(n)=yinter(n)。
需要说明的是,在本发明的一个可选实施方式中,若所述语音激活检测结果为语音帧时,且所述目标出现概率等于预设的目标信号阈值thtarget,则所述滤波模块45具体用于:
确定进行滤波处理的滤波器组的滤波系数为背景噪声滤波器组的滤波系数{Hi(n)|i=1,2,...M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为y(n)=ynoise(n);或者确定进行滤波处理的滤波器组的滤波系数为干扰抑制滤波器组的滤波系数{H′i(n)|i=1,2,…M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为y(n)=yinter(n);
若所述语音激活检测结果为语音帧时,且所述目标出现概率等于预设的干扰标信号阈值thinter,则所述滤波模块45具体用于:
确定进行滤波处理的滤波器组的滤波系数为干扰抑制滤波器组的滤波系数{H′i(n)|i=1,2,...M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为。
在本发明的一个可选实施方式中,滤波模块45具体还用于:
利用背景噪声滤波器组的滤波系数{Hi(n)|i=1,2,...M-1},对所述M-1路参考干扰信号U(n)进行滤波处理,得到背景噪声抑制输出信号ynoise(n);
利用干扰抑制滤波器组的滤波系数{H′i(n)|i=1,2,…M-1},对所述M-1路参考干扰信号U(n)进行滤波处理,得到干扰抑制输出信号yinter(n);
根据所述目标出现概率分析模块得到的目标出现概率计算混合比例因子β;
根据所述混合比例因子β,将所述背景噪声抑制输出信号ynoise(n)和干扰抑制输出信号yinter(n)进行混合得到滤波处理后的参考干扰信号y(n)。
在本发明的一个可选实施方式中,所述装置还包括:系数更新模块47;
若所述语音激活检测模块得到的语音激活检测结果为背景噪声时,则系数更新模块47具体用于:
利用所述M路输入信号X(n)和所述输出信号ABF(n),将所述背景噪声滤波器组的滤波系数更新为{Hi(n+1)|i=1,2,…M-1};或者
若所述语音激活检测模块得到的语音激活检测结果为语音帧时,且所述目标出现概率分析模块得到的目标出现概率小于预设的干扰标信号阈值thinter,则系数更新模块47具体用于:
利用所述M路输入信号和所述输出信号,将所述干扰抑制滤波器组的滤波系数更新为{H′i(n+1)|i=1,2,…M-1};或者
若所述语音激活检测模块得到的语音激活检测结果为语音帧时,且所述目标出现概率小于预设的目标信号阈值thtarget并大于预设的干扰标信号阈值thinter,则系数更新模块47具体用于:
根据所述目标出现概率,计算所述干扰抑制滤波器组的更新步长step(n),利用所述更新步长step(n)、所述M路输入信号和所述输出信号,将所述干扰抑制滤波器组的滤波系数更新为{H′i(n+1)|i=1,2,…M-1}。
需要说明的是,在本发明的一个可选实施方式中,若所述语音激活检测结果为语音帧时,且所述目标出现概率等于预设的目标信号阈值thtarget,则所述系数更新模块47具体用于:
根据所述目标出现概率,计算所述干扰抑制滤波器组的更新步长step(n),利用所述更新步长step(n)、所述M路输入信号X(n)和所述输出信号ABF(n),将所述干扰抑制滤波器组的滤波系数更新为{H′i(n+1)|i=1,2,...M-1};
若所述语音激活检测结果为语音帧时,且所述目标出现概率等于预设的干扰标信号阈值thinter,则所述系数更新模块47具体用于:
利用所述M路输入信号X(n)和所述输出信号ABF(n),将所述干扰抑制滤波器组的滤波系数更新为{H′i(n+1)|i=1,2,…M-1};或者根据所述目标出现概率,计算所述干扰抑制滤波器组的更新步长step(n),利用所述更新步长step(n)、所述M路输入信号X(n)和所述输出信号ABF(n),将所述干扰抑制滤波器组的滤波系数更新为{H′i(n+1)|i=1,2,…M-1}。
在本发明的一个可选实施方式中,系数更新模块47具体还用于:
若所述语音激活检测结果为背景噪声时,利用所述M路输入信号X(n)和所述输出信号ABF(n),将所述背景噪声滤波器组的滤波系数更新为{Hi(n+1)|i=1,2,…M-1};
根据所述目标出现概率,计算所述干扰抑制滤波器组的更新步长step(n),利用所述更新步长step(n)、所述M路输入信号和所述输出信号,将所述干扰抑制滤波器组的滤波系数更新为{H′i(n+1)|i=1,2,…M-1}。
本实施例采用将所述M路输入信号进行目标出现概率分析后得到目标出现概率,并进一步利用目标出现概率和语音激活检测结果确定进行滤波处理的滤波器组的滤波系数,并利用所述确定的滤波器组的滤波系数对所述M-1路参考干扰信号进行滤波处理,得到滤波处理后的参考干扰信号的技术手段,可以有效的克服麦克风之间一致性差异、间距差异以及真实环境中时变的混响导致的参考干扰信号中存在目标信号泄露,在不影响对旁瓣说话人干扰抑制的同时最大程度的降低了对目标信号的损伤。
进一步,本发明实施例根据得到的语音激活检测结果和目标出现概率,利用M路输入信号和输出信号ABF(n),动态调整自适应滤波器组的滤波系数;能够减小自适应滤波器组的稳态误差,提高影响通话质量。
图5为本发明另一实施例提供的麦克风阵列的信号处理装置的结构示意图,如图5所示,包括:本实施例的麦克风阵列的信号处理装置具体为安装有麦克风阵列的信号处理指令的设备,所述设备包括处理器、存储器和通信总线,其中,处理器通过通信总线与存储器连接,其中,存储器中保存有麦克风阵列的信号处理指令,处理器调取并执行存储器中保存的麦克风阵列的信号处理指令;所述设备还包括通信接口,所述设备通过通信接口与麦克风阵列通信,具体可以接收麦克风阵列采集到的M路输入信号X(n)。
所述处理器根据存储器中保存的指令,执行以下步骤:
将麦克风阵列采集到的M路输入信号X(n)进行固定波束形成后得到参考目标信号d(n),将所述参考目标信号d(n)进行语音激活检测后得到语音激活检测结果,将所述M路输入信号X(n)进行目标出现概率分析后得到目标出现概率P,将所述M路输入信号通过拥塞矩阵后得到M-1路参考干扰信号U(n);
根据所述语音激活检测结果和所述目标出现概率,确定进行滤波处理的滤波器组的滤波系数,并利用所述确定的滤波器组的滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号y(n);
将所述参考目标信号d(n)减去所述滤波处理后的参考干扰信号y(n),得到所述麦克风阵列的输出信号ABF(n)。
在第一种可能的实施方式中,所述将所述M路输入信号进行目标出现概率分析后得到目标出现概率,包括:
根据所述M路输入信号的互相关函数,分别估算每相邻两个麦克风采集到的信号之间的时延差;
利用时延差与信号源入射角度的对应关系,根据所述估算的各时延差,分别估算各时延差对应的信号源入射角度;
将所述估算的各信号源入射角度取平均值得到信号源入射角度平均值;
根据预设的主瓣范围与旁瓣范围以及所述信号源入射角度平均值,估算目标出现概率。
在第二种可能的实施方式中,所述将所述M路输入信号进行目标出现概率分析后得到目标出现概率,包括:
根据所述M-1路参考干扰信号U(n),分别计算对应的参考干扰信号的能量值i=1,2,...M-1,在计算得到的各能量值中取最小值作为参考干扰信号的能量最小值;
计算当前帧的参考目标信号的能量值Efbf,将所述当前帧的参考目标信号的能量值Efbf除以所述参考干扰信号的能量最小值,得到当前的目标干扰能量比值;
根据预设的目标干扰能量比例范围以及所述当前的目标干扰能量比值,估算目标出现概率。
基于第一种和第二种可能的实施方式中的任一种实施方式,在第三种可能的实施方式中,根据所述语音激活检测结果和所述目标出现概率,确定进行滤波处理的滤波器组的滤波系数,并利用所述确定的滤波器组的滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号y(n),包括:
若所述语音激活检测结果为背景噪声时,确定进行滤波处理的滤波器组的滤波系数为背景噪声滤波器组的滤波系数{Hi(n)|i=1,2,…M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为y(n)=ynoise(n);或者
若所述语音激活检测结果为语音帧时,且所述目标出现概率大于预设的目标信号阈值thtarget,确定进行滤波处理的滤波器组的滤波系数为背景噪声滤波器组的滤波系数{Hi(n)|i=1,2,...M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为y(n)=ynoise(n);或者
若所述语音激活检测结果为语音帧时,且所述目标出现概率小于预设的干扰标信号阈值thinter,确定进行滤波处理的滤波器组的滤波系数为干扰抑制滤波器组的滤波系数{H′i(n)|i=1,2,...M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为y(n)=yinter(n);或者
若所述语音激活检测结果为语音帧时,且所述目标出现概率小于预设的目标信号阈值thtarget并大于预设的干扰标信号阈值thinter,确定进行滤波处理的滤波器组的滤波系数为干扰抑制滤波器组的滤波系数{H′i(n)|i=1,2,…M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为y(n)=yinter(n)。
基于第一种和第二种可能的实施方式中的任一种实施方式,在第四种可能的实施方式中,根据所述语音激活检测结果和所述目标出现概率,确定进行滤波处理的滤波器组的滤波系数,并利用所述确定的滤波器组的滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号y(n),还包括:
若所述语音激活检测结果为语音帧时,且所述目标出现概率等于预设的目标信号阈值thtarget,则确定进行滤波处理的滤波器组的滤波系数为背景噪声滤波器组的滤波系数{Hi(n)|i=1,2,…M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为y(n)=ynoise(n);或者确定进行滤波处理的滤波器组的滤波系数为干扰抑制滤波器组的滤波系数{H′i(n)|i=1,2,…M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为y(n)=yinter(n);
若所述语音激活检测结果为语音帧时,且所述目标出现概率等于预设的干扰标信号阈值thinter,则确定进行滤波处理的滤波器组的滤波系数为干扰抑制滤波器组的滤波系数{H′i(n)|i=1,2,…M-1},利用所述确定滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号为。
基于第一种和第二种可能的实施方式中的任一种实施方式,在第五种可能的实施方式中,根据所述语音激活检测结果和所述目标出现概率,确定进行滤波处理的滤波器组的滤波系数,并利用所述确定的滤波器组的滤波系数对所述M-1路参考干扰信号U(n)进行滤波处理,得到滤波处理后的参考干扰信号y(n),还包括:
利用背景噪声滤波器组的滤波系数{Hi(n)|i=1,2,...M-1},对所述M-1路参考干扰信号U(n)进行滤波处理,得到背景噪声抑制输出信号ynoise(n);
利用干扰抑制滤波器组的滤波系数{H′i(n)|i=1,2,…M-1},对所述M-1路参考干扰信号U(n)进行滤波处理,得到干扰抑制输出信号yinter(n);
根据所述目标出现概率计算混合比例因子β;
根据所述混合比例因子β,将所述背景噪声抑制输出信号ynoise(n)和干扰抑制输出信号yinter(n)进行混合得到滤波处理后的参考干扰信号y(n)。
基于第三种可能的实施方式,在第六种可能的实施方式中,将所述参考目标信号d(n)减去所述滤波处理后的参考干扰信号y(n),得到所述麦克风阵列的输出信号ABF(n)之后,包括:
若所述语音激活检测结果为背景噪声时,则利用所述M路输入信号X(n)和所述输出信号ABF(n),将所述背景噪声滤波器组的滤波系数更新为{Hi(n+1)|i=1,2,…M-1};或者
若所述语音激活检测结果为语音帧时,且所述目标出现概率大于预设的目标信号阈值thtarget,则不更新所述背景噪声滤波器组的滤波系数和所述干扰抑制滤波器组的滤波系数;或者
若所述语音激活检测结果为语音帧时,且所述目标出现概率小于预设的干扰标信号阈值thinter,利用所述M路输入信号和所述输出信号,将所述干扰抑制滤波器组的滤波系数更新为{H′i(n+1)|i=1,2,...M-1};或者
若所述语音激活检测结果为语音帧时,且所述目标出现概率小于预设的目标信号阈值thtarget并大于预设的干扰标信号阈值thinter,则根据所述目标出现概率,计算所述干扰抑制滤波器组的更新步长step(n),利用所述更新步长step(n)、所述M路输入信号和所述输出信号,将所述干扰抑制滤波器组的滤波系数更新为{H′i(n+1)|i=1,2,…M-1}。
基于第四种可能的实施方式,在第七种可能的实施方式中,将所述参考目标信号d(n)减去所述滤波处理后的参考干扰信号y(n),得到所述麦克风阵列的输出信号ABF(n)之后,包括:
若所述语音激活检测结果为语音帧时,且所述目标出现概率等于预设的目标信号阈值thtarget,则不更新所述背景噪声滤波器组的滤波系数和所述干扰抑制滤波器组的滤波系数;或者根据所述目标出现概率,计算所述干扰抑制滤波器组的更新步长step(n),利用所述更新步长step(n)、所述M路输入信号X(n)和所述输出信号ABF(n),将所述干扰抑制滤波器组的滤波系数更新为{H′i(n+1)|i=1,2,…M-1};
若所述语音激活检测结果为语音帧时,且所述目标出现概率等于预设的干扰标信号阈值thinter,利用所述M路输入信号X(n)和所述输出信号ABF(n),将所述干扰抑制滤波器组的滤波系数更新为{H′i(n+1)|i=1,2,…M-1};或者根据所述目标出现概率,计算所述干扰抑制滤波器组的更新步长step(n),利用所述更新步长step(n)、所述M路输入信号X(n)和所述输出信号ABF(n),将所述干扰抑制滤波器组的滤波系数更新为{H′i(n+1)|i=1,2,...M-1}。
基于第五种可能的实施方式,在第八种可能的实施方式中,将所述参考目标信号d(n)减去所述滤波处理后的参考干扰信号y(n),得到所述麦克风阵列的输出信号ABF(n)之后,包括:
若所述语音激活检测结果为背景噪声时,利用所述M路输入信号X(n)和所述输出信号ABF(n),将所述背景噪声滤波器组的滤波系数更新为{Hi(n+1)|i=1,2,…M-1};若所述语音激活检测结果为语音帧时,则不更新所述背景噪声滤波器组的滤波系数;
根据所述目标出现概率,计算所述干扰抑制滤波器组的更新步长step(n),利用所述更新步长step(n)、所述M路输入信号和所述输出信号,将所述干扰抑制滤波器组的滤波系数更新为{H′i(n+1)|i=1,2,…M-1}。
由于本实施例采用将所述M路输入信号进行目标出现概率分析后得到目标出现概率,并进一步利用目标出现概率和语音激活检测结果确定进行滤波处理的滤波器组的滤波系数,并利用所述确定的滤波器组的滤波系数对所述M-1路参考干扰信号进行滤波处理,得到滤波处理后的参考干扰信号的技术手段,可以有效的克服麦克风之间一致性差异、间距差异以及真实环境中时变的混响导致的参考干扰信号中存在目标信号泄露,在不影响对旁瓣说话人干扰抑制的同时最大程度的降低了对目标信号的损伤。
进一步,本发明实施例根据得到的语音激活检测结果和目标出现概率,利用M路输入信号和输出信号ABF(n),动态调整自适应滤波器组的滤波系数;能够减小自适应滤波器组的稳态误差,提高影响通话质量。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以以代码的形式存储在一个计算机可读取存储介质中。上述代码存储在一个计算机可读存储介质中,包括若干指令用以使处理器或硬件电路执行本发明各个实施例所述方法的部分或全部步骤。而前述的存储介质包括:通用串行总线接口的无需物理驱动器的微型高容量移动存储盘、移动硬盘、只读存储器(英文:Read-Only Memory,简称ROM)、随机存取存储器(英文:Random Access Memory,简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的保护范围。