CN108257607B

CN108257607B - 一种多通道语音信号处理方法

Info

Publication number: CN108257607B
Application number: CN201810069729.2A
Authority: CN
Inventors: 杨晓莹; 吴伟杰
Original assignee: Chengdu Trust Electronic Technology Co ltd
Current assignee: Chengdu Trust Electronic Technology Co ltd
Priority date: 2018-01-24
Filing date: 2018-01-24
Publication date: 2021-05-18
Anticipated expiration: 2038-01-24
Also published as: CN108257607A

Abstract

本发明提供了一种多通道语音信号处理方法，包括如下步骤：接收语音信号，所述语音信号具有静默信号，即只有噪声的信号；在多个不同的时间段进行信号谱分析；根据所述谱分析得到的增益函数对语音信号降噪。本方法适用于语音中语句之间间隔时间段较多的语音降噪处理，实现了对语音信号噪音的稳定降噪处理，特别是对连续语句中词语之间或词语内各个单词的发音存在空白的语音的稳定的、高信噪比的降噪处理。

Description

一种多通道语音信号处理方法

技术领域

本发明属于语音信号处理领域，具体涉及一种多通道语音信号处理方法。

背景技术

语音信号处理被广泛的应用在波达方向估计、声源定位、语音降噪、声源分离、混响抑制、远场拾音、3维音频等问题。相关处理方法与技术在包括声学监控、智能手机、智能电视、平板电脑、助听器、机器人等领域。如何抑制麦克风传输的语音信号中的噪声是当前语音信号处理领域的热点。

相关技术中提出基于正则参数的超指向性波束形成方法对语音信号中的噪声进行抑制。基于正则参数的超指向性波束形成方法是通过引入和调节正则参数(RegularizationParameter)可以在指向性和白噪声增益之间获得一个折中，或者通过假设每个传感器的误差(传感器的增益、相位和位置误差)服从某种概率分布，从而推导出一种鲁棒性较好的波束形成器，从而对语音信号中的噪声进行抑制。

随着移动通信技术的发展和人们生活水平的不断提高，人们往往需要通过录音装置在不同的场合进行录音，如在采访场合、开会场合、培训场合等，将现场声音录制下来，生成音视频文件。但是，由于录音的场景复杂多变，录音的质量和内容由于周围环境的变化而受影响；比如，在开会期间录音，使用者打开录音装置进行录音，一直到会议结束后停止录音，但是，这段录音包含了会议休息期间的录音，因此，需要对录音装置录制的音视频文件进行去噪，以去除掉无关紧要的声音。例如，申请号为CN201210196983.1的中国发明专利申请公开了一种语音信号的基音周期估计算法，涉及语音信号处理领域，包括如下步骤：S1.将带噪音的语音信号经自适应滤波器进行降噪处理；S2.求出降噪后语音信号的自相关函数和循环的平均幅度差函数；S3.通过公式得出加权平方特征，其中，α、β、γ为大于1的常数，R(k)为所述自相关函数，D(k)为所述平均幅度差函数。

然而，经申请人试验，现有技术的诸多方案关注的多在语句之间存在空白(或称为静默段，即此时没有语音)的情况，而对于词语之间存在空白或者词语内存在语音空白的情况却无法有效地降低语音中的噪声。

发明内容

鉴于以上分析，本发明的主要目的在于提供一种多通道语音信号处理方法，包括如下步骤：

接收第一通道语音信号，所述语音信号具有静默信号，即只有噪声的信号；

在多个不同的时间段进行第一信号谱分析；

接收第二通道语音信号，所述语音信号具有静默信号，即只有噪声的信号；

在多个不同的时间段进行第二信号谱分析；

根据所述第一信号谱分析和第二信号谱分析得到的增益函数对语音信号降噪。

进一步地，接收第一通道或第二通道语音信号均为：从t1时刻到t4时刻接收语音信号，该语音信号至少包括连续的第一语句语音信号、静默信号、第二语句语音信号，所述第一语句语音信号和第二语句语音信号是包括噪声以及有用语音信号的信号，该有用语音信号不必然是完整的语句，静默信号是相对于第一语句语音信号和第二语句语音信号而言只有噪声的信号。

进一步地，所述在多个不同的时间段进行第一信号谱分析包括：

在t1时刻和t1+T1时刻分别采集语音信号的两个帧，t1+T1在所述静默信号之前；

对两个语音信号帧进行小波变换，得到两个帧信号小波F1和F2；

根据下式取F1和F2的公共门槛能量Q1和Q2：

p为采集语音信号时的捕获窗口长度；

计算Q1和Q2的协方差矩阵，并对协方差矩阵进行能量谱分解，得到特征值A和特征向量A’，A’阶数为i；

在t2时刻，以及在t2+T2时刻分别采集语音信号的两个帧，所述t2时刻在t1至t1+T1时刻之间，从t1至t2+T2小于第一语句语音信号的时间；

对两个语音信号帧进行小波变换，得到两个帧信号小波G1和G2；

根据下式取G1和G2的公共门槛能量R1和R2：

p为采集语音信号时的捕获窗口长度；

计算R1和R2的协方差矩阵，并对协方差矩阵进行能量谱分解，得到特征值B和特征向量B’，B’阶数为j；

M_a和M_b分别为i×i阶的矩阵和i×j阶的矩阵；

在t3时刻，以及在t3+T3时刻分别采集语音信号的两个帧，所述t3时刻在t2+T2时刻之后、t3+T3在t4之前，即从t3到t3+T3这段时间包括一部分所述静默信号和一部分所述第二语句语音信号；

对两个语音信号帧进行希尔伯特变换，得到两个帧信号谱函数为H1和H2，能量谱比率K；

设C＝[A”,B”]，A”为A’转置矩阵，B”为B’转置矩阵，则对于所述语音信号的增益函数为：

进一步地，所述在多个不同的时间段进行第二信号谱分析包括：对于第二通道接收的语音信号，

根据下式取F1和F2的公共门槛能量Q1和Q2：

p为采集语音信号时的捕获窗口长度；

根据下式取G1和G2的公共门槛能量R1和R2：

p为采集语音信号时的捕获窗口长度；

M_a和M_b分别为i×i阶的矩阵和i×j阶的矩阵；

进一步地，根据所述谱分析得到的第一和第二增益函数对语音信号降噪包括：

将语音信号的谱函数与所述增益函数

的谱函数相乘，得到降噪后的语音信号的谱函数。

本发明的技术方案具有以下优点：

提供一种语音信号加密方法，适用于语音中语句之间间隔时间段较多的语音降噪处理，实现了对语音信号噪音的稳定降噪处理，特别是对连续语句中词语之间或词语内各个单词的发音存在空白(即本申请提及的“静默”)的语音的稳定的、高信噪比的降噪处理。经试验，信噪比相比同类现有技术高出65％以上。

附图说明

图1示出了根据本发明的方法流程图。

具体实施方式

如图1所示，一种多通道语音信号处理方法，包括如下步骤：

在多个不同的时间段进行第一信号谱分析；

在多个不同的时间段进行第二信号谱分析；

接收第一通道或第二通道语音信号均为：从t1时刻到t4时刻接收语音信号，该语音信号至少包括连续的第一语句语音信号、静默信号、第二语句语音信号，所述第一语句语音信号和第二语句语音信号是包括噪声以及有用语音信号的信号，该有用语音信号不必然是完整的语句，静默信号是相对于第一语句语音信号和第二语句语音信号而言只有噪声的信号。

所述在多个不同的时间段进行第一信号谱分析包括：

根据下式取F1和F2的公共门槛能量Q1和Q2：

p为采集语音信号时的捕获窗口长度；

根据下式取G1和G2的公共门槛能量R1和R2：

p为采集语音信号时的捕获窗口长度；

M_a和M_b分别为i×i阶的矩阵和i×j阶的矩阵；

所述在多个不同的时间段进行第二信号谱分析包括：对于第二通道接收的语音信号，

根据下式取F1和F2的公共门槛能量Q1和Q2：

p为采集语音信号时的捕获窗口长度；

根据下式取G1和G2的公共门槛能量R1和R2：

p为采集语音信号时的捕获窗口长度；

M_a和M_b分别为i×i阶的矩阵和i×j阶的矩阵；

根据所述谱分析得到的第一和第二增益函数对语音信号降噪包括：

将语音信号的谱函数与所述增益函数

的谱函数相乘，得到降噪后的语音信号的谱函数。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种多通道语音信号处理方法，包括如下步骤：

在多个不同的时间段进行第一信号谱分析；

在多个不同的时间段进行第二信号谱分析；

根据所述第一信号谱分析和第二信号谱分析得到的增益函数对语音信号降噪；

接收第一通道或第二通道语音信号均为：从t1时刻到t4时刻接收语音信号，该语音信号至少包括连续的第一语句语音信号、静默信号、第二语句语音信号，所述第一语句语音信号和第二语句语音信号是包括噪声以及有用语音信号的信号，该有用语音信号不必然是完整的语句，静默信号是相对于第一语句语音信号和第二语句语音信号而言只有噪声的信号；

其特征在于，所述在多个不同的时间段进行第一信号谱分析包括：

根据下式取F1和F2的公共门槛能量Q1和Q2：