CN108281154B - 一种语音信号的降噪方法 - Google Patents

一种语音信号的降噪方法 Download PDF

Info

Publication number
CN108281154B
CN108281154B CN201810068643.8A CN201810068643A CN108281154B CN 108281154 B CN108281154 B CN 108281154B CN 201810068643 A CN201810068643 A CN 201810068643A CN 108281154 B CN108281154 B CN 108281154B
Authority
CN
China
Prior art keywords
signal
time
voice signal
speech
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810068643.8A
Other languages
English (en)
Other versions
CN108281154A (zh
Inventor
杨晓莹
吴伟杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Trust Electronic Technology Co ltd
Original Assignee
Chengdu Trust Electronic Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Trust Electronic Technology Co ltd filed Critical Chengdu Trust Electronic Technology Co ltd
Priority to CN201810068643.8A priority Critical patent/CN108281154B/zh
Publication of CN108281154A publication Critical patent/CN108281154A/zh
Application granted granted Critical
Publication of CN108281154B publication Critical patent/CN108281154B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明提供了一种语音信号的降噪方法,包括如下步骤:接收语音信号,所述语音信号具有静默信号,即只有噪声的信号;在多个不同的时间段进行信号谱分析;根据所述谱分析得到的增益函数对语音信号降噪。本方法适用于语音中语句之间间隔时间段较多的语音降噪处理,实现了对语音信号噪音的稳定降噪处理,特别是对连续语句中词语之间或词语内各个单词的发音存在空白的语音的稳定的、高信噪比的降噪处理。

Description

一种语音信号的降噪方法
技术领域
本发明属于语音信号处理领域,具体涉及一种语音信号的降噪方法。
背景技术
语音信号处理被广泛的应用在波达方向估计、声源定位、语音降噪、声源分离、混响抑制、远场拾音、3维音频等问题。相关处理方法与技术在包括声学监控、智能手机、智能电视、平板电脑、助听器、机器人等领域。如何抑制麦克风传输的语音信号中的噪声是当前语音信号处理领域的热点。
相关技术中提出基于正则参数的超指向性波束形成方法对语音信号中的噪声进行抑制。基于正则参数的超指向性波束形成方法是通过引入和调节正则参数(RegularizationParameter)可以在指向性和白噪声增益之间获得一个折中,或者通过假设每个传感器的误差(传感器的增益、相位和位置误差)服从某种概率分布,从而推导出一种鲁棒性较好的波束形成器,从而对语音信号中的噪声进行抑制。
随着移动通信技术的发展和人们生活水平的不断提高,人们往往需要通过录音装置在不同的场合进行录音,如在采访场合、开会场合、培训场合等,将现场声音录制下来,生成音视频文件。但是,由于录音的场景复杂多变,录音的质量和内容由于周围环境的变化而受影响;比如,在开会期间录音,使用者打开录音装置进行录音,一直到会议结束后停止录音,但是,这段录音包含了会议休息期间的录音,因此,需要对录音装置录制的音视频文件进行去噪,以去除掉无关紧要的声音。例如,申请号为CN201210196983.1的中国发明专利申请公开了一种语音信号的基音周期估计算法,涉及语音信号处理领域,包括如下步骤:S1.将带噪音的语音信号经自适应滤波器进行降噪处理;S2.求出降噪后语音信号的自相关函数和循环的平均幅度差函数;S3.通过公式得出加权平方特征,其中,α、β、γ为大于1的常数,R(k)为所述自相关函数,D(k)为所述平均幅度差函数。
然而,经申请人试验,现有技术的诸多方案关注的多在语句之间存在空白(或称为静默段,即此时没有语音)的情况,而对于词语之间存在空白或者词语内存在语音空白的情况却无法有效地降低语音中的噪声。
发明内容
鉴于以上分析,本发明的主要目的在于提供一种语音信号的降噪方法,包括如下步骤:
接收语音信号,所述语音信号具有静默信号,即只有噪声的信号;
在多个不同的时间段进行信号谱分析;
根据所述谱分析得到的增益函数对语音信号降噪。
进一步地,所述接收语音信号为从t1时刻到t4时刻接收语音信号,该语音信号至少包括连续的第一语句语音信号、静默信号、第二语句语音信号,所述第一语句语音信号和第二语句语音信号是包括噪声以及有用语音信号的信号,该有用语音信号不必然是完整的语句,静默信号是相对于第一语句语音信号和第二语句语音信号而言只有噪声的信号。
进一步地,所述在多个不同的时间段进行信号谱分析包括:
在t1时刻和t1+T1时刻分别采集语音信号的两个帧,t1+T1在所述静默信号之前;
对两个语音信号帧进行小波变换,得到两个帧信号小波F1和F2;
根据下式取F1和F2的公共门槛能量Q1和Q2:
Figure BDA0001557450870000031
Figure BDA0001557450870000032
p为采集语音信号时的捕获窗口长度;
计算Q1和Q2的协方差矩阵,并对协方差矩阵进行能量谱分解,得到特征值A和特征向量A’,A’阶数为i;
在t2时刻,以及在t2+T2时刻分别采集语音信号的两个帧,所述t2时刻在t1至t1+T1时刻之间,从t1至t2+T2小于第一语句语音信号的时间;
对两个语音信号帧进行小波变换,得到两个帧信号小波G1和G2;
根据下式取G1和G2的公共门槛能量R1和R2:
Figure BDA0001557450870000033
Figure BDA0001557450870000034
p为采集语音信号时的捕获窗口长度;
计算R1和R2的协方差矩阵,并对协方差矩阵进行能量谱分解,得到特征值B和特征向量B’,B’阶数为j;
Ma和Mb分别为i×i阶的矩阵和i×j阶的矩阵;
在t3时刻,以及在t3+T3时刻分别采集语音信号的两个帧,所述t3时刻在t2+T2时刻之后、t3+T3在t4之前,即从t3到t3+T3这段时间包括一部分所述静默信号和一部分所述第二语句语音信号;
对两个语音信号帧进行希尔伯特变换,得到两个帧信号谱函数为H1和H2,能量谱比率K;
设C=[A”,B”],A”为A’转置矩阵,B”为B’转置矩阵,则对于所述语音信号的增益函数为:
Figure BDA0001557450870000041
进一步地,所述根据所述谱分析得到的增益函数对语音信号降噪包括:
将语音信号的谱函数与所述增益函数的谱函数相乘,得到降噪后的语音信号的谱函数。
本发明的技术方案具有以下优点:
提供一种语音信号加密方法,适用于语音中语句之间间隔时间段较多的语音降噪处理,实现了对语音信号噪音的稳定降噪处理,特别是对连续语句中词语之间或词语内各个单词的发音存在空白(即本申请提及的“静默”)的语音的稳定的、高信噪比的降噪处理。经试验,信噪比相比同类现有技术高出65%以上。
附图说明
图1示出了根据本发明的方法流程图。
具体实施方式
如图1所示,一种语音信号的降噪方法,包括如下步骤:
接收语音信号,所述语音信号具有静默信号,即只有噪声的信号;
在多个不同的时间段进行信号谱分析;
根据所述谱分析得到的增益函数对语音信号降噪。
所述接收语音信号为从t1时刻到t4时刻接收语音信号,该语音信号至少包括连续的第一语句语音信号、静默信号、第二语句语音信号,所述第一语句语音信号和第二语句语音信号是包括噪声以及有用语音信号的信号,该有用语音信号不必然是完整的语句,静默信号是相对于第一语句语音信号和第二语句语音信号而言只有噪声的信号。
所述在多个不同的时间段进行信号谱分析包括:
在t1时刻和t1+T1时刻分别采集语音信号的两个帧,t1+T1在所述静默信号之前;
对两个语音信号帧进行小波变换,得到两个帧信号小波F1和F2;
根据下式取F1和F2的公共门槛能量Q1和Q2:
Figure BDA0001557450870000051
Figure BDA0001557450870000052
p为采集语音信号时的捕获窗口长度;
计算Q1和Q2的协方差矩阵,并对协方差矩阵进行能量谱分解,得到特征值A和特征向量A’,A’阶数为i;
在t2时刻,以及在t2+T2时刻分别采集语音信号的两个帧,所述t2时刻在t1至t1+T1时刻之间,从t1至t2+T2小于第一语句语音信号的时间;
对两个语音信号帧进行小波变换,得到两个帧信号小波G1和G2;
根据下式取G1和G2的公共门槛能量R1和R2:
Figure BDA0001557450870000061
Figure BDA0001557450870000062
p为采集语音信号时的捕获窗口长度;
计算R1和R2的协方差矩阵,并对协方差矩阵进行能量谱分解,得到特征值B和特征向量B’,B’阶数为j;
Ma和Mb分别为i×i阶的矩阵和i×j阶的矩阵;
在t3时刻,以及在t3+T3时刻分别采集语音信号的两个帧,所述t3时刻在t2+T2时刻之后、t3+T3在t4之前,即从t3到t3+T3这段时间包括一部分所述静默信号和一部分所述第二语句语音信号;
对两个语音信号帧进行希尔伯特变换,得到两个帧信号谱函数为H1和H2,能量谱比率K;
设C=[A”,B”],A”为A’转置矩阵,B”为B’转置矩阵,则对于所述语音信号的增益函数为:
Figure BDA0001557450870000063
所述根据所述谱分析得到的增益函数对语音信号降噪包括:
将语音信号的谱函数与所述增益函数的谱函数相乘,得到降噪后的语音信号的谱函数。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (2)

1.一种语音信号的降噪方法,包括如下步骤:
接收语音信号,所述语音信号具有静默信号,即只有噪声的信号;
在多个不同的时间段进行信号谱分析;
根据所述谱分析得到的增益函数对语音信号降噪;
所述接收语音信号为从t1时刻到t4时刻接收语音信号,该语音信号至少包括连续的第一语句语音信号、静默信号、第二语句语音信号,所述第一语句语音信号和第二语句语音信号是包括噪声以及有用语音信号的信号,该有用语音信号不必然是完整的语句,静默信号是相对于第一语句语音信号和第二语句语音信号而言只有噪声的信号;
其特征在于,所述在多个不同的时间段进行信号谱分析包括:
在t1时刻和t1+T1时刻分别采集语音信号的两个帧,t1+T1在所述静默信号之前;
对两个语音信号帧进行小波变换,得到两个帧信号小波F1和F2;
根据下式取F1和F2的公共门槛能量Q1和Q2:
Figure FDA0002975924920000011
Figure FDA0002975924920000012
p为采集语音信号时的捕获窗口长度;
计算Q1和Q2的协方差矩阵,并对协方差矩阵进行能量谱分解,得到特征值A和特征向量A’,A’阶数为i;
在t2时刻,以及在t2+T2时刻分别采集语音信号的两个帧,所述t2时刻在t1至t1+T1时刻之间,从t1至t2+T2小于第一语句语音信号的时间;
对两个语音信号帧进行小波变换,得到两个帧信号小波G1和G2;
根据下式取G1和G2的公共门槛能量R1和R2:
Figure FDA0002975924920000021
Figure FDA0002975924920000022
p为采集语音信号时的捕获窗口长度;
计算R1和R2的协方差矩阵,并对协方差矩阵进行能量谱分解,得到特征值B和特征向量B’,B’阶数为j;
Ma和Mb分别为i×i阶的矩阵和i×j阶的矩阵;
在t3时刻,以及在t3+T3时刻分别采集语音信号的两个帧,所述t3时刻在t2+T2时刻之后、t3+T3在t4之前,即从t3到t3+T3这段时间包括一部分所述静默信号和一部分所述第二语句语音信号;
对两个语音信号帧进行希尔伯特变换,得到两个帧信号谱函数为H1和H2,能量谱比率K;
设C=[A”,B”],A”为A’转置矩阵,B”为B’转置矩阵,则对于所述语音信号的增益函数为:
Figure FDA0002975924920000023
2.根据权利要求1所述的语音信号的降噪方法,其特征在于,所述根据所述谱分析得到的增益函数对语音信号降噪包括:
将语音信号的谱函数与所述增益函数的谱函数相乘,得到降噪后的语音信号的谱函数。
CN201810068643.8A 2018-01-24 2018-01-24 一种语音信号的降噪方法 Active CN108281154B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810068643.8A CN108281154B (zh) 2018-01-24 2018-01-24 一种语音信号的降噪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810068643.8A CN108281154B (zh) 2018-01-24 2018-01-24 一种语音信号的降噪方法

Publications (2)

Publication Number Publication Date
CN108281154A CN108281154A (zh) 2018-07-13
CN108281154B true CN108281154B (zh) 2021-05-18

Family

ID=62804940

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810068643.8A Active CN108281154B (zh) 2018-01-24 2018-01-24 一种语音信号的降噪方法

Country Status (1)

Country Link
CN (1) CN108281154B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103489454A (zh) * 2013-09-22 2014-01-01 浙江大学 基于波形形态特征聚类的语音端点检测方法
CN105679330A (zh) * 2016-03-16 2016-06-15 南京工程学院 基于改进子带信噪比估计的数字助听器降噪方法
CN106328155A (zh) * 2016-09-13 2017-01-11 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种修正先验信噪比过估计的语音增强方法
CN108831493A (zh) * 2018-05-21 2018-11-16 北京捷通华声科技股份有限公司 一种音频处理方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10468036B2 (en) * 2014-04-30 2019-11-05 Accusonus, Inc. Methods and systems for processing and mixing signals using signal decomposition

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103489454A (zh) * 2013-09-22 2014-01-01 浙江大学 基于波形形态特征聚类的语音端点检测方法
CN105679330A (zh) * 2016-03-16 2016-06-15 南京工程学院 基于改进子带信噪比估计的数字助听器降噪方法
CN106328155A (zh) * 2016-09-13 2017-01-11 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种修正先验信噪比过估计的语音增强方法
CN108831493A (zh) * 2018-05-21 2018-11-16 北京捷通华声科技股份有限公司 一种音频处理方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于改进小波阈值和EMD的语音去噪方法;李洋等;《计算机工程与设计》;20140716;第35卷(第7期);第2463-2464页 *

Also Published As

Publication number Publication date
CN108281154A (zh) 2018-07-13

Similar Documents

Publication Publication Date Title
CN106782584B (zh) 音频信号处理设备、方法和电子设备
CN102164328B (zh) 一种用于家庭环境的基于传声器阵列的音频输入系统
US9197974B1 (en) Directional audio capture adaptation based on alternative sensory input
KR20130084298A (ko) 원거리 다중 음원 추적 및 분리 시스템, 방법, 장치 및 컴퓨터-판독가능 매체
CN110223708B (zh) 基于语音处理的语音增强方法及相关设备
CN108109617A (zh) 一种远距离拾音方法
CN205249484U (zh) 一种麦克风线性阵列增强指向性拾音器
CN110875056B (zh) 语音转录设备、系统、方法、及电子设备
CN107124647A (zh) 一种全景视频录制时自动生成字幕文件的方法及装置
CN107863099A (zh) 一种新型双麦克风语音检测和增强方法
US12051429B2 (en) Transform ambisonic coefficients using an adaptive network for preserving spatial direction
CN105575403A (zh) 一种融合听觉掩蔽与双耳信号帧的互相关声源定位方法
CN115359804B (zh) 一种基于麦克风阵列的定向音频拾取方法和系统
CN112786064A (zh) 一种端到端的骨气导语音联合增强方法
Ganguly et al. Real-time smartphone application for improving spatial awareness of hearing assistive devices
CN115482830A (zh) 语音增强方法及相关设备
WO2023108864A1 (zh) 小型麦克风阵列设备的区域拾音方法及系统
CN108257607B (zh) 一种多通道语音信号处理方法
CN108281154B (zh) 一种语音信号的降噪方法
CN108133711B (zh) 具有降噪模块的数字信号监测设备
CN111009259B (zh) 一种音频处理方法和装置
CN115376534A (zh) 一种麦克风阵列音频的处理方法及拾音胸牌
CN113782046A (zh) 一种用于远距离语音识别的麦克风阵列拾音方法及系统
Meutzner et al. Binaural signal processing for enhanced speech recognition robustness in complex listening environments
CN112533120B (zh) 基于带噪语音信号幅度谱动态压缩的波束形成方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant