CN113593599A - 一种去除语音信号中噪声信号的方法 - Google Patents

一种去除语音信号中噪声信号的方法 Download PDF

Info

Publication number
CN113593599A
CN113593599A CN202111028183.4A CN202111028183A CN113593599A CN 113593599 A CN113593599 A CN 113593599A CN 202111028183 A CN202111028183 A CN 202111028183A CN 113593599 A CN113593599 A CN 113593599A
Authority
CN
China
Prior art keywords
frame
noise
signal
power spectrum
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111028183.4A
Other languages
English (en)
Inventor
陈天
李建新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yundie Zhixue Technology Co ltd
Original Assignee
Beijing Yundie Zhixue Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yundie Zhixue Technology Co ltd filed Critical Beijing Yundie Zhixue Technology Co ltd
Priority to CN202111028183.4A priority Critical patent/CN113593599A/zh
Publication of CN113593599A publication Critical patent/CN113593599A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/87Detection of discrete points within a voice signal

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明实施例涉及一种去除语音信号中噪声信号的方法,包括:对含噪语音信号进行分帧处理和傅里叶变换,得到各帧含噪语音信号的频谱;根据频谱,对各帧含噪语音信号进行端点检测,将各帧含噪语音信号区分为语音帧和噪声数据帧;分别对语音帧和噪声数据帧进行噪声估计,得到语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值;对语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值进行融合,得到噪声功率谱估计融合值;根据噪声功率谱估计融合值,确定先验信噪比;根据先验信噪比,确定维纳滤波增益函数;根据维纳滤波增益函数对含噪语音信号进行增益处理,得到去噪语音信号。

Description

一种去除语音信号中噪声信号的方法
技术领域
本发明涉及语音信号领域,尤其涉及一种去除语音信号中噪声信号的方法。
背景技术
在语音通信过程中,往往会有各种噪声干扰使得语音质量下降。语音处理设备在对语音进行获取或处理的过程中,不可避免地会受到环境噪声或其他讲话者的干扰。
噪声的存在会严重破坏语音信号原有的模型参数和声学特性,导致语音处理系统服务质量的降低,而且会影响系统输出语音的可懂程度。去除语音信号中的噪声信号对提高语音质量非常重要,传统的去除语音信号中噪声信号的方法是使用端点检测技术判别语音是否出现,将含噪语音分为语音区和噪声区(即无声段),噪声区部分主要表现为噪声特性,然后在噪声区通过某种统计方法,获得背景噪声特性的近似估计。这种方法,在噪声是平稳的、加性的情况下可行,然而,在非平稳噪声和乘性噪声(如回音噪声等)环境下,语音区的噪声与噪声区的噪声存在区别,仅根据噪声区噪声的估计结果对整体语音信号进行去噪处理,最终效果不佳。
发明内容
本发明的目的是提供一种去除语音信号中噪声信号的方法,分别对语音帧和噪声数据帧进行噪音估计,根据语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值的综合结果确定维纳滤波增益函数,在去除语音信号中噪声信号的过程中,依据上述维纳滤波增益函数对含噪语音信号进行去噪处理,进而提升语音去噪效果。
为实现上述目的,第一方面,本发明提供了一种去除语音信号中噪声信号的方法,包括:
对含噪语音信号进行分帧处理和傅里叶变换,得到各帧含噪语音信号的频谱;
根据所述频谱,对各帧含噪语音信号进行端点检测,将所述各帧含噪语音信号区分为语音帧和噪声数据帧;
分别对所述语音帧和噪声数据帧进行噪声估计,得到语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值;
对所述语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值进行融合,得到噪声功率谱估计融合值;
根据所述噪声功率谱估计融合值,确定先验信噪比;
根据所述先验信噪比,确定维纳滤波增益函数;
根据所述维纳滤波增益函数对所述含噪语音信号进行增益处理,得到去噪语音信号。
优选的,在所述对所述各帧含噪语音信号的频谱进行端点检测之前,所述方法还包括:
获取多个语音训练数据和噪声训练数据,提取各个所述语音训练数据的梅尔频率倒谱系数和各个所述噪声训练数据的梅尔频率倒谱系数;
根据最大期望算法对所述语音训练数据的梅尔频率倒谱系数进行数据处理,生成语音帧的模型;
根据最大期望算法对所述噪声训练数据的梅尔频率倒谱系数进行数据处理,生成噪声数据帧的模型。
进一步优选的,所述根据所述频谱,对各帧含噪语音信号进行端点检测,将所述各帧含噪语音信号区分为语音帧和噪声数据帧具体为:
根据所述频谱,提取各帧含噪语音信号的梅尔频率倒谱系数;
根据所述各帧含噪语音信号的梅尔频率倒谱系数与所述语音帧的模型和噪声数据帧的模型,对所述各帧含噪语音信号进行类别判断,将所述各帧含噪语音信号区分为语音帧和噪声数据帧。
优选的,所述语音帧噪声功率谱估计值λDs(i,k)由如下公式得出:
λDs(i,k)=Quantiles(X(i,k)2)i=0,1,2,3,…,J;
所述噪声数据帧噪声功率谱估计值λDn(i,k)由如下公式得出:
λDn(i,k)=a×X(i,k)2+(1-a)×Quantiles(X(i,k)2)i=0,1,2,3,…,J;
其中,J表示总帧数;X(i,k)表示第i帧第k个频点的频谱分量;Quantiles()表示取分位数;a表示权重系数。
进一步优选的,所述噪声功率谱估计融合值λmix(i,k)由如下公式得出:
Figure BDA0003244119770000031
其中,λD(i,k)具体为所述语音帧噪声功率谱估计值λDs(i,k)或噪声数据帧噪声功率谱估计值λDn(i,k);L表示噪声平滑区间长度。
优选的,所述根据所述噪声功率谱估计融合值,确定先验信噪比具体为:
首先根据如下公式,确定后验信噪比:
Figure BDA0003244119770000032
其中,X(i,k)表示第i帧第k个频点的频谱分量;λmix(i,k)表示第i帧第k个频点的所述噪声功率谱估计融合值;
根据所述后验信噪比,按照如下公式,确定先验信噪比:
Figure BDA0003244119770000033
其中,γ(i,k)表示第i帧第k个频点的所述后验信噪比;max[]表示取最大值;λmix(i,k)表示第i帧第k个频点的所述噪声功率谱估计融合值;β为固定因子;g(i-1,k)表示第i-1帧第k个频点的维纳抑制因子,并且
Figure BDA0003244119770000041
优选的,所述根据所述先验信噪比,确定维纳滤波增益函数具体为:
Figure BDA0003244119770000042
其中,ζ(i,k)表示第i帧第k个频点的所述先验信噪比。
第二方面,本发明还提供了一种语音去噪装置,包括存储器和处理器,其特征在于,所述存储器用于存储程序,所述处理器用于执行第一方面及第一方面的各实现方式中的方法。
第三方面,本发明还提供了一种包含指令的程序产品,当所述程序产品在语音去噪装置上运行时,使得所述语音去噪装置执行第一方面及第一方面的各实现方式中的方法。
第四方面,本发明还提供了一种可读存储介质,所述可读存储介质上存储有程序,所述程序被处理器执行时实现第一方面及第一方面的各实现方式中的方法。
本发明实施例提供的去除语音信号中噪声信号的方法,分别对语音帧和噪声数据帧进行噪音估计,根据语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值的综合结果确定先验信噪比和维纳滤波增益函数,在去除语音信号中噪声信号的过程中,依据上述维纳滤波增益函数对含噪语音信号进行去噪处理,进而能够提升语音去噪效果。
附图说明
图1为本发明实施例1提供的去除语音信号中噪声信号的方法流程图。
具体实施方式
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
本发明实施例中的终端设备是指具有数据处理能力的智能手机、平板电脑、台式电脑等设备。
图1为本发明实施例1提供的去除语音信号中噪声信号的方法流程图,以下结合图1所示,对本发明实施例1提供的去除语音信号中噪声信号的方法进行说明。
本发明实施例1提供的去除语音信号中噪声信号的方法包括如下步骤:
步骤110,对含噪语音信号进行分帧处理和傅里叶变换,得到各帧含噪语音信号的频谱。
具体的,终端设备接收到的语音信号为受到噪声干扰后形成的时域含噪语音信号,可以是通话时候的语音信号,例如,视频聊天时的对讲语音信号或聊天应用中发送传输的语音信号等。这些语音信号是在正常的生活环境中录制的,难以避免会受到例如,别人的讲话声、车辆鸣笛声、语音免提通信时扬声器的残余回声等噪声的干扰,这些噪声会降低语音的质量。
终端设备接收到的时域含噪语音信号是时间和幅度都连续变化的一维模拟信号,为了对其进行数字处理,首先需要将模拟信号转换为数字信号。在将模拟信号转化为数字信号的过程中,需要进行采样和量化,最终得到时间和幅度上的离散的数字信号。为使采样过程中不丢失信息,采样频率应在原始信号频率的两倍以上,由于人的正常发音在40Hz至3400Hz,所以采样频率应在6800Hz以上。
时域含噪语音信号是短时平稳信号,为了对其进行处理,还需对采样后的时域含噪语音信号进行分帧处理,以便把每一帧当成平稳信号处理。同时为了减少帧与帧之间的变化,相邻帧之间取重叠。其中具体可以采用添加汉明窗或矩形窗等窗函数的方式进行分帧处理,采用固定窗长的汉明窗或矩形窗等截取采样后的时域含噪语音信号得到一帧时域含噪语音信号,然后汉明窗或矩形窗等移动一定长度,生成下一帧时域含噪语音信号。
对分帧后的时域含噪语音信号进行傅里叶变换,得到每一帧含噪语音信号的频谱,即,将时域含噪语音信号转换为频域含噪语音信号。
步骤120,根据频谱,对各帧含噪语音信号进行端点检测,将各帧含噪语音信号区分为语音帧和噪声数据帧。
具体的,每一帧含噪语音信号的频谱均包含多个采样点,例如1024个采样点,根据频谱可以确定每个采样点的幅度和相位。
对每一帧含噪语音信号进行端点检测,具体可以采用门限判别类算法和模型匹配类算法等进行端点检测,以判断各帧含噪语音信号是语音帧还是噪声数据帧。
在一个具体的例子中,利用基于混合高斯模型的模型匹配类算法进行端点检测。在对含噪语音信号进行端点检测之前,预先确定语音帧的模型和噪声数据帧的模型,以用于对含噪语音信号进行匹配。其中,语音帧的模型和噪声数据帧的模型是基于大量的各种语音训练数据和大量的各种噪声训练数据生成的,语音训练数据是各种受噪声干扰后的语音的数据,噪声训练数据是包括周围人的讲话声和扬声器播放的语音的残余回声等噪声的数据。首先提取各个语音训练数据的梅尔频率倒谱系数和各个噪声训练数据的梅尔频率倒谱系数,然后利用最大期望算法对语音训练数据的梅尔频率倒谱系数和噪声训练数据的梅尔频率倒谱系数分别进行处理,生成语音帧的模型和噪声数据帧的模型。
在前面所述的具体例子中,将每一帧含噪语音信号的梅尔频率倒谱系数分别带入语音帧的模型和噪声数据帧的模型进行计算,得出每个模型的输出概率,若语音帧的模型的输出概率更大,则认为被检测的含噪语音信号为语音帧,若噪声数据帧的的模型的输出概率更大,则认为被检测的含噪语音信号为噪声数据帧。
前述的每一帧含噪语音信号的梅尔频率倒谱系数可以根据如下方法获取:根据含噪语音信号的频谱,计算得到功率谱,将功率谱用一组三角形帯通滤波器进行滤波,得到一组滤波系数。对得到的滤波系数进行如下式1的M阶余弦变换,去除各维含噪语音信号之间的相关性,将含噪语音信号映射到低维空间,得到梅尔频率倒谱系数:
Figure BDA0003244119770000071
其中,c(m)是梅尔频率倒谱系数第m维特征参数,S(n)表示第n个三角形帯通滤波器的滤波器系数,M指梅尔频率倒谱系数阶数。
步骤130,分别对语音帧和噪声数据帧进行噪声估计,得到语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值。
具体的,可采用分位数算法、加权算法和最小值追踪算法等噪声估计算法对每一帧语音帧和噪声数据帧进行噪声估计,得到语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值。
在一个具体的例子中,用分位数算法进行噪声估计,语音帧的语音帧噪声功率谱估计值λDs(i,k)根据下式2得出:
λDs(i,k)=Quantiles(X(i,k)2) i=0,1,2,3,…,J; (式2)
其中,J表示总帧数;i表示语音帧的帧号,i的具体值由步骤120的检测结果确定;X(i,k)表示第i帧第k个频点的频谱分量;Quantiles()表示取分位数,优选的,取0.5;λDs(i,k)具体是第i帧第k个频点的语音帧噪声功率谱估计值。
噪声数据帧的噪声数据帧噪声功率谱估计值λDn(i,k),根据如下式3得出:
λDn(i,k)=a×X(i,k)2+(1-a)×Quantiles(X(i,k)2)i=0,1,2,3,…,J;(式3)
其中,J表示总帧数;i表示噪声数据帧的帧号,i的具体值由步骤120的检测结果确定;a表示权重系数,优选的,取0.8;X(i,k)表示第i帧第k个频点的频谱分量,Quantiles()表示取分位数,优选的,取0.5;λDn(i,k)具体是第i帧第k个频点的噪声数据帧噪声功率谱估计值。
步骤140,对语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值进行融合,得到噪声功率谱估计融合值。
具体的,可以根据如下式4对语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值进行融合,得到噪声功率谱估计融合值λmix(i,k):
Figure BDA0003244119770000081
其中,λD(i,k)具体为语音帧噪声功率谱估计值λDs(i,k)或噪声数据帧噪声功率谱估计值λDn(i,k);L表示噪声平滑区间长度,优选的,取9帧;λmix(i,k)具体是第i帧第k个频点的噪声功率谱估计融合值。
步骤150,根据噪声功率谱估计融合值,确定先验信噪比。
具体的,可以首先根据如下式5,确定后验信噪比:
Figure BDA0003244119770000082
其中,X(i,k)表示第i帧第k个频点的频谱分量;λmix(i,k)表示第i帧第k个频点的噪声功率谱估计融合值;γ(i,k)具体是第i帧第k个频点的后验信噪比。
根据后验信噪比,按照如下式6,确定先验信噪比:
Figure BDA0003244119770000083
其中,γ(i,k)表示第i帧第k个频点的后验信噪比;γ(i-1,k)表示第i-1帧第k个频点的后验信噪比;max[]表示取最大值;λmix(i,k)表示第i帧第k个频点的噪声功率谱估计融合值;β为固定因子,优选的,β取0.9~0.98;g(i-1,k)表示第i-1帧第k个频点的维纳抑制因子,并且
Figure BDA0003244119770000084
步骤160,根据先验信噪比,确定维纳滤波增益函数。
具体的,根据先验信噪比,可以按照如下式7,确定维纳滤波增益函数:
Figure BDA0003244119770000085
其中,ζ(i,k)表示第i帧第k个频点的先验信噪比。
步骤170,根据维纳滤波增益函数对含噪语音信号进行增益处理,得到去噪语音信号。
具体的,在确定维纳滤波增益函数后,用维纳滤波法对各帧含噪语音信号进行增益处理,得到频域去噪语音信号。
进一步的,可以对频域去噪语音信号进行反傅里叶变换,得到时域去噪语音信号。
本发明实施例1提供的去除语音信号中噪声信号的方法,分别对语音帧和噪声数据帧进行噪音估计,根据语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值的综合结果确定先验信噪比和维纳滤波增益函数,在去除语音信号中噪声信号的过程中,依据上述维纳滤波增益函数对含噪语音信号进行去噪处理,进而提升语音去噪效果。
需要说明的是,本发明实施例2提供了一种语音去噪装置,该装置包括存储器和处理器,存储器可通过总线与处理器连接。存储器可以是非易失存储器,例如硬盘驱动器和闪存,存储器中存储有软件程序和装置驱动程序。软件程序能够执行本发明实施例1提供的上述方法的各种功能;装置驱动程序可以是网络和接口驱动程序。处理器用于执行软件程序,该软件程序被执行时,能够实现本发明实施例1提供的去除语音信号中噪声信号的方法。
本发明实施例3提供了一种包含指令的程序产品,当该程序产品在语音去噪装置上运行时,使得语音去噪装置执行上述实施例1中的去除语音信号中噪声信号的方法。
本发明实施例4提供了一种可读存储介质,该可读存储介质上存储有程序,该程序被处理器执行时,能够实现本发明实施例1提供的去除语音信号中噪声信号的方法。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种去除语音信号中噪声信号的方法,其特征在于,所述方法包括:
对含噪语音信号进行分帧处理和傅里叶变换,得到各帧含噪语音信号的频谱;
根据所述频谱,对各帧含噪语音信号进行端点检测,将所述各帧含噪语音信号区分为语音帧和噪声数据帧;
分别对所述语音帧和噪声数据帧进行噪声估计,得到语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值;
对所述语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值进行融合,得到噪声功率谱估计融合值;
根据所述噪声功率谱估计融合值,确定先验信噪比;
根据所述先验信噪比,确定维纳滤波增益函数;
根据所述维纳滤波增益函数对所述含噪语音信号进行增益处理,得到去噪语音信号。
2.根据权利要求1所述的去除语音信号中噪声信号的方法,其特征在于,在所述对所述各帧含噪语音信号的频谱进行端点检测之前,所述方法还包括:
获取多个语音训练数据和噪声训练数据,提取各个所述语音训练数据的梅尔频率倒谱系数和各个所述噪声训练数据的梅尔频率倒谱系数;
根据最大期望算法对所述语音训练数据的梅尔频率倒谱系数进行数据处理,生成语音帧的模型;
根据最大期望算法对所述噪声训练数据的梅尔频率倒谱系数进行数据处理,生成噪声数据帧的模型。
3.根据权利要求2所述的去除语音信号中噪声信号的方法,其特征在于,所述根据所述频谱,对各帧含噪语音信号进行端点检测,将所述各帧含噪语音信号区分为语音帧和噪声数据帧具体为:
根据所述频谱,提取各帧含噪语音信号的梅尔频率倒谱系数;
根据所述各帧含噪语音信号的梅尔频率倒谱系数与所述语音帧的模型和噪声数据帧的模型,对所述各帧含噪语音信号进行类别判断,将所述各帧含噪语音信号区分为语音帧和噪声数据帧。
4.根据权利要求1所述的去除语音信号中噪声信号的方法,其特征在于,所述语音帧噪声功率谱估计值λDs(i,k)由如下公式得出:
λDs(i,k)=Quantiles(X(i,k)2)i=0,1,2,3,…,J;
所述噪声数据帧噪声功率谱估计值λDn(i,k)由如下公式得出:
λDn(i,k)=a×X(i,k)2+(1-a)×Quantiles(X(i,k)2)i=0,1,2,3,…,J;
其中,J表示总帧数;X(i,k)表示第i帧第k个频点的频谱分量;Quantiles()表示取分位数;a表示权重系数。
5.根据权利要求4所述的去除语音信号中噪声信号的方法,其特征在于,所述噪声功率谱估计融合值λmix(i,k)由如下公式得出:
Figure FDA0003244119760000021
其中,λD(i,k)具体为所述语音帧噪声功率谱估计值λDs(i,k)或噪声数据帧噪声功率谱估计值λDn(i,k);L表示噪声平滑区间长度。
6.根据权利要求1所述的去除语音信号中噪声信号的方法,其特征在于,所述根据所述噪声功率谱估计融合值,确定先验信噪比具体为:
首先根据如下公式,确定后验信噪比:
Figure FDA0003244119760000022
其中,X(i,k)表示第i帧第k个频点的频谱分量;λmix(i,k)表示第i帧第k个频点的所述噪声功率谱估计融合值;
根据所述后验信噪比,按照如下公式,确定先验信噪比:
Figure FDA0003244119760000023
其中,γ(i,k)表示第i帧第k个频点的所述后验信噪比;max[]表示取最大值;λmix(i,k)表示第i帧第k个频点的所述噪声功率谱估计融合值;β为固定因子;g(i-1,k)表示第i-1帧第k个频点的维纳抑制因子,并且
Figure FDA0003244119760000031
7.根据权利要求1或6所述的去除语音信号中噪声信号的方法,其特征在于,所述根据所述先验信噪比,确定维纳滤波增益函数具体为:
Figure FDA0003244119760000032
其中,ζ(i,k)表示第i帧第k个频点的所述先验信噪比。
8.一种语音去噪装置,包括存储器和处理器,其特征在于,所述存储器用于存储程序,所述处理器用于执行如权利要求1-7任一项所述的去除语音信号中噪声信号的方法。
9.一种包含指令的程序产品,其特征在于,当所述程序产品在语音去噪装置上运行时,使得所述语音去噪装置执行如权利要求1-7任一权利要求所述的去除语音信号中噪声信号的方法。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有程序,所述程序被处理器执行时实现如权利要求1-7任一权利要求所述的去除语音信号中噪声信号的方法。
CN202111028183.4A 2021-09-02 2021-09-02 一种去除语音信号中噪声信号的方法 Pending CN113593599A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111028183.4A CN113593599A (zh) 2021-09-02 2021-09-02 一种去除语音信号中噪声信号的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111028183.4A CN113593599A (zh) 2021-09-02 2021-09-02 一种去除语音信号中噪声信号的方法

Publications (1)

Publication Number Publication Date
CN113593599A true CN113593599A (zh) 2021-11-02

Family

ID=78241053

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111028183.4A Pending CN113593599A (zh) 2021-09-02 2021-09-02 一种去除语音信号中噪声信号的方法

Country Status (1)

Country Link
CN (1) CN113593599A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116580723A (zh) * 2023-07-13 2023-08-11 合肥星本本网络科技有限公司 一种强噪声环境下的语音检测方法和系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110024969A (ko) * 2009-09-03 2011-03-09 한국전자통신연구원 음성신호에서 통계적 모델을 이용한 잡음 제거 장치 및 방법
CN102097095A (zh) * 2010-12-28 2011-06-15 天津市亚安科技电子有限公司 一种语音端点检测方法及装置
CN103247293A (zh) * 2013-05-14 2013-08-14 中国科学院自动化研究所 一种语音数据的编码及解码方法
CN103646649A (zh) * 2013-12-30 2014-03-19 中国科学院自动化研究所 一种高效的语音检测方法
CN106486131A (zh) * 2016-10-14 2017-03-08 上海谦问万答吧云计算科技有限公司 一种语音去噪的方法及装置
WO2020107269A1 (zh) * 2018-11-28 2020-06-04 深圳市汇顶科技股份有限公司 自适应语音增强方法和电子设备
CN112116909A (zh) * 2019-06-20 2020-12-22 杭州海康威视数字技术股份有限公司 语音识别方法、装置及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110024969A (ko) * 2009-09-03 2011-03-09 한국전자통신연구원 음성신호에서 통계적 모델을 이용한 잡음 제거 장치 및 방법
CN102097095A (zh) * 2010-12-28 2011-06-15 天津市亚安科技电子有限公司 一种语音端点检测方法及装置
CN103247293A (zh) * 2013-05-14 2013-08-14 中国科学院自动化研究所 一种语音数据的编码及解码方法
CN103646649A (zh) * 2013-12-30 2014-03-19 中国科学院自动化研究所 一种高效的语音检测方法
CN106486131A (zh) * 2016-10-14 2017-03-08 上海谦问万答吧云计算科技有限公司 一种语音去噪的方法及装置
WO2020107269A1 (zh) * 2018-11-28 2020-06-04 深圳市汇顶科技股份有限公司 自适应语音增强方法和电子设备
CN112116909A (zh) * 2019-06-20 2020-12-22 杭州海康威视数字技术股份有限公司 语音识别方法、装置及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116580723A (zh) * 2023-07-13 2023-08-11 合肥星本本网络科技有限公司 一种强噪声环境下的语音检测方法和系统
CN116580723B (zh) * 2023-07-13 2023-09-08 合肥星本本网络科技有限公司 一种强噪声环境下的语音检测方法和系统

Similar Documents

Publication Publication Date Title
US10650796B2 (en) Single-channel, binaural and multi-channel dereverberation
US8010355B2 (en) Low complexity noise reduction method
JP3484757B2 (ja) 音声信号の雑音低減方法及び雑音区間検出方法
US9343056B1 (en) Wind noise detection and suppression
EP2031583B1 (en) Fast estimation of spectral noise power density for speech signal enhancement
US8571231B2 (en) Suppressing noise in an audio signal
US7313518B2 (en) Noise reduction method and device using two pass filtering
CN111554315B (zh) 单通道语音增强方法及装置、存储介质、终端
CN106463106B (zh) 用于音频接收的风噪声降低
JP2003534570A (ja) 適応ビームフォーマーにおいてノイズを抑制する方法
JP2002541753A (ja) 固定フィルタを用いた時間領域スペクトラル減算による信号雑音の低減
CN110782914B (zh) 信号处理方法、装置、终端设备及存储介质
EP2346032A1 (en) Noise suppression device and audio decoding device
US20200286501A1 (en) Apparatus and a method for signal enhancement
Soon et al. Wavelet for speech denoising
JP3459363B2 (ja) 雑音低減処理方法、その装置及びプログラム記憶媒体
CN113539285A (zh) 音频信号降噪方法、电子装置和存储介质
CN110556125A (zh) 基于语音信号的特征提取方法、设备及计算机存储介质
JP2014513320A (ja) オーディオ信号におけるドミナント周波数を減衰する方法及び装置
JP4965891B2 (ja) 信号処理装置およびその方法
CN113593599A (zh) 一种去除语音信号中噪声信号的方法
CN112669869B (zh) 噪声抑制方法、设备、装置及存储介质
CN112165558B (zh) 一种双讲状态检测方法、装置、存储介质及终端设备
CN111226278B (zh) 低复杂度的浊音语音检测和基音估计
Yang et al. Environment-Aware Reconfigurable Noise Suppression

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: Room 1002, floor 10, block B, No. 18, Zhongguancun Street, Haidian District, Beijing 100044

Applicant after: Beijing Biyun shuchuang Technology Co.,Ltd.

Address before: Room 1002, floor 10, block B, No. 18, Zhongguancun Street, Haidian District, Beijing 100044

Applicant before: Beijing yundie Zhixue Technology Co.,Ltd.

CB02 Change of applicant information