CN113593599A - 一种去除语音信号中噪声信号的方法 - Google Patents
一种去除语音信号中噪声信号的方法 Download PDFInfo
- Publication number
- CN113593599A CN113593599A CN202111028183.4A CN202111028183A CN113593599A CN 113593599 A CN113593599 A CN 113593599A CN 202111028183 A CN202111028183 A CN 202111028183A CN 113593599 A CN113593599 A CN 113593599A
- Authority
- CN
- China
- Prior art keywords
- frame
- noise
- signal
- power spectrum
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000001228 spectrum Methods 0.000 claims abstract description 88
- 238000012545 processing Methods 0.000 claims abstract description 25
- 238000001514 detection method Methods 0.000 claims abstract description 15
- 230000004927 fusion Effects 0.000 claims abstract description 15
- 238000009432 framing Methods 0.000 claims abstract description 6
- 238000001914 filtration Methods 0.000 claims abstract description 5
- 238000012549 training Methods 0.000 claims description 20
- 230000006870 function Effects 0.000 claims description 18
- 238000004422 calculation algorithm Methods 0.000 claims description 15
- 238000009499 grossing Methods 0.000 claims description 3
- 230000001629 suppression Effects 0.000 claims description 3
- 239000000203 mixture Substances 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000005070 sampling Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/24—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/87—Detection of discrete points within a voice signal
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明实施例涉及一种去除语音信号中噪声信号的方法,包括:对含噪语音信号进行分帧处理和傅里叶变换,得到各帧含噪语音信号的频谱;根据频谱,对各帧含噪语音信号进行端点检测,将各帧含噪语音信号区分为语音帧和噪声数据帧;分别对语音帧和噪声数据帧进行噪声估计,得到语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值;对语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值进行融合,得到噪声功率谱估计融合值;根据噪声功率谱估计融合值,确定先验信噪比;根据先验信噪比,确定维纳滤波增益函数;根据维纳滤波增益函数对含噪语音信号进行增益处理,得到去噪语音信号。
Description
技术领域
本发明涉及语音信号领域,尤其涉及一种去除语音信号中噪声信号的方法。
背景技术
在语音通信过程中,往往会有各种噪声干扰使得语音质量下降。语音处理设备在对语音进行获取或处理的过程中,不可避免地会受到环境噪声或其他讲话者的干扰。
噪声的存在会严重破坏语音信号原有的模型参数和声学特性,导致语音处理系统服务质量的降低,而且会影响系统输出语音的可懂程度。去除语音信号中的噪声信号对提高语音质量非常重要,传统的去除语音信号中噪声信号的方法是使用端点检测技术判别语音是否出现,将含噪语音分为语音区和噪声区(即无声段),噪声区部分主要表现为噪声特性,然后在噪声区通过某种统计方法,获得背景噪声特性的近似估计。这种方法,在噪声是平稳的、加性的情况下可行,然而,在非平稳噪声和乘性噪声(如回音噪声等)环境下,语音区的噪声与噪声区的噪声存在区别,仅根据噪声区噪声的估计结果对整体语音信号进行去噪处理,最终效果不佳。
发明内容
本发明的目的是提供一种去除语音信号中噪声信号的方法,分别对语音帧和噪声数据帧进行噪音估计,根据语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值的综合结果确定维纳滤波增益函数,在去除语音信号中噪声信号的过程中,依据上述维纳滤波增益函数对含噪语音信号进行去噪处理,进而提升语音去噪效果。
为实现上述目的,第一方面,本发明提供了一种去除语音信号中噪声信号的方法,包括:
对含噪语音信号进行分帧处理和傅里叶变换,得到各帧含噪语音信号的频谱;
根据所述频谱,对各帧含噪语音信号进行端点检测,将所述各帧含噪语音信号区分为语音帧和噪声数据帧;
分别对所述语音帧和噪声数据帧进行噪声估计,得到语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值;
对所述语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值进行融合,得到噪声功率谱估计融合值;
根据所述噪声功率谱估计融合值,确定先验信噪比;
根据所述先验信噪比,确定维纳滤波增益函数;
根据所述维纳滤波增益函数对所述含噪语音信号进行增益处理,得到去噪语音信号。
优选的,在所述对所述各帧含噪语音信号的频谱进行端点检测之前,所述方法还包括:
获取多个语音训练数据和噪声训练数据,提取各个所述语音训练数据的梅尔频率倒谱系数和各个所述噪声训练数据的梅尔频率倒谱系数;
根据最大期望算法对所述语音训练数据的梅尔频率倒谱系数进行数据处理,生成语音帧的模型;
根据最大期望算法对所述噪声训练数据的梅尔频率倒谱系数进行数据处理,生成噪声数据帧的模型。
进一步优选的,所述根据所述频谱,对各帧含噪语音信号进行端点检测,将所述各帧含噪语音信号区分为语音帧和噪声数据帧具体为:
根据所述频谱,提取各帧含噪语音信号的梅尔频率倒谱系数;
根据所述各帧含噪语音信号的梅尔频率倒谱系数与所述语音帧的模型和噪声数据帧的模型,对所述各帧含噪语音信号进行类别判断,将所述各帧含噪语音信号区分为语音帧和噪声数据帧。
优选的,所述语音帧噪声功率谱估计值λDs(i,k)由如下公式得出:
λDs(i,k)=Quantiles(X(i,k)2)i=0,1,2,3,…,J;
所述噪声数据帧噪声功率谱估计值λDn(i,k)由如下公式得出:
λDn(i,k)=a×X(i,k)2+(1-a)×Quantiles(X(i,k)2)i=0,1,2,3,…,J;
其中,J表示总帧数;X(i,k)表示第i帧第k个频点的频谱分量;Quantiles()表示取分位数;a表示权重系数。
进一步优选的,所述噪声功率谱估计融合值λmix(i,k)由如下公式得出:
其中,λD(i,k)具体为所述语音帧噪声功率谱估计值λDs(i,k)或噪声数据帧噪声功率谱估计值λDn(i,k);L表示噪声平滑区间长度。
优选的,所述根据所述噪声功率谱估计融合值,确定先验信噪比具体为:
首先根据如下公式,确定后验信噪比:
其中,X(i,k)表示第i帧第k个频点的频谱分量;λmix(i,k)表示第i帧第k个频点的所述噪声功率谱估计融合值;
根据所述后验信噪比,按照如下公式,确定先验信噪比:
其中,γ(i,k)表示第i帧第k个频点的所述后验信噪比;max[]表示取最大值;λmix(i,k)表示第i帧第k个频点的所述噪声功率谱估计融合值;β为固定因子;g(i-1,k)表示第i-1帧第k个频点的维纳抑制因子,并且
优选的,所述根据所述先验信噪比,确定维纳滤波增益函数具体为:
其中,ζ(i,k)表示第i帧第k个频点的所述先验信噪比。
第二方面,本发明还提供了一种语音去噪装置,包括存储器和处理器,其特征在于,所述存储器用于存储程序,所述处理器用于执行第一方面及第一方面的各实现方式中的方法。
第三方面,本发明还提供了一种包含指令的程序产品,当所述程序产品在语音去噪装置上运行时,使得所述语音去噪装置执行第一方面及第一方面的各实现方式中的方法。
第四方面,本发明还提供了一种可读存储介质,所述可读存储介质上存储有程序,所述程序被处理器执行时实现第一方面及第一方面的各实现方式中的方法。
本发明实施例提供的去除语音信号中噪声信号的方法,分别对语音帧和噪声数据帧进行噪音估计,根据语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值的综合结果确定先验信噪比和维纳滤波增益函数,在去除语音信号中噪声信号的过程中,依据上述维纳滤波增益函数对含噪语音信号进行去噪处理,进而能够提升语音去噪效果。
附图说明
图1为本发明实施例1提供的去除语音信号中噪声信号的方法流程图。
具体实施方式
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
本发明实施例中的终端设备是指具有数据处理能力的智能手机、平板电脑、台式电脑等设备。
图1为本发明实施例1提供的去除语音信号中噪声信号的方法流程图,以下结合图1所示,对本发明实施例1提供的去除语音信号中噪声信号的方法进行说明。
本发明实施例1提供的去除语音信号中噪声信号的方法包括如下步骤:
步骤110,对含噪语音信号进行分帧处理和傅里叶变换,得到各帧含噪语音信号的频谱。
具体的,终端设备接收到的语音信号为受到噪声干扰后形成的时域含噪语音信号,可以是通话时候的语音信号,例如,视频聊天时的对讲语音信号或聊天应用中发送传输的语音信号等。这些语音信号是在正常的生活环境中录制的,难以避免会受到例如,别人的讲话声、车辆鸣笛声、语音免提通信时扬声器的残余回声等噪声的干扰,这些噪声会降低语音的质量。
终端设备接收到的时域含噪语音信号是时间和幅度都连续变化的一维模拟信号,为了对其进行数字处理,首先需要将模拟信号转换为数字信号。在将模拟信号转化为数字信号的过程中,需要进行采样和量化,最终得到时间和幅度上的离散的数字信号。为使采样过程中不丢失信息,采样频率应在原始信号频率的两倍以上,由于人的正常发音在40Hz至3400Hz,所以采样频率应在6800Hz以上。
时域含噪语音信号是短时平稳信号,为了对其进行处理,还需对采样后的时域含噪语音信号进行分帧处理,以便把每一帧当成平稳信号处理。同时为了减少帧与帧之间的变化,相邻帧之间取重叠。其中具体可以采用添加汉明窗或矩形窗等窗函数的方式进行分帧处理,采用固定窗长的汉明窗或矩形窗等截取采样后的时域含噪语音信号得到一帧时域含噪语音信号,然后汉明窗或矩形窗等移动一定长度,生成下一帧时域含噪语音信号。
对分帧后的时域含噪语音信号进行傅里叶变换,得到每一帧含噪语音信号的频谱,即,将时域含噪语音信号转换为频域含噪语音信号。
步骤120,根据频谱,对各帧含噪语音信号进行端点检测,将各帧含噪语音信号区分为语音帧和噪声数据帧。
具体的,每一帧含噪语音信号的频谱均包含多个采样点,例如1024个采样点,根据频谱可以确定每个采样点的幅度和相位。
对每一帧含噪语音信号进行端点检测,具体可以采用门限判别类算法和模型匹配类算法等进行端点检测,以判断各帧含噪语音信号是语音帧还是噪声数据帧。
在一个具体的例子中,利用基于混合高斯模型的模型匹配类算法进行端点检测。在对含噪语音信号进行端点检测之前,预先确定语音帧的模型和噪声数据帧的模型,以用于对含噪语音信号进行匹配。其中,语音帧的模型和噪声数据帧的模型是基于大量的各种语音训练数据和大量的各种噪声训练数据生成的,语音训练数据是各种受噪声干扰后的语音的数据,噪声训练数据是包括周围人的讲话声和扬声器播放的语音的残余回声等噪声的数据。首先提取各个语音训练数据的梅尔频率倒谱系数和各个噪声训练数据的梅尔频率倒谱系数,然后利用最大期望算法对语音训练数据的梅尔频率倒谱系数和噪声训练数据的梅尔频率倒谱系数分别进行处理,生成语音帧的模型和噪声数据帧的模型。
在前面所述的具体例子中,将每一帧含噪语音信号的梅尔频率倒谱系数分别带入语音帧的模型和噪声数据帧的模型进行计算,得出每个模型的输出概率,若语音帧的模型的输出概率更大,则认为被检测的含噪语音信号为语音帧,若噪声数据帧的的模型的输出概率更大,则认为被检测的含噪语音信号为噪声数据帧。
前述的每一帧含噪语音信号的梅尔频率倒谱系数可以根据如下方法获取:根据含噪语音信号的频谱,计算得到功率谱,将功率谱用一组三角形帯通滤波器进行滤波,得到一组滤波系数。对得到的滤波系数进行如下式1的M阶余弦变换,去除各维含噪语音信号之间的相关性,将含噪语音信号映射到低维空间,得到梅尔频率倒谱系数:
其中,c(m)是梅尔频率倒谱系数第m维特征参数,S(n)表示第n个三角形帯通滤波器的滤波器系数,M指梅尔频率倒谱系数阶数。
步骤130,分别对语音帧和噪声数据帧进行噪声估计,得到语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值。
具体的,可采用分位数算法、加权算法和最小值追踪算法等噪声估计算法对每一帧语音帧和噪声数据帧进行噪声估计,得到语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值。
在一个具体的例子中,用分位数算法进行噪声估计,语音帧的语音帧噪声功率谱估计值λDs(i,k)根据下式2得出:
λDs(i,k)=Quantiles(X(i,k)2) i=0,1,2,3,…,J; (式2)
其中,J表示总帧数;i表示语音帧的帧号,i的具体值由步骤120的检测结果确定;X(i,k)表示第i帧第k个频点的频谱分量;Quantiles()表示取分位数,优选的,取0.5;λDs(i,k)具体是第i帧第k个频点的语音帧噪声功率谱估计值。
噪声数据帧的噪声数据帧噪声功率谱估计值λDn(i,k),根据如下式3得出:
λDn(i,k)=a×X(i,k)2+(1-a)×Quantiles(X(i,k)2)i=0,1,2,3,…,J;(式3)
其中,J表示总帧数;i表示噪声数据帧的帧号,i的具体值由步骤120的检测结果确定;a表示权重系数,优选的,取0.8;X(i,k)表示第i帧第k个频点的频谱分量,Quantiles()表示取分位数,优选的,取0.5;λDn(i,k)具体是第i帧第k个频点的噪声数据帧噪声功率谱估计值。
步骤140,对语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值进行融合,得到噪声功率谱估计融合值。
具体的,可以根据如下式4对语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值进行融合,得到噪声功率谱估计融合值λmix(i,k):
其中,λD(i,k)具体为语音帧噪声功率谱估计值λDs(i,k)或噪声数据帧噪声功率谱估计值λDn(i,k);L表示噪声平滑区间长度,优选的,取9帧;λmix(i,k)具体是第i帧第k个频点的噪声功率谱估计融合值。
步骤150,根据噪声功率谱估计融合值,确定先验信噪比。
具体的,可以首先根据如下式5,确定后验信噪比:
其中,X(i,k)表示第i帧第k个频点的频谱分量;λmix(i,k)表示第i帧第k个频点的噪声功率谱估计融合值;γ(i,k)具体是第i帧第k个频点的后验信噪比。
根据后验信噪比,按照如下式6,确定先验信噪比:
其中,γ(i,k)表示第i帧第k个频点的后验信噪比;γ(i-1,k)表示第i-1帧第k个频点的后验信噪比;max[]表示取最大值;λmix(i,k)表示第i帧第k个频点的噪声功率谱估计融合值;β为固定因子,优选的,β取0.9~0.98;g(i-1,k)表示第i-1帧第k个频点的维纳抑制因子,并且
步骤160,根据先验信噪比,确定维纳滤波增益函数。
具体的,根据先验信噪比,可以按照如下式7,确定维纳滤波增益函数:
其中,ζ(i,k)表示第i帧第k个频点的先验信噪比。
步骤170,根据维纳滤波增益函数对含噪语音信号进行增益处理,得到去噪语音信号。
具体的,在确定维纳滤波增益函数后,用维纳滤波法对各帧含噪语音信号进行增益处理,得到频域去噪语音信号。
进一步的,可以对频域去噪语音信号进行反傅里叶变换,得到时域去噪语音信号。
本发明实施例1提供的去除语音信号中噪声信号的方法,分别对语音帧和噪声数据帧进行噪音估计,根据语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值的综合结果确定先验信噪比和维纳滤波增益函数,在去除语音信号中噪声信号的过程中,依据上述维纳滤波增益函数对含噪语音信号进行去噪处理,进而提升语音去噪效果。
需要说明的是,本发明实施例2提供了一种语音去噪装置,该装置包括存储器和处理器,存储器可通过总线与处理器连接。存储器可以是非易失存储器,例如硬盘驱动器和闪存,存储器中存储有软件程序和装置驱动程序。软件程序能够执行本发明实施例1提供的上述方法的各种功能;装置驱动程序可以是网络和接口驱动程序。处理器用于执行软件程序,该软件程序被执行时,能够实现本发明实施例1提供的去除语音信号中噪声信号的方法。
本发明实施例3提供了一种包含指令的程序产品,当该程序产品在语音去噪装置上运行时,使得语音去噪装置执行上述实施例1中的去除语音信号中噪声信号的方法。
本发明实施例4提供了一种可读存储介质,该可读存储介质上存储有程序,该程序被处理器执行时,能够实现本发明实施例1提供的去除语音信号中噪声信号的方法。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种去除语音信号中噪声信号的方法,其特征在于,所述方法包括:
对含噪语音信号进行分帧处理和傅里叶变换,得到各帧含噪语音信号的频谱;
根据所述频谱,对各帧含噪语音信号进行端点检测,将所述各帧含噪语音信号区分为语音帧和噪声数据帧;
分别对所述语音帧和噪声数据帧进行噪声估计,得到语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值;
对所述语音帧噪声功率谱估计值和噪声数据帧噪声功率谱估计值进行融合,得到噪声功率谱估计融合值;
根据所述噪声功率谱估计融合值,确定先验信噪比;
根据所述先验信噪比,确定维纳滤波增益函数;
根据所述维纳滤波增益函数对所述含噪语音信号进行增益处理,得到去噪语音信号。
2.根据权利要求1所述的去除语音信号中噪声信号的方法,其特征在于,在所述对所述各帧含噪语音信号的频谱进行端点检测之前,所述方法还包括:
获取多个语音训练数据和噪声训练数据,提取各个所述语音训练数据的梅尔频率倒谱系数和各个所述噪声训练数据的梅尔频率倒谱系数;
根据最大期望算法对所述语音训练数据的梅尔频率倒谱系数进行数据处理,生成语音帧的模型;
根据最大期望算法对所述噪声训练数据的梅尔频率倒谱系数进行数据处理,生成噪声数据帧的模型。
3.根据权利要求2所述的去除语音信号中噪声信号的方法,其特征在于,所述根据所述频谱,对各帧含噪语音信号进行端点检测,将所述各帧含噪语音信号区分为语音帧和噪声数据帧具体为:
根据所述频谱,提取各帧含噪语音信号的梅尔频率倒谱系数;
根据所述各帧含噪语音信号的梅尔频率倒谱系数与所述语音帧的模型和噪声数据帧的模型,对所述各帧含噪语音信号进行类别判断,将所述各帧含噪语音信号区分为语音帧和噪声数据帧。
4.根据权利要求1所述的去除语音信号中噪声信号的方法,其特征在于,所述语音帧噪声功率谱估计值λDs(i,k)由如下公式得出:
λDs(i,k)=Quantiles(X(i,k)2)i=0,1,2,3,…,J;
所述噪声数据帧噪声功率谱估计值λDn(i,k)由如下公式得出:
λDn(i,k)=a×X(i,k)2+(1-a)×Quantiles(X(i,k)2)i=0,1,2,3,…,J;
其中,J表示总帧数;X(i,k)表示第i帧第k个频点的频谱分量;Quantiles()表示取分位数;a表示权重系数。
8.一种语音去噪装置,包括存储器和处理器,其特征在于,所述存储器用于存储程序,所述处理器用于执行如权利要求1-7任一项所述的去除语音信号中噪声信号的方法。
9.一种包含指令的程序产品,其特征在于,当所述程序产品在语音去噪装置上运行时,使得所述语音去噪装置执行如权利要求1-7任一权利要求所述的去除语音信号中噪声信号的方法。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有程序,所述程序被处理器执行时实现如权利要求1-7任一权利要求所述的去除语音信号中噪声信号的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111028183.4A CN113593599A (zh) | 2021-09-02 | 2021-09-02 | 一种去除语音信号中噪声信号的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111028183.4A CN113593599A (zh) | 2021-09-02 | 2021-09-02 | 一种去除语音信号中噪声信号的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113593599A true CN113593599A (zh) | 2021-11-02 |
Family
ID=78241053
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111028183.4A Pending CN113593599A (zh) | 2021-09-02 | 2021-09-02 | 一种去除语音信号中噪声信号的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113593599A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116580723A (zh) * | 2023-07-13 | 2023-08-11 | 合肥星本本网络科技有限公司 | 一种强噪声环境下的语音检测方法和系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20110024969A (ko) * | 2009-09-03 | 2011-03-09 | 한국전자통신연구원 | 음성신호에서 통계적 모델을 이용한 잡음 제거 장치 및 방법 |
CN102097095A (zh) * | 2010-12-28 | 2011-06-15 | 天津市亚安科技电子有限公司 | 一种语音端点检测方法及装置 |
CN103247293A (zh) * | 2013-05-14 | 2013-08-14 | 中国科学院自动化研究所 | 一种语音数据的编码及解码方法 |
CN103646649A (zh) * | 2013-12-30 | 2014-03-19 | 中国科学院自动化研究所 | 一种高效的语音检测方法 |
CN106486131A (zh) * | 2016-10-14 | 2017-03-08 | 上海谦问万答吧云计算科技有限公司 | 一种语音去噪的方法及装置 |
WO2020107269A1 (zh) * | 2018-11-28 | 2020-06-04 | 深圳市汇顶科技股份有限公司 | 自适应语音增强方法和电子设备 |
CN112116909A (zh) * | 2019-06-20 | 2020-12-22 | 杭州海康威视数字技术股份有限公司 | 语音识别方法、装置及系统 |
-
2021
- 2021-09-02 CN CN202111028183.4A patent/CN113593599A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20110024969A (ko) * | 2009-09-03 | 2011-03-09 | 한국전자통신연구원 | 음성신호에서 통계적 모델을 이용한 잡음 제거 장치 및 방법 |
CN102097095A (zh) * | 2010-12-28 | 2011-06-15 | 天津市亚安科技电子有限公司 | 一种语音端点检测方法及装置 |
CN103247293A (zh) * | 2013-05-14 | 2013-08-14 | 中国科学院自动化研究所 | 一种语音数据的编码及解码方法 |
CN103646649A (zh) * | 2013-12-30 | 2014-03-19 | 中国科学院自动化研究所 | 一种高效的语音检测方法 |
CN106486131A (zh) * | 2016-10-14 | 2017-03-08 | 上海谦问万答吧云计算科技有限公司 | 一种语音去噪的方法及装置 |
WO2020107269A1 (zh) * | 2018-11-28 | 2020-06-04 | 深圳市汇顶科技股份有限公司 | 自适应语音增强方法和电子设备 |
CN112116909A (zh) * | 2019-06-20 | 2020-12-22 | 杭州海康威视数字技术股份有限公司 | 语音识别方法、装置及系统 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116580723A (zh) * | 2023-07-13 | 2023-08-11 | 合肥星本本网络科技有限公司 | 一种强噪声环境下的语音检测方法和系统 |
CN116580723B (zh) * | 2023-07-13 | 2023-09-08 | 合肥星本本网络科技有限公司 | 一种强噪声环境下的语音检测方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10650796B2 (en) | Single-channel, binaural and multi-channel dereverberation | |
US8010355B2 (en) | Low complexity noise reduction method | |
JP3484757B2 (ja) | 音声信号の雑音低減方法及び雑音区間検出方法 | |
US9343056B1 (en) | Wind noise detection and suppression | |
EP2031583B1 (en) | Fast estimation of spectral noise power density for speech signal enhancement | |
US8571231B2 (en) | Suppressing noise in an audio signal | |
US7313518B2 (en) | Noise reduction method and device using two pass filtering | |
CN111554315B (zh) | 单通道语音增强方法及装置、存储介质、终端 | |
CN106463106B (zh) | 用于音频接收的风噪声降低 | |
JP2003534570A (ja) | 適応ビームフォーマーにおいてノイズを抑制する方法 | |
JP2002541753A (ja) | 固定フィルタを用いた時間領域スペクトラル減算による信号雑音の低減 | |
CN110782914B (zh) | 信号处理方法、装置、终端设备及存储介质 | |
EP2346032A1 (en) | Noise suppression device and audio decoding device | |
US20200286501A1 (en) | Apparatus and a method for signal enhancement | |
Soon et al. | Wavelet for speech denoising | |
JP3459363B2 (ja) | 雑音低減処理方法、その装置及びプログラム記憶媒体 | |
CN113539285A (zh) | 音频信号降噪方法、电子装置和存储介质 | |
CN110556125A (zh) | 基于语音信号的特征提取方法、设备及计算机存储介质 | |
JP2014513320A (ja) | オーディオ信号におけるドミナント周波数を減衰する方法及び装置 | |
JP4965891B2 (ja) | 信号処理装置およびその方法 | |
CN113593599A (zh) | 一种去除语音信号中噪声信号的方法 | |
CN112669869B (zh) | 噪声抑制方法、设备、装置及存储介质 | |
CN112165558B (zh) | 一种双讲状态检测方法、装置、存储介质及终端设备 | |
CN111226278B (zh) | 低复杂度的浊音语音检测和基音估计 | |
Yang et al. | Environment-Aware Reconfigurable Noise Suppression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: Room 1002, floor 10, block B, No. 18, Zhongguancun Street, Haidian District, Beijing 100044 Applicant after: Beijing Biyun shuchuang Technology Co.,Ltd. Address before: Room 1002, floor 10, block B, No. 18, Zhongguancun Street, Haidian District, Beijing 100044 Applicant before: Beijing yundie Zhixue Technology Co.,Ltd. |
|
CB02 | Change of applicant information |