CN100358007C - 一种利用改进的谱相减法提高语音识别精度的方法 - Google Patents
一种利用改进的谱相减法提高语音识别精度的方法 Download PDFInfo
- Publication number
- CN100358007C CN100358007C CNB2005100404006A CN200510040400A CN100358007C CN 100358007 C CN100358007 C CN 100358007C CN B2005100404006 A CNB2005100404006 A CN B2005100404006A CN 200510040400 A CN200510040400 A CN 200510040400A CN 100358007 C CN100358007 C CN 100358007C
- Authority
- CN
- China
- Prior art keywords
- speech
- spectrums
- voice
- subtractive method
- speech recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
本发明是关于提高语音识别精度的方法,具体的说,是关于在语音识别算法特征提取之前,通过对语音进行增强处理,提高语音输入信噪比,进而提高语音识别精度的方法。本发明在进行语音识别处理之前对带噪声语音输入进行语音增强处理,语音增强处理的方法采用改进的谱相减法,改传统的谱相减法α=2,β=1为α=2,β=5得到改进的谱相减法,改进的谱相减法使信噪比增益获得提高。本发明利用改进的谱相减法使语音识别精度被显著提高。
Description
技术领域
本发明是关于提高语音识别精度的方法,具体的说,是关于在语音识别算法特征提取之前,通过对语音进行增强处理,提高语音输入信噪比,进而提高语音识别精度的方法。
背景技术
语音识别是机器通过识别和理解过程把语音信号转变为相应的文本文件或命令的高技术。作为专门的研究领域,语音识别又是一门交叉学科,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。语音识别经过四十多年的发展到今天,已经显示出巨大的应用前景。促使语音识别技术可以得到广泛应用的关键是识别精度。
本发明提供了一种通过对语音进行增强处理,提高语音输入信噪比,进而提高语音识别精度的方法。
发明内容
为了以上目的,本发明提供了一种有效的通过对语音进行增强处理,提高语音输入信噪比,进而提高语音识别精度的方法。该方法包括:
在进行语音识别处理之前对带噪声语音输入进行语音增强处理
语音增强处理的方法采用改进的谱相减法
改传统的谱相减法α=2,β=1为α=2,β=5得到改进的谱相减法
改进的谱相减法信噪比增益获得提高
通过语音识别验证平台测试发现经过改进的谱相减法的语音识别精度被显著提高
附图说明
在本专利申请的权利要求书中,具体地指出了本发明的主题,并清楚地对其提出了专利保护。然而参照下面的详细说明和附图,可以更好的理解本发明的有关结构和实现方法以及其目的、特征和优势。
图1表示通过语音增强提高语音识别精度的语音识别系统框图,y(n)为带噪语音,S(n) +为增强后的语音,W为识别器的输出;
图2表示改进谱减法框图,y(n)为带噪语音,s(n)为纯净语音输入、d(n)为加性噪声,噪声功率谱系数λn(k),θk为相位,α、β为参数,FFT为快速傅利叶转换,IFFT为反快速傅利叶转换,S(n) +为增强后的语音;
虽然此处说明描述了本发明的某此特征及一种实现方法,但是对于本专业的技术人员来说,将会出现许多修改、替换、变化和等效代换。因此,本发明的保护范围由所附的权利要求的范围为准。
Claims (3)
1.一种利用改进的谱相减法提高语音识别精度的方法,该方法包括以下步骤:
--带噪声语音输入y(n),包含两项:纯净语音输入s(n)、加性噪声d(n)
--在语音中的无声段估计得到的噪声功率谱系数λn(k)
--带噪声语音和纯净语音的频谱系数分别为:Yk、Sk,k=0,1,…
--传统谱相减法α=2,β=1得到语音s(n)谱幅度系数|Sk|=[|Yk|α-βλn(k)α]1/α
--改进谱相减法,设定α=2,β=5,得到增强后的语音S(n) +的谱幅度系数|Sk +|。
2.如权利要求1所述一种利用改进的谱相减法提高语音识别精度的方法,其特征在于:谱相减法用在语音识别算法特征提取之前,对语音进行增强处理,从而提高语音输入信噪比。
3.如权利要求1所述一种利用改进的谱相减法提高语音识别精度的方法,其特征在于:通过改进传统谱相减法的α=2和β=1的参数值为α=2和β=5,来提高语音谱幅度系数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2005100404006A CN100358007C (zh) | 2005-06-07 | 2005-06-07 | 一种利用改进的谱相减法提高语音识别精度的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB2005100404006A CN100358007C (zh) | 2005-06-07 | 2005-06-07 | 一种利用改进的谱相减法提高语音识别精度的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1697018A CN1697018A (zh) | 2005-11-16 |
CN100358007C true CN100358007C (zh) | 2007-12-26 |
Family
ID=35349715
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2005100404006A Expired - Fee Related CN100358007C (zh) | 2005-06-07 | 2005-06-07 | 一种利用改进的谱相减法提高语音识别精度的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN100358007C (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104064185B (zh) * | 2013-03-18 | 2017-06-27 | 联想(北京)有限公司 | 信息处理方法及系统、电子设备 |
CN106023996B (zh) * | 2016-06-12 | 2019-08-27 | 杭州电子科技大学 | 基于十字形声阵列宽带波束形成的声识别方法 |
CN112309414B (zh) * | 2020-07-21 | 2024-01-12 | 东莞市逸音电子科技有限公司 | 基于音频编解码的主动降噪方法、耳机及电子设备 |
CN112312256B (zh) * | 2020-07-30 | 2023-08-01 | 深圳市逸音科技有限公司 | 一种基于数字通讯的智能主动降噪耳机 |
CN112312258B (zh) * | 2020-09-08 | 2023-04-07 | 深圳市逸音科技有限公司 | 一种具有听力防护及听力补偿的智能耳机 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002101729A1 (fr) * | 2001-06-06 | 2002-12-19 | Mitsubishi Denki Kabushiki Kaisha | Attenuateur de bruit |
CN1397929A (zh) * | 2002-07-12 | 2003-02-19 | 清华大学 | 抗噪声语音识别用语音增强-特征加权-对数谱相加方法 |
-
2005
- 2005-06-07 CN CNB2005100404006A patent/CN100358007C/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002101729A1 (fr) * | 2001-06-06 | 2002-12-19 | Mitsubishi Denki Kabushiki Kaisha | Attenuateur de bruit |
CN1397929A (zh) * | 2002-07-12 | 2003-02-19 | 清华大学 | 抗噪声语音识别用语音增强-特征加权-对数谱相加方法 |
Also Published As
Publication number | Publication date |
---|---|
CN1697018A (zh) | 2005-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109147796B (zh) | 语音识别方法、装置、计算机设备及计算机可读存储介质 | |
CN105118501A (zh) | 语音识别的方法及系统 | |
CN110853629A (zh) | 一种基于深度学习的语音识别数字的方法 | |
CN100358007C (zh) | 一种利用改进的谱相减法提高语音识别精度的方法 | |
CN1650349A (zh) | 用于抗噪声语音识别的在线参数直方图正态化 | |
CN111243617B (zh) | 一种基于深度学习降低mfcc特征失真的语音增强方法 | |
Chuang et al. | Speaker-Aware Deep Denoising Autoencoder with Embedded Speaker Identity for Speech Enhancement. | |
Dua et al. | Discriminative training using heterogeneous feature vector for Hindi automatic speech recognition system | |
CN114495969A (zh) | 一种融合语音增强的语音识别方法 | |
Islam et al. | Supervised single channel speech enhancement based on stationary wavelet transforms and non-negative matrix factorization with concatenated framing process and subband smooth ratio mask | |
CN106297769A (zh) | 一种应用于语种识别的鉴别性特征提取方法 | |
Li et al. | A complexity reduction of ETSI advanced front-end for DSR | |
CN107103913A (zh) | 一种基于功率谱Gabor特征序列递归模型的语音识别方法 | |
CN102314883A (zh) | 一种判断音乐噪声的方法以及语音消噪方法 | |
CN113744715A (zh) | 声码器语音合成方法、装置、计算机设备及存储介质 | |
JP2010102129A (ja) | 基本周波数抽出方法、基本周波数抽出装置、およびプログラム | |
KR100766170B1 (ko) | 다중 레벨 양자화를 이용한 음악 요약 장치 및 방법 | |
Alam et al. | Regularized minimum variance distortionless response-based cepstral features for robust continuous speech recognition | |
CN105513587B (zh) | 一种mfcc提取方法及装置 | |
JP2006215228A (ja) | 音声信号分析方法およびこの分析方法を実施する装置、この音声信号分析装置を用いた音声認識装置、この分析方法を実行するプログラムおよびその記憶媒体 | |
CN112331219A (zh) | 语音处理方法和装置 | |
Mittal et al. | Classical and deep learning data processing techniques for speech and speaker recognitions | |
CN111048072A (zh) | 一种应用于电力企业的声纹识别方法 | |
Wang et al. | Robust principal component analysis based speaker verification under additive noise conditions | |
Dutta et al. | Robust language identification using power normalized cepstral coefficients |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |