CN101266797A - 语音信号后处理滤波方法 - Google Patents

语音信号后处理滤波方法 Download PDF

Info

Publication number
CN101266797A
CN101266797A CNA200710038147XA CN200710038147A CN101266797A CN 101266797 A CN101266797 A CN 101266797A CN A200710038147X A CNA200710038147X A CN A200710038147XA CN 200710038147 A CN200710038147 A CN 200710038147A CN 101266797 A CN101266797 A CN 101266797A
Authority
CN
China
Prior art keywords
fundamental tone
wave filter
signal
filtering method
fundamental
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA200710038147XA
Other languages
English (en)
Other versions
CN101266797B (zh
Inventor
黄鹤云
林福辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Spreadtrum Communications Shanghai Co Ltd
Original Assignee
Spreadtrum Communications Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Spreadtrum Communications Shanghai Co Ltd filed Critical Spreadtrum Communications Shanghai Co Ltd
Priority to CN200710038147XA priority Critical patent/CN101266797B/zh
Priority to US12/047,232 priority patent/US8175866B2/en
Publication of CN101266797A publication Critical patent/CN101266797A/zh
Application granted granted Critical
Publication of CN101266797B publication Critical patent/CN101266797B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Abstract

本发明公开了一种语音信号后处理滤波方法,可同时实现语音信号的基音加重和基音增强,且算法简单,易于实现。包括:(1)将待处理语音信号依次送入基音频率分量整型模块、基音权重参数调整和第一基音增强滤波器进行处理;(2)将步骤(1)处理所得的信号再与待处理语音信号进行相加;(3)将步骤(2)处理所得的信号再送入第二基音增强滤波器进行处理。或包括:(1)将待处理语音信号首先送入第二基音增强滤波器进行处理;(2)将步骤(1)所得的处理信号再依次送入基音频率分量整型模块、基音权重参数调整和第一基音增强滤波器进行处理;(3)将步骤(2)所得的处理信号再与步骤(1)所得的处理信号进行相加。

Description

语音信号后处理滤波方法
技术领域
本发明涉及一种滤波方法,尤其涉及一种语音信号后处理滤波方法。
背景技术
通用的语音编解码器一般都是使用基于线性预测技术和残差激励编码的码激励线性预测(CELP)算法来实现的,其激励通常是自适应码本和固定码本产生的激励构成的,其具体实现流程可参见图1和图2。尽管上述线性预测技术和激励编码技术已经能够较好的模拟语音信号,但是由于模型并不能总是完美的近似信号和编解码中不可避免的解码语音信号会有一定程度的失真。特别是在低码率情况下,失真情况会更加严重。因此对语音再进行一些后处理是有必要的,所述后处理可包括对自适应码本激励、固定码本激励、总激励和解码语音信号的滤波处理。传统的AMR-WB和AMR-WB+含有多种后处理滤波器,其中包括低码率下基音加重,频率选择性后滤波方法等等多种后处理的子方法。其中很多方法都是针对低码率下由于比特数不够导致基音分量偏弱的不足,进行的语音或者激励信号的滤波和增强。
现有的语音信号用于基音增强的后处理滤波,主要包括以下两种典型的实现方式:
一种是基于不同频带的基音增强滤波器,这种滤波器将已经合成的语音信号分成不同的频段,在某些频段里(而不是全部)进行基音增强的滤波,最后将不同频段的语音信号加起来成为滤波结果。它引入了多种带通滤波器,造成了计算复杂度的提高。不仅如此,它也没有进行基音加重,而仅仅是部分抑制了基频之间的噪声分量。
另一种滤波器的算法是直接将自适应码本激励信号加到总激励上。由于它要计算权重分量和信号能量,需要引入大量乘法和开方运算,复杂度也是比较高。
发明内容
本发明要解决的技术问题是提供一种语音信号后处理滤波方法,可同时实现语音信号的基音加重和基音增强,且算法简单,易于实现。
为解决上述技术问题,本发明提供一种语音信号后处理滤波方法,包括:
(1)将待处理语音信号依次送入基音频率分量整型模块、基音权重参数调整和第一基音增强滤波器进行处理;
(2)将步骤(1)处理所得的信号再与待处理语音信号进行相加;
(3)将步骤(2)处理所得的信号再送入第二基音增强滤波器进行处理。
本发明所述语音信号后处理滤波方法,还可按如下步骤进行:
(1)将待处理语音信号首先送入第二基音增强滤波器进行处理;
(2)将步骤(1)所得的处理信号再依次送入基音频率分量整型模块、基音权重参数调整和第一基音增强滤波器进行处理;
(3)将步骤(2)所得的处理信号再与步骤(1)所得的处理信号进行相加。
本发明由于采用了上述技术方案,具有这样的有益效果,即同时实现了语音信号的基音加重和基音增强,即第一,由于基音增强滤波的主要作用是消除谐波之间的多余的频率成分,因此起到了基音增强的作用;第二,由于本发明所述方法实现的后处理滤波器等效于将原语音信号通过一个长时滤波器和特定滤波器再相加到原信号上,因此进一步增强了信号的基音成分;从而实现了改善语音质量的目的。该语音信号后处理滤波方法还具有算法复杂度低、易于实现的特点。
附图说明
下面结合附图与具体实施方式对本发明作进一步详细的说明:
图1为使用码激励线性预测算法对语音信号进行编码的流程示意图;
图2为使用码激励线性预测算法对语音信号进行解码的流程示意图;
图3为本发明所述语音信号后处理滤波方法的一个实施例的实现框图;
图4为本发明所述语音信号后处理滤波方法的另一个实施例的实现框图。
具体实施方式
在一个实施例中,如图3所示,本发明所述语音信号后处理滤波可通过以下方法来实现:(1)将待处理语音信号依次送入基音频率分量整型模块、基音权重参数调整和第一基音增强滤波器进行处理;(2)再将经上述处理后得到的信号与原待处理语音信号进行相加;(3)将相加后的信号送入第二基音增强滤波器进行处理,即得到了本发明所要实现的后处理信号。
在另一个实施例中,如图4所示,本发明所述语音信号后处理滤波还可以通过以下方法来实现:(1)将待处理语音信号首先送入第二基音增强滤波器进行处理;(2)将经所述第二基音增强滤波器处理后的信号再依次送入基音频率分量整型模块、基音权重参数调整和第一基音增强滤波器进行处理;(3)将(2)处理所得的信号再与经所述第二基音增强滤波器处理后的信号进行相加,即得到了本发明所要实现的后处理信号。
上述两个实施例中所述依次送入基音频率分量整型模块、基音权重参数调整和第一基音增强滤波器进行处理是指这三个处理顺序是可以任意改变的或者任意一种等效的形式。
其中,所述基音频率分量整型模块为一个特定滤波器,用于控制基音所包含的各种频率分量的幅度,其既可以用全通滤波器来实现,即其所实现的算法为:H0(z)=1;也可以用低通滤波器来实现,即其所实现的算法为:H0(z)=1+z-T
所述第一基音增强滤波器和第二基音增强滤波器可采用任何一种形式的基音增强滤波器,一般采用长时滤波器来实现。其中所采用的长时滤波器时可以采用任何一种参数形式来配置其参数,只要满足HLT(z)=λ+ηz-T的形式即可。在本发明中,所述第一基音增强滤波器和第二基音增强滤波器一般采用如下的典型形式来表示,即:
HPE(z)=(1-α)+αz-T
其中,T是本帧语音信号所对应的基音参数,α则是和基音增益相关的参数。
因此,假设所述基音频率分量整型模块所实现的算法为H0(z),所述第一基音增强滤波器中所实现的算法为HPE1(z),所述第二基音增强滤波器中所实现的算法为HPE2(z),则依据上述方法所实现的后处理滤波器将最终所实现的算法如下:
H(z)=HPE2(z)(1+βHPE1(z)H0(z))
其中,β为基音权重参数,它是一个固定的经验参数,用于控制基音增强的大小。
因此本发明所述语音信号后处理滤波还可采用实现如下算法的一个后处理滤波器来完成:
H(z)=((1-α)+αz-T)(1+β((1-α)+αz-T)H0(z))
本发明所述的语音信号后处理滤波方法既可以用于对解码语音信号进行滤波,也可以用于对解码激励信号进行滤波,因此用于实现该后处理滤波方法的后处理滤波器其既可以放在解码语音信号形成之后,也可以放在任何一个等效的位置,例如在激励信号被重建的时候,如自适应码本激励、固定码本激励或总激励信号形成之后的位置。因此,本发明所述语音信号后处理滤波方法中所用到的基音参数T、α和β可从当前的语音解码器中直接读取,也可以采取任意一种基音跟踪算法来计算获得。
本发明所述后处理滤波器可应用在任何基于码激励线性预测编码的框架里,例如AMR-WB,AMR-WB+,G.729等等。

Claims (9)

1. 一种语音信号后处理滤波方法,其特征在于,包括:
(1)将待处理语音信号依次送入基音频率分量整型模块、基音权重参数调整和第一基音增强滤波器进行处理;
(2)将步骤(1)处理所得的信号再与待处理语音信号进行相加;
(3)将步骤(2)处理所得的信号再送入第二基音增强滤波器进行处理。
2. 一种语音信号后处理滤波方法,其特征在于,包括:
(1)将待处理语音信号首先送入第二基音增强滤波器进行处理;
(2)将步骤(1)所得的处理信号再依次送入基音频率分量整型模块、基音权重参数调整和第一基音增强滤波器进行处理;
(3)将步骤(2)所得的处理信号再与步骤(1)所得的处理信号进行相加。
3. 根据权利要求1或2所述的语音信号后处理滤波方法,其特征在于,所述基音频率分量整型模块用于控制基音所包含的各种频率分量的幅度,可用全通滤波器来实现,即其所实现的算法为:H0(z)=1;或者用低通滤波器来实现,即其所实现的算法为:H0(z)=1+z-T,其中T为本帧语音信号所对应的基音参数。
4. 根据权利要求1或2所述的语音信号后处理滤波方法,其特征在于,所述基音权重参数是一个固定的经验参数,用于控制基音增强的大小。
5. 根据权利要求1或2所述的语音信号后处理滤波方法,其特征在于,所述第一基音增强滤波器和所述第二基音增强滤波器为长时滤波器,其所实现的算法应满足:HLT(z)=λ+ηz-T的形式。
6. 根据权利要求5所述的语音信号后处理滤波方法,其特征在于,所述第一基音增强滤波器和所述第二基音增强滤波器所实现的算法为:HPE(z)=(1-α)+αz-T,其中α为和基音增益相关的参数,T为本帧语音信号所对应的基音参数。
7. 根据权利要求1所述的语音信号后处理滤波方法,其特征在于,所述步骤(1)中基音频率分量整型模块、基音权重参数调整和第一基音增强滤波器进行处理的顺序可任意组合。
8. 根据权利要求2所述的语音信号后处理滤波方法,其特征在于,所述步骤(2)中基音频率分量整型模块、基音权重参数调整和第一基音增强滤波器进行处理的顺序可任意组合。
9. 根据权利要求1或2所述的语音信号后处理滤波方法,其特征在于,所述待处理语音信号为解码语音信号或解码激励信号。
CN200710038147XA 2007-03-16 2007-03-16 语音信号后处理滤波方法 Active CN101266797B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN200710038147XA CN101266797B (zh) 2007-03-16 2007-03-16 语音信号后处理滤波方法
US12/047,232 US8175866B2 (en) 2007-03-16 2008-03-12 Methods and apparatus for post-processing of speech signals

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200710038147XA CN101266797B (zh) 2007-03-16 2007-03-16 语音信号后处理滤波方法

Publications (2)

Publication Number Publication Date
CN101266797A true CN101266797A (zh) 2008-09-17
CN101266797B CN101266797B (zh) 2011-06-01

Family

ID=39763543

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200710038147XA Active CN101266797B (zh) 2007-03-16 2007-03-16 语音信号后处理滤波方法

Country Status (2)

Country Link
US (1) US8175866B2 (zh)
CN (1) CN101266797B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930872A (zh) * 2012-11-05 2013-02-13 深圳广晟信源技术有限公司 用于宽带语音解码中基音增强后处理的方法及装置
CN107945812A (zh) * 2014-04-25 2018-04-20 株式会社Ntt都科摩 线性预测系数变换装置和线性预测系数变换方法

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9185487B2 (en) 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
CN101308655B (zh) * 2007-05-16 2011-07-06 展讯通信(上海)有限公司 一种音频编解码方法与装置
US8473287B2 (en) 2010-04-19 2013-06-25 Audience, Inc. Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system
US8538035B2 (en) 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8781137B1 (en) 2010-04-27 2014-07-15 Audience, Inc. Wind noise detection and suppression
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
US8447596B2 (en) * 2010-07-12 2013-05-21 Audience, Inc. Monaural noise suppression based on computational auditory scene analysis
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
JP6261381B2 (ja) * 2014-02-28 2018-01-17 日本電信電話株式会社 信号処理装置、信号処理方法、プログラム
DE112015003945T5 (de) 2014-08-28 2017-05-11 Knowles Electronics, Llc Mehrquellen-Rauschunterdrückung

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9512284D0 (en) * 1995-06-16 1995-08-16 Nokia Mobile Phones Ltd Speech Synthesiser
WO1997027578A1 (en) * 1996-01-26 1997-07-31 Motorola Inc. Very low bit rate time domain speech analyzer for voice messaging
CN1256000A (zh) * 1998-01-26 2000-06-07 松下电器产业株式会社 增强音调的方法和装置
US7117146B2 (en) * 1998-08-24 2006-10-03 Mindspeed Technologies, Inc. System for improved use of pitch enhancement with subcodebooks
US6704701B1 (en) * 1999-07-02 2004-03-09 Mindspeed Technologies, Inc. Bi-directional pitch enhancement in speech coding systems
US7606703B2 (en) * 2000-11-15 2009-10-20 Texas Instruments Incorporated Layered celp system and method with varying perceptual filter or short-term postfilter strengths
CA2388352A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102930872A (zh) * 2012-11-05 2013-02-13 深圳广晟信源技术有限公司 用于宽带语音解码中基音增强后处理的方法及装置
CN107945812A (zh) * 2014-04-25 2018-04-20 株式会社Ntt都科摩 线性预测系数变换装置和线性预测系数变换方法
CN107945812B (zh) * 2014-04-25 2022-01-25 株式会社Ntt都科摩 线性预测系数变换装置和线性预测系数变换方法

Also Published As

Publication number Publication date
US20080228474A1 (en) 2008-09-18
US8175866B2 (en) 2012-05-08
CN101266797B (zh) 2011-06-01

Similar Documents

Publication Publication Date Title
CN101266797B (zh) 语音信号后处理滤波方法
CN101140759B (zh) 语音或音频信号的带宽扩展方法及系统
CN101548319B (zh) 后置滤波器以及滤波方法
CN100550712C (zh) 一种信号处理方法和处理装置
US8010351B2 (en) Speech coding system to improve packet loss concealment
CN101286319B (zh) 改进语音丢包修补质量的语音编码方法
CN102934161B (zh) 音频混合编码装置以及音频混合解码装置
EP2573767B1 (en) Method and device for updating status of synthesis filters
WO2013061584A1 (ja) 音信号ハイブリッドデコーダ、音信号ハイブリッドエンコーダ、音信号復号方法、及び音信号符号化方法
CN106663444A (zh) 用于使用谐波后置滤波器来处理音频信号的装置及方法
CN102714040A (zh) 编码装置、解码装置、频谱变动量计算方法和频谱振幅调整方法
CN1126076C (zh) 语音译码器和语音译码方法
CN102844810B (zh) 用于在码激励线性预测编码器和解码器中使用的灵活和可缩放的组合式创新代码本
EP2569767B1 (en) Method and arrangement for processing of audio signals
CN106463140B (zh) 具有语音信息的改进型帧丢失矫正
CN102074242B (zh) 语音音频混合分级编码中核心层残差提取系统及方法
CN104269173A (zh) 切换模式的音频带宽扩展装置与方法
CN101582263B (zh) 语音解码中噪音增强后处理的方法和装置
CN101533639B (zh) 语音信号处理方法及装置
JP2002366195A (ja) 音声符号化パラメータ符号化方法及び装置
CN101587711B (zh) 基音后处理方法、滤波器以及基音后处理系统
CN100416652C (zh) 增强的amr编码器快速固定码本搜索方法
CN105280189A (zh) 带宽扩展编码和解码中高频生成的方法和装置
CN102930872A (zh) 用于宽带语音解码中基音增强后处理的方法及装置
KR100341398B1 (ko) 씨이엘피형 보코더의 코드북 검색 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20190314

Address after: 101399 Building 8-07, Ronghui Garden 6, Shunyi Airport Economic Core Area, Beijing

Patentee after: Xin Xin finance leasing (Beijing) Co.,Ltd.

Address before: 201203 No. 1 Building, No. 2288 Lane Exhibition Center, Zuchong Road, Pudong New Area, Shanghai

Patentee before: SPREADTRUM COMMUNICATIONS (SHANGHAI) Co.,Ltd.

EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20080917

Assignee: SPREADTRUM COMMUNICATIONS (SHANGHAI) Co.,Ltd.

Assignor: Xin Xin finance leasing (Beijing) Co.,Ltd.

Contract record no.: X2021110000008

Denomination of invention: Speech signal post processing filtering method

Granted publication date: 20110601

License type: Exclusive License

Record date: 20210317

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20221020

Address after: 201203 Shanghai city Zuchongzhi road Pudong New Area Zhangjiang hi tech park, Spreadtrum Center Building 1, Lane 2288

Patentee after: SPREADTRUM COMMUNICATIONS (SHANGHAI) Co.,Ltd.

Address before: 101399 Building 8-07, Ronghui Garden 6, Shunyi Airport Economic Core Area, Beijing

Patentee before: Xin Xin finance leasing (Beijing) Co.,Ltd.