JPH1020891A - 音声符号化方法及び装置 - Google Patents
音声符号化方法及び装置Info
- Publication number
- JPH1020891A JPH1020891A JP8179178A JP17917896A JPH1020891A JP H1020891 A JPH1020891 A JP H1020891A JP 8179178 A JP8179178 A JP 8179178A JP 17917896 A JP17917896 A JP 17917896A JP H1020891 A JPH1020891 A JP H1020891A
- Authority
- JP
- Japan
- Prior art keywords
- adaptive codebook
- linear prediction
- codebook
- voiced sound
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
Abstract
(57)【要約】
【課題】 PSI−CELP等の適応コードブックと固
定コードブックとを切換選択して用いる符号化におい
て、入力音声周波数成分が大きく変化するときに固定コ
ードブックが選択されることによる波形歪を軽減する。 【解決手段】 適応コードブック21からの出力と固定
コードブック22からの出力とを切換選択スイッチ26
により選択して、雑音コードブック23、24からの出
力と加算して、線形予測合成フィルタ16に送る。切換
選択スイッチ26を切換制御するスイッチ制御回路19
は、線形予測分析回路14からの初期の信号エネルギに
対する線形予測残差エネルギの比率である予測利得に応
じて、この予測利得が所定の閾値より小さいとき、有声
音であると判別して、強制的に適応コードブック21か
らの出力を選択するように切換選択スイッチ26を制御
する。
定コードブックとを切換選択して用いる符号化におい
て、入力音声周波数成分が大きく変化するときに固定コ
ードブックが選択されることによる波形歪を軽減する。 【解決手段】 適応コードブック21からの出力と固定
コードブック22からの出力とを切換選択スイッチ26
により選択して、雑音コードブック23、24からの出
力と加算して、線形予測合成フィルタ16に送る。切換
選択スイッチ26を切換制御するスイッチ制御回路19
は、線形予測分析回路14からの初期の信号エネルギに
対する線形予測残差エネルギの比率である予測利得に応
じて、この予測利得が所定の閾値より小さいとき、有声
音であると判別して、強制的に適応コードブック21か
らの出力を選択するように切換選択スイッチ26を制御
する。
Description
【0001】
【発明の属する技術分野】本発明は、ディジタル信号処
理により音声信号を高能率で圧縮符号化する音声信号符
号化方法及び装置に関する。
理により音声信号を高能率で圧縮符号化する音声信号符
号化方法及び装置に関する。
【0002】
【従来の技術】近年において、自動車電話や携帯電話あ
るいはテレビ電話用音声等への適用を目的として、例え
ば 4.8 〜9.6 kbps 程度の低ビットレートの音声符号化
方法が開発されており、このような音声符号化方法とし
て、ベクトル和励起リニア予測(VSELP:Vector S
um Excited Linear Prediction)符号化等のコード励起
リニア予測(CELP:Code Excited Linear Predicti
on)符号化方法が提案されている。さらに、ビットレー
トを半減した 3.45kbps 程度のいわゆるハーフレートの
音声符号化方法として、ピッチ同期化処理を伴うCEL
P、いわゆるPSI−CELP(Pitch Synchronus Inn
ovation - CELP)符号化方法が提案されている。
るいはテレビ電話用音声等への適用を目的として、例え
ば 4.8 〜9.6 kbps 程度の低ビットレートの音声符号化
方法が開発されており、このような音声符号化方法とし
て、ベクトル和励起リニア予測(VSELP:Vector S
um Excited Linear Prediction)符号化等のコード励起
リニア予測(CELP:Code Excited Linear Predicti
on)符号化方法が提案されている。さらに、ビットレー
トを半減した 3.45kbps 程度のいわゆるハーフレートの
音声符号化方法として、ピッチ同期化処理を伴うCEL
P、いわゆるPSI−CELP(Pitch Synchronus Inn
ovation - CELP)符号化方法が提案されている。
【0003】このPSI−CELP符号化方法は、CE
LP系の符号化方式であり、励振源となる励振符号ベク
トルのコードブック(符号帳)として、長期予測のため
の適応コードブックと、固定コードブックと、雑音コー
ドブックとを有している。特徴としては、適応符号ベク
トルのピッチ周期ラグに対応させて雑音符号ベクトルを
周期化する点が挙げられる。この雑音コードブックのピ
ッチ同期化は、雑音コードブックの先頭から音声の基本
周期であるピッチ周期分だけ取り出し、繰り返すような
形に変形することにより行われ、これによって有声部の
音質改善を図っている。また、このPSI−CELPに
おいては、適応コードブックと固定コードブックの切り
換えにより非周期性音声の表現力改善を図っている。
LP系の符号化方式であり、励振源となる励振符号ベク
トルのコードブック(符号帳)として、長期予測のため
の適応コードブックと、固定コードブックと、雑音コー
ドブックとを有している。特徴としては、適応符号ベク
トルのピッチ周期ラグに対応させて雑音符号ベクトルを
周期化する点が挙げられる。この雑音コードブックのピ
ッチ同期化は、雑音コードブックの先頭から音声の基本
周期であるピッチ周期分だけ取り出し、繰り返すような
形に変形することにより行われ、これによって有声部の
音質改善を図っている。また、このPSI−CELPに
おいては、適応コードブックと固定コードブックの切り
換えにより非周期性音声の表現力改善を図っている。
【0004】
【発明が解決しようとする課題】ところで、上記PSI
−CELP符号化において、入力信号に応じて長期予測
フィルタとしての適応コードブックと固定コードブック
とを切換選択することにより、有声音と無声音とに対し
効果的に音声合成を行っているが、有声音において、そ
の周波数成分が前後のサブフレームで大きく変化する
と、固定コードブックが多く選択されることになり、復
号音声の連続性を損ね、波形歪を発生する虞れがある、
という欠点がある。
−CELP符号化において、入力信号に応じて長期予測
フィルタとしての適応コードブックと固定コードブック
とを切換選択することにより、有声音と無声音とに対し
効果的に音声合成を行っているが、有声音において、そ
の周波数成分が前後のサブフレームで大きく変化する
と、固定コードブックが多く選択されることになり、復
号音声の連続性を損ね、波形歪を発生する虞れがある、
という欠点がある。
【0005】すなわち、適応コードブック及び固定コー
ドブックの符号ベクトルの選択は、入力音声に対して最
も相関が強い候補を選択することにより行われるが、例
えば入力音声が、高調波成分を多く含んだ音声から特定
の低域周波数が支配的な音声に変化すると、長期予測フ
ィルタの適応コードブックの状態が追従できず、結果的
に相関の強い固定コードブックの方が多く選択されるこ
とになる。しかし、これを復号した場合には、音声の連
続性が著しく損なわれ、最悪の場合には波形歪を発生す
ることもある。
ドブックの符号ベクトルの選択は、入力音声に対して最
も相関が強い候補を選択することにより行われるが、例
えば入力音声が、高調波成分を多く含んだ音声から特定
の低域周波数が支配的な音声に変化すると、長期予測フ
ィルタの適応コードブックの状態が追従できず、結果的
に相関の強い固定コードブックの方が多く選択されるこ
とになる。しかし、これを復号した場合には、音声の連
続性が著しく損なわれ、最悪の場合には波形歪を発生す
ることもある。
【0006】本発明は、上述したような実情に鑑みてな
されたものであり、有声音であるにもかかわらず固定コ
ードブックが選択されることにより生じる波形歪を軽減
し得るような音声符号化方法及び音声符号化装置の提供
を目的とするものである。
されたものであり、有声音であるにもかかわらず固定コ
ードブックが選択されることにより生じる波形歪を軽減
し得るような音声符号化方法及び音声符号化装置の提供
を目的とするものである。
【0007】
【課題を解決するための手段】上記の課題を解決するた
めに、本発明は、音声信号を合成するための励振源とし
て適応コードブックと固定コードブックとが少なくとも
設けられて、適応コードブック又は固定コードブックの
いずれか一方を選択して出力を合成フィルタに供給する
際に、入力音声の信号エネルギに基づいて有声音か否か
の判別を行い、有声音と判別されたときに上記適応コー
ドブックを強制的に選択することを特徴としている。
めに、本発明は、音声信号を合成するための励振源とし
て適応コードブックと固定コードブックとが少なくとも
設けられて、適応コードブック又は固定コードブックの
いずれか一方を選択して出力を合成フィルタに供給する
際に、入力音声の信号エネルギに基づいて有声音か否か
の判別を行い、有声音と判別されたときに上記適応コー
ドブックを強制的に選択することを特徴としている。
【0008】ここで、上記判別の際には、初期の信号エ
ネルギe0 に対する線形予測残差エネルギeL の比率で
ある予測利得e0/eLが所定の閾値THよりも小さい
(e0/eL <TH)ときに有声音であると判別し、こ
の有声音であると判別されたときに上記適応コードブッ
クを強制的に選択することが挙げられる。
ネルギe0 に対する線形予測残差エネルギeL の比率で
ある予測利得e0/eLが所定の閾値THよりも小さい
(e0/eL <TH)ときに有声音であると判別し、こ
の有声音であると判別されたときに上記適応コードブッ
クを強制的に選択することが挙げられる。
【0009】また、上記判別の際には、直前の線形予測
分析区間で適応コードブックが選択されかつ現在の線形
予測分析区間の信号エネルギPSUB が所定の閾値PTHよ
りも大きい(PSUB>PTH) ときに有声音であると判別
し、この有声音であると判別されたときに上記適応コー
ドブックを強制的に選択するようにしてもよい。
分析区間で適応コードブックが選択されかつ現在の線形
予測分析区間の信号エネルギPSUB が所定の閾値PTHよ
りも大きい(PSUB>PTH) ときに有声音であると判別
し、この有声音であると判別されたときに上記適応コー
ドブックを強制的に選択するようにしてもよい。
【0010】
【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照しながら説明する。図1は、本発明の実施
の形態を説明するための図である。この図1に示す実施
の形態は、本発明を前述したいわゆるPSI−CELP
(Pitch Synchronus Innovation - Code Excited Linea
r Prediction)符号化方法に適用した一例を示してい
る。
て図面を参照しながら説明する。図1は、本発明の実施
の形態を説明するための図である。この図1に示す実施
の形態は、本発明を前述したいわゆるPSI−CELP
(Pitch Synchronus Innovation - Code Excited Linea
r Prediction)符号化方法に適用した一例を示してい
る。
【0011】この図1において、入力端子11に供給さ
れた音声信号(入力音声)は、ノイズキャンセラ12に
送られてノイズ成分が除去され、低音量抑圧回路13に
送られて低レベル成分が抑圧される。低音量抑圧回路1
3からの出力は、線形予測分析(LPC分析)回路14
及び減算器15に送られる。線形予測分析回路14で
は、所定のサブフレーム毎に自己相関法でLPC分析を
行う。具体的には、サンプリング周波数を8kHz、符号
化フレームを40ms(320サンプル)、サブフレーム
数を4とするときサブフレームは10ms(80サンプ
ル)であるが、各サブフレームの中央を分析中心として
分析区間を20ms(160サンプル)とっている。線形
予測分析では、LPCのαパラメータを算出してLSP
(線スペクトル対)領域で量子化し、線形予測合成フィ
ルタ16に用いる短期予測係数とする。線形予測合成フ
ィルタ16は、後述する符号帳(コードブック)を有す
る励振源からの信号を線形予測(LPC)合成処理し、
減算器15に送っている。減算器15は、合成フィルタ
16からの合成出力と低音量抑圧回路13からの入力音
声との誤差を取り出して聴覚重み付き波形歪最小化回路
17に送る。聴覚重み付き波形歪最小化回路17では、
減算器15からの誤差を最小化するように、すなわち波
形歪が最小となるように励振源を制御する。
れた音声信号(入力音声)は、ノイズキャンセラ12に
送られてノイズ成分が除去され、低音量抑圧回路13に
送られて低レベル成分が抑圧される。低音量抑圧回路1
3からの出力は、線形予測分析(LPC分析)回路14
及び減算器15に送られる。線形予測分析回路14で
は、所定のサブフレーム毎に自己相関法でLPC分析を
行う。具体的には、サンプリング周波数を8kHz、符号
化フレームを40ms(320サンプル)、サブフレーム
数を4とするときサブフレームは10ms(80サンプ
ル)であるが、各サブフレームの中央を分析中心として
分析区間を20ms(160サンプル)とっている。線形
予測分析では、LPCのαパラメータを算出してLSP
(線スペクトル対)領域で量子化し、線形予測合成フィ
ルタ16に用いる短期予測係数とする。線形予測合成フ
ィルタ16は、後述する符号帳(コードブック)を有す
る励振源からの信号を線形予測(LPC)合成処理し、
減算器15に送っている。減算器15は、合成フィルタ
16からの合成出力と低音量抑圧回路13からの入力音
声との誤差を取り出して聴覚重み付き波形歪最小化回路
17に送る。聴覚重み付き波形歪最小化回路17では、
減算器15からの誤差を最小化するように、すなわち波
形歪が最小となるように励振源を制御する。
【0012】励振源には、長期予測フィルタとしての適
応コードブック21と、固定コードブック22と、2つ
の雑音コードブック23、24とが用いられる。適応コ
ードブック21は、励振源から合成フィルタ16に送ら
れる信号を入力とし、上記入力音声から検出されたピッ
チの周期(ピッチラグ)に応じた遅延量だけ遅延して出
力するためのものである。上記ピッチラグは、上記低音
量抑圧回路13からの音声信号をピッチ分析回路25に
より分析することで検出される。この適応コードブック
21を補完するために固定コードブック22が設けられ
ており、固定コードブック22を採用することにより無
声音の表現力が向上する。適応コードブック21及び固
定コードブック22から出力される励振符号ベクトル
は、切換選択スイッチ26によりいずれか一方が選択さ
れる。固定コードブック22内の励振符号ベクトルは切
換選択スイッチ27により選択され、極性付与回路28
により正負極性が決定されて、切換選択スイッチ26に
送られる。切換選択スイッチ26からの出力は係数乗算
器で係数g0 が乗算されて加算器30に送られる。雑音
コードブック23、24の励振符号ベクトルは、それぞ
れ切換選択スイッチ31、32で選択されて、それぞれ
のピッチ同期化回路33、34に送られる。ピッチ同期
化回路33、34は、それぞれ入力された雑音符号ベク
トルから適応コードブック21で得られたピッチラグ分
だけを取り出して繰り返すような形に変形するPSI
(Pitch Synchronous Innovation:ピッチ同期化)処理
を施して、それぞれ極性付与回路35、36を介して加
算器37に送る。加算器37からの加算出力は係数乗算
器38に送られて係数g1 が乗算され、加算器30に送
られる。加算器30からの出力は、上記線形予測合成フ
ィルタ15に送られる。上記聴覚重み付き波形歪最小化
回路17は、線形予測合成フィルタ15からの合成出力
と、上記低音量抑圧回路13からの音声との間の誤差が
最小となるように、励振源の適応コードブック21のピ
ッチラグ、切換選択スイッチ27、31、32の選択状
態、極性付与回路28、35、36の正負の極性、及び
係数乗算器29、38の係数g0,g1 を制御する。
応コードブック21と、固定コードブック22と、2つ
の雑音コードブック23、24とが用いられる。適応コ
ードブック21は、励振源から合成フィルタ16に送ら
れる信号を入力とし、上記入力音声から検出されたピッ
チの周期(ピッチラグ)に応じた遅延量だけ遅延して出
力するためのものである。上記ピッチラグは、上記低音
量抑圧回路13からの音声信号をピッチ分析回路25に
より分析することで検出される。この適応コードブック
21を補完するために固定コードブック22が設けられ
ており、固定コードブック22を採用することにより無
声音の表現力が向上する。適応コードブック21及び固
定コードブック22から出力される励振符号ベクトル
は、切換選択スイッチ26によりいずれか一方が選択さ
れる。固定コードブック22内の励振符号ベクトルは切
換選択スイッチ27により選択され、極性付与回路28
により正負極性が決定されて、切換選択スイッチ26に
送られる。切換選択スイッチ26からの出力は係数乗算
器で係数g0 が乗算されて加算器30に送られる。雑音
コードブック23、24の励振符号ベクトルは、それぞ
れ切換選択スイッチ31、32で選択されて、それぞれ
のピッチ同期化回路33、34に送られる。ピッチ同期
化回路33、34は、それぞれ入力された雑音符号ベク
トルから適応コードブック21で得られたピッチラグ分
だけを取り出して繰り返すような形に変形するPSI
(Pitch Synchronous Innovation:ピッチ同期化)処理
を施して、それぞれ極性付与回路35、36を介して加
算器37に送る。加算器37からの加算出力は係数乗算
器38に送られて係数g1 が乗算され、加算器30に送
られる。加算器30からの出力は、上記線形予測合成フ
ィルタ15に送られる。上記聴覚重み付き波形歪最小化
回路17は、線形予測合成フィルタ15からの合成出力
と、上記低音量抑圧回路13からの音声との間の誤差が
最小となるように、励振源の適応コードブック21のピ
ッチラグ、切換選択スイッチ27、31、32の選択状
態、極性付与回路28、35、36の正負の極性、及び
係数乗算器29、38の係数g0,g1 を制御する。
【0013】この図1の装置は、各部をハードウェアで
構成してもよいが、一部あるいは全部をDSP(ディジ
タル信号プロセッサ)等を用いてソフトウェア的に実現
してもよいことは勿論である。
構成してもよいが、一部あるいは全部をDSP(ディジ
タル信号プロセッサ)等を用いてソフトウェア的に実現
してもよいことは勿論である。
【0014】ここで、適応コードブック21のピッチラ
グ及び固定コードブック22の符号ベクトルの選択の従
来例について説明する。適応コードブック21のピッチ
ラグを選択する際には、ピッチ分析回路25における分
析によりピッチ強度の強い方から例えば6個のピッチラ
グを候補とし、ピッチ予測精度を向上させるため最高で
1/4サンプル精度で表現するようにして、最大で24
個のピッチラグに対応する適応コードブック21からの
出力について、線形予測合成した出力と聴覚重み付き入
力音声との間の誤差を小さくするような、例えば相関値
が最も高くなるようなものを、予備的に2個選択する。
同様に固定コードブック22についても、符号ベクトル
の線形予測合成出力と聴覚重み付き入力音声との相関値
の高いものを予備的に2個選択する。次に、これらの4
個の励振符号ベクトルの内で、聴覚重み付き入力音声に
対して最も相関の強い2個を選択し、それぞれについて
雑音コードブックを選択し、利得を決定した後、重み付
き入力音声との誤差の小さい方を選択するようにしてい
る。
グ及び固定コードブック22の符号ベクトルの選択の従
来例について説明する。適応コードブック21のピッチ
ラグを選択する際には、ピッチ分析回路25における分
析によりピッチ強度の強い方から例えば6個のピッチラ
グを候補とし、ピッチ予測精度を向上させるため最高で
1/4サンプル精度で表現するようにして、最大で24
個のピッチラグに対応する適応コードブック21からの
出力について、線形予測合成した出力と聴覚重み付き入
力音声との間の誤差を小さくするような、例えば相関値
が最も高くなるようなものを、予備的に2個選択する。
同様に固定コードブック22についても、符号ベクトル
の線形予測合成出力と聴覚重み付き入力音声との相関値
の高いものを予備的に2個選択する。次に、これらの4
個の励振符号ベクトルの内で、聴覚重み付き入力音声に
対して最も相関の強い2個を選択し、それぞれについて
雑音コードブックを選択し、利得を決定した後、重み付
き入力音声との誤差の小さい方を選択するようにしてい
る。
【0015】ところで、適応コードブック21と固定コ
ードブック22の選択は、単に重み付き入力音声との相
関でのみ決定されるが、例えば高調波成分を多く含んだ
音声から特定の低域周波数が支配的な音声に入力が変化
すると適応コードブックの状態が追従できず、結果的に
相関の強い固定コードブックの方が多く選択されること
がある。しかし、これを復号した場合には、音声の連続
性が著しく損なわれ、最悪の場合には波形歪を発生する
こともある。
ードブック22の選択は、単に重み付き入力音声との相
関でのみ決定されるが、例えば高調波成分を多く含んだ
音声から特定の低域周波数が支配的な音声に入力が変化
すると適応コードブックの状態が追従できず、結果的に
相関の強い固定コードブックの方が多く選択されること
がある。しかし、これを復号した場合には、音声の連続
性が著しく損なわれ、最悪の場合には波形歪を発生する
こともある。
【0016】そこで、本発明の実施の形態においては、
線形予測分析回路14での計算中に得られる線形予測残
差エネルギを用いて、現在の入力音声の特定の低域周波
数成分が強い場合、予測利得が十分大きくなることに着
目し、この時には強制的に適応コードブックを選択する
ようにしている。
線形予測分析回路14での計算中に得られる線形予測残
差エネルギを用いて、現在の入力音声の特定の低域周波
数成分が強い場合、予測利得が十分大きくなることに着
目し、この時には強制的に適応コードブックを選択する
ようにしている。
【0017】すなわち、図1において、切換選択スイッ
チ26を切換制御するスイッチ制御回路19を設け、こ
のスイッチ制御回路19には、聴覚重み付き波形歪最小
化回路17からの情報のみならず、線形予測分析回路1
4での計算中に得られる線形予測残差エネルギ情報も供
給するようにしている。これらの情報に基づいて、スイ
ッチ制御回路19は切換選択スイッチ26を切換制御す
る。このときの動作について、図2のフローチャートを
参照しながら説明する。
チ26を切換制御するスイッチ制御回路19を設け、こ
のスイッチ制御回路19には、聴覚重み付き波形歪最小
化回路17からの情報のみならず、線形予測分析回路1
4での計算中に得られる線形予測残差エネルギ情報も供
給するようにしている。これらの情報に基づいて、スイ
ッチ制御回路19は切換選択スイッチ26を切換制御す
る。このときの動作について、図2のフローチャートを
参照しながら説明する。
【0018】図2において、ステップS101で上述し
た適応コードブック21の予備選択により2個の候補を
選択し、そのコードブック出力を線形予測合成した出力
と聴覚重み付き入力音声との間の相関評価値を保持して
おく。次のステップS102では、上記サブフレーム毎
に線形予測分析で求めた初期の信号エネルギe0 と、最
終の線形予測残差エネルギeL との比である予測利得e
L/e0が、所定の閾値THより小さい(eL/e0<T
H)か否かを判別する。信号エネルギe0 は、入力音声
の線形予測分析区間内のサンプルの二乗和により求めら
れる。また、線形予測残差エネルギeL は、入力音声を
線形予測分析する際のパーコル係数(偏自己相関係数)
を求める過程で得られる値である。線形予測分析区間
は、例えば、上記サブフレーム(10ms)の中央を中心
として、サブフレームの前後に1/2サブフレームずつ
オーバーラップさせた20msの区間である。上記閾値T
Hとしては、例えば−24dB以下とすることが挙げら
れる。
た適応コードブック21の予備選択により2個の候補を
選択し、そのコードブック出力を線形予測合成した出力
と聴覚重み付き入力音声との間の相関評価値を保持して
おく。次のステップS102では、上記サブフレーム毎
に線形予測分析で求めた初期の信号エネルギe0 と、最
終の線形予測残差エネルギeL との比である予測利得e
L/e0が、所定の閾値THより小さい(eL/e0<T
H)か否かを判別する。信号エネルギe0 は、入力音声
の線形予測分析区間内のサンプルの二乗和により求めら
れる。また、線形予測残差エネルギeL は、入力音声を
線形予測分析する際のパーコル係数(偏自己相関係数)
を求める過程で得られる値である。線形予測分析区間
は、例えば、上記サブフレーム(10ms)の中央を中心
として、サブフレームの前後に1/2サブフレームずつ
オーバーラップさせた20msの区間である。上記閾値T
Hとしては、例えば−24dB以下とすることが挙げら
れる。
【0019】上記ステップS102でYES、すなわち
eL/e0<THであると判別された場合には、予測利得
が十分取れており有声音であると判断して、ステップS
103に進んで固定コードブックの検索を行わず評価値
を0にした後、ステップS104に進む。これに対し
て、ステップS102でNOと判別された場合には、ス
テップS105に進み、上述した通常の固定コードブッ
クサーチにより候補を2個選択し、ステップS104に
進む。ステップS104では、4個の候補の各評価値に
基づいて最終的に候補を2個選択するが、ステップS1
03において固定コードブックの評価値が0となってい
れば、強制的に適応コードブックを選択することにな
る。
eL/e0<THであると判別された場合には、予測利得
が十分取れており有声音であると判断して、ステップS
103に進んで固定コードブックの検索を行わず評価値
を0にした後、ステップS104に進む。これに対し
て、ステップS102でNOと判別された場合には、ス
テップS105に進み、上述した通常の固定コードブッ
クサーチにより候補を2個選択し、ステップS104に
進む。ステップS104では、4個の候補の各評価値に
基づいて最終的に候補を2個選択するが、ステップS1
03において固定コードブックの評価値が0となってい
れば、強制的に適応コードブックを選択することにな
る。
【0020】図3は、入力音声を符号化して復号したと
きの波形歪の軽減の様子を説明するための図であり、図
中の曲線aが元の入力音声信号を示し、曲線bが本実施
の形態により符号化を行った場合の復号音声信号を示
し、曲線cが従来の方法により符号化を行った場合の復
号音声信号を示している。これらの各曲線a〜cを比較
すれば明らかなように、従来の方法では入力音声の周波
数成分が大きく変化するときに復号音声に生じていた波
形歪が、本実施の形態の方法により符号化を行うことに
より大幅に軽減され、元の入力音声に近いことが分か
る。
きの波形歪の軽減の様子を説明するための図であり、図
中の曲線aが元の入力音声信号を示し、曲線bが本実施
の形態により符号化を行った場合の復号音声信号を示
し、曲線cが従来の方法により符号化を行った場合の復
号音声信号を示している。これらの各曲線a〜cを比較
すれば明らかなように、従来の方法では入力音声の周波
数成分が大きく変化するときに復号音声に生じていた波
形歪が、本実施の形態の方法により符号化を行うことに
より大幅に軽減され、元の入力音声に近いことが分か
る。
【0021】次に、本発明に係る他の実施の形態につい
て説明する。この実施の形態においては、上述した適応
及び固定コードブックの選択時に、直前のサブフレーム
が適応コードブックであり、かつそのサブフレームの信
号エネルギPSUB が所定の閾値PTHより大きいとき、強
制的に適応コードブックを選択するようにしている。こ
のサブフレームのエネルギPSUB は、線形予測分析区間
内のサンプルを二乗和したものであり、例えば上記サブ
フレームが10msのとき、線形予測分析区間はサブフレ
ームの前後に1/2サブフレームずつのオーバーラップ
を設けて20msの区間となる。
て説明する。この実施の形態においては、上述した適応
及び固定コードブックの選択時に、直前のサブフレーム
が適応コードブックであり、かつそのサブフレームの信
号エネルギPSUB が所定の閾値PTHより大きいとき、強
制的に適応コードブックを選択するようにしている。こ
のサブフレームのエネルギPSUB は、線形予測分析区間
内のサンプルを二乗和したものであり、例えば上記サブ
フレームが10msのとき、線形予測分析区間はサブフレ
ームの前後に1/2サブフレームずつのオーバーラップ
を設けて20msの区間となる。
【0022】図4は、この実施の形態の要部動作を説明
するためのフローチャートである。この図4において、
ステップS201で上述した適応コードブック21の予
備選択により2個の候補を選択し、そのコードブック出
力を線形予測合成した出力と聴覚重み付き入力音声との
間の相関評価値を保持しておく。次のステップS202
では、直前のサブフレームの選択結果が適応コードブッ
クであり、かつ、現在のサブフレームのエネルギPSUB
(例えばそのサブフレームにおけるサンプルの二乗和)
が所定の閾値PTHより大きい(PSUB>PTH) か否かを
判別する。このステップS202でYES、すなわち前
サブフレームが適応コードブックでかつPSUB>PTH で
ある、と判別された場合には、有声音であると判断し
て、ステップS203に進んで固定コードブックの検索
を行わず評価値を0にした後、ステップS204に進
む。これに対して、ステップS202でNOと判別され
た場合には、ステップS205に進み、上述した通常の
固定コードブックサーチにより候補を2個選択し、ステ
ップS204に進む。ステップS204では、4個の候
補の各評価値に基づいて最終的に候補を2個選択する
が、ステップS203において固定コードブックの評価
値が0となっていれば、強制的に適応コードブックを選
択することになる。
するためのフローチャートである。この図4において、
ステップS201で上述した適応コードブック21の予
備選択により2個の候補を選択し、そのコードブック出
力を線形予測合成した出力と聴覚重み付き入力音声との
間の相関評価値を保持しておく。次のステップS202
では、直前のサブフレームの選択結果が適応コードブッ
クであり、かつ、現在のサブフレームのエネルギPSUB
(例えばそのサブフレームにおけるサンプルの二乗和)
が所定の閾値PTHより大きい(PSUB>PTH) か否かを
判別する。このステップS202でYES、すなわち前
サブフレームが適応コードブックでかつPSUB>PTH で
ある、と判別された場合には、有声音であると判断し
て、ステップS203に進んで固定コードブックの検索
を行わず評価値を0にした後、ステップS204に進
む。これに対して、ステップS202でNOと判別され
た場合には、ステップS205に進み、上述した通常の
固定コードブックサーチにより候補を2個選択し、ステ
ップS204に進む。ステップS204では、4個の候
補の各評価値に基づいて最終的に候補を2個選択する
が、ステップS203において固定コードブックの評価
値が0となっていれば、強制的に適応コードブックを選
択することになる。
【0023】ここで、一般に無声音は音量が低く、有声
音は音量が高いことから、現在の音声レベルが高いとき
に、前サブフレームで適応コードブックを選択されてい
る場合には、有声音であると判断でき、無条件で適応コ
ードブックを選択するようにする。
音は音量が高いことから、現在の音声レベルが高いとき
に、前サブフレームで適応コードブックを選択されてい
る場合には、有声音であると判断でき、無条件で適応コ
ードブックを選択するようにする。
【0024】従って、この実施の形態においても、入力
音声の周波数成分が大きく変化する等により従来では有
声音であるにもかかわらず固定コードブックが選択され
るような場合でも、ステップS202により有声音であ
ることが判別でき、適応コードブックが強制的に選択さ
れるため、復号音声において生じ得る音声波形歪を軽減
することができる。
音声の周波数成分が大きく変化する等により従来では有
声音であるにもかかわらず固定コードブックが選択され
るような場合でも、ステップS202により有声音であ
ることが判別でき、適応コードブックが強制的に選択さ
れるため、復号音声において生じ得る音声波形歪を軽減
することができる。
【0025】なお、本発明は上述した実施の形態のみに
限定されるものではなく、線形予測分析の際のフレーム
やサブフレームの具体的数値やサンプリング周波数等は
任意に変更してもよく、有声音か否かの判別条件も信号
エネルギに基づいて種々設定可能である。また、適応コ
ードブック及び固定コードブックを選択的に切り換えて
用いる符号化は、上記PSI−CELP符号化に限定さ
れない。この他、本発明の要旨を逸脱しない範囲で種々
の変更が可能である。
限定されるものではなく、線形予測分析の際のフレーム
やサブフレームの具体的数値やサンプリング周波数等は
任意に変更してもよく、有声音か否かの判別条件も信号
エネルギに基づいて種々設定可能である。また、適応コ
ードブック及び固定コードブックを選択的に切り換えて
用いる符号化は、上記PSI−CELP符号化に限定さ
れない。この他、本発明の要旨を逸脱しない範囲で種々
の変更が可能である。
【0026】
【発明の効果】本発明によれば、入力音声の信号エネル
ギに基づいて有声音か否かの判別を行い、有声音と判別
されたときに適応コードブックを強制的に選択するよう
にしているため、入力音声の周波数成分が大きく変化す
る等により従来では有声音であるにもかかわらず固定コ
ードブックが選択されるような場合でも、適応コードブ
ックが強制的に選択されるため、復号音声において生じ
得る音声波形歪を軽減することができる。
ギに基づいて有声音か否かの判別を行い、有声音と判別
されたときに適応コードブックを強制的に選択するよう
にしているため、入力音声の周波数成分が大きく変化す
る等により従来では有声音であるにもかかわらず固定コ
ードブックが選択されるような場合でも、適応コードブ
ックが強制的に選択されるため、復号音声において生じ
得る音声波形歪を軽減することができる。
【0027】ここで、上記判別の際には、初期の信号エ
ネルギe0 に対する線形予測残差エネルギeL の比率で
ある予測利得e0/eLが所定の閾値THよりも小さい
(e0/eL <TH)か否かを条件とすることにより、
有声音の判別が確実に行える。また、上記判別の際に、
直前の線形予測分析区間で適応コードブックが選択され
かつ現在の線形予測分析区間の信号エネルギPSUB が所
定の閾値PTHよりも大きい(PSUB>PTH) か否かを条
件とすることによっても、有声音の判別が確実に行え
る。
ネルギe0 に対する線形予測残差エネルギeL の比率で
ある予測利得e0/eLが所定の閾値THよりも小さい
(e0/eL <TH)か否かを条件とすることにより、
有声音の判別が確実に行える。また、上記判別の際に、
直前の線形予測分析区間で適応コードブックが選択され
かつ現在の線形予測分析区間の信号エネルギPSUB が所
定の閾値PTHよりも大きい(PSUB>PTH) か否かを条
件とすることによっても、有声音の判別が確実に行え
る。
【図1】本発明の実施の形態を説明するための符号化装
置の概略構成を示すブロック図である。
置の概略構成を示すブロック図である。
【図2】本発明の実施の形態の要部動作を説明するため
のフローチャートである。
のフローチャートである。
【図3】本発明の実施の形態による波形歪の軽減の様子
を説明するための図である。
を説明するための図である。
【図4】本発明の他の実施の形態の要部動作を説明する
ためのフローチャートである。
ためのフローチャートである。
14 線形予測分析回路、 16 線形予測合成フィル
タ、 17 聴覚重み付き波形歪最小化回路、 19
スイッチ制御回路、 21 適応コードブック、 22
固定コードブック、 23,24 雑音コードブッ
ク、 25 ピッチ分析回路、 26,27,31,3
2 切換スイッチ、 29,38 係数乗算器、 3
3,34 ピッチ同期化回路
タ、 17 聴覚重み付き波形歪最小化回路、 19
スイッチ制御回路、 21 適応コードブック、 22
固定コードブック、 23,24 雑音コードブッ
ク、 25 ピッチ分析回路、 26,27,31,3
2 切換スイッチ、 29,38 係数乗算器、 3
3,34 ピッチ同期化回路
Claims (6)
- 【請求項1】 音声信号を合成するための励振源として
適応コードブックと固定コードブックとが少なくとも設
けられて、適応コードブック又は固定コードブックのい
ずれか一方を選択して出力を合成フィルタに供給する際
に、 入力音声の信号エネルギに基づいて有声音か否かの判別
を行い、 有声音と判別されたときに上記適応コードブックを強制
的に選択することを特徴とする音声符号化方法。 - 【請求項2】 上記判別は、初期の信号エネルギに対す
る線形予測残差エネルギの比率である予測利得が所定の
閾値よりも小さいときに有声音であると判別することを
特徴とする請求項1記載の音声符号化方法。 - 【請求項3】 上記判別は、直前に適応コードブックが
選択されかつ現在の信号エネルギが所定の閾値よりも大
きいときに有声音であると判別することを特徴とする請
求項1記載の音声符号化方法。 - 【請求項4】 音声信号を合成するための励振源として
設けられた適応コードブックと固定コードブックとのい
ずれか一方からの出力を合成フィルタに供給する音声符
号化装置において、 入力音声の信号エネルギに基づいて有声音か否かの判別
を行い、有声音と判別されたときに強制的に上記適応コ
ードブックを選択制御するスイッチ制御手段を有するこ
とを特徴とする音声符号化装置。 - 【請求項5】 上記スイッチ制御手段は、初期の信号エ
ネルギに対する線形予測残差エネルギの比率である予測
利得が所定の閾値よりも小さいときに上記適応コードブ
ックを強制的に選択制御することを特徴とする請求項4
記載の音声符号化装置。 - 【請求項6】 上記スイッチ制御手段は、直前に適応コ
ードブックが選択されかつ現在の信号エネルギが所定の
閾値よりも大きいときに上記適応コードブックを強制的
に選択制御することを特徴とする請求項4記載の音声符
号化装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8179178A JPH1020891A (ja) | 1996-07-09 | 1996-07-09 | 音声符号化方法及び装置 |
US08/882,156 US6003001A (en) | 1996-07-09 | 1997-06-25 | Speech encoding method and apparatus |
MXPA/A/1997/004987A MXPA97004987A (en) | 1996-07-09 | 1997-07-01 | Apparatus and method for the codification of ha |
BR9703903A BR9703903A (pt) | 1996-07-09 | 1997-07-09 | Processo e aparelho para codificação de voz |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8179178A JPH1020891A (ja) | 1996-07-09 | 1996-07-09 | 音声符号化方法及び装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH1020891A true JPH1020891A (ja) | 1998-01-23 |
Family
ID=16061307
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP8179178A Withdrawn JPH1020891A (ja) | 1996-07-09 | 1996-07-09 | 音声符号化方法及び装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US6003001A (ja) |
JP (1) | JPH1020891A (ja) |
BR (1) | BR9703903A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6678651B2 (en) * | 2000-09-15 | 2004-01-13 | Mindspeed Technologies, Inc. | Short-term enhancement in CELP speech coding |
KR100416362B1 (ko) * | 1998-09-16 | 2004-01-31 | 텔레폰아크티에볼라게트 엘엠 에릭슨 | Celp 인코딩/디코딩 방법 및 장치 |
JP2007041593A (ja) * | 2005-08-01 | 2007-02-15 | Samsung Electronics Co Ltd | 音声信号のハーモニック成分を用いた有声音/無声音分離情報を抽出する方法及び装置 |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69737012T2 (de) | 1996-08-02 | 2007-06-06 | Matsushita Electric Industrial Co., Ltd., Kadoma | Sprachkodierer, sprachdekodierer und aufzeichnungsmedium dafür |
JP3707153B2 (ja) * | 1996-09-24 | 2005-10-19 | ソニー株式会社 | ベクトル量子化方法、音声符号化方法及び装置 |
JP4132154B2 (ja) * | 1997-10-23 | 2008-08-13 | ソニー株式会社 | 音声合成方法及び装置、並びに帯域幅拡張方法及び装置 |
CN1143268C (zh) | 1997-12-24 | 2004-03-24 | 三菱电机株式会社 | 声音编码方法、声音译码方法、声音编码装置和声音译码装置 |
US6249758B1 (en) * | 1998-06-30 | 2001-06-19 | Nortel Networks Limited | Apparatus and method for coding speech signals by making use of voice/unvoiced characteristics of the speech signals |
US7072832B1 (en) | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
JP4550176B2 (ja) * | 1998-10-08 | 2010-09-22 | 株式会社東芝 | 音声符号化方法 |
DE60026189T2 (de) * | 1999-03-25 | 2006-09-28 | Yamaha Corp., Hamamatsu | Verfahren und Vorrichtung zur Wellenformkomprimierung und Erzeugung |
US6983242B1 (en) * | 2000-08-21 | 2006-01-03 | Mindspeed Technologies, Inc. | Method for robust classification in speech coding |
WO2002029682A1 (en) * | 2000-10-02 | 2002-04-11 | International Projects Consultancy Services, Inc. | Object-based workflow system and method |
US8712766B2 (en) * | 2006-05-16 | 2014-04-29 | Motorola Mobility Llc | Method and system for coding an information signal using closed loop adaptive bit allocation |
WO2009023807A1 (en) * | 2007-08-15 | 2009-02-19 | Massachusetts Institute Of Technology | Speech processing apparatus and method employing feedback |
KR101441896B1 (ko) * | 2008-01-29 | 2014-09-23 | 삼성전자주식회사 | 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치 |
US9325544B2 (en) * | 2012-10-31 | 2016-04-26 | Csr Technology Inc. | Packet-loss concealment for a degraded frame using replacement data from a non-degraded frame |
JP6366705B2 (ja) * | 2013-10-18 | 2018-08-01 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 確定的及びノイズ状情報を用いてオーディオ信号を符号化/復号化する概念 |
CN105745705B (zh) * | 2013-10-18 | 2020-03-20 | 弗朗霍夫应用科学研究促进协会 | 编码和解码音频信号的编码器、解码器及相关方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5732389A (en) * | 1995-06-07 | 1998-03-24 | Lucent Technologies Inc. | Voiced/unvoiced classification of speech for excitation codebook selection in celp speech decoding during frame erasures |
-
1996
- 1996-07-09 JP JP8179178A patent/JPH1020891A/ja not_active Withdrawn
-
1997
- 1997-06-25 US US08/882,156 patent/US6003001A/en not_active Expired - Fee Related
- 1997-07-09 BR BR9703903A patent/BR9703903A/pt active Search and Examination
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100416362B1 (ko) * | 1998-09-16 | 2004-01-31 | 텔레폰아크티에볼라게트 엘엠 에릭슨 | Celp 인코딩/디코딩 방법 및 장치 |
US6678651B2 (en) * | 2000-09-15 | 2004-01-13 | Mindspeed Technologies, Inc. | Short-term enhancement in CELP speech coding |
JP2007041593A (ja) * | 2005-08-01 | 2007-02-15 | Samsung Electronics Co Ltd | 音声信号のハーモニック成分を用いた有声音/無声音分離情報を抽出する方法及び装置 |
US7778825B2 (en) | 2005-08-01 | 2010-08-17 | Samsung Electronics Co., Ltd | Method and apparatus for extracting voiced/unvoiced classification information using harmonic component of voice signal |
Also Published As
Publication number | Publication date |
---|---|
US6003001A (en) | 1999-12-14 |
BR9703903A (pt) | 1998-11-03 |
MX9704987A (es) | 1998-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH1020891A (ja) | 音声符号化方法及び装置 | |
US5729655A (en) | Method and apparatus for speech compression using multi-mode code excited linear predictive coding | |
AU752229B2 (en) | Perceptual weighting device and method for efficient coding of wideband signals | |
JP2004510174A (ja) | Celp型音声符号化装置用の利得量子化 | |
WO2000011648A9 (en) | Speech encoder using voice activity detection in coding noise | |
EP2945158B1 (en) | Method and arrangement for smoothing of stationary background noise | |
US6826527B1 (en) | Concealment of frame erasures and method | |
WO2015021938A2 (en) | Adaptive high-pass post-filter | |
JP2000112498A (ja) | 音声符号化方法 | |
EP1103953A2 (en) | Method for concealing erased speech frames | |
JP2003044099A (ja) | ピッチ周期探索範囲設定装置及びピッチ周期探索装置 | |
US6842732B2 (en) | Speech encoding and decoding method and electronic apparatus for synthesizing speech signals using excitation signals | |
JP3510643B2 (ja) | 音声信号のピッチ周期処理方法 | |
JPH0830299A (ja) | 音声符号化装置 | |
JP3232701B2 (ja) | 音声符号化方法 | |
JPH05165497A (ja) | コード励振線形予測符号化器及び復号化器 | |
JP3232728B2 (ja) | 音声符号化方法 | |
JP2003195900A (ja) | 音声信号符号化装置、音声信号復号装置及び音声信号符号化方法 | |
JP2000089797A (ja) | 音声符号化装置 | |
JP4230550B2 (ja) | 音声符号化方法及び装置、並びに音声復号化方法及び装置 | |
Miki et al. | Pitch synchronous innovation code excited linear prediction (PSI‐CELP) | |
Tseng | An analysis-by-synthesis linear predictive model for narrowband speech coding | |
JP3332132B2 (ja) | 音声符号化方法および装置 | |
EP1212750A1 (en) | Multimode vselp speech coder | |
JPH08286700A (ja) | 音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20031007 |