JP3074680B2 - 音声復号器のポスト雑音整形フィルタ - Google Patents

音声復号器のポスト雑音整形フィルタ

Info

Publication number
JP3074680B2
JP3074680B2 JP63088922A JP8892288A JP3074680B2 JP 3074680 B2 JP3074680 B2 JP 3074680B2 JP 63088922 A JP63088922 A JP 63088922A JP 8892288 A JP8892288 A JP 8892288A JP 3074680 B2 JP3074680 B2 JP 3074680B2
Authority
JP
Japan
Prior art keywords
filter
short
predictor
noise shaping
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63088922A
Other languages
English (en)
Other versions
JPH01261930A (ja
Inventor
隆裕 野村
陽太郎 八塚
茂 飯塚
Original Assignee
ケイディディ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ケイディディ株式会社 filed Critical ケイディディ株式会社
Priority to JP63088922A priority Critical patent/JP3074680B2/ja
Priority to CA000581746A priority patent/CA1321025C/en
Publication of JPH01261930A publication Critical patent/JPH01261930A/ja
Application granted granted Critical
Publication of JP3074680B2 publication Critical patent/JP3074680B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、低ビットレートに符号化されたディジタル
音声信号を復号化し、雑音整形する音声復号化方式に関
する。
(従来技術) ディジタル海事衛星通信システムやSCPCによるディジ
タル・ビジネス衛星通信システムなどのように周波数帯
域の制限や送信電力の制限の厳しいシステムにあって
は、低ビットレートで、かつ高品質な符号化処理音声が
得られ、しかも伝送符号誤りの影響が非常に少ない音声
符号化・復号化方式が要求されている。
このような背景から種々の音声符号化・復号化方式が
すでに提案され、代表的な方式として、フレームごとに
予測係数を算出する予測器を用い標本値間の相関を取り
除いた残差信号を適応量子化器を用いて符号化する適応
予測符号化(APC)方式、又は複数個のパルスを音源と
してLPC合成フィルタを駆動するマルチパルス駆動線形
予測符号化(MPEC)方式等がある。
ここでは、従来の音声符号化・復号化方式として適応
予測符号化方式を例にとり説明する。
第1図(a)は、従来の適応予測符号化方式に用いる
符号器のブロック図である。まず、動作を説明する。デ
ィジタル入力音声信号Sjは、符号化入力端子1を介して
LPC分析器2と短時間予測器6に入力される。LPC分析器
2ではディジタル入力音声信号をもとにフレーム毎に短
時間スペクトル分析(以下、「LPC分析」と称す)を行
い、そこで得られたLPCパラメータをLPCパラメータ符号
器3を介して符号化し、多重回路30を介して符号器出力
端子31から受信側の復号器へ伝送する。又、LPCパラメ
ータ符号器3の出力をLPCパラメータ復号器4を介して
復号し、その出力から、LPCパラメータ・短時間予測パ
ラメータ変換器5を介して短時間予測パラメータを得
る。そして、この短時間予測パラメータを短時間予測器
6、雑音整形フィルタ19、局部復号用の短時間予測器24
に設定する。
引算器11では、この短時間予測パラメータを仕様した
短時間予測器6の出力をディジタル入力音声信号Sjから
差し引くことにより、音声波形の隣接サンプル間の相関
を取り除き短時間予測残残渣信号ΔSjを得る。この短時
間予測残差信号ΔSjは、ピッチ分析器7と長時間予測器
10に入力される。ピッチ分析器7では短時間予測残差信
号ΔSjをもとにフレーム毎にピッチ分析を行い、そこで
得られたピッチ周期とピッチ予測パラメータをピッチパ
ラメータ符号器8を介して符号化し、多重回路30を介し
て符号器出力端子31から受信側の復号器へ伝送する。一
方、ピッチ周期とピッチ予測パラメータをピッチパラメ
ータ復号器9を介して復号し、長時間予測器10、雑音整
形フィルタ19、局部復号用の長時間予測器23に設定す
る。
引算器12では、このピッチ周期とピッチ予測パラメー
タを使用した長時間予測器10の出力を短時間予測残差信
号ΔSjから差し引くことにより、音声信号のピッチによ
る繰り返し波形の相関を取り除き理想的に白色化された
長時間予測残差信号を得る。この長時間予測残差信号か
ら雑音整形フィルタ19の出力を引算器17を用いて差し引
き、最終予測残差信号としてこれを適応量子化器16で量
子化、符号化し、多重回路30を介して受信側の復号器へ
伝送する。又、この符号化された最終予測残差信号は逆
量子化器18を介して復号化・逆量子化され引算器20及び
加算器21に入力される。引算器20では、この量子化され
た最終予測残差信号から適応量子化器16の入力信号であ
る最終予測残差信号を差し引くことにより量子化雑音を
得、これを雑音整形フィルタ19に入力する。
サブフレーム毎に量子化ステップサイズを更新するた
めに、前述の長時間予測残差信号はRMS計算器13でRMS値
が計算され、RMS値符号器14で符号化されて、その出力
レベルを基準レベルとし、併せて近傍のレベルをRMS値
符号器14内に記憶しておく。そして、RMS値符号器14の
出力信号はRMS値復号器15を介して復号され、特にこの
基準レベルに対応した量子化されたRMS値を基準RMS値と
し、これにあらかじめ用意しておいた基本ステップサイ
ズを掛け合せることにより適応量子化器16のステップサ
イズを決定する。一方、逆量子化器18の出力信号である
量子化された最終予測残渣信号に局部復号用長時間予測
器23の出力を加算器21を介して加算する。更に、これを
局部復号用長時間予測器23に入力すると共に、局部復号
用短時間予測器24の出力を加算器22を介して加算し、こ
れを局部復号用短時間予測器24の入力とする。この様な
過程によって局部復号されたディジタル入力音声信号
Sj′が得られる。この局部復号されたディジタル入力音
声信号Sj′と元のディジタル入力信号Sj′との差を誤差
信号として引算器26を介して求める。サブフレーム間に
渡って、この誤差信号の電力を最小誤差電力検出器27で
計算する。そして、あらかじめ用意されている全ての基
本ステップサイズと記憶しておいた基準レベルの近傍レ
ベルについても同様な一連の動作を行い、以上得られた
誤差信号電力の内で最小な電力を与える符号化RMSレベ
ルと基体ステップサイズを選択しこれを多重回路30を介
して符号器出力端子31から受信側の復号器へ伝送する。
なお、ステップサイズの符号化に際してはステップサイ
ズ符号器29を用いている。
第1図(b)は、従来の適応予測符号化方式に用いる
復号器のブロック図である。
復号器では、復号器入力端子32を介して入力された信
号は、最終残渣信号に関する信号、RMS値やステップサ
イズに関する信号、及びLPCパラメータやピッチ周期・
ピッチ予測パラメータに関する信号とに多重分離回路33
を用いて分離され、各々、適応逆量子化器36、RMS値復
号器35、ステップサイズ復号器34、LPCパラメータ復号
器38、及びピッチパラメータ復号器37に入力される。
RMS値復号器35を用いてRMS値を復号し、これと、ステ
ップサイズ復号器34を介して得られた基本ステップサイ
ズとを適応逆量子化器36に設定する。そして、受信され
た最終予測残渣信号に関する信号を適応逆量子化器36を
用いて逆量子化し、量子化された最終予測残渣信号を得
る。一方、LPCパラメータ復号器38を介して復号しLPCパ
ラメータ・短時間予測パラメータ変換器39を介して得ら
れた短時間予測パラメータを、加算器41とから短時間合
成フィルタを形成する短時間予測器43とポスト雑音整形
フィルタ44内の短時間予測器フィルタに設定し、更に、
ピッチパラメータ復号器37を介して復号されたピッチ周
期とピッチ予測パラメータを加算器40とから長時間合成
フィルタを形成する長時間予測器42に設定する。
加算器40では、長時間予測器42の出力を適応逆量子化
器35の出力に加算し、その出力を長時間予測器42の入力
とすると共に、更にこれに短時間予測器43の出力を加算
器41を介して加算することにより、再生音声信号を得
る。そして、この信号は短時間予測器43に入力すると共
に、ポスト雑音整形フィルタ44に入力され雑音整形が行
われる。更に、その信号はレベル調整器45にも入され、
ポスト雑音整形フィルタ44の出力と比較することにより
レベル調整を行う。
次に、符号器及び復号器に用いられている雑音整形フ
ィルタ19及びポスト雑音整形フィルタ44の構成について
述べる。
第2図は、従来の符号器内の雑音整形フィルタ19の一
構成図である。符号器内の雑音整形フィルタは量子化雑
音に対してのみ作用する。量子化雑音のスペクトルを音
声スペクトルに近い形に整形し音声でマスクすることに
より、聴感上の音声品質を改善するものである。
この動作を説明すると、まず、LPCパラメータ・短時
間予測パラメータ変換器5より得られた短時間予測パラ
メータを短時間予測器49に、又、ピッチパラメータ復号
器9より得られたピッチ周期、ピッチ予測パラメータを
長時間予測器47に設定する。次に、量子化雑音が引算器
20より長時間予測器47に入力され、その出力を量子化雑
音から引算器48を介して差し引く。そして、この引算器
48の出力を短時間予測器49に入力し、その出力と長時間
予測器47の出力を引算器50を介して加算し、これを引算
器17へ送る。この雑音整形フィルタの伝達関数F′
(z)は次式のようになり、基本的に零フィルタのみで
構成される。
F′(z) =rn1P1(z)+{1−rn1P1(z)}Ps(z/rsrns) (1) ここで、Ps(z)及びP1(z)は例えば、後述する
(2)式、(3)式からそれぞれ与えられる短時間予測
器6及び長時間予測器10の伝達関数、rsは短時間予測器
6、24と共通なリーケージ、rn1,rnsは、それぞれ長時
間予測器、短時間予測器の雑音整形荷重係数であり、各
々0≦rs,rn1,rns≦1の範囲の値である。従来の雑音整
形フィルタには、このrn1,rnsとして一定の値が用いら
れている。
(1)式に於ける短時間予測器6の伝達関数Ps(z)
は、次式で与えられる。
ここで、aiは短時間予測パラメータ(但し、a1
0)、Nsは短時間予測器のタップ数である。aiはフレー
ム単位毎にLPC分析器2を介してLPCパラメータ・短時間
予測パラメータ変換器5内で計算され、入力信号のスペ
クトルの変動に対してフレーム毎に適応的に変化する。
同様に、長時間予測器10の伝達関数も定義でき、特に、
1タップの予測器を用いる長時間予測器の伝達関数P
1(z)は、次式で与えられる。
P1(z)=b1z-Pp (3) ここで、b1はピッチ予測パラメータ、Ppはピッチ周期
を表す。このb1やPpもまたフレーム単位毎にピッチ分析
器7で計算され、入力信号の波形のピッチ周期性の変動
に対してフレーム毎に適応的に変化する。
このように符号器内の量子化雑音に対して雑音整形が
作用すると、等価的に復号器側での再生音声信号は、入
力音声信号と、雑音整形された量子化雑音 N0(1−Ps(z/rsrns))/(1−Ps(z/rs))・ ((1−rn1P1(z))/(1−P1(z)) (4) とからなる。N0は符号器内の適応量子化器16で発生した
量子化雑音である。
ここでは、長時間合成フィルタ内の長時間予測器23、
42及び短時間合成フィルタ内の短時間予測24、43とそれ
ぞれ同一のものが、(4)式の分母の極フィルタとし
て、直接量子化雑音に作用している。従って、零フィル
タの雑音整形荷重係数rns,rn1を大きく(1に近付け
る)すると、極フィルタと次第に打ち消しあい量子化雑
音N0そのものに近づき、雑音マスク効果が大幅に劣化す
る。逆に小さくすると、短時間予測器極フィルタの極周
波数近傍の量子化雑音N0の成分が過剰利得を得る為発信
気味となり、同時に非常に大きな位相ひずみも発生し、
音声品質が大きく劣化する。
このように短時間予測器6、24、43と同一の構成を持
っ極フィルタが必然的に量子化雑音に作用することか
ら、符号器内の雑音整形フィルタ19として、零フィルタ
だけで構成すると、量子化雑音が増加することも合わせ
雑音整形の調整を困難とし、更に、音声信号のスペクト
ル時間変動、即ち、音声信号の特徴を調べることなく一
定の雑音整形荷重係数を用いること、雑音整形を大きく
できず音声品質は若干改善されるものの大幅な改善は期
待できず、十分な音声品質が得られない。
また、通常1タップのフィルタで構成された長時間予
測器を雑音整形フィルタ内の短時間予測器フィルタと同
様な構成で導入しても、一般にピッチ予測パラメータ
(予測係数)の値が小さいことから、雑音整形の効果が
あまりないなどの問題がある。
第3図(a)及び(b)は、従来の復号器内のポスト
雑音整形フィルタ44の一構成図である。ポスト雑音整形
フィルタは再生された音声信号に、即ち入力音声信号と
量子化雑音の両方に作用する。従来方式では、(2)式
の短時間予測パラメータを雑音整形荷重係数により荷重
したフィルタ係数を持つ短時間予測器フィルタ52(極フ
ィルタ)をポスト雑音整形フィルタに用いている。
まず、極フィルタのみで構成されている第3図(a)
に示す様なポスト雑音整形フィルタの動作から説明す
る。LPCパラメータ・短時間予測パラメータ変換器39よ
り得られる短時間予測パラメータを短時間予測器極フィ
ルタ52に設定する。加算器41からの再生音声信号と短時
間予測器極フィルタ52の出力を加算器51を介して加算
し、それを短時間予測器極フィルタ52とレベル調整器45
に入力する。レベル調整器45を含めたこのポスト雑音整
形フィルタ44の伝達関数Fp′(z)としては、次式のよ
うになる。
ここで、G0′はゲインコントロールパラメータ、rps
は雑音整形荷重係数であり、0≦rps≦1の範囲の値で
ある。
次に、第3図(a)に更に零フィルタを加えた構成の
第3図(b)に示す様なポスト雑音整形フィルタの動作
を説明する。LPCパラメータ・短時間予測パラメータ変
換器39より得られる短時間予測パラメータを短時間予測
器の極フィルタ54と零フィルタ55に設定する。加算器41
からの再生音声信号と極フィルタ54の出力を加算器51を
介して加算し、これを極フィルタ54と零フィルタ55の入
力とする。加算器53の出力から零フィルタ55の出力を引
算器56を介して差し引き、この出力をレベル調整器45へ
入力する。レベル調整器45を含めたこのポスト雑音整形
フィルタの伝達関数Fpo′(z)としては、次式のよう
になる。
ここで、G0′はゲインコントロールパラメータ、
rpsz,rpspはそれぞれ零雑音荷重係数、極雑音整形荷重
係数であり、各々0≦rpsz,rpsp≦1の範囲の値であ
る。零フィルタの零点により極フィルタに於ける極周波
数近傍での過剰な利得と位相ひずみは抑えられるもの
の、これらのrpsz,rpspとして一定の値を用いており、
音声信号スペクトル変動との整合がとれず、而も音声信
号と量子化雑音との両方に同時に作用することからも、
大きく雑音整形することができない問題がある。
一方、詳細説明を省略するが、MPECにおいても、復号
器内において、入力音声と、合成フィルタから得られた
再生音声との誤差信号に対して、極及び零フィルタを持
った誤差荷重フィルタ(雑音整形フィルタに対応)を用
いその出力電力が最小となる様に駆動パルスの振幅及び
位置を最適に決定しているが、この場合にも誤差荷重フ
ィルタの極フィルタに於てのみ短時間予測パラメータに
一定の荷重係数をかけたものを用いるため、前述の雑音
整形フィルタ19(ポスト雑音整形フィルタ44)と同様に
有声音と無声音との双方で十分な音声品質が得られない
という問題点がある。
また、符号器内の誤差荷重フィルタは、誤差雑音だけ
に作用するよう構成されることから、等価的な復号器内
での再生音声は、入力音声信号と、雑音整形された誤差
雑音 N0/(1−Ps(z/rsrns)) (7) とからなる。即ち、誤差荷重フィルタ内の短時間予測器
極フィルタだけで雑音整形される。誤差荷重フィルタ内
の短時間予測器零フィルタは、短時間合成フィルタ内の
短時間予測器と作用が相殺するように導入されており、
全く同一のフィルタ係数とフィルタ構成を用いる必要が
あり、雑音整形そのものには寄与していない。従って、
誤差荷重フィルタ内の短時間予測器極フィルタの雑音整
形荷重係数を大きくすると、過剰位相ひずみや過剰利得
が発生し、発信気味の歪んだ音声になりやすいなどの問
題がある。
もし、仮に誤差荷重フィルタ内の短時間予測器零フィ
ルタに、短時間合成フィルタ内の短時間予測器とは異な
ったフィルタ係数を与えると、作用が相殺されないこと
から、雑音整形された誤差雑音は音声スペクトルの形と
は大きく異なる場合が発生し、誤差雑音のマスク効果が
著しく低下し、音声品質の改善効果が無くなるなど、誤
差荷重フィルタを自由に設計できないなどの問題もあ
る。
(発明が解決しようとする課題) 従来の符号器内の雑音整形フィルタ19は、等価的に短
時間予測器を基本とした零フィルタ構成のもとで量子化
雑音に対してのみ雑音整形を行っていることから、雑音
整形された量子化雑音には、短時間予測器と全く同一の
短時間予測器極フィルタが作用することとなり、上述の
ごとく過剰利得や過剰位相ひずみが多く発生し、効果的
な量子化雑音のマスク効果が得られない。また、マルチ
パルス符号化の場合には、上述のように短時間予測器極
フィルタだけを用いてその誤差荷重係数(雑音整形荷重
係数)によるスペクトル整形の為の誤差整形が大きくで
きず十分なマスク効果を得ることが出来ないなどの問題
があった。また、符号器内での雑音整形フィルタ構造に
は自由度が無いなどの問題があった。
一方、従来の復号器内のポスト雑音整形フィルタ44も
また、前述の音声信号のスペクトルの特徴を調べること
なく短時間予測パラメータに一定の荷重をかけているこ
と、ポスト雑音整形フィルタは、量子化雑音だけでなく
音声信号に対して同時に作用することなどから、無声音
に最適な大きい荷重係数を用いると有声音の部分で発振
ぎみの大きな歪やクリック音を非常に多く発生し、著し
く音声品質を劣化し、逆に、有声音に最適な荷重係数を
用いると無声音に対して十分な雑音整形とはならないな
ど、雑音整形を強く行えないなどの問題点があった。
このように、雑音整形フィルタ構成に十分な自由度が
なく、而も一定の荷重係数を用いた方式では、量子化雑
音だけでなく音声信号に対しても作用することからも、
大幅に雑音整形を強くできず、有声音と無声音との双方
で十分な音声品質が達成されない欠点がある。
本発明の目的は、上述した従来技術の問題点を解決す
るためになされたもので、有声音と無声音に関係なく良
好な音声品質が得られるポスト雑音整形フィルタを用い
た音声復号化方式を提供することにある。
(課題を解決するための手段) 本発明は、送信側から送られてきた符号化された予測
残差信号を、逆量子化器により復号・逆量子化した後、
該逆量子化器の出力信号と合成フィルタにより再生され
た予測信号とを加算して音声信号を再生する復号器に備
えられる、該再生された音声信号の量子化雑音の聴感的
影響を改善するためのポスト雑音整形フィルタにおい
て、短時間予測器極フィルタと、短時間予測器零フィル
タと、予測利得を判定し且つ当該予測利得に応じて、短
時間予測器零フィルタの雑音整形荷重係数と該雑音整形
荷重係数より常に大きい短時間予測器極フィルタの雑音
整形荷重係数とを選択し、短時間予測器零フィルタと短
時間予測器極フィルタとに同時にそれぞれ設定する短時
間予測器荷重係数選択器とを有するものである。
また、本発明は、送信側から送られてきた符号化され
た予測残差信号を、逆量子化器により復号・逆量子化し
た後、該逆量子化器の出力信号と合成フィルタにより再
生された予測信号とを加算して音声信号を再生する復号
器に備えられる、該再生された音声信号の量子化雑音の
聴感的影響を改善するためのポスト雑音整形フィルタに
おいて、短時間予測器極フィルタと、短時間予測器零フ
ィルタと、長時間予測器極フィルタと長時間予測器零フ
ィルタとを有しており、入力信号と長時間予測器極フィ
ルタからの出力信号とを加算する第1の加算手段と、第
1の加算手段の出力信号と長時間予測器零フィルタから
の出力信号とを加算する第2の加算手段とを有し、第1
の加算手段の出力信号が長時間予測器零フィルタ及び長
時間予測器極フィルタに入力されるように構成されてい
る。
本発明の他の実施形態によれば、予測利得を判定し且
つ当該予測利得に応じて、長時間予測器零フィルタの雑
音整形荷重係数と、該雑音整形荷重係数より常に大きい
長時間予測器極フィルタの雑音形荷重係数とを選択し、
長時間予測器零フィルタと長時間予測器極フィルタとに
同時にそれぞれ設定する長時間荷重係数選択器と、予測
利得を判定し且つ当該予測利得に応じて、短時間予測器
零フィルタの雑音整形荷重係数と、該雑音整形荷重係数
より常に大きい短時間予測器極フィルタの雑音形荷重係
数とを選択し、短時間予測器零フィルタと短時間予測器
極フィルタとに同時にそれぞれ設定する短時間荷重係数
選択器とを有するものである。
(発明の構成) 以下に、図面を用いて本発明を詳細に説明する。
なお、以下の説明では本発明と従来との相違点である
復号器に用いるポスト雑音整形フィルタの構成について
詳述し、他の構成については説明の重複を省くために省
略する。
第4図は、本発明による復号器に用いるポスト雑音整
形フィルタ44の一実施例形態のブロック図である。短時
間予測器極フィルタ72と、短時間予測器零フィルタ73
と、予測利得を判定し且つ当該予測利得に応じて、短時
間予測器零フィルタの零雑音整形荷重係数と、該零雑音
整形荷重係数より常に大きい短時間予測器極フィルタ72
の極雑音整形荷重係数とを選択し、短時間予測器零フィ
ルタ73と短時間予測器極フィルタ72とに同時にそれぞれ
設定する短時間予測器用荷重係数選択器76と、長時間予
測器極フィルタ68と、長時間予測器零フィルタ69と、予
測利得を判定し且つ当該予測利得に応じて、長時間予測
器零フィルタ69の零雑音整形荷重係数と、該零雑音整形
荷重係数より常に大きい長時間予測器極フィルタ68の極
雑音整形荷重係数とを選択し、長時間予測器零フィルタ
69と長時間予測器極フィルタ68とに同時にそれぞれ設定
する長時間予測器用荷重係数選択器75と、加算器67、7
0、71と減算器74とから構成される。
以下動作について詳細に説明する。
一般に、有声音は明確なスペクトルエンベロープを有
しており、特に、鼻音や語尾等は正弦波に近いので、短
時間スペクトル予測が当りやすく、又、それらの音声が
明かなピッチ構造も持つので、ピッチ予測も当りやす
く、量子化雑音も少ない。逆に、摩擦音等の無声音は、
ランダム雑音に近いスペクトルを有しており、又、明確
なピッチ構造も持たないため、短・長時間予測が当りに
くく、量子化雑音も多い。従って、ポスト雑音整形フィ
ルタは、量子化雑音だけでなく入力音声信号にも作用す
ることからも、予測の当り具合を調べることにより音声
の特徴に合った雑音整形を行うことは必要不可欠であ
る。
ここで、予測の当り具合として、LPCパラメータ復号
器38の出力である。LPCパラメータ(反射係数)kiを用
いることもできる。一般に、有声音、鼻音、或は、語尾
等は予測利得が高いので|ki|が1に近い。また、摩擦音
等の無声音は、予測利得が低いので|ki|が0に近い。そ
こで、予測利得を定めるパラメータGは次式から求ま
る。
この式は、パラメータGが0に近いと予測利得が高
く、1に近いと予測利得が低いことを意味することか
ら、このパラメータGの小さい有声音には弱く(雑音整
形荷重係数を小さく)、大きいわたり音や無声音には強
く(雑音整形荷重係数を大きく)雑音整形することが可
能となる。
従って、短時間予測器用荷重係数選択器76では、LPC
パラメータ復号器38の出力であるLPCパラメータから予
測の当り具合(予測利得)を評価することにより、LPC
パラメータ・短時間予測パラメータ変換器39の出力であ
る短時間予測パラメータをフレーム周期毎に荷重する為
の極及び零雑音整形荷重係数とを選択し、短時間予測器
極フィルタ72と零フィルタ73とに同時にそれぞれ設定す
る。更に、長時間予測器用荷重係数選択器75でも、同様
にピッチパラメータ復号器37の出力であるピッチ予測パ
ラメータから予測の当り具合(ピッチ予測パラメータを
用いた予測利得)を評価することにより、同ピッチ予測
パラメータをフレーム周期毎に荷重する為の極及び零雑
音整形荷重係数とを選択し、長時間予測器極フィルタ68
と零フィルタ69とに同時にそれぞれ設定する。ここで、
短時間及び長時間予測器極フィルタ68、72の極雑音整形
荷重係数は、後述の具体的数値例でしめす如く、短時間
及び長時間予測器零フィルタ69、73の零雑音整形荷重係
数より常に大きい値を持っている。
入力信号としての引算器41からの再生音声信号と長時
間予測器極フィルタ68の出力とを加算器67で加算し、長
時間予測器極フィルタ68と零フィルタ69に入力する。こ
の加算器67の出力と長時間予測器零フィルタ69の出力と
を加算器70で加算し、長時間予測器フィルタによる雑音
整形出力を得る。更に、この出力を入力信号として、短
時間予測器極フィルタ72の出力とを加算器71で加算し、
短時間予測器極フィルタ72と零フィルタ73に入力する。
この加算器71の出力から短時間予測器零フィルタ73の出
力を引算器74で差し引くことにより、短時間予測器フィ
ルタによる雑音整形出力を得る。その出力をポスト雑音
整形フィルタ44の出力としてレベル調整器45へ送り、ポ
スト雑音整形フィルタ44の出力と比較することによりレ
ベル調整を行い出力し、最終的な再生声信号を得る。
レベル調整器45を含めた本発明のポスト雑音整形フィ
ルタの伝達関数Fp(z)は、次式で与えられる。
但し、rpsp,rpsz,rplp,rplzは、各々、短時間予測器
極・零フィルタ72、73の零・極雑音整形荷重係数、長時
間予測器極・零フィルタ68、69の零・極雑音整形荷重係
数をそれぞれ表す。尚、フレーム周期毎に短時間予測パ
ラメータを短時間予測器フィルタ72、73に、また、ピッ
チ周期及びピッチ予測パラメータを長時間予測器フィル
タ68、69にそれぞれ設定することが当然必要であるが、
ここでは、本発明の説明を簡単にする為、設定されてい
ることを前提として、第4図では省略している。
符号器内の雑音整形フィルタは量子化雑音だけに作用
するのに対して、第1図(b)から明らかなように、ポ
スト雑音整形フィルタ44は、加算器41と短時間予測器43
からなる短時間合成フィルタ及び加算器40と長時間予測
器42からなる長時間合成フィルタとに従属接続されてい
ることから、再生された音声、即ち、常に入力音声信号
と量子化雑音の両方に同時に作用する。
また、ポスト雑音整形フィルタ44内には、短時間予測
器極フィルタ72の他に、雑音整形荷重係数以外は全て同
じ構成を持つ短時間予測器零フィルタ73が導入されてい
るが、この動作は、短時間合成フィルタ内の短時間予測
器43の動作により完全に相殺されることはない。(マル
チパルス符号器内での雑音整形の場合は、前記の説明の
如く相殺されてしまう。) ここでは、予測利得に従って、短時間予測器零フィル
タの零雑音整形荷重係数と、これより常に大きい関係に
ある短時間予測器極フィルタの極雑音整形荷重係数とを
それぞれ同時に切替えることと、雑音整形が音声信号と
量子化雑音の両方に同時に同じように作用することか
ら、符号器内の雑音整形フィルタ19の場合と異なり、音
声信号のスペクトラム構造に整合した雑音整形を強く行
うことができ、音声品質の著しい改善が図られる。
また、これらの短時間予測器極及び零フィルタ72、73
は、スペクトル上で、極フィルタ72の極周波数位置と零
フィルタ73の零点周波数位置とを重ね、更に、短時間予
測器零フィルタ73の荷重係数を、短時間予測器極フィル
タ72の荷重係数より常に小さくすることにより、極周波
数近傍での位相ひずみと過剰利得を常に防ぐなど、LPC
スペクトルのホルマント構造を反映し且つ制御しやすい
スペクトル特性を実現している。而も有声音や無声音の
スペクトル変動に応じてこれらの荷重係数を制御するこ
とから、量子化雑音へのマスク効果を非常にうまく高め
ることが可能となる。
特に、このスペクトル特性では、単なる短時間予測器
極フィルタ72だけにより雑音整形されたスペクトル特性
よりも、短時間予測器極フィルタ72の極周波数近傍での
過剰な利得が大幅に抑えられると共に、この近傍での過
剰な位相ひずみの発生も非常に少なくなる利点があり、
入力音声信号にも同時に作用するにも関わらず非常に大
きく雑音整形することができ、著しいマスク効果による
音声品質改善が簡単に図れる。
一方、短時間予測器零フィルタ73の零雑音整形荷重係
数を固定のままで、短時間予測器極フィルタ73の極雑音
整形荷重係数だけを音声信号の予測利得により切り替え
た場合には、短時間予測器零フィルタ73と短時間予測器
極フィルタ72との周波数−利得特性のバランスが崩れ、
極周波数領域での過剰利得の制御が効果的にできず、而
も大きな位相ひずみが発生する場合もあり、また、入力
音声信号そのものへも構成上当然影響することから、短
時間予測器零フィルタ73の挿入の利点が大幅に減少して
しまう。従って、必ず短時間予測器極フィルタ72と短時
間予測器零フィルタ73の雑音整形荷重係数両方を同時に
切り替える必要がある。
従って、本発明に示すように、短時間予測器極フィル
タ72の極雑音整形荷重係数を短時間予測器零フィルタ73
のそれより常に大きくなるよう設定し、而も音声信号の
予測利得によって、短時間予測器極フィルタ72と短時間
予測器零フィルタ73の両雑音整形荷重係数を、より大き
な値に、或いはより小さな値に同時に切り替えることに
より、上記の問題点が上手く解決できる。
上記の理由から、雑音整形を強く行っても、極周波数
近傍での過剰利得や不足利得の回避と過剰な位相ひずみ
の回避とを常に達成することができる。この結果、安定
且つ大幅な雑音整形が可能となり、再生された音声品質
が従来方式より格段に改善される。
また、これらの長時間予測器フィルタ、68、69に関し
ては、長時間予測器零フィルタ69と、減算器ではなく加
算器70とを用いた構成とすることにより、長時間予測器
極フィルタ68の極の周波数位置を長時間予測器零フィル
タ69の零点と零点との中間の周波数位置に置くことがで
き、常に極周波数の近傍の利得を上げると共に、その近
傍の帯域幅も広くでき、ピッチ周波数近傍の成分を強調
できるとともに雑音整形できる。
一般に、ピッチ予測パラメータの値は比較的小さく、
而も長時間予測残差信号のピッチ波形部分のピーク値が
量子化器によりクリッピングされる場合が多く、有声音
のような予測利得が高い部分でもそのピッチ周波数近傍
成分は大きく劣化して再生される。従って、本発明の実
施形態のように加算器70を用いた構成のもとで、長時間
予測器フィルタ68、69の零・極雑音整形荷重係数を音声
の予測利得を基に切り替えることにより、ピッチ周波数
近傍の成分を常に程よく強調でき、有声音の部分は勿論
のこと、無声音に近い部分に於ても雑音整形による雑音
マスク効果が非常に大きい。
上記の説明のごとく、短時間予測器極及び零フィルタ
72、73と長時間予測器極及び零フィルタ68、69と加算器
67、70、71と減算器74とを用い、而も極雑音整形荷重係
数を常に零雑音整形荷重係数より大きくしたポスト雑音
整形フィルタ44を構成し、それらの零・極雑音整形荷重
係数を音声信号の予測利得によって切り替えることによ
り、音声のホルマント成分、特に広域のホルマント成分
と、ピッチ成分とを非常に少ない位相ひずみのもとで最
適に強調することができるために、音声品質の聴感的改
善が著しく図れる。
従って、低ビットレートの符号化音声に於ても、メリ
ハリがあり、且つ聴感的な量子化雑音が非常に少なく明
瞭な音声(こもらない音声)を再現することができる。
具体的な構成例としては、まず、ポスト雑音整形フィ
ルタの短時間予測器フイルタ72、73の極・零雑音整形荷
重係数の切替えの為に短時間予測器用荷重係数選択器76
において、スペクトルエンベロープ情報にLPCパラメー
タkiを用いた場合、すなわち、前述と同様に、予測利得
として(8)式のパラメータGを用いた場合について示
す。パラメータGについてスレッショールドGth2,Gth3
を用いて、rpsp,rpszを、次式のように切換え設定す
る。
G<Gth2:rpsp=rpsth1,rpsz=rpsth4 Gth2≦G<Gth3:rpsp=rpsth2,rpsz=rpsth5 (10) Gth3≦G:rpsp=rpsth3,rpsz=rpsth6 但し、0≦Gth2≦Gth3≦1, 0≦rpsth1≦rpsth2≦rpsth3≦1, 0≦rpsth4≦rpsth5≦rpsth6≦1 このように短時間予測器極フィルタ72及び零フィルタ
73の荷重係数を同時に切換えることにより、音声スペク
トルに合った雑音整形を実施することができる。又、長
時間予測器フィルタ68、69に対しても同様のことがで
き、(8)式を用いることも可能である。ここでは、説
明を簡単化するために1タップフィルタを用いた例を説
明する。ピッチ予測パラメータb1は0<b1<1の範囲の
値でピッチ周期間の相関度を表し、b1が1に近づくと、
ピッチ構造が明確となり長時間予測利得も大きくなる。
よって、b1が大きい有声音の場合には弱く、小さいわた
り音(半母音)の場合には強く雑音整形を行うことがで
きる。ここで、b1に対して、スレッショールドbthを設
け、rplp,rplzを、次式のように切換え、それぞれ設定
する。
b1<bth:rplp=rplth2,rplz=rplth4 bth≦b1:rplp=rplth1,pplz=rplth3 (11) 但し、0≦bth≦1, 0≦rplth1≦rplth2≦1, 0≦rplth3≦rplth4≦1 このように長時間予測器極フィルタ68及び零フィルタ
69の荷重係数を同時に切換えることにより、有声音など
の音声スペクトルに合った雑音整形を実施することがで
きる。
なお、第4図では荷重係数選択器(75,76)として、
長時間予測器フィルタ68、69と短時間予測器フィルタ7
2、73とで別々のものを使用した構成例を示したが、同
一の荷重係数選択器を用いてもよい。
次に、パラメータの具体的数値例として、9.6Kbpsの
最大量子化適応予測符号化方式(APC−MLQ)のシュミレ
ーションに用いた雑音整形荷重係数を以下に示す。
(a)復号器のレベル調整器45を含むポスト雑音整形フ
ィルタ44の伝達関数として(9)式を、予測信号の当り
具合としてLPCパラメータをもちいた場合((10)式の
パラメータ)。
G<0.08:rpsp=0.25,rpsz=0.075、 0.08≦G<0.4:rpsp=0.6,rpsz=0.18、 0.4≦G:rpsp=0.9,rpsz=0.27。 (12) (b)復号器の長時間予測フィルタの予測信号の当り具
合として、ピッチ予測パラメータをもちいた場合((1
1)式のパラメータ)。
b1<0.4:rplp=0.62,rplz=0.31、 0.4≦b1:rplp=0.35,rplz=0.175 (13) (発明の効果) 以上の説明の如く、ポスト雑音整形フィルタに荷重係
数選択器75、76と、長時間予測器極フィルタ68及び零フ
ィルタ69と、短時間予測器極フィルタ72及び零フィルタ
73とを用い、かつ長時間予測器極フィルタ68の出力を加
算器67で加算し、零フィルタ69の出力を加算器70で加算
するように構成し、而も極フィルタの極雑音荷重係数を
零フィルタの零雑音荷重係数より常に大きく設定し、予
測利得に応じて極フィルタと零フィルタの雑音整形荷重
係数を同時に切り替えることにより、極フィルタに起因
した過剰利得や過度の位相ひずみによる異音の発生も無
く、従来技術よりも大幅に雑音整形を強く行うことがで
きるため、量子化雑音の聴感上の影響を大きく低減し、
かつメリハリのある明瞭な音声を再現することが可能と
なる。
更に、本発明は、上記の如くポスト雑音整形フィルタ
の雑音整形荷重係数を予測の当り具合(予測利得)に応
じて量子化雑音の聴感的なマスク効果が最適になるよう
変化させると共に、ポスト雑音整形フィルタの出力のレ
ベルを調整して最終的なディジタル音声信号を再生する
ことにより、有声音・無声音に関係なく非常に良好な音
声品質が達成される。また、予測の当り具合として、LP
Cパラメータ及びピッチ予測パラメータ等を用いること
により、本発明を簡単に実現することもできる。
従って、本発明によるポスト雑音整形フィルタを用い
た音声復号化方式は、非常に高品質な音声を再生できる
低ビットレートの高能率音声復号化方式を実現すること
が可能となり、その効果が極めて大である。
【図面の簡単な説明】
第1図(a)及び(b)は従来の音声符号化・復号化方
式及び音声復号化方式の構成図、第2図は従来の符号化
器に用いる雑音整形フィルタの構成図、第3図(a)及
び(b)は従来の復号化器に用いるポスト雑音整形フィ
ルタの構成図、第4図は本発明の復号化器に用いるポス
ト雑音整形フィルタの構成図である。 1……符号器入力端子、2……LPC分析器、 3……LPCパラメータ符号器、4,38……LPCパラメータ復
号器、 5,39……LPCパラメータ・短時間予測パラメータ変換
器、 6,24,43,49……短時間予測器、 7……ピッチ分析器、8……ピッチパラメータ符号器、 9,37……ピッチパラメータ復号器、 10,23,42,47……長時間予測器、11,12,17,20,26,48,56,
74……引算器、 13……RMS計算器、14……RMS値符号器、 15,35……RMS値復号器、16……適応量子化器、 18,36……逆量子化器、19……雑音整形フィルタ、 21,22,40,41,50,51,53,67,70,71……加算器、 25……局部復号信号端子、27……最小誤差電力検出器、 28……RMS値ステップサイズ選択器、 29……ステップサイズ符号器、30……多重回路、 31……符号器出力端子、32……復号化器入力端子、 33……多重分離回路、34……ステップサイズ復号器、 44……ポスト雑音整形フィルタ、 45……レベル調整器、46……復号器出力端子 52,54,72……短時間予測器極フィルタ、 55,73……短時間予測器零フィルタ、 68……長時間予測器極フィルタ、 69……長時間予測器零フィルタ、 75……長時間予測器用荷重係数選択器、 76……短時間予測器用荷重係数選択器。
フロントページの続き (56)参考文献 特開 昭61−184912(JP,A) 特表 昭62−500138(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 19/00 - 19/14 H03M 3/00 - 11/00 JICSTファイル(JOIS)

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】送信側から送られてきた符号化された予測
    残差信号を、逆量子化器により復号・逆量子化した後、
    該逆量子化器の出力信号と合成フィルタにより再生され
    た予測信号とを加算して音声信号を再生する復号器に備
    えられる、該再生された音声信号の量子化雑音の影響を
    改善するためのポスト雑音整形フィルタにおいて、 短時間予測器極フィルタと、短時間予測器零フィルタ
    と、 予測利得を判定し且つ当該予測利得に応じて、前記短時
    間予測器零フィルタの雑音整形荷重係数と、該雑音整形
    荷重係数より常に大きい前記短時間予測器極フィルタの
    雑音整形荷重係数とを選択し、前記短時間予測器零フィ
    ルタと前記短時間予測器極フィルタとに同時にそれぞれ
    設定する短時間荷重係数選択器と を有することを特徴とするポスト雑音整形フィルタ。
  2. 【請求項2】送信側から送られてきた符号化された予測
    残差信号を、逆量子化器により復号・逆量子化した後、
    該逆量子化器の出力信号と合成フィルタにより再生され
    た予測信号とを加算して音声信号を再生する復号器に備
    えられる、該再生された音声信号の量子化雑音を取り除
    くためのポスト雑音整形フィルタにおいて、 短時間予測器極フィルタと、短時間予測器零フィルタ
    と、 長時間予測器極フィルタと長時間予測器零フィルタとを
    有しており、 入力信号と前記長時間予測器極フィルタからの出力信号
    とを加算する第1の加算手段と、前記第1の加算手段の
    出力信号と前記長時間予測器零フィルタからの出力信号
    とを加算する第2の加算手段とを有し、前記第1の加算
    手段の出力信号が前記長時間予測器零フィルタ及び前記
    長時間予測器極フィルタに入力されるように構成されて
    いることを特徴とするポスト雑音整形フィルタ。
  3. 【請求項3】予測利目を判定し且つ当該予測利得に応じ
    て、前記長時間予測器零フィルタの雑音整形荷重係数
    と、該雑音整形荷重係数より常に大きい前記長時間予測
    器極フィルタの雑音整形荷重係数とを選択し、前記長時
    間予測器零フィルタと前記長時間予測器極フィルタとに
    同時にそれぞれ設定する長時間荷重係数選択器と、 予測利得を判定し且つ当該予測利得に応じて、前記短時
    間予測器零フィルタの雑音整形荷重係数と、該雑音整形
    荷重係数より常に大きい前記短時間予測器極フィルタの
    雑音整形荷重係数とを選択し、前記短時間予測器零フィ
    ルタと前記短時間予測器極フィルタとに同時にそれぞれ
    設定する短時間荷重係数選択器と を有すること特徴とする請求項2に記載のポスト雑音整
    形フィルタ。
JP63088922A 1988-04-13 1988-04-13 音声復号器のポスト雑音整形フィルタ Expired - Lifetime JP3074680B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP63088922A JP3074680B2 (ja) 1988-04-13 1988-04-13 音声復号器のポスト雑音整形フィルタ
CA000581746A CA1321025C (en) 1988-04-13 1988-10-31 Speech signal coding/decoding system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63088922A JP3074680B2 (ja) 1988-04-13 1988-04-13 音声復号器のポスト雑音整形フィルタ

Publications (2)

Publication Number Publication Date
JPH01261930A JPH01261930A (ja) 1989-10-18
JP3074680B2 true JP3074680B2 (ja) 2000-08-07

Family

ID=13956406

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63088922A Expired - Lifetime JP3074680B2 (ja) 1988-04-13 1988-04-13 音声復号器のポスト雑音整形フィルタ

Country Status (2)

Country Link
JP (1) JP3074680B2 (ja)
CA (1) CA1321025C (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3071800B2 (ja) * 1990-02-23 2000-07-31 株式会社東芝 適応ポストフィルタ
JP3274451B2 (ja) * 1990-02-23 2002-04-15 株式会社東芝 適応ポストフィルタ及び適応ポストフィルタリング方法
JP3076086B2 (ja) * 1991-06-28 2000-08-14 シャープ株式会社 音声合成装置用ポストフィルタ
ES2164640T3 (es) * 1991-08-02 2002-03-01 Sony Corp Codificador digital con asignacion dinamica de bits de cuantificacion.
US5710862A (en) * 1993-06-30 1998-01-20 Motorola, Inc. Method and apparatus for reducing an undesirable characteristic of a spectral estimate of a noise signal between occurrences of voice signals
JP3360423B2 (ja) * 1994-06-21 2002-12-24 三菱電機株式会社 音声強調装置
US5819213A (en) * 1996-01-31 1998-10-06 Kabushiki Kaisha Toshiba Speech encoding and decoding with pitch filter range unrestricted by codebook range and preselecting, then increasing, search candidates from linear overlap codebooks
JP4735711B2 (ja) * 2008-12-17 2011-07-27 ソニー株式会社 情報符号化装置
JP2010160496A (ja) * 2010-02-15 2010-07-22 Toshiba Corp 信号処理装置および信号処理方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0727398B2 (ja) * 1985-02-12 1995-03-29 日本電気株式会社 定数可変型聴感的重み付けフイルタ
JPS62111299A (ja) * 1985-11-08 1987-05-22 松下電器産業株式会社 音声信号特徴抽出回路
JPS62111300A (ja) * 1985-11-08 1987-05-22 松下電器産業株式会社 音声分析合成回路

Also Published As

Publication number Publication date
JPH01261930A (ja) 1989-10-18
CA1321025C (en) 1993-08-03

Similar Documents

Publication Publication Date Title
US10181327B2 (en) Speech gain quantization strategy
EP0764941B1 (en) Speech signal quantization using human auditory models in predictive coding systems
RU2325707C2 (ru) Способ и устройство для эффективного маскирования стертых кадров в речевых кодеках на основе линейного предсказания
US7020605B2 (en) Speech coding system with time-domain noise attenuation
US5790759A (en) Perceptual noise masking measure based on synthesis filter frequency response
EP0732686B1 (en) Low-delay code-excited linear-predictive coding of wideband speech at 32kbits/sec
EP0764939B1 (en) Synthesis of speech signals in the absence of coded parameters
EP0814458B1 (en) Improvements in or relating to speech coding
US20060116874A1 (en) Noise-dependent postfiltering
KR20030046451A (ko) 음성 코딩을 위한 코드북 구조 및 탐색 방법
US5913187A (en) Nonlinear filter for noise suppression in linear prediction speech processing devices
JP3033060B2 (ja) 音声予測符号化・復号化方式
US6205423B1 (en) Method for coding speech containing noise-like speech periods and/or having background noise
JP3074680B2 (ja) 音声復号器のポスト雑音整形フィルタ
CA2378035A1 (en) Coded domain noise control
RU2707144C2 (ru) Аудиокодер и способ для кодирования аудиосигнала
WO1997031367A1 (en) Multi-stage speech coder with transform coding of prediction residual signals with quantization by auditory models
JP4295372B2 (ja) 音声符号化装置
JPH0786952A (ja) 音声の予測符号化方法
CN100369108C (zh) 编码域中的音频增强的方法和设备
JPH08139688A (ja) 音声符号化装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term