JP3071800B2 - 適応ポストフィルタ - Google Patents

適応ポストフィルタ

Info

Publication number
JP3071800B2
JP3071800B2 JP2041286A JP4128690A JP3071800B2 JP 3071800 B2 JP3071800 B2 JP 3071800B2 JP 2041286 A JP2041286 A JP 2041286A JP 4128690 A JP4128690 A JP 4128690A JP 3071800 B2 JP3071800 B2 JP 3071800B2
Authority
JP
Japan
Prior art keywords
signal
filter
circuit
output
post
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2041286A
Other languages
English (en)
Other versions
JPH03245195A (ja
Inventor
公生 三関
政巳 赤嶺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2041286A priority Critical patent/JP3071800B2/ja
Publication of JPH03245195A publication Critical patent/JPH03245195A/ja
Application granted granted Critical
Publication of JP3071800B2 publication Critical patent/JP3071800B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) この発明は音声信号等を高能率に圧縮する音声符号化
方式に係り、特に合成音声信号の主観品質を高めるため
に復号側で用いられる適応ポストフィルタに関する。
(従来の技術) 音声信号を10kbit/s程度以下の伝送量で符号化する従
来方式として、CELP(Code Excited Linear Predictio
n)方式が知られている。
CELP方式は、入力信号を予測フィルタで予測したとき
に得られる予測残差信号を、聴感重み付けられた合成音
声信号のレベルで量子化するために、出力合成信号に含
まれるノイズを少なくできることを特徴とする音声符号
化方式である。この方式を原理とする方式は他の方式と
比べて良好な音声符号化を行えるので近年広く用いられ
てきている(例えば、この内容は「M.R.Schroeder and
B.S.Atal,“Code−Excited Linear Prediction(CEL
P):high quality speech at very low bit rates,"Pro
c.IEEE Int.Conf.Acoust.,Speech,Signal Processing,p
p.937−940(1985).」に記載されている。)通常、CE
LP方式においては復号化された合成音声信号は最終的に
適応ポストフィルタを介して出力される。この適応ポス
トフィルタはパラメータを適切に設定することによりス
ペクトル包絡やピッチのくり返しを強調して合成音声信
号に含まれるノイズを抑える効果があり、主観品質を向
上させるために用いられる。
この適応ポストフィルタはノイズを抑えると同時に、
出力音声信号のパワーを増大させてしまうので、従来は
ポストフィルタの入力信号と出力信号のパワーがサブフ
レーム単位で同じになるようにポストフィルタの出力信
号にゲインを乗じて出力信号のパワーを制御している。
しかしながら、上記のパワー制御では、パワーの変化
の激しい音声に対しては、ブロック間で出力信号に不連
続点が発生し、結果としてポストフィルタリングされた
出力音声信号の品質が劣化するという欠点がある。
第15図に「P.Kroon and E.F.Deprettere,“A Class o
f Analysis−by−Synthesis Predictive Coders for Hi
gh Quality Speech Coding at Rates Between 4.8 and
16kbits/s",IEEE SAC−6,February.1988.pp.353〜363」
に記載されているように、一般に用いられる適応ポスト
フィルタのブロック図を示す。CELP方式ではポストフィ
ルタは復号されたスペクトル包絡を表すLPC合成フィル
タとスペクトルの微細構造を表すピッチ合成フィルタと
の両方の継続結合で表され、サブフレーム単位で更新し
て用いられる。
(発明が解決しようとする課題) 上述したように、従来の適応ポストフィルタはサブフ
レーム単位でポストフィルタの出力信号にゲインを乗じ
ることにより入力信号と出力信号のサブフレーム内のパ
ワーが同じになるように出力音声信号のパワー制御を行
っている。このため、パワーの変化の激しい音声信号に
対しては最終的にゲインを乗じて出力される出力音声信
号波形がサブフレーム単位で不連続になりやすく、ポス
トフィルタを用いることで、波形の不連続による新たな
品質劣化を生じるという問題点があった。
本発明はこのような問題に鑑みなされたもので、入力
信号のパワーの変化に依存せず、波形が連続的で、ノイ
ズの少い高品質な出力音声信号が得られる適応ポストフ
ィルタを提供することを目的とする。
[発明の構成] (課題を解決するための手段) 本発明は、合成音声信号を入力して雑音整形された音
声信号を出力する適応ポストフィルタにおいて、フレー
ム内の音声信号に対するLPC係数を得る手段と、 このLPC係数をもとにポストフィルタを生成する手段
と、 このポストフィルタに入力する合成音声信号を得る手
段と、 ポストフィルタの零入力応答を得る手段と、 合成音声信号を入力したときのポストフィルタの零状
態応答を得る手段と、 合成音声信号と零入力応答と零状態応答とを用いてポ
ストフィルタのゲインを再設定する手段とを有すること
を特徴とする適応ポストフィルタを提供するものであ
る。
(作用) 本発明では、ポストフィルタの入力信号と出力信号と
のパワーが一致するようにサブフレーム単位でポストフ
ィルタのゲイン(すなわち、入力信号のゲイン)を計算
される前記零入力応答と零状態応答と合成音声信号とを
用いて再設定するので、サブフレーム間の入力信号のゲ
イン再設定による不連続部分の雑音もポストフィルタ
(一般に低域通過形フィルタ)を通過するため、自動的
に雑音整形され、出力信号は連続波形となる。
しかもそのパワーは入力信号と完全に一致するため、
ポストフィルタの雑音整形の効果の利点を十分に生かす
ことができ、よりノイズの少ない高品質は音声信号を生
成することができる。
(実施例) 以下に本発明の適応ポストフィルタのゲイン再設定の
方法の原理に基づく第1の実施例を第1図のブロック図
と第2図のフローチャートとを用いて説明する。
第1図(C)に示すように、いま入力信号Px(n)
(復号された合成音声信号)がポストフィルタの入力端
子26から入力されて乗算器27でゲインaを乗じられた後
にポストフィルタ28を通過して得られる出力信号をPy
(n)とする。このとき入力信号と出力信号のパワーが
等しい条件は次式で表される。
ここでLはゲインを再設定する区間長を表す。
第1図(c)のように入力側でゲインを乗じる構成の
ポストフィルタの出力信号Py(n)は次式のように分解
することができる。
Py(n)=Py0(n)+a・Py1(n) ……(2) ここで、Py0(n)は第1図(a)に示すように、入
力信号が零の場合のポストフィルタの内部状態だけで出
力される出力信号(零入力応答)を表し、Py1(n)は
第1図(b)に示すように、ポストフィルタの内部状態
が零にリセットされた状態で、Px(n)にゲインを乗じ
ないで直接ポストフィルタに入力した場合に出力される
出力信号(零状態応答)を表す。
また、aはポストフィルタのゲインの再設定値を表
す。
最適なゲインの再設定値aは(2)式を(1)式に代
入して得られるaの2次方程式を解けば決定する。すな
わち、 をaについて解けば、 が得られる。
第2図は上述の本発明の原理に基づいて、ポストフィ
ルタの出力を計算する方法の1例を示すフローチャート
である。
第2図の処理11でポストフィルタのフィルタ係数を設
定し、ポストフィルタの内部状態を一時保持する。
次に処理12で設定されたポストフィルタに零の入力信
号を入力し、零入力応答Py0(n)を求める。
処理13でポストフィルタに入力する入力信号X(n)
をセットする処理14でポストフィルタの内部状態を零に
リセットし、Px(n)を入力して零状態応答Py1(n)
を求める。
処理16で、処理12,13,14でそれぞれ求められた零入力
応答Py0(n),入力信号Px(n),零状態応答Py1
(n)を用いて(3)式(4)式より最適なポストフィ
ルタのゲインaを計算する。
処理17で処理11において保持されたポストフィルタの
内部状態を再びセットし、第1図(c)に示すように入
力信号Px(n)に最適ゲインaを乗じてポストフィルタ
を通過させて出力信号Py(n)を求める。
以上の処理によって生成されたポストフィルタ出力信
号Py(n)は前述したように、入力信号Px(n)とパワ
ーが完全に一致し、しかも、ゲインが入力側で乗じられ
るポストフィルタの構成となっているため、ゲインの異
なる区間の間で生じる不連続部分の雑音もポストフィル
タリングされて自動的に雑音整形され、出力音声信号Py
(n)は連続波形となるので、ポストフィルタの雑音整
形の効果が十分生かされて、出力音声信号Py(n)の主
観品質は大幅に向上する。
本実施例では最適ポストフィルタゲインaを入力信号
Px(n)に乗じた信号をポストフィルタに通過させて出
力信号Py(n)を求める方法を説明したが、零入力応答
Py0(n)と零状態応答Py1(n)と最適ゲインaとを用
いて前述の(2)式に基づいて出力信号Py(n)を求め
ることもできる。
また、(4)式において平行根の内部の値m2−lnが負
となる場合は最適ゲインaとして、 を用いることができる。
第3図および第4図は本発明の第2の実施例に係る適
応ポストフィルタをCELP方式の音声符号化装置および復
号化装置に適用した場合のブロック図である。
第3図において、フレームバッファ101は入力端子100
に入力される音声信号を1フレーム分蓄積する回路であ
り、第3図の各ブロックはフレームバッファ101を用い
て1フレーム又は1サブフレーム毎に以下の処理を行
う。
まず、1フレーム分の音声信号に対して予測パラメー
タ計算回路102において、公知の方法を用いて短時間予
測パラメータを計算する(通常、この予測パラメータは
8〜12個計算される。)計算法については、例えば(古
井貞照著「ディジタル音声処理」)に記述されている。
計算された予測パラメータは、予測パラメータ符号化回
路103に入力される。予測パラメータ符号化回路103は、
予測パラメータを予め定められた量子化ビット数に基づ
いて符号化し、その符号をマルチプレクサ115へ出力す
ると共に、復号値Pを予測フィルタ104、聴感重みフィ
ルタ105、影響信号作成回路107、長期ベクトル量子化回
路109および短期ベクトル量子化回路111へ出力する。
予測フィルタ104は、フレームバッファ101からの入力
音声信号と符号化回路103からの予測パラメータの復号
値から短期予測残差信号rを計算し、それを聴感重みフ
ィルタ105へ出力する。
聴感重みフィルタ105は、予測パラメータの復号値P
を基に構成されるフィルタで短期予測残差信号rのスペ
クトルを変形した信号xを減算回路106へ出力する。こ
の聴感重みフィルタ105は従来例における重み付けフィ
ルタと同様に聴覚のマスキング効果を利用するためのも
のであり、その詳細は上記文献に記載されているので、
説明は省略する。
影響信号作成回路107は、加算回路112からの過去の重
み付けされた合成信号と、予測パラメータの復号値P
を入力とし、過去の影響信号fを出力する。具体的には
過去の重み付けされた合成信号フィルタの内部状態と
する聴感重みフィルタの零入力応答を計算し、それを影
響信号fとして、予め設定されるサブフレーム単位で出
力する。8KHzサンプリング時のサブフレーム中の典型的
な値としては、1フレーム(160サンプル)を4分割し
た40サンプル程度が使用される。影響信号作成回路107
は、第1サブフレームにおいては前フレームの合成信号
を入力として影響信号fを作成する。減算回路106
は、サブフレーム単位で聴感重み付き入力信号xから過
去の影響信号fを差し引いた信号uを減算回路108およ
び長期ベクトル量子化回路109へ出力する。
長期ベクトル量子化回路109は、減算回路106からの差
信号u、後述の駆動信号保持回路110からの過去の駆動
信号exおよび符号化回路103からの予測パラメータPを
入力とし、サブフレーム単位で差信号uの量子化出力信
号を減算回路108および加算回路112へ、ベクトルゲイ
ンβおよびインデックスTをマルチプレクサ115へ、長
期駆動信号tを駆動信号保持回路110へそれぞれ出力す
る。このときtととの間には、=t*h(hは聴感
重みフィルタ105のインパルス応答、*は畳み込みを表
わす)という関係がある。
サブフレーム単位のベクトルゲインβ(m)とインデッ
クスT(m)(mはサブフレームの番号)の詳細な求め方の
一例を以下に示す。
予め設定されるインデックスTとゲインβと過去の駆
動信号を用いて現サブフレームの駆動信号候補を作成
し、これを聴感重みフィルタに入力して差信号uの量子
化信号の候補を作成し、差信号uと量子化信号の候補と
の誤差が最小となるように最適なインディックスT(m)
最適なβ(m)を決定する。このときT(m)とβ(m)を用いて
作成される現サブフレームの駆動信号をtとし、tを聴
感重みフィルタに入力して得られる信号を差信号uの量
子化出力信号とする。
これと同様な方法は、例えば「PETER KROON氏らによ
るIEEE 1988年2月、Vol.SAC−6.pp.353−363」に掲載
の“A Class of Analysis−by−Synthesic Predicative
Coders for High Quality Speech Coding at Rates Be
tween 4.8 and 16kbits/s"と題する論文中の閉ループで
ピッチ予測器の係数を求める方法と同様の公知の方法を
用いることができる。
一方、減算回路108ではサブフレーム単位で差信号
から量子化出力信号uを減じた差信号Vを短期ベクトル
量子化回路111へ出力する。
短期ベクトル量子化回路111は、差信号Vおよび予測
パラメータPを入力とし、サブフレーム単位で差信号V
の量子化出力信号を加算回路112へ、短期駆動信号y
を駆動信号保持回路110へそれぞれ出力する。ここで
とyとの間には、、=y*hという関係がある。
また、これと共に短期ベクトル量子化回路111は短期
駆動信号を構成するゲインGおよびコードベクトルのイ
ンデックスIをマルチプレクサ115へ出力する。
短期ベクトル量子化回路111の具体的な構成例を第5
図に示す。第5図において、合成ベクトル生成回路301
は予測パラメータPと、予め設定されるコードブック30
2内のコードベクトルC(i)(iはコードベクトルのイン
デックス)とから、パルス列を作成し、このパルス列を
予測パラメータPから生成される聴感重みフィルタで合
成することにより、合成ベクトルV(i)を生成し、内積計
算回路304およびパワー計算回路305へ出力する。コード
ブック302はパルスの振幅情報を格納し、インデックス
iに対して予め定められたコードベクトルC(i)が引き出
し可能なメモリ回路またはベクトル発生回路で構成され
る。内積計算回路304は、第3図の減算回路108からの差
信号Vと、合成ベクトルV(i)との内積値A(i)を求め、イ
ンデックス選択回路306へ出力する。パワー計算回路305
は、合成ベクトルV(i)のパワーB(i)を求め、インデック
ス選択回路306へ出力する。
インデックス選択回路306では、内積値A(i)とパワーB
(i)を用いて、次式の評価値 {A(i)2/B(i) (28) が最も大きくなるようなインデックスIをインデックス
候補iの中から選択し、対応する内積値A(I)とパワーB
(I)の組をゲイン量子化回路307へ出力する。また、イン
デックス選択回路306はさらにインデックスIの情報を
コードブック302および第3図のマルチプレクサ115へ出
力する。
ゲイン符号化回路307では、インデックス選択回路306
からの内積値A(I)とパワーB(I)との比 A(I)/B(I) (29) を所定の方法で符号化して、そのゲイン情報Gを短期駆
動信号生成回路308および第3図のマルチプレクサ115へ
出力する。
上の(28)(29)式は、例えばI.M.Trancoso氏らによ
るInternational Conference on Acoustic,speech and
Signal Processingの論文“EFFICIENT PROCEDURES FOR
FINDING THE OPTIMUM INNOVATION IN STOCHATIC CODER
S"によって提案されたものを用いてもよい。
短期駆動信号生成回路308は、ゲイン情報G、および
インデックスIに対応するコードベクトルC(I)を入力と
し、C(I)を用いて上記合成ベクトル生成回路301での方
法と同様の方法でパルス列を作成し、そのパルス振幅に
ゲイン情報Gに対応する値を乗じ、短期駆動信号yを生
成する。この短期駆動信号yは、聴感重みフィルタ309
および第3図の駆動信号保持回路110へ出力される。聴
感重みフィルタ309は第3図の聴感重みフィルタ105と同
様の特性を持つフィルタであり、予測パラメータPを基
にして作られ、短期駆動信号yを入力として差信号Vの
量子化出力を第3図の加算回路112へ出力する。
第3図に説明を戻すと、駆動信号保持回路110は長期
ベクトル量子化回路109より出力される長期駆動信号t
および短期ベクトル量子化回路111より出力される短期
駆動信号yを入力とし、駆動信号exをサブフレーム単位
で長期ベクトル量子化回路109へ出力する。具体的に
は、例えばtとyをサブフレーム単位でサンプル毎に加
算したものを駆動信号exとすればよい。現サブフレーム
の駆動信号exは、次のサブフレームにおいて過去の駆動
信号として長期ベクトル量子化回路109において使用で
きるように、駆動信号保持回路110内のバッファメモリ
に保持される。
加算回路122は、サブフレーム単位で量子化出力(m)
および(m)と、現サブフレームで作成された過去の影
響信号fとの和信号xを求め、影響信号作成回路107へ
出力する。
以上のようにして求められた各パラメータP,β,T,G,I
の情報がマルチプレクサ115により多重化され、伝送符
号として出力端子116より伝送される。
次に、第3図の復号化装置から伝送された符号を復号
する第4図の復号化装置について説明する。
第4図において、入力端子200には伝送された符号が
入力される。デマルチプレクサ201はこの入力符号をま
ず予測パラメータ、ゲインβ、ゲインG、インデックス
TおよびインデックスIの符号に分離する。復号化回路
202〜207は、それぞれゲインG、インデックスI、ゲイ
ンβおよびインデックスTの符号を復号し、駆動信号生
成回路209へ出力する。もう一つの復号化回路208は、符
号化された予測パラメータを復号し、合成フィルタ210
へ出力する、駆動信号生成回路209は、復号された各パ
ラメータを入力とし、駆動信号を生成する。
駆動信号生成回路209は、具体的には例えば第6図に
示すように構成される。第6図において、コードブック
500は符号化装置内の第5図に示すコードブック302と同
一機能を有するものであり、インデックスIに対応する
コードベクトルC(I)を短期駆動信号生成回路501へ出力
する。短期駆動信号生成回路501は、符号化装置内の第
5図に示す短期駆動信号生成回路308と同一機能を有す
るものであり、ゲインGを入力とし、短期駆動信号yを
加算回路506へ出力する、加算回路506は、短期駆動信号
yと長期駆動信号生成回路502で生成された長期駆動信
号tとの和信号、すなわち駆動信号exを駆動信号バッフ
ァ503および第4図の合成フィルタ210へ出力する。
駆動信号バッファ503は、加算回路506から出力される
駆動信号を現在から所定のサンプル数だけ過去のものま
で保持し、インデックスTが入力されるとTサンプル過
去の駆動信号から順にサブフレーム長に相当するサンプ
ル数だけ出力する構成となっている、長期駆動信号生成
回路502は、インデックスTに基づき駆動信号バッファ5
03より出力される信号を入力とし、この入力信号にゲイ
ンβを乗じると共に、Tサンプルの周期で繰り返す長期
駆動信号を生成し、加算回路506へサブフレーム単位で
出力する。
第4図に説明を戻すと、合成フィルタ210は符号化装
置内の第3図に示す予測フィルタ104と逆の周波数特性
を持つフィルタであり、駆動信号と予測パラメータを入
力として、合成信号を出力する。
ポストフィルタ211は予測パラメータ、ゲインβおよ
びインデックスTを用いて合成フィルタ210から出力さ
れる合成信号のスペクトルを主観的に雑音が減少するよ
うに整形して、バッファ212へ出力する。ポストフィル
タ211の具体的な構成例を第7図に示す。
第7図に示すポストフィルタは2つのポストフィルタ
の縦続接続より構成される。1つはFINE SPECTRAL SHAP
INGフィルタであり、もう1つはGLOBAL SPECTRAL SHAPI
NGフィルタである。前者はピッチのくり返しを強調する
フィルタで、出力音声信号のスペクトルの微細構造に影
響を与える。このフィルタの伝達関数としては例えば、 が一般に用いられる。ここでεは0.2〜0.5程度の値が適
当であることが知られている。
一方、後者のフィルタは音声信号のスペクトル包絡の
形を強調するフィルタであり、伝達関数としては、 が一般に用いられる。ここで0<r1<r2<1であり、A
(Z)は受側で復号した予測パラメータより構成される
予測フィルタを表す。
以下に第7図を用いて詳細にポストフィルタの説明を
行う。
第7図において、合成フィルタ210より出力された合
成信号Px(n)はポストフィルタ入力端子33より入力さ
れる。
入力信号Px(n)はゲイン計算回路37およびスイッチ
端子43へ出力される。スイッチ55は端子43と端子34とを
接続しFINE SPECTRAL SHAPINGフィルタ35に入力信号Px
(n)を入力する。FINE SPECTRAL SHAPINGフィルタ35
の出力信号はGLOBAL SPECTRAL SHAPINGフィルタ36に入
力され、その出力信号Py1(n)はゲイン計算回路37へ
入力される。ここで出力信号Py1(n)は零状態応答で
あり、フィルタ35,36は現サブフレームよりも過去のフ
ィルタの内部状態を用いずに入力されたPx(n)の値だ
けに基づいてPy1(n)を計算し出力する。
一方、フィルタ31,32はそれぞれ前述したフィルタ35,
36と同じ特性を持つポストフィルタであり、その縦続接
続されたフィルタは、端子30から零データを入力し、現
サブフレームよりも過去のフィルタの内部状態を用いて
零入力応答Py0(n)を生成し、これをゲイン計算回路3
7へ入力する。
ゲイン計算回路37は入力されたPx(n),Py0(n),P
y1(n)の信号を用いて、前述の(3)式(4)より最
適なポストフィルタのゲインaを求めこれを乗算回路39
へ入力すると共にスイッチ55に制御信号を入力する。ス
イッチ55はゲイン計算回路37よりの制御信号を基に端子
34側に接続されていたスイッチを端子38側に接続し、入
力信号xP(n)を乗算回路39へ入力する。
乗算回路39は入力信号xP(n)の振幅をa倍した信号
をフィルタ40へ入力する。
フィルタ40はフィルタ31と同一の特性のフィルタであ
り、その出力をフィルタ41へ入力する。フィルタ41はフ
ィルタ32と同一の特性を持つフィルタであり、その出力
Py(n)をポストフィルタ出力端子42へ出力する。フィ
ルタ40,41は現サブフレームよりも過去のフィルタの内
部状態を用いてポストフィルタ出力信号Py(n)を生成
する。
以上で第7図のポストフィルタの説明を終る。ポスト
フィルタの他の例として、第7図の構成のポストフィル
タのポストフィルタ部を共用する構成にした例を第8図
に示す。
第8図において、零入力応答Py0(n)をゲイン計算
回路66へ出力する場合はスイッチ75で端子61と端子62は
OFFの状態にし、スイッチ74で端子70と端子71がONの状
態にすればよい。
また、零状態応答Py1(n)をゲイン計算回路66へ出
力する場合は、スイッチ75がOFF、スイッチ74は端子72
と端子71がONの状態とすればよい。最後に、ポストフィ
ルタ出力信号Py(n)を出力するためには、スイッチ76
がON、スイッチ75がON、スイッチ74がOFFの状態にすれ
ばよい。
以上で第8図のポストフィルタの説明を終る。
第4図に説明を戻すと、 バッファ212は入力されるポストフィルタの出力信号
をサブフレーム毎に結合し、ポストフィルタリングされ
た合成音声信号を出力端子213へ出力する。
第9図および第10図は本発明の第3の実施例に係る適
応ポストフィルタを適応密度パルス列を駆動信号とする
CELP方式の音声符号化装置および復号化装置に適用した
場合のブロック図である。
適応密度パルス列とは、フレームが複数のサブフレー
ムに分割されて、サブフレーム単位でパルス間隔が可変
なパルス列のことを示す。
第13図に適応密度パルス列の1例を示す。
適応密度パルス列は、従来のCELP方式で用いられる密
度(いいかえるとパルス間隔)が一定のパルス列を用い
た駆動信号に比べてフレーム内の音声の重要な部分に多
くの情報を適応的に割りあてることができるので発声の
開始部分や、音声信号のパワーが変化する部分等の変化
に対しても高品質の音声を提供できる改良されたCELP方
式の駆動信号である。この適応密度パルス列については
既に本発明者らによって提案されている。
第9図および第10図は本発明の第3の実施例に係る音
声符号化装置および復号化装置のブロック図である。
第9図において、フレームバッファ1101は入力端子11
00に入力される音声信号を1フレーム分蓄積する回路で
あり、第9図の各ブロックはフレームバッファ1101を用
いて1フレーム又は1サブフレーム毎に以下の処理を行
う。
まず、1フレーム分の音声信号に対し予測パラメータ
計算回路1102において、公知の方法を用いて短時間予測
パラメータを計算する(通常、この予測パラメータは8
〜12個計算される)。計算法については、例えば(古井
貞照著「ディジタル音声処理」)に記述されている。計
算された予測パラメータは、予測パラメータ符号化回路
1103に入力される。予測パラメータ符号化回路1103は、
予測パラメータを予め定められた量子化ビット数に基づ
いて符号化し、その符号をマルチプレクサ1115へ出力す
ると共に、復号値Pを予測フィルタ1104、聴感重みフィ
ルタ1105、影響信号作成回路1107、長期ベクトル量子化
回路1109および短期ベクトル量子化回路1111へ出力す
る。
予測フィルタ1104は、フレームバッファ1101からの入
力音声信号と符号化回路1103からの予測パラメータの復
号値から短期予測残差信号rを計算し、それを聴感重み
フィルタ1105へ出力する。
聴感重みフィルタ1105は、予測パラメータの復号値P
を基に構成されるフィルタで短期予測残差信号rのスペ
クトルを変形した信号xを減算回路1106へ出力する。こ
の聴感重みフィルタ1105は従来例における重み付けフィ
ルタと同様に聴覚のマスキング効果を利用するためのも
のである。
影響信号作成回路1107は、加算回路1112からの過去の
重み付けされた合成信号と、予測パラメータの復号値
Pを入力とし、過去の影響信号fを出力する。具体的に
は過去の重み付けされた合成信号をフィルタの内部状
態とする聴感重みフィルタの零入力応答を計算し、それ
を影響信号fとして、予め設定されるサブフレーム単位
で出力する。8kHzサンプリング時のサブフレーム中の典
型的な値としては、1フレーム(160サンプル)を4分
割した40サンプル程度が使用される。影響信号作成回路
1107は、第1サブフレームにおいては前フレームで決定
した密度パターンKに基づいて作成された前フレームの
合成信号を入力として影響信号fを作成する。減算回
路1106は、サブフレーム単位で聴感重み付き入力信号x
から過去の影響信号fを差し引いた信号uを減算回路11
08および長期ベクトル量子化回路1109へ出力する。
パワー計算回路1113は、予測フィルタ1104の出力であ
る短期予測残差信号のパワー(2乗和)をサブフレーム
単位で計算し、各サブフレームのパワーを密度パターン
選択回路1114へ出力する。
密度パターン選択回路1114は、パワー計算回路1115か
ら出力されるサブフレーム毎の短期予測段差信号のパワ
ーを基に、予め設定された駆動信号の密度パターンの中
から一つを選択する。具体的には、パワーの大きいサブ
フレームの順に密度が高くなるように密度パターンを選
択する、例えば、等長のサブフレームが4個、密度の種
類が2つで、密度パターンを次表のように設定した場
合、密度パターン選択回路1115はサブフレーム毎の上記
パワーを比較し、パワーが最大となるサブフレームが密
となる密度パターンの番号Kを選択し、それを密度パタ
ーン情報として短期ベクトル量子化回路1111とマルチプ
レクサ1115へ出力する。
長期ベクトル量子化回路1109は、減算回路1106からの
差信号u、後述の駆動信号保持回路1110からの過去の駆
動信号exおよび符号化回路1103からの予測パラメータP
を入力とし、サブフレーム単位で差信号uの量子化出力
信号を減算回路108および加算回路1112へ、ベクトル
ゲインβおよびインデックスTをマルチプレクサ1115
へ、長期駆動信号tを駆動信号保持回路1110へそれぞれ
出力する。このときtととの間には、=t*h(h
は聴感重みフィルタ1105のインパルス応答、*は畳み込
みを表わす)という関係がある。
サブフレーム単位のベクトルゲインβ(m)とインデッ
クスT(m)(mはサブフレームの番号)の詳細な求め方の
一例を以下に示す。
予め設定されるインデックスTとゲインβと過去の駆
動信号を用いて現サブフレームの駆動信号候補を作成
し、これを聴感重みフィルタに入力して差信号uの量子
化信号の候補を作成し、差信号uと量子化信号の候補と
の誤差が最小となるように最適なインデックスT(m)と最
適なβ(m)を決定する。このときT(m)と最適なβ(m)を用
いて作成される現サブフレームの駆動信号をtとし、t
を聴感重みフィルタに入力して得られる信号を差信号u
の量子化出力信号とする。
これと同様な方法は、例えばPETER KROON氏らによるI
EEE 1988年2月、Vol.SAC−6.pp.353−363に掲載の“A
Class of Analysis−by−Synthesic Predicative Coder
s for High Quality Speech Coding at Rates Between
4.8 and 16kbits/s"と題する論文中の閉ループでピッチ
予測器の係数を求める方法と同様の公知の方法を用いる
ことができるので、ここでは説明を省略する。
一方、減算回路1108ではサブフレーム単位で差信号u
から量子化出力信号を減じた差信号Vを短期ベクトル
量子化回路1111へ出力する。
短期ベクトル量子化回路1111は、差信号V、予測パラ
メータPおよび密度パターン選択回路1114より出力され
る密度パターン番号Kを入力とし、サブフレーム単位で
差信号Vの量子化出力信号を加算回路1112へ、短期駆
動信号yを駆動信号保持回路1110へそれぞれ出力する。
ここでとyとの間には、=y*hという関係があ
る。
また、これと共に短期ベクトル量子化回路1111は駆動
パルス列のゲインG、位相情報Jおよびコードベクトル
のインデックスIをマルチプレクサ1115へ出力する。こ
のとき、サブフレーム単位で出力されるパラメータG,J,
Iは、密度パターン番号Kで決まる現サブフレーム(第
mサブフレーム)の密度(パルス間隔)に応じたパルス
数N(m)をサブフレーム内で符号化しなければならないの
で、予め設定されるコードベクトルの次元数ND(1つず
つのコードベクトルを構成するパルス数)に応じた個
数、すなわちN(m)/ND個ずつ現サブフレームで出力され
る。
例えばフレーム長が160サンプル、サブフレームが4
つの等長の40サンプルで構成され、コードベクトルの次
元が20であるとする。この場合、予め用意される密度パ
ターンの1つが第1サブフレームのパルス間隔1、第2
〜第4サブフレームのパルス間隔2とすると、この密度
パターンに対して短期ベクトル量子化回路1111から出力
されるゲイン、位相およびインデックスの個数は、それ
ぞれ第1サブフレームで40/20=2個(ただし、この場
合はパルス間隔が1なので、位相情報は出力しない)、
第2〜第4サブフレームで20/20=1個となる。
短期ベクトル量子化回路1111の具体的な構成例を第11
図に示す。第11図において、合成クトル生成回路1301は
予測パラメータPとべ、予め設定されるコードブック13
02内のコードベクトルC(i)(iはコードベクトルのイン
デックス)および密度パターン情報Kとから、密度パタ
ーン情報Kに対応する予め設定されたパルス間隔となる
ようにC(i)の第1のサンプル以降に所定の周期で零を内
挿して密度情報を持つパルス列を作成し、このパルス列
を予測パラメータPから生成される聴感重みフィルタで
合成することにより、合成ベクトルV1 (i)を生成する。
位相シフト回路1303は、この合成ベクトルV1 (i)を密
度パターン情報Kに基づいて所定のサンプル数だけ遅延
させて位相の異なる合成ベクトルV2 (i),V3 (i),…V1 (i),
…を作成し、内積計算回路1304およびパワー計算回路13
05へ出力する。コードブック1302は適応密度パルスの振
幅情報を格納し、インデックスiに対して予め定められ
たコードベクトルC(i)が引き出し可能なメモリ回路また
はベクトル発生回路で構成される。内積計算回路1304
は、第9図の減算回路1108からの差信号Vと、合成ベク
トルVj (i)との内積値Aj (i)を求め、インデックス・位相
選択回路1306へ出力する。パワー計算回路1305は、合成
ベクトルVj (i)のパワーBj (i)を求め、インデックス・位
相選択回路1306へ出力する。
インデックス・位相選択回路1306では、内積値Aj (i)
とパワーBi (i)を用いて、次式の評価値 {Aj (i)2/Bj (i) (28) が最も大きくなるような位相JとインデックスIを位相
候補jとインデックス候補iの中から選択し、対応する
内積値AJ (I)とパワーBJ (I)の組をゲイン量子化回路1307
へ出力する。また、インデックス・位相選択回路1306は
さらに位相Jの情報を短期駆動信号生成回路1308および
第9図のマルチプレクサ1115へ出力し、インデックスI
の情報をコードブック1302および第9図マルチプレクサ
1115へ出力する。
ゲイン符号化回路1307では、インデックス・位相選択
回路1306からの内積値Aj (I)とパワーBJ (I)との比。
AJ (I)/BJ (I) (29) を所定の方法で符号化して、そのゲイン情報Gを短期駆
動信号生成回路1308および第8図のマルチプレクサ1115
へ出力する。
上の(28)(29)式は、例えばI.M.Trancoso氏らによ
るInternational Conference on Acoustic,Speech and
Signal Processingの論文“EFFICIENT PROCEDURES FOR
FINDING THE OPTIMUM INNOVATION IN STOCHATIC CODER
S"によって提案されたものを用いてもよい。
短期駆動信号生成回路1308は、密度パターン情報K、
ゲイン情報G、位相情報JおよびインデックスIに対応
するコードベクトルC(I)を入力とし、KおよびC(I)を用
いて上記合成ベクトル生成回路1301での方法と同様の方
法で密度情報を持つパルス列を作成し、そのパルス振幅
にゲイン情報Gに対応する値を乗じ、位相情報Jに基づ
き所定のサンプル数だけパルス列を遅延することによ
り、短期駆動信号yを生成する。この短期駆動信号y
は、聴感重みフィルタ1309および第9図の駆動信号保持
回路1110へ出力される。聴感重みフィルタ1309は第9図
の聴感重みフィルタ1105と同様の特性を持つフィルタで
あり、予測パラメータPを基にして作られ、短期駆動信
号yを入力として差信号Vの量子化出力を第9図の加
算回路1112へ出力する。
第9図に説明を戻すと、駆動信号保持回路1110は長期
ベクトル量子化回路1109より出力される長期駆動信号t
および短期ベクトル量子化回路1111より出力される短期
駆動信号yを入力とし、駆動信号exをサブフレーム単位
で長期ベクトル量子化回路1109へ出力する。具体的に
は、例えばtとyとをサブフレーム単位でサンプル毎に
加算したものを駆動信号exとすればよい。現サブフレー
ムの駆動信号exは、次のサブフレームにおいて過去の駆
動信号として長期ベクトル量子化回路1109において使用
できるように、駆動信号保持回路1110内のバッファメモ
リに保持される。
加算回路1112は、サブフレーム単位で量子化出力u(m)
および(m)と、、現サブフレームで作成された過去の
影響信号fとの和信号を求め、影響信号作成回路1107
へ出力する。
以上のようにして求められた各パラメータP,β,T,G,
I,J,Kの情報がマルチプレクサ1115により多重化され、
伝送符号として出力端子1116より伝送される。
次に、第9図の符号化装置から伝送された符号を復号
する第10図の復号化装置について説明する。
第10図において、入力端子1200には伝送された符号が
入力される。デマルチプレクサ1201はこの入力符号をま
ず予測パラメータ、密度パターン情報K、ゲインβ,ゲ
インG、インデックスT、インデックスIおよび位相情
報Jの符号に分離する。復号化回路1202〜1207は、それ
ぞれ密度パターン情報K、ゲインG、位相J、インデッ
クスI、ゲインβおよびインデックスTの符号を復号
し、駆動信号生成回路1209へ出力する。もう一つの復号
化回路1208は、符号化された予測パラメータを復号し、
合成フィルタ1210へ出力する。駆動信号生成回路1209
は、復号された各パラメータを入力とし、密度パターン
情報Kに基づいてサブフレーム単位で密度の異なる駆動
信号を生成する。
駆動信号生成回路1209は、具体的には例えば第12図に
示すように構成される。第12図において、コードブック
1500は符号化装置内の第11図に示すコードブック1302と
同一機能を有するものであり、インデックスIに対応す
るコードベクトルC(I)を短期駆動信号生成回路1501へ出
力する。短期駆動信号生成回路1501は、符号化装置内の
第11図に示す短期駆動信号生成回路1308と同一機能を有
するものであり、密度パターン情報K、位相情報Jおよ
びゲインGを入力とし、短期駆動信号yを加算回路1506
へ出力する。加算回路1506は、短期駆動信号yと長期駆
動信号生成回路1502で生成された長期駆動信号tとの和
信号、すなわち駆動信号exを駆動信号バッファ1503およ
び第10図の合成フィルタ1210へ出力する。
駆動信号バッファ1503は、加算回路1506から出力され
る駆動信号を現在から所定のサンプル数だけ過去のもの
まで保持し、インデックスTが入力されるとTサンプル
過去の駆動信号から順にサブフレーム長に相当するサン
プル数だけ出力する構成となっている。長期駆動信号生
成回路1502は、インデックスTに基づき駆動信号バッフ
ァ1503より出力される信号を入力とし、この入力信号に
ゲインβを乗じると共に、Tサンプルの周期で繰り返す
長期駆動信号を生成し、加算回路1506へサブフレーム単
位で出力する。
第10図に説明を戻すと、合成フィルタ1210は符号化装
置内の第9図に示す予測フィルタ1104と逆の周波数特性
を持つフィルタであり、駆動信号と予測パラメータを入
力として、合成信号を出力する。
ポストフィルタ1211は予測パラメータ、ゲインβおよ
びインデックスTを用いて合成フィルタ1210から出力さ
れる合成信号のスペクトルを主観的に雑音が減少するよ
うに整形して、バッファ1212へ出力する。ポストフィル
タ1211の具体的な構成法は第2実施例において述べたも
のと同じであるので、ここでは説明を省略する。バッフ
ァ1212は入力される信号をフレーム毎に結合し、合成音
声信号を出力端子1213へ出力する。
本発明の適応ポストフィルタの第4の実施例について
第14図を用いて説明する。
第14図において、Px(n)はポストフィルタの入力信
号Py(n)は出力信号を表す。
端子2060から入力された信号Px(n)はまず、スイッ
チ2075OFF,スイッチ2074ONの状態で直接ポストフィルタ
2074,2065を通過し、フィルタ2065の出力Py2(n)はゲ
イン計算回路2066へ入力される。
ゲイン計算回路2066はPy2(n)とPx(n)を入力
し、次式によりポストフィルタのゲインaを設定する。
(6)式でゲインaが決定すると、ゲイン計算回路20
66はスイッチ2075,スイッチ2074およびスイッチ2076へ
制御信号を出力し、スイッチ2074をOFFにした後スイッ
チ2075をONの状態にし、これと同時に、乗算回路2063に
ゲインaを入力するとともにスイッチ2076をONにする。
この状態で端子2060からPx(n)を入力することによ
りポストフィルタリングされた出力信号Py(n)が端子
2067より出力される。
以上述べた実施例の中でポストフィルタはFINE SPECT
RAL SHAPINGフィルタとGLOBAL SPECTRAL SHAPINGフィル
タの2つのフィルタの縦続接続となっているが、ポスト
フィルタの構成としてはどちらか一方のフィルタのみを
使う構成でもよいし、更に別のフィルタを組み合わせて
使う構成でもよい。
またFINE SPECTRAL SHAPINGフィルタとしては極形の
フィルタの例を示したが、例えば極零形のフィルタ を代りに使うこともできる。ここで0<κ<εの関係が
あり、εは|εβ|<|を満たす必要がある。
[発明の効果] 本発明ではポストフィルタの入力信号と出力信号との
パワーが一致するようにサブフレーム単位でポストフィ
ルタのゲイン(すなわち、入力信号のゲイン)を計算さ
れる前記零入力応答と零状態応答と合成音声信号とを用
いて再設定するので、サブフレーム間の入力信号のゲイ
ン再設定による不連続部分の雑音もポストフィルタ(一
般に低域通過形フィルタ)を通過するため、自動的に雑
音整形され、出力信号は連続波形となる。
しかもそのパワーは入力信号と完全に一致するため、
ポストフィルタの雑音整形の効果の利点を十分に生かす
ことができ、よりノイズの少ない高品質な音声信号を生
成することができる。
【図面の簡単な説明】
第1図は本発明の第1の実施例を説明するブロック図、
第2図は本発明の原理を説明するフローチャート、第3
図及び第4図は本発明の第2の実施例を説明するブロッ
ク図、第5図は本発明に係る短期ベクトル量子化回路の
構成図、第6図は本発明に係る駆動信号生成回路の構成
図、第7図は本発明に係るポストフィルタの構成図、第
8図はポストフィルタの他の構成図、第9図及び第10図
は本発明の第3の実施例を説明するブロック図、第11図
は短期ベクトル量子化回路の構成図、第12図は駆動信号
生成回路の構成図、第13図は適応密度パルス列を説明す
るための図、第14図は本発明の第4の実施例を説明する
ブロック図、第15図は従来例を説明するための図であ
る。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平1−261930(JP,A) M.Akamine et.al." Improvement of ADP −CELP speech codin g at 4kbit/s”,GLOB ECOM’91 Vol.3,pp. 1869−1873(1991) (58)調査した分野(Int.Cl.7,DB名) G10L 11/00 - 21/06 H03M 7/30 H04B 14/04 JICSTファイル(JOIS) INSPEC(DIALOG)

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】合成音声信号を入力して雑音整形された音
    声信号を出力する適応ポストフィルタにおいて、フレー
    ム内の音声信号に対するLPC係数を得る手段と、 このLPC係数をもとにポストフィルタを生成する手段
    と、 このポストフィルタに入力する合成音声信号を得る手段
    と、 前記ポストフィルタの零入力応答を得る手段と、 前記合成音声信号を入力したときのポストフィルタの零
    状態応答を得る手段と、 前記合成音声信号と零入力応答と零状態応答とを用い
    て、 前記ポストフィルタのゲインを再設定する手段とを有す
    ることを特徴とする適応ポストフィルタ。
  2. 【請求項2】フレーム内の音声信号に対するLPC係数と
    ピッチ予測パラメータとを得る手段と、 このLPC係数とピッチ予測パラメータとをもとにポスト
    フィルタを生成する手段と、 このポストフィルタに入力する合成音声信号を得る手段
    と、 ポストフィルタの零入力応答を得る手段と、 合成音声信号を入力したときのポストフィルタの零状態
    応答を得る手段と、 合成信号と零入力応答と零状態応答とを用いてポストフ
    ィルタのゲインを再設定する手段とを有することを特徴
    とする適応ポストフィルタ。
JP2041286A 1990-02-23 1990-02-23 適応ポストフィルタ Expired - Lifetime JP3071800B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2041286A JP3071800B2 (ja) 1990-02-23 1990-02-23 適応ポストフィルタ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2041286A JP3071800B2 (ja) 1990-02-23 1990-02-23 適応ポストフィルタ

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2000077653A Division JP3274451B2 (ja) 1990-02-23 2000-03-21 適応ポストフィルタ及び適応ポストフィルタリング方法

Publications (2)

Publication Number Publication Date
JPH03245195A JPH03245195A (ja) 1991-10-31
JP3071800B2 true JP3071800B2 (ja) 2000-07-31

Family

ID=12604206

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2041286A Expired - Lifetime JP3071800B2 (ja) 1990-02-23 1990-02-23 適応ポストフィルタ

Country Status (1)

Country Link
JP (1) JP3071800B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2162883B1 (fr) * 2007-07-06 2012-09-05 France Telecom Limitation de distorsion introduite par un post-traitement au decodage d'un signal numerique

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3074680B2 (ja) * 1988-04-13 2000-08-07 ケイディディ株式会社 音声復号器のポスト雑音整形フィルタ

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
M.Akamine et.al."Improvement of ADP−CELP speech coding at 4kbit/s",GLOB ECOM’91 Vol.3,pp.1869−1873(1991)

Also Published As

Publication number Publication date
JPH03245195A (ja) 1991-10-31

Similar Documents

Publication Publication Date Title
JP2940005B2 (ja) 音声符号化装置
JP4662673B2 (ja) 広帯域音声及びオーディオ信号復号器における利得平滑化
EP1273005B1 (en) Wideband speech codec using different sampling rates
JP3180762B2 (ja) 音声符号化装置及び音声復号化装置
JPH10187196A (ja) 低ビットレートピッチ遅れコーダ
JPH0990995A (ja) 音声符号化装置
US6826527B1 (en) Concealment of frame erasures and method
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
EP1103953B1 (en) Method for concealing erased speech frames
JPH09258795A (ja) ディジタルフィルタおよび音響符号化/復号化装置
JP3531780B2 (ja) 音声符号化方法および復号化方法
JP3510643B2 (ja) 音声信号のピッチ周期処理方法
JP3071800B2 (ja) 適応ポストフィルタ
JP3274451B2 (ja) 適応ポストフィルタ及び適応ポストフィルタリング方法
JP3319396B2 (ja) 音声符号化装置ならびに音声符号化復号化装置
JP3232701B2 (ja) 音声符号化方法
JP3299099B2 (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置
JP3296411B2 (ja) 音声符号化方法および復号化方法
JP2853170B2 (ja) 音声符号化復号化方式
JP2001142499A (ja) 音声符号化装置ならびに音声復号化装置
JP2000298500A (ja) 音声符号化方法
JP3166697B2 (ja) 音声符号化・復号装置及びシステム
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JP3103108B2 (ja) 音声符号化装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090526

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090526

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100526

Year of fee payment: 10

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100526

Year of fee payment: 10