JP2000305598A - 適応ポストフィルタ - Google Patents
適応ポストフィルタInfo
- Publication number
- JP2000305598A JP2000305598A JP2000077653A JP2000077653A JP2000305598A JP 2000305598 A JP2000305598 A JP 2000305598A JP 2000077653 A JP2000077653 A JP 2000077653A JP 2000077653 A JP2000077653 A JP 2000077653A JP 2000305598 A JP2000305598 A JP 2000305598A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- filter
- input
- circuit
- post
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
的にゲインを乗じて出力される出力音声信号波形がサブ
フレーム単位で不連続になりやすく、ポストフィルタを
用いることで、波形の不連続による新たな品質劣化を生
じるという問題点があった。 【解決手段】フレーム内の音声信号に対するLPC係数
を得る手段と、このLPC係数をもとにポストフィルタ
を生成する手段と、このポストフィルタに入力する合成
音声信号を得る手段と、合成音声信号を入力したときの
ポストフィルタの応答を得る手段と、合成音声信号と前
記ポストフィルタの応答とを用いてポストフィルタのゲ
インを再設定する手段とを有することを特徴とする適応
ポストフィルタを提供する。
Description
圧縮する音声符号化方式に係り、特に合成音声信号の主
観品質を高めるために符号側で用いられる適応ポストフ
ィルタに関する。
量で符号化する従来方式として、CELP(Code Excit
ed Linear Prediction)方式が知られている。
で予測したときに得られる予測残差信号を、聴感重み付
けられた合成音声信号のレベルで量子化するために、出
力合成音声信号に含まれるノイズを少なくできることを
特徴とする音声符号化方式である。この方式を原理とす
る方式は他の方式と比べて良好な音声符号化を行えるの
で近年広く用いられてきている(例えば、この内容は
「M.R.Schroeder and B.S.Atal, "Code - Excited Line
ar Prediction (CELP) :high quality speech at v
ery low bit rates, " Proc. IEEE Int. Conf. Acous
t., Speech, SignalProcessing, pp. 937−940 (1985)
.」に記載されている。)通常、CELP方式において
は複合化された合成音声信号は最終的に適応ポストフィ
ルタを介して出力される。この適応ポストフィルタはパ
ラメータを適切に設定することによりスペクトル包絡や
ピッチのくり返しを強調して合成音声信号に含まれるノ
イズを抑える効果があり、主観品質を向上させるために
用いられる。
と同時に、出力音声信号のパワーを増大させてしまうの
で、従来はポストフィルタの入力信号と出力信号のパワ
ーがサブフレーム単位で同じになるようにポストフィル
タの出力信号にゲインを乗じて出力信号のパワーを制御
している。
ワーの変化の激しい音声に対しては、ブロック間で出力
信号に不連続点が発生し、結果としてポストフィルタリ
ングされた出力音声信号の品質が劣化するという欠点が
ある。
"A Class of Analysis - by - Synthesis Predictive
Coders for High Quality Speech Coding at Rates Bet
ween4.8 and 16kbits/s", IEEE SAC - G.February, 198
8. pp. 353〜363」に記載されているように、一般に用
いられる適応ポストフィルタのブロック図を示す。CE
LP方式ではポストフィルタは復号されたスペクトル包
絡を表すLPC合成フィルタとスペクトルの微細構造を
表すピッチ合成フィルタとの両方の継続結合で表され、
サブフレーム単位で更新して用いられる。
の適応ポストフィルタはサブフレーム単位でポストフィ
ルタの出力信号にゲインを乗じることにより入力信号と
出力信号のサブフレーム内のパワーが同じになるように
出力音声信号のパワー制御を行っている。このため、パ
ワーの変化の激しい音声信号に対しては最終的にゲイン
を乗じて出力される出力音声信号波形がサブフレーム単
位で不連続になりやすく、ポストフィルタを用いること
で、波形の不連続による新たな品質劣化を生じるという
問題点があった。
もので、入力信号のパワーの変化に依存せず、波形が連
続的で、ノイズの少ない高品質な出力音声信号が得られ
る適応ポストフィルタを提供することを目的とする。
音声信号に対するLPC係数を得る手段と、このLPC
係数をもとにポストフィルタを生成する手段と、このポ
ストフィルタに入力する合成音声信号を得る手段と、合
成音声信号を入力したときのポストフィルタの応答を得
る手段と、合成音声信号と前記ポストフィルタの応答と
を用いてポストフィルタのゲインを再設定する手段とを
有することを特徴とする適応ポストフィルタを提供す
る。
するLPC係数とピッチ予測パラメータとを得る手段
と、このLPC係数とピッチ予測パラメータとをもとに
ポストフィルタを生成する手段と、このポストフィルタ
に入力する合成音声信号を得る手段と、合成音声信号を
入力したときのポストフィルタの応答を得る手段と、合
成信号と前記ポストフィルタの応答とを用いてポストフ
ィルタのゲインを再設定する手段とを有することを特徴
とする適応ポストフィルタを提供する。
信号とのパワーが一致するようにサブフレーム単位でポ
ストフィルタのゲイン(すなわち、入力信号のゲイン)
を計算される前記零入力応答と零状態応答と合成音声信
号とを用いて再設定するので、サブフレーム間の入力信
号のゲイン再設定による不連続部分の雑音もポストフィ
ルタ(一般に低域通過形フィルタ)を通過するため、自
動的に雑音整形され、出力信号は連続波形となる。
するため、ポストフィルタの雑音整形の効果の利点を十
分に生かすことができ、よりノイズの少ない高品質な音
声信号を生成することができる。
再設定の方法の原理に基づく第1の実施例を図1のブロ
ック図と図2のフローチャートとを用いて説明する。
x(n)(復号された合成音声信号)がポストフィルタ
の入力端子26から入力されて乗算器27でゲインaを
乗じられた後にポストフィルタ28を通過して得られる
出力信号をPy(n)とする。このとき入力信号と出力
信号のパワーが等しい条件は次式で表される。
す。
る構成のポストフィルタの出力信号Py(n)は次式の
ように分解することができる。
ように、入力信号が零の場合のポストフィルタの内部状
態だけで出力される出力信号(零入力応答)を表し、P
y1(n)は図1(b)に示すように、ポストフィルタ
の内部状態が零にリセットされた状態で、Px(n)に
ゲインを乗じないで直接ポストフィルタに入力した場合
に出力される出力信号(零状態応答)を表す。また、a
はポストフィルタのゲインの再設定値を表す。最適なゲ
インの再設定値aは(2)式を(1)式に代入して得ら
れるaの2次方程式を解けば決定する。すなわち、
ストフィルタの出力を計算する方法の1例を示すフロー
チャートである。
タ係数を設定し、ポストフィルタの内部状態を一時保持
する。次に処理12で設定されたポストフィルタに零の
入力信号を入力し、零入力応答Py0(n)を求める。
処理13でポストフィルタに入力する入力信号X(n)
をセットする処理14でポストフィルタの内部状態を零
にリセットし、Px(n)を入力して零状態応答Py1
(n)を求める。
ぞれ求められた零入力応答Py0(n)、入力信号Px
(n)、零状態応答Py1(n)を用いて(3)式
(4)式より最適なポストフィルタのゲインaを計算す
る。処理17で処理11において保持されたポストフィ
ルタの内部状態を再びセットし、図1(c)に示すよう
に入力信号Px(n)に最適ゲインaを乗じてポストフ
ィルタを通過させて出力信号Py(n)を求める。
ルタ出力信号Py(n)は前述したように、入力信号P
x(n)とパワーが完全に一致し、しかも、ゲインが入
力側で乗じられるポストフィルタの構成となっているた
め、ゲインの異なる区間の間で生じる不連続部分の雑音
もポストフィルタリングされて自動的に雑音整形され、
出力音声信号Py(n)は連続波形となるので、ポスト
フィルタの雑音整形の効果が十分生かされて、出力音声
信号Py(n)の主観品質は大幅に向上する。
を入力信号Px(n)に乗じた信号をポストフィルタに
通過させて出力信号Py(n)を求める方法を説明した
が、零入力応答Py0(n)と零状態応答Py1(n)
と最適ゲインaとを用いて前述の(2)式に基づいて出
力信号Py(n)を求めることもできる。
m2−lnが負となる場合は最適ゲインaとして、
係る適応ポストフィルタをCELP方式の音声符号化装
置および復号化装置に適用した場合のブロック図であ
る。
入力端子100に入力される音声信号を1フレーム分蓄
積する回路であり、図3の各ブロックはフレームバッフ
ァ101を用いて1フレーム又は1サブフレーム毎に以
下の処理を行う。
測パラメータ計算回路102において、公知の方法を用
いて短時間予測パラメータを計算する(通常、この予測
パラメータは8〜12個計算される。)計算法について
は、例えば(古井貞照著「ディジタル音声処理」)に記
述されている。計算された予測パラメータは、予測パラ
メータ符号化回路103に入力される。予測パラメータ
符号化回路103は、予測パラメータを予め定められた
量子化ビット数に基づいて符号化し、その符号をマルチ
プレクサ115へ出力すると共に、復号値Pを予測フィ
ルタ104、聴感重みフィルタ105、影響信号作成回
路107、長期ベクトル量子化回路109および短期ベ
クトル量子化回路111へ出力する。
101からの入力音声信号と符号化回路103からの予
測パラメータの復号値から短期予測残差信号rを計算
し、それを聴感重みフィルタ105へ出力する。
タの復号値Pを基に構成されるフィルタで短期予測残差
信号rのスペクトルを変形した信号xを減算回路106
へ出力する。この聴感重みフィルタ105は従来例にお
ける重み付けフィルタと同様に聴覚のマスキング効果を
利用するためのものであり、その詳細は上記文献に記載
されているので、説明は省略する。
2からの過去の重み付けされた合成信号xと、予測パラ
メータの復号値Pを入力とし、過去の影響信号fを出力
する。具体的には過去の重み付けされた合成信号xフィ
ルタの内部状態とする聴感重みフィルタの零入力応答を
計算し、それを影響信号fとして、予め設定されるサブ
フレーム単位で出力する。8KHzサンプリング時のサ
ブフレーム中の典型的な値としては、1フレーム(16
0サンプル)を4分割した40サンプル程度が使用され
る。影響信号作成回路107は、第1サブフレームにお
いては前フレームの合成信号xを入力として影響信号f
を作成する。減算回路106は、サブフレーム単位で聴
感重み付き入力信号xから過去の影響信号fを差し引い
た信号uを減算回路108および長期ベクトル量子化回
路109へ出力する。
路106からの差信号u、後述の駆動信号保持回路11
0からの過去の駆動信号exおよび符号化回路103か
らの予測パラメータPを入力とし、サブフレーム単位で
差信号uの量子化出力信号uを減算回路108および加
算回路112へ、ベクトルゲインβおよびインデックス
Tをマルチプレクサ115へ、長期駆動信号tを駆動信
号保持回路110へそれぞれ出力する。このときtとu
との間には、u=t*h(hは聴感重みフィルタ105
のインパルス応答、*は畳み込みを表す)という関係が
ある。
(m)とインデックスT(m)(mはサブフレームの番
号)の詳細な求め方の一例を以下に示す。
と過去の駆動信号を用いて現サブフレームの駆動信号候
補を作成し、これを聴感重みフィルタに入力して差信号
uの量子化信号の候補を作成し、差信号uと量子化信号
の候補との誤差が最小となるように最適なインデックス
T(m)と最適なβ(m)を決定する。このときT
(m)とβ(m)を用いて作成される現サブフレームの
駆動信号をtとし、tを聴感重みフィルタに入力して得
られる信号を差信号uの量子化出力信号uとする。
N氏らによるIEEE1988年2月、Vol. SAC - 6. pp. 353 -
363」に掲載の "A Class of Analysis - by - Synthesi
c Predicative Coders for High Quality Speech Codin
g at Rates Between 4. 8 and 1Gkbits/s" と題する論
文中の閉ループでピッチ予測器の係数を求める方法と同
様の公知の方法を用いることができる。
位で差信号uから量子化出力信号uを減じた差信号Vを
短期ベクトル量子化回路111へ出力する。短期ベクト
ル量子化回路111は、差信号Vおよび予測パラメータ
Pを入力とし、サブフレーム単位で差信号Vの量子化出
力信号Vを加算回路112へ、短期駆動信号yを駆動信
号保持回路110へそれぞれ出力する。ここでVとyと
の間には、V=y*hという関係がある。
111は短期駆動信号を構成するゲインGおよびコード
ベクトルのインデックスIをマルチプレクサ115へ出
力する。
構成例を図5に示す。図5において、合成ベクトル生成
回路301は予測パラメータPと、予め設定されるコー
ドブック302内のコードベクトルC(i)(iはコー
ドベクトルのインデックス)とから、パルス列を作成
し、このパルス列を予測パラメータPから生成される聴
感重みフィルタで合成することにより、合成ベクトルV
(i)を生成し、内積計算回路304およびパワー計算
回路305へ出力する。コードブック302はパルスの
振幅情報を格納し、インデックスiに対して予め定めら
れたコードベクトルC(i)が引き出し可能なメモリ回
路またはベクトル発生回路で構成される。内積計算回路
304は、図3の減算回路108からの差信号Vと、合
成ベクトルV(i)との内積値A(i)を求め、インデ
ックス選択回路306へ出力する。パワー計算回路30
5は、合成ベクトルV(i)のパワーB(i)を求め、
インデックス選択回路306へ出力する。
A(i)とパワーB(i)を用いて、次式の評価値
インデックス候補iの中から選択し、対応する内積値A
(I)とパワーB(I)の組をゲイン量子化回路307
へ出力する。また、インデックス選択回路306はさら
にインデックスIの情報をコードブック302および図
3のマルチプレクサ115へ出力する。
ス選択回路306からの内積値A(I)とパワーB
(I)との比
報Gを短期駆動信号生成回路308および図3のマルチ
プレクサ115へ出力する。
Trancoso氏らによるInternationalConference on Acous
tic, speech and Signal Processingの論文 "EFFICIENT
PROCEDURES FOR FINDING THE OPTIMUM INNOVATI ON IN
STOCHATIC CODERS" によって提案されたものを用いて
もよい。
報G、およびインデックスIに対応するコードベクトル
C(I)を入力とし、C(I)を用いて上記合成ベクト
ル生成回路301での方法と同様の方法でパルス列を作
成し、そのパルス振幅にゲイン情報Gに対応する値を乗
じ、短期駆動信号yを生成する。この短期駆動信号y
は、聴感重みフィルタ309および図3の駆動信号保持
回路110へ出力される。聴感重みフィルタ309は図
3の聴感重みフィルタ105と同様の特性を持つフィル
タであり、予測パラメータPを基にして作られ、短期駆
動信号yを入力として差信号Vの量子化出力Vを図3の
加算回路112へ出力する。
10は長期ベクトル量子化回路109より出力される長
期駆動信号tおよび短期ベクトル量子化回路111より
出力される短期駆動信号yを入力とし、駆動信号exを
サブフレーム単位で長期ベクトル量子化回路109へ出
力する。具体的には、例えばtとyをサブフレーム単位
でサンプル毎に加算したものを駆動信号exとすればよ
い。現サブフレームの駆動信号exは、次のサブフレー
ムにおいて過去の駆動信号として長期ベクトル量子化回
路109において使用できるように、駆動信号保持回路
110内のバッファメモリに保持される。加算回路11
2は、サブフレーム単位で量子化出力u(m)およびV
(m)と、現サブフレームで作成された過去の影響信号
fとの和信号xを求め、影響信号作成回路107へ出力
する。
P、β、T、G、Iの情報がマルチプレクサ115によ
り多重化され、伝送符号として出力端子116より伝送
される。
号を復号する図4の復号化装置について説明する。
れた符号が入力される。デマルチプレクサ201はこの
入力符号をまず予測パラメータ、ゲインβ、ゲインG、
インデックスTおよびインデックスIの符号に分離す
る。復号化回路202〜207は、それぞれゲインG、
インデックスI、ゲインβおよびインデックスTの符号
を復号し、駆動信号生成回路209へ出力する。もう一
つの復号化回路208は、符号化された予測パラメータ
を復号し、合成フィルタ210へ出力する、駆動信号生
成回路209は、復号された各パラメータを入力とし、
駆動信号を生成する。
えば図6に示すように構成される。図6において、コー
ドブック500は符号化装置内の図5に示すコードブッ
ク302と同一機能を有するものであり、インデックス
Iに対応するコードベクトルC(I)を短期駆動信号生
成回路501へ出力する。短期駆動信号生成回路501
は、符号化装置内の図5に示す短期駆動信号生成回路3
08と同一機能を有するものであり、ゲインGを入力と
し、短期駆動信号yを加算回路506へ出力する、加算
回路506は、短期駆動信号yと長期駆動信号生成回路
502で生成された長期駆動信号tとの和信号、すなわ
ち駆動信号exを駆動信号バッファ503および図4の
合成フィルタ210へ出力する。
6から出力される駆動信号を現在から所定のサンプル数
だけ過去のものまで保持し、インデックスTが入力され
るとTサンプル過去の駆動信号から順にサブフレーム長
に相当するサンプル数だけ出力する構成となっている、
長期駆動信号生成回路502は、インデックスTに基づ
き駆動信号バッファ503より出力される信号を入力と
し、この入力信号にゲインβを乗じると共に、Tサンプ
ルの周期で繰り返す長期駆動信号を生成し、加算回路5
06へサブフレーム単位で出力する。
は符号化装置内の図3に示す予測フィルタ104と逆の
周波数特性を持つフィルタであり、駆動信号と予測パラ
メータを入力として、合成信号を出力する。
ゲインβおよびインデックスTを用いて合成フィルタ2
10から出力される合成信号のスペクトルを主観的に雑
音が減少するように整形して、バッファ212へ出力す
る。ポストフィルタ211の具体的な構成例を図7に示
す。
フィルタの継続接続より構成される。1つはFINE SPECT
RAL SHAPING フィルタであり、もう1つはGLOBAL SPECT
RALSHAPINGフィルタである。前者はピッチのくり返しを
強調するフィルタで、出力音声信号のスペクトルの微細
構造に影響を与える。このフィルタの伝達関数としては
例えば、
0.5程度の値が適当であることが知られている。
トル包絡の形を強調するフィルタであり、伝達関数とし
ては、
2<1であり、A(Z)は受側で復号した予測パラメー
タより構成される予測フィルタを表す。
の説明を行う。
力された合成信号Px(n)はポストフィルタ入力端子
33より入力される。入力信号Px(n)はゲイン計算
回路37およびスイッチ端子43へ出力される。スイッ
チ55は端子43と端子34とを接続しFINE SPECTRAL
SHAPINGフィルタ35に入力信号Px(n)を入力す
る。FINE SPECTRAL SHAPINGフィルタ35の出力信号はG
LOBAL SPECTRAL SHAPINGフィルタ36に入力され、その
出力信号Py1(n)はゲイン計算回路37へ入力され
る。ここで出力信号Py1(n)は零状態応答であり、
フィルタ35、36は現サブフレームよりも過去のフィ
ルタの内部状態を用いずに入力されたPx(n)の値だ
けに基づいてPy1(n)を計算し出力する。
したフィルタ35、36と同じ特性を持つポストフィル
タであり、その継続接続されたフィルタは、端子30か
ら零データを入力し、現サブフレームよりも過去のフィ
ルタの内部状態を用いて零入力応答Py0(n)を生成
し、これをゲイン計算回路37へ入力する。
(n)、Py0(n)、Py1(n)の信号を用いて、
前述の(3)式(4)式より最適なポストフィルタのゲ
インaを求めこれを乗算回路39へ入力すると共にスイ
ッチ55に制御信号を入力する。スイッチ55はゲイン
計算回路37よりの制御信号を基に端子34側に接続さ
れていたスイッチを端子38側に接続し、入力信号xP
(n)を乗算回路39へ入力する。
を3倍した信号をフィルタ40へ入力する。フィルタ4
0はフィルタ31と同一の特性のフィルタであり、その
出力をフィルタ41へ入力する。フィルタ41はフィル
タ32と同一の特性を持つフィルタであり、その出力P
y(n)をポストフィルタ出力端子42へ出力する。フ
ィルタ40、41は現サブフレームよりも過去のフィル
タの内部状態を用いてポストフィルタ出力信号Py
(n)を生成する。
る。ポストフィルタの他の例として、図7の構成のポス
トフィルタのポストフィルタ部を共用する構成にした例
を図8に示す。
ゲイン計算回路66へ出力する場合はスイッチ75で端
子61と端子62はOFFの状態にし、スイッチ74で
端子70と端子71がONの状態にすればよい。
算回路66へ出力する場合は、スイッチ75がOFF、
スイッチ74は端子72と端子71がONの状態とすれ
ばよい。最後に、ポストフィルタ出力信号Py(n)を
出力するためには、スイッチ76がON、スイッチ75
がON、スイッチ74がOFFの状態にすればよい。以
上で図8のポストフィルタの説明を終る。
力されるポストフィルタの出力信号をサブフレーム毎に
結合し、ポストフィルタリングされた合成音声信号を出
力端子213へ出力する。図9および図10は本発明の
第3の実施例に係る適応ポストフィルタを適応密度パル
ス列を駆動信号とするCELP方式の音声符号化装置お
よび復号化装置に適用した場合のブロック図である。
サブフレームに分割されて、サブフレーム単位でパルス
間隔が可変なパルス列のことを示す。図13に適応密度
パルス列の1例を示す。
で用いられる密度(いいかえるとパルス間隔)が一定の
パルス列を用いた駆動信号に比べてフレーム内の音声の
重要な部分に多くの情報を適応的に割りあてることがで
きるので発声の開始部分や、音声信号のパワーが変化す
る部分等の変化に対しても高品質の音声を提供できる改
良されたCELP方式の駆動信号である。この適応密度
パルス列については既に本発明者らによって提案されて
いる。
に係る音声符号化装置および復号化装置のブロック図で
ある。
は入力端子1100に入力される音声信号を1フレーム
分蓄積する回路であり、図9の各ブロックはフレームバ
ッファ1101を用いて1フレーム又は1サブフレーム
毎に以下の処理を行う。
パラメータ計算回路1102において、公知の方法を用
いて短時間予測パラメータを計算する(通常、この予測
パラメータは8〜12個計算される)。計算法について
は、例えば(古井貞照著「ディジタル音声処理」)に記
述されている。計算された予測パラメータは、予測パラ
メータ符号化回路1103に入力される。予測パラメー
タ符号化回路1103は、予測パラメータを予め定めら
れた量子化ビット数に基づいて符号化し、その符号をマ
ルチプレクサ1115へ出力すると共に、符号値Pを予
測フィルタ1104、聴感重みフィルタ1105、影響
信号作成回路1107、長期ベクトル量子化回路110
9および短期ベクトル量子化回路1111へ出力する。
ァ1101からの入力音声信号と符号化回路1103か
らの予測パラメータの符号値から短期予測残差信号rを
計算し、それを聴感重みフィルタ1105へ出力する。
ータの復号値Pを基に構成されるフィルタで短期予測残
差信号rのスペクトルを変形した信号xを減算回路11
06へ出力する。この聴感重みフィルタ1105は従来
例における重み付けフィルタと同様に聴覚のマスキング
効果を利用するためのものである。
112からの過去の重み付けされた合成信号xと、予測
パラメータの復号値Pを入力とし、過去の影響信号fを
出力する。具体的には過去の重み付けされた合成信号x
をフィルタの内部状態とする聴感重みフィルタの零入力
応答を計算し、それを影響信号fとして、予め設定され
るサブフレーム単位で出力する。8kHzサンプリング
時のサブフレーム中の典型的な値としては、1フレーム
(160サンプル)を4分割した40サンプル程度が使
用される。影響信号作成回路1107は、第1サブフレ
ームにおいては前フレームで決定した密度パターンKに
基づいて作成された前フレームの合成信号xを入力とし
て影響信号fを作成する。減算回路1106は、サブフ
レーム単位で聴感重み付き入力信号xから過去の影響信
号fを差し引いた信号uを減算回路1108および長期
ベクトル量子化回路1109へ出力する。
1104の出力である短期予測残差信号のパワー(2乗
和)をサブフレーム単位で計算し、各サブフレームのパ
ワーを密度パターン選択回路1114へ出力する。
計算回路1115から出力されるサブフレーム毎の短期
予測段差信号のパワーを基に、予め設定された駆動信号
の密度パターンの中から一つを選択する。具体的には、
パワーの大きいサブフレームの順に密度が高くなるよう
に密度パターンを選択する、例えば、等長のサブフレー
ムが4個、密度の種類が2つで、密度パターンを図16
のように設定した場合、密度パターン選択回路1115
はサブフレーム毎の上記パワーを比較し、パワーが最大
となるサブフレームが密となる密度パターンの番号Kを
選択し、それを密度パターン情報として短期ベクトル量
子化回路1111とマルチプレクサ1115へ出力す
る。
回路1106からの差信号u、後述の駆動信号保持回路
1110からの過去の駆動信号exおよび符号化回路1
103からの予測パラメータPを入力とし、サブフレー
ム単位で差信号uの量子化出力信号uを減算回路108
および加算回路1112へ、ベクトルゲインβおよびイ
ンデックスTをマルチプレクサ1115へ、長期駆動信
号tを駆動信号保持回路1110へそれぞれ出力する。
このときtとuとの間には、u=t*h(hは聴感重み
フィルタ1105のインパルス応答、*は畳み込みを表
す)という関係がある。
(m)とインデックスT(m)(mはサブフレームの番
号)の詳細な求め方の一例を以下に示す。
と過去の駆動信号を用いて現サブフレームの駆動信号候
補を作成し、これを聴感重みフィルタに入力して差信号
uの量子化信号の候補を作成し、差信号uと量子化信号
の候補との誤差が最小となるように最適なインデックス
T(m)と最適なβ(m)を決定する。このときT
(m)と最適なβ(m)を用いて作成される現サブフレ
ームの駆動信号をtとし、tを聴感重みフィルタに入力
して得られる信号を差信号uの量子化出力信号uとす
る。
氏らによるIEEE1988年2月、Vol. SAC- 6. pp. 353 - 36
3に掲載の"A Class of Analysis - by - Synthesic Pre
dicative Coders for High Quality Speech Coding at
Rates Between 4.8 and 16kbits/s"と題する論文中の閉
ループでピッチ予測器の係数を求める方法と同様の公知
の方法を用いることができるので、ここでは説明を省略
する。
単位で差信号uから量子化出力信号uを減じた差信号V
を短期ベクトル量子化回路1111へ出力する。
号V、予測パラメータPおよび密度パターン選択回路1
114より出力される密度パターン番号Kを入力とし、
サブフレーム単位で差信号Vの量子化出力信号Vを加算
回路1112へ、短期駆動信号yを駆動信号保持回路1
110へそれぞれ出力する。ここでVとyとの間には、
V=y*hという関係がある。
1111は駆動パルス列のゲインG、位相情報Jおよび
コードベクトルのインデックスIをマルチプレクサ11
15へ出力する。このとき、サブフレーム単位で出力さ
れるパラメータG、J、Iは、密度パターン番号Kで決
まる現サブフレーム(第mサブフレーム)の密度(パル
ス間隔)に応じたパルス数N(m)をサブフレーム内で
符号化しなけれならないので、予め設定されるコードベ
クトルの次元数ND(1つずつのコードベクトルを構成
するパルス数)に応じた個数、すなわちN(m)/ND
個ずつ現サブフレームで出力される。
フレームが4つの等長の40サンプルで構成され、コー
ドベクトルの次元が20であるとする。この場合、予め
用意される密度パターンの1つが第1サブフレームのパ
ルス間隔1、第2〜第4サブフレームのパルス間隔2と
すると、この密度パターンに対して短期ベクトル量子化
回路1111から出力されるゲイン、位相およびインデ
ックスの個数は、それぞれ第1サブフレームで40/2
0=2個(ただし、この場合はパルス間隔が1なので、
位相情報は出力しない)、第2〜第4サブフレームで2
0/20=1個となる。
な構成例を図11に示す。図11において、合成ベクト
ル生成回路1301は予測パラメータPと、予め設定さ
れるコードブック1302内のコードベクトルC(i)
(iはコードベクトルのインデックス)および密度パタ
ーン情報Kとから、密度パターン情報Kに対応する予め
設定されたパルス間隔となるようにC(i)の第1のサ
ンプル以降に所定の周期で零を内挿して密度情報を持つ
パルス列を作成し、このパルス列を予測パラメータPか
ら生成される聴感重みフィルタで合成することにより、
合成ベクトルV1(i)を生成する。
トルV1(i)を密度パターン情報Kに基づいて所定の
サンプル数だけ遅延させて位相の異なる合成ベクトルV
2(i)、V3(i)、・・・V1(i)、・・・を作成し、
内積計算回路1304およびパワー計算回路1305へ
出力する。コードブック1302は適応密度パルスの振
幅情報を格納し、インデックスiに対して予め定められ
たコードベクトルC(i)が引き出し可能なメモリ回路
またはベクトル発生回路で構成される。内積計算回路1
304は、図9の減算回路1108からの差信号Vと、
合成ベクトルVj(i)との内積値Aj(i)を求め、
インデックス・位相選択回路1306へ出力する。パワ
ー計算回路1305は、合成ベクトルVj(i)のパワ
ーBj(i)を求め、インデックス・位相選択回路13
06へ出力する。
は、内積値Aj(i)とパワーBj(i)を用いて、次
式の評価値
クスIを位相候補jとインデックス候補iの中から選択
し、対応する内積値AJ(I)とパワーBJ(I)の組
をゲイン量子化回路1307へ出力する。また、インデ
ックス・位相選択回路1306はさらに位相Jの情報を
短期駆動信号生成回路1308および図9のマルチプレ
クサ1115へ出力し、インデックスIの情報をコード
ブック1302および図9マルチプレクサ1115へ出
力する。
クス・位相選択回路1306からの内積値Aj(I)と
パワーBJ(I)との比
報Gを短期駆動信号生成回路1308および図8のマル
チプレクサ1115へ出力する。
Trancoso氏らによるInternationalConference on Acous
tic, Speech and Signal Processingの論文 "EFFICIENT
PROCEDURES FOR FINDING THE OPTIMUM INNOVATI ON IN
STOCHATIC CODERS" によって提案されたものを用いて
もよい。
ターン情報K、ゲイン情報G、位相情報Jおよびインデ
ックスIに対応するコードベクトルC(I)を入力と
し、KおよびC(I)を用いて上記合成ベクトル生成回
路1301での方法と同様の方法で密度情報を持つパル
ス列を作成し、そのパルス振幅にゲイン情報Gに対応す
る値を乗じ、位相情報Jに基づき所定のサンプル数だけ
パルス列を遅延することにより、短期駆動信号yを生成
する。この短期駆動信号yは、聴感重みフィルタ130
9および図9の駆動信号保持回路1110へ出力され
る。聴感重みフィルタ1309は図9の聴感重みフィル
タ1105と同様の特性を持つフィルタであり、予測パ
ラメータPを基にして作られ、短期駆動信号yを入力と
して差信号Vの量子化出力∧Vを図9の加算回路111
2へ出力する。
110は長期ベクトル量子化回路1109より出力され
る長期駆動信号tおよび短期ベクトル量子化回路111
1より出力される短期駆動信号yを入力とし、駆動信号
exをサブフレーム単位で長期ベクトル量子化回路11
09へ出力する。具体的には、例えばtとyとをサブフ
レーム単位でサンプル毎に加算したものを駆動信号ex
とすればよい。現サブフレームの駆動信号exは、次の
サブフレームにおいて過去の駆動信号として長期ベクト
ル量子化回路1109において使用できるように、駆動
信号保持回路1110内のバッファメモリに保持され
る。
量子化出力u(m)およびV(m)と、現サブフレーム
で作成された過去の影響信号fとの和信号xを求め、影
響信号作成回路1107へ出力する。
P、β、T、G、I、J、Kの情報がマルチプレクサ1
115により多重化され、伝送符号として出力端子11
16より伝送される。
号を復号する図10の復号化装置について説明する。
送された符号が入力される。マルチプレクサ1201は
この入力符号をまず予測パラメータ、密度パターン情報
K、ゲインβ、ゲインG、インデックスT、インデック
スIおよび位相情報Jの符号に分離する。復号化回路1
202〜1207は、それぞれ密度パターン情報K、ゲ
インG、位相J、インデックスI、ゲインβおよびイン
デックスTの符号を復号し、駆動信号生成回路1209
へ出力する。もう一つの復号化回路1208は、符号化
された予測パラメータを復号し、合成フィルタ1210
へ出力する。駆動信号生成回路1209は、復号された
各パラメータを入力とし、密度パターン情報Kに基づい
てサブフレーム単位で密度の異なる駆動信号を生成す
る。
例えば図12に示すように構成される。図12におい
て、コードブック1500は符号化装置内の図11に示
すコードブック1302と同一機能を有するものであ
り、インデックスIに対応するコードベクトルC(I)
を短期駆動信号生成回路1501へ出力する。短期駆動
信号生成回路1501は、符号化装置内の図11に示す
短期駆動信号生成回路1308と同一機能を有するもの
であり、密度パターン情報K、位相情報Jおよびゲイン
Gを入力とし、短期駆動信号yを加算回路1506へ出
力する。加算回路1506は、短期駆動信号yと長期駆
動信号生成回路1502で生成された長期駆動信号tと
の和信号、すなわち駆動信号exを駆動信号バッファ1
503および図10の合成フィルタ1210へ出力す
る。
506から出力される駆動信号を現在から所定のサンプ
ル数だけ過去のものまで保持し、インデックスTが入力
されるとTサンプル過去の駆動信号から順にサブフレー
ム長に相当するサンプル数だけ出力する構成となってい
る。長期駆動信号生成回路1502は、インデックスT
に基づき駆動信号バッファ1503より出力される信号
を入力とし、この入力信号にゲインβを乗じると共に、
Tサンプルの周期で繰り返す長期駆動信号を生成し、加
算回路1506へサブフレーム単位で出力する。
10は符号化装置内の図9に示す予測フィルタ1104
と逆の周波数特性を持つフィルタであり、駆動信号と予
測パラメータを入力として、合成信号を出力する。
タ、ゲインβおよびインデックスTを用いて合成フィル
タ1210から出力される合成信号のスペクトルを主観
的に雑音が減少するように整形して、バッファ1212
へ出力する。ポストフィルタ1211の具体的な構成法
は第2実施例において述べたものと同じであるので、こ
こでは説明を省略する。バッファ1212は入力される
信号をフレーム毎に結合し、合成音声信号を出力端子1
213へ出力する。
例について図14を用いて説明する。図14において、
Px(n)はポストフィルタの入力信号Py(n)は出
力信号を表す。端子2060から入力された信号Px
(n)はまず、スイッチ2075OFF、スイッチ20
74ONの状態で直接ポストフィルタ2074、206
5を通過し、フィルタ2065の出力Py2(n)はゲ
イン計算回路2066へ入力される。
Px(n)を入力し、次式によりポストフィルタのゲイ
ンaを設定する。
計算回路2066はスイッチ2075、スイッチ207
4およびスイッチ2076へ制御信号を出力し、スイッ
チ2074をOFFにした後スイッチ2075をONの
状態にし、これと同時に、乗算回路2063にゲインa
を入力するとともにスイッチ2076をONにする。
入力することによりポストフィルタリングされた出力信
号Py(n)が端子2067より出力される。
FINE SPECTRAL SHAPINGフィルタとGLOBAL SPECTRAL SHA
PINGフィルタの2つのフィルタの継続接続となっている
が、ポストフィルタの構成としてはどちらか一方のフィ
ルタのみを使う構成でもよいし、更に別のフィルタを組
み合わせて使う構成でもよい。
ては極形のフィルタの例を示したが、例えば極零形のフ
ィルタ
κ<εの関係があり、εは|εβ|<|を満たす必要が
ある。
出力信号とのパワーが一致するようにサブフレーム単位
でポストフィルタのゲイン(すなわち、入力信号のゲイ
ン)を計算される前記零入力応答と零状態応答と合成音
声信号とを用いて再設定するので、サブフレーム間の入
力信号のゲイン再設定による不連続部分の雑音もポスト
フィルタ(一般に低域通過形フィルタ)を通過するた
め、自動的に雑音整形され、出力信号は連続波形とな
る。
するため、ポストフィルタの雑音整形の効果の利点を十
分に生かすことができ、よりノイズの少ない高品質な音
声信号を生成することができる。
図
図。
図。
図。
Claims (2)
- 【請求項1】フレーム内の音声信号に対するLPC係数
を得る手段と、このLPC係数をもとにポストフィルタ
を生成する手段と、このポストフィルタに入力する合成
音声信号を得る手段と、合成音声信号を入力したときの
ポストフィルタの応答を得る手段と、合成音声信号と前
記ポストフィルタの応答とを用いてポストフィルタのゲ
インを再設定する手段とを有することを特徴とする適応
ポストフィルタ。 - 【請求項2】フレーム内の音声信号に対するLPC係数
とピッチ予測パラメータとを得る手段と、このLPC係
数とピッチ予測パラメータとをもとにポストフィルタを
生成する手段と、このポストフィルタに入力する合成音
声信号を得る手段と、合成音声信号を入力したときのポ
ストフィルタの応答を得る手段と、合成信号と前記ポス
トフィルタの応答とを用いてポストフィルタのゲインを
再設定する手段とを有することを特徴とする適応ポスト
フィルタ。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000077653A JP3274451B2 (ja) | 1990-02-23 | 2000-03-21 | 適応ポストフィルタ及び適応ポストフィルタリング方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000077653A JP3274451B2 (ja) | 1990-02-23 | 2000-03-21 | 適応ポストフィルタ及び適応ポストフィルタリング方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2041286A Division JP3071800B2 (ja) | 1990-02-23 | 1990-02-23 | 適応ポストフィルタ |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000305598A true JP2000305598A (ja) | 2000-11-02 |
JP3274451B2 JP3274451B2 (ja) | 2002-04-15 |
Family
ID=18595191
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000077653A Expired - Lifetime JP3274451B2 (ja) | 1990-02-23 | 2000-03-21 | 適応ポストフィルタ及び適応ポストフィルタリング方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3274451B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008072671A1 (ja) * | 2006-12-13 | 2008-06-19 | Panasonic Corporation | 音声復号化装置およびパワ調整方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01261930A (ja) * | 1988-04-13 | 1989-10-18 | Kokusai Denshin Denwa Co Ltd <Kdd> | 音声復号器のポスト雑音整形フィルタ |
-
2000
- 2000-03-21 JP JP2000077653A patent/JP3274451B2/ja not_active Expired - Lifetime
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01261930A (ja) * | 1988-04-13 | 1989-10-18 | Kokusai Denshin Denwa Co Ltd <Kdd> | 音声復号器のポスト雑音整形フィルタ |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008072671A1 (ja) * | 2006-12-13 | 2008-06-19 | Panasonic Corporation | 音声復号化装置およびパワ調整方法 |
Also Published As
Publication number | Publication date |
---|---|
JP3274451B2 (ja) | 2002-04-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2940005B2 (ja) | 音声符号化装置 | |
JP4550289B2 (ja) | Celp符号変換 | |
JP4662673B2 (ja) | 広帯域音声及びオーディオ信号復号器における利得平滑化 | |
EP0832482B1 (en) | Speech coder | |
US7280959B2 (en) | Indexing pulse positions and signs in algebraic codebooks for coding of wideband signals | |
WO2000025298A1 (en) | A method and device for adaptive bandwidth pitch search in coding wideband signals | |
US6826527B1 (en) | Concealment of frame erasures and method | |
JPH11327597A (ja) | 音声符号化装置及び音声復号化装置 | |
US20040111257A1 (en) | Transcoding apparatus and method between CELP-based codecs using bandwidth extension | |
JP3582589B2 (ja) | 音声符号化装置及び音声復号化装置 | |
JP2000155597A (ja) | デジタル音声符号器において使用するための音声符号化方法 | |
JPH09319398A (ja) | 信号符号化装置 | |
JP3531780B2 (ja) | 音声符号化方法および復号化方法 | |
JP3510643B2 (ja) | 音声信号のピッチ周期処理方法 | |
JP3274451B2 (ja) | 適応ポストフィルタ及び適応ポストフィルタリング方法 | |
JP2968109B2 (ja) | コード励振線形予測符号化器及び復号化器 | |
JP3071800B2 (ja) | 適応ポストフィルタ | |
JP3319396B2 (ja) | 音声符号化装置ならびに音声符号化復号化装置 | |
JP3232701B2 (ja) | 音声符号化方法 | |
JP3299099B2 (ja) | 音声符号化装置 | |
JP3296411B2 (ja) | 音声符号化方法および復号化方法 | |
JP2001142499A (ja) | 音声符号化装置ならびに音声復号化装置 | |
JP3192051B2 (ja) | 音声符号化装置 | |
JP3063087B2 (ja) | 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置 | |
JP2853170B2 (ja) | 音声符号化復号化方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080201 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090201 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100201 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100201 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110201 Year of fee payment: 9 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110201 Year of fee payment: 9 |