JP3270146B2 - 音声符号化装置 - Google Patents

音声符号化装置

Info

Publication number
JP3270146B2
JP3270146B2 JP28300192A JP28300192A JP3270146B2 JP 3270146 B2 JP3270146 B2 JP 3270146B2 JP 28300192 A JP28300192 A JP 28300192A JP 28300192 A JP28300192 A JP 28300192A JP 3270146 B2 JP3270146 B2 JP 3270146B2
Authority
JP
Japan
Prior art keywords
drive signal
signal vector
codebook
vector
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP28300192A
Other languages
English (en)
Other versions
JPH06130997A (ja
Inventor
正浩 押切
政巳 赤嶺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP28300192A priority Critical patent/JP3270146B2/ja
Publication of JPH06130997A publication Critical patent/JPH06130997A/ja
Application granted granted Critical
Publication of JP3270146B2 publication Critical patent/JP3270146B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声符号化装置に係
り、特に音声信号を8kbps 程度以下の低ビットレート
で符号化するのに適した音声符号化装置に関する。
【0002】
【従来の技術】音声信号を低ビットレートで高能率に符
号化する技術は、自動車電話などの移動体通信や、企業
内通信において、電波の有効利用や通信コスト削減のた
めの重要な技術である。8kbps 以下のビットレートで
品質の優れた音声合成が可能な音声符号化方式として、
CELP(Code Excited Linear Prediction)方式が知
られている。
【0003】このCELP方式は、AT&Tベル研のM.
R.Schroeder 氏とB.S.Atal氏によりCode-Excited Linea
r Prediction(CELP)"High-Quality Speech at Very Low
BitRates"Proc,ICASSP;1985,pp.937-939(文献1)で
発表されて以来、高品質の音声が合成できる方式として
注目され、品質の改善や計算量の削減などについて、種
々の検討がなされて来た。CELP方式の特徴は、LP
C(Liner PredictiveCoding:線形予測符号化)合成フ
ィルタの駆動信号を駆動信号ベクトルとしてコードブッ
クに格納し、入力音声信号に対する合成音声信号の誤差
を評価しながら最適な駆動信号ベクトルをコードブック
から探索する点にある。
【0004】図8は、従来のCELP方式による音声符
号化装置のブロック図である。同図において、入力信号
であるサンプリングされた音声信号系列は入力端子60
0からフレーム単位で入力される。フレームはL個の信
号サンプルからなり、サンプリング周波数が8kHzの
場合、一般にL=160が用いられる。図8には示され
ていないが、駆動信号ベクトルの探索に先立ち、入力さ
れたLサンプルの音声信号系列に対してLPC分析が行
われ、LPC予測パラメータ{αi ,i=1,2,…
p}が抽出される。このLPC予測パラメータαi は、
LPC合成フィルム630に供給される。なお、pは予
測次数であり、一般にp=10が用いられる。LPC合
成フィルタ630の伝達関数H(z) は、[数1]で与え
られる。
【0005】
【数1】
【0006】次に、音声信号を合成しながら最適な駆動
信号ベクトルを探索する過程について説明する。まず、
入力端子600に入力された1フレームの音声信号か
ら、減算器610で前フレームでの合成フィルタ630
の内部状態が現フレームに与える影響が減算される。減
算器610から得られた信号系列は4個のサブフレーム
に分割され、各サブフレームの目標信号ベクトルとな
る。
【0007】LPC合成フィルタ630の入力信号であ
る駆動信号ベクトルは、適応コードブック640から選
択された駆動信号ベクトルに乗算器650で所定のゲイ
ンを乗算したものと、白色雑音コードブック710から
選択された雑音ベクトルに乗算器720で所定のゲイン
を乗算したものとを加算器660で加算することで得ら
れる。
【0008】ここで、適応コードブック640は文献1
に記載されているピッチ予測分析を閉ループ動作または
合成による分析(Ahalysis by Synthesis)によって行う
ものであり、詳細はW.B.Kleijin D.J.Krasinski and R.
H.Ketchum,"Improved SpeechQuality and Efficient Ve
ctor Quantization in CELP",Proc.ICASSP,1988,pp.155
-158 (文献2)に述べられている。この文献2による
と、LPC合成フィルタ630の駆動信号をピッチ探索
範囲a〜b(a,bは駆動信号のサンプル番号であり、
通常、a=20,b=147)にわたって遅延回路67
0で1サンプルずつ遅延させることにより、a〜bサン
プルのピッチ周期に対する駆動信号ベクトルが作成さ
れ、これがコードワードとして適応コードブックに格納
される。
【0009】最適な駆動信号ベクトルの探索を行う場
合、適応コードブック640から各ピッチ周期に対応す
る駆動信号ベクトルのコードワードが1個ずつ読み出さ
れ、乗算器650で所定のゲインと乗算される。そし
て、LPC合成フィルタ630によりフィルタ演算が行
われ、合成音声信号ベクトルが生成される。生成された
合成音声信号ベクトルは、減算器620で目標信号ベク
トルと減算される。この減算器620の出力は聴感重み
付けフィルタ680を経て誤差計算回路690に入力さ
れ、平均2乗誤差が求められる。平均2乗誤差の情報は
更に最小歪探索回路700に入力され、その最小値が検
出される。
【0010】以上の過程は、適応コードブック640中
の全ての駆動信号ベクトルのコードワードについて行わ
れ、最小歪探索回路700において平均2乗誤差の最小
値を与えるコードワードの番号が求められる。また、乗
算器650で乗じられるゲインも平均2乗誤差が最小に
なるよう決定される。
【0011】次に、同様な方法で最適な白色雑音ベクト
ルの探索が行われる。すなわち、白色雑音コードブック
710から雑音ベクトルのコードワードが1個ずつ読み
出され、乗算器720でのゲインとの乗算、LPC合成
フィルタ630でのフィルタ演算を経て、合成音声信号
ベクトルの生成、目標ベクトルとの平均2乗誤差の計算
が全ての雑音ベクトルについて行われる。そして、平均
2乗誤差の最小値を与える雑音ベクトルの番号及びゲイ
ンが求められる。なお、聴感重み付けフィルタ680は
減算器620から出力される誤差信号のスペクトルを整
形して、人間の耳に知覚される歪を低減するために用い
られる。
【0012】このようにCELP方式は、入力音声信号
に対する合成音声信号の誤差が最小になるような最適の
駆動信号ベクトルを求めているので、符号化ビットレー
トが8kbps 程度の低レートでも高品質の音声を合成す
ることができる。しかし、8kbps 以下のさらに低い符
号化ビットレートになると合成音声の品質劣化が知覚さ
れ、まだ不十分である。
【0013】すなわち、符号化ビットレートを下げるた
めには、最も簡単には入力音声信号のフレーム長を長く
すればよいが、フレーム長を長くするほど合成音声の品
質は低下する。具体的には、符号化ビットレートが8k
bps の場合、入力音声信号のフレーム長を20msec、入
力音声信号の1フレームに対応する駆動信号の符号化に
使用するビット数を160ビットにしたとすれば、符号
化ビットレートを1/2の4kbps に下げるためには、
フレーム長を2倍の40msecにすればよい。しかし、こ
のようにフレーム長を長くすると1フレーム区間で入力
音声信号の特徴が変化してしまう場合が多くなる。具体
的には、入力音声信号の1フレーム区間に特徴の全く異
なる有声区間と無声区間が両方含まれる可能性が高くな
る。この結果、適応コードブックが入力音声信号の特徴
を的確に表現できる状態になっていることが少なくな
り、適応コードブックしての能力が低下してしまう。
【0014】さらに、符号化ビットレートを下げるため
には雑音コードブックに使用されるビット数も少なくす
る必要があるため、適応コードブックが入力音声信号の
変化に対して入力音声信号の特徴を的確に表現できる状
態となるまでに要する時間が長くなってしまう。
【0015】
【発明が解決しようとする課題】上述したように、適応
コードブックを用いる従来のCELP方式においては、
符号化ビットレートをより下げるためには入力音声信号
のフレーム長を長くし、また雑音コードブックに使用さ
れるビット数を少なくする必要があるため、適応コード
ブックの能力が低下し、かつ適応コードブックが入力音
声信号の変化した特徴を的確に表現できるようになるま
で時間がかかり、応答性が悪くなるという問題があっ
た。本発明は、従来のより低ビットレート化を達成しつ
つ、高品質の音声を合成できる音声符号化装置を提供す
ることを目的とする。
【0016】
【課題を解決するための手段】本発明は上記の課題を解
決するため、適応コードブック、すなわち駆動信号を複
数の駆動信号ベクトルのコードワードとしてそれぞれ格
納したコードブックを複数個備え、この適応コードブッ
ク群の全てまたは所定の基準で選択した一つの適応コー
ドブックから入力音声信号を参照して最適な駆動信号ベ
クトルを探索し、その駆動信号ベクトルに所定のゲイン
を乗じたものを音声合成手段である合成手段に入力して
合成音声信号を生成するとともに、この合成フィルタに
入力される駆動信号ベクトルを上記最適な駆動信号ベク
トルが探索された適応コードブックに新たな駆動信号ベ
クトルとして格納するようにしたことを基本的な特徴と
する。
【0017】第1の態様においては、入力音声信号を参
照して適応コードブック群から最適な駆動信号ベクトル
を探索し、その駆動信号ベクトルに所定のゲインを乗じ
た駆動信号ベクトルを合成フィルタの入力として合成音
声信号を生成すると共に、該合成フィルタに入力された
駆動信号ベクトルを適応コードブック群のうち最適な駆
動信号ベクトルが探索されたコードブックに新たな駆動
信号ベクトルとして格納する。
【0018】第2の態様においては、入力音声信号の特
徴に応じて適応コードブック群の中から所定の一つのコ
ードブックを選択して、この選択されたコードブックか
ら入力音声信号を参照して最適な駆動信号ベクトルを探
索し、探索された最適な駆動信号ベクトルに所定のゲイ
ンを乗じた駆動信号ベクトルを合成フィルタの入力とし
て合成音声信号を生成すると共に、該合成フィルタに入
力された駆動信号ベクトルを適応コードブック群のうち
先に選択されたコードブックに新たな駆動信号ベクトル
として格納する。
【0019】第3の態様においては、フレーム単位で入
力される入力音声信号を参照して、第1の探索手段で適
応コードブック群のうち該入力音声信号の前フレームで
選択された駆動信号ベクトルが格納されたコードブック
から最適な駆動信号ベクトルを探索すると共に、第2の
選択手段で前フレームで選択された駆動信号ベクトルが
格納されたコードブック以外のコードブックから最適な
駆動信号ベクトルを探索する。
【0020】そして、これら二つの探索された駆動信号
ベクトルの間に、所定の閾値以上の最適度の差があるか
否かを判定し、所定の閾値以上の最適度の差がない場合
は第1の探索手段により探索された駆動信号ベクトルを
選択し、所定の閾値以上の最適度の差があると判定され
た場合は第2の探索手段により探索された駆動信号ベク
トルを選択して、その選択された駆動信号ベクトルに所
定のゲインを乗じた駆動信号ベクトルを合成フィルタの
入力として合成音声信号を生成すると共に、該合成フィ
ルタに入力された駆動信号ベクトルを選択された駆動信
号ベクトルが格納されているコードブックに新たな駆動
信号ベクトルとして格納する。
【0021】第4の態様においては、入力音声信号を参
照して適応コードブック群から最適な駆動信号ベクトル
を探索する第1の探索モードと、第1の探索モードに続
く所定の複数のフレームにわたり入力音声信号を参照し
て適応コードブック群のうち第1の探索モードで最適な
駆動信号ベクトルが探索された一つのコードブックから
最適な駆動信号ベクトルを探索する第2の探索モードが
用意され、これらが選択的に実行される。
【0022】そして、選択された探索モードで探索され
た最適な駆動信号ベクトルに所定のゲインを乗じた駆動
信号ベクトルを合成フィルタの入力として合成音声信号
を生成すると共に、該合成フィルタに入力された駆動信
号ベクトルを適応コードブック群のうち先に選択された
探索モードで最適な駆動信号ベクトルが探索されたコー
ドブックに新たな駆動信号ベクトルとして格納する。
【0023】
【作用】このように本発明では適応コードブック群また
は選択された一つの適応コードブックから、入力音声信
号を参照して最適な駆動信号ベクトル、すなわち入力音
声信号に対する合成音声信号の誤差が最小となる駆動信
号ベクトルが探索され、その駆動信号ベクトルが合成音
声信号の生成に使用されると共に、新たな駆動信号ベク
トルとして、その駆動信号ベクトルが選択された適応コ
ードブックに格納される。
【0024】従って、適応コードブック群は入力音声信
号の1フレーム区間の各部の特徴をそれぞれ良く反映し
たものとなるため、符号化ビットレートを下げるために
入力音声信号のフレーム長を長くした場合でも、適応コ
ードブック全体の能力が向上する。入力音声信号が例え
ば無声区間から有声区間、有声区間から無声区間へとそ
の特徴が変化する部分においても、符号化に際してその
各部の特徴に応じた適応コードブックが駆動信号ベクト
ルの探索対象として選択されるようになるので、符号化
品質が向上する。
【0025】また、前フレームで選択された駆動信号ベ
クトルを格納した適応コードブックと、それ以外の全て
の適応コードブックからそれぞれ最適な駆動信号ベクト
ルを探索し、最適度つまりその駆動信号ベクトルを用い
て生成された合成音声信号の入力音声信号に対する誤差
の差が閾値以下であれば前フレームで選択された駆動信
号ベクトルを格納した適応コードブックから探索された
駆動信号ベクトルを選択し、そうでなければそれ以外の
適応コードブックから得られる駆動信号ベクトルを選択
することによって、使用される適応コードブックが短時
間内に頻繁に変わるということとがなくなる。これによ
り、同じような入力音声信号の特徴を反映した適応コー
ドブックが複数個存在するという無駄を避けることがで
きる。
【0026】さらに、適応コードブック群の全てから最
適な駆動信号ベクトルを探索する第1の探索モードと、
第1の探索モードに続く所定の複数のフレームにわたっ
て、第1の探索モードで駆動信号ベクトルが探索された
一つのコードブックから最適な駆動信号ベクトルを探索
する第2の探索モードを持つようにすれば、駆動信号ベ
クトルがどの適応コードブックから選択されたかを示す
適応コードブック選択情報は第1の探索モードでのみ復
号化装置へ送ればよいため、適応コードブック選択情報
による符号量の増加が避けられ、かつ駆動信号ベクトル
探索に要する総計算量が減少する。
【0027】
【実施例】以下、図面を参照しながら本発明の実施例を
説明する。
【0028】図1は、本発明の第1の実施例に係る音声
符号化装置のブロック図である。図1において、入力音
声信号は入力端子100からフレームバッファ101に
入力される。フレームバッファ101は、入力音声信号
系列をL個のサンプル単位で切出し、1フレームの信号
として記憶する。Lは、通常160である。フレームバ
ッファ101から読み出される1フレームの入力音声信
号系列は、LPC分析回路102および重み付けフィル
タ106へ供給される。
【0029】LPC分析回路102は、例えば自己相関
法を用いて入力音声信号に対してLPC(Linear Predi
ctive Coding:線形予測符号化)分析を行い、P個のL
PC予測係数{αi 、i=1,2,…,p}、または反
射係数{ki 、i=1,2,…,p}を抽出する。抽出
された予測係数または反射係数は、符号化回路103に
おいて所定のビット数で符号化された後、重み付けフィ
ルタ106および重み付け合成フィルタ107,11
2,122,152で利用される。
【0030】重み付けフィルタ106は、複数個(この
実施例では2個)の適応コードブック110,150お
よび雑音コードブック120から合成フィルタの駆動信
号ベクトルを探索する際に、入力音声信号系列に重み付
けを行うものである。合成フィルタ107,112,1
52,122の伝達関数H(z) は、[数1]で記述され
る。このとき、重み付けフィルタ106の伝達関数W
(z) は[数2]で表される。
【0031】
【数2】 但し、γは重み付けの強さを制御するパラメータである
(0≦γ≦1)。
【0032】重み付け合成フィルタ112,152,1
22は、H(z) なる伝達関数の合成フィルタと、W(z)
なる伝達関数の重み付けフィルタを継続接続したフィル
タであり、その伝達関数HW (z) は[数3]で記述され
る。
【0033】
【数3】
【0034】重み付けフィルタ106を用いると、聴感
上の符号化歪を低減することが可能になる。また、本実
施例では重み付けフィルタ106を駆動信号ベクトルの
探索ループの外に設けた構成になっており、この結果、
探索に要する計算量が大幅に削減される。
【0035】さらに、重み付け合成フィルタ112,1
52,122が駆動信号ベクトルの探索に影響を与えな
いように、初期メモリを備えた重み付け合成フィルタ1
07が設けられている。この重み付け合成フィルタ10
7は、前フレームの最後に重み付け合成フィルタ11
2,152,122が保持していた内部状態を初期状態
として持つ。
【0036】そして、重み付け合成フィルタ107の零
入力応答ベクトルを作成し、減算器108において重み
付けフィルタ106の出力から上記零入力応答ベクトル
を減算する。これにより、重み付け合成フィルタ11
2,152,122の初期状態を零とすることができ、
前フレームの影響を考慮せずに駆動信号ベクトルの探索
を行うことができる。以上の処理は、全てフレーム単位
で行われる。次に、フレームをM個(通常、M=4)の
サブフレームに分割し、サブフレーム単位で駆動信号ベ
クトルを探索する処理について説明する。
【0037】駆動信号ベクトルの探索に際しては、まず
適応コードブックに対して探索を行い、次に雑音コード
ブック120について探索を行う。ここで、適応コード
ブック110に対する探索について説明するが、適応コ
ードブック150および雑音コードブック120に対す
る探索も全く同様である。
【0038】適応コードブック110からピッチ周期j
に対応する駆動信号ベクトルXj(ベクトルの次元
は、L/M=K)を順次読み出し、乗算器111でX
j に所定のゲインβを乗じた後、重み付け合成フィルタ
112に供給する。重み付け合成フィルタ112では、
フィルタリング演算を行って合成音声信号ベクトルを作
成する。
【0039】一方、フレームバッファ101から読み出
された入力音声信号は、重み付けフィルタ106によっ
て重み付けがなされた後、減算器108で前フレームの
影響が差し引かれる。この減算器108から出力される
音声信号ベクトルYを目標ベクトルとして、重み付け
合成フィルタ112から出力される合成音声信号ベクト
ルの目標ベクトルYに対する誤差ベクトルEj が減
算器113で計算される。そして、2乗誤差計算回路1
14において誤差の2乗和‖Ej ‖が計算され、この
‖Ej ‖の最小値および最小値を与えるインデックス
jが最小歪探索回路115で検出される。このインデッ
クスjがjA としてコードブック切替回路161に与え
られる。
【0040】具体的には、誤差ベクトルEj は例えば
[数4]で表わされる。この誤差ベクトル‖Ej ‖を
βで偏微分して零と置くことによって、βを最適化した
場合の‖Ej ‖の最小値が[数5]で表わされる。但
し、βは乗算器111で与えられるゲインである。この
ゲインをβA と表し、このβA の情報をコードブック切
替回路161に入力する。
【0041】
【数4】
【0042】
【数5】
【0043】ここで‖X‖は2乗ノルム、(X,
Y)は内積をそれぞれ表し、Hは[数6]で与えら
れる重み付け合成フィルタ(伝達関数:HW (z) )のイ
ンパルス応答行列である。
【0044】
【数6】
【0045】[数]から明らかなように、適応コード
ブック110からの駆動信号ベクトルの探索は全てのコ
ードワードXj に対して[数]の右辺第2項を計算
し、それが最大になるインデックスjを検出することに
よって行う。
【0046】上述した方法と同様に、適応コードブック
150の目標信号Yに対する最適なインデックスjB
よびゲインβB が求められ、これらの情報がコードブッ
ク切替回路161に入力される。
【0047】誤差比較回路160は、適応コードブック
110から探索された駆動信号ベクトルに乗算器111
でゲインβA を乗じた駆動信号ベクトルを入力として重
み付け合成フィルタ112で生成した合成音声信号ベク
トルの目標ベクトルYに対する最小2乗誤差値E
A と、適応コードブック150から探索された駆動信号
ベクトルに乗算器151でゲインβB を乗じた駆動信号
ベクトルを入力として重み付け合成フィルタ112で生
成した合成音声信号ベクトルの目標ベクトルYに対す
る最小2乗誤差値EB とを比較し、EA <EB ならばS
=0、またEA ≧EB ならばS=1なる適応コードブッ
ク選択信号Sをコードブック切替回路161に与える。
【0048】コードブック切替回路161では、誤差比
較回路160より出力される適応コードブック選択信号
がS=0であれば、適応コードブック選択信号Sととも
にインデックスjA をマルチプレクサ142へ与え、さ
らにゲインβA の情報をゲイン符号化回路140に与え
る。ゲインβA の情報は、ゲイン符号化回路140で符
号化された後、マルチプレクサ142へ与えられる。さ
らに、適応コードブック110から最適な駆動信号ベク
トルXAoptが探索されると、減算器113において目
標ベクトルYからXAoptに対応する重み付け合成フ
ィルタ112から出力される合成音声信号ベクトルが差
し引かれ、この減算器113の出力が雑音コードブック
120の目標ベクトルとなる。
【0049】一方、誤差比較回路160より得られる適
応コードブック選択信号がS=1であれば、コードブッ
ク切替回路161は適応コードブック選択信号Sととも
にインデックスjB をマルチプレクサ142へ与え、さ
らにゲインβB の情報をゲイン符号化回路140に与え
る。ゲインβB の情報は、ゲイン符号化回路140で符
号化された後、マルチプレクサ142へ与えられる。さ
らに、適応コードブック150から最適な駆動信号ベク
トルXBoptが探索されると、減算器153において目
標ベクトルYからXBoptに対応する重み付け合成フ
ィルタ112から出力される合成音声信号ベクトルが差
し引かれ、この減算器153の出力が雑音コードブック
120の目標ベクトルとなる。
【0050】雑音コードブック120からの雑音ベクト
ルの探索についても、適応コードブック110,150
からの最適な駆動信号ベクトルの探索と全く同様に行う
ことができる。この雑音コードブック120から探索さ
れた雑音ベクトルをNopt とする。
【0051】こうして適応コードブック110または1
50からの最適な駆動信号ベクトルXAoptまたはX
Boptが探索され、さらに雑音コードブック120から最
適な雑音ベクトルNopt が探索されると、加算器116
または156において探索された駆動信号ベクトルと雑
音ベクトルが加算され、合成フィルタの駆動信号ベクト
ルXが得られる。この合成フィルタの駆動信号ベクト
ルXは、X =βA ・XAopt+g・Nopt (S=0のとき)X =βB ・XBopt+g・Nopt (S=1のとき)
【0052】と表される。但し、βA ,βB およびg
は、乗算器111,151および121において適応コ
ードブック110,150および雑音コードブック12
0から探索された駆動信号ベクトルおよび雑音ベクトル
にそれぞれ乗じられるゲインである。
【0053】こうして求められた最適な駆動信号ベクト
ルXは、適応コードブック選択信号SがS=0ならば
適応コードブック110に、S=1ならば適応コードブ
ック150にそれぞれ格納される。
【0054】以上の処理の過程で求められた符号化パラ
メータは、マルチプレクサ142で多重化され、出力端
子143から伝送路へ符号化出力として送出される。す
なわち、マルチプレクサ142では(a) LPC分析回路
102で求められたLPC予測係数の情報を符号化回路
103で符号化したコードと、(b) 誤差比較回路160
で得られる適応コードブック選択信号Sと、(c) 最小歪
探索回路115または155で求められた適応コードブ
ック110または150のインデックスjA またはjB
と、(d) 乗算器111または151で乗じられるゲイン
βA またはβBの情報をゲイン符号化回路140で符号
化したコードと、(f) 最小歪探索回路125で求められ
た雑音コードブック120のインデックスjN 、および
(f) 乗算器121で乗じられるゲインgの情報をゲイン
符号化回路141で符号化したコードが多重化される。
次に、図1の音声符号化装置に対応した音声復号化装置
の構成を図2により説明する。
【0055】図2において、入力端子200より入力さ
れた符号化パラメータは、まずデマルチプレクサ201
において前記(a) 〜(f) で説明した個々のパラメータに
分解され、復号化器202でLPC予測係数のコード、
復号化器203で適応コードブックのゲインβA または
βB のコード、復号化器204で雑音コードブックのゲ
インgのコードがそれぞれ復号化される。適応コードブ
ック選択信号Sはコードブック切替回路221へ渡さ
れ、この選択信号Sに基づいて二つの適応コードブック
210,220のいずれかが選択される。そして、選択
された適応コードブックからインデックスjA またはj
B で指定される駆動信号ベクトル、雑音コードブック2
12からインデックスjN で指定される雑音ベクトルが
それぞれ読み出され、乗算器211,213においてゲ
インβA またはβB 、ゲインgがそれぞれ乗じられた
後、加算器214でそれらの乗算結果が加算されること
により、駆動信号が作成される。この駆動信号が合成フ
ィルタ215でフィルタリングされることによって、合
成音声信号が作成される。この合成音声信号は、ポスト
フィルタ216でスペクトルの整形が行われ、聴感的な
歪が抑圧された後、出力端子217より出力される。
【0056】次に、適応コードブック選択信号Sに基づ
いてコードブック切替回路221が制御され、加算器2
14から出力された駆動信号が適応コードブック21
0,220のいずれかに格納される。
【0057】次に、具体的な例を用いて本実施例と従来
例による効果の相違を説明する。図3の(a)は無声区
間から有声区間へ変化する入力音声信号波形の典型的な
例であり、また(b)は図8に示した従来例における適
応コードブックの内部状態、(c)は本実施例における
二つの適応コードブックの内部状態をそれぞれ模式的に
示したものである。
【0058】図3(b)に示されるように、従来例では
適応コードブックは入力音声信号の無声区間においては
無声区間の特徴を反映した状態になっており、この状態
では有声区間に対してはほとんど効果が期待できない。
入力音声信号が有声区間になると、適応コードブックは
雑音コードブックの助けによって除々に有声区間の特徴
を反映した状態に変化してゆくが、適応コードブックの
能力が落ちた状況で符号化が長い時間続いてしまうの
で、得られる合成音声の品質は低下している。
【0059】これに対し、本実施例では図3(c)に示
されるように、二つの適応コードブックが既に過去の入
力音声信号の特徴を反映して有声区間、無声区間にそれ
ぞれ対応した状態になっている。このため入力音声信号
が無声区間から有声区間に変化した場合は、有声区間の
特徴を反映した適応コードブックが選択されることによ
り、適応コードブック全体として高い能力が期待でき
る。また、入力音声信号が有声区間から無声区間へ変化
する場合も、同様の効果が得られることは容易に類推で
きる。次に、本発明の他の実施例を説明する。なお、以
下の実施例においては図1と同一部分に同一の参照符号
を付して、相違点についてのみ述べる。図4は、本発明
の第2の実施例に係る音声符号化装置のブロック図であ
る。本実施例と第1の実施例の違いは、適応コードブッ
クの選択方法にある。
【0060】第1の実施例では目標信号Yに対し、2
乗誤差が最小となる駆動信号ベクトルを適応コードブッ
ク110,150からそれぞれ探索し、両適応コードブ
ック110,150から得られる駆動信号ベクトルの中
で2乗誤差が最小となるものを最適な駆動信号ベクトル
として求めていた。これに対し、本実施例では入力音声
信号の特徴を分析し、その分析結果(特徴量)に応じて
使用する適応コードブックを開ループ的に求める。ま
た、この実施例では特徴分析として有声/無声判定を用
いる。
【0061】図4において、有声/無声判定回路162
は入力音声信号を分析して有声区間か無声区間かの判定
を行い、その判定結果に従って適応コードブック選択信
号Sを出力する。すなわち、有声/無声判定回路162
は有声区間と判定した場合、適応コードブック選択信号
SをS=0とし、無声区間と判定した場合、S=1とし
て、この適応コードブック選択信号Sを適応コードブッ
ク切替回路161に送ると共に、切替スイッチ164,
165にも切替信号として供給する。
【0062】適応コードブック選択信号SがS=0のと
きは、適応コードブック切替回路161は適応コードブ
ック110を選択し、切替スイッチ164は重み付け合
成フィルタ112から出力される合成音声信号ベクトル
を選択して減算器163へ与え、切替スイッチ165は
減算器163から出力される音声信号ベクトルを2乗誤
差計算回路114へ与える。
【0063】また、S=1のときは、適応コードブック
切替回路161は適応コードブック150を選択し、切
替スイッチ164は重み付け合成フィルタ152から出
力される合成音声信号ベクトルを選択して減算器163
へ与え、切替スイッチ165は減算器163から出力さ
れる音声信号ベクトルを2乗誤差計算回路154へ与え
る。
【0064】このようにして、S=0のときは適応コー
ドブック110について、目標ベクトルY(減算器1
08から出力される音声信号ベクトル)に対して合成音
声信号ベクトルの2乗誤差が最小となる駆動信号ベクト
ルを探索し、またS=1のときは適応コードブック15
0について同様に探索を行う。こうして探索された駆動
信号ベクトルは、選択された適応コードブックに格納さ
れる。
【0065】この実施例によれば、入力音声信号の特徴
から駆動信号ベクトルを探索すべき適応コードブックを
選択するため、一つの適応コードブックについてのみ探
索を行えばよく、第1の実施例に比較して駆動信号ベク
トルの探索に必要な計算量を削減できる。なお、本実施
例における音声復号化装置は図2と同一の構成でよいの
で、説明は省略する。
【0066】図5は、本発明の第3の実施例に係る音声
符号化装置のブロック図である。本実施例では、前フレ
ームにおける適応コードブック選択信号Sをメモリ16
6に記憶しておき、現フレームでの駆動信号ベクトルの
探索の際、このメモリ166に記憶されている適応コー
ドブック選択信号Sで示される適応コードブックから探
索された駆動信号ベクトルを用いて重み付け合成フィル
タで生成した合成音声ベクトルの目標ベクトルに対する
最小2乗誤差の値と、それ以外の適応コードブックから
探索された駆動信号ベクトルを用いて重み付け合成フィ
ルタで生成した合成音声ベクトルの目標ベクトルに対す
る最小2乗誤差の値とを誤差比較回路160で比較す
る。
【0067】ここで、誤差比較回路160は本実施例で
は比較する二つの最小2乗誤差の差に対して閾値処理を
行う機能を持っており、適応コードブック切替回路16
1はこの差が閾値以下の場合はメモリ166に記憶され
ている適応コードブック選択信号Sで示される適応コー
ドブックを選択し、そうでない場合はそれ以外の適応コ
ードブックを選択する。
【0068】例えば、メモリ166に記憶されている適
応コードブック選択信号Sが適応コードブック110を
示しており、適応コードブック110,150から探索
された駆動信号ベクトルにゲインを乗じた駆動信号ベク
トルを用いて重み付け合成フィルタで生成した合成音声
ベクトルの目標ベクトルに対する最小2乗誤差値をそれ
ぞれEA ,EB とし、誤差比較回路160での上記の閾
値をεとしたとき、適応コードブック110,150の
選択状態は次の通りとなる。 EA −EB ≦ε→適応コードブック110を選択 EA −EB >ε→適応コードブック150を選択
【0069】こうして選択された適応コードブックにつ
いて駆動信号ベクトルの探索が行われ、また探索された
駆動信号ベクトルにゲインを乗じた駆動信号ベクトルが
選択された適応コードブックに新たな駆動信号ベクトル
として格納される。
【0070】本実施例によれば、誤差比較回路160に
おいて閾値処理を行うことで、前フレームで使用した適
応コードブックが選択されやすくなるため、短時間内に
全ての適応コードブックが選択されることが少なくな
る。短時間内に全ての適応コードブックが選択される
と、各適応コードブックが入力音声信号の同じような特
徴を反映した状態となって、適応コードブック全体の能
力が低下する可能性があるが、本実施例によればこのよ
うな現象を回避することができる。なお、本実施例にお
ける音声復号化装置も図2と同一の構成でよいので、説
明は省略する。
【0071】図6は、本発明の第4の実施例に係る音声
符号化装置のブロック図である。本実施例では、第1〜
第3の実施例のようにサブフレーム毎に適応コードブッ
クを選択し、かつその都度適応コードブック選択信号S
を復号化装置側へ伝送することを行わず、入力音声信号
の特徴の時間的変動が小さいことに着目して、あるサブ
フレームで最適な適応コードブックが選択されたなら、
その適応コードブックを複数のサブフレームにわたって
強制的に使用するようにしたものである。これによって
伝送すべき符号量および適応コードブック探索に必要な
計算量を最小限に止めることができる。
【0072】図6において、カウンタ167は“0”を
初期値とし、入力音声信号の新たなサブフレーム毎にそ
の出力値Cが“1”ずつインクリメントされ、カウント
値Cが任意定数Nになると、“0”に戻る動作を行う。
従って、カウンタ167の出力値Cのとりうる範囲は C=0〜N−1 (N:任意の定数) となる。カウンタ167には、メモリ168が接続され
ている。
【0073】本実施例では適応コードブックに対する駆
動信号ベクトルの探索のモードとして、全コードブック
探索モード(第1の探索モード)と、特定コードブック
選択モード(第2の探索モード)を持ち、これらのモー
ドはカウンタ167によって選択される。
【0074】すなわち、カウンタ167の出力値が
“0”のときは全コードブック探索モードとして、第1
の実施例と同様に適応コードブック110,150の両
方について最適な駆動信号ベクトルの探索を行い、その
最適な駆動信号ベクトルを探索した適応コードブックを
示す適応コードブック選択信号Sをメモリ168に記憶
する。
【0075】一方、カウンタ167の出力値Cが“0”
以外の値を示すNサブフレームの期間では特定コードブ
ック探索モードとして、このメモリ168に記憶されて
いる適応コードブック選択信号Sで示される適応コード
ブックのみについて最適な駆動信号ベクトルの探索を行
う。この特定コードブック探索モードでは、一つの適応
コードブックに対してのみ駆動信号ベクトルの探索を行
えばよく、また復号器に対して適応コードブック選択信
号Sを伝送する必要はない。
【0076】従って、本実施例によると常時全コードブ
ック選択モードとした場合に比較して、駆動信号ベクト
ルの探索に要する計算量と、復号化装置側へ伝送する符
号量を減らすことができ、より効率の高い符号化が可能
となる。
【0077】なお、本実施例ではカウンタ167の出力
値Cが“0”の場合の全探索モードでの適応コードブッ
クに対する駆動信号ベクトルの探索法として、第1の実
施例の探索法を例にとって説明したが、第2または第3
の実施例における探索法を用いることも可能である。
【0078】次に、図6の音声符号化装置に対応した音
声復号化装置の構成を図7により説明する。図7におい
て、図2と同一部分には同一の参照符号を付して詳細な
説明を省略する。また、図7におけるカウンタ230お
よびメモリ231は、図6におけるカウンタ167およ
びメモリ168と同じ動作を行うものである。
【0079】図7に示す音声復号化装置においては、カ
ウンタ230の出力値Cが“0”のときに、図6の音声
符号化装置から送られる適応コードブック選択信号Sを
適応コードブック切替回路221に与え、かつメモリ2
31は適応コードブック選択信号Sを記憶する。カウン
タ230の出力値Cが“0”以外の値をとりうるとき
は、適応コードブック選択信号Sが送られてこないの
で、メモリ231に記憶されている適応コードブック選
択信号Sを読み出して、適応コードブック切替回路22
1に与えるようにする。このようにして駆動信号を生成
し、合成音声信号を生成することができる。
【0080】
【発明の効果】以上説明したように、本発明によれば適
応コードブックを複数個備え、入力音声信号に応じて符
号化に使用する適応コードブックを選択して駆動信号ベ
クトルを求め、適応コードブック更新の際はその駆動信
号ベクトルを選択された適応コードブックに新たな駆動
信号ベクトルとして格納することで、入力音声信号の特
徴を正しく反映した適応コードブックを得ることができ
る。
【0081】従って、符号化出力を低ビットレート化す
るために入力音声信号のフレーム長を長くしても、入力
音声信号の1フレーム区間内での特徴変化に対して、そ
の特徴を的確に表現している適応コードブックが選択さ
れるようになる。この結果、適応コードブック全体の能
力が向上し、単一の適応コードブックを用いる従来の方
式に比較して、より低ビットレート化を達成しつつ合成
音声の品質向上を図ることができる。
【図面の簡単な説明】
【図1】本発明の第1の実施例に係る音声符号化装置の
ブロック図
【図2】同実施例に係る音声復号化装置のブロック図
【図3】無声区間から有声区間へ変化する入力音声信号
に対する第1の実施例と従来例における適応コードブッ
クの状態変化を模式的に示す図
【図4】本発明の第2の実施例に係る音声符号化装置の
ブロック図
【図5】本発明の第3の実施例に係る音声符号化装置の
ブロック図
【図6】本発明の第4の実施例に係る音声符号化装置の
ブロック図
【図7】同実施例に係る音声復号化装置のブロック図
【図8】従来の音声符号化装置における駆動信号ベクト
ル探索に係る部分の構成を示すブロック図
【符号の説明】
100…音声信号入力端子 102…LPC分
析回路 103…符号化回路 106…重み付け
フィルタ 107…重み付け合成フィルタ 110…適応コー
ドブック 112…重み付け合成フィルタ 114…2乗誤差
計算回路 115…最小歪探索回路 120…雑音コー
ドブック 122…重み付け合成フィルタ 124…2乗誤差
計算回路 125…最小歪探索回路 140…ゲイン符
号化回路 141…ゲイン符号化回路 142…マルチプ
レクサ 143…出力端子 150…適応コー
ドブック 152…重み付け合成フィルタ 154…2乗誤差
計算回路 155…最小歪探索回路 160…誤差比較
回路 161…適応コードブック切替回路 162…有声/無
声判定回路 164…切替スイッチ 165…切替スイ
ッチ 166…メモリ 167…カウンタ 168…メモリ
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平1−258000(JP,A) 特開 平2−287400(JP,A) 特開 平3−75700(JP,A) 特開 平4−51100(JP,A) 特開 平4−75100(JP,A) 特開 平5−249999(JP,A) 特開 平5−265496(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 19/00 - 19/14 H03M 7/30 H04B 14/04

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】駆動信号を複数の駆動信号ベクトルのコー
    ドワードとしてそれぞれ格納したコードブック群と、 入力音声信号を参照して前記コードブック群から最適な
    駆動信号ベクトルを探索する探索手段と、 この探索手段により前記コードブック群から探索された
    駆動信号ベクトルに所定のゲインを乗じた駆動信号ベク
    トルを入力として合成音声信号を生成する音声合成手段
    と、 前記音声合成手段に入力された駆動信号ベクトルを前記
    コードブック群のうち前記最適な駆動信号ベクトルが探
    索されたコードブックに新たな駆動信号ベクトルとして
    格納する格納手段とを具備することを特徴とする音声符
    号化装置。
  2. 【請求項2】駆動信号を複数の駆動信号ベクトルのコー
    ドワードとしてそれぞれ格納したコードブック群と、 入力音声信号の特徴に応じて前記コードブック群の中か
    ら所定の一つのコードブックを選択する選択手段と、 前記入力音声信号を参照して前記選択手段により選択さ
    れたコードブックから最適な駆動信号ベクトルを探索す
    る探索手段と、 この探索手段により探索された駆動信号ベクトルに所定
    のゲインを乗じた駆動信号ベクトルを入力として合成音
    声信号を生成する音声合成手段と、 前記音声合成手段に入力された駆動信号ベクトルを前記
    コードブック群のうち前記選択手段により選択されたコ
    ードブックに新たな駆動信号ベクトルとして格納する格
    納手段とを具備することを特徴とする音声符号化装置。
  3. 【請求項3】駆動信号を複数の駆動信号ベクトルのコー
    ドワードとしてそれぞれ格納したコードブック群と、 フレーム単位で入力される入力音声信号を参照して、前
    記コードブック群のうち該入力音声信号の前フレームで
    選択された駆動信号ベクトルが格納されたコードブック
    から最適な駆動信号ベクトルを探索する第1の探索手段
    と、 前記入力音声信号を参照して、前記コードブック群のう
    ち前記前フレームで選択された駆動信号ベクトルが格納
    されたコードブック以外のコードブックから最適な駆動
    信号ベクトルを探索する第2の探索手段と、 前記第1の探索手段により探索された駆動信号ベクトル
    と前記第2の探索手段により探索された駆動信号ベクト
    ルとの間に、所定の閾値以上の最適度の差があるか否か
    を判定する判定手段と、 前記判定手段により前記所定の閾値以上の最適度の差が
    ないと判定された場合は前記第1の探索手段により探索
    された駆動信号ベクトルを選択し、前記所定の閾値以上
    の最適度の差があると判定された場合は前記第2の探索
    手段により探索された駆動信号ベクトルを選択する選択
    手段と、 前記選択手段により選択された駆動信号ベクトルに所定
    のゲインを乗じた駆動信号ベクトルを入力として合成音
    声信号を生成する音声合成手段と、 前記音声合成手段に入力された駆動信号ベクトルを前記
    コードブック群のうち前記選択手段により選択された駆
    動信号ベクトルが格納されたコードブックに新たな駆動
    信号ベクトルとして格納する格納手段とを具備すること
    を特徴とする音声符号化装置。
  4. 【請求項4】駆動信号を複数の駆動信号ベクトルのコー
    ドワードとしてそれぞれ格納したコードブック群と、 第1の探索モードにおいてフレーム単位で入力される入
    力音声信号を参照して前記コードブック群から最適な駆
    動信号ベクトルを探索する第1の探索手段と、 前記第1の探索モードに続く所定の複数のフレームにわ
    たる第2の探索モードにおいて前記入力音声信号を参照
    して前記コードブック群のうち前記第1の探索モードで
    最適な駆動信号ベクトルが探索された一つのコードブッ
    クから最適な駆動信号ベクトルを探索する第2の探索手
    段と、 これら前記第1および第2の探索モードを選択する選択
    手段と、 前記選択手段により選択された探索モードで探索された
    駆動信号ベクトルに所定のゲインを乗じた駆動信号ベク
    トルを入力として合成音声信号を生成する音声合成手段
    と、 前記音声合成手段に入力された駆動信号ベクトルを前記
    コードブック群コードのうち前記選択手段により選択さ
    れた探索モードで駆動信号ベクトルが探索されたコード
    ブックに新たな駆動信号ベクトルとして格納する格納手
    段とを具備することを特徴とする音声符号化装置。
JP28300192A 1992-10-21 1992-10-21 音声符号化装置 Expired - Fee Related JP3270146B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP28300192A JP3270146B2 (ja) 1992-10-21 1992-10-21 音声符号化装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP28300192A JP3270146B2 (ja) 1992-10-21 1992-10-21 音声符号化装置

Publications (2)

Publication Number Publication Date
JPH06130997A JPH06130997A (ja) 1994-05-13
JP3270146B2 true JP3270146B2 (ja) 2002-04-02

Family

ID=17659937

Family Applications (1)

Application Number Title Priority Date Filing Date
JP28300192A Expired - Fee Related JP3270146B2 (ja) 1992-10-21 1992-10-21 音声符号化装置

Country Status (1)

Country Link
JP (1) JP3270146B2 (ja)

Also Published As

Publication number Publication date
JPH06130997A (ja) 1994-05-13

Similar Documents

Publication Publication Date Title
US5602961A (en) Method and apparatus for speech compression using multi-mode code excited linear predictive coding
KR100304682B1 (ko) 음성 코더용 고속 여기 코딩
JP3346765B2 (ja) 音声復号化方法及び音声復号化装置
JP3094908B2 (ja) 音声符号化装置
US6978235B1 (en) Speech coding apparatus and speech decoding apparatus
US5659659A (en) Speech compressor using trellis encoding and linear prediction
JPH0990995A (ja) 音声符号化装置
EP1005022B1 (en) Speech encoding method and speech encoding system
JPH08272395A (ja) 音声符号化装置
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
JPH09319398A (ja) 信号符号化装置
JPH10177398A (ja) 音声符号化装置
JPH0944195A (ja) 音声符号化装置
JP3353852B2 (ja) 音声の符号化方法
JP2003044099A (ja) ピッチ周期探索範囲設定装置及びピッチ周期探索装置
JP3270146B2 (ja) 音声符号化装置
JP3360545B2 (ja) 音声符号化装置
JP3153075B2 (ja) 音声符号化装置
JP3299099B2 (ja) 音声符号化装置
JPH0519795A (ja) 音声の励振信号符号化・復号化方法
JP3232701B2 (ja) 音声符号化方法
JP2968109B2 (ja) コード励振線形予測符号化器及び復号化器
JPH0830299A (ja) 音声符号化装置
JP3249144B2 (ja) 音声符号化装置
JP3192051B2 (ja) 音声符号化装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees