JPH10207495A

JPH10207495A - 音声情報処理装置

Info

Publication number: JPH10207495A
Application number: JP9008356A
Authority: JP
Inventors: Akiko Susa; 明子須佐; Toru Okamoto; 亨岡本; Masahiro Tsujikawa; 真寛辻川; Yoshiaki Asakawa; 吉章浅川
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1997-01-21
Filing date: 1997-01-21
Publication date: 1998-08-07

Abstract

(57)【要約】【課題】ＣＥＬＰ符号化方式における、最適音源ベク
トルの検索を高速化し、同処理に使用するメモリ量を削
減する。【解決手段】複数の音源ベクトルからなる音源符号帳
を格納した音源ベクトルメモリ１０と、しきい値比較部
２０と、音声合成部３０と、入力音声信号のベクトル要
素と前記メモリから読み出したベクトル要素を検索処理
する評価関数算出部４０と、評価関数の最大値を検出す
る最大値比較部５０とからなるＣＥＬＰ符号化器におい
て、音源符号帳をベクトルの要素を数要素ずつずらして
重ねあわせた形（オーバーラップ）に構成し、比較部２
０において読み出した音源ベクトル要素を予め設定した
しきい値Ｅとの比較し、値がしきい値以上の要素のみ、
評価関数演算を行うようにした。また、この比較による
削減処理量を大きくするため、評価関数算出部内の音声
合成にインパルス応答を使用した。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、無線通信などに用
いられる符号励振線形予測（ＣＥＬＰ：code excited l
inear prediction）符号化方式、および該符号化方式の
符号器および／または復号器を備えて構成される音声情
報処理装置に関するものである。

【０００２】

【従来の技術】本発明における符号励振線形予測（ＣＥ
ＬＰ）符号化方式は、アナログの音声信号をディジタル
データに変換する符号化とその符号化データを音声信号
に戻す復号化の方式の一種で、予め用意した数十の振幅
データの組合せからなる音声ベクトルを組み合わせて伝
送速度１０Ｋｂ／ｓ程度に符号化する方式である。この
ＣＥＬＰ方式は、入力音声が有声音か無声音か判別し、
有声音にはパルス音源を、無声音には雑音源を使用して
符号化または復号化している。この符号化方式は、無声
音時の処理量が有声音時の処理量に比較して多いことか
ら、ＤＳＰ（Digital signal processor）による符号化
／復号化処理上の隘路となっていた。ＣＥＬＰ方式自体
は、同業者にとって公知なので、本明細書では詳細な説
明は割愛する。

【０００３】図７および図８を用いて、従来のＣＥＬＰ
方式に用いる、符号器および復号器の全体構成を説明す
る。図７に示すように、ＣＥＬＰ符号器は、線形予測分
析部５０１と、聴覚重み付フィルタ部５０２と、重み付
合成フィルタ部５０３と、有声音用の適応コードブック
を有した適応コードブック検索部５０４と、無声音用の
統計コードブック（音源符号帳）を有した統計コードブ
ック検索部５０５と、２乗和演算部５０６と、２乗誤差
最小化部５０７と、伝送ビット多重化部５０８とから構
成される。ＣＥＬＰ符号器は、有声音に対しては、適応
コードブックを用いて、無声音に対しては統計コードブ
ックを用いて、入力音声に最適の音源ベクトルを検索
し、線形予測係数α、適応コードブックに対する利得
β、統計コードブックに対する利得γ、最適適応コード
ベクトルインデックスＬ、最適統計ベクトルインデック
スＩを多重して送出する。

【０００４】図８に示すように、ＣＥＬＰ復号器は、伝
送ビット多重分離部５１１と、適応コードブックを有し
た適応コードベクトル検索部５１２と、統計コードブッ
クを備えた統計コードベクトル検索部５１３と、復号化
合成フィルタ部５１４と、ポストフィルタ部５１５とか
ら構成される。ＣＥＬＰ復号器は、受信したベクトルイ
ンデックスに基づいて、適応コードブックから最適な音
源ベクトルを取り出して有声音の、統計コードブックか
ら最適な音源ベクトルを取り出して無声音の音声出力に
復号する。

【０００５】ＣＥＬＰ方式においては、符号化器に備え
られる適応コードブックおよび統計コードブックと、復
号化器に備えられる適応コードブックおよび統計コード
ブックは、それぞれ同一のコードブックが用いられる。

【０００６】上記した通常のＣＥＬＰ符号化方式におい
て、統計コードブックは、図１（Ａ）に示すように、ベ
クトル次元長の音源ベクトルデータ列を、伝送するビッ
ト数に対応する数（音源ベクトル数）だけ、音源ベクト
ルとして音源符号帳（統計コードブック）に格納してい
る。例えば、サンプリング周波数が８ｋＨz、フレーム
長が４０ms、サブフレーム長が１０ms、線形予測次数が
１０次、伝送ビット数が６ビットのシステムにおいて、
音源ベクトル次元数は８０となり、音源ベクトル数は６
４となる。以下、この条件下において説明する。

【０００７】ＣＥＬＰ符号器において、最適な音源ベク
トルを検索する際には、統計コードブックから検索対象
のベクトルインデックスに対応する音源ベクトルを読み
出し、評価関数へ入力している。重み付合成フィルタ部
で読み出した音源ベクトルデータＣjに、重み付合成フ
ィルタをかける。重み付合成フィルタ関数Ｈ（ｚ）は、
現フレームの重み付合成フィルタ係数α［ｋ］を用いる
と、下記（１）式のように表わされる。

【０００８】

【数１】ここで、Ｎpは線形予測次数を示し、一般的な例として
Ｎp＝１０としている。この重み付けフィルタ部５０３
は、検索対象となる入力音源ベクトルＣjに線形予測係
数αを乗じて、合成音声ベクトルＳjを出力する。

【０００９】合成音声ベクトルＳjの要素Ｓj［i］を、
下記の（２）式，（３）式に入力し、評価値Ｃi，Ｇiを
演算する。

【００１０】

【数２】ここでｐ［i］は、重み付入力音声から過去の重み付合
成フィルタの影響であるゼロ入力応答などを減算したデ
ータ列である。また、jは音源ベクトルインデックス
（０〜６３）を示し、iは音源ベクトルの要素番号（０
〜７９）を示す。これらの値から、次の（４）式で示さ
れる評価関数を演算する。

【００１１】

【数３】この値が最大となる音源ベクトルを、現フレームの最適
音源ベクトルとして最適コードベクトルインデックスを
得る。

【００１２】

【発明が解決しようとする課題】上述の従来技術のＣＥ
ＬＰ符号化方式においては、音源ベクトルメモリの要素
数が、各音源ベクトルを構成する要素数すなわちベクト
ル次元数iと音源ベクトル数jとの積と同じになっている
が、符号化音声品質を維持するためには、音源ベクトル
数jを極端に削減することはできない。そのため、メモ
リ量が膨大なものとなっている。また、全ての音源ベク
トルに対して評価関数を計算するため、演算量も膨大と
なっている。

【００１３】例えば、前記従来技術で述べた条件下で
は、（１）式の合成フィルタ演算を行うだけでも、サブ
フレーム毎に５１，２００回の積和演算を必要とする。
この演算量は、汎用の浮動小数点ＤＳＰを用いた場合、
１秒間の演算量を示すＭＩＰＳ（Million Instruction
Per Second）値は、５.１２ＭＩＰＳとなる。また、そ
の他の演算も含めると、積和演算だけでも、全部で６
２，２４０回、６.２２ＭＩＰＳとなり、ＤＳＰの演算
能力が２０ＭＩＰＳとすると、その３０％以上に達す
る。さらに、同条件下でのメモリ量は、５，１２０word
必要である。

【００１４】符号化装置全体のＤＳＰ数やメモリ量は、
実用上制限されることが多い。よって、従来技術におい
ては、装置を実現する上で、処理量とメモリ量を削減す
ることが重要である。ＣＥＬＰ方式の処理量、コードブ
ックメモリ量を大幅に削減する方法として、ＶＳＥＬＰ
(Vector-Sum Excited Linear Prediction)方式が知られ
ている。この方式は、メモリに少数(ｍ個)の基底ベクト
ルのみ格納しておき、基底ベクトルの加算もしくは減算
によって、２のｍ乗個の音源ベクトルを構成するもので
ある。しかしながら、音源ベクトルのこのような構造上
の制約によって、従来型のＣＥＬＰと同等の符号化音声
品質を達成するためには、より多くのビットが必要であ
ることが知られている。

【００１５】本発明の目的は、従来型のＣＥＬＰ方式に
おいて、無声音時の処理量とメモリ量の削減を達成する
ことである。

【００１６】

【課題を解決するための手段】ＣＥＬＰ方式における音
源符号帳に格納される音源ベクトルは、雑音源から構成
されることから、上記課題を解決するために、本発明
は、音源符号帳の構成を、次のように変更する。すなわ
ち、本発明は、例えば雑音源から得られた一連の音源ベ
クトル列をメモリに格納して音源符号帳を構成する。こ
の音源ベクトル列は、各ベクトルを数要素ずつずらして
重ね合わせ（オーバラップ）て格納したものとして扱
い、ベクトル次元数iと音源ベクトル数（音源ベクトル
数）jとの積よりも少ない要素数にすることによって、
メモリへの格納量を大幅に減少させる。音源ベクトルを
読み出すに当たっては、読み出す音源ベクトルの先頭ア
ドレスを制御して、対象とする音源ベクトルをその先頭
アドレスからベクトル次元数で切り出し、音源ベクトル
として使用する。この方法（オーバーラップ）によっ
て、メモリ量を削減することができる。統計コードブッ
ク（音源符号帳）のオーバーラップの概念を図１（Ｂ）
に示す。但し、ここでも、サンプリング周波数、フレー
ム長、サブフレーム長、線形予測次数、伝送ビット数、
音源ベクトル次元数、音源ベクトル数などの条件は前述
した従来技術の条件と同様とする。

【００１７】既に述べたように、従来のＣＥＬＰ方式の
音源符号帳は、図１（Ａ）に示すように、雑音から得ら
れた例えば音源ベクトル次元数８０の一連の音源ベクト
ルを、それぞれの音源ベクトルごとに対応したアドレス
（コードベクトルインデックス）に格納していた。した
がって、この方法では、音源ベクトル数jと音源ベクト
ル次元数iの積に相当するメモリ容量が必要であった。
図１（Ｂ）に示すように、本発明にかかるオーバラップ
型の音源符号帳は、連続した雑音を一連の音源ベクトル
要素列として格納し、この音源ベクトル要素列に順次コ
ードベクトルインデックスＣjを付与して音源ベクトル
としている。音源符号帳から音源ベクトルを読み出すに
当たっては、コードインデックスＣjを先頭に音源ベク
トル次元数ｉ分の音源ベクトル要素Ｃj［i］を切り出し
て音源ベクトルとする。このような音源符号帳とするこ
とによって、音源符号帳を格納するメモリ容量を大幅に
少なくすることができる。

【００１８】次に、処理量を削減する方法として、ベク
トル要素の間引き(スパース化)を行う。重み付合成フィ
ルタでの演算は、前述の（１）式の形ではスパース化の
効果があらわれない。復号化音声を作成する音源ベクト
ル中の要素数ｉを減らしていくと、元のベクトルの要素
数から１０％程度まで削減しても、復号化した音声は、
主観的な品質が劣化しないことがわかっている。これ
は、１９８６年IEEE. ICASSP.において発表された論
文、”ComplexityReduction Methods for Vector Excita
tion Coding”（Grant Davidson，Allen Gersho共著）
に示されている。これに基づき、本発明は、音源ベクト
ルメモリから読み出した音源ベクトル要素の値Ｃiをし
きい値Ｅと比較し、しきい値以上のベクトル要素につい
てのみ、合成フィルタの演算を行うようにする。この方
法によれば、フィルタの初期内容を０にセットすること
ができるので、合成フィルタのインパルス応答ｈを使用
して演算すると、スパース化により大幅に処理を削減す
ることができる。

【００１９】スパース化の例を図２に示す。すなわち、
統計コードブックに格納された音源ベクトルＣjを構成
する音源ベクトル要素Ｃj［i］のデータ列が図２（Ａ）
に示される内容だとする。図２（Ｂ）に示すように統計
コードブックから読み出された音源ベクトルデータをし
きい値Ｅと比較し、図２（Ｃ）に示すようにしきい値を
越えた音源ベクトル要素Ｃj［i］データのみを評価関数
算出部へ送るようにする。このことによって、データの
間引きによる処理量の減少に加えて、データがオーバラ
ップしていることから、各音源ベクトルにおける演算処
理は、相違する部分のみを対象とすればよくその処理量
を大幅に減少することができる。

【００２０】

【発明の実施の形態】本発明にかかる符号励振線形予測
（ＣＥＬＰ）符号化器の構成を、図７および図３を用い
て説明する。図７において、本発明に特徴的な部分を破
線で囲んで示し、破線で囲まれた部分の詳細な構成を図
３に示す。以後、簡単化のため、該当部分についてのみ
述べ、他の部分の説明は省略する。以下、図面を参照し
て、本発明の実施例について説明する。なお、これらの
実施例では、従来技術と同様に、音声のサンプリング周
波数を８ＫＨz、フレーム長を４０ms、サブフレーム長
を１０ms、線形予測次数を１０次、音源ベクトル数を６
４としたＣＥＬＰ方式に適用した場合を想定して説明す
る。この時、音源ベクトル次元数は８０である。

【００２１】図３に、本発明による音源ベクトルの構成
と検索方法の一実施例を示す。本実施例は、複数の音源
ベクトルＣjからなる音源符号帳が格納された音源ベク
トルメモリ１０と、音源ベクトルＣjのベクトル要素Ｃj
［i］としきい値Ｅとを比較し、しきい値以上のベクト
ル要素Ｃj［i］のみからなるスパース化音源ベクトルＣ
´jを出力するしきい値比較部２０と、スパース化音源
ベクトルＣ´jとインパルス応答ｈから合成音声ベクト
ルＳjを作成する音声合成部３０と、合成音声ベクトル
Ｓjと重み付入力音声のゼロ入力応答減算後の重み付入
力音声ｐとから前記（４）式で示される評価関数Ｃi²／
Ｇiを算出する評価関数算出部４０と、順次入力される
評価値Ｃi²／Ｇiの最大値joptをとる最大値比較部５０
と、最大値比較部の最大値jopt出力に基づいて音源ベク
トルメモリ１０から評価値が最大の音源ベクトルを取り
出して最適な音源ベクトルを作成する出力作成部６０と
を有して構成される。

【００２２】ここで、各構成要素について説明する。音
源ベクトルメモリ１０は、図１（Ｂ）に示した音源ベク
トルの先頭アドレスを少なくとも１要素（音源ベクトル
次元）ずつずらしたオーバーラップ形の音源ベクトル要
素列からなる音源符号帳が格納されている。しきい値比
較部２０は、音源ベクトルメモリから読み出した音源ベ
クトルＣjのベクトル要素Ｃj［i］がしきい値Ｅ以上か
どうか判定し、しきい値Ｅ以上のベクトル要素Ｃj［i］
のみからなるスパース化音源ベクトルＣ´jを、音声合
成部３０に入力する。

【００２３】音声合成部３０は、図７に示した重み付合
成フィルタ部５０３と同等であり、重み付合成フィルタ
部のインパルス応答ｈを入力し、合成音声ベクトルＳj
を算出する。評価関数算出部４０は、音声合成部３０の
出力である合成音声ベクトルＳjと、重み付入力音声か
ら重み付合成フィルタのゼロ入力応答を減算したデータ
ｐとから、評価関数Ｃi²／Ｇiを算出する。比較部５０
は、評価関数算出部４０から入力される評価関数の評価
値Ｃi²／Ｇiをそれまで演算した評価関数の最大評価値
Ｍと比較して、算出した評価値Ｃi²／Ｇiが最大値かど
うかを判定し、すべての音源ベクトル検索が終了した時
点で、最大評価値に対応する音源ベクトルのインデック
スjoptを出力する。出力作成部６０は、最適な音源ベク
トルインデックスjoptを用いて、音源ベクトルメモリ１
０の内容から、最適な音源ベクトルＣjを作成し、出力
する。

【００２４】次に、本実施例の動作を説明する。音源ベ
クトルメモリ１０から切り出された音源ベクトルＣjの
要素Ｃj［i］は、比較部２０でしきい値Ｅと比較され、
しきい値を越えたスパース化音源ベクトルＣ´jを音声
合成部３０へ出力する。ここで、jは音源ベクトルイン
デックス（この場合は０〜６３）、iは音源ベクトルの
要素番号（同じく０〜７９）を示す。音声合成部３０で
は、図示を省略した図７に示される線形予測分析部５０
１で入力音声の線形予測分析によって求められた、重み
付合成フィルタのインパルス応答ｈを入力し、合成音声
Ｓjを演算する。合成フィルタ係数の計算は、公知公用
の方法を使用している。合成音声の演算は前述の（１）
式のように表わされるが、このフィルタの初期内容が、
０で置き換えられるため、次の（５）式のように表わす
ことも可能である。

【００２５】

【数４】ここで、hは重み付合成フィルタのインパルス応答を示
す。＊は畳込み演算を示すので、次元数８０の音源ベク
トルＣjを入力した時の出力sjは、次の（６）式ように
計算される。

【００２６】

【数５】但しこの式において、Ｃj［i］の値がしきい値Ｅ以上で
なければ、Ｃj［i］を含む項の計算は行わない。

【００２７】上式で演算した合成音声Ｓjは、重み付入
力音声から重み付合成フィルタのゼロ入力応答を減算し
たデータｐと一緒に、評価関数算出部４０に入力され
る。評価関数算出部４０では、前記（２），（３），
（４）式と同じ処理を行う。評価関数算出部４０で演算
された評価値Ｃi²／Ｇiは、最大値比較部５０に入力さ
れる。最大値比較部５０では、これまでの最大評価値Ｍ
と比較するが、最初に検索したベクトルの場合、Ｍに現
在の評価値を置き換える。

【００２８】その後、次の音源ベクトルの読み出しへと
戻るが、本発明では、図１に示すように、音源ベクトル
の内容が重なっている。特に本実施例では、ベクトル間
のずれを１要素としているので、合成音声の演算である
（６）式は、次の（７）式のように簡単化できる。ここ
で、Ｃj-1が１つ前の検索ベクトルで、Ｓj-1はＣj-1か
ら求めた合成音声である。

【００２９】

【数６】また、音源符号帳の最後から音源ベクトルを検索する
と、（７）式はさらに次の（８）式のように簡単化でき
る。ここでは、Ｃj+1が前の検索ベクトルになるので、
Ｓj+1が１つ前の合成音声となる。

【００３０】

【数７】よって、２番目以降の音源ベクトルの検索処理におい
て、音源ベクトルから合成音声を演算するには、重なっ
ていないベクトル要素についてのみ、計算すればよい。
（８）式においては、Ｃj[0]を含む項のみを計算する。
ここでも、このＣj[0]の値がしきい値以上でなければ、
この計算は行わない。

【００３１】その後、前記の処理と同様に各音源ベクト
ルに対する評価値Ｃi²／Ｇiを演算し、最小評価値を検
索する。そして、全ベクトルに対して、以上の処理が終
了した時の最大評価値Ｍの値に対応する音源ベクトルイ
ンデックスjoptを出力作成部６０に入力する。

【００３２】出力作成部６０では、音源ベクトルメモリ
１０内の音源符号帳の要素と音源ベクトルインデックス
joptから、入力音声に対する最適な音源ベクトルを作成
し、出力する。

【００３３】本実施例において、２番目以降の音源ベク
トルの検索処理では、合成音声の演算が１要素分の積和
演算で可能であり、またこの演算も、ベクトル要素がし
きい値以下ならば必要ない。これにより、本実施例の条
件下において、(１)式に示される評価関数演算を行う
と、積和演算は、従来５１，２００回必要であるのに対
し、スパース化音源ベクトルＣ´jの要素数を元の音源
ベクトル要素数の４０％となるようにしきい値Ｅを設定
したところ、７，１０４回にまで削減することができ、
約８６％の処理削減が可能となった。また、音源ベクト
ルメモリのワード数は、５，１２０個必要であったのに
対し、１４３個にまで削減された。

【００３４】図４を用いて、本発明かかる符号化器の第
２実施例を説明する。本実施例の符号化器は、音源符号
帳を格納した音源ベクトルメモリ１１と、ベクトル要素
と０とを比較する０比較部２１と、音声合成部３０と、
評価関数算出部４０と、評価値の最大値との比較部５０
と、最適なコードベクトルを作成する出力作成部６０と
を有して構成される。

【００３５】ここで、各構成要素について説明する。音
源ベクトルメモリ１１に格納される音源符号帳は、前記
実施例の音源ベクトルメモリ１０に格納された音源ベク
トルＣjの音源ベクトル要素Ｃj［i］を、予めしきい値
Ｅと比較し、スパース化した音源ベクトルＣ´jを格納
して構成されている。すなわち、本実施例の音源符号帳
は、音源ベクトル要素Ｃj［i］の絶対値がしきい値Ｅ以
下の要素は、その値を０に設定した音源ベクトルＣ´j
を格納しておく。０比較部２１は、読み出した音源ベク
トル要素Ｃ´j［i］の値が０かどうかを判定し、０以外
のベクトル要素のみを音声合成部３０に入力する。その
他の本実施例の構成要素において、前記第１実施例と同
じ符号を付けたものは同じ内容を有し、同じ働きを行う
ものであるため、ここでの説明は割愛する。本実施例に
よれば、音源符号帳から読み出したベクトル要素Ｃ´j
［i］について０か否かを判定すればよく、ベクトル要
素Ｃj［i］をしきい値Ｅと比較する方法に比べて構成を
簡単にすることができる。

【００３６】次に、本実施例の動作を説明する。スパー
ス化した音源ベクトルメモリ１１から切り出された音源
ベクトルＣ´jの要素Ｃ´j［i］は、０比較部２１で０
と比較され、０以外の場合、音声合成部３０へと入力さ
れる。これ以降の動作は、前記第１実施例と同じである
ため省略する。ただし、最後の出力作成部６０では、ス
パース化した音源ベクトルからなる音源符号帳１１を用
いて、最適コードベクトルを作成する。

【００３７】本実施例において、最適コードベクトル作
成に使用する音源符号帳に格納される音源ベクトルをス
パース化しているので、復号化音声の客観評価値が多少
劣化することは否めない。しかし、この劣化は、主観的
な音質に大きな差のある劣化ではない。また、本実施例
により、第１実施例のしきい値比較部２０において必要
であった、絶対値演算と比較毎の減算が削減された。こ
れにより、更なる処理削減が達成できた。

【００３８】図５を用いて、本発明の第３実施例を説明
する。本実施例は、音源ベクトルメモリ１０と、音源ベ
クトル要素Ｃj［i］としきい値Ｅとの比較部２０と、合
成音声を作成する音声合成部３０と、評価関数算出部４
０と、評価値の最大から最大に近い複数個を音源ベクト
ルインデックスと対応して保存する最大評価値（最大
値）メモリ７０と、評価値と最大値メモリの内容とを比
較する最大評価値（最大値）メモリ比較部５１と、合成
フィルタ部８０と、評価値を最大値と比較する比較部５
０と、最適なコードベクトルを作成する出力作成部６０
とを有して構成される。

【００３９】ここで、各構成要素について説明する。前
記第２実施例と同様に、他の実施例と同一の符号を付け
たものについては、説明を省略する。最大評価値メモリ
７０は、演算された評価関数Ｃi²／Ｇiの値のうち、評
価値の最大から最大に近い複数個を音源ベクトルインデ
ックスと対応して記憶する。最大評価値メモリ比較部５
１は、演算された評価関数の値と、最大評価値メモリ７
０に記憶された値とを順次比較する。合成フィルタ部８
０は、最大評価値メモリ７０に記憶された音源ベクトル
インデックスから、複数個の音源ベクトルを切り出し、
合成音声を作成する。この合成フィルタは、前記（１）
式で示す重み付合成フィルタの形をとっており、入力音
声の線形予測分析によって求められた、重み付合成フィ
ルタ係数αを入力している。(本図において、線形予測
分析部は省略している)

【００４０】次に、本実施例の動作を説明する。図５に
みるとおり、最初に評価関数を算出するまでは、第１実
施例と同じ動作であるため、説明を省略する。算出され
た評価関数は、最大評価値メモリ比較部５１において、
最大評価値メモリ７０の内容と比較される。そして、そ
の結果により、最大評価値メモリ７０の内容を書き換え
ていく。これを、全ての音源ベクトルに対して行うが、
その際の合成音声作成の演算は、第１実施例と同様に音
源ベクトル要素をスパース化して行う。このように、複
数個の音源ベクトルを選択する手段を予備選択といい、
選択された音源ベクトルを音源ベクトル候補という。選
択された音源ベクトル候補を合成フィルタ部８０に入力
する。合成フィルタ部８０では、予備選択の結果である
最大評価値メモリ７０に格納された複数の評価値と、音
源ベクトルメモリ１０に格納された符号化帳から、音源
ベクトル候補の合成音声を作成する。この音源ベクトル
候補の合成音声の作成ではしきい値判定は行わず、スパ
ース化されない音源ベクトル候補の合成音声を得る。こ
こで、音声合成に重み付合成フィルタを使用する。これ
は、音源ベクトル候補が、隣り合ったものであるとは限
らず、また、スパース化も行っていないためである。こ
のような時、音声合成部３０を使用すると、合成フィル
タ部８０よりも処理量が多くなることがわかっている。

【００４１】合成された音声は、再度、評価関数算出部
４０に入力され、最大値比較部５０で最大値Ｍと比較さ
れる。この処理を音源ベクトル候補の数の分だけ行い、
最大評価値に対応する音源ベクトルのインデックスjopt
を出力する。このように予備選択結果の候補から、さら
に最適なベクトルを検索することを本選択という。出力
作成部６０において、本選択結果のインデックスとスパ
ース化していない音源ベクトルＣjによって、入力音声
に最適な音源ベクトルを作成し、出力する。

【００４２】本実施例は、従来の技術に比べれば、処理
量・メモリ量、共に削減されているが、前記の第１実施
例、または第２実施例に比べ、処理量が増加する。しか
し、スパース化による音質の劣化を防ぐことが可能であ
る。また、本選択において、評価する音源ベクトルが、
実際に使用するベクトルの値であることから、第１実施
例よりも検索に信頼性があり、より最適な音源ベクトル
を選択することができる。

【００４３】本発明にかかる音声情報処理装置の第４の
実施例を図６を用いて説明する。本実施例にかかる符号
励振線形予測符号化器を備えた音声情報処理装置は、有
声条件測定部１００と、有声判定部２００と、パルス音
源検索部３００と、雑音源検索部４００と、音源ベクト
ル作成部５００とを有して構成される。

【００４４】ここで、各構成要素について説明する。有
声条件測定部１００は、入力音声の各種分析結果から、
有声条件を示す値を演算し、有声判定部２００へ入力す
る。有声判定部２００は、前記条件の測定結果から入力
音声が有声音であるか無声音であるか判定し、有声音の
場合にはパルス音源検索部３００を、無声音の場合には
雑音源検索部４００を、それぞれ選択する。パルス音源
検索部３００は、音源情報としてパルスの立つ位置を記
憶したメモリを持ち、このパルス位置に合せて前出の
（５）式と同様にインパルス応答との畳込み演算を行
い、音声を合成する。この結果から評価関数を演算し、
音源ベクトルに最適なパルス音源を検索する。雑音源検
索部４００は、上述のそれぞれの実施例に従って処理を
行う。その詳細は割愛する。

【００４５】次に、本実施例の動作を説明する。有声条
件測定部１００では、入力音声から有声／無声を示す値
を演算する。この演算は、既存の方式に添ったものであ
る。有声判定時には、パルス音源を選択し、パルス音源
検索部３００の処理を行う。ここでの処理内容は、特開
平６−１３０９９４号公報に詳しいので省略する。一
方、無声判定時には、雑音源を選択し、前記の３つの実
施例に示した検索処理を行う。その後、パルス音源／雑
音源のどちらかから選択された最適な音源ベクトルをそ
の他の処理へと出力する。

【００４６】本実施例において、有声条件の測定部およ
び判定部や、２つの検索処理部があるため、その他の実
施例からみて、プログラムやメモリ量が増え、処理も多
少増加する。しかし、従来の方式と比べると、処理量・
メモリ量共に削減されている。これは、２つの検索部の
処理量がほぼ同じであるが、必ずどちらか一方の処理だ
けを行っており、実質的な処理量は変わっていないため
である。また、有声条件の測定部および判定部の処理
は、その他の処理の出力を用いており、新たな演算は３
回の積算と比較のみであるため、処理の増加は微小であ
る。メモリ量は、従来技術の５１２０個から、音源ベク
トルメモリを２つ合せても２７１個と、約９５％の削減
ができた。さらに、有声音声の復号化音声はピッチ成分
がより明確になり、無声音声はパルス的な雑音がなくな
るため、雑音源のみやパルス音源のみの場合よりも、主
観的および客観的な音質が向上した。

【００４７】

【発明の効果】本発明により、メモリ量を大幅に削減す
ることができた。さらに、ＤＳＰにおける符号化／復号
化処理の量も、実施方法によって多少の差はあるが、従
来技術から見て大幅に削減することができた。よって、
従来、ＣＥＬＰ方式を実用化する上で問題であったＤＳ
Ｐの数やメモリ量を、縮小できる可能性が高くなった。
また、従来技術から削減された処理量を、他の処理に使
用することができ、いっそうの音質改善が期待される。
尚、本発明による主観的な音質の劣化が無いことが、非
公式な聴取実験の結果で確認された。

【図面の簡単な説明】

【図１】音源ベクトルメモリの従来方法とオーバラップ
方法による格納態様を説明する概念図。

【図２】本発明におけるスパース化の概念を説明する概
念図。

【図３】本発明の符号化器の第１の実施例の構成を示す
ブロック図。

【図４】本発明の符号化器の第２の実施例の構成を示す
ブロック図。

【図５】本発明の符号化器の第３の実施例の構成を示す
ブロック図。

【図６】本発明にかかる符号化器の第４の実施例の構成
を示すブロック図。

【図７】ＣＥＬＰ符号化器の構成の概念を説明するブロ
ック図。

【図８】ＣＥＬＰ復号化器の構成の概念を説明するブロ
ック図。

【符号の説明】

１０スパース化しない音源ベクトルメモリ１１スパース化した音源ベクトルメモリ２０しきい値との比較部２１０比較部３０音声合成部４０評価関数算出部５０最大評価値との比較部５１最大評価値メモリとの比較部６０出力作成部７０最大評価値メモリ８０合成フィルタ部１００有声条件測定部２００有声／無声判定部３００パルス音源検索部４００雑音源検索部５０１線形予測分析部５０２聴覚重み付フィルタ部５０３重み付合成フィルタ部５０４適応コードブック検索部５０５統計コードブック検索部５０６２乗和演算部５０７２乗誤差最小化５０８伝送ビット多重化装置５１１伝送ビット多重分離装置５１２適応音源ベクトル復号化部５１３統計音源ベクトル復号化部５１４復号化合成フィルタ部５１５ポストフィルタ部１ａ線形予測係数α １ｂ適応コードブックに対する利得β １ｃ統計コードブックに対する利得γ １ｄ最適適応音源ベクトルインデックスＬ１ｅ最適統計音源ベクトルインデックスＩ１ｆ多重化後の伝送ビット２ａ復号化線形予測係数２ｂ適応コードブックに対する復号化利得２ｃ統計コードブックに対する復号化利得２ｄ復号化適応音源ベクトルインデックス２ｅ復号化統計音源ベクトルインデックス２ｆ復号化入力伝送ビットＣj 音源ベクトルＣj［i］音源ベクトル要素Ｃ´j スパース化後の音源ベクトルｈ重み付合成フィルタのインパルス応答ｐ重み付合成フィルタのゼロ入力応答を減算した重み
付入力音声Ｓj スパース化後の音源ベクトルからの合成音声Ｓ´j スパース化しない音源ベクトルからの合成音声 jopt 最適音源ベクトルインデックス α 重み付合成フィルタ係数

───────────────────────────────────────────────────── フロントページの続き (72)発明者浅川吉章神奈川県横浜市戸塚区戸塚町216番地株式会社日立製作所情報通信事業部内

Claims

【特許請求の範囲】

【請求項１】一定時間間隔（フレーム）毎の入力音声
信号を分析し、予め複数個の音源ベクトルが格納された
音源符号帳から、前記入力音声信号に最適な音源ベクト
ルを検索する手段を具備する符号励振線形予測（ＣＥＬ
Ｐ）符号化器からなる音声情報処理装置において、前記音源符号帳は、音源ベクトルの次元数と音源ベクト
ル数との積よりも要素数の少ない要素からなる一連の音
源ベクトル列からなり、該音源符号帳の読出先頭アドレスから順次ベクトル次元
数分の音源ベクトル要素を読み出す手段と、音源ベクトル検索時に、音源ベクトル要素のしきい値判
定を行う手段と、該しきい値判定結果に基づき、入力音声信号との評価関
数を演算する評価関数演算手段とを具備することを特徴
とする符号励振線形予測符号化器からなる音声情報処理
装置。
【請求項２】音源ベクトル検索時に、複数の最適音源
ベクトル候補を選択し、該最適音源ベクトル候補にの
み、前記音源ベクトル要素のしきい値判定を行わずに評
価関数演算を行う評価関数演算手段を備えたことを特徴
とする請求項１記載の符号励振線形予測符号化器からな
る音声情報処理装置。
【請求項３】一定時間間隔（フレーム）毎の入力音声
信号を分析し、入力音声が有声であるか無声であるかを
判定する有声／無声判定手段手段を具備し、無声判定時
に、請求項１または請求項２記載の符号励振線形予測符
号化器を用いるようにしたことを特徴とする符号励振線
形予測符号化器からなる音声情報処理装置。
【請求項４】受信した最適コードベクトルに基づい
て、音源符号帳から音源ベクトル要素を読み出し、音声
を合成して合成音声を出力するようにした符号励振線形
予測復号化器からなる音声情報処理装置において、音源
符号帳は、音源ベクトルの次元数と音源ベクトル数との
積よりも要素数の少ない要素からなる一連の音源ベクト
ル列からなり、該音源符号帳の読出先頭アドレスから順次ベクトル次元
数分の音源ベクトル要素を読み出す手段を具備すること
を特徴とする符号励振線形予測復号化器からなる音声情
報処理装置。
【請求項５】それぞれ複数の音源ベクトル要素から構
成された複数個の音源ベクトルからなる音源符号帳が予
め格納された音源ベクトルメモリと、該音源ベクトルメ
モリから読み出した音源ベクトルの各要素の値としきい
値とを比較してしきい値以上の要素を送出するしきい値
比較部と、音源ベクトル要素に基づいて音声を合成する
音声合成部と、重み付け入力音声から重み付け合成フィ
ルタのゼロ入力応答を減算したデータと前記音声合成部
の出力である合成音声とから評価関数を算出する評価関
数算出部と、評価関数の最大値を検出する最大値比較部
とを有する入力音声の符号励振線形予測符号化器からな
る音声情報処理装置において、前記音源符号帳を、各音源ベクトルの要素数すなわち音
源ベクトルの次元数と音源ベクトル数との積よりも少な
い要素数からなる一連の音源ベクトル要素の列から構成
するとともに、少なくとも１要素以上ずつずらして各音
源ベクトルの読出先頭アドレスすなわちコードベクトル
インデックスを付与して構成し、該音源符号帳の一連の音源ベクトル要素列の、読出先頭
アドレスから音源ベクトル次元数分の音源ベクトル要素
を切り出して音源ベクトルとし、音声合成部は、しきい値比較部からの音源ベクトル要素
と入力音声の線形予測分析によって得た重み付合成フィ
ルタのインパルス応答都から合成音声を演算して評価関
数算出部へ送出し、全ての音源ベクトルの内の最大評価関数を有する音源ベ
クトルのコードベクトルインデックスと音源符号帳の音
源ベクトル要素とから入力音声に対する最適コードベク
トルを作成して送出することを特徴とする符号励振線形
予測符号化器からなる音声情報処理装置。