JP2001142500A

JP2001142500A - 音声符号化装置

Info

Publication number: JP2001142500A
Application number: JP2000252349A
Authority: JP
Inventors: Toshiyuki Morii; 利幸森井; Kazutoshi Yasunaga; 和敏安永
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1999-08-23
Filing date: 2000-08-23
Publication date: 2001-05-25
Anticipated expiration: 2020-08-23
Also published as: JP4034929B2

Abstract

(57)【要約】【課題】予測量子化を用いて局所的異音を生じる
ことなく音声符号化を行うこと。【解決手段】量子化対象ベクトルの代表的サンプルが
複数格納されたベクトル符号帳１０９４を作成してお
く。各ベクトルは、ＡＣゲイン、ＳＣゲインの対数値に
対応する値、ＳＣの予測係数の調整係数である。予測係
数格納部１０９５には、予測符号化を行うための係数を
格納する。この係数はＭＡの予測係数でＡＣとＳＣの２
種類を予測次数分格納する。パラメータ計算部１０９１
において、入力された、聴感重み付け入力音声、聴感重
み付けＬＰＣ合成済み適応音源、聴感重み付けＬＰＣ合
成済み確率的音源、復号化ベクトル格納部１０９６に格
納された復号化ベクトル（ＡＣ、ＳＣ、調整係数）、予
測係数格納部１０９５に格納された予測係数（ＡＣ、Ｓ
Ｃ）から距離計算に必要なパラメータを計算する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、ディジタル通信シ
ステムにおいて使用される音声符号化装置に関する。

【０００２】

【従来の技術】携帯電話などのディジタル移動通信の分
野では、加入者の増加に対処するために低ビットレート
の音声の圧縮符号化法が求められており、各研究機関に
おいて研究開発が進んでいる。

【０００３】日本国内においては、モトローラ社が開発
したビットレート１１．２ｋｂｐｓのＶＳＥＬＰという
符号化法がディジタル携帯電話用の標準符号化方式とし
て採用され、同方式を搭載したディジタル携帯電話は１
９９４年秋から国内において発売されている。

【０００４】また、ＮＴＴ移動通信網株式会社の開発し
たビットレート５．６ｋｂｐｓのＰＳＩ−ＣＥＬＰとい
う符号化方式が現在製品化されている。これらの方式は
いずれもＣＥＬＰ(Code Exited Linear Prediction: M.
R.Schroeder”High QualitySpeech at Low Bit Rates”
Proc.ICASSP'85 pp.937-940に記載されている)という
方式を改良したものである。

【０００５】このＣＥＬＰ方式は、音声を音源情報と声
道情報とに分離し、音源情報については符号帳に格納さ
れた複数の音源サンプルのインデクスによって符号化
し、声道情報についてはＬＰＣ（線形予測係数）を符号
化するということ及び音源情報符号化の際に声道情報を
加味して入力音声とを比較することを行う方法(Ａ−ｂ
−Ｓ:Analysis by Synthesis)を採用していることに特
徴がある。

【０００６】このＣＥＬＰ方式においては、まず、入力
された音声データ（入力音声）に対して自己相関分析と
ＬＰＣ分析を行ってＬＰＣ係数を得て、得られたＬＰＣ
係数の符号化を行ってＬＰＣ符号を得る。さらに、得ら
れたＬＰＣ符号を復号化して復号化ＬＰＣ係数を得る。
一方、入力音声は、ＬＰＣ係数を用いた聴感重み付けフ
ィルタを用いて聴感重み付けされる。

【０００７】適応符号帳と確率的符号帳に格納された音
源サンプル（それぞれ適応コードベクトル（又は適応音
源）、確率的コードベクトル（又は、確率的音源）と呼
ぶ）のそれぞれのコードベクトルに対して、得られた復
号化ＬＰＣ係数によってフィルタリングを行い、２つの
合成音を得る。

【０００８】そして、得られた２つの合成音と、聴感重
み付けされた入力音声との関係を分析し、２つの合成音
の最適値（最適ゲイン）を求め、求められた最適ゲイン
によって合成音をパワー調整し、それぞれの合成音を加
算して総合合成音を得る。その後、得られた総合合成音
と入力音声との間の符号化歪みを求める。このようにし
て、全ての音源サンプルに対して総合合成音と入力音声
との間の符号化歪みを求め、符号化歪みが最も小さいと
きの音源サンプルのインデクスを求める。

【０００９】このようにして得られたゲイン及び音源サ
ンプルのインデクスを符号化し、これらの符号化された
ゲイン及び音源サンプルをＬＰＣ符号と共に伝送路に送
る。また、ゲイン符号と音源サンプルのインデクスに対
応する２つの音源から実際の音源信号を作成し、それを
適応符号帳に格納すると同時に古い音源サンプルを破棄
する。

【００１０】なお、一般的には、適応符号帳と確率的符
号帳に対する音源探索は、分析区間をさらに細かく分け
た区間（サブフレームと呼ばれる）で行われる。

【００１１】ゲインの符号化（ゲイン量子化）は、音源
サンプルのインデクスに対応する２つの合成音を用いて
ゲインの量子化歪を評価するベクトル量子化（ＶＱ）に
よって行われる。

【００１２】このアルゴリズムにおいては、予めパラメ
ータベクトルの代表的サンプル（コードベクトル）が複
数格納されたベクトル符号帳を作成しておく。次いで、
聴感重み付けした入力音声と、適応音源及び確率的音源
を聴感重み付けＬＰＣ合成したものとに対して、ベクト
ル符号帳に格納されたゲインコードベクトルを用いて符
号化歪を下記式１により計算する。

【００１３】

【数１】式１ここで、Ｅ_n：ｎ番のゲインコードベクトルを用いたときの符号
化歪みＸ_i：聴感重み付け音声Ａ_i：聴感重み付けＬＰＣ合成済み適応音源Ｓ_i：聴感重み付けＬＰＣ合成済み確率的音源ｇ_n：コードベクトルの要素（適応音源側のゲイン）ｈ_n：コードベクトルの要素（確率的音源側のゲイン）ｎ：コードベクトルの番号ｉ：音源データのインデクスＩ：サブフレーム長（入力音声の符号化単位）

【００１４】次いで、ベクトル符号帳を制御することに
よって各コードベクトルを用いたときの歪Ｅ_nを比較
し、最も歪の小さいコードベクトルの番号をベクトルの
符号とする。また、ベクトル符号帳に格納された全ての
コードベクトルの中で最も歪みが小さくなるコードベク
トルの番号を求め、これをベクトルの符号とする。

【００１５】上記式１は一見して各ｎ毎に多くの計算を
必要とするように見えるが、予めｉについての積和を計
算しておけばよいので、少ない計算量でｎの探索を行う
ことができる。

【００１６】一方、音声復号化装置（デコーダ）では、
伝送されてきたベクトルの符号に基づいてコードベクト
ルを求めることによって符号化されたデータを復号化し
てコードベクトルを得る。

【００１７】また、上記アルゴリズムを基本として、従
来よりさらなる改良がなされてきた。例えば、人間の音
圧の聴覚特性が対数であることを利用し、パワを対数化
して量子化し、そのパワで正規化した２つのゲインをＶ
Ｑする。この方法は、日本国ＰＤＣハーフレートコーデ
ックの標準方式で用いられている方法である。また、ゲ
インパラメータのフレーム間相関を利用して符号化する
方法（予測符号化）がある。この方法は、ＩＴＵ−Ｔ国
際標準Ｇ．７２９で用いられている方法である。しかし
ながら、これらの改良によっても十分な性能を得ること
ができていない。

【００１８】

【発明が解決しようとする課題】これまで人間の聴覚特
性やフレーム間相関を利用したゲイン情報符号化法が開
発され、ある程度効率の良いゲイン情報の符号化が可能
になった。特に、予測量子化によって性能は大きく向上
したが、その従来法では、状態としての値として以前の
サブフレームの値をそのまま用いて予測量子化を行って
いた。しかしながら、状態として格納される値の中に
は、極端に大きな（小さな）値をとるものがあり、その
値を次のサブフレームに用いると、次のサブフレームの
量子化がうまくいかず、局所的異音になる場合がある。

【００１９】本発明はかかる点に鑑みてなされたもので
あり、予測量子化を用いて局所的異音を生じることなく
音声符号化を行うことができるＣＥＬＰ型音声符号化装
置を提供することを目的とする。

【００２０】

【課題を解決するための手段】本発明の骨子は、予測量
子化において前のサブフレームでの状態値が極端に大き
な値や極端に小さな値である場合に、自動的に予測係数
を調整することにより、局所的異音の発生を防止するこ
とである。

【００２１】

【発明の実施の形態】本発明の音声符号化装置は、適応
符号帳及び確率的符号帳に格納された適応音源及び確率
的音源に対して、入力音声から求めたＬＰＣ係数を用い
てフィルタリングすることにより、合成音を得るＬＰＣ
合成手段と、前記適応音源及び前記確率的音源のゲイン
を求め、さらに前記ゲインを用いて得られる前記入力音
声と前記合成音との間の符号化歪みを用いて適応音源及
び確率的音源の符号を探索するゲイン演算手段と、求め
られた符号に対応する適応音源及び確率的音源を用いて
ゲインの予測符号化を行うパラメータ符号化手段と、を
具備し、前記パラメータ符号化手段は、以前のサブフレ
ームの状態に応じて前記予測符号化に用いる予測係数を
調整する予測係数調整手段を備える構成を採る。

【００２２】この構成によれば、各コードベクトルに応
じて予測係数を制御することが可能になり、音声の局所
的特徴により適応したより効率的な予測や、非定常部に
おける予測の弊害を防ぐことができる。

【００２３】本発明の音声符号化装置は、適応符号帳及
び確率的符号帳に格納された適応音源及び確率的音源に
対して、入力音声から求めたＬＰＣ係数を用いてフィル
タリングすることにより、合成音を得るＬＰＣ合成手段
と、前記適応音源及び前記確率的音源のゲインを求める
ゲイン演算手段と、前記入力音声と前記合成音との間の
符号化歪みを用いて求められた適応音源及び確率的音
源、並びに前記ゲインのベクトル量子化を行うパラメー
タ符号化手段と、を具備し、１つのフレームを複数のサ
ブフレームに分解して符号化を行うＣＥＬＰ型音声符号
化装置であって、最初のサブフレームの適応符号帳探索
の前に、フレームを構成する複数のサブフレームのピッ
チ分析を行って相関値を求め、前記相関値を用いて最も
ピッチ周期に近似する値を算出するピッチ分析手段を備
える構成を採る。

【００２４】この構成によれば、第２サブフレームの探
索の時に第２サブフレームの仮ピッチ付近を探索できる
ので、フレームの後半から音声が始まる場合などの非定
常なフレームでも、第１，第２サブフレームにおいて適
当なラグ探索が可能になる。

【００２５】以下、本発明の実施の形態について、添付
図面を参照して詳細に説明する。（実施の形態１）図１は、本発明の実施の形態１，２に
係る音声符号化装置を備えた無線通信装置の構成を示す
ブロック図である。

【００２６】この無線通信装置において、送信側で音声
がマイクなどの音声入力装置１１によって電気的アナロ
グ信号に変換され、Ａ／Ｄ変換器１２に出力される。ア
ナログ音声信号は、Ａ／Ｄ変換器１２によってディジタ
ル音声信号に変換され、音声符号化部１３に出力され
る。音声符号化部１３は、ディジタル音声信号に対して
音声符号化処理を行い、符号化した情報を変復調部１４
に出力する。変復調部１４は、符号化された音声信号を
ディジタル変調して、無線送信部１５に送る。無線送信
部１５では、変調後の信号に所定の無線送信処理を施
す。この信号は、アンテナ１６を介して送信される。な
お、プロセッサ２１は、適宜ＲＡＭ２２及びＲＯＭ２３
に格納されたデータを用いて処理を行う。

【００２７】一方、無線通信装置の受信側では、アンテ
ナ１６で受信した受信信号は、無線受信部１７で所定の
無線受信処理が施され、変復調部１４に送られる。変復
調部１４では、受信信号に対して復調処理を行い、復調
後の信号を音声復号化部１８に出力する。音声復号化部
１８は、復調後の信号に復号処理を行ってディジタル復
号音声信号を得て、そのディジタル復号音声信号をＤ／
Ａ変換器１９へ出力する。Ｄ／Ａ変換器１９は、音声復
号化部１８から出力されたディジタル復号音声信号をア
ナログ復号音声信号に変換してスピーカなどの音声出力
装置２０に出力する。最後に音声出力装置２０が電気的
アナログ復号音声信号を復号音声に変換して出力する。

【００２８】ここで、音声符号化部１３及び音声復号化
部１８は、ＲＡＭ２２及びＲＯＭ２３に格納された符号
帳を用いてＤＳＰなどのプロセッサ２１により動作す
る。また、これらの動作プログラムは、ＲＯＭ２３に格
納されている。

【００２９】図２は、本発明の実施の形態１に係るＣＥ
ＬＰ型音声符号化装置の構成を示すブロック図である。
この音声符号化装置は、図１に示す音声符号化部１３に
含まれている。なお、図２に示す適応符号帳１０３は図
１に示すＲＡＭ２２に格納されており、図２に示す確率
的符号帳１０４は図１に示すＲＯＭ２３に格納されてい
る。

【００３０】図２に示す音声符号化装置においては、Ｌ
ＰＣ分析部１０２において、入力された音声データ（入
力音声）１０１に対して自己相関分析及びＬＰＣ分析を
行ってＬＰＣ係数を得る。また、ＬＰＣ分析部１０２で
は、得られたＬＰＣ係数の符号化を行ってＬＰＣ符号を
得る。さらに、ＬＰＣ分析部１０２では、得られたＬＰ
Ｃ符号を復号化して復号化ＬＰＣ係数を得る。入力され
た音声データ１０１は、聴感重み付け部１０７に送ら
れ、そこで上記ＬＰＣ係数を用いた聴感重み付けフィル
タを用いて聴感重み付けされる。

【００３１】次に、音源作成部１０５において、適応符
号帳１０３に格納された音源サンプル（適応コードベク
トル又は適応音源）と確率的符号帳１０４に格納された
音源サンプル（確率的コードベクトル又は、確率的音
源）を取り出し、それぞれのコードベクトルを聴感重み
ＬＰＣ合成部１０６へ送る。さらに、聴感重みＬＰＣ合
成部１０６において、音源作成部１０５で得られた２つ
の音源に対して、ＬＰＣ分析部１０２で得られた復号化
ＬＰＣ係数によってフィルタリングを行い、２つの合成
音を得る。

【００３２】なお、聴感重みＬＰＣ合成部１０６におい
ては、ＬＰＣ係数や高域強調フィルタや長期予測係数
（入力音声の長期予測分析を行うことによって得られ
る）を用いた聴感重み付けフィルターを併用してそれぞ
れの合成音に対して聴感重み付けＬＰＣ合成を行う。

【００３３】聴感重みＬＰＣ合成部１０６は、２つの合
成音をゲイン演算部１０８に出力する。ゲイン演算部１
０８は、図３に示す構成を有する。ゲイン演算部１０８
においては、聴感重みＬＰＣ合成部１０６で得られた２
つの合成音及びを聴感重み付けされた入力音声を分析部
１０８１に送り、そこで２つの合成音と入力音声との関
係を分析し、２つの合成音の最適値（最適ゲイン）を求
める。この最適ゲインは、パワ調整部１０８２に出力さ
れる。

【００３４】パワ調整部１０８２では、求められた最適
ゲインによって２つの合成音をパワ調整する。パワ調整
された合成音は、合成部１０８３に出力されて、そこで
加算されて総合合成音となる。この総合合成音は、符号
化歪算出部１０８４に出力される。符号化歪算出部１０
８４では、得られた総合合成音と入力音声との間の符号
化歪みを求める。

【００３５】符号化歪算出部１０８４は、音源作成部１
０５を制御して、適応符号帳１０３及び確率的符号帳１
０４の全ての音源サンプルを出力させ、全ての音源サン
プルに対して総合合成音と入力音声との間の符号化歪み
を求め、符号化歪みが最も小さいときの音源サンプルの
インデクスを求める。

【００３６】次に、分析部１０８１は、音源サンプルの
インデクス、そのインデクスに対応する２つの聴感重み
付けＬＰＣ合成された音源、及び入力音声をパラメータ
符号化部１０９に送る。

【００３７】パラメータ符号化部１０９では、ゲインの
符号化を行うことによってゲイン符号を得、ＬＰＣ符
号、音源サンプルのインデクスをまとめて伝送路へ送
る。また、ゲイン符号とインデクスに対応する２つの音
源から実際の音源信号を作成し、それを適応符号帳１０
３に格納すると同時に古い音源サンプルを破棄する。な
お、一般的には、適応符号帳と確率的符号帳に対する音
源探索は、分析区間をさらに細かく分けた区間（サブフ
レームと呼ばれる）で行われる。

【００３８】ここで、上記構成を有する音声符号化装置
のパラメータ符号化部１０９のゲイン符号化の動作につ
いて説明する。図４は、本発明の音声符号化装置のパラ
メータ符号化部の構成を示すブロック図である。

【００３９】図４において、聴感重み付け入力音声（Ｘ
_i）、聴感重み付けＬＰＣ合成済み適応音源（Ａ_i）、及
び聴感重み付けＬＰＣ合成済み確率的音源（Ｓ_i）がパ
ラメータ計算部１０９１に送られる。パラメータ計算部
１０９１では、符号化歪計算に必要なパラメータを計算
する。パラメータ計算部１０９１で計算されたパラメー
タは、符号化歪計算部１０９２に出力され、そこで符号
化歪が計算される。この符号化歪は、比較部１０９３に
出力される。比較部１０９３では、符号化歪計算部１０
９２及びベクトル符号帳１０９４を制御して、得られた
符号化歪から最も適当とされる符号（復号化ベクトル）
を求め、この符号を基にベクトル符号帳１０９４から得
られるコードベクトルを復号化ベクトル格納部１０９６
に出力し、復号化ベクトル格納部１０９６を更新する。

【００４０】予測係数格納部１０９５は、予測符号化に
用いる予測係数を格納する。この予測係数はパラメータ
計算及び符号化歪計算に用いられるために、パラメータ
計算部１０９１及び符号化歪計算部１０９２に出力され
る。復号化ベクトル格納部１０９６は、予測符号化のた
めに状態を格納する。この状態は、パラメータ計算に用
いられるため、パラメータ計算部１０９１に出力され
る。ベクトル符号帳１０９４は、コードベクトルを格納
する。

【００４１】次に、本発明に係るゲイン符号化方法のア
ルゴリズムについて説明する。予め、量子化対象ベクト
ルの代表的サンプル（コードベクトル）が複数格納され
たベクトル符号帳１０９４を作成しておく。各ベクトル
は、ＡＣゲイン、ＳＣゲインの対数値に対応する値、及
びＳＣの予測係数の調整係数の３つの要素からなる。

【００４２】この調整係数は、以前のサブフレームの状
態に応じて予測係数を調整する係数である。具体的に
は、この調整係数は、以前のサブフレームの状態が極端
に大きな値又は極端に小さな値である場合に、その影響
を小さくするように設定される。この調整係数は、多数
のベクトルサンプルを用いた本発明者らが開発した学習
アルゴリズムにより求めることが可能である。ここで
は、この学習アルゴリズムについての説明は省略する。

【００４３】例えば、有声音に多くの頻度で用いるコー
ドベクトルは調整係数を大きく設定する。すなわち、同
じ波形が並んでいる場合には、以前のサブフレームの状
態の信頼性が高いので調整係数を大きくして、以前のサ
ブフレームの予測係数をそのまま利用できるようにす
る。これにより、より効率的な予測を行うことができ
る。

【００４４】一方、語頭などに使用するあまり使用頻度
の少ないコードベクトルは調整係数を小さくする。すな
わち、前の波形と全然違う場合には、以前のサブフレー
ムの状態の信頼性が低い（適応符号帳が機能しないと考
えられる）ので、調整係数を小さくして、以前のサブフ
レームの予測係数の影響を小さくする。これにより、次
の予測の弊害を防いで良好な予測符号化を実現すること
ができる。

【００４５】このように、各コードベクトル（状態）に
応じて予測係数を制御することにより、これまでの予測
符号化の性能をさらに向上させることができる。

【００４６】また、予測係数格納部１０９５には、予測
符号化を行うための予測係数を格納しておく。この予測
係数はＭＡ(moving average)の予測係数でＡＣとＳＣの
２種類を予測次数分格納する。これらの予測係数値は、
一般に、予め多くのデータを用いた学習により求めてお
く。また、復号化ベクトル格納部１０９６には、初期値
として無音状態を示す値を格納しておく。

【００４７】次に、符号化方法について詳細に説明す
る。まず、パラメータ計算部１０９１に聴感重み付け入
力音声（Ｘ_i）、聴感重み付けＬＰＣ合成済み適応音源
（Ａ_i）、聴感重み付けＬＰＣ合成済み確率的音源
（Ｓ_i）を送り、さらに復号化ベクトル格納部１０９６
に格納された復号化ベクトル（ＡＣ、ＳＣ、調整係
数）、予測係数格納部１０９５に格納された予測係数
（ＡＣ、ＳＣ）を送る。これらを用いて符号化歪計算に
必要なパラメータを計算する。

【００４８】符号化歪計算部１０９２における符号化歪
計算は、下記式２にしたがって行う。

【００４９】

【数２】式２ここで、Ｇ_an，Ｇ_sn：復号化ゲインＥ_n：ｎ番のゲインコードベクトルを用いたときの符号
化歪みＸ_i：聴感重み付け音声Ａ_i：聴感重み付けＬＰＣ合成済み適応音源Ｓ_i：聴感重み付けＬＰＣ合成済み確率的音源ｎ：コードベクトルの番号ｉ：音源ベクトルのインデクスＩ：サブフレーム長（入力音声の符号化単位）

【００５０】この場合、演算量を少なくするために、パ
ラメータ計算部１０９１では、コードベクトルの番号に
依存しない部分の計算を行う。計算しておくものは、上
記予測ベクトルと３つの合成音（Ｘ_i，Ａ_i，Ｓ_i）間の
相関、パワである。この計算は、下記式３にしたがって
行う。

【００５１】

【数３】式３Ｄ_xx，Ｄ_xa，Ｄ_xs，Ｄ_aa，Ｄ_as，Ｄ_ss：合成音間の相関
値、パワＸ_i：聴感重み付け音声Ａ_i：聴感重み付けＬＰＣ合成済み適応音源Ｓ_i：聴感重み付けＬＰＣ合成済み確率的音源ｎ：コードベクトルの番号ｉ：音源ベクトルのインデクスＩ：サブフレーム長（入力音声の符号化単位）

【００５２】また、パラメータ計算部１０９１では、復
号化ベクトル格納部１０９６に格納された過去のコード
ベクトルと、予測係数格納部１０９５に格納された予測
係数を用いて下記式４に示す３つの予測値を計算してお
く。

【００５３】

【数４】式４ここで、Ｐ_ra：予測値（ＡＣゲイン）Ｐ_rs：予測値（ＳＣゲイン）Ｐ_sc：予測値（予測係数） α_m：予測係数（ＡＣゲイン、固定値） β_m：予測係数（ＳＣゲイン、固定値）Ｓ_am：状態（過去のコードベクトルの要素、ＡＣゲイ
ン）Ｓ_sm：状態（過去のコードベクトルの要素、ＳＣゲイ
ン）Ｓ_cm：状態（過去のコードベクトルの要素、ＳＣ予測係
数調整係数）ｍ：予測インデクスＭ：予測次数

【００５４】上記式４から分かるように、Ｐ_rs、Ｐ_scに
ついては、従来と異なり調整係数が乗算されている。し
たがって、ＳＣゲインの予測値及び予測係数について
は、調整係数により、以前のサブフレームにおける状態
の値が極端に大きいか小さい場合に、それを緩和する
（影響を小さくする）ことができる。すなわち、状態に
応じて適応的にＳＣゲインの予測値及び予測係数を変化
させることが可能となる。

【００５５】次に、符号化歪計算部１０９２において、
パラメータ計算部１０９１で計算した各パラメータ、予
測係数格納部１０９５に格納された予測係数、及びベク
トル符号帳１０９４に格納されたコードベクトルを用い
て、下記式５にしたがって符号化歪を算出する。

【００５６】

【数５】式５ここで、Ｅ_n：ｎ番のゲインコードベクトルを用いたときの符号
化歪みＤ_xx，Ｄ_xa，Ｄ_xs，Ｄ_aa，Ｄ_as，Ｄ_ss：合成音間の相関
値、パワＧ_an，Ｇ_sn：復号化ゲインＰ_ra：予測値（ＡＣゲイン）Ｐ_rs：予測値（ＳＣゲイン）Ｐ_ac：予測係数の和（固定値）Ｐ_sc：予測係数の和（上記式４で算出）Ｃ_an，Ｃ_sn，Ｃ_cn：コードベクトル、Ｃ_cnは予測係数調
整係数であるがここでは使用しないｎ：コードベクトルの番号なお、実際にはＤ_xxはコードベクトルの番号ｎに依存し
ないので、その加算を省略することができる。

【００５７】次いで、比較部１０９３は、ベクトル符号
帳１０９４と符号化歪計算部１０９２を制御し、ベクト
ル符号帳１０９４に格納された複数のコードベクトルの
中で符号化歪計算部１０９２にて算出された符号化歪み
の最も小さくなるコードベクトルの番号を求め、これを
ゲインの符号とする。また、得られたゲインの符号を用
いて復号化ベクトル格納部１０９６の内容を更新する。
更新は、下記式６にしたがって行う。

【００５８】

【数６】式６ここで、Ｓ_am，Ｓ_sm，Ｓ_cm：状態ベクトル（ＡＣ、ＳＣ、予測係
数調整係数）ｍ：予測インデクスＭ：予測次数Ｊ：比較部で求められた符号

【００５９】式４から式６までで分かるように、本実施
の形態では、復号化ベクトル格納部１０９６で状態ベク
トルＳ_cmを格納しておいて、この予測係数調整係数を用
いて予測係数を適応的に制御している。

【００６０】図５は、本発明の実施の形態の音声復号化
装置の構成を示すブロック図である。この音声復号化装
置は、図１に示す音声復号化部１８に含まれている。な
お、図５に示す適応符号帳２０２は図１に示すＲＡＭ２
２に格納されており、図５に示す確率的符号帳２０３は
図１に示すＲＯＭ２３に格納されている。

【００６１】図５に示す音声復号化装置において、パラ
メータ復号化部２０１は、伝送路から、符号化された音
声信号を得ると共に、各音源符号帳（適応符号帳２０
２、確率的符号帳２０３）の音源サンプルの符号、ＬＰ
Ｃ符号、及びゲイン符号を得る。そして、ＬＰＣ符号か
ら復号化されたＬＰＣ係数を得て、ゲイン符号から復号
化されたゲインを得る。

【００６２】そして、音源作成部２０４は、それぞれの
音源サンプルに復号化されたゲインを乗じて加算するこ
とによって復号化された音源信号を得る。この際、得ら
れた復号化された音源信号を、音源サンプルとして適応
符号帳２０４へ格納し、同時に古い音源サンプルを破棄
する。そして、ＬＰＣ合成部２０５では、復号化された
音源信号に復号化されたＬＰＣ係数によるフィルタリン
グを行うことによって、合成音を得る。

【００６３】また、２つの音源符号帳は、図２に示す音
声符号化装置に含まれるもの（図２の参照符号１０３，
１０４）と同様のものであり、音源サンプルを取り出す
ためのサンプル番号（適応符号帳への符号と確率的符号
帳への符号）は、いずれもパラメータ復号化部２０１か
ら供給される。

【００６４】このように、本実施の形態の音声符号化装
置では、各コードベクトルに応じて予測係数を制御する
ことが可能になり、音声の局所的特徴により適応したよ
り効率的な予測や、非定常部における予測の弊害を防ぐ
ことが可能になり、従来得られなかった格別の効果を得
ることができる。

【００６５】（実施の形態２）音声符号化装置におい
て、上述したように、ゲイン演算部では、音源作成部か
ら得られた適応符号帳、確率的符号帳の全ての音源につ
いて合成音と入力音声との間の比較を行う。このとき、
演算量の都合上、通常は２つの音源（適応符号帳と確率
的符号帳）はオープンループに探索される。以下、図２
を参照して説明する。

【００６６】このオープンループ探索においては、ま
ず、音源作成部１０５は適応符号帳１０３からのみ音源
候補を次々に選び、聴感重みＬＰＣ合成部１０６を機能
させて合成音を得て、ゲイン演算部１０８へ送り、合成
音と入力音声との間の比較を行って最適な適応符号帳１
０３の符号を選択する。

【００６７】次いで、上記適応符号帳１０３の符号を固
定して、適応符号帳１０３からは同じ音源を選択し、確
率的符号帳１０４からはゲイン演算部１０８の符号に対
応した音源を次々に選択して聴感重みＬＰＣ合成部１０
６へ伝送する。ゲイン演算部１０８で両合成音の和と入
力音声との間の比較を行って確率的符号帳１０４の符号
を決定する。

【００６８】このアルゴリズムを用いた場合、全ての符
号帳の符号をそれぞれに対して全て探索するよりは符号
化性能は若干劣化するが、計算量は大幅に削減される。
このため一般にはこのオープンループ探索が用いられ
る。

【００６９】ここで、従来のオープンループの音源探索
の中で代表的なアルゴリズムについて説明する。ここで
は、１つの分析区間（フレーム）に対して２つのサブフ
レームで構成する場合の音源探索手順について説明す
る。

【００７０】まず、ゲイン演算部１０８の指示を受け
て、音源作成部１０５は適応符号帳１０３から音源を引
出して聴感重みＬＰＣ合成部１０６へ送る。ゲイン演算
部１０８において、合成された音源と第１サブフレーム
の入力音声との間の比較を繰り返して最適な符号を求め
る。ここで、適応符号帳の特徴を示す。適応符号帳は過
去において合成に使用した音源である。そして、符号
は、図６に示すようにタイムラグに対応している。

【００７１】次に、適応符号帳１０３の符号が決まった
後に、確率的符号帳の探索を行う。音源作成部１０５は
適応符号帳１０３の探索で得られた符号の音源とゲイン
演算部１０８で指定された確率的符号帳１０４の音源と
を取り出して聴感重みＬＰＣ合成部１０６へ送る。そし
て、ゲイン演算部１０８において、聴感重み付け済みの
合成音と聴感重み付け済みの入力音声との間の符号化歪
みを計算し、最も適当な（二乗誤差が最小となるもの）
確率的音源１０４の符号を決める。１つの分析区間（サ
ブフレームが２の場合）での音源符号探索の手順を以下
に示す。

【００７２】１）第１サブフレームの適応符号帳の符号
を決定２）第１サブフレームの確率的符号帳の符号を決定３）パラメータ符号化部１０９でゲインを符号化し、復
号化ゲインで第１サブフレームの音源を作成し、適応符
号帳１０３を更新する。４）第２サブフレームの適応符号帳の符号を決定５）第２サブフレームの確率的符号帳の符号を決定６）パラメータ符号化部１０９でゲインを符号化し、復
号化ゲインで第２サブフレームの音源を作成し、適応符
号帳１０３を更新する。

【００７３】上記アルゴリズムによって効率よく音源の
符号化を行うことができる。しかしながら、最近では、
さらなる低ビットレート化を目指し、音源のビット数を
節約する工夫が行われている。特に注目されているの
は、適応符号帳のラグに大きな相関があることを利用し
て、第１サブフレームの符号はそのままで、第２サブフ
レームの探索範囲を第１サブフレームのラグの近くに狭
めて（エントリ数を減らして）ビット数を少なくすると
いうアルゴリズムである。

【００７４】このアルゴリズムでは、分析区間（フレー
ム）の途中から音声が変化する場合や、２つのサブフレ
ームの様子が大きく異なる場合には局所的劣化を引き起
こすことが考えられる。

【００７５】本実施の形態では、符号化の前に２つのサ
ブフレーム両方についてピッチ分析を行って相関値を算
出し、得られた相関値に基づいて２つのサブフレームの
ラグの探索範囲を決定する探索方法を実現する音声符号
化装置を提供する。

【００７６】具体的には、本実施の形態の音声符号化装
置は、１つのフレームを複数のサブフレームに分解して
それぞれを符号化するＣＥＬＰ型符号化装置において、
最初のサブフレームの適応符号帳探索の前に、フレーム
を構成する複数のサブフレームのピッチ分析を行って相
関値を算出するピッチ分析部と、上記ピッチ分析部がフ
レームを構成する複数のサブフレームの相関値を算出す
ると共に、その相関値の大小から各サブフレームで最も
ピッチ周期らしい値（代表ピッチと呼ぶ）を求め、ピッ
チ分析部にて得られた相関値と代表ピッチとに基づいて
複数のサブフレームのラグの探索範囲を決定する探索範
囲設定部と、を備えることを特徴としている。

【００７７】そして、この音声符号化装置では、探索範
囲設定部において、ピッチ分析部で得た複数のサブフレ
ームの代表ピッチと相関値を利用して探索範囲の中心と
なる仮のピッチ（仮ピッチと呼ぶ）を求め、探索範囲設
定部において、求めた仮ピッチの周りの指定の範囲にラ
グの探索区間を設定し、ラグの探索区間を設定するとき
に、仮ピッチの前後に探索範囲を設定する。また、その
際に、ラグの短い部分の候補を少なくし、ラグのより長
い範囲を広く設定し、適応符号帳探索の際に上記探索範
囲設定部で設定された範囲でラグの探索を行う。

【００７８】以下、本実施の形態に係る音声符号化装置
について添付図面を用いて詳細に説明する。ここでは、
１フレームは２サブフレームに分割されているものとす
る。３サブフレーム以上の場合でも同様の手順で符号化
を行うことができる。

【００７９】この音声符号化装置においては、いわゆる
デルタラグ方式によるピッチ探索において、分割された
サブフレームについてすべてピッチを求め、ピッチ間で
どの程度の相関があるかどうかを求めて、その相関結果
に応じて探索範囲を決定する。

【００８０】図７は、本発明の実施の形態２に係る音声
符号化装置の構成を示すブロック図である。まず、ＬＰ
Ｃ分析部３０２において、入力された音声データ（入力
音声）３０１に対して自己相関分析とＬＰＣ分析を行う
ことによってＬＰＣ係数を得る。また、ＬＰＣ分析部３
０２にぽいて、得られたＬＰＣ係数の符号化を行ってＬ
ＰＣ符号を得る。さらに、ＬＰＣ分析部３０２におい
て、得られたＬＰＣ符号を復号化して復号化ＬＰＣ係数
を得る。

【００８１】次いで、ピッチ分析部３１０において、２
サブフレーム分の入力音声のピッチ分析を行い、ピッチ
候補とパラメータを求める。１サブフレームに対するア
ルゴリズムを以下に示す。相関係数は、下記式７によ
り、２つ求められる。なおこの時、Ｃ_ppはＰ_minについ
てまず求め、あとのＰ_min+1、Ｐ_min+2については、フレ
ーム端の値の足し引きで効率的に計算できる。

【００８２】

【数７】式７ここで、Ｘ_i，Ｘ_i-P：入力音声Ｖ_p：自己相関関数Ｃ_pp：パワ成分ｉ：入力音声のサンプル番号Ｌ：サブフレームの長さＰ：ピッチＰ_min，Ｐ_max：ピッチの探索を行う最小値と最大値

【００８３】そして、上記式７で求めた自己相関関数と
パワ成分はメモリに蓄えておき、次の手順で代表ピッチ
Ｐ₁を求める。これはＶ_pが正でＶ_p×Ｖ_p／Ｃ_ppを最大に
するピッチＰを求める処理となっている。ただし、割り
算は一般的に計算量がかかるので、分子と分母を２つと
も格納し、掛け算に直して効率化を図っている。

【００８４】ここでは、入力音声と入力音声からピッチ
分過去の適応音源との差分の二乗和が最も小さくなるよ
うなピッチを探す。この処理はＶ_p×Ｖ_p／Ｃ_ppを最大に
するピッチＰを求める処理と等価となる。具体的な処理
は以下のようになる。

【００８５】１）初期化（Ｐ＝Ｐ_min、ＶＶ＝Ｃ＝０、Ｐ₁＝Ｐ_min）２）もし（Ｖ_p×Ｖ_p×Ｃ＜ＶＶ×Ｃ_pp）又は（Ｖ_p＜
０）ならば４）へ。それ以外なら３）へ。３）ＶＶ＝Ｖ_p×Ｖ_p、Ｃ＝Ｃ_pp、Ｐ₁＝Ｐとして４）へ４）Ｐ＝Ｐ＋１とする。この時Ｐ＞Ｐ_maxであれば終
了、それ以外の場合には２）へ。

【００８６】上記作業を２サブフレームのそれぞれにつ
いて行い、代表ピッチＰ₁、Ｐ₂と自己相関係数Ｖ_1p、Ｖ
_2p、パワー成分Ｃ_1pp、Ｃ_2pp（Ｐ_min＜ｐ＜Ｐ_max）を求
める。

【００８７】次に、探索範囲設定部３１１で適応符号帳
のラグの探索範囲を設定する。まず、その探索範囲の軸
となる仮ピッチを求める。仮ピッチはピッチ分析部３１
０で求めた代表ピッチとパラメータを用いて行う。

【００８８】仮ピッチＱ₁、Ｑ₂は以下の手順で求める。
なお、以下の説明においてラグの範囲として定数Ｔｈ
（具体的には６程度が適当である）を用いる。また、相
関値は上記式７で求めたものを用いる。

【００８９】まず、Ｐ₁を固定した状態でＰ₁の付近（±
Ｔｈ）で相関の最も大きい仮ピッチ（Ｑ₂）を見つけ
る。

【００９０】１）初期化（ｐ＝Ｐ₁−Ｔｈ、Ｃ_max＝０、
Ｑ₁＝Ｐ₁、Ｑ₂＝Ｐ₁）２）もし（Ｖ_1p1×Ｖ_1p1／Ｃ_1p1p1＋Ｖ_2p×Ｖ_2p／Ｃ_2pp
＜Ｃ_max）または（Ｖ₂ _p＜０）ならば４）へ。それ以外
なら３）へ。３）Ｃ_max＝Ｖ_1p1×Ｖ_1p1／Ｃ_1p1p1＋Ｖ_2p×Ｖ_2p／Ｃ
_2pp、Ｑ₂＝ｐとして４）へ４）ｐ＝ｐ＋１として２）へ。ただし、この時ｐ＞Ｐ₁
＋Ｔｈであれば５）へ。

【００９１】このようにして２）〜４）の処理をＰ₁−
Ｔｈ〜Ｐ₁＋Ｔｈまで行って、相関の最も大きいものＣ
_maxと仮ピッチＱ₂を求める。

【００９２】次に、Ｐ₂を固定した状態でＰ₂の付近（±
Ｔｈ）で相関の最も大きい仮ピッチ（Ｑ₁）を求める。
この場合、Ｃ_maxは初期化しない。Ｑ₂を求めた際のＣ
_maxを含めて相関が最大となるＱ₁を求めることにより、
第１，第２サブフレーム間で最大の相関を持つＱ₁，Ｑ₂
を求めることが可能となる。

【００９３】５）初期化（ｐ＝Ｐ₂−Ｔｈ）６）もし（Ｖ_1p×Ｖ_1p／Ｃ_1pp＋Ｖ_2p2×Ｖ_2p2／Ｃ_2p2p2
＜Ｃ_max）又は（Ｖ_1p＜０）ならば８）へ。それ以外は
７）へ。７）Ｃ_max＝Ｖ_1p×Ｖ_1p／Ｃ_1pp＋Ｖ_2p2×Ｖ_2p2／Ｃ
_2p2p2、Ｑ₁＝ｐ、Ｑ₂＝Ｐ₂として８）へ。８）ｐ＝ｐ＋１として６）へ。ただし、この時ｐ＞Ｐ₂
＋Ｔｈであれば９）へ。９）終了。

【００９４】このようにして６）〜８）の処理をＰ₂−
Ｔｈ〜Ｐ₂＋Ｔｈまで行って、相関の最も大きいものＣ
_maxと仮ピッチＱ₁、Ｑ₂を求める。この時のＱ₁、Ｑ₂が
第１サブフレームと第２サブフレームの仮ピッチであ
る。

【００９５】上記アルゴリズムにより、２つのサブフレ
ームの相関を同時に評価しながら大きさに比較的差のな
い（差の最大はＴｈである）仮ピッチを２つ選択するこ
とができる。この仮ピッチを用いることにより、第２サ
ブフレームの適応符号帳探索の際に、探索の範囲を狭く
設定しても符号化性能を大きく劣化させることを防止で
きる。例えば、第２サブフレームから音質が急に変化し
た場合などで、第２サブフレームの相関が強い場合は、
第２サブフレームの相関を反映したＱ₁を用いることで
第２サブフレームの劣化を回避出来る。

【００９６】さらに、探索範囲設定部３１１は、求めた
仮ピッチＱ₁を用いて適応符号帳の探索を行う範囲（Ｌ_
_ST〜Ｌ__EN）を下記式８のようにして設定する。

【００９７】

【数８】式８ここで、Ｌ__ST：探索範囲の最小Ｌ__EN：探索範囲の最大Ｌ_min：ラグの最小値（例：２０）Ｌ_max：ラグの最大値（例：１４３）Ｔ₁：第１フレームの適応符号帳ラグ

【００９８】上記設定において、第１サブフレームは探
索範囲を狭める必要はない。しかしながら、本発明者ら
は、入力音声のピッチに基づいた値の付近を探索区間と
した方が性能が良いことを実験により確認しており、本
実施の形態では２６サンプルに狭めて探索するアルゴリ
ズムを使用している。

【００９９】また、第２サブフレームは第１サブフレー
ムで求められたラグＴ₁を中心にその付近に探索範囲を
設定している。したがって、合計３２エントリで、第２
サブフレームの適応符号帳のラグを５ビットで符号化で
きることになる。また、本発明者らは、この時もラグの
小さい候補を少なく、ラグの大きい候補を多く設定する
ことにより、より良い性能が得られることを実験により
確認している。ただし、これまでの説明でわかるよう
に、本実施の形態においては、仮ピッチＱ₂は使用しな
い。

【０１００】ここで、本実施の形態における効果につい
て説明する。探索範囲設定部３１１によって得られた第
１サブフレームの仮ピッチの近くには、第２サブフレー
ムの仮ピッチも存在している（定数Ｔｈで制限したた
め）。また、第１サブフレームにおいて探索範囲を絞っ
て探索しているので、探索の結果得られるラグは第１サ
ブフレームの仮ピッチから離れない。

【０１０１】したがって、第２サブフレームの探索の時
には、第２サブフレームの仮ピッチから近い範囲を探索
できることになり、第１，第２サブフレームの両方にお
いて適当なラグが探索できることになる。

【０１０２】例として、第１サブフレームが無音で、第
２サブフレームから音声が立ち上がった場合を考える。
従来法では、探索範囲を狭めることで第２サブフレーム
のピッチが探索区間に含まれなくなると、音質は大きく
劣化してしまう。本実施の形態に係る方法においては、
ピッチ分析部の仮ピッチの分析において、代表ピッチＰ
₂の相関は強く出る。したがって、第１サブフレームの
仮ピッチはＰ₂付近の値になる。このため、デルタラグ
による探索の際に、音声が立ち上がった部分に近い部分
を仮ピッチとすることができる。すなわち、第２サブフ
レームの適応符号帳の探索の時には、Ｐ₂付近の値を探
索できることになり、途中で音声の立ち上がり生じても
劣化なくデルダラグにより第２サブフレームの適応符号
帳探索を行うことができる。

【０１０３】次に、音源作成部３０５において、適応符
号帳３０３に格納された音源サンプル（適応コードベク
トル又は適応音源）と確率的符号帳３０４に格納された
音源サンプル（確率的コードベクトル又は確率的音源）
を取り出し、それぞれを聴感重みＬＰＣ合成部３０６へ
送る。さらに、聴感重みＬＰＣ合成部３０６において、
音源作成部３０５で得られた２つの音源に対して、ＬＰ
Ｃ分析部３０２で得られた復号化ＬＰＣ係数によってフ
ィルタリングを行って２つの合成音を得る。

【０１０４】さらに、ゲイン演算部３０８においては、
聴感重みＬＰＣ合成部３０６で得られた２つの合成音と
聴感重み付け部３０７で聴感重み付けされた入力音声と
の関係を分析し、２つの合成音の最適値（最適ゲイン）
を求める。また、ゲイン演算部３０８においては、その
最適ゲインによってパワ調整したそれぞれの合成音を加
算して総合合成音を得る。そして、ゲイン演算部３０８
は、その総合合成音と入力音声の符号化歪みの計算を行
う。また、ゲイン演算部３０８においては、適応符号帳
３０３と確率的符号帳３０４の全ての音源サンプルに対
して音源作成部３０５、聴感重みＬＰＣ合成部３０６を
機能させることによって得られる多くの合成音と入力音
声との間の符号化歪みを行い、その結果得られる符号化
歪みの中で最も小さいときの音源サンプルのインデクス
を求める。

【０１０５】次に、得られた音源サンプルのインデク
ス、そのインデクスに対応する２つの音源、及び入力音
声をパラメータ符号化部３０９へ送る。パラメータ符号
化部３０９では、ゲインの符号化を行うことによってゲ
イン符号を得て、ＬＰＣ符号、音源サンプルのインデク
スと共に伝送路へ送る。

【０１０６】また、パラメータ符号化部３０９は、ゲイ
ン符号と音源サンプルのインデクスに対応する２つの音
源から実際の音源信号を作成し、それを適応符号帳３０
３に格納すると同時に古い音源サンプルを破棄する。

【０１０７】なお、聴感重みＬＰＣ合成部３０６におい
ては、ＬＰＣ係数や高域強調フィルタや長期予測係数
（入力音声の長期予測分析を行うことによって得られ
る）を用いた聴感重み付けフィルタを用いる。

【０１０８】上記ゲイン演算部３０８は、音源作成部３
０５から得られた適応符号帳３０３、確率的符号帳３０
４の全ての音源について入力音声との間の比較を行う
が、計算量削減のため、２つの音源（適応符号帳３０３
と確率的符号帳３０４）については上述したようにして
オープンループにより探索する。

【０１０９】このように、本実施の形態におけるピッチ
探索方法により、最初のサブフレームの適応符号帳探索
の前に、フレームを構成する複数のサブフレームのピッ
チ分析を行って相関値を算出することにより、フレーム
内の全サブフレームの相関値を同時に把握することがで
きる。

【０１１０】そして、各サブフレームの相関値を算出す
ると共に、その相関値の大小から各サブフレームで最も
ピッチ周期らしい値（代表ピッチと呼ぶ）を求め、ピッ
チ分析で得られた相関値と代表ピッチに基づいて複数の
サブフレームのラグの探索範囲を設定する。この探索範
囲の設定においては、ピッチ分析で得た複数のサブフレ
ームの代表ピッチと相関値を利用して探索範囲の中心と
なる差の少ない適当な仮のピッチ（仮ピッチと呼ぶ）を
求める。

【０１１１】さらに、上記探索範囲の設定で求めた仮ピ
ッチの前後の指定の範囲にラグの探索区間を限定するの
で、適応符号帳の効率の良い探索を可能にする。その
際、ラグの短い部分の候補を少なくし、ラグのより長い
範囲を広く設定するので、良好な性能が得られる適当な
探索範囲を設定することができる。また、適応符号帳探
索の際に上記探索範囲の設定で設定された範囲でラグの
探索を行うので、良好な復号化音を得ることができる符
号化が可能になる。

【０１１２】このように、本実施の形態によれば、探索
範囲設定部３１１によって得られた第１サブフレームの
仮ピッチの近くには第２サブフレームの仮ピッチも存在
しており、第１サブフレームにおいて探索範囲を絞って
いるので、探索の結果得られるラグは仮ピッチから離れ
て行かない。したがって、第２サブフレームの探索の時
には第２サブフレームの仮ピッチ付近を探索できること
になり、フレームの後半から音声が始まる場合などの非
定常なフレームでも、第１，第２サブフレームにおいて
適当なラグ探索が可能になり、従来得られなかった格別
の効果を得ることができる。

【０１１３】上記実施の形態１，２に係る音声符号化／
復号化は、音声符号化装置／音声復号化装置として説明
しているが、これらの音声符号化／復号化をソフトウェ
アとして構成しても良い。例えば、上記音声符号化／復
号化のプログラムをＲＯＭに格納し、そのプログラムに
したがってＣＰＵの指示により動作させるように構成し
ても良い。また、プログラム，適応符号帳，及び確率的
符号帳（パルス拡散符号帳）をコンピュータで読み取り
可能な記憶媒体に格納し、この記憶媒体のプログラム，
適応符号帳，及び確率的符号帳（パルス拡散符号帳）を
コンピュータのＲＡＭに記録して、プログラムにしたが
って動作させるようにしても良い。このような場合にお
いても、上記実施の形態１，２と同様の作用、効果を呈
する。さらに、実施の形態１〜３におけるプログラムを
通信端末でダウンロードし、その通信端末でプログラム
を動作させるようにしても良い。

【０１１４】なお、上記実施の形態１，２については、
個々に実施しても良く、組み合わせて実施しても良い。

【０１１５】

【発明の効果】以上説明したように本発明の音声符号化
装置は、以前のサブフレームの状態に応じて予測符号化
に用いる予測係数を調整するので、各コードベクトルに
応じて予測係数を制御することが可能になり、音声の局
所的特徴により適応したより効率的な予測や、非定常部
における予測の弊害を防ぐことができる。

【図面の簡単な説明】

【図１】本発明の音声符号化装置を備えた無線通信装置
の構成を示すブロック図

【図２】本発明の実施の形態１に係る音声符号化装置の
構成を示すブロック図

【図３】図２に示す音声符号化装置におけるゲイン演算
部の構成を示すブロック図

【図４】図２に示す音声符号化装置におけるパラメータ
符号化部の構成を示すブロック図

【図５】本発明の実施の形態１に係る音声符号化装置で
符号化された音声データを復号する音声復号化装置の構
成を示すブロック図

【図６】適応符号帳探索を説明するための図

【図７】本発明の実施の形態２に係る音声符号化装置の
構成を示すブロック図

【符号の説明】

１０２，３０２ＬＰＣ分析部１０３，３０３適応符号帳１０４，３０４確率的符号帳１０５，３０５音源作成部１０６，３０６聴感重みＬＰＣ合成部１０７，３０７聴感重み付け部１０８，３０８ゲイン演算部１０９，３０９パラメータ符号化部３１０ピッチ分析部３１１探索範囲設定部１０９１パラメータ計算部１０９２符号化歪計算部１０９３比較部１０９４ベクトル符号帳１０９５予測係数格納部１０９６復号化ベクトル格納部

Claims

【特許請求の範囲】

【請求項１】適応符号帳及び確率的符号帳に格納され
た適応音源及び確率的音源に対して、入力音声から求め
たＬＰＣ係数を用いてフィルタリングすることにより、
合成音を得るＬＰＣ合成手段と、前記適応音源及び前記
確率的音源のゲインを求め、さらに前記ゲインを用いて
得られる前記入力音声と前記合成音との間の符号化歪み
を用いて適応音源及び確率的音源の符号を探索するゲイ
ン演算手段と、求められた符号に対応する適応音源及び
確率的音源を用いてゲインの予測符号化を行うパラメー
タ符号化手段と、を具備し、前記パラメータ符号化手段は、以前のサブフレームの状
態に応じて前記予測符号化に用いる予測係数を調整する
予測係数調整手段を備えることを特徴とする音声符号化
装置。
【請求項２】前記予測係数調整手段は、以前のサブフ
レームの状態が極端に大きな値又は極端に小さな値であ
る場合に、その影響を小さくするように前記予測係数を
調整することを特徴とする請求項１記載の音声符号化装
置。
【請求項３】前記パラメータ符号化手段は、適応音源
のゲインのベクトル及び確率的音源のゲインのベクト
ル、並びに予測係数を調整する係数を含む符号帳を有す
ることを特徴とする請求項１又は請求項２記載の音声符
号化装置。
【請求項４】予測符号化において、状態と予測係数と
の間の積和を求めるときに、その状態に対応した予測係
数調整係数を乗じることを特徴とする請求項３記載の音
声符号化装置。
【請求項５】前記適応音源及び前記確率的音源、並び
に予測係数調整係数を状態毎に対応させて格納する格納
手段を具備することを特徴とする請求項１から請求項４
のいずれかに記載の音声符号化装置。
【請求項６】前記格納手段に格納された前記適応音源
及び前記確率的音源の状態を更新する際に、前記予測係
数調整係数も更新することを特徴とする請求項５記載の
音声符号化装置。
【請求項７】適応符号帳及び確率的符号帳に格納され
た適応音源及び確率的音源に対して、入力音声から求め
たＬＰＣ係数を用いてフィルタリングすることにより、
合成音を得るＬＰＣ合成手段と、前記適応音源及び前記
確率的音源のゲインを求めるゲイン演算手段と、前記入
力音声と前記合成音との間の符号化歪みを用いて求めら
れた適応音源及び確率的音源、並びに前記ゲインのベク
トル量子化を行うパラメータ符号化手段と、を具備し、
１つのフレームを複数のサブフレームに分解して符号化
を行うＣＥＬＰ型音声符号化装置であって、最初のサブフレームの適応符号帳探索の前に、フレーム
を構成する複数のサブフレームのピッチ分析を行って相
関値を求め、前記相関値を用いて最もピッチ周期に近似
する値を算出するピッチ分析手段を備えることを特徴と
する音声符号化装置。
【請求項８】前記ピッチ分析手段において得られた相
関値及び最もピッチ周期に近似する値に基づいて複数の
サブフレームのラグの探索範囲を決定する探索範囲設定
手段を具備することを特徴とする請求項７記載の音声符
号化装置。
【請求項９】探索範囲設定手段は、前記ピッチ分析手
段において得られた相関値及び最もピッチ周期に近似す
る値を用いて探索範囲の中心となる仮ピッチを求めるこ
とを特徴とする請求項８記載の音声符号化装置。
【請求項１０】探索範囲設定手段は、仮ピッチの周り
の指定の範囲にラグの探索区間を設定することを特徴と
する請求項９記載の音声符号化装置。
【請求項１１】探索範囲設定手段は、ラグが短い候補
を少なくしてラグの探索区間を設定することを特徴とす
る請求項８から請求項１０のいずれかに記載の音声符号
化装置。
【請求項１２】探索範囲設定手段は、適応符号帳探索
の際に、設定された範囲でラグの探索を行うことを特徴
とする請求項８から請求項１１のいずれかに記載の音声
符号化装置。
【請求項１３】音声符号化プログラム；過去に合成し
た音源信号が格納された適応符号帳；複数の音源ベクト
ルを格納した確率的符号帳；を格納し、コンピュータに
より読み取り可能な記録媒体であって、前記音声符号化
プログラムは、前記適応符号帳及び前記確率的符号帳に格納された適応
音源及び確率的音源に対して、入力音声から求めたＬＰ
Ｃ係数を用いてフィルタリングすることにより、合成音
を得る手順と、前記適応音源及び前記確率的音源のゲインを求める手順
と、前記入力音声と前記合成音との間の符号化歪みを用いて
求められた適応音源及び確率的音源、並びに前記ゲイン
のベクトル量子化を行う手順と、を含み、ベクトル量子化を行う手順において、複数の量子化対象
ベクトルと、予測符号化に用いる予測係数との間の符号
化歪みに基づいて量子化対象ベクトルを求める手順と、
以前のサブフレームの状態に応じて前記予測係数を調整
する手順と、を含むことを特徴とする記録媒体。
【請求項１４】音声符号化プログラム；過去に合成し
た音源信号が格納された適応符号帳；複数の音源ベクト
ルを格納した確率的符号帳；を格納し、コンピュータに
より読み取り可能な記録媒体であって、前記音声符号化
プログラムは、前記適応符号帳及び前記確率的符号帳に格納された適応
音源及び確率的音源に対して、入力音声から求めたＬＰ
Ｃ係数を用いてフィルタリングすることにより、合成音
を得る手順と、前記適応音源及び前記確率的音源のゲインを求める手順
と、前記入力音声と前記合成音との間の符号化歪みを用いて
求められた適応音源及び確率的音源、並びに前記ゲイン
のベクトル量子化を行う手順と、最初のサブフレームの適応符号帳探索の前に、フレーム
を構成する複数のサブフレームのピッチ分析を行って相
関値を求め、前記相関値を用いて最もピッチ周期に近似
する値を算出する手順と、を含むことを特徴とする記録
媒体。