JP2004170494A

JP2004170494A - 音声符号化装置，音声符号化方法

Info

Publication number: JP2004170494A
Application number: JP2002333436A
Authority: JP
Inventors: Takayuki Hiekata; 孝之稗方; Tetsuya Takahashi; 哲也高橋; Yohei Ikeda; 陽平池田; Shigeki Murakami; 茂樹村上; Toshiro Yamashita; 俊郎山下; Toshiaki Shimoda; 敏章下田
Original assignee: Kobe Steel Ltd
Current assignee: Kobe Steel Ltd
Priority date: 2002-11-18
Filing date: 2002-11-18
Publication date: 2004-06-17

Abstract

【課題】入力される音声信号をロスレス符号化する音声符号化装置において，予測器における音声信号の予測精度を向上させ，ひいては，該音声信号の圧縮率を向上させること。
【解決手段】入力される音声信号を所定サンプル数毎に取得するバッファ２０１と，複数の予測係数が適用され，夫々の前記予測係数により過去の前記音声信号から現在の前記音声信号の予測信号を予測する予測器２０２と，夫々の予測信号と前記音声信号との間の残差信号を算出する残差器２１２と，前記残差信号及び該残差信号の算出に使用された前記予測信号を予測する際に適用された前記予測係数を特定する情報とを符号化する符号器２０３と，符号化された前記残差信号及び前記予測係数を特定する情報の符号長に基づいて，複数の前記予測手段のうち一つを選択する符号長計算選択器２０４と，を具備してなることを特徴とする音声符号化装置として構成する。
【選択図】図１

Description

【０００１】
【発明の属する技術分野】
本発明は，入力される音声信号を可逆符号化する符号化装置に係り，詳しくは，符号長の異なる予測係数が適用される予測器を複数備え，それら予測器から最適な予測器を選択することで，前記音声信号の高効率な圧縮を実現可能にする符号化装置に関する。
【０００２】
【従来の技術】
近年，音声信号の冗長性を利用して符号化することでデータ量を圧縮し，音声信号の記録／再生，或いは送受信に関する効率を向上させる技術が数多く開発されている。
これらの技術は，大別すると非可逆符号化と可逆符号化に分けることが可能である。
前者は，ＭＰ３やＡＡＣ方式に代表されるようにデータの圧縮による聴覚的劣化を伴うものの，比較的高い圧縮率（１／１０以下程度でも聴覚上大きな問題がない）の符号化が可能なものである。
一方，後者は，ロスレス符号化とも呼ばれ，圧縮（符号化）前の信号が完全に復元可能であるため聴覚的劣化はないが，比較的低い圧縮率（符号化される音声データによるが，概ね１／２程度）の符号化しかできないものである。
そのため，特にメモリ容量に制限のある携帯端末等を用いて前記音声信号を記録，再生するといった使用状況では，その圧縮率の優位性から，非可逆符号化が利用されることが多い。
しかしながら，圧縮前の信号と全く同一の信号が得られるロスレス符号化に対するニーズは強く，その技術的課題となっている圧縮率を向上させる技術の開発が望まれている。
そこで，ロスレス符号化における圧縮率を向上する技術としては，特性の異なる（つまりは，適用される予測係数が異なる）複数の予測器により入力された音声信号を予測し，その予測結果に基づいて（つまりは，残差信号を最小とする）それら複数の予測器のうち一つを選択し，その選択された予測器からの出力信号（即ち，残差信号）と該予測器（即ち，予測係数）を特定する信号とを符号化した後に出力するよう構成された音声符号化装置がある（例えば，特許文献１参照。）。
このような構成によれば，音声信号に応じて最適な（即ち，残差信号を最小とし得る）予測器（予測係数）が選択されるため，音声信号を予測する予測精度を向上させることが可能となり，ひいては，符号化後の圧縮率の向上に寄与し得る。
【０００３】
【特許文献１】
特開２００１−１７５２９５号公報
【０００４】
【発明が解決しようとする課題】
ところで，上述の従来公知の技術は，特性の異なる複数の予測器を有するものの，各予測器における予測係数は固定長（一定）であることを前提としており，符号化後の音声信号の符号長を最小にするという観点からすれば，必ずしも最適な予測器が選択されているとは言い難い。
別言すれば，予測器による予測精度を向上させるという観点では，従来公知の手法の如く，予測係数の係数を変更するだけでなく，各予測器毎の予測係数の次数を変える，或いは各予測器毎の予測方式を変える等，各予測器毎の予測係数の符号長を可変長にする方が有利である。
しかしながら，複数の予測器から一つを選択するに当たり，残差信号を最小とする予測器を選択する従来公知の技術では，各予測器の予測係数は固定長であることが前提とならざる得ず，予測係数の符号長の異なる予測器を適用し，更なる圧縮率の向上を図ることは不可能であった。
そこで，本発明は，前記事情に鑑みてなされたものであり，その目的とするところは，予測器毎の予測係数を可変長にすることによって，予測器における音声信号の予測精度を向上させ，ひいては，該音声信号の圧縮率を向上させることが可能な音声符号化装置を提供することにある。
【０００５】
【課題を解決するための手段】
前記目的を達成するために，本発明は，入力される音声信号を可逆符号化する音声符号化装置において，入力される前記音声信号を所定サンプル数毎に取得するサンプル取得手段と，複数の予測係数が適用され，夫々の前記予測係数により過去の前記音声信号から現在の前記音声信号の予測信号を予測する予測手段と，前記予測手段により予測された夫々の予測信号と前記サンプル取得手段で取得された所定サンプル数の前記音声信号との間の残差信号を算出する残差信号算出手段と，前記残差信号算出手段により算出された前記残差信号及び該残差信号の算出に使用された前記予測信号を予測する際に適用された前記予測係数を特定する情報とを符号化する符号化手段と，前記符号化手段により符号化された前記残差信号及び前記予測係数を特定する情報の符号長に基づいて，複数の前記予測手段のうち一つを選択する予測選択手段と，を具備してなることを特徴とする音声符号化装置として構成される。
このような構成により，本発明によれば，入力される前記音声信号を符号長の異なる予測係数が適用される複数の前記予測手段によって予測し，しかる後，複数の前記予測手段のうち，予測精度の高い予測手段を選択することが可能となり，入力される前記音声信号を高い圧縮率で符号化することが可能である。
ここで，本発明は，前記予測手段毎に符号長が異なる予測係数を用いる構成上，前記予測選択手段において前記予測手段を選択するに当たり，前記残差信号算出手段から得られる残差信号だけでなく，該残差信号の算出に使用された前記予測信号を予測する際に適用された前記予測係数を特定する情報とを符号化した符号の符号長が最小となる予測手段が選択するよう構成される。
これにより，複数の前記予測手段のうち一つを選択するに当たり，前記予測手段間における予測係数の符号長の差異を考慮しつつ，音声信号を最も高い圧縮率で符号化し得る前記予測手段が選択される。
前記予測手段における予測係数の一例としては，前記サンプル取得手段で取得された所定サンプル数の前記音声信号から線形予測分析により計算された予測係数が考えられる。
また，前記予測手段における予測係数の他の例としては，前記サンプル取得手段で取得された所定サンプル数の前記音声信号から線形予測分析により計算された予測係数を基にベクトル量子化した予測係数が考えられる。
更に，前記予測手段における予測係数の別の例としては，前記予測選択手段により過去に選択された前記予測係数が考えられる。
【０００６】
尚，前述構成の音声符号化装置に適用される音声符号化方法として捉えることで，本発明は，入力される音声信号を可逆符号化する音声符号化方法において，入力される前記音声信号を所定サンプル数毎に取得するサンプル取得工程と，複数の予測係数が適用される複数の予測手段により，過去の前記音声信号から現在の前記音声信号の予測信号を予測する予測工程と，複数の前記予測手段で予測された夫々の予測信号と前記サンプル取得工程により取得された所定サンプル数の前記音声信号との間の残差信号を算出する残差信号算出工程と，前記残差信号算出工程により算出された前記残差信号及び該残差信号の算出に使用された前記予測信号を予測する際に適用された前記予測係数を特定する情報とを符号化する符号化工程と，前記符号化工程により符号化された前記残差信号及び前記予測係数を特定する情報の符号長に基づいて，複数の前記予測手段のうち一つを選択する予測選択工程と，を具備してなることを特徴とする音声符号化方法と考えることも可能である。
この場合の作用については，前述した形態と同様であるため，ここでは省略する。
【０００７】
【発明の実施の形態】
以下添付図面を参照しながら，本発明の実施の形態及び実施例について説明し，本発明の理解に供する。尚，以下の実施の形態及び実施例は，本発明を具体化した一例であって，本発明の技術的範囲を限定する性格のものではない。
ここに，図１は本発明の実施形態に係る音声符号化装置の概略構成を示すブロック図，図２は本発明の別の実施形態に係る音声符号化装置の概略構成を示すブロック図，図３は本発明の実施形態に係る音声符号化装置により生成されたビットストリームを復号化する音声復号化装置の概略構成を示すブロック図，図４はビットストリーム中の予測係数情報の符号長を説明する図，図５はビットストリームの構成を模式的に示す図，図６は音声信号の一例を示す図，図７は音声信号における振幅毎の出現頻度を示す図，図８は予測残差信号における振幅毎の出現頻度を示す図である。
【０００８】
ここに，本発明の実施形態に係る音声符号化装置は，図１に示すブロック図の如く具現化される。
同図に示す如く，本実施形態に係る音声符号化装置Ａは，バッファ２０１（前記サンプル取得手段の一例に該当）、予測器２０２−１〜２０２−３（前記予測手段の一例に該当）、減算器２１２−１〜２１２−３（前記残差信号算出手段の一例に該当）、符号器２０３−１〜２０３−３（前記符号化手段の一例に該当）、符号長計算／選択器２０４（前記予測選択手段の一例に該当）、ビットストリーム生成器２０５，メモリ部２１３を具備して概略構成される。
以下に，当該音声符号化装置Ａに入力されたＰＣＭデータ（つまりは，音声信号）が符号化され，符号データとして出力されるまでの各部の処理について，処理の流れに沿って説明する。
【０００９】
（バッファ２０１）
先ず，当該音声符号化装置Ａに入力されたＰＣＭデータは，入力端子２００から前記バッファ２０１に入力される。
該バッファ２０１では，あるサンプル数（例えば８００サンプル）毎にフレームと呼ばれる単位で処理可能なようにバッファリングされる。
該バッファ２０１に入力されたＰＣＭデータがフレーム化されつつ順次バッファリングされる様子を模式的に示す図が図６である。同図に示す如く，入力されたＰＣＭデータＤは所定サンプル数毎にフレーム化され，該バッファ２０１に順次バッファリングされる。
尚，ＰＣＭデータのチャンネル数が複数の場合には，該バッファ２０１において，各チャンネル相互の相関性を除去する処理を行ってもよい。例えば，ＰＣＭデータが２チャンネルであるとすれば，Ｌｃｈ＋Ｒｃｈ，或いはＬｃｈ−Ｒｃｈの演算処理がそれに該当する。
【００１０】
（予測器２０２）
次に，前記バッファ２０１にバッファリングされた，フレーム単位のＰＣＭデータ（以下，略して単にフレームデータという）が予測器２０２−１〜２０２−３に夫々入力される。
該予測器２０２では，下式１の如く，夫々に割り当てられた所定の予測係数αｎに基づいて線形予測処理が行われ，過去のサンプルデータｘ（ｉ）から現在のサンプルの予測値
【数１】

が予測される。
【数２】

但し，αｎ（ｎ＝１，２，・・，Ｎ）は予測係数である。
ここで，該予測器２０２には，各予測器に対し，異なる符号長を有する予測係数が割り当てられ，その予測精度の向上を図っている点で従来構成と異なる。
そのため，当該音声符号化装置Ａでは，後述するように，前記予測器２０２のうち一つの予測器を選択するに当たり，その予測器により予測された予測信号を用いて算出される残差信号だけでなく，その予測信号を予測する際に適用された「予測係数を特定する情報」の符号長を考慮する必要がある。
ここでは，先ず，前記予測器２０２の夫々に適用される予測係数，及び「予測係数を特定する情報」の符号長について，以下に説明する。
（予測器２０２−１）
先ず，前記予測器２０２−１には，バッファリングされたフレームデータを対象として線形予測分析器２０７で算出された線形予測係数２０９を割り当てる。これにより，フレームデータに応じて適宜算出される予測係数によって予測を行うことが可能となり，一定の予測係数による予測に較べ，予測精度を著しく向上させ得る。
尚，前記線形予測分析器２０７における線形予測係数２０９の算出方法に関する詳細は，「音のコミュニケーション工学」（社団法人日本音響学会編，コロナ社，１９９６／８／３０初版）に詳しいため，ここでは省略する。
このように前記線形予測係数２０９が適用される当該予測器２０２−１では，「予測係数を特定する情報」の符号長を，前記線形予測分析器２０７で算出される前記線形予測係数２０７が４次，各次数毎の予測係数が８ｂｉｔの場合を考えると，４×８ｂｉｔ＝３２ｂｉｔとすることが可能である（図４参照）。無論，この符号長は一例であって，予測係数の次数や各次数毎の符号長は前述の値に限定されるものではない。
（予測器２０２−２）
そして，前記予測器２０２−２には，１フレーム前で使用した予測係数２１１を割り当てる。つまり，前回のフレームデータを符号化する際に用いられた予測係数を一旦メモリ部２１３に保存しておき，現在のフレームデータを符号化する際に，その保存された前記予測係数２１１を前記メモリ部２１３から読み出して使用する。
これは，現在のフレームデータと前回のフレームデータとの間には何らかの相関性があるとの仮定に基づくものであり，例えば，同一或いは類似したデータが繰り返されるＰＣＭデータに対して有効であると解される。
このように前記予測係数２１１が適用される当該予測器２０２−２では，「予測係数を特定する情報」の符号長を，過去の前記予測係数２１１を使用したことを表すインデックス（フラグ）のみとすることが可能である。つまり，前記フラグの「０」「１」に応じ，前記予測係数２１１の使用／不使用を判定するよう構成することで，その符号長は１ｂｉｔとなる（図４参照）。尚，本実施形態では，簡単のため過去１フレームのみの予測係数を使用する形態としているが，更に過去のフレームに使用された予測係数を保存しておき，それらを使用する形態とすることも可能である。
（予測器２０２−３）
そして，前記予測器２０２−３には，複数の予測係数が予め記憶された予測係数テーブル２１０から選択された予測係数を割り当てる。
ここで，前記予測係数テーブル２１０から一つの予測係数を選択する手法として，本実施形態では，前記線形予測分析器２０７で算出された前記線形予測係数２０９に最も近い予測係数２０９’を選択し，該予測係数２０９’を特定する前記予測係数テーブル２１０の行番号（以下，テーブルインデックスといい，図１参照）を符号化する，いわゆるベクトル量子化法を用いる。
このような構成により，予め記憶された複数の予測係数から最も高い予測精度を発揮し得る予測係数を選択することが可能となり，より高い圧縮率での符号化を実現し得る。
このように前記予測係数２０９’が適用される当該予測器２０２−３では，「予測係数を特定する情報」の符号長を，該予測係数２０９’毎に設定された前記テーブルインデックスのみとすることが可能である。ここで，前記予測係数テーブル２１０のテーブルが２５６通りの場合を考えると，その符号長は，８ｂｉｔとなる（図４参照）。無論，このテーブル数は一例であって，この値に特定されるものではない。
更に，前記予測係数テーブル２１０に記憶されている前記予測係数２０９’は，上述した線形予測係数に限定されるものではなく，これと等価なＰＡＲＣＯＲ係数，或いはＬＳＰ（ＬｉｎｅＳｐｅｃｔｒｕｍＰａｉｒ）係数等を用いることも可能である。
【００１１】
次に，図４を参照しつつ，前記予測器２０２に夫々に適用される予測係数における「予測係数を特定する情報」の符号長について詳説する。
この「予測係数を特定する情報」は，図４に示す如く，予測器識別子とそれ以外のデータ部分により構成される。
尚，前記予測器識別子とは，前記予測係数情報の先頭部分に配置され，該予測係数情報によって，その予測係数が，上述した前記予測器２０２のうち，どの予測器に適用された予測係数であるかを表すフラグである。
具体的には，図４上段に示す（ａ）の如く，最初の１ビットが１であれば１フレーム前の予測係数である（つまりは，前記予測器２０２−２が適用されている）ことを示し，図４中段に示す（ｂ）の如く，最初の１ビットが０，２ビット目が１であれば前記予測係数テーブル２１０から選択された前記予測係数２０９’である（つまりは，前記予測器２０２−３が適用されている）ことを示し，図４下段に示す（ｃ）の如く，最初の１ビットが０，２ビット目が１であれば前記線形予測分析器２０７で算出された前記線形予測係数２０９である（つまりは，前記予測器２０２−１が適用されている）ことを示す。
一方，前記データ部分とは，前記予測器識別子の後に配置され，該データ部分によって，その予測係数を特定するために必要な情報が付与される。
具体的には，図４上段に示す（ａ）の如く，１フレーム前の予測係数については前記予測器識別子のみより一意に識別されるため新たな情報（データ部分）は不要であるが，図４中段に示す（ｂ）の如く，前記予測係数テーブル２１０から選択された前記予測係数２０９’については該予測係数２０９’のテーブルインデックスがこれに該当し，図４下段に示す（ｃ）の如く，前記線形予測分析器２０７で算出された前記線形予測係数２０９については該線形予測係数２０９自体がこれに該当する。
このように，本実施形態に係る前記音声符号化装置Ａでは，前記予測器２０２に適用された「予測係数を特定する情報」の符号長が，前記予測器２０２−１が選択される（図４（ｃ）参照）場合には２＋３２＝３４ｂｉｔ，前記予測器２０２−２が選択される（図４（ａ）参照）場合には１ｂｉｔ，前記予測器２０２−３が選択される（図４（ｂ）参照）場合には２＋８＝１０ｂｉｔとなり，各予測器毎に異なることが理解される。
そのため，本実施形態に係る前記音声符号化装置Ａでは，後述する符号長計算／選択器２０４において，この「予測係数を特定する情報」の符合長の差異を考慮した上で，複数の前記予測器２０２から，最適な（つまりは，最も圧縮率の高い符号化を行い得る）予測器が選択される。
尚，上述説明では，前記予測器識別子が可変長であるが，無論，前記予測器識別子は固定長であってもよい。例えば，前記予測器識別をも２ｂｉｔ固定長とし，「００」ならば前記予測器２０２−１，「０１」ならば前記予測器２０２−２，「１０」ならば前記予測器２０２−３というように判定することが考え得る。
【００１２】
（減算器２１２）
上述の如く所定の予測係数が夫々適用され，過去のサンプリングデータから現在のサンプリングデータの予測信号を予測した前記予測器２０２は，該予測信号を，減算器２１２−１〜２１２−３に出力する。
該減算器２１２では，前記予測器２０２から入力された前記予測信号
【数３】

と，前記バッファ２０１から入力されたサンプルデータｘ（ｉ）とを用い，下式２の如く，残差信号ｄ（ｉ）が算出される。
【数４】

そして，算出された残差信号ｄ（ｉ）が，前記符号器２０３−１〜２０３−３に出力される。
【００１３】
（符号器２０３）
前記符号化器２０３には，各予測器２０２毎の残差信号ｄ（ｉ）と，該残差信号ｄ（ｉ）に対応する（つまり，該残差信号ｄ（ｉ）の算出に使用された予測信号を予測する際に適用された）「予測係数を特定する情報」が入力される。
該符号器２０３は，前記減算器２１２から取得した残差信号ｄ（ｉ）と，前記予測器２０２から取得した「予測係数を特定する情報」を符号化し，しかる後，符号化された残差信号及び「予測係数を特定する情報」（以下，符号化候補という）を前記符号長計算／選択器２０４に出力する。
先ず，残差信号ｄ（ｉ）については，その出現頻度の偏りを利用した符号化方法（いわゆるエントロピー符号化）が行われることが望ましい。
該符号器２０３において残差信号を符号化する利点は，エントロピー（振幅ｋ［ｉ］の出現確率をｐ［ｉ］とした時，ｐ［ｉ］×ｌｏｇ２（１／ｐ［ｉ］）の合計）を小さくできることである。
これについて，あるＰＣＭデータ（１６ｂｉｔ）の振幅の累積度数を表す図７，及び該ＰＣＭデータをある所定の予測係数を用いて予測値を予測し，その予測値を用いて算出された残差信号の振幅の累積度数を表した図８を用いて説明する。
両図より明らかな如く，ＰＣＭデータの残差信号を算出することによって，その信号に対する振幅の分布は０近傍に集中する。そこで，振幅の分布の偏り（集中）を利用して符号化すれば圧縮率の向上させ得る。
具体的には，振幅が０近傍の信号には短いビット長の符号を割当て，振幅が大きくなるに従いビット長の長い符号を割り当てるように符号化すれば，より圧縮効率を高めることが可能である。尚，上述した説明は，概念的な説明であるが，これら概念をさらに効率よく具現化した符号化手法として公知な技術であるＨｕｆｆｍａｎ符号方式，算術符号化方式，或いはレンジコーダ等の手法を用いることが可能である。
このように，該符号器２０３において残差信号を符号化することで，より圧縮効率の高い符号化が可能である。
一方，「予測係数を特定する情報」については，特にその符号化方法に係る限定はなく，図４に示す構造を符号化として捉えることも可能であるし，図４に示す構造の「予測係数を特定する情報」を，上述したエントロピー符号化等を用い更に符号化してもよい。
つまり，該符号器２０３は，前記減算器２１２から取得した残差信号ｄ（ｉ）と，前記予測器２０２から取得した「予測係数を特定する情報」と，を夫々符号化（両者の符号化方式は同一であっても異なってもよい）すると共に，符号化された夫々の符号を合わせて形成される前記符号化候補を前記符号長計算／選択器２０４に出力する機能を有する。
【００１４】
（符号長計算／選択器２０４）
前記符号長計算／選択器２０４では，前記予測器２０２から入力される複数の符号化候補から一つを選択するに当たり，該符号化候補の符号長が最小であるものを選択し，選択された符号化候補をビットストリーム生成器２０５へと出力する。
このように，該符号長計算／選択器２０４では，残差信号だけでなく，残差信号及び「予測係数を特定する情報」とを合わせて構成された符号化候補を最小とするものを選択する構成であるため，本実施形態によれば，前記予測器２０２毎に異なる符号長の予測係数が適用され，前記予測器２０２毎に「予測係数の特定する情報」の符号長が異なる構成であっても，出力される符号化候補を最小とする前記予測器２０２を選択することが可能となる。
その結果，特に前記予測器２０２での予測精度を向上させるべく予測係数の候補に種々選択肢を持たせ，それら予測係数を特定できる情報が可変長になった場合にも，「予測係数を特定する情報」の符号長を加味した上で最適（つまりは，圧縮率が最も高い）な予測器を選択することが可能となる。
【００１５】
（ビットストリーム生成器２０５）
続いて，前記符号長計算／選択器１０４で選択された一つの符号化候補は，ビットストリーム生成器２０５でビットストリームとしてパッキングされた後，出力端子２０６から出力される。
ここに，前記ビットストリーム生成器２０５によりパッキングされたビットストリームの一例を図５に示す。尚，同図に示すビットストリームＥは，チャンネル数が２（ステレオ）のＰＣＭデータから生成されたビットストリームの一例を示す。
同図に示す如く，前記ビットストリームＥは，ファイルヘッダ６０８と，それに続くフレームデータの２つに大別される。更に，前記フレームデータはフレーム毎にフレームデータ（１）６０９，フレームデータ（２）６１０，フレームデータ（３）６１１，・・（以下，フレームデータ（１）６０９により代表する）に分けられる。
先ず，前記ファイルヘッダ６０８の構成要素について説明する。
該ファイルヘッダ６０８は，更にヘッダ６０１と先頭サンプル値６０２，６０３とに分けられる。
前記ヘッダ６０１は，例えば，ビットストリーム（ＰＣＭデータ）全体を司る情報，例えばサンプリングレート，チャンネル数，平均ビットレート等の情報が含まれる。
また，前記先頭サンプル値６０２，６０３には，Ｌｃｈ用（６０２）とＲｃｈ用（６０３）の夫々の先頭サンプル値が格納される。尚，この先頭サンプル値６０２，６０３はデコードする最初の１フレームを復元するために必要であり，少なくとも予測係数αｎの次数（すなわちｎ）分を各チャンネル毎に確保してあればよい。若しくは，線形予測のために必要な過去のサンプルの初期値をエンコーダ，デコーダ共に０とするなどして予測させるようにすれば，先頭サンプル値６０２，６０３は無くてもよい。このように，該ファイルヘッダ６０８を構成する前記ヘッダ６０１及び前記先頭サンプル値６０２，６０３は，固定長である。
次に，前記フレームデータ（１）６０９の構成要素について説明する。
前記フレームデータ（１）６０９は，更に予測係数情報６０４，６０６と残差信号情報６０５，６０７とに分けられる。
前記予測係数情報６０４，６０６は，先に説明した「予測係数を特定する情報」であり，このビットストリームＥを復号化する際に用いられる。該予測係数情報６０４，６０６に基づいて，ビットストリームＥからＰＣＭデータを復号する装置（音声復号化装置）については後述する。
また，前記残差信号情報６０５，６０７は，残差信号を符号化して得られた符号である。このように，該フレームデータ（１）６０９を構成する前記予測係数情報６０４，６０６及び前記残差信号情報６０５，６０７は両者とも可変長である。
ここで，図５ではチャンネル数２（ステレオ）を例にしているため，Ｌｃｈに対応するデータ（つまりは，６０４と６０５））と，Ｒｃｈに対応する組（つまりは，６０６と６０７）と，によって一つのフレームデータ（１）６０９が構成される。尚，各情報の並び順，或いはチャンネル数は図５示す例に限定されず，任意の形態が可能であることは言うまでもない。
【００１６】
次に，前記音声符号化装置Ａにより生成されたビットストリームを取得し，復号化可能な音声復号化装置の一例について，図３を参照しつつ，説明する。
以下に，図３に示す音声復号化装置Ｃに入力されたビットストリームが復号化され，ＰＣＭデータとして出力されるまでの各部の処理について，処理の流れに沿って説明する。
【００１７】
先ず，前記音声復号化装置Ｃに入力されたビットストリームは，入力端子５０１を介してビットストリーム解読器５０２に入力される。
該ビットストリーム解読器５０２では，ビットストリームのセグメントを解読して各信号成分毎に分解された後，それら信号成分の振り分けが行われる。
つまり，同図に示す如く，先頭サンプル値（図５に示す６０２，６０３）はバッファ５０４および予測器５０３に振り分けられ，ＰＣＭデータの一部（先頭データ）として出力される。
また，前記予測係数情報（図５に示す６０４，６０６）は予測係数形成部５０５に振り分けられ，予測器５０３に適用する予測係数を特定するために用いられる。
具体的には，本実施形態に係る前記音声符号化装置Ａを用い，ＰＣＭデータを符号化する際に，前記予測器２０２（図１参照）に適用された予測係数の特定を行う。つまり，前記予測係数情報に含まれる前記予測器識別子及びそれに付随するデータ部分（図４参照）に基づいて，メモリ部５０９に記憶しておいた１フレーム前の予測係数５０６（前記予測器２０２−１に適用される予測係数２１１に該当）、予測係数テーブル５０７に予め記憶された予測係数（前記予測器２０２−３に適用される予測係数２０９’に該当）、或いは前記予測係数情報のデータ部分として送信される線形予測係数２０９のいずれかが選択される。尚，この予測係数情報はフレームデータ毎に取得されるものであり，各フレームデータ毎にその符号化（予測）に適用された予測係数が適宜選択される。
かかる手順により前記予測器５０３に適用する予測係数を選択することで，その予測係数は，ＰＣＭデータを前記音声符号化する際に前記予測器２０２（図１参照）に適用された予測係数と同一にすることが可能となる。
そして，前記予測器５０３の出力信号と，残差信号情報（図５に示す６０５，６０７）とを加算することで元のＰＣＭデータが復号され，その復号されたＰＣＭデータをバッファ５０４へ順次転送し，該バッファ５０４の出力信号を出力端子５０８を介して出力することで，ＰＣＭデータの復号化が完了する。
このように，当該音声復号化装置Ｃにおいては，前記音声符号化装置Ａの逆の手順に従って元のＰＣＭデータをロスレス復号化することが可能である。
尚，当該音声復号化装置Ｃは，図１で説明した前記音声符号化装置Ａにおける前記バッファ２０１と対応させるべく前記バッファ５０４を設けた形態としたが，該バッファ５０４は不可欠な構成要素ではなく，該バッファ５０４で順次バッファリングすることなく，復号されたＰＣＭデータを順次出力する構成としてもよい。但し，上述の符号化の手順において説明したように，前記符号化装置Ａにおける前記バッファ２０１において各チャンネル間の相関を利用した処理（例えば，２ｃｈの音声信号におけるＬｃｈ＋Ｒｃｈ，或いはＬｃｈ−Ｒｃｈ）が実施される場合には，該バッファ５０４において逆処理を実施する必要がある。
【００１８】
【実施例】
上述説明した図１示す実施形態では，前記予測器２０３−３に適用する予測係数を前記予測係数テーブル２１０から選択するに当たり，前記線形予測分析器２０７で算出された前記線形予測係数２０７を基にベクトル量子化する手法について説明している。
しかしながら，前記予測係数テーブル２１０から一つの予測係数を選択する手法はそれに限定されるものではない。
例えば，図３に示す実施例は，予測係数テーブル４１３（前記予測係数テーブル２１０に該当）に記憶された予測係数から一つを選択するに当たり，上述実施形態とは異なる手法を適用したものである。
ここでは，当該実施例と上述の実施形態との異なる部分だけを抽出して説明する。
前記実施形態と較べ，当該実施例で増加した（異なる）のは予備選択ユニット４０７である。
ここで，該予備選択ユニット４０７とは，前記予測係数テーブル４１３から読み出される予測係数４１８−１，４１８−２，・・，４１８−ｎが夫々適用される予測器４０８−１，４０８−２，・・，４０８−ｎと，該予測器４０８からの出力信号とバッファ４０１から入力されるサンプルデータとの間の残差信号を算出する減算器４１６−１，４１６−２，・・，４１６−ｎと，該減算器４１６により算出された残差信号に基づいて（つまりは残差信号を最小とする）前記予測器から一つを選択する予備選択器４０９と，該予備選択器４０９により選択された残差信号及び該残差信号の算出に使用された予測信号を予測する際に適用された「予測係数（４１８−１，４１８−２，・・，４１８−ｎ）を特定する情報」を符号化する符号器４１０と，を具備して概略構成される。
このような構成により，前記予備選択ユニット４０７では，前記予測係数テーブル４１３に記録された予測係数のうち，最も残差信号を小さくし得る予測係数を選択すると共に，該予測係数を適用して予測した予測信号に基づいて前記減算器４１６により残差信号を算出し，しかる後，前記符号器４１０により残差信号及び「予測係数を特定する情報」を符号化することで，最適な（つまりは残差信号を最小とする）符号化候補を算出することができる。
尚，本予備選択ユニット４０７内に限って考えると，各予測器４０８間の「予測係数を特定する情報」は，前記予測係数テーブル４１３のテーブルインデックスが該当するため，その符号長は同一である。従って，上述実施形態の如く，各予測器４０８毎に符号化器を設け，符号化された残差信号及び「予測係数を特定する情報」を最小とする予測係数を選択するよう構成する必要はなく，従来公知の技術の如く，前記減算器４１６で算出された残差信号を最小とする予測係数を選択するよう構成できる。かかる構成とすれば，本予備選択ユニット４０７に設ける符号器を符号器４１０のみとすることが可能となり，構成の簡単化を図ることが可能となる。
尚，該予備選択ユニット４０７により選択された符号化候補が符号長計算／選択器４０４に入力された後の処理は上述同様であるため，ここでは省略する。
更に，本実施例では，前記予備選択器４０９において複数の符号化候補から１つの（つまりは，残差信号が最小である）符号化候補を予備選択する例を示しているが，複数の符号化候補を予備選択する構成であってもよい。例えば，複数の予備候補選択としては，残差信号が小さい順に複数通り予備選択するなどが有効な手段である。
【００１９】
【発明の効果】
以上説明したように，本発明によれば，予測器に適用される予測係数の候補に種々選択肢を持たせる（異なる予測係数を予測器に適用する）ことが可能となり，音声信号の予測精度を向上させることが可能となり，その結果として，符号化効率（圧縮率）を高めることができる。
【図面の簡単な説明】
【図１】本発明の実施形態に係る音声符号化装置の概略構成を示すブロック図。
【図２】本発明の別の実施形態に係る音声符号化装置の概略構成を示すブロック図。
【図３】本発明の実施形態に係る音声符号化装置により生成されたビットストリームを復号化する音声復号化装置の概略構成を示すブロック図。
【図４】ビットストリーム中の予測係数情報の符号長を説明する図。
【図５】ビットストリームの構成を模式的に示す図。
【図６】音声信号の一例を示す図。
【図７】音声信号における振幅毎の出現頻度を示す図。
【図８】予測残差信号における振幅毎の出現頻度を示す図。
【符号の説明】
Ａ…音声符号化装置
Ｂ…音声符号化装置
Ｃ…音声復号化装置
２０１…バッファ
２０２…予測器
２０３…符号器
２０４…符号長計算／選択器
２０５…ビットストリーム生成器
２１０…予測係数テーブル
２１２…減算器
２１３…メモリ部
４０１…バッファ
４０２…予測器
４０３…符号器
４０４…符号長計算／選択器
４０５…ビットストリーム生成器
４０７…予備選択ユニット
４０８…予測器
４０９…予備選択器
４１０…符号器
４１６…減算器
４１３…予測係数テーブル
４１５…減算器
４１７…メモリ部
５０２…ビットストリーム解読器
５０３…予測器
５０４…バッファ
５０５…予測係数形成部
５０７…予測係数テーブル
５０９…メモリ部

Claims

入力される音声信号を可逆符号化する音声符号化装置において，
入力される前記音声信号を所定サンプル数毎に取得するサンプル取得手段と，
複数の予測係数が適用され，夫々の前記予測係数により過去の前記音声信号から現在の前記音声信号の予測信号を予測する予測手段と，
前記予測手段により予測された夫々の予測信号と前記サンプル取得手段で取得された所定サンプル数の前記音声信号との間の残差信号を算出する残差信号算出手段と，
前記残差信号算出手段により算出された前記残差信号及び該残差信号の算出に使用された前記予測信号を予測する際に適用された前記予測係数を特定する情報とを符号化する符号化手段と，
前記符号化手段により符号化された前記残差信号及び前記予測係数を特定する情報の符号長に基づいて，複数の前記予測手段のうち一つを選択する予測選択手段と，
を具備してなることを特徴とする音声符号化装置。
前記予測手段における予測係数には，前記サンプル取得手段で取得された所定サンプル数の前記音声信号から線形予測分析により計算された予測係数が含まれてなる請求項１に記載の音声符号化装置。
前記予測手段における予測係数には，前記サンプル取得手段で取得された所定サンプル数の前記音声信号から線形予測分析により計算された予測係数を基にベクトル量子化した予測係数が含まれてなる請求項１に記載の音声符号化装置。
前記予測手段における予測係数には，前記予測選択手段により過去に選択された前記予測係数が含まれてなる請求項１に記載の音声符号化装置。
入力される音声信号を可逆符号化する音声符号化方法において，
入力される前記音声信号を所定サンプル数毎に取得するサンプル取得工程と，
複数の予測係数が適用される複数の予測手段により，過去の前記音声信号から現在の前記音声信号の予測信号を予測する予測工程と，
複数の前記予測手段で予測された夫々の予測信号と前記サンプル取得工程により取得された所定サンプル数の前記音声信号との間の残差信号を算出する残差信号算出工程と，
前記残差信号算出工程により算出された前記残差信号及び該残差信号の算出に使用された前記予測信号を予測する際に適用された前記予測係数を特定する情報とを符号化する符号化工程と，
前記符号化工程により符号化された前記残差信号及び前記予測係数を特定する情報の符号長に基づいて，複数の前記予測手段のうち一つを選択する予測選択工程と，
を具備してなることを特徴とする音声符号化方法。