JP3804968B2

JP3804968B2 - 適応配分式符号化・復号装置及び方法

Info

Publication number: JP3804968B2
Application number: JP50471795A
Authority: JP
Inventors: デビットソン、グランド・アレン; トッド、クレグ・キャンベル; ディビス、マーク・フランクリン; リンク、ブライアン・ディビット; フィルダー、ルイス・ダン
Original assignee: Dolby Laboratories Licensing Corp
Current assignee: Dolby Laboratories Licensing Corp
Priority date: 1993-07-16
Filing date: 1994-07-14
Publication date: 2006-08-02
Anticipated expiration: 2021-08-02
Also published as: CA2164964A1; US5632003A; ATE147908T1; AU677856B2; JPH09500772A; DE69401512D1; DE69401512T2; SG47116A1; SG54317A1; CA2164964C; DK0709004T3; ES2097057T3; AU7362194A; WO1995002928A1; EP0709004B1; EP0709004A1

Description

技術分野
本発明は、概して音声情報のような情報の低ビットレート符号化及び復号に関する。特に本発明は、高品質低ビットレート符号化システムにとって有効な情報の適応ビット配分及び量子化に関する。
背景
オーディオ信号及びビデオ信号処理業界においては、信号品質上の知覚できる損失なしに、信号を表すのに必要な情報量を最低にすることに多大な関心がある。情報要件を減らすことによって、通信チャンネル及び記憶媒体に対する信号の情報容量要件は低下する。
より少ない２進ビットで符号化されたデジタル信号は、信号を表すために多数のビット数を用いた符号化信号より低い情報容量要件を与える。もちろん、知覚される信号品質を劣化させることなく実現できる低減の量には限界がある。
デジタル信号の各サンプルを表すのに利用できるビット数は、符号化された信号サンプルによって信号表現の精度を設定する。より低いビットレートは、各サンプルを表すのにより少ないビットが利用できることを意味する。従って、より低いビットレートは、より大きな量子化の誤り、すなわち、量子化誤差を意味する。多くの用途において量子化誤差は量子化雑音として表され、量子化雑音は、誤差がかなりの大きさである場合符号化信号の本来的品質を劣化させるであろう。
各種の分割帯域符号化技術は、各種の心理知覚効果を利用することによって知覚的劣化なしに情報要件を低下させることを試みている。例えば、オーディオ用では、人の聴覚系は周波数分析特性を示し、これは中心周波数の関数として変わる可変中心周波数を有する非対称に調整されたフィルタ特性と類似している。別個の音を感知する人の聴覚系の能力は、概して音間の周波数差が増加するにつれて増加する。しかし、人の聴覚系の分解能は、上記フィルタの帯域幅未満の周波数差に対しては一定のままである。このように人の聴覚系の分解能は、全オーディオスペクトルを通してこれらのフィルタの帯域幅により変化する。この様な聴覚フィルタの有効帯域幅は『限界帯域』を指す。限界帯域内の優勢信号は、当該限界帯域外の周波数における他の信号を隠蔽するよりは恐らく当該限界帯域内の任意の場所にある他の信号の可聴性を隠蔽するであろう。『オーディオ・エンジニアリング・ハンドブック』（K.Blair Benson ed.,McGraw-Hill,1988,1.40-1.42及び4.8-4.10ページ）参照。
有効な信号帯域幅を、人の聴覚系の限界帯域に近似した帯域幅を有する、周波数帯域に分割するオーディオ分割帯域符号化技術は、広帯域技術より心理音響効果をより良く利用できる。概念的にこのような分割帯域符号化技術は、フィルタバンクで信号帯域を分割し、各フィルタ帯域を通過した信号の情報要件を低減させて信号劣化が丁度聴取できない程度になるようにし、逆処理で原信号のレプリカ（写し）を再構成することからなる。この様な２つの技術は小帯域（サブバンド）符号化及び変換符号化である。オーディオ小帯域コーダ及び変換コーダは、特定の周波数帯域において情報要件を低減させることができ、そこでは結果的に生じる量子化雑音は、符号化された信号の本来的品質を劣化させることなく、隣接スペクトル成分によって心理音響的に隠蔽される。
小帯域コーダは、デジタルフィルタを備えたフィルタバンクを利用する各種のデジタル技術を任意に用いることができる。このようなコーダでは、信号サンプルから成る入力信号はデジタルフィルタのバンクを通過する。フィルタバンクにおいてそれぞれのフィルタを通過した各小帯域信号は、当該小帯域フィルタの帯域幅に応じてさらにサンプルが抜き出される。各小帯域信号は、入力信号スペクトルの一部を表すサンプルから成る。
デジタル変換コーダは、デジタルフィルタバンクを提供するために、任意に各種のいわゆる時間領域対周波数領域変換を用いることができる。信号サンプルから成る入力信号は、濾波（フィルタリング）に先立って、『信号サンプルブロック』に区分される。変換から得られる個々の係数又は共にグループ化される２以上の隣接係数が、個々の変換係数帯域幅の合計である有効帯域幅を有する『小帯域』を定める。
以下の記載を通して、『分割帯域コーダ』の用語は、小帯域コーダ、変換コーダ及び有効な信号帯域幅の各部分で作動する他の分割符号化技術を指すものとする。『小帯域』の用語は、真の小帯域コーダ、変換コーダ又は他の技術によって提供されるかどうかに関わらず、有効信号帯域幅のこれらの部分を指すものとする。
『小帯域情報』の用語は、分割帯域で濾波された有効な信号帯域幅を横切るスペクトルエネルギの表現を指す。『小帯域情報ブロック』の用語は、所与の時間間隔又は時間ブロックに対する小帯域情報を指す。デジタルフィルタバンクによって提供される小帯域コーダに対しては、小帯域情報ブロックは所与の時間間隔に亘る全小帯域信号のサンプルの組（セット）から成る。変換コーダに対しては、小帯域情報ブロックは信号サンプルブロックに相当する全変換係数の組からなる。
上記の通り、心理音響的原理を用いる多くの分割帯域コーダは、小帯域情報を発生させるために入力信号にフィルタバンクを適用し、小帯域情報の各要素に割り当てられたビット数を用いて各要素を量子化して、心理音響的隠蔽効果により結果的に生じる量子化雑音を聞こえないようにし、量子化された情報を伝送又は記憶に適する形にアセンブルすることによって低ビットレートにおいて高品質符号化を与える。
相補的な分割帯域コーダが、符号化された信号から量子化情報を抽出し、小帯域情報を得るために量子化された情報を逆量子化し、原入力信号のレプリカを発生させるために小帯域情報に逆フィルタバンクを適用することによって、原入力信号のレプリカを回復させる。
小帯域情報の各要素を量子化するために割り当てられるビット数は、小帯域情報の正確な逆量子化を可能にするためにデコーダにより利用されなければならない。『順方向適応』エンコーダは、明確な配分（割当て）情報、すなわち、副情報をデコーダに伝える。『逆方向適応』エンコーダは、デコーダが、符号化された信号自体から配分情報を決められるようにするために、明確なものよりはむしろ内在的情報を伝える。
一実施態様において逆方向適応オーディオエンコーダは、入力信号スペクトル包絡線の推定値を作り、包絡線推定値に配分関数を適用し、包絡線推定値の要素を位取り因子として用いてオーディオ情報を基準化、すなわち、位取りし、設定された配分情報に従って位取りした情報を量子化し、量子化された情報及び包絡線推定値を符号化情報にアセンブルする。逆方向適応デコーダは、符号化された信号から包絡線推定値及び量子化された情報を抽出し、エンコーダで用いたものと同一は配分ファンクション（関数）を包絡線推定値に適用することによって配分情報を設定し、量子化された情報を逆量子化し、オーディオ情報の基準化を逆転させる。基準化（位取り）は情報のダイナミックレンジを増大させるのに用いられ、これは量子化に利用できる限られた数のビットによって表すことができる。逆方向適応エンコーダ・デコーダシステムの２つの例が米国特許第4,790,016及び5,109,417に開示されている。
一方においては、副情報を伝えるビットが不要なので、逆方向適応技術は多くの低ビットレート符号化システムで魅力がある。デコーダは、配分情報を再構成するために配分ファクション、すなわち、配分関数を用いる。
他方において、順方向適応技術は多くの高品質符号化システムで魅力がある。その理由は、配分情報を設定するためにデコーダは配分ファンクションを実行する必要がないからである。その結果、順方向適応デコーダは電算的に複雑さが緩和され、デコーダによって行われる配分関数を制限することは全く必要ない。逆方向適応システムにおいてエンコーダは、デコーダによって用いられたものと同一若しくは少なくとも厳密に同等な配分関数を用いなければならず、さもなければデコーダの正確な量子化は保証されない。それゆえに、順方向適応符号化システムにおいてエンコーダは、現存のデコーダとの両立性を維持することを何等考慮せずに改良された配分関数を組入れることができる。
逆方向適応システムにおいては、デコーダの複雑さに対するあらゆる制約が、通常エンコーダ及びデコーダの双方に対する配分関数の複雑さに制限を与え、それによってエンコーダ・デコーダシステムの総合性能を制限する。しかし、順方向適応システムはこの制限を回避できる。その理由は、デコーダでは配分関数が必要ないからである。すなわち、エンコーダで用いられる配分関数については、自由にデザイン選択を行うことができる。
エンコーダの配分関数を向上させる能力は重要である。技術進歩によりデジタル計算のコストが低下するにつれて、高性能の配分関数が経済的にますます実用されている。配分関数を高性能化することによって、所与の信号品質に対してビットレートを低下させるか若しくは所与のビットレートに対して信号品質を高めることができる。配分関数を向上させる能力は、逆方向適用システムにおいては本質的に不可能であるが、順方向適応システムにおいては少なくとも理論的には可能である。それにもかかわらずこの能力は、各種の順方向適応システムにおいて厳しく制限される。配分関数の向上を厳しく制限する順方向適応音声符号化システムの例が、EP 0,141,520に開示されている。開示された音声エンコーダは、３つのビット配分パターンの中から選ばれた計画の指標を副情報として選択してデコーダへ伝える。３つの配分パターンのすべてがデコーダに知らされていなければならず、それによってデコーダを通して副情報から適切な配分パターンを得ることができるようにしている。一方においてこの符号化技術は、配分情報を伝えるのに要する副情報の量を大いに低減させるが、他方においては、デコーダに知られている３つのパターンの１つを発生させる配分関数のみにエンコーダを限定する。上記のような完全な配分情報を明示的に伝える順方向適応システムは、配分関数の向上面でかなりの自由度を与えることができる。
しかし、この利点に拘らず順方向適応符号化システムは多くの低ビットレート用途において不適当である。その理由は同システムが副情報を伝えるためにかなりのビット数を要するからである。概して、配分関数を通してスペクトルをより狭い帯域、従って、より多い帯域に分割することによって符号化性能を改良しようとするにつれて、副情報を伝えるためにさらに多くのビットが必要になる。さらに、この副情報を伝えるために要するビット数は、符号化された信号の残部を伝えるのに要するビット数が改良された符号化技術より低下するにつれて、符号化された信号のより大きな割合に相当するであろう。
発明の開示
本発明の目的は、低ビットレートの高品質符号化・復号システムを提供することにある。同システムにおいては、現存のデコーダとの両立性を失うことなくエンコダの配分関数を変えることが可能で、しかも明示的配分情報を伝えるために最小比率の符号化信号しか必要としない。
エンコーダの第１実施態様における本発明の教示によれば、小帯域情報を発生させるために、フィルタバンクは入力信号を複数の小帯域に分割し、変換器は第１語及び第２語から成る小帯域情報の表現を発生させる。第１語に応答して、配分関数を通して各々が１以上の第２語と関連した１組の基本配分値を入手する。アダプタは、オーディオ情報、小帯域情報、第１語において検知した特性に応答して、それぞれの基本配分値に対応する１以上の改変された配分値を発生させる。量子化装置は、関連した基本配分値又はもしあれば対応する改変値のいずれかと等しいビット数を用いて、各第２語を量子化情報（量子化された第２語）に量子化する。フォーマッタは、第１語、量子化情報及び改変配分値の指標から成る副情報を伝送又は記憶に適したフォーマットにアセンブルする。
第２実施態様においては、入力信号、小帯域情報、第１語のいずれかに応答して、アダプタが、配分関数の結果に影響するパラメータを改変する。この実施態様では、基本配分値がさらに改変されることはない。改変されたパラメータの指標から成る副情報は、フォーマット出力にアセンブルされる。
本発明の教示によるエンコーダのさらなる実施態様が可能であり、同実施態様は上記２つの実施態様の組合せを組入れた実施態様等を含む。例えば、第２実施態様で述べたような配分関数に影響するパラメータを改変することが可能で、さらに入力信号、小帯域情報、第１語内で検知した特性に応答して、結果的に生じた基本配分値をさらに改変することができる。
デコーダの第１実施態様における本発明の教示によれば、デフォーマッタは符号化された信号を第１語、量子化された語及び量子化された語を量子化するのに用いた改変された配分値の標識から成る副情報に逆アセンブルする。配分関数により第１語に応答して１組の基本配分値が入手され、同配分値においては各値が１以上の量子化された語に関連づけられる。１以上の基本配分値は、逆アセンブルされた信号から得られる改変された値によって改変される。逆量子化装置は、関連した基本配分値又はもしあれば対応する改変された値のいずれかと等しいビット数を用いて、量子化された語を第３語に逆量子化する。逆変換器は、第１語及び第３語に応答して小帯域情報を発生させ、逆フィルタは、小帯域情報に応答して符号化された信号によって表される入力信号のレプリカである出力信号を入手する。
第２実施態様においては、配分関数の結果に影響を与える改変されたパラメータが逆アセンブルされた信号から得られる。この実施態様では、基本配分値がさらに改変されることはない。
本発明の教示によるデコーダのさらなる実施態様が可能であり、同実施態様は上記２つの実施態様の組合せを組入れた実施態様等を含む。例えば、配分関数の結果に影響する改変されたパラメータ及び各基本配分値を改変するための改変された値は、共にそれぞれ第１及び第２実施態様で述べた通り逆アセンブルされた信号から得られる。
本発明の実施上決定的な特別の配分関数はない。例えば、本発明を組入れた単一及び多重チャンネルエンコーダ・デコーダシステムは、参照によりそのすべてを本明細書に組入れた、米国特許第5,109,417号及び5,222,189号記載のような配分関数を用いることができる。単一チャンネルシステムに適した他の配分関数は、参照によりそのすべてを本明細書に組入れた、米国特許第4,790,016号に開示されている。同様に多重チャンネルシステムは、参照によりそのすべてを本明細書に組入れた、国際特許公報第WO 92/12607号に開示されている。
本発明を組込んだ符号化システムでは、副情報は改変された配分値、パラメータを伝えることのみを必要とする。エンコーダ及びデコーダの双方に知られている基本配分関数は、デコーダに基本配分情報を与える。副情報は、エンコーダで用いられるものと同一の配分情報を得るのに必要な基本配分情報の調節に備える。こんな風に、現存のデコーダとの両立性を失うことなくエンコーダの配分関数を向上させることが可能で、副情報を通してエンコーダ及びデコーダ間の両立性を維持するのに必要なビット数が最小にされる。
本発明は、幾つかの技術のうちの任意のものによって実施される分割帯域コーダで用いることができる。変換符号化システムの実施においては、Princen及びBradleyの『時間領域エイリアシング相殺に基づく分析・合成フィルタバンクデザイン』（IEEE Trans.on Acoust.,Speech,Signal Proc.vol.ASSP-34,1986,pp.1153-1161）に開示された時間領域エイリアシング相殺（TDAC）変換を用いるのが望ましい。TDAC変換を用いる変換エンコーダ・デコーダシステムの例は、すでに言及した米国特許第5,109,417号に記載されている。
人間の聴覚系限界帯域幅と釣り合った帯域幅を持つ小帯域を用いることで心理音響的効果をより多く利用することができるが、本発明の教示はそのような用途限定されないことを理解すべきである。従って、ここで用いる『小帯域』等の用語は、入力信号の有効帯域幅以内の１以上の周波数帯域を意味するものと解釈すべきである。
本発明の各種の特徴及び好ましい実施態様は、同一要素には同一の参照番号を付した添付図と共に以下の記載を参照することにより良く理解されるよう。以下の記載及び図面の内容は例としてのみ示したもので、本発明の範囲を限定するものと理解すべきではない。
【図面の簡単な説明】
図１は、順方向適応配分を組入れたエンコーダ・デコーダシステムにおけるエンコーダの一実施態様を示す構成図である。
図２は、順方向適応配分を組入れたエンコーダ・デコーダシステムにおけるデコーダの一実施態様を示す構成図である。
図３は、順方向適応配分を組入れたエンコーダ・デコーダシステムにおけるエンコーダの他の実施態様を示す構成図である。
図４は、逆方向適応配分を組入れたエンコーダ・デコーダシステムにおけるエンコーダの一実施態様を示す構成図である。
図５は、逆方向適応配分を組入れたエンコーダ・デコーダシステムにおけるデコーダの一実施態様を示す構成図である。
図６は、ハイブリッド適応配分を組入れたエンコーダ・デコーダシステムにおけるエンコーダの一実施態様を示す構成図である。
図７は、ハイブリッド適応配分を組入れたエンコーダ・デコーダシステムにおけるデコーダの一実施態様を示す構成図である。
発明の実行モード
順方向適応配分
図１は、順方向適応配分を組入れたエンコーダ・デコーダシステムにおいて用いられる分割帯域エンコーダの基本的構成を例示する。フィルタバンク１０２は路１００から受信した入力信号に応答して小帯域情報を発生させる。配分関数１１０は入力信号に応答して配分情報を設定し、路１１１を通して同配分情報を量子化装置１０４及びフォーマッタ１０６へ伝える。量子化装置１０４は、配分情報によって特定されたビット数を用いてフィルタバンク１０２から受信した小帯域情報を量子化し、フォーマッタ１０６は、量子化された小帯域情報及び配分情報を伝送又は記憶に適したフォーマットを有する符号化された信号にアセンブルする。量子化信号は、路１０８を通して所望の伝送又は記憶装置へ伝えられる。
図２は、順方向適応配分を組入れたエンコーダ・デコーダシステムにおいて用いられる分割帯域デコーダの基本的構成を例示する。デフォーマッタ２０２は、量子化された情報及び配分情報を路２００から受信した符号化された信号から抽出する。配分情報は路２１１を通して逆量子化装置２０４へ伝えられる。逆量子化装置２０４は、デフォーマッタ２０２から受信した量子化された情報を逆量子化することによって小帯域情報を発生させる。同情報は、配分情報によって特定されたビット数を用いて逆量子化される。逆フィルタバンク２０６は、逆量子化装置２０４から受信した逆量子化小帯域情報に応答して路２０８を通して出力信号２０８を発生させる。
エンコーダ及びデコーダの代わりの実施態様が可能である。例えば、図３に示す通り、順方向適応エンコーダは、フィルタバンク１０２によって発生された小帯域情報に応答して配分情報を設定することができる。図示していないさらに他の実施態様においては、配分情報は、入力信号及び小帯域情報の双方に応答して設定することができる。
上記の通り、配分情報は符号化された信号に明示的に伝えられるので、順方向適応エンコーダにおける配分関数は、現存の順方向適応デコーダとの両立性を犠牲にすることなく変えることができる。
逆方向適応配分
図４は、逆方向適応配分を組入れたエンコーダ・デコーダシステムで用いられる分割帯域エンコーダの一実施態様の基本構成を示す。フィルタバンク１０２は、路１００から受信した入力信号に応答して小帯域情報を発生させる。変換器１１２は、第１語及び第２語から成る小帯域情報の表現を発生させる。第１語は、入力として路１１３を通して配分関数１１０及びフォーマッタ１０６へ伝えられる。配分関数１１０は、第１語に応答して配分情報を設定し、同配分情報を量子化装置１０４へ伝える。量子化装置１０４は、配分情報によって特定されたビット数を用いて、路１１５から受信した第２語を量子化することによって量子化された情報を発生させ、フォーマッタ１０６は、量子化された情報及び第１語を伝送又は記憶に適したフォーマットを有する符号化された信号にアセンブルする。符号化された信号は路１０８を通して所望の伝送チャンネル又は記憶装置へ伝えられる。
図５は、逆方向適応配分を組入れたエンコーダ・デコーダシステムで用いられる分割帯域デコーダの一実施態様の基本構成を例示する。デフォーマッタ２０２は、路２００から受信した符号化された信号から量子化された情報情報及び第１語を抽出する。同第１語は、路２０３を通して配分関数２１０へ伝えられる。配分関数２１０は、第１語に応答して配分情報を設定し、同配分情報を逆量子化装置２０４へ伝える。逆量子化装置２０４は、デフォーマッタ２０２から受信した量子化された情報を逆量子化することによって第３語を発生させる。同第３語は、配分情報によって特定されたビット数を用いて逆量子化される。逆変換器２１２は、第１語及び第３語に応答して小帯域女王を発生させ、逆フィルタバンク２０６は、逆変換器２１２から受信した小帯域情報に応答して路２０８を通して出力信号を発生させる。
逆方向適応符号化システムは、符号化された信号内の副情報を伝えるのに要するオーバーヘッドを避けることができる。その理由は、配分情報が符号化信号内にアセンブルされた第１語によって明示的に表されているからである。逆方向適応デコーダは、先に逆方向適応エンコーダで行われた同一配分関数を実行することによって第１語から配分情報を回復することができる。符号化信号の正確な復号は、エンコーダ及びデコーダ配分関数それ自体が同一であることは要しないが、正確な復号は、もし２つの関数が同一組の第１語に応答して同一の配分情報を得られる場合にのみ保証し得るということを理解すべきである。
ハイブリッド適応配分
図６は、本発明の教示によるハイブリッド適応配分を組入れたエンコーダ・デコーダシステムで用いられる分割帯域エンコーダの一実施態様の基本構成を例示する。この実施態様の構成及び作動は、上記図４で例示した逆方向適応エンコーダの構成及び作動の関係で記載する。アダプタ１２０は、２つの基本的技術の１つ又は双方を用いて配分関数１１０によって設定された配分情報の１以上の値を改変する。双方の技術を実行するのに用いられる構成は、図６に例示するが、いずれか一方の技術のみを用いることができる。
第１又は『パラメータ』技術においては、アダプタ１２０が配分関数１１０の結果に影響する１以上のパラメータを改変する。アダプタ１２０によって与えられた改変されたパラメータは、路１２３を通して関数１１０及びフォーマッタ１０６へ伝えられる。フォーマッタ１０６は、改変されたパラメータ及び量子化された情報の表示を、伝送及び記憶に適したフォーマットを有する符号化された情報にアセンブルする。
第２又は『値』技術においては、アダプタ１２０が配分情報の各々の値に対する１以上の新しい値を改変する。アダプタ１２０によって与えられた改変値は、路１２１を通してフォーマッタ１０６及びマージ１１８へ伝えられる。マージ１１８は、改変値を配分関数１１０から受信した配分情報と併合し、併合した配分情報を量子化装置１０４へ伝える。フォーマッタ１０６は、改変された情報及び量子化された情報の表示を、伝送及び記憶に適したフォーマットを有する符号化された信号にアセンブルする。
図６に例示する実施態様は、路１００から受信した入力信号、路１０３から受信した小帯域情報及び路１１３から受信した第１語に応答するアダプタ１２０を示す。ハイブリッド適応エンコーダの代わりの実施態様においては、アダプタ１２０は３つの路の任意の１つに応答し、３つの路の任意の組合わせに応答し、他の情報に応答することができる。
図７は、本発明の教示によるハイブリッド適応配分を組入れたエンコーダ・デコーダシステムで用いられる分割帯域デコーダの一実施態様の基本構成を例示する。この実施態様の構成及び作動は、上記図５で例示した逆方向適応デコーダの構成及び作動の関係で記載する。配分情報の１以上の値が、上記のものと同様な基本的技術の１つ又は双方のいずれかを用いて改変される。双方の技術を実行するのに用いる構成は図７に例示するが、いずれか一方の技術のみを用いることができる。
第１又は『パラメータ』技術においては、デフォーマッタ２０２が、符号化された信号から、配分関数２１０の結果に影響する１以上の改変されたパラメータを抽出し、路２１３を通して改変パラメータを配分関数２１０へ伝える。
第２又は『値』技術においては、デフォーマッタ２０２が、符号化された信号から１以上の改変された値を抽出し、路２０５を通して改変値をマージ２１８へ伝える。マージ２１８は、改変値を配分関数２１０から受信した配分情報と併合し、併合された配分値を逆量子化装置２０４へ伝える。
実施
図６及び７に例示した幾つかの要素は、広範な各種の形で実施できる。例えば、フィルタバンク１０２及び逆フィルタバンク２０６は、直角位相ミラーフィルタ、多相フィルタ、フーリエ変換、上記のTDAC変換等、当業界で知られた各種のデジタルフィルタ技術によって実施できる。本発明の実施にとって決定的な特定な技術はない。本発明の上記記載は、特に分割符号化用途に向けられているが、本発明はさらに広帯域符号化にも適用できることを理解すべきである。
同様に第１語及び第２語を発生させかつ回復させる変換器１１２及び逆変換器２１２も、広範な各種の形で実施できる。既に述べた通り、第１語は、配分関数を知らせるためにエンコーダ及びデコーダの双方で利用できる。概して第１語は、位取り因子に相当し、第２語は、位取り因子にに従って位取りされた値に相当するであろう。各種の数量の浮動小数点表示を用いる実施態様においては、第１語は、浮動小数点指数に相当し、第２語は、浮動小数点仮数に相当するであろう。
配分関数１１０及び２１０によって与えられる特定な処理は、本発明の実施上決定的ではない。既に述べた通り、２つの関数は同一である必要はないが、同一のパラメータを前提とすれば、同一組の第１語に応答して同一の配分情報を得るものでなければならない。各種の配分関数を組入れた符号化システムの幾つかの例が、上記米国に開示されている。順方向適応及び逆方向適応のさらなる例が、米国特許第4,142,071、4,455,649、4,896,362、5,157,760、及び5,166,686号に開示されている（参照することによってこれらのすべてを全面的に併合する）。当業界では他の多くの例が知られている。
各種の配分関数によって得られた結果は各種のパラメータによって影響される。この様なパラメータは、用いられた特殊な配分関数に依存する。それゆえに完全な表は不可能である。選ばれた特殊なパラメータは、本発明の実施上決定的ではないが、概念を説明する上で幾つかの例が助けとなるであろう。
例えば、小帯域情報を浮動小数点フォーマットで表す実施態様においては、浮動小数点指数の一次関数であるビット数を配分することによって、スペクトル振幅で各6dBの増加に対して追加のビットを配分することができる。その代わりに、２、３、又は４でそれぞれ除した指数の一次関数として配分することによって振幅で各12、18、又は24dBの増加に対して追加のビットを配分することができる。指数の除数は、この特殊な配分関数の結果に影響する一パラメータの例である。
各種の心理知覚効果に基づく配分関数を用いる分割帯域システムにおいては、基礎的心理知覚モデルに影響する任意のパラメータは、配分関数を適応させるために改変することができる。例えば、オーディオ符号化用途においてこの様なパラメータは、１）隠蔽（マスキング）音の上方又は下方の心理音響的隠蔽のレベル又は程度、２）所与の周波数および隠蔽成分間の差の関数としての心理音響的隠蔽しきい値の形状、３）多重チャンネルシステムにおけるチャンネル間隠蔽のレベル、４）入力信号の帯域幅、５）周波数の関数として小帯域情報に配分する最小ビット数および６）周波数の関数として配分する最大ビット数を含む。
適応量子化装置は当業界では周知である。量子化装置１０４および２０４によって用いられる特殊な量子化関数は決定的ではないが、２つの関数は同一結果を生じさせるべきである。例えば、量子化関数は、線形又は非線形若しくは対称又は非対称でよい。
マージ１１８および２１８で用いられる方法は、本発明にとって決定的ではない。概念上各要素は、配分情報値の組および改変された値の組からの値に相当する一組の値に併合される。これは各種の方法で行なってもよい。
例えば、配分情報値は、相当する改変された値によって置き換えてもよい。分割帯域エンコーダの実施態様において各配分情報値は、それぞれの小帯域において小帯域情報を量子化するのに用いるビット数を表す。各改変値は、対応する配分情報に取って代わり、その代わり量子化装置によって用いられる。
他の例として配分情報値は、それを対応する改変値と組合わせることによって改変してもよい。すなわち、改変された値は増分量を表し、その量だけ対応する配分情報値が変化されなければならない。上記の模範的分割帯域実施態様を続けると、特定の小帯域において小帯域情報を量子化するのに用いられるビット数は、それぞれの配分情報値及び、もし存在するなら、対応する改変された値の代数和によって定められる。その代わりに、改変値は、対応する配分情報値がそれによって位取りされるべき因子を表してもよい。
アダプタ１２０は、配分処理を適応させるために『パラメータ』技術及び『値』技術の一方又は双方を用いることができる。パラメータ技術は、既に述べたような配分の結果に影響する１以上のパラメータを改変することを伴う。値技術は、配分関数かから得られる配分情報値と併合される１以上の改変された値を発生させることを伴う。
いずれかの技術を実施するのに用いられる特定の処理は、本発明の実施にとって決定的ではない。一手法は、代わりの配分関数を実行し、代わりの関数の結果を基本配分関数１１０から得られる『基本値』と比較し、代わりの値とそれぞれの基本値との間の差が優位な場合には各代わりの値に対する改変された値を形成することからなる。基本配分関数の複雑性は、デコーダを単純化するように制限できるが、代わりの配分関数は所望のものと同じくらい複雑であってもよい。例えば、オーディオ符号化用途において代わりの関数は、より高性能な心理音響的モデルを用いてもよい。すなわち、モデルは、入力信号スペクトルの平坦さのような信号特性、入力信号の平坦又はピーク振幅及び隠蔽成分が音状か若しくは雑音状のいずれかであるかに対する配慮を含む。
他の模範的な適応処理は、完全な配分関数を実行することを避け、単に各種の信号特性の検知に応答して基本配分値に対する調節手段を発生させるのみである。例えば、検知される音状隠蔽成分に応答して基本配分値が増加されるか若しくはほぼ平坦な入力信号スペクトルを検知することに応答して基本配分値が低減されるようにしてもよい。
以上記載した通り、アダプタ１２０は、入力信号、フィルタバンク１０２から得られる小帯域情報、変換器１１２から得られる第１語又は特定の用途に有意な他のあらゆる情報に応答してもよい。
例えば、長距離電話網用の符号化システムにおいてアダプタ１２０は、日付、時刻及び曜日情報に応答してビット配分を低減させる配分関数を与えるようにし、それによって電話網を通した通話料の予報された増加を予想して、より低い情報要件をより高い忠実度符号化に対して兼ね合わせる。
例えば、デジタルビデオ表示システムにおいてアダプタ１２０は、オペレータ入力に応答する配分関数を与え、それによってオペレータは、より高い画像解像度に対してより短い表示応答時間を釣り合わせることを可能にしてもよい。
このような例が示すようにアダプタ１２０は、特定の用途で望まれるあらゆる情報に応答してもよい。この情報の選択は、本発明の実施上決定的ではない。
符号化された信号が一連のビットで表される多くの符号化システムにおいて、フォーマッタ１０８及びデフォーマッタ２０２によって与えられる関数は、それぞれ一連のマルチプレクス（多重送信）及びデマルチプレクスにほぼ対応する。フォーマット及びデフォーマット関数の実施は、特定の用途に対しては重要であるかも知れないが、それは本発明の実施上決定的ではない。すなわち、符号化され信号を伝送又は記憶に適した形にすることが可能でかつフォーマットされた表現から符号化信号を回復できるあらゆる処理が適している。
本発明は、広範な各種の技術によって実施される多くの実施態様内で実施できることを理解すべきである。
上記の記載はとくにオーディオ符号化用途に向けられているが、本発明はビデオのような広範囲の符号化用途で実施することができる。

Claims

入力信号を符号化するエンコーダであって、
前記入力信号に応答して該入力信号のスペクトル構成を表す小帯域情報を発生させる小帯域装置１０２、１１２と、
前記小帯域情報に含まれる第１語に配分関数を適用することによって複数の基本配分値を設定するビット配分装置１１０であって、前記複数の基本配分値の各々が前記小帯域情報に含まれる１つ又はそれ以上の第２語と関連するビット配分装置と、
少なくとも前記入力信号、前記小帯域情報、前記第１語及び前記複数の基本配分値の１つに応答して、前記複数の基本配分値の各値に対応する１つ又はそれ以上の改変された配分値を発生させる適応装置１２０と、
前記複数の基本配分値又はもしあるならば対応する改変された配分値のいずれかと等しいビット数を用いて、前記第２語の各々を量子化することによって量子化された情報を発生させる量子化装置１０４、１１８と、
前記第１語、前記量子化情報及び前記改変された配分値の表示を含む副情報を、伝送又は記憶に適した形にアセンブルするフォーマット装置１０６とから成るエンコーダ。
入力信号を符号化するエンコーダであって、
前記入力信号に応答して該入力信号のスペクトル構成を表す小帯域情報を発生させる小帯域装置１０２、１１２と、
前記小帯域情報に含まれる第１語に配分関数を適用することによって、各々が１つ又はそれ以上の前記小帯域情報に含まれる第２語と関連した複数の配分値を設定するビット配分装置１１０であって、前記配分関数の結果が１つ又はそれ以上のパラメータによって影響される配分装置と、
前記入力信号、前記小帯域情報、前記第１語及び前記複数の配分値の少なくとも１つに応答して、１つ又はそれ以上の前記パラメータを改変させることによって１つ又はそれ以上の改変されたパラメータを発生させる装置１２０と、
前記複数の配分値の関連した１つと等しいビット数を用いて、前記第２語の各々を量子化することによって量子化された情報を発生させる量子化装置１０４と、
前記第１語、前記量子化情報及び前記１つ又はそれ以上の改変されたパラメータの表示から成る副情報を、伝送又は記憶に適した形にアセンブルするフォーマット装置１０６とから成るエンコーダ。
前記小帯域装置が、前記小帯域情報の浮動小数点記号を発生させ、前記第１語が浮動小数点指数を表し、前記第２語が浮動小数点仮数を表す、請求項１又は２のエンコーダ。
前記第１語が位取り因子を表し、前記第２語が前記位取り因子によって位取りされる値を表す、請求項１又は２のエンコーダ。
前記第１語が前記入力信号のスペクトル包絡線を表す、請求項１乃至４のいずれか１つのエンコーダ。
前記配分関数が心理音響原理に基づき、該配分関数の結果が、隠蔽成分より上方及び下方の周波数における隠蔽の程度、隠蔽を達成する隠蔽成分を有する周波数差に対する信号対雑音比の関数、チャンネル間隠蔽のレベル、周波数の関数として小帯域情報に配分する最少、最大ビット数に関係する１つ又はそれ以上のパラメータによって影響される、請求項１乃至５のいずれか１つのエンコーダ。
前記適応装置が、１つ又はそれ以上の前記複数の基本配分値に関して差を表す、改変された配分値を発生させる、請求項１又は３乃至６のいずれか１つのエンコーダ。
前記適応装置が、代わりの配分関数を実行することによって前記１つ又はそれ以上の改変された配分値を得る、請求項１又は３乃至７のいずれか１つのエンコーダ。
前記代わりの配分関数が、前記入力信号スペクトルの平坦さ、該入力信号の振幅及び隠蔽成分が音状か又は雑音状かどうかの中のいずれに基づく、請求項８のエンコーダ。
前記１つ又はそれ以上の改変された配分値の表示が、前記１つ又はそれ以上の改変された配分値の大きさの表現から成る、請求項１又は３乃至９のいずれか１つのエンコーダ。
前記１つ又はそれ以上の改変された配分値の表示が、前記１つ又はそれ以上の改変された配分値と各々の基本配分値との差の表現から成る、請求項１又は３乃至９のいずれか１つのエンコーダ。
前記１つ又はそれ以上の改変されたパラメータの表示が、前記１つ又はそれ以上の改変されたパラメータと、それぞれの改変されていないパラメータとの間の差の表現から成る、請求項２又は請求項２と組み合った請求項３乃至６のいずれか１つのエンコーダ。
符号化された情報を復号するデコーダであって、
前記符号化された情報を、第１語と、量子化された第２語と、１つ又はそれ以上の改変された配分値から成る副情報とに逆アセンブルするデフォーマット装置２０２と、
前記第１語に配分関数を適用することによって、各々が１つ又はそれ以上の前記量子化された第２語と関連した複数の基本配分値を設定するビット配分装置２１０と、
前記関連した複数の基本配分値の１つと等しいビット数から構成されるか又は、もしあれば、各々の改変された配分値から得られる、前記量子化された第２語を逆量子化することによって第３語を発生させる逆量子化装置２０４、２１８と、
前記第１語及び第３語から成る小帯域情報に応答して、前記符号化された情報によって表される情報のレプリカを発生させる逆小帯域装置２０６、２１２とから成るデコーダ。
符号化された情報を復号するデコーダであって、
前記符号化された情報を第１語と、量子化された第２語と、１つ又はそれ以上の改変されたパラメータから成る副情報とに逆アセンブルするデフォーマット装置２０２と、
前記第１語に配分関数を適用することによって、各々が１つ又はそれ以上の前記量子化された第２語と関連した複数の配分値を設定するビット配分装置２１０であって、前記配分関数の結果が、もしあれば、前記１つ又はそれ以上の改変されたパラメータによって影響されるビット配分装置と、
前記複数の配分値の関連した１つと等しいビット数から前記量子化された第２語を逆量子化することによって第３語を発生させる逆量子化装置２０４と、
前記第１語及び第３語から成る小帯域情報に応答して、前記符号化された情報によって表される情報のレプリカを発生させる逆小帯域装置２０６、２１２とから成るデコーダ。
前記第１語が浮動小数点指数を表し、前記第２語が浮動小数点仮数を表す、請求項１３又は１４のデコータ。
前記第１語が位取り因子を表し、前記第２語が前記位取り因子によって位取りされた値を表す、請求項１３又は１４のデコーダ。
前記第１語が前記入力信号のスペクトル包絡線を表す、請求項１３乃至１６のいずれか１つのデコーダ。
前記配分関数が心理音響原理に基づき、該配分関数の結果が、隠蔽成分より上方及び下方の周波数における隠蔽の程度と、隠蔽を達成する隠蔽成分を有する周波数差に対する信号対雑音比の関数と、チャンネル間隠蔽のレベルと、周波数の関数として小帯域情報に配分される最少ビット数、最大ビット数に関係する１つ又はそれ以上のパラメータとによって影響される、請求項１３乃至１７のいずれか１つのデコーダ。
前記１つ又はそれ以上の改変された配分値の表示が、前記１つ又はそれ以上の改変された配分値の大きさの表現から成る、請求項１３又は１５乃至１８のいずれか１つのデコーダ。
前記１つ又はそれ以上の改変された配分値の表示が、前記１つ又はそれ以上の改変された配分値と各々の基本配分値との差の表現から成る、請求項１３又は１５乃至１８のいずれか１つのデコーダ。
前記１つ又はそれ以上の改変されたパラメータの表示が、前記１つ又はそれ以上の改変されたパラメータと、それぞれの改変されていないパラメータとの間の表現から成る、請求項１４又は１５乃至１８のいずれか１つのデコーダ。
入力信号を符号化する符号化方法であって、
該入力信号のスペクトル構成を表す小帯域情報を発生させ、
前記小帯域情報に含まれる第１語に配分関数を適用することによって複数の基本配分値を設定し、前記複数の基本配分値の各々が前記小帯域情報に含まれる１つ又はそれ以上の第２語と関連するようにさせ、
前記入力信号、前記小帯域情報、前記第１語及び前記複数の基本配分値の少なくとも１つに応答して、前記複数の基本配分値の各値に対応する１つ又はそれ以上の改変された配分値を発生させ、
前記複数の基本配分値の関連した１つと等しいか又は、もしあれば、改変された配分値に相当するビット数を用いて前記第２語の各々を量子化することによって量子化された情報を発生させ、
前記第１語、前記量子化された情報及び前記改変された配分値の表示から成る副情報を、伝送又は記憶に適した形にアセンブルすることから成る符号化方法。
入力信号を符号化する符号化方法であって、
該入力信号のスペクトル構成を表す小帯域情報を発生させ、
前記小帯域情報に含まれる第１語に配分関数を適用することによって複数の配分値を設定し、前記複数の配分値の各々が前記小帯域情報に含まれる１つ又はそれ以上の第２語と関連し、前記配分関数の結果が１つ又はそれ以上のパラメータによって影響されるようにし、
前記入力信号、前記小帯域情報、前記第１語及び前記複数の配分値の少なくとも１つに応答して、前記パラメータの１つ又はそれ以上を改変することによって１つ又はそれ以上の改変されたパラメータを発生させ、
前記複数の配分値と関連した１つのと等しいビット数を用いて、前記第２語の各々を量子化することによって量子化された情報を発生させ、
前記第１語、前記量子化情報及び前記１つ又はそれ以上の改変されたパラメータの表示から成る副情報を、伝送又は記憶に適した形にアセンブルすることから成る符号化方法。
前記小帯域情報を発生させることで、前記小帯域情報の浮動小数点記号を発生させ、前記第１語が浮動小数点指数を表し、前記第２語が浮動小数点仮数を表すようにする、請求項２２又は２３の方法。
前記第１語が位取り因子を表し、前記第２語が前記位取り因子によって位取りされた値を表す、請求項２２又は２３の方法。
前記第１語が前記入力信号のスペクトル包絡線を表す、請求項２２乃至２５のいずれか１つの方法。
前記配分関数が心理音響原理に基づき、該配分関数の結果が、隠蔽成分より上方及び下方の周波数における隠蔽の程度、隠蔽を達成する隠蔽成分を有する周波数差に対する信号対雑音比の関数、チャンネル間隠蔽のレベル、周波数の関数として小帯域情報に配分する最少、最大ビット数と関連する１つ又はそれ以上のパラメータによって影響される、請求項２２乃至２６のいずれか１つの方法。
前記１つ又はそれ以上の改変された配分値を発生させることが、１つ又はそれ以上の前記複数の基本配分値に関して差を表す改変された配分値を発生させる、請求項２２又は２４乃至２７のいずれか１つの方法。
前記１つ又はそれ以上の改変された配分値を発生させることで、代わりの配分関数を実行することによって代わりの配分値を発生させる、請求項２２又は２４乃至２８のいずれか１つの方法。
前記代わりの配分関数が、前記入力信号スペクトルの平坦さ、該入力信号の振幅及び隠蔽成分が音状か又は雑音状かどうかの中の任意のものに基づく、請求項２９の方法。
前記１つ又はそれ以上の改変された配分値の前記表示が、前記１つ又はそれ以上の改変された配分値の大きさの表現から成る、請求項２２又は２４乃至３０のいずれか１つの方法。
前記１つ又はそれ以上の改変された配分値の表示が、該１つ又はそれ以上の改変された配分値と各々の基本配分値との差の表現から成る、請求項２２又は２４乃至３０のいずれか１つの方法。
１つ又はそれ以上の改変されたパラメータの前記表示が、前記１つ又はそれ以上の改変されたパラメータ及びそれぞれの改変されていないパラメータ間の差を表す表現を含む、請求項２３又は２４乃至２７のいずれか１つの方法。
符号化された情報を復号する復号方法であって、
前記符号化された情報を、第１語、量子化された第２語及び１つ又はそれ以上の改変された配分値の表示から成る副情報に逆アセンブルし、
前記第１語に配分関数を適用することによって複数の基本配分値を設定し、前記複数の基本配分値の各々が前記量子化された１つ又はそれ以上の第２語と関連するようにし、
前記複数の基本配分値のうち前記関連がなされたものと等しいビット数、又は、もしあれば、各改変された配分値から得られるビット数から、前記量子化された第２語を逆量子化することによって第３語を発生させ、
前記第１語及び第３語から成る小帯域情報に応答して、前記符号化された情報によって表される情報のレプリカを発生させることから成る復号方法。
符号化された情報を復号する復号方法であって、
前記符号化された情報を、第１語、量子化された第２語及び１つ又はそれ以上の改変されたパラメータから成る副情報に逆アセンブルし、
前記第１語に、配分関数を適用することによって複数の配分値を設定し、前記複数の配分値の各々が、前記量子化された第２語の１つ又はそれ以上と関連するようにし、前記配分関数の結果が、もしあれば、前記１つ又はそれ以上の改変されたパラメータによって影響されるようにし、
前記複数の配分値のうち前記関連がなされたものと等しいビット数から成る前記量子化された第２語を逆量子化することによって第３語を発生させ、
前記第１語及び第３語から成る小帯域情報に応答して、前記符号化された情報によって表される情報のレプリカを発生させることから成る復号化方法。
前記第１語が浮動小数点指数を表し、前記第２語が浮動小数点仮数を表す、請求項３４又は３５の方法。
前記第１語が位取り因子を表し、前記第２語が前記位取り因子によって位取りされた値を表す、請求項３４又は３５の方法。
前記第１語が前記入力信号のスペクトル包絡線を表す、請求項３４乃至３７のいずれか１つの方法。
前記配分関数が心理音響原理に基づき、該配分関数の結果が、隠蔽成分より上方及び下方の周波数における隠蔽の程度、隠蔽を達成する隠蔽成分を用いた周波数差に対する信号対雑音比の関数、チャンネル間隠蔽のレベル、周波数の関数として小帯域情報に配分する最少、最大ビット数に関係する１つ又はそれ以上のパラメータによって影響される、請求項３４乃至３８のいずれか１つの方法。
前記１つ又はそれ以上の改変された配分値の表示が、前記１つ又はそれ以上の改変された配分値の大きさの表現から成る、請求項３４又は３６乃至３９のいずれか１つの方法。
前記１つ又はそれ以上の改変された配分値の表示が、該１つ又はそれ以上の改変された配分値と各々の基本配分値との差の表現から成る、請求項３４又は３６乃至３９のいずれか１つの方法。
前記１つ又はそれ以上の改変されたパラメータが、該１つ又はそれ以上の改変されたパラメータ及びそれぞれの改変されていないパラメータ間の差を表す表現を含む、請求項３５又は請求項３５と組み合った３６乃至３９のいずれか１つの方法。