JP3804968B2 - 適応配分式符号化・復号装置及び方法 - Google Patents
適応配分式符号化・復号装置及び方法 Download PDFInfo
- Publication number
- JP3804968B2 JP3804968B2 JP50471795A JP50471795A JP3804968B2 JP 3804968 B2 JP3804968 B2 JP 3804968B2 JP 50471795 A JP50471795 A JP 50471795A JP 50471795 A JP50471795 A JP 50471795A JP 3804968 B2 JP3804968 B2 JP 3804968B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- information
- allocation
- modified
- values
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/665—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/667—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
Description
本発明は、概して音声情報のような情報の低ビットレート符号化及び復号に関する。特に本発明は、高品質低ビットレート符号化システムにとって有効な情報の適応ビット配分及び量子化に関する。
背景
オーディオ信号及びビデオ信号処理業界においては、信号品質上の知覚できる損失なしに、信号を表すのに必要な情報量を最低にすることに多大な関心がある。情報要件を減らすことによって、通信チャンネル及び記憶媒体に対する信号の情報容量要件は低下する。
より少ない2進ビットで符号化されたデジタル信号は、信号を表すために多数のビット数を用いた符号化信号より低い情報容量要件を与える。もちろん、知覚される信号品質を劣化させることなく実現できる低減の量には限界がある。
デジタル信号の各サンプルを表すのに利用できるビット数は、符号化された信号サンプルによって信号表現の精度を設定する。より低いビットレートは、各サンプルを表すのにより少ないビットが利用できることを意味する。従って、より低いビットレートは、より大きな量子化の誤り、すなわち、量子化誤差を意味する。多くの用途において量子化誤差は量子化雑音として表され、量子化雑音は、誤差がかなりの大きさである場合符号化信号の本来的品質を劣化させるであろう。
各種の分割帯域符号化技術は、各種の心理知覚効果を利用することによって知覚的劣化なしに情報要件を低下させることを試みている。例えば、オーディオ用では、人の聴覚系は周波数分析特性を示し、これは中心周波数の関数として変わる可変中心周波数を有する非対称に調整されたフィルタ特性と類似している。別個の音を感知する人の聴覚系の能力は、概して音間の周波数差が増加するにつれて増加する。しかし、人の聴覚系の分解能は、上記フィルタの帯域幅未満の周波数差に対しては一定のままである。このように人の聴覚系の分解能は、全オーディオスペクトルを通してこれらのフィルタの帯域幅により変化する。この様な聴覚フィルタの有効帯域幅は『限界帯域』を指す。限界帯域内の優勢信号は、当該限界帯域外の周波数における他の信号を隠蔽するよりは恐らく当該限界帯域内の任意の場所にある他の信号の可聴性を隠蔽するであろう。『オーディオ・エンジニアリング・ハンドブック』(K.Blair Benson ed.,McGraw-Hill,1988,1.40-1.42及び4.8-4.10ページ)参照。
有効な信号帯域幅を、人の聴覚系の限界帯域に近似した帯域幅を有する、周波数帯域に分割するオーディオ分割帯域符号化技術は、広帯域技術より心理音響効果をより良く利用できる。概念的にこのような分割帯域符号化技術は、フィルタバンクで信号帯域を分割し、各フィルタ帯域を通過した信号の情報要件を低減させて信号劣化が丁度聴取できない程度になるようにし、逆処理で原信号のレプリカ(写し)を再構成することからなる。この様な2つの技術は小帯域(サブバンド)符号化及び変換符号化である。オーディオ小帯域コーダ及び変換コーダは、特定の周波数帯域において情報要件を低減させることができ、そこでは結果的に生じる量子化雑音は、符号化された信号の本来的品質を劣化させることなく、隣接スペクトル成分によって心理音響的に隠蔽される。
小帯域コーダは、デジタルフィルタを備えたフィルタバンクを利用する各種のデジタル技術を任意に用いることができる。このようなコーダでは、信号サンプルから成る入力信号はデジタルフィルタのバンクを通過する。フィルタバンクにおいてそれぞれのフィルタを通過した各小帯域信号は、当該小帯域フィルタの帯域幅に応じてさらにサンプルが抜き出される。各小帯域信号は、入力信号スペクトルの一部を表すサンプルから成る。
デジタル変換コーダは、デジタルフィルタバンクを提供するために、任意に各種のいわゆる時間領域対周波数領域変換を用いることができる。信号サンプルから成る入力信号は、濾波(フィルタリング)に先立って、『信号サンプルブロック』に区分される。変換から得られる個々の係数又は共にグループ化される2以上の隣接係数が、個々の変換係数帯域幅の合計である有効帯域幅を有する『小帯域』を定める。
以下の記載を通して、『分割帯域コーダ』の用語は、小帯域コーダ、変換コーダ及び有効な信号帯域幅の各部分で作動する他の分割符号化技術を指すものとする。『小帯域』の用語は、真の小帯域コーダ、変換コーダ又は他の技術によって提供されるかどうかに関わらず、有効信号帯域幅のこれらの部分を指すものとする。
『小帯域情報』の用語は、分割帯域で濾波された有効な信号帯域幅を横切るスペクトルエネルギの表現を指す。『小帯域情報ブロック』の用語は、所与の時間間隔又は時間ブロックに対する小帯域情報を指す。デジタルフィルタバンクによって提供される小帯域コーダに対しては、小帯域情報ブロックは所与の時間間隔に亘る全小帯域信号のサンプルの組(セット)から成る。変換コーダに対しては、小帯域情報ブロックは信号サンプルブロックに相当する全変換係数の組からなる。
上記の通り、心理音響的原理を用いる多くの分割帯域コーダは、小帯域情報を発生させるために入力信号にフィルタバンクを適用し、小帯域情報の各要素に割り当てられたビット数を用いて各要素を量子化して、心理音響的隠蔽効果により結果的に生じる量子化雑音を聞こえないようにし、量子化された情報を伝送又は記憶に適する形にアセンブルすることによって低ビットレートにおいて高品質符号化を与える。
相補的な分割帯域コーダが、符号化された信号から量子化情報を抽出し、小帯域情報を得るために量子化された情報を逆量子化し、原入力信号のレプリカを発生させるために小帯域情報に逆フィルタバンクを適用することによって、原入力信号のレプリカを回復させる。
小帯域情報の各要素を量子化するために割り当てられるビット数は、小帯域情報の正確な逆量子化を可能にするためにデコーダにより利用されなければならない。『順方向適応』エンコーダは、明確な配分(割当て)情報、すなわち、副情報をデコーダに伝える。『逆方向適応』エンコーダは、デコーダが、符号化された信号自体から配分情報を決められるようにするために、明確なものよりはむしろ内在的情報を伝える。
一実施態様において逆方向適応オーディオエンコーダは、入力信号スペクトル包絡線の推定値を作り、包絡線推定値に配分関数を適用し、包絡線推定値の要素を位取り因子として用いてオーディオ情報を基準化、すなわち、位取りし、設定された配分情報に従って位取りした情報を量子化し、量子化された情報及び包絡線推定値を符号化情報にアセンブルする。逆方向適応デコーダは、符号化された信号から包絡線推定値及び量子化された情報を抽出し、エンコーダで用いたものと同一は配分ファンクション(関数)を包絡線推定値に適用することによって配分情報を設定し、量子化された情報を逆量子化し、オーディオ情報の基準化を逆転させる。基準化(位取り)は情報のダイナミックレンジを増大させるのに用いられ、これは量子化に利用できる限られた数のビットによって表すことができる。逆方向適応エンコーダ・デコーダシステムの2つの例が米国特許第4,790,016及び5,109,417に開示されている。
一方においては、副情報を伝えるビットが不要なので、逆方向適応技術は多くの低ビットレート符号化システムで魅力がある。デコーダは、配分情報を再構成するために配分ファクション、すなわち、配分関数を用いる。
他方において、順方向適応技術は多くの高品質符号化システムで魅力がある。その理由は、配分情報を設定するためにデコーダは配分ファンクションを実行する必要がないからである。その結果、順方向適応デコーダは電算的に複雑さが緩和され、デコーダによって行われる配分関数を制限することは全く必要ない。逆方向適応システムにおいてエンコーダは、デコーダによって用いられたものと同一若しくは少なくとも厳密に同等な配分関数を用いなければならず、さもなければデコーダの正確な量子化は保証されない。それゆえに、順方向適応符号化システムにおいてエンコーダは、現存のデコーダとの両立性を維持することを何等考慮せずに改良された配分関数を組入れることができる。
逆方向適応システムにおいては、デコーダの複雑さに対するあらゆる制約が、通常エンコーダ及びデコーダの双方に対する配分関数の複雑さに制限を与え、それによってエンコーダ・デコーダシステムの総合性能を制限する。しかし、順方向適応システムはこの制限を回避できる。その理由は、デコーダでは配分関数が必要ないからである。すなわち、エンコーダで用いられる配分関数については、自由にデザイン選択を行うことができる。
エンコーダの配分関数を向上させる能力は重要である。技術進歩によりデジタル計算のコストが低下するにつれて、高性能の配分関数が経済的にますます実用されている。配分関数を高性能化することによって、所与の信号品質に対してビットレートを低下させるか若しくは所与のビットレートに対して信号品質を高めることができる。配分関数を向上させる能力は、逆方向適用システムにおいては本質的に不可能であるが、順方向適応システムにおいては少なくとも理論的には可能である。それにもかかわらずこの能力は、各種の順方向適応システムにおいて厳しく制限される。配分関数の向上を厳しく制限する順方向適応音声符号化システムの例が、EP 0,141,520に開示されている。開示された音声エンコーダは、3つのビット配分パターンの中から選ばれた計画の指標を副情報として選択してデコーダへ伝える。3つの配分パターンのすべてがデコーダに知らされていなければならず、それによってデコーダを通して副情報から適切な配分パターンを得ることができるようにしている。一方においてこの符号化技術は、配分情報を伝えるのに要する副情報の量を大いに低減させるが、他方においては、デコーダに知られている3つのパターンの1つを発生させる配分関数のみにエンコーダを限定する。上記のような完全な配分情報を明示的に伝える順方向適応システムは、配分関数の向上面でかなりの自由度を与えることができる。
しかし、この利点に拘らず順方向適応符号化システムは多くの低ビットレート用途において不適当である。その理由は同システムが副情報を伝えるためにかなりのビット数を要するからである。概して、配分関数を通してスペクトルをより狭い帯域、従って、より多い帯域に分割することによって符号化性能を改良しようとするにつれて、副情報を伝えるためにさらに多くのビットが必要になる。さらに、この副情報を伝えるために要するビット数は、符号化された信号の残部を伝えるのに要するビット数が改良された符号化技術より低下するにつれて、符号化された信号のより大きな割合に相当するであろう。
発明の開示
本発明の目的は、低ビットレートの高品質符号化・復号システムを提供することにある。同システムにおいては、現存のデコーダとの両立性を失うことなくエンコダの配分関数を変えることが可能で、しかも明示的配分情報を伝えるために最小比率の符号化信号しか必要としない。
エンコーダの第1実施態様における本発明の教示によれば、小帯域情報を発生させるために、フィルタバンクは入力信号を複数の小帯域に分割し、変換器は第1語及び第2語から成る小帯域情報の表現を発生させる。第1語に応答して、配分関数を通して各々が1以上の第2語と関連した1組の基本配分値を入手する。アダプタは、オーディオ情報、小帯域情報、第1語において検知した特性に応答して、それぞれの基本配分値に対応する1以上の改変された配分値を発生させる。量子化装置は、関連した基本配分値又はもしあれば対応する改変値のいずれかと等しいビット数を用いて、各第2語を量子化情報(量子化された第2語)に量子化する。フォーマッタは、第1語、量子化情報及び改変配分値の指標から成る副情報を伝送又は記憶に適したフォーマットにアセンブルする。
第2実施態様においては、入力信号、小帯域情報、第1語のいずれかに応答して、アダプタが、配分関数の結果に影響するパラメータを改変する。この実施態様では、基本配分値がさらに改変されることはない。改変されたパラメータの指標から成る副情報は、フォーマット出力にアセンブルされる。
本発明の教示によるエンコーダのさらなる実施態様が可能であり、同実施態様は上記2つの実施態様の組合せを組入れた実施態様等を含む。例えば、第2実施態様で述べたような配分関数に影響するパラメータを改変することが可能で、さらに入力信号、小帯域情報、第1語内で検知した特性に応答して、結果的に生じた基本配分値をさらに改変することができる。
デコーダの第1実施態様における本発明の教示によれば、デフォーマッタは符号化された信号を第1語、量子化された語及び量子化された語を量子化するのに用いた改変された配分値の標識から成る副情報に逆アセンブルする。配分関数により第1語に応答して1組の基本配分値が入手され、同配分値においては各値が1以上の量子化された語に関連づけられる。1以上の基本配分値は、逆アセンブルされた信号から得られる改変された値によって改変される。逆量子化装置は、関連した基本配分値又はもしあれば対応する改変された値のいずれかと等しいビット数を用いて、量子化された語を第3語に逆量子化する。逆変換器は、第1語及び第3語に応答して小帯域情報を発生させ、逆フィルタは、小帯域情報に応答して符号化された信号によって表される入力信号のレプリカである出力信号を入手する。
第2実施態様においては、配分関数の結果に影響を与える改変されたパラメータが逆アセンブルされた信号から得られる。この実施態様では、基本配分値がさらに改変されることはない。
本発明の教示によるデコーダのさらなる実施態様が可能であり、同実施態様は上記2つの実施態様の組合せを組入れた実施態様等を含む。例えば、配分関数の結果に影響する改変されたパラメータ及び各基本配分値を改変するための改変された値は、共にそれぞれ第1及び第2実施態様で述べた通り逆アセンブルされた信号から得られる。
本発明の実施上決定的な特別の配分関数はない。例えば、本発明を組入れた単一及び多重チャンネルエンコーダ・デコーダシステムは、参照によりそのすべてを本明細書に組入れた、米国特許第5,109,417号及び5,222,189号記載のような配分関数を用いることができる。単一チャンネルシステムに適した他の配分関数は、参照によりそのすべてを本明細書に組入れた、米国特許第4,790,016号に開示されている。同様に多重チャンネルシステムは、参照によりそのすべてを本明細書に組入れた、国際特許公報第WO 92/12607号に開示されている。
本発明を組込んだ符号化システムでは、副情報は改変された配分値、パラメータを伝えることのみを必要とする。エンコーダ及びデコーダの双方に知られている基本配分関数は、デコーダに基本配分情報を与える。副情報は、エンコーダで用いられるものと同一の配分情報を得るのに必要な基本配分情報の調節に備える。こんな風に、現存のデコーダとの両立性を失うことなくエンコーダの配分関数を向上させることが可能で、副情報を通してエンコーダ及びデコーダ間の両立性を維持するのに必要なビット数が最小にされる。
本発明は、幾つかの技術のうちの任意のものによって実施される分割帯域コーダで用いることができる。変換符号化システムの実施においては、Princen及びBradleyの『時間領域エイリアシング相殺に基づく分析・合成フィルタバンクデザイン』(IEEE Trans.on Acoust.,Speech,Signal Proc.vol.ASSP-34,1986,pp.1153-1161)に開示された時間領域エイリアシング相殺(TDAC)変換を用いるのが望ましい。TDAC変換を用いる変換エンコーダ・デコーダシステムの例は、すでに言及した米国特許第5,109,417号に記載されている。
人間の聴覚系限界帯域幅と釣り合った帯域幅を持つ小帯域を用いることで心理音響的効果をより多く利用することができるが、本発明の教示はそのような用途限定されないことを理解すべきである。従って、ここで用いる『小帯域』等の用語は、入力信号の有効帯域幅以内の1以上の周波数帯域を意味するものと解釈すべきである。
本発明の各種の特徴及び好ましい実施態様は、同一要素には同一の参照番号を付した添付図と共に以下の記載を参照することにより良く理解されるよう。以下の記載及び図面の内容は例としてのみ示したもので、本発明の範囲を限定するものと理解すべきではない。
【図面の簡単な説明】
図1は、順方向適応配分を組入れたエンコーダ・デコーダシステムにおけるエンコーダの一実施態様を示す構成図である。
図2は、順方向適応配分を組入れたエンコーダ・デコーダシステムにおけるデコーダの一実施態様を示す構成図である。
図3は、順方向適応配分を組入れたエンコーダ・デコーダシステムにおけるエンコーダの他の実施態様を示す構成図である。
図4は、逆方向適応配分を組入れたエンコーダ・デコーダシステムにおけるエンコーダの一実施態様を示す構成図である。
図5は、逆方向適応配分を組入れたエンコーダ・デコーダシステムにおけるデコーダの一実施態様を示す構成図である。
図6は、ハイブリッド適応配分を組入れたエンコーダ・デコーダシステムにおけるエンコーダの一実施態様を示す構成図である。
図7は、ハイブリッド適応配分を組入れたエンコーダ・デコーダシステムにおけるデコーダの一実施態様を示す構成図である。
発明の実行モード
順方向適応配分
図1は、順方向適応配分を組入れたエンコーダ・デコーダシステムにおいて用いられる分割帯域エンコーダの基本的構成を例示する。フィルタバンク102は路100から受信した入力信号に応答して小帯域情報を発生させる。配分関数110は入力信号に応答して配分情報を設定し、路111を通して同配分情報を量子化装置104及びフォーマッタ106へ伝える。量子化装置104は、配分情報によって特定されたビット数を用いてフィルタバンク102から受信した小帯域情報を量子化し、フォーマッタ106は、量子化された小帯域情報及び配分情報を伝送又は記憶に適したフォーマットを有する符号化された信号にアセンブルする。量子化信号は、路108を通して所望の伝送又は記憶装置へ伝えられる。
図2は、順方向適応配分を組入れたエンコーダ・デコーダシステムにおいて用いられる分割帯域デコーダの基本的構成を例示する。デフォーマッタ202は、量子化された情報及び配分情報を路200から受信した符号化された信号から抽出する。配分情報は路211を通して逆量子化装置204へ伝えられる。逆量子化装置204は、デフォーマッタ202から受信した量子化された情報を逆量子化することによって小帯域情報を発生させる。同情報は、配分情報によって特定されたビット数を用いて逆量子化される。逆フィルタバンク206は、逆量子化装置204から受信した逆量子化小帯域情報に応答して路208を通して出力信号208を発生させる。
エンコーダ及びデコーダの代わりの実施態様が可能である。例えば、図3に示す通り、順方向適応エンコーダは、フィルタバンク102によって発生された小帯域情報に応答して配分情報を設定することができる。図示していないさらに他の実施態様においては、配分情報は、入力信号及び小帯域情報の双方に応答して設定することができる。
上記の通り、配分情報は符号化された信号に明示的に伝えられるので、順方向適応エンコーダにおける配分関数は、現存の順方向適応デコーダとの両立性を犠牲にすることなく変えることができる。
逆方向適応配分
図4は、逆方向適応配分を組入れたエンコーダ・デコーダシステムで用いられる分割帯域エンコーダの一実施態様の基本構成を示す。フィルタバンク102は、路100から受信した入力信号に応答して小帯域情報を発生させる。変換器112は、第1語及び第2語から成る小帯域情報の表現を発生させる。第1語は、入力として路113を通して配分関数110及びフォーマッタ106へ伝えられる。配分関数110は、第1語に応答して配分情報を設定し、同配分情報を量子化装置104へ伝える。量子化装置104は、配分情報によって特定されたビット数を用いて、路115から受信した第2語を量子化することによって量子化された情報を発生させ、フォーマッタ106は、量子化された情報及び第1語を伝送又は記憶に適したフォーマットを有する符号化された信号にアセンブルする。符号化された信号は路108を通して所望の伝送チャンネル又は記憶装置へ伝えられる。
図5は、逆方向適応配分を組入れたエンコーダ・デコーダシステムで用いられる分割帯域デコーダの一実施態様の基本構成を例示する。デフォーマッタ202は、路200から受信した符号化された信号から量子化された情報情報及び第1語を抽出する。同第1語は、路203を通して配分関数210へ伝えられる。配分関数210は、第1語に応答して配分情報を設定し、同配分情報を逆量子化装置204へ伝える。逆量子化装置204は、デフォーマッタ202から受信した量子化された情報を逆量子化することによって第3語を発生させる。同第3語は、配分情報によって特定されたビット数を用いて逆量子化される。逆変換器212は、第1語及び第3語に応答して小帯域女王を発生させ、逆フィルタバンク206は、逆変換器212から受信した小帯域情報に応答して路208を通して出力信号を発生させる。
逆方向適応符号化システムは、符号化された信号内の副情報を伝えるのに要するオーバーヘッドを避けることができる。その理由は、配分情報が符号化信号内にアセンブルされた第1語によって明示的に表されているからである。逆方向適応デコーダは、先に逆方向適応エンコーダで行われた同一配分関数を実行することによって第1語から配分情報を回復することができる。符号化信号の正確な復号は、エンコーダ及びデコーダ配分関数それ自体が同一であることは要しないが、正確な復号は、もし2つの関数が同一組の第1語に応答して同一の配分情報を得られる場合にのみ保証し得るということを理解すべきである。
ハイブリッド適応配分
図6は、本発明の教示によるハイブリッド適応配分を組入れたエンコーダ・デコーダシステムで用いられる分割帯域エンコーダの一実施態様の基本構成を例示する。この実施態様の構成及び作動は、上記図4で例示した逆方向適応エンコーダの構成及び作動の関係で記載する。アダプタ120は、2つの基本的技術の1つ又は双方を用いて配分関数110によって設定された配分情報の1以上の値を改変する。双方の技術を実行するのに用いられる構成は、図6に例示するが、いずれか一方の技術のみを用いることができる。
第1又は『パラメータ』技術においては、アダプタ120が配分関数110の結果に影響する1以上のパラメータを改変する。アダプタ120によって与えられた改変されたパラメータは、路123を通して関数110及びフォーマッタ106へ伝えられる。フォーマッタ106は、改変されたパラメータ及び量子化された情報の表示を、伝送及び記憶に適したフォーマットを有する符号化された情報にアセンブルする。
第2又は『値』技術においては、アダプタ120が配分情報の各々の値に対する1以上の新しい値を改変する。アダプタ120によって与えられた改変値は、路121を通してフォーマッタ106及びマージ118へ伝えられる。マージ118は、改変値を配分関数110から受信した配分情報と併合し、併合した配分情報を量子化装置104へ伝える。フォーマッタ106は、改変された情報及び量子化された情報の表示を、伝送及び記憶に適したフォーマットを有する符号化された信号にアセンブルする。
図6に例示する実施態様は、路100から受信した入力信号、路103から受信した小帯域情報及び路113から受信した第1語に応答するアダプタ120を示す。ハイブリッド適応エンコーダの代わりの実施態様においては、アダプタ120は3つの路の任意の1つに応答し、3つの路の任意の組合わせに応答し、他の情報に応答することができる。
図7は、本発明の教示によるハイブリッド適応配分を組入れたエンコーダ・デコーダシステムで用いられる分割帯域デコーダの一実施態様の基本構成を例示する。この実施態様の構成及び作動は、上記図5で例示した逆方向適応デコーダの構成及び作動の関係で記載する。配分情報の1以上の値が、上記のものと同様な基本的技術の1つ又は双方のいずれかを用いて改変される。双方の技術を実行するのに用いる構成は図7に例示するが、いずれか一方の技術のみを用いることができる。
第1又は『パラメータ』技術においては、デフォーマッタ202が、符号化された信号から、配分関数210の結果に影響する1以上の改変されたパラメータを抽出し、路213を通して改変パラメータを配分関数210へ伝える。
第2又は『値』技術においては、デフォーマッタ202が、符号化された信号から1以上の改変された値を抽出し、路205を通して改変値をマージ218へ伝える。マージ218は、改変値を配分関数210から受信した配分情報と併合し、併合された配分値を逆量子化装置204へ伝える。
実施
図6及び7に例示した幾つかの要素は、広範な各種の形で実施できる。例えば、フィルタバンク102及び逆フィルタバンク206は、直角位相ミラーフィルタ、多相フィルタ、フーリエ変換、上記のTDAC変換等、当業界で知られた各種のデジタルフィルタ技術によって実施できる。本発明の実施にとって決定的な特定な技術はない。本発明の上記記載は、特に分割符号化用途に向けられているが、本発明はさらに広帯域符号化にも適用できることを理解すべきである。
同様に第1語及び第2語を発生させかつ回復させる変換器112及び逆変換器212も、広範な各種の形で実施できる。既に述べた通り、第1語は、配分関数を知らせるためにエンコーダ及びデコーダの双方で利用できる。概して第1語は、位取り因子に相当し、第2語は、位取り因子にに従って位取りされた値に相当するであろう。各種の数量の浮動小数点表示を用いる実施態様においては、第1語は、浮動小数点指数に相当し、第2語は、浮動小数点仮数に相当するであろう。
配分関数110及び210によって与えられる特定な処理は、本発明の実施上決定的ではない。既に述べた通り、2つの関数は同一である必要はないが、同一のパラメータを前提とすれば、同一組の第1語に応答して同一の配分情報を得るものでなければならない。各種の配分関数を組入れた符号化システムの幾つかの例が、上記米国に開示されている。順方向適応及び逆方向適応のさらなる例が、米国特許第4,142,071、4,455,649、4,896,362、5,157,760、及び5,166,686号に開示されている(参照することによってこれらのすべてを全面的に併合する)。当業界では他の多くの例が知られている。
各種の配分関数によって得られた結果は各種のパラメータによって影響される。この様なパラメータは、用いられた特殊な配分関数に依存する。それゆえに完全な表は不可能である。選ばれた特殊なパラメータは、本発明の実施上決定的ではないが、概念を説明する上で幾つかの例が助けとなるであろう。
例えば、小帯域情報を浮動小数点フォーマットで表す実施態様においては、浮動小数点指数の一次関数であるビット数を配分することによって、スペクトル振幅で各6dBの増加に対して追加のビットを配分することができる。その代わりに、2、3、又は4でそれぞれ除した指数の一次関数として配分することによって振幅で各12、18、又は24dBの増加に対して追加のビットを配分することができる。指数の除数は、この特殊な配分関数の結果に影響する一パラメータの例である。
各種の心理知覚効果に基づく配分関数を用いる分割帯域システムにおいては、基礎的心理知覚モデルに影響する任意のパラメータは、配分関数を適応させるために改変することができる。例えば、オーディオ符号化用途においてこの様なパラメータは、1)隠蔽(マスキング)音の上方又は下方の心理音響的隠蔽のレベル又は程度、2)所与の周波数および隠蔽成分間の差の関数としての心理音響的隠蔽しきい値の形状、3)多重チャンネルシステムにおけるチャンネル間隠蔽のレベル、4)入力信号の帯域幅、5)周波数の関数として小帯域情報に配分する最小ビット数および6)周波数の関数として配分する最大ビット数を含む。
適応量子化装置は当業界では周知である。量子化装置104および204によって用いられる特殊な量子化関数は決定的ではないが、2つの関数は同一結果を生じさせるべきである。例えば、量子化関数は、線形又は非線形若しくは対称又は非対称でよい。
マージ118および218で用いられる方法は、本発明にとって決定的ではない。概念上各要素は、配分情報値の組および改変された値の組からの値に相当する一組の値に併合される。これは各種の方法で行なってもよい。
例えば、配分情報値は、相当する改変された値によって置き換えてもよい。分割帯域エンコーダの実施態様において各配分情報値は、それぞれの小帯域において小帯域情報を量子化するのに用いるビット数を表す。各改変値は、対応する配分情報に取って代わり、その代わり量子化装置によって用いられる。
他の例として配分情報値は、それを対応する改変値と組合わせることによって改変してもよい。すなわち、改変された値は増分量を表し、その量だけ対応する配分情報値が変化されなければならない。上記の模範的分割帯域実施態様を続けると、特定の小帯域において小帯域情報を量子化するのに用いられるビット数は、それぞれの配分情報値及び、もし存在するなら、対応する改変された値の代数和によって定められる。その代わりに、改変値は、対応する配分情報値がそれによって位取りされるべき因子を表してもよい。
アダプタ120は、配分処理を適応させるために『パラメータ』技術及び『値』技術の一方又は双方を用いることができる。パラメータ技術は、既に述べたような配分の結果に影響する1以上のパラメータを改変することを伴う。値技術は、配分関数かから得られる配分情報値と併合される1以上の改変された値を発生させることを伴う。
いずれかの技術を実施するのに用いられる特定の処理は、本発明の実施にとって決定的ではない。一手法は、代わりの配分関数を実行し、代わりの関数の結果を基本配分関数110から得られる『基本値』と比較し、代わりの値とそれぞれの基本値との間の差が優位な場合には各代わりの値に対する改変された値を形成することからなる。基本配分関数の複雑性は、デコーダを単純化するように制限できるが、代わりの配分関数は所望のものと同じくらい複雑であってもよい。例えば、オーディオ符号化用途において代わりの関数は、より高性能な心理音響的モデルを用いてもよい。すなわち、モデルは、入力信号スペクトルの平坦さのような信号特性、入力信号の平坦又はピーク振幅及び隠蔽成分が音状か若しくは雑音状のいずれかであるかに対する配慮を含む。
他の模範的な適応処理は、完全な配分関数を実行することを避け、単に各種の信号特性の検知に応答して基本配分値に対する調節手段を発生させるのみである。例えば、検知される音状隠蔽成分に応答して基本配分値が増加されるか若しくはほぼ平坦な入力信号スペクトルを検知することに応答して基本配分値が低減されるようにしてもよい。
以上記載した通り、アダプタ120は、入力信号、フィルタバンク102から得られる小帯域情報、変換器112から得られる第1語又は特定の用途に有意な他のあらゆる情報に応答してもよい。
例えば、長距離電話網用の符号化システムにおいてアダプタ120は、日付、時刻及び曜日情報に応答してビット配分を低減させる配分関数を与えるようにし、それによって電話網を通した通話料の予報された増加を予想して、より低い情報要件をより高い忠実度符号化に対して兼ね合わせる。
例えば、デジタルビデオ表示システムにおいてアダプタ120は、オペレータ入力に応答する配分関数を与え、それによってオペレータは、より高い画像解像度に対してより短い表示応答時間を釣り合わせることを可能にしてもよい。
このような例が示すようにアダプタ120は、特定の用途で望まれるあらゆる情報に応答してもよい。この情報の選択は、本発明の実施上決定的ではない。
符号化された信号が一連のビットで表される多くの符号化システムにおいて、フォーマッタ108及びデフォーマッタ202によって与えられる関数は、それぞれ一連のマルチプレクス(多重送信)及びデマルチプレクスにほぼ対応する。フォーマット及びデフォーマット関数の実施は、特定の用途に対しては重要であるかも知れないが、それは本発明の実施上決定的ではない。すなわち、符号化され信号を伝送又は記憶に適した形にすることが可能でかつフォーマットされた表現から符号化信号を回復できるあらゆる処理が適している。
本発明は、広範な各種の技術によって実施される多くの実施態様内で実施できることを理解すべきである。
上記の記載はとくにオーディオ符号化用途に向けられているが、本発明はビデオのような広範囲の符号化用途で実施することができる。
Claims (42)
- 入力信号を符号化するエンコーダであって、
前記入力信号に応答して該入力信号のスペクトル構成を表す小帯域情報を発生させる小帯域装置102、112と、
前記小帯域情報に含まれる第1語に配分関数を適用することによって複数の基本配分値を設定するビット配分装置110であって、前記複数の基本配分値の各々が前記小帯域情報に含まれる1つ又はそれ以上の第2語と関連するビット配分装置と、
少なくとも前記入力信号、前記小帯域情報、前記第1語及び前記複数の基本配分値の1つに応答して、前記複数の基本配分値の各値に対応する1つ又はそれ以上の改変された配分値を発生させる適応装置120と、
前記複数の基本配分値又はもしあるならば対応する改変された配分値のいずれかと等しいビット数を用いて、前記第2語の各々を量子化することによって量子化された情報を発生させる量子化装置104、118と、
前記第1語、前記量子化情報及び前記改変された配分値の表示を含む副情報を、伝送又は記憶に適した形にアセンブルするフォーマット装置106とから成るエンコーダ。 - 入力信号を符号化するエンコーダであって、
前記入力信号に応答して該入力信号のスペクトル構成を表す小帯域情報を発生させる小帯域装置102、112と、
前記小帯域情報に含まれる第1語に配分関数を適用することによって、各々が1つ又はそれ以上の前記小帯域情報に含まれる第2語と関連した複数の配分値を設定するビット配分装置110であって、前記配分関数の結果が1つ又はそれ以上のパラメータによって影響される配分装置と、
前記入力信号、前記小帯域情報、前記第1語及び前記複数の配分値の少なくとも1つに応答して、1つ又はそれ以上の前記パラメータを改変させることによって1つ又はそれ以上の改変されたパラメータを発生させる装置120と、
前記複数の配分値の関連した1つと等しいビット数を用いて、前記第2語の各々を量子化することによって量子化された情報を発生させる量子化装置104と、
前記第1語、前記量子化情報及び前記1つ又はそれ以上の改変されたパラメータの表示から成る副情報を、伝送又は記憶に適した形にアセンブルするフォーマット装置106とから成るエンコーダ。 - 前記小帯域装置が、前記小帯域情報の浮動小数点記号を発生させ、前記第1語が浮動小数点指数を表し、前記第2語が浮動小数点仮数を表す、請求項1又は2のエンコーダ。
- 前記第1語が位取り因子を表し、前記第2語が前記位取り因子によって位取りされる値を表す、請求項1又は2のエンコーダ。
- 前記第1語が前記入力信号のスペクトル包絡線を表す、請求項1乃至4のいずれか1つのエンコーダ。
- 前記配分関数が心理音響原理に基づき、該配分関数の結果が、隠蔽成分より上方及び下方の周波数における隠蔽の程度、隠蔽を達成する隠蔽成分を有する周波数差に対する信号対雑音比の関数、チャンネル間隠蔽のレベル、周波数の関数として小帯域情報に配分する最少、最大ビット数に関係する1つ又はそれ以上のパラメータによって影響される、請求項1乃至5のいずれか1つのエンコーダ。
- 前記適応装置が、1つ又はそれ以上の前記複数の基本配分値に関して差を表す、改変された配分値を発生させる、請求項1又は3乃至6のいずれか1つのエンコーダ。
- 前記適応装置が、代わりの配分関数を実行することによって前記1つ又はそれ以上の改変された配分値を得る、請求項1又は3乃至7のいずれか1つのエンコーダ。
- 前記代わりの配分関数が、前記入力信号スペクトルの平坦さ、該入力信号の振幅及び隠蔽成分が音状か又は雑音状かどうかの中のいずれに基づく、請求項8のエンコーダ。
- 前記1つ又はそれ以上の改変された配分値の表示が、前記1つ又はそれ以上の改変された配分値の大きさの表現から成る、請求項1又は3乃至9のいずれか1つのエンコーダ。
- 前記1つ又はそれ以上の改変された配分値の表示が、前記1つ又はそれ以上の改変された配分値と各々の基本配分値との差の表現から成る、請求項1又は3乃至9のいずれか1つのエンコーダ。
- 前記1つ又はそれ以上の改変されたパラメータの表示が、前記1つ又はそれ以上の改変されたパラメータと、それぞれの改変されていないパラメータとの間の差の表現から成る、請求項2又は請求項2と組み合った請求項3乃至6のいずれか1つのエンコーダ。
- 符号化された情報を復号するデコーダであって、
前記符号化された情報を、第1語と、量子化された第2語と、1つ又はそれ以上の改変された配分値から成る副情報とに逆アセンブルするデフォーマット装置202と、
前記第1語に配分関数を適用することによって、各々が1つ又はそれ以上の前記量子化された第2語と関連した複数の基本配分値を設定するビット配分装置210と、
前記関連した複数の基本配分値の1つと等しいビット数から構成されるか又は、もしあれば、各々の改変された配分値から得られる、前記量子化された第2語を逆量子化することによって第3語を発生させる逆量子化装置204、218と、
前記第1語及び第3語から成る小帯域情報に応答して、前記符号化された情報によって表される情報のレプリカを発生させる逆小帯域装置206、212とから成るデコーダ。 - 符号化された情報を復号するデコーダであって、
前記符号化された情報を第1語と、量子化された第2語と、1つ又はそれ以上の改変されたパラメータから成る副情報とに逆アセンブルするデフォーマット装置202と、
前記第1語に配分関数を適用することによって、各々が1つ又はそれ以上の前記量子化された第2語と関連した複数の配分値を設定するビット配分装置210であって、前記配分関数の結果が、もしあれば、前記1つ又はそれ以上の改変されたパラメータによって影響されるビット配分装置と、
前記複数の配分値の関連した1つと等しいビット数から前記量子化された第2語を逆量子化することによって第3語を発生させる逆量子化装置204と、
前記第1語及び第3語から成る小帯域情報に応答して、前記符号化された情報によって表される情報のレプリカを発生させる逆小帯域装置206、212とから成るデコーダ。 - 前記第1語が浮動小数点指数を表し、前記第2語が浮動小数点仮数を表す、請求項13又は14のデコータ。
- 前記第1語が位取り因子を表し、前記第2語が前記位取り因子によって位取りされた値を表す、請求項13又は14のデコーダ。
- 前記第1語が前記入力信号のスペクトル包絡線を表す、請求項13乃至16のいずれか1つのデコーダ。
- 前記配分関数が心理音響原理に基づき、該配分関数の結果が、隠蔽成分より上方及び下方の周波数における隠蔽の程度と、隠蔽を達成する隠蔽成分を有する周波数差に対する信号対雑音比の関数と、チャンネル間隠蔽のレベルと、周波数の関数として小帯域情報に配分される最少ビット数、最大ビット数に関係する1つ又はそれ以上のパラメータとによって影響される、請求項13乃至17のいずれか1つのデコーダ。
- 前記1つ又はそれ以上の改変された配分値の表示が、前記1つ又はそれ以上の改変された配分値の大きさの表現から成る、請求項13又は15乃至18のいずれか1つのデコーダ。
- 前記1つ又はそれ以上の改変された配分値の表示が、前記1つ又はそれ以上の改変された配分値と各々の基本配分値との差の表現から成る、請求項13又は15乃至18のいずれか1つのデコーダ。
- 前記1つ又はそれ以上の改変されたパラメータの表示が、前記1つ又はそれ以上の改変されたパラメータと、それぞれの改変されていないパラメータとの間の表現から成る、請求項14又は15乃至18のいずれか1つのデコーダ。
- 入力信号を符号化する符号化方法であって、
該入力信号のスペクトル構成を表す小帯域情報を発生させ、
前記小帯域情報に含まれる第1語に配分関数を適用することによって複数の基本配分値を設定し、前記複数の基本配分値の各々が前記小帯域情報に含まれる1つ又はそれ以上の第2語と関連するようにさせ、
前記入力信号、前記小帯域情報、前記第1語及び前記複数の基本配分値の少なくとも1つに応答して、前記複数の基本配分値の各値に対応する1つ又はそれ以上の改変された配分値を発生させ、
前記複数の基本配分値の関連した1つと等しいか又は、もしあれば、改変された配分値に相当するビット数を用いて前記第2語の各々を量子化することによって量子化された情報を発生させ、
前記第1語、前記量子化された情報及び前記改変された配分値の表示から成る副情報を、伝送又は記憶に適した形にアセンブルすることから成る符号化方法。 - 入力信号を符号化する符号化方法であって、
該入力信号のスペクトル構成を表す小帯域情報を発生させ、
前記小帯域情報に含まれる第1語に配分関数を適用することによって複数の配分値を設定し、前記複数の配分値の各々が前記小帯域情報に含まれる1つ又はそれ以上の第2語と関連し、前記配分関数の結果が1つ又はそれ以上のパラメータによって影響されるようにし、
前記入力信号、前記小帯域情報、前記第1語及び前記複数の配分値の少なくとも1つに応答して、前記パラメータの1つ又はそれ以上を改変することによって1つ又はそれ以上の改変されたパラメータを発生させ、
前記複数の配分値と関連した1つのと等しいビット数を用いて、前記第2語の各々を量子化することによって量子化された情報を発生させ、
前記第1語、前記量子化情報及び前記1つ又はそれ以上の改変されたパラメータの表示から成る副情報を、伝送又は記憶に適した形にアセンブルすることから成る符号化方法。 - 前記小帯域情報を発生させることで、前記小帯域情報の浮動小数点記号を発生させ、前記第1語が浮動小数点指数を表し、前記第2語が浮動小数点仮数を表すようにする、請求項22又は23の方法。
- 前記第1語が位取り因子を表し、前記第2語が前記位取り因子によって位取りされた値を表す、請求項22又は23の方法。
- 前記第1語が前記入力信号のスペクトル包絡線を表す、請求項22乃至25のいずれか1つの方法。
- 前記配分関数が心理音響原理に基づき、該配分関数の結果が、隠蔽成分より上方及び下方の周波数における隠蔽の程度、隠蔽を達成する隠蔽成分を有する周波数差に対する信号対雑音比の関数、チャンネル間隠蔽のレベル、周波数の関数として小帯域情報に配分する最少、最大ビット数と関連する1つ又はそれ以上のパラメータによって影響される、請求項22乃至26のいずれか1つの方法。
- 前記1つ又はそれ以上の改変された配分値を発生させることが、1つ又はそれ以上の前記複数の基本配分値に関して差を表す改変された配分値を発生させる、請求項22又は24乃至27のいずれか1つの方法。
- 前記1つ又はそれ以上の改変された配分値を発生させることで、代わりの配分関数を実行することによって代わりの配分値を発生させる、請求項22又は24乃至28のいずれか1つの方法。
- 前記代わりの配分関数が、前記入力信号スペクトルの平坦さ、該入力信号の振幅及び隠蔽成分が音状か又は雑音状かどうかの中の任意のものに基づく、請求項29の方法。
- 前記1つ又はそれ以上の改変された配分値の前記表示が、前記1つ又はそれ以上の改変された配分値の大きさの表現から成る、請求項22又は24乃至30のいずれか1つの方法。
- 前記1つ又はそれ以上の改変された配分値の表示が、該1つ又はそれ以上の改変された配分値と各々の基本配分値との差の表現から成る、請求項22又は24乃至30のいずれか1つの方法。
- 1つ又はそれ以上の改変されたパラメータの前記表示が、前記1つ又はそれ以上の改変されたパラメータ及びそれぞれの改変されていないパラメータ間の差を表す表現を含む、請求項23又は24乃至27のいずれか1つの方法。
- 符号化された情報を復号する復号方法であって、
前記符号化された情報を、第1語、量子化された第2語及び1つ又はそれ以上の改変された配分値の表示から成る副情報に逆アセンブルし、
前記第1語に配分関数を適用することによって複数の基本配分値を設定し、前記複数の基本配分値の各々が前記量子化された1つ又はそれ以上の第2語と関連するようにし、
前記複数の基本配分値のうち前記関連がなされたものと等しいビット数、又は、もしあれば、各改変された配分値から得られるビット数から、前記量子化された第2語を逆量子化することによって第3語を発生させ、
前記第1語及び第3語から成る小帯域情報に応答して、前記符号化された情報によって表される情報のレプリカを発生させることから成る復号方法。 - 符号化された情報を復号する復号方法であって、
前記符号化された情報を、第1語、量子化された第2語及び1つ又はそれ以上の改変されたパラメータから成る副情報に逆アセンブルし、
前記第1語に、配分関数を適用することによって複数の配分値を設定し、前記複数の配分値の各々が、前記量子化された第2語の1つ又はそれ以上と関連するようにし、前記配分関数の結果が、もしあれば、前記1つ又はそれ以上の改変されたパラメータによって影響されるようにし、
前記複数の配分値のうち前記関連がなされたものと等しいビット数から成る前記量子化された第2語を逆量子化することによって第3語を発生させ、
前記第1語及び第3語から成る小帯域情報に応答して、前記符号化された情報によって表される情報のレプリカを発生させることから成る復号化方法。 - 前記第1語が浮動小数点指数を表し、前記第2語が浮動小数点仮数を表す、請求項34又は35の方法。
- 前記第1語が位取り因子を表し、前記第2語が前記位取り因子によって位取りされた値を表す、請求項34又は35の方法。
- 前記第1語が前記入力信号のスペクトル包絡線を表す、請求項34乃至37のいずれか1つの方法。
- 前記配分関数が心理音響原理に基づき、該配分関数の結果が、隠蔽成分より上方及び下方の周波数における隠蔽の程度、隠蔽を達成する隠蔽成分を用いた周波数差に対する信号対雑音比の関数、チャンネル間隠蔽のレベル、周波数の関数として小帯域情報に配分する最少、最大ビット数に関係する1つ又はそれ以上のパラメータによって影響される、請求項34乃至38のいずれか1つの方法。
- 前記1つ又はそれ以上の改変された配分値の表示が、前記1つ又はそれ以上の改変された配分値の大きさの表現から成る、請求項34又は36乃至39のいずれか1つの方法。
- 前記1つ又はそれ以上の改変された配分値の表示が、該1つ又はそれ以上の改変された配分値と各々の基本配分値との差の表現から成る、請求項34又は36乃至39のいずれか1つの方法。
- 前記1つ又はそれ以上の改変されたパラメータが、該1つ又はそれ以上の改変されたパラメータ及びそれぞれの改変されていないパラメータ間の差を表す表現を含む、請求項35又は請求項35と組み合った36乃至39のいずれか1つの方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US9226993A | 1993-07-16 | 1993-07-16 | |
US08/092,269 | 1993-07-16 | ||
PCT/US1994/007910 WO1995002928A1 (en) | 1993-07-16 | 1994-07-14 | Hybrid adaptive allocation for audio encoder and decoder |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09500772A JPH09500772A (ja) | 1997-01-21 |
JP3804968B2 true JP3804968B2 (ja) | 2006-08-02 |
Family
ID=22232469
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP50471795A Expired - Lifetime JP3804968B2 (ja) | 1993-07-16 | 1994-07-14 | 適応配分式符号化・復号装置及び方法 |
Country Status (11)
Country | Link |
---|---|
US (1) | US5632003A (ja) |
EP (1) | EP0709004B1 (ja) |
JP (1) | JP3804968B2 (ja) |
AT (1) | ATE147908T1 (ja) |
AU (1) | AU677856B2 (ja) |
CA (1) | CA2164964C (ja) |
DE (1) | DE69401512T2 (ja) |
DK (1) | DK0709004T3 (ja) |
ES (1) | ES2097057T3 (ja) |
SG (2) | SG47116A1 (ja) |
WO (1) | WO1995002928A1 (ja) |
Families Citing this family (78)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3307138B2 (ja) * | 1995-02-27 | 2002-07-24 | ソニー株式会社 | 信号符号化方法及び装置、並びに信号復号化方法及び装置 |
EP0772925B1 (en) * | 1995-05-03 | 2004-07-14 | Sony Corporation | Non-linearly quantizing an information signal |
JP3082625B2 (ja) * | 1995-07-15 | 2000-08-28 | 日本電気株式会社 | 音声信号処理回路 |
US5960390A (en) * | 1995-10-05 | 1999-09-28 | Sony Corporation | Coding method for using multi channel audio signals |
JP3521596B2 (ja) * | 1996-01-30 | 2004-04-19 | ソニー株式会社 | 信号符号化方法 |
US5825320A (en) * | 1996-03-19 | 1998-10-20 | Sony Corporation | Gain control method for audio encoding device |
US6263312B1 (en) | 1997-10-03 | 2001-07-17 | Alaris, Inc. | Audio compression and decompression employing subband decomposition of residual signal and distortion reduction |
JP3784993B2 (ja) * | 1998-06-26 | 2006-06-14 | 株式会社リコー | 音響信号の符号化・量子化方法 |
US6253165B1 (en) * | 1998-06-30 | 2001-06-26 | Microsoft Corporation | System and method for modeling probability distribution functions of transform coefficients of encoded signal |
US6128593A (en) * | 1998-08-04 | 2000-10-03 | Sony Corporation | System and method for implementing a refined psycho-acoustic modeler |
EP1125235B1 (en) * | 1998-10-26 | 2003-04-23 | STMicroelectronics Asia Pacific Pte Ltd. | Multi-precision technique for digital audio encoder |
US6418404B1 (en) * | 1998-12-28 | 2002-07-09 | Sony Corporation | System and method for effectively implementing fixed masking thresholds in an audio encoder device |
EP1729287A1 (en) * | 1999-01-07 | 2006-12-06 | Tellabs Operations, Inc. | Method and apparatus for adaptively suppressing noise |
EP1141948B1 (en) | 1999-01-07 | 2007-04-04 | Tellabs Operations, Inc. | Method and apparatus for adaptively suppressing noise |
TW477119B (en) * | 1999-01-28 | 2002-02-21 | Winbond Electronics Corp | Byte allocation method and device for speech synthesis |
US6321200B1 (en) * | 1999-07-02 | 2001-11-20 | Mitsubish Electric Research Laboratories, Inc | Method for extracting features from a mixture of signals |
AU2018201A (en) | 1999-10-12 | 2001-04-23 | Perception Digital Technology (Bvi) Limited | Digital multimedia jukebox |
AU754612B2 (en) * | 1999-11-12 | 2002-11-21 | Motorola Australia Pty Ltd | Method and apparatus for estimating a spectral model of a signal used to enhance a narrowband signal |
AU741881B2 (en) * | 1999-11-12 | 2001-12-13 | Motorola Australia Pty Ltd | Method and apparatus for determining paremeters of a model of a power spectrum of a digitised waveform |
US6765962B1 (en) * | 1999-12-02 | 2004-07-20 | Sarnoff Corporation | Adaptive selection of quantization scales for video encoding |
US6567781B1 (en) | 1999-12-30 | 2003-05-20 | Quikcat.Com, Inc. | Method and apparatus for compressing audio data using a dynamical system having a multi-state dynamical rule set and associated transform basis function |
US6647365B1 (en) * | 2000-06-02 | 2003-11-11 | Lucent Technologies Inc. | Method and apparatus for detecting noise-like signal components |
US6813600B1 (en) * | 2000-09-07 | 2004-11-02 | Lucent Technologies Inc. | Preclassification of audio material in digital audio compression applications |
KR100871999B1 (ko) * | 2001-05-08 | 2008-12-05 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 코딩 |
US6661880B1 (en) | 2001-06-12 | 2003-12-09 | 3Com Corporation | System and method for embedding digital information in a dial tone signal |
US7333929B1 (en) | 2001-09-13 | 2008-02-19 | Chmounk Dmitri V | Modular scalable compressed audio data stream |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7197083B2 (en) * | 2001-12-21 | 2007-03-27 | Intel Corporation | Creation of spectral windows through the use of high rate code words |
US7050965B2 (en) * | 2002-06-03 | 2006-05-23 | Intel Corporation | Perceptual normalization of digital audio signals |
US7299190B2 (en) * | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
JP4676140B2 (ja) | 2002-09-04 | 2011-04-27 | マイクロソフト コーポレーション | オーディオの量子化および逆量子化 |
SG135920A1 (en) * | 2003-03-07 | 2007-10-29 | St Microelectronics Asia | Device and process for use in encoding audio data |
US7333930B2 (en) * | 2003-03-14 | 2008-02-19 | Agere Systems Inc. | Tonal analysis for perceptual audio coding using a compressed spectral representation |
US7299172B2 (en) * | 2003-10-08 | 2007-11-20 | J.W. Associates | Systems and methods for sound compression |
US7613608B2 (en) * | 2003-11-12 | 2009-11-03 | Telecom Italia S.P.A. | Method and circuit for noise estimation, related filter, terminal and communication network using same, and computer program product therefor |
KR100713452B1 (ko) | 2003-12-06 | 2007-05-02 | 삼성전자주식회사 | 오디오 신호를 부호화하는 장치 및 방법 |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
DE102004009949B4 (de) * | 2004-03-01 | 2006-03-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Ermitteln eines Schätzwertes |
US7921007B2 (en) * | 2004-08-17 | 2011-04-05 | Koninklijke Philips Electronics N.V. | Scalable audio coding |
PT1792304E (pt) * | 2004-09-20 | 2008-12-04 | Tno | Compensação de frequência para análise de percepção de voz |
US7536301B2 (en) * | 2005-01-03 | 2009-05-19 | Aai Corporation | System and method for implementing real-time adaptive threshold triggering in acoustic detection systems |
US7548853B2 (en) | 2005-06-17 | 2009-06-16 | Shmunk Dmitry V | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
US8270439B2 (en) * | 2005-07-08 | 2012-09-18 | Activevideo Networks, Inc. | Video game system using pre-encoded digital audio mixing |
US7539612B2 (en) * | 2005-07-15 | 2009-05-26 | Microsoft Corporation | Coding and decoding scale factor information |
US8074248B2 (en) | 2005-07-26 | 2011-12-06 | Activevideo Networks, Inc. | System and method for providing video content associated with a source image to a television in a communication network |
KR100754389B1 (ko) * | 2005-09-29 | 2007-08-31 | 삼성전자주식회사 | 음성 및 오디오 신호 부호화 장치 및 방법 |
US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
US7953604B2 (en) * | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
US8190425B2 (en) * | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
KR101393298B1 (ko) * | 2006-07-08 | 2014-05-12 | 삼성전자주식회사 | 적응적 부호화/복호화 방법 및 장치 |
KR100950651B1 (ko) * | 2006-11-29 | 2010-04-01 | 삼성전자주식회사 | 통신 시스템에서 집중 타입 자원 할당 정보 송수신 장치 및방법 |
US9042454B2 (en) | 2007-01-12 | 2015-05-26 | Activevideo Networks, Inc. | Interactive encoded content system including object models for viewing on a remote device |
US9826197B2 (en) | 2007-01-12 | 2017-11-21 | Activevideo Networks, Inc. | Providing television broadcasts over a managed network and interactive content over an unmanaged network to a client device |
FR2912249A1 (fr) * | 2007-02-02 | 2008-08-08 | France Telecom | Codage/decodage perfectionnes de signaux audionumeriques. |
US8321491B2 (en) * | 2007-06-26 | 2012-11-27 | The United States Of America As Represented By The Secretary Of The Army | System and method for detecting a weak signal in a noisy environment |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
KR101435411B1 (ko) * | 2007-09-28 | 2014-08-28 | 삼성전자주식회사 | 심리 음향 모델의 마스킹 효과에 따라 적응적으로 양자화간격을 결정하는 방법과 이를 이용한 오디오 신호의부호화/복호화 방법 및 그 장치 |
KR101597375B1 (ko) | 2007-12-21 | 2016-02-24 | 디티에스 엘엘씨 | 오디오 신호의 인지된 음량을 조절하기 위한 시스템 |
US11657788B2 (en) | 2009-05-27 | 2023-05-23 | Dolby International Ab | Efficient combined harmonic transposition |
TWI484481B (zh) | 2009-05-27 | 2015-05-11 | 杜比國際公司 | 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體 |
US8194862B2 (en) * | 2009-07-31 | 2012-06-05 | Activevideo Networks, Inc. | Video game system with mixing of independent pre-encoded digital audio bitstreams |
US8538042B2 (en) | 2009-08-11 | 2013-09-17 | Dts Llc | System for increasing perceived loudness of speakers |
US9021541B2 (en) | 2010-10-14 | 2015-04-28 | Activevideo Networks, Inc. | Streaming digital video between video devices using a cable television system |
FR2973551A1 (fr) * | 2011-03-29 | 2012-10-05 | France Telecom | Allocation par sous-bandes de bits de quantification de parametres d'information spatiale pour un codage parametrique |
US9204203B2 (en) | 2011-04-07 | 2015-12-01 | Activevideo Networks, Inc. | Reduction of latency in video distribution networks using adaptive bit rates |
WO2013106390A1 (en) | 2012-01-09 | 2013-07-18 | Activevideo Networks, Inc. | Rendering of an interactive lean-backward user interface on a television |
US9800945B2 (en) | 2012-04-03 | 2017-10-24 | Activevideo Networks, Inc. | Class-based intelligent multiplexing over unmanaged networks |
US9312829B2 (en) | 2012-04-12 | 2016-04-12 | Dts Llc | System for adjusting loudness of audio signals in real time |
US9123084B2 (en) | 2012-04-12 | 2015-09-01 | Activevideo Networks, Inc. | Graphical application integration with MPEG objects |
US10275128B2 (en) | 2013-03-15 | 2019-04-30 | Activevideo Networks, Inc. | Multiple-mode system and method for providing user selectable video content |
EP3005712A1 (en) | 2013-06-06 | 2016-04-13 | ActiveVideo Networks, Inc. | Overlay rendering of user interface onto source video |
US9219922B2 (en) | 2013-06-06 | 2015-12-22 | Activevideo Networks, Inc. | System and method for exploiting scene graph information in construction of an encoded video sequence |
US9294785B2 (en) | 2013-06-06 | 2016-03-22 | Activevideo Networks, Inc. | System and method for exploiting scene graph information in construction of an encoded video sequence |
US9788029B2 (en) | 2014-04-25 | 2017-10-10 | Activevideo Networks, Inc. | Intelligent multiplexing using class-based, multi-dimensioned decision logic for managed networks |
US10043527B1 (en) * | 2015-07-17 | 2018-08-07 | Digimarc Corporation | Human auditory system modeling with masking energy adaptation |
US10804932B2 (en) * | 2018-12-27 | 2020-10-13 | Seagate Technology Llc | Non-linear LLR look-up tables |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3171990D1 (en) * | 1981-04-30 | 1985-10-03 | Ibm | Speech coding methods and apparatus for carrying out the method |
GB8326719D0 (en) * | 1983-10-06 | 1983-11-09 | British Telecomm | Digital coding |
GB8421498D0 (en) * | 1984-08-24 | 1984-09-26 | British Telecomm | Frequency domain speech coding |
IL76283A0 (en) * | 1985-09-03 | 1986-01-31 | Ibm | Process and system for coding signals |
US4868867A (en) * | 1987-04-06 | 1989-09-19 | Voicecraft Inc. | Vector excitation speech or audio coder for transmission or storage |
US4956871A (en) * | 1988-09-30 | 1990-09-11 | At&T Bell Laboratories | Improving sub-band coding of speech at low bit rates by adding residual speech energy signals to sub-bands |
CA2002015C (en) * | 1988-12-30 | 1994-12-27 | Joseph Lindley Ii Hall | Perceptual coding of audio signals |
KR100220861B1 (ko) * | 1989-01-27 | 1999-09-15 | 쥬더, 에드 에이. | 고품질 오디오용 낮은 시지연 변환인코더, 디코더 및 인코딩/디코딩방법 |
US5109417A (en) * | 1989-01-27 | 1992-04-28 | Dolby Laboratories Licensing Corporation | Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio |
US5185800A (en) * | 1989-10-13 | 1993-02-09 | Centre National D'etudes Des Telecommunications | Bit allocation device for transformed digital audio broadcasting signals with adaptive quantization based on psychoauditive criterion |
US5280532A (en) * | 1990-04-09 | 1994-01-18 | Dsc Communications Corporation | N:1 bit compression apparatus and method |
ZA921988B (en) * | 1991-03-29 | 1993-02-24 | Sony Corp | High efficiency digital data encoding and decoding apparatus |
KR100312664B1 (ko) * | 1991-03-29 | 2002-12-26 | 소니 가부시끼 가이샤 | 디지탈신호부호화방법 |
US5285498A (en) * | 1992-03-02 | 1994-02-08 | At&T Bell Laboratories | Method and apparatus for coding audio signals based on perceptual model |
DE4212546C1 (ja) * | 1992-04-15 | 1993-03-11 | Joachim Dr. Scheerer | |
US5381512A (en) * | 1992-06-24 | 1995-01-10 | Moscom Corporation | Method and apparatus for speech feature recognition based on models of auditory signal processing |
-
1993
- 1993-11-01 US US08/145,975 patent/US5632003A/en not_active Expired - Lifetime
-
1994
- 1994-07-14 SG SG1996008674A patent/SG47116A1/en unknown
- 1994-07-14 AT AT94922554T patent/ATE147908T1/de active
- 1994-07-14 JP JP50471795A patent/JP3804968B2/ja not_active Expired - Lifetime
- 1994-07-14 ES ES94922554T patent/ES2097057T3/es not_active Expired - Lifetime
- 1994-07-14 DK DK94922554.4T patent/DK0709004T3/da active
- 1994-07-14 CA CA002164964A patent/CA2164964C/en not_active Expired - Lifetime
- 1994-07-14 AU AU73621/94A patent/AU677856B2/en not_active Expired
- 1994-07-14 DE DE69401512T patent/DE69401512T2/de not_active Expired - Lifetime
- 1994-07-14 EP EP94922554A patent/EP0709004B1/en not_active Expired - Lifetime
- 1994-07-14 WO PCT/US1994/007910 patent/WO1995002928A1/en active IP Right Grant
- 1994-07-18 SG SG1996008675A patent/SG54317A1/en unknown
Also Published As
Publication number | Publication date |
---|---|
CA2164964A1 (en) | 1995-01-26 |
US5632003A (en) | 1997-05-20 |
ATE147908T1 (de) | 1997-02-15 |
AU677856B2 (en) | 1997-05-08 |
JPH09500772A (ja) | 1997-01-21 |
DE69401512D1 (de) | 1997-02-27 |
DE69401512T2 (de) | 1997-06-12 |
SG47116A1 (en) | 1998-03-20 |
SG54317A1 (en) | 1998-11-16 |
CA2164964C (en) | 2005-10-11 |
DK0709004T3 (da) | 1997-03-10 |
ES2097057T3 (es) | 1997-03-16 |
AU7362194A (en) | 1995-02-13 |
WO1995002928A1 (en) | 1995-01-26 |
EP0709004B1 (en) | 1997-01-15 |
EP0709004A1 (en) | 1996-05-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3804968B2 (ja) | 適応配分式符号化・復号装置及び方法 | |
JP4223679B2 (ja) | 低ビットレート多重オーデイオチャンネル符号・復号方法及び装置 | |
EP0525809B1 (en) | Digital encoder with dynamic quantization bit allocation | |
CA2166551C (en) | Computationally efficient adaptive bit allocation for coding method and apparatus | |
EP0864146B1 (en) | Multi-channel predictive subband coder using psychoacoustic adaptive bit allocation | |
AU653582B2 (en) | Encoder/decoder for multidimensional sound fields | |
KR100295217B1 (ko) | 신호스펙트럼-의존양자화비트할당및노이즈스펙트럼-의존양자화비트할당으로서디지탈입력신호를압축하는장치 | |
KR100310216B1 (ko) | 다중채널오디오신호를위한코딩장치또는방법 | |
US6061649A (en) | Signal encoding method and apparatus, signal decoding method and apparatus and signal transmission apparatus | |
US5581654A (en) | Method and apparatus for information encoding and decoding | |
EP0669724A1 (en) | High-efficiency encoding method, high-efficiency decoding method, high-efficiency encoding device, high-efficiency decoding device, high-efficiency encoding/decoding system and recording media | |
EP1228506B1 (en) | Method of encoding an audio signal using a quality value for bit allocation | |
Musmann | Genesis of the MP3 audio coding standard | |
US5758316A (en) | Methods and apparatus for information encoding and decoding based upon tonal components of plural channels | |
JP3513178B2 (ja) | 情報符号化又は復号化方法、並びに装置 | |
JPH09102742A (ja) | 符号化方法および装置、復号化方法および装置、並びに記録媒体 | |
Noll et al. | ISO/MPEG audio coding | |
Stautner | High quality audio compression for broadcast and computer applications | |
JPH0744192A (ja) | 情報符号化又は情報復号化方法、並びに記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050419 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060418 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060509 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100519 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110519 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120519 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130519 Year of fee payment: 7 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |