JP4880053B2 - エンコードと複雑性の低いトランスコードのための合成スペクトル成分の変換 - Google Patents

エンコードと複雑性の低いトランスコードのための合成スペクトル成分の変換 Download PDF

Info

Publication number
JP4880053B2
JP4880053B2 JP2010112800A JP2010112800A JP4880053B2 JP 4880053 B2 JP4880053 B2 JP 4880053B2 JP 2010112800 A JP2010112800 A JP 2010112800A JP 2010112800 A JP2010112800 A JP 2010112800A JP 4880053 B2 JP4880053 B2 JP 4880053B2
Authority
JP
Japan
Prior art keywords
scale factor
quantized
scaled
value
control parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2010112800A
Other languages
English (en)
Other versions
JP2010250328A (ja
Inventor
レノン、ブライアン・ティモシー
トルーマン、マイケル・ミード
アンデルセン、ロバート・ローリン
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2010250328A publication Critical patent/JP2010250328A/ja
Application granted granted Critical
Publication of JP4880053B2 publication Critical patent/JP4880053B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
  • Stereophonic System (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Description

本発明は一般にオーディオコーディング方法と装置に関し、より具体的には改善されたオーディオ情報のエンコードとトランスコードに関する。
A.コーディング
多くの通信システムは、情報伝達容量と記録容量の需要がしばしば利用可能な容量を上回ることがあるという問題に直面している。その結果、人間の感覚で感知できる音質を損なうことなくオーディオ信号を伝達又は記憶させるのに必要な情報量を減らすことが放送及び記録分野に携わる人々の間で多大な関心事となっている。また与えられたバンド幅又は記憶容量において出力信号の感知できる音質を改善することも関心事となっている。
必要な情報量を減少させるための従来の方法は、入力信号のうち一部の選択された部分のみを伝達又は記録させるものである。その他の部分は放棄される。聴覚エンコード(perceptual encoding)として知られる技術では、冗長なあるいは不適切な信号部分を容易に特定し廃棄することができるように、一般に元のオーディオ信号をスペクトル成分又は周波数サブ帯域信号に変換する。ある信号部分が他の部分から再現できる場合はその信号部分は冗長であると判断される。聴覚デコーダ(perceptual decoder)は、失われた冗長部分をエンコードされた信号から再現することができるが、冗長ではなかった失われた不適切な情報を再現することができない。しかしながら、不適切な情報を失うことは、その情報がなくなってもデコードされた信号において聴覚的などんな効力も及ぼさないので、多くのアプリケーションで容認できる。
信号エンコード技術では、冗長な又は聴覚的に不適切な信号部分のみを廃棄したとしても聴覚的に明白となる。信号の不適切な部分を廃棄するひとつの方法は、信号の不適切な部分の廃棄されたスペクトルを表現することであり、また、正確さが低いスペクトルを表現することであり、これはしばしば量子化と呼ばれている。元のスペクトル成分とその量子化された表現との差は量子化ノイズとして知られている。聴覚エンコード技術により、聞こえない程度まで量子化ノイズのレベルを制御するよう試みられる。
もし、聴覚的に明白な技術により必要な情報要求量を十分減らすことができないのならば、冗長でもなく聴覚的に不適切でもない信号部分をさらに廃棄する、聴覚的に明白でない技術が必要となる。その結果、伝達されたあるいは記録された信号の忠実度が劣化することが避けられない。聴覚的に明白でない技術では、聴覚的にほとんど意味のないと判断される信号部分のみが廃却される。
しばしば聴覚的に明白でない技術とみなされる「カップリング」といわれるエンコーディング技術を必要な情報要求量を減らすために用いてもよい。この技術によれば2以上のオーディオ入力信号のスペクトル成分を結合してこれらのスペクトル成分を合成して表現するチャンネル結合信号を形成する。結合し合成した表現となっている、各入力信号におけるスペクトル成分のスペクトル包絡線を表すサイドインフォメーションも生成される。チャンネル結合信号を含むエンコードされた信号とサイドインフォメーションとは受信器により引き続きデコードするために伝達又は記録される。受信器は、元の入力信号のスペクトル包絡線を実質的に復元するために、チャンネル結合信号のコピーを生成し、このコピーされた信号中のスペクトル成分をスケーリングするためのサイドインフォメーションを用いることにより、元の入力信号の不正確な複製である分離された信号を生成する。2チャンネルステレオシステムの一般的なカップリング技術では、左右のチャンネルの信号における高周波成分を結合して合成された単一の高周波成分を形成し、元の左右のチャンネルの信号における高周波成分のスペクトル包絡線を表現するサイドインフォメーションを生成する。カップリング技術の一例が、ここでA/52書面として引用している、「ディジタルオーディオ圧縮(AC−3)」、Advanced Television System Committee (ATSC) Standard document A/52 (1994)である。
スペクトル再生として知られるエンコード技術は、必要情報容量を減らすために用いられる聴覚的に明白ではない技術である。多くの実施形態において、高周波スペクトル成分のみが再生されるのでこの技術は「高周波再生」(HFR)と称されている。この技術によれば、オーディオ入力信号の低周波成分のみを含むベース帯域信号が伝達され記録される。元の高周波数成分のスペクトル包絡線を表現するサイドインフォメーションもまた提供される。ベース帯域信号とサイドインフォメーションとを含むエンコードされた信号が、受信器で引き続いてデコーディングを行うために伝達又は記録される。受信器は、サイドインフォメーションに基づいてスペクトルレベルで、削除された高周波成分を再生し、再生された高周波成分とベース帯域信号とを結合し出力信号を生成する。既知のHFRの方法はMakhoul及びBeroutiの「スピーチコーディングシステムにおける高周波再生」Proc. of the International Conf. on Acoust., Speech and Signal Proc., 1979年4月に見つけることができる。高品質の音楽のコーディングに適切な改良されたスペクトル再生技術は、米国特許出願番号10/113,858表題「Broadband Frequency Translation for High Frequency Regeneration」2002年3月28日出願、米国特許出願番号10/174,493表題「Audio Coding System Using Spectral Hole Filling」2002年6月17日出願、米国特許出願番号10/238,047表題「Audio Coding System Using Characteristics of a Decoded Signal to Adapt Synthesized Spectral Components」2002年9月6日出願、及び、米国特許出願番号10/434,449表題「Improved Audio Coding Systems and Methods Using Spectral Component Coupling and Spectral Component Regeneration」2003年5月8日出願に開示されている。
B.トランスコーディング
既知のコーディング技術により、聴覚的に感知できる所定のレベルまでオーディオ信号の必要情報容量を削減する。逆に言えば、所定の情報容量を持ったオーディオ信号の聴覚的に感知できるレベルを改善する。このような成功にもかかわらず、さらなる改良の必要性が存在し、新しいコーディング技術を発見し、既知の技術を使う新しい方法を発見するために、コーディングについての研究が続けられている。
さらなる進歩における重要な問題は、新しいコーディング技術によりエンコードされた信号と、古いコーディング技術を組み込んだ既設の装置との潜在的な不適合である。早期の陳腐化を避けるための、標準化組織や装置製造業者の多大な努力にもかかわらず、古い受信器は新しいコーディング技術によりエンコードされた信号を常に正しくデコードできるとは限らない。逆に、新しい受信器は古いコーディング技術によりエンコードされた信号を常に正しくデコードできるとは限らない。その結果、専門家も消費者も、もし古いコーディング技術でエンコードされた信号と新しいコーディング技術でエンコードされた信号との互換性を確保しようとするならば、多くの装置を入手し保持することになる。
このような負担を軽減し避けるための1つの方法は、エンコードされた信号を1つのフォーマットから他のフォーマットに変換することのできるトランスコーダを手に入れることである。トランスコーダは異なったコーディング技術間の架け橋としての役割を果たす。例えば、トランスコーダにより、新しいコーディング技術によりエンコードされた信号を、古い技術によりエンコードされた信号のみデコードすることのできる受信器と相性の合う他の信号に変換することができる。
通常のトランスコーディングにおいて、完全なデコーディングとエンコーディングの工程が実行される。上記コーディングの例を参照すると、エンコードされた入力信号は、新しいコーディング技術を用いてデコードされ、その後合成フィルタによりディジタルオーディオ信号に変換されるべきスペクトル成分を得る。次に、このディジタルオーディオ信号は、分析フィルタにより再びスペクトル成分に変換され、続いてこれらのスペクトル成分は古いコーディング技術を用いてエンコードされる。その結果エンコードされた信号は古い受信装置と互換性を持つようになる。古いフォーマットから新しいフォーマットに変換するため、同時期の相異なるフォーマット間での変換を行うため、及び、同じフォーマットで異なったビットレート間での変換を行うためにトランスコーディングを用いてもよい。
通常のトランスコーディング技術は、聴覚符号化(perceptual coding system)によりエンコードされた信号を変換するために用いられたとき深刻な不利益がある。1番目の不利益は、通常のトランスコーディング装置は、デコーディングとエンコーディングの工程を完全に実行しなければならないので、比較的高価となることである。2番目の不利益は、デコーディングを行った後トランスコードされた信号の聴覚的音質は、ほとんど常に、デコーディングの後エンコードされた入力信号の聴覚的音質に比べて劣化していることである。
トランスコードされた信号の品質を改善するため、及び安価にトランスコーディング装置を導入することができるようにするために用いることができるコーディング技術を提供することが本発明の1つの目的である。
この目的は特許請求の範囲に記載された発明により達成される。トランスコーディングにより、エンコードされた入力信号をデコードしてスペクトル成分を取得し、そして、このスペクトル成分をエンコードしてエンコードされた出力信号とする。合成フィルタと分析フィルタのために被る実施のためのコストと信号の劣化が避けられる。トランスコーダに自分自身の制御パラメータを決定させるよりむしろエンコードされた信号内に制御パラメータを用意することにより、トランスコーダの実施のためのコストをさらに下げることができる。
本発明とその好ましい実施の形態における様々な機能は、以下の説明と、図の相当する要素に参照番号を付加した添付図面を参照することによりよく理解できるであろう。以下の説明と図面の内容は例示としてのみ述べたもので、本発明の技術範囲を限定するためのものではないと理解すべきである。
オーディオエンコーディング伝送器の概念図である。 オーディオデコーディング受信器の概念図である。 トランスコーダの概念図である。 本発明の種々の特徴を組み込んだオーディオエンコーディング伝送器の概念図である。 本発明の種々の特徴を組み込んだオーディオエンコーディング伝送器の概念図である。 本発明の種々の特徴を実行することのできる装置の構成概念図である。
A.システムの概観
基本的なオーディオコーディングシステムは、エンコーディング伝送器、デコーディング受信器、及び、通信経路又は記録媒体を具備する。伝送器は、オーディオの1以上のチャンネルを表現する入力信号を受信し、そのオーディオを表現するエンコードされた信号を生成する。次に伝送器は、エンコードされた信号を伝達するために通信経路に伝送するか又は、エンコードされた信号を記録するために記録媒体に伝送する。受信器は、通信経路又は記録媒体からエンコードされた信号を受信し、元のオーディオの正確な又は類似の複製となる出力信号を生成する。出力信号が正確な複製でない場合、多くのコーディングシステムにより、元の入力オーディオと聴覚的に区別できない複製を供給するよう試みる。
コーディングシステムを適切に動作させるための生来的で明らかな条件は、受信器が正確に信号をデコード及びエンコードすることである。しかしながらコーディング技術の進歩により、受信器が正確にデコードできないコーディング技術によりエンコードされた信号をデコードするためにその受信器を使う必要が生じる場合がある。例えば、デコーダがスペクトル生成を行うことを前提とするエンコーディング技術によりエンコードされた信号が生成されているが、受信器はスペクトル生成ができない場合である。逆に、デコーダがスペクトル生成を行うことを前提としないエンコーディング技術によりエンコードされた信号が生成されているが、受信器はスペクトル生成を必要とするエンコードされた信号を要求し必要とする場合もある。本発明は、互換性のないコーディング技術とコーディング装置との間の架け橋となるトランスコーディングを目的とする。
本発明を実行する方法の詳細な説明の導入部として以下に2,3のコーディング技術について説明する。
1.基本システム
a)エンコーディング伝送器
経路11からオーディオ入力信号を受信するスプリットバンドオーディオコーディング伝送器10の一実施の形態の概念図である。分析フィルスペクトル成分タバンク12により、オーディオ入力信号はこのオーディオ入力信号のスペクトル成分の内容を表すスペクトル成分に分割される。エンコーダ13は、少なくとも一部のスペクトル成分をコード化されたスペクトル情報にエンコードする工程を実行する。エンコーダ13によりエンコードされなかったスペクトル成分は、量子化制御装置14から受け取った制御パラメータに応じて修正された量子化分解能を用いて、量子化装置15により量子化される。あるいは、コード化されたスペクトル成分の一部又は全てを量子化することができる。量子化制御装置14は、検出したオーディオ入力信号の特性から制御パラメータを抽出する。図示の実施の形態において、検出された特性はエンコーダ13により提供された情報から得られる。量子化制御装置14は、オーディオ信号の時間特性を含む他の特性に応答して制御信号を抽出するようにしてもよい。分析フィルタバンクにより処理がなされる前、最中、又は後にオーディオ信号の分析から、これらの特性を得ても良い。量子化されたスペクトル情報、コード化されたスペクトル情報、及び制御パラメータを表現するデータは、フォーマッタ16によりアセンブルされてエンコードされた信号になり、エンコードされた信号は送信又は記録のために経路17に伝送される。フォーマッタ16は、他のデータを、同期化ワード、パリティ又は検出コード、データベース、データベース検索キー、及び補助信号のような、エンコードされた信号にアセンブルすることができるが、これらは本発明の理解に関係しないので、これ以上説明しない。
エンコードされた信号は、超音波領域から紫外線領域の周波数を含むスペクトルにわたって、ベース帯域又は変調した通信経路を介して送信することができ、又は、磁気テープ、カード、又はディスク、光学カード又はディスク、紙のような媒体上の検出可能な表示を含む本資質的にあらゆる記録技術を用いて媒体上に記録することができる。
(1)分析フィルタバンク
以下に説明する、分析フィルタバンク12と合成フィルタバンク25は、広い範囲のディジタルフィルタ技術、ブロック変換、及びウェーブレット変換を含む、本質的にどのような方法により実行しても良い。オーディオコーディングシステムの1つにおいて、分析フィルタバンク12は、修正離散コサイン変換(MDCT)により実行され、合成フィルタバンク25は、プリンセン、他による「基時間領域エリアスキャンセル技術に基づくフィルタバンク設計を用いたサブ帯域/変換コーディング」、Proc. of the International Conf. on Acoust., Speech and Signal Proc., 1987年5月, 2161−64ページに記載された逆離散コサイン変換(IMDCT)により実行される。本質的にどんなフィルタバンクの実施も重要ではない。
ブロック変換により実行される分析フィルタバンクは、入力信号のブロック又はインターバルを分割して、その信号のインターバルにおけるスペクトル内容を表現する1組の変換係数にする。隣り合う1以上の係数のグループは、グループ内の係数の数に相応する帯域幅を持った特定の周波数サブ帯域内のスペクトル内容を表現する。ブロック変換よりむしろポリフェーズフィルタのようなディジタルフィルタにより実行される分析フィルタバンクが入力信号を分割し1組のサブ帯域信号にする。各サブ帯域信号は、特定の周波数サブ帯域内において入力信号のスペクトル内容を時間基準で表現する。サブ帯域信号は、時間の単位インターバルに対するサブ帯域信号内のサンプル数に相応する帯域幅を各サブ帯域信号が持つように、間引きすることが好ましい。
以下の説明において、上述の基時間領域エリアスキャンセル(TDAC)変換のようなブロック変換を用いる実施の形態について特に説明する。この説明において、用語「スペクトル成分」は、変換係数を意味し、用語「周波数サブ帯域」と「サブ帯域信号」は、1以上の隣接する変換係数のグループに関する。しかしながら、本発明の原理は他の実施の形態に適用しても良いので、用語「周波数サブ帯域」と「サブ帯域信号」はまた、信号の全帯域のうち一部のスペクトル内容を表現する信号に関し、用語「スペクトル成分」はサブ帯域信号のサンプル又は要素を一般に意味すると理解してよい。聴覚コーディングシステムは、人間の聴覚システムのいわゆる限界帯域幅に相応する帯域幅を持つ周波数サブ帯域を提供するための分析フィルタバンクを実行する。
(2)コーディング
エンコーダ13は必要とされるどのようなタイプのエンコーディング処理も本質的に実行することができる。一実施の形態において、エンコーディング処理によりスペクトル成分が変換されてスケーリングした値とその係数とを表すスケーリング表現となり、このスケーリング表現を以下に説明する。他の実施の形態において、スペクトル再生又はスペクトル結合のためのマトリックス化やサイドインフォメーションの生成のようなエンコーディング処理もまた用いられる。これらの技術のいくつかは以下の詳細に説明する。
伝送器10は、図1に提示されていない他のコーディング処理を具備しても良い。例えば、量子化スペクトル成分を算術コーディングやハフマンコーディングのようなエントロピーコーディング処理の対象にしてもよい。このようなコーディング処理の詳細な説明は本発明を理解するために必要ではない。
(3)量子化
量子化装置15により提供される量子化分解能は、量子化制御装置14から受け取った制御パラメータに応答して修正される。これらの制御パラメータは、要求されるいかなる方法によっても抽出することができるが、聴覚エンコーダにおいて、エンコードされたオーディオ信号によりどれだけの量の量子化されたノイズがマスクされるかを評価するためにいくつかの聴覚モデルが用いられる。多くのアプリケーションにおいて、量子化制御装置は、エンコードされた信号の情報容量に課せられた制限にも対応する。この制限は、エンコードされた信号又はエンコードされた信号の特定部分の最大許容ビットレートという用語で表現される。
聴覚コーディングシステムの好ましい実施の形態において、制御パラメータは、情報容量又はビットレート制限を前提として可聴な量子化ノイズを最小限にするために、各スペクトル成分に配分するビット数を決定し、量子化装置15が各スペクトル成分を量子化するのに用いる量子化解像度を決定するために、ビット配分処理で使われる。量子化制御装置14の特別な実施形態が本発明にとって決定的要素となることはない。
量子化制御装置の一例が、しばしばドルビーAC−3と称されるコーディングシステムについて記載したA/52書面に開示されている。本実施の形態において、オーディオ信号のスペクトル外形の推定値を与えるスケールファクタにてスケーリングされた表現で、オーディオ信号のスペクトル成分が表される。聴覚モデルは、オーディオ信号のマスキング効果を評価するマスキング曲線を計算するためにこのスケールファクタを用いる。次に量子化制御装置は、許容されるノイズの閾値を決定し、この閾値により、課せられた情報容量制限又はビットレートに適合する最適なやり方で量子化ノイズを配分するためには、どのようにスペクトル成分が量子化されるべきかを制御する。許容ノイズの閾値はマスキング曲線の複製であり、量子化制御装置により定められた量のマスキング曲線とのオフセット量である。本実施の形態において、制御パラメータは、許容ノイズの閾値を定める値である。これらのパラメータは、閾値自身、又は、スケールファクタや許容ノイズの閾値を導き出すオフセット量のような値のような数々の方法で表現することができる。
b)デコーディング受信器
経路21からオーディオ信号を表現するエンコードされた信号を受信する分割帯域オーディオデコーディング受信器20の一実施の形態を示す概念図である。デフォーマッタ22は、エンコードされた信号から量子化されたスペクトル情報、コード化されたスペクトル情報、及び制御パラメータを取得する。量子化されたスペクトル情報は、制御パラメータに応じて修正された分解能を用いて、逆量子化装置23により逆量子化される。あるいは、コード化されたスペクトル情報の一部又は全てを逆量子化しても良い。コード化されたスペクトル情報はデコーダ24によりデコードされ逆量子化されたスペクトル成分と結合され、合成フィルタバンク25によりオーディオ信号に変換されて経路26に沿って送り出される。
受信器で行われる処理は、これに対応する送信器で行われる処理を補完するものである。デフォーマッタ22は、フォーマッタ16でアセンブルされたものを逆アセンブルする。デコーダ24は、エンコーダ13により行われるエンコーディング処理とまったく逆の処理又は逆の処理に準じる処理であるデコーディング処理を行い、逆量子化装置23は、量子化装置15により行われる処理の逆の処理に準じる処理を行う。合成フィルタバンク25は、分析フィルタバンク12の行う処理と逆のフィルタ処理を行う。デコーディング処理と逆量子化処理は、送信器における処理を完全に補完する逆の処理ではないので、逆の処理に準じる処理と言われている。
ある実施の形態において、合成ノイズ又は擬似ランダムノイズは量子化されたスペクトル成分の最下位ビットに挿入されるか又は1以上のスペクトル成分の代替として用いられる。受信器はまた、送信器で行うかもしれない他のコーディング処理を補完する付加的なデコーディング処理を行っても良い。
c)トランスコーダ
図3は、オーディオ信号を表現するエンコードされた信号を経路31を通じて受け取るトランスコーダ30の一実施の形態の概念図である。デフォーマッタ32は、量子化されたスペクトル情報、コード化されたスペクトル情報、1以上の第1の制御パラメータ、及び第2の1以上の制御パラメータを、エンコードされた信号から取得する。量子化されたスペクトル情報は、エンコードされた信号から受け取った1以上の第1の制御パラメータに応じて修正された量子化分解能を用いて、逆量子化装置33により量子化される。任意的に、コード化されたスペクトル情報の一部又は全部もまた逆量子化しても良い。必要ならば、コード化されたスペクトル情報を、トランスコーディングのためにデコーダ34によりデコードしても良い。
エンコーダ35は任意的な構成要素で、特定のトランスコーディングアプリケーションには必要でないかもしれない。必要に応じてエンコーダ35は、量子化されたスペクトル情報の少なくとも一部、又はコード化及び/又はデコードされたスペクトル情報の少なくとも一部をエンコードし、再エンコードされたスペクトル情報に変換する処理を実行する。エンコーダ35によりエンコードされないスペクトル成分は、エンコードされた信号から受け取った1以上の第2の制御パラメータに応じて修正された量子化分解能を用いて、量子化装置36により再量子化される。任意的に、再エンコードされたスペクトル情報の一部又は全部を量子化してもよい。再量子化されたスペクトル情報を表すデータ、再エンコードされたスペクトル情報を表すデータ、及び、1以上の第2の制御パラメータを表すデータは、フォーマッタ37によりアセンブルされてエンコードされた信号となり、送信又は記録のために経路38を通じて送り出される。フォーマッタ37は、他のデータをアセンブルして、フォーマッタ16について上述したようなエンコードされた信号にする。
トランスコーダ30は、量子化制御装置に第1又は第2の制御パラメータを決定させるためにコンピュータのリソースを必要としないので、その動作をより効率的に行うことができる。トランスコーダ30には、エンコードされた信号から取得しないで、1以上の第2の制御パラメータ、及び/又は、1以上の第1の制御パラメータを導き出すための、上述のような量子化制御装置14のような1以上の量子化制御装置が含まれる。第1又は第2の制御パラメータを決定するために必要なエンコーディング伝送器の特徴については以下に説明する。
2.数値の説明
スケーリング
オーディオコーディングシステムは、一般に100dB以上のダイナミックレンジを持つオーディオ信号を表現しなければならない。このダイナミックレンジを表現するオーディオ信号又はそのスペクトル表現の2進表示に必要なビット数はその表現の精度に比例する。従来のコンパクトディスクオーディオ、パルス符号変調(PCM)オーディオのようなアプリケーションでは、16ビットで表現される。多くの専門的なアプリケーションでは、より広いダイナミックを持ちより精度の高いPCMオーディオを表現するために、もっと多くのビット、例えば20ビット又は24ビットが用いられる。
オーディオ信号又はそのスペクトル成分を整数で表現することは非常に非効率であり、多くのコーディングシステムでは、スケーリングされた値と対応するスケールファクタを含む他の形式の表現を用いる。
s=ν・f (1)
ここで、
s=オーディオ成分
ν=スケーリングされた値
f=対応するスケールファクタ

スケーリングされた値νは、本質的に、小数表現や整数表現を含むどんな方法で表現してもよい。正数と負数は、サインマグニチュード及び、2進数に対する1の補数と2の補数のような様々な補数表現のような種々の方法で表現してもよい。スケールファクタfは単純な数でもよく、あるいは、本質的に、指数関数gf又は対数関数loggfのようなあらゆる関数としてもよく、ここでgは指数関数又は対数関数の底である。
ディジタルコンピュータに用いるのに適した好ましい実施の形態において、2の補数を用いた2進小数で表現される「仮数」mがスケーリングされた値であり、指数関数2−xにおける「指数」xがスケールファクタである、特別な浮動小数点表現が用いられる。本説明の残りの部分では浮動小数点の仮数と指数について言及する。しかし、このような特別な表現方法は、本発明に適用するスケーリングされた値とスケールファクタで表現されたオーディオ情報の1つの方法であるにすぎないことを了解すべきである。
オーディオ信号成分の値はこの特別な浮動小数点表現では以下のように表される。
s=m・2−x (2)
例えば、スペクトル成分が0.1757812510に等しい値、これは2進数で0.00101101である、を持っていたと仮定する。この値は表Iに示すような多くの仮数と指数の対により表現することができる。
Figure 0004880053
この特別な浮動小数点表現において、負数は2の補数の値を持つ仮数により表現される。表Iの最後の行を参照すると、例えば2の補数で表現した2進数1.01101は、10進数で-0.59375を意味する。結局、表の最後の行で示した浮動小数点で表現した実際の値は、-0.59375 x 2−3 = -0.07421875であり、表に示した意図した値とは異なる。この特徴の重要性については以下に説明する。
(2)正規化
浮動小数点表現が「正規化」されている場合は、浮動小数点で表現された数値は少ないビット数で表現できる。仮数の2進数表現におけるが、その値における情報を失うことなく可能な限り最上位のビットに移動する場合を、非ゼロ浮動小数点表現は正規化されると言われている。2の補数で表現する場合において、正規化された正の仮数は常に+0.5以上で+I未満であり、正規化された負の仮数は常に−0.5未満で−1以上である。これは、符号ビットと等しくない最上位ビットを有するのと等しい。表Iにおいて、第3行の浮動小数点表現は正規化されている。正規化された仮数の指数xは2に等しく、これは1ビット分最上位ビット位置に移動させることを要求するビット移動の数である。
スペクトル成分が10進数で-0.17578125、2進数で-1.01101と等しい値を持つと仮定する。2の補数表現で最初の1ビットは数値が負であることを示す。この値は、正規化された仮数m=1.01101を持つ浮動小数点で表現された数値を表す。この正規化された仮数に対する指数xは2に等しく、これはゼロビット分最上位ビット位置に移動させることを要求するビット移動の数である。
表Iの第1、第2、及び最後の行に示した浮動小数点表現は、正規化されていない表現である。表の最初の2行に示した表現は「不足正規化(under normalized)」されており、最後の行は「過剰正規化(over normalized)」されている。
コーディングの目的で、浮動小数点で表現された数値の仮数の正確な値を少ないビット数で表現することができる。例えば、正規化されていない仮数m=0.00101101を9ビットで表現することができる。8ビットは小数値を表現するために用い、1ビットは符号を表現するために用いる。正規化された仮数m=0.101101はほんの7ビットで表現することができる。過剰正規化された表Iの最後の行に示された仮数m=1.01101はさらに少ないビットで表現することができる。しかしながら、上述したように、過剰正規化された仮数を有する浮動小数点で表現された数値はもはや正確な値を表さない。
これらの例は、不足正規化された仮数を避けることが一般に望ましい理由と過剰正規化を避けることが一般に重要である理由を説明するのに役立つ。不足正規化された仮数が存在するということは、ビットが効率的に使われていないこと又は数値が正確に表現されていないことを意味し、過剰正規化された仮数が存在するということは、値が不当に歪められているということを意味する。
(3)正規化についての他の考察
多くの実施の形態において、指数は固定ビット数で表現されるか、又は、あらかじめ定めた範囲の値を持つように制限される。もし、仮数のビット長が指数の最大可能値より長ければ、仮数は正規化することのできない値を表現することができる。例えば、指数を3ビットで表現する場合、0から7までの値を表現することができる。もし指数を16ビットで表現したとすると、表現可能な最も小さいゼロでない値は正規化のために14ビット移動する必要がある。3ビットの指数は、この仮数を正規化するために必要な値を表現することができない。この状況は、本発明の基本原理に影響を与えず、実用的な実施の形態では、算術演算において関連する指数で表現できる範囲を超えて仮数を移動させることがないようにすべきである。
各スペクトル成分を独自の仮数と指数を持ったエンコードされた信号で表現することは一般に非常に非効率的である。もし複数の仮数が共通の指数を共有するならば、指数は少なくてすむ。このような構成をしばしばブロック浮動小数点(BFP)表現と称す。ブロックの指数値は、そのブロック中の最大値を持つ値を正規化した仮数で表現できるように定められる。
指数を少なくすること、そしてその結果として指数を表現するためのビット数を少なくすることは、大きなブロックを用いるとした場合に必要である。大きなブロックを用いることはしかしながら、通常、ブロック中の多くの値を不足正規化させる。従ってブロックのサイズは、指数を伝達するのに必要なビット数と、不足正規化された仮数を表現することによる不正確さと非効率化を招くことの二律背反関係のバランスをとって、通常は選ばれる。
ブロックサイズの選択により、量子化制御装置14に用いられる聴覚モデルにより計算されるマスキング曲線の正確さのような他のコーディング特性も影響を受ける。ある実施の形態において、聴覚モデルは、マスキング曲線を計算するためにスペクトルの形の推定値としてBFPを用いる。もし非常に大きなブロックサイズをBFPに用いる場合は、BFPの指数のスペクトル分解能を減少させ、聴覚モデルで計算されたマスキング曲線の精度を下げる。追加すべき詳細はA/52書面で入手できる。
BFP表現を用いることの重要性については以下では説明しない。BFP表現を用いたとき、あるスペクトル成分は常に不足正規化されやすいということを理解すれば十分である。
(4)量子化
浮動小数点形式で表現されたスペクトル成分の量子化は一般に仮数の量子化と称される。指数は一般に量子化されず、固定ビット数で表現されるか、又は、あらかじめ定めた範囲の値を持つように制限される。
もし正規化された仮数がm=0.101101表Iに示したように0.0625=0.0001の分解能で量子化されたならば、量子化された仮数q(m)は2進数の小数0.1011に等しく、これは5ビットで表現することができ、10進数の小数0.6875に等しい。この特定の分解能で量子化した後の浮動小数点表現により表現された値はq(m)・2−x=0.6875 x 0.25=0.171875となる。
より粗い分解能で量子化した後の浮動小数点表現により表された値は、q(s)=0.5 x 0.25=0.125である。
このような特別な例は、説明の便宜のためだけのものである。量子化の特別な形式や量子化分解能と量子化された仮数を表現するためのビット数との特別な関係は、本発明の本質とは関係がない。
(5)算術演算
多くのプロセッサや他のハードウエアロジックにより、数値の浮動小数点表現に直接適用することができる特定の一群の算術演算が実行される。あるプロセッサやプロセッシングロジックは、このような演算を行わず、これらは通常非常に安価なのでこれらの型式のプロセッサを用いることはしばしば魅力的なものとなる。このようなプロセッサを用いるとき、浮動小数点演算をシミュレートする1つの方法は、浮動小数点表現を精度を向上させた固定小数点表現に変換し、変換された値に整数値用算術演算を行い、浮動小数点表現に再度変換することである。もっと効率的な方法は、仮数と指数に別々に整数値用算術演算を行うことである。
これらの算術演算を仮数に行うことの効果を考えることにより、エンコーディング伝送器は、引き続き行われるデコーディング処理における過剰正規化と不足正規化を要望通り制限又は回避できるように、そのエンコーディング処理を修正することができるであろう。スペクトル成分における仮数の過剰正規化と不足正規化とがデコーディング処理において起こったとすると、デコーダは関連する指数の値を変更することなくこの状況を訂正することができない。
指数の変更は、トランスコーディングのための制御パラメータを決定するために量子化制御装置での複雑な処理を必要とすることを意味するので、トランスコーダ30にとって特に厄介である。スペクトル成分の指数が変更された場合、エンコードされた信号中に伝達された1以上の制御パラメータはもはや有効ではなく、これらの制御パラメータを決定したエンコーディング処理がこの変更をあらかじめ見込むことができた場合でない限り再び制御パラメータを決定しなければならない。
加算、減算、及び除算の効果は、これらの算術演算が以下に説明するようなコーディング技術に用いられるので、特に関心がある。
(a)加算
2個の浮動小数点で表現された数値の加算は2つのステップにより行われる。第1のステップにおいて、必要に応じて2個の数値間で調整が行われる。もし2個の数値の指数が等しくなければ、大きい指数を持つほうの仮数のビットを、2個の指数の差に等しい数だけ右に移動させる。第2のステップでは、「仮数の和」が、2の補数計算を用いて2個の仮数の数値を加えることにより計算される。仮数の和と2個の元の数の小さいほうの指数とにより2個の元の数の和が表現される。
この加算演算の結果、仮数の和が過剰正規化又は不足正規化されるかもしれない。2個の元の仮数の和が+1以上であるか、−1未満である場合は、仮数の和は過剰正規化される。2個の元の仮数の和が+0.5未満であるか、−0.5以上である場合は、仮数の和は不足正規化される。後者の状況は2つの元の仮数が反対の符号を持つ場合に生じる。
(b)減算
2個の浮動小数点で表現された数値の減算は、加算について上述したのと類似の方法で2つのステップにより行われる。第2のステップで、「仮数の差」が、2の補数計算を用いて一方の元の仮数を他方の元の仮数から減算することにより計算される。仮数の差と2個の元の数の小さいほうの指数とにより2個の元の数の差が表現される。
この減算演算の結果、仮数の差が過剰正規化又は不足正規化されるかもしれない。2個の元の仮数の差が+0.5未満であるか、−0.5以上である場合は、仮数の差は不足正規化される。2個の元の仮数の差が+1以上であるか、−1未満である場合は、仮数の差は過剰正規化される。後者の状況は2つの元の仮数が反対の符号を持つ場合に生じる。
(c)乗算
2個の浮動小数点で表現された数値の乗算は2つのステップにより行われる。第1のステップにおいて、「指数の和」が、2個の元の数の指数を加えることにより計算される。第2のステップでは、「仮数の積」が、2の補数計算を用いて2個の仮数の数値を乗算することにより計算される。仮数の積と指数の和により2個の元の数の積が表現される。
この乗算演算の結果、仮数の積は不足正規化されるかもしれないが、1つの例外を除いて、仮数の積の大きさが決して+1以上又は−1未満とならないので、過剰正規化されることはない。2個の元の仮数の積が+0.5未満であるか、−0.5以上である場合は、仮数の積は不足正規化される。
乗算すべき両方の浮動小数点で表現された数値が−1に等しい仮数を持つとき、過剰正規化が起こる1つの例外となる。この場合、乗算により仮数の積が+1に等しくなり、これは過剰正規化である。しかしながら、乗算すべき値のうち少なくとも1つを間違いなく負にしないことにより、このような状況を避けることができる。以下に説明する合成技術として、乗算は、結合されたチャンネル信号の合成信号のためとスペクトル再生のためにのみ用いられる。結合係数を負でない値にするよう要求することによりこの例外的な状況を避け、包絡線スケーリング情報、変換された成分の混合係数、及びノイズのような成分の混合係数を負でない値にするよう要求することにより、この例外的な状況を避ける。
本説明の残りでは、この1つの例外的な状況を避けるためのコーディング技術が実行されるものと仮定する。この状況を避けることができない場合は、乗算を用いるとき過剰正規化を避けるためのステップも行わなければならない。
(d)まとめ
仮数に対するこれらの演算の効果は以下のようにまとめられる。
(1)2個の正規化された数値の加算により、正規化された、不足正規化された、又は過剰正規化された和がもたらされる。
(2)2個の正規化された数値の減算により、正規化された、不足正規化された、又は過剰正規化された差がもたらされる。
(3)2個の正規化された数値の乗算により、正規化された、不足正規化された積がもたらされるが、上述の制限を考慮すると、過剰正規化されるものではない。
これらの数値演算から得られる値は、それが正規化された場合は少ないビット数で表現することができる。不足正規化された仮数は、正規化された仮数に対する望ましい値よりも小さい指数と結びつき、不足正規化された仮数の整数表現は、最下位ビット位置からかなりのビットが失われるので、精度を失う。過剰正規化された仮数は、正規化された仮数に対する望ましい値よりも大きい指数と結びつき、過剰正規化された仮数の整数表現は、かなりのビットが最上位ビットから符号ビット位置に移動するので、歪を生じさせる。コーディング技術により正規化に影響を与えさせる方法を以下に説明する。
3.コーディング技術
アプリケーションによっては、デコードされた信号に受忍できないレベルの量子化ノイズを混入させることなしに基本的な聴覚エンコーディング技術に適合しないエンコードされた信号の情報容量に厳しい制限を課している。デコードされた信号の質を劣化させるが量子化ノイズを許容レベルに減少させる方法でそれを行う付加的なコーディング技術を用いることもできる。このようなコーディング技術を以下に説明する。
a)マトリックス化
もし2つのチャンネルの信号に高い相関関係があるならば、2チャンネルコーディングシステムの必要情報容量を減らすためにマトリックス化を用いることができる。2つの相関関係のある信号を和と差の信号にマトリックス化することにより、マトリックス化された2つの信号の内の1つは、2つの元の信号の内の1つと同じ必要情報容量を持つが、他の1つは非常に少ない必要情報容量を持つようになる。例えば、もし2つの元の信号に完全に相関関係があるのなら、マトリックス化された信号の1つの必要情報容量はゼロに近づく。
原則的に、2個の元の信号はマトリックス化された和と差の2個の信号から完全に復元することができるが、他のコーディング技術により混入された量子化ノイズにより完全な復元が妨げられる。量子化ノイズに起因するマトリックス化の問題点は本発明を理解する上での本質的事項ではないのでこれ以上説明しない。さらなる詳細は、米国特許5,291,557及びバーモン「ドルビーデジタル:デジタルテレビジョン及び記憶装置」Audio Eng. Soc. 17回国際会議、1999年8月40−57ページ、特に50−51ページのような他の文献から得られる。
2チャンネル立体音響プログラムをエンコーディングする一般的なマトリックスを以下に示す。2個の元のサブ帯域信号が高い相関性を持つと判断されるときのみ、サブ帯域信号のスペクトル成分に臨機応変にマトリックス化を適用することが好ましい。このマトリックスにより、左右の入力チャンネルのスペクトル成分は、以下のような和チャンネルの信号と差チャンネルの信号とに結合される。

Mi=1/2(Li+Ri) (3a)
Di=1/2(Li−Ri) (3b)

ここで、
Mi=マトリックスの和チャンネル出力におけるスペクトル成分i
Di=マトリックスの差チャンネル出力におけるスペクトル成分i
Li=マトリックスへの左チャンネル入力におけるスペクトル成分i
Ri=マトリックスへの右チャンネル入力におけるスペクトル成分i
和チャンネル信号と差チャンネル信号のスペクトル成分は、マトリックス化されていない信号におけるスペクトル成分に対して行うのと同様の方法でエンコードされる。左チャンネルと右チャンネルのサブ帯域信号が高い相関関係を持ち同位相である場合、和チャンネル信号におけるスペクトル成分は、左チャンネルと右チャンネルのスペクトル成分の大きさとほぼ同じ大きさを持ち、差チャンネル信号におけるスペクトル成分は、実質的にゼロに等しくなる。左チャンネルと右チャンネルのサブ帯域信号が高い相関関係を持ちお互いに逆位相である場合、スペクトル成分の大きさと、和チャンネル信号と差チャンネル信号との関係は逆になる。
サブ帯域信号に臨機応変にマトリックス化を適用する場合は、受信器がいつ相補的な逆マトリックスを使うべきかを判断できるように、各周波数のサブバンドにマトリックス化の表示を含める。受信器は、サブ帯域信号がマトリックス化されているという表示を受け取らない限り、エンコードされた信号の各チャンネルに対するサブ帯域信号を独立に処理しデコードする。受信器は、以下の逆マトリックスを適用することで、マトリックス化の効果をひっくり返し、左チャンネルと右チャンネルのサブ帯域信号のスペクトル成分を復元する。

L’i=Mi+Di (4a)
R’i=Mi−Di (4b)

ここで、
L’i=マトリックスの復元された左チャンネル出力におけるスペクトル成分i
R’i=マトリックスの復元された右チャンネル出力におけるスペクトル成分i
一般に、量子化効果があるので、復元されたスペクトル成分は元のスペクトル成分と正確に同じではない。
逆マトリックスが、正規化された仮数を持つスペクトル成分を受け取った場合は、上述したように、逆マトリックスにおける和演算と差演算により、不足正規化または過剰正規化された仮数を持つスペクトル成分を復元する結果となるかもしれない。
マトリックス化されたサブ帯域信号において1以上のスペクトル成分の代替となるものを受信器が合成する場合はこの状況はもっと複雑になる。一般に合成処理により確かでないスペクトル成分値を生成する。このように確かでないために、あらかじめ合成処理全体の効果が分かっていない限り、逆マトリックスからどのスペクトル成分が過剰正規化または不足正規化されるのかをあらかじめ判断することが不可能になる。
b)カップリング
多数チャンネルのスペクトル成分をエンコードするためにカップリングを用いてもよい。好ましい実施の形態において、カップリングは高い周波数のサブ帯域のスペクトル成分に制限される。しかし、原則的にはカップリングをどんなスペクトル部分に用いてもよい。
カップリングにより、多数チャンネルのスペクトル成分が結合されて単一の結合されたチャンネルの信号のスペクトル成分となり、元の多数チャンネルを表現する情報がエンコードされないで結合されたチャンネルの信号を表現する情報がエンコードされる。エンコードされた信号には、元の信号のスペクトルの形を表現するサイドインフォメーションが含まれる。このサイドインフォメーションにより、受信器は、結合されたチャンネルの信号から、元の多数チャンネル信号のスペクトルの形と実質的に同じ多数の信号を合成することが可能となる。カップリングを行う1つの方法はA/52書面に記載されている。
カップリングが行われる1つの簡単な実施の形態を以下に記載する。本実施の形態によれば、結合されたチャンネルのスペクトル成分は、複数チャンネルにおける対応するスペクトル成分の平均値を計算することにより形成される。元の信号のスペクトルの形を表現するこのサイドインフォメーションはカップリング係数と称される。特定のチャンネルのカップリング係数は、結合されたチャンネルの信号におけるスペクトル成分のエネルギに対する特定のチャンネルのスペクトル成分のエネルギの比から計算される。
好ましい実施の形態において、スペクトル成分とカップリング係数とは、浮動小数点で表現された数値としてエンコードされた信号内に伝達される。受信器は、結合されたチャンネルの信号における各スペクトル成分を適切なカップリング係数で乗算することにより、結合されたチャンネルの信号から複数のチャンネル信号を合成する。その結果、元の信号と同じか又は実質的に同じスペクトルの形を有する1組の合成信号となる。この演算は以下のように表現できる。

Sij=Ci・ccij (5)

ここで、
Sij=チャンネルjにおける合成スペクトル成分i
Ci=結合されたチャンネルの信号におけるスペクトル成分i
ccij=チャンネルjにおける合成スペクトル成分iのカップリング係数
結合されたチャンネルのスペクトル成分とカップリング係数とが正規化された浮動小数点で表現された数値で表わされている場合、これらの2つの数値の積は、上述した理由により不足正規化されるかもしれないが過剰正規化されることのない仮数により表現される値となる。
結合されたチャンネルの信号において1以上のスペクトル成分の代替となるものを受信器が合成する場合はこの状況はもっと複雑になる。上述のように、一般に合成処理により確かでないスペクトル成分値を生成し、スペクトル成分値が確かでないために、あらかじめ合成処理全体の効果が分かっていない限り、乗算から得られるどのスペクトル成分が不足正規化されるのかをあらかじめ判断することが不可能になる。
c)スペクトルの再生
コーディングシステムにおいて、エンコーディング伝送器はオーディオ入力信号のベース帯域部分のみエンコードし他を廃棄する。デコーディング受信器はこの廃棄された部分を代替する合成信号を生成する。エンコードされた信号には、合成された信号が廃棄されたオーディオ入力信号の部分のスペクトルレベルをある値に保持するよう信号の合成を制御ためにデコーディング処理が用いるスケーリング情報が含まれる。
スペクトル成分を様々な方法で再生してよい。スペクトル成分を生成又は合成するために方法によっては擬似乱数発生装置を用いる。他の方法では、ベース帯域信号のスペクトル成分を再生する必要のあるスペクトル部分に変換又はコピーする。本発明においてこの方法はさほど重要ではないが、いくつかの好ましい実施の形態の説明は先に引用した参考文献から得ることができる。
以下に説明するのはスペクトル成分の再生についての1つの簡単な実施の形態である。本実施の形態によれば、ベース帯域信号からスペクトル成分をコピーすることによりスペクトル成分を合成し、擬似乱数発生装置により作られたノイズのような成分とコピーした成分とを結合し、エンコードされた信号内のスケーリング情報に従い結合した信号をスケーリングする。コピーされた成分及びノイズに類似の成分の相対的な重みは、伝達されたエンコードされた信号中の混合係数に従い調整される。この演算は以下のように表現される。

si=ei・[ai・Ti+bi・Ni] (6)

ここで
si=合成されたスペクトル成分i
ei=スペクトル成分iのスケーリング情報の包絡
Ti=スペクトル成分iについてのコピーされたスペクトル成分
Ni=スペクトル成分iについて生成されたノイズに類似の成分
ai=変換された成分Tiの混合係数
bi=ノイズに類似の成分Niの混合係数
コピーされたスペクトル成分、スケーリング情報の包絡、ノイズに類似の成分、及び混合係数が正規化された浮動小数点で表現された数値で表現される場合、合成スペクトル成分を生成するために必要な加算演算及び乗算演算により、上述した理由で不足正規化または過剰正規化された仮数で表現された値が生まれる。あらかじめ合成処理全体の効果が分かっていない限り、どの合成スペクトル成分が不足正規化または過剰正規化されるのかをあらかじめ判断することが不可能になる。
B.改良された技術
本発明は、聴覚エンコードされた信号のトランスコーディングがより効率的に実施されより高品質のトランスコードされた信号を提供できるようにする技術に関する。従来のエンコーディング伝送器及びデコーディング受信器において必要とした分析フィルタと合成フィルタのようないくつかの機能をトランスコーディング処理から削除することによりこのことが達成される。簡単な形態においては、本発明によるトランスコーディングは、スペクトル情報を逆量子化するのに必要な範囲にのみ部分的なデコーディング処理を行い、逆量子化されたスペクトル情報を再量子化するのに必要な範囲にのみ部分的なエンコーディング処理を行う。必要に応じて付加的なデコーディング及びエンコーディングを行ってもよい。逆量子化及び再量子化を制御するために必要な制御パラメータをエンコードされた信号から取得することにより、トランスコーディング処理はさらに単純化される。エンコーディング伝送器がトランスコーディングに必要な制御パラメータ生成するために用いる2つの方法について以下に説明する。
1.最悪の場合の想定
a)概要
制御パラメータ生成するための第1の方法では、最悪の場合を想定し、浮動小数点で表現された指数を、過剰正規化が決して起こらないようにするために必要な範囲だけになるよう補正する。必要でない不足正規化のいくつかは予想している。1以上の第2の制御パラメータを決定するために補正された指数を量子化制御装置14が用いる。トランスコーディング処理において同様の条件で指数を補正し、浮動小数点表現が正確な値を表現するように補正された指数に関連する仮数を補正するので、補正された指数をエンコードされた信号に含める必要はない。
図2と図4を参照すると、上述したように量子化制御装置14が1以上の第1の制御パラメータを決定し、合成処理において過剰正規化が起こることのないようにするためにはどの指数を補正しなければならないかを決定するためのデコーダ24の合成処理に関連して評価装置43がスペクトル成分を分析する。これらの指数は補正され他の補正されない指数と共に量子化制御装置44に送られ、量子化制御装置44は、トランスコーダ30にて実行される再エンコーディング処理のための1以上の第2の制御パラメータを決定する。評価装置43は、過剰正規化を起こすかもしれない合成処理における算術演算のみを考慮する必要がある。このため、上述したように、この処理は過剰正規化を起こすことがないので、上述のような結合されたチャンネルの信号についての合成処理を考慮する必要がない。カップリングの他の実施の形態における算術演算は考慮する必要があるかもしれない。
b)処理の詳細
(1)マトリックス化
マトリックス化において、逆マトリックスに用いられる各仮数の正確な値は、量子化装置15により量子化が行われ、デコーディング処理により生じるノイズに類似の成分が合成された後でなければ知ることができない。この実施の形態において、仮数の値が分からないので、各マトリックス処理において最悪の条件を想定しなければならない。式4aと4bを参照すると、逆マトリックスにおける最悪の条件における演算は、同じ符号及び加算すると十分1より大きな値になる大きさを持つ2つの仮数の加算演算、又は、異なった符号及び加算すると十分1より大きな値になる大きさを持つ2つの仮数の減算演算のどちらかである。各仮数を1ビットだけ右にずらしその指数を1だけ減らすことにより、どちらの最悪の場合においてもトランスコーダの過剰正規化を避けることができる。従って、評価装置43は、逆マトリックス計算において各スペクトル成分の指数を減少させ、量子化制御装置44は、これらの補正された指数を用いて、トランスコーダのための1以上の第2の制御パラメータを決定する。これ以降の説明において、補正前の指数の値はゼロ以上であると仮定する。
逆マトリックスに実際に提供された2つの仮数が最悪の場合の条件を満たす場合、その結果は適切に正規化された仮数となる。実際の仮数が最悪の場合の条件を満たさない場合は、その結果は不足正規化された仮数となる。
(2)スペクトルの再生(HFR)
スペクトルの再生において、再生処理に用いられる各仮数の正確な値は、量子化装置15により量子化が行われ、デコーディング処理で生成されノイズに類似の成分が合成されるまで知ることができない。この実施の形態において、仮数の値が分からないので、各算術演算について最悪の場合を想定する必要がある。式6を参照すると、最悪の場合の演算とは、同じ符号及び加算すると十分1より大きな値になる大きさを持つスペクトル成分の仮数及び同じ符号及び加算すると十分1より大きな値になる大きさを持つノイズに類似の成分の仮数を加算する演算である。乗算演算が過剰正規化の原因となることはないが、過剰正規化が起こらないことを保証するものでもない。従って、合成されたスペクトル成分が過剰正規化されることを想定しなければならない。スペクトル成分の仮数とノイズに類似の成分の仮数とを1ビットだけ右にずらしその指数を1だけ減らすことにより、トランスコーダにおいて過剰正規化を避けることができる。従って、評価装置43は、変換された成分の指数を減少させ、量子化制御装置44は、これらの補正された指数を用いて、トランスコーダのための1以上の第2の制御パラメータを決定する
再生処理に実際に提供された2つの仮数が最悪の場合の条件を満たす場合、その結果は適切に正規化された仮数となる。実際の仮数が最悪の場合の条件を満たさない場合は、その結果は不足正規化された仮数となる。
c)長所と短所
最悪の場合を想定する第1の方法は、安価に実施することができる。しかしこの方法は、トランスコーダがスペクトル成分を不足正規化させ、それらを表現するためにより多くのビットを割り振らない限り、エンコードされた信号が正確さの劣るものとなってしまう。さらに、いくつかの指数値が減少しているので、これらの補正された指数に基づくマスキング曲線の精度も低下する。
2.決定論的処理
a)概要
制御パラメータ生成するための第2の方法では、過剰正規化と不足正規化の具体例で判断することを許容する処理を行う。過剰正規化を避け不足正規化の発生を最小限にするために浮動小数点の指数が補正される。補正された指数を量子化制御装置14が用いて1以上の第2の制御パラメータを決定する。トランスコーディング処理において同様の条件で指数を補正し、浮動小数点表現が正確な値を表現するように補正された指数に関連する仮数を補正するので、補正された指数をエンコードされた信号に含める必要はない。
図2と図5を参照すると、上述したように量子化制御装置14が1以上の第1の制御パラメータを決定し、合成処理において過剰正規化が起こることのないよう、また合成処理において起こる不足正規化の発生を最小限にするためにはどの指数を補正しなければならないかを決定するためのデコーダ24の合成処理に関連して合成モデル53がスペクトル成分を分析する。これらの指数は補正され他の補正されない指数と共に量子化制御装置54に送られ、量子化制御装置54は、トランスコーダ30にて実行される再エンコーディング処理のための1以上の第2の制御パラメータを決定する。合成モデル53は合成処理の全て又は一部を行い、あるいは、合成処理における全ての算術演算の正規化の効果を前もって決定しておくためにその効果をシミュレートする。
各量子化された仮数とあらゆる合成された成分は、合成モデル53で行われる分析処理に利用できるものでなければならない。合成処理において擬似乱数発生装置又は準乱数処理を用いる場合、初期化又は初期値は伝送器の分析処理及び受信器の合成処理間で同期させておく必要がある。このことは、伝送エンコーダ10に全ての初期値を決定させ、エンコードされた信号中にこれらの値の表示を含めさせることにより行うことができる。エンコードされた信号が独立した間隔又はフレーム中に配置されるならば、デコーディングにおける開始遅れを最小限にし編集のような種々のプログラム生成を容易にするために各フレーム中にこの情報を入れることが好ましい。
b)処理の詳細
(1)マトリックス化
マトリックス化において、デコーダ24により用いられるデコーディング処理において、逆マトリックスに入力するスペクトル成分の1つ又は両方を合成することは可能である。どちらかの成分が合成された場合、逆マトリックスで計算されたスペクトル成分が過剰正規化されるのか不足正規化されるのかを判断することができる。逆マトリックスで計算されたスペクトル成分は、仮数における量子化誤差に起因して過剰正規化または不足正規化されることもある。合成モデル53は、逆マトリックスに入力される仮数と指数の正確な値を決定することができるので、このような正規化されない状態をテストすることができる。
合成モデル53は、正規化が失われると判断した場合は、逆マトリックスに入力される1つ又は両方の成分の指数を、過剰正規化を避けるために減らすことができ、不足正規化を避けるために増やすことができる。補正された指数は、エンコードされた信号には含まれないが、2以上の第2の制御パラメータを決定するために量子化制御装置54により用いられる。トランスコーダ30が指数に同じ補正を行ったとき、結果として発生した浮動小数点で表現された数値が正確な指数値を表現するように、関連する仮数も補正する。
(2)スペクトルの再生(HFR)
スペクトルの再生において、デコーダ24で用いられるデコーディング処理により、変換されたスペクトル成分を合成し、変換された成分に付加されるノイズに類似の成分も合成することができる。結果として、スペクトル再生処理により計算されたスペクトル成分を過剰正規化または不足正規化することが可能となる。変換された成分の量子化誤差に起因して、再生された成分も過剰正規化又は不足正規化することができる。合成モデル53は、再生処理に入力される仮数値と指数値の正確な値を算定することができるので、これらの正規化されない状態をテストすることができる。
合成モデル53は、正規化が失われると判断した場合は、再生処理に入力される1つ又は両方の成分の指数を、過剰正規化を避けるために減らすことができ、不足正規化を避けるために増やすことができる。補正された指数は、エンコードされた信号には含まれないが、2以上の第2の制御パラメータを決定するために量子化制御装置54により用いられる。トランスコーダ30が指数に同じ補正を行ったとき、結果として発生した浮動小数点で表現された数値が正確な指数値を表現するように、関連する仮数も補正する。
カップリング
結合されたチャンネル信号の合成処理において、結合されたチャンネル信号内の1以上のスペクトル成分に、ノイズに類似の成分をデコーダ24で用いられるデコーディング処理により合成することが可能である。結果として、合成処理により計算されたスペクトル成分を不足正規化することが可能となる。結合されたチャンネル信号におけるスペクトル成分の仮数における量子化誤差に起因して、合成された成分を不足正規化することもできる。合成モデル53は、逆マトリックスに入力される仮数と指数の正確な値を決定することができるので、このような正規化されない状態をテストすることができる。
合成モデル53は、正規化が失われると判断した場合は、合成処理に入力される1つ又は両方の成分の指数を、不足正規化を避けるために増やすことができる。補正された指数は、エンコードされた信号には含まれないが、2以上の第2の制御パラメータを決定するために量子化制御装置54により用いられる。トランスコーダ30が指数に同じ補正を行ったとき、結果として発生した浮動小数点で表現された数値が正確な指数値を表現するように、関連する仮数も補正する。
c)長所と短所
決定論的方法を行う処理は、最悪の場合を推定する方法を行う場合に比べて実施がより高価となる。しかし、これらの付加的な実施コストはエンコーディング伝送器に関し、もっと安価にトランスコーダに組み込むことができる。加えて、正規化されない仮数による不正確さは、避けること又は最小限に抑えることができ、決定論的方法により補正された指数に基づくマスキング曲線は、最悪の場合を推定する方法により計算されたマスキング曲線に比べてより正確である。
C.実施
汎用コンピュータにあるのと同様の構成要素を組み合わせたディジタル信号処理(DSP)のようなより専門化した装置を含むコンピュータ又は他の装置により実行されるソフトウエアを含めた様々な方法により、本発明を様々な形態で実施することができる。図6は、本発明の実施の形態に用いることのできる装置70の構成概念図である。DSP72は計算手段を提供する。RAM73は信号処理のためにDSP72により用いられるランダムアクセスメモリ(RAM)システムである。ROM74は装置70を動作させるのに必要なプログラムを記録するためのリードオンリーメモリ(ROM)のような永続的な記憶装置を表し、本発明の様々な形態を実行する。I/O制御75は、通信チャンネル76,77の経路を通じて受信及び送信するインターフェース回路を表す。アナログオーディオ信号を受信及び/又は送信するために、アナログ・ディジタル変換器とディジタル・アナログ変換器とをI/O制御75に含めてもよい。図示の実施の形態において、全ての主な構成要素は、2以上の物理的なバスを表している場合もあるバス71につながっている。しかし、バス構造は本発明を実施するために必要なものではない。汎用コンピュータシステムで実行される実施の形態において、キーボードやマウス及びディスプレイのような装置とのインターフェースのため、及び、磁気テープ又はディスク、又は光媒体のような記憶媒体を有する記憶装置を制御するために構成要素を追加してもよい。記憶媒体は、オペレーティングシステム、ユーティリティ、及びアプリケーションへの指令のプログラムを記録するために用いてもよく、本発明の様々な特徴を実行するプログラムの形態を具備することができる。
本発明の種々の特徴を実行する上で必要な機能は、個別論理素子、集積回路、1以上の特定用途向け集積回路、及び/又は、プログラム制御プロセッサを含む種々の方法で導入される構成要素により実行することができる。これらの構成要素を導入する態様については本発明にとって重要ではない。
本発明のソフトウエアでの実施の形態は、ベース帯域又は超音波領域から紫外線領域の周波数を含むスペクトルにわたって変調した通信経路のような種々の機械的な読み取り媒体、又は磁気テープ、カード、又はディスク、光学カード又はディスク、紙のような媒体上の検出可能な表示を含む本資質的にあらゆる記録技術を用いて情報を伝達する記憶媒体により譲渡される。

Claims (21)

  1. エンコードされたオーディオ情報をトランスコーディングする方法であって、
    第1の量子化されスケーリングされた値と、オーディオ信号のスペクトル成分を表現するスケールファクタとを伝達する第1のエンコードされた信号を受信するステップであって、第1のスケールファクタの各々は、1以上の第1の量子化されスケーリングされた値と関連付けられ、第1の量子化されスケーリングされた値の各々は、関連付けられた第1のスケールファクタによりスケーリングされ、第1の量子化されスケーリングされた値の各々及び関連付けられた第1のスケールファクタとがそれぞれスペクトル成分を表現することを特徴とするステップと、
    前記第1のスケールファクタから第2のスケールファクタを導き出すステップであって、1以上の前記第2のスケールファクタは対応する第1のスケールファクタとは値が異なることを特徴とするステップと、
    1以上の第1の制御パラメータに応答して第1のビット配置処理に従いビットを配置し、前記第1のビット配置処理により配置されたビット数に基づく量子化分解能に従い逆量子化することで前記第1の量子化されスケーリングされた値から逆量子化されスケーリングされた値を取得するステップと、
    1以上の第2の制御パラメータに応答して第2のビット配置処理に従いビットを配置し、前記第2のビット配置処理により配置されたビット数に基づく量子化分解能を用いて逆量子化されスケーリングされた値を量子化することで第2の量子化されスケーリングされた値を取得するステップであって、各第2のスケールファクタは1以上の第2の量子化されスケーリングされた値と関連付けられ、各第2の量子化されスケーリングされた値は、関連付けられた第2のスケールファクタに従いスケーリングされ、各第2の量子化されスケーリングされた値及び関連付けられた第2のスケールファクタはそれぞれのスペクトル成分の値を表現することを特徴とするステップと、
    前記第2の量子化されスケーリングされた値と、前記第2のスケールファクタと、1以上の第2の制御パラメータを第2のエンコードされた信号にアセンブルするステップと、 を具備するエンコードされたオーディオ情報をトランスコーディングする方法。
  2. 前記第1のエンコードされた信号から1以上の第1の制御パラメータと1以上の第2の制御パラメータとを取得するステップを具備することを特徴とする請求項に記載の方法。
  3. 前記1以上の第1の制御パラメータは、前記第1のエンコードされた信号のビットレート要件に応答して導き出され、前記1以上の第2の制御パラメータは、前記第2のエンコードされた信号のビットレート要件に応答して導き出されたことを特徴とする請求項に記載の方法。
  4. 前記第2のスケールファクタと前記第2のエンコードされた信号のビットレート要件から、前記1以上の第2の制御パラメータを導き出すステップを具備することを特徴とする請求項に記載の方法。
  5. 前記第1のビット配置処理は、前記第1のエンコードされた信号の第1のビットレートに従って行われ、前記第2のビット配置処理は、第1のビットレートに等しい前記第2のエンコードされた信号の第2のビットレートに従って行われることを特徴とする請求項に記載の方法。
  6. 1以上の前記逆量子化されスケーリングされた値に応答するコーディング処理を行うことによりコード化されたスペクトル情報を生成するステップを具備することを特徴とする請求項に記載の方法。
  7. 前記コーディング処理は、マトリックス化、逆マトリックス化、カップリング、デカップリング、スペクトル成分を再生するためのスケールファクタ形成、及び、スペクトル成分再生の中から、1以上のコーディング技術を実行することにより前記第2のスケールファクタを生成することを特徴とする請求項に記載の方法。
  8. エンコードされたオーディオ情報をトランスコーディングするトランスコーダであって、
    第1の量子化されスケーリングされた値と、オーディオ信号のスペクトル成分を表現するスケールファクタとを伝達する第1のエンコードされた信号を受信する手段であって、第1のスケールファクタの各々は、1以上の第1の量子化されスケーリングされた値と関連付けられ、第1の量子化されスケーリングされた値の各々は、関連付けられた第1のスケールファクタによりスケーリングされ、第1の量子化されスケーリングされた値の各々及び関連付けられた第1のスケールファクタとがそれぞれスペクトル成分を表現することを特徴とする、手段と、
    前記第1のスケールファクタから第2のスケールファクタを導き出す手段であって、1以上の前記第2のスケールファクタは対応する第1のスケールファクタとは値が異なることを特徴とする手段と、
    1以上の第1の制御パラメータに応答して第1のビット配置処理に従いビットを配置し、前記第1のビット配置処理により配置されたビット数に基づく量子化分解能に従い逆量子化することで前記第1の量子化されスケーリングされた値から逆量子化されスケーリングされた値を取得する手段であって、各第2のスケールファクタは1以上の第2の量子化されスケーリングされた値と関連付けられ、各第2の量子化されスケーリングされた値は、関連付けられた第2のスケールファクタに従いスケーリングされ、各第2の量子化されスケーリングされた値及び関連付けられた第2のスケールファクタはそれぞれのスペクトル成分の値を表現することを特徴とする手段と、
    1以上の第2の制御パラメータに応答して第2のビット配置処理に従いビットを配置し、前記第2のビット配置処理により配置されたビット数に基づく量子化分解能を用いて逆量子化されスケーリングされた値を量子化することで前記第2の量子化されスケーリングされた値を取得する手段と、
    前記第2の量子化されスケーリングされた値と、前記第2のスケールファクタと、1以上の第2の制御パラメータを第2のエンコードされた信号にアセンブルする手段と、
    を具備するトランスコーダ。
  9. 前記第1のエンコードされた信号から1以上の第1の制御パラメータと1以上の第2の制御パラメータとを取得する手段を具備することを特徴とする請求項に記載のトランスコーダ。
  10. 前記1以上の第1の制御パラメータは、前記第1のエンコードされた信号のビットレート要件に応答して導き出され、前記1以上の第2の制御パラメータは、前記第2のエンコードされた信号のビットレート要件に応答して導き出されたことを特徴とする請求項に記載のトランスコーダ。
  11. 前記第2のスケールファクタと前記第2のエンコードされた信号のビットレート要件から、前記1以上の第2の制御パラメータを導き出すステップを具備することを特徴とする請求項に記載のトランスコーダ。
  12. 前記第1のビット配置処理は、前記第1のエンコードされた信号の第1のビットレートに従って行われ、前記第2のビット配置処理は、第1のビットレートに等しい前記第2のエンコードされた信号の第2のビットレートに従って行われることを特徴とする請求項に記載のトランスコーダ。
  13. 1以上の前記逆量子化されスケーリングされた値に応答するコーディング処理を行うことによりコード化されたスペクトル情報を生成する手段を具備することを特徴とする請求項に記載のトランスコーダ。
  14. 前記コーディング処理は、マトリックス化、逆マトリックス化、カップリング、デカップリング、スペクトル成分を再生するためのスケールファクタ形成、及び、スペクトル成分再生の中から、1以上のコーディング技術を実行することにより前記第2のスケールファクタを生成することを特徴とする請求項13に記載のトランスコーダ。
  15. 装置により実行できる命令のプログラムを記録した媒体であって、命令のプログラムを実行することにより、装置にオーディオ情報をトランスコーディングする方法を実行させ、該方法は、
    第1の量子化されスケーリングされた値と、オーディオ信号のスペクトル成分を表現するスケールファクタとを伝達する第1のエンコードされた信号を受信するステップであって、第1のスケールファクタの各々は、1以上の第1の量子化されスケーリングされた値と関連付けられ、第1の量子化されスケーリングされた値の各々は、関連付けられた第1のスケールファクタによりスケーリングされ、第1の量子化されスケーリングされた値の各々及び関連付けられた第1のスケールファクタとがそれぞれスペクトル成分を表現することを特徴とする、ステップと、
    前記第1のスケールファクタから第2のスケールファクタを導き出すステップであって、1以上の前記第2のスケールファクタは対応する第1のスケールファクタとは値が異なることを特徴とするステップと、
    1以上の第1の制御パラメータに応答して第1のビット配置処理に従いビットを配置し、前記第1のビット配置処理により配置されたビット数に基づく量子化分解能に従い逆量子化することで前記第1の量子化されスケーリングされた値から逆量子化されスケーリングされた値を取得するステップと、
    1以上の第2の制御パラメータに応答して第2のビット配置処理に従いビットを配置し、前記第2のビット配置処理により配置されたビット数に基づく量子化分解能を用いて逆量子化されスケーリングされた値を量子化することで第2の量子化されスケーリングされた値を取得するステップであって、各第2のスケールファクタは1以上の第2の量子化されスケーリングされた値と関連付けられ、各第2の量子化されスケーリングされた値は、
    関連付けられた第2のスケールファクタに従いスケーリングされ、各第2の量子化されスケーリングされた値及び関連付けられた第2のスケールファクタはそれぞれのスペクトル成分の値を表現することを特徴とするステップと、
    前記第2の量子化されスケーリングされた値と、前記第2のスケールファクタと、1以上の第2の制御パラメータを第2のエンコードされた信号にアセンブルするステップと、
    を具備する媒体。
  16. 前記第1のエンコードされた信号から1以上の第1の制御パラメータと1以上の第2の制御パラメータとを取得するステップを具備することを特徴とする請求項15に記載の媒体。
  17. 前記1以上の第1の制御パラメータは、前記第1のエンコードされた信号のビットレート要件に応答して導き出され、前記1以上の第2の制御パラメータは、前記第2のエンコードされた信号のビットレート要件に応答して導き出されたことを特徴とする請求項16に記載の媒体。
  18. 前記第2のスケールファクタと前記第2のエンコードされた信号のビットレート要件から、前記1以上の第2の制御パラメータを導き出すステップを具備することを特徴とする請求項15に記載の媒体。
  19. 前記第1のビット配置処理は、前記第1のエンコードされた信号の第1のビットレートに従って行われ、前記第2のビット配置処理は、第1のビットレートに等しい前記第2のエンコードされた信号の第2のビットレートに従って行われることを特徴とする請求項15に記載の媒体。
  20. 1以上の前記逆量子化されスケーリングされた値に応答するコーディング処理を行うことによりコード化されたスペクトル情報を生成するステップを具備することを特徴とする請求項15に記載の媒体。
  21. 前記コーディング処理は、マトリックス化、逆マトリックス化、カップリング、デカップリング、スペクトル成分を再生するためのスケールファクタ形成、及び、スペクトル成分再生の中から、1以上のコーディング技術を実行することにより前記第2のスケールファクタを生成することを特徴とする請求項20に記載の媒体。
JP2010112800A 2003-02-06 2010-05-17 エンコードと複雑性の低いトランスコードのための合成スペクトル成分の変換 Expired - Lifetime JP4880053B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US44593103P 2003-02-06 2003-02-06
US60/445,931 2003-02-06
US10/458,798 2003-06-09
US10/458,798 US7318027B2 (en) 2003-02-06 2003-06-09 Conversion of synthesized spectral components for encoding and low-complexity transcoding

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2006503173A Division JP4673834B2 (ja) 2003-02-06 2004-01-30 エンコードと複雑性の低いトランスコードのための合成スペクトル成分の変換

Publications (2)

Publication Number Publication Date
JP2010250328A JP2010250328A (ja) 2010-11-04
JP4880053B2 true JP4880053B2 (ja) 2012-02-22

Family

ID=32871965

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2006503173A Expired - Lifetime JP4673834B2 (ja) 2003-02-06 2004-01-30 エンコードと複雑性の低いトランスコードのための合成スペクトル成分の変換
JP2010112800A Expired - Lifetime JP4880053B2 (ja) 2003-02-06 2010-05-17 エンコードと複雑性の低いトランスコードのための合成スペクトル成分の変換

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2006503173A Expired - Lifetime JP4673834B2 (ja) 2003-02-06 2004-01-30 エンコードと複雑性の低いトランスコードのための合成スペクトル成分の変換

Country Status (20)

Country Link
US (1) US7318027B2 (ja)
EP (3) EP2136361B1 (ja)
JP (2) JP4673834B2 (ja)
KR (1) KR100992081B1 (ja)
CN (2) CN101661750B (ja)
AT (2) ATE382180T1 (ja)
AU (1) AU2004211163B2 (ja)
CA (2) CA2776988C (ja)
CY (1) CY1114289T1 (ja)
DE (2) DE602004010885T2 (ja)
DK (1) DK1590801T3 (ja)
ES (2) ES2297376T3 (ja)
HK (2) HK1080596B (ja)
IL (1) IL169442A (ja)
MX (1) MXPA05008318A (ja)
MY (1) MY142955A (ja)
PL (2) PL378175A1 (ja)
SG (1) SG144743A1 (ja)
TW (2) TWI352973B (ja)
WO (1) WO2004072957A2 (ja)

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7620545B2 (en) * 2003-07-08 2009-11-17 Industrial Technology Research Institute Scale factor based bit shifting in fine granularity scalability audio coding
US7983909B2 (en) 2003-09-15 2011-07-19 Intel Corporation Method and apparatus for encoding audio data
US20080260048A1 (en) * 2004-02-16 2008-10-23 Koninklijke Philips Electronics, N.V. Transcoder and Method of Transcoding Therefore
US20050232497A1 (en) * 2004-04-15 2005-10-20 Microsoft Corporation High-fidelity transcoding
US7406412B2 (en) * 2004-04-20 2008-07-29 Dolby Laboratories Licensing Corporation Reduced computational complexity of bit allocation for perceptual coding
KR100634506B1 (ko) * 2004-06-25 2006-10-16 삼성전자주식회사 저비트율 부호화/복호화 방법 및 장치
GB2420952B (en) * 2004-12-06 2007-03-14 Autoliv Dev A data compression method
WO2006065078A1 (en) * 2004-12-14 2006-06-22 Samsung Electronics Co., Ltd. Apparatus for encoding and decoding image and method thereof
EP1855271A1 (en) * 2006-05-12 2007-11-14 Deutsche Thomson-Brandt Gmbh Method and apparatus for re-encoding signals
CN101136200B (zh) * 2006-08-30 2011-04-20 财团法人工业技术研究院 音频信号转换编码方法与系统
US7725311B2 (en) * 2006-09-28 2010-05-25 Ericsson Ab Method and apparatus for rate reduction of coded voice traffic
US8036903B2 (en) 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
US20080097757A1 (en) * 2006-10-24 2008-04-24 Nokia Corporation Audio coding
DE102006051673A1 (de) * 2006-11-02 2008-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
US8086465B2 (en) * 2007-03-20 2011-12-27 Microsoft Corporation Transform domain transcoding and decoding of audio data using integer-reversible modulated lapped transforms
US7991622B2 (en) * 2007-03-20 2011-08-02 Microsoft Corporation Audio compression and decompression using integer-reversible modulated lapped transforms
KR101403340B1 (ko) 2007-08-02 2014-06-09 삼성전자주식회사 변환 부호화 방법 및 장치
US8457958B2 (en) * 2007-11-09 2013-06-04 Microsoft Corporation Audio transcoder using encoder-generated side information to transcode to target bit-rate
US8155241B2 (en) * 2007-12-21 2012-04-10 Mediatek Inc. System for processing common gain values
US8364471B2 (en) * 2008-11-04 2013-01-29 Lg Electronics Inc. Apparatus and method for processing a time domain audio signal with a noise filling flag
US8396114B2 (en) * 2009-01-29 2013-03-12 Microsoft Corporation Multiple bit rate video encoding using variable bit rate and dynamic resolution for adaptive video streaming
US8311115B2 (en) * 2009-01-29 2012-11-13 Microsoft Corporation Video encoding using previously calculated motion information
US8270473B2 (en) * 2009-06-12 2012-09-18 Microsoft Corporation Motion based dynamic resolution multiple bit rate video encoding
US8396119B1 (en) * 2009-09-30 2013-03-12 Ambarella, Inc. Data sample compression and decompression using randomized quantization bins
TWI443646B (zh) 2010-02-18 2014-07-01 Dolby Lab Licensing Corp 音訊解碼器及使用有效降混之解碼方法
US8705616B2 (en) 2010-06-11 2014-04-22 Microsoft Corporation Parallel multiple bitrate video encoding to reduce latency and dependences between groups of pictures
US8923386B2 (en) * 2011-02-11 2014-12-30 Alcatel Lucent Method and apparatus for signal compression and decompression
US20130006644A1 (en) * 2011-06-30 2013-01-03 Zte Corporation Method and device for spectral band replication, and method and system for audio decoding
CN103703783B (zh) * 2011-07-20 2017-11-24 飞思卡尔半导体公司 编码图像的方法及装置
US9591318B2 (en) 2011-09-16 2017-03-07 Microsoft Technology Licensing, Llc Multi-layer encoding and decoding
US11089343B2 (en) 2012-01-11 2021-08-10 Microsoft Technology Licensing, Llc Capability advertisement, configuration and control for video coding and decoding
US9378748B2 (en) * 2012-11-07 2016-06-28 Dolby Laboratories Licensing Corp. Reduced complexity converter SNR calculation
RU2621003C2 (ru) 2013-01-29 2017-05-30 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Адаптивное к тональности квантование низкой сложности аудиосигналов
KR20140117931A (ko) 2013-03-27 2014-10-08 삼성전자주식회사 오디오 디코딩 장치 및 방법
EP3671738B1 (en) * 2013-04-05 2024-06-05 Dolby International AB Audio encoder and decoder
US8804971B1 (en) 2013-04-30 2014-08-12 Dolby International Ab Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio
EP2830064A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
DE102014101307A1 (de) 2014-02-03 2015-08-06 Osram Opto Semiconductors Gmbh Kodierverfahren zur Datenkompression von Leistungsspektren eines optoelektronischen Bauteils und Dekodierverfahren
US10854209B2 (en) * 2017-10-03 2020-12-01 Qualcomm Incorporated Multi-stream audio coding
WO2019091576A1 (en) * 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
US10950251B2 (en) * 2018-03-05 2021-03-16 Dts, Inc. Coding of harmonic signals in transform-based audio codecs
CN113538485B (zh) * 2021-08-25 2022-04-22 广西科技大学 学习生物视觉通路的轮廓检测方法

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3995115A (en) 1967-08-25 1976-11-30 Bell Telephone Laboratories, Incorporated Speech privacy system
US3684838A (en) 1968-06-26 1972-08-15 Kahn Res Lab Single channel audio signal transmission system
US3880490A (en) 1973-10-01 1975-04-29 Lockheed Aircraft Corp Means and method for protecting and spacing clamped insulated wires
JPS6011360B2 (ja) 1981-12-15 1985-03-25 ケイディディ株式会社 音声符号化方式
US4667340A (en) 1983-04-13 1987-05-19 Texas Instruments Incorporated Voice messaging system with pitch-congruent baseband coding
US4790016A (en) 1985-11-14 1988-12-06 Gte Laboratories Incorporated Adaptive method and apparatus for coding speech
WO1986003873A1 (en) 1984-12-20 1986-07-03 Gte Laboratories Incorporated Method and apparatus for encoding speech
US4885790A (en) 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
US4935963A (en) 1986-01-24 1990-06-19 Racal Data Communications Inc. Method and apparatus for processing speech signals
JPS62234435A (ja) 1986-04-04 1987-10-14 Kokusai Denshin Denwa Co Ltd <Kdd> 符号化音声の復号化方式
DE3683767D1 (de) 1986-04-30 1992-03-12 Ibm Sprachkodierungsverfahren und einrichtung zur ausfuehrung dieses verfahrens.
US4776014A (en) 1986-09-02 1988-10-04 General Electric Company Method for pitch-aligned high-frequency regeneration in RELP vocoders
US5054072A (en) 1987-04-02 1991-10-01 Massachusetts Institute Of Technology Coding of acoustic waveforms
US5127054A (en) 1988-04-29 1992-06-30 Motorola, Inc. Speech quality improvement for voice coders and synthesizers
US5109417A (en) 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5054075A (en) 1989-09-05 1991-10-01 Motorola, Inc. Subband decoding method and apparatus
CN1062963C (zh) 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
DE4121137C3 (de) 1990-04-14 1995-07-13 Alps Electric Co Ltd Verbindungseinrichtung mit einem nach Art einer Uhrfeder angeordnetem elektrischen Kabel
AU653582B2 (en) 1991-01-08 1994-10-06 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
US5246382A (en) 1992-03-02 1993-09-21 G & H Technology, Inc. Crimpless, solderless, contactless, flexible cable connector
JP2693893B2 (ja) * 1992-03-30 1997-12-24 松下電器産業株式会社 ステレオ音声符号化方法
US5291557A (en) 1992-10-13 1994-03-01 Dolby Laboratories Licensing Corporation Adaptive rematrixing of matrixed audio signals
JPH07199996A (ja) * 1993-11-29 1995-08-04 Casio Comput Co Ltd 波形データ符号化装置、波形データ符号化方法、波形データ復号装置、及び波形データ符号化/復号装置
JP3223281B2 (ja) * 1993-12-10 2001-10-29 カシオ計算機株式会社 波形データ符号化装置、波形データ符号化方法、波形データ復号装置、及び波形データ符号化/復号装置
DE19509149A1 (de) 1995-03-14 1996-09-19 Donald Dipl Ing Schulz Codierverfahren
JPH08328599A (ja) * 1995-06-01 1996-12-13 Mitsubishi Electric Corp Mpegオーディオ復号器
US5718601A (en) 1995-12-21 1998-02-17 Masters; Greg N. Electrical connector assembly
DE19628293C1 (de) 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
EP0833405A1 (de) 1996-09-28 1998-04-01 Harting KGaA Steckverbindung für Koaxialkabel
FR2756978B1 (fr) 1996-12-06 1999-01-08 Radiall Sa Connecteur circulaire modulaire
US5845251A (en) * 1996-12-20 1998-12-01 U S West, Inc. Method, system and product for modifying the bandwidth of subband encoded audio data
US5970461A (en) * 1996-12-23 1999-10-19 Apple Computer, Inc. System, method and computer readable medium of efficiently decoding an AC-3 bitstream by precalculating computationally expensive values to be used in the decoding algorithm
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
DE19730130C2 (de) 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
EP1228569A1 (en) * 1999-10-30 2002-08-07 STMicroelectronics Asia Pacific Pte Ltd. A method of encoding frequency coefficients in an ac-3 encoder
GB0003954D0 (en) * 2000-02-18 2000-04-12 Radioscape Ltd Method of and apparatus for converting a signal between data compression formats
SE0001926D0 (sv) 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
SE0004187D0 (sv) 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
JP2002196792A (ja) * 2000-12-25 2002-07-12 Matsushita Electric Ind Co Ltd 音声符号化方式、音声符号化方法およびそれを用いる音声符号化装置、記録媒体、ならびに音楽配信システム
US20030028386A1 (en) * 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
JP4259110B2 (ja) * 2002-12-27 2009-04-30 カシオ計算機株式会社 波形データ符号化装置及び波形データ符号化方法
US9996281B2 (en) 2016-03-04 2018-06-12 Western Digital Technologies, Inc. Temperature variation compensation

Also Published As

Publication number Publication date
JP2006518873A (ja) 2006-08-17
JP2010250328A (ja) 2010-11-04
IL169442A0 (en) 2007-07-04
CA2512866A1 (en) 2004-08-26
HK1080596B (zh) 2008-05-09
TWI350107B (en) 2011-10-01
DE602004024139D1 (de) 2009-12-24
US20040165667A1 (en) 2004-08-26
AU2004211163B2 (en) 2009-04-23
AU2004211163A1 (en) 2004-08-26
US7318027B2 (en) 2008-01-08
HK1107607A1 (en) 2008-04-11
EP1590801B1 (en) 2007-12-26
CA2512866C (en) 2012-07-31
KR20050097990A (ko) 2005-10-10
TWI352973B (en) 2011-11-21
TW200415922A (en) 2004-08-16
IL169442A (en) 2009-09-22
EP2136361A1 (en) 2009-12-23
ATE382180T1 (de) 2008-01-15
CN101661750A (zh) 2010-03-03
EP1852852A1 (en) 2007-11-07
JP4673834B2 (ja) 2011-04-20
DK1590801T3 (da) 2008-05-05
CN100589181C (zh) 2010-02-10
SG144743A1 (en) 2008-08-28
EP2136361B1 (en) 2013-05-22
DE602004010885D1 (de) 2008-02-07
ES2421713T3 (es) 2013-09-05
CY1114289T1 (el) 2016-08-31
CN101661750B (zh) 2014-07-16
EP1852852B1 (en) 2009-11-11
PL378175A1 (pl) 2006-03-06
PL397127A1 (pl) 2012-02-13
ATE448540T1 (de) 2009-11-15
WO2004072957A3 (en) 2005-05-12
TW201126514A (en) 2011-08-01
KR100992081B1 (ko) 2010-11-04
CN1748248A (zh) 2006-03-15
HK1080596A1 (en) 2006-04-28
EP1590801A2 (en) 2005-11-02
WO2004072957A2 (en) 2004-08-26
MXPA05008318A (es) 2005-11-04
MY142955A (en) 2011-01-31
CA2776988C (en) 2015-09-29
ES2297376T3 (es) 2008-05-01
CA2776988A1 (en) 2004-08-26
DE602004010885T2 (de) 2008-12-11

Similar Documents

Publication Publication Date Title
JP4880053B2 (ja) エンコードと複雑性の低いトランスコードのための合成スペクトル成分の変換
KR101135869B1 (ko) 복수-채널 인코더, 복수-채널 인코더에 포함된 신호 프로세서, 복수-채널 인코더 내에 입력 신호를 인코딩하는 방법, 인코딩 방법에 따라 생성된 인코딩된 출력 데이터, 복수-채널 디코더, 복수-채널 디코더에서의 사용을 위한 신호 프로세서, 복수-채널 디코더에서 인코딩된 데이터를 디코딩하는 방법
JP4925671B2 (ja) デジタル信号の符号化/復号化方法及びその装置並びに記録媒体
PL183498B1 (pl) Dekoder akustyczny wielokanałowy
PL207861B1 (pl) Sposób wytwarzania kodowanych sygnałów akustycznych w telekomunikacji
US6463405B1 (en) Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband
KR100472402B1 (ko) 복수의정보신호의부호화장치및방법
KR100370411B1 (ko) 비트율 조절이 가능한 오디오 부호화방법 및 이를이용한오디오부호화기
JPH07327014A (ja) オーディオ信号高能率符号化装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110111

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110411

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110726

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20111013

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111018

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111115

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111130

R150 Certificate of patent or registration of utility model

Ref document number: 4880053

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141209

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term