JP4880053B2 - エンコードと複雑性の低いトランスコードのための合成スペクトル成分の変換 - Google Patents
エンコードと複雑性の低いトランスコードのための合成スペクトル成分の変換 Download PDFInfo
- Publication number
- JP4880053B2 JP4880053B2 JP2010112800A JP2010112800A JP4880053B2 JP 4880053 B2 JP4880053 B2 JP 4880053B2 JP 2010112800 A JP2010112800 A JP 2010112800A JP 2010112800 A JP2010112800 A JP 2010112800A JP 4880053 B2 JP4880053 B2 JP 4880053B2
- Authority
- JP
- Japan
- Prior art keywords
- scale factor
- quantized
- scaled
- value
- control parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000003595 spectral effect Effects 0.000 title claims abstract description 170
- 239000002131 composite material Substances 0.000 title description 7
- 238000000034 method Methods 0.000 claims abstract description 183
- 230000008569 process Effects 0.000 claims abstract description 103
- 230000005236 sound signal Effects 0.000 claims abstract description 24
- 230000004044 response Effects 0.000 claims abstract description 19
- 238000013139 quantization Methods 0.000 claims description 59
- 230000015572 biosynthetic process Effects 0.000 claims description 38
- 238000001228 spectrum Methods 0.000 claims description 27
- 238000010168 coupling process Methods 0.000 claims description 22
- 230000008878 coupling Effects 0.000 claims description 20
- 238000005859 coupling reaction Methods 0.000 claims description 20
- 238000003786 synthesis reaction Methods 0.000 description 35
- 238000007667 floating Methods 0.000 description 26
- 239000011159 matrix material Substances 0.000 description 24
- 238000004458 analytical method Methods 0.000 description 15
- 230000000295 complement effect Effects 0.000 description 14
- 238000010606 normalization Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 12
- 230000000694 effects Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 230000000873 masking effect Effects 0.000 description 10
- 238000007792 addition Methods 0.000 description 8
- 230000000875 corresponding effect Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 230000002829 reductive effect Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000008929 regeneration Effects 0.000 description 6
- 238000011069 regeneration method Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 238000012937 correction Methods 0.000 description 5
- 230000002441 reversible effect Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
- Stereophonic System (AREA)
- Electrophonic Musical Instruments (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Description
多くの通信システムは、情報伝達容量と記録容量の需要がしばしば利用可能な容量を上回ることがあるという問題に直面している。その結果、人間の感覚で感知できる音質を損なうことなくオーディオ信号を伝達又は記憶させるのに必要な情報量を減らすことが放送及び記録分野に携わる人々の間で多大な関心事となっている。また与えられたバンド幅又は記憶容量において出力信号の感知できる音質を改善することも関心事となっている。
既知のコーディング技術により、聴覚的に感知できる所定のレベルまでオーディオ信号の必要情報容量を削減する。逆に言えば、所定の情報容量を持ったオーディオ信号の聴覚的に感知できるレベルを改善する。このような成功にもかかわらず、さらなる改良の必要性が存在し、新しいコーディング技術を発見し、既知の技術を使う新しい方法を発見するために、コーディングについての研究が続けられている。
この目的は特許請求の範囲に記載された発明により達成される。トランスコーディングにより、エンコードされた入力信号をデコードしてスペクトル成分を取得し、そして、このスペクトル成分をエンコードしてエンコードされた出力信号とする。合成フィルタと分析フィルタのために被る実施のためのコストと信号の劣化が避けられる。トランスコーダに自分自身の制御パラメータを決定させるよりむしろエンコードされた信号内に制御パラメータを用意することにより、トランスコーダの実施のためのコストをさらに下げることができる。
基本的なオーディオコーディングシステムは、エンコーディング伝送器、デコーディング受信器、及び、通信経路又は記録媒体を具備する。伝送器は、オーディオの1以上のチャンネルを表現する入力信号を受信し、そのオーディオを表現するエンコードされた信号を生成する。次に伝送器は、エンコードされた信号を伝達するために通信経路に伝送するか又は、エンコードされた信号を記録するために記録媒体に伝送する。受信器は、通信経路又は記録媒体からエンコードされた信号を受信し、元のオーディオの正確な又は類似の複製となる出力信号を生成する。出力信号が正確な複製でない場合、多くのコーディングシステムにより、元の入力オーディオと聴覚的に区別できない複製を供給するよう試みる。
a)エンコーディング伝送器
経路11からオーディオ入力信号を受信するスプリットバンドオーディオコーディング伝送器10の一実施の形態の概念図である。分析フィルスペクトル成分タバンク12により、オーディオ入力信号はこのオーディオ入力信号のスペクトル成分の内容を表すスペクトル成分に分割される。エンコーダ13は、少なくとも一部のスペクトル成分をコード化されたスペクトル情報にエンコードする工程を実行する。エンコーダ13によりエンコードされなかったスペクトル成分は、量子化制御装置14から受け取った制御パラメータに応じて修正された量子化分解能を用いて、量子化装置15により量子化される。あるいは、コード化されたスペクトル成分の一部又は全てを量子化することができる。量子化制御装置14は、検出したオーディオ入力信号の特性から制御パラメータを抽出する。図示の実施の形態において、検出された特性はエンコーダ13により提供された情報から得られる。量子化制御装置14は、オーディオ信号の時間特性を含む他の特性に応答して制御信号を抽出するようにしてもよい。分析フィルタバンクにより処理がなされる前、最中、又は後にオーディオ信号の分析から、これらの特性を得ても良い。量子化されたスペクトル情報、コード化されたスペクトル情報、及び制御パラメータを表現するデータは、フォーマッタ16によりアセンブルされてエンコードされた信号になり、エンコードされた信号は送信又は記録のために経路17に伝送される。フォーマッタ16は、他のデータを、同期化ワード、パリティ又は検出コード、データベース、データベース検索キー、及び補助信号のような、エンコードされた信号にアセンブルすることができるが、これらは本発明の理解に関係しないので、これ以上説明しない。
以下に説明する、分析フィルタバンク12と合成フィルタバンク25は、広い範囲のディジタルフィルタ技術、ブロック変換、及びウェーブレット変換を含む、本質的にどのような方法により実行しても良い。オーディオコーディングシステムの1つにおいて、分析フィルタバンク12は、修正離散コサイン変換(MDCT)により実行され、合成フィルタバンク25は、プリンセン、他による「基時間領域エリアスキャンセル技術に基づくフィルタバンク設計を用いたサブ帯域/変換コーディング」、Proc. of the International Conf. on Acoust., Speech and Signal Proc., 1987年5月, 2161−64ページに記載された逆離散コサイン変換(IMDCT)により実行される。本質的にどんなフィルタバンクの実施も重要ではない。
エンコーダ13は必要とされるどのようなタイプのエンコーディング処理も本質的に実行することができる。一実施の形態において、エンコーディング処理によりスペクトル成分が変換されてスケーリングした値とその係数とを表すスケーリング表現となり、このスケーリング表現を以下に説明する。他の実施の形態において、スペクトル再生又はスペクトル結合のためのマトリックス化やサイドインフォメーションの生成のようなエンコーディング処理もまた用いられる。これらの技術のいくつかは以下の詳細に説明する。
量子化装置15により提供される量子化分解能は、量子化制御装置14から受け取った制御パラメータに応答して修正される。これらの制御パラメータは、要求されるいかなる方法によっても抽出することができるが、聴覚エンコーダにおいて、エンコードされたオーディオ信号によりどれだけの量の量子化されたノイズがマスクされるかを評価するためにいくつかの聴覚モデルが用いられる。多くのアプリケーションにおいて、量子化制御装置は、エンコードされた信号の情報容量に課せられた制限にも対応する。この制限は、エンコードされた信号又はエンコードされた信号の特定部分の最大許容ビットレートという用語で表現される。
経路21からオーディオ信号を表現するエンコードされた信号を受信する分割帯域オーディオデコーディング受信器20の一実施の形態を示す概念図である。デフォーマッタ22は、エンコードされた信号から量子化されたスペクトル情報、コード化されたスペクトル情報、及び制御パラメータを取得する。量子化されたスペクトル情報は、制御パラメータに応じて修正された分解能を用いて、逆量子化装置23により逆量子化される。あるいは、コード化されたスペクトル情報の一部又は全てを逆量子化しても良い。コード化されたスペクトル情報はデコーダ24によりデコードされ逆量子化されたスペクトル成分と結合され、合成フィルタバンク25によりオーディオ信号に変換されて経路26に沿って送り出される。
図3は、オーディオ信号を表現するエンコードされた信号を経路31を通じて受け取るトランスコーダ30の一実施の形態の概念図である。デフォーマッタ32は、量子化されたスペクトル情報、コード化されたスペクトル情報、1以上の第1の制御パラメータ、及び第2の1以上の制御パラメータを、エンコードされた信号から取得する。量子化されたスペクトル情報は、エンコードされた信号から受け取った1以上の第1の制御パラメータに応じて修正された量子化分解能を用いて、逆量子化装置33により量子化される。任意的に、コード化されたスペクトル情報の一部又は全部もまた逆量子化しても良い。必要ならば、コード化されたスペクトル情報を、トランスコーディングのためにデコーダ34によりデコードしても良い。
スケーリング
オーディオコーディングシステムは、一般に100dB以上のダイナミックレンジを持つオーディオ信号を表現しなければならない。このダイナミックレンジを表現するオーディオ信号又はそのスペクトル表現の2進表示に必要なビット数はその表現の精度に比例する。従来のコンパクトディスクオーディオ、パルス符号変調(PCM)オーディオのようなアプリケーションでは、16ビットで表現される。多くの専門的なアプリケーションでは、より広いダイナミックを持ちより精度の高いPCMオーディオを表現するために、もっと多くのビット、例えば20ビット又は24ビットが用いられる。
ここで、
s=オーディオ成分
ν=スケーリングされた値
f=対応するスケールファクタ
スケーリングされた値νは、本質的に、小数表現や整数表現を含むどんな方法で表現してもよい。正数と負数は、サインマグニチュード及び、2進数に対する1の補数と2の補数のような様々な補数表現のような種々の方法で表現してもよい。スケールファクタfは単純な数でもよく、あるいは、本質的に、指数関数gf又は対数関数loggfのようなあらゆる関数としてもよく、ここでgは指数関数又は対数関数の底である。
例えば、スペクトル成分が0.1757812510に等しい値、これは2進数で0.001011012である、を持っていたと仮定する。この値は表Iに示すような多くの仮数と指数の対により表現することができる。
浮動小数点表現が「正規化」されている場合は、浮動小数点で表現された数値は少ないビット数で表現できる。仮数の2進数表現におけるが、その値における情報を失うことなく可能な限り最上位のビットに移動する場合を、非ゼロ浮動小数点表現は正規化されると言われている。2の補数で表現する場合において、正規化された正の仮数は常に+0.5以上で+I未満であり、正規化された負の仮数は常に−0.5未満で−1以上である。これは、符号ビットと等しくない最上位ビットを有するのと等しい。表Iにおいて、第3行の浮動小数点表現は正規化されている。正規化された仮数の指数xは2に等しく、これは1ビット分最上位ビット位置に移動させることを要求するビット移動の数である。
多くの実施の形態において、指数は固定ビット数で表現されるか、又は、あらかじめ定めた範囲の値を持つように制限される。もし、仮数のビット長が指数の最大可能値より長ければ、仮数は正規化することのできない値を表現することができる。例えば、指数を3ビットで表現する場合、0から7までの値を表現することができる。もし指数を16ビットで表現したとすると、表現可能な最も小さいゼロでない値は正規化のために14ビット移動する必要がある。3ビットの指数は、この仮数を正規化するために必要な値を表現することができない。この状況は、本発明の基本原理に影響を与えず、実用的な実施の形態では、算術演算において関連する指数で表現できる範囲を超えて仮数を移動させることがないようにすべきである。
浮動小数点形式で表現されたスペクトル成分の量子化は一般に仮数の量子化と称される。指数は一般に量子化されず、固定ビット数で表現されるか、又は、あらかじめ定めた範囲の値を持つように制限される。
多くのプロセッサや他のハードウエアロジックにより、数値の浮動小数点表現に直接適用することができる特定の一群の算術演算が実行される。あるプロセッサやプロセッシングロジックは、このような演算を行わず、これらは通常非常に安価なのでこれらの型式のプロセッサを用いることはしばしば魅力的なものとなる。このようなプロセッサを用いるとき、浮動小数点演算をシミュレートする1つの方法は、浮動小数点表現を精度を向上させた固定小数点表現に変換し、変換された値に整数値用算術演算を行い、浮動小数点表現に再度変換することである。もっと効率的な方法は、仮数と指数に別々に整数値用算術演算を行うことである。
2個の浮動小数点で表現された数値の加算は2つのステップにより行われる。第1のステップにおいて、必要に応じて2個の数値間で調整が行われる。もし2個の数値の指数が等しくなければ、大きい指数を持つほうの仮数のビットを、2個の指数の差に等しい数だけ右に移動させる。第2のステップでは、「仮数の和」が、2の補数計算を用いて2個の仮数の数値を加えることにより計算される。仮数の和と2個の元の数の小さいほうの指数とにより2個の元の数の和が表現される。
2個の浮動小数点で表現された数値の減算は、加算について上述したのと類似の方法で2つのステップにより行われる。第2のステップで、「仮数の差」が、2の補数計算を用いて一方の元の仮数を他方の元の仮数から減算することにより計算される。仮数の差と2個の元の数の小さいほうの指数とにより2個の元の数の差が表現される。
2個の浮動小数点で表現された数値の乗算は2つのステップにより行われる。第1のステップにおいて、「指数の和」が、2個の元の数の指数を加えることにより計算される。第2のステップでは、「仮数の積」が、2の補数計算を用いて2個の仮数の数値を乗算することにより計算される。仮数の積と指数の和により2個の元の数の積が表現される。
仮数に対するこれらの演算の効果は以下のようにまとめられる。
アプリケーションによっては、デコードされた信号に受忍できないレベルの量子化ノイズを混入させることなしに基本的な聴覚エンコーディング技術に適合しないエンコードされた信号の情報容量に厳しい制限を課している。デコードされた信号の質を劣化させるが量子化ノイズを許容レベルに減少させる方法でそれを行う付加的なコーディング技術を用いることもできる。このようなコーディング技術を以下に説明する。
もし2つのチャンネルの信号に高い相関関係があるならば、2チャンネルコーディングシステムの必要情報容量を減らすためにマトリックス化を用いることができる。2つの相関関係のある信号を和と差の信号にマトリックス化することにより、マトリックス化された2つの信号の内の1つは、2つの元の信号の内の1つと同じ必要情報容量を持つが、他の1つは非常に少ない必要情報容量を持つようになる。例えば、もし2つの元の信号に完全に相関関係があるのなら、マトリックス化された信号の1つの必要情報容量はゼロに近づく。
Mi=1/2(Li+Ri) (3a)
Di=1/2(Li−Ri) (3b)
ここで、
Mi=マトリックスの和チャンネル出力におけるスペクトル成分i
Di=マトリックスの差チャンネル出力におけるスペクトル成分i
Li=マトリックスへの左チャンネル入力におけるスペクトル成分i
Ri=マトリックスへの右チャンネル入力におけるスペクトル成分i
和チャンネル信号と差チャンネル信号のスペクトル成分は、マトリックス化されていない信号におけるスペクトル成分に対して行うのと同様の方法でエンコードされる。左チャンネルと右チャンネルのサブ帯域信号が高い相関関係を持ち同位相である場合、和チャンネル信号におけるスペクトル成分は、左チャンネルと右チャンネルのスペクトル成分の大きさとほぼ同じ大きさを持ち、差チャンネル信号におけるスペクトル成分は、実質的にゼロに等しくなる。左チャンネルと右チャンネルのサブ帯域信号が高い相関関係を持ちお互いに逆位相である場合、スペクトル成分の大きさと、和チャンネル信号と差チャンネル信号との関係は逆になる。
L’i=Mi+Di (4a)
R’i=Mi−Di (4b)
ここで、
L’i=マトリックスの復元された左チャンネル出力におけるスペクトル成分i
R’i=マトリックスの復元された右チャンネル出力におけるスペクトル成分i
一般に、量子化効果があるので、復元されたスペクトル成分は元のスペクトル成分と正確に同じではない。
多数チャンネルのスペクトル成分をエンコードするためにカップリングを用いてもよい。好ましい実施の形態において、カップリングは高い周波数のサブ帯域のスペクトル成分に制限される。しかし、原則的にはカップリングをどんなスペクトル部分に用いてもよい。
Sij=Ci・ccij (5)
ここで、
Sij=チャンネルjにおける合成スペクトル成分i
Ci=結合されたチャンネルの信号におけるスペクトル成分i
ccij=チャンネルjにおける合成スペクトル成分iのカップリング係数
結合されたチャンネルのスペクトル成分とカップリング係数とが正規化された浮動小数点で表現された数値で表わされている場合、これらの2つの数値の積は、上述した理由により不足正規化されるかもしれないが過剰正規化されることのない仮数により表現される値となる。
コーディングシステムにおいて、エンコーディング伝送器はオーディオ入力信号のベース帯域部分のみエンコードし他を廃棄する。デコーディング受信器はこの廃棄された部分を代替する合成信号を生成する。エンコードされた信号には、合成された信号が廃棄されたオーディオ入力信号の部分のスペクトルレベルをある値に保持するよう信号の合成を制御ためにデコーディング処理が用いるスケーリング情報が含まれる。
si=ei・[ai・Ti+bi・Ni] (6)
ここで
si=合成されたスペクトル成分i
ei=スペクトル成分iのスケーリング情報の包絡
Ti=スペクトル成分iについてのコピーされたスペクトル成分
Ni=スペクトル成分iについて生成されたノイズに類似の成分
ai=変換された成分Tiの混合係数
bi=ノイズに類似の成分Niの混合係数
コピーされたスペクトル成分、スケーリング情報の包絡、ノイズに類似の成分、及び混合係数が正規化された浮動小数点で表現された数値で表現される場合、合成スペクトル成分を生成するために必要な加算演算及び乗算演算により、上述した理由で不足正規化または過剰正規化された仮数で表現された値が生まれる。あらかじめ合成処理全体の効果が分かっていない限り、どの合成スペクトル成分が不足正規化または過剰正規化されるのかをあらかじめ判断することが不可能になる。
本発明は、聴覚エンコードされた信号のトランスコーディングがより効率的に実施されより高品質のトランスコードされた信号を提供できるようにする技術に関する。従来のエンコーディング伝送器及びデコーディング受信器において必要とした分析フィルタと合成フィルタのようないくつかの機能をトランスコーディング処理から削除することによりこのことが達成される。簡単な形態においては、本発明によるトランスコーディングは、スペクトル情報を逆量子化するのに必要な範囲にのみ部分的なデコーディング処理を行い、逆量子化されたスペクトル情報を再量子化するのに必要な範囲にのみ部分的なエンコーディング処理を行う。必要に応じて付加的なデコーディング及びエンコーディングを行ってもよい。逆量子化及び再量子化を制御するために必要な制御パラメータをエンコードされた信号から取得することにより、トランスコーディング処理はさらに単純化される。エンコーディング伝送器がトランスコーディングに必要な制御パラメータ生成するために用いる2つの方法について以下に説明する。
a)概要
制御パラメータ生成するための第1の方法では、最悪の場合を想定し、浮動小数点で表現された指数を、過剰正規化が決して起こらないようにするために必要な範囲だけになるよう補正する。必要でない不足正規化のいくつかは予想している。1以上の第2の制御パラメータを決定するために補正された指数を量子化制御装置14が用いる。トランスコーディング処理において同様の条件で指数を補正し、浮動小数点表現が正確な値を表現するように補正された指数に関連する仮数を補正するので、補正された指数をエンコードされた信号に含める必要はない。
(1)マトリックス化
マトリックス化において、逆マトリックスに用いられる各仮数の正確な値は、量子化装置15により量子化が行われ、デコーディング処理により生じるノイズに類似の成分が合成された後でなければ知ることができない。この実施の形態において、仮数の値が分からないので、各マトリックス処理において最悪の条件を想定しなければならない。式4aと4bを参照すると、逆マトリックスにおける最悪の条件における演算は、同じ符号及び加算すると十分1より大きな値になる大きさを持つ2つの仮数の加算演算、又は、異なった符号及び加算すると十分1より大きな値になる大きさを持つ2つの仮数の減算演算のどちらかである。各仮数を1ビットだけ右にずらしその指数を1だけ減らすことにより、どちらの最悪の場合においてもトランスコーダの過剰正規化を避けることができる。従って、評価装置43は、逆マトリックス計算において各スペクトル成分の指数を減少させ、量子化制御装置44は、これらの補正された指数を用いて、トランスコーダのための1以上の第2の制御パラメータを決定する。これ以降の説明において、補正前の指数の値はゼロ以上であると仮定する。
スペクトルの再生において、再生処理に用いられる各仮数の正確な値は、量子化装置15により量子化が行われ、デコーディング処理で生成されノイズに類似の成分が合成されるまで知ることができない。この実施の形態において、仮数の値が分からないので、各算術演算について最悪の場合を想定する必要がある。式6を参照すると、最悪の場合の演算とは、同じ符号及び加算すると十分1より大きな値になる大きさを持つスペクトル成分の仮数及び同じ符号及び加算すると十分1より大きな値になる大きさを持つノイズに類似の成分の仮数を加算する演算である。乗算演算が過剰正規化の原因となることはないが、過剰正規化が起こらないことを保証するものでもない。従って、合成されたスペクトル成分が過剰正規化されることを想定しなければならない。スペクトル成分の仮数とノイズに類似の成分の仮数とを1ビットだけ右にずらしその指数を1だけ減らすことにより、トランスコーダにおいて過剰正規化を避けることができる。従って、評価装置43は、変換された成分の指数を減少させ、量子化制御装置44は、これらの補正された指数を用いて、トランスコーダのための1以上の第2の制御パラメータを決定する
再生処理に実際に提供された2つの仮数が最悪の場合の条件を満たす場合、その結果は適切に正規化された仮数となる。実際の仮数が最悪の場合の条件を満たさない場合は、その結果は不足正規化された仮数となる。
最悪の場合を想定する第1の方法は、安価に実施することができる。しかしこの方法は、トランスコーダがスペクトル成分を不足正規化させ、それらを表現するためにより多くのビットを割り振らない限り、エンコードされた信号が正確さの劣るものとなってしまう。さらに、いくつかの指数値が減少しているので、これらの補正された指数に基づくマスキング曲線の精度も低下する。
a)概要
制御パラメータ生成するための第2の方法では、過剰正規化と不足正規化の具体例で判断することを許容する処理を行う。過剰正規化を避け不足正規化の発生を最小限にするために浮動小数点の指数が補正される。補正された指数を量子化制御装置14が用いて1以上の第2の制御パラメータを決定する。トランスコーディング処理において同様の条件で指数を補正し、浮動小数点表現が正確な値を表現するように補正された指数に関連する仮数を補正するので、補正された指数をエンコードされた信号に含める必要はない。
(1)マトリックス化
マトリックス化において、デコーダ24により用いられるデコーディング処理において、逆マトリックスに入力するスペクトル成分の1つ又は両方を合成することは可能である。どちらかの成分が合成された場合、逆マトリックスで計算されたスペクトル成分が過剰正規化されるのか不足正規化されるのかを判断することができる。逆マトリックスで計算されたスペクトル成分は、仮数における量子化誤差に起因して過剰正規化または不足正規化されることもある。合成モデル53は、逆マトリックスに入力される仮数と指数の正確な値を決定することができるので、このような正規化されない状態をテストすることができる。
スペクトルの再生において、デコーダ24で用いられるデコーディング処理により、変換されたスペクトル成分を合成し、変換された成分に付加されるノイズに類似の成分も合成することができる。結果として、スペクトル再生処理により計算されたスペクトル成分を過剰正規化または不足正規化することが可能となる。変換された成分の量子化誤差に起因して、再生された成分も過剰正規化又は不足正規化することができる。合成モデル53は、再生処理に入力される仮数値と指数値の正確な値を算定することができるので、これらの正規化されない状態をテストすることができる。
結合されたチャンネル信号の合成処理において、結合されたチャンネル信号内の1以上のスペクトル成分に、ノイズに類似の成分をデコーダ24で用いられるデコーディング処理により合成することが可能である。結果として、合成処理により計算されたスペクトル成分を不足正規化することが可能となる。結合されたチャンネル信号におけるスペクトル成分の仮数における量子化誤差に起因して、合成された成分を不足正規化することもできる。合成モデル53は、逆マトリックスに入力される仮数と指数の正確な値を決定することができるので、このような正規化されない状態をテストすることができる。
決定論的方法を行う処理は、最悪の場合を推定する方法を行う場合に比べて実施がより高価となる。しかし、これらの付加的な実施コストはエンコーディング伝送器に関し、もっと安価にトランスコーダに組み込むことができる。加えて、正規化されない仮数による不正確さは、避けること又は最小限に抑えることができ、決定論的方法により補正された指数に基づくマスキング曲線は、最悪の場合を推定する方法により計算されたマスキング曲線に比べてより正確である。
汎用コンピュータにあるのと同様の構成要素を組み合わせたディジタル信号処理(DSP)のようなより専門化した装置を含むコンピュータ又は他の装置により実行されるソフトウエアを含めた様々な方法により、本発明を様々な形態で実施することができる。図6は、本発明の実施の形態に用いることのできる装置70の構成概念図である。DSP72は計算手段を提供する。RAM73は信号処理のためにDSP72により用いられるランダムアクセスメモリ(RAM)システムである。ROM74は装置70を動作させるのに必要なプログラムを記録するためのリードオンリーメモリ(ROM)のような永続的な記憶装置を表し、本発明の様々な形態を実行する。I/O制御75は、通信チャンネル76,77の経路を通じて受信及び送信するインターフェース回路を表す。アナログオーディオ信号を受信及び/又は送信するために、アナログ・ディジタル変換器とディジタル・アナログ変換器とをI/O制御75に含めてもよい。図示の実施の形態において、全ての主な構成要素は、2以上の物理的なバスを表している場合もあるバス71につながっている。しかし、バス構造は本発明を実施するために必要なものではない。汎用コンピュータシステムで実行される実施の形態において、キーボードやマウス及びディスプレイのような装置とのインターフェースのため、及び、磁気テープ又はディスク、又は光媒体のような記憶媒体を有する記憶装置を制御するために構成要素を追加してもよい。記憶媒体は、オペレーティングシステム、ユーティリティ、及びアプリケーションへの指令のプログラムを記録するために用いてもよく、本発明の様々な特徴を実行するプログラムの形態を具備することができる。
Claims (21)
- エンコードされたオーディオ情報をトランスコーディングする方法であって、
第1の量子化されスケーリングされた値と、オーディオ信号のスペクトル成分を表現するスケールファクタとを伝達する第1のエンコードされた信号を受信するステップであって、第1のスケールファクタの各々は、1以上の第1の量子化されスケーリングされた値と関連付けられ、第1の量子化されスケーリングされた値の各々は、関連付けられた第1のスケールファクタによりスケーリングされ、第1の量子化されスケーリングされた値の各々及び関連付けられた第1のスケールファクタとがそれぞれスペクトル成分を表現することを特徴とするステップと、
前記第1のスケールファクタから第2のスケールファクタを導き出すステップであって、1以上の前記第2のスケールファクタは対応する第1のスケールファクタとは値が異なることを特徴とするステップと、
1以上の第1の制御パラメータに応答して第1のビット配置処理に従いビットを配置し、前記第1のビット配置処理により配置されたビット数に基づく量子化分解能に従い逆量子化することで前記第1の量子化されスケーリングされた値から逆量子化されスケーリングされた値を取得するステップと、
1以上の第2の制御パラメータに応答して第2のビット配置処理に従いビットを配置し、前記第2のビット配置処理により配置されたビット数に基づく量子化分解能を用いて逆量子化されスケーリングされた値を量子化することで第2の量子化されスケーリングされた値を取得するステップであって、各第2のスケールファクタは1以上の第2の量子化されスケーリングされた値と関連付けられ、各第2の量子化されスケーリングされた値は、関連付けられた第2のスケールファクタに従いスケーリングされ、各第2の量子化されスケーリングされた値及び関連付けられた第2のスケールファクタはそれぞれのスペクトル成分の値を表現することを特徴とするステップと、
前記第2の量子化されスケーリングされた値と、前記第2のスケールファクタと、1以上の第2の制御パラメータを第2のエンコードされた信号にアセンブルするステップと、 を具備するエンコードされたオーディオ情報をトランスコーディングする方法。 - 前記第1のエンコードされた信号から1以上の第1の制御パラメータと1以上の第2の制御パラメータとを取得するステップを具備することを特徴とする請求項1に記載の方法。
- 前記1以上の第1の制御パラメータは、前記第1のエンコードされた信号のビットレート要件に応答して導き出され、前記1以上の第2の制御パラメータは、前記第2のエンコードされた信号のビットレート要件に応答して導き出されたことを特徴とする請求項2に記載の方法。
- 前記第2のスケールファクタと前記第2のエンコードされた信号のビットレート要件から、前記1以上の第2の制御パラメータを導き出すステップを具備することを特徴とする請求項1に記載の方法。
- 前記第1のビット配置処理は、前記第1のエンコードされた信号の第1のビットレートに従って行われ、前記第2のビット配置処理は、第1のビットレートに等しい前記第2のエンコードされた信号の第2のビットレートに従って行われることを特徴とする請求項1に記載の方法。
- 1以上の前記逆量子化されスケーリングされた値に応答するコーディング処理を行うことによりコード化されたスペクトル情報を生成するステップを具備することを特徴とする請求項1に記載の方法。
- 前記コーディング処理は、マトリックス化、逆マトリックス化、カップリング、デカップリング、スペクトル成分を再生するためのスケールファクタ形成、及び、スペクトル成分再生の中から、1以上のコーディング技術を実行することにより前記第2のスケールファクタを生成することを特徴とする請求項6に記載の方法。
- エンコードされたオーディオ情報をトランスコーディングするトランスコーダであって、
第1の量子化されスケーリングされた値と、オーディオ信号のスペクトル成分を表現するスケールファクタとを伝達する第1のエンコードされた信号を受信する手段であって、第1のスケールファクタの各々は、1以上の第1の量子化されスケーリングされた値と関連付けられ、第1の量子化されスケーリングされた値の各々は、関連付けられた第1のスケールファクタによりスケーリングされ、第1の量子化されスケーリングされた値の各々及び関連付けられた第1のスケールファクタとがそれぞれスペクトル成分を表現することを特徴とする、手段と、
前記第1のスケールファクタから第2のスケールファクタを導き出す手段であって、1以上の前記第2のスケールファクタは対応する第1のスケールファクタとは値が異なることを特徴とする手段と、
1以上の第1の制御パラメータに応答して第1のビット配置処理に従いビットを配置し、前記第1のビット配置処理により配置されたビット数に基づく量子化分解能に従い逆量子化することで前記第1の量子化されスケーリングされた値から逆量子化されスケーリングされた値を取得する手段であって、各第2のスケールファクタは1以上の第2の量子化されスケーリングされた値と関連付けられ、各第2の量子化されスケーリングされた値は、関連付けられた第2のスケールファクタに従いスケーリングされ、各第2の量子化されスケーリングされた値及び関連付けられた第2のスケールファクタはそれぞれのスペクトル成分の値を表現することを特徴とする手段と、
1以上の第2の制御パラメータに応答して第2のビット配置処理に従いビットを配置し、前記第2のビット配置処理により配置されたビット数に基づく量子化分解能を用いて逆量子化されスケーリングされた値を量子化することで前記第2の量子化されスケーリングされた値を取得する手段と、
前記第2の量子化されスケーリングされた値と、前記第2のスケールファクタと、1以上の第2の制御パラメータを第2のエンコードされた信号にアセンブルする手段と、
を具備するトランスコーダ。 - 前記第1のエンコードされた信号から1以上の第1の制御パラメータと1以上の第2の制御パラメータとを取得する手段を具備することを特徴とする請求項8に記載のトランスコーダ。
- 前記1以上の第1の制御パラメータは、前記第1のエンコードされた信号のビットレート要件に応答して導き出され、前記1以上の第2の制御パラメータは、前記第2のエンコードされた信号のビットレート要件に応答して導き出されたことを特徴とする請求項9に記載のトランスコーダ。
- 前記第2のスケールファクタと前記第2のエンコードされた信号のビットレート要件から、前記1以上の第2の制御パラメータを導き出すステップを具備することを特徴とする請求項8に記載のトランスコーダ。
- 前記第1のビット配置処理は、前記第1のエンコードされた信号の第1のビットレートに従って行われ、前記第2のビット配置処理は、第1のビットレートに等しい前記第2のエンコードされた信号の第2のビットレートに従って行われることを特徴とする請求項8に記載のトランスコーダ。
- 1以上の前記逆量子化されスケーリングされた値に応答するコーディング処理を行うことによりコード化されたスペクトル情報を生成する手段を具備することを特徴とする請求項8に記載のトランスコーダ。
- 前記コーディング処理は、マトリックス化、逆マトリックス化、カップリング、デカップリング、スペクトル成分を再生するためのスケールファクタ形成、及び、スペクトル成分再生の中から、1以上のコーディング技術を実行することにより前記第2のスケールファクタを生成することを特徴とする請求項13に記載のトランスコーダ。
- 装置により実行できる命令のプログラムを記録した媒体であって、命令のプログラムを実行することにより、装置にオーディオ情報をトランスコーディングする方法を実行させ、該方法は、
第1の量子化されスケーリングされた値と、オーディオ信号のスペクトル成分を表現するスケールファクタとを伝達する第1のエンコードされた信号を受信するステップであって、第1のスケールファクタの各々は、1以上の第1の量子化されスケーリングされた値と関連付けられ、第1の量子化されスケーリングされた値の各々は、関連付けられた第1のスケールファクタによりスケーリングされ、第1の量子化されスケーリングされた値の各々及び関連付けられた第1のスケールファクタとがそれぞれスペクトル成分を表現することを特徴とする、ステップと、
前記第1のスケールファクタから第2のスケールファクタを導き出すステップであって、1以上の前記第2のスケールファクタは対応する第1のスケールファクタとは値が異なることを特徴とするステップと、
1以上の第1の制御パラメータに応答して第1のビット配置処理に従いビットを配置し、前記第1のビット配置処理により配置されたビット数に基づく量子化分解能に従い逆量子化することで前記第1の量子化されスケーリングされた値から逆量子化されスケーリングされた値を取得するステップと、
1以上の第2の制御パラメータに応答して第2のビット配置処理に従いビットを配置し、前記第2のビット配置処理により配置されたビット数に基づく量子化分解能を用いて逆量子化されスケーリングされた値を量子化することで第2の量子化されスケーリングされた値を取得するステップであって、各第2のスケールファクタは1以上の第2の量子化されスケーリングされた値と関連付けられ、各第2の量子化されスケーリングされた値は、
関連付けられた第2のスケールファクタに従いスケーリングされ、各第2の量子化されスケーリングされた値及び関連付けられた第2のスケールファクタはそれぞれのスペクトル成分の値を表現することを特徴とするステップと、
前記第2の量子化されスケーリングされた値と、前記第2のスケールファクタと、1以上の第2の制御パラメータを第2のエンコードされた信号にアセンブルするステップと、
を具備する媒体。 - 前記第1のエンコードされた信号から1以上の第1の制御パラメータと1以上の第2の制御パラメータとを取得するステップを具備することを特徴とする請求項15に記載の媒体。
- 前記1以上の第1の制御パラメータは、前記第1のエンコードされた信号のビットレート要件に応答して導き出され、前記1以上の第2の制御パラメータは、前記第2のエンコードされた信号のビットレート要件に応答して導き出されたことを特徴とする請求項16に記載の媒体。
- 前記第2のスケールファクタと前記第2のエンコードされた信号のビットレート要件から、前記1以上の第2の制御パラメータを導き出すステップを具備することを特徴とする請求項15に記載の媒体。
- 前記第1のビット配置処理は、前記第1のエンコードされた信号の第1のビットレートに従って行われ、前記第2のビット配置処理は、第1のビットレートに等しい前記第2のエンコードされた信号の第2のビットレートに従って行われることを特徴とする請求項15に記載の媒体。
- 1以上の前記逆量子化されスケーリングされた値に応答するコーディング処理を行うことによりコード化されたスペクトル情報を生成するステップを具備することを特徴とする請求項15に記載の媒体。
- 前記コーディング処理は、マトリックス化、逆マトリックス化、カップリング、デカップリング、スペクトル成分を再生するためのスケールファクタ形成、及び、スペクトル成分再生の中から、1以上のコーディング技術を実行することにより前記第2のスケールファクタを生成することを特徴とする請求項20に記載の媒体。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US44593103P | 2003-02-06 | 2003-02-06 | |
US60/445,931 | 2003-02-06 | ||
US10/458,798 | 2003-06-09 | ||
US10/458,798 US7318027B2 (en) | 2003-02-06 | 2003-06-09 | Conversion of synthesized spectral components for encoding and low-complexity transcoding |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006503173A Division JP4673834B2 (ja) | 2003-02-06 | 2004-01-30 | エンコードと複雑性の低いトランスコードのための合成スペクトル成分の変換 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010250328A JP2010250328A (ja) | 2010-11-04 |
JP4880053B2 true JP4880053B2 (ja) | 2012-02-22 |
Family
ID=32871965
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006503173A Expired - Lifetime JP4673834B2 (ja) | 2003-02-06 | 2004-01-30 | エンコードと複雑性の低いトランスコードのための合成スペクトル成分の変換 |
JP2010112800A Expired - Lifetime JP4880053B2 (ja) | 2003-02-06 | 2010-05-17 | エンコードと複雑性の低いトランスコードのための合成スペクトル成分の変換 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006503173A Expired - Lifetime JP4673834B2 (ja) | 2003-02-06 | 2004-01-30 | エンコードと複雑性の低いトランスコードのための合成スペクトル成分の変換 |
Country Status (20)
Country | Link |
---|---|
US (1) | US7318027B2 (ja) |
EP (3) | EP2136361B1 (ja) |
JP (2) | JP4673834B2 (ja) |
KR (1) | KR100992081B1 (ja) |
CN (2) | CN101661750B (ja) |
AT (2) | ATE382180T1 (ja) |
AU (1) | AU2004211163B2 (ja) |
CA (2) | CA2776988C (ja) |
CY (1) | CY1114289T1 (ja) |
DE (2) | DE602004010885T2 (ja) |
DK (1) | DK1590801T3 (ja) |
ES (2) | ES2297376T3 (ja) |
HK (2) | HK1080596B (ja) |
IL (1) | IL169442A (ja) |
MX (1) | MXPA05008318A (ja) |
MY (1) | MY142955A (ja) |
PL (2) | PL378175A1 (ja) |
SG (1) | SG144743A1 (ja) |
TW (2) | TWI352973B (ja) |
WO (1) | WO2004072957A2 (ja) |
Families Citing this family (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7620545B2 (en) * | 2003-07-08 | 2009-11-17 | Industrial Technology Research Institute | Scale factor based bit shifting in fine granularity scalability audio coding |
US7983909B2 (en) | 2003-09-15 | 2011-07-19 | Intel Corporation | Method and apparatus for encoding audio data |
US20080260048A1 (en) * | 2004-02-16 | 2008-10-23 | Koninklijke Philips Electronics, N.V. | Transcoder and Method of Transcoding Therefore |
US20050232497A1 (en) * | 2004-04-15 | 2005-10-20 | Microsoft Corporation | High-fidelity transcoding |
US7406412B2 (en) * | 2004-04-20 | 2008-07-29 | Dolby Laboratories Licensing Corporation | Reduced computational complexity of bit allocation for perceptual coding |
KR100634506B1 (ko) * | 2004-06-25 | 2006-10-16 | 삼성전자주식회사 | 저비트율 부호화/복호화 방법 및 장치 |
GB2420952B (en) * | 2004-12-06 | 2007-03-14 | Autoliv Dev | A data compression method |
WO2006065078A1 (en) * | 2004-12-14 | 2006-06-22 | Samsung Electronics Co., Ltd. | Apparatus for encoding and decoding image and method thereof |
EP1855271A1 (en) * | 2006-05-12 | 2007-11-14 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for re-encoding signals |
CN101136200B (zh) * | 2006-08-30 | 2011-04-20 | 财团法人工业技术研究院 | 音频信号转换编码方法与系统 |
US7725311B2 (en) * | 2006-09-28 | 2010-05-25 | Ericsson Ab | Method and apparatus for rate reduction of coded voice traffic |
US8036903B2 (en) | 2006-10-18 | 2011-10-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system |
US20080097757A1 (en) * | 2006-10-24 | 2008-04-24 | Nokia Corporation | Audio coding |
DE102006051673A1 (de) * | 2006-11-02 | 2008-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale |
US8086465B2 (en) * | 2007-03-20 | 2011-12-27 | Microsoft Corporation | Transform domain transcoding and decoding of audio data using integer-reversible modulated lapped transforms |
US7991622B2 (en) * | 2007-03-20 | 2011-08-02 | Microsoft Corporation | Audio compression and decompression using integer-reversible modulated lapped transforms |
KR101403340B1 (ko) | 2007-08-02 | 2014-06-09 | 삼성전자주식회사 | 변환 부호화 방법 및 장치 |
US8457958B2 (en) * | 2007-11-09 | 2013-06-04 | Microsoft Corporation | Audio transcoder using encoder-generated side information to transcode to target bit-rate |
US8155241B2 (en) * | 2007-12-21 | 2012-04-10 | Mediatek Inc. | System for processing common gain values |
US8364471B2 (en) * | 2008-11-04 | 2013-01-29 | Lg Electronics Inc. | Apparatus and method for processing a time domain audio signal with a noise filling flag |
US8396114B2 (en) * | 2009-01-29 | 2013-03-12 | Microsoft Corporation | Multiple bit rate video encoding using variable bit rate and dynamic resolution for adaptive video streaming |
US8311115B2 (en) * | 2009-01-29 | 2012-11-13 | Microsoft Corporation | Video encoding using previously calculated motion information |
US8270473B2 (en) * | 2009-06-12 | 2012-09-18 | Microsoft Corporation | Motion based dynamic resolution multiple bit rate video encoding |
US8396119B1 (en) * | 2009-09-30 | 2013-03-12 | Ambarella, Inc. | Data sample compression and decompression using randomized quantization bins |
TWI443646B (zh) | 2010-02-18 | 2014-07-01 | Dolby Lab Licensing Corp | 音訊解碼器及使用有效降混之解碼方法 |
US8705616B2 (en) | 2010-06-11 | 2014-04-22 | Microsoft Corporation | Parallel multiple bitrate video encoding to reduce latency and dependences between groups of pictures |
US8923386B2 (en) * | 2011-02-11 | 2014-12-30 | Alcatel Lucent | Method and apparatus for signal compression and decompression |
US20130006644A1 (en) * | 2011-06-30 | 2013-01-03 | Zte Corporation | Method and device for spectral band replication, and method and system for audio decoding |
CN103703783B (zh) * | 2011-07-20 | 2017-11-24 | 飞思卡尔半导体公司 | 编码图像的方法及装置 |
US9591318B2 (en) | 2011-09-16 | 2017-03-07 | Microsoft Technology Licensing, Llc | Multi-layer encoding and decoding |
US11089343B2 (en) | 2012-01-11 | 2021-08-10 | Microsoft Technology Licensing, Llc | Capability advertisement, configuration and control for video coding and decoding |
US9378748B2 (en) * | 2012-11-07 | 2016-06-28 | Dolby Laboratories Licensing Corp. | Reduced complexity converter SNR calculation |
RU2621003C2 (ru) | 2013-01-29 | 2017-05-30 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Адаптивное к тональности квантование низкой сложности аудиосигналов |
KR20140117931A (ko) | 2013-03-27 | 2014-10-08 | 삼성전자주식회사 | 오디오 디코딩 장치 및 방법 |
EP3671738B1 (en) * | 2013-04-05 | 2024-06-05 | Dolby International AB | Audio encoder and decoder |
US8804971B1 (en) | 2013-04-30 | 2014-08-12 | Dolby International Ab | Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio |
EP2830064A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection |
DE102014101307A1 (de) | 2014-02-03 | 2015-08-06 | Osram Opto Semiconductors Gmbh | Kodierverfahren zur Datenkompression von Leistungsspektren eines optoelektronischen Bauteils und Dekodierverfahren |
US10854209B2 (en) * | 2017-10-03 | 2020-12-01 | Qualcomm Incorporated | Multi-stream audio coding |
WO2019091576A1 (en) * | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
US10950251B2 (en) * | 2018-03-05 | 2021-03-16 | Dts, Inc. | Coding of harmonic signals in transform-based audio codecs |
CN113538485B (zh) * | 2021-08-25 | 2022-04-22 | 广西科技大学 | 学习生物视觉通路的轮廓检测方法 |
Family Cites Families (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3995115A (en) | 1967-08-25 | 1976-11-30 | Bell Telephone Laboratories, Incorporated | Speech privacy system |
US3684838A (en) | 1968-06-26 | 1972-08-15 | Kahn Res Lab | Single channel audio signal transmission system |
US3880490A (en) | 1973-10-01 | 1975-04-29 | Lockheed Aircraft Corp | Means and method for protecting and spacing clamped insulated wires |
JPS6011360B2 (ja) | 1981-12-15 | 1985-03-25 | ケイディディ株式会社 | 音声符号化方式 |
US4667340A (en) | 1983-04-13 | 1987-05-19 | Texas Instruments Incorporated | Voice messaging system with pitch-congruent baseband coding |
US4790016A (en) | 1985-11-14 | 1988-12-06 | Gte Laboratories Incorporated | Adaptive method and apparatus for coding speech |
WO1986003873A1 (en) | 1984-12-20 | 1986-07-03 | Gte Laboratories Incorporated | Method and apparatus for encoding speech |
US4885790A (en) | 1985-03-18 | 1989-12-05 | Massachusetts Institute Of Technology | Processing of acoustic waveforms |
US4935963A (en) | 1986-01-24 | 1990-06-19 | Racal Data Communications Inc. | Method and apparatus for processing speech signals |
JPS62234435A (ja) | 1986-04-04 | 1987-10-14 | Kokusai Denshin Denwa Co Ltd <Kdd> | 符号化音声の復号化方式 |
DE3683767D1 (de) | 1986-04-30 | 1992-03-12 | Ibm | Sprachkodierungsverfahren und einrichtung zur ausfuehrung dieses verfahrens. |
US4776014A (en) | 1986-09-02 | 1988-10-04 | General Electric Company | Method for pitch-aligned high-frequency regeneration in RELP vocoders |
US5054072A (en) | 1987-04-02 | 1991-10-01 | Massachusetts Institute Of Technology | Coding of acoustic waveforms |
US5127054A (en) | 1988-04-29 | 1992-06-30 | Motorola, Inc. | Speech quality improvement for voice coders and synthesizers |
US5109417A (en) | 1989-01-27 | 1992-04-28 | Dolby Laboratories Licensing Corporation | Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio |
US5054075A (en) | 1989-09-05 | 1991-10-01 | Motorola, Inc. | Subband decoding method and apparatus |
CN1062963C (zh) | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
DE4121137C3 (de) | 1990-04-14 | 1995-07-13 | Alps Electric Co Ltd | Verbindungseinrichtung mit einem nach Art einer Uhrfeder angeordnetem elektrischen Kabel |
AU653582B2 (en) | 1991-01-08 | 1994-10-06 | Dolby Laboratories Licensing Corporation | Encoder/decoder for multidimensional sound fields |
US5246382A (en) | 1992-03-02 | 1993-09-21 | G & H Technology, Inc. | Crimpless, solderless, contactless, flexible cable connector |
JP2693893B2 (ja) * | 1992-03-30 | 1997-12-24 | 松下電器産業株式会社 | ステレオ音声符号化方法 |
US5291557A (en) | 1992-10-13 | 1994-03-01 | Dolby Laboratories Licensing Corporation | Adaptive rematrixing of matrixed audio signals |
JPH07199996A (ja) * | 1993-11-29 | 1995-08-04 | Casio Comput Co Ltd | 波形データ符号化装置、波形データ符号化方法、波形データ復号装置、及び波形データ符号化/復号装置 |
JP3223281B2 (ja) * | 1993-12-10 | 2001-10-29 | カシオ計算機株式会社 | 波形データ符号化装置、波形データ符号化方法、波形データ復号装置、及び波形データ符号化/復号装置 |
DE19509149A1 (de) | 1995-03-14 | 1996-09-19 | Donald Dipl Ing Schulz | Codierverfahren |
JPH08328599A (ja) * | 1995-06-01 | 1996-12-13 | Mitsubishi Electric Corp | Mpegオーディオ復号器 |
US5718601A (en) | 1995-12-21 | 1998-02-17 | Masters; Greg N. | Electrical connector assembly |
DE19628293C1 (de) | 1996-07-12 | 1997-12-11 | Fraunhofer Ges Forschung | Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion |
EP0833405A1 (de) | 1996-09-28 | 1998-04-01 | Harting KGaA | Steckverbindung für Koaxialkabel |
FR2756978B1 (fr) | 1996-12-06 | 1999-01-08 | Radiall Sa | Connecteur circulaire modulaire |
US5845251A (en) * | 1996-12-20 | 1998-12-01 | U S West, Inc. | Method, system and product for modifying the bandwidth of subband encoded audio data |
US5970461A (en) * | 1996-12-23 | 1999-10-19 | Apple Computer, Inc. | System, method and computer readable medium of efficiently decoding an AC-3 bitstream by precalculating computationally expensive values to be used in the decoding algorithm |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
DE19730130C2 (de) | 1997-07-14 | 2002-02-28 | Fraunhofer Ges Forschung | Verfahren zum Codieren eines Audiosignals |
SE9903553D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
EP1228569A1 (en) * | 1999-10-30 | 2002-08-07 | STMicroelectronics Asia Pacific Pte Ltd. | A method of encoding frequency coefficients in an ac-3 encoder |
GB0003954D0 (en) * | 2000-02-18 | 2000-04-12 | Radioscape Ltd | Method of and apparatus for converting a signal between data compression formats |
SE0001926D0 (sv) | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
SE0004187D0 (sv) | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
JP2002196792A (ja) * | 2000-12-25 | 2002-07-12 | Matsushita Electric Ind Co Ltd | 音声符号化方式、音声符号化方法およびそれを用いる音声符号化装置、記録媒体、ならびに音楽配信システム |
US20030028386A1 (en) * | 2001-04-02 | 2003-02-06 | Zinser Richard L. | Compressed domain universal transcoder |
JP4259110B2 (ja) * | 2002-12-27 | 2009-04-30 | カシオ計算機株式会社 | 波形データ符号化装置及び波形データ符号化方法 |
US9996281B2 (en) | 2016-03-04 | 2018-06-12 | Western Digital Technologies, Inc. | Temperature variation compensation |
-
2003
- 2003-06-09 US US10/458,798 patent/US7318027B2/en active Active
-
2004
- 2004-01-15 TW TW099129455A patent/TWI352973B/zh not_active IP Right Cessation
- 2004-01-15 TW TW093101043A patent/TWI350107B/zh not_active IP Right Cessation
- 2004-01-30 ES ES04707005T patent/ES2297376T3/es not_active Expired - Lifetime
- 2004-01-30 EP EP20090012227 patent/EP2136361B1/en not_active Expired - Lifetime
- 2004-01-30 PL PL378175A patent/PL378175A1/pl not_active IP Right Cessation
- 2004-01-30 DE DE200460010885 patent/DE602004010885T2/de not_active Expired - Lifetime
- 2004-01-30 AT AT04707005T patent/ATE382180T1/de active
- 2004-01-30 ES ES09012227T patent/ES2421713T3/es not_active Expired - Lifetime
- 2004-01-30 MX MXPA05008318A patent/MXPA05008318A/es active IP Right Grant
- 2004-01-30 DE DE200460024139 patent/DE602004024139D1/de not_active Expired - Lifetime
- 2004-01-30 SG SG200604994-4A patent/SG144743A1/en unknown
- 2004-01-30 EP EP20070015219 patent/EP1852852B1/en not_active Expired - Lifetime
- 2004-01-30 CN CN200910164435.9A patent/CN101661750B/zh not_active Expired - Lifetime
- 2004-01-30 KR KR1020057014508A patent/KR100992081B1/ko active IP Right Grant
- 2004-01-30 WO PCT/US2004/002605 patent/WO2004072957A2/en active IP Right Grant
- 2004-01-30 EP EP20040707005 patent/EP1590801B1/en not_active Expired - Lifetime
- 2004-01-30 AU AU2004211163A patent/AU2004211163B2/en not_active Expired
- 2004-01-30 CA CA2776988A patent/CA2776988C/en not_active Expired - Lifetime
- 2004-01-30 AT AT07015219T patent/ATE448540T1/de not_active IP Right Cessation
- 2004-01-30 PL PL397127A patent/PL397127A1/pl not_active Application Discontinuation
- 2004-01-30 CN CN200480003666A patent/CN100589181C/zh not_active Expired - Lifetime
- 2004-01-30 DK DK04707005T patent/DK1590801T3/da active
- 2004-01-30 JP JP2006503173A patent/JP4673834B2/ja not_active Expired - Lifetime
- 2004-01-30 CA CA 2512866 patent/CA2512866C/en not_active Expired - Lifetime
- 2004-02-05 MY MYPI20040348A patent/MY142955A/en unknown
-
2005
- 2005-06-28 IL IL169442A patent/IL169442A/en active IP Right Grant
-
2006
- 2006-01-06 HK HK06100259.0A patent/HK1080596B/zh not_active IP Right Cessation
-
2007
- 2007-11-29 HK HK07113012.0A patent/HK1107607A1/xx not_active IP Right Cessation
-
2010
- 2010-05-17 JP JP2010112800A patent/JP4880053B2/ja not_active Expired - Lifetime
-
2013
- 2013-07-26 CY CY20131100641T patent/CY1114289T1/el unknown
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4880053B2 (ja) | エンコードと複雑性の低いトランスコードのための合成スペクトル成分の変換 | |
KR101135869B1 (ko) | 복수-채널 인코더, 복수-채널 인코더에 포함된 신호 프로세서, 복수-채널 인코더 내에 입력 신호를 인코딩하는 방법, 인코딩 방법에 따라 생성된 인코딩된 출력 데이터, 복수-채널 디코더, 복수-채널 디코더에서의 사용을 위한 신호 프로세서, 복수-채널 디코더에서 인코딩된 데이터를 디코딩하는 방법 | |
JP4925671B2 (ja) | デジタル信号の符号化/復号化方法及びその装置並びに記録媒体 | |
PL183498B1 (pl) | Dekoder akustyczny wielokanałowy | |
PL207861B1 (pl) | Sposób wytwarzania kodowanych sygnałów akustycznych w telekomunikacji | |
US6463405B1 (en) | Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband | |
KR100472402B1 (ko) | 복수의정보신호의부호화장치및방법 | |
KR100370411B1 (ko) | 비트율 조절이 가능한 오디오 부호화방법 및 이를이용한오디오부호화기 | |
JPH07327014A (ja) | オーディオ信号高能率符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110111 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110411 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110726 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20111013 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111018 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111115 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111130 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4880053 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141209 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |