JP2004264811A - オーディオの量子化および逆量子化 - Google Patents
オーディオの量子化および逆量子化 Download PDFInfo
- Publication number
- JP2004264811A JP2004264811A JP2003309277A JP2003309277A JP2004264811A JP 2004264811 A JP2004264811 A JP 2004264811A JP 2003309277 A JP2003309277 A JP 2003309277A JP 2003309277 A JP2003309277 A JP 2003309277A JP 2004264811 A JP2004264811 A JP 2004264811A
- Authority
- JP
- Japan
- Prior art keywords
- channel
- encoder
- channels
- quantization
- matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013139 quantization Methods 0.000 title claims abstract description 300
- 238000000034 method Methods 0.000 claims abstract description 214
- 239000003607 modifier Substances 0.000 claims abstract description 54
- 230000002123 temporal effect Effects 0.000 claims abstract description 41
- 239000011159 matrix material Substances 0.000 claims description 320
- 230000008569 process Effects 0.000 claims description 18
- 230000008859 change Effects 0.000 claims description 16
- 230000006837 decompression Effects 0.000 claims description 8
- 238000011156 evaluation Methods 0.000 claims description 8
- 238000012952 Resampling Methods 0.000 claims description 7
- 238000007907 direct compression Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 abstract description 16
- 238000006243 chemical reaction Methods 0.000 description 55
- 238000007906 compression Methods 0.000 description 39
- 230000006835 compression Effects 0.000 description 39
- 238000012805 post-processing Methods 0.000 description 38
- 230000009466 transformation Effects 0.000 description 37
- 238000007781 pre-processing Methods 0.000 description 33
- 238000013459 approach Methods 0.000 description 31
- 230000000875 corresponding effect Effects 0.000 description 22
- 238000010586 diagram Methods 0.000 description 17
- 230000007704 transition Effects 0.000 description 14
- 230000003044 adaptive effect Effects 0.000 description 10
- 230000002596 correlated effect Effects 0.000 description 9
- 238000005070 sampling Methods 0.000 description 9
- 230000005236 sound signal Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 239000000872 buffer Substances 0.000 description 7
- 238000002156 mixing Methods 0.000 description 7
- 238000005192 partition Methods 0.000 description 7
- 238000000926 separation method Methods 0.000 description 7
- 230000009471 action Effects 0.000 description 6
- 238000005259 measurement Methods 0.000 description 5
- 230000008447 perception Effects 0.000 description 5
- 238000000638 solvent extraction Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000005284 excitation Effects 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000000844 transformation Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000011217 control strategy Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000013707 sensory perception of sound Effects 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000005056 compaction Methods 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
【解決手段】 オーディオエンコーダは、複数のチャネルのオーディオデータを量子化し、複数のチャネル固有クォンタイザステップ変更子を適用し、これによって、エンコーダに、チャネルの間での再構成品質のバランスに対するより多くの制御が与えられる。エンコーダは、複数の量子化行列を適用し、量子化行列の分解能を変更し、これによって、エンコーダが、全体的な品質がよい場合に高い分解能、全体的な品質が低い場合に低い分解能を使用することが可能になる。最後に、エンコーダは、時間圧縮を使用して1つまたは複数の量子化行列を圧縮して、量子化行列に関連するビットレートを減らす。オーディオデコーダは、対応する逆処理およびデコーディングを実行する。
【選択図】 図14
Description
コンピュータでは、オーディオ情報を、オーディオ情報を表す一連の数として処理する。たとえば、単一の数が、オーディオサンプルを表すことができ、このオーディオサンプルは、特定の時刻の振幅値(すなわち、音の大きさ)である。サンプル深さ(sample depth)、サンプリングレート(sampling rate)、およびチャネルモードなど、複数の要因が、オーディオ情報の品質に影響する。
多くのコンピュータおよびコンピュータネットワークに、生ディジタルオーディオを処理するリソース(資源)が不足している。圧縮(エンコーディングまたはコーディングとも称する)では、情報をよりビットレートの低い形に変換することによって、オーディオ情報の保管および伝送のコストを下げる。圧縮は、ロスレス(損失のない)(lossless)(品質に影響しない)、またはロッシイ(損失のある)(lossy)(品質に影響するが、後続のロスレス圧縮からのビットレート削減がより劇的である)とすることができる。圧縮解除(復元)(デコーディング(複合化、解読、逆符号化)とも称する)によって、圧縮された形から元の情報の再構成されたバージョンが抽出される。
一般に、オーディオ圧縮の目標は、オーディオ信号をディジタルに表現して、可能な最小限の量のビットで最高の信号品質をもたらすことである。通常のオーディオエンコーダ/デコーダ[「コーデック(codec)」]システムでは、サブバンド/変換コーディング、量子化、レート制御、および可変長コーディングを使用して、その圧縮を達成する。量子化および他のロッシイ圧縮手法によって、潜在的に可聴の雑音がオーディオ信号に導入される。雑音の可聴性は、どれほどの雑音があるかと、雑音のどれだけを聴取者が知覚するかに依存する。第1の要因は、主に客観的な品質に関し、第2の要因は、人間による音の知覚に依存する。
全体として、エンコーダ(100)は、入力オーディオサンプル(105)の時系列を受け取り、オーディオサンプル(105)を圧縮し、エンコーダ(100)のさまざまなモジュールによって作られる情報を多重化して、ビットストリーム(195)を出力する。エンコーダ(100)には、周波数トランスフォーマ(変換器)(frequency transformer)(110)、マルチチャネルトランスフォーマ(multi−channel transformer)(120)、知覚モデラ(モデル信号発生器)(perception modeler)(130)、ウェイタ(重み付け器)(weighter)(140)、クォンタイザ(量子化器)(quantizer)(150)、エントロピエンコーダ(entropy encoder)(160)、コントローラ(170)、およびビットストリームマルチプレクサ(bitstream multiplexer)[「MUX」](180)が含まれる。
全体として、デコーダ(200)は、エントロピエンコードされたデータならびにサイド情報を含む圧縮オーディオ情報のビットストリーム(205)を受け取り、このビットストリームから、オーディオサンプル(295)を再構成する。オーディオデコーダ(200)には、ビットストリームデマルチプレクサ[「DEMUX」](210)、エントロピデコーダ(220)、逆クォンタイザ(230)、雑音ジェネレータ(240)、逆ウェイタ(250)、逆マルチチャネルトランスフォーマ(260)、および逆周波数トランスフォーマ(270)が含まれる。
上で説明した知覚エンコーダおよび知覚デコーダは、多くの応用例について良好な総合性能を有するが、複数の短所、特にマルチチャネルオーディオの圧縮および圧縮解除に関する短所を有する。この短所によって、いくつかの場合、たとえば使用可能なビットレートが、入力オーディオチャネルの数に対して少ない時に、再構成されるマルチチャネルオーディオの品質が制限される。
さまざまな点で、図1のエンコーダ(100)によって実行されるフレーム区分は、柔軟でない。
図1のエンコーダ(100)では、あるチャネル間冗長性(inter−channel redundancy)が活用されるが、マルチチャネル変換に関するさまざまな点で柔軟性がない。エンコーダ(100)を用いると、2種類の変換すなわち、(a)恒等変換(変換なしと同等である)、または(b)ステレオ対の和−差コーディングが可能である。これらの制限によって、3つ以上のチャネルのマルチチャネルコーディングが制約される。3つ以上のチャネルを扱うことができるAACにおいても、マルチチャネル変換は、1時に1対のチャネルだけに制限される。
図1のエンコーダ(100)では、ウェイタ(140)が、オーディオデータの帯域にまたがるひずみを整形し、クォンタイザ(150)が、量子化ステップサイズをセットして、フレームに関するひずみの振幅を変更し、これによって品質とビットレートのバランスをとる。エンコーダ(100)は、ほとんどの応用例で品質とビットレートのよいバランスを達成するが、エンコーダ(100)は、まだ複数の短所を有する。
マルチチャネルオーディオのエンコーディングおよびデコーディングはさておき、Dolby Pro−Logicおよび複数の他のシステムは、マルチチャネルオーディオのダウンミキシングを実行して、異なる数のスピーカを有するスピーカ構成との互換性を容易にする。Dolby Pro−Logicのダウンミキシングでは、たとえば、4チャネルが、2チャネルにミックスダウンされ、2チャネルのそれぞれが、元の4つのチャネルのオーディオデータのある組合せを有する。この2チャネルを、ステレオチャネル装置で出力することができ、あるいは、4チャネルを、2チャネルから再構成して、4チャネル機器で出力することができる。
図5に、説明される実施形態を実施することができる適当なコンピューティング環境(500)の一般化された例を示す。コンピューティング環境(500)は、本発明の使用または機能性の範囲に関する制限を提案することを意図されたものではない。というのは、本発明を、別個の汎用コンピューティング環境または特殊目的コンピューティング環境で実施することができるからである。
図6は、説明される実施形態を実施することができる一般化されたオーディオエンコーダ(600)のブロック図である。図7は、説明される実施形態を実施することができる一般化されたオーディオデコーダ(700)のブロック図である。
一般化されたオーディオエンコーダ(600)には、セレクタ(608)、マルチチャネルプリプロセッサ(610)、パーティショナ(分配器)(partitioner)/タイルコンフィギュアラ(configurer)(620)、周波数トランスフォーマ(630)、知覚モデラ(640)、量子化帯域ウェイタ(642)、チャネルウェイタ(644)、マルチチャネルトランスフォーマ(650)、クォンタイザ(660)、エントロピエンコーダ(670)、コントローラ(680)、ミックスド/ピュアロスレスコーダ(672)および関連エントロピエンコーダ(674)、およびビットストリームマルチプレクサ[「MUX」](690)が含まれる。
図7を参照すると、一般化されたオーディオデコーダ(700)に、ビットストリームデマルチプレクサ[「DEMUX」](710)、1つまたは複数のエントロピデコーダ(720)、ミックスド/ピュアロスレスデコーダ(722)、タイル構成デコーダ(730)、逆マルチチャネルトランスフォーマ(740)、逆クォンタイザ/ウェイタ(750)、逆周波数トランスフォーマ(760)、オーバーラッパ/アダー(770)、およびマルチチャネルポストプロセッサ(780)が含まれる。デコーダ(700)にはレート/品質制御または知覚モデリングのモジュールが含まれないので、デコーダ(700)は、エンコーダ(600)より多少単純である。
いくつかの実施形態で、図6のエンコーダ(600)などのエンコーダが、時間領域の入力オーディオサンプルに対してマルチチャネル前処理を実行する。
ypre=Aprexpre (4)
ここで、xpreおよびypreは、前処理に入力されるN個の入力および前処理から出力されるN個の出力であり、Apreは、実数(すなわち連続的な)値の要素を有する一般的なN×N変換行列である。行列Apreは、xpreと比較してypreの相互チャネル相関性を人工的に増やすように選択することができる。これによって、エンコーダの残りに関する複雑さが減るが、チャネルセパレーションの低下が犠牲になる。
いくつかの実施形態で、図6のエンコーダ(600)などのエンコーダが、マルチチャネルオーディオのウィンドウを、後続のエンコーディングのためにタイルにグループ化する。これによって、フレームのチャネルのさまざまな組合せに対するマルチチャネル変換を可能にしながら、エンコーダに、フレームの異なるチャネルについて異なるウィンドウ構成を使用する柔軟性が与えられる。図7のデコーダ(700)などのデコーダが、デコード中にタイルを処理する。
図13に、特定のビットストリーム構文による、マルチチャネルオーディオのフレームに関してタイルを構成し、タイル構成情報を送る手法(1300)を示す流れ図である。図13には、情報をビットストリームに入れるためにエンコーダによって実行される手法(1300)が示され、デコーダは、対応する手法(フラグを読み取る、特定のタイルに関する構成情報を得る、など)を実行して、ビットストリーム構文に従ってフレームのタイル構成情報を検索する。代替案では、デコーダおよびエンコーダが、図13に示されたオプションの1つまたは複数に関する別の構文、たとえば、異なるフラグまたは異なる順序付けを使用する構文を使用する。
いくつかの実施形態で、図6のエンコーダ(600)などのエンコーダが、相互チャネル相関性を効果的に活用する柔軟なマルチチャネル変換を実行する。図7のデコーダ(700)などのデコーダが、対応する逆マルチチャネル変換を実行する。
いくつかの実施形態で、エンコーダは、知覚的重みづけの後にマルチチャネル変換を位置付け(デコーダは、逆重みづけの前に逆マルチチャネル変換を位置付け)、チャネル間の漏れ信号が、制御され、測定可能であり、元の信号に類似するスペクトルを有するようにする。
ymc=Amc・xmc (7)
いくつかの実施形態で、エンコーダおよびデコーダが、マルチチャネル変換のためにチャネルをグループ化して、一緒に変換されるチャネルを制限する。たとえば、タイル構成を使用する実施形態では、エンコーダが、タイルのどのチャネルが相関するかを判定し、相関するチャネルをグループ化する。代替案では、エンコーダおよびデコーダが、タイル構成を使用しないが、フレームまたは他のレベルでチャネルをグループ化する。
いくつかの実施形態で、エンコーダおよびデコーダが、周波数帯域レベルでマルチチャネル変換を選択的にオン/オフにして、どの帯域が一緒に変換されるかを制御する。この形で、エンコーダおよびデコーダが、マルチチャネル変換で互換性がない帯域を選択的に除外する。マルチチャネル変換が、特定の帯域についてオフにされる時に、エンコーダおよびデコーダは、その帯域に恒等変換を使用し、データを変更せずにその帯域のデータを通過させる。
いくつかの実施形態で、エンコーダおよびデコーダは、階層マルチチャネル変換を使用して、特にデコーダでの、計算の複雑さを制限する。階層変換を用いるときに、エンコーダが、全体的な変換を複数のステージに分割し、個々のステージの計算の複雑さを減らし、いくつかの場合にマルチチャネル変換を指定するのに必要な情報の量を減らす。このカスケード構造を使用して、エンコーダは、より大きい全体的な変換を、ある精度まで、より小さい変換を用いてエミュレートする。デコーダは、対応する階層逆変換を実行する。
いくつかの実施形態で、エンコーダおよびデコーダが、事前定義のマルチチャネル変換行列を使用して、変換行列の指定に使用されるビットレートを減らす。エンコーダは、複数の使用可能な事前定義の行列タイプの中から選択し、選択された行列を、ビットストリーム内で少数(たとえば、1、2)のビットを使用して知らせる。行列のタイプの中には、ビットストリーム内の追加シグナリングを必要としないものと、追加の指定を必要とするものがある。デコーダは、行列のタイプを示す情報と(必要な場合に)行列を指定する追加情報を検索する。
正方行列Asquareは、その転置行列が逆行列である場合に、ユニタリである。
Asquare・Asquare T=Asquare T・Asquare=I (12)
ここで、Iは、単位行列である。エンコーダは、任意のユニタリ行列を使用して、効果的な冗長性除去のためのKLT変換を指定する。エンコーダは、ビットストリーム内で、フラグビットおよび行列のパラメータ化を使用して、任意のユニタリ行列を効率的に指定する。いくつかの実施形態で、エンコーダは、下で説明するように、量子化されたギブンス因数分解回転を使用して行列をパラメータ化する。代替案では、エンコーダが、別のパラメータ化を使用する。
いくつかの実施形態で、エンコーダおよびデコーダが、ビット効率のために、量子化されたギブンス回転ベースの因数分解パラメータを使用して、任意のユニタリ変換行列を指定する。
RotationAngle[iAnglesDecoded]=π×(getBits(6)−32)/64 (16)
RotationSign[iSignsDecoded]=(2×getBits(1))−1 (17)
いくつかの実施形態で、図6のエンコーダ(600)などのエンコーダが、下で説明するさまざまな手法を使用して、オーディオデータに対する量子化および重みづけを実行する。タイルに構成されたマルチチャネルオーディオに関して、エンコーダは、タイルのチャネルの量子化行列、チャネルごとの量子化ステップ変更子、および全体的な量子化タイル係数を計算し、適用する。これによって、エンコーダが、聴覚モデルに従って雑音を整形し、チャネルの間の雑音のバランスをとり、全体的なひずみを制御できるようになる。
いくつかの実施形態で、タイルのオーディオデータの品質および/またはビットレートを制御するために、エンコーダのクォンタイザが、タイルの量子化ステップサイズQtを計算する。クォンタイザは、レート/品質コントローラと共に働いて、ビットレートおよび/または品質制約を満足するタイル量子化ステップサイズを選択する前に、タイルの異なる量子化ステップサイズを評価することができる。たとえば、クォンタイザおよびコントローラは、参照によって本明細書に組み込まれる関連特許出願の発明の名称"Quality and Rate Control Strategy for Digital Audio," の米国特許出願第10/017,694号(2001年12月14日出願)に記載されているように動作する。
Qt=90・ValidBitsPerSample/16 (18)
ここで、ValidBitsPerSampleは、16≦ValidBitsPerSample≦24の数であり、デコーダまたはオーディオクリップについてセットされるか、他のレベルでセットされる。
いくつかの実施形態で、エンコーダは、タイルの各チャネルの量子化ステップ変更子:Qc,0、Qc,1、...、Qc,#ChannelsInTile−1を計算する。エンコーダは、通常は、これらのチャネル固有量子化係数を計算して、すべてのチャネルにまたがる再構成品質のバランスをとる。タイル構成を使用しない実施形態であっても、エンコーダは、フレームまたはオーディオデータの他の単位でチャネルのチャネルごとの量子化係数を計算することができる。対照的に、図1のエンコーダ(100)で使用されるものなどの、以前の量子化手法は、チャネル内のウィンドウの帯域ごとに量子化行列要素を使用するが、チャネルに関する全体的な変更子を有しない。
その一方で、チャネルカウンタが、タイルのチャネル数より少ない場合には、デコーダは、1ビットを入手し(3232)、そのビットを検査して(3240)、現在のチャネルの量子化ステップ変更子が0であるかどうかを判定する。そうである場合には、デコーダは、現在のチャネルの量子化ステップ変更子に0をセットする(3242)。
いくつかの実施形態で、エンコーダは、タイルの各チャネルの量子化行列を計算する。エンコーダは、複数の形で、図1のエンコーダ(100)で使用されるものなどの以前の量子化手法より改善される。量子化行列のロッシイ圧縮に関して、エンコーダは、量子化行列要素の柔軟なステップサイズを使用し、これによって、エンコーダが、量子化行列の要素の分解能を変更できるようになる。この特徴とは別に、エンコーダは、量子化行列の圧縮中に量子化行列値の時間的相関を活用する。
図33に、量子化行列要素の量子化ステップサイズを適応式にセットする一般化された手法(3300)を示す。これによって、エンコーダが、マスク情報を粗くまたは微細に量子化できるようになる。一実施形態では、エンコーダが、タイルのチャネルごとに(すなわち、タイルの各チャネルが行列を有する時には行列ごとに)量子化行列要素の量子化ステップサイズをセットする。代替案では、エンコーダが、オーディオシーケンス全体または他のレベルで、タイルごとにまたはフレームごとに、マスク要素の量子化ステップサイズをセットする。
図35に、時間予測を使用して量子化行列を圧縮する一般化された手法(3500)を示す。手法(3500)では、エンコーダが、マスク値の時間相関を活用する。これによって量子化行列に関連するビットレートが下がる。
PredConst=45/MaskQuantMultiplieriChannel (19)
代替案では、エンコーダが、アンカ行列の別の圧縮手法を使用する。
MaskPrediction[iBand]=AnchorMask[iScaledBand] (20)
ここで、iScaledBandは、iBandの代表的な(たとえば平均)周波数を含むアンカ行列帯域である。iBandは、現在の量子化行列/現在のタイルサイズの項であり、iScaledBandは、アンカ行列/アンカタイルサイズの項である。
MaskQuantMultiplieriChannel=getBits(2)+1 (21)
PredConst=45/MaskQuantMultiplieriChannel (22)
代替案では、デコーダが、フレームのチャネルのアンカ行列に別の圧縮解除手法を使用する。
Qm,iChannel,iBand=AnchorMask[iBand] (23)
MaskPrediction[iBand]=AnchorMask[iScaledBand] (24)
Qm,iChannel,iBand=MaskPrediction[iBand] (25)
になる。
その後、デコーダは、現在のタイルのすべてのチャネルの量子化行列がデコードされたかどうかを検査し(3860)、そうである場合には終了する。そうでない場合には、デコーダは、現在のタイルの次の量子化行列のデコードを継続する。
デコーダは、必要な量子化および重みづけの情報のすべてを検索したならば、オーディオデータを逆量子化し、逆重みづけする。一実施形態では、デコーダが、逆量子化および逆重みづけを1ステップで実行するが、これを、印刷を明瞭にするために下の2つの式に示す。
いくつかの実施形態で、図7のデコーダ(700)などのデコーダが、時間領域の再構成されるオーディオサンプルに対するマルチチャネル後処理を実行する。
ここで、xpostおよびypostは、マルチチャネル後処理へのNチャネルの入力および出力であり、Apostは、一般的なN×N変換行列であり、xpostは、出力ベクトル長Nに一致するように0でパディングされる。
500 コンピューティング環境
510 処理ユニット
520 メモリ
570 通信接続
550 入力デバイス
560 出力デバイス
540 ストレージ
600 オーディオエンコーダ
605 入力オーディオサンプル
608 セレクタ
610 マルチチャネルプリプロセッサ
620 パーティショナ/タイルコンフィギュアラ
630 周波数トランスフォーマ
640 知覚モデラ
642 量子化帯域ウェイタ
644 チャネルウェイタ
690 MUX
695 出力ビットストリーム
650 マルチチャネルトランスフォーマ
672 ミックスド/ピュアロスレスコーダ
674 エントロピエンコーダ
680 レート/品質コントローラ
660 クォンタイザ
670 エントロピエンコーダ
700 オーディオデコーダ
705 入力ビットストリーム
710 DEMUX
730 タイル構成デコーダ
720 エントロピデコーダ
740 逆マルチチャネルトランスフォーマ
750 逆クォンタイザ/ウェイタ
760 逆周波数トランスフォーマ
770 オーバーラッパ/アダー
722 ミックスド/ピュアロスレスデコーダ
780 マルチチャネルポストプロセッサ
795 再構成されたオーディオ
805 時間領域マルチチャネルオーディオデータ
815 時間領域マルチチャネル変換されたオーディオデータ
825 エンコードされたマルチチャネルオーディオデータ
Claims (68)
- オーディオエンコーダにおいて、コンピュータにより実施される方法であって、
複数のチャネルでオーディオデータを受け取ることと、
前記複数のチャネルに関する複数のチャネル固有量子化係数を適用することを含む、前記オーディオデータを量子化することと
を含むことを特徴とする方法。 - 前記複数のチャネルは、2つのチャネルからなることを特徴とする請求項1に記載の方法。
- 前記複数のチャネルは、2つを超えるチャネルからなることを特徴とする請求項1に記載の方法。
- 前記複数のチャネル固有量子化係数は、複数のチャネル固有量子化ステップ変更子であることを特徴とする請求項1に記載の方法。
- 前記エンコーダは、前記複数のチャネルにまたがって再構成品質のバランスをとるために前記複数の変更子を適用することを特徴とする請求項4に記載の方法。
- 前記エンコーダは、タイルのチャネルごとに前記複数の変更子の1つを計算することを特徴とする請求項4に記載の方法。
- 前記エンコーダ内で、1つまたは複数の判断基準に少なくとも部分的に基づいて前記量子化係数を計算することをさらに含むことを特徴とする請求項1に記載の方法。
- 前記判断基準は、前記複数のチャネルにまたがる再構成品質の均等を含むことを特徴とする請求項7に記載の方法。
- 前記判断基準は、前記複数のチャネルのうちで知覚的に他のチャネルより重要な1つまたは複数のチャネルを優先することを含むことを特徴とする請求項7に記載の方法。
- 前記計算することは、前記複数のチャネルのめいめいのエネルギに少なくとも部分的に基づくことを特徴とする請求項7に記載の方法。
- 前記エンコーダ内で、オープンループ評価によって前記量子化係数を計算することをさらに含むことを特徴とする請求項1に記載の方法。
- 前記エンコーダ内で、クローズドループ評価によって前記量子化係数を計算することをさらに含むことを特徴とする請求項1に記載の方法。
- コンピュータ実行可能命令を保管し、それによってプログラムされたコンピュータに請求項1に記載の方法を実行させることを特徴とするコンピュータ可読メディア。
- オーディオデコーダにおいて、コンピュータにより実施される方法であって、
複数のチャネルでエンコードされたオーディオデータを受け取ることと、
複数のチャネル固有クォンタイザステップ変更子に関する情報を検索することと、
逆量子化で前記複数のチャネルに関する前記複数のチャネル固有クォンタイザステップ変更子を適用することを含み、前記オーディオデータをデコードすることと
を含むことを特徴とする方法。 - 前記複数のチャネルは、2つのチャネルからなることを特徴とする請求項14に記載の方法。
- 前記複数のチャネルは、2つを超えるチャネルからなることを特徴とする請求項14に記載の方法。
- 前記デコーダは、タイルのチャネルごとに、前記複数のチャネル固有クォンタイザステップ変更子の1つに関する情報を検索することを特徴とする請求項14に記載の方法。
- 前記検索することは、前記複数のチャネル固有クォンタイザステップ変更子の精度を示す複数のビットを入手することを含むことを特徴とする請求項14に記載の方法。
- 前記検索することは、変更子が0の値を有するかどうかを示すために変更子ごとに単一のビットを入手することを含むことを特徴とする請求項14に記載の方法。
- 前記適用することは、量子化に関する組み合わされたステップの一部であることを特徴とし、複数の係数のそれぞれについて、前記組み合わされたステップは、全体的な量子化の量による単一の乗算を含むことを特徴とする請求項14に記載の方法。
- コンピュータ実行可能命令を保管し、それによってプログラムされたコンピュータに請求項14に記載の方法を実行させることを特徴とするコンピュータ可読メディア。
- オーディオエンコーダにおいて、コンピュータにより実施される方法であって、
オーディオデータを受け取ることと、
複数の量子化行列を適用することを含む、前記オーディオデータを量子化することであって、ここで前記エンコーダが、前記複数の量子化行列の分解能を変更することと
を含むことを特徴とする方法。 - 前記オーディオデータは、単一のチャネルになっていることを特徴とする請求項22に記載の方法。
- 前記オーディオデータは、2つのチャネルになっていることを特徴とする請求項22に記載の方法。
- 前記オーディオデータは、2つを超えるチャネルになっていることを特徴とする請求項22に記載の方法。
- 前記エンコーダは、前記複数の量子化行列に関する情報の量子化を変更することによって前記分解能を変更することを特徴とする請求項22に記載の方法。
- 前記エンコーダは、前記複数の量子化行列の要素の量子化を変更することによって前記分解能を変更することを特徴とする請求項22に記載の方法。
- 前記エンコーダは、ビットを節約するために低品質オーディオデータについて前記要素を粗く量子化することを特徴とし、前記エンコーダは、品質を保つために高品質オーディオデータについて前記要素を微細に量子化することを特徴とする請求項27に記載の方法。
- 前記エンコーダは、チャネルごとに前記分解能をセットすることを特徴とする請求項22に記載の方法。
- 前記エンコーダ内で、オープンループ評価によって前記分解能をセットすることをさらに含むことを特徴とする請求項22に記載の方法。
- 前記エンコーダ内で、クローズドループ評価によって前記分解能をセットすることをさらに含むことを特徴とする請求項22に記載の方法。
- コンピュータ実行可能命令を保管し、それによってプログラムされたコンピュータに請求項22に記載の方法を実行させることを特徴とするコンピュータ可読メディア。
- オーディオデコーダにおいて、コンピュータにより実施される方法であって、
エンコードされたオーディオデータを受け取ることと、
逆量子化で複数の量子化行列を適用することを含む、前記オーディオデータをデコードすることであって、ここで前記複数の量子化行列の分解能は前記デコード中に変化することと
を含むことを特徴とする方法。 - 前記オーディオデータは、単一のチャネルになっていることを特徴とする請求項33に記載の方法。
- 前記オーディオデータは、2つのチャネルになっていることを特徴とする請求項33に記載の方法。
- 前記オーディオデータは、2つを超えるチャネルになっていることを特徴とする請求項33に記載の方法。
- 前記分解能は、前記複数の量子化行列に関する情報の量子化の変化に起因して変化することを特徴とする請求項33に記載の方法。
- 前記分解能は、前記複数の量子化行列の要素の量子化の変化に起因して変化することを特徴とする請求項33に記載の方法。
- 前記分解能が、チャネルごとにセットされることを特徴とする請求項33に記載の方法。
- 前記適用することは、量子化に関する組み合わされたステップの一部であることを特徴とし、複数の係数のそれぞれについて、前記組み合わされたステップは、全体的な量子化の量による単一の乗算を含むことを特徴とする請求項33に記載の方法。
- コンピュータ実行可能命令を保管し、それによってプログラムされたコンピュータに請求項33に記載の方法を実行させることを特徴とするコンピュータ可読メディア。
- オーディオエンコーダにおいて、コンピュータにより実施される方法であって、
オーディオデータを受け取ることと、
複数の量子化行列を計算することと、
時間予測を使用して、前記複数の量子化行列の少なくとも1つを圧縮することと
を含むことを特徴とする方法。 - 前記オーディオデータは、単一のチャネルになっていることを特徴とする請求項42に記載の方法。
- 前記オーディオデータは、2つのチャネルになっていることを特徴とする請求項42に記載の方法。
- 前記オーディオデータは、2つを超えるチャネルになっていることを特徴とする請求項42に記載の方法。
- 前記複数の量子化行列を圧縮解除することと、
前記複数の量子化行列を適用することを含む、前記オーディオデータを量子化することと
をさらに含むことを特徴とする請求項42に記載の方法。 - 前記複数の圧縮された量子化行列に関する情報を出力することをさらに含むことを特徴とする請求項42に記載の方法。
- 前記時間予測は、アンカ行列からチャネル内の現在の行列への時間予測であることを特徴とする請求項42に記載の方法。
- 直接圧縮を使用して前記複数の量子化行列の少なくとも1つを圧縮することをさらに含むことを特徴とする請求項42に記載の方法。
- 前記圧縮することは、アンカ行列と異なるサイズを有する現在の行列の時間予測のために前記アンカ行列に対して再サンプリング処理を実行することをさらに含むことを特徴とする請求項42に記載の方法。
- 前記圧縮することは、
別の行列に関する現在の行列の予測を計算することと、
前記現在の行列および前記予測から残差を計算することと
を含むことを特徴とする請求項42に記載の方法。 - 前記計算することは、前記残差をランレベルコーディングすることをさらに含むことを特徴とする請求項51に記載の方法。
- コンピュータ実行可能命令を保管し、それによってプログラムされたコンピュータに請求項42に記載の方法を実行させることを特徴とするコンピュータ可読メディア。
- オーディオデコーダにおいて、コンピュータにより実施される方法であって、
エンコードされたオーディオデータを受け取ることと、
複数の量子化行列に関する情報を検索することと、
時間予測を使用して、前記複数の量子化行列の少なくとも1つを圧縮解除することと
を含むことを特徴とする方法。 - 前記オーディオデータは、単一のチャネルになっていることを特徴とする請求項54に記載の方法。
- 前記オーディオデータは、2つのチャネルになっていることを特徴とする請求項54に記載の方法。
- 前記オーディオデータは、2つを超えるチャネルになっていることを特徴とする請求項54に記載の方法。
- 前記複数の量子化行列を適用することを含む、前記オーディオデータを逆量子化することをさらに含むことを特徴とする請求項54に記載の方法。
- 前記デコーダは、量子化に関する組み合わされたステップで逆量子化を実行することを特徴とし、複数の係数のそれぞれについて、前記組み合わされたステップは、全体的な量子化の量による単一の乗算を含むことを特徴とする請求項58に記載の方法。
- 前記時間予測は、アンカ行列からチャネル内の現在の行列への時間予測であることを特徴とする請求項54に記載の方法。
- 前記デコーダは、各フレームの初めにアンカ行列をリセットすることを特徴とする請求項60に記載の方法。
- 直接圧縮解除を使用して、前記複数の量子化行列の少なくとも1つを圧縮解除することをさらに含むことを特徴とする請求項54に記載の方法。
- 前記圧縮解除することは、アンカ行列と異なるサイズを有する現在の行列の時間予測のために前記アンカ行列に対して再サンプリング処理を実行することをさらに含むことを特徴とする請求項54に記載の方法。
- 前記サイズは、帯域の数に関することを特徴とする請求項63に記載の方法。
- 前記圧縮解除することは、
別の行列に関する現在の行列の予測を計算することと、
前記現在の行列に関する残差をデコードすることと、
前記残差と前記現在の行列に関する前記予測とを合計することと
を含むことを特徴とする請求項54に記載の方法。 - 前記残差を前記デコードすることは、前記残差をランレベルデコーディングすることを含むことを特徴とする請求項65に記載の方法。
- 前記圧縮解除することは、
別の行列に関する現在の行列の予測を計算することと、
前記現在の行列に関する残差の存在または不在を示すビットを入手することと、
残差は前記現在の行列に関して存在する場合に、前記残差をデコードし、前記残差と前記現在の行列の前記予想とを合計することと
を含むことを特徴とする請求項54に記載の方法。 - コンピュータ実行可能命令を保管し、それによってプログラムされたコンピュータに請求項54に記載の方法を実行させることを特徴とするコンピュータ可読メディア。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US40851702P | 2002-09-04 | 2002-09-04 | |
US10/642,551 US7299190B2 (en) | 2002-09-04 | 2003-08-15 | Quantization and inverse quantization for audio |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010095924A Division JP5091272B2 (ja) | 2002-09-04 | 2010-04-19 | オーディオの量子化および逆量子化 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2004264811A true JP2004264811A (ja) | 2004-09-24 |
JP2004264811A5 JP2004264811A5 (ja) | 2006-10-05 |
JP4676140B2 JP4676140B2 (ja) | 2011-04-27 |
Family
ID=31981597
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003309277A Expired - Lifetime JP4676140B2 (ja) | 2002-09-04 | 2003-09-01 | オーディオの量子化および逆量子化 |
JP2010095924A Expired - Lifetime JP5091272B2 (ja) | 2002-09-04 | 2010-04-19 | オーディオの量子化および逆量子化 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010095924A Expired - Lifetime JP5091272B2 (ja) | 2002-09-04 | 2010-04-19 | オーディオの量子化および逆量子化 |
Country Status (6)
Country | Link |
---|---|
US (2) | US8069052B2 (ja) |
EP (3) | EP2261897A1 (ja) |
JP (2) | JP4676140B2 (ja) |
AT (1) | ATE418136T1 (ja) |
DE (2) | DE60325310D1 (ja) |
ES (1) | ES2316679T3 (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008522551A (ja) * | 2004-11-30 | 2008-06-26 | アギア システムズ インコーポレーテッド | 被送出チャネルに基づくキューを用いる空間オーディオのパラメトリック・コーディング |
JP2008543227A (ja) * | 2005-06-03 | 2008-11-27 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | サイド情報を有するチャンネルの再構成 |
JP2009501354A (ja) * | 2005-07-14 | 2009-01-15 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオエンコード及びデコード |
JP2009503576A (ja) * | 2005-07-29 | 2009-01-29 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の処理方法 |
JP2009506378A (ja) * | 2005-08-30 | 2009-02-12 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号デコーディング方法及びその装置 |
JP2009194506A (ja) * | 2008-02-13 | 2009-08-27 | Pioneer Electronic Corp | 受信装置、音声再生方法、音声再生プログラム及びその記録媒体 |
JP2013077017A (ja) * | 2005-04-15 | 2013-04-25 | Fraunhofer Ges Zur Foerderung Der Angewandten Forschung Ev | マルチチャネルシンセサイザ制御信号を発生するための装置および方法並びにマルチチャネル合成のための装置および方法 |
US8626503B2 (en) | 2005-07-14 | 2014-01-07 | Erik Gosuinus Petrus Schuijers | Audio encoding and decoding |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1764923B1 (en) * | 2004-07-02 | 2011-01-12 | Nippon Telegraph And Telephone Corporation | Multi-channel signal encoding method, decoding method, device thereof, program, and recording medium thereof |
US7733973B2 (en) | 2004-08-19 | 2010-06-08 | The University Of Tokyo | Multichannel signal encoding method, its decoding method, devices for these, program, and its recording medium |
US8577483B2 (en) | 2005-08-30 | 2013-11-05 | Lg Electronics, Inc. | Method for decoding an audio signal |
DE102006055737A1 (de) * | 2006-11-25 | 2008-05-29 | Deutsche Telekom Ag | Verfahren zur skalierbaren Codierung von Stereo-Signalen |
CA2672165C (en) * | 2006-12-12 | 2014-07-29 | Ralf Geiger | Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream |
US8612237B2 (en) * | 2007-04-04 | 2013-12-17 | Apple Inc. | Method and apparatus for determining audio spatial quality |
US8457958B2 (en) * | 2007-11-09 | 2013-06-04 | Microsoft Corporation | Audio transcoder using encoder-generated side information to transcode to target bit-rate |
WO2010091555A1 (zh) * | 2009-02-13 | 2010-08-19 | 华为技术有限公司 | 一种立体声编码方法和装置 |
JP5533502B2 (ja) * | 2010-09-28 | 2014-06-25 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
US8620166B2 (en) * | 2011-01-07 | 2013-12-31 | Raytheon Bbn Technologies Corp. | Holevo capacity achieving joint detection receiver |
KR101854469B1 (ko) * | 2011-11-30 | 2018-05-04 | 삼성전자주식회사 | 오디오 컨텐츠의 비트레이트 판단장치 및 방법 |
TWI453733B (zh) * | 2011-12-30 | 2014-09-21 | Nyquest Corp Ltd | 音訊量化編解碼裝置及其方法 |
US9070362B2 (en) | 2011-12-30 | 2015-06-30 | Nyquest Corporation Limited | Audio quantization coding and decoding device and method thereof |
US9336791B2 (en) * | 2013-01-24 | 2016-05-10 | Google Inc. | Rearrangement and rate allocation for compressing multichannel audio |
JP6179122B2 (ja) * | 2013-02-20 | 2017-08-16 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム |
EP3014609B1 (en) * | 2013-06-27 | 2017-09-27 | Dolby Laboratories Licensing Corporation | Bitstream syntax for spatial voice coding |
FR3008533A1 (fr) * | 2013-07-12 | 2015-01-16 | Orange | Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences |
TWI579831B (zh) | 2013-09-12 | 2017-04-21 | 杜比國際公司 | 用於參數量化的方法、用於量化的參數之解量化方法及其電腦可讀取的媒體、音頻編碼器、音頻解碼器及音頻系統 |
US9794712B2 (en) | 2014-04-25 | 2017-10-17 | Dolby Laboratories Licensing Corporation | Matrix decomposition for rendering adaptive audio using high definition audio codecs |
EP2963949A1 (en) * | 2014-07-02 | 2016-01-06 | Thomson Licensing | Method and apparatus for decoding a compressed HOA representation, and method and apparatus for encoding a compressed HOA representation |
US10249312B2 (en) * | 2015-10-08 | 2019-04-02 | Qualcomm Incorporated | Quantization of spatial vectors |
US9961475B2 (en) | 2015-10-08 | 2018-05-01 | Qualcomm Incorporated | Conversion from object-based audio to HOA |
US9961467B2 (en) | 2015-10-08 | 2018-05-01 | Qualcomm Incorporated | Conversion from channel-based audio to HOA |
CN109302222B (zh) * | 2016-05-13 | 2019-11-19 | 华为技术有限公司 | 一种信道信息发送方法、数据发送方法和设备 |
WO2018044125A1 (ko) * | 2016-09-01 | 2018-03-08 | 엘지전자(주) | 레이어드 기븐스 변환을 이용하여 변환을 수행하는 방법 및 장치 |
EP3467824B1 (en) * | 2017-10-03 | 2021-04-21 | Dolby Laboratories Licensing Corporation | Method and system for inter-channel coding |
GB2576769A (en) * | 2018-08-31 | 2020-03-04 | Nokia Technologies Oy | Spatial parameter signalling |
MX2022015649A (es) * | 2020-06-11 | 2023-03-06 | Dolby Laboratories Licensing Corp | Cuantificacion y codificacion entropica de parametros para un codec de audio de baja latencia. |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0675590A (ja) * | 1992-03-02 | 1994-03-18 | American Teleph & Telegr Co <Att> | 知覚モデルに基づく音声信号符号化方法とその装置 |
JPH06149292A (ja) * | 1992-11-11 | 1994-05-27 | Sony Corp | 高能率符号化方法及び装置 |
WO1995002925A1 (fr) * | 1993-07-16 | 1995-01-26 | Sony Corporation | Procede et dispositif de codage a haute efficacite, procede et dispositif de decodage a haute efficacite, systeme de codage/decodage et support d'enregistrement a haute efficacite |
JPH09500503A (ja) * | 1993-07-16 | 1997-01-14 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | 適応ビット配分符号化装置及び方法 |
WO2000060746A2 (en) * | 1999-04-07 | 2000-10-12 | Dolby Laboratories Licensing Corporation | Matrixing for losseless encoding and decoding of multichannels audio signals |
JP2001044844A (ja) * | 1999-07-26 | 2001-02-16 | Matsushita Electric Ind Co Ltd | サブバンド符号化方式 |
Family Cites Families (100)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB206877A (en) | 1922-05-17 | 1923-11-19 | Charles Kingston Welch | Improvements in or relating to pneumatic tyres and wheels for various vehicles |
US1691801A (en) | 1926-06-24 | 1928-11-13 | George W Fothergill | Multiplane bevel square |
US1769401A (en) | 1928-04-23 | 1930-07-01 | William W Tancre | Fruit clipper |
JPS5921039B2 (ja) * | 1981-11-04 | 1984-05-17 | 日本電信電話株式会社 | 適応予測符号化方式 |
CA1253255A (en) | 1983-05-16 | 1989-04-25 | Nec Corporation | System for simultaneously coding and decoding a plurality of signals |
GB8421498D0 (en) | 1984-08-24 | 1984-09-26 | British Telecomm | Frequency domain speech coding |
GB2205465B (en) * | 1987-05-13 | 1991-09-04 | Ricoh Kk | Image transmission system |
US4922537A (en) | 1987-06-02 | 1990-05-01 | Frederiksen & Shu Laboratories, Inc. | Method and apparatus employing audio frequency offset extraction and floating-point conversion for digitally encoding and decoding high-fidelity audio signals |
NL8901032A (nl) | 1988-11-10 | 1990-06-01 | Philips Nv | Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting. |
US5222189A (en) | 1989-01-27 | 1993-06-22 | Dolby Laboratories Licensing Corporation | Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio |
US5479562A (en) | 1989-01-27 | 1995-12-26 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding audio information |
CA2026207C (en) | 1989-01-27 | 1995-04-11 | Louis Dunn Fielder | Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio |
US5752225A (en) | 1989-01-27 | 1998-05-12 | Dolby Laboratories Licensing Corporation | Method and apparatus for split-band encoding and split-band decoding of audio information using adaptive bit allocation to adjacent subbands |
US5142656A (en) | 1989-01-27 | 1992-08-25 | Dolby Laboratories Licensing Corporation | Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio |
EP0386418B1 (de) | 1989-03-06 | 1994-12-21 | Robert Bosch Gmbh | Verfahren zur Datenreduktion bei digitalen Tonsignalen und zur genäherten Rückgewinnung der digitalen Tonsignale |
DE69029120T2 (de) * | 1989-04-25 | 1997-04-30 | Toshiba Kawasaki Kk | Stimmenkodierer |
US5115240A (en) | 1989-09-26 | 1992-05-19 | Sony Corporation | Method and apparatus for encoding voice signals divided into a plurality of frequency bands |
JP2921879B2 (ja) * | 1989-09-29 | 1999-07-19 | 株式会社東芝 | 画像データ処理装置 |
US5185800A (en) | 1989-10-13 | 1993-02-09 | Centre National D'etudes Des Telecommunications | Bit allocation device for transformed digital audio broadcasting signals with adaptive quantization based on psychoauditive criterion |
JP2560873B2 (ja) * | 1990-02-28 | 1996-12-04 | 日本ビクター株式会社 | 直交変換符号化復号化方法 |
JP2861238B2 (ja) | 1990-04-20 | 1999-02-24 | ソニー株式会社 | ディジタル信号符号化方法 |
US5388181A (en) * | 1990-05-29 | 1995-02-07 | Anderson; David J. | Digital audio compression system |
JP3033156B2 (ja) * | 1990-08-24 | 2000-04-17 | ソニー株式会社 | ディジタル信号符号化装置 |
US5274740A (en) | 1991-01-08 | 1993-12-28 | Dolby Laboratories Licensing Corporation | Decoder for variable number of channel presentation of multidimensional sound fields |
US5559900A (en) | 1991-03-12 | 1996-09-24 | Lucent Technologies Inc. | Compression of signals for perceptual quality by selecting frequency bands having relatively high energy |
JP3141450B2 (ja) | 1991-09-30 | 2001-03-05 | ソニー株式会社 | オーディオ信号処理方法 |
US5369724A (en) | 1992-01-17 | 1994-11-29 | Massachusetts Institute Of Technology | Method and apparatus for encoding, decoding and compression of audio-type data using reference coefficients located within a band of coefficients |
EP0559348A3 (en) * | 1992-03-02 | 1993-11-03 | AT&T Corp. | Rate control loop processor for perceptual encoder/decoder |
JP2693893B2 (ja) * | 1992-03-30 | 1997-12-24 | 松下電器産業株式会社 | ステレオ音声符号化方法 |
SG43996A1 (en) * | 1993-06-22 | 1997-11-14 | Thomson Brandt Gmbh | Method for obtaining a multi-channel decoder matrix |
US5632003A (en) * | 1993-07-16 | 1997-05-20 | Dolby Laboratories Licensing Corporation | Computationally efficient adaptive bit allocation for coding method and apparatus |
US7158654B2 (en) * | 1993-11-18 | 2007-01-02 | Digimarc Corporation | Image processor and image processing method |
US5684920A (en) * | 1994-03-17 | 1997-11-04 | Nippon Telegraph And Telephone | Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein |
DE4409368A1 (de) * | 1994-03-18 | 1995-09-21 | Fraunhofer Ges Forschung | Verfahren zum Codieren mehrerer Audiosignale |
JP3277677B2 (ja) * | 1994-04-01 | 2002-04-22 | ソニー株式会社 | 信号符号化方法及び装置、信号記録媒体、信号伝送方法、並びに信号復号化方法及び装置 |
ATE214524T1 (de) * | 1994-11-04 | 2002-03-15 | Koninkl Philips Electronics Nv | Kodierung und dekodierung eines breitbandigen digitalen informationssignals |
US5774846A (en) * | 1994-12-19 | 1998-06-30 | Matsushita Electric Industrial Co., Ltd. | Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus |
US5629780A (en) * | 1994-12-19 | 1997-05-13 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | Image data compression having minimum perceptual error |
WO1996032710A1 (en) * | 1995-04-10 | 1996-10-17 | Corporate Computer Systems, Inc. | System for compression and decompression of audio signals for digital transmission |
US5774837A (en) * | 1995-09-13 | 1998-06-30 | Voxware, Inc. | Speech coding system and method using voicing probability determination |
US5960390A (en) * | 1995-10-05 | 1999-09-28 | Sony Corporation | Coding method for using multi channel audio signals |
DE19549621B4 (de) * | 1995-10-06 | 2004-07-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung zum Codieren von Audiosignalen |
US5819215A (en) * | 1995-10-13 | 1998-10-06 | Dobson; Kurt | Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data |
JPH09152896A (ja) * | 1995-11-30 | 1997-06-10 | Oki Electric Ind Co Ltd | 声道予測係数符号化・復号化回路、声道予測係数符号化回路、声道予測係数復号化回路、音声符号化装置及び音声復号化装置 |
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US5686964A (en) * | 1995-12-04 | 1997-11-11 | Tabatabai; Ali | Bit rate control mechanism for digital image and video data compression |
FR2742568B1 (fr) * | 1995-12-15 | 1998-02-13 | Catherine Quinquis | Procede d'analyse par prediction lineaire d'un signal audiofrequence, et procedes de codage et de decodage d'un signal audiofrequence en comportant application |
US5682152A (en) * | 1996-03-19 | 1997-10-28 | Johnson-Grace Company | Data compression using adaptive bit allocation and hybrid lossless entropy encoding |
US5812971A (en) * | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
US5822370A (en) * | 1996-04-16 | 1998-10-13 | Aura Systems, Inc. | Compression/decompression for preservation of high fidelity speech quality at low bandwidth |
DE19628293C1 (de) * | 1996-07-12 | 1997-12-11 | Fraunhofer Ges Forschung | Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion |
DE19628292B4 (de) | 1996-07-12 | 2007-08-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren zum Codieren und Decodieren von Stereoaudiospektralwerten |
US5969750A (en) * | 1996-09-04 | 1999-10-19 | Winbcnd Electronics Corporation | Moving picture camera with universal serial bus interface |
GB2318029B (en) * | 1996-10-01 | 2000-11-08 | Nokia Mobile Phones Ltd | Audio coding method and apparatus |
SG54379A1 (en) * | 1996-10-24 | 1998-11-16 | Sgs Thomson Microelectronics A | Audio decoder with an adaptive frequency domain downmixer |
JP3339335B2 (ja) * | 1996-12-12 | 2002-10-28 | ヤマハ株式会社 | 圧縮符号化復号方式 |
JP3283200B2 (ja) * | 1996-12-19 | 2002-05-20 | ケイディーディーアイ株式会社 | 符号化音声データの符号化レート変換方法および装置 |
FI970266A (fi) * | 1997-01-22 | 1998-07-23 | Nokia Telecommunications Oy | Menetelmä solukkoradiojärjestelmän ohjauskanavien kantaman pidentämiseksi ja solukkoradiojärjestelmä |
EP1113672B1 (en) * | 1997-02-08 | 2005-04-13 | Matsushita Electric Industrial Co., Ltd. | Quantization matrix for still and moving picture coding |
JP3143406B2 (ja) * | 1997-02-19 | 2001-03-07 | 三洋電機株式会社 | 音声符号化方法 |
FI114248B (fi) * | 1997-03-14 | 2004-09-15 | Nokia Corp | Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen |
KR100265112B1 (ko) * | 1997-03-31 | 2000-10-02 | 윤종용 | 디브이디 디스크와 디브이디 디스크를 재생하는 장치 및 방법 |
US6064954A (en) * | 1997-04-03 | 2000-05-16 | International Business Machines Corp. | Digital audio signal coding |
EP0924962B1 (en) | 1997-04-10 | 2012-12-12 | Sony Corporation | Encoding method and device, decoding method and device, and recording medium |
DE19730129C2 (de) | 1997-07-14 | 2002-03-07 | Fraunhofer Ges Forschung | Verfahren zum Signalisieren einer Rauschsubstitution beim Codieren eines Audiosignals |
DE19730130C2 (de) * | 1997-07-14 | 2002-02-28 | Fraunhofer Ges Forschung | Verfahren zum Codieren eines Audiosignals |
US6016111A (en) * | 1997-07-31 | 2000-01-18 | Samsung Electronics Co., Ltd. | Digital data coding/decoding method and apparatus |
US6185253B1 (en) * | 1997-10-31 | 2001-02-06 | Lucent Technology, Inc. | Perceptual compression and robust bit-rate control system |
US6253185B1 (en) * | 1998-02-25 | 2001-06-26 | Lucent Technologies Inc. | Multiple description transform coding of audio using optimal transforms of arbitrary dimension |
US6249614B1 (en) * | 1998-03-06 | 2001-06-19 | Alaris, Inc. | Video compression and decompression using dynamic quantization and/or encoding |
US6353807B1 (en) * | 1998-05-15 | 2002-03-05 | Sony Corporation | Information coding method and apparatus, code transform method and apparatus, code transform control method and apparatus, information recording method and apparatus, and program providing medium |
JP3437445B2 (ja) * | 1998-05-22 | 2003-08-18 | 松下電器産業株式会社 | 線形信号予測を用いた受信装置及び方法 |
US6029126A (en) * | 1998-06-30 | 2000-02-22 | Microsoft Corporation | Scalable audio coder and decoder |
US6115689A (en) * | 1998-05-27 | 2000-09-05 | Microsoft Corporation | Scalable audio coder and decoder |
JP3998330B2 (ja) * | 1998-06-08 | 2007-10-24 | 沖電気工業株式会社 | 符号化装置 |
JP3541680B2 (ja) * | 1998-06-15 | 2004-07-14 | 日本電気株式会社 | 音声音楽信号の符号化装置および復号装置 |
DE19840835C2 (de) * | 1998-09-07 | 2003-01-09 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Entropiecodieren von Informationswörtern und Vorrichtung und Verfahren zum Decodieren von Entropie-codierten Informationswörtern |
SE519552C2 (sv) | 1998-09-30 | 2003-03-11 | Ericsson Telefon Ab L M | Flerkanalig signalkodning och -avkodning |
CA2252170A1 (en) * | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
US6370502B1 (en) * | 1999-05-27 | 2002-04-09 | America Online, Inc. | Method and system for reduction of quantization-induced block-discontinuities and general purpose audio codec |
US6226616B1 (en) * | 1999-06-21 | 2001-05-01 | Digital Theater Systems, Inc. | Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility |
US6658162B1 (en) * | 1999-06-26 | 2003-12-02 | Sharp Laboratories Of America | Image coding method using visual optimization |
EP1221694B1 (en) * | 1999-09-14 | 2006-07-19 | Fujitsu Limited | Voice encoder/decoder |
US6418405B1 (en) * | 1999-09-30 | 2002-07-09 | Motorola, Inc. | Method and apparatus for dynamic segmentation of a low bit rate digital voice message |
US7096240B1 (en) * | 1999-10-30 | 2006-08-22 | Stmicroelectronics Asia Pacific Pte Ltd. | Channel coupling for an AC-3 encoder |
US6738074B2 (en) * | 1999-12-29 | 2004-05-18 | Texas Instruments Incorporated | Image compression system and method |
US6499010B1 (en) * | 2000-01-04 | 2002-12-24 | Agere Systems Inc. | Perceptual audio coder bit allocation scheme providing improved perceptual quality consistency |
JP2001285073A (ja) | 2000-03-29 | 2001-10-12 | Sony Corp | 信号処理装置及び方法 |
US6757654B1 (en) * | 2000-05-11 | 2004-06-29 | Telefonaktiebolaget Lm Ericsson | Forward error correction in speech coding |
DE60132853D1 (de) | 2000-07-07 | 2008-04-03 | Nokia Siemens Networks Oy | Verfahren und Vorrichtung für die perzeptuelle Tonkodierung von einem mehrkanal Tonsignal mit Verwendung der kaskadierten diskreten Cosinustransformation oder der modifizierten diskreten Cosinustransformation |
JP4857468B2 (ja) * | 2001-01-25 | 2012-01-18 | ソニー株式会社 | データ処理装置およびデータ処理方法、並びにプログラムおよび記録媒体 |
US7062445B2 (en) * | 2001-01-26 | 2006-06-13 | Microsoft Corporation | Quantization loop with heuristic approach |
US7136418B2 (en) * | 2001-05-03 | 2006-11-14 | University Of Washington | Scalable and perceptually ranked signal coding and decoding |
US6934677B2 (en) * | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US7027982B2 (en) * | 2001-12-14 | 2006-04-11 | Microsoft Corporation | Quality and rate control strategy for digital audio |
US7460993B2 (en) * | 2001-12-14 | 2008-12-02 | Microsoft Corporation | Adaptive window-size selection in transform coding |
US7146313B2 (en) | 2001-12-14 | 2006-12-05 | Microsoft Corporation | Techniques for measurement of perceptual audio quality |
US7299190B2 (en) * | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
WO2005062823A2 (en) | 2003-12-19 | 2005-07-14 | Savacor, Inc. | Digital electrode for cardiac rhythm management |
-
2003
- 2003-09-01 JP JP2003309277A patent/JP4676140B2/ja not_active Expired - Lifetime
- 2003-09-04 EP EP10009815A patent/EP2261897A1/en not_active Ceased
- 2003-09-04 ES ES03020111T patent/ES2316679T3/es not_active Expired - Lifetime
- 2003-09-04 EP EP03020111A patent/EP1400955B1/en not_active Expired - Lifetime
- 2003-09-04 EP EP08016647A patent/EP2023340A3/en not_active Ceased
- 2003-09-04 DE DE60325310T patent/DE60325310D1/de not_active Expired - Lifetime
- 2003-09-04 AT AT03020111T patent/ATE418136T1/de not_active IP Right Cessation
- 2003-09-04 DE DE20321886U patent/DE20321886U1/de not_active Expired - Lifetime
-
2010
- 2010-04-19 JP JP2010095924A patent/JP5091272B2/ja not_active Expired - Lifetime
- 2010-08-03 US US12/849,626 patent/US8069052B2/en not_active Expired - Lifetime
-
2011
- 2011-10-18 US US13/276,163 patent/US8255234B2/en not_active Expired - Lifetime
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0675590A (ja) * | 1992-03-02 | 1994-03-18 | American Teleph & Telegr Co <Att> | 知覚モデルに基づく音声信号符号化方法とその装置 |
JPH06149292A (ja) * | 1992-11-11 | 1994-05-27 | Sony Corp | 高能率符号化方法及び装置 |
WO1995002925A1 (fr) * | 1993-07-16 | 1995-01-26 | Sony Corporation | Procede et dispositif de codage a haute efficacite, procede et dispositif de decodage a haute efficacite, systeme de codage/decodage et support d'enregistrement a haute efficacite |
JPH09500503A (ja) * | 1993-07-16 | 1997-01-14 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | 適応ビット配分符号化装置及び方法 |
WO2000060746A2 (en) * | 1999-04-07 | 2000-10-12 | Dolby Laboratories Licensing Corporation | Matrixing for losseless encoding and decoding of multichannels audio signals |
JP2002541524A (ja) * | 1999-04-07 | 2002-12-03 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | 損失のない符号化・復号へのマトリックス改良 |
JP2001044844A (ja) * | 1999-07-26 | 2001-02-16 | Matsushita Electric Ind Co Ltd | サブバンド符号化方式 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008522551A (ja) * | 2004-11-30 | 2008-06-26 | アギア システムズ インコーポレーテッド | 被送出チャネルに基づくキューを用いる空間オーディオのパラメトリック・コーディング |
JP4856653B2 (ja) * | 2004-11-30 | 2012-01-18 | アギア システムズ インコーポレーテッド | 被送出チャネルに基づくキューを用いる空間オーディオのパラメトリック・コーディング |
JP2013077017A (ja) * | 2005-04-15 | 2013-04-25 | Fraunhofer Ges Zur Foerderung Der Angewandten Forschung Ev | マルチチャネルシンセサイザ制御信号を発生するための装置および方法並びにマルチチャネル合成のための装置および方法 |
JP2008543227A (ja) * | 2005-06-03 | 2008-11-27 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | サイド情報を有するチャンネルの再構成 |
JP2009501354A (ja) * | 2005-07-14 | 2009-01-15 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオエンコード及びデコード |
JP2011059711A (ja) * | 2005-07-14 | 2011-03-24 | Koninkl Philips Electronics Nv | オーディオエンコード及びデコード |
US8626503B2 (en) | 2005-07-14 | 2014-01-07 | Erik Gosuinus Petrus Schuijers | Audio encoding and decoding |
JP2009503576A (ja) * | 2005-07-29 | 2009-01-29 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号の処理方法 |
JP2009506378A (ja) * | 2005-08-30 | 2009-02-12 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号デコーディング方法及びその装置 |
JP2009194506A (ja) * | 2008-02-13 | 2009-08-27 | Pioneer Electronic Corp | 受信装置、音声再生方法、音声再生プログラム及びその記録媒体 |
Also Published As
Publication number | Publication date |
---|---|
DE60325310D1 (de) | 2009-01-29 |
ES2316679T3 (es) | 2009-04-16 |
ATE418136T1 (de) | 2009-01-15 |
EP1400955A2 (en) | 2004-03-24 |
DE20321886U1 (de) | 2012-03-02 |
US20120035941A1 (en) | 2012-02-09 |
EP1400955B1 (en) | 2008-12-17 |
JP5091272B2 (ja) | 2012-12-05 |
EP2023340A3 (en) | 2009-04-29 |
JP4676140B2 (ja) | 2011-04-27 |
US8069052B2 (en) | 2011-11-29 |
EP2261897A1 (en) | 2010-12-15 |
EP1400955A3 (en) | 2006-05-10 |
US8255234B2 (en) | 2012-08-28 |
US20100318368A1 (en) | 2010-12-16 |
EP2023340A2 (en) | 2009-02-11 |
JP2010176151A (ja) | 2010-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5097242B2 (ja) | マルチチャネルオーディオのエンコーディングおよびデコーディング | |
JP5091272B2 (ja) | オーディオの量子化および逆量子化 | |
US7299190B2 (en) | Quantization and inverse quantization for audio | |
CA2637185C (en) | Complex-transform channel coding with extended-band frequency coding | |
US20070174063A1 (en) | Shape and scale parameters for extended-band frequency coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060823 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060823 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091218 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20100318 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20100324 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100419 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110121 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110127 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140204 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4676140 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |