JP2008547043A - スケール調節可能な圧縮されたオーディオビットストリーム、並びに階層的フィルターバンクおよび多チャンネルジョイントコーディングを使用したコーデック - Google Patents
スケール調節可能な圧縮されたオーディオビットストリーム、並びに階層的フィルターバンクおよび多チャンネルジョイントコーディングを使用したコーデック Download PDFInfo
- Publication number
- JP2008547043A JP2008547043A JP2008516455A JP2008516455A JP2008547043A JP 2008547043 A JP2008547043 A JP 2008547043A JP 2008516455 A JP2008516455 A JP 2008516455A JP 2008516455 A JP2008516455 A JP 2008516455A JP 2008547043 A JP2008547043 A JP 2008547043A
- Authority
- JP
- Japan
- Prior art keywords
- timbre
- components
- residual
- time
- samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 80
- 230000005236 sound signal Effects 0.000 claims abstract description 23
- 230000006870 function Effects 0.000 claims description 29
- 238000006243 chemical reaction Methods 0.000 claims description 17
- 238000013139 quantization Methods 0.000 claims description 12
- 230000036961 partial effect Effects 0.000 claims description 11
- 230000009466 transformation Effects 0.000 claims description 11
- 230000003139 buffering effect Effects 0.000 claims description 5
- 230000003247 decreasing effect Effects 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 238000003780 insertion Methods 0.000 claims description 3
- 230000037431 insertion Effects 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 2
- 230000002194 synthesizing effect Effects 0.000 claims 3
- 108020001568 subdomains Proteins 0.000 claims 2
- 230000001131 transforming effect Effects 0.000 claims 1
- 230000000873 masking effect Effects 0.000 abstract description 11
- 239000000284 extract Substances 0.000 abstract description 5
- 239000000306 component Substances 0.000 description 160
- 238000010586 diagram Methods 0.000 description 18
- 230000008569 process Effects 0.000 description 11
- 238000012546 transfer Methods 0.000 description 11
- 238000000354 decomposition reaction Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 8
- 230000003595 spectral effect Effects 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 230000006798 recombination Effects 0.000 description 4
- 238000005215 recombination Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000012804 iterative process Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- BXBVPYSHEOQGHP-UHFFFAOYSA-N Nordihydrocapsiate Chemical compound COC1=CC(COC(=O)CCCCCC(C)C)=CC=C1O BXBVPYSHEOQGHP-UHFFFAOYSA-N 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000004091 panning Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 235000003899 Brassica oleracea var acephala Nutrition 0.000 description 1
- 235000012905 Brassica oleracea var viridis Nutrition 0.000 description 1
- 244000064816 Brassica oleracea var. acephala Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 239000008358 core component Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 238000011326 mechanical measurement Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/28—Programmable structures, i.e. where the code converter contains apparatus which is operator-changeable to modify the conversion process
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Abstract
【選択図】図21
Description
図1に示すように、一つの例示的実施形態において、スケール調節可能なビットストリームエンコーダは、コア成分(音色成分)および/または残余成分(時間−サンプルおよびスケール因子)から最低順位の成分を選択的に排除することによって、ビットストリームを任意のデータ転送速度にスケール調節するために、残余コーディングトポロジーを使用する。該エンコーダは、階層的フィルタバンクを使用して入力信号を多重分解能の時間/周波数表現へと効率的に分解し、該エンコーダはそこから音色成分および残余成分を効率的に抽出することができる。多重分解能の時間/周波数表現を提供するためにここに記載する階層的フィルタバンク(HFB)は、入力信号のこのような表現が望ましい他の多くのアプリケーションで使用することができる。階層的フィルタバンクの一般的説明およびオーディオエンコーダで使用するためのその構成、並びに特定のオーディオエンコーダによって使用される修飾されたHFBが以下で説明される。
ここで:
Ai=振幅=(Rei・Rei+Imi・Imi)
−(Rei+1・Rei+1+Imi+1・Imi+1)
t=時間 (t∈N 正の整数値である)
l=パワーが2の時の変換サイズ(l∈512、1024、…、8192)
Φ=位相
f=周波数
多元音色抽出器102は、好ましくは「修飾された」階層的フィルタバンクを使用して、そこから音色成分および残余成分の両方を効率的に抽出できる多重分解能の時間/周波数分解能を提供する。HFBは、連続的な各反復において、入力信号を逐次的により低い周波数分解能で変換係数に分解し、また逐次的により精細な時間スケール分解能で時間ドメイン副バンドサンプルに戻す。階層的フィルタバンクによって発生された音色成分は、多重重なりFFTによって発生されたものと正確に同じであるが、コンピュータ処理の負荷は遥かに低い。階層的フィルタバンクは、入力信号を異なる時間/周波数分解能で同時に分析し、略任意の時間/周波数分解を達成することによって、ヒト聴覚系の等しくない時間/周波数分解能をモデル化する問題を取扱う。階層的フィルタバンクは、既知の分解能では見られない内部変換において、ウインドウ化および重なり加算ステップを使用する。該ウインドウ機能のこのステップおよび新規な設計は、望ましい分解を達成するために、この構造が任意のツリーにおいて反復されることを可能にし、また信号適応性で行われることができるであろう。
ここで、xは時間ドメインサンプル指数(0<x≦L>であり、またLはサンプル中のウインドウの長さである。
(a)図5aに示すように、入力信号サンプル2702がNサンプル2704のフレームの中にバッファーされ、各フレームはNサンプルウインドウ関数(図5b)2706を乗じられて、Nウインドウ化されたサンプル2708(図5c)を生じる(ステップ2900);
(c)任意に、1以上の隣接変換係数の線型結合を適用することによって、リンギング除去が1以上入の変換係数2804に適用される;
(d)N/2変換係数2804がP群のMi係数に分割され、ここでのMi係数の総和はN/2である。即ち、
(d)各副バンドにおいて、(2*Mi)点ウインドウ関数2706により(2*Mi)副バンドサンプルが適用される(ステップ2908);
(e)各副バンドにおいて、Miの先のサンプルが重ねられ、対応する現在の値に付加されて、各副バンドについてMiの新たなサンプルを生じる(ステップ2910);
(f)Nが、先のMiに等しく設定され、PおよびMiについて新たな値を選択する;
(g)望ましい時間/変換分解能が達成されるまで(ステップ2914)、Nについての連続的に小さくなる変換サイズを使用して、Miの新規なサンプルの1以上の副バンドに対して上記ステップが反復される(ステップ2912)。なお、ステップは全ての副バンド、最低の副バンドのみ、またはこれらの何れか望ましい組み合わせに対して反復されてよいことに留意されたい。これらのステップが全ての副バンドに対して反復されれば該HFBは均一であり、そうでなければそれは不均一である。
図7は、均一に離間した副バンドフィルタバンクを実行する、階層的フィルタバンクの例示的実施形態3900のブロック図である。均一なフィルタバンクについては、Mi=M=N/(2*P)である。副バンド信号3914への入力信号の分解について以下に述べる:
1.入力時間サンプル3902が、N点(50%が重なるフレーム3904)においてウインドウ化される。
2.N点MDCT3906が、各フレームに対して実行される。
3.得られたMDCT係数が、各群において、P群3908のM係数にグループ化される。
4.各群に対して(2*M)点のIMDCT3910が実行され、(2*M)副バンド時間サンプル3911が形成される。
5.得られた時間サンプル3911は、(2*M)点、50%重なりフレーム、および重なり加算(OLA)でウインドウ化され、各副バンドにおいてM倍のサンプルが形成される。
階層的フィルタバンク3000のもう一つの実施形態が、図8aおよび図8bに示されている。この実施形態では、異なる周波数分解能を表す変換係数を備えた三つの異なる周波数範囲を用いた変換を生じさせるためには、幾つかのフィルタバンク段階が不完全である。時間ドメイン信号は、一連のカスケード化された単一要素のフィルタバンクを使用して、これらの変換係数へと分解される。詳細なフィルタバンク要素は、望ましい時間/周波数分解を生じるように何回も反復されてよい。なお、バッファーサイズ、変換サイズ、およびウインドウサイズについての数字、並びに変換のためのMDCT/IMDCTの使用は、例示的実施形態だけのためのものであり、本発明の範囲を限定するものではない。他のバッファーウインドウおよび変換サイズ、並びに他の変換タイプもまた有用であり得る。一般に、Miは相互に異なるが、Miの合計がN/2に等しいとの制約条件を満たす。
図1における音色セレクタ103は、入力として、マスク計算機101からのデータおよび多元音色抽出器102からの音色リストを取る。音色セレクタ103は、最初に、マスク計算機101に対する相対的出力によって音色リストを保存し、音響心理学的重要度による序列を形成する。用いられる式は下記により与えられる:
ここで、
Ak=スペクトル線振幅
Mik=iのマスク副フレームにおけるkのスペクトル線についてのマスキングレベル
l=マスク副フレームの項における基本関数の長さ
である。
合計は、スペクトル成分が非ゼロ値を有する副フレームに対して行われる。
グループ化モードはまた、図11のステップ3704に示したようにして決定される。音色成分は、左−右または中央−側部の表現としてコード化されてよく、或いは、このステップの出力は、点線で示すように一つの主チャンネルのみを生じてもよい。左−右の表現において、副バンドのための最も高いパワーを持ったチャンネルは主チャンネルとみなされ、また右チャンネルが最高パワーのチャンネルであれば、副バンドのためのビットストリーム3706において単一ビットが設定される。以下の条件が副バンドについて満たされるときに、中央−側部コード化が該副バンドのために使用いされる:
多重チャンネル信号の場合、各チャンネル群について上記が実行される。
ここで、
mは副バンドの数であり、
nはG0の欄番号である。
ここで、WIは、図19における表1から得られた重み値である。
典型的には、マスタービットストリームの各フレームは、(a)入力信号の異なる周波数分解能での周波数ドメイン内容を表す複数の量子化された音色成分、(b)再構築された音色成分と入力信号の間の相違から形成された時間ドメイン残余を表す、量子化された残余時間サンプル成分、および(c)入力信号の周波数範囲に亘る、残余信号の信号エネルギーを表すケール因子グリッドを含んでいる。多重チャンネル信号については、各フレームが、d)チャンネル群内での残余信号チャンネルの信号エネルギー比率を表す部分グリッド、およびe)音色成分のための副チャンネルの共同コード化を特定する各主チャンネルについてのビットマスクを含んでいる。通常は、各フレームにおける利用可能なデータ転送速度の一部は、音色成分(a)から割当てられ、また一部は残余成分(b、c)のために割当てられる。しかし、幾つかの場合には、利用可能な転送速度の全てが、音色成分をコード化するために割り当てられてよい。或いは、利用可能な転送速度の全てが、残余成分をコード化するために割り当てられてよい。極端な場合、スケール因子グリッドだけがコード化されてよく、この場合にはデコーダがノイズ信号を使用して、出力信号を再構築する。実際の応用の殆ど全てにおいて、該スケール調節されたビットストリームは、音色成分を含む少なくとも幾つかのフレーム、およびスケール因子グリッドを含む幾つかのフレームを含むであろう。
図13は、デコーダのためのブロック図を示している。ビットストリームパーサ600は、コード化前のコード化される信号のヘルツでのサンプル速度、該ストリームの元のデータ転送速度、およびコード化されたデータ転送速度からなる初期副情報を読取る。この初期副情報は、元の信号の完全なデータ転送速度を再構築することを可能にする。ビットストリーム599における更なる成分は、ビットストリームパーサ600によって構文解析され、適切なデコード要素:音色デコーダ601または残余デコーダ602へと回される。音色デコーダ601を介してデコード化された成分は、信号を時間ドメインへと戻し変換する逆周波数変換604を通して処理される。重なり加算ブロック608は、先にデコード化されたフレームの最後の半分の値を、逆周波数変換604の出力である丁度デコード化されたばかりのフレームの最初の半分の値に加える。ビットストリームパーサ600が残余デコード化プロセスの一部であると決定する成分は、残余デコーダ602を通して処理される。時間ドメイン中に表された32の周波数副バンドを含む残余デコーダ602の出力は、逆フィルタバンク605を通して処理される。逆フィルタバンク605は、32の副バンドを、コンバイナ607において重なり加算608の出力と組合される一つの信号に再合体させる。コンバイナ607の出力は、デコード化された出力信号614である。
デコーダの複雑さを低減するために、階層的フィルタバンクを使用して、逆周波数変換604、逆フィルタバンク605、重なり加算608およびコンバイナ607のステップを合体してもよい。図15に示すように、残余デコーダ602は逆階層的フィルタバンク4000の最初の段階へと通される一方、音色デコーダ601の出力は、最終逆変換4010の前の高周波数分解能段階において、残余サンプルに加えられる。次いで、こうして得られた逆変換されたサンプルが重なり加算されて、線型出力サンプル4016を生じる。
(a)各副バンドにおいて、Miの先のサンプルがバッファーされ、現在のMiサンプルと連結されて、各副バンドについての(2*Mi)の新たなサンプルを生じる2828;
(b)各副バンドにおいて、(2*Mi)の副バンドサンプルは、(2*Mi)点ウインドウ関数を乗じられる2706(図5a〜図5c);
(c)(2*Mi)点変換(下向き矢印2826で表される)が適用されて、各副バンドについてMiの変換係数を生じる;
(d)各副バンドについてのMiの変換係数が濃縮されて、N/2の係数の一つの群2824が形成される;
(e)N点逆変換(上向き矢印2822で表される)が前記連結された係数に適用されて、Nのサンプルを生じる;
(f)Nサンプルの各フレーム2704は、N−サンプルウインドウ関数2706を乗じられ、Nウインドウ化されたサンプル2708を生じる。
(g)得られたウインドウ化されたサンプル2708が重なり加算されて、所定の副バンドレベルでN/2の新たな出力サンプルを生じる。
(h)上記ステップは、全ての副バンドが処理されてしまうまで、現在のレベルおよび全ての後続レベルにおいて反復されて、元の時間サンプル2840が再構築される。
図15は、図7に示した順方向フィルタバンクと適合する、逆階層的フィルタバンク4000の例示的実施形態のブロック図を示している。デコード化された出力信号の合成を、以下で更に詳細に説明する:
1.各入力フレーム4002は、Pの副バンドの各々の中にM個の時間サンプルを含んでいる。
2.各副バンド4004をバッファーし、Mの新たなサンプルの中にシフトし、(2*M)点ウインドウを、50%重なり加算(OLA)4006を適用して、Mの新たな副バンドサンプルを生じる。
3.(2*M)点MDCT4006が各副バンド内で実行されて、Pの福バンドの各々において、MのMDCT係数の一つのフレームが形成される。
4.得られたMDCT係数がグループ化されて、(N/2)のMDCT係数の一つのフレーム4010が形成される。
5.各フレーム上で、N点IMDCT4012が実行される。
6.IMDCT出力は、N点の50%重なりフレームでウインドウ化され、重なり加算4014されて、N/2の新たな出力サンプル4016が形成される。
逆階層的フィルタバンクのもう一つの実施形態が図17a〜17bに示されており、これは図8a〜8bに示したフィルタバンクと適合する。この実施形態において、詳述されたフィルタバンク要素の幾つかは、三つの異なる周波数範囲を用い、各範囲において異なる周波数分解能を表す変換係数を用いて変換を生じるためには不完全である。これら変換係数からの時間ドメイン信号の再構築について、次の通り説明する。
ビットストリームパーサ600
ビットストリームパーサ600は、ビットストリームからIFFチャンク情報を読取り、該情報の要素を適切なデコーダ、音色デコーダ601または残余デコーダ602上に回す。該デコーダに到達する前に、ビットストリームがスケール調節されていることも可能である。用いられるスケール調節の方法に応じて、チャンクの最後にある音響心理学的データ要素は、失われたビットに起因して無効にされてよい。音色デコーダ601および残余デコーダ602は、チャンクの最後において無効であることが分かったデータを適切に無視する。当該要素のビットが失われている時に、全体の音響心理学的データ要素を無視する音色デコーダ601および残余デコーダ602に対する代替法は、これらデコーダを得て、存在しないビットにおける読取り、残りの失われたビットにはゼロ、ランダムパターン、または先の音響心理学的データ要素に基づくパターンを充填することにより、可能な限り多くの要素を修復することである。よりコンピュータ処理集約的ではあるが、結果として得られるデコード化されたオーディオが元のオーディオ信号に更に密接にマッチすることができるので、先の音響心理学的データ要素に基づくデータを使用する方が好ましい。
ビットストリームパーサ600によって見出された音色情報は、音色デコーダ601を介して処理される。音色成分の再合成は、先に述べたような階層的フィルタバンクを使用して実行される。或いは、逆迅速フーリエ変換を使用することができ、そのサイズは、エンコーダにおいて音色成分を抽出するために使用された最小変換サイズと同じサイズである。
a)周波数ドメイン副フレームを、ゼロ値で初期化する;
b)音色成分の必要な部分を、最小変換サイズから周波数ドメイン副フレームに再合成する;
c)必要な位置において、他の四つの変換サイズからの音色成分を同じ副フレームに再合成する。これら他の四つの変換サイズの再合成は、如何なる順序でも生じることができる。
Re[Freq]
+= Amplitude * sin(2*Pi*Phase/8);
Im[Freq]
+= Amplitude * cos(2*Pi*Phase/8);
Re[Freq + 1]
+= Amplitude * sin(2*Pi*Phase/8);
Im[Freq + 1]
+= Amplitude * cos(2*Pi*Phase/8);
xFreq=Freq>>(Group−1);
CurrentPhase=Phase−2*(2*xFreq+1);
for(i=0;i<length;i=i+1)
{
CurrentPhase += 2*(2*Freq+1)/length;
CurrentAmplitude
= Amplitude*Envelope[Group][i];
Re[i][xFreq] +=
CurrentAmplitude*
sin(2*Pi*CurrentPhase/8);
Im[i][xFreq] +=
CurrentAmplitude*
cos(2*Pi*CurrentPhase/8);
Re[i][xFreq+1] +=
CurrentAmplitude*
sin(2*Pi*CurrentPhase/8);
Im[i][xFreq+1] +=
CurrentAmplitude*
cos(2*Pi*CurrentPhase/8);
}
ここで、
Amplitude、FreqおよびPhaseは先に定義したのと同じである。
Groupは、基本関数変換サイズを表す数字であり、最小の変換については1であり、最大の変換については5である。
lengthは、Groupについての副フレームであり、
length = 2^(Group−1)
によって与えられる。
>>は、右シフトオペレータである。
CurrentAmplitude、およびCurrentPhaseは、次の副フレームのために保存される。
Envelope[Group][i]は、各群についての適切な長さ(length)の三角形状のエンベロープであり、両端ではゼロ値であり、中央では1の値である。
xFreq=Freq>>(Group−1);
CurrentPhase=Phase−2*(2*xFreq+1);
f_dlt=Freq−(xFreq<<(Group−1));
for(i=0;i<length;i=i+1)
{
CurrentPhase += 2*(2*Freq+1)/length;
CurrentAmplitude
=Amplitude*Envelope[Group][i];
Re_Amp=CurrentAmplitude*
sin(2*Pi*CurrentPhase/8);
Im_Amp=CurrentAmplitude*
cos(2*Pi*CurrentPhase/8);
a0 = Re_Amp * CorrCf[f_dlt][0];
b0 = Im_Amp * CorrCf[f_dlt][0];
a1 = Re_Amp * CorrCf[f_dlt][1];
b1 = Im_Amp * CorrCf[f_dlt][1];
a2 = Re_Amp * CorrCf[f_dlt][2];
b2 = Im_Amp * CorrCf[f_dlt][2];
a3 = Re_Amp * CorrCf[f_dlt][3];
b3 = Im_Amp * CorrCf[f_dlt][3];
a4 = Re_Amp * CorrCf[f_dlt][4];
b4 = Im_Amp * CorrCf[f_dlt][4];
Re[i][abs(xFreq−2)] −= a4;
Im[i][abs(xFreq−2)] −= b4;
Re[i][abs(xFreq−1)] += (a3−a0);
Im[i][abs(xFreq−1)] += (b3−b0);
Re[i][xFreq] += Re_Amp−a2−a3;
Im[i][xFreq] += Im_Amp−b2−b3;
Re[i][xFreq+1] += a1+a4−Re_Amp;
Im[i][xFreq + 1] += b1+b4−Im_Amp;
Re[i][xFreq + 2] += a0−a1;
Re[i][xFreq + 3] += a2;
Im[i][xFreq + 3] += a2;
}
ここで、
Amplitude、Freq、Phase、Envelope[Group][i]、Group、およびLengthは、全て先に定義した通りである。
CorrCfは、表2(図20)によって与えられる。
abs(val)は、valの絶対値を戻す関数である。
逆周波数変換604は、エンコーダにおける周波数ドメイン表現を作成するために使用される変換の逆である。現在の実施形態では、上記で述べた逆階層的フィルタバンクを用いる。或いは、逆迅速フーリエ変換を使用することができ、これは、重なりFFTがコード時間で使用されたとすれば、エンコーダにより音色を抽出するために使用された最小FFTの逆である。
残余デコーダ602の詳細なブロック図が、図18に示されている。ビットストリームパーサ600は、ビットストリームからのG1要素を、ライン610上でグリッドデコーダ702へと通す。グリッドデコーダ702は、G1をデコードして、64時間間隔による32の周波数ウ副バンドであるG0を再生する。該ビットストリームは、量子化されたG1値およびこれら値の間の距離を含む。ビットストリームからのG1値は、音色成分振幅を脱量子化するために使用したのと同じ脱量子化表を使用して脱量子化される。ビットストリームからの値の間の線型補間は、各G1副バンドについて8の最終G1振幅へと導く。G1の副バンド0および1はゼロに初期化され、ゼロ値は、これら二つの副バンドについての情報がビットストリームの中に見出されたときに置換えられる。次いで、これら振幅は、図19における表1から得られるマッピング重みを使用して、再生されたG0グリッドの中に重み付けされる。G0についての一般式は下記によって与えられる:
ここで、
mは、副バンド数であり、
Wは、表1化らのエントリーであり、
nは、G0カラム数であり、
kは、11のG1副バンドに亘る。
ビットストリームパーサ600によって認められた時間サンプルは、脱量子化器700において脱量子化される。脱量子化器700は、エンコーダの逆プロセスを使用して、ビットストリームからの時間サンプルを脱量子化する。副バンドゼロからの時間サンプルは16のレベルに、副バンド1および副バンド2は8のレベルに、副バンド11〜25は3のレベルに、また副バンド26〜31は2のレベルに脱量子化される。如何なる失われた時間サンプルまたは無効の時間サンプルも、白−ノイズ・スペクトルエネルギー分布を有する−1〜1の範囲にある値の擬ランダム配列で置換される。このような値の配列は、ゼロ値での置換よりも元の信号に更に密接に似た特性を有するので、これはスケール調節されたビットストリームオーディオの品質を改善する。
ビットストリームにおける副チャンネル情報は、ビットストリームにおけるフラッグ組に依存して、幾つかの副バンドについて主チャンネルからの差として保存される。これら副バンドのために、チャンネル分離器701は、主チャンネルにおける値およびビットストリームにおける相違値から、副チャンネルにおける値を修復する。副チャンネル情報が失われていれば、主チャンネル情報いを副チャンネルの中に複製し、また後述するステレオグリッドを使用することによって、ビットストリーム副チャンネル情報は主チャンネルから概略的に修復されることができる。
ステレオ再構築706は、副チャンネル情報(時間サンプル)がビットストリームの中に見出されないときに、副チャンネルに対して適用される。グリッドデコーダ702によって再構築されたステレオグリッドは、チャンネル間の元のステレオパワー比率を維持するために、主チャンネル時間サンプル情報を複製することによリ回復された二次時間サンプルに適用される。
多重チャンネル再構築706は、副チャンネルについての二次情報(時間サンプルまたはグリッド)がビットストリームの中に存在しないときに、副チャンネルに対して適用される。このプロセスは、グリッドデコーダ702によって再構築された部分グリッドが各チャンネル群内の副チャンネルの時間サンプルに適用され、副チャンネル内における適性なパワーレベルを維持するように主チャンネル時間サンプル情報を複製することによって回復されることを除き、ステレオ再構築706に類似している。この部分グリッドは、グリッドGの時間サンプルに各副チャンネルについての部分グリッドの対応する要素を乗じることによって、スケール調節ステップ703でのグリッドG0を含む他のスケール因子グリッドによるスケール調節に続き、再構築されたチャンネル群における各副チャンネルに個別的に適用される。グリッドG0、部分グリッドは、本発明に即して如何なる順序で適用されてもよい。
Claims (45)
- 入力信号をコード化する方法であって:
階層的フィルタバンク(HFB)を使用して、入力信号(100)を多重分解能の時間/周波数表現に分解すること(2101a、…210Ie)と;
前記時間/周波数表現から、多重周波数分解能で音色成分を抽出すること(2109)と;
前記時間/周波数表現から残余成分を抽出すること(2117,2118,2119)と;
前記成分を、デコード化された信号品質に対するそれらの相対的寄与に基づいて順位付けすること(102,107,108)と;
充分な数の最低順位のコード化された成分を除去して(115)、望ましいデータ転送速度未満または概略これに等しいデータ転送速度を有するスケール調節されたビットストリーム(116)を形成すること
を含んでなる方法。 - 請求項1に記載の方法であって、前記成分は、最初に音色成分を異なる周波数分解能で少なくとも一つの周波数副ドメイン(903,904,905,906,907)にグループ化し、また残余成分を異なる時間スケールおよび/または周波数分解能で少なくとも一つの残余副ドメイン(908,909,910)にグループ化し、これら副ドメインを、デコード化された信号品質に対するそれらの相対的寄与に基づいて順位付けし、また各副ドメイン内の前記成分を、デコード化された信号品質に対するそれらの相対的寄与に基づいて順位付けすることによって順位付けされる方法。
- 請求項2に記載の方法であって、更に、
その中で前記副ドメインおよび各副ドメイン内の成分がそれらの順位付け(109)に基づいて並べられるマスタービットストリーム(126)を形成することを含み、前記低順位付け成分は、最低順位の副ドメイン内における最低順位の成分から出発して、望ましいデータ転送速度が達成されるまで(115)、順序に従って成分を排除することにより除去される方法。 - 請求項1に記載の方法であって、更に、
順位付けされた量子化成分(109)を含むマスタービットストリーム(126)を形成することを含んでなり、該マスタービットストリームは、充分な数の低順位成分を除去してスケール調節されたビットストリーム(115)を形成することにより、スケール調節される方法。 - 請求項4に記載の方法であって、前記スケール調節されたビットストリーム(116)は、制約として望ましいデータ転送速度を有するチャンネル上に記録され、または該チャンネル上を送信される方法。
- 請求項5に記載の方法であって、前記スケール調節されたビットストリーム(116)は複数のスケール調節されたビットストリームの一つであり、また、各個別のビットストリームのデータ転送速度は独立に制御されるが、個々のデータ転送速度の総和は最大の合計データ転送速度を超えてはならず、且つ前記各データ転送速度はデコード化信号品質に従ってインタイムで且つ動的に制御されるとの制約条件を伴う方法。
- 請求項1に記載の方法であって、前記残余成分は、前記入力信号および音色成分の間の残余信号(113)から誘導され、それによって前記スケール調節されたビットストリームを形成するために排除される音色成分は、前記残余信号(2114)からも除去される(2112)方法。
- 請求項1に記載の方法であって、前記残余成分は時間サンプル成分(2117)と、該時間サンプル成分を異なる時間スケールおよび/または周波数分解能で修飾するスケール因子成分(2118,2119)とを含む方法
- 請求項8に記載の方法であって、前記時間サンプル成分は、グリッドG(2117)によって表され、また前記スケール因子成分は、前記グリッドGを時間/周波数平面内のG0およびG1のグリッド要素で分割することにより時間サンプル成分に適用される、複数の時間スケールおよび周波数分解能での一連の1以上のグリッドG0,G1(2118,2119)を含んでなり、各グリッドG0、G1は時間および/または周波数における異なる数のスケール因子を有する方法。
- 請求項8に記載の方法であって、前記スケール因子は、前記スケール因子成分に対して二次元変換を適用し、且つ前記変換係数を量子化することによってコード化される(107)方法。
- 請求項10に記載の方法であって、前記変換は、二次元離散コサイン変換である方法。
- 請求項1に記載の方法であって、前記HFBは、連続的に低下する周波数分解能レベルで、連続的反復において前記入力信号を変換係数に分解し、また前記音色成分および残余成分は、
各反復において、前記変換係数から音色成分を抽出し(2109)、該抽出された音色成分を量子化(2110)および音色リストに保存すること(2106)と;
前記入力信号から前記音色成分(2111,2112)を除去して、残余信号(2114)をHFBの次の反復へと通過させることと;
前記HFBの最終反復よりも比較的低い周波数分解能を備えた最終逆変換(2115)を、前記残余信号(113)に適用して、前記残余成分(2117)を抽出すること
によって抽出される方法。 - 請求項12に記載の方法であって、更に、
前記最終反復の後に、前記音色リストから音色成分(114)の幾つかを除去することと;
前記除去された量子化音色成分(114)をローカルにデコード化および逆量子化(104)し、最終反復においてそれらを残余信号(111)と合体させること
を含んでなる方法。 - 請求項13に記載の方法であって、前記リストから除去された比較的強い音色成分の少なくとも幾つかは、ローカルにデコード化および合体されない方法。
- 請求項12に記載の方法であって、各周波数分解能での前記音色成分は、
知覚モデルの適用を介して、望ましい音色成分を同定すること;
知覚的に最も有意な変換係数を選択すること;
各選択された変換係数のパラメータを音色成分として保存し、前記パラメータは振幅、周波数、位相、および対応する変換係数のフレームにおける位置を含むこと;および
前記音色リストにおける各音色成分について、前記パラメータをビットストリームへの挿入のために量子化およびコード化(2110)すること
によって抽出(2109)される方法。 - 請求項12に記載の方法であって、前記残余成分はグリッドG(2117)で表された時間サンプル成分を含み、前記残余成分の抽出は更に、
異なる時間/周波数分解能の1以上のスケール因子グリッド(2118,2119)であって、その要素が、時間/周波数領域における最大信号値または信号エネルギーを表すグリッドを構築すること;
時間−サンプルグリッドGの要素を、スケール因子グリッドの対応する要素で割って、スケール調節された時間サンプルグリッドG(2120)を生じさせることと;
前記スケール調節された時間サンプルグリッドG(2122)およびスケール因子グリッド(2121)を、前記コード化されたビットストリームの中に挿入するために量子化およびコード化すること
を含んでなる方法。 - 請求項1に記載の方法であって、前記入力信号が分解され、前記音色成分および残余成分は、
(a)前記入力信号のサンプルを、Nサンプルのフレームの中にバッファーすること(2900);
(b)前記各フレームにおけるNサンプルに、N−サンプルウインドウ関数を乗じること(2900);
(c)N−点変換を適用して、N/2の元の変換係数を生じること(2902);
(d)前記N/2の元の変換係数から音色成分を抽出し(2109)、該抽出された音色成分を量子化(2110)および音色リストの中に保存すること(2106);
(e)前記音色成分を逆量子化によって差引き(2111)、得られた音色変換係数を元の変換係数から差引いて(2112)、N/2の残余変換係数を得ること;
(f)該N/2の残余変換係数をP群のMi係数に分割し、Mi係数の総和がN/2になるようにすること(2906);
(g)P群の各々について、(2*Mi)点逆変換を前記変換係数に適用して、各群から(2*Mi)副バンドサンプルを生じること(2906);
(h)各副バンドにおいて、(2*Mi)副バンドサンプルに、(2*Mi)点ウインドウ関数を乗じること(2908);
(i)各副バンドにおいて、Miの先のサンプルを重ならせ、対応する値を付加して、各副バンドについてMiの新たなサンプルを生じること(2910);
(j)望ましい時間/変換分解能が得られるまで(29014)、連続的に小さくなる変換サイズNを用いて、Miの新たなサンプルの副バンドの1以上に対して上記のステップ(a)〜(i)を反復すること(2912);および
(k)比較的低い周波数分解能Nを備えた最終逆変換を、最終反復において出力された各副バンドについてのMiの新たなサンプルに適用して(2115)、副バンドのグリドGにおける時間サンプルの副バンド、および各副バンドにおける複数の時間サンプルを生じること
によって抽出される方法。 - 請求項1に記載の方法であって、前記入力信号は多重チャンネル入力信号であり、前記音色成分は前記チャンネルの群を形成することによって、また前記各群について、
主チャンネル、および副チャンネルの存在を同定する各ビットを用いてビットマスクを介して同定される(3602)少なくとも一つの副チャンネルを選択すること;
前記主チャンネルを量子化およびコード化すること(102,108);および
前記主チャンネルおよび各副チャンネルの間の差を量子化およびコード化すること
によって一緒にコード化される方法。 - 請求項18に記載の方法であって、各チャンネル群をコード化するためのジョイントチャンネルモードは、デコード化された出力信号における望ましいデータ転送速度について、何れのモードが知覚される最小の歪みを与えるかを示す測定基準に基づいて選択される方法。
- 請求項1に記載の方法であって、前記入力信号は多重チャンネル信号であり、更に、
前記抽出された音色成分を各チャンネルについての入力信号から差引いて、残余信号を形成すること(2109a,..2109e);
残余信号のチャンネルを、知覚基準およびコード化効率によって決定される群に形成すること(3702);
前記の各残余信号群について、主チャンネルおよび副チャンネルを決定すること(3704);
部分グリッド(508)を計算して、各残余信号群における各主/副チャンネル対の間の相対的空間情報をコード化すること(502);
各群における主チャンネルのための残余成分を、夫々のグリッドGとして量子化およびコード化すること(2110a);
前記部分グリッドを量子化およびコード化して、必要なデータ転送速度を低下させること(2110a);および
前記コード化された部分グリッドおよび各群についてのグリッドGを、スケール調節されたビットストリームの中に挿入すること(3706)
を含んでなる方法。 - 請求項20に記載の方法であって、前記副チャンネルが1以上のチャンネルの線型結合から構築される(3704)方法。
- オーディオ入力信号をコード化する方法であって:
オーディオ入力信号(100)を多重分解能の時間/周波数表現に分解すること(2101a、…210Ie)と;
各周波数分解能で音色成分を抽出すること(2109)と;
前記時間/周波数表現から音色成分を除去して(2111,2112)、残余信号を形成すること(113)と;
前記残余信号から残余成分を抽出すること(2117,2118,2119);
前記音色成分を、少なくとも一つの周波数副ドメインにグループ化すること(903,904,905,906,907)と;
前記残余成分を、少なくとも一つの残余副ドメインにグループ化すること(908,909,910)と;
前記副ドメインを、音響心理学的重要度に基づいて順位付けすること(103,107,109)と;
各副ドメイン内の前記成分を、音響心理学的重要度に基づいて順位付けすること(903,904,905,906,907)と;
各副ドメイン内の成分を量子化およびコード化すること(102,107,108)と;
充分な数の最低順位のコード化された成分を除去して(115)、望ましいデータ転送速度未満または概略これに等しいデータ転送速度を有するスケール調節されたビットストリーム(116)を形成すること
を含んでなる方法。 - 請求項22に記載の方法であって、前記音色成分は、異なる周波数分解能で複数の周波数副ドメイン(903,904,905,906,907)にグループ化され、また前記残余成分は、異なる時間スケールおよび/または周波数分解能で複数の残余副ドメイン(908,909,910)にグループ化されるグリッドを含んでいる方法。
- 請求項22に記載の方法であって、更に、
その中で前記副ドメインおよび各副ドメイン内の成分がそれらの順位付けに基づいて並べられるマスタービットストリーム(126)を形成することを含み、前記低順位付け成分は、最低順位の副ドメイン内における最低順位の成分から出発して、望ましいデータ転送速度が達成されるまで、順序に従って成分を排除することにより除去される(115)方法。 - 入力オーディオ信号をコード化し、スケール調節可能なビットストリームを形成するためのスケール調節可能なビットストリームエンコーダであって:
入力オーディオ信号を、連続的に低下する周波数分解能レベルで変換係数に分解し(2108)、また連続的反復で、連続的に精細になる時間スケールで時間ドメイン副バンドサンプルに戻す階層的フィルタバンク(HFB)(2100)と;
音色エンコーダ(102)であって、(a)各反復において前記変換係数から音色成分を抽出し(2109)、それらを量子化(2110)および音色リストの中に保存し(2106)、(b)前記入力オーディオ信号から前記音色成分を除去し、残余信号(2114b)をHFBの次の反復へと通過させ、(c)全ての前記抽出された音色成分を、デコード化された信号品質に対するそれらの相対的寄与に基づいて順位付けする音色エンコーダと;
HFBの最終反復(2101e)よりも相対的に低い周波数分解能で、最終の残余信号(113)に最終逆変換(2115)を適用して、残余成分(2117,2118,2119)を抽出し、該残余成分を、デコード化された信号品質に対するそれらの相対的寄与に基づいて順位付けする残余エンコーダ(107)と;
前記音色成分および残余成分をフレーム毎のベースでアセンブリングして、マスタービットストリーム(126)を形成するビットストリームフォーマット器(109)と;
前記マスタービットストリームの各フレームから、充分な数の低順位でコード化された成分を除去して、望ましいデータ転送速度未満またはこれに概略等しいデータ転送速度を有するスケール調節されたビットストリーム(116)を形成する、スケール調節器と
を含んでなるスケール調節可能なビットストリームエンコーダ。 - 請求項25に記載のエンコーダであって、前記音色エンコーダは、異なる周波数分解能で前記音色成分を周波数副ドメインにグループ化して(903,904,905,906,907)、これら成分を各副ドメインと共に順位付けし、また前記残余エンコーダは、異なる時間スケールおよび/または周波数分解能で前記残余成分を残余副ドメインにグループ化して(908,909,910)、これら成分を各副ドメインと共に順位付けし、また前記ビットストリームフォーマット器は、前記副ドメインを、デコード化された信号品質に対するそれらの相対的寄与に基づいて順位付けするエンコーダ。
- 請求項26に記載のエンコーダであって、前記ビットストリームフォーマット器は、各副ドメイン内の前記副ドメインおよび前記成分を、それらの順位に基づいて整列させ、前記スケール調節器(115)は、最低順位の副ドメイン内における最低順位の成分で出発して、望ましいデータ転送速度が達成されるまで(115)順序に従って成分を排除するエンコーダ。
- 請求項25に記載のエンコーダであって、前記入力オーディオ信号は多重チャンネル入力オーディオ信号であり、前記音色エンコーダは、前記チャンネルの群を形成することによって、また前記の各群について、
主チャンネル、および副チャンネルの存在を同定する各ビットを用いてビットマスクを介して同定される(3602)少なくとも一つの副チャンネルを選択すること;
前記主チャンネルを量子化およびコード化すること(102,108);および
前記主チャンネルおよび各副チャンネルの間の差を量子化およびコード化すること(102,108)
によって一緒にコード化されるエンコーダ。 - 請求項25に記載のエンコーダであって、前記入力信号は多重チャンネルオーディオ信号であり、前記残余エンコーダは、
残余信号のチャンネルを、知覚基準およびコード化効率によって決定される群に形成し(3702);
前記の各残余信号群について、主チャンネルおよび副チャンネルを決定し(3704);
部分グリッド(508)を計算して、各残余信号群における各主/副チャンネル対の間の相対的空間情報をコード化し(502);
各群における主チャンネルのための残余成分を、夫々のグリッドGとして量子化およびコード化し(2110a);
前記部分グリッドを量子化およびコード化して、必要なデータ転送速度を低下させ(2110a);および
前記コード化された部分グリッドおよび各群についてのグリッドGを、スケール調節されたビットストリームの中に挿入する(3706)
エンコーダ。 - 請求項25に記載のエンコーダであって、前記残余エンコーダは、グリッドG(2117)によって表された前記時間サンプル成分、および複数の時間スケールおよび周波数分解能での一連の1以上のグリッドG0,G1(2118,2119)を抽出し、これらは前記グリッドGを時間/周波数平面内のG0およびG1のグリッド要素で分割する(2120)ことにより時間サンプル成分に適用され、各グリッドG0、G1は時間および/または周波数における異なる数のスケール因子を有するエンコーダ。
- コード化されたビットストリームから時間ドメイン出力信号を再構築する方法であって:
所定の範囲内の予め定められたデータ転送速度を有するスケール調節されたビットストリーム(599)をフレームのシーケンスとして受信し、各フレームは次の(a)〜(c)の少なくとも一つを含んでいること:(a)入力信号の異なる周波数分解能において周波数ドメイン内容を表す複数の量子化された音色成分(2407)、(b)再構成された音色成分と入力信号の間の差から形成された時間ドメイン残余を表す、量子化された残余時間サンプル成分(2403)、および(c)入力信号の周波数範囲に少なくとも部分的に広がる残余信号の信号エネルギーを表すスケール因子グリッド(2404);
各フレームについて、前記周波数配位内での前記量子化された成分および/またはグリッドの位置に関する情報を受信すること;
前記スケール調節されたビットストリームのフレームを、前記成分およびグリッドに構文解析すること(600);
全ての音色成分デコード化して、変換係数を形成すること(2408);
全ての時間サンプル成分および全てのグリッドをデコード化すること(2401〜2405);
前記時間サンプル成分にグリッド要素を乗じて、時間ドメインサンプルを形成すること(2406);および
前記変換係数(2407)および時間ドメインサンプル(4002)に逆階層的フィルタバンク(2400)を適用して、時間ドメイン出力信号(614)を再構成すること
を含んでなる方法。 - 請求項31に記載の方法であって、前記時間ドメインサンプルが、
前記ビットストリームを、スケール因子グリッドG1(2404)および時間サンプル成分(2403)に構文解析すること;
グリッドG1スケール因子グリッドをデコードおよび逆量子化して、G0スケール因子グリッド(2405)を生じさせること;および
前記時間サンプル成分をデコード化および逆量子化し、これら時間サンプル値にG0スケール因子グリッド値を乗じて(2406)、再構築された時間サンプルを生じさせること(4002)
によって形成される方法。 - 請求項32に記載の方法であって、前記信号は残余チャンネルがグループ化およびコード化されている多重チャンネル信号であり、前記の各フレームはまた、d)チャンネルグループ内における前記残余信号チャンネルの信号エネルギー比率を表す部分グリッドを含んでおり、更に、
前記ビットストリームを部分グリッド(508)に構文解析すること;
前記部分グリッドをデコード化および逆量子化すること(2401);および
前記再構築された時間サンプルに、チャンネル群における各副チャンネルに適用される前記部分グリッド(508)を乗じて、再構築された時間ドメインサンプルを生じさせること
を含んでなる方法。 - 請求項31に記載の方法であって、前記入力信号は多重チャンネルであり、その中では音色成分軍が主チャンネルおよび1以上の副チャンネルを含んでおり、前記各フレームはまた、e)各群における主チャンネルに付随したビットマスクを含んでおり、ここでの各ビットは前記主チャンネルと一緒にコード化された副チャンネルの存在を同定し、
前記ビットストリームをビットマスクに構文解析し(3602);
各群における主チャンネルについて前記音色成分(601)をデコード化し;
各群において、前記一緒にコード化された音色成分(601)をデコード化し;
各群について、前記ビットマスクを使用して、前記各副チャンネルのための音色成分を、前記主チャンネルの音色成分および一緒にコード化された音色成分(601)から再構築する方法。 - 請求項34に記載の方法であって、前記副チャンネル音色成分が、主周波数および副周波数の間の差情報をデコード化することによってデコード化され、前記音色成分が存在する各副チャンネルについて振幅および位相がエントロピーコード化されて保存される方法。
- 請求項31に記載の方法であって、前記階層的フィルタバンク(2400)は、時間ドメインサンプル(4002)を残余変換係数(2411)に変換し、それを低周波数分解能で一組の音色成分(2407)についての変換係数(2409)と組み合せ(2412)、この組合された変換係数を逆変換(2413)して部分的に再構築された出力信号を形成し(2415)、該部分的に再構築された出力信号に対して、出力信号(614)が再構築されるまで、次に高い周波数分解能のもう一つの組の音色成分についての変換係数を用いてこれらステップを反復することにより、出力信号(614)を再構築する方法。
- 請求項36に記載の方法であって、前記時間ドメインサンプルが副バンドとして表され、前記逆階層的フィルタバンクは、下記a)〜g)により時間ドメイン出力信号を再構築する方法:
a)前記入力フレームの時間ドメイン副バンドの各々において信号をウインドウ化して、ウインドウ化された時間ドメイン副バンドを形成すること(2410);
b)前記ウインドウ化された時間ドメイン副バンドの各々に対して時間から周波数メインへの変換を適用し、変換係数を形成すること(2411);
c)得られた変換係数を連結して、より大きな組の残余変換係数を形成すること(2411);
d)前記一組の音色成分から前記変換係数を合成すること(2409);
e)前記音色成分および時間ドメイン成分から再構築された変換係数を、単一組の合体された変換係数に組み合せること(2412);
f)前記合体された変換係数に逆変換を適用し、ウインドウ化し、先のフレームと重なり加算して(2414)、部分的に再構築された時間ドメイン信号を再構築すること(2415);
g)時間ドメイン出力信号(614)が再構築されるまで、前記部分的に再構築された時間ドメイン信号に対して、次の組の音色成分を使用してステップ(a)〜(f)の連続的反復を適用すること(2407)。 - 請求項36に記載の方法であって、各入力フレームがPの副バンドの各々の中にMiの時間サンプルを含み、前記逆階層的フィルタバンクが以下のステップを実行する方法:
a)各副バンドiにおいて、Miの先のサンプルをバッファーし、現在のMiサンプルと連結して、2*Miの新たなサンプルを生じること(4004)
b)各副バンドiにおいて、前記2*Miの副バンドサンプルに2*Mi点ウインドウ関数を乗じること(4006);
c)前記副バンドサンプルに(2*Mi)点変換を適用して、各副バンドiのためのMiの変換係数を生じること(4008);
d)各副バンドiのための前記Miの変換係数を連結して、一組のN/2の係数を形成すること(4010);
e)前記デコード化および逆量子化された一組の音色成分から音色変換係数を合成し、それらを先のステップの前記連結された係数と組み合せて、一組の組合され連結された係数を形成すること(2407,2408,2409,2412);
f)前記組合され連結された係数にN点逆変換を適用して、Nのサンプルを生じさせること(4012);
g)Nのサンプルの各フレームにNのサンプルウインドウ関数を乗じて、Nのウインドウサンプルを生じさせること(4014)
h)得られた前記ウインドウ化されたサンプルを重なり加算し(4014)、部分的に再構築された出力信号として、所定の副バンドレベルでN/2の新たな出力サンプルを生じること(4016);
i)全ての副バンドが処理され且つNの元の時間サンプルが出力信号(614)として再構築されるまで、前記N/2の新たな出力サンプルに対して、次の組の音色成分を使用してステップ(a)〜(h)を反復すること(2407)。 - コード化されたビットストリームから時間ドメイン出力オーディオ信号を再構築するためのデコーダであって:
スケール調節されたビットストリームの各フレームを、そのオーディオ成分に構文解釈するためのビットストリームパーサ(600)であって、各フレームは次の(a)〜(c)の少なくとも一つを含んでいるビットストリームパーサ:(a)入力信号の異なる周波数分解能において周波数ドメイン内容を表す複数の量子化された音色成分、(b)再構成された音色成分と入力信号の間の差から形成された時間ドメイン残余を表す、量子化された残余時間サンプル成分、および(c)入力信号の周波数範囲に少なくとも部分的に広がる残余信号の信号エネルギーを表すスケール因子グリッド;
全ての時間サンプル成分および全てのグリッドをデコード化して、時間サンプルを再構築するための残余デコーダ(602);
全ての音色成分をデコード化して変換係数を形成するための音色デコーダ(601);および
時間サンプルを残余変換係数に変換し、それらを低周波数分解能で一組の音色成分のための変換係数と組み合せ、組合された変換係数を逆変換して部分的に再構築された出力信号を形成し、この部分的に再構築された出力信号に対して、次の最高周波数分解能でのもう一つの組の音色成分のための変換係数を用いて、前記オーディオ信号が再構築されるまでこれらステップを反復することによって、出力信号を再構築する逆階層的フィルタバンク(2400)
を含んでなるデコーダ。 - 請求項39に記載のデコーダであって、各入力フレームがPの副バンドの各々の中にMiの時間サンプルを含み、前記逆階層的フィルタバンクが以下のステップを実行するデコーダ:
a)各副バンドiにおいて、Miの先のサンプルをバッファーし、現在のMiサンプルと連結して、2*Miの新たなサンプルを生じること(4004)
b)各副バンドiにおいて、前記2*Miの副バンドサンプルに2*Mi点ウインドウ関数を乗じること(4006);
c)前記副バンドサンプルに(2*Mi)点変換を適用して、各副バンドiのためのMiの変換係数を生じること(4008);
d)各副バンドiのための前記Miの変換係数を連結して、一組のN/2の係数を形成すること(4010);
e)前記デコード化および逆量子化された一組の音色成分から音色変換係数を合成し、それらを先のステップの前記連結された係数と組み合せて、一組の組合され連結された係数を形成すること(2407,2408,2409,2412);
f)前記組合され連結された係数にN点逆変換を適用して、Nのサンプルを生じさせること(4012);
g)Nのサンプルの各フレームにNのサンプルウインドウ関数を乗じて、Nのウインドウサンプルを生じさせること(4014)
h)得られた前記ウインドウ化されたサンプルを重なり加算し(4014)、部分的に再構築された出力信号として、所定の副バンドレベルでN/2の新たな出力サンプルを生じること(4016);
i)全ての副バンドが処理され且つNの元の時間サンプルが出力信号(614)として再構築されるまで、前記N/2の新たな出力サンプルに対して、次の組の音色成分を使用してステップ(a)〜(h)を反復すること(2407)。 - 入力信号を階層的にフィルタリングして、ほぼ任意の時間/周波数分解を達成する方法であって:
(a)前記入力信号のサンプルを、Nサンプルのフレームの中にバッファーするステップ(2900)と;
(b)前記各フレームにおけるNサンプルに、N−サンプルウインドウ関数を乗じるステップ(2900)と;
(c)N−点変換を適用して、N/2の元の変換係数を生じるステップ(2902);
(d)該N/2の残余変換係数をP群のMi係数に分割し、Mi係数の総和がN/2になるようにするステップ(2906)と;
(e)P群の各々について、(2*Mi)点逆変換を前記変換係数に適用して、各群から(2*Mi)副バンドサンプルを生じるステップ(2906)と;
(f)各副バンドにおいて、(2*Mi)副バンドサンプルに、(2*Mi)点ウインドウ関数を乗じるステップ(2908)と;
(g)各副バンドにおいて、Miの先のサンプルを重ならせ、対応する値を付加して、各副バンドについてMiの新たなサンプルを生じるステップ(2910)と;
(h)望ましい時間/変換分解能が達成されるまで(2914)、Miの新たなサンプルの1以上の副バンドに対して、連続的に小さくなる変換サイズNを使用してステップ(a)〜(g)を反復するステップ(2912)
を含んでなる方法。 - 請求項41に記載の方法であって、前記変換がMDCT変換である方法。
- 請求項41に記載の方法であって、Miの全ての副バンドに対してステップ(a)〜(g)が反復される方法。
- 請求項41に記載の方法であって、Miの低周波数右副バンドの定義された組に対してのみ、ステップ(a)〜(g)が反復される方法。
- 入力信号の時間サンプルを階層的に再構築する方法であって、各入力フレームがPの副バンドの各々の中にMiの時間サンプルを含み、以下のステップを実行することを含んでなる方法:
a)各副バンドiにおいて、Miの先のサンプルをバッファーし、現在のMiサンプルと連結して、2*Miの新たなサンプルを生じること(4004)
b)各副バンドiにおいて、前記2*Miの副バンドサンプルに2*Mi点ウインドウ関数を乗じること(4006);
c)前記ウインドウ化された副バンドサンプルに(2*Mi)点変換を適用して、各副バンドiのためのMiの変換係数を生じること(4008);
d)各副バンドiのための前記Miの変換係数を連結して、一つのN/2の係数群を形成すること(4010);
e)前記連結された係数にN点逆変換を適用して、Nのサンプルを生じさせること(4012);
f)Nのサンプルの各フレームにN−サンプルウインドウ関数を乗じて、Nのウインドウサンプルを生じさせること(4014)
g)得られた前記ウインドウ化されたサンプルを重なり加算し(4014)、所定の副バンドレベルでN/2の新たな出力サンプルを生じること(4016);および
h)全ての副バンドが処理され且つNの元の時間サンプルが再構築されるまで、ステップ(a)〜(g)を反復すること。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US69155805P | 2005-06-17 | 2005-06-17 | |
US60/691,558 | 2005-06-17 | ||
US11/452,001 | 2006-06-12 | ||
US11/452,001 US7548853B2 (en) | 2005-06-17 | 2006-06-12 | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
PCT/IB2006/003986 WO2007074401A2 (en) | 2005-06-17 | 2006-06-16 | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012036055A Division JP5291815B2 (ja) | 2005-06-17 | 2012-02-22 | 階層的フィルタバンクを用いたスケール調節可能なコーディング |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008547043A true JP2008547043A (ja) | 2008-12-25 |
JP5164834B2 JP5164834B2 (ja) | 2013-03-21 |
Family
ID=37883522
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008516455A Expired - Fee Related JP5164834B2 (ja) | 2005-06-17 | 2006-06-16 | スケール調節可能な圧縮されたオーディオビットストリーム、並びに階層的フィルターバンクおよび多チャンネルジョイントコーディングを使用したコーデック |
JP2012036055A Active JP5291815B2 (ja) | 2005-06-17 | 2012-02-22 | 階層的フィルタバンクを用いたスケール調節可能なコーディング |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012036055A Active JP5291815B2 (ja) | 2005-06-17 | 2012-02-22 | 階層的フィルタバンクを用いたスケール調節可能なコーディング |
Country Status (15)
Country | Link |
---|---|
US (1) | US7548853B2 (ja) |
EP (2) | EP2479750B1 (ja) |
JP (2) | JP5164834B2 (ja) |
KR (1) | KR101325339B1 (ja) |
CN (1) | CN101199121B (ja) |
AU (1) | AU2006332046B2 (ja) |
CA (2) | CA2608030C (ja) |
ES (1) | ES2717606T3 (ja) |
HK (2) | HK1117655A1 (ja) |
IL (1) | IL187402A (ja) |
NZ (3) | NZ590418A (ja) |
PL (2) | PL1891740T3 (ja) |
RU (1) | RU2402160C2 (ja) |
TR (3) | TR200708666T1 (ja) |
WO (1) | WO2007074401A2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011137817A (ja) * | 2009-12-29 | 2011-07-14 | Mitsubishi Electric Research Laboratories Inc | ストリーミング測定値からストリーミング信号を再構築するための方法 |
JP2011529199A (ja) * | 2008-07-24 | 2011-12-01 | ディーティーエス・インコーポレイテッド | 二次元変換によるオーディオスケールファクタの圧縮 |
JPWO2018052004A1 (ja) * | 2016-09-15 | 2019-07-04 | 日本電信電話株式会社 | サンプル列変形装置、信号符号化装置、信号復号装置、サンプル列変形方法、信号符号化方法、信号復号方法、およびプログラム |
JP2019526074A (ja) * | 2016-07-29 | 2019-09-12 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | スペクトル解析に続いて部分合成を用いる不均一フィルタバンクのための時間領域エイリアシング低減 |
JP2022505789A (ja) * | 2018-10-26 | 2022-01-14 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | サブバンド併合および時間領域エイリアシング低減を使用した適応的な非均一時間/周波数タイリングによる知覚音声符号化 |
Families Citing this family (83)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7333929B1 (en) | 2001-09-13 | 2008-02-19 | Chmounk Dmitri V | Modular scalable compressed audio data stream |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
EP1571647A1 (en) * | 2004-02-26 | 2005-09-07 | Lg Electronics Inc. | Apparatus and method for processing bell sound |
KR20050087368A (ko) * | 2004-02-26 | 2005-08-31 | 엘지전자 주식회사 | 무선 단말기의 벨소리 처리 장치 |
KR100636906B1 (ko) * | 2004-03-22 | 2006-10-19 | 엘지전자 주식회사 | 미디 재생 장치 그 방법 |
SE0402651D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Advanced methods for interpolation and parameter signalling |
US7562021B2 (en) * | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
US7630882B2 (en) * | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
JP4640020B2 (ja) * | 2005-07-29 | 2011-03-02 | ソニー株式会社 | 音声符号化装置及び方法、並びに音声復号装置及び方法 |
CN100539437C (zh) * | 2005-07-29 | 2009-09-09 | 上海杰得微电子有限公司 | 一种音频编解码器的实现方法 |
CN101283249B (zh) * | 2005-10-05 | 2013-12-04 | Lg电子株式会社 | 信号处理的方法和装置以及编码和解码方法及其装置 |
US20070094035A1 (en) * | 2005-10-21 | 2007-04-26 | Nokia Corporation | Audio coding |
TWI297488B (en) * | 2006-02-20 | 2008-06-01 | Ite Tech Inc | Method for middle/side stereo coding and audio encoder using the same |
US20070270987A1 (en) * | 2006-05-18 | 2007-11-22 | Sharp Kabushiki Kaisha | Signal processing method, signal processing apparatus and recording medium |
EP1883067A1 (en) * | 2006-07-24 | 2008-01-30 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream |
US20080059201A1 (en) * | 2006-09-03 | 2008-03-06 | Chih-Hsiang Hsiao | Method and Related Device for Improving the Processing of MP3 Decoding and Encoding |
US20080120114A1 (en) * | 2006-11-20 | 2008-05-22 | Nokia Corporation | Method, Apparatus and Computer Program Product for Performing Stereo Adaptation for Audio Editing |
KR101261524B1 (ko) * | 2007-03-14 | 2013-05-06 | 삼성전자주식회사 | 노이즈를 포함하는 오디오 신호를 저비트율로부호화/복호화하는 방법 및 이를 위한 장치 |
KR101411901B1 (ko) * | 2007-06-12 | 2014-06-26 | 삼성전자주식회사 | 오디오 신호의 부호화/복호화 방법 및 장치 |
US7761290B2 (en) | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US8046214B2 (en) | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
US7885819B2 (en) * | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
WO2009007639A1 (fr) * | 2007-07-03 | 2009-01-15 | France Telecom | Quantification apres transformation lineaire combinant les signaux audio d'une scene sonore, codeur associe |
JP4372184B2 (ja) * | 2007-09-20 | 2009-11-25 | 株式会社東芝 | サンプルレート変換器 |
US8249883B2 (en) * | 2007-10-26 | 2012-08-21 | Microsoft Corporation | Channel extension coding for multi-channel source |
US20100250260A1 (en) * | 2007-11-06 | 2010-09-30 | Lasse Laaksonen | Encoder |
CN101896968A (zh) * | 2007-11-06 | 2010-11-24 | 诺基亚公司 | 音频编码装置及其方法 |
WO2009059633A1 (en) * | 2007-11-06 | 2009-05-14 | Nokia Corporation | An encoder |
US8386271B2 (en) * | 2008-03-25 | 2013-02-26 | Microsoft Corporation | Lossless and near lossless scalable audio codec |
KR101756834B1 (ko) | 2008-07-14 | 2017-07-12 | 삼성전자주식회사 | 오디오/스피치 신호의 부호화 및 복호화 방법 및 장치 |
US8855440B2 (en) * | 2008-08-04 | 2014-10-07 | Saudi Arabian Oil Company | Structure-independent analysis of 3-D seismic random noise |
JP5340378B2 (ja) * | 2009-02-26 | 2013-11-13 | パナソニック株式会社 | チャネル信号生成装置、音響信号符号化装置、音響信号復号装置、音響信号符号化方法及び音響信号復号方法 |
US20110301946A1 (en) * | 2009-02-27 | 2011-12-08 | Panasonic Corporation | Tone determination device and tone determination method |
CN102918590B (zh) * | 2010-03-31 | 2014-12-10 | 韩国电子通信研究院 | 编码方法和装置、以及解码方法和装置 |
KR101584480B1 (ko) | 2010-04-13 | 2016-01-14 | 지이 비디오 컴프레션, 엘엘씨 | 평면 간 예측 |
CN106454371B (zh) | 2010-04-13 | 2020-03-20 | Ge视频压缩有限责任公司 | 解码器、数组重建方法、编码器、编码方法及存储介质 |
ES2549734T3 (es) | 2010-04-13 | 2015-11-02 | Ge Video Compression, Llc | Codificación de vídeo que usa subdivisiones multi-árbol de imágenes |
KR102166520B1 (ko) | 2010-04-13 | 2020-10-16 | 지이 비디오 컴프레션, 엘엘씨 | 샘플 영역 병합 |
CN101848002B (zh) * | 2010-06-18 | 2012-09-19 | 上海交通大学 | Rs级联网格调制码的迭代译码装置及其译码方法 |
US9008811B2 (en) | 2010-09-17 | 2015-04-14 | Xiph.org Foundation | Methods and systems for adaptive time-frequency resolution in digital data coding |
JP5743137B2 (ja) * | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
WO2012122297A1 (en) | 2011-03-07 | 2012-09-13 | Xiph. Org. | Methods and systems for avoiding partial collapse in multi-block audio coding |
US8838442B2 (en) | 2011-03-07 | 2014-09-16 | Xiph.org Foundation | Method and system for two-step spreading for tonal artifact avoidance in audio coding |
US9009036B2 (en) | 2011-03-07 | 2015-04-14 | Xiph.org Foundation | Methods and systems for bit allocation and partitioning in gain-shape vector quantization for audio coding |
US9075159B2 (en) * | 2011-06-08 | 2015-07-07 | Chevron U.S.A., Inc. | System and method for seismic data inversion |
RU2505921C2 (ru) * | 2012-02-02 | 2014-01-27 | Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." | Способ и устройство кодирования и декодирования аудиосигналов (варианты) |
US9905236B2 (en) | 2012-03-23 | 2018-02-27 | Dolby Laboratories Licensing Corporation | Enabling sampling rate diversity in a voice communication system |
EP2665208A1 (en) * | 2012-05-14 | 2013-11-20 | Thomson Licensing | Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation |
JPWO2014007097A1 (ja) | 2012-07-02 | 2016-06-02 | ソニー株式会社 | 復号装置および方法、符号化装置および方法、並びにプログラム |
BR112014004127A2 (pt) * | 2012-07-02 | 2017-04-04 | Sony Corp | dispositivo e método de decodificação, programa, e, dispositivo e método de codificação |
WO2014049192A1 (en) * | 2012-09-26 | 2014-04-03 | Nokia Corporation | A method, an apparatus and a computer program for creating an audio composition signal |
US9373337B2 (en) * | 2012-11-20 | 2016-06-21 | Dts, Inc. | Reconstruction of a high-frequency range in low-bitrate audio coding using predictive pattern analysis |
TWI557727B (zh) * | 2013-04-05 | 2016-11-11 | 杜比國際公司 | 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品 |
US8908796B1 (en) * | 2013-05-15 | 2014-12-09 | University Of South Florida | Orthogonal frequency division multiplexing (OFDM) transmitter and receiver windowing for adjacent channel interference (ACI) suppression and rejection |
US9691406B2 (en) * | 2013-06-05 | 2017-06-27 | Dolby Laboratories Licensing Corporation | Method for encoding audio signals, apparatus for encoding audio signals, method for decoding audio signals and apparatus for decoding audio signals |
CN105474313B (zh) | 2013-06-21 | 2019-09-06 | 弗劳恩霍夫应用研究促进协会 | 时间缩放器、音频解码器、方法和计算机可读存储介质 |
KR101953613B1 (ko) | 2013-06-21 | 2019-03-04 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 지터 버퍼 제어부, 오디오 디코더, 방법 및 컴퓨터 프로그램 |
EP2830048A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for realizing a SAOC downmix of 3D audio content |
EP2830045A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Concept for audio encoding and decoding for audio channels and audio objects |
EP2830049A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient object metadata coding |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
US9564136B2 (en) | 2014-03-06 | 2017-02-07 | Dts, Inc. | Post-encoding bitrate reduction of multiple object audio |
EP2980794A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
EP2980798A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Harmonicity-dependent controlling of a harmonic filter tool |
EP2980795A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
US9747922B2 (en) * | 2014-09-19 | 2017-08-29 | Hyundai Motor Company | Sound signal processing method, and sound signal processing apparatus and vehicle equipped with the apparatus |
EP3230980B1 (en) * | 2014-12-09 | 2018-11-28 | Dolby International AB | Mdct-domain error concealment |
WO2016204579A1 (ko) * | 2015-06-17 | 2016-12-22 | 삼성전자 주식회사 | 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치 |
WO2016204581A1 (ko) * | 2015-06-17 | 2016-12-22 | 삼성전자 주식회사 | 저연산 포맷 변환을 위한 인터널 채널 처리 방법 및 장치 |
CN105070292B (zh) * | 2015-07-10 | 2018-11-16 | 珠海市杰理科技股份有限公司 | 音频文件数据重排序的方法和系统 |
CN107924683B (zh) * | 2015-10-15 | 2021-03-30 | 华为技术有限公司 | 正弦编码和解码的方法和装置 |
US9990317B2 (en) * | 2015-11-24 | 2018-06-05 | Qualcomm Incorporated | Full-mask partial-bit-field (FM-PBF) technique for latency sensitive masked-write |
GB2547877B (en) * | 2015-12-21 | 2019-08-14 | Graham Craven Peter | Lossless bandsplitting and bandjoining using allpass filters |
MX2019005147A (es) | 2016-11-08 | 2019-06-24 | Fraunhofer Ges Forschung | Aparato y metodo para codificar o decodificar una se?al multicanal usando una ganancia lateral y una ganancia residual. |
EP3616197A4 (en) | 2017-04-28 | 2021-01-27 | DTS, Inc. | AUDIO ENCODER WINDOW SIZES AND TIME-FREQUENCY TRANSFORMATIONS |
CN109389986B (zh) | 2017-08-10 | 2023-08-22 | 华为技术有限公司 | 时域立体声参数的编码方法和相关产品 |
EP3483879A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
CN110556117B (zh) * | 2018-05-31 | 2022-04-22 | 华为技术有限公司 | 立体声信号的编码方法和装置 |
TWI681384B (zh) * | 2018-08-01 | 2020-01-01 | 瑞昱半導體股份有限公司 | 音訊處理方法與音訊等化器 |
CN111341303B (zh) * | 2018-12-19 | 2023-10-31 | 北京猎户星空科技有限公司 | 一种声学模型的训练方法及装置、语音识别方法及装置 |
KR20220065758A (ko) * | 2019-09-20 | 2022-05-20 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 코딩 블록의 스케일링 프로세스 |
TWI825492B (zh) * | 2020-10-13 | 2023-12-11 | 弗勞恩霍夫爾協會 | 對多個音頻對象進行編碼的設備和方法、使用兩個以上之相關音頻對象進行解碼的設備和方法、電腦程式及資料結構產品 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5699382A (en) * | 1994-12-30 | 1997-12-16 | Lucent Technologies Inc. | Method for noise weighting filtering |
JPH11186911A (ja) * | 1997-11-20 | 1999-07-09 | Samsung Electron Co Ltd | ビット率の調節可能なオーディオ符号化/復号化方法及びその装置及びその方法を記録した記録媒体 |
JP2000268510A (ja) * | 1999-03-19 | 2000-09-29 | Victor Co Of Japan Ltd | 符号化装置 |
JP2000268509A (ja) * | 1999-03-19 | 2000-09-29 | Victor Co Of Japan Ltd | 符号化装置 |
US6298322B1 (en) * | 1999-05-06 | 2001-10-02 | Eric Lindemann | Encoding and synthesis of tonal audio signals using dominant sinusoids and a vector-quantized residual tonal signal |
JP2002517023A (ja) * | 1998-05-27 | 2002-06-11 | マイクロソフト コーポレイション | 音声信号の量子化ノイズをマスクするためのシステムと方法 |
US20030016772A1 (en) * | 2001-04-02 | 2003-01-23 | Per Ekstrand | Aliasing reduction using complex-exponential modulated filterbanks |
WO2005001813A1 (en) * | 2003-06-25 | 2005-01-06 | Coding Technologies Ab | Apparatus and method for encoding an audio signal and apparatus and method for decoding an encoded audio signal |
JP2005037949A (ja) * | 2003-07-16 | 2005-02-10 | Samsung Electronics Co Ltd | 広域音声信号の圧縮装置および復元装置ならびに圧縮方法および復元方法 |
US7003451B2 (en) * | 2000-11-14 | 2006-02-21 | Coding Technologies Ab | Apparatus and method applying adaptive spectral whitening in a high-frequency reconstruction coding system |
Family Cites Families (50)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4074069A (en) | 1975-06-18 | 1978-02-14 | Nippon Telegraph & Telephone Public Corporation | Method and apparatus for judging voiced and unvoiced conditions of speech signal |
US5222189A (en) | 1989-01-27 | 1993-06-22 | Dolby Laboratories Licensing Corporation | Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio |
CN1062963C (zh) * | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
GB2258372B (en) | 1991-08-02 | 1995-05-31 | Sony Corp | Apparatus for and methods of recording and/or reproducing digital data |
US5903454A (en) * | 1991-12-23 | 1999-05-11 | Hoffberg; Linda Irene | Human-factored interface corporating adaptive pattern recognition based controller apparatus |
US5347611A (en) | 1992-01-17 | 1994-09-13 | Telogy Networks Inc. | Apparatus and method for transparent tone passing over narrowband digital channels |
US5377302A (en) * | 1992-09-01 | 1994-12-27 | Monowave Corporation L.P. | System for recognizing speech |
US5623577A (en) | 1993-07-16 | 1997-04-22 | Dolby Laboratories Licensing Corporation | Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions |
US5632003A (en) | 1993-07-16 | 1997-05-20 | Dolby Laboratories Licensing Corporation | Computationally efficient adaptive bit allocation for coding method and apparatus |
US5451954A (en) | 1993-08-04 | 1995-09-19 | Dolby Laboratories Licensing Corporation | Quantization noise suppression for encoder/decoder system |
US5623003A (en) * | 1994-03-29 | 1997-04-22 | Kansai Paint Co., Ltd. | Coating compositions containing polyester resin, epoxy resins and an anticorrosion pigment |
GB9509831D0 (en) | 1995-05-15 | 1995-07-05 | Gerzon Michael A | Lossless coding method for waveform data |
US5987181A (en) | 1995-10-12 | 1999-11-16 | Sharp Kabushiki Kaisha | Coding and decoding apparatus which transmits and receives tool information for constructing decoding scheme |
US5819215A (en) | 1995-10-13 | 1998-10-06 | Dobson; Kurt | Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data |
EP0857392B1 (en) * | 1995-10-25 | 2004-08-11 | Sarnoff Corporation | Overlapping block zerotree wavelet image coder |
US5956674A (en) | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US5890106A (en) | 1996-03-19 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation |
FR2747225B1 (fr) * | 1996-04-03 | 1998-04-30 | France Telecom | Systeme de codage et systeme de decodage d'un signal, notamment d'un signal audionumerique |
US5845249A (en) * | 1996-05-03 | 1998-12-01 | Lsi Logic Corporation | Microarchitecture of audio core for an MPEG-2 and AC-3 decoder |
US5781144A (en) * | 1996-07-03 | 1998-07-14 | Litton Applied Technology | Wide band video signal denoiser and method for denoising |
US6092041A (en) | 1996-08-22 | 2000-07-18 | Motorola, Inc. | System and method of encoding and decoding a layered bitstream by re-applying psychoacoustic analysis in the decoder |
JP3622365B2 (ja) * | 1996-09-26 | 2005-02-23 | ヤマハ株式会社 | 音声符号化伝送方式 |
SG54383A1 (en) | 1996-10-31 | 1998-11-16 | Sgs Thomson Microelectronics A | Method and apparatus for decoding multi-channel audio data |
ATE371298T1 (de) | 1996-11-07 | 2007-09-15 | Koninkl Philips Electronics Nv | Übertragung eines bitstromsignals |
US5886276A (en) * | 1997-01-16 | 1999-03-23 | The Board Of Trustees Of The Leland Stanford Junior University | System and method for multiresolution scalable audio signal encoding |
KR100261253B1 (ko) | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치 |
KR100261254B1 (ko) | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치 |
KR100266578B1 (ko) | 1997-06-11 | 2000-09-15 | 구자홍 | 자동 음색보정 방법 및 장치 |
US5890125A (en) | 1997-07-16 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method |
US6144937A (en) * | 1997-07-23 | 2000-11-07 | Texas Instruments Incorporated | Noise suppression of speech by signal processing including applying a transform to time domain input sequences of digital signals representing audio information |
US6006179A (en) | 1997-10-28 | 1999-12-21 | America Online, Inc. | Audio codec using adaptive sparse vector quantization with subband vector classification |
US6091773A (en) | 1997-11-12 | 2000-07-18 | Sydorenko; Mark R. | Data compression method and apparatus |
US6081783A (en) * | 1997-11-14 | 2000-06-27 | Cirrus Logic, Inc. | Dual processor digital audio decoder with shared memory data transfer and task partitioning for decompressing compressed audio data, and systems and methods using the same |
JP3802219B2 (ja) | 1998-02-18 | 2006-07-26 | 富士通株式会社 | 音声符号化装置 |
US6115689A (en) | 1998-05-27 | 2000-09-05 | Microsoft Corporation | Scalable audio coder and decoder |
US6029126A (en) | 1998-06-30 | 2000-02-22 | Microsoft Corporation | Scalable audio coder and decoder |
US6216107B1 (en) | 1998-10-16 | 2001-04-10 | Ericsson Inc. | High-performance half-rate encoding apparatus and method for a TDM system |
GB2351884B (en) * | 1999-04-10 | 2002-07-31 | Peter Strong | Data transmission method |
US6434519B1 (en) | 1999-07-19 | 2002-08-13 | Qualcomm Incorporated | Method and apparatus for identifying frequency bands to compute linear phase shifts between frame prototypes in a speech coder |
US6446037B1 (en) | 1999-08-09 | 2002-09-03 | Dolby Laboratories Licensing Corporation | Scalable coding method for high quality audio |
JP4055336B2 (ja) | 2000-07-05 | 2008-03-05 | 日本電気株式会社 | 音声符号化装置及びそれに用いる音声符号化方法 |
SE0004187D0 (sv) * | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
US6868114B2 (en) * | 2001-01-18 | 2005-03-15 | The Titan Corporation | Interference suppression in a spread spectrum communications system using non-linear frequency domain excision |
US7610205B2 (en) | 2002-02-12 | 2009-10-27 | Dolby Laboratories Licensing Corporation | High quality time-scaling and pitch-scaling of audio signals |
US7136418B2 (en) * | 2001-05-03 | 2006-11-14 | University Of Washington | Scalable and perceptually ranked signal coding and decoding |
JP4622164B2 (ja) * | 2001-06-15 | 2011-02-02 | ソニー株式会社 | 音響信号符号化方法及び装置 |
US20060008000A1 (en) * | 2002-10-16 | 2006-01-12 | Koninikjkled Phillips Electronics N.V. | Fully scalable 3-d overcomplete wavelet video coding using adaptive motion compensated temporal filtering |
JP2006508385A (ja) * | 2002-11-27 | 2006-03-09 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 正弦波オーディオ符号化 |
AU2003274526A1 (en) * | 2002-11-27 | 2004-06-18 | Koninklijke Philips Electronics N.V. | Method for separating a sound frame into sinusoidal components and residual noise |
US20070153731A1 (en) * | 2006-01-05 | 2007-07-05 | Nadav Fine | Varying size coefficients in a wireless local area network return channel |
-
2006
- 2006-06-12 US US11/452,001 patent/US7548853B2/en active Active
- 2006-06-16 TR TR2007/08666T patent/TR200708666T1/xx unknown
- 2006-06-16 RU RU2008101778/09A patent/RU2402160C2/ru active
- 2006-06-16 KR KR1020077030321A patent/KR101325339B1/ko active IP Right Grant
- 2006-06-16 EP EP12160328.6A patent/EP2479750B1/en active Active
- 2006-06-16 NZ NZ590418A patent/NZ590418A/en unknown
- 2006-06-16 NZ NZ563337A patent/NZ563337A/en unknown
- 2006-06-16 TR TR2008/06843T patent/TR200806843T1/xx unknown
- 2006-06-16 ES ES06848793T patent/ES2717606T3/es active Active
- 2006-06-16 CN CN2006800217657A patent/CN101199121B/zh active Active
- 2006-06-16 PL PL06848793T patent/PL1891740T3/pl unknown
- 2006-06-16 CA CA2608030A patent/CA2608030C/en active Active
- 2006-06-16 EP EP06848793.3A patent/EP1891740B1/en active Active
- 2006-06-16 AU AU2006332046A patent/AU2006332046B2/en active Active
- 2006-06-16 CA CA2853987A patent/CA2853987C/en active Active
- 2006-06-16 WO PCT/IB2006/003986 patent/WO2007074401A2/en active Application Filing
- 2006-06-16 PL PL12160328T patent/PL2479750T3/pl unknown
- 2006-06-16 NZ NZ593517A patent/NZ593517A/en unknown
- 2006-06-16 JP JP2008516455A patent/JP5164834B2/ja not_active Expired - Fee Related
- 2006-06-16 TR TR2008/06842T patent/TR200806842T1/xx unknown
-
2007
- 2007-11-15 IL IL187402A patent/IL187402A/en active IP Right Grant
-
2008
- 2008-07-16 HK HK08107850.6A patent/HK1117655A1/xx unknown
-
2012
- 2012-02-22 JP JP2012036055A patent/JP5291815B2/ja active Active
- 2012-12-05 HK HK12112553.0A patent/HK1171859A1/xx unknown
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5699382A (en) * | 1994-12-30 | 1997-12-16 | Lucent Technologies Inc. | Method for noise weighting filtering |
JPH11186911A (ja) * | 1997-11-20 | 1999-07-09 | Samsung Electron Co Ltd | ビット率の調節可能なオーディオ符号化/復号化方法及びその装置及びその方法を記録した記録媒体 |
JP2002517023A (ja) * | 1998-05-27 | 2002-06-11 | マイクロソフト コーポレイション | 音声信号の量子化ノイズをマスクするためのシステムと方法 |
JP2000268510A (ja) * | 1999-03-19 | 2000-09-29 | Victor Co Of Japan Ltd | 符号化装置 |
JP2000268509A (ja) * | 1999-03-19 | 2000-09-29 | Victor Co Of Japan Ltd | 符号化装置 |
US6298322B1 (en) * | 1999-05-06 | 2001-10-02 | Eric Lindemann | Encoding and synthesis of tonal audio signals using dominant sinusoids and a vector-quantized residual tonal signal |
US7003451B2 (en) * | 2000-11-14 | 2006-02-21 | Coding Technologies Ab | Apparatus and method applying adaptive spectral whitening in a high-frequency reconstruction coding system |
US20030016772A1 (en) * | 2001-04-02 | 2003-01-23 | Per Ekstrand | Aliasing reduction using complex-exponential modulated filterbanks |
WO2005001813A1 (en) * | 2003-06-25 | 2005-01-06 | Coding Technologies Ab | Apparatus and method for encoding an audio signal and apparatus and method for decoding an encoded audio signal |
JP2005037949A (ja) * | 2003-07-16 | 2005-02-10 | Samsung Electronics Co Ltd | 広域音声信号の圧縮装置および復元装置ならびに圧縮方法および復元方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011529199A (ja) * | 2008-07-24 | 2011-12-01 | ディーティーエス・インコーポレイテッド | 二次元変換によるオーディオスケールファクタの圧縮 |
JP2011137817A (ja) * | 2009-12-29 | 2011-07-14 | Mitsubishi Electric Research Laboratories Inc | ストリーミング測定値からストリーミング信号を再構築するための方法 |
JP2019526074A (ja) * | 2016-07-29 | 2019-09-12 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | スペクトル解析に続いて部分合成を用いる不均一フィルタバンクのための時間領域エイリアシング低減 |
US10978082B2 (en) | 2016-07-29 | 2021-04-13 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Time domain aliasing reduction for non-uniform filterbanks which use spectral analysis followed by partial synthesis |
JPWO2018052004A1 (ja) * | 2016-09-15 | 2019-07-04 | 日本電信電話株式会社 | サンプル列変形装置、信号符号化装置、信号復号装置、サンプル列変形方法、信号符号化方法、信号復号方法、およびプログラム |
JP2022505789A (ja) * | 2018-10-26 | 2022-01-14 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | サブバンド併合および時間領域エイリアシング低減を使用した適応的な非均一時間/周波数タイリングによる知覚音声符号化 |
JP7279160B2 (ja) | 2018-10-26 | 2023-05-22 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | サブバンド併合および時間領域エイリアシング低減を使用した適応的な非均一時間/周波数タイリングによる知覚音声符号化 |
US11688408B2 (en) | 2018-10-26 | 2023-06-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Perceptual audio coding with adaptive non-uniform time/frequency tiling using subband merging and the time domain aliasing reduction |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5164834B2 (ja) | スケール調節可能な圧縮されたオーディオビットストリーム、並びに階層的フィルターバンクおよび多チャンネルジョイントコーディングを使用したコーデック | |
US7333929B1 (en) | Modular scalable compressed audio data stream | |
JP4950210B2 (ja) | オーディオ圧縮 | |
US9111532B2 (en) | Methods and systems for perceptual spectral decoding | |
JP2018013796A (ja) | 復号装置、復号方法およびコンピュータプログラム | |
EP1852851A1 (en) | An enhanced audio encoding/decoding device and method | |
JP2001521648A (ja) | スペクトル帯域複製を用いた原始コーディングの強化 | |
KR20070037945A (ko) | 오디오 신호의 부호화/복호화 방법 및 장치 | |
CN111210832B (zh) | 基于频谱包络模板的带宽扩展音频编解码方法及装置 | |
EP1873753A1 (en) | Enhanced audio encoding/decoding device and method | |
GB2357231A (en) | Encoding and decoding speech signals | |
US20040083094A1 (en) | Wavelet-based compression and decompression of audio sample sets | |
AU2011205144B2 (en) | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding | |
AU2011221401B2 (en) | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding | |
Spanias et al. | Analysis of the MPEG-1 Layer III (MP3) Algorithm using MATLAB | |
Atlas et al. | Modulation frequency and efficient audio coding | |
Reyes et al. | A new perceptual entropy-based method to achieve a signal adapted wavelet tree in a low bit rate perceptual audio coder | |
Ning | Analysis and coding of high quality audio signals | |
Bhaskaran et al. | Standards for Audio Compression | |
Pollak et al. | Audio Compression using Wavelet Techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090515 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091030 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110822 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20111122 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20111130 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120521 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120821 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120828 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20121019 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20121026 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121116 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121210 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121218 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151228 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5164834 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |