JP2010500631A - サイド情報なしの時間的ノイズエンベロープの自由な整形 - Google Patents
サイド情報なしの時間的ノイズエンベロープの自由な整形 Download PDFInfo
- Publication number
- JP2010500631A JP2010500631A JP2009524635A JP2009524635A JP2010500631A JP 2010500631 A JP2010500631 A JP 2010500631A JP 2009524635 A JP2009524635 A JP 2009524635A JP 2009524635 A JP2009524635 A JP 2009524635A JP 2010500631 A JP2010500631 A JP 2010500631A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- quantization
- time domain
- noise
- frequency domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002123 temporal effect Effects 0.000 title claims abstract description 43
- 238000007493 shaping process Methods 0.000 title claims abstract description 19
- 238000013139 quantization Methods 0.000 claims abstract description 113
- 238000001914 filtration Methods 0.000 claims abstract description 7
- 238000000034 method Methods 0.000 claims description 71
- 230000008569 process Effects 0.000 claims description 17
- 230000000873 masking effect Effects 0.000 claims description 14
- 238000001228 spectrum Methods 0.000 claims description 11
- 230000005236 sound signal Effects 0.000 claims description 10
- 230000004044 response Effects 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims 2
- 230000003595 spectral effect Effects 0.000 abstract description 38
- 230000006870 function Effects 0.000 description 23
- 238000006243 chemical reaction Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 9
- 238000012546 transfer Methods 0.000 description 5
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000001052 transient effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000001550 time effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/665—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
- Transducers For Ultrasonic Waves (AREA)
- Burglar Alarm Systems (AREA)
Abstract
Description
2.AC−3のような既存のシステムに対する下位互換性をTNSに持たせることができないスペクトル手段に、逆フィルターを適用する必要がある
3.スペクトルに、逆フィルターを適用する必要があるので、デコーダの複雑さが増大する
本発明の特徴によれば、ノイズフィードバック量子化(NFQ)に基づく新技術により、スペクトル領域コーディングシステムにおける量子化ノイズの時間エンベロープを、MPEG−2/4・AACに用いられるTNSコーディングツールにより課された制限を克服しつつ修正する。本発明の特徴によれば、AACシステムにおけるTNSの代わりにNFQを採用する。本発明の特徴によれば、NFQはまた、AC−3システムのような他のスペクトル領域のコーディングシステムにおいて採用することもできる。
本発明のさらに他の特徴によれば、ディジタルオーディオエンコーダにおける、周波数領域ノイズフィードバック量子化の方法が提供される。この方法では、時間領域オーディオ信号から抽出した周波数領域信号をノイズフィードバック信号と結合させ、量子化装置の入力信号を生成し、量子化装置の入力信号を量子化して量子化装置の出力信号を生成し、量子化装置の入力信号と量子化装置の出力信号とを結合して量子化誤差信号を生成し、量子化誤差信号にフィルターを掛けてノイズフィードバック信号を生成する。
2.エンコーダのみの処理である
3.サイド情報の伝送を必要としない
4.既存のオーディオコーディングシステムと下位互換性がある
5.デコーダの複雑性を軽減する
本発明の他の利点は、ノイズの時間的進展がスペクトルグループの信号特性によく合致するように、フィードバックフィルターを全スペクトルに亘って変化させることができる点である。言い換えると、1以上の周波数ビン又は周波数ビンのグループ、ここで周波数ビンはスペクトルグループを形成している、の各々に一意的なフィードバックフィルターを採用することができる。TNSもそのような能力を持つが、デコーダに要求されるスペクトルグループを示すことの必要性と共に、フィルター係数をデコーダに伝送する必要性があるので、使うことのできるスペクトル領域の数は非常に制限される。
AAC(以下の参考文献2参照)及びAC−3(以下の参考文献3参照)を含む最新のオーディオコーディング技術では、量子化により生じたノイズを、知覚的に適切な方法で、制御するためにスペクトル領域における量子化を行う。一般に、MDCTのような時間・周波数変換を用いて、入力時間波形をスペクトル領域に変換する。時間・周波数変換と平行して、知覚モデルを計算し、時間・周波数変換の出力係数のそれぞれに生じる量子化ノイズを調整するために知覚モデルを用いる。図2は、入力をスペクトル領域に変換し信号のスペクトル表現を量子化する、先行技術のオーディオコーディングシステム(エンコーダ及びデコーダ)の単純化して示した概略ブロック図である。離散的時間領域信号x(n)を、周波数領域(又はスペクトル領域)の信号を生成するための、時間・周波数変換又は時間・周波数変換機能(時間・周波数変換)12に適用する。スペクトル領域の信号を、量子化装置又は量子化機能(Q)14により量子化し、周波数領域の信号を量子化したものY(K)を生成する。システムのデコーダ部分には、時間領域の出力信号をもたらす逆変換又は逆変換機能(周波数・時間変換)16が含まれる。
1つの方法は、時間的信号のエンベロープを計算し、逆変換し、式(7)で示したような計算結果の逆DFT(離散フーリエ変換)を計算することである。この方法は、フィードバックを伴うスペクトル領域の量子化の結果得られたノイズ特性により、変換ブロック内のすべてのサンプルでほぼ等しい部分的な信号対ノイズ比(少数のサンプルについて計算した信号対ノイズ比)が導かれることを確実なものにする。これは以下のように示される。
本発明の実施の形態を適用したときの性能の一例を図4に示す。ここで、ノイズフィードバックフィルター又はノイズフィードバックフィルター機能を、結果生じた部分的な信号対ノイズ比がほぼ一定になるような、オーディオコンテンツの特定の変換ブロックに適用するよう設計されている。部分的な信号対ノイズ比は、この例では、変換ブロックにおけるサンプル数より少ない、少数のサンプルについて計算したSNRとして定義される。さらにこの例では、ノイズフィードバックフィルターの次数は10に設定されている。図4の上段は、鋭い過渡信号を有する変換ブロック内の時間領域における入力波形を示す。中段は、単純なスペクトル領域のコーダの出力信号を示し、ここでは、量子化ノイズが過渡信号の始まる前の変換ブロック全体に拡がっている。下段は、次数が10のNFQを採用した本発明の実施の形態を適用したスペクトル領域オーディオコーダの出力を示す。本例における、NFQ処理又はNFQシステムに対して、フィードバックフィルターは、断片的なSNRが、変換ブロック全体を通してほぼ一定に維持されるように計算される。量子化ノイズの時間的エンベロープを修正させる本発明の能力を示すように、NFQ処理又はNFQシステムの出力は、NFQがない場合の構成に比べて顕著にプリエコー(過渡信号に先立つ、変換ブロック内にノイズが拡がっている部分)が少なくなっている。
先行技術のMPEG−2/4・AACエンコーダの単純化した概略ブロック図を図6に示す。入力パルスコード変調(PCM)オーディオが、2048点のMDCT32を用いて、スペクトル領域に変換され、そのブロックに対するマスキング曲線の推定値が心理音響モデル34を用いて計算される。次に、(スペクトルの量子化による)ノイズ対マスク比(NMR)をできるだけ低く維持するようにスケールファクターが選択される(36)。結果生じた信号は量子化され(38)、次いでエントロピーコード化される(40)。フォーマッタ又はフォーマット処理(ビットストリーム)42は、エンコードされたビットストリーム出力を生成する。しかしながらこの技術は、個々の変換ブロック内での時間的マスキングを無視する。本発明の特徴によれば、量子化ノイズを時間的に配置する方法が示されている。図6に示したAACエンコーダを、図7で示したように、ノイズフィードバック量子化装置18及びダイナミックノイズフィードバック計算30を加算し、補完的なTNSエンコーディング・デコーディングフィルター(すなわち、図1のフィルター6及び8)を削除し、TNSフィルター係数をエンコーダからデコーダに伝送する必要性を削除すると、先に示唆したように、スペクトル領域量子化ノイズを、(スペクトル領域にスケールファクターを適用することにより)スペクトルマスキングモデルに適するのみならず(NFQを適用することにより)時間的マスキングモデルにも適するように再配置することができる。ダイナミックノイズフィードバック計算30は、(1)PCM時間領域入力、又は(2)MDCT32の周波数領域出力のどちらか一方からの入力を受け取る。時間的マスキングモデルは図7には示されていない。
x(n)n=0,1,...N−1
別名化した時間シーケンスを抽出することができ、
本発明に係るノイズフィードバック量子化の適用には、以下のうちの少なくとも1つが含まれる。
以下の特許、特許出願、及び、刊行物は参照としてそのすべてを本明細書に編入する。
[2]MPEG−2/4・AACの詳細は以下の参考文献に記載されている
1)ISO/IEC IS-14496(パート3、オーディオ)、1996年、AAC ISO/IEC JTC1/SC29, 「Information technology-very low bitrate audio-visual coding」、
2) ISO/IEC 13818-7、International Standard、1997年「MPEG-2 advanced audio coding, AAC」、
3) M. Bosi、K. Brandenburg、S. Quackenbush、L. Fielder、K. Akagiri、H. Fuchs、M. Dietz、J. Herre、G. Davidson、及び、Y. Oikawaによる、1996年、Proc. of the 101st AES-Convention、「ISO/IEC MPEG-2 Advanced Audio Coding」、
4) M. Bosi、K. Brandenburg、S. Quackenbush、L. Fielder、K. Akagiri、H. Fuchs、M. Dietz、J. Herre、G. Davidson、及び、Y. Oikawaによる、Journal of the AES, Vol.45, No.10, October 1997, pp. 789-814、「ISO/IEC MPEG-2 Advanced Audio Coding」、
5) Karlheinz Brandenburgによる、Proc. of the AES 17th International Conference on High Quality Audio Coding, Florence, Italy, 1999、「MP3 and AAC explained」、及び、
6) G. A. Soulodre他による、J. Audio Eng. Soc, Vol.46, No.3, pp 164-177 March 1998、「Subjective Evaluation of State-of-the-Art Two-Channel Audio Codecs」
[3]J. Princen、A. Bradleyによる、IEEE Trans. Accoust. Speech Signal Processing, vol. ASSP-34 pp. 1153-1161, Oct. 1986、「Analysis/synthesis filter bank design based on time domain aliasing cancellation」
[4]AC−3、ドルビーデジタル(Dolby Digital)としても知られている(ドルビーとドルビーデジタルはドルビー・ラボラトリーズ・ライセンシング・コーポレーションの登録商標である)は、「A/52B document」に定義されている(Digital Audio Compression Standard (AC-3, E-AC-3) Revision B、及びそれに先行する標準、「A52/A」書面(ATSC標準:Digital Audio Compression Standard (AC-3), Revision A)及び「A52/A」(Digital Audio Compression Standard (AC-3))。
1)Steve Vernonによる、1995年8月の EEE Trans.Consumer Electronics,Vol.41,No. 3、「Design and Implementation of AC-3 Coders」
2)Mark Davisによる、1993年10月のAudio Engineering Society Preprint 3774, 95th AES Convention,「The AC-3 Multichannel Coder」
3)Bosi他による、1992年10月のAudio Engineering Society Preprint 3365, 93rd AES Convention,「High Quality, Low-Rate Audio Transform Coding for Transmission and Multimedia Applications」
[5]Werner Verhelst、Dreten De Koningによる2002年6月の、「Least Squares Theory and Design of Optimal Noise Shaping Filters」AES 22nd International Conference on Virtual, Synthetic and Entertainment Audio。
本発明は、ハードウェア又はソフトウェア又は両方を組み合わせたもの(例えば、プログラマブルロジックアレー)で実施することができる。特記なき場合は、本発明の1部として含まれるアルゴリズムは、特定の計算機または特定の他の装置に本質的に関連するものではない。具体的には、種々の汎用機を、ここに記載された内容に従って書かれたプログラムと共に用いてもよい、あるいは、要求の方法を実行するために、より特化した装置(例えば、集積回路)を構成することが便利かもしれない。このように、本発明は、それぞれ少なくとも1つのプロセッサ、少なくとも1つの記憶システム(揮発性及び非揮発性メモリー及び/又は記憶素子を含む)、少なくとも1つの入力装置又は入力ポート、及び少なくとも1つの出力装置又は出力ポートを具備する、1つ以上のプログラマブルコンピュータシステム上で実行される1つ以上のコンピュータプログラムにより実現することができる。ここに記載した機能を遂行し、出力情報を出力させるために入力データにプログラムコードを適用する。この出力情報は、公知の方法で、1以上の出力装置に適用される。
Claims (25)
- 離散時間領域信号の周波数領域表現の量子化を採用する、離散時間領域信号をエンコーディングするためのディジタルオーディオエンコーディング方法であって、
量子化誤差の指標を抽出するステップと、
フィルターされた量子化誤差の指標を生成するために前記量子化誤差の指標にフィルターを掛けるステップと、
前記フィルターされた量子化誤差の指標を、量子化の前に前記離散時間領域信号の周波数領域表現にフィードバック信号として適用するステップと、
を具備し、
前記フルターを掛けるステップでのフィルター係数により、周波数領域から時間領域に逆変換したときに、離散時間領域信号の量子化された周波数領域表現の時間領域における量子化ノイズを整形する効果がもたらされることを特徴とする方法。 - 前記フィルターを掛けるステップでは、離散時間領域信号の周波数領域表現のスペクトルの全セグメントに亘ってフィルターされた量子化誤差の指標が変化することができるように、1以上の周波数ビン又は周波数ビンのグループの各々にフィルターされた量子化誤差の指標を生成するために前記量子化誤差の指標にフィルターを掛けることを特徴とする請求項1に記載の方法。
- 前記フィルター係数は動的に制御可能であることを特徴とする請求項1又は請求項2に記載の方法。
- 前記フィルター係数は、前記離散時間領域信号の指標に応答して動的に制御可能であることを特徴とする請求項3に記載の方法。
- 前記離散時間領域信号の前記指標は、時間的信号のエンベロープを計算し、逆変換し、その結果の逆DFTを計算することを含む処理により取得することを特徴とする請求項4に記載の方法。
- 前記フィルター係数は、前記離散時間領域信号の周波数領域表現の指標に応答して動的に制御可能であることを特徴とする請求項3に記載の方法。
- 前記離散時間領域信号の前記周波数領域表現の指標は、線形予測コーディング(LPC)計算を含む処理により取得することを特徴とする請求項6に記載の方法。
- 前記フィルター係数は、時間的マスキングモデルに応答することを特徴とする請求項1乃至請求項7のいずれか1項に記載の方法。
- 前記時間的マスキングモデルは、量子化した時間的整形をおこなおうとすることを特徴とする請求項8に記載の方法。
- 前記時間的マスキングモデルは、変換ブロック内で前記離散時間領域信号の相対的に音量の小さいセグメントから音量の大きいセグメントに前記量子化ノイズを移動させようとすることを特徴とする請求項8に記載の方法。
- エンコードされたビットストリームを生成するために、前記離散時間領域信号の前記量子化した周波数領域表現をエンコードするステップをさらに具備することを特徴とする請求項1乃至請求項10のいずれか1項に記載のオーディオエンコーディング方法。
- 請求項11に記載のエンコーディング方法により生成されたビットストリームをデコードするようにしたディジタルオーディオデコーダ。
- 離散時間領域信号の周波数領域表現を量子化し、量子化誤差を抽出し、フィルターされた量子化誤差の指標を生成するために量子化誤差の指標にフィルターを掛け、前記離散時間領域信号の量子化する前の前記周波数領域表現に、フィードバック信号としてフィルターされた量子化誤差の指標を適用し、離散時間領域信号の量子化された周波数領域表現をビットストリームにエンコードする、エンコーダによって生成されたエントロピーエンコードされたビットストリームをデコーディングするためのディジタルオーディオデコーディング方法であって、
離散時間領域信号の量子化された前記周波数領域表現又はその近似を生成するために、前記ビットストリームをデコードするステップと、
前記量子化された前記周波数領域表現又はその近似を逆量子化するステップと、
オーディオ信号を生成するために前記周波数領域表現又はその近似を時間領域に逆変換するステップと、
を具備し、前記エンコーダ中のフィルター係数は、前記オーディオ信号の量子化ノイズの整形に影響を与えることを特徴とする方法。 - ディジタルオーディオエンコーダにおける、周波数領域ノイズフィードバック量子化の方法であって、
量子化装置の入力信号を生成するために時間領域オーディオ信号から抽出した周波数領域信号をノイズフィードバック信号と結合させるステップと、
量子化装置の出力信号を生成するために、前記量子化装置の入力信号を量子化するステップと、
量子化誤差信号を生成するために、前記量子化装置の前記入力信号を前記量子化装置の前記出力信号と結合させるステップと、
ノイズフィードバック信号を生成するために、前記量子化誤差信号にフィルターを掛けるステップと、
を具備することを特徴とする方法。 - 前記ノイズフィードバックのフィルター係数を動的に制御するステップを具備することを特徴とする請求項14に記載の方法。
- 前記動的に制御するステップでは、前記周波数領域信号を抽出する時間領域オーディオ信号の指標に応答して前記ノイズフィードバックのフィルター係数を制御することを特徴とする請求項15に記載の方法。
- 前記動的に制御するステップでは、時間的マスキングモデルに応答して前記ノイズフィードバックのフィルター係数を制御することを特徴とする請求項16に記載の方法。
- 請求項1乃至請求項17のいずれか1項に記載の方法を実施するようにした装置。
- 請求項18に記載の装置をコンピュータに制御させるための、コンピュータ読み取り可能な媒体に記憶させたコンピュータプログラム。
- 請求項1乃至請求項17に記載の方法をコンピュータに実行させるための、コンピュータ読み取り可能な媒体に記憶させたコンピュータプログラム。
- ディジタルオーディオエンコーダで用いるための周波数領域ノイズフィードバック量子化装置であって、
量子化装置の入力信号を生成するために、時間領域オーディオ信号から抽出した周波数領域信号をノイズフィードバック信号と結合させる第1の合成器と、
量子化装置の出力信号を生成するために、前記量子化装置の入力信号を量子化する量子化装置と、
量子化誤差信号を生成するために、前記量子化装置の入力信号と前記量子化装置の出力信号とを結合する第2の合成器と、
ノイズフィードバック信号を生成するために、前記量子化誤差信号にフィルターを掛けるノイズフィードバックフィルターと、
を具備することを特徴とする装置。 - ノイズフィードバックフィルター係数を動的に制御する、フィルター係数制御装置をさらに具備することを特徴とする請求項21に記載の量子化装置。
- 前記フィルター係数制御装置は、前記周波数領域信号を抽出する時間領域の1以上の指標に応答して前記ノイズフィードバックフィルター係数を制御することを特徴とする請求項22に記載の量子化装置。
- 前記フィルター係数制御装置は、時間的マスキングモデルに応答して前記ノイズフィードバックフィルター係数を制御することを特徴とする請求項23に記載の量子化装置。
- 前記ノイズフィードバックフィルターの次数は10から20の範囲であることを特徴とする請求項21乃至請求項24のいずれか1項に記載の量子化装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US83809406P | 2006-08-15 | 2006-08-15 | |
US60/838,094 | 2006-08-15 | ||
PCT/US2007/017811 WO2008021247A2 (en) | 2006-08-15 | 2007-08-10 | Arbitrary shaping of temporal noise envelope without side-information |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010500631A true JP2010500631A (ja) | 2010-01-07 |
JP5096468B2 JP5096468B2 (ja) | 2012-12-12 |
Family
ID=38984075
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009524635A Active JP5096468B2 (ja) | 2006-08-15 | 2007-08-10 | サイド情報なしの時間的ノイズエンベロープの自由な整形 |
Country Status (8)
Country | Link |
---|---|
US (1) | US8706507B2 (ja) |
EP (1) | EP2054882B1 (ja) |
JP (1) | JP5096468B2 (ja) |
CN (1) | CN101501761B (ja) |
AT (1) | ATE496365T1 (ja) |
DE (1) | DE602007012116D1 (ja) |
TW (1) | TWI456567B (ja) |
WO (1) | WO2008021247A2 (ja) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020525853A (ja) * | 2017-07-03 | 2020-08-27 | ドルビー・インターナショナル・アーベー | 密集性の過渡事象の検出及び符号化の複雑さの低減 |
JP2021502597A (ja) * | 2017-11-10 | 2021-01-28 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 一時的ノイズシェーピング |
US10984809B2 (en) | 2013-07-22 | 2021-04-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Frequency-domain audio coding supporting transform length switching |
US11217261B2 (en) | 2017-11-10 | 2022-01-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoding and decoding audio signals |
US11315583B2 (en) | 2017-11-10 | 2022-04-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
US11315580B2 (en) | 2017-11-10 | 2022-04-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
US11380341B2 (en) | 2017-11-10 | 2022-07-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
US11462226B2 (en) | 2017-11-10 | 2022-10-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
US11545167B2 (en) | 2017-11-10 | 2023-01-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
US11562754B2 (en) | 2017-11-10 | 2023-01-24 | Fraunhofer-Gesellschaft Zur F Rderung Der Angewandten Forschung E.V. | Analysis/synthesis windowing function for modulated lapped transformation |
US12033646B2 (en) | 2017-11-10 | 2024-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8335684B2 (en) * | 2006-07-12 | 2012-12-18 | Broadcom Corporation | Interchangeable noise feedback coding and code excited linear prediction encoders |
ATE496365T1 (de) | 2006-08-15 | 2011-02-15 | Dolby Lab Licensing Corp | Arbiträre formung einer temporären rauschhüllkurve ohne nebeninformation |
AT504164B1 (de) * | 2006-09-15 | 2009-04-15 | Tech Universit T Graz | Vorrichtung zur gerauschunterdruckung bei einem audiosignal |
US8190440B2 (en) * | 2008-02-29 | 2012-05-29 | Broadcom Corporation | Sub-band codec with native voice activity detection |
JP4603062B2 (ja) * | 2008-06-26 | 2010-12-22 | 京セラ株式会社 | 信号変換器、無線信号送信システム及び無線信号受信システム |
FR2938688A1 (fr) * | 2008-11-18 | 2010-05-21 | France Telecom | Codage avec mise en forme du bruit dans un codeur hierarchique |
CN102667923B (zh) | 2009-10-20 | 2014-11-05 | 弗兰霍菲尔运输应用研究公司 | 音频编码器、音频解码器、用于将音频信息编码的方法、用于将音频信息解码的方法 |
CA2786944C (en) * | 2010-01-12 | 2016-03-15 | Fraunhofer Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding and audio information, method for decoding an audio information and computer program using a hash table describing both significant state values and interval boundaries |
EP2705516B1 (en) * | 2011-05-04 | 2016-07-06 | Nokia Technologies Oy | Encoding of stereophonic signals |
US8891775B2 (en) * | 2011-05-09 | 2014-11-18 | Dolby International Ab | Method and encoder for processing a digital stereo audio signal |
WO2013142650A1 (en) | 2012-03-23 | 2013-09-26 | Dolby International Ab | Enabling sampling rate diversity in a voice communication system |
WO2014161996A2 (en) * | 2013-04-05 | 2014-10-09 | Dolby International Ab | Audio processing system |
EP2887350B1 (en) * | 2013-12-19 | 2016-10-05 | Dolby Laboratories Licensing Corporation | Adaptive quantization noise filtering of decoded audio data |
EP4095854A1 (en) * | 2014-01-15 | 2022-11-30 | Samsung Electronics Co., Ltd. | Weight function determination device and method for quantizing linear prediction coding coefficient |
EP3105755B1 (en) | 2014-02-14 | 2017-07-26 | Telefonaktiebolaget LM Ericsson (publ) | Comfort noise generation |
US9576589B2 (en) * | 2015-02-06 | 2017-02-21 | Knuedge, Inc. | Harmonic feature processing for reducing noise |
US11295750B2 (en) * | 2018-09-27 | 2022-04-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for noise shaping using subspace projections for low-rate coding of speech and audio |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03201716A (ja) * | 1989-12-28 | 1991-09-03 | Sony Corp | ノイズシェーピング回路 |
JPH03201715A (ja) * | 1989-12-28 | 1991-09-03 | Sony Corp | ノイズシェーピング回路 |
US5487086A (en) * | 1991-09-13 | 1996-01-23 | Comsat Corporation | Transform vector quantization for adaptive predictive coding |
JP2001237708A (ja) * | 2000-02-24 | 2001-08-31 | Alpine Electronics Inc | データ処理方式 |
JP2002542648A (ja) * | 1999-04-12 | 2002-12-10 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | 合成フィルタ雑音伸長の補償を持つ知覚音声コーダの量子化 |
WO2005004113A1 (ja) * | 2003-06-30 | 2005-01-13 | Fujitsu Limited | オーディオ符号化装置 |
JP2005516442A (ja) * | 2002-01-25 | 2005-06-02 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | Pcm信号から量子化雑音を除去するための方法及びユニット |
JP2006047561A (ja) * | 2004-08-03 | 2006-02-16 | Matsushita Electric Ind Co Ltd | オーディオ信号符号化装置およびオーディオ信号復号化装置 |
WO2006107833A1 (en) * | 2005-04-01 | 2006-10-12 | Qualcomm Incorporated | Method and apparatus for vector quantizing of a spectral envelope representation |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5206884A (en) * | 1990-10-25 | 1993-04-27 | Comsat | Transform domain quantization technique for adaptive predictive coding |
US5623577A (en) * | 1993-07-16 | 1997-04-22 | Dolby Laboratories Licensing Corporation | Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions |
TW324762B (en) | 1996-07-15 | 1998-01-11 | Tokyo Electric Power Co | Manufacturing method for concrete sections |
CN1144179C (zh) * | 1997-07-11 | 2004-03-31 | 索尼株式会社 | 声音信号解码方法和装置、声音信号编码方法和装置 |
US6446037B1 (en) * | 1999-08-09 | 2002-09-03 | Dolby Laboratories Licensing Corporation | Scalable coding method for high quality audio |
US7171355B1 (en) * | 2000-10-25 | 2007-01-30 | Broadcom Corporation | Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals |
MXPA03009357A (es) | 2001-04-13 | 2004-02-18 | Dolby Lab Licensing Corp | Escalamiento en el tiempo y escalamiento en el tono de alta calidad de senales de audio. |
US7512535B2 (en) * | 2001-10-03 | 2009-03-31 | Broadcom Corporation | Adaptive postfiltering methods and systems for decoding speech |
US7483835B2 (en) | 2002-12-23 | 2009-01-27 | Arbitron, Inc. | AD detection using ID code and extracted signature |
US7318035B2 (en) * | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
ATE496365T1 (de) | 2006-08-15 | 2011-02-15 | Dolby Lab Licensing Corp | Arbiträre formung einer temporären rauschhüllkurve ohne nebeninformation |
TWM324762U (en) | 2007-05-11 | 2008-01-01 | Wan-Chen Jou | Externally connected type condensed water atomizer of air conditioner |
-
2007
- 2007-08-10 AT AT07836718T patent/ATE496365T1/de not_active IP Right Cessation
- 2007-08-10 EP EP07836718A patent/EP2054882B1/en active Active
- 2007-08-10 CN CN200780030179.3A patent/CN101501761B/zh active Active
- 2007-08-10 US US12/310,124 patent/US8706507B2/en active Active
- 2007-08-10 JP JP2009524635A patent/JP5096468B2/ja active Active
- 2007-08-10 DE DE602007012116T patent/DE602007012116D1/de active Active
- 2007-08-10 WO PCT/US2007/017811 patent/WO2008021247A2/en active Application Filing
- 2007-08-14 TW TW096129984A patent/TWI456567B/zh active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03201716A (ja) * | 1989-12-28 | 1991-09-03 | Sony Corp | ノイズシェーピング回路 |
JPH03201715A (ja) * | 1989-12-28 | 1991-09-03 | Sony Corp | ノイズシェーピング回路 |
US5487086A (en) * | 1991-09-13 | 1996-01-23 | Comsat Corporation | Transform vector quantization for adaptive predictive coding |
JP2002542648A (ja) * | 1999-04-12 | 2002-12-10 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | 合成フィルタ雑音伸長の補償を持つ知覚音声コーダの量子化 |
JP2001237708A (ja) * | 2000-02-24 | 2001-08-31 | Alpine Electronics Inc | データ処理方式 |
JP2005516442A (ja) * | 2002-01-25 | 2005-06-02 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | Pcm信号から量子化雑音を除去するための方法及びユニット |
WO2005004113A1 (ja) * | 2003-06-30 | 2005-01-13 | Fujitsu Limited | オーディオ符号化装置 |
JP2006047561A (ja) * | 2004-08-03 | 2006-02-16 | Matsushita Electric Ind Co Ltd | オーディオ信号符号化装置およびオーディオ信号復号化装置 |
WO2006107833A1 (en) * | 2005-04-01 | 2006-10-12 | Qualcomm Incorporated | Method and apparatus for vector quantizing of a spectral envelope representation |
JP2008535024A (ja) * | 2005-04-01 | 2008-08-28 | クゥアルコム・インコーポレイテッド | スペクトルエンベロープ表示のベクトル量子化方法及び装置 |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11862182B2 (en) | 2013-07-22 | 2024-01-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Frequency-domain audio coding supporting transform length switching |
US10984809B2 (en) | 2013-07-22 | 2021-04-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Frequency-domain audio coding supporting transform length switching |
JP2020525853A (ja) * | 2017-07-03 | 2020-08-27 | ドルビー・インターナショナル・アーベー | 密集性の過渡事象の検出及び符号化の複雑さの低減 |
JP7257975B2 (ja) | 2017-07-03 | 2023-04-14 | ドルビー・インターナショナル・アーベー | 密集性の過渡事象の検出及び符号化の複雑さの低減 |
US11380339B2 (en) | 2017-11-10 | 2022-07-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
JP6990306B2 (ja) | 2017-11-10 | 2022-01-12 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 一時的ノイズシェーピング |
US11315583B2 (en) | 2017-11-10 | 2022-04-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
US11315580B2 (en) | 2017-11-10 | 2022-04-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
US11217261B2 (en) | 2017-11-10 | 2022-01-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoding and decoding audio signals |
US11380341B2 (en) | 2017-11-10 | 2022-07-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
US11386909B2 (en) | 2017-11-10 | 2022-07-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
US11462226B2 (en) | 2017-11-10 | 2022-10-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
US11545167B2 (en) | 2017-11-10 | 2023-01-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
US11562754B2 (en) | 2017-11-10 | 2023-01-24 | Fraunhofer-Gesellschaft Zur F Rderung Der Angewandten Forschung E.V. | Analysis/synthesis windowing function for modulated lapped transformation |
US11127408B2 (en) | 2017-11-10 | 2021-09-21 | Fraunhofer—Gesellschaft zur F rderung der angewandten Forschung e.V. | Temporal noise shaping |
JP2021502597A (ja) * | 2017-11-10 | 2021-01-28 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 一時的ノイズシェーピング |
US12033646B2 (en) | 2017-11-10 | 2024-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
Also Published As
Publication number | Publication date |
---|---|
JP5096468B2 (ja) | 2012-12-12 |
EP2054882A2 (en) | 2009-05-06 |
WO2008021247A9 (en) | 2008-07-10 |
US8706507B2 (en) | 2014-04-22 |
US20100094637A1 (en) | 2010-04-15 |
WO2008021247A3 (en) | 2008-04-17 |
WO2008021247A2 (en) | 2008-02-21 |
TW200818123A (en) | 2008-04-16 |
TWI456567B (zh) | 2014-10-11 |
DE602007012116D1 (de) | 2011-03-03 |
CN101501761A (zh) | 2009-08-05 |
ATE496365T1 (de) | 2011-02-15 |
EP2054882B1 (en) | 2011-01-19 |
CN101501761B (zh) | 2012-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5096468B2 (ja) | サイド情報なしの時間的ノイズエンベロープの自由な整形 | |
CN109509478B (zh) | 音频处理装置 | |
RU2608878C1 (ru) | Регулировка уровня во временной области для декодирования или кодирования аудиосигналов | |
JP6735053B2 (ja) | マルチチャネル符号化におけるステレオ充填装置及び方法 | |
US7761290B2 (en) | Flexible frequency and time partitioning in perceptual transform coding of audio | |
JP6173288B2 (ja) | マルチモードオーディオコーデックおよびそれに適応されるcelp符号化 | |
KR101278805B1 (ko) | 엔트로피 코딩 방법 및 엔트로피 디코딩 방법 | |
KR100991450B1 (ko) | 스펙트럼 홀 충전을 사용하는 오디오 코딩 시스템 | |
CA2286068C (en) | Method for coding an audio signal | |
JP4673882B2 (ja) | 推定値を決定するための方法および装置 | |
US9230551B2 (en) | Audio encoder or decoder apparatus | |
US20100250260A1 (en) | Encoder | |
JP2008026372A (ja) | 符号化データの符号化則変換方法および装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111004 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20111025 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20111221 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120104 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20120112 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120203 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120417 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120810 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20120821 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120918 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120920 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5096468 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150928 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |