JP2007526691A - 信号解析及び合成のための適応型混合変換 - Google Patents

信号解析及び合成のための適応型混合変換 Download PDF

Info

Publication number
JP2007526691A
JP2007526691A JP2006554100A JP2006554100A JP2007526691A JP 2007526691 A JP2007526691 A JP 2007526691A JP 2006554100 A JP2006554100 A JP 2006554100A JP 2006554100 A JP2006554100 A JP 2006554100A JP 2007526691 A JP2007526691 A JP 2007526691A
Authority
JP
Japan
Prior art keywords
transform
signal
coefficients
spectral
segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006554100A
Other languages
English (en)
Other versions
JP4689625B2 (ja
Inventor
ヴィントン、マーク・スチュアート
デービッドソン、グラント・アレン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of JP2007526691A publication Critical patent/JP2007526691A/ja
Application granted granted Critical
Publication of JP4689625B2 publication Critical patent/JP4689625B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/147Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Discrete Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measurement Of Resistance Or Impedance (AREA)
  • Investigating, Analyzing Materials By Fluorescence Or Luminescence (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Stereophonic System (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Control Of Eletrric Generators (AREA)
  • Control Of Motors That Do Not Use Commutators (AREA)

Abstract

オーディオ及びビデオコーディングシステム等に用いられる各解析及び合成フィルタバンクは、一次変換とそれにカスケードする1つ以上の二次変換を含むハブリッド変換により実行される。フィルタバンクの一次変換は時間領域エイリアシングアーチファクトをキャンセルする解析/合成システムを実行する。一次変換にカスケードする二次変換は変換係数のブロックに適用される。ブロック長は、析及び合成フィルタバンクの時間分解能を適合させるように変換される。

Description

発明の詳細な説明
技術分野
本発明は、一般に、オーディオ及びビデオコーディングシステムに使用できる信号解析及び合成フィルタバンクに関する。本発明は、特に、フィルタバンクの時間及び周波数分解を適用することができる連続したブロック変換によって実行される解析及び合成フィルタバンクに関する。
背景技術
コーディングシステムは、適切にソース信号を表すのに必要である情報量を減少させるのにしばしば使用される。情報必要量を減少させることにより、より小さなバンド幅を持つチャンネルによって信号表現を伝えることができ、あるいは、より少ない空間を使用するメディアに信号表現を記録できる。コード化は、信号中の冗長成分か無関係成分のどちらかを取り除くことによって、ソース信号の情報必要量を減らすことができる。いわゆる知覚コード化方法とシステムはしばしばフィルタバンクを使用し、スペクトル成分の基礎セットを用いてソース信号を非相関化することで冗長性を減少させ、かつ、心理知覚基準に従うスペクトル成分の適応量子化により無関係性を減少させる。
多くの知覚コード化システムはブロック変換によりフィルタバンクを実行する。オーディオコーディングシステムでは、例えば、ソースオーディオ信号(時間セグメントか時間領域のサンプルのブロックによって表される)はソース信号のスペクトルコンテントを表す周波数領域係数のセットに変換される。セグメントの長さはフィルタバンクの時間分解能と周波数分解能の両方を確立する。時間分解能は、セグメント長が減少するのに従い増加する。周波数分解能は、セグメント長が大きくなるにつれ増加する。この関係のために、セグメント長の選択はブロック変換フィルタバンクの時間と周波数分解能のトレードオフを課す。
セグメント長のいかなる選択も典型的なコーディングシステムで遭遇するソース信号条件のすべてに関する分解能の最適トレードオフを提供できない。フィルタバンクが高周波化分解能を有するならば(これは、より長いセグメント長を使用することで得られる)、ゆっくり変化する又は定常のソース信号を、一般に、より効率的にコード化できる。フィルタバンクが高時間分解能を有するならば(これは、より短いセグメント長を使用することとで得られる)、急速に変化する又は高度に非定常のソース信号を、一般に、より効率的にコード化できる。変化するソース信号条件に応答してセグメント長を適合させることによって、ブロック変換フィルタバンクはその時間と周波数分解能のトレードオフを最適化できる。
オーディオコーディングシステムにおけるフィルタバンクを実行するのにさまざまな変換を使用することができる。しかし、例えば、特定の修正離散コサイン変換(MDCT)が広く使用されている。なぜならば、それは、重要なサンプリングを提供すると共に隣接するソース信号セグメントを互いにオーバラップさせる能力を含みオーディオコード化のためのいくつかの非常に魅力的な性質を持つからである。MDCTはまた、セグメント中の実質的に定常のソース信号内の冗長成分を実質的にすべて取り除くことができるので魅力的である。MDCTフィルタバンクを適切に操作するために、オーバラップしたソース信号セグメントを使用することと、プリンセン(Princen)他による「時間領域エイリアシング消去に基づくフィルタバンク設計を使用するサブバンド/変換コード化」(1987年の音響、スピーチ、および信号処理に関する国際会議(ICASSP)議事録、1987年5月、第2161乃至2164ページ)で説明されるある種の基準を満たすウィンドウ関数を使用することを必要とする。残念ながら、オーバラッピングソース信号セグメントに適用されなければならないウィンドウ関数に課される要件により、信号条件に応答してMDCTフィルタバンクの時間と周波数分解能を適合させるのは難しい。
しばしば「ウィンドウスイッチング」と呼ばれる技術は、急激な信号変化又は振幅過渡などのある種の信号条件の検出に応答して2つの異なるウィンドウ関数を切り換えることによって、MDCTフィルタバンクの時間分解能を適合させることができる。この技術(1993年5月25日に発行されエドラー(Edler)に付与された米国特許5,214,742に説明されている)によると、セグメント長は変えられないが、異なるウィンドウ関数形を切り換えることによって時間分解能を適合させて、フィルタバンクによって変換される各セグメント中のノンゼロのサンプルの数を減少させている。残念ながら、この技術はフィルタバンクの周波数分解能を適合させず、そして、ウィンドウの切換に必要なウィンドウ関数の形がMDCTの適切な操作のための要件を満たすように準最適でなければならないという理由により、時間分解能が下がるときはいつも、フィルタバンクの周波数選択性が極めて低下する。
しばしば「ブロックスイッチング」と呼ばれる別の公知の技術は、異なるウィンドウ関数形を切り換えるという点で前記のウィンドウスイッチング技術と同様であるが、ブロックスイッチング技術は、急激な信号変化又は振幅過渡などのある種の信号条件の検出に応答して2つの異なるセグメント長をまた適応して切り換えることにより、MDCTフィルタバンクの時間と周波数分解能の両方を適合させることができる。この技術は、J.オーディオエンジニアリング学会(J. Audio Eng. Soc.)、vol.45、No.10、1997年10月、第789乃至814ページにおいてBosi他による「ISO/IEC MPEG−2アドバンスト・オーディオ・コーディングで説明される「高度な音声コーダ(the Advanced Audio Coder: AAC)で使用される。
AACでは、MDCTフィルタバンクは2048個のサンプルに等しい長さを持つ定常信号セグメントに適用され、かつ、256個のサンプルに等しい長さを持つ非定常ソース信号セグメントに適用される。ブロックスイッチングは、AACでは、より長いセグメントに適する「長ウィンドウ関数」、より短いセグメントに適する「短ウィンドウ関数」、より長いセグメント長からより短いセグメント長への切替を可能にする「長−短ブリッジウィンドウ関数」、および、より短いセグメント長からより長いセグメント長への切替を可能にする「短−長ブリッジウィンドウ関数」を使用することによって、達成される。2つのブリッジウィンドウ関数はMDCTの適切な操作に必要な基準を満たしながら、異なるセグメント長を切り換える。より長いセグメント長からより短いセグメント長に切り換え、さらに該より短いセグメント長からより長いセグメント長に戻ることは、長−短ブリッジウィンドウ関数を使用してMDCTを長いセグメントに適用し、短ウィンドウ関数を使用してMDCTを8の整数倍の数の短いセグメントに適用し、かつ、短−長ブリッジウィンドウ関数を使用して長いセグメントにMDCTを適用することで達成される。その後すぐにMDCTが長いセグメントに適用されなければならないが、別のブロックスイッチが望まれるならば、長ウィンドウ関数が使用され、または、長−短ブリッジウィンドウ関数は使用されるだろう。
ブロックスイッチングはMDCTフィルタバンクの時間と周波数分解能を適合させる方法を提供するが、それはいくつかの理由から理想的な解決でない。1つの理由は変換の周波数選択性がブロック長のスイッチの間に下がることであり、これは、セグメント長スイッチングを可能にしかつMDCTの適切な操作のための要件を満たすためにブリッジウィンドウ関数の形が準最適でなければならないことによるものである。別の理由はスイッチが任意の時間にいつでも起こることができないことである。上で説明されるように、MDCTは、より長いセグメント長に切り替わった直後に別の長いセグメントに適用されなければならない。より短い長さへ即座にスイッチすることは可能でない。ブロックスイッチング技術も理想的な解決でない。なぜならば、スイッチング機構がただ2つのセグメント長を提供するが、これらのセグメント長はすべての信号条件には最適でないからである。例えば、AACにおけるその2つのセグメント長は最適でない。なぜならば、AACにおけるより長い又はより短いセグメント長のいずれもほとんどの音声信号セグメントには最適でないからである。2048サンプルのセグメントはスピーチの非定常性質に対して通常長過ぎ、256サンプルのセグメントは通常短すぎて冗長成分を有効に取り除くことができない。その上、2048サンプルより長いセグメント長がより最適である多くの定常信号がある。その結果、MDCTフィルタバンクの時間と周波数分解能を適合させるためのブロックスイッチングの限られた能力によってAACの性能は損なわれる。
ブロックスイッチングの別の形態はドルビーデジタルコード化ビットストリーム規格に一致するコーディングシステムで使用される。このコード化規格はしばしばAC−3と呼ばれ、2001年8月20日に発行され「ディジタルオーディオ圧縮リビジョンA(AC−3)規格」と題した高品位テレビシステム委員会(ATSC)A/52Aドキュメントで説明されている。AC−3コーディングシステムで使用されるブロックスイッチングの形態は、定常信号の場合は512サンプル、非定常信号の場合は256サンプルのソース信号セグメントにMDCTを適用する。AC−3コーディングシステムで使用されるブロックスイッチング技術は、長さスイッチィングが行われるときの選択においてより多くの柔軟性を提供する。その上、スピーチのような非定常ソース信号に対してコード化性能はかなり良い。しかしながら、より定常の信号に対するコード化性能は、より長いセグメントによって提供される比較的低い周波数分解能によって制限される。
MDCTフィルタバンクの時間及び周波数分解能の適応制御のための他の技術は、1995年2月28日にディヴィッドソンに付与された米国特許5,394,473で説明されている。これらの技術のいくつかは、他の公知技術が可能とするよりもより良い周波数応答をより多く供給するウィンドウ関数を使用してMDCTフィルタバンクを本質的にいかなる長さのセグメントに適用することを可能にしている。残念ながら、これらの技術は、MDCTのカーネル機能又は基礎機能を適合させなければならず、したがって、上記AC−3規格のような既存のビットストリーム規格と両立しない。これらの技術はまた演算負荷が大きい。
MDCTのような変換で実行されるフィルタバンクの周波数分解能を適合させるような、より効率的かつ効果的な解決法が必要とされている。望ましくは、その解決法は、既存のビットストリーム規格と互換性があるシステムへの組み込みを簡素化する実行を提供すべきである。これは、ブロック変換のカスケードによって実行される混合変換(ハイブリッド変換)フィルタバンクを使用することによって達成される。
本発明によれば、解析及び合成フィルタバンクは一次変換と、それにカスケードする1つ以上の二次変換とを含む混合変換によって実行される。1実施の形態では、一次変換は、互いに半セグメント長オーバラップするソース信号セグメントに適用されるMDCTであり、二次変換は、特定の周波数時間幅に関してMDCT係数の非オーバラッピングブロックに適用されるDCTである。フィルタバンクの周波数分解能は、1つ以上の二次変換で変換されるブロック内の係数の数を増すことによって大きくされる。係数周波数に従って変化する多数の係数を持つMDCT係数のブロックに1つ以上の二次変換を適用することができ、それにより、フィルタバンクの周波数分解能を多種多様な方法に適合させることができる。
以下の説明と添付図面を参照することにより本発明の様々な特徴とその好ましい実施の態様をより良く理解できるであろう。図において、同様な要素には同様な参照番号を付している。以下の説明及び図面の内容は単に例示的なものであり、本発明の範囲をそういったものに制限するものと理解するべきでない。
発明を実施するための態様
A.序論
本発明は容易に周波数分解能を適合させることができる混合変換によって実行されるフィルタバンクを提供する。図1と2は本発明の種々の実施の形態を取り入れるオーディオコーディングシステムにおける送信機と受信機の略ブロック図をそれぞれ示す。以下のセクションで図示の送信機と受信機の特徴を簡潔に説明する。この説明に続いて、解析及び合成フィルタバンクの適切な特徴について説明する。
1.送信機
図1に示す送信機は、解析フィルタバンク3を通信路1から受けたソース信号に適用してソース信号のスペクトルコンテントを表すスペクトル係数を作り出し、該スペクトル係数にエンコーダ5を適用してコード化された情報を作り出し、該コード化された情報にフォーマッタ8を適用して信号路9での伝送に適した出力信号を作り出す。出力信号は直ちに受信機に送信され、またはその後の送信のために記録される。解析フィルタバンク3は以下で説明されるように多様な方法で実行されるであろう。
この開示では、「エンコーダ」と「コード化」のような用語はいかなる特定の種類の情報処理を含意することを意図しない。例えば、コード化は情報容量を減らすのにしばしば使用されるが、この開示においてこれらの用語は必ずしもこのタイプの処理に言及するというわけではない。エンコーダ5は望まれるいかなるタイプの処理も本質的に実行する。1つの実施の形態では、コード化された情報は、2001年6月12日にディヴィッドソン他に付与された米国特許6,246,345で説明されているベクトル量子化及び利得適応型量子化を含むさまざまな量子化技術を使用して知覚モデルに従ってスペクトル係数を量子化することによって作り出される。特定のタイプのコード化は本発明では重要でない。
2.受信機
図2に示す受信機は、信号路21から受けた入力信号にディフォマッタ23を適用してコード化された情報を得、該コード化された情報にデコーダ25を適用してソース信号のスペクトルコンテントを表すスペクトル係数を得、該スペクトル係数に合成フィルタバンク27を適用してソース信号のレプリカではあるが正確なレプリカではない出力信号を生成して信号路29に送出する。解析フィルタバンク3の実施を補足するさまざまな態様で合成フィルタバンク27を実施できる。
この開示では、「デコーダ」と「復号化」のような用語はいかなる特定種類の情報処理を含意することを意図しない。デコーダ25は必要あるいは所望のいかなるタイプの処理も本質的に実行することができるであろう。上で説明したコード化プロセスの逆である1実施の形態では、量子化されたスペクトル成分は逆量子化スペクトル係数に復号化される。いかなる特定のタイプの復号化あっても、それは本発明にとって重要ではない。
B.適応型混合変換
解析フィルタバンク3と合成フィルタバンク27は混合変換を含む。それらの混合変換は図4と5にそれぞれ示すように実行される。
図4に示す解析フィルタバンク3は一次変換43と、該一次変換に続いてカスケードして行われる1つ以上の二次変換45を含む。一次変換がソース信号セグメントに適用されてソース信号セグメントのスペクトルコンテントを表すスペクトル係数のセットを作り出す。1つ以上の二次変換がそれぞれ特定の時間幅周波数のスペクトル係数のブロックに適用される。各ブロックの係数の数は制御信号に応答して適合される。
図5に示す合成フィルタバンク27は1つ以上の逆二次変換52と、該逆二次変換に関連してカスケードして行われる逆一次変換54を含む。それぞれの1つ以上の逆二次変換は特定の時間幅周波数のスペクトル係数のブロックを作り出す。各ブロックの係数の数は制御信号に応答して適合される。スペクトル係数のブロックは特定の時間幅周波数に関するスペクトル係数のセットとして組み立てられ、該スペクトル係数のセットに一次変換が適用されてオリジナルソース信号のレプリカを提供するために結合される信号のセグメントを作り出す。
解析フィルタバンクと合成フィルタバンクの一次変換は解析/合成システムを実行し、このシステムで逆一次変換が先の一次変換で作り出された時間領域エイリアシングアーチファクトをキャンセル(消去)する。例えば、修正離散コサイン変換(MDCT)と、前記プリンセン論文で説明される逆MDCT(IMDCT)は、奇数重ね重要サンプル単側波帯解析/合成系の時間領域等価を実行する。これらの変換は、本願において奇数重ね時間領域エイリアシング消去(O−TDAC:
Oddly-Stacked Time-Domain Aliasing Cancellation)変換と呼ばれる。もう1つの別のTDACの実施形態が「IEEE、音響、音声、信号処理に関する変換」、vol.ASSP−34、1986、第1153乃至1161ページのプリンセン他による「時間領域エイリアシング消去に基づく解析/合成フィルタバンク設計」で説明されている。この実施における解析フィルタバンクは、交替信号セグメントにMDCTと修正離散型サイン変換(MDST)を適用することを含む。合成フィルタバンクはIMDCTと逆MDST(IMDST)を適用することを含む。これらの変換は、偶数重ね単側波帯解析/合成系の時間領域等価を実行し、偶数重ね時間領域エイリアシング消去変換(Evenly-Stacked Time-Domain Aliasing Cancellation Transform)と呼ばれる。
二次変換は離散コサイン変換(DCT)、離散サイン変換(DST)、および離散フーリエ変換(DFT)を含む多くの変換のいずれでも実行される。解析フィルタバンク3の好ましい実施の形態では、タイプIIのDCTが前記O−TDAC IMDCTにカスケードして使用される。合成フィルタバンク27の対応実施形態において、O−TDACIMDCTはタイプIIの逆DCT(IDCT)にカスケードして使用される。さらに詳細に以下でこれらの実施について説明する。
1.解析フィルタバンク
図4に言及し、一連のソース信号サンプルが通信路1から受け取られバッファ41に記憶される。アナライザ(解析器)47は、各セグメントにおけるソース信号サンプルの数、またはセグメント長を決定して、何らかの解析プロセスを前記記憶されたサンプルに適用することによりその後の処理に使用するオプションの構成要素である。本質的には望まれるいかなる解析プロセスも使用される。例えば、振幅過渡は上で引用したATSC A/52Aドキュメントで説明されるように検出される。選ばれたセグメント長を表す情報は出力信号に含まれて通信路2、さらにフォーマッタ7に渡される。固定長セグメントはアナライザ47と通信路2を省略する代替の実施の形態において使用される。
a)解析ウィンドウ関数
ウィンドウ42は、各セグメント内のソース信号サンプルを解析ウィンドウ関数で重み付けすることによって一連のオーバラッピングセグメントを形成する。各セグメントのための解析ウィンドウ関数の長さと形は通信路2から受け取ったセグメント長情報に応答して適合される。さまざまなウィンドウ関数を使用することができるが、一般に、カイザー−ベッセル誘導(KBD)ウィンドウ関数は優れた周波数選択特性を有するので、それが好まれる。このウィンドウ関数は以下に示すカイザー−ベッセル関数から導かれる。
式1
Figure 2007526691
典型的なオーディオコード化応用に対して4〜7の範囲のアルファ値がうまく作用する。
誘導は、カイザー−ベッセル関数W(n)を必要なウィンドウ関数長Nからオーバラップインタバルνを引いたものに等しい長さを有するレクタングラウィンドウ関数で畳み込む。第2式を参照。この畳込みは第3式で示すように簡素化できる。
式2
Figure 2007526691
誘導された生成ウィンドウWP(n)の平方根を取ることによって、KBD解析ウィンドウ関数を得ることができる。この解析ウィンドウ関数を以下に第4式で示す。
式3
Figure 2007526691
b)一次変換
一次変換43はウィンドウ化ソース信号サンプルの各セグメントを1セットのスペクトル係数に変換する。1セットの係数の各係数は特定の周波数に関するウィンドウ化セグメントのスペクトルコンテントを表す。O−TDAC MDCTが好ましい実施の形態に使用される。この変換は以下のように表される。
式4
Figure 2007526691
一次変換43は第5式に従い直接実行されるか、あるいは、米国特許5,394,473で説明されている高速フーリエ変換(FFT)を使用する方法のように、より効率的な演算プロセスによって実行される。解析ウィンドウ関数と一次変換は、望まれる本質的ないかなるプロセスを使用することでセグメント長に応答して適合させる。いくつかの技術が米国特許No. 5,214,742、米国特許No. 5,394,473、ATSC A/52Aドキュメント、および上で引用したISO/MPEG AACドキュメントで開示されている。
1つ以上のそれぞれの周波数に関するにウィンドウ化ソース信号セグメントのスペクトルコンテントを表すスペクトル係数がそれぞれの信号経路に渡されてバッファに記憶される。例えば、図4に示す送信機はそれぞれの2つの周波数の各周波数に関するスペクトル係数を2つの信号経路の1つに渡してバッファの44a,44bに記憶させる。図示を容易にするために、図4にただ2つの信号処理通信路を示す。典型的なシステムに使用する解析フィルタバンク3の実施においては、何百もの通信路があるかもしれない。
c)スペクトル成分解析
図4に示す上側信号経路に言及し、一連のセグメントにおける特定の周波数に関するスペクトル係数は、バッファ44aに保存されてブロックに組み立てられる。アナライザ48aはブロック長である各ブロックの係数の数を決定して、この長さを通信路49aに渡す。この長さはバッファ44aに保存された係数を解析することによって決定される。解析のいかなる特定の方法も原則として本発明には重要でない。いくつかの解析手法がここで説明される。
1つの基本的方法は可能な限り長いスペクトル係数のブロックを形成するが、そこでは、それぞれのブロック内での係数が強度に関して十分同様であるようにブロック形成がなされる。1つの方法は隣接するスペクトル係数の強度差を計算し、平均差がある敷居値以下である隣接する係数の最も長いブロックを特定する。別の方法は、複数の信号経路のバッファに保存されるスペクトル係数を使用する。この手法は、スペクトル係数の1つのバンドに関する強度差をまとめ、該バンド幅での平均差がある敷居値以下である最も長いブロックを特定する。バンド幅は人間の聴覚器のいわゆる重要なバンド幅に等しくすることができる。
別の基本的方法は、送信機のほかの場所で実行される信号コード化プロセスによって実行される信号解析に依存する。上で引用したA/52Aドキュメントで説明されるビットストリーム規格と互換性がある送信機は、例えば、スケールファクタと関連するスケール値として表されるスペクトル係数を備えるコード化された信号を作り出す。これらのスケールファクタは、共通セットのスケールファクタを共有できるMDCT係数セットの順序を特定するために解析される。アナライザ48aは、それぞれの信号経路に関するブロック長がべき指数を共有する係数セットの数と等しいように適合させる。
d)二次変換
二次変換45aはそれぞれのブロックのスペクトル係数を1セットの混合変換係数に変換する。変換の長さは通信路49aから受け取ったブロック長情報に応答して適合される。好ましい実施の形態では、タイプIIのDCTが互いオーバラップしないスペクトル係数のブロックに適用される。この変換は以下のように表される。
式5
Figure 2007526691
二次変換は第7式に従い直接実行されか、あるいは、ラオ(Rao)他による「離散コサイン変換」(アカデミックプレス社、1990年)の第4章で説明される方法のような、より効率的な演算プロセスによって実行される。
e)フォーマッタと他の信号経路
フォーマッタ46aは、混合変換係数とブロック長情報を組み立ててエンコーダ5とフォーマッタ7が処理できるデータにすることに使用されるオプションの構成要素である。これは、図1に示す送信機の解析フィルタバンク3が送信機の残りの構成要素をほとんど変更することなく、混合変換によって実行されることを可能にする。
バッファ44b、アナライザ48b、二次変換45b、およびフォーマッタ46bは、上側信号経路のそれぞれの構成要素に関して上で説明したプロセスに類似する下側信号経路でのプロセスを実行する。
f)コード化
典型的なシステムでは、エンコーダ5は、あるコード化形態での混合変換係数を表すコード化された情報を生成する。知覚コード化プロセスが使用されるならば、混合変換係数は知覚的非関連性を減少させる形式にコード化される。知覚コード化プロセスは、通常、スペクトル情報を失わせ、この失われた情報を回復することができず又は受信機で再生できない。この失われる可能性は、混合変換によって作り出される混合変換係数に対する可能な変更を表す次のシンボル
式6
Figure 2007526691
によって以下に表される。そのようなコード化プロセスの使用は本発明に重要でない。
2.合成フィルタバンク
図5に言及し、ディフォマッタの5la、51bは通信路26a,26bからそれぞれ受け取ったデータから混合変換係数及びブロック長情報を得る。ブロック長情報は通信路59a,59bに渡され、混合変換係数は逆二次変換52a,52bに渡される。図示を容易にするために、図5に単に2つの信号処理路を示す。典型的なシステムに使用する合成フィルタバンク27の実施では何百もの通信路があるかもしれない。
ディフォマッタ51b、逆二次変換52b、およびバッファ53bは、上側信号経路における各構成要素に関して以下で説明するプロセスに類似する下側信号経路でのプロセスを実行する。
a)ディフォマッタ
図5の上側信号経路に言及し、ディフォマッタ5laは、ディフォマッタ23とデコーダ25から受け取ったデータから混合変換係数とブロック長情報のセットを分解するのに使用されるオプションの構成要素である。これは、合成フィルタバンク27の混合変換の実行を受信機の残りの構成をほとんど変更することなく図2に示す既存の受信機に組み込むことを可能にする。
b)逆二次変換
逆二次変換52aは1セットの混合変換係数を一連のソース信号セグメントの特定の周波数に関するスペクトルコンテントを表す1ブロックのスペクトル係数に変換する。スペクトル係数のブロックはバッファ53aに保存される。変換の長さは、通信路59aから受け取ったブロック長情報に応答して適合される。好ましい実施の形態では、タイプIIのIDCTは互いにオーバラップしないスペクトル係数のブロックに適用される。この変換は以下のように表される。
式7
Figure 2007526691
逆二次変換は第8式に従って直接実行することができ、または、公知のより効率的な演算プロセスによって実行することができる。
c)逆一次変換
バッファ53a,53bはスペクトル係数を保存し、それらのスペクトル係数を逆一次変換がそれぞれのソース信号セグメントのスペクトルコンテントを表すスペクトル係数のセットを受けるように逆一次変換54に渡す。信号サンプルのセグメントは、スペクトル係数のセットに逆変換を適用することによって作り出されてバッファ55に保存される。逆一次変換の長さは通信路22から受け取られたセグメント長情報に応答して適合される。O−TDAC IMDCTは好ましい実施の形態に使用される。
典型的な応用では、MDCT係数の半分は送信機で破棄される。破棄された係数は以下の式を使用することで受信機によって回復される。
式8
Figure 2007526691
逆一次変換は第10式から直接的に実行され、または、米国特許5,394,473で説明されたFFTを使用するような公知のより効率的な演算プロセスによって実行される。
d)合成ウィンドウ関数
ウィンドウ56は、バッファ55内に保存されている信号サンプルのセグメントを合成ウィンドウ関数で重み付けし、かつ、オーバラッピングセグメント中の重み付けされたサンプルをオーバラッピング部分において互いに加えることにより出力信号を作り出して通信路29に渡す。逆一次変換と、合成ウィンドウ関数と、このoverlap-add(オーバラップ・アッド)プロセスは先の変換で作り出された時間領域エイリアシングアーチファクトの少なくともかなりの部分をキャンセルする。コード化プロセスかつ一次及び二次変換の計算における有限演算精度により引き起こされた変換係数に対する変更のために、キャンセルは正確でないかもしれない。各セグメントの合成ウィンドウ関数の長さと形は通信路22から受け取られたセグメント長情報に応答して適合される。上記第4式に示す解析ウィンドウ関数WAに等しいKBDウィンドウ関数は好ましい実施の形態において使用される。
合成ウィンドウ関数と逆一次変換は、上で言及したプロセスなどのプロセスを使用してセグメント長情報に応答して適合される。
C.実施
これまで説明した開示はほんのいくつかの実施の形態を説明するものである。さまざまな変換と変換タイプが使用されるだろう。本発明の原理は多種多様な方法で適用され実行される。
本発明の種々の実施の形態を取り入れたデバイスは、コンピュータ、又は、汎用コンピュータに見られる構成要素と同様の構成要素に繋がれたデジタルシグナルプロセッサ(DSP)サーキットリーなどのより専門化した構成要素を含むその他の装置によって実行されるソフトウェアを含みさまざまな方法で実行される。図3は、本発明の実施の態様を実行するのに使用できるデバイス70の略ブロック図である。DSP72は演算リソースを提供する。RAM73は信号処理のためにDSP72で使用されるシステムランダム・アクセス・メモリ(RAM)である。ROM74は、デバイス70を操作して本発明の種々の形態の実施に必要なプログラムを保存する読み出し専用メモリ(ROM)などの永続的ストレージの何らかの形態である。入出力制御75は、通信チャネル76、77を介して信号を送受するインタフェース回路である。アナログ信号の送受に必要なアナログディジタル変換器とディジタルアナログ変換器を入出力制御75に含むこととしてもよい。図示の実施の形態では、すべての主要な構成要素がバス71(これは1つ以上の物理的なバスを示す)に接続されている。しかしながら、本発明を実行するためにバスアーキテクチュアは必要とされない。
汎用コンピュータシステムで実行する実施の形態では、キーボード又はマウス及びディスプレイ等のデバイスに接続し、かつ、磁気テープ若しくは磁気ディスクまたは光学メディアなどの記憶メディアを持つストレージデバイスを制御する追加の構成要素を含むこととしてもよい。記憶メディアは、オペレーティングシステム、ユーティリティ、および応用ソフトウェアの指示プログラムを記録するのに使用され、本発明の種々の態様を実行するプログラムの実施の態様を含むことができる。本発明の種々の態様を実施するのに必要機能は、離散的論理要素、集積回路、1つ以上のASIC、及び/又は、プログラム被制御プロセッサを含む多種多様な方法で実行される。これらの要素が実行される方法は本発明では重要でない。
本発明を実施するソフトウェアは、ベースバンド、若しくは、超音波乃至紫外線領域周波数のスペクトルに渡る変調された通信経路などのマシンでの読み込みが可能な多様なメディア、または、磁気テープ、磁気カード若しくは磁気ディスクあるいは光学カード若しくは光学ディスク、あるいは紙のようなメディアに設けた検出可能なマークを含むいかなる記録技術を本質的に使用することで情報を伝達する記憶メディアによって伝えられる。
コーディングシステムで使用する送信機の略ブロック図である。 コーディングシステムで使用する受信機の略ブロック図である。 本発明の種々の実施の形態に使用される装置の略ブロック図である。 本発明の種々の実施の形態を取り入れた解析フィルタバンクの略ブロック図である。 本発明の種々の実施の形態を取り入れた解析フィルタバンクの略ブロック図である。

Claims (24)

  1. スペクトルコンテントを有するソース信号のサンプルを受け取り;
    前記サンプルのオーバラッピングセグメントに一次変換を適用して複数のセットのスペクトル係数を発生させ、ただし、前記各セットのスペクトル係数は時間領域エイリアシングアーチファクトを持ちかつ1セットの周波数に関する各ソース信号セグメントの前記スペクトルコンテントを表し;
    前記複数のセットのスペクトル係数から前記1セットの周波数のうちの1つの同一周波数を表す複数のスペクトル係数を得、かつ、該複数のスペクトル係数を1つ以上のブロックのスペクトル係数に組み立て、ただし、前記1つ以上のブロックの各ブロックに組み立てられたスペクトル係数の数がブロック長制御信号に応答して適合され;
    前記1つ以上のブロックのスペクトル係数に二次変換を適用して1つ以上のセットの混合変換係数を生成し、ただし、前記1つ以上のブロックのスペクトル係数の各ブロックに適用される二次変換の長さが前記ブロック長制御信号に応答して適合され;
    前記1つ以上のセットの混合変換係数を表す情報と、前記ブロック長制御信号を出力信号として組み立てる;
    ことを含んでなる出力信号を生成する方法。
  2. 請求項1の方法であって、前記一次変換は修正離散コサイン変換であり、前記二次変換は、互いにオーバラップしないブロックのスペクトル係数に適用される離散コサイン変換である方法。
  3. 請求項1の方法であって、
    前記複数のセットのスペクトル成分内のスペクトル成分強度に関する類似性の測度を生成し;
    前記類似性の測度に応答して前記ブロック長制御信号を生成する;
    ことを含んでなる方法。
  4. 請求項1,2,又は3の方法であって、
    前記ソース信号のサンプルを解析してセグメント長制御信号を発生させ;
    形状又は長さが前記セグメント長制御信号に応答して適合される解析ウィンドウ関数を前記ソース信号のサンプルのセグメントに適用する;
    ことを含んでなる方法。
  5. 請求項4の方法であって、 前記一次変換は1セットの基礎関数を有し、方法は、前記セグメント長制御信号に応答して前記1セットの基礎関数を適合させる方法。
  6. ソース信号のスペクトルコンテントを表す入力信号を受け取り;
    前記入力信号から1つ以上のセットのハイブリッド変換係数と、1つのブロック長制御信号を得;
    前記1つ以上のセットのハイブリッド変換係数に逆二次変換を適用して1セットの周波数のうちの1つの同じ周波数に関する前記ソース信号のスペクトルコンテントを表す1つ以上のブロックのスペクトル係数を生成し、ただし、前記1つ以上のセットのハイブリッド変換係数に適用される前記逆二次変換の長さは前記ブロック長制御信号に応答して適合され;
    前記スペクトル係数をスペクトル係数のセットに組み立て、ただし、前記スペクトル係数の各セットが時間領域エイリアシングアーチファクトを持ちかつ前記1セットの周波数のすべての周波数に関して前記ソース信号のセグメントの前記スペクトルコンテントを表し;
    時間領域エイリアシングアーチファクトを実質的にキャンセルする逆一次変換を前記スペクトル係数のセットに適用して前記ソース信号のセグメントに相当する出力信号セグメントを生成する;
    ことを含んでなる出力信号を生成する方法。
  7. 請求項6の方法であって、前記逆一次変換は逆修正離散コサイン変換であり、前記逆二次変換は、互いにオーバラップしないスペクトルブロックの係数を表す混合変換係数のセットに適用される逆離散コサイン変換である方法。
  8. 請求項6又は7の方法であって、
    前記入力信号からセグメント長制御信号を得;
    形又は長さが前記セグメント長制御信号に応答して適合される合成ウィンドウ関数を出力信号セグメントに適用する;
    ことを含んでなる方法。
  9. 請求項8の方法であって、前記逆一次変換は1セットの基礎関数を持ち、方法は、前記セグメント長制御信号に応答して前記1セットの基礎関数を適合させる;
    ことを含んでなる方法。
  10. (a)入力端子と;
    (b)出力端子と;
    (c)前記入力端子と前記出力端子端に結合した信号処理サーキットリーと;
    を含んでなる出力信号を生成する装置であって、
    前記信号処理サーキットリーは:
    スペクトルコンテントを持つソース信号のサンプルを前記入力端子から受け取り;
    前記サンプルのオーバラッピングセグメントに一次変換を適用して複数のセットのスペクトル係数を生成し、ただし、前記各セットのスペクトル係数が時間領域エイリアシングアーチファクトを持ちかつ1セットの周波数に関する各ソース信号セグメントの前記スペクトルコンテントを表すものであり;
    前記複数のセットのスペクトル係数から前記1セットの周波数のうちの1つの同一の周波数を表す複数のスペクトル係数を得て、該複数のスペクトル係数を1つ以上のブロックのスペクトル係数に組み立て、ただし、前記1つ以上のブロックの各ブロックにおいて組み立てられるスペクトル係数の数がブロック長制御信号に応答して適合され;
    前記1つ以上のブロックのスペクトル係数に二次変換を適用して1つ以上のセットの混合変換係数を生成し、ただし、前記1つ以上のブロックのスペクトル係数の各ブロックに適用される前記二次変換の長さが前記ブロック長制御信号に応答して適合されるものであり;前記1つ以上のセットのハイブリッド変換係数を表す情報と前記ブロック長制御信号を前記出力端に送出される出力信号に組み立てる;
    ように構成されている装置。
  11. 請求項10の装置であって、前記一次変換は修正離散コサイン変換であり、前記二次変換は、互いにオーバラップしないブロックのスペクトル係数に適用される離散コサイン変換である装置。
  12. 請求項10の装置であって、前記信号処理サーキットリーは:
    スペクトル成分強度の類似性の測度を複数のセットのスペクトル成分中に生成し;
    前記類似性の測度に応答して前記ブロック長制御信号を生成する;
    ように構成されている装置。
  13. 請求項10,11,又は12の装置であって、前記信号処理サーキットリーは:
    前記ソース信号のサンプルを解析してセグメント長制御信号を生成し;
    前記セグメント長制御信号に応答して形又は長さが適合される解析ウィンドウ関数を前記ソース信号のサンプルのセグメントに適用する;
    ように構成されている装置。
  14. 請求項13の装置であって、前記一次変換は1セットの基本関数を有し、かつ、前記信号処理サーキットリーは前記セグメント長制御信号に応答して前記1セットの基本関数を適用する装置。
  15. (a)入力端子と;
    (b)出力端子と;
    (c)前記入力端子と前記出力端子端に結合した信号処理サーキットリーと;
    を含んでなる出力信号を生成する装置であって、
    前記信号処理サーキットリーは:
    ソース信号のスペクトルコンテントを表す入力信号を前記入力端子から受け取り;
    前記入力信号から1つ以上のセットの混合変換係数と、1つのブロック長制御信号を得;
    前記1つ以上のセットの混合変換係数に逆二次変換を適用して1セットの周波数のうちの1つの同一の周波数に関する前記ソース信号のスペクトルコンテントを表す1つ以上のブロックのスペクトル係数を生成し、ただし前記1つ以上のセットの混合変換係数に適用される前記逆二次変換の長さが前記ブロック長制御信号に応答して適合させるものであり;
    前記スペクトル係数をスペクトル係数のセットに組み立て、ただし、該各セットのスペクトル係数が時間領域エイリアシングアーチファクトを持ちかつ1セットの周波数のすべての周波数に関して前記ソース信号のセグメントの前記スペクトルコンテントを表すものであり;
    前記スペクトル係数のセットに逆一次変換を適用して前記ソース信号のセグメントに相当する出力信号セグメントを生成する、ただし、前記逆一次変換は前記時間領域エイリアシングアーチファクトを実質的にキャンセルし、前記出力信号セグメントは前記出力端子に送られるものである;
    ように構成された装置。
  16. 請求項15の装置であって、前記逆一次変換は逆修正離散コサイン変換であり、前記逆二次変換が互いをオーバラップしないブロックのスペクトル係数を表す混合変換係数のセットに適用される逆離散コサイン変換である装置。
  17. 請求項15又は16の装置であって、信号処理サーキットリーは:
    前記入力信号からセグメント長制御信号を得;
    形又は長さが前記セグメント長制御信号に応答して適合される合成ウィンドウ関数を出力信号セグメントに適用する;
    ように構成された装置。
  18. 請求項17の装置であって、前記逆一次変換は1セットの基礎関数を有し、前記信号処理サーキットリーが前記セグメント長制御信号に応答して前記1セットの基礎関数を適合させる装置。
  19. 出力信号発生方法を実行する装置によって実行することができる命令プログラムを保持するメディアであって、前記出力信号発生方法は:
    スペクトルコンテントを持つソース信号のサンプルを受け取り;
    前記サンプルのオーバラッピングセグメントに一次変換を適用して複数のセットのスペクトル係数を生成し、ただし、前記各セットのスペクトル係数が時間領域エイリアシングアーチファクトを持ちかつ1セットの周波数に関する各ソース信号セグメントの前記スペクトルコンテントを表すものであり;
    前記複数のセットのスペクトル係数から前記1セットの周波数のうちの1つの同一の周波数を表す複数のスペクトル係数を得て、該複数のスペクトル係数を1つ以上のブロックのスペクトル係数に組み立て、ただし、前記1つ以上のブロックの各ブロックとして組み立てられるスペクトル係数の数がブロック長制御信号に応答して適合されるものであり;
    前記1つ以上のブロックのスペクトル係数に二次変換を適用して1つ以上のセットの混合変換係数を生成し、ただし、前記1つ以上のブロックのスペクトル係数の各ブロックに適用される前記二次変換の長さが前記ブロック長制御信号に応答して適合されるものであり;
    前記1つ以上のセットのハイブリッド変換係数を表す情報と、前記ブロック長制御信号を出力信号として組み立てる;
    ことを含んでなるメディア。
  20. 請求項19のメディアであって、前記一次変換は修正離散コサイン変換であり、前記二次変換は、互いにオーバラップしないブロックのスペクトル係数に適用される離散コサイン変換であるメディア。
  21. 請求項19又は21のメディアであって、前記方法は:
    前記ソース信号のサンプルを解析してセグメント長制御信号を生成し;
    形又は長さが前記セグメント長制御信号に応答して適合される解析ウィンドウ関数を前記ソース信号のサンプルのセグメントに適用する;
    ことを含むメディア。
  22. 出力信号発生方法を実施する装置によって実行することができる命令プログラムを含むメディアであって、出力信号発生方法は:
    ソース信号のスペクトルコンテントを表す入力信号を受け取り;
    前記入力信号から1つ以上のセットの混合変換係数と、1つのブロック長制御信号を得;
    前記1つ以上のセットのハイブリッド変換係数に逆二次変換を適用して1セットの周波数のうちの1つの同一の周波数に関するソース信号のスペクトルコンテントを表す1つ以上のブロックのスペクトル係数を生成し、ただし、前記1つ以上のセットの混合変換係数に適用される前記逆二次変換の長さが前記ブロック長制御信号に応答して適合されるものであり;
    前記スペクトル係数をスペクトル係数のセットに組み立て、ただし、該各セットのスペクトル係数が時間領域エイリアシングアーチファクトを持ちかつ1セットの周波数のすべての周波数に関する前記ソース信号のセグメントのスペクトルコンテントを表すものであり;
    実質的に時間領域エイリアシングアーチファクトをキャンセルする逆一次変換を前記スペクトル係数のセットに適用して前記ソース信号のセグメントに相当する出力信号セグメントを生成する;
    ことを含むメディア。
  23. 請求項22のメディアであって、前記逆一次変換は逆修正離散コサイン変換であり、前記逆二次変換が互いにオーバラップしないブロックのスペクトル係数を表す混合変換係数のセットに適用される逆離散コサイン変換であるメディア。
  24. 請求項22又は23のメディアであって、前記方法は:
    前記入力信号からセグメント長制御信号を得;
    形又は長さが前記セグメント長制御信号に応答して適合される合成ウィンドウ関数を出力信号セグメントに適用する;
    ことを含むメディア。
JP2006554100A 2004-02-19 2005-01-21 信号解析及び合成のための適応型混合変換 Active JP4689625B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10/783,951 2004-02-19
US10/783,951 US7516064B2 (en) 2004-02-19 2004-02-19 Adaptive hybrid transform for signal analysis and synthesis
PCT/US2005/001923 WO2005083682A1 (en) 2004-02-19 2005-01-21 Adaptive hybrid transform for signal analysis and synthesis

Publications (2)

Publication Number Publication Date
JP2007526691A true JP2007526691A (ja) 2007-09-13
JP4689625B2 JP4689625B2 (ja) 2011-05-25

Family

ID=34861377

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006554100A Active JP4689625B2 (ja) 2004-02-19 2005-01-21 信号解析及び合成のための適応型混合変換

Country Status (22)

Country Link
US (1) US7516064B2 (ja)
EP (3) EP2293293B1 (ja)
JP (1) JP4689625B2 (ja)
KR (1) KR101273486B1 (ja)
CN (2) CN1926609B (ja)
AT (1) ATE526660T1 (ja)
AU (2) AU2005217943B2 (ja)
BR (1) BRPI0507806B1 (ja)
CA (4) CA2860180C (ja)
CY (1) CY1122444T1 (ja)
DE (1) DE602005015427D1 (ja)
DK (1) DK1723638T3 (ja)
ES (1) ES2329384T3 (ja)
HK (2) HK1092925A1 (ja)
IL (1) IL177093A (ja)
LT (1) LT2293293T (ja)
MY (2) MY143979A (ja)
PL (1) PL1723638T3 (ja)
PT (1) PT1723638E (ja)
SI (1) SI2088583T1 (ja)
TW (2) TWI369852B (ja)
WO (1) WO2005083682A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008310327A (ja) * 2007-06-14 2008-12-25 Thomson Licensing スペクトル領域において適応切り替え式時間分解を使用して音声信号を符号化及び復号化する方法及び装置
JP2012530946A (ja) * 2009-06-23 2012-12-06 ヴォイスエイジ・コーポレーション 重み付けされた信号領域またはオリジナルの信号領域で適用される順方向時間領域エイリアシング取り消し
US9093066B2 (en) 2010-01-13 2015-07-28 Voiceage Corporation Forward time-domain aliasing cancellation using linear-predictive filtering to cancel time reversed and zero input responses of adjacent frames
JP2017507339A (ja) * 2014-02-03 2017-03-16 オスラム オプト セミコンダクターズ ゲゼルシャフト ミット ベシュレンクテル ハフツングOsram Opto Semiconductors GmbH オプトエレクトロニクス部品のパワー・スペクトルをデータ圧縮するための符号化方法および復号方法
JP2022505789A (ja) * 2018-10-26 2022-01-14 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン サブバンド併合および時間領域エイリアシング低減を使用した適応的な非均一時間/周波数タイリングによる知覚音声符号化

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050229769A1 (en) * 2004-04-05 2005-10-20 Nathaniel Resnikoff System and method for assigning visual markers to the output of a filter bank
KR101037931B1 (ko) * 2004-05-13 2011-05-30 삼성전자주식회사 2차원 데이터 처리를 이용한 음성 신호 압축 및 복원장치와 그 방법
US7895034B2 (en) * 2004-09-17 2011-02-22 Digital Rise Technology Co., Ltd. Audio encoding system
US8744862B2 (en) * 2006-08-18 2014-06-03 Digital Rise Technology Co., Ltd. Window selection based on transient detection and location to provide variable time resolution in processing frame-based data
US7987089B2 (en) * 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
US8036903B2 (en) * 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
JP5171842B2 (ja) 2006-12-12 2013-03-27 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 時間領域データストリームを表している符号化および復号化のための符号器、復号器およびその方法
FR2911228A1 (fr) * 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
US8214200B2 (en) * 2007-03-14 2012-07-03 Xfrm, Inc. Fast MDCT (modified discrete cosine transform) approximation of a windowed sinusoid
US9653088B2 (en) * 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
CA2698039C (en) * 2007-08-27 2016-05-17 Telefonaktiebolaget Lm Ericsson (Publ) Low-complexity spectral analysis/synthesis using selectable time resolution
US20090099844A1 (en) * 2007-10-16 2009-04-16 Qualcomm Incorporated Efficient implementation of analysis and synthesis filterbanks for mpeg aac and mpeg aac eld encoders/decoders
EP2144171B1 (en) * 2008-07-11 2018-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding and decoding frames of a sampled audio signal
MX2011000375A (es) * 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
ES2592416T3 (es) * 2008-07-17 2016-11-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Esquema de codificación/decodificación de audio que tiene una derivación conmutable
US9384748B2 (en) * 2008-11-26 2016-07-05 Electronics And Telecommunications Research Institute Unified Speech/Audio Codec (USAC) processing windows sequence based mode switching
EP3474279A1 (en) 2009-07-27 2019-04-24 Unified Sound Systems, Inc. Methods and apparatus for processing an audio signal
PL2491553T3 (pl) 2009-10-20 2017-05-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koder audio, dekoder audio, sposób kodowania informacji audio, sposób dekodowania informacji audio i program komputerowy wykorzystujący iteracyjne zmniejszania rozmiaru przedziału
SI2510515T1 (sl) * 2009-12-07 2014-06-30 Dolby Laboratories Licensing Corporation Dekodiranje večkanalnih avdio kodiranih bitnih prenosov s pomočjo adaptivne hibridne transformacije
JP5624159B2 (ja) 2010-01-12 2014-11-12 フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. オーディオ符号化器、オーディオ復号器、オーディオ情報を符号化および復号するための方法、ならびに以前に復号されたスペクトル値のノルムに基づいてコンテキストサブ領域値を取得するコンピュータプログラム
TWI443646B (zh) 2010-02-18 2014-07-01 Dolby Lab Licensing Corp 音訊解碼器及使用有效降混之解碼方法
WO2012004349A1 (en) * 2010-07-08 2012-01-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Coder using forward aliasing cancellation
KR101742136B1 (ko) 2011-03-18 2017-05-31 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치
CN103443854B (zh) * 2011-04-08 2016-06-08 杜比实验室特许公司 用于混合来自两个编码位流的音频节目的元数据的自动配置
FR2977969A1 (fr) * 2011-07-12 2013-01-18 France Telecom Adaptation de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee
US9979962B2 (en) * 2011-08-08 2018-05-22 Hewlett-Packard Development Company, L.P. Method and system for compression of a real-time surveillance signal
US8527264B2 (en) 2012-01-09 2013-09-03 Dolby Laboratories Licensing Corporation Method and system for encoding audio data with adaptive low frequency compensation
JP6126006B2 (ja) * 2012-05-11 2017-05-10 パナソニック株式会社 音信号ハイブリッドエンコーダ、音信号ハイブリッドデコーダ、音信号符号化方法、及び音信号復号方法
US9967583B2 (en) * 2012-07-10 2018-05-08 Qualcomm Incorporated Coding timing information for video coding
CN103714821A (zh) 2012-09-28 2014-04-09 杜比实验室特许公司 基于位置的混合域数据包丢失隐藏
EP2830058A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frequency-domain audio coding supporting transform length switching
US9349196B2 (en) 2013-08-09 2016-05-24 Red Hat, Inc. Merging and splitting data blocks
US10504530B2 (en) 2015-11-03 2019-12-10 Dolby Laboratories Licensing Corporation Switching between transforms
EP3276620A1 (en) * 2016-07-29 2018-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain aliasing reduction for non-uniform filterbanks which use spectral analysis followed by partial synthesis
WO2018201112A1 (en) * 2017-04-28 2018-11-01 Goodwin Michael M Audio coder window sizes and time-frequency transformations

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1175157A (ja) * 1997-08-29 1999-03-16 Sony Corp 映像信号及び音声信号の記録装置
JP2002091500A (ja) * 2000-09-19 2002-03-27 Sharp Corp デジタルデータ符号化方法
JP2002118517A (ja) * 2000-07-31 2002-04-19 Sony Corp 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法
JP2002132295A (ja) * 2000-10-27 2002-05-09 Matsushita Electric Ind Co Ltd ステレオオーディオ信号高能率符号化装置
JP2003345779A (ja) * 2003-03-26 2003-12-05 Seiko Epson Corp フィルタリング処理方法およびフィルタリング処理装置
JP2004004554A (ja) * 2002-03-27 2004-01-08 Toshiba Corp オーディオ符号化器とその符号化処理プログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5357594A (en) * 1989-01-27 1994-10-18 Dolby Laboratories Licensing Corporation Encoding and decoding using specially designed pairs of analysis and synthesis windows
DE3902948A1 (de) * 1989-02-01 1990-08-09 Telefunken Fernseh & Rundfunk Verfahren zur uebertragung eines signals
US5107345A (en) * 1990-02-27 1992-04-21 Qualcomm Incorporated Adaptive block size image compression method and system
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
CA2090052C (en) * 1992-03-02 1998-11-24 Anibal Joao De Sousa Ferreira Method and apparatus for the perceptual coding of audio signals
US6430529B1 (en) * 1999-02-26 2002-08-06 Sony Corporation System and method for efficient time-domain aliasing cancellation
US6246345B1 (en) * 1999-04-16 2001-06-12 Dolby Laboratories Licensing Corporation Using gain-adaptive quantization and non-uniform symbol lengths for improved audio coding
JP3762579B2 (ja) * 1999-08-05 2006-04-05 株式会社リコー デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
US6678647B1 (en) * 2000-06-02 2004-01-13 Agere Systems Inc. Perceptual coding of audio signals using cascaded filterbanks for performing irrelevancy reduction and redundancy reduction with different spectral/temporal resolution
US6963842B2 (en) * 2001-09-05 2005-11-08 Creative Technology Ltd. Efficient system and method for converting between different transform-domain signal representations
US7383180B2 (en) * 2003-07-18 2008-06-03 Microsoft Corporation Constant bitrate media encoding techniques

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1175157A (ja) * 1997-08-29 1999-03-16 Sony Corp 映像信号及び音声信号の記録装置
JP2002118517A (ja) * 2000-07-31 2002-04-19 Sony Corp 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法
JP2002091500A (ja) * 2000-09-19 2002-03-27 Sharp Corp デジタルデータ符号化方法
JP2002132295A (ja) * 2000-10-27 2002-05-09 Matsushita Electric Ind Co Ltd ステレオオーディオ信号高能率符号化装置
JP2004004554A (ja) * 2002-03-27 2004-01-08 Toshiba Corp オーディオ符号化器とその符号化処理プログラム
JP2003345779A (ja) * 2003-03-26 2003-12-05 Seiko Epson Corp フィルタリング処理方法およびフィルタリング処理装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008310327A (ja) * 2007-06-14 2008-12-25 Thomson Licensing スペクトル領域において適応切り替え式時間分解を使用して音声信号を符号化及び復号化する方法及び装置
JP2012530946A (ja) * 2009-06-23 2012-12-06 ヴォイスエイジ・コーポレーション 重み付けされた信号領域またはオリジナルの信号領域で適用される順方向時間領域エイリアシング取り消し
US9093066B2 (en) 2010-01-13 2015-07-28 Voiceage Corporation Forward time-domain aliasing cancellation using linear-predictive filtering to cancel time reversed and zero input responses of adjacent frames
JP2017507339A (ja) * 2014-02-03 2017-03-16 オスラム オプト セミコンダクターズ ゲゼルシャフト ミット ベシュレンクテル ハフツングOsram Opto Semiconductors GmbH オプトエレクトロニクス部品のパワー・スペクトルをデータ圧縮するための符号化方法および復号方法
US9992504B2 (en) 2014-02-03 2018-06-05 Osram Opto Semiconductors Gmbh Coding method for data compression of power spectra of an optoelectronic component and decoding method
JP2022505789A (ja) * 2018-10-26 2022-01-14 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン サブバンド併合および時間領域エイリアシング低減を使用した適応的な非均一時間/周波数タイリングによる知覚音声符号化
JP7279160B2 (ja) 2018-10-26 2023-05-22 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン サブバンド併合および時間領域エイリアシング低減を使用した適応的な非均一時間/周波数タイリングによる知覚音声符号化
US11688408B2 (en) 2018-10-26 2023-06-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Perceptual audio coding with adaptive non-uniform time/frequency tiling using subband merging and the time domain aliasing reduction

Also Published As

Publication number Publication date
TW201214949A (en) 2012-04-01
DK1723638T3 (da) 2009-09-07
EP2088583A3 (en) 2009-08-19
CA2554381A1 (en) 2005-09-09
IL177093A0 (en) 2006-12-10
KR101273486B1 (ko) 2013-06-14
HK1092925A1 (en) 2007-02-16
EP2088583B1 (en) 2011-09-28
MY146425A (en) 2012-08-15
CN1926609A (zh) 2007-03-07
TWI369852B (en) 2012-08-01
EP2293293A1 (en) 2011-03-09
EP1723638A1 (en) 2006-11-22
CA2860180A1 (en) 2005-09-09
CA2924281C (en) 2017-11-07
CA2880055A1 (en) 2005-09-09
WO2005083682A1 (en) 2005-09-09
AU2010203126B2 (en) 2012-12-13
AU2005217943B2 (en) 2010-05-13
PT1723638E (pt) 2009-09-24
BRPI0507806A (pt) 2007-07-10
CN101826071A (zh) 2010-09-08
CA2880055C (en) 2016-05-31
TWI463790B (zh) 2014-12-01
JP4689625B2 (ja) 2011-05-25
LT2293293T (lt) 2020-01-10
IL177093A (en) 2010-12-30
US20050185850A1 (en) 2005-08-25
KR20070001123A (ko) 2007-01-03
CY1122444T1 (el) 2021-01-27
AU2005217943A1 (en) 2005-09-09
CN101826071B (zh) 2011-09-14
EP1723638B1 (en) 2009-07-15
BRPI0507806B1 (pt) 2019-06-25
SI2088583T1 (sl) 2012-07-31
ES2329384T3 (es) 2009-11-25
CA2860180C (en) 2015-08-11
ATE526660T1 (de) 2011-10-15
HK1130358A1 (en) 2009-12-24
CA2924281A1 (en) 2005-09-09
MY143979A (en) 2011-07-29
PL1723638T3 (pl) 2009-11-30
CN1926609B (zh) 2010-05-26
CA2554381C (en) 2014-11-04
TW200529548A (en) 2005-09-01
US7516064B2 (en) 2009-04-07
EP2088583A2 (en) 2009-08-12
DE602005015427D1 (en) 2009-08-27
AU2010203126A1 (en) 2010-08-12
EP2293293B1 (en) 2019-11-27

Similar Documents

Publication Publication Date Title
JP4689625B2 (ja) 信号解析及び合成のための適応型混合変換
US8195730B2 (en) Apparatus and method for conversion into a transformed representation or for inverse conversion of the transformed representation
KR100778349B1 (ko) 이산값의 시퀀스를 갖는 신호 처리 장치 및 방법
KR20060084440A (ko) 오디오 인코딩에서 신속한 코드북 선택 방법
CN116018640A (zh) 对过渡段编码失真具有鲁棒性的音频编码/解码设备和方法
US9837085B2 (en) Audio encoding device and audio coding method
AU2012247062B2 (en) Adaptive Hybrid Transform for Signal Analysis and Synthesis
MXPA06009424A (es) Transformada hibrida adaptiva para analisis y sintesis de señal
US10410644B2 (en) Reduced complexity transform for a low-frequency-effects channel
TWI470622B (zh) 用於低頻效應頻道降低複雜度之轉換
AU2012238001A1 (en) Reduced complexity transform for a low-frequency-effects channel

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071128

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100819

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100824

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101124

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20101201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101220

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110118

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110216

R150 Certificate of patent or registration of utility model

Ref document number: 4689625

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140225

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250