JP2012177939A - 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形 - Google Patents

周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形 Download PDF

Info

Publication number
JP2012177939A
JP2012177939A JP2012122890A JP2012122890A JP2012177939A JP 2012177939 A JP2012177939 A JP 2012177939A JP 2012122890 A JP2012122890 A JP 2012122890A JP 2012122890 A JP2012122890 A JP 2012122890A JP 2012177939 A JP2012177939 A JP 2012177939A
Authority
JP
Japan
Prior art keywords
audio signal
envelope
time
audio
side information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012122890A
Other languages
English (en)
Other versions
JP5292498B2 (ja
Inventor
Stewart Vinton Mark
ビントン、マーク・ステュアート
Alan Jeffrey Seefeldt
シーフェルト、アラン・ジェフリー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of JP2012177939A publication Critical patent/JP2012177939A/ja
Application granted granted Critical
Publication of JP5292498B2 publication Critical patent/JP5292498B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Abstract

【課題】オーディオ信号の時間エンベロープを再整形するための方法を提供する。
【解決手段】合成された出力オーディオ信号の時間エンベロープを再整形して、入力オーディオ信号の時間エンベロープに、より近似させるための方法が提供され、方法は、a)ダウンミックスオーディオ信号及びエンベロープサイド情報を含む、空間的にエンコードされたビットストリームを受信すること、b)空間的にエンコードされたビットストリームをデコードして、合成された出力オーディオ信号を生成すること、c)エンベロープサイド情報に従って、合成された出力オーディオ信号の時間エンベロープを再整形して、入力オーディオ信号の時間エンベロープに、より近似させることを含む。
【選択図】図2

Description

本発明は、デコードされるときにオーディオ情報がブロックレートにより制限される時間エンベロープ分解能を有する場合における、知覚的パラメトリックオーディオエンコーダー、デコーダー、及びシステムを含んだ、ブロックベースのオーディオコーダーと、かかる方法を実行するコンピュータプログラムと、かかるエンコーダーにより作られたビットストリームとに関する。
ビットレートを削減するオーディオコーディング技法の多くは、1以上のエンコードされたオーディオ信号の各々を時間ブロックに分割し、このエンコードされたオーディオと関連のあるサイド情報の少なくともいくつかをブロックレート以下の頻度で更新する処理を含むエンコーディングにおける「ブロックベース」となっている。結果として、このオーディオ情報は、デコードされるときに、このブロックレートにより制限される時間エンベロープ分解能を有する。したがって、時間についてデコードされたオーディオ信号の詳細な構成においてそのコーディング技法の粒度より小さな時間周期(一般にブロック毎に8から50ミリ秒の範囲)は保存されない。
このようなブロックベースのオーディオコーディング技法には、AC−3、AAC、及びさまざまなMPEGのような、一般に個別のチャンネルがエンコーディング/デコーディングを経由して保存される、すでに確立された知覚コーディング技法のみならず、最近発表された、しばしば「バイノーラルキューコーディング」や「パラメトリックステレオコーディング」と称され、エンコーディング/デコーディングを経由して、多入力チャンネルがダウンミックスされ、また、単一のチャンネルがアップミックスされる限られたビットレートのコーディング技法も含まれる。このようなコーディングシステムの詳細は、「参照として編入」の見出しで以下に引用したさまざまな書面に記載されている。このようなコーディングシステムにおいて単一のチャンネルを用いる結果として、復元された出力チャンネルは、必然的にお互いに振幅が縮小拡大されたもの、すなわち特定のブロックについて、多様な出力信号が実質的に同じ詳細なエンベロープ構造を必然的に有する。
すべてのブロックベースのオーディオコーディング技法は、コード化されたオーディオ信号の時間エンベロープ分解能を改善することにより恩恵を受けるかもしれないが、このようは改善の必要性は、エンコーディング/デコーディングプロセスを通して個別のチャンネルを保存しないブロックベースのオーディオコーディング技法において特に大きい。例えば、拍手のような特定の入力信号は、再生されて知覚される空間音像が狭くなるか又は壊れてしまうので特に問題である。
オーディオ信号の時間エンベロープを再整形するための方法を提供する。
本発明の1つの特徴により、オーディオ信号のエンコーディング方法が提供され、本方法により、1以上のオーディオ信号がオーディオ情報とビットストリームをデコードするのに有用な該オーディオ情報に関するサイド情報とからなるビットストリームにエンコードされる。該エンコード処理には、1以上のオーディオ信号の各々を時間ブロックに分割し、デコードするときにブロックレートで制限される時間エンベロープ分解能をオーディオ情報が持つようなブロックレート以下の頻度で、少なくともいくつかのサイド情報を更新する処理が含まれる。少なくとも1つのオーディオ信号の時間エンベロープと、この少なくとも1つのオーディオ信号のそれぞれをデコードして復元したときの推定される時間エンベロープとの比較がなされる。復元の推定では、少なくともいくつかのオーディオ情報と、少なくともいくつかのサイド情報が用いられる。比較結果の表示は、デコードするときに、少なくともいくつかのオーディオ情報の時間エンベロープ分解能を改善するために有用である。
本発明の他の特徴により、オーディオ信号のエンコーディング方法及びデコーディング方法が提供され、本方法により、1以上の入力オーディオ信号がオーディオ情報と該オーディオ情報に関してビットストリームをデコードするのに有益なサイド情報とからなるビットストリームにエンコードされる。前記ビットストリームを受信して、前記オーディオ情報を前記サイド情報を用いてデコードし1以上の出力オーディオ信号にする。前記エンコード処理とデコード処理には、1以上の入力オーディオ信号と前記デコードされたビットストリームの各々をそれぞれ時間ブロックに分割し、デコードするときにブロックレートで制限される分解能を有する時間エンベロープをオーディオ情報が持つようなブロックレート以下の頻度で、少なくともいくつかのサイド情報を更新するエンコード処理が含まれる。少なくとも1つの入力オーディオ信号の時間エンベロープと、この少なくとも1つの入力オーディオ信号のそれぞれをデコードして復元したときの推定される時間エンベロープとの比較がなされる。復元の推定では、少なくともいくつかのオーディオ情報と、少なくともいくつかのサイド情報が用いられ、前記比較により、デコードするときに、少なくともいくつかのオーディオ情報の時間エンベロープ分解能を改善するために有用であるような比較結果の表示がもたらされる。この結果表示のいくつかの出力がなされ、ビットストリームのデコーディングがなされる。このデコーディングでは、オーディオ情報とサイド情報と出力された結果表示とが採用される。
本発明のさらなる特徴により、オーディオ信号のデコーディング方法が提供され、本方法により、1以上の入力オーディオ信号がオーディオ情報とこのオーディオ情報に関してビットストリームをデコードするのに有益なサイド情報とからなるビットストリームにエンコードされている。このエンコード処理には、1以上の入力オーディオ信号の各々を時間ブロックに分割し、前記サイド情報を用いてデコードするときにブロックレートで制限される時間エンベロープ分解能をオーディオ情報が持つようなブロックレート以下の頻度で、少なくともいくつかのサイド情報を更新する処理が含まれる。このエンコード処理にはさらに、少なくとも1つの入力オーディオ信号の時間エンベロープと、少なくとも1つのオーディオ信号のそれぞれをデコードして復元したときの推定される時間エンベロープとの比較がなされる。復元の推定では、少なくともいくつかのオーディオ情報と、少なくともいくつかのサイド情報とが用いられる。比較により比較結果の表示がもたらされ、この表示は、デコードするときに、少なくともいくつかのオーディオ情報の時間エンベロープ分解能を改善するために有用であり、このエンコード処理にはさらにこの表示の少なくともいくつかを出力する処理が含まれる。受信とデコード処理とがなされ、前記オーディオ情報とサイド情報と出力された表示とを用いてデコーディング処理がなされる。
本発明の他の特徴には、上述の方法を実施するための装置と、コンピュータに上述の方法を実行させるためにコンピュータ読み込み可能媒体に記憶させたコンピュータプログラムと、上述の方法で作られたビットストリームと、上述の方法を実施するための装置により作られたビットストリームとが含まれる。
本発明の特徴を具体化したエンコーダー又はエンコーディング機能の概略機能ブロックダイアグラムである。 本発明の特徴を具体化したデコーダー又はデコーディング機能の概略機能ブロックダイアグラムである。
図1は、本発明の特徴を採用することのできるエンコーダー又はエンコーディング処理の例を示す。PCM信号のような複数のオーディオ入力信号の、それぞれのアナログオーディオ信号の時間サンプル1からnまでが、それぞれの時間領域から周波数領域への変換器又は変換機能(「T/F])2−1から2−nに入力される。このオーディオ信号は、例えば、左、中央、右、などの空間的方向を表すことができる。各T/Fは、例えば、入力オーディオサンプルをブロックに分割し、このブロックを窓処理し、ブロックを重複させ、離散周波数変換(DFT)を用いて計算することにより窓処理し重複のあるブロックの各々を周波数領域に変換し、結果得られた周波数スペクトルを、例えば等価矩形帯域幅(ERB)スケールを用いて、耳の臨界帯域を模擬する例えば21の帯域に区分することにより、実施することができる。このようなDFT処理は当業者に広く知られている。他の時間領域から周波数領域への変換パラメータ及びその技法を採用することもできる。その特別な変換パラメータあるいは技法はどちらも本発明にとって決定的なものではない。しかし、説明を分かりやすくするために以下の説明ではこのようなDFT変換技法が採用されることを想定する。
T/F2−1から2−nまでの周波数領域出力は各々スペクトル係数のセットである。これらのセットは、それぞれY[k]からY[k]で表される。これらのセットのすべては、ブロックベースのエンコーダー又はエンコーダー機能(「ブロックベースエンコーダー」)4に入力される。ブロックベースエンコーダーは、例えば、上述の公知のブロックベースエンコーダーを単独又はときには組み合わせたもの、あるいは、上述のこれらのエンコーダーを変形させたものを含む未来のブロックベースエンコーダーとすることができる。しかし、本発明の特徴はエンコーディング処理及びデコーディング処理のときに離散チャンネルを保持しないブロックベースエンコーダーと共に用いるためには特に有用であり、本発明の特徴は実質的にどんなブロックベースエンコーダーに対しても有用である。
一般的なブロックベースエンコーダー4の出力は「オーディオ情報」及び「サイド情報」として特徴づけられる。このオーディオ情報は、例えばAC−3,AAC,その他のような、ブロックベースのコーディングシステム中にあるような複数信号チャンネルを表すデータで構成してもよく、あるいは、前述のバイナリーキューコーディングシステムやパラメトリックステレオコーディングシステムのような、多数入力チャンネルをダウンミックスすることにより導き出した単一のチャンネルのみで構成してもよい(バイナリーキューコーディングエンコーダー又はパラメトリックステレオコーディングシステム中のこのダウンミックスしたチャンネルは、例えば、AAC又は他の適切なコーディングにより知覚エンコードしてもよい)。これはまた、Davis他による、2004年7月14日出願の米国暫定特許出願S.N.60/588,256、表題「Low Bit Rate Audio Encoding and Decoding in Which Multiple Channels are Represented By Monophonic Channel and Auxiliary Information.」に開示されているように、多数入力チャンネルをダウンミックスすることにより導き出された単一のチャンネル又は複数のチャンネルで構成してもよい。この暫定特許出願S.N.60/588,256はそのすべてをここに参照として編入する。サイド情報はオーディオ情報に関するデータであって、それをデコーディングする場合において有用なデータで構成してもよい。ダウンミックスする種々のコーディングシステムの場合において、サイド情報は、例えば、チャンネル間の振幅の差と、チャンネル間の時間と位相の差と、チャンネル間の相互相関とで構成してもよい。
ブロックベースエンコーダー4からのオーディオ情報とサイド情報は、次に、各々上述のT/Fと逆の機能、つまり逆FFTを行う周波数領域から時間領域への変換装置又は変換機能(「F/T」)6及び8にそれぞれ入力され、続いて、窓化と重複加算とをなすことができる。F/T6及び8からの時間領域の情報は、エンコードされたビットストリームを出力するビットストリームパッカー又はパッキング機能10に入力される。あるいは、もしエンコーダーが周波数領域情報を表すビットストリームを提供する場合は、F/T6及び8は省略してもよい。
ブロックベースエンコーダー4からの周波数領域のオーディオ情報とサイド情報は、デコーディング推定器または推定機能(「デコーディング推定器」)14にも入力される。デコーディング推定器14は、ビットストリームパッカー10により提供されるエンコードされたビットストリームをデコードするように設計されたデコーダー又はデコーディング機能の少なくとも一部をシミュレートすることができる。このようなデコーダー又はデコーディング機能について、図2と関連させて以下に説明する。デコーディング推定器14は、デコーダー又はデコーディング機能において入手することになっている入力オーディオ信号に対応するY[k]からY[k]までのスペクトル係数のセットに近似する、スペクトル係数のセットX[k]からX[k]までを提供することができる。あるいは、すべての入力オーディオ信号より少ない、及び/又は、すべての入力オーディオ信号時間ブロックより少ない、及び/又は、すべての周波数帯域より少ない(すなわち、すべてのスペクトル係数を提供しない)ようなスペクトル係数を提供することとしてもよい。これは、例えば、他より重要だと思われるチャンネルを表す入力信号のみを改善したいときに生じる。もう1つの例として、耳が時間波形エンベロープの細部の詳細にまで敏感となる低周波数部分の信号のみを改善したいときに生じる。
周波数領域の出力T/F2−1から2−nまで、すなわちスペクトル係数Y[k]からY[k]までセットの各々は、それぞれ、比較装置又は機能12−1から12−nまでに入力される。このセットは、それぞれの12−1から12−nまでの比較において推定スペクトル係数X[k]からX[k]までに対応する時間ブロックと比較される。12−1から12−nまでの比較における比較結果は、フィルター計算器又は計算機能(「フィルター計算器」)15−1から15−nまでに各々入力される。この情報は、デコーディングされた入力信号の復元のときに、フィルターが分解能を改善した時間エンベロープを有する信号を生じさせるような、各時間ブロックに対するフィルターの係数を定めるフィルター計算に十分な情報となる。言い換えれば、このフィルターは、元の信号の時間エンベロープをより厳密に複製するように信号を作り直す。改善された分解能は、ブロックレートより細かな分解能となる。好ましいフィルターのさらなる詳細は以下に説明する。
原則として、図1の例では周波数領域における比較とフィルター計算とが示されているが、比較とフィルター計算とは時間領域で行ってもよい。周波数領域で行われても時間領域で行われても、(連続する時間ブロックのいくつかで同じフィルター構成が適用されるかもしれないが)時間ブロック毎にただ1つのフィルター構成が決定される。原則として、フィルター構成は(ERBスケールの帯域毎のような)帯域毎に決定してもよいが、そのようにすることは、多数のサイド情報ビットを送ることを要求することになり、本発明の利点、すなわち、ビットレートを少し増やすだけで時間エンベロープの分解能を改善するという利点を無にする。
各比較12−1から12−nまでにおける比較指標は、決定器又は決定機能16−1から16−nまでに各々入力される。各決定器で比較指標と閾値とが比較される。比較指標は、さまざまな形態をとることができ決定的なものではない。例えば、対応する係数値の差の絶対値を計算し、その差の合計を、時間ブロックにおいて信号の波形の違いの程度を表す単一の数値としてもよい。この数値は、閾値を越えたならば「yes」の表示を対応するフィルター計算に提供するような閾値と比較することができる。「yes」の表示が無い場合、そのブロックのフィルター計算は禁止することができ、あるいは、計算したとしても、それはフィルター計算から出力されないようにすることができる。各信号に対するこのような「yes/no」情報は、ビットストリームに封入するためのビットストリームパッカー10に入力することもできるフラグを構成要素となる(このようにして、各入力信号に1つの複数のフラグが存在することになり、そのようなフラグの各々は1ビットで表現される)。あるいは、それぞれの比較12−1から12−nまでの代わりに、又はこれと共にそれぞれのフィルター計算14−1から14−nまでからの情報を各決定16−1から16−nまでが受け取ってもよい。各決定16は、計算したフィルター特性(例えば、その平均又はピーク振幅)を決定を行うための基準として又は決定を補助するために採用することもできる。
上述の通り、各フィルター計算14−1から14−nまでにより、比較結果の表示が出力され、これがフィルターの係数となることができ、このフィルターにより、デコードした入力信号の復元に適用するときに改善された分解能を有する時間エンベロープを信号に持たせることとなる。もし、推定スペクトル係数X[k]からX[k]までが不完全であれば(デコーディング推定器がすべての入力オーディオ信号より少ないか、及び/又は、すべての入力オーディオ信号のすべての時間ブロックより少ないか、及び/又は、すべての周波数帯域より少ないスペクトル係数を出力する場合は)、すべての時間ブロック、すべての周波数帯域、及びすべての入力信号に対して各比較12−1から12−nまでが出力されないかもしれない。ここでX[k]からX[k]までは復元された出力と称し、Y[k]からY[k]までは入力と称す。
フィルター計算14−1から14−nまでの各出力はビットストリームアセンブラ10に適用してもよい。フィルター情報はビットストリームからとは別に送られるが、ビットストリームの1部としてそしてサイド情報の1部として送られることが好ましい。本発明の特徴が既存のブロックベースのエンコーディングシステムに適用されたとき、本発明の特徴により提供される付加的な情報を補助情報を送るためのシステムのビットストリームの一部に挿入することができる。
特定の実施の形態において、オーディオ情報のみならずサイド情報及びフィルター係数も、伝達コストを最小限にするために同様の方法で量子化できるとおもわれる。しかし、説明を簡略化するため及びその詳細は広く知られており本発明の理解に役立たないので、量子化及び逆量子化については図示されていない。
[周波数領域におけるウィナーフィルターの設計]
フィルター計算装置又は計算機能14−1から14−nまでの各々は、信号チャンネルの元の時間エンベロープをより正確に復元したものを取得するために必要な、時間領域における乗法的な変化を表す周波数領域でのFIRフィルターを特徴づけることが好ましい。このフィルター問題は少なくとも平方の問題として公式化することができ、しばしばウィナーフィルター設計と称される。例えば、X. Rong Liの、「Probability, Random Signals, and Statistics」CRC Press 1999年、ニューヨーク、423ページ参照のこと。ウィナーフィルター技法を適用することは、再整形フィルター情報をデコーダに伝達するために必要とされる付加ビットを減らす利点がある。ウィナーフィルターの一般的な応用は時間領域において設計・適用される。周波数領域の最小2乗フィルター設計問題は以下ののように定義される。元の信号Y[k]のDFTスペクトル表現とそのような元のチャンネルX[k]の近似のDFTスペクトル表現が与えられ、式1の最小化するフィルター係数(a)のセットを計算する。Y[k]とX[k]は複素数であり、従って、一般にaもまた複素数となることに留意しなければならない。
ここで、kはスペクトル指標であり、Eは期待値(expectation operator)であり、Mは設計したフィルターの長さである。
式1は、式2に示すようにマトリックスを使った表現で表すこともできる
ここで
及び
である。
このようにして、式2の部分導関数をフィルター係数に関してゼロに設定することにより、最小化問題の解を示すことが簡単になり、式3で与えられる。
ここで
及び
となる。
式3は、特定のチャンネルにおける元のスペクトル(Y[k])と復元されたスペクトル(X[k])との誤差を最小にする最適なフィルター係数の計算を定める。一般に、フィルター係数のセットは、入力信号毎の各時間ブロックに対して計算される。
本発明の特徴を用いた実際の実施の形態において、12次元のウィナーフィルターが採用されるが、本発明はそのようなサイズのウィナーフィルターに限定されるものではない。そのような実際の実施の形態では、DFTの後に周波数領域での処理を採用する。その結果、ウィナーフィルター係数は複素数となり、各フィルターは24個の実数を伝達することが必要となる。そのようなフィルター情報を効率的にデコーダーに伝達するために、各フィルターの係数をエンコードするためにベクトル量子化(VQ)を用いることができる。コードブックは、12次元の複素数フィルター情報を伝達するために、デコーダーに送るのに必要なただ1つの指標を採用してもよい。実際の実施の形態では、24次元で16,536個の入力があるVQテーブルのコードブックが有用であることが分かった。本発明はベクトル量子化を使うものやコードブックを使うものに限定されない。
上記説明ではスペクトルコンテンツを推定するため、及びウィナーフィルターを設計するためにDFTを用いることを想定したが、一般にどんな変換を用いてもよい。
図2は、本発明の特徴を採用することのできるデコーダー又はデコーディング処理環境の例を示す。このようなエンコーダー又はエンコーディング処理は、図1の例に関連して説明したエンコーダー又はエンコーディング処理と協調して動作させるのに適切であろう。図1の構成により生成されたようなエンコードされたビットストリームは、適切な信号伝達様式又は信号記憶様式で受け取られ、エンコードされた情報をサイド情報とyes/noフラグ(ビットストリームに含まれる場合)とから分離するために必要なときにビットストリームをアンパックするビットストリームアンパッカー30に入力される。サイド情報には、図1のエンコーディングの構成に入力される1以上の入力信号のそれぞれの復元を改善するために用いられるフィルター係数のセットが含まれるようにすることが好ましい。
この例では、各入力信号に対応する再生された信号と時間エンベロープ再整形フィルターが各再生された信号に提供されることが想定されているが、このことは、上述のように問題ではない。このように、1からnまでのフィルター係数サイド情報はビットストリームアンパッカー30からの出力として示される。各入力信号に対するフィルター係数情報はそれぞれ再整形フィルター36−1から36−nまでに入力される。再整形フィルターの動作は以下に説明する。各フィルターは、特定の時間ブロック期間でアクティブかどうかを示す、それぞれのyes/noフラグ31−1から31−nまでを受け取ることができる。
ビットストリームアンパッカー30からのサイド情報には、例えば、チャンネル間の振幅差、チャンネル間の時間差又は位相差、及び、両耳性のキューコーディング又はパラメトリックステレオシステムの場合におけるチャンネル間の相互相関が含まれてもよい。ブロックベースデコーダー42は、ビットストリームアンパッカー30からの時間領域から周波数領域へ変換されたオーディオ情報と共に、ビットストリームアンパッカー30からのサイド情報を受け取る。ビットストリームアンパッカー30からのオーディオ情報は、図1の周波数領域変換装置又は変換機能(「T/F」)2−1から2−nまでのいずれかと同じとすることのできる、時間領域から周波数領域への変換装置又は変換機能(「T/F」)46を経由して入力される。
ブロックベースデコーダーは、1以上の出力を出し、その各々は図1における対応する入力の近似値となる。いくつかの入力信号は対応する出力信号を持たないかもしれないが、図2の例では出力信号1からnまでを示し、その各々は図1における入力信号1からnまでのそれぞれに対応する近似値となる。この例において、デコーダー42の出力信号1からnまでの各々は、それぞれ、FIRフィルターとして実施することのできる再整形フィルター36−1から36−nまでに入力される。各FIRフィルターの係数は、ブロックベースで、その出力が改善された特定の入力チャンネルに関するそれぞれのフィルター情報により制御される。時間領域における倍数的に増加するエンベロープの整形は、FIRフィルターを各フィルター36−1から36−nまでにおけるブロックベースデコーダーの出力で畳み込むことにより実施されることが望ましい。このようにして、本発明の特徴による時間エンベロープの整形は時間と周波数の双対性での優位性を持つ。すなわち時間領域の畳み込み演算が周波数領域の乗算と等価であり、その逆も成り立つ。デコードされた出力信号とフィルターされた出力信号の各々は、それぞれ周波数領域から時間領域への変換器、すなわち各々上述のT/Fとは反対の機能、つまり逆FFTを行う変換機能(「F/T」)44−1から44−nまでに入力され、続いて、窓化されて重複加算される。あるいは、周波数から時間領域への各変換器の後に続いて、適切な時間領域再整形フィルターを採用してもよい。例えば、FIRフィルター係数と時間領域で乗算される曲線の代わりにサイド情報として、n次多項式の曲線のn個の多項式の係数を送ってもよい。再整形フィルター情報をデコーダーに伝達するためにウィナーフィルター技術を採用することが好ましいが、TrumanとVintonによる米国特許出願S.N.10/113,858、表題「Broadband Frequency Translation for High Frequency Regeneration」、2002年3月28日出願、US2003/0187663Alとして、2003年10月2日に公開、に記載されたような他の周波数領域と時間領域の技術を採用してもよい。この出願は、そのすべてを参照として本明細書に編入するものとする。
[実施例]
本発明は、ハードウェア又はソフトウェア又はこれらの組み合わせ(例えばプログラマブルロジックアレー)により実施可能である。特に記述が無い場合は、本発明の1部として組み込まれるアルゴリズムは特定のコンピュータ又はその他の装置に本来的に結びついたものではない。特に、さまざまな汎用機でここに開示した記載のプログラムを用いてもよく、あるいは、必要な方法のステップを実行するためのもっと特化した装置(例えば集積回路)を組み立てたほうがもっと便利かもしれない。このように、本発明は、それぞれが少なくとも1つのプロセッサと、少なくとも1つのデータ記憶システム(揮発メモリ及び不揮発メモリ及び/又は記憶装置を含む)と、少なくとも1つの入力装置又は入力ポートと、少なくとも1つの出力装置からなる1以上のプログラム可能なコンピュータシステムで動作する1以上のコンピュータプログラムにより実行することができる。ここに記載した機能を実行し出力情報を出力するために入力データにプログラムコードが適用される。出力情報は、1以上の出力装置に既知の方法で適用される。
このようなプログラムの各々は、コンピュータシステムと通信するため必要とされるどのようなコンピュータ言語(機械言語、アセンブリ言語、高級手続言語又はロジック言語又はオブジェクト指向プログラミング言語を含む)、で実行してもよい。いずれにせよ、言語はコンパイル言語又はインタプリタ言語とすることができる。
このようなコンピュータプログラムの各々は、その記憶媒体又は記憶装置をコンピュータシステムが読み取り、ここに記載された手続を実行するときに、コンピュータを設定し実行させるために、汎用又は専用のプログラマブルコンピュータにより読み取り可能な記憶媒体又は記憶装置(例えば、半導体メモリ又は半導体媒体、又は磁気又は光学媒体)に保存又はダウンロードされることが好ましい。発明したシステムは、コンピュータプログラムコンピュータが設定された読取可能な記憶媒体であって、コンピュータシステムにここに記載した機能を実行するために、あらかじめ定めた特定の方法で動作させるよう構成されている記憶媒体としての実施も考えることができる。本発明の多くの実施の形態を記載した。しかしながら、本発明の精神と技術的範囲を逸脱することなく多くの変更を加えることができることは了解されよう。例えば、ここに記載したステップのいくつかは独立したものであり、したがって、この記載とは違った順序で実施することができる。
[参照としての編入]
以下の特許、特許出願、及び、刊行物は参照としてそのすべてを本明細書に編入する。
[AC−3]
ATSC標準A52/A:Digital Audio Compression Standard (AC-3), Revision A、Advanced Television Systems Committee、2001年8月20日。このA52/A書面は、ワールドワイドウェブhttp://www.atsc.orR/standards.html.にて参照することができる。
Steve Vernon /EEE Trans.による、1995年8月のConsumer Electronics,Vol.41,No.3、「Design and Implementation of AC-3 Coders」、
Mark Davisによる、1993年10月のAudio Engineering Society Preprint 3774, 95th AES Convention,「The AC-3 Multichannel Coder」、
Bosi他による、1992年10月のAudio Engineering Society Preprint 3365, 93rd AES Convention,「High Quality, Low-Rate Audio Transform Coding for Transmission and Multimedia Applications」、
米国特許、5,583,962と、5,632,005と、5,633,981と、5,727,119と、6,021,386、
[AAC]
ISO/IEC IS-14496(パート3、オーディオ)、1996年、AAC ISO/IEC JTC1/SC29, 「Information technology-very low bitrate audio-visual coding」、
ISO/IEC 13818-7、International Standard、1997年「MPEG-2 advanced audio coding, AAC」、
M. Bosi、K. Brandenburg、S. Quackenbush、L. Fielder、K. Akagiri、H. Fuchs、M. Dietz、J. Herre、G. Davidson、及び、Y. Oikawaによる、1996年、Proc. of the 101st AES-Convention、「ISO/IEC MPEG-2 Advanced Audio Coding」、
M. Bosi、K. Brandenburg、S. Quackenbush、L. Fielder、K. Akagiri、H. Fuchs、M. Dietz、J. Herre、G. Davidson、及び、Y. Oikawaによる、Journal of the AES, Vol.45, No.10, October 1997, pp. 789-814、「ISO/IEC MPEG-2 Advanced Audio Coding」、
Karlheinz Brandenburgによる、Proc. of the AES 17th International Conference on High Quality Audio Coding, Florence, Italy, 1999、「MP3 and AAC explained」、及び、
G. A. Soulodre他による、J. Audio Eng. Soc, Vol.46, No.3, pp 164-177 March 1998、「Subjective Evaluation of State-of-the-Art Two-Channel Audio Codecs」、
[MPEG Intensity Stereo]
米国特許、5,323,396と、5,539,829と、5,606,618と、5,621,855、
米国公開特許出願US2001/0044713、
[空間的コーディング及びパラメトリックコーディング]
Davis他による2004年7月14日出願の米国暫定特許出願、S.N.60/588,256、表題「Low Bit Rate Audio Encoding and Decoding in Which Multiple Channels are Represented By Monophonic Channel and Auxiliary Information」、
米国特許出願公開公報US2003/0026441、2003年2月6日公開、
米国特許出願公開公報US2003/0035553、2003年2月20日公開、
米国特許出願公開公報US2003/0219130(Baumgarte & Faller)、2003年11月27日公開、
Audio Engineering Society 論文5852、2003年3月、
国際公開公報WO03/090206、2003年10月30日公開、
国際公開公報WO03/090207、2003年10月30日公開、
国際公開公報WO03/090208、2003年10月30日公開、
国際公開公報WO03/007656、2003年1月22日公開、
Baumgarte他による、2003年12月25日に公開された、米国特許出願公開公報US2003/0236583Al、表題「Hybrid Multi-Channel/Cue Coding/Decoding of Audio Signals」、出願番号S.N.10/246,570、
Faller他による、Audio Engineering Society Convention Paper 5574, 112th Convention, Munich, May 2002、「Binaural Cue Coding Applied to Stereo and Multi-Channel Audio Compression」、
Baumgarte他による、Audio Engineering Society Convention Paper 5575, 112th Convention, Munich, May 2002、「Why Binaural Cue Coding is Better than Intensity Stereo Coding」、
Baumgarte他による、Audio Engineering Society Convention Paper 5706, 113th Convention, Los Angeles, October 2002、「Design and Evaluatinof Binaural Cue Coding Schemes」、
Faller他による、IEEE Workshop on Applications of Signal Processing to Audio and Acoustics 2001, New Paltz, New York, October 2001, pp.199-202、「Efficient Representation of Spatial Audio Using Perceptual Parametrization」、
Baumgarte他による、Proc. ICASSP 2002, Orlando, Florida, May 2002, pp.II-1801-1804、「Estimation of Auditory Spatial Cues for Binaural Cue Coding」、
Faller他による、Proc. ICASSP 2002, Orlando, Florida, May 2002, pp.II-1841II-1844、「Binaural Cue Coding: A Novel and Efficient Representation of Spatial Audio」、
Breebaart他による、Audio Engineering Society Convention Paper 6072, 116th Convention, Berlin, May 2004、「High-quality parametric spatial audio coding at low bitrates」、
Baumgarte他による、Audio Engineering Society Convention Paper 6060, 116th Convention, Berlin, May 2004、「Audio Coder Enhancement using Scalable Binaural Cue Coding with Equalized Mixing」、
Schuijers他による、Audio Engineering Society Convention Paper 6073, 116th Convention, Berlin, May 2004、「Low complexity parametric stereo coding」、
Engdegard他による、Audio Engineering Society Convention Paper 6074, 116th Convention, Berlin, May 2004、「Synthetic Ambience in Parametric Stereo Coding」、
[その他]
Herreによる米国特許5,812,971、表題「Enhanced Joint Stereo Coding Method Using Temporal Envelope Shaping」1998年9月22日付、
Herre他による、Audio Engineering Society Preprint 3799, 96th Convention, Amsterdam, 1994。
30…ビットストリームアンパッカー、36−1〜36−n…再整形フィルター、42…ブロックベースデコーダー。

Claims (10)

  1. 合成された出力オーディオ信号の時間エンベロープを再整形して、入力オーディオ信号の時間エンベロープに、より近似させるための方法であって、
    a)ダウンミックスオーディオ信号及びエンベロープサイド情報を含む、空間的にエンコードされたビットストリームを受信することであって、
    前記ダウンミックスオーディオ信号は、複数の時間スロットに分割されたオーディオ信号を含み、前記エンベロープサイド情報は、前記オーディオ信号に関連し、前記合成された出力オーディオ信号の時間エンベロープの再整形において有用であり、
    前記エンベロープサイド情報は、前記入力オーディオ信号のエンベロープと、前記ダウンミックスオーディオ信号から導出されたオーディオ信号のエンベロープとを比較することにより得られる情報を含み、前記ダウンミックスオーディオ信号は、少なくとも前記入力オーディオ信号からダウンミックスされている、前記空間的にエンコードされたビットストリームを受信すること、
    b)前記空間的にエンコードされたビットストリームをデコードして、前記合成された出力オーディオ信号を生成すること、
    c)前記エンベロープサイド情報に従って、前記合成された出力オーディオ信号の時間エンベロープを再整形して、前記入力オーディオ信号の時間エンベロープに、より近似させること
    を含む方法。
  2. 前記複数の時間スロットの粒度は、前記ダウンミックスオーディオ信号のエンベロープについて、入力オーディオ信号のエンベロープに関連している、請求項1に記載の方法。
  3. 前記ビットストリームをデコードすることは、再整形フィルターの、前記エンベロープサイド情報との相関除去を制御することを含む、請求項1に記載の方法。
  4. 入力オーディオ信号のエンベロープと前記ダウンミックスオーディオ信号から導出された信号のエンベロープとの比較は、比較されたエンベロープのサイド情報の表示を含む、請求項1に記載の方法。
  5. 前記空間的にエンコードされたビットストリームは、一つ又は複数の入力オーディオ信号から構築されたビットストリームを含む、請求項1に記載の方法。
  6. 前記一つ又は複数の入力オーディオ信号は、複数チャンネル音場を含む、請求項5に記載の方法。
  7. 前記オーディオ信号が分割されている複数の時間スロットはそれぞれ、時間のブロックを含む、請求項1に記載の方法。
  8. 前記時間スロットの粒度は、前記時間のブロックのレートにより制限される分解能を備える、請求項7に記載の方法。
  9. 前記時間のブロックは、前記エンベロープサイド情報の分解能を制限するブロックレートを有する、請求項7に記載の方法。
  10. 前記ダウンミックスオーディオ信号から導出される信号は、前記入力オーディオ信号の推定されデコードされた復元を含む、請求項1に記載の方法。
JP2012122890A 2004-08-25 2012-05-30 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形 Active JP5292498B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US60483604P 2004-08-25 2004-08-25
US60/604,836 2004-08-25

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2007529954A Division JP5038138B2 (ja) 2004-08-25 2005-08-15 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形

Publications (2)

Publication Number Publication Date
JP2012177939A true JP2012177939A (ja) 2012-09-13
JP5292498B2 JP5292498B2 (ja) 2013-09-18

Family

ID=35636849

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2007529954A Active JP5038138B2 (ja) 2004-08-25 2005-08-15 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形
JP2012122890A Active JP5292498B2 (ja) 2004-08-25 2012-05-30 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2007529954A Active JP5038138B2 (ja) 2004-08-25 2005-08-15 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形

Country Status (15)

Country Link
US (3) US8255211B2 (ja)
EP (4) EP4036914A1 (ja)
JP (2) JP5038138B2 (ja)
KR (3) KR20120006077A (ja)
CN (3) CN101006494B (ja)
AU (2) AU2005280392B2 (ja)
BR (3) BRPI0514650B1 (ja)
CA (1) CA2589623C (ja)
ES (3) ES2899286T3 (ja)
IL (3) IL181407A (ja)
MX (1) MX2007001948A (ja)
MY (2) MY151318A (ja)
PL (3) PL3940697T3 (ja)
TW (3) TWI393120B (ja)
WO (1) WO2006026161A2 (ja)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI393120B (zh) 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 用於音訊信號編碼及解碼之方法和系統、音訊信號編碼器、音訊信號解碼器、攜帶有位元流之電腦可讀取媒體、及儲存於電腦可讀取媒體上的電腦程式
WO2006126843A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
TWI396188B (zh) 2005-08-02 2013-05-11 Dolby Lab Licensing Corp 依聆聽事件之函數控制空間音訊編碼參數的技術
US20080255859A1 (en) * 2005-10-20 2008-10-16 Lg Electronics, Inc. Method for Encoding and Decoding Multi-Channel Audio Signal and Apparatus Thereof
US8208641B2 (en) * 2006-01-19 2012-06-26 Lg Electronics Inc. Method and apparatus for processing a media signal
US8285556B2 (en) * 2006-02-07 2012-10-09 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
ES2362920T3 (es) * 2006-03-28 2011-07-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Método mejorado para la conformación de señales en reconstrucción de audio multicanal.
BRPI0813723B1 (pt) 2007-07-13 2020-02-04 Dolby Laboratories Licensing Corp método para controlar o nível de intensidade do som de eventos auditivos, memória legível por computador não transitória, sistema de computador e aparelho
CN101673545B (zh) * 2008-09-12 2011-11-16 华为技术有限公司 一种编解码方法及装置
EP2214161A1 (en) * 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for upmixing a downmix audio signal
WO2010098120A1 (ja) * 2009-02-26 2010-09-02 パナソニック株式会社 チャネル信号生成装置、音響信号符号化装置、音響信号復号装置、音響信号符号化方法及び音響信号復号方法
JP4932917B2 (ja) 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
CN102884570B (zh) 2010-04-09 2015-06-17 杜比国际公司 基于mdct的复数预测立体声编码
WO2012037515A1 (en) 2010-09-17 2012-03-22 Xiph. Org. Methods and systems for adaptive time-frequency resolution in digital data coding
EP2469741A1 (en) * 2010-12-21 2012-06-27 Thomson Licensing Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field
US9978379B2 (en) * 2011-01-05 2018-05-22 Nokia Technologies Oy Multi-channel encoding and/or decoding using non-negative tensor factorization
US8838442B2 (en) 2011-03-07 2014-09-16 Xiph.org Foundation Method and system for two-step spreading for tonal artifact avoidance in audio coding
WO2012122299A1 (en) 2011-03-07 2012-09-13 Xiph. Org. Bit allocation and partitioning in gain-shape vector quantization for audio coding
WO2012122297A1 (en) * 2011-03-07 2012-09-13 Xiph. Org. Methods and systems for avoiding partial collapse in multi-block audio coding
MY176406A (en) * 2012-08-10 2020-08-06 Fraunhofer Ges Forschung Encoder, decoder, system and method employing a residual concept for parametric audio object coding
EP2981956B1 (en) * 2013-04-05 2022-11-30 Dolby International AB Audio processing system
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
JP6035270B2 (ja) * 2014-03-24 2016-11-30 株式会社Nttドコモ 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム
WO2019081089A1 (en) 2017-10-27 2019-05-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. MITIGATION OF NOISE AT THE LEVEL OF A DECODER
JP7092047B2 (ja) * 2019-01-17 2022-06-28 日本電信電話株式会社 符号化復号方法、復号方法、これらの装置及びプログラム
TW202334938A (zh) * 2021-12-20 2023-09-01 瑞典商都比國際公司 正交鏡像濾波器域中之沉浸式音訊及視訊服務空間重建濾波器庫
KR102446720B1 (ko) * 2022-02-18 2022-09-26 오드컨셉 주식회사 이미지 복원 모델, 및 이미지 복원 모델의 학습 방법
KR102423552B1 (ko) * 2022-02-28 2022-07-21 오드컨셉 주식회사 적대적 생성 신경망으로 구성된 상품 이미지 복원 및 합성 모델, 및 상품 이미지 복원 및 합성 모델의 학습 방법

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007531027A (ja) * 2004-04-16 2007-11-01 コーディング テクノロジーズ アクチボラゲット レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法
JP2008507184A (ja) * 2004-07-14 2008-03-06 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオチャネル変換

Family Cites Families (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4875095A (en) * 1987-06-30 1989-10-17 Kokusai Denshin Denwa Kabushiki Kaisha Noise-shaping predictive coding system
US4943855A (en) * 1988-07-22 1990-07-24 At&T Bell Laboratories Progressive sub-band image coding system
US5539829A (en) 1989-06-02 1996-07-23 U.S. Philips Corporation Subband coded digital transmission system using some composite signals
US6289308B1 (en) 1990-06-01 2001-09-11 U.S. Philips Corporation Encoded wideband digital transmission signal and record carrier recorded with such a signal
NL9000338A (nl) 1989-06-02 1991-01-02 Koninkl Philips Electronics Nv Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting.
DE69031869D1 (de) * 1989-10-11 1998-02-05 Cias Inc Kode und vorrichtung für optimale fehlerdetektion und -verbesserung
EP0520068B1 (en) 1991-01-08 1996-05-15 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
US5632005A (en) 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
NL9100173A (nl) 1991-02-01 1992-09-01 Philips Nv Subbandkodeerinrichting, en een zender voorzien van de kodeerinrichting.
JP2693893B2 (ja) * 1992-03-30 1997-12-24 松下電器産業株式会社 ステレオ音声符号化方法
DE4320990B4 (de) * 1993-06-05 2004-04-29 Robert Bosch Gmbh Verfahren zur Redundanzreduktion
US5623577A (en) * 1993-07-16 1997-04-22 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
DE4331376C1 (de) * 1993-09-15 1994-11-10 Fraunhofer Ges Forschung Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen
BE1007616A3 (nl) * 1993-10-11 1995-08-22 Philips Electronics Nv Transmissiesysteem met vereenvoudigde broncodering.
DE4409368A1 (de) * 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
JP3365874B2 (ja) 1994-10-05 2003-01-14 富士写真フイルム株式会社 キノンジアジドの合成法およびこれを含むポジ型レジスト
US5727119A (en) 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
JP3747492B2 (ja) * 1995-06-20 2006-02-22 ソニー株式会社 音声信号の再生方法及び再生装置
JP4132109B2 (ja) * 1995-10-26 2008-08-13 ソニー株式会社 音声信号の再生方法及び装置、並びに音声復号化方法及び装置、並びに音声合成方法及び装置
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
GB9614209D0 (en) * 1996-07-05 1996-09-04 Univ Manchester Speech synthesis system
JP3259759B2 (ja) * 1996-07-22 2002-02-25 日本電気株式会社 音声信号伝送方法及び音声符号復号化システム
JP4132154B2 (ja) * 1997-10-23 2008-08-13 ソニー株式会社 音声合成方法及び装置、並びに帯域幅拡張方法及び装置
DE19747132C2 (de) * 1997-10-24 2002-11-28 Fraunhofer Ges Forschung Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
TW382094B (en) * 1997-12-11 2000-02-11 Inventec Corp Base tone synchronous differential coding method and device thereof
US6529730B1 (en) * 1998-05-15 2003-03-04 Conexant Systems, Inc System and method for adaptive multi-rate (AMR) vocoder rate adaption
WO2002021794A2 (en) * 2000-09-08 2002-03-14 Findthedot,Inc. A method and system of connecting printed media to electronic information as a response to a request
US6614365B2 (en) * 2000-12-14 2003-09-02 Sony Corporation Coding device and method, decoding device and method, and recording medium
US7116787B2 (en) 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7644003B2 (en) 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
DE60307252T2 (de) * 2002-04-11 2007-07-19 Matsushita Electric Industrial Co., Ltd., Kadoma Einrichtungen, verfahren und programme zur kodierung und dekodierung
JP4399185B2 (ja) * 2002-04-11 2010-01-13 パナソニック株式会社 符号化装置および復号化装置
SE0201145L (sv) 2002-04-17 2003-10-07 Dirac Res Ab Digital audiokompensering
EP1500084B1 (en) 2002-04-22 2008-01-23 Koninklijke Philips Electronics N.V. Parametric representation of spatial audio
ATE354161T1 (de) 2002-04-22 2007-03-15 Koninkl Philips Electronics Nv Signalsynthese
BRPI0304542B1 (pt) 2002-04-22 2018-05-08 Koninklijke Philips Nv “Método e codificador para codificar um sinal de áudio de multicanal, sinal de áudio multicanal codificado, e, método e decodificador para decodificar um sinal de áudio de multicanal codificado”
US20040086130A1 (en) 2002-05-03 2004-05-06 Eid Bradley F. Multi-channel sound processing systems
KR100981699B1 (ko) 2002-07-12 2010-09-13 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
WO2004008437A2 (en) * 2002-07-16 2004-01-22 Koninklijke Philips Electronics N.V. Audio coding
US20040083417A1 (en) * 2002-10-29 2004-04-29 Lane Richard D. Multimedia transmission using variable error coding rate based on data importance
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
US7394903B2 (en) 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
ATE390683T1 (de) 2004-03-01 2008-04-15 Dolby Lab Licensing Corp Mehrkanalige audiocodierung
US7391870B2 (en) 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
TWI393120B (zh) 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 用於音訊信號編碼及解碼之方法和系統、音訊信號編碼器、音訊信號解碼器、攜帶有位元流之電腦可讀取媒體、及儲存於電腦可讀取媒體上的電腦程式
US10113858B2 (en) 2015-08-19 2018-10-30 Medlumics S.L. Distributed delay-line for low-coherence interferometry
US9996281B2 (en) 2016-03-04 2018-06-12 Western Digital Technologies, Inc. Temperature variation compensation
CN113535073B (zh) 2020-04-22 2024-04-16 伊姆西Ip控股有限责任公司 管理存储单元的方法、电子设备和计算机可读存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007531027A (ja) * 2004-04-16 2007-11-01 コーディング テクノロジーズ アクチボラゲット レベル・パラメータを生成する装置と方法、及びマルチチャネル表示を生成する装置と方法
JP2008507184A (ja) * 2004-07-14 2008-03-06 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオチャネル変換

Also Published As

Publication number Publication date
IL214135A0 (en) 2011-08-31
TWI498882B (zh) 2015-09-01
JP5292498B2 (ja) 2013-09-18
CN102968996B (zh) 2015-06-10
KR20070051860A (ko) 2007-05-18
EP3279893B1 (en) 2021-09-22
ES2923661T3 (es) 2022-09-29
EP3940697B1 (en) 2022-06-22
TWI393120B (zh) 2013-04-11
CN101006494A (zh) 2007-07-25
ES2899286T3 (es) 2022-03-10
CN102270453A (zh) 2011-12-07
KR20110069179A (ko) 2011-06-22
IL201469A (en) 2012-07-31
AU2011200680B2 (en) 2012-05-24
AU2005280392A1 (en) 2006-03-09
TW200611240A (en) 2006-04-01
CN101006494B (zh) 2011-09-07
AU2005280392B2 (en) 2011-02-24
JP2008511040A (ja) 2008-04-10
EP1784818A2 (en) 2007-05-16
MY151318A (en) 2014-05-15
JP5038138B2 (ja) 2012-10-03
TW201316327A (zh) 2013-04-16
PL3279893T3 (pl) 2022-02-07
BR122018077089B8 (pt) 2021-01-05
AU2011200680C1 (en) 2013-03-14
CA2589623C (en) 2014-10-28
US20080040103A1 (en) 2008-02-14
EP1784818B1 (en) 2017-11-15
PL3940697T3 (pl) 2022-08-22
ES2658824T3 (es) 2018-03-12
BR122018077099B1 (pt) 2020-11-10
CN102270453B (zh) 2014-06-18
MX2007001948A (es) 2007-04-23
US7945449B2 (en) 2011-05-17
EP4036914A1 (en) 2022-08-03
TWI497485B (zh) 2015-08-21
WO2006026161A3 (en) 2006-05-04
US20080046253A1 (en) 2008-02-21
KR101253699B1 (ko) 2013-04-12
EP3279893A1 (en) 2018-02-07
BRPI0514650A (pt) 2008-06-24
MY163042A (en) 2017-07-31
US8255211B2 (en) 2012-08-28
TW201333933A (zh) 2013-08-16
IL181407A0 (en) 2007-07-04
AU2011200680A1 (en) 2011-03-10
IL181407A (en) 2011-10-31
US20080033731A1 (en) 2008-02-07
BR122018077089B1 (pt) 2020-11-10
PL1784818T3 (pl) 2018-04-30
IL201469A0 (en) 2011-07-31
KR101139880B1 (ko) 2012-05-02
IL214135A (en) 2015-10-29
CA2589623A1 (en) 2006-03-09
EP3940697A1 (en) 2022-01-19
CN102968996A (zh) 2013-03-13
BRPI0514650B1 (pt) 2019-09-24
KR20120006077A (ko) 2012-01-17
WO2006026161A2 (en) 2006-03-09

Similar Documents

Publication Publication Date Title
JP5292498B2 (ja) 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形
JP4909272B2 (ja) 空間オーディオコーディングにおける複数チャンネルデコリレーション
KR101143225B1 (ko) 오디오 인코더 및 오디오 디코더에서의 컴퓨터 구현 방법및 컴퓨터 판독 가능 매체
MX2007001969A (es) Ensamble de guia de fruta de carriles multiples que tiene extremos de reborde integrales para un extractor de jugo y metodos relacionados.
AU2012205170B2 (en) Temporal Envelope Shaping for Spatial Audio Coding using Frequency Domain Weiner Filtering

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120530

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121211

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130308

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130313

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130410

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130604

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130610

R150 Certificate of patent or registration of utility model

Ref document number: 5292498

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250