JP5595602B2 - 予め計算された参照曲線を用いて入力信号を分解する装置および方法 - Google Patents

予め計算された参照曲線を用いて入力信号を分解する装置および方法 Download PDF

Info

Publication number
JP5595602B2
JP5595602B2 JP2013542451A JP2013542451A JP5595602B2 JP 5595602 B2 JP5595602 B2 JP 5595602B2 JP 2013542451 A JP2013542451 A JP 2013542451A JP 2013542451 A JP2013542451 A JP 2013542451A JP 5595602 B2 JP5595602 B2 JP 5595602B2
Authority
JP
Japan
Prior art keywords
signal
frequency
similarity
analysis
channels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013542451A
Other languages
English (en)
Other versions
JP2014502478A (ja
Inventor
アンドレーアス ヴァルター
Original Assignee
フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ filed Critical フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Publication of JP2014502478A publication Critical patent/JP2014502478A/ja
Application granted granted Critical
Publication of JP5595602B2 publication Critical patent/JP5595602B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction

Description

本発明は、オーディオ処理に関し、特に、例えば知覚的に識別可能な成分のような異なる成分へのオーディオ信号の分解に関する。
人間の聴覚システムは、全ての方向から音を感知する。知覚される聴覚環境(「聴覚」は知覚されることを表し、一方で「サウンド」は物理的現象を記載するために用いられる)は、サラウンド空間と発生しているサウンドイベントの音響的特性のインプレッションを生成する。特定の音場において知覚される聴覚インプレッションは、自動車の入口における3つの異なるタイプの信号:直接音(ダイレクトサウンド)、初期反射および拡散反射を考慮してモデル化する(少なくとも部分的に)ことができる。これらの信号は、知覚された聴覚空間像の形成に寄与する。
直接音は、妨害なしに直接音源からリスナーに最初に到達する各サウンドイベントの波動を表す。それは、音源に対して特有であり、サウンドイベントの入射の方向に関する最も少ない妥協された情報を提供する。水平面における音源の方向を推定する主なキューは、左耳と右耳の入力信号間の差、すなわち、両耳間時間差(ITD)および両耳間レベル差(ILD)である。引き続いて、直接音の多数の反射が、異なる方向から異なる相対的時間遅延とレベルで耳に到着する。時間遅延の増加によって、直接音と比較して、反射の密度は、それらが統計的攪乱(クラッター)を構成するまで増加する。
反射音は、距離の知覚と、聴覚空間インプレッション(これは少なくとも2つの成分:見かけの音源幅(ASW)(ASWに対して一般的に用いられる他の用語は聴覚広さである)とリスナーエンベロープ(LEV)から構成される)に寄与する。ASWは、音源の見かけ上の幅の広がりとして定められ、主として初期の横方向の反射によって決定される。LEVは、音に包まれているリスナーの感覚に関連し、主に遅れて到着する反射によって決定される。電気音響学の立体音響再生の目標は、気持ちよい聴覚空間像の知覚を喚起することである。これは、自然のまたは構造上のレファレンス(例えば、ホールにおけるコンサートの録音)を有することができるか、または実際には存在しない音場(例えば電気音響学の音楽)とすることができる。
コンサートホール音響の分野から、主観的に気持ちよい音場を取得するために、不可欠な部分であるLEVによる聴覚空間インプレッションの強い感覚が重要であることがよく知られている。拡散音場を再生することによって包囲する音場を再生するスピーカセットアップの能力は興味深い。合成音場において、専用の変換器を用いて全ての自然に生ずる反射を再生することはできない。それは、拡散後反射に対して特に正しい。拡散反射のタイミングとレベルの特性は、スピーカ供給として「反響」信号を用いることによってシミュレートすることができる。それらが十分に無相関の場合、再生に用いられるスピーカの数と位置は、音場が拡散であると知覚されるかどうかを決定する。目標は、離散した数の変換器のみを用いて、連続する拡散音場の知覚を喚起することである。それは、音の到来の方向を推定することができず、特に単一の変換器をローカライズすることができない音場を生成する。合成音場の主観的拡散は、主観的試験において評価することができる。
立体音響再生は、離散した数の変換器のみを用いて、連続する音場の知覚を喚起することを目的とする。最も望ましい機能は、ローカライズされた音源の方向安定性と周囲の聴覚環境の現実的なレンダリングである。立体音響録音を記憶するまたは転送するために今日用いられるフォーマットの大半は、チャンネルベースである。各チャンネルは、特定の位置において、関連するスピーカ上で再生されることが意図された信号を伝達する。録音またはミキシングプロセスの間、特定の聴覚像がデザインされる。この像は、再生に用いられるスピーカセットアップが、録音に対してデザインされたターゲットセットアップに似ている場合、この像は正確に再現される。
実行可能な転送および再生のチャンネル数は、絶えず大きくなり、あらゆる新生のオーディオ再生フォーマットによって、実際の再生システム上でレガシーフォーマットコンテンツをレンダリングする要望に近づく。アップミックスアルゴリズムは、この要望に対する解法であり、レガシー信号から、より多くのチャンネルによって信号を演算する。多くのステレオアップミックスアルゴリズムは、例えば、非特許文献1、非特許文献2、非特許文献3において提案されている。これらのアルゴリズムの多くは、ターゲットスピーカセットアップに適合されたレンダリングに従うダイレクト/アンビエント信号分解に基づいている。
記載されたダイレクト/アンビエント信号分解は、多重チャンネルサラウンド信号に対して直ちに適用可能ではない。N個のオーディオチャンネルから対応するN個のダイレクトサウンドとN個のアンビエントサウンドのチャンネルを取得するために、信号モデルとフィルタリングを定式化することは容易でない。ステレオのケースで用いられる単純な信号モデル(例えば、非特許文献2参照)は、全てのチャンネル間で相関するダイレクトサウンドを仮定しており、サラウンド信号チャンネル間に存在することができるチャンネル関係の多様性を獲得していない。
立体音響再生の一般的な目標は、限定された数の伝送チャンネルと変換器のみを用いて連続音場の知覚を喚起することである。2つのスピーカは、空間サウンド再生に対する最小の必要条件である。最新の消費者システムは、しばしば、より多数の再生チャンネルを提供する。基本的に、立体音響信号(チャンネル数から独立している)は、各音源に対して、直接音が特定の方向キューによって多数のチャンネルにコヒーレント(=従属する)に入り、反射独立音が見かけの音源幅とリスナーエンベロープに対するキューを決定する多数のチャンネルに入るように、録音またはミックスされる。意図された聴覚像の正しい知覚は、通常、録音において意図された再生セットアップにおける理想的な観測ポイントにおいてのみ可能である。与えられたスピーカセットアップに対してより多くのスピーカを加えることは、通常、自然音場のより現実的な復元/シミュレーションを可能にする。入力信号が他のフォーマットで与えられる場合に、拡張されたスピーカセットアップの最大限の利点を用いるため、あるいは入力信号の知覚的に識別可能な部分を操作するために、それらは別々にアクセス可能でなければならない。本明細書は、以下において、任意の数の入力チャンネルを備える立体音響録音の従属成分と独立成分を分離する方法を記述する。
オーディオ信号の知覚的に識別可能な成分への分解は、高品質信号修正、強調、適応再生および知覚的符号化のために必要である。2チャンネルの入力信号からの知覚的に識別可能な信号成分の操作および/または抽出を可能にする多くの方法が最近提案されている。2チャンネルよりも多い入力信号がますます一般的になっているので、記載された操作は多重チャンネル入力信号に対しても望ましい。しかしながら、2チャンネル入力に対して記載された大部分のコンセプトは、任意のチャンネル数を有する入力信号と連動するように容易に拡張することができない。
ダイレクト部分とアンビエント部分への信号解析を、例えば、左チャンネル、中央チャンネル、右チャンネル、左サラウンドチャンネル、右サラウンドチャンネルおよび低周波強調(サブウーファー)を有する5.1チャンネルサラウンド信号によって実行した場合、ダイレクト/アンビエント信号解析をどのように適用すべきであるかは簡単ではない。結局は15までの異なる比較演算を有する階層処理に結果としてなる6チャンネルの各ペアを比較することを考えるかもしれない。そして、各チャンネルがすべての他のチャンネルと比較されるこれらの15の比較演算の全てがなされるとき、15の結果をどのように評価すべきかについて決定しなければならない。これは、時間を消費し、結果の解釈が難しく、相当数の処理リソースのために、例えばダイレクト/アンビエント分離のリアルタイムアプリケーション、または、一般に、例えば、アップミックスの文脈または他のいかなるオーディオ処理演算においても用いることができる信号分解に対して使えない。
非特許文献4において、主(=ダイレクト)信号とアンビエント信号の分解を実行するために、入力チャンネル信号に対して主成分分析が適用される。
非特許文献2および非特許文献5において用いられたモデルは、ステレオ信号およびマイクロフォン信号において、それぞれ非相関または部分的に相関する拡散音を仮定している。それらは、この仮定を与える拡散/アンビエント信号を抽出するフィルタを導き出す。これらのアプローチは、単一および2チャンネルのオーディオ信号に限定される。
更なる文献は、非特許文献1である。非特許文献4は、非特許文献1について、次のようにコメントしている。この文献は、ステレオ入力信号からアンビエントを抽出するために、時間−周波数マスクを生成することを含むアプローチを提供する。しかしながら、そのマスクは左右のチャンネル信号間の相互相関に基づいており、その結果、このアプローチは任意の多重チャンネル入力からアンビエントを抽出する問題に対して直ちに適用することはできない。この高次のケースにおいて、いずれかのこのような相関ベースの方法を用いることは、階層的なペアワイズの相関分析を必要とし、有意の演算コスト、または多重チャンネル相関のいくつかの代替測定を要する。
空間インパルス応答レンダリング(SIRR)(非特許文献6)は、Bフォーマットインパルス応答において、方向および拡散音によってダイレクトサウンドを推定する。SIRRに非常に類似して、方向オーディオ符号化(DirAC)(非特許文献7)は、Bフォーマットの連続オーディオ信号に対して類似するダイレクトおよび拡散サウンド解析を実施する。
非特許文献8において提案されたアプローチは、入力としてバイノーラル信号を用いたアップミックスを記載している。
非特許文献9は、反響する音場に対して空間的に最適であるウィーナーフィルタの導出を記載している。反響する部屋における2マイクロフォンのノイズ消去に対するアプリケーションが与えられている。拡散音場の空間的相関から導き出された最適フィルタは、音場の局所的挙動を捕え、それ故、反響する部屋における従来の適応ノイズ消去フィルタよりも、より低次で、潜在的に、より空間的にロバストである。無制約および因果的に制約される最適フィルタに対する定式化が提案され、2マイクロフォンのスピーチ強調に対する実施例のアプリケーションがコンピュータシミュレーションを用いて実証されている。
ウィーナーフィルタリング・アプローチは、反響する部屋の雑音取り消しのために有用な結果を提供することができますが、それは計算上非能率的なものとなることがあり、また、それは幾つかの例に対して信号分解にそれほど役立たない。
Carlos Avendano and Jean-Marc Jot、「多重チャンネルアップミックスに対する周波数ドメインアプローチ」、Journal of the Audio Engineering Society、52巻、7/8号、740-749頁、2004年 Christof Faller, 「ステレオ信号の多重スピーカ再生」、Journal of the Audio Engineering Society、54巻、11号、1051-1064号、2006年11月 John Usherand Jacob Benesty、「空間音響品質の強調:新しい反響抽出オーディオアップミキサー」、IEEE Transactions on Audio, Speech and Language Processing、15巻、7号、2141-2150頁、2007年9月 M. M. Goodwin and J. M. Jot、「空間オーディオ符号化および強調のための主要アンビエント信号分解およびベクトルベースの局所化」、Proc. Of ICASSP 2007、2007年 C. Faller、「高指向性2カプセルベースマイクロフォンシステム」、Preprint 123rd Conv. Aud. Eng. Soc.、2007年10月 Juha Merimaa and Ville Pulkki、「空間インパルス応答レンダリング」、Proc. of the 7th Int. Conf. on Digital Audio Effects (DAFx'04)、2004年 Ville Pulkki、「方向オーディオ符号化による空間サウンド再生」、Journal of the Audio Engineering Society、55号、6号、503-516頁、2007年6月 Julia Jakka、バイノーラルから多重チャンネルへのアップミックス、ヘルシンキ工科大学、博士論文、修士論文、2005年 Boaz Rafaely、「反響する音場における空間最適ウィーナーフィルタリング」、IEEE Workshop on Applications of Signal Processing to Audio and Acoustics 2001、2001年10月21-24日、New Paltz, New York Richard K. Cook, R. V. Waterhouse, R. D. Berendt, Seymour Edelman, and Jr. M.C. Thompson、「反響する音場における相関係数の測定」、Journal Of The Acoustical Society Of America、27巻、6号、1072-1077頁、1955年11月 Richard O. Duda and William L. Martens、「球状ヘッドモデルの応答のレンジ依存」、Journal Of The Acoustical Society Of America、104巻、5号、3048-3058頁、1998年11月 Brian R. Glasberg and Brian C. J. Moore、「ノッチノイズデータからの聴覚フィルタシェイプの導出」、Hearing Research、47巻、103-138頁、1990年
本発明の目的は、入力信号を分解する改良されたコンセプトを提供することである。
この目的は、請求項1にかかる入力信号を分解する装置、請求項14にかかる入力信号を分解する方法、または請求項15にかかるコンピュータプログラムによって達成される。
本発明は、信号解析が、参照曲線として予め計算された周波数依存類似度曲線に基づいて実行されるとき、信号分解の目的に対して特別な効率性が得られるという発見に基づいている。用語「類似度」は、相関とコヒーレンスを含み、ここで、−厳格な−数学的センスにおいて、相関は、2つの信号間で付加的な時間シフトなしに計算され、コヒーレンスは、信号が最大の相関を有するように2つの信号を時間/位相においてシフトすることによって計算され、周波数上の実際の相関は、適用される時間/位相シフトによってそのとき計算される。このテキストに対して、類似度、相関およびコヒーレンスは、同じこと、すなわち2つの信号間の定量的な類似度の程度を意味すると考えられ、例えば、高い絶対値の類似度は2つの信号がより類似することを意味し、低い絶対値の類似度は2つの信号がより類似しないことを意味する。
曲線は、直接的な比較演算および/または重み係数の計算に対して用いることができるので、参照曲線のような相関曲線の使用は、非常に効率的に実施できる解析を可能とすることが示されている。予め計算された周波数依存相関曲線の使用は、より複雑なウィーナーフィルタリング演算よりもむしろ簡単な計算のみを実行することを可能とする。さらにまた、問題の解決を得るために現在のセットアップからできる限り多くの情報が導入されるので、周波数依存相関曲線のアプリケーションは、問題が統計的な観点から対処されるのではなく、より解析的な方法で対処されるという事実により特に有用である。加えて、参照曲線は多くの異なる方法によって得ることができので、この手続の柔軟性は非常に高い。一つの方法は、特定のセットアップにおける2つ以上の信号を実際に測定し、そして測定された信号から周波数上の相関曲線を計算することである。それ故、異なるスピーカから独立信号を、または予め知られた一定程度の従属性を有する信号を放射することができる。
他の好ましい変形例は、独立信号の仮定下で、単に相関曲線を計算することである。この場合、結果は信号と独立しているので、いかなる信号も実際には必要でない。
信号解析に対して参照曲線を用いた信号分解は、ステレオ処理に対して、すなわちステレオ信号の分解に対して適用することができる。あるいは、この手続は、多重チャンネル信号を分解するダウンミキサーとともに実施することもできる。あるいは、この手続は、階層的な方法において信号のペア毎の評価が予想されるとき、多重チャンネル信号に対してダウンミキサーを用いることなく実施することもできる。
さらなる実施例において、多重チャンネル信号の分解に対して、入力信号によって直接に、すなわち少なくとも3つの入力チャンネルを有する信号によって、異なる信号成分に関する解析を実行しないことが有効なアプローチである。その代わりに、少なくとも3つの入力チャンネルを有する多重チャンネル入力信号は、入力信号をダウンミックスしてダウンミックス信号を取得するダウンミキサーによって処理される。ダウンミックス信号は、入力チャンネル数より小さい、好ましくは2つのダウンミックスチャンネル数を有する。そのとき、入力信号の解析は、入力信号に関して直接よりも、ダウンミックス信号に関して実行され、解析は解析結果に帰着する。しかしながら、この解析結果はダウンミックス信号に適用されないが、入力信号、または、代替として、入力信号から導き出された信号に適用される。ここで、この入力信号から導き出される信号は、アップミックス信号とすることができるか、または、入力信号のチャンネル数に依存して、ダウンミックス信号とすることもできるが、入力信号から導き出されるこの信号は、解析が実行されたダウンミックス信号からは異なる。例えば、入力信号が5.1のチャンネル信号であるケースが考慮されるとき、解析が実行されるダウンミックス信号は、2チャンネルを有するステレオダウンミックスであるかもしれない。解析結果は、そのとき、直接5.1入力信号に直接に、7.1出力信号のような高いアップミックスに、または、3チャンネルオーディオレンダリング装置のみが手元にあるとき、例えば左チャンネル、中央チャンネルおよび右チャンネルの3チャンネルのみを有する入力信号の多重チャンネルダウンミックスに適用される。しかしながら、いずれにせよ、信号処理器によって解析結果が適用される信号は、解析が実行され、信号成分に関して解析が実行されるダウンミックス信号よりも通常は多いチャンネルを有するダウンミックス信号からは異なる。
ダウンミックスは、通常は異なる方法における入力チャンネルの追加から構成されるので、個々の入力チャンネルにおけるいかなる信号成分もダウンミックスチャンネルにおいて生ずると仮定することができるという事実により、いわゆる「間接的な」解析/処理が可能である。1つの簡単なダウンミックスは、例えば、個々の入力チャンネルがダウンミックスルールまたはダウンミックスマトリクスによって要求されるように重み付けされ、重み付けされた後に一緒に加算される。代替のダウンミックスは、HRTFフィルタのような特定のフィルタによって入力チャンネルをフィルタリングすることから構成され、ダウンミックスは、フィルタリングされた信号、すなわち、先行技術において知られたようなHRTFフィルタによってフィルタリングされた信号を用いることによって実行される。5チャンネルの入力信号に対して10個のHRTFフィルタを必要とし、左辺/左耳に対するHRTFフィルタ出力は一緒に加算され、右チャンネルフィルタに対するHRTFフィルタ出力は右耳に対して一緒に加算される。代替のダウンミックスは、信号解析器において処理されなければならないチャンネル数を減らすために適用することができる。
それ故、本発明の実施形態は、解析信号を考慮することによって任意の入力信号から知覚的に識別可能な成分を抽出し、その一方で解析の結果が入力信号に適用される新規なコンセプトを記述する。このような解析信号は、例えば、チャンネルまたはスピーカ信号から耳への伝播モデルを考慮することによって得ることができる。これは、人間の聴覚システムも音場を評価するために単に2つのセンサ(左右の耳)を用いるという事実によってある程度動機づけられる。このように、知覚的に識別可能な成分の抽出は、以下においてダウンミックスとして表される解析信号の考慮に基本的に低減される。この文書の全体にわたって、用語「ダウンミックス」は、解析信号(これは、例えば、伝搬モデル、HRTF、BRIR、単純なクロスファクタダウンミックスを含むことができる)に結果としてなる多重チャンネル信号のいかなる前処理に対しても用いられる。
与えられた入力のフォーマットおよび抽出される信号の要求される特性を知っていると、理想的なチャンネル間の関係は、ダウンミックスフォーマットなどに対して定めることができ、この解析信号の解析は、多重チャンネル信号の分解に対する重みづけマスク(または多重の重みづけマスク)を生成するのに十分である。
実施形態において、多重チャンネルの問題は、サラウンド信号のステレオダウンミックスを用い、ダイレクト/アンビエント解析をダウンミックスに適用することによって、簡単化される。その結果、すなわちダイレクトサウンドおよびアンビエントサウンドの短時間パワースペクトル推定に基づいて、Nチャンネルの信号をN個のダイレクトサウンドとN個のアンビエントサウンドのチャンネルに分解するためのフィルタが導き出される。
本発明は、信号解析がより小さいチャンネル数に適用され、必要な処理時間を有意に低減するという事実により有利であり、その結果、本発明のコンセプトは、アップミックスするまたはダウンミックスするまたは信号の知覚的に異なる成分のような異なる成分が必要とされるいかなる他の信号処理演算に対するリアルタイムアプリケーションにおいてさえも適用することができる。
本発明の更なる利点は、ダウンミックスが実行されるにもかかわらず、これが入力信号における知覚的に識別可能な成分の検出性を悪化させないことが判っていることである。換言すると、入力チャンネルがダウンミックスされるときでさえも、個々の信号成分は、それでも大部分は分離することができる。さらにまた、ダウンミックスは、全ての入力チャンネルの全ての信号成分の2つのチャンネルへの一種の「収集(collection)」として動作し、これらの「収集された」ダウンミックス信号に関して適用される単一の解析は、もはや解釈される必要がなく、信号処理に対して直接用いることができるユニークな結果を提供する。
本発明の好ましい実施態様は、以下の付随する図面に関して引き続いて記述される。
ダウンミキサーを用いて入力信号を分解する装置を示すブロック図である。 本発明の更なる態様による予め計算された周波数依存相関曲線による解析器を用いた少なくとも3つの入力チャンネル数を有する信号を分解する装置の実施態様を示すブロック図である。 ダウンミックス、解析および信号処理に対して周波数ドメイン処理を有する本発明の更なる好ましい実施態様を示す。 図1または図2に示された解析のための参照曲線に対する例示的な予め計算された周波数依存相関曲線を示す。 独立成分を抽出するための更なる処理を示すブロック図である。 独立した拡散成分、独立したダイレクト成分およびダイレクト成分が抽出される更なる処理に対する実施態様のブロック図を示す。 解析信号生成器としてダウンミキサーを実装するブロック図を示す。 図1または図2の信号解析器における好ましい処理方法を示すフローチャートを示す。 異なる数および位置の音源(スピーカのような)を有するいくつかの異なるセットアップに対して参照曲線として用いることができる、異なる予め計算された周波数依存相関曲線を示す。 異なる数と位置の音源(スピーカのような)を有するいくつかの異なるセットアップに対して参照曲線として用いることができる、異なる予め計算された周波数依存相関曲線を示す。 異なる数と位置の音源(スピーカのような)を有するいくつかの異なるセットアップに対して参照曲線として用いることができる、異なる予め計算された周波数依存相関曲線を示す。 異なる数と位置の音源(スピーカのような)を有するいくつかの異なるセットアップに対して参照曲線として用いることができる、異なる予め計算された周波数依存相関曲線を示す。 異なる数と位置の音源(スピーカのような)を有するいくつかの異なるセットアップに対して参照曲線として用いることができる、異なる予め計算された周波数依存相関曲線を示す。 拡散成分が分解される成分である拡散推定に対する他の実施形態を示すブロック図を示す。 周波数依存相関曲線なしに、ウィーナーフィルタリングアプローチによって信号解析を適用する実施例の式を示す。 周波数依存相関曲線なしに、ウィーナーフィルタリングアプローチによって信号解析を適用する実施例の式を示す。
図1は、少なくとも3つの入力チャンネル数、一般的にはN個の入力チャンネルを有する入力信号10を分解する装置を示す。これらの入力チャンネルは、ダウンミックス信号14を取得するために入力信号をダウンミックスするダウンミキサー12に入力され、ダウンミキサー12は、「m」で示されるダウンミックス信号14のダウンミックスチャンネル数が、少なくとも2つで、入力信号10の入力チャンネルの数よりも小さいようにダウンミックスするように構成される。m個のダウンミックスチャンネルは、解析結果18を導き出すためにダウンミックス信号を解析する解析器16に入力される。解析結果18は、入力信号10、または解析結果を用いて信号導出器22によって入力信号から導き出された信号を処理するように構成される信号処理器20に入力され、信号処理器20は、入力チャンネルまたは入力信号から導き出された信号24のチャンネルに解析結果を適用し、分解された信号26を取得するように構成される。
図1に示された実施形態において、入力チャンネル数はnであり、ダウンミックスチャンネル数はmであり、導き出されたチャンネル数はlであり、入力信号よりもむしろ導き出された信号が信号処理器によって処理されるとき、出力チャンネル数はlに等しい。あるいは、信号導出器22が存在しないとき、入力信号は、信号処理器によって直接処理され、図1において「l」によって示される分解された信号26のチャンネル数はnに等しくなる。それ故、図1は2つの異なる実施例を示す。1つの実施例は、信号導出器22を有さず、入力信号は信号処理器20に直接適用される。他の実施例は、信号導出器22が実装され、入力信号10よりもむしろ導き出された信号24が信号処理器20によって処理される。信号導出器は、例えば、より多くの出力チャンネルを生成するアップミキサーのようなオーディオチャンネルミキサーとすることができる。この場合、lはnより大きい。他の実施形態では、信号導出器は、入力チャンネルに対して重みづけ、遅延または他に何かを実行する他のオーディオ処理器とすることができ、この場合、信号導出器22の出力チャンネル数lは入力チャンネル数nに等しい。更なる実施態様において、信号導出器は、入力信号から、導き出された信号までチャンネル数を低減するダウンミキサーとすることができる。この実施態様において、本発明の利点の1つを有するために、すなわち信号解析がより少ないチャンネル信号数に適用されるために、lはダウンミックスチャンネル数mよりもなお大きいことが好ましい。
解析器は、知覚的に識別可能な成分に関してダウンミックス信号を解析するために動作する。これらの知覚的に識別可能な成分は、一方では個々のチャンネルにおいて独立な成分とすることができ、他方では従属する成分とすることができる。本発明によって解析される代替の信号成分は、一方ではダイレクト成分であり、他方ではアンビエント成分である。ここでは、異なる楽器等によって提供される多重ピッチ信号成分における、音楽成分からの音声成分、音声成分からのノイズ成分、音楽成分からのノイズ成分、低周波ノイズ成分に関する高周波ノイズ成分のような、本発明によって分離することができる多くの他の成分がある。これは、図11a、11bの文脈において述べられるウィーナーフィルタリングのような強力な解析ツール、または本発明による例えば図8の文脈において述べられる周波数依存相関曲線を用いるような他の解析手続があるという事実による。
図2は、解析器が、予め計算された周波数依存相関曲線16を用いるために実装される他の態様を示す。このように、複数のチャンネルを有する信号28を分解する装置は、例えば、図1の文脈において示されたようなダウンミックス演算によって、入力信号と同一のまたは入力信号に関連する解析信号の2つのチャンネル間の相関を解析する解析器16を備える。解析器16によって解析された解析信号は、少なくとも2つの解析チャンネルを有し、解析器16は、解析結果18を決定するために、参照曲線として予め計算された周波数依存相関曲線を用いるように構成される。信号処理器20は、図1の文脈において述べられたのと同じ方法で動作することができ、解析信号、または信号導出器22によって解析信号から導き出された信号を処理するように構成され、信号導出器22は、図1の信号導出器22の文脈において述べられたのと同様に実施することができる。あるいは、信号処理器は、それから解析信号が導き出される信号を処理することができ、信号処理は、分解された信号を取得するために解析結果を用いる。それ故、図2の実施形態においては、入力信号は解析信号と同一とすることができ、この場合に、解析信号は、図2に示されたようなちょうど2つのチャンネルを有するステレオ信号とすることもできる。あるいは、解析信号は、入力信号から、図1の文脈において記載されたダウンミックスのようないかなる種類の処理によっても、あるいはアップミックスのような他のいかなる処理などによっても導き出すことができる。加えて、信号処理器20は、解析器に入力されたのと同じ信号に信号処理を適用するのに有用とすることができ、すなわち、信号処理器は、図1の文脈において示されたような、それから解析信号が導き出される信号に信号処理を適用することができるか、または信号処理器は、アップミックスなどによる解析信号から導き出された信号に信号処理を適用することができる。
それ故、信号処理器に対して異なる可能性が存在し、これらの全ての可能性は、解析結果を決定するために参照曲線として予め計算された周波数依存相関曲線を用いる解析器のユニークな演算により有利である。
引き続いて、更なる実施形態が述べられる。図2の文脈において述べられたように、2チャンネルの解析信号(ダウンミックスなし)の使用さえ考慮される点に留意する必要がある。それ故、図1および図2の文脈において異なる態様で述べられたように、一緒にまたは分離した態様として用いることができる本発明は、ダウンミックスは解析器によって処理することができるか、または、ダウンミックスによっておそらく生成されなかった2チャンネルの信号は信号解析器によって予め計算された参照曲線を用いて処理することができる。この文脈において、実施態様の引き続く記載は、特定の特徴が両方の態様よりもむしろ1つの態様に対してのみに記載されているときでさえも、図1および図2に概略的に示された両方の態様に対して適用することができる点に留意する必要がある。例えば、図3が考慮される場合、図3の周波数ドメインの特徴が図1に示された態様の文脈において記載されていることは明らかとなるが、図3に関して引き続いて記載されるような時間/周波数変換および逆変換は、ダウンミキサーを有しないが、予め計算された周波数依存相関曲線を用いる特定の解析器を有する図2の実施に対しても適用することができることは明らかである。
特に、解析信号が解析器に入力される前に、時間/周波数変換器が解析信号を変換するために置かれ、処理された信号を時間ドメインに戻すために、周波数/時間変換器が信号処理器の出力に置かれる。信号導出器が存在するとき、信号導出器、解析器および信号処理器が、全て周波数/サブバンドドメインにおいて動作するように、時間/周波数変換器が信号導出器の入力に置かれるであろう。この文脈において、周波数サブバンドは、周波数表現の周波数における部分を基本的に意味する。
図1における解析器は、さらに多くの異なる方法で実施できることは明らかであるが、この解析器は、一実施形態において、図2において述べられた解析器、すなわち、ウィーナーフィルタリングまたは他のいかなる解析法にも代わるものとして、予め計算された周波数依存相関曲線を用いる解析器としても実施される。
図3の実施形態は、2チャンネル表現を取得するために、ダウンミックス手続を任意の入力信号に適用する。図3に示されるように、時間−周波数ドメインにおける解析が実行され、入力信号の時間周波数表現によって掛け合わされた重みづけマスクが計算される。
図において、T/Fは、時間周波数変換、一般に短時間フーリエ変換(STFT)を表す。iT/Fは、それぞれの逆変換を表す。[x1(n),…,xN(n)]は、時間ドメインの入力信号であり、ここで、nは時間インデックスである。[X1(m,i),…,XN(m,i)]は、周波数分解の係数を表し、ここで、mは分解の時間インデックスであり、iは分解の周波数インデックスである。[D1(m,i),D2(m,i)]は、2つのチャンネルのダウンミックスされた信号である。
Figure 0005595602
W(m,i)は、計算された重みである。[Y1(m,i),…,YN(m,i)]は、各チャンネルの重みづけられた周波数分解である。Hij(i)は、ダウンミックス係数であり、実数値または複素数値とすることができ、この係数は時間的に一定または可変とすることができる。それ故、ダウンミックス係数は、ちょうど定数とすることができるか、または、HRTFフィルタ、残響フィルタまたは類似するフィルタのようなフィルタとすることができる。
Figure 0005595602
図3において、全てのチャンネルに対して同じ重みが適用されるケースが描かれている。
Figure 0005595602
[y1(n),…,yN(n)]は、抽出された信号成分を備える時間ドメインの出力信号である。(入力信号は、任意のターゲット再生スピーカセットアップに対して生成される任意のチャンネル数(N)を有することができる。ダウンミックスは、耳入力信号、聴覚フィルタのシミュレーション、その他を取得するために、HRTFを含むことができる。ダウンミックスは、時間ドメインにおいても実行することができる。)
実施形態において、参照相関の間の差異(この文書を通して、用語「相関」は、チャンネル間の類似度に対する同義語として用いられ、用語「コヒーレンス」に対して通常用いられる時間シフトの評価を含むことができる。時間シフトが評価される場合でさえも、結果として生ずる値は符号を有することができる。一般に、コヒーレンスは、正値だけを有するように定められる)は、周波数の関数(cref(ω))であり、ダウンミックス入力信号の実際の相関(csig(ω))が演算される。参照曲線からの実際の曲線の偏差に依存して、それが従属成分または独立成分を備えるかどうかを示す各時間−周波数タイルに対する重み係数が計算される。取得された時間−周波数重みは、独立成分を表し、識別可能であるまたは拡散であるとして知覚することができる独立部分を含む多重チャンネル信号(チャンネル数は入力チャンネル数に等しい)をもたらすために、入力信号の各チャンネルにすでに適用することができる。
参照曲線は、異なる方法で定めることができる。例えば、
・独立成分からなる理想化された2次元または3次元の拡散音場に対する理想的な理論上の参照曲線
・与えられた入力信号に対する参照ターゲットスピーカセットアップ(例えば、方位角(±30°)を有する標準ステレオセットアップまたは方位角(0°,±30°,±110°)を有するITU−R BS.775による標準5チャンネルセットアップ)によって達成可能な理想的な曲線
・実際に提示されたスピーカセットアップに対する理想的な曲線(実際の位置は測定することができるかまたはユーザー入力によって知ることができる。参照曲線は、与えられたスピーカにわたる独立信号の再生を仮定して計算することができる。)
・各入力チャンネルの実際の周波数依存短時間パワーは、参照の演算に組み入れることができる。
周波数依存参照曲線(cref(ω))が与えられると、上側閾値(chi(ω))と下側閾値(clo(ω))を定めることができる(図4を参照)。閾値曲線は、参照曲線と一致することができる(cref(ω)=chi(ω)=clo(ω))か、または、可検出閾値を仮定して定めることができるか、または発見的に導き出すことができる。
参照曲線からの実際の曲線の偏差が閾値によって与えられる境界内にある場合、実際のビンは、独立成分を示す重みを得る。上側閾値より上または下側閾値より下では、ビンは従属として表される。この表示は、バイナリーとすることができるか、または段階的(すなわち、ソフト判定関数に従う)とすることができる。特に、上側閾値および下側閾値が参照曲線と一致する場合、適用される重みは参照曲線からの偏差に直接関係する。
図3に関して、参照符号32は、短時間フーリエ変換として、またはQMFフィルタバンクなどのようなサブバンド信号を生成するいかなる種類のフィルタバンクとしても実施することができる時間/周波数変換器を示す。時間/周波数変換器32の詳細な実施とは独立して、時間/周波数変換器の出力は、各入力チャンネルxiに対する、入力信号の各時間周期のスペクトルである。それ故、時間/周波数処理器32は、個々のチャンネル信号の1ブロックの入力サンプルを常にとり、低周波数から高周波数まで延びているスペクトル線を有するFFTスペクトルのような周波数表現を計算するように実施することができる。次に、次の時間ブロックに対して、同じ手続が実行され、その結果、各入力チャンネル信号に対して一連の短時間スペクトルが最終的に計算される。入力チャンネルの特定のブロックの入力サンプルに関する特定の周波数範囲の特定のスペクトルは、「時間/周波数タイル」と呼ばれ、好ましくは、解析器16における解析は、これらの時間/周波数タイルに基づいて実行される。それ故、解析器は、1つの時間/周波数タイルに対する入力として、第1のダウンミックスチャンネルD1の特定のブロックの入力サンプルに対する第1の周波数におけるスペクトル値を受信し、第2のダウンミックスチャンネルD2の同じ周波数および同じブロック(時間において)に対する値を受信する。
次に、図8に示される実施例として、解析器16は、サブバンドおよび時間ブロック毎の2つの入力チャンネル間の相関値、すなわち時間/周波数タイルに対する相関値、を決定する(80)ように構成される。次に、解析器16は、図2または図4に関して示された実施形態において、参照相関曲線から対応するサブバンドに対する相関値を読み出す(82)。例えば、サブバンドが図4において40で示されるサブバンドであるとき、ステップ82は、−1と+1の間の相関を示す値41に結果としてなり、値41は、そのとき読み出された相関値である。次に、ステップ83において、サブバンドに対する結果は、ステップ80から決定された相関値およびステップ82において取得された読み出された相関値41を用いて、比較および引き続く判定を実行することによってなされるか、または実際の差分を計算することによってなされる。結果は、前に述べられたように、ダウンミックス/解析信号において考慮された実際の時間/周波数タイルが独立成分を有するというバイナリーの結果とすることができる。この判定は、実際に判定された相関値(ステップ80における)が参照相関値に等しいかまたは参照相関値に非常に近いときになされる。
しかしながら、判定された相関値が参照相関値より高い絶対値の相関を示すと判定されたとき、考慮中の時間/周波数タイルは従属成分を備えると判定される。それ故、ダウンミックスまたは解析信号の時間/周波数タイルの相関が参照曲線より高い絶対値の相関値を示すとき、この時間/周波数タイルにおける成分はお互いに従属しているということができる。しかしながら、相関が参照曲線に非常に近いことが示されるとき、成分は独立しているということができる。従属成分は「1」のような第1の重み値を受信することができ、独立成分は「0」のような第2の重み値を受信することができる。好ましくは、図4に示されたように、単独で参照曲線を用いるよりも適した良好な結果を提供するために、基準線から離れて配置されている上下の閾値が用いられる。
さらに、図4に関して、相関は−1と+1の間で変化することができる点に留意する必要がある。負の符号を有する相関は、信号間の180°の位相シフトを付加的に示す。それ故、0と1の間でのみ延びている他の相関を同様に適用することができ、そこでは相関の負の部分は単に正にされる。この手続においては、相関の判定の目的に対して、時間シフトまたは位相シフトを無視する。
結果を計算する代替方法は、ブロック80において決定された相関値とブロック82において取得された読み出された相関値の間の距離を実際に計算し、それから距離に基づいて重み係数として0と1の間の基準値を決定することである。図8における第1の変形例(1)は、0または1の値にのみ結果としてなるのに対して、可能性(2)は、好ましくは、いくつかの実施態様において、0と1の間の値に結果としてなる。
図3における信号処理器20は、乗算器として示され、図8において84で示されるように、解析結果は、ちょうど解析器から信号処理器まで転送され、入力信号10の対応する時間/周波数タイルに適用される決定された重み係数である。例えば実際に考慮されたスペクトルが、一連のスペクトルにおける第20番目のスペクトルであるとき、そして実際に考慮された周波数ビンがこの第20番目のスペクトルの第5番目の周波数ビンであるとき、時間/周波数タイルは(20、5)として表すことができる(ここで、第1の数は時間におけるブロック番号を示し、第2の数はこのスペクトルにおける周波数ビンを示す)。次に、時間/周波数タイル(20、5)に対する解析結果は、図3における入力信号の各チャンネルの対応する時間/周波数タイル(20、5)に適用されるか、または、図1に示されたように信号導出器が実装されるとき、導き出された信号の各チャンネルの対応する時間/周波数タイルに適用される。
引き続いて、参照曲線の計算が更に詳細に述べられる。しかしながら、本発明に対して、参照曲線がどのように導き出されたかは基本的に重要でない。それは、任意の曲線、すなわち、例えば、ダウンミックス信号Dにおける入力信号xj、または図2の文脈における解析信号の理想的なまたは所望の関係を示すルックアップテーブルにおける値とすることができる。以下の導出は例示である。
音場の物理的な拡散は、Cook他(非特許文献10)により導入された方法によって評価することができ、以下の式(4)に示されるように、2つの空間的に分離されたポイントにおける平面波の定常状態の音圧の相関係数(r)を利用する。
Figure 0005595602
ここで、p1(n)とp2(n)は2つのポイントでの音圧測定値であり、nは時間インデックスであり、<・>は時間平均を表す。定常状態の音場において、以下の関係を導き出すことができる。
Figure 0005595602
ここで、dは2つの測定ポイント間の距離であり、k=2π/λは波数である(ここでλは波長)。(物理的参照曲線r(k,d)は、更なる処理に対して、既にcrefとして用いることができる。)
音場の知覚的な拡散に対する尺度は、音場で測定された両耳間の相互相関係数(ρ)である。測定することは、圧力センサ(それぞれの耳の)間の半径が固定されることを意味する。この制限を含むことで、rはラジアン周波数ω=kcによる周波数の関数になる(ここで、cは空気中の音速である)。さらにまた、圧力信号は、リスナーの耳介、頭部および胴部によって生じる反射、回折およびベンディング効果により、前に考慮された自由音場信号とは異なる。空間聴覚に対して本質的なそれらの効果は、頭部関連伝達関数(HRTF)によって記述される。それらの影響を考慮すると、耳の入口で結果として生じる圧力信号は、pL(n,ω)とpR(n,ω)である。その計算に対して、測定されたHRTFデータを用いることができるか、または、解析モデル(例えば、非特許文献11)を用いて近似を取得することができる。
人間の聴覚システムは限られた周波数選択性を有する周波数解析器として作用するので、さらに、この周波数選択性を組み込むことができる。聴覚フィルタは、オーバーラップするバンドパスフィルタのように振る舞うとみなされる。以下の実施例の説明において、矩形フィルタによってこれらのオーバーラップするバンドパスを近似するために、クリチカルバンドアプローチが用いられる。等価な矩形のバンド幅(ERB)は、中心周波数の関数として計算することができる(非特許文献12)。バイノーラル処理が聴覚フィルタリングに従うことを考慮して、ρは、以下の周波数依存圧力信号を生ずる分離した周波数チャンネルに対して計算されなければならない。
Figure 0005595602
ここで、積分の範囲は実際の中心周波数に従ってクリチカルバンドの境界によって与えられる。係数1/b(ω)は、式(7)および(8)において用いても用いなくてもよい。
音圧測定の1つが、周波数に独立な時間差によって進められるまたは遅らされる場合、信号のコヒーレンスを評価することができる。人間の聴覚システムは、このような時間アラインメント特性を用いることが可能である。通常、両耳間のコヒーレンスは、±1ms内で計算される。利用可能な処理パワーに依存して、計算は、遅延ゼロ値(低い複雑性に対して)、または時間前進および遅延を有するコヒーレンス(高い煩雑性が可能である場合)のみを用いて実施することができる。以下においては、両方のケースの間で区別はなされない。
理想的な挙動は、理想的な拡散音場を考慮して達成され、それは全方向に伝搬する等しく強い、無相関の平面波からなる波動場(すなわち、ランダムな位相関係および一様に分布する伝搬方向を有する無限数の伝搬する平面波の重畳)として理想化することができる。スピーカによって放射される信号は、十分に遠くに位置するリスナーに対する平面波と考えることができる。この平面波の仮定は、スピーカ上の立体音響再生において一般的である。このように、スピーカによって再生される合成音場は、限定された数の方向からの寄与する平面波から構成される。
スピーカ位置[l1,l2,l3, ... ,lN]によるセットアップ上の再生に対して生成されるNチャンネルを有する入力信号が与えられる(水平のみの再生セットアップのケースでは、liは方位角を示す。一般的なケースにおいて、li=(方位、高低)はリスナーの頭部に対するスピーカの位置を示す。リスニングルームに存在するセットアップが参照セットアップと異なる場合、liは、実際の再生セットアップのスピーカ位置を代わりに表現することができる。)。この情報によって、拡散音場シミュレーションに対する両耳間コヒーレンス参照曲線ρrefは、独立信号が各スピーカに供給されるという仮定下で、このセットアップに対して計算することができる。各時間−周波数タイルにおいて各入力チャンネルに寄与する信号パワーは、参照曲線の計算に含めることができる。実施例の実施において、ρrefは、crefとして用いられる。
周波数依存参照曲線または相関曲線に対する実施例としての異なる参照曲線は、図9a〜9eにおいて、異なる数の音源に対して、図に示されるように異なる音源の位置および異なる頭部方位において示される。
引き続いて、図8の文脈において述べられたような参照曲線に基づく解析結果の計算が、より詳細に述べられる。
目標は、独立信号が全てのスピーカから再生されるという仮定下で、ダウンミックスチャンネルの相関が、計算された参照相関に等しい場合に、1に等しい重みを導き出すことである。ダウンミックスの相関が+1または−1に等しい場合に、導き出される重みは、独立成分が存在しないことを示す、0でなければならない。それらの極端なケースの間において、重みは、独立している(W=1)または完全に従属している(W=0)ような表示の間で合理的な遷移を表現しなければならない。
参照相関曲線cref(ω)と、実際の再生セットアップ上で再生される実際の入力信号の相関/コヒーレンスの推定csig(ω)(csigは、ダウンミックスの相関のそれぞれのコヒーレンスである)が与えられると、csig(ω)のcref(ω)からの偏差を計算することができる。この偏差(おそらくは、上下の閾値を含む)は、独立成分を切り離すために全ての入力チャンネルに適用される重み(W(m,i))を取得するため、範囲[0;1]にマッピングされる。
以下の実施例は、閾値が参照曲線に対応するときに可能なマッピングを示す。
実際の曲線csigの参照曲線crefからの偏差(Δで表される)の大きさは、次式によって与えられる。
Figure 0005595602
相関/コヒーレンスが[−1;+1]の間で制限されると、+1または−1に対する最大限可能な偏差は、各周波数に対して、次式で与えられる。
Figure 0005595602
各周波数に対する重みは、従って次式から取得される。
Figure 0005595602
周波数分解の時問依存性および限られた周波数分解能を考慮すると、重み値は、以下のように導き出される。(ここで、時間上で変化することができる参照曲線の一般的なケースが与えられる。時間独立参照曲線(すなわち、cref(i))も可能である。)
Figure 0005595602
このような処理は、計算量の理由のために、そしてより短いインパルス応答を有するフィルタを取得するために、知覚的に動機づけられたサブバンドに分類される周波数係数による周波数分解において実行することができる。さらにまた、平滑フィルタを適用することができ、そして圧縮関数(すなわち、所望の方法で重みを歪め、付加的に最小および/または最大の重み値を導入する)を適用することができる。
図5は、ダウンミキサーがHRTFおよび聴覚フィルタを用いて実施される本発明の更なる実施態様を示す。さらに、図5は、解析器16によって出力される解析結果が、各時間/周波数ビンに対する重み係数であることを付加的に示し、信号処理器20は、独立成分を抽出する抽出器として示される。そのとき、処理器20の出力は、再びNチャンネルであるが、各チャンネルは、ここで独立成分のみを含み、いかなる従属成分も含まない。この実施態様において、解析器は、図8の第1の実施態様において、独立成分が1の重み値を受信し、従属成分が0の重み値を受信するように、重みを計算する。そのとき、処理器20によって処理される、従属成分を有するオリジナルのNチャンネルにおける時間/周波数タイルは、0にセットされる。
その他の変形例においては、図8において0と1の間の重み値があり、解析器は、参照曲線までの距離が小さい時間/周波数タイルは高い値(より1に近い)を受信し、参照曲線までの距離が大きい時間/周波数タイルは小さい重み係数(より0に近い)を受信するように、重みづけを計算する。例えば、図3の20において示された引き続く重みづけにおいて、独立成分はそのとき増幅され、一方で従属成分は減衰される。
しかしながら、信号処理器20が独立成分を抽出しないが、従属成分を抽出するように実施されるとき、重みは、図3に示された乗算器20において重みづけが実行されるときに、独立成分が減衰され、従属成分が増幅されるように、反対に割り当てられる。それ故、各信号処理器は、実際に抽出された信号成分の判定が重み値の実際の割り当てによって決定されるので、信号成分の抽出に対して適用することができる。
図6は、発明コンセプトの更なる実施態様を示し、ここでは処理器20の異なる実施態様を有する。図6の実施形態において、処理器20は、独立の拡散部分、独立のダイレクト部分、およびダイレクト部分/成分自体を抽出するように実施される。
分離された独立成分(Y1,…,YN)から、包囲する/アンビエント音場の知覚に寄与する部分を取得するため、更なる制約条件を考慮しなければならない。一つのそのような制約条件は、包囲するアンビエントサウンドが各方向から等しく強いという仮定とすることができる。従って、包囲するアンビエント信号を取得するために(それは、高い数のアンビエントチャンネルを取得するために、更に処理することができる)、例えば、独立のサウンド信号のあらゆるチャンネルにおける各時間−周波数タイルの最小限のエネルギーを抽出することができる。
実施例:
Figure 0005595602
ここで、Pは、短時間パワー推定を表す。(この実施例は、最も単純なケースを示す。適用することができない一つの明白な例外的ケースは、1つのチャンネルがこのチャンネルにおけるパワーが非常に低いまたはゼロである信号休止期間を含むときである。)
いくつかのケースにおいては、全ての入力チャンネルの等しいエネルギー部分を抽出し、この抽出されたスペクトルのみを用いて重みを計算することが有益である。
Figure 0005595602
抽出された従属部分(それらは、例えば、Ydependent=Yj(m,i)−Xj(m,i)として導き出すことができる)は、チャンネルの従属性を検出し、入力信号において固有の方向キューを推定するなどし、例えばリパニングのような更なる処理を許容するために用いることができる。
図7は、一般的なコンセプトの変形例を表す。Nチャンネルの入力信号は、解析信号発生器(ASG)に供給される。Mチャンネルの解析信号の生成は、例えば、チャンネル/スピーカから耳への伝搬モデル、またはこの文書を通してダウンミックスとして表される他の方法を含むことができる。識別可能な成分の表示は、解析信号に基づいている。異なる成分を示すマスクは、入力信号に適用される(A抽出/D抽出(20a、20b))。重みづけられた入力信号は、特定の性質を有する出力信号を得るために、更に処理することができ(A後処理/D後処理(70a、70b))、ここで、この実施例においては、表記「A」と「D」は、抽出される成分が「アンビエントサウンド」と「ダイレクトサウンド」のいずれかを示すように選定されている。
引き続いて、図10が記述される。定常的な音場は、サウンドエネルギーの方向分布が方向に依存しない場合に、拡散と呼ばれる。方向エネルギー分布は、高い指向性のマイクロフォンを用いて全ての方向を測定することによって評価することができる。室内音響において、包囲空間において反響する音場は、拡散音場としてしばしばモデル化される。拡散音場は、全方向に伝搬する等しく強い、無相関の平面波から成る波動場として理想化することができる。この種の音場は、等方性で、均一である。
エネルギー分布の均一性に特に関心がある場合、2つの空間的に分離された位置における定常状態の音圧P1(t)とP2(t)の2点間の相関係数
Figure 0005595602
は、音場の物理的な拡散を評価するために用いることができる。正弦波音源によって引き起こされる想定上の理想的な三次元および二次元の定常状態の拡散音場に対して、以下の関係を導き出すことができる。
Figure 0005595602
ここで、k=2π/λ(ここでλ=波長)は波数であり、dは測定ポイントの間の距離である。これらの関係が与えられると、音場の拡散は、測定データを参照曲線と比較することによって評価することができる。理想的な関係のみが必要であるが、充分な条件でないので、マイクロフォンが接続される異なる方位の軸による多くの測定を考慮することができる。
音場におけるリスナーを考慮して、音圧測定は、耳入力信号pl(t)とpr(t)によって与えられる。従って、測定ポイント間の想定された距離dは固定され、rは、f=kc/2π(ここで、cは大気の音速である)による周波数のみの関数になる。耳入力信号は、リスナーの耳介、頭部および胴部によって生じる効果の影響により、前に考慮された自由音場信号から異なる。空間聴覚に対して重要なそれらの効果は、頭部関連伝達関数(HRTF)によって記述される。測定されたHRTFデータは、これらの効果を組み入れるために用いることができる。我々は、HRTFの近似をシミュレートするために、解析モデルを使用する。頭部は、半径が8.75cm、耳位置が方位角±100°、高低角0°による剛体球としてモデル化される。理想的な拡散音場におけるrの理論上の挙動とHRTFの影響が与えられると、拡散音場に対する周波数に依存する両耳間の相互相関参照曲線を決定することができる。
拡散推定は、シミュレートされたキューの、想定された拡散音場参照キューとの比較に基づいている。この比較は、人間の聴覚の制限を受ける。聴覚システムにおいて、バイノーラル処理は、外耳、中耳および内耳から構成される聴覚周辺に従う。球モデルによって近似されない外耳の効果(例えば、耳介形状、耳道)と中耳の効果は、考慮されない。内耳のスペクトル選択性は、オーバーラップするバンドパスフィルタバンク(図10において聴覚フィルタとして表された)としてモデル化される。クリチカルバンドアプローチは、矩形のフィルタによってこれらのオーバーラップするバンドパスを近似するために用いられる。等価な矩形のバンド幅(ERB)が、次式に従って、中心周波数の関数として計算される。
Figure 0005595602
人間の聴覚システムは、コヒーレント信号成分を検出するために時間アラインメントを実行することができ、複合音が存在する場合において、相互相関解析がアラインメント時間(ITDに相当する)の推定に用いられると想定される。およそ1〜1.5kHzに至るまで、キャリア信号の時間シフトは、波形の相互相関を用いて評価されるが、より高い周波数においては、包絡相互相関が関連するキューになる。以下においては、我々はこの区別をしない。両耳間コヒーレンス(IC)推定は、次式の正規化された両耳間相互相関関数の最大絶対値としてモデル化される。
Figure 0005595602
バイノーラル知覚のいくつかのモデルは、実行中の両耳間相互相関解析を考慮する。我々は、定常信号を考慮するので、時間に関する従属を考慮しない。クリチカルバンド処理の影響をモデル化するために、次のような周波数依存の正規化された相互相関関数を演算する。
Figure 0005595602
ここで、Aはクリチカルバンド毎の相互相関関数であり、BおよびCはクリチカルバンド毎の自己相関関数である。バンドパス相互スペクトルとバンドパス自己スペクトルによる周波数ドメインに対するそれらの関係は、以下の通りに定式化することができる。
Figure 0005595602
Figure 0005595602
異なる角度における2つ以上の音源からの信号が重畳される場合、振動性のILDキューおよびITDキューが喚起される。このような時間および/または周波数の関数のようなILDおよびITDの変化は、広大さを生成することができる。しかしながら、長時間の平均においては、拡散音場においてILDおよびITDがあってはならない。ゼロの平均ITDは、信号間の相関が時間アラインメントによって増加することができないことを意味する。ILDは、原則として、完全な可聴周波数範囲上で評価することができる。頭部は低い周波数において障害物を構成しないので、ILDは、中周波および高周波において最も効率的である。
引き続いて、図11aおよび11bは、図10または図4の文脈において述べられたような参照曲線を用いない解析器の代替の実施態様を示すために述べられる。
Figure 0005595602
ダウンミックスステレオ信号に基づいて、フィルタWDおよびWAは、式(2)および(3)において、ダイレクトサウンドとアンビエントサウンドのサラウンド信号推定を取得するために演算される。
アンビエントサウンド信号が全ての入力チャンネル間で無相関であると仮定すると、我々は、この仮定がダウンミックスチャンネルに対しても保持されるようにダウンミックス係数を選ぶ。従って、式(4)においてダウンミックス信号モデルを定式化することができる。
1とD2は、相関したダイレクトサウンドSTFTスペクトルを表し、A1とA2は、無相関のアンビエントサウンドを表す。各チャンネルにおけるダイレクトサウンドとアンビエントサウンドが相互に無相関であると更に仮定する。
ダイレクトサウンドの推定は、最小自乗平均のセンスにおいて、アンビエンスを抑制するために、オリジナルのサラウンド信号に対してウィーナーフィルタを適用することによって達成される。全ての入力チャンネルに適用することができる単一のフィルタを導き出すために、我々は、式(5)におけるように、ダウンミックスにおいて、左右のチャンネルに対して同じフィルタを用いてダイレクト成分を推定する。
この推定のための結合平均自乗誤差関数は、式(6)によって与えられる。
E{・}は除外オペレータであり、PDとPAはダイレクト成分とアンビエント成分の短期間パワー推定の合計である(式(7))。
誤差関数(6)は、その導き出されたものをゼロにセットすることによって最小化される。ダイレクトサウンドの推定に対して結果として生じるフィルタは、式(8)にある。
同様に、アンビエントサウンドに対する推定フィルタは、式(9)におけるように導き出すことができる。
以下において、WDとWAの演算に必要な、PDとPAに対する推定が導き出される。
ダウンミックスの相互相関は、式(10)によって与えられる。
ここで、ダウンミックス信号モデル(4)が与えられると、式(11)が参照される。
ダウンミックスにおけるアンビエント成分が左右のダウンミックスチャンネルにおいて同じパワーを有すると更に仮定して、式(12)を書くことができる。
式(12)を式(10)の最終行へ置換し、式(13)を考慮し、式(14)と(15)が得られる。
図4の文脈において述べられたように、最小限の相関に対する参照曲線の生成は、再生セットアップにおいて2つ以上の音源を置くことによって、そして、この再生セットアップにおいてリスナーの頭部を特定の位置に置くことによって、推測することができる。そのとき、完全に独立な信号は、異なるスピーカによって放射される。2スピーカセットアップに対して、2つのチャンネルは、いかなるクロスミックス生成物もないケースにおいて、相関が0に等しいように完全に無相関でなければならない。しかしながら、これらのクロスミックス生成物は、人間の聴覚システムの左側から右側へのクロスカップリングによって起こり、他のクロスカップリングも部屋の残響等によって起こる。それ故、図4または図9a〜9dに示されたような結果として生じる参照曲線は、必ずしも0ではなく、このシナリオにおいて推測された参照信号が完全に独立であったにも拘らず、特に0から異なる値を有する。しかしながら、実際にはこれらの信号を必要としないことを理解することは重要である。参照曲線を計算するときに、2つ以上の信号間の完全独立を仮定することも差し支えない。しかしながら、この文脈において、例えば、完全には独立でないが、ある程度の予め知られた従属性または互いの間の従属の程度を有する信号を用いてまたは仮定して、他のシナリオに対して他の参照曲線を計算することができる点に注意すべきである。このような異なる参照曲線が計算されるとき、重み係数の解釈または提供は、完全な独立信号が仮定される参照曲線に関して異なる。
いくつかの態様が装置の文脈において記載されたが、これらの態様は、ブロックまたはデバイスが方法ステップまたは方法ステップの機能に対応する、対応する方法の記載をも表すことは明らかである。同様に、方法ステップの文脈において記載された態様は、対応する装置の対応するブロックまたはアイテムまたは機能の記載を表す。
本発明の分解された信号は、デジタル記憶媒体上に記憶することができ、または、無線伝送媒体のような伝送媒体またはインターネットのような有線伝送媒体上を伝送することができる。
特定の実施要求条件に依存して、本発明の実施形態は、ハードウェアにおいてまたはソフトウェアにおいて実施することができる。実施は、その上に格納された電子的に読取可能な制御信号を有し、それぞれの方法が実行されるように、プログラム可能なコンピュータシステムと協働する(または協働することができる)デジタル記憶媒体、例えばフロッピー(登録商標)ディスク、DVD、CD、ROM、PROM、EPROM、EEPROMまたはフラッシュメモリを用いて実行することができる。
本発明によるいくつかの実施形態は、電子的に読取可能な制御信号を有し、本願明細書に記載された方法の1つが実行されるようにプログラム可能なコンピュータシステムと協働することができる固定のデータキャリアを備える。
一般に、本発明の実施形態は、コンピュータプログラムコードがコンピュータ上で動作するときに、本発明の方法の1つを実行するように動作するプログラムコードを有するコンピュータプログラム製品として実施することができる。プログラムコードは、例えば、機械読取可能なキャリア上に記憶することもできる。
他の実施形態は、本願明細書に記載された方法の1つを実行する機械読取可能なキャリアに記憶されたコンピュータプログラムを備える。
言い換えれば、本発明の方法の実施形態は、それ故に、コンピュータプログラムがコンピュータ上で動作するときに、本願明細書に記載された方法の1つを実行するプログラムコードを有するコンピュータプログラムである。
本発明の方法の更なる実施形態は、それ故に、本願明細書に記載された方法の1つを実行するコンピュータプログラムがその上に格納されたデータキャリア(またはデジタル記憶媒体またはコンピュータ読取可能媒体)である。
本発明の方法の更なる実施形態は、それ故に、本願明細書に記載された方法の1つを実行するコンピュータプログラムを表現するデータストリームまたは信号のシーケンスである。データストリームまたは信号のシーケンスは、例えば、データ通信接続、例えばインターネットを介して転送されるように構成することができる。
更なる実施形態は、処理手段、例えば本願明細書に記載された方法の1つを実行するように構成されたまたは適合されたコンピュータまたはプログラム可能なロジックデバイスを備える。
更なる実施形態は、本願明細書に記載された方法の1つを実行するコンピュータプログラムがその上にインストールされたコンピュータを備える。
いくつかの実施形態において、本願明細書に記載された方法のいくつかまたはすべての機能を実行するために、プログラム可能なロジックデバイス(例えば、フィールドプログラマブルゲートアレイ)を用いることができる。いくつかの実施形態において、フィールドプログラマブルゲートアレイは、本願明細書に記載された方法の1つを実行するために、マイクロプロセッサと協働することができる。一般に、方法は、好ましくはいかなるハードウェア装置によっても実行される。
上述の実施形態は、単に本発明の原理を示している。本願明細書に記載された構成および詳細の修正および変更は、他の当業者に対して自明であると理解される。それ故に、本発明は、特許クレームのスコープのみによって限定され、本願明細書の実施形態の記載および説明の方法によって表される特定の詳細に限定されないことが意図される。

Claims (15)

  1. 複数のチャンネルを有する信号を分解する装置であって、
    解析結果(18)を決定するように、参照曲線として予め計算された周波数依存類似度曲線を用いるように構成され、前記予め計算された周波数依存類似度曲線は、周波数レンジに関する2つの信号間の類似性の量的程度を得るために前記2つの信号に基づいて計算され、前記解析結果(18)を得るために複数のチャンネルを有する信号に関連した解析信号の2つのチャンネルの類似度を解析する解析器(16)、および
    分解された信号を得るために、前記解析結果を用いて、導き出される前記解析信号、または前記解析信号から導き出される信号、または前記解析信号が導き出される信号を処理する信号処理器(20)、
    を含む、装置。
  2. 参照曲線が予め記憶されるルックアップテーブルをさらに含む、請求項1に記載の装置。
  3. 前記信号または前記解析信号あるいは複数のサブバンドを有する各周波数表現(周波数表示)の時間系列に区分される前記解析信号を変換する時間−周波数変換器(32)さらに含み、
    前記解析器(16)は、各々のサブバンドのために、前記周波数依存類似度曲線から、そして、サブバンドのための前記解析結果を決定するように前記サブバンドの前記2つのチャンネルと前記参照類似度との類似度を用いるように構成される、請求項1または請求項2に記載の装置。
  4. 前記解析器(16)は、前記解析信号の2つのチャンネルから導き出される類似度を参照曲線により決定された対応する類似度と比較することによって、そして、比較の結果に従って重み付けの値を割り当てるために、または、前記解析信号の2つのチャンネルから導き出される類似度と参照曲線から決定された対応する類似度の間の差を計算することによって、前記解析結果を計算するように構成される、請求項1〜請求項3のいずれか1項に記載の装置。
  5. 前記解析器(16)は、前記解析結果として、重み係数(W(m,i))を生成するように構成され、
    前記信号処理器(20)は、前記重み係数を前記入力信号または前記入力信号から導き出された信号に適用し、前記重み係数で重み付けするように構成される、請求項1〜請求項4のいずれか1項に記載の装置。
  6. 前記解析信号に入力信号をダウンミックスするダウン・ミキサー(12)をさらに含み、前記入力信号は、前記解析信号よりも多くのチャンネルを備え、
    前記処理器(20)は、前記解析信号と異なる前記入力信号から導き出される入力信号または信号を処理するように構成される、請求項1〜請求項5のいずれか1項に記載の装置。
  7. 前記解析器(16)は、事前に知られた依存度を有する信号によって発生された2つの信号間の周波数依存類似度を示す予め計算された参照曲線を用いるように構成される、請求項1〜請求項6のいずれか1項に記載の装置。
  8. 前記解析器は、リスナー位置における2つ以上の信号間の周波数依存類似度を示す予め記憶された周波数依存類似度曲線を、前記信号が知られた類似度特徴を有し、前記信号が知られたスピーカ位置においてスピーカによって放射することができるという仮定下で用いるように構成される、請求項1〜請求項7のいずれか1項に記載の装置。
  9. 前記参照信号の類似度特性が知られている、請求項7または請求項8に記載の装置。
  10. 前記参照信号は、完全に無相関化されている、請求項7〜請求項9のいずれか1項に記載の装置。
  11. 前記解析器(16)は、人間の耳の周波数分解能によって決定されるサブバンドにおいて前記ダウンミックスチャンネルを解析するように構成される、請求項1〜請求項10のいずれか1項に記載の装置。
  12. 前記解析器(16)は、前記ダウンミックスされた信号を解析し、ダイレクト・アンビエント分解を可能にする解析結果を生成するように構成され、
    前記信号処理器(20)は、前記解析結果を用いて、前記ダイレクト部分または前記アンビエント部分を抽出するように構成される、請求項1〜請求項11のいずれか1項に記載の装置。
  13. 前記解析器(16)は、前記参照曲線と異なる、より低いかまたはより高い境界を用いるように構成され、 前記解析器は、前記解析チャンネルの周波数依存類似度結果をより低いものと比較するように構成されるか、あるいは、より高い前記解析結果を決定するように構成される、請求項1〜請求項12のいずれか1項に記載の装置。
  14. 複数のチャンネルを有する信号を分解する方法であって、
    解析結果(18)を決定するように、参照曲線として予め計算された周波数依存類似度曲線を用いるように構成され、前記予め計算された周波数依存類似度曲線は、周波数レンジ上の2つの信号間の類似性の量的程度を得るために、前記2つの信号に基づいて計算され、複数のチャンネルを有する信号に関連した解析信号の2つのチャンネルの類似度を解析するステップ(16)、および
    分解された信号を得るために、前記解析結果を用いて、導き出される前記解析信号、または前記解析信号から導き出される信号、または前記解析信号が導き出される信号を処理するステップ(20)、
    を含む、方法。
  15. コンピュータプログラムは、コンピュータまたはプロセッサによって実行されるときに、請求項14に記載の方法を実行する、コンピュータプログラム。
JP2013542451A 2010-12-10 2011-11-22 予め計算された参照曲線を用いて入力信号を分解する装置および方法 Active JP5595602B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US42192710P 2010-12-10 2010-12-10
US61/421,927 2010-12-10
EP11165746A EP2464146A1 (en) 2010-12-10 2011-05-11 Apparatus and method for decomposing an input signal using a pre-calculated reference curve
EP11165746.6 2011-05-11
PCT/EP2011/070700 WO2012076331A1 (en) 2010-12-10 2011-11-22 Apparatus and method for decomposing an input signal using a pre-calculated reference curve

Publications (2)

Publication Number Publication Date
JP2014502478A JP2014502478A (ja) 2014-01-30
JP5595602B2 true JP5595602B2 (ja) 2014-09-24

Family

ID=44582056

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2013542451A Active JP5595602B2 (ja) 2010-12-10 2011-11-22 予め計算された参照曲線を用いて入力信号を分解する装置および方法
JP2013542452A Active JP5654692B2 (ja) 2010-12-10 2011-11-22 ダウンミキサーを用いて入力信号を分解する装置および方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2013542452A Active JP5654692B2 (ja) 2010-12-10 2011-11-22 ダウンミキサーを用いて入力信号を分解する装置および方法

Country Status (16)

Country Link
US (3) US10187725B2 (ja)
EP (4) EP2464146A1 (ja)
JP (2) JP5595602B2 (ja)
KR (2) KR101480258B1 (ja)
CN (2) CN103348703B (ja)
AR (2) AR084176A1 (ja)
AU (2) AU2011340891B2 (ja)
BR (2) BR112013014173B1 (ja)
CA (2) CA2820351C (ja)
ES (2) ES2530960T3 (ja)
HK (2) HK1190552A1 (ja)
MX (2) MX2013006364A (ja)
PL (2) PL2649814T3 (ja)
RU (2) RU2554552C2 (ja)
TW (2) TWI519178B (ja)
WO (2) WO2012076331A1 (ja)

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI429165B (zh) 2011-02-01 2014-03-01 Fu Da Tong Technology Co Ltd Method of data transmission in high power induction power supply
US10056944B2 (en) 2011-02-01 2018-08-21 Fu Da Tong Technology Co., Ltd. Data determination method for supplying-end module of induction type power supply system and related supplying-end module
TWI472897B (zh) * 2013-05-03 2015-02-11 Fu Da Tong Technology Co Ltd 自動調節電壓準位之方法、裝置及其感應式電源供應器
US9048881B2 (en) 2011-06-07 2015-06-02 Fu Da Tong Technology Co., Ltd. Method of time-synchronized data transmission in induction type power supply system
US9628147B2 (en) 2011-02-01 2017-04-18 Fu Da Tong Technology Co., Ltd. Method of automatically adjusting determination voltage and voltage adjusting device thereof
US9075587B2 (en) 2012-07-03 2015-07-07 Fu Da Tong Technology Co., Ltd. Induction type power supply system with synchronous rectification control for data transmission
US9671444B2 (en) 2011-02-01 2017-06-06 Fu Da Tong Technology Co., Ltd. Current signal sensing method for supplying-end module of induction type power supply system
US9831687B2 (en) 2011-02-01 2017-11-28 Fu Da Tong Technology Co., Ltd. Supplying-end module for induction-type power supply system and signal analysis circuit therein
US10038338B2 (en) 2011-02-01 2018-07-31 Fu Da Tong Technology Co., Ltd. Signal modulation method and signal rectification and modulation device
US9600021B2 (en) 2011-02-01 2017-03-21 Fu Da Tong Technology Co., Ltd. Operating clock synchronization adjusting method for induction type power supply system
US8941267B2 (en) 2011-06-07 2015-01-27 Fu Da Tong Technology Co., Ltd. High-power induction-type power supply system and its bi-phase decoding method
KR20120132342A (ko) * 2011-05-25 2012-12-05 삼성전자주식회사 보컬 신호 제거 장치 및 방법
US9253574B2 (en) * 2011-09-13 2016-02-02 Dts, Inc. Direct-diffuse decomposition
AU2013314299B2 (en) * 2012-09-12 2016-05-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for providing enhanced guided downmix capabilities for 3D audio
CN105210389B (zh) 2013-03-19 2017-07-25 皇家飞利浦有限公司 用于确定麦克风的位置的方法和装置
EP2790419A1 (en) * 2013-04-12 2014-10-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for center signal scaling and stereophonic enhancement based on a signal-to-downmix ratio
CN108806704B (zh) 2013-04-19 2023-06-06 韩国电子通信研究院 多信道音频信号处理装置及方法
US10075795B2 (en) 2013-04-19 2018-09-11 Electronics And Telecommunications Research Institute Apparatus and method for processing multi-channel audio signal
US9502044B2 (en) * 2013-05-29 2016-11-22 Qualcomm Incorporated Compression of decomposed representations of a sound field
US9319819B2 (en) 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
EP3767970B1 (en) * 2013-09-17 2022-09-28 Wilus Institute of Standards and Technology Inc. Method and apparatus for processing multimedia signals
CN108449704B (zh) 2013-10-22 2021-01-01 韩国电子通信研究院 生成用于音频信号的滤波器的方法及其参数化装置
CA2934856C (en) 2013-12-23 2020-01-14 Wilus Institute Of Standards And Technology Inc. Method for generating filter for audio signal, and parameterization device for same
CN104768121A (zh) 2014-01-03 2015-07-08 杜比实验室特许公司 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频
RU2747713C2 (ru) 2014-01-03 2021-05-13 Долби Лабораторис Лайсэнзин Корпорейшн Генерирование бинаурального звукового сигнала в ответ на многоканальный звуковой сигнал с использованием по меньшей мере одной схемы задержки с обратной связью
KR101782917B1 (ko) 2014-03-19 2017-09-28 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
US9848275B2 (en) 2014-04-02 2017-12-19 Wilus Institute Of Standards And Technology Inc. Audio signal processing method and device
EP2942982A1 (en) * 2014-05-05 2015-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. System, apparatus and method for consistent acoustic scene reproduction based on informed spatial filtering
CN106576204B (zh) 2014-07-03 2019-08-20 杜比实验室特许公司 声场的辅助增大
CN105336332A (zh) * 2014-07-17 2016-02-17 杜比实验室特许公司 分解音频信号
CN106797525B (zh) 2014-08-13 2019-05-28 三星电子株式会社 用于生成和回放音频信号的方法和设备
US10559303B2 (en) * 2015-05-26 2020-02-11 Nuance Communications, Inc. Methods and apparatus for reducing latency in speech recognition applications
US9666192B2 (en) 2015-05-26 2017-05-30 Nuance Communications, Inc. Methods and apparatus for reducing latency in speech recognition applications
TWI596953B (zh) * 2016-02-02 2017-08-21 美律實業股份有限公司 錄音模組
CN108604454B (zh) * 2016-03-16 2020-12-15 华为技术有限公司 音频信号处理装置和输入音频信号处理方法
EP3232688A1 (en) * 2016-04-12 2017-10-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for providing individual sound zones
US10659904B2 (en) * 2016-09-23 2020-05-19 Gaudio Lab, Inc. Method and device for processing binaural audio signal
US10187740B2 (en) * 2016-09-23 2019-01-22 Apple Inc. Producing headphone driver signals in a digital audio signal processing binaural rendering environment
JP6788272B2 (ja) * 2017-02-21 2020-11-25 オンフューチャー株式会社 音源の検出方法及びその検出装置
US10784908B2 (en) * 2017-03-10 2020-09-22 Intel IP Corporation Spur reduction circuit and apparatus, radio transceiver, mobile terminal, method and computer program for spur reduction
IT201700040732A1 (it) * 2017-04-12 2018-10-12 Inst Rundfunktechnik Gmbh Verfahren und vorrichtung zum mischen von n informationssignalen
JP7297740B2 (ja) 2017-10-04 2023-06-26 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. DirACベース空間オーディオコーディングに関する符号化、復号、シーン処理、および他の手順のための装置、方法、およびコンピュータプログラム
CN111107481B (zh) * 2018-10-26 2021-06-22 华为技术有限公司 一种音频渲染方法及装置

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9025A (en) * 1852-06-15 And chas
US7026A (en) * 1850-01-15 Door-lock
US5065759A (en) * 1990-08-30 1991-11-19 Vitatron Medical B.V. Pacemaker with optimized rate responsiveness and method of rate control
US5912976A (en) * 1996-11-07 1999-06-15 Srs Labs, Inc. Multi-channel audio enhancement system for use in recording and playback and methods for providing same
TW358925B (en) * 1997-12-31 1999-05-21 Ind Tech Res Inst Improvement of oscillation encoding of a low bit rate sine conversion language encoder
SE514862C2 (sv) 1999-02-24 2001-05-07 Akzo Nobel Nv Användning av en kvartär ammoniumglykosidtensid som en effektförhöjande hjälpkemikalie för gödningsmedel eller pesticider samt kompositioner innehållande pesticider eller gödningsmedel
US6694027B1 (en) * 1999-03-09 2004-02-17 Smart Devices, Inc. Discrete multi-channel/5-2-5 matrix system
EP1523862B1 (en) * 2002-07-12 2007-10-31 Koninklijke Philips Electronics N.V. Audio coding
PL378021A1 (pl) * 2002-12-28 2006-02-20 Samsung Electronics Co., Ltd. Sposób i urządzenie do mieszania strumieni akustycznych i nośnik pamięciowy informacji
US7254500B2 (en) * 2003-03-31 2007-08-07 The Salk Institute For Biological Studies Monitoring and representing complex signals
JP2004354589A (ja) * 2003-05-28 2004-12-16 Nippon Telegr & Teleph Corp <Ntt> 音響信号判別方法、音響信号判別装置、音響信号判別プログラム
CA2992125C (en) 2004-03-01 2018-09-25 Dolby Laboratories Licensing Corporation Reconstructing audio signals with multiple decorrelation techniques and differentially coded parameters
JP4744438B2 (ja) 2004-03-05 2011-08-10 パナソニック株式会社 エラー隠蔽装置およびエラー隠蔽方法
US7392195B2 (en) 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
US20070297519A1 (en) * 2004-10-28 2007-12-27 Jeffrey Thompson Audio Spatial Environment Engine
US7961890B2 (en) * 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
US7468763B2 (en) * 2005-08-09 2008-12-23 Texas Instruments Incorporated Method and apparatus for digital MTS receiver
US7563975B2 (en) * 2005-09-14 2009-07-21 Mattel, Inc. Music production system
KR100739798B1 (ko) 2005-12-22 2007-07-13 삼성전자주식회사 청취 위치를 고려한 2채널 입체음향 재생 방법 및 장치
SG136836A1 (en) * 2006-04-28 2007-11-29 St Microelectronics Asia Adaptive rate control algorithm for low complexity aac encoding
US8379868B2 (en) * 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
US7877317B2 (en) * 2006-11-21 2011-01-25 Yahoo! Inc. Method and system for finding similar charts for financial analysis
US8023707B2 (en) * 2007-03-26 2011-09-20 Siemens Aktiengesellschaft Evaluation method for mapping the myocardium of a patient
DE102008009024A1 (de) * 2008-02-14 2009-08-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum synchronisieren von Mehrkanalerweiterungsdaten mit einem Audiosignal und zum Verarbeiten des Audiosignals
EP2272169B1 (en) * 2008-03-31 2017-09-06 Creative Technology Ltd. Adaptive primary-ambient decomposition of audio signals
US8023660B2 (en) 2008-09-11 2011-09-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method and computer program for providing a set of spatial cues on the basis of a microphone signal and apparatus for providing a two-channel audio signal and a set of spatial cues
US8654990B2 (en) * 2009-02-09 2014-02-18 Waves Audio Ltd. Multiple microphone based directional sound filter
WO2010125228A1 (en) * 2009-04-30 2010-11-04 Nokia Corporation Encoding of multiview audio signals
KR101566967B1 (ko) * 2009-09-10 2015-11-06 삼성전자주식회사 디지털 방송 시스템에서 패킷 디코딩 방법 및 장치
EP2323130A1 (en) * 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
CN102907120B (zh) 2010-06-02 2016-05-25 皇家飞利浦电子股份有限公司 用于声音处理的系统和方法
US9183849B2 (en) 2012-12-21 2015-11-10 The Nielsen Company (Us), Llc Audio matching with semantic audio recognition and report generation

Also Published As

Publication number Publication date
ES2534180T3 (es) 2015-04-20
AU2011340890B2 (en) 2015-07-16
BR112013014172A2 (pt) 2016-09-27
RU2555237C2 (ru) 2015-07-10
EP2464145A1 (en) 2012-06-13
ES2530960T3 (es) 2015-03-09
US20130272526A1 (en) 2013-10-17
WO2012076332A1 (en) 2012-06-14
US20130268281A1 (en) 2013-10-10
AR084176A1 (es) 2013-04-24
RU2013131774A (ru) 2015-01-20
KR20130105881A (ko) 2013-09-26
AU2011340891B2 (en) 2015-08-20
BR112013014173A2 (pt) 2018-09-18
JP2014502479A (ja) 2014-01-30
EP2649815B1 (en) 2015-01-21
MX2013006358A (es) 2013-08-08
RU2554552C2 (ru) 2015-06-27
AU2011340890A1 (en) 2013-07-04
HK1190552A1 (en) 2014-07-04
US10531198B2 (en) 2020-01-07
CN103355001A (zh) 2013-10-16
US20190110129A1 (en) 2019-04-11
TWI524786B (zh) 2016-03-01
TW201234871A (en) 2012-08-16
WO2012076331A1 (en) 2012-06-14
CA2820376A1 (en) 2012-06-14
AR084175A1 (es) 2013-04-24
EP2649815A1 (en) 2013-10-16
CA2820351A1 (en) 2012-06-14
KR20130133242A (ko) 2013-12-06
RU2013131775A (ru) 2015-01-20
KR101480258B1 (ko) 2015-01-09
JP5654692B2 (ja) 2015-01-14
US10187725B2 (en) 2019-01-22
MX2013006364A (es) 2013-08-08
US9241218B2 (en) 2016-01-19
JP2014502478A (ja) 2014-01-30
PL2649814T3 (pl) 2015-08-31
HK1190553A1 (en) 2014-07-04
CA2820351C (en) 2015-08-04
BR112013014172B1 (pt) 2021-03-09
EP2649814A1 (en) 2013-10-16
BR112013014173B1 (pt) 2021-07-20
CA2820376C (en) 2015-09-29
TWI519178B (zh) 2016-01-21
EP2464146A1 (en) 2012-06-13
CN103355001B (zh) 2016-06-29
AU2011340891A1 (en) 2013-06-27
PL2649815T3 (pl) 2015-06-30
CN103348703A (zh) 2013-10-09
EP2649814B1 (en) 2015-01-14
KR101471798B1 (ko) 2014-12-10
TW201238367A (en) 2012-09-16
CN103348703B (zh) 2016-08-10

Similar Documents

Publication Publication Date Title
US10531198B2 (en) Apparatus and method for decomposing an input signal using a downmixer
KR101532505B1 (ko) 분해기를 이용하여 출력 신호를 생성하는 장치 및 방법
AU2015255287B2 (en) Apparatus and method for generating an output signal employing a decomposer
AU2012252490A1 (en) Apparatus and method for generating an output signal employing a decomposer

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140708

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140805

R150 Certificate of patent or registration of utility model

Ref document number: 5595602

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250