JP2012529216A - オーディオ信号のアップミキシング - Google Patents
オーディオ信号のアップミキシング Download PDFInfo
- Publication number
- JP2012529216A JP2012529216A JP2012513712A JP2012513712A JP2012529216A JP 2012529216 A JP2012529216 A JP 2012529216A JP 2012513712 A JP2012513712 A JP 2012513712A JP 2012513712 A JP2012513712 A JP 2012513712A JP 2012529216 A JP2012529216 A JP 2012529216A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- channel
- spatial
- channels
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
Abstract
オーディオ装置は、オーディオチャネルの組を供給するプロセッサ(101)を有する。予測回路(103)は、適応フィルタによる第2チャネルの適応フィルタリングによって、第1チャネルに関し予測信号を生成する。適応プロセッサ(105)は、予測信号と第1チャネルとの間の差を示すコスト関数を最小化するよう適応フィルタを適応させる。次いで、補償プロセッサ(107)は、第1の信号に予測信号を補償することによって非予測信号を生成し、分配回路(109)は、出力オーディオ信号の組にわたって少なくとも予測信号と非予測信号とを分配することによって、出力オーディオチャネルの組を生成する。このとき、分配は、予測信号及び非予測信号に関し異なる。クロスチャネル予測フィルタリングは、発生音響の異なる空間特性を表し、従って、有利に出力チャネルごとに異なって分配される信号成分を供給する。
Description
本発明は、オーディオチャネルの他の組からのオーディオチャネルの組の生成に係り、特に、2よりも多いチャネルによるステレオ信号からマルチチャネル信号へのアップミキシングに係るがこれに限定されない。
2よりも多いチャネルに基づく空間オーディオ再生は、この10年でますます一般的になってきている。例えば、5又はそれ以上の音源を用いるマルチチャネル空間サラウンドシステムは非常に人気になっており、例えば、ホームシネマ・システムは、消費者市場において、大成功の製品になっている。
結果として、研究の増加量は、性能を改善し又は更なる柔軟性を空間サラウンドシステムに提供することができる技術及びアルゴリズムを発展させることに通じた。
例えば、そのような空間サラウンドシステムに関連する1つの問題は、レガシーコンテンツ及びオーディオマテリアルの多くが従来のステレオフォーマットにおいて取り込まれている点であり、従って、ステレオ信号の2つのチャネルから大部分の空間サラウンドシステムのより多くの数のチャネルへのフォーマット変換を実行可能であることが、システムにとって有利である。
また、多くの筋書きにおいて、空間オーディオコンテンツが最適化又は改善されることが望ましい。例えば、中央の音源が主チャネルに集中し、一方、中央にない音源がサイドチャネルにおいて(更に)表現されることを確かにすることによって、異なる音源の間で分化促進を提供することが、しばしば望ましい。これは、例えば、多くのホームシネマ・システムのために、音声の明りょうさの改善を提供することができる。
より大きな組のチャネルへのチャネルの組の拡張は、通常、アップミキシング(upmixing)と呼ばれ、そのようなフォーマット変換のための様々なアプローチが提案されている。
例えば、ステレオ信号を5つの空間チャネルへアップミキシングする簡単な方法は、2つのステレオ信号を5つの出力信号にマッピングする5×2行列を用いることである。そのようなアプローチは複雑性が低く、従って、低コストの解決法に該当するが、品質が比較的低い傾向がある。
このアプローチの拡張は、夫々の行列が信号特性から決定される別々の重みを有する複数のアップミキシング行列を使用することである。重みは、例えば、アップミキシングされるべきステレオ信号のエネルギ特性から決定されてよい。しかし、これは改善を提供するが、音響品質は依然として次善である傾向があり、更に、当該アプローチは実質的に複雑性を高めうる。一般的に、そのような技術は適応マトリクス化と呼ばれる。
他のアプローチは、R.Irwan及びR.M.Aarts、「Two-to-five channel sound processing」、Journal of the Audio Engineering Society、Vol.50(11)、pp.914-926、2002年(非特許文献1)において提案されている。このアプローチは、支配的な音響位置を定めるツールとして主成分分析を用いる。その後に、適応アップミキシング行列の値が支配的な音響位置によって導かれる。しかし、高い品質が概して達成され得るものの、幾つかの筋書きにおいて性能は最適ではなく、更に、当該アプローチは比較的複雑である。例えば、典型的なオーディオは多くの音源を有し、アルゴリズムとして如何なる時間差も考慮しないので、空間イメージは時々何らかの歪みを示すことがある。
ステレオコンテンツを分析するためのより精巧な技術も知られている。しかし、それらの技術及びアプローチは品質を改善するが、比較的複雑である傾向があり、依然として多くの筋書きにおいて次善のオーディオ品質を提供する傾向がある。例えば、MPEG音響デコーダ標準は、送信される空間パラメータに依存することなくアップミキシングを行うことができるアップミキシングモード(ブラインド・アップミキシングモード)を含む。しかし、当該アプローチは、ステレオ信号の両方のチャネルを時間周波数タイルに分解しすることを伴い、これは、計算的に不利であり、相当な遅延を導入する。
R.Irwan及びR.M.Aarts、「Two-to-five channel sound processing」、Journal of the Audio Engineering Society、Vol.50(11)、pp.914-926、2002年
従って、改善されたシステムが有利であり、特に、高められた柔軟性、改善されたオーディオ品質、低減された複雑性、容易化された実施及び/又は動作、低減されたリソース要求、及び/又は改善された性能を可能にする、入力チャネルの組からオーディオチャネルの組を生成するアプローチが有利である。
然るに、本発明は、望ましくは、上記の欠点のうち1又はそれ以上を1つずつ又は組み合わせて解消し、軽減し又は取り除くことを目的とする。
本発明の態様に従って、オーディオチャネルの第1の組から出力オーディオチャネルの組を生成する装置であって:前記オーディオチャネルの第1の組を供給する供給回路;適応フィルタによる前記オーディオチャネルの第1の組の中の第2チャネルの信号の適応フィルタリングによって、前記オーディオチャネルの第1の組の中の第1チャネルに関し予測信号を生成する予測回路;前記予測信号と前記第1チャネルの第1の信号との間の差を示すコスト関数を最小化するよう前記適応フィルタを適応させる回路;前記第1の信号に前記予測信号を補償することによって、前記第1チャネルに関し非予測信号を生成する回路;及び、出力オーディオ信号の組にわたって少なくとも前記予測信号と前記非予測信号とを分配することによって、前記出力オーディオチャネルの組を生成する分配回路を有し、前記分配は、前記予測信号及び前記非予測信号に関し異なる、装置が提供される。
本発明は、オーディオチャネルの出力される組の改善された生成を可能にすることができる。改善された品質が多くの筋書きにおいて達成可能であり、且つ/あるいは、低減された複雑性及び/又はリソース消費、及び/又は低減されたアルゴリズム遅延が達成可能である。多くの実施形態において、改善された空間的経験が達成可能である。
システムは、例えば、第1の組のチャネルの異なる信号成分を出力チャネルの組に分配することを最適化するために使用される相関情報を決定するために、クロスチャネル予測フィルタリング(cross-channel predictive filtering)を使用してよい。特に、予測及び非予測音響成分は、実質的に異なった空間特性を有し、従って、有利に異なって分配される成分に対応してよい。例えば、当該アプローチは、空間的に適切に定められた音源に対応する信号成分と、明確な空間的位置を有さない周囲の拡散した音源に対応する信号成分とを推定するための、複雑性が低いアプローチを提供してよい。他の例として、当該アプローチは、中央に位置付けられた音源に対応する信号成分と、中央に位置付けられていない音源に対応する信号成分とを推定するための、複雑性が低いアプローチを提供してよい。
当該アプローチは、具体的に、オーディオチャネルの改善されたアップミキシングを提供することができる。実際に、幾つかの実施形態において、オーディオチャネルの出力される組は、第1の組のオーディオチャネルよりも多いオーディオチャネルを有してよい。具体的に、第1の組のオーディオチャネルは、ステレオチャネルの組又はステレオチャネルの組から得られるチャネルを有してよい。
当然のことながら、如何なる適切なコスト関数も使用されてよい。更に、当然のことながら、コスト関数の最小化は、絶対的且つ数学的に正確な最小化でなくてよく、単に、例えばリソース制限、実際的制限等の他の制約を考慮しながらコスト関数を低減しようとする如何なるアプローチであってもよい。このように、語「最小化」は、その弱い意味においては、一般的に、その厳密な数学的意味においてよりもむしろ、技術的意味において適用される。また、当然のことながら、コスト関数は、所望の特性を示す関数を最適化することによって、間接的に最小化されてよい。例えば、コスト関数は、予測信号と第1の信号との間の相互の情報又は相関の程度を最大化することによって、最小化され得る。
前記適応フィルタは、例えばゲイン調整又はレンジ制限等の、信号の更なる処理を含んでよい。また、前記適応フィルタは、適応フィルタ部分及び非適応フィルタ部分を有してよい。例えば、適応フィルタ部分は、前置フィルタが先行し、後置フィルタが後に続いてよい。前置フィルタ及び/又は後置フィルタは、固定の静的フィルタであってよい。
幾つかの実施形態において、本発明は、異なる信号成分の改善された分離を提供することができる。例えば、幾つかの実施形態において、本発明は、センターチャネルにおける中央音源の改善された分離及び集束を提供することができる。
本発明の任意の特徴に従って、前記供給回路は、第1の空間チャネル及び第2の空間チャネルから差分信号を生成するよう配置され、前記第1チャネルは前記差分信号を有する。
これは、多くの実施形態において、改善された性能を提供することができる。特に、予測及び非予測信号成分への差分信号の分割は、ステレオ信号における音源の異なる特性を反映するよう、異なる空間チャネルへの分配に特に適する信号を提供することができる。第1及び第2の空間チャネルは、具体的に、例えばステレオ信号の左右のチャネルであってよい。
本発明の任意の特徴に従って、前記分配回路は、前記出力オーディオチャネルの組の中の少なくとも1つの空間フロントサイドチャネルにおける予測信号電力が、前記出力オーディオチャネルの組の中のいずれかの空間サラウンドチャネル又は空間フロントセンターチャネルにおける予測信号電力の少なくとも2倍の大ききであるように、前記予測信号を分配するよう配置される。
これは、多くの実施形態において、改善された性能を提供することができる。特に、それは、改善された空間的経験を提供することができ、更に、適切に定められた音源の空間的位置が原のステレオ信号からそれらの位置をますます保つことを可能にすることができる。
本発明の任意の特徴に従って、前記分配回路は、前記出力オーディオチャネルの組の中の少なくとも1つの空間サイドチャネル又はサラウンドチャネルにおける非予測信号電力が、前記出力オーディオチャネルの組の中の空間フロントセンターチャネルにおける非予測信号電力の少なくとも2倍の大きさであるように、前記非予測信号を分配するよう配置される。
これは、多くの実施形態において、改善された性能を提供することができる。特に、それは、改善された空間的経験を提供することができ、更に、適切に定められた空間的位置に対応しそうにない音源が、それらがサララウンド経験を提供するように分配されることを可能にすることができる。
本発明の任意の特徴に従って、前記分配回路は、前記出力オーディオチャネルの組の中の前記空間サイドチャネル及びサラウンドチャネルのうちいずれか2つのチャネルの間の非予測信号電力における変化が6デシベルよりも大きくないように、前記非予測信号を分配するよう配置される。
これは、多くの実施形態において、改善された性能を提供することができ、特に、多くの筋書きにおいて、より実体験のように感じるサラウンド経験を提供することができる。
本発明の任意の特徴に従って、前記供給回路は、第1の空間チャネル及び第2の空間チャネルから和信号を生成するよう配置され、前記第2チャネルは前記和信号を有する。
これは、多くの実施形態において、改善された性能を提供することができる。特に、他のチャネルに関し予測信号を生成するよう和信号に適用される予測フィルタリングは、複数のチャネルにおいて存在しうる適切に定められた音源を示す予測信号を提供する。具体的に、それは、適切に定められた音源位置に対応する予測成分と、拡散した周囲音源(例えば、室内反響)に対応する非予測成分とに第1の信号を分離することを改善することができる。
第1及び第2の空間チャネルは、具体的に、例えばステレオ信号の左右のチャネルであってよい。
第2チャネルの対する和信号の使用は、具体的に、特に有利な動作及び性能を提供するよう、第1チャネルに対する差分信号の使用と組み合わされてよい。
本発明の任意の特徴に従って、前記供給回路は、第1の空間チャネル及び第2の空間チャネルから和信号を生成するよう配置され、前記第1チャネルは前記和信号を有する。
これは、多くの実施形態において、改善された性能を提供することができる。特に、予測及び非予測信号成分への和信号の分割は、ステレオ信号における音源の異なる特性を反映するよう、異なる空間チャネルへの分配に特に適する信号を提供する。
第1及び第2の空間チャネルは、具体的に、例えばステレオ信号の左右のチャネルであってよい。
本発明の任意の特徴に従って、前記分配回路は、前記出力オーディオチャネルの組の中の少なくとも1つの空間フロントセンターチャネルにおける非予測信号電力が、前記出力オーディオチャネルの組の中のいずれかの空間フロントサイドチャネルにおける非予測信号電力の少なくとも2倍の大きさであるように、前記非予測信号を分配するよう配置される。
これは、多くの筋書きにおいて、特に有利な動作及び/又は性能を提供することができる。具体的に、それは、中央に位置付けられた音源の中央チャネルへの改善された割り当てを可能にすることができる。
本発明の任意の特徴に従って、前記分配回路は、前記出力オーディオチャネルの組の中の少なくとも1つの空間フロントサイドチャネルにおける予測信号電力が、前記出力オーディオチャネルの組の中の空間フロントセンターチャネルにおける予測信号電力の少なくとも2倍の大きさであるように、前記予測信号を分配するよう配置される。
これは、多くの筋書きにおいて、特に有利な動作及び/又は性能を提供することができる。具体的に、それは、音源の正面ポジショニングを保ちながら、中央に位置付けられていない音源のサイドチャネルへの改善された割り当てを可能にすることができる。
本発明の任意の特徴に従って、前記供給回路は、第1の空間チャネル及び第2の空間チャネルから差分信号を生成するよう配置され、前記第2チャネルは前記差分信号を有する。
これは、多くの実施形態において、改善された性能を提供することができる。特に、和信号等の他のチャネルに関する予測信号を生成するために差分信号に適用される予測フィルタリングは、中央に位置付けられていない音源を示す予測信号と、中央に位置付けられた音源を示す非予測信号とを提供する。
第1及び第2の空間チャネルは、具体的に、例えばステレオ信号の左右のチャネルであってよい。
第2チャネルに対する差分信号の使用は、具体的に、特に有利な動作及び性能を提供するよう、第1チャネルに対する和信号の使用と組み合わされてよい。
本発明の任意の特徴に従って、前記第1チャネルは、前記第1の空間チャネル及び前記第2の空間チャネルのうちの一方に対応する。
これは、多くの実施形態において、改善された性能及び/又は容易化された動作を提供することができる。特に、それは、多くの場合に、改善された音響上演を提供するよう異なって分配されうる中央に位置付けられた音源及び中央に位置付けられていない音源への改善された分離を提供することができる。例えば、それは、発話等の中央の音源の改善された集束を提供することができる。
第1及び第2の空間チャネルは、具体的に、例えばステレオ信号の左右のチャネルであってよい。
本発明の任意の特徴に従って、前記分配回路は、前記非予測信号のゲイン係数の少なくとも2倍のゲイン係数を有して前記第1の空間チャネル及び前記第2の空間チャネルのうちの一方に対応する前記出力オーディオチャネルの組の中の空間チャネルに前記予測信号を分配するよう配置される。
これは、多くの筋書きにおいて、改善された性能を提供することができる。特に、それは、サイドチャネルにわたる中央位置の拡散が低減されることを可能にするとともに、中央チャネルの位置に対応するより具体的な予測位置を提供することができる。
本発明の任意の特徴に従って、前記分配回路は、前記第1の空間チャネル及び前記第2の空間チャネルのうちの一方に対応する前記出力オーディオチャネルの組の中の空間チャネルのゲイン係数の少なくとも2倍のゲイン係数を有して前記出力オーディオチャネルの組の中の空間センターチャネルに前記非予測信号を分配するよう配置される。
これは、多くの筋書きにおいて、改善された性能を提供することができる。特に、それは、サイドチャネルにわたる中央位置の不鮮明化が低減されることを可能にするとともに、中央チャネルの話者の位置に対応するより具体的な予測位置を提供することができる。
本発明の任意の特徴に従って、前記予測回路は、遅延された予測信号として前記予測信号を生成するよう配置される。
これは、多くの筋書きにおいて、改善された性能を提供することができ、特に、前記適応フィルタを適応させるときに信号の過去及び将来の両方のサンプルを含むことによって、第2チャネルの信号からの第1の信号のより正確な予測を可能にすることができる。
本発明の態様に従って、オーディオチャネルの第1の組から出力オーディオチャネルの組を生成する方法であって:前記オーディオチャネルの第1の組を供給するステップ;適応フィルタによる前記オーディオチャネルの第1の組の中の第2チャネルの信号の適応フィルタリングによって、前記オーディオチャネルの第1の組の中の第1チャネルに関し予測信号を生成するステップ;前記予測信号と前記第1チャネルの第1の信号との間の差を示すコスト関数を最小化するよう前記適応フィルタを適応させるステップ;前記第1の信号に前記予測信号を補償することによって、前記第1チャネルに関し非予測信号を生成するステップ;及び、出力オーディオ信号の組にわたって少なくとも前記予測信号と前記非予測信号とを分配することによって、前記出力オーディオチャネルの組を生成するステップを有し、前記分配は、前記予測信号及び前記非予測信号に関し異なる、方法が提供される。
本発明のこれらの及び他の態様、特徴及び利点は、以下で記載される実施形態から明らかであり、それらを参照して説明される。
本発明の実施形態について、一例として、図面を参照して記載する。
以下の記載は、2よりも多い空間チャネルを有するマルチチャネルへのステレオチャネルのアップミキシングに適用可能な本発明の実施形態に焦点を当てる。なお、当然のことながら、本発明はこの適用に限定されず、他の多くのオーディオ処理システムに適用されてよい。
図1は、入力チャネルの組から出力チャネルの組を生成するオーディオ装置の例を表す。オーディオ装置は、信号を予測部分及び非予測部分に分けるためにクロスチャネル予測フィルタリングを使用する。
このように、予測信号は、適応フィルタによって第2チャネルからの第2の信号をフィルタリングすることによって、第1チャネルからの第1の信号に関し生成される。適応フィルタは、可能な限り第1の信号に類似しており、従って、第1及び第2のフィルタの間の相関を反映する予測信号を生じさせるよう構成される。このように、予測信号成分は、少なくとも1つの他のチャネルにも存在しうる第1の信号の成分を反映する。このような筋書きは、例えば、適切に定められた位置を有する1又はそれ以上の特定の音源から生じ、従って、異なる空間チャネルの間で相関すると見込まれる成分に起因する。なお、残りの非予測信号は、分散した、拡散した、及びあまり定まっていない音源から生じると見込まれてよく、然るに、周囲音響を表すと考えられてよい。このように、クロスチャネル予測に基づく予測信号及び非予測信号への分離は、第1の信号が、異なる空間特性を有する異なるタイプの音響を表す信号に分割されることを可能にする。
図1のシステムは、出力チャネルにわたって異なって予測信号及び非予測信号を分配する。例えば、予測信号は、主に、適切に定められた音源位置の認知を可能にする特定の空間チャネルへ分配されてよく、一方、非予測信号は、より幅広く分配されてよく、具体的に、周囲環境経験を提供することを目的とするチャネルを含む更なるチャネルにわたって広げられてよい。
簡潔さ及び明りょうさのために、図1は、1つのチャネルのみが他の1つのチャネルに基づき予測信号及び非予測信号に分けられる例を表す。しかし、当然のことながら、他の実施形態においては、同じアプローチが複数のチャネルに適用されてよく、実際には、1つの信号/チャネルが複数の他のチャネルに基づき予測信号及び非予測信号に分けられてよい。
図1の例において、複数の信号が、1又はそれ以上の内部又は外部の音源から受信器101によって受信される。次いで、第1の信号x1(n)は、第2の信号x2(n)の適応予測フィルタリングに基づき予測信号成分yp(n)及び非予測信号成分ynp(n)に分けられる。
第2の信号x2(n)は、適応フィルタ103へ供給される。適応フィルタ103は、第2の信号x2(n)をフィルタリングして、予測信号yp(n)を生成するよう配置される。適応フィルタ103は、具体例において、適応FIR(有限インパルス応答)フィルタである。適応フィルタ103のフィルタ係数は、適応プロセッサ105によって与えられる。適応プロセッサ105は、フィルタ係数が第1の信号x1(n)と結果として起こる予測信号yp(n)との間の差を示すコスト関数を(例えば、第1の信号x1(n)と結果として起こる予測信号yp(n)との間の相互の情報の指標を最大化することによって)最小化するように、フィルタ係数を生成する。このように、適応フィルタ103は、第2の信号x2(n)のフィルタリングによって、予測信号yp(n)が可能な限り第1の信号x1(n)に類似しているように、適応プロセッサ105により適応される。このように、予測信号は、2つのチャネルの間を相互に関連づける第1の信号x1(n)の信号成分に相当する。
当然のことながら、適応フィルタ103は、他の処理を有してよく、非適応処理を有してもよいが、それは少なくとも1つの適応フィルタリング処理を有する。例えば、適応フィルタリングは、第2の信号x2(n)が適応フィルタ部によってフィルタリングされる前に、第2の信号x2(n)の固定の前置フィルタリングを含んでよい。結果として起こる信号は、更に、固定の後置フィルタによってポストフィルタリングされてよい。
当然のことながら、信号の予測フィルタリングのための多種多様なアプローチ及びアルゴリムが知られており、如何なる適切なアプローチ及び方法も本発明を損なうことなしに使用されてよい。例えば、適応フィルタ103は、FIRフィルタとして実施されてよいが、代替的に又は追加的に、IIR(無限インパルス応答)フィルタを有してよい。また、当然のことながら、予測フィルタリングを提供するよう適応フィルタを適応させるための多種多様なアルゴリズム及び方法が知られており、そのような適切なアルゴリズム及びアプローチのいずれもが本発明を損なうことなしに使用されてよい。例えば、適応プロセッサ105は、係数を決定するためにLMS(Least-Mean-Squares)、NLMS(Normalized Least-Mean-Squares)又はRLS(Recursive Least-Squares)適応アルゴリズムを使用してよい。
図1の装置は、更に、第1の信号x1(n)に関し非予測信号ynp(n)を生成するよう配置される。従って、装置は、補償プロセッサ107を有する。補償プロセッサ107は、第1の信号x1(n)に予測信号yp(n)を補償することによって非予測信号ynp(n)を生成するよう配置される。補償プロセッサ107は、適応フィルタ103に結合され、それから予測信号yp(n)を受信する。次いで、補償プロセッサ107は、第1の信号x1(n)に予測信号yp(n)を補償することによって非予測信号ynp(n)を生成する。具体例において、この補償は、第1の信号x1(n)からの予測信号yp(n)の単純な減算であり、すなわち、非予測信号は、ynp(n)=x1(n)−yp(n)によって与えられる。
装置は、分配プロセッサ109を更に有する。分配プロセッサ109は、適応フィルタ103及び保証プロセッサ107へ結合されており、予測信号yp(n)及び非予測信号ynp(n)を受信する。例において、分派プロセッサは、更に受信器101に結合されており、第2の信号xn(n)も受信する。
分配プロセッサ109は、予測信号yp(n)及び非予測信号ynp(n)、更に、例においては第2の信号x2(n)をオーディオ信号の出力される組にわたって分配することによって、オーディオチャネルの出力される組を生成するよう配置される。しかし、予測信号yp(n)の分配は、非予測信号ynp(n)の分配とは異なる。
特に、分配プロセッサ109は、自身が受信する信号の夫々から出力チャネルの夫々へ実効ゲインを導入してよく、このゲインは、少なくとも1つのチャネルに関し予測信号yp(n)及び非予測信号ynp(n)によって異なってよい。特に、ゲインは、例えば、幾つかのチャネルについて非予測信号ynp(n)に関しては零であるが、予測信号yp(n)に関しては零でなく、結果として、予測信号yp(n)はこのチャネルに分配されるが、非予測信号ynp(n)はこのチャネルに分配されない。
幾つかの実施形態において、分配は、例えば、予測信号yp(n)及び非予測信号ynp(n)に関し異なる周波数応答を有することによって、他の態様においては異なってよい。
予測信号yp(n)及び非予測信号ynp(n)は異なるタイプの音響特性を表し、具体的には、通常、異なる空間特性を表しうるので、分配は、これを反映するよう最適化されてよく、例えば、改善された空間的ユーザ経験を提供するために使用されてよい。
以下、空間マルチチャネルへのステレオチャネルのアップミキシングを目的とする具体例について、より詳細に説明する。例においては、5つのチャネル出力信号がステレオ入力信号から生成される。具体的に、例においては、右(R)及び左(L)信号が受信され、センター(C)、レフトフロント(lf)、ライトフロント(rf)、レフトサラウンド(ls)及びライトサラウンド(rs)に対応する5つの空間信号が生成される。
具体的なシステムは図2に表されており、図1に関して先に記載されたのと同じ要素を有する。しかし、図2のシステムでは、受信されるステレオ信号は、直接的に使用されず、むしろ最初に和信号(通常、ミッド信号と呼ばれる。)と差分信号(通常、サイド信号と呼ばれる。)とに変換される。具体例において、ミッド(和)信号mは、加算回路201によって、m=R+Lとして生成される。同様に、サイド(差分)信号sは、減算回路203によって、s=R−Lとして生成される。
当然のことながら、特定の和信号及び差分信号(ミッド信号及びサイド信号)は他の実施形態においては異なってよく、特に、重みが、和信号及び差分信号(ミッド信号及びサイド信号)の計算において、左右信号に適用されてよい。また、当然のことながら、ミッド信号及びサイド信号を生成する機能は、受信器101の部分であると考えられてよい。
例において、ミッド信号及びサイド信号は受信器101へ供給される。受信器101は、図1を参照して説明された予測フィルタリングを実行する。特に、予測信号及び非予測信号が、ミッド信号の適応フィルタリングによって、サイド信号に関し生成される。このように、システムにおいて、予測フィルタは、ミッド信号からサイド信号を予測するために使用される。これは、
ミッド信号m及び
このように、予測フィルタ103は、原の2つの信号から3つの信号を生成する。これら3つの信号は、次いで、分配プロセッサ109によって5つの出力信号に分配される。
具体的に、分配プロセッサ109は、分配行列Uを用いて、複雑性が低いマトリクス乗算を適用してよい:
実際に、システムにおいて、予測信号は、支配的にフロントサイドスピーカから提示されるように分配される。このように、予測信号は、主に、望ましくは左右両方のフロントチャネルに供給される。特に、有利な性能及び、特に、改善された空間的経験は、予測信号から生じる少なくとも1つのフロントサイドチャネルにおける信号成分からの信号電力が、空間サラウンドチャネル又は空間フロントセンターチャネルのいずれかにおけるそのような成分からの予測信号電力の少なくとも2倍の大きさである場合に、達成されることが分かっている。実際に、多くの実施形態において、予測信号は、フロントサイドチャネルにのみ(通常は一様に)分配されてよい。
このように、システムは、具体的に、
[外3]
が、主に左右のチャネルに共通でない情報を含み、従って、分散した音響位置を表すが、適切に定められた音源位置を示し、従って、聴取者の前に特定の位置で提示されるよう意図されると思われる、ことを利用する。
が、主に左右のチャネルに共通でない情報を含み、従って、分散した音響位置を表すが、適切に定められた音源位置を示し、従って、聴取者の前に特定の位置で提示されるよう意図されると思われる、ことを利用する。
分配プロセッサ109は、更に、ミッド信号mをフロントチャネルに分配するよう配置されてよく、具体的には、主にこれをセンターチャネル並びに左右のフロントチャネルに分配してよい。これは、左右のチャネルの和信号が、一般的に、主に、2つのチャネルの間で相関する音源からの音響を含み、従って、ユーザの前方から再生されるよう意図される音響に対応すると思われる、ことを反映する。
更に、非予測信号は、むしろ拡散的に提示されるように、分配される。実際に、非予測信号は、全てのチャネルに、又はより一般的には、センターチャネルを除く全てのチャネルに分配されてよい。これは、非予測信号が、様々な方向から、及び主にユーザのすぐ前以外の他の方向からユーザに達することをもたらす。これは、比較的拡散的且つ非集束的な空間認知を提供し、かかる認知は、特に、拡散した周囲音響(例えば、室内反響)により生じる可能性が高い信号成分にとって望ましい。
特に、有利な性能は、2つのフロントサイドチャネルの間又は2つのサラウンドチャネルの間の、非予測信号から生ずる電力における変化が6デシベルよりも大きくない場合に、達成され得ることが分かっている。加えて、有利な性能は、1つのフロントサイドチャネルにおいて非予測信号から生じる電力が、サラウンドチャネルにおいて生じる電力よりも5倍低い場合に、達成され得ることが分かっている。
実際に、非予測サイド信号の分配は実験的に評価されている。幾つかの筋書きにおいて、もっぱらサラウンドチャネルにおける信号に焦点を当てることは、それらの位置からの過度の信号をもたらす傾向があることが分かった。また、フロント及びサラウンドサイドチャネルにおける一様な分配は、サラウンド音源から認知される信号が少なすぎることをもたらすことが分かった。道理にかなった譲歩が、4分の1のエネルギがフロントサイドチャネルに供給され、残りのエネルギがサラウンドチャネルに分配されることに関して、見出された。
また、サイド及びサラウンドチャネルのうち少なくとも1つにおいて非予測信号成分から生じる成分の電力は、フロントセンターチャネルにおけるそれの少なくとも2倍の大きさであることが特に有利であることが分かっている。
このように、出力チャネルにわたる異なる信号の分配は、信号が存在しうる音響の固有の特性を反映する。更に、システムは、ステレオ記録を生成する場合に記録技師によって行われる典型的な音響上演を考慮するように、信号を分配する。例えば、ほとんどの音楽記録は、ユーザの前方の音響ステージにおける様々な特定の位置に特定の重要な楽器を配置して、周囲ノイズ又は重要でない楽器を音響ステージにわたって広げる傾向がある。記載されるシステムは、このアプローチの認識を用いて、1次元の音響ステージを、主たる音源(例えば、主要な楽器)の位置付けを実質的に保ちながら、ユーザを囲む2次元音響ステージへ拡張する。このように、当該アプローチは、個々の音源について正確な音響ステージを依然として保ちながら、より実体験のように感じるサラウンドサウンド経験を提供することができる。
更に、アプローチは、低い複雑性を有して達成可能であり、且つ、低い計算リソースコストを有して非常に効率的な実施を可能にすることができる。実際に、適応フィルタリングは、時間領域に実行されてよく、分配プロセッサ109は、時間領域において信号に適用される簡単なマトリクス演算を実施してよい。このように、分配及びアップミキシングは、如何なる周波数変換又は個々の時間周波数ブロックの如何なる特性若しくは処理手続きも必要としない。
具体例として、分配プロセッサ109は、次のように与えられる単純行列を実施してよい:
係数a、b、d、fは、具体的に、
[外4]
の総エネルギが5つの出力信号の総エネルギに対応するように、選択される。例えば、a=f=√2/2、b=d=0.5。行列のスケーリング係数は、ミッド信号及びサイド信号への左右の信号のマッピングによるエネルギの増大を補償するよう導入される。
の総エネルギが5つの出力信号の総エネルギに対応するように、選択される。例えば、a=f=√2/2、b=d=0.5。行列のスケーリング係数は、ミッド信号及びサイド信号への左右の信号のマッピングによるエネルギの増大を補償するよう導入される。
このように、システムは、音響の2つの異なる分類を表すとのオーディオ信号の考慮に基づく、チャネルフォーマット変換のための、リソースコストが安い方法を用いる。第1の分類は、特定の空間位置を夫々有する適切に定められた音源に関連する。第2の分類は、更なる周囲音響、すなわち、より明りょうな空間位置を欠いた音響又は音響成分から成る。この分離は、以下の観点において、フォーマット変換にとって特に有益である。フォーマット変換を行う場合に、適切に定められた音源は変換時に実質的に同じ空間位置を保つことが望まれる。しかし、周囲オーディオコンテンツの位置は、よりずっと自由に操作されてよい。
従って、システムは、周囲及び非周囲信号部分の、リソースコストが安い推定と、その後の、出力チャネルへの周囲及び非周囲信号部分の異なるマッピングとから成る2段階プロシージャを用いる。周囲及び非周囲信号は、信号を予測及び非予測成分に分けるクロスチャネル適応フィルタリングによって得られる。このような信号の分割は、原則的に、帯域全体にわたって実行され(時間周波数分析を回避する。)、リソースコストが安い適応フィルタの使用によって生じる。予測及び非予測成分は、夫々、非周囲及び周囲信号の良好な推定を提供する。予測及び非予測成分への分割は、チャネル間の関係が把握されるという利点を有し、これは、それらの成分を出力チャネルにわたって分配する場合に、よりずっと良く空間ステレオイメージを保つことを可能にする。
次のステップは、意図されるフォーマット又は再生システムへのそれらの成分のマッピングである。このような信号成分のマッピング又は分配は、周囲及び非周囲信号成分ごとに実質的に異なる。すなわち、各信号成分は、それ自身の分配係数の組と関連づけられる。
このようなマッピングは原のフォーマット及び意図されるフォーマット又は再生システムに依存する。しかし、具体例において、ミッド及び予測可能なサイド信号の分配は、空間的イメージが実質的に保たれるように為される。すなわち、それらは、主に、フロンチャネルに分配される。対照的に、サイド信号の非予測部分は、明りょうな空間的イメージをもたらさない。すなわち、それは、より周辺的な特徴を備え、フロント及びリアチャネル又は主にリアチャネルにマッピングされて、より実体験のように感じるサラウンド経験を作り出すことができる。
予測フィルタは、具体的に、線形フィルタリングにより多数のリグレッサ(regressor)信号yi(i=1,・・・,K)を生成することによって、生成されてよい。これは、例えば、タップ付き遅延線、全域通過フィルタ等によってよい。次いで、
幾つかの実施形態において、予測は、遅延された予測信号として予測信号を生成してよい。このように、実施形態は、サイド信号の遅延されたものを予測してよい。すなわち、実施形態は、Dが適切な遅延である場合に、
[外6]
を生成してよい。これは、予測が(ミッド及びサイド信号の両方に関し)将来及び過去両方のサンプルに基づくことを可能にする。そのような遅延が適用される場合に、分配プロセッサ109に供給される信号を同期させることが必要であり、特に、ミッド信号は存続期間Dだけ遅延されてよい。
を生成してよい。これは、予測が(ミッド及びサイド信号の両方に関し)将来及び過去両方のサンプルに基づくことを可能にする。そのような遅延が適用される場合に、分配プロセッサ109に供給される信号を同期させることが必要であり、特に、ミッド信号は存続期間Dだけ遅延されてよい。
上記の例において、予測及び非予測信号成分はサイド信号に関し生成された。しかし、代替的に又は付加的に、予測及び非予測信号成分はミッド信号に関し生成されてよい。
実際に、幾つかの実施形態において、ミッド信号に係る予測信号成分は、サイド信号の適応フィルタリングによって生成されてよい。次いで、非予測信号は、ミッド信号にこの予測信号を補償することによって、生成されてよい。次いで、ミッド信号の予測及び非予測部分の分配は、出力チャネルにわたって異なって分配されてよい。そのようなアプローチは、サイド信号の処理手続きとは無関係であってよく、具体的に、サイド信号に関し如何なる分析又は分離も行われることなしに、実行されてよい。具体例として、分配プロセッサ109は、予測ミッド信号、非予測ミッド信号、及びサイド信号を受信してよく、出力チャネルを生成するよう3×5行列を適用してよい。
なお、多くの実施形態において、改善された性能は、ミッド及びサイド信号の両方を分離することによって、達成され得る。このように、ミッド信号mの適応フィルタリングによって
そのようなシステムの例が図4に示されている。例において、左右入力信号がミッド/サイド(M/S)プロセッサ401に供給される。M/Sプロセッサ401は、図2のシステムに関し説明されたように、ミッド信号m及びサイド信号sを生成する。次いで、ミッド信号m及びサイド信号sは予測プロセッサ403に供給される。予測プロセッサ403は、図1及び図2に関し記載されたものに対応する適応フィルタリングによって、
更に、分配は、非予測ミッド信号emを、これが差分信号と相関しない(すなわち、適切に定められた非中央の音源に対応しそうにない)ミッド信号の要素であることを反映するよう、主にセンターチャネルに分配しようとする。特に、有利な性能は、センターチャネルにおける非予測信号電力(非予測ミッド信号emからの電力)がいずれかの空間フロントセンターサイドチャネル(及び一般的にいずれかのサラウンドチャネル)の非予測信号電力の少なくとも2倍の大きさである場合に、達成され得ることが分かっている。
更に、非予測サイド信号の分配は、主にサラウンド信号に対してであってよく、具体的に、ミッド信号の処理手続きを反映するようフロントサイド信号を無視してよい。
具体例として、以下のアップミキシング行列が使用されてよい:
幾つかのシステムにおいては、低周波チャネルが生成されてもよい。これは、例えば、左右両方の信号に低域通過フィルタを適用して、これら2つの信号を足し合わせ、和信号を低周波チャネルに関し用いることによって、行われてよい。被低域通過フィルタリング信号は、被高域通過フィルタリング信号を生成するよう、原の入力信号から減じられてよい。それらの被高域通過フィルタリング信号は、その後に、記載されるアップミキシングシステムの入力信号として使用され得る。
図6は、クロスチャネル予測フィルタリングを用いる他の応用例を表す。システムは、異なる音源の改善された分離を提供するために当該アプローチを用い、特に、サイドチャネルにおいては中央の音源の成分を低減しながら、センターチャネルに対する中央の音源の改善された集束を提供しようとする。そのようなアプローチは、具体的に、例えば、ステレオミックスから中央の音源を分離することに適する。これは、例えば、ステレオ記録における会話又は他の発話の明瞭性を高めることができる。
例において、クロスチャネル予測フィルタリングは、サイド信号に基づく左(及び/又は右)ステレオ信号に関し予測信号を決定するために使用される。この予測信号は、左チャネルのうちどの程度が非中央音源に対応するのかを示す。次いで、左(及び/又は右)信号は、中央位置に対応する左(及び/又は右)信号の部分に対応する非予測信号を生成するよう、予測信号を補償される。次いで、サイドチャネルは、主に予測信号から生成され、それにより、中央の音源に関係する左右の信号の如何なる成分も抑制する。更に、センターチャネルが、左右のチャネルからの非予測信号から生成されてよい。
システムはミッド/サイドプロセッサ601を有する。ミッド/サイドプロセッサ601は、左信号xl(n)及び右信号xr(n)を受信し、xd(n)=wlxl(n)−wrxr(n)に従って差分信号xd(n)を生成する。ここで、wl及びwrは、例えば、主成分分析(PCA)(Principal Component Analysis)によって決定されてよく、あるいは、例えば、wl=wr=1のように一定であってよい。後者の場合に、差分信号は、厳密にステレオミックスにおけるセンターにパンされていない信号成分しか含まない。
次いで、結果として起こる差分信号は、2つの予測回路603及び605に供給される。予測回路603及び605の夫々は、左右の信号の夫々について予測信号成分を生成するために使用される適応FIRフィルタを有する。このように、(左チャネル用の)第1の予測回路603の適応フィルタは、差分信号のフィルタリングが、予測信号と左信号との間の差分を示す基準を最適化する(例えば、コスト関数を最小化する)ように、適応される。同じアプローチが、第2の予測回路605によって右チャネルに適用される。
具体的に、第1の予測回路に関し、適応フィルタは、rl(n)=xl(n)−yl(n)によって与えられる左残留信号のエネルギを最小化するよう適応される。ここで、次の式は、適応フィルタのフィルタリングを表す:
左右のチャネルの夫々の予測信号は、このようにして、yl(n)及びyr(n)によって与えられる。左チャネルに係る予測信号yl(n)は減算回路607に供給される。減算回路607は、左チャネル信号xl(n)から予測信号yl(n)を減じることによって、左チャネルに係る非予測信号zl(n)を生成する。同様に、右チャネルに係る予測信号yr(n)は減算回路609に供給される。減算回路609は、右チャネル信号xr(n)から予測信号yr(n)を減じることによって、右チャネルに係る非予測信号zr(n)を生成する。
このように、処理は、左右夫々のチャネルについての予測信号成分及び非予測信号成分に対応する4つの信号成分を生成する。このとき、予測信号成分は、差分信号の予測フィルタリングによって生成される。
次いで、システムは、3つのチャネル、すなわち、左、右及び中央のチャネル(例えば、システムはサラウンドチャネルを有さない。)にわたって、それら4つの信号を分配する。実際には、具体例において、予測信号は主に右/左チャネルに供給され、実際に、特に有利な性能は、左右のチャネルのうち一方に対する予測信号のゲイン係数が中央のチャネルに対するゲイン係数の少なくとも2倍である場合に、見出されている。このように、予測信号は主にサイドチャネルに供給される。更に、サイドチャネルへの非予測信号の分配は、通常は、よりずっと低く、実際には、具体例において、サイドチャネルに対する対応する予測信号のゲイン係数は、非予測信号の少なくとも2倍である。実際に、例において、サイドチャネルは、非予測信号からの寄与成分しか有さず、予測信号からの寄与成分を有さない。然るに、サイドチャネルは、差分信号と相関する信号成分しか含まないので、非中央音源の如何なる寄与成分も持っていない。
更に、非予測信号成分は中央のチャネルに分配され、具体的に、左右のチャネルからの非予測信号成分は具体例において結合器611で結合され、結合器611はセンターチャネルCを生じさせる。なお、例において、予測信号からの寄与成分のみが実質的に低減され、具体例においては、予測信号は、センターチャネルに如何なる寄与成分も与えない。
特に、特に有利な性能は、センターチャネルに対する非予測信号のゲイン係数が予測信号のゲイン係数の少なくとも2倍である場合に、達成され得ることが分かっている。
また、特に、特に有利な性能は、非予測信号が、サイドチャネルへの非予測信号の分配に適用されるゲイン係数の少なくとも2倍のゲイン係数を有してセンターチャネルに分配される場合に、達成され得ることが分かっている。このように、非予測信号は主にセンターチャネルに分配される。
このように、図6の記載されるシステムは、中央部及び側部の音源の極めて有効な分離を提供する。更に、それは、中央の音源をサイドチャネルから実質的に減じ又は除去して、それらをセンターチャネルに集束させることができる。このようなアプローチは、多くの筋書きにおいて、改善された性能を提供することができ、具体的に、ステレオ記録において中央の音声の改善された明瞭性を可能にすることができる。
図6のシステムの動作は、具体例によって説明される。例において、受信されるステレオ信号は、ノイズの3つの分離された帯域から成る。ノイズ帯域の1つは、ステレオイメージにおいて厳密に中央にパンされる。残り2つのノイズ帯域は、イメージにおいて極右及び極左にパンされる。信号のスペクトルが図7に表されている。差分信号はこの場合にωl=ωr=1を用いて計算され、差分信号のスペクトルは図8に表されている。図8は、また、参照用に和信号のスペクトルも表している。
左右の予測信号(左右の出力チャネルに対応)及びセンターチャネル信号のスペクトルが図9に表されている。
表されているように、アプローチは、ステレオ混合からの3つの成分の分離を達成する。この合成例において、サイドチャネルへのセンターチャネルの漏れは、極めて低いレベルにある。左右のチャネルは互いに漏れる。しかし、漏れ音響のレベルは、30デシベル以上所望の音響のレベルを下回っている。加えて、図9においては、中央にパンされる音源が残留信号(非予測信号)のスペクトルを決定づけることが見られる。若干の漏れがサイド信号からセンターチャネルに起こるが、レベルは、約20デシベルだけ所望の中央音源のレベルを下回っている。
当然のことながら、以上の記載は、明りょうさのために、機能ごとの回路、ユニット及びプロセッサを参照して本発明の実施形態を記載してきた。しかし、機能ごとの回路、ユニット又はプロセッサの間の機能の如何なる適切な分配も、本発明を損なうことなく使用されてよいことは明らかである。例えば、別個のプロセッサ又はコントローラによって実行されるよう表されている機能が同じプロセッサ又はコントローラによって実行されてよい。従って、特定の機能ユニットへの言及は、厳密な論理的又は物理的構造又は体系を示しているわけではなく、単に、記載される機能を提供する適切な手段への言及と見なされるべきである。
本発明は、ハードウェア、ソフトウェア、ファームウェア又はそれらのいずれかの組み合わせを含む如何なる適切な形態においても実施されてよい。本発明は、任意に、1又はそれ以上のデータプロセッサ及び/又はデジタル信号プロセッサで実行されるコンピュータソフトウェアとして少なくとも部分的に実施されてよい。本発明の実施形態の要素及び部品は、如何なる適切な方法においても物理的、機能的及び論理的に実施されてよい。実際に、機能は、単一のユニットにおいて、複数のユニットにおいて、又は他の機能ユニットの部分として、実施されてよい。そのようなものとして、本発明は単一のユニットにおいて実施されてよく、あるいは、異なるユニット及びプロセッサの間で物理的及び機能的に分配されてよい。
本発明は幾つかの実施形態に関連して記載されてきたが、ここに挙げられている特定の形態に限定されるよう意図されない。むしろ、本発明の適用範囲は、添付の特許請求の範囲によってのみ制限される。更に、特徴は特定の実施形態に関連して記載されているように見えることがあるが、記載される実施形態の様々な特徴は本発明に従って組み合わされてよいことが当業者には認識されるであろう。特許請求の範囲において、語「有する(comprising)」は、他の要素又はステップの存在を除外しない。
更に、たとえ個々に挙げられているとしても、複数の回路、手段、要素又は方法ステップは、例えば、単一のユニット又はプロセッサによって、実施されてよい。更に、個々の特徴が異なる請求項に含まれることがあるが、それらは場合により有利に組み合わされてよく、異なる請求項における包含は、特徴の組み合わせが実行可能でなく及び/又は有利でないことを暗示しているわけではない。また、1つのカテゴリの請求項における特徴の包含は、このカテゴリに制限されることを暗示するものではなく、むしろ、その特徴が、必要に応じて、他のカテゴリの請求項に同様に適用可能であることを示す。更に、特許請求の範囲における特徴の順序は、特徴が実行されるべき具体的な順序を暗示するものではなく、特に、方法の請求項における個々のステップの順序は、その順序がこの順序において実行されるべきことを暗示するものではない。むしろ、ステップは、如何なる適切な順序においても実行されてよい。加えて、単数参照は複数個を除かず、従って、「1つの(a又はan)」、「第1」及び「第2」等への言及は複数個を除かない。特許請求の範囲における参照符号は、単に、明らかな例として提供されており、特許請求の範囲の適用範囲を限定するものとして決して解されるべきではない。
前記供給回路は、第1の空間チャネル及び第2の空間チャネルから差分信号を生成するよう配置され、前記第1チャネルは前記差分信号を有する。
前記分配回路は、前記出力オーディオチャネルの組の中の少なくとも1つの空間フロントサイドチャネルにおける予測信号電力が、前記出力オーディオチャネルの組の中のいずれかの空間サラウンドチャネル又は空間フロントセンターチャネルにおける予測信号電力の少なくとも2倍の大ききであるように、前記予測信号を分配するよう配置される。
本発明の態様に従って、オーディオチャネルの第1の組から出力オーディオチャネルの組を生成する方法であって:前記オーディオチャネルの第1の組を供給するステップ;適応フィルタによる前記オーディオチャネルの第1の組の中の第2チャネルの信号の適応フィルタリングによって、前記オーディオチャネルの第1の組の中の第1チャネルに関し予測信号を生成するステップ;前記予測信号と前記第1チャネルの第1の信号との間の差を示すコスト関数を最小化するよう前記適応フィルタを適応させるステップ;前記第1の信号に前記予測信号を補償することによって、前記第1チャネルに関し非予測信号を生成するステップ;及び、出力オーディオ信号の組にわたって少なくとも前記予測信号と前記非予測信号とを分配することによって、前記出力オーディオチャネルの組を生成するステップを有し、前記分配は、前記予測信号及び前記非予測信号に関し異なり、前記オーディオチャネルの第1の組を供給するステップは、第1の空間チャネル及び第2の空間チャネルから差分信号及び和信号を生成することを含み、前記第1チャネルは前記差分信号及び前記和信号の一方を有し、前記第2チャネルは前記差分信号及び前記和信号の他方を有し、前記出力オーディオチャネルの組を生成するステップは、前記出力オーディオチャネルの組の中の少なくとも1つの空間フロントサイドチャネルにおける予測信号電力が、前記出力オーディオチャネルの組の中のいずれかの空間サラウンドチャネル又は空間フロントセンターチャネルにおける予測信号電力の少なくとも2倍の大ききであるように、前記予測信号を分配することを含む、方法が提供される。
Claims (15)
- オーディオチャネルの第1の組から出力オーディオチャネルの組を生成する装置であって:
前記オーディオチャネルの第1の組を供給する供給回路;
適応フィルタによる前記オーディオチャネルの第1の組の中の第2チャネルの信号の適応フィルタリングによって、前記オーディオチャネルの第1の組の中の第1チャネルに関し予測信号を生成する予測回路;
前記予測信号と前記第1チャネルの第1の信号との間の差を示すコスト関数を最小化するよう前記適応フィルタを適応させる回路;
前記第1の信号に前記予測信号を補償することによって、前記第1チャネルに関し非予測信号を生成する回路;及び
出力オーディオ信号の組にわたって少なくとも前記予測信号と前記非予測信号とを分配することによって、前記出力オーディオチャネルの組を生成する分配回路
を有し、
前記分配は、前記予測信号及び前記非予測信号に関し異なる、装置。 - 前記供給回路は、第1の空間チャネル及び第2の空間チャネルから差分信号を生成するよう配置され、前記第1チャネルは前記差分信号を有する、
請求項1に記載の装置。 - 前記分配回路は、前記出力オーディオチャネルの組の中の少なくとも1つの空間フロントサイドチャネルにおける予測信号電力が、前記出力オーディオチャネルの組の中のいずれかの空間サラウンドチャネル又は空間フロントセンターチャネルにおける予測信号電力の少なくとも2倍の大ききであるように、前記予測信号を分配するよう配置される、
請求項2に記載の装置。 - 前記分配回路は、前記出力オーディオチャネルの組の中の少なくとも1つの空間サイドチャネル又はサラウンドチャネルにおける非予測信号電力が、前記出力オーディオチャネルの組の中の空間フロントセンターチャネルにおける非予測信号電力の少なくとも2倍の大きさであるように、前記非予測信号を分配するよう配置される、
請求項2に記載の装置。 - 前記分配回路は、前記出力オーディオチャネルの組の中の前記空間サイドチャネル及びサラウンドチャネルのうちいずれか2つのチャネルの間の非予測信号電力における変化が6デシベルよりも大きくないように、前記非予測信号を分配するよう配置される、
請求項4に記載の装置。 - 前記供給回路は、第1の空間チャネル及び第2の空間チャネルから和信号を生成するよう配置され、前記第2チャネルは前記和信号を有する、
請求項1に記載の装置。 - 前記供給回路は、第1の空間チャネル及び第2の空間チャネルから和信号を生成するよう配置され、前記第1チャネルは前記和信号を有する、
請求項1に記載の装置。 - 前記分配回路は、前記出力オーディオチャネルの組の中の少なくとも1つの空間フロントセンターチャネルにおける非予測信号電力が、前記出力オーディオチャネルの組の中のいずれかの空間フロントサイドチャネルにおける非予測信号電力の少なくとも2倍の大きさであるように、前記非予測信号を分配するよう配置される、
請求項7に記載の装置。 - 前記分配回路は、前記出力オーディオチャネルの組の中の少なくとも1つの空間フロントサイドチャネルにおける予測信号電力が、前記出力オーディオチャネルの組の中の空間フロントセンターチャネルにおける予測信号電力の少なくとも2倍の大きさであるように、前記予測信号を分配するよう配置される、
請求項9に記載の装置。 - 前記供給回路は、第1の空間チャネル及び第2の空間チャネルから差分信号を生成するよう配置され、前記第2チャネルは前記差分信号を有する、
請求項1に記載の装置。 - 前記第1チャネルは、前記第1の空間チャネル及び前記第2の空間チャネルのうちの一方に対応する、
請求項10に記載の装置。 - 前記分配回路は、前記非予測信号のゲイン係数の少なくとも2倍のゲイン係数を有して前記第1の空間チャネル及び前記第2の空間チャネルのうちの一方に対応する前記出力オーディオチャネルの組の中の空間チャネルに前記予測信号を分配するよう配置される、
請求項11に記載の装置。 - 前記分配回路は、前記第1の空間チャネル及び前記第2の空間チャネルのうちの一方に対応する前記出力オーディオチャネルの組の中の空間チャネルのゲイン係数の少なくとも2倍のゲイン係数を有して前記出力オーディオチャネルの組の中の空間センターチャネルに前記非予測信号を分配するよう配置される、
請求項11に記載の装置。 - 前記予測回路は、遅延された予測信号として前記予測信号を生成するよう配置される、
請求項1に記載の装置。 - オーディオチャネルの第1の組から出力オーディオチャネルの組を生成する方法であって:
前記オーディオチャネルの第1の組を供給するステップ;
適応フィルタによる前記オーディオチャネルの第1の組の中の第2チャネルの信号の適応フィルタリングによって、前記オーディオチャネルの第1の組の中の第1チャネルに関し予測信号を生成するステップ;
前記予測信号と前記第1チャネルの第1の信号との間の差を示すコスト関数を最小化するよう前記適応フィルタを適応させるステップ;
前記第1の信号に前記予測信号を補償することによって、前記第1チャネルに関し非予測信号を生成するステップ;及び
出力オーディオ信号の組にわたって少なくとも前記予測信号と前記非予測信号とを分配することによって、前記出力オーディオチャネルの組を生成するステップ
を有し、
前記分配は、前記予測信号及び前記非予測信号に関し異なる、方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP09161998 | 2009-06-05 | ||
EP09161998.1 | 2009-06-05 | ||
PCT/IB2010/052412 WO2010140105A2 (en) | 2009-06-05 | 2010-05-31 | Processing of audio channels |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012529216A true JP2012529216A (ja) | 2012-11-15 |
Family
ID=42983206
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012513712A Pending JP2012529216A (ja) | 2009-06-05 | 2010-05-31 | オーディオ信号のアップミキシング |
Country Status (7)
Country | Link |
---|---|
US (1) | US20120076307A1 (ja) |
EP (1) | EP2438593A2 (ja) |
JP (1) | JP2012529216A (ja) |
KR (1) | KR20120032000A (ja) |
CN (1) | CN102804262A (ja) |
RU (1) | RU2011154112A (ja) |
WO (1) | WO2010140105A2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014535182A (ja) * | 2011-09-29 | 2014-12-25 | ドルビー・インターナショナル・アーベー | 予測ベースのfmステレオ・ノイズ削減 |
WO2019155603A1 (ja) * | 2018-02-09 | 2019-08-15 | 三菱電機株式会社 | 音響信号処理装置及び音響信号処理方法 |
JP7410282B2 (ja) | 2019-10-10 | 2024-01-09 | ブームクラウド 360 インコーポレイテッド | スペクトル直交オーディオ成分を用いたサブバンド空間処理およびクロストーク処理 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2544466A1 (en) * | 2011-07-05 | 2013-01-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for decomposing a stereo recording using frequency-domain processing employing a spectral subtractor |
EP3081014A4 (en) * | 2013-12-13 | 2017-08-09 | Ambidio, Inc. | Apparatus and method for sound stage enhancement |
KR102603621B1 (ko) | 2019-01-08 | 2023-11-16 | 엘지전자 주식회사 | 신호 처리 장치 및 이를 구비하는 영상표시장치 |
CN112135226B (zh) * | 2020-08-11 | 2022-06-10 | 广东声音科技有限公司 | Y轴音频再生方法以及y轴音频再生系统 |
CN113194400B (zh) * | 2021-07-05 | 2021-08-27 | 广州酷狗计算机科技有限公司 | 音频信号的处理方法、装置、设备及存储介质 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5434948A (en) * | 1989-06-15 | 1995-07-18 | British Telecommunications Public Limited Company | Polyphonic coding |
US7412380B1 (en) * | 2003-12-17 | 2008-08-12 | Creative Technology Ltd. | Ambience extraction and modification for enhancement and upmix of audio signals |
US7725324B2 (en) * | 2003-12-19 | 2010-05-25 | Telefonaktiebolaget Lm Ericsson (Publ) | Constrained filter encoding of polyphonic signals |
EP1769491B1 (en) * | 2004-07-14 | 2009-09-30 | Koninklijke Philips Electronics N.V. | Audio channel conversion |
CN101091208B (zh) * | 2004-12-27 | 2011-07-13 | 松下电器产业株式会社 | 语音编码装置和语音编码方法 |
US8335330B2 (en) * | 2006-08-22 | 2012-12-18 | Fundacio Barcelona Media Universitat Pompeu Fabra | Methods and devices for audio upmixing |
KR101438389B1 (ko) * | 2007-11-15 | 2014-09-05 | 삼성전자주식회사 | 오디오 매트릭스 디코딩 방법 및 장치 |
-
2010
- 2010-05-31 KR KR1020127000119A patent/KR20120032000A/ko not_active Application Discontinuation
- 2010-05-31 CN CN2010800247663A patent/CN102804262A/zh active Pending
- 2010-05-31 US US13/375,035 patent/US20120076307A1/en not_active Abandoned
- 2010-05-31 WO PCT/IB2010/052412 patent/WO2010140105A2/en active Application Filing
- 2010-05-31 JP JP2012513712A patent/JP2012529216A/ja active Pending
- 2010-05-31 EP EP10728308A patent/EP2438593A2/en not_active Withdrawn
- 2010-05-31 RU RU2011154112/08A patent/RU2011154112A/ru unknown
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014535182A (ja) * | 2011-09-29 | 2014-12-25 | ドルビー・インターナショナル・アーベー | 予測ベースのfmステレオ・ノイズ削減 |
WO2019155603A1 (ja) * | 2018-02-09 | 2019-08-15 | 三菱電機株式会社 | 音響信号処理装置及び音響信号処理方法 |
JP7410282B2 (ja) | 2019-10-10 | 2024-01-09 | ブームクラウド 360 インコーポレイテッド | スペクトル直交オーディオ成分を用いたサブバンド空間処理およびクロストーク処理 |
Also Published As
Publication number | Publication date |
---|---|
WO2010140105A2 (en) | 2010-12-09 |
RU2011154112A (ru) | 2013-07-20 |
US20120076307A1 (en) | 2012-03-29 |
EP2438593A2 (en) | 2012-04-11 |
WO2010140105A3 (en) | 2011-01-27 |
KR20120032000A (ko) | 2012-04-04 |
CN102804262A (zh) | 2012-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7183467B2 (ja) | 少なくとも一つのフィードバック遅延ネットワークを使ったマルチチャネル・オーディオに応答したバイノーラル・オーディオの生成 | |
JP7139409B2 (ja) | 少なくとも一つのフィードバック遅延ネットワークを使ったマルチチャネル・オーディオに応答したバイノーラル・オーディオの生成 | |
RU2640647C2 (ru) | Устройство и способ преобразования первого и второго входных каналов, по меньшей мере, в один выходной канал | |
US8553895B2 (en) | Device and method for generating an encoded stereo signal of an audio piece or audio datastream | |
JP2012529216A (ja) | オーディオ信号のアップミキシング | |
JP5384721B2 (ja) | 音響エコー抑制ユニットと会議開催フロントエンド | |
JP4909272B2 (ja) | 空間オーディオコーディングにおける複数チャンネルデコリレーション | |
EP2614659B1 (en) | Upmixing method and system for multichannel audio reproduction | |
JP6377249B2 (ja) | オーディオ信号の強化のための装置と方法及び音響強化システム | |
JP2012525051A (ja) | オーディオ信号の合成 | |
CN1659927A (zh) | 房间内扬声器声音的数字均衡方法及其使用 | |
JP2021101242A (ja) | 相関分離フィルタの適応制御のための方法および装置 | |
Kinoshita et al. | Blind upmix of stereo music signals using multi-step linear prediction based reverberation extraction | |
Uhle et al. | Methods for Low Bitrate Coding Enhancement Part II: Spatial Enhancement | |
WO2009027886A2 (en) | A device for and method of processing audio signals |