JP7083405B2 - 周囲信号を複数の周囲信号チャネルに分配するオーディオ信号プロセッサ、システムおよび方法 - Google Patents

周囲信号を複数の周囲信号チャネルに分配するオーディオ信号プロセッサ、システムおよび方法 Download PDF

Info

Publication number
JP7083405B2
JP7083405B2 JP2020562845A JP2020562845A JP7083405B2 JP 7083405 B2 JP7083405 B2 JP 7083405B2 JP 2020562845 A JP2020562845 A JP 2020562845A JP 2020562845 A JP2020562845 A JP 2020562845A JP 7083405 B2 JP7083405 B2 JP 7083405B2
Authority
JP
Japan
Prior art keywords
signal
ambient
channels
direct
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020562845A
Other languages
English (en)
Other versions
JP2021512570A (ja
Inventor
ウーリー・クリスチャン
ヘルムス・オリバー
ハーヴンステイン・ジュリア
レオナルド・ティモシー
ラング・マティアス
ホプフェル・マルク
プロケイン・ピーター
Original Assignee
フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン filed Critical フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Publication of JP2021512570A publication Critical patent/JP2021512570A/ja
Application granted granted Critical
Publication of JP7083405B2 publication Critical patent/JP7083405B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K15/00Acoustics not otherwise provided for
    • G10K15/08Arrangements for producing a reverberation or echo sound
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/005Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo five- or more-channel type, e.g. virtual surround
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Stereophonic System (AREA)

Description

本発明による実施形態は、入力オーディオ信号に基づいて周囲信号チャネルを提供するためのオーディオ信号プロセッサに関する。
本発明による実施形態は、マルチチャネル入力オーディオ信号によって表現されるオーディオコンテンツをレンダリングするためのシステムに関する。
本発明による実施形態は、入力オーディオ信号に基づいて周囲信号チャネルを提供するための方法に関する。
本発明による実施形態は、マルチチャネル入力オーディオ信号によって表現されるオーディオコンテンツをレンダリングするための方法に関する。
本発明による実施形態は、コンピュータプログラムに関する。
本発明による実施形態は、一般に、複数の出力チャネルによる周囲信号抽出に関する。
オーディオ信号の処理とレンダリングは新しい技術分野である。特に、直接音と周囲音の両方を含むマルチチャネル信号を適切にレンダリングすることは困難な課題を提供している。
オーディオ信号は、複数の直接音と周囲(または拡散)音の混合であり得る。直接音信号は、音源、例えば楽器から発せられ、音源と聴取者との間の直接(最短)経路で聴取者の耳に到達する。聴取者は、空間音像内でのそれらの位置を特定し、音源が位置する方向を指すことができる。位置特定に関連する聴覚的手がかりは、両耳間レベル差、両耳間時間差、および両耳間コヒーレンスである。同一の両耳間レベル差と両耳間時間差を誘発する直接音波は、同じ方向から来るものとして知覚される。拡散音がない場合、左右の耳または他の多数のセンサーに到達する信号はコヒーレントである[1]。
対照的に、周囲音は拡散していると認識され、位置を特定できないため、聴取者は(「音に浸されている」)包み込みの印象を呼び起こす。間隔を空けた多数のセンサーを使用して周囲音場を取り込む場合、記録された信号は少なくとも部分的に非干渉性である。周囲音は、間隔を空けた多数の音源から構成される。一例は拍手、つまり複数の位置での多くの拍手の重ね合わせである。別の例は、残響、つまり境界または壁に反射した音の重ね合わせである。音波が部屋の壁に到達すると、その一部が反射され、部屋でのすべての反射の重ね合わせである残響が最も顕著な周囲音である。すべての反射音は、直接音源によって生成された励起信号から発生する、例えば残響スピーチは、配置可能な位置にある部屋のスピーカによって生成される。
音響のポストプロダクションと再生の様々な用途は、オーディオ信号の直接信号成分と周囲信号成分への分解、すなわち直接-周囲分解(DAD)、または周囲(拡散)信号の抽出、すなわち周囲信号抽出(ASE)を応用している。周囲信号抽出の目的は、すべての直接信号成分が減衰され、拡散信号成分のみが聞こえる周囲信号を算出することである。
これまで、周囲信号の抽出は、入力信号と同じ数またはそれ以下のチャネルを有する出力信号に制限されていた(例えば、参考文献[2]、[3]、[4]、[5]、[6]、[7]、[8]を参照されたい)。2チャネルのステレオ信号を処理すると、1チャネルまたは2チャネルを有する周囲信号が生成される。
サラウンドサウンド信号から周囲信号を抽出する方法は、[9]で提案されており、それはN>2であるNチャネルにより入力信号を処理する。本方法は、マルチチャネル入力信号のダウンミックスから各入力チャネルに適用されるスペクトル重みを算出し、それによってN個の信号により出力信号を生成する。
さらに、聴覚信号成分または直接信号成分をステレオ画像内でのそれらの位置に従ってのみ分離するための様々な方法が提案されており、例えば、[2]、[10]、[11]、[12]である。
従来の解決策を考慮して、改善された聴覚印象を得ることを可能にする周囲信号を得るための概念を創造することが望まれている。
本発明による実施形態は、入力オーディオ信号に基づいて周囲信号チャネルを提供するためのオーディオ信号プロセッサを作成する。オーディオ信号プロセッサは、周囲信号チャネルを取得するように構成され、異なるオーディオコンテンツを含む取得された周囲信号チャネルの数は、入力オーディオ信号のチャネルの数よりも大きい。オーディオ信号プロセッサは、入力オーディオ信号内の音源の位置または方向に応じて、周囲信号成分が周囲信号チャネル間で分配されるように、周囲信号チャネルを取得するように構成される。
本発明によるこの実施形態は、入力オーディオ信号のチャネルの数よりも多い数の周囲信号チャネルを有することが望ましく、そのような場合に、周囲信号チャネルを提供するときの音源の位置または方向を考慮することが有利であるという発見に基づく。したがって、周囲信号のコンテンツは、入力オーディオ信号によって表現されるオーディオコンテンツに適合させることができる。例えば、周囲オーディオコンテンツは、異なる周囲信号チャネルに含めることができ、異なる周囲信号チャネルに含まれる周囲オーディオコンテンツは、入力オーディオ信号の解析に基づいて決定することができる。したがって、どの周囲信号チャネルにどの周囲オーディオコンテンツを含めるかについての決定は、異なる周囲オーディオコンテンツを励起する音源(例えば、直接音源)の位置または方向に応じて行うことができる。
したがって、最初に入力オーディオ信号の方向ベースの分解(またはアップミキシング)があり、次に直接/周囲分解がある実施形態があり得る。しかしながら、最初に直接/周囲分解があり、その後に、抽出された周囲信号成分の(例えば、周囲チャネル信号への)アップミキシングが行われる実施形態もある。また、組み合わされたアップミキシングと周囲信号抽出(または直接/周囲分解)があり得る実施形態もある。
好ましい実施形態では、オーディオ信号プロセッサは、それぞれの周囲信号成分を励起する直接音源の位置または方向に従って周囲信号成分が周囲信号チャネルに分配されるように、周囲信号チャネルを取得するように構成される。したがって、良好な聴覚印象を得ることができ、周囲信号チャネルが、所与の位置または所与の方向の直接音源のオーディオコンテンツに適合しない周囲オーディオコンテンツを含むことを回避することができる。換言すれば、周囲音を励起する直接音が到達しない位置または方向に関連付けられたオーディオチャネル内に周囲音がレンダリングされることを回避することができる。周囲音を均一に分配すると、不満足な聴覚印象が生じることがあり、そのような不満足な聴覚印象は、それぞれの周囲信号成分を励起する直接音源の位置または方向に応じて周囲信号成分を分配するという概念を使用することによって回避できることが分かった。
好ましい実施形態では、オーディオ信号プロセッサは、入力オーディオ信号の1つまたは複数のチャネルを複数のアップミックスされたチャネルに分配するように構成され、アップミックスされたチャネルの数は、入力オーディオ信号のチャネルの数より大きい。また、オーディオ信号プロセッサは、アップミックスされたチャネルから周囲信号チャネルを抽出するように構成される。したがって、直接信号成分と周囲信号成分の単純な結合アップミキシングが実行されるので、効率的な処理を得ることができる。周囲信号成分と直接信号成分との間の分離は、アップミキシング(入力オーディオ信号の1つまたは複数のチャネルの、複数のアップミックスされたチャネルへの分配)の後に実行される。その結果、適度な労力で、直接信号が周囲信号を励起するように同様の方向から周囲信号が発生することを実現することができる。
好ましい実施形態では、オーディオ信号プロセッサは、マルチチャネル周囲信号抽出を使用して、またはマルチチャネル直接信号/周囲信号分離を使用して、アップミックスされたチャネルから周囲信号チャネルを抽出するように構成される。したがって、周囲信号抽出または直接信号/周囲信号分離において、複数のチャネルの存在を利用することができる。言い換えると、アップミックスされたチャネル間の類似点および/または相違点を利用して周囲信号チャネルを抽出することが可能であり、これにより、(例えば、個別のチャネルに基づいて個別の周囲信号抽出と比較すると)周囲信号チャネルの抽出が容易になり、良好な結果がもたらされる。
好ましい実施形態では、オーディオ信号プロセッサは、アップミキシング係数を決定し、周囲信号抽出係数を決定するように構成される。また、オーディオ信号プロセッサは、アップミキシング係数および周囲信号抽出係数を使用して周囲信号チャネルを取得するように構成される。したがって、(例えば、アップミキシング係数および周囲信号抽出係数に基づいて単一の処理行列を導出することによって)単一の処理ステップで周囲信号チャネルを導出することが可能である。
本発明による実施形態(任意選択的に上記の特徴の1つまたは複数を含むことができる)は、入力オーディオ信号(例えば、マルチチャネル入力オーディオ信号であってもよい)に基づいて周囲信号チャネルを提供するためのオーディオ信号プロセッサを作成する。オーディオ信号プロセッサは、入力オーディオ信号に基づいて周囲信号を抽出するように構成される。
例えば、オーディオ信号プロセッサは、(中間)周囲信号を導出(「抽出」)するために、入力オーディオ信号に基づいて直接-周囲分離または直接-周囲分解を実行するように構成することができ、あるいはオーディオ信号プロセッサは、周囲信号を導出するために周囲信号抽出を実行するように構成することができる。例えば、直接-周囲分離または直接-周囲分解または周囲信号抽出を代替的に実行することができる。例えば、周囲信号はマルチチャネル信号であってもよく、周囲信号のチャネルの数は、例えば、入力オーディオ信号のチャネルの数と同一であってもよい。
さらに、信号プロセッサは、(抽出された)周囲信号を複数の周囲信号チャネルに分配する(または「アップミックスする」)ように構成され、(例えば、異なる信号コンテンツを有する周囲信号チャネルの)周囲信号チャネルの数は、入力オーディオ信号内の音源(例えば、直接音源)の位置または方向に応じて、入力オーディオ信号のチャネルの数よりも大きい(および/または、例えば、抽出された周囲信号のチャネルの数よりも大きい)。
言い換えると、オーディオ信号プロセッサは、抽出された周囲信号をより多くの数のチャネルにアップミックスする場合に、入力オーディオ信号内の音源(例えば、直接音源)の方向または位置を考慮するように構成することができる。
したがって、周囲信号は周囲信号チャネルに「均一に」分配されないが、周囲信号の基礎となる(またはそれを生成する、または励起する)音源の位置または方向が考慮される。
周囲信号が周囲信号チャネルに任意に分配されない(周囲信号チャネルの数は入力オーディオ信号のチャネル数よりも大きい)が、入力オーディオ信号内の音源の位置または方向に依存するという概念は、多くの状況でより好ましい聴覚印象を提供するということが分かった。例えば、周囲信号をすべての周囲信号チャネルに均一に分配すると、非常に不自然な、または混乱させる聴覚印象になる可能性がある。例えば、これは、直接音源が特定の到来方向に明確に割り当てられ、一方、前記音源のエコー(周囲信号である)がすべての周囲信号チャネルに分配される場合に当てはまることが分かった。
結論として、周囲信号チャネルが導出される入力オーディオ信号内の1つまたは複数の音源の位置または方向が、抽出された周囲信号の周囲信号チャネルへの分配において考慮される場合には、複数の周囲信号チャネルを含む周囲信号によって引き起こされる聴覚印象がしばしば改善されるが、それは、(例えば、入力オーディオ信号内の音源の位置または方向を考慮せずに、周囲信号の均一なまたは任意の分配と比較した場合)、(入力オーディオ信号内の音源の位置または方向に応じた)入力オーディオ信号内の周囲信号コンテンツの不均一な分配が現実をより良く反映するためであることが分かった。
好ましい実施形態では、オーディオ信号プロセッサは、(中間)周囲信号を導出するために、入力オーディオ信号に基づいて直接-周囲分離(例えば、オーディオ信号の直接音成分と周囲音成分への分解であり、これは直接-周囲分解とも呼ばれ得る)を実行するように構成される。このような技法を使用すると、入力オーディオ信号に基づいて周囲信号と直接信号の両方を取得することができ、通常、直接信号と周囲信号の両方がさらなる処理に必要になるため、これにより処理の効率が向上する。
好ましい実施形態では、オーディオ信号プロセッサは、(例えば、マルチチャネルの周囲信号であってもよい抽出された周囲信号の)周囲信号成分を、それぞれの周囲信号成分を励起する直接音源の位置または方向に従って周囲信号チャネル間で分配するように構成される(周囲信号チャネルの数は、例えば、入力オーディオ信号のチャネル数よりも大きくてもよい、および/または抽出された周囲信号のチャネル数よりも大きくてもよい)。したがって、周囲信号成分を励起する直接音源の位置または方向を考慮することができ、それによって、例えば、異なる位置にある異なる直接音源によって励起される異なる周囲信号成分を、周囲信号チャネル間で異なって分配することができる。例えば、所与の直接音源によって励起された周囲信号成分は、それぞれの直接音源の直接信号成分が主に分配される1つまたは複数の直接信号チャネルに関連付けられた1つまたは複数の周囲信号チャネルに主に分配され得る。したがって、異なる周囲信号チャネルへの周囲信号成分の分配は、それぞれの周囲信号成分を励起する直接信号成分の異なる直接信号チャネルへの分配に対応することができる。その結果、レンダリング環境では、周囲信号成分は、それぞれの周囲信号成分を励起する直接音源のように、同じ方向または同様の方向から発生していると認識され得る。このように、場合によっては不自然な聴覚印象を回避することができる。例えば、エコーを励起する直接音源と比較した場合、エコー信号が完全に異なる方向から到着することは、いくつかの望ましい合成聴覚環境に適合しないが、これを回避することができる。
好ましい実施形態では、周囲信号チャネルは、様々な方向に関連付けられる。例えば、周囲信号チャネルは、対応する直接信号チャネルと同じ方向に関連付けられてもよく、または対応する直接信号チャネルのような同様の方向に関連付けられてもよい。したがって、周囲信号成分を周囲信号チャネルに分配して、周囲信号成分が、それぞれの周囲信号成分を励起する直接音源の方向と相関する特定の方向から生じると知覚できるようにすることができる。
好ましい実施形態では、直接信号チャネルは、異なる方向に関連付けられ、周囲信号チャネルおよび直接信号チャネルは、(例えば、少なくとも方位角方向に関して、かつ少なくとも例えば、+/-20°または+/-10°の妥当な許容誤差内で)同じ方向のセットに関連付けられる。さらに、オーディオ信号プロセッサは、それぞれの直接音成分の位置または方向に従って、直接信号成分を直接信号チャネル間で分配する(または、同等に、直接信号成分を直接信号チャネルにパンする)ように構成される。さらに、オーディオ信号プロセッサは、直接信号成分が分配されるのと同じように(例えば、同じパンニング係数またはスペクトル重みを使用して)、それぞれの周囲信号成分を励起する直接音源の位置または方向に従って(例えば、抽出された周囲信号の)周囲信号成分を周囲信号チャネルに分配するように構成される(周囲信号チャネルは、好ましくは直接信号チャネル、すなわち独立したチャネルとは異なる)。したがって、直接信号成分の(空間的)分配を考慮せずに周囲信号を任意に分配することが不自然に聞こえるいくつかの状況では、良好な聴覚印象を得ることができる。
好ましい実施形態では、オーディオ信号プロセッサは、周囲信号成分の基礎となる音源信号(例えば、それぞれの周囲信号成分を生成した直接音源信号)の位置に従って周囲信号が周囲信号成分に分離されるように、周囲信号チャネルを提供するように構成される。したがって、異なる直接音源から発生すると予想される異なる周囲信号成分を分離することが可能である。これにより、様々な音源によって励起された直接音信号と周囲信号の個別の処理(例えば、操作、スケーリング、遅延、フィルタリングなど)が可能になる。
好ましい実施形態では、オーディオ信号プロセッサは、(処理が時間周波数領域で行われるように)周囲信号を周囲信号チャネルに分配(またはアップミックスまたはパン)するために、スペクトル重み(例えば、時間に依存するおよび周波数に依存するスペクトル重み)を適用するように構成される。スペクトル重みを使用する時間周波数領域でのこのような処理は、複数の音源がある場合の処理に非常に適していることが分かっている。この概念を使用して、位置または到来方向を各スペクトルビンに関連付けることができ、複数の周囲信号チャネルへの周囲信号の分配も、スペクトルビンごとに行うことができる。言い換えれば、各スペクトルビンについて、周囲信号が周囲信号チャネルにどのように分配されるべきかを決定することができる。また、時間に依存するおよび周波数に依存するスペクトル重みの決定は、入力信号内の音源の位置または方向の決定に対応することができる。したがって、入力オーディオ信号内の音源の位置または方向に応じて、周囲信号が複数の周囲信号チャネルに分配されることを容易に実現することができる。
好ましい実施形態では、オーディオ信号プロセッサは、複数の周囲信号チャネルに周囲信号をアップミックス(またはパン)するために、スペクトル重みを適用するように構成され、スペクトル重みは、それらの位置または方向に従って直接音源を分離するために計算される。あるいは、オーディオ信号プロセッサは、周囲信号を複数の周囲信号チャネルにアップミックスするために、スペクトル重みの遅延バージョンを適用するように構成され、スペクトル重みの遅延バージョンは、直接音源をそれらの位置または方向に従って分離するために計算される。これらのスペクトル重みを適用することにより、計算の複雑さを抑えて良好な聴覚印象を達成できることが分かっており、これらのスペクトル重みは、複数の周囲信号チャネルへの周囲信号の分配(またはアップミックスまたはパンニング)のために、それらの位置または方向、またはそれらの遅延バージョンに従って直接音源を分離するために計算される。スペクトル重みの遅延バージョンの使用は、例えば、直接信号とエコーとの間の時間シフトを考慮するのに適切であり得る。
好ましい実施形態では、オーディオ信号プロセッサは、スペクトル重みが時間に依存し、かつ周波数に依存するように、スペクトル重みを導出するように構成される。したがって、直接音源の時間変化信号および直接音源の可能な動きを考慮することができる。また、直接音源の強度を変えることも考えられる。したがって、周囲信号の周囲信号チャネルへの分配は静的ではなく、複数の(アップミックスされた)周囲信号チャネルにおける周囲信号の相対的な重み付けは動的に変化する。
好ましい実施形態では、オーディオ信号プロセッサは、入力オーディオ信号の空間音像における音源の位置に応じてスペクトル重みを導出するように構成される。したがって、スペクトル重みは、周囲信号を励起する直接音源の位置を十分に反映し、したがって、特定の音源によって励起された周囲信号成分を、(入力オーディオ信号の空間音像における)直接音源の方向に対応する適切な周囲信号チャネルに関連付けることが容易に可能である。
好ましい実施形態では、入力オーディオ信号は少なくとも2つの入力チャネル信号を含み、オーディオ信号プロセッサは、少なくとも2つの入力チャネル信号間の差に応じてスペクトル重みを導出するように構成される。入力チャネル信号間の差(例えば、位相差および/または振幅差)は、直接音源の方向に関する情報を得るために十分に評価できることが分かっており、スペクトル重みは、直接音源の方向に少なくともある程度対応することが好ましい。
好ましい実施形態では、オーディオ信号プロセッサは、(例えば、周囲信号チャネルの)他のチャネルと比較した場合に、与えられた位置または方向(例えば、位置pから)に由来するスペクトル成分がそれぞれの位置または方向に関連する(例えば、周囲信号チャネルの)チャネル内でより強く重み付けされるように、(例えば、入力信号または直接信号における直接音成分の)スペクトル成分が発生する位置または方向に応じてスペクトル重みを決定するように構成される。言い換えれば、スペクトル重みは、周囲信号成分を励起する直接音成分が発生する方向に応じて、周囲信号成分を区別する(または分離する)ように決定される。したがって、例えば、異なる音源から生じる周囲信号が、異なる周囲信号チャネルに分配され、異なる周囲信号チャネルが、異なる周囲信号成分(例えば、異なるスペクトルビン)の異なる重み付けを通常有するように達成され得る。
好ましい実施形態では、オーディオ信号プロセッサは、スペクトル重みが複数の出力チャネル信号における(例えば、入力信号の)入力チャネル信号のスペクトル成分の重み付けを記述するようにスペクトル重みを決定するように構成される。例えば、スペクトル重みは、所与の入力チャネル信号が強い重み付けで第1の出力チャネル信号に含まれ、同じ入力チャネル信号がより小さい重み付けで第2の出力チャネル信号に含まれることを記述することができる。重みは、異なるスペクトル成分に対して個別に決定され得る。入力信号は、例えば、マルチチャネル信号であり得るので、スペクトル重みは、複数の出力チャネル信号における複数の入力チャネル信号の重み付けを記述することができ、通常、入力チャネル信号よりも多くの出力チャネル信号が存在する(アップミキシング)。また、特定の入力チャネル信号からの信号が特定の出力チャネル信号に引き継がれないという可能性がある。例えば、レンダリング環境の左側に関連付けられている入力チャネル信号がレンダリング環境の右側に関連付けられている出力チャネル信号に含まれていなかったり、その逆の場合もある。
好ましい実施形態では、オーディオ信号プロセッサは、直接信号成分を直接信号チャネルに分配するために、および周囲信号の周囲信号成分を周囲信号チャネルに分配するために、同じスペクトル重みのセットを適用するように構成される(周囲信号成分を分配するときに、時間遅延を考慮に入れることができる)。したがって、周囲信号成分は、直接信号成分が直接信号チャネルに割り当てられるのと同じ方法で周囲信号チャネルに分配され得る。その結果、場合によっては、周囲信号成分はすべて直接信号成分に適合し、特に良好な聴覚印象が得られる。
好ましい実施形態では、入力オーディオ信号は少なくとも2つのチャネルを含み、および/または周囲信号は少なくとも2つのチャネルを含む。本明細書で説明される概念は、2つ以上のチャネルを有する入力オーディオ信号に特によく適しており、それは、このような入力オーディオ信号が、信号成分の場所(または方向)を表現できるからであることに留意されたい。
本発明による実施形態は、マルチチャネル入力オーディオ信号によって表現されるオーディオコンテンツをレンダリングするためのシステムを作成する。システムは、上述のようなオーディオ信号プロセッサを含み、オーディオ信号プロセッサは、3つ以上の直接信号チャネルおよび3つ以上の周囲信号チャネルを提供するように構成される。さらに、システムは、一組の直接信号スピーカと一組の周囲信号スピーカとを含むスピーカ配置を含む。直接信号チャネルの各々は、少なくとも1つの直接信号スピーカに関連付けられ、周囲信号チャネルの各々は、少なくとも1つの周囲信号スピーカに関連付けられる。したがって、直接信号および周囲信号は、例えば、異なるスピーカを使用してレンダリングされてもよく、例えば、直接信号スピーカと対応する周囲信号スピーカとの間に空間的相関があってもよい。したがって、直接信号(または直接信号成分)および周囲信号(または周囲信号成分)の両方を、入力オーディオ信号のチャネルの数よりも多い数のスピーカにアップミックスすることができる。周囲信号または周囲信号成分は、複数のスピーカによって不均一にレンダリングされ、音源が配置されている方向に従って異なる周囲信号スピーカに分配される。その結果、良好な聴覚印象を得ることができる。
好ましい実施形態では、各周囲信号スピーカは、1つの直接信号スピーカと関連付けられる。したがって、直接信号成分が直接信号スピーカに分配されるのと同じ方法で、周囲信号スピーカに周囲信号成分を分配することにより、良好な聴覚印象を実現することができる。
好ましい実施形態では、周囲信号スピーカの位置は、直接信号スピーカの位置に対して高くなっている。このような構成により、良好な聴覚印象を実現できることが分かっている。また、この構成は、例えば車両で使用することができ、そのような車両で良好な聴覚印象を提供することができる。
本発明による実施形態は、入力オーディオ信号(好ましくは、マルチチャネル入力オーディオ信号であってもよい)に基づいて、周囲信号チャネルを提供するための方法を作成する。本方法は、入力オーディオ信号に基づいて周囲信号を抽出するステップを含む(周囲信号を導出するために、すなわち、いわゆる「周囲信号抽出」のために、例えば、入力オーディオ信号に基づいて直接-周囲分離または直接-周囲合成を実行するステップを含むことができる)。
さらに、本方法は、周囲信号を複数の周囲信号チャネルに分配する(例えば、アップミキシングする)ステップを含み、周囲信号チャネル(これは、例えば、関連する異なる信号コンテンツを有してもよい)の数は、入力オーディオ信号内の音源の位置または方向に応じて、入力オーディオ信号のチャネルの数よりも大きい(例えば、抽出された周囲信号のチャネルの数よりも大きい)。本方法は、上記の装置と同じ考察に基づいている。また、本方法は、対応する装置に関して本明細書で説明されている特徴、機能、および詳細のいずれかによって補足できることに留意されたい。
別の実施形態は、マルチチャネル入力オーディオ信号によって表現されるオーディオコンテンツをレンダリングする方法を含む。本方法は、上述のように、入力オーディオ信号に基づいて周囲信号チャネルを提供するステップを含む。この場合、3つ以上の周囲信号チャネルが提供される。さらに、本方法は、3つ以上の直接信号チャネルを提供するステップも含む。本方法は、周囲信号チャネルおよび直接信号チャネルを、一連の直接信号スピーカおよび一連の周囲信号スピーカを含むスピーカ配置に供給するステップも含み、直接信号チャネルの各々は、少なくとも1つの直接信号スピーカに供給され、周囲信号チャネルの各々は、少なくとも1つの周囲信号スピーカに供給される。本方法は、上記のシステムと同じ考察に基づいている。また、本方法は、上述のシステムに関して本明細書で説明されている任意の特徴、機能、および詳細によって補足できることに留意されたい。
本発明による別の実施形態は、コンピュータプログラムがコンピュータ上で実行されるときに、前述の方法の1つを実行するためのコンピュータプログラムを作成する。
本発明の一実施形態による、オーディオ信号プロセッサのブロック概略図である。 本発明の一実施形態による、オーディオ信号プロセッサのブロック概略図である。 本発明の一実施形態による、システムのブロック概略図である。 本発明の一実施形態による、オーディオ信号プロセッサにおける信号フローの概略図である。 本発明の一実施形態による、スペクトル重みの導出の概略図である。 本発明の一実施形態による、周囲信号チャネルを提供するための方法のフローチャートを示す図である。 本発明の一実施形態による、オーディオコンテンツをレンダリングするための方法のフローチャートを示す図である。 2チャネルステレオフォニーのための2つのスピーカ(左側および右側に、それぞれ「L」、「R」)を備えた標準的なスピーカ設定の概略図である。 4つのスピーカ(前左「fL」、前右「fR」、後左「rL」、後右「rR」)を備えた4チャネルスピーカ設定の概略図である。 「h」とマークされた追加の高さスピーカを備えた4チャネルスピーカ設定の概略図である。
1.図1aおよび図1bによるオーディオ信号プロセッサ
1a)図1aによるオーディオ信号プロセッサ。
図1aは、本発明の実施形態による、オーディオ信号プロセッサのブロック概略図を示す。図1aによるオーディオ信号プロセッサは、全体として符号100で示されている。
オーディオ信号プロセッサ100は、例えば、マルチチャネル入力オーディオ信号であってもよい、入力オーディオ信号110を受信する。入力オーディオ信号110は、例えば、N個のチャネルを含むことができる。さらに、オーディオ信号プロセッサ100は、入力オーディオ信号110に基づいて、周囲信号チャネル112a、112b、112cを提供する。
オーディオ信号プロセッサ100は、入力オーディオ信号110に基づいて(中間周囲信号とみなすこともできる)周囲信号130を抽出するように構成される。この目的のために、オーディオ信号プロセッサは、例えば、周囲信号抽出120を含むことができる。例えば、周囲信号抽出120は、周囲信号130を導出するために、入力オーディオ信号110に基づいて直接-周囲分離または直接周囲分解を実行することができる。例えば、周囲信号抽出120は、直接信号(例えば、推定または抽出された直接信号)も提供することができ、それは
Figure 0007083405000001
で表すことができ、図1aには示されていない。あるいは、周囲信号抽出は、直接信号を提供することなく、入力オーディオ信号120から周囲信号130のみを抽出してもよい。例えば、周囲信号抽出120は、「ブラインド」直接-周囲分離または直接-周囲分解または周囲信号抽出を実行することができる。しかしながら、代替として、周囲信号抽出120は、直接周囲分離または直接周囲分解または周囲信号抽出をサポートするパラメータを受け取ることができる。
さらに、オーディオ信号プロセッサ100は、(中間周囲信号とみなすことができる)周囲信号130を複数の周囲信号チャネル112a、112b、112cに分配する(例えば、アップミックスする)ように構成され、周囲信号チャネル112a、112b、112cの数は、入力オーディオ信号110のチャネルの数よりも大きい(そして、通常、中間周囲信号130のチャネルの数よりも多い)。周囲信号130を複数の周囲信号チャネル112a、112b、112cに分配する機能は、例えば、(中間)周囲信号130を受信することができ、かつ入力オーディオ信号110、または、例えば、入力オーディオ信号内の音源の位置または方向に関する情報も受信することができる、周囲信号分配140によって実行することができることに留意されたい。また、オーディオ信号プロセッサは、入力オーディオ信号110内の音源の位置または方向に応じて、周囲信号130を複数の周囲信号チャネルに分配するように構成されることに留意されたい。したがって、周囲信号チャネル112a、112b、112cは、例えば、異なる信号コンテンツを含むことができ、複数の周囲信号チャネル112a、112b、112cへの(中間)周囲信号130の分配も時間に依存し、および/または周波数に依存し、入力オーディオ信号の基礎となる音源の様々な位置および/または様々な内容を反映することができる。
結論として、オーディオ信号プロセッサ110は、周囲信号抽出を使用して(中間)周囲信号130を抽出し、次に(中間)周囲信号130を周囲信号チャネル112a、112b、112cに分配することができ、周囲信号チャネルの数は、入力オーディオ信号のチャネルの数よりも大きい。(中間)周囲信号130の周囲信号チャネル112a、112b、112cへの分配は、静的に定義されなくてもよいが、入力オーディオ信号内の音源の時間変化する位置または方向に適応することができる。また、周囲信号130の信号成分は、分配が周囲信号を励起する直接音源の位置または方向に対応するように、周囲信号チャネル112a、112b、112cにわたって分配されてもよい。
したがって、異なる周囲信号チャネル112a、112b、112cは、例えば、異なる周囲信号成分を含むことができ、周囲信号チャネルの1つは、主に、第1の直接音源に由来する(またはそれによって励起される)周囲信号成分を含むことができ、別の周囲信号チャネルは、主に、別の直接音源から生じる(または別の直接音源によって励起される)周囲信号成分を含むことができる。
結論として、図1aによるオーディオ信号プロセッサ100は、例えば、周囲信号成分が空間的に分配され得るように、異なる直接音源から生じる周囲信号成分を異なる周囲信号チャネルに分配することができる。
これにより、状況によって聴覚印象が改善され、直接音の発生元の方向に「絶対に適合しない」方向に関連付けられている周囲信号チャネルを介して、周囲信号成分がレンダリングされるのを回避することができる。
さらに、図1aによるオーディオ信号プロセッサは、個々におよび組み合わせての両方で、本明細書に記載された任意の特徴、機能性および詳細によって補足され得ることに留意されたい。
1b)図1bによるオーディオ信号プロセッサ
図1bは、本発明の実施形態による、オーディオ信号プロセッサのブロック概略図を示す。図1bによるオーディオ信号プロセッサは、全体として150で示されている。
オーディオ信号プロセッサ150は、例えば、マルチチャネル入力オーディオ信号であってもよい、入力オーディオ信号160を受信する。入力オーディオ信号160は、例えば、N個のチャネルを含むことができる。さらに、オーディオ信号プロセッサ150は、入力オーディオ信号160に基づいて、周囲信号チャネル162a、162b、162cを提供する。
オーディオ信号プロセッサ150は、入力オーディオ信号内の音源の位置または方向に応じて、周囲信号成分が周囲信号チャネル間で分配されるように、周囲信号チャネルを提供するように構成される。
このオーディオ信号プロセッサは、周囲信号チャネルが直接信号コンテンツに直接適応するという利点をもたらし、これは、直接信号チャネルに含めることができる。さらなる詳細については、「発明の概要」の項の上記の説明、および他の実施形態に関する説明を参照されたい。
さらに、信号プロセッサ150は、本明細書で説明される任意の特徴、機能、および詳細によって任意選択的に補足され得ることに留意されたい。
2)図2によるシステム
図2は、本発明の一実施形態による、システムのブロック概略図を示す。システムは、全体として符号200で示されている。システム200は、入力オーディオ信号110に対応することができるマルチチャネル入力オーディオ信号210を受信するように構成される。さらに、システム200は、例えば、図1aまたは図1bを参照して説明されるようなオーディオ信号プロセッサ100の機能を含むことができるオーディオ信号プロセッサ250を含む。しかしながら、オーディオ信号プロセッサ250は、いくつかの実施形態では、増大した機能を有することができることに留意されたい。
さらに、システムはまた、例えば、一組の直接信号スピーカ262a、262b、262cおよび一組の周囲信号スピーカ264a、264b、264cを含むことができるスピーカ配置260も含む。例えば、オーディオ信号プロセッサは、複数の直接信号チャネル252a、252b、252cを直接信号スピーカ262a、262b、262cに提供することができ、オーディオ信号プロセッサ250は、周囲信号チャネル254a、254b、254cを周囲信号スピーカ264a、264b、264cに提供することができる。例えば、周囲信号チャネル254a、254b、254cは、周囲信号チャネル112a、112b、112cに対応することができる。
したがって、一般的に言えば、オーディオ信号プロセッサ250は、3つ以上の直接信号チャネル252a、252b、252cおよび3つ以上の周囲信号チャネル254a、254b、254cを提供すると言うことができる。直接信号チャネル252a、252b、252cの各々は、直接信号スピーカ262a、262b、262cのうちの少なくとも1つに関連付けられる。また、周囲信号チャネル254a、254b、254cのそれぞれは、周囲信号スピーカ264a、264b、264cのうちの少なくとも1つと関連付けられる。
加えて、例えば、直接信号スピーカと周囲信号スピーカとの間に関連(例えば、ペアをなす関連)があってもよい。しかしながら、代わりに、直接信号スピーカのサブセットと周囲信号スピーカとの間に関連があってもよい。例えば、周囲信号スピーカよりも直接信号スピーカが多くてもよい(例えば、6つの直接信号スピーカと4つの周囲信号スピーカ)。したがって、直接信号スピーカのうちの一部のみが関連する周囲信号スピーカを有してもよく、他のいくつかの直接信号スピーカは関連する周囲信号スピーカを有さない。例えば、周囲信号スピーカ264aは直接信号スピーカ262aと関連付けることができ、周囲信号スピーカ264bは直接信号スピーカ262bと関連付けることができ、周囲信号スピーカ264cは直接信号スピーカ262cと関連付けることができる。例えば、関連付けられたスピーカは、等しいまたは類似した方位角位置に配置することができる(例えば、聴取者の位置から見た場合に、20°以下または10°以下の違いがあってもよい)。しかしながら、関連するスピーカ(例えば、直接信号スピーカおよびその関連する周囲信号スピーカは、異なる高さを含んでもよい。
以下では、オーディオ信号プロセッサ250に関するいくつかの詳細が説明される。オーディオ信号プロセッサ250は、例えば、周囲信号抽出120に対応することができる直接-周囲分解220を含む。直接-周囲分解220は、例えば、入力オーディオ信号210を受信し、ブラインド(または、代替的に、ガイドされた)直接-周囲分解を実行することができ、(ガイドされた直接-周囲分解は、例えば、異なる周波数帯域またはサブバンドの直接成分と周囲成分に対応するエネルギーを記述するオーディオエンコーダーからパラメータを受け取って使用する)、これにより、(中間)直接信号(
Figure 0007083405000002
で示すことができる)および(中間)周囲信号230を提供することができ、(中間)周囲信号230は、例えば、(中間)周囲信号130に対応することができ、例えば、
Figure 0007083405000003
で示すことができる。直接信号226は、例えば、直接信号分配246に入力することができ、それは(中間の)直接信号226(例えば、2つのチャネルを含むことができる)を直接信号チャネル252a、252b、252cに分配する。例えば、直接信号分配246は、アップミキシングを実行することができる。また、直接信号分配246は、例えば、直接-周囲分解226からの(中間)直接信号226をアップミックスして直接信号チャネル252a、252b、252cを取得するときに、直接信号源の位置(または方向)を考慮することができる。直接信号分配246は、例えば、入力オーディオ信号210から、例えば、マルチチャネル入力オーディオ信号210の異なるチャネル間の差から、音源の位置または方向についての情報を導き出すことができる。
例えば、周囲信号分配140に対応することができる周囲信号分配240は、(中間)周囲信号230を周囲信号チャネル254a、254b、254cに分配する。(中間)周囲信号230のチャネルの数は、通常、周囲信号チャネル254a、254b、254cの数よりも少ないので、周囲信号分配240は、アップミキシングを実行することもできる。
周囲信号分配240はまた、アップミキシング機能を実行するときに、入力オーディオ信号210内の音源の位置または方向を考慮することができ、(周囲信号チャネル254a、254b、254cは通常、様々なレンダリング位置に関連付けられているので)周囲信号の成分も空間的に分配される。
さらに、直接信号分配246および周囲信号分配240は、例えば、協調して動作することができることに留意されたい。信号成分の分配(例えば、直接信号および周囲信号の時間周波数領域表現の時間周波数ビンまたはブロックの分配)は、直接信号分配246によっておよび周囲信号分配240によって同様に分配され得る(直接信号成分に対する周囲信号成分の遅延を適切に考慮するために、周囲信号分配の動作に時間シフトがあり得る)。言い換えると、直接信号分配246による時間周波数ビンまたはブロックのスケーリング246(直接信号分配246が直接信号の時間-周波数領域表現で動作する場合に実行され得る)は、周囲信号230から周囲信号チャネル254a、254b、254cを導出するために周囲信号分配246によって適用される対応する時間-周波数ビンまたはブロックのスケーリングと同一であり得る。このオプション機能の詳細については、以下で説明する。
結論として、図2によるシステム200では、(中間)直接信号と(中間)周囲信号(どちらもマルチチャネル中間信号であり得る)との間に分離がある。その結果、(中間)直接信号および(中間)周囲信号は、それぞれの直接信号チャネルおよび周囲信号チャネルを得るために分配(アップミックス)される。直接信号チャネルおよび周囲信号チャネルは空間位置に関連付けることができるので、アップミキシングは、直接信号成分および周囲信号成分の空間分布に対応することができる。また、(中間)直接信号と(中間)周囲信号のアップミキシングを調整することができるので、対応する信号成分(例えば、それらの周波数に関して対応し、かつそれらの時間に関して対応する-おそらく周囲信号成分と直接信号成分との間の時間シフトを考慮して)を同じ方法で(例えば、同じアップミックススケーリングで)分配することができる。したがって、良好な聴覚印象を得ることができ、周囲信号が適切な位置から発信されていると知覚されることを回避することができる。
さらに、システム200またはそのオーディオ信号プロセッサ250は、本明細書で説明される特徴および機能および詳細のいずれかによって、個別にまたは組み合わせて補足することができることに留意されたい。さらに、オーディオ信号プロセッサ250に関して説明した機能は、オプションの拡張としてオーディオ信号プロセッサ100に組み込まれてもよいことに留意されたい。
3)図3および図4による信号処理
以下では、信号処理について図3および図4を参照して説明するが、それは、例えば、図1aのオーディオ信号プロセッサ100において、または図1bによるオーディオ信号プロセッサにおいて、または図2によるオーディオ信号プロセッサ250において実施され得る。
しかし、以下で説明する特徴、機能、および詳細は任意選択であるとみなすべきであることに留意されたい。さらに、以下で説明する特徴、機能、および詳細は、個別に、または組み合わせて、オーディオ信号プロセッサ100、250に導入できることに留意されたい。
以下では、最初に図3を参照して全体的な信号の流れについて説明する。続いて、図4に示す例を参照して、スペクトル重み計算の詳細について説明する。
ここで図3の信号フローを参照すると、N個のチャネルを有する入力オーディオ信号310があり、Nは通常2以上であると仮定されていることに留意されたい。入力オーディオ信号は、入力オーディオ信号の時間領域表現を示すx(t)、あるいは入力オーディオ信号の周波数領域表現またはスペクトル領域表現または時間周波数領域表現を示すX(m,k)として表現することもできる。例えば、mは時間インデックスであり、kは周波数ビン(またはサブバンド)インデックスである。
さらに、入力オーディオ信号が時間領域表現である場合、任意選択的に時間領域からスペクトル領域への変換があり得ることに留意されたい。また、処理は、好ましくは、スペクトル領域で(すなわち、信号X(m,k)に基づいて)実行されることに留意されたい。
また、入力オーディオ信号310は、入力オーディオ信号110および入力オーディオ信号210に対応できることに留意されたい。
さらに、入力オーディオ信号310に基づいて実行される直接/周囲分解320がある。必須ではないが、好ましくは、直接/周囲分解320は、入力オーディオ信号のスペクトル領域表現X(m,k)に基づいて実行される。また、直接/周囲分解は、例えば、周囲信号抽出120および直接/周囲分解220に対応することができる。
さらに、当業者には、直接/周囲分解220の様々な実施態様が公知であることに留意されたい。例えば、PCT/EP2013/072170に記載されている周囲信号分離が参照される。しかし、当業者に公知の直接/周囲分解の概念のいずれもここで使用できることに留意されたい。
したがって、直接/周囲分解は、(入力オーディオ信号310のように)通常はN個のチャネルを含む(中間)直接信号を提供する。(中間)直接信号は符号322で示され、
Figure 0007083405000004
で示すこともできる。(中間)直接信号は、例えば、(中間)直接信号226に対応することができる。
さらに、直接/周囲分解320はまた、(中間)周囲信号324も提供し、これは、例えば、(入力オーディオ信号310のように)N個のチャネルも含むことができる。(中間)周囲信号は、
Figure 0007083405000005
で示すこともできる。
直接/周囲分解320は、完全な直接/周囲分解または直接/周囲分離を必ずしも提供しないことに留意されたい。言い換えると、(中間)直接信号320は元の直接信号を完全に表現する必要はなく、(中間)周囲信号は元の周囲信号を完全に表現する必要はない。しかし、(中間)直接信号
Figure 0007083405000006
と(中間)周囲信号
Figure 0007083405000007
は、元の直接信号と元の周囲信号の推定値とみなすべきであり、推定の質は、直接/周囲分解320に使用されるアルゴリズムの質(および/または複雑さ)に依存する。しかし、当業者に知られているように、直接信号成分と周囲信号成分との間の合理的な分離は、文献から知られているアルゴリズムによって達成することができる。
図3に示す信号処理300はまた、スペクトル重み計算330を含む。スペクトル重み計算330は、例えば、入力オーディオ信号310および/または(中間)直接信号322を受け取ることができる。直接信号のアップミキシングと、聴覚シーン内の信号源の(推定)位置または方向に応じて周囲信号のアップミキシング用のスペクトル重み332を提供することが、スペクトル重み計算330の目的である。スペクトル重み計算は、例えば、入力オーディオ信号310の解析に基づいてこれらのスペクトル重みを決定することができる。一般的に言えば、入力オーディオ信号310の解析により、スペクトル重み計算330は、特定のスペクトルビン内の音が発生する位置または方向を推定(またはスペクトル重みの直接導出)することができる。例えば、スペクトル重み計算330は、入力オーディオ信号のチャネル(例えば、左チャネルおよび右チャネル)のスペクトルビン(または複数のスペクトルビン)の振幅および/または位相を比較(または、一般的に言えば、評価)することができる。そのような比較(または評価)に基づいて、考慮されているスペクトルビンのスペクトル成分がどの位置または方向から生じているかについての(明示的または暗黙的な)情報を導き出すことができる。したがって、特定のスペクトルビンの音がどの位置または方向から発生しているかの推定に基づいて、スペクトル成分を(アップミックスされた)オーディオチャネル信号のどの1つまたは複数のチャネルにアップミックスするべきか(およびどの強度またはスケーリングを使用するか)を結論づけることができる。言い換えると、スペクトル重みの組み合わせ330によって提供されるスペクトル重み332は、例えば、(中間)直接信号322の各チャネルについて、直接信号のアップミキシング340で使用される重みを定義することができる。
言い換えれば、直接信号のアップミキシング340は、(中間)直接信号322およびスペクトル重み332を受信し、その結果、Q>NであるQ個のチャネルを含むことができる直接オーディオ信号342を導出することができる。さらに、アップミックスされた直接オーディオ信号342のチャネルは、例えば、直接信号チャネル252a、252b、252cに対応することができる。例えば、スペクトル重み計算330によって提供されるスペクトル重み332は、アップミックスされた直接オーディオ信号342のQ個のチャネルの計算における(中間)直接信号322のN個のチャネルに関連する重みを定義するアップミックス行列Gを定義することができる。スペクトル重み、および結果としてアップミキシング340によって使用されるアップミックス行列Gは、例えば、スペクトルビンごとに(またはスペクトルビンの異なるブロック間で)異なっていてもよい。
同様に、スペクトル重み計算330によって提供されるスペクトル重み332はまた、(中間)周囲信号324のアップミキシング350において使用されてもよい。アップミキシング350は、N個のチャネル324を含むことができるスペクトル重み332および(中間)周囲信号を受け取ることができ、それに基づいて、Q>NであるQ個のチャネルを含むことができるアップミックスされた周囲信号352を提供する。例えば、アップミックスされた周囲オーディオ信号352のQ個のチャネルは、例えば、周囲信号チャネル254a、254b、254cに対応することができる。また、アップミキシング350は、例えば、図2に示す周囲信号分配240および図1aまたは図1bに示す周囲信号分配140に対応することができる。
この場合も、スペクトル重み332は、アップミックスされた周囲オーディオ信号352のQ個のチャネルの提供において直接/周囲分解320によって提供される(中間)周囲信号324のN個のチャネルの寄与(重み)を記述するアップミックス行列を定義することができる。
例えば、アップミキシング340およびアップミキシング350は、同じアップミキシング行列Gを使用することができる。ただし、異なるアップミックス行列の使用も可能である。
この場合も、周囲信号のアップミックスは周波数に依存し、(異なるスペクトルビンまたは異なるグループのスペクトルビンに対して異なるアップミックス行列Gを使用して)個別に実行することができる。
スペクトル重み計算330によって実行されるスペクトル重みの可能な計算に関するオプションの詳細は、以下で説明される。
さらに、例えば、スペクトル重み計算330に関して、直接信号のアップミキシング340に関して、および周囲信号のアップミキシング350に関して、ここで説明される機能は、任意選択的に、個別に、または組み合わせて、図1および図2による実施形態に組み込まれ得ることに留意されたい。
以下において、スペクトル重みの計算のための簡略化された例が、図4を参照して説明される。しかしながら、スペクトル重みの計算は、例えば、国際公開第2013004698A1号に記載されているように実行されてもよいことに留意されたい。
しかしながら、Nチャネル信号のQチャネル信号へのアップミキシングを意図した、スペクトル重みの計算のための異なる概念も使用できることに留意されたい。しかしながら、入力オーディオ信号に基づいてアップミキシングに従来適用されていたスペクトル重みは、(入力オーディオ信号に基づいて)直接/周囲分解320によって提供される周囲信号324のアップミキシングに適用されることに留意されたい。しかしながら、スペクトル重みの決定は、依然として(直接/周囲分解の前の)入力オーディオ信号に基づいて、または(中間)直接信号に基づいて実行されてもよい。言い換えれば、スペクトル重みの決定は、従来のスペクトル重みの決定と同様または同一であってもよいが、本発明による実施形態では、スペクトル重みが異なるタイプの信号、すなわち抽出された周囲信号に適用され、それによって聴覚印象を改善する。
以下において、スペクトル重みを決定するための簡略化された例が、図4を参照して説明される。(例えば、信号310の)2チャネル入力オーディオ信号の周波数領域表現は、符号410で示されている。左の列410aは、入力オーディオ信号の第1のチャネル(例えば、左チャネル)のスペクトルビンを表し、右の列418bは、入力オーディオ信号(例えば、入力オーディオ信号310)の第2のチャネル(例えば、右チャネル)のスペクトルビンを表す。異なる行419a~419dは、異なるスペクトルビンに関連付けられている。
さらに、凡例420に示すように、異なる信号強度は、表現410におけるそれぞれのフィールドの異なる塗りつぶしによって示される。
換言すれば、符号410における信号表現は、所与の時間(例えば、所与のフレームについて)および複数の周波数ビン(インデックスkを有する)にわたる入力オーディオ信号Xの周波数領域表現を表すことができる。例えば、行419aに示す第1のスペクトルビンでは、第1のチャネルおよび第2のチャネルの信号は、ほぼ同じ強度(例えば、中程度の信号強度)を有することができる。これは、例えば、音源が聴取者のほぼ正面、すなわち中央領域にあることを示す(または暗示する)ことができる。しかし、行419bに表されている第2のスペクトルビンを検討すると、第1のチャネルの信号が第2のチャネルの信号よりも大幅に強いことが分かるが、これは、例えば、音源が聴取者の特定の側(例えば、左側)にあることを示すことができる。行419cで表されている第3のスペクトルビンでは、信号は第2のチャネルと比較して第1のチャネルで強く、差(相対差)は第2のスペクトルビン(行419bで示されている)よりも小さい場合がある。これは、音源が中心からいくらかずれている、例えば、聴取者の視点から見て左側にいくらかずれていることを示すことができる。
以下では、スペクトル重みについて説明する。スペクトル重みの表現が符号440に示されている。4つの列448a~448dは、アップミックス信号の(すなわち、アップミックスされた直接オーディオ信号342の、および/またはアップミックスされた周囲オーディオ信号352の)異なるチャネルに関連付けられている。言い換えれば、符号440で示される例では、Q=4であると仮定されている。行449a~449eは、異なるスペクトルビンに関連付けられている。しかし、行449a~449eの各々は2行の数(スペクトル重み)を含むことに留意されたい。行449a~449eの各々の中の第1の上の行は、それぞれのスペクトルビンについて、(例えば、アップミックスされた直接オーディオ信号またはアップミックスされた周囲オーディオ信号の)それぞれのアップミックスされた信号のチャネルへの(中間直接信号および/または中間周囲信号の)第1のチャネルの寄与を表す。同様に、数値の2行目(スペクトル重み)は、それぞれのスペクトルビンについて(アップミックスされた直接オーディオ信号および/またはアップミックスされた周囲オーディオ信号の)それぞれのアップミックス信号の異なるチャネルへの、中間直接信号または中間周囲信号の第2のチャネルの寄与を表す。
各行449a、449b、449c、449d、449eは、アップミキシング行列Gの転置バージョンに対応することができることに留意されたい。
以下では、いくつかのロジックについて、入力オーディオ信号からアップミキシング係数をどのようにして導出できるかについて説明する。しかしながら、以下の説明は、本発明の基本的な理解を容易にするためだけに簡略化された例とみなされるべきである。しかし、次の例では振幅にのみ焦点を当て、位相は考慮しないでいるが、実際の実施態様では位相も考慮に入れてもよいことに留意されたい。さらに、使用されたアルゴリズムは、例えば、参考文献に記載されているように、より精巧であり得ることに留意されたい。
ここで第1のスペクトルビンを参照すると、行419aに示されているように、入力オーディオ信号の第1のチャネルと第2のチャネルの振幅が類似していることが(例えば、スペクトル重み計算によって)分かる。したがって、スペクトル重み計算230によって、第1のスペクトルビンについて、(中間)直接信号および/または(中間)周囲信号の第1のチャネルが、アップミックスされた直接オーディオ信号またはアップミックスされた周囲オーディオ信号(のみ)の第2のチャネル(チャネル2’)に寄与するべきであると結論づけることができる。したがって、行449aの上の線には、0.5の適切なスペクトル重みが見られる。同様に、スペクトル重み計算により、(中間)直接信号および/または中間周囲信号の第2のチャネルが、第1の行449aの2行目の対応する値0.5から分かるように、アップミックスされた直接オーディオ信号および/またはアップミックスされた周囲オーディオ信号の第3のチャネル(チャネル3’)に寄与するべきであると結論づけることができる。例えば、アップミックスされた直接オーディオ信号およびアップミックスされた周囲オーディオ信号の第2のチャネル(チャネル2’)および第3のチャネル(チャネル3’)は、比較的聴覚シーンの中心近くにあるが、一方、例えば、第1のチャネル(チャネル1’)と第4のチャネル(チャネル4’)は、聴覚シーンの中心からより離れていると仮定することができる。したがって、スペクトル重み計算330によって、音源が聴取者のほぼ正面にあることが判明した場合には、この音源によって励起される周囲信号成分がオーディオシーンの中心に近い1つまたは複数のチャネルでレンダリングされる(または主にレンダリングされる)ように、スペクトル重みを選択することができる。
ここで、第2のスペクトルビンを参照すると、行419bで、音源がおそらく聴取者の左側にあることが分かる。その結果、スペクトル重み計算330は、このスペクトルビンの周囲信号が、聴取者の左側の遠方の話者を対象とするアップミックスされた周囲オーディオ信号のチャネルに含まれるように、スペクトル重みを選択することができる。したがって、この第2の周波数ビンについて、スペクトル重み計算330によって、このスペクトルビンの周囲信号は、アップミックスされた周囲オーディオ信号の第1のチャネル(チャネル1’)にのみ含まれるべきであると決定することができる。これは、例えば、第1のアップミックスチャネル(チャネル1’)に関連するスペクトル重みを0とは異なるように(例えば、1に)選択し、他のスペクトル重み(他のアップミックスチャネル2’、3’、4’に関連する)を0に選択することで実行することができる。したがって、スペクトル重み計算230によって、音源がオーディオシーンの左側に強くあることが判明した場合には、スペクトル重み計算は、それぞれのスペクトルビン内の周囲信号成分がオーディオシーンの左側のスピーカに関連付けられている、アップミックスされた周囲オーディオ信号の(1つまたは複数の)チャネルに分配(アップミックス)されるようにスペクトル重みを選択する。当然のことながら、(入力オーディオ信号または直接信号を考慮したときに)スペクトル重み計算330によって、音源がオーディオシーンの右側にあることが判明した場合には、スペクトル重み計算330は、抽出された周囲信号の対応するスペクトル成分が、オーディオシーンの右側のスピーカ位置に関連付けられているアップミックスされた周囲オーディオ信号の(1つまたは複数の)チャネルに分配(アップミックス)されるようにスペクトル重みを選択する。
第3の例として、第3のスペクトルビンが考慮される。第3のスペクトルビンでは、スペクトル重み計算330は、音源がオーディオシーンの「ある程度」左側にある(しかし、オーディオシーンの極端に左側にあるわけではない)ことを見いだすことができる。例えば、これは、第1のチャネルに強い信号があり、第2のチャネルに中程度の信号がある(行419cを参照)という事実から分かる。
この場合、スペクトル重み計算330は、第3のスペクトルビン内の周囲信号成分がアップミックスされた周囲オーディオ信号のチャネル1’および2’に分配されるようにスペクトル重みを設定することができ、これは、周囲信号を聴覚シーンのいくらか左側に配置することに対応する(しかし、聴覚シーンの極端に左側ではない)。
結論として、スペクトル重みを適切に選択することにより、スペクトル重み計算330は、抽出された周囲信号成分がオーディオ信号シーンのどこに配置(またはパン)されるかを決定することができる。周囲信号成分の配置は、例えば、スペクトルビンごとに実行される。スペクトルシーン内で抽出された周囲信号の特定の周波数ビンを配置する必要があるという決定は、入力オーディオ信号の解析に基づいて、または抽出された直接信号の解析に基づいて行うことができる。また、直接信号と周囲信号との間の時間遅延が考慮されてもよく、それにより、周囲信号のアップミックス350で使用されるスペクトル重みを、直接信号のアップミックス340で使用されるスペクトル重みと比較して、時間的に(例えば、1つまたは複数のフレームだけ)遅延させることができる。
しかしながら、入力オーディオ信号または抽出された直接信号の位相または位相差も、スペクトル重みの組み合わせによって考慮することができる。また、スペクトル重みは自然に微調整された方法で決定され得る。例えば、スペクトル重みが、(中間)周囲信号のチャネルの、アップミックスされた周囲オーディオ信号の厳密に1つのチャネルへの割り当てを表す必要はない。むしろ、複数のチャネルまたはすべてのチャネルにわたる滑らかな分配は、スペクトル重みによって示されてもよい。
図3および図4を参照して説明された機能は、本発明による実施形態のいずれにおいても任意選択的に使用できることに留意されたい。しかしながら、周囲信号の抽出および周囲信号の分配について異なる概念を使用することもできる。
また、図3および図4に関して説明された特徴、機能および詳細は、他の実施形態に個別にまたは組み合わせて導入できることに留意されたい。
4)図5による方法
図5は、入力オーディオ信号に基づいて周囲信号チャネルを提供するための方法500のフローチャートを示す。
本方法は、ステップ510において、入力オーディオ信号に基づいて(中間)周囲信号を抽出するステップを含む。方法500は、ステップ520において、(抽出された中間)周囲信号を複数の(アップミックスされた)周囲信号チャネルに分配するステップをさらに含み、周囲信号チャネルの数は、入力オーディオ信号内の音源の位置または方向に応じて、入力オーディオ信号のチャネルの数よりも大きい。
図5による方法500は、個別にまたは組み合わせて、本明細書で説明されている特徴および機能のいずれかによって補足することができる。特に、図5による方法500は、オーディオ信号プロセッサに関しておよび/またはシステムに関して説明された特徴および機能および詳細のいずれかによって補足され得ることに留意されたい。
5)図6による方法
図6は、マルチチャネル入力オーディオ信号によって表現されるオーディオコンテンツをレンダリングするための方法600のフローチャートを示す。
本方法は、入力オーディオ信号に基づいて周囲信号チャネルを提供するステップ610を含み、3つ以上の周囲信号チャネルが提供される。周囲信号チャネルの提供は、例えば、図5に関して説明された方法500に従って実行されてもよい。
方法600はまた、3つ以上の直接信号チャネルを提供するステップ620を含む。
方法600は、周囲信号チャネルおよび直接信号チャネルを、一連の直接信号スピーカおよび一連の周囲信号スピーカを含むスピーカ配置に供給するステップ630も含み、直接信号チャネルの各々は、少なくとも1つの直接信号スピーカに供給され、周囲信号チャネルの各々は、少なくとも1つの周囲信号スピーカに供給される。
方法600は、個別にまたは組み合わせて、本明細書で説明される特徴および機能および詳細のいずれかによって任意選択的に補足することができる。例えば、方法600は、オーディオ信号プロセッサに関して、またはシステムに関して説明された特徴、機能、および詳細によって補足することもできる。
6)さらなる態様および実施形態
以下に、本発明による実施形態を提示する。特に、他の実施形態のいずれにも、個別にまたは組み合わせて取り入れることができる詳細が提示される。しかし、本明細書で言及される装置およびシステムによって実行することができる方法について説明することに留意されたい。
6.1.概要
以下に概要を提示する。概要に記載されている特徴は、実施形態を形成することができ、または本明細書に記載されている他の実施形態に導入することができる。
本発明による実施形態は、周囲信号の分離を導入し、周囲信号自体がそれらの音源信号の位置に従って(例えば、周囲信号を励起する音源の位置に従って)信号成分に分離される。すべての周囲信号は拡散しているため、位置を特定できないが、多くの周囲信号、例えば残響は、位置を特定できる(直接)励起信号から生成される。取得された周囲出力信号(例えば、周囲信号チャネル112b~112cまたは周囲信号チャネル254a~254cまたはアップミックスされた周囲オーディオ信号352)は、入力信号(例えば、N個のチャネル)よりも多くのチャネル(例えば、Q個のチャネル)を有し、出力チャネル(例えば、周囲信号チャネル)は、周囲信号成分を生成した直接ソース信号の位置に対応する。
(例えば、周囲信号チャネル112a~112cによって、または周囲信号チャネル254a~254cによって、またはアップミックスされた周囲オーディオ信号352によって表現される)取得されたマルチチャネル周囲信号は、オーディオ信号のアップミキシングのために、すなわち、N個のチャネルの入力信号が与えられた場合、Q個のチャネルの信号を作成するために要求され、ここでQ>Nである。マルチチャネル音響再生システムにおける出力信号のレンダリングは、以下で説明される(上記の説明でもある程度説明している)。
6.2 抽出された信号の提案されたレンダリング
提示された方法(および概念)の重要な側面は、抽出された周囲信号成分(例えば、抽出された周囲信号130または抽出された周囲信号230または抽出された周囲信号324)が、(例えば、それぞれの周囲信号または周囲信号成分を励起する直接音源の)それらの励起信号の位置に従って、周囲チャネル信号の間(例えば、信号112a~112cの間、または信号254a~254cの間、またはアップミックスされた周囲オーディオ信号352のチャネルの間)で分配されるということである。一般に、すべてのチャネル(スピーカ)は、直接信号または周囲信号、あるいはその両方を再生するために使用することができる。
図7は、2つのチャネルでステレオオーディオ信号を再生するのに適した、2つのスピーカを備えた一般的なスピーカ設定を示している。言い換えると、図7は、2チャネルステレオフォニー用の2つのスピーカ(左側と右側にそれぞれ「L」と「R」)を備えた標準のスピーカ設定を示している。
より多くのチャネルを備えたスピーカ設定が利用可能な場合、2チャネル入力信号(例えば、入力オーディオ信号110または入力オーディオ信号210または入力オーディオ信号310)を複数のチャネル信号に分離することができ、追加の出力信号が追加のスピーカに供給される。利用可能な入力チャネルよりも多くのチャネルで出力信号を生成するこのプロセスは、一般にアップミキシングと呼ばれる。
図8は、4つのスピーカを備えたスピーカ設定を示している。言い換えると、図8は、4つのスピーカ(前左「fL」、前右「fR」、後左「rL」、後右「rR」)を備えた4チャネルスピーカ設定を示している。別の言い方をすれば、図8は4つのスピーカを備えたスピーカ設定を示している。例えば、2つのチャネルで信号を再生するときに4つすべてのスピーカを利用するには、入力信号(例えば、入力オーディオ信号110または入力オーディオ信号210または入力オーディオ信号310)を4つのチャネルを有する信号に分割することができる。
図9に、4つのスピーカ(「高さ」スピーカ)が持ち上げられている、例えば、リスニングルームの天井の下に取り付けられている、8つのスピーカがある別のスピーカ設定を示す。言い換えると、図9は、「h」とマークされた追加の高さスピーカを備えた4チャネルスピーカ設定を示している。
入力信号よりも多くのチャネルを有するスピーカ設定を使用してオーディオ信号を再生する場合、入力信号を意味のある信号成分に分解するのが一般的である。与えられた例では、すべての直接音は4つの下部スピーカの1つに供給され、入力信号の側面にパンされた音源が後部スピーカ「rL」と「rR」によって再生される。中央にパンされた、または少しずれた音源は、前部スピーカ「fL」および「fR」にパンされる。これにより、直接音源は、ステレオパノラマにおけるそれらの知覚された位置に従ってスピーカの間で分配され得る。従来の方法では、入力信号と同じ数のチャネルを有する周囲信号を計算する。2チャネルのステレオ入力信号をアップミックスする場合、2チャネルの周囲信号は、使用可能なスピーカのサブセットに供給されるか、1つの周囲チャネル信号を複数のスピーカに供給することにより、4つすべてのスピーカに分配される。
提示された方法の重要な側面は、Q>NであるN個のチャネルの入力信号からQ個のチャネルの周囲信号を分離することである。与えられた例では、4つのチャネルを有する周囲信号は、直接音源から励起された周囲信号が、これらの信号の方向にパンされるように計算される。
この点で、例えば、上述のスピーカ間の直接音源の分配は、直接/周囲分解220と周囲信号分配240との相互作用によって実行できることに留意されたい。例えば、スペクトル重み計算330は、直接信号のアップミックス340が、本明細書で説明されるような直接音源の分配を実行するように(例えば、入力信号の側面にパンされた音源が後部スピーカで再生され、中央またはわずかに中央からずれた音源が前部スピーカにパンされるように)、スペクトル重みを決定することができる。
また、上記の4つの下部スピーカ(fL、fR、rL、rR)は、スピーカ262a~262cに対応してもよい。また、高さスピーカhは、スピーカ264a~264cに対応してもよい。
言い換えれば、直接音の分配に関する上記の概念は、図2によるシステム200でも実施することができ、図3および図4に関して説明した処理によって達成することができる。
6.3 信号分離方法
以下では、本発明による実施形態で使用することができる信号分離方法について説明する。
残響の多い環境(レコーディングスタジオやコンサートホール)では、音源が残響を生成し、それにより、拍手音や拡散する周囲騒音(例えば風雑音や雨など)のような他の拡散音とともに、雰囲気に寄与する。ほとんどの音楽録音では、残響は最も顕著な周囲信号である。それは、部屋で音源を録音するか、スピーカの信号を部屋に送り、残響信号をマイクで録音することで、音響的に生成することができる。残響は、信号処理によって人工的に生成することもできる。
残響は、境界(壁、床、天井)で反射される音源によって生成される。初期反射は通常最大の大きさで、最初にマイクに到達する。反射は減衰する振幅でさらに反射され、遅延した残響の原因となる。このプロセスは、音源信号の多くの遅延およびスケーリングされたコピーの加法混合としてモデル化できる。したがって、多くの場合、畳み込みによって実施される。
アップミキシングは、追加情報を使用してガイドするか、追加情報なしでオーディオ入力信号のみを使用してガイドなしで実行することができる。ここでは、ブラインドアップミキシングのより困難な手順に焦点を当てる。適切なメタデータでガイドされた手法を使用する場合も、同様の概念を適用することができる。
入力信号x(t)は、直接信号d(t)と周囲信号a(t)の加法混合であると仮定される。
x(t)=d(t)+a(t) (1)
すべての信号は複数のチャネル信号を有する。入力、直接、または周囲信号の第iのチャネル信号は、それぞれx(t)、d(t)、a(t)で表現される。マルチチャネル信号は、x(t)=[x(t)・・・x(t)]、d(t)=[d(t)・・・d(t)]およびa(t)=[a(t)・・・a(t)]として記述でき、ここでNはチャネル数である。
処理(例えば、本発明による装置および方法によって実行される処理、例えば、装置100またはシステム200によって実行される処理、または図3および4に示されるような処理)は、短期フーリエ変換または別の再構成フィルタバンクを使用して、時間-周波数領域で実行される。時間周波数領域では、信号モデルは次のように記述される。
X(m,k)=D(m,k)+A(m,k)、 (2)
ここで、X(m,k)、D(m,k)およびA(m,k)は、それぞれx(t)、d(t)およびa(t)のスペクトル係数であり、mは時間インデックスを示し、kは周波数ビン(またはサブバンド)インデックスを示す。以下では、可能な場合、時間とサブバンドのインデックスは省略される。
直接信号自体は、複数の音源によって生成される複数の信号成分
Figure 0007083405000008
で構成することができ、周波数領域表記では次のように記述され、
Figure 0007083405000009
(3)
そして時間領域表記では次のように記述され、
Figure 0007083405000010
(4)
Sは音源の数である。信号成分は異なる位置にパンされる。
直接信号成分dによる残響信号成分rの生成は、線形時間不変(LTI)プロセスとしてモデル化され、直接信号と反響プロセスを特徴付けるインパルス応答の畳み込みによって時間領域で合成できる。
Figure 0007083405000011
(5)
音楽制作に使用される残響プロセスのインパルス応答は減衰し、指数関数的に減衰することがよくある。残響時間で減衰を指定することができる。残響時間は、初期音がミュートされた後に、残響信号のレベルが初期音の一部分に減衰するまでの時間である。残響時間は、例えば「RT60」、つまり残響信号が60dB減少するのにかかる時間として指定できる。一般的な部屋、ホール、その他の残響プロセスの残響時間RT60は、100ミリ秒から6秒の範囲である。
上記の信号x(t)、x(t)、X(m、k)およびrの上述のモデルは、入力オーディオ信号110の特性、入力オーディオ信号210の特性、および/または入力オーディオ信号310の特性を表すことができ、そして、周囲信号抽出120を実行するとき、または直接/周囲分解220または直接/周囲分解320を実行するときに利用できることに留意されたい。
以下では、本発明の基礎となる主要な概念について説明し、これは、装置100、システム200に適用でき、図3および図4に関して説明した機能によって実施することができる。
本発明の一態様によれば、
Figure 0007083405000012
個のチャネルを有する周囲信号
Figure 0007083405000013
を分離する(または提供する)ことが提案される。例えば、本方法は以下を含む。
1.
Figure 0007083405000014
個のチャネルを有する周囲信号
Figure 0007083405000015
を分離し、
2.すべての位置
Figure 0007083405000016
について、入力信号からの空間画像内の位置に応じて音源を分離するためのスペクトル重み(7)を計算し、
3.スペクトル重み付け(6)により、取得した周囲信号を
Figure 0007083405000017
個のチャネルにアップミックスする。
Figure 0007083405000018
(6)
例えば、N個のチャネルを有する周囲信号
Figure 0007083405000019
の分離は、周囲信号抽出120によって、または直接/周囲分解220によって、または直接/周囲分解320によって実行することができる。
さらに、スペクトル重みの計算は、オーディオ信号プロセッサ100によって、またはオーディオ信号プロセッサ250によって、またはスペクトル重み計算330によって実行することができる。さらに、取得された周囲信号のQ個のチャネルへのアップミキシングは、例えば、周囲信号分配140によって、または周囲信号分配240によって、またはアップミキシング350によって実行することができる。スペクトル重み(例えば、図4の行449a~449eによって表され得るスペクトル重み332)は、例えば、入力信号X(例えば、入力オーディオ信号110または入力オーディオ信号210または入力オーディオ信号310)を解析することから導出され得る。
Figure 0007083405000020
(7)
スペクトル重み
Figure 0007083405000021
は、入力信号から位置
Figure 0007083405000022
にパンされた音源を分離できるように計算される。スペクトル重み
Figure 0007083405000023
は、残響のインパルス応答(プリディレイ)の時間遅延を考慮するために、推定された周囲信号
Figure 0007083405000024
に適用する前に、任意選択的に遅延(時間シフト)される。
信号分離の両方の処理ステップには様々な方法が可能である。以下では、2つの適切な方法について説明する。
しかしながら、以下に記載される方法は、例としてのみ考慮されるべきであり、本方法は、本発明による特定の用途に適合されるべきであることに留意されたい。周囲信号の分離方法に関しては、修正が全く不要であるか、または軽微な修正のみが必要であることに留意されたい。
さらに、スペクトル重みの計算も強く適合させる必要がないことに留意されたい。むしろ、以下に述べるスペクトル重みの計算は、例えば、入力オーディオ信号110、210、310に基づいて実行することができる。ただし、以下で説明する方法(スペクトル重みの計算用)によって取得されたスペクトル重みは、入力信号のアップミキシングまたは直接信号のアップミキシングではなく、抽出された周囲信号のアップミキシングに適用される。
6.4 周囲信号の分離方法
周囲信号分離の可能な方法は、国際特許出願PCT/EP2013/072170「Apparatus and method for multi-channel direct-ambient decomposition for audio signal processing」に記載されている。
しかしながら、周囲信号の分離のために異なる方法を使用することができ、周囲信号の抽出または直接信号と周囲信号への入力信号の分解がある限り、前記方法への修正も可能である。
6.5 空間位置のスペクトル重みを計算する方法
空間位置のスペクトル重みを計算するための可能な方法は、国際公開第2013004698A1号「Method and apparatus for decomposing a stereo recording using frequency-domain processing employing a spectral weights generator」に記載されている。
しかしながら、(例えば、行列Gを定義することができる)スペクトル重みを取得するための異なる方法を使用できることに留意されたい。また、国際公開第2013004698A1号による方法は、空間画像における位置に従って音源を分離するためのスペクトル重みが、出力チャネルの所望の数に対応するいくつかのチャネルについて導出されることが保証される限り、修正することもできる。
7.結論
以下では、いくつかの結論が提供される。しかしながら、結論に記載されているアイデアは、本明細書に開示されている実施形態のいずれにも導入できることに留意されたい。
オーディオ入力信号を直接信号成分と周囲信号成分に分解する方法が説明されていることに留意されたい。本方法は、サウンドのポストプロダクションと再生に適用することができる。目的は、すべての直接信号成分が減衰され、拡散信号成分のみが聞こえる周囲信号を算出することである。
提示された方法の重要な側面は、そのような周囲信号成分がそれらの音源信号の位置に従って分離されることである。すべての周囲信号は拡散しているため、位置を有さないが、多くの周囲信号、例えば残響は、定義された位置を有する直接励起信号から生成される。例えば、周囲信号チャネル112a~112cによって、または周囲チャネル信号254a~254cによって、またはアップミックスされた周囲オーディオ信号352によって表すことができる、取得された周囲出力信号は、入力信号(例えば、N個のチャネル)よりも多くのチャネル(例えば、Q個のチャネル)を有し、出力チャネル(例えば、周囲信号チャネル112a~112cまたは周囲信号チャネル254a~254c)は、直接励起信号(これは、例えば、入力オーディオ信号110または入力オーディオ信号210または入力オーディオ信号310に含まれてもよい)の位置に対応する。
さらに結論を述べると、ステレオ画像内の位置に従ってのみ信号成分(またはすべての信号成分)または直接信号成分を分離するための様々な方法が提案されている(例えば、参考文献[2]、[10]、[11]および[12]を参照)。本発明による実施形態は、この(従来の)概念を周囲信号成分に拡張する。
さらに結論すると、本発明による実施形態は、周囲信号の抽出およびアップミキシングに関する。本発明による実施形態は、例えば、自動車用途に適用することができる。
本発明による実施形態は、例えば、「シンフォリア」概念のコンテキストで適用することができる。
本発明による実施形態は、3Dパノラマを作成するために適用することもできる。
8.実施態様の代替例
いくつかの態様を装置のコンテキストで説明したが、これらの態様は対応する方法の説明も表し、ブロックまたはデバイスが方法ステップまたは方法ステップの特徴に対応することは明らかである。同様に、方法ステップのコンテキストで説明される態様は、対応するブロックまたは項目または対応する装置の特徴の説明も表す。方法ステップの一部またはすべては、例えば、マイクロプロセッサ、プログラム可能なコンピュータまたは電子回路などのハードウェア装置によって(または使用して)実行されてもよい。いくつかの実施形態では、最も重要な方法ステップの1つまたは複数は、そのような装置によって実行されてもよい。
特定の実施態様に応じて、本発明の実施形態は、ハードウェアまたはソフトウェアで実施することができる。実施は、電子的に読み取り可能な制御信号が格納されており、それぞれの方法が実行されるように、プログラム可能なコンピュータシステムと協働する(または協働することができる)デジタル記憶媒体、例えばフロッピーディスク、DVD、ブルーレイ、CD、ROM、PROM、EPROM、EEPROMまたはフラッシュメモリを使用して実行することができる。したがって、デジタル記憶媒体はコンピュータで読み取り可能であってもよい。
本発明によるいくつかの実施形態は、本明細書に記載の方法の1つが実行されるように、プログラム可能なコンピュータシステムと協働することができる電子的に読み取り可能な制御信号を有するデータキャリアを含む。
一般に、本発明の実施形態は、プログラムコードを有するコンピュータプログラム製品として実施することができ、プログラムコードは、コンピュータプログラム製品がコンピュータ上で実行されるときに方法の1つを実行するように動作する。プログラムコードは、例えば、機械可読なキャリアに格納されてもよい。
他の実施形態は、機械可読なキャリアに格納された、本明細書に記載の方法の1つを実行するためのコンピュータプログラムを含む。
言い換えれば、したがって、本発明の方法の実施形態は、コンピュータプログラムがコンピュータ上で実行されるときに、本明細書に記載の方法の1つを実行するためのプログラムコードを有するコンピュータプログラムである。
したがって、本発明の方法のさらなる実施形態は、本明細書に記載の方法の1つを実行するためのコンピュータプログラムを含み、それが記録されたデータキャリア(またはデジタル記憶媒体、またはコンピュータ可読媒体)である。データキャリア、デジタル記憶媒体、または記録された媒体は、通常、有形および/または非一時的である。
したがって、本発明の方法のさらなる実施形態は、本明細書に記載の方法の1つを実行するためのコンピュータプログラムを表すデータストリームまたは信号シーケンスである。データストリームまたは信号シーケンスは、例えばインターネットなどのデータ通信接続を介して転送されるように構成されてもよい。
さらなる実施形態は、本明細書に記載の方法の1つを実行するように構成または適合された処理手段、例えばコンピュータ、またはプログラマブルロジックデバイスを含む。
さらなる実施形態は、本明細書に記載の方法の1つを実行するためのコンピュータプログラムがインストールされたコンピュータを含む。
本発明によるさらなる実施形態は、本明細書に記載の方法の1つを実行するためのコンピュータプログラムを(例えば、電子的または光学的に)受信機に転送するように構成された装置またはシステムを含む。受信機は、例えば、コンピュータ、モバイルデバイス、メモリデバイスなどであってもよい。装置またはシステムは、例えば、コンピュータプログラムを受信機に転送するためのファイルサーバーを含んでもよい。
いくつかの実施形態では、プログラマブルロジックデバイス(例えば、フィールドプログラマブルゲートアレイ)を使用して、本明細書に記載の方法の機能の一部またはすべてを実行することができる。いくつかの実施形態では、フィールドプログラマブルゲートアレイは、本明細書に記載の方法の1つを実行するためにマイクロプロセッサと協働してもよい。一般に、これらの方法は、任意のハードウェア装置によって実行されることが好ましい。
本明細書で説明する装置は、ハードウェア装置を使用して、またはコンピュータを使用して、またはハードウェア装置とコンピュータの組合せを使用して実施することができる。
本明細書で説明される装置、または本明細書で説明される装置の任意の構成要素は、少なくとも部分的にハードウェアおよび/またはソフトウェアで実施することができる。
本明細書で説明する方法は、ハードウェア装置を使用して、またはコンピュータを使用して、またはハードウェア装置とコンピュータの組合せを使用して実行することができる。
本明細書で説明される方法、または本明細書で説明される装置の任意の構成要素は、ハードウェアおよび/またはソフトウェアによって少なくとも部分的に実行することができる。
上述の実施形態は、本発明の原理の単なる例示に過ぎない。本明細書に記載の配置および詳細の修正および変更は、他の当業者には明らかであることを理解されたい。したがって、本明細書の実施形態の説明および説明として提示される特定の詳細によってではなく、差し迫った特許請求の範囲によってのみ限定されることが意図されている。
参考文
[1]JB Allen,DA Berkeley,and J Blauert,“Multi-microphone signal-processing technique to remove room reverberation from speech signals,”J Acoust Soc Am.,vol 62,1977
[2]C Avendano and J-M Jot,“A frequency-domain ap-proach to multi-channel upmix,”J Audio Eng Soc.,vol 52,2004
[3]C Faller,“Multiple-loudspeaker playback of stereo sig-nals,”J Audio Eng Soc.,vol 54,2006
[4]J Merimaa,M Goodwin,and J-M Jot,“Correlation-based ambience extraction from stereo recordings,”in Proc Audio Eng Soc /23rd Conv.,2007
[5]J Usher and J Benesty,“Enhancement of spatial sound quality:A new reverberation-extraction audio uprnixer,”IEEE Trans Audio,Speech,and Language Process.,vol 15,pp 2141-2150,2007
[6]G Soulodre,“System for extracting and changing the reverberant content of an audio input signal,”US Patent 8,036,767,Oct 2011
[7]J He,E-L Tan,and W-S Gan,“Linear estimation based primary-ambient extraction for stereo audio signals,”IEEE/ACM Trans Audio,Speech,and Language Process.,vol 22,no 2,2014
[8]C Uhle and E Habets,“Direct-ambient decomposition using parametric Wiener filtering wih spatial cue con-trol,”in ProcInt Conf on Acoust.,Speech and Sig Process.,ICASSP,2015
[9]A Walther and C Faller,“Direct-ambient decom-position and upmix of surround sound signals,”in ProcIEEE WASPAA,2011
[10]D Barry,B Lawlor,and E Coyle,“Sound source sep-aration:Azimuth discrimination and resynthesis,”in Proc Int Conf Digital Audio Effects(DAFx),2004
[11]C Uhle,“Center signal scaling using signal-to-downmix ratios,”in Proc Int Corif Digital Audio Ef-fects,DAFx,2013
[12]C Uhle and E Habets,“Subband center signal scaling using power ratios,”in Proc AES 53rd Conf Semantic Audio,2014.

Claims (33)

  1. 入力オーディオ信号(110;160;210;310;x(t)、x(t)、X(m,k))に基づいて周囲信号チャネル(112a~112c;162a~162c;254a~254c;352;
    Figure 0007083405000025
    )を提供するためのオーディオ信号プロセッサ(100;150;250)であって、
    前記オーディオ信号プロセッサは、前記周囲信号チャネルを取得するように構成され、
    異なるオーディオコンテンツを含む取得された周囲信号チャネルの数(Q)は、前記入力オーディオ信号のチャネルの数(N)より大きく、
    前記オーディオ信号プロセッサは、前記入力オーディオ信号内の音源の位置または方向に応じて、周囲信号成分が前記周囲信号チャネル間で分配されるように、前記周囲信号チャネルを取得するように構成され
    記オーディオ信号プロセッサは、それぞれの周囲信号成分を励起する直接音源の位置または方向に従って周囲信号成分を前記周囲信号チャネルに分配するように構成され、
    異なる位置に配置された異なる音源によって励起された異なる周囲信号成分は、前記周囲信号チャネル間で異なるように分配され、
    異なる周囲信号チャネルへの周囲信号成分の分配は、前記それぞれの周囲信号成分を励起する直接信号成分の異なる直接信号チャネルへの分配に対応し、
    前記周囲信号チャネル(112a~112c;254a~254c;352;
    Figure 0007083405000026
    )は、異なる方向に関連付けられ、
    直接信号チャネル(252a~252c;324;
    Figure 0007083405000027
    )は異なる方向に関連付けられ、
    前記周囲信号チャネル(254a~254c;352;
    Figure 0007083405000028
    )および前記直接信号チャネル(252a~252c;342;
    Figure 0007083405000029
    )は、+/-20°の許容誤差内で同じ方位角方向のセットに関連付けられ、あるいは、前記周囲信号チャネルは、+/-20°の許容誤差内で前記直接信号チャネルに関連する前記方位角方向のセットのサブセットに関連付けられ、
    前記オーディオ信号プロセッサは、それぞれの直接音成分の位置または方向に従って、直接信号成分を直接信号チャネル間で分配するように構成され、
    前記オーディオ信号プロセッサは、前記それぞれの周囲信号成分を励起する直接音源の位置または方向に従って前記周囲信号チャネル間で前記周囲信号成分を分配するように構成され、
    前記オーディオ信号プロセッサは、直接信号成分(226;
    Figure 0007083405000030
    ;322)を直接信号チャネル(252a~252c;342;
    Figure 0007083405000031
    )に分配するために、および前記周囲信号の周囲信号成分(230;
    Figure 0007083405000032
    ;324)を周囲信号チャネル(112a~112c;254a~254c;352;
    Figure 0007083405000033
    )に分配するために、同じパンニング係数またはスペクトル重み(332;G )を使用するように構成される、
    オーディオ信号プロセッサ(100;150;250)。
  2. 入力オーディオ信号(110;160;210;310;x(t)、x(t)、X(m,k))に基づいて周囲信号チャネル(112a~112c;162a~162c;254a~254c;352;
    Figure 0007083405000034
    )を提供するためのオーディオ信号プロセッサ(100;150;250)であって、
    前記オーディオ信号プロセッサは、前記周囲信号チャネルを取得するように構成され、
    異なるオーディオコンテンツを含む取得された周囲信号チャネルの数(Q)は、前記入力オーディオ信号のチャネルの数(N)より大きく、
    前記オーディオ信号プロセッサは、前記入力オーディオ信号内の音源の位置または方向に応じて、周囲信号成分が前記周囲信号チャネル間で分配されるように、前記周囲信号チャネルを取得するように構成され、
    前記オーディオ信号プロセッサは、前記入力オーディオ信号に基づいて、直接音成分を含む直接信号を取得するように構成され、
    前記オーディオ信号プロセッサは、前記入力オーディオ信号に基づいて周囲信号(130;230;324;
    Figure 0007083405000035
    )を抽出するように構成され、
    前記信号プロセッサは、前記入力オーディオ信号内の音源の位置または方向に応じて、前記周囲信号を複数の周囲信号チャネルに分配するように構成され、周囲信号チャネルの数(Q)は、前記入力オーディオ信号のチャネル数(N)よりも大きく、
    前記周囲信号チャネル(112a~112c;254a~254c;352;
    Figure 0007083405000036
    )は、異なる方向に関連付けられ、
    直接信号チャネル(252a~252c;324;
    Figure 0007083405000037
    )は異なる方向に関連付けられ、
    前記周囲信号チャネル(254a~254c;352;
    Figure 0007083405000038
    )および前記直接信号チャネル(252a~252c;342;
    Figure 0007083405000039
    )は、じ方向のセットに関連付けられ、あるいは、前記周囲信号チャネルは、前記直接信号チャネルに関連する前記方向のセットのサブセットに関連付けられ、
    前記オーディオ信号プロセッサは、それぞれの直接音成分の位置または方向に従って、直接信号成分を直接信号チャネル間で分配するように構成され、
    前記オーディオ信号プロセッサは、前記直接信号成分の分配に使用するのと同じパンニング係数またはスペクトル重みを使用して、前記それぞれの周囲信号成分を励起する直接音源の位置または方向に従って前記周囲信号成分を前記周囲信号チャネルに分配するように構成される、
    オーディオ信号プロセッサ(100;150;250)。
  3. 入力オーディオ信号(110;160;210;310;x(t)、x(t)、X(m,k))に基づいて周囲信号チャネル(112a~112c;162a~162c;254a~254c;352;
    Figure 0007083405000040
    )を提供するためのオーディオ信号プロセッサ(100;150;250)であって、
    前記オーディオ信号プロセッサは、前記周囲信号チャネルを取得するように構成され、
    異なるオーディオコンテンツを含む取得された周囲信号チャネルの数(Q)は、前記入力オーディオ信号のチャネルの数(N)より大きく、
    前記オーディオ信号プロセッサは、前記入力オーディオ信号内の音源の位置または方向に応じて、周囲信号成分が前記周囲信号チャネル間で分配されるように、前記周囲信号チャネルを取得するように構成され、
    前記オーディオ信号プロセッサは、前記入力オーディオ信号に基づいて、直接音成分を含む直接信号を取得するように構成され、
    前記オーディオ信号プロセッサは、前記入力オーディオ信号に基づいて周囲信号(130;230;324;
    Figure 0007083405000041
    )を抽出するように構成され、
    前記信号プロセッサは、前記入力オーディオ信号内の音源の位置または方向に応じて、前記周囲信号を複数の周囲信号チャネルに分配するように構成され、周囲信号チャネルの数(Q)は、前記入力オーディオ信号のチャネル数(N)よりも大きく、
    前記オーディオ信号プロセッサは、前記入力オーディオ信号に基づいて直接信号を取得するように構成され、
    前記オーディオ信号プロセッサは、前記周囲信号(130;230;324;
    Figure 0007083405000042
    )を前記周囲信号チャネル(112a~112c;254a~254c;352;
    Figure 0007083405000043
    )に分配するために、パンニング係数またはスペクトル重み(332;G)を適用するように構成され、
    前記オーディオ信号プロセッサは、直接信号成分(226;
    Figure 0007083405000044
    ;322)を直接信号チャネル(252a~252c;342;
    Figure 0007083405000045
    )に分配するために、および前記周囲信号の周囲信号成分(230;
    Figure 0007083405000046
    ;324)を周囲信号チャネル(112a~112c;254a~254c;352;
    Figure 0007083405000047
    )に分配するために、同じパンニング係数またはスペクトル重み(332;G)のセットを適用するように構成される、
    オーディオ信号プロセッサ(100;150;250)。
  4. 前記オーディオ信号プロセッサは、前記周囲信号成分が、前記それぞれの周囲信号成分を励起する直接音源の位置または方向に従って前記周囲信号チャネル間で分配されるように、前記周囲信号チャネル(112a~112c;162a~162c;254a~254c;352;
    Figure 0007083405000048
    )を取得するように構成される、請求項1から3のいずれか一項に記載のオーディオ信号プロセッサ(100;150;250)。
  5. 前記オーディオ信号プロセッサは、前記入力オーディオ信号の前記1つまたは複数のチャネルを複数のアップミックスされたチャネルに分配するように構成され、アップミックスされたチャネルの数は、前記入力オーディオ信号の前記チャネルの数より大きく、
    前記オーディオ信号プロセッサは、アップミックスされたチャネルから前記周囲信号チャネルを抽出するように構成される、
    請求項1から4のいずれか一項に記載のオーディオ信号プロセッサ(150;250)。
  6. 前記オーディオ信号プロセッサは、マルチチャネル周囲信号抽出を使用して、またはマルチチャネル直接信号/周囲信号分離を使用して、前記アップミックスされたチャネルから前記周囲信号チャネルを抽出するように構成される、請求項5に記載のオーディオ信号プロセッサ(150;250)。
  7. 前記オーディオ信号プロセッサは、アップミキシング係数を決定し、周囲信号抽出係数を決定するように構成され、前記オーディオ信号プロセッサは、前記アップミキシング係数および前記周囲信号抽出係数を使用して前記周囲信号チャネルを取得するように構成される、請求項1から4のいずれか一項に記載のオーディオ信号プロセッサ(150;250)。
  8. 力オーディオ信号(110;210;310;x(t)、x(t)、X(m,k))に基づいて、周囲信号チャネル(112a~112c;254a~254c;352;
    Figure 0007083405000049
    )を提供するための請求項1から7のいずれか一項に記載のオーディオ信号プロセッサ(100;250)であって、
    前記オーディオ信号プロセッサは、前記入力オーディオ信号に基づいて周囲信号(130;230;324;
    Figure 0007083405000050
    )を抽出するように構成され、
    前記信号プロセッサは、前記入力オーディオ信号内の音源の位置または方向に応じて、前記周囲信号を複数の周囲信号チャネルに分配するように構成され、周囲信号チャネルの数(Q)は、前記入力オーディオ信号のチャネル数(N)よりも大きい、
    オーディオ信号プロセッサ(100;250)。
  9. 前記オーディオ信号プロセッサは、前記周囲信号を導出するために、前記入力オーディオ信号(110;210;310;x(t)、x(t)、X(m,k))に基づいて直接-周囲分離(120;220;320)を実行するように構成される、請求項1から8のいずれか一項に記載のオーディオ信号プロセッサ。
  10. 前記オーディオ信号プロセッサは、それぞれの周囲信号成分を励起する直接音源の位置または方向に従って周囲信号成分を前記周囲信号チャネルに分配するように構成される、請求項1から9のいずれか一項に記載のオーディオ信号プロセッサ。
  11. 前記周囲信号チャネル(112a~112c;254a~254c;352;
    Figure 0007083405000051
    )は、異なる方向に関連付けられる、請求項10に記載のオーディオ信号プロセッサ。
  12. 直接信号チャネル(252a~252c;324;
    Figure 0007083405000052
    )は異なる方向に関連付けられ、
    前記周囲信号チャネル(254a~254c;352;
    Figure 0007083405000053
    )および前記直接信号チャネル(252a~252c;342;
    Figure 0007083405000054
    )は、じ方向のセットに関連付けられ、あるいは、前記周囲信号チャネルは、前記直接信号チャネルに関連する前記方向のセットのサブセットに関連付けられ、
    前記オーディオ信号プロセッサは、それぞれの直接音成分の位置または方向に従って、直接信号成分を直接信号チャネル間で分配するように構成され、
    前記オーディオ信号プロセッサは、前記直接信号成分が分配されるのと同じ方法で、前記それぞれの周囲信号成分を励起する直接音源の位置または方向に従って前記周囲信号チャネル間で前記周囲信号成分を分配するように構成される、
    請求項11に記載のオーディオ信号プロセッサ。
  13. 前記オーディオ信号プロセッサは、周囲信号成分の基礎となる音源信号の位置に従って前記周囲信号が前記周囲信号成分に分離されるように、前記周囲信号チャネル(112a~112c;254a~254c;352;
    Figure 0007083405000055
    )を提供するように構成される、請求項1から12のいずれか一項に記載のオーディオ信号プロセッサ。
  14. 前記オーディオ信号プロセッサは、前記周囲信号(130;230;324;
    Figure 0007083405000056
    )を前記周囲信号チャネル(112a~112c;254a~254c;352;
    Figure 0007083405000057
    )に分配するために、スペクトル重み(332;G)を適用するように構成される、請求項1から13のいずれか一項に記載のオーディオ信号プロセッサ。
  15. 前記オーディオ信号プロセッサは、前記周囲信号(130;230;324;
    Figure 0007083405000058
    )を前記複数の周囲信号チャネル(112a~112c;254a~254c;352;
    Figure 0007083405000059
    )にアップミックスするために、スペクトル重み(332;G)を適用するように構成され、前記スペクトル重み(332;G)は、指向性音源をそれらの位置または方向に従って分離するために計算され、あるいは
    前記オーディオ信号プロセッサは、前記周囲信号を前記複数の周囲信号チャネルにアップミックスするために、スペクトル重みの遅延バージョンを適用するように構成され、前記スペクトル重みの遅延バージョンは、指向性音源をそれらの位置または方向に従って分離するために計算される、請求項14に記載のオーディオ信号プロセッサ。
  16. 前記オーディオ信号プロセッサは、前記スペクトル重みが時間に依存し、かつ周波数に依存するように、前記スペクトル重み(332;G)を導出するように構成される、請求項14または15に記載のオーディオ信号プロセッサ。
  17. 前記オーディオ信号プロセッサは、前記入力オーディオ信号(110;210;310;x(t)、x(t)、X(m,k))の空間音像における音源の位置または方向に応じて前記スペクトル重み(332;G)を導出するように構成される、請求項14から16のいずれか一項に記載のオーディオ信号プロセッサ。
  18. 前記入力オーディオ信号(110;210;310;x(t)、x(t)、X(m,k))は少なくとも2つの入力チャネル信号を含み、前記オーディオ信号プロセッサは、前記少なくとも2つの入力チャネル信号間の差に応じて前記スペクトル重み(332;G)を導出するように構成される、
    請求項14から17のいずれか一項に記載のオーディオ信号プロセッサ。
  19. 前記オーディオ信号プロセッサは、所与の位置または方向に由来するスペクトル成分が、他のチャネルと比較した場合、それぞれの位置または方向に関連するチャネルでより強く重み付けされるように、前記スペクトル成分が由来する位置または方向に応じて前記スペクトル重み(332;G)を決定するように構成される、請求項14から18のいずれか一項に記載のオーディオ信号プロセッサ。
  20. 前記オーディオ信号プロセッサは、前記スペクトル重みが、複数の出力チャネル信号(342、352)における入力チャネル信号(322、324)のスペクトル成分の重み付けを記述するように、前記スペクトル重み(332;G)を決定するように構成される、請求項14から19のいずれか一項に記載のオーディオ信号プロセッサ。
  21. 前記オーディオ信号プロセッサは、直接信号成分(226;
    Figure 0007083405000060
    ;322)を直接信号チャネル(252a~252c;342;
    Figure 0007083405000061
    )に分配するために、および前記周囲信号の周囲信号成分(230;
    Figure 0007083405000062
    ;324)を周囲信号チャネル(112a~112c;254a~254c;352;
    Figure 0007083405000063
    )に分配するために、同じスペクトル重み(332;G)のセットを適用するように構成される、請求項14から20のいずれか一項に記載のオーディオ信号プロセッサ。
  22. 前記入力オーディオ信号(110;210;310;x(t)、x(t)、X(m,k))は少なくとも2つのチャネルを含み、および/または前記周囲信号(130;230;324;
    Figure 0007083405000064
    )は少なくとも2つのチャネルを含む、請求項1から21のいずれか一項に記載のオーディオ信号プロセッサ。
  23. マルチチャネル入力オーディオ信号(210、X)によって表現されるオーディオコンテンツをレンダリングするためのシステム(200)であって、
    請求項1から22のいずれか一項に記載のオーディオ信号プロセッサ(100;250)であって、3つ以上の直接信号チャネル(252a~252c)および3つ以上の周囲信号チャネル(254a~254c)を提供するように構成されたオーディオ信号プロセッサと、
    一組の直接信号スピーカ(262a~262c)および一組の周囲信号スピーカ(264a~264c)を含むスピーカ配置(260)と、を含み、
    前記直接信号チャネルの各々は、前記直接信号スピーカのうちの少なくとも1つに関連付けられ、
    前記周囲信号チャネルの各々は、前記周囲信号スピーカのうちの少なくとも1つに関連付けられる、
    システム(200)。
  24. 前記周囲信号スピーカ(264a~264c)の各々は、前記直接信号スピーカ(262a~262c)のうちの1つと関連付けられる、請求項23に記載のシステム。
  25. 前記周囲信号スピーカ(264a~264c;h)の位置は、前記直接信号スピーカ(262a~262c;fL、fR、rL、rR)の位置に対して高くなっている、請求項23または24に記載のシステム。
  26. 入力オーディオ信号に基づいて周囲信号チャネルを提供するための方法であって、
    前記方法は、前記入力オーディオ信号内の音源の位置または方向に応じて、周囲信号成分が前記周囲信号チャネル間で分配されるように、前記周囲信号チャネルを取得するステップを含み、
    異なるオーディオコンテンツを含む取得された周囲信号チャネルの数は、前記入力オーディオ信号のチャネルの数よりも大きく、
    周囲信号成分は、それぞれの周囲信号成分を励起する直接音源の位置または方向に従って前記周囲信号チャネル間で分配され、
    異なる位置に配置された異なる音源によって励起された異なる周囲信号成分は、前記周囲信号チャネル間で異なるように分配され、
    異なる周囲信号チャネルへの周囲信号成分の分配は、前記それぞれの周囲信号成分を励起する直接信号成分の異なる直接信号チャネルへの分配に対応し、
    前記周囲信号チャネル(112a~112c;254a~254c;352;
    Figure 0007083405000065
    )は、異なる方向に関連付けられ、
    直接信号チャネル(252a~252c;324;
    Figure 0007083405000066
    )は異なる方向に関連付けられ、
    前記周囲信号チャネル(254a~254c;352;
    Figure 0007083405000067
    )および前記直接信号チャネル(252a~252c;342;
    Figure 0007083405000068
    )は、+/-20°の許容誤差内で同じ方位角方向のセットに関連付けられ、あるいは、前記周囲信号チャネルは、+/-20°の許容誤差内で前記直接信号チャネルに関連する前記方位角方向のセットのサブセットに関連付けられ、
    それぞれの直接音成分の位置または方向に従って、直接信号成分が、直接信号チャネル間で分配され、
    前記それぞれの周囲信号成分を励起する直接音源の位置または方向に従って前記周囲信号チャネル間で周囲信号成分が分配され、
    直接信号成分(226;
    Figure 0007083405000069
    ;322)を直接信号チャネル(252a~252c;342;
    Figure 0007083405000070
    )に分配するために、および前記周囲信号の周囲信号成分(230;
    Figure 0007083405000071
    ;324)を周囲信号チャネル(112a~112c;254a~254c;352;
    Figure 0007083405000072
    )に分配するために、同じパンニング係数またはスペクトル重み(332;G )が使用される、
    方法。
  27. 入力オーディオ信号に基づいて周囲信号チャネルを提供するための方法であって、
    前記方法は、前記入力オーディオ信号内の音源の位置または方向に応じて、周囲信号成分が前記周囲信号チャネル間で分配されるように、前記周囲信号チャネルを取得するステップを含み、
    異なるオーディオコンテンツを含む取得された周囲信号チャネルの数は、前記入力オーディオ信号のチャネルの数よりも大きく、
    前記方法は、前記入力オーディオ信号に基づいて、直接音成分を含む直接信号を取得するステップを含み、
    前記方法は、前記入力オーディオ信号に基づいて周囲信号(130;230;324;
    Figure 0007083405000073
    )を抽出するステップを含み、
    前記方法は、前記入力オーディオ信号内の音源の位置または方向に応じて、前記周囲信号を複数の周囲信号チャネルに分配するステップを含み、
    周囲信号チャネルの数(Q)は、前記入力オーディオ信号のチャネル数(N)よりも大きく、
    前記周囲信号チャネル(112a~112c;254a~254c;352;
    Figure 0007083405000074
    )は、異なる方向に関連付けられ、
    直接信号チャネル(252a~252c;324;
    Figure 0007083405000075
    )は異なる方向に関連付けられ、
    前記周囲信号チャネル(254a~254c;352;
    Figure 0007083405000076
    )および前記直接信号チャネル(252a~252c;342;
    Figure 0007083405000077
    )は、じ方向のセットに関連付けられ、あるいは、前記周囲信号チャネルは、前記直接信号チャネルに関連する前記方向のセットのサブセットに関連付けられ、
    直接信号成分は、それぞれの直接音成分の位置または方向に従って直接信号チャネル間に分配され、
    前記周囲信号成分は、前記直接信号成分の分配に使用するのと同じパンニング係数またはスペクトル重みを使用して、前記それぞれの周囲信号成分を励起する直接音源の位置または方向に従って前記周囲信号チャネル間に分配される、
    方法。
  28. 入力オーディオ信号に基づいて周囲信号チャネルを提供するための方法であって、
    前記方法は、前記入力オーディオ信号内の音源の位置または方向に応じて、周囲信号成分が前記周囲信号チャネル間で分配されるように、前記周囲信号チャネルを取得するステップを含み、
    異なるオーディオコンテンツを含む取得された周囲信号チャネルの数は、前記入力オーディオ信号のチャネルの数よりも大きく、
    前記方法は、前記入力オーディオ信号に基づいて、直接音成分を含む直接信号を取得するステップを含み、
    前記方法は、前記入力オーディオ信号に基づいて周囲信号(130;230;324;
    Figure 0007083405000078
    )を抽出するステップを含み、
    前記周囲信号は、前記入力オーディオ信号内の音源の位置または方向に応じて、複数の周囲信号チャネルに分配され、
    周囲信号チャネルの数(Q)は、前記入力オーディオ信号のチャネル数(N)よりも大きく、
    前記直接信号は前記入力オーディオ信号に基づいて取得され、
    前記周囲信号(130;230;324;
    Figure 0007083405000079
    )を前記周囲信号チャネル(112a~112c;254a~254c;352;
    Figure 0007083405000080
    )に分配するために、パンニング係数またはスペクトル重み(332;G)が適用され、
    直接信号成分(226;
    Figure 0007083405000081
    ;322)を直接信号チャネル(252a~252c;342;
    Figure 0007083405000082
    )に分配するために、および前記周囲信号の周囲信号成分(230;
    Figure 0007083405000083
    ;324)を周囲信号チャネル(112a~112c;254a~254c;352;
    Figure 0007083405000084
    )に分配するために、同じパンニング係数またはスペクトル重み(332;G)のセットが適用される、方法。
  29. 請求項26から28のいずれか一項に記載の入力オーディオ信号に基づいて周囲信号チャネルを提供するための方法(500)であって、
    前記方法は、前記入力オーディオ信号に基づいて周囲信号を抽出するステップ(510)を含み、
    前記方法は、前記入力オーディオ信号内の音源の位置または方向に応じて、前記周囲信号を複数の周囲信号チャネルに分配するステップ(520)を含み、
    周囲信号チャネルの数は、前記入力オーディオ信号のチャネルの数よりも大きい、
    方法(500)。
  30. マルチチャネル入力オーディオ信号によって表現されるオーディオコンテンツをレンダリングするための方法(600)であって、
    力オーディオ信号に基づいて周囲信号チャネルを提供する請求項26から29のいずれか一項に記載の方法のステップ(610)であって、3つ以上の周囲信号チャネルが提供される、ステップと、
    3つ以上の直接信号チャネルを提供するステップ(620)と、
    前記周囲信号チャネルおよび前記直接信号チャネルを、一組の直接信号スピーカおよび一組の周囲信号スピーカを含むスピーカ配置に供給するステップ(630)と、を含み、
    前記直接信号チャネルの各々は、前記直接信号スピーカのうちの少なくとも1つに供給され、
    前記周囲信号チャネルの各々は、前記周囲信号スピーカのうちの少なくとも1つに供給される、
    方法(600)。
  31. コンピュータ上で実行された場合に、請求項26から30のいずれか一項に記載の方法を実行するためのコンピュータプログラム。
  32. マルチチャネル入力オーディオ信号(210、X)によって表現されるオーディオコンテンツをレンダリングするためのシステム(200)であって、
    入力オーディオ信号(110;160;210;310;x(t)、x(t)、X(m、k))に基づいて周囲信号チャネル(112a~112c;162a~162c;254a~254c;352;
    Figure 0007083405000085
    )を提供するためのオーディオ信号プロセッサ(100;150;250)であって、
    前記オーディオ信号プロセッサは、前記周囲信号チャネルを取得するように構成され、
    異なるオーディオコンテンツを含む取得された周囲信号チャネルの数(Q)は、前記入力オーディオ信号のチャネルの数(N)より大きく、
    前記オーディオ信号プロセッサは、前記入力オーディオ信号内の音源の位置または方向に応じて、周囲信号成分が前記周囲信号チャネル間で分配されるように、前記周囲信号チャネルを取得するように構成され、
    3つ以上の直接信号チャネル(252a~252c)および3つ以上の周囲信号チャネル(254a~254c)を提供するように構成されたオーディオ信号プロセッサと、
    一組の直接信号スピーカ(262a~262c)および一組の周囲信号スピーカ(264a~264c)を含むスピーカ配置(260)と、を含み、
    前記直接信号チャネルの各々は、前記直接信号スピーカのうちの少なくとも1つに関連付けられ、
    前記周囲信号チャネルの各々は、前記周囲信号スピーカのうちの少なくとも1つに関連付けられ、
    直接信号および周囲信号は異なるスピーカを使用してレンダリングされる、
    システム(200)。
  33. 請求項32に記載のシステムであって、
    直接信号スピーカと周囲信号スピーカとの間には関連がある、または
    前記直接信号スピーカのサブセットと前記周囲信号スピーカとの間には関連がある、
    請求項32に記載のシステム。
JP2020562845A 2018-01-29 2019-01-28 周囲信号を複数の周囲信号チャネルに分配するオーディオ信号プロセッサ、システムおよび方法 Active JP7083405B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP18153968.5 2018-01-29
EP18153968.5A EP3518562A1 (en) 2018-01-29 2018-01-29 Audio signal processor, system and methods distributing an ambient signal to a plurality of ambient signal channels
PCT/EP2019/052018 WO2019145545A1 (en) 2018-01-29 2019-01-28 Audio signal processor, system and methods distributing an ambient signal to a plurality of ambient signal channels

Publications (2)

Publication Number Publication Date
JP2021512570A JP2021512570A (ja) 2021-05-13
JP7083405B2 true JP7083405B2 (ja) 2022-06-10

Family

ID=61074439

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020562845A Active JP7083405B2 (ja) 2018-01-29 2019-01-28 周囲信号を複数の周囲信号チャネルに分配するオーディオ信号プロセッサ、システムおよび方法

Country Status (11)

Country Link
US (1) US11470438B2 (ja)
EP (3) EP3518562A1 (ja)
JP (1) JP7083405B2 (ja)
KR (1) KR102547423B1 (ja)
CN (1) CN111919455B (ja)
AU (1) AU2019213006B2 (ja)
BR (1) BR112020015360A2 (ja)
CA (1) CA3094815C (ja)
MX (1) MX2020007863A (ja)
RU (1) RU2768974C2 (ja)
WO (1) WO2019145545A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014513502A (ja) 2011-05-11 2014-05-29 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 分解器を使用する出力信号を生成するための装置および方法
JP2014523174A (ja) 2011-07-05 2014-09-08 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ スペクトル重みジェネレータを使用する周波数領域処理を用いてステレオ録音を分解するための方法および装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000152399A (ja) * 1998-11-12 2000-05-30 Yamaha Corp 音場効果制御装置
US8379868B2 (en) * 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
US8036767B2 (en) 2006-09-20 2011-10-11 Harman International Industries, Incorporated System for extracting and changing the reverberant content of an audio input signal
RU2439717C1 (ru) * 2008-01-01 2012-01-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ и устройство для обработки звукового сигнала
GB2457508B (en) * 2008-02-18 2010-06-09 Ltd Sony Computer Entertainmen System and method of audio adaptaton
CH703771A2 (de) * 2010-09-10 2012-03-15 Stormingswiss Gmbh Vorrichtung und Verfahren zur zeitlichen Auswertung und Optimierung von stereophonen oder pseudostereophonen Signalen.
US9031268B2 (en) * 2011-05-09 2015-05-12 Dts, Inc. Room characterization and correction for multi-channel audio
EP2733964A1 (en) * 2012-11-15 2014-05-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Segment-wise adjustment of spatial audio signal to different playback loudspeaker setup
SG11201507066PA (en) 2013-03-05 2015-10-29 Fraunhofer Ges Forschung Apparatus and method for multichannel direct-ambient decomposition for audio signal processing
FR3017484A1 (fr) 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
EP3048818B1 (en) * 2015-01-20 2018-10-10 Yamaha Corporation Audio signal processing apparatus
DE102015205042A1 (de) * 2015-03-19 2016-09-22 Continental Automotive Gmbh Verfahren zur Steuerung einer Audiosignalausgabe für ein Fahrzeug

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014513502A (ja) 2011-05-11 2014-05-29 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 分解器を使用する出力信号を生成するための装置および方法
JP2014523174A (ja) 2011-07-05 2014-09-08 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ スペクトル重みジェネレータを使用する周波数領域処理を用いてステレオ録音を分解するための方法および装置

Also Published As

Publication number Publication date
EP3518562A1 (en) 2019-07-31
EP4300999A3 (en) 2024-03-27
MX2020007863A (es) 2021-01-08
CN111919455B (zh) 2022-11-22
CN111919455A (zh) 2020-11-10
BR112020015360A2 (pt) 2020-12-08
RU2020128498A3 (ja) 2022-02-28
US20200359155A1 (en) 2020-11-12
RU2020128498A (ru) 2022-02-28
AU2019213006B2 (en) 2022-03-10
EP3747206B1 (en) 2023-12-27
AU2019213006A1 (en) 2020-09-24
JP2021512570A (ja) 2021-05-13
EP4300999A2 (en) 2024-01-03
WO2019145545A1 (en) 2019-08-01
KR20200128671A (ko) 2020-11-16
EP3747206C0 (en) 2023-12-27
RU2768974C2 (ru) 2022-03-28
KR102547423B1 (ko) 2023-06-23
US11470438B2 (en) 2022-10-11
CA3094815C (en) 2023-11-14
CA3094815A1 (en) 2019-08-01
EP3747206A1 (en) 2020-12-09

Similar Documents

Publication Publication Date Title
JP7183467B2 (ja) 少なくとも一つのフィードバック遅延ネットワークを使ったマルチチャネル・オーディオに応答したバイノーラル・オーディオの生成
US20190364379A1 (en) Methods and systems for designing and applying numerically optimized binaural room impulse responses
CN107770717B (zh) 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频
US8670850B2 (en) System for modifying an acoustic space with audio source content
Avendano et al. Ambience extraction and synthesis from stereo signals for multi-channel audio up-mix
JP6377249B2 (ja) オーディオ信号の強化のための装置と方法及び音響強化システム
JP2016048927A (ja) 少なくとも2つの出力チャネルを有する出力信号を生成するための装置および方法
EP2368375B1 (en) Converter and method for converting an audio signal
WO2014091375A1 (en) Reverberation processing in an audio signal
JP7083405B2 (ja) 周囲信号を複数の周囲信号チャネルに分配するオーディオ信号プロセッサ、システムおよび方法
JP2013055439A (ja) 音声信号変換装置、方法、プログラム、及び記録媒体
Pfanzagl-Cardone The Art and Science of 3D Audio Recording
JP2011239036A (ja) 音声信号変換装置、方法、プログラム、及び記録媒体
JP2023548570A (ja) オーディオシステムの高さチャネルアップミキシング

Legal Events

Date Code Title Description
A529 Written submission of copy of amendment under article 34 pct

Free format text: JAPANESE INTERMEDIATE CODE: A529

Effective date: 20200923

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200923

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210927

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211014

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20211217

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20220310

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220414

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220502

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220531

R150 Certificate of patent or registration of utility model

Ref document number: 7083405

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150