JP5746621B2 - バイノーラル信号のための信号生成 - Google Patents

バイノーラル信号のための信号生成 Download PDF

Info

Publication number
JP5746621B2
JP5746621B2 JP2011520384A JP2011520384A JP5746621B2 JP 5746621 B2 JP5746621 B2 JP 5746621B2 JP 2011520384 A JP2011520384 A JP 2011520384A JP 2011520384 A JP2011520384 A JP 2011520384A JP 5746621 B2 JP5746621 B2 JP 5746621B2
Authority
JP
Japan
Prior art keywords
channel
channels
signal
downmix
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011520384A
Other languages
English (en)
Other versions
JP2011529650A (ja
Inventor
ハラルト ムント
ハラルト ムント
ベルンハルト ノイゲバウア
ベルンハルト ノイゲバウア
ジョーハン ヒルペアト
ジョーハン ヒルペアト
アンドレーアス ズィルズル
アンドレーアス ズィルズル
ヤン プログスティース
ヤン プログスティース
Original Assignee
フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ, フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ filed Critical フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Publication of JP2011529650A publication Critical patent/JP2011529650A/ja
Application granted granted Critical
Publication of JP5746621B2 publication Critical patent/JP5746621B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S3/004For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)

Description

本発明は、バイノーラル信号の室内反射および/または残響に関連した寄与の生成、バイノーラル信号自体の生成および相互類似性を低減している頭部伝達関数の組を形成することに関する。
人間の聴覚系は、知覚された音が来る方向を判別することが可能である。この目的のために、人間の聴覚系は、右の耳で受け取られた音と左の耳で受け取られた音の特定の違いを評価する。後者の情報は、例えば、次々に両耳間における音響信号の違いを参照しうる、いわゆる両耳による手がかり(inter−aural cues)を含む。両耳による手がかり(inter−aural cues)は、定位に最も重要な手段である。両耳間の圧力レベルの違い、すなわち、両耳間レベル差(ILD:inter−aural level difference)は、定位のために最も重要な一つの手がかりである。音が、ゼロでない方位角を有する水平面から到着するときに、それは各耳において異なるレベルを有する。陰になっていない耳と比較して、陰になっている耳は、自然に抑制された音像を有する。定位を取扱っている他の非常に重要な性質は、両耳間時間差(ITD:inter−aural time difference)である。陰になっている耳は、音源までより長い距離を有しており、このように、陰になっていない耳より後に、音波の前部を得る。ITDの意味は、陰になっていない耳と比較して、陰になっている耳に着くときに、それほど減衰しない低周波において重要視される。音の波長が両耳間の距離により近くなるので、ITDはより高い周波数ではあまり重要でない。それ故、換言すれば、定位は、音が音源から、それぞれ、左右の耳まで進行している聴取者の頭部、耳および肩に関する異なる相互作用に依存するという事実を利用する。
人がヘッドホンを介してラウドスピーカ・セットアップによって再生されることを目的とするステレオ信号を聞くときに問題は起こる。聴取者は、音源が頭の中に置かれていると感じるように、その音を不自然で落ち着かなく心をかき乱すようなものとしてみなす傾向がある。この現象は、「頭内」定位(“in−the−head” localization)として文献においてしばしば参照される。長期の「頭内」(“in−the−head”)音は、聞き疲れにつながりうる。それは、音源を位置決めするときに人間の聴覚系が頼る情報、すなわち、両耳による手がかり(inter−aural cues)が見つからない、または、不明瞭であるために起こる。
ステレオ信号またはヘッドホン再生のための2本以上のチャンネルを有するマルチチャンネル信号を再生するために、方向フィルタは、これらの相互作用をモデル化するために使用されうる。例えば、復号されたマルチチャンネル信号からのヘッドホン出力の生成は、1対の方向フィルタによって復号した後に、各信号をフィルタリングすることを含みうる。これらのフィルタは、一般的に一室の仮想音源から聴取者の耳道への音響伝達、いわゆる両耳室内伝達関数(BRTF:binaural room transfer function)をモデル化する。BRTFは、時間、レベル、そしてスペクトルの修正を実行し、室内反射および残響をモデル化する。方向フィルタは、時間または周波数領域において実行されうる。
しかし、多くのフィルタが必要とされる、すなわち、Nが復号されたチャンネル数であるN×2のフィルタが必要であるので、これらの方向フィルタは44.1kHzで20000フィルタタップのようにかなり長く、そして、フィルタリングの方法は計算的に要求が多い。従って、方向フィルタは、時に最低限まで減らされる。いわゆる頭部伝達関数(HRTF)は、両耳による手がかりを含んでいる方向情報を含む。共通の処理ブロックは、室内反射および残響をモデル化するのに使用される。ルームプロセッシングモジュールは、時間または周波数領域における残響アルゴリズムであることが可能であり、マルチチャンネル入力信号のチャンネルの合計によってマルチチャンネル入力信号から得られる1または2のチャンネル入力信号に作用しうる。この種の構造は、例えば、国際公開第99/14983号において説明される。このように、ルームプロセッシングブロックは、室内反射および/または残響を実行する。特に距離および外在化に関して、室内反射および残響は音の位置を定めるのに重要である。外在化は、音が聴取者の頭部の外に知覚されることを意味する。上述した文書は、また、音源から各耳への直接の経路および識別可能な反射をモデル化するために、方向フィルタを、それぞれのチャンネルを異なって遅延したものに作用している一組のFIRフィルタとして実行することも示唆する。さらに、1対のヘッドホンにおけるより良いリスニング体験を供給するためのいくつかの手段を説明する際、この文書は、また、リア左とリア右チャンネルの和や差に対して、センターチャンネルとフロント左チャンネルの混合およびセンターチャンネルとフロント右チャンネルの混合をそれぞれ遅延させることも示唆する。
しかし、こうして得られたリスニング結果は、いまだにバイノーラル出力信号の低減された空間幅と外在化の欠如があった。更に、ヘッドホン再生のためマルチチャンネル信号を与えるための上述した手段にもかかわらず、映画の会話および音楽における声の部分がしばしば不自然に反響しスペクトル的に不均一に知覚されることが分かった。
国際公開第99/14983号
このように、バイノーラル信号生成の方式を供給し、より安定して好感の持てるヘッドホン再生をもたらすことが本発明の目的である。
この目的は、請求項1、3、4、13、22、24および26のいずれかに記載の装置、そして、請求項9、10、11、21、23、25および27のいずれかに記載の方法によって達成される。
本発明のアプリケーションの基礎をなしている第1の考えは、ヘッドホン再生のためのより安定して好感の持てるバイノーラル信号が、複数の入力チャンネルのうちの左と右のチャンネル、複数の入力チャンネルのうちのフロントとリアのチャンネル、複数の入力チャンネルのうちのセンターチャンネルと非センターチャンネル(non−center channel)のうちの少なくとも1つを異なって処理し、それによりその間の類似性を低減し、それにより相互類似性を低減されたチャンネルの組を得ることによって得られうるというものである。この相互類似性を低減されたチャンネルの組は、それから、それぞれ左耳や右耳のための各ミキサーが後に続く複数の方向フィルタに送られる。マルチチャンネル入力信号のチャンネルの相互類似性を低減することによって、バイノーラル出力信号の空間幅は増加されうるし、そして、外在化は改善されうる。
本発明のアプリケーションの基礎をなしている別の考えは、ヘッドホン再生のためのより安定して好感の持てるバイノーラル信号が、スペクトル的に変化させる意味で、位相および/または振幅の修正を複数チャンネルのうち少なくとも2つのチャンネル間で異なって実行し、それにより、左耳と右耳のための各ミキサーが後に続く複数の方向フィルタに次々にそれぞれ送られうる、相互類似性を低減されたチャンネルの組を得ることによって得られうるというものである。さらにまた、マルチチャンネル入力信号のチャンネルの相互類似性を低減することによって、バイノーラル出力信号の空間幅は増加されうるし、そして、外在化は改善されうる。
上述した利点は、また、元の複数の頭部伝達関数のインパルス応答を互いに比較して遅らせることにより、または、スペクトル的に変化させる意味で、元の複数の頭部伝達関数の位相および/または振幅応答を互いに比較して異なって生じさせることにより、相互類似性を低減している頭部伝達関数の組を形成するときにも得られる。その形成は、例えば使用される仮想音源の位置の指標に応答するような方向フィルタとして頭部伝達関数を使用することにより、設計段階時はオフラインで、または、バイノーラル信号生成の間はオンラインでなされうる。
本発明のアプリケーションの基礎をなしている他の考えは、バイノーラル信号の室内反射/残響に関連した寄与を生成するためのルームプロセッサにかけられるマルチチャンネル信号のチャンネルのモノラルまたはステレオのダウンミックスが、複数のチャンネルがマルチチャンネル信号のうちの少なくとも2つのチャンネルの間で異なるレベルでモノラル又はステレオのダウンミックスに寄与するように形成されるとき、映画や音楽のいくつかの部分が、結果としてより自然に知覚されたヘッドホン再生となるというものである。例えば、本発明者は、映画の会話および音楽の音声が一般的にマルチチャンネル信号のセンターチャンネルに主に混合されること、そして、センターチャンネル信号が、ルームプロセッシングモジュールに供給されるときに、結果としてしばしば不自然に反響しスペクトル的に不均一に知覚された出力になると気づいた。しかし、本発明者は、これらの欠陥は、センターチャンネルを例えば3〜12dB、特に6dBの現弱によるレベル低減を有するルームプロセッシングモジュールに送ることにより打開されうることを発見した。
以下において、好ましい実施形態が図に関してより詳細に説明される。
図1は、一実施形態によるバイノーラル信号を生成するための装置のブロック図を示す。 図2は、別の実施形態による相互類似性を低減している頭部伝達関数の組を形成するための装置のブロック図を示す。 図3は、別の実施形態によるバイノーラル信号の室内反射および/または残響に関連した寄与を生成するための装置を示す。 図4aと図4bは、別の実施形態による図3のルームプロセッサのブロック図を示す。 図5は、一実施形態による図3のダウンミックスジェネレータのブロック図を示す。 図6は、一実施形態による空間オーディオ符号化を使用してマルチチャンネル信号の表現を図示している回路図を示す。 図7は、一実施形態によるバイノーラル出力信号ジェネレータを示す。 図8は、別の実施形態によるバイノーラル出力信号ジェネレータのブロック図を示す。 図9は、さらに別の実施形態によるバイノーラル出力信号ジェネレータのブロック図を示す。 図10は、別の実施形態によるバイノーラル出力信号ジェネレータのブロック図を示す。 図11は、別の実施形態によるバイノーラル出力信号ジェネレータのブロック図を示す。 図12は、一実施形態による図11のバイノーラル空間オーディオ復号器のブロック図を示す。 図13は、一実施形態による図11の修正された空間オーディオ復号器のブロック図を示す。
図1は、例えば、複数のチャンネルを示しているマルチチャンネル信号に基づいてヘッドホン再生することを目的とし、そして、各チャンネルに関連した仮想音源の位置を有するスピーカ構成によって再生することを目的とするバイノーラル信号を生成するための装置を示す。概して、引用符号10によって示されるその装置は、類似性低減装置12、複数の方向フィルタ14(14a〜14h)、第1のミキサー16aおよび第2のミキサー16bを含む。
類似性低減装置12は、複数のチャンネル18a〜18dを示しているマルチチャンネル信号18を相互類似性を低減されたチャンネルの組20(20a〜20d)に変えるように構成される。マルチチャンネル信号18によって示されるチャンネル18a〜18dの数は、2以上でありうる。説明の目的だけのために、4チャンネル18a〜18dは、図1に明示的に示された。複数のチャンネル18は、例えば、センターチャンネル、フロント左チャンネル、フロント右チャンネル、リア左チャンネルおよびリア右チャンネルを含みうる。各チャンネル18a〜18dに関連した既に定めた仮想音源位置に配置されるスピーカを有するスピーカ・セットアップ(図1には示されていない)によってチャンネル18a〜18dが再生されるということを仮定し、または、意図して、チャンネル18a〜18dは、例えば個々の楽器、歌声、または他の個々の音源を示している複数の個々のオーディオ信号からサウンドデザイナーによって混合されている。
図1の実施形態によれば、複数のチャンネル18a〜18dは、少なくとも、1対の左および右チャンネル、1対のフロントおよびリアチャンネル、または、1対のセンターおよび非センターチャンネル(non−center channel)を含む。もちろん、2以上のちょうど言及された対は、複数のチャンネル18(18a〜18d)内に存在しうる。類似性低減装置12は、相互類似性を低減されたチャンネル20a〜20dの組20を得るために、異なって処理し、そしてそれにより複数のチャンネルの中のチャンネル間に類似性を低減するように構成される。第1の態様によれば、複数のチャンネル18のうち左および右チャンネル、複数チャンネルの18のうちフロントおよびリアチャンネル、複数のチャンネル18のうちセンターおよび非センターチャンネルのうちの少なくとも1つで類似性は、相互類似性を低減されたチャンネル20a〜20dの組20を得るために、類似性低減装置12によって低減されうる。第2の態様によれば、類似性低減装置(12)は、加えて、または、代わりに、スペクトル的に変化させる意味で、相互類似性を低減されたチャンネルの組20を得るために、複数のチャンネルのうち少なくとも2つのチャンネルの間で異なって位相および/または振幅の修正を実行しうる。
以下でより詳細に概説されるように、類似性低減装置12は、例えば、各対が互いに比較して遅延させることによって、または、例えば複数の周波数帯域の各々において異なる量の遅延をチャンネルの各対に受けさせ、それにより相互類似性を低減されたチャンネルの組20を得ることによって、異なる処理を成し遂げうる。もちろん、チャンネル間の相関を減少させる他の可能性がある。換言すれば、相関低減装置12は、各チャンネルのスペクトルエネルギー分布が同じ状態のままである伝達関数、すなわち、関連するオーディオスペクトル範囲の1つの振幅と同じ伝達関数を有しうる。しかし、ここで類似性低減装置12はサブバンドまたはその周波数成分の位相を異なって修正する。例えば、相関低減装置12は、ある周波数帯域のための第1のチャンネルの信号が、少なくとも1つのサンプル分、そのチャンネルのうちの別の1つと比較して遅れるように、チャンネル18の全ての、または1つまたはいくつかにおける位相修正を同上が引き起こすように、構成されうる。更に、相関低減装置12は、第1のチャンネルの群遅延が複数の周波数帯域のためのチャンネルのうちの別の1つと比較して1サンプルの少なくとも8分の1の標準偏差を示すように、同上が位相修正を引き起こすように、構成されうる。考慮される周波数帯域は、バーク(Bark)帯域またはそのサブセットまたは他の周波数帯域の再分割でありうる。
相関を低減することは、人間の聴覚系の頭内(in―the―head)定位を防ぐ唯一の方法ではない。むしろ、相関は、その使用によって人間の聴覚系が両耳に到着する音の類似性と、こうして音の内側への向きを判断するいくつかのありうる手段のうちの1つである。したがって、類似性低減装置12は、また、例えば、複数の周波数帯域の各々において異なる量のレベル低減をチャンネルの各対に受けさせ、それによりスペクトル的に形成された方法で相互類似性を低減されたチャンネルの組20を得ることによって、異なる処理を成し遂げうる。スペクトル形成は、例えば、耳たぶによって陰になるため、例えばフロントチャンネルの音に対するリアチャンネルの音のために生じている相対的なスペクトルで形成された低減を大きく見せる。したがって、類似性低減装置12は、リアチャンネルに他のチャンネルに対するスペクトル的に変化させているレベル低減を受けさせる。このスペクトル形成において、類似性低減装置12は、位相応答を関連するオーディオスペクトル範囲にわたって一定にさせうる。しかし、ここで類似性低減装置12は、サブバンドまたはその周波数成分の振幅を異なって修正する。
マルチチャンネル信号18が複数のチャンネル18a〜18dを示す方法は、原則として、いかなる特定の表現にも制限されない。例えば、マルチチャンネル信号18は、空間オーディオ符号化を使用する、圧縮方法で複数のチャンネル18a〜18dを示すことができる。空間オーディオ符号化によって、複数のチャンネル18a〜18dは、それにより個々のチャンネル18a〜18dがダウンミックスチャンネルに混合されている混合比を明示しているダウンミックス情報を伴った、チャンネルが混合されたことによりいたったダウンミックス信号と、例えば個々のチャンネル18a〜18d間のレベル/強度差、位相差、時間差および/または、相関/干渉性の計測によってマルチチャンネル信号の空間イメージを表している空間パラメータによって示されうる。相関低減装置12の出力は、個々のチャンネル20a〜20dに分割される。後者のチャンネルは、例えば、時間信号として、または、例えばスペクトル的にサブバンドに分解されるようなスペクトログラムとして出力されうる。
方向フィルタ14a〜14hは、各チャンネルと関連した仮想音源の位置から聴取者の各耳道までのチャンネル20a〜20dのそれぞれの音響伝達をモデル化するように構成される。図1において、方向フィルタ14a〜14dは、例えば、左の耳道への音響伝達をモデル化し、一方で、方向フィルタ14e〜14hは、右の耳道への音響伝達をモデル化する。方向フィルタは、室内の仮想音源の位置から聴取者の耳道への音響伝達をモデル化しうるし、時間、レベルおよびスペクトルの修正を実行することによって、このモデリングを実行しうるし、そして、選択的に室内反射および残響を実行しうる。方向フィルタ18a〜18hは、時間または周波数領域において実行されうる。すなわち、方向フィルタは、FIRフィルタのような時間領域フィルタでありうるし、または、チャンネル20a〜20dの各スペクトル値を有する各伝達関数のサンプル値を掛けることにより周波数領域に作用しうる。特に、方向フィルタ14a〜14hは、例えば、人間の頭部、耳、肩での相互作用を含む、各仮想音源の位置から各耳道までの、各チャンネル信号20a〜20dの相互作用を表している各頭部伝達関数をモデル化するように選択されうる。第1のミキサー16aは、バイノーラル出力信号の左チャンネルに寄与する、または、バイノーラル出力信号の左チャンネルでさえあることを目的とした信号22aを得るために聴取者の左の耳道への音響伝達をモデル化する方向フィルタ14a〜14dの出力を混合するように構成される。その一方で、第2のミキサー16bは、信号22bを得るために聴取者の右の耳道への音響伝達をモデル化する方向フィルタ14e〜14hの出力を混合するように構成され、そしてそれは、バイノーラル出力信号の右チャンネルに寄与する、あるいはバイノーラル出力信号の右チャンネルでさえあることを目的とされる。
各実施形態に関して以下で詳しく述べるように、室内反射および/または残響を考慮するために、別の寄与は、信号22aおよび22bに追加されうる。この手段によって、方向フィルタ14a〜14hの煩雑性は、低減されうる。
図1の装置において、類似性低減装置12は、それぞれ、ミキサー16aおよび16bに入力される相互関係のある信号の総和のマイナスの副作用、それによりバイノーラル出力信号22aおよび22bの低減された空間幅および外在化の欠如が結果として生じるものだが、その副作用を無効にする。類似性低減装置12によって得られるその非相関性(decorrelation)は、これらのマイナスの副作用を低減する。
次の実施形態に移る前に、図1は、換言すれば、例えば、復号マルチチャンネル信号からのヘッドホン出力の生成のための信号の流れを示す。各信号は、1対の方向フィルタによってフィルタにかけられる。例えば、チャンネル18aは、方向フィルタ14a〜14eの1対によってフィルタにかけられる。残念なことに、相関のようなかなり多くの類似性が、典型的なマルチチャンネル音生成のチャンネル18a〜18dの間に存在する。このことはバイノーラル出力信号にマイナスの影響を及ぼすだろう。すなわち、方向フィルタ14a〜14hによってマルチチャンネル信号を処理した後、方向フィルタ14a〜14hによって出力される中間信号は、ヘッドホン出力信号20aおよび20bを形成するために、ミキサー16aおよび16bで加算される。類似/相関している出力信号の総和は、結果として出力信号20aおよび20bの極めて低減された空間幅をもたらし、そして外在化の欠如をもたらす。これは、特に左右の信号およびセンターチャンネルの類似/相関に関して問題を含む。したがって、類似性低減装置12は、これらの信号間の類似性をできるだけ離れるように低減することである。
複数のチャンネル18(18a〜18d)のチャンネル間での類似性を低減するために類似性低減装置12によって実行されるほとんどの方法が、音響伝達の上述のモデリングを実行するためだけでなく、ちょうど述べた非相関性のような非類似性を得るために、方向フィルタを同時に変更することに関する類似性低減装置12を取り除くことによっても達成できることは留意する必要がある。したがって、方向フィルタは、例えばHRTFでなく、修正された頭部伝達関数をモデル化するだろう。
図2は、例えば、各チャンネルに関連した仮想音源の位置から聴取者の耳道への一組のチャンネルの音響伝達をモデル化するための相互類似性を低減している頭部伝達関数の組を形成するための装置を示す。概して30により示される装置は、HRTFプロセッサ34だけでなく、HRTFプロバイダ32を含む。
HRTFプロバイダ32は、元の複数のHRTFを供給するように構成される。ステップ32は、ある音の位置から標準のダミーリスナの耳道までの頭部伝達関数を測定するために、標準のダミーヘッドを使用している測定を含みうる。同様に、HRTFプロバイダ32は、メモリから元のHRTFを単に検索する、または、読み込むように構成されうる。さらに他には、例えば、興味がある仮想音源の位置に応じて、HRTFプロバイダ32は、所定の公式に従ってHRTFを割り出すように構成されうる。したがって、HRTFプロバイダ32は、バイノーラル出力信号ジェネレータを設計するための設計環境において作動するように構成されうるし、または、例えば仮想音源の位置の選択または変更に応答するようにオンラインで元のHRTFを供給するために、この種のバイノーラル出力信号ジェネレータの信号自体の一部でありうる。例えば、装置30は、それらのチャンネルに関連した異なる仮想音源の位置を有する異なるスピーカ構成を目的としているマルチチャンネル信号に適応できるバイノーラル出力信号ジェネレータの一部でもありうる。この場合、HRTFプロバイダ32は、現在意図された仮想音源の位置に適合される方法で元のHRTFを供給するように構成されうる。
HRTFプロセッサ34は、次に、少なくとも1対のHRTFのインパルス応答に互いに比較して位置を変えさせるように、または、スペクトル的に変化させる意味で、互いに比較して異なってその位相および/または振幅応答を修正するように、構成される。HRTFの1対は、左および右のチャンネル、フロントおよびリアチャンネル、センターおよび非センターチャンネルのうちの1つの音響伝達をモデル化しうる。実質的に、このことは、マルチチャンネル信号の1つまたはいくつかのチャンネルに適用される以下の技術の1つまたは組み合わせにより達成されうる。すなわち、各チャンネルのHRTFを遅らせ、各HRTFの位相応答を修正し、および/または各HRTFへの全域通過フィルタなどの非相関性フィルタを適用し、それにより、HRTFの相互類似性を低減させた組を得る、および/または、スペクトル的に修正する意味で、各HRTFの振幅応答を修正し、それにより少なくとも相互類似性を低減されたHRTFの組を得る。いずれにせよ、結果として生じる各チャンネル間の非相関性/非類似性は、外部に音源を定位する際に人間の聴覚系をサポートし、それにより頭内(in―the―head)定位が起こるのを防止しうる。例えば、HRTFプロセッサ34は、特定の周波数帯域のための第1のHRTFの群遅延が、少なくとも1つのサンプル分、そのHRTFの他の1つと比較して生じる、または第1のHRTFの特定の周波数帯域が遅れるように、チャンネルHRTFの全てまたは1つまたはいくつかの位相応答の修正を同上が生じさせるように構成できた。更に、HRTFプロセッサ34は、複数の周波数帯域のためのHRTFの他のものに対する第1のHRTFの群遅延が1サンプルの少なくとも8分の1の標準偏差を示すように、位相応答の修正を同上が生じさせるように、構成できた。考慮される周波数帯域は、バーク(Bark)帯域またはそのサブセットまたは他の周波数帯域の再分割でありうる。
HRTFプロセッサ34から結果として生じた相互類似性を低減しているHRTFの組は、図1の装置の方向フィルタ14a〜14hのHRTFを設定するために使用されうる。そこにおいて、類似性低減装置12はある場合もあれば、ない場合もありうる。修正されたHRTFの非類似性という性質のため、バイノーラル出力信号の空間幅および改善された外在化に関する上述の利点は、類似性低減装置12がないときでも、同じように得られる。
すでに上述したように、図1の装置は、入力チャンネル18a〜18dの少なくともいくつかのダウンミックスに基づくバイノーラル出力信号の室内反射および/または残響に関連した寄与を得るように構成された更なる経路によって付随されうる。これは、方向フィルタ14a〜14h上にもたらされた煩雑性を緩和する。この種のバイノーラル出力信号の室内反射および/または残響に関連した寄与を生成するための装置は、図3において示される。装置40は、ルームプロセッサ44がダウンミックスジェネレータ42の後に続くことで互いに直列に接続されたダウンミックスジェネレータ42とルームプロセッサ44とを含む。装置40は、マルチチャンネル信号18が入力される図1の装置の入力と、ルームプロセッサ44の左チャンネルの寄与46aが出力22aに追加され、ルームプロセッサ44の右チャンネル出力46bが出力22bに追加されるバイノーラル出力信号の出力との間に接続されうる。ダウンミックスジェネレータ42は、マルチチャンネル信号18のチャンネルからモノラルまたはステレオのダウンミックス48を形成し、そして、プロセッサ44は、モノラルまたはステレオの信号48に基づいて室内反射および/または残響をモデル化することによって、バイノーラル信号の室内反射および/または残響に関連した寄与の左チャンネル46aおよびの右チャンネル46bを生成するように構成される。
ルームプロセッサ44の基礎をなしている考えは、例えば一室で生じる室内反射/残響が、マルチチャンネル信号18のチャンネルの単純な加算のようなダウンミックスに基づいた、聴取者にとってトランスペアレントな方法でモデル化されうる。室内反射/残響は、音源から耳道までの直接経路または見通し線に沿って伝わる音よりも後に生じるので、ルームプロセッサのインパルス応答は、図1に示される方向フィルタのインパルス応答の末端を表し、そして置換する。方向フィルタのインパルス応答は、同様に、直接経路や聴取者の頭部、耳、肩で生じる反射や減弱をモデル化するのに限定されうる。このことにより、方向フィルタのインパルス応答を短くすることを可能にする。もちろん、方向フィルタによりモデル化されたものとルームプロセッサ44によりモデル化されたものの間の境界は、その方向フィルタが、例えば、第1の室内反射/残響をモデル化もしうるように自由に変化しうる。
図4aおよび図4bは、ルームプロセッサの内部構造のための可能性のある実施例を示す。図4aによれば、ルームプロセッサ44は、モノラルのダウンミックス信号48によって供給されて、そして2つの残響フィルタ50aおよび50bを含む。その方向フィルタに類似して、残響フィルタ50aおよび50bは、時間領域または周波数領域において作動するように実行されうる。両方の入力は、モノラルのダウンミックス信号48を受ける。残響フィルタ50aの出力は、左チャンネル寄与出力46aを供給し、一方で、残響フィルタ50bは右チャンネル寄与信号46bを出力する。図4bは、ルームプロセッサ44がステレオのダウンミックス信号48を供給されている場合におけるルームプロセッサ44の内部構造の例を示す。この場合、ルームプロセッサは、4つの残響フィルタ50a〜50dを含む。残響フィルタ50aおよび50bの入力は、ステレオのダウンミックス48の第1のチャンネル48aと接続され、一方で、残響フィルタ50cおよび50dの入力は、ステレオのダウンミックス48のもう一方のチャンネル48bと接続される。残響フィルタ50aおよび50cの出力は、アダー(adder)52aの入力と接続され、そして、それの出力は左チャンネル寄与46aを供給する。残響フィルタ50bおよび50dの出力は、別のアダー52bの入力と接続され、そして、それの出力は右チャンネル寄与46bを供給する。
ダウンミックスジェネレータ42が、マルチチャンネル信号のチャンネルを、各チャンネルを均等に重み付けして、単純に加算しうることが説明されたが、これは必ずしも図3の実施形態に関する場合というわけではない。むしろ、図3のダウンミックスジェネレータ42は、モノラルまたはステレオのダウンミックス48を形成するよう構成され、その結果、複数のチャンネルは、マルチチャンネル信号18の少なくとも2つのチャンネルの間で異なっているレベルでモノラルまたはステレオのダウンミックスに寄与する。この手段により、特定のチャンネルまたはマルチチャンネル信号に混合される音声またはバックグラウンドミュージックのようなマルチチャンネル信号の特定のコンテンツは、ルームプロセッシングの影響を受けることを妨げられうる、または促されうる。そして、それによって、不自然な音を回避する。
例えば、マルチチャンネル信号18の複数のチャンネルのセンターチャンネルがマルチチャンネル信号18の他のチャンネルと比較してレベルを低減した方法でモノラルまたはステレオのダウンミックス信号48に寄与するように、図3のダウンミックスジェネレータ42は、モノラルまたはステレオのダウンミックス48を形成するように構成されうる。例えば、レベルの低減量は、3dBと12dBの間でありうる。レベルの低減は、均一にマルチチャンネル信号18のチャンネルの有効なスペクトル範囲にわたって広がっていることもあり、または、声の信号により一般的に占有されるスペクトル部分のような特定のスペクトル部分に集中するなどの周波数依存であることもある。他のチャンネルに対するレベル低減量は、他の全てのチャンネルで同じでありうる。すなわち、他のチャンネルは、同じレベルでダウンミックス信号48に混合されうる。あるいは、他のチャンネルは、不均一なレベルでダウンミックス信号48に混合されうる。それから、その他のチャンネルに対するレベル低減量は、その他のチャンネルの平均値またはその低減された1つを含むすべてのチャンネルの平均値と比較されうる。その場合は、その他のチャンネルのミキシングウェイトの標準偏差またはすべてのチャンネルのミキシングウェイトの標準偏差は、ちょうど言及した平均値と比較してレベルを減じたチャンネルのミキシングウェイトのレベル低減の66%より小さいこともありうる。
センターチャンネルに関するレベル低減の効果は、寄与56aおよび56bを経て得られたバイノーラル出力信号が 、(少なくともより詳細に下で述べられるいくつかの状況では)、レベル低減なしのものよりもより自然に聴取者に知覚される。換言すれば、その他のチャンネルの加重値と比較してセンターチャンネルに関連する加重値が減じられた状態で、ダウンミックスジェネレータ42は、マルチチャンネル信号18のチャンネルの加重和を形成する。
センターチャンネルのレベル低減は、特に映画の会話または音楽の音声部分で有利である。これらの音声部分で得られたオーディオの印象の改良は、非音声位相のレベル低減による軽微なペナルティを過分に補償する。しかし、別の実施例によれば、レベル低減は一定でない。むしろ、ダウンミックスジェネレータ42は、レベル低減のスイッチを切ったモードとレベル低減のスイッチを入れたモードとの間で切り替わるように構成されうる。換言すれば、ダウンミックスジェネレータ42は、時間変化する方法でレベル低減量を変化させるように構成されうる。その変化は、ゼロおよび最大値との間で、バイナリまたは類似した種類のものでありうる。ダウンミックスジェネレータ42は、モードスイッチングまたはマルチチャンネル信号18内に含まれる情報に依存しているレベル低減量の変化を実行するように構成されうる。例えば、ダウンミックスジェネレータ42は、音声位相を検出する、または、これらの音声位相と非音声位相を区別するように構成されうるし、あるいは、センターチャンネルの連続したフレームに、少なくとも順序尺度である音声内容を測定する音声内容計測を割り当てうる。例えば、ダウンミックスジェネレータ42は、音声フィルタによってセンターチャンネルの音声の存在を検出し、そして、このフィルタの出力レベルが合計閾値を上回るかどうかに関して判断する。しかし、ダウンミックスジェネレータ42によるセンターチャンネルの音声位相の検出は、レベル低減量変化の前述のモードスイッチングを時間依存させるようにする唯一の方法ではない。例えば、マルチチャンネル信号18は、特に音声位相と非音声位相との間で区別する、または、量的に音声内容を測定することを目的とする、それに関連した補助情報を有しうる。この場合、ダウンミックスジェネレータ42は、この補助情報に応答し作動する。他の可能性は、ジェネレータ42が、例えばセンターチャンネル、左チャンネル、右チャンネルの現在のレベルの間での比較に依存して、前述のモードスイッチングまたはレベル低減量の変化を実行することだろう。センターチャンネルが、左右のチャンネルよりも、個々に、または、その総計と比較して、特定の閾値比以上の差で大きい場合に、ダウンミックスジェネレータ42は、音声位相が現在存在するとみなし、それにしたがって、すなわち、レベル低減を実行することによって動作しうる。同様に、ダウンミックスジェネレータ42は、上述した依存性を実現するために、センター、左および右のチャンネル間のレベル差を使用しうる。
この他に、ダウンミックスジェネレータ42は、マルチチャンネル信号18のマルチプルチャンネルの空間イメージを説明するために使用される空間パラメータに応答しうる。これを図5に示す。図5は、特別なオーディオ符号化を用いることにより、すなわち、複数のチャンネルがダウンミックスされたダウンミックス信号62および複数のチャンネルの空間イメージを表している空間パラメータ64を用いることにより、マルチチャンネル信号18が複数のチャンネルを示す場合のダウンミックスジェネレータ42の一例を示す。選択的に、マルチチャンネル信号18は、個々のチャンネルがダウンミックス信号62に混合される比を表しているダウンミキシング情報、または、ダウンミックス信号62のダウンミックスチャンネルを含みうる。そのダウンミックスチャンネル62は、例えば、通常のダウンミックス信号62またはステレオのダウンミックス信号62でありうる。図5のダウンミックスジェネレータ42は、復号器64とミキサー66とを含む。復号器64は、空間オーディオ復号化に従って、特に、センターチャンネル66、そして他のチャンネル68を含んでいる複数のチャンネルを得るために、マルチチャンネル信号18を復号する。ミキサー66は、前述のレベル低減を実行することによって、モノラルまたはステレオの信号48を引き出すためにセンターチャンネル66およびその他の非センターチャンネル68を混合するように構成される。破線70によって示されるように、ミキサー66は、上述したように、変化させられたレベル低減の量に関するレベル低減モードとレベル低減なしのモードとの間で切り替わるために空間パラメータ64を使用するように構成されうる。ミキサー66により用いられた空間パラメータ64は、例えば、センターチャンネル66、左チャンネルまたは右チャンネルがダウンミックス信号62からどのように導き出されうるかを表しているチャンネル予測係数でありうる。そこにおいて、ミキサー66は加えて、それぞれ、フロント左およびリア左チャンネルおよびフロント右およびリア右チャンネルのダウンミックスでありうるちょうど言及された左右のチャンネルとの間で可干渉性または相互相関を示している相互チャンネル可干渉性/相互相関パラメータを使用しうる。例えば、センターチャンネルは、前述のステレオダウンミックス信号62の左チャンネルおよび右チャンネルに固定した比率で混合されうる。この場合、2チャンネル予測係数は、センター、左および右チャンネルがどのようにステレオダウンミックス信号62の2つのチャンネルの各線形結合から導き出されうるか決めるために充分である。例えば、ミキサー66は、音声位相および非音声位相を区別するために、チャンネル予測係数の和と差との間の比率を使用しうる。
センターチャンネルに関するレベル低減が、マルチチャンネル信号18の少なくとも2つのチャンネルの間で異なっているレベルのモノラルまたはステレオのダウンミックスに同上が寄与するように、複数のチャンネルの加重和を例証するために説明されたが、この、または、これらのチャンネルに存在するある音源コンテントが、低減/増幅されたレベルではなく、マルチチャンネル信号の他のコンテンツと同じレベルでルームプロセッシングの影響を受ける、または、受けないことになっているので、他のチャンネルが他方の、または、他のチャンネルと比較して、都合よくレベル低減またはレベル増幅された他の例もある。
図5は、むしろ、ダウンミックス信号62および空間パラメータ64によって複数の入力チャンネルを示す可能性に関して、概して説明されたものである。図6に関して、この説明は強められる。図6に関する説明は、また、図10から13に関して説明された以下の実施形態を理解することにも使用される。図6は、スペクトル的に複数のサブバンド82に分解されたダウンミックス信号62を示す。見本となるように、図6において、周波数領域の矢印84によって示されるように、サブバンド82がサブバンド周波数を底部から上部へ増加して配置された状態で水平に延長するように示される。水平方向への拡張は、時間軸86を意味する。例えば、ダウンミックス信号62は、サブバンド82ごとに一連のスペクトル値88を含む。サブバンド82がサンプル値88によってサンプリングされる時間分解能は、フィルタバンクのスロット90によって定義されうる。このように、タイムスロット90およびサブバンド82は、ある時間/周波数分解能またはグリッドを定める。図6の破線によって示されるように、より粗い時間/周波数グリッドは時間/周波数のタイル92に隣接したサンプル値88を結合させることによって定められ、そして、これらのタイルが時間/周波数パラメータ解像度またはグリッドを定める。上述した空間パラメータ62は、その時間/周波数パラメータ解像度92において定義される。時間/周波数パラメータ解像度92は、時間で変化しうる。この目的で、マルチチャンネル信号62は、連続したフレーム94に分割されうる。フレームごとに、時間/周波数分解能グリッド92は、個々に設定できる。復号器64が時間領域においてダウンミックスを受けとる場合、復号器64は、図6に示すようにダウンミックス信号62の表現を導き出すために内部の分析フィルタバンクから成ることもある。あるいは、ダウンミックス信号62は図6に示すような形式で復号器64に入り、その場合、分析フィルタバンクは復号器64には必要でない。図5においてすでに述べたように、タイル92ごとに、2つのチャンネル予測係数は、各時間/周波数のタイル92に関して、右および左チャンネルがどのようにステレオのダウンミックス信号62の左右のチャンネルから導き出されうるかを明らかにして存在する。加えて、相互チャンネル可干渉性/相互相関(ICC:inter−channel coherence/cross−correlation)パラメータは、ステレオダウンミックス信号62から導き出されるために左右チャンネル間のICC類似性を指し示しているタイル92のために存在しうる。そこにおいて、ステレオダウンミックス信号62の1本のチャンネルは完全に混合されており、一方で、その他方は、ステレオダウンミックス信号62の他のチャンネルに完全に混合されている。しかし、チャンネルレベル差(CLD:channel level difference)パラメータは、ちょうど言及された左右のチャンネル間のレベル差を示しているタイル92ごとに更に存在する。対数目盛上の均一でない量子化はCLDパラメータに適用されうる。ここで、チャンネル間のレベルにおいて大きな差があるとき、その量子化は0dB付近の高い正確さとより粗い解像度を有する。加えて、別のパラメータは、空間パラメータ64の中に存在しうる。これらのパラメータは、ちょうど言及された、例えばリア左、フロント左、リア右およびフロント右のチャンネルのような左右チャンネルを混合することによって形成するのに役立ったチャンネルに関連するCLDおよびICCを特に定めうる。
上述した実施形態が互いに組み合わせられうることは、留意すべきことである。いくつかの組み合わせの可能性は、すでに上に述べた。別の可能性は、図7から13までの実施形態に関して以下に述べられる。加えて、図1および5の上述した実施形態は、中間のチャンネル20、66および68が、それぞれ、実際に装置内に存在すると仮定した。しかし、これは必ずしもそうとは限らない。例えば、図2の装置により導き出されるような修正されたHRTFは、類似性低減装置12を除外することにより図1の方向フィルタを定めるのに使用されうる。そして、この場合、図1の装置は、図5に示されるダウンミックス信号62のようなダウンミックス信号に作用しうる。そして、空間パラメータおよび修正されたHRTFを時間/周波数パラメータ解像度92において最適に組み合わせることによって、複数のチャンネル18a〜18dを示して、それに応じて得られた線形結合係数をバイノーラル信号22aおよび22bを形成するために適用する。
同様に、ダウンミックスジェネレータ42は、ルームプロセッサ44への提供を目的とするモノラルまたはステレオのダウンミックス48を得るためにセンターチャンネルのために得られる空間パラメータ64およびレベル低減量を最適に組み合わせるように構成されうる。図7は、一実施形態に従ったバイノーラル出力信号ジェネレータを示す。概して引用符号100によって示されるジェネレータは、マルチチャンネル復号器102、バイノーラル出力104およびマルチチャンネル復号器102の出力とバイノーラル出力104の間で拡張している2つの経路、すなわち直接経路106と残響経路108とを含む。直接経路において、方向フィルタ110は、マルチチャンネル復号器102の出力に接続される。直接経路は、さらに、アダー112の第1のグループとアダー114の第2のグループを含む。アダー112は、方向フィルタ110の最初の半分の出力信号を計上し、そして、第2のアダー114は方向フィルタ110のもう半分の出力信号を計上する。第1および第2のアダー112および114の合計された出力は、バイノーラル出力信号22aおよび22bの前述の直接経路の寄与を示す。アダー116および118は、寄与信号22aおよび22bを、残響経路108により供給されるバイノーラル寄与信号、すなわち、信号46aおよび46bと結合するために供給される。残響経路108において、ミキサー120およびルームプロセッサ122はマルチチャンネル復号器102の出力およびアダー16および118の各入力との間で直列に接続される。そして、それらアダーの出力は、出力104で出力されるバイノーラル出力信号を定める。
図7の装置についての以下の説明の理解を容易にするために、図1から6において使用された引用符号は、図1から6で生ずる要素に対応する、または、それら要素の機能の責任を負う、図7の要素を示すために部分的に使用されている。対応の説明は、後の説明でより明白になるだろう。しかし、以下の説明を容易にするために、以下の実施形態は、類似性低減装置が相関低減を実行すると仮定して説明されたことが留意される。したがって、後者は、以下において、相関低減装置を示す。しかし、上記から明白になったように、下で概説される実施形態は、類似性低減装置が相関に関して以外の類似性の低減を実行するケースに容易に振替え可能である。更に、上記のように、別の実施形態への転用は容易に可能だろうが、以下で概説される実施形態は、ルームプロセッシングのためのダウンミックスを生成するためのミキサーがセンターチャンネルのレベル低減を生成すると仮定して立案されている。
図7の装置は、復号化マルチチャンネル信号124からの出力104でのヘッドホン出力の生成のための信号伝達を使用する。復号化されたマルチチャンネル124は、例えば、空間オーディオ復号化などによるビットストリーム入力126でのビットストリーム入力からマルチチャンネル復号器102によって得られる。復号化の後、復号化されたマルチチャンネル信号124の各信号または各チャンネルは、1対の方向フィルタ110によってフィルタにかけられる。例えば、復号化されたマルチチャンネル信号124の第1の(上側の)チャンネルは、方向フィルタ(1,L)および方向フィルタ(1,R)によってフィルタにかけられ、そして、第2の(上から2番目の)信号またはチャンネルは、方向フィルタ(2,L)および方向フィルタ(2,R)などによってフィルタにかけらえる。これらのフィルタ110は、室内の仮想音源から聴取者の耳道への音響伝達、いわゆる両耳室内伝達関数(BRTF:binaural room transfer function)をモデル化しうる。それらは、時間、レベルそしてスペクトルの修正を実行しうる。そして、部分的に室内反射、残響もまたモデル化しうる。方向フィルタ110は、時間または周波数領域において実行されうる。必要な多くのフィルタ110(N×2、Nは復号化されたチャンネル数)があるので、これらの方向フィルタは、室内反射および残響を完全にモデル化する場合、それらフィルタはかなり長くなる、すなわち、フィルタリング処理が計算上、必要とされるだろう場合には、44.1kHzで20000フィルタタップという長さになる。方向フィルタ110は、最小限、いわゆる頭部伝達関数(HRTF)まで都合よく減少させられる。そして共通の処理ブロック122は、室内反射および残響のモデルが使用される。ルームプロセッシングモジュール122は時間または周波数領域の残響算法を実行することができて、1または2のチャンネル入力信号48から作動しうる。ここで、その入力信号はミキサー120内で、混合行列によって復号化マルチチャンネル入力信号124から算出される。ルームプロセッシングブロックは、室内反射および/または残響を実行する。特に距離、および、聴取者の頭の外に知覚されることを意味する外在化に関して、室内反射および残響は音の定位に必要不可欠である。
一般的に、支配的な音響エネルギーがフロントチャンネル、すなわち、左フロント、右フロント、センターに含まれるように、マルチチャンネル音は生成される。映画の会話および音楽における声は、一般的にセンターチャンネルに主に混合される。センターチャンネル信号がルームプロセッシングモジュール122に供給される場合、結果として生じる出力は、しばしば不自然に残響し、スペクトル的に不均一に知覚される。したがって、図7の実施形態によれば、センターチャンネルは、すでに上で記載したように、ミキサー120内でレベル低減が実行され、6dB減衰されたような有意なレベル低減を有するルームプロセッシングモジュール122に供給される。その範囲において、図7の実施形態は、図3および5に記載の構造を含む。そこにおいて、図7の引用符号102、124、120、および122は、図3および5の引用符号18、64、引用符号66および68の結合、引用符号66および引用符号44にそれぞれ対応する。
図8は、別の実施形態に従う他のバイノーラル出力信号ジェネレータを示す。そのジェネレータは、概して引用符号140によって示される。図8の説明を容易にするために、同じ引用符号が、図7にあるように使用された。図3、5および7の実施形態によって示されるような機能、すなわち、センターチャンネルに関してレベル低減を実行する機能を、ミキサー120が必ずしも有するというわけではないことを示すために、引用符号40’は、ブロック102、120および122の配置を示すために使用された。換言すれば、ミキサー122内のレベル低減は、図8の場合には選択的である。しかし、図7と異なり、非相関装置(decorrelator)は、方向フィルタ110の各対と復号化されたマルチチャンネル信号124の関連するチャンネルのための復号器102の出力との間にそれぞれ接続される。非相関装置は、引用符号1421、1422などによって示される。非相関装置1421〜1424は、図1に示す相関低減装置12として働く。図8に示されるにもかかわらず、非相関装置1421〜1424が復号化されたマルチチャンネル信号124のチャンネルの各々に供給される必要はない。むしろ、1つの非相関装置で充分だろう。非相関装置142は、単に遅延でありうる。好ましくは、遅延1421〜1424の各々によって生じる遅延量は、互いに異なるだろう。他の可能性は、非相関装置1421〜1424が全通過フィルタであるということ、すなわち、ある定常的な大きさの伝達関数を有するが、各チャンネルのスペクトル成分の位相を変えるフィルタであることである。非相関装置1421〜1424によって生じる位相修正は、好ましくは各チャンネルで異なるだろう。他の可能性も、もちろん存在するだろう。例えば、非相関装置1421〜1424は、FIRフィルタ、またはそのようなものとして実行されうる。
このように、図8の実施形態によれば、要素1421〜1424、110、112、および114は、図1の装置10に従って作動する。
図8と同様に、図9は、図7のバイノーラル出力信号ジェネレータのバリエーションを示す。このように、図9も、図7において用いられているものと同じ引用符号を使用して、以下で説明される。図8の実施形態と同様に、ミキサー122のレベル低減は単に図9の場合は選択的である。したがって、図7の場合のような引用符号40というより、むしろ引用符号40’が図9にある。図9の実施形態は、有意な相関がマルチチャンネルの音生成におけるすべてのチャンネルの間に存在するという問題に対処する。方向フィルタ110に関するマルチチャンネル信号の処理後、各フィルタ対の2つのチャンネルの中間信号は、出力104のヘッドホン出力信号を形成するために、アダー112および114によって加算される。アダー112および114による相関した出力信号の和は、結果として出力104の出力信号の極めて低減された空間幅および外在化の欠如をもたらす。これは、復号化されたマルチチャンネル信号124内の左右の信号およびセンターチャンネルの相関に特に問題を含む。図9の実施形態によれば、方向フィルタは、できるだけ非相関な(decorrelated)出力を有するように構成される。この目的で、図9の装置は、HRTFの元々の組を基礎として方向フィルタ110により用いられる相互類似性を低減しているHRTFの組を形成するための装置30を含む。上述の通り、装置30は、復号化されたマルチチャンネル信号124の1つまたはいくつかのチャンネルに関連する方向フィルタの対のHRTFに関して、以下の技術の1つまたはいくつかを使用しうる:例えばフィルタタップの位置を変えることによって、各方向フィルタの位相応答を修正することによって、そして、全通過フィルタのような非相関フィルタ(decorrelation filter)を、各チャンネルの各方向フィルタに適用することによって、なされうるそのインパルス応答の位置を変えることによって、方向フィルタまたは各方向フィルタの対を遅延させる。この種の全通過フィルタは、FIRフィルタとして実行することができる。
上述の通り、装置30は、ビットストリーム入力126のビットストリームが向くラウドスピーカ構成における変化に応答して作動しうる。
図7から9の実施形態は、復号化されたマルチチャンネル信号に関連したものである。以下の実施形態は、ヘッドホンのためのパラメータのマルチチャンネルの復号化に関する。一般的に言って、空間オーディオ符号化は、より高い圧縮率を得るためにマルチチャンネルオーディオ信号の知覚的な相互チャンネルの無関係を活用するマルチチャンネル圧縮技術である。これは、空間的な手がかりまたは空間パラメータ、すなわち、マルチチャンネルのオーディオ信号の空間イメージを表しているパラメータに関して取り込むことができる。空間的な手がかりは、一般的にチャンネル間のレベル/強度の差、位相差および相関/可干渉性の計測を含み、そして極めて簡潔な方法で示すことができる。空間オーディオ符号化の構想は、結果としてMPEGサラウンド標準、すなわち、ISO/IEC23003―1をもたらしたMPEGによって採用された。空間オーディオ符号化において用いられたような空間パラメータは、方向フィルタを説明するためにも用いることができる。そうすることによって、空間オーディオデータを復号化するステップと方向フィルタを適用するステップは、ヘッドホン再生のためのマルチチャンネルオーディオを能率的に復号化し、供給するために組み合わせることができる。
ヘッドホン出力のための空間オーディオ復号器の一般の構造は、図10に与えられる。図10の復号器は、概して、引用符号200によって示され、そして、ステレオまたはモノラルのダウンミックス信号204のための入力、空間パラメータ206のための他の入力およびバイノーラル出力信号208のための出力を含んでいるバイノーラル空間サブバンド修正器(modifier)202を含む。空間パラメータ206を伴ったダウンミックス信号は、前述のマルチチャンネル信号18を形成して、その複数のチャンネルを示す。
内部的に、サブバンド修正器202は、入力されたダウンミックス信号とサブバンド修正器202の出力との間に述べられる順に接続された分析フィルタバンク208、行列化ユニットまたは線形結合器210、および、合成フィルタバンク212を含む。更に、サブバンド修正器202は、空間パラメータ206によって供給されるパラメータ変換装置214および装置30によって得られるようなHRTFの修正された一組を含む。
図10では、ダウンミックス信号は、例えばエントロピー符号化を含んで、前もってすでに復号されたと仮定される。バイノーラル空間オーディオ復号器は、ダウンミックス信号204によって供給される。パラメータ変換装置214は、バイノーラルパラメータ218を形成するために、修正されたHRTFパラメータ216の形で、空間パラメータ206および方向フィルタのパラメータ記述を使用する。これらのパラメータ218は、周波数領域において、2×2の行列(ステレオダウンミックス信号の場合)の形で、そして、1×2の行列(モノラルダウンミックス信号204の場合)の形で、分析フィルタバンク208によって出力されるスペクトル値88に行列化ユニット210によって適用される(図6参照)。換言すれば、バイノーラルパラメータ218は、図6に示される時間/周波数パラメータ解像度92において変動し、各サンプル値88に適用される。補間は、より粗い時間/周波数パラメータ領域92から分析フィルタバンク208の時間/周波数分解能まで、行列係数およびバイノーラルパラメータ218を、それぞれ、整形するために使用されうる。すなわち、ステレオダウンミックス204の場合、装置210によって実行される行列化により、ダウンミックス信号204の左チャンネルのサンプル値とダウンミックス信号204の対応する右チャンネルのサンプル値の1対あたり2つのサンプル値が結果として生じる。結果として生じる2つのサンプル値は、それぞれ、バイノーラル出力信号208の左右のチャンネルの一部である。モノラルのダウンミックス信号204の場合には、装置210による行列化は、モノラルのダウンミックス信号204、すなわち、バイノーラル出力信号208の左チャンネルのための1つと右チャンネルのための1つのサンプル値ごとに、結果として2つのサンプル値になる。バイノーラルパラメータ218は、ダウンミックス信号204の1つまたは2つのサンプル値からバイノーラル出力信号208のそれぞれの左右のチャンネルサンプル値まで導く行列演算を定める。バイノーラルパラメータ218は、すでに修正されたHRTFパラメータを反映する。このように、それらは、上記のようにマルチチャンネル信号18の入力チャンネルを非相関にする。
このように、行列化ユニット210の出力は、図6で示すような修正されたスペクトログラムである。合成フィルタバンク212は、そこからバイノーラル出力信号208を再構築する。換言すれば、合成フィルタバンク212は、行列化ユニット210により出力される結果として生じる2つのチャンネル信号を時間領域に変換する。これは、もちろん、選択的である。
図10の場合には、室内反射および残響の効果は、別途述べられなかった。もしあったとすれば、これらの効果は、HRTF216において考慮されなければならない。図11は、バイノーラル空間オーディオ復号器200’を別々の室内反射/残響処理と結合しているバイノーラル出力信号ジェネレータを示す。図11の引用符号200’の中の「’」は、図11のバイノーラル空間オーディオ復号器200’が修正されていないHRTF、すなわち、図2に示すような元のHRTFを使用しうることを意味するものとする。しかし、選択的に、図11のバイノーラル空間オーディオ復号器200’は、図10に示されるものでありうる。いずれにせよ、概して引用符号230によって示される図11のバイノーラル出力信号ジェネレータは、バイノーラル空間復号器200’の他に、ダウンミックスオーディオ復号器232、修正された空間オーディオサブバンド修正器234、ルームプロセッサ122および2つのアダー116および118を含む。ダウンミックスオーディオ復号器232は、ビットストリーム入力126およびバイノーラル空間オーディオ復号器200’のバイノーラル空間オーディオサブバンド修正器202との間に接続される。ダウンミックスオーディオ復号器232は、ダウンミックス信号214および空間パラメータ206を導き出すために入力126で入力されるビットストリームを復号するように構成される。両方とも、すなわち修正された空間オーディオサブバンド修正器234だけでなくバイノーラル空間オーディオサブバンド修正器202も、空間パラメータ206に加えてダウンミックス信号204を供給される。修正された空間オーディオサブバンド修正器234は、ダウンミックス信号204から、センターチャンネルのレベル低減の前述の量を反映している修正されたパラメータ236だけでなく空間パラメータ206の使用により、ルームプロセッサ122のための入力として役立つモノラルまたはステレオのダウンミックス48を割り出す。バイノーラル空間オーディオサブバンド修正器202とルームプロセッサ122の両方により出力される寄与は、それぞれ、出力238で結果としてバイノーラル出力信号をもたらすためにアダー116および118においてチャンネルごとに合計される。
図12は、図11のバイノーラルオーディオ復号器200’の機能を説明しているブロック図を示す。図12は図11のバイノーラル空間オーディオ復号器200’の実際の内部構造を示さず、バイノーラル空間オーディオ復号器200’によって得られた信号修正を説明するという点には留意する必要がある。バイノーラル空間オーディオ復号器200’の内部構造は、同上が元のHRTFで作動する場合には装置30は切り離しうるということを除いて、通常、図10に示される構造でコンパイルすることは、想起されることである。加えて、図12は、マルチチャンネル信号18によって示されるそのわずか3本のチャンネルが、バイノーラル出力信号208を形成するためにバイノーラル空間オーディオ復号器200’によって使用される場合を見本として、バイノーラル空間オーディオ復号器200’の機能を示す。特に、「2 to 3」、すなわち、TTTボックスは、ステレオダウンミックス204の2本のチャンネルからセンターチャンネル242、右チャンネル244および左チャンネル246を導出するために使用される。換言すれば、図12は、見本として、ダウンミックス204がステレオダウンミックスであると仮定する。TTTボックス248により用いられる空間パラメータ206は、上述のチャンネル予測係数を含む。相関の低減は、図12のDelayL、DelayRおよびDelayCで示される3つの非相関装置によって達成される。それらは、例えば、図1および7の場合に導入される非相関性に対応する。しかし、図12は、実際の構造が図10に示されたそれに対応するにもかかわらず、単にバイノーラル空間オーディオ復号器200’によってなされる信号修正を示すだけであることがさらにまた想起される。このように、方向フィルタ14を形成しているHRTFと比較して相関低減装置12を形成している遅延は分離した機能として示されるが、相関低減装置12における遅延の存在は、図12の方向フィルタ14の元のHRTFを形成しているHRTFパラメータの修正として理解されうる。まず、図12は、単にそれにバイノーラル空間オーディオ復号器200’がヘッドホン再生のためのチャンネルを非相関にする(decorrelate)ことを示すだけである。非相関性は、簡潔な方法によって、すなわち、行列Mのためのパラメータ処理における遅延ブロックとバイノーラル空間オーディオ復号器200’を追加することによって、達成される。このように、バイノーラル空間オーディオ復号器200’は、個々のチャンネルに以下の修正を適用しうる。すなわち、好ましくは少なくとも一つのサンプル分、センターチャンネルを遅延させること、各周波数帯域において、異なる間隔でセンターチャンネルを遅延させること、好ましくは少なくとも一つのサンプル分、左右のチャンネルを遅延させると、および/または各周波数帯域において、異なる間隔で左右のチャンネルを遅延させること、を適用しうる。
図13は、図11の修正された空間オーディオサブバンド修正器の構造のための例を示す。図13のサブバンド修正器234は、two−to−threeまたはTTTボックス262、重み付けステージ264a〜264e、第1のアダー266aおよび266b、第2のアダー268aおよび268b、ステレオダウンミックス204のための入力、空間パラメータ206のための入力、残差信号270のための更なる入力およびルームプロセッサにより処理され、そして図13に従えば、ステレオ信号であることを目的としたダウンミックス48のための出力を含む。
図13が構造的な意味で修正された空間オーディオサブバンド修正器234のための実施形態を定める際、図13のTTTボックス262は単にステレオダウンミックス204から空間パラメータ206を使用することによって、センターチャンネル、右チャンネル244、左チャンネル246を再構築するのみである。図12の場合、チャンネル242〜246が実際は割り出されないことが再度想起される。むしろ、バイノーラル空間オーディオサブバンド修正器は、ステレオダウンミックス信号204がHRTFを反映しているバイノーラル寄与に直接変えられるような方法で、行列Mを修正する。しかし、図13のTTTボックス262は、実際に再構築を実行する。選択的に、図13に示すように、上記に示すように、チャンネル予測係数を含み、選択的にICC値を含む、ステレオダウンミックス204および空間パラメータ206に基づいてチャンネル242〜246を再構築するときに、TTTボックス262は予測残差を反映している残差信号270を使用しうる。第1のアダー266aは、ステレオダウンミックス48の左チャンネルを形成するために、チャンネル242〜246を合計するように構成される。特に、加重和はアダー266aおよび266bによって形成される。そこにおいて、加重値は、各チャンネル246から242までに、各加重値EQLL、EQRLおよびEQCLを適用する重み付けステージ264a、264b、264cおよび264eによって定義される。同様に、アダー268aおよび268bは、加重値を形成している加重ステージ264b、264dおよび264eでチャンネル246〜242の加重和を形成する。そして、その加重和はステレオダウンミックス48の右チャンネルを形成する。
ステレオダウンミックス48の前述したセンターチャンネルのレベル低減がなされ、上記のように、結果として自然な音感覚に関する効果がもたらされるに、加重ステージ264a〜264eのためのパラメータ270は、上記のように、選択される。
このように、換言すれば、図13は、図12のバイノーラルパラメータ復号器200’と結合して使用されうるルームプロセッシングモジュールを示す。図13において、ダウンミックス信号204は、モジュールに供給するために使用される。ダウンミックス信号204は、ステレオ互換性を供給することができるようにマルチチャンネル信号のすべての信号を含む。上記のように、低減されたセンターの信号だけを含んでいる信号をルームプロセッシングモジュールに供給することは、望ましい。図13の修正された空間オーディオサブバンド修正器は、このレベル低減を実行するのに役立つ。特に、図13によれば、残差信号270は、センター、左右のチャンネル242〜246を再構築するために使用されうる。図11には図示されていないが、センターおよび左右のチャンネル242〜246の残差信号は、ダウンミックスオーディオ復号器232によって復号されうる。
加重ステージ264a〜264eにより適用されるEQパラメータまたは加重値は、左、右およびセンターチャンネル242〜246のために実数値でありうる。センターチャンネル242のための1つのパラメータの組は、格納され、適用されうる。そして、センターチャンネルは、図13に従って、ステレオのダウンミックス48の左右両方の出力に例として均等に混合される。修正された空間オーディオサブバンド修正器234に入れられるEQパラメータ270は、以下の性質を有しうる。第1に、センターチャンネル信号は、好ましくは、少なくとも6dB減衰されうる。更に、センターチャンネル信号は、ローパス特性を有しうる。更に、その残りのチャンネルの差分信号は、低周波数で増大させられうる。その他のチャンネル244および246に対してより低いセンターチャンネル242のレベルを補償するために、バイノーラル空間オーディオサブバンド修正器202で使用されるセンターチャンネルのためのHRTFパラメータの利得は、それに応じて、増加しなければならない。
EQパラメータの設定の主な目的は、ルームプロセッシングモジュールのための出力におけるセンターチャンネル信号の低減である。しかし、センターチャンネルは、限られた範囲に抑制されなければならないだけである。センターチャンネル信号は、TTTボックス内部で左および右のダウンミックスチャンネルから減算される。センターのレベルが低減される場合、左右のチャンネルのアーチファクトは聞き取れるようになりうる。従って、EQステージにおけるセンターのレベルの低減は、抑制およびアーチファクトの間のトレードオフである。EQパラメータの固定した設定を見つけることは可能であるが、すべての信号に最適であるとは限らない。したがって、実施形態によっては、適合アルゴリズムまたはモジュール274は、1つまたは以下のパラメータの結合によりセンターレベルの低減量を制御するために使用されうる。
TTTボックス262の中への左右のダウンミックスチャンネル204からセンターチャンネル242を復号するために使用される空間パラメータ206は、破線276によって示されるように使用されうる。
センター、左および右のチャンネルのレベルは、破線278によって示されるように使用されうる。
センター、左および右のチャンネル242〜246間のレベル差は、破線278によっても示されるように使用されうる。
例えばヴォイス・アクティビティ・ディテクター(VAD:voice activity detector)のようなシングルタイプの検出アルゴリズムの出力は、破線278によっても示されるように使用されうる。
最後に、オーディオ内容を表している静的または動的なメタデータは、破線280によって示されるように、センターのレベル低減量を測定するために使用されうる。
いくつかの態様が装置の文脈において説明されたが、これらの態様は、また、対応する方法の説明を示しもすることは明らかである。そこにおいて、ブロックまたは装置は、方法のステップまたは方法のステップの特徴に対応する。類似して、方法のステップの文脈においても説明される態様は、対応するブロックまたは項目の説明または例えばASIC、プログラムコードのサブルーチンまたはプログラムされたプログラム可能な論理の一部のような対応する装置の特徴を示す。
本発明の符号化されたオーディオ信号は、デジタル記憶媒体に格納できる、または、例えば無線伝送媒体またはインターネットのような有線伝送媒体などの伝送媒体に送信できる。
特定の実施要件に応じて、本発明の実施形態は、ハードウェアにおいて、または、ソフトウェアにおいて実施できる。実施例は、例えばフロッピー(登録商標)ディスク、DVD、CD、ROM、PROM、EPROM、EEPROMまたはFLASHメモリといった、その上に格納された電子的に読み込み可能な制御信号を有するデジタル記憶媒体を使用して実行できる。そして、その記憶媒体は、各方法が実行されるように、それはプログラム可能な計算機システムと協動する(または協動することができる)。
本発明によるいくつかの実施形態は、プログラム可能な計算機システムと協動可能である、電子的に読み込み可能な制御信号を有するデータキャリアを含む。その結果、ここで説明された方法のうちの1つが実行される。
通常、本発明の実施形態は、プログラムコードを有するコンピュータ・プログラム製品として実施できる。そして、コンピュータ・プログラム製品がコンピュータ上で動作するときに、そのプログラムコードは、その方法のうちの1つを実行する働きをする。そのプログラムコードは、例えば、機械読み取り可能なキャリアに格納されうる。
他の実施形態は、ここで説明された方法のうちの1つを実行するための、機械読み取り可能キャリアに格納された、コンピュータ・プログラムを含む。
したがって、換言すれば、本発明の方法の実施形態は、コンピュータ・プログラムがコンピュータ上で動作するときに、ここに説明された方法のうちの1つを実行するためのプログラムコードを有するコンピュータ・プログラムである。
したがって、本発明の方法の別の実施形態は、その上に記録されて、ここに説明された方法のうちの1つを実行するためのコンピュータ・プログラムを含んでいるデータキャリア(またはデジタル記憶媒体またはコンピュータ可読媒体)である。
したがって、本発明の方法の別の実施形態は、ここにおいて説明された方法のうちの1つを実行するためのコンピュータ・プログラムを示しているデータストリームまたは信号のシーケンスである。例えば、そのデータストリームまたは信号のシーケンスは、データ通信コネクションを介して、例えばインターネットを介して転送されるように構成されうる。
別の実施形態は、例えばコンピュータまたはプログラム可能な論理デバイスといった、ここに説明された方法のうちの1つを実行するために構成される、または、適用される処理手段を含む。
別の実施形態は、ここに説明された方法のうちの1つを実行するためのコンピュータ・プログラムをその上にインストールしたコンピュータを含む。
いくつかの実施形態では、プログラム可能な論理デバイス(例えば論理フィールド・プログラマブル・ゲート・アレイ)は、ここに説明された方法の特徴のいくつかまたは全てを実行するために使用されうる。いくつかの実施形態では、フィールド・プログラマブル・ゲート・アレイは、ここに説明された方法のうちの1つを実行するために、マイクロプロセッサと協動しうる。通常、その方法は、いかなるハードウェア装置によっても好ましくは実行される。
上で説明された実施形態は、本発明の原理のために、単に図示しているだけである。ここに説明された装置と詳細の修正および変形は、他の当業者にとって明らかであるものと理解される。したがって、以下の特許請求の範囲のみによって制限され、実施形態の記載および説明の仕方によってここに提示された具体的な詳細によっては制限されないという意図がある。

Claims (19)

  1. 複数のチャンネルを示しているマルチチャンネル信号に基づいており、仮想音源の位置をそれぞれのチャンネルに関連させているスピーカ構成による再生を目的としたバイノーラル信号を生成するための装置であって、
    前記複数のチャンネルの各々について、1対の方向フィルタを含む、複数の方向フィルタ(14)であって、前記複数の方向フィルタ(14)は、前記複数のチャンネルの各々について、前記方向フィルタの各対が、聴取者の各耳道への各チャンネルに関連した仮想音源の位置から、前記各チャンネルの音響伝達をモデル化するために構成される、前記複数の方向フィルタ(14)と、
    前記バイノーラル信号の第1のチャンネル(22a)を得るために前記聴取者の前記第1の耳道への前記音響伝達をモデル化している前記方向フィルタの出力を混合するための第1のミキサー(16a)と、
    前記バイノーラル信号の第2のチャンネル(22b)を得るために前記聴取者の前記第2の耳道への前記音響伝達をモデル化している前記方向フィルタの出力を混合するための第2のミキサー(16b)と、を含み、
    前記マルチチャンネル信号に基づいた前記バイノーラル信号の室内反射/残響に関連した寄与を生成すための装置であって、
    前記マルチチャンネル信号の前記チャンネルのモノラルまたはステレオのダウンミックスを形成しているダウンミックスジェネレータと、
    前記モノラルまたはステレオのダウンミックスに基づいて室内反射/残響をモデル化することによって、第1のチャンネル出力および第2のチャンネル出力を含む前記バイノーラル信号の前記室内反射/残響に関連した寄与を生成するためのルームプロセッサと、
    前記ルームプロセッサの前記第1のチャンネル出力を前記バイノーラル信号の前記第1のチャンネル(22a)に加算するように構成された第1のアダー(116)と、
    前記ルームプロセッサの前記第2のチャンネル出力を前記バイノーラル信号の前記第2のチャンネル(22a)に加算するように構成された第2のアダー(118)と、を含み、
    前記ダウンミックスジェネレータは、前記複数のチャンネルが前記マルチチャンネル信号の少なくとも2つのチャンネル間で異なっているレベルで前記モノラルまたはステレオのダウンミックスに寄与し、そして
    記複数のチャンネルのセンターチャンネルが、前記マルチチャンネル信号の前記他のチャンネルと比較してレベルが低減された方法で前記モノラルまたはステレオのダウンミックスに寄与するように、前記モノラルまたはステレオのダウンミックスを形成するように構成され
    前記ダウンミックスジェネレータは、空間オーディオ符号化によって、ダウンミックス信号、および、前記複数のチャンネル間のレベル差、位相差、時間差および/または相関性の計測を表している関連した空間パラメータから、前記複数のチャンネルを再構築するように構成されること、を特徴とする、装置。
  2. 前記複数の方向フィルタ(14)は、時間領域フィルタである、請求項1に記載の装置。
  3. 前記ダウンミックスジェネレータは、前記少なくとも2つのチャンネルのうちの第2のものと比較した前記少なくとも2つのチャンネルのうちの第1のもののレベルの低減量が前記空間パラメータに依存するように、前記形成を実行するように構成されること、を特徴とする、請求項に記載の装置。
  4. 前記ダウンミックスジェネレータは、空間オーディオ符号化によって、ステレオのダウンミックス信号、前記ステレオのダウンミックス信号のチャンネルがセンター、右、左のチャンネルのトリプレットを予測するためにどのように線形に結合されることになっているかを表しているチャンネル予測係数、および、前記トリプレットを予測するときに予測残差を反映している残差信号(270)、から前記複数のチャンネルを再構築するように構成されること、を特徴とする、請求項に記載の装置。
  5. 前記ダウンミックスジェネレータは、前記少なくとも2つのチャンネルのうちの第2のものと比較した前記少なくとも2つのチャンネルのうちの第1のもののレベルの低減量が、前記複数のチャンネルの個々のチャンネル間のレベル差および/または相関に依存するように、前記形成を実行するように構成されること、を特徴とする、請求項1〜請求項4のいずれかに記載の装置。
  6. 前記ダウンミックスジェネレータは、前記複数のチャンネルを示しているダウンミックス信号に付随している空間パラメータに基づいて、前記複数のチャンネルの個々のチャンネル間の前記レベル差および/または前記相関を増すように構成されること、を特徴とする、請求項5に記載の装置。
  7. 前記ダウンミックスジェネレータは、前記少なくとも2つのチャンネルのうちの第2のものと比較した前記少なくとも2つのチャンネルのうちの第1のもののレベルの低減量が、前記マルチチャンネル信号の補助情報内に送られた時間的に変化する指標によって示されるように時間で変動するように、前記形成を実行するように構成されること、を特徴とする、請求項1〜請求項4のいずれかに記載の装置。
  8. 前記マルチチャンネル信号内の音声と非音声の位相を検出するための信号形式検出器を更に含み、
    前記ダウンミックスジェネレータは、レベルの低減量が非音声位相間より音声位相間のほうが高いように前記形成を実行するように構成されること、を特徴とする、請求項1に記載の装置。
  9. 複数のチャンネルを示しているマルチチャンネル信号に基づいており、前記複数のチャンネルの各々について1対の方向フィルタを含む複数の方向フィルタ(14)であって、前記複数の方向フィルタ(14)は、前記複数のチャンネルの各々について、前記方向フィルタの各対が、聴取者の各耳道への各チャンネルに関連した仮想音源の位置から、前記各チャンネルの音響伝達をモデル化するために構成される、前記複数の方向フィルタ(14)を用いて、仮想音源の位置をそれぞれのチャンネルに関連させているスピーカ構成による再生を目的としたバイノーラル信号を生成するための方法であって、
    前記バイノーラル信号の第1のチャンネル(22a)を得るために前記聴取者の前記第1の耳道への前記音響伝達をモデル化している前記方向フィルタの出力を混合するステップと、
    前記バイノーラル信号の第2のチャンネル(22b)を得るために前記聴取者の前記第2の耳道への前記音響伝達をモデル化している前記方向フィルタの出力を混合するステップと、
    前記マルチチャンネル信号に基づいた前記バイノーラル信号の室内反射/残響に関連した寄与を生成する方法であって、
    前記マルチチャンネル信号の前記チャンネルのモノラルまたはステレオのダウンミックスを形成するステップと、
    前記モノラルまたはステレオのダウンミックスに基づいて室内反射/残響をモデル化することによって、第1のチャンネル出力および第2のチャンネル出力を含む前記バイノーラル信号の前記室内反射/残響に関連した寄与を生成するステップと、
    前記ルームプロセッサの前記第1のチャンネル出力を前記バイノーラル信号の前記第1のチャンネル(22a)に加算するステップと、
    前記ルームプロセッサの前記第2のチャンネル出力を前記バイノーラル信号の前記第2のチャンネル(22a)に加算するステップと、を含み、
    前記モノラルまたはステレオのダウンミックスを形成するステップは、前記複数のチャンネルが前記マルチチャンネル信号の少なくとも2つのチャンネル間で異なっているレベルで前記モノラルまたはステレオのダウンミックスに寄与し、そして、
    前記複数のチャンネルのセンターチャンネルが、前記マルチチャンネル信号の前記他のチャンネルと比較してレベルが低減された方法で、前記モノラルまたはステレオのダウンミックスに寄与するように、実行され、
    前記方法は、空間オーディオ符号化によって、ダウンミックス信号、および、前記複数のチャンネル間のレベル差、位相差、時間差および/または相関性の計測を表している関連した空間パラメータから、前記複数のチャンネルを再構築するステップをさらに含むこと、を特徴とする、方法。
  10. 前記複数の方向フィルタ(14)は、時間領域フィルタである、請求項9に記載の方法。
  11. 複数のチャンネルを示しているマルチチャンネル信号に基づいており、仮想音源の位置をそれぞれのチャンネルに関連させているスピーカ構成による再生を目的としたバイノーラル信号を生成するための装置であって、
    前記複数のチャンネルの各々について、1対の方向フィルタを含む、複数の方向フィルタ(14)であって、前記複数の方向フィルタ(14)は、前記複数のチャンネルの各々について、前記方向フィルタの各対が、聴取者の各耳道への各チャンネルに関連した仮想音源の位置から、前記各チャンネルの音響伝達をモデル化するために構成される、前記複数の方向フィルタ(14)と、
    前記バイノーラル信号の第1のチャンネル(22a)を得るために前記聴取者の前記第1の耳道への前記音響伝達をモデル化している前記方向フィルタの出力を混合するための第1のミキサー(16a)と、
    前記バイノーラル信号の第2のチャンネル(22b)を得るために前記聴取者の前記第2の耳道への前記音響伝達をモデル化している前記方向フィルタの出力を混合するための第2のミキサー(16b)と、を含み、
    前記マルチチャンネル信号に基づいた前記バイノーラル信号の室内反射/残響に関連した寄与を生成ための装置であって、
    前記マルチチャンネル信号の前記チャンネルのモノラルまたはステレオのダウンミックスを形成しているダウンミックスジェネレータと、
    前記モノラルまたはステレオのダウンミックスに基づいて室内反射/残響をモデル化することによって、第1のチャンネル出力および第2のチャンネル出力を含む前記バイノーラル信号の前記室内反射/残響に関連した寄与を生成するためのルームプロセッサと、
    前記ルームプロセッサの前記第1のチャンネル出力を前記バイノーラル信号の前記第1のチャンネル(22a)に加算するように構成された第1のアダー(116)と、
    前記ルームプロセッサの前記第2のチャンネル出力を前記バイノーラル信号の前記第2のチャンネル(22a)に加算するように構成された第2のアダー(118)と、を含み、
    前記ダウンミックスジェネレータは、前記複数のチャンネルが前記マルチチャンネル信号の少なくとも2つのチャンネル間で異なっているレベルで前記モノラルまたはステレオのダウンミックスに寄与するように、前記モノラルまたはステレオのダウンミックスを形成するように構成されることと、
    前記ダウンミックスジェネレータは、空間オーディオ符号化によって、ダウンミックス信号、および、前記複数のチャンネル間のレベル差、位相差、時間差および/または相関性の計測を表している関連した空間パラメータから、前記複数のチャンネルを再構築するように構成されることと、
    前記ダウンミックスジェネレータは、前記少なくとも2つのチャンネルのうちの第2のものと比較した前記少なくとも2つのチャンネルのうちの第1のもののレベルの低減量が前記空間パラメータに依存するように、前記形成を実行するように構成されることと、を特徴とする、装置。
  12. 前記複数の方向フィルタ(14)は、時間領域フィルタである、請求項11に記載の装置。
  13. 複数のチャンネルを示しているマルチチャンネル信号に基づいており、前記複数のチャンネルの各々について1対の方向フィルタを含む複数の方向フィルタ(14)であって、前記複数の方向フィルタ(14)は、前記複数のチャンネルの各々について、前記方向フィルタの各対が、聴取者の各耳道への各チャンネルに関連した仮想音源の位置から、前記各チャンネルの音響伝達をモデル化するために構成される、前記複数の方向フィルタ(14)を用いて、仮想音源の位置をそれぞれのチャンネルに関連させているスピーカ構成による再生を目的としたバイノーラル信号を生成するための方法であって、
    前記バイノーラル信号の第1のチャンネル(22a)を得るために前記聴取者の前記第1の耳道への前記音響伝達をモデル化している前記方向フィルタの出力を混合するステップと、
    前記バイノーラル信号の第2のチャンネル(22b)を得るために前記聴取者の前記第2の耳道への前記音響伝達をモデル化している前記方向フィルタの出力を混合するステップと、
    前記マルチチャンネル信号に基づいた前記バイノーラル信号の室内反射/残響に関連した寄与を生成する方法であって、
    前記マルチチャンネル信号の前記チャンネルのモノラルまたはステレオのダウンミックスを形成するステップと、
    前記モノラルまたはステレオのダウンミックスに基づいて室内反射/残響をモデル化することによって、第1のチャンネル出力および第2のチャンネル出力を含む前記バイノーラル信号の前記室内反射/残響に関連した寄与を生成するステップと、
    前記ルームプロセッサの前記第1のチャンネル出力を前記バイノーラル信号の前記第1のチャンネル(22a)に加算するステップと、
    前記ルームプロセッサの前記第2のチャンネル出力を前記バイノーラル信号の前記第2のチャンネル(22a)に加算するステップと、を含み、
    前記モノラルまたはステレオのダウンミックスを形成するステップは、前記複数のチャンネルが前記マルチチャンネル信号の少なくとも2つのチャンネル間で異なっているレベルで前記モノラルまたはステレオのダウンミックスに寄与するように、実行されることと、
    前記方法は、空間オーディオ符号化によって、ダウンミックス信号、および、前記複数のチャンネル間のレベル差、位相差、時間差および/または相関性の計測を表している関連した空間パラメータから、前記複数のチャンネルを再構築するステップ、を更に含むことと、
    前記形成は、前記少なくとも2つのチャンネルのうちの第2のものと比較した前記少なくとも2つのチャンネルのうちの第1のもののレベルの低減量が前記空間パラメータに依存するように、実行されることと、を特徴とする、方法。
  14. 前記複数の方向フィルタ(14)は、時間領域フィルタである、請求項13に記載の方法。
  15. 複数のチャンネルを示しているマルチチャンネル信号に基づいており、仮想音源の位置をそれぞれのチャンネルに関連させているスピーカ構成による再生を目的としたバイノーラル信号を生成するための装置であって、
    前記複数のチャンネルの各々について、1対の方向フィルタを含む、複数の方向フィルタ(14)であって、前記複数の方向フィルタ(14)は、前記複数のチャンネルの各々について、前記方向フィルタの各対が、聴取者の各耳道への各チャンネルに関連した仮想音源の位置から、前記各チャンネルの音響伝達をモデル化するために構成される、前記複数の方向フィルタ(14)と、
    前記バイノーラル信号の第1のチャンネル(22a)を得るために前記聴取者の前記第1の耳道への前記音響伝達をモデル化している前記方向フィルタの出力を混合するための第1のミキサー(16a)と、
    前記バイノーラル信号の第2のチャンネル(22b)を得るために前記聴取者の前記第2の耳道への前記音響伝達をモデル化している前記方向フィルタの出力を混合するための第2のミキサー(16b)と、を含み、
    前記マルチチャンネル信号に基づいた前記バイノーラル信号の室内反射/残響に関連した寄与を生成ための装置であって、
    前記マルチチャンネル信号の前記チャンネルのモノラルまたはステレオのダウンミックスを形成しているダウンミックスジェネレータと、
    前記モノラルまたはステレオのダウンミックスに基づいて室内反射/残響をモデル化することによって、第1のチャンネル出力および第2のチャンネル出力を含む前記バイノーラル信号の前記室内反射/残響に関連した寄与を生成するためのルームプロセッサと、
    前記ルームプロセッサの前記第1のチャンネル出力を前記バイノーラル信号の前記第1のチャンネル(22a)に加算するように構成された第1のアダー(116)と、
    前記ルームプロセッサの前記第2のチャンネル出力を前記バイノーラル信号の前記第2のチャンネル(22a)に加算するように構成された第2のアダー(118)と、を含み、
    前記ダウンミックスジェネレータは、前記複数のチャンネルが前記マルチチャンネル信号の少なくとも2つのチャンネル間で異なっているレベルで前記モノラルまたはステレオのダウンミックスに寄与するように、前記モノラルまたはステレオのダウンミックスを形成するように構成されることと、
    前記装置は、前記マルチチャンネル信号内の音声と非音声の位相を検出するための信号形式検出器を更に含むことと、前記ダウンミックスジェネレータは、レベルの低減量が非音声位相間より音声位相間のほうが高いように前記形成を実行するように構成されること、を特徴とする、装置。
  16. 前記複数の方向フィルタ(14)は、時間領域フィルタである、請求項15に記載の装置。
  17. 複数のチャンネルを示しているマルチチャンネル信号に基づいており、前記複数のチャンネルの各々について1対の方向フィルタを含む複数の方向フィルタ(14)であって、前記複数の方向フィルタ(14)は、前記複数のチャンネルの各々について、前記方向フィルタの各対が、聴取者の各耳道への各チャンネルに関連した仮想音源の位置から、前記各チャンネルの音響伝達をモデル化するために構成される、前記複数の方向フィルタ(14)を用いて、仮想音源の位置をそれぞれのチャンネルに関連させているスピーカ構成による再生を目的としたバイノーラル信号を生成するための方法であって、
    前記バイノーラル信号の第1のチャンネル(22a)を得るために前記聴取者の前記第1の耳道への前記音響伝達をモデル化している前記方向フィルタの出力を混合するステップと、
    前記バイノーラル信号の第2のチャンネル(22b)を得るために前記聴取者の前記第2の耳道への前記音響伝達をモデル化している前記方向フィルタの出力を混合するステップと、
    前記マルチチャンネル信号に基づいた前記バイノーラル信号の室内反射/残響に関連した寄与を生成する方法であって、
    前記マルチチャンネル信号の前記チャンネルのモノラルまたはステレオのダウンミックスを形成するステップと、
    前記モノラルまたはステレオのダウンミックスに基づいて室内反射/残響をモデル化することによって、第1のチャンネル出力および第2のチャンネル出力を含む前記バイノーラル信号の前記室内反射/残響に関連した寄与を生成するステップと、
    前記ルームプロセッサの前記第1のチャンネル出力を前記バイノーラル信号の前記第1のチャンネル(22a)に加算するステップと、
    前記ルームプロセッサの前記第2のチャンネル出力を前記バイノーラル信号の前記第2のチャンネル(22a)に加算するステップと、を含み、
    前記モノラルまたはステレオのダウンミックスを形成するステップは、前記複数のチャンネルが前記マルチチャンネル信号の少なくとも2つのチャンネル間で異なっているレベルで前記モノラルまたはステレオのダウンミックスに寄与するように、実行されることと、
    前記方法は、前記マルチチャンネル信号内の音声と非音声の位相を検出するステップを更に含むことと、前記形成は、レベルの低減量が非音声位相間より音声位相間のほうが高いように実行されること、を特徴とする、方法。
  18. 前記複数の方向フィルタ(14)は、時間領域フィルタである、請求項17に記載の方法。
  19. コンピュータ・プログラムがコンピュータ上で動作するときに、請求項9、請求項13、請求項1のいずれかに記載の方法を実行するための命令を有する前記コンピュータ・プログラム。
JP2011520384A 2008-07-31 2009-07-30 バイノーラル信号のための信号生成 Active JP5746621B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US8528608P 2008-07-31 2008-07-31
US61/085,286 2008-07-31
PCT/EP2009/005548 WO2010012478A2 (en) 2008-07-31 2009-07-30 Signal generation for binaural signals

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2013258613A Division JP5860864B2 (ja) 2008-07-31 2013-12-13 バイノーラル信号のための信号生成

Publications (2)

Publication Number Publication Date
JP2011529650A JP2011529650A (ja) 2011-12-08
JP5746621B2 true JP5746621B2 (ja) 2015-07-08

Family

ID=41107586

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2011520384A Active JP5746621B2 (ja) 2008-07-31 2009-07-30 バイノーラル信号のための信号生成
JP2013258613A Active JP5860864B2 (ja) 2008-07-31 2013-12-13 バイノーラル信号のための信号生成

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2013258613A Active JP5860864B2 (ja) 2008-07-31 2013-12-13 バイノーラル信号のための信号生成

Country Status (13)

Country Link
US (1) US9226089B2 (ja)
EP (3) EP2384029B1 (ja)
JP (2) JP5746621B2 (ja)
KR (3) KR101366997B1 (ja)
CN (3) CN102172047B (ja)
AU (1) AU2009275418B9 (ja)
BR (1) BRPI0911729B1 (ja)
CA (3) CA2732079C (ja)
ES (3) ES2528006T3 (ja)
HK (3) HK1156139A1 (ja)
PL (3) PL2304975T3 (ja)
RU (1) RU2505941C2 (ja)
WO (1) WO2010012478A2 (ja)

Families Citing this family (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7711123B2 (en) * 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
JP5679340B2 (ja) * 2008-12-22 2015-03-04 コーニンクレッカ フィリップス エヌ ヴェ 送信効果処理による出力信号の生成
JP5857071B2 (ja) * 2011-01-05 2016-02-10 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. オーディオ・システムおよびその動作方法
KR101842257B1 (ko) * 2011-09-14 2018-05-15 삼성전자주식회사 신호 처리 방법, 그에 따른 엔코딩 장치, 및 그에 따른 디코딩 장치
JP5960851B2 (ja) 2012-03-23 2016-08-02 ドルビー ラボラトリーズ ライセンシング コーポレイション 頭部伝達関数の線形混合による頭部伝達関数の生成のための方法およびシステム
JP5949270B2 (ja) * 2012-07-24 2016-07-06 富士通株式会社 オーディオ復号装置、オーディオ復号方法、オーディオ復号用コンピュータプログラム
WO2014105857A1 (en) 2012-12-27 2014-07-03 Dts, Inc. System and method for variable decorrelation of audio signals
JP2014175670A (ja) * 2013-03-05 2014-09-22 Nec Saitama Ltd 情報端末装置及び音響制御方法並びにプログラム
WO2014164361A1 (en) * 2013-03-13 2014-10-09 Dts Llc System and methods for processing stereo audio content
US10219093B2 (en) * 2013-03-14 2019-02-26 Michael Luna Mono-spatial audio processing to provide spatial messaging
CN108806704B (zh) * 2013-04-19 2023-06-06 韩国电子通信研究院 多信道音频信号处理装置及方法
CN108810793B (zh) 2013-04-19 2020-12-15 韩国电子通信研究院 多信道音频信号处理装置及方法
CN105308988B (zh) * 2013-05-02 2017-12-19 迪拉克研究公司 配置成转换音频输入通道用于头戴受话器收听的音频解码器
EP2830332A3 (en) 2013-07-22 2015-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method, signal processing unit, and computer program for mapping a plurality of input channels of an input channel configuration to output channels of an output channel configuration
EP2840811A1 (en) * 2013-07-22 2015-02-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for processing an audio signal; signal processing unit, binaural renderer, audio encoder and audio decoder
EP2830053A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-channel audio decoder, multi-channel audio encoder, methods and computer program using a residual-signal-based adjustment of a contribution of a decorrelated signal
EP2830051A3 (en) 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
US9319819B2 (en) 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
WO2015032009A1 (es) * 2013-09-09 2015-03-12 Recabal Guiraldes Pablo Método y sistema de tamaño reducido para la decodificación de señales de audio en señales de audio binaural
WO2015041477A1 (ko) 2013-09-17 2015-03-26 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
US10204630B2 (en) 2013-10-22 2019-02-12 Electronics And Telecommunications Research Instit Ute Method for generating filter for audio signal and parameterizing device therefor
DE102013223201B3 (de) * 2013-11-14 2015-05-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zum Komprimieren und Dekomprimieren von Schallfelddaten eines Gebietes
BR112016014892B1 (pt) 2013-12-23 2022-05-03 Gcoa Co., Ltd. Método e aparelho para processamento de sinal de áudio
CN104768121A (zh) 2014-01-03 2015-07-08 杜比实验室特许公司 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频
CN107770718B (zh) 2014-01-03 2020-01-17 杜比实验室特许公司 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频
EP3090573B1 (en) * 2014-04-29 2018-12-05 Dolby Laboratories Licensing Corporation Generating binaural audio in response to multi-channel audio using at least one feedback delay network
EP4294055A1 (en) * 2014-03-19 2023-12-20 Wilus Institute of Standards and Technology Inc. Audio signal processing method and apparatus
CN108966111B (zh) 2014-04-02 2021-10-26 韦勒斯标准与技术协会公司 音频信号处理方法和装置
WO2016028199A1 (en) * 2014-08-21 2016-02-25 Dirac Research Ab Personal multichannel audio precompensation controller design
CN104581602B (zh) * 2014-10-27 2019-09-27 广州酷狗计算机科技有限公司 录音数据训练方法、多轨音频环绕方法及装置
US9560467B2 (en) * 2014-11-11 2017-01-31 Google Inc. 3D immersive spatial audio systems and methods
PL3550859T3 (pl) * 2015-02-12 2022-01-10 Dolby Laboratories Licensing Corporation Wirtualizacja słuchawkowa
US9860666B2 (en) 2015-06-18 2018-01-02 Nokia Technologies Oy Binaural audio reproduction
EP3657822A1 (en) * 2015-10-09 2020-05-27 Sony Corporation Sound output device and sound generation method
JP6658026B2 (ja) * 2016-02-04 2020-03-04 株式会社Jvcケンウッド フィルタ生成装置、フィルタ生成方法、及び音像定位処理方法
KR102513586B1 (ko) * 2016-07-13 2023-03-27 삼성전자주식회사 전자 장치 및 전자 장치의 오디오 출력 방법
KR102531886B1 (ko) 2016-08-17 2023-05-16 삼성전자주식회사 전자장치 및 그 제어방법
KR102502383B1 (ko) 2017-03-27 2023-02-23 가우디오랩 주식회사 오디오 신호 처리 방법 및 장치
CN108665902B (zh) 2017-03-31 2020-12-01 华为技术有限公司 多声道信号的编解码方法和编解码器
CN110462731B (zh) * 2017-04-07 2023-07-04 迪拉克研究公司 一种用于音频应用的新颖的参数均衡
CN107205207B (zh) * 2017-05-17 2019-01-29 华南理工大学 一种基于中垂面特性的虚拟声像近似获取方法
CN107221337B (zh) * 2017-06-08 2018-08-31 腾讯科技(深圳)有限公司 数据滤波方法、多人语音通话方法以及相关设备
WO2019105575A1 (en) * 2017-12-01 2019-06-06 Nokia Technologies Oy Determination of spatial audio parameter encoding and associated decoding
US11395083B2 (en) * 2018-02-01 2022-07-19 Qualcomm Incorporated Scalable unified audio renderer
CN111886882A (zh) * 2018-03-19 2020-11-03 OeAW奥地利科学院 用于确定特定于收听者的头部相关传递函数的方法
KR20190124631A (ko) 2018-04-26 2019-11-05 제이엔씨 주식회사 액정 조성물 및 액정 표시 소자
EP3827599A1 (en) 2018-07-23 2021-06-02 Dolby Laboratories Licensing Corporation Rendering binaural audio over multiple near field transducers
CN109005496A (zh) * 2018-07-26 2018-12-14 西北工业大学 一种hrtf中垂面方位增强方法
KR102531634B1 (ko) * 2018-08-10 2023-05-11 삼성전자주식회사 오디오 장치 및 그 제어방법
DE102019107302A1 (de) * 2018-08-16 2020-02-20 Rheinisch-Westfälische Technische Hochschule (Rwth) Aachen Verfahren zum Erzeugen und Wiedergeben einer binauralen Aufnahme
CN110881164B (zh) * 2018-09-06 2021-01-26 宏碁股份有限公司 增益动态调节的音效控制方法及音效输出装置
CN113115175B (zh) * 2018-09-25 2022-05-10 Oppo广东移动通信有限公司 3d音效处理方法及相关产品
AU2019409705B2 (en) 2018-12-19 2023-04-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for reproducing a spatially extended sound source or apparatus and method for generating a bitstream from a spatially extended sound source
US12003945B2 (en) 2018-12-28 2024-06-04 Sony Group Corporation Audio reproduction device
WO2020151837A1 (en) * 2019-01-25 2020-07-30 Huawei Technologies Co., Ltd. Method and apparatus for processing a stereo signal
JP7270186B2 (ja) 2019-03-27 2023-05-10 パナソニックIpマネジメント株式会社 信号処理装置、音響再生システム、及び音響再生方法
CN111988703A (zh) * 2019-05-21 2020-11-24 北京中版超级立体信息科技有限公司 音频处理器及音频处理方法
JP7383942B2 (ja) * 2019-09-06 2023-11-21 ヤマハ株式会社 車載音響システムおよび車両
CN110853658B (zh) * 2019-11-26 2021-12-07 中国电影科学技术研究所 音频信号的下混方法、装置、计算机设备及可读存储介质
US10904690B1 (en) * 2019-12-15 2021-01-26 Nuvoton Technology Corporation Energy and phase correlated audio channels mixer
GB2590913A (en) * 2019-12-31 2021-07-14 Nokia Technologies Oy Spatial audio parameter encoding and associated decoding
CN111787465A (zh) * 2020-07-09 2020-10-16 瑞声科技(新加坡)有限公司 双声道设备的立体声效果检测方法
CN112019994B (zh) * 2020-08-12 2022-02-08 武汉理工大学 一种基于虚拟扬声器构建车内扩散声场环境的方法及装置
CN112731289B (zh) * 2020-12-10 2024-05-07 深港产学研基地(北京大学香港科技大学深圳研修院) 一种基于加权模板匹配的双耳声源定位方法和装置
JP2022152984A (ja) * 2021-03-29 2022-10-12 ヤマハ株式会社 オーディオミキサ及び音響信号の処理方法
CN113365189B (zh) * 2021-06-04 2022-08-05 上海傅硅电子科技有限公司 多声道无缝切换方法
GB2609667A (en) * 2021-08-13 2023-02-15 British Broadcasting Corp Audio rendering
WO2023059838A1 (en) * 2021-10-08 2023-04-13 Dolby Laboratories Licensing Corporation Headtracking adjusted binaural audio
CN114630240B (zh) * 2022-03-16 2024-01-16 北京小米移动软件有限公司 方向滤波器的生成方法、音频处理方法、装置及存储介质

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3040896C2 (de) * 1979-11-01 1986-08-28 Victor Company Of Japan, Ltd., Yokohama, Kanagawa Schaltungsanordnung zur Erzeugung und Aufbereitung stereophoner Signale aus einem monophonen Signal
US5371799A (en) * 1993-06-01 1994-12-06 Qsound Labs, Inc. Stereo headphone sound source localization system
JP4306815B2 (ja) 1996-03-04 2009-08-05 富士通株式会社 線形予測係数を用いた立体音響処理装置
US6236730B1 (en) * 1997-05-19 2001-05-22 Qsound Labs, Inc. Full sound enhancement using multi-input sound signals
KR20010030608A (ko) 1997-09-16 2001-04-16 레이크 테크놀로지 리미티드 청취자 주변의 음원의 공간화를 향상시키기 위한 스테레오헤드폰 디바이스에서의 필터링 효과의 이용
JPH11275696A (ja) 1998-01-22 1999-10-08 Sony Corp ヘッドホン、ヘッドホンアダプタおよびヘッドホン装置
JP2000069598A (ja) * 1998-08-24 2000-03-03 Victor Co Of Japan Ltd マルチチャンネルサラウンド再生装置及びマルチチヤンネルサラウンド再生における残響音生成方法
US6934676B2 (en) * 2001-05-11 2005-08-23 Nokia Mobile Phones Ltd. Method and system for inter-channel signal redundancy removal in perceptual audio coding
CN1552171A (zh) * 2001-09-06 2004-12-01 �ʼҷ����ֵ��ӹɷ����޹�˾ 音频再现设备
JP3682032B2 (ja) 2002-05-13 2005-08-10 株式会社ダイマジック オーディオ装置並びにその再生用プログラム
US7949141B2 (en) * 2003-11-12 2011-05-24 Dolby Laboratories Licensing Corporation Processing audio signals with head related transfer function filters and a reverberator
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
CN1930914B (zh) * 2004-03-04 2012-06-27 艾格瑞系统有限公司 对多声道音频信号进行编码和合成的方法和装置
RU2391714C2 (ru) 2004-07-14 2010-06-10 Конинклейке Филипс Электроникс Н.В. Преобразование аудиоканалов
KR100608024B1 (ko) * 2004-11-26 2006-08-02 삼성전자주식회사 다중 채널 오디오 입력 신호를 2채널 출력으로 재생하기위한 장치 및 방법과 이를 수행하기 위한 프로그램이기록된 기록매체
JP4414905B2 (ja) * 2005-02-03 2010-02-17 アルパイン株式会社 オーディオ装置
KR100619082B1 (ko) * 2005-07-20 2006-09-05 삼성전자주식회사 와이드 모노 사운드 재생 방법 및 시스템
KR101370365B1 (ko) * 2005-09-13 2014-03-05 코닌클리케 필립스 엔.브이. 3d 사운드를 발생시키기 위한 방법 및 디바이스
CN101390443B (zh) * 2006-02-21 2010-12-01 皇家飞利浦电子股份有限公司 音频编码和解码
KR100754220B1 (ko) * 2006-03-07 2007-09-03 삼성전자주식회사 Mpeg 서라운드를 위한 바이노럴 디코더 및 그 디코딩방법
EP1994796A1 (en) 2006-03-15 2008-11-26 Dolby Laboratories Licensing Corporation Binaural rendering using subband filters
PL1999999T3 (pl) * 2006-03-24 2012-07-31 Dolby Int Ab Generowanie downmixów przestrzennych na podstawie parametrycznych reprezentacji sygnałów wielokanałowych
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
FR2903562A1 (fr) * 2006-07-07 2008-01-11 France Telecom Spatialisation binaurale de donnees sonores encodees en compression.
US8488796B2 (en) * 2006-08-08 2013-07-16 Creative Technology Ltd 3D audio renderer
KR100763920B1 (ko) * 2006-08-09 2007-10-05 삼성전자주식회사 멀티채널 신호를 모노 또는 스테레오 신호로 압축한 입력신호를 2채널의 바이노럴 신호로 복호화하는 방법 및 장치
US20080273708A1 (en) * 2007-05-03 2008-11-06 Telefonaktiebolaget L M Ericsson (Publ) Early Reflection Method for Enhanced Externalization

Also Published As

Publication number Publication date
HK1156139A1 (en) 2012-06-01
RU2011105972A (ru) 2012-08-27
CN102172047B (zh) 2014-01-29
CN103634733A (zh) 2014-03-12
CA2732079A1 (en) 2010-02-04
ES2531422T3 (es) 2015-03-13
EP2384029B1 (en) 2014-09-10
CA2820199C (en) 2017-02-28
PL2384029T3 (pl) 2015-04-30
CN103634733B (zh) 2016-05-25
ES2531422T8 (es) 2015-09-03
KR101313516B1 (ko) 2013-10-01
ES2524391T3 (es) 2014-12-09
AU2009275418B9 (en) 2014-01-09
CN103561378B (zh) 2015-12-23
HK1164009A1 (en) 2012-09-14
CA2820208C (en) 2015-10-27
CN103561378A (zh) 2014-02-05
AU2009275418A1 (en) 2010-02-04
CA2820199A1 (en) 2010-02-04
JP2011529650A (ja) 2011-12-08
JP5860864B2 (ja) 2016-02-16
KR20110039545A (ko) 2011-04-19
CA2732079C (en) 2016-09-27
US9226089B2 (en) 2015-12-29
BRPI0911729B1 (pt) 2021-03-02
JP2014090464A (ja) 2014-05-15
ES2528006T3 (es) 2015-02-03
EP2384028A2 (en) 2011-11-02
PL2304975T3 (pl) 2015-03-31
BRPI0911729A2 (pt) 2019-06-04
CA2820208A1 (en) 2010-02-04
RU2505941C2 (ru) 2014-01-27
PL2384028T3 (pl) 2015-05-29
CN102172047A (zh) 2011-08-31
AU2009275418B2 (en) 2013-12-19
KR101354430B1 (ko) 2014-01-22
KR20130004373A (ko) 2013-01-09
WO2010012478A2 (en) 2010-02-04
EP2384028B1 (en) 2014-11-05
EP2384028A3 (en) 2012-10-24
EP2384029A2 (en) 2011-11-02
EP2384029A3 (en) 2012-10-24
KR101366997B1 (ko) 2014-02-24
EP2304975B1 (en) 2014-08-27
HK1163416A1 (en) 2012-09-07
WO2010012478A3 (en) 2010-04-08
KR20130004372A (ko) 2013-01-09
US20110211702A1 (en) 2011-09-01
EP2304975A2 (en) 2011-04-06

Similar Documents

Publication Publication Date Title
JP5860864B2 (ja) バイノーラル信号のための信号生成
CA2599969C (en) Device and method for generating an encoded stereo signal of an audio piece or audio data stream
JP5698189B2 (ja) オーディオ符号化
KR101358700B1 (ko) 오디오 인코딩 및 디코딩
KR20080078882A (ko) 입체 오디오 신호 디코딩
AU2013263871B2 (en) Signal generation for binaural signals
RU2427978C2 (ru) Кодирование и декодирование аудио
AU2015207815B2 (en) Signal generation for binaural signals

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130122

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20130417

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20130424

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130722

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130813

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131213

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20140224

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20140425

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20141126

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20141201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150302

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150310

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150508

R150 Certificate of patent or registration of utility model

Ref document number: 5746621

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250