JP5298199B2 - モノフォニック対応およびラウドスピーカ対応のバイノーラルフィルタ - Google Patents

モノフォニック対応およびラウドスピーカ対応のバイノーラルフィルタ Download PDF

Info

Publication number
JP5298199B2
JP5298199B2 JP2011529110A JP2011529110A JP5298199B2 JP 5298199 B2 JP5298199 B2 JP 5298199B2 JP 2011529110 A JP2011529110 A JP 2011529110A JP 2011529110 A JP2011529110 A JP 2011529110A JP 5298199 B2 JP5298199 B2 JP 5298199B2
Authority
JP
Japan
Prior art keywords
filter
binaural
sum
pair
reverberation time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011529110A
Other languages
English (en)
Other versions
JP2012503943A (ja
Inventor
ディキンス、グレン・エヌ
マクグラス、デビッド・エス
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Publication of JP2012503943A publication Critical patent/JP2012503943A/ja
Application granted granted Critical
Publication of JP5298199B2 publication Critical patent/JP5298199B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/305Electronic adaptation of stereophonic audio signals to reverberation of the listening space
    • H04S7/306For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)

Description

関連出願の相互参照
本出願は、参照によりその内容全体を本願明細書に組み込むものとする、2008年9月25日出願の米国特許仮出願第61/099,967号に対する優先権を主張する。
発明の分野
本開示は、全般的にはオーディオ信号の信号処理に関し、特に、出力がヘッドホンでも、モノフォニックでも、一組のスピーカを通してでも、再生可能であるように、バイノーラルフィルタによって空間化するためのオーディオ入力の処理に関する。
リスニングルーム内の所定位置に配置された複数の仮想スピーカからのサウンドを聴いているという印象を受聴者にもたらすように、ヘッドホンを通して再生される1つ以上のオーディオ入力信号から成る信号セットを処理することは公知である。本願明細書においては、このような処理を空間化およびバイノーラル化と称する。本願明細書においては、オーディオ入力信号を処理するフィルタをバイノーラルフィルタと称する。このような処理がなければ、ヘッドホンを通して聴いている受聴者は、そのサウンドが受聴者の頭の内部にあるという印象を持つであろう。このオーディオ入力信号は、単一の信号、ステレオ再生用の一対の信号、複数のサラウンドサウンド信号、例えば、4.1サラウンドサウンド用の4つのオーディオ入力信号、5.1用の5つのオーディオ入力信号、7.1用の7つのオーディオ入力信号など、でもよく、さらに特定の音源のような、複数の特定位置に対応する個々の信号を含んでもよい。空間化される各オーディオ入力信号に対して、一対のバイノーラルフィルタが存在する。リアルな再生のために、バイノーラルフィルタは、各仮想スピーカから左耳および右耳のそれぞれへの頭部伝達関数(HRTF:head related transfer function)を考慮すると共に、シミュレートされるリスニングルームの初期反響と残響応答の両方も考慮する。
このように、ヘッドホンを通して受聴するための一対のオーディオ出力信号、すなわちバイノーラル化された信号、を生成するために、バイノーラルフィルタによって信号を前処理することは公知である。
バイノーラル化された信号を単一のスピーカを通して、すなわち信号をモノフォニック再生用に電子的にダウンミックスすることによってモノフォニックで、聴きたいと思われる場合も多い。一例は、モバイル機器のモノフォニックラウドスピーカを通しての受聴である。さらに、狭い間隔で配置された一対のラウドスピーカを通してこのようなサウンドを聴きたいと思われる場合も多い。後者の場合、バイノーラル化された出力信号は、電子的にではなく、オーディオクロストークによってミックスダウンされる。どちらの場合も、バイノーラル化後にミックスダウンされた信号の響きは不自然であり、特に、残響が響くため、了解度とオーディオの明晰さが下がる。バイノーラル化されたオーディオにおける空間および距離の印象を損なわずに、この問題を排除することは難しい。
本発明の複数の実施形態は、方法と、装置と、プログラムロジック、例えば実行されたときに本方法の実施を引き起こす、コンピュータ可読媒体内にコード化されたプログラムロジック、とを含む。1つの方法は、1つ以上のオーディオ入力の仮想空間化を実現するために、ヘッドホンを通して再生される1つ以上のオーディオ入力信号をバイノーラルフィルタを用いて処理する方法であり、ダウンミックス後のモノフォニック再生時に、または相対的に狭い間隔で配置された複数のラウドスピーカを通して再生されたときに、バイノーラル化された信号が良好に響くという追加の特性をさらに提供する。別の方法は、1つ以上のオーディオ入力信号を一対以上の修正されたバイノーラルフィルタの特性を有する一対以上のバイノーラルフィルタによってそれぞれバイノーラル化したときに、バイノーラル化された信号が1つ以上のオーディオ入力の仮想空間化を実現すると共に、バイノーラル化された信号のダウンミックス後のモノフォニック再生時に、または相対的に狭い間隔で配置された複数のラウドスピーカを介して再生されたときに、良好に響くという追加の特性を有するように、一対以上の修正されたバイノーラルフィルタの特性、例えば、修正されたバイノーラルフィルタのインパルス応答、を求めるために、対応する一対以上のバイノーラルフィルタの特性、例えばバイノーラルフィルタのインパルス応答、を処理するためのデータ処理システムを動作させる方法である。
特定の複数の実施形態は、1つ以上のオーディオ入力信号から成るオーディオ入力信号セットをバイノーラル化するための装置を含む。この装置は、一対以上のベースバイノーラルフィルタによって特徴付けられる一対のバイノーラルフィルタを含み、各オーディオ信号入力に一対のベースバイノーラルフィルタが対応する。各ベースバイノーラルフィルタ対は、左耳のベースフィルタと右耳のベースフィルタとによって表され、さらにベース和フィルタとベース差フィルタとによって表される。各フィルタは、それぞれのインパルス応答によって特徴付けられる。
少なくとも一対のベースバイノーラルフィルタは、受聴者への直接応答を対応する仮想スピーカ位置から取り込むために、およびリスニングルームの初期反響と残響応答の両方を取り込むために、対応するオーディオ信号入力を空間化するように構成される。
少なくとも一対のベースバイノーラルフィルタについては、
・ ベース和フィルタの時間周波数特性は、ベース差フィルタの時間周波数特性とは大幅に異なり、ベース和フィルタ長は、あらゆる周波数において、ベース差フィルタ長、左耳ベースフィルタ長、および右耳ベースフィルタ長より大幅に短い。
・ ベース和フィルタ長は、左耳ベースフィルタ長または右耳ベースフィルタ長の複数の周波数にわたる変化に比べ、さまざまな周波数にわたって大きく変化し、ベース和フィルタ長は、周波数の増加に伴い減少する。
本装置は、ヘッドホンを通して、またはモノフォニックミックス後のモノフォニックで、再生可能な出力信号を生成する。
一部の実施形態において、少なくとも一対のベースバイノーラルフィルタについては、ベース和フィルタのインパルス応答の非有意レベルへの移行は、ベース和フィルタのインパルス応答の初期期間にわたって周波数依存的に経時的に徐々に起こる。
一部の実施形態において、少なくとも一対のベースバイノーラルフィルタについては、ベース和フィルタは、この移行期間にわたって初期の全帯域幅から低域カットオフに向けて周波数成分が減少する。例えば、少なくとも一対のベースバイノーラルフィルタについては、この移行期間は、ベース和フィルタのインパルス応答が約3msまでの全帯域幅から約40msにおける100Hz未満に移行するようになっている。
一部の実施形態において、少なくとも一対のベースバイノーラルフィルタについては、10kHz超の高周波数におけるベース差フィルタ長は40ms未満であり、3kHzと4kHzの間の周波数におけるベース差フィルタ長は100ms未満であり、2kHz未満の周波数におけるベース差フィルタ長は160ms未満である。これらの実施形態の一部において、10kHz超の高周波数におけるベース差フィルタ長は20ms未満であり、3kHzと4kHzの間の周波数におけるベース差フィルタ長は60ms未満であり、2kHz未満の周波数におけるベース差フィルタ長は120ms未満である。これらの実施形態の一部において、10kHz超の高周波数におけるベース差フィルタ長は10ms未満であり、3kHzと4kHzの間の周波数におけるベース差フィルタ長は40ms未満であり、2kHz未満の周波数におけるベース差フィルタ長は80ms未満である。
一部の実施形態において、少なくとも一対のベースバイノーラルフィルタについては、ベース差フィルタ長は約800ms未満である。これらの実施形態の一部において、ベース差フィルタ長は約400ms未満である。これらの実施形態の一部において、ベース差フィルタ長は約200ms未満である。
一部の実施形態において、少なくとも一対のベースバイノーラルフィルタについては、ベース和フィルタ長は周波数の増加に伴い減少し、100Hz未満のあらゆる周波数におけるベース和フィルタ長は40ms以上160ms以下であり、100Hzと1kHzの間のあらゆる周波数におけるベース和フィルタ長は20ms以上80ms以下であり、1kHzと2kHzの間のあらゆる周波数におけるベース和フィルタ長は10ms以上20ms以下であり、2kHzと20kHzの間のあらゆる周波数におけるベース和フィルタ長は5ms以上20ms以下である。これらの実施形態の一部において、100Hz未満のあらゆる周波数におけるベース和フィルタ長は60ms以上120ms以下であり、100Hzと1kHzの間のあらゆる周波数におけるベース和フィルタ長は30ms以上60ms以下であり、1kHzと2kHzの間のあらゆる周波数におけるベース和フィルタ長は15ms以上30ms以下であり、2kHzと20kHzの間のあらゆる周波数におけるベース和フィルタ長は7ms以上15ms以下である。さらに、これらの実施形態の一部において、100Hz未満のあらゆる周波数におけるベース和フィルタ長は70ms以上90ms以下であり、100Hzと1kHzの間のあらゆる周波数におけるベース和フィルタ長は35ms以上50ms以下であり、1kHzと2kHzの間のあらゆる周波数におけるベース和フィルタ長は18ms以上25ms以下であり、2kHzと20kHzの間のあらゆる周波数におけるベース和フィルタ長は8ms以上12ms以下である。
一部の実施形態において、少なくとも一対のベースバイノーラルフィルタについては、ベースバイノーラルフィルタの特性は、整合される一対のバイノーラルフィルタの特性から決まる。このような実施形態の一部において、少なくとも一対のベースバイノーラルフィルタについては、ベース差フィルタのインパルス応答は、後期において、整合されるバイノーラルフィルタの差フィルタにほぼ比例する。例えば、ベース差フィルタのインパルス応答は、40ms後に、整合されるバイノーラルフィルタの差フィルタにほぼ比例する。
特定の複数の実施形態は、1つ以上のオーディオ入力信号から成るオーディオ入力信号セットをバイノーラル化する方法を含む。この方法は、一対以上のベースバイノーラルフィルタによって特徴付けられるバイノーラライザによってオーディオ入力信号セットをフィルタリングするステップを含む。ベースバイノーラルフィルタは、さまざまな実施形態において、この「発明の概要」節における特定の装置実施形態の説明で上述したとおりである。
特定の複数の実施形態は、信号処理装置を動作させる方法を含む。この方法は、オーディオ信号をバイノーラル化するように構成された一対の整合されるバイノーラルフィルタのインパルス応答を表す対応する一対の信号を受け付けるステップと、時変フィルタ特性を有する修正フィルタによって各フィルタが特徴付けられる一対のフィルタによって、受け付けた信号セットを処理するステップと、を含む。この処理は、一対の修正されたバイノーラルフィルタのインパルス応答を表す、対応する一対の修正された信号を形成する。修正されたバイノーラルフィルタは、オーディオ信号をバイノーラル化するように構成され、かつモノフォニックミックスダウンにおいて知覚される残響が小さく、ヘッドホン経由のバイノーラルフィルタに対する影響も最小であるという特性をさらに有する。
一部の実施形態において、修正されたバイノーラルフィルタは、修正された和フィルタと修正された差フィルタとによって特徴付けられる。時変フィルタは、修正されたバイノーラルフィルタのインパルス応答が、所定位置にある仮想スピーカを聴いている受聴者に対する頭部伝達関数によって規定される直接部分を含むように構成される。さらに、修正された和フィルタは、修正された差フィルタに比べ、大幅に低減されたレベルと大幅に短い残響時間とを有し、和フィルタのインパルス応答の直接部分から和フィルタの無視しうるほど小さい応答部分への滑らかな移行があり、この滑らかな移行は周波数選択的に経時的に起こる。
さまざまな実施形態において、修正されたバイノーラルフィルタは、この「発明の概要」節で特定の装置実施形態に関して上述したベースバイノーラルフィルタの特性を有する。
特定の複数の実施形態は、信号処理装置を動作させる方法を含む。この方法は、オーディオ信号をバイノーラル化するように構成された左耳および右耳バイノーラルフィルタのインパルス応答を表す、対応する左耳信号と右耳信号とを受け付けるステップを含む。この方法は、左耳信号と右耳信号の和に比例する和信号と、左耳信号と右耳信号の間の差に比例する差信号とを形成するために、左耳信号と右耳信号とをシャフリングするステップをさらに含む。この方法は、時変フィルタ特性を有する和フィルタによって和信号をフィルタリングしてフィルタリングされた和信号を形成し、和フィルタによって特徴付けられる差フィルタによって差信号を処理してフィルタリングされた差信号を形成するステップとをさらに含む。この方法は、修正された左耳および右耳バイノーラルフィルタのインパルス応答を表す、対応する修正された左耳信号と修正された右耳信号とを形成するために、フィルタリングされた和信号とフィルタリングされた差信号とをアンシャフリングするステップをさらに含む。修正されたバイノーラルフィルタは、オーディオ信号をバイノーラル化するように構成され、かつ修正された和フィルタと修正された差フィルタとによって表現可能である。さまざまな実施形態において、修正されたバイノーラルフィルタは、この「発明の概要」節で特定の装置実施形態に関して上述したベースバイノーラルフィルタの特性を有する。
特定の複数の実施形態は、処理システムの少なくとも1つのプロセッサによって実行されたときに、この「発明の概要」節で特定の装置実施形態に関して上述した方法実施形態の何れかの実施を引き起こすプログラムロジックを含む。
特定の複数の実施形態は、処理システムの少なくとも1つのプロセッサによって実行されたときに、この「発明の概要」節で特定の装置実施形態に関して上述した方法実施形態の何れかの実施を引き起こすプログラムロジックを収容したコンピュータ可読媒体を含む。
特定の複数の実施形態は、装置を含む。この装置は、少なくとも1つのプロセッサと記憶デバイスとを有する処理システムを備える。この記憶デバイスは、実行されたときに、この「発明の概要」節で特定の装置実施形態に関して上述した方法実施形態の何れかを装置に実施させるプログラムロジックと共に構成される。
特定の複数の実施形態は、これらの側面、特徴、または利点の全てまたは一部を提供する場合も、一切提供しない場合もある。特定の複数の実施形態は、他の側面、特徴、または利点を1つ以上提供することもあり、これらのうちの1つ以上は、本願明細書に含まれる図、説明、および特許請求の範囲から当業者には容易に明らかになるかもしれない。
本発明の一実施形態を含む、単一の入力信号を処理するための一対のバイノーラルフィルタを含むバイノーラライザの簡略ブロック図を示す。 本発明の一実施形態を含む、対応する1つ以上の入力信号を処理するための一対以上のバイノーラルフィルタを含むバイノーラライザの簡略ブロック図を示す。 本発明の一実施形態を含みうる、1つ以上のオーディオ入力信号を有し、モノフォニックミックスにミックスダウンされる左耳および右耳用出力信号を生成するバイノーラライザの簡略ブロック図を示す。 シャフリング操作と、その後の、本発明の一実施形態を含みうるバイノーラルフィルタ対による和および差フィルタリングと、その後のデシャフリング操作とを示す。 本発明の一実施形態を含みうるバイノーラルフィルタのインパルス応答を表す左および右入力信号に対するシャフリング操作と、その後のデシャフリング操作とを示す。 バイノーラルフィルタのインパルス応答の一例を示す。 整合されるバイノーラル化特性を有するバイノーラルフィルタのインパルス応答を表す一対の入力信号を操作する信号処理装置の実施形態の簡略ブロック図を示す。この処理装置は、本発明の1つ以上の側面によると、バイノーラル化と自然な響きのモノフォニックミックスの生成とが可能なバイノーラルフィルタのインパルス応答を表す信号を出力するように構成される。 バイノーラルインパルス応答を発生させるために図6のような信号処理装置を動作させる方法の一実施形態の簡略フローチャートを示す。 バイノーラルフィルタのインパルス応答を表す一対の信号をバイノーラルフィルタの修正されたインパルス応答を表す信号に変換する方法の一実施形態を実施するMATLAB(マサチューセッツ州ネイティックのマスワークス社)構文のコードの一部を示す。 一組のさまざまな時点のそれぞれにおけるインパルスに対する図6の装置実施形態と図7の方法実施形態とに用いられる時変フィルタのインパルス応答のプロットを示す。 一組のさまざまな時点のそれぞれにおける図6の装置実施形態及び図7の方法実施形態とに用いられる時変フィルタの周波数応答の大きさのプロットを示す。 元の左耳バイノーラルフィルタのインパルス応答と、本発明の一実施形態による左耳バイノーラルフィルタのインパルス応答とを示す。 元のバイノーラル化和フィルタのインパルス応答と、本発明の一実施形態によるバイノーラル化和フィルタのインパルス応答とを示す。 元のバイノーラル化差フィルタのインパルス応答と、本発明の一実施形態によるバイノーラル化差フィルタのインパルス応答とを示す。 本発明の一例示的実施形態のバイノーラルフィルタ対のフィルタのインパルス応答の長さに沿った一期間における和および差フィルタの応答におけるエネルギーのプロットを周波数の関数として示す。 本発明の一例示的実施形態のバイノーラルフィルタ対のフィルタのインパルス応答の長さに沿った別の期間における和および差フィルタの応答におけるエネルギーのプロットを周波数の関数として示す。 本発明の一例示的実施形態のバイノーラルフィルタ対のフィルタのインパルス応答の長さに沿った別の期間における和および差フィルタの応答におけるエネルギーのプロットを周波数の関数として示す。 本発明の一例示的実施形態のバイノーラルフィルタ対のフィルタのインパルス応答の長さに沿った別の期間における和および差フィルタの応答におけるエネルギーのプロットを周波数の関数として示す。 本発明の一例示的実施形態のバイノーラルフィルタ対のフィルタのインパルス応答の長さに沿った別の期間における和および差フィルタの応答におけるエネルギーのプロットを周波数の関数として示す。 本発明の一例示的実施形態のバイノーラルフィルタ対の和フィルタのインパルス応答にそれぞれ対応する時間周波数平面上の等減衰量等高線を示す。 本発明の一例示的実施形態のバイノーラルフィルタ対の周波数フィルタのインパルス応答にそれぞれ対応する時間周波数平面上の等減衰量等高線を示す。 本発明の一例示的実施形態のバイノーラルフィルタ対の和フィルタのインパルス応答の時間周波数プロット、すなわちスペクトログラム、の表面の等角図を示す。 本発明の一例示的実施形態のバイノーラルフィルタ対の周波数フィルタのインパルス応答の時間周波数プロット、すなわちスペクトログラム、の表面の等角図を示す。 図16Aと同じ時間周波数プロットの表面の等角図であるが、一般的なバイノーラルフィルタ対、特に、図16Aに用いられているバイノーラルフィルタ、の和フィルタのインパルス応答の等角図を示す。 図16Bと同じ時間周波数プロットの表面の等角図であるが、一般的なバイノーラルフィルタ対、特に、図16Bに用いられているバイノーラルフィルタ、の周波数フィルタのインパルス応答の等角図を示す。 本発明の複数の側面による一組のオーディオ入力信号を処理するように構成されたオーディオ処理装置の実装の一形態を示す。 5つのチャンネルのオーディオ情報を受け付けるバイノーラル化装置の一実施形態の簡略ブロック図を示す。 4つのチャンネルのオーディオ情報を受け付けるバイノーラル化装置の一実施形態の簡略ブロック図を示す。
バイノーラルフィルタおよび表記法
図1は、単一の入力信号を処理するための一対のバイノーラルフィルタ103、104を含むバイノーラライザ101の簡略ブロック図を示す。バイノーラルフィルタは当該技術分野で周知であるが、本願明細書に記載のモノフォニック再生の特徴を含むバイノーラルフィルタは従来技術ではない。
この説明を続けるために、一部の表記法を紹介する。説明を簡潔にするために、本願明細書においては、信号は連続的な時間関数として表される。ただし、この枠組みは、離散時間信号、すなわち適切に標本化および量子化された信号、にも同様によく当てはまることは信号処理分野の当業者には明らかなはずである。このような信号は、一般に、標本化された時点を表す整数のインデックスによって示される。畳み込み積分は畳み込み和などになる。さらに、記載の各フィルタは、時間領域または周波数領域のどちらか一方に、あるいはこれらの組み合わせにも、実装可能であり、さらに有限インパルス応答FIR(finite impulse response)による実装、再帰型無限インパルス応答(IIR:infinite impulse response)による近似、時間遅延などとしても実装可能であることを当業者は理解されるであろう。これらの詳細については、本明細書から省かれている。
さらに、記載の各方法は、通常、任意の数の入力ソース信号に適用可能であり、容易に一般化される。なお、この説明および定式化は、個別化された何れか特定の頭部伝達関数セットに固有のものではなく、あるいは何れか特定の合成された、または全般的な、頭部伝達関数に固有なものでもないことに留意すべきである。この手法は、所望される如何なるバイノーラル応答にも適用可能である。
図1を参照すると、ヘッドホン105を通したバイノーラルレンダリングのためにバイノーラライザ101によってバイノーラル化される単一のオーディオ信号がu(t)で示され、リスニングルーム内の受聴者107の左耳および右耳に対するバイノーラルフィルタのインパルス応答がそれぞれh(t)およびh(t)で示されている。バイノーラライザは、音源、すなわち所定の位置にある「仮想ラウドスピーカ」109、から来る信号u(t)の響きを聴いている感覚を受聴者105にもたらすように設計される。
バイノーラルフィルタ103および104の適切な設計によってこのような音源の仮想的な空間定位を実現するためのバイノーラルフィルタの設計、近似、および実装に関する従来技術は多数存在する。これらのフィルタは、スピーカ109が完全な無響室に存在するかのように各耳の頭部伝達関数(HRTF)を考慮に入れる、すなわち仮想スピーカ109からの直接受聴の空間寸法を考慮に入れ、さらには受聴環境における初期反射と残響の両方を考慮に入れる。いくつかのバイノーラルフィルタの設計方法に関する詳細については、例えば国際公開第9914983号として公開された「ステレオヘッドホンデバイスにおけるフィルタリング効果の利用(UTILIZATION OF FILTERING EFFECTS IN STEREO HEADPHONE DEVICES)」と題される国際出願PCT/AU98/00769号および国際公開第9949574号として公開された「オーディオ信号処理方法および装置(AUDIO SIGNAL PROCESSING METHOD AND APPARATUS)」と題される国際出願PCT/AU99/00002号を参照されたい。これらの出願の各々は米国を指定国としている。国際公開第9914983号および国際公開第9949574号の各公開内容は、参照により本願明細書に組み込まれるものとする。
したがって、ヘッドホン用にバイノーラル化された複数の信号を利用可能であることもある。これらの信号のバイノーラル化処理は、さまざまな種類の部屋においてコンテンツ受聴感を受聴者にもたらすように設けられた1つ以上の所定のバイノーラルフィルタにより可能である。商用バイノーラル化の1つは、DOLBY HEADPHONE(商標)として公知である。DOLBY HEADPHONEのバイノーラル化におけるバイノーラルフィルタ対は、空間的広がりのない1つの共通の残響尾部を有するインパルス応答をそれぞれ有する。さらに、DOLBY HEADPHONEの一部の実装は、単一の一般的なリスニングルームを表す単一のバイノーラルフィルタセットのみを提供し、他の実装は、DH1、DH2、およびDH3で示される3つの異なるバイノーラルフィルタセットのうちの1つを用いてバイノーラル化を行える。これらは、以下の特性を有する。
・ DH1は、映画および音楽のみの録音の両方に適した小さな、よく吸音される部屋での受聴感をもたらす。
・ DH2は、音楽の受聴に特に適した、より音響的にライブな部屋での受聴感をもたらす。
・ DH3は、より大きな部屋、すなわちコンサートホールまたは映画館により近い部屋、での受聴感をもたらす。
畳み込み動作を
Figure 0005298199
で示す。すなわち、a(t)およびb(t)の畳み込みは、次のように示される。
Figure 0005298199
式中、時間依存性は左辺に明示的には示されていないが、英字の使用により暗示されるであろう。非時間依存量は、明確に示されるであろう。
バイノーラル出力は、v(t)で示される左出力信号とv(t)で示される右耳信号とを含む。バイノーラル出力は、ソース信号u(t)とバイノーラルフィルタ103、104の左右のインパルス応答との畳み込みによって生成される。
Figure 0005298199
図1は、単一の入力オーディオ信号を示す。図2は、u(t)、u(t)、...、u(t)で示される1つ以上のオーディオ入力信号を有するバイノーラライザの簡略ブロック図を示す。ここで、Mは入力オーディオ信号の数である。Mは、1またはそれ以上にすることができる。M=2はステレオ再生用であり、これより大きな数はサラウンドサウンド信号用であり、例えば、M=4は4.1サラウンドサウンド用、M=5は5.1サラウンドサウンド用、M=7は7.1サラウンドサウンド用などである。複数の音源を有することもできる。例えば、通常のバックグラウンドのための複数の入力に加え、環境内で喋っている人々など、特定の音源を配置するための1つ以上の入力を有することもできる。空間化される各オーディオ入力信号に対して、一対のバイノーラルフィルタが存在する。リアルな再生のために、バイノーラルフィルタは、各仮想スピーカ位置と左右の耳とに関するそれぞれの頭部伝達関数(HRTF)を考慮に入れ、さらにシミュレートされるリスニングルームの初期反響と残響応答の両方を考慮に入れる。図示のバイノーラライザのための左右のバイノーラルフィルタは、インパルス応答h1L(t)およびh1R(t)、h2L(t)およびh2R(t)、...、hML(t)およびhMR(t)をそれぞれ有する左耳バイノーラライザおよび右の各バイノーラライザ203−1および204−1、203−2および204−2、...、203−Mおよび204−Mを含む。出力v(t)およびv(t)を生成するために、加算器205および206によって左耳および右耳出力が加算される。
仮想スピーカの数はMで示されている。このようなスピーカは、図2の対応するM位置にスピーカ209−1、209−2、...、209−Mとして示されている。一般にはM=Mであるが、これは必須ではない。例えば、一対のステレオ入力信号を空間化するアップミキシングを組み込むことによって、ヘッドホンを装着している受聴者に、あたかも5つの仮想ラウドスピーカがあるかのように響かせることもできる。
本願明細書の説明においては、一対のバイノーラルフィルタの特性と操作とについて述べる。このようなバイノーラルフィルタ対の特性と操作とは、図2に示すような構成の各バイノーラルフィルタ対に適用されることを当業者は理解するであろう。
図3は、1つ以上のオーディオ入力信号を有し、左出力信号v(t)と、v(t)で示される右耳信号とを生成するバイノーラライザ303の簡略ブロック図を示す。左耳信号v(t)と、v(t)で示される右耳信号とのそれぞれに対して一部フィルタリングを行い、フィルタリングされた信号同士を加算すなわち混合するダウンミキサー305によって得られた左右の出力信号のモノフォニックミックスダウンがv(t)で示されている。以下の説明は、単一の入力u(t)を想定する。ダウンミキサー305の左右の出力信号に対するフィルタ307および308のインパルス応答をそれぞれm(t)およびm(t)で示す。以下の説明は、単一の入力u(t)を想定する。同様の操作がこのような入力のそれぞれに対して行われる。次に、このモノフォニックミックスダウンは、
Figure 0005298199
理想的なモノフォニック対応のためには、モノフォニックミックスが初期信号u(t)と同じである(またはこれに比例している)ことが望ましい。すなわち、v(t)=αu(t)。ここで、αは何らかの変倍率定数である。これを適用するために、α=1であると想定すると、次の恒等式を理論上適用する必要があるであろう。
Figure 0005298199
式中、δ(t)は、
Figure 0005298199
になるように規定される単位元の積分核であり、ディラックのデルタ関数とも呼ばれる。離散処理において、所望される結果は、
Figure 0005298199
− 各インパルス応答は離散関数 − が単位インパルス応答に比例することである。勿論、実際の実装においては、計算に時間がかかるため、実際の因果性フィルタを用いて実装するには、「完全な」モノフォニック対応のための要件は、
Figure 0005298199
が単位インパルスの時間遅延されて変倍された形になることである。
単純なモノフォニックミキシングの場合は、m(t)=m(t)=δ(t)である。すなわち、
Figure 0005298199
したがって、単純なモノフォニックミキシングの場合、バイノーラル化された出力のモノフォニックミックスを完全に再生するには、理想的には、
(t)+h(t)=δ(t)。 (5)
(t)およびh(t)は、良好なバイノーラル化をもたらすことが望ましい。すなわち、これらの出力のレンダリングは、あたかもそのサウンドが本当のリスニングルームにおいて仮想スピーカ位置(単数または複数)から出ているように、ヘッドホンを通して自然に響くことが望ましい。さらに、バイノーラル出力のモノフォニックミックスは、レンダリング時にオーディオ入力u(t)のように響くことが望ましい。
オーディオ信号処理の当業者は、和チャンネルと差チャンネルとを生成するために、最初に左右のバイノーラル信号のシャフリングを行うことによって一組のステレオ信号に対するバイノーラルフィルタリング操作を表現することに精通しているであろう。
理想的には、左入力および右ステレオまたはバイノーラル入力u(t)およびu(t)に対して、u(t)およびu(t)で示される和信号および差信号は、
Figure 0005298199
逆の関係もシャフリング操作によって行われる。
Figure 0005298199
シャフリングによって、バイノーラルフィルタのインパルス応答を、バイノーラルフィルタリングされた和および差信号v(t)、v(t)を生成する、インパルス応答h(t)を有する和フィルタと、インパルス応答h(t)を有する差フィルタとして表現できる。すなわち、
Figure 0005298199
式中、
Figure 0005298199
左耳および右耳バイノーラルフィルタのインパルス応答間の逆の関係も次のシャフリング操作によって実現される。
Figure 0005298199
この説明では、左耳および右耳バイノーラルフィルタh(t)およびh(t)に関連付けられた、インパルス応答h(t)を有する和フィルタおよびインパルス応答h(t)を有する差フィルタの特性について述べる。これらの和および差フィルタは、各バイノーラルフィルタ対に対して規定される。ステレオ入力については、単に例示のために上で述べた。勿論、和および差フィルタの存在は、ステレオ入力または何れか特定数の入力の存在に依存するものではない。各バイノーラルフィルタ対に対して、和および差フィルタが規定される。
図4Aは、左耳のバイノーラル信号出力v(t)と右耳のバイノーラル信号出力v(t)とを生成するための、左耳のステレオ信号u(t)と右耳のステレオ信号u(t)とに対するシャフラ401によるシャフリング操作、その後の和フィルタのインパルス応答および差フィルタのインパルス応答h(t)およびh(t)をそれぞれ有する和フィルタ403および差フィルタ404、およびその後のデシャフラ405、すなわち基本的に各信号のシャフラおよびハーバー、の簡略ブロック図を示す。
インパルス応答は時間信号であるため、すなわち単位インパルス入力に対する応答であるため、インパルス応答に対するフィルタリングおよび他の信号処理操作は他の如何なる信号とも同様に実行可能である。図4Bは、和フィルタのバイノーラルインパルス応答h(t)と差フィルタのバイノーラルインパルス応答h(t)とを生成するためのシャフラ401による左耳バイノーラルフィルタのインパルス応答h(t)と右耳バイノーラルフィルタのインパルス応答h(t)とに対するシャフリング操作の簡略ブロック図を示す。左耳バイノーラルフィルタのインパルス応答h(t)と右耳バイノーラルフィルタのインパルス応答h(t)とを返すためのデシャフラ405、すなわち基本的にはシャフラとハーバー、によるデシャフリングも示されている。
なお、線形性のために、実際には多くの場合、√2係数はシャフリングから除外され、アンシャフリングされた出力に変倍係数2が加えられることに注目されたい。したがって、一部の実施形態においては、
Figure 0005298199
および
Figure 0005298199
したがって、当業者には明らかなように、本願明細書の説明においては、あらゆる数量が適宜変倍可能である。
バイノーラルフィルタの設計
本発明の特定の実施形態は、用意された一対のバイノーラルフィルタの特性を修正して一対の修正されたバイノーラルフィルタの特性を求めるために、信号処理装置を動作させる方法を含む。本方法の1つの実施形態は、1つのオーディオ信号をバイノーラル化するように構成された、対応する一対のバイノーラルフィルタのインパルス応答を表す一対の信号を受け付けるステップを含む。本方法は、この受け付けられた一対の信号を、時変フィルタ特性を有する修正フィルタによって各フィルタが特徴付けられる、一対のフィルタによって処理することによって、対応する一対の修正されたバイノーラルフィルタのインパルス応答を表す一対の修正された信号を形成する。修正された各バイノーラルフィルタは、1つのオーディオ信号をバイノーラル化して一対のバイノーラル化された信号にするように構成され、かつバイノーラル化された信号のモノフォニックミックスが受聴者に自然に響くという特性をさらに有する。
左耳および右耳のインパルス応答h(t)およびh(t)をそれぞれ有する一組のバイノーラルフィルタを考えてみる。上記のように、式(3)に記述されているようなモノフォニックミックスの場合、理想的な完全モノフォニック対応のためには、理想的には、如何なる比例定数も無視して、以下の恒等式を適用する必要があるであろう。
Figure 0005298199
単純なモノフォニックミキシングの場合は、理想的には、
(t)+h(t)=δ(t)。 (5)
発明者らは、レンダリング時にバイノーラル出力のモノフォニックミックスがオーディオ入力u(t)のように響く特性を「モノフォニック再生対応」または単に「モノフォニック対応」と称する。モノフォニック再生対応に加え、h(t)およびh(t)が良好なバイノーラル化をもたらす、すなわち出力のレンダリングが、あたかもそのサウンドが本物のリスニングルームにおいて仮想スピーカ位置(単数または複数)から出ているかのように、ヘッドホンを介して自然に響くことが望ましい。さらに、バイノーラル化されたオーディオは、さまざまな仮想スピーカ位置、ひいてはさまざまなバイノーラルフィルタ対、によって混合されるいくつかの異なるオーディオ入力源を含むケースに対応することが望ましい。モノフォニックフィルタは簡単に実装可能であることが望ましく、かつステレオコンテンツのモノフォニックダウンミキシングのための一般慣行に対応することが好ましいであろう。式(5)の拘束は、通常、バイノーラルインパルス応答の指向性および距離特性に大きな影響を及ぼさずには可能ではない。これは、フィルタのインパルス応答の初期インパルスまたはタップ以外では、t>0においてh(t)=−h(t)であることを暗示する。換言すると、バイノーラルフィルタをインパルス応答h(t)およびh(t)を有する和および差フィルタとして表すと、t>0においてh(t)=0である。
この拘束を、バイノーラル応答に大きな影響を及ぼさずに、何れかの方法によって実現しうることは直ちには分からない。このためには、バイノーラルインパルス応答の大部分が相関係数−1を有する必要がある。すなわち、インパルス応答は同じになるが、符号が逆になる。
図5は、一般的なバイノーラルフィルタのインパルス応答、例えば和フィルタのインパルス応答h(t)、または左耳または右耳バイノーラルフィルタのどちらか一方のインパルス応答、を簡略化された形態で示す。このような音響インパルス応答の一般的な形態は、直接音と、いくらかの初期反射と、狭い間隔で隔てられた複数の反射で構成される、ひいては拡散残響によってよく近似される、応答の後期部分とを含む。
ある人にインパルス応答hL0(t)およびhR0(t)をそれぞれ有する左耳および右耳バイノーラルフィルタが用意されていると想定し、これらが申し分ないバイノーラル化をもたらすと想定する。本発明の一側面は、インパルス応答h(t)およびh(t)によって規定される、申し分ないバイノーラル化をもたらす一組のバイノーラルフィルタであり、例えば、所与の一組のフィルタhL0(t)およびhR0(t)と同様であるが、その出力がモノフォニック信号へのミックスダウン時にも良好に響く一組のバイノーラルフィルタである。次に、h(t)およびh(t)がhL0(t)およびhR0(t)に如何に匹敵するかについて、また所与のhL0(t)およびhR0(t)に対して如何にh(t)およびh(t)を設計するかについて述べる。
直接応答部分
左耳および右耳のバイノーラルインパルス応答の各々において、直接応答は、受聴者に与えられる方向感に主に関与する、2つの対応する耳へのレベル差および時間差をコード化する。発明者は、バイノーラルフィルタの頭部伝達関数(HRTF)の直接部分のスペクトル効果はそれほど重大ではないことを見出した。さらに、一般的なHRTFは、時間遅延成分をさらに含む。すなわち、バイノーラル化された出力を混合してモノフォニック信号にすると、このモノフォニック信号用の等価フィルタは最小位相にならず、追加のスペクトル整形をいくらか導入する。発明者は、これらの遅延が比較的短いこと、例えば1ms未満であること、を見出した。したがって、バイノーラル化された信号の出力が混合されてモノフォニック信号になるとき、これらの遅延はいくらかのスペクトル整形を生成するが、発明者は、このスペクトル整形は一般にそれほど重大ではなく、この遅延によって生じる離散反響は何れも比較的感知不能であることを見出した。したがって、本発明の一部の実施形態においては、バイノーラルフィルタのインパルス応答h(t)およびh(t)の直接部分、すなわちHRTFによって規定される部分、は何れのバイノーラルフィルタのインパルス応答、例えばフィルタhL0(t)およびhR0(t)のインパルス応答、とも同じである。すなわち、本発明の一部の側面により見られるバイノーラルフィルタh(t)およびh(t)の特性は、これらのバイノーラルフィルタのインパルス応答の直接部分を除外する。
なお、一部の代替実施形態においては、このスペクトル整形が考慮されることに注目されたい。複数の仮想スピーカ位置にわたって励振が与えられたときに左右の耳にもたらされる、組み合わされたスペクトルを考慮することにより、1つの実施形態は、より平らなスペクトル応答を実現するための補償用等化フィルタを含む。これは、多くの場合、拡散音場における頭部応答のための補償と称され、このようなフィルタリングの実施方法は当業者には単純明快である。このような補償はスペクトルバイノーラルキューの一部を除去できる一方、スペクトルカラレーションをもたらす。
1つの実施形態において、直接音応答はt<0における応答である。すなわち、
t<3msにおいては、h(t)=hL0(t)、および (10)
t<3msにおいては、h(t)=hR0(t)。 (11)
ここで、hS0(t)およびhD0(t)で示される元の和フィルタおよび差フィルタと、それぞれh(t)およびh(t)で示されるバイノーラライザの和および差フィルタとを考える。式(8a)および式(9a)ならびに図4Bは、左耳および右耳のバイノーラライザのインパルス応答と和および差フィルタのインパルス応答との間の、すなわち一方は他方のシャフリング結果である、順方向および逆方向の関係を表す。ここでも、シャフリング操作および逆シャフリング操作の実際の実装においては、√2係数を各操作に含めなくてもよいが、一例として、式(8b)および式(9b)に記述されているように、和および差を1回のシャフリングで単に求め、この操作を逆にするためのシャフリングにおいて2で割ることに注目されたい。
発明者は、一般的なバイノーラルフィルタのインパルス応答は、和および差フィルタの両方において1つの同様の信号エネルギーを有することを見出した。式(5)において特定されたモノフォニック対応の拘束は、和フィルタはインパルス応答を有しない、すなわち、t>0においてh(t)=0である、と述べることに相当する。変化しない応答の直接部分を考慮しない実施形態の場合、要件は、式(10)および式(11)に示されているように、t>3ms以降においてもh(t)=0に緩和される。
ほぼ同じエネルギーを和および差フィルタにおいて維持するために、修正された応答において直接エネルギーと残響エネルギーとの比およびスペクトルを正しく維持する必要がある場合は、差チャンネルを、元のフィルタに比べ、約3dBブーストすべきである。ただし、この修正は、バイノーラル音像の望ましくない劣化を引き起こす。両耳間の相互相関の急激な変化は、強い知覚的影響を有し、空間感覚および距離感の大部分を破壊する。
1つの実施形態において、
tが小さい値の場合、例えばt<3msにおいては、
(t)=hD0(t)であり、 (12)
tが大きい値の場合、例えばt>40msにおいては、
(t)=√2hD0(t)である。 (13)
バイノーラルフィルタの差フィルタのインパルス応答は、インパルス応答の直接部分、例えば<3ms、については一般的なバイノーラル差フィルタのインパルス応答に比べ、3dBブーストされ、差フィルタのインパルス応答の残響部分の後期部分においてフラットな一定値のインパルス応答を有する。
発明者は、h(t)=hD0(t)からh(t)=h(t)=√2hD0(t)への変化は突然起こり、得られたバイノーラルフィルタは、元のフィルタに比べ、バイノーラル音像の望ましくない劣化を有することを見出した。両耳間の相互相関の急激な変化は、強い知覚的影響を有し、空間感覚および距離感の大部分を破壊する。
この開示の1つの側面は、モノフォニック対応の拘束をバイノーラル応答の後期部分に、知覚的にマスクされた段階的方法で、ひいてはバイノーラル音像への影響が最小である方法で、導入することである。
発明者は、バイノーラルフィルタ対の一般的なバイノーラル室内インパルス応答は、一般に初期にはかなり相関性があり、応答の後期部分では無相関になることを見出した。さらに、波長がより短いことにより、応答のより高い周波数部分がバイノーラル応答のより早期において無相関になる。すなわち、発明者は、時間依存的な現象があることを見出した。
本発明の1つの実施形態において、バイノーラル対の和フィルタは、一般的なバイノーラルフィルタ対の一般的な和フィルタに時変フィルタによって関連付けられる。この時変フィルタの時変インパルス応答をf(t,τ)で示す。これは、時点t=τにおけるインパルス、すなわち入力δ(t−τ)、に対する時点tにおける時変フィルタの応答である。すなわち、
Figure 0005298199
式中、f(t,τ)は以下のようになる。
f(0、τ)=δ(τ)および (15)
後期においては、例えばt>40msまたはt>80msにおいては、
f(t,τ)≒0。 (16)
一部の実施形態においては、|F(t,ω)|で示される時間依存的な周波数応答が、帯域幅未満の低周波数においては|F(t,ω)|がフラットであり、帯域幅外では0であるという特性を有するように、f(t,τ)は、Ω(t)>0で示される、時間依存的に帯域幅が減少するゼロ遅延、線形位相、低域通過フィルタのインパルス応答であるか、またはこれに近似する。
|ω|<Ω(t)|においては、|F(t,ω)|≒1 (17)
|ω|>Ω(t)|においては、|F(t,ω)|≒0 (18)
式中、時変周波数応答はF(t,ω)で示される。
Figure 0005298199
式中、時変帯域幅は、経時的に単調に減少する、すなわち、
<tにおいて、Ω(t)>Ω(t) (20)
1つの実施形態は、t=0における最小値20kHzから高い時間値、例えばt>10ms、における約100Hz以下に単調に増加するフィルタの時間依存的な帯域幅を使用する。すなわち、
次のようになる。
Ω(0)/2π>20kHz、および
t>40msにおいては、Ω(t)/2π<100Hz (21)
ここでも、フィルタの形態は式(14)〜(21)において連続時間で示されていることを当業者は理解されるであろう。これを離散時間として記述することは比較的単純明快であるので、本願明細書においては、本発明の特徴の説明から気を逸らさせないために、述べないことにする。
差フィルタに関して、1つの実施形態で用いられる差フィルタのインパルス応答h(t)は、その空間的広がりが整合される差フィルタに以下の式によって関連付けられる。
Figure 0005298199
式中、hD0(t)は、元の差フィルタのインパルス応答を示す。
ここでも、フィルタの形態は式(22)において連続時間で示されていることを当業者は理解されるであろう。これを離散時間として記述することは比較的単純明快であるので、本願明細書においては、本発明の特徴の説明から気を逸らさせないために、述べないことにする。
式(22)のインパルス応答を有するフィルタは、空間化品質を整合させる元の差フィルタhD0(t)と差フィルタh(t)とが位相同期するように、f(t,τ)で示される低域通過フィルタのインパルス応答がゼロ遅延および線形位相を有する場合に適している。
なお、f(0,τ)=δ(τ)であるため、
(0)=hD0(0)。
さらに、後期、例えばt>40ms、においては、f(t,τ)≒0であるため、
t>40ms程度においては、h(t)=√2hD0(t)。
したがって、差フィルタのインパルス応答は、後期においては、例えば40ms後に、整合される、または一般的な、バイノーラルフィルタの差フィルタに比例する。したがって、元の差フィルタのインパルス応答hD0(t)に対する修正は、t=0と規定される初期インパルス時点の0dBから、時間tの増加に伴い漸次低下する周波数において+3dBへと増加する周波数依存的なブーストを差チャンネルに対してもたらす。この利得は、和および差フィルタのインパルス応答が大きさにおいて同様であり、かつ無相関であるという前提のもとに適している。これは常に厳密に真実であるとは限らないが、発明者はこれは妥当な前提であることを見出し、さらに差チャンネルのインパルス応答h(t)と、空間的広がりが整合されるバイノーラルフィルタ対の差チャンネルのインパルス応答との間の関係は、修正されたフィルタのスペクトルと直接エネルギーと残響エネルギーとの比とを修正するために妥当なアプローチであることを見出した。
ただし、本発明は、式(14)および式(22)に示された関係に限定されない。複数の代替実施形態においては、他の関係を用いて規定または決定された何れかのバイノーラルフィルタ対、例えばインパルス応答hL0(t)およびhR0(t)を有するバイノーラルフィルタ対、とのスペクトルの整合をさらに向上させることができる。この具体的なアプローチは、本願明細書においては妥当な結果を達成するための比較的単純な方法として提示されており、限定を意図したものではない。
次に、式(8a)および式(9a)ならびに図4Bのシャフリング関係を用いて、または式(8b)および式(9b)のシャフリング関係を用いて、目的のバイノーラルフィルタを再構成できる。このアプローチは、モノフォニックミックスダウンにおける残響の低減と、バイノーラル応答に対する知覚的にマスクされた影響との間に効果的な平衡をもたらすことが見出された。相関係数−1への移行は、滑らかに、かつインパルス応答の初期期間中に、例えば初期40ms中に、起こる。このような一実施形態において、モノフォニックミックスダウンにおける残響応答は約40msに制限され、高周波残響ははるかに短い。
モノフォニックミックスダウンが知覚的にほぼ無響になる時間として、40msが示唆される。一部の初期反射および残響はモノフォニックミックスに依然として存在しうるが、これは直接音によって効果的にマスクされ、離散的な反響またはさらなる残響としては知覚されないことを発明者は見出した。
本発明は、移行領域の長さ40msに限定されない。このような移行領域は、用途に応じて変化させうる。残響時間が特に長いか、または直接エネルギーと残響エネルギーとの比が低い部屋をシミュレートしたい場合は、このような部屋のための標準バイノーラルフィルタに比べ、移行時間をさらに延長できるばかりでなく、モノフォニック対応の向上を引き続きもたらすこともできる。移行時間40msは、元のバイノーラルフィルタの残響時間が150msであり、かつモノフォニックミックスをできる限り無響に近付ける必要がある特定の用途に適していることが見出された。
一部の実施形態においては和フィルタが完全に排除されるが、これは要件ではない。和インパルス応答の大きさは、モノフォニックミックスダウンの残響部分の顕著な差または低減の実現に十分な割合に低減される。発明者は、約6dBの残響レベルの変化に対して「丁度可知差異」を基準として選択した。したがって、本発明の一部の実施形態においては、一般的なバイノーラルフィルタを用いてバイノーラル化された信号のモノフォニックミックスダウンの場合に比べ、和フィルタの残響応答の少なくとも6dBの低減が用いられる。したがって、一部の実施形態において、和フィルタは完全には排除されないが、その影響、例えば、そのインパルス応答の大きさは、例えば和チャンネルフィルタのインパルス応答の振幅を6dB以上減衰することによって、大幅に低減される。1つの実施形態は、これを実現するために、
Figure 0005298199
で示される以下の和インパルス応答を求めるために、元の和フィルタのインパルス応答と上で提案した、修正されたフィルタのインパルス応答とを組み合わせる。
Figure 0005298199
βの一般的な値は1/2である。これは、元の和フィルタおよび修正された和フィルタのインパルス応答を等しく重み付けする。複数の代替実施形態においては、他の重み付けを用いる。
なお、拘束f(t,τ)がゼロ遅延であり、かつ線形位相であることは、式(22)の差チャンネルのシャフリング変換および修正における簡略化および適切な位相の復元のためであることにも留意されたい。h(t)とhD0(t)との間に関係を生じさせるために差チャンネルにも適切なフィルタリングが適用される場合は、この拘束を緩和できることは信号処理の当業者には明らかなはずである。発明者が行った観察では、バイノーラル応答の後期部分における厳密な位相関係および指向性キューは、全般的な空間感覚および距離感には重要ではない。したがって、このようなフィルタリングは厳密には必要ないこともある。バイノーラルフィルタh(t)、h(t)に別のバイノーラルフィルタ対hL0(t)、hR0(t)に存在するような残響比を維持することが目標である場合は、差フィルタのインパルス応答h(t)への適切な、1つの実施形態においては周波数依存的な、利得によって実現できる。
図6は信号処理装置の簡略ブロック図を示し、図7は信号処理装置の動作方法の簡略フローチャートを示す。この装置は、左耳および右耳のインパルス応答hL0(t)およびhR0(t)を有するバイノーラルフィルタ対のバイノーラル化を近似するバイノーラルフィルタ対の左耳および右耳のインパルス応答を形成する一組の左耳信号h(t)および右耳信号hR(t)を求めるためのものである。この方法は、703において、オーディオ信号をバイノーラル化するように構成され、そのバイノーラル応答が整合化される対応する左耳および右耳バイノーラルフィルタのインパルス応答を表す左耳信号hL0(t)と右耳信号hR0(t)とを受け付けるステップを含む。この方法は、705において、左耳信号と右耳信号の和に比例する和信号と、左耳信号と右耳信号の間の差に比例する差信号とを形成するために、左耳信号と右耳信号とをシャフリングするステップをさらに含む。図6の装置において、これはシャフラ603によって行われる。この方法は、さらに707において、時変フィルタ特性を有する時変フィルタ(和フィルタ)605によって和信号をフィルタリングしてフィルタリングされた和信号を形成し、和フィルタ605によって特徴付けられる異なる時変フィルタ607、すなわち差フィルタ、によって差信号を処理してフィルタリングされた差信号を形成するステップをさらに含む。この方法は、さらに709において、整合されるバイノーラルフィルタの空間化特性にその空間化特性が一致し、かつその出力を許容できる響きのモノフォニックミックスにダウンミックスできるバイノーラルフィルタの左耳および右耳のインパルス応答にそれぞれ比例する左耳信号と右耳信号とを生成するために、フィルタリングされた和信号およびフィルタリングされた差信号をアンシャフリングするステップを含む。図6において、デシャフラ609は、シャフラ603と同じであるが、2による除算が追加されている。得られる各インパルス応答は、オーディオ信号をバイノーラル化するように構成された各バイノーラルフィルタを規定すると共に、和チャンネルのインパルス応答は、最初の40ms程度で、感知できないレベル、例えば−6dB超、に滑らかに低減し、差チャンネルは、最初の40ms程度で移行して、一般的な、または整合される特定の、バイノーラルフィルタの差チャンネルのインパルス応答に比例するという特性をさらに有する。
以上で、信号処理装置の動作方法を説明した。本方法は、1つのオーディオ信号をバイノーラル化するように構成された対応する一対のバイノーラルフィルタのインパルス応答を表す一対の信号を受け付けるステップを含む。本方法は、時変フィルタ特性を有する修正フィルタによってそれぞれ特徴付けられる一対のフィルタによって、受け付けられた一対の信号を処理することによって、対応する一対の修正されたバイノーラルフィルタのインパルス応答を表す一対の修正された信号を形成する。修正されたバイノーラルフィルタは、オーディオ信号をバイノーラル化するように構成され、さらにモノフォニックミックスダウンにおいて知覚される残響が小さく、かつヘッドホン経由のバイノーラルフィルタに対する影響が最小であるという特性を有する。
本発明の1つ以上の側面によるバイノーラルフィルタは、以下の特性を有する。
・ インパルス応答の直接部分、例えばインパルス応答の初期の3msから5msにおける部分、は仮想スピーカ位置の頭部伝達関数によって規定される。
・ 差フィルタのインパルス応答に比べ、和フィルタのインパルス応答のレベルは大幅に低減され、および/または残響が大幅に短い。
・ 和フィルタのインパルス応答の直接部分から和フィルタの後期のゼロまたは無視しうるほど小さい応答部分への移行が滑らかである。この滑らかな移行は、周波数選択的に経時的に起こる。
これらの特性は、実際の室内応答においては如何なる場合も起こらず、ひいては一般的な、または整合される、バイノーラルフィルタにおいては存在しないであろう。これらの特性は、一組のバイノーラルフィルタに導入または設計される。
これらの特性について、以下により詳細に説明する。
スピーカ対応
上の説明はモノフォニック再生対応のバイノーラルフィルタについて説明しているが、本発明の別の側面では、本発明の一実施形態によるフィルタを用いてバイノーラル化された出力信号は、一組のラウドスピーカ経由の再生にも対応している。
音響クロストークとは、例えば受聴者のほぼ中央正面にある、一対のステレオラウドスピーカを聴くときに受聴者の各耳がこれらのステレオラウドスピーカの両方からの信号を受聴する現象を記述するために用いられる用語である。本発明の複数の実施形態によるバイノーラルフィルタでは、音響クロストークは低周波残響をいくらかキャンセルする。全般的に、入力に対する残響応答の後期部分は低域通過フィルタによって漸次フィルタリングされる。したがって、本発明の複数の実施形態によるフィルタバイノーラルフィルタによってバイノーラル化された信号は、スピーカ経由の受聴時に残響がより少ないことが見出された。これは、特にモバイルメディア機器に見られるように、複数の小型ステレオスピーカが相対的に狭い間隔で配置された場合である。
複雑さの低減
インパルス応答の残響部分は空間位置の影響を受けにくいという観察を用いることによって、実装される計算が相対的に少ないバイノーラルフィルタを設計することは公知である。したがって、多くのバイノーラル処理システムは、シミュレートされるさまざまな仮想スピーカ位置に対してインパルス応答の尾部が共通であるバイノーラルフィルタを用いる。例えば、上記の国際公開第9914983号および国際公開第9949574号を参照されたい。本発明の複数の実施形態は、このようなバイノーラル処理システムに適用可能であり、さらにモノフォニック再生に対応させるためにこのようなバイノーラルフィルタを修正する場合にも適用可能である。特に、本発明のいくつかの実施形態により設計されたバイノーラルフィルタは、左右の耳のインパルス応答の残響尾部の後期部分は位相がずれており、時間t>40ms程度においてh(t)≒−h(t)と数学的に表される特性を有する。したがって、計算の複雑度が比較的低いバイノーラルフィルタの実装によると、応答の後期部分に対して単一のフィルタのインパルス応答のみを求めるだけでよく、このように求められた後期部分のインパルス応答はあらゆる仮想スピーカ位置に対するバイノーラルフィルタ対の左耳および右耳のインパルス応答の各々に使用可能であるため、メモリおよび計算の節約につながる。このような各バイノーラルフィルタ対の和フィルタは、和フィルタの低周波数成分をバイノーラル応答にまで広げる漸次時変周波数カットオフを含む。
アルゴリズム例および結果
前節では、修正されたバイノーラルフィルタリングを実現するための全般的特性とアプローチとを示した。同様の結果をもたらすフィルタ設計および処理の可能な変形例は多数あるが、以下の例は、所望のフィルタ特性を実証するために提示されており、既存のバイノーラルフィルタセットを修正するための好適なアプローチを提供する。
図8は、一対のバイノーラルフィルタのインパルス応答を、バイノーラルフィルタのインパルス応答を表す信号に変換する方法部分を実行するMATLAB(マサチューセッツ州ネイティックのマスワークス社)構文のコードの一部を示す。連結された一連の一次フィルタを用いて、線形位相、ゼロ遅延、時変低域通過フィルタを実装する。この単純なアプローチはガウシアンフィルタに近似する。MATLABコードのこの短いセクションは、一対のバイノーラルフィルタh_L0およびh_R0を取り、一組の出力バイノーラルフィルタh_Lおよびh_Rを作成する。これは、標本化速度48kHzに基づく。
最初に、803において、元の和および差フィルタを作成するために、入力フィルタをシャフリングする(コードの行1〜2を参照)。
ガウシアンフィルタ(B)の3dB帯域幅を標本数の逆二乗と適切な変倍係数とによって変化させる。これから、ガウシアンフィルタの対応する分散を計算し(GaussVar)、4で除算して指数一次フィルタの分散を得る(ExponVar)。805において、これを用いて時変指数関数的重み付け係数(a)を計算する。(コードの行3〜6を参照)。
807において、一次フィルタの2つの順方向パスと2つの逆方向パスとを用いてフィルタを実装する。和および差応答の両方をフィルタリングする。(コードの行7〜12を参照)。
809において、元の差応答のスケールアップ版から再作成された差から、フィルタリングされた差応答の適切量を引く。これは、実質的に、時間ゼロにおける0dBからその後の応答における+3dBへの差チャンネルの周波数選択的なブーストである。(コードの行13を参照)。
最後に811において、修正された左右のバイノーラルフィルタを作成するために、フィルタをリシャフリングする。(コードの行14〜15を参照)。
以降の数字は、受聴者の正面に位置付けられた、最大残響時間が150msであり、サウンドの直接エネルギーと残響エネルギーとの比が約13dBの一組のバイノーラルフィルタのインパルス応答に、図8にコード化されている方法を適用することによって得られる。
図9は、複数の時点τ、すなわち1ms、5ms、10ms、20ms、および40ms、におけるインパルスに対する時変フィルタf(t,τ)のインパルス応答のプロットを示す。最初の2つのインパルスは、この図の縦軸を超えている。図9は、適用されたフィルタのインパルス応答のガウス近似とほぼガウス状分布のフィルタのインパルス応答の経時的に増加する分散とを明確に示す。一次フィルタは順方向および逆方向の両方向に実行されるので、得られるフィルタはゼロ遅延、線形位相、低域通過フィルタに近似する。
図10は、複数の時点τ、すなわち1ms、5ms、10ms、20ms、および40ms、におけるインパルス応答の時変フィルタf(t,τ)の周波数応答エネルギーのプロットを示す。この応答の直接部分、このケースにおいてはほぼ0msから3msの部分、はフィルタの影響を大きく受けないが、40msまでにフィルタは100Hzまでほぼ10dBの減衰を引き起こすことが分かる。このインパルス応答はほぼガウス形状であるため、周波数応答もほぼガウス分布を有する。このほぼガウス分布の周波数応答と、カットオフ周波数の経時的変化とは、元のフィルタに行われる修正の知覚マスキングの実現を助ける。
図11は、元の左耳のインパルス応答hL0(t)と修正された左耳のインパルス応答h(t)とを示す。この両方が同様の残響エネルギーレベルを有することは明らかである。直接音は不変である。なお、直接音の初期インパルスは約0.2であり、この図の目盛りでは示すことができないことに留意されたい。
図12は、元の和インパルス応答hS0(t)と修正された和インパルス応答h(t)との比較を示す。これは、和応答のレベルおよび残響時間の低減を明確に実証する。これは、出力がモノフォニックにミックスダウンされたときに残響の大幅な低減を実現する特徴である。修正された和応答h(t)は低域通過フィルタによって漸次フィルタリングされ、最も低い周波数信号成分のみが応答の初期部分を超えて広がることも分かる。
図13は、元の差インパルス応答hD0(t)と修正された差インパルス応答h(t)とを示す。この差信号のレベルがブーストされていることを観察できる。これは、2つの応答の匹敵するスペクトルを実現するためである。
バイノーラルフィルタの時間周波数解析
バイノーラルフィルタ、例えば本発明の1つ以上の側面による一対のバイノーラルインパルス応答によって特徴付けられるようなバイノーラルフィルタ、は、ソース信号のフィルタリングに用いられたとき、例えばバイノーラルインパルス応答との畳み込みによって、または他の方法でソース信号に適用されたときに、方向、距離、および室内音響効果をシミュレートした空間音質を、ヘッドホンを介して受聴している受聴者に追加する。
時間周波数解析、例えば短時間フーリエ変換または他の短時間変換を重複しうる複数区間の信号に対して用いた時間周波数解析、は当該技術分野では周知である。例えば、周波数時間解析プロットは、スペクトログラムとして公知である。短時間フーリエ変換は、例えば、所望の信号の1セグメントにわたる窓掛けされた離散フーリエ変換(DFT:discrete Fourier transform)として一般に実装される。時間周波数解析には、他の変換、例えばウェーブレット変換などの変換、を用いることもできる。インパルス応答は時間信号であり、したがってその時間周波数特性によって特徴付けられうる。このような時間周波数特性によって、本発明のバイノーラルフィルタを記述することもできる。
本発明の1つ以上の側面によるバイノーラルフィルタは、例えば一対の整合されるバイノーラルフィルタにより、ヘッドホンを通じて納得のいくバイノーラル効果と、単一出力へのミックスダウン時にモノフォニック再生対応信号とを同時に実現するように構成される。本発明のバイノーラルフィルタの実施形態は、バイノーラルフィルタのインパルス応答の(短時間)周波数応答が1つ以上の特徴を伴って経時的に変化するという特性を有するように構成される。具体的には、和フィルタのインパルス応答、例えば2つの左右のバイノーラルフィルタのインパルス応答の算術和、は時間および周波数にわたって、差フィルタのインパルス応答、例えば左右のバイノーラルフィルタのインパルス応答の算術差、とは著しく異なるパターンを有する。一般的なバイノーラル応答の場合、和および差フィルタは、経時的な周波数応答において1つの極めて同様の変化を示す。この応答の初期部分は、エネルギーの大半を含み、後期部分は残響または拡散成分を含む。これは、初期部分および後期部分の間の平衡であり、インパルス応答の空間またはバイノーラル特性を与えるフィルタの特徴的な構造である。ただし、モノフォニックにミックスダウンされると、この残響応答は、通常、信号了解度および知覚品質を低下させる。
単純な対応とは、式(5)が当てはまることを意味する。すなわち、フィルタのインパルス応答の初期インパルスまたはタップ以外では、t>0においてh(t)=−h(t)、すなわちt>0においてh(t)=0である。得られるフィルタセットは、単純なモノフォニック再生対応フィルタセットまたは単純なフィルタと称される。
この節では、本発明のバイノーラルフィルタ対のこのようなインパルス応答の時間周波数解析の特徴のいくつかを説明し、いくつかの時間周波数パラメータに対する一般的な値および値範囲のいくつかを提供する。これはデータ例と、1)一組の整合される、例えば一般的な、バイノーラルフィルタと、2)単純なモノフォニック対応フィルタセットを得るために簡単な適合性を課すことによって一般的なバイノーラルフィルタから派生させたフィルタセットと、の比較とによって実証される。
図14A〜14Eは、フィルタの長さに沿った可変期間における和および差フィルタの応答におけるエネルギーのプロットを周波数の関数として示す。独断的ではあるが、発明者は、この説明のために、0〜5ms、10〜15ms、20〜25ms、40〜45ms、および80〜85msのタイムスライスを選択した。各区間の5msの時間は、相対的なパワーレベルを求めるために一貫した長さを維持するためであり、経時的に散在しうる、各フィルタの反響および詳細のいくつかを捕捉するためにも十分でもある。図14A〜14Eは、これらの時点の5msセグメントにおける周波数スペクトルを、一般的な対、単純なモノフォニック対応対、および本発明の1つ以上の側面による新規バイノーラルフィルタ対について示す。これらのプロットを求めるために、単純なモノフォニック対応対のインパルス応答は、一般的な対(整合される対)から求められた。さらに、本発明の特徴を含むフィルタのインパルス応答は、上記方法による一般的な対(整合される対)から求められた。周波数エネルギー応答の計算には、短時間フーリエ変換を窓掛けされた短時間DFTとして用いた。5つの周波数応答セットを求めるために、重複は一切用いなかった。
なお、これらのプロットに表現される値が相対的および量的な意味で解釈されるように、図示のフィルタは任意量で容易に変倍されうることに留意されたい。注目すべき点は、実際のレベルではなく、それぞれの差フィルタのインパルス応答のスペクトルの特定部分が、それぞれの和フィルタのインパルス応答に比べ、無視しうるほど小さくなる時点である。
図14Aでは、時点0msからの最初の5msの間、3つの応答は殆ど同じであることが分かる。これは、仮想スピーカ位置からのHRTFに基づく応答の極めて初期の、方向感を与える、部分である。この時間におけるフィルタ内の信号または反響の如何なる広がりも、マスキング効果と優勢な初期インパルスとにより、知覚的には殆ど無視される。
図14Bでは、時点10msからの5msにおいて、単純なアプローチの和信号はゼロである。和応答の後期部分は除去されている。それに対し、新規フィルタ対、例えば上記のフィルタ対、は4kHz未満において和フィルタにいくらかの信号エネルギーを依然として維持している。これら3つのフィルタ全ての差応答は同様であり、新規フィルタ対の差インパルス応答は、周波数が高くなるほどエネルギーが僅かに大きくなる。
図14Cでは、時点20msからの5msにおいて、新規フィルタ対の和フィルタはさらに減衰され、帯域幅は約1kHzになる。新規フィルタ対の差フィルタは、バイノーラルレベルおよび周波数応答を全体として、一般的な、または整合される、フィルタ対のものと同様に維持するために、ブーストされる。
図14Dでは、40msからの5msにおいて、新規フィルタ対の和フィルタの最も低い成分のみが残っている。最後に、図14Eでは、80msからの5msにおいて、単純なフィルタ対および新規フィルタ対の両方の和フィルタのインパルス応答は無視しうるほど小さい。
したがって、極めて良好なモノフォニック再生対応を実現するように構成された、バイノーラルフィルタのインパルス応答の整形を伴うバイノーラルフィルタセットが提案される。一部の実施形態において、これらのフィルタは、モノフォニック応答が最初の40msに限定されるように構成される。
以下の特性は、良好なバイノーラル応答と良好なモノフォニック再生対応の両方を実現するためのフィルタの有効性に関する。これらにおいて、「フィルタ範囲」および「フィルタ長」とは、フィルタのインパルス応答がその初期値の−60dB未満になる時点である。これは、当該技術分野においては「残響時間」としても公知である。
以下の特性により、本願明細書に記載の本発明のフィルタを他のバイノーラルフィルタおよびモノフォニック再生対応バイノーラルフィルタから区別することができる。
・ 和および差フィルタは大きく異なる。通常のバイノーラルフィルタの場合、和および差フィルタは、時間周波数プロットにわたって同様の強度および衰退特性を示す。
・ 和フィルタは、あらゆる周波数において差フィルタより大幅に短い。和フィルタは、一般的なリスニングルームにおいて一般に持続時間が僅かに短くなるが、これは大して重要ではない。モノフォニック対応のために、和フィルタを大幅に短くする必要がある。
・ 和フィルタは、さまざまな周波数にわたって大きな長さの違いを示す。これは、さまざまな周波数にわたって和フィルタの長さがある程度一定している単純なアプローチと比較してのことである。
・ 和フィルタは、高周波数においてより短く、低周波数においてより長い。
なお、和チャンネルの抑圧をより強硬にした(より良好なモノフォニック応答)、またはより控えめにした(より良好なバイノーラル応答)同様の整形も実現可能であることに注目されたい。
より数量的に表現すると、バイノーラル応答とモノフォニック再生対応との良好な組み合わせを実現するには、以下が当てはまることが見出された。
差フィルタ
・ 差フィルタの高周波数、例えば10kHz超、は約10msを超えて広がらない。別の例示的実施形態において、約20msという差フィルタ長は依然として許容可能であるが、約40msというフィルタ長ではモノフォニック信号が反響し始める。
・ 差フィルタの低周波数、例えば3kHzと4kHzの間の周波数、はより長く、約40msまで、またはその周波数における差フィルタの残響長の約1/8から1/4まで、広がる。
・ さらに低い周波数、例えば2kHz未満、において極めて良好な応答を得るには、最も低い周波数において差フィルタを約80msより長くすべきではない。一部の実施形態においては、120msという長さでも許容可能と思われるが、2kHz未満においては約160msのフィルタ長でモノフォニック信号が反響し始める。
さらに、この拘束された差フィルタで良好なバイノーラル応答を得るには、全体的な範囲、例えば差フィルタの残響、を長くしすぎてはならない。発明者は、残響時間200msは素晴らしい結果をもたらし、400msは許容可能な結果をもたらすが、フィルタ長800msではオーディオの響きに問題が出始めることを見出した。
和フィルタ
表1は、さまざまな周波数帯域についての和フィルタのインパルス応答長の一般的な値セットと、モノフォニック再生対応とリスニングルームの空間化との間の平衡を依然としてもたらす周波数帯域における和フィルタのインパルス応答の長さ値の範囲とを示す。
Figure 0005298199
時間依存的な周波数整形の選択は、例えば上記のような整合される一組のバイノーラルフィルタhL0(t)およびhR0(t)によって特徴付けられるような、所望のバイノーラル応答の性質と残響とに依存すると共に、これらのバイノーラルフィルタにおける近似または拘束に対してモノフォニックミックスにおける明晰さを優先させるか否かにも依存する。
次に、この発明によって示される和フィルタの整形の説明を容易にするために、データ例を時間および周波数の二次元マップにわたる相対的なフィルタエネルギーのプロットとして提示する。図15Aおよび図15Bは、バイノーラルフィルタ対の一例示的実施形態の和および周波数フィルタのインパルス応答それぞれについての等減衰量の等高線を時間周波数平面上に示す。図16Aおよび図16Bは、この時間周波数プロット、すなわちスペクトログラム、の表面の等角図を示す。等高線データは、1.5ms間隔で始まる、すなわち重複部分が大きい、各5ms長のセグメントに対して窓掛けされた短時間フーリエ変換を用いることによって得られた。これらの等角図は、3msの窓長を用いた。重複はない、すなわちデータは3msごとに始まる。図17Aおよび図17Bは、図16Aおよび図16Bと同じ時間周波数プロットの表面の等角図であるが、一般的なバイノーラルフィルタ対、特に、図16Aおよび図16Bに用いられている整合されるバイノーラルフィルタ、の和および周波数フィルタのインパルス応答それぞれについての等角図を示す。なお、一般的なバイノーラルフィルタ対においては、和および差フィルタの対応するインパルス応答の時間周波数プロットの形状はあまり違わないことに注目されたい。
なお、単純なモノフォニック対応フィルタ対は、和フィルタのインパルス応答が、あらゆる周波数において、即座にかつ突然に知覚可能レベル未満への降下を示すであろうことに注目されたい。
なお、それぞれの応答の些細な変化によって時間周波数特性の特徴が曖昧にならないように、図15A、図15B、図16A、図16B、図17A、および図17Bの作成に当たっては、図面を単純化するために時間周波数データをいくらか平滑化したことに留意されたい。
本願明細書に提示されている全てのプロットおよびグラフに示されているdBレベルは、単なる相対的な大きさに過ぎず、説明されているフィルタおよびパターンの絶対的特性ではないことに留意すべきである。これらの図面と図面が記述している特性とは、詳細なレベル、時間、およびスペクトル形状を厳密に守らなくとも、当業者は解釈できるであろう。
テスト
発明者は、上の表1の欄「一般的な和フィルタ長」に規定されている整形を伴う数種類のソース材料と、図14A〜14Eの例として与えられている、整合されるバイノーラルインパルス応答とを用いて、主観テストを実行した。整合されるインパルス応答は、残響時間200〜300msのバイノーラル応答を有し、DOLBY HEADPHONE DH3バイノーラルフィルタに対応する。このテストにおいては、被験者が1つのバイノーラル応答を他のバイノーラル応答より好む統計的に有意なケースはなかった。ただし、モノフォニックミックスは、テストした全てのソース材料について大幅に改善され、全ての被験者によって全員一致で好まれた。
スピーカによる再生
バイノーラルフィルタを用いた上記の方法および装置は、ヘッドホンでのバイノーラル再生に適用可能であるだけではなく、スピーカによるステレオ再生にも適用可能である。ラウドスピーカ同士が近接している場合、受聴中の受聴者の左耳と右耳の間にクロストーク、例えば1つのスピーカの出力とそのスピーカから最も遠い耳との間のクロストーク、が起きる。例えば、受聴者の正面に置かれた一対のステレオスピーカの場合、クロストークとは、左耳で右スピーカからの音を聴くことばかりでなく、右耳で左スピーカからの音を聴くことでもある。スピーカと受聴者との間の距離に比べ、スピーカ同士が十分に近接している場合は、クロストークは基本的に2つのスピーカ出力の和を受聴者に聴かせる。これは、基本的にモノフォニック再生と同じである。
フィルタの実装
さらに、デジタルフィルタを多くの方法で実装しうることを当業者は理解するであろう。例えば、有限インパルス応答(FIR)の実装、周波数領域での実装、重複変換法などによってデジタルフィルタを実施しうる。このような方法の多くは公知であり、これらの方法を本願明細書に記載の実装に適用する方法は当業者には単純明快であろう。
なお、上記フィルタ説明は、オーディオアンプや他の同様の要素など、必要な全ての構成要素を例示していないことを当業者は理解されるであろう。また、当業者は、このような要素の追加をさらなる教示なしに行えるであろう。さらに、上記の実装はデジタルフィルタリング用である。したがって、アナログ入力の場合は、アナログデジタル変換器を含める必要があることを当業者は理解されるであろう。さらに、ヘッドホンを介した再生には、またはトランスオーラルフィルタリングの場合のラウドスピーカを介した再生には、デジタル信号出力をアナログ出力に変換するために、デジタルアナログ(D/A)変換器が必要であることを理解されるであろう。
図18は、本発明の複数の側面による一組のオーディオ入力信号を処理するためのオーディオ処理装置の実装の一形態を示す。このオーディオ処理システムは、アナログ入力信号を対応するデジタル信号に変換するように構成されたアナログデジタル(A/D)変換器を含む入力インタフェースブロック1821と、処理された信号をアナログ出力信号に変換するためのデジタルアナログ(D/A)変換器を備えた出力ブロック1823とを備える。一代替実施形態において、入力ブロック1821はさらに、またはA/D変換器の代わりに、アナログ入力信号に加えて、またはその代わりに、デジタル入力信号を受け付けるように構成されたSPDIF(ソニー/フィリップスデジタルインターコネクトフォーマット)インタフェースを備える。この装置は、入力を処理して出力を十分高速に生成できるデジタル信号プロセッサ(DSP:digital signal processor)デバイス1800を含む。1つの実施形態において、DSPデバイスは、プロセッサのオーバーヘッドなしにA/DおよびD/A変換器情報をやり取りするように構成された複数のシリアルポート1817の形態のインタフェース回路を含み、1つの実施形態においては、オフデバイスメモリ1803と、入出力処理の動作を妨げずにオフチップメモリ1803からオンチップメモリ1811へデータをコピーできるDMAエンジン1813とを含む。一部の実施形態において、本願明細書に記載の本発明の複数の側面を実装するためのプログラムコードは、オフチップメモリ1803にあってもよく、必要に応じてオンチップメモリ1811に読み込んでもよい。図示のDSP装置は、DSP装置のプロセッサ部1805に本願明細書に記載のフィルタリングを実施させるプログラムコード1809を含むプログラムメモリ1807を含む。外部メモリ1803が必要な場合のために、外部バスマルチプレクサ1815が含まれている。
なお、オフチップおよびオンチップという用語は、図示のチップが複数存在することを暗示すると解釈されるべきではないことに留意されたい。最新の用途においては、図示のDSPデバイス1800のブロックは、他の回路と一緒にチップに含まれる「コア」として設けられる場合もある。さらに、図18に示されている装置は単なる一例であることを当業者は理解されるであろう。
同様に、図19Aは、複数の正面スピーカによる再生用の左、中央、および右信号と、複数のリアスピーカによる再生用の左サラウンドおよび右サラウンド信号との形態で、5つのチャンネルのオーディオ情報を受け付けるように構成されたバイノーラル化装置の一実施形態の簡略ブロック図を示す。このバイノーラライザは、ヘッドホンを通して聴いている受聴者には空間量を体験させる一方で、モノフォニックミックスを聴いている受聴者には信号があたかもモノフォニック音源から出ているように心地よく体験させるように、左サラウンドおよび右サラウンド信号を含む、各入力に対応した複数のバイノーラルフィルタ対を実装する。このバイノーラライザは、処理システム1903、例えば少なくとも1つのプロセッサ1905を含むDSPデバイスを含む処理システム、を用いて実装される。プログラムコードを複数の命令の形態で保持するためにメモリ1907が含まれているが、メモリ1907は必要なパラメータがあれば如何なるものでもさらに保持できる。プログラムコードは、実行されたときに、上記のようなフィルタリングを処理システム1903に実行させる。
同様に、図19Bは、正面スピーカによる再生用の左右のフロント信号と、リアスピーカによる再生用の左リアおよび右リア信号との形態で4つのチャンネルのオーディオ情報を受け付けるバイノーラル化装置の一実施形態の簡略ブロック図を示す。このバイノーラライザは、ヘッドホンを通して聴いている受聴者には空間量を体験させる一方で、モノフォニックミックスを聴いている受聴者には信号があたかもモノフォニック音源から出ているように心地よく体験させるように、左右の信号と左リアおよび右リア信号とを含む各入力に対して複数のバイノーラルフィルタ対を実装する。このバイノーラライザは、処理システム1903、例えばプロセッサ1905を有するDSPデバイスを含む処理システムを用いて実装される。プログラムコード1909を複数の命令の形態で保持するためにメモリ1907が含まれているが、メモリ1907は必要なパラメータがあれば如何なるものでもさらに保持できる。プログラムコードは、実行されたときに、上記のようなフィルタリングを処理システム1903に実行させる。
1つの実施形態においては、プログラムロジック、例えば少なくとも1つのプロセッサによって実行されたときに、本願明細書に記載の方法の一連の方法ステップの実施を引き起こす一組の命令、と共にコンピュータ可読媒体が構成される。
特に明記されていない限り、以下の説明から明らかなように、本明細書を通して、「処理する(processing)」、「計算する(computing)」、「計算する(calculating)」、「求める/決める(determining)」などの用語を用いた説明は、コンピュータまたはコンピューティングシステム、あるいは電子的などの物理的な数量として表されるデータを扱う、および/または同様に物理量として表される他のデータに変換する同様の電子計算機器、の動作および/または処理を指す。
同様に、用語「プロセッサ」は、電子データ、例えばレジスタおよび/またはメモリからの電子データ、を処理してその電子データを他の、例えばレジスタおよび/またはメモリに格納可能な、電子データに変換する、何れかのデバイスまたはデバイスの一部を指すこともある。「コンピュータ」または「計算機」または「コンピューティングプラットフォーム」は、少なくとも1つのプロセッサを含みうる。
なお、いくつかの要素、例えば、いくつかのステップを含む方法が説明されるとき、特に明記されていない限り、このような要素の順序付け、例えばステップの順序付け、は暗示されていないことに留意されたい。
本願明細書に記載の方法は、1つの実施形態においては、1つ以上のコンピュータ可読媒体上に具現化されたコンピュータ実行可能(マシン実行可能とも称される)プログラムロジックを受け付ける1つ以上のプロセッサによって実行可能である。このプログラムロジックは、1つ以上のプロセッサによって実行されたときに、本願明細書に記載の方法の少なくとも1つを実施する一組の命令を含む。取るべきアクションを指定する一組の命令(順次またはその他)を実行可能な何れかのプロセッサが含まれる。したがって、一例は、1つ以上のプロセッサを含む一般的な処理システムである。各プロセッサは、1つ以上のCPUと、1つのグラフィックス処理ユニットと、1つのプログラム可能DSPユニットとを含みうる。この処理システムは、主RAMおよび/またはスタティックRAM、および/またはROMを含むメモリサブシステムを含む記憶サブシステムをさらに含みうる。記憶サブシステムは、他の記憶デバイスを1つ以上さらに含みうる。構成要素間の通信用にバスサブシステムを含んでもよい。この処理システムは、さらに、複数のプロセッサが1つのネットワークによって結合された分散処理システムでもよい。この処理システムが表示を必要とする場合は、例えば液晶ディスプレイ(LCD:liquid crystal display)、有機発光ディスプレイ、プラズマディスプレイ、陰極線管(CRT:cathode ray tube)ディスプレイなどの、ディスプレイを含んでもよい。手動データ入力が必要な場合は、処理システムは、キーボードなどの1つ以上の英数字入力ユニット、マウスなどのポインティング制御デバイスなどの入力デバイスをさらに含む。本願明細書で使用されている記憶デバイス、記憶サブシステム、ユニットなどの用語は、文脈から明らかな場合、および特に明記されていない限り、ディスクドライブユニットなどの記憶デバイスも含む。一部の構成における処理システムは、サウンド出力デバイスとネットワークインタフェースデバイスとを含みうる。したがって、記憶サブシステムは、1つ以上のプロセッサによって実行されたときに本願明細書に記載の方法の1つ以上の実施を引き起こす一組の命令を含むプログラムロジック(例えば、ソフトウェア)を担持するコンピュータ可読媒体を含む。このプログラムロジックは、ハードディスクに常駐させてもよく、あるいは処理システムによるその実行中、その全体、または少なくとも一部、をRAM内および/またはプロセッサ内に常駐させてもよい。したがって、メモリおよびプロセッサは、コード化された、例えば命令の形態の、プログラムロジックが格納されるコンピュータ可読媒体をさらに構成する。
さらに、コンピュータ可読媒体は、コンピュータプログラム製品を形成してもよいが、コンピュータプログラム製品に含めてもよい。
複数の代替実施形態において、1つ以上のプロセッサはスタンドアロンデバイスとして動作するか、または他のプロセッサ(単数または複数)に接続、例えばネットワーク型配備においては他のプロセッサ(単数または複数)にネットワーク接続、することもできる。この1つ以上のプロセッサは、サーバクライアントネットワーク環境においてサーバまたはクライアントマシンとして機能することも、またはピアツーピアまたは分散ネットワーク環境においてピアマシンとして機能することもできる。この1つ以上のプロセッサは、パーソナルコンピュータ(PC:personal computer)、タブレットPC、セットトップボックス(STB:set−top box)、電子手帳(PDA:Personal Digital Assistant)、携帯電話、ウェブアプライアンス、ネットワークルータ、スイッチまたはブリッジ、またはマシンが取るべきアクションを指定する一組の命令を(順次またはその他)実行可能な何れかのマシンを形成しうる。
なお、一部の図面(単数または複数)は単一のプロセッサと、複数の命令を含むロジックを担持する単一のメモリとだけを示しているが、当業者は上記の構成要素の多くが含まれていること、しかし本発明の側面を曖昧にしないために明示的に図示または説明されていないことを理解されるであろう。例えば、単一のマシンのみが図示されているが、単数の「マシン」という用語は、本願明細書に記載の方法の1つ以上を実行するために一組の(または複数組の)命令を個々にまたは一緒に実行する複数のマシンから成る何れかのマシン集合を含むものとしても解釈されるべきである。
したがって、本願明細書に記載の方法の各々の1つの実施形態は、一組の命令、例えば1つ以上のプロセッサ上で、例えば信号処理装置の一部を構成する1つ以上のプロセッサ上で、実行するためのコンピュータプログラム、と共に構成されたコンピュータ可読媒体の形態である。したがって、当業者には理解されるように、本発明の複数の実施形態は、方法、専用装置などの装置、データ処理システムなどの装置、またはコンピュータ可読媒体、例えばコンピュータプログラム製品、として具現化されうる。コンピュータ可読媒体は、1つ以上のプロセッサ上で実行されたとき、方法ステップの実施を引き起こす一組の命令を含むロジックを担持する。したがって、本発明の複数の側面は、方法、完全にハードウェアの実施形態、完全にソフトウェアの実施形態、またはソフトウェアおよびハードウェアの側面を組み合わせた実施形態の形態を取りうる。さらに、本発明は、例えばコンピュータ可読媒体内の、プログラムロジックの形態、例えばコンピュータ可読記憶媒体上のコンピュータプログラム、またはコンピュータ可読プログラムコードで構成されたコンピュータ可読媒体、例えばコンピュータプログラム製品の形態、を取りうる。
一例示的実施形態において、コンピュータ可読媒体は単一の媒体として図示されているが、単数形の「媒体(medium)」という用語は、一組以上の命令を格納する単一の媒体または複数の媒体(例えば、集中または分散データベース、および/または対応付けられた複数のキャッシュおよび複数のサーバ)を含むものと解釈されたい。用語「コンピュータ可読媒体」は、1つ以上のプロセッサによって実行され、本発明の方法の何れか1つ以上の実施を引き起こす命令セットの格納、コード化が可能な、またはこれらの命令と共にその他の方法で構成された、コンピュータ可読媒体であれば如何なるものでも含むものと解釈されたい。コンピュータ可読媒体は、不揮発性媒体および揮発性媒体などの多くの形態を取りうるが、これだけに限定されない。不揮発性媒体として、例えば、光、磁気ディスク、および光磁気ディスクが挙げられる。揮発性媒体として、主メモリなどのダイナミックメモリが挙げられる。
記載の各方法のステップは、1つの実施形態においては記憶装置に格納された命令を実行する処理システム(例えば、コンピュータシステム)の適切なプロセッサ(単数または複数)によって実施されることを理解されるであろう。本発明の複数の実施形態は、何れか特定の実装またはプログラミング手法に限定されず、本発明は本願明細書に記載の機能を実施するための何れか適切な手法を用いて実施されうることも理解されるであろう。さらに、複数の実施形態は、何れか特定のプログラミング言語またはオペレーティングシステムに限定されない。
この明細書本文を通して「1つの実施形態(one embodiment)」または「一実施形態(an embodiment)」への言及は、その実施形態に関連して説明されている特定の特徴、構造、または特性が本発明の少なくとも1つの実施形態に含まれることを意味する。したがって、この明細書を通してさまざまな箇所において「1つの実施形態において(in one embodiment)」または「一実施形態において(in an embodiment)」という句の出現は、必ずしも全てが1つの同じ実施形態に言及しているわけではなく、複数の実施形態に言及している場合もある。さらに、この開示から当業者には明らかなように、特定の特徴、構造、または特性は、1つ以上の実施形態において何れか適した方法での組み合わせが可能である。
同様に、本発明の一例示的実施形態の上記説明においては、本開示を簡素化し、本発明のさまざまな側面のうちの1つ以上の理解を助ける目的で、本発明のさまざまな特徴が単一の実施形態、図、またはその説明において一緒にまとめられている場合もあることを理解されたい。ただし、この開示の方法は、本願発明が各請求項に明示的に記載されている特徴より多くの特徴を必要とするという意図を反映したものとは解釈されないものとする。むしろ、添付の特許請求の範囲に反映されているように、本発明の複数の側面は、上記の単一の開示された実施形態の全ての特徴より少ない特徴にある。したがって、これにより、この「発明を実施するための形態」に続く特許請求の範囲は、上記の「発明の概要」および「発明を実施するための形態」に明示的に組み込まれ、各請求項はこの発明の1つの独立した実施形態として自立する。
さらに、本願明細書に記載の一部の実施形態は、他の複数の実施形態に含まれている特徴の一部のみを含むが、さまざまな実施形態の特徴のさまざまな組み合わせは、当業者には理解されるように、本発明の範囲に含まれ、さまざまな実施形態を形成するものとする。例えば、添付の特許請求の範囲において、記載されている実施形態の多くは如何なる組み合わせでも使用可能である。
さらに、これらの実施形態の一部は、本願明細書において、コンピュータシステムのプロセッサによって、またはその機能を実行する他の手段によって、実施可能な1つの方法として、または1つの方法の要素の組み合わせとして、記載されている。したがって、このような方法、またはこのような方法の要素を実行するために必要な命令、を備えたプロセッサは、この方法、または方法の要素、を実行するための手段を形成する。さらに、装置実施形態について本願明細書に記載されている要素は、本発明を実施するためにその要素によって実行される機能を実施する手段の一例である。
本願明細書に提供されている説明において、数多くの具体的詳細が説明されている。ただし、本発明の複数の実施形態は、これらの具体的詳細なしに実施されうることを理解されたい。また、この説明の理解を曖昧にしないために、周知の方法、構造、および手法については詳細に示されていない。
特に明記されていない限り、1つの共通の対象物を記述するために本願明細書で使用されている序数形容詞「第1の」、「第2の」、「第3の」などの使用は、言及されている同様の対象物の複数の異なるインスタンスを単に示しているにすぎず、そのように記述されている対象物が時間的、空間的、序列において、または何れか他の様式で、所与の順序でなければならないことを暗示することを意図しているものではない。
この明細書における従来技術の説明は何れも、そのような従来技術が広く知られている、または公に知られている、または当該技術分野における一般常識の一部を成すことを認めるものであるとは決して見なされないものとする。
以下の特許請求の範囲および本願明細書の説明において、「を備える/含む(comprising)」、「で構成された(comprised of)」、または「を備える(which comprises)」という用語は何れも、後続の要素/特徴を少なくとも含むが、他の要素/特徴を排除しないことを意味する非限定的な用語である。したがって、「を備える/備えた/含む/含んだ(comprising)」という用語は、特許請求の範囲で用いられたとき、その後に列挙されている手段または要素またはステップに限定するものと解釈されるべきではない。例えば、「AとBとを備えたデバイス(a device comprising A and B)」という表現の範囲は、要素AおよびBのみによって構成されたデバイスに限定されるべきではない。本願明細書で使用される場合、「を含む(including)」、または「を含む(which includes)」、または「を含む(that includes)」という用語は何れも、その用語に続く要素/特徴を少なくとも含み、他の要素/特徴を排除しないことを意味する非限定的な用語である。したがって、「を含む(including)」は「を備える(comprising)」と同義である。
同様に、用語「結合され(coupled)」は、特許請求の範囲で使われた場合、直接接続のみに限定されると解釈されるべきではないことに留意されたい。用語「結合され(coupled)」および「接続され(connected)」は、これらの派生語と共に、使用されうる。これらの用語は互いに同義語であると意図されていないことを理解されたい。したがって、「デバイスBに結合されたデバイスA(a device A coupled to a device B)」と言う表現の範囲は、デバイスAの出力がデバイスBの入力に直接接続されているシステムまたはデバイスに限定されるべきではない。すなわち、Aの出力とBの入力との間に経路が存在し、その経路は他のデバイスまたは手段を含む経路でもよいことを意味する。「結合され(coupled)」とは、2つ以上の要素が物理的または電気的に直接接触していること、または2つ以上の要素が互いに直接は接触していないが、互いに連係または相互作用すること意味しうる。
したがって、本発明の好適な実施形態と考えられるものを説明してきたが、他の修正およびさらなる修正を、本発明の精神から逸脱せずに、これらの実施形態に行いうることを当業者は認識されるであろう。したがって、このような変更および修正は全て本発明の範囲に含まれることを主張するものである。例えば、上記の式は何れも、使用しうる手順を単に表しているにすぎない。機能をブロック図に追加または削除してもよく、動作を機能ブロック間で入れ替えてもよい。記載されている方法に、本発明の範囲内で、ステップを追加または削除してもよい。

Claims (36)

  1. 1つ以上のオーディオ入力信号から成るオーディオ入力信号セットをバイノーラル化するための装置であって、
    一対以上のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)を実装するバイノーラライザ(101)であって、各バイノーラルフィルタ対は前記オーディオ信号入力の各々に対応し、各バイノーラルフィルタ対(203−1、204−1、...、203−M、204−M)は、左耳出力と右耳出力とを有し、各バイノーラルフィルタ対は、左耳のバイノーラルフィルタと右耳のバイノーラルフィルタとによってそれぞれ表現可能であり、各バイノーラルフィルタ対は、前記左耳および右耳のバイノーラルフィルタに関連付けられた和フィルタ(403)と差フィルタ(404)とによってさらに表現可能であり、各フィルタは前記フィルタを特徴付けるインパルス応答をそれぞれ有する、バイノーラライザ(101)を備え、
    少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)は、受聴者(107)への直接応答を対応する仮想スピーカ位置(209−1、...、209−M)から取り込むために、およびリスニングルームの初期反響と残響応答の両方を取り込むために、それぞれのオーディオ入力信号を空間化するように構成され、
    前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)については、
    前記和フィルタ(403)の時間周波数特性は、前記差フィルタ(404)の時間周波数特性とは異なり、前記和フィルタの残響時間は、あらゆる周波数において、前記差フィルタの残響時間、前記左耳フィルタの残響時間、および前記右耳フィルタの残響時間のどれよりも小さく、
    前記和フィルタの残響時間は、複数の異なる周波数にわたって、前記左耳フィルタの残響時間および前記右耳フィルタの残響時間の複数の周波数にわたるそれぞれの変化より大きく変化し、前記和フィルタの残響時間は、周波数の増加に伴い減少し、
    これにより、前記一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)によってフィルタリングされた前記1つ以上のオーディオ入力信号は、ヘッドホン(105)を通じて再生されたときは空間的広がりを持って知覚され、ダウンミキシングによって、または相対的に狭い間隔で配置された複数のラウドスピーカによる再生によって、モノフォニックミックスが実現された後にモノフォニック再生されたときは良好に響く出力信号を生成し、前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)については、前記和フィルタのインパルス応答のその無視しうるほど低いレベルへの移行は、前記和フィルタのインパルス応答の初期期間にわたって周波数依存的に経時的に徐々に起こり、前記少なくとも一対のバイノーラルフィルタ(203−1、2041、...、203−M、204−M)については、前記和フィルタは、前記移行期間にわたって初期の全帯域幅から低域カットオフに向けて周波数成分が減少するようになっている、
    装置。
  2. 前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203M、204−M)については、前記移行期間は、前記和フィルタのインパルス応答が約3msまでの全帯域幅から約40msにおける100Hz未満に移行するようになっている、請求項1に記載の装置。
  3. 前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)については、10kHz超の高周波数における前記差フィルタの残響時間は40ms未満であり、3kHzと4kHzの間の周波数における前記差フィルタの残響時間は100ms未満であり、2kHz未満の周波数における前記差フィルタの残響時間は160ms未満である、請求項1または2に記載の装置。
  4. 前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)については、10kHz超の高周波数における前記差フィルタの残響時間は20ms未満であり、3kHzと4kHzの間の周波数における前記差フィルタの残響時間は60ms未満であり、2kHz未満の周波数における前記差フィルタの残響時間は120ms未満である、請求項1乃至3の何れか1項に記載の装置。
  5. 前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)については、10kHz超の高周波数における前記差フィルタの残響時間は10ms未満であり、3kHzと4kHzの間の周波数における前記差フィルタの残響時間は40ms未満であり、2kHz未満の周波数における前記差フィルタの残響時間は80ms未満である、請求項1乃至4の何れか1項に記載の装置。
  6. 前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)については、前記差フィルタの残響時間は約800ms未満である、請求項1乃至5の何れか1項に記載の装置。
  7. 前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)については、前記差フィルタの残響時間は約400ms未満である、請求項1乃至6の何れか1項に記載の装置。
  8. 前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)については、前記差フィルタの残響時間は約200ms未満である、請求項1乃至7の何れか1項に記載の装置。
  9. 前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)については、
    前記和フィルタの残響時間は、前記周波数の増加に伴い減少し、
    前記和フィルタの残響時間は、100Hz未満のあらゆる周波数において、40ms以上160ms以下であり、
    前記和フィルタの残響時間は、100Hzと1kHzの間のあらゆる周波数において、20ms以上80ms以下であり、
    前記和フィルタの残響時間は、1kHzと2kHzの間のあらゆる周波数において、10ms以上20ms以下であり、
    前記和フィルタの残響時間は、2kHzと20kHzの間のあらゆる周波数において、5ms以上20ms以下である、請求項1乃至8の何れか1項に記載の装置。
  10. 前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)については、
    前記和フィルタの残響時間は、前記周波数の増加に伴い減少し、
    前記和フィルタの残響時間は、100Hz未満のあらゆる周波数において、60ms以上120ms以下であり、
    前記和フィルタの残響時間は、100Hzと1kHzの間のあらゆる周波数において、30ms以上60ms以下であり、
    前記和フィルタの残響時間は、1kHzと2kHzの間のあらゆる周波数において、15ms以上30ms以下であり、
    前記和フィルタの残響時間は、2kHzと20kHzの間のあらゆる周波数において、7ms以上15ms以下である、請求項1乃至9の何れか1項に記載の装置。
  11. 前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)については、
    前記和フィルタの残響時間は、前記周波数の増加に伴い減少し、
    前記和フィルタの残響時間は、100Hz未満のあらゆる周波数において、70ms以上90ms以下であり、
    前記和フィルタの残響時間は、100Hzと1kHzの間のあらゆる周波数において、35ms以上50ms以下であり、
    前記和フィルタの残響時間は、1kHzと2kHzの間のあらゆる周波数において、18ms以上25ms以下であり、
    前記和フィルタの残響時間は、2kHzと20kHzの間のあらゆる周波数において、8ms以上12ms以下である、
    求項1乃至10の何れか1項に記載の装置。
  12. 前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)については、前記バイノーラルフィルタの特性は、整合される一対のバイノーラルフィルタの特性から決まる、請求項1乃至11の何れか1項に記載の装置。
  13. 前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)については、前記差フィルタのインパルス応答は、後期において、前記整合されるバイノーラルフィルタの前記差フィルタに比例する、請求項12に記載の装置。
  14. 前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)については、前記差フィルタのインパルス応答は、40ms後に、前記整合されるバイノーラルフィルタの前記差フィルタに比例する、請求項13に記載の装置。
  15. 1つ以上のオーディオ入力信号から成るオーディオ入力信号セットをバイノーラル化する方法であって、
    一対以上のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)を実装するバイノーラライザ(101)によって前記オーディオ入力信号セットをフィルタリングするステップであって、各バイノーラルフィルタ対は前記オーディオ信号入力の各々に対応し、各バイノーラルフィルタ対(203−1、204−1、...、203−M、204−M)は、左耳出力と右耳出力とを有し、各バイノーラルフィルタ対は、左耳のバイノーラルフィルタと右耳のバイノーラルフィルタとによってそれぞれ表現可能であり、各バイノーラルフィルタ対は、さらに前記左耳および右耳のバイノーラルフィルタに関連付けられた和フィルタ(403)と差フィルタ(404)とによって表現可能であり、各フィルタは前記フィルタを特徴付けるインパルス応答をそれぞれ有する、ステップを含み、
    少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)は、受聴者(107)への直接応答を対応する仮想スピーカ位置(209−1、...、209−M)から取り込むために、およびリスニングルームの初期反響と残響応答の両方を取り込むために、それぞれのオーディオ入力信号を空間化するように構成され、
    前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)については、
    前記和フィルタ(403)の時間周波数特性は、前記差フィルタ(404)の時間周波数特性とは異なり、前記和フィルタの残響時間は、あらゆる周波数において、前記差フィルタの残響時間、前記左耳フィルタの残響時間、および前記右耳フィルタの残響時間のどれよりも小さく、
    前記和フィルタの残響時間の複数の異なる周波数にわたる変化は、複数の周波数にわたる前記左耳フィルタの残響時間および前記右耳フィルタの残響時間のそれぞれの変化より大きく、前記和フィルタの残響時間は周波数の増加に伴い減少し、
    これにより、前記出力は、ヘッドホン(104)を通して再生されたときは空間的広がりを持って知覚され、またダウンミキシングによって、または相対的に狭い間隔で配置された複数のラウドスピーカを介した再生によって、モノフォニックミックスが実現された後にモノフォニック再生されたときは良好に響くようになっており、
    前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)については、前記和フィルタのインパルス応答のその無視しうるほど低いレベルへの移行は、前記和フィルタのインパルス応答の初期期間にわたって周波数依存的に経時的に徐々に起こり、
    前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)については、前記和フィルタは、前記移行期間にわたって初期の全帯域幅から低域カットオフに向けて周波数成分が減少する、
    方法。
  16. 前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)については、前記移行期間は、前記和フィルタのインパルス応答が約3msまでの全帯域幅から約40msにおける100Hz未満に移行するようになっている、請求項15に記載の方法。
  17. 前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)については、10kHz超の高周波数における前記差フィルタの残響時間は40ms未満であり、3kHzと4kHzの間の周波数における前記差フィルタの残響時間は100ms未満であり、2kHz未満の周波数における前記差フィルタの残響時間は160ms未満である、請求項15または16に記載の方法。
  18. 前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)については、10kHz超の高周波数における前記差フィルタの残響時間は20ms未満であり、3kHzと4kHzの間の周波数における前記差フィルタの残響時間は60ms未満であり、2kHz未満の周波数における前記差フィルタの残響時間は120ms未満である、請求項15乃至17の何れか1項に記載の方法。
  19. 前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)については、10kHz超の高周波数における前記差フィルタの残響時間は10ms未満であり、3kHzと4kHzの間の周波数における前記差フィルタの残響時間は40ms未満であり、2kHz未満の周波数における前記差フィルタの残響時間は80ms未満である、請求項15乃至18の何れか1項に記載の方法。
  20. 前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)については、前記差フィルタの残響時間は約800ms未満である、請求項15乃至19の何れか1項に記載の方法。
  21. 前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)については、前記差フィルタの残響時間は約400ms未満である、請求項15乃至20の何れか1項に記載の方法。
  22. 前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)については、前記差フィルタの残響時間は約200ms未満である、請求項15乃至21の何れか1項に記載の方法。
  23. 前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)については、
    前記和フィルタの残響時間は、前記周波数の増加に伴い減少し、
    前記和フィルタの残響時間は、100Hz未満のあらゆる周波数において、40ms以上160ms以下であり、
    前記和フィルタの残響時間は、100Hzと1kHzの間のあらゆる周波数において、20ms以上80ms以下であり、
    前記和フィルタの残響時間は、1kHzと2kHzの間のあらゆる周波数において、10ms以上20ms以下であり、
    前記和フィルタの残響時間は、2kHzと20kHzの間のあらゆる周波数において、5ms以上20ms以下である、請求項15乃至22の何れか1項に記載の方法。
  24. 前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)については、
    前記和フィルタの残響時間は、前記周波数の増加に伴い減少し、
    前記和フィルタの残響時間は、100Hz未満のあらゆる周波数において、60ms以上120ms以下であり、
    前記和フィルタの残響時間は、100Hzと1kHzの間のあらゆる周波数において、30ms以上60ms以下であり、
    前記和フィルタの残響時間は、1kHzと2kHzの間のあらゆる周波数において、15ms以上30ms以下であり、
    前記和フィルタの残響時間は、2kHzと20kHzの間のあらゆる周波数において、7ms以上15ms以下である、請求項15乃至23の何れか1項に記載の方法。
  25. 前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)については、
    前記和フィルタの残響時間は、前記周波数の増加に伴い減少し、
    前記和フィルタの残響時間は、100Hz未満のあらゆる周波数において、70ms以上90ms以下であり、
    前記和フィルタの残響時間は、100Hzと1kHzの間のあらゆる周波数において、35ms以上50ms以下であり、
    前記和フィルタの残響時間は、1kHzと2kHzの間のあらゆる周波数において、18ms以上25ms以下であり、
    前記和フィルタの残響時間は、2kHzと20kHzの間のあらゆる周波数において、8ms以上12ms以下である、請求項15乃至24の何れか1項に記載の方法
  26. 前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)については、前記バイノーラルフィルタの特性は、整合される一対のバイノーラルフィルタの特性から決まる、請求項15乃至25の何れか1項に記載の方法。
  27. 修正されたバイノーラルフィルタを生成するために一対の信号を処理する方法であって、
    オーディオ信号をバイノーラル化するように構成された一対の整合されるバイノーラルフィルタのインパルス応答を表す一対の対応する信号を受け付けるステップ(703)と、
    時変フィルタ特性を有する修正フィルタによってそれぞれ特徴付けられる一対のフィルタによって前記受け付けられた一対の信号の和フィルタおよび差フィルタ表現を処理するステップ(707)であって、前記処理は、一対の修正されたバイノーラルフィルタの前記インパルス応答を表す、対応する一対の修正された信号の和フィルタおよび差フィルタ表現を形成する、ステップと、を含み、
    これにより、前記修正されたバイノーラルフィルタは、オーディオ信号をバイノーラル化するように構成され、さらにモノフォニックミックスダウンにおいては知覚される残響が小さく、ヘッドホン経由の前記バイノーラルフィルタに対する影響が最小であるという特性を有するようになっており、
    修正されたバイノーラルフィルタは、修正された和フィルタと修正された差フィルタとによって特徴付けられ、前記時変フィルタは、
    修正されたバイノーラルフィルタのインパルス応答は、所定位置にある仮想スピーカを聴いている受聴者に対する頭部伝達関数によって規定された直接部分を含み、
    前記修正された和フィルタは、前記修正された差フィルタに比べ、レベルが低く、残響時間がより短く、
    前記和フィルタの前記インパルス応答の前記直接部分から前記和フィルタの前記無視しうるほど小さい応答部分への滑らかな移行があり、滑らかな移行は周波数選択的に経時的に起こる、
    ように構成される、
    方法。
  28. 修正されたバイノーラルフィルタを生成するために、左耳信号と右耳信号とを処理する方法であって、
    オーディオ信号をバイノーラル化するように構成された左耳および右耳のバイノーラルフィルタのインパルス応答を表す、対応する左耳信号と右耳信号とを受け付けるステップ(703)と、
    前記左耳信号と右耳信号との和に比例する和信号と、前記左耳信号と前記右耳信号の間の差に比例する差信号とを形成するために、前記左耳信号と右耳信号とをシャフリングするステップ(705)と、
    時変フィルタ特性を有する和フィルタによって前記和信号をフィルタリングするステップであって、前記フィルタリングはフィルタリングされた和信号を形成する、ステップ(707)と、
    前記和フィルタによって特徴付けられる差フィルタによって前記差信号を処理するステップであって、前記処理はフィルタリングされた差信号を形成する、ステップ(707)と、
    左耳および右耳の修正されたバイノーラルフィルタの前記インパルス応答を表す、対応する修正された左耳信号と修正された右耳信号とを形成するために、前記フィルタリングされた和信号と前記フィルタリングされた差信号とをアンシャフリングするステップ(709)と、を含み、
    前記修正されたバイノーラルフィルタは、オーディオ信号をバイノーラル化するように構成され、対応する修正された和フィルタと対応する修正された差フィルタとによって表現可能であり、さらに左耳出力と右耳出力とを有し、各対のバイノーラルフィルタは、左耳のバイノーラルフィルタと右耳のバイノーラルフィルタとによってそれぞれ表現可能であり、各フィルタはそのフィルタを特徴付けるインパルス応答をそれぞれ有し、
    少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)は、受聴者(107)への直接応答を対応する仮想スピーカ位置(209−1、...、209−M)から取り込むために、およびリスニングルームの初期反響と残響応答の両方を取り込むために、それぞれのオーディオ入力信号を空間化するように構成され、
    前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)については、
    前記和フィルタ(403)の時間周波数特性は、前記差フィルタ(404)の時間周波数特性とは異なり、前記和フィルタの残響時間は、あらゆる周波数において、前記差フィルタの残響時間、前記左耳フィルタの残響時間、および前記右耳フィルタの残響時間のどれよりも小さく、
    前記和フィルタの残響時間の複数の異なる周波数にわたる変化は、複数の周波数にわたる前記左耳フィルタの残響時間および前記右耳フィルタの残響時間のそれぞれの変化より大きく、前記和フィルタの残響時間は周波数の増加に伴い減少し、
    これにより、前記一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)によってフィルタリングされた前記1つ以上のオーディオ入力信号は、ヘッドホン(105)を通して再生されたときは空間的広がりを持って知覚され、またダウンミキシングによって、または相対的に狭い間隔で配置された複数のラウドスピーカによる再生によって、モノフォニックミックスを実現した後はモノフォニック再生されたときに良好に響く出力信号を生成し、前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)については、前記和フィルタのインパルス応答のその無視しうるほど低いレベルへの移行は、前記和フィルタのインパルス応答の初期期間にわたって周波数依存的に経時的に徐々に起こり、前記少なくとも一対のバイノーラルフィルタ(203−1、204−1、...、203−M、204−M)については、前記和フィルタは、前記移行期間にわたって初期の全帯域幅から低域カットオフに向かって周波数成分が減少するようになっている、
    方法。
  29. 前記修正された和信号は、前記時変フィルタリングによって引き起こされた前記修正された差信号の損失エネルギーがあればそれを補償するために適切にブーストされる、請求項28に記載の方法。
  30. 前記修正時変フィルタは、前記整合されるバイノーラルフィルタの前記和フィルタを表す信号を操作する和修正フィルタと、前記整合されるバイノーラルフィルタの前記差フィルタを表す信号を操作する差修正フィルタとによって表現可能であり、
    前記和修正フィルタは、40msより後の時点においては、前記整合されるバイノーラルフィルタの前記和フィルタを表す前記信号を大幅に減衰させ、前記差修正フィルタは、前記和修正フィルタの前記時変特性によって規定可能である、請求項27乃至29の何れか1項に記載の方法。
  31. 前記和修正フィルタは、時刻t=γにおけるインパルスに対する、tで示される時点における時変インパルス応答f(t,τ)によって特徴付けられ、前記和修正フィルタは、時変帯域幅を含む時変周波数応答によってさらに特徴付けられ、前記差修正フィルタの前記インパルス応答はf(t,τ)から決定可能であり、前記時変帯域幅は経時的に単調に狭まる、
    請求項30に記載の方法。
  32. 前記時変帯域幅は、ほぼ40msより長い時間において100Hz未満に滑らかに狭まる、請求項31に記載の方法。
  33. 前記差修正フィルタの前記インパルス応答は、
    Figure 0005298199
    に比例し、hD0(t)は、前記シャフリングから得られた前記差信号を示す、
    請求項31乃至32の何れか1項に記載の方法。
  34. 処理システムの少なくとも1つのプロセッサによって実行されたときに、請求項15乃至33の何れか1項に記載の方法の実施を引き起こすコンピュータプログラム。
  35. 処理システムの少なくとも1つのプロセッサによって実行されたときに、請求項15乃至33の何れか1項に記載の方法の実施を引き起こすコンピュータプログラムを内部に有するコンピュータ可読媒体。
  36. 少なくとも1つのプロセッサと、
    記憶デバイスと、
    を含む処理システムを備えた装置であって、
    前記記憶デバイスは、実行されたときに、請求項15乃至33の何れか1項に記載の方法を前記装置に実施させるコンピュータプログラムと共に構成される、装置。
JP2011529110A 2008-09-25 2009-09-15 モノフォニック対応およびラウドスピーカ対応のバイノーラルフィルタ Active JP5298199B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US9996708P 2008-09-25 2008-09-25
US61/099,967 2008-09-25
PCT/US2009/056956 WO2010036536A1 (en) 2008-09-25 2009-09-15 Binaural filters for monophonic compatibility and loudspeaker compatibility

Publications (2)

Publication Number Publication Date
JP2012503943A JP2012503943A (ja) 2012-02-09
JP5298199B2 true JP5298199B2 (ja) 2013-09-25

Family

ID=41346692

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011529110A Active JP5298199B2 (ja) 2008-09-25 2009-09-15 モノフォニック対応およびラウドスピーカ対応のバイノーラルフィルタ

Country Status (8)

Country Link
US (1) US8515104B2 (ja)
EP (4) EP3739908B1 (ja)
JP (1) JP5298199B2 (ja)
KR (1) KR101261446B1 (ja)
CN (1) CN102165798B (ja)
HK (1) HK1256734A1 (ja)
TW (1) TWI475896B (ja)
WO (1) WO2010036536A1 (ja)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9031268B2 (en) 2011-05-09 2015-05-12 Dts, Inc. Room characterization and correction for multi-channel audio
FR2976759B1 (fr) * 2011-06-16 2013-08-09 Jean Luc Haurais Procede de traitement d'un signal audio pour une restitution amelioree.
EP2642407A1 (en) * 2012-03-22 2013-09-25 Harman Becker Automotive Systems GmbH Method for retrieving and a system for reproducing an audio signal
WO2013142653A1 (en) * 2012-03-23 2013-09-26 Dolby Laboratories Licensing Corporation Method and system for head-related transfer function generation by linear mixing of head-related transfer functions
JP6160072B2 (ja) * 2012-12-06 2017-07-12 富士通株式会社 オーディオ信号符号化装置および方法、オーディオ信号伝送システムおよび方法、オーディオ信号復号装置
CN104982042B (zh) 2013-04-19 2018-06-08 韩国电子通信研究院 多信道音频信号处理装置及方法
WO2014171791A1 (ko) 2013-04-19 2014-10-23 한국전자통신연구원 다채널 오디오 신호 처리 장치 및 방법
WO2014177202A1 (en) * 2013-04-30 2014-11-06 Huawei Technologies Co., Ltd. Audio signal processing apparatus
DE102013217367A1 (de) * 2013-05-31 2014-12-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und verfahren zur raumselektiven audiowiedergabe
US9319819B2 (en) * 2013-07-25 2016-04-19 Etri Binaural rendering method and apparatus for decoding multi channel audio
KR101782916B1 (ko) * 2013-09-17 2017-09-28 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
US9426300B2 (en) 2013-09-27 2016-08-23 Dolby Laboratories Licensing Corporation Matching reverberation in teleconferencing environments
WO2015048551A2 (en) * 2013-09-27 2015-04-02 Sony Computer Entertainment Inc. Method of improving externalization of virtual surround sound
FR3012247A1 (fr) * 2013-10-18 2015-04-24 Orange Spatialisation sonore avec effet de salle, optimisee en complexite
WO2015060654A1 (ko) 2013-10-22 2015-04-30 한국전자통신연구원 오디오 신호의 필터 생성 방법 및 이를 위한 파라메터화 장치
WO2015099429A1 (ko) 2013-12-23 2015-07-02 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법, 이를 위한 파라메터화 장치 및 오디오 신호 처리 장치
EP3090576B1 (en) 2014-01-03 2017-10-18 Dolby Laboratories Licensing Corporation Methods and systems for designing and applying numerically optimized binaural room impulse responses
CN107750042B (zh) 2014-01-03 2019-12-13 杜比实验室特许公司 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频
CN104768121A (zh) 2014-01-03 2015-07-08 杜比实验室特许公司 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频
CN108600935B (zh) * 2014-03-19 2020-11-03 韦勒斯标准与技术协会公司 音频信号处理方法和设备
KR101882423B1 (ko) 2014-03-21 2018-08-24 후아웨이 테크놀러지 컴퍼니 리미티드 적어도 제1 쌍의 룸 임펄스 응답에 기초하여, 믹싱 시간 전체를 추정하는 장치 및 방법, 대응하는 컴퓨터 프로그램
KR101856127B1 (ko) 2014-04-02 2018-05-09 주식회사 윌러스표준기술연구소 오디오 신호 처리 방법 및 장치
US10015616B2 (en) 2014-06-06 2018-07-03 University Of Maryland, College Park Sparse decomposition of head related impulse responses with applications to spatial audio rendering
US9560464B2 (en) * 2014-11-25 2017-01-31 The Trustees Of Princeton University System and method for producing head-externalized 3D audio through headphones
EP4447494A2 (en) 2015-02-12 2024-10-16 Dolby Laboratories Licensing Corporation Headphone virtualization
CN109565633B (zh) * 2016-04-20 2022-02-11 珍尼雷克公司 有源监听耳机及其双声道方法
CN107358962B (zh) * 2017-06-08 2018-09-04 腾讯科技(深圳)有限公司 音频处理方法及音频处理装置
US10511909B2 (en) 2017-11-29 2019-12-17 Boomcloud 360, Inc. Crosstalk cancellation for opposite-facing transaural loudspeaker systems
FR3075443A1 (fr) * 2017-12-19 2019-06-21 Orange Traitement d'un signal monophonique dans un decodeur audio 3d restituant un contenu binaural
CN108156561B (zh) * 2017-12-26 2020-08-04 广州酷狗计算机科技有限公司 音频信号的处理方法、装置及终端
CN111630877B (zh) 2018-01-29 2022-05-10 索尼公司 声音处理装置、声音处理方法和程序
CN118574070A (zh) 2018-06-12 2024-08-30 奇跃公司 低频信道间相干性控制
WO2020216459A1 (en) * 2019-04-23 2020-10-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method or computer program for generating an output downmix representation
US11533560B2 (en) 2019-11-15 2022-12-20 Boomcloud 360 Inc. Dynamic rendering device metadata-informed audio enhancement system
EP3840405A1 (de) * 2019-12-16 2021-06-23 M.U. Movie United GmbH Verfahren und system zur übermittlung und wiedergabe akustischer informationen
CN113613143B (zh) * 2021-07-08 2023-06-13 北京小唱科技有限公司 适用于移动终端的音频处理方法、装置及存储介质

Family Cites Families (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4955057A (en) * 1987-03-04 1990-09-04 Dynavector, Inc. Reverb generator
JPH06121394A (ja) 1992-10-02 1994-04-28 Toshiba Corp 音声出力装置
JPH06165298A (ja) * 1992-11-24 1994-06-10 Nissan Motor Co Ltd 音響再生装置
JP2897586B2 (ja) * 1993-03-05 1999-05-31 ヤマハ株式会社 音場制御装置
US5371799A (en) * 1993-06-01 1994-12-06 Qsound Labs, Inc. Stereo headphone sound source localization system
EP0641139B1 (en) 1993-07-13 2002-09-11 Hewlett-Packard Company, A Delaware Corporation Merging audio and telephone data for a computer
JP3637596B2 (ja) * 1994-01-27 2005-04-13 ソニー株式会社 オーディオ再生装置およびヘッドホン
US5436975A (en) * 1994-02-02 1995-07-25 Qsound Ltd. Apparatus for cross fading out of the head sound locations
US5596644A (en) * 1994-10-27 1997-01-21 Aureal Semiconductor Inc. Method and apparatus for efficient presentation of high-quality three-dimensional audio
US5943427A (en) * 1995-04-21 1999-08-24 Creative Technology Ltd. Method and apparatus for three dimensional audio spatialization
GB9606814D0 (en) * 1996-03-30 1996-06-05 Central Research Lab Ltd Apparatus for processing stereophonic signals
US6009178A (en) * 1996-09-16 1999-12-28 Aureal Semiconductor, Inc. Method and apparatus for crosstalk cancellation
US5809149A (en) * 1996-09-25 1998-09-15 Qsound Labs, Inc. Apparatus for creating 3D audio imaging over headphones using binaural synthesis
US6421446B1 (en) * 1996-09-25 2002-07-16 Qsound Labs, Inc. Apparatus for creating 3D audio imaging over headphones using binaural synthesis including elevation
US5912976A (en) * 1996-11-07 1999-06-15 Srs Labs, Inc. Multi-channel audio enhancement system for use in recording and playback and methods for providing same
JPH1188994A (ja) 1997-09-04 1999-03-30 Matsushita Electric Ind Co Ltd 音像定位装置及び音像制御方法
US6198826B1 (en) * 1997-05-19 2001-03-06 Qsound Labs, Inc. Qsound surround synthesis from stereo
US6067361A (en) * 1997-07-16 2000-05-23 Sony Corporation Method and apparatus for two channels of sound having directional cues
WO1999014983A1 (en) * 1997-09-16 1999-03-25 Lake Dsp Pty. Limited Utilisation of filtering effects in stereo headphone devices to enhance spatialization of source around a listener
CA2325482C (en) 1998-03-25 2009-12-15 Lake Technology Limited Audio signal processing method and apparatus
US6990205B1 (en) * 1998-05-20 2006-01-24 Agere Systems, Inc. Apparatus and method for producing virtual acoustic sound
US6590983B1 (en) * 1998-10-13 2003-07-08 Srs Labs, Inc. Apparatus and method for synthesizing pseudo-stereophonic outputs from a monophonic input
JP4499206B2 (ja) * 1998-10-30 2010-07-07 ソニー株式会社 オーディオ処理装置及びオーディオ再生方法
TW437256B (en) * 1999-03-12 2001-05-28 Ind Tech Res Inst Apparatus and method for virtual sound enhancement
AU2001261344A1 (en) * 2000-05-10 2001-11-20 The Board Of Trustees Of The University Of Illinois Interference suppression techniques
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
JP4130779B2 (ja) * 2003-03-13 2008-08-06 パイオニア株式会社 音場制御システム及び音場制御方法
US20040213415A1 (en) * 2003-04-28 2004-10-28 Ratnam Rama Determining reverberation time
US7522733B2 (en) 2003-12-12 2009-04-21 Srs Labs, Inc. Systems and methods of spatial image enhancement of a sound source
US20050147261A1 (en) * 2003-12-30 2005-07-07 Chiang Yeh Head relational transfer function virtualizer
EP1571768A3 (en) * 2004-02-26 2012-07-18 Yamaha Corporation Mixer apparatus and sound signal processing method
CN1965610A (zh) 2004-06-08 2007-05-16 皇家飞利浦电子股份有限公司 编码混响声音信号
TWI249361B (en) * 2004-09-21 2006-02-11 Formosa Ind Computing Inc Cross-talk Cancellation System of multiple sound channels
US7634092B2 (en) * 2004-10-14 2009-12-15 Dolby Laboratories Licensing Corporation Head related transfer functions for panned stereo audio content
EP1803115A2 (en) * 2004-10-15 2007-07-04 Koninklijke Philips Electronics N.V. A system and a method of processing audio data to generate reverberation
NO328256B1 (no) 2004-12-29 2010-01-18 Tandberg Telecom As Audiosystem
EP1905004A2 (en) 2005-05-26 2008-04-02 LG Electronics Inc. Method of encoding and decoding an audio signal
US8331603B2 (en) * 2005-06-03 2012-12-11 Nokia Corporation Headset
JP5108767B2 (ja) 2005-08-30 2012-12-26 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
CN101263739B (zh) * 2005-09-13 2012-06-20 Srs实验室有限公司 用于音频处理的系统和方法
KR100739776B1 (ko) * 2005-09-22 2007-07-13 삼성전자주식회사 입체 음향 생성 방법 및 장치
KR100636252B1 (ko) * 2005-10-25 2006-10-19 삼성전자주식회사 공간 스테레오 사운드 생성 방법 및 장치
KR100708196B1 (ko) * 2005-11-30 2007-04-17 삼성전자주식회사 모노 스피커를 이용한 확장된 사운드 재생 장치 및 방법
CN101401455A (zh) * 2006-03-15 2009-04-01 杜比实验室特许公司 使用子带滤波器的立体声呈现技术
US9100765B2 (en) 2006-05-05 2015-08-04 Creative Technology Ltd Audio enhancement module for portable media player
US8619998B2 (en) * 2006-08-07 2013-12-31 Creative Technology Ltd Spatial audio enhancement processing method and apparatus
TW200743871A (en) * 2006-05-29 2007-12-01 Kenmos Technology Co Ltd Combination of a light source for a direct-type backlight module
US7876903B2 (en) * 2006-07-07 2011-01-25 Harris Corporation Method and apparatus for creating a multi-dimensional communication space for use in a binaural audio system
US8391504B1 (en) * 2006-12-29 2013-03-05 Universal Audio Method and system for artificial reverberation employing dispersive delays
EP1962559A1 (en) * 2007-02-21 2008-08-27 Harman Becker Automotive Systems GmbH Objective quantification of auditory source width of a loudspeakers-room system
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound

Also Published As

Publication number Publication date
US8515104B2 (en) 2013-08-20
KR101261446B1 (ko) 2013-05-10
TW201031234A (en) 2010-08-16
EP3340660B1 (en) 2020-03-04
EP2329661B1 (en) 2018-03-21
HK1256734A1 (zh) 2019-10-04
WO2010036536A1 (en) 2010-04-01
KR20110074566A (ko) 2011-06-30
CN102165798B (zh) 2013-07-17
JP2012503943A (ja) 2012-02-09
EP4274263A3 (en) 2024-01-24
EP2329661A1 (en) 2011-06-08
EP3739908B1 (en) 2023-07-12
EP3739908A1 (en) 2020-11-18
US20110170721A1 (en) 2011-07-14
TWI475896B (zh) 2015-03-01
EP3340660A1 (en) 2018-06-27
CN102165798A (zh) 2011-08-24
EP4274263A2 (en) 2023-11-08

Similar Documents

Publication Publication Date Title
JP5298199B2 (ja) モノフォニック対応およびラウドスピーカ対応のバイノーラルフィルタ
US11272311B2 (en) Methods and systems for designing and applying numerically optimized binaural room impulse responses
JP7536846B2 (ja) 少なくとも一つのフィードバック遅延ネットワークを使ったマルチチャネル・オーディオに応答したバイノーラル・オーディオの生成
JP6607895B2 (ja) 少なくとも一つのフィードバック遅延ネットワークを使ったマルチチャネル・オーディオに応答したバイノーラル・オーディオの生成
US20100158258A1 (en) Binaural Sound Localization Using a Formant-Type Cascade of Resonators and Anti-Resonators
CN109155896B (zh) 用于改进音频虚拟化的系统和方法
JP2010534012A (ja) 強化された知覚的品質を備えたステレオ信号を生成する方法及び装置
EP2484127B1 (en) Method, computer program and apparatus for processing audio signals
JP5651813B1 (ja) 音声信号処理装置、および音声信号処理方法
Liitola Headphone sound externalization

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130305

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130312

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130508

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130528

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130617

R150 Certificate of patent or registration of utility model

Ref document number: 5298199

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250