JP2016516355A - スピーカアレイを用いた堅牢なクロストークキャンセル - Google Patents

スピーカアレイを用いた堅牢なクロストークキャンセル Download PDF

Info

Publication number
JP2016516355A
JP2016516355A JP2016502158A JP2016502158A JP2016516355A JP 2016516355 A JP2016516355 A JP 2016516355A JP 2016502158 A JP2016502158 A JP 2016502158A JP 2016502158 A JP2016502158 A JP 2016502158A JP 2016516355 A JP2016516355 A JP 2016516355A
Authority
JP
Japan
Prior art keywords
listener
audio
room
microphones
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016502158A
Other languages
English (en)
Other versions
JP6193468B2 (ja
Inventor
マーティン イー ジョンソン
マーティン イー ジョンソン
ロナルド エヌ アイザック
ロナルド エヌ アイザック
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Apple Inc
Original Assignee
Apple Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Apple Inc filed Critical Apple Inc
Publication of JP2016516355A publication Critical patent/JP2016516355A/ja
Application granted granted Critical
Publication of JP6193468B2 publication Critical patent/JP6193468B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/301Automatic calibration of stereophonic sound system, e.g. with test microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/02Spatial or constructional arrangements of loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2203/00Details of circuits for transducers, loudspeakers or microphones covered by H04R3/00 but not provided for in any of its subgroups
    • H04R2203/12Beamforming aspects for stereophonic sound reproduction with loudspeaker arrays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Stereophonic System (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Abstract

スピーカアレイを用いてクロストークキャンセルを実行するオーディオ受信機が記載されている。オーディオ受信機は、部屋におけるリスナの位置を検出し、1つ以上のビームパターン行列を用いて、スピーカアレイを通して出力される1本の音声プログラムコンテンツを処理する。ビームパターン行列は、1つ以上の制約条件によって、生成する。制約条件として、リスナの右の耳において、右のチャネルを増大させ、かつ、左のチャネルを減少させること、リスナの左耳において、左のチャネルを増大させ、かつ、右のチャネルを減少させること、及び、部屋の全ての他の領域における音声を減少させること、を挙げることができる。これらの制約条件によって、オーディオ受信機は、部屋の周波数応答に対する変動の影響を最小にしてクロストークキャンセルが達成されるように、部屋の他の領域ではなく、主にリスナの方へ音を放射する。他の実施形態もまた記載されている。

Description

〔関連事項〕
本出願は、米国仮出願第61/782,287号(2013年3月14日出願)の、先の出願日の利益を主張する。
スピーカアレイを用いて、一つ以上の制約条件を達成することによって、クロストークキャンセルを実行するオーディオ受信機について説明する。他の実施形態についてもまた説明する。
単一のラウドスピーカは、リスナの両耳に、音を生成することができる。例えば、リスナの左側のラウドスピーカは、リスナの右耳に、それでもなお、いくらかの音を生成する。クロストークキャンセラの目的は、別の耳には音を生成することなく、リスナの耳の一つに音を生成することができることである。この分離により、任意の音を、他の耳に流出することなく、1つの耳に生成できる。独立して各耳で音を制御することは、音がラウドスピーカから離れた位置から到来するという印象を引き起こすために、用いることができる。
原則として、クロストークキャンセラは、音を2つの耳で別々に制御するのに、ただ2台のスピーカ(すなわち、2自由度)を必要とするだけである。多くのクロストークキャンセラは、リスナの頭のまわりで回折する音によって生成される影響(通常、頭部伝達関数(HRTFs)として知られている)を補償することによって、リスナの耳における音を制御する。右のオーディオ入力チャネルをdR、及び左のオーディオ入力チャネルをdLと想定すると、クロストークキャンセラは、以下のように表すことができる。
この式で、ラウドスピーカから到来する音によるリスナ頭部の伝達関数Hは、伝達関数の逆関数H-1によって補償され、リスナの右及び左の耳でそれぞれ、右の出力チャネルfR及び左の出力チャネルfLを生じる。2台のスピーカだけを使う多くのクロストークキャンセラは、一部の周波数で状態調整が悪いことを欠点としている。
例えば、これらのシステムのラウドスピーカは、クロストークキャンセルを達成するために、大信号で駆動する必要があり、理想状態からの変化に非常に敏感である。言い換えると、システムが推定された伝達関数H(ラウドスピーカからリスナの耳への音の伝搬を表す)を用いて設計されるならば、Hの小さな変化により、クロストークキャンセラは動作を停止する可能性がある。この1つの例は、伝達関数Hは無響の環境(すなわち、音響反射のない)で測定されるにも関わらず、その後、実施されるのは多数の反射のある実際の部屋の場合である。
発明の一実施例は、複数のトランスデューサを有するスピーカアレイを用いて、クロストークキャンセルを実行するオーディオ受信機である。オーディオ受信機は、部屋又はリスニング領域でのリスナの位置を検出し、続いて、リスナが検出された位置に対応する一つ以上のビームパターン行列を用いて、1本の音声プログラムコンテンツを処理して、スピーカアレイにより出力する。ビームパターン行列は、特定の可聴周波数に各々対応し、一つ以上の制約条件に従って発生する。そして、オーディオ受信機にあらかじめセットすることができる。この制約条件として、以下を挙げることができる。(1)リスナの左耳で、1本の音声プログラムコンテンツの左のチャネルを最大にすること/増大させること、及び、右のチャネルを最小にすること/及び減少させること、(2)リスナの右耳で、右のチャネルを最大にすること/増大させること、及び、左のチャネルを最小にすること/及び減少させること、並びに、(3)部屋の全ての他の領域で、音声を最小にすること/減少させること、である。これらの制約により、オーディオ受信機は、主にリスナの方へ音を放射することになる。部屋の他の領域ではなく、リスナの方へ音を放射することによって、部屋の周波数応答への変化による影響が最小か又は減じた状態で、クロストークキャンセルが達成される。
上記概要には、本発明の全ての態様の網羅的なリストを挙げてはいない。本発明には、前述でまとめた種々の態様の全ての好適な組合せからの実施可能な全てのシステム及び方法が含まれ、並びに以下の詳細な説明で開示されるもの、特に出願と共に提出された請求項において指摘されるものが含まれると考えられる。このような組合せには、上記概要では具体的には説明されていない特定の優位性がある。
本発明の実施形態を、限定としてではなく例として、添付図面の図に示し、図面中、同様の参照符号は同様の要素を示す。本開示での、本発明の「an」又は「1つの」実施形態への言及は、必ずしも同じ実施形態に対するものではなく、それらは、少なくとも1つを意味していることに留意されたい。
一実施形態に係るオーディオシステムを有する部屋又はリスニング領域を示す。 別の実施形態に係るオーディオシステムを有する部屋又はリスニング領域を示す。 一実施形態に係る単一キャビネットに収納されたラウドスピーカアレイを示す。 別の実施形態に係る単一キャビネットに収納されたラウドスピーカアレイを示す。 一実施形態に係るオーディオ受信機の機能単位ブロック図及び若干の構成ハードウェア構成要素を示す。 部屋の最初の場所でのリスナを示す。 部屋の第2の場所でのリスナを示す。 一実施形態に係る、1組のマイクを用いて、単独のリスナ用のビームパターン行列を生成するためのシステムを示す。 一実施形態に係る、1組のマイクを用いて、複数のリスナ用のビームパターン行列を生成するためのシステムを示す。 一実施形態に係る、図5A及び図5Bに示されるマイク構成を用いて、ビームパターン行列を生成する方法を示す。
以下、いくつかの実施形態について、添付の図面を参照しながら説明する。詳細について多く説明されるが、当然のことながら、本発明のいくつかの実施形態は、これらの詳細なしに実施してもよい。他の例では、本説明の理解を不明瞭にすることがないように、周知の回路、構造、及び技術について、詳細には示されていない。
図1Aは、外部音源2、オーディオ受信機3及び一つ以上のラウドスピーカアレイ4を含むオーディオシステム1を示す。オーディオシステム1は、意図されたリスナ6が位置する部屋又はリスニング領域7に音声プログラムコンテンツを出力する。リスナ6は、習慣的に、オーディオシステム1が主に方向を定め又は標的とする目標位置の席に着く。目標位置は、通常は部屋7の中央にあるが、部屋7の任意の指定領域とすることができる。
外部音源2は、1つ以上の音声ストリーム(音声プログラムコンテンツを表す)を、処理のために、オーディオ受信機3に送信可能な任意のデバイスとすることができる。例えば、図1Aのシステム1の外部音源2は、一つ以上の音声ストリーム(音声プログラムコンテンツを表現)を、処理のために、有線又は無線の接続のどちらかにより、オーディオ受信機3に送信するラップトップコンピュータである。別の実施形態では、外部音源2は、その代わりに、1つ以上のデスクトップコンピュータ、タブレット型コンピュータ、モバイル機器(例えば、携帯電話又はモバイル音楽プレーヤー)、及び、遠隔メディアサーバ(例えば、インターネットストリーム音楽又は映画サービス)とすることができる。
図1Aで示すように、オーディオシステム1の構成要素は、異なるユニットに分散され、収容される。これに対して、図1Bのオーディオシステム1の実施形態で示すように、オーディオ受信機3は、ラウドスピーカアレイ4の中に統合されて、独立型ユニットを提供する。この実施形態では、ラウドスピーカアレイ4は、有線又は無線の接続のどちらかにより、音声プログラムコンテンツを表す1つ以上の音声ストリームを、外部音源2から直接受信する。
外部音源2から音声ストリームを受信するとして説明しているが、音声受信器3は、記憶媒体に、ローカルに記憶される音声ストリームにアクセスすることができる。この実施形態では、オーディオ受信機3は、外部音源2と連携することなく、ローカルな記憶媒体から、処理のために、音声ストリームを読み出す。
以下でより詳細に説明するように、オーディオ受信機3は、音声ストリームの処理及び一つ以上のラウドスピーカアレイ4の駆動用の任意のデバイスの種類又はデバイスのセットとすることができる。例えば、オーディオ受信機3は、ラップトップコンピュータ、デスクトップコンピュータ、タブレット型コンピュータ、モバイル機器、又はホームシアターオーディオ受信機とすることができる。
次にラウドスピーカアレイ4を参照すると、図2Aは、単一キャビネット6に収容された複数のトランスデューサ5を有するスピーカアレイ4を示す。この例で、スピーカアレイ4は、キャビネット6内で、8つの行及び4つの列で均一に整列した32個の互いに異なるトランスデューサ5を有する。別の実施形態では、異なる数のトランスデューサ5は、均一な又は不均一な間隔で、用いることができる。例えば、図2Bに示すように、10個のトランスデューサ5は、キャビネット6内で一直線に並んで、サウンドバースタイルのスピーカアレイ4を形成することができる。平坦な面又は直線状に整列して示されているが、トランスデューサ5は、円弧に沿って湾曲した形態で整列させることができる。
トランスデューサ5は、フルレンジドライバ、ミッドレンジドライバ、サブウーファー、ウーファー及びツィータの任意の組合せとすることができる。トランスデューサ5の各々は、軽量ダイアフラム又は柔軟なサスペンションを介して、硬質のバスケット又はフレームに接続されるはコーンを用いることができる。このサスペンションは、円筒状の磁気間隙の中を電線コイル(例えば、ボイスコイル)が軸方向に動くことを制限する。電気オーディオ信号がボイスコイルに印加されると、ボイスコイルの電流によって磁場が生成され、可変の電磁石を形成する。コイル及びトランスデューサ5の磁気システムは、相互に作用して、コイル(したがって、それに結合しているコーン)を前後に動かす機械力を生成する。これによって、発生源(例えば、信号プロセッサ、コンピュータ、及びオーディオ受信機)から到来する印加された電気オーディオ信号の制御下で、音を再生する。単一のキャビネット6に収容された複数のトランスデューサ5を有するとして本明細書で説明しているが、別の実施形態では、スピーカアレイ4は、キャビネット6に収容された単一のトランスデューサ5を含むことができる。これらの実施形態では、スピーカアレイ4は、独立型のラウドスピーカである。
各トランスデューサ5は、異なる個別のオーディオ信号に応じて、個々に別々に駆動して音を発生することができる。
スピーカアレイ4のトランスデューサ5が、異なるパラメータ及び設定(遅延及びエネルギレベルを含む)に応じて、個々に別々に駆動されることを可能にすることによって、スピーカアレイ4は、多数の指向性パターンを発生することができる。この指向性パターンは、リスナ6に対して再生される音声プログラムコンテンツのそれぞれのチャネルを、シミュレートするか又はより十分に表現する。例えば、異なる幅及び指向性のビームパターンを、スピーカアレイ4によって放射することができる。
図1Aに示すように、スピーカアレイ4は、オーディオ受信機3に接続する電線又は導管を含むことができる。例えば、各スピーカアレイ4は、2つの配線ポイントを含むことができ、オーディオ受信機3は補完的な配線ポイントを含むことができる。配線ポイントは、それぞれ、スピーカアレイ4及びオーディオ受信機3の裏の結合ポスト又はばねクリップとすることができる。電線は、スピーカアレイ4をオーディオ受信機3に電気的に接続するために、それぞれの配線ポイントのまわりに別々に巻き付けるか、さもなければ結合する。
別の実施形態では、図1Bに示すように、スピーカアレイ4は、無線のプロトコルを用いて、アレイ4及びオーディオ受信機3が物理的に接続されないが無線周波接続を維持するように、オーディオ受信機3に接続することができる。例えば、スピーカアレイ4は、オーディオ受信機3の対応するWiFi送信器からのオーディオ信号受信用のWiFi受信器を含むことができる。いくつかの実施形態では、スピーカアレイ4は、オーディオ受信機3から受信する無線のオーディオ信号を用いて、トランスデューサ5を駆動する一体型の増幅器を含むことができる。上述したように、スピーカアレイ4は、以下に説明する技術による信号処理、及び、各トランスデューサ5駆動用の構成要素を含む独立型ユニットとすることができる。
2つのスピーカアレイ4を含むものとして、図1Aに示されているが、音声システム1は、無線の又は有線の接続によってオーディオ受信機3に接続する任意の数のスピーカアレイ4を含むことができる。例えば、オーディオシステム1は、前面左のチャネル、前面中心チャネル、前面右のチャネル、後部の右のサラウンドチャネル、後部の左のサラウンドチャネル及び低周波チャネル(例えば、サブウーファー)を表す6つのスピーカアレイ4を含むことができる。別の実施形態では、図1Bに示すように、オーディオシステム1は、単一のスピーカアレイ4を含むことができる。この単一のスピーカアレイ4は、サウンドバースタイルのスピーカアレイとすることができる。
図3は、一実施形態に係る、機能単位ブロック図及びオーディオ受信機3の若干の構成ハードウェア構成要素を示す。図3に示される構成要素は、オーディオ受信機3に含まれる要素を代表するものであり、他の構成要素を排除するものとして解釈してはならない。図3の各要素は、以下に例として説明する。
オーディオ受信機3は、一つ以上の外部音源2からの電気、無線又は光学の信号を用いて、音声プログラムコンテンツの一つ以上のチャネルを受信する複数の入力8を含むことができる。
入力8は、デジタル入力8A及び8B、並びに、アナログ入力8C及び8Dのセット(オーディオ受信機3の露出表面に位置する物理的コネクタのセットを含む)とすることができる。例えば、入力8として、高解像度マルチメディアインタフェース(HDMI(登録商標))入力、光学デジタル入力(TOSLINK)、同軸デジタル入力及びフォノ入力を挙げることができる。一実施形態では、オーディオ受信機3は、外部音源2との無線接続を通して、オーディオ信号を受信する。本実施形態では、入力8として、無線プロトコルを用いた外部音源2との通信用の無線アダプタが挙げられる。例えば、無線アダプタは、BLUETOOTH(登録商標)、IEEE(登録商標)802.11x、セルラ広域自動車通信システム(GSM(登録商標))、セルラ符号分割多元接続(CDMA)又は長期的進化(LTE)を用いて通信することができる。
図1A及び図1Bに示し、並びに上述したように、外部音源2は、ラップトップコンピュータ、又は、無線若しくは有線の接続によって、オーディオ受信機3に、音声プログラムコンテンツの一つ以上のチャネルを送信することができる任意のデバイスとすることができる。一実施形態では、外部音源2及びオーディオ受信機3は、1つの、分割できないユニットに統合されている。本実施形態では、ラウドスピーカアレイ4もまた、同じユニットに統合することができる。例えば、外部音源2及びオーディオ受信機3は、ユニットの左右の側に統合されたトランスデューサ5を有する1つのコンピュータに搭載することができる。
オーディオ受信機3に戻って、入力8からの全般的な信号の流れを次に説明する。最初にデジタル入力8A及び8Bを見て、入力8A及び/又は8Bを通してデジタルオーディオ信号を受信すると、オーディオ受信機3は、復号器9A又は9Bを用いて、電気、光又は無線の信号を、音声プログラムコンテンツを表す1組のオーディオチャネルに復号化する。例えば、復号器9Aは、6本のオーディオチャネル(例えば、5.1の信号)を含む単一の信号を受信し、6本のオーディオチャネルに信号を復号化することができる。復号器9は、任意の符復号器又は技法(先進的音響符号化(AAC(登録商標))、MPEGオーディオレイヤ2、MPEGオーディオレイヤ3及びFree Lossless Audio Codec(FLAC)を含む)を用いて、コード化されたオーディオ信号を復号化することができる。
アナログ入力8C及び8Dを参照すると、アナログ入力8C及び8Dによって受信される各アナログ信号は、音声プログラムコンテンツの単一のオーディオチャネルを表すことができる。したがって、複数のアナログ入力8C及び8Dは、1本の音声プログラムコンテンツの各チャネルを受信する必要があり得る。オーディオチャネルは、各アナログ/デジタル変換器10A及び10Bによってデジタル化され、デジタルオーディオチャネルを形成することができる。
復号器9A及び9B、並びにアナログ/デジタル変換器10A及び10Bの各々からのデジタルオーディオチャネルは、マルチプレクサ12に出力される。
マルチプレクサ12は、制御信号13に基づいて、1組のオーディオチャネルを選択的に出力する。制御信号13は、オーディオ受信機3の制御回路若しくはプロセッサから、又は外部装置から受信することができる。例えば、オーディオ受信機3の動作モードを制御する制御回路は、1組のデジタルオーディオチャネルを選択的に出力するマルチプレクサ12に、制御信号13を出力することができる。
マルチプレクサ12は、アレイプロセッサ14に選択されたデジタルオーディオチャネルを供給する。マルチプレクサ12によって出力されたチャネルは、アレイプロセッサ14によって処理され、1組の処理されたオーディオチャネルを生成する。この処理は、高速フーリエ変換(FFT)などの変換を用いて、時間及び周波数の双方の領域で、動作することができる。アレイプロセッサ14は、特定用途向け集積回路(ASICs)などの専用プロセッサ、多目的マイクロプロセッサ、フィールドプログラマブルゲートアレイ(FPGA)、デジタル信号コントローラ、又は1組のハードウェア論理構造(例えば、フィルタ、演算論理ユニット、及び専用の状態機械)とすることができる。アレイプロセッサ14は、位置推定器15及び/又はクロストーク行列発生器16からの入力に基づいて、スピーカアレイ4のトランスデューサ5を駆動する1組の信号を生成する。
位置推定器15は、部屋7における1人以上の人間であるリスナの位置を決定する。例えば、位置推定器15は、部屋7のリスナ6の物理的座標、又は、スピーカアレイ4(例えば、スピーカアレイ4に対する距離及び角度、又は座標)に対するリスナ6の位置を決定することができる。図4Aは、部屋7において、スピーカアレイ4に対する座標xA、yAの位置にいるリスナ6を示す。リスナ6が部屋7の中を移動するにつれ、そして、音がスピーカアレイ4によって放出されている間、位置推定器15はリスナ6の位置を決定する。単一のリスナ6に関して説明しているが、位置推定器15は部屋7にいる複数のリスナ6の位置を決定することができる。本明細書に記載する位置推定器15は、部屋7にいるリスナ6の位置を適応的に決定するが、一実施形態では、位置推定器は、リスナ6の位置は、最初の位置決定の後、固定されるとみなす。
位置推定器15は、リスナ6の位置を決定する任意のデバイス又はアルゴリズムを用いることができる。一実施形態では、ユーザ入力デバイス17は、リスナ6の位置決定を支援する位置推定器15に接続する。ユーザ入力デバイス17により、リスナ6は、スピーカアレイ4又は部屋7にある別の既知の物体に対するリスナ6の位置を、定期的に入力することができる。例えば、映画を見ている間、リスナ6は、図4Aに示すように、スピーカアレイ4に対して、座標xA、yAを有するソファにまず最初に座る場合がある。リスナ6は、ユーザ入力デバイス17を用いて、この位置を位置推定器15に入力することができる。映画の中ほどで、リスナ6は、図4Bに示すように、スピーカアレイ4に対してxB、yBに位置するテーブルに移動することを決定する場合がある。この移動に基づいて、リスナ6は、ユーザ入力デバイス17を用いて、この新しい位置を位置推定器15に入力することができる。ユーザ入力デバイス17は、有線若しくは無線のキーボード、モバイル機器、又は、リスナ6が位置を位置推定器15に入力することができる任意の他の同様な機器、とすることができる。一実施形態では、入力された値は、非数値又は相対値である。例えば、リスナ6は、自分がスピーカアレイ4の右側に位置することを指示することができる。
別の実施形態では、リスナ6の位置決定を支援するために、マイク18を位置推定器15に接続することができる。本実施形態では、マイク18は、リスナ6と共に、又はリスナ6に近接して位置する。オーディオ受信機3は、スピーカアレイ4を駆動して1組のテスト音声を放出し、このテスト音声は、マイク18で検知され、処理のために位置推定器15に供給される。位置推定器15は、検知された音に基づいて、スピーカアレイ4からマイク18まで伝搬するさいのテスト音声の伝搬遅延を判断する。この伝搬遅延は、スピーカアレイ4に対するリスナ6の位置を決定するために、その後用いることができる。
マイク18は、有線又は無線の接続を用いて、位置推定器15に接続することができる。一実施形態では、マイク18はモバイル機器(例えば、携帯電話)に一体化され、検知された音は1つ以上の無線プロトコル(例えば、BLUETOOTH及びIEEE 802.11x)を用いて、位置推定器15に送信される。マイク18は、任意の種類の音響/電気トランスデューサ又はセンサ(微小電子機械システム(MEMS)マイクロホン、圧電マイクロホン、エレクトレットコンデンサマイクロホン、又はダイナミックマイクロホンなど)とすることができる。マイク18は、カーディオイド、全方向性、及び8の字型などの極性パターンの範囲を提供することができる。一実施形態では、マイク18の極性パターンは、時間と共に連続的に変動する可能性がある。単一のマイク18として示され説明されているが、1つの実施形態では、複数のマイクロホン又はマイクアレイを、部屋7の音を検知するために用いることができる。
別の実施形態では、リスナ6の位置決定を支援するために、カメラ19を位置推定器15に接続することができる。カメラ19は、部屋7に対して、スピーカアレイ4と同じ方向を向いているビデオカメラ又は静止画像カメラとすることができる。カメラ19は、スピーカアレイ4の前にある領域のビデオ、又は1組の静止画像を記録する。これらの記録に基づいて、カメラ19は、単独で又は位置推定器15と連携して、リスナ6の顔又は体の他の部分を追尾する。位置推定器15は、この顔/体の追尾に基づいて、リスナ6の位置を決定することができる。一実施形態では、スピーカアレイ4が音声プログラムコンテンツを出力する間、リスナ6の位置が更新されて正確であり続けることができるように、カメラ19は定期的にリスナ6の形体を追尾する。例えば、歌がスピーカアレイ4を通して再生される間、カメラ19は連続的にリスナ6を追尾することができる。
カメラ19は、有線又は無線の接続を用いて、位置推定器15に接続することができる。一実施形態では、カメラ19はモバイル機器(例えば、携帯電話)に一体化され、記録されたビデオ又は静止画像は1つ以上の無線プロトコル(例えば、BLUETOOTH及びIEEE 802.11x)を用いて、位置推定器16に送信される。単一のカメラ18として示され説明されているが、1つの実施形態では、複数のカメラは、顔/体の追尾に用いることができる。
更に別の実施形態では、1つ以上の赤外線(IR)センサ20が、位置推定器15に接続される。IRセンサ20は、スピーカアレイ4の前の領域にある物体から放射されるIR光を捕捉する。これらの検知されたIRの測定値に基づいて、位置推定器15は、リスナ6の位置を決定することができる。一実施形態では、スピーカアレイ4が音声を出力する間、リスナ6の位置が更新されて正確であり続けることができるように、IRセンサ20は定期的に作動する。例えば、歌がスピーカアレイ4を通して再生される間、IRセンサ20は、連続的にリスナ6を追尾することができる。
赤外センサ20は、有線又は無線の接続を用いて、位置推定器15に接続することができる。一実施形態では、IRセンサ20はモバイル機器(例えば、携帯電話)に一体化され、検知された赤外線は、1つ以上の無線プロトコル(例えば、BLUETOOTH及びIEEE 802.11x)を用いて、位置推定器15に送信される。
単一のリスナ6に関して上述したが、一実施形態では、位置推定器15は、スピーカアレイ4に対する複数のリスナ6の位置を決定することができる。本実施形態では、リスナ6の各位置は、スピーカアレイ4によって放出される音を調節するために用いる。
上述した技法の任意の組合せを用いて、位置推定器15は、リスナ6の位置を計算し、処理のために、クロストーク行列発生器16にそれを供給する。クロストーク行列発生器16は、リスナ6の検出された位置に基づいて、ビームパターン行列を読み出す。読み出されたビームパターン行列は、スピーカアレイ4を通して音を放出するための、一つ以上のあらかじめ定義された制約条件を達成する。一実施形態では、この制約条件の中に、以下のものを含む。(1)リスナ6の左耳で、1本の音声プログラムコンテンツの左のチャネルを最大にすること/増大させること、及び、右のチャネルを最小にすること/及び減少させること、(2)リスナ6の右耳で、右のチャネルを最大にすること/増大させること、及び、左のチャネルを最小にすること/及び減少させること、並びに、(3)部屋7の他の全ての領域で、音声を最小にすること/減少させること、である。ビームパターン行列を生成する方法は、以下でより詳細に説明する。
一実施形態では、1つの耳において、第2のチャネルを最小にする間、第1のチャネルを最大にする/増大させることとして、その耳において、第2のチャネルを減少させるか又は除去している間、その耳で、第1のチャネルの感知される音を増大させることを挙げることができる。この認識は、第1のチャネルのパワーが第2のチャネルのパワーよりかなり大きいことによって、画定することができる。
右のオーディオ入力チャネルをdR、及び左のオーディオ入力チャネルをdLと想定すると、ビームパターン行列は、リスナの右及び左の耳で、右の出力チャネルfR及び左の出力チャネルfLをそれぞれ生成する。これは以下の式によって表すことができる。ここで、Gはビームパターン行列である。
この式で、リスナの右及び左の耳でそれぞれ生成される右の出力チャネルfR及び左の出力チャネルfLは、右のオーディオ入力チャネルdR及び左のオーディオ入力チャネルdLに実質的にそれぞれ同様又は同一である。
一実施形態では、オーディオ受信機3は、部屋7で、1人以上のリスナ6のスピーカアレイ4に対する異なる位置に対応する複数のビームパターン行列を格納する。例えば、オーディオ受信機3は各座標対x、y(部屋7におけるリスナ6のスピーカアレイ4に対する位置を表す)に関する異なるビームパターン行列を記憶することができる。上述したように、ビームパターン行列は、部屋7にいる複数のリスナ6の位置に関連づけることができる。
一実施形態では、ビームパターン行列は、オーディオ受信機3のローカルな媒体に格納することができる。例えば、ビームパターン行列は、オーディオ受信機3の中で一体化された、超小型電子技術の、揮発性又は不揮発性媒体に格納することができる。別の実施形態では、ビームパターン行列は、遠隔のサーバ又はシステムに位置し、有線又は無線のネットワーク接続を用いて、オーディオ受信機3により、アクセスすることができる。例えば、オーディオ受信機3は、IEEE 802.11x、IEEE 802.3、セルラ広域自動車通信システム(GSM)、セルラ符号分割多元接続(CDMA)及び長期的進化(LTE)のうちの1つ以上を用いて、ビームパターン行列にアクセスすることができる。
上述したように、部屋7の全ての他の領域で、音を最小にする一方、ビームパターン行列は、リスナ6の位置に基づいて、リスナ6の右及び左の耳について意図した音を、最大にすることができる。一実施形態では、各ビームパターン行列は、フィルタ(例えば、振幅及び位相)を記述する1組の複素数値から成る。この各フィルタは、スピーカアレイ4の対応するトランスデューサ5を駆動して、左右のオーディオチャネルを生成する特定の周波数に関するものである。例えば、ビームパターン行列は、次のように表すことができる。
上記のビームパターン行列の実例において、各rは、特定の周波数に関する左右のオーディオチャネルについて、スピーカアレイ4のt個のトランスデューサ5の各々に印加される振幅及び位相を記述する複素フィルタ値に対応する。上述したように、クロストークキャンセラ16は、リスナ6の検出された位置に対応する、1つ以上の所望の各周波数に関するビームパターン行列を読み出す。読み出されたビームパターン行列は、1本の音声プログラムコンテンツを表す1つ以上のオーディオチャネルを処理するために、アレイプロセッサ14に供給される。本明細書で用いる式は、周波数領域で記述されているが、ビームパターン行列のフィルタ値は、時間又は周波数の領域のどちらでも実行することができる。
複素フィルタ値は、1つ以上のあらかじめ定義された制約条件(当初ビームパターン行列を計算するために使用)を達成するために、各トランスデューサ5によって放出される音の振幅及び位相を記述する。上述したように、この制約条件の中に、以下のものを含むことができる。(1)リスナ6の左耳で、1本の音声プログラムコンテンツの左のチャネルを最大にすること/増大させること、及び、右のチャネルを最小にすること/減少させること、(2)リスナの右耳で、右のチャネルを最大にすること/増大させること、及び、左のチャネルを最小にすること/減少させること、並びに、(3)部屋7の全ての他の領域で、音声を最小にすること/減少させること、である。これらの制約条件により、オーディオ受信機3はリスナ6の方へ音を放射する。部屋7の他の領域ではなく、リスナ6の方へ音を放射することによって、部屋7の周波数応答に対する変動の影響を最小にして、クロストークキャンセルが達成される。
リスナ6の現在の位置に対応する1組の周波数に関する1つ以上のビームパターン行列を読み出すと、クロストークキャンセラ16は、アレイプロセッサ14にビームパターン行列を供給する。アレイプロセッサ14は、ビームパターン行列に従って、マルチプレクサ12から受信した1本の音声プログラムコンテンツの各オーディオチャネルを処理する。例えば、アレイプロセッサ14は、ビームパターン行列の各複素フィルタ値を、スピーカアレイのトランスデューサ5に供給される対応するオーディオ信号に関する重み及び位相値として、用いることができる。アレイプロセッサ14は、ビームパターン行列のフィルタ値に基づいて、制約条件の各々が達成されるように、トランスデューサ5に音を放出させる。(例えば、(1)リスナ6の左耳で、1本の音声プログラムコンテンツの左のチャネルを最大にすること、及び、右のチャネルを最小にすること、(2)リスナ6の右耳で、右のチャネルを最大にすること、及び、左のチャネルを最小にすること、並びに、(3)部屋7の全ての他の領域で、音声を最小にすること、がある。)
リスナ6に向けられる音を最大にすることによって、音が部屋7の大部分の領域で最小にされるので、部屋7は、リスナ6に対して、ほとんど影響を有しない。更に、調節に用いることができるより多くの制御次数(すなわち、スピーカアレイ4の多数のトランスデューサ5)があるので、条件の悪い場合(例えば、トランスデューサ5の感度変動及び部屋7の影響)によってクロストークキャンセルが影響されることは、より少なくなる可能性がある。
アレイプロセッサ14は、高速フーリエ変換(FFT)などの変換を用いて、時間及び周波数の双方の領域で、動作することができる。アレイプロセッサ14は、特定用途向け集積回路(ASIC)などの専用プロセッサ、多目的マイクロプロセッサ、フィールドプログラマブルゲートアレイ(FPGA)、デジタル信号コントローラ、又は1組のハードウェア論理構造(例えば、フィルタ、論理演算装置、及び専用の状態機械など)とすることができる。図3に示すように、音声プログラムコンテンツの処理したセグメントは、1つ以上の互いに異なるアナログ信号を生成するために、アレイプロセッサ14から1つ以上のデジタル/アナログ変換器21まで伝達される。デジタル/アナログ変換器21で生成されたアナログ信号は、ラウドスピーカアレイ4の選択されたトランスデューサ5を駆動するために、電力増幅器22に供給される。
オーディオ受信機3は、位置推定器15によって検出されたリスナ6の移動に基づいて、スピーカアレイ4の出力を絶えず調節することができる。例えば、リスナ6が移動したことを検出すると、クロストークキャンセラは、ビームパターン行列の更新されたセットを、処理のために、アレイプロセッサ14に供給する。
図5A及び図5Bを次に参照して、ビームパターン行列を生成するシステムを説明する。ビームパターン行列は、オーディオシステム1の初期構成の間にオーディオ受信機3によって、又は製造若しくは研究施設の離れたユニットによって生成することができる。下記の説明において、ビームパターン行列の生成は、オーディオ受信機3に関して説明する。しかし、別の実施形態では、これらの行列を計算し、1つ以上のオーディオ受信機に提供するために、異なる機器を用いることができる。
クロストークキャンセラ16は、部屋7のリスナ6の位置に基づいて、1組の周波数に関する1つ以上のビームパターン行列を生成する。一実施形態では、オーディオ受信機3は、ビームパターン行列の生成を支援する1つ以上のマイク22を含む。マイク22は、リスナ6位置の決定に用いるマイク18を含むことができるか、又は、マイク22はマイク18から独立させることができる。マイク22は、部屋6のオーディオ受信機3及びラウドスピーカアレイ4を調整するために、最初に用いる。ビームパターン行列が一旦生成されたならば、マイク22は取り外す/保管することができる。
図5Aに示すように、マイク22Aはリスナ6の右耳を表すように置かれ、マイク22Bはリスナ6の左耳を表すように置かれ、マイク22Cはマイク22A及び22Bから離れて、部屋7の他の領域に置かれる。図5Bに示される別の実施形態では、マイクは、複数のリスナ6を表すように置くことができる。例えば、マイク22A1及び22B1は、第1のリスナ6の右及び左の耳を表すように置かれる。マイク22A2及び22B2は、第2のリスナの右及び左の耳を表すように置かれる。そして、マイク22Cは、マイク22A1、22B1、22A2及び22B2から離れて、部屋7の他の領域に置かれる。単一のリスナ6に関して以下に説明するが、クロストーク行列発生器16は、複数のリスナ6の場合に、同様に動作することができる。
マイク22は、有線又は無線の接続を用いて、クロストークキャンセラ16に接続することができる。一実施形態では、マイク22はモバイル機器(例えば、携帯電話)に一体化され、検知された音は1つ以上の無線プロトコル(例えば、BLUETOOTH及びIEEE 802.11x)を用いて、クロストークキャンセラ16に送信される。マイク22は、任意の種類の音響/電気トランスデューサ又はセンサとすることができ、微小電子機械システム(MEMS)マイクロホン、圧電マイクロホン、エレクトレットコンデンサマイクロホン又はダイナミックマイクロホンが挙げられる。マイク22は、カーディオイド、全方向性、及び8の字型などの極性パターンの範囲を提供することができる。一実施形態では、マイク22の極性パターンは、時間と共に連続的に変動する可能性がある。
一実施形態では、オーディオ受信機3は、スピーカアレイ4のトランスデューサ5を駆動するために用いる一連のテスト音声を生成する。テスト音声は、持続時間、周波数、及びパワーを変動させることができ、リスナ6の左右の耳に対応する右のチャネル及び左のチャネルに分けることができる。図5Aに示されるマイクレイアウトを用いて、クロストーク行列発生器16は、1組の周波数における各周波数用のビームパターン行列を計算する。生成されたビームパターン行列は、1つ以上の制約条件に基づいて、スピーカアレイ4の各トランスデューサ5を駆動する。一実施形態では、この制約条件の中に、以下のものを含む。(1)マイク22Aで、1本の音声プログラムコンテンツの左のチャネルを最大にすること/増大させること、及び、右のチャネルを最小にすること/減少させること、(2)マイク22Bで、右のチャネルを最大にすること/増大させること、及び、左のチャネルを最小にすること/減少させること、並びに、(3)マイク22Cで、音声を生成しないか、又は非常に低レベルの音声を生成すること、である。例えば、右のチャネルテスト音声zL及び左のチャネルテスト音声zRに関して、上述の制約条件は、マイク22A及び22Bについて、それぞれ、右のチャネルテスト音声zR及び左のチャネルテスト音zLと同一の検知された音声を与える一方、マイク22Cはほとんど音を検知しない。上記の制約条件を用いて、クロストーク発生器16は、反対のチャネルから音声が左右の耳に流出することを許すことなく、それぞれ、リスナ6の左右の耳で、右のチャネル及び左のチャネルを正確に生成するビームパターン行列を計算することができる。
図6は、一実施形態に係る、図5A及び図5Bに示されるマイク構成を用いたビームパターン行列を生成する方法23を示す。方法23は、部屋7におけるリスナ6の位置決定の動作24から始まる。この動作におけるリスナ6は、実際のリスナ6ではなく、その代わりに、リスナ6の耳を表すマイク22A及び22Bの位置とすることができる。一実施形態では、位置推定器15は、ユーザ入力デバイス17、マイク18、カメラ19、及びIRセンサ20のうちの一つ以上を用いて、リスナ6の位置を決定することができる。リスナ6の位置は、スピーカアレイ4、又は、部屋7の任意の他の既知の定着物に対する座標として、表すことができる。
リスナ6の位置決定と同時に、動作25で、複数のテスト音声が、オーディオ受信機3によって部屋7に放出される。テスト音声は、それぞれ、リスナ6の右の及び左の耳に対応する、右のチャネルzR及び左のチャネルzLに分けられる。テスト音声は、各チャネルzR及びzLに関して、持続時間、周波数及びパワーを変動させることができる。
動作26で、テスト音声が部屋7に浸透して、マイク22はテスト音声を検知し、検知された音声は、クロストークキャンセラに送信される。上述及び図5Aに示すように、マイク22Aはリスナ6の右耳を表すように置かれ、マイク22Bはリスナ6の左耳を表すように置かれ、マイク22Cはマイク22A及び22Bから離れた、部屋7の他の領域に置かれる。検知された音声は、有線又は無線の接続を用いて、クロストークキャンセラに送信することができる。
動作27で、各マイク22から検知された音声は、リスナ6の位置に対応するビームパターン行列を生成するために、クロストーク行列発生器16に供給される。クロストーク行列発生器16は、1組のあらかじめ定義された制約条件の達成を目指すビームパターン行列を計算する。ビームパターン行列には、1つ以上の制約条件を達成するために、オーディオ信号(スピーカアレイ4の各トランスデューサ5に印加される)に適用される振幅/重み及び位相を記述する1組の複素フィルタ値が含まれる。一実施形態では、この制約条件として、以下が挙げられる。(1)マイク22Aで、1本の音声プログラムコンテンツの左のチャネルを最大にし、右のチャネルを最小にすること、(2)マイク22Bで、右のチャネルを最大にし、左のチャネルを最小にすること、並びに、(3)マイク22Cで、音声を生成しないか、又は非常に低レベルの音声を生成すること、である。これらの制約条件を達成するために、課題は最小二乗法問題として定式化することができる。この場合、ビームパターン行列のうち、マイク22A、22Bでそれぞれ右及び左のチャネルを最大にし、かつ、最小にすることに関連する(例えば、クロストークキャンセル)部分に、大きな重みが適用される。一方、比較的より小さな重みが、マイク22Cで音声を最小にすることに関連するビームパターン行列の部分に適用される。全体的な効果は、方法23が、リスナ6から離れた音声を最小にする一方で、クロストークキャンセルを達成するということである。
一実施形態では、リスナ6の位置に対応する部屋7の伝達関数が決定される。決定した伝達関数は、ビームパターン行列生成の間に、部屋7の中を伝搬するテスト音声によって引き起こされる影響/外乱を補償するために用いられる。
動作28で、計算されたビームパターン行列は、記憶されるか、及び/又は、さまざまな部屋及び環境で、上述したように、クロストークキャンセルを実行するために、1つ以上のオーディオ受信機3に送信することができる。送信は、有線又は無線の接続によって、実行することができる。一実施形態では、計算されたビームパターン行列は、製造設備で生産中に、他のオーディオ受信機3に記憶される。
対応するビームパターン行列が、1組の周波数に関して生成することができるように、方法23は、リスナ6の複数の可能な位置に関して、絶えず実行することができる。各対応する位置に関する各ビームパターン行列は、上述したように、1つ以上の制約条件を用いてクロストークキャンセルを実行するために、1つ以上のオーディオ受信機3に送信することができる。上述した制約条件を用いて、クロストーク発生器16は、反対のチャネルから音声がリスナ6の左右の耳に流出することを許すことなく、それぞれ、リスナ6の左右の耳で、右のチャネル及び左のチャネルを正確に生成するビームパターン行列を計算することができる。
上で説明したように、本発明の実施形態は、以下の機械可読媒体(超小型電子技術によるメモリなど)を搭載する製造品とすることができる。この機械可読媒体は、上述した動作を実行する1つ以上のデータ処理コンポーネント(全体的に「プロセッサ」と本明細書でいう)をプログラムする命令を記憶するものである。他の実施形態では、これらの動作の一部は、結線論理回路(例えば、専用デジタルフィルタブロック及び状態機械)を含む特定のハードウェア部品により実行することができる。それらの動作は、代わりに、プログラムされたデータ処理部品及び固定された結線回路部品の任意の組合せによって、実行することがあり得る。
ある実施形態について説明し添付の図面に示してきたが、このような実施形態は大まかな発明を単に例示するものであってそれを限定するものではない。また、他の種々の変更が当業者に想起され得るため、本発明は図示及び説明した特定の構成及び配置には限定されないことを理解されたい。したがって、説明は、限定的ではなく例示的であるとみなされる。

Claims (23)

  1. 部屋におけるリスナの位置を特定する工程と、
    複数のビームパターン行列を収容する記憶装置から、前記リスナの前記特定された位置に対応する、以前に記憶された1組のビームパターン行列を読み出す工程と、
    前記読み出されたビームパターン行列に基づいて、1組のビームパターンを生成するために、スピーカアレイを駆動する工程と、
    を含み、前記ビームパターンは、(1)前記リスナの左耳で、1本の音声プログラムコンテンツの左のチャネルを増大させ、かつ、右のチャネルを減少させ、(2)前記リスナの右耳で、前記右のチャネルを増大させ、かつ、前記左のチャネルを減少させ、並びに、(3)前記部屋の全ての他の領域で、音声のパワーを減少させることを特徴とする、クロストークキャンセルを実行する方法。
  2. 前記部屋における前記リスナの前記位置を特定する工程は、顔の検出及び追尾を実行する工程を含むことを特徴とする、請求項1に記載のクロストークキャンセルを実行する方法。
  3. 前記1本の音声プログラムコンテンツが再生され続ける間に、前記部屋における前記リスナの前記位置を反復して特定する工程を更に含むことを特徴とする、請求項1に記載のクロストークキャンセルを実行する方法。
  4. 前記反復した特定に基づいて、前記リスナが、前記部屋の異なる位置へ移動したと判断すると、前記リスナの前記異なる位置に対応する新しい1組のビームパターン行列を読み出す工程を更に含むことを特徴とする、請求項3に記載のクロストークキャンセルを実行する方法。
  5. ビームパターン行列の前記読み出された新しいセットに基づいて、1組のビームパターンを生成するために前記スピーカアレイを駆動する工程を更に含むことを特徴とする、請求項4に記載のクロストークキャンセルを実行する方法。
  6. 各ビームパターン行列は、前記スピーカアレイの各トランスデューサを駆動する周波数に対応する1組のフィルタ値であることを特徴とする、請求項1に記載のクロストークキャンセルを実行する方法。
  7. 前記記憶装置の前記複数のビームパターン行列は、前記スピーカアレイに対する、前記部屋の互いに異なる位置及び可聴周波数に各々対応することを特徴とする、請求項1に記載のクロストークキャンセルを実行する方法。
  8. 前記複数のビームパターン行列は、前記スピーカアレイの製造の間にあらかじめ設定されることを特徴とする、請求項7に記載のクロストークキャンセルを実行する方法。
  9. リスナの左耳の位置をシミュレートするようにマイクの第1のセットを部屋に配置する工程と、
    前記リスナの右耳の位置をシミュレートするようにマイクの第2のセットを前記部屋に配置する工程と、
    マイクの前記第1及び前記第2のセットから離れて、マイクの第3のセットを前記部屋に配置する工程と、
    左のオーディオチャネル及び右のオーディオチャネルでスピーカアレイを駆動する工程と、
    1組のビームパターンを決定する工程であって、(1)マイクの前記第1のセットにおいて、前記左のオーディオチャネルを最大にし、かつ、前記右のオーディオチャネルを最小にし、(2)マイクの前記第2のセットにおいて、前記右のオーディオチャネルを最大にし、かつ、前記左のオーディオチャネルを最小にし、(3)マイクの前記第3のセットによって検知される音声を最小にする、1組のビームパターンを決定する工程と、
    特定の周波数に関して、前記スピーカアレイを駆動する1組の実値として前記ビームパターンを表すクロストーク行列を生成する工程と、
    を含むことを特徴とする、クロストーク行列を生成するための方法。
  10. 前記部屋における前記リスナの新しい位置をシミュレートするマイクの前記第1、前記第2及び前記第3のセットを再配置する工程と、
    (1)マイクの前記第1のセットにおいて、前記左のオーディオチャネルを増大させ、かつ、前記右のオーディオチャネルを減少させ、(2)マイクの前記第2のセットにおいて、前記右のオーディオチャネルを増大させ、かつ、前記左のオーディオチャネルを減少させ、(3)マイクの前記第3のセットによって検知される音声を減少させる、新しい1組のビームパターンを決定する工程と、
    特定の周波数に関して、前記スピーカアレイを駆動する1組の実値として前記ビームパターンを表すクロストーク行列を生成する工程と、
    を更に含むことを特徴とする、請求項9に記載のクロストーク行列を生成するための方法。
  11. 異なる部屋で使用するオーディオ機器に前記クロストーク行列を提供する工程を更に含むことを特徴とする、請求項9に記載のクロストーク行列を生成するための方法。
  12. 前記1組のビームパターンは、最小二乗法アルゴリズムを用いて決定され、大きな重みは、それぞれ、マイクの前記第1及び前記第2のセットで、前記左右のオーディオチャネルを最大にし、かつ、最小にすることに適用され、より小さな重みは、マイクの前記第3のセットに適用されることを特徴とする、請求項9に記載のクロストーク行列を生成するための方法。
  13. 前記部屋の伝達関数を決定する工程と、
    前記部屋の中を伝搬する前記右のオーディオチャネル及び前記左のオーディオチャネルによって引き起こされる影響を補償するために、前記クロストーク行列の生成の間に、前記伝達関数を利用する工程と、
    を更に含むことを特徴とする、請求項9に記載のクロストーク行列を生成するための方法。
  14. 部屋に位置するリスナの左耳を表すマイクの第1のセットと、
    前記リスナの右耳を表すマイクの第2のセットと、
    前記リスナが位置する部屋の他の領域を表すマイクの第3のセットと、
    スピーカアレイに関する1組のビームパターンを決定するオーディオプロセッサと、
    を備え、前記ビームパターンは、マイクの前記第3のセットによって検知される音声を最小にしている間、マイクの前記第1のセットで左のオーディオチャネルを、マイクの前記第2のセットで右のオーディオチャネルを生成し、前記オーディオプロセッサは、前記スピーカアレイを駆動する1組の実値としての前記ビームパターンを表す前記クロストーク行列を生成することを特徴とする、クロストーク行列を生成するためのシステム。
  15. 前記1組のビームパターンは、最小二乗法アルゴリズムを用いて前記オーディオプロセッサによって決定され、大きな重みが、マイクの前記第1のセットにおいて前記左のオーディオチャネルの、及び、マイクの前記第2のセットにおいて前記右のオーディオチャネルの生成に適用される一方で、より小さな重みが、マイクの前記第3セットに適用されることを特徴とする、請求項14に記載のクロストーク行列を生成するためのシステム。
  16. 異なる部屋で使用される外部機器に前記クロストーク行列を送信するための送信ユニットを更に備える、ことを特徴とする、請求項15に記載の、クロストーク行列を生成するためのシステム。
  17. 前記部屋の伝達関数を決定する工程と、
    前記部屋の中を伝搬する前記右のオーディオチャネル及び前記左のオーディオチャネルによって引き起こされる影響を補償するために、前記クロストークパターン行列の前記生成の間に前記伝達関数を利用する工程と、
    を更に含む、ことを特徴とする、請求項14に記載の方法。
  18. 命令を記憶する機械可読記憶媒体を備える製造品であって、前記命令は、コンピュータのプロセッサで実行されると、
    1つの部屋にいるリスナの位置を特定し、
    複数のクロストーク行列を収容する記憶装置から、前記リスナの前記特定された位置に対応する以前に記憶されたクロストーク行列を読み出し、
    前記読み出されたクロストーク行列に基づいて、スピーカアレイを駆動して1組のビームパターンを生成し、
    前記ビームパターンは、(1)前記リスナの左耳において、1本の音声プログラムコンテンツの左のチャネルを増大させ、かつ、右のチャネルを減少させ、(2)前記リスナの右耳において、前記右のチャネルを増大させ、かつ、前記左のチャネルを減少させ、並びに、(3)前記部屋の全ての他の領域で音声を最小にすることを特徴とする製造品。
  19. 前記部屋における前記リスナの前記位置は、顔追尾を用いて特定されることを特徴とする、請求項18に記載の製造品。
  20. 前記リスナの前記位置の特定は、前記1本の音声プログラムコンテンツの継続期間の間に絶えず実行されることを特徴とする、請求項18に記載の製造品。
  21. 前記リスナの前記部屋の新しい位置への移動を判断すると、前記リスナの前記新しい特定された位置に対応する新しいクロストーク行列を読み出すことを特徴とする、請求項20に記載の製造品。
  22. 前記読み出された新しいクロストーク行列に基づいて、前記スピーカアレイを駆動して、1組のビームパターンを生成することを更に備えることを特徴とする、請求項21に記載の製造品。
  23. 前記クロストーク行列は、特定の周波数に関する前記スピーカアレイの各トランスデューサを駆動する1組の複素フィルタ値であることを特徴とする、請求項18に記載の製造品。
JP2016502158A 2013-03-14 2014-03-13 スピーカアレイを用いた堅牢なクロストークキャンセル Expired - Fee Related JP6193468B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361782287P 2013-03-14 2013-03-14
US61/782,287 2013-03-14
PCT/US2014/026503 WO2014151817A1 (en) 2013-03-14 2014-03-13 Robust crosstalk cancellation using a speaker array

Publications (2)

Publication Number Publication Date
JP2016516355A true JP2016516355A (ja) 2016-06-02
JP6193468B2 JP6193468B2 (ja) 2017-09-06

Family

ID=50686147

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016502158A Expired - Fee Related JP6193468B2 (ja) 2013-03-14 2014-03-13 スピーカアレイを用いた堅牢なクロストークキャンセル

Country Status (7)

Country Link
US (1) US9756446B2 (ja)
EP (1) EP2974385A1 (ja)
JP (1) JP6193468B2 (ja)
KR (1) KR101752288B1 (ja)
CN (1) CN105122847B (ja)
AU (1) AU2014236850C1 (ja)
WO (1) WO2014151817A1 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10154339B2 (en) * 2014-08-18 2018-12-11 Apple Inc. Rotationally symmetric speaker array
WO2016048381A1 (en) * 2014-09-26 2016-03-31 Nunntawi Dynamics Llc Audio system with configurable zones
AU2017202717B2 (en) * 2014-09-26 2018-05-17 Apple Inc. Audio system with configurable zones
CN107431871B (zh) 2015-02-16 2019-12-17 华为技术有限公司 过滤音频信号的音频信号处理装置和方法
CN104902388B (zh) * 2015-05-06 2018-05-25 苏州上声电子股份有限公司 用于实现多区域音量差异的声重放方法及系统
US9401158B1 (en) 2015-09-14 2016-07-26 Knowles Electronics, Llc Microphone signal fusion
CN105407443B (zh) * 2015-10-29 2018-02-13 小米科技有限责任公司 录音方法及装置
US9830930B2 (en) 2015-12-30 2017-11-28 Knowles Electronics, Llc Voice-enhanced awareness mode
US9779716B2 (en) 2015-12-30 2017-10-03 Knowles Electronics, Llc Occlusion reduction and active noise reduction based on seal quality
US9812149B2 (en) 2016-01-28 2017-11-07 Knowles Electronics, Llc Methods and systems for providing consistency in noise reduction during speech and non-speech periods
US11722821B2 (en) * 2016-02-19 2023-08-08 Dolby Laboratories Licensing Corporation Sound capture for mobile devices
US10531196B2 (en) * 2017-06-02 2020-01-07 Apple Inc. Spatially ducking audio produced through a beamforming loudspeaker array
CN107172568B (zh) * 2017-06-29 2024-04-05 深圳市泰衡诺科技有限公司上海分公司 一种立体声声场校准设备及校准方法
EP3425925A1 (en) * 2017-07-07 2019-01-09 Harman Becker Automotive Systems GmbH Loudspeaker-room system
US10516963B2 (en) * 2017-08-04 2019-12-24 Harman International Industries, Incorporated Adjusting the perceived elevation of an audio image on a solid cinema screen
CN111587582B (zh) * 2017-10-18 2022-09-02 Dts公司 用于3d音频虚拟化的音频信号预调节的系统、方法、以及存储介质
US10945090B1 (en) * 2020-03-24 2021-03-09 Apple Inc. Surround sound rendering based on room acoustics
GB202008547D0 (en) 2020-06-05 2020-07-22 Audioscenic Ltd Loudspeaker control
CN113314138B (zh) * 2021-04-25 2024-03-29 普联国际有限公司 基于麦克风阵列的声源监听分离方法、装置及存储介质
US11741093B1 (en) 2021-07-21 2023-08-29 T-Mobile Usa, Inc. Intermediate communication layer to translate a request between a user of a database and the database
US11924711B1 (en) 2021-08-20 2024-03-05 T-Mobile Usa, Inc. Self-mapping listeners for location tracking in wireless personal area networks
GB2616073A (en) * 2022-02-28 2023-08-30 Audioscenic Ltd Loudspeaker control

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003174699A (ja) * 2001-09-27 2003-06-20 Nissan Motor Co Ltd 音声入出力装置
JP2008227804A (ja) * 2007-03-12 2008-09-25 Yamaha Corp アレイスピーカ装置
WO2012068174A2 (en) * 2010-11-15 2012-05-24 The Regents Of The University Of California Method for controlling a speaker array to provide spatialized, localized, and binaural virtual surround sound

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6424719B1 (en) * 1999-07-29 2002-07-23 Lucent Technologies Inc. Acoustic crosstalk cancellation system
KR100739762B1 (ko) * 2005-09-26 2007-07-13 삼성전자주식회사 크로스토크 제거 장치 및 그를 적용한 입체 음향 생성 시스템
JP4821250B2 (ja) * 2005-10-11 2011-11-24 ヤマハ株式会社 音像定位装置
US9113264B2 (en) * 2009-11-12 2015-08-18 Robert H. Frater Speakerphone and/or microphone arrays and methods and systems of the using the same
US9107021B2 (en) * 2010-04-30 2015-08-11 Microsoft Technology Licensing, Llc Audio spatialization using reflective room model

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003174699A (ja) * 2001-09-27 2003-06-20 Nissan Motor Co Ltd 音声入出力装置
JP2008227804A (ja) * 2007-03-12 2008-09-25 Yamaha Corp アレイスピーカ装置
WO2012068174A2 (en) * 2010-11-15 2012-05-24 The Regents Of The University Of California Method for controlling a speaker array to provide spatialized, localized, and binaural virtual surround sound

Also Published As

Publication number Publication date
WO2014151817A1 (en) 2014-09-25
CN105122847B (zh) 2017-04-26
US9756446B2 (en) 2017-09-05
JP6193468B2 (ja) 2017-09-06
AU2014236850A1 (en) 2015-10-08
AU2014236850C1 (en) 2017-02-16
US20160021480A1 (en) 2016-01-21
AU2014236850B2 (en) 2016-09-15
KR20150119299A (ko) 2015-10-23
CN105122847A (zh) 2015-12-02
KR101752288B1 (ko) 2017-06-29
EP2974385A1 (en) 2016-01-20

Similar Documents

Publication Publication Date Title
JP6193468B2 (ja) スピーカアレイを用いた堅牢なクロストークキャンセル
US11399255B2 (en) Adjusting the beam pattern of a speaker array based on the location of one or more listeners
JP6615300B2 (ja) ハンズフリー・ビームパターン構成
US9900723B1 (en) Multi-channel loudspeaker matching using variable directivity
JP6162320B2 (ja) 機器の方向をブロードキャストするための音波ビーコン

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160912

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160920

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170529

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170607

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170710

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170809

R150 Certificate of patent or registration of utility model

Ref document number: 6193468

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees