JP2014501064A - マルチマイクロフォンを用いた3次元サウンド獲得及び再生 - Google Patents

マルチマイクロフォンを用いた3次元サウンド獲得及び再生 Download PDF

Info

Publication number
JP2014501064A
JP2014501064A JP2013536744A JP2013536744A JP2014501064A JP 2014501064 A JP2014501064 A JP 2014501064A JP 2013536744 A JP2013536744 A JP 2013536744A JP 2013536744 A JP2013536744 A JP 2013536744A JP 2014501064 A JP2014501064 A JP 2014501064A
Authority
JP
Japan
Prior art keywords
signal
channel
microphones
applying
recording
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013536744A
Other languages
English (en)
Other versions
JP5762550B2 (ja
Inventor
キム、レ−ホン
ビッサー、エリック
シャン、ペイ
リウ、イアン・アーナン
ラマクリシュナン、ディネッシュ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2014501064A publication Critical patent/JP2014501064A/ja
Application granted granted Critical
Publication of JP5762550B2 publication Critical patent/JP5762550B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/40Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
    • H04R2201/4012D or 3D arrays of transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction

Abstract

マルチマイクロフォンセットアップを使用する3次元録音及び再生のためのシステム、方法、装置、及び機械可読媒体について説明する。

Description

[0002]本開示は、オーディオ信号処理に関する。
米国特許法第119条に基づく優先権の主張
本特許出願は、2010年10月25日に出願され、本出願の譲受人に譲渡された「THREE-DIMENSIONAL SOUND CAPTURING AND REPRODUCING WITH MULTI-MICROPHONES」と題する仮出願第61/406,396号の優先権を主張する。また、本特許出願は、2011年3月22日に出願され、本出願の譲受人に譲渡された「MULTI-MICROPHONE SETUP AND PROCESSING SCHEME FOR WIDE STEREO AND SURROUND SOUND RECORDING」と題する仮出願第61/466,432号の優先権を主張する。
[0003]一般的構成によるオーディオ信号処理の方法は、記録された聴覚シーンを局在化可能音源(localizable sources)の第1のカテゴリーと周囲音の第2のカテゴリーとに分解することと、局在化可能音源の各々の方向の指示を記録することとを含む。また、特徴を読み取る機械にそのような方法を実行させる有形特徴を有するコンピュータ可読記憶媒体(例えば、非一時的媒体)が開示される。一般的構成によるオーディオ信号処理のための装置は、記録された聴覚シーンを局在化可能音源の第1のカテゴリーと周囲音の第2のカテゴリーとに分解するための手段と、局在化可能音源の各々の方向の指示を記録するための手段とを含む。別の一般的構成によるオーディオ信号処理のための装置は、記録された聴覚シーンを局在化可能音源の第1のカテゴリーと周囲音の第2のカテゴリーとに分解するように構成された空間選択フィルタと、局在化可能音源の各々の方向の指示を記録するように構成された方向推定器とを含む。
セルラーテレフォニーのための代表的なハンドセット上のマイクロフォン配置を示す図。 ユーザインターフェース入力に基づくマイクロフォン/ビームフォーマ選択の方法のフローチャート。 マイクロフォンペアの空間選択性の領域を示す図。 2次元において所望の記録方向を選択するためのユーザインターフェースを示す図。 アクティブノイズ消去(ANC)を実行するように構成されたヘッドセットの周りに定義された可能な空間セクタを示す図。 3マイクロフォン構成を示す図。 2つの局在化可能音源(シンガー及びドラム)と非定位周囲との場合の概念図。 音源方向及び/又は数を推定するために位相差の分布を使用する例を示す図。 音源方向及び/又は数を推定するために複数のビームフォーマを使用する例を示す図。 4マイクロフォンセットアップを使用した空間符号化のための全方向及び1次獲得を示す図。 ポータブル通信機器の一例の前面図及び背面図。 ブロードサイド方向から到着する音源信号を記録する場合を示す図。 ブロードサイド方向から到着する音源信号を記録する別の場合を示す図。 エンドファイアビームを合成する場合を示す図。 前方中央、前方左、前方右、後方左、及び後方右方向におけるビームのプロットの例を示す図。 後方右空間的方向の信号を取得するための処理の例を示す図。 3つのマイクロフォンのアレイをもつ2マイクロフォンペアBSSを使用するヌルビームフォーミング手法を示す図。 前方右方向についての結果を取得するために前方及び右方向におけるビームが合成される例を示す図。 図16に示したような手法のためのヌルビームの例を示す図。 4つのマイクロフォンのアレイをもつ4チャネルBSSを使用するヌルビームフォーミング手法を示す図。 コーナー方向FL、FR、BL、及びBRについての4つのフィルタのセットのビームパターンの例を示す図。 モバイルスピーカーデータに関して学習されたIVA収束(converged)フィルタビームパターンの例を示す図。 改良されたモバイルスピーカーデータに関して学習されたIVA収束フィルタビームパターンの例を示す図。 エンドファイアビームを合成する方法のフローチャート。 一般的デュアルペア(dual-pair)の場合の方法のフローチャート。 3マイクロフォンの場合の図23Bの方法の実施形態を示す図。 4つのマイクロフォンのアレイをもつ4チャネルBSSを使用する方法のフローチャート。 複数の全方向性マイクロフォンを使用して記録された信号から5.1チャネル記録を与えるため、及びヘッドフォンを使用してそのような記録を再生するためのシステムを示す図。 BSSフィルタバンクの部分ルーティング図。 2×2フィルタバンクのルーティング図。 アレイR100の実施形態R200のブロック図。 アレイR200の実施形態R210のブロック図。 一般的構成によるマルチマイクロフォンオーディオ感知機器D10のブロック図。 機器D10の実施形態である通信機器D20のブロック図。
[0038]それの文脈によって明確に限定されない限り、「信号」という用語は、本明細書では、ワイヤ、バス、又は他の伝送媒体上に表されたメモリ位置(又はメモリ位置のセット)の状態を含む、それの通常の意味のいずれをも示すのに使用される。それの文脈によって明確に限定されない限り、「発生(generating)」という用語は、本明細書では、計算(computing)又は別様の生成(producing)など、それの通常の意味のいずれをも示すのに使用される。それの文脈によって明確に限定されない限り、「計算(calculating)」という用語は、本明細書では、複数の値からの計算(computing)、評価、平滑化、及び/又は選択など、それの通常の意味のいずれをも示すのに使用される。それの文脈によって明確に限定されない限り、「取得(obtaining)」という用語は、計算(calculating)、導出、(例えば、外部機器からの)受信、及び/又は(例えば、記憶要素のアレイからの)検索など、それの通常の意味のいずれをも示すのに使用される。それの文脈によって明確に限定されない限り、「選択(selecting)」という用語は、2つ以上のセットのうちの少なくとも1つ、及び全てよりも少数を識別、指示、適用、及び/又は使用することなど、それの通常の意味のいずれをも示すのに使用される。「備える(comprising)」という用語は、本明細書及び特許請求の範囲において使用される場合、他の要素又は動作を除外しない。「に基づく」(「AはBに基づく」など)という用語は、(i)「から導出される」(例えば、「BはAの先駆け(precursor)である」)、(ii)「少なくとも〜に基づく」(例えば、「Aは少なくともBに基づく」)、及び特定の文脈で適当な場合に、(iii)「に等しい」(例えば、「AはBに等しい」)という場合を含む、それの通常の意味のいずれをも示すのに使用される。同様に、「に応答して」という用語は、「少なくとも〜に応答して」を含む、それの通常の意味のいずれをも示すのに使用される。
[0039]マルチマイクロフォンオーディオ感知機器のマイクロフォンの「位置(location)」への言及は、文脈によって別段に規定されていない限り、マイクロフォンの音響的に敏感な面の中心の位置を示す。「チャネル」という用語は、特定の文脈に応じて、時々、信号経路を示すのに使用され、また他のときには、そのような経路によって搬送される信号を示すのに使用される。別段に規定されていない限り、「一連」という用語は、2つ以上のアイテムのシーケンスを示すのに使用される。「対数」という用語は、10を底とする対数を示すのに使用されるが、他の底へのそのような演算の拡張は本開示の範囲内である。「周波数成分」という用語は、(例えば、高速フーリエ変換によって生成される)信号の周波数領域表現のサンプル、又は信号のサブバンド(例えば、バーク尺度又はメル尺度サブバンド)など、信号の周波数又は周波数帯域のセットのうちの1つを示すのに使用される。
[0040]別段に規定されていない限り、特定の特徴を有する装置の動作のいかなる開示も、類似の特徴を有する方法を開示する(その逆も同様)ことをも明確に意図し、特定の構成による装置の動作のいかなる開示も、類似の構成による方法を開示する(その逆も同様)ことをも明確に意図する。「構成」という用語は、それの特定の文脈によって示されるように、方法、装置、及び/又はシステムに関して使用され得る。「方法」、「プロセス」、「手順(procedure)」、及び「技術(technique)」という用語は、特定の文脈によって別段に規定されていない限り、一般的、互換的に使用される。「装置」及び「機器」という用語も、特定の文脈によって別段に規定されていない限り、一般的、互換的に使用される。「要素」及び「モジュール」という用語は、一般に、より大きい構成の一部分を示すのに使用される。それの文脈によって明確に限定されない限り、「システム」という用語は、本明細書では、「共通の目的を果たすために相互作用する要素のグループ」を含む、それの通常の意味のいずれをも示すのに使用される。また、文書の一部分の参照によるいかなる組込みも、その部分内で参照される用語又は変数の定義が、その文書中の他の場所、及び組み込まれた部分中で参照される図に現れた場合、そのような定義を組み込んでいることを理解されたい。
[0041]本明細書で説明する方法は、獲得された信号を一連のセグメントとして処理するように構成され得る。典型的なセグメント長は約5又は10ミリ秒から約40又は50ミリ秒にわたり、セグメントは、重複しても(例えば、隣接するセグメントが25%又は50%だけ重複する)、重複しなくてもよい。1つの特定の例では、上記信号は、10ミリ秒の長さをそれぞれ有する一連の重複しないセグメント又は「フレーム」に分割される。また、そのような方法によって処理されるセグメントは、異なる演算によって処理されるより大きいセグメントのセグメント(即ち、「サブフレーム」)であり得、又はその逆も同様である。
[0042]今日では、フェイスブック、ツイッターなど、急速に成長するソーシャルネットワーキングサービスを通して個人情報の迅速な交換が経験されている。同時に、テキストだけでなく、マルチメディアデータをもすでにサポートしている、ネットワーク速度及び記憶容量の顕著な増大も認められる。この環境では、個々の聴覚エクスペリエンスのより現実的な没入型交換のために3次元(3D)オーディオを獲得し、再生するための重要な必要性が認められる。
[0043]3次元オーディオ再生は、ヘッドフォン又はラウドスピーカーアレイを使用して実行されてきた。しかしながら、オンライン制御可能性がなく、従って正確な音像を再生することのロバストネスが制限される。頭部伝達関数(HRTF:head-related transfer function)に基づくヘッドフォン再生の場合、音像は、一般にユーザの頭部内で定位されるので、深さ及び広さ(spaciousness)知覚が制限され得る。
[0044]マルチマイクロフォンベースのオーディオ処理アルゴリズムが最近、音声通信を向上させるコンテキストにおいて開発されてきた。本開示は、1つ以上のそのようなアルゴリズムと組み合わされ得るマルチマイクロフォントポロジに基づく3Dオーディオのための幾つかの固有の特徴について説明する。これらの特徴について、記録の観点から、及び再生の観点から以下で説明する。
[0045]これらの特徴は、3Dオーディオの全経路をサポートするために使用され得、サブカテゴリー分類された特徴を以下に記載する。記録の観点では、方向情報とともに再生するために使用される、モノラルオーディオチャネルを送信するための指向性確保を扱う。再生の観点では、同じくマルチマイクロフォントポロジとともに、ロバストで忠実な音像再構成の方法を導入する。
[0046]図1に、異なる音源方向のために構成可能なマイクロフォンアレイジオメトリを有する機器の3つの異なる図を示す。使用事例に応じて、機器のマイクロフォンの異なる組合せ(例えば、ペア)は、異なる音源方向において空間選択オーディオ記録をサポートするように選択され得る。例えば、図1を参照すると、(例えば、カメラレンズが機器の背面にある)ビデオカメラ状況において、前後マイクロフォンペア(例えば、マイクロフォン2及び4、マイクロフォン2及び3、マイクロフォン5及び4)は、前方方向と後方方向とを記録するために(即ち、カメラポイント方向に、及びそれから離れるようにビームをステアリングするために)、手動又は自動で構成され得る左及び右方向選好を用いて使用され得る。前後軸に直交する方向における録音の場合、マイクロフォンペア(1、2)は、別のオプションである。
[0047]様々な設計方法(即ち、MVDR、LCMV、フェーズドアレイなど)が与えられれば、異なるビームフォーマデータバンクが、様々なマイクロフォン組合せのためにオフラインで計算され得る。使用中に、これらのビームフォーマのうちの所望の1つが、現在の使用事例要件に応じてユーザインターフェース中のメニューを介して選択され得る。図2Aに、タスクT110とタスクT120とを含むそのような方法の概念フローチャートを示す。タスクT110は、(例えば、自動的に及び/又はユーザインターフェースを介して選択されるように)1つ以上の好適なサウンド獲得方向を指定し、タスクT120は、指定された指向性を与えるビームフォーマとマイクロフォンアレイ(例えば、ペア)との組合せを選択する。図3に、記録方向を選択するためのユーザインターフェースの例を示す。
[0048]図4に、ボイス獲得及び/又はアクティブノイズ消去(ANC)などの適用例をサポートする3つのマイクロフォンを含むステレオヘッドセットについて関係する使用事例の図を示す。そのような適用例では、(図4、全方向性マイクロフォンを使用する)この3マイクロフォン構成を使用して記録するための、頭部の周りの異なるセクタが定義され得る。
[0049]3次元オーディオ獲得はまた、図5に示す3マイクロフォン構成など、専用マイクロフォンセットアップを用いて実行され得る。そのような構成は、ビデオ記録機器D400など、記録機器にコードを介して又はワイヤレスに接続され得る。機器D400は、機器方向性の検出と、選択されたオーディオ記録方向に応じたマイクロフォンML10、MR10、及びMC10の間のペアの選択とのための本明細書で説明する装置を含み得る。代替構成では、マイクロフォンMC10は記録機器上に位置する。
[0050]自動シーン分析及び分解の能力を与えることが望ましいことがある。機器のユーザが好適なオーディオ記録方向を指定しなかった、又はさもなければそのような知識が利用不可能であった場合、そのような能力が望ましいことがある。
[0051]自動シーン分析及び分解の一例では、聴覚シーンが2つの主要なカテゴリーに分解される。第1の主要なカテゴリーは局在化可能音源である。そのような音源からの信号成分は、それぞれの推定された到着方向に応じて設計(例えば、オフラインで計算)及び選択され得る好適なビームフォーマを使用して獲得され得る。各局在化可能音源の記録は、音源の到着方向と、対応するモノフォニックオーディオ信号とを記録することを含み得る。記録された信号の再生中に、これらの音源は、適切な指向性情報と合成され得る。
[0052]記録されているシーンに応答して、既知の方向に方向性されるビームフォーマの出力を比較することによって、到着方向(DOA)の推定が実行され得る。追加又は代替として、方向推定器は、マイクロフォンチャネルの1つ以上のペアの対応する周波数成分間の位相差を計算するように構成され得る(到着方向は位相差と周波数との間の比によって示される)。追加又は代替として、方向推定器は、マイクロフォンチャネルの1つ以上のペアのレベル(例えば、エネルギー差)間の差を計算するように構成され得る。
[0053]定位音源信号は、別々に、又は組み合わせて再生され得る。空間モノフォニック音源が再生側で最終的に混合される場合は、分離要件が緩和され得る。例えば、記録中の、1つ以上の他の指向性音源のわずか6dBだけの抑制でも、十分な程度の分離を与えると見なされ得る。
[0054]第2の主要なカテゴリーは、獲得された非定位可能周囲である。そのような周囲は、例えば、記録された信号から、定位音源からの成分を減算することによる残差として取得され得る。周囲信号は、再生においてはサラウンドラウドスピーカーを用いてさらに処理され得、又はヘッドフォンリスニングの場合は拡散され得る。
[0055]そのような自動分析及び分解は、シーン中で定位される、ユーザ定義の数の支配的音源によって誘導され得る。しかしながら、所望の数の支配的音源が利用可能でない場合、それはまた(例えば、到着方向情報の分析に基づいて)自動的に決定され得る。図6に、マイクロフォンアレイに対して異なる到着方向θに配置された2つの局在化可能音源(シンガー及びドラム)の概念図を示す。
[0056](例えば、図7に示す)一例では、定位音源の数は、周波数範囲にわたる各方向から到着する周波数成分の数を示すヒストグラム中のピークの数に応じて計算される。(例えば、図8に示す)別の例では、定位音源の数は、異なる方向に方向性されるビームフォーマのセットのうちのビームフォーマの数に応じて計算され、記録されているシーンに応答するそれらの出力は、閾値を上回る(代替的に、少なくとも等しい)。
[0057]一般に、遠端ユーザは、ステレオヘッドセット(例えば、適応ノイズ消去又はANCヘッドセット)を使用して、記録された空間音を聴くと仮定される。しかしながら、他の適用例では、3つ以上の空間的方向を再生することが可能なマルチラウドスピーカーアレイが、遠端において利用可能であり得る。そのような使用事例をサポートするために、記録中に同時に2つ以上のマイクロフォン/ビームフォーマ組合せを可能にすることが望ましいことがある。
[0058]マルチマイクロフォンアレイは、1つ以上の音源方向の各々についてモノフォニック音を生成するために空間選択フィルタとともに使用され得る。しかしながら、そのようなアレイは、2次元又は3次元において空間オーディオ符号化をサポートするためも使用され得る。本明細書で説明するマルチマイクロフォンアレイでサポートされ得る空間オーディオ符号化方法の例としては、5.1サラウンド、7.1サラウンド、ドルビーサラウンド、ドルビープロロジック、又は他の位相振幅行列ステレオフォーマット、ならびにドルビーデジタル、DTS又はディスクリートマルチチャネルフォーマット、及び波動場合成がある。5チャネル符号化の一例としては、左チャネル、右チャネル、中央チャネル、左サラウンドチャネル、及び右サラウンドチャネルがある。
[0059]本明細書で説明するマルチマイクロフォンアレイでサポートされ得る空間オーディオ符号化方法の例には、アンビソニックBフォーマット又は高次アンビソニックフォーマットなど、特殊マイクロフォンとの使用が最初に意図され得る方法がある。例えば、アンビソニック符号化方式の処理されたマルチチャネル出力は、測定点の3次元テイラー展開であり、それは図9に示すように3次元的に配置されたマイクロフォンアレイを使用して、少なくとも1次まで近似され得る。マイクロフォンが多くなると、近似次数が増加され得る。
[0060]没入型サウンドエクスペリエンスをユーザに伝えるために、サラウンド録音は、一般に単独で、又はビデオテープ録画と併せて行われる。サラウンド録音は、概して、単方向マイクロフォンを使用する別個のマイクロフォンセットアップを必要とし、単方向マイクロフォンは、一般に別々にクリップオンされる必要があり、従って、ポータブルオーディオ感知機器(例えば、スマートフォン又はタブレット)に適さない。本開示では、空間フィルタ処理と組み合わされる複数の全方向性マイクロフォンに基づく代替方式が提示される。この解決法は、複数の使用事例をサポートするためにスマートフォン又はタブレット上に埋め込まれた全方向性マイクロフォンに基づく。従って、ビデオテープ録画適用例をサポートするために、かさばる単方向マイクロフォンセットアップが必要とされない。
[0061]スマートフォン又はタブレット機器上で複数の音チャネルを記録するために、ワイドステレオの場合は2つのマイクロフォンが、サラウンドサウンドの場合は適切なマイクロフォン軸をもつ少なくとも3つの全方向性マイクロフォンが使用される。これらのチャネルは、順にペアで処理されるか、又は所望のルック方向において特定の空間ピックアップパターンを有するように設計されたフィルタを用いて全て同時にフィルタ処理される。空間エイリアシングにより、マイクロフォン間距離は、パターンが最も関係する周波数帯域において有効であるように選定され得る。発生されたステレオ又は5.1出力チャネルは、没入型サウンドエクスペリエンスを生じるために、サラウンドサウンドセットアップにおいて再生され得る。
[0062]図10に、ポータブル通信機器(例えば、スマートフォン)の一例の前面図及び背面図を示す。前面マイクロフォン2及び背面マイクロフォン4のアレイは、ステレオ録音を行うために使用され得る1つの典型的なデュアルマイクロフォン構成であり、幾つか他のペアアレイ(例えば、(1、2)(3、4)(1、4))も可能である。機器の保持位置に依存し得る、音源に対するマイクロフォンの異なる位置は、空間フィルタ処理を使用して強調され得るステレオ効果を生じる。(例えば、ビデオテープ録画中に)コメンテータと記録されているシーンとの間にステレオ像を作成するために、(図1の側面図に示すように)機器の厚さの距離をもつ前面マイクロフォン2と背面マイクロフォン4とを使用するエンドファイアペアリングを使用することが望ましいことがある。しかしながら、(図1の背面図に示すように)z軸方向の距離をもつエンドファイアペアリングを生じるために、同じマイクロフォンを異なる保持位置において使用することもできることに留意されたい。後者の場合、シーンに向かうステレオ像を生じることができる(例えば、シーンの左から来る音が、左から来る音として捕捉される)。
[0063]図11に、ブロードサイド方向から到着する音源信号を記録するために、機器の厚さの距離をもつ前面マイクロフォン2と背面マイクロフォン4とのエンドファイアペアリングを使用する場合を示す。この例では、2つのマイクロフォンの座標は、(x=0,y=0,z=0)及び(x=0,y=0.10,z=−0.01)である。y=0面に沿ったエリアはブロードサイド方向におけるビームを示し、(x=0,y=−0.5,z=0)周辺のエリアはエンドファイア方向におけるヌルビームを示すように、ステレオビームフォーミングが適用される。コメンテータがブロードサイド方向から(例えば、機器の背面に)話しているとき、マイクロフォンペアの軸の周りの回転に対するあいまいさにより、そのコメンテータのボイスと機器の前面のシーンからの音とを区別することが困難であることがある。その結果、コメンテータのボイスをシーンから分離するステレオ効果が強化されない。
[0064]図12に、ブロードサイド方向から到着する音源信号を記録するために、機器の厚さの距離をもち、マイクロフォン座標が図11の場合と同じである前面マイクロフォン2と背面マイクロフォン4とのエンドファイアペアリングを使用する別の場合を示す。この例では、ユーザの(例えば、コメンテータの)ボイスが1つのチャネルにおいてヌルアウトされるように、ビームは(点(x=0,y=−0.5,z=0)を通る)エンドファイア方向に方向性される。ビームは、ヌルビームフォーマ又は別の手法を使用して形成され得る。例えば、独立成分分析(ICA)又は独立ベクトル解析(IVA)など、ブラインド音源分離(BSS)手法は、ヌルビームフォーマよりもワイドなステレオ効果を与えることができる。テープに記録されたシーン自体に、よりワイドなステレオ効果を与えるために、(図1の背面図に示すように)z軸方向の距離をもつ同じマイクロフォンのエンドファイアペアリングを使用すれば十分であり得ることに留意されたい。
[0065]ブロードサイド保持位置にある機器の場合、元の記録と比較してステレオ効果を強化するために、(例えば、図12及び図13に示すように)左側及び右側へのエンドファイアビームを合成することが望ましいことがある。そのような処理は、(例えば、マイクロフォン間隔をシミュレートするために)チャネル間遅延を加算することをも含み得る。そのような遅延は、空間における共通の基準点に対して両方のビームフォーマの出力遅延を正規化するのに役立ち得る。ステレオチャネルがヘッドフォンを介して再生されるとき、遅延を操作することで、好適な方向に空間像を回転するのを助けることもできる。機器は、(例えば、「SYSTEMS, METHODS, APPARATUS, AND COMPUTER-READABLE MEDIA FOR ORIENTATION-SENSITIVE RECORDING CONTROL」と題する米国特許出願第13/XXX,XXX号、代理人整理番号第102978U1号に記載されているように)加速度計、磁力計、及び/又は保持位置を示すジャイロスコープを含み得る。図23Aに、そのような方法のフローチャートを示す。
[0066]機器がエンドファイア保持位置にあるとき、記録が、ワイドステレオ効果を与えることをすでに予想されることがある。この場合、(例えば、ヌルビームフォーマ又はICA又はIVAなど、BSSソリューションを使用する)空間フィルタ処理は、その効果をわずかしか強化し得ない。
[0067]デュアルマイクロフォンの場合、上記で説明したように、ステレオ記録されたファイルが、(例えば、ユーザのボイスと記録されたシーンとの分離を高めるために)空間フィルタ処理を介して強化され得る。3つ以上のチャネルに信号をアップミックスするためなど、(例えば、サラウンドサウンドの場合)獲得されたステレオ信号から幾つかの異なる指向性チャネルを発生させることが望ましいことがある。例えば、(例えば、5.1サラウンドサウンド方式の場合)チャネルごとに5つのスピーカーのアレイのうちの異なる1つを使用して信号が再生され得るように、信号を5チャネルにアップミックスすることが望ましいことがある。そのような手法は、アップミックスされたチャネルを取得するために、対応する方向における空間フィルタ処理を適用することを含み得る。そのような手法は、アップミックスされたチャネル(例えば、ドルビーサラウンドのバージョン)にマルチチャネル符号化方式を適用することをも含み得る。
[0068]記録のために3つ以上のマイクロフォンが使用される場合は、空間フィルタ処理及び異なるマイクロフォン組合せを使用して、複数の方向(例えば、5.1規格に従って、5つの方向)において記録し、記録された信号を(例えば、5つのラウドスピーカーを使用して)再生することが可能である。そのような処理は、アップミックスすることなしに実行され得る。
[0069]図1に、3つ以上のマイクロフォンを有するポータブル通信機器(例えば、スマートフォン)の一例の前面図、背面図、及び側面図を示す。特定のルック方向における強化された識別を取得するために、異なるマイクロフォンペアからのビーム及び/又はヌルビームを合成することが望ましいことがある。マルチチャネル記録の1つの手法は、前後マイクロフォンペア(例えば、マイクロフォン2及び3)及び左右マイクロフォンペア(例えば、マイクロフォン1及び2)を使用して、5つの異なるルック方向における2次元ビームを設計することを含む。図14に、前方中央(FC)、前方左(FL)、前方右(FR)、後方左(BL)、及び後方右(BR)方向におけるそのようなビームのプロットの例を示す。X、Y及びZ軸はこれらのプロットの全てにおいて同様に方向性され(各範囲の中央は0であり、両極端は+/−0.5であり、X軸は右に増大し、Y軸は左のほうへ増大し、Z軸は上部のほうへ増大する)、暗いエリアは上述のようにビーム又はヌルビーム方向を示す。各プロットのためのビームは、以下の点、即ち、(z=0)、FCについては(x=0,y=+0.5)、FRについては(x=+0.5,y=+0.5)、BRについては(x=+0.5,y=−0.5)、BLについては(x=−0.5,y=−0.5)、及びFLについては(x=−0.5,y=+0.5)を通ってダイレクトされる。
[0070]空間フィルタ処理技術の有効性は、小さいマイクロフォン間間隔、空間エイリアシング、高周波数における散乱などのファクタに応じて、帯域通過範囲に制限され得る。一例では、信号は、空間フィルタ処理の前に(例えば、8kHzのカットオフ周波数で)低域フィルタ処理される。
[0071]単一点音源からの音が獲得されている場合、そのようなビームフォーミングを他の方向から到着する信号のマスキングで補完することは、所望のマスキング効果を達成するために必要なアグレッシブネスのレベルにおける非直接経路信号及び/又は可聴歪みの強い減衰につながり得る。そのようなアーティファクトは、高精細度(HD)オーディオのために望ましくないことがある。一例では、HDオーディオは48kHzのサンプリングレートで記録される。そのようなアーティファクトを緩和するために、積極的に空間フィルタ処理された信号を使用する代わりに、各チャネルの処理された信号のエネルギープロファイルのみを使用し、マスキング前に元の入力信号又は空間処理済み出力に、各チャネルのエネルギープロファイルに応じたゲインパンニングルールを適用することが望ましいことがある。音イベントは、一般に時間周波数マップにおいて非常に僅かであるので、複数音源の場合でも、そのようなポストゲインパンニング方法を使用することが可能であることに留意されたい。図15に、後方右空間的方向の信号を取得するための処理の例を示す。プロットA(振幅対時間)は、元のマイクロフォン記録を示す。プロットB(振幅対時間)は、マイクロフォン信号を(8kHzのカットオフ周波数で)低域フィルタ処理し、マスキングとともに空間フィルタ処理を実行した結果を示す。プロットC(大きさ対時間)は、プロットBにおける信号のエネルギーに基づく、関係する空間エネルギー(例えば、2乗サンプル値の和)を示す。プロットD(状態対時間)は、低周波数空間フィルタ処理によって示されるエネルギー差に基づくパンニングプロファイルを示し、プロットE(振幅対時間)は、48kHzでパンニングされた出力を示す。
[0072]デュアルマイクロフォンペアの場合、1つのペアのための少なくとも1つのビームと、他のペアのための少なくとも2つの異なる方向におけるビームとを設計することが望ましいことがある。ビームは、(例えば、ICA又はIVAなど、BSS手法を用いて)設計又は学習され得る。これらのビームの各々は、(例えば、サラウンド録音のために)記録の異なるチャネルを取得するために使用され得る。
[0073]図16に、3つのマイクロフォンのアレイをもつ2マイクロフォンペアBSS(例えば、ICA又はIVA)を使用するヌルビームフォーミング手法を示す。前方及び後方方向のために、マイクロフォンペア(2、3)が使用される。左及び右方向のために、マイクロフォンペア(1、2)が使用される。2つのマイクロフォンペアの軸は直交又は少なくとも実質的に直交している(例えば、直交から5、10、15、又は20度以下である)ことが望ましいことがある。
[0074]チャネルのうちの幾つかは、2つ以上のビームを組み合わせることによって生成され得る。図17は、前方右方向についての結果を取得するために前方及び右方向におけるビームが合成される例を示す。前方左、後方右、及び/又は後方左方向についての結果が同様にして取得され得る。この例では、そのような方法で重複するビームを組み合わせることが、他の位置から到着した信号よりも対応するコーナーから到着した信号が6dB大きい信号を与える。図23Bに、一般的デュアルペアの場合のそのような方法のフローチャートを示す。図23Cに、3マイクロフォンの場合の図23Bの方法の実施形態を示す。空間における共通の基準点に対する両方のビームフォーマの出力遅延を正規化するために、チャネル間遅延を適用することが望ましいことがある。「左右エンドファイアペア」及び「前後エンドファイアペア」が合成されるとき、マイクロフォンアレイの重心に基準点を設定することが望ましいことがある。そのような演算は、2つのペア間の遅延が調整された、所望のコーナー位置における最大化された放射(beaming)をサポートし得る。
[0075]図18に、図16に示した手法のためのヌルビームの例を示し、そのヌルビームは、MVDRビームフォーマ、又は機器及び1つ(又は複数)の音源の相対位置が固定されるシナリオで学習される集束BSS(例えば、ICA又はIVA)フィルタを使用して設計され得る。これらの例では、図示された周波数ビンの範囲は、0kHz〜8kHzの帯域に対応する。空間ビームパターンが相補型であることがわかり得る。また、これらの例では左右ペアのマイクロフォン間の間隔と前後ペアのマイクロフォン間の間隔とが異なるために、空間エイリアシングがこれらのビームパターンに及ぼす影響が異なることがわかり得る。
[0076]空間エイリアシングのために、マイクロフォン間距離に応じて、獲得された信号の全周波数範囲よりも小さい範囲に(例えば、上述のように0kHz〜8kHzの範囲に)ビームを適用することが望ましいことがある。低周波数コンテンツが空間フィルタ処理された後に、空間遅延、処理遅延、及び/又は利得整合のための幾つかの調整を用いて、高周波数コンテンツが再加算され得る。また、幾つか(例えば、ハンドヘルド機器形状ファクタ)の場合には、いずれにせよ指向性のいくらかの損失が、マイクロフォンの間隔制限により予想され得るので、中間周波数範囲のみ(例えば、200Hz又は500Hzまでのみ)をフィルタ処理することが望ましいことがある。
[0077]非線形位相歪みの幾つかの種類が存在する場合(通常、常に存在する)、同じDOAに従って全ての周波数に対して同じ遅延に基づく標準ビーム/ヌルフォーミング技術が、非線形位相歪みによって引き起こされる幾つかの周波数上の遅延差により、十分に機能できないことがある。しかしながら、本明細書で説明する方法に基づくIVAは、音源分離に基づいて動作し、従って、同じDOAに対して遅延差が存在する場合でさえ、そのような方法が良好な結果を生成することが予想され得る。そのようなロバストネスは、サラウンド処理係数を取得するためのIVAを使用することの潜在的な利点であり得る。
[0078]空間フィルタ処理が、いくらのカットオフ周波数(例えば、8kHz)より上で行われない場合、最終HD信号を与えることは、元の前方/後方チャネルを高域フィルタ処理することと、8kHz〜24kHzの帯域を再加算することとを含み得る。そのような演算は、空間及び高域フィルタ処理遅延について調整することを含み得る。また、(例えば、空間分離効果を混乱させないように)8〜24kHz帯域の利得を調整することが望ましいことがある。図15に示す例は、時間領域においてフィルタ処理されたが、本明細書で説明した手法の他の領域(例えば、周波数領域)におけるフィルタ処理への適用が、明確に企図され、本明細書によって開示される。
[0079]図19に、4つのマイクロフォンのアレイをもつ4チャネルBSS(例えば、ICA又はIVA)を使用するヌルビームフォーミング手法を示す。4つのマイクロフォンの様々なペアのうちの少なくとも2つの軸が、直交し、少なくとも実質的に直交している(例えば、直交から5、10、15、又は20度以下である)ことが望ましいことがある。そのような4マイクロフォンフィルタは、コーナー方向へのビームパターンを生じるためにデュアルマイクロフォンペアリングに加えて使用され得る。一例では、フィルタは、IVA及びトレーニングデータを使用して学習され、得られた集束IVAフィルタは、5.1サラウンドサウンドにおいてそれぞれの5つのチャネル方向(FL、FC、FR、BR、BL)の各々の信号を生成するために、4つの記録されたマイクロフォン入力に適用される固定フィルタとして実施される。5つのスピーカーを十分に活用するために、例えば、次のルール
Figure 2014501064
を使用して前方中央チャネルFCが取得され得る。図24に、そのような方法のフローチャートを示す。図26に、そこで1≦n≦4の場合、マイクロフォンnが列n中のフィルタに入力を与え、出力チャネルの各々が対応する行中のフィルタの出力の和であるフィルタバンクの部分ルーティング図を示す。
[0080]そのような学習プロセスの一例では、独立音源が、4つの指定された位置(例えば、4マイクロフォンアレイの周りの4つのコーナー位置FL、FR、BL、及びBR)の各々に配置され、アレイは、4チャネル信号を獲得するために使用される。獲得された4チャネル出力の各々が、全ての4つの音源の混合であることに留意されたい。次いで、BSS技術(例えば、IVA)が、4つの独立音源を分離するために適用される。収束の後、分離された4つの独立音源、ならびに基本的にターゲットコーナーのほうへビーミングし、他の3つのコーナーのほうへヌリングする収束フィルタセットを取得する。
[0081]図20に、コーナー方向FL、FR、BL、及びBRについての4つのフィルタのそのようなセットのビームパターンの例を示す。ランドスケープ記録モードの場合、フィルタを取得及び適用することは、2つの前面マイクロフォン及び2つの背面マイクロフォンを使用することと、アレイに対して固定位置にある音源のための4チャネルIVA学習アルゴリズムを実行することと、収束フィルタを適用することとを含み得る。
[0082]ビームパターンは、収集された混合データに応じて変動し得る。図21に、モバイルスピーカーデータに関して学習されたIVA収束フィルタビームパターンの例を示す。図22に、改良されたモバイルスピーカーデータに関して学習されたIVA収束フィルタビームパターンの例を示す。これらの例は、FRビームパターンを除いて、図21に示した例と同じである。
[0083]IVAを使用して4マイクロフォンフィルタをトレーニングするプロセスは、所望の方向に放射(beaming)することだけでなく、干渉方向を無効化(nulling)することをも含む。例えば、前方左(FL)方向へのビームを含み、前方右(FR)、後方左(BL)、及び後方右(BR)方向に無効化する問題に、FL方向のためのフィルタは絞られる。厳密なマイクロフォンアレイの配列(geometry)がすでに既知である場合、そのようなトレーニング演算は決定論的に行われ得る。代替的に、IVAプロセスはリッチトレーニングデータを用いて実行され得、1つ以上のオーディオソース(例えば、音声、楽器など)が各コーナーに配置され、4マイクロフォンアレイによって獲得される。この場合、トレーニングプロセスは、マイクロフォン構成にかかわらず(即ち、マイクロフォン配列に関する情報の必要なしに)1回実行され得、フィルタは、特定のアレイ構成のために後で固定され得る。アレイが、投影2次元(x−y)平面内に4つのマイクロフォンを含む限り、この学習処理の結果は、4つのコーナーフィルタの適切なセットを生成するために適用され得る。アレイのマイクロフォンが2つの直交する又はほぼ直交する(例えば、15度以内の直交である)軸において構成される限り、そのようなトレーニングされたフィルタは、特定のマイクロフォンアレイ構成の制約なしにサラウンド音像を記録するために使用され得ることに明確に留意されたい。例えば、2つの軸が直交に非常に近接している場合、3マイクロフォンアレイで十分であり、各軸上のマイクロフォン間の間隔間の比は重要ではない。
[0084]上述のように、低周波数を空間的に処理し、高周波数項をパスすることによって、広帯域(例えば、HD)信号が取得され得る。しかしながら、計算量の増加が特定の設計にとって重大な問題でない場合は、全周波数領域の処理が、代わりに実行され得る。4マイクロフォンIVA手法は放射(beaming)よりも無効化(nulling)に絞られるので、高周波数項におけるエイリアシングの効果は低減される。ヌルエイリアシングは、放射方向においてまれな周波数でのみ起こるので、特に小さいインターマイクロフォン間距離の場合、放射方向における周波数領域の大部分が、ヌルエイリアシングによって影響を受けないままである。より大きいマイクロフォン間距離の場合は、無効化が実際にランダム化されるので、効果はちょうど未処理の高周波数項をパスする場合と同様である。
[0085]小さいフォームファクタ(例えば、ハンドヘルド機器)の場合、良好な結果をサポートするにはマイクロフォン間隔が小さすぎ、より高い周波数における性能が損なわれることがあるので、空間フィルタ処理を低周波数において実行することを回避することが望ましいことがある。同様に、高周波数は一般にすでに指向性があり、フィルタ処理は、空間エイリアシング周波数より上の周波数に対して効果がないことがあるので、空間フィルタ処理を高周波数において実行することを回避することが望ましいことがある。
[0086]4つ未満のマイクロフォンが使用される場合、(例えば、不十分な自由度により)3つの他のコーナーにおいてヌルを形成することが困難であり得る。この場合、図17、図23B、及び図23Cに関して上記で説明したエンドファイアペアリングなど、代替を使用することが望ましいことがある。
[0087]本明細書は、(例えば、図25の中央から左への経路に示す)複数の全方向性マイクロフォンを使用して記録された信号から5.1チャネル記録を与えることの開示を含む。複数の全方向性マイクロフォンを使用して獲得された信号から両耳録音(binaural recording)を形成することが望ましいことがある。例えば、ユーザ側に5.1チャネルサラウンドシステムがない場合、サラウンドサウンドシステムを用いて実際の音響空間にいるという経験をユーザが有することができるように、5.1チャネルをステレオバイノーラル録音にダウンミックスすることが望ましいことがある。また、この能力は、ユーザがスポットでシーンを記録している間、ユーザがサラウンド記録を監視すること、及び/又は記録されたビデオ及びサラウンドサウンドをホームシアターシステムの代わりにステレオヘッドセットを使用してユーザのモバイル機器上で再生することができるオプションを与えることができる。
[0088]一般的なリビングルーム空間において、指定された位置(FL、FR、C、BL(又はサラウンド左)、及びBR(又はサラウンド右))に位置するラウドスピーカーを通して再生されるように意図された、全方向性マイクロフォンからの指向性音源を有することができる。(例えば、図25において中央から右への経路に示す)ヘッドフォンのみを用いてこの状況を再生する1つの方法は、所望の音響空間において各ラウドスピーカーから各耳の内部にあるマイクロフォンへのバイノーラルインパルス応答(BIR)(例えば、バイノーラル伝達関数)を測定するオフラインプロセスである。BIRは、ラウドスピーカーのアレイと2つの耳との間のあらゆる音源受信機ペアについて、各ラウドスピーカーからの直接経路ならびに反射経路を含む、音響経路情報を符号化する。小さいマイクロフォンを現実の人間の耳の内部に配置するか、又はシリコーン耳をもつHead and Torso Simulator(HATS、Bruel and Kjaer、デンマーク)などのダミーヘッドを使用し得る。
[0089]バイノーラル再生の場合、測定されたBIRは、指定されたラウドスピーカー位置の各指向性音源を用いて畳み込まれる。全ての指向性音源をBIRと畳み込んだ後、結果は耳記録ごとに加算される。人間の耳によって獲得された左及び右の信号を複製し、ヘッドフォンを介して再生され得る2つのチャネル(例えば、左及び右)が最終結果である。全方向性マイクロフォンのアレイからの5.1サラウンド発生が、そのアレイからバイノーラル再生への経由点として実際に使用されることに留意されたい。従って、この方式は、経由点がどのように発生されるかに応じて一般化され得る。例えば、アレイによって獲得された信号からより指向的な音源を生じる場合、それらの音源を、所望のラウドスピーカー位置から耳への適宜に測定されたBIRをもつ通過点として使用することができる。
[0090]音響信号を受信するように構成された2つ以上のマイクロフォンのアレイR100を有するポータブルオーディオ感知機器内で、本明細書で説明する方法を実行することが望ましいことがある。そのようなアレイを含むように実装され得、オーディオ記録及び/又はボイス通信適用例のために使用され得るポータブルオーディオ感知機器の例には、電話ハンドセット(例えば、セルラー電話ハンドセット)、有線又はワイヤレスヘッドセット(例えば、Bluetooth(登録商標)ヘッドセット)、ハンドヘルドオーディオ及び/又はビデオレコーダ、オーディオ及び/又はビデオコンテンツを記録するように構成されたパーソナルメディアプレーヤ、携帯情報端末(PDA)又は他のハンドヘルドコンピューティング機器、及びノートブックコンピュータ、ラップトップコンピュータ、ネットブックコンピュータ、タブレットコンピュータ、又は他のポータブルコンピューティング機器がある。ポータブルコンピューティング機器の種類は現在、ラップトップコンピュータ、ノートブックコンピュータ、ネットブックコンピュータ、ウルトラポータブルコンピュータ、タブレットコンピュータ、モバイルインターネット機器、スマートブック、及びスマートフォンなどの名称を有する機器を含む。そのような機器は、表示器スクリーンを含む上部パネルと、キーボードを含み得る下部パネルとを有し得、2つのパネルは、二つ折り(clamshell)又は他のヒンジ結合関係で接続され得る。そのような機器は、上表面にタッチスクリーン表示器を含むタブレットコンピュータとして同様に実施され得る。そのような方法を実行し、アレイR100のインスタンスを含むように構築され得、オーディオ記録及び/又はボイス通信適用例のために使用され得るオーディオ感知機器の他の例には、セットトップボックス並びにオーディオ及び/又はビデオ会議機器がある。
[0091]図29Aに、一般的構成によるマルチマイクロフォンオーディオ感知機器D10のブロック図を示す。機器D10は、本明細書で開示するマイクロフォンアレイR100の実施形態のうちのいずれかのインスタンスを含み、本明細書で開示するオーディオ感知機器のいずれも機器D10のインスタンスとして実施され得る。機器D10は、本明細書で開示する方法の実施形態を実行することによってマルチチャネルオーディオ信号MCSを処理するように構成された装置A100をも含む。装置A100は、ソフトウェアとの、及び/又はファームウェアとのハードウェア(例えば、プロセッサ)の組合せとして実施され得る。
[0092]図29Bに、機器D10の実施形態である通信機器D20のブロック図を示す。機器D20は、装置A100を含むチップ又はチップセットCS10(例えば、移動局モデム(MSM)チップセット)を含む。チップ/チップセットCS10は、1つ以上のプロセッサを含み得る。チップ/チップセットCS10は、アレイR100の処理要素(例えば、以下で説明するオーディオ前処理段AP10の要素)をも含み得る。チップ/チップセットCS10は、無線周波(RF)通信信号を受信し、RF信号内で符号化されたオーディオ信号を復号し再生するように構成された、受信機と、装置A100によって生成された処理済み信号に基づくオーディオ信号を符号化し、符号化オーディオ信号を記述しているRF通信信号を送信するように構成された、送信機とを含み得る。例えば、チップ/チップセットCS10の1つ以上のプロセッサは、符号化オーディオ信号が雑音低減信号に基づくように、マルチチャネル信号の1つ以上のチャネルに対して上記で説明した雑音低減演算を実行するように構成され得る。
[0093]アレイR100の各マイクロフォンは、全方向、双方向、又は単方向(例えば、カージオイド)である応答を有し得る。アレイR100において使用され得る様々なタイプのマイクロフォンには、(限定はしないが)圧電マイクロフォン、ダイナミックマイクロフォン、及びエレクトレットマイクロフォンがある。ハンドセット又はヘッドセットなど、ポータブルボイス通信のための機器では、アレイR100の隣接するマイクロフォン間の中心間間隔は一般に約1.5cm〜約4.5cmの範囲内であるが、ハンドセット又はスマートフォンなどの機器では(例えば、10cm又は15cmまでの)より広い間隔も可能であり、タブレットコンピュータなどの機器では(例えば、20cm、25cm又は30cm以上までの)さらに広い間隔が可能である。アレイR100のマイクロフォンは、(一様又は非一様なマイクロフォン間隔をもつ)線に沿って、又は代替的に、それらの中心が2次元形状(例えば、三角形)又は3次元形状の頂点に存在するように構成され得る。
[0094]マイクロフォンは、より一般的には、音以外の放射又は放出に敏感なトランスデューサとして実施され得ることに明確に留意されたい。1つのそのような例では、マイクロフォンペアは、超音波トランスデューサ(例えば、15、20、25、30、40、又は50キロヘルツ以上よりも大きい音響周波数に敏感なトランスデューサ)のペアとして実施される。
[0095]マルチマイクロフォンオーディオ感知機器の動作中、アレイR100はマルチチャネル信号を生成し、各チャネルは、音響環境に対するマイクロフォンのうちの対応する1つの応答に基づく。単一のマイクロフォンを使用して獲得され得るよりも音響環境の完全な表現を集合的に与えるために、対応するチャネルが互いに異なるように、1つのマイクロフォンが別のマイクロフォンよりも直接的に特定の音を受信し得る。
[0096]アレイR100は、マルチチャネル信号MCSを生成するために、マイクロフォンによって生成された信号に対して1つ以上の処理演算を実行することが望ましいことがある。図28Aに、(限定はしないが)インピーダンス整合、アナログデジタル変換、利得制御、及び/又はアナログ及び/又はデジタル領域におけるフィルタ処理を含み得る、1つ以上のそのような演算を実行するように構成されたオーディオ前処理段AP10を含むアレイR100の実施形態R200のブロック図を示す。
[0097]図28Bに、アレイR200の実施形態R210のブロック図を示す。アレイR210は、アナログ前処理段P10aとアナログ前処理段P10bとを含むオーディオ前処理段AP10の実施形態AP20を含む。一例では、段P10a及びP10bはそれぞれ、対応するマイクロフォン信号に対して(例えば、50、100、又は200Hzのカットオフ周波数をもつ)高域フィルタ処理演算を実行するように構成される。
[0098]アレイR100は、マルチチャネル信号をデジタル信号として、即ち、サンプルのシーケンスとして生成することが望ましいことがある。アレイR210は、例えば、対応するアナログチャネルをサンプリングするようにそれぞれ構成されたアナログデジタル変換器(ADC)C10a及びC10bを含む。音響適用例の典型的なサンプリングレートには、8kHz、12kHz、16kHz、及び約8kHz〜約16kHzの範囲内の他の周波数があるが、約44kHzも使用され得る。この特定の例では、アレイR210はまた、マルチチャネル信号MCSの対応するチャネルMCS−1、MCS−2を生成するために、対応するデジタル化チャネル上で1つ以上の前処理演算(例えば、エコー消去、雑音低減、及び/又はスペクトル整形)を実行するようにそれぞれ構成されたデジタル前処理段P20a及びP20bを含む。図28A及び図28Bは2チャネル実施形態を示しているが、同じ原理が任意の数のマイクロフォンとマルチチャネル信号MCSの対応するチャネルとに拡張され得ることを理解されよう。
[0099]本明細書で開示した方法及び装置は、概して任意の送受信及び/又はオーディオ感知適用例、特にそのような適用例のモバイル又は場合によってはポータブルインスタンスにおいて適用され得る。例えば、本明細書で開示した構成の範囲は、符号分割多元接続(CDMA)オーバージエアインターフェースを採用するように構成されたワイヤレステレフォニー通信システム中に常駐する通信機器を含む。とはいえ、本明細書で説明した特徴を有する方法及び装置は、有線及び/又はワイヤレス(例えば、CDMA、TDMA、FDMA、及び/又はTD−SCDMA)送信チャネルを介したボイスオーバIP(VoIP)を採用するシステムなど、当業者に知られている広範囲の技術を採用する様々な通信システムのいずれにも常駐し得ることが、当業者には理解されよう。
[00100]本明細書で開示した通信機器は、パケット交換式であるネットワーク(例えば、VoIPなどのプロトコルに従ってオーディオ送信を搬送するように構成された有線及び/又はワイヤレスネットワーク)及び/又は回線交換式であるネットワークにおける使用に適応され得ることが明確に企図され、本明細書によって開示される。また、本明細書で開示した通信機器は、狭帯域符号化システム(例えば、約4又は5キロヘルツの可聴周波数範囲を符号化するシステム)での使用、及び/又は全帯域広帯域符号化システム及びスプリットバンド広帯域符号化システムを含む、広帯域符号化システム(例えば、5キロヘルツを超える可聴周波数を符号化するシステム)での使用に適応され得ることが明確に企図され、本明細書によって開示される。
[00101]説明した構成の上記の提示は、本明細書で開示する方法及び他の構造を当業者が製造又は使用できるように与えたものである。本明細書で図示及び説明したフローチャート、ブロック図、及び他の構造は例にすぎず、これらの構造の他の変形態も本開示の範囲内である。これらの構成に対する様々な変更が可能であり、本明細書で提示した一般原理は他の構成にも同様に適用され得る。従って、本開示は、上記に示した構成に限定されるものではなく、原開示の一部をなす、出願した添付の特許請求の範囲を含む、本明細書において任意の方法で開示した原理及び新規の特徴に一致する最も広い範囲が与えられるべきである。
[00102]情報及び信号は、多種多様な技術及び技術のいずれかを使用して表され得ることを当業者なら理解されよう。例えば、上記の説明全体にわたって言及され得るデータ、命令、コマンド、情報、信号、ビット、及びシンボルは、電圧、電流、電磁波、磁界又は磁性粒子、光場又は光学粒子、又はそれらの任意の組合せによって表され得る。
[00103]本明細書で開示する構成の実施形態の重要な設計要件は、圧縮されたオーディオ又はオーディオビジュアル情報(例えば、本明細書で識別される例の1つなどの圧縮形式に従って符号化されるファイル又はストリーム)の再生などの計算集約的適用例、若しくは広帯域通信(例えば、12、16、又は44kHzなど、8キロヘルツよりも高いサンプリングレートにおけるボイス通信)の適用例では特に、(一般に百万命令毎秒又はMIPSで測定される)処理遅延及び/又は計算複雑性を最小にすることを含み得る。
[00104]マルチマイクロフォン処理システムの目的は、全体で10〜12dBの雑音低減を達成すること、所望のスピーカーの移動中にボイスレベル及びカラーを保持すること、アグレッシブな雑音除去、音声の残響除去の代わりに雑音が背景に移動されたという知覚を得ること、及び/又はよりアグレッシブな雑音低減のための後処理のオプションを可能にすることを含み得る。
[00105]本明細書で開示する装置の実施形態の様々な要素は、意図された適用例に好適であると考えられる、ソフトウェアとの、及び/又はファームウェアとのハードウェアの任意の組合せで実施できる。例えば、そのような要素は、例えば、同じチップ上に、又はチップセット中の2つ以上のチップ間に常駐する電子機器及び/又は光機器として作製され得る。そのような機器の一例は、トランジスタ又は論理ゲートなどの論理要素の固定アレイ又はプログラマブルアレイであり、これらの要素のいずれも1つ以上のそのようなアレイとして実装され得る。これらの要素のうちの任意の2つ以上、さらには全てが、同じ1つ以上のアレイ内に実装され得る。そのような1つ以上のアレイは、1つ以上のチップ内(例えば、2つ以上のチップを含むチップセット内)に実装され得る。
[00106]本明細書で開示した装置の様々な実施形態の1つ以上の要素は、全体又は一部を、マイクロプロセッサ、組込みプロセッサ、IPコア、デジタル信号プロセッサ、FPGA(フィールドプログラマブルゲートアレイ)、ASSP(特定用途向け標準製品)、及びASIC(特定用途向け集積回路)などの論理要素の1つ以上の固定アレイ又はプログラマブルアレイ上で実行するように構成された命令の1つ以上のセットとしても実施され得る。本明細書で開示した装置の実施形態の様々な要素のいずれも、1つ以上のコンピュータ(例えば、「プロセッサ」とも呼ばれる、命令の1つ以上のセット又はシーケンスを実行するようにプログラムされた1つ以上のアレイを含む機械)としても実施され得、これらの要素のうちの任意の2つ以上、さらには全てが、同じそのような1つ以上のコンピュータ内に実装され得る。
[00107]本明細書で開示したプロセッサ又は処理するための他の手段は、例えば、同じチップ上に、又はチップセット中の2つ以上のチップ間に常駐する1つ以上の電子機器及び/又は光機器として作製され得る。そのような機器の一例は、トランジスタ又は論理ゲートなどの論理要素の固定アレイ又はプログラマブルアレイであり、これらの要素のいずれも1つ以上のそのようなアレイとして実施され得る。そのような1つ以上のアレイは、1つ以上のチップ内(例えば、2つ以上のチップを含むチップセット内)に実装され得る。そのようなアレイの例には、マイクロプロセッサ、組込みプロセッサ、IPコア、DSP、FPGA、ASSP、及びASICなど、論理要素の固定アレイ又はプログラマブルアレイがある。本明細書で開示したプロセッサ又は処理するための他の手段は、1つ以上のコンピュータ(例えば、命令の1つ以上のセット又はシーケンスを実行するようにプログラムされた1つ以上のアレイを含む機械)あるいは他のプロセッサとしても実施され得る。本明細書で説明したプロセッサは、プロセッサが組み込まれている機器又はシステム(例えば、オーディオ感知機器)の別の演算に関係するタスクなど、指向性符号化プロシージャに直接関係しないタスクを実行するか又は命令の他のセットを実行するために使用することが可能である。また、本明細書で開示した方法の一部はオーディオ感知機器のプロセッサによって実行され、その方法の別の一部は1つ以上の他のプロセッサの制御下で実行されることが可能である。
[00108]本明細書で開示した構成に関して説明した様々な例示的なモジュール、論理ブロック、回路、及びテストならびに他の動作は、電子ハードウェア、コンピュータソフトウェア、又はその両方の組合せとして実施され得ることを、当業者なら諒解されよう。そのようなモジュール、論理ブロック、回路、及び動作は、本明細書で開示した構成を生成するように設計された、汎用プロセッサ、デジタル信号プロセッサ(DSP)、ASIC又はASSP、FPGA又は他のプログラマブル論理機器、個別ゲート又はトランジスタ論理、個別ハードウェア構成要素、あるいはそれらの任意の組合せを用いて実装又は実行され得る。例えば、そのような構成は、少なくとも部分的に、ハード有線回路として、特定用途向け集積回路へと作製された回路構成として、又は不揮発性記憶装置にロードされるファームウェアプログラム、又は汎用プロセッサ若しくは他のデジタル信号処理ユニットなどの論理要素のアレイによって実行可能な命令である機械可読コードとしてデータ記憶媒体からロードされるか又はデータ記憶媒体にロードされるソフトウェアプログラムとして実施され得る。汎用プロセッサはマイクロプロセッサであり得るが、代替として、プロセッサは、任意の従来のプロセッサ、コントローラ、マイクロコントローラ、又は状態機械であり得る。プロセッサはまた、コンピューティング機器の組合せ、例えば、DSPとマイクロプロセッサとの組合せ、複数のマイクロプロセッサ、DSPコアと連携する1つ以上のマイクロプロセッサ、又は任意の他のそのような構成として実施され得る。ソフトウェアモジュールは、RAM(ランダムアクセスメモリ)、ROM(読取り専用メモリ)、フラッシュRAMなどの不揮発性RAM(NVRAM)、消去可能プログラマブルROM(EPROM)、電気的消去可能プログラマブルROM(EEPROM)、レジスタ、ハードディスク、リムーバブルディスク、CD−ROM、又は当技術分野で知られている任意の他の形態の記憶媒体中に常駐し得る。例示的な記憶媒体は、プロセッサが記憶媒体から情報を読み取り、記憶媒体に情報を書き込むことができるように、プロセッサに結合される。代替として、記憶媒体はプロセッサに一体化され得る。プロセッサ及び記憶媒体はASIC中に常駐し得る。ASICはユーザ端末内に常駐し得る。代替として、プロセッサ及び記憶媒体は、ユーザ端末中に個別構成要素として常駐し得る。
[00109]本明細書で開示した様々な方法は、プロセッサなどの論理要素のアレイによって実行され得、本明細書で説明した装置の様々な要素は、そのようなアレイ上で実行するように設計されたモジュールとして実施され得ることに留意されたい。本明細書で使用する「モジュール」又は「サブモジュール」という用語は、ソフトウェア、ハードウェア又はファームウェアの形態でコンピュータ命令(例えば、論理式)を含む任意の方法、装置、機器、ユニット又はコンピュータ可読データ記憶媒体を指すことができる。複数のモジュール又はシステムは1つのモジュール又はシステムに合成され得、1つのモジュール又はシステムは、同じ機能を実行する複数のモジュール又はシステムに分離され得ることを理解されたい。ソフトウェア又は他のコンピュータ実行可能命令で実施されるとき、プロセスの要素は本質的に、ルーチン、プログラム、オブジェクト、コンポーネント、データ構造などを用いて関連するタスクを実行するコードセグメントである。「ソフトウェア」という用語は、ソースコード、アセンブリ言語コード、機械コード、バイナリコード、ファームウェア、マクロコード、マイクロコード、論理要素のアレイによって実行可能な命令の1つ以上のセット又はシーケンス、及びそのような例の任意の組合せを含むことを理解されたい。プログラム又はコードセグメントは、プロセッサ可読媒体に記憶され得、又は搬送波に埋め込まれたコンピュータデータ信号によって伝送媒体又は通信リンクを介して送信され得る。
[00110]本明細書で開示した方法、方式、及び技術の実施形態は、(例えば、本明細書に記載する1つ以上のコンピュータ可読媒体中で)論理要素のアレイ(例えば、プロセッサ、マイクロプロセッサ、マイクロコントローラ、又は他の有限状態機械)を含む機械によって読取り可能及び/又は実行可能な命令の1つ以上のセットとしても有形に実施され得る。「コンピュータ可読媒体」という用語は、情報を記憶又は転送することができる、揮発性、不揮発性、取外し可能及び取外し不可能な媒体を含む、任意の媒体を含み得る。コンピュータ可読媒体の例は、電子回路、半導体メモリ機器、ROM、フラッシュメモリ、消去可能ROM(EROM)、フロッピー(登録商標)ディスケット又は他の磁気記憶装置、CD−ROM/DVD又は他の光記憶装置、ハードディスク、光ファイバー媒体、無線周波(RF)リンク、又は所望の情報を記憶するために使用され得、アクセスされ得る、任意の他の媒体を含む。コンピュータデータ信号は、電子ネットワークチャネル、光ファイバー、エアリンク、電磁リンク、RFリンクなどの伝送媒体を介して伝播することができるどんな信号をも含み得る。コードセグメントは、インターネット又はイントラネットなどのコンピュータネットワークを介してダウンロードされ得る。いずれの場合も、本開示の範囲は、そのような実施形態によって限定されると解釈すべきではない。
[00111]本明細書で説明した方法のタスクの各々は、ハードウェアで直接実施され得るか、プロセッサによって実行されるソフトウェアモジュールで実施され得るか、又はその2つの組合せで実施され得る。本明細書で開示した方法の実施形態の典型的な適用例では、論理要素のアレイ(例えば、論理ゲート)は、この方法の様々なタスクのうちの1つ、複数、さらには全てを実行するように構成される。タスクのうちの1つ以上(場合によっては全て)は、論理要素のアレイ(例えば、プロセッサ、マイクロプロセッサ、マイクロコントローラ、又は他の有限状態機械)を含む機械(例えば、コンピュータ)によって読取り可能及び/又は実行可能であるコンピュータプログラム製品(例えば、ディスク、フラッシュメモリカード又は他の不揮発性メモリカード、半導体メモリチップなど、1つ以上のデータ記憶媒体など)に埋め込まれたコード(例えば、命令の1つ以上のセット)としても実施され得る。本明細書で開示した方法の実施形態のタスクは、2つ以上のそのようなアレイ又は機械によっても実行され得る。これら又は他の実施形態では、タスクは、セルラー電話など、ワイヤレス通信用の機器、又はそのような通信機能を有する他の機器内で実行され得る。そのような機器は、(例えば、VoIPなどの1つ以上のプロトコルを使用して)回線交換及び/又はパケット交換ネットワークと通信するように構成され得る。例えば、そのような機器は、符号化フレームを受信及び/又は送信するように構成されたRF回路を含み得る。
[00112]本明細書で開示した様々な方法は、ハンドセット、ヘッドセット、又は携帯情報端末(PDA)などのポータブル通信機器によって実行され得、本明細書で説明した様々な装置は、そのような機器内に含まれ得ることが明確に開示される。典型的なリアルタイム(例えば、オンライン)適用例は、そのようなモバイル機器を使用して行われる電話会話である。
[00113]1つ以上の例示的な実施形態では、本明細書で説明した動作は、ハードウェア、ソフトウェア、ファームウェア、又はそれらの任意の組合せで実施され得る。ソフトウェアで実装する場合、そのような動作は、1つ以上の命令又はコードとしてコンピュータ可読媒体に記憶され得るか、又はコンピュータ可読媒体を介して送信され得る。「コンピュータ可読媒体」という用語は、コンピュータ記憶媒体と、ある場所から別の場所へのコンピュータプログラムの転送を可能にするいかなる媒体をも含む通信媒体の両方を含む。記憶媒体は、コンピュータによってアクセスされ得る任意の利用可能な媒体であり得る。限定ではなく、例として、そのようなコンピュータ可読媒体は、(限定はしないが、ダイナミック又はスタティックRAM、ROM、EEPROM、及び/又はフラッシュRAMを含み得る)半導体メモリ、若しくは強誘電体メモリ、磁気抵抗メモリ、オボニックメモリ、高分子メモリ、又は相変化メモリなどの一連の記憶要素、CD−ROM又は他の光ディスク記憶装置、磁気ディスク記憶装置又は他の磁気記憶装置機器、若しくは所望のプログラムコードを命令又はデータ構造の形態で、コンピュータによってアクセスされ得る有形構造に記憶するために使用され得る任意の他の媒体を備えることができる。また、いかなる接続もコンピュータ可読媒体と適切に呼ばれる。例えば、ソフトウェアが、同軸ケーブル、光ファイバーケーブル、ツイストペア、デジタル加入者回線(DSL)、又は赤外線、無線、及び/又はマイクロ波などのワイヤレス技術を使用して、ウェブサイト、サーバ、若しくは他のリモートソースから送信される場合、同軸ケーブル、光ファイバーケーブル、ツイストペア、DSL、又は赤外線、無線、及び/又はマイクロ波などのワイヤレス技術は、媒体の定義に含まれる。本明細書で使用するディスク(disk)及びディスク(disc)は、コンパクトディスク(disc)(CD)、レーザディスク(disc)、光ディスク(disc)、デジタル多用途ディスク(disc)(DVD)、フロッピーディスク(disk)及びブルーレイディスク(商標)(Blu−Ray Disc Association、カリフォルニア州ユニヴァーサルシティー)を含み、ディスク(disk)は、通常、データを磁気的に再生し、ディスク(disc)はデータをレーザで光学的に再生する。上記の組合せもコンピュータ可読媒体の範囲内に含めるべきである。
[00114]本明細書で説明した音響信号処理装置は、幾つかの動作を制御するために音声入力を受容し、又は背景雑音から所望の雑音を分離することから利益を得ることがある、通信機器などの電子機器に組み込まれ得る。多くの適用例では、複数の方向から発生した背景音から明瞭な所望の音を強調又は分離することから利益を得ることがある。そのような適用例は、ボイス認識及び検出、音声強調及び分離、ボイスアクティブ化制御などの機能を組み込んだ電子機器又はコンピューティング機器におけるヒューマンマシンインターフェースを含み得る。限られた処理機能のみを与える機器に適したそのような音響信号処理装置を実装することが望ましいことがある。
[00115]本明細書で説明したモジュール、要素、及び機器の様々な実施形態の要素は、例えば、同じチップ上に又はチップセット中の2つ以上のチップ間に常駐する電子機器及び/又は光機器として作製され得る。そのような機器の一例は、トランジスタ又はゲートなど、論理要素の固定アレイ又はプログラマブルアレイである。本明細書で説明した装置の様々な実施形態の1つ以上の要素は、全体又は一部が、マイクロプロセッサ、組込みプロセッサ、IPコア、デジタル信号プロセッサ、FPGA、ASSP、及びASICなど、論理要素の1つ以上の固定アレイ又はプログラマブルアレイ上で実行するように構成された命令の1つ以上のセットとしても実施され得る。
[00116]本明細書で説明した装置の実施形態の1つ以上の要素は、その装置が組み込まれている機器又はシステムの別の動作に関係するタスクなど、装置の動作に直接関係しないタスクを実施するために、又は装置の動作に直接関係しない命令の他のセットを実行するために使用されることが可能である。また、そのような装置の実施形態の1つ以上の要素は、共通の構造(例えば、異なる要素に対応するコードの部分を異なる時間に実行するために使用されるプロセッサ、異なる要素に対応するタスクを異なる時間に実施するために実行される命令のセット、又は、異なる要素向けの動作を異なる時間に実施する電子機器及び/又は光機器の構成)を有することが可能である。
[00116]本明細書で説明した装置の実施形態の1つ以上の要素は、その装置が組み込まれている機器又はシステムの別の動作に関係するタスクなど、装置の動作に直接関係しないタスクを実施するために、又は装置の動作に直接関係しない命令の他のセットを実行するために使用されることが可能である。また、そのような装置の実施形態の1つ以上の要素は、共通の構造(例えば、異なる要素に対応するコードの部分を異なる時間に実行するために使用されるプロセッサ、異なる要素に対応するタスクを異なる時間に実施するために実行される命令のセット、又は、異なる要素向けの動作を異なる時間に実施する電子機器及び/又は光機器の構成)を有することが可能である。
以下に本件出願当初の特許請求の範囲に記載された発明を付記する。
[1] オーディオ信号処理の方法であって、記録された聴覚シーンを局在化可能音源の第1のカテゴリーと周囲音の第2のカテゴリーとに分解することと、前記局在化可能音源の各々の方向の指標を記録することと、を備える、方法。
[2] 前記方法が、記録された前記指標の中から記録方向を選択することを備える、請求項1に記載の方法。
[3] 前記方法が、前記局在化可能音源の数を決定することを備え、各音源の到着方向を推定することを含む、請求項1及び2のいずれか1項に記載の方法。
[4] 前記方法が、記録されたマルチチャネル信号を3次元オーディオ符号化方式に従って符号化することを備える、[1]から[3]のいずれか1に記載の方法。
[5] 前記3次元オーディオ符号化方式が、アンビソニック方式及び波動場合成方式のうちの少なくとも1つである、[4]に記載の方法。
[6] 第1のフィルタ処理された信号を取得するために1つのエンドファイア方向においてビームを適用することと、第2のフィルタ処理された信号を取得するために他のエンドファイア方向においてビームを適用することと、前記第1のフィルタ処理された信号を前記第2のフィルタ処理された信号の遅延バージョンと合成することと、を備える、[1]から[5]のいずれか1に記載の方法。
[7] 前記方法が、第1のフィルタ処理された信号を取得するために1つのエンドファイア方向においてビームを適用することと、第2のフィルタ処理された信号を取得するために他のエンドファイア方向においてビームを適用することと、合成信号を取得するために前記第1及び第2のフィルタ処理された信号を合成することと、を備え、前記第1及び第2のフィルタ処理された信号の各々が、少なくとも2つのチャネルを有し、前記合成信号の1つのチャネルが、前記合成信号の別のチャネルに対して遅延させられる、[1]から[5]のいずれか1に記載の方法。
[8] 前記合成することより前に、前記第1のフィルタ処理された信号の1つのチャネルを前記第1のフィルタ処理された信号の別のチャネルに対して遅延させ、前記第2のフィルタ処理された信号の1つのチャネルを前記第2のフィルタ処理された信号の別のチャネルに対して遅延させることを備える、請求項7に記載の方法。
[9] 前記合成信号の1つのチャネルを前記合成信号の別のチャネルに対して遅延させることを備える、請求項7に記載の方法。
[10] 第1の空間フィルタ処理された信号を取得するために、マイクロフォンの第1のペアによって生成された信号に、第1の方向においてビームを有するフィルタを適用することと、第2の空間フィルタ処理された信号を取得するために、マイクロフォンの前記第1のペアとは異なるマイクロフォンの第2のペアによって生成された信号に、前記第1の方向とは異なる第2の方向においてビームを有するフィルタを適用することと、前記第1及び第2の方向とは異なる第3の方向において音源に対応する出力信号を取得するために、前記第1及び第2の空間フィルタ処理された信号を合成することと、を備える、[1]から[5]のいずれか1に記載の方法。
[11] マイクロフォンの前記第1のペアの軸が、マイクロフォンの前記第2のペアの軸に少なくとも実質的に直交する、[10]に記載の方法。
[12] アレイ中の複数のマイクロフォンの各々について、対応する入力チャネルを記録することと、複数のルック方向の各々について、対応する出力チャネルを取得するために、対応するマルチチャネルフィルタを複数の前記記録された入力チャネルに適用することと、を備え、前記マルチチャネルフィルタの各々が、前記対応するルック方向においてビームを適用し、前記複数のルック方向のうちの他のルック方向においてヌルビームを適用する、[1]から[5]のいずれか1に記載の方法。
[13] 前記複数のマイクロフォンの第1のペアの前記軸が、前記複数のマイクロフォンの第2のペアの前記軸に対して直交から15度以下である、[12]に記載の方法。
[14] 前記複数のマイクロフォンが少なくとも4つである、[12]及び[13]のいずれか1に記載の方法。
[15] 前記複数のルック方向が少なくとも4つである、[12]から[14]のいずれか1に記載の方法。
[16] 前記方法が、バイノーラル録音を生成するために前記複数の出力チャネルを処理することを備え、前記処理が、前記複数の出力チャネルの各々について、対応する両耳信号を取得するために、対応する両耳インパルス応答を前記出力チャネルに適用することを含み、前記両耳録音が前記両耳信号の和に基づく、[12]から[15]のいずれか1に記載の方法。
[17] 前記方法が、ポータブルオーディオ感知機器の方向性に基づいて記録方向を選択することを備える、[1]に記載の方法。
[18] 前記フィルタを適用することが、低い閾値と高い閾値との間の周波数に制限され、前記低い閾値及び高い閾値のうちの少なくとも1つが、マイクロフォン間の距離に基づく、[10]に記載の方法。
[19] オーディオ信号処理のための装置であって、記録された聴覚シーンを局在化可能音源の第1のカテゴリーと周囲音の第2のカテゴリーとに分解するための手段と、前記局在化可能音源の各々の方向の指標を記録するための手段と、を備える、装置。
[20] 前記装置が、記録された前記指標の中から記録方向を選択するための手段を備える、[19]に記載の装置。
[21] 前記装置が、各音源の到着方向を推定するための手段を含む、局在化可能音源の数を決定するための手段を備える、[19]及び[20]のいずれか1に記載の装置。
[22] 前記装置が、記録されたマルチチャネル信号を3次元オーディオ符号化方式に従って符号化するための手段を備える、[19]から[21]のいずれか1に記載の装置。
[23] 前記3次元オーディオ符号化方式が、アンビソニック方式及び波動場合成方式のうちの少なくとも1つである、[22]に記載の装置。
[24] 第1のフィルタ処理された信号を取得するために1つのエンドファイア方向にビームを適用するための手段と、第2のフィルタ処理された信号を取得するために他のエンドファイア方向にビームを適用するための手段と、前記第1のフィルタ処理された信号を前記第2のフィルタ処理された信号の遅延バージョンと合成するための手段と
を備える、[19]から[23]のいずれか1に記載の装置。
[25] 第1のフィルタ処理された信号を取得するために1つのエンドファイア方向にビームを適用するための手段と、第2のフィルタ処理された信号を取得するために他のエンドファイア方向にビームを適用するための手段と、合成信号を取得するために前記第1及び第2のフィルタ処理された信号を合成するための手段とを備え、前記第1及び第2のフィルタ処理された信号の各々が、少なくとも2つのチャネルを有し、前記合成信号の1つのチャネルが、前記合成信号の別のチャネルに対して遅延させられる、[19]から[23]のいずれか1に記載の装置。
[26] 前記装置が、前記合成することより前に、前記第1のフィルタ処理された信号の1つのチャネルを前記第1のフィルタ処理された信号の別のチャネルに対して遅延させ、前記第2のフィルタ処理された信号の1つのチャネルを前記第2のフィルタ処理された信号の別のチャネルに対して遅延させるための手段を備える、[25]に記載の装置。
[27] 前記装置が、前記合成信号の1つのチャネルを前記合成信号の別のチャネルに対して遅延させるための手段を備える、[25]に記載の装置。
[28] 第1の空間フィルタ処理された信号を取得するために、マイクロフォンの第1のペアによって生成された信号に、第1の方向にビームを有するフィルタを適用するための手段と、第2の空間フィルタ処理された信号を取得するために、マイクロフォンの前記第1のペアとは異なるマイクロフォンの第2のペアによって生成された信号に、前記第1の方向とは異なる第2の方向においてビームを有するフィルタを適用するための手段と、前記第1及び第2の方向とは異なる第3の方向に音源に対応する出力信号を取得するために、前記第1及び第2の空間フィルタ処理された信号を合成するための手段と、を備える、[19]から[23]いずれか1に記載の装置。
[29] マイクロフォンの前記第1のペアの軸が、マイクロフォンの前記第2のペアの軸に少なくとも実質的に直交する、[28]に記載の装置。
[30] アレイ中の複数のマイクロフォンの各々に、対応する入力チャネルを記録するための手段と、対応する出力チャネルを取得するために、複数のルック方向の各々に、対応するマルチチャネルフィルタを複数の前記記録された入力チャネルに適用するための手段と、を備え、前記マルチチャネルフィルタの各々が、前記対応するルック方向にビームを適用し、前記複数のルック方向のうちの他のルック方向にヌルビームを適用する、[19]から[23]のいずれか1に記載の装置。
[31] 前記複数のマイクロフォンの第1のペアの前記軸が、前記複数のマイクロフォンの第2のペアの前記軸に対して直交から15度以下である、[30]に記載の装置。
[32] 前記複数のマイクロフォンが少なくとも4つである、[30]及び[31]のいずれか1に記載の装置。
[33] 前記複数のルック方向が少なくとも4つである、[30]から[32]のいずれか1に記載の装置。
[34] 前記装置が、バイノーラル録音を生成するために前記複数の出力チャネルを処理するための手段を備え、前記処理が、前記複数の出力チャネルの各々について、対応するバイノーラル信号を取得するために、対応する両耳インパルス応答を前記出力チャネルに適用することを含み、前記バイノーラル録音が前記バイノーラル信号の和に基づく、[30]から[33]のいずれか1に記載の装置。
[35] 前記装置が、ポータブルオーディオ感知機器の方向性に基づいて記録方向を選択するための手段を備える、[19]に記載の装置。
[36] 前記ビームを適用するための前記手段が、低い閾値と高い閾値との間の周波数のみに前記ビームを適用するように構成され、前記低い閾値及び高い閾値のうちの少なくとも1つが、マイクロフォン間の距離に基づく、[24]に記載の装置。
[37] オーディオ信号処理のための装置であって、記録された聴覚シーンを局在化可能音源の第1のカテゴリーと周囲音の第2のカテゴリーとに分解するように構成された空間選択フィルタと、前記局在化可能音源の各々の方向の指標を記録するように構成された方向推定器と、を備える、装置。
[38] 機械によって読み取られたとき、前記機械に[1]から[14]のいずれか1に記載の方法を実行させる有形特徴を備える機械可読記憶媒体。
[39] 対応する複数の固定収束フィルタを発生させるために複数のフィルタをトレーニングすることと、前記分解することを実行するために、前記記録された聴覚シーンに前記固定収束フィルタを適用することと、を含む、[1]から[18]のいずれか1に記載の方法。

Claims (39)

  1. オーディオ信号処理の方法であって、
    記録された聴覚シーンを局在化可能音源の第1のカテゴリーと周囲音の第2のカテゴリーとに分解することと、
    前記局在化可能音源の各々の方向の指標を記録することと、
    を備える、方法。
  2. 前記方法が、記録された前記指示の中から記録方向を選択することを備える、請求項1に記載の方法。
  3. 前記方法が、前記局在化可能音源の数を決定することを備え、各音源の到着方向を推定することを含む、請求項1及び2のいずれか1項に記載の方法。
  4. 前記方法が、記録されたマルチチャネル信号を3次元オーディオ符号化方式に従って符号化することを備える、請求項1から3のいずれか1項に記載の方法。
  5. 前記3次元オーディオ符号化方式が、アンビソニック方式及び波動場合成方式のうちの少なくとも1つである、請求項4に記載の方法。
  6. 第1のフィルタ処理された信号を取得するために1つのエンドファイア方向においてビームを適用することと、
    第2のフィルタ処理された信号を取得するために他のエンドファイア方向においてビームを適用することと、
    前記第1のフィルタ処理された信号を前記第2のフィルタ処理された信号の遅延バージョンと合成することと、
    を備える、請求項1から5のいずれか1項に記載の方法。
  7. 前記方法が、
    第1のフィルタ処理された信号を取得するために1つのエンドファイア方向においてビームを適用することと、
    第2のフィルタ処理された信号を取得するために他のエンドファイア方向においてビームを適用することと、
    合成信号を取得するために前記第1及び第2のフィルタ処理された信号を合成することと、
    を備え、
    前記第1及び第2のフィルタ処理された信号の各々が、少なくとも2つのチャネルを有し、
    前記合成信号の1つのチャネルが、前記合成信号の別のチャネルに対して遅延させられる、
    請求項1から5のいずれか1項に記載の方法。
  8. 前記合成することより前に、前記第1のフィルタ処理された信号の1つのチャネルを前記第1のフィルタ処理された信号の別のチャネルに対して遅延させ、前記第2のフィルタ処理された信号の1つのチャネルを前記第2のフィルタ処理された信号の別のチャネルに対して遅延させることを備える、請求項7に記載の方法。
  9. 前記合成信号の1つのチャネルを前記合成信号の別のチャネルに対して遅延させることを備える、請求項7に記載の方法。
  10. 第1の空間フィルタ処理された信号を取得するために、マイクロフォンの第1のペアによって生成された信号に、第1の方向においてビームを有するフィルタを適用することと、
    第2の空間フィルタ処理された信号を取得するために、マイクロフォンの前記第1のペアとは異なるマイクロフォンの第2のペアによって生成された信号に、前記第1の方向とは異なる第2の方向においてビームを有するフィルタを適用することと、
    前記第1及び第2の方向とは異なる第3の方向において音源に対応する出力信号を取得するために、前記第1及び第2の空間フィルタ処理された信号を合成することと、
    を備える、請求項1から5のいずれか1項に記載の方法。
  11. マイクロフォンの前記第1のペアの軸が、マイクロフォンの前記第2のペアの軸に少なくとも実質的に直交する、請求項10に記載の方法。
  12. アレイ中の複数のマイクロフォンの各々について、対応する入力チャネルを記録することと、
    複数のルック方向の各々について、対応する出力チャネルを取得するために、対応するマルチチャネルフィルタを複数の前記記録された入力チャネルに適用することと、
    を備え、
    前記マルチチャネルフィルタの各々が、前記対応するルック方向においてビームを適用し、前記複数のルック方向のうちの他のルック方向においてヌルビームを適用する、
    請求項1から5のいずれか1項に記載の方法。
  13. 前記複数のマイクロフォンの第1のペアの前記軸が、前記複数のマイクロフォンの第2のペアの前記軸に対して直交から15度以下である、請求項12に記載の方法。
  14. 前記複数のマイクロフォンが少なくとも4つである、請求項12及び13のいずれか1項に記載の方法。
  15. 前記複数のルック方向が少なくとも4つである、請求項12から14のいずれか1項に記載の方法。
  16. 前記方法が、バイノーラル録音を生成するために前記複数の出力チャネルを処理することを備え、
    前記処理が、前記複数の出力チャネルの各々について、対応する両耳信号を取得するために、対応する両耳インパルス応答を前記出力チャネルに適用することを含み、
    前記両耳録音が前記両耳信号の和に基づく、請求項12から15のいずれか1項に記載の方法。
  17. 前記方法が、ポータブルオーディオ感知機器の方向性に基づいて記録方向を選択することを備える、請求項1に記載の方法。
  18. 前記フィルタを適用することが、低い閾値と高い閾値との間の周波数に制限され、
    前記低い閾値及び高い閾値のうちの少なくとも1つが、マイクロフォン間の距離に基づく、
    請求項10に記載の方法。
  19. オーディオ信号処理のための装置であって、
    記録された聴覚シーンを局在化可能音源の第1のカテゴリーと周囲音の第2のカテゴリーとに分解するための手段と、
    前記局在化可能音源の各々の方向の指標を記録するための手段と、
    を備える、装置。
  20. 前記装置が、記録された前記指標の中から記録方向を選択するための手段を備える、請求項19に記載の装置。
  21. 前記装置が、各音源の到着方向を推定するための手段を含む、局在化可能音源の数を決定するための手段を備える、請求項19及び20のいずれか1項に記載の装置。
  22. 前記装置が、記録されたマルチチャネル信号を3次元オーディオ符号化方式に従って符号化するための手段を備える、請求項19から21のいずれか1項に記載の装置。
  23. 前記3次元オーディオ符号化方式が、アンビソニック方式及び波動場合成方式のうちの少なくとも1つである、請求項22に記載の装置。
  24. 第1のフィルタ処理された信号を取得するために1つのエンドファイア方向にビームを適用するための手段と、
    第2のフィルタ処理された信号を取得するために他のエンドファイア方向にビームを適用するための手段と、
    前記第1のフィルタ処理された信号を前記第2のフィルタ処理された信号の遅延バージョンと合成するための手段と
    を備える、請求項19から23のいずれか1項に記載の装置。
  25. 第1のフィルタ処理された信号を取得するために1つのエンドファイア方向にビームを適用するための手段と、
    第2のフィルタ処理された信号を取得するために他のエンドファイア方向にビームを適用するための手段と、
    合成信号を取得するために前記第1及び第2のフィルタ処理された信号を合成するための手段と
    を備え、
    前記第1及び第2のフィルタ処理された信号の各々が、少なくとも2つのチャネルを有し、
    前記合成信号の1つのチャネルが、前記合成信号の別のチャネルに対して遅延させられる、
    請求項19から23のいずれか1項に記載の装置。
  26. 前記装置が、前記合成することより前に、前記第1のフィルタ処理された信号の1つのチャネルを前記第1のフィルタ処理された信号の別のチャネルに対して遅延させ、前記第2のフィルタ処理された信号の1つのチャネルを前記第2のフィルタ処理された信号の別のチャネルに対して遅延させるための手段を備える、請求項25に記載の装置。
  27. 前記装置が、前記合成信号の1つのチャネルを前記合成信号の別のチャネルに対して遅延させるための手段を備える、請求項25に記載の装置。
  28. 第1の空間フィルタ処理された信号を取得するために、マイクロフォンの第1のペアによって生成された信号に、第1の方向にビームを有するフィルタを適用するための手段と、
    第2の空間フィルタ処理された信号を取得するために、マイクロフォンの前記第1のペアとは異なるマイクロフォンの第2のペアによって生成された信号に、前記第1の方向とは異なる第2の方向においてビームを有するフィルタを適用するための手段と、
    前記第1及び第2の方向とは異なる第3の方向に音源に対応する出力信号を取得するために、前記第1及び第2の空間フィルタ処理された信号を合成するための手段と、
    を備える、請求項19から23いずれか1項に記載の装置。
  29. マイクロフォンの前記第1のペアの軸が、マイクロフォンの前記第2のペアの軸に少なくとも実質的に直交する、請求項28に記載の装置。
  30. アレイ中の複数のマイクロフォンの各々に、対応する入力チャネルを記録するための手段と、
    対応する出力チャネルを取得するために、複数のルック方向の各々に、対応するマルチチャネルフィルタを複数の前記記録された入力チャネルに適用するための手段と、
    を備え、
    前記マルチチャネルフィルタの各々が、前記対応するルック方向にビームを適用し、前記複数のルック方向のうちの他のルック方向にヌルビームを適用する、請求項19から23のいずれか1項に記載の装置。
  31. 前記複数のマイクロフォンの第1のペアの前記軸が、前記複数のマイクロフォンの第2のペアの前記軸に対して直交から15度以下である、請求項30に記載の装置。
  32. 前記複数のマイクロフォンが少なくとも4つである、請求項30及び31のいずれか1項に記載の装置。
  33. 前記複数のルック方向が少なくとも4つである、請求項30から32のいずれか1項に記載の装置。
  34. 前記装置が、バイノーラル録音を生成するために前記複数の出力チャネルを処理するための手段を備え、
    前記処理が、前記複数の出力チャネルの各々について、対応するバイノーラル信号を取得するために、対応する両耳インパルス応答を前記出力チャネルに適用することを含み、
    前記バイノーラル録音が前記バイノーラル信号の和に基づく、請求項30から33のいずれか1項に記載の装置。
  35. 前記装置が、ポータブルオーディオ感知機器の方向性に基づいて記録方向を選択するための手段を備える、請求項19に記載の装置。
  36. 前記ビームを適用するための前記手段が、低い閾値と高い閾値との間の周波数のみに前記ビームを適用するように構成され、
    前記低い閾値及び高い閾値のうちの少なくとも1つが、マイクロフォン間の距離に基づく、請求項24に記載の装置。
  37. オーディオ信号処理のための装置であって、
    記録された聴覚シーンを局在化可能音源の第1のカテゴリーと周囲音の第2のカテゴリーとに分解するように構成された空間選択フィルタと、
    前記局在化可能音源の各々の方向の指示を記録するように構成された方向推定器と、
    を備える、装置。
  38. 機械によって読み取られたとき、前記機械に請求項1から14のいずれか1項に記載の方法を実行させる有形特徴を備える機械可読記憶媒体。
  39. 対応する複数の固定収束フィルタを発生させるために複数のフィルタをトレーニングすることと、
    前記分解することを実行するために、前記記録された聴覚シーンに前記固定収束フィルタを適用することと、
    を含む、請求項1から18のいずれか1項に記載の方法。
JP2013536744A 2010-10-25 2011-10-25 マルチマイクロフォンを用いた3次元サウンド獲得及び再生 Expired - Fee Related JP5762550B2 (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US40639610P 2010-10-25 2010-10-25
US61/406,396 2010-10-25
US201161466432P 2011-03-22 2011-03-22
US61/466,432 2011-03-22
US13/280,303 US9552840B2 (en) 2010-10-25 2011-10-24 Three-dimensional sound capturing and reproducing with multi-microphones
US13/280,303 2011-10-24
PCT/US2011/057728 WO2012061149A1 (en) 2010-10-25 2011-10-25 Three-dimensional sound capturing and reproducing with multi-microphones

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2015116766A Division JP6121481B2 (ja) 2010-10-25 2015-06-09 マルチマイクロフォンを用いた3次元サウンド獲得及び再生

Publications (2)

Publication Number Publication Date
JP2014501064A true JP2014501064A (ja) 2014-01-16
JP5762550B2 JP5762550B2 (ja) 2015-08-12

Family

ID=44913426

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2013536744A Expired - Fee Related JP5762550B2 (ja) 2010-10-25 2011-10-25 マルチマイクロフォンを用いた3次元サウンド獲得及び再生
JP2015116766A Active JP6121481B2 (ja) 2010-10-25 2015-06-09 マルチマイクロフォンを用いた3次元サウンド獲得及び再生

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2015116766A Active JP6121481B2 (ja) 2010-10-25 2015-06-09 マルチマイクロフォンを用いた3次元サウンド獲得及び再生

Country Status (6)

Country Link
US (1) US9552840B2 (ja)
EP (1) EP2633697B1 (ja)
JP (2) JP5762550B2 (ja)
KR (1) KR101547035B1 (ja)
CN (1) CN103181192B (ja)
WO (1) WO2012061149A1 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015523594A (ja) * 2012-05-24 2015-08-13 クゥアルコム・インコーポレイテッドQualcomm Incorporated 呼中における三次元サウンド圧縮及びオーバー・ザ・エア送信
JP2016502797A (ja) * 2012-11-15 2016-01-28 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 複数のパラメトリック・オーディオ・ストリームを発生するための装置及び方法、並びに複数のラウドスピーカ信号を発生するための装置及び方法
KR20160026652A (ko) * 2014-08-29 2016-03-09 후아웨이 테크놀러지 컴퍼니 리미티드 사운드 신호 처리 방법 및 장치
WO2016056410A1 (ja) * 2014-10-10 2016-04-14 ソニー株式会社 音声処理装置および方法、並びにプログラム
JP2017514360A (ja) * 2014-04-07 2017-06-01 ハーマン ベッカー オートモーティブ システムズ ゲーエムベーハー 音波動場生成
JP2018182518A (ja) * 2017-04-12 2018-11-15 株式会社ザクティ 全天球カメラ装置
US10504523B2 (en) 2017-06-01 2019-12-10 Kabushiki Kaisha Toshiba Voice processing device, voice processing method, and computer program product
WO2023013041A1 (ja) * 2021-08-06 2023-02-09 日本電信電話株式会社 マイクロホンアレイおよび信号変換装置

Families Citing this family (159)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9031256B2 (en) 2010-10-25 2015-05-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for orientation-sensitive recording control
US8855341B2 (en) 2010-10-25 2014-10-07 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for head tracking based on recorded sound signals
US9363602B2 (en) * 2012-01-06 2016-06-07 Bit Cauldron Corporation Method and apparatus for providing virtualized audio files via headphones
CN104335599A (zh) 2012-04-05 2015-02-04 诺基亚公司 柔性的空间音频捕捉设备
US9135927B2 (en) * 2012-04-30 2015-09-15 Nokia Technologies Oy Methods and apparatus for audio processing
US9190065B2 (en) 2012-07-15 2015-11-17 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients
US8989552B2 (en) * 2012-08-17 2015-03-24 Nokia Corporation Multi device audio capture
KR20140029931A (ko) * 2012-08-31 2014-03-11 삼성전자주식회사 스피커에서 출력되는 음성을 소멸시켜 에코 발생을 차단하는 전자 장치 및 방법
WO2014064689A1 (en) 2012-10-22 2014-05-01 Tomer Goshen A system and methods thereof for capturing a predetermined sound beam
US9271076B2 (en) * 2012-11-08 2016-02-23 Dsp Group Ltd. Enhanced stereophonic audio recordings in handheld devices
US10606546B2 (en) 2012-12-05 2020-03-31 Nokia Technologies Oy Orientation based microphone selection apparatus
US10127912B2 (en) * 2012-12-10 2018-11-13 Nokia Technologies Oy Orientation based microphone selection apparatus
US9277321B2 (en) 2012-12-17 2016-03-01 Nokia Technologies Oy Device discovery and constellation selection
EP2760223B1 (en) * 2013-01-29 2019-07-24 2236008 Ontario Inc. Sound field encoder
US9426573B2 (en) 2013-01-29 2016-08-23 2236008 Ontario Inc. Sound field encoder
US9338420B2 (en) 2013-02-15 2016-05-10 Qualcomm Incorporated Video analysis assisted generation of multi-channel audio data
US9959875B2 (en) * 2013-03-01 2018-05-01 Qualcomm Incorporated Specifying spherical harmonic and/or higher order ambisonics coefficients in bitstreams
US10750132B2 (en) * 2013-03-14 2020-08-18 Pelco, Inc. System and method for audio source localization using multiple audio sensors
WO2014147442A1 (en) * 2013-03-20 2014-09-25 Nokia Corporation Spatial audio apparatus
US10068363B2 (en) 2013-03-27 2018-09-04 Nokia Technologies Oy Image point of interest analyser with animation generator
CA2908654C (en) * 2013-04-10 2019-08-13 Nokia Technologies Oy Audio recording and playback apparatus
US20140355769A1 (en) 2013-05-29 2014-12-04 Qualcomm Incorporated Energy preservation for decomposed representations of a sound field
US9877135B2 (en) 2013-06-07 2018-01-23 Nokia Technologies Oy Method and apparatus for location based loudspeaker system configuration
CN104244164A (zh) 2013-06-18 2014-12-24 杜比实验室特许公司 生成环绕立体声声场
WO2015032009A1 (es) * 2013-09-09 2015-03-12 Recabal Guiraldes Pablo Método y sistema de tamaño reducido para la decodificación de señales de audio en señales de audio binaural
US20160227320A1 (en) * 2013-09-12 2016-08-04 Wolfson Dynamic Hearing Pty Ltd. Multi-channel microphone mapping
EP2884491A1 (en) 2013-12-11 2015-06-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Extraction of reverberant sound using microphone arrays
CN104754446B (zh) * 2013-12-31 2018-06-22 展讯通信(上海)有限公司 一种麦克风控制方法和装置
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US9502045B2 (en) 2014-01-30 2016-11-22 Qualcomm Incorporated Coding independent frames of ambient higher-order ambisonic coefficients
KR102188101B1 (ko) * 2014-03-14 2020-12-07 삼성전자주식회사 오디오 처리 방법 및 그 전자 장치
DE102014004071A1 (de) * 2014-03-20 2015-09-24 Unify Gmbh & Co. Kg Verfahren, Vorrichtung und System zur Steuerung einer Konferenz
EP2928210A1 (en) 2014-04-03 2015-10-07 Oticon A/s A binaural hearing assistance system comprising binaural noise reduction
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
US9852737B2 (en) 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
EP3165007B1 (en) 2014-07-03 2018-04-25 Dolby Laboratories Licensing Corporation Auxiliary augmentation of soundfields
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
US10034088B2 (en) * 2014-11-11 2018-07-24 Sony Corporation Sound processing device and sound processing method
US9654868B2 (en) 2014-12-05 2017-05-16 Stages Llc Multi-channel multi-domain source identification and tracking
US10609475B2 (en) 2014-12-05 2020-03-31 Stages Llc Active noise control and customized audio system
US20160161588A1 (en) * 2014-12-05 2016-06-09 Stages Pcs, Llc Body-mounted multi-planar array
KR102008745B1 (ko) * 2014-12-18 2019-08-09 후아웨이 테크놀러지 컴퍼니 리미티드 이동 디바이스들을 위한 서라운드 사운드 레코딩
WO2016123572A1 (en) * 2015-01-30 2016-08-04 Dts, Inc. System and method for capturing, encoding, distributing, and decoding immersive audio
CN104637494A (zh) * 2015-02-02 2015-05-20 哈尔滨工程大学 基于盲源分离的双话筒移动设备语音信号增强方法
WO2016130834A1 (en) * 2015-02-12 2016-08-18 Dolby Laboratories Licensing Corporation Reverberation generation for headphone virtualization
US9716944B2 (en) 2015-03-30 2017-07-25 Microsoft Technology Licensing, Llc Adjustable audio beamforming
US9554207B2 (en) 2015-04-30 2017-01-24 Shure Acquisition Holdings, Inc. Offset cartridge microphones
US9565493B2 (en) 2015-04-30 2017-02-07 Shure Acquisition Holdings, Inc. Array microphone system and method of assembling the same
KR101678305B1 (ko) * 2015-07-03 2016-11-21 한양대학교 산학협력단 텔레프레즌스를 위한 하이브리드형 3d 마이크로폰 어레이 시스템 및 동작 방법
CN106339514A (zh) * 2015-07-06 2017-01-18 杜比实验室特许公司 从活动的音频源估计回响能量成分
CN107925818B (zh) * 2015-10-15 2020-10-16 华为技术有限公司 用于声音处理节点装置的声音处理节点
CN105407443B (zh) * 2015-10-29 2018-02-13 小米科技有限责任公司 录音方法及装置
AU2016355673B2 (en) 2015-11-17 2019-10-24 Dolby International Ab Headtracking for parametric binaural output system and method
CN105447244B (zh) * 2015-11-18 2018-06-19 北京大学 一种3d录音系统球面麦克风阵列分布方法
US10152977B2 (en) * 2015-11-20 2018-12-11 Qualcomm Incorporated Encoding of multiple audio signals
CN106790940B (zh) 2015-11-25 2020-02-14 华为技术有限公司 录音方法、录音播放方法、装置及终端
GB2549922A (en) * 2016-01-27 2017-11-08 Nokia Technologies Oy Apparatus, methods and computer computer programs for encoding and decoding audio signals
US10095470B2 (en) 2016-02-22 2018-10-09 Sonos, Inc. Audio response playback
US9947316B2 (en) 2016-02-22 2018-04-17 Sonos, Inc. Voice control of a media playback system
US9965247B2 (en) 2016-02-22 2018-05-08 Sonos, Inc. Voice controlled media playback system based on user profile
US10509626B2 (en) 2016-02-22 2019-12-17 Sonos, Inc Handling of loss of pairing between networked devices
US10264030B2 (en) 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US9826306B2 (en) 2016-02-22 2017-11-21 Sonos, Inc. Default playback device designation
US9978390B2 (en) 2016-06-09 2018-05-22 Sonos, Inc. Dynamic player selection for audio signal processing
US10477304B2 (en) * 2016-06-15 2019-11-12 Mh Acoustics, Llc Spatial encoding directional microphone array
WO2017218399A1 (en) * 2016-06-15 2017-12-21 Mh Acoustics, Llc Spatial encoding directional microphone array
US10152969B2 (en) 2016-07-15 2018-12-11 Sonos, Inc. Voice detection by multiple devices
US10134399B2 (en) 2016-07-15 2018-11-20 Sonos, Inc. Contextualization of voice inputs
US10115400B2 (en) 2016-08-05 2018-10-30 Sonos, Inc. Multiple voice services
US9942678B1 (en) 2016-09-27 2018-04-10 Sonos, Inc. Audio playback settings for voice interaction
US9743204B1 (en) 2016-09-30 2017-08-22 Sonos, Inc. Multi-orientation playback device microphones
US10181323B2 (en) 2016-10-19 2019-01-15 Sonos, Inc. Arbitration-based voice recognition
GB2556093A (en) * 2016-11-18 2018-05-23 Nokia Technologies Oy Analysis of spatial metadata from multi-microphones having asymmetric geometry in devices
US10945080B2 (en) 2016-11-18 2021-03-09 Stages Llc Audio analysis and processing system
US9980042B1 (en) 2016-11-18 2018-05-22 Stages Llc Beamformer direction of arrival and orientation analysis system
US9980075B1 (en) 2016-11-18 2018-05-22 Stages Llc Audio source spatialization relative to orientation sensor and output
US10367948B2 (en) 2017-01-13 2019-07-30 Shure Acquisition Holdings, Inc. Post-mixing acoustic echo cancellation systems and methods
US11183181B2 (en) 2017-03-27 2021-11-23 Sonos, Inc. Systems and methods of multiple voice services
WO2018186656A1 (ko) 2017-04-03 2018-10-11 가우디오디오랩 주식회사 오디오 신호 처리 방법 및 장치
US10750307B2 (en) 2017-04-14 2020-08-18 Hewlett-Packard Development Company, L.P. Crosstalk cancellation for stereo speakers of mobile devices
US20180317006A1 (en) 2017-04-28 2018-11-01 Qualcomm Incorporated Microphone configurations
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
US10129648B1 (en) 2017-05-11 2018-11-13 Microsoft Technology Licensing, Llc Hinged computing device for binaural recording
EP3422744B1 (en) * 2017-06-30 2021-09-29 Nokia Technologies Oy An apparatus and associated methods
US10475449B2 (en) 2017-08-07 2019-11-12 Sonos, Inc. Wake-word detection suppression
US10477310B2 (en) * 2017-08-24 2019-11-12 Qualcomm Incorporated Ambisonic signal generation for microphone arrays
US10048930B1 (en) 2017-09-08 2018-08-14 Sonos, Inc. Dynamic computation of system response volume
US10446165B2 (en) 2017-09-27 2019-10-15 Sonos, Inc. Robust short-time fourier transform acoustic echo cancellation during audio playback
US10051366B1 (en) 2017-09-28 2018-08-14 Sonos, Inc. Three-dimensional beam forming with a microphone array
US10482868B2 (en) 2017-09-28 2019-11-19 Sonos, Inc. Multi-channel acoustic echo cancellation
US10621981B2 (en) 2017-09-28 2020-04-14 Sonos, Inc. Tone interference cancellation
US10390131B2 (en) * 2017-09-29 2019-08-20 Apple Inc. Recording musical instruments using a microphone array in a device
US10466962B2 (en) 2017-09-29 2019-11-05 Sonos, Inc. Media playback system with voice assistance
US11245981B2 (en) * 2017-11-15 2022-02-08 Mitsubishi Electric Corporation Sound collection and playback apparatus, and recording medium
US10880650B2 (en) 2017-12-10 2020-12-29 Sonos, Inc. Network microphone devices with automatic do not disturb actuation capabilities
US10818290B2 (en) 2017-12-11 2020-10-27 Sonos, Inc. Home graph
WO2019152722A1 (en) 2018-01-31 2019-08-08 Sonos, Inc. Device designation of playback and network microphone device arrangements
US11175880B2 (en) 2018-05-10 2021-11-16 Sonos, Inc. Systems and methods for voice-assisted media content selection
US10847178B2 (en) 2018-05-18 2020-11-24 Sonos, Inc. Linear filtering for noise-suppressed speech detection
US10959029B2 (en) 2018-05-25 2021-03-23 Sonos, Inc. Determining and adapting to changes in microphone performance of playback devices
US11523212B2 (en) 2018-06-01 2022-12-06 Shure Acquisition Holdings, Inc. Pattern-forming microphone array
US11297423B2 (en) 2018-06-15 2022-04-05 Shure Acquisition Holdings, Inc. Endfire linear array microphone
US10681460B2 (en) 2018-06-28 2020-06-09 Sonos, Inc. Systems and methods for associating playback devices with voice assistant services
TWI690921B (zh) 2018-08-24 2020-04-11 緯創資通股份有限公司 收音處理裝置及其收音處理方法
US10461710B1 (en) 2018-08-28 2019-10-29 Sonos, Inc. Media playback system with maximum volume setting
US11076035B2 (en) 2018-08-28 2021-07-27 Sonos, Inc. Do not disturb feature for audio notifications
US10878811B2 (en) 2018-09-14 2020-12-29 Sonos, Inc. Networked devices, systems, and methods for intelligently deactivating wake-word engines
US10587430B1 (en) 2018-09-14 2020-03-10 Sonos, Inc. Networked devices, systems, and methods for associating playback devices based on sound codes
CN112889296A (zh) 2018-09-20 2021-06-01 舒尔获得控股公司 用于阵列麦克风的可调整的波瓣形状
US11024331B2 (en) 2018-09-21 2021-06-01 Sonos, Inc. Voice detection optimization using sound metadata
US10811015B2 (en) 2018-09-25 2020-10-20 Sonos, Inc. Voice detection optimization based on selected voice assistant service
US11100923B2 (en) 2018-09-28 2021-08-24 Sonos, Inc. Systems and methods for selective wake word detection using neural network models
US10665250B2 (en) 2018-09-28 2020-05-26 Apple Inc. Real-time feedback during audio recording, and related devices and systems
US10692518B2 (en) 2018-09-29 2020-06-23 Sonos, Inc. Linear filtering for noise-suppressed speech detection via multiple network microphone devices
US11899519B2 (en) 2018-10-23 2024-02-13 Sonos, Inc. Multiple stage network microphone device with reduced power consumption and processing load
CN111145793B (zh) * 2018-11-02 2022-04-26 北京微播视界科技有限公司 音频处理方法和装置
EP3654249A1 (en) 2018-11-15 2020-05-20 Snips Dilated convolutions and gating for efficient keyword spotting
KR102085210B1 (ko) * 2018-11-15 2020-03-04 (주)파트론 지향성 마이크로폰 장치
CN111223254B (zh) * 2018-11-23 2022-04-19 无锡科晟光子科技有限公司 一种精准性高的声音报警传感器
US11839808B2 (en) 2018-11-30 2023-12-12 Sony Interactive Entertainment Inc. Input device
US11183183B2 (en) 2018-12-07 2021-11-23 Sonos, Inc. Systems and methods of operating media playback systems having multiple voice assistant services
US11132989B2 (en) 2018-12-13 2021-09-28 Sonos, Inc. Networked microphone devices, systems, and methods of localized arbitration
US10602268B1 (en) 2018-12-20 2020-03-24 Sonos, Inc. Optimization of network microphone devices using noise classification
US10867604B2 (en) 2019-02-08 2020-12-15 Sonos, Inc. Devices, systems, and methods for distributed voice processing
US11315556B2 (en) 2019-02-08 2022-04-26 Sonos, Inc. Devices, systems, and methods for distributed voice processing by transmitting sound data associated with a wake word to an appropriate device for identification
US11049509B2 (en) * 2019-03-06 2021-06-29 Plantronics, Inc. Voice signal enhancement for head-worn audio devices
US11558693B2 (en) 2019-03-21 2023-01-17 Shure Acquisition Holdings, Inc. Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition and voice activity detection functionality
EP3942842A1 (en) 2019-03-21 2022-01-26 Shure Acquisition Holdings, Inc. Housings and associated design features for ceiling array microphones
EP3942845A1 (en) 2019-03-21 2022-01-26 Shure Acquisition Holdings, Inc. Auto focus, auto focus within regions, and auto placement of beamformed microphone lobes with inhibition functionality
US11120794B2 (en) 2019-05-03 2021-09-14 Sonos, Inc. Voice assistant persistence across multiple network microphone devices
EP3973716A1 (en) 2019-05-23 2022-03-30 Shure Acquisition Holdings, Inc. Steerable speaker array, system, and method for the same
JP2022535229A (ja) 2019-05-31 2022-08-05 シュアー アクイジッション ホールディングス インコーポレイテッド 音声およびノイズアクティビティ検出と統合された低レイテンシオートミキサー
US10586540B1 (en) 2019-06-12 2020-03-10 Sonos, Inc. Network microphone device with command keyword conditioning
US11200894B2 (en) 2019-06-12 2021-12-14 Sonos, Inc. Network microphone device with command keyword eventing
US11361756B2 (en) 2019-06-12 2022-06-14 Sonos, Inc. Conditional wake word eventing based on environment
US11138969B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US11138975B2 (en) 2019-07-31 2021-10-05 Sonos, Inc. Locally distributed keyword detection
US10871943B1 (en) 2019-07-31 2020-12-22 Sonos, Inc. Noise classification for event detection
CN114467312A (zh) 2019-08-23 2022-05-10 舒尔获得控股公司 具有改进方向性的二维麦克风阵列
US20210092543A1 (en) * 2019-09-19 2021-03-25 Qualcomm Incorporated 3d sound orientation adaptability
US11189286B2 (en) 2019-10-22 2021-11-30 Sonos, Inc. VAS toggle based on device orientation
US11200900B2 (en) 2019-12-20 2021-12-14 Sonos, Inc. Offline voice control
JP7396029B2 (ja) 2019-12-23 2023-12-12 ティアック株式会社 録音再生装置
US11562740B2 (en) 2020-01-07 2023-01-24 Sonos, Inc. Voice verification for media playback
US11556307B2 (en) 2020-01-31 2023-01-17 Sonos, Inc. Local voice data processing
US11308958B2 (en) 2020-02-07 2022-04-19 Sonos, Inc. Localized wakeword verification
US11552611B2 (en) 2020-02-07 2023-01-10 Shure Acquisition Holdings, Inc. System and method for automatic adjustment of reference gain
USD944776S1 (en) 2020-05-05 2022-03-01 Shure Acquisition Holdings, Inc. Audio device
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
US11308962B2 (en) 2020-05-20 2022-04-19 Sonos, Inc. Input detection windowing
US11727919B2 (en) 2020-05-20 2023-08-15 Sonos, Inc. Memory allocation for keyword spotting engines
WO2021243368A2 (en) 2020-05-29 2021-12-02 Shure Acquisition Holdings, Inc. Transducer steering and configuration systems and methods using a local positioning system
CN111856402B (zh) * 2020-07-23 2023-08-18 海尔优家智能科技(北京)有限公司 信号处理方法及装置、存储介质、电子装置
US11698771B2 (en) 2020-08-25 2023-07-11 Sonos, Inc. Vocal guidance engines for playback devices
CN112259110B (zh) * 2020-11-17 2022-07-01 北京声智科技有限公司 音频编码方法及装置、音频解码方法及装置
US11551700B2 (en) 2021-01-25 2023-01-10 Sonos, Inc. Systems and methods for power-efficient keyword detection
EP4285605A1 (en) 2021-01-28 2023-12-06 Shure Acquisition Holdings, Inc. Hybrid audio beamforming system
US20220046355A1 (en) * 2021-10-25 2022-02-10 Intel Corporation Audio processing device and method for acoustic angle of arrival detection using audio signals of a virtual rotating microphone

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07336250A (ja) * 1994-06-04 1995-12-22 Kenwood Corp マルチパス除去フィルタ
US20060195324A1 (en) * 2002-11-12 2006-08-31 Christian Birk Voice input interface
WO2007099908A1 (ja) * 2006-02-27 2007-09-07 Matsushita Electric Industrial Co., Ltd. ウェアラブル端末、および、携帯撮像収音装置、およびそれらを実現する装置、方法、プログラム
JP2008507926A (ja) * 2004-07-22 2008-03-13 ソフトマックス,インク 雑音環境内で音声信号を分離するためのヘッドセット
JP2008079255A (ja) * 2006-09-25 2008-04-03 Toshiba Corp 音響信号処理装置、音響信号処理方法及び音響信号処理プログラム
JP2008193420A (ja) * 2007-02-05 2008-08-21 Sony Corp ヘッドフォン装置、音声再生システム、音声再生方法
JP2008219458A (ja) * 2007-03-05 2008-09-18 Kobe Steel Ltd 音源分離装置,音源分離プログラム及び音源分離方法
US20080247565A1 (en) * 2003-01-10 2008-10-09 Mh Acoustics, Llc Position-Independent Microphone System
WO2009086017A1 (en) * 2007-12-19 2009-07-09 Qualcomm Incorporated Systems, methods, and apparatus for multi-microphone based speech enhancement
WO2009117471A1 (en) * 2008-03-18 2009-09-24 Qualcomm Incorporated Speech enhancement using multiple microphones on multiple devices
JP2010506525A (ja) * 2006-10-10 2010-02-25 シーメンス アウディオローギッシェ テヒニク ゲゼルシャフト ミット ベシュレンクテル ハフツング 補聴器の駆動方法および補聴器
WO2010048620A1 (en) * 2008-10-24 2010-04-29 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coherence detection
WO2010116153A1 (en) * 2009-04-09 2010-10-14 Ntnu Technology Transfer As Optimal modal beamformer for sensor arrays

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2630573B1 (fr) 1988-04-26 1990-07-13 Sgs Thomson Microelectronics Memoire programmable electriquement avec plusieurs bits d'information par cellule
JPH0795698A (ja) 1993-09-21 1995-04-07 Sony Corp オーディオ再生装置
FR2744871B1 (fr) 1996-02-13 1998-03-06 Sextant Avionique Systeme de spatialisation sonore, et procede de personnalisation pour sa mise en oeuvre
US6072878A (en) 1997-09-24 2000-06-06 Sonic Solutions Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics
US6005610A (en) 1998-01-23 1999-12-21 Lucent Technologies Inc. Audio-visual object localization and tracking system and method therefor
KR19990076219A (ko) 1998-03-30 1999-10-15 전주범 3차원 사운드 녹화 시스템
US6507659B1 (en) 1999-01-25 2003-01-14 Cascade Audio, Inc. Microphone apparatus for producing signals for surround reproduction
JP2000287295A (ja) * 1999-01-29 2000-10-13 Canon Inc 信号処理装置
EP1094374B1 (en) 1999-10-20 2007-12-05 Sony Deutschland GmbH Mobile terminal for a wireless telecommunication system with accurate real time generation
US6690618B2 (en) 2001-04-03 2004-02-10 Canesta, Inc. Method and apparatus for approximating a source position of a sound-causing event for determining an input used in operating an electronic device
JP2002135898A (ja) 2000-10-19 2002-05-10 Matsushita Electric Ind Co Ltd 音像定位制御ヘッドホン
JP4202640B2 (ja) 2001-12-25 2008-12-24 株式会社東芝 短距離無線通信用ヘッドセット、これを用いたコミュニケーションシステム、および短距離無線通信における音響処理方法
WO2003101150A1 (de) 2002-05-27 2003-12-04 Sonicemotion Ag Verfahren und vorrichtung zur erzeugung von daten über die gegenseitige lage von mindestens drei schallwandlern
US7606372B2 (en) 2003-02-12 2009-10-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Device and method for determining a reproduction position
JP4266148B2 (ja) 2003-09-30 2009-05-20 株式会社東芝 電子機器
JP2005176063A (ja) 2003-12-12 2005-06-30 Canon Inc 録音機能を有する撮像装置及びその録音方法
JP2005176138A (ja) 2003-12-12 2005-06-30 Canon Inc 音声記録再生装置及び音声記録再生方法
DE102004005998B3 (de) 2004-02-06 2005-05-25 Ruwisch, Dietmar, Dr. Verfahren und Vorrichtung zur Separierung von Schallsignalen
JP4116600B2 (ja) 2004-08-24 2008-07-09 日本電信電話株式会社 収音方法、収音装置、収音プログラム、およびこれを記録した記録媒体
GB0419346D0 (en) 2004-09-01 2004-09-29 Smyth Stephen M F Method and apparatus for improved headphone virtualisation
KR100677554B1 (ko) * 2005-01-14 2007-02-02 삼성전자주식회사 비임형성 방식을 이용한 녹음 장치 및 그 방법
FI20055260A0 (fi) * 2005-05-27 2005-05-27 Midas Studios Avoin Yhtioe Laite, järjestelmä ja menetelmä akustisten signaalien vastaanottamista tai toistamista varten
WO2007103037A2 (en) * 2006-03-01 2007-09-13 Softmax, Inc. System and method for generating a separated signal
JP4779748B2 (ja) 2006-03-27 2011-09-28 株式会社デンソー 車両用音声入出力装置および音声入出力装置用プログラム
JP2007318373A (ja) 2006-05-25 2007-12-06 Kobe Steel Ltd 音声入力装置、音源分離装置
JP2008131616A (ja) 2006-11-27 2008-06-05 Nec Saitama Ltd 携帯端末装置、表示方向切り替え方法、および、表示方向切り替えプログラム
DE102007005861B3 (de) 2007-02-06 2008-08-21 Siemens Audiologische Technik Gmbh Hörvorrichtung mit automatischer Ausrichtung des Richtmikrofons und entsprechendes Verfahren
JP4928382B2 (ja) 2007-08-10 2012-05-09 日本電信電話株式会社 特定方向収音装置、特定方向収音方法、特定方向収音プログラム、記録媒体
WO2009126561A1 (en) * 2008-04-07 2009-10-15 Dolby Laboratories Licensing Corporation Surround sound generation from a microphone array
JP5240832B2 (ja) 2008-06-04 2013-07-17 Necカシオモバイルコミュニケーションズ株式会社 音入力装置、音入力方法およびプログラム
KR20090131237A (ko) 2008-06-17 2009-12-28 한국전자통신연구원 공간 필터링을 이용한 오디오 채널 분리 장치 및 그 방법
US8391507B2 (en) 2008-08-22 2013-03-05 Qualcomm Incorporated Systems, methods, and apparatus for detection of uncorrelated component
JP5231139B2 (ja) * 2008-08-27 2013-07-10 株式会社日立製作所 音源抽出装置
US20100098258A1 (en) 2008-10-22 2010-04-22 Karl Ola Thorn System and method for generating multichannel audio with a portable electronic device
JP5369649B2 (ja) 2008-11-28 2013-12-18 ヤマハ株式会社 受信装置および音声ガイドシステム
EP2205007B1 (en) * 2008-12-30 2019-01-09 Dolby International AB Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction
US8855341B2 (en) 2010-10-25 2014-10-07 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for head tracking based on recorded sound signals
US9031256B2 (en) 2010-10-25 2015-05-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for orientation-sensitive recording control

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07336250A (ja) * 1994-06-04 1995-12-22 Kenwood Corp マルチパス除去フィルタ
US20060195324A1 (en) * 2002-11-12 2006-08-31 Christian Birk Voice input interface
US20080247565A1 (en) * 2003-01-10 2008-10-09 Mh Acoustics, Llc Position-Independent Microphone System
JP2008507926A (ja) * 2004-07-22 2008-03-13 ソフトマックス,インク 雑音環境内で音声信号を分離するためのヘッドセット
WO2007099908A1 (ja) * 2006-02-27 2007-09-07 Matsushita Electric Industrial Co., Ltd. ウェアラブル端末、および、携帯撮像収音装置、およびそれらを実現する装置、方法、プログラム
JP2008079255A (ja) * 2006-09-25 2008-04-03 Toshiba Corp 音響信号処理装置、音響信号処理方法及び音響信号処理プログラム
JP2010506525A (ja) * 2006-10-10 2010-02-25 シーメンス アウディオローギッシェ テヒニク ゲゼルシャフト ミット ベシュレンクテル ハフツング 補聴器の駆動方法および補聴器
JP2008193420A (ja) * 2007-02-05 2008-08-21 Sony Corp ヘッドフォン装置、音声再生システム、音声再生方法
JP2008219458A (ja) * 2007-03-05 2008-09-18 Kobe Steel Ltd 音源分離装置,音源分離プログラム及び音源分離方法
WO2009086017A1 (en) * 2007-12-19 2009-07-09 Qualcomm Incorporated Systems, methods, and apparatus for multi-microphone based speech enhancement
WO2009117471A1 (en) * 2008-03-18 2009-09-24 Qualcomm Incorporated Speech enhancement using multiple microphones on multiple devices
WO2010048620A1 (en) * 2008-10-24 2010-04-29 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coherence detection
JP2012507049A (ja) * 2008-10-24 2012-03-22 クゥアルコム・インコーポレイテッド コヒーレンス検出のためのシステム、方法、装置、およびコンピュータ可読媒体
WO2010116153A1 (en) * 2009-04-09 2010-10-14 Ntnu Technology Transfer As Optimal modal beamformer for sensor arrays
JP2012523731A (ja) * 2009-04-09 2012-10-04 エヌティーエヌユー テクノロジー トランスファー エーエス センサーアレイに最適なモーダルビームフォーマ

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015523594A (ja) * 2012-05-24 2015-08-13 クゥアルコム・インコーポレイテッドQualcomm Incorporated 呼中における三次元サウンド圧縮及びオーバー・ザ・エア送信
JP2016502797A (ja) * 2012-11-15 2016-01-28 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 複数のパラメトリック・オーディオ・ストリームを発生するための装置及び方法、並びに複数のラウドスピーカ信号を発生するための装置及び方法
US10313815B2 (en) 2012-11-15 2019-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a plurality of parametric audio streams and apparatus and method for generating a plurality of loudspeaker signals
JP2017514360A (ja) * 2014-04-07 2017-06-01 ハーマン ベッカー オートモーティブ システムズ ゲーエムベーハー 音波動場生成
US10715917B2 (en) 2014-04-07 2020-07-14 Harman Becker Automotive Systems Gmbh Sound wave field generation
KR101724514B1 (ko) * 2014-08-29 2017-04-07 후아웨이 테크놀러지 컴퍼니 리미티드 사운드 신호 처리 방법 및 장치
JP2016052117A (ja) * 2014-08-29 2016-04-11 華為技術有限公司Huawei Technologies Co.,Ltd. 音声信号処理方法および装置
KR20160026652A (ko) * 2014-08-29 2016-03-09 후아웨이 테크놀러지 컴퍼니 리미티드 사운드 신호 처리 방법 및 장치
WO2016056410A1 (ja) * 2014-10-10 2016-04-14 ソニー株式会社 音声処理装置および方法、並びにプログラム
JPWO2016056410A1 (ja) * 2014-10-10 2017-07-20 ソニー株式会社 音声処理装置および方法、並びにプログラム
US10602266B2 (en) 2014-10-10 2020-03-24 Sony Corporation Audio processing apparatus and method, and program
JP2018182518A (ja) * 2017-04-12 2018-11-15 株式会社ザクティ 全天球カメラ装置
US10504523B2 (en) 2017-06-01 2019-12-10 Kabushiki Kaisha Toshiba Voice processing device, voice processing method, and computer program product
WO2023013041A1 (ja) * 2021-08-06 2023-02-09 日本電信電話株式会社 マイクロホンアレイおよび信号変換装置

Also Published As

Publication number Publication date
US20120128160A1 (en) 2012-05-24
CN103181192A (zh) 2013-06-26
JP6121481B2 (ja) 2017-04-26
KR20130116271A (ko) 2013-10-23
WO2012061149A1 (en) 2012-05-10
KR101547035B1 (ko) 2015-08-24
US9552840B2 (en) 2017-01-24
EP2633697A1 (en) 2013-09-04
JP5762550B2 (ja) 2015-08-12
CN103181192B (zh) 2017-03-01
JP2015213328A (ja) 2015-11-26
EP2633697B1 (en) 2016-07-20

Similar Documents

Publication Publication Date Title
JP6121481B2 (ja) マルチマイクロフォンを用いた3次元サウンド獲得及び再生
US9361898B2 (en) Three-dimensional sound compression and over-the-air-transmission during a call
US8855341B2 (en) Systems, methods, apparatus, and computer-readable media for head tracking based on recorded sound signals
US9031256B2 (en) Systems, methods, apparatus, and computer-readable media for orientation-sensitive recording control
US8965546B2 (en) Systems, methods, and apparatus for enhanced acoustic imaging
EP3320692B1 (en) Spatial audio processing apparatus
US9578439B2 (en) Method, system and article of manufacture for processing spatial audio
US20140006017A1 (en) Systems, methods, apparatus, and computer-readable media for generating obfuscated speech signal
EP3005362B1 (en) Apparatus and method for improving a perception of a sound signal
EP2599330B1 (en) Systems, methods, and apparatus for enhanced creation of an acoustic image in space

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131030

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131030

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140819

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150512

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150609

R150 Certificate of patent or registration of utility model

Ref document number: 5762550

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees