JP2016513816A - コンテンツベースのノイズ抑制 - Google Patents
コンテンツベースのノイズ抑制 Download PDFInfo
- Publication number
- JP2016513816A JP2016513816A JP2015561382A JP2015561382A JP2016513816A JP 2016513816 A JP2016513816 A JP 2016513816A JP 2015561382 A JP2015561382 A JP 2015561382A JP 2015561382 A JP2015561382 A JP 2015561382A JP 2016513816 A JP2016513816 A JP 2016513816A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- content
- audio signal
- noise signal
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000001629 suppression Effects 0.000 title description 16
- 230000005236 sound signal Effects 0.000 claims abstract description 206
- 238000000034 method Methods 0.000 claims abstract description 81
- 238000004891 communication Methods 0.000 claims abstract description 58
- 230000002238 attenuated effect Effects 0.000 claims abstract description 13
- 230000003044 adaptive effect Effects 0.000 claims description 42
- 230000001360 synchronised effect Effects 0.000 claims description 26
- 230000004044 response Effects 0.000 claims description 8
- 238000012545 processing Methods 0.000 description 62
- 238000010586 diagram Methods 0.000 description 20
- 238000013500 data storage Methods 0.000 description 14
- 230000000694 effects Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 238000001914 filtration Methods 0.000 description 6
- 230000001413 cellular effect Effects 0.000 description 4
- 230000001934 delay Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000012805 post-processing Methods 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 240000001436 Antirrhinum majus Species 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 230000009931 harmful effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 239000010979 ruby Substances 0.000 description 1
- 229910001750 ruby Inorganic materials 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M9/00—Arrangements for interconnection not involving centralised switching
- H04M9/08—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic
- H04M9/082—Two-way loud-speaking telephone systems with means for conditioning the signal, e.g. for suppressing echoes for one or both directions of traffic using echo cancellers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
以下の記述はオーディオ信号処理を対象にしている。より詳細には、記述はオーディオノイズ抑制を対象にしている。
部分的には、バッテリー技術、処理技術、および通信技術における進歩のために、パーソナルデバイスはいっそう移動性が増し、高性能になり、および接続性が向上している。これらの技術が進歩するにつれて、デバイスを使用する方法や、デバイスと対話する方法において、ユーザはより柔軟性を有する。特に、ユーザが音声コマンドにより移動体デバイスを制御するのを可能にする音声認識を、移動体デバイスは使用するかもしれない。さらに、音声認識とともに音声テレメトリに対して、ユーザは、音響的に耳障りな環境を含むさまざまな環境中で移動体デバイスが正常に動作することを望む。
ユーザが移動体デバイスと対話しているとき、さまざまなノイズ抑制スキームが使用されて、バックグラウンドノイズの有害な影響が低減または緩和されている。例えば、周波数選択フィルタリングを使用して、ある周波数帯域に関係付けられているノイズを抑制することができる。他のノイズ抑制スキームは、統計モデルを使用して、ノイズに統計的に関連する、または意図したオーディオ信号に統計的に関連しない、取り込まれたオーディオ信号のある態様を抑制する。さらに、他のノイズ抑制スキームは、内部信号を使用して、移動体デバイスによって生成され後に感知されるサウンドから結果的に生じるノイズ(例えば、エコーノイズ)をキャンセルする。
発明のシステム、方法、およびデバイスは各々いくつかの態様を有しており、これらのうちの単一のもののみが、その望ましい属性に関与しているわけではない。後続する特許請求の範囲によって表された本発明の範囲を限定することなく、いくつかの特徴をここで簡単に説明する。この説明を考慮した後に、特に“詳細な説明”と題するセクションを読んだ後に、バックグラウンドノイズを低減させてオーディオ処理を改善することを含む利点を、本発明の特徴がどのように提供するかを理解するだろう。
1つの実施形態は、オーディオノイズを減衰させるデバイスである。デバイスは、入力オーディオ信号を受け取るように構成されているマイクロフォンを備えることができる。デバイスは、識別可能なコンテンツを有するノイズ信号を入力オーディオ信号が含むか否かを決定するように構成されているオーディオ信号解析器も備えることができる。識別可能なコンテンツを有するノイズ信号が存在する場合に、オーディオ信号解析器は、コンテンツソースにアクセスして、ノイズ信号のコピーを取得することができる。デバイスは、ノイズ信号のコピーと入力オーディオ信号とを比較することに基づいて、減衰されたノイズ信号を有する処理されたオーディオ信号を発生させるように構成されているオーディオキャンセラも備えることができる。
別の実施形態は、オーディオノイズを減衰させる方法である。方法は、入力オーディオ信号を受け取ることを含むことができる。方法は、識別可能なコンテンツを有するノイズ信号を入力オーディオ信号が含むか否かを決定することも含むことができる。識別可能なコンテンツを有するノイズ信号が存在する場合に、方法は、コンテンツソースにアクセスして、ノイズ信号のコピーを取得することを含むことができる。方法は、ノイズ信号のコピーと入力オーディオ信号とを比較することに基づいて、減衰されたノイズ信号を有する処理されたオーディオ信号を発生させることをさらに含むことができる。
さらに別の実施形態は、実行されるときにプロセッサに方法を実行させる命令を記憶する、非一時的コンピュータ読み取り可能媒体である。方法は、入力オーディオ信号を受け取ることと、識別可能なコンテンツを有するノイズ信号を入力オーディオ信号が含むか否かを決定することとを含む。識別可能なコンテンツを有するノイズ信号が存在する場合に、方法は、コンテンツソースにアクセスして、ノイズ信号のコピーを取得することを含む。方法は、ノイズ信号のコピーと入力オーディオ信号とを比較することに基づいて、減衰されたノイズ信号を有する処理されたオーディオ信号を発生させることをさらに含む。
実施形態は、電子デバイスによって受け取られるオーディオ信号中の、望ましくないオーディオノイズを抑制するための、システムおよび方法に関連している。1つの実施形態において、システムは、バックグラウンドで再生されているポピュラーな歌のような、識別可能なメディアコンテンツを表すオーディオノイズを抑制する。システムは、メディアコンテンツのコピーを取得し、メディアコンテンツのコピーから望ましくないオーディオノイズのコピーを発生させ、望ましくないオーディオノイズをオーディオ信号から除去する。例えば、動作において、システムは、望ましくないオーディオノイズの音響パターンまたは音響フィンガープリントを決定し、音響パターンを使用して、オーディオノイズによって表されるメディアコンテンツ(例えば、特定の歌)を識別する。識別子を使用して、識別された歌のデジタルレコーディングのようなメディアコンテンツソースをサーチすることができる。いったん歌が識別されると、歌のコピーを電子デバイスにダウンロードして、その後、歌のコピーを使用して、オーディオ信号からその歌を減算することができる。1つの実施形態では、セルラフォンのようなポータブルコンピューティングデバイスによってシステムを実現することができる。例えば、電話機での会話の間にバックグラウンドで再生されている歌または他のメディアコンテンツを、セルラフォンは抑制することができる。
1つの特有の例では、マイクロフォンと、その電話機のメモリ中に記憶されているデジタル音楽ライブラリとを有するセルラフォンによって、システムを実現することができる。特定の歌を再生しているラジオの近くで人が電話機でトークするとき、システムは、マイクロフォンのオーディオ信号からオーディオ特徴を抽出して、その歌の音響パターンまたは音響フィンガープリントを作り出すことができる。その後、作り出されたパターンを使用して、そのような音響パターンによってインデックス付けされた歌識別子を含んでいるデータベースをサーチして、ラジオによって再生されている歌を発見することができる。歌識別子がパターンに一致する場合、電話機は、識別された歌のコピーを発見するために自身の音楽ライブラリをサーチすることができる。代替的に、電話機は、識別された歌のコピーを、ネットワーク接続を通してサーバから要求することができる。いったんアクセスされると、ラジオの再生にしたがって、歌のコピーを歌の時間的なポジションに同期化させて、受け取ったオーディオ信号から歌を抑制することができる。このシステムを有する電話機によって、アウトドア音楽現場またはコンサートホールのような、電話による会話に対して、そうでなければあまりにも音響的に耳障りであっただろうエリアにおいて、ユーザは電話機を動作させることができるだろう。
別の特有の例では、ワイヤレス通信能力を有するテレビ(TV)のような別個のメディアデバイスを制御する、音声制御される遠隔制御装置によって、ノイズ抑制システムを実現することができる。制御装置は、コンテンツ情報をTVから直接受信するかもしれない。例えば、TVは、再生しているアクティブなチャンネルを遠隔装置に通信することができ、遠隔装置は、その情報を使用して、インターネット接続を通してチャンネルのオーディオにアクセスすることができる。代替的に、TVは、ブロードキャストのコピーを遠隔装置に送ることができる。次に、遠隔装置は、ブロードキャストのコピーを使用して、TVによって生成されるオーディオをキャンセルすることができる。このことによって、音声制御電子デバイスは、オーディオを発生させているメディアデバイスと一緒に動作することができるだろう。
開示する方法、装置、およびシステムは、既存のノイズ抑制技術を改良するように機能する。特に、いくつかのシチュエーションにおいて、オーディオノイズのコンテンツを推定および/または識別した後に、オーディオノイズが実質的に決定論的であると発見することがある。実例として、そのような1つのシチュエーションは、予め記録された歌がノイズソースである場合である。このケースでは、例えば、歌が再生されていることと、何の特定の歌かと、歌の特有のタイミングとが知られている場合に、歌は実質的に決定論的であることがある。上記のコンテンツ関連情報が既知である、または識別可能である場合に、歌またはオーディオ信号のコピーを使用して、歌に対応するオーディオ信号の成分を減衰すなわちキャンセルすることができる。この方法における歌の抑制は、移動体デバイスを通した音声認識または音声通信の品質を改善する。
メディアデバイスの例には、オーディオメディアコンテンツを含むメディアコンテンツを再生するように構成されている、テレビ、ラジオ、ラップトップ/ネットワークブックコンピュータ、タブレットコンピュータ、デスクトップコンピュータ、および、これらに類する電子デバイスが含まれる。オーディオメディアコンテンツの例には、音楽、ビデオ、および、これらに類するオーディオを有する他のメディア、を表すデータまたは信号が含まれる。
さらに図示すると、図1は、1つ以上のメディアデバイスからのノイズを抑制するように構成されているモバイルフォン102を含む、特有のオーディオコンフィギュレーション100のブロックダイヤグラムを示している。特に、モバイルフォン102はマイクロフォン104とアンテナ106とを有している。モバイルフォン102は、ネットワーク108または他の電子デバイスに、音声およびデータの信号を通信することができる。ネットワーク108は、ワイヤードネットワークまたはワイヤレスネットワークであり、音楽およびオーディオビデオのデータファイルのようなさまざまなコンテンツソースを記憶する1つ以上のコンテンツデータベース110へのアクセスを提供することができる。1つの実施形態では、ネットワークはインターネットである。
動作において、例えば、モバイルフォン102を制御する、または、モバイルフォン102に通信可能に結合されている他の電子デバイスを制御する、音声通信および/または音声認識のために、ユーザ112は、モバイルフォン102のマイクロフォン104に話しかける。モバイルフォン102のマイクロフォン104は、ユーザの音声コマンド114を取り込んで、入力オーディオ信号を発生させる。いくつかのシチュエーションでは、ネットワークイネーブルされているテレビ(TV)116またはラジオ118のような別個のメディアデバイスに、モバイルフォン102が近接しているかもしれない。これらのデバイスはバックグラウンドサウンド120、122を生成させるかもしれず、バックグラウンドサウンド120、122は、モバイルフォン102の動作に関して、望ましくないバックグラウンドオーディオノイズとして作用する。
例えば、ネットワークイネーブルされているTV116またはラジオ118が、記憶している音楽またはストリーム音楽を再生していることがある。ネットワークイネーブルされているTV116またはラジオ118によって生成されるバックグラウンドサウンドと同時に、マイクロフォン104は、ユーザ112からの音声コマンド114を取り込むかもしれない。このような状況では、ネットワークイネーブルされているTV116またはラジオ118からのサウンドは、ユーザの音声コマンド114を著しく妨害して、ユーザに対して、会話または音声の認識を難しくするかもしれない。さまざまな実施形態は、入力オーディオ信号のノイズ成分を抑制することに関連している。
ノイズ信号のコンテンツが識別できる場合は、モバイルフォン102はノイズ信号をより明確に抑制することができる。1つの実施形態において、モバイルフォン102は、入力オーディオ信号を解析して、テレビのブロードキャストからの特定の歌またはオーディオのような識別可能なコンテンツを、入力オーディオ信号が有するか否かを決定する。例えば、1つの実施形態は、入力オーディオ信号の特徴を抽出することによって(歌のタイトル、アルバム名、アーティスト名、または、これらに類するもの、のような)コンテンツ−識別情報を決定し、その後、コンテンツソースをサーチ、ダウンロード、ストリーミングするか、または、そうでない場合はコンテンツソースにアクセスする。例えば、図1を参照すると、モバイルフォン102は、コンテンツデータベース110をサーチして、コンテンツソースにアクセスできる。コンテンツソースは、ソース−識別情報との一致に基づいて決定される。コンテンツソースへのアクセスを有すると、オーディオノイズのコピー(“ソース信号”)をモバイルフォン102は取得することができる。オーディオノイズのコピーを使用して、メディアデバイスによって生成されるサウンドに対応するオーディオノイズを明確に減衰または抑制できる。
追加的または代替的に、モバイルフォン102は、直接か、またはネットワーク108を通してかのいずれかで、ネットワークイネーブルされているTV116および/またはラジオ118と通信して、コンテンツソースを識別するかもしれない。例えば、モバイルフォン102は、ネットワークイネーブルされているTV116からの、例えばチャンネル情報を要求することができる。ネットワークイネーブルされているTV116は、自身の通信アンテナ124を使用することによって通信することができる。モバイルフォン102は、受信したチャンネル情報に基づいて、コンテンツデータベース110からのコンテンツソースにアクセスすることができる。別の例として、モバイルフォン102は、例えば、識別されたチャンネルにチューニングすることによって、ネットワークイネーブルされているTV116にメディアコンテンツをブロードキャストしている(示していない)デバイスからのコンテンツソースにアクセスすることができる。さらに別の例として、モバイルフォン102は、ネットワークイネーブルされているTV116からのコンテンツソースにアクセスすることができる。言い換えれば、ネットワークイネーブルされているTV116は、モバイルフォン102に直接、コンテンツソースを送信または中継することができる。
ここで、図2に移ると、望ましくないオーディオノイズを抑制するように構成されているオーディオ処理デバイス202の、実例となる実施形態のブロックダイヤグラムが示されている。オーディオ処理デバイス202は、バス214によって相互接続されている、プロセッサ204と、マイクロフォン206と、通信インターフェース208と、データ記憶デバイス210と、メモリ212とを備えている。さらに、メモリ212は、オーディオ信号解析器モジュール216と、オーディオキャンセラモジュール218と、通信モジュール212とを含むことができる。オーディオ処理デバイス202の例には、移動体コンピューティングデバイス、セルラフォン、汎用コンピュータ、および、これらに類するもの、のような任意の適用可能な電子デバイスが含まれる。
メモリ212からの命令を実行し、マイクロフォン206、通信インターフェース208、データ記憶デバイス210、メモリ212、およびバス214を制御および動作させるように構成されているマイクロプロセッサまたはマイクロ制御装置のような回路を、プロセッサ204は含んでいる。特に、プロセッサ204は、汎用の単一または複数チップマイクロプロセッサ(例えば、ARM)、特殊目的マイクロプロセッサ(例えば、デジタル信号プロセッサ(DSP))、マイクロ制御装置、プログラム可能ゲートアレイなどであってもよい。オーディオ処理デバイス202中ではちょうど単一のプロセッサを示しているが、代替的なコンフィギュレーションにおいては、プロセッサ(例えば、ARMやDSP)を組み合わせたものを使用することもできる。
プロセッサ204がメモリ212からの特有の命令を実行することによって制御されて、マイクロフォン206は、音響サウンドを取り込み、応答の入力オーディオ信号を発生させるように構成されている。マイクロフォン206の例には、コンデンサーマイクロフォン、ダイナミックマイクロフォン、圧電マイクロフォン、および、これらに類するもの、のようなサウンドを電気的なオーディオ信号に変換する任意の適用可能なセンサまたはトランスデューサーが含まれる。いくつかの実施形態においては、マイクロフォン206はオプションであり、図3を参照して説明するように、入力オーディオ信号は、例えば、データ記憶デバイス210またはメモリ212からのデータから発生される、あるいは、通信インターフェース208から受け取られる。
コンテンツソースを識別、検索、またはコンテンツソースにアクセスするためのデータのようなデータを、オーディオ処理デバイス202が送信および受信することを可能にするように構成されている電子装置を、通信インターフェース208は備えている。通信インターフェース208を、ワイヤレスアンテナ、WLAN/LANおよび他のタイプのルータ、ならびに、これらに類する通信デバイスに、通信可能に結合することができる。
化学的手段、磁気的手段、電気的手段、光学的手段、または、これらに類する手段によって情報を記憶するように構成されているメカニズムを、データ記憶デバイス210およびメモリ212は備えている。例えば、データ記憶デバイス210およびメモリ212を各々、フラッシュメモリまたはハードディスクドライブのような不揮発性メモリデバイス、あるいは、ダイナミックランダムアクセスメモリ(DRAM)またはスタティックランダムアクセスメモリ(SRAM)のような揮発性メモリデバイスにすることができる。いくつかの実施形態において、データ記憶デバイス210のコンテンツソースデータベースにアクセスすることによって、プロセッサ204はコンテンツソースにアクセスすることができる。図2は、データ記憶デバイス210を、オーディオ処理デバイス202の一部として示している。他の実施形態において、データ記憶デバイス210は、別個のデバイスに位置していてもよく、例えばネットワークを通して、通信チャネルによってアクセスされるかもしれない。図3に関連して、オーディオ信号解析器モジュール216をさらに詳細に説明する。
オーディオ信号解析器モジュール216は、メモリ212内に存在する。入力オーディオ信号のコンテンツの識別を開始し、対応するコンテンツソースへのアクセスを提供し、および/または、識別されたソース信号を受信するようにプロセッサ204を構成する命令を、オーディオ信号解析器モジュール216は含んでいる。図3に関連してさらに詳細に説明するように、いくつかの実施形態において、入力オーディオ信号から特徴が抽出される。抽出された特徴を使用して、入力オーディオ信号によって表されるメディアコンテンツのコンテンツ識別子を決定することができる。コンテンツ識別子を使用して、コンテンツ識別子に関係付けられているコンテンツソースにアクセスすることができる。図4および図5に関連して、オーディオ信号解析器モジュール218をさらに詳細に説明する。
オーディオキャンセラモジュール218は、メモリ212内に存在する。識別されたソース信号により入力オーディオ信号を処理して、オーディオノイズを減衰させるようにプロセッサ204を構成する命令を、オーディオキャンセラモジュール218は含んでいる。特に、入力オーディオ信号と識別されたソース信号とを比較する。1つの実施形態では、ルーム音響に対処するように、識別されたソース信号をフィルタリングする。このことを行う1つの理由は、とりわけ、電子デバイスが位置している音響空間の音響効果が部分的に原因で、メディアデバイスによって生成されるサウンドが、識別されたソース信号とは異なることがあるからである。音響効果は、音響上の減衰およびエコーを含む。別の実施形態では、入力オーディオ信号と識別されたソース信号は、計算、通信、および音響の要因から結果として生じるさまざまな遅延に対処するように同期化される。図4および図5に関連して、オーディオキャンセラモジュール218をさらに詳細に説明する。
通信モジュール220は、メモリ212内に存在する。通信インターフェース208を制御して、データを送信または受信するようにプロセッサ204を構成する命令を、通信モジュール220は含んでいる。いくつかの実施形態において、以下でさらに詳細に説明するように、オーディオ処理デバイス202と、図1のネットワークイネーブルされているTV116のような別個のメディアデバイスとの間で、通信を開始することができる。
動作において、プロセッサ204は、メモリ212からの命令を実行して、マイクロフォン206によって取り込まれた入力オーディオ信号を受け取ることができる。入力オーディオ信号は、音声信号とオーディオノイズ信号とを含んでいるかもしれない。例えば、音声信号がユーザの音声を表す一方で、オーディオノイズ信号は近くのメディアデバイスによって生成されるサウンドを表すかもしれない。プロセッサ204は、オーディオ信号解析器モジュール216からの命令を実行して、オーディオノイズ信号のコンテンツを識別する。その後、プロセッサ204は、識別したコンテンツに関係付けられているコンテンツソースを発見するためにデータ記憶デバイス210をサーチするかもしれない。追加的または代替的に、プロセッサ204は、オーディオ信号解析器モジュールおよび/または通信モジュール212からの命令を実行して、通信インターフェース208を介して、ネットワークを通してデータベースをサーチするかもしれない。いったん、オーディオ処理デバイス202がコンテンツソースへのアクセスを有して、対応する識別されたソース信号を有すると、プロセッサ204は、オーディオキャンセラモジュール218からの命令を実行して、ノイズ信号のコピー(例えば、フィルタリングされた、またはフィルタリングされていない、識別されたソース信号)と入力オーディオ信号とを比較することによって、オーディオノイズ信号の少なくとも一部を抑制または減衰させる。
図3を参照すると、図2のオーディオ処理デバイス202によって実現されるオーディオ信号解析器300の特定の実例となる実施形態を、ブロックダイヤグラムが示している。プロセッサ204によって実行される、オーディオ信号解析器モジュール216の命令のようなコンピュータ実行可能命令により、オーディオ信号解析器300を実現することができる。入力オーディオ信号を受け取って、コンテンツ−識別情報を発生させるように構成されている識別子発生器302を、図3のオーディオ信号解析器300は備えている。コンテンツ−識別情報は、アーティスト名と、コンテンツタイトル(曲の名前、ムービー、オーディオブックなど)と、識別番号と、これらに類する識別子のしるしと、のうちの1つ以上を含むことができる。コンテンツ−識別情報を受け取って、識別されたソース信号を発生させるように構成されているソースマッチャー304も、オーディオ信号解析器300は有している。
図3の識別子発生器302は、特徴抽出器306と、コンテンツ識別器308と、コンテンツ−識別子データベース310とを有している。コンテンツを決定するための入力オーディオ信号の特徴情報を決定するようにプロセッサ204を構成する命令を含むモジュールによって、特徴抽出器306を実現することができる。例えば、動作において、特徴抽出器306は、入力オーディオ信号を解析して、入力オーディオ信号を識別または特徴付けできる音響パターンまたは音響フィンガープリントを決定することができる。1つの実施形態において、音響パターンまたは音響フィンガープリントは、スペクトル(例えば、時間−周波数)解析を実行することに基づいていることがある。メル周波数ケプストラム係数および/または知覚的線形予測(例えば、相対スペクトル変換−知覚的線形予測)に基づくオーディオ処理技術のような、特徴抽出のための他の適用可能な方法およびシステムを選択することができることが、正しく認識できるだろう。コンテンツ識別のための特徴抽出システムの1つの特定の非制限的な例は、例えば、ワンによる論文“インダストリアルストレングスオーディオサーチアルゴリズム”(音楽情報検索国際会議プロシーディングISMIR.2003年.vol.3)中で見つけることができる。例えば、ワンによって記述されているシステムは、バックグラウンドノイズに対するロバストネスを改善するために、スペクトル中の局所ピークパターンを利用している。
音響パターンまたは音響フィンガープリントを使用して、音響パターンまたは音響フィンガープリントのコンテンツ識別子を発見するためにコンテンツ−識別子データベース310をサーチするようにプロセッサ204を構成する命令を含むモジュールによって、コンテンツ識別器308を実現することができる。例えば、プロセッサ204は、音響パターンまたは音響フィンガープリントに対応する、すなわち、おおよそ一致する、コンテンツ−識別情報を発見するために、コンテンツ−識別子データベース310をサーチすることができる。識別子発生器302は、コンテンツ−識別情報をソースマッチャー304に提供する。
図3のソースマッチャー304は、ソースサーチャー312と、ソースデータベース314と、ソース送信機316とを備えている。コンテンツ−識別情報を使用して、コンテンツソースを発見するためにソースデータベース314をサーチするようにプロセッサ204を構成する命令を含むモジュールによって、ソースサーチャー312を実現することができる。例えば、プロセッサ204は、コンテンツ−識別情報に対応する、すなわち、おおよそ一致する、歌のMP3ファイルのようなコンテンツソースを発見するために、データ記憶デバイス210上に記憶されている(または、外部に記憶されていて、通信インターフェース208によりアクセスされる)ソースデータベース314をサーチすることができる。
ソース送信機316は、ソースサーチャー312によって識別されたコンテンツソースにアクセスすることができ、識別されたソース信号を発生させることができる。ソース信号は、パルスコード変調(PCM)オーディオサンプル、(圧縮またはコード化されたデータを含む)データパケット、または、これらに類するデータフォーマットとして送信することができる。したがって、ソース送信機316は、オーディオ処理デバイス202に送信されるコード化されたオーディオデータパケットを発生させるボコーダ(エンコーダ)318をオプション的に備えているかもしれない。言い換えると、ソース送信機316はサーバコンピューティングデバイスに位置することができ、データパス上または音声パス上で、(図1のモバイルフォン102のような)オーディオ処理デバイス202にソース信号を送ることができる。
オーディオ信号解析器300の機能の各々を、図2のオーディオ処理デバイス202によって実行できることが、正しく認識できるだろう。他の実施形態では、(コンテンツデータベース110、および、ネットワークに接続されている他のデバイスのような)1つ以上のサーバコンピューティングデバイスによって、1つ以上の機能が実行される。例えば、オーディオ処理デバイス202は、通信インターフェース208を使用して、ネットワークを通してサーバコンピュータと通信することができる。ストリーミングのような方法により、その全体を、または、ダウンロードのような方法により、データブロックで、ネットワークを通して、識別されたソース信号を提供してもよい。したがって、オーディオ処理デバイス202は、キャンセリングに対して必要とされる前に、識別されたソース信号の一部を受信することができる。したがって、コンテンツ−識別子データベース310およびソースデータベース314の各々を、オーディオ処理デバイス202のデータ記憶デバイス210またはメモリ212上に電子的に記憶することができる、あるいは、オーディオ処理デバイス202の外部に記憶させて、ネットワークを通してアクセスすることができる。
図4は、図2のオーディオ処理デバイス202によって実現されるオーディオキャンセラシステム400の、特定の実例となる実施形態のブロックダイヤグラムを示している。示しているように、オーディオキャンセラシステム400を使用して、複数のオーディオノイズソースを抑制することができる。例えば、オーディオキャンセラシステム400は、n個の(“信号同期器”とも呼ばれる)同期化ブロック402(1)〜402(n)と、n個の対応するオーディオキャンセラ404(1)〜405(n)とともに、オプションの、後処理406ブロックと、ボコーダ408ブロックと、音声認識410ブロックとを有している。プロセッサ204によって実行される、オーディオキャンセラモジュール218の命令のようなコンピュータ実行可能命令により、オーディオキャンセラシステム400を実現することができる。
動作において、n個の可能性あるオーディオノイズの各々を減衰するように、オーディオキャンセラシステム400は、入力オーディオ信号とn個の識別されたソース信号とを受け取る。例えば、図1を参照すると、ネットワークイネーブルされているTV116からのオーディオ120にオーディオノイズ1が対応でき、ラジオ118からのオーディオ122にオーディオノイズ2が対応できる。さらに、例えば、図3のオーディオ信号解析器300によって発生されるソース信号に、各識別されたソース信号が対応できる。オーディオノイズ1が最初に抑制され、結果として生じる処理された入力オーディオ信号がオーディオキャンセラ2に供給されて、オーディオノイズ2が抑制され、続いていくように、同期化ブロック402(1)〜402(n)とオーディオキャンセラブロック404(1)〜404(n)とのn個のペアが直列に構成されている。n個の並列のオーディオキャンセラ404(1)〜404(n)のような、他の適用可能なコンフィギュレーションを選択することもできることが、正しく認識されるだろう。
先述したように、図3において示したソース送信機のような、n個の別個のソース送信機によって、n個の識別されたソース信号を提供することができる。追加的または代替的に、オーディオノイズを生成させる別個のメディアデバイスによって、n個の識別されたソース信号を発生させることができる。n個の識別されたソース信号(とともに入力オーディオ信号)は各々、PCMオーディオサンプルまたはデータパケットとして提供することができる。例えば、1つの実施形態では、n個の識別されたソース信号はコード化された音声パケットとして送信され、オーディオキャンセラシステム400は、同期化ブロック402(1)〜402(n)に信号を提供する前に信号をデコードする、オプションの(示していない)ボコーダ/デコーダを備えている。
図4において示しているように、オーディオキャンセラ404(1)〜404(n)の各々はそれぞれ、同期化ブロック402(1)〜402(n)に関係付けられている。同期化ブロック402(1)〜402(n)の各々は、入力オーディオ信号(または、前のオーディオキャンセラの出力)と、対応する識別されたソース信号とを同期化することができる。処理、通信、および、これらに類する遅延のソース、が原因のタイミング差を、同期化ブロック402(1)〜402(n)は補償することができる。さらに、同期化ブロック402(1)〜402(n)を使用して、メディアデバイスによって再生されているソースの現在の時間的な位置の決定におけるまたは推定におけるエラーを補償することができる。同期化ブロック402(1)〜402(n)の各々はそれぞれ、同期化のための遅延を提供する、対応するデータバッファ416(1)〜416(n)を有することができる。いくつかの実施形態では、遅延を調整可能にすることができる。動作において、較正処理を実行することによって、調整可能な遅延を決定することができる。較正を行う、および遅延を調整するための処理の非限定的な例を、2012年8月9日に出願された米国仮特許出願番号61/681,474中で見つけることができる。
n個のオーディオキャンセラ404(1)〜404(n)の各々はそれぞれ、対応するソース信号をフィルタリングするように構成されている1つ以上の適応フィルタ412(1)〜412(n)を有することができる。フィルタリングを使用して、取り込まれたオーディオノイズとソース信号との間のバリエーションに対処することができる。すなわち、音響空間の変化(例えば、マイクロフォン206の位置とメディアデバイスの位置とにより変化することがあるエコーや、音響上の減衰)、スピーカー/マイクロフォンの変化、コンテンツソースにおけるバリエーション(例えば、異なる録音品質)、および、これらに類するもの、を含む多数の要因のために、マイクロフォン206によって取り込まれるオーディオノイズはソース信号から変化しているかもしれない。
これらのバリエーションを補償するために、適応フィルタ412(1)〜412(n)の各々は、1つ以上の調整可能なフィルタパラメータを有することができる。いくつかの実施形態では、入力オーディオ信号とソース信号とに基づいて、これらのバリエーションをモデリングするように、フィルタパラメータをオンラインで調整できる。例えば、入力オーディオ信号が、メディアデバイス1によって発生されるサウンドを大部分含んでいるときは、適応フィルタ412(1)の出力(“フィルタリングされたソース信号”)と入力オーディオ信号との間のエラーを使用して、信号間のエラーを低減させる方法で、フィルタパラメータを調整することができる。小さなエラーは、オーディオノイズ信号を変更する音響効果を、適応フィルタ412(1)がおおよそモデリングしていることを示すことができる一方で、大きなエラーは、音響効果を適応フィルタ412(1)がモデリングしていないことを示す。“適応則”または“更新ルール”のようなさまざまな方法を使用して、フィルタ係数を調節することができる。例は、調整可能なフィルタパラメータを調節して、フィルタリングされたソース信号と、入力オーディオ信号との間のエラーを低減させるための、瞬間的または総合的なコストを低減させることに基づくような、勾配法に基づく適応則を含む。他の例は、最小平均2乗法、リアプノフ/安定法、および推計法を含む。しかしながら、任意の適切な再帰的な、非再帰的な、またはバッチの適応則を使用して、調整可能なフィルタパラメータを調節できることが正しく認識できるだろう。
動作において、オーディオキャンセラ404(1)は、同期化された入力オーディオ信号のコピーと、識別されたソース信号1とを受け取る。先述したように、識別されたソース信号1は、オーディオノイズを発生させているスピーカーを駆動しているオーディオ信号に近似することができる。適応フィルタ412(1)は、音響空間の音響変化に対処するように、識別されたソース信号をフィルタリングすることができ、これにより、マイクロフォン206によって取り込まれるオーディオノイズ1に近似する、フィルタリングされたソース信号1を発生させることができる。オーディオキャンセラ404(1)は、同期化された入力オーディオ信号と、フィルタリングされたソース信号1とを比較して、オーディオノイズ1を減衰または抑制する。示しているように、オーディオキャンセラ404(1)は、フィルタリングされたソース信号を入力オーディオ信号から減算する。その後、抑制されたノイズ1を有するオーディオ信号が、第2の同期化ブロックに供給されて、オーディオノイズ2が抑制され、入力オーディオ信号からn個のオーディオノイズが抑制されるまで続く。
追加的に、各適応フィルタ412(1)〜412(n)はそれぞれ、ある状況下でそのフィルタパラメータの調節を停止またはイネーブルさせる、ダブルトーク検出器(“DTD”)414(1)〜414(n)をオプション的に有することができる。入力オーディオ信号(または、前のオーディオキャンセラの出力)が、対応するオーディオノイズに加えて(ユーザの音声、または、他のメディアノイズのような)他の近端信号を含んでいるときは、対応する適応フィルタ412(n)は適切な適応を行わないかもしれない。オーディオノイズ以外の付加的な近端信号が存在しているときに適応フィルタ412(n)が適応を行っているかもしれないので、適応則に関して、強く、相関されていないノイズとして、それらの付加的な近端信号が作用するかもしれない。したがって、付加的な近端信号の存在は、適応フィルタ412(n)を発散させるかもしれず、抑制されていないオーディオノイズを許容するかもしれない。したがって、DTD414(1)〜414(n)の各々を使用して、対応する適応フィルタ412(1)〜412(n)の入力を監視して、付加的な近端信号の検出に基づいて、適応を停止またはイネーブルさせてもよい。
DTD414(1)〜414(n)のこのような1つの方法は、適応フィルタ入力信号が付加的な近端信号をいつ含んでいるかを決定するために、ダブルトーク検出統計値を算出することを伴うかもしれない。1つの例示的なダブルトーク検出統計値は、対応する適応フィルタ入力信号に対するソース信号電力の比によって与えられる。他の適用可能なダブルトーク検出統計値を選択することもできる。さらに、ダブルトーク統計値は、時間ドメインまたは周波数ドメインで計算してもよい。
図4において示しているように、エコーキャンセラ404(n)によって提供される信号においてあるタイプの処理を実行する、オプションの非線形の後処理ブロック406をオプション的に備えることができる。例えば、非線形の後処理ブロック406は、エコーキャンセラ404(n)を出る信号から、残余ノイズ(例えば、オーディオノイズ信号の非線形成分)を除去するかもしれない。いくつかの実施形態では、入力オーディオ信号の非線形成分を推定し、その後、(例えば、スペクトル減算技術を使用することによって)入力オーディオ信号から推定を減算することによって、非線形ノイズ成分を除去することができる、または減衰させることができる。非線形の後処理ブロックは、DTD414(1)〜414(n)からのダブルトーク決定に基づいて動作するかもしれない。それゆえ、非線形の後プロセッサ204が信号を完全にクリップまたは除去する前に、ダブルトーク決定が、近端信号と残余オーディオノイズとの間を区分するのを助ける。
抑制されたノイズ1、・・・、nを有するオーディオ信号は、オーディオ信号を音声パケットにエンコードする、ボコーダ408に提供されるかもしれない。追加的または代替的に、抑制されたノイズを有するオーディオ信号は、さらなるオーディオ信号処理のために、音声認識ブロック410に提供されるかもしれない。
予期されるノイズ環境、計算機能力、リアルタイム制約、メモリ、性能、および/または、これらに類する考慮事項、のようなさまざまな考慮事項に基づいて、オーディオキャンセラ404(1)〜404(n)の数nを選択することができる。しかしながら、適用可能な他の要因を考慮することもできることが、正しく認識できるだろう。同様に、適用可能な任意の数の同期化ブロックをオーディオキャンセラシステムが備えることができることが、正しく認識できるだろう。いくつかの実施形態において、図5に関連して以下で説明するように、これらのコンポーネントの数を、識別されたノイズ成分の数に関して動的に変化させることができる。
図5は、図2のオーディオ処理デバイス202によって実現されるオーディオキャンセラシステム500の、特定の実例となる別の実施形態のブロックダイヤグラムを示している。図4および図5のシステム400、500に共通のエレメントは、共通の参照番号を共有しており、簡潔にするために、システム400、550の間の差異のみをここに記述している。
オーディオキャンセラシステム500は、n個の同期化ブロック402(1)〜402(n)と、n個のオーディオキャンセラブロック404(1)〜404(n)と、ソース識別子検出器502と、再構成可能キャンセライネーブラ504とを有している。ソース識別子検出器502は、n個の識別されたソース信号を受け取り、識別されたソース信号のパスのうちのどれがアクティブであるかを決定する。例えば、信号の存在、または、そのパス上での対応する信号のエネルギーのレベルに基づいて、ソース識別子検出器502はアクティブなソース信号パスを決定することができる。次に、再構成可能キャンセライネーブラ504は、アクティブな識別されたソース信号パスに対応する、オーディオキャンセラブロック404(1)〜404(n)をアクティブ化する。オーディオキャンセラブロック404(1)〜404(n)のうちの各アクティブオーディオキャンセラブロックは、図4に関連して上述したように動作することができる。オーディオキャンセラブロック404(1)〜404(n)のうちの各非アクティブオーディオキャンセラブロックは、例えば、パススルーフィルタとして構成することができる。
図6は、1つの実施形態にしたがった、オーディオノイズ抑制の方法600のフローダイヤグラムを示している。以下に続く方法の記載は、モバイルフォンやパーソナルオーディオプレイヤーのようなパーソナルオーディオ処理デバイス202におけるインプリメンテーションに焦点を合わせているが、他のデバイスを、方法またはその変形を実行するように構成してもよい。方法は、オーディオ処理デバイス202に関係付けられているコンピューティングデバイスの、RAM、ROM、ハードディスクドライブ、または、これらに類するもの、のような非一時的コンピュータ記憶装置に存在する、ソフトウェアモジュールとして、またはモジュールの集合として実現することができる。コンピューティングデバイスの1つ以上のプロセッサが、ソフトウェアモジュールを実行することができる。
ブロック602において、方法600は、入力オーディオ信号を受け取ることを含んでいる。例えば、オーディオ処理デバイス202は入力オーディオ信号を、オーディオ処理デバイス202のマイクロフォン206から、データ記憶デバイス210から、またはメモリ212デバイスから受け取るかもしれない、あるいは、通信インターフェース208において受信するかもしれない。
ブロック602において入力オーディオ信号を受け取った後、プロセス600はブロック604に進み、識別可能なコンテンツを有するノイズをオーディオ入力信号が含むか否かの決定が行われる。例えば、1つの実施形態において、オーディオ処理デバイス202は、オーディオ信号解析器モジュール216からの命令を実行して、オーディオノイズのコンテンツを識別するのに使用することができる、オーディオ入力信号の特徴情報を決定するかもしれない。コンテンツ識別器308によって特徴情報を使用して、コンテンツ識別情報を決定することができる。1つの実施形態において、オーディオ処理デバイス202は、さらなる処理のために、ネットワークを通してサーバに特徴情報を送り、その後、ネットワークを通してコンテンツ−識別情報を受信することができる。別の実施形態では、コンテンツ識別器308ブロックおよびソースサーチャー312ブロックの機能のうちの1つ以上をオーディオ処理デバイス202において実行して、コンテンツ−識別情報を決定することができる。ブロック604の動作を実現するための方法の1つの実施形態は、図7Aに関連して以下で記述する。
別の実施形態では、オーディオ信号解析器モジュール216からの実行命令によって、別個のメディアデバイスと通信して、オーディオ入力信号が識別可能なコンテンツを有するか否かを決定するブロック604の動作が実行される。例えば、オーディオ処理デバイス202は、メディアデバイスがオーディオメディアを再生しているか否かに関する別個のメディアデバイスからの情報を要求することができ、メディアデバイスがオーディオメディアを再生している場合は、コンテンツ−識別情報を要求することができる。応答として、オーディオ処理デバイス202は、コンテンツ−識別情報を受信するかもしれない。
いったん、識別可能なコンテンツを有するバックグラウンドノイズをオーディオ入力信号が含むことが決定されると、方法600は、識別可能なコンテンツのコンテンツソースにアクセスして、ソース信号を取得するブロック606に進む。例えば、1つの実施形態において、オーディオ処理デバイス202は、通信インターフェース208を介して、あるいは、メモリ212またはデータ記憶デバイス210を介して、コンテンツソースまたはコンテンツソース信号にアクセスするかもしれない。例えば、ブロック604において取得したコンテンツ−識別情報を使用して、コンテンツソースを位置特定して、コンテンツソースにアクセスすることができる。コンテンツソースを使用して、ソース信号を発生させることができる。ブロック606の動作を実現するための方法の1つの実施形態は、図7Bに関連して以下で記述する。
ソース信号の少なくとも一部が入手可能となった後、方法600はブロック608に進み、ソース信号と入力オーディオ信号とを比較することに基づいて、ノイズを減衰させる。例えば、1つの実施形態において、オーディオ処理デバイス202は、メモリ212中のオーディオキャンセラモジュール218の命令を実行して、図4または図5において示したオーディオキャンセラシステムにしたがって、オーディオノイズを減衰させる。
ここで図7Aに移ると、1つの実施形態にしたがった、識別可能なコンテンツを有するノイズをオーディオ入力信号が含むか否かを決定するブロック604において行うステップの例の、実例となるフローダイヤグラムが示されている。ブロック702において、方法604は、入力オーディオ信号の特徴情報を決定する。例えば、1つの実施形態において、オーディオ処理デバイス202は、メモリ212中のオーディオ信号解析器モジュール216の命令を実行して、図3において示した特徴抽出器306にしたがって特徴を抽出する。いったん、十分な特徴情報が決定されると、その後、プロセス604は、コンテンツソースを識別するために特徴情報を提供するブロック704に進む。例えば、1つの実施形態において、オーディオ処理デバイス202は、メモリ212中のオーディオ信号解析器モジュール216の命令を実行して、通信インターフェース208に、サーバデバイスによる処理のために、ネットワークを通してサーバデバイスに対して特徴情報を送信させる。
特徴情報を提供した後、方法604は、コンテンツ−識別情報を取得するブロック706に進む。例えば、オーディオ処理デバイス202は、ブロック704を実行することで特徴情報を受信したサーバデバイスから、コンテンツ−識別情報を受信することができる。代替的または追加的に、いくつかの実施形態では、オーディオ処理デバイス202は、サーバデバイスと通信する代わりに、処理デバイス202において、必要なステップを実行することによってコンテンツ−識別情報を発生させる。例えば、オーディオ処理デバイス202のプロセッサ204は、メモリ212中のオーディオ信号解析器モジュール216の命令を実行して、図3のオーディオ信号解析器300を実現することができる。
図7Bは、1つの実施形態にしたがった、コンテンツソースにアクセスしてソース信号を取得するための例示的な方法606の、実例となるフローダイヤグラムである。ブロック708において、方法606は、受信したコンテンツ−識別情報に関係付けられているコンテンツソースをサーチすることを含んでいる。例えば、1つの実施形態において、オーディオ処理デバイス202は、メモリ212中のオーディオ信号解析器モジュール216の命令を実行して、データ記憶デバイス210中に記憶されているメディアライブラリをサーチする。サーチの後、方法606は、サーチ結果に基づいて、ソース信号を発生させる、または受信するブロック710に進む。例えば、コンテンツソースがオーディオ処理デバイス202においてローカルに発見された場合は、プロセッサ204は命令を実行して、コンテンツソースからソース信号を発生させる。コンテンツソースがデバイスにおいてローカルに発見されない場合は、1つの実施形態において、オーディオ処理デバイス202は、メモリ212中のオーディオ信号解析器モジュール216の命令を実行して、ネットワーク108を通して、識別されたソース信号を要求して、コンテンツデータベース110から識別されたソース信号を受信する。
ここで図8に移ると、実施形態にしたがった、オーディオノイズを減衰させるブロック608において行うステップの例の、実例となるフローダイヤグラムが示されている。ブロック810において、2つの信号の間の時間遅延を補償するように、入力オーディオ信号とソース信号とを同期化させる。動作において、異なる信号パスおよび計算パスをとることから結果として生じるさまざまな遅延を含む、さまざまな理由のために、信号が同期から外れることがある。信号を同期化させるために、各信号のタイミングを制御するように、可変長の(環状バッファのような)データバッファ中に各信号を記憶させることができる。例えば、図4を参照すると、入力オーディオ信号と識別されたソース信号は、第1の同期化ブロック402(1)において受け取られる。同期化ブロック402(1)は、バッファブロック416(1)中に記憶される対応する環状バッファデータ構造中に信号を記憶させることができる。環状バッファの長さは、信号を同期化させるための、所望の遅延の関数とすることができる。いくつかの実施形態では、例えば、較正モードの間に、所望の遅延を算出または推定する。n個のオーディオキャンセラ404(1)〜404(n)によって入力オーディオ信号が処理されるにしたがって、n個のオーディオキャンセラ404(1)〜404(n)の各々において、オーディオ信号に追加の遅延が生じることがある。例えば、n個の適応フィルタ412(1)〜412(n)によるフィルタリングが遅延をもたらすことがある。さらに、n個の識別されたソース信号は、例えば、識別されたソース信号が識別されて最終的に受信されるのに要した時間が原因の、さまざまな遅延を経験することがある。したがって、n個の同期化ブロック402(1)〜402(n)を使用して、それらのさまざまな遅延を補償し、オーディオ−キャンセリング処理の間、オーディオ信号と識別されたソース信号とが同期化されているように維持することができる。
オーディオ入力信号と識別されたソース信号とを同期化させた後、方法608は、識別されたソース信号をフィルタリングして、音響変化、スピーカーおよびマイクロフォンの変化、ならびに、これらに類するもののような、オーディオノイズに影響を与えている音響効果に対処するブロック820に続く。マイクロフォン206によって取り込まれるオーディオノイズを、識別されたソース信号が正確には表していないかもしれないので、フィルタリングが行われる。識別されたソース信号がオーディオノイズから相当変化している場合は、オーディオ抑制は効果的でないかもしれない。ノイズ抑制を改善するため、オーディオノイズに忠実に一致するように、または、オーディオノイズを再現するように、識別されたソース信号を成形するために、このような要因の効果をオンラインで推定することができる。例えば、ここで図4を参照すると、同期化されたオーディオ入力信号と同期化された識別されたソース信号1は、オーディオノイズキャンセラ404(1)に、および、適応フィルタ412(1)にパスされる。その後、適応フィルタ412(1)は、オーディオノイズをおおよそ再現する参照信号を生成させるように、識別されたソース信号1をフィルタリングまたは形成することができる。フィルタが、識別されたソース信号をどのように形成するかについて影響を与える、1つ以上のフィルタパラメータ(例えば、無限インパルス応答フィルタの有限インパルス応答の1つ以上のフィルタ係数)を、適応フィルタ412(1)は有することができる。いくつかの実施形態は、広い範囲の音響効果に対処する調整可能なパラメータを含んでいる。
識別されたソース信号を同期化させてフィルタリングした後、方法608は、同期化されたオーディオ入力とフィルタリングされたソース信号とを比較することによって、処理されたオーディオ信号を発生させるブロック830に進むことができる。1つの実施形態において、フィルタリングされたソース信号が、同期化されたオーディオ入力信号から減算される。図示すると、図4は、適応フィルタ412(1)の出力がオーディオ入力信号から減算されて、抑制されたノイズ1を有するオーディオ信号が発生されることを示している。1つの実施形態において、通信または音声認識のアプリケーションに対して、抑制されたノイズ1を有するオーディオ信号を処理することができる。別の実施形態では、さらなるノイズ抑制のために、抑制されたノイズ1を有するオーディオ信号を処理することができる。例えば、図4は、抑制されたノイズ1を有する処理されたオーディオ信号を、同期化ブロック402(2)〜402(n)およびオーディオキャンセラ404(2)〜404(n)に提供して、識別されたソース信号2〜nにより、付加的なノイズ2〜nを抑制できることを示している。
オプション的に、方法608は、ブロック820を実行した後に、適応フィルタ412(1)の調整可能なフィルタパラメータを調節して、広い範囲の音響効果に関してノイズ抑制を改善するブロック840に進むことができる。1つの実施形態では、調整可能なフィルタパラメータの調節は、適応則または更新則によって管理される。例えば、図4を参照すると、適応フィルタ414(1)は、同期化されたオーディオ入力信号と識別されたソース信号との両方を受け取る。適応フィルタ414(1)は、フィルタリングされたソース信号を発生させることができる。オーディオ入力信号とフィルタリングされたソース信号とを比較することによって、“エラー信号”または“リプレッサー信号”を発生させることができる。適応フィルタがオーディオノイズをどれだけ忠実に再現しているかを、エラー信号が示すことができる。例えば、オーディオ入力が実質的にオーディオノイズから構成されている場合、同期化されたオーディオ入力信号とフィルタリングされたソース信号との間の差異は、フィルタリングされた識別されたソース信号と、オーディオノイズとの間の不一致の量を示す。すなわち、小さなエラーは、適応フィルタが、ルーム中の実際の音響変化を忠実にモデリングしていることを示す。エラー信号を低減させる方法で、適応フィルタ412(1)の調整可能なフィルタパラメータを調節するために、(例えば、勾配または再帰的最小平均2乗法、または、これらに類する方法、に基づいて)適応則を選ぶことができる。
しかしながら、オーディオ入力信号が、識別されたソース信号1に対応するオーディオノイズから実質的に構成されていないときは、適応フィルタ414(1)は、その調整可能なパラメータを適切には調節しないかもしれない。例えば、ユーザの音声コマンド、または、第2のソースからのオーディオノイズを、オーディオ信号が含むことがある。このシチュエーションでは、例えば、オーディオノイズ1に関するルーム音響に、適応フィルタがどれだけ忠実に一致しているかの意義のある表示を、エラー信号は提供しないかもしれない。したがって、図4に関連して先述したように、DTDブロックがこのような条件を検出するときには、DTD414(1)ブロックは適応フィルタの調節をオフにしてもよい。
先述したように、同期化およびフィルタリングのステップは、n個のオーディオノイズをキャンセルするためのn個の識別されたソース信号を使用して実行することができる。特に、図4を参照すると、オーディオノイズはシーケンシャルにキャンセルされる。しかしながら、いくつかの実施形態では、ノイズをパラレルにキャンセルすることもできる。
図9は、実施形態にしたがった、オーディオノイズ抑制の特定の実例となる方法900のフローダイヤグラムである。ブロック902において、方法900は、入力オーディオ信号を受け取ることを含んでいる。ブロック902は、図6に関連して記述したように実行することができる。オーディオ入力信号の少なくとも一部を受け取った後に、方法900は、別個のメディアデバイスによって発生されたノイズに関連する情報を受信するブロック904に進む。例えば、図2に関連して説明したように、オーディオ処理デバイス202は、オーディオ信号解析器モジュール216および通信モジュール220からの命令を実行することによって、別個のメディアデバイスと通信することができる。別個のメディアデバイスは、メディアコンテンツを有するノイズを別個のメディアデバイスが発生させているか否かの表示を、オーディオ処理デバイス202に提供するかもしれない。追加的または代替的に、別個のメディアデバイスはコンテンツ−識別情報を通信することができる。オーディオ処理デバイス202は、コンテンツ−識別情報を使用して、コンテンツソースをサーチするかもしれない。コンテンツ−識別情報の例には、TVのチャンネル、ラジオの周波数、および、これらに類するメディアブロードキャスト選択情報が含まれる。1つの実施形態において、別個のメディアデバイスは、ソース信号をオーディオ処理デバイス202に送るかもしれない。
オーディオ処理デバイス202がノイズに関連する情報を受信した後に、方法900は、別個のメディアデバイスによって発生されたノイズに関連する受信した情報に基づいて、ソース信号を受信するブロック906に進む。例えば、オーディオ処理デバイスが別個のメディアデバイスから、メディアデバイスがノイズを発生させていることの表示を受信する場合、または、オーディオ処理デバイス202がコンテンツ−識別情報を受信する場合、上述した図6、図7A、および図7Bの方法604および606を実行することによって、オーディオ処理デバイス202はソース信号を受信することができる。いくつかの実施形態では、オーディオ処理デバイス202は、別個のメディアデバイスからソース信号を受信する。例えば、別個のメディアデバイスは、別個のメディアデバイスが再生させているメディアのコピーを送信することができる。
ソース信号を受信した後、方法900は、ソース信号と入力オーディオ信号とを比較することに基づいて、ノイズを減衰させるブロック908に進むことができる。例えば、上述した図6および図8の方法608を実行することによって、オーディオ処理デバイス202は、オーディオノイズを減衰させる。
本技術は、多数の他の汎用または特別な目的の、コンピューティングシステムの環境またはコンフィギュレーションにより、動作可能である。発明での使用に適しているであろう、よく知られたコンピューティングシステム、環境、および/またはコンフィギュレーションの例は、パーソナルコンピュータ、サーバコンピュータ、ハンドヘルドデバイスまたはラップトップデバイス、マルチプロセッサシステム、プロセッサベースのシステム、プログラム可能なコンシューマエレクトロニクス、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、上記のシステムまたはデバイスのいずれをも含む分散コンピューティング環境、ならびに、これらに類するものを含むが、これらに限定されない。
ここで使用されるように、命令は、システムで情報を処理するための、コンピュータで実現するステップを指す。命令はソフトウェア、ファームウェア、または、ハードウェアにおいて実現され、システムのコンポーネントにより行われるプログラムされたステップの任意のタイプを含むことができる。
プロセッサは、AMD(登録商標)アスロン(登録商標)IIまたはフェノム(登録商標)IIプロセッサ、インテル(登録商標)i3(登録商標)/i5(登録商標)/i7(登録商標)プロセッサ、インテルジーオン(登録商標)プロセッサ、あるいは、ARM(登録商標)プロセッサの任意のインプリメンテーションのような、任意の従来の汎用シングルまたはマルチチッププロセッサであってもよい。加えて、プロセッサは、OMAPプロセッサ、スナップドラゴン(登録商標)のようなクァルコム(登録商標)プロセッサ、あるいは、デジタル信号プロセッサまたはグラフィックプロセッサを含む、任意の従来の特別目的プロセッサであってもよい。プロセッサは、典型的に、従来のアドレス線、従来のデータ線、および1つ以上の従来の制御線を有する。
システムは、詳しく議論したように、さまざまなモジュールを備えている。当業者により認識できるように、モジュールのそれぞれが、さまざまなサブルーチン、手順、定義付け命令文、および、マクロを備えている。モジュールのそれぞれは、典型的に、単一の実行可能なプログラムに、別々にコンパイルされ、リンクされる。したがって、好ましいシステムの機能性を説明するために、モジュールのそれぞれの説明が便宜上、使用されている。これにより、モジュールのそれぞれにより経験されるプロセスは、他のモジュールのうちの1つに任意に再分配され、単一のモジュールに共に結合され、または、例えば共有可能な動的リンクライブラリで利用可能になってもよい。
システムは、C#、C、C++、ベーシック、パスカル、または、ジャバ(登録商標)のような、任意の従来のプログラミング言語で書かれてもよく、従来のオペレーティングシステムのもとで実行されてもよい。C#、C、C++、ベーシック、パスカル、ジャバ、および、フォートランは、実行可能なコードを生成させるために、多くの汎用コンパイラーが使用できる業界標準プログラミング言語である。システムは、パール、パイソン、または、ルビーのような翻訳言語も使用して、書かれてもよい。
ここで開示した実施形態に関連して説明した、さまざまな例示的な論理ブロック、モジュール、回路、および、アルゴリズムステップは、電子ハードウェア、コンピュータソフトウェア、または、双方を組み合わせたものとして実現してもよいことを、当業者はさらに認識するだろう。ハードウェアおよびソフトウェアのこの互換性を明確に図示するために、さまざまな例示的なコンポーネント、ブロック、モジュール、回路、および、ステップを、一般的に、これらの機能性に関して上記で説明している。このような機能性が、ハードウェアまたはソフトウェアとして実現されるか否かは、全体的なシステムに課せられている、特定のアプリケーションおよび設計制約に依存する。熟練者は、各特定のアプリケーションに対してさまざまな方法で、説明した機能性を実現するかもしれないが、このようなインプリメンテーションの決定は、本開示の範囲から逸脱が生じるとして解釈すべきでない。
ここで開示した実施形態に関連して説明したさまざまな例示的な、論理ブロック、モジュール、および、回路は、汎用プロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)または他のプログラマブル論理デバイス、ディスクリートゲートまたはトランジスタロジック、ディスクリートハードウェアコンポーネント、あるいは、ここに説明した機能を実行するように設計されたこれらの任意の組み合わせで、実現または実行してもよい。汎用プロセッサはマイクロプロセッサであってもよいが、代替実施形態では、プロセッサは、任意の従来のプロセッサ、制御装置、マイクロ制御装置、または、状態機械であってもよい。プロセッサはまた、例えば、DSPとマイクロプロセッサとの組み合わせ、複数のマイクロプロセッサ、DSPコアに関連する1つ以上のマイクロプロセッサ、または、他の何らかのこのようなコンフィギュレーションである、コンピューティングデバイスの組み合わせとして実現してもよい。
1つ以上の例示的な実施形態において、説明した機能および方法は、ハードウェア、プロセッサ上で実行される、ソフトウェア、または、ファームウェア、あるいは、これらの任意の組み合わせで実現してもよい。ソフトウェアで実現する場合、機能は、1つ以上の命令またはコードとしてコンピュータ読取可能媒体上に記憶されてもよく、または、1つ以上の命令またはコードとしてコンピュータ読取可能媒体上で送信されてもよい。コンピュータ読取可能媒体は、1つの場所から別の場所へのコンピュータプログラムの転送を促進する任意の媒体を含む、コンピュータ記憶媒体および通信媒体の両方を含む。記憶媒体は、コンピュータによってアクセスできる任意の利用可能な媒体であってもよい。限定ではなく例として、このようなコンピュータ読取可能媒体は、RAM、ROM、EEPROM(登録商標)、CD−ROMまたは他の光ディスク記憶装置、磁気ディスク記憶装置または他の磁気記憶デバイス、あるいは、コンピュータによってアクセスできる命令またはデータ構造の形態で所望のプログラムコードを運ぶまたは記憶するために使用できる他の何らかの媒体を含むことができる。また、任意の接続は、コンピュータ読取可能媒体と適切に呼ばれる。例えば、ソフトウェアが、ウェブサイトから、サーバから、あるいは、同軸ケーブル、光ファイバケーブル、撚り対、デジタル加入者線(DSL)、または、赤外線や、無線や、マイクロ波のようなワイヤレス技術を使用している他の遠隔ソースから送信された場合、同軸ケーブル、光ファイバケーブル、撚り対、DSL、あるいは、赤外線や、無線や、マイクロ波のようなワイヤレス技術は、媒体の定義に含まれる。ここで使用するような、ディスク(disk)およびディスク(disc)は、コンパクトディスク(CD)、レーザーディスク(登録商標)、光ディスク、デジタル汎用ディスク(DVD)、フロッピー(登録商標)ディスク、およびブルーレイディスクを含み、ここでディスク(disk)は通常、磁気的にデータを再生し、ディスク(disc)は、レーザーを用いて光学的にデータを再生する。上記の組み合わせもまた、コンピュータ読取可能媒体の範囲内に含まれるべきである。
上述の説明は、ここで開示したシステム、デバイス、および、方法のある実施形態を詳述している。しかしながら、どれほど詳細に上記をテキストに表したとしても、システム、デバイス、および、方法は、多くの方法で実施できると認識すべきである。上記でも述べたように、本発明のある特徴または態様を説明するとき、その専門用語が関係付けられている技術の特徴または態様の何らかの特定の特性を含むことに限定されるように、専門用語がここで再定義されることを、特定の専門用語の使用が意味しているとみなすべきではないことに着目すべきである。
さまざまな修正および変更が、説明した技術の範囲から逸脱することなくなされてもよいことが、当業者によって認識されるだろう。このような修正および変更は、実施形態の範囲内に入ることが意図されている。1つの実施形態中に含まれる部分は、他の実施形態と交換可能であり、描かれた実施形態からの1つ以上の部分は、他の描かれた実施形態との任意の組み合わせに含めることができると当業者によって認識されるだろう。例えば、ここで説明した、および/または、図中で描いた、さまざまなコンポーネントのうちのいずれかは、組み合わせてもよく、交換可能であってもよく、または、他の実施形態から除外してもよい。
ここでの任意の複数形および/または単数形の用語の実質的な使用に関して、当業者であれば、文脈および/または用途に適切なように、複数形から単数形へ、および/または、単数形から複数形へ変えることができる。さまざまな単数形/複数形の置き換えを、明瞭さのために、ここで明示的に述べる。
一般的に、ここで使用する用語は、「オープン」な用語(例えば、用語「含んでいる」は、「含んでいるが、これに限定されない」と解釈すべきであり、用語「有している」は、「少なくとも有している」と解釈すべきであり、用語「含む」は、「含むがこれに限定されない」と解釈すべきである等)として一般的に意図されていると当業者によって理解されるだろう。導入された請求項の記述の特定の数が意図されている場合、このような意図は請求項中に明示的に記載され、このような記述がない場合、このような意図は存在しないと当業者によってさらに理解されるだろう。例えば、理解を支援するために、以下に添付した特許請求の範囲は、請求項の記述を導入するために、導入フレーズ「少なくとも1つ」および「1つ以上」の使用を含んでいてもよい。しかしながら、このようなフレーズの使用は、同じ請求項が導入フレーズ「1つ以上」または「少なくとも1つ」および「a」または「an」のような不定冠詞を含むときでさえ、不定冠詞「a」または「an」による請求項の導入の記載は、このような導入された請求項の記述を含む任意の特定の請求項を、このような記述のみを含む実施形態に限定すると意味するように解釈すべきではなく(例えば、「a」および/または「an」は、典型的には、「少なくとも1つ」または「1つ以上」を意味するように解釈すべきである)、請求項の記述を導入するために使用される定冠詞の使用に対しても、同じことが当てはまる。加えて、導入された請求項の記述の特定の数が明示的に記載されている場合でさえ、このような記述は、少なくとも記載された数を意味する(例えば、他の修飾語なしの、「2つの記述」のそれだけの記述は、典型的に、少なくとも2つの記述または2つ以上の記述を意味する)ように典型的に解釈すべきであると当業者であれば認識するだろう。さらに、「A、BおよびC等のうちの少なくとも1つ」に類似する伝統的表現法が使用される事例において、一般的に、このような構成は、当業者が伝統的表現法(例えば、「A、BおよびCのうちの少なくとも1つを有するシステム」は、Aだけ、Bだけ、Cだけ、AおよびBともに、AおよびCともに、BおよびCともに、ならびに/あるいは、A、BおよびCともに等を含むがこれらに限定されない)を理解する意味で意図されている。「A、BまたはC等のうちの少なくとも1つ」に類似する伝統的表現法が使用される事例において、一般的に、このような構成は、当業者が伝統的表現法(例えば、「A、BまたはCのうちの少なくとも1つを有するシステム」は、Aだけ、Bだけ、Cだけ、AおよびBともに、AおよびCともに、BおよびCともに、ならびに/あるいは、A、BおよびCともに等を含むがこれらに限定されない)を理解する意味で意図されている。2つ以上の代替用語を提示する、実質的に離接的な任意の単語および/またはフレーズは、説明、特許請求の範囲、または図面中であろうとなかろうと、用語のうちの1つ、用語のうちのいずれか、または、両方の用語を含む可能性を企図していると理解すべきであると、当業者によってさらに理解されるだろう。例えば、フレーズ「AまたはB」は、「A」または「B」あるいは「AおよびB」の可能性を含んでいると理解されるだろう。
さまざまな態様および実施形態をここで開示したが、他の態様および実施形態も当業者にとって明らかだろう。ここで開示したさまざまな態様および実施形態は、実例目的であり、限定することを意図してはいない。
さまざまな態様および実施形態をここで開示したが、他の態様および実施形態も当業者にとって明らかだろう。ここで開示したさまざまな態様および実施形態は、実例目的であり、限定することを意図してはいない。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[1]オーディオノイズを減衰させるデバイスにおいて、
前記デバイスは、
入力オーディオ信号を受け取るように構成されているマイクロフォンと、
識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定するように構成され、識別可能なコンテンツを有するノイズ信号が存在する場合に、コンテンツソースにアクセスして、前記ノイズ信号のコピーを取得するオーディオ信号解析器と、
前記ノイズ信号のコピーと前記入力オーディオ信号とを比較することに基づいて、減衰されたノイズ信号を有する処理されたオーディオ信号を発生させるように構成されているオーディオキャンセラとを具備するデバイス。
[2]前記オーディオ信号解析器は、別個のメディアデバイスによって発生されたノイズ信号に対して識別可能なコンテンツを有するノイズ信号を、前記入力オーディオ信号が含むか否かの決定を実行するように構成されている[1]記載のデバイス。
[3]通信インターフェースをさらに具備し、
前記オーディオ信号解析器は、
前記入力オーディオ信号の特徴情報を決定するようにと、
前記通信インターフェースを使用して、前記特徴情報を送信するようにと、
前記通信インターフェースを使用して、前記特徴情報を送信することに少なくとも基づいて、前記ノイズ信号のコピーを受信するようにさらに構成されている[1]記載のデバイス。
[4]前記オーディオ信号解析器は、
前記通信インターフェースを使用して、前記特徴情報を提供することに応答したコンテンツ−識別情報を受信するようにと、
前記受信したコンテンツ−識別情報と前記コンテンツソースとの一致に基づいて、前記コンテンツソースを発見するために前記デバイスをサーチするようにと、
前記サーチが結果として前記コンテンツソースに一致する場合に、前記ノイズ信号のコピーを前記コンテンツソースから発生させるようにさらに構成されている[3]記載のデバイス。
[5]前記オーディオ信号解析器は、
前記入力オーディオ信号の特徴情報を決定するように構成されている特徴抽出器と、
前記特徴情報に関係付けられているコンテンツ−識別情報を決定するように構成されているコンテンツ識別器と、
前記コンテンツ−識別情報と前記コンテンツソースとの一致に基づいて、前記コンテンツソースを発見するためにデータベースをサーチするように構成されているソースサーチャーと、
前記サーチが前記コンテンツソースを位置特定する場合に、前記ノイズ信号のコピーを前記コンテンツソースから発生させるように構成されているソース送信機とを備える[1]記載のデバイス。
[6]前記入力オーディオ信号と前記ノイズ信号のコピーとのうちの少なくとも1つを遅延させるように構成されている信号同期器をさらに具備し、
前記オーディオキャンセラは、
調整可能なフィルタパラメータを有し、同期化されたノイズ信号のコピーと前記調整可能なフィルタパラメータとに基づいて、フィルタリングされたノイズ信号を発生させるように構成され、同期化された入力オーディオ信号と前記同期化されたノイズ信号のコピーとを比較することに基づいて、前記調整可能なフィルタパラメータを調節するように構成されている適応フィルタと、
前記ノイズ信号のコピーに加えて別の信号を前記入力オーディオ信号が有することをダブルトーク検出器が検出するときに、前記適応フィルタの前記調整可能なフィルタパラメータの調節をディセーブルするように構成されている、前記適応フィルタのダブルトーク検出器とを備え、
前記オーディオキャンセラは、前記フィルタリングされたノイズ信号と前記同期化された入力オーディオ信号とを比較することによって、前記ノイズ信号のコピーと前記入力オーディオ信号とを比較する[1]記載のデバイス。
[7]前記デバイスと別個のメディアデバイスとの間の通信チャネル上でデータを通信するように構成されている通信モジュールをさらに具備し、
前記通信モジュールは、前記ノイズ信号のコピーの少なくとも一部を、前記別個のメディアデバイスから受信する[1]記載のデバイス。
[8]前記デバイスと別個のメディアデバイスとの間の通信チャネル上でデータを通信するように構成されている通信モジュールをさらに具備し、
前記ソース通信モジュールは、前記コンテンツソースに対応するコンテンツ−識別データを受信する[1]記載のデバイス。
[9]オーディオノイズを減衰させる方法において、
前記方法は、
入力オーディオ信号を受け取ることと、
識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定することと、
識別可能なコンテンツを有するノイズ信号が存在する場合に、コンテンツソースにアクセスして、前記ノイズ信号のコピーを取得することと、
前記ノイズ信号のコピーと前記入力オーディオ信号とを比較することに基づいて、減衰されたノイズ信号を有する処理されたオーディオ信号を発生させることとを含む方法。
[10]前記識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定するステップは、別個のメディアデバイスによって発生されて、識別可能なコンテンツを有するノイズ信号を、前記入力オーディオ信号が含むか否かを決定することを含む[9]記載の方法。
[11]前記識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定するステップは、
前記入力オーディオ信号の特徴情報を決定することと、
前記特徴情報を送信することとを含み、
前記ノイズ信号のコピーにアクセスするステップは、前記特徴情報を送信することに少なくとも基づいて、前記ノイズ信号のコピーを受信することを含む[9]記載の方法。
[12]前記識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定するステップは、
前記特徴情報を提供することに応答したコンテンツ−識別情報を受信することと、
前記受信したコンテンツ−識別情報と前記コンテンツソースとの一致に基づいて、前記コンテンツソースを発見するためにデバイスをサーチすることと、
前記サーチが結果として前記コンテンツソースに一致する場合に、前記ノイズ信号のコピーを前記コンテンツソースから発生させることとを含む[11]記載の方法。
[13]前記識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定するステップは、
前記入力オーディオ信号の特徴情報を決定することと、
前記特徴情報に関係付けられているコンテンツ−識別情報を決定することと、
前記コンテンツ−識別情報と前記コンテンツソースとの一致に基づいて、前記コンテンツソースを発見するためにデータベースをサーチすることと、
前記サーチが前記コンテンツソースを位置特定する場合に、前記ノイズ信号のコピーを前記コンテンツソースから発生させることとを含む[9]記載の方法。
[14]前記入力オーディオ信号と前記ノイズ信号のコピーとのうちの少なくとも1つを遅延させて、前記入力オーディオ信号と前記ノイズ信号のコピーとを同期化させることをさらに含み、
前記処理されたオーディオ信号を発生させるステップは、
調整可能なフィルタパラメータを有する適応フィルタを使用して、同期化されたノイズ信号のコピーと前記調整可能なフィルタパラメータとに基づいて、フィルタリングされたノイズ信号を発生させることと、
同期化された入力オーディオ信号と前記同期化されたノイズ信号のコピーとを比較することに基づいて、前記調整可能なフィルタパラメータを選択的に調節することと、
前記ノイズ信号に加えて別の信号を前記入力オーディオ信号が有するか否かを決定することと、
前記ノイズ信号に加えて別の信号を前記入力オーディオ信号が有することが決定されたときに、前記適応フィルタの前記調整可能なフィルタパラメータの調節をディセーブルすることとを含み、
前記ノイズ信号と前記入力オーディオ信号とを比較することによって、前記ノイズ信号のコピーと前記入力オーディオ信号とを比較することは、前記フィルタリングされたノイズ信号と前記同期化された入力オーディオ信号とを比較することを含む[9]記載の方法。
[15]別個のメディアデバイスとの通信チャネル上でデータを通信して、前記ノイズ信号のコピーの少なくとも一部を、前記別個のメディアデバイスから受信することをさらに含む[9]記載の方法。
[16]別個のメディアデバイスへの通信チャネル上でデータを通信して、前記コンテンツソースに対応するコンテンツ−識別データを受信することをさらに含む[9]記載の方法。
[17]命令を記憶する非一時的コンピュータ読み取り可能媒体において、
前記命令は、実行されるときに、
入力オーディオ信号を受け取ることと、
識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定することと、
識別可能なコンテンツを有するノイズ信号が存在する場合に、コンテンツソースにアクセスして、前記ノイズ信号のコピーを取得することと、
前記ノイズ信号のコピーと前記入力オーディオ信号とを比較することに基づいて、減衰されたノイズ信号を有する処理されたオーディオ信号を発生させることとを含む方法を、プロセッサに実行させる非一時的コンピュータ読み取り可能媒体。
[18]前記命令は、実行されるときに、
前記入力オーディオ信号の特徴情報を決定することと、
通信インターフェースを使用することによって、前記特徴情報を送信することと、
前記通信インターフェースを使用することによって、前記特徴情報を送信することに少なくとも基づいて、前記ノイズ信号のコピーを受信することとをさらに含む方法を実行する[17]記載の非一時的コンピュータ読み取り可能媒体。
[19]オーディオノイズを減衰させる装置において、
前記装置は、
入力オーディオ信号を受け取る手段と、
識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定して、識別可能なコンテンツを有するノイズ信号が存在する場合に、コンテンツソースに選択的にアクセスして、前記ノイズ信号のコピーを取得する手段と、
前記ノイズ信号のコピーと前記入力オーディオ信号とを比較することに基づいて、減衰されたノイズ信号を有する処理されたオーディオ信号を発生させる手段とを具備する装置。
[20]前記決定する手段は、
特徴情報に関係付けられているコンテンツ−識別情報を決定する手段と、
前記コンテンツ−識別情報と前記コンテンツソースとの一致に基づいて、前記コンテンツソースを発見するためにデータベースをサーチする手段と、
前記サーチが前記コンテンツソースを位置特定する場合に、前記ノイズ信号のコピーを前記コンテンツソースから発生させる手段とを備える[19]記載の装置。
Claims (20)
- オーディオノイズを減衰させるデバイスにおいて、
前記デバイスは、
入力オーディオ信号を受け取るように構成されているマイクロフォンと、
識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定するように構成され、識別可能なコンテンツを有するノイズ信号が存在する場合に、コンテンツソースにアクセスして、前記ノイズ信号のコピーを取得するオーディオ信号解析器と、
前記ノイズ信号のコピーと前記入力オーディオ信号とを比較することに基づいて、減衰されたノイズ信号を有する処理されたオーディオ信号を発生させるように構成されているオーディオキャンセラとを具備するデバイス。 - 前記オーディオ信号解析器は、別個のメディアデバイスによって発生されたノイズ信号に対して識別可能なコンテンツを有するノイズ信号を、前記入力オーディオ信号が含むか否かの決定を実行するように構成されている請求項1記載のデバイス。
- 通信インターフェースをさらに具備し、
前記オーディオ信号解析器は、
前記入力オーディオ信号の特徴情報を決定するようにと、
前記通信インターフェースを使用して、前記特徴情報を送信するようにと、
前記通信インターフェースを使用して、前記特徴情報を送信することに少なくとも基づいて、前記ノイズ信号のコピーを受信するようにさらに構成されている請求項1記載のデバイス。 - 前記オーディオ信号解析器は、
前記通信インターフェースを使用して、前記特徴情報を提供することに応答したコンテンツ−識別情報を受信するようにと、
前記受信したコンテンツ−識別情報と前記コンテンツソースとの一致に基づいて、前記コンテンツソースを発見するために前記デバイスをサーチするようにと、
前記サーチが結果として前記コンテンツソースに一致する場合に、前記ノイズ信号のコピーを前記コンテンツソースから発生させるようにさらに構成されている請求項3記載のデバイス。 - 前記オーディオ信号解析器は、
前記入力オーディオ信号の特徴情報を決定するように構成されている特徴抽出器と、
前記特徴情報に関係付けられているコンテンツ−識別情報を決定するように構成されているコンテンツ識別器と、
前記コンテンツ−識別情報と前記コンテンツソースとの一致に基づいて、前記コンテンツソースを発見するためにデータベースをサーチするように構成されているソースサーチャーと、
前記サーチが前記コンテンツソースを位置特定する場合に、前記ノイズ信号のコピーを前記コンテンツソースから発生させるように構成されているソース送信機とを備える請求項1記載のデバイス。 - 前記入力オーディオ信号と前記ノイズ信号のコピーとのうちの少なくとも1つを遅延させるように構成されている信号同期器をさらに具備し、
前記オーディオキャンセラは、
調整可能なフィルタパラメータを有し、同期化されたノイズ信号のコピーと前記調整可能なフィルタパラメータとに基づいて、フィルタリングされたノイズ信号を発生させるように構成され、同期化された入力オーディオ信号と前記同期化されたノイズ信号のコピーとを比較することに基づいて、前記調整可能なフィルタパラメータを調節するように構成されている適応フィルタと、
前記ノイズ信号のコピーに加えて別の信号を前記入力オーディオ信号が有することをダブルトーク検出器が検出するときに、前記適応フィルタの前記調整可能なフィルタパラメータの調節をディセーブルするように構成されている、前記適応フィルタのダブルトーク検出器とを備え、
前記オーディオキャンセラは、前記フィルタリングされたノイズ信号と前記同期化された入力オーディオ信号とを比較することによって、前記ノイズ信号のコピーと前記入力オーディオ信号とを比較する請求項1記載のデバイス。 - 前記デバイスと別個のメディアデバイスとの間の通信チャネル上でデータを通信するように構成されている通信モジュールをさらに具備し、
前記通信モジュールは、前記ノイズ信号のコピーの少なくとも一部を、前記別個のメディアデバイスから受信する請求項1記載のデバイス。 - 前記デバイスと別個のメディアデバイスとの間の通信チャネル上でデータを通信するように構成されている通信モジュールをさらに具備し、
前記ソース通信モジュールは、前記コンテンツソースに対応するコンテンツ−識別データを受信する請求項1記載のデバイス。 - オーディオノイズを減衰させる方法において、
前記方法は、
入力オーディオ信号を受け取ることと、
識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定することと、
識別可能なコンテンツを有するノイズ信号が存在する場合に、コンテンツソースにアクセスして、前記ノイズ信号のコピーを取得することと、
前記ノイズ信号のコピーと前記入力オーディオ信号とを比較することに基づいて、減衰されたノイズ信号を有する処理されたオーディオ信号を発生させることとを含む方法。 - 前記識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定するステップは、別個のメディアデバイスによって発生されて、識別可能なコンテンツを有するノイズ信号を、前記入力オーディオ信号が含むか否かを決定することを含む請求項9記載の方法。
- 前記識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定するステップは、
前記入力オーディオ信号の特徴情報を決定することと、
前記特徴情報を送信することとを含み、
前記ノイズ信号のコピーにアクセスするステップは、前記特徴情報を送信することに少なくとも基づいて、前記ノイズ信号のコピーを受信することを含む請求項9記載の方法。 - 前記識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定するステップは、
前記特徴情報を提供することに応答したコンテンツ−識別情報を受信することと、
前記受信したコンテンツ−識別情報と前記コンテンツソースとの一致に基づいて、前記コンテンツソースを発見するためにデバイスをサーチすることと、
前記サーチが結果として前記コンテンツソースに一致する場合に、前記ノイズ信号のコピーを前記コンテンツソースから発生させることとを含む請求項11記載の方法。 - 前記識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定するステップは、
前記入力オーディオ信号の特徴情報を決定することと、
前記特徴情報に関係付けられているコンテンツ−識別情報を決定することと、
前記コンテンツ−識別情報と前記コンテンツソースとの一致に基づいて、前記コンテンツソースを発見するためにデータベースをサーチすることと、
前記サーチが前記コンテンツソースを位置特定する場合に、前記ノイズ信号のコピーを前記コンテンツソースから発生させることとを含む請求項9記載の方法。 - 前記入力オーディオ信号と前記ノイズ信号のコピーとのうちの少なくとも1つを遅延させて、前記入力オーディオ信号と前記ノイズ信号のコピーとを同期化させることをさらに含み、
前記処理されたオーディオ信号を発生させるステップは、
調整可能なフィルタパラメータを有する適応フィルタを使用して、同期化されたノイズ信号のコピーと前記調整可能なフィルタパラメータとに基づいて、フィルタリングされたノイズ信号を発生させることと、
同期化された入力オーディオ信号と前記同期化されたノイズ信号のコピーとを比較することに基づいて、前記調整可能なフィルタパラメータを選択的に調節することと、
前記ノイズ信号に加えて別の信号を前記入力オーディオ信号が有するか否かを決定することと、
前記ノイズ信号に加えて別の信号を前記入力オーディオ信号が有することが決定されたときに、前記適応フィルタの前記調整可能なフィルタパラメータの調節をディセーブルすることとを含み、
前記ノイズ信号と前記入力オーディオ信号とを比較することによって、前記ノイズ信号のコピーと前記入力オーディオ信号とを比較することは、前記フィルタリングされたノイズ信号と前記同期化された入力オーディオ信号とを比較することを含む請求項9記載の方法。 - 別個のメディアデバイスとの通信チャネル上でデータを通信して、前記ノイズ信号のコピーの少なくとも一部を、前記別個のメディアデバイスから受信することをさらに含む請求項9記載の方法。
- 別個のメディアデバイスへの通信チャネル上でデータを通信して、前記コンテンツソースに対応するコンテンツ−識別データを受信することをさらに含む請求項9記載の方法。
- 命令を記憶する非一時的コンピュータ読み取り可能媒体において、
前記命令は、実行されるときに、
入力オーディオ信号を受け取ることと、
識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定することと、
識別可能なコンテンツを有するノイズ信号が存在する場合に、コンテンツソースにアクセスして、前記ノイズ信号のコピーを取得することと、
前記ノイズ信号のコピーと前記入力オーディオ信号とを比較することに基づいて、減衰されたノイズ信号を有する処理されたオーディオ信号を発生させることとを含む方法を、プロセッサに実行させる非一時的コンピュータ読み取り可能媒体。 - 前記命令は、実行されるときに、
前記入力オーディオ信号の特徴情報を決定することと、
通信インターフェースを使用することによって、前記特徴情報を送信することと、
前記通信インターフェースを使用することによって、前記特徴情報を送信することに少なくとも基づいて、前記ノイズ信号のコピーを受信することとをさらに含む方法を実行する請求項17記載の非一時的コンピュータ読み取り可能媒体。 - オーディオノイズを減衰させる装置において、
前記装置は、
入力オーディオ信号を受け取る手段と、
識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定して、識別可能なコンテンツを有するノイズ信号が存在する場合に、コンテンツソースに選択的にアクセスして、前記ノイズ信号のコピーを取得する手段と、
前記ノイズ信号のコピーと前記入力オーディオ信号とを比較することに基づいて、減衰されたノイズ信号を有する処理されたオーディオ信号を発生させる手段とを具備する装置。 - 前記決定する手段は、
特徴情報に関係付けられているコンテンツ−識別情報を決定する手段と、
前記コンテンツ−識別情報と前記コンテンツソースとの一致に基づいて、前記コンテンツソースを発見するためにデータベースをサーチする手段と、
前記サーチが前記コンテンツソースを位置特定する場合に、前記ノイズ信号のコピーを前記コンテンツソースから発生させる手段とを備える請求項19記載の装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/787,605 US9275625B2 (en) | 2013-03-06 | 2013-03-06 | Content based noise suppression |
US13/787,605 | 2013-03-06 | ||
PCT/US2014/017381 WO2014137612A1 (en) | 2013-03-06 | 2014-02-20 | Content based noise suppression |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016513816A true JP2016513816A (ja) | 2016-05-16 |
JP2016513816A5 JP2016513816A5 (ja) | 2018-03-22 |
Family
ID=50236325
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015561382A Pending JP2016513816A (ja) | 2013-03-06 | 2014-02-20 | コンテンツベースのノイズ抑制 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9275625B2 (ja) |
EP (1) | EP2965496B1 (ja) |
JP (1) | JP2016513816A (ja) |
KR (1) | KR20150123902A (ja) |
CN (1) | CN105027541B (ja) |
WO (1) | WO2014137612A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018195934A (ja) * | 2017-05-16 | 2018-12-06 | ソニー株式会社 | 情報処理装置、及び情報処理方法 |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9947333B1 (en) * | 2012-02-10 | 2018-04-17 | Amazon Technologies, Inc. | Voice interaction architecture with intelligent background noise cancellation |
US9570087B2 (en) * | 2013-03-15 | 2017-02-14 | Broadcom Corporation | Single channel suppression of interfering sources |
US9832299B2 (en) * | 2013-07-17 | 2017-11-28 | Empire Technology Development Llc | Background noise reduction in voice communication |
US10149047B2 (en) * | 2014-06-18 | 2018-12-04 | Cirrus Logic Inc. | Multi-aural MMSE analysis techniques for clarifying audio signals |
US10325591B1 (en) * | 2014-09-05 | 2019-06-18 | Amazon Technologies, Inc. | Identifying and suppressing interfering audio content |
US9952095B1 (en) | 2014-09-29 | 2018-04-24 | Apple Inc. | Methods and systems for modulation and demodulation of optical signals |
US9979955B1 (en) * | 2014-09-30 | 2018-05-22 | Apple Inc. | Calibration methods for near-field acoustic imaging systems |
US9747488B2 (en) | 2014-09-30 | 2017-08-29 | Apple Inc. | Active sensing element for acoustic imaging systems |
JP6322125B2 (ja) * | 2014-11-28 | 2018-05-09 | 日本電信電話株式会社 | 音声認識装置、音声認識方法および音声認識プログラム |
CN105988049B (zh) * | 2015-02-28 | 2019-02-19 | 惠州市德赛西威汽车电子股份有限公司 | 一种噪声抑制的调试方法 |
US9672821B2 (en) * | 2015-06-05 | 2017-06-06 | Apple Inc. | Robust speech recognition in the presence of echo and noise using multiple signals for discrimination |
EP3317878B1 (de) * | 2015-06-30 | 2020-03-25 | Fraunhofer Gesellschaft zur Förderung der Angewand | Verfahren und vorrichtung zum erzeugen einer datenbank |
US11048902B2 (en) | 2015-08-20 | 2021-06-29 | Appple Inc. | Acoustic imaging system architecture |
CN105489215B (zh) * | 2015-11-18 | 2019-03-12 | 珠海格力电器股份有限公司 | 一种噪声源识别方法及系统 |
US11277210B2 (en) * | 2015-11-19 | 2022-03-15 | The Hong Kong University Of Science And Technology | Method, system and storage medium for signal separation |
DE112017001830B4 (de) * | 2016-05-06 | 2024-02-22 | Robert Bosch Gmbh | Sprachverbesserung und audioereignisdetektion für eine umgebung mit nichtstationären geräuschen |
US9838815B1 (en) * | 2016-06-01 | 2017-12-05 | Qualcomm Incorporated | Suppressing or reducing effects of wind turbulence |
KR102515996B1 (ko) * | 2016-08-26 | 2023-03-31 | 삼성전자주식회사 | 음성 인식을 위한 전자 장치 및 그 제어 방법 |
US10554822B1 (en) * | 2017-02-28 | 2020-02-04 | SoliCall Ltd. | Noise removal in call centers |
JP6545419B2 (ja) * | 2017-03-08 | 2019-07-17 | 三菱電機株式会社 | 音響信号処理装置、音響信号処理方法、及びハンズフリー通話装置 |
US10475449B2 (en) * | 2017-08-07 | 2019-11-12 | Sonos, Inc. | Wake-word detection suppression |
US10313218B2 (en) * | 2017-08-11 | 2019-06-04 | 2236008 Ontario Inc. | Measuring and compensating for jitter on systems running latency-sensitive audio signal processing |
EP3692530B1 (en) | 2017-10-02 | 2021-09-08 | Dolby Laboratories Licensing Corporation | Audio de-esser independent of absolute signal level |
US10847178B2 (en) * | 2018-05-18 | 2020-11-24 | Sonos, Inc. | Linear filtering for noise-suppressed speech detection |
US10297266B1 (en) | 2018-06-15 | 2019-05-21 | Cisco Technology, Inc. | Adaptive noise cancellation for multiple audio endpoints in a shared space |
US10867615B2 (en) * | 2019-01-25 | 2020-12-15 | Comcast Cable Communications, Llc | Voice recognition with timing information for noise cancellation |
EP3709194A1 (en) | 2019-03-15 | 2020-09-16 | Spotify AB | Ensemble-based data comparison |
CN110047497B (zh) * | 2019-05-14 | 2021-06-11 | 腾讯科技(深圳)有限公司 | 背景音频信号滤除方法、装置及存储介质 |
US11017792B2 (en) * | 2019-06-17 | 2021-05-25 | Bose Corporation | Modular echo cancellation unit |
US11094319B2 (en) * | 2019-08-30 | 2021-08-17 | Spotify Ab | Systems and methods for generating a cleaned version of ambient sound |
US11328722B2 (en) | 2020-02-11 | 2022-05-10 | Spotify Ab | Systems and methods for generating a singular voice audio stream |
US11308959B2 (en) | 2020-02-11 | 2022-04-19 | Spotify Ab | Dynamic adjustment of wake word acceptance tolerance thresholds in voice-controlled devices |
US11950512B2 (en) | 2020-03-23 | 2024-04-02 | Apple Inc. | Thin-film acoustic imaging system for imaging through an exterior surface of an electronic device housing |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005077865A (ja) * | 2003-09-02 | 2005-03-24 | Sony Corp | 音楽検索システムおよび方法、情報処理装置および方法、プログラム、並びに記録媒体 |
JP2006527425A (ja) * | 2003-03-13 | 2006-11-30 | グレイスノート インコーポレイテッド | 改良されたデータ検索方法およびシステム |
US20090030654A1 (en) * | 2007-07-26 | 2009-01-29 | Casio Hitachi Mobile Communications Co., Ltd. | Noise Suppression System, Sound Acquisition Apparatus, Sound Output Apparatus, and Computer-Readable Medium |
US20100266118A1 (en) * | 2000-03-15 | 2010-10-21 | Broadcom Corporation | Method and System for Stereo Echo Cancellation for VOIP Communication Systems |
JP2012163788A (ja) * | 2011-02-07 | 2012-08-30 | Jvc Kenwood Corp | ノイズ除去装置およびノイズ除去方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100538701C (zh) * | 2000-07-31 | 2009-09-09 | 兰德马克数字服务公司 | 用于从媒体样本辨认媒体实体的方法 |
US6990453B2 (en) * | 2000-07-31 | 2006-01-24 | Landmark Digital Services Llc | System and methods for recognizing sound and music signals in high noise and distortion |
CN1897054A (zh) | 2005-07-14 | 2007-01-17 | 松下电器产业株式会社 | 可根据声音种类发出警报的传输装置及方法 |
US20090012786A1 (en) | 2007-07-06 | 2009-01-08 | Texas Instruments Incorporated | Adaptive Noise Cancellation |
US20090034750A1 (en) | 2007-07-31 | 2009-02-05 | Motorola, Inc. | System and method to evaluate an audio configuration |
US9112989B2 (en) | 2010-04-08 | 2015-08-18 | Qualcomm Incorporated | System and method of smart audio logging for mobile devices |
US9280598B2 (en) | 2010-05-04 | 2016-03-08 | Soundhound, Inc. | Systems and methods for sound recognition |
US8812014B2 (en) | 2010-08-30 | 2014-08-19 | Qualcomm Incorporated | Audio-based environment awareness |
US9384726B2 (en) | 2012-01-06 | 2016-07-05 | Texas Instruments Incorporated | Feedback microphones encoder modulators, signal generators, mixers, amplifiers, summing nodes |
-
2013
- 2013-03-06 US US13/787,605 patent/US9275625B2/en active Active
-
2014
- 2014-02-20 CN CN201480010777.4A patent/CN105027541B/zh active Active
- 2014-02-20 EP EP14708428.9A patent/EP2965496B1/en not_active Not-in-force
- 2014-02-20 JP JP2015561382A patent/JP2016513816A/ja active Pending
- 2014-02-20 WO PCT/US2014/017381 patent/WO2014137612A1/en active Application Filing
- 2014-02-20 KR KR1020157026895A patent/KR20150123902A/ko active IP Right Grant
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100266118A1 (en) * | 2000-03-15 | 2010-10-21 | Broadcom Corporation | Method and System for Stereo Echo Cancellation for VOIP Communication Systems |
JP2006527425A (ja) * | 2003-03-13 | 2006-11-30 | グレイスノート インコーポレイテッド | 改良されたデータ検索方法およびシステム |
JP2005077865A (ja) * | 2003-09-02 | 2005-03-24 | Sony Corp | 音楽検索システムおよび方法、情報処理装置および方法、プログラム、並びに記録媒体 |
US20090030654A1 (en) * | 2007-07-26 | 2009-01-29 | Casio Hitachi Mobile Communications Co., Ltd. | Noise Suppression System, Sound Acquisition Apparatus, Sound Output Apparatus, and Computer-Readable Medium |
JP2009033470A (ja) * | 2007-07-26 | 2009-02-12 | Casio Hitachi Mobile Communications Co Ltd | 音声取得装置、音声出力装置、雑音除去システム、及び、プログラム |
JP2012163788A (ja) * | 2011-02-07 | 2012-08-30 | Jvc Kenwood Corp | ノイズ除去装置およびノイズ除去方法 |
Non-Patent Citations (1)
Title |
---|
ALEXANDER, ANIL, ET AL.: "Music and Noise Fingerprinting and Reference Cancellation Applied to Forensic Audio Enhancement", PROC. AES 46TH INTERNATIONAL CONFERENCE, JPN6018006799, 14 June 2012 (2012-06-14), US, pages 1 - 7 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018195934A (ja) * | 2017-05-16 | 2018-12-06 | ソニー株式会社 | 情報処理装置、及び情報処理方法 |
JP7020799B2 (ja) | 2017-05-16 | 2022-02-16 | ソニーグループ株式会社 | 情報処理装置、及び情報処理方法 |
Also Published As
Publication number | Publication date |
---|---|
KR20150123902A (ko) | 2015-11-04 |
EP2965496B1 (en) | 2018-01-03 |
WO2014137612A1 (en) | 2014-09-12 |
CN105027541B (zh) | 2018-01-16 |
CN105027541A (zh) | 2015-11-04 |
US20140254816A1 (en) | 2014-09-11 |
US9275625B2 (en) | 2016-03-01 |
EP2965496A1 (en) | 2016-01-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2965496B1 (en) | Content based noise suppression | |
US11688419B2 (en) | Linear filtering for noise-suppressed speech detection via multiple network microphone devices | |
US9913056B2 (en) | System and method to enhance speakers connected to devices with microphones | |
RU2467406C2 (ru) | Способ и устройство для поддержки воспринимаемости речи в многоканальном звуковом сопровождении с минимальным влиянием на систему объемного звучания | |
US9704478B1 (en) | Audio output masking for improved automatic speech recognition | |
US20230395088A1 (en) | Robust Short-Time Fourier Transform Acoustic Echo Cancellation During Audio Playback | |
JP5085556B2 (ja) | エコー除去の構成 | |
CN112424864A (zh) | 用于噪声抑制话音检测的线性滤波 | |
KR20180056752A (ko) | 초광대역 음악을 위한 적응적 잡음 억제 | |
US9286883B1 (en) | Acoustic echo cancellation and automatic speech recognition with random noise | |
US10325591B1 (en) | Identifying and suppressing interfering audio content | |
US11024331B2 (en) | Voice detection optimization using sound metadata | |
US9076452B2 (en) | Apparatus and method for generating audio signal having sound enhancement effect | |
Park et al. | Acoustic interference cancellation for a voice-driven interface in smart TVs | |
US20240080609A1 (en) | Systems, apparatus, and methods for acoustic transparency | |
JP7436564B2 (ja) | ヘッドホン、及びヘッドホン状態の検出方法 | |
US8582754B2 (en) | Method and system for echo cancellation in presence of streamed audio | |
GB2575873A (en) | Processing audio signals | |
JP2023062699A (ja) | アクティブノイズリダクションフィルタの生成方法、記憶媒体およびヘッドホン |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170127 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170127 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180209 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20180209 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20180216 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180221 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180306 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180419 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180717 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20190312 |