JP2016513816A

JP2016513816A - コンテンツベースのノイズ抑制

Info

Publication number: JP2016513816A
Application number: JP2015561382A
Authority: JP
Inventors: キム、レ−ホン; モハンマド、アシフ・イクバル; ビッサー、エリック; シン、ジョンウォン
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2013-03-06
Filing date: 2014-02-20
Publication date: 2016-05-16
Also published as: KR20150123902A; EP2965496B1; WO2014137612A1; CN105027541B; CN105027541A; US20140254816A1; US9275625B2; EP2965496A1

Abstract

オーディオノイズ減衰のための装置および方法を開示している。オーディオ信号解析器は、識別可能なコンテンツを有するノイズ信号を、マイクロフォンデバイスから受け取る入力オーディオ信号が含むか否かを決定することができる。識別可能なコンテンツを有するノイズ信号が存在する場合に、コンテンツソースにアクセスして、ノイズ信号のコピーを取得する。オーディオキャンセラは、ノイズ信号のコピーと入力オーディオ信号とを比較することに基づいて、減衰されたノイズ信号を有する処理されたオーディオ信号を発生させることができる。追加的または代替的に、別個のメディアデバイスへの通信チャネル上でデータを通信して、ノイズ信号のコピーの少なくとも一部を別個のメディアデバイスから受信しても、または、コンテンツソースに対応するコンテンツ−識別データを受信してもよい。【選択図】図４

Description

分野

［０００１］
以下の記述はオーディオ信号処理を対象にしている。より詳細には、記述はオーディオノイズ抑制を対象にしている。

背景

［０００２］
部分的には、バッテリー技術、処理技術、および通信技術における進歩のために、パーソナルデバイスはいっそう移動性が増し、高性能になり、および接続性が向上している。これらの技術が進歩するにつれて、デバイスを使用する方法や、デバイスと対話する方法において、ユーザはより柔軟性を有する。特に、ユーザが音声コマンドにより移動体デバイスを制御するのを可能にする音声認識を、移動体デバイスは使用するかもしれない。さらに、音声認識とともに音声テレメトリに対して、ユーザは、音響的に耳障りな環境を含むさまざまな環境中で移動体デバイスが正常に動作することを望む。

［０００３］
ユーザが移動体デバイスと対話しているとき、さまざまなノイズ抑制スキームが使用されて、バックグラウンドノイズの有害な影響が低減または緩和されている。例えば、周波数選択フィルタリングを使用して、ある周波数帯域に関係付けられているノイズを抑制することができる。他のノイズ抑制スキームは、統計モデルを使用して、ノイズに統計的に関連する、または意図したオーディオ信号に統計的に関連しない、取り込まれたオーディオ信号のある態様を抑制する。さらに、他のノイズ抑制スキームは、内部信号を使用して、移動体デバイスによって生成され後に感知されるサウンドから結果的に生じるノイズ（例えば、エコーノイズ）をキャンセルする。

概要

［０００４］
発明のシステム、方法、およびデバイスは各々いくつかの態様を有しており、これらのうちの単一のもののみが、その望ましい属性に関与しているわけではない。後続する特許請求の範囲によって表された本発明の範囲を限定することなく、いくつかの特徴をここで簡単に説明する。この説明を考慮した後に、特に“詳細な説明”と題するセクションを読んだ後に、バックグラウンドノイズを低減させてオーディオ処理を改善することを含む利点を、本発明の特徴がどのように提供するかを理解するだろう。

［０００５］
１つの実施形態は、オーディオノイズを減衰させるデバイスである。デバイスは、入力オーディオ信号を受け取るように構成されているマイクロフォンを備えることができる。デバイスは、識別可能なコンテンツを有するノイズ信号を入力オーディオ信号が含むか否かを決定するように構成されているオーディオ信号解析器も備えることができる。識別可能なコンテンツを有するノイズ信号が存在する場合に、オーディオ信号解析器は、コンテンツソースにアクセスして、ノイズ信号のコピーを取得することができる。デバイスは、ノイズ信号のコピーと入力オーディオ信号とを比較することに基づいて、減衰されたノイズ信号を有する処理されたオーディオ信号を発生させるように構成されているオーディオキャンセラも備えることができる。

［０００６］
別の実施形態は、オーディオノイズを減衰させる方法である。方法は、入力オーディオ信号を受け取ることを含むことができる。方法は、識別可能なコンテンツを有するノイズ信号を入力オーディオ信号が含むか否かを決定することも含むことができる。識別可能なコンテンツを有するノイズ信号が存在する場合に、方法は、コンテンツソースにアクセスして、ノイズ信号のコピーを取得することを含むことができる。方法は、ノイズ信号のコピーと入力オーディオ信号とを比較することに基づいて、減衰されたノイズ信号を有する処理されたオーディオ信号を発生させることをさらに含むことができる。

［０００７］
さらに別の実施形態は、実行されるときにプロセッサに方法を実行させる命令を記憶する、非一時的コンピュータ読み取り可能媒体である。方法は、入力オーディオ信号を受け取ることと、識別可能なコンテンツを有するノイズ信号を入力オーディオ信号が含むか否かを決定することとを含む。識別可能なコンテンツを有するノイズ信号が存在する場合に、方法は、コンテンツソースにアクセスして、ノイズ信号のコピーを取得することを含む。方法は、ノイズ信号のコピーと入力オーディオ信号とを比較することに基づいて、減衰されたノイズ信号を有する処理されたオーディオ信号を発生させることをさらに含む。

［０００８］図１は、１つの実施形態にしたがった、１つ以上のメディアデバイスからのノイズを抑制するモバイルフォンを含むオーディオシステムの、ブロック概略ダイヤグラムである。［０００９］図２は、オーディオノイズを抑制するオーディオ処理デバイスの、実例となる実施形態のブロックダイヤグラムである。［００１０］図３は、図２のオーディオ処理デバイスによって実現されるオーディオ信号解析器の、特定の実例となる実施形態のブロックダイヤグラムである。［００１１］図４は、図２のオーディオ処理デバイスによって実現されるオーディオキャンセラシステムの、特定の実例となる実施形態のブロックダイヤグラムである。［００１２］図５は、図２のオーディオ処理デバイスによって実現されるオーディオキャンセラシステムの、特定の実例となる別の実施形態のブロックダイヤグラムである。［００１３］図６は、さまざまな実施形態にしたがった、オーディオノイズ抑制の方法のフローダイヤグラムである。［００１４］図７Ａは、１つの実施形態にしたがった、識別可能なコンテンツを有するノイズをオーディオ入力信号が含むか否かを決定するための例示的な方法の、実例となるフローダイヤグラムである。［００１５］図７Ｂは、１つの実施形態にしたがった、コンテンツソースにアクセスしてソース信号を取得するための例示的な方法の、実例となるフローダイヤグラムである。［００１６］図８は、実施形態にしたがった、オーディオノイズを減衰させるための例示的な方法の、実例となるフローダイヤグラムである。［００１７］図９は、実施形態にしたがった、オーディオノイズ抑制の特定の実例となる方法のフローダイヤグラムである。

詳細な説明

［００１８］
実施形態は、電子デバイスによって受け取られるオーディオ信号中の、望ましくないオーディオノイズを抑制するための、システムおよび方法に関連している。１つの実施形態において、システムは、バックグラウンドで再生されているポピュラーな歌のような、識別可能なメディアコンテンツを表すオーディオノイズを抑制する。システムは、メディアコンテンツのコピーを取得し、メディアコンテンツのコピーから望ましくないオーディオノイズのコピーを発生させ、望ましくないオーディオノイズをオーディオ信号から除去する。例えば、動作において、システムは、望ましくないオーディオノイズの音響パターンまたは音響フィンガープリントを決定し、音響パターンを使用して、オーディオノイズによって表されるメディアコンテンツ（例えば、特定の歌）を識別する。識別子を使用して、識別された歌のデジタルレコーディングのようなメディアコンテンツソースをサーチすることができる。いったん歌が識別されると、歌のコピーを電子デバイスにダウンロードして、その後、歌のコピーを使用して、オーディオ信号からその歌を減算することができる。１つの実施形態では、セルラフォンのようなポータブルコンピューティングデバイスによってシステムを実現することができる。例えば、電話機での会話の間にバックグラウンドで再生されている歌または他のメディアコンテンツを、セルラフォンは抑制することができる。

［００１９］
１つの特有の例では、マイクロフォンと、その電話機のメモリ中に記憶されているデジタル音楽ライブラリとを有するセルラフォンによって、システムを実現することができる。特定の歌を再生しているラジオの近くで人が電話機でトークするとき、システムは、マイクロフォンのオーディオ信号からオーディオ特徴を抽出して、その歌の音響パターンまたは音響フィンガープリントを作り出すことができる。その後、作り出されたパターンを使用して、そのような音響パターンによってインデックス付けされた歌識別子を含んでいるデータベースをサーチして、ラジオによって再生されている歌を発見することができる。歌識別子がパターンに一致する場合、電話機は、識別された歌のコピーを発見するために自身の音楽ライブラリをサーチすることができる。代替的に、電話機は、識別された歌のコピーを、ネットワーク接続を通してサーバから要求することができる。いったんアクセスされると、ラジオの再生にしたがって、歌のコピーを歌の時間的なポジションに同期化させて、受け取ったオーディオ信号から歌を抑制することができる。このシステムを有する電話機によって、アウトドア音楽現場またはコンサートホールのような、電話による会話に対して、そうでなければあまりにも音響的に耳障りであっただろうエリアにおいて、ユーザは電話機を動作させることができるだろう。

［００２０］
別の特有の例では、ワイヤレス通信能力を有するテレビ（ＴＶ）のような別個のメディアデバイスを制御する、音声制御される遠隔制御装置によって、ノイズ抑制システムを実現することができる。制御装置は、コンテンツ情報をＴＶから直接受信するかもしれない。例えば、ＴＶは、再生しているアクティブなチャンネルを遠隔装置に通信することができ、遠隔装置は、その情報を使用して、インターネット接続を通してチャンネルのオーディオにアクセスすることができる。代替的に、ＴＶは、ブロードキャストのコピーを遠隔装置に送ることができる。次に、遠隔装置は、ブロードキャストのコピーを使用して、ＴＶによって生成されるオーディオをキャンセルすることができる。このことによって、音声制御電子デバイスは、オーディオを発生させているメディアデバイスと一緒に動作することができるだろう。

［００２１］
開示する方法、装置、およびシステムは、既存のノイズ抑制技術を改良するように機能する。特に、いくつかのシチュエーションにおいて、オーディオノイズのコンテンツを推定および／または識別した後に、オーディオノイズが実質的に決定論的であると発見することがある。実例として、そのような１つのシチュエーションは、予め記録された歌がノイズソースである場合である。このケースでは、例えば、歌が再生されていることと、何の特定の歌かと、歌の特有のタイミングとが知られている場合に、歌は実質的に決定論的であることがある。上記のコンテンツ関連情報が既知である、または識別可能である場合に、歌またはオーディオ信号のコピーを使用して、歌に対応するオーディオ信号の成分を減衰すなわちキャンセルすることができる。この方法における歌の抑制は、移動体デバイスを通した音声認識または音声通信の品質を改善する。

［００２２］
メディアデバイスの例には、オーディオメディアコンテンツを含むメディアコンテンツを再生するように構成されている、テレビ、ラジオ、ラップトップ／ネットワークブックコンピュータ、タブレットコンピュータ、デスクトップコンピュータ、および、これらに類する電子デバイスが含まれる。オーディオメディアコンテンツの例には、音楽、ビデオ、および、これらに類するオーディオを有する他のメディア、を表すデータまたは信号が含まれる。

［００２３］
さらに図示すると、図１は、１つ以上のメディアデバイスからのノイズを抑制するように構成されているモバイルフォン１０２を含む、特有のオーディオコンフィギュレーション１００のブロックダイヤグラムを示している。特に、モバイルフォン１０２はマイクロフォン１０４とアンテナ１０６とを有している。モバイルフォン１０２は、ネットワーク１０８または他の電子デバイスに、音声およびデータの信号を通信することができる。ネットワーク１０８は、ワイヤードネットワークまたはワイヤレスネットワークであり、音楽およびオーディオビデオのデータファイルのようなさまざまなコンテンツソースを記憶する１つ以上のコンテンツデータベース１１０へのアクセスを提供することができる。１つの実施形態では、ネットワークはインターネットである。

［００２４］
動作において、例えば、モバイルフォン１０２を制御する、または、モバイルフォン１０２に通信可能に結合されている他の電子デバイスを制御する、音声通信および／または音声認識のために、ユーザ１１２は、モバイルフォン１０２のマイクロフォン１０４に話しかける。モバイルフォン１０２のマイクロフォン１０４は、ユーザの音声コマンド１１４を取り込んで、入力オーディオ信号を発生させる。いくつかのシチュエーションでは、ネットワークイネーブルされているテレビ（ＴＶ）１１６またはラジオ１１８のような別個のメディアデバイスに、モバイルフォン１０２が近接しているかもしれない。これらのデバイスはバックグラウンドサウンド１２０、１２２を生成させるかもしれず、バックグラウンドサウンド１２０、１２２は、モバイルフォン１０２の動作に関して、望ましくないバックグラウンドオーディオノイズとして作用する。

［００２５］
例えば、ネットワークイネーブルされているＴＶ１１６またはラジオ１１８が、記憶している音楽またはストリーム音楽を再生していることがある。ネットワークイネーブルされているＴＶ１１６またはラジオ１１８によって生成されるバックグラウンドサウンドと同時に、マイクロフォン１０４は、ユーザ１１２からの音声コマンド１１４を取り込むかもしれない。このような状況では、ネットワークイネーブルされているＴＶ１１６またはラジオ１１８からのサウンドは、ユーザの音声コマンド１１４を著しく妨害して、ユーザに対して、会話または音声の認識を難しくするかもしれない。さまざまな実施形態は、入力オーディオ信号のノイズ成分を抑制することに関連している。

［００２６］
ノイズ信号のコンテンツが識別できる場合は、モバイルフォン１０２はノイズ信号をより明確に抑制することができる。１つの実施形態において、モバイルフォン１０２は、入力オーディオ信号を解析して、テレビのブロードキャストからの特定の歌またはオーディオのような識別可能なコンテンツを、入力オーディオ信号が有するか否かを決定する。例えば、１つの実施形態は、入力オーディオ信号の特徴を抽出することによって（歌のタイトル、アルバム名、アーティスト名、または、これらに類するもの、のような）コンテンツ−識別情報を決定し、その後、コンテンツソースをサーチ、ダウンロード、ストリーミングするか、または、そうでない場合はコンテンツソースにアクセスする。例えば、図１を参照すると、モバイルフォン１０２は、コンテンツデータベース１１０をサーチして、コンテンツソースにアクセスできる。コンテンツソースは、ソース−識別情報との一致に基づいて決定される。コンテンツソースへのアクセスを有すると、オーディオノイズのコピー（“ソース信号”）をモバイルフォン１０２は取得することができる。オーディオノイズのコピーを使用して、メディアデバイスによって生成されるサウンドに対応するオーディオノイズを明確に減衰または抑制できる。

［００２７］
追加的または代替的に、モバイルフォン１０２は、直接か、またはネットワーク１０８を通してかのいずれかで、ネットワークイネーブルされているＴＶ１１６および／またはラジオ１１８と通信して、コンテンツソースを識別するかもしれない。例えば、モバイルフォン１０２は、ネットワークイネーブルされているＴＶ１１６からの、例えばチャンネル情報を要求することができる。ネットワークイネーブルされているＴＶ１１６は、自身の通信アンテナ１２４を使用することによって通信することができる。モバイルフォン１０２は、受信したチャンネル情報に基づいて、コンテンツデータベース１１０からのコンテンツソースにアクセスすることができる。別の例として、モバイルフォン１０２は、例えば、識別されたチャンネルにチューニングすることによって、ネットワークイネーブルされているＴＶ１１６にメディアコンテンツをブロードキャストしている（示していない）デバイスからのコンテンツソースにアクセスすることができる。さらに別の例として、モバイルフォン１０２は、ネットワークイネーブルされているＴＶ１１６からのコンテンツソースにアクセスすることができる。言い換えれば、ネットワークイネーブルされているＴＶ１１６は、モバイルフォン１０２に直接、コンテンツソースを送信または中継することができる。

［００２８］
ここで、図２に移ると、望ましくないオーディオノイズを抑制するように構成されているオーディオ処理デバイス２０２の、実例となる実施形態のブロックダイヤグラムが示されている。オーディオ処理デバイス２０２は、バス２１４によって相互接続されている、プロセッサ２０４と、マイクロフォン２０６と、通信インターフェース２０８と、データ記憶デバイス２１０と、メモリ２１２とを備えている。さらに、メモリ２１２は、オーディオ信号解析器モジュール２１６と、オーディオキャンセラモジュール２１８と、通信モジュール２１２とを含むことができる。オーディオ処理デバイス２０２の例には、移動体コンピューティングデバイス、セルラフォン、汎用コンピュータ、および、これらに類するもの、のような任意の適用可能な電子デバイスが含まれる。

［００２９］
メモリ２１２からの命令を実行し、マイクロフォン２０６、通信インターフェース２０８、データ記憶デバイス２１０、メモリ２１２、およびバス２１４を制御および動作させるように構成されているマイクロプロセッサまたはマイクロ制御装置のような回路を、プロセッサ２０４は含んでいる。特に、プロセッサ２０４は、汎用の単一または複数チップマイクロプロセッサ（例えば、ＡＲＭ）、特殊目的マイクロプロセッサ（例えば、デジタル信号プロセッサ（ＤＳＰ））、マイクロ制御装置、プログラム可能ゲートアレイなどであってもよい。オーディオ処理デバイス２０２中ではちょうど単一のプロセッサを示しているが、代替的なコンフィギュレーションにおいては、プロセッサ（例えば、ＡＲＭやＤＳＰ）を組み合わせたものを使用することもできる。

［００３０］
プロセッサ２０４がメモリ２１２からの特有の命令を実行することによって制御されて、マイクロフォン２０６は、音響サウンドを取り込み、応答の入力オーディオ信号を発生させるように構成されている。マイクロフォン２０６の例には、コンデンサーマイクロフォン、ダイナミックマイクロフォン、圧電マイクロフォン、および、これらに類するもの、のようなサウンドを電気的なオーディオ信号に変換する任意の適用可能なセンサまたはトランスデューサーが含まれる。いくつかの実施形態においては、マイクロフォン２０６はオプションであり、図３を参照して説明するように、入力オーディオ信号は、例えば、データ記憶デバイス２１０またはメモリ２１２からのデータから発生される、あるいは、通信インターフェース２０８から受け取られる。

［００３１］
コンテンツソースを識別、検索、またはコンテンツソースにアクセスするためのデータのようなデータを、オーディオ処理デバイス２０２が送信および受信することを可能にするように構成されている電子装置を、通信インターフェース２０８は備えている。通信インターフェース２０８を、ワイヤレスアンテナ、ＷＬＡＮ／ＬＡＮおよび他のタイプのルータ、ならびに、これらに類する通信デバイスに、通信可能に結合することができる。

［００３２］
化学的手段、磁気的手段、電気的手段、光学的手段、または、これらに類する手段によって情報を記憶するように構成されているメカニズムを、データ記憶デバイス２１０およびメモリ２１２は備えている。例えば、データ記憶デバイス２１０およびメモリ２１２を各々、フラッシュメモリまたはハードディスクドライブのような不揮発性メモリデバイス、あるいは、ダイナミックランダムアクセスメモリ（ＤＲＡＭ）またはスタティックランダムアクセスメモリ（ＳＲＡＭ）のような揮発性メモリデバイスにすることができる。いくつかの実施形態において、データ記憶デバイス２１０のコンテンツソースデータベースにアクセスすることによって、プロセッサ２０４はコンテンツソースにアクセスすることができる。図２は、データ記憶デバイス２１０を、オーディオ処理デバイス２０２の一部として示している。他の実施形態において、データ記憶デバイス２１０は、別個のデバイスに位置していてもよく、例えばネットワークを通して、通信チャネルによってアクセスされるかもしれない。図３に関連して、オーディオ信号解析器モジュール２１６をさらに詳細に説明する。

［００３３］
オーディオ信号解析器モジュール２１６は、メモリ２１２内に存在する。入力オーディオ信号のコンテンツの識別を開始し、対応するコンテンツソースへのアクセスを提供し、および／または、識別されたソース信号を受信するようにプロセッサ２０４を構成する命令を、オーディオ信号解析器モジュール２１６は含んでいる。図３に関連してさらに詳細に説明するように、いくつかの実施形態において、入力オーディオ信号から特徴が抽出される。抽出された特徴を使用して、入力オーディオ信号によって表されるメディアコンテンツのコンテンツ識別子を決定することができる。コンテンツ識別子を使用して、コンテンツ識別子に関係付けられているコンテンツソースにアクセスすることができる。図４および図５に関連して、オーディオ信号解析器モジュール２１８をさらに詳細に説明する。

［００３４］
オーディオキャンセラモジュール２１８は、メモリ２１２内に存在する。識別されたソース信号により入力オーディオ信号を処理して、オーディオノイズを減衰させるようにプロセッサ２０４を構成する命令を、オーディオキャンセラモジュール２１８は含んでいる。特に、入力オーディオ信号と識別されたソース信号とを比較する。１つの実施形態では、ルーム音響に対処するように、識別されたソース信号をフィルタリングする。このことを行う１つの理由は、とりわけ、電子デバイスが位置している音響空間の音響効果が部分的に原因で、メディアデバイスによって生成されるサウンドが、識別されたソース信号とは異なることがあるからである。音響効果は、音響上の減衰およびエコーを含む。別の実施形態では、入力オーディオ信号と識別されたソース信号は、計算、通信、および音響の要因から結果として生じるさまざまな遅延に対処するように同期化される。図４および図５に関連して、オーディオキャンセラモジュール２１８をさらに詳細に説明する。

［００３５］
通信モジュール２２０は、メモリ２１２内に存在する。通信インターフェース２０８を制御して、データを送信または受信するようにプロセッサ２０４を構成する命令を、通信モジュール２２０は含んでいる。いくつかの実施形態において、以下でさらに詳細に説明するように、オーディオ処理デバイス２０２と、図１のネットワークイネーブルされているＴＶ１１６のような別個のメディアデバイスとの間で、通信を開始することができる。

［００３６］
動作において、プロセッサ２０４は、メモリ２１２からの命令を実行して、マイクロフォン２０６によって取り込まれた入力オーディオ信号を受け取ることができる。入力オーディオ信号は、音声信号とオーディオノイズ信号とを含んでいるかもしれない。例えば、音声信号がユーザの音声を表す一方で、オーディオノイズ信号は近くのメディアデバイスによって生成されるサウンドを表すかもしれない。プロセッサ２０４は、オーディオ信号解析器モジュール２１６からの命令を実行して、オーディオノイズ信号のコンテンツを識別する。その後、プロセッサ２０４は、識別したコンテンツに関係付けられているコンテンツソースを発見するためにデータ記憶デバイス２１０をサーチするかもしれない。追加的または代替的に、プロセッサ２０４は、オーディオ信号解析器モジュールおよび／または通信モジュール２１２からの命令を実行して、通信インターフェース２０８を介して、ネットワークを通してデータベースをサーチするかもしれない。いったん、オーディオ処理デバイス２０２がコンテンツソースへのアクセスを有して、対応する識別されたソース信号を有すると、プロセッサ２０４は、オーディオキャンセラモジュール２１８からの命令を実行して、ノイズ信号のコピー（例えば、フィルタリングされた、またはフィルタリングされていない、識別されたソース信号）と入力オーディオ信号とを比較することによって、オーディオノイズ信号の少なくとも一部を抑制または減衰させる。

［００３７］
図３を参照すると、図２のオーディオ処理デバイス２０２によって実現されるオーディオ信号解析器３００の特定の実例となる実施形態を、ブロックダイヤグラムが示している。プロセッサ２０４によって実行される、オーディオ信号解析器モジュール２１６の命令のようなコンピュータ実行可能命令により、オーディオ信号解析器３００を実現することができる。入力オーディオ信号を受け取って、コンテンツ−識別情報を発生させるように構成されている識別子発生器３０２を、図３のオーディオ信号解析器３００は備えている。コンテンツ−識別情報は、アーティスト名と、コンテンツタイトル（曲の名前、ムービー、オーディオブックなど）と、識別番号と、これらに類する識別子のしるしと、のうちの１つ以上を含むことができる。コンテンツ−識別情報を受け取って、識別されたソース信号を発生させるように構成されているソースマッチャー３０４も、オーディオ信号解析器３００は有している。

［００３８］
図３の識別子発生器３０２は、特徴抽出器３０６と、コンテンツ識別器３０８と、コンテンツ−識別子データベース３１０とを有している。コンテンツを決定するための入力オーディオ信号の特徴情報を決定するようにプロセッサ２０４を構成する命令を含むモジュールによって、特徴抽出器３０６を実現することができる。例えば、動作において、特徴抽出器３０６は、入力オーディオ信号を解析して、入力オーディオ信号を識別または特徴付けできる音響パターンまたは音響フィンガープリントを決定することができる。１つの実施形態において、音響パターンまたは音響フィンガープリントは、スペクトル（例えば、時間−周波数）解析を実行することに基づいていることがある。メル周波数ケプストラム係数および／または知覚的線形予測（例えば、相対スペクトル変換−知覚的線形予測）に基づくオーディオ処理技術のような、特徴抽出のための他の適用可能な方法およびシステムを選択することができることが、正しく認識できるだろう。コンテンツ識別のための特徴抽出システムの１つの特定の非制限的な例は、例えば、ワンによる論文“インダストリアルストレングスオーディオサーチアルゴリズム”（音楽情報検索国際会議プロシーディングＩＳＭＩＲ．２００３年．ｖｏｌ．３）中で見つけることができる。例えば、ワンによって記述されているシステムは、バックグラウンドノイズに対するロバストネスを改善するために、スペクトル中の局所ピークパターンを利用している。

［００３９］
音響パターンまたは音響フィンガープリントを使用して、音響パターンまたは音響フィンガープリントのコンテンツ識別子を発見するためにコンテンツ−識別子データベース３１０をサーチするようにプロセッサ２０４を構成する命令を含むモジュールによって、コンテンツ識別器３０８を実現することができる。例えば、プロセッサ２０４は、音響パターンまたは音響フィンガープリントに対応する、すなわち、おおよそ一致する、コンテンツ−識別情報を発見するために、コンテンツ−識別子データベース３１０をサーチすることができる。識別子発生器３０２は、コンテンツ−識別情報をソースマッチャー３０４に提供する。

［００４０］
図３のソースマッチャー３０４は、ソースサーチャー３１２と、ソースデータベース３１４と、ソース送信機３１６とを備えている。コンテンツ−識別情報を使用して、コンテンツソースを発見するためにソースデータベース３１４をサーチするようにプロセッサ２０４を構成する命令を含むモジュールによって、ソースサーチャー３１２を実現することができる。例えば、プロセッサ２０４は、コンテンツ−識別情報に対応する、すなわち、おおよそ一致する、歌のＭＰ３ファイルのようなコンテンツソースを発見するために、データ記憶デバイス２１０上に記憶されている（または、外部に記憶されていて、通信インターフェース２０８によりアクセスされる）ソースデータベース３１４をサーチすることができる。

［００４１］
ソース送信機３１６は、ソースサーチャー３１２によって識別されたコンテンツソースにアクセスすることができ、識別されたソース信号を発生させることができる。ソース信号は、パルスコード変調（ＰＣＭ）オーディオサンプル、（圧縮またはコード化されたデータを含む）データパケット、または、これらに類するデータフォーマットとして送信することができる。したがって、ソース送信機３１６は、オーディオ処理デバイス２０２に送信されるコード化されたオーディオデータパケットを発生させるボコーダ（エンコーダ）３１８をオプション的に備えているかもしれない。言い換えると、ソース送信機３１６はサーバコンピューティングデバイスに位置することができ、データパス上または音声パス上で、（図１のモバイルフォン１０２のような）オーディオ処理デバイス２０２にソース信号を送ることができる。

［００４２］
オーディオ信号解析器３００の機能の各々を、図２のオーディオ処理デバイス２０２によって実行できることが、正しく認識できるだろう。他の実施形態では、（コンテンツデータベース１１０、および、ネットワークに接続されている他のデバイスのような）１つ以上のサーバコンピューティングデバイスによって、１つ以上の機能が実行される。例えば、オーディオ処理デバイス２０２は、通信インターフェース２０８を使用して、ネットワークを通してサーバコンピュータと通信することができる。ストリーミングのような方法により、その全体を、または、ダウンロードのような方法により、データブロックで、ネットワークを通して、識別されたソース信号を提供してもよい。したがって、オーディオ処理デバイス２０２は、キャンセリングに対して必要とされる前に、識別されたソース信号の一部を受信することができる。したがって、コンテンツ−識別子データベース３１０およびソースデータベース３１４の各々を、オーディオ処理デバイス２０２のデータ記憶デバイス２１０またはメモリ２１２上に電子的に記憶することができる、あるいは、オーディオ処理デバイス２０２の外部に記憶させて、ネットワークを通してアクセスすることができる。

［００４３］
図４は、図２のオーディオ処理デバイス２０２によって実現されるオーディオキャンセラシステム４００の、特定の実例となる実施形態のブロックダイヤグラムを示している。示しているように、オーディオキャンセラシステム４００を使用して、複数のオーディオノイズソースを抑制することができる。例えば、オーディオキャンセラシステム４００は、ｎ個の（“信号同期器”とも呼ばれる）同期化ブロック４０２（１）〜４０２（ｎ）と、ｎ個の対応するオーディオキャンセラ４０４（１）〜４０５（ｎ）とともに、オプションの、後処理４０６ブロックと、ボコーダ４０８ブロックと、音声認識４１０ブロックとを有している。プロセッサ２０４によって実行される、オーディオキャンセラモジュール２１８の命令のようなコンピュータ実行可能命令により、オーディオキャンセラシステム４００を実現することができる。

［００４４］
動作において、ｎ個の可能性あるオーディオノイズの各々を減衰するように、オーディオキャンセラシステム４００は、入力オーディオ信号とｎ個の識別されたソース信号とを受け取る。例えば、図１を参照すると、ネットワークイネーブルされているＴＶ１１６からのオーディオ１２０にオーディオノイズ１が対応でき、ラジオ１１８からのオーディオ１２２にオーディオノイズ２が対応できる。さらに、例えば、図３のオーディオ信号解析器３００によって発生されるソース信号に、各識別されたソース信号が対応できる。オーディオノイズ１が最初に抑制され、結果として生じる処理された入力オーディオ信号がオーディオキャンセラ２に供給されて、オーディオノイズ２が抑制され、続いていくように、同期化ブロック４０２（１）〜４０２（ｎ）とオーディオキャンセラブロック４０４（１）〜４０４（ｎ）とのｎ個のペアが直列に構成されている。ｎ個の並列のオーディオキャンセラ４０４（１）〜４０４（ｎ）のような、他の適用可能なコンフィギュレーションを選択することもできることが、正しく認識されるだろう。

［００４５］
先述したように、図３において示したソース送信機のような、ｎ個の別個のソース送信機によって、ｎ個の識別されたソース信号を提供することができる。追加的または代替的に、オーディオノイズを生成させる別個のメディアデバイスによって、ｎ個の識別されたソース信号を発生させることができる。ｎ個の識別されたソース信号（とともに入力オーディオ信号）は各々、ＰＣＭオーディオサンプルまたはデータパケットとして提供することができる。例えば、１つの実施形態では、ｎ個の識別されたソース信号はコード化された音声パケットとして送信され、オーディオキャンセラシステム４００は、同期化ブロック４０２（１）〜４０２（ｎ）に信号を提供する前に信号をデコードする、オプションの（示していない）ボコーダ／デコーダを備えている。

［００４６］
図４において示しているように、オーディオキャンセラ４０４（１）〜４０４（ｎ）の各々はそれぞれ、同期化ブロック４０２（１）〜４０２（ｎ）に関係付けられている。同期化ブロック４０２（１）〜４０２（ｎ）の各々は、入力オーディオ信号（または、前のオーディオキャンセラの出力）と、対応する識別されたソース信号とを同期化することができる。処理、通信、および、これらに類する遅延のソース、が原因のタイミング差を、同期化ブロック４０２（１）〜４０２（ｎ）は補償することができる。さらに、同期化ブロック４０２（１）〜４０２（ｎ）を使用して、メディアデバイスによって再生されているソースの現在の時間的な位置の決定におけるまたは推定におけるエラーを補償することができる。同期化ブロック４０２（１）〜４０２（ｎ）の各々はそれぞれ、同期化のための遅延を提供する、対応するデータバッファ４１６（１）〜４１６（ｎ）を有することができる。いくつかの実施形態では、遅延を調整可能にすることができる。動作において、較正処理を実行することによって、調整可能な遅延を決定することができる。較正を行う、および遅延を調整するための処理の非限定的な例を、２０１２年８月９日に出願された米国仮特許出願番号６１／６８１，４７４中で見つけることができる。

［００４７］
ｎ個のオーディオキャンセラ４０４（１）〜４０４（ｎ）の各々はそれぞれ、対応するソース信号をフィルタリングするように構成されている１つ以上の適応フィルタ４１２（１）〜４１２（ｎ）を有することができる。フィルタリングを使用して、取り込まれたオーディオノイズとソース信号との間のバリエーションに対処することができる。すなわち、音響空間の変化（例えば、マイクロフォン２０６の位置とメディアデバイスの位置とにより変化することがあるエコーや、音響上の減衰）、スピーカー／マイクロフォンの変化、コンテンツソースにおけるバリエーション（例えば、異なる録音品質）、および、これらに類するもの、を含む多数の要因のために、マイクロフォン２０６によって取り込まれるオーディオノイズはソース信号から変化しているかもしれない。

［００４８］
これらのバリエーションを補償するために、適応フィルタ４１２（１）〜４１２（ｎ）の各々は、１つ以上の調整可能なフィルタパラメータを有することができる。いくつかの実施形態では、入力オーディオ信号とソース信号とに基づいて、これらのバリエーションをモデリングするように、フィルタパラメータをオンラインで調整できる。例えば、入力オーディオ信号が、メディアデバイス１によって発生されるサウンドを大部分含んでいるときは、適応フィルタ４１２（１）の出力（“フィルタリングされたソース信号”）と入力オーディオ信号との間のエラーを使用して、信号間のエラーを低減させる方法で、フィルタパラメータを調整することができる。小さなエラーは、オーディオノイズ信号を変更する音響効果を、適応フィルタ４１２（１）がおおよそモデリングしていることを示すことができる一方で、大きなエラーは、音響効果を適応フィルタ４１２（１）がモデリングしていないことを示す。“適応則”または“更新ルール”のようなさまざまな方法を使用して、フィルタ係数を調節することができる。例は、調整可能なフィルタパラメータを調節して、フィルタリングされたソース信号と、入力オーディオ信号との間のエラーを低減させるための、瞬間的または総合的なコストを低減させることに基づくような、勾配法に基づく適応則を含む。他の例は、最小平均２乗法、リアプノフ／安定法、および推計法を含む。しかしながら、任意の適切な再帰的な、非再帰的な、またはバッチの適応則を使用して、調整可能なフィルタパラメータを調節できることが正しく認識できるだろう。

［００４９］
動作において、オーディオキャンセラ４０４（１）は、同期化された入力オーディオ信号のコピーと、識別されたソース信号１とを受け取る。先述したように、識別されたソース信号１は、オーディオノイズを発生させているスピーカーを駆動しているオーディオ信号に近似することができる。適応フィルタ４１２（１）は、音響空間の音響変化に対処するように、識別されたソース信号をフィルタリングすることができ、これにより、マイクロフォン２０６によって取り込まれるオーディオノイズ１に近似する、フィルタリングされたソース信号１を発生させることができる。オーディオキャンセラ４０４（１）は、同期化された入力オーディオ信号と、フィルタリングされたソース信号１とを比較して、オーディオノイズ１を減衰または抑制する。示しているように、オーディオキャンセラ４０４（１）は、フィルタリングされたソース信号を入力オーディオ信号から減算する。その後、抑制されたノイズ１を有するオーディオ信号が、第２の同期化ブロックに供給されて、オーディオノイズ２が抑制され、入力オーディオ信号からｎ個のオーディオノイズが抑制されるまで続く。

［００５０］
追加的に、各適応フィルタ４１２（１）〜４１２（ｎ）はそれぞれ、ある状況下でそのフィルタパラメータの調節を停止またはイネーブルさせる、ダブルトーク検出器（“ＤＴＤ”）４１４（１）〜４１４（ｎ）をオプション的に有することができる。入力オーディオ信号（または、前のオーディオキャンセラの出力）が、対応するオーディオノイズに加えて（ユーザの音声、または、他のメディアノイズのような）他の近端信号を含んでいるときは、対応する適応フィルタ４１２（ｎ）は適切な適応を行わないかもしれない。オーディオノイズ以外の付加的な近端信号が存在しているときに適応フィルタ４１２（ｎ）が適応を行っているかもしれないので、適応則に関して、強く、相関されていないノイズとして、それらの付加的な近端信号が作用するかもしれない。したがって、付加的な近端信号の存在は、適応フィルタ４１２（ｎ）を発散させるかもしれず、抑制されていないオーディオノイズを許容するかもしれない。したがって、ＤＴＤ４１４（１）〜４１４（ｎ）の各々を使用して、対応する適応フィルタ４１２（１）〜４１２（ｎ）の入力を監視して、付加的な近端信号の検出に基づいて、適応を停止またはイネーブルさせてもよい。

［００５１］
ＤＴＤ４１４（１）〜４１４（ｎ）のこのような１つの方法は、適応フィルタ入力信号が付加的な近端信号をいつ含んでいるかを決定するために、ダブルトーク検出統計値を算出することを伴うかもしれない。１つの例示的なダブルトーク検出統計値は、対応する適応フィルタ入力信号に対するソース信号電力の比によって与えられる。他の適用可能なダブルトーク検出統計値を選択することもできる。さらに、ダブルトーク統計値は、時間ドメインまたは周波数ドメインで計算してもよい。

［００５２］
図４において示しているように、エコーキャンセラ４０４（ｎ）によって提供される信号においてあるタイプの処理を実行する、オプションの非線形の後処理ブロック４０６をオプション的に備えることができる。例えば、非線形の後処理ブロック４０６は、エコーキャンセラ４０４（ｎ）を出る信号から、残余ノイズ（例えば、オーディオノイズ信号の非線形成分）を除去するかもしれない。いくつかの実施形態では、入力オーディオ信号の非線形成分を推定し、その後、（例えば、スペクトル減算技術を使用することによって）入力オーディオ信号から推定を減算することによって、非線形ノイズ成分を除去することができる、または減衰させることができる。非線形の後処理ブロックは、ＤＴＤ４１４（１）〜４１４（ｎ）からのダブルトーク決定に基づいて動作するかもしれない。それゆえ、非線形の後プロセッサ２０４が信号を完全にクリップまたは除去する前に、ダブルトーク決定が、近端信号と残余オーディオノイズとの間を区分するのを助ける。

［００５３］
抑制されたノイズ１、・・・、ｎを有するオーディオ信号は、オーディオ信号を音声パケットにエンコードする、ボコーダ４０８に提供されるかもしれない。追加的または代替的に、抑制されたノイズを有するオーディオ信号は、さらなるオーディオ信号処理のために、音声認識ブロック４１０に提供されるかもしれない。

［００５４］
予期されるノイズ環境、計算機能力、リアルタイム制約、メモリ、性能、および／または、これらに類する考慮事項、のようなさまざまな考慮事項に基づいて、オーディオキャンセラ４０４（１）〜４０４（ｎ）の数ｎを選択することができる。しかしながら、適用可能な他の要因を考慮することもできることが、正しく認識できるだろう。同様に、適用可能な任意の数の同期化ブロックをオーディオキャンセラシステムが備えることができることが、正しく認識できるだろう。いくつかの実施形態において、図５に関連して以下で説明するように、これらのコンポーネントの数を、識別されたノイズ成分の数に関して動的に変化させることができる。

［００５５］
図５は、図２のオーディオ処理デバイス２０２によって実現されるオーディオキャンセラシステム５００の、特定の実例となる別の実施形態のブロックダイヤグラムを示している。図４および図５のシステム４００、５００に共通のエレメントは、共通の参照番号を共有しており、簡潔にするために、システム４００、５５０の間の差異のみをここに記述している。

［００５６］
オーディオキャンセラシステム５００は、ｎ個の同期化ブロック４０２（１）〜４０２（ｎ）と、ｎ個のオーディオキャンセラブロック４０４（１）〜４０４（ｎ）と、ソース識別子検出器５０２と、再構成可能キャンセライネーブラ５０４とを有している。ソース識別子検出器５０２は、ｎ個の識別されたソース信号を受け取り、識別されたソース信号のパスのうちのどれがアクティブであるかを決定する。例えば、信号の存在、または、そのパス上での対応する信号のエネルギーのレベルに基づいて、ソース識別子検出器５０２はアクティブなソース信号パスを決定することができる。次に、再構成可能キャンセライネーブラ５０４は、アクティブな識別されたソース信号パスに対応する、オーディオキャンセラブロック４０４（１）〜４０４（ｎ）をアクティブ化する。オーディオキャンセラブロック４０４（１）〜４０４（ｎ）のうちの各アクティブオーディオキャンセラブロックは、図４に関連して上述したように動作することができる。オーディオキャンセラブロック４０４（１）〜４０４（ｎ）のうちの各非アクティブオーディオキャンセラブロックは、例えば、パススルーフィルタとして構成することができる。

［００５７］
図６は、１つの実施形態にしたがった、オーディオノイズ抑制の方法６００のフローダイヤグラムを示している。以下に続く方法の記載は、モバイルフォンやパーソナルオーディオプレイヤーのようなパーソナルオーディオ処理デバイス２０２におけるインプリメンテーションに焦点を合わせているが、他のデバイスを、方法またはその変形を実行するように構成してもよい。方法は、オーディオ処理デバイス２０２に関係付けられているコンピューティングデバイスの、ＲＡＭ、ＲＯＭ、ハードディスクドライブ、または、これらに類するもの、のような非一時的コンピュータ記憶装置に存在する、ソフトウェアモジュールとして、またはモジュールの集合として実現することができる。コンピューティングデバイスの１つ以上のプロセッサが、ソフトウェアモジュールを実行することができる。

［００５８］
ブロック６０２において、方法６００は、入力オーディオ信号を受け取ることを含んでいる。例えば、オーディオ処理デバイス２０２は入力オーディオ信号を、オーディオ処理デバイス２０２のマイクロフォン２０６から、データ記憶デバイス２１０から、またはメモリ２１２デバイスから受け取るかもしれない、あるいは、通信インターフェース２０８において受信するかもしれない。

［００５９］
ブロック６０２において入力オーディオ信号を受け取った後、プロセス６００はブロック６０４に進み、識別可能なコンテンツを有するノイズをオーディオ入力信号が含むか否かの決定が行われる。例えば、１つの実施形態において、オーディオ処理デバイス２０２は、オーディオ信号解析器モジュール２１６からの命令を実行して、オーディオノイズのコンテンツを識別するのに使用することができる、オーディオ入力信号の特徴情報を決定するかもしれない。コンテンツ識別器３０８によって特徴情報を使用して、コンテンツ識別情報を決定することができる。１つの実施形態において、オーディオ処理デバイス２０２は、さらなる処理のために、ネットワークを通してサーバに特徴情報を送り、その後、ネットワークを通してコンテンツ−識別情報を受信することができる。別の実施形態では、コンテンツ識別器３０８ブロックおよびソースサーチャー３１２ブロックの機能のうちの１つ以上をオーディオ処理デバイス２０２において実行して、コンテンツ−識別情報を決定することができる。ブロック６０４の動作を実現するための方法の１つの実施形態は、図７Ａに関連して以下で記述する。

［００６０］
別の実施形態では、オーディオ信号解析器モジュール２１６からの実行命令によって、別個のメディアデバイスと通信して、オーディオ入力信号が識別可能なコンテンツを有するか否かを決定するブロック６０４の動作が実行される。例えば、オーディオ処理デバイス２０２は、メディアデバイスがオーディオメディアを再生しているか否かに関する別個のメディアデバイスからの情報を要求することができ、メディアデバイスがオーディオメディアを再生している場合は、コンテンツ−識別情報を要求することができる。応答として、オーディオ処理デバイス２０２は、コンテンツ−識別情報を受信するかもしれない。

［００６１］
いったん、識別可能なコンテンツを有するバックグラウンドノイズをオーディオ入力信号が含むことが決定されると、方法６００は、識別可能なコンテンツのコンテンツソースにアクセスして、ソース信号を取得するブロック６０６に進む。例えば、１つの実施形態において、オーディオ処理デバイス２０２は、通信インターフェース２０８を介して、あるいは、メモリ２１２またはデータ記憶デバイス２１０を介して、コンテンツソースまたはコンテンツソース信号にアクセスするかもしれない。例えば、ブロック６０４において取得したコンテンツ−識別情報を使用して、コンテンツソースを位置特定して、コンテンツソースにアクセスすることができる。コンテンツソースを使用して、ソース信号を発生させることができる。ブロック６０６の動作を実現するための方法の１つの実施形態は、図７Ｂに関連して以下で記述する。

［００６２］
ソース信号の少なくとも一部が入手可能となった後、方法６００はブロック６０８に進み、ソース信号と入力オーディオ信号とを比較することに基づいて、ノイズを減衰させる。例えば、１つの実施形態において、オーディオ処理デバイス２０２は、メモリ２１２中のオーディオキャンセラモジュール２１８の命令を実行して、図４または図５において示したオーディオキャンセラシステムにしたがって、オーディオノイズを減衰させる。

［００６３］
ここで図７Ａに移ると、１つの実施形態にしたがった、識別可能なコンテンツを有するノイズをオーディオ入力信号が含むか否かを決定するブロック６０４において行うステップの例の、実例となるフローダイヤグラムが示されている。ブロック７０２において、方法６０４は、入力オーディオ信号の特徴情報を決定する。例えば、１つの実施形態において、オーディオ処理デバイス２０２は、メモリ２１２中のオーディオ信号解析器モジュール２１６の命令を実行して、図３において示した特徴抽出器３０６にしたがって特徴を抽出する。いったん、十分な特徴情報が決定されると、その後、プロセス６０４は、コンテンツソースを識別するために特徴情報を提供するブロック７０４に進む。例えば、１つの実施形態において、オーディオ処理デバイス２０２は、メモリ２１２中のオーディオ信号解析器モジュール２１６の命令を実行して、通信インターフェース２０８に、サーバデバイスによる処理のために、ネットワークを通してサーバデバイスに対して特徴情報を送信させる。

［００６４］
特徴情報を提供した後、方法６０４は、コンテンツ−識別情報を取得するブロック７０６に進む。例えば、オーディオ処理デバイス２０２は、ブロック７０４を実行することで特徴情報を受信したサーバデバイスから、コンテンツ−識別情報を受信することができる。代替的または追加的に、いくつかの実施形態では、オーディオ処理デバイス２０２は、サーバデバイスと通信する代わりに、処理デバイス２０２において、必要なステップを実行することによってコンテンツ−識別情報を発生させる。例えば、オーディオ処理デバイス２０２のプロセッサ２０４は、メモリ２１２中のオーディオ信号解析器モジュール２１６の命令を実行して、図３のオーディオ信号解析器３００を実現することができる。

［００６５］
図７Ｂは、１つの実施形態にしたがった、コンテンツソースにアクセスしてソース信号を取得するための例示的な方法６０６の、実例となるフローダイヤグラムである。ブロック７０８において、方法６０６は、受信したコンテンツ−識別情報に関係付けられているコンテンツソースをサーチすることを含んでいる。例えば、１つの実施形態において、オーディオ処理デバイス２０２は、メモリ２１２中のオーディオ信号解析器モジュール２１６の命令を実行して、データ記憶デバイス２１０中に記憶されているメディアライブラリをサーチする。サーチの後、方法６０６は、サーチ結果に基づいて、ソース信号を発生させる、または受信するブロック７１０に進む。例えば、コンテンツソースがオーディオ処理デバイス２０２においてローカルに発見された場合は、プロセッサ２０４は命令を実行して、コンテンツソースからソース信号を発生させる。コンテンツソースがデバイスにおいてローカルに発見されない場合は、１つの実施形態において、オーディオ処理デバイス２０２は、メモリ２１２中のオーディオ信号解析器モジュール２１６の命令を実行して、ネットワーク１０８を通して、識別されたソース信号を要求して、コンテンツデータベース１１０から識別されたソース信号を受信する。

［００６６］
ここで図８に移ると、実施形態にしたがった、オーディオノイズを減衰させるブロック６０８において行うステップの例の、実例となるフローダイヤグラムが示されている。ブロック８１０において、２つの信号の間の時間遅延を補償するように、入力オーディオ信号とソース信号とを同期化させる。動作において、異なる信号パスおよび計算パスをとることから結果として生じるさまざまな遅延を含む、さまざまな理由のために、信号が同期から外れることがある。信号を同期化させるために、各信号のタイミングを制御するように、可変長の（環状バッファのような）データバッファ中に各信号を記憶させることができる。例えば、図４を参照すると、入力オーディオ信号と識別されたソース信号は、第１の同期化ブロック４０２（１）において受け取られる。同期化ブロック４０２（１）は、バッファブロック４１６（１）中に記憶される対応する環状バッファデータ構造中に信号を記憶させることができる。環状バッファの長さは、信号を同期化させるための、所望の遅延の関数とすることができる。いくつかの実施形態では、例えば、較正モードの間に、所望の遅延を算出または推定する。ｎ個のオーディオキャンセラ４０４（１）〜４０４（ｎ）によって入力オーディオ信号が処理されるにしたがって、ｎ個のオーディオキャンセラ４０４（１）〜４０４（ｎ）の各々において、オーディオ信号に追加の遅延が生じることがある。例えば、ｎ個の適応フィルタ４１２（１）〜４１２（ｎ）によるフィルタリングが遅延をもたらすことがある。さらに、ｎ個の識別されたソース信号は、例えば、識別されたソース信号が識別されて最終的に受信されるのに要した時間が原因の、さまざまな遅延を経験することがある。したがって、ｎ個の同期化ブロック４０２（１）〜４０２（ｎ）を使用して、それらのさまざまな遅延を補償し、オーディオ−キャンセリング処理の間、オーディオ信号と識別されたソース信号とが同期化されているように維持することができる。

［００６７］
オーディオ入力信号と識別されたソース信号とを同期化させた後、方法６０８は、識別されたソース信号をフィルタリングして、音響変化、スピーカーおよびマイクロフォンの変化、ならびに、これらに類するもののような、オーディオノイズに影響を与えている音響効果に対処するブロック８２０に続く。マイクロフォン２０６によって取り込まれるオーディオノイズを、識別されたソース信号が正確には表していないかもしれないので、フィルタリングが行われる。識別されたソース信号がオーディオノイズから相当変化している場合は、オーディオ抑制は効果的でないかもしれない。ノイズ抑制を改善するため、オーディオノイズに忠実に一致するように、または、オーディオノイズを再現するように、識別されたソース信号を成形するために、このような要因の効果をオンラインで推定することができる。例えば、ここで図４を参照すると、同期化されたオーディオ入力信号と同期化された識別されたソース信号１は、オーディオノイズキャンセラ４０４（１）に、および、適応フィルタ４１２（１）にパスされる。その後、適応フィルタ４１２（１）は、オーディオノイズをおおよそ再現する参照信号を生成させるように、識別されたソース信号１をフィルタリングまたは形成することができる。フィルタが、識別されたソース信号をどのように形成するかについて影響を与える、１つ以上のフィルタパラメータ（例えば、無限インパルス応答フィルタの有限インパルス応答の１つ以上のフィルタ係数）を、適応フィルタ４１２（１）は有することができる。いくつかの実施形態は、広い範囲の音響効果に対処する調整可能なパラメータを含んでいる。

［００６８］
識別されたソース信号を同期化させてフィルタリングした後、方法６０８は、同期化されたオーディオ入力とフィルタリングされたソース信号とを比較することによって、処理されたオーディオ信号を発生させるブロック８３０に進むことができる。１つの実施形態において、フィルタリングされたソース信号が、同期化されたオーディオ入力信号から減算される。図示すると、図４は、適応フィルタ４１２（１）の出力がオーディオ入力信号から減算されて、抑制されたノイズ１を有するオーディオ信号が発生されることを示している。１つの実施形態において、通信または音声認識のアプリケーションに対して、抑制されたノイズ１を有するオーディオ信号を処理することができる。別の実施形態では、さらなるノイズ抑制のために、抑制されたノイズ１を有するオーディオ信号を処理することができる。例えば、図４は、抑制されたノイズ１を有する処理されたオーディオ信号を、同期化ブロック４０２（２）〜４０２（ｎ）およびオーディオキャンセラ４０４（２）〜４０４（ｎ）に提供して、識別されたソース信号２〜ｎにより、付加的なノイズ２〜ｎを抑制できることを示している。

［００６９］
オプション的に、方法６０８は、ブロック８２０を実行した後に、適応フィルタ４１２（１）の調整可能なフィルタパラメータを調節して、広い範囲の音響効果に関してノイズ抑制を改善するブロック８４０に進むことができる。１つの実施形態では、調整可能なフィルタパラメータの調節は、適応則または更新則によって管理される。例えば、図４を参照すると、適応フィルタ４１４（１）は、同期化されたオーディオ入力信号と識別されたソース信号との両方を受け取る。適応フィルタ４１４（１）は、フィルタリングされたソース信号を発生させることができる。オーディオ入力信号とフィルタリングされたソース信号とを比較することによって、“エラー信号”または“リプレッサー信号”を発生させることができる。適応フィルタがオーディオノイズをどれだけ忠実に再現しているかを、エラー信号が示すことができる。例えば、オーディオ入力が実質的にオーディオノイズから構成されている場合、同期化されたオーディオ入力信号とフィルタリングされたソース信号との間の差異は、フィルタリングされた識別されたソース信号と、オーディオノイズとの間の不一致の量を示す。すなわち、小さなエラーは、適応フィルタが、ルーム中の実際の音響変化を忠実にモデリングしていることを示す。エラー信号を低減させる方法で、適応フィルタ４１２（１）の調整可能なフィルタパラメータを調節するために、（例えば、勾配または再帰的最小平均２乗法、または、これらに類する方法、に基づいて）適応則を選ぶことができる。

［００７０］
しかしながら、オーディオ入力信号が、識別されたソース信号１に対応するオーディオノイズから実質的に構成されていないときは、適応フィルタ４１４（１）は、その調整可能なパラメータを適切には調節しないかもしれない。例えば、ユーザの音声コマンド、または、第２のソースからのオーディオノイズを、オーディオ信号が含むことがある。このシチュエーションでは、例えば、オーディオノイズ１に関するルーム音響に、適応フィルタがどれだけ忠実に一致しているかの意義のある表示を、エラー信号は提供しないかもしれない。したがって、図４に関連して先述したように、ＤＴＤブロックがこのような条件を検出するときには、ＤＴＤ４１４（１）ブロックは適応フィルタの調節をオフにしてもよい。

［００７１］
先述したように、同期化およびフィルタリングのステップは、ｎ個のオーディオノイズをキャンセルするためのｎ個の識別されたソース信号を使用して実行することができる。特に、図４を参照すると、オーディオノイズはシーケンシャルにキャンセルされる。しかしながら、いくつかの実施形態では、ノイズをパラレルにキャンセルすることもできる。

［００７２］
図９は、実施形態にしたがった、オーディオノイズ抑制の特定の実例となる方法９００のフローダイヤグラムである。ブロック９０２において、方法９００は、入力オーディオ信号を受け取ることを含んでいる。ブロック９０２は、図６に関連して記述したように実行することができる。オーディオ入力信号の少なくとも一部を受け取った後に、方法９００は、別個のメディアデバイスによって発生されたノイズに関連する情報を受信するブロック９０４に進む。例えば、図２に関連して説明したように、オーディオ処理デバイス２０２は、オーディオ信号解析器モジュール２１６および通信モジュール２２０からの命令を実行することによって、別個のメディアデバイスと通信することができる。別個のメディアデバイスは、メディアコンテンツを有するノイズを別個のメディアデバイスが発生させているか否かの表示を、オーディオ処理デバイス２０２に提供するかもしれない。追加的または代替的に、別個のメディアデバイスはコンテンツ−識別情報を通信することができる。オーディオ処理デバイス２０２は、コンテンツ−識別情報を使用して、コンテンツソースをサーチするかもしれない。コンテンツ−識別情報の例には、ＴＶのチャンネル、ラジオの周波数、および、これらに類するメディアブロードキャスト選択情報が含まれる。１つの実施形態において、別個のメディアデバイスは、ソース信号をオーディオ処理デバイス２０２に送るかもしれない。

［００７３］
オーディオ処理デバイス２０２がノイズに関連する情報を受信した後に、方法９００は、別個のメディアデバイスによって発生されたノイズに関連する受信した情報に基づいて、ソース信号を受信するブロック９０６に進む。例えば、オーディオ処理デバイスが別個のメディアデバイスから、メディアデバイスがノイズを発生させていることの表示を受信する場合、または、オーディオ処理デバイス２０２がコンテンツ−識別情報を受信する場合、上述した図６、図７Ａ、および図７Ｂの方法６０４および６０６を実行することによって、オーディオ処理デバイス２０２はソース信号を受信することができる。いくつかの実施形態では、オーディオ処理デバイス２０２は、別個のメディアデバイスからソース信号を受信する。例えば、別個のメディアデバイスは、別個のメディアデバイスが再生させているメディアのコピーを送信することができる。

［００７４］
ソース信号を受信した後、方法９００は、ソース信号と入力オーディオ信号とを比較することに基づいて、ノイズを減衰させるブロック９０８に進むことができる。例えば、上述した図６および図８の方法６０８を実行することによって、オーディオ処理デバイス２０２は、オーディオノイズを減衰させる。

［００７５］
本技術は、多数の他の汎用または特別な目的の、コンピューティングシステムの環境またはコンフィギュレーションにより、動作可能である。発明での使用に適しているであろう、よく知られたコンピューティングシステム、環境、および／またはコンフィギュレーションの例は、パーソナルコンピュータ、サーバコンピュータ、ハンドヘルドデバイスまたはラップトップデバイス、マルチプロセッサシステム、プロセッサベースのシステム、プログラム可能なコンシューマエレクトロニクス、ネットワークＰＣ、ミニコンピュータ、メインフレームコンピュータ、上記のシステムまたはデバイスのいずれをも含む分散コンピューティング環境、ならびに、これらに類するものを含むが、これらに限定されない。

［００７６］
ここで使用されるように、命令は、システムで情報を処理するための、コンピュータで実現するステップを指す。命令はソフトウェア、ファームウェア、または、ハードウェアにおいて実現され、システムのコンポーネントにより行われるプログラムされたステップの任意のタイプを含むことができる。

［００７７］
プロセッサは、ＡＭＤ（登録商標）アスロン（登録商標）ＩＩまたはフェノム（登録商標）ＩＩプロセッサ、インテル（登録商標）ｉ３（登録商標）／ｉ５（登録商標）／ｉ７（登録商標）プロセッサ、インテルジーオン（登録商標）プロセッサ、あるいは、ＡＲＭ（登録商標）プロセッサの任意のインプリメンテーションのような、任意の従来の汎用シングルまたはマルチチッププロセッサであってもよい。加えて、プロセッサは、ＯＭＡＰプロセッサ、スナップドラゴン（登録商標）のようなクァルコム（登録商標）プロセッサ、あるいは、デジタル信号プロセッサまたはグラフィックプロセッサを含む、任意の従来の特別目的プロセッサであってもよい。プロセッサは、典型的に、従来のアドレス線、従来のデータ線、および１つ以上の従来の制御線を有する。

［００７８］
システムは、詳しく議論したように、さまざまなモジュールを備えている。当業者により認識できるように、モジュールのそれぞれが、さまざまなサブルーチン、手順、定義付け命令文、および、マクロを備えている。モジュールのそれぞれは、典型的に、単一の実行可能なプログラムに、別々にコンパイルされ、リンクされる。したがって、好ましいシステムの機能性を説明するために、モジュールのそれぞれの説明が便宜上、使用されている。これにより、モジュールのそれぞれにより経験されるプロセスは、他のモジュールのうちの１つに任意に再分配され、単一のモジュールに共に結合され、または、例えば共有可能な動的リンクライブラリで利用可能になってもよい。

［００７９］
システムは、Ｃ＃、Ｃ、Ｃ＋＋、ベーシック、パスカル、または、ジャバ（登録商標）のような、任意の従来のプログラミング言語で書かれてもよく、従来のオペレーティングシステムのもとで実行されてもよい。Ｃ＃、Ｃ、Ｃ＋＋、ベーシック、パスカル、ジャバ、および、フォートランは、実行可能なコードを生成させるために、多くの汎用コンパイラーが使用できる業界標準プログラミング言語である。システムは、パール、パイソン、または、ルビーのような翻訳言語も使用して、書かれてもよい。

［００８０］
ここで開示した実施形態に関連して説明した、さまざまな例示的な論理ブロック、モジュール、回路、および、アルゴリズムステップは、電子ハードウェア、コンピュータソフトウェア、または、双方を組み合わせたものとして実現してもよいことを、当業者はさらに認識するだろう。ハードウェアおよびソフトウェアのこの互換性を明確に図示するために、さまざまな例示的なコンポーネント、ブロック、モジュール、回路、および、ステップを、一般的に、これらの機能性に関して上記で説明している。このような機能性が、ハードウェアまたはソフトウェアとして実現されるか否かは、全体的なシステムに課せられている、特定のアプリケーションおよび設計制約に依存する。熟練者は、各特定のアプリケーションに対してさまざまな方法で、説明した機能性を実現するかもしれないが、このようなインプリメンテーションの決定は、本開示の範囲から逸脱が生じるとして解釈すべきでない。

［００８１］
ここで開示した実施形態に関連して説明したさまざまな例示的な、論理ブロック、モジュール、および、回路は、汎用プロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）または他のプログラマブル論理デバイス、ディスクリートゲートまたはトランジスタロジック、ディスクリートハードウェアコンポーネント、あるいは、ここに説明した機能を実行するように設計されたこれらの任意の組み合わせで、実現または実行してもよい。汎用プロセッサはマイクロプロセッサであってもよいが、代替実施形態では、プロセッサは、任意の従来のプロセッサ、制御装置、マイクロ制御装置、または、状態機械であってもよい。プロセッサはまた、例えば、ＤＳＰとマイクロプロセッサとの組み合わせ、複数のマイクロプロセッサ、ＤＳＰコアに関連する１つ以上のマイクロプロセッサ、または、他の何らかのこのようなコンフィギュレーションである、コンピューティングデバイスの組み合わせとして実現してもよい。

［００８２］
１つ以上の例示的な実施形態において、説明した機能および方法は、ハードウェア、プロセッサ上で実行される、ソフトウェア、または、ファームウェア、あるいは、これらの任意の組み合わせで実現してもよい。ソフトウェアで実現する場合、機能は、１つ以上の命令またはコードとしてコンピュータ読取可能媒体上に記憶されてもよく、または、１つ以上の命令またはコードとしてコンピュータ読取可能媒体上で送信されてもよい。コンピュータ読取可能媒体は、１つの場所から別の場所へのコンピュータプログラムの転送を促進する任意の媒体を含む、コンピュータ記憶媒体および通信媒体の両方を含む。記憶媒体は、コンピュータによってアクセスできる任意の利用可能な媒体であってもよい。限定ではなく例として、このようなコンピュータ読取可能媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ（登録商標）、ＣＤ−ＲＯＭまたは他の光ディスク記憶装置、磁気ディスク記憶装置または他の磁気記憶デバイス、あるいは、コンピュータによってアクセスできる命令またはデータ構造の形態で所望のプログラムコードを運ぶまたは記憶するために使用できる他の何らかの媒体を含むことができる。また、任意の接続は、コンピュータ読取可能媒体と適切に呼ばれる。例えば、ソフトウェアが、ウェブサイトから、サーバから、あるいは、同軸ケーブル、光ファイバケーブル、撚り対、デジタル加入者線（ＤＳＬ）、または、赤外線や、無線や、マイクロ波のようなワイヤレス技術を使用している他の遠隔ソースから送信された場合、同軸ケーブル、光ファイバケーブル、撚り対、ＤＳＬ、あるいは、赤外線や、無線や、マイクロ波のようなワイヤレス技術は、媒体の定義に含まれる。ここで使用するような、ディスク（ｄｉｓｋ）およびディスク（ｄｉｓｃ）は、コンパクトディスク（ＣＤ）、レーザーディスク（登録商標）、光ディスク、デジタル汎用ディスク（ＤＶＤ）、フロッピー（登録商標）ディスク、およびブルーレイディスクを含み、ここでディスク（ｄｉｓｋ）は通常、磁気的にデータを再生し、ディスク（ｄｉｓｃ）は、レーザーを用いて光学的にデータを再生する。上記の組み合わせもまた、コンピュータ読取可能媒体の範囲内に含まれるべきである。

［００８３］
上述の説明は、ここで開示したシステム、デバイス、および、方法のある実施形態を詳述している。しかしながら、どれほど詳細に上記をテキストに表したとしても、システム、デバイス、および、方法は、多くの方法で実施できると認識すべきである。上記でも述べたように、本発明のある特徴または態様を説明するとき、その専門用語が関係付けられている技術の特徴または態様の何らかの特定の特性を含むことに限定されるように、専門用語がここで再定義されることを、特定の専門用語の使用が意味しているとみなすべきではないことに着目すべきである。

［００８４］
さまざまな修正および変更が、説明した技術の範囲から逸脱することなくなされてもよいことが、当業者によって認識されるだろう。このような修正および変更は、実施形態の範囲内に入ることが意図されている。１つの実施形態中に含まれる部分は、他の実施形態と交換可能であり、描かれた実施形態からの１つ以上の部分は、他の描かれた実施形態との任意の組み合わせに含めることができると当業者によって認識されるだろう。例えば、ここで説明した、および／または、図中で描いた、さまざまなコンポーネントのうちのいずれかは、組み合わせてもよく、交換可能であってもよく、または、他の実施形態から除外してもよい。

［００８５］
ここでの任意の複数形および／または単数形の用語の実質的な使用に関して、当業者であれば、文脈および／または用途に適切なように、複数形から単数形へ、および／または、単数形から複数形へ変えることができる。さまざまな単数形／複数形の置き換えを、明瞭さのために、ここで明示的に述べる。

［００８６］
一般的に、ここで使用する用語は、「オープン」な用語（例えば、用語「含んでいる」は、「含んでいるが、これに限定されない」と解釈すべきであり、用語「有している」は、「少なくとも有している」と解釈すべきであり、用語「含む」は、「含むがこれに限定されない」と解釈すべきである等）として一般的に意図されていると当業者によって理解されるだろう。導入された請求項の記述の特定の数が意図されている場合、このような意図は請求項中に明示的に記載され、このような記述がない場合、このような意図は存在しないと当業者によってさらに理解されるだろう。例えば、理解を支援するために、以下に添付した特許請求の範囲は、請求項の記述を導入するために、導入フレーズ「少なくとも１つ」および「１つ以上」の使用を含んでいてもよい。しかしながら、このようなフレーズの使用は、同じ請求項が導入フレーズ「１つ以上」または「少なくとも１つ」および「ａ」または「ａｎ」のような不定冠詞を含むときでさえ、不定冠詞「ａ」または「ａｎ」による請求項の導入の記載は、このような導入された請求項の記述を含む任意の特定の請求項を、このような記述のみを含む実施形態に限定すると意味するように解釈すべきではなく（例えば、「ａ」および／または「ａｎ」は、典型的には、「少なくとも１つ」または「１つ以上」を意味するように解釈すべきである）、請求項の記述を導入するために使用される定冠詞の使用に対しても、同じことが当てはまる。加えて、導入された請求項の記述の特定の数が明示的に記載されている場合でさえ、このような記述は、少なくとも記載された数を意味する（例えば、他の修飾語なしの、「２つの記述」のそれだけの記述は、典型的に、少なくとも２つの記述または２つ以上の記述を意味する）ように典型的に解釈すべきであると当業者であれば認識するだろう。さらに、「Ａ、ＢおよびＣ等のうちの少なくとも１つ」に類似する伝統的表現法が使用される事例において、一般的に、このような構成は、当業者が伝統的表現法（例えば、「Ａ、ＢおよびＣのうちの少なくとも１つを有するシステム」は、Ａだけ、Ｂだけ、Ｃだけ、ＡおよびＢともに、ＡおよびＣともに、ＢおよびＣともに、ならびに／あるいは、Ａ、ＢおよびＣともに等を含むがこれらに限定されない）を理解する意味で意図されている。「Ａ、ＢまたはＣ等のうちの少なくとも１つ」に類似する伝統的表現法が使用される事例において、一般的に、このような構成は、当業者が伝統的表現法（例えば、「Ａ、ＢまたはＣのうちの少なくとも１つを有するシステム」は、Ａだけ、Ｂだけ、Ｃだけ、ＡおよびＢともに、ＡおよびＣともに、ＢおよびＣともに、ならびに／あるいは、Ａ、ＢおよびＣともに等を含むがこれらに限定されない）を理解する意味で意図されている。２つ以上の代替用語を提示する、実質的に離接的な任意の単語および／またはフレーズは、説明、特許請求の範囲、または図面中であろうとなかろうと、用語のうちの１つ、用語のうちのいずれか、または、両方の用語を含む可能性を企図していると理解すべきであると、当業者によってさらに理解されるだろう。例えば、フレーズ「ＡまたはＢ」は、「Ａ」または「Ｂ」あるいは「ＡおよびＢ」の可能性を含んでいると理解されるだろう。

［００８７］
さまざまな態様および実施形態をここで開示したが、他の態様および実施形態も当業者にとって明らかだろう。ここで開示したさまざまな態様および実施形態は、実例目的であり、限定することを意図してはいない。

［００８７］
さまざまな態様および実施形態をここで開示したが、他の態様および実施形態も当業者にとって明らかだろう。ここで開示したさまざまな態様および実施形態は、実例目的であり、限定することを意図してはいない。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
［１］オーディオノイズを減衰させるデバイスにおいて、
前記デバイスは、
入力オーディオ信号を受け取るように構成されているマイクロフォンと、
識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定するように構成され、識別可能なコンテンツを有するノイズ信号が存在する場合に、コンテンツソースにアクセスして、前記ノイズ信号のコピーを取得するオーディオ信号解析器と、
前記ノイズ信号のコピーと前記入力オーディオ信号とを比較することに基づいて、減衰されたノイズ信号を有する処理されたオーディオ信号を発生させるように構成されているオーディオキャンセラとを具備するデバイス。
［２］前記オーディオ信号解析器は、別個のメディアデバイスによって発生されたノイズ信号に対して識別可能なコンテンツを有するノイズ信号を、前記入力オーディオ信号が含むか否かの決定を実行するように構成されている［１］記載のデバイス。
［３］通信インターフェースをさらに具備し、
前記オーディオ信号解析器は、
前記入力オーディオ信号の特徴情報を決定するようにと、
前記通信インターフェースを使用して、前記特徴情報を送信するようにと、
前記通信インターフェースを使用して、前記特徴情報を送信することに少なくとも基づいて、前記ノイズ信号のコピーを受信するようにさらに構成されている［１］記載のデバイス。
［４］前記オーディオ信号解析器は、
前記通信インターフェースを使用して、前記特徴情報を提供することに応答したコンテンツ−識別情報を受信するようにと、
前記受信したコンテンツ−識別情報と前記コンテンツソースとの一致に基づいて、前記コンテンツソースを発見するために前記デバイスをサーチするようにと、
前記サーチが結果として前記コンテンツソースに一致する場合に、前記ノイズ信号のコピーを前記コンテンツソースから発生させるようにさらに構成されている［３］記載のデバイス。
［５］前記オーディオ信号解析器は、
前記入力オーディオ信号の特徴情報を決定するように構成されている特徴抽出器と、
前記特徴情報に関係付けられているコンテンツ−識別情報を決定するように構成されているコンテンツ識別器と、
前記コンテンツ−識別情報と前記コンテンツソースとの一致に基づいて、前記コンテンツソースを発見するためにデータベースをサーチするように構成されているソースサーチャーと、
前記サーチが前記コンテンツソースを位置特定する場合に、前記ノイズ信号のコピーを前記コンテンツソースから発生させるように構成されているソース送信機とを備える［１］記載のデバイス。
［６］前記入力オーディオ信号と前記ノイズ信号のコピーとのうちの少なくとも１つを遅延させるように構成されている信号同期器をさらに具備し、
前記オーディオキャンセラは、
調整可能なフィルタパラメータを有し、同期化されたノイズ信号のコピーと前記調整可能なフィルタパラメータとに基づいて、フィルタリングされたノイズ信号を発生させるように構成され、同期化された入力オーディオ信号と前記同期化されたノイズ信号のコピーとを比較することに基づいて、前記調整可能なフィルタパラメータを調節するように構成されている適応フィルタと、
前記ノイズ信号のコピーに加えて別の信号を前記入力オーディオ信号が有することをダブルトーク検出器が検出するときに、前記適応フィルタの前記調整可能なフィルタパラメータの調節をディセーブルするように構成されている、前記適応フィルタのダブルトーク検出器とを備え、
前記オーディオキャンセラは、前記フィルタリングされたノイズ信号と前記同期化された入力オーディオ信号とを比較することによって、前記ノイズ信号のコピーと前記入力オーディオ信号とを比較する［１］記載のデバイス。
［７］前記デバイスと別個のメディアデバイスとの間の通信チャネル上でデータを通信するように構成されている通信モジュールをさらに具備し、
前記通信モジュールは、前記ノイズ信号のコピーの少なくとも一部を、前記別個のメディアデバイスから受信する［１］記載のデバイス。
［８］前記デバイスと別個のメディアデバイスとの間の通信チャネル上でデータを通信するように構成されている通信モジュールをさらに具備し、
前記ソース通信モジュールは、前記コンテンツソースに対応するコンテンツ−識別データを受信する［１］記載のデバイス。
［９］オーディオノイズを減衰させる方法において、
前記方法は、
入力オーディオ信号を受け取ることと、
識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定することと、
識別可能なコンテンツを有するノイズ信号が存在する場合に、コンテンツソースにアクセスして、前記ノイズ信号のコピーを取得することと、
前記ノイズ信号のコピーと前記入力オーディオ信号とを比較することに基づいて、減衰されたノイズ信号を有する処理されたオーディオ信号を発生させることとを含む方法。
［１０］前記識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定するステップは、別個のメディアデバイスによって発生されて、識別可能なコンテンツを有するノイズ信号を、前記入力オーディオ信号が含むか否かを決定することを含む［９］記載の方法。
［１１］前記識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定するステップは、
前記入力オーディオ信号の特徴情報を決定することと、
前記特徴情報を送信することとを含み、
前記ノイズ信号のコピーにアクセスするステップは、前記特徴情報を送信することに少なくとも基づいて、前記ノイズ信号のコピーを受信することを含む［９］記載の方法。
［１２］前記識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定するステップは、
前記特徴情報を提供することに応答したコンテンツ−識別情報を受信することと、
前記受信したコンテンツ−識別情報と前記コンテンツソースとの一致に基づいて、前記コンテンツソースを発見するためにデバイスをサーチすることと、
前記サーチが結果として前記コンテンツソースに一致する場合に、前記ノイズ信号のコピーを前記コンテンツソースから発生させることとを含む［１１］記載の方法。
［１３］前記識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定するステップは、
前記入力オーディオ信号の特徴情報を決定することと、
前記特徴情報に関係付けられているコンテンツ−識別情報を決定することと、
前記コンテンツ−識別情報と前記コンテンツソースとの一致に基づいて、前記コンテンツソースを発見するためにデータベースをサーチすることと、
前記サーチが前記コンテンツソースを位置特定する場合に、前記ノイズ信号のコピーを前記コンテンツソースから発生させることとを含む［９］記載の方法。
［１４］前記入力オーディオ信号と前記ノイズ信号のコピーとのうちの少なくとも１つを遅延させて、前記入力オーディオ信号と前記ノイズ信号のコピーとを同期化させることをさらに含み、
前記処理されたオーディオ信号を発生させるステップは、
調整可能なフィルタパラメータを有する適応フィルタを使用して、同期化されたノイズ信号のコピーと前記調整可能なフィルタパラメータとに基づいて、フィルタリングされたノイズ信号を発生させることと、
同期化された入力オーディオ信号と前記同期化されたノイズ信号のコピーとを比較することに基づいて、前記調整可能なフィルタパラメータを選択的に調節することと、
前記ノイズ信号に加えて別の信号を前記入力オーディオ信号が有するか否かを決定することと、
前記ノイズ信号に加えて別の信号を前記入力オーディオ信号が有することが決定されたときに、前記適応フィルタの前記調整可能なフィルタパラメータの調節をディセーブルすることとを含み、
前記ノイズ信号と前記入力オーディオ信号とを比較することによって、前記ノイズ信号のコピーと前記入力オーディオ信号とを比較することは、前記フィルタリングされたノイズ信号と前記同期化された入力オーディオ信号とを比較することを含む［９］記載の方法。
［１５］別個のメディアデバイスとの通信チャネル上でデータを通信して、前記ノイズ信号のコピーの少なくとも一部を、前記別個のメディアデバイスから受信することをさらに含む［９］記載の方法。
［１６］別個のメディアデバイスへの通信チャネル上でデータを通信して、前記コンテンツソースに対応するコンテンツ−識別データを受信することをさらに含む［９］記載の方法。
［１７］命令を記憶する非一時的コンピュータ読み取り可能媒体において、
前記命令は、実行されるときに、
入力オーディオ信号を受け取ることと、
識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定することと、
識別可能なコンテンツを有するノイズ信号が存在する場合に、コンテンツソースにアクセスして、前記ノイズ信号のコピーを取得することと、
前記ノイズ信号のコピーと前記入力オーディオ信号とを比較することに基づいて、減衰されたノイズ信号を有する処理されたオーディオ信号を発生させることとを含む方法を、プロセッサに実行させる非一時的コンピュータ読み取り可能媒体。
［１８］前記命令は、実行されるときに、
前記入力オーディオ信号の特徴情報を決定することと、
通信インターフェースを使用することによって、前記特徴情報を送信することと、
前記通信インターフェースを使用することによって、前記特徴情報を送信することに少なくとも基づいて、前記ノイズ信号のコピーを受信することとをさらに含む方法を実行する［１７］記載の非一時的コンピュータ読み取り可能媒体。
［１９］オーディオノイズを減衰させる装置において、
前記装置は、
入力オーディオ信号を受け取る手段と、
識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定して、識別可能なコンテンツを有するノイズ信号が存在する場合に、コンテンツソースに選択的にアクセスして、前記ノイズ信号のコピーを取得する手段と、
前記ノイズ信号のコピーと前記入力オーディオ信号とを比較することに基づいて、減衰されたノイズ信号を有する処理されたオーディオ信号を発生させる手段とを具備する装置。
［２０］前記決定する手段は、
特徴情報に関係付けられているコンテンツ−識別情報を決定する手段と、
前記コンテンツ−識別情報と前記コンテンツソースとの一致に基づいて、前記コンテンツソースを発見するためにデータベースをサーチする手段と、
前記サーチが前記コンテンツソースを位置特定する場合に、前記ノイズ信号のコピーを前記コンテンツソースから発生させる手段とを備える［１９］記載の装置。

Claims

オーディオノイズを減衰させるデバイスにおいて、
前記デバイスは、
入力オーディオ信号を受け取るように構成されているマイクロフォンと、
識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定するように構成され、識別可能なコンテンツを有するノイズ信号が存在する場合に、コンテンツソースにアクセスして、前記ノイズ信号のコピーを取得するオーディオ信号解析器と、
前記ノイズ信号のコピーと前記入力オーディオ信号とを比較することに基づいて、減衰されたノイズ信号を有する処理されたオーディオ信号を発生させるように構成されているオーディオキャンセラとを具備するデバイス。
前記オーディオ信号解析器は、別個のメディアデバイスによって発生されたノイズ信号に対して識別可能なコンテンツを有するノイズ信号を、前記入力オーディオ信号が含むか否かの決定を実行するように構成されている請求項１記載のデバイス。
通信インターフェースをさらに具備し、
前記オーディオ信号解析器は、
前記入力オーディオ信号の特徴情報を決定するようにと、
前記通信インターフェースを使用して、前記特徴情報を送信するようにと、
前記通信インターフェースを使用して、前記特徴情報を送信することに少なくとも基づいて、前記ノイズ信号のコピーを受信するようにさらに構成されている請求項１記載のデバイス。
前記オーディオ信号解析器は、
前記通信インターフェースを使用して、前記特徴情報を提供することに応答したコンテンツ−識別情報を受信するようにと、
前記受信したコンテンツ−識別情報と前記コンテンツソースとの一致に基づいて、前記コンテンツソースを発見するために前記デバイスをサーチするようにと、
前記サーチが結果として前記コンテンツソースに一致する場合に、前記ノイズ信号のコピーを前記コンテンツソースから発生させるようにさらに構成されている請求項３記載のデバイス。
前記オーディオ信号解析器は、
前記入力オーディオ信号の特徴情報を決定するように構成されている特徴抽出器と、
前記特徴情報に関係付けられているコンテンツ−識別情報を決定するように構成されているコンテンツ識別器と、
前記コンテンツ−識別情報と前記コンテンツソースとの一致に基づいて、前記コンテンツソースを発見するためにデータベースをサーチするように構成されているソースサーチャーと、
前記サーチが前記コンテンツソースを位置特定する場合に、前記ノイズ信号のコピーを前記コンテンツソースから発生させるように構成されているソース送信機とを備える請求項１記載のデバイス。
前記入力オーディオ信号と前記ノイズ信号のコピーとのうちの少なくとも１つを遅延させるように構成されている信号同期器をさらに具備し、
前記オーディオキャンセラは、
調整可能なフィルタパラメータを有し、同期化されたノイズ信号のコピーと前記調整可能なフィルタパラメータとに基づいて、フィルタリングされたノイズ信号を発生させるように構成され、同期化された入力オーディオ信号と前記同期化されたノイズ信号のコピーとを比較することに基づいて、前記調整可能なフィルタパラメータを調節するように構成されている適応フィルタと、
前記ノイズ信号のコピーに加えて別の信号を前記入力オーディオ信号が有することをダブルトーク検出器が検出するときに、前記適応フィルタの前記調整可能なフィルタパラメータの調節をディセーブルするように構成されている、前記適応フィルタのダブルトーク検出器とを備え、
前記オーディオキャンセラは、前記フィルタリングされたノイズ信号と前記同期化された入力オーディオ信号とを比較することによって、前記ノイズ信号のコピーと前記入力オーディオ信号とを比較する請求項１記載のデバイス。
前記デバイスと別個のメディアデバイスとの間の通信チャネル上でデータを通信するように構成されている通信モジュールをさらに具備し、
前記通信モジュールは、前記ノイズ信号のコピーの少なくとも一部を、前記別個のメディアデバイスから受信する請求項１記載のデバイス。
前記デバイスと別個のメディアデバイスとの間の通信チャネル上でデータを通信するように構成されている通信モジュールをさらに具備し、
前記ソース通信モジュールは、前記コンテンツソースに対応するコンテンツ−識別データを受信する請求項１記載のデバイス。
オーディオノイズを減衰させる方法において、
前記方法は、
入力オーディオ信号を受け取ることと、
識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定することと、
識別可能なコンテンツを有するノイズ信号が存在する場合に、コンテンツソースにアクセスして、前記ノイズ信号のコピーを取得することと、
前記ノイズ信号のコピーと前記入力オーディオ信号とを比較することに基づいて、減衰されたノイズ信号を有する処理されたオーディオ信号を発生させることとを含む方法。
前記識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定するステップは、別個のメディアデバイスによって発生されて、識別可能なコンテンツを有するノイズ信号を、前記入力オーディオ信号が含むか否かを決定することを含む請求項９記載の方法。
前記識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定するステップは、
前記入力オーディオ信号の特徴情報を決定することと、
前記特徴情報を送信することとを含み、
前記ノイズ信号のコピーにアクセスするステップは、前記特徴情報を送信することに少なくとも基づいて、前記ノイズ信号のコピーを受信することを含む請求項９記載の方法。
前記識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定するステップは、
前記特徴情報を提供することに応答したコンテンツ−識別情報を受信することと、
前記受信したコンテンツ−識別情報と前記コンテンツソースとの一致に基づいて、前記コンテンツソースを発見するためにデバイスをサーチすることと、
前記サーチが結果として前記コンテンツソースに一致する場合に、前記ノイズ信号のコピーを前記コンテンツソースから発生させることとを含む請求項１１記載の方法。
前記識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定するステップは、
前記入力オーディオ信号の特徴情報を決定することと、
前記特徴情報に関係付けられているコンテンツ−識別情報を決定することと、
前記コンテンツ−識別情報と前記コンテンツソースとの一致に基づいて、前記コンテンツソースを発見するためにデータベースをサーチすることと、
前記サーチが前記コンテンツソースを位置特定する場合に、前記ノイズ信号のコピーを前記コンテンツソースから発生させることとを含む請求項９記載の方法。
前記入力オーディオ信号と前記ノイズ信号のコピーとのうちの少なくとも１つを遅延させて、前記入力オーディオ信号と前記ノイズ信号のコピーとを同期化させることをさらに含み、
前記処理されたオーディオ信号を発生させるステップは、
調整可能なフィルタパラメータを有する適応フィルタを使用して、同期化されたノイズ信号のコピーと前記調整可能なフィルタパラメータとに基づいて、フィルタリングされたノイズ信号を発生させることと、
同期化された入力オーディオ信号と前記同期化されたノイズ信号のコピーとを比較することに基づいて、前記調整可能なフィルタパラメータを選択的に調節することと、
前記ノイズ信号に加えて別の信号を前記入力オーディオ信号が有するか否かを決定することと、
前記ノイズ信号に加えて別の信号を前記入力オーディオ信号が有することが決定されたときに、前記適応フィルタの前記調整可能なフィルタパラメータの調節をディセーブルすることとを含み、
前記ノイズ信号と前記入力オーディオ信号とを比較することによって、前記ノイズ信号のコピーと前記入力オーディオ信号とを比較することは、前記フィルタリングされたノイズ信号と前記同期化された入力オーディオ信号とを比較することを含む請求項９記載の方法。
別個のメディアデバイスとの通信チャネル上でデータを通信して、前記ノイズ信号のコピーの少なくとも一部を、前記別個のメディアデバイスから受信することをさらに含む請求項９記載の方法。
別個のメディアデバイスへの通信チャネル上でデータを通信して、前記コンテンツソースに対応するコンテンツ−識別データを受信することをさらに含む請求項９記載の方法。
命令を記憶する非一時的コンピュータ読み取り可能媒体において、
前記命令は、実行されるときに、
入力オーディオ信号を受け取ることと、
識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定することと、
識別可能なコンテンツを有するノイズ信号が存在する場合に、コンテンツソースにアクセスして、前記ノイズ信号のコピーを取得することと、
前記ノイズ信号のコピーと前記入力オーディオ信号とを比較することに基づいて、減衰されたノイズ信号を有する処理されたオーディオ信号を発生させることとを含む方法を、プロセッサに実行させる非一時的コンピュータ読み取り可能媒体。
前記命令は、実行されるときに、
前記入力オーディオ信号の特徴情報を決定することと、
通信インターフェースを使用することによって、前記特徴情報を送信することと、
前記通信インターフェースを使用することによって、前記特徴情報を送信することに少なくとも基づいて、前記ノイズ信号のコピーを受信することとをさらに含む方法を実行する請求項１７記載の非一時的コンピュータ読み取り可能媒体。
オーディオノイズを減衰させる装置において、
前記装置は、
入力オーディオ信号を受け取る手段と、
識別可能なコンテンツを有するノイズ信号を前記入力オーディオ信号が含むか否かを決定して、識別可能なコンテンツを有するノイズ信号が存在する場合に、コンテンツソースに選択的にアクセスして、前記ノイズ信号のコピーを取得する手段と、
前記ノイズ信号のコピーと前記入力オーディオ信号とを比較することに基づいて、減衰されたノイズ信号を有する処理されたオーディオ信号を発生させる手段とを具備する装置。
前記決定する手段は、
特徴情報に関係付けられているコンテンツ−識別情報を決定する手段と、
前記コンテンツ−識別情報と前記コンテンツソースとの一致に基づいて、前記コンテンツソースを発見するためにデータベースをサーチする手段と、
前記サーチが前記コンテンツソースを位置特定する場合に、前記ノイズ信号のコピーを前記コンテンツソースから発生させる手段とを備える請求項１９記載の装置。