JP6574529B2

JP6574529B2 - 音声通信システム及び方法

Info

Publication number: JP6574529B2
Application number: JP2018541467A
Authority: JP
Inventors: シンシァォゾン; イートンファン
Original assignee: Individual
Current assignee: Individual
Priority date: 2016-02-04
Filing date: 2016-02-04
Publication date: 2019-09-11
Anticipated expiration: 2036-02-04
Also published as: US10460744B2; US20180226086A1; JP2018538765A; US10706871B2; WO2017132958A1; CN105940445A; CN105940445B; US20200027472A1

Description

本開示は、音声通信システム及び方法に関する。特に、センサが埋め込まれたウェアラブル装置を活用した音声通信システム及び方法の提供に関する。

音声制御の応用はより広がりを見せている。例えば、携帯電話、自動車ナビゲーションシステム等の電子装置において音声による制御が多くなってきている。より具体的には、例えば、上述の音声制御の応用では、ユーザーがマイクに音声コマンド（例：単語、または、フレーズ）を話しかけると、電子装置がその音声コマンドを受け付けて、当該音声コマンドに応じた動作を行う。このような音声制御機能は、原動機付き車両、航空機等を操作するユーザー等、ハンズフリーが望まれるユーザーにとって望ましい機能である。

音声通信のためのシステム及び方法を開示する。一部の実施形態において、音声通信システムを提供する。前記システムは、音響入力を捕捉（capture）して、当該音響入力に基づいて第１オーディオ信号を生成する第１オーディオセンサを備え、前記第１オーディオセンサは、織物構造体の第１面と第２面との間に配置されている。

一部の実施形態において、前記第１オーディオセンサはシリコンウエハに形成されたマイクである。

一部の実施形態において、前記マイクロフォンは微小電気機械システム（ＭＥＭＳ）マイクロフォンである。

一部の実施形態において、前記第１オーディオセンサは、前記織物構造体の前記第１面と前記第２面との間に位置する領域に配置されている。

一部の実施形態において、前記第１オーディオセンサは、前記織物構造体の前記第１面と前記第２面との間に位置する通路に配置されている。

一部の実施形態において、前記システムは、音響入力を捕捉して、当該音響入力に基づいて第２オーディオ信号を生成する第２オーディオセンサを更に備え、前記織物構造体は第２通路を備え、前記第２オーディオセンサは少なくとも部分的に前記第２通路に配置されている。

一部の実施形態において、前記第１通路は前記第２通路と平行である。

一部の実施形態において、前記第１オーディオセンサ及び前記第２オーディオセンサが、オーディオセンサの差分サブアレイを形成している。

一部の実施形態において、システムは更に前記第１オーディオ信号と前記第２オーディオ信号とに基づいてスピーチ信号を生成するプロセッサを有している。

上記実施形態において、前記織物構造体は複数の層を有している。前記複数の層には、第１の層と第２の層が含まれている。

一部の実施形態において、前記第１オーディオセンサと前記第２オーディオセンサの少なくとも１つが、前記織物構造体の第１層に埋め込まれている。

一部の実施形態において、前記第１オーディオセンサに関連する回路の少なくとも一部が、前記織物構造体の第１層に埋め込まれている。

一部の実施形態において、前記第１オーディオセンサに関連する回路の少なくとも一部が、前記織物構造体の第２層に埋め込まれている。

一部の実施形態において、前記織物構造体の前記第１面と第２面との距離は２．５ｍｍ以下である。

一部の実施形態において、前記距離は前記織物構造体の最大厚みを表している。

一部の実施形態において、前記スピーチ信号を生成するために、前記プロセッサは更に、前記第１オーディオ信号と前記第２オーディオ信号とを組み合わせて出力信号を生成し、前記出力信号にエコー消去を実施する。

一部の実施形態において、前記エコー消去を行うために、前記プロセッサは更に、音響経路を表すモデルを構築し、前記モデルに基づいて前記出力信号の成分を推定する。

一部の実施形態において、前記プロセッサは更に、前記第２オーディオ信号に遅延処理をかけて、遅延オーディオ信号を生成し、前記第１オーディオ信号と遅延オーディオ信号とを組み合わせて出力信号を生成する。

参照符号により各要素が示される以下の図面と以下に記す本開示の詳細の説明を参照することによって、本開示の種々の目的、特徴点、効果を更に理解することができるであろう。

本発明の実施形態における、音声通信システムの実施例を示す図である。本発明の実施形態における、センサが埋め込まれた織物構造体の例を示す図である。本発明の実施形態における、センサが埋め込まれた織物構造体の例を示す図である。本発明の実施形態におけるプロセッサの例を示す図である。本発明の実施形態におけるビームフォーマの例を示す模式図である。本発明の実施形態における音響エコー消去部の例を示す図である。本発明の実施形態における音響エコー消去部の例を示す図である。本発明の実施形態における、音声通信用の音声信号を処理する工程の例を示すフローチャートである。本発明の実施形態の空間フィルタ用の処理の例を示すフローチャートである。本発明の実施形態におけるエコー消去処理の例を示すフローチャートである。本発明の実施形態におけるマルチチャンネルノイズリダクション処理の例を示すフローチャートである。本発明の実施形態における、ウェアラブル装置に埋め込まれたオーディオセンサのサブアレイの図を示す図である。本発明の実施形態における音声通信システムの例を示す図である。本発明の実施形態におけるウェアラブル装置の例を示す断面図である。本発明の実施形態における、ウェアラブル装置に利用可能な織物構造体の例を示す図である。本発明の実施形態における１つ以上のセンサに関連付けられた回路の例を示す図である。本発明の実施形態における１つ以上のセンサに関連付けられた回路の例を示す図である。

以下に更に詳細に記載する各実施例に基づいて、音声通信用のシステム、方法、及び、媒体を含む構造が提供される。

一部の実施形態において、前記構造は、センサが埋め込まれたウェアラブル装置を活用した音声通信システムを提供する。前記ウェアラブル装置は、ユーザーの一部分以上の箇所に取り付けられる装置であってもよく、及び／又は、そのような装置を含んでいてもよい。例えば、前記ウェアラブル装置は、シートベルト、安全ベルト、フィルム、建築ハーネス、ウェアラブル演算装置、ヘルメット、ヘルメットストラップ、頭部搭載装置、バンド（例：リストバンド）等であってもよく、これらの組み合わせであってもよく、及び／又は、それらを含む装置であってもよい。

前記ウェアラブル装置は、１つ以上のセンサが埋め込まれた織物構造体を１つ以上含んでいてもよい。例えば、織物構造体は、シートベルト、安全ベルトなどの帯紐であってもよい。前記１つ以上の埋込センサは、音声信号、温度、脈拍、血圧、心拍数、呼吸数、心電図、筋電図に関する情報、物体の移動、ユーザの位置情報、及び／又は、その他の情報を捕捉することができる。

前記織物構造体は、一又は複数のセンサを埋め込み可能な任意の適切な材料で作製可能であり、例えば、布（例えば、織布、不織布、導電性生地、非導電性生地等）、帯紐、繊維、織物、強化フィルム、プラスチック、プラスチックフィルム、ポリウレタン、シリコーンゴム、金属、セラミックス、ガラス、膜、紙、カード用紙、ポリマー、ポリエステル、ポリイミド、ポリエチレンテレフタレート、可撓性材料、圧電材料、カーボンナノチューブ、バイオニック材料、及び／又は、埋込センサを有する織物構造体が製造可能なその他の任意の適切な材料で作製可能である。また、前記織物構造体は、導電性材料（例えば、導電性糸、導電性生地、導電性トレッド（tread）、導電性繊維等）、非導電性材料（例えば、非導電性生地、非導電性エポキシなど）、及び／又は、その他の導電性材料で作製されていてもよい。

１つ以上のセンサ（例えば、マイク、生体センサ等）が、織物構造体に埋め込まれていてよい。例えば、センサが織物構造体の第１面と第２面との間に配置されていてよい（例えば、自動車両内の人に対向するシートベルトの内面と、シートベルトの外面との間等）。より具体的には、織物構造体の第１面と第２面との間には通路が設けられていてよい。センサ、及び／又は、それに関連する回路は、前記通路内に配置されていてよい。通路は、一部分以上が中空であってよい。別のより具体的な例では、センサ及び／又はその関連回路の一部分以上が、繊維構造体の第１面と第２面との間に位置する織物構造体の領域に配置されており、センサ及びその関連回路が織物構造体に完全に埋め込まれている。このように、埋め込まれたセンサは、織物構造体の厚さ、及び／又は、外観を変更する必要がない場合がある。したがって、織物構造体の厚さは、埋め込まれたセンサが無い場合の織物構造体の厚さと同じであることもある。織物構造体の両面は滑らかな面であってよい。

織物構造体は、１つ以上の層を有していてよい。各層は、１つ以上のオーディオセンサ、回路、及び／又は、一又は複数のオーディオセンサ、一又は複数のプロセッサ、及び／又は、その他の任意の適切なコンポーネントに関連付けられた任意の他のハードウェアを含むことができる。例えば、１つ以上のオーディオセンサ、及び、それらに関連する回路、及び／又は、ハードウェアが織物構造体の第１層に埋め込まれていてよい。別の例として、１つ以上のオーディオセンサが織物構造体の第１層に埋め込まれていてよい。これらに関連する回路の一部分以上は、織物構造体の１つ以上の層の別の層（例えば、第２層、第３層等）に埋め込まれていてよい。

一部の実施形態において、音声通信を行いやすくするために、複数のオーディオセンサ（例えば、マイクロフォン）が織物構造体に埋め込まれていてよい。オーディオセンサは、オーディオセンサのアレイ（本明細書では「マイクアレイ」とも称す）を形成するように配置されていてよい。マイクアレイは、オーディオセンサのサブアレイ（本明細書では「マイクサブアレイ」とも呼ばれる）を１つ以上含むことができる。一部の実施形態において、マイクサブアレイは、織物構造体の１つ以上の長手方向の線に沿って配置されていてよい。例えば、マイクサブアレイは、織物構造体に沿って長手方向に延在する織物構造体の複数の通路に配置されていてよい。通路は互いに平行であっても平行でなくてよい。通路は、織物構造体の様々な位置に配置されていてよい。

マイクサブアレイは、織物構造体内に埋め込まれたオーディオセンサを１つ以上含んでいてよい。一部の実施形態において、マイクサブアレイは差動型指向性マイクロフォンシステム（differential directional microphone system）を構成可能な２つのオーディオセンサ（例えば、第１オーディオセンサ、及び、第２オーディオセンサ）を含んでいてよい。一部の実施形態において、第１オーディオセンサ及び第２オーディオセンサは、織物構造体の断面線に沿って配置されていてよい。前記第１オーディオセンサと第２オーディオセンサは、音響入力（例えば、ユーザーの音声に対応する成分を含む入力信号）を示す第１オーディオ信号と第２オーディオ信号とを生成することができる。第１オーディオ信号及び第２オーディオ信号が（ビームフォーミング、空間フィルタ、及び／又は、他の適切な技術を１つ以上使用することにより）処理されることにより、特定の指向特性を有するマイクサブアレイの出力が生成されてもよい。

以下でより詳細に説明するように、マイクサブアレイの出力は、マイクサブアレイの幾何学配置（例えば、ユーザに対する第１マイク、及び／又は、第２マイクの具体的な位置）、及び／又は、音源の位置（例えば、ユーザ、又は、ユーザの口の位置）の情報無しで生成されてよい。したがって、マイクの出力は、マイクサブアレイの幾何学配置が変化したとき（例えば、ユーザの位置が移動するとき、織物構造体が曲がるとき等）に特定の指向特性を達成するように生成されてよい。

一部の実施形態において、複数のマイクサブアレイを用いて音響入力を表す複数の出力信号を生成してよい。前記構成において、１つ以上の出力信号を処理することにより、音響入力のスピーチ成分（例えば、ユーザの音声）を表すスピーチ信号を生成することができる。例えば、前記構成は、１つ以上の出力信号にエコー消去を行い、複数の出力信号のエコー及び／又はフィードバック成分を低減、及び／又は、消去することができる。別の例として、前記構成は、１つ以上の出力信号（例えば、特定のオーディオチャネルに対応する１つ以上の出力信号）に対してマルチチャネルノイズリダクションを実行することができる。さらに別の例として、前記構成は、１つ以上の出力信号に対して残留ノイズ、及び／又は、エコー抑圧を実行することができる。

上述の構成は、さらに音声信号を処理することにより、様々な機能をユーザに提供できるようにしてよい。例えば、前記構成は、スピーチ信号を解析することにより（例えば、１つ以上の適切な音声認識技術、及び／又は、その他の任意の信号処理技術を使用して）、スピーチ信号の内容を判断してよい。その後、前記構成は、音声信号の解析された内容に基づいて１つ以上の動作を実行してよい。例えば、前記構成は、解析された内容に基づいてメディアコンテンツ（例えば、オーディオコンテンツ、ビデオコンテンツ、画像、グラフィックス、テキスト等）を提示することができる。より具体的には、例えば、メディアコンテンツは、地図、ウェブコンテンツ、ナビゲーション情報、ニュース、オーディオクリップ、及び／又は、スピーチ信号の内容に関連する他の情報に関連するものであってよい。別の例として、前記構成は、前記構成を実装するアプリケーション、及び／又は、他のアプリケーションを用いて、ユーザのために電話をかけることができる。さらに別の例として、前記構成は、スピーチ信号に基づいてメッセージの送受信等を行うことができる。さらに別の例として、前記構成は、（例えば、検索を実行可能なサーバに要求を送ることにより）解析されたコンテンツの検索を実行することができる。

したがって、本開示によって、ハンズフリーな通信体験をユーザに提供可能な音声通信システムを実装する構成が提供される。前記音声通信システムは、ユーザの車内体験を向上させるために車両に実装してよい。

以下、図１〜１６を参照して、検出されたオーディオイベントに基づいてメディアコンテンツを巻き戻すための上記特徴、及び、その他の特徴を説明する。

図１は、本発明の実施形態における、音声通信システムの実施例１００を示す図である。

図に示すように、システム１００は、本開示内容に従ってオーディオ信号を処理するための１つ以上のオーディオセンサ１１０、一又は複数のプロセッサ１２０、一又は複数のコントローラ１３０、通信ネットワーク１４０、及び／又は、その他の適切なコンポーネントを含んでいてよい。

一又は複数のオーディオセンサ１１０は、音響入力の受信、音響入力の処理、音響入力に基づく１つ以上のオーディオ信号の生成、オーディオ信号の処理、及び／又は、他の適切な機能を実行可能な装置であればよい。オーディオ信号は、１つ以上のアナログ信号、及び／又は、デジタル信号を含んでいればよい。各オーディオセンサ１１０は、アナログ−デジタル変換器（ＡＤＣ）を含んでもいてよく、含んでいなくてもよい。

各オーディオセンサ１１０は、レーザマイクロフォン、コンデンサマイクロフォン、シリコンマイクロフォン（例えば、微小電気機械システム（ＭＥＭＳ）マイクロフォン）など、またはそれらの任意の組み合わせなどの任意の適切なタイプのマイクロフォンであるか、及び／又は、これらを含んでいてもよい。一部の実施形態において、シリコンマイクロフォン（マイクロフォンチップとも称す）は、感圧ダイアフラムをシリコンウエハに直接エッチングすることによって製造されたものであってよい。この製造工程に関わる幾何学は、ミクロンのレベル（例えば、１０^-６メートル）であってよい。前記マイクロフォンチップの各種電気的、及び／又は、機械的コンポーネントが、１つのチップに統合され得る。シリコンマイクロフォンは、内蔵のアナログ−デジタル変換器（ＡＤＣ）回路、及び／又は、チップ上の任意のその他の回路を含むことができる。シリコンマイクロフォンは、コンデンサマイクロフォン、光ファイバーマイクロフォン、表面実装装置、及び／又は、任意のその他のタイプのマイクロフォンであってよく、及び／又は、それらを含むものであってもよい。

人の一以上の部位に取り付けられるウェアラブル装置に、１つ以上のオーディオセンサ１１０が埋め込まれていてよい。前記ウェアラブル装置は、シートベルト、安全ベルト、フィルム、建築ハーネス、ウェアラブル演算装置、ヘルメット、ヘルメットストラップ、頭部搭載装置、バンド（例：リストバンド）等であってもよく、これらの組み合わせであってよく、及び／又は、それらを含む装置であってもよい。

オーディオセンサ１１０はそれぞれ、ウェアラブル装置の織物構造体への埋め込みに適した任意のサイズを有していてよい。例えば、オーディオセンサ１１０は、そのサイズ（例えば、寸法）が、特定の厚さ（例えば、２．５ｍｍ以下、又は、他の任意の閾値以下の厚さ）の織物構造体に完全に埋め込み可能なものであってよい。より具体的には、例えば、オーディオセンサは、織物構造体の第１面と第２面との間に配置されていてよい。

例えば、１つ以上のオーディオセンサ１１０及びそれらに関連する回路が、オーディオセンサ１１０が織物構造体の第１面と第２面との間に配置するように、織物構造体に埋め込まれていてよい。このように、織物構造体の厚さ、及び／又は、外観が、埋め込まれたオーディオセンサの存在によって変わらない場合もある。したがって、織物構造体の厚さは、埋め込まれたセンサが無い場合の織物構造体の厚さと同じであることもある。織物構造体の両面は滑らかな面であってよい。より具体的には、例えば、織物構造体の２つの表面の間に、１つ以上のセンサがいずれの部分も突出しない状態で織物構造体に埋め込まれていてよい。一部の実施形態において、オーディオセンサは、以下の図１１〜１６を参照して説明される技術の１つ以上を使用して織物構造体に埋め込まれていてよい。

オーディオセンサ１１０は、様々な指向特性を有することができる。例えば、１つ以上のオーディオセンサ１１０は指向性を有しており、１つ以上の特定の方向からの音に対する感度を有していてよい。より詳細には、例えば、オーディオセンサ１１０は、ダイポールマイクロフォン、双方向マイクロフォン、又は、それらの任意の組み合わせとすることができる。別の例として、１つ以上のオーディオセンサ１１０は無指向性であってよい。例えば、一又は複数のオーディオセンサ１１０は、全指向性マイクロフォンであってよい。

一部の実施形態において、音声通信を容易にするために、複数のオーディオセンサ１１０がオーディオセンサのアレイ（本明細書では「マイクアレイ」とも呼ぶ）として配置されていてよい。マイクアレイは、１つ以上のオーディオセンサのサブアレイ（本明細書では「マイクサブアレイ」とも呼ばれる）を含むことができる。各マイクサブアレイは、１つ以上のオーディオセンサ（例えば、マイクロフォン）を含むことができる。マイクサブアレイは、ウェアラブル装置のユーザ（例えば、シートベルトを着用している乗車中の人）に向けられた差分指向性マイクロフォンシステムを形成することができる。マイクサブアレイは、ユーザの音声を表す出力信号を出力してよい。以下でより詳細に説明するように、１つ以上のマイクサブアレイによって生成された１つ以上の出力信号を組み合わせたり、処理する等して、ユーザの音声、及び／又は、ユーザによって提供されるその他の音響入力を表すスピーチ信号を生成することができる。一部の実施形態において、以下により詳細に説明するように、マイクアレイの複数のオーディオセンサが織物構造体に埋め込まれていてよい（例えば、織物構造体の第１面と第２面との間に配置される）。

一又は複数のプロセッサ１２０、及び／又は、またはその他の任意のデバイスによって、スピーチ信号を処理することにより、１つ以上の音声制御アプリケーションを実施することができる。例えば、一又は複数のプロセッサ１２０は、スピーチ信号の内容を識別するためにスピーチ信号を分析してよい。より詳細には、例えば、ユーザによって話される１つ以上のキーワード、フレーズ等が、適切な音声認識技術を利用して識別されてよい。一又は複数のプロセッサ１２０は、識別された内容に基づいて１つ以上の操作を実行させることができる（例えば、操作を行わせるコマンドを１つ以上生成すること、操作を行うこと、操作において使用する情報を提供すること等によって）。例えば、一又は複数のプロセッサ１２０は、ユーザーに対して、メディアコンテンツ（例えば、ビデオコンテンツ、オーディオコンテンツ、テキスト、グラフィックス等）をディスプレイに表示させることができる。メディアコンテンツは、地図、ウェブコンテンツ、ナビゲーション情報、ニュース、オーディオクリップ、及び／又は、スピーチ信号の内容に関連する他の情報に関連するものであってもよい。別の例として、一又は複数のプロセッサ１２０は、スピーチ信号の内容に基づいて検索を実行させることができる（例えば、他のデバイス、及び／又は、アプリケーションを制御することによって、サーバに対して、識別されたキーワード、及び／又は、フレーズの検索要求を送信すること等）。

一又は複数のプロセッサ１２０は、オーディオ信号に対して、受信、処理、及び／又は、その他の機能を果たすことが可能な任意の適切な装置であればよい。例えば、一又は複数のプロセッサ１２０は、１つ以上のマイクサブアレイ、及び／又は、その他の任意の適切な装置からオーディオ信号を受信することができる。その後、一又は複数のプロセッサ１２０は、空間フィルタ、エコー消去、ノイズリダクション、ノイズ、及び／又は、エコーの抑圧、及び／又は、その他の適切な処理をオーディオ信号に対して実行することによりスピーチ信号を生成することができる。

一又は複数のプロセッサ１２０は、及び／又は、コンピュータなどのような汎用装置であってよく、又は、クライアントやサーバ等のような専用装置であってもよい。これら汎用装置又は専用装置はいずれも、ハードウェアプロセッサ（マイクロプロセッサ、デジタル信号プロセッサ、コントローラ等）、メモリ、通信インターフェース、ディスプレイコントローラ、入力装置、記憶装置（ハードドライブ、デジタルビデオレコーダ、固体記憶装置、リムーバブル記憶装置、又は、その他の任意の適切な記憶装置）等の任意の適切なコンポーネントを含んでいてよい。

一部の実施形態において、一又は複数のプロセッサ１２０は、図３を参照して説明するプロセッサであってよく、及び／又は、そのようなプロセッサを含んでいてもよい。一部の実施形態において、一又は複数のプロセッサ１２０は、以下、図７〜図１０を参照して説明するように、１つ以上の操作を実行することと、及び／又は、１つ以上の処理７００〜１０００を実施することができる。

一又は複数のコントローラ１３０は、システム１００のコンポーネント１つ以上の機能および動作を制御するように構成することができる。一又は複数のコントローラ１３０は、別の制御装置（例えば、制御回路、スイッチ等）、制御バス、携帯機器（例えば、携帯電話、タブレット型コンピュータ等）等であってよく、又は、それらの任意の組み合わせであってもよい。一部の実施形態において、一又は複数のコントローラ１３０は、ユーザコマンドを取得するための１つ以上のユーザーインターフェイス（図１には図示せず）を提供してよい。一部の実施形態において、一又は複数のコントローラ１３０は、車両の速度、環境の騒音、ユーザの特性（例えば、ユーザの履歴データ、ユーザの設定）、空間特性等の複数の条件、又は、これら条件の任意の組み合わせに応じて、１つ以上のサブアレイ、処理方法の選択に使用することができる。

一部の実施形態において、一又は複数のプロセッサ１２０は、それぞれ通信リンク１５１、１５３を介して一又は複数のオーディオセンサ１１０及び一又は複数のコントローラ１３０に通信可能に接続することができる。一部の実施形態において、一又は複数のオーディオセンサ１１０、一又は複数のプロセッサ１２０、及び、一又は複数のコントローラ１３０のそれぞれは、通信リンク１５５、１５７、１５９を介してそれぞれ通信ネットワーク１４０に接続することができる。通信リンク１５１、１５３、１５５、１５７、１５９は、ネットワークリンク、ダイアルアップリンク、無線リンク、Ｂｌｕｅｔｏｏｔｈ（登録商標）リンク、有線リンク、その他の適切な通信リンク、又は、これらリンクの任意の適切な組み合わせであってよく、及び／又は、これらを含んでいてもよい。

通信ネットワーク１４０は、インターネット、イントラネット、広域ネットワーク（ＷＡＮ）、ローカルエリアネットワーク（ＬＡＮ）、無線ネットワーク、デジタル加入者回線（ＤＳＬ）ネットワーク、フレームリレーネットワーク、非同期転送モード（ＡＴＭ）ネットワーク、仮想プライベートネットワーク（ＶＰＮ）、ケーブルテレビネットワーク、光ファイバーネットワーク、電話網、衛星ネットワーク、又は、これらいずれかの任意の組み合わせであってよい。

一部の実施形態において、一又は複数のオーディオセンサ１１０、一又は複数のプロセッサ１２０、および一又は複数のコントローラ１３０は、通信ネットワーク１４０を介して相互に通信することができる。例えば、オーディオ信号は、さらに処理するために、通信ネットワーク１４０を介して、一又は複数のオーディオセンサ１１０から一又は複数のプロセッサ１２０に転送されてよい。別の例において、制御信号は、通信ネットワーク１４０を介して、一又は複数のコントローラ１３０から、１つ以上のオーディオセンサ１１０及びプロセッサ１２０に転送されてよい。

一部の実施形態において、一又は複数のオーディオセンサ１１０、一又は複数のプロセッサ１２０、及び、一又は複数のコントローラ１３０のそれぞれは、スタンドアローン装置として実装されてよく、システム１００の他のコンポーネントと統合されてもよい。

一部の実施形態において、システム１００の各種コンポーネントは、１つ以上のデバイスに実装することができる。例えば、システム１００における、１つ以上のオーディオセンサ１１０、プロセッサ１２０、及び／又は、コントローラ１３０は、ウェアラブル装置（例えば、シートベルト、フィルム等）に埋め込まれていてよい。別の例として、一又は複数のオーディオセンサ１１０がウェアラブル装置に埋め込まれつつ、１つ以上のプロセッサ１２０及びコントローラ１３０が別のデバイス（例えば、スタンドアローンプロセッサ、携帯電話、サーバ、タブレットコンピュータ等）に位置していてよい。

一部の実施形態において、システム１００は、ユーザの心拍数、呼吸数、脈拍、血圧、温度、呼気中のアルコール含有量、指紋、心電図、筋電図、位置、及び／又は、その他のユーザに関する情報などを検出可能な１つ以上のバイオセンサを含んでいてよい。システム１００は、スマート制御装置の一部として使用することができる。例えば、図１３Ｂに示すように、システム１００が受信したスピーチ信号に応じて１つ以上の制御コマンド又はそれらの組み合わせ等を作製することができる。一実施形態において、システム１００によってスピーチ信号が取得され、携帯電話が１つ以上の機能を果たすように制御されてよい（例えば、電源のオン／オフ、電話帳から名前を検索し電話をかけたり、メッセージを送信したり）。別の実施形態において、システム１００によって呼気中アルコール含有量が取得されてもよく、この場合、呼気中アルコール含有量が閾値を超える場合（例えば、２０ｍｇ／１００ｍｌ，８０ｍｇ／１００ｍｌ，等よりも高い場合）に、車両をロックすることができる。さらに別の実施形態では、システム１００によって、ユーザの心拍数、又は、その他の任意の生体パラメータが取得され、警告を生成することができる。一部の実施形態において、前記警告は、別のユーザ（例えば、サーバ、医療提供者の携帯電話等）に送信されてもよい。

図２Ａは、本開示における一部の実施形態によるオーディオセンサが埋め込まれた織物構造体の実施例２００を示す。織物構造体２００は、ウェアラブル装置の一部であってよい。

図に示されるように、織物構造体２００は、１つ以上の層（例えば、層２０２ａ、２０２ｂ、２０２ｎ等）を含んでいる。図２Ａには３つの層が示されているが、これは例示に過ぎない。織物構造体２００は、任意の適切な数の層（例えば、１つの層、２つの層等）を有していてよい。

各層２０２ａ〜ｎは、複数のオーディオセンサ、回路、及び／又は、一又は複数のオーディオセンサに付随するその他の任意のハードウェア等が埋め込まれ得る織物構造体としてみなすことができる。図２Ａに示すように、層２０２ａ〜ｎは、横方向に沿って配置されていてよい。

織物構造体２００、及び／又は、各層２０２ａ〜ｎは、任意の適切な材料で作製可能であり、例えば、布（例えば、織布、不織布、導電性生地、非導電性生地等）、帯紐、繊維、織物、強化フィルム、プラスチック、プラスチックフィルム、ポリウレタン、シリコーンゴム、金属、セラミックス、ガラス、膜、紙、カード用紙、ポリマー、ポリエステル、ポリイミド、ポリエチレンテレフタレート、可撓性材料、圧電材料、カーボンナノチューブ、バイオニック材料、及び／又は、埋込センサを有する織物構造体が製造可能なその他の任意の適切な材料で作製可能である。また、織物構造体２００、及び／又は、各層２０２ａ〜ｎは、導電性材料（例えば、導電性糸、導電性生地、導電性トレッド、導電性繊維等）、非導電性材料（例えば、非導電性生地、非導電性エポキシなど）、及び／又は、その他の導電性材料で作製されていてよい。一部の実施形態において、基板（織物構造体）２００の複数の層は、同一の、又は、一又は複数の異なる材料で作製することができる。各層２０２ａ〜ｎの色、形状、密度、弾性、厚さ、導電性、温度伝導率、空気透過率、及び／又は、その他の特性は、同じであっても異なっていてもよい。

各層２０２ａ〜ｎは、任意の適切な寸法（例えば、長さ、幅、厚さ（例えば、高さ）等）を有していてよい。織物構造体２００の複数の層は、同じ寸法を有していてもよく、有していなくてもよい。例えば、層２０２ａ、２０２ｂ、２０２ｎは、それぞれ厚さ２０４ａ、２０４ｂ、２０４ｎを有していてよい。厚さ２０４ａ、２０４ｂ、２０４ｎは、互いに同じであっても異なっていてもよい。一部の実施形態において、織物構造体２００の１つ以上の層は特定の厚さを有することができる。例えば、織物構造体２００の全ての層の厚さ（例えば、厚さ２０４ａ〜ｎの組み合わせ）は、特定の厚さ（例えば、２．５ｍｍ、２．４ｍｍ、２ｍｍ、３ｍｍ、４ｍｍ、及び／又は、その他の任意の厚さ）以下であってもよい。別の例において、織物構造体２００の特定の層の厚さは、特定の厚さ（例えば、２．５ｍｍ、２．４ｍｍ、２ｍｍ、３ｍｍ、４ｍｍ、及び／又は、その他の任意の厚さ）以下であってもよい。

一部の実施形態において、織物構造体の層の厚さ（例えば、厚さ２０４ａ、２０４ｂ、２０４ｎ等）は、層の第１面と層の第２面との間の距離によって測定することができる。層の第１面は、層の第２面と平行であってもよく、平行でなくてもよい。層の厚さは、層の第１面と第２面との間の最大距離（本明細書では「最大厚さ」とも称す）であってよい。層の厚さは、層の第１面と第２面との間のその他の任意の距離であってもよい。

同様に、織物構造体の厚さは、織物構造体の第１面と織物構造体の第２面との間の距離によって測定することができる。織物構造体の第１面は、織物構造体の第２面と平行であってもよく、平行でなくてもよい。織物構造体の厚さは、織物構造体の第１面と第２面との間の最大距離（本明細書では「最大厚さ」とも称す）であってよい。織物構造体の厚さは、織物構造体の第１面と第２面との間のその他の任意の距離であってもよい。

織物構造体２００は、シートベルト、建築ハーネス、ウェアラブル演算装置、ヘルメット、ヘルメットストラップ、頭部搭載装置、バンド（例：リストバンド）、衣料品、軍用アパレル等のウェアラブル装置の一部であってよい。一部の実施形態において、織物構造体２００はシートベルトの帯紐であってもよく、及び／又は、これを含むものであってもよい。

各層２０２ａ〜ｎは、１つ以上のオーディオセンサ、回路、及び／又は、一又は複数のオーディオセンサ、一又は複数のプロセッサ、及び／又は、その他ウェアラブル装置において通信システムを提供するための適切なコンポーネントに関連付けられた他のハードウェアを含むことができる。例えば、１つ以上のオーディオセンサ、及び、それらに関連する回路、及び／又は、ハードウェアが織物構造体２００の層に埋め込まれていてよい。別の例として、１つ以上のオーディオセンサが織物構造体２００の任意の層（例えば、第１層）に埋め込まれていてよい。これらに関連する回路の一部分以上が、織物構造体２００の１つ以上の層の別の層（例えば、第２層、第３層等）に埋め込まれていてよい。一部の実施形態において、各層２０２ａ〜ｎは、図２Ｂ、図１１〜１４を参照して説明する１つ以上の織物構造体であってもよく、及び／又は、それらを含んでいてもよい。

一部の実施形態において、織物構造体２００の１つ以上の層に埋め込まれた複数のオーディオセンサは、オーディオセンサの１つ以上の配列（例えば、マイクアレイ）を形成してよく、各アレイはさらにオーディオセンサの１つ以上のサブアレイ（例えば、マイクサブアレイ）を含んでいてよい。例えば、マイクアレイ、及び／又は、マイクサブアレイは、織物構造体２００の特定の層に埋め込まれたオーディオセンサによって形成されていてよい。別の例において、マイクアレイ、及び／又は、マイク副配列は、織物構造体２００の複数の層に埋め込まれたオーディオセンサによって形成されていてよい。一部の実施形態において、複数のオーディオセンサは、以下に図２Ｂ、図１１〜１４を参照して説明する織物構造体２００の１つ以上の層に配置されていてよい。

一部の実施形態において、１つ以上の層２０２ａ〜ｎは、複数のオーディオセンサ、一又は複数のオーディオセンサに付随する回路、一又は複数のプロセッサ等が埋め込まれ得る１つ以上の通路（例えば、通路２０６ａ、２０６ｂ、２０６ｎ等）を含んでいてよい。例えば、各通路は、図２Ｂに示す通路２０１ａ〜ｇ、図１１に示す流路１１０１ａ〜ｅ、図１３に示す通路１３１０、図１４に示す通路１４１１、１４２１の１つ以上であってもよく、及び／又は、これらを含んでいてもよい。これに代わり、またはこれに加えて、１つ以上のオーディオセンサ、回路、及び／又は、オーディオセンサに付随するその他の任意のハードウェア（例えば、電極、ワイヤー等）等は織物構造体２００の一部分以上に統合されていてよい。

図２Ｂは、本開示における一部の実施形態によるセンサが埋め込まれた織物構造体の実施例２１０、２２０、２３０、２４０を示す。各織物構造体２１０、２２０、２３０、２４０はウェアラブル装置の一部であってよい。例えば、織物構造体２１０、２２０、２３０、２４０のそれぞれは、図２Ａに示されるような織物構造体の層に含まれていてよい。別の例として、織物構造体２１０、２２０、２３０、２４０の２つ以上が、図２Ａに示されるような織物構造体の層に含まれていてもよい。これに代わり、またはこれに加えて、織物構造体２１０、２２０、２３０、２４０は複数のウェアラブル装置に使用されていてもよい。

織物構造体２１０、２２０、２３０、２４０のそれぞれは、１つ以上の通路（例えば、通路２０１ａ、２０１ｂ、２０１ｃ、２０１ｄ、２０１ｅ、２０１ｅ、２０１ｆ、２０１ｇ）を含んでいてよい。各通路は、１つ以上のオーディオセンサ（例えば、オーディオセンサ２０３ａ〜ｐ）、回路、及び／又は、オーディオセンサ、及び／又は、本開示の一部の実施形態によるその他の任意の適切なコンポーネントに関連付けられた任意の他のハードウェアを含むことができる。オーディオセンサ２０３ａ〜ｐの各々は、図１を参照して説明するオーディオセンサ１１０であってもよく、及び／又は、それを含むものであってもよい。

一部の実施形態において、１つ以上の通路２０１ａ〜ｇは、織物構造体に沿って長手方向に延在していてよい。或いは、各通路２０１ａ〜ｇは、その他の適切な方向に配置されてもよい。

織物構造体内の複数の通路は、任意の適切な方法で配置されていてよい。例えば、織物構造体に配置された複数の通路（例えば、通路２０１ｂ〜ｃ、通路２０１ｄ〜ｅ、通路２０１ｆ〜ｇ）は、互いに平行であってもよく、平行でなくてもよい。別の例として、織物構造体における複数の通路（例えば、通路２０１ｂ〜ｃ、通路２０１ｄ〜ｅ、通路２０１ｆ〜ｇ等）の始点および終点は同じであってもよく、異なっていてもよい。さらに別の例として、織物構造体内の複数の通路は、同一または異なる寸法（例えば、長さ、幅、高さ（例えば厚さ）、形状等）を有してよい。通路２０１ａ〜ｇの各々は、曲線、長方形、楕円形、同様のもの、又は、それらの組み合わせ等、任意の適切な形状を有することができる。通路２０１ａ〜ｇの空間構造の例としては、直方体、円柱、楕円体等、又は、それらの組み合わせがあるが、これらに限定されない。複数の通路の形状、及び、空間構造は同一であってもよく、異なっていてもよい。各通路２０１ａ〜ｇは、一部分以上が中空であってもよい。一部の実施形態において、各通路２０１ａ〜ｇは、図１１を参照して説明する流路１１０１ａ〜ｅであってよく、及び／又は、そのような通路を含んでいてもよい。通路２０１ａ〜ｇの各々はまた、図１４に示す通路１４１１、及び／又は、通路１４１２であってよく、これらを含むものであってもよい。

実施例２２０、２３０、及び、２４０には２つの通路が示されているが、これは単なる例示である。各織物構造体は、任意の適切な数の通路（例えば、ゼロ、１つ、２つ等）を含むことができる。

図に示されるように、各オーディオセンサ２０３ａ〜ｐは、通路内に配置されていてよい。１つ以上のオーディオセンサに付随する１つ以上の回路（例えば、図１２〜図１６を参照して説明する回路）もまた通路内に配置されていてよい。一部の実施形態において、オーディオセンサ２０３は通路２０１内の長手方向の線上に配置することができる。さらに別の実施形態において、複数のオーディオセンサ２０３が通路２０１内の複数の線上に配置されていてよい。一部の実施形態において、複数列のオーディオセンサ２０３を１つの通路２０１に搭載することができる。オーディオセンサ２０３は、その一部が織物構造体から突き出た状態で、又は、突き出てない状態で織物構造体の通路２０１に搭載されている。例えば、一部の実施形態において、オーディオセンサ２０３、及び／又は、これらに付随する回路は、織物構造体から突出していない。

一部の実施形態において、通路２０１の数およびオーディオセンサ２０３の配置は同じであってもよく、異なっていてもよい。織物構造体２１０において、通路２０１は織物構造体に形成することができ、１つ以上のオーディオセンサを通路２０１に搭載することができる。複数のオーディオセンサ２０３の出力を組み合わせてオーディオ信号を生成することができる。実施例２２０、２３０、２４０では、複数の通路２０１を１つの織物構造体に製造することができ、１つ以上のオーディオセンサが各通路２０１に取り付けられてよい。隣接する通路２０１の間の距離は、同じであってもよく、異なっていてもよい。織物構造体２２０において、複数のオーディオセンサが平行な横線上に配置されていてよい。横線は、縦線に垂直であってもよい。これにより、複数のオーディオセンサを利用して、１つ以上の差動型指向性オーディオセンササブアレイを形成することができる。１つ以上の差動型指向性オーディオセンササブアレイの出力を組み合わせてオーディオ信号を生成することができる。例えば、オーディオセンサ２０３ｂ、２０３ｃによって、差動型指向性オーディオセンササブアレイを形成することができる。オーディオセンサ２０３ｄ、２０３ｅによって、差動型指向性オーディオセンササブアレイを形成することができる。オーディオセンサ２０３ｆ、２０３ｇによって、差動型指向性オーディオセンササブアレイを形成することができる。

織物構造体２３０において、複数のオーディオセンサ２０３が平行な横線及びその他の線上に配置されていてよい。これにより、平行な横方向の線上に配置される複数のオーディオセンサ２０３を利用して、１つ以上の差動型指向性オーディオセンササブアレイを形成することができる。１つ以上の差動型指向性オーディオセンササブアレイの出力を組み合わせてオーディオ信号を生成することができる。オーディオセンサ２０３ｈ、及び、オーディオセンサ２０３ｉによって、差動型指向性オーディオセンササブアレイを形成することができる。例えば、オーディオセンサ２０３ｊ、２０３ｋによって、差動型指向性オーディオセンササブアレイを形成することができる。例えば、オーディオセンサ２０３ｍ、２０３ｈによって、差動型指向性オーディオセンササブアレイを形成することができる。一部の実施形態において、織物構造体２４０には１つ以上のオーディオセンサ２０３がランダムに且つ複数の横方向の線上に配置されていてよい。複数のオーディオセンサ２０３の出力を組み合わせてオーディオ信号を生成することができる。

図３は、本発明の実施形態におけるプロセッサの例３００を示す図である。図に示されるように、プロセッサ３００は、Ｉ／Ｏモジュール３１０、空間フィルタモジュール３２０、エコー消去モジュール３３０、ノイズリダクションモジュール３４０、及び／又は、本開示の各種実施形態に従って、オーディオ信号を処理するその他の適切なコンポーネントを含むことができる。プロセッサ３００には、さらに多くの又はより少ないコンポーネントが含まれていてもよい。例えば、２つのモジュールを１つのモジュールに統合してもよく、１つのモジュールを２つ以上のモジュールに分割してもよい。一例において、１つ以上のモジュールが複数の演算装置（例えば、異なるサーバコンピュータ）に設けられていてもよい。一部の実施形態において、図３のプロセッサ３００は、図１のプロセッサ１２０と同じであってもよい。

Ｉ／Ｏモジュール３１０は、複数の制御アプリケーションに使用することができる。例えば、Ｉ／Ｏモジュール３１０は、オーディオセンサ、圧力センサ、光電センサ、電流センサ等の電子装置、又は、これらの任意の組み合わせから信号を受信するための回路を含むことができる。一部の実施形態において、Ｉ／Ｏモジュール３１０は、複数の受信信号又は一又は複数のその他の信号（例えば、１つ以上の受信信号に由来する信号、又は、１つ以上の受信信号に関連する信号）を、通信リンクを介して、システム３００のその他のモジュール（例えば、空間フィルタモジュール３２０、エコー消去モジュール３３０、ノイズリダクションモジュール３４０）に送信することができる。一部の別の実施形態において、Ｉ／Ｏモジュール３１０はプロセッサ３００の１つ以上のコンポーネントによって生成された信号を、更に処理するために他の装置に送信することができる。一部の実施形態において、Ｉ／Ｏモジュール３１０は、アナログ信号をデジタル信号に変換できるアナログ／デジタル変換器（図３には図示せず）を含んでいてもよい。

空間フィルタモジュール３２０は、１つ以上のビームフォーマ３２２、ローパスフィルタ３２４、及び／又は、オーディオ信号に空間フィルタを行うためのその他の適切なコンポーネントを含んでいてもよい。一又は複数のビームフォーマ３２２は、複数のサブアレイのそれぞれのオーディオセンサによって受信された複数のオーディオ信号を結合させることができる。例えば、ビームフォーマ３２２は、複数の方向からの信号に対して異なる応答をすることができる。ビームフォーマ３２２は、特定の方向からの信号の通過を許容し、他の方向からの信号を抑制することができる。一又は複数のビームフォーマ３２２によって区別される信号の方向は、例えば、マイクアレイのオーディオセンサ、及び／又は、ビームフォーマ３２２を形成するマイクサブアレイの幾何学情報、オーディオセンサの数、ソース信号の位置情報、及び／又は、信号の方向性に関するその他の情報に基づいて判定することができる。一部の実施形態において、一又は複数のビームフォーマ３２２は、図４に示すビームフォーマ４００を１つ以上、及び／又は、ビームフォーマ４００の一部分以上を含んでいてよい。以下に図４を参照して説明するように、一又は複数のビームフォーマ３２２は、オーディオセンサの幾何情報（例えば、オーディオセンサの位置、オーディオセンサ間の距離等）及びソース信号の位置を参照することなく、ビームフォーミングを実行することができる。

一又は複数のローパスフィルタ３２４は、一又は複数のビームフォーマの配置に関連する歪を削減できる。一部の実施形態において、ローパスフィルタ３２４は、一又は複数のビームフォーマ３２２によって生成されたオーディオ信号の歪み成分を除去することができる。例えば、歪（例えば、オーディオセンササブアレイの幾何学配置、オーディオセンサの数、信号のソース位置等、又は、これらの組み合わせにより発生する歪）を均等化することにより歪成分を除去することができる。

図３に示すように、プロセッサ３００はまた、入力されたオーディオ信号（例えば、Ｉ／Ｏモジュール３１０、空間フィルタモジュール３２０、又はその他の装置によって生成された信号）エコー、及び／又は、フィードバック成分（これもエコー成分と称す）を除去可能なエコー消去モジュール３３０を含んでいてよい。例えば、エコー消去モジュール３３０は入力されたオーディオ信号に含まれるエコー成分を推定し、前記入力されたオーディオ信号からエコー成分を除去する（例えば、入力されたオーディオ信号から、推定されたエコー成分を取り除く）。入力されたオーディオ信号のエコー成分は、音響環境内におけるオーディオセンサ（例えば、マイク）と１つ以上のスピーカとの間で適切な音響絶縁が欠如しているために発生するエコーを表している。例えば、マイクによって生成されるオーディオ信号は、遠端スピーチおよび近端オーディオ（例えば、インフォテインメントサブシステムからのコマンド、又は、オーディオ信号）からのエコー成分、及び、フィードバック成分をそれぞれ含むことができる。これらのエコー成分、及び／又は、フィードバック成分は、音響エコーを生成するために１つ以上のスピーカによって再生されてもよい。

一部の実施形態において、エコー消去モジュール３３０は、音響エコーキャンセラー３３２、ダブルトーク検出器３３４、及び／又は、オーディオ信号のエコー、及び／又は、フィードバック消去を実行するための他の適切なコンポーネントを含むことができる。

一部の実施形態において、音響エコーキャンセラー３２は入力されたオーディオ信号のエコー成分を推定できる。例えば、音響エコーキャンセラー３３２はエコー成分が生成される音響経路を表すモデルを構築することができる。そして、音響エコーキャンセラー３３２はそのモデルに基づいてエコー成分を推定できる。一部の実施形態において、音響経路は、ＮＬＭＳ（Normalized Least Mean Square）アルゴリズム、アフィン射影（ＡＰ）アルゴリズム、ＦＬＭＳ（Frequency-Domain Least Mean Square）アルゴリズムなどの適応アルゴリズムを使用してモデル化することができる。一部の実施形態において、音響経路は有限インパルス応答フィルタ（ＦＩＲ）を有する適応フィルタ等のフィルタによってモデル化できる。適応フィルタは、図５及び図６を参照して説明するような構成とすることができる。

ダブルトーク検出器３３４は、ダブルトーク検出を行うことが可能であり、この検出に基づいてエコー消去を実行させることができる。ダブルトークは、エコー消去モジュール３３０が複数の話者の音声を表す信号を同時にまたは略同時に受信したときに発生することがある。ダブルトークの発生を検出すると、ダブルトーク検出器３３４は、音響エコーキャンセラー３３２によって構築された適応フィルタを停止させるか、または減速させることができる。

一部の実施形態において、ダブルトーク検出器３３４は、１つ以上のスピーカ信号及び出力信号と１つ以上のオーディオセンサによって生成された複数の出力信号との相関に関する情報に基づいて、ダブルトークの発生を検出する。例えば、ダブルトークの発生は、エネルギー比試験、統計などのような相互相関、又は、整合性、又は、これらの組み合わせに基づいて検出され得る。ダブルトーク検出器３３４は、スピーカ信号とマイク信号との相関に関する情報を音響エコーキャンセラー３３２に提供することもできる。一部の実施形態において、音響エコーキャンセラー３３２によって構成された適応フィルタは、情報に基づいて停止または減速することができる。エコー消去モジュール３３０によって実行される様々な機能について、図５及び図６を参照して詳細に説明する。

ノイズリダクションモジュール３４０は、１つ以上のオーディオセンサ、Ｉ／Ｏモジュール３１０、空間フィルタモジュール３２０、エコー消去モジュール３３０、及び／又は、その他の任意の装置によって生成されたオーディオ信号等の入力されたオーディオ信号に対してノイズ低減を行うことができる。図３に示すように、ノイズリダクションモジュール３４０は、チャネル選択部３４２、マルチチャネルノイズリダクション部（ＭＮＲ）３４４、残留ノイズ及びエコー抑制部３４６、及び／又は、ノイズ低減を実行するためのその他の適切なコンポーネントを含むことができる。

チャネル選択部３４２は、さらに処理を行うために１つ以上のオーディオチャネルを選択することができる。複数のオーディオチャネルは、１つ以上のマイクアレイ、マイクサブアレイ等、複数のオーディオセンサの出力に対応したものであってよい。一部の実施形態において、複数のオーディオチャネルを介して提供される複数のオーディオ信号の品質に基づいて、１つ以上のオーディオチャネルを選択することができる。例えば、１つ以上のオーディオチャネルは、複数のオーディオチャネルによって提供される複数のオーディオ信号の信号対雑音比（ＳＮＲ）に基づいて選択されてもよい。より詳細には、例えば、チャネル選択部３４２は、最高ＳＮＲ、最上位３つのＳＮＲ、閾値より高いＳＮＲなど、特定の品質（例えば、特定のＳＮＲ）に関連する１つ以上のオーディオチャネルを選択することができる。

一又は複数のオーディオチャネルを選択すると、チャネル選択部３４２は、当該選択に関する情報、選択された一又は複数のオーディオチャネルを介して供給される複数のオーディオ信号、及び／又は、その他の情報を、マルチチャネルノイズリダクション部（ＭＣＮＲ）３４４に提供することができる。次いで、ＭＣＮＲ部３４４は、選択された一又は複数のオーディオチャネルによって提供される一又は複数のオーディオ信号に対し、ノイズリダクションを実行することができる。

ＭＣＮＲ部３４４は、チャネル選択部３４２、Ｉ／Ｏモジュール３１０、空間フィルタモジュール３２０、エコー消去モジュール３３０、１つ以上のオーディオセンサ、及び／又は、他の任意のデバイスから、１つ以上の入力されたオーディオ信号を受信することができる。ＭＣＮＲ部３４４で受信される入力オーディオ信号は、スピーチ成分、ノイズ成分、及び／又は、他の成分を含むことができる。スピーチ信号は、所望のスピーチ信号（例えば、ユーザの音声、その他の音響入力、及び／又は、その他の所望の信号）に対応したものであってよい。ノイズ成分は、周囲のノイズ、回路のノイズ、及び／又は、他のタイプのノイズに対応したものであってよい。ＭＣＮＲ部３４４は、入力オーディオ信号を処理することにより（例えば、スピーチ成分、及び／又は、ノイズ成分に関する統計を推定することにより）スピーチ信号を生成することができる。例えば、ＭＣＮＲ部３４４は、１つ以上のノイズリダクションフィルタを構築することができ、ノイズリダクションフィルタを入力されたオーディオ信号に適用することによって、スピーチ信号、及び／又は、ノイズ消去済み信号を生成することができる。同様に、複数のオーディオチャネルに対応する複数の入力オーディオ信号を処理するために、１つ以上のノイズリダクションフィルタを構築することもできる。これらノイズ除去フィルタのうちの１つ以上を、単一チャネルノイズリダクション、及び／又は、マルチチャネルノイズリダクションのために構成することができる。一又は複数のノイズリダクションフィルタは、代表的なウィーナフィルタ（Wiener filtering）、櫛形フィルタ技術（線形フィルタが、ピッチ期間から導出された有声音声の高調波成分のみを通過させるように適合されている）、音声の線形全極モデリング及び極零モデリング（例えば、雑音のある音声からのスピーチ成分の係数の推定による）、隠れマルコフモデリング等の１つ以上のフィルタリング技術に基づいて構築されていてよい。一部の実施形態において、１つ以上のノイズリダクションフィルタは、以下の図１０を参照して説明する動作を１つ以上実行することによって構築されていてよい。

一部の実施形態において、ＭＣＮＲ部３４４は、無音期間中のノイズ統計値を推定および追跡することができる。ＭＣＮＲ部３４４は、推定された情報を用いて、スピーチ信号が存在するときのノイズ成分を抑圧することができる。一部の実施形態において、ＭＣＮＲ部３４４は、スピーチ歪の少ない、又は、全くないノイズリダクションを達成することができる。ＭＣＮＲ部３４４は、複数のオーディオセンサの出力信号を処理することができる。複数のオーディオセンサの出力信号は、未知のソース、ノイズ成分、及び／又は、他の任意の成分に分解することができる。一部の実施形態において、ＭＣＮＲ部３４４は、未知のソースから成分の推定値を取得することができる。ＭＣＮＲ部３４４は、未知のソースからの成分とこれに対応する推定処理に基づいて、エラー信号を生成することができる。次いで、ＭＣＮＲ部３４４は、エラー信号に従ってノイズ消去済み信号を生成することができる。

一部の実施形態において、１つ以上の他のオーディオチャネルを介して提供されるオーディオ信号に関する統計に基づいて、オーディオチャネルに対するノイズリダクションを実行することができる。これに代わり、またはこれに加えて、単一チャネルノイズリダクションのアプローチで、個々のオーディオチャネルに対してノイズリダクションを実行することができる。

ＭＣＮＲ部３４４によって生成されたスピーチ信号は、さらなる処理のために、残留ノイズ及びエコー抑制部３４６に供給されてよい。例えば、残留ノイズ及びエコー抑制部３４６は、スピーチ信号に含まれる残留ノイズ、及び／又は、エコー（例えば、エコーＭＣＮＲ３４４、及び／又は、エコー消去モジュール３３０によって除去されなかったノイズ、及び／又は、エコー成分）を抑圧することができる。ノイズリダクションモジュール３４０によって実行される各種機能については、図１０を参照して詳細に説明する。

本明細書の記載は例示的なものであり、特許請求の範囲を限定するものではない。本明細書に記載の構成や詳細の変形例は当業者にとって自明である。本明細書に記載された例示的な実施形態の特徴、構造、方法、および他の特徴を様々な方法で組み合わせることによって更に、及び／又は、代替となる例示的な実施形態を得ことができる。例えば、線形エコー消去部（図３において図示せず）をエコー消去モジュール３３０に設けて、線形エコーを消去してもよい。別の例として、音響エコー消去部３３４が、線形エコーを消去する機能を有していてもよい。

図４は、本発明の実施形態におけるビームフォーマの例４００を示す模式図である。一部の実施形態において、ビームフォーマ４００は、図３に示す一又は複数のビームフォーマ３２２と同一であってもよい。

一部の実施形態において、マイクサブアレイ４５０は、オーディオセンサ４１０、４２０を含んでいてよい。オーディオセンサ４１０、４２０の各々は、全指向性マイクロフォンであってもよく、または、他の適切な指向特性を有してもよい。オーディオセンサ４１０、４２０は、差分ビームフォーマ（例えば、固定差分ビームフォーマ、適応差分ビームフォーマ、一次差分ビームフォーマ、二次差分ビームフォーマ等）を形成するように配置されていてよい。一部の実施形態において、オーディオセンサ４１０、４２０は、ある程度の距離（例えば、衝突する音波の波長に比べて小さい距離）を空けて配置されていてよい。オーディオセンサ４１０、４２０は、図２Ａ、２Ｂを参照して説明したマイクサブアレイを形成していてよい。オーディオセンサ４１０、４２０の各々は、図１を参照して説明するオーディオセンサ１１０であってもよく、及び／又は、それを含むものであってもよい。

軸４０５はマイクサブアレイ４５０の軸である。例えば、軸４０５は、オーディオセンサ４１０、４２０を結ぶ線を表すものであってよい。例えば、軸４０５は、オーディオセンサ４１０、４２０の幾何学的配置の中央、及び／又は、オーディオセンサ４１０、４２０のその他の部分を結ぶものであってよい。

オーディオセンサ４１０及びオーディオセンサ４２０は、音波４０７を受信することができる。一部の実施形態において、音波４０７は、衝突する平面波、非平面波（例えば、球面波、円筒波等）等であってもよい。オーディオセンサ４１０、４２０の各々は、音波４０７を表すオーディオ信号を生成することができる。例えば、オーディオセンサ４１０、４２０は、それぞれ、第１オーディオ信号および第２オーディオ信号を生成するものであってよい。

遅延モジュール４３０は、第１オーディオ信号、及び／又は、第２オーディオ信号に基づいて遅延オーディオ信号を生成することができる。例えば、遅延モジュール４３０は、第２オーディオ信号に時間遅延を適用することによって遅延オーディオ信号を生成することができる。時間遅延は、線形アルゴリズム、非線形アルゴリズム、及び／又は、遅延オーディオ信号の生成に使用できる他の適切なアルゴリズムを使用して決定することができる。以下により詳細に説明するように、様々な指向応答性を実現する目的で、音波がオーディオセンサ４１０、４２０の間を軸方向に移動する伝播時間に基づいて、時間遅延を調整してもよい。

結合モジュール４４０は、第１オーディオ信号（例えば、オーディオセンサ４１０によって生成されたオーディオ信号）と遅延モジュール４３０によって生成される遅延オーディオ信号とを結合することができる。例えば、結合モジュール４４０は、第１オーディオ信号と遅延オーディオ信号とを交代符号方式により結合することができる。一部の実施形態において、結合モジュール４４０は、近接場モデル、遠方場モデル、及び／又は、複数のオーディオ信号を結合するのに利用できるその他のモデルを利用して、第１オーディオ信号と遅延オーディオ信号とを結合することができる。例えば、２つのセンサが、近接場ビームフォーマを形成していてよい。一部の実施形態において、結合モジュール４４０によって使用されるアルゴリズムは、線形アルゴリズム、非線形アルゴリズム、リアルタイムアルゴリズム、非リアルタイムアルゴリズム、時間領域アルゴリズム、又は、周波数領域アルゴリズム等であってもよく、或いは、これらの任意の組み合わせであってもよい。一部の実施形態において、結合モジュール４４０によって使用されるアルゴリズムは、２段階時間遅延推定（ＴＤＯＡ）に基づくアルゴリズム、１段階時間遅延推定値に基づくアルゴリズム、ステアドビームに基づくアルゴリズム、独立成分分析に基づくアルゴリズム、遅延及び合計（ＤＡＳ）アルゴリズム、最小分散無歪応答（ＭＶＤＲ）アルゴリズム、一般化サイドローブキャンセラ（ＧＳＣ）アルゴリズム、最小平均二乗誤差（ＭＭＳＥ）に基づくアルゴリズム等の１つ以上のビームフォーミング又は空間フィルタ技術、或いは、これらの組み合わせであってもよい。

一部の実施形態において、オーディオセンサ４１０、４２０は固定一次差分ビームフォーマを形成できる。より詳細には、例えば、一次差分ビームフォーマの感度は、音圧フィールドの第１空間導関数に比例し、これを含む。マイクサブアレイ４５０に入射する振幅Ｓ_０及び角周波数ωを有する平面波の場合、結合モジュール４４０の出力は、以下の式を使用して表すことができる。

[数１]

式（１）において、ｄはマイク間の隙間（例えば、オーディオセンサ４１０、４２０間の距離）を表し、ｃは音の速度を表し、θは音波４０７の軸４０５に対する入射角を表し、τはマイクサブアレイの１つのオーディオセンサに対して適応する時間遅延を表している。

一部の実施形態において、オーディオセンサの間隔ｄは小さくてもよい（例えば、ω・ｄ／ｃ＜＜π及びω・τ＜＜πを満たす値）。結合モジュール４４０の出力は、次のように表すことができる。

[数２]

式（２）に示すように、結合モジュール４４０は、出力信号の生成に、オーディオセンサ４１０、４２０の幾何学的配置の情報を参照する必要はない。方程式（２）のかっこ内の項は、マイクサブアレイの指向性応答を含むことができる。

一部の実施形態において、マイクサブアレイは、一次ハイパス周波数依存性を有することができる。従って、軸４０５上で真っ直ぐに（例えば、θ＝０）到達する所望の信号Ｓ（ｊｗ）は、係数ｗだけ歪むことがある。この歪みは、ローパスフィルタによって（例えば、結合モジュール４４０によって生成された出力信号を均等化することにより）低減、及び／又は、除去することができる。一部の実施形態において、ローパスフィルタは整合ローパスフィルタとすることができる。一部の実施形態において、ローパスフィルタは、一次再帰ローパスフィルタとすることができる。一部の実施形態において、ローパスフィルタは、図３のローパスフィルタ３２４であってもよく、及び／又は、これを含んでいてもよい。

一部の実施形態において、結合モジュール４４０は、音波がサブアレイの２つのオーディオセンサの間を軸方向に移動するための伝搬時間（例えば、ｄ／ｃの値）に基づいて時間遅延τを調整することができる。より具体的には、例えば、τの値は、ｄ／ｃの値に比例してもよい（例えば、τの値は「０」、ｄ／ｃ、ｄ／３ｃ、ｄ／３^1/2ｃ等であってもよい）。一部の実施形態において、時間遅延τは、様々な指向性応答が達成できる範囲（例えば、０とｄ／ｃの値との間の範囲）で調整することができる。例えば、マイクサブアレイの応答の最小値が９０°と１８０°の間で変化するように、時間遅延を調整してもよい。一部の実施形態において、オーディオセンサ４２０に印加される時間遅延τは、以下の式を使用して決定することができる。

[数３]

代替的または追加的に、遅延時間τは、以下の式を使用して計算することができる。

[数４]

図５は、本発明の実施形態における音響エコー消去部（ＡＥＣ）の例５００を示す図である。

図に示されるように、ＡＥＣ５００は、スピーカ５０１、ダブルトーク検出器（ＤＴＤ）５０３、適応フィルタ５０５、結合器５０６、及び／又は、音響エコー消去を行うための他の適切なコンポーネントを含むことができる。一部の実施形態において、ＡＥＣ５００の１つ以上のコンポーネントが、図３のエコー消去モジュール３３０に含まれてもよい。例えば、図５に示すように、エコー消去モジュール３３０は、ＤＴＤ５０３、適応フィルタ５０５、及び、結合器５０６を含むことができる。オーディオセンサ５０８のさらなる詳細については、図２Ａ、２Ｂのオーディオセンサ２０３を参照されたい。

スピーカ５０１は、オーディオ信号を対応する音に変換可能な任意の装置であってもよく、及び／又は、そのような装置を含んでいてもよい。スピーカ５０１は、スタンドアローン型の装置であってもよく、または１つ以上の他の装置と一体化されてもよい。例えば、スピーカ５０１は、自動車オーディオシステムの内蔵型スピーカ、携帯電話と一体化されたスピーカなどであってもよい。

スピーカ５０１は、スピーカ信号５０７を出力することができる。スピーカ信号５０７は、音響経路（例えば、音響経路５１９）を通過し、エコー信号５０９を生成することができる。一部の実施形態において、スピーカ信号５０７およびエコー信号５０９は、それぞれｘ（ｎ）およびｙ_ｅ（ｎ）として表すことができ、ｎは時間インデックスを表す。エコー信号５０９はローカルスピーチ信号５１１と共に、オーディオセンサ５０８によって捕捉され、ローカルノイズ信号５１３、及び／又は、他の信号は、オーディオセンサ５０８によって捕捉される。ローカルスピーチ信号５１１、ローカルノイズ信号５１３は、それぞれｖ（ｎ）およびｕ（ｎ）で表すことができる。ローカルスピーチ信号５１１は、ユーザの音声、他の任意の音響入力、及び／又は、オーディオセンサ５０８によって捕捉され得るその他の所望の入力信号を表すことができる。ローカルノイズ信号５１３は、周囲のノイズ、回路のノイズ、及び／又は、その他の種類のノイズを表し得る。ローカルスピーチｖ（ｎ）５１１は本質的に間欠的であり、ローカルノイズｕ（ｎ）５１３は比較的定常的な場合がある。

オーディオセンサ５０８は、出力信号５１５を出力することができる。出力信号５１５は、エコー信号５０９（例えば、エコー成分）に対応する成分、ローカルスピーチ５１１（例えば、スピーチ成分）に対応する成分、ローカルノイズ５１３（例えば、ノイズ成分）、及び／又は、その他の成分の組み合わせとして表される。

エコー消去モジュール３３０は、エコー信号５０９を推定するために適応フィルタ５０５を使用して音響経路５１９をモデル化することができる。適応フィルタ５０５は、エコー信号５０９を推定するための有限インパルス応答（ＦＩＲ）を有するフィルタであってもよく、及び／又は、それを含んでいてもよい。エコー消去モジュール３３０は、適応アルゴリズムを使用してフィルタを推定することができる。一部の実施形態において、適応フィルタ５０５は、１つ以上の可変パラメータによって制御される伝達関数を有する線形フィルタと、適応アルゴリズムに従って１つ以上のパラメータを調整する１つ以上の手段とを有するシステムとすることができる。

適応フィルタ５０５は、スピーカ信号５０７、及び、出力信号５１５を受信することができる。適応フィルタ５０５は、その後受信信号を処理して、推定されたエコー信号５０９を表す推定エコー信号（例えば、信号
[数５]
）を生成してよい。推定エコー信号は、エコー信号５０９の複製とみなすことができる。結合器５０６は、推定エコー信号と出力信号５１５とを組み合わせることによりエコー消去済み信号５１７を生成することができる。例えば、エコー消去済み信号５１７は、出力信号５１５から推定エコー信号を減じて、エコー、及び／又は、フィードバックの消去を行うことで生成できる。適応アルゴリズムにおいて、ローカルスピーチ信号ｖ（ｎ）５１１とローカルノイズ信号ｕ（ｎ）５１３の両方が、無相関の干渉として作用することができる。一部の実施形態において、ローカルスピーチ信号５１１は間欠的である一方、ローカルノイズ信号５１３は比較的定常的な場合がある。

一部の実施形態において、適応フィルタ５０５によって使用されるアルゴリズムは、線形または非線形であってよい。適応フィルタ５０５で使用されるアルゴリズムは、ＮＬＭＳ（Normalized Least Mean Square）、アフィン射影（ＡＰ）アルゴリズム、ＲＬＳ（Recursive Least Squares）アルゴリズム、及び、ＦＬＭＳ（Frequency-Domain Least Mean Square）アルゴリズム等、又は、これらの組み合わせを含んでいてもよいがこれらに限定されない。

一部の実施形態において、発展したＦＬＭＳアルゴリズムを使用して、音響経路５１９のモデル化、及び／又は、推定エコー信号の生成を行うことができる。ＦＬＭＳアルゴリズムを使用して、音響経路５１９および適応フィルタ５０５を表す音響インパルス応答を構築することができる。一部の実施形態において、音響インパルス応答および適応フィルタ５０５は、有限長Ｌを有することができる。発展したＦＬＭＳアルゴリズムは、時間領域または空間領域からの１つ以上の信号を周波数領域表現に変換、又は、その逆を行うことがでできる。例えば、高速フーリエ変換を使用して、入力信号を周波数領域表現に変換することができる（例えば、入力信号の周波数領域表現）。オーバーラップ保存（Ｏｖｅｒｌａｐ−Ｓａｖｅ）技術は、前記表現を処理することができる。一部の実施形態において、オーバーラップ保存技術を使うことによって（例えば、信号と有限インパルス応答フィルタとの間の離散畳み込みを評価することによって）入力の周波数領域表現を処理することができる。時間領域または空間領域から周波数領域表現への、及びその逆の変換方法は、高速フーリエ変換、ウェーブレット変換、ラプラス変換、Ｚ変換等、又は、これらの組み合わせを含むことができるが、これらに限定されない。ＦＦＴは、素因数（Prime-factor）ＦＦＴアルゴリズム、ブルーン（Bruun）ＦＦＴアルゴリズム、レーダー（Rader）ＦＦＴアルゴリズム、ブルーステイン（Bluestein）ＦＦＴアルゴリズムなどを含んでよいが、これらに限定されない。

音響経路５１９を介して生成される真の音響インパルス応答は、以下のようなベクトルによって特徴付けることができる。

[数６]

適応フィルタ５０５は、以下のベクトル等によって特徴付けることができる。

[数７]

上記式（３）及び（４）において、（・）^Ｔはベクトルまたは行列の転置を表し、ｎは離散時間インデックスを表している。ｈは音響経路５１９を表すことができる。
[数８]
は、適応フィルタ５０５によってモデル化された音響経路を表すことができる。ベクトルｈ及び
[数８]
の各々は、実数値ベクトルであってもよい。上で示されるように、一部の実施形態において、真の音響インパルス及び適応フィルタは、有限長Ｌを有することができる。

オーディオセンサ５０８の出力信号５１５は真の音響インパルス応答に基づいてモデル化することができ、エコー信号５０９、スピーチ信号５１１、ローカルノイズ信号５１３等に対応するコンポーネントを１つ以上含んでいてもよい。例えば、出力信号５１５は、以下のようにモデル化することができる。

[数９]

ここで、以下の通りである。
[数１０]

[数１１]

上記式（５）〜（７）において、ｘ（ｎ）はスピーカ信号５０７（例えば、Ｌ個のサンプル）に対応し、ｖ（ｎ）はローカルスピーチ信号５１１に対応し、ｕ（ｎ）はローカルノイズ信号５１３に対応する。

一部の実施形態において、出力信号ｙ（ｎ）５１５及びスピーカ信号ｘ（ｎ）５０７は、複数のフレームに編成することができる。各フレームは、所定数のサンプル（例えば、Ｌ個のサンプル）を含むことができる。出力信号ｙ（ｎ）５１５のフレームは、以下のようであってもよい。

[数１２]

スピーカ信号ｘ（ｎ）５０７のフレームは、以下のようであってもよい。

[数１３]

上記式（８）及び（９）において、ｍ（ｍ＝０，１，２、．．．）はフレームのインデックスを示す。

スピーカ信号、及び／又は、出力信号は、例えば、１つ以上の高速フーリエ変換（ＦＦＴ）を実行することによって、周波数領域に変換されてもよい。また、スピーカ信号、及び／又は、出力信号の１つ以上のフレームに変換を実行してもよい。例えば、スピーカ信号の現在のフレーム（例えば、ｍ番目のフレーム）の周波数領域表現は、以下のように２ＬポイントＦＦＴを実行することによって生成されてもよい。

[数１４]

ここで、Ｆ_{２Ｌ×２Ｌ}は、（２Ｌ×２Ｌ）次元のフーリエ行列とすることができる。

前のフレーム（例えば、（ｍ−１）番目のフレーム）に適用される適応フィルタの周波数領域表現は、以下のように決定されてもよい。

[数１５]

ｘ_ｆ（ｍ）のシューア（エレメント対エレメント）積及び
[数１６]
を計算することができる。シューア積（Schur product）の時間領域表現を生成してもよい（例えば、逆ＦＦＴを利用したシューア積の時間領域への変換、又は、周波数領域信号の時間領域へのその他の適切な変換によって）。次に、エコー消去モジュール３３０は、シューア積の時間領域表現に基づいて、エコー信号の現在のフレーム（例えば、ｙ（ｍ））の推定値を生成することができる。例えば、推定されたフレーム（例えば、推定エコー信号、エコー
[数１７]
の現在のフレーム）は、以下のようにシューア積の時間領域表現の最後のＬ個の要素に基づいて生成されてもよい。

[数１８]

ここで、以下の通りである。

[数１９]

[数２０]
はシューア積を表すことができる。

エコー消去モジュール３３０は、エコー信号と推定エコー信号との間の類似性を表す事前エラー信号に基づいて適応フィルタ５０５の１つ以上の係数を更新することができる。例えば、エコー信号の現在のフレーム（例えば、ｙ（ｍ））について、事前エラー信号ｅ（ｍ）は、エコー信号の現在のフレーム（例えば、ｙ（ｍ））と推定された信号の現在のフレーム
[数１７]
との差に基づいて決定され得る。一部の実施形態において、事前エラー信号ｅ（ｍ）は、以下の式に基づいて決定され得る。

[数２１]

対角成分がｘｆ（ｍ）の要素である２Ｌ×２Ｌ対角行列を
[数２２]
で表す。式（１４）は以下のようであってもよい。

[数２３]

事前エラー信号に基づいて、コスト関数Ｊ（ｍ）は以下のように定義され得る。

[数２４]

ここで、λは指数関数忘却因子である。λの値は、任意の適切な値として設定されてもよい。例えば、λの値は一定の範囲（例えば、０＜λ＜１）内にあってもよい。コスト関数に基づいて（例えば、コスト関数Ｊ（ｍ）の勾配をゼロに設定することによって）、正規方程式を生成することができる。エコー消去モジュール３３０は、通常の機能に基づいてＦＬＭＳアルゴリズムの更新ルールを導出することができる。例えば、時間フレームｍ及びｍ−１において正規方程式を実施することによって以下の更新ルールが導出されてもよい。

[数２５]

[数２６]

[数２７]

ここで、μはステップサイズであり、δは正則化係数であってもよく、

[数２８]
である。

Ｉ_{２Ｌ×２Ｌ}は、２Ｌ×２Ｌ次元の単位行列であり、Ｓｆ（ｍ）は、対角成分がスピーカ５０１の信号ｘ（ｎ）５０７の推定パワースペクトルの要素となり得る対角行列を表していてよい。エコー消去モジュール３３０は、以下の式に基づいて行列Ｓ_ｆ（ｍ）を再帰的に更新することができる。

[数２９]

ここで、（・）^＊は複素共役演算子であってよい。

エコー消去モジュール３３０は、Ｉ_{２Ｌ×２Ｌ}／２として
[数３０]
を近似させることにより、ＦＬＭＳアルゴリズムの更新バージョンを演繹することができる。エコー消去モジュール３３０は、適応フィルタ５０５を再帰的に更新することができる。例えば、適応フィルタ５０５は、Ｌサンプルごとに１回更新されてもよい。エコー消去モジュール３３０のようにＬが大きい場合、長い遅延は、適応アルゴリズムの追従能力を低下させる可能性がある。したがって、エコー消去モジュール３３０において、演算の複雑さを犠牲にすることは、より高い又はより低い割合のオーバーラップを使用することによって高い追従性能を実現できるので意義のあることである。

式（１６）に基づいて、ＦＬＭＳアルゴリズムは、ＲＬＳ（Recursive Least-Squares）基準に基づいて適合され得る。エコー消去モジュール３３０は、忘却因子λを調整することにより、収束率、追跡、整合不良、ＦＬＭＳアルゴリズムの安定性など、又はそれらの任意の組合せを制御することができる。忘却因子λは、１つ以上の周波数ビンにおいて、個別に時間変化可能である。一部の実施形態において、忘却因子λを調整するために、式（１８）におけるステップサイズμ及び正則化δを無視してもよい。忘却因子λを、以下の式（２０）〜（３１）を参照して説明する１つ以上の操作を実行することによって調整してもよい。一部の実施形態において、ＦＬＭＳアルゴリズム（例えば、無制約ＦＬＭＳアルゴリズム）の更新ルールは、以下のように決定されてもよい。

[数３１]

ここで、以下の通りである。

[数３２]

[数３３]

事前エラーベクトルｅ_ｆ（ｍ）の周波数領域は、（１５）を（１７）に代入することによって以下のように書き直される。

[数３４]

ここで、以下の通りである。
[数３５]

[数３６]

エコー消去モジュール３３０において、以下のように、事前エラーベクトルε_ｆ（ｍ）の周波数領域を決定することができる。

[数３７]

エコー消去モジュール３３０は、式（２０）を式（２２）に代入し、且つ式（２１）を使用して以下の式を導き出すことができる。

[数３８]

近似値
[数３９]
を使用することができ、

[数４０]

予想関数Ｅ［ψ_ｌ（ｍ）］は、以下のように決定されてもよい。

[数４１]

一部の実施形態において、忘却因子λ、及び／又は、行列Λ_ｖ（ｍ）は、以下の式が成立するように、エコー消去モジュール３３０によって調整されてもよい。

[数４２]

このように、エコー消去モジュール３３０は、以下を満たすことによって
[数４３]
適応フィルタのための解を得ることができる。

[数４４]

エコー消去モジュール３３０は、式（２３）を式（２６）に代入することによって以下の式を導出することができる。

[数４５]

ここで、
[数４６]
はランダム変数ａの第２モーメント、すなわち
[数４７]
を表す。一部の実施形態において、事前エラー信号が入力信号と無相関であると仮定し、これに基づいて式（２８）を導出することができる。式（２５）に基づいて、エコー消去モジュール３３０は、式（２８）から以下の式を導出することができる。

[数４８]

一部の実施形態において、適応フィルタはある程度収束することができ、エコー消去モジュール３３０は、以下の近似値に基づいてＦＬＭＳアルゴリズムの可変忘却因子制御方式を構築することができる。

[数４９]

可変忘却因子制御方式は、以下の式に基づいて構成することができる。

[数５０]

ここで、
[数５１]
は、エコー消去モジュール３３０によって対応する信号からそれぞれ再帰的に推定することができる。

上述の適応アルゴリズムに基づいて、適応フィルタ５０５の出力
[数５２]
は、オーディオセンサ５０８の出力信号ｙ（ｎ）５１５から推定及び減算されて、音響エコー及びフィードバック消去を達成することができる。

一部の実施形態において、ＤＴＤ５０３は、１つ以上のダブルトークの発生を検出することができる。例えば、ダブルトークは、スピーカ信号５０７及び出力信号５１５が、同時に適応フィルタ５０５に存在するときに発生していると判定されてもよい（例えば、ｘ（ｎ）≠０及びｖ（ｎ）≠０）。スピーカ信号５０７の存在は、適応フィルタ５０５の性能に影響（例えば、適応アルゴリズムを分岐させる）を及ぼすおそれがある。例えば、可聴エコーは、エコー消去モジュール３３０を通過し、ＡＥＣシステム５００の出力５１７に現れることができる。一部の実施形態において、ダブルトークの発生を検出すると、ＤＴＤ５０３は、適応フィルタ５０５においてダブルトークの存在を示す制御信号を生成することができる。制御信号は、適応フィルタ５０５、及び／又は、ＡＥＣ３３０の他のコンポーネントに送信され、（例えば、適応フィルタ５０５の係数の更新を停止することにより）適応アルゴリズムの適応を停止又は減速させることができる。

ＤＴＤ５０３は、ゲイゲル（Geigel）アルゴリズム、相互相関法、コヒーレンス法、２パス法等、又は、これらの任意の組合せを用いてダブルトークを検出することができる。ＤＴＤ５０３は、スピーカ信号５０７と出力信号５１５との間の相互相関に関する情報に基づいて、ダブルトークの発生を検出することができる。一部の実施形態において、スピーカとマイク信号との間の高い相互相関は、ダブルトークの不在を示すことができる。スピーカ信号５０７と出力信号５１５との間の低い相互相関は、ダブルトークの発生を示すことができる。一部の実施形態において、スピーカ信号とマイク信号との間の相互相関は、１つ以上の検出統計を使用して表すことができる。相互相関は、相関関係を表す１つ以上の検出統計が閾値以上である場合に、高い相関であるとみなされてもよい。同様に、相互相関は、相関関係を表す１つ以上の検出統計が所定の閾値以下である場合に、高い相関であるとみなされてもよい。ＤＴＤ５０３は、適応フィルタ５０５の係数（例えば、
[数５３]
）、スピーカ信号５０１、マイク信号５１５、エラー信号ｅ、及び／又は、スピーカ信号５０７と出力信号５１５とのコヒーレンス、及び／又は、相互相関の決定に用いられる他の情報に基づいて、１つ以上の検出統計値を決定することにより、スピーカ信号と出力信号との関係を決定することができる。一部の実施形態において、ＤＴＤ５０３は、検出統計を所定の閾値と比較することによってダブルトークの発生を検出することができる。

ダブルトークの発生を検出すると、ＤＴＤ５０３は、制御信号を生成して、適応フィルタ５０５を一定期間無効又は停止させることができる。ダブルトークが発生していない、及び／又は、所定の時間間隔にダブルトークが発生しなかったと判定されると、ＤＴＤ５０３は、適応フィルタ５０５を有効にする制御信号を生成することができる。

一部の実施形態において、ＤＴＤ５０３は、相互相関又はコヒーレンス的な統計（coherence-like statistics）に基づいてダブルトーク検出を実行することができる。決定統計は、例えば、１を上限値にすることにより、さらに正規化することができる。一部の実施形態において、ダブルトーク検出に用いられる閾値が決定されている場合に、音響経路の変形例は考慮されてもよく、考慮されなくてもよい。

一部の実施形態において、周波数領域において、１つ以上の検出統計を導出することができる。一部の実施形態において、スピーカ信号５０７と出力信号５１５との相関関係を表す１つ以上の検出統計は、周波数領域において、例えば、ＤＴＤ５０３によって決定されてもよい。

例えば、ＤＴＤ５０３は、擬似コヒーレンスに基づくＤＴＤ（ＰＣ−ＤＴＤ）技術に基づいて、１つ以上の検出統計を判定し、及び／又は、ダブルトーク検出を行うことができる。ＰＣ−ＤＴＤは、以下のように定義可能な擬似コヒーレンス（ＰＣ）ベクトル
[数５４]
に基づいたものであってよい。

[数５５]

ここで、以下の通りである。

[数５６]

[数５７]

[数５８]

[数５９]

エコー消去モジュール３３０は、近似値
[数６０]
を用いてФ_ｆ，ｘｘを算出することができる。上記演算は、忘却因子λ_ｂ（本明細書では「バックグラウンド忘却因子」とも呼ばれる）を調整することによって、式（１９）と同様の再帰的推定スキームで簡略化することができる。バックグラウンド忘却因子λ_ｂは、上述した忘却因子λ_ａ（本明細書では「フォアグラウンド忘却因子」とも呼ばれる）と同じであってもよく、同じでなくてもよい。ＤＴＤ５０３は、近端スピーチの開始に応答して、分岐が開始する前に適応フィルタに警告することができる。推定量は、以下の式に基づいて決定されてもよい。

[数６１]

[数６２]

[数６３]

一部の実施形態において、Ф_ｆ，ｘｘ（ｍ）は近似値
[数６０]
によって（１９）で定義されたＳ_ｆ（ｍ）と若干異なってもよい。Ф_ｆ，ｘｘ（ｍ）は対角行列であってもよいため、その逆数が簡単に決定され得る。

検出統計は、ＰＣベクトルに基づいて決定され得る。例えば、検出統計量は、以下の式に基づいて決定されてもよい。

[数６４]

一部の実施形態において、ＤＴＤ５０３は、検出統計（例えば、ξの値又は他の検出統計）を所定の閾値と比較し、比較の結果に基づいてダブルトークの発生を検出することができる。例えば、ＤＴＤ５０３は、検出統計が所定の閾値以下であると判定した場合、ダブルトークが存在すると判定することができる。別の例として、ＤＴＤ５０３は、検出統計値が所定の閾値よりも大きいと判定した場合に、ダブルトークが存在しないと判定することができる。例えば、以下のように決定することができる。

[数６５]

ここで、パラメータＴは、所定の閾値であってもよい。パラメータＴは、任意の適切な値を有してもよい。一部の実施形態において、Ｔの値はある範囲（例えば、０＜Ｔ＜１，０．７５≦Ｔ≦０．９８など）であってもよい。

別の例として、ＤＴＤ５０３は、２フィルタ構造を用いてダブルトーク検出を行うこともできる。式（３２）から、時間フレームｍにおける決定統計量ξ^２（ｍ）の２乗は、次のように書き直されてもよい。

[数６６]

ここで、（・）^Ｈは１つ以上の行列又はベクトルのエルミート転置を表してもよい。

[数６７]

上記式は、等価「バックグラウンド」フィルタと定義することができる。適応フィルタ５０５は、以下のように更新することができる。

[数６８]

[数６９]

方程式（３３）〜（３５）に示されるように、単極回帰平均は、遠くの過去よりも近くの過去に重く重み付けすることができる。対応するインパルス応答は、
[数７０]
（ｎ＞０）として減衰する。λ_ｂの値は、追従能力、推定分散、及び／又は、他の因子に基づいて決定されてもよい。λ_ｂの値は、固定値（例えば、定数）、変数（例えば、後述する再帰技法を用いて決定される値）などであってもよい。一部の実施形態において、λ_ｂの値は、０＜λ_ｂ＜１を満たすように選択することができる。一部の実施形態において、λ_ｂが減少すると、推定量の変化に追従する能力は向上するが、推定値の分散を高めることになり得る。ＰＣ−ＤＴＤの場合、λ_ｂは次のようにして求めることができる。

[数７１]

ここでρはオーバーラップの割合であり、ｆ_ｓはサンプリング率であり、ｔ_ｃ，ｂは再帰性平均化の時定数であってもよい。一部の実施形態において、ＤＴＤ５０３は、ローカルスピーチｖ（ｎ）５１１の１つ以上のバーストのアタック端（例えば、ダブルトークの発生）を捕捉することができる。λ_ｂの値は、追従能力と推定分散との釣り合いを考慮して選択することができる。例えば、λ_ｂに小さな値を割り当てて、ローカルスピーチにおける１つ以上のバーストのアタック端を捕捉してもよい。しかし、λ_ｂが小さすぎると、決定統計量推定値ξが閾値を超えて変動し、ダブルトークが継続し、誤検出を招く虞がある。

一部の実施形態において、現在のフレームに対応する忘却因子λ_ｂの値は、１つ以上の前のフレーム中のダブルトークの有無に基づいて変化することができる。例えば、λ_ｂの値は、再帰技法（例えば、両側単極再帰技法）を使用して決定することができる。エコー消去モジュール３３０は、以下のように式（４２）のルールによってｔ_ｃ，ｂを管理することができる。

[数７２]

ここで、ｔ_{ｃ，ｂ，ａｔｔａｃｋ}は、本明細書では「アタック」係数と称する係数であってもよく、ｔ_{ｃ，ｂ，ｄｅｃａｙ}は、本明細書では「減衰」係数と称する係数であってもよい。一部の実施形態において、「アタック」係数および「減衰」係数は、不等式ｔ_{ｃ，ｂ，ａｔｔａｃｋ}＜ｔ_ｃ＜ｔ_{ｃ，ｂ，ｄｅｃａｙ}を満たすように選択することができる。例えば、エコー消去モジュール３３０は、ｔ_{ｃ，ｂ，ａｔｔａｃｋ}＝３００ｍｓ、及び、ｔ_{ｃ，ｂ，ｄｅｃａｙ}＝５００ｍｓとなるように選択することができる。一部の実施形態において、前のフレームでダブルトークが検出されなかった場合、小さいｔ_ｃ，ｂ及び小さいλ_ｂを使用することができる。あるいは、前のフレームが既にダブルトークの一部である（例えば、前のフレームに関してダブルトークの発生が検出された）場合、大きいλｂを選択することができ、ダブルトークは、スピーチの性質上しばらく継続する可能性がある。これによりξの変化が円滑化され、検出漏れの防止が可能となる。さらに、この状況におけるより大きいλｂは、（例えば、「フォアグラウンド」フィルタの場合のように）バックグラウンドフィルタを完全に停止するのではなく、更新を遅くする。

図６は本発明の実施形態におけるＡＥＣシステムの一例６００を示す図である。

図示のように、ＡＥＣ６００は、スピーカ６０１ａ〜ｚ、１つ以上のＤＴＤ６０３、適応フィルタ６０５ａ〜ｚ、１つ以上の結合器６０６、６０８、オーディオセンサ６１９ａ、６１９ｚ、及び／又は、音響エコー消去を実行するための他の適切なコンポーネントを含む。ＡＥＣ６００は、また普遍性を損なうことなく多少のコンポーネントを含んでいてもよい。例えば、２つのモジュールを１つのモジュールに統合してもよく、１つのモジュールを２つ以上のモジュールに分割してもよい。一例において、１つ以上のモジュールが、複数の演算装置（例えば、異なるサーバコンピュータ）に存在してもよい。

一部の実施形態において、ＡＥＣ６００の１つ以上のコンポーネントが、図３のエコー消去モジュール３３０に含まれてもよい。例えば、図６に示すように、エコー消去モジュール３３０は、ＤＴＤ６０３、適応フィルタ６０５ａ〜ｚ、結合器６０６、及び、結合器６０８を含むことができる。一部の実施形態において、図６のＤＴＤ６０３は図５のＤＴＤ５０３と同じであってもよい。

各スピーカ６０１ａ〜ｚは、オーディオ信号を対応する音に変換することができる装置であってもよく、及び／又は、そのような装置を含んでいてもよい。各スピーカ６０１ａ〜ｚは、スタンドアローン型の装置であってもよく、又は、１つ以上の他の装置と一体化されてもよい。例えば、各スピーカ６０１ａ〜ｚは、自動車オーディオシステムの内蔵型スピーカ、携帯電話と一体化されたスピーカなどであってもよい。スピーカ、オーディオセンサ、適応フィルタなどが幾つか図６に示されているが、これは例示に過ぎない。スピーカ、オーディオセンサ、適応フィルタなどは、任意の数をＡＥＣ６００に設けることができる。

スピーカ６０１ａ、ｂ、及び、ｚはそれぞれ、スピーカ信号６０７ａ、ｂ、及び、ｚを出力することができる。スピーカ信号６０７ａ〜ｚは、それぞれ対応する音響経路（例えば、音響経路６１９ａ〜ｚ）を通過し、エコー信号６０９を生成することができる。エコー信号６０９は、ローカルスピーチ信号５１１と共に、オーディオセンサ６０３ａ、及び／又は、６０３ｂによって捕捉され、ローカルノイズ信号５１３、及び／又は、他の信号は、オーディオセンサ６１９ａ〜ｚによって捕捉されることができる。

各オーディオセンサ６１９ａ〜ｚは、出力信号６１５を出力してもよい。エコー消去モジュール３３０は、適応フィルタ６０５ａ、６０５ｂ、及び、６０５ｚを使用して音響経路６１９ａ〜ｚをモデル化することによりエコー信号６０９を推定してもよい。適応フィルタ６０５ａ〜ｚは、エコー信号６０９を生成するための有限インパルス応答（ＦＩＲ）を有するフィルタであってもよく、及び／又は、それを含んでいてもよい。次いで、エコー消去モジュール３３０は、適応アルゴリズムを使用してフィルタを推定することができる。

適応フィルタ６０５ａ〜ｚはそれぞれ、スピーカ信号６０７ａ〜ｚを受信することができる。各適応フィルタは、スピーカ信号の１つに対応する推定エコー信号を生成して出力することができる。適応フィルタ６０５ａ〜ｚの出力は、スピーカ信号６０７ａ〜ｚに対応する推定エコー信号を表すことができる。結合器６０６は、出力を組み合わせて、エコー信号６０９（例えば、信号
[数５２]
）の推定値を表す信号を生成することができる。

一部の実施形態において、スピーカ信号６０７ａ〜ｚが適応フィルタ６０５ａ〜ｚに供給される前に、１つ以上のスピーカ信号に対して変換を行い、スピーカ信号の相関を低減することができる。例えば、変換はゼロメモリ非線形変換を含むことができる。より具体的には、例えば、スピーカ信号に半波整流バージョンのスピーカ信号を追加することにより、及び／又は、非線形性を制御するスケール因子を適用することによって、変換を実行することができる。一部の実施形態において、変換は、式（４８）に基づいて実行されてもよい。別の例において、変換は、１つ以上のスピーカ信号に相関のないノイズ（例えば、ホワイトガウスノイズ、シュレーダーノイズなど）を加えることによって実行されてもよい。更に別の例において、複数の時変オールパスフィルタを１つ以上のスピーカ信号に適用することができる。

一部の実施形態において、各スピーカ信号６０７ａ〜ｚに対して変換を行い、対応する変換されたスピーカ信号を生成することができる。適応フィルタ６０５ａ〜ｚは、拡声器信号６０７ａ〜ｚに対応する変換されたスピーカ信号を処理して、エコー信号６０９の推定値を生成することができる。

結合器６０８は、推定エコー信号
[数５２]
と出力信号６１５とを合成することにより、エコー消去済み信号６１７を生成することができる。例えば、エコー消去済み信号６１７は、出力信号６１５から推定エコー信号を減じて生成することにより、エコー、及び／又は、フィードバック消去を達成することができる。

図６に示されるように、オーディオセンサ６１９ａ〜ｚの１つによって捕捉された音響エコーｙｅ（ｎ）６０９は、対応する音響経路６１９ａ〜ｚからの異なっているが相関性の高いＫ個の（Ｋ≧２）スピーカ信号６０７ａ〜ｚに起因することもある。オーディオセンサ６１９ａの出力信号６１５は、真の音響インパルス応答に基づいてモデル化することができ、エコー信号６０９、スピーチ信号５１１、ローカルノイズ信号５１３等に対応する１つ以上の成分を含むことができる。例えば、オーディオセンサの出力信号６１５は、以下のようにモデル化することができる。

[数７３]

ここで、エコー消去モジュール３３０における定義は、以下のようにすることができる。

[数７４]

[数７５]

式（４３）において、ｘ_ｋ（ｎ）はスピーカ信号６０７ａ〜ｚに対応し、ｗ（ｎ）は、ローカルスピーチ信号５１１とローカルノイズ信号５１３との和に対応する。

エコー消去モジュール３３０は、ベクトルｘ（ｎ）及びｈ（ｎ）のスタックを次のように定義することができる。

[数７６]

[数７７]

式（４３）は以下のようであってもよい。

ｙ（ｎ）＝ｘ^Ｔ（ｎ）・ｈ＋ｗ（ｎ），（４４）

ｘ（ｎ）とｈの長さはＫＬとすることができる。一部の実施形態において、事後エラー信号ε（ｎ）及びその関連コスト関数Ｊは、以下のように定義することができる。

[数７８]

[数７９]

コスト関数を最小化することにより、エコー消去モジュール３３０は、以下のように、ウィナー（Ｗｉｎｅｒ）フィルタを演繹することができる。

[数８０]

ここで、以下の通りである。
[数８１]

[数８２]

マルチスピーカＡＥＣシステム６００では、スピーカ信号６０７ａ〜ｚを相関させることができる。一部の実施形態において、単一スピーカのために開発される適応アルゴリズムは、マルチスピーカエコー消去に直接適用されない。これは、事後誤差ε（ｎ）をある値に駆動しながら、所望のフィルタ［例えば、
[数８３]
］
を得ることができないためである。例えば、この値は０であってもよい。

この問題を解決するにあたって、複数のスピーカ信号ｘ（ｎ）５０７の相関をある程度低減することが課題となる。ある程度とは、適応アルゴリズムを適切なフィルタに収束させるのに十分でありつつ、知覚的に無視できるぐらいに低くなる程度であればよい。一部の実施形態において、エコー消去モジュール３３０は、スピーカ信号に半波整流バージョンのスピーカ信号を加えることができる。スピーカ信号は、非線形性を制御するために定数αによって調整することもできる。一部の実施形態において、変換は以下の式に基づいて実行されてもよい。

[数８４]

適応フィルタ６０５ａ〜ｚは、スピーカ６０１ａ〜ｚに対応させることができる。一部の実施形態において、適応フィルタ６０５ａ〜ｚの数、及び、スピーカ６０１ａ〜ｚの数は同じであってもよく、異なっていてもよい。適応フィルタ６０５ａ〜ｚを推定し、推定された適応フィルタ６０５ａ〜ｚの和をオーディオセンサ６１９ａの出力信号６１５から減じることにより、音響エコー、及び／又は、フィードバック消去を達成することができる。

図７は、本発明の実施形態におけるオーディオ信号の処理の一例７００を示すフローチャートである。一部の実施形態において、方法７００の１つ以上の動作は、１つ以上のプロセッサ（例えば、図１〜６を参照して説明する１つ以上のプロセッサ１２０）によって実行することができる。

図示されるように、７０１における１つ以上のオーディオチャネルに対応する１つ以上のマイクサブアレイによって生成される１つ以上のオーディオ信号を受信することによって処理７００を開始することができる。各オーディオ信号は、スピーチ成分、ローカルノイズ成分、及び、１つ以上のスピーカ信号等、又は、それらの任意の組み合わせに対応するエコー成分を含むことができるが、これに限定されない。一部の実施形態において、本開示におけるセンササブアレイは、ＭＥＭＳマイクサブアレイであってもよい。一部の実施形態において、マイクサブアレイは、図２Ａ〜Ｂを参照して説明するように配置することができる。

処理７００のステップ７０３において、オーディオ信号に対して空間フィルタを実行することによって、１つ以上の空間フィルタ済み信号を生成することができる。一部の実施形態において、図３〜４を参照して説明する空間フィルタモジュール３２０によって空間フィルタの１つ以上の操作を実行することができる。

一部の実施形態において、空間フィルタ済み信号はマイクサブアレイによって生成されるオーディオ信号に対して空間フィルタを実行することによって生成されてもよい。例えば、空間フィルタ済み信号が、受信される各オーディオ信号に対して生成されてもよい。これに代わり、またはこれに加えて、空間フィルタ済み信号は、複数のマイクサブアレイによって生成される複数のオーディオ信号の組み合わせに対して空間フィルタを実行することによって生成することもできる。

適切な操作によって、空間フィルタ済み信号を生成することができる。例えば、空間フィルタ済み信号は、１つ以上のビームフォーマを使用して１つ以上のオーディオ信号に対してビームフォーミングを行うことによって生成されてもよい。一部の実施形態において、ビームフォーミングは、上記の図３〜図４を参照して説明するように１つ以上のビームフォーマによって実行することができる。別の例として、空間フィルタ済み信号は、（例えば、出力信号にローパスフィルタを適用することによって）一又は複数のビームフォーマの出力信号をイコライジングすることによって生成することができる。一部の実施形態において、均等化は、上記の図３〜図４を参照して説明するような１つ以上のローパスフィルタによって実行することができる。空間フィルタは、以下に図８を参照して説明する１つ以上の操作によって実行されてもよい。

処理７００のステップ７０５において、空間フィルタ済み信号に対してエコー消去を行い、１つ以上のエコー消去済み信号を生成することができる。例えば、空間フィルタ済み信号のエコー成分を推定し、空間フィルタ済み信号から推定されたエコー成分を減算することによって、空間フィルタ済み信号に対してエコー消去を実行することができる。エコー成分は、１つ以上のスピーカによって生成される１つ以上のスピーカ信号に対応するものであってもよい。エコー成分は、エコー成分が生成される音響経路をモデル化する適応フィルタに基づいて推定されてもよい。

一部の実施形態において、エコー消去は、図３、図５、及び図６を参照して説明するエコー消去モジュールによって実行することができる。オーディオ信号のエコー、及び、フィードバック消去に使用されるアルゴリズムは、ＮＬＭＳ（Normalized Least Mean Square）、アフィン射影（ＡＰ）、ＢＬＭＳ（Block Least Mean Square）、及び、ＦＬＭＳ（Frequency-Domain Least Mean Square）アルゴリズム等、又は、これらの組み合わせを含んでいてもよいが、これらに限定されない。一部の実施形態において、エコー消去は、以下の図９を参照して説明する１つ以上の操作によって実行されてもよい。

処理７００のステップ７０７において、１つ以上のオーディオチャネルを選択することができる。この選択は、図３に示すノイズリダクションモジュール３４０（例えば、チャネル選択部３４２）によって決定されてもよい。一部の実施形態において、上記選択には、オーディオ信号の１つ以上の特性に基づいて、統計又はクラスタアルゴリズムを使用するものであってもよい。一部の実施形態において、複数のオーディオチャネルを介して提供される複数のオーディオ信号の品質に基づいて、１つ以上のオーディオチャネルを選択することができる。例えば、１つ以上のオーディオチャネルは、複数のオーディオチャネルによって提供される複数のオーディオ信号の信号対雑音比（ＳＮＲ）に基づいて選択されてもよい。より詳細には、例えば、チャネル選択部３４２は、最高ＳＮＲ、最上位３つのＳＮＲ、閾値より高いＳＮＲなど、特定の品質（例えば、特定のＳＮＲ）に関連する１つ以上のオーディオチャネルを選択することができる。一部の実施形態において、選択は、ユーザ設定、適応的計算等、又は、それらの任意の組み合わせに基づいて決定されてもよい。一部の実施形態において、処理７００からステップ７０７を省略することができる。これに代わり、またはこれに加えて、一部の実施形態において、全部のオーディオチャネルを選択することができる。

処理７００のステップ７０９において、選択された一又は複数のオーディオチャネルに対応する複数のエコー消去済み信号に対してノイズリダクションを行い、１つ以上のノイズ消去済み信号を生成することができる。各ノイズ消去済み信号は、所望のスピーチ信号に対応させることができる。一部の実施形態において、ノイズリダクションは、図３に示すノイズリダクションモジュール３４０によって実行されてもよい。例えば、ＭＣＮＲ部３４４は、１つ以上のノイズリダクションフィルタを構築することができ、一又は複数のノイズリダクションフィルタを複数のエコー消去済み信号に適用することができる。一部の実施形態において、ノイズリダクションは、以下図１０を参照して説明する１つ以上の操作によって実行されてもよい。

処理７００のステップ７１１において、一又は複数のノイズ低減済み信号に対してノイズ、及び／又は、エコー抑制を実行して、スピーチ信号を生成することができる。一部の実施形態において、ノイズリダクションモジュール３４０の残留ノイズ及びエコー抑制部３４６によって、残留ノイズ及びエコー抑制を実行することができる。例えば、残留ノイズ及びエコー抑制部３４６は、ＭＣＮＲ部３４４に除去されない残留ノイズ、及び／又は、エコーを抑制することができる。

処理７００のステップ７１３において、音声信号を出力することができる。音声信号は、更に処理され様々な機能を提供することができる。例えば、前記構成は、スピーチ信号を解析することにより（例えば、１つ以上の適切な音声認識技術、及び／又は、その他の任意の信号処理技術を使用して）、スピーチ信号の内容を判断してもよい。次に、処理７００及び／又は他のプロセスによるスピーチ信号の解析された内容に基づいて、１つ以上の操作を実行することができる。例えば、前記構成は、解析された内容に基づいてメディアコンテンツ（例えば、オーディオコンテンツ、ビデオコンテンツ、画像、グラフィックス、テキスト等）を提示することができる。より具体的には、例えば、メディアコンテンツは、地図、ウェブコンテンツ、ナビゲーション情報、ニュース、オーディオクリップ、及び／又は、スピーチ信号の内容に関連する他の情報に関連するものであってよい。別の例としては、ユーザが電話をかけることができる。更に別の例において、スピーチ信号に基づいて１つ以上のメッセージの送受信等を行うことができる。更に別の例では、例えば、検索を実行することができるサーバに要求を送信することにより、解析されたコンテンツの検索を行ってもよい。

図８は本発明の実施形態の空間フィルタ処理の例８００を示すフローチャートである。一部の実施形態において、処理８００は、図１〜４を参照して説明するように、空間フィルタモジュール３２０を実行する１つ以上のプロセッサによって実行されてもよい。

処理８００のステップ８０１において、オーディオセンサのサブアレイの第１オーディオセンサによって捕捉された音響入力を表す第１オーディオ信号を受信することができる。音響入力は、ユーザの音声、及び／又は、１つ以上の音源からの任意の入力に対応していてもよい。処理８００のステップ８０３において、サブアレイの第２オーディオセンサによって捕捉された音響入力を表す第２オーディオ信号を受信することができる。一部の実施形態において、第１オーディオ信号及び第２オーディオ信号は、同じであってもよく、異なっていてもよい。第１オーディオ信号及び第２オーディオ信号は、同時に、略同時に、及び／又は、他の様式で受信されてもよい。各第１オーディオセンサ及び第２オーディオセンサは、図１を参照して説明するシステム１００のオーディオセンサ１１０など、任意の適切なオーディオセンサであってもよく、及び／又は、これを含んでいてもよい。第１オーディオセンサ及び第２オーディオセンサは、図２Ａ、図２Ｂ及び図４を参照して説明するマイクサブアレイが形成されるように配置されてもよい。

処理８００のステップ８０５において、第２オーディオ信号に時間遅延を適用することによって遅延オーディオ信号を生成することができる。一部の実施形態において、遅延オーディオ信号は、図３に示すように空間フィルタモジュール３２０の一又は複数のビームフォーマ３２２（例えば、図４に示す遅延モジュール４３０）によって生成されてもよい。一部の実施形態において、時間遅延は、第１オーディオセンサと第２オーディオセンサとの距離に基づいて決定され適用されてもよい。例えば、時間遅延は、方程式（２．１）、及び／又は、方程式（２．２）に基づいて計算することができる。

処理８００のステップ８０７において、第１オーディオ信号と遅延オーディオ信号とを組み合わせて、合成信号を生成することができる。一部の実施形態において、合成信号は、図３に示されるように空間フィルタモジュール３２０の一又は複数のビームフォーマ３２２（例えば、図４に示される結合モジュール４４０）によって生成されてもよい。合成信号は、方程式（１）、及び／又は、（２）を使用して表すことができる。

処理８００のステップ８０９において、合成信号を均等化することができる。例えば、プロセス８００は、合成信号にローパスフィルタ（例えば、図３の一又は複数のローパスフィルタ３２４）を適用することによって、合成信号を均等化することができる。

処理８００のステップ８１１において、オーディオセンサのサブアレイの出力として均等化信号を出力することができる。

図９は本発明の実施形態のエコー消去処理の例９００を示すフローチャートである。一部の実施形態において、処理９００は、図３のエコー消去モジュール３３０を実行する１つ以上のプロセッサによって実行され得る。

処理９００のステップ９０１において、スピーチ成分及びエコー成分を含むオーディオ信号を受信することができる。オーディオ信号は、オーディオセンサに捕捉され得る他の成分を含んでいてもよい。一部の実施形態において、エコー成分及びスピーチ成分は、上記の図５を参照して説明するように、エコー信号５０９及びローカルスピーチ信号５１１に対応させることができる。

処理９００のステップ９０３において、エコー成分が生成される基準オーディオ信号を取得することができる。一部の実施形態において、基準オーディオ信号は、図５〜図６を参照して上述した１つ以上のスピーカ信号であってもよく、及び／又は、これを含んでいてもよい。これに代わり、またはこれに加えて、基準オーディオ信号は、一又は複数のスピーカ信号に基づいて生成された１つ以上の信号を含んでいてもよい。例えば、基準オーディオ信号は、スピーカ信号に基づいて（例えば、式（４８）に基づいて）生成される変換信号を含んでいてもよい。

処理９００のステップ９０５において、エコー成分が生成される音響経路を表すモデルを構築することができる。例えば、音響経路は、１つ以上の適応フィルタを使用して構築することができる。一部の実施形態において、１つ以上の音響経路を表す１つ以上のモデルが存在し得る。音響経路モデルは、適応音響経路モデル、オープン音響経路モデル、線形音響経路モデル、非線形音響経路モデル等、又は、それらの組み合わせとすることができる。一部の実施形態において、上記モデルは、方程式（５）〜（４８）の１つ以上に基づいて構築されてもよい。

処理９００のステップ９０７において、モデル及び基準オーディオ信号に基づいて推定エコー信号を生成することができる。例えば、推定エコー信号は、結合器６０６において構築された適応フィルタの出力信号であってもよく、及び／又は、これを含んでいてもよい。一部の実施形態において、図６を参照して説明するように、推定エコー信号は、複数の適応フィルタによって生成された複数の出力の組み合わせであってもよい。

処理９００のステップ９０９において、推定エコー信号とオーディオ信号とを組み合わせることによってエコー消去済み信号を生成することができる。例えば、エコー消去済み信号は、オーディオ信号から推定エコー信号を減ずることによって生成することができる。

図１０は本発明の実施形態のマルチチャネルノイズリダクション処理の例１０００を示すフローチャートである。一部の実施形態において、処理１０００は、図３のノイズリダクションモジュール３４０を実行する１つ以上のプロセッサによって実行されてもよい。

処理１０００のステップ１００１において、複数のオーディオセンサによって生成された複数の入力信号を受信することができる。オーディオセンサは、アレイ（例えば、線形アレイ、差動アレイなど）を形成することができる。各オーディオ信号は、スピーチ成分、ノイズ成分、及び／又は、他の成分を含んでもよい。スピーチ成分は、所望のスピーチ信号（例えば、ユーザの音声を表す信号）に対応させることができる。スピーチ成分は、未知のソースからのチャネルインパルス応答に基づいてモデル化することができる。ノイズ成分は、顕著なノイズ、及び／又は、他の種類のノイズに対応し得る。一部の実施形態において、複数の入力信号は、複数のオーディオセンサの出力信号であってもよく、及び／又は、これを含んでいてもよい。或いは、複数の入力信号は、図３の空間フィルタモジュール３２０、図３のエコー消去モジュール３３０、及び／又は、他の装置によって生成された複数の信号であってもよく、及び／又は、これを含んでいてもよい。

一部の実施形態において、複数の出力信号は、アレイ（例えばＰ個のオーディオセンサ）を形成する特定の数のオーディオセンサによって生成されてもよい。処理１０００は、以下のように複数のオーディオセンサの出力信号をモデル化することができる。

ｙ_ｐ（ｎ）＝ｇ_ｐ・ｓ（ｎ）＋ｖ_ｐ（ｎ）（４９）

＝ｘ_ｐ（ｎ）＋ｖ_ｐ（ｎ），ｐ＝１，２，．．．Ｐ，（５０）

ここで、ｐはオーディオセンサのインデックスであり、ｇ_ｐは、未知のソースｓ（ｎ）からｐ番目のオーディオセンサまでのチャネルインパルス応答であり、ｖ_ｐ（ｎ）は、オーディオセンサｐのノイズであってもよい。一部の実施形態において、フロントエンドは、差動オーディオセンサのサブアレイを含んでもよい。チャネルインパルス応答は、室内インパルス応答及び差動アレイのビームパターンの両方を含んでよい。信号ｘ_ｐ（ｎ）及びｖ_ｐ（ｎ）は、無相関及びゼロ平均であってもよい。

一部の実施形態において、第１オーディオセンサは、最も高いＳＮＲを有することができる。例えば、処理１０００では、ＳＮＲによって複数の出力信号をランク付けし、それに応じてこれら出力信号を再インデックスすることができる。

一部の実施形態において、ＭＣＮＲ部は、時間領域または空間領域からの１つ以上の出力信号を周波数領域に、又は、その逆に変換することができる。例えば、各オーディオ信号に対して時間−周波数変換を行うことができる。時間−周波数変換は、例えば、高速フーリエ変換、ウェーブレット変換、ラプラス変換、Ｚ変換など、又は、それらの任意の組合せであってもよく、及び／又は、それらを含んでいてもよい。ＦＦＴは、素因数（Prime-factor）ＦＦＴアルゴリズム、ブルーン（Bruun）ＦＦＴアルゴリズム、レーダー（Rader）ＦＦＴアルゴリズム、ブルーステイン（Bluestein）ＦＦＴアルゴリズムなどを含んでよいが、これらに限定されない。

例えば、処理１０００では、短時間フーリエ変換（ＳＴＦＴ）を用いて、式（４９）を周波数領域に変換し、以下の式を生成することができる。

Ｙ_ｐ（ｊω）＝Ｇ_ｐ（ｊω）・ｓ（ｊω）＋Ｖ_ｐ（ｊω）（５１）

＝Ｘ_ｐ（ｊω）＋Ｖ_ｐ（ｊω），ｐ＝１，２，…Ｐ，（５２）

ここで、
[数８５]
ωは、角周波数、Ｙ_ｐ（ｊω）、Ｓ（ｊω）、Ｇ_ｐ（ｊω）、又は、Ｘ_ｐ（ｊω）＝Ｇ_ｐ（ｊω）・Ｓ（ｊω）であってもよく、Ｖ_ｐ（ｊω）は、ｙ_ｐ（ｎ）、ｓ（ｎ）、ｇ_ｐ、ｘ_ｐ（ｎ）、又は、ｖｐ（ｎ）の短時間フーリエ変換であってもよい。

処理１０００のステップ１００３において、入力オーディオ信号に対するスピーチ信号の推定を決定することができる。例えば、推定は、複数の入力信号に対する１つ以上のパワースペクトル密度（ＰＳＤ）行列を決定することによって実行されてもよい。より具体的には、例えば、任意の入力信号（例えば、ｐ番目の入力オーディオ信号）ｙ _ｐ（ｎ）のＰＳＤは、以下のように決定され得る。

[数８６]

ここで、

[数８７]

は、２つの信号ａ（ｎ）とｂ（ｎ）との間のクロススペクトルであってもよく、φ_ａａ（ω）、及び、φ_ｂｂ（ω）は、それぞれのＰＳＤであってもよく、Ｅ｛・｝は、数学的予測値を表してもよく、（・）^＊は、複素共役を表してもよい。時系列解析では、クロススペクトルは、２つの時系列間の相互相関又は相互共分散の周波数領域分析の一部として使用されてもよい。

一部の実施形態において、処理１０００では、以下のようにＰ個のオーディオセンサ信号からＸ_１（ｊω）の線形推定値を得ることができる。

[数８８]

ここで、以下の通りである。

[数８９]

[数９０]

一部の実施形態において、処理１０００では、ｙ（ｊω）と同様にｖ（ｊω）を定義することができ、

[数９１]

は、決定されるＰ非因果性フィルタを含むベクトルであってもよい。ｚ（ｎ）のＰＳＤは、次のように求められる。

φ_ｚｚ（ω）＝ｈ^Ｈ（ｊω）・Ф_ｘｘ（ｊω）・ｈ（ω）＋ｈ^Ｈ（ｊω）・Ф_ｖｖ（ｊω）・ｈ（ω）（５７）

ここで、以下の通りである。

[数９２]

[数９３]

それぞれ信号ｘｐ（ｎ）およびｖｐ（ｎ）のＰＳＤ行列とすることができる。行列Ф_ｘｘ（ｊω）の階数は１に等しい。

処理１０００のステップ１００５において、スピーチ成分の推定値に基づいて１つ以上のノイズリダクションフィルタを構築することができる。例えば、スピーチ成分の推定値、複数のスピーチ成分の１つ以上のＰＳＤ行列、複数の入力信号のノイズ成分、及び／又は、その他の情報に基づいて、ウィナーフィルタを構築することができる。

より詳細には、例えば、処理１０００では、スピーチ成分及び対応する線形推定値に基づいてエラー信号を生成することができる。一部の実施形態において、処理１０００では、以下の式に基づいてエラー信号を生成してもよい。

[数９４]

ここで、

[数９５]

は、長さＰのベクトルであってよい。対応する平均二乗誤差（ＭＳＥ）は、以下のように表されてもよい。

[数９６]

推定量のＭＳＥは、「誤差」の平方平均、即ち、推定量と推定されたものとの差を測定することができる。

処理１０００では、以下のようにＭＳＥを最小にすることによってウィナー解ｈ_Ｗ（ｊω）を導き出すことができる。

ｈ_Ｗ（ｊω）＝ａｒｇｍｉｎ_{ｈ（ｊω）} Ｊ［ｈ（ｊω）］．（６２）

式（６２）の解は次のように表されてもよい。

[数９７]

ここで、以下の通りである。

[数９８]

[数９９]

処理１０００では、ウッドベリーの同一性（Woodbury’s identity）を以下のように使用することによって式（６４）からФ_ｙｙ（ｊω）の逆数を求めることができる。

[数１００]

ここで、ｔｒ［・］は行列のトレースを表すことができる。ウッドベリーの同一性を使用することによって、元の行列の逆数に対する階数ｋ補正を行うことで、ある行列の階数ｋ補正の逆数を計算することができる。処理１０００では、式（６５）を式（６３）に代入して、以下のようなウィナーフィルタの他の公式を得ることができる

[数１０１]

一部の実施形態において、処理１０００では、単極再帰技法を使用して、Ф_ｙｙ（ｊω）及びФ_ｖｖ（ｊω）の推定値を更新することができる。Ф_ｙｙ（ｊω）及びФ_ｖｖ（ｊω）の推定値のそれぞれは、無音期間中連続的に、及び／又は、その他の様式で更新され得る。

別の例として、処理１０００では、最小分散無歪応答（ＭＶＤＲ）の手法を使用してマルチチャネルノイズリダクション（ＭＣＮＲ）フィルタを構築することができる。構築されたフィルタは、本明細書では「ＭＶＤＲフィルタ」とも称す。ＭＶＤＲフィルタは、式（５６）に基づいて設計されてもよい。ＭＶＤＲフィルタは、所望のスピーチ信号を歪ませることなく、ＭＣＮＲ出力のノイズレベルを最小化するように構築できる。ＭＣＮＲは、以下のように定義された制約付き最適化問題を解決することによって構築できる。

[数１０２]

ｈ^Ｈ（ｊω）・ｇ（ｊω）＝Ｇ_１（ｊω）となる。（６８）

ラグランジュ（Lagrange）の未定乗数法を用いて、式（６８）を解き、且つ以下の式を構築してもよい。

[数１０３]

一部の実施形態において、式（６８）に対する解は、以下の通りである。

[数１０４]

処理１０００では、式（６６）及び（７０）を比較して以下を得ることができる。

ｈ_Ｗ（ｊω）＝ｈ_ＭＶＤＲ（ｊω）・Ｈ′（ω），（７２）

ここで、以下の通りである。

[数１０５]

式（７０）に基づいて、ＭＶＤＲフィルタは、以下に基づいて構築できる。

[数１０６]

式（７４）は、ＭＶＤＲフィルタを使用してＭＣＮＲを適用した後の単一チャネルノイズリダクション（ＳＣＮＲ）用のウィナーフィルタを表すことができる。

処理１０００のステップ１００７において、一又は複数のノイズリダクションフィルタに基づいてノイズ低減済み信号を生成することができる。例えば、処理１０００では、一又は複数のノイズリダクションフィルタを複数の入力信号に適用することができる。

図７〜図１０のフローチャートの上記ステップは、当該フローチャートに示され記載された順序及びシーケンスに限定されない任意の順序又はシーケンスで実行又は行うことが可能であることに留意されたい。また、図７〜図１０のフローチャートの上記ステップの一部は、待ち時間及び処理時間短縮のために、適切に並列に、又は、略同時に実行され得る。さらに、図７〜図１０は単なる例示であることに留意されたい。これらの図に示されたステップの少なくとも一部は、示された順序と異なる順序で実行されてもよく、同時に実行されてもよく、または完全に省略されてもよい。例えば、ステップ７０５を実行することなくステップ７０９が実行されてもよい。別の例として、ステップ７０７、７０９、７１１は、１つ以上のセンササブアレイを使用して複数のオーディオ信号を受信した後に実行することができる。

図１１は、本発明の一部の実施形態による織物構造体の実施例１１１０、１１２０、及び１１３０を示す。一部の実施形態において、織物構造体１１１０、１１２０、及び１１３０のそれぞれは、ウェアラブル装置の一部であってもよい。これに代わり、またはこれに加えて、織物構造体１１１０、１１２０、及び１１３０のそれぞれは、個々のウェアラブル装置に用いられてもよい。一部の実施形態において、上記の図２Ａに関連して説明したように、各織物構造体は織物構造体の層に含まれてもよい。

図に示されるように、織物構造体１１１０、１１２０、及び１１３０は、１つ以上の通路１１０１ａ、１１０１ｂ、１１０１ｃ、１１０１ｄ及び１１０１ｅを含んでいてもよい。各通路１１０１ａ〜１１０１ｅの一部分以上は、中空であってもよい。通路１１０１ｂと１１０１ｃとは、互いに平行であってもよく、平行でなくてもよい。同様に、通路１１０１ｄは、通路１１０１ｅと平行であってもよく、平行でなくてもよい。通路１１０１ａ、１１０１ｂ、１１０１ｃ、１１０１ｄ、及び１１０１ｅは、同じ構造であってもなくてもよい。

織物構造体１１１０、１１２０、及び１１３０は、音声通信システム（例えば、音声通信システム１１０５ａ、１１０５ｂ、１１０５ｃ等）が存在し得る１つ以上の領域（例えば、１１０３ａ、１１０３ｂ、１１０３ｃ等）を含んでもよい。各領域は、その領域内に音の通過を可能にする部分を含んでおり、配置されるオーディオセンサに音が到達するようにしてもよい。音が通過する部分は貫通孔であってもよい。音が通過する前記領域の形状は、高密度に配置された多孔形状、円、多角形、オーディオセンサの寸法に基づいて決定された形状など、又はこれらの任意の組合わせを含んでよいが、これらに限定されない。

１つ以上の領域及び１つ以上の通路は、任意の適切な方法で織物構造体に配置されてもよい。例えば、前記領域、及び／又は、前記領域の一部分以上（例えば、領域１１０３ａ、１１０３ｂ、１１０３ｃ）は、前記通路の一部（例えば、通路１１０１ａ、１１０１ｂ、１１０１ｄ）であってもよい。別の例として、前記領域は前記通路の一部でなくてもよい。より具体的には、例えば、前記領域は、織物構造体の表面と前記通路との間に配置されてもよい。一部の実施形態において、一又は複数のセンサ、及び／又は、一又は複数のセンサに関連する回路の一部が織物構造体から突出することのないように、１つ以上のセンサが前記領域、及び／又は、通路に埋め込まれていてよい。

各領域の形状は、高密度に配置された多孔形状、円、多角形など、又はそれらの任意の組み合わせを含んでよいが、これらに限定されない。一部の実施形態において、前記領域の形状は、領域に配置される音声通信システムの寸法に基づいて決定、及び／又は、製造されればよい。各領域の製造方法として、レーザー切断、一体成形など、又は、これらの組合せがあるが、これらに限定されない。

通路１１０１ａ〜ｅの空間構造の例としては、直方体、円柱、楕円体等、又は、それらの組み合わせがあるが、これらに限定されない。織物構造体を製造する材料は、帯紐、ナイロン、ポリエステル繊維など、又はそれらの組み合わせがあるが、これらに限定されない。

一部の実施形態において、各音声通信システム１１０５ａ、１１０５ｂ、及び１１０５ｃは、１つ以上のセンサ（例えば、オーディオセンサ）、センサに関連する回路、及び／又は、適切なコンポーネントを含むことができる。例えば、各音声通信システム１１０５ａ、１１０５ｂ、１１０５ｃは、１つ以上の音声通信システム１２００、及び／又は、図１２の音声通信システム１２００の一部分以上を含むことができる。音声通信システム１２００は、通路１１０１ａ〜ｅの一面に固定されてよい。したがって、音声通信システム１２００は、通路の表面に堅固に固定されてよい。音声通信システム１２００と通路表面とを接続する方法は、高温懸濁物質の加熱処理、固着、一体成形、固定ネジ等、又は、これらの組み合わせがあるが、これらに限定されない。

図１２は、本発明の実施形態における音声通信システムの例１２００を示す。音声通信システム１２００は、１つ以上のオーディオセンサ１２０１ａ〜ｃ、筐体１２０３ａ〜ｃ、はんだドット１２０５、コネクタ１２０７ａ〜ｂ、電気コンデンサ１２０９、及び／又は、音声通信システムを実装するための他の適切なコンポーネントを含んでいる。

各オーディオセンサ１２０１ａ、１２０１ｂ、１２０１ｃは、入力音響信号を捕捉して、１つ以上のオーディオ信号に変換することができる。一部の実施形態において、各オーディオセンサ１２０１ａ、１２０１ｂ、１２０１ｃは、マイクであってもよく、及び／又は、マイクを含んでもよい。一部の実施形態において、マイクは、レーザマイクロフォン、コンデンサマイクロフォン、ＭＥＭＳマイクロフォンなど、又は、それらの組み合わせを含むことができるが、これらに限定されない。例えば、ＭＥＭＳマイクロフォンは、感圧ダイアフラムを直接シリコンウエハにエッチングすることによって製造可能である。この製造工程に関わる幾何学は、ミクロンのレベルであってもよい。一部の実施形態において、オーディオセンサ１２０１ａ、１２０１ｂ、１２０１ｃの各々は、図１を参照して上述した、オーディオセンサ１１０であってもよく、及び／又は、これを含んでいてもよい。

図１２に示すように、オーディオセンサ１２０１ａ、１２０１ｂ、１２０１ｃ、及び／又は、それに関連する回路は、筐体１２０３ａ、１２０３ｂ、１２０３ｃの各々に接続されていてよい。例えば、オーディオセンサは、はんだ付け、固着、一体成形、固定ネジ等の方法、又は、これらの組み合わせによって筐体に接続されていてもよいが、これに限定されない。筐体１２０３は、図１１の通路１１０１の表面に接続されていてよい。筐体１２０３ａ、１２０３ｂ、１２０３ｃの各々は、プラスチック、繊維、他の非導電性材料等の適切な材料、又は、それらの組み合わせを使用して製造することができる。

一部の実施形態において、筐体１２０３ａ、１２０３ｂ、１２０３ｃは、互いに通信可能に接続されていてよい。例えば、筐体１２０３ａは、１つ以上のコネクタ１２０７ａを介して筐体１２０３ｂに通信可能に接続されていてもよい。別の例において、筐体１２０３ｂは、１つ以上のコネクタ１２０７ｂを介して筐体１２０３ｃに通信可能に接続されていてもよい。一部の実施形態において、コネクタ１２０７ａ〜ｂの各々は、はんだ付けによって（例えば、はんだドット１２０５を介して）音声通信システム１２００の筐体１２０３に接続されていてよい。一部の実施形態において、筐体１２０３に取り付けられたオーディオセンサ１２０１ａ、１２０１ｂ、１２０１ｃは、はんだ付けによって筐体１２０３内の回路に通信可能に接続されていてよい。そして、複数のオーディオセンサ１２０１が電気的に接続させることができる。コネクタ１２０７ａ〜ｂの各々は、銅、アルミニウム、ニクロム等の適切な材料、又は、それらの組み合わせによって製造することができる。

製造工程では、筐体１２０３ａ〜ｃ、及び／又は、通路１３１０（図１３に示す）の１つ以上の表面を懸濁物質でコーティングしてもよい。次に、通信システム１２００を通路に挿入してもよい。そして、懸濁物質が加熱されて、結果として筐体が通路の表面に固定されていてよい。したがって、オーディオセンサ１２０１ａ〜ｃを、織物構造体に固定することができる。一部の実施形態における織物構造体において、通路２０１（図１１〜１２に図示せず）の縦方向に沿った柔軟な冗長性により、織物構造体が曲がるときにコネクタ１２０７も曲がる。柔軟な冗長性は、伸縮冗長性、弾性構造等、又は、これらの組み合わせを含むことができるが、これに限定されない。例えば、２つの固定点を接続するコネクタ１２０７ａ〜ｂの長さは、２つの固定点の間の直線距離よりも長くてもよく、伸縮冗長性を実現することが可能となる。一部の実施形態において、弾性構造を実現するために、コネクタ１２０７ａ〜ｂの形状は、螺旋状、蛇行状、ジグザグ状など、又は、これらの組み合わせが挙げられるが、これらに限定されない。

一部の実施形態において、電気コンデンサ１２０９を筐体上に配置して、他の回路要素によって引き起こされるノイズを遮断し、ノイズが回路の他の部分に与える影響を低減することができる。例えば、電気コンデンサ１２０９はデカップリングコンデンサとすることができる。

図１２には、特定の数の筐体およびオーディオセンサが示されているが、これは例示に過ぎない。例えば、音声通信システム１２００は、任意の適切な数のオーディオセンサに結合される任意の適切な数の筐体を含むことができる。別の例において、音声通信システム１２００の筐体は、１つ以上のオーディオセンサ、及び／又は、それらの関連回路に結合されていてもよい。

図１３は、本開示における一部の実施形態によるセンサが埋め込まれた織物構造体の断面図の例１３００を示す。一部の実施形態において、織物構造体１３００は、図１１に示すような織物構造体であってもよく、及び／又は、それを含んでもよい。織物構造体１３００は、図１２に示される音声通信システム１２００の一部分以上を含んでいてもよい。織物構造体１３００は、上記図２Ａを参照して説明する織物構造体の層に含まれていてもよい。

図示されるように、織物構造体１３００は、１つ以上の筐体１３２０ａ、１３２０ｂ、１３２０ｃが配置される通路１３１０を含んでいてもよい。筐体１３２０ａ、１３２０ｂ、１３２０ｃは、１つ以上のコネクタ１２０７ａ、１２０７ｂなどを介して、互いに通信可能に接続されていてもよい。

センサ１３３０ａ、１３３０ｂ、１３３０ｃ、１３３０ｄ、１３３０ｅ、１３３０ｆは、１つ以上の筐体１３２０ａ〜ｃに接続されてもよい。例えば、センサ１３３０ａ及び１３３０ｂは、筐体１３２０ａに接続されてもよい。各センサ１３３０ａ〜ｆは、各種信号を捕捉、及び／又は、生成することができる。例えば、各センサ１３３０ａ〜ｆは、音響信号を捕捉し、及び／又は、オーディオ信号（例えば、上記の図１を参照して説明する音声センサ１１０）を生成することができるオーディオセンサであってもよい。

各センサ１３３０ａ〜ｆは、織物構造体１３００の第１面１３０１と第２面１３０３との間に配置されてもよい。例えば、センサ１３３０ａ、及び／又は、その関連回路の一部分以上は、筐体１３２０ａに接続されていてもよく、通路１３１０に配置されてもよい。それに加えて、またはこれに代えて、センサ１３３０ａ、及び／又は、その関連回路の一部分以上は、面１３０１と通路１３１０との間に位置する織物構造体１３００の領域に配置されてもよい。別の例において、センサ１３３０ｂの一部分以上が筐体１３２０ａに結合され、通路１３１０に配置されていてもよい。それに加えて、またはこれに代えて、センサ１３３０ｂ、及び／又は、その関連回路の一部分以上は、表面１３０３と通路１３１０との間に位置する織物構造体１３００の領域に配置されてもよい。一部の実施形態において、１つ以上のセンサ、及び／又は、それらに関連する回路が、織物構造体の任意の部分から突出することなく、織物構造体の表面１３０１と１３０３との間に埋め込まれていてよい。

一部の実施形態において、表面１３０１は、ユーザ（例えば、乗車中の人）に対向していてもよい。或いは、表面１３０３は、使用者に対向する織物構造体１３００の一部であってもよい。具体的な例としては、センサ１３３０ａは、オーディオセンサであってもよく、及び／又は、これを含んでいてもよい。センサ１３３０ｂは、脈拍、血圧、心拍数、呼吸数、及び／又は、乗員に関する他の情報を捕捉することができるバイオセンサであってもよい。この場合、一部の実施形態においては、表面１３０３は、ユーザに対向していてもよい。

一部の実施形態において、１つ以上のセンサ１３３０ａ〜ｆは、はんだ付け、固着、一体成形、固定ネジ等の方法、又は、これらの組み合わせによって１つ以上の筐体１３２０ａ〜ｃに接続されていてもよいが、これに限定されない。一部の実施形態において、筐体１３２０ａ、１３２０ｂ、１３２０ｃは、それぞれ、図１２の筐体１２０３ａ、１２０３ｂ、１２０３ｃに対応させることができる。

筐体１３２０ａ〜ｃは、コネクタ１２０７を介して互いに電気的に接続されてよい。一部の実施形態において、コネクタ１２０７は、縦方向に柔軟な冗長性を有している。柔軟な冗長性は、伸縮冗長性、弾性構造等、又は、こららの組み合わせを含むことができるが、これに限定されない。例えば、２つ固定点を接続するコネクタ１２０７の長さは、２つの固定点間の直線距離よりも長くて、伸縮冗長性を実現することが可能となる。一部の実施形態において、弾性構造を実現するために、コネクタの形状は、螺旋状、蛇行状、ジグザグ状など、又は、それらの組合せを含んでいるが、これらに限定されない。

筐体１３２０ａ〜ｃの付属物のない表面は、高温懸濁物質でコーティングされてよい。

図１４は、本開示における一部の実施形態による音声通信システム１２００を実装するために埋め込まれたセンサを有する織物構造体の例１４１０及び１４２０を示す。一部の実施形態において、各織物構造体１３１０及び１３２０は、ウェアラブル装置（例えば、シートベルト、安全ベルト、フィルムなど）の一部であってもよい。これに代わり、またはこれに加えて、織物構造体１４１０及び１４２０は、複数のウェアラブル装置で使用されてもよい。一部の実施形態において、各織物構造体１４１０及び１４２０は、図２Ａを参照して上述した織物構造体の層に含まれてもよい。

図示されるように、織物構造体１４１０は通路１４１１を含む。同様に、織物構造体１４２０は通路１４２１を含んでいてもよい。１つ以上の音声通信システム１２００等の、音声通信システムは一部分以上が、通路１４１１、及び／又は、１４２１に配置されてもよい。

各通路１４１１及び１４２１は、織物構造体の中間部分にあってもよい。織物構造体１４２０では、１つ以上の通路は、人体音源近くの織物構造体の縁部にあってもよい。例えば、人体音源は人間の口であってもよい。

一部の実施形態において、１つ以上の通路１４１１及び１４２１は、織物構造体内に作製されることができる。隣接する通路１４１１の間の距離は、同じであってもよく、異なっていてもよい。複数の通路の始点、及び、終点は同一であってもよく、異なっていてもよい。

製造工程において、音声通信システム１２００は、通路１４１１及び１４２１内に配置されてよい。次いで、何もない通路１４１１の空き領域が充填物で満たされてよい。その結果、音声通信システム１２００は、充填物の射出成形によって通路１４１１に固定されてよい。充填物は、シリカゲル、シリコンゴム、天然ゴムなど、又は、それらの任意の組み合わせを含むことができるが、これらに限定されない。一部の実施形態における充填工程において、充填物で覆われるコネクタ１２０７を使用することができる。したがって、オーディオセンサ１２０１及び筐体１２０３は、充填工程において充填物に満たすことができる。更に他の実施形態では、コネクタ１２０７、オーディオセンサ１２０１、及び、筐体１２０３は、１回の充填工程で充填物が満たされてもよい。

一部の実施形態において、充填物は、オーディオセンサ１２０１の外側に沿って音が通過する領域を実現することができる。例えば、領域は図１１に示す領域１１０３であってもよい。充填物の射出成形後、通路１４１１内の物の複数部分の厚さは、通路１４１１の対応する深さより小さくてもよく、及び／又は、それより大きくてもよい。通路の深さは、位置に応じて変化してもよい。したがって、通路１４１１内の材料は、通路１４１１から突出する、及び／又は、突出しない部分を含んでいる。

図１５は、本開示の実施形態における音声通信システム１２００の配線の例１５００を示す。配線１５００は、１つ以上のＶＤＤコネクタ１５０１、ＧＮＤコネクタ１５０３、ＳＤデータコネクタ１５０５、オーディオセンサ１２０１と筐体１２０３、及び／又は、音声通信システムを実装するための他の適切なコンポーネントを含んでいる。

オーディオセンサ１２０１は、１つ以上のピン１５０７を含んでいてもよい。例えば、オーディオセンサ２０３は、６つのピン１５０７ａ〜ｆを含んでいる。各オーディオセンサ１２０１のピンは、同じであってもよく、異なっていてもよい。１つ以上のピンをＶＤＤコネクタ１５０１及びＧＮＤコネクタ１５０３に接続することができる。これにより、オーディオセンサ１２０１に電力を供給することができる。例えば、３つのピン１５０７ａ〜ｃがＧＮＤコネクタ１５０３に接続されてもよく、１つのピン１５０７がＶＤＤコネクタ１５０１に接続されてもよい。１つ以上のピン１５０７が相互接続されてもよい。一部の実施形態において、ピン１５０７ｂ及び１５０７ｅを相互に接続してもよい。オーディオセンサ１２０１は、複数の信号を出力するため、１つ以上のピン１５０７を含んでいる。例えば、ピン１５０７ｄは、ＳＤデータコネクタ１５０５に接続されて複数の信号を出力してもよい。図１５において、配線１５００は、４つのオーディオセンサ１２０１と、対応する４つのＳＤデータコネクタ１５０５ａ、１５０５ｂ、１５０５ｃ、１５０５ｄとを含んでいる。別の実施形態において、オーディオセンサ１２０１の数及びＳＤデータコネクタ１５０５の数は変更可能であってもよい。また、オーディオセンサ１２０１の数とＳＤデータコネクタの数も同じであってもよく、異なっていてもよい。

ＶＤＤコネクタ１５０１、ＧＮＤコネクタ１５０３、ＳＤデータコネクタ１５０５及び筐体１２０３の間の接続は、直列、及び／又は、並列にしてもよい。一部の実施形態において、筐体１２０３は、１つ以上の層を含んでいてもよい。ＶＤＤコネクタ１５０１、ＧＮＤコネクタ１５０３及びＳＤデータコネクタ１５０５は、筐体１２０３内で相互接続されていてもよい。そして、ＶＤＤコネクタ１５０１、ＧＮＤコネクタ１５０３、及び、ＳＤデータコネクタ１５０５は、互いに平行であってもよい。音声通信システム１２００の配線１５００は、織物構造体の通路２０１（図１５に図示せず）に挿入され、通路２０１の表面に固定されていてもよい。

図１６は、本開示の実施形態における音声通信システム１２００の配線例１６００を示す。配線１６００は、１つ以上のＶＤＤコネクタ１６０１、ＧＮＤコネクタ１６０３、ＷＳビットクロックコネクタ１６０５、ＳＣＫサンプリングクロックコネクタ１６０７、ＳＤデータコネクタ１６０９、オーディオセンサ１２０１ａ〜ｂ及び筐体１２０３、及び／又は、音声通信システムを実装するための他の適切なコンポーネントを含んでいる。

オーディオセンサ１２０１ａ〜ｂは、１つ以上のピン１６１１及び１６１３を含んでいてもよい。例えば、オーディオセンサ１２０１ａは、８つのピン１６１１ａ〜ｈを含むことができる。オーディオセンサ１２０１ｂは、８つのピン１６１３ａ〜ｈを含むことができる。１つ以上のピンをＶＤＤコネクタ１６０１及びＧＮＤコネクタ１６０３に接続してもよい。これにより、オーディオセンサ１２０１ａ、１２０１ｂに電力を供給することができる。例えば、オーディオセンサ１２０１ａにおいて、ピン１６１１ｆはＶＤＤコネクタ１６０１に接続されていてもよく、ピン１６１１ｈはＧＮＤコネクタ１６０３に接続されていてもよい。オーディオセンサ１２０１ｂにおいて、ピン１６１３ｄと１６１３ｆはＶＤＤコネクタ１６０１に接続されていてもよく、ピン１６１３ｈはＧＮＤコネクタ１６０３に接続されていてもよい。１つ以上のピン１６１１は相互に接続されてもよい。１つ以上のピン１６１３も相互に接続されてもよい。一部の実施形態において、オーディオセンサ１２０１ａにおけるピン１６１１ｆはピン１６１１ｇに接続されていてもよい。ピン１６１１ｄ及び１６１１ｅはピン１６１１ｈに接続されていてよい。オーディオセンサ１２０１ｂにおいて、ピン１６１３ｆはピン１６１３ｇに接続されてもよい。ピン１６１３ｅはピン１６１３ｈに結合されてもよい。

ＷＳビットクロックコネクタ１６０５及びＳＣＫサンプリングクロックコネクタ１６０７は、１つ以上のクロック信号を供給することができる。オーディオセンサ１２０１ａにおいて、ピン１６１１ｃはＷＳビットクロックコネクタ１６０５に接続されていてもよく、ピン１６１１ａをＳＣＫサンプリングクロックコネクタ１６０７に接続されていてもよい。１２０１ｂにおいて、ピン１６１３ｃはＷＳビットクロックコネクタ１６０５に接続されていてもよく、ピン１６１３ａはＳＣＫサンプリングクロックコネクタ１６０７に接続されてもよい。

オーディオセンサ１２０１は、１つ以上のピンを含み、複数の信号を出力することができる。１つ以上のピンはＳＤデータコネクタ１６０９に接続されてもよい。１つ以上のＳＤデータコネクタ１６０９は、ピン１６１１、及び／又は、１６１３に接続されてもよい。例えば、オーディオセンサ１２０１ａのピン１６１１ｂと、オーディオセンサ１２０１ｂのピン１６１３ｂは、ＳＤデータコネクタ１６０９ａに接続されて複数の信号を出力してもよい。図１６において、配線１６００は、４つのＳＤデータコネクタ１６０９ａ、１６０９ｂ、１６０９ｃ、１６０９ｄを含んでいてもよい。ＳＤデータコネクタ１６０９に、別のオーディオセンサ１２０１（図１６に図示せず）が接続されていてもよい。別の実施形態で、オーディオセンサ１２０１の数及びＳＤデータコネクタ１６０９の数は変更可能であってもよい。また、２つの数は同じであってもよく、異なっていてもよい。

ＶＤＤコネクタ１６０１、ＧＮＤコネクタ１６０３及びＳＤデータコネクタ１６０９は、筐体１２０３に直列、及び／又は、並列に接続されていてもよい。一部の実施形態において、筐体１２０３は、１つ以上の層を含んでいてもよい。ＶＤＤコネクタ１６０１、ＧＮＤコネクタ１６０３及びＳＤデータコネクタ１６０９は、筐体１２０３内で相互接続相互接続されていてもよい。そして、ＶＤＤコネクタ１６０１、ＧＮＤコネクタ１６０３及びＳＤデータコネクタ１６０９は、互いに平行であってもよい。音声通信システム１２００の配線１６００は、織物構造体の通路２０１（図１６に図示せず）に挿入され、通路２０１の表面に固定されていてもよい。

上の説明において、多くの詳細が述べられている。しかしながら、これらの具体的な詳細がなくても本開示を実施することができることは明らかであろう。一部の例で、周知の構造及びデバイスは、開示を不明瞭にすることを避けるため、詳細ではなくブロック図の形態で示されている。

以下詳細な説明の一部は、コンピュータメモリにおける、データビットに対する操作のアルゴリズム及び記号表現によって提示される。これらアルゴリズムの記述および表現は、データ処理技術の当業者から他の当業者に研究の実体を最も効果的に伝えるために資するものである。アルゴリズムは、ここで、及び、一般的に所望の結果を導く自己矛盾のないステップのシーケンスと解釈される。これらのステップは、物理量の物理的操作を必要とするステップである。通常、必ずしも必要ではないが、これらの量は、保存、転送、結合、比較、及び、その他の操作が可能な電気信号又は磁気信号の形式をとる。これらの信号をビット、値、要素、記号、文字、用語、数字などと呼ぶことは、主に一般的な使用のために、好都合であることが判明している。

しかしながら、これらの条件及び類似条件は全て、適切な物理量に関連し、これらの量に適用される好適なラベルに過ぎないことに留意されたい。特記しない限り、以下の説明から明らかなように、「送信」、「受信」、「生成する」、「提供する」、「計算する」、「実行する」、「保存する」、「生成する」、「決定する」などの用語を利用する議論は、「埋め込む」、「配置する」、「配置する」などの用語は、コンピュータシステムまたは同様の電子演算装置の動作及びプロセスを指し、コンピュータシステムのレジスタ及びメモリ内の物理（電子）量として表されるデータを、コンピュータシステムのメモリ又はレジスタ又は他のそのような情報記憶装置、伝送装置又は表示装置内の物理量として同様に表される他のデータを操作及び変換するものである。

本明細書で使用される「第１」、「第２」、「第３」、「第４」などという用語は、異なる要素を区別するためのラベルを意味し、それらの数値指定に従って序数的な意味を有する必要はない。

一部の実装では、本明細書に記載のプロセス実行の命令を記憶するために、あらゆる適切なコンピュータ可読媒体が使用可能である。例えば、一部の実施例において、コンピュータ可読媒体は、一時的又は非一時的である。例えば、非一時的なコンピュータ可読媒体は、磁気媒体（例えば、ハードディスク、フロッピーディスクなど）、光学媒体（例えば、コンパクトディスク、デジタルビデオディスク、ブルーレイディスク等）、半導体媒体（フラッシュメモリ、電子的プログラマブル読取り専用メモリ（ＥＰＲＯＭ）、電気的に消去可能なプログラム可能な読取り専用メモリ（ＥＥＰＲＯＭ）等、送信時の一過性のものでもなく、永続性を欠くものでもない適切な媒体、及び／又は、任意の適切な有形媒体であればよい。また、一時的なコンピュータ可読媒体の例としては、ネットワーク上の信号、コネクタ、導体、光ファイバ、回路、送信中に永続性を欠く任意の適切な媒体、及び／又は、任意の適切な無形媒体を含んでいる。

Claims

音響入力を捕捉して、当該音響入力に基づいて第１オーディオ信号を生成する第１オーディオセンサを備え、前記第１オーディオセンサは、織物構造体の第１面と第２面との間に配置されており、
前記織物構造体は、前記織物構造体の前記第１面と前記第２面との間に位置する第１通路を含み、前記第１オーディオセンサは、前記第１通路に配置されていることを特徴とする音声通信システム。
前記第１オーディオセンサは、シリコンウエハに形成されたマイクであることを特徴とする請求項１に記載のシステム。
前記システムは、音響入力を捕捉して、当該音響入力に基づいて第２オーディオ信号を生成する第２オーディオセンサを更に備え、前記織物構造体は、第２通路を含み、前記第２オーディオセンサは、少なくとも部分的に前記第２通路に配置されていることを特徴とする請求項１に記載のシステム。
前記第１通路は前記第２通路と平行であることを特徴とする請求項３に記載のシステム。
前記第１オーディオセンサ及び前記第２オーディオセンサが、オーディオセンサの差分サブアレイを形成していることを特徴とする請求項３に記載のシステム。
前記第１オーディオ信号と前記第２オーディオ信号とに基づいてスピーチ信号を生成するプロセッサをさらに備えていることを特徴とする請求項３に記載のシステム。
前記スピーチ信号を生成するために、前記プロセッサは更に、前記第１オーディオ信号と前記第２オーディオ信号とを組み合わせることによって出力信号を生成し、前記出力信号にエコー消去を実施することを特徴とする請求項６に記載のシステム。
前記エコー消去を行うために、前記プロセッサは更に、音響経路を表すモデルを構築し、前記モデルに基づいて前記出力信号の成分を推定することを特徴とする請求項７に記載のシステム。
音響入力を捕捉して、当該音響入力に基づいて第１オーディオ信号を生成する第１オーディオセンサを備え、前記第１オーディオセンサは、織物構造体の第１面と第２面との間に配置されており、
前記第１オーディオセンサは、前記織物構造体の第１層に埋め込まれていることを特徴とする音声通信システム。
前記第１オーディオセンサに関連する回路の少なくとも一部が、前記織物構造体の第２層に埋め込まれていることを特徴とする請求項９に記載のシステム。
前記織物構造体の前記第１面と第２面との距離は２．５ｍｍ以下であることを特徴とする請求項１又は９に記載のシステム。
前記第１オーディオセンサは、前記織物構造体から突出していないことを特徴とする請求項１又は９に記載のシステム。
音響入力を捕捉して、当該音響入力に基づいて第１オーディオ信号を生成する第１オーディオセンサを備え、前記第１オーディオセンサは、織物構造体の第１面と第２面との間に配置されており、
前記織物構造体の前記第１面と前記第２面との間に配置されたバイオセンサをさらに備えていることを特徴とする音声通信システム。
マイクアレイによって生成された複数のオーディオ信号を受信するステップと、
複数の前記オーディオ信号に空間フィルタを実行して、複数の空間フィルタ済み信号を生成するステップと、
プロセッサによって、複数の前記オーディオ信号に対するエコー消去を実行して、少なくとも１つのスピーチ信号を生成するステップとを含み、
前記マイクアレイは、第１マイクサブアレイを含み、複数の前記オーディオ信号は、前記第１マイクサブアレイによって生成された第１オーディオ信号を含むことを特徴とする音声通信の方法。
複数の前記オーディオ信号に対してノイズリダクションを行って前記スピーチ信号を生成するステップをさらに含み、
前記ノイズリダクションを実行するステップは、
少なくとも１つのノイズリダクションフィルタを構築するステップと、
前記ノイズリダクションフィルタを複数の前記オーディオ信号に適用するステップとを含むことを特徴とする請求項１４に記載の方法。
前記少なくとも１つのノイズリダクションフィルタを構築するステップは、
複数の前記オーディオ信号に基づいて前記第１オーディオ信号の所望の成分の推定値を決定するステップと、
前記第１オーディオ信号の所望の成分の推定値に基づいてエラー信号を決定するステップと、
前記エラー信号に基づいて最適化問題を解くステップとを含むことを特徴とする請求項１５に記載の方法。
前記少なくとも１つのノイズリダクションフィルタを構築するステップは、
前記第１オーディオ信号の第１パワースペクトル密度を決定するステップと、
前記第１オーディオ信号の前記所望の成分の第２パワースペクトル密度を決定するステップと、
前記第１オーディオ信号のノイズ成分の第３パワースペクトル密度を決定するステップと、
前記第１パワースペクトル密度、前記第２パワースペクトル密度、及び、前記第３パワースペクトル密度のうちの少なくとも１つに基づいて、前記少なくとも１つのノイズリダクションフィルタを構築するステップとを更に含むことを特徴とする請求項１６に記載の方法。
前記少なくとも１つのノイズリダクションフィルタは、前記マイクアレイ内の複数のオーディオセンサに対応する複数の非因果的フィルタを含むことを特徴とする請求項１５に記載の方法。
単極再帰技法を使用して前記ノイズリダクションフィルタを更新するステップをさらに含むことを特徴とする請求項１５に記載の方法。
前記ノイズリダクションを実行するステップは、前記ノイズリダクションフィルタを前記空間フィルタ済み信号に適用することをさらに含むことを特徴とする請求項１５に記載の方法。
前記エコー消去を実行するステップは、
複数のスピーカによって生成された複数のスピーカ信号を受信するステップと、
非線形変換を前記スピーカ信号のそれぞれに適用して複数の変換されたスピーカ信号を生成するステップと、
前記変換されたスピーカ信号に基づいて複数のフィルタを構築するステップと、
変換されたスピーカ信号に複数のフィルタを適用して、第１オーディオ信号のエコー成分を推定するステップとを含み、
複数の前記フィルタのそれぞれは、前記複数のスピーカ信号の１つに対応する音響経路を表していることを特徴とする請求項１４に記載の方法。
前記非線形変換を複数の前記スピーカ信号の第１スピーカ信号に適用するステップは、前記第１スピーカの半波整流バージョンを前記第１スピーカ信号に加えることを含むことを特徴とする請求項２１に記載の方法。
複数の前記フィルタを構築するステップは、
前記第１オーディオ信号に基づいて事後エラー信号を決定するステップと、
前記事後エラー信号に基づいてコスト関数を決定するステップと、
コスト関数を最小化するステップとを含むことを特徴とする請求項２１に記載の方法。
前記エコー消去を実行するステップは、
前記第１オーディオ信号の前のフレームについてダブルトークの発生が検出されたかどうかを判定するステップと、
前記判定に基づいて忘却因子を計算するステップと、
前記忘却因子に基づいて、前記第１オーディオ信号の現在のフレームについてダブルトーク検出を実行するステップとを含むことを特徴とする請求項１４に記載の方法。
前記第１マイクサブアレイは、第１オーディオセンサと第２オーディオセンサとを含み、
複数の前記オーディオ信号に空間フィルタを実行するステップは、
時間遅延を前記第２オーディオセンサによって生成された第２オーディオ信号に適用して遅延信号を生成するステップと、
前記第１オーディオセンサによって生成された前記第１オーディオ信号と前記遅延信号とを合成するステップと、
前記合成信号にローパスフィルタを適用するステップとを含むことを特徴とする請求項１４に記載の方法。