JP2014112831A

JP2014112831A - 複数のマイクロフォン及びスピーカーを管理するシステム

Info

Publication number: JP2014112831A
Application number: JP2013232095A
Authority: JP
Inventors: Heiman Arie; ハイマンアリー; Roeimi Roei; ロエイミロエイ; Yehuday Uri; イェフデイウリ
Original assignee: DSP Group Inc
Current assignee: DSP Group Inc
Priority date: 2012-11-08
Filing date: 2013-11-08
Publication date: 2014-06-19
Also published as: EP2731351A2; US20140126729A1; CN103841491B; US9124965B2; KR20140061255A; CN103841491A

Abstract

【課題】電子機器内の複数のマイクロフォン及びスピーカーを適応的に管理する方法及びシステムを提供する。
【解決手段】電子機器２００の動作モードを決定でき、決定した動作モードに基づいて、少なくとも１つのスピーカーの動作を管理する。この管理には、少なくとも１つのスピーカーの機能を適応的に切り替えるかまたは修正することを含む。例えば、少なくとも１つのスピーカーを、マイクロフォンまたは振動検出器として作用するように構成することができる。少なくとも１つのスピーカーを用いて得られる入力を、ノイズリダクション及び／または音響エコー消去などの音声関連機能を最適化するのに使用できる。
【選択図】図２

Description

本発明は、音声処理に関する。さらに詳細には、本開示の特定の実施態様は、複数のマイクロフォン及びスピーカーを管理するための適応システムに関する。

優先権の主張：
本出願は、２０１２年１１月８日に出願された特許文献１、発明の名称「複数のマイクロフォン及びスピーカーを管理するための適応システム」を参照し、この優先権を主張するとともに、これに基づく利益を主張する。特許文献１の出願を、その全容を参照することによって本願に援用する。

電子機器内の音声入力／出力部品（例えばスピーカーやマイクロフォン）を管理するための既存の方法及びシステムは、不十分かつ／またはコストがかかることがある。従来の慣習的な手法を、図面を参照して本開示の以下の部分に記載した本方法及び機器のいくつかの態様と比較することで、このような手法にはさらに多くの制限及び欠点があることが、当業者に明らかである。

米国特許仮出願第６１／７２３,８５６号

本発明は、少なくとも１つの図面と関連付けて実質的に示しかつ／または説明し、特許請求の範囲でさらに完全に記載したように、複数のマイクロフォン及びスピーカーを管理するための適応システムとして、１つのシステム及び／または方法を提供する。

本開示のこれらの利点及びその他の利点、態様及び新規性のある特徴ならびにその説明的な実装の詳細は、以下の説明文及び図面からさらに完全に理解される。

複数のマイクロフォン及びスピーカーを搭載した電子機器の一例を示す説明図複数のマイクロフォン及びスピーカーを搭載した電子機器の一例のアーキテクチャを示す説明図複数のマイクロフォン及びスピーカーを搭載した電子機器の一例のアーキテクチャを示す図であり、スピーカーを音声入力部品として使用できるように修正した説明図複数のマイクロフォン及びスピーカーを搭載した電子機器の一例のアーキテクチャを示す図であり、スピーカーを音声入力部品として使用できるように別の方法で修正した説明図スピーカーから得た信号を標準マイクロフォンからの信号とマッチングするように変換し、マイクロフォンを介して得た標準の音声信号と合わせて使用するための前処理の一例を示す説明図電子機器内の複数のマイクロフォン及びスピーカーを管理するための例示的なプロセスを示すフローチャートスピーカーを介して捕捉した振動を利用して音声入力を生成するための例示的なプロセスを示すフローチャート

電子機器（例えば、携帯電話やタブレット端末などのモバイル通信システム）に搭載された複数のマイクロフォン及びスピーカーの動作を、適応的に管理し、制御し、切り替えるための方法及びシステムにおいて、特定の実施態様を見出すことができる。この点で、デバイスの元の構造内でのマイクロフォン及びスピーカーの位置を変更することなく、電子機器の内蔵式マイクロフォン及びスピーカーを、本開示に従って使用することができる。むしろ、電子機器のマイクロフォン及びスピーカーの動作を、管理し、制御し、切り替えて、電子機器内の機能性を高め、かつ／または改善するのをサポートすることができる。例えば、標準のモバイルデバイスの内蔵式スピーカーを、ハードウェア及びソフトウェアを含むデバイスの信号処理能力と組み合わせて使用して、デバイス内で使用するための入力を得ることができる。内蔵式スピーカーをマイクロフォン及び／または振動検出器として構成して使用し、デバイスのユーザが話し中かどうかを確実に判定するようにでき、かつ／または様々な適応プロセスを実施するための有益な入力及び／もしくは指示を生成するようにできる。例えば、スピーカーによって生成された入力または指示は、ノイズリダクションプロセスまたは音響エコー消去プロセスを改善するのに使用することができる。使用するスピーカー及び／またはマイクロフォンの選択は、本システムの動作モードなどに基づいて自動的かつ適応的に行うことができる。

本明細書で用いているように、「回路（ｃｉｒｃｕｉｔｓ及びｃｉｒｃｕｉｔｒｙ）」という用語は、物理的電子部品（すなわちハードウェア）、ならびに、ハードウェアを構成でき、ハードウェアによって実行されるか、あるいはハードウェアに連結されていてよい任意のソフトウェア及び／またはファームウェア（「コード」）を指す。本明細書で使用しているように、例えば、特定のプロセッサ及びメモリが、第１の数行のコードを実行する場合に第１の「回路」を備え、第２の数行のコードを実行する場合に第２の「回路」を備えることができる。本明細書で用いているように、「及び／または」とは、「及び／または」でつながれた列記事項のうちの任意の１つ以上の項目という意味である。一例を挙げると、「ｘ及び／またはｙ」とは、３要素からなる集合｛（ｘ）,（ｙ）,（ｘ,ｙ）｝のうちのいずれかの要素という意味である。もう１つの例を挙げると、「ｘ、ｙ、及び／またはｚ」とは、７要素からなる集合｛（ｘ）,（ｙ）,（ｚ）,（ｘ,ｙ）,（ｘ,ｚ）,（ｙ,ｚ）,（ｘ,ｙ,ｚ）｝のうちのいずれかの要素という意味である。本明細書で用いているように、「ブロック」及び「モジュール」という用語は、１つ以上の回路が実施できる機能を指す。本明細書で用いているように、「例」という用語は、非限定的な例、場合、または説明として使用するという意味である。本明細書で用いているように、「例えば（ｆｏｒｅｘａｍｐｌｅ及びｅ．ｇ．，）」という用語は、１つ以上の非限定的な例、場合、または説明からなる列記事項を導入するものである。本明細書で用いているように、回路は、回路が機能を実施するのに必要なハードウェア及びコード（必要な場合）を備えているときはいつでも機能を実施するために「動作可能」であり、その機能の性能が何らかのユーザ構成可能な設定によって無効になっているかどうか、または有効になっていないかどうかは問題ではない。

図１は、複数のマイクロフォン及びスピーカーを搭載した電子機器の一例を示している。図１を参照すると、電子機器１００が示されている。

電子機器１００は、様々な機能、動作、アプリケーション、及び／またはサービスを実施またはサポートするのに適した回路を備えることができる。電子機器１００が実施またはサポートする機能、動作、アプリケーション、及び／またはサービスは、ユーザの命令及び／または予備構成された命令に基づいて進行または制御されることができる。場合によっては、電子機器１００は、有線及び／または無線接続などを介して、１つ以上のサポートされた有線及び／または無線のプロトコルまたは規格に応じて、データ通信をサポートすることができるものがある。場合によっては、電子機器１００は、ハンドセットモバイルデバイスとすることができ、すなわち、移動中及び／または様々な場所で使用するためのものとすることができる。この点で、電子機器１００は、動かしやすいように設計及び／または構成されて、ユーザが保持している間はユーザが動く通りに容易に動かせるようにすることができるとともに、電子機器１００は、移動中に電子機器１００が実施またはサポートする機能、動作、アプリケーション、及び／またはサービスのうちの少なくともいくつかを扱うように構成することができる。電子機器の例には、モバイル通信デバイス（例えば携帯電話、スマートフォン、及びタブレット端末）、パーソナルコンピュータ（例えばラップトップ型またはデスクトップ型）などを挙げることができる。ただし、本開示は、任意の特定タイプの電子機器に限定されるものではない。

例示的な実施態様では、電子機器１００は、音声の入力及び／または出力をサポートすることができる。電子機器１００は、例えば、スピーカー及びマイクロフォンを駆動し、制御し、かつ／または使用するのに適した回路に沿って、音声を出力及び／または入力する（捕捉する）のに使用する複数のスピーカー及びマイクロフォンを組み入れることができる。例えば、電子機器１００は、第１のスピーカー１１０、第１のマイクロフォン１２０、第２のスピーカー１３０、及び第２のマイクロフォン１４０を備えることができる。第１のスピーカー１１０、第１のマイクロフォン１２０、第２のスピーカー１３０、及び／または第２のマイクロフォン１４０を使用する方法は、電子機器１００の動作に基づくものとすることができる。さらに、電子機器１００は、スピーカー及び／またはマイクロフォンの（通常は様々に異なる）使用特性に対応させて、複数の動作モードをサポートすることができる。例えば、電子機器１００がモバイル通信デバイス（例えばスマートフォン）である（またはモバイル通信デバイスとして使用される）場合、電子機器１００は、「ハンドセットモード」及び「スピーカーモード」などのモードを（音声の入力／出力に対して）サポートすることができる。

この点で、ハンドセットモードは、音声通話中に電子機器１００を使用するのに対応できるものであり、このモードでは、ユーザが電子機器をユーザの顔に向けて保持できる（すなわち、電子機器１００は、典型的な方法で保持される「電話」として使用される）。例えば、ハンドセットモード中は、第１のスピーカー１１０及び第１のマイクロフォン１２０を、音声通話サービスをサポートするのに使用できる−すなわち、第１のスピーカー１１０は、第１のマイクロフォン１２０を（ユーザの口近くに置いて）発言／音声入力の捕捉に使用している間、イヤフォンスピーカーとなることができる。スピーカーモードでは、第２のスピーカー１３０（すなわちイヤフォンではないスピーカー）を、音声を出力する際に使用できる。スピーカーモードは、例えば、音声通話中に電子機器１００を使用するのに対応できるが、ユーザが電子機器を保持できない（例えば電子機器１００をハンドフリーまたはスピーカー「フォン」として使用する）という状況においての場合である。この点で、電子機器１００がハンドフリーの音声通話中にスピーカーモードで動作すると、第２のスピーカー１３０（すなわちイヤフォンではないスピーカー）を、音声出力に使用することができ、（遠方から周囲の音声を捕捉するのにより適した）第２のマイクロフォン１４０を発言／音声入力の捕捉に使用することができる。スピーカーモードは、音声通話とは無関係の音声サービスを提供する際に電子機器１００を使用するのにも対応できる。例えば、第２のスピーカー１３０は、電子機器１００内で再生される音楽を出力する際に、スピーカーモードで動作できる。スピーカー１１０と１３０とは、同時に動作できず（例えばハンドセットモードで）、主要（イヤフォン）スピーカー１１０は、第２のスピーカー１３０が非アクティブ及び／または非使用である間に作動でき、使用でき、一方スピーカーモードでは、主要（イヤフォン）スピーカー１１０は、通常発声力をより強く生成できる第２のスピーカー１３０がアクティブの間はアクティブにならない。

本開示の様々な実施態様では、既存の複数のマイクロフォン及びスピーカーの使用及び／または構成を、電子機器（例えば電子機器１００）内で最適化して、様々な音声関連機能を向上させることができ、これは例えば、特定モードで通常非アクティブにできるスピーカーを使用して入力信号を捕捉または取得するなどの方法で行う。デバイス内に存在する既存の複数のマイクロフォン及びスピーカーを最適な形でこのように使用することで向上させることができる音声関連機能の例には、ノイズリダクション及び／またはエコー消去などを挙げることができる。

例えば、高質な音声通信を提供することが通常求められていることから、音声の質を向上させるために種々の技術を適用することができる。音声の質を向上させるのに用いられる技術の１つが、ノイズリダクション（ＮＲ）であり、これは、ユーザ（特に相手側のエンドユーザ）のために周囲のノイズを低減できるようにする技術である。場合によっては、ノイズリダクション技術を複数のマイクロフォンを使用することで実装できることがある。例えば、デバイスに２つのマイクロフォン使用し、一方のマイクロフォンをユーザの口に近づけ（ユーザの声を捕捉するのに使用し）、もう一方のマイクロフォンをデバイスの口以外の場所（例えば耳の近く及び／またはデバイスの反対の面）に置く場合、第１のマイクロフォンは、ユーザの声及び周囲のノイズを拾うのに使用できるのに対し、第２のマイクロフォンは、主に周囲のノイズを拾うのに使用できる。相手の当事者に送信するきれいな音声を生成するために、（２つのマイクロフォンから来る）２つの信号を処理することができる。このような構成では、ノイズがコヒーレントで、二次マイクロフォンで拾われるノイズと、主要マイクロフォンで拾われるノイズとが相関関係にあれば、ノイズリダクションをうまく実施できる。しかし、オフィスなどの狭い場所に通常存在する残響ノイズのようなコヒーレントでないノイズが存在する場合、両方のマイクロフォンに拾われるノイズは、強い相関関係にはないことがあり、これがノイズリダクションの性能を低下させることがある。ところが、ノイズリダクションの性能は、互いに接近した（例えば互いに１〜２ｃｍの距離）マイクロフォンを使用する場合は著しくよくなることがある。なぜなら、両方のマイクロフォンに拾われたノイズ同士の相関関係が、著しく強まることがあるからである。

場合によっては、エコーを低減し、受信側がユーザ自身の声のエコーを聞こえないようにするために、エコー消去の種々の技術を用いることもできる。音響エコー消去技術（ＡＥＣ）は、デバイスの環境内におけるノイズ及びエコーの推定に基づいたものとすることができる。さらに、この推定は、様々な適応技術を用いるなどして、連続的に−例えば通話中に行うことができる。ユーザが話し中のときに適応が行われれば、ユーザの声がノイズと解釈されるおそれがあるため、適応技術は、ユーザが話し中かどうかなど、様々な考慮に基づいたものとすることができる。適応を向上させるために行う、ユーザが話し中かどうかの推定は、様々な技術を用いて行うことができる。例えば、音声活動検出器（ＶＡＤ）を用いて、捕捉した信号を分析して、ユーザが話し中かどうかを判定または推定することができる。これらの技術のほとんどは、周囲のノイズレベルが低い場合（例えば信号雑音比（ＳＮＲ）が高い場合）に効果が高い。しかし、ＳＮＲが低い（すなわち、ユーザの声のレベルに比して環境ノイズレベルが高い）ときは、推定プロセスは、ユーザが話し中かどうかを検出し損ねることがあり、その結果、ＮＲ及びＡＥＣの性能は著しく低下する。

マイクロフォン及び／またはスピーカーの配置は、規定の動作モードに対しては最適である可能性があるが、他の音声関連機能に対しては最適ではないことがある。例えば、マイクロフォン１２０及び１４０は、通常（特にモバイル通信デバイスでは）互いに比較的離して−例えば上と下で１０〜１５ｃｍの距離を置いて配置してよく、かつ／またはデバイスの両側に配置してよい。しかし、このような設置は、ノイズリダクション（ＮＲ）及び音響エコー消去（ＡＥＣ）のような音声関連機能には最適ではないことがある。マイクロフォン（複数の場合もある）をさらに追加して既存のマイクロフォン（複数の場合もある）の比較的近くに設置することで、この問題に対する解決策を得られる可能性がある。しかし、マイクロフォン（複数の場合もある）をさらに追加することは、様々な理由−例えばコスト増加、デバイスの設計上の制限または限定などにより好ましくないことがある。もう１つの解決策でマイクロフォン及びスピーカーの配置を調整して、これらの音声関連機能に対する性能を特に改善することができる。しかし、このような調整は、これらのマイクロフォン及び／またはスピーカーの主な使用法に悪影響を及ぼすことがあり、かつ／または実行不可能なことがある。

したがって、様々な実施態様では、既存の複数のマイクロフォン及びスピーカー（例えば電子機器１００のスピーカー１１０及び１３０ならびにマイクロフォン１２０及び１４０）は、既存のマイクロフォン及び／もしくはスピーカーの使用法に影響を及ぼすことなく、またはマイクロフォン及び／もしくはスピーカーの配置の修正を必要とすることなく、向上したノイズリダクション（ＮＲ）及び音響エコー消去（ＡＥＣ）の性能を得られるように構成することができ、この性能を他の（主な）使用目的−例えば音声通話、背景音声の再生、及び／またはステレオ録音能力などに向けて最適化することができる。例えば、既存の複数のマイクロフォン（遠くに置いたもの）及びスピーカーを、特定の動作モード（例えばハンドセットモード）のように、２つの接近したマイクロフォンを基盤とする配置として動作するように構成して、向上したノイズリダクション性能及び／または音響エコー消去を得られるようにすることができる。この２つの接近したマイクロフォンを基盤とする配置は、１つ以上のスピーカーを使用して、求められているマイクロフォンを基盤とする機能を提供することで実現できる。つまり、スピーカーを「マイクロフォン」として−すなわち、音声の捕捉及び／または入力信号の生成に用いることができる。

使用するスピーカーは、動作モードに従うなどして自動的に選択されてよい。例えば、選択されるスピーカーには、その動作モードでは逆に非アクティブであるスピーカーを備えることができる。選択されたスピーカーを振動検出器として−例えばユーザが話し中かどうかを確実に示すために、使用することができる。選択されたスピーカーは、スピーカーとも振動検出器とも同時に動作することができる。本開示に従って実装されたシステムは、モジュール式とすることができ、かつ／またはいかなるアーキテクチャにも有効とすることができる。スピーカー及びマイクロフォンの動作は、ノイズリダクション及び／またはエコー消去などの音声関連機能を最適に実施するために管理することができる。この管理には、動作モードを認識することと、ユーザが話し中かどうかを指摘することと、認識された動作モードに応じて及び／またはユーザが話し中かどうかの指摘に応じて、自動的にスピーカーを選択することと、モバイル通信システムの認識動作モードに応じて、及びユーザが話し中かどうかの指摘に応じて、選択されたスピーカーの動作をマイクロフォンとしてまたは振動検出器としての機能に切り替えることとを含むことができる。

いくつかの例では携帯電話に言及していることがあるが、他のモバイル通信システムや任意の適切な電子システムも同じように使用してよい。さらに、記載した例の中には、スピーカー及びマイクロフォンが特定の数で、その配置が特定のもので、その動作を特定の方法で管理するためのその他の特定の部品を備えた、特定のアーキテクチャを開示しているものがあるが、これらの例は、本開示を完全に理解してもらうために記載しているに過ぎず、本開示の範囲を限定する意図はないことを理解すべきである。

図２は、複数のマイクロフォン及びスピーカーを搭載した例示的な電子機器のアーキテクチャを示している。図２を参照すると、電子機器２００が示されている。

電子機器２００は、例えば図１の電子機器１００と同様のものであってよい。この点で、電子機器２００には、複数の音声出力部品（例えばスピーカー２３０_１及び２３０_２）及び音声入力部品（例えばマイクロフォン２４０_１及び２４０_２）を組み入れることができる。電子機器２００には、音声関連の処理及び／または動作をサポートするための回路も組み入れることができる。例えば、電子機器２００は、プロセッサ２１０及び音声コーデック２２０を備えることができる。

プロセッサ２１０は、データを処理し、動作（例えば電子機器２００またはその部品の動作）を制御または管理し、タスク及び／または機能を実施する（またはこのようなタスク／機能を制御する）ように構成可能な適切な回路を備えることができる。プロセッサ２１０は、アプリケーション、プログラム及び／またはコードを進行及び／または実行することができ、このコードは、プロセッサ２１０の内部または外部に備わる例えばメモリ（図示せず）に保存できる。さらに、プロセッサ２１０は、１つ以上の制御信号を用いて、電子機器２００（または部品またはそのサブシステム）の動作を制御できる。プロセッサ２１０は、汎用プロセッサを備えることができ、この汎用プロセッサは、特定タイプの動作（例えば音声関連動作）を実施またはサポートするように構成できる。プロセッサ２１０は、特別な目的のプロセッサを備えることもできる。例えば、プロセッサ２１０は、デジタルシグナルプロセッサ（ＤＳＰ）、ベースバンドプロセッサ、及び／またはアプリケーションプロセッサ（例えばＡＳＩＣ）を備えることができる。

音声コーデック２２０は、音声の符号化／復号化動作を実施するように構成可能な適切な回路を備えることができる。例えば、音声コーデック２２０は、１つ以上のアナログ−デジタル変換器（ＡＤＣ）、１つ以上のデジタル−アナログ変換器（ＤＡＣ）、及び少なくとも１つのマルチプレクサ（ＭＵＸ）を備えることができ、マルチプレクサは、音声コーデック２２０内で扱われる信号を、マルチプレクサの適切な入力ポート及び出力ポートに誘導するのに使用できる。

動作において、電子機器２００は、音声信号の入力及び／または出力をサポートすることができる。例えば、マイクロフォン２４０_１及び２４０_２は、アナログ音声入力を受信することができ、このアナログ音声入力は、その後、（アナログ信号２４２及び２４４として）音声コーデック２２０に転送されることができる。音声コーデック２２０は、アナログ音声入力を（例えばＡＤＣを介して）デジタル音声ストリームに変換することができ、デジタル音声ストリームは、プロセッサ２１０に（デジタル信号２１６を介して−例えばＩ^２Ｓ接続上で）伝送されることができる。プロセッサ２１０は、その後、デジタル音声信号にデジタル処理を適用することができる。出力側では、プロセッサ２１０は、デジタル音声信号を生成することができ、その際に、対応するデジタル音声ストリームを音声コーデック２２０に（デジタル信号２１４を介して−例えばＩ^２Ｓ接続上で）伝送する。音声コーデック２２０は、デジタル音声ストリームを処理することができ、これを（ＤＡＣを介して）アナログ信号に変換し、このアナログ信号を、（アナログ接続２２２及び２２４を介して）スピーカー２３０_１及び２３０_２に送ることができる。

例示的な実施形態では、音声出力信号を一方のスピーカーのみに送ることができる。例えば、電子機器２００は、ハンドセットモード及びスピーカーモードなどの複数のモードをサポートすることができる。したがって、音声出力信号を、電子機器２００がハンドセットモードで動作している際は、スピーカー２３０_１（これを「主要スピーカー」として使用できる）のみに送ることができ、電子機器２００がスピーカーモードで動作している際は、スピーカー２３０_２（これを「二次スピーカー」として使用できる）のみに送ることができる。２つのスピーカー間の切り替えは、音声コーデック２２０のＭＵＸを用いて行うことができる。さらに、この切り替えは、（動作モードを基に設定できる）制御信号２１２を用いて制御できる。

場合によっては、音声出力部品（例えば電子機器２００のスピーカー２３０_１及び２３０_２）を使用して音声入力を取得または生成することが望ましいことがあり、この音声入力は、ノイズリダクション及び／または音響エコー消去などの音声関連機能を最適化または向上するのに使用することができる。例えば、ユーザがいくつかの音声関連サービスで電子機器を使用する場合（例えばデバイスを携帯電話とすることができ、ユーザがこれを音声通話中に使用しているとする場合）、デバイス（またはデバイスの筐体）は、ユーザの頬に接触していてよい。ユーザの発言（すなわち声）は、ユーザの骨格を振動させることができ、次にこの骨格が、デバイスの筐体を振動させることができ、これは筐体がユーザの頬と接着していることによって起こる。デバイスのスピーカー（複数の場合もある）は通常筐体に装着できるため、ユーザの声によって起こる振動などの筐体内の振動を感知するために、スピーカーを振動検出器（ＶＳｅｎｓｏｒ）として使用できる−すなわち、ＶＳｅｎｓｏｒの信号を生成する際にスピーカーを使用できる。ＶＳｅｎｓｏｒの信号を分析し、ユーザが話し中かどうかを判定することができる。さらに、ＶＳｅｎｓｏｒの信号（場合によっては、標準マイクロフォンを介して得られた信号と合わせた信号）を、ノイズリダクション及び／または音響エコー消去の処理を改善するなどのために、処理することができる。このようなスピーカーの使用は、特定の動作モード（例えばハンドセットモードで）の方が適切なことがあるが、本開示はそのように限定されるものではなく、ユーザの発話とは通常関係のないことがある他の動作モードで（例えばスピーカーモードで）、同じようにスピーカーを使用することができる。例えば、スピーカーモードであっても、デバイスがユーザの口に近ければ、ユーザが話しているときは、ユーザの声が依然としてデバイスの筐体を振動させることがある。このような振動は、その時の動作モード中には通常アクティブではないスピーカー−例えば「イヤフォン」スピーカーで検出することができ、このスピーカーは、スピーカーモードなどのモード中には通常使用されないことがあり、振動検出器（ＶＳｅｎｓｏｒ）として構成され、かつ／または振動検出器（ＶＳｅｎｓｏｒ）として作用することができ、このような振動を捕捉する。

音声入力を得るためのスピーカーを（例えばマイクロフォンまたは振動検出器として）使用する際のサポートには、電子機器内への既存の部品（回路及び／またはソフトウェア）の追加または修正が必要になることがある。それでも、このような変更を最小にすることができ、実質的には、専用の音声入力部品をさらに追加するよりもコスト効果を高くすることができる。スピーカーのこのような使用をサポートする実施態様の例を、少なくとも図３、図４及び図５に示している。

図３は、複数のマイクロフォン及びスピーカーを搭載した例示的な電子機器のアーキテクチャを示し、このアーキテクチャは、スピーカーを音声入力部品として使用できるように修正されている。図３を参照すると、電子機器３００が示されている。

電子機器３００は、例えば図２の電子機器２００と実質的に同様のものであってよい。ただし、電子機器３００は、特定の音声関連機能（例えばノイズリダクション及び／または音響エコー消去）を向上させるなどのために、音声出力部品（例えばスピーカー）を音声入力部品（例えばマイクロフォンまたは振動検出器）として使用するのをサポートするように構成できるものである。電子機器３００は、回路及び／または部品を追加で−すなわち、電子機器２００に関して記載した回路及び／または部品に加えて−備えて、このように最適化したスピーカーの使用をサポートすることができる。例えば、図３に示した実施態様では、電子機器は、マルチプレクサ（ＭＵＸ）３３０及び一対の増幅器３１０及び３２０を備えることができる。ＭＵＸ３３０及び増幅器３１０及び３２０は、スピーカー２３０_１及び２３０_２（接続３１２及び３２２を介して）からの入力を得て、この入力（複数の場合もある）を音声コーデック２２０に送るのに使用することができる。スピーカー２３０_１及び２３０_２からの入力（複数の場合もある）は、ノイズリダクション及び／または音響エコー消去などの音声関連機能を向上かつ／または最適化するのに使用することができる。この点で、スピーカー２３０_１及び２３０_２からの入力を使用することは、このスピーカーを電子機器３００内に配置することで−例えば、入力を捕捉する際に好ましい距離を置いた間隔で（例えばマイクロフォン２４０_１及び２４０_２のうちの一方の近くに）配置するか、あるいは電子機器３００の筐体に装着して配置することで、望ましくなることがあり、これによって、振動検出器として働くのに理想的な配置になる。

動作中において、スピーカー２３０_１及び２３０_２は、入力デバイスとして（すなわち、音声または振動の入力を得るために）構成し、かつ／または使用することができる。例示的な使用状況では、スピーカー２３０_１及び２３０_２のうちの一方または両方を、「マイクロフォン」の入力を得るのに使用するために選択でき、この入力を、ノイズリダクション及び／または音響エコー消去の処理過程で、標準マイクロフォン（すなわち、マイクロフォン２４０_１及び２４０_２のうちの一方または両方）から得た入力と合わせるなどして処理することができる。プロセッサ２１０は、ＭＵＸ３３０に（例えば制御信号３３６を介して）、スピーカー２３０_１及び２３０_２のうちの一方と１つ以上のマイクロフォン２４０_１及び２４０_２とから得た入力を選択して、２つの接近したマイクロフォンとして動作するよう命令することができる。このようにして使用するスピーカーとマイクロフォンとの特定の対は、電子機器３００の動作モードなどに基づいて、自動的かつ／または適応的に選択することができる。

例えば、スピーカー２３０_１を（例えば「イヤフォン」スピーカーとして）使用できるハンドセットモードでは、プロセッサ２１０は、制御信号３３６を介して、ＭＵＸ３３０に、（主要マイクロフォンとして使用されている）マイクロフォン２４０_１とスピーカー２３０_２からの入力を選択するよう命令することができる。さらに、プロセッサ２１０は、ハンドセットモード中はスピーカーとして作動していないスピーカー２３０_２を、マイクロフォンとして使用するように−例えば、ＮＲ及び／またはＡＥＣ処理をサポートする入力を得るように、構成することができる。例えば、スピーカー２３０_２は、出力音声を生成する際に使用される同じ部品などを使用して、入力信号を生成するように構成しながらも、逆に機能するように構成することができる。さらに、ＭＵＸ３３０に送られる前に、生成された信号を増幅器３２０を介して増幅することができる。したがって、接近したマイクロフォン（すなわち、マイクロフォン２４０_１及びスピーカー２３０_２）として作用する部品から選択された信号を、（アナログ接続３３２及び３３４を介して）音声コーデック２２０に送ることができ、この音声コーデックでデジタル化する。その後、対応するデジタル信号を（デジタル信号２１６として）プロセッサ２１０に送ってさらに処理することができる。

スピーカー２３０_２を（例えば「イヤフォンではない」スピーカーとして）使用できるスピーカーモードでは、プロセッサ２１０は、制御信号３３６を介して、ＭＵＸ３３０に、（主要マイクロフォンとして使用されている）マイクロフォン２４０_２とスピーカー２３０_１からの入力を選択するよう命令することができる。プロセッサ２１０は、スピーカーモード中はスピーカーとして作動していないスピーカー２３０_１を、前述したようにマイクロフォンとして使用するように構成することができる。このように、マイクロフォン２４０_２及びスピーカー２３０_１は、接近したマイクロフォンとして作用でき、そこからＭＵＸ３３０に入力された信号は（増幅器３１０を介してスピーカー２３０_１が生成した信号を増幅した後）、ＭＵＸ３３０によって（接続３３２及び３３４を介して）音声コーデック２２０に送られてデジタル化されることができ、これに対応するデジタル結果は、プロセッサ２１０に送られてさらに処理される。

プロセッサ２１０は、入力信号を扱う際に追加のステップを実施するように構成され、入力信号の発信源を明らかにすることができる。例えば、標準マイクロフォン（例えばマイクロフォン２４０_１及び２４０_２）の周波数応答は、マイクロフォンとして作用しているスピーカー（例えばスピーカー２３０_１及び２３０_２）の周波数応答とは通常異なるため、プロセッサ２１０は、マイクロフォンとして作用しているスピーカーからの信号の前処理を実行して、標準マイクロフォンからくる入力信号にさらに良好な形でマッチングさせることができる。スピーカーからの信号を標準マイクロフォンの信号にマッチングさせるための前処理行程の一例を、図５にさらに詳細に記載している。

図４は、複数のマイクロフォン及びスピーカーを搭載した例示的な電子機器のアーキテクチャを示し、このアーキテクチャは、スピーカーを音声入力部品として使用できるように別の方法で修正されている。図４を参照すると、電子機器４００が示されている。

電子機器４００は、例えば図２の電子機器２００と実質的に同様のものであってよい。ただし、図３の電子機器３００のように、電子機器４００は、特定の音声関連機能（例えばノイズリダクション及び／または音響エコー消去）を向上させるなどのために、音声出力部品（例えばスピーカー）を音声入力部品（例えばマイクロフォンまたは振動検出器）として使用するのをサポートするように構成することもできる。電子機器４００は、回路及び／または部品を追加で−すなわち、電子機器２００に関して記載した回路及び／または部品に加えて−備えて、このように最適化したスピーカーの使用をサポートすることができる。例えば、図４に示した実施態様では、電子機器は、１対のスイッチ４１０及び４２０、及び１対の増幅器４３０及び４４０を備えることができる。各々のスイッチ４１０及び４２０は、信号を受信する入力ポートなどを基に、信号を適応させてルーティングできるようにするための回路を備えることができる。例えば、スイッチ４１０及び４２０は、音声コーデック２２０からの信号（すなわち、「出力」信号）をスピーカー２３０_１及び２３０_２に転送し、スピーカー２３０_１及び２３０_２から得られた信号（すなわち、「入力」信号）を増幅器４３０及び４４０に転送するように構成可能であることができる。スイッチ４１０及び４２０ならびに増幅器４３０及び４４０は、スピーカー２３０_１及び２３０_２からの入力を得て、この入力（複数の場合もある）を音声コーデック２２０に送るのに使用することができる。記載したように、スピーカー２３０_１及び２３０_２からの入力（複数の場合もある）は、ノイズリダクション及び／または音響エコー消去などの音声関連機能を向上かつ／または最適化するのに使用することができる。

動作において、スピーカー２３０_１及び２３０_２は、入力デバイスとして（すなわち、音声または振動入力を得るために）構成され、かつ／または使用されることができる。例示的な使用状況では、スピーカー２３０_１及び２３０_２のうちの一方（または両方）を、ＶＳｅｎｓｏｒとして選択し、構成して、振動を感知し、これに対応する「振動」入力を生成するのに使用することができ、この振動入力を、ノイズリダクション及び／または音響エコー消去の処理過程で、標準マイクロフォン（すなわち、マイクロフォン２４０_１及び２４０_２のうちの一方）から得た入力と合わせるなどして処理することができる。ＶＳｅｎｓｏｒとして使用する特定のスピーカーは、電子機器４００の動作モードなどに基づいて、自動的かつ／または適応的に選択することができる。

例えば、ハンドセットモードでは、スピーカー２３０_１を作動させて主要スピーカーとして使用できるが、音声通話サービスをサポートするにあたり、通常スピーカー２３０_２を作動することも使用することもできない。そのため、スピーカー２３０_２は、電子機器４００がハンドセットモードのときに選択することができ、ＶＳｅｎｓｏｒとして構成することができる。スピーカー２３０_２は、（例えば電子機器４００が何らかの振動を受けている際に）スイッチ４２０を介して（接続４２２上で）増幅器４４０までルーティングできるＶＳｅｎｓｏｒ信号を生成でき、増幅器は、信号を増幅したのち、この信号を（接続４４２を介して）音声コーデック２２０に送ることができる。音声コーデック２２０は、（例えばそのＡＤＣを介した変換を適用して）信号を処理することができ、生じたデジタル信号を（デジタル信号２１６として）プロセッサ２１０に送り、これを処理する。場合によっては、プロセッサ２１０は、専用のアプリケーションモジュール４５０（例えばソフトウェアモジュール）を組み入れることができ、このモジュールは、入力されるＶＳｅｎｓｏｒ信号を分析するように構成可能であることができる。例えば、ＶＳｅｎｓｏｒ信号の分析で、対応する振動が、デバイスのユーザが話し中であることを示すかどうかを検出することができる。

スピーカー２３０_２を作動させて主要スピーカーとして使用できるが、通常はスピーカー２３０_１を作動することも使用することもできないスピーカーモードでは、代わりにスピーカー２３０_１を選択でき、ＶＳｅｎｓｏｒとして構成できる。このようにすると、スイッチ４１０は、スピーカー２３０_１が生成したいかなるＶＳｅｎｓｏｒ信号も（接続４１２上で）増幅器４３０までルーティングすることができ、増幅器は、信号を増幅したのち、この信号を（接続４３２を介して）音声コーデック２２０に送ることができる。すると、前述したのと同様の方法で、この信号をヘッドセットモードに対して処理することができる。

いくつかの実施態様では、スピーカーとして作動して使用されている間は、スピーカーをＶＳｅｎｓｏｒとして構成できると同時に、そのように（すなわち、ＶＳｅｎｓｏｒ信号を生成するのに）使用できる。例えば、スピーカー２３０_２を通常作動させて主要スピーカーとして使用できるスピーカーモードでは、スピーカー２３０_１を引き続きＶＳｅｎｓｏｒとして構成することができる。すると、スイッチ４２０は、必要であれば信号を両方向にルーティングする−すなわち、音声コーデック２２０から受信した「出力」信号をスピーカー２３０_２までルーティングするとともに、スピーカー２３０_１から受信した「入力」ＶＳｅｎｓｏｒ信号を増幅器４４０にもルーティングするように構成できる。

図５は、スピーカーから得られた信号を変換して標準マイクロフォンからの信号にマッチングさせ、マイクロフォンを介して得られた標準の音声信号と合わせて使用するための例示的な前処理を示ししている。図５を参照すると、前処理行程５００が示されている。

前処理行程５００は、電子機器内の音声処理を扱うように構成されている電子機器（例えばプロセッサ２１０）内の処理回路の一部とすることができる。特に、前処理行程５００は、音声出力部品（例えばスピーカーなど）から得られた音声入力信号の扱いをサポートして、標準の音声入力部品（例えば標準マイクロフォン）からの音声入力と合わせて使用できるように構成されることができる。

図５に示した例示的な実施態様では、前処理行程５００で、標準マイクロフォン（例えばマイクロフォン２４０_１及び２４０_２のうちの一方）から受信した（標準の）入力信号５２０と、マイクロフォンとして作用するように構成されたスピーカー（例えばスピーカー２３０_１及び２３０_２のうちの一方）から受信した入力音声信号５３０とを扱うことができる。その後、前処理行程５００は、スピーカー入力信号５３０を処理することができ、これに対応する（修正された）信号５４０を生成して、この対応する（修正された）信号５４０が（標準の）入力信号５２０と適正にマッチングできるようにする。例えば、スピーカー入力信号５３０は、前処理行程５００内で、（例えばフィルタ５１０を介して）信号５２０と５４０の周波数を同様のものにするフィルタリングを受けることができる。この点で、フィルタ５１０は、信号をフィルタリングにかけるための適切な回路を備えることができる。フィルタ５１０は、スピーカー入力に対応する信号が標準マイクロフォン入力にマッチングできるような方法で、信号を適正に変換するように構成することができる。

例えば、フィルタリングした信号の位相を崩さないように、フィルタ５１０を、位相が線形である有限インパルス応答（ＦＩＲ）フィルタとして実装することができる。さらに、ＦＩＲフィルタを、処理したスピーカー信号（すなわち、フィルタリングした信号５４０）のスペクトルがマイクロフォン信号（すなわち、信号５２０）のスペクトルに近似するように設計することができる。例えば、Ｓ（ｆ）がマイクロフォンとしてのスピーカーのスペクトルに相当し、Ｓ_Ｍ（ｆ）が標準マイクロフォンのスペクトルであると仮定すると、このフィルタによって実施されたフィルタリングによって、処理した信号のスペクトル−すなわちＳ（ｆ）×ＦＩＲ（ｆ）がマイクロフォンスペクトルのスペクトルＳ_Ｍ（ｆ）に近似するように、フィルタ５１０を構成することができる。そのため、フィルタ５１０の周波数応答を、ＦＩＲ（ｆ）＝Ｓ_Ｍ（ｆ）／Ｓ（ｆ）となるように構成することができる。したがって、このようにして構成した（ＦＩＲ）フィルタ５１０により、信号のフィルタリングを一定の方法で実現でき、その結果、標準マイクロフォンの伝送機能とマイクロフォンとして作用するスピーカーとの間に差が生じる。

フィルタ５１０のフィルタリング機能は、フィルタリングパラメータを用いて制御でき、このフィルタリングパラメータは、例えばキャリブレーションプロセスに基づいて決定することができる。キャリブレーションプロセスは、フィルタリングパラメータが明らかになった時点で行うことができ、フィルタリングパラメータはその後、保存して再度使用できる。キャリブレーションプロセスは、反復的にかつ／または動的に（例えばリアルタイムで）実施することもできる。フィルタリング機能（よってこれに対応するフィルタリングパラメータも）は、信号の発信源に応じて異なっていてよい。例えば、フィルタリングパラメータは、フィルタリングされる予定の信号がスピーカー２３０_２ではなくスピーカー２３０_１から来ている場合は、異なっていてよい。そのため、様々な一連のフィルタリングパラメータを様々な（利用可能な）スピーカーに対して事前に規定することができ、使用状況ごとの発信源に応じて適切なスピーカーを選択する状態にする。すると、信号５２０及び５４０を２つの「マイクロフォン」信号−例えば任意の２つのマイクロフォンのノイズリダクション（ＮＲ）動作として使用できる。

図６は、電子機器内の複数のマイクロフォン及びスピーカーを管理するための例示的なプロセスを示すフローチャートである。図６を参照すると、複数の例示的なステップを含むフローチャート６００が示されており、これらのステップを電子システム（例えば図３及び図４の電子機器３００または４００）内で実行して、そこに組み込まれているスピーカー及びマイクロフォンの最適な管理を簡易化することができる。

最初のステップ６０２では、電子機器（例えば電子機器３００）の電源を入れて起動させることができる。このステップには、電源をオンにすることと、電子機器の様々な部品を作動させかつ／または起動させることとを含めることができ、その結果、電子機器は、この電子機器がサポートする機能またはアプリケーションを実施または実行する準備ができた状態になることができる。

ステップ６０４では、ユーザのコマンド／入力または事前に構成された実行命令などに基づいて、電子機器の動作モードを設定する（または切り替える）ことができる。例えば、電子機器が通信（特に音声通話）サービスをサポートできる場合、動作モードには、ハンドセットモード及び／またはスピーカーモードを含めることができる。したがって、電子機器は、デバイスのユーザが音声通話を開始し（または受け入れ）て、電子機器をユーザの顔に置いた際に、ハンドセットモードに切り替えることができる。

ステップ６０６では、その時の動作モードに基づいて非アクティブになっているスピーカーがあるかどうかを判定することができる。例えば、複数のスピーカーを有するモバイル通信デバイス（例えば携帯電話）では、特定の動作モードで特定のスピーカー（複数の場合もある）のみ−例えばハンドセットモードで「イヤフォン」スピーカーのみを使用することができる。非アクティブ（または非使用）のスピーカーがないと判定された場合、プロセスはステップ６１２へ進むことができ、このように判定されなければ、プロセスはステップ６０８へと進む。

ステップ６０８では、非アクティブ（または非使用）のスピーカーが入力を行うように構成する必要があるかどうかを判定することができる。例えば、複数のマイクロフォンを有する電子機器では、ノイズリダクションや音響エコー消去などの機能をサポートするための入力を得るために、マイクロフォンを使用できることがある。しかし、これらの機能の性能は、使用されているマイクロフォンが最適に配置されていなければ（例えば離れすぎていれば）、低下することがある。そのため、スピーカーが一方のマイクロフォンに対してより最適に配置されている場合は、そのスピーカーを「マイクロフォン」として使用する方が望ましいことがある。また、例えばスピーカーが、ユーザの骨格及び電子機器（またはその筐体）を伝播する振動を受信するのに理想的な形で配置されている場合、スピーカーを振動検出器（ＶＳｅｎｓｏｒ）として使用することが望ましいことがある。非アクティブ（または非使用）のスピーカーが入力を行うように構成する必要がないと判定された場合、プロセスは、ステップ６１２へ進むことができ、このように判定されなければ、プロセスはステップ６１０へと進む。

ステップ６１０では、（例えば、その時の動作モードに基づいて判定された通りの、非アクティブ／非使用状態に基づいて、かつ／また所望の入力を行うのに最適な状態に基づいて）選択された１つ以上のスピーカーを、所望の入力を行うように（例えば、周囲の音声を捕捉する「マイクロフォン」として、または電子機器を伝播する振動を捕捉するＶＳｅｎｓｏｒとして）構成することができる。さらに、入力を行って−例えば必要な部品（増幅器、ＭＵＸ、スイッチング素子など）を作動させて、生成された入力をルーティングし、処理する際に、選択されたスピーカー（複数の場合もある）の使用をサポートするように、電子機器を全体的に構成することができる。

ステップ６１２では、電子機器は、その時の動作モードに従って動作することができる。このステップには、例えばノイズリダクション及び／または音響エコー消去処理を向上させるために、任意の選択されたスピーカー（複数の場合もある）を介して得られた入力を使用することを含めることができる。

図７は、スピーカーを介して捕捉した振動を用いて音声入力を生成するための例示的なプロセスを示すフローチャートである。図７を参照すると、複数の例示的なステップを含むフローチャート７００が示されている。この複数の例示的なステップは、例えばアプリケーションモジュール４５０を介して実装されたアルゴリズムに相当することができ、かつ／またはこのアルゴリズムに従って実施されることができる。

最初のステップ７０２では、スピーカーを介して信号を捕捉することができる。信号Ｖ（ｔ）は、例えば、スピーカーを介して捕捉した振動に相当するものとすることができる。ステップ７０４では、この信号を前処理して、例えば対応する離散信号Ｖ（ｎ）を生成することができ、この場合の「ｎ」は、離散時間ｎＴの時点での信号Ｖ（ｔ）のサンプルに相当する。このような信号Ｖ（ｎ）は、発言による振動を感知しやすいことがあるが、特に周波数が低い場合は、周囲のノイズに対する感知度は著しく低いことがある（例えば最大約１ｋＨｚ）。そのためノイズの多い環境であっても、信号雑音比（ＳＮＲ）は比較的高いことがある。

ステップ７０６では、分析に適切になるように信号を処理することができる。例えば、信号Ｖ（ｎ）を（例えばバンドパスフィルタまたはＢＰＦを用いて）フィルタリングすることができる。

ステップ７０８では、信号を処理することができる。例えば、（フィルタリングＶ（ｎ）信号から生じた）Ｖ_ＢＰ（ｎ）信号を、１つ以上の分析技術を用いてサンプルごとに処理することができる。Ｖ_ＢＰ（ｎ）信号は、（例えば話者の）ピッチを計算するための自己相関など、標準の技術を用いて分析することができる。Ｖ_ＢＰ（ｎ）信号は、信号の包絡線Ｖ_ＥＮ（ｎ）を計算することによって分析することもできる。

ステップ７１０では、分析結果をチェックし、任意のマッチング基準を満たしているかどうかを判定することができる。満たされるマッチング基準がないと判定できる場合、プロセスは、ステップ７０８に戻って、次のサンプルを分析することができる。少なくとも１つのマッチング基準が満たされていると判定できる―すなわち、その人が話し中であると示されている場合、プロセスは、ステップ７１２へと進むことができ、このステップでは、信号を入力音声信号として−例えば音声活動検出器（ＶＡＤ）として使用することができる。

例えば、ステップ７１０で実施されるチェックには、ピッチが検出されたかどうか、かつ／または信号の包絡線が所定閾値よりも上か−例えばＶ_ＥＮ（ｎ）＞ＴＨ＿ｅｎｖであるどうかを判定することを含めることができる。

ピッチの検出は、入力信号の自己相関を分析し、所定閾値に対するその最大値をチェックすることによる、ピッチ値の計算に基づいて行うことができる。そのため、計算された最大値（Ａｕｔｏ＿ｍａｘ）が所定閾値（ＴＨ＿ｐｉｔｃｈ）よりも大きければ、その信号を音声信号として確定できる。

そのため、Ａｕｔｏ＿ｍａｘ＞ＴＨ＿ｐｉｔｃｈである場合、またはＡｕｔｏ＿ｍａｘ＜ＴＨ＿ｐｉｔｃｈだがＶ_ＥＮ（ｎ）＞ＴＨ＿ｅｎｖである場合、その信号を音声フレームとして確定でき、ＶＡＤフラグを設定できる。しかし、そうでない場合は、ＶＡＤフラグを解除する。

図７に示した例示的なプロセスでは、信号の扱い（計算及び／または分析）をサンプルごとに行う。しかし、このようにする代わりに、この処理をサンプルの集合単位で行ってもよい。例えば、Ｎ個のサンプルの各々（「Ｎ」は整数）を１つのフレーム内にまとめることができ、計算をフレームごとに行う。フレームのサイズは、最適な性能となるように調整することができる。例えば、各フレームを１０ｍｓとすることができる（そのため、Ｎ個のサンプルの各々の時間が１０ｍｓとなるようにＮを設定する）。

いくつかの実施態様では、スピーカー及び／またはマイクロフォンを適応的に管理する方法を、電子機器（例えば電子機器３００または４００）を備えることができるシステムで使用でき、この電子機器は、１つ以上の回路（例えばプロセッサ２１０、音声コーデック２２０、スイッチ４１０及び４２０、ならびに増幅器３１０、３２０、４３０、及び４４０）と、第１のスピーカー及び第２のスピーカー（例えばスピーカー２３０_１及び２３０_２）とを備えることができる。この１つ以上の回路は、電子機器の動作モードを判定するために動作可能なものにすることができ、判定された動作モードに基づいて、第１のスピーカーと第２のスピーカーのうちの一方または両方の動作を管理し、この場合の管理には、第１のスピーカー及び第２のスピーカーのうちの一方または両方の機能を適応的に切り替えるまたは修正することを含めることができる。第１のスピーカー及び第２のスピーカーのうちの一方または両方の機能の切り替えまたは修正には、第１のスピーカーと第２のスピーカーのうちの一方を、マイクロフォンとしてまたは振動検出器（ＶＳｅｎｓｏｒ）として使用するように構成することを含めることができる。１つ以上の回路は、第１のスピーカーと第２のスピーカーのうちの一方を、スピーカーとして機能し続けると同時に、マイクロフォンとしてまたは振動検出器としても使用されるように構成することができる。１つ以上の回路は、電子機器内の音声向上機能をサポートするために、マイクロフォンとしてまたは振動検出器として使用するように構成された、第１のスピーカーと第２のスピーカーのうちの一方からの入力を使用するために動作可能なものにすることができる。音声向上機能には、ノイズリダクション及び／または音響エコー消去を含めることができる。第１のスピーカーと第２のスピーカーのうちの一方を、電子機器のユーザが話し中かどうかを示すための振動検出器として構成することができる。第１のスピーカーと第２のスピーカーのうちの一方を、電子機器の筐体内の振動を検出するための振動検出器として構成することができる。１つ以上の回路は、電子機器の別の異なる動作モードに応じて、第１のスピーカーと第２のスピーカーのうちのもう一方を選択するために動作可能なものにすることができる。

いくつかの実施態様では、スピーカー及びマイクロフォンを適応的に管理する方法を、第１のスピーカー及び第２のスピーカー（例えばスピーカー２３０_１及び２３０_２）、ならびに第１のマイクロフォン及び第２のマイクロフォン（例えばマイクロフォン２４０_１及び２４０_２）を備えているモバイル通信デバイスに使用することができる。この方法には、モバイル通信デバイスの動作モードを判定することと、モバイル通信デバイスのユーザが話し中のときに表示を生成することと、モバイル通信デバイスの動作モードユーザが話し中であるという表示に基づいて、第１のスピーカーと第２のスピーカーのうちの一方を選択することと、判定された動作モードに基づいて、選択されたスピーカーの動作を管理することとを含めることができる。この管理には、第１のマイクロフォン及び第２のマイクロフォンから入力される時期が、モバイル通信デバイス内の音声向上機能をサポートするのに不適切であることを判定することと、選択されたスピーカーの機能を適応的に切り替えるまたは修正して、選択されたスピーカーへの入力を達成することとを含めることができる。音声向上機能には、ノイズリダクションまたは音響エコー消去を含めることができる。第１のマイクロフォン及び第２のマイクロフォンからの入力は、第１のマイクロフォンと第２のマイクロフォンとの間の配置及び／または間隔に基づいて、モバイル通信デバイスにおける音声向上機能をサポートするのに不適切であると判定されることがある。第１のスピーカーと第２のスピーカーのうちの一方を、第１のマイクロフォンと第２のマイクロフォンのうちの一方または両方に対する配置及び／または間隔に基づいて選択することができる。

他の実施態様では、機械及び／もしくはコンピュータによって実行できる少なくとも１つのコード部分を有する機械コード及び／もしくはコンピュータプログラムを記憶した、一時的でないコンピュータ可読媒体及び／もしくは記憶媒体、ならびに／または一時的でない機械可読媒体及び／もしくは記憶媒体を備えることができ、これによって、その機械及び／もしくはコンピュータに、本明細書に記載したようなステップを、複数のマイクロフォン及びスピーカーを管理するための適応システムに対して実施させる。

したがって、本方法及び／または本システムは、ハードウェア、ソフトウェア、またはハードウェアとソフトウェアとを組み合わせたものにおいて実現できる。本方法及び／または本システムは、少なくとも１つのコンピュータシステムにおいて中央集中型に、または様々な素子が相互接続された複数のコンピュータシステムにまたがって展開されている場合には、分配型に実現できる。本明細書に記載した方法を実行するのに適応したどのような種類のコンピュータシステムまたは他のシステムも、適切である。ハードウェアとソフトウェアとの典型的な組み合わせを、コンピュータプログラムを備えた汎用コンピュータシステムであって、このコンピュータプログラムが、ロードされて実行される際に、本明細書に記載の方法を実行するようにコンピュータシステムを制御する汎用コンピュータシステム、とすることができる。もう１つの典型的な実施態様では、特定用途向け集積回路またはチップを備えることができる。

本方法及び／または本システムは、本明細書に記載した方法の実装を可能にするあらゆる特徴を備えるコンピュータプログラム製品であって、コンピュータシステムにロードされた際にこれらの方法を実行することができるコンピュータプログラム製品に取り入れることもできる。ここでいうコンピュータプログラムとは、情報処理能力を有するシステムに、特定の機能を直接実施させるか、あるいは、ａ）別の言語、コードまたは符号への変換、ｂ）異なる材料形態での再現、のいずれかまたは両方を行った後に実施させるための一連の命令を、任意の言語、コードまたは符号で表現したもののことである。したがって、いくつかの実施態様では、機械で実行できる１行以上のコードを記憶した、一時的でない機械可読（例えばコンピュータ可読）媒体（例えばＦＬＡＳＨドライブ、光学ディスク、磁気記憶ディスクなど）を備えることができ、これによって、その機械に、本明細書に記載したようなプロセスを実施させる。

本方法及び／または本システムを、特定の実施態様を参照して説明してきたが、本方法及び／または本システムの範囲を逸脱しない限り、様々な変更を加えてよく、均等物を代替してもよいことが、当業者には理解される。このほか、本開示の範囲を逸脱しない限り、本開示の教示に多くの修正を加えて特定の状況または材料に適応させてよい。したがって、本方法及び／または本システムは、開示した特定の実施態様に限定されるものではなく、本方法及び／または本システムは、添付の特許請求の範囲内に収まるすべての実施態様を含むものとする。

Claims

複数のマイクロフォン及びスピーカーを管理するシステムであって、
１つ以上の回路、ならびに第１のスピーカー及び第２のスピーカーを備える電子機器を備え、
前記１つ以上の回路が、
前記電子機器の動作モードを決定し、
前記決定された動作モードに基づいて、前記第１のスピーカーと前記第２のスピーカーのうちの一方または両方の動作を管理することであって、その管理が、前記第１のスピーカーと前記第２のスピーカーのうちの一方または両方の機能を適応的に切り替えるかまたは修正することを含む管理をする動作可能である
ことを特徴とするシステム。
前記第１のスピーカーと前記第２のスピーカーのうちの一方または両方の機能を切り替えるまたは修正することは、前記第１のスピーカーと前記第２のスピーカーのうちの一方を、マイクロフォンとしてまたは振動検出器として使用するように構成することを含む
請求項１に記載のシステム。
前記１つ以上の回路は、前記第１のスピーカーと前記第２のスピーカーのうちの一方を、スピーカーとして機能し続けると同時に、マイクロフォンとしてまたは振動検出器としても使用されるように構成する
請求項２に記載のシステム。
前記１つ以上の回路は、マイクロフォンとしてまたは振動検出器として使用するように構成された、前記第１のスピーカーと前記第２のスピーカーのうちの一方からの入力を用いて、前記電子機器内の音声向上機能をサポートするように動作可能である
請求項２に記載のシステム。
前記音声向上機能は、ノイズリダクション及び／または音響エコー消去を含む
請求項４に記載のシステム。
前記第１のスピーカーと前記第２のスピーカーのうちの一方は、前記電子機器のユーザが話し中かどうかを指摘するための振動検出器として構成される
請求項２に記載のシステム。
前記第１のスピーカーと前記第２のスピーカーのうちの一方は、前記電子機器の筐体内の振動を検出するための振動検出器として構成される
請求項２に記載のシステム。
前記１つ以上の回路は、前記電子機器の別の異なる動作モードに応じて、前記第１のスピーカーと前記第２のスピーカーのうちのもう一方を選択するように動作可能である
請求項１に記載のシステム。
複数のマイクロフォン及びスピーカーを管理する方法であって、
少なくとも１つの第１のスピーカー及び第２のスピーカーを備える電子機器内で、
前記電子機器の動作モードを決定するステップと、
決定された動作モードに基づいて、前記第１のスピーカーと前記第２のスピーカーのうちの一方または両方の動作を管理することであって、その管理が、前記第１のスピーカーと前記第２のスピーカーのうちの一方または両方の機能を適応的に切り替えるまたは修正することを含む管理をするステップとを含む
ことを特徴とする方法。
前記第１のスピーカーと前記第２のスピーカーのうちの一方または両方の機能を切り替えるまたは修正することは、前記第１のスピーカーと前記第２のスピーカーのうちの一方を、マイクロフォンとしてまたは振動検出器として使用するように構成することを含む
請求項９に記載の方法。
前記第１のスピーカーと前記第２のスピーカーのうちの一方を、スピーカーとして機能し続けると同時に、マイクロフォンとしてまたは振動検出器としても使用されるように構成することを含む
請求項１０に記載の方法。
マイクロフォンとしてまたは振動検出器として使用するように構成された、前記第１のスピーカーと前記第２のスピーカーのうちの一方からの入力を用いて、前記電子機器内の音声向上機能をサポートすることを含む
請求項１０に記載の方法。
前記音声向上機能は、ノイズリダクション及び／または音響エコー消去を含む
請求項１２に記載の方法。
前記第１のスピーカーと前記第２のスピーカーのうちの一方を、前記電子機器のユーザが話し中かどうかを指摘するための振動検出器として構成することを含む
請求項１０に記載の方法。
前記第１のスピーカーと前記第２のスピーカーのうちの一方を、前記電子機器の筐体内の振動を検出するための振動検出器として構成することを含む
請求項１０に記載の方法。
前記電子機器の別の異なる動作モードに応じて、前記第１のスピーカーと前記第２のスピーカーのうちのもう一方を選択することを含む
請求項９に記載の方法。
複数のマイクロフォン及びスピーカーを管理する方法であって、
第１のスピーカー及び第２のスピーカー、ならびに第１のマイクロフォン及び第２のマイクロフォンを備えるモバイル通信デバイス内で、
前記モバイル通信デバイスの動作モードを決定するステップと、
前記モバイル通信デバイスのユーザが話し中のときに表示を生成するステップと、
前記モバイル通信デバイスの前記動作モード及び前記ユーザが話し中であるという前記表示に基づいて、前記第１のスピーカーと前記第２のスピーカーのうちの一方を選択するステップと、
前記決定された動作モードに基づいて、前記選択されたスピーカーの動作を管理するステップであって、その管理が、
前記第１のマイクロフォン及び前記第２のマイクロフォンから入力される時期が、前記モバイル通信デバイス内の音声向上機能をサポートするのに不適切であることを判定することと、
前記選択されたスピーカーを介して入力を得るために、前記選択されたスピーカーの機能を適応的に切り替えまたは修正することとを含む管理をすることとを含む
ことを特徴とする方法。
前記音声向上機能は、ノイズリダクションまたは音響エコー消去を含む
請求項１７に記載の方法。
前記第１のマイクロフォンと前記第２のマイクロフォンとの間の配置及び／または間隔に基づいて、前記第１のマイクロフォン及び前記第２のマイクロフォンからの入力が、前記モバイル通信デバイス内の音声向上機能をサポートするのに不適切であることを判定することを含む
請求項１７に記載の方法。
前記第１のマイクロフォンと前記第２のマイクロフォンのうちの一方または両方に対する配置及び／または間隔に基づいて、前記第１のスピーカーと前記第２のスピーカーのうちの一方を選択することを含む
請求項１７に記載の方法。