JP2014112831A - 複数のマイクロフォン及びスピーカーを管理するシステム - Google Patents

複数のマイクロフォン及びスピーカーを管理するシステム Download PDF

Info

Publication number
JP2014112831A
JP2014112831A JP2013232095A JP2013232095A JP2014112831A JP 2014112831 A JP2014112831 A JP 2014112831A JP 2013232095 A JP2013232095 A JP 2013232095A JP 2013232095 A JP2013232095 A JP 2013232095A JP 2014112831 A JP2014112831 A JP 2014112831A
Authority
JP
Japan
Prior art keywords
speaker
microphone
electronic device
speakers
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013232095A
Other languages
English (en)
Inventor
Heiman Arie
ハイマン アリー
Roeimi Roei
ロエイミ ロエイ
Yehuday Uri
イェフデイ ウリ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DSP Group Inc
Original Assignee
DSP Group Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DSP Group Inc filed Critical DSP Group Inc
Publication of JP2014112831A publication Critical patent/JP2014112831A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2400/00Loudspeakers
    • H04R2400/01Transducers used as a loudspeaker to generate sound aswell as a microphone to detect sound
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/11Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】電子機器内の複数のマイクロフォン及びスピーカーを適応的に管理する方法及びシステムを提供する。
【解決手段】電子機器200の動作モードを決定でき、決定した動作モードに基づいて、少なくとも1つのスピーカーの動作を管理する。この管理には、少なくとも1つのスピーカーの機能を適応的に切り替えるかまたは修正することを含む。例えば、少なくとも1つのスピーカーを、マイクロフォンまたは振動検出器として作用するように構成することができる。少なくとも1つのスピーカーを用いて得られる入力を、ノイズリダクション及び/または音響エコー消去などの音声関連機能を最適化するのに使用できる。
【選択図】図2

Description

本発明は、音声処理に関する。さらに詳細には、本開示の特定の実施態様は、複数のマイクロフォン及びスピーカーを管理するための適応システムに関する。
優先権の主張:
本出願は、2012年11月8日に出願された特許文献1、発明の名称「複数のマイクロフォン及びスピーカーを管理するための適応システム」を参照し、この優先権を主張するとともに、これに基づく利益を主張する。特許文献1の出願を、その全容を参照することによって本願に援用する。
電子機器内の音声入力/出力部品(例えばスピーカーやマイクロフォン)を管理するための既存の方法及びシステムは、不十分かつ/またはコストがかかることがある。従来の慣習的な手法を、図面を参照して本開示の以下の部分に記載した本方法及び機器のいくつかの態様と比較することで、このような手法にはさらに多くの制限及び欠点があることが、当業者に明らかである。
米国特許仮出願第61/723,856号
本発明は、少なくとも1つの図面と関連付けて実質的に示しかつ/または説明し、特許請求の範囲でさらに完全に記載したように、複数のマイクロフォン及びスピーカーを管理するための適応システムとして、1つのシステム及び/または方法を提供する。
本開示のこれらの利点及びその他の利点、態様及び新規性のある特徴ならびにその説明的な実装の詳細は、以下の説明文及び図面からさらに完全に理解される。
複数のマイクロフォン及びスピーカーを搭載した電子機器の一例を示す説明図 複数のマイクロフォン及びスピーカーを搭載した電子機器の一例のアーキテクチャを示す説明図 複数のマイクロフォン及びスピーカーを搭載した電子機器の一例のアーキテクチャを示す図であり、スピーカーを音声入力部品として使用できるように修正した説明図 複数のマイクロフォン及びスピーカーを搭載した電子機器の一例のアーキテクチャを示す図であり、スピーカーを音声入力部品として使用できるように別の方法で修正した説明図 スピーカーから得た信号を標準マイクロフォンからの信号とマッチングするように変換し、マイクロフォンを介して得た標準の音声信号と合わせて使用するための前処理の一例を示す説明図 電子機器内の複数のマイクロフォン及びスピーカーを管理するための例示的なプロセスを示すフローチャート スピーカーを介して捕捉した振動を利用して音声入力を生成するための例示的なプロセスを示すフローチャート
電子機器(例えば、携帯電話やタブレット端末などのモバイル通信システム)に搭載された複数のマイクロフォン及びスピーカーの動作を、適応的に管理し、制御し、切り替えるための方法及びシステムにおいて、特定の実施態様を見出すことができる。この点で、デバイスの元の構造内でのマイクロフォン及びスピーカーの位置を変更することなく、電子機器の内蔵式マイクロフォン及びスピーカーを、本開示に従って使用することができる。むしろ、電子機器のマイクロフォン及びスピーカーの動作を、管理し、制御し、切り替えて、電子機器内の機能性を高め、かつ/または改善するのをサポートすることができる。例えば、標準のモバイルデバイスの内蔵式スピーカーを、ハードウェア及びソフトウェアを含むデバイスの信号処理能力と組み合わせて使用して、デバイス内で使用するための入力を得ることができる。内蔵式スピーカーをマイクロフォン及び/または振動検出器として構成して使用し、デバイスのユーザが話し中かどうかを確実に判定するようにでき、かつ/または様々な適応プロセスを実施するための有益な入力及び/もしくは指示を生成するようにできる。例えば、スピーカーによって生成された入力または指示は、ノイズリダクションプロセスまたは音響エコー消去プロセスを改善するのに使用することができる。使用するスピーカー及び/またはマイクロフォンの選択は、本システムの動作モードなどに基づいて自動的かつ適応的に行うことができる。
本明細書で用いているように、「回路(circuits及びcircuitry)」という用語は、物理的電子部品(すなわちハードウェア)、ならびに、ハードウェアを構成でき、ハードウェアによって実行されるか、あるいはハードウェアに連結されていてよい任意のソフトウェア及び/またはファームウェア(「コード」)を指す。本明細書で使用しているように、例えば、特定のプロセッサ及びメモリが、第1の数行のコードを実行する場合に第1の「回路」を備え、第2の数行のコードを実行する場合に第2の「回路」を備えることができる。本明細書で用いているように、「及び/または」とは、「及び/または」でつながれた列記事項のうちの任意の1つ以上の項目という意味である。一例を挙げると、「x及び/またはy」とは、3要素からなる集合{(x),(y),(x,y)}のうちのいずれかの要素という意味である。もう1つの例を挙げると、「x、y、及び/またはz」とは、7要素からなる集合{(x),(y),(z),(x,y),(x,z),(y,z),(x,y,z)}のうちのいずれかの要素という意味である。本明細書で用いているように、「ブロック」及び「モジュール」という用語は、1つ以上の回路が実施できる機能を指す。本明細書で用いているように、「例」という用語は、非限定的な例、場合、または説明として使用するという意味である。本明細書で用いているように、「例えば(for example及びe.g.,)」という用語は、1つ以上の非限定的な例、場合、または説明からなる列記事項を導入するものである。本明細書で用いているように、回路は、回路が機能を実施するのに必要なハードウェア及びコード(必要な場合)を備えているときはいつでも機能を実施するために「動作可能」であり、その機能の性能が何らかのユーザ構成可能な設定によって無効になっているかどうか、または有効になっていないかどうかは問題ではない。
図1は、複数のマイクロフォン及びスピーカーを搭載した電子機器の一例を示している。図1を参照すると、電子機器100が示されている。
電子機器100は、様々な機能、動作、アプリケーション、及び/またはサービスを実施またはサポートするのに適した回路を備えることができる。電子機器100が実施またはサポートする機能、動作、アプリケーション、及び/またはサービスは、ユーザの命令及び/または予備構成された命令に基づいて進行または制御されることができる。場合によっては、電子機器100は、有線及び/または無線接続などを介して、1つ以上のサポートされた有線及び/または無線のプロトコルまたは規格に応じて、データ通信をサポートすることができるものがある。場合によっては、電子機器100は、ハンドセットモバイルデバイスとすることができ、すなわち、移動中及び/または様々な場所で使用するためのものとすることができる。この点で、電子機器100は、動かしやすいように設計及び/または構成されて、ユーザが保持している間はユーザが動く通りに容易に動かせるようにすることができるとともに、電子機器100は、移動中に電子機器100が実施またはサポートする機能、動作、アプリケーション、及び/またはサービスのうちの少なくともいくつかを扱うように構成することができる。電子機器の例には、モバイル通信デバイス(例えば携帯電話、スマートフォン、及びタブレット端末)、パーソナルコンピュータ(例えばラップトップ型またはデスクトップ型)などを挙げることができる。ただし、本開示は、任意の特定タイプの電子機器に限定されるものではない。
例示的な実施態様では、電子機器100は、音声の入力及び/または出力をサポートすることができる。電子機器100は、例えば、スピーカー及びマイクロフォンを駆動し、制御し、かつ/または使用するのに適した回路に沿って、音声を出力及び/または入力する(捕捉する)のに使用する複数のスピーカー及びマイクロフォンを組み入れることができる。例えば、電子機器100は、第1のスピーカー110、第1のマイクロフォン120、第2のスピーカー130、及び第2のマイクロフォン140を備えることができる。第1のスピーカー110、第1のマイクロフォン120、第2のスピーカー130、及び/または第2のマイクロフォン140を使用する方法は、電子機器100の動作に基づくものとすることができる。さらに、電子機器100は、スピーカー及び/またはマイクロフォンの(通常は様々に異なる)使用特性に対応させて、複数の動作モードをサポートすることができる。例えば、電子機器100がモバイル通信デバイス(例えばスマートフォン)である(またはモバイル通信デバイスとして使用される)場合、電子機器100は、「ハンドセットモード」及び「スピーカーモード」などのモードを(音声の入力/出力に対して)サポートすることができる。
この点で、ハンドセットモードは、音声通話中に電子機器100を使用するのに対応できるものであり、このモードでは、ユーザが電子機器をユーザの顔に向けて保持できる(すなわち、電子機器100は、典型的な方法で保持される「電話」として使用される)。例えば、ハンドセットモード中は、第1のスピーカー110及び第1のマイクロフォン120を、音声通話サービスをサポートするのに使用できる−すなわち、第1のスピーカー110は、第1のマイクロフォン120を(ユーザの口近くに置いて)発言/音声入力の捕捉に使用している間、イヤフォンスピーカーとなることができる。スピーカーモードでは、第2のスピーカー130(すなわちイヤフォンではないスピーカー)を、音声を出力する際に使用できる。スピーカーモードは、例えば、音声通話中に電子機器100を使用するのに対応できるが、ユーザが電子機器を保持できない(例えば電子機器100をハンドフリーまたはスピーカー「フォン」として使用する)という状況においての場合である。この点で、電子機器100がハンドフリーの音声通話中にスピーカーモードで動作すると、第2のスピーカー130(すなわちイヤフォンではないスピーカー)を、音声出力に使用することができ、(遠方から周囲の音声を捕捉するのにより適した)第2のマイクロフォン140を発言/音声入力の捕捉に使用することができる。スピーカーモードは、音声通話とは無関係の音声サービスを提供する際に電子機器100を使用するのにも対応できる。例えば、第2のスピーカー130は、電子機器100内で再生される音楽を出力する際に、スピーカーモードで動作できる。スピーカー110と130とは、同時に動作できず(例えばハンドセットモードで)、主要(イヤフォン)スピーカー110は、第2のスピーカー130が非アクティブ及び/または非使用である間に作動でき、使用でき、一方スピーカーモードでは、主要(イヤフォン)スピーカー110は、通常発声力をより強く生成できる第2のスピーカー130がアクティブの間はアクティブにならない。
本開示の様々な実施態様では、既存の複数のマイクロフォン及びスピーカーの使用及び/または構成を、電子機器(例えば電子機器100)内で最適化して、様々な音声関連機能を向上させることができ、これは例えば、特定モードで通常非アクティブにできるスピーカーを使用して入力信号を捕捉または取得するなどの方法で行う。デバイス内に存在する既存の複数のマイクロフォン及びスピーカーを最適な形でこのように使用することで向上させることができる音声関連機能の例には、ノイズリダクション及び/またはエコー消去などを挙げることができる。
例えば、高質な音声通信を提供することが通常求められていることから、音声の質を向上させるために種々の技術を適用することができる。音声の質を向上させるのに用いられる技術の1つが、ノイズリダクション(NR)であり、これは、ユーザ(特に相手側のエンドユーザ)のために周囲のノイズを低減できるようにする技術である。場合によっては、ノイズリダクション技術を複数のマイクロフォンを使用することで実装できることがある。例えば、デバイスに2つのマイクロフォン使用し、一方のマイクロフォンをユーザの口に近づけ(ユーザの声を捕捉するのに使用し)、もう一方のマイクロフォンをデバイスの口以外の場所(例えば耳の近く及び/またはデバイスの反対の面)に置く場合、第1のマイクロフォンは、ユーザの声及び周囲のノイズを拾うのに使用できるのに対し、第2のマイクロフォンは、主に周囲のノイズを拾うのに使用できる。相手の当事者に送信するきれいな音声を生成するために、(2つのマイクロフォンから来る)2つの信号を処理することができる。このような構成では、ノイズがコヒーレントで、二次マイクロフォンで拾われるノイズと、主要マイクロフォンで拾われるノイズとが相関関係にあれば、ノイズリダクションをうまく実施できる。しかし、オフィスなどの狭い場所に通常存在する残響ノイズのようなコヒーレントでないノイズが存在する場合、両方のマイクロフォンに拾われるノイズは、強い相関関係にはないことがあり、これがノイズリダクションの性能を低下させることがある。ところが、ノイズリダクションの性能は、互いに接近した(例えば互いに1〜2cmの距離)マイクロフォンを使用する場合は著しくよくなることがある。なぜなら、両方のマイクロフォンに拾われたノイズ同士の相関関係が、著しく強まることがあるからである。
場合によっては、エコーを低減し、受信側がユーザ自身の声のエコーを聞こえないようにするために、エコー消去の種々の技術を用いることもできる。音響エコー消去技術(AEC)は、デバイスの環境内におけるノイズ及びエコーの推定に基づいたものとすることができる。さらに、この推定は、様々な適応技術を用いるなどして、連続的に−例えば通話中に行うことができる。ユーザが話し中のときに適応が行われれば、ユーザの声がノイズと解釈されるおそれがあるため、適応技術は、ユーザが話し中かどうかなど、様々な考慮に基づいたものとすることができる。適応を向上させるために行う、ユーザが話し中かどうかの推定は、様々な技術を用いて行うことができる。例えば、音声活動検出器(VAD)を用いて、捕捉した信号を分析して、ユーザが話し中かどうかを判定または推定することができる。これらの技術のほとんどは、周囲のノイズレベルが低い場合(例えば信号雑音比(SNR)が高い場合)に効果が高い。しかし、SNRが低い(すなわち、ユーザの声のレベルに比して環境ノイズレベルが高い)ときは、推定プロセスは、ユーザが話し中かどうかを検出し損ねることがあり、その結果、NR及びAECの性能は著しく低下する。
マイクロフォン及び/またはスピーカーの配置は、規定の動作モードに対しては最適である可能性があるが、他の音声関連機能に対しては最適ではないことがある。例えば、マイクロフォン120及び140は、通常(特にモバイル通信デバイスでは)互いに比較的離して−例えば上と下で10〜15cmの距離を置いて配置してよく、かつ/またはデバイスの両側に配置してよい。しかし、このような設置は、ノイズリダクション(NR)及び音響エコー消去(AEC)のような音声関連機能には最適ではないことがある。マイクロフォン(複数の場合もある)をさらに追加して既存のマイクロフォン(複数の場合もある)の比較的近くに設置することで、この問題に対する解決策を得られる可能性がある。しかし、マイクロフォン(複数の場合もある)をさらに追加することは、様々な理由−例えばコスト増加、デバイスの設計上の制限または限定などにより好ましくないことがある。もう1つの解決策でマイクロフォン及びスピーカーの配置を調整して、これらの音声関連機能に対する性能を特に改善することができる。しかし、このような調整は、これらのマイクロフォン及び/またはスピーカーの主な使用法に悪影響を及ぼすことがあり、かつ/または実行不可能なことがある。
したがって、様々な実施態様では、既存の複数のマイクロフォン及びスピーカー(例えば電子機器100のスピーカー110及び130ならびにマイクロフォン120及び140)は、既存のマイクロフォン及び/もしくはスピーカーの使用法に影響を及ぼすことなく、またはマイクロフォン及び/もしくはスピーカーの配置の修正を必要とすることなく、向上したノイズリダクション(NR)及び音響エコー消去(AEC)の性能を得られるように構成することができ、この性能を他の(主な)使用目的−例えば音声通話、背景音声の再生、及び/またはステレオ録音能力などに向けて最適化することができる。例えば、既存の複数のマイクロフォン(遠くに置いたもの)及びスピーカーを、特定の動作モード(例えばハンドセットモード)のように、2つの接近したマイクロフォンを基盤とする配置として動作するように構成して、向上したノイズリダクション性能及び/または音響エコー消去を得られるようにすることができる。この2つの接近したマイクロフォンを基盤とする配置は、1つ以上のスピーカーを使用して、求められているマイクロフォンを基盤とする機能を提供することで実現できる。つまり、スピーカーを「マイクロフォン」として−すなわち、音声の捕捉及び/または入力信号の生成に用いることができる。
使用するスピーカーは、動作モードに従うなどして自動的に選択されてよい。例えば、選択されるスピーカーには、その動作モードでは逆に非アクティブであるスピーカーを備えることができる。選択されたスピーカーを振動検出器として−例えばユーザが話し中かどうかを確実に示すために、使用することができる。選択されたスピーカーは、スピーカーとも振動検出器とも同時に動作することができる。本開示に従って実装されたシステムは、モジュール式とすることができ、かつ/またはいかなるアーキテクチャにも有効とすることができる。スピーカー及びマイクロフォンの動作は、ノイズリダクション及び/またはエコー消去などの音声関連機能を最適に実施するために管理することができる。この管理には、動作モードを認識することと、ユーザが話し中かどうかを指摘することと、認識された動作モードに応じて及び/またはユーザが話し中かどうかの指摘に応じて、自動的にスピーカーを選択することと、モバイル通信システムの認識動作モードに応じて、及びユーザが話し中かどうかの指摘に応じて、選択されたスピーカーの動作をマイクロフォンとしてまたは振動検出器としての機能に切り替えることとを含むことができる。
いくつかの例では携帯電話に言及していることがあるが、他のモバイル通信システムや任意の適切な電子システムも同じように使用してよい。さらに、記載した例の中には、スピーカー及びマイクロフォンが特定の数で、その配置が特定のもので、その動作を特定の方法で管理するためのその他の特定の部品を備えた、特定のアーキテクチャを開示しているものがあるが、これらの例は、本開示を完全に理解してもらうために記載しているに過ぎず、本開示の範囲を限定する意図はないことを理解すべきである。
図2は、複数のマイクロフォン及びスピーカーを搭載した例示的な電子機器のアーキテクチャを示している。図2を参照すると、電子機器200が示されている。
電子機器200は、例えば図1の電子機器100と同様のものであってよい。この点で、電子機器200には、複数の音声出力部品(例えばスピーカー230及び230)及び音声入力部品(例えばマイクロフォン240及び240)を組み入れることができる。電子機器200には、音声関連の処理及び/または動作をサポートするための回路も組み入れることができる。例えば、電子機器200は、プロセッサ210及び音声コーデック220を備えることができる。
プロセッサ210は、データを処理し、動作(例えば電子機器200またはその部品の動作)を制御または管理し、タスク及び/または機能を実施する(またはこのようなタスク/機能を制御する)ように構成可能な適切な回路を備えることができる。プロセッサ210は、アプリケーション、プログラム及び/またはコードを進行及び/または実行することができ、このコードは、プロセッサ210の内部または外部に備わる例えばメモリ(図示せず)に保存できる。さらに、プロセッサ210は、1つ以上の制御信号を用いて、電子機器200(または部品またはそのサブシステム)の動作を制御できる。プロセッサ210は、汎用プロセッサを備えることができ、この汎用プロセッサは、特定タイプの動作(例えば音声関連動作)を実施またはサポートするように構成できる。プロセッサ210は、特別な目的のプロセッサを備えることもできる。例えば、プロセッサ210は、デジタルシグナルプロセッサ(DSP)、ベースバンドプロセッサ、及び/またはアプリケーションプロセッサ(例えばASIC)を備えることができる。
音声コーデック220は、音声の符号化/復号化動作を実施するように構成可能な適切な回路を備えることができる。例えば、音声コーデック220は、1つ以上のアナログ−デジタル変換器(ADC)、1つ以上のデジタル−アナログ変換器(DAC)、及び少なくとも1つのマルチプレクサ(MUX)を備えることができ、マルチプレクサは、音声コーデック220内で扱われる信号を、マルチプレクサの適切な入力ポート及び出力ポートに誘導するのに使用できる。
動作において、電子機器200は、音声信号の入力及び/または出力をサポートすることができる。例えば、マイクロフォン240及び240は、アナログ音声入力を受信することができ、このアナログ音声入力は、その後、(アナログ信号242及び244として)音声コーデック220に転送されることができる。音声コーデック220は、アナログ音声入力を(例えばADCを介して)デジタル音声ストリームに変換することができ、デジタル音声ストリームは、プロセッサ210に(デジタル信号216を介して−例えばIS接続上で)伝送されることができる。プロセッサ210は、その後、デジタル音声信号にデジタル処理を適用することができる。出力側では、プロセッサ210は、デジタル音声信号を生成することができ、その際に、対応するデジタル音声ストリームを音声コーデック220に(デジタル信号214を介して−例えばIS接続上で)伝送する。音声コーデック220は、デジタル音声ストリームを処理することができ、これを(DACを介して)アナログ信号に変換し、このアナログ信号を、(アナログ接続222及び224を介して)スピーカー230及び230に送ることができる。
例示的な実施形態では、音声出力信号を一方のスピーカーのみに送ることができる。例えば、電子機器200は、ハンドセットモード及びスピーカーモードなどの複数のモードをサポートすることができる。したがって、音声出力信号を、電子機器200がハンドセットモードで動作している際は、スピーカー230(これを「主要スピーカー」として使用できる)のみに送ることができ、電子機器200がスピーカーモードで動作している際は、スピーカー230(これを「二次スピーカー」として使用できる)のみに送ることができる。2つのスピーカー間の切り替えは、音声コーデック220のMUXを用いて行うことができる。さらに、この切り替えは、(動作モードを基に設定できる)制御信号212を用いて制御できる。
場合によっては、音声出力部品(例えば電子機器200のスピーカー230及び230)を使用して音声入力を取得または生成することが望ましいことがあり、この音声入力は、ノイズリダクション及び/または音響エコー消去などの音声関連機能を最適化または向上するのに使用することができる。例えば、ユーザがいくつかの音声関連サービスで電子機器を使用する場合(例えばデバイスを携帯電話とすることができ、ユーザがこれを音声通話中に使用しているとする場合)、デバイス(またはデバイスの筐体)は、ユーザの頬に接触していてよい。ユーザの発言(すなわち声)は、ユーザの骨格を振動させることができ、次にこの骨格が、デバイスの筐体を振動させることができ、これは筐体がユーザの頬と接着していることによって起こる。デバイスのスピーカー(複数の場合もある)は通常筐体に装着できるため、ユーザの声によって起こる振動などの筐体内の振動を感知するために、スピーカーを振動検出器(VSensor)として使用できる−すなわち、VSensorの信号を生成する際にスピーカーを使用できる。VSensorの信号を分析し、ユーザが話し中かどうかを判定することができる。さらに、VSensorの信号(場合によっては、標準マイクロフォンを介して得られた信号と合わせた信号)を、ノイズリダクション及び/または音響エコー消去の処理を改善するなどのために、処理することができる。このようなスピーカーの使用は、特定の動作モード(例えばハンドセットモードで)の方が適切なことがあるが、本開示はそのように限定されるものではなく、ユーザの発話とは通常関係のないことがある他の動作モードで(例えばスピーカーモードで)、同じようにスピーカーを使用することができる。例えば、スピーカーモードであっても、デバイスがユーザの口に近ければ、ユーザが話しているときは、ユーザの声が依然としてデバイスの筐体を振動させることがある。このような振動は、その時の動作モード中には通常アクティブではないスピーカー−例えば「イヤフォン」スピーカーで検出することができ、このスピーカーは、スピーカーモードなどのモード中には通常使用されないことがあり、振動検出器(VSensor)として構成され、かつ/または振動検出器(VSensor)として作用することができ、このような振動を捕捉する。
音声入力を得るためのスピーカーを(例えばマイクロフォンまたは振動検出器として)使用する際のサポートには、電子機器内への既存の部品(回路及び/またはソフトウェア)の追加または修正が必要になることがある。それでも、このような変更を最小にすることができ、実質的には、専用の音声入力部品をさらに追加するよりもコスト効果を高くすることができる。スピーカーのこのような使用をサポートする実施態様の例を、少なくとも図3、図4及び図5に示している。
図3は、複数のマイクロフォン及びスピーカーを搭載した例示的な電子機器のアーキテクチャを示し、このアーキテクチャは、スピーカーを音声入力部品として使用できるように修正されている。図3を参照すると、電子機器300が示されている。
電子機器300は、例えば図2の電子機器200と実質的に同様のものであってよい。ただし、電子機器300は、特定の音声関連機能(例えばノイズリダクション及び/または音響エコー消去)を向上させるなどのために、音声出力部品(例えばスピーカー)を音声入力部品(例えばマイクロフォンまたは振動検出器)として使用するのをサポートするように構成できるものである。電子機器300は、回路及び/または部品を追加で−すなわち、電子機器200に関して記載した回路及び/または部品に加えて−備えて、このように最適化したスピーカーの使用をサポートすることができる。例えば、図3に示した実施態様では、電子機器は、マルチプレクサ(MUX)330及び一対の増幅器310及び320を備えることができる。MUX330及び増幅器310及び320は、スピーカー230及び230(接続312及び322を介して)からの入力を得て、この入力(複数の場合もある)を音声コーデック220に送るのに使用することができる。スピーカー230及び230からの入力(複数の場合もある)は、ノイズリダクション及び/または音響エコー消去などの音声関連機能を向上かつ/または最適化するのに使用することができる。この点で、スピーカー230及び230からの入力を使用することは、このスピーカーを電子機器300内に配置することで−例えば、入力を捕捉する際に好ましい距離を置いた間隔で(例えばマイクロフォン240及び240のうちの一方の近くに)配置するか、あるいは電子機器300の筐体に装着して配置することで、望ましくなることがあり、これによって、振動検出器として働くのに理想的な配置になる。
動作中において、スピーカー230及び230は、入力デバイスとして(すなわち、音声または振動の入力を得るために)構成し、かつ/または使用することができる。例示的な使用状況では、スピーカー230及び230のうちの一方または両方を、「マイクロフォン」の入力を得るのに使用するために選択でき、この入力を、ノイズリダクション及び/または音響エコー消去の処理過程で、標準マイクロフォン(すなわち、マイクロフォン240及び240のうちの一方または両方)から得た入力と合わせるなどして処理することができる。プロセッサ210は、MUX330に(例えば制御信号336を介して)、スピーカー230及び230のうちの一方と1つ以上のマイクロフォン240及び240とから得た入力を選択して、2つの接近したマイクロフォンとして動作するよう命令することができる。このようにして使用するスピーカーとマイクロフォンとの特定の対は、電子機器300の動作モードなどに基づいて、自動的かつ/または適応的に選択することができる。
例えば、スピーカー230を(例えば「イヤフォン」スピーカーとして)使用できるハンドセットモードでは、プロセッサ210は、制御信号336を介して、MUX330に、(主要マイクロフォンとして使用されている)マイクロフォン240とスピーカー230からの入力を選択するよう命令することができる。さらに、プロセッサ210は、ハンドセットモード中はスピーカーとして作動していないスピーカー230を、マイクロフォンとして使用するように−例えば、NR及び/またはAEC処理をサポートする入力を得るように、構成することができる。例えば、スピーカー230は、出力音声を生成する際に使用される同じ部品などを使用して、入力信号を生成するように構成しながらも、逆に機能するように構成することができる。さらに、MUX330に送られる前に、生成された信号を増幅器320を介して増幅することができる。したがって、接近したマイクロフォン(すなわち、マイクロフォン240及びスピーカー230)として作用する部品から選択された信号を、(アナログ接続332及び334を介して)音声コーデック220に送ることができ、この音声コーデックでデジタル化する。その後、対応するデジタル信号を(デジタル信号216として)プロセッサ210に送ってさらに処理することができる。
スピーカー230を(例えば「イヤフォンではない」スピーカーとして)使用できるスピーカーモードでは、プロセッサ210は、制御信号336を介して、MUX330に、(主要マイクロフォンとして使用されている)マイクロフォン240とスピーカー230からの入力を選択するよう命令することができる。プロセッサ210は、スピーカーモード中はスピーカーとして作動していないスピーカー230を、前述したようにマイクロフォンとして使用するように構成することができる。このように、マイクロフォン240及びスピーカー230は、接近したマイクロフォンとして作用でき、そこからMUX330に入力された信号は(増幅器310を介してスピーカー230が生成した信号を増幅した後)、MUX330によって(接続332及び334を介して)音声コーデック220に送られてデジタル化されることができ、これに対応するデジタル結果は、プロセッサ210に送られてさらに処理される。
プロセッサ210は、入力信号を扱う際に追加のステップを実施するように構成され、入力信号の発信源を明らかにすることができる。例えば、標準マイクロフォン(例えばマイクロフォン240及び240)の周波数応答は、マイクロフォンとして作用しているスピーカー(例えばスピーカー230及び230)の周波数応答とは通常異なるため、プロセッサ210は、マイクロフォンとして作用しているスピーカーからの信号の前処理を実行して、標準マイクロフォンからくる入力信号にさらに良好な形でマッチングさせることができる。スピーカーからの信号を標準マイクロフォンの信号にマッチングさせるための前処理行程の一例を、図5にさらに詳細に記載している。
図4は、複数のマイクロフォン及びスピーカーを搭載した例示的な電子機器のアーキテクチャを示し、このアーキテクチャは、スピーカーを音声入力部品として使用できるように別の方法で修正されている。図4を参照すると、電子機器400が示されている。
電子機器400は、例えば図2の電子機器200と実質的に同様のものであってよい。ただし、図3の電子機器300のように、電子機器400は、特定の音声関連機能(例えばノイズリダクション及び/または音響エコー消去)を向上させるなどのために、音声出力部品(例えばスピーカー)を音声入力部品(例えばマイクロフォンまたは振動検出器)として使用するのをサポートするように構成することもできる。電子機器400は、回路及び/または部品を追加で−すなわち、電子機器200に関して記載した回路及び/または部品に加えて−備えて、このように最適化したスピーカーの使用をサポートすることができる。例えば、図4に示した実施態様では、電子機器は、1対のスイッチ410及び420、及び1対の増幅器430及び440を備えることができる。各々のスイッチ410及び420は、信号を受信する入力ポートなどを基に、信号を適応させてルーティングできるようにするための回路を備えることができる。例えば、スイッチ410及び420は、音声コーデック220からの信号(すなわち、「出力」信号)をスピーカー230及び230に転送し、スピーカー230及び230から得られた信号(すなわち、「入力」信号)を増幅器430及び440に転送するように構成可能であることができる。スイッチ410及び420ならびに増幅器430及び440は、スピーカー230及び230からの入力を得て、この入力(複数の場合もある)を音声コーデック220に送るのに使用することができる。記載したように、スピーカー230及び230からの入力(複数の場合もある)は、ノイズリダクション及び/または音響エコー消去などの音声関連機能を向上かつ/または最適化するのに使用することができる。
動作において、スピーカー230及び230は、入力デバイスとして(すなわち、音声または振動入力を得るために)構成され、かつ/または使用されることができる。例示的な使用状況では、スピーカー230及び230のうちの一方(または両方)を、VSensorとして選択し、構成して、振動を感知し、これに対応する「振動」入力を生成するのに使用することができ、この振動入力を、ノイズリダクション及び/または音響エコー消去の処理過程で、標準マイクロフォン(すなわち、マイクロフォン240及び240のうちの一方)から得た入力と合わせるなどして処理することができる。VSensorとして使用する特定のスピーカーは、電子機器400の動作モードなどに基づいて、自動的かつ/または適応的に選択することができる。
例えば、ハンドセットモードでは、スピーカー230を作動させて主要スピーカーとして使用できるが、音声通話サービスをサポートするにあたり、通常スピーカー230を作動することも使用することもできない。そのため、スピーカー230は、電子機器400がハンドセットモードのときに選択することができ、VSensorとして構成することができる。スピーカー230は、(例えば電子機器400が何らかの振動を受けている際に)スイッチ420を介して(接続422上で)増幅器440までルーティングできるVSensor信号を生成でき、増幅器は、信号を増幅したのち、この信号を(接続442を介して)音声コーデック220に送ることができる。音声コーデック220は、(例えばそのADCを介した変換を適用して)信号を処理することができ、生じたデジタル信号を(デジタル信号216として)プロセッサ210に送り、これを処理する。場合によっては、プロセッサ210は、専用のアプリケーションモジュール450(例えばソフトウェアモジュール)を組み入れることができ、このモジュールは、入力されるVSensor信号を分析するように構成可能であることができる。例えば、VSensor信号の分析で、対応する振動が、デバイスのユーザが話し中であることを示すかどうかを検出することができる。
スピーカー230を作動させて主要スピーカーとして使用できるが、通常はスピーカー230を作動することも使用することもできないスピーカーモードでは、代わりにスピーカー230を選択でき、VSensorとして構成できる。このようにすると、スイッチ410は、スピーカー230が生成したいかなるVSensor信号も(接続412上で)増幅器430までルーティングすることができ、増幅器は、信号を増幅したのち、この信号を(接続432を介して)音声コーデック220に送ることができる。すると、前述したのと同様の方法で、この信号をヘッドセットモードに対して処理することができる。
いくつかの実施態様では、スピーカーとして作動して使用されている間は、スピーカーをVSensorとして構成できると同時に、そのように(すなわち、VSensor信号を生成するのに)使用できる。例えば、スピーカー230を通常作動させて主要スピーカーとして使用できるスピーカーモードでは、スピーカー230を引き続きVSensorとして構成することができる。すると、スイッチ420は、必要であれば信号を両方向にルーティングする−すなわち、音声コーデック220から受信した「出力」信号をスピーカー230までルーティングするとともに、スピーカー230から受信した「入力」VSensor信号を増幅器440にもルーティングするように構成できる。
図5は、スピーカーから得られた信号を変換して標準マイクロフォンからの信号にマッチングさせ、マイクロフォンを介して得られた標準の音声信号と合わせて使用するための例示的な前処理を示ししている。図5を参照すると、前処理行程500が示されている。
前処理行程500は、電子機器内の音声処理を扱うように構成されている電子機器(例えばプロセッサ210)内の処理回路の一部とすることができる。特に、前処理行程500は、音声出力部品(例えばスピーカーなど)から得られた音声入力信号の扱いをサポートして、標準の音声入力部品(例えば標準マイクロフォン)からの音声入力と合わせて使用できるように構成されることができる。
図5に示した例示的な実施態様では、前処理行程500で、標準マイクロフォン(例えばマイクロフォン240及び240のうちの一方)から受信した(標準の)入力信号520と、マイクロフォンとして作用するように構成されたスピーカー(例えばスピーカー230及び230のうちの一方)から受信した入力音声信号530とを扱うことができる。その後、前処理行程500は、スピーカー入力信号530を処理することができ、これに対応する(修正された)信号540を生成して、この対応する(修正された)信号540が(標準の)入力信号520と適正にマッチングできるようにする。例えば、スピーカー入力信号530は、前処理行程500内で、(例えばフィルタ510を介して)信号520と540の周波数を同様のものにするフィルタリングを受けることができる。この点で、フィルタ510は、信号をフィルタリングにかけるための適切な回路を備えることができる。フィルタ510は、スピーカー入力に対応する信号が標準マイクロフォン入力にマッチングできるような方法で、信号を適正に変換するように構成することができる。
例えば、フィルタリングした信号の位相を崩さないように、フィルタ510を、位相が線形である有限インパルス応答(FIR)フィルタとして実装することができる。さらに、FIRフィルタを、処理したスピーカー信号(すなわち、フィルタリングした信号540)のスペクトルがマイクロフォン信号(すなわち、信号520)のスペクトルに近似するように設計することができる。例えば、S(f)がマイクロフォンとしてのスピーカーのスペクトルに相当し、S(f)が標準マイクロフォンのスペクトルであると仮定すると、このフィルタによって実施されたフィルタリングによって、処理した信号のスペクトル−すなわちS(f)×FIR(f)がマイクロフォンスペクトルのスペクトルS(f)に近似するように、フィルタ510を構成することができる。そのため、フィルタ510の周波数応答を、FIR(f)=S(f)/S(f)となるように構成することができる。したがって、このようにして構成した(FIR)フィルタ510により、信号のフィルタリングを一定の方法で実現でき、その結果、標準マイクロフォンの伝送機能とマイクロフォンとして作用するスピーカーとの間に差が生じる。
フィルタ510のフィルタリング機能は、フィルタリングパラメータを用いて制御でき、このフィルタリングパラメータは、例えばキャリブレーションプロセスに基づいて決定することができる。キャリブレーションプロセスは、フィルタリングパラメータが明らかになった時点で行うことができ、フィルタリングパラメータはその後、保存して再度使用できる。キャリブレーションプロセスは、反復的にかつ/または動的に(例えばリアルタイムで)実施することもできる。フィルタリング機能(よってこれに対応するフィルタリングパラメータも)は、信号の発信源に応じて異なっていてよい。例えば、フィルタリングパラメータは、フィルタリングされる予定の信号がスピーカー230ではなくスピーカー230から来ている場合は、異なっていてよい。そのため、様々な一連のフィルタリングパラメータを様々な(利用可能な)スピーカーに対して事前に規定することができ、使用状況ごとの発信源に応じて適切なスピーカーを選択する状態にする。すると、信号520及び540を2つの「マイクロフォン」信号−例えば任意の2つのマイクロフォンのノイズリダクション(NR)動作として使用できる。
図6は、電子機器内の複数のマイクロフォン及びスピーカーを管理するための例示的なプロセスを示すフローチャートである。図6を参照すると、複数の例示的なステップを含むフローチャート600が示されており、これらのステップを電子システム(例えば図3及び図4の電子機器300または400)内で実行して、そこに組み込まれているスピーカー及びマイクロフォンの最適な管理を簡易化することができる。
最初のステップ602では、電子機器(例えば電子機器300)の電源を入れて起動させることができる。このステップには、電源をオンにすることと、電子機器の様々な部品を作動させかつ/または起動させることとを含めることができ、その結果、電子機器は、この電子機器がサポートする機能またはアプリケーションを実施または実行する準備ができた状態になることができる。
ステップ604では、ユーザのコマンド/入力または事前に構成された実行命令などに基づいて、電子機器の動作モードを設定する(または切り替える)ことができる。例えば、電子機器が通信(特に音声通話)サービスをサポートできる場合、動作モードには、ハンドセットモード及び/またはスピーカーモードを含めることができる。したがって、電子機器は、デバイスのユーザが音声通話を開始し(または受け入れ)て、電子機器をユーザの顔に置いた際に、ハンドセットモードに切り替えることができる。
ステップ606では、その時の動作モードに基づいて非アクティブになっているスピーカーがあるかどうかを判定することができる。例えば、複数のスピーカーを有するモバイル通信デバイス(例えば携帯電話)では、特定の動作モードで特定のスピーカー(複数の場合もある)のみ−例えばハンドセットモードで「イヤフォン」スピーカーのみを使用することができる。非アクティブ(または非使用)のスピーカーがないと判定された場合、プロセスはステップ612へ進むことができ、このように判定されなければ、プロセスはステップ608へと進む。
ステップ608では、非アクティブ(または非使用)のスピーカーが入力を行うように構成する必要があるかどうかを判定することができる。例えば、複数のマイクロフォンを有する電子機器では、ノイズリダクションや音響エコー消去などの機能をサポートするための入力を得るために、マイクロフォンを使用できることがある。しかし、これらの機能の性能は、使用されているマイクロフォンが最適に配置されていなければ(例えば離れすぎていれば)、低下することがある。そのため、スピーカーが一方のマイクロフォンに対してより最適に配置されている場合は、そのスピーカーを「マイクロフォン」として使用する方が望ましいことがある。また、例えばスピーカーが、ユーザの骨格及び電子機器(またはその筐体)を伝播する振動を受信するのに理想的な形で配置されている場合、スピーカーを振動検出器(VSensor)として使用することが望ましいことがある。非アクティブ(または非使用)のスピーカーが入力を行うように構成する必要がないと判定された場合、プロセスは、ステップ612へ進むことができ、このように判定されなければ、プロセスはステップ610へと進む。
ステップ610では、(例えば、その時の動作モードに基づいて判定された通りの、非アクティブ/非使用状態に基づいて、かつ/また所望の入力を行うのに最適な状態に基づいて)選択された1つ以上のスピーカーを、所望の入力を行うように(例えば、周囲の音声を捕捉する「マイクロフォン」として、または電子機器を伝播する振動を捕捉するVSensorとして)構成することができる。さらに、入力を行って−例えば必要な部品(増幅器、MUX、スイッチング素子など)を作動させて、生成された入力をルーティングし、処理する際に、選択されたスピーカー(複数の場合もある)の使用をサポートするように、電子機器を全体的に構成することができる。
ステップ612では、電子機器は、その時の動作モードに従って動作することができる。このステップには、例えばノイズリダクション及び/または音響エコー消去処理を向上させるために、任意の選択されたスピーカー(複数の場合もある)を介して得られた入力を使用することを含めることができる。
図7は、スピーカーを介して捕捉した振動を用いて音声入力を生成するための例示的なプロセスを示すフローチャートである。図7を参照すると、複数の例示的なステップを含むフローチャート700が示されている。この複数の例示的なステップは、例えばアプリケーションモジュール450を介して実装されたアルゴリズムに相当することができ、かつ/またはこのアルゴリズムに従って実施されることができる。
最初のステップ702では、スピーカーを介して信号を捕捉することができる。信号V(t)は、例えば、スピーカーを介して捕捉した振動に相当するものとすることができる。ステップ704では、この信号を前処理して、例えば対応する離散信号V(n)を生成することができ、この場合の「n」は、離散時間nTの時点での信号V(t)のサンプルに相当する。このような信号V(n)は、発言による振動を感知しやすいことがあるが、特に周波数が低い場合は、周囲のノイズに対する感知度は著しく低いことがある(例えば最大約1kHz)。そのためノイズの多い環境であっても、信号雑音比(SNR)は比較的高いことがある。
ステップ706では、分析に適切になるように信号を処理することができる。例えば、信号V(n)を(例えばバンドパスフィルタまたはBPFを用いて)フィルタリングすることができる。
ステップ708では、信号を処理することができる。例えば、(フィルタリングV(n)信号から生じた)VBP(n)信号を、1つ以上の分析技術を用いてサンプルごとに処理することができる。VBP(n)信号は、(例えば話者の)ピッチを計算するための自己相関など、標準の技術を用いて分析することができる。VBP(n)信号は、信号の包絡線VEN(n)を計算することによって分析することもできる。
ステップ710では、分析結果をチェックし、任意のマッチング基準を満たしているかどうかを判定することができる。満たされるマッチング基準がないと判定できる場合、プロセスは、ステップ708に戻って、次のサンプルを分析することができる。少なくとも1つのマッチング基準が満たされていると判定できる―すなわち、その人が話し中であると示されている場合、プロセスは、ステップ712へと進むことができ、このステップでは、信号を入力音声信号として−例えば音声活動検出器(VAD)として使用することができる。
例えば、ステップ710で実施されるチェックには、ピッチが検出されたかどうか、かつ/または信号の包絡線が所定閾値よりも上か−例えばVEN(n)>TH_envであるどうかを判定することを含めることができる。
ピッチの検出は、入力信号の自己相関を分析し、所定閾値に対するその最大値をチェックすることによる、ピッチ値の計算に基づいて行うことができる。そのため、計算された最大値(Auto_max)が所定閾値(TH_pitch)よりも大きければ、その信号を音声信号として確定できる。
そのため、Auto_max>TH_pitchである場合、またはAuto_max<TH_pitchだがVEN(n)>TH_envである場合、その信号を音声フレームとして確定でき、VADフラグを設定できる。しかし、そうでない場合は、VADフラグを解除する。
図7に示した例示的なプロセスでは、信号の扱い(計算及び/または分析)をサンプルごとに行う。しかし、このようにする代わりに、この処理をサンプルの集合単位で行ってもよい。例えば、N個のサンプルの各々(「N」は整数)を1つのフレーム内にまとめることができ、計算をフレームごとに行う。フレームのサイズは、最適な性能となるように調整することができる。例えば、各フレームを10msとすることができる(そのため、N個のサンプルの各々の時間が10msとなるようにNを設定する)。
いくつかの実施態様では、スピーカー及び/またはマイクロフォンを適応的に管理する方法を、電子機器(例えば電子機器300または400)を備えることができるシステムで使用でき、この電子機器は、1つ以上の回路(例えばプロセッサ210、音声コーデック220、スイッチ410及び420、ならびに増幅器310、320、430、及び440)と、第1のスピーカー及び第2のスピーカー(例えばスピーカー230及び230)とを備えることができる。この1つ以上の回路は、電子機器の動作モードを判定するために動作可能なものにすることができ、判定された動作モードに基づいて、第1のスピーカーと第2のスピーカーのうちの一方または両方の動作を管理し、この場合の管理には、第1のスピーカー及び第2のスピーカーのうちの一方または両方の機能を適応的に切り替えるまたは修正することを含めることができる。第1のスピーカー及び第2のスピーカーのうちの一方または両方の機能の切り替えまたは修正には、第1のスピーカーと第2のスピーカーのうちの一方を、マイクロフォンとしてまたは振動検出器(VSensor)として使用するように構成することを含めることができる。1つ以上の回路は、第1のスピーカーと第2のスピーカーのうちの一方を、スピーカーとして機能し続けると同時に、マイクロフォンとしてまたは振動検出器としても使用されるように構成することができる。1つ以上の回路は、電子機器内の音声向上機能をサポートするために、マイクロフォンとしてまたは振動検出器として使用するように構成された、第1のスピーカーと第2のスピーカーのうちの一方からの入力を使用するために動作可能なものにすることができる。音声向上機能には、ノイズリダクション及び/または音響エコー消去を含めることができる。第1のスピーカーと第2のスピーカーのうちの一方を、電子機器のユーザが話し中かどうかを示すための振動検出器として構成することができる。第1のスピーカーと第2のスピーカーのうちの一方を、電子機器の筐体内の振動を検出するための振動検出器として構成することができる。1つ以上の回路は、電子機器の別の異なる動作モードに応じて、第1のスピーカーと第2のスピーカーのうちのもう一方を選択するために動作可能なものにすることができる。
いくつかの実施態様では、スピーカー及びマイクロフォンを適応的に管理する方法を、第1のスピーカー及び第2のスピーカー(例えばスピーカー230及び230)、ならびに第1のマイクロフォン及び第2のマイクロフォン(例えばマイクロフォン240及び240)を備えているモバイル通信デバイスに使用することができる。この方法には、モバイル通信デバイスの動作モードを判定することと、モバイル通信デバイスのユーザが話し中のときに表示を生成することと、モバイル通信デバイスの動作モードユーザが話し中であるという表示に基づいて、第1のスピーカーと第2のスピーカーのうちの一方を選択することと、判定された動作モードに基づいて、選択されたスピーカーの動作を管理することとを含めることができる。この管理には、第1のマイクロフォン及び第2のマイクロフォンから入力される時期が、モバイル通信デバイス内の音声向上機能をサポートするのに不適切であることを判定することと、選択されたスピーカーの機能を適応的に切り替えるまたは修正して、選択されたスピーカーへの入力を達成することとを含めることができる。音声向上機能には、ノイズリダクションまたは音響エコー消去を含めることができる。第1のマイクロフォン及び第2のマイクロフォンからの入力は、第1のマイクロフォンと第2のマイクロフォンとの間の配置及び/または間隔に基づいて、モバイル通信デバイスにおける音声向上機能をサポートするのに不適切であると判定されることがある。第1のスピーカーと第2のスピーカーのうちの一方を、第1のマイクロフォンと第2のマイクロフォンのうちの一方または両方に対する配置及び/または間隔に基づいて選択することができる。
他の実施態様では、機械及び/もしくはコンピュータによって実行できる少なくとも1つのコード部分を有する機械コード及び/もしくはコンピュータプログラムを記憶した、一時的でないコンピュータ可読媒体及び/もしくは記憶媒体、ならびに/または一時的でない機械可読媒体及び/もしくは記憶媒体を備えることができ、これによって、その機械及び/もしくはコンピュータに、本明細書に記載したようなステップを、複数のマイクロフォン及びスピーカーを管理するための適応システムに対して実施させる。
したがって、本方法及び/または本システムは、ハードウェア、ソフトウェア、またはハードウェアとソフトウェアとを組み合わせたものにおいて実現できる。本方法及び/または本システムは、少なくとも1つのコンピュータシステムにおいて中央集中型に、または様々な素子が相互接続された複数のコンピュータシステムにまたがって展開されている場合には、分配型に実現できる。本明細書に記載した方法を実行するのに適応したどのような種類のコンピュータシステムまたは他のシステムも、適切である。ハードウェアとソフトウェアとの典型的な組み合わせを、コンピュータプログラムを備えた汎用コンピュータシステムであって、このコンピュータプログラムが、ロードされて実行される際に、本明細書に記載の方法を実行するようにコンピュータシステムを制御する汎用コンピュータシステム、とすることができる。もう1つの典型的な実施態様では、特定用途向け集積回路またはチップを備えることができる。
本方法及び/または本システムは、本明細書に記載した方法の実装を可能にするあらゆる特徴を備えるコンピュータプログラム製品であって、コンピュータシステムにロードされた際にこれらの方法を実行することができるコンピュータプログラム製品に取り入れることもできる。ここでいうコンピュータプログラムとは、情報処理能力を有するシステムに、特定の機能を直接実施させるか、あるいは、a)別の言語、コードまたは符号への変換、b)異なる材料形態での再現、のいずれかまたは両方を行った後に実施させるための一連の命令を、任意の言語、コードまたは符号で表現したもののことである。したがって、いくつかの実施態様では、機械で実行できる1行以上のコードを記憶した、一時的でない機械可読(例えばコンピュータ可読)媒体(例えばFLASHドライブ、光学ディスク、磁気記憶ディスクなど)を備えることができ、これによって、その機械に、本明細書に記載したようなプロセスを実施させる。
本方法及び/または本システムを、特定の実施態様を参照して説明してきたが、本方法及び/または本システムの範囲を逸脱しない限り、様々な変更を加えてよく、均等物を代替してもよいことが、当業者には理解される。このほか、本開示の範囲を逸脱しない限り、本開示の教示に多くの修正を加えて特定の状況または材料に適応させてよい。したがって、本方法及び/または本システムは、開示した特定の実施態様に限定されるものではなく、本方法及び/または本システムは、添付の特許請求の範囲内に収まるすべての実施態様を含むものとする。

Claims (20)

  1. 複数のマイクロフォン及びスピーカーを管理するシステムであって、
    1つ以上の回路、ならびに第1のスピーカー及び第2のスピーカーを備える電子機器を備え、
    前記1つ以上の回路が、
    前記電子機器の動作モードを決定し、
    前記決定された動作モードに基づいて、前記第1のスピーカーと前記第2のスピーカーのうちの一方または両方の動作を管理することであって、その管理が、前記第1のスピーカーと前記第2のスピーカーのうちの一方または両方の機能を適応的に切り替えるかまたは修正することを含む管理をする動作可能である
    ことを特徴とするシステム。
  2. 前記第1のスピーカーと前記第2のスピーカーのうちの一方または両方の機能を切り替えるまたは修正することは、前記第1のスピーカーと前記第2のスピーカーのうちの一方を、マイクロフォンとしてまたは振動検出器として使用するように構成することを含む
    請求項1に記載のシステム。
  3. 前記1つ以上の回路は、前記第1のスピーカーと前記第2のスピーカーのうちの一方を、スピーカーとして機能し続けると同時に、マイクロフォンとしてまたは振動検出器としても使用されるように構成する
    請求項2に記載のシステム。
  4. 前記1つ以上の回路は、マイクロフォンとしてまたは振動検出器として使用するように構成された、前記第1のスピーカーと前記第2のスピーカーのうちの一方からの入力を用いて、前記電子機器内の音声向上機能をサポートするように動作可能である
    請求項2に記載のシステム。
  5. 前記音声向上機能は、ノイズリダクション及び/または音響エコー消去を含む
    請求項4に記載のシステム。
  6. 前記第1のスピーカーと前記第2のスピーカーのうちの一方は、前記電子機器のユーザが話し中かどうかを指摘するための振動検出器として構成される
    請求項2に記載のシステム。
  7. 前記第1のスピーカーと前記第2のスピーカーのうちの一方は、前記電子機器の筐体内の振動を検出するための振動検出器として構成される
    請求項2に記載のシステム。
  8. 前記1つ以上の回路は、前記電子機器の別の異なる動作モードに応じて、前記第1のスピーカーと前記第2のスピーカーのうちのもう一方を選択するように動作可能である
    請求項1に記載のシステム。
  9. 複数のマイクロフォン及びスピーカーを管理する方法であって、
    少なくとも1つの第1のスピーカー及び第2のスピーカーを備える電子機器内で、
    前記電子機器の動作モードを決定するステップと、
    決定された動作モードに基づいて、前記第1のスピーカーと前記第2のスピーカーのうちの一方または両方の動作を管理することであって、その管理が、前記第1のスピーカーと前記第2のスピーカーのうちの一方または両方の機能を適応的に切り替えるまたは修正することを含む管理をするステップとを含む
    ことを特徴とする方法。
  10. 前記第1のスピーカーと前記第2のスピーカーのうちの一方または両方の機能を切り替えるまたは修正することは、前記第1のスピーカーと前記第2のスピーカーのうちの一方を、マイクロフォンとしてまたは振動検出器として使用するように構成することを含む
    請求項9に記載の方法。
  11. 前記第1のスピーカーと前記第2のスピーカーのうちの一方を、スピーカーとして機能し続けると同時に、マイクロフォンとしてまたは振動検出器としても使用されるように構成することを含む
    請求項10に記載の方法。
  12. マイクロフォンとしてまたは振動検出器として使用するように構成された、前記第1のスピーカーと前記第2のスピーカーのうちの一方からの入力を用いて、前記電子機器内の音声向上機能をサポートすることを含む
    請求項10に記載の方法。
  13. 前記音声向上機能は、ノイズリダクション及び/または音響エコー消去を含む
    請求項12に記載の方法。
  14. 前記第1のスピーカーと前記第2のスピーカーのうちの一方を、前記電子機器のユーザが話し中かどうかを指摘するための振動検出器として構成することを含む
    請求項10に記載の方法。
  15. 前記第1のスピーカーと前記第2のスピーカーのうちの一方を、前記電子機器の筐体内の振動を検出するための振動検出器として構成することを含む
    請求項10に記載の方法。
  16. 前記電子機器の別の異なる動作モードに応じて、前記第1のスピーカーと前記第2のスピーカーのうちのもう一方を選択することを含む
    請求項9に記載の方法。
  17. 複数のマイクロフォン及びスピーカーを管理する方法であって、
    第1のスピーカー及び第2のスピーカー、ならびに第1のマイクロフォン及び第2のマイクロフォンを備えるモバイル通信デバイス内で、
    前記モバイル通信デバイスの動作モードを決定するステップと、
    前記モバイル通信デバイスのユーザが話し中のときに表示を生成するステップと、
    前記モバイル通信デバイスの前記動作モード及び前記ユーザが話し中であるという前記表示に基づいて、前記第1のスピーカーと前記第2のスピーカーのうちの一方を選択するステップと、
    前記決定された動作モードに基づいて、前記選択されたスピーカーの動作を管理するステップであって、その管理が、
    前記第1のマイクロフォン及び前記第2のマイクロフォンから入力される時期が、前記モバイル通信デバイス内の音声向上機能をサポートするのに不適切であることを判定することと、
    前記選択されたスピーカーを介して入力を得るために、前記選択されたスピーカーの機能を適応的に切り替えまたは修正することとを含む管理をすることとを含む
    ことを特徴とする方法。
  18. 前記音声向上機能は、ノイズリダクションまたは音響エコー消去を含む
    請求項17に記載の方法。
  19. 前記第1のマイクロフォンと前記第2のマイクロフォンとの間の配置及び/または間隔に基づいて、前記第1のマイクロフォン及び前記第2のマイクロフォンからの入力が、前記モバイル通信デバイス内の音声向上機能をサポートするのに不適切であることを判定することを含む
    請求項17に記載の方法。
  20. 前記第1のマイクロフォンと前記第2のマイクロフォンのうちの一方または両方に対する配置及び/または間隔に基づいて、前記第1のスピーカーと前記第2のスピーカーのうちの一方を選択することを含む
    請求項17に記載の方法。
JP2013232095A 2012-11-08 2013-11-08 複数のマイクロフォン及びスピーカーを管理するシステム Pending JP2014112831A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201261723856P 2012-11-08 2012-11-08
US61/723,856 2012-11-08

Publications (1)

Publication Number Publication Date
JP2014112831A true JP2014112831A (ja) 2014-06-19

Family

ID=49553594

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013232095A Pending JP2014112831A (ja) 2012-11-08 2013-11-08 複数のマイクロフォン及びスピーカーを管理するシステム

Country Status (5)

Country Link
US (1) US9124965B2 (ja)
EP (1) EP2731351A2 (ja)
JP (1) JP2014112831A (ja)
KR (1) KR20140061255A (ja)
CN (1) CN103841491B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020123821A (ja) * 2019-01-30 2020-08-13 アイコム株式会社 無線通信機

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150365762A1 (en) * 2012-11-24 2015-12-17 Polycom, Inc. Acoustic perimeter for reducing noise transmitted by a communication device in an open-plan environment
US9747899B2 (en) * 2013-06-27 2017-08-29 Amazon Technologies, Inc. Detecting self-generated wake expressions
CN105874818A (zh) * 2013-11-20 2016-08-17 楼氏电子(北京)有限公司 具有用作第二麦克风的扬声器的装置
US9398130B2 (en) * 2014-08-15 2016-07-19 Htc Corporation Mobile terminal and method for controlling answer mode of the mobile terminal and non-transitory computer-readable storage medium
EP2999199B1 (en) * 2014-09-16 2018-03-07 Nxp B.V. Mobile device
EP3800902A1 (en) * 2014-09-30 2021-04-07 Apple Inc. Method to determine loudspeaker change of placement
US9648419B2 (en) * 2014-11-12 2017-05-09 Motorola Solutions, Inc. Apparatus and method for coordinating use of different microphones in a communication device
CN104935742B (zh) * 2015-06-10 2017-11-24 瑞声科技(南京)有限公司 移动通讯终端及改善其在听筒模式下的音质的方法
KR102296174B1 (ko) * 2015-06-26 2021-08-31 삼성전자주식회사 전자 장치 및 그의 오디오 변환 방법
EP3145216B1 (en) * 2015-09-17 2018-11-14 Nxp B.V. Amplifier system
CN105635378A (zh) * 2015-12-28 2016-06-01 小米科技有限责任公司 通话质量调整方法、装置及移动终端
CN106255000A (zh) * 2016-07-29 2016-12-21 维沃移动通信有限公司 一种音频信号采集方法及移动终端
US10462567B2 (en) * 2016-10-11 2019-10-29 Ford Global Technologies, Llc Responding to HVAC-induced vehicle microphone buffeting
CN106507242A (zh) * 2016-12-12 2017-03-15 捷开通讯(深圳)有限公司 一种音频装置及终端
US10366708B2 (en) 2017-03-20 2019-07-30 Bose Corporation Systems and methods of detecting speech activity of headphone user
CN110603822B (zh) * 2017-05-09 2021-01-15 株式会社索思未来 声音处理装置以及声音处理方法
CN107155143A (zh) * 2017-06-07 2017-09-12 太仓埃特奥数据科技有限公司 一种用于管理会议麦克风的智能控制系统
TWI656525B (zh) * 2017-07-20 2019-04-11 美律實業股份有限公司 高保真語音裝置
KR102388246B1 (ko) * 2017-12-19 2022-04-19 엘지디스플레이 주식회사 표시장치와 이를 이용한 모바일 기기
US10438605B1 (en) * 2018-03-19 2019-10-08 Bose Corporation Echo control in binaural adaptive noise cancellation systems in headsets
US10455340B1 (en) * 2018-05-11 2019-10-22 Motorola Solutions, Inc. Validating the operation of a transducer and an audio signal path
US10491998B1 (en) * 2018-08-27 2019-11-26 Blackberry Limited Vehicle communication systems and methods of operating vehicle communication systems
CN109040378A (zh) * 2018-09-21 2018-12-18 深圳市万普拉斯科技有限公司 基于声音输出元件采集外界声波的方法、装置和移动终端
US11126224B2 (en) 2018-10-31 2021-09-21 Snap Inc. Alternating sampling method for non-echo duplex conversations on a wearable device with multiple speakers and microphones
US10952002B2 (en) * 2018-11-27 2021-03-16 Google Llc Automatically switching active microphone for wireless headsets
US11304001B2 (en) 2019-06-13 2022-04-12 Apple Inc. Speaker emulation of a microphone for wind detection
US11659332B2 (en) 2019-07-30 2023-05-23 Dolby Laboratories Licensing Corporation Estimating user location in a system including smart audio devices
US11968268B2 (en) 2019-07-30 2024-04-23 Dolby Laboratories Licensing Corporation Coordination of audio devices
US11158300B2 (en) * 2019-09-16 2021-10-26 Crestron Electronics, Inc. Speakerphone system that corrects for mechanical vibrations on an enclosure of the speakerphone using an output of a mechanical vibration sensor and an output of a microphone generated by acoustic signals and mechanical vibrations
CN110769354B (zh) * 2019-10-25 2021-11-30 歌尔股份有限公司 一种用户语音检测装置、方法及耳机
CN115428474A (zh) * 2020-04-29 2022-12-02 惠普发展公司,有限责任合伙企业 基于由扬声器收集的环境噪声对音频信号的修改
FR3121259A1 (fr) * 2021-03-26 2022-09-30 Sagemcom Broadband Sas Equipement de restitution audio modulaire

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5125032A (en) * 1988-12-02 1992-06-23 Erwin Meister Talk/listen headset
US7072476B2 (en) * 1997-02-18 2006-07-04 Matech, Inc. Audio headset
JP3267556B2 (ja) * 1998-02-18 2002-03-18 沖電気工業株式会社 エコー除去装置および送話器
JP2009539306A (ja) * 2006-05-31 2009-11-12 アギア システムズ インコーポレーテッド 非呼状況での移動体通信デバイスによる雑音低減
US7953456B2 (en) * 2007-07-12 2011-05-31 Sony Ericsson Mobile Communication Ab Acoustic echo reduction in mobile terminals
US9202455B2 (en) * 2008-11-24 2015-12-01 Qualcomm Incorporated Systems, methods, apparatus, and computer program products for enhanced active noise cancellation
EP2396958B1 (en) * 2009-02-11 2013-01-02 Nxp B.V. Controlling an adaptation of a behavior of an audio device to a current acoustic environmental condition
KR101694420B1 (ko) * 2009-09-03 2017-01-09 삼성전자주식회사 이동단말의 통신 품질 개선 방법 및 장치
US20140037100A1 (en) * 2012-08-03 2014-02-06 Qsound Labs, Inc. Multi-microphone noise reduction using enhanced reference noise signal

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020123821A (ja) * 2019-01-30 2020-08-13 アイコム株式会社 無線通信機
JP7116317B2 (ja) 2019-01-30 2022-08-10 アイコム株式会社 無線通信機

Also Published As

Publication number Publication date
EP2731351A2 (en) 2014-05-14
US20140126729A1 (en) 2014-05-08
CN103841491B (zh) 2018-10-23
US9124965B2 (en) 2015-09-01
KR20140061255A (ko) 2014-05-21
CN103841491A (zh) 2014-06-04

Similar Documents

Publication Publication Date Title
JP2014112831A (ja) 複数のマイクロフォン及びスピーカーを管理するシステム
US10720173B2 (en) Voice capture processing modified by back end audio processing state
US20140363008A1 (en) Use of vibration sensor in acoustic echo cancellation
US20110181452A1 (en) Usage of Speaker Microphone for Sound Enhancement
US9380384B2 (en) Systems and methods for providing a wideband frequency response
EP3304548B1 (en) Electronic device and method of audio processing thereof
US7864969B1 (en) Adaptive amplifier circuitry for microphone array
EP2605239A2 (en) Method and arrangement for noise reduction
EP2449754B1 (en) Apparatus, method and computer program for controlling an acoustic signal
TWI510104B (zh) 用於貼近發聲差動式麥克風陣列之頻域信號處理器
JP2004226656A (ja) マイクロホンアレイを用いた話者距離検出装置及び方法並びに当該装置を用いた音声入出力装置
JP2007019898A (ja) 携帯電話機
EP3096318A1 (en) Noise reduction in multi-microphone systems
JP5446745B2 (ja) 音信号処理方法および音信号処理装置
KR20140145108A (ko) 이동 통신 장치에서의 음성 통신 개선방법 및 시스템
EP2996352B1 (en) Audio system and method using a loudspeaker output signal for wind noise reduction
CN101140760A (zh) 一种声音信号采集处理系统及方法
US20140341386A1 (en) Noise reduction
JP5167706B2 (ja) 放収音装置
US9961441B2 (en) Near-end listening intelligibility enhancement
JP2008219164A (ja) エコー防止装置及びプログラム
JP5022459B2 (ja) 収音装置、収音方法及び収音プログラム
US20210264933A1 (en) Sound signal processing system and sound signal processing apparatus
EP4128731A1 (en) Double talk detection using up-sampling
JP2021087142A (ja) エコーキャンセル装置、エコーキャンセル方法およびプログラム