JP6517365B2

JP6517365B2 - 音声アクティブ化システムのためのアナログ／デジタルコンバータ（ａｄｃ）ダイナミックレンジ拡張

Info

Publication number: JP6517365B2
Application number: JP2017555693A
Authority: JP
Inventors: ユーソフモルタザビ，; ラミンザンバギー，; アーロンブレナン，; ジョンエル．メランソン，
Original assignee: シーラスロジックインターナショナルセミコンダクターリミテッド
Priority date: 2015-04-24
Filing date: 2016-04-04
Publication date: 2019-05-22
Anticipated expiration: 2036-04-04
Also published as: GB2537694B; WO2016170413A1; US9799349B2; US20160314805A1; GB2537697B; EP3286837B1; CN107548508B; JP2018518096A; GB2537694A; GB2537697A; GB201515181D0; GB201509320D0; KR102009475B1; KR20170140314A; WO2016170413A8; EP3286837A1; CN107548508A

Description

（関連出願の引用）
本願は、米国特許出願第１４／６９６，１７２号（２０１５年４月２４日出願、ＹｏｕｓｏｆＭｏｒｔａｚａｖｉ、他、名称「Ａｎａｌｏｇ−ｔｏ−ＤｉｇｉｔａｌＣｏｎｖｅｒｔｅｒＤｙｎａｍｉｃＲａｎｇｅＥｎｈａｎｃｅｍｅｎｔｆｏｒＶｏｉｃｅ−ＡｃｔｉｖａｔｅｄＳｙｓｔｅｍｓ」）に対する優先権を主張する。上記出願の全ては、その全体が参照により本明細書に引用される。

（開示の分野）
本開示は、アナログ／デジタルコンバータ（ＡＤＣ）に関する。より具体的には、本開示の一部は、音声アクティブ化システムにおけるＡＤＣのダイナミックレンジ（ＤＲ）拡張に関する。

従来の音声アクティブ化システムでは、オーディオサンプルが、ヒトの音声活動の存在を検出するように監視および処理される。ヒトの音声活動が検出された後、ヒトの音声のオーディオサンプルはさらに、発話処理技法を介して処理される。典型的には、特定の単語または語句の発声が、ヒトの音声活動の監視から発話処理の実施へのシステムの移行をトリガする。例えば、ヒトは、以下のように発声し得る。「ＢｌｕｅＧｅｎｉｅ、現在の気温は？」この例では、「ＢｌｕｅＧｅｎｉｅ」は、「トリガ」であり、残りは、「コマンド」である。したがって、従来の音声アクティブ化システムは、オーディオサンプルを監視し、トリガ語句「ＢｌｕｅＧｅｎｉｅ」を検出するであろう。トリガ語句が検出された後、ヒトの音声によって発声される任意の単語が、続いて、音声アクティブ化システムによって発話処理される。

１つの従来の実装は、単一の高性能ＡＤＣを使用して、トリガおよびコマンドを含む全ての発話を処理する。しかしながら、この実装は、多数の欠点を有する。例えば、高信号対雑音比（ＳＮＲ）要件を常時満たすようにＡＤＣを設計し、動作させることは、高電力消費、したがって、短縮されたバッテリ寿命をもたらす。携帯電話等のデバイスでは、音声アクティブ化制御は、多くの場合、電子システムを制御する一次手段ではない。したがって、発声される単語の監視に消費される電力は、モバイルデバイスのユーザに限定された利益を提供する。

ここで述べられた短所は、代表的にすぎず、特に、携帯電話等の消費者レベルデバイス内で採用される音声アクティブ化システムにおけるＡＤＣおよび発話検出のための改良された電気コンポーネントの必要性が存在することを単に強調するために含まれる。本明細書に説明される実施形態は、ある一定の短所に対処するが、必ずしも、ここで説明される、または当技術分野において公知のあらゆるものに対処するものではない。

音声コマンド等のオーディオ信号を受信するための再構成可能入力経路が、オーディオ信号を処理することにおいて、より低い電力消費および類似性能を提供し得る。例えば、音声アクティブ化システム内のＡＤＣの低電力ＤＲ拡張が、受信されたオーディオサンプルの分析に基づいて、音声アクティブ化システムのコンポーネントの動作性能を動的に調節することによって達成され得る。例えば、音声アクティブ化システムが、ヒトの音声活動のためにオーディオサンプルを監視している間、音声アクティブ化システム内のＡＤＣは、低電力状態で動作させられ得る。トリガが検出された後、オーディオ信号品質が、発話処理をオーディオサンプルに行うために十分ではない場合、ＡＤＣは、より高い性能状態で動作するように調節され得る。例えば、オーディオサンプルのＳＮＲが、低すぎて、発話処理のために要求されるＳＮＲを満たすことができない場合、ＡＤＣは、発話が検出された後、再構成され得る。オーディオサンプルがヒトの音声活動のために監視されているにすぎない間ではなく、オーディオサンプルが発話処理を要求するときのみ、ＡＤＣが高性能状態で動作させられると、電力効率は、増加させられ得、ＤＲも、改良され得る。

電力効率は、有意な時間量にわたって入力経路が低電力（例えば、低ＤＲ）動作モードで動作し得るので、向上し得る。音声アクティブ化を提供する電子デバイスは、発話処理を発声された単語に行うよりも頻繁に、オーディオサンプルを監視し、ヒトの音声活動を検出する。再構成可能入力経路を用いないと、ＡＤＣは、この時間全体の間、高ＳＮＲで動作し、音声アクティブ化システムにコマンドの監視に必要なものより多くの電力を消費させるであろう。この結果は、音声アクティブ化システムがモバイルデバイス内に実装されるとき、不必要な電力消費がモバイルデバイスのバッテリ寿命を短縮し、バッテリのより頻繁な充電を要求し、両方とも、モバイルデバイスに関するユーザ満足を低下させるので、特に望ましくない。より低い電力消費を提供するための１つの解決策は、トリガを監視する間、ＳＮＲを低減させること、そうでなければ、ＡＤＣにおけるオーディオ処理電力を低減させることである。

トリガの検出に先立って監視されるオーディオサンプルは、高性能発話処理ソフトウェアルーチンを用いずに処理されることができる。したがって、音声アクティブ化システム内のコンポーネントのための性能要件は、オーディオサンプルがヒトの音声活動を検出するために処理されるべきときと、オーディオサンプルが発話処理技法を介して処理されるべきときとでは異なる。例えば、音声アクティブ化システム内のＡＤＣのための最小信号対雑音比（ＳＮＲ）要件は、オーディオサンプルがヒトの音声活動を検出するために処理されるべきとき、オーディオサンプルが発話処理技法を介して処理されるべきときより低くあり得る。しかしながら、従来の音声アクティブ化システムは、単一ＡＤＣを用いて全オーディオサンプルを処理するので、ＡＤＣは、常時、最高ＳＮＲ要件を満たすように設計および動作させられる。

一実施形態によると、音声アクティブ化システム内のＡＤＣの低電力ＤＲ拡張のための方法は、第１の構成を有する入力経路を通して、オーディオの第１の部分を受信すること、オーディオの第１の部分の特性を決定すること、少なくとも部分的に、決定された特性に基づいて、入力経路を第２の構成に調節すること、第２の構成を有する入力経路を通して、オーディオの第２の部分を受信すること、および／またはオーディオの第２の部分に対して発話分析を行うことを含み得る。いくつかの実施形態では、発話分析を行うステップは、デジタル信号プロセッサ（ＤＳＰ）を用いて発話分析を行うことを含む。

ある実施形態では、オーディオの第１の部分は、トリガコマンドを備え、オーディオの第２の部分は、命令コマンドを備えている。加えて、いくつかの実施形態では、特性を決定するステップは、ＳＮＲ、信号レベル、および周波数成分のうちの少なくとも１つを決定することを含む。

いくつかの実施形態では、入力経路を調節することは、入力経路の利得、ＳＮＲ、およびダイナミックレンジのうちの少なくとも１つを調節することを含む。特に、一実施形態によると、入力経路を調節することは、入力経路の増幅器のための利得を第１の構成の第１の値から第２の構成のより高い第２の値に調節することを含む。いくつかの実施形態では、利得を調節することは、少なくとも部分的に、オーディオの第１の部分の信号レベルに基づいて、利得を調節し、いくつかの実施形態では、命令コマンドを備え得るオーディオの第２の部分に対して発話分析を行うための入力経路内の所望のＳＮＲを得ることを含む。

他の実施形態では、入力経路を調節することは、入力経路のＡＤＣのための雑音床値を第１の構成の第１の値部分から第２の構成のより低い第２の値部分に調節することを含み得る。例えば、一実施形態によると、雑音床値を調節することは、ＡＤＣ内のレジスタの値を調節することと、ＡＤＣ内のコンデンサの値を調節することと、ＡＤＣ内を流れる電流の値を調節することのうちの少なくとも１つを含み得る。

別の実施形態によると、入力経路を調節することは、入力経路の第１のＡＤＣを非アクティブにすることと、入力経路の第２のＡＤＣをアクティブにすることとも含み得る。いくつかの実施形態では、第１のＡＤＣは、その利得段において最小限の信号増幅を伴う低電力低ダイナミックレンジ（ＤＲ）ＡＤＣであり得、第２のＡＤＣは、その利得段において第１のＡＤＣより多くの信号増幅を伴う高電力高ＤＲＡＤＣであり得る。電力は、第１および第２のＡＤＣに関して言及されるが、第１および第２のＡＤＣは、類似増幅能力を有し得る。低電力第１のＡＤＣは、より高い電力の第２のＡＤＣと比較して、ダイナミックレンジを低下させることによって得られ得る。

ある実施形態では、方法は、少なくとも部分的に、受信されたオーディオの第２の部分の特性に基づいて、入力経路の利得を第３の構成に調節すること、第３の構成を有する入力経路を通して、オーディオの第３の部分を受信すること、オーディオの第３の部分に対して発話分析を行うこと、および／またはオーディオの追加の部分のために、入力経路の利得の調節を継続することも含み得る。

別の実施形態によると、装置は、マイクロホン、オーディオ信号をマイクロホンから受信するように結合されている入力経路であって、ＡＤＣを備えている入力経路、および／または入力経路に結合され、オーディオ信号のデジタル表現を受信するＤＳＰを含み得、ＤＳＰは、第１の構成を有する入力経路を通して、オーディオの第１の部分を受信すること、オーディオの第１の部分の特性を決定すること、少なくとも部分的に、決定された特性に基づいて、入力経路を第２の構成に調節すること、および／または第２の構成を有する入力経路を通して、オーディオの第２の部分を受信することを行うように構成される。いくつかの実施形態では、ＤＳＰは、オーディオの第２の部分に対して発話分析を行うことを行うようにさらに構成される。

いくつかの実施形態では、入力経路は、マイクロホンとＡＤＣとの間に結合されている増幅器をさらに備え、入力経路を調節するステップは、入力経路の増幅器のための利得を第１の構成の第１の値から第２の構成のより高い第２の値に調節することを含む。一実施形態では、利得を調節するステップは、少なくとも部分的に、オーディオの第１の部分の信号レベルに基づいて、利得を調節し、オーディオの第２の部分に対して発話分析を行うための入力経路内の所望のＳＮＲを得ることを含む。

ある実施形態によると、入力経路を調節するステップは、入力経路のＡＤＣの雑音床値を第１の構成のための第１の値から第２の構成のためのより低い第２の値に調節することを含む。一実施形態では、雑音床値を調節するステップは、ＡＤＣ内のレジスタの値を調節することと、ＡＤＣ内のコンデンサの値を調節することと、ＡＤＣ内を流れる電流の値を調節することとのうちの少なくとも１つを含む。

ある実施形態による、入力経路は、第２のＡＤＣをさらに備え、ＤＳＰは、入力経路の第１のＡＤＣを非アクティブにし、入力経路の第２のＡＤＣをアクティブにすることによって、入力経路を調節するステップを行うように構成される。一実施形態では、第１のＡＤＣは、低電力低ダイナミックレンジＡＤＣを備え、第２のＡＤＣは、高電力高ダイナミックレンジＡＤＣを備えている。

ある実施形態では、ＤＳＰは、少なくとも部分的に、受信されたオーディオの第２の部分に基づいて、入力経路の利得を第３の構成に調節すること、第３の構成を有する入力経路を通して、オーディオの第３の部分を受信すること、オーディオの第３の部分に対して発話分析を行うこと、および／またはオーディオの追加の部分のために、入力経路の利得の調節を継続することを行うようにさらに構成される。

別の実施形態によると、モバイルデバイスは、マイクロホンと、マイクロホンに結合され、オーディオ信号をマイクロホンから受信するように構成されているオーディオ処理回路とを含み得る。いくつかの実施形態では、オーディオ処理回路は、アナログ／デジタルコンバータ（ＡＤＣ）、および／またはＡＤＣに結合され、オーディオ信号のデジタル表現を受信するデジタル信号プロセッサ（ＤＳＰ）を備え、オーディオ処理回路は、オーディオ処理回路が第１の構成に構成されている間、オーディオの第１の部分をマイクロホンから受信すること、オーディオの第１の部分の特性を決定すること、少なくとも部分的に、決定された特性に基づいて、オーディオ処理回路を第２の構成に調節すること、および／またはオーディオ処理回路が第２の構成に構成されている間、オーディオの第２の部分をマイクロホンを通して受信することを行うように構成される。

いくつかの実施形態では、オーディオ処理回路は、マイクロホンとＡＤＣとの間に結合されている増幅器をさらに備え、入力経路を調節するステップは、入力経路の増幅器のための利得を第１の構成の第１の値から第２の構成のより高い第２の値に調節することを含む。一実施形態では、利得を調節するステップは、少なくとも部分的に、オーディオの第１の部分の信号レベルに基づいて、利得を調節し、オーディオの第２の部分に対して発話分析を行うための入力経路内の所望のＳＮＲを得ることを含む。

別の実施形態では、入力経路を調節するステップは、入力経路のＡＤＣのための雑音床値を第１の構成のための第１の値から第２の構成のためのより低い第２の値に調節することを含む。例えば、一実施形態では、オーディオ処理回路は、可変レジスタおよび可変コンデンサのうちの少なくとも１つを備え得、オーディオ処理回路は、ＡＤＣ内のレジスタの値を調節することと、ＡＤＣ内のコンデンサの値を調節することと、ＡＤＣ内を流れる電流の値を調節することとのうちの少なくとも１つを行うことによって、雑音床値を調節するように構成される。

いくつかの実施形態では、入力経路は、第２のＡＤＣをさらに備え、ＤＳＰは、入力経路のアナログ／デジタルコンバータ（ＡＤＣ）を非アクティブにし、入力経路の第２のアナログ／デジタルコンバータ（ＡＤＣ）をアクティブにすることによって、入力経路を調節するステップを行うように構成される。一実施形態では、ＡＤＣは、低電力低ダイナミックレンジＡＤＣを備え、第２のＡＤＣは、高電力高ダイナミックレンジＡＤＣを備えている。

ある実施形態では、オーディオ処理回路は、少なくとも部分的に、受信されたオーディオの第２の部分に基づいて、増幅器の利得を第３の構成に調節するステップと、利得が第３の構成に設定されている間、オーディオの第３の部分を受信するステップと、オーディオの第３の部分に対して発話分析を行うステップと、オーディオの追加の部分のために、増幅器の利得の調節を継続するステップとを行うようにさらに構成される。

いくつかの実施形態では、オーディオ処理回路はさらに、オーディオの第２の部分に対して発話分析を行うステップを行うように構成される。加えて、一実施形態では、ＤＳＰは、モバイルデバイスの汎用中央処理ユニット（ＣＰＵ）の一部を構成する。

前述は、以下の発明を実施するための形態がより深く理解され得るために、本発明の実施形態のある特徴および技術的利点をかなり広義に概略している。本発明の請求項の主題を形成する、追加の特徴および利点は、本明細書に後述されるであろう。開示される概念および具体的実施形態は、同一または類似目的を果たすための他の構造を修正もしくは設計するための基礎として容易に利用され得ることが、当業者によって理解されるはずである。そのような均等物構造が添付の請求項に記載される本発明の精神および範囲から逸脱しないことも、当業者によって認識されるはずである。追加の特徴は、付随の図と併せて検討されるとき、以下の説明からより深く理解されるであろう。しかしながら、図の各々は、例証および説明の目的のためだけに提供されており、本発明を限定することを意図するものではないことは、明示的に理解されたい。
例えば、本願は以下の項目を提供する。
（項目１）
方法であって、前記方法は、
第１の構成を有する音声アクティブ化システムの入力経路を通して、オーディオの第１の部分を受信することと、
前記オーディオの第１の部分の特性を決定することと、
前記決定された特性に少なくとも部分的に基づいて、前記入力経路を第２の構成に調節することと、
前記第２の構成を有する前記入力経路を通して、オーディオの第２の部分を受信することと、
前記オーディオの第２の部分に対して発話分析を行うことと
を含む、方法。
（項目２）
前記入力経路を第２の構成に調節するステップは、前記入力経路のダイナミックレンジ（ＤＲ）を増加させることを含む、項目１に記載の方法。
（項目３）
前記オーディオの第１の部分は、トリガコマンドを備え、前記オーディオの第２の部分は、命令コマンドを備えている、項目１に記載の方法。
（項目４）
前記特性を決定するステップは、信号対雑音比（ＳＮＲ）、信号レベル、および周波数成分のうちの少なくとも１つを決定することを含む、項目１に記載の方法。
（項目５）
前記入力経路を調節するステップは、前記入力経路の利得、信号対雑音比（ＳＮＲ）、およびダイナミックレンジのうちの少なくとも１つを調節することを含む、項目１に記載の方法。
（項目６）
前記入力経路を調節するステップは、
前記入力経路の第１のアナログ／デジタルコンバータ（ＡＤＣ）を非アクティブにすることと、
前記入力経路の第２のアナログ／デジタルコンバータ（ＡＤＣ）をアクティブにすることと
を含む、項目１に記載の方法。
（項目７）
前記第１のＡＤＣは、低電力低ダイナミックレンジＡＤＣを備え、前記第２のＡＤＣは、高電力高ダイナミックレンジＡＤＣを備えている、項目６に記載の方法。
（項目８）
前記入力経路を調節するステップは、前記入力経路の増幅器のための利得を前記第１の構成の第１の値から前記第２の構成のより高い第２の値に調節することを含む、項目１に記載の方法。
（項目９）
前記利得を調節するステップは、前記オーディオの第１の部分の信号レベルに少なくとも部分的に基づいて、前記利得を調節し、前記オーディオの第２の部分に対して発話分析を行うための前記入力経路内の所望の信号対雑音比（ＳＮＲ）を得ることを含む、項目８に記載の方法。
（項目１０）
前記受信されたオーディオの第２の部分の特性に少なくとも部分的に基づいて、前記入力経路の利得を第３の構成に調節することと、
前記第３の構成を有する前記入力経路を通して、オーディオの第３の部分を受信することと、
前記オーディオの第３の部分に対して発話分析を行うことと、
オーディオの追加の部分のために、前記入力経路の利得の調節を継続することと
をさらに含む、項目８に記載の方法。
（項目１１）
前記入力経路を調節するステップは、前記入力経路のアナログ／デジタルコンバータ（ＡＤＣ）のための雑音床値を前記第１の構成のための第１の値から前記第２の構成のためのより低い第２の値に調節することを含む、項目１に記載の方法。
（項目１２）
前記雑音床値を調節するステップは、
前記アナログ／デジタルコンバータ（ＡＤＣ）内のレジスタの値を調節することと、
前記アナログ／デジタルコンバータ（ＡＤＣ）内のコンデンサの値を調節することと、
前記アナログ／デジタルコンバータ（ＡＤＣ）内を流れる電流の値を調節することと
のうちの少なくとも１つを含む、項目１１に記載の方法。
（項目１３）
前記発話分析を行うステップは、デジタル信号プロセッサ（ＤＳＰ）を用いて発話分析を行うことを含む、項目１に記載の方法。
（項目１４）
装置であって、前記装置は、
マイクロホンと、
音声コマンドを受信するように構成され、オーディオ信号を前記マイクロホンから受信するように結合されている入力経路であって、前記入力経路は、アナログ／デジタルコンバータ（ＡＤＣ）を備えている、入力経路と、
前記入力経路に結合され、前記オーディオ信号のデジタル表現を受信するデジタル信号プロセッサ（ＤＳＰ）と
を備え、前記ＤＳＰは、
第１の構成を有する前記入力経路を通して、オーディオの第１の部分を受信することと、
前記オーディオの第１の部分の特性を決定することと、
前記決定された特性に少なくとも部分的に基づいて、前記入力経路を第２の構成に調節することと、
前記第２の構成を有する前記入力経路を通して、オーディオの第２の部分を受信することと
を行うように構成されている、装置。
（項目１５）
前記デジタル信号プロセッサ（ＤＳＰ）は、前記入力経路のダイナミックレンジ（ＤＲ）を増加させることによって、前記入力経路を第２の構成に調節するように構成されている、項目１４に記載の装置。
（項目１６）
前記オーディオの第１の部分は、トリガコマンドを備え、前記オーディオの第２の部分は、命令コマンドを備えている、項目１４に記載の装置。
（項目１７）
前記入力経路は、第２のアナログ／デジタルコンバータ（ＡＤＣ）をさらに備え、前記ＤＳＰは、
前記入力経路の第１のアナログ／デジタルコンバータ（ＡＤＣ）を非アクティブにすることと、
前記入力経路の第２のアナログ／デジタルコンバータ（ＡＤＣ）をアクティブにすることと
によって、前記入力経路を調節するステップを行うように構成されている、項目１４に記載の装置。
（項目１８）
前記第１のＡＤＣは、低電力低ダイナミックレンジＡＤＣを備え、前記第２のＡＤＣは、高電力高ダイナミックレンジＡＤＣを備えている、項目１７に記載の装置。
（項目１９）
前記入力経路は、前記マイクロホンと前記アナログ／デジタルコンバータ（ＡＤＣ）との間に結合されている増幅器をさらに備え、前記入力経路を調節するステップは、前記入力経路の増幅器のための利得を前記第１の構成の第１の値から前記第２の構成のより高い第２の値に調節することを含む、項目１４に記載の装置。
（項目２０）
前記利得を調節するステップは、前記オーディオの第１の部分の信号レベルに少なくとも部分的に基づいて、前記利得を調節し、前記オーディオの第２の部分に対して発話分析を行うための前記入力経路内の所望の信号対雑音比（ＳＮＲ）を得ることを含む、項目１９に記載の装置。
（項目２１）
前記ＤＳＰは、
前記受信されたオーディオの第２の部分に少なくとも部分的に基づいて、前記入力経路の利得を第３の構成に調節することと、
前記第３の構成を有する前記入力経路を通して、オーディオの第３の部分を受信することと、
前記オーディオの第３の部分に対して発話分析を行うことと、
オーディオの追加の部分のために、前記入力経路の利得の調節を継続することと
を行うようにさらに構成されている、項目１９に記載の装置。
（項目２２）
前記入力経路を調節するステップは、前記入力経路のアナログ／デジタルコンバータ（ＡＤＣ）の雑音床値を前記第１の構成のための第１の値から前記第２の構成のためのより低い第２の値に調節することを含む、項目１４に記載の装置。
（項目２３）
前記雑音床値を調節するステップは、
前記アナログ／デジタルコンバータ（ＡＤＣ）内のレジスタの値を調節することと、
前記アナログ／デジタルコンバータ（ＡＤＣ）内のコンデンサの値を調節することと、
前記アナログ／デジタルコンバータ（ＡＤＣ）内を流れる電流の値を調節することと
のうちの少なくとも１つを含む、項目２２に記載の装置。
（項目２４）
前記ＤＳＰは、前記オーディオの第２の部分に対して発話分析を行うステップを行うようにさらに構成されている、項目１４に記載の装置。
（項目２５）
モバイルデバイスであって、前記モバイルデバイスは、
マイクロホンと、
前記マイクロホンに結合され、音声コマンドを備えているオーディオ信号を前記マイクロホンから受信するように構成されているオーディオ処理回路と
を備え、
前記オーディオ処理回路は、
アナログ／デジタルコンバータ（ＡＤＣ）と、
前記ＡＤＣに結合され、前記オーディオ信号のデジタル表現を受信するデジタル信号プロセッサ（ＤＳＰ）と
を備え、
前記オーディオ処理回路は、
前記オーディオ処理回路が第１の構成に構成されている間、オーディオの第１の部分を前記マイクロホンから受信することと、
前記オーディオの第１の部分の特性を決定することと、
前記決定された特性に少なくとも部分的に基づいて、前記オーディオ処理回路を第２の構成に調節することと、
前記オーディオ処理回路が第２の構成に構成されている間、オーディオの第２の部分を前記マイクロホンを通して受信することと
を行うように構成されている、モバイルデバイス。
（項目２６）
前記オーディオ処理回路は、前記入力経路のダイナミックレンジ（ＤＲ）を増加させることによって、前記入力経路を第２の構成に調節するように構成されている、項目２５に記載のモバイルデバイス。
（項目２７）
前記オーディオの第１の部分は、トリガコマンドを備え、前記オーディオの第２の部分は、命令コマンドを備えている、項目２５に記載のモバイルデバイス。
（項目２８）
前記入力経路は、第２のアナログ／デジタルコンバータ（ＡＤＣ）をさらに備え、前記ＤＳＰは、
前記入力経路のアナログ／デジタルコンバータ（ＡＤＣ）を非アクティブにすることと、
前記入力経路の第２のアナログ／デジタルコンバータ（ＡＤＣ）をアクティブにすること
によって、前記入力経路を調節するステップを行うように構成されている、項目２５に記載のモバイルデバイス。
（項目２９）
前記ＡＤＣは、低電力低ダイナミックレンジＡＤＣを備え、前記第２のＡＤＣは、高電力高ダイナミックレンジＡＤＣを備えている、項目２８に記載のモバイルデバイス。
（項目３０）
前記オーディオ処理回路は、前記マイクロホンと前記アナログ／デジタルコンバータ（ＡＤＣ）との間に結合されている増幅器をさらに備え、前記入力経路を調節するステップは、前記入力経路の増幅器のための利得を前記第１の構成の第１の値から前記第２の構成のより高い第２の値に調節することを含む、項目２５に記載のモバイルデバイス。
（項目３１）
前記利得を調節するステップは、前記オーディオの第１の部分の信号レベルに少なくとも部分的に基づいて、前記利得を調節し、前記オーディオの第２の部分に対して発話分析を行うための前記入力経路内の所望の信号対雑音比（ＳＮＲ）を得ることを含む、項目３０に記載のモバイルデバイス。
（項目３２）
前記オーディオ処理回路は、
前記受信されたオーディオの第２の部分に少なくとも部分的に基づいて、前記増幅器の利得を第３の構成に調節するステップと、
前記利得が前記第３の構成に設定されている間、オーディオの第３の部分を受信するステップと、
前記オーディオの第３の部分に対して発話分析を行うステップと、
オーディオの追加の部分のために、前記増幅器の利得の調節を継続するステップと
を行うようにさらに構成されている、項目３１に記載のモバイルデバイス。
（項目３３）
前記入力経路を調節するステップは、前記入力経路のアナログ／デジタルコンバータ（ＡＤＣ）のための雑音床値を前記第１の構成のための第１の値から前記第２の構成のためのより低い第２の値に調節することを含む、項目２５に記載のモバイルデバイス。
（項目３４）
前記オーディオ処理回路は、可変レジスタおよび可変コンデンサのうちの少なくとも１つを備え、前記オーディオ処理回路は、
前記アナログ／デジタルコンバータ（ＡＤＣ）内のレジスタの値を調節するステップと、
前記アナログ／デジタルコンバータ（ＡＤＣ）内のコンデンサの値を調節するステップと、
前記アナログ／デジタルコンバータ（ＡＤＣ）内を流れる電流の値を調節するステップと
のうちの少なくとも１つを行うことによって、前記雑音床値を調節するように構成されている、項目３３に記載のモバイルデバイス。
（項目３５）
前記オーディオ処理回路は、前記オーディオの第２の部分に対して発話分析を行うステップを行うようにさらに構成されている、項目２５に記載のモバイルデバイス。
（項目３６）
前記デジタル信号プロセッサ（ＤＳＰ）は、前記モバイルデバイスの汎用中央処理ユニット（ＣＰＵ）の一部を備えている、項目２５に記載のモバイルデバイス。

開示されるシステムおよび方法のより完全な理解のために、ここで、添付の図面と併せて検討される、以下の説明を参照する。

図１は、本開示の一実施形態による、ＤＲ拡張ＡＤＣを伴う音声アクティブ化システムを図示する例示的概略ブロック図である。図２は、本開示の一実施形態による、トリガを検出するため、かつ発話処理を行うためのオーディオ信号品質要件間の区別の例示的振幅対周波数プロット図である。図３は、本開示の一実施形態による、調節可能持続時間デルタ−シグマ変調ＡＤＣを図示する例示的概略ブロック図である。図４は、本開示の一実施形態による、調節可能二重経路入力を図示する例示的概略ブロック図である。図５は、本開示の一実施形態による、調節可能入力経路によって達成される性能改良を図示する例示的振幅対周波数プロットである。図６は、本開示の一実施形態による、音声アクティブ化システムによって処理されているオーディオ信号の振幅を低減させるための別の音声アクティブ化システムを図示する例示的概略ブロック図である。図７は、本開示の一実施形態による、音声アクティブ化システムの低電力ＤＲ拡張のための方法を図示する例示的フロー図である。

ダイナミックレンジ（ＤＲ）拡張低電力アナログ／デジタルコンバータ（ＡＤＣ）を伴う音声アクティブ化システムの一実施形態が、図１の概略ブロック図に図示される。電子システム１００は、マイクロホン１０２と、プログラムマブル利得増幅器（ＰＧＡ）１０４と、ＡＤＣ１０６と、バッファ１０８と、デジタル信号プロセッサ（ＤＳＰ）１１０と、コンピューティングネットワーク１１２とを含み得る。アナログコンポーネント１０４および１０６と、デジタルコンポーネント１０８および１１０とは、音声アクティブ化システム等の混合信号システム１１４内に統合され得る。いくつかの実施形態では、マイクロホン１０２は、音声アクティブ化システム１１４の一部であり得る一方、他の実施形態では、マイクロホン１０２は、音声アクティブ化システム１１４の外部にあり得る。コンピューティングネットワーク１１２は、ネットワーク化されたコンピュータおよびデータセンタの「クラウド」であり得る。いくつかの実施形態では、コンピューティングネットワーク１１２は、発話から変換されたテキストを記憶するため等、データ記憶のために、混合信号システム１１４によってアクセスされ得る。他の実施形態では、コンピューティングネットワーク１１２は、電子システム１００が記録されたオーディオをコンピューティングネットワーク１１２に伝送し、返される文字化されたテキストを受信するように、発話の部分を処理するために、電子システム１００によってアクセスされ得る。図１は、ＰＧＡ１０４およびＡＤＣ１０６を２つの別個のコンポーネントとして図示するが、いくつかの実施形態では、ＰＧＡ１０４およびＡＤＣ１０６は、単一コンポーネント１１６として設計され、動作させられ得る。統合されても、ＰＧＡ１０４およびＡＤＣ１０６を含む、単一コンポーネントは、依然として、ＡＤＣと称され得る。

音声アクティブ化システム１１４が発話処理を行っていないとき等、音声アクティブ化システム１１４がアイドルであるとき、音声アクティブ化システム１１４は、オーディオサンプルを持続的に処理し、ヒトの音声活動を検出する音声活動検出モードで動作し得る。例えば、マイクロホン１０２によって検出されたオーディオ信号は、ＰＧＡ１０４および低電力ＡＤＣ１０６に転送され、アナログオーディオ信号をデジタルオーディオ信号に変換し得る。マイクロホン１０２、ＰＧＡ１０４、およびＡＤＣ１０６は、ほぼ常時、オンであり、ユーザが音声コマンドを発するときの瞬間と、コマンドされたアクションが行われるときの瞬間との間の応答時間を短縮させ得る。音声活動検出モードは、音声アクティブ化システム１１４の低電力モードであり得る。低電力消費は、音声アクティブ化システム１１４が音声活動検出モードにある間、ＤＳＰ１１０によって実行されるソフトウェアルーチンのための低最小信号品質によって可能にされ得る。例えば、ＤＳＰ１１０は、音声活動検出モードでは、オーディオサンプルのための低下させられたＳＮＲ要件を有し得る。

ＡＤＣ１０６によって出力されるデジタルオーディオサンプルは、先入れ先出し（ＦＩＦＯ）バッファであり得るバッファ１０８内に記憶され得る。ＤＳＰ１１０は、新しいサンプルのためにバッファ１０８にポーリングし、サンプルを処理し、ヒトの音声活動が存在するかどうかを決定し得る。音声活動が検出されると、音声アクティブ化システム１１４は、ＤＳＰ１１０がオーディオサンプルを処理し、トリガ音、単語、語句、および／または文を検出する音声ウェイクモード（「トリガ検出モード」とも称される）に移行し得る。音声活動検出モードより複雑なＤＳＰルーチンが、音声ウェイクモード中、オーディオサンプルを処理するために使用され得る。これらのより複雑なルーチンは、発声されたトリガを検出するために必要であり得る。より高度なルーチンは、より高いＳＮＲ等のより優れた信号品質を要求し得、それは、ＡＤＣ１０６によるより大量の電力消費をもたらす。

トリガが検出された後、音声アクティブ化システム１１４は、ＤＳＰ１１０が発話処理ソフトウェアアルゴリズムを用いてオーディオサンプルを処理し、ヒトの音声によって発話された情報を解読する発話処理モード（「コマンド処理モード」とも称される）で動作する。この解読された情報は、アクションを電子システム１００によって行わせるため等、電子システム１００によるさらなる処理を始動するために使用され得る。例えば、いくつかの実施形態では、ＤＳＰ１１０は、検出された発話をテキストに変換し、テキストをコンピューティングネットワーク１１２に転送し得る。このテキストは、画面上に表示される、または文書の中に挿入され得る。代替として、テキストは、電子システム１００にアクションを実行させ得る。

トリガを検出するためにＤＳＰ１１０によって要求されるオーディオサンプルの信号品質は、発話処理ルーチンを実行するためにＤＳＰ１１０によって要求されるオーディオサンプルの信号品質と異なり得る。例えば、図２は、本開示の一実施形態による、トリガを検出するため、かつ発話処理を行うためのオーディオ信号品質要件間の区別の例示的振幅対周波数プロット図である。レベル２０２に到達するオーディオ信号は、２０ｄＢのＳＮＲをもたらし、トリガを検出するためにＤＳＰによって課されるＳＮＲ要件を満たすために十分であり得る。しかしながら、より高いＳＮＲを伴う、レベル２０４に到達するより強いオーディオ信号が、発話処理ルーチンをオーディオサンプルに行うためにＤＳＰによって課されるＳＮＲ要件を満たすために必要であり得る。いくつかの実施形態では、発話処理を行うためのＳＮＲ要件は、３０ｄＢと低くも、４０ｄＢと高くもあり得る、実際の要件は、異なる実施形態に対してこの範囲外で変動し得る。

広ＳＮＲ要件範囲を考慮するために、音声アクティブ化システム１１４は、ＤＳＰ１１０からＰＧＡ１０４へのフィードバック経路１１８を含み、ＰＧＡ１０４の利得を調節し、単一ＡＤＣ１０６を使用して、異なるＳＮＲ要件を満たし得る。例えば、いくつかの実施形態では、ＤＳＰ１１０は、第１の構成を有するＰＧＡ１０４およびＡＤＣ１０６の入力経路から、トリガコマンド等のオーディオの第１の部分を受信し得る。例えば、ＰＧＡ１０４は、第１の利得値に設定され得る。別の実施例では、第１の構成を有する入力経路は、第１の雑音床値を用いて構成されている入力経路のＡＤＣ１０６を含み得る。信号をフィードバック経路１１８に提供することを補助するために、ＤＳＰ１１０は、オーディオの第１の部分の特性を決定するように構成され得る。例えば、ＤＳＰ１１０は、オーディオの第１の部分内のオーディオサンプルのＳＮＲ、信号レベル、および周波数成分のうちの少なくとも１つを決定するように構成され得る。

ＤＳＰ１１０は、少なくとも部分的に、決定された特性に基づいて、入力経路を第２の構成に調節するように構成され得る。例えば、ＤＳＰ１１０は、ＰＧＡ１０４の利得を第１の利得値部分からより高い第２の利得値に調節し得る。言い換えると、ＤＳＰ１１０は、発話分析をオーディオの第２の部分に行うために入力経路内に所望のＳＮＲを得るために、少なくとも部分的に、オーディオの第１の部分の信号レベルに基づいて、ＰＧＡ１０４または他の増幅コンポーネントの利得を調節し得る。他の実施形態では、ＤＳＰ１１０は、ＡＤＣ１０６の雑音床値を第１の雑音床値からより低い第２の雑音床値に調節し、類似結果を達成することによって、入力経路を第２の構成に調節し得る。

本開示の一実施形態による、入力経路を調節するステップの実施例を図示するために、図３は、連続時間デルタ−シグマ変調ＡＤＣ（ΔΣ ＡＤＣ）を図示する例示的概略ブロック図を提供する。ΔΣ ＡＤＣ３００は、積分器３０２と、量子化器３０４と、デジタル／アナログコンバータ（ＤＡＣ）３０６とを含み得る。いくつかの実施形態では、ΔΣ ＡＤＣ３００は、追加のループフィルタリングコンポーネント（またはループフィルタの残り）３０８も含み得る。

いくつかの実施形態では、ΔΣ ＡＤＣ３００は、ＰＧＡ１０４およびＡＤＣ１０６を含む回路実装に対応し得る。言い換えると、ΔΣ ＡＤＣ３００は、増幅部分およびＡＤＣ部分を含む入力経路の単一コンポーネントＡＤＣ実施形態に対応し得る。入力経路を調節することは、本実施形態では、積分器３０２内のレジスタ３１０および３１２等のＡＤＣ内の１つ以上のレジスタの値を調節することを含み得る。例えば、ΔΣ ＡＤＣ３００の雑音床値を低減させるために、レジスタ３１０および３１２の抵抗値が、低減させられ得る。代替として、レジスタ３１０および３１２の抵抗値は、ΔΣ ＡＤＣ３００の雑音床値を増加させるために増加させられ得る。レジスタ３１０および３１２は、いくつかの実施形態では、調節可能である必要があり得るため、レジスタ３１０および３１２は、可変レジスタ（バリスタ）であり得る。代替として、レジスタ３１０および３１２は、レジスタ３１０および／または３１２に代用されるより大きいプログラマブル（可変）抵抗デバイスを構成する切り替え式レジスタ要素であり得る。別の実施形態では、入力経路を第１の構成から第２の構成に調節することは、積分器３０２内のコンデンサ３１４および３１６等のＡＤＣ内の１つ以上のコンデンサの値を調節することを含み得る。例えば、ΔΣ ＡＤＣ３００の雑音床値を低減させるために、コンデンサ３１４および３１６の静電容量値は、増加させられ得る。代替として、コンデンサ３１４および３１６の静電容量値は、ΔΣ ＡＤＣ３００の雑音床値を増加させるために低減させられ得る。コンデンサ３１４および３１６は、いくつかの実施形態では、調節可能である必要があり得るので、コンデンサ３１４および３１６は、可変コンデンサであり得る。代替として、コンデンサ３１４および３１６は、コンデンサ３１４および／または３１６の代用とされるより大きいプログラマブル（可変）静電容量デバイスを構成する切り替え式コンデンサ要素であり得る。

入力経路を第１の構成から第２の構成に調節することは、ＡＤＣ内を流れる電流の値を調節することも含み得る。例えば、ＡＤＣ内のいくつかのデバイスに供給される電流は、ＡＤＣの雑音床値を低減させ、ＳＮＲを増加させるために増加させられ得る。代替として、ＡＤＣ内のいくつかのデバイスに供給される電流は、ＡＤＣの雑音床値を増加させるために低下させられ得る。いくつかの実施形態では、レジスタ、コンデンサ、および電流の組み合わせが、入力経路を第１の構成から第２の構成に調節するために調節され得る。

前述のように、２つ以上の入力経路構成は、入力経路の動的再構成を可能にすることによって提供され得る。２つ以上の入力経路構成は、複数の入力経路を使用することによっても提供され得る。図４は、本開示の一実施形態に従って調節され得る二重経路入力経路を図示する例示的概略ブロック図を提供する。図１に図示される電子システム１００と同様に、電子システム４００は、マイクロホン４０２と、プログラマブル利得増幅器（ＰＧＡ）４０４と、ＡＤＣ４０６と、バッファ４０８と、デジタル信号プロセッサ（ＤＳＰ）４１０と、コンピューティングネットワーク４１２とを含み得る。ＰＧＡ４０４は、ＰＧＡ４０４がＡＤＣ４０６において得られる固有の利得によって置換されるとき等、明示的利得段または仮想／機能的ＰＧＡであり得る。二重経路入力を伴う電子システム４００は、追加のＰＧＡ４１４と、追加のＡＤＣ４１６と、第１のマルチプレクサ４１８と、第２のマルチプレクサ４２０とも含む。いくつかの実施形態では、各ＰＧＡ−ＡＤＣ対は、ＤＳＰ４１０によって課される異なるＳＮＲ要件を満たすように設計され、動作させられ得る。例えば、ＰＧＡ４０４およびＡＤＣ４０６から成るＰＧＡ−ＡＤＣ対は、ＰＧＡ４０４が低利得を有するように設定され得る低電力低ダイナミックレンジＡＤＣに対応し得る。低利得は、ＤＳＰ４１０がオーディオサンプル内のトリガを検出するために十分なＳＮＲを伴って、ＡＤＣ４０６がオーディオサンプルを出力するために十分であるように選択され得る。ＰＧＡ４１４およびＡＤＣ４１６から成るＰＧＡ−ＡＤＣ対は、ＰＧＡ４１４がより高い利得を有するように設定され得る高電力高ダイナミックレンジＡＤＣに対応し得る。より高い利得は、ＡＤＣ４１６が発話処理ルーチンをオーディオサンプルに行うために十分であるように選択され得る。言い換えると、ＰＧＡ４１４は、ＰＧＡ４０４より高い利得を有し得、および／またはＡＤＣ４１６は、ＡＤＣ４０６より低い雑音床値を有し得る。いくつかの実施形態では、任意の所与の時間において、ＰＧＡ−ＡＤＣ対の１つのみが、オーディオサンプルを処理し、ＤＳＰ４１０によるさらなる処理のために、オーディオサンプルを出力し得る。入力経路が図４に図示される二重経路入力経路等の二重経路入力経路である実施形態では、ＤＳＰは、ＡＤＣ４０６等の入力経路の第１のＡＤＣを非アクティブにし、ＡＤＣ４１６等の入力経路の第２のＡＤＣをアクティブにすることによって、入力経路を第１の構成から第２の構成に調節するステップを行うように構成され得る。ＰＧＡ−ＡＤＣ対が別個のＰＧＡおよびＡＤＣコンポーネントから成る実施形態等のいくつかの実施形態では、ＰＧＡ４０４はまた、ＡＤＣ４０６が非アクティブ化されるとき、非アクティブ化され得、ＰＧＡ４１４も、ＡＤＣ４１６がアクティブ化されるとき、アクティブ化され得る。２つのＰＧＡ４０４および４１４が、全体を通して説明されるが、図４の一実施形態は、明示的ＰＧＡ４０４および４１４を伴わずに実現され得る。例えば、ＡＤＣ４０６および４１６は、異なるフルスケールを伴って構成され得、それは、ＰＧＡ４０４および４１４の存在を伴わずに、異なる利得を２つの経路にもたらすであろう。

いくつかの実施形態では、図４に図示される二重経路入力経路内のコンポーネントの非アクティブ化およびアクティブ化は、フィードバック経路４２２を介して実現され得る。加えて、いくつかの実施形態では、フィードバック経路４２２は、マルチプレクサ４１８および４２０内のどの経路が経路を介した信号伝送を可能にするために閉鎖されるか、および、どの経路が経路を介した信号伝送を制限するように開放されるかを制御するために、ＤＳＰ４１０によって使用され得る。さらに、マルチプレクサ４１８が図４に図示されるが、フィードバック経路４２２は、入力が両入力を駆動することを可能にすることによって、マルチプレクサ４１８を伴わずに実装され得る。その構成では、フィードバックは、両経路（ＡＤＣ４０６を通した第１の経路およびＡＤＣ４１６を通した第２の経路）に提供され、マルチプレクサ４２０は、システム４００を通して継続するために、経路のうちの一方のみを選択するであろう。２つのみのＰＧＡ−ＡＤＣ対が図４に図示されるが、追加の対が、フィードバック経路４２２を通して実装および制御され得る。

第１の構成から第２の構成への入力経路の調節は、入力経路からのオーディオサンプル出力が発話処理をオーディオサンプルに対して行うためにＤＳＰ１１０によって課されるＳＮＲ要件を満たすために十分なＳＮＲを有するように、入力経路内のコンポーネントの性能を増加させ得る。例えば、図５は、本開示の一実施形態による、入力経路を第２の構成に調節することによって達成される性能改良を図示する例示的振幅対周波数プロットである。入力経路が第１の構成にあるとき、入力経路は、トリガ検出のための要件を満たすレベル５０２に到達する十分なＳＮＲを伴って、オーディオサンプルを生成し得る。例えば、ＤＳＰ１１０によって課される最小ＳＮＲ要件が２０ｄＢである実施形態では、第１の構成における入力経路は、少なくとも２０ｄＢのＳＮＲを伴って、オーディオサンプルを出力し得る。入力経路が第２の構成にあるとき、入力経路は、レベル５０４に到達する発話処理のための要件を満たす十分なＳＮＲを伴って、オーディオサンプルを生成し得る。例えば、入力経路を調節することが利得を調節することを含むとき、利得の増加は、第２の構成における入力経路によって出力されるオーディオサンプルが発話処理をオーディオサンプルに行うためにＤＳＰ１１０によって課されるＳＮＲ要件を満たす、十分な増加であり得る。

図１に戻ると、ＤＳＰ１１０は、入力経路が第２の構成に構成されるように調節された後、オーディオの第２の部分を入力経路を通して受信するようにさらに構成され得る。第２の構成における入力経路によって処理されるオーディオサンプルは、発話処理をオーディオサンプルに行うためにＤＳＰによって課されるＳＮＲ要件を満たすために十分なＳＮＲを有し得る。ＤＳＰは、オーディオの第２の部分に対して発話分析を行うようにさらに構成され得る。

いくつかの実施形態では、入力経路の第２の構成は、入力経路の第１の構成と同一であり得る。例えば、いくつかの実施形態では、オーディオの第１の部分のオーディオサンプル部分のＳＮＲは、発話処理を行うためにＤＳＰによって課されるＳＮＲ要件を満たすために十分に高くあり得る。その場合、ＡＤＣは、ＳＮＲ改良が必要とされないこともあるので、第１の構成に維持され、オーディオの第２の部分およびオーディオの後続部分を処理することができる。

いくつかの実施形態では、ＤＳＰによって受信されたオーディオの第２の部分は、信号クリッピングが問題となり得るほど高いか、またはＤＳＰ１１０が信頼性のある発話処理を行うために低すぎるＳＮＲをもたらす振幅を有し得る。例えば、いくつかの実施形態では、オーディオサンプルの信号特性は、オーディオの第１の部分に基づいて決定され得、入力経路は、オーディオの第１の部分から決定される信号特性に基づいて調節され得る。オーディオの第２の部分は、オーディオの第１の部分と同一信号特性を有していないこともある。したがって、いくつかの実施形態では、ＤＳＰ１１０は、オーディオの第２の部分の特性を検出し、オーディオの第２の部分から決定される信号特性に基づいて、入力経路を調節することもある。

特に、いくつかの実施形態では、ＤＳＰ１１０は、少なくとも部分的に、受信されたオーディオの第２の部分に基づいて、入力経路の利得を第３の構成に調節するようにさらに構成され得る。例えば、ＤＳＰ１１０は、（１）オーディオの第２の部分内のオーディオサンプルがＤＳＰが発話処理を行うために十分なＳＮＲを有していないとき、マイクロホン１０２によって受信されたオーディオサンプルの信号振幅をさらに増加させるか、または、（２）オーディオの第２の部分内のオーディオサンプルがクリッピングが生じ得るほど高い振幅を有するとき、マイクロホン１０２によって受信されたオーディオサンプルの信号振幅を低減させるかのいずれかのために、入力経路をさらに調節し得る。いくつかの実施形態では、信号レベルは、信号レベルが所定の閾値を超えるとき、クリッピングが生じ得るほど高いと見なされ得る。別の実施形態では、信号レベルは、信号レベルがＡＤＣによって処理され得る最大信号レベルの９０％より高いとき、クリッピングが生じ得るほど高いと見なされ得る。

入力経路が第３の構成に調節された後、ＤＳＰ１１０は、第３の構成を有する入力経路を通して、オーディオの第３の部分を受信し、オーディオの第３の部分に発話分析を行い得る。いくつかの実施形態では、ＤＳＰ１１０は、オーディオの追加の部分のために、入力経路の利得の調節を継続するようにも構成され得る。したがって、いくつかの実施形態では、入力経路内に適用される利得の調節は、ＤＳＰによって処理されるオーディオサンプルが、信頼性のある発話処理を行うために十分なＳＮＲであるが、クリッピングが生じるほど高くないＳＮＲを有するように、入力経路内に適用される利得を動的に増加または減少させる、動的調節であり得る。

入力経路の再構成は、信号がクリッピングされないように十分に迅速であり得る。例えば、オーディオサンプルの信号レベルが高すぎることを検出すると、ＤＳＰ１１０は、フィードバック経路１１８を介して、ＰＧＡ１０４における利得を低減させ得る。図６は、音声アクティブ化システムによって処理されているオーディオ信号の振幅を迅速に低減させるための例示的概略ブロック図を図示し、信号レベル検出回路６０２が、ＡＤＣ６０４およびＰＧＡ６０６に結合される。信号レベル検出回路６０２は、ＡＤＣ６０４によって処理されているオーディオサンプルの信号レベルを検出し得、信号レベルが所定の閾値に到達する場合、信号レベル検出回路６０２は、ＰＧＡ６０６によって適用される利得を低減させ得る。ＤＳＰ６１０によって受信されたオーディオサンプルの振幅が低すぎる場合、ＤＳＰ６１０は、ＰＧＡ６０６における利得を増加させ得る。利得が減少させられる率および利得が増加させられる率は、非対称であり得る。すなわち、利得は、クリッピングを回避するために十分に迅速に減少させられるが、音声アクティブ化システム内の制御ループを不安定にすることを回避するために、より低率で増加させられ得る。

入力経路は、第１の構成に戻り、ヒトの音声活動およびトリガの検出のために、オーディオサンプルを監視および処理するように調節され得る。例えば、オーディオサンプルの発話処理が終了した後、および／またはヒトの音声活動がもはやオーディオサンプル内に存在しない場合、入力経路は、第１の構成に調節され、殆ど電力を消費しないようにすることができる。いくつかの実施形態では、音声アクティブ化システムは、発話処理がオーディオサンプルに対して行われてから、またはヒトの音声活動が最後にオーディオサンプル内に存在してから、所定の時間量が経過した後、入力経路を第１の構成に戻すように構成され得る。例えば、入力経路は、ヒトの音声活動が検出されなくなってから５秒またはそれを上回る時間後、第１の構成に戻され得る。

本明細書に図示および説明される例示的システムに照らして、開示される主題に従って実装され得る方法論が、種々の機能ブロック図を参照してより深く理解されるであろう。説明の簡略化目的のために、方法論は、一連の行為／ブロックとして図示および説明されるが、請求される主題は、ブロックの数または順序によって限定されず、したがって、いくつかのブロックは、本明細書に描写および説明されるものと異なる順序において、および／または他のブロックと実質的に同時に生じ得ることを理解および認識されたい。さらに、全ての図示されるブロックが、本明細書に説明される方法論を実装するために要求されないこともある。ブロックに関連付けられた機能性は、ソフトウェア、ハードウェア、それらの組み合わせ、または任意の他の好適な手段（例えば、デバイス、システム、プロセス、またはコンポーネント）によって実装され得ることを認識されたい。加えて、本明細書全体を通して開示される方法論は、種々のデバイスへのそのような方法論のトランスポートおよび転送を促進するために、製造品上に記憶されることが可能であることをさらに認識されたい。当業者は、方法論が、代替として、状態略図におけるように、一連の相互関連状態またはイベントとして表され得ることを理解および認識するであろう。

図７は、本開示の一実施形態による、音声アクティブ化システムの低電力ＤＲ拡張のための方法を図示する例示的フロー図である。方法７００は、図１−６に関して説明されるシステムを用いて実装され得る。方法７００は、ブロック７０２から開始し、第１の構成を有する入力経路を通して、オーディオの第１の部分を受信する。いくつかの実施形態では、オーディオの第１の部分は、トリガコマンドを含み得る。ブロック７０４では、方法７００は、いくつかの実施形態では、ＳＮＲ、信号レベル、および周波数成分のうちの少なくとも１つを含み得る、オーディオの第１の部分の特性を決定することを含む。

方法７００は、ブロック７０６では、少なくとも部分的に、決定された特性に基づいて、入力経路を第２の構成に調節することを含む。いくつかの実施形態では、入力経路を調節することは、入力経路の利得、ＳＮＲ、およびダイナミックレンジのうちの少なくとも１つを調節することを含み得る。例えば、一実施形態によると、入力経路を調節することは、入力経路の増幅器のための利得を第１の構成の第１の値から第２の構成のより高い第２の値に調節することを含み得る。いくつかの実施形態では、利得を調節することは、少なくとも部分的に、オーディオの第１の部分の信号レベルに基づいて、利得を調節し、命令コマンドを含み得るオーディオの第２の部分に対して発話分析を行うために、入力経路内に所望のＳＮＲを得ることを含み得る。他の実施形態では、ブロック７０６等の入力経路を調節することは、入力経路のＡＤＣのための雑音床値を第１の構成の第１の値部分から第２の構成のより低い第２の値部分に調節することを含み得る。例えば、一実施形態によると、雑音床値を調節することは、ＡＤＣ内のレジスタの値を調節することと、ＡＤＣ内のコンデンサの値を調節することと、ＡＤＣ内を流れる電流の値を調節することとのうちの少なくとも１つを含み得る。

別の実施形態によると、入力経路は、２つの経路の各々に異なるＡＤＣを含む二重経路入力経路であり得、各ＡＤＣは、異なる性能制約および仕様に従って設計されることができる。そのような実施形態では、ブロック７０６等の入力経路を調節することは、入力経路の第１のＡＤＣを非アクティブにすることと、入力経路の第２のＡＤＣをアクティブにすることも含み得る。いくつかの実施形態では、第１のＡＤＣは、その利得段に最小限の信号増幅を伴う低電力低ＤＲＡＤＣであり得、第２のＡＤＣは、その利得段に第１のＡＤＣより多くの信号増幅を伴う高電力高ＤＲＡＤＣであり得る。電力は、第１および第２のＡＤＣに関して言及されるが、第１および第２のＡＤＣは、類似増幅能力を有し得る。低電力の第１のＡＤＣは、より高い電力の第２のＡＤＣと比較して、ダイナミックレンジを低下させることによって得られ得る。

次に、方法７００は、ブロック７０８では、第２の構成を有する入力経路を通して、オーディオの第２の部分を受信することを含む。例えば、オーディオの第２の部分は、ヒトの音声によって発話された命令コマンドを含む、オーディオの部分であり得る。ブロック７１０では、方法７００は、オーディオの第２の部分に対して発話分析を行うことを含む。例えば、発話分析は、図１に図示されるＤＳＰ１１０等のＤＳＰを用いて行われ得る。

いくつかの実施形態では、オーディオの第２の部分内のオーディオサンプルの信号レベルは、オーディオの第１の部分内のオーディオサンプルの信号レベルと異なり得る。入力経路の利得は、少なくとも部分的に、受信されたオーディオの第２の部分の特性に基づいて、第３の構成に調節され得る。続いて、オーディオの第３の部分が、第３の構成を有する入力経路を通して受信され得、発話分析が、オーディオの第３の部分に対して行われ得る。ある実施形態によると、方法７００を採用するシステムは、オーディオの追加の部分のために、入力経路の利得の調節を継続し得る。

図７の概略フロー図略図は、概して、論理フロー図略図として記載される。したがって、描写される順序および標識されるステップは、開示される方法の側面を示す。図示される方法の１つ以上のステップまたはその一部と機能、論理、または効果上均等物である他のステップおよび方法も、想起され得る。加えて、採用されるフォーマットおよび記号は、方法の論理ステップを説明するために提供され、方法の範囲を限定するものと理解されるものではない。種々の矢印タイプおよび線タイプが、フロー図略図において採用され得るが、それらは、対応する方法の範囲を限定するものと理解されるものではない。実際には、いくつかの矢印または他のコネクタは、方法の論理フローのみを示すために使用され得る。例えば、矢印は、描写される方法の列挙されたステップ間の規定されていない持続時間の待機または監視周期を示し得る。加えて、特定の方法が生じる順序は、示される対応するステップの順序に厳密に従っても、従わなくてもよい。

ファームウェアおよび／またはソフトウェア内に実装される場合、前述の機能は、コンピュータ読み取り可能な媒体上の１つ以上の命令もしくはコードとして記憶され得る。実施例として、データ構造でエンコードされた非一過性コンピュータ読み取り可能な媒体およびコンピュータプログラムでエンコードされたコンピュータ読み取り可能な媒体が挙げられる。コンピュータ読み取り可能な媒体は、物理的コンピュータ記憶媒体を含む。記憶媒体は、コンピュータによってアクセスされ得る、任意の利用可能な媒体であり得る。限定ではないが、一例として、そのようなコンピュータ読み取り可能な媒体として、ランダムアクセスメモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、電気的に消去可能なプログラマブル読み取り専用メモリ（ＥＥＰＲＯＭ）、コンパクトディスク読み取り専用メモリ（ＣＤ−ＲＯＭ）もしくは他の光ディスク記憶、磁気ディスク記憶もしくは他の磁気記憶デバイス、または所望のプログラムコードを命令もしくはデータ構造の形態で記憶するために使用され得、コンピュータによってアクセスされ得る、任意の他の媒体が挙げられ得る。ディスク（ｄｉｓｋおよびｄｉｓｃ）は、コンパクトディスク（ＣＤ）、レーザディスク、光学ディスク、デジタル多用途ディスク（ＤＶＤ）、フロッピー（登録商標）ディスク、およびＢｌｕ−ｒａｙ（登録商標）ディスクを含む。概して、ディスク（ｄｉｓｋ）は、データを磁気的に再生し、ディスク（ｄｉｓｃ）は、データを光学的に再生する。前述の組み合わせもまた、コンピュータ読み取り可能な媒体の範囲内に含まれるべきである。

コンピュータ読み取り可能な媒体上の記憶に加え、命令および／またはデータは、通信装置内に含まれる伝送媒体上の信号として提供され得る。例えば、通信装置は、命令およびデータを示す信号を有する、送受信機を含み得る。命令およびデータは、１つ以上のプロセッサに、請求項に概略された機能を実装させるように構成される。

本開示およびある代表的利点が詳細に説明されたが、種々の変更、代用、ならびに改変が、添付の請求項によって定義される本開示の精神および範囲から逸脱することなく、本明細書に成され得ることを理解されたい。さらに、本願の範囲は、明細書に説明されるプロセス、機械、製造、組成物、手段、方法、およびステップの特定の実施形態に限定されるものと意図されない。当業者が本開示から容易に理解するであろうように、本明細書に説明される対応する実施形態と実質的に同一機能を行う、または実質的に同一結果を達成する、現在既存である、もしくは後に開発される、プロセス、機械、製造、組成物、手段、方法、およびステップが、利用され得る。故に、添付の請求項は、その範囲内に、そのようなプロセス、機械、製造、組成物、手段、方法、およびステップを含むことが意図される。

Claims

方法であって、前記方法は、
第１の構成を有する音声アクティブ化システムの入力経路を通して、オーディオの第１の部分を受信することと、
前記オーディオの第１の部分の特性を決定することと、
前記決定された特性に少なくとも部分的に基づいて、前記入力経路を第２の構成に調節することと、
前記第２の構成を有する前記入力経路を通して、オーディオの第２の部分を受信することと、
前記オーディオの第２の部分に対して発話分析を行うことと
を含み、
前記入力経路を調節するステップは、前記入力経路の増幅器のための利得を前記第１の構成の第１の値から前記第２の構成のより高い第２の値に調節することを含み、
前記利得を調節するステップは、前記オーディオの第１の部分の信号レベルに少なくとも部分的に基づいて、前記利得を調節することにより、前記オーディオの第２の部分に対して発話分析を行うための前記入力経路内の所望の信号対雑音比（ＳＮＲ）を得ることを含む、方法。
前記入力経路を第２の構成に調節するステップは、前記入力経路のダイナミックレンジ（ＤＲ）を増加させることを含む、請求項１に記載の方法。
前記オーディオの第１の部分は、トリガコマンドを備え、前記オーディオの第２の部分は、命令コマンドを備えている、請求項１に記載の方法。
前記特性を決定するステップは、信号対雑音比（ＳＮＲ）、信号レベル、周波数成分のうちの少なくとも１つを決定することを含む、請求項１に記載の方法。
前記入力経路を調節するステップは、前記入力経路の利得、信号対雑音比（ＳＮＲ）、ダイナミックレンジのうちの少なくとも１つを調節することを含む、請求項１に記載の方法。
前記入力経路を調節するステップは、
前記入力経路の第１のアナログ／デジタルコンバータ（ＡＤＣ）を非アクティブにすることと、
前記入力経路の第２のアナログ／デジタルコンバータ（ＡＤＣ）をアクティブにすることと
を含む、請求項１に記載の方法。
前記第１のＡＤＣは、低電力低ダイナミックレンジＡＤＣを備え、前記第２のＡＤＣは、高電力高ダイナミックレンジＡＤＣを備えている、請求項６に記載の方法。
前記受信されたオーディオの第２の部分の特性に少なくとも部分的に基づいて、前記入力経路の利得を第３の構成に調節することと、
前記第３の構成を有する前記入力経路を通して、オーディオの第３の部分を受信することと、
前記オーディオの第３の部分に対して発話分析を行うことと、
オーディオの追加の部分のために、前記入力経路の利得の調節を継続することと
をさらに含む、請求項１に記載の方法。
前記入力経路を調節するステップは、前記入力経路のアナログ／デジタルコンバータ（ＡＤＣ）のための雑音床値を前記第１の構成のための第１の値から前記第２の構成のためのより低い第２の値に調節することを含む、請求項１に記載の方法。
前記雑音床値を調節するステップは、
前記アナログ／デジタルコンバータ（ＡＤＣ）内のレジスタの値を調節することと、
前記アナログ／デジタルコンバータ（ＡＤＣ）内のコンデンサの値を調節することと、
前記アナログ／デジタルコンバータ（ＡＤＣ）内を流れる電流の値を調節することと
のうちの少なくとも１つを含む、請求項９に記載の方法。
前記発話分析を行うステップは、デジタル信号プロセッサ（ＤＳＰ）を用いて発話分析を行うことを含む、請求項１に記載の方法。
装置であって、前記装置は、
マイクロホンと、
音声コマンドを受信するように構成され、オーディオ信号を前記マイクロホンから受信するように結合されている入力経路であって、前記入力経路は、アナログ／デジタルコンバータ（ＡＤＣ）を備えている、入力経路と、
前記入力経路に結合され、前記オーディオ信号のデジタル表現を受信するデジタル信号プロセッサ（ＤＳＰ）と
を備え、前記ＤＳＰは、
第１の構成を有する前記入力経路を通して、オーディオの第１の部分を受信することと、
前記オーディオの第１の部分の特性を決定することと、
前記決定された特性に少なくとも部分的に基づいて、前記入力経路を第２の構成に調節することと、
前記第２の構成を有する前記入力経路を通して、オーディオの第２の部分を受信することと
を行うように構成されており、
前記入力経路は、前記マイクロホンと前記アナログ／デジタルコンバータ（ＡＤＣ）との間に結合されている増幅器をさらに備え、前記入力経路を調節するステップは、前記入力経路の増幅器のための利得を前記第１の構成の第１の値から前記第２の構成のより高い第２の値に調節することを含み、
前記利得を調節するステップは、前記オーディオの第１の部分の信号レベルに少なくとも部分的に基づいて、前記利得を調節することにより、前記オーディオの第２の部分に対して発話分析を行うための前記入力経路内の所望の信号対雑音比（ＳＮＲ）を得ることを含む、装置。
前記デジタル信号プロセッサ（ＤＳＰ）は、前記入力経路のダイナミックレンジ（ＤＲ）を増加させることによって、前記入力経路を第２の構成に調節するように構成されている、請求項１２に記載の装置。
前記オーディオの第１の部分は、トリガコマンドを備え、前記オーディオの第２の部分は、命令コマンドを備えている、請求項１２に記載の装置。
前記入力経路は、第２のアナログ／デジタルコンバータ（ＡＤＣ）をさらに備え、前記ＤＳＰは、
前記入力経路の第１のアナログ／デジタルコンバータ（ＡＤＣ）を非アクティブにすることと、
前記入力経路の第２のアナログ／デジタルコンバータ（ＡＤＣ）をアクティブにすることと
によって、前記入力経路を調節するステップを行うように構成されている、請求項１２に記載の装置。
前記第１のＡＤＣは、低電力低ダイナミックレンジＡＤＣを備え、前記第２のＡＤＣは、高電力高ダイナミックレンジＡＤＣを備えている、請求項１５に記載の装置。
前記ＤＳＰは、
前記受信されたオーディオの第２の部分に少なくとも部分的に基づいて、前記入力経路の利得を第３の構成に調節することと、
前記第３の構成を有する前記入力経路を通して、オーディオの第３の部分を受信することと、
前記オーディオの第３の部分に対して発話分析を行うことと、
オーディオの追加の部分のために、前記入力経路の利得の調節を継続することと
を行うようにさらに構成されている、請求項１２に記載の装置。
前記入力経路を調節するステップは、前記入力経路のアナログ／デジタルコンバータ（ＡＤＣ）の雑音床値を前記第１の構成のための第１の値から前記第２の構成のためのより低い第２の値に調節することを含む、請求項１２に記載の装置。
前記雑音床値を調節するステップは、
前記アナログ／デジタルコンバータ（ＡＤＣ）内のレジスタの値を調節することと、
前記アナログ／デジタルコンバータ（ＡＤＣ）内のコンデンサの値を調節することと、
前記アナログ／デジタルコンバータ（ＡＤＣ）内を流れる電流の値を調節することと
のうちの少なくとも１つを含む、請求項１８に記載の装置。
前記ＤＳＰは、前記オーディオの第２の部分に対して発話分析を行うステップを行うようにさらに構成されている、請求項１２に記載の装置。
モバイルデバイスであって、前記モバイルデバイスは、
マイクロホンと、
前記マイクロホンに結合され、音声コマンドを備えているオーディオ信号を前記マイクロホンから受信するように構成されているオーディオ処理回路と
を備え、
前記オーディオ処理回路は、
アナログ／デジタルコンバータ（ＡＤＣ）と、
前記ＡＤＣに結合され、前記オーディオ信号のデジタル表現を受信するデジタル信号プロセッサ（ＤＳＰ）と
を備え、
前記オーディオ処理回路は、
前記オーディオ処理回路が第１の構成に構成されている間、オーディオの第１の部分を前記マイクロホンから受信することと、
前記オーディオの第１の部分の特性を決定することと、
前記決定された特性に少なくとも部分的に基づいて、前記オーディオ処理回路を第２の構成に調節することと、
前記オーディオ処理回路が第２の構成に構成されている間、オーディオの第２の部分を前記マイクロホンを通して受信することと
を行うように構成されており、
前記オーディオ処理回路は、前記マイクロホンと前記アナログ／デジタルコンバータ（ＡＤＣ）との間に結合されている増幅器をさらに備え、前記オーディオ処理回路を調節するステップは、前記オーディオ処理回路の増幅器のための利得を前記第１の構成の第１の値から前記第２の構成のより高い第２の値に調節することを含み、
前記利得を調節するステップは、前記オーディオの第１の部分の信号レベルに少なくとも部分的に基づいて、前記利得を調節することにより、前記オーディオの第２の部分に対して発話分析を行うための前記オーディオ処理回路内の所望の信号対雑音比（ＳＮＲ）を得ることを含む、モバイルデバイス。
前記オーディオ処理回路は、前記オーディオ処理回路のダイナミックレンジ（ＤＲ）を増加させることによって、前記オーディオ処理回路を第２の構成に調節するように構成されている、請求項２１に記載のモバイルデバイス。
前記オーディオの第１の部分は、トリガコマンドを備え、前記オーディオの第２の部分は、命令コマンドを備えている、請求項２１に記載のモバイルデバイス。
前記オーディオ処理回路は、第２のアナログ／デジタルコンバータ（ＡＤＣ）をさらに備え、前記ＤＳＰは、
前記オーディオ処理回路のアナログ／デジタルコンバータ（ＡＤＣ）を非アクティブにすることと、
前記オーディオ処理回路の第２のアナログ／デジタルコンバータ（ＡＤＣ）をアクティブにすること
によって、前記オーディオ処理回路を調節するステップを行うように構成されている、請求項２１に記載のモバイルデバイス。
前記ＡＤＣは、低電力低ダイナミックレンジＡＤＣを備え、前記第２のＡＤＣは、高電力高ダイナミックレンジＡＤＣを備えている、請求項２４に記載のモバイルデバイス。
前記オーディオ処理回路は、
前記受信されたオーディオの第２の部分に少なくとも部分的に基づいて、前記増幅器の利得を第３の構成に調節するステップと、
前記利得が前記第３の構成に設定されている間、オーディオの第３の部分を受信するステップと、
前記オーディオの第３の部分に対して発話分析を行うステップと、
オーディオの追加の部分のために、前記増幅器の利得の調節を継続するステップと
を行うようにさらに構成されている、請求項２１に記載のモバイルデバイス。
前記オーディオ処理回路を調節するステップは、前記オーディオ処理回路のアナログ／デジタルコンバータ（ＡＤＣ）のための雑音床値を前記第１の構成のための第１の値から前記第２の構成のためのより低い第２の値に調節することを含む、請求項２１に記載のモバイルデバイス。
前記オーディオ処理回路は、可変レジスタおよび可変コンデンサのうちの少なくとも１つを備え、前記オーディオ処理回路は、
前記アナログ／デジタルコンバータ（ＡＤＣ）内のレジスタの値を調節するステップと、
前記アナログ／デジタルコンバータ（ＡＤＣ）内のコンデンサの値を調節するステップと、
前記アナログ／デジタルコンバータ（ＡＤＣ）内を流れる電流の値を調節するステップと
のうちの少なくとも１つを行うことによって、前記雑音床値を調節するように構成されている、請求項２７に記載のモバイルデバイス。
前記オーディオ処理回路は、前記オーディオの第２の部分に対して発話分析を行うステップを行うようにさらに構成されている、請求項２１に記載のモバイルデバイス。
前記デジタル信号プロセッサ（ＤＳＰ）は、前記モバイルデバイスの汎用中央処理ユニット（ＣＰＵ）の一部を備えている、請求項２１に記載のモバイルデバイス。