JP6517365B2 - 音声アクティブ化システムのためのアナログ/デジタルコンバータ(adc)ダイナミックレンジ拡張 - Google Patents

音声アクティブ化システムのためのアナログ/デジタルコンバータ(adc)ダイナミックレンジ拡張 Download PDF

Info

Publication number
JP6517365B2
JP6517365B2 JP2017555693A JP2017555693A JP6517365B2 JP 6517365 B2 JP6517365 B2 JP 6517365B2 JP 2017555693 A JP2017555693 A JP 2017555693A JP 2017555693 A JP2017555693 A JP 2017555693A JP 6517365 B2 JP6517365 B2 JP 6517365B2
Authority
JP
Japan
Prior art keywords
audio
adc
input path
adjusting
configuration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2017555693A
Other languages
English (en)
Other versions
JP2018518096A (ja
Inventor
ユーソフ モルタザビ,
ユーソフ モルタザビ,
ラミン ザンバギー,
ラミン ザンバギー,
アーロン ブレナン,
アーロン ブレナン,
ジョン エル. メランソン,
ジョン エル. メランソン,
Original Assignee
シーラス ロジック インターナショナル セミコンダクター リミテッド
シーラス ロジック インターナショナル セミコンダクター リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by シーラス ロジック インターナショナル セミコンダクター リミテッド, シーラス ロジック インターナショナル セミコンダクター リミテッド filed Critical シーラス ロジック インターナショナル セミコンダクター リミテッド
Publication of JP2018518096A publication Critical patent/JP2018518096A/ja
Application granted granted Critical
Publication of JP6517365B2 publication Critical patent/JP6517365B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M3/00Conversion of analogue values to or from differential modulation
    • H03M3/30Delta-sigma modulation
    • H03M3/39Structural details of delta-sigma modulators, e.g. incremental delta-sigma modulators
    • H03M3/436Structural details of delta-sigma modulators, e.g. incremental delta-sigma modulators characterised by the order of the loop filter, e.g. error feedback type
    • H03M3/438Structural details of delta-sigma modulators, e.g. incremental delta-sigma modulators characterised by the order of the loop filter, e.g. error feedback type the modulator having a higher order loop filter in the feedforward path
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M1/00Analogue/digital conversion; Digital/analogue conversion
    • H03M1/12Analogue/digital converters
    • H03M1/18Automatic control for modifying the range of signals the converter can handle, e.g. gain ranging
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/34Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • G10L21/034Automatic adjustment
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M1/00Analogue/digital conversion; Digital/analogue conversion
    • H03M1/004Reconfigurable analogue/digital or digital/analogue converters
    • H03M1/007Reconfigurable analogue/digital or digital/analogue converters among different resolutions
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M1/00Analogue/digital conversion; Digital/analogue conversion
    • H03M1/06Continuously compensating for, or preventing, undesired influence of physical parameters
    • H03M1/08Continuously compensating for, or preventing, undesired influence of physical parameters of noise
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M1/00Analogue/digital conversion; Digital/analogue conversion
    • H03M1/12Analogue/digital converters
    • H03M1/18Automatic control for modifying the range of signals the converter can handle, e.g. gain ranging
    • H03M1/181Automatic control for modifying the range of signals the converter can handle, e.g. gain ranging in feedback mode, i.e. by determining the range to be selected from one or more previous digital output values
    • H03M1/183Automatic control for modifying the range of signals the converter can handle, e.g. gain ranging in feedback mode, i.e. by determining the range to be selected from one or more previous digital output values the feedback signal controlling the gain of an amplifier or attenuator preceding the analogue/digital converter
    • H03M1/185Automatic control for modifying the range of signals the converter can handle, e.g. gain ranging in feedback mode, i.e. by determining the range to be selected from one or more previous digital output values the feedback signal controlling the gain of an amplifier or attenuator preceding the analogue/digital converter the determination of the range being based on more than one digital output value, e.g. on a running average, a power estimation or the rate of change
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M3/00Conversion of analogue values to or from differential modulation
    • H03M3/30Delta-sigma modulation
    • H03M3/458Analogue/digital converters using delta-sigma modulation as an intermediate step
    • H03M3/478Means for controlling the correspondence between the range of the input signal and the range of signals the converter can handle; Means for out-of-range indication
    • H03M3/488Means for controlling the correspondence between the range of the input signal and the range of signals the converter can handle; Means for out-of-range indication using automatic control
    • H03M3/49Means for controlling the correspondence between the range of the input signal and the range of signals the converter can handle; Means for out-of-range indication using automatic control in feedback mode, i.e. by determining the range to be selected from one or more previous digital output values
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M1/00Analogue/digital conversion; Digital/analogue conversion
    • H03M1/12Analogue/digital converters
    • H03M1/60Analogue/digital converters with intermediate conversion to frequency of pulses

Description

(関連出願の引用)
本願は、米国特許出願第14/696,172号(2015年4月24日出願、Yousof Mortazavi、他、名称「Analog−to−Digital Converter Dynamic Range Enhancement for Voice−Activated Systems」)に対する優先権を主張する。上記出願の全ては、その全体が参照により本明細書に引用される。
(開示の分野)
本開示は、アナログ/デジタルコンバータ(ADC)に関する。より具体的には、本開示の一部は、音声アクティブ化システムにおけるADCのダイナミックレンジ(DR)拡張に関する。
従来の音声アクティブ化システムでは、オーディオサンプルが、ヒトの音声活動の存在を検出するように監視および処理される。ヒトの音声活動が検出された後、ヒトの音声のオーディオサンプルはさらに、発話処理技法を介して処理される。典型的には、特定の単語または語句の発声が、ヒトの音声活動の監視から発話処理の実施へのシステムの移行をトリガする。例えば、ヒトは、以下のように発声し得る。「Blue Genie、現在の気温は?」この例では、「Blue Genie」は、「トリガ」であり、残りは、「コマンド」である。したがって、従来の音声アクティブ化システムは、オーディオサンプルを監視し、トリガ語句「Blue Genie」を検出するであろう。トリガ語句が検出された後、ヒトの音声によって発声される任意の単語が、続いて、音声アクティブ化システムによって発話処理される。
1つの従来の実装は、単一の高性能ADCを使用して、トリガおよびコマンドを含む全ての発話を処理する。しかしながら、この実装は、多数の欠点を有する。例えば、高信号対雑音比(SNR)要件を常時満たすようにADCを設計し、動作させることは、高電力消費、したがって、短縮されたバッテリ寿命をもたらす。携帯電話等のデバイスでは、音声アクティブ化制御は、多くの場合、電子システムを制御する一次手段ではない。したがって、発声される単語の監視に消費される電力は、モバイルデバイスのユーザに限定された利益を提供する。
ここで述べられた短所は、代表的にすぎず、特に、携帯電話等の消費者レベルデバイス内で採用される音声アクティブ化システムにおけるADCおよび発話検出のための改良された電気コンポーネントの必要性が存在することを単に強調するために含まれる。本明細書に説明される実施形態は、ある一定の短所に対処するが、必ずしも、ここで説明される、または当技術分野において公知のあらゆるものに対処するものではない。
音声コマンド等のオーディオ信号を受信するための再構成可能入力経路が、オーディオ信号を処理することにおいて、より低い電力消費および類似性能を提供し得る。例えば、音声アクティブ化システム内のADCの低電力DR拡張が、受信されたオーディオサンプルの分析に基づいて、音声アクティブ化システムのコンポーネントの動作性能を動的に調節することによって達成され得る。例えば、音声アクティブ化システムが、ヒトの音声活動のためにオーディオサンプルを監視している間、音声アクティブ化システム内のADCは、低電力状態で動作させられ得る。トリガが検出された後、オーディオ信号品質が、発話処理をオーディオサンプルに行うために十分ではない場合、ADCは、より高い性能状態で動作するように調節され得る。例えば、オーディオサンプルのSNRが、低すぎて、発話処理のために要求されるSNRを満たすことができない場合、ADCは、発話が検出された後、再構成され得る。オーディオサンプルがヒトの音声活動のために監視されているにすぎない間ではなく、オーディオサンプルが発話処理を要求するときのみ、ADCが高性能状態で動作させられると、電力効率は、増加させられ得、DRも、改良され得る。
電力効率は、有意な時間量にわたって入力経路が低電力(例えば、低DR)動作モードで動作し得るので、向上し得る。音声アクティブ化を提供する電子デバイスは、発話処理を発声された単語に行うよりも頻繁に、オーディオサンプルを監視し、ヒトの音声活動を検出する。再構成可能入力経路を用いないと、ADCは、この時間全体の間、高SNRで動作し、音声アクティブ化システムにコマンドの監視に必要なものより多くの電力を消費させるであろう。この結果は、音声アクティブ化システムがモバイルデバイス内に実装されるとき、不必要な電力消費がモバイルデバイスのバッテリ寿命を短縮し、バッテリのより頻繁な充電を要求し、両方とも、モバイルデバイスに関するユーザ満足を低下させるので、特に望ましくない。より低い電力消費を提供するための1つの解決策は、トリガを監視する間、SNRを低減させること、そうでなければ、ADCにおけるオーディオ処理電力を低減させることである。
トリガの検出に先立って監視されるオーディオサンプルは、高性能発話処理ソフトウェアルーチンを用いずに処理されることができる。したがって、音声アクティブ化システム内のコンポーネントのための性能要件は、オーディオサンプルがヒトの音声活動を検出するために処理されるべきときと、オーディオサンプルが発話処理技法を介して処理されるべきときとでは異なる。例えば、音声アクティブ化システム内のADCのための最小信号対雑音比(SNR)要件は、オーディオサンプルがヒトの音声活動を検出するために処理されるべきとき、オーディオサンプルが発話処理技法を介して処理されるべきときより低くあり得る。しかしながら、従来の音声アクティブ化システムは、単一ADCを用いて全オーディオサンプルを処理するので、ADCは、常時、最高SNR要件を満たすように設計および動作させられる。
一実施形態によると、音声アクティブ化システム内のADCの低電力DR拡張のための方法は、第1の構成を有する入力経路を通して、オーディオの第1の部分を受信すること、オーディオの第1の部分の特性を決定すること、少なくとも部分的に、決定された特性に基づいて、入力経路を第2の構成に調節すること、第2の構成を有する入力経路を通して、オーディオの第2の部分を受信すること、および/またはオーディオの第2の部分に対して発話分析を行うことを含み得る。いくつかの実施形態では、発話分析を行うステップは、デジタル信号プロセッサ(DSP)を用いて発話分析を行うことを含む。
ある実施形態では、オーディオの第1の部分は、トリガコマンドを備え、オーディオの第2の部分は、命令コマンドを備えている。加えて、いくつかの実施形態では、特性を決定するステップは、SNR、信号レベル、および周波数成分のうちの少なくとも1つを決定することを含む。
いくつかの実施形態では、入力経路を調節することは、入力経路の利得、SNR、およびダイナミックレンジのうちの少なくとも1つを調節することを含む。特に、一実施形態によると、入力経路を調節することは、入力経路の増幅器のための利得を第1の構成の第1の値から第2の構成のより高い第2の値に調節することを含む。いくつかの実施形態では、利得を調節することは、少なくとも部分的に、オーディオの第1の部分の信号レベルに基づいて、利得を調節し、いくつかの実施形態では、命令コマンドを備え得るオーディオの第2の部分に対して発話分析を行うための入力経路内の所望のSNRを得ることを含む。
他の実施形態では、入力経路を調節することは、入力経路のADCのための雑音床値を第1の構成の第1の値部分から第2の構成のより低い第2の値部分に調節することを含み得る。例えば、一実施形態によると、雑音床値を調節することは、ADC内のレジスタの値を調節することと、ADC内のコンデンサの値を調節することと、ADC内を流れる電流の値を調節することのうちの少なくとも1つを含み得る。
別の実施形態によると、入力経路を調節することは、入力経路の第1のADCを非アクティブにすることと、入力経路の第2のADCをアクティブにすることとも含み得る。いくつかの実施形態では、第1のADCは、その利得段において最小限の信号増幅を伴う低電力低ダイナミックレンジ(DR)ADCであり得、第2のADCは、その利得段において第1のADCより多くの信号増幅を伴う高電力高DR ADCであり得る。電力は、第1および第2のADCに関して言及されるが、第1および第2のADCは、類似増幅能力を有し得る。低電力第1のADCは、より高い電力の第2のADCと比較して、ダイナミックレンジを低下させることによって得られ得る。
ある実施形態では、方法は、少なくとも部分的に、受信されたオーディオの第2の部分の特性に基づいて、入力経路の利得を第3の構成に調節すること、第3の構成を有する入力経路を通して、オーディオの第3の部分を受信すること、オーディオの第3の部分に対して発話分析を行うこと、および/またはオーディオの追加の部分のために、入力経路の利得の調節を継続することも含み得る。
別の実施形態によると、装置は、マイクロホン、オーディオ信号をマイクロホンから受信するように結合されている入力経路であって、ADCを備えている入力経路、および/または入力経路に結合され、オーディオ信号のデジタル表現を受信するDSPを含み得、DSPは、第1の構成を有する入力経路を通して、オーディオの第1の部分を受信すること、オーディオの第1の部分の特性を決定すること、少なくとも部分的に、決定された特性に基づいて、入力経路を第2の構成に調節すること、および/または第2の構成を有する入力経路を通して、オーディオの第2の部分を受信することを行うように構成される。いくつかの実施形態では、DSPは、オーディオの第2の部分に対して発話分析を行うことを行うようにさらに構成される。
いくつかの実施形態では、入力経路は、マイクロホンとADCとの間に結合されている増幅器をさらに備え、入力経路を調節するステップは、入力経路の増幅器のための利得を第1の構成の第1の値から第2の構成のより高い第2の値に調節することを含む。一実施形態では、利得を調節するステップは、少なくとも部分的に、オーディオの第1の部分の信号レベルに基づいて、利得を調節し、オーディオの第2の部分に対して発話分析を行うための入力経路内の所望のSNRを得ることを含む。
ある実施形態によると、入力経路を調節するステップは、入力経路のADCの雑音床値を第1の構成のための第1の値から第2の構成のためのより低い第2の値に調節することを含む。一実施形態では、雑音床値を調節するステップは、ADC内のレジスタの値を調節することと、ADC内のコンデンサの値を調節することと、ADC内を流れる電流の値を調節することとのうちの少なくとも1つを含む。
ある実施形態による、入力経路は、第2のADCをさらに備え、DSPは、入力経路の第1のADCを非アクティブにし、入力経路の第2のADCをアクティブにすることによって、入力経路を調節するステップを行うように構成される。一実施形態では、第1のADCは、低電力低ダイナミックレンジADCを備え、第2のADCは、高電力高ダイナミックレンジADCを備えている。
ある実施形態では、DSPは、少なくとも部分的に、受信されたオーディオの第2の部分に基づいて、入力経路の利得を第3の構成に調節すること、第3の構成を有する入力経路を通して、オーディオの第3の部分を受信すること、オーディオの第3の部分に対して発話分析を行うこと、および/またはオーディオの追加の部分のために、入力経路の利得の調節を継続することを行うようにさらに構成される。
別の実施形態によると、モバイルデバイスは、マイクロホンと、マイクロホンに結合され、オーディオ信号をマイクロホンから受信するように構成されているオーディオ処理回路とを含み得る。いくつかの実施形態では、オーディオ処理回路は、アナログ/デジタルコンバータ(ADC)、および/またはADCに結合され、オーディオ信号のデジタル表現を受信するデジタル信号プロセッサ(DSP)を備え、オーディオ処理回路は、オーディオ処理回路が第1の構成に構成されている間、オーディオの第1の部分をマイクロホンから受信すること、オーディオの第1の部分の特性を決定すること、少なくとも部分的に、決定された特性に基づいて、オーディオ処理回路を第2の構成に調節すること、および/またはオーディオ処理回路が第2の構成に構成されている間、オーディオの第2の部分をマイクロホンを通して受信することを行うように構成される。
いくつかの実施形態では、オーディオ処理回路は、マイクロホンとADCとの間に結合されている増幅器をさらに備え、入力経路を調節するステップは、入力経路の増幅器のための利得を第1の構成の第1の値から第2の構成のより高い第2の値に調節することを含む。一実施形態では、利得を調節するステップは、少なくとも部分的に、オーディオの第1の部分の信号レベルに基づいて、利得を調節し、オーディオの第2の部分に対して発話分析を行うための入力経路内の所望のSNRを得ることを含む。
別の実施形態では、入力経路を調節するステップは、入力経路のADCのための雑音床値を第1の構成のための第1の値から第2の構成のためのより低い第2の値に調節することを含む。例えば、一実施形態では、オーディオ処理回路は、可変レジスタおよび可変コンデンサのうちの少なくとも1つを備え得、オーディオ処理回路は、ADC内のレジスタの値を調節することと、ADC内のコンデンサの値を調節することと、ADC内を流れる電流の値を調節することとのうちの少なくとも1つを行うことによって、雑音床値を調節するように構成される。
いくつかの実施形態では、入力経路は、第2のADCをさらに備え、DSPは、入力経路のアナログ/デジタルコンバータ(ADC)を非アクティブにし、入力経路の第2のアナログ/デジタルコンバータ(ADC)をアクティブにすることによって、入力経路を調節するステップを行うように構成される。一実施形態では、ADCは、低電力低ダイナミックレンジADCを備え、第2のADCは、高電力高ダイナミックレンジADCを備えている。
ある実施形態では、オーディオ処理回路は、少なくとも部分的に、受信されたオーディオの第2の部分に基づいて、増幅器の利得を第3の構成に調節するステップと、利得が第3の構成に設定されている間、オーディオの第3の部分を受信するステップと、オーディオの第3の部分に対して発話分析を行うステップと、オーディオの追加の部分のために、増幅器の利得の調節を継続するステップとを行うようにさらに構成される。
いくつかの実施形態では、オーディオ処理回路はさらに、オーディオの第2の部分に対して発話分析を行うステップを行うように構成される。加えて、一実施形態では、DSPは、モバイルデバイスの汎用中央処理ユニット(CPU)の一部を構成する。
前述は、以下の発明を実施するための形態がより深く理解され得るために、本発明の実施形態のある特徴および技術的利点をかなり広義に概略している。本発明の請求項の主題を形成する、追加の特徴および利点は、本明細書に後述されるであろう。開示される概念および具体的実施形態は、同一または類似目的を果たすための他の構造を修正もしくは設計するための基礎として容易に利用され得ることが、当業者によって理解されるはずである。そのような均等物構造が添付の請求項に記載される本発明の精神および範囲から逸脱しないことも、当業者によって認識されるはずである。追加の特徴は、付随の図と併せて検討されるとき、以下の説明からより深く理解されるであろう。しかしながら、図の各々は、例証および説明の目的のためだけに提供されており、本発明を限定することを意図するものではないことは、明示的に理解されたい。
例えば、本願は以下の項目を提供する。
(項目1)
方法であって、前記方法は、
第1の構成を有する音声アクティブ化システムの入力経路を通して、オーディオの第1の部分を受信することと、
前記オーディオの第1の部分の特性を決定することと、
前記決定された特性に少なくとも部分的に基づいて、前記入力経路を第2の構成に調節することと、
前記第2の構成を有する前記入力経路を通して、オーディオの第2の部分を受信することと、
前記オーディオの第2の部分に対して発話分析を行うことと
を含む、方法。
(項目2)
前記入力経路を第2の構成に調節するステップは、前記入力経路のダイナミックレンジ(DR)を増加させることを含む、項目1に記載の方法。
(項目3)
前記オーディオの第1の部分は、トリガコマンドを備え、前記オーディオの第2の部分は、命令コマンドを備えている、項目1に記載の方法。
(項目4)
前記特性を決定するステップは、信号対雑音比(SNR)、信号レベル、および周波数成分のうちの少なくとも1つを決定することを含む、項目1に記載の方法。
(項目5)
前記入力経路を調節するステップは、前記入力経路の利得、信号対雑音比(SNR)、およびダイナミックレンジのうちの少なくとも1つを調節することを含む、項目1に記載の方法。
(項目6)
前記入力経路を調節するステップは、
前記入力経路の第1のアナログ/デジタルコンバータ(ADC)を非アクティブにすることと、
前記入力経路の第2のアナログ/デジタルコンバータ(ADC)をアクティブにすることと
を含む、項目1に記載の方法。
(項目7)
前記第1のADCは、低電力低ダイナミックレンジADCを備え、前記第2のADCは、高電力高ダイナミックレンジADCを備えている、項目6に記載の方法。
(項目8)
前記入力経路を調節するステップは、前記入力経路の増幅器のための利得を前記第1の構成の第1の値から前記第2の構成のより高い第2の値に調節することを含む、項目1に記載の方法。
(項目9)
前記利得を調節するステップは、前記オーディオの第1の部分の信号レベルに少なくとも部分的に基づいて、前記利得を調節し、前記オーディオの第2の部分に対して発話分析を行うための前記入力経路内の所望の信号対雑音比(SNR)を得ることを含む、項目8に記載の方法。
(項目10)
前記受信されたオーディオの第2の部分の特性に少なくとも部分的に基づいて、前記入力経路の利得を第3の構成に調節することと、
前記第3の構成を有する前記入力経路を通して、オーディオの第3の部分を受信することと、
前記オーディオの第3の部分に対して発話分析を行うことと、
オーディオの追加の部分のために、前記入力経路の利得の調節を継続することと
をさらに含む、項目8に記載の方法。
(項目11)
前記入力経路を調節するステップは、前記入力経路のアナログ/デジタルコンバータ(ADC)のための雑音床値を前記第1の構成のための第1の値から前記第2の構成のためのより低い第2の値に調節することを含む、項目1に記載の方法。
(項目12)
前記雑音床値を調節するステップは、
前記アナログ/デジタルコンバータ(ADC)内のレジスタの値を調節することと、
前記アナログ/デジタルコンバータ(ADC)内のコンデンサの値を調節することと、
前記アナログ/デジタルコンバータ(ADC)内を流れる電流の値を調節することと
のうちの少なくとも1つを含む、項目11に記載の方法。
(項目13)
前記発話分析を行うステップは、デジタル信号プロセッサ(DSP)を用いて発話分析を行うことを含む、項目1に記載の方法。
(項目14)
装置であって、前記装置は、
マイクロホンと、
音声コマンドを受信するように構成され、オーディオ信号を前記マイクロホンから受信するように結合されている入力経路であって、前記入力経路は、アナログ/デジタルコンバータ(ADC)を備えている、入力経路と、
前記入力経路に結合され、前記オーディオ信号のデジタル表現を受信するデジタル信号プロセッサ(DSP)と
を備え、前記DSPは、
第1の構成を有する前記入力経路を通して、オーディオの第1の部分を受信することと、
前記オーディオの第1の部分の特性を決定することと、
前記決定された特性に少なくとも部分的に基づいて、前記入力経路を第2の構成に調節することと、
前記第2の構成を有する前記入力経路を通して、オーディオの第2の部分を受信することと
を行うように構成されている、装置。
(項目15)
前記デジタル信号プロセッサ(DSP)は、前記入力経路のダイナミックレンジ(DR)を増加させることによって、前記入力経路を第2の構成に調節するように構成されている、項目14に記載の装置。
(項目16)
前記オーディオの第1の部分は、トリガコマンドを備え、前記オーディオの第2の部分は、命令コマンドを備えている、項目14に記載の装置。
(項目17)
前記入力経路は、第2のアナログ/デジタルコンバータ(ADC)をさらに備え、前記DSPは、
前記入力経路の第1のアナログ/デジタルコンバータ(ADC)を非アクティブにすることと、
前記入力経路の第2のアナログ/デジタルコンバータ(ADC)をアクティブにすることと
によって、前記入力経路を調節するステップを行うように構成されている、項目14に記載の装置。
(項目18)
前記第1のADCは、低電力低ダイナミックレンジADCを備え、前記第2のADCは、高電力高ダイナミックレンジADCを備えている、項目17に記載の装置。
(項目19)
前記入力経路は、前記マイクロホンと前記アナログ/デジタルコンバータ(ADC)との間に結合されている増幅器をさらに備え、前記入力経路を調節するステップは、前記入力経路の増幅器のための利得を前記第1の構成の第1の値から前記第2の構成のより高い第2の値に調節することを含む、項目14に記載の装置。
(項目20)
前記利得を調節するステップは、前記オーディオの第1の部分の信号レベルに少なくとも部分的に基づいて、前記利得を調節し、前記オーディオの第2の部分に対して発話分析を行うための前記入力経路内の所望の信号対雑音比(SNR)を得ることを含む、項目19に記載の装置。
(項目21)
前記DSPは、
前記受信されたオーディオの第2の部分に少なくとも部分的に基づいて、前記入力経路の利得を第3の構成に調節することと、
前記第3の構成を有する前記入力経路を通して、オーディオの第3の部分を受信することと、
前記オーディオの第3の部分に対して発話分析を行うことと、
オーディオの追加の部分のために、前記入力経路の利得の調節を継続することと
を行うようにさらに構成されている、項目19に記載の装置。
(項目22)
前記入力経路を調節するステップは、前記入力経路のアナログ/デジタルコンバータ(ADC)の雑音床値を前記第1の構成のための第1の値から前記第2の構成のためのより低い第2の値に調節することを含む、項目14に記載の装置。
(項目23)
前記雑音床値を調節するステップは、
前記アナログ/デジタルコンバータ(ADC)内のレジスタの値を調節することと、
前記アナログ/デジタルコンバータ(ADC)内のコンデンサの値を調節することと、
前記アナログ/デジタルコンバータ(ADC)内を流れる電流の値を調節することと
のうちの少なくとも1つを含む、項目22に記載の装置。
(項目24)
前記DSPは、前記オーディオの第2の部分に対して発話分析を行うステップを行うようにさらに構成されている、項目14に記載の装置。
(項目25)
モバイルデバイスであって、前記モバイルデバイスは、
マイクロホンと、
前記マイクロホンに結合され、音声コマンドを備えているオーディオ信号を前記マイクロホンから受信するように構成されているオーディオ処理回路と
を備え、
前記オーディオ処理回路は、
アナログ/デジタルコンバータ(ADC)と、
前記ADCに結合され、前記オーディオ信号のデジタル表現を受信するデジタル信号プロセッサ(DSP)と
を備え、
前記オーディオ処理回路は、
前記オーディオ処理回路が第1の構成に構成されている間、オーディオの第1の部分を前記マイクロホンから受信することと、
前記オーディオの第1の部分の特性を決定することと、
前記決定された特性に少なくとも部分的に基づいて、前記オーディオ処理回路を第2の構成に調節することと、
前記オーディオ処理回路が第2の構成に構成されている間、オーディオの第2の部分を前記マイクロホンを通して受信することと
を行うように構成されている、モバイルデバイス。
(項目26)
前記オーディオ処理回路は、前記入力経路のダイナミックレンジ(DR)を増加させることによって、前記入力経路を第2の構成に調節するように構成されている、項目25に記載のモバイルデバイス。
(項目27)
前記オーディオの第1の部分は、トリガコマンドを備え、前記オーディオの第2の部分は、命令コマンドを備えている、項目25に記載のモバイルデバイス。
(項目28)
前記入力経路は、第2のアナログ/デジタルコンバータ(ADC)をさらに備え、前記DSPは、
前記入力経路のアナログ/デジタルコンバータ(ADC)を非アクティブにすることと、
前記入力経路の第2のアナログ/デジタルコンバータ(ADC)をアクティブにすること
によって、前記入力経路を調節するステップを行うように構成されている、項目25に記載のモバイルデバイス。
(項目29)
前記ADCは、低電力低ダイナミックレンジADCを備え、前記第2のADCは、高電力高ダイナミックレンジADCを備えている、項目28に記載のモバイルデバイス。
(項目30)
前記オーディオ処理回路は、前記マイクロホンと前記アナログ/デジタルコンバータ(ADC)との間に結合されている増幅器をさらに備え、前記入力経路を調節するステップは、前記入力経路の増幅器のための利得を前記第1の構成の第1の値から前記第2の構成のより高い第2の値に調節することを含む、項目25に記載のモバイルデバイス。
(項目31)
前記利得を調節するステップは、前記オーディオの第1の部分の信号レベルに少なくとも部分的に基づいて、前記利得を調節し、前記オーディオの第2の部分に対して発話分析を行うための前記入力経路内の所望の信号対雑音比(SNR)を得ることを含む、項目30に記載のモバイルデバイス。
(項目32)
前記オーディオ処理回路は、
前記受信されたオーディオの第2の部分に少なくとも部分的に基づいて、前記増幅器の利得を第3の構成に調節するステップと、
前記利得が前記第3の構成に設定されている間、オーディオの第3の部分を受信するステップと、
前記オーディオの第3の部分に対して発話分析を行うステップと、
オーディオの追加の部分のために、前記増幅器の利得の調節を継続するステップと
を行うようにさらに構成されている、項目31に記載のモバイルデバイス。
(項目33)
前記入力経路を調節するステップは、前記入力経路のアナログ/デジタルコンバータ(ADC)のための雑音床値を前記第1の構成のための第1の値から前記第2の構成のためのより低い第2の値に調節することを含む、項目25に記載のモバイルデバイス。
(項目34)
前記オーディオ処理回路は、可変レジスタおよび可変コンデンサのうちの少なくとも1つを備え、前記オーディオ処理回路は、
前記アナログ/デジタルコンバータ(ADC)内のレジスタの値を調節するステップと、
前記アナログ/デジタルコンバータ(ADC)内のコンデンサの値を調節するステップと、
前記アナログ/デジタルコンバータ(ADC)内を流れる電流の値を調節するステップと
のうちの少なくとも1つを行うことによって、前記雑音床値を調節するように構成されている、項目33に記載のモバイルデバイス。
(項目35)
前記オーディオ処理回路は、前記オーディオの第2の部分に対して発話分析を行うステップを行うようにさらに構成されている、項目25に記載のモバイルデバイス。
(項目36)
前記デジタル信号プロセッサ(DSP)は、前記モバイルデバイスの汎用中央処理ユニット(CPU)の一部を備えている、項目25に記載のモバイルデバイス。
開示されるシステムおよび方法のより完全な理解のために、ここで、添付の図面と併せて検討される、以下の説明を参照する。
図1は、本開示の一実施形態による、DR拡張ADCを伴う音声アクティブ化システムを図示する例示的概略ブロック図である。 図2は、本開示の一実施形態による、トリガを検出するため、かつ発話処理を行うためのオーディオ信号品質要件間の区別の例示的振幅対周波数プロット図である。 図3は、本開示の一実施形態による、調節可能持続時間デルタ−シグマ変調ADCを図示する例示的概略ブロック図である。 図4は、本開示の一実施形態による、調節可能二重経路入力を図示する例示的概略ブロック図である。 図5は、本開示の一実施形態による、調節可能入力経路によって達成される性能改良を図示する例示的振幅対周波数プロットである。 図6は、本開示の一実施形態による、音声アクティブ化システムによって処理されているオーディオ信号の振幅を低減させるための別の音声アクティブ化システムを図示する例示的概略ブロック図である。 図7は、本開示の一実施形態による、音声アクティブ化システムの低電力DR拡張のための方法を図示する例示的フロー図である。
ダイナミックレンジ(DR)拡張低電力アナログ/デジタルコンバータ(ADC)を伴う音声アクティブ化システムの一実施形態が、図1の概略ブロック図に図示される。電子システム100は、マイクロホン102と、プログラムマブル利得増幅器(PGA)104と、ADC106と、バッファ108と、デジタル信号プロセッサ(DSP)110と、コンピューティングネットワーク112とを含み得る。アナログコンポーネント104および106と、デジタルコンポーネント108および110とは、音声アクティブ化システム等の混合信号システム114内に統合され得る。いくつかの実施形態では、マイクロホン102は、音声アクティブ化システム114の一部であり得る一方、他の実施形態では、マイクロホン102は、音声アクティブ化システム114の外部にあり得る。コンピューティングネットワーク112は、ネットワーク化されたコンピュータおよびデータセンタの「クラウド」であり得る。いくつかの実施形態では、コンピューティングネットワーク112は、発話から変換されたテキストを記憶するため等、データ記憶のために、混合信号システム114によってアクセスされ得る。他の実施形態では、コンピューティングネットワーク112は、電子システム100が記録されたオーディオをコンピューティングネットワーク112に伝送し、返される文字化されたテキストを受信するように、発話の部分を処理するために、電子システム100によってアクセスされ得る。図1は、PGA104およびADC106を2つの別個のコンポーネントとして図示するが、いくつかの実施形態では、PGA104およびADC106は、単一コンポーネント116として設計され、動作させられ得る。統合されても、PGA104およびADC106を含む、単一コンポーネントは、依然として、ADCと称され得る。
音声アクティブ化システム114が発話処理を行っていないとき等、音声アクティブ化システム114がアイドルであるとき、音声アクティブ化システム114は、オーディオサンプルを持続的に処理し、ヒトの音声活動を検出する音声活動検出モードで動作し得る。例えば、マイクロホン102によって検出されたオーディオ信号は、PGA104および低電力ADC106に転送され、アナログオーディオ信号をデジタルオーディオ信号に変換し得る。マイクロホン102、PGA104、およびADC106は、ほぼ常時、オンであり、ユーザが音声コマンドを発するときの瞬間と、コマンドされたアクションが行われるときの瞬間との間の応答時間を短縮させ得る。音声活動検出モードは、音声アクティブ化システム114の低電力モードであり得る。低電力消費は、音声アクティブ化システム114が音声活動検出モードにある間、DSP110によって実行されるソフトウェアルーチンのための低最小信号品質によって可能にされ得る。例えば、DSP110は、音声活動検出モードでは、オーディオサンプルのための低下させられたSNR要件を有し得る。
ADC106によって出力されるデジタルオーディオサンプルは、先入れ先出し(FIFO)バッファであり得るバッファ108内に記憶され得る。DSP110は、新しいサンプルのためにバッファ108にポーリングし、サンプルを処理し、ヒトの音声活動が存在するかどうかを決定し得る。音声活動が検出されると、音声アクティブ化システム114は、DSP110がオーディオサンプルを処理し、トリガ音、単語、語句、および/または文を検出する音声ウェイクモード(「トリガ検出モード」とも称される)に移行し得る。音声活動検出モードより複雑なDSPルーチンが、音声ウェイクモード中、オーディオサンプルを処理するために使用され得る。これらのより複雑なルーチンは、発声されたトリガを検出するために必要であり得る。より高度なルーチンは、より高いSNR等のより優れた信号品質を要求し得、それは、ADC106によるより大量の電力消費をもたらす。
トリガが検出された後、音声アクティブ化システム114は、DSP110が発話処理ソフトウェアアルゴリズムを用いてオーディオサンプルを処理し、ヒトの音声によって発話された情報を解読する発話処理モード(「コマンド処理モード」とも称される)で動作する。この解読された情報は、アクションを電子システム100によって行わせるため等、電子システム100によるさらなる処理を始動するために使用され得る。例えば、いくつかの実施形態では、DSP110は、検出された発話をテキストに変換し、テキストをコンピューティングネットワーク112に転送し得る。このテキストは、画面上に表示される、または文書の中に挿入され得る。代替として、テキストは、電子システム100にアクションを実行させ得る。
トリガを検出するためにDSP110によって要求されるオーディオサンプルの信号品質は、発話処理ルーチンを実行するためにDSP110によって要求されるオーディオサンプルの信号品質と異なり得る。例えば、図2は、本開示の一実施形態による、トリガを検出するため、かつ発話処理を行うためのオーディオ信号品質要件間の区別の例示的振幅対周波数プロット図である。レベル202に到達するオーディオ信号は、20dBのSNRをもたらし、トリガを検出するためにDSPによって課されるSNR要件を満たすために十分であり得る。しかしながら、より高いSNRを伴う、レベル204に到達するより強いオーディオ信号が、発話処理ルーチンをオーディオサンプルに行うためにDSPによって課されるSNR要件を満たすために必要であり得る。いくつかの実施形態では、発話処理を行うためのSNR要件は、30dBと低くも、40dBと高くもあり得る、実際の要件は、異なる実施形態に対してこの範囲外で変動し得る。
広SNR要件範囲を考慮するために、音声アクティブ化システム114は、DSP110からPGA104へのフィードバック経路118を含み、PGA104の利得を調節し、単一ADC106を使用して、異なるSNR要件を満たし得る。例えば、いくつかの実施形態では、DSP110は、第1の構成を有するPGA104およびADC106の入力経路から、トリガコマンド等のオーディオの第1の部分を受信し得る。例えば、PGA104は、第1の利得値に設定され得る。別の実施例では、第1の構成を有する入力経路は、第1の雑音床値を用いて構成されている入力経路のADC106を含み得る。信号をフィードバック経路118に提供することを補助するために、DSP110は、オーディオの第1の部分の特性を決定するように構成され得る。例えば、DSP110は、オーディオの第1の部分内のオーディオサンプルのSNR、信号レベル、および周波数成分のうちの少なくとも1つを決定するように構成され得る。
DSP110は、少なくとも部分的に、決定された特性に基づいて、入力経路を第2の構成に調節するように構成され得る。例えば、DSP110は、PGA104の利得を第1の利得値部分からより高い第2の利得値に調節し得る。言い換えると、DSP110は、発話分析をオーディオの第2の部分に行うために入力経路内に所望のSNRを得るために、少なくとも部分的に、オーディオの第1の部分の信号レベルに基づいて、PGA104または他の増幅コンポーネントの利得を調節し得る。他の実施形態では、DSP110は、ADC106の雑音床値を第1の雑音床値からより低い第2の雑音床値に調節し、類似結果を達成することによって、入力経路を第2の構成に調節し得る。
本開示の一実施形態による、入力経路を調節するステップの実施例を図示するために、図3は、連続時間デルタ−シグマ変調ADC(ΔΣ ADC)を図示する例示的概略ブロック図を提供する。ΔΣ ADC300は、積分器302と、量子化器304と、デジタル/アナログコンバータ(DAC)306とを含み得る。いくつかの実施形態では、ΔΣ ADC300は、追加のループフィルタリングコンポーネント(またはループフィルタの残り)308も含み得る。
いくつかの実施形態では、ΔΣ ADC300は、PGA104およびADC106を含む回路実装に対応し得る。言い換えると、ΔΣ ADC300は、増幅部分およびADC部分を含む入力経路の単一コンポーネントADC実施形態に対応し得る。入力経路を調節することは、本実施形態では、積分器302内のレジスタ310および312等のADC内の1つ以上のレジスタの値を調節することを含み得る。例えば、ΔΣ ADC300の雑音床値を低減させるために、レジスタ310および312の抵抗値が、低減させられ得る。代替として、レジスタ310および312の抵抗値は、ΔΣ ADC300の雑音床値を増加させるために増加させられ得る。レジスタ310および312は、いくつかの実施形態では、調節可能である必要があり得るため、レジスタ310および312は、可変レジスタ(バリスタ)であり得る。代替として、レジスタ310および312は、レジスタ310および/または312に代用されるより大きいプログラマブル(可変)抵抗デバイスを構成する切り替え式レジスタ要素であり得る。別の実施形態では、入力経路を第1の構成から第2の構成に調節することは、積分器302内のコンデンサ314および316等のADC内の1つ以上のコンデンサの値を調節することを含み得る。例えば、ΔΣ ADC300の雑音床値を低減させるために、コンデンサ314および316の静電容量値は、増加させられ得る。代替として、コンデンサ314および316の静電容量値は、ΔΣ ADC300の雑音床値を増加させるために低減させられ得る。コンデンサ314および316は、いくつかの実施形態では、調節可能である必要があり得るので、コンデンサ314および316は、可変コンデンサであり得る。代替として、コンデンサ314および316は、コンデンサ314および/または316の代用とされるより大きいプログラマブル(可変)静電容量デバイスを構成する切り替え式コンデンサ要素であり得る。
入力経路を第1の構成から第2の構成に調節することは、ADC内を流れる電流の値を調節することも含み得る。例えば、ADC内のいくつかのデバイスに供給される電流は、ADCの雑音床値を低減させ、SNRを増加させるために増加させられ得る。代替として、ADC内のいくつかのデバイスに供給される電流は、ADCの雑音床値を増加させるために低下させられ得る。いくつかの実施形態では、レジスタ、コンデンサ、および電流の組み合わせが、入力経路を第1の構成から第2の構成に調節するために調節され得る。
前述のように、2つ以上の入力経路構成は、入力経路の動的再構成を可能にすることによって提供され得る。2つ以上の入力経路構成は、複数の入力経路を使用することによっても提供され得る。図4は、本開示の一実施形態に従って調節され得る二重経路入力経路を図示する例示的概略ブロック図を提供する。図1に図示される電子システム100と同様に、電子システム400は、マイクロホン402と、プログラマブル利得増幅器(PGA)404と、ADC406と、バッファ408と、デジタル信号プロセッサ(DSP)410と、コンピューティングネットワーク412とを含み得る。PGA404は、PGA404がADC406において得られる固有の利得によって置換されるとき等、明示的利得段または仮想/機能的PGAであり得る。二重経路入力を伴う電子システム400は、追加のPGA414と、追加のADC416と、第1のマルチプレクサ418と、第2のマルチプレクサ420とも含む。いくつかの実施形態では、各PGA−ADC対は、DSP410によって課される異なるSNR要件を満たすように設計され、動作させられ得る。例えば、PGA404およびADC406から成るPGA−ADC対は、PGA404が低利得を有するように設定され得る低電力低ダイナミックレンジADCに対応し得る。低利得は、DSP410がオーディオサンプル内のトリガを検出するために十分なSNRを伴って、ADC406がオーディオサンプルを出力するために十分であるように選択され得る。PGA414およびADC416から成るPGA−ADC対は、PGA414がより高い利得を有するように設定され得る高電力高ダイナミックレンジADCに対応し得る。より高い利得は、ADC416が発話処理ルーチンをオーディオサンプルに行うために十分であるように選択され得る。言い換えると、PGA414は、PGA404より高い利得を有し得、および/またはADC416は、ADC406より低い雑音床値を有し得る。いくつかの実施形態では、任意の所与の時間において、PGA−ADC対の1つのみが、オーディオサンプルを処理し、DSP410によるさらなる処理のために、オーディオサンプルを出力し得る。入力経路が図4に図示される二重経路入力経路等の二重経路入力経路である実施形態では、DSPは、ADC406等の入力経路の第1のADCを非アクティブにし、ADC416等の入力経路の第2のADCをアクティブにすることによって、入力経路を第1の構成から第2の構成に調節するステップを行うように構成され得る。PGA−ADC対が別個のPGAおよびADCコンポーネントから成る実施形態等のいくつかの実施形態では、PGA404はまた、ADC406が非アクティブ化されるとき、非アクティブ化され得、PGA414も、ADC416がアクティブ化されるとき、アクティブ化され得る。2つのPGA404および414が、全体を通して説明されるが、図4の一実施形態は、明示的PGA404および414を伴わずに実現され得る。例えば、ADC406および416は、異なるフルスケールを伴って構成され得、それは、PGA404および414の存在を伴わずに、異なる利得を2つの経路にもたらすであろう。
いくつかの実施形態では、図4に図示される二重経路入力経路内のコンポーネントの非アクティブ化およびアクティブ化は、フィードバック経路422を介して実現され得る。加えて、いくつかの実施形態では、フィードバック経路422は、マルチプレクサ418および420内のどの経路が経路を介した信号伝送を可能にするために閉鎖されるか、および、どの経路が経路を介した信号伝送を制限するように開放されるかを制御するために、DSP410によって使用され得る。さらに、マルチプレクサ418が図4に図示されるが、フィードバック経路422は、入力が両入力を駆動することを可能にすることによって、マルチプレクサ418を伴わずに実装され得る。その構成では、フィードバックは、両経路(ADC406を通した第1の経路およびADC416を通した第2の経路)に提供され、マルチプレクサ420は、システム400を通して継続するために、経路のうちの一方のみを選択するであろう。2つのみのPGA−ADC対が図4に図示されるが、追加の対が、フィードバック経路422を通して実装および制御され得る。
第1の構成から第2の構成への入力経路の調節は、入力経路からのオーディオサンプル出力が発話処理をオーディオサンプルに対して行うためにDSP110によって課されるSNR要件を満たすために十分なSNRを有するように、入力経路内のコンポーネントの性能を増加させ得る。例えば、図5は、本開示の一実施形態による、入力経路を第2の構成に調節することによって達成される性能改良を図示する例示的振幅対周波数プロットである。入力経路が第1の構成にあるとき、入力経路は、トリガ検出のための要件を満たすレベル502に到達する十分なSNRを伴って、オーディオサンプルを生成し得る。例えば、DSP110によって課される最小SNR要件が20dBである実施形態では、第1の構成における入力経路は、少なくとも20dBのSNRを伴って、オーディオサンプルを出力し得る。入力経路が第2の構成にあるとき、入力経路は、レベル504に到達する発話処理のための要件を満たす十分なSNRを伴って、オーディオサンプルを生成し得る。例えば、入力経路を調節することが利得を調節することを含むとき、利得の増加は、第2の構成における入力経路によって出力されるオーディオサンプルが発話処理をオーディオサンプルに行うためにDSP110によって課されるSNR要件を満たす、十分な増加であり得る。
図1に戻ると、DSP110は、入力経路が第2の構成に構成されるように調節された後、オーディオの第2の部分を入力経路を通して受信するようにさらに構成され得る。第2の構成における入力経路によって処理されるオーディオサンプルは、発話処理をオーディオサンプルに行うためにDSPによって課されるSNR要件を満たすために十分なSNRを有し得る。DSPは、オーディオの第2の部分に対して発話分析を行うようにさらに構成され得る。
いくつかの実施形態では、入力経路の第2の構成は、入力経路の第1の構成と同一であり得る。例えば、いくつかの実施形態では、オーディオの第1の部分のオーディオサンプル部分のSNRは、発話処理を行うためにDSPによって課されるSNR要件を満たすために十分に高くあり得る。その場合、ADCは、SNR改良が必要とされないこともあるので、第1の構成に維持され、オーディオの第2の部分およびオーディオの後続部分を処理することができる。
いくつかの実施形態では、DSPによって受信されたオーディオの第2の部分は、信号クリッピングが問題となり得るほど高いか、またはDSP110が信頼性のある発話処理を行うために低すぎるSNRをもたらす振幅を有し得る。例えば、いくつかの実施形態では、オーディオサンプルの信号特性は、オーディオの第1の部分に基づいて決定され得、入力経路は、オーディオの第1の部分から決定される信号特性に基づいて調節され得る。オーディオの第2の部分は、オーディオの第1の部分と同一信号特性を有していないこともある。したがって、いくつかの実施形態では、DSP110は、オーディオの第2の部分の特性を検出し、オーディオの第2の部分から決定される信号特性に基づいて、入力経路を調節することもある。
特に、いくつかの実施形態では、DSP110は、少なくとも部分的に、受信されたオーディオの第2の部分に基づいて、入力経路の利得を第3の構成に調節するようにさらに構成され得る。例えば、DSP110は、(1)オーディオの第2の部分内のオーディオサンプルがDSPが発話処理を行うために十分なSNRを有していないとき、マイクロホン102によって受信されたオーディオサンプルの信号振幅をさらに増加させるか、または、(2)オーディオの第2の部分内のオーディオサンプルがクリッピングが生じ得るほど高い振幅を有するとき、マイクロホン102によって受信されたオーディオサンプルの信号振幅を低減させるかのいずれかのために、入力経路をさらに調節し得る。いくつかの実施形態では、信号レベルは、信号レベルが所定の閾値を超えるとき、クリッピングが生じ得るほど高いと見なされ得る。別の実施形態では、信号レベルは、信号レベルがADCによって処理され得る最大信号レベルの90%より高いとき、クリッピングが生じ得るほど高いと見なされ得る。
入力経路が第3の構成に調節された後、DSP110は、第3の構成を有する入力経路を通して、オーディオの第3の部分を受信し、オーディオの第3の部分に発話分析を行い得る。いくつかの実施形態では、DSP110は、オーディオの追加の部分のために、入力経路の利得の調節を継続するようにも構成され得る。したがって、いくつかの実施形態では、入力経路内に適用される利得の調節は、DSPによって処理されるオーディオサンプルが、信頼性のある発話処理を行うために十分なSNRであるが、クリッピングが生じるほど高くないSNRを有するように、入力経路内に適用される利得を動的に増加または減少させる、動的調節であり得る。
入力経路の再構成は、信号がクリッピングされないように十分に迅速であり得る。例えば、オーディオサンプルの信号レベルが高すぎることを検出すると、DSP110は、フィードバック経路118を介して、PGA104における利得を低減させ得る。図6は、音声アクティブ化システムによって処理されているオーディオ信号の振幅を迅速に低減させるための例示的概略ブロック図を図示し、信号レベル検出回路602が、ADC604およびPGA606に結合される。信号レベル検出回路602は、ADC604によって処理されているオーディオサンプルの信号レベルを検出し得、信号レベルが所定の閾値に到達する場合、信号レベル検出回路602は、PGA606によって適用される利得を低減させ得る。DSP610によって受信されたオーディオサンプルの振幅が低すぎる場合、DSP610は、PGA606における利得を増加させ得る。利得が減少させられる率および利得が増加させられる率は、非対称であり得る。すなわち、利得は、クリッピングを回避するために十分に迅速に減少させられるが、音声アクティブ化システム内の制御ループを不安定にすることを回避するために、より低率で増加させられ得る。
入力経路は、第1の構成に戻り、ヒトの音声活動およびトリガの検出のために、オーディオサンプルを監視および処理するように調節され得る。例えば、オーディオサンプルの発話処理が終了した後、および/またはヒトの音声活動がもはやオーディオサンプル内に存在しない場合、入力経路は、第1の構成に調節され、殆ど電力を消費しないようにすることができる。いくつかの実施形態では、音声アクティブ化システムは、発話処理がオーディオサンプルに対して行われてから、またはヒトの音声活動が最後にオーディオサンプル内に存在してから、所定の時間量が経過した後、入力経路を第1の構成に戻すように構成され得る。例えば、入力経路は、ヒトの音声活動が検出されなくなってから5秒またはそれを上回る時間後、第1の構成に戻され得る。
本明細書に図示および説明される例示的システムに照らして、開示される主題に従って実装され得る方法論が、種々の機能ブロック図を参照してより深く理解されるであろう。説明の簡略化目的のために、方法論は、一連の行為/ブロックとして図示および説明されるが、請求される主題は、ブロックの数または順序によって限定されず、したがって、いくつかのブロックは、本明細書に描写および説明されるものと異なる順序において、および/または他のブロックと実質的に同時に生じ得ることを理解および認識されたい。さらに、全ての図示されるブロックが、本明細書に説明される方法論を実装するために要求されないこともある。ブロックに関連付けられた機能性は、ソフトウェア、ハードウェア、それらの組み合わせ、または任意の他の好適な手段(例えば、デバイス、システム、プロセス、またはコンポーネント)によって実装され得ることを認識されたい。加えて、本明細書全体を通して開示される方法論は、種々のデバイスへのそのような方法論のトランスポートおよび転送を促進するために、製造品上に記憶されることが可能であることをさらに認識されたい。当業者は、方法論が、代替として、状態略図におけるように、一連の相互関連状態またはイベントとして表され得ることを理解および認識するであろう。
図7は、本開示の一実施形態による、音声アクティブ化システムの低電力DR拡張のための方法を図示する例示的フロー図である。方法700は、図1−6に関して説明されるシステムを用いて実装され得る。方法700は、ブロック702から開始し、第1の構成を有する入力経路を通して、オーディオの第1の部分を受信する。いくつかの実施形態では、オーディオの第1の部分は、トリガコマンドを含み得る。ブロック704では、方法700は、いくつかの実施形態では、SNR、信号レベル、および周波数成分のうちの少なくとも1つを含み得る、オーディオの第1の部分の特性を決定することを含む。
方法700は、ブロック706では、少なくとも部分的に、決定された特性に基づいて、入力経路を第2の構成に調節することを含む。いくつかの実施形態では、入力経路を調節することは、入力経路の利得、SNR、およびダイナミックレンジのうちの少なくとも1つを調節することを含み得る。例えば、一実施形態によると、入力経路を調節することは、入力経路の増幅器のための利得を第1の構成の第1の値から第2の構成のより高い第2の値に調節することを含み得る。いくつかの実施形態では、利得を調節することは、少なくとも部分的に、オーディオの第1の部分の信号レベルに基づいて、利得を調節し、命令コマンドを含み得るオーディオの第2の部分に対して発話分析を行うために、入力経路内に所望のSNRを得ることを含み得る。他の実施形態では、ブロック706等の入力経路を調節することは、入力経路のADCのための雑音床値を第1の構成の第1の値部分から第2の構成のより低い第2の値部分に調節することを含み得る。例えば、一実施形態によると、雑音床値を調節することは、ADC内のレジスタの値を調節することと、ADC内のコンデンサの値を調節することと、ADC内を流れる電流の値を調節することとのうちの少なくとも1つを含み得る。
別の実施形態によると、入力経路は、2つの経路の各々に異なるADCを含む二重経路入力経路であり得、各ADCは、異なる性能制約および仕様に従って設計されることができる。そのような実施形態では、ブロック706等の入力経路を調節することは、入力経路の第1のADCを非アクティブにすることと、入力経路の第2のADCをアクティブにすることも含み得る。いくつかの実施形態では、第1のADCは、その利得段に最小限の信号増幅を伴う低電力低DR ADCであり得、第2のADCは、その利得段に第1のADCより多くの信号増幅を伴う高電力高DR ADCであり得る。電力は、第1および第2のADCに関して言及されるが、第1および第2のADCは、類似増幅能力を有し得る。低電力の第1のADCは、より高い電力の第2のADCと比較して、ダイナミックレンジを低下させることによって得られ得る。
次に、方法700は、ブロック708では、第2の構成を有する入力経路を通して、オーディオの第2の部分を受信することを含む。例えば、オーディオの第2の部分は、ヒトの音声によって発話された命令コマンドを含む、オーディオの部分であり得る。ブロック710では、方法700は、オーディオの第2の部分に対して発話分析を行うことを含む。例えば、発話分析は、図1に図示されるDSP110等のDSPを用いて行われ得る。
いくつかの実施形態では、オーディオの第2の部分内のオーディオサンプルの信号レベルは、オーディオの第1の部分内のオーディオサンプルの信号レベルと異なり得る。入力経路の利得は、少なくとも部分的に、受信されたオーディオの第2の部分の特性に基づいて、第3の構成に調節され得る。続いて、オーディオの第3の部分が、第3の構成を有する入力経路を通して受信され得、発話分析が、オーディオの第3の部分に対して行われ得る。ある実施形態によると、方法700を採用するシステムは、オーディオの追加の部分のために、入力経路の利得の調節を継続し得る。
図7の概略フロー図略図は、概して、論理フロー図略図として記載される。したがって、描写される順序および標識されるステップは、開示される方法の側面を示す。図示される方法の1つ以上のステップまたはその一部と機能、論理、または効果上均等物である他のステップおよび方法も、想起され得る。加えて、採用されるフォーマットおよび記号は、方法の論理ステップを説明するために提供され、方法の範囲を限定するものと理解されるものではない。種々の矢印タイプおよび線タイプが、フロー図略図において採用され得るが、それらは、対応する方法の範囲を限定するものと理解されるものではない。実際には、いくつかの矢印または他のコネクタは、方法の論理フローのみを示すために使用され得る。例えば、矢印は、描写される方法の列挙されたステップ間の規定されていない持続時間の待機または監視周期を示し得る。加えて、特定の方法が生じる順序は、示される対応するステップの順序に厳密に従っても、従わなくてもよい。
ファームウェアおよび/またはソフトウェア内に実装される場合、前述の機能は、コンピュータ読み取り可能な媒体上の1つ以上の命令もしくはコードとして記憶され得る。実施例として、データ構造でエンコードされた非一過性コンピュータ読み取り可能な媒体およびコンピュータプログラムでエンコードされたコンピュータ読み取り可能な媒体が挙げられる。コンピュータ読み取り可能な媒体は、物理的コンピュータ記憶媒体を含む。記憶媒体は、コンピュータによってアクセスされ得る、任意の利用可能な媒体であり得る。限定ではないが、一例として、そのようなコンピュータ読み取り可能な媒体として、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、電気的に消去可能なプログラマブル読み取り専用メモリ(EEPROM)、コンパクトディスク読み取り専用メモリ(CD−ROM)もしくは他の光ディスク記憶、磁気ディスク記憶もしくは他の磁気記憶デバイス、または所望のプログラムコードを命令もしくはデータ構造の形態で記憶するために使用され得、コンピュータによってアクセスされ得る、任意の他の媒体が挙げられ得る。ディスク(diskおよびdisc)は、コンパクトディスク(CD)、レーザディスク、光学ディスク、デジタル多用途ディスク(DVD)、フロッピー(登録商標)ディスク、およびBlu−ray(登録商標)ディスクを含む。概して、ディスク(disk)は、データを磁気的に再生し、ディスク(disc)は、データを光学的に再生する。前述の組み合わせもまた、コンピュータ読み取り可能な媒体の範囲内に含まれるべきである。
コンピュータ読み取り可能な媒体上の記憶に加え、命令および/またはデータは、通信装置内に含まれる伝送媒体上の信号として提供され得る。例えば、通信装置は、命令およびデータを示す信号を有する、送受信機を含み得る。命令およびデータは、1つ以上のプロセッサに、請求項に概略された機能を実装させるように構成される。
本開示およびある代表的利点が詳細に説明されたが、種々の変更、代用、ならびに改変が、添付の請求項によって定義される本開示の精神および範囲から逸脱することなく、本明細書に成され得ることを理解されたい。さらに、本願の範囲は、明細書に説明されるプロセス、機械、製造、組成物、手段、方法、およびステップの特定の実施形態に限定されるものと意図されない。当業者が本開示から容易に理解するであろうように、本明細書に説明される対応する実施形態と実質的に同一機能を行う、または実質的に同一結果を達成する、現在既存である、もしくは後に開発される、プロセス、機械、製造、組成物、手段、方法、およびステップが、利用され得る。故に、添付の請求項は、その範囲内に、そのようなプロセス、機械、製造、組成物、手段、方法、およびステップを含むことが意図される。

Claims (30)

  1. 方法であって、前記方法は、
    第1の構成を有する音声アクティブ化システムの入力経路を通して、オーディオの第1の部分を受信することと、
    前記オーディオの第1の部分の特性を決定することと、
    前記決定された特性に少なくとも部分的に基づいて、前記入力経路を第2の構成に調節することと、
    前記第2の構成を有する前記入力経路を通して、オーディオの第2の部分を受信することと、
    前記オーディオの第2の部分に対して発話分析を行うことと
    を含み、
    前記入力経路を調節するステップは、前記入力経路の増幅器のための利得を前記第1の構成の第1の値から前記第2の構成のより高い第2の値に調節することを含み、
    前記利得を調節するステップは、前記オーディオの第1の部分の信号レベルに少なくとも部分的に基づいて、前記利得を調節することにより、前記オーディオの第2の部分に対して発話分析を行うための前記入力経路内の所望の信号対雑音比(SNR)を得ることを含む、方法。
  2. 前記入力経路を第2の構成に調節するステップは、前記入力経路のダイナミックレンジ(DR)を増加させることを含む、請求項1に記載の方法。
  3. 前記オーディオの第1の部分は、トリガコマンドを備え、前記オーディオの第2の部分は、命令コマンドを備えている、請求項1に記載の方法。
  4. 前記特性を決定するステップは、信号対雑音比(SNR)、信号レベル周波数成分のうちの少なくとも1つを決定することを含む、請求項1に記載の方法。
  5. 前記入力経路を調節するステップは、前記入力経路の利得、信号対雑音比(SNR)ダイナミックレンジのうちの少なくとも1つを調節することを含む、請求項1に記載の方法。
  6. 前記入力経路を調節するステップは、
    前記入力経路の第1のアナログ/デジタルコンバータ(ADC)を非アクティブにすることと、
    前記入力経路の第2のアナログ/デジタルコンバータ(ADC)をアクティブにすることと
    を含む、請求項1に記載の方法。
  7. 前記第1のADCは、低電力低ダイナミックレンジADCを備え、前記第2のADCは、高電力高ダイナミックレンジADCを備えている、請求項6に記載の方法。
  8. 前記受信されたオーディオの第2の部分の特性に少なくとも部分的に基づいて、前記入力経路の利得を第3の構成に調節することと、
    前記第3の構成を有する前記入力経路を通して、オーディオの第3の部分を受信することと、
    前記オーディオの第3の部分に対して発話分析を行うことと、
    オーディオの追加の部分のために、前記入力経路の利得の調節を継続することと
    をさらに含む、請求項に記載の方法。
  9. 前記入力経路を調節するステップは、前記入力経路のアナログ/デジタルコンバータ(ADC)のための雑音床値を前記第1の構成のための第1の値から前記第2の構成のためのより低い第2の値に調節することを含む、請求項1に記載の方法。
  10. 前記雑音床値を調節するステップは、
    前記アナログ/デジタルコンバータ(ADC)内のレジスタの値を調節することと、
    前記アナログ/デジタルコンバータ(ADC)内のコンデンサの値を調節することと、
    前記アナログ/デジタルコンバータ(ADC)内を流れる電流の値を調節することと
    のうちの少なくとも1つを含む、請求項に記載の方法。
  11. 前記発話分析を行うステップは、デジタル信号プロセッサ(DSP)を用いて発話分析を行うことを含む、請求項1に記載の方法。
  12. 装置であって、前記装置は、
    マイクロホンと、
    音声コマンドを受信するように構成され、オーディオ信号を前記マイクロホンから受信するように結合されている入力経路であって、前記入力経路は、アナログ/デジタルコンバータ(ADC)を備えている、入力経路と、
    前記入力経路に結合され、前記オーディオ信号のデジタル表現を受信するデジタル信号プロセッサ(DSP)と
    を備え、前記DSPは、
    第1の構成を有する前記入力経路を通して、オーディオの第1の部分を受信することと、
    前記オーディオの第1の部分の特性を決定することと、
    前記決定された特性に少なくとも部分的に基づいて、前記入力経路を第2の構成に調節することと、
    前記第2の構成を有する前記入力経路を通して、オーディオの第2の部分を受信することと
    を行うように構成されており、
    前記入力経路は、前記マイクロホンと前記アナログ/デジタルコンバータ(ADC)との間に結合されている増幅器をさらに備え、前記入力経路を調節するステップは、前記入力経路の増幅器のための利得を前記第1の構成の第1の値から前記第2の構成のより高い第2の値に調節することを含み、
    前記利得を調節するステップは、前記オーディオの第1の部分の信号レベルに少なくとも部分的に基づいて、前記利得を調節することにより、前記オーディオの第2の部分に対して発話分析を行うための前記入力経路内の所望の信号対雑音比(SNR)を得ることを含む、装置。
  13. 前記デジタル信号プロセッサ(DSP)は、前記入力経路のダイナミックレンジ(DR)を増加させることによって、前記入力経路を第2の構成に調節するように構成されている、請求項12に記載の装置。
  14. 前記オーディオの第1の部分は、トリガコマンドを備え、前記オーディオの第2の部分は、命令コマンドを備えている、請求項12に記載の装置。
  15. 前記入力経路は、第2のアナログ/デジタルコンバータ(ADC)をさらに備え、前記DSPは、
    前記入力経路の第1のアナログ/デジタルコンバータ(ADC)を非アクティブにすることと、
    前記入力経路の第2のアナログ/デジタルコンバータ(ADC)をアクティブにすることと
    によって、前記入力経路を調節するステップを行うように構成されている、請求項12に記載の装置。
  16. 前記第1のADCは、低電力低ダイナミックレンジADCを備え、前記第2のADCは、高電力高ダイナミックレンジADCを備えている、請求項15に記載の装置。
  17. 前記DSPは、
    前記受信されたオーディオの第2の部分に少なくとも部分的に基づいて、前記入力経路の利得を第3の構成に調節することと、
    前記第3の構成を有する前記入力経路を通して、オーディオの第3の部分を受信することと、
    前記オーディオの第3の部分に対して発話分析を行うことと、
    オーディオの追加の部分のために、前記入力経路の利得の調節を継続することと
    を行うようにさらに構成されている、請求項12に記載の装置。
  18. 前記入力経路を調節するステップは、前記入力経路のアナログ/デジタルコンバータ(ADC)の雑音床値を前記第1の構成のための第1の値から前記第2の構成のためのより低い第2の値に調節することを含む、請求項12に記載の装置。
  19. 前記雑音床値を調節するステップは、
    前記アナログ/デジタルコンバータ(ADC)内のレジスタの値を調節することと、
    前記アナログ/デジタルコンバータ(ADC)内のコンデンサの値を調節することと、
    前記アナログ/デジタルコンバータ(ADC)内を流れる電流の値を調節することと
    のうちの少なくとも1つを含む、請求項18に記載の装置。
  20. 前記DSPは、前記オーディオの第2の部分に対して発話分析を行うステップを行うようにさらに構成されている、請求項12に記載の装置。
  21. モバイルデバイスであって、前記モバイルデバイスは、
    マイクロホンと、
    前記マイクロホンに結合され、音声コマンドを備えているオーディオ信号を前記マイクロホンから受信するように構成されているオーディオ処理回路と
    を備え、
    前記オーディオ処理回路は、
    アナログ/デジタルコンバータ(ADC)と、
    前記ADCに結合され、前記オーディオ信号のデジタル表現を受信するデジタル信号プロセッサ(DSP)と
    を備え、
    前記オーディオ処理回路は、
    前記オーディオ処理回路が第1の構成に構成されている間、オーディオの第1の部分を前記マイクロホンから受信することと、
    前記オーディオの第1の部分の特性を決定することと、
    前記決定された特性に少なくとも部分的に基づいて、前記オーディオ処理回路を第2の構成に調節することと、
    前記オーディオ処理回路が第2の構成に構成されている間、オーディオの第2の部分を前記マイクロホンを通して受信することと
    を行うように構成されており、
    前記オーディオ処理回路は、前記マイクロホンと前記アナログ/デジタルコンバータ(ADC)との間に結合されている増幅器をさらに備え、前記オーディオ処理回路を調節するステップは、前記オーディオ処理回路の増幅器のための利得を前記第1の構成の第1の値から前記第2の構成のより高い第2の値に調節することを含み、
    前記利得を調節するステップは、前記オーディオの第1の部分の信号レベルに少なくとも部分的に基づいて、前記利得を調節することにより、前記オーディオの第2の部分に対して発話分析を行うための前記オーディオ処理回路内の所望の信号対雑音比(SNR)を得ることを含む、モバイルデバイス。
  22. 前記オーディオ処理回路は、前記オーディオ処理回路のダイナミックレンジ(DR)を増加させることによって、前記オーディオ処理回路を第2の構成に調節するように構成されている、請求項21に記載のモバイルデバイス。
  23. 前記オーディオの第1の部分は、トリガコマンドを備え、前記オーディオの第2の部分は、命令コマンドを備えている、請求項21に記載のモバイルデバイス。
  24. 前記オーディオ処理回路は、第2のアナログ/デジタルコンバータ(ADC)をさらに備え、前記DSPは、
    前記オーディオ処理回路のアナログ/デジタルコンバータ(ADC)を非アクティブにすることと、
    前記オーディオ処理回路の第2のアナログ/デジタルコンバータ(ADC)をアクティブにすること
    によって、前記オーディオ処理回路を調節するステップを行うように構成されている、請求項21に記載のモバイルデバイス。
  25. 前記ADCは、低電力低ダイナミックレンジADCを備え、前記第2のADCは、高電力高ダイナミックレンジADCを備えている、請求項24に記載のモバイルデバイス。
  26. 前記オーディオ処理回路は、
    前記受信されたオーディオの第2の部分に少なくとも部分的に基づいて、前記増幅器の利得を第3の構成に調節するステップと、
    前記利得が前記第3の構成に設定されている間、オーディオの第3の部分を受信するステップと、
    前記オーディオの第3の部分に対して発話分析を行うステップと、
    オーディオの追加の部分のために、前記増幅器の利得の調節を継続するステップと
    を行うようにさらに構成されている、請求項21に記載のモバイルデバイス。
  27. 前記オーディオ処理回路を調節するステップは、前記オーディオ処理回路のアナログ/デジタルコンバータ(ADC)のための雑音床値を前記第1の構成のための第1の値から前記第2の構成のためのより低い第2の値に調節することを含む、請求項21に記載のモバイルデバイス。
  28. 前記オーディオ処理回路は、可変レジスタおよび可変コンデンサのうちの少なくとも1つを備え、前記オーディオ処理回路は、
    前記アナログ/デジタルコンバータ(ADC)内のレジスタの値を調節するステップと、
    前記アナログ/デジタルコンバータ(ADC)内のコンデンサの値を調節するステップと、
    前記アナログ/デジタルコンバータ(ADC)内を流れる電流の値を調節するステップと
    のうちの少なくとも1つを行うことによって、前記雑音床値を調節するように構成されている、請求項27に記載のモバイルデバイス。
  29. 前記オーディオ処理回路は、前記オーディオの第2の部分に対して発話分析を行うステップを行うようにさらに構成されている、請求項21に記載のモバイルデバイス。
  30. 前記デジタル信号プロセッサ(DSP)は、前記モバイルデバイスの汎用中央処理ユニット(CPU)の一部を備えている、請求項21に記載のモバイルデバイス。
JP2017555693A 2015-04-24 2016-04-04 音声アクティブ化システムのためのアナログ/デジタルコンバータ(adc)ダイナミックレンジ拡張 Expired - Fee Related JP6517365B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/696,172 2015-04-24
US14/696,172 US9799349B2 (en) 2015-04-24 2015-04-24 Analog-to-digital converter (ADC) dynamic range enhancement for voice-activated systems
PCT/IB2016/000496 WO2016170413A1 (en) 2015-04-24 2016-04-04 Analog-to-digital converter (adc) dynamic range enhancement for voice-activated systems

Publications (2)

Publication Number Publication Date
JP2018518096A JP2018518096A (ja) 2018-07-05
JP6517365B2 true JP6517365B2 (ja) 2019-05-22

Family

ID=53677467

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017555693A Expired - Fee Related JP6517365B2 (ja) 2015-04-24 2016-04-04 音声アクティブ化システムのためのアナログ/デジタルコンバータ(adc)ダイナミックレンジ拡張

Country Status (7)

Country Link
US (1) US9799349B2 (ja)
EP (1) EP3286837B1 (ja)
JP (1) JP6517365B2 (ja)
KR (1) KR102009475B1 (ja)
CN (1) CN107548508B (ja)
GB (2) GB2537694B (ja)
WO (1) WO2016170413A1 (ja)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10284217B1 (en) 2014-03-05 2019-05-07 Cirrus Logic, Inc. Multi-path analog front end and analog-to-digital converter for a signal processing system
US10785568B2 (en) 2014-06-26 2020-09-22 Cirrus Logic, Inc. Reducing audio artifacts in a system for enhancing dynamic range of audio signal path
US9959856B2 (en) 2015-06-15 2018-05-01 Cirrus Logic, Inc. Systems and methods for reducing artifacts and improving performance of a multi-path analog-to-digital converter
WO2016208789A1 (ko) * 2015-06-26 2016-12-29 삼성전자 주식회사 소리를 판별하는 방법 및 이를 위한 장치
CN105609118B (zh) * 2015-12-30 2020-02-07 生迪智慧科技有限公司 语音检测方法及装置
US9880802B2 (en) 2016-01-21 2018-01-30 Cirrus Logic, Inc. Systems and methods for reducing audio artifacts from switching between paths of a multi-path signal processing system
WO2017151650A1 (en) * 2016-02-29 2017-09-08 Littrell Robert J A piezoelectric mems device for producing a signal indicative of detection of an acoustic stimulus
US9998826B2 (en) 2016-06-28 2018-06-12 Cirrus Logic, Inc. Optimization of performance and power in audio system
US10545561B2 (en) * 2016-08-10 2020-01-28 Cirrus Logic, Inc. Multi-path digitation based on input signal fidelity and output requirements
US10263630B2 (en) 2016-08-11 2019-04-16 Cirrus Logic, Inc. Multi-path analog front end with adaptive path
US9929703B1 (en) 2016-09-27 2018-03-27 Cirrus Logic, Inc. Amplifier with configurable final output stage
US9967665B2 (en) 2016-10-05 2018-05-08 Cirrus Logic, Inc. Adaptation of dynamic range enhancement based on noise floor of signal
EP3566229B1 (en) * 2017-01-23 2020-11-25 Huawei Technologies Co., Ltd. An apparatus and method for enhancing a wanted component in a signal
US10321230B2 (en) 2017-04-07 2019-06-11 Cirrus Logic, Inc. Switching in an audio system with multiple playback paths
US10008992B1 (en) 2017-04-14 2018-06-26 Cirrus Logic, Inc. Switching in amplifier with configurable final output stage
US9917557B1 (en) 2017-04-17 2018-03-13 Cirrus Logic, Inc. Calibration for amplifier with configurable final output stage
US11475888B2 (en) * 2018-04-29 2022-10-18 Dsp Group Ltd. Speech pre-processing in a voice interactive intelligent personal assistant
US10726873B2 (en) * 2018-08-14 2020-07-28 Cirrus Logic, Inc. Polymorphic playback system with signal detection filters of different latencies
US10892772B2 (en) 2018-08-17 2021-01-12 Invensense, Inc. Low power always-on microphone using power reduction techniques
KR20200043642A (ko) 2018-10-18 2020-04-28 삼성전자주식회사 동작 상태에 기반하여 선택한 마이크를 이용하여 음성 인식을 수행하는 전자 장치 및 그의 동작 방법
KR20200084727A (ko) * 2019-01-03 2020-07-13 삼성전자주식회사 전자 장치 및 이의 제어 방법
US11418882B2 (en) 2019-03-14 2022-08-16 Vesper Technologies Inc. Piezoelectric MEMS device with an adaptive threshold for detection of an acoustic stimulus
KR20210141549A (ko) * 2019-03-14 2021-11-23 베스퍼 테크놀로지스 인코포레이티드 상이한 전력 소비 수준에서 결정된 디지털 출력을 갖는 마이크로폰
US10763889B1 (en) 2019-03-22 2020-09-01 Texas Instruments Incorporated Analog-to-digital converter with dynamic range enhancer
JP2020170101A (ja) * 2019-04-04 2020-10-15 日本電信電話株式会社 音量調整装置、その方法、およびプログラム
US11438697B2 (en) 2019-06-07 2022-09-06 Cirrus Logic, Inc. Low-latency audio output with variable group delay
US10701486B1 (en) 2019-06-07 2020-06-30 Cirrus Logic, Inc. Low-latency audio output with variable group delay
FR3097633B1 (fr) * 2019-06-19 2021-11-12 Alliantech Dispositif de mesure microphonique portatif
US11726105B2 (en) 2019-06-26 2023-08-15 Qualcomm Incorporated Piezoelectric accelerometer with wake function
TWI760939B (zh) * 2020-11-25 2022-04-11 瑞昱半導體股份有限公司 音訊處理電路以及音訊處理方法
US11659329B2 (en) * 2021-08-05 2023-05-23 Infineon Technologies Ag Efficient seamless switching of sigma-delta modulators
US11606100B1 (en) * 2021-10-25 2023-03-14 Ess Technology, Inc. Method and apparatus for enhancing dynamic range in an analog-to-digital converter

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01303933A (ja) * 1988-06-01 1989-12-07 Matsushita Electric Ind Co Ltd デジタル信号処理装置
JPH05224694A (ja) * 1992-02-14 1993-09-03 Ricoh Co Ltd 音声認識装置
SE502618C2 (sv) * 1994-10-03 1995-11-27 Ericsson Telefon Ab L M Förfarande och anordning för att erhålla ett brett dynamiskt område hos en mottagare i ett digitalt radiotransmissionssystem
JP3522012B2 (ja) * 1995-08-23 2004-04-26 沖電気工業株式会社 コード励振線形予測符号化装置
US5983183A (en) * 1997-07-07 1999-11-09 General Data Comm, Inc. Audio automatic gain control system
US6359939B1 (en) * 1998-05-20 2002-03-19 Diva Systems Corporation Noise-adaptive packet envelope detection
DE10021824C2 (de) 1999-05-07 2002-01-31 Yamaha Corp D/A-Wandlervorrichtung und D/A-Wandlerverfahren
GB2355607B (en) * 1999-10-20 2002-01-16 Motorola Israel Ltd Digital speech processing system
JP2001217714A (ja) * 2000-01-31 2001-08-10 Toa Corp ディジタル通信システム
US6661901B1 (en) 2000-09-01 2003-12-09 Nacre As Ear terminal with microphone for natural voice rendition
US6583747B1 (en) * 2002-05-24 2003-06-24 Broadcom Corporation Subranging analog to digital converter with multi-phase clock timing
DE102004006957A1 (de) * 2004-02-12 2005-09-15 Infineon Technologies Ag Verfahren und Vorrichtung zum Verstärken eines Empfangssignals
KR100595707B1 (ko) * 2004-12-08 2006-06-30 엘지전자 주식회사 듀얼모드 휴대단말기의 안테나 스위치 장치 및 방법
US8000302B2 (en) * 2005-06-23 2011-08-16 Qualcomm Incorporated Adaptive multi-channel modem
US20080300025A1 (en) * 2007-05-31 2008-12-04 Motorola, Inc. Method and system to configure audio processing paths for voice recognition
US7755523B2 (en) 2007-09-24 2010-07-13 Nanoamp Mobile, Inc. ADC use with multiple signal modes
US8099289B2 (en) * 2008-02-13 2012-01-17 Sensory, Inc. Voice interface and search for electronic devices including bluetooth headsets and remote systems
US20090287489A1 (en) * 2008-05-15 2009-11-19 Palm, Inc. Speech processing for plurality of users
JP5614767B2 (ja) * 2009-04-14 2014-10-29 アルパイン株式会社 音声処理装置
JP4809454B2 (ja) 2009-05-17 2011-11-09 株式会社半導体理工学研究センター 発話推定による回路起動方法及び回路起動装置
US20110125494A1 (en) * 2009-11-23 2011-05-26 Cambridge Silicon Radio Limited Speech Intelligibility
DK2352312T3 (da) 2009-12-03 2013-10-21 Oticon As Fremgangsmåde til dynamisk undertrykkelse af omgivende akustisk støj, når der lyttes til elektriske input
US8217822B2 (en) * 2010-11-09 2012-07-10 Microsoft Corporation Resolution enhancing analog-to-digital conversion
US8717211B2 (en) 2010-11-30 2014-05-06 Qualcomm Incorporated Adaptive gain adjustment system
EP2800508B1 (en) * 2012-01-06 2018-09-12 Draeger Medical Systems, Inc. System and method for improving signal to noise ratio for high frequency signal component
US9838810B2 (en) 2012-02-27 2017-12-05 Qualcomm Technologies International, Ltd. Low power audio detection
CN113470640B (zh) * 2013-02-07 2022-04-26 苹果公司 数字助理的语音触发器
US9043211B2 (en) * 2013-05-09 2015-05-26 Dsp Group Ltd. Low power activation of a voice activated device
EP3000241B1 (en) * 2013-05-23 2019-07-17 Knowles Electronics, LLC Vad detection microphone and method of operating the same
GB2541079B (en) 2013-06-26 2018-03-14 Cirrus Logic Int Semiconductor Ltd Analog-to-digital converter
US9697831B2 (en) * 2013-06-26 2017-07-04 Cirrus Logic, Inc. Speech recognition
US9245527B2 (en) * 2013-10-11 2016-01-26 Apple Inc. Speech recognition wake-up of a handheld portable electronic device
GB2520048B (en) * 2013-11-07 2018-07-11 Toshiba Res Europe Limited Speech processing system
KR102216048B1 (ko) * 2014-05-20 2021-02-15 삼성전자주식회사 음성 명령 인식 장치 및 방법
US10276180B2 (en) * 2014-07-21 2019-04-30 Honeywell International Inc. Audio command adaptive processing system and method
GB2535766B (en) * 2015-02-27 2019-06-12 Imagination Tech Ltd Low power detection of an activation phrase

Also Published As

Publication number Publication date
GB2537694B (en) 2019-07-10
WO2016170413A1 (en) 2016-10-27
US9799349B2 (en) 2017-10-24
US20160314805A1 (en) 2016-10-27
GB2537697B (en) 2019-09-11
EP3286837B1 (en) 2022-06-08
CN107548508B (zh) 2020-11-27
JP2018518096A (ja) 2018-07-05
GB2537694A (en) 2016-10-26
GB2537697A (en) 2016-10-26
GB201515181D0 (en) 2015-10-07
GB201509320D0 (en) 2015-07-15
KR102009475B1 (ko) 2019-08-09
KR20170140314A (ko) 2017-12-20
WO2016170413A8 (en) 2017-12-14
EP3286837A1 (en) 2018-02-28
CN107548508A (zh) 2018-01-05

Similar Documents

Publication Publication Date Title
JP6517365B2 (ja) 音声アクティブ化システムのためのアナログ/デジタルコンバータ(adc)ダイナミックレンジ拡張
US10824391B2 (en) Audio user interface apparatus and method
US9596537B2 (en) Systems and methods for reduction of audio artifacts in an audio system with dynamic range enhancement
US20180160227A1 (en) Speaker protection excursion oversight
US8165321B2 (en) Intelligent clip mixing
JP4913906B2 (ja) 音声デバイスの中の抑制する出力オフセット
US10979010B2 (en) Audio signal processing
JP6067391B2 (ja) 信号音量に基いた信号利得の適合時のピーク検出
US9161127B2 (en) Signal processing apparatus
WO2018107084A1 (en) Data encoding detection
KR20150115653A (ko) 오디오 불연속을 단조롭게 관리하기 위한 장치 및 방법
JP2009135717A (ja) Δς変調装置、遮断方法、プログラム、および、記録媒体
GB2552280A (en) Speech recognition

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181019

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190304

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190401

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190417

R150 Certificate of patent or registration of utility model

Ref document number: 6517365

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees