JP6517365B2 - 音声アクティブ化システムのためのアナログ/デジタルコンバータ(adc)ダイナミックレンジ拡張 - Google Patents
音声アクティブ化システムのためのアナログ/デジタルコンバータ(adc)ダイナミックレンジ拡張 Download PDFInfo
- Publication number
- JP6517365B2 JP6517365B2 JP2017555693A JP2017555693A JP6517365B2 JP 6517365 B2 JP6517365 B2 JP 6517365B2 JP 2017555693 A JP2017555693 A JP 2017555693A JP 2017555693 A JP2017555693 A JP 2017555693A JP 6517365 B2 JP6517365 B2 JP 6517365B2
- Authority
- JP
- Japan
- Prior art keywords
- audio
- adc
- input path
- adjusting
- configuration
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000004913 activation Effects 0.000 title claims description 43
- 238000012545 processing Methods 0.000 claims description 79
- 238000000034 method Methods 0.000 claims description 77
- 238000004458 analytical method Methods 0.000 claims description 41
- 239000003990 capacitor Substances 0.000 claims description 24
- 230000005236 sound signal Effects 0.000 claims description 23
- 230000003213 activating effect Effects 0.000 claims description 10
- 230000000694 effects Effects 0.000 description 19
- 238000010586 diagram Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 16
- 238000001514 detection method Methods 0.000 description 13
- 230000003321 amplification Effects 0.000 description 8
- 238000003199 nucleic acid amplification method Methods 0.000 description 8
- 230000009977 dual effect Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 229920000954 Polyglycolide Polymers 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 235000010409 propane-1,2-diol alginate Nutrition 0.000 description 2
- 230000008054 signal transmission Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M3/00—Conversion of analogue values to or from differential modulation
- H03M3/30—Delta-sigma modulation
- H03M3/39—Structural details of delta-sigma modulators, e.g. incremental delta-sigma modulators
- H03M3/436—Structural details of delta-sigma modulators, e.g. incremental delta-sigma modulators characterised by the order of the loop filter, e.g. error feedback type
- H03M3/438—Structural details of delta-sigma modulators, e.g. incremental delta-sigma modulators characterised by the order of the loop filter, e.g. error feedback type the modulator having a higher order loop filter in the feedforward path
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M1/00—Analogue/digital conversion; Digital/analogue conversion
- H03M1/12—Analogue/digital converters
- H03M1/18—Automatic control for modifying the range of signals the converter can handle, e.g. gain ranging
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/34—Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/034—Automatic adjustment
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M1/00—Analogue/digital conversion; Digital/analogue conversion
- H03M1/004—Reconfigurable analogue/digital or digital/analogue converters
- H03M1/007—Reconfigurable analogue/digital or digital/analogue converters among different resolutions
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M1/00—Analogue/digital conversion; Digital/analogue conversion
- H03M1/06—Continuously compensating for, or preventing, undesired influence of physical parameters
- H03M1/08—Continuously compensating for, or preventing, undesired influence of physical parameters of noise
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M1/00—Analogue/digital conversion; Digital/analogue conversion
- H03M1/12—Analogue/digital converters
- H03M1/18—Automatic control for modifying the range of signals the converter can handle, e.g. gain ranging
- H03M1/181—Automatic control for modifying the range of signals the converter can handle, e.g. gain ranging in feedback mode, i.e. by determining the range to be selected from one or more previous digital output values
- H03M1/183—Automatic control for modifying the range of signals the converter can handle, e.g. gain ranging in feedback mode, i.e. by determining the range to be selected from one or more previous digital output values the feedback signal controlling the gain of an amplifier or attenuator preceding the analogue/digital converter
- H03M1/185—Automatic control for modifying the range of signals the converter can handle, e.g. gain ranging in feedback mode, i.e. by determining the range to be selected from one or more previous digital output values the feedback signal controlling the gain of an amplifier or attenuator preceding the analogue/digital converter the determination of the range being based on more than one digital output value, e.g. on a running average, a power estimation or the rate of change
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M3/00—Conversion of analogue values to or from differential modulation
- H03M3/30—Delta-sigma modulation
- H03M3/458—Analogue/digital converters using delta-sigma modulation as an intermediate step
- H03M3/478—Means for controlling the correspondence between the range of the input signal and the range of signals the converter can handle; Means for out-of-range indication
- H03M3/488—Means for controlling the correspondence between the range of the input signal and the range of signals the converter can handle; Means for out-of-range indication using automatic control
- H03M3/49—Means for controlling the correspondence between the range of the input signal and the range of signals the converter can handle; Means for out-of-range indication using automatic control in feedback mode, i.e. by determining the range to be selected from one or more previous digital output values
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M1/00—Analogue/digital conversion; Digital/analogue conversion
- H03M1/12—Analogue/digital converters
- H03M1/60—Analogue/digital converters with intermediate conversion to frequency of pulses
Description
本願は、米国特許出願第14/696,172号(2015年4月24日出願、Yousof Mortazavi、他、名称「Analog−to−Digital Converter Dynamic Range Enhancement for Voice−Activated Systems」)に対する優先権を主張する。上記出願の全ては、その全体が参照により本明細書に引用される。
本開示は、アナログ/デジタルコンバータ(ADC)に関する。より具体的には、本開示の一部は、音声アクティブ化システムにおけるADCのダイナミックレンジ(DR)拡張に関する。
例えば、本願は以下の項目を提供する。
(項目1)
方法であって、前記方法は、
第1の構成を有する音声アクティブ化システムの入力経路を通して、オーディオの第1の部分を受信することと、
前記オーディオの第1の部分の特性を決定することと、
前記決定された特性に少なくとも部分的に基づいて、前記入力経路を第2の構成に調節することと、
前記第2の構成を有する前記入力経路を通して、オーディオの第2の部分を受信することと、
前記オーディオの第2の部分に対して発話分析を行うことと
を含む、方法。
(項目2)
前記入力経路を第2の構成に調節するステップは、前記入力経路のダイナミックレンジ(DR)を増加させることを含む、項目1に記載の方法。
(項目3)
前記オーディオの第1の部分は、トリガコマンドを備え、前記オーディオの第2の部分は、命令コマンドを備えている、項目1に記載の方法。
(項目4)
前記特性を決定するステップは、信号対雑音比(SNR)、信号レベル、および周波数成分のうちの少なくとも1つを決定することを含む、項目1に記載の方法。
(項目5)
前記入力経路を調節するステップは、前記入力経路の利得、信号対雑音比(SNR)、およびダイナミックレンジのうちの少なくとも1つを調節することを含む、項目1に記載の方法。
(項目6)
前記入力経路を調節するステップは、
前記入力経路の第1のアナログ/デジタルコンバータ(ADC)を非アクティブにすることと、
前記入力経路の第2のアナログ/デジタルコンバータ(ADC)をアクティブにすることと
を含む、項目1に記載の方法。
(項目7)
前記第1のADCは、低電力低ダイナミックレンジADCを備え、前記第2のADCは、高電力高ダイナミックレンジADCを備えている、項目6に記載の方法。
(項目8)
前記入力経路を調節するステップは、前記入力経路の増幅器のための利得を前記第1の構成の第1の値から前記第2の構成のより高い第2の値に調節することを含む、項目1に記載の方法。
(項目9)
前記利得を調節するステップは、前記オーディオの第1の部分の信号レベルに少なくとも部分的に基づいて、前記利得を調節し、前記オーディオの第2の部分に対して発話分析を行うための前記入力経路内の所望の信号対雑音比(SNR)を得ることを含む、項目8に記載の方法。
(項目10)
前記受信されたオーディオの第2の部分の特性に少なくとも部分的に基づいて、前記入力経路の利得を第3の構成に調節することと、
前記第3の構成を有する前記入力経路を通して、オーディオの第3の部分を受信することと、
前記オーディオの第3の部分に対して発話分析を行うことと、
オーディオの追加の部分のために、前記入力経路の利得の調節を継続することと
をさらに含む、項目8に記載の方法。
(項目11)
前記入力経路を調節するステップは、前記入力経路のアナログ/デジタルコンバータ(ADC)のための雑音床値を前記第1の構成のための第1の値から前記第2の構成のためのより低い第2の値に調節することを含む、項目1に記載の方法。
(項目12)
前記雑音床値を調節するステップは、
前記アナログ/デジタルコンバータ(ADC)内のレジスタの値を調節することと、
前記アナログ/デジタルコンバータ(ADC)内のコンデンサの値を調節することと、
前記アナログ/デジタルコンバータ(ADC)内を流れる電流の値を調節することと
のうちの少なくとも1つを含む、項目11に記載の方法。
(項目13)
前記発話分析を行うステップは、デジタル信号プロセッサ(DSP)を用いて発話分析を行うことを含む、項目1に記載の方法。
(項目14)
装置であって、前記装置は、
マイクロホンと、
音声コマンドを受信するように構成され、オーディオ信号を前記マイクロホンから受信するように結合されている入力経路であって、前記入力経路は、アナログ/デジタルコンバータ(ADC)を備えている、入力経路と、
前記入力経路に結合され、前記オーディオ信号のデジタル表現を受信するデジタル信号プロセッサ(DSP)と
を備え、前記DSPは、
第1の構成を有する前記入力経路を通して、オーディオの第1の部分を受信することと、
前記オーディオの第1の部分の特性を決定することと、
前記決定された特性に少なくとも部分的に基づいて、前記入力経路を第2の構成に調節することと、
前記第2の構成を有する前記入力経路を通して、オーディオの第2の部分を受信することと
を行うように構成されている、装置。
(項目15)
前記デジタル信号プロセッサ(DSP)は、前記入力経路のダイナミックレンジ(DR)を増加させることによって、前記入力経路を第2の構成に調節するように構成されている、項目14に記載の装置。
(項目16)
前記オーディオの第1の部分は、トリガコマンドを備え、前記オーディオの第2の部分は、命令コマンドを備えている、項目14に記載の装置。
(項目17)
前記入力経路は、第2のアナログ/デジタルコンバータ(ADC)をさらに備え、前記DSPは、
前記入力経路の第1のアナログ/デジタルコンバータ(ADC)を非アクティブにすることと、
前記入力経路の第2のアナログ/デジタルコンバータ(ADC)をアクティブにすることと
によって、前記入力経路を調節するステップを行うように構成されている、項目14に記載の装置。
(項目18)
前記第1のADCは、低電力低ダイナミックレンジADCを備え、前記第2のADCは、高電力高ダイナミックレンジADCを備えている、項目17に記載の装置。
(項目19)
前記入力経路は、前記マイクロホンと前記アナログ/デジタルコンバータ(ADC)との間に結合されている増幅器をさらに備え、前記入力経路を調節するステップは、前記入力経路の増幅器のための利得を前記第1の構成の第1の値から前記第2の構成のより高い第2の値に調節することを含む、項目14に記載の装置。
(項目20)
前記利得を調節するステップは、前記オーディオの第1の部分の信号レベルに少なくとも部分的に基づいて、前記利得を調節し、前記オーディオの第2の部分に対して発話分析を行うための前記入力経路内の所望の信号対雑音比(SNR)を得ることを含む、項目19に記載の装置。
(項目21)
前記DSPは、
前記受信されたオーディオの第2の部分に少なくとも部分的に基づいて、前記入力経路の利得を第3の構成に調節することと、
前記第3の構成を有する前記入力経路を通して、オーディオの第3の部分を受信することと、
前記オーディオの第3の部分に対して発話分析を行うことと、
オーディオの追加の部分のために、前記入力経路の利得の調節を継続することと
を行うようにさらに構成されている、項目19に記載の装置。
(項目22)
前記入力経路を調節するステップは、前記入力経路のアナログ/デジタルコンバータ(ADC)の雑音床値を前記第1の構成のための第1の値から前記第2の構成のためのより低い第2の値に調節することを含む、項目14に記載の装置。
(項目23)
前記雑音床値を調節するステップは、
前記アナログ/デジタルコンバータ(ADC)内のレジスタの値を調節することと、
前記アナログ/デジタルコンバータ(ADC)内のコンデンサの値を調節することと、
前記アナログ/デジタルコンバータ(ADC)内を流れる電流の値を調節することと
のうちの少なくとも1つを含む、項目22に記載の装置。
(項目24)
前記DSPは、前記オーディオの第2の部分に対して発話分析を行うステップを行うようにさらに構成されている、項目14に記載の装置。
(項目25)
モバイルデバイスであって、前記モバイルデバイスは、
マイクロホンと、
前記マイクロホンに結合され、音声コマンドを備えているオーディオ信号を前記マイクロホンから受信するように構成されているオーディオ処理回路と
を備え、
前記オーディオ処理回路は、
アナログ/デジタルコンバータ(ADC)と、
前記ADCに結合され、前記オーディオ信号のデジタル表現を受信するデジタル信号プロセッサ(DSP)と
を備え、
前記オーディオ処理回路は、
前記オーディオ処理回路が第1の構成に構成されている間、オーディオの第1の部分を前記マイクロホンから受信することと、
前記オーディオの第1の部分の特性を決定することと、
前記決定された特性に少なくとも部分的に基づいて、前記オーディオ処理回路を第2の構成に調節することと、
前記オーディオ処理回路が第2の構成に構成されている間、オーディオの第2の部分を前記マイクロホンを通して受信することと
を行うように構成されている、モバイルデバイス。
(項目26)
前記オーディオ処理回路は、前記入力経路のダイナミックレンジ(DR)を増加させることによって、前記入力経路を第2の構成に調節するように構成されている、項目25に記載のモバイルデバイス。
(項目27)
前記オーディオの第1の部分は、トリガコマンドを備え、前記オーディオの第2の部分は、命令コマンドを備えている、項目25に記載のモバイルデバイス。
(項目28)
前記入力経路は、第2のアナログ/デジタルコンバータ(ADC)をさらに備え、前記DSPは、
前記入力経路のアナログ/デジタルコンバータ(ADC)を非アクティブにすることと、
前記入力経路の第2のアナログ/デジタルコンバータ(ADC)をアクティブにすること
によって、前記入力経路を調節するステップを行うように構成されている、項目25に記載のモバイルデバイス。
(項目29)
前記ADCは、低電力低ダイナミックレンジADCを備え、前記第2のADCは、高電力高ダイナミックレンジADCを備えている、項目28に記載のモバイルデバイス。
(項目30)
前記オーディオ処理回路は、前記マイクロホンと前記アナログ/デジタルコンバータ(ADC)との間に結合されている増幅器をさらに備え、前記入力経路を調節するステップは、前記入力経路の増幅器のための利得を前記第1の構成の第1の値から前記第2の構成のより高い第2の値に調節することを含む、項目25に記載のモバイルデバイス。
(項目31)
前記利得を調節するステップは、前記オーディオの第1の部分の信号レベルに少なくとも部分的に基づいて、前記利得を調節し、前記オーディオの第2の部分に対して発話分析を行うための前記入力経路内の所望の信号対雑音比(SNR)を得ることを含む、項目30に記載のモバイルデバイス。
(項目32)
前記オーディオ処理回路は、
前記受信されたオーディオの第2の部分に少なくとも部分的に基づいて、前記増幅器の利得を第3の構成に調節するステップと、
前記利得が前記第3の構成に設定されている間、オーディオの第3の部分を受信するステップと、
前記オーディオの第3の部分に対して発話分析を行うステップと、
オーディオの追加の部分のために、前記増幅器の利得の調節を継続するステップと
を行うようにさらに構成されている、項目31に記載のモバイルデバイス。
(項目33)
前記入力経路を調節するステップは、前記入力経路のアナログ/デジタルコンバータ(ADC)のための雑音床値を前記第1の構成のための第1の値から前記第2の構成のためのより低い第2の値に調節することを含む、項目25に記載のモバイルデバイス。
(項目34)
前記オーディオ処理回路は、可変レジスタおよび可変コンデンサのうちの少なくとも1つを備え、前記オーディオ処理回路は、
前記アナログ/デジタルコンバータ(ADC)内のレジスタの値を調節するステップと、
前記アナログ/デジタルコンバータ(ADC)内のコンデンサの値を調節するステップと、
前記アナログ/デジタルコンバータ(ADC)内を流れる電流の値を調節するステップと
のうちの少なくとも1つを行うことによって、前記雑音床値を調節するように構成されている、項目33に記載のモバイルデバイス。
(項目35)
前記オーディオ処理回路は、前記オーディオの第2の部分に対して発話分析を行うステップを行うようにさらに構成されている、項目25に記載のモバイルデバイス。
(項目36)
前記デジタル信号プロセッサ(DSP)は、前記モバイルデバイスの汎用中央処理ユニット(CPU)の一部を備えている、項目25に記載のモバイルデバイス。
Claims (30)
- 方法であって、前記方法は、
第1の構成を有する音声アクティブ化システムの入力経路を通して、オーディオの第1の部分を受信することと、
前記オーディオの第1の部分の特性を決定することと、
前記決定された特性に少なくとも部分的に基づいて、前記入力経路を第2の構成に調節することと、
前記第2の構成を有する前記入力経路を通して、オーディオの第2の部分を受信することと、
前記オーディオの第2の部分に対して発話分析を行うことと
を含み、
前記入力経路を調節するステップは、前記入力経路の増幅器のための利得を前記第1の構成の第1の値から前記第2の構成のより高い第2の値に調節することを含み、
前記利得を調節するステップは、前記オーディオの第1の部分の信号レベルに少なくとも部分的に基づいて、前記利得を調節することにより、前記オーディオの第2の部分に対して発話分析を行うための前記入力経路内の所望の信号対雑音比(SNR)を得ることを含む、方法。 - 前記入力経路を第2の構成に調節するステップは、前記入力経路のダイナミックレンジ(DR)を増加させることを含む、請求項1に記載の方法。
- 前記オーディオの第1の部分は、トリガコマンドを備え、前記オーディオの第2の部分は、命令コマンドを備えている、請求項1に記載の方法。
- 前記特性を決定するステップは、信号対雑音比(SNR)、信号レベル、周波数成分のうちの少なくとも1つを決定することを含む、請求項1に記載の方法。
- 前記入力経路を調節するステップは、前記入力経路の利得、信号対雑音比(SNR)、ダイナミックレンジのうちの少なくとも1つを調節することを含む、請求項1に記載の方法。
- 前記入力経路を調節するステップは、
前記入力経路の第1のアナログ/デジタルコンバータ(ADC)を非アクティブにすることと、
前記入力経路の第2のアナログ/デジタルコンバータ(ADC)をアクティブにすることと
を含む、請求項1に記載の方法。 - 前記第1のADCは、低電力低ダイナミックレンジADCを備え、前記第2のADCは、高電力高ダイナミックレンジADCを備えている、請求項6に記載の方法。
- 前記受信されたオーディオの第2の部分の特性に少なくとも部分的に基づいて、前記入力経路の利得を第3の構成に調節することと、
前記第3の構成を有する前記入力経路を通して、オーディオの第3の部分を受信することと、
前記オーディオの第3の部分に対して発話分析を行うことと、
オーディオの追加の部分のために、前記入力経路の利得の調節を継続することと
をさらに含む、請求項1に記載の方法。 - 前記入力経路を調節するステップは、前記入力経路のアナログ/デジタルコンバータ(ADC)のための雑音床値を前記第1の構成のための第1の値から前記第2の構成のためのより低い第2の値に調節することを含む、請求項1に記載の方法。
- 前記雑音床値を調節するステップは、
前記アナログ/デジタルコンバータ(ADC)内のレジスタの値を調節することと、
前記アナログ/デジタルコンバータ(ADC)内のコンデンサの値を調節することと、
前記アナログ/デジタルコンバータ(ADC)内を流れる電流の値を調節することと
のうちの少なくとも1つを含む、請求項9に記載の方法。 - 前記発話分析を行うステップは、デジタル信号プロセッサ(DSP)を用いて発話分析を行うことを含む、請求項1に記載の方法。
- 装置であって、前記装置は、
マイクロホンと、
音声コマンドを受信するように構成され、オーディオ信号を前記マイクロホンから受信するように結合されている入力経路であって、前記入力経路は、アナログ/デジタルコンバータ(ADC)を備えている、入力経路と、
前記入力経路に結合され、前記オーディオ信号のデジタル表現を受信するデジタル信号プロセッサ(DSP)と
を備え、前記DSPは、
第1の構成を有する前記入力経路を通して、オーディオの第1の部分を受信することと、
前記オーディオの第1の部分の特性を決定することと、
前記決定された特性に少なくとも部分的に基づいて、前記入力経路を第2の構成に調節することと、
前記第2の構成を有する前記入力経路を通して、オーディオの第2の部分を受信することと
を行うように構成されており、
前記入力経路は、前記マイクロホンと前記アナログ/デジタルコンバータ(ADC)との間に結合されている増幅器をさらに備え、前記入力経路を調節するステップは、前記入力経路の増幅器のための利得を前記第1の構成の第1の値から前記第2の構成のより高い第2の値に調節することを含み、
前記利得を調節するステップは、前記オーディオの第1の部分の信号レベルに少なくとも部分的に基づいて、前記利得を調節することにより、前記オーディオの第2の部分に対して発話分析を行うための前記入力経路内の所望の信号対雑音比(SNR)を得ることを含む、装置。 - 前記デジタル信号プロセッサ(DSP)は、前記入力経路のダイナミックレンジ(DR)を増加させることによって、前記入力経路を第2の構成に調節するように構成されている、請求項12に記載の装置。
- 前記オーディオの第1の部分は、トリガコマンドを備え、前記オーディオの第2の部分は、命令コマンドを備えている、請求項12に記載の装置。
- 前記入力経路は、第2のアナログ/デジタルコンバータ(ADC)をさらに備え、前記DSPは、
前記入力経路の第1のアナログ/デジタルコンバータ(ADC)を非アクティブにすることと、
前記入力経路の第2のアナログ/デジタルコンバータ(ADC)をアクティブにすることと
によって、前記入力経路を調節するステップを行うように構成されている、請求項12に記載の装置。 - 前記第1のADCは、低電力低ダイナミックレンジADCを備え、前記第2のADCは、高電力高ダイナミックレンジADCを備えている、請求項15に記載の装置。
- 前記DSPは、
前記受信されたオーディオの第2の部分に少なくとも部分的に基づいて、前記入力経路の利得を第3の構成に調節することと、
前記第3の構成を有する前記入力経路を通して、オーディオの第3の部分を受信することと、
前記オーディオの第3の部分に対して発話分析を行うことと、
オーディオの追加の部分のために、前記入力経路の利得の調節を継続することと
を行うようにさらに構成されている、請求項12に記載の装置。 - 前記入力経路を調節するステップは、前記入力経路のアナログ/デジタルコンバータ(ADC)の雑音床値を前記第1の構成のための第1の値から前記第2の構成のためのより低い第2の値に調節することを含む、請求項12に記載の装置。
- 前記雑音床値を調節するステップは、
前記アナログ/デジタルコンバータ(ADC)内のレジスタの値を調節することと、
前記アナログ/デジタルコンバータ(ADC)内のコンデンサの値を調節することと、
前記アナログ/デジタルコンバータ(ADC)内を流れる電流の値を調節することと
のうちの少なくとも1つを含む、請求項18に記載の装置。 - 前記DSPは、前記オーディオの第2の部分に対して発話分析を行うステップを行うようにさらに構成されている、請求項12に記載の装置。
- モバイルデバイスであって、前記モバイルデバイスは、
マイクロホンと、
前記マイクロホンに結合され、音声コマンドを備えているオーディオ信号を前記マイクロホンから受信するように構成されているオーディオ処理回路と
を備え、
前記オーディオ処理回路は、
アナログ/デジタルコンバータ(ADC)と、
前記ADCに結合され、前記オーディオ信号のデジタル表現を受信するデジタル信号プロセッサ(DSP)と
を備え、
前記オーディオ処理回路は、
前記オーディオ処理回路が第1の構成に構成されている間、オーディオの第1の部分を前記マイクロホンから受信することと、
前記オーディオの第1の部分の特性を決定することと、
前記決定された特性に少なくとも部分的に基づいて、前記オーディオ処理回路を第2の構成に調節することと、
前記オーディオ処理回路が第2の構成に構成されている間、オーディオの第2の部分を前記マイクロホンを通して受信することと
を行うように構成されており、
前記オーディオ処理回路は、前記マイクロホンと前記アナログ/デジタルコンバータ(ADC)との間に結合されている増幅器をさらに備え、前記オーディオ処理回路を調節するステップは、前記オーディオ処理回路の増幅器のための利得を前記第1の構成の第1の値から前記第2の構成のより高い第2の値に調節することを含み、
前記利得を調節するステップは、前記オーディオの第1の部分の信号レベルに少なくとも部分的に基づいて、前記利得を調節することにより、前記オーディオの第2の部分に対して発話分析を行うための前記オーディオ処理回路内の所望の信号対雑音比(SNR)を得ることを含む、モバイルデバイス。 - 前記オーディオ処理回路は、前記オーディオ処理回路のダイナミックレンジ(DR)を増加させることによって、前記オーディオ処理回路を第2の構成に調節するように構成されている、請求項21に記載のモバイルデバイス。
- 前記オーディオの第1の部分は、トリガコマンドを備え、前記オーディオの第2の部分は、命令コマンドを備えている、請求項21に記載のモバイルデバイス。
- 前記オーディオ処理回路は、第2のアナログ/デジタルコンバータ(ADC)をさらに備え、前記DSPは、
前記オーディオ処理回路のアナログ/デジタルコンバータ(ADC)を非アクティブにすることと、
前記オーディオ処理回路の第2のアナログ/デジタルコンバータ(ADC)をアクティブにすること
によって、前記オーディオ処理回路を調節するステップを行うように構成されている、請求項21に記載のモバイルデバイス。 - 前記ADCは、低電力低ダイナミックレンジADCを備え、前記第2のADCは、高電力高ダイナミックレンジADCを備えている、請求項24に記載のモバイルデバイス。
- 前記オーディオ処理回路は、
前記受信されたオーディオの第2の部分に少なくとも部分的に基づいて、前記増幅器の利得を第3の構成に調節するステップと、
前記利得が前記第3の構成に設定されている間、オーディオの第3の部分を受信するステップと、
前記オーディオの第3の部分に対して発話分析を行うステップと、
オーディオの追加の部分のために、前記増幅器の利得の調節を継続するステップと
を行うようにさらに構成されている、請求項21に記載のモバイルデバイス。 - 前記オーディオ処理回路を調節するステップは、前記オーディオ処理回路のアナログ/デジタルコンバータ(ADC)のための雑音床値を前記第1の構成のための第1の値から前記第2の構成のためのより低い第2の値に調節することを含む、請求項21に記載のモバイルデバイス。
- 前記オーディオ処理回路は、可変レジスタおよび可変コンデンサのうちの少なくとも1つを備え、前記オーディオ処理回路は、
前記アナログ/デジタルコンバータ(ADC)内のレジスタの値を調節するステップと、
前記アナログ/デジタルコンバータ(ADC)内のコンデンサの値を調節するステップと、
前記アナログ/デジタルコンバータ(ADC)内を流れる電流の値を調節するステップと
のうちの少なくとも1つを行うことによって、前記雑音床値を調節するように構成されている、請求項27に記載のモバイルデバイス。 - 前記オーディオ処理回路は、前記オーディオの第2の部分に対して発話分析を行うステップを行うようにさらに構成されている、請求項21に記載のモバイルデバイス。
- 前記デジタル信号プロセッサ(DSP)は、前記モバイルデバイスの汎用中央処理ユニット(CPU)の一部を備えている、請求項21に記載のモバイルデバイス。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/696,172 | 2015-04-24 | ||
US14/696,172 US9799349B2 (en) | 2015-04-24 | 2015-04-24 | Analog-to-digital converter (ADC) dynamic range enhancement for voice-activated systems |
PCT/IB2016/000496 WO2016170413A1 (en) | 2015-04-24 | 2016-04-04 | Analog-to-digital converter (adc) dynamic range enhancement for voice-activated systems |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018518096A JP2018518096A (ja) | 2018-07-05 |
JP6517365B2 true JP6517365B2 (ja) | 2019-05-22 |
Family
ID=53677467
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017555693A Expired - Fee Related JP6517365B2 (ja) | 2015-04-24 | 2016-04-04 | 音声アクティブ化システムのためのアナログ/デジタルコンバータ(adc)ダイナミックレンジ拡張 |
Country Status (7)
Country | Link |
---|---|
US (1) | US9799349B2 (ja) |
EP (1) | EP3286837B1 (ja) |
JP (1) | JP6517365B2 (ja) |
KR (1) | KR102009475B1 (ja) |
CN (1) | CN107548508B (ja) |
GB (2) | GB2537694B (ja) |
WO (1) | WO2016170413A1 (ja) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10284217B1 (en) | 2014-03-05 | 2019-05-07 | Cirrus Logic, Inc. | Multi-path analog front end and analog-to-digital converter for a signal processing system |
US10785568B2 (en) | 2014-06-26 | 2020-09-22 | Cirrus Logic, Inc. | Reducing audio artifacts in a system for enhancing dynamic range of audio signal path |
US9959856B2 (en) | 2015-06-15 | 2018-05-01 | Cirrus Logic, Inc. | Systems and methods for reducing artifacts and improving performance of a multi-path analog-to-digital converter |
WO2016208789A1 (ko) * | 2015-06-26 | 2016-12-29 | 삼성전자 주식회사 | 소리를 판별하는 방법 및 이를 위한 장치 |
CN105609118B (zh) * | 2015-12-30 | 2020-02-07 | 生迪智慧科技有限公司 | 语音检测方法及装置 |
US9880802B2 (en) | 2016-01-21 | 2018-01-30 | Cirrus Logic, Inc. | Systems and methods for reducing audio artifacts from switching between paths of a multi-path signal processing system |
WO2017151650A1 (en) * | 2016-02-29 | 2017-09-08 | Littrell Robert J | A piezoelectric mems device for producing a signal indicative of detection of an acoustic stimulus |
US9998826B2 (en) | 2016-06-28 | 2018-06-12 | Cirrus Logic, Inc. | Optimization of performance and power in audio system |
US10545561B2 (en) * | 2016-08-10 | 2020-01-28 | Cirrus Logic, Inc. | Multi-path digitation based on input signal fidelity and output requirements |
US10263630B2 (en) | 2016-08-11 | 2019-04-16 | Cirrus Logic, Inc. | Multi-path analog front end with adaptive path |
US9929703B1 (en) | 2016-09-27 | 2018-03-27 | Cirrus Logic, Inc. | Amplifier with configurable final output stage |
US9967665B2 (en) | 2016-10-05 | 2018-05-08 | Cirrus Logic, Inc. | Adaptation of dynamic range enhancement based on noise floor of signal |
EP3566229B1 (en) * | 2017-01-23 | 2020-11-25 | Huawei Technologies Co., Ltd. | An apparatus and method for enhancing a wanted component in a signal |
US10321230B2 (en) | 2017-04-07 | 2019-06-11 | Cirrus Logic, Inc. | Switching in an audio system with multiple playback paths |
US10008992B1 (en) | 2017-04-14 | 2018-06-26 | Cirrus Logic, Inc. | Switching in amplifier with configurable final output stage |
US9917557B1 (en) | 2017-04-17 | 2018-03-13 | Cirrus Logic, Inc. | Calibration for amplifier with configurable final output stage |
US11475888B2 (en) * | 2018-04-29 | 2022-10-18 | Dsp Group Ltd. | Speech pre-processing in a voice interactive intelligent personal assistant |
US10726873B2 (en) * | 2018-08-14 | 2020-07-28 | Cirrus Logic, Inc. | Polymorphic playback system with signal detection filters of different latencies |
US10892772B2 (en) | 2018-08-17 | 2021-01-12 | Invensense, Inc. | Low power always-on microphone using power reduction techniques |
KR20200043642A (ko) | 2018-10-18 | 2020-04-28 | 삼성전자주식회사 | 동작 상태에 기반하여 선택한 마이크를 이용하여 음성 인식을 수행하는 전자 장치 및 그의 동작 방법 |
KR20200084727A (ko) * | 2019-01-03 | 2020-07-13 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
US11418882B2 (en) | 2019-03-14 | 2022-08-16 | Vesper Technologies Inc. | Piezoelectric MEMS device with an adaptive threshold for detection of an acoustic stimulus |
KR20210141549A (ko) * | 2019-03-14 | 2021-11-23 | 베스퍼 테크놀로지스 인코포레이티드 | 상이한 전력 소비 수준에서 결정된 디지털 출력을 갖는 마이크로폰 |
US10763889B1 (en) | 2019-03-22 | 2020-09-01 | Texas Instruments Incorporated | Analog-to-digital converter with dynamic range enhancer |
JP2020170101A (ja) * | 2019-04-04 | 2020-10-15 | 日本電信電話株式会社 | 音量調整装置、その方法、およびプログラム |
US11438697B2 (en) | 2019-06-07 | 2022-09-06 | Cirrus Logic, Inc. | Low-latency audio output with variable group delay |
US10701486B1 (en) | 2019-06-07 | 2020-06-30 | Cirrus Logic, Inc. | Low-latency audio output with variable group delay |
FR3097633B1 (fr) * | 2019-06-19 | 2021-11-12 | Alliantech | Dispositif de mesure microphonique portatif |
US11726105B2 (en) | 2019-06-26 | 2023-08-15 | Qualcomm Incorporated | Piezoelectric accelerometer with wake function |
TWI760939B (zh) * | 2020-11-25 | 2022-04-11 | 瑞昱半導體股份有限公司 | 音訊處理電路以及音訊處理方法 |
US11659329B2 (en) * | 2021-08-05 | 2023-05-23 | Infineon Technologies Ag | Efficient seamless switching of sigma-delta modulators |
US11606100B1 (en) * | 2021-10-25 | 2023-03-14 | Ess Technology, Inc. | Method and apparatus for enhancing dynamic range in an analog-to-digital converter |
Family Cites Families (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01303933A (ja) * | 1988-06-01 | 1989-12-07 | Matsushita Electric Ind Co Ltd | デジタル信号処理装置 |
JPH05224694A (ja) * | 1992-02-14 | 1993-09-03 | Ricoh Co Ltd | 音声認識装置 |
SE502618C2 (sv) * | 1994-10-03 | 1995-11-27 | Ericsson Telefon Ab L M | Förfarande och anordning för att erhålla ett brett dynamiskt område hos en mottagare i ett digitalt radiotransmissionssystem |
JP3522012B2 (ja) * | 1995-08-23 | 2004-04-26 | 沖電気工業株式会社 | コード励振線形予測符号化装置 |
US5983183A (en) * | 1997-07-07 | 1999-11-09 | General Data Comm, Inc. | Audio automatic gain control system |
US6359939B1 (en) * | 1998-05-20 | 2002-03-19 | Diva Systems Corporation | Noise-adaptive packet envelope detection |
DE10021824C2 (de) | 1999-05-07 | 2002-01-31 | Yamaha Corp | D/A-Wandlervorrichtung und D/A-Wandlerverfahren |
GB2355607B (en) * | 1999-10-20 | 2002-01-16 | Motorola Israel Ltd | Digital speech processing system |
JP2001217714A (ja) * | 2000-01-31 | 2001-08-10 | Toa Corp | ディジタル通信システム |
US6661901B1 (en) | 2000-09-01 | 2003-12-09 | Nacre As | Ear terminal with microphone for natural voice rendition |
US6583747B1 (en) * | 2002-05-24 | 2003-06-24 | Broadcom Corporation | Subranging analog to digital converter with multi-phase clock timing |
DE102004006957A1 (de) * | 2004-02-12 | 2005-09-15 | Infineon Technologies Ag | Verfahren und Vorrichtung zum Verstärken eines Empfangssignals |
KR100595707B1 (ko) * | 2004-12-08 | 2006-06-30 | 엘지전자 주식회사 | 듀얼모드 휴대단말기의 안테나 스위치 장치 및 방법 |
US8000302B2 (en) * | 2005-06-23 | 2011-08-16 | Qualcomm Incorporated | Adaptive multi-channel modem |
US20080300025A1 (en) * | 2007-05-31 | 2008-12-04 | Motorola, Inc. | Method and system to configure audio processing paths for voice recognition |
US7755523B2 (en) | 2007-09-24 | 2010-07-13 | Nanoamp Mobile, Inc. | ADC use with multiple signal modes |
US8099289B2 (en) * | 2008-02-13 | 2012-01-17 | Sensory, Inc. | Voice interface and search for electronic devices including bluetooth headsets and remote systems |
US20090287489A1 (en) * | 2008-05-15 | 2009-11-19 | Palm, Inc. | Speech processing for plurality of users |
JP5614767B2 (ja) * | 2009-04-14 | 2014-10-29 | アルパイン株式会社 | 音声処理装置 |
JP4809454B2 (ja) | 2009-05-17 | 2011-11-09 | 株式会社半導体理工学研究センター | 発話推定による回路起動方法及び回路起動装置 |
US20110125494A1 (en) * | 2009-11-23 | 2011-05-26 | Cambridge Silicon Radio Limited | Speech Intelligibility |
DK2352312T3 (da) | 2009-12-03 | 2013-10-21 | Oticon As | Fremgangsmåde til dynamisk undertrykkelse af omgivende akustisk støj, når der lyttes til elektriske input |
US8217822B2 (en) * | 2010-11-09 | 2012-07-10 | Microsoft Corporation | Resolution enhancing analog-to-digital conversion |
US8717211B2 (en) | 2010-11-30 | 2014-05-06 | Qualcomm Incorporated | Adaptive gain adjustment system |
EP2800508B1 (en) * | 2012-01-06 | 2018-09-12 | Draeger Medical Systems, Inc. | System and method for improving signal to noise ratio for high frequency signal component |
US9838810B2 (en) | 2012-02-27 | 2017-12-05 | Qualcomm Technologies International, Ltd. | Low power audio detection |
CN113470640B (zh) * | 2013-02-07 | 2022-04-26 | 苹果公司 | 数字助理的语音触发器 |
US9043211B2 (en) * | 2013-05-09 | 2015-05-26 | Dsp Group Ltd. | Low power activation of a voice activated device |
EP3000241B1 (en) * | 2013-05-23 | 2019-07-17 | Knowles Electronics, LLC | Vad detection microphone and method of operating the same |
GB2541079B (en) | 2013-06-26 | 2018-03-14 | Cirrus Logic Int Semiconductor Ltd | Analog-to-digital converter |
US9697831B2 (en) * | 2013-06-26 | 2017-07-04 | Cirrus Logic, Inc. | Speech recognition |
US9245527B2 (en) * | 2013-10-11 | 2016-01-26 | Apple Inc. | Speech recognition wake-up of a handheld portable electronic device |
GB2520048B (en) * | 2013-11-07 | 2018-07-11 | Toshiba Res Europe Limited | Speech processing system |
KR102216048B1 (ko) * | 2014-05-20 | 2021-02-15 | 삼성전자주식회사 | 음성 명령 인식 장치 및 방법 |
US10276180B2 (en) * | 2014-07-21 | 2019-04-30 | Honeywell International Inc. | Audio command adaptive processing system and method |
GB2535766B (en) * | 2015-02-27 | 2019-06-12 | Imagination Tech Ltd | Low power detection of an activation phrase |
-
2015
- 2015-04-24 US US14/696,172 patent/US9799349B2/en active Active
- 2015-05-29 GB GB1509320.6A patent/GB2537694B/en active Active
- 2015-08-26 GB GB1515181.4A patent/GB2537697B/en active Active
-
2016
- 2016-04-04 JP JP2017555693A patent/JP6517365B2/ja not_active Expired - Fee Related
- 2016-04-04 KR KR1020177033848A patent/KR102009475B1/ko active IP Right Grant
- 2016-04-04 WO PCT/IB2016/000496 patent/WO2016170413A1/en active Application Filing
- 2016-04-04 CN CN201680023713.7A patent/CN107548508B/zh active Active
- 2016-04-04 EP EP16724458.1A patent/EP3286837B1/en active Active
Also Published As
Publication number | Publication date |
---|---|
GB2537694B (en) | 2019-07-10 |
WO2016170413A1 (en) | 2016-10-27 |
US9799349B2 (en) | 2017-10-24 |
US20160314805A1 (en) | 2016-10-27 |
GB2537697B (en) | 2019-09-11 |
EP3286837B1 (en) | 2022-06-08 |
CN107548508B (zh) | 2020-11-27 |
JP2018518096A (ja) | 2018-07-05 |
GB2537694A (en) | 2016-10-26 |
GB2537697A (en) | 2016-10-26 |
GB201515181D0 (en) | 2015-10-07 |
GB201509320D0 (en) | 2015-07-15 |
KR102009475B1 (ko) | 2019-08-09 |
KR20170140314A (ko) | 2017-12-20 |
WO2016170413A8 (en) | 2017-12-14 |
EP3286837A1 (en) | 2018-02-28 |
CN107548508A (zh) | 2018-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6517365B2 (ja) | 音声アクティブ化システムのためのアナログ/デジタルコンバータ(adc)ダイナミックレンジ拡張 | |
US10824391B2 (en) | Audio user interface apparatus and method | |
US9596537B2 (en) | Systems and methods for reduction of audio artifacts in an audio system with dynamic range enhancement | |
US20180160227A1 (en) | Speaker protection excursion oversight | |
US8165321B2 (en) | Intelligent clip mixing | |
JP4913906B2 (ja) | 音声デバイスの中の抑制する出力オフセット | |
US10979010B2 (en) | Audio signal processing | |
JP6067391B2 (ja) | 信号音量に基いた信号利得の適合時のピーク検出 | |
US9161127B2 (en) | Signal processing apparatus | |
WO2018107084A1 (en) | Data encoding detection | |
KR20150115653A (ko) | 오디오 불연속을 단조롭게 관리하기 위한 장치 및 방법 | |
JP2009135717A (ja) | Δς変調装置、遮断方法、プログラム、および、記録媒体 | |
GB2552280A (en) | Speech recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181019 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181205 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190304 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190401 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190417 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6517365 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |