CN107548508A - 用于话音激活的系统的模数转换器(adc)动态范围增强 - Google Patents

用于话音激活的系统的模数转换器(adc)动态范围增强 Download PDF

Info

Publication number
CN107548508A
CN107548508A CN201680023713.7A CN201680023713A CN107548508A CN 107548508 A CN107548508 A CN 107548508A CN 201680023713 A CN201680023713 A CN 201680023713A CN 107548508 A CN107548508 A CN 107548508A
Authority
CN
China
Prior art keywords
audio
adc
input path
analog
configuration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201680023713.7A
Other languages
English (en)
Other versions
CN107548508B (zh
Inventor
Y·莫尔塔扎维
J·L·梅兰桑
R·赞巴吉
A·布伦南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cirrus Logic International UK Ltd
Cirrus Logic International Semiconductor Ltd
Original Assignee
Wolfson Microelectronics PLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wolfson Microelectronics PLC filed Critical Wolfson Microelectronics PLC
Publication of CN107548508A publication Critical patent/CN107548508A/zh
Application granted granted Critical
Publication of CN107548508B publication Critical patent/CN107548508B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M3/00Conversion of analogue values to or from differential modulation
    • H03M3/30Delta-sigma modulation
    • H03M3/39Structural details of delta-sigma modulators, e.g. incremental delta-sigma modulators
    • H03M3/436Structural details of delta-sigma modulators, e.g. incremental delta-sigma modulators characterised by the order of the loop filter, e.g. error feedback type
    • H03M3/438Structural details of delta-sigma modulators, e.g. incremental delta-sigma modulators characterised by the order of the loop filter, e.g. error feedback type the modulator having a higher order loop filter in the feedforward path
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M1/00Analogue/digital conversion; Digital/analogue conversion
    • H03M1/12Analogue/digital converters
    • H03M1/18Automatic control for modifying the range of signals the converter can handle, e.g. gain ranging
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/34Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • G10L21/034Automatic adjustment
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M1/00Analogue/digital conversion; Digital/analogue conversion
    • H03M1/004Reconfigurable analogue/digital or digital/analogue converters
    • H03M1/007Reconfigurable analogue/digital or digital/analogue converters among different resolutions
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M1/00Analogue/digital conversion; Digital/analogue conversion
    • H03M1/06Continuously compensating for, or preventing, undesired influence of physical parameters
    • H03M1/08Continuously compensating for, or preventing, undesired influence of physical parameters of noise
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M1/00Analogue/digital conversion; Digital/analogue conversion
    • H03M1/12Analogue/digital converters
    • H03M1/18Automatic control for modifying the range of signals the converter can handle, e.g. gain ranging
    • H03M1/181Automatic control for modifying the range of signals the converter can handle, e.g. gain ranging in feedback mode, i.e. by determining the range to be selected from one or more previous digital output values
    • H03M1/183Automatic control for modifying the range of signals the converter can handle, e.g. gain ranging in feedback mode, i.e. by determining the range to be selected from one or more previous digital output values the feedback signal controlling the gain of an amplifier or attenuator preceding the analogue/digital converter
    • H03M1/185Automatic control for modifying the range of signals the converter can handle, e.g. gain ranging in feedback mode, i.e. by determining the range to be selected from one or more previous digital output values the feedback signal controlling the gain of an amplifier or attenuator preceding the analogue/digital converter the determination of the range being based on more than one digital output value, e.g. on a running average, a power estimation or the rate of change
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M3/00Conversion of analogue values to or from differential modulation
    • H03M3/30Delta-sigma modulation
    • H03M3/458Analogue/digital converters using delta-sigma modulation as an intermediate step
    • H03M3/478Means for controlling the correspondence between the range of the input signal and the range of signals the converter can handle; Means for out-of-range indication
    • H03M3/488Means for controlling the correspondence between the range of the input signal and the range of signals the converter can handle; Means for out-of-range indication using automatic control
    • H03M3/49Means for controlling the correspondence between the range of the input signal and the range of signals the converter can handle; Means for out-of-range indication using automatic control in feedback mode, i.e. by determining the range to be selected from one or more previous digital output values
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M1/00Analogue/digital conversion; Digital/analogue conversion
    • H03M1/12Analogue/digital converters
    • H03M1/60Analogue/digital converters with intermediate conversion to frequency of pulses

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Telephone Function (AREA)
  • Analogue/Digital Conversion (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

可以通过动态地调节话音激活的系统的输入路径的配置来改善所述话音激活的系统的动态范围和功率效率。在一个实施例中,可以通过具有第一配置的话音激活的系统的输入路径来接收音频的第一部分。可以确定音频的所述第一部分的特性并且可以基于所确定的特性来将所述输入路径调节到第二配置。然后,可以通过具有所述第二配置的输入路径来接收音频的第二部分,并且可以对音频的所述第二部分执行语音分析。

Description

用于话音激活的系统的模数转换器(ADC)动态范围增强
相关申请的交叉引用
本申请主张要求以Yousof Mortazavi等人的名义的题为“Analog-to-DigitalConverter Dynamic Range Enhancement for Voice-Activated Systems”的美国实用新型专利申请No.14/696172的优先权。其全部内容以其整体通过引用被并入本文。
技术领域
本公开涉及模数转换器(ADC)。更具体地,本公开的各部分涉及话音激活的系统中的ADC的动态范围(DR)增强。
背景技术
在常规的话音激活的系统中,监测并处理音频样本以检测人类话音活动的存在。在检测到人类话音活动之后,经由语音处理技术来进一步处理人类话音的音频样本。通常,特定词语或短语的表达触发所述系统从监测人类话音活动到执行语音处理的转换。例如,人类可以表达以下内容:“Blue Genie,温度是多少?”在该范例中,“Blue Genie”是“触发器”,并且剩余部分是“命令”。因此,常规的话音激活的系统将监测音频样本以检测触发器短语“Blue Genie”。在检测到触发器短语之后由人类话音表达的任何词语随后由话音激活的系统进行语音处理。
一种常规的实施方案使用单个高性能ADC来处理所有语音,包括触发器和命令。然而,该实施方案具有许多缺点。例如,设计和操作ADC以始终满足高信噪比(SNR)要求导致高功耗并且因此缩短电池寿命。在诸如移动电话的设备中,话音激活的控制常常不是控制电子系统的主要手段。因此,监测表达的词语而消耗的功率为移动设备的用户提供了有限的益处。
此处所提到的缺点仅仅是代表性的并且被简单地包括以突出显示存在对于经改进的电气部件、特别是对于ADC以及在诸如移动电话的消费级设备中采用的话音激活的系统中的语音检测的需求。在本文中所描述的实施例解决了某些缺点但是不必在此描述本领域中已知的每个或每一个。
发明内容
用于接收诸如话音命令的音频信号的可重新配置的输入路径可以提供在处理所述音频信号过程中的更低的功耗以及相似的性能。例如,可以通过基于对所接收的音频样本的分析来动态地调节话音激活的系统的部件的操作性能以实现在话音激活的系统中的ADC的低功率DR增强。例如,尽管所述话音激活的系统针对人类话音活动而监测音频样本,但是可以在低功率状态中操作所述话音激活的系统内的ADC。在已经检测到所述触发器之后,如果所述音频信号质量不足以对所述音频样本执行语音处理,那么ADC可以被调节以在更高性能状态中进行操作。例如,如果所述音频样本的SNR太低而不能满足用于语音处理所要求的SNR,则在检测到语音之后可以对所述ADC进行重新配置。仅当音频样本要求语音处理时,而不是在仅针对人类话音活动而监测音频样本时,当ADC在高性能状态中操作时可以增加功率效率并且可以改善DR。
可以改善功率效率,因为对于大量的时间而言,所述输入路径可以在操作的低功率(例如,低DR)模式中操作。提供话音激活的电子设备比对表达的词语执行语音处理更频繁地监测音频样本以检测人类话音活动。在没有可重新配置的输入路径的情况下,所述ADC将在该全部时间期间以高SNR来操作,使得所述话音激活的系统消耗比监测命令所需的更多的功率。当在移动设备中实施所述话音激活的系统时该结果是尤其不期望的,因为不必要的功耗降低了所述移动设备的电池寿命并且要求对电池的更频繁的充电,其两者降低了用户对所述移动设备的满意度。提供更低功耗的一种方案是降低SNR或者否则减少在监测触发器时在ADC处的音频处理功率。
在没有高性能语音处理软件例程的情况下,能够对在对触发器的检测之前所监测的音频样本进行处理。因此,针对话音激活的系统内的部件的性能要求在所述音频样本将被处理以检测人类话音活动时与在所述音频样本将经由语音处理技术进行处理时是不同的。例如,对于话音激活的系统内的ADC的最小信噪比(SNR)要求在所述音频样本将被处理以检测人类话音活动时与在所述音频样本将经由语音处理技术进行处理时相比可以是更低的。然而,因为常规的话音激活的系统利用单个ADC来处理所有音频样本,所述ADC被设计并且被操作以始终满足最高SNR要求。
根据一个实施例,一种用于话音激活的系统中的ADC的低功率DR增强的方法可以包括:通过具有第一配置的输入路径来接收音频的第一部分;确定音频的所述第一部分的特性;至少部分地基于所确定的特性来将所述输入路径调节到第二配置;通过具有所述第二配置的输入路径来接收音频的第二部分;和/或对音频的所述第二部分执行语音分析。在一些实施例中,执行语音分析的步骤包括利用数字信号处理器(DSP)执行语音分析。
在某些实施例中,音频的所述第一部分包括触发器命令,并且音频的所述第二部分包括指令命令。另外,在一些实施例中,确定所述特性的步骤包括确定以下中的至少一项:SNR、信号电平和频率内容。
在一些实施例中,调节所述输入路径包括调节以下中的至少一项:所述输入路径的增益、SNR和动态范围。具体地,根据一个实施例,调节所述输入路径包括将针对所述输入路径的放大器的增益从所述第一配置的第一值调节到所述第二配置的较高的第二值。在一些实施例中,调节所述增益包括至少部分地基于音频的所述第一部分的信号电平来调节所述增益,以获得用于对音频的所述第二部分执行语音分析的所述输入路径中的期望的SNR,音频的所述第二部分在一些实施例中可以包括指令命令。
在其他实施例中,调节所述输入路径可以包括将针对所述输入路径的ADC的噪声基底从所述第一配置的第一值部分调节到所述第二配置的较低的第二值部分。例如,根据一个实施例,调节所述噪声基底可以包括以下中的至少一项:调节所述ADC中的电阻器的值、调节所述ADC中的电容器的值、以及调节所述ADC中的电流的值。
根据另一实施例,调节所述输入路径还可以包括去激活所述输入路径的第一ADC并且激活所述输入路径的第二ADC。在一些实施例中,所述第一ADC可以是具有在其增益级中的最小信号放大的低功率、低动态范围(DR)ADC,并且所述第二ADC可以是比所述第一ADC具有在其增益级中的更多信号放大的高功率、高DR ADC。尽管针对所述第一ADC和所述第二ADC参考了功率,所述第一ADC和所述第二ADC可以具有相似的放大能力。与高功率第二ADC相比较,可以通过减小动态范围来获得低功率第一ADC。
在某些实施例中,所述方法也可以包括:至少部分地基于所接收的音频的第二部分的特性来将所述输入路径的增益调节到第三配置;通过具有所述第三配置的输入路径来接收音频的第三部分;对音频的所述第三部分执行语音分析;和/或针对音频的额外部分继续调节所述输入路径的增益。
根据另一实施例,一种装置可以包括:麦克风;输入路径,其被耦合以从所述麦克风接收音频信号,其中,所述输入路径包括ADC;和/或DSP,所述DSP被耦合到所述输入路径以接收所述音频信号的数字表示,其中,所述DSP被配置为:通过具有第一配置的所述输入路径来接收音频的第一部分;确定音频的所述第一部分的特性;至少部分地基于所确定的特性来将所述输入路径调节到第二配置;和/或通过具有所述第二配置的输入路径来接收音频的第二部分。在一些实施例中,所述DSP还被配置为对音频的所述第二部分执行语音分析的步骤。
在一些实施例中,所述输入路径还包括被耦合在所述麦克风与所述ADC之间的放大器,并且其中,调节所述输入路径的步骤包括将针对所述输入路径的放大器的增益从所述第一配置的第一值调节到所述第二配置的较高的第二值。在一个实施例中,调节所述增益的步骤包括至少部分地基于音频的所述第一部分的信号电平来调节所述增益以获得用于对音频的所述第二部分执行语音分析的所述输入路径中的期望的SNR。
根据实施例,调节所述输入路径的步骤包括将所述输入路径的所述ADC的噪声基底从针对所述第一配置的第一值调节到针对所述第二配置的较低的第二值。在一个实施例中,调节所述噪声基底的步骤包括以下中的至少一项:调节所述ADC中的电阻器的值;调节所述ADC中的电容器的值;以及调节所述ADC中的电流的值。
根据实施例,所述输入路径还包括第二ADC,并且其中,所述DSP被配置为执行通过以下操作来调节所述输入路径的步骤:去激活所述输入路径的第一ADC;并且激活所述输入路径的第二ADC。在一个实施例中,所述第一ADC包括低功率、低动态范围ADC,并且其中,所述第二ADC包括高功率、高动态范围ADC。
在某些实施例中,所述DSP还被配置为:至少部分地基于所接收的音频的第二部分来将所述输入路径的增益调节至第三配置;通过具有所述第三配置的输入路径来接收音频的第三部分;对音频的所述第三部分执行语音分析;和/或针对音频的额外部分继续调节所述输入路径的增益。
根据另一实施例,一种移动设备可以包括:麦克风;以及音频处理电路,所述音频处理电路被耦合到所述麦克风并且被配置为从所述麦克风接收音频信号。在一些实施例中,所述音频处理电路包括:模数转换器(ADC);和/或数字信号处理器(DSP),所述数字信号处理器被耦合到所述ADC以接收所述音频信号的数字表示,其中,所述音频处理电路被配置为:在所述音频处理电路被配置在第一配置中时,从所述麦克风接收音频的第一部分;确定音频的所述第一部分的特性;至少部分地基于所确定的特性来将所述音频处理电路调节到第二配置;和/或在所述音频处理电路被配置在所述第二配置中时,通过所述麦克风接收音频的第二部分。
在一些实施例中,所述音频处理电路还包括被耦合在所述麦克风与所述ADC之间的放大器,并且其中,调节所述输入路径的步骤包括将针对所述输入路径的放大器的增益从所述第一配置的第一值调节到所述第二配置的较高的第二值。在一个实施例中,调节所述增益的步骤包括至少部分地基于音频的所述第一部分的信号电平来调节所述增益,以获得用于对音频的所述第二部分执行语音分析的所述输入路径中的期望的SNR。
在另一实施例中,调节所述输入路径的步骤包括将针对所述输入路径的所述ADC的噪声基底从针对所述第一配置的第一值调节到针对所述第二配置的较低的第二值。例如,在一个实施例中,所述音频处理电路可以包括可变电阻器和可变电容器中的至少一个,其中,所述音频处理电路被配置为通过执行以下步骤中的至少一个步骤来调节所述噪声基底:调节所述ADC中的电阻器的值;调节所述ADC中的电容器的值;以及调节所述ADC中的电流的值。
在一些实施例中,所述输入路径还包括第二ADC,并且所述DSP被配置为执行通过以下操作来调节所述输入路径的步骤:去激活所述输入路径的所述模数转换器(ADC);并且激活所述输入路径的第二模数转换器(ADC)。在一个实施例中,所述ADC包括低功率、低动态范围ADC,并且所述第二ADC包括高功率、高动态范围ADC。
在某些实施例中,所述音频处理电路还被配置为执行以下步骤:至少部分地基于所接收的音频的第二部分来将所述放大器的增益调节到第三配置;在所述增益被设定到所述第三配置时接收音频的第三部分;对音频的所述第三部分执行语音分析;并且针对音频的额外部分继续调节所述放大器的增益。
在一些实施例中,所述音频处理电路还被配置为对音频的所述第二部分执行语音分析的步骤。另外,在一个实施例中,所述DSP包括所述移动设备的通用中央处理单元(CPU)的一部分。
前述内容已经概括了本发明的实施例的相当宽泛地某些特征和技术优点以便可以更好地理解下文的详细描述。在下文中将描述形成本发明的权利要求的主题的额外特征和优点。本领域普通技术人员应当理解,所公开的概念和特定实施例可以被容易地用作用于修改或设计用于执行相同或相似目的的其他结构的基础。本领域普通技术人员还应当认识到,这样的等效构造不脱离如在权利要求书中所阐述的本发明的精神和范围。将从结合附图考虑时的以下描述更好地理解额外特征。然而,应当明确理解,附图中的每个仅仅出于图示和描述的目的被提供的而并非旨在限制本发明。
附图说明
为了对所公开的系统和方法的更完整的理解,现在结合附图参考以下描述。
图1是图示了根据本公开的一个实施例的具有DR增强型ADC的话音激活的系统的范例示意性框图;
图2是根据本公开的一个实施例的用于检测触发器和用于执行语音处理的音频信号质量要求之间的区别的范例幅度对频率绘图图示;
图3是图示了根据本公开的一个实施例的可调节的连续时间δ-σ调制ADC的范例示意性框图;
图4是图示了根据本公开的一个实施例的可调节的双路径输入的范例示意性框图;
图5是图示了根据本公开的一个实施例的由可调节的输入路径实现的性能改进的范例幅度对频率绘图图示;
图6是图示了根据本公开的一个实施例的用于降低正由话音激活的系统处理的音频信号的幅度的另一话音激活的系统的范例示意性框图;并且
图7是图示了根据本公开的一个实施例的用于话音激活的系统的低功率DR增强的方法的范例流程图。
具体实施方式
在图1的示意性框图中图示了具有动态范围(DR)增强型低功率模数转换器(ADC)的话音激活的系统的一个实施例。电子系统100可以包括麦克风102、可编程增益放大器(PGA)104、ADC 106、缓存器108、数字信号处理器(DSP)110和计算网络112。模拟部件104和106以及数字部件108和110可以被集成在诸如话音激活的系统的混合信号系统114中。在一些实施例中,麦克风102可以是话音激活的系统114的一部分,而在其他实施例中,麦克风102可以在话音激活的系统114的外部。计算网络112可以是联网计算机和数据中心的“云”。在一些实施例中,可以由用于数据存储(诸如用于存储从话音转换的文本)的混合信号系统114来访问计算网络112。在其他实施例中,可以由用于处理语音的各部分的电子系统100来访问计算网络112,使得电子系统100将记录的音频发送到计算网络112并且接收回转录的文本。尽管图1将PGA 104和ADC 106图示为两个分离的部件,但是在一些实施例中,PGA 104和ADC 106可以被设计并且被操作为单个部件116。当被集成时,包括PGA 104和ADC 106的单个部件可以仍然被称为ADC。
当话音激活的系统114是空闲时,诸如当话音激活的系统114未正在执行语音处理时,话音激活的系统114可以在话音活动检测模式中操作,其中,其连续地处理音频样本以检测人类话音活动。例如,由麦克风102所检测的音频信号可以被传送到PGA 104和低功率ADC 106以将模拟音频信号转换为数字音频信号。麦克风102、PGA 104和ADC 106可以在几乎所有时间处是ON(开启)以降低在用户发出话音命令时的时刻与在命令的动作被执行时的时刻之间的响应时间。话音活动检测模式可以是话音激活的系统114的低功率模式。在话音激活的系统114处在话音活动检测模式中时,可以通过由DSP 110运行的软件例程的低最小信号质量实现低功耗。例如,DSP 110可能已经降低了对话音活动检测模式中的音频样本的SNR要求。
由ADC 106输出的数字音频样本可以被存储在缓存器108中,缓存器108可以是先进先出(FIFO)缓存器。DSP 110可以针对新样本而轮询所述缓存器108并且处理所述样本以确定人类话音活动是否存在。当检测到话音活动时,话音激活的系统114可以转换到话音唤醒模式(也被称为“触发器检测模式”),其中,DSP 110处理音频样本以检测触发器声音、词语、短语和/或句子。更复杂的DSP例程可以被用于在话音唤醒模式期间而不是在话音活动检测模式中处理音频样本。这些更复杂的例程可以是对于检测表达的触发器所必需的。更高级的例程可以要求更好的信号质量,诸如更高的SNR,其导致ADC 106的更大的功耗。
在检测到触发器之后,话音激活的系统114可以在语音处理模式(也被称为“命令处理模式”)中操作,其中,DSP 110利用语音处理软件算法处理所述音频样本以解释由人类话音说出的信息。该经解释的信息可以被用于发起通过电子系统100的进一步处理,诸如使得动作由电子系统100来执行。例如,在一些实施例中,DSP 110可以将所检测到的话音转换为文本并且将所述文本传送到计算网络112。该文本可以被显示在屏幕上或者被插入到文档中。备选地,所述文本可以使电子系统100执行动作。
由DSP 110检测触发器所要求的音频样本的信号质量可以与由DSP 110执行语音处理例程所要求的音频样本的信号质量不同。例如,图2是根据本公开的一个实施例的用于检测触发器和用于执行语音处理的音频信号质量要求之间的区别的范例幅度对频率绘图图示。到达水平202的音频信号产生20dB的SNR并且可以足以满足由DSP检测触发器所施加的SNR要求。然而,利用更高的SNR到达水平204的更强的音频信号可以对于满足由DSP对音频样本执行语音处理例程的所施加的SNR要求是必要的。在一些实施例中,尽管实际要求可以针对不同的实施例在该范围外部变化,但是用于执行语音处理的SNR要求可以与30dB一样低并且与40dB一样高。
为了解释宽的SNR要求范围,话音激活的系统100可以包括从DSP 110到PGA 104的反馈路径118,从而调节PGA 104的增益以使用单个ADC 106来满足不同的SNR要求。例如,在一些实施例中,DSP 110可以从具有第一配置的PGA 104和ADC 106的输入路径接收音频的第一部分,诸如触发器命令。例如,PGA 104可以被设定到第一增益值。在另一范例中,具有第一配置的输入路径可以包括输入路径的ADC 106被配置有第一噪声基底值。为了辅助向反馈路径118提供信号,DSP 110可以被配置为确定音频的第一部分的特性。例如,DSP 110可以被配置为确定以下中的至少一项:音频的第一部分中的音频样本的SNR、信号电平和频率内容。
DSP 110可以被配置为至少部分地基于所确定的特性来将输入路径调节到第二配置。例如,DSP 110可以将PGA 104的增益从第一增益值部分调节到较高的第二增益值。换言之,DSP 110可以至少部分地基于音频的第一部分的信号电平来调节PGA 104或其他放大部件的增益,以获得用于对音频的第二部分执行语音分析的输入路径中的期望的SNR。在其他实施例中,DSP 110可以通过将ADC 106的噪声基底从第一噪声基底值调节到较低的第二噪声基底值来将输入路径调节到第二配置以实现相似的结果。
为了图示根据本公开的一个实施例来调节输入路径的范例,图3提供了图示连续时间δ-σ调制ADC(ΔΣADC)的范例示意性框图。ΔΣADC 300可以包括积分器302、量化器304和数模转换器(DAC)306。在一些实施例中,ΔΣADC 300也可以包括额外的回路滤波部件(或者回路滤波器的剩余部分)308。
在一些实施例中,ΔΣADC 300可以对应于包括PGA 104和ADC 106的电路实施方案。换言之,ΔΣADC 300可以对应于包括放大部分和ADC部分的输入路径的单部件ADC实施例。在该实施例中调节输入路径可以包括调节ADC中的一个或多个电阻器的值,诸如积分器302中的电阻器310和312的值。例如,为了降低ΔΣADC 300的噪声基底值,可以降低电阻器310和312的电阻值。备选地,电阻器310和312的电阻值可以被增加以增加ΔΣADC 300的噪声基底值。因为在一些实施例中电阻器310和312可能需要是可调节的,所以电阻器310和312可以是可变电阻器(可变电阻)。备选地,电阻器310和312可以是开关电阻器元件,其组成被电阻器310和/或312代替的更大的可编程(可变)电阻设备。在另一实施例中,将所述输入路径从第一配置调节到第二配置可以包括调节ADC中的一个或多个电容器的值,诸如调节积分器302中的电容器314和316的值。例如,为了降低ΔΣADC 300的噪声基底值,可以增加电容器314和316的电容值。备选地,电容器314和316的电容值可以被降低以增加ΔΣADC300的噪声基底值。因为在一些实施例中电容器314和316可能需要是可调节的,所以电容器314和316可以是可变电容器。备选地,电容器314和316可以是开关电容器元件,其组成被电容器314和/或316代替的更大的可编程(可变)电容设备。
将所述输入路径从第一配置调节到第二配置还可以包括调节ADC中的电流的值。例如,被供应到ADC中的一些设备的电流可以被增加以降低ADC的噪声基底值并且增加SNR。备选地,被供应到ADC中的一些设备的电流可以被减小以增加ADC的噪声基底值。在一些实施例中,电阻器、电容器和电流的组合可以被调节以将所述输入路径从第一配置调节到第二配置的。
如上文所描述的,可以通过允许对输入路径的动态重新配置来提供两个或更多输入路径配置。也可以通过使用多个输入路径来提供两个或更多输入路径配置。图4提供了图示根据本公开的一个实施例的可以被调节的双路径输入路径的范例示意性框图。与在图1中所图示的电子系统100相似,电子系统400可以包括麦克风402、可编程增益放大器(PGA)404、ADC 406、缓存器408、数字信号处理器(DSP)410和计算网络412。PGA404可以是明确的增益级或虚拟/功能PGA,诸如在PGA 404由在ADC 406处所获得的固有增益替换时。具有双路径输入的电子系统400也包括额外的PGA 414、额外的ADC 416、第一多路复用器418和第二多路复用器420。在一些实施例中,每个PGA-ADC对可以被设计并且被操作以满足由DSP410所施加的不同的SNR要求。例如,包括PGA 404和ADC 406的PGA-ADC对可以对应于低功率、低动态范围ADC,其中,PGA 404可以被设定为具有低增益。所述低增益可以被选择以对于ADC 406足以输出具有用于DSP 410检测音频样本中的触发器的足够的SNR的音频样本。包括PGA 414和ADC 416的PGA-ADC对可以对应于高功率、高动态范围ADC,其中,PGA 414可以被设定为具有较高的增益。所述较高的增益可以被选择以对于ADC 416足以对音频样本执行语音处理例程。换言之,PGA 414可以具有比PGA 404较高的增益和/或ADC 416可以具有比ADC 406更低的噪声基底。在一些实施例中,在任何给定时间处,仅PGA-ADC对之一可以正在处理音频样本并且输出音频样本以用于由DSP 410进一步处理。在其中输入路径是双路径输入路径(诸如在图4中所图示的双路径输入路径)的实施例中,DSP可以被配置为执行通过去激活输入路径的第一ADC(诸如ADC 406)并且激活输入路径的第二ADC(诸如ADC416)来将输入路径从第一配置调节到第二配置的步骤。在一些实施例中,诸如在其中PGA-ADC对包括分离的PGA和ADC部件的实施例中,PGA 404也可以在ADC 406被去激活时被去激活并且PGA 414也可以在ADC 416被激活时被激活。尽管自始至终描述了两个PGA 404和414,但是可以在没有明确PGA404和414的情况下实现图4的一个实施例。例如,ADC 406和416可以被配置有不同的全标度,其将导致在不存在PGA 404和414的情况下两个路径中的不同的增益。
在一些实施例中,可以经由反馈路径422实现对在图4中所图示的双路径输入路径中的部件的去激活和激活。另外,在一些实施例中,反馈路径422也可以由DSP 410用于控制多路复用器418和420中的哪些路径被闭合以允许经由所述路径的信号传输以及哪些路径被打开以限制经由所述路径的信号传输。此外,尽管在图4中图示了多路复用器418,但是可以通过允许输入以驱动这两个输入而在没有多路复用器418的情况下实施反馈路径422。在该配置中,所述反馈将被提供到这两个路径(穿过ADC 406的第一路径以及穿过ADC 416的第二路径),并且多路复用器420将仅选择所述路径中的一个路径以通过系统400继续。尽管在图4中图示了仅两个PGA-ADC对,但是可以通过反馈路径422来实施和控制额外的对。
对所述输入路径的从第一配置到第二配置的调节可以增加输入路径中的部件的性能,使得从所述输入路径输出的音频样本具有足够的SNR以满足由DSP 110对音频样本执行语音处理所施加的SNR要求。例如,图5是图示了根据本公开的一个实施例的通过将输入路径调节到第二配置而实现的性能改进的范例幅度对频率绘图。当所述输入路径处在第一配置中时,所述输入路径可以产生具有足够的SNR到达水平502的音频样本,以满足用于触发器检测的要求。例如,在其中由DSP 110所施加的最小SNR要求是20dB的实施例中,所述第一配置中的输入路径可以输出具有至少20dB的SNR的音频样本。当输入路径处在第二配置中时,所述输入路径可以产生具有足够的SNR的音频样本以满足用于到达水平504的语音处理的要求。例如,当调节所述输入路径包括调节增益时,增益中的增加对于由第二配置中的输入路径输出的音频样本满足由用于对音频样本执行语音处理的DSP 110所施加的SNR要求的增加可以是足够的。
返回到图1,DSP 110还可以被配置为:在所述输入路径已经被调节以被配置在第二配置中之后,通过所述输入路径来接收音频的第二部分。由第二配置中的输入路径处理的音频样本可以具有足够的SNR以满足由DSP对音频样本执行语音处理所施加的SNR要求。DSP还可以被配置为对音频的第二部分执行语音分析。
在一些实施例中,所述输入路径的第二配置可以与所述输入路径的第一配置相同。例如,在一些实施例中,音频的第一部分的音频样本部分的SNR可以足够高以满足由DSP执行语音处理所施加的SNR要求。如果是的话,则ADC能够被维持在第一配置中以处理音频的第二部分和音频的后续部分,因为可以不需要SNR要求。
在一些实施例中,由DSP所接收的音频的第二部分可以具有产生太高以至于信号裁剪可能变为问题或者对于DSP 110太低以至于不能执行可靠的语音处理的SNR的幅度。例如,在一些实施例中,音频样本的信号特性可以基于音频的第一部分来确定,并且所述输入路径可以基于从音频的第一部分所确定的信号特性来调节。音频的第二部分可以不具有与音频的第一部分相同的信号特性。因此,在一些实施例中,DSP 110也可以检测音频的第二部分的特性并且基于从音频的第二部分所确定的信号特性来调节所述输入路径。
具体地,在一些实施例中,DSP 110还可以被配置为至少部分地基于所接收的音频的第二部分来将所述输入路径的增益调节到第三配置。例如,DSP 110还可以调节所述输入路径以:要么(1)当音频的第二部分中的音频样本不具有对于DSP执行语音处理足够的SNR时进一步增加由麦克风102所接收的音频样本的信号幅度;要么(2)当音频的第二部分中的音频样本具有太高的幅度以至于裁剪可能发生时,降低由麦克风102所接收的音频样本的信号幅度。在一些实施例中,信号电平可以被认为是太高以至于裁剪可能在信号电平超过阈值时发生。在另一实施例中,信号电平可以被认为是太高以至于当信号电平比能够由ADC处理的最大信号电平的90%更高时裁剪可能发生。
在所述输入路径已经被调节到第三配置之后,DSP 110可以通过具有第三配置的输入路径来接收音频的第三部分并且对音频的所述第三部分执行语音分析。在一些实施例中,DSP 110也可以被配置为音频的额外部分继续调节输入路径的增益。因此,在一些实施例中,对在所述输入路径中应用的增益的调节可以是动态调节,所述动态调节动态地增加或减小输入路径中应用的增益,使得由DSP处理的音频样本具有足够的SNR以执行可靠的语音处理而不是SNR太高以至于裁剪发生。
对所述输入路径的重新配置可以是足够快的,使得信号不被裁剪。例如,一旦检测到音频样本的信号电平太高,则DSP 110可以经由反馈路径118降低在PGA 104处的增益。图6图示了快速地降低正在由话音激活的系统处理的音频信号的幅度的范例示意性框图,其中,信号电平检测电路602被耦合到ADC 604和PGA 606。信号电平检测电路602可以检测正在由ADC 604处理的音频样本的信号电平,并且如果信号电平到达预定阈值,则信号电平检测电路602可以降低由PGA 606应用的增益。如果由DSP 610所接收的音频样本的幅度太低,那么DSP 610可以增加PGA 606处的增益。增益减小的速率以及增益增加的速率可以是非对称的。亦即,增益可以快速地减小以避免裁剪但是以较慢的速率增加以避免使话音激活的系统中的控制回路不稳定。
所述输入路径可以被调节以返回到第一配置以监测和处理用于人类话音活动和用于触发器的检测的音频样本。例如,在对音频样本的语音处理已经完成之后和/或如果人类话音活动不再存在于音频样本中,则所述输入路径能够被调节到第一配置以消耗更少的功率。在一些实施例中,所述话音激活的系统可以被配置为在自从对音频样本执行语音处理或者自从人类话音活动最后存在于音频样本中已经经过了预定时间量之后,将所述输入路径返回到第一配置。例如,在没有人类话音活动被检测到的期间的时间的五秒或更多秒之后,所述输入路径可以被返回到第一配置。
鉴于在本文中所示出和所描述的示范性系统,将参考各种功能框图更好地领会根据所公开的主题可以实施的方法。尽管出于解释的简单性的目的而将方法示出并且描述为一系列的动作/框,但是将理解并且将领会到,所主张的主题并不由框的数目或顺序限制,因为一些框可以以不同的顺序和/或与从在本文中描绘并且描述什么的其他框基本上相同的时间发生。此外,并非所有图示的框可以被要求实施在本文中所描述的方法。将领会到,可以由软件、硬件或者其组合或任何其他适合的装置(例如,设备、系统、过程或部件)来实施与各框相关联的功能。另外,还应当领会到,贯穿本说明书所公开的方法能够被存储在制造品上以促进将这样的方法传输并且传送到各种设备。本领域技术人员将理解并且将领会到,所述方法可以备选地被表示为一系列相关的状态或事件,诸如在状态图中。
图7是图示了根据本公开的一个实施例的用于话音激活的系统的低功率DR增强的方法的范例流程图。可以利用关于图1-6所描述的系统来实施方法700。方法700在框702处以通过具有第一配置的输入路径接收音频的第一部分开始。在一些实施例中,音频的所述第一部分可以包括触发器命令。在框704处,方法700包括确定音频的所述第一部分的特性,所述特性在一些实施例中可以包括以下中的至少一项:SNR、信号电平和频率内容。
方法700包括在框706处至少部分地基于所确定的特性将输入路径调节到第二配置。在一些实施例中,调节所述输入路径可以包括调节以下中的至少一项:所述输入路径的增益、SNR和动态范围。例如,根据一个实施例,调节所述输入路径可以包括将针对所述输入路径的放大器的增益从所述第一配置的第一值调节到所述第二配置的较高的第二值。在一些实施例中,调节所述增益可以包括至少部分地基于音频的所述第一部分的信号电平来调节所述增益,以获得用于对可以包括指令命令的音频的第二部分执行语音分析的输入路径中的期望的SNR。在其他实施例中,诸如在框706处调节所述输入路径可以包括将针对所述输入路径的ADC的噪声基底从第一配置的第一值部分调节到第二配置的较低的第二值部分。例如,根据一个实施例,调节所述噪声基底可以包括以下中的至少一项:调节ADC中的电阻器的值、调节ADC中的电容器的值、以及调节ADC中的电流的值。
根据另一实施例,所述输入路径可以是包括两个路径中的每个路径中的不同的ADC的双路径输入路径,其中,每个ADC能够根据不同的性能约束和规格来设计。在这样的实施例中,诸如在框706处调节所述输入路径也可以包括去激活所述输入路径的第一ADC并且激活所述输入路径的第二ADC。在一些实施例中,第一ADC可以是具有其增益级中的最小信号放大的低功率、低DR ADC,并且第二ADC可以是比第一ADC具有其增益级中的更多信号放大的高功率、高DR ADC。尽管针对第一和第二ADC参考功率,第一和第二ADC可以具有相似的放大能力。与较高功率的第二ADC相比较,可以通过减小动态范围来获得低功率的第一ADC。
接下来,方法700包括在框708处通过具有第二配置的输入路径来接收音频的第二部分。例如,音频的第二部分可以是包括由人类话音说出的指令命令的音频的部分。在框710处,方法700包括对音频的第二部分执行语音分析。例如,可以利用DSP(诸如在图1中所图示的DSP 110)来执行语音分析。
在一些实施例中,音频的第二部分中的音频样本的信号电平可以与音频的第一部分中的音频样本的信号电平是不同的。至少部分地基于所接收的音频的第二部分的特性,可以将所述输入路径的增益调节到第三配置。随后,可以通过具有第三配置的输入路径来接收音频的第三部分,并且可以对音频的第三部分执行语音分析。根据实施例,采用方法700的系统可以针对音频的额外部分继续调节所述输入路径的增益。
图7的示意性流程图通常被阐述为逻辑流程图。这样,所描绘的顺序和所标记的步骤指示所公开的方法的各方面。可以设想在功能、逻辑或效果方面等效于所图示的方法的一个或多个步骤或者其部分的其他步骤和方法。另外,所采用的格式和符号被提供以解释方法的逻辑步骤并且被理解为不限制所述方法的范围。尽管各种箭头类型和线类型可以被采用在流程图中,但是其被理解为不限制对应的方法的范围。实际上,一些箭头或其他连接器可以被用于仅指示方法的逻辑流。例如,箭头可以指示所描绘的方法的枚举步骤之间的未指定的持续时间的等待或监测时段。另外,特定方法发生的顺序可以严格地遵守所示的对应的步骤的顺序或者可以不严格地遵守所示的对应的步骤的顺序。
如果以固件和/或软件来实施,则上文所描述的功能可以作为一个或多个指令或代码被存储在计算机可读介质上。范例包括编码有数据结构的计算机可读介质以及编码有计算机程序的计算机可读介质。计算机可读介质包括物理计算机存储介质。存储介质可以是能够由计算机访问的任何可用介质。以范例而非限制的方式,这样的计算机可读介质能够包括随机存取存储器(RAM)、只读存储器(ROM)、电可擦可编程只读存储器(EEPROM)、压缩盘只读存储器(CD-ROM)或者其他光盘存储装置、磁盘存储装置或者其他磁性存储设备或者可以被用于存储以指令或数据结构的形式并且能够由计算机访问的期望的程序代码的任何其他介质。磁盘和光盘包括压缩盘(CD)、激光盘、光学盘、数字通用盘(DVD)、软盘和蓝光盘。一般地,磁盘磁性地再现数据,并且光盘光学地再现数据。上文的组合还应当被包括在计算机可读介质的范围内。
除了计算机可读介质上的存储装置之外,指令和/或数据可以被提供为被包括在通信装置中的传输介质上的信号。例如,通信装置可以包括具有指示指令和数据的信号的收发器。指令和数据被配置为使得一个或多个处理器来实施权利要求中概括的功能。
尽管已经详细描述本公开和某些代表性优点,但是应当理解,在不脱离如由权利要求书所限定的本公开的精神和范围的情况下,可以在本文中做出各种改变、替代和变更。此外,本申请的范围不旨在限于说明书中所描述的过程、机器、制造、物质组成、装置、方法和步骤的特定实施例。如本领域普通技术人员从本公开将容易领会到的,可以利用与本文所描述的对应的实施例执行基本上相同功能或者实现基本上相同结果的目前存在或稍后将被研发的过程、机器、制造、物质组成、装置、方法或步骤。因此,权利要求书旨在在其范围内包括这样的过程、机器、制造、物质组成、装置、方法或步骤。

Claims (36)

1.一种方法,包括:
通过具有第一配置的话音激活的系统的输入路径来接收音频的第一部分;
确定音频的所述第一部分的特性;
至少部分地基于所确定的特性来将所述输入路径调节到第二配置;
通过具有所述第二配置的所述输入路径来接收音频的第二部分;以及
对音频的所述第二部分执行语音分析。
2.根据权利要求1所述的方法,其中,将所述输入路径调节到第二配置的步骤包括增加所述输入路径的动态范围(DR)。
3.根据权利要求1所述的方法,其中,音频的所述第一部分包括触发器命令,并且其中,音频的所述第二部分包括指令命令。
4.根据权利要求1所述的方法,其中,确定所述特性的步骤包括确定以下中的至少一项:信噪比(SNR)、信号电平和频率内容。
5.根据权利要求1所述的方法,其中,调节所述输入路径的步骤包括调节以下中的至少一项:所述输入路径的增益、信噪比(SNR)和动态范围。
6.根据权利要求1所述的方法,其中,调节所述输入路径的步骤包括:
去激活所述输入路径的第一模数转换器(ADC);以及
激活所述输入路径的第二模数转换器(ADC)。
7.根据权利要求6所述的方法,其中,所述第一ADC包括低功率、低动态范围ADC,并且其中,所述第二ADC包括高功率、高动态范围ADC。
8.根据权利要求1所述的方法,其中,调节所述输入路径的步骤包括将针对所述输入路径的放大器的增益从所述第一配置的第一值调节到所述第二配置的较高的第二值。
9.根据权利要求8所述的方法,其中,调节所述增益的步骤包括至少部分地基于音频的所述第一部分的信号电平来调节所述增益,以获得用于对音频的所述第二部分执行语音分析的所述输入路径中的期望的信噪比(SNR)。
10.根据权利要求8所述的方法,还包括:
至少部分地基于所接收的音频的第二部分的特性来将所述输入路径的增益调节到第三配置;
通过具有所述第三配置的所述输入路径来接收音频的第三部分;
对音频的所述第三部分执行语音分析;以及
针对音频的额外部分继续调节所述输入路径的所述增益。
11.根据权利要求1所述的方法,其中,调节所述输入路径的步骤包括将针对所述输入路径的模数转换器(ADC)的噪声基底从针对所述第一配置的第一值调节到针对所述第二配置的较低的第二值。
12.根据权利要求11所述的方法,其中,调节所述噪声基底的步骤包括以下中的至少一项:
调节所述模数转换器(ADC)中的电阻器的值;
调节所述模数转换器(ADC)中的电容器的值;以及
调节所述模数转换器(ADC)中的电流的值。
13.根据权利要求1所述的方法,其中,执行语音分析的步骤包括利用数字信号处理器(DSP)来执行语音分析。
14.一种装置,包括:
麦克风;
输入路径,其被配置为接收话音命令并且被耦合以从所述麦克风接收音频信号,所述输入路径包括:
模数转换器(ADC);以及
数字信号处理器(DSP),其被耦合到所述输入路径以接收所述音频信号的数字表示,其中,所述DSP被配置为:
通过具有第一配置的所述输入路径来接收音频的第一部分;
确定音频的所述第一部分的特性;
至少部分地基于所确定的特性来将所述输入路径调节到第二配置;以及
通过具有所述第二配置的所述输入路径来接收音频的第二部分。
15.根据权利要求14所述的装置,其中,所述数字信号处理器(DSP)被配置为通过增加所述输入路径的动态范围(DR)来将所述输入路径调节到第二配置。
16.根据权利要求14所述的装置,其中,音频的所述第一部分包括触发器命令,并且其中,音频的所述第二部分包括指令命令。
17.根据权利要求14所述的装置,其中,所述输入路径还包括第二模数转换器(ADC),并且其中,所述DSP被配置为执行通过以下操作来调节所述输入路径的步骤:
去激活所述输入路径的第一模数转换器(ADC);以及
激活所述输入路径的第二模数转换器(ADC)。
18.根据权利要求17所述的装置,其中,所述第一ADC包括低功率、低动态范围ADC,并且其中,所述第二ADC包括高功率、高动态范围ADC。
19.根据权利要求14所述的装置,其中,所述输入路径还包括被耦合在所述麦克风与所述模数转换器(ADC)之间的放大器,并且其中,调节所述输入路径的步骤包括将针对所述输入路径的放大器的增益从所述第一配置的第一值调节到所述第二配置的较高的第二值。
20.根据权利要求19所述的装置,其中,调节所述增益的步骤包括至少部分地基于音频的所述第一部分的信号电平来调节所述增益,以获得用于对音频的所述第二部分执行语音分析的所述输入路径中的期望的信噪比(SNR)。
21.根据权利要求19所述的装置,其中,所述DSP还被配置为:
至少部分地基于所接收的音频的第二部分来将所述输入路径的增益调节到第三配置;
通过具有所述第三配置的所述输入路径来接收音频的第三部分;
对音频的所述第三部分执行语音分析;以及
针对音频的额外部分继续调节所述输入路径的所述增益。
22.根据权利要求14所述的装置,其中,调节所述输入路径的步骤包括将所述输入路径的所述模数转换器(ADC)的噪声基底从针对所述第一配置的第一值调节到针对所述第二配置的较低的第二值。
23.根据权利要求22所述的装置,其中,调节所述噪声基底的步骤包括以下中的至少一项:
调节所述模数转换器(ADC)中的电阻器的值;
调节所述模数转换器(ADC)中的电容器的值;以及
调节所述模数转换器(ADC)中的电流的值。
24.根据权利要求14所述的装置,其中,所述DSP还被配置为执行对音频的所述第二部分执行语音分析的步骤。
25.一种移动设备,包括:
麦克风;
音频处理电路,其被耦合到所述麦克风并且被配置为从所述麦克风接收包括话音命令的音频信号,所述音频处理电路包括:
模数转换器(ADC);以及
数字信号处理器(DSP),其被耦合到所述ADC以接收所述音频信号的数字表示,
其中,所述音频处理电路被配置为:
在所述音频处理电路被配置在第一配置中时从所述麦克风接收音频的第一部分;
确定音频的所述第一部分的特性;
至少部分地基于所确定的特性来将所述音频处理电路调节到第二配置;以及
在所述音频处理电路被配置在所述第二配置中时通过所述麦克风接收音频的第二部分。
26.根据权利要求25所述的移动设备,其中,所述音频处理电路被配置为通过增加所述输入路径的动态范围(DR)来将所述输入路径调节到第二配置。
27.根据权利要求25所述的移动设备,其中,音频的所述第一部分包括触发器命令,并且其中,音频的所述第二部分包括指令命令。
28.根据权利要求25所述的移动设备,其中,所述输入路径还包括第二模数转换器(ADC),并且其中,所述DSP被配置为执行通过以下操作来调节所述输入路径的步骤:
去激活所述输入路径的所述模数转换器(ADC);以及
激活所述输入路径的第二模数转换器(ADC)。
29.根据权利要求28所述的移动设备,其中,所述ADC包括低功率、低动态范围ADC,并且其中,所述第二ADC包括高功率、高动态范围ADC。
30.根据权利要求25所述的移动设备,其中,所述音频处理电路还包括被耦合在所述麦克风与所述模数转换器(ADC)之间的放大器,并且其中,调节所述输入路径的步骤包括将针对所述输入路径的放大器的增益从所述第一配置的第一值调节到所述第二配置的较高的第二值。
31.根据权利要求30所述的移动设备,其中,调节所述增益的步骤包括至少部分地基于音频的所述第一部分的信号电平来调节所述增益,以获得用于对音频的所述第二部分执行语音分析的所述输入路径中的期望的信噪比(SNR)。
32.根据权利要求31所述的移动设备,其中,所述音频处理电路还被配置为执行以下步骤:
至少部分地基于所接收的音频的第二部分来将所述放大器的所述增益调节到第三配置;
在所述增益被设定到所述第三配置时接收音频的第三部分;
对音频的所述第三部分执行语音分析;以及
针对音频的额外部分继续调节所述放大器的所述增益。
33.根据权利要求25所述的移动设备,其中,调节所述输入路径的步骤包括将针对所述输入路径的所述模数转换器(ADC)的噪声基底从针对所述第一配置的第一值调节到针对所述第二配置的较低的第二值。
34.根据权利要求33所述的移动设备,其中,所述音频处理电路包括可变电阻器和可变电容器中的至少一个,并且其中,所述音频处理电路被配置为通过执行以下步骤中的至少一个步骤来调节所述噪声基底:
调节所述模数转换器(ADC)中的电阻器的值;
调节所述模数转换器(ADC)中的电容器的值;以及
调节所述模数转换器(ADC)中的电流的值。
35.根据权利要求25所述的移动设备,其中,所述音频处理电路还被配置为执行对音频的所述第二部分执行语音分析的步骤。
36.根据权利要求25所述的移动设备,其中,所述数字信号处理器(DSP)包括所述移动设备的通用中央处理单元(CPU)的一部分。
CN201680023713.7A 2015-04-24 2016-04-04 用于模数转换器(adc)的动态范围增强的方法和装置 Active CN107548508B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/696,172 2015-04-24
US14/696,172 US9799349B2 (en) 2015-04-24 2015-04-24 Analog-to-digital converter (ADC) dynamic range enhancement for voice-activated systems
PCT/IB2016/000496 WO2016170413A1 (en) 2015-04-24 2016-04-04 Analog-to-digital converter (adc) dynamic range enhancement for voice-activated systems

Publications (2)

Publication Number Publication Date
CN107548508A true CN107548508A (zh) 2018-01-05
CN107548508B CN107548508B (zh) 2020-11-27

Family

ID=53677467

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680023713.7A Active CN107548508B (zh) 2015-04-24 2016-04-04 用于模数转换器(adc)的动态范围增强的方法和装置

Country Status (7)

Country Link
US (1) US9799349B2 (zh)
EP (1) EP3286837B1 (zh)
JP (1) JP6517365B2 (zh)
KR (1) KR102009475B1 (zh)
CN (1) CN107548508B (zh)
GB (2) GB2537694B (zh)
WO (1) WO2016170413A1 (zh)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10284217B1 (en) 2014-03-05 2019-05-07 Cirrus Logic, Inc. Multi-path analog front end and analog-to-digital converter for a signal processing system
US10785568B2 (en) 2014-06-26 2020-09-22 Cirrus Logic, Inc. Reducing audio artifacts in a system for enhancing dynamic range of audio signal path
US9959856B2 (en) 2015-06-15 2018-05-01 Cirrus Logic, Inc. Systems and methods for reducing artifacts and improving performance of a multi-path analog-to-digital converter
WO2016208789A1 (ko) * 2015-06-26 2016-12-29 삼성전자 주식회사 소리를 판별하는 방법 및 이를 위한 장치
CN105609118B (zh) * 2015-12-30 2020-02-07 生迪智慧科技有限公司 语音检测方法及装置
US9880802B2 (en) 2016-01-21 2018-01-30 Cirrus Logic, Inc. Systems and methods for reducing audio artifacts from switching between paths of a multi-path signal processing system
EP4351170A3 (en) * 2016-02-29 2024-07-03 Qualcomm Technologies, Inc. A piezoelectric mems device for producing a signal indicative of detection of an acoustic stimulus
US9998826B2 (en) 2016-06-28 2018-06-12 Cirrus Logic, Inc. Optimization of performance and power in audio system
US10545561B2 (en) * 2016-08-10 2020-01-28 Cirrus Logic, Inc. Multi-path digitation based on input signal fidelity and output requirements
US10263630B2 (en) 2016-08-11 2019-04-16 Cirrus Logic, Inc. Multi-path analog front end with adaptive path
US9929703B1 (en) 2016-09-27 2018-03-27 Cirrus Logic, Inc. Amplifier with configurable final output stage
US9967665B2 (en) 2016-10-05 2018-05-08 Cirrus Logic, Inc. Adaptation of dynamic range enhancement based on noise floor of signal
EP3566229B1 (en) * 2017-01-23 2020-11-25 Huawei Technologies Co., Ltd. An apparatus and method for enhancing a wanted component in a signal
US10321230B2 (en) 2017-04-07 2019-06-11 Cirrus Logic, Inc. Switching in an audio system with multiple playback paths
US10008992B1 (en) 2017-04-14 2018-06-26 Cirrus Logic, Inc. Switching in amplifier with configurable final output stage
US9917557B1 (en) 2017-04-17 2018-03-13 Cirrus Logic, Inc. Calibration for amplifier with configurable final output stage
US11475888B2 (en) * 2018-04-29 2022-10-18 Dsp Group Ltd. Speech pre-processing in a voice interactive intelligent personal assistant
US10726873B2 (en) * 2018-08-14 2020-07-28 Cirrus Logic, Inc. Polymorphic playback system with signal detection filters of different latencies
US10892772B2 (en) 2018-08-17 2021-01-12 Invensense, Inc. Low power always-on microphone using power reduction techniques
KR20200043642A (ko) 2018-10-18 2020-04-28 삼성전자주식회사 동작 상태에 기반하여 선택한 마이크를 이용하여 음성 인식을 수행하는 전자 장치 및 그의 동작 방법
KR20200084727A (ko) * 2019-01-03 2020-07-13 삼성전자주식회사 전자 장치 및 이의 제어 방법
US11418882B2 (en) 2019-03-14 2022-08-16 Vesper Technologies Inc. Piezoelectric MEMS device with an adaptive threshold for detection of an acoustic stimulus
EP3939036A4 (en) * 2019-03-14 2022-12-28 Vesper Technologies Inc. MICROPHONE WITH DETERMINED DIGITAL OUTPUT AT DIFFERENT LEVELS OF POWER CONSUMPTION
US10763889B1 (en) * 2019-03-22 2020-09-01 Texas Instruments Incorporated Analog-to-digital converter with dynamic range enhancer
JP2020170101A (ja) * 2019-04-04 2020-10-15 日本電信電話株式会社 音量調整装置、その方法、およびプログラム
US10945074B2 (en) 2019-06-07 2021-03-09 Cirrus Logic, Inc. Low-latency compensating audio filters using negative group delay
US11438697B2 (en) 2019-06-07 2022-09-06 Cirrus Logic, Inc. Low-latency audio output with variable group delay
FR3097633B1 (fr) * 2019-06-19 2021-11-12 Alliantech Dispositif de mesure microphonique portatif
US11726105B2 (en) 2019-06-26 2023-08-15 Qualcomm Incorporated Piezoelectric accelerometer with wake function
TWI760939B (zh) * 2020-11-25 2022-04-11 瑞昱半導體股份有限公司 音訊處理電路以及音訊處理方法
US11659329B2 (en) * 2021-08-05 2023-05-23 Infineon Technologies Ag Efficient seamless switching of sigma-delta modulators
US11606100B1 (en) * 2021-10-25 2023-03-14 Ess Technology, Inc. Method and apparatus for enhancing dynamic range in an analog-to-digital converter
CN117714940B (zh) * 2024-02-05 2024-04-19 江西斐耳科技有限公司 一种aux功放链路底噪优化方法及系统

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05224694A (ja) * 1992-02-14 1993-09-03 Ricoh Co Ltd 音声認識装置
CN1159869A (zh) * 1994-10-03 1997-09-17 艾利森电话股份有限公司 传输系统中的方法和装置
US6359939B1 (en) * 1998-05-20 2002-03-19 Diva Systems Corporation Noise-adaptive packet envelope detection
US6583747B1 (en) * 2002-05-24 2003-06-24 Broadcom Corporation Subranging analog to digital converter with multi-phase clock timing
CN1681199A (zh) * 2004-02-12 2005-10-12 因芬尼昂技术股份公司 放大接收信号的方法及装置
CN1787391A (zh) * 2004-12-08 2006-06-14 乐金电子(中国)研究开发中心有限公司 双模式便携终端的天线开关装置及其方法
US20090287489A1 (en) * 2008-05-15 2009-11-19 Palm, Inc. Speech processing for plurality of users
CN101689367A (zh) * 2007-05-31 2010-03-31 摩托罗拉公司 配置用于语音识别的音频处理路径的方法和系统
US20100292987A1 (en) * 2009-05-17 2010-11-18 Hiroshi Kawaguchi Circuit startup method and circuit startup apparatus utilizing utterance estimation for use in speech processing system provided with sound collecting device
CN102427367A (zh) * 2010-11-09 2012-04-25 微软公司 分辨率增强的模数转换
WO2013103353A1 (en) * 2012-01-06 2013-07-11 Draeger Medical Systems, Inc. System and method for improving signal to noise ratio for high frequency signal component
WO2014124332A2 (en) * 2013-02-07 2014-08-14 Apple Inc. Voice trigger for a digital assistant
CN104144377A (zh) * 2013-05-09 2014-11-12 Dsp集团有限公司 话音激活设备的低功率激活
GB2515526A (en) * 2013-06-26 2014-12-31 Wolfson Microelectronics Plc Speech Recognition

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01303933A (ja) * 1988-06-01 1989-12-07 Matsushita Electric Ind Co Ltd デジタル信号処理装置
JP3522012B2 (ja) * 1995-08-23 2004-04-26 沖電気工業株式会社 コード励振線形予測符号化装置
US5983183A (en) * 1997-07-07 1999-11-09 General Data Comm, Inc. Audio automatic gain control system
DE10021824C2 (de) 1999-05-07 2002-01-31 Yamaha Corp D/A-Wandlervorrichtung und D/A-Wandlerverfahren
GB2355607B (en) * 1999-10-20 2002-01-16 Motorola Israel Ltd Digital speech processing system
JP2001217714A (ja) * 2000-01-31 2001-08-10 Toa Corp ディジタル通信システム
US6661901B1 (en) 2000-09-01 2003-12-09 Nacre As Ear terminal with microphone for natural voice rendition
US8000302B2 (en) * 2005-06-23 2011-08-16 Qualcomm Incorporated Adaptive multi-channel modem
US7755523B2 (en) 2007-09-24 2010-07-13 Nanoamp Mobile, Inc. ADC use with multiple signal modes
US8099289B2 (en) * 2008-02-13 2012-01-17 Sensory, Inc. Voice interface and search for electronic devices including bluetooth headsets and remote systems
JP5614767B2 (ja) * 2009-04-14 2014-10-29 アルパイン株式会社 音声処理装置
US20110125494A1 (en) * 2009-11-23 2011-05-26 Cambridge Silicon Radio Limited Speech Intelligibility
EP2352312B1 (en) 2009-12-03 2013-07-31 Oticon A/S A method for dynamic suppression of surrounding acoustic noise when listening to electrical inputs
US8717211B2 (en) 2010-11-30 2014-05-06 Qualcomm Incorporated Adaptive gain adjustment system
US9838810B2 (en) 2012-02-27 2017-12-05 Qualcomm Technologies International, Ltd. Low power audio detection
KR20160010606A (ko) * 2013-05-23 2016-01-27 노우레스 일렉트로닉스, 엘엘시 Vad 탐지 마이크로폰 및 그 마이크로폰을 동작시키는 방법
US9697831B2 (en) * 2013-06-26 2017-07-04 Cirrus Logic, Inc. Speech recognition
US9245527B2 (en) * 2013-10-11 2016-01-26 Apple Inc. Speech recognition wake-up of a handheld portable electronic device
GB2520048B (en) * 2013-11-07 2018-07-11 Toshiba Res Europe Limited Speech processing system
KR102216048B1 (ko) * 2014-05-20 2021-02-15 삼성전자주식회사 음성 명령 인식 장치 및 방법
US10276180B2 (en) * 2014-07-21 2019-04-30 Honeywell International Inc. Audio command adaptive processing system and method
GB2535766B (en) * 2015-02-27 2019-06-12 Imagination Tech Ltd Low power detection of an activation phrase

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05224694A (ja) * 1992-02-14 1993-09-03 Ricoh Co Ltd 音声認識装置
CN1159869A (zh) * 1994-10-03 1997-09-17 艾利森电话股份有限公司 传输系统中的方法和装置
US6359939B1 (en) * 1998-05-20 2002-03-19 Diva Systems Corporation Noise-adaptive packet envelope detection
US6583747B1 (en) * 2002-05-24 2003-06-24 Broadcom Corporation Subranging analog to digital converter with multi-phase clock timing
CN1681199A (zh) * 2004-02-12 2005-10-12 因芬尼昂技术股份公司 放大接收信号的方法及装置
CN1787391A (zh) * 2004-12-08 2006-06-14 乐金电子(中国)研究开发中心有限公司 双模式便携终端的天线开关装置及其方法
CN101689367A (zh) * 2007-05-31 2010-03-31 摩托罗拉公司 配置用于语音识别的音频处理路径的方法和系统
US20090287489A1 (en) * 2008-05-15 2009-11-19 Palm, Inc. Speech processing for plurality of users
US20100292987A1 (en) * 2009-05-17 2010-11-18 Hiroshi Kawaguchi Circuit startup method and circuit startup apparatus utilizing utterance estimation for use in speech processing system provided with sound collecting device
CN102427367A (zh) * 2010-11-09 2012-04-25 微软公司 分辨率增强的模数转换
WO2013103353A1 (en) * 2012-01-06 2013-07-11 Draeger Medical Systems, Inc. System and method for improving signal to noise ratio for high frequency signal component
WO2014124332A2 (en) * 2013-02-07 2014-08-14 Apple Inc. Voice trigger for a digital assistant
CN104144377A (zh) * 2013-05-09 2014-11-12 Dsp集团有限公司 话音激活设备的低功率激活
GB2515526A (en) * 2013-06-26 2014-12-31 Wolfson Microelectronics Plc Speech Recognition

Also Published As

Publication number Publication date
GB201515181D0 (en) 2015-10-07
WO2016170413A8 (en) 2017-12-14
GB2537697A (en) 2016-10-26
EP3286837B1 (en) 2022-06-08
US9799349B2 (en) 2017-10-24
GB2537694A (en) 2016-10-26
GB2537694B (en) 2019-07-10
KR20170140314A (ko) 2017-12-20
KR102009475B1 (ko) 2019-08-09
WO2016170413A1 (en) 2016-10-27
JP2018518096A (ja) 2018-07-05
GB2537697B (en) 2019-09-11
US20160314805A1 (en) 2016-10-27
JP6517365B2 (ja) 2019-05-22
CN107548508B (zh) 2020-11-27
EP3286837A1 (en) 2018-02-28
GB201509320D0 (en) 2015-07-15

Similar Documents

Publication Publication Date Title
CN107548508A (zh) 用于话音激活的系统的模数转换器(adc)动态范围增强
CN113812173B (zh) 处理音频信号的听力装置系统及方法
CN110473567B (zh) 基于深度神经网络的音频处理方法、装置及存储介质
CN104811891B (zh) 多通道音频中语音相关通道的缩放回避的方法和系统
CN102282867B (zh) 助听器和一种检测并衰减瞬变的方法
CN102907077B (zh) 用于移动装置的智能音频记录的系统和方法
JP2011508494A (ja) ノイズレベルに基づく利得制御付きノイズキャンセル・システム
US9671999B2 (en) Methods and apparatus for improving understandability of audio corresponding to dictation
US11627421B1 (en) Method for realizing hearing aid function based on bluetooth headset chip and a bluetooth headset
US9391575B1 (en) Adaptive loudness control
WO2016017229A1 (ja) 発話区間検出装置、音声処理システム、発話区間検出方法およびプログラム
US20160336023A1 (en) Methods and apparatus for improving understandability of audio corresponding to dictation
KR20210016619A (ko) 향상된 사용자 경험을 위한 햅틱 출력을 생성하는 시스템 및 방법
US9614486B1 (en) Adaptive gain control
JP6067391B2 (ja) 信号音量に基いた信号利得の適合時のピーク検出
GB2526980A (en) Sensor input recognition
Ni et al. A real-time smartphone app for field personalization of hearing enhancement by adaptive dynamic range optimization
CN111416909A (zh) 音量自适应调节方法、系统、存储介质及移动终端
CN102326416A (zh) 用于助听器的声音消息记录系统
US11490198B1 (en) Single-microphone wind detection for audio device
JP2009171057A (ja) 増幅回路
Kiselev et al. Event-driven local gain control on a spiking cochlea sensor
GB2553040A (en) Sensor input recognition
US20070076895A1 (en) Audio processing system and method for hearing protection
US11165401B2 (en) Dynamic and self-adjusting microphone gain for voice-enabled devices

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant