CN114584907A - 具有低数据速率接口的数字麦克风 - Google Patents
具有低数据速率接口的数字麦克风 Download PDFInfo
- Publication number
- CN114584907A CN114584907A CN202111318000.2A CN202111318000A CN114584907A CN 114584907 A CN114584907 A CN 114584907A CN 202111318000 A CN202111318000 A CN 202111318000A CN 114584907 A CN114584907 A CN 114584907A
- Authority
- CN
- China
- Prior art keywords
- data rate
- low data
- mems
- feature extraction
- extraction component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/08—Mouthpieces; Microphones; Attachments therefor
- H04R1/083—Special constructions of mouthpieces
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R19/00—Electrostatic transducers
- H04R19/005—Electrostatic transducers using semiconductor materials
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B81—MICROSTRUCTURAL TECHNOLOGY
- B81B—MICROSTRUCTURAL DEVICES OR SYSTEMS, e.g. MICROMECHANICAL DEVICES
- B81B3/00—Devices comprising flexible or deformable elements, e.g. comprising elastic tongues or membranes
- B81B3/0018—Structures acting upon the moving or flexible element for transforming energy into mechanical movement or vice versa, i.e. actuators, sensors, generators
- B81B3/0021—Transducers for transforming electrical into mechanical energy or vice versa
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/02—Casings; Cabinets ; Supports therefor; Mountings therein
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/02—Casings; Cabinets ; Supports therefor; Mountings therein
- H04R1/04—Structural association of microphone with electric circuitry therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R19/00—Electrostatic transducers
- H04R19/04—Microphones
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B81—MICROSTRUCTURAL TECHNOLOGY
- B81B—MICROSTRUCTURAL DEVICES OR SYSTEMS, e.g. MICROMECHANICAL DEVICES
- B81B2201/00—Specific applications of microelectromechanical systems
- B81B2201/02—Sensors
- B81B2201/0257—Microphones or microspeakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/003—Mems transducers or their use
Abstract
本公开的实施例涉及具有低数据速率接口的数字麦克风。微机电系统(MEMS)包括:MEMS器件;特征提取部件,耦合到MEMS器件的输出,其中特征提取部件被配置为提供MEMS器件的输出信号的多个特征;以及低数据速率接口,耦合到特征提取部件的,其中低数据速率接口被配置为传输MEMS器件的输出信号的多个特征,并且其中确定低数据速率接口的低数据速率由所传输的多个特征的数量来确定,其中MEMS器件、特征提取部件和低数据速率接口一起被封装在半导体封装中。
Description
技术领域
本发明总体上涉及一种具有低数据速率接口的数字麦克风以及一种对应的方法。
背景技术
数字麦克风用于将音频输入信号转换为对应的数字输出信号。典型的数字麦克风包括高数据速率接口,高数据速率接口包括数字信号处理电路装置,以便将音频输入信号转换为高质量的数字输出信号。由于数字麦克风的始终在线性质以及高数据速率接口中的数字电路装置的高能耗,数字麦克风在具有电池寿命限制的便携式设备中的使用局限性非常大。制造商和客户需要具有低数据速率接口的数字麦克风,以便在不显著降低性能的情况下降低功率并延长电池寿命。
发明内容
根据一个实施例,一种MEMS系统包括:MEMS器件;特征提取部件,耦合到MEMS器件的输出,其中特征提取部件被配置为提供MEMS器件的输出信号的多个特征;以及低数据速率接口,耦合到特征提取部件,其中低数据速率接口被配置为传输MEMS器件的输出信号的多个特征,并且其中所述低数据速率接口的低数据速率由所传输的所述多个特征的数量来确定,其中所述MEMS器件、所述特征提取部件和所述低数据速率接口一起被封装在半导体封装中。
根据另一实施例,一种转换方法包括:使用MEMS器件将环境变化转换为输出信号;从MEMS器件的输出信号中提取多个特征;以及通过低数据速率接口传输多个特征,其中低数据速率接口的低数据速率由所传输的多个特征的数量决定,其中转换方法由单个半导体封装中的一个或多个集成电路来实现。
根据另一个实施例,一种MEMS系统包括:MEMS麦克风;特征提取部件,耦合到MEMS麦克风的输出,其中特征提取部件被配置为提供MEMS麦克风的输出信号的多个特征;低数据速率接口,耦合到特征提取部件,其中低数据速率接口被配置为传输MEMS器件的输出信号的多个特征,并且其中低数据速率接口的低数据速率由所传输的多个特征的数量来确定;以及编解码器,耦合到低数据速率接口,用于对所传输的多个特征进行数字处理,其中所述MEMS麦克风、所述特征提取部件和所述低数据速率接口一起被集成在单个半导体封装中的一个或多个集成电路上。
附图说明
为了更完整地理解本发明及其优点,现结合附图参考以下说明,其中:
图1A是数字麦克风和编解码器的示例性系统分区的框图,编解码器包括关键字检测、语音活动检测或语音识别应用程序;
图1B是用于图1A的数字麦克风和编解码器的CMOS接口功率与频率的关系图;
图2是数字麦克风和包括抽取滤波器的编解码器的示例性系统划分的框图;
图3是根据实施例的具有低数据速率接口的数字麦克风和编解码器的框图;
图4是根据实施例的图3中框图的更详细版本;
图5A是根据实施例的包括双二阶滤波器的特征提取部件的示意图;
图5B是根据实施例的用于对图5A中所示的特征提取部件的输出进行平均的平均电路的示意图;
图6是根据实施例的包括压控振荡器、计数器和平均电路的特征提取部件的示意图;
图7是根据实施例的包括自相关部件和平均电路的特征提取部件的框图;
图8是根据实施例的可用于低数据速率接口的缓冲放大器的示意图;
图9是用于各种麦克风接口的时钟速率和数据速率表;
图10是根据实施例的与数字麦克风相关联的低数据速率方法的框图;以及
图11是根据实施例的数字麦克风系统的框图。
具体实施方式
下面详细讨论当前优选实施例的制造和使用。然而,应该理解的是,本发明提供了许多可应用的发明概念,这些概念可以体现在各种特定的上下文中。所讨论的具体实施例仅用于说明制造和使用本发明的具体方式,并不限制本发明的范围。
根据实施例,数字麦克风系统包括MEMS器件和专用集成电路(ASIC),ASIC包括特征提取部件和耦合到MEMS器件的低数据速率接口。特征提取部件从MEMS器件的模拟输出信号中提取多个特征,这些特征突出了最具支配性和区别性的特征。在一个实施例中,如果需要,可以仅从多个特征构造模拟数字输出的高质量副本。在其他实施例中,检测到的特征可以与语音识别应用程序结合使用以启动或执行各种功能。特征提取部件的特征提取可以在模拟域或数字域中进行。在实施例中,ASIC耦合到外部音频编码器-解码器(编解码器),其可以包括一个或多个应用程序,这些应用程序包括语音活动检测(VAD)、关键字检测(KWD)和语音识别应用程序。低数据速率接口的低数据速率有利地通过仅将多个特征从特征提取部件通过低速率接口传输到编解码器来提供。通常,与所传输特征相关联的数据量远小于与使用高时钟速率进行数字转换的模拟信号相关联的数据量。因此,可以降低数字麦克风系统的数据速率。
在一些实施例中,特征提取在模拟域中进行。因此,模数转换器用于将模拟特征转换为数字特征,以便在数字麦克风系统中进行后续的数字信号处理。然而,执行模拟特征的模数转换所需的功率远低于执行模拟音频信号的完整模数转换所需的功率。由于模数转换器的时钟频率也可以显著降低,因此可以显著降低功率。因此,根据实施例的数字麦克风系统可以用在许多极低功率应用中。在实施例中,数字麦克风系统的功率需求可以有利地降低到小于四十微瓦,优选地小于三十微瓦,优选地小于二十微瓦,并且优选地小于十微瓦。
图1A是数字麦克风系统100A的示例性系统划分的框图,特别是为标准语音识别应用配置的。数字麦克风系统100A包括数字麦克风102,该数字麦克风102包括通过MEMS组件104的模拟输出106耦合到ASIC 107的输入端的MEMS组件104。MEMS组件104可以包括MEMS麦克风组件。ASIC 107包括用于将模拟输出106处的模拟信号转换为数字代码的模数转换器(ADC)108。数字代码通常由耦合到ADC 108的输出端的数字滤波器110进行滤波。最后,ASIC107通常在数字麦克风输出端116处将数字调制器包括到单比特数字流中。ASIC 107在时钟输入端接收时钟信号麦克风系统100A典型地包括音频编解码器118,其包括关键字检测、语音活动检测或语音识别应用程序。编解码器输出124提供具有由关键字检测、语音活动检测或语音识别应用程序生成的输出数据的数字信号。在图1A中,MEMS麦克风104感测声学信号并且ASIC 107向处理器(图1中未示出)传输单比特信号。单比特信号可以使用脉冲编码调制(PCM)或脉冲密度调制(PDM)进行编码。执行进一步的数字信号处理功能,例如在DSP组件120中提取特征,并且在语音识别组件122中执行语音活动检测(VAD)、关键字检测(KWD)或语音识别。DSP块120具有耦合到数字麦克风输出116,并且语音识别组件122具有耦合到编解码器输出124的输出。
图1A中所示的数字麦克风系统的一个方面是由于ADC 108执行的模数转换所使用的高时钟速率导致的高能耗。标准数字麦克风通常以低数据速率(例如,低功耗操作模式下的768kHz)或高数据速率(例如高性能操作模式下的2.4至3MHz)提供单比特流。由于ADC108所需的是高时钟速率,高性能操作模式导致ASIC 107中的高功耗。
图1B是用于图1A的数字麦克风102和音频编解码器118的CMOS接口功率与频率的关系图,其中“接口功率”可被定义为由数字麦克风102为了在数字麦克风输出116处提供单比特数字流所需的功率,该输出是用于进一步的处理电路装置(例如音频编解码器118)的接口。在图1B中,假设数字麦克风输出116处的负载电容为50pF。在现有技术的麦克风中,已实现低至200μW的能耗,但某些电池供电应用需要进一步的功率降低。在图1B中,描绘了CMOS接口的功耗与用于两个接口电压的接口活动性的关系。第一条线126代表接口电源电压为1.8伏时接口功率与时钟频率的关系。第二条线128代表接口电源电压为1.2伏时接口功率与时钟频率的关系。假设合理大小的负载电容为50pf。在更高的时钟频率时,其中负载电容为50pf,与数字麦克风功率相比,数据通信所需的功率非常重要。时钟线114和数字麦克风输出116处的数据线都定义了更高频率下的高功率要求。例如,在768kHz时钟速率时,接口功率要求为120μW(1.8伏)或56μW(1.2伏)。
所期望的是显著降低接口数据速率和时钟速率,以便接口的能耗可以降低到个位数μW的数字,即小于10微瓦。
图2是包括数字麦克风和音频编解码器118的数字麦克风系统100B的示例性系统划分的框图。数字麦克风系统100B类似于先前描述的数字麦克风系统100A,除了音频编解码器118包括抽取滤波器126。在一些数字麦克风系统中,包括用于在数字麦克风输出116处接收单比特数字流的抽取滤波器。抽取滤波器126实施的方法仅观察ADC样本的周期性部分而忽略其余部分。结果是降低了ADC 108的采样率。例如,4倍抽取模式意味着通过抽取滤波器126的总样本减少了4倍,而所有其他样本都有效丢弃。使用抽取滤波器126的数字滤波有效地从由抽取率设置的狭义定义的带宽中去除带外噪声。图2中所示的数字麦克风系统配置的另一个方面是,对于特征提取,不需要具有完整质量的音频信号,这会导致数字麦克风(例如高质量ADC108)以及在随后的数字信号处理(例如抽取滤波器126)中的额外开销。在高时钟速率(高性能)应用中,额外开销也可能增加数字麦克风系统100B的功率需求。
图3是根据实施例的包括具有低数据速率接口的数字麦克风202和音频编解码器218的数字麦克风系统200A的框图。数字麦克风202包括诸如MEMS麦克风204的MEMS部件,其具有模拟输出206。MEMS麦克风204耦合到ASIC 207。在一个实施例中,ASIC 207包括特征提取部件208,其被配置为提取模拟或数字域中的音频特征。图4中所示的特征提取部件208可以包括模拟、数字或组合解决方案,以提供特征提取功能。下面描述特征提取部件208的具体实施例。低数据速率接口部件210耦合在特征提取部件208与数字麦克风202的输出216之间。下面描述低数据速率接口部件210的具体实施例。数字麦克风202包括用于从处理器(图3中未示出)接收时钟信号的时钟输入214。时钟信号然后被分配到特征提取部件208和/或低数据速率接口210。在一个实施例中,数字麦克风系统200A包括耦合到数字麦克风202的输出216的音频编解码器218。音频编解码器218被配置有一个或多个应用,例如语音活动检测(VAD)、关键字检测(KWD)或语音识别,并在编解码器输出224处生成对应的数字信号。音频编解码器218在下面进一步详细描述。
此处使用的“语音活动检测”(VAD)与检测输入音频或压力信号中的语音或语言的过程相关联(并且可能不包括关键字或短语检测)。短语“语音活动检测”有时也称为“语音唤醒”过程或“语言唤醒”过程。短语“关键字识别”(“KWS”)或“关键字检测”(KWD)可以指检测特定口语单词或短语的过程。短语“关键词识别”有时也称为语音触发。VAD算法的典型设计可能包括:初始降噪阶段,例如通过光谱减法;从输入信号的一部分计算特征或数量;以及应用分类规则将该部分分类为语言或非语言,其中当计算的特征或数量的值超过预定阈值时调用分类规则。
语音识别可用于识别特定的说话者,例如在安全应用中。可以使用多种语音识别算法,包括使用隐马尔可夫模型、基于动态时间扭曲(DTW)的语言识别、训练神经网络和使用简化语音模型的“端到端”自动语音识别技术,这些模型可以在低音频帧率情况下使用。
在实施例中,数字麦克风202包括在半导体封装中的一个或多个集成电路。在实施例中,半导体封装包括金属、塑料、玻璃或陶瓷外壳,其包括一个或多个分立半导体器件或集成电路。可以使用任何合适类型的半导体封装。在一个实施例中,MEMS麦克风204包括第一集成电路并且ASIC 207包括耦合到第一集成电路的第二集成电路。在其他实施例中,单个集成电路包括包含MEMS麦克风204和ASIC207的公共衬底。在实施例中,音频编解码器218在数字麦克风202的外部。
根据实施例,图3中所示的数字麦克风系统200A有利地最小化了关于图1A的示例性数字麦克风系统100A和图1B的示例性数字麦克风系统100B示出和描述的信号处理组件的额外开销,并显著降低了相关的能耗。在图3所示的配置中,低数据接口210的输出216处的数据利用由MEMS麦克风203检测到的语音/音频信号的提取特征被编码,而在上述示例性数字麦克风系统中,全数字时间域语音/音频信号被应用于接口。
根据实施例,全部或部分的特征提取功能位于数字麦克风202中,并且特征被传输到后续处理电路装置。通过仅传输所检测特征,可以显著降低接口的数据速率,从而降低能耗。下面参照图9的表格描述了各种编码技术的数据速率。
图4示出了实施例数字麦克风200B,其中在模拟域中执行特征提取,因此附加的模数转换器220插入在特征提取部件208与低数据速率接口210之间。根据实施例,先前在图2中示出的音频编解码器218、抽取滤波器126和特征提取部件120现在可以从数字信号处理链中被去除,从而降低产品成本并降低功率需求。
图5A是根据实施例的包括双二阶滤波器500的特征提取部件的示意图。图5A的特征提取部件适合用作前面描述的提取部件。双二阶滤波器500包括耦合到第二积分器510的第一积分器508。积分器508和510都具有ω0/S的传递函数,其中“ω0”与积分器的转角频率相关,而“S”是频域中的积分传递函数。双二阶滤波器500x(t)的输入耦合到加法器506的输入502。加法器506的输出耦合到积分器508的输入。积分器508的输出耦合到双二阶滤波器的输出节点504,y(t)。积分器510的输入耦合到输出节点504,并且积分器510的输出耦合到加法器506的负输入。双二阶滤波器的输出节点504通过放大器512耦合到加法器506的另一个负输入。放大器的增益设置为1/Q,其中“Q”是双二阶滤波器的品质因数。双二阶滤波器500可以在模拟或数字域中实现。如果在模拟域中实现,则需要数模转换来转换双二阶滤波器500的模拟输出。然而,用于转换的ADC可以以相对低的采样率操作。
积分器508和510的转角频率以及放大器512的增益可以根据需要进行调整,以从输入节点502处存在的模拟信号中提取基本特征。
图5A中所示的双二阶滤波器500可以使用例如一个或多个压控振荡器(VCO)来实现,如下面将进一步详细描述的、特别是关于图6。VCO产生的类似信号是从模拟滤波器获得、但以方波频率编码,而不是模拟电压或模拟电流。在一个实施例中,由滤波器提供的输出信号y(t)是差分的,即对于正信号有一个方波而对于负信号有另一个方波。这些方波在滤波器的内部VCO中生成,如下文进一步详细描述。为了提取输入信号的音频特征值,使用了平均电路。该平均电路可以包括计数器,以正信号向上计数并以负信号向下计数。这个计数器周期性取得的绝对值代表滤波器输出的平均功率,这可以用作特征值。下面参照图5B描述平均电路的一种实现方式。
包括例如计数器和绝对值电路的平均电路用于对节点504处的滤波信号y(t)进行平均,以产生用于提取特征值的有用信息。图5B中示出了具有计数器522的平均电路520的示意图,计数器耦合到的输入节点502是图5A中所示的双二阶滤波器500的差分输出节点504P和504N。正输出信号节点504P耦合到计数器522的“向上”计数器输入,负输出信号节点504N耦合到计数器522的“向下”计数器输入。计数器522耦合到第一寄存器524。寄存器524还在节点526处接收时钟信号,其频率速率确定特征提取的更新速率。寄存器524耦合到绝对值电路530。在一些实施例中,可以通过简单地剥离寄存器524的输出的符号位来计算绝对值;然而,也可以使用其他确定绝对值的方法。在替代实施例中,可以应用其他非线性函数代替绝对值函数,例如平方函数。绝对值电路耦合到附加的积分器电路532。积分器电路532可以实现为累加器电路,该累加器电路包括算术逻辑单元(ALU),该算术逻辑单元具有耦合到绝对值电路530的第一输入和耦合到ALU的输出。积分器电路耦合到第二寄存器534。寄存器534的输出耦合到提供输出特征值的输出节点528。寄存器534还在节点536处接收时钟信号,其频率速率周期性地更新节点528处的输出特征值。在实施例中,任何合适的计数器可用于计数器522,并且任何合适的寄存器可用于寄存器524和寄存器534。可以使用平均电路520中所示的组件的其他类型布置,并且也可以使用其他类型的平均电路。
对于这里描述的数字麦克风的特征提取,有几种不同的有效特征提取算法可用。例如,特征提取算法可以基于自相关系数。另一种方法是基于带通滤波器组,使用压控振荡器(VCO)实现。下面参照图6和图7描述VCO和自相关系数特征提取实施例。
图6是根据实施例的包括压控振荡器和计数器的特征提取部件600的示意图。基于VCO的特征提取部件600在配置上类似于图5中所示的双二阶滤波器500。在相关部分中,每个积分器都用VCO和计数器配置来实现,下面将进一步详细描述。特征提取部件600包括具有耦合到输入节点602用于接收模拟输入信号x(t)的正输入的加法器。加法器608的输出耦合到第一积分器612A。第一积分器612A的输出耦合到具有增益“G”的放大器618A。放大器618A的输出耦合到输出节点604以提供数字输出,y(t)。第二积分器612B具有耦合到输出节点604的输入和耦合到具有增益“G”的放大器618B的输入的输出。放大器618B的输出耦合到加法器608的负输入。数字输出信号y(t)通过增益为1/Q的放大器610反馈到加法器608的另一个负输入,其中“Q”是基于VCO的特征提取部件600的品质因数。输出节点604处的数字输出信号y(t)耦合到平均电路630的输入,平均电路在节点632处提供输出特征值。平均电路630可以是在一个实施例中类似于图5B中所示的平均电路520。然而,也可以使用任何合适的平均电路。
积分器612A和612B的转角频率以及放大器618A、618B和610的增益可以根据需要进行调整,以从输入节点602处存在的模拟信号中提取基本特征。
第一积分器612A包括具有输出的第一VCO 614A,该输出耦合到被指定为C1的计数器616A的“向上”计数器输入。计数器616A的“向下”计数器输入接收被指定为“f0”的时钟信号606。计数器616A的输出耦合到放大器618A的输入。第二积分器612B包括具有输出的第二VCO 614B,该输出耦合到被指定为C2的计数器616B的“向上”计数器输入。计数器616A的“向下”计数器输入接收被指定为“f0”的时钟信号606。计数器616B的输出耦合到放大器618B的输入。
图6中所示的VCO实现的优点在于,无需在滤波器组之前进行模数转换,该滤波器组对频率编码信号(来自VCO)进行操作。因此,基于VCO的滤波器的行为类似于模拟带通滤波器,但它们的操作使用由VCO振荡器和数字基元处理的数字频率编码信号。
语音频带能量是在数字域中估算的,而无需明确的模数转换器进行功率估算,这是因为可以通过对滤波器输出处的脉冲进行计数来测量信号能量。因此,图6所示的VCO实施方案不需要图4所示的ADC220。图6所示的VCO实施方案的大部分数字性质允许将亚纳米半导体制造技术用于所有数字麦克风系统电子设备。例如,图3和图4中所示的数字麦克风202和音频编解码器218可以一起集成在具有公共衬底的单个亚纳米集成电路上。可替代地,数字麦克风202可以集成在第一集成电路上,并且音频编解码器218可以集成在耦合到第一集成电路的第二集成电路上。
图7是根据实施例的包括自相关部件的特征提取部件700的框图。通常,自相关算法是模拟或数字信号与包含时间延迟的副本的相似性的度量。一般而言,基于自相关的特征提取包括与快速傅立叶变换(FFT)函数结合的自相关函数。特征提取部件700(无FFT函数)可以在数字麦克风内部整体实现。然而,自相关特征提取部件700的一部分也可以在音频编解码器中实现,例如数字麦克风中自相关系数的计算以及FFT函数。
特征提取部件700包括用于接收模拟输入信号702的输入节点702。乘法器712包括第一输入用于接收输入信号702,x(t)。乘法器712包括第二输入708,用于接收输入信号的时间延迟副本,x(t-τ),其中τ是延迟值。因此,乘法器712的输出产生两个输入信号的乘积,其等于x(t)×x(t-τ)。乘法器712的输出信号由平均电路716在时间间隔T上平均,以在输出节点704处产生自相关信号。用于计算自相关系数“Ac”的公式等于1/T×∫x(t)*x(t-τ)dt,从零到T,其中T是选定的时间间隔。自相关系数“Ac”可以在模拟或数字域中计算。平均电路716可以类似于图5B中所示的平均电路520。然而,也可以使用任何合适的平均电路。
对于每个延迟τ均有一个自相关系数(Ac),并且输入信号和来自706的延迟输入信号的乘积在时间间隔T上取平均值。用于语音应用的自相关系数的典型数字为16到20个自相关系数,其中应用了16到20个延迟“τi”。通常,计算8kHz范围内的特征(因此使用16kHz时钟信号进行采样),并且对于计算自相关系数使用1/16kHz的倍数作为延迟,例如τ1=1/16kHz,τ2=2*τ1,τ3=3*τ1,...,τ20=20*τ1。
图8是根据实施例的可用于图3和图4所示的低数据速率接口210中的缓冲放大器800的示意图。在一个实施例中,缓冲放大器800包括具有用于接收输入电压VIN的正输入端的运算放大器806,该输入电压是例如图3和图4中所示的特征提取部件208的输出电压。运算放大器806还具有输出节点804用于生成输出电压VOUT,该输出电压被反馈到负输入以提供单位增益缓冲放大器配置。输出节点804耦合到图3和图4所示的数字麦克风202的输出节点216。可以使用其他类型的放大器来代替图8所示的放大器800,例如无反馈的放大器。其他低数据速率接口可以包括除单个单元增益放大器之外的附加部件。
图9是各种麦克风接口的时钟速率和数据速率的表900。在表900中,为数字麦克风和对应的接口时钟速率显示了四种类型的编码方案,并显示了在接口输出处的数据速率。表900中显示了与四种编码方案中每一种要传输的数据量相关的比较。典型的数字麦克风提供768kHz的脉冲密度调制(PDM)数据(用于VAD、KWD和语音识别应用程序),其被用作参考。通过脉冲编码调制(PCM)数据传输,可以实现数据速率降低三个因数。
表900中示出了两种对应特征提取情况的两种时钟速率和两种数据速率,用于与先前描述的PDM和PCM情况进行比较。表900中显示了两个极端情况(情况1和情况2)。在情况1中,从长度为10ms的帧中计算出四十(40)个特征,在情况2中从长度为20ms的帧中计算出二十(20)个特征。根据这里描述的实施例,表900示出了如果传输特征而不是数字音频信号,则可以显著减少接口处的数据量。在情况1中,传输40个特征只需要100Hz的接口时钟速率(对于16位接口)和每秒64kbit的数据速率。在情况2中,传输20个特征只需要50Hz的接口时钟速率(对于16位接口)和每秒16kbit的数据速率。不同的时钟速率将对应于其他数据速率,包括等于每秒256kbit、每秒192kbit、每秒128kbit、或每秒64kbit的低数据速率。
图10是根据实施例的与数字麦克风相关联的低数据速率方法1000的框图。低数据速率方法1000可以包括转换方法,该转换方法包括:在方法步骤1002中使用MEMS器件将环境变化转换为输出信号;在方法步骤1004中从MEMS器件的输出信号中提取多个特征;以及通过低数据速率接口传输多个特征,其中低数据速率接口的低数据速率由所传输的多个特征的数量决定,并且其中转换方法在方法步骤1006中由单个半导体封装中的一个或多个集成电路实施的。
图11是根据实施例的数字麦克风系统1100的框图。数字麦克风系统1100包括数字麦克风1110,该数字麦克风包括在单个封装1102中的MEMS器件和对应的ASIC。在一个实施例中,MEMS器件可以包括用于检测音频带中的音频信号的音频麦克风,通常从20到20KHz,或者压力检测器,用于检测音频带下端处的压力信号甚至更低频率的压力信号。在一个实施例中,封装1102中的MEMS器件和对应ASIC的输出耦合到音频编解码器1104。封装1102中的MEMS器件和对应的ASIC可以包括一个或多个集成电路。在一个实施例中,音频编解码器1104在封装1102中的MEMS器件和ASIC的外部。虽然音频编解码器1104被示为是数字麦克风1110的一部分,但在实施例中,音频编解码器1104的至少一部分可以被包括在处理器1106中。数字麦克风系统1100还包括处理器1106,用于向数字麦克风1110提供时钟信号和控制信号,并用于从数字麦克风1100接收数据。在便携式实施例中,电池1108为处理器1106和数字麦克风1110提供功率。在实施例中,处理器1106和数字麦克风1110可以一起集成在单个集成电路上,或集成在两个单独的集成电路中。可以使用用于数字麦克风系统1100的各种产品配置,包括蜂窝电话、智能电话、耳机、时钟和智能扬声器产品配置,以及众多其他产品配置。
本文描述的实施例的优点包括数字麦克风中降低的能耗(功率节省)(包括由于接口处时钟减少而引起的功率降低,并且不需要消除高音频质量数字信号处理所需的开销),可以降低频率的系统时钟(其可以被客户在某些应用程序和某些操作模式下需要),并降低后续数字信号处理器中的信号处理复杂性(因为不需要抽取滤波器,并且不需要或减少了需要大量的特征提取)。
总之,本文已经描述了数字麦克风和数字麦克风系统的实施方式,其实施模拟输入信号特征提取(或特征提取的至少一部分)并传输提取的特征而并非高质量数字编码的音频信号。在实施例中,MEMS器件、特征提取部件和低数据速率接口一起封装在半导体封装中。在一个实施例中,至少特征提取部件和低数据速率接口一起集成在单个集成电路中。
这里总结了本发明的示例实施例。其他实施例也可以从说明书和在此提交的权利要求的整体来理解。
示例1.根据实施例,MEMS系统包括:MEMS器件;特征提取部件,耦合到MEMS器件的输出,其中特征提取部件被配置为提供MEMS器件的输出信号的多个特征;以及低数据速率接口,耦合到特征提取部件,其中低数据速率接口被配置为传输MEMS器件的输出信号的多个特征,并且其中所述低数据速率接口的低数据速率由所传输的所述多个特征的数量来确定,其中所述MEMS器件、所述特征提取部件和是低数据速率接口一起被封装在半导体封装中。
示例2.根据示例1的MEMS所述的系统,其中MEMS系统的总功耗小于四十微瓦。
示例3.根据以上示例中任一项所述的MEMS系统,其中MEMS器件包括第一集成电路,并且所述特征提取部件和所述低数据速率接口一起被集成在耦合到所述第一集成电路的第二集成电路上。
示例4.根据以上示例中任一个所述的MEMS系统,其中所述低数据速率等于每秒256kbit、每秒192kbit、每秒128kbit、或每秒64kbit。
示例5.根据以上示例中任一项所述的MEMS系统,其中MEMS器件包括麦克风或压力传感器。
示例6.根据以上示例中任一项所述的MEMS系统,其中特征提取部件包括双二阶滤波器。
示例7.根据以上示例中任一项所述的MEMS系统,其中特征提取部件包括耦合到计数器的压控振荡器。
示例8.根据以上示例中任一项所述的MEMS系统,其中特征提取部件包括自相关部件。
示例9.根据上述示例中任一项所述的MEMS系统,其中特征提取部件包括用于接收时钟信号的输入。
示例10.根据以上示例中任一项所述的MEMS系统,还包括插入在所述特征提取部件与所述低数据速率接口之间的模数转换器。
示例11.根据一个实施例,一种转换方法包括:使用MEMS器件将环境变化转换为输出信号;从MEMS器件的输出信号中提取多个特征;和通过低数据速率接口传输多个特征,其中低数据速率接口的低数据速率由所传输的多个特征的数量决定,其中转换方法由单个半导体封装中的一个或多个集成电路来实现。
示例12.根据示例11的转换方法,其中一个或多个集成电路的总功耗小于四十微瓦。
示例13.根据以上示例中的任一个所述的转换方法,其中低数据速率等于每秒256kbit、每秒192kbit、每秒128kbit、或每秒64kbit。
示例14.根据上述示例中任一项所述的转换方法,其中从所述MEMS器件的输出信号中提取所述多个特征包括:对所述MEMS器件的输出信号进行滤波,或确定所述MEMS器件的输出信号的自相关特征。
示例15.根据以上示例中任一项所述的MEMS系统,其中所述环境变化包括频率在所述音频频带内的音频波,或频率在所述音频频带以下的压力波。
示例16.根据一个实施例,MEMS系统包括:MEMS麦克风;特征提取部件,耦合到MEMS麦克风的输出,其中特征提取部件被配置为提供MEMS麦克风的输出信号的多个特征;低数据速率接口,耦合到特征提取部件的,其中低数据速率接口被配置为传输MEMS器件的输出信号的多个特征,并且其中低数据速率接口的低数据速率由所传输的多个特征的数量来确定;以及编解码器,耦合到低数据速率接口,用于对所传输的多个特征进行数字处理,其中所述MEMS麦克风、所述特征提取部件和所述低数据速率接口一起被集成在单个半导体封装中的一个或多个集成电路上。
示例17.根据示例16所述的MEMS系统,其中一个或多个集成电路的总功耗小于四十微瓦。
示例18.根据以上示例中任一项所述的MEMS系统,其中编解码器被配置为提供语音活动检测功能。
示例19.根据以上示例中任一项所述的MEMS系统,其中编解码器被配置为提供关键字检测功能。
示例20.根据上述示例中任一项所述MEMS系统,其中所述编解码器被配置为提供语音识别功能。
虽然已经参考说明性实施例描述了本发明,但是该描述并不旨在被解释为限制性的。参考说明书,本领域技术人员将清楚说明性实施例以及本发明的其他实施例的各种修改和组合。因此,所附权利要求旨在涵盖任何此类修改或实施例。
Claims (20)
1.一种MEMS系统,包括:
MEMS器件;
特征提取部件,耦合到所述MEMS器件的输出,其中所述特征提取部件被配置为提供所述MEMS器件的输出信号的多个特征;以及
低数据速率接口,耦合到所述特征提取部件,其中所述低数据速率接口被配置为传输所述MEMS器件的所述输出信号的所述多个特征,并且其中所述低数据速率接口的低数据速率由所传输的所述多个特征的数量来确定,
其中所述MEMS器件、所述特征提取部件和所述低数据速率接口一起被封装在半导体封装中。
2.根据权利要求1所述的MEMS系统,其中所述MEMS系统的总功耗小于四十微瓦。
3.根据权利要求1所述的MEMS系统,其中所述MEMS器件包括第一集成电路,并且所述特征提取部件和所述低数据速率接口一起被集成在耦合到所述第一集成电路的第二集成电路上。
4.根据权利要求1所述的MEMS系统,其中所述低数据速率等于每秒256kbit、每秒192kbit、每秒128kbit、或每秒64kbit。
5.根据权利要求1所述的MEMS系统,其中所述MEMS器件包括麦克风或压力传感器。
6.根据权利要求1所述的MEMS系统,其中所述特征提取部件包括双二阶滤波器。
7.根据权利要求1所述的MEMS系统,其中所述特征提取部件包括耦合到计数器的压控振荡器。
8.根据权利要求1所述的MEMS系统,其中所述特征提取部件包括自相关部件。
9.根据权利要求1所述的MEMS系统,其中所述特征提取部件包括用于接收时钟信号的输入。
10.根据权利要求1所述的MEMS系统,还包括插入在所述特征提取部件与所述低数据速率接口之间的模数转换器。
11.一种转换方法,包括:
使用MEMS器件将环境变化转换为输出信号;
从所述MEMS器件的所述输出信号中提取多个特征;以及
通过低数据速率接口传输多个特征,其中低数据速率接口的低数据速率由所传输的所述多个特征的数量决定,其中所述转换方法由单个半导体封装中的一个或多个集成电路来实现。
12.根据权利要求11所述的转换方法,其中所述一个或多个集成电路的总功耗小于四十微瓦。
13.根据权利要求11所述的转换方法,其中所述低数据速率等于每秒256kbit、每秒192kbit、每秒128kbit、或每秒64kbit。
14.根据权利要求11所述的转换方法,其中从所述MEMS器件的所述输出信号中提取所述多个特征包括:对所述MEMS器件的所述输出信号进行滤波,或确定所述MEMS器件的所述输出信号的自相关特征。
15.根据权利要求1所述的MEMS系统,其中所述环境变化包括频率在音频频带内的音频波,或频率在音频频带以下的压力波。
16.一种MEMS系统,包括:
MEMS麦克风;
特征提取部件,耦合到所述MEMS麦克风的输出,其中所述特征提取部件被配置为提供所述MEMS麦克风的所述输出信号的多个特征;
低数据速率接口,耦合到所述特征提取部件,其中所述低数据速率接口被配置为传输所述MEMS器件的所述输出信号的所述多个特征,并且其中所述低数据速率接口的低数据速率由所传输的所述多个特征的数量来确定;以及
编解码器,耦合到所述低数据速率接口,用于对所传输的所述多个特征进行数字处理,
其中所述MEMS麦克风、所述特征提取部件和所述低数据速率接口一起被集成在单个半导体封装中的一个或多个集成电路上。
17.根据权利要求16所述的MEMS系统,其中所述一个或多个集成电路的总功耗小于四十微瓦。
18.根据权利要求16所述的MEMS系统,其中所述编解码器被配置为提供语音活动检测功能。
19.根据权利要求16所述的MEMS系统,其中所述编解码器被配置为提供关键字检测功能。
20.根据权利要求16所述的MEMS系统,其中所述编解码器被配置为提供语音识别功能。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US17/106,983 US11582560B2 (en) | 2020-11-30 | 2020-11-30 | Digital microphone with low data rate interface |
US17/106,983 | 2020-11-30 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114584907A true CN114584907A (zh) | 2022-06-03 |
Family
ID=78789721
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111318000.2A Pending CN114584907A (zh) | 2020-11-30 | 2021-11-09 | 具有低数据速率接口的数字麦克风 |
Country Status (3)
Country | Link |
---|---|
US (1) | US11582560B2 (zh) |
EP (1) | EP4007298A1 (zh) |
CN (1) | CN114584907A (zh) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9542933B2 (en) * | 2013-03-08 | 2017-01-10 | Analog Devices Global | Microphone circuit assembly and system with speech recognition |
GB201509483D0 (en) * | 2014-12-23 | 2015-07-15 | Cirrus Logic Internat Uk Ltd | Feature extraction |
-
2020
- 2020-11-30 US US17/106,983 patent/US11582560B2/en active Active
-
2021
- 2021-11-09 CN CN202111318000.2A patent/CN114584907A/zh active Pending
- 2021-11-24 EP EP21210212.3A patent/EP4007298A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20220174424A1 (en) | 2022-06-02 |
US11582560B2 (en) | 2023-02-14 |
EP4007298A1 (en) | 2022-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108694959B (zh) | 语音能量检测 | |
CN110244833B (zh) | 麦克风组件 | |
US9443508B2 (en) | User programmable voice command recognition based on sparse features | |
CN107251573B (zh) | 包括集成语音分析的麦克风单元 | |
US9785706B2 (en) | Acoustic sound signature detection based on sparse features | |
US7692568B2 (en) | Low power sigma delta modulator with successive approximation converter | |
US9177546B2 (en) | Cloud based adaptive learning for distributed sensors | |
US9466288B2 (en) | Comparing differential ZC count to database to detect expected sound | |
US11087780B2 (en) | Analog voice activity detector systems and methods | |
Cho et al. | 17.2 A 142nW voice and acoustic activity detection chip for mm-scale sensor nodes using time-interleaved mixer-based frequency scanning | |
US9830080B2 (en) | Low power voice trigger for acoustic apparatus and method | |
US20150371638A1 (en) | Context Aware Sound Signature Detection | |
US20150066498A1 (en) | Analog to Information Sound Signature Detection | |
US9467774B2 (en) | System and method for a PCM interface for a capacitive signal source | |
US4982427A (en) | Integrated circuit for telephone set with signal envelope detector | |
CN114584907A (zh) | 具有低数据速率接口的数字麦克风 | |
CN109119082A (zh) | 语音唤醒电路及电子设备 | |
CN110310635B (zh) | 语音处理电路及电子设备 | |
WO2015069878A1 (en) | Microphone and corresponding digital interface | |
Mourrane et al. | Event-driven continuous-time feature extraction for ultra low-power audio keyword spotting | |
CN114930451A (zh) | 背景噪声估计和语音活动检测系统 | |
Rawandale et al. | Aquila Based Adaptive Filtering for Hearing Aid with Optimized Performance. | |
Gruden et al. | Using spectral subtraction for suppression of noise in speech signals with analog integrated circuits | |
Miyawaki et al. | A Study on Pitch Detection of Sinusoidal Noise for Noise Reduction System | |
Saleh et al. | A comparative study of different compression laws of speech encoding and regeneration technique |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |