CN101361355A

CN101361355A - 音频事件检测器及其方法

Info

Publication number: CN101361355A
Application number: CNA2005800074339A
Authority: CN
Inventors: 卢西奥·F·C·佩索阿; 阿赫桑·U·阿齐兹; 苏文武
Original assignee: Freescale Semiconductor Inc
Current assignee: NXP USA Inc
Priority date: 2004-03-08
Filing date: 2005-01-21
Publication date: 2009-02-04
Also published as: WO2005094397A3; US20050195967A1; EP1726153A2; JP2007535840A; KR20060132926A; US7844048B2; WO2005094397A2

Abstract

在一个实施例中，音频事件检测器(18)首先确定是否在输入信号上指示出存在的音频，然后基于这个确定，选择性地确定输入信号上的音频是否已经被检测到。例如，在一个实施例中，只有当首先指示出音频的存在时才执行音频检测，以便如果未指示出音频的存在，就无需执行音频检测。由于使用简化的方式来指示音频的存在，因而这有助于减少音频事件检测器的复杂性，只有当需要时，才启用更复杂的算法用于音频检测。而且，在一个实施例中，音频检测包括生成相应于所检测到的音频的一个或多个音频特性，然后这些音频特性被用来确定所检测到的音频是否相应于有效的音频事件。

Description

音频事件检测器及其方法

技术领域

本发明通常涉及音频事件检测，特别地，涉及音频指示、音频检测，以及音频事件检测。

背景技术

音频事件检测在具有共享数据以及通过电话网络进行话音通信的数字电话系统中是一种重要的应用。国际电信联盟(ITU)已经制定了通过分组网进行数据传送(V系列调制解调器信号)的标准(V.150)，该标准定义了公共交换电话网(PSTN)和因特网协议(IP)之间的互操作。在数据传送之前或期间，交换一系列音频事件，以便无论何时检测到音频事件，都能够采取具体的行动来起动和维护IP上适当的数据通信。

音频事件包括单音信号或具有不同调制方案的多频声段的组合。例如，音频事件包括具有开关调幅(AM)的单频信号音。在另一个示例中，音频事件包括跟随有单频信号音的双频组合信号音。在另一个示例中，音频事件包括具有周期性相位变化的单频信号音。因此，期望可靠地检测根据不同调制方案的音频事件。需要检测的某些标准音频事件包括T.30呼叫音(CNG)、V.25呼叫音(CT)、V.25应答音(ANS)/T.30CED、具有倒相的V.25应答音(ANS_PR)、具有调幅的V.8应答音(ANSam)、具有调幅和倒相的V.8应答音(ANSam_PR)、V.22复原二进制1(USB1)、V.21信道2HDLC标记、TIA/EIA-825TTY信号音、V.8双启动/响应、Q.24双音多频(DTMF)，多频信号音(例如MFR 1，MFR 2)等等。这些音频事件通过幅值、频率、或相位，或其任意组合进行调制。此外，这些音频事件包括具有相同音频特性的信号，信号的每一段都具有一个以上的频率分量。

大量通过数字电话系统传送的信令音需要能够识别预定音频事件的不同类型的音频检测器。然而，使多个独立的音频检测器在系统中运行会导致较高的复杂性，有时甚至会导致音频事件检测错误。一种用于检测音频事件的传统方法是基于Goertzel滤波器，Goertzel滤波器有效地估计了位于特定频率的信号的傅里叶变换。根据频率值的范围，分量的数量或时序，所需的处理以及存储器成本都会显著地增加，并且时常导致不良的缓慢检测。另外，为了使用该些Goertzel滤波器来检测具有低频分量的音频，该具有低频分量的音频(与采样率相比较)需要大量采样(从而增加了处理时间)。

附图说明

本发明通过举例来说明并且不局限于附图，附图中相同的引用标记表示相似的元件，其中：

图1根据本发明的一个实施例，以方块图表的形式示出了一个通讯系统；

图2根据本发明的一个实施例，以方块图表的形式示出了图1通信系统中的音频事件检测器；

图3根据本发明的一个实施例，以方块图表的形式示出了图2音频事件检测器中的预处理单元；

图4根据本发明的一个实施例，以方块图表的形式示出了图2音频事件检测器中的音频指示器；

图5根据本发明的一个实施例，以方块图表的形式示出了图2音频事件检测器中的联合音频检测器组；

图6根据本发明的一个实施例，以方块图表的形式示出了图5联合音频检测器组中的单分量频率检测器；

图7根据本发明的一个实施例，以方块图表的形式示出了图5联合音频检测器组中的单分量相位检测器；

图8根据本发明的一个实施例，以方块图表的形式示出了图5联合音频检测器组中的多分量音频检测器；

图9-12根据本发明的各种实施例，以方块图表的形式示出了解码音频特性的各种实施例；

图13根据本发明的一个实施例示出了相应于图2音频事件检测器操作的多级检测流程所对应的状态机；

图14根据本发明的一个实施例，以流程图的形式示出了音频事件检测的方法；

图15根据本发明的一个实施例，以流程图的形式示出了用于预处理所接收信号的方法；

图16根据本发明的一个实施例，以流程图的形式示出了音频指示的方法；

图17根据本发明的一个实施例，以流程图的形式示出了应用联合音频检测器组的方法；

图18根据本发明的一个实施例，以流程图的形式示出了用于错误校正的方法；

图19根据本发明的一个实施例，以流程图的形式示出了应用音频检测判定逻辑的方法。

本领域的技术人员应当认识到为了达到简明清楚的目的，附图中所示的元件不必按比例描绘。例如，附图中一些元件的尺寸可以相对于其他元件被放大，从而有助于提高对本发明实施例的理解。

具体实施方式

如这里所使用的，术语“总线”指的是多个信号或导线，该信号或导线用于传输一个或多个不同类型的信息，如数据，地址，控制信号或状态信号。这里所讨论的导线可用于图示或描述单个导线，多个导线，单向导线，或双向导线。然而，不同实施例可以改变导线的实施。例如，可以使用单独的单向导线，而非双向导线，并且反之亦然。同样，多个导线可以被连续或以时分复用的方式传送多个信号的单个导线取代。同样，传送多个信号的单个导线可以被分离成传送这些信号的子集的各种不同的导线。因此，传送信号存在多种选择。

当涉及到将信号，状态位，或类似的装置分别译成其逻辑真或逻辑假的状态时，使用术语“断言”和“否定”(或“取消断言”)。如果逻辑真状态为逻辑电平1，则逻辑假状态为逻辑电平0。如果逻辑真状态为逻辑电平0，则逻辑假状态为逻辑电平1。

连接

图1根据本发明的一个实施例，以方框图的形式示出了通信系统10。通信系统10包括一发送器/接收器12，一音频事件检测器14，通信网络16，一音频事件检测器18，一发送器/接收器20，以及控制总线22。控制总线22双向连接到发送器/接收器12，音频事件检测器14，通信网络16，音频事件检测器18，和发送器/接收器20。发送器/接收器12双向连接到音频事件检测器14，该音频事件检测器14双向连接到通信网络16，该通信网络16双向连接到音频事件检测器18，该音频事件检测器双向连接到发送器/接收器20。

图2根据本发明的一个实施例，以方框图的形式示出了音频事件检测器14。该音频事件检测器14包括可选的预处理单元26，音频指示器32，开关36和43，联合音频检测器组40，以及判定逻辑和控制单元44(也可称为共用控制逻辑44)。音频事件检测器14接收采样输入信号x’(m)，该信号x’(m)提供给预处理单元26(如果使用))和开关43。预处理单元26(如果使用)经由导线28耦接到判定逻辑和控制单元44，并提供信号x(n)30给音频指示器32和开关36。应当指出如果不存在预处理单元26，信号x’(m)作为信号x(n)30提供给开关36和音频指示器32。音频指示器32提供音频指示信号34给开关36和判定逻辑控制单元44，并提供电源指示器P(n)38给联合音频检测器组40。音频检测器组40耦接到开关36，并经由导线42和46耦接到与判定逻辑和控制单元44。判定逻辑和控制单元44耦接到开关43，并提供检测到的音频事件信号45作为音频事件检测器14的输出。应当指出在一个实施例中，检测到的音频事件信号45经由控制总线22来提供。可选地，检测到的音频事件信号45可以作为独立的信号或经由通信网络16提供给控制总线22。音频事件检测器14通过由控制总线22提供的音频事件检测器控制47被外部控制。

图3根据本发明的一个实施例，以方框图的形式示出了预处理单元26。预处理单元26是可选的并包括可选的抽取器48，和可选的自动电平控制(ALC)单元50。抽取器48接收x’(m)信号并产生x”(n)给ALC 50。ALC 50经由导线28提供信号电平51给判定逻辑和控制单元44，并提供x(n)给开关36和音频指示器32。应当指出抽取器48和ALC 50均是可选的。因此，可选实施例可以包括这些单元中的一个或都不包括这些单元。可选地，预处理单元26可以包括除了或取代抽取器48和ALC50以外的其他单元，这些其它单元可以预先处理或预调节信号x’(m)来产生信号x(n)30。

图4以方框图的形式示出了图2的音频指示器32的一个实施例。音频指示器32包括存储器52，延迟单元54和56，乘法器58和60，加法器62，幅值单元64，低通滤波器(LPF)66，和音频指示判定单元68。信号x(n)30提供给延迟单元54和乘法器58。延迟单元54耦接到延迟单元56和乘法器60，并从存储器52接收k。延迟单元56耦接到乘法器58，并从存储器52接收k。乘法器58和乘法器60耦接到与幅值单元64相连的加法器62。幅值单元64耦接到与音频指示判定单元68相连的LPF 66，从存储器52接收a，并提供P(n)38给联合音频检测器组40。音频指示器判定单元68耦接到存储器52并提供音频指示信号34。

图5以方块图表的形式示出了图2联合音频检测器组40的一个实施例。联合音频检测器组40包括单分量频率检测器70，单分量相位检测器72，和多分量音频检测器74。每个检测器70、72和74接收信号x(n)30，并经由导线42提供音频特性给判定逻辑控制单元44。每个检测器70、72和74还可经由导线46从判定逻辑和控制单元44接收信息和控制，并且还接收P(n)38。另外，应当指出在可选实施例中，联合音频检测器组40可以根据需要存在其它，较少或不同的检测器，并且每个检测器能够接收并提供所有在图5中示出的信号，信号子集，或不同的信号。因此，如下面描述的，联合音频检测器组40可以包括任何数量的检测器。

图6以方块图表的形式示出了图5中的单分量频率检测器70的一个实施例。单分量频率检测器70包括两点移动平均单元76，能量计算单元78，低通滤波器(LPF)80，倒数估计单元82，乘法器84，低通滤波器(LPF)86，加法器100，倒数估计单元98，乘法器96，低通滤波器(LPF)94，和单分量频率检测器判定单元90。两点移动平均单元76接收x(n)30，并耦接到与低通滤波器(LPF)80相连的能量计算单元78，该低通滤波器(LPF)80与乘法器84相连。倒数估计单元82接收P(n)38，并耦接到与LPF 86相连的乘法器84。LPF 86提供ρ_Ω88给单分量频率检测器判定单元90和加法器100。加法器100还接收1，并耦接到与乘法器96相连接的倒数估计单元98。乘法器96接收P(n)38并将信号提供给LPF 94，该LPF 94产生ρ_A92给单分量频率检测器判定单元90，该单分量频率检测器判定单元90经由导线42和46与判定逻辑和控制单元44通信。

图7以方块图表的形式示出了图5中的单分量相位检测器72的一个实施例。单分量相位检测器72包括耦接到相位估计单元104的自适应数字振荡器102和连接到单分量相位检测器判定单元158的频率/相位偏移校正单元106。自适应数字振荡器102包括延迟单元112，118和116，乘法器114，加法器108。加法器108耦接到乘法器114和延迟单元118，并提供目标信号w(n)110给延迟单元112和相位估计单元104。乘法器114接收2并耦接到加法器108，延迟单元116，延迟单元118和112。相位估计单元104包括延迟单元120和134，低通滤波器(LPF)136和138，乘法器122，124，126，128，以及加法器130和132。信号w(n)110提供给乘法器128，延迟单元120，和乘法器122。加法器130耦接到乘法器122，124和LPF 136。延迟单元120接收n₀并耦接到乘法器124和126。可选滤波器133耦接到乘法器122，延迟单元134，和乘法器126。延迟单元134的输出耦接到乘法器124和128并接收信号n₀。加法器132耦接到乘法器126和128以及LPF 138。每个LPF 136和138接收b。LPF 136提供信号c(n)137以及LPF 138提供信号s(n)139给单分量相位检测器判定单元158。频率/相位偏移校正单元106包括延迟单元140，142和154，加法器148和152，以及乘法器150，144和146。延迟单元140接收c(n)并耦接到乘法器144。延迟单元142接收s(n)并耦接到乘法器146。乘法器144接收s(n)并耦接到加法器148。乘法器146接收c(n)并耦接到加法器148。乘法器150耦接到加法器148和152并接收数据μ。加法器152耦接到延迟单元154并提供c₀(n)156给延迟单元116和延迟单元154以及单分量相位检测器判定单元158。图7还包括提供所需存储值的存储单元160，例如，c₀(-1)，n₀，b和μ，该存储单元160耦接到单分量相位检测器判定单元158。在一个实施例中，图7还包括可选幅值估计器，其包括乘法器151和145，加法器149，倒数估计147，LPF 143。该可选幅值估计器接收c₀(n)并产生ρ_A’141给单分量相位检测器判定单元158。在该实施例中，乘法器151接收c₀(n)的两个实例，并耦接到加法器149的负输入端，该加法器接收信号1并耦接到与乘法器145相连接的倒数估计单元147。乘法器145接收P(n)38并耦接到LPF 143。LPF 143接收b并产生信号ρ_A’141。单分量相位检测器判定单元158经由导线42和46与判定逻辑和控制单元44通信，并且耦接到存储器160。

图8示出了多分量音频检测器74的一个实施例。该多分量音频检测器74包括滤波器₁162到滤波器_N164，每个滤波器接收x(n)30，并耦接到AM-FM解调器₁166到AM-FM解调器_N168相对应的其中一个。自调谐单元170耦接到解调器166到168，滤波器162到164，以及多分量音频检测器判定单元172。多分量音频检测器判定单元172经由导线42和46与判定逻辑和控制单元44通信，并接收P(n)38。

图9示出了单分量频率检测器判定单元90部分的一个实施例，该单分量频率检测器判定单元90包括接收P(n)38和P_LOW并耦接到阶跃函数176的加法器174，随后该阶跃函数176生成解码ON-OFF幅值μ_ON-OFF(n)。应当指出这里所使用的阶跃函数U(y)对于y＞0的所有值都等于1，否则等于0。可选的实施例可以定义不同的阶跃函数U(y)。

图10示出了单分量频率检测器判定单元90或单分量相位检测器判定单元158(或90和158两者)部分的一个实施例，其中包括DC偏移估计和补偿单元178，该DC偏移估计和补偿单元178接收信号P(n)38或ρ_A 92或ρ_A’141(或及其任何结合)，并耦接到与加法器182相连接的过零计数器180。加法器182接收NZmax并耦接到阶跃函数184，随后该阶跃函数184生成解码的AM调制频率μ_AM(n)。

图11示出了单分量频率检测器判定单元90或多分量音频检测器判定单元172，或单分量相位检测器判定单元158(或90，172，158的两个或多个)部分的一个实施例，其中包括加法器186到190，每个加法器接收对应的参考值ρ_Ω(n)(

到

其中之一)，并耦接到相应的L-norm 192到196中的一个。每一个L-norm192到196耦接到arg min 198，随后arg min 198产生解码频率μ_f(n)。

图12示出了单分量相位检测器判定单元158部分的一个实施例，其包括ABS单元200，ABS单元204，加法器202，212，216，224和220，阶跃函数206，208，210以及乘法器214，218和222。信号c(n)137提供给阶跃函数206和ABS单元200。信号s(n)139提供给ABS单元204和阶跃函数210。ABS单元204和ABS单元200耦接到与阶跃函数208相连接的加法器202。加法器212耦接到阶跃函数206，阶跃函数210和乘法器214。乘法器214-2，并耦接到加法器216，该加法器接收1并耦接到乘法器218。乘法器218耦接到阶跃函数208和加法器224。乘法器222接收2并耦接到阶跃函数210和加法器220，该加法器接收1，并耦接到加法器224。加法器224接收乘法器218和加法器220的输出，并产生解码相位μ_p(n)。应当指出，如果给定信号c(n)137和s(n)139，那么相应的相位信息能够被映射到具有独立轴c(n)228和s(n)230的二维空间。解码相位信息与分别由0，1，2，3表示的量化参考点232，234，236和238相对应。在当前的实施例中，判定边界240和242假定解码相位值是等概率的。根据相关的应用，本领域的技术人员知道可以定义可选判定边界，此时图12的实施例中可以包含比所示更多或更少的块。

图1-12示出了通信系统10中存在的方块的一个实施例。可选实施例根据所需的功能包括与所示元件不同的各种元件，或比所示元件多的元件，或比所示元件少的元件。此外，图1-12中的块能够不同地分组或不同地连接而仍然获得相同的结果。因此，图1-12仅仅意味者提供用于说明下面将要讨论的原理的范例。同样，尽管图1-12中的连接已经被描述成单个导线(单方向或双向的)或作为若干导线(单方向或双向的)，也可以使用各种不同的连接。例如，若干导线可以被各种不同的单个单向的或双向的导线代替。类似的，单个导线可以扩展成若干个单向的或双向的导线。信号能够经由信号导线串行地通信，或能够经由若干导线并行地通信。同样，信号能够经由单个或若干个导线时间复用传输。因此，图1-12所示的连接能够以各种不同的方式实现，而同样获得所需的功能。同样，如下面进一步描述的，图1-12的设计能够在硬件，软件，或硬件和软件的结合中实现。同样应当指出诸如存储器52和160的存储单元可以包含在音频事件检测器14的任何地方，或可选地扩展到音频事件检测器14的外部。

操作

如这里描述的，音频事件检测器用来检测输入信号(如，采样输入信号)上的音频事件。在一个实施例中，音频事件检测器首先确定输入信号上是否指示存在音频，于是根据这个确定，选择地确定是否已经检测到输入信号上的音频。例如，在一个实施例中，仅仅当首先指示出存在音频时，才执行音频检测，从而如果没有指示出音频的存在，则不执行音频检测。由于使用简化的方式来指示音频的存在，因而这种多段过程有助于减少音频事件检测器的复杂性，只有当需要时(例如只有当存在的音频已经被首先指示出时)，才启用更复杂的算法式用于音频检测。而且，在一个实施例中，音频检测包括生成相应于所检测到的音频的一个或多个音频特性，其中这些音频特性可以提供频率信息，时序信息，相位信息，调制信息，幅值信息，等等，或其任何的组合。然后这些音频特性被用来确定所检测到的音频是否相应于一个有效的音频事件。

参考图1，发送器/接收器12经由音频事件检测器14提供并接收通信网络16的数据信号。类似地，发送器/接收器20经由音频事件检测器18提供并接收通信网络16的数据信号。因此，发送器/接收器12和20能够通过通信网络16互相通信。发送器/接收器12和发送器/接收器20可以是任何用于通过通信网络16进行通信的设备，例如电话，调制解调器，等等。同样，通信网络16包括信息分组电话网络(例如包括，因特网协议语音(IP)，信息分组上的数据，同步传输模式(ATM)，等等，同时也可以应用于无线网络或有线网络系统或公共交换电话网(PSTN)。在可选的实施例中，通信系统10指的是任何类型的通信系统。

控制总线22在发送器/接收器12和20、音频事件检测器14和18、以及通信网络16之间提供控制路径。经由控制总线22传输的控制信号通常是非线内信号。例如，控制总线22包括使能/禁止信号来启动或禁止音频检测器14或18，或包括需要在音频检测器14或18各个部分之间通信的信号。控制总线22还包括指示电话是否处于挂机或摘机的信号。同样应当指出，如下述更详细的描述，控制总线22包括发送信号的解码版本，例如根据RFC2833标准。

应当指出发送器/接收器12和音频事件检测器14的操作类似于发送器/接收器20和音频事件检测器18的操作。也就是，如图1所示的通信系统10是对称的。因此，将参考发送器/接收器12和音频事件检测器14对图2-12进行描述；然而，应当理解到该描述同样适用于发送器/接收器20和音频事件检测器18。此外，尽管本发明的实施例使用发送信号来描述，但音频事件检测能够在发送或接收信号中的任一个(也就是，前往或者离开通信网络的信号)上执行。在图1中，发送器/接收器12提供标记为x’(m)的发送或传输信号给音频检测器14。信号x’(m)包括普通语音或包括根据具体调制方案(例如AM，频移键控(FSK)，差分相位频移键控(DPSK)等等)的音频事件。

例如，TTY电话能够通过诸如通信网络16的通信网络启动语音和文本通信。TTY电话一般包括允许文本通信的内置键盘。即，对于每个按下的键产生相应的字符串。生成的字符串相应于FSK调制音频事件。例如，当使用TTY电话时，任何按下的键将产生具有七(7)个FSK调制音频的音频事件，包括一起始位音频，5个数据位字符集音频，和一终止位音频。因此，应当指出在这种情况中，音频事件包括7个单独的音频段。在一个例子中(例如，当通信网络是分组电话网络时)，与音频事件相关的信息被传输给接收器，使得音频事件能够在接收器侧本地地被重造。也就是，在这个例子中，一旦通过发送器(如，发送器12)检测由TTY电话生成的起始位音频，发送器抑制余下的音频直到检测到音频事件，这时，发送器发送与音频事件相关的信息给接收器(例如，接收器20)，该接收器能够从发送的信息中本地恢复音频事件。在一个例子中，该信息通过诸如控制总线22这样的控制线传输，而非经由通信网络传输。可选地，音频事件的信息或信号音能够直接通过通信网络发送。

图2根据本发明的一个实施例，以方框图的形式示出了图1音频事件检测器14。信号x’(m)提供给可选预处理单元26和开关43。在一个实施例中，信号x’(m)以8kHZ的采样率进行采样并在块中被处理。例如，信号x’(m)以10毫秒80个采样的速率进行处理。在一个实施例中，音频事件检测器14在多阶段中运行(参考图13的状态图来进一步描述)，多阶段包括：(1)扫描具有音频指示器的信号，(2)识别音频特性(包括一个或多个阶段)，和(3)根据识别的音频特性检测音频事件，其中该音频事件被映射到定义音频事件的音频特性集。

在一个实施例中，音频事件检测器14包括预处理单元26，预处理单元26抽取发送信号x’(m)，利用自动电平控制来增加或减少信号电平，或两者。预处理单元26的输出x(n)30提供给扫描具有音频指示器(该指示器将参考图4作更详细的描述)的信号x(n)的音频指示器32。预处理单元26还经由导线28提供由自动电平控制单元50，如果使用，引入的信号电平缩放比例的数量，以便通过判定逻辑和控制单元44估计正确的信号电平。应当指出如果不存在预处理单元26，那么发送信号x’(m)作为信号X(n)30直接被提供。

如果音频指示器32指示出存在的音频，那么提供音频指示信号34来使能或闭合开关36，使得信号x(n)30提供给联合音频检测器组40。然而，如果音频指示器32没有指示出存在的音频，那么音频指示信号34被提供来禁止或开关断开36，使得禁止或跳过联合音频检测器组40。音频指示信号34还提供给判定逻辑和控制单元44，这样有助于使音频事件有效或检验当前音频事件的中断。同样，如果音频指示信号34指示出不存在音频，那么判定逻辑和控制单元44激活开关43，使得信号x’(m)被直接提供给通信网络16，从而跳过联合音频检测器组40。在可选的实施例中，开关43可以通过使用仅消除x’(m)的音频事件部分的滤波操作来实现。如果音频指示信器32经由音频指示信号34指示出音频的存在，那么联合音频检测器组40被激活(经由开关36)并经由导线42提供音频特性(以及任何其他相关的信号，如果存在)给判定逻辑和控制单元44，该判定逻辑和控制单元44能够使用接收到的音频特性来确定是否检测到有效的音频事件。(同样应当指出，其他相关的内部音频事件检测器控制信号可以经由导线46从判定逻辑和控制单元44反向通信给联合音频检测器组40。)

因此，在一个实施例中，直到音频识别器32至少指示存在音频，音频才被检测或识别。因而，应当指出如这里所使用的，音频指示指的是确定是否指示出存在的音频，音频检测指的是更完全地识别指示出的音频(例如，通过产生已被指示出的音频的音频特性)。在这种方式中，由于和更为复杂的音频检测算法相比，使用简化的方法来指示音频的存在，可以减少处理的时间和复杂度，仅当需要时采使用复杂的算法用于音频检测(例如，仅仅当首先指示存在的音频时)。因此，参考图2，仅仅当存在的音频已经被指示时，联合音频检测器组40的音频检测器可才被激活，从而减少了处理时间和复杂度。此外，应当指出，在一个实施例中，在联合音频检测器组40中的每一个音频检测器可以根据需要被单独的激活。还应当指出，不同的实施例在联合音频检测器组40中可以包括任何数量的音频检测器，这些音频检测器可以提供所需的任何类型的音频特性。例如，由联合音频检测器组40中的一个或多个检测器输出的音频特性包括用于检测音频的频率信息，用于检测音频的相位信息，用于检测音频的幅度和幅值信息，用于检测音频的调制信息，用于检测音频的时序信息等等，或其任意的组合。

根据经由导线42从联合音频检测器组40接收到的音频特性，判定逻辑和控制单元44能够确定是否检测到有效的音频事件(其中，如上所述，有效的音频事件包括一个或多个音频并能够根据各种不同的协议方案被定义)。如果检测到有效的音频事件，那么判定逻辑和控制单元44经由控制总线22提供检测到的音频事件的指示给通信网路16。在一个实施例中，音频事件自身并不通过通信网络传输。相反，而与音频事件相关的信息经由控制总线22传输，使得位于网络接收端的音频事件检测器能够根据接收到的与检测到的已传输的音频事件相关的信息本地地产生音频事件。在这种方式，接收到的音频事件无需通过通信网路通信。可选地，除了或代替经由控制总线22提供信息，检测到的音频事件可以通过通信网络16通信。

参考图13和14也描述了图2的操作。参考图13，当音频当前不被指示时，音频事件检测器14处于搜索存在的音频的状态244。如果音频未被指示，那么音频指示标记f_i被清零(f_i＝0)。一旦音频被指示(例如，通过音频指示器32)，则从状态244到状态246的状态机转换中识别音频。一旦识别了音频(例如，通过音频检测器组40)，则将大于0的ID分配给那个音频(例如，通过联合音频检测器组40)，并且在转换到状态248的状态机转换中检测音频事件。然而，如果音频未被识别(或如果检测到的音频是无效的)，则将等于0的ID分配给该无效音频并且在从状态246返回到状态244的状态机转换中音频指示标记被清零。在状态248中，一旦检测到音频事件(例如，通过判定逻辑和控制单元44)，则设置音频事件检测标记(f_d＝1)并且状态机转换返回到状态244。同样，应当指出如果检测到一个无效的音频事件，状态机同样转换到状态244并且音频事件检测标记也被设置(f_d＝1)。即，不管是否检测到有效音频或如果该音频事件被认为是无效的，状态机转换都返回到244，并且设置f_d为1。无论何时检测到有效的音频事件，其相应的标识都从音频事件检测器14提供给控制22。尽管未检测到音频事件，但状态机仍保持在状态248，同时音频事件检测标记保持清零状态(f_d＝0)。

参考图14，流程首先开始于250，接着进入到块252，在块252中初始化音频事件检测器控制信号。然后流程进入块254，在块254中接收到输入信号的新采样。于是流程进入块256，在块256中任选地应用预处理，参考如上所述的可选预处理单元26。接着流程进入到块258，在块258中应用了音频指示器。如果在判定方块260中音频未被指示出，则流程进入到判定方块268，在块268中确定新的采样是否可用。如果是，流程回到块254，如果不是，流程在终止于结束270。然而，如果在判定方块260中音频被指示出，则流程进入到块262，在块262中应用联合音频检测器组来确定是否检测到有效的音频，在块262中有效的音频表示全部或部分的音频事件。在块262之后，流程进入到判定方块264，在块264中确定是否检测到有效的音频事件，如果检测到，流程进入到块266，在块266中报告所检测到的音频事件标识。例如，当检测到TTY音频事件时，所报告的音频事件标识可以是相应的TTY编码字符和信号电平。如果没有检测到，流程进入到判定方块268。

参阅图2，应当指出预处理用于预调节x’(m)从而产生x(n)。如果存在，预处理单元26能够对输入信号x’(m)执行不同类型的预处理从而产生预调节的信号x(n)。图3示出了图2预处理单元26的一个实施例。在所示的实施例中，预处理单元包括可选的抽取和电平控制。

在一个实施例中，如图3中所示的，预处理单元26抽取x’(m)从而产生抽取的且电平调整过的信号x(n)，其中n相应于已抽取的采样索引。因此，应当指出上述图14的流程(例如块258、判定方块260、块262、判定方块264，和块266)可以每y个采样就执行一次，其中y相应于抽取器48输入的次速率。例如，在一个实施例中，y＝2使得x(n)具有和x’(m)的8kHz采样率相比减少的4kHz采样率。在这种方式中，抽取器48用于减少计算复杂性使得只有每第y个采样被处理。应当指出y可以是任意值(包括1，表示由于每个采样都被处理，因此不使用次速率处理，即m＝n)。因此，每第y个采样可以被认为是次速率采样。因此，在这里使用的等式中，如果存在抽取器48则在这里使用x(n)，n指的是次速率采样，如果不存在抽取器48，n指的是和m相同的索引。

为了通过放大输入采样提高动态范围，可以使用自动电平控制单元50。在一个实施例中，x’(n)的电平或增益在放大之前被监控以便如果必要使之减少来避免削波。自动电平控制单元50还用于减少电平x’(m)从而避免削波。预处理单元26还提供由自动电平控制单元50，如果使用，经由信号电平51输入的信号电平缩放量，使得校正信号电平通过判定逻辑和控制电路44来估计。在一个实施例中，信号电平51经由导线28来提供。

参考图15能够进一步理解可选预处理单元26的操作，图15示出了图14的块256的一部分。在判定方块272，如果抽取被激活(例如，如果存在抽取器48)，则流程进入到块274，在块274中抽取信号x’(m)以生成x”(n)并且流程进入到判定方块276。在判定方块272，如果抽取未被激活(例如，如果不存在抽取器48)，则流程进入到判定方块276。在判定方块276，如果自动电平控制被激活(例如，如果存在自动电平控制单元50)，则流程进入到块278，在块278中在预定数量的采样(如果抽取被激活，即，次速率采样)中确定|x”(n)|的最大幅值。然后流程进入到块280，在块280中x”(n)被归一化以便生成x(n)使得其最大绝对值在预定范围内。于是流程进入到图14的块528。同样，如果在判定方块276，自动电平控制未被激活(例如，如果不存在自动电平控制单元50)，则流程进入到图14的块258。

图4示出了图2音频指示器32的一个实施例，其参考图16来描述。然而，应当指出在可选实施例中，可以使用任何方法来指示音频的存在。所示图4的实施例使用了诸如改良版的Teager-Kaiser滤波器的多项滤波器来指示任何频率的正弦信号的存在。应当指出可以使用任何适当的多项滤波器。图4中所示的多项滤波器仅是一个实施例。

图4包括将任何单频信号音通过修正的能量算符转换成常数的实施例。即，单频信号音可以表示如下。

等式1：x(n)＝Acos(Ωn+φ)

修正的能量算符ψk可以表示如下。

等式2：ψ_k(x(n))＝x²(n-k)-x(n)x(n-2k)＝A²sin²(kΩ)，k＝1，2，……

在上述等式中，应当指出x(n)相应于x(n)30并且x²(n-k)-x(n)x(n-2k)相应于图4加法器62的输出(即，延迟54的输出是x(n-k)，延迟56的输出是x(n-2k)，乘法器58的输出是x(n)x(n-2k)，乘法器60的输出是x²(n-k)，并且加法器62的输出是乘法器60的输出和乘法器58的负输出的总和)。通过将等式1中的x(n)替换成x²(n-k)-x(n)x(n-2k)，获得结果A²sin²(kΩ)。因此，应当指出ψ取决于音频的幅值A和归一化频率Ω(Ω＝2πf/f_s)，其中f是音频，f_s是采样频率，在利用抽取的实施例中相应于次速率。应当指出ψ_k(x(n))不依赖于初始相位φ，而是根据急剧的相位变化生成短期瞬变，这可以用来表示通信信号x(n)中的相位变化。

x(n)30的功率(等式1)可以用下述等式表达。

等式3：Power_x(n)＝A²/2

因此，应当指出ψ_k(x(n))提供了由A²sin²(kΩ)缩放的x(n)的功率，因此：

等式4：ψ_k(x(n))＝Power_x(n)*2sin²(kΩ)

用ψ_k(x(n))来求出Power_x(n)，从而得到下述等式：

等式5：Power_x(n)＝ψ_k(x(n))csc²(kΩ)/2

然而，实际上，信号x(n)30会被噪声破坏，产生噪声估计ψnoisy_k(x(n))。于是任何低通滤波器都可以用于平滑该结果，例如，单极点低通滤波器。因此，从图4中可以看出，音频指示器32包括低通滤波器66，低通滤波器66接收幅值64的输出(相应于加法器62输出的绝对值)和来自存储器52的a并且提供ψnoisy_k(x(n))的平滑估计P(n)。P(n)可以用下述等式表达。

等式6：P(n)＝a P(n-1)+(1-a)|x²(n-k)-x(n)x(n-2k)|

在上述等式中，a是控制平滑低通滤波器带宽的平滑参数(0＜a＜1)。应当指出可以使用固定的或变化的平滑参数a。于是P(n)38(位于图4中LPF 66的输出端)被提供给图4中的音频指示判定单元68，音频指示判定单元68基于估计P(n)的方差表示是否存在音频，下文参考图16将更详细地描述。P(n)38还提供给联合音频检测器组40。

当x(n)30是音频信号时，P(n)38的方差相当小。即，单频信号音无论何时存在于x(n)30，相应于P(n)38微小方差的P(n)38都期望是恒定水平。因此，音频指示判定单元68搜索其中小方差的P(n)38段，从而提供x(n)30上存在音频的指示。例如，参考图16，流程从估计信号能量P(n)的块282开始(来自图14的块256)。(应当指出上述描述提供了如何估计P(n)的一个例子，但可选实施例除了使用Teager-Kaiser方法还可以使用不同的方法来估计信号能量。)然后流程进入到判定方块284，在判定方块284中确定P(n)是否大得足以进行以下处理。即，P(n)应当大得足以指示x(n)上信号的存在。如果不是这样，流程进入到块290，在块290中音频指示标记f_i被清零并且流程进入到图14的块260。

如果P(n)足够大，于是流程进入到块286，在块286中检测到具有小方差的P(n)段。如果，在判定方块288，未搜索到小方差段，则流程进入到块290，在块290中fi被清零，然后流程进入到图14的块260。然而，如果搜索到小方差段，则流程进入到判定方块292，在判定方块292中确定小方差段是否足够长。即，如果x(n)上存在音频信号，那么P(n)应当保持相当长时间的恒定不变(即，具有相当小的方差或具有小于预定方差量的方差，其中预定的方差量基于所需的音频分量的数量来确定)。如果时间不够长(即，不超过预定的持续时间)，那么流程进入到块290，在块290中f_i被清零。在这个例子中，假设小方差P(n)段的长度太短以致不能指示x(n)上音频信号存在的可能性。在一个实施例中，所需最小段持续时间(具有小P(n)方差)取决于采样速率、噪音级、低通滤波器控制参数以及要检测的音频事件的类型。在一个实施例中，可靠指示音频段需要足够的长度，但不长于最短音频事件的持续时间。

如果在判定方块292，小方差段被确定为足够的长，于是流程进入到块294，在块294中设置f_i(f_i＝1)。因此，在块294中，音频指示标记被设置来表示已经检测到音频的存在。应当指出判定方块284、288、292以及块286、290、294都可以由音频指示判定单元68来执行。在一个实施例中，当音频指示标记被设置时，音频指示信号34表明向联合音频检测器组40和开关36指示已经检测到音频的存在。可选择的，音频指示标记和音频指示信号34可以是相同的指示器。因此，一旦在块294检测到音频的存在，就启动音频检测(例如，通过闭合开关36和启动联合音频检测器组40)。应当指出在所示的实施例中，根据每个采样点(以采样速率，如果如果使用抽取则以次速率)选择性地启动和禁止联合音频检测器组40而无需在整个操作中全部启动。在这种方式中，根据每个采样启动和禁止各个音频检测器，而不是根据每个块，从而比现有技术产生更可靠和更频繁的判定。即，在现有技术系统中，判定逐块进行，其中块可为10毫秒长，具有80个采样。然而，根据每个采样启动或禁止音频检测器的能力可以通过允许根据每个采样的变化来提高性能和灵活性。同样，根据音频指示启动或禁止检测器的能力允许显著地减少复杂性和功率消耗。

图5示出了图2的联合音频检测器组40的一个实施例。所示的实施例包括三个检测器：单分量频率检测器70(参考图6进一步描述)、单分量相位检测器72(参考图7进一步描述)和多分量音频检测器(参考图8进一步描述)。可选实施例可以包括任何数量和任何类型的检测器。图5中的每个检测器接收x(n)30和P(n)38并且经由导线42提供音频特性给判定逻辑和控制单元44。检测器70、72和74还经由导线46接收来自判定逻辑和控制单元44的信息并且相互之间传送信息。即，检测器可以相互依赖，或相互独立操作。在所示的实施例中，每个检测器70、72和74的相关性在于它们能够共享信息并且能够基于来自其他检测器的信息进行调整。(参考图6-12将更详细地描述检测器70、72、和74。)

图6示出了图5的单分量频率检测器70的一个实施例。所示的实施例接收x(n)30和P(n)38并且提供检测到的音频的频率分量(ρ_Ω)给单分量频率检测器判定单元90，如果需要，提供检测到的音频的幅度分量(ρ_A)给单分量频率检测器判定单元90。参考图6，x(n)30提供给两点移动平均单元76，两点移动平均单元76的输出端提供给能量计算单元78。应当指出根据x(n)上输入音频的幅值A，上述能量操作算符ψ_k(.)对相同的归一化频率Ω产生不同的电平。因此，为了估计Ω，这种幅度相关性必须被消除(即，提取)。因此，使用两点移动平均单元76从输入信号中消除幅度相关性。这能够按照下文所示的等式7实现。

等式7：

\frac{1}{2} (x (n - d_{1}) + x (n - d_{2}))

应当指出在上述等式中，d₁表示第一延迟值而d₂表示第二延迟值，从而确定x(n)中间隔为“d₁-d₂”的两个采样之间的平均值。然后能量计算单元78确定从两点移动平均单元76接收的两点移动平均值的能量，如下述等式所示。

等式8：

Ψ_{k} (\frac{1}{2} (x (n - d_{1}) + x (n - d_{2})))

应当指出P(n)38(音频指示器32确定的x(n)的能量，在一个实施例中，相应于上述修正的Teager-Kaiser能量算符)被提供给倒数估计82。可选地，应当指出x(n)30的能量可以在单分量频率检测器内部计算并且可以根据不同的方法来计算。

能量计算单元78的输出提供给LPF 80。LPF 80可实现为单极点滤波器并且为了获得更好的音频检测运行LPF 80以便从信号中消除噪声。P(n)38提供给乘法器96和倒数估计单元82。从而倒数估计单元82被用于估计1/P(n)≈1/ψ_k(x(n))。

LPF 80和倒数估计单元82的输出提供给乘法器84，为了使结果平滑，乘法器84的输出提供给LPF 86。因此，LPF 86的输出提供的ρ_Ω可以如下表示：

等式9：

ρ_{Ω} = \frac{Ψ_{k} (\frac{1}{2} (x (n - d_{1}) + x (n - d_{2})))}{Ψ_{k} (x (n))} = \cos^{2} ((\frac{d_{1} - d_{2}}{2}) Ω)

应当指出如果选择d₁-d₂使得d₁-d₂＝2k，ρ_Ω的值可以用来确定ρ_A(如必要的话)。即，在可选实施例中，如果不需要幅度分量(ρ_A)，就不存在乘法器100、倒数估计98、乘法器96，和LPF 94。在所示的实施例中，LPF 86的输出(ρ_Ω)提供给加法器100以便从1中减去ρ_Ω从而产生1-ρ_Ω。加法器100的输出提供给倒数估计单元98，倒数估计单元98估计1/(1-ρ_Ω)并将结果提供给乘法器96。乘法器96将P(n)38(在一个实施例中，相应于ψ_k(x(n)))和倒数估计单元98的输出相乘，为了使结果平滑并将结果提供给LPF 94。因此，LPF94的输出提供的ρ_A可以如下表示：

等式10：

ρ_{A} = \frac{Ψ_{k} (x (n))}{1 - ρ_{Ω}} \approx A^{2}

在等式10中，假设d₁-d₂＝2k并且等式1、2和9的结果对输入信号x(n)30是适用的。应当指出还可以使用三角恒等式sin²(kΩ)+cos²(kΩ)＝1。

每个LPF 80、86和94都接收影响低通滤波器带宽的参数α(图6中未示出)。如果参数α的值接近1，则会减少带宽。因此，根据所需的带宽可以使用不同的α值。例如，一个实施例中根据所需的带宽α可以取两个值。可选的，根据音频格式，每个滤波器可以使用不同的α值。

还应当指出倒数估计单元82和98的一个实施例是使用多项式近似法来计算分子N和分母D之间的比率q＝N/D，如下述等式所示。

等式11：

q = \frac{N}{D} = \frac{2 N}{2 D} = \frac{2 N}{2 D 2^{b} 2^{- b}} = N (\frac{1}{2 D 2^{b}}) 2^{b + 1} = Np (D^{'}) 2^{b + 1}

在上述等式中，D’＝D2^b是归一化至范围1/2和1之间的分母，b是归一化前导位的相应数量，p(.)是函数f(x)＝1/2x(1/2≤x≤1)的多项式近似。在当前实施例中，选定为三阶多项式，使得：

等式12：

q = N (a_{3} + D^{'} (a_{2} + D^{'} (a_{1} + D^{'} a_{0}))) 2^{b + 4} \approx \frac{N}{D}

在上述等式中，系数归一化的范围在-1和+1之间从而产生附加的3个移位(即，2^b+1改变为2^b+4)。一个实施例是使用下述归一化的系数：a₀＝-0.2248，a₁＝0.6695，a₂＝-0.7357，和a₃＝0.3532。因此，倒数估计单元82和98能够使用这种近似法高效并且有效地估计该倒数。

参考图6，ρ_Ω和ρ_A提供给单分量频率检测器判定单元，单分量频率检测器判定单元将这些值作为输出提供给判定逻辑和控制单元44(例如，经由导线42)或使用这些值来输出不同格式的音频特性，参考图9-11所描述的，图9-11示出了在单分量频率检测器判定单元90内单独或组合使用来提供音频特性的各种实施例，例如，解码频率、AM调制频率、解码开关幅值指示器等等。

图7示出了图5单分量相位检测器72的一个实施例。所示实施例接收x(n)30并且提供所检测音频的相位分量c(n)137和s(n)139给单分量相位检测器判定单元158。检测器72包括自适应数字振荡器102，自适应数字振荡器102根据控制信号c₀(n)提供尝试和输入信号x(n)30相匹配的目标信号w(n)110。目标信号w(n)110和输入信号x(n)30提供给相位估计104。(应当指出检测器72包括可选滤波器133，可选滤波器133在执行相位估计之前被用于过滤x(n)30)。例如，在一个实施例中，根据所使用的音频格式，滤波器133被用来消除来自x(n)30的邻近频率分量，如果有的话。因此，应当指出关于图7中x(n)30的讨论，无论指的是x(n)30还是已过滤的x(n)30，都取决于诸如滤波器133这样的滤波器的存在。相位估计104提供相位分量c(n)和s(n)给单分量相位检测器判定单元158，其中这些相位分量可以表示成c(n)+js(n)，使得s(n)/c(n)近似为tan(φ(n))，其中φ(n)是x(n)30的估计相位(或可选滤波器133的输出，如果存在滤波器133的话)。因此，相位分量c(n)和s(n)提供输入信号x(n)130的相位指示。例如，下述等式可以用来表示x(n)和w(n)，其中x(n)和w(n)分别转换为复信号X(n)和W(n)：

等式13：

X (n) = {Ae}^{j (Ωn + φ (n))}

等式14：

W (n) = e^{j (Ωn)}

因此，应当指出w(n)应该和x(n)的频率Ω匹配。将X(n)乘以W(n)的复共轭，如下等式可以获得x(n)的相位φ(n)：

等式15：Z(n)＝X(n)·W^*(n)＝e^jφ(n)

在上述等式中，Z(n)相应于加法器130和132的输出，分别通过LPF136和138来提供R(n)＝LPF{Z(n)}＝c(n)+js(n)。

在图7所示的实施例中，应当指出自适应数字振荡器102的输出，即目标信号w(n)110，可以表示成下述等式。

等式16：w(n)＝2c₀(n-1)w(n-1)-w(n-2)

即，乘法器114接收延迟112的输出(相应于w(n-1))、延迟116的输出(相应于c₀(n-1))，和2并且提供“2c₀(n-1)w(n-1)”给加法器108，加法器108还接收延迟118的输出(由于延迟118的输入是延迟112的输出，因此相应于w(n-2))，并从乘法器114的输出中减去延迟118的输出，从而产生上述等式16中给定的w(n)。由于w(n)的频率应当与x(n)的频率匹配，因此可如此设置或控制c₀(n)。在一个实施例中，c₀(n)可以是定值。例如，在一个实施例中，c₀(n)＝c₀＝cos(Ω)，相应于目标频率。然而，在所示的实施例中，c₀(n)通过频率/相位偏差校正106根据每个采样进行更新，频率/相位偏差校正106根据c(n)、s(n)和步长μ更新c₀(n)。下文将详细描述频率/相位偏差校正106。

应当指出，对于给定的定值c₀(n)，x(n)和w(n)相应的等式可以表示成如下：

等式17：x(n)＝Re{X(n)}＝Acos(Ωn+φ(n))

等式18：w(n)＝Re{W(n)}＝cos(Ωn)

还应当指出正弦波可以通过将余弦波延迟π/2来获得。因此，假设

相应于近似π/2的相位延迟，可以获得下述正弦波：

等式19：x(n-n₀)≈Asin(Ωn+φ(n))

等式20：w(n-n₀)≈sin(Ωn)

因此，n₀提供给图7中相位估计104的延迟120和134，使得延迟120的输出相应于w(n-n₀)，而延迟134的输出相应于x(n-n₀)。依然参考图7的相位估计104，c(n)137和s(n)139可以表示成如下：

等式20：c(n)＝b c(n-1)+(1-b)[x(n)w(n)+x(n-n₀)w(n-n₀)](0＜b＜1)

等式21：s(n)＝b s(n-1)+(1-b)[x(n-n₀)w(n)-x(n)w(n-n₀)](0＜b＜1)

即，应当指出乘法器124的输出提供“x(n-n₀)w(n-n₀)”给加法器130，加法器130还接收来自乘法器122的“x(n)w(n)”。因此，加法器130提供“x(n)w(n)+x(n-n₀)w(n-n₀)”给LPF 136，在所述实施例中，示出的LPF136是具有参数b(0＜b＜1)的单极点低通滤波器。类似的，乘法器126提供“x(n)w(n-n₀)”给加法器132的负输入端，加法器132还接收来自乘法器128的“x(n-n₀)w(n)”。因此，加法器132提供“x(n-n₀)w(n)-x(n)w(n-n₀)”给LPF 138，在所述实施例中，示出的LPF 138是具有参数b(0＜b＜1)的单极点低通滤波器。应当指出c(n)相应于Z(n)实部的低通滤波型，s(n)相应于Z(n)虚部的低通滤波型，其中Z(n)在上述等式15中提供。

如上所述，应当指出假设w(n)跟踪cos(Ωn)以便和x(n)30的频率匹配。然而，x(n)30(见上述等式17)包括频率偏移，因此Ω＝Ω₀+ΔΩ，其中ΔΩ相应于频率偏移而Ω₀相应于目标信号w(n)的频率。如果存在频率偏移，那么c(n)和s(n)会随着时间改变(即，从采样到采样)。就是说为了避免c(n)和s(n)随着时间变化，c(n)和s(n)会随着时间回转，该回转必须被消除。这能够通过调整自适应数字振荡器102的频率来实现，调整自适应数字振荡器102的频率能够通过在延迟116输入端适当地调整c₀(n)来完成，而不是仅仅为c₀(n)选择固定值(即，常数)。因此，如上所述，图7所示的实施例根据需要更新c₀(n)从而确保c(n)和s(n)不会从采样到采样的变化或回转。

如上所述，R(n)＝LPF(Z(n))＝c(n)+js(n)。应当指出R(n)的先前采样和当前采样之间的相位差提供了频率偏移ΔΩ的指示。即，如果该相位差是正值，则下一个采样的c₀(n)会增加(即，数字振荡器的频率会降低)，如果该相位差是负值，则下一个采样的c₀(n)会减少(即，数字振荡器的频率会提高)。R(n)的先前采样和当前采样之间的相位差(E(N))可以通过将R(n)乘以R(n-1)的复共轭来计算，如下所示。

等式22：E(N)＝R(n)R^*(n-1)

可以看出E(N)的虚部是sin(ΔΩ)的倍数。因此，c₀(n)能够按照下述等式根据相位差估计E(N)来调整：

等式23：c₀(n)＝c₀(n-1)+μImag{E(N)}(0＜μ＜1＝

参考图7，延迟140的输出提供“c(n-1)”给乘法器144，乘法器144还接收“s(n)”并且提供“c(n-1)s(n)”给加法器148。延迟142的输出提供“s(n-1)”给乘法器146，乘法器146还接收“c(n)”并且提供“c(n)s(n-1)”给加法器148的负输入端。因此，加法器148提供“c(n-1)s(n)-c(n)s(n-1)”(相应于E(N)的虚部)给乘法器150。乘法器150将E(N)的虚部乘以μ并提供“μImag{E(N)}”给加法器152。加法器152将“μImag{E(N)}”和延迟154的输出“c₀(n-1)”相加从而提供根据上述等式23调整的c₀(n)值。因此，应当指出c(n)和s(n)可以用来修改控制信号c₀(n)。还应当指出c₀(n)也被认为是根据需要经由单分量相位检测器判定单元158提供给判定逻辑和控制44的音频特性。

在图7所示的实施例中，R(n)的前一个值，即R(n-1)被用于调整c₀(n)。然而，在可选实施例中，只使用R(n)的当前值及其量化参考值Q(R(n))，在图12中用232，234，236或238示出，使得R(n)和Q(R(n))之间的距离最小(例如，通过最小化E’(N)＝R(n)Q(R(n))^*，这相应于用类似于图12的量化器代替延迟单元140和142)。在另一个可选实施例中，不使用反馈。即，使用一次性前馈系统。例如，可以使用频率估计量ρ_Ω(n)来调整c₀(n)，使得

c_{0} (n) = sign (π / 2 - Ω) \sqrt{ρ_{Ω} (n)},

其中该平方根可以通过多项式近似得到。然而，这种方式不如所示实施例一样平滑。因此，可以使用多种不同的方法来设置c₀(n)。在一个实施例中，获得c₀(n)并生成ρ_A’141给单分量相位检测器判定单元158的可选幅值估计器可以可选地包括在图7中。在这个例子中，乘法器145的输出相应于P(n)/[1-c² ₀(n)]，如果在等式2中k＝1则近似于A²。LPF 143接收b和乘法器145的输出，并且生成平滑估计ρ_A’141，平滑估计ρ_A’141可以作为单分量相位检测器判定单元158内的幅度或幅值检测器。

于是单分量相位检测器判定单元158基于接收的c(n)和s(n)值(如果需要，接收c₀(n)和ρ_A’)经由导线42提供音频特性给判定逻辑和控制44。c(n)和s(n)的值可以直接提供给判定逻辑和控制44，或例如，从表示相位音频特性的这些值中获得的音频特性提供给判定逻辑控制44。应当指出参考下文图12将更详细地描述单分量相位检测器判定单元158，图12示出了判定单元158部分的一个实施例。

图8示出了图5多分量音频检测器74的一个实施例。所示实施例接收x(n)30并提供包括在x(n)30中的每一个音频分量的频率和幅度信息(ρ_Ω和ρ_A)给多分量音频检测判定单元172。例如，多分量音频检测器74包括能够提供x(n)上N个分量的相位和幅度信息的N个滤波器。输入信号x(n)30提供给滤波器₁162到滤波器_N164，然后分别提供给AF-FM解调器₁166到解调器_N168。AF-FM解调器₁166到解调器_N168的每一个分别提供值，

到

因此检测器74根据需要能够具有任何数量的滤波器和AF-FM解调器。通常，对于特定音频格式内音频的每一个频率分量需要一个滤波器和AF-FM解调器。例如，在DTMF格式中，每个符号都具有两个频率分量，每个频率分量都使用一个滤波器和一个AF-FM解调器(一个用于高频分量，一个用于低频分量)。每个滤波器提供包括所需频率的信号给其相应的AM-FM解调器。相应的AM-FM解调器根据当前接收x(n)的采样和当前已估计的DTMF代码值μ_f(n)(相应于x(n)已解码的频率值)产生已测量或已估计的值

和(已测量或已估计的值用

和表示)。然后使用这些已估计的值

和以及相应于DTMF音频格式的已存储的表格通过自调谐单元36来确定下一个已估计的DTMF代码值(μ_f(n+1))，结果提供给多分量音频检测器判定单元172并且反馈给下一个接收的x(n)采样使用的filter₁ 28到filter_N 32。

应当指出在上述等式17中，x(n)由一个频率组成；然而，上述关于图2音频指示器32的Teager-Kaiser能量算符可以被扩展以便适用于由一个以上频率组成的x(n)的情况。在这种情况下，

x (n) = Σ_{i = 1}^{N} A_{i} \cos (n Ω_{i} + φ_{i}),

使得

其中

使能量算符随着时间改变，从而对分离N个分量施加额外的困难。

因此，该能量算符(表示为来自音频指示器32的P(n)38)被用来通过首先利用N个独立滤波器滤波信号x(n)来检测多个分量，使得每个分量x_c(n)能够被有效地提取。一旦提取N个分量，那么计算它们的频率和幅度估计(

和

)。

Filter₁ 162过滤x(n)从而提取第一分量x₁(n)。类似的，Filter_N过滤x(n)从而提取第N个分量x_N(n)。因此，使用每个滤波器来提取相应的分量x_c(n)，也称作为音频分量。(因此，在其中每个音频包括N＝5个分量的音频格式的例子中，存在5个滤波器，每个滤波器都用来提取相应的音频分量)。一旦该分量被抽取，则确定

至

例如，在一个实施例中，梳状滤波器被用于filter₁到filter_N的每一个，使得给定的滤波路径消除来自其他路径的所有不希望的分量。

在这种方式中，每个AM-FM解调器计算其相应的

值，不包括相应于当前存在的值μ_f(n)的音频的其他频率分量。因此，每个滤波器filter_c(c＝1，…，N)的梳状滤波器都具有如等式24所示的一般形式。

等式24：

H_{c}^{(m)} (Z) = Γ_{c}^{(m)} Π_{i &NotEqual; c, i = 1}^{N} \frac{1 - b_{i, j} z^{- 1} + z^{- 2}}{1 - r b_{i, j} z^{- 1} + r^{2} z^{- 2}}, c = 1, . . ., N

在上述等式中，0＜r＜1，每个乘积项对于i＝1至N，且i≠c存在。根据上述等式，如果音频格式具有L个频率分量，则每个滤波器的传输函数H包括L-1个项的乘积。应当指出在当前实施例中，梳状滤波器的系数是自适应的并且因此根据μ_f(n)的当前值改变。

在一个实施例中，选取Γ_c ^(m)使得

| H_{c}^{(m)} (e^{jΩc, j}) | = 1,

即消除多余的分量i≠c不会在目标分量c上引入增益偏移。可以表示成：

Γ_{c}^{(m)} = \sqrt{\underset{i &NotEqual; c}{Π} \frac{{(\frac{1 - r^{2}}{2})}^{2} - r [r \cos (Ω_{c, j}) - \cos (Ω_{c, j})] [r \cos (Ω_{c, j}) - \cos (Ω_{c, j})]}{{[\cos (Ω_{c, j}) - \cos (Ω_{i, j})]}^{2}}}

对于两个分量的情况(N＝2)，应当指出

Γ_{1}^{(m)} = Γ_{2}^{(m)},

Γ_c ^(m)的值和系数b_c，j，c＝1，…，N，可以预先计算并存储在查找表中。如果未使用幅值估计，则忽略增益Γ_c ^(m)。

为了成功地检测给定的多分量音频，自调谐机制被用于搜索使频率检测器输出的可变性最小化的频率的最佳设置。这是由于单频信号音在通过Teager-Kaiser能量算符处理之后生成定值。自调谐单元170的操作使用μ_f(n)的当前值来调整滤波器₁到滤波器_N的系数使得如果生成相同的μ_f(n)值则处理x(n)30的下一个采样。如果x(n)30的实际段标识值相应于μ_f(n)，这会引起信号分量的校正估计，从而导致自调谐单元170的频率锁定。另一个方面，如果x(n)30的实际段标识值不对应于μ_f(n)，那么自调谐单元170会继续调整滤波器₁到滤波器_N的系数直到获得频率锁定。在一个实施例中，已解码的频率值μ_f(n)根据图11来估计，其中最接近的参考频率估计确定用于处理x(n)30的下一个采样的滤波器₁到滤波器_N的系数，使得相应的参考频率值通过滤波器₁到滤波器_N被陷波。

图9到图12示出了包括在单分量频率检测器判定单元90(或在单分量相位检测器判定单元158中，或在多分量音频检测器判定单元172中，或在90，158和172的任何两个或两个以上的单元中，根据需要)中的各个部分。例如，图9的实施例(例如，可以包括在单元90或158或两者中)提供了表示已解码的开关调制信息的音频特性μ_on-off(n)。图10的实施例(例如，也可以用于单元90或158，或两者中)提供了表示已解码的AM调制频率的音频特性μ_AM(n)。图11的实施例(例如，可以使用在单元90，158或172，或这些单元的任何两个或两个以上的单元中)提供了表示x(n)30上的音频的已解码频率的音频特性μ_f(n)。因此，根据联合音频检测器组40支持的音频格式，可以提供其他的，较少的，或不同类型的音频特性给判定逻辑和控制单元44。应当指出图11的实施例适用于x(n)30上的单信号音分量和多信号音分量。在多分量的情况下，图11可以提供每个音频分量的音频特性μ_f(n)，音频特性μ_f(n)表示x(n)的音频分量的已解码频率。同样的，图12示出了包括在图7单分量相位检测器判定单元158中的一个实施例并且提供了表示已解码的相位的音频特性μ_p(n)。此外，应当指出，如下文所述，图9-12的输出是整数输出，这些整数输出易于操作并且允许判定逻辑和控制单元44使用共同的逻辑来确定有效的音频事件是否发生。

图9示出了单分量频率检测器判定单元90部分的一个实施例。图9用于提供已解码的开关幅值指示器μ_on-off(n)作为音频特性。如果输入信号x(n)30根据开关调制(例如使用在CNG和CT中)进行调制，于是单分量频率检测器判定单元90可以包括图9的项目。如图9所示，P(n)38提供给加法器174的正输入端，阈值P_low提供给加法器174的负输入端。加法器174的输出(“P(n)-P_low”)提供给阶跃函数176，如果P(n)＞P_low则阶跃函数176输出μ_on-off(n)为1，或如果P(n)≤P_low则阶跃函数176输出μ_on-off(n)为0。然后提供这种音频特性给判定逻辑和控制单元44。

图10示出了使用在除了或代替图9的单分量频率检测器判定单元90部分的一个实施例。图10用来提供AM调制频率的音频特性μ_AM(n)。P(n)38或ρ_A92(或ρ’_A 141，如果作为单分量相位检测器判定单元158的一部分来实现)提供给DC偏移估计和补偿单元178，DC偏移估计和补偿单元178识别并消除其输入信号中的DC偏移。在一个实施例中，使用AM调制频率的一个周期来定义DC偏移为给定输入信号的最大值和最小值之间的平均值(一个周期内)。然后从输入信号中减去已估计的DC偏移从而生成178的输出。DC偏移估计和补偿单元的输出提供给保持过零数的过零计数器180。该输出提供给加法器182，加法器182还接收负的NZ_max。加法器182的输出提供给阶跃函数184，如果过零计数器180确定的过零数大于NZ_max，则阶跃函数184输出1，如果不是这样则输出0。因此，根据图10的元件，0或1的输出提供了AM调制频率的指示，AM调制频率作为μ_AM(n)提供给判定逻辑和控制单元44。在一个实施例中，预定采样数内的非零过零数小于NZ_max(即，μ_AM(n)＝0)表示AM调制频率的可能匹配。例如，图10可用于检测ANSam和ANSam_PR音频事件。

图11示出了单分量频率检测器判定单元90和多分量音频检测器判定单元172部分的一个实施例。在一个实施例中，这部分总是根据音频指示被激活，并且基于其输出确定图9、10或12是否需要被激活。因此，在所示的实施例中，一旦检测到x(n)30上存在音频，就根据需要独立地激活或禁止图9-12的每一个。信号ρ_Ω(n)(可以是单值，例如来自图6中LPF 86的ρ_Ω或矢量值，例如图8的解调器166-168的输出)提供给加法器，例如加法器186。图11加法器的数量取决于要被检测的不同音频(具有单频或多频分量)的数量。ρ_Ω(n)的每个值(也称为频率估计值)和相应的参考值

到

的负值(也指的是参考频率估计值)相加。该结果提供给相应的L-norm 192到196的L-norm。在一个实施例中，L₁范数用于生成192到196的输出，192到196的输出表示ρ_Ω(n)和每个参考值之间的距离。所估计的距离值提供给arg min 198，arg min 198提供来自L-norm192到196中的每一个的最小分支的下标(1到N的一个)作为μ_f(n)。因此，当利用其他音频特性一样，应当指出μ_f(n)也是和μ_AM(n)以及μ_on-off(n)一样的整数(1到N)输出。在一个实施例中，一旦确定了μ_f(n)，x(n)30的每个输入采样的μ_f(n)也被确定，判定单元(例如图9、10和12)的其他部分基于μ_f(n)的值根据需要被激活。例如，相位检测器根据μ_f(n)出现的某些值被激活。在可选实施例中，图11所示的频率解码器可以在单分量相位检测器判定单元158中实现。在这种情况下，c₀(n)可以直接用于解码该频率(即，ρ_Ω(n)用c₀(n)代替，用

代替，m＝1，…N)。

图12示出了单分量相位检测器判定单元158部分的一个实施例，单分量相位检测器判定单元158基于c(n)和s(n)(分别来自图7的LPF 136和138)提供解码的相位音频特性μ_p(n)226。如图12的图表所示，其中c(n)相应于x轴228，s(n)相应于y轴230，对于x(n)的每一个采样，根据c(n)和s(n)的值落在虚线240和242确定的哪一象限中，相位被量化成0、1、2和3中的一个(在图12中，分别相应于点232、234、236和238)。例如，如果使用轴228和230图示(c(n)，s(n))时，c(n)和s(n)的值落在图表左半部中由虚线242和240之间的区域226中，输出μ_p(n)被设置为2。

参考图12，c(n)提供给绝对值200，绝对值200提供c(n)的幅值给加法器202。信号c(n)也提供给阶跃函数206，阶跃函数206提供其输出给加法器202。信号s(n)提供给绝对值204，绝对值204提供s(n)的幅值给加法器202的负输出端，其中加法器202提供“|c(n)|-|s(n)|”给阶跃函数208。信号s(n)也提供给阶跃函数210。阶跃函数206、208和210的每一个输出1给正输入端，否则输出0。因此，加法器212的输出可以是0、1或2。加法器212的输出通过乘法器214乘以-2，乘法器214将结果(0、-2或-4)提供给加法器216。加法器216将乘法器214的结果加1(以获得1、-1、或-3)并且提供结果给乘法器218。阶跃函数210的输出提供给乘法器222，乘法器222将输出乘以2并将结果提供给加法器220。因此，乘法器222的结果可以是0或2，该结果提供给加法器220。加法器220加1以获得1或3，然后将该结果提供给加法器224。乘法器218接收加法器216的输出和阶跃函数208的输出并提供该结果(0、1、-1或-3)给加法器224，加法器224提供的μ_p(n)的结果为0到3中的一个。应当指出当需要已解码的相位信息时，图12可以用于检测诸如ANS_PR、ANSam_PR和USB1的音频格式。还应当指出在可选实施例中，可以使用任何数量的判定边界来量化μ_p(n)。即，μ_p(n)可以被量化成多于或少于图12所示的四个点。因此，图12的逻辑可以根据μ_p(n)所需的量化通过各种方式来设计。

任何的音频特性还可以从判定逻辑和控制单元44提供回至联合检测器组40内的任意一个检测器。例如，为了重置它们，它们可以被反向提供，例如，在它们超出可允许的容限的情况。同样，在一个实施例中，图7的控制信号c₀(n)也可以作为x(n)30的频率估计，也可以和ρ_Ω(n)一起使用来确认给定音频的检测。例如，c₀(n)的符号表示给定音频的频率是否小于或大于采样率的25％。特别的，对于8kHz的采样率，频率为1900Hz和2100Hz的两个单分量音频具有相同的ρ_Ω(n)值，然而，c₀(n)对于1900Hz(小于2000Hz)为正，对于2100Hz(大于2000Hz)为负。还应当指出图9-12仅示出了可能的音频特性的某些例子，而可选实施例可以使用除了或代替图9-12的其他方式来提供其他或不同类型的音频特性。例如，提供其他类型的频率信息，相位信息，定时信息，或幅度信息，他们可以通过各种不同方式来生成。

一旦音频特性被确定，并且作为整数值提供给判定逻辑和控制单元44，判定逻辑和控制单元44可以采用共用逻辑方案来确定是否检测到有效的音频事件。图17示出了根据本方明一个实施例的一种检测音频事件的方法，示出了其中采用联合音频检测器组的图14的块262的一个实施例。

图17的流程开始于块296，此处通过独立的检测器(例如，图5的检测器70、72和74)处理信号x(n)。(应当指出在不同的实施例中可以使用任意数量和类型的检测器。)然后流程进入到块298，在块298中确定每个检测器d的已解码音频特性μ_d(n)。例如，在图9-12的实施例中，μ_d(n)包括μ_f(n)、μ_AM(n)、μ_on-off(n)和μ_p(n)。应当指出，如上所述，并不是每一个检测器都提供x(n)每个采样的音频特性。例如，检测器仅根据需要被激活，例如在上述的一个实施例中，其中在需要时估计某些音频特性(例如，μ_AM(n)、μ_on-off(n)和μ_p(n))。流程进入到块299，在块299中检测并校正可能的特性误差，如果可能的化，如关于图18所说明的。流程继续到300，其中共用音频检测判定逻辑被应用于每个检测器d。即，通过使用整数音频特性，共用判定逻辑可以用于不同的检测器。可选实施例可以提供不同格式的音频特性并且可以包括不同的检测判定逻辑。于是流程进入到判定方块302，在判定方块302中基于该音频特性确定是否检测到新的音频。如果没有，流程进入到图14的块264。

在判定方块302，如果检测到新的音频，流程进入到块304，在块304中已检测到的音频被加入到先前检测到的音频的列表中。然后流程进入到块306，在块306中检查该列表从而搜索定义音频事件的预定音频序列。例如，判定逻辑和控制单元44包括定义能够被检测的不同音频事件的音频事件表格，并且基于音频事件的列表和表格上的当前音频序列能够检测到有效的音频事件。因此，流程进入到判定方块308，在判定方块308中确定是否检测到已知的序列。如果是这样，流程进入到块310，在块310中设置音频事件检测标记f_d。否则，流程进入到图14的块264。于是判定逻辑和控制单元能够确定已检测到的音频事件45来表示已经检测到有效的音频并且将关于已检测到的音频事件的所需信息提供给控制总线22。应当指出在检测已知序列的过程中，可以设置音频检测标记来表示已经检测到无效的音频事件，在这种情况下，不报告音频事件。例如，一个TTY音频事件最多具有7个音频，通过具体的音频开始和停止；如果提供更多或更少的音频给图2的音频事件检测器14，它们不会导致TTY音频事件检测。

图18表示图17块299中的误差校正处理的一个实施例。一旦已解码的音频特性μ_d(n)被估计，流程进入到块305，在块305中比较μ_d(n)的值和当前音频事件所期望的解码测量值。例如，对于TTY音频事件，音频段必须具有μ_f(n)两个具体值中的一个；因此，如果μ_f(n)被估计为不同的值，它应当表示误差。于是判定方块307检验是否检测到误差，如果没有检测到误差，处理进入到图17的块300。否则，判定方块307进入到块309，在提供已解码的音频特性μ_d(n)给图17的块300之前，在块309中通过使用误差校正算法调整受到影响的音频特性μ_d(n)来校正检测到的误差。在一个实施例中，这种误差校正可以用来克服可能的冲突要求，例如，在频率公差方面。在上述TTY音频事件例子中，误差校正算法可以定义成如下：如果具体的已解码频率μ_f(n)被估计并且其值不同于任何所期望的TTY已解码的频率，则μ_f(n)根据最接近于μ_f(n)的估计值的TTY频率被替换成所期望的TTY已解码的频率。误差校正算法还可以用于校验音频特性的预定公差，以便如果给定的特性超出规范，则相应的已解码测量值μ_d(n)无效，例如，如果频率公差超出规范，则μ_f(n)被替换成0(即，复位)，这表示一个无效的频率分量。

图19示出了相应于图17流程的方块300的一个实施例的流程，其中使用了共用音频检测判定逻辑。图19的流程确定给定整数值的转变是否发生以及该值是否维持预定时间(大于N_d)。流程从块312开始，在块312中估计μ_d(n)(μ_d(n)表示μ_f(n)、μ_AM(n)、μ_on-off(n)和μ_p(n)中的一个)。然后流程进入到判定方块314，在判定方块314中确定μ_d(n)是否不等于相应于μ_d(n)的先前值的μ_est。如果μ_d(n)不等于μ_est，则流程进入到块316，在块316中n₀(先前已经初始化为0)增加一。然后流程进入到判定方块318，在判定方块318中确定n₀是否大于N₀。如果不是，流程进入到图17的判定方块302。如果是这样，流程进入到块320，其中n₁被设置成n₀，n₀被设置成0，μ_est被设置成μ_d(n)，F_d被设置成0。然后流程进入到图17的判定方块302。

如果在判定方块314，μ_d(n)等于μ_est，则流程进入到块322，在块322中n₁增加一。然后流程进入到判定方块324，在判定方块324中确定n₁是否大于N₁。如果不是，流程进入到判定方块330。如果是这样，流程进入到判定方块336，在判定方块336中确定F_d是否等于0。如果是这样，流程进入到块328，其中F_d被设置成1，μ_d(Δμ_d)中的变化被设置成(μ_est-μ_old)MODμ_max，μ_old被设置成μ_est(在一个实施例中，Δμ_d＝Δμ_p被用于检测具有DPSK调制段的音频事件)。然后流程进入到判定方块330，在判定方块330中确定n₁是否大于N_d。如果不是，流程进入到图17的块302。如果是这样，流程进入到块332，在块332中报告一个新的音频检测。然后流程进入到块334，在块334中n₀、n₁、和F_d都被复位成0。于是流程进入到图17的块302。在上述说明中，n₀和n₁是分别用于表示已解码音频特性(μ_d(n)不等于μ_est)上的变化或边界以及定值(μ_d(n)等于μ_est)的可能平台。在所示实施例中，N₀是定义转换到新的音频段所需采样的最小数，N₁是表示可能音频段所需采样的最小数，N_d＞N₁是确认新的音频检测所需采样的最小数。同样的，在所示的实施例中，F_d是当Δμ_d和Δμ_old被估计时用于控制时间的检测标记。在当前实施例中，应当指出N₀、N₁、N_d和μ_MAX取决于μ_d(n)，以便不同的音频根据某些预定规范具有它们相应的值(N₀、N₁、N_d和μ_MAX)。

音频事件检测器14可以在硬件、软件、固件或其任意组合中执行。例如，图1-19中的方块图和流程图可以在软件、硬件、固件或其任意组合中执行。

在前述说明书中，已经参考具体实施例描述了本发明。然而，本领域的普通技术人员应当理解不脱离本发明的精神范围内，根据下述权利要求阐明的内容可以进行各种修改和变化。例如，这里教导的任何方法都可以体现为一个或多个计算机硬盘、软盘、3.5”磁盘、计算机存储磁带、磁鼓、静态随机存取存储器(SRAM)单元，动态随机存取存储器(DRAM)单元，电可擦除(EEPROM、EPROM、闪存)单元、非易失性单元、铁电体存储器、压缩盘(CD)、激光盘、光盘以及任何类似计算机可读介质上的软件。同样的，方块图可以具有和所示实施例不同的块以及更多或更少的块或不同的配置。同样的，流程图也可以被不同地配置，包括更多或更少的步骤，或具有能够被分割成多个步骤的步骤或具有能够彼此同时执行的步骤。因此，说明书和附图是用于说明性的而不是用于限制的，所有这样的修改都认为是包括在本发明的精神范围内。

上述已经描述了关于具体实施例的益处，其他优点和解决问题的方法。然而，引起任何益处，优点或解决问题的方法出现或变得更明确的益处，优点，解决问题的方法以及任何要素都不能认为是任何或全部权利要求关键的，必要的，或本质特征或要素。如这里所使用的术语“包括”，“包含”或其任何其他变化都规定为非排它的包括，例如包括要素列表的处理，方法，产品或装置不仅仅包括那些要素，还包括未明确列出的其他要素或这些处理，方法，产品或装置固有的要素。

Claims

1.一种用于执行音频事件检测的方法，包括：

接收采样输入信号；

基于所述采样输入信号确定是否已经指示出至少一个音频；

选择性地确定是否已经检测到至少一个音频，其中选择性地确定包括：

当所述至少一个音频已经被指示出时，确定是否已经检测到至少一个音频；和

当所述至少一个音频未被指示出时，忽略确定是否已经检测到至少一个音频；和

当至少一个音频已经被检测到时，确定所述至少一个音频是否相应于音频事件。

2.权利要求1的所述方法，其中所述采样输入信号具有多频信号音格式。

3.权利要求1的所述方法，其中所述确定是否已经检测到至少一个音频包括使用所述采样输入信号来生成第一音频特性值，第一音频特性值提供频率信息，相位信息，定时信息和幅值信息中的至少一个，并且其中所述确定所述至少一个音频是否相应于音频事件包括使用所述第一音频特性来确定所述至少一个音频是否是音频事件。

4.权利要求1的所述方法，其中所述基于所述采样输入信号确定是否已经指示出至少一个音频包括：

确定所述采样输入信号的能量估计；

确定所述能量估计的至少一个段在预定持续时间上是否具有小于预定方差数的方差；

当所述至少一个段在所述预定持续时间上具有小于所述预定方差数的所述方差时，提供所述采样输入信号来确定是否已经检测到至少一个音频。

5.一种用于分离采样输入信号的幅值、相位或频率中的至少一个的方法，包括：

接收所述采样输入信号；

基于控制信号生成目标信号；

确定所述目标信号和所述采样输入信号之间的相位差；

使用所述相位差来生成第一信号和第二信号；和

使用所述第一信号和所述第二信号来调整所述控制信号。

6.权利要求5的所述方法，进一步包括使用所述第一信号和所述第二信号来确定所述采样输入信号的相位。

7.权利要求5的所述方法，进一步包括：

确定所述采样输入信号的能量估计；和

使用所述第一信号、所述第二信号、所述控制信号和所述能量估计来分离所述采样输入信号的所述幅值，所述相位或所述频率中的至少一个。

8.一种音频事件检测器，包括：

耦接用来接收采样输入信号的音频指示器，所述音频指示器基于所述采样输入信号确定是否已经指示出至少一个音频；和

耦接到所述音频指示器的至少一个音频检测器，所述至少一个音频检测器耦接用来接收所述采样输入信号并确定当所述至少一个音频已经被指示出时是否已经检测到至少一个音频，其中当所述至少一个音频未被指示出时所述至少一个音频检测器被忽略；和

耦接到所述音频指示器和所述至少一个音频检测器的控制逻辑，当检测到至少一个音频时，所述控制逻辑确定所述至少一个音频是否相应于音频事件。

9.一种经由计算机可读介质存储的音频事件检测器，其中所述计算机可读介质包括：

用于接收采样输入信号的第一指令集；

基于所述采样输入信号确定是否已经指示出至少一个音频的第二指令集；

用于选择性地确定是否已经检测到至少一个音频的第三指令集，其中选择性地确定包括：

用于当至少一个音频已经被检测到时，确定所述至少一个音频是否相应于音频事件的第四指令集。

10.一种经由计算机可读介质存储的音频事件检测器，其中所述计算机可读介质包括：

用于接收采样输入信号的第一指令集；

基于控制信号生成目标信号的第二指令集；

确定所述目标信号和所述采样输入信号之间相位差的第三指令集；

使用所述相位差来生成第一信号和第二信号的第四指令集；和

使用所述第一信号和所述第二信号来调整所述控制信号的第五指令集。