CN107358964A

CN107358964A - 用于检测在变化的环境中的警戒信号的方法

Info

Publication number: CN107358964A
Application number: CN201710223382.8A
Authority: CN
Inventors: A.伊耶; J.L.哈钦斯; R.A.克赖菲尔特
Original assignee: Crown Audio Inc
Current assignee: Crown Audio Inc
Priority date: 2016-04-07
Filing date: 2017-04-07
Publication date: 2017-11-17
Anticipated expiration: 2037-04-07
Also published as: US9749733B1; US20180014112A1; CN107358964B; EP3229487B1; CN116844559A; EP3229487A1; US10555069B2

Abstract

在音频系统中，音频信号被预先处理以向快速检测器和慢速检测器提供输入信号，所述输入信号包括警戒信号和环境声。所述慢检测器确定被输出到警戒信号检测器的所述输入信号的环境声电平。所述警戒信号检测器使用所述环境声电平来使用自适应阈值函数计算自适应阈值电平。所述快速检测器确定被输出到所述警戒信号检测器的所述输入信号的包络电平。所述警戒信号检测器比较所述包络电平与所述自适应阈值电平以确定警戒信号是否存在于所述输入信号中。所述自适应阈值电平根据所述输入信号的所述环境声电平而改变，且所述音频系统的所述警戒信号检测自动适应于具有不同的环境声电平的变化的声环境。

Description

用于检测在变化的环境中的警戒信号的方法

背景技术

本公开的实施方案的领域

本公开的实施方案总体涉及音频信号处理，且更具体地涉及用于检测在变化的环境中的警戒信号的方法。

相关技术的描述

头戴式耳机、耳机、耳塞和其它个人收听设备通常由希望听到从特定类型的音频源产生的声音例如音乐、言语或电影配乐的个人使用，而不干扰在附近的周围区域中的其他人。这些类型的声音在本文通常被称为“娱乐”信号，且每个这样的娱乐信号在本文被特征化为在持久的时间段期间存在的音频信号。

一般，个人收听设备包括用于插入音频重放设备的音频输出端内的音频插头。音频插头连接到将音频信号从音频重放设备传送到个人收听设备的电缆。为了提供高质量音频，这样的个人收听设备通常包括覆盖整个耳朵或完全密封耳道的扬声器部件。个人收听设备设计成提供良好的声密封，从而减少音频信号泄漏并提高收听者体验的质量，特别是关于低频响应。

上面的个人收听设备设计的一个缺点是，因为设备形成与耳朵的良好声密封，用户听环境声音的能力实质上减小了，这可对用户呈现相当大的安全问题。例如，用户可能不能够听见来自环境的某些重要的声音，例如即将来临的车辆的声音、人说话或警报。从环境发出的这些类型的重要声音在本文被称为“优先级”或“警戒”信号，且每个这样的信号一般被特征化为间歇的音频信号，其充当对由娱乐信号产生的更持久的声音或收听环境的其它方面的中断。

解决上面的问题的一种方法涉及试图使用集成在收听设备内的一个或多个麦克风来检测在收听环境中存在的警戒信号。当检测到警戒信号时，收听设备可例如自动减小娱乐信号的声音电平，并向用户重放警戒信号以使用户知道警戒信号。然而，用于检测警戒信号的传统解决方案在计算上是复杂的，且需要相当多的处理资源以得到可接受的性能。此外，这样的解决方案不考虑变化的声环境，且因此不提供在不同的声环境中的令人满意的性能。

如前述内容说明的，用于检测在收听环境内的警戒信号的、可在个人收听设备中实现的更有效的技术将是有用的。

发明内容

各种实施方案阐述了音频处理系统，其包括配置成确定包括环境声的音频输入信号的环境声电平并将环境声电平传输到警戒信号检测器的慢速检测器。音频处理系统还包括配置成确定音频输入信号的包络电平并将包络电平传输到警戒信号检测器的快速检测器。音频处理系统还包括配置成基于环境声电平来确定自适应阈值电平并通过比较包络电平与自适应阈值电平来确定警戒信号是否存在于音频输入信号中的警戒信号检测器。

其它实施方案包括(但不限于)包含用于执行所公开的技术的一个或多个方面的指令的计算机可读介质以及用于执行所公开的技术的一个或多个方面的方法。

所公开的方法的至少一个优点是，它允许音频处理系统以检测在变化的声环境中的警戒信号的简单和低成本的方式实现。

附图说明

因此可通过参考某些特定的实施方案来有上面阐述的一个或多个实施方案的所列举的特征可详细地被理解的方式、上面简要概述的一个或多个实施方案的更具体的描述，其中一些实施方案在附图中示出。然而应注意，附图只示出典型实施方案且因此不应以任何方式被考虑为它的范围的限制，因为各种实施方案的范围也包含其它实施方案。

图1示出配置成实现各种实施方案的一个或多个方面的音频处理系统；

图2示出根据各种实施方案的由图1的警戒信号检测器实现的示例性自适应阈值函数；以及

图3是根据各种实施方案的用于检测在音频信号内的警戒信号的方法步骤的流程图。

具体实施方式

在下面的描述中，阐述了很多特定的细节以提供对某些特定实施方案的更彻底的理解。然而对本领域中的技术人员将明显，其它实施方案可在没有这些特定的细节中的一个或多个的情况下或有额外的特定细节的情况下被实施。

系统概述

图1示出配置成实现各种实施方案的一个或多个方面的音频处理系统100。如所示，音频处理系统100包括(但不限于)部件例如麦克风110、声环境处理器(SEP)120、带通滤波器(BPF)130、快速均方根(RMS)检测器150、慢速RMS检测器160、警戒信号检测器170和检测接收设备190。可以软件和/或硬件制造并实现在图1中示出的音频处理系统100的每个部件。例如，每个部件可使用硬连线数字和/或模拟电路以硬件实现和/或使用存储器单元和处理器单元以软件实现。通常，处理器单元可以是能够处理数据和/或执行软件应用的任何在技术上可行的硬件单元。例如，处理器可包括中央处理单元(CPU)、图形处理单元(GPU)、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑设备、分立门或晶体管逻辑、分立硬件部件或不同处理单元的任何组合，例如配置成结合GPU来操作的CPU。存储器单元配置成存储软件应用和数据。来自在存储器单元内的软件结构的指令由处理器执行以实现本文所述的创造性操作和功能。

通常，麦克风110捕获来自环境的声音并将所捕获的音频声音发送到声环境处理器120。音频信号捕获包括警戒信号和环境声的周围环境声。声环境处理器120对音频信号执行降噪并将经处理的信号传输到带通滤波器130，其产生传输到快速RMS检测器150和慢速RMS检测器160的带通滤波信号(输入信号140)。由快速和慢速RMS检测器150和160接收的输入信号140包含警戒信号和环境声。慢速RMS检测器160配置成确定被输出到警戒信号检测器170的输入信号140的环境声电平。警戒信号检测器170使用环境声电平来使用自适应阈值函数计算自适应阈值电平。快速RMS检测器150配置成确定被输出到警戒信号检测器170的输入信号140的包络电平。警戒信号检测器170比较包络电平与自适应阈值电平以确定警戒信号是否当前存在于输入信号140中。警戒信号检测器170将检测信号发送到检测接收设备190，检测信号指示警戒信号是否由警戒信号检测器170接收到。检测接收设备190接收检测信号并基于检测信号的状态来执行一个或多个操作。

如上所述，声环境处理器120和带通滤波器130预先处理所捕获的音频信号以产生由快速和慢速RMS检测器150和160接收的输入信号140。在其它实施方案中，不同的预处理步骤或没有预处理步骤在所捕获的音频信号上被执行以产生输入信号140。不考虑预处理步骤，音频输入信号140(由快速和慢速RMS检测器150和160接收)包括周围环境声，其包括警戒信号和环境声。如上所述，警戒信号检测器170基于输入信号140的环境声电平(如由慢速RMS检测器160检测的)来确定自适应阈值电平，并接着通过比较输入信号140的包络电平(如由快速RMS检测器150检测的)与自适应阈值电平来确定警戒信号是否存在。因为自适应阈值电平根据输入信号140的环境声电平而改变，警戒信号的检测也根据环境声电平而改变。因此，音频处理系统100的警戒信号检测功能自动适应于具有不同的环境声电平的变化的声环境而没有最终用户输入或干预。通过根据环境声电平来改变自适应阈值电平，警戒信号的检测更准确并导致在不同的声环境当中的更少的错误检测。快速和慢速RMS检测器150和160还提供低复杂度解决方案，同时也提供好的性能结果。

如图1所示，声环境处理器120从捕获从环境发出的声音的一个或多个麦克风110接收输入音频信号。在一些实施方案中，声环境处理器120电子地而不是经由一个或多个麦克风110接收从环境发出的声音。声环境处理器120对输入音频信号执行降噪。声环境处理器120通过移除一个或多个噪声信号-包括(但不限于)麦克风(mic)嘶嘶声、稳态噪声、极低频声音(例如交通喧嚣)和其它低电平稳态声音-来清洁并增强输入音频信号，同时维持任何潜在的警戒信号完整无缺。通常，低电平声音是具有低于响度的阈值的信号电平的声音。在一些实施方案中，门可用于在传输经处理的信号作为对带通滤波器130的输出之前从输入信号移除这样的低电平信号。

通常，稳态声音是信号的频谱保持相对恒定/随着时间的过去而缓慢变化的声音，与具有随着时间的过去而快速改变的频谱的短暂声音例如警戒信号相反。在一个例子中且并非限制，空转的汽车的声音可被考虑为稳态声音，而加速的汽车或具有旋转的引擎的汽车的声音将不被考虑为稳态声音。在另一例子中且并非限制，歌剧唱歌的声音可被考虑为稳态声音，而说话的声音将不被考虑为稳态声音。在又一例子中且并非限制，非常低的交响乐的声音可被考虑为稳态声音，而相对更快的敲击乐的声音将不被考虑为稳态声音。潜在的警戒信号包括不是低电平稳态声音的声音，例如人说话或汽车喇叭。

声环境处理器120将噪声减小的信号输出到带通滤波器130。带通滤波器130应用于噪声减小的信号以产生带通滤波信号。带通滤波器130只使在预定频率范围内的频率通过以进一步提取信号内容并聚焦于包含警戒信号的特定的感兴趣频率范围。在一些实施方案中，带通滤波器130使在500-1800Hz的频率范围之间的频率通过。在其它实施方案中，带通滤波器130使在不同的频率范围之间的频率通过。在一些实施方案中，带通滤波器130在时域中操作，因此节省将信号转换成频域的成本。

带通滤波器130将一些带通滤波信号(音频输入信号140)输出到快速RMS检测器150和慢速RMS检测器160。通常，由快速和慢速RMS检测器150和160检测的音频输入信号140包含周围环境声，其包括警戒信号和环境声。快速和慢速RMS检测器150和160可包括用于检测这两种不同类型的声音的时域检测器(其在规定的时间段期间测量输入信号140的声能)。快速和慢速RMS检测器150和160可通过在不同长度的时间段期间检测在输入信号140中的音频能量的平均RMS电平来这么做。在其它实施方案中，快速和慢速RMS检测器150和160可使用可选的信号电平测量技术而不是检测信号的RMS电平。在一个例子中且并非限制，快速和慢速RMS检测器150和160使用更复杂的音质信号电平测量技术。在另外的实施方案中，可使用不同类型的检测器，例如峰值检测器、包络检测器、能量检测器或频域检测器。

慢速RMS检测器160可配置成检测并输出在相对较长的时间段期间(与快速RMS检测器150比较)在输入信号140中的平均能级。在相对较长的该时间段期间在输入信号140中的平均能级在本文可被称为环境声电平。环境声包括随着时间的过去保持相对恒定(与警戒信号比较)的具有相对较低的信号振幅的稳态声音，例如交通噪声、行人噪声和其它背景噪声。环境声电平用于通过应用自适应阈值函数来计算自适应阈值，如下面关于图2所讨论的。

快速RMS检测器150可配置成检测并输出在相对较短的时间段期间(与慢速RMS检测器160比较)在输入信号140中的平均能量。在相对较短的该时间段期间在输入信号140中的平均能量在本文可被称为输入信号140的包络电平。快速RMS检测器150用于帮助确定输入信号140当前是否包括警戒信号。警戒信号包括随着时间的过去而快速改变(与环境声比较)的具有相对较高的信号振幅的稳态声音，例如人叫喊或汽车喇叭声。因此，警戒信号可由在短时间段期间的高声能尖峰特征化。基于输入信号140的包络电平(如由快速RMS检测器150输出的)和自适应阈值来检测警戒信号。例如，如果从快速RMS检测器150输出的包络电平超过自适应阈值，则可确定警戒信号当前存在于输入信号140中。

在一些实施方案中，快速RMS检测器150和慢速RMS检测器160的输出各自由下面的方程表示：

v[n]＝a*u[n]+(1-a)*v[n-1] (1)

在方程(1)中：

v[n]＝RMS检测器的当前输出值；

a＝检测器的时间系数；

u[n]＝输入信号140；以及

v[n-1]＝RMS检测器的前一输出值。

每个RMS检测器150和160的输出值可以在预定采样频率下被采样。因此，v[n]可等于对于当前采样点的检测器的当前输出值，而v[n-1]可等于对于前一采样点的RMS检测器的前一输出值。如所示，RMS检测器的当前输出值v[n]基于RMS检测器的前一输出值v[n-1]、检测器的时间系数“a”和所接收的输入信号u[n]。因此，每个RMS检测器150和160可包含用于存储以前的输出值的存储器部件(未示出)和用于使用前一输出值、时间系数“a”和所接收的输入信号来计算当前输出值的处理器部件(未示出)。在一些实施方案中，所接收的输入信号u[n]等于从带通滤波器130接收的带通滤波信号。在其它实施方案中，所接收的输入信号u[n]等于带通滤波信号，其然后由RMS检测器(如下面讨论的)整流并转换成对数域。

在一些实施方案中，v[n]等于在由检测器的时间系数“a”定义的时间段期间的所接收的输入信号u[n]的平均能级。在这些实施方案中，快速RMS检测器150和慢速RMS检测器160由时间系数“a”的不同值区分开。快速RMS检测器150的输出v[n]可等于第一时间段期间的所接收的输入信号u[n]的平均能级，且慢速RMS检测器160的输出v[n]可等于第二时间段期间的所接收的输入信号u[n]的平均能级，第一时间段比第二时间段更短。例如，快速RMS检测器150的第一时间段可近似等于22ms，而慢速RMS检测器160的第二时间段可近似等于128ms。在这个例子中，在每个采样点处，快速RMS检测器150可在最后22ms期间输出所接收的输入信号u[n]的平均能级，而慢速RMS检测器160可在最后128ms期间输出所接收的输入信号u[n]的平均能级。在其它实施方案中，使用第一和第二时间段的其它值。

在可选的实施方案中，快速和慢速RMS检测器150和160每个包括对数域RMS检测器。在这些实施方案中，所接收的输入信号u[n](包括带通滤波信号)由RMS检测器整流并转换成对数(dB单位)域。在这些实施方案中，快速RMS检测器150和慢速RMS检测器160的输出各自由下面的方程表示：

v[n]＝a*log(abs(u[n]))+(1-a)*v[n-1] (2)

例如，根据方程(2)，在每个采样点处，快速RMS检测器150可在最后22ms时间段期间输出所接收的输入信号u[n]的平均能级(在对数域中)，而慢速RMS检测器160可在最后128ms时间段期间输出所接收的输入信号u[n]的平均能级(在对数域中)。将快速和慢速RMS检测器150和160实现为对数域RMS检测器的优点是，快速和慢速RMS检测器150和160的输出值是按照对数域(例如dB FS)中的值。因此，涉及快速和慢速RMS检测器150和160的输出值的任何随后的乘和/或除运算使用对数值由加和/或减运算代替(例如以计算自适应阈值，如下面讨论的)。此外，对数域值可转换成使它们乘以的因子的dB值。

如图1所示，快速RMS检测器150和慢速RMS检测器160每个将输出发送到警戒信号检测器170。如上面讨论的，慢速RMS检测器160的输出包括由警戒信号检测器170接收的输入信号140的环境声电平。警戒信号检测器170接着使用环境声电平通过应用自适应阈值函数来计算自适应阈值。自适应阈值规定根据环境声电平而改变的声能级。快速RMS检测器150的输出包括也由警戒信号检测器170接收的输入信号140的包络电平。警戒信号检测器170接着使用包络电平通过比较包络电平与自适应阈值来确定所接收的输入信号当前是否包含警戒信号。例如，如果从快速RMS检测器150输出的包络电平等于或大于自适应阈值电平，则可确定警戒信号当前存在于所接收的输入信号中。否则，可确定警戒信号当前不存在于所接收的输入信号中。

因此，警戒信号检测器170基于所接收的输入信号的环境声电平来确定自适应阈值，并接着通过比较所接收的输入信号的包络电平与自适应阈值来确定警戒信号是否存在于所接收的输入信号中。因为自适应阈值规定根据所接收的输入信号的环境声电平而改变的声能级，在所接收的输入信号中的警戒信号的检测也根据环境声电平而改变。因此，音频处理系统100的警戒信号检测功能自动适合于变化的声环境，由此，当环境的环境声电平改变时，用于检测警戒信号的自适应阈值自动改变，而没有最终用户输入或干预。在一些实施方案中，当环境声电平增大时，自适应阈值自动增大，而当环境声电平减小时，自适应阈值自动减小(如下面关于图2所讨论的)。

在一些实施方案中，警戒信号检测器170还提供有条件的环境更新特征。在这些实施方案中，基于警戒信号是否由警戒信号检测器170检测来更新环境声电平(其从慢速RMS检测器160输出)。如在本文使用的，“当前”环境声电平包括由警戒信号检测器170接收并使用以检测警戒信号的、在“当前”采样点处的环境声电平。如果未检测到警戒信号，则在下一采样点处更新当前环境声电平以产生下一环境声电平(按照音频处理系统100的惯常操作)。然而，如果检测到警戒信号，则在下一采样点处不更新当前环境声电平，但更确切地，当前环境声电平仍然由警戒信号检测器170使用来检测警戒信号。当前环境声电平由警戒信号检测器170在随后的采样点处连续地循环并使用以检测警戒信号，直到警戒信号检测器170确定警戒信号不再存在于输入信号140中为止。在警戒信号检测器170确定警戒信号不再存在于输入信号140中之后，接着在下一采样点处更新当前环境声电平以产生下一环境声电平(按照音频处理系统100的惯常操作)。这确保警戒信号的相对高的能级不在随后的采样点处人为地升高环境声电平，这又将人为地升高自适应阈值。通过使当前环境声电平循环，更实际可行的环境声电平被输入到警戒信号检测器170。

如图1所示，为了实现有条件的环境更新特征，警戒信号检测器170将控制信号180发送到慢速RMS检测器160。控制信号180的状态基于警戒信号是否被检测到。如果警戒信号没有由警戒信号检测器170检测到，则警戒信号检测器170将控制信号180发送到慢速RMS检测器160以使慢速RMS检测器160正常操作并在下一采样点处更新环境声电平。如果警戒信号由警戒信号检测器170检测到，则警戒信号检测器170将控制信号180发送到慢速RMS检测器160以使慢速RMS检测器160不在下一采样点处更新环境声电平和/或连续地输出/循环环境声电平。在警戒信号检测器170确定警戒信号不再存在于输入信号140中之后，警戒信号检测器170将控制信号180发送到慢速RMS检测器160以使慢速RMS检测器160正常操作并在下一采样点处更新环境声电平。

警戒信号检测器170也将检测信号发送到检测接收设备190，检测信号指示警戒信号是否由检测信号检测器170检测。检测接收设备190包括利用音频处理系统100的警戒信号检测能力的设备。检测接收设备190接收检测信号并基于检测信号的状态来执行另外的操作。例如，检测接收设备190可包括减小娱乐信号的声电平的收听设备，和/或如果检测信号指示警戒信号被检测到则通过收听设备重放警戒信号。作为另一例子，检测接收设备190可基于检测信号的状态来改变算法的设置，例如修改环境/声音特定的音频处理设置。例如，当检测信号指示警戒信号被检测到时，降噪设置可被修改以增加输入信号的可懂度。在其它实施方案中，检测接收设备190使用检测信号用于不同的目的，并基于检测信号的状态来执行不同的操作。

自适应阈值功能

如上面讨论的，自适应阈值规定根据输入信号140的环境声电平而改变的声能级。自适应阈值是(由慢速RMS检测器160检测的)环境声电平的函数，由此，当环境的环境声电平改变时，自适应阈值自动改变。自适应阈值函数可将自适应阈值表示为环境电平的传递函数。在一些实施方案中，自适应阈值函数包括线性函数、分段线性函数或曲线函数。在其它实施方案中，自适应阈值函数包括取决于输入信号140的环境电平的任何其它类型的传递函数。

在一些实施方案中，自适应阈值函数包括由下面的方程表示的分段线性函数：

如果x[n]<b，y[n]＝A1*x[n]+B (3)

如果b<x[n]，y[n]＝A2*x[n]+C

自适应阈值函数也可以不同的形式由下面的方程表示：

y[n]＝max(A*x[n]+B,x[n]+C) (4)

在方程(3)和(4)中，

y[n]＝自适应阈值电平；

x[n]＝环境声电平(慢速RMS检测器160的输出)；

A1*x[n]+B＝第一阈值函数；

A2*x[n]+C＝第二阈值函数；

x[n]<b＝环境声电平的第一范围；

b<x[n]＝环境声电平的第二范围；以及

b＝过渡声电平。

图2示出根据各种实施方案的由图1的警戒信号检测器实现的示例性自适应阈值函数。X轴表示环境声电平(以dB FS为单位)而y轴表示自适应阈值电平(以dB FS为单位)。图2所示的自适应阈值函数由方程(3)表示。环境线曲线210表示环境声电平x[n](以dB FS为单位)。环境线曲线210分成环境声电平的第一范围220(其低于过渡声电平240)和环境声电平的第二范围230(其高于过渡声电平240)。阈值线曲线250表示自适应阈值声电平y[n](以dB FS为单位)。阈值线曲线250分成作为环境声电平的第一范围220的函数的第一阈值线260(在过渡声电平240之下)和作为环境声电平的第二范围230的函数的第二阈值线270(在过渡声电平240之上)。

第一阈值线260由环境声电平的第一范围220所定义的第一阈值函数(A1*x[n]+B)确定，而第二阈值线270由环境声电平的第二范围230所定义的第二阈值函数(A2*x[n]+C)确定。通过为环境声电平的不同范围(由过渡声电平240定义)设计不同的自适应阈值函数，自适应阈值函数本身可基于环境声电平的范围而改变。以这种方式，可以为环境声电平的特定范围特别设计自适应阈值函数以产生最佳性能结果。例如，可定义在“低”环境声电平中工作得更好的第一阈值函数，并可定义在“高”环境声电平中工作得更好的第二阈值函数。在另外的实施方案中，可为环境声电平的两个或多个不同的范围(例如低、中和高环境声电平)定义不同的自适应阈值函数。可在实验上确定定义并分离环境声电平的第一和第二范围的过渡声电平240以产生最佳性能结果。在一些实施方案中，过渡声电平240近似等于-65dB FS环境声电平。

在图2的例子中，第一和第二阈值函数是具有不同的斜率系数“A1”和“A2”的线性函数。在其它实施方案中，第一阈值函数和/或第二阈值函数可包括非线性函数。对于第一阈值函数，“A1”是第一阈值线260的斜率系数，且“B”是第一阈值线260与y轴交叉(在0dB FS环境声电平处)时的点，如果延伸到y轴。对于第二阈值函数，“A2”是第二阈值线270的斜率系数，且“C”是第二阈值线270与y轴交叉(在0dB FS环境声电平处)时的点。斜率系数A1和A2控制陡度，自适应阈值根据在环境声电平中的变化以该陡度增大或减小。B的值确定环境声电平(例如-65dB FS)，陡度的变化在该环境声电平处开始。C的值确定环境声电平的比例因子以计算自适应阈值。

可在实验上确定A1和B的值以为环境声电平的第一范围220提供最佳性能结果，且可在实验上确定A2和C的值以为环境声电平的第二范围230提供最佳性能结果。例如，在实验上发现，按恒定的比例因子缩放环境声电平以确定自适应阈值电平对于环境声电平的较高范围230很好地起作用。因此，对于环境声电平的第二范围230的第二阈值线270的斜率A2可被设置为等于1，这产生等于环境声电平乘以恒定比例因子的自适应阈值电平。在实验上还发现，等于环境声电平乘以大约1.5的恒定比例因子的自适应阈值电平对环境声电平的较高范围230很好地起作用。在第二阈值线270中，C的值确定因而产生的恒定比例因子。因此，可使用在第二阈值线270中的C的值，其对环境声电平的较高范围230产生大约1.5的恒定比例因子。

然而，在实验上发现，等于环境声电平乘以恒定比例因子的自适应阈值电平对环境声电平的较低范围220不很好地起作用。这是由于下面的事实：环境声电平的平均能量很低，使得如果恒定比例因子被使用，不是警戒信号的很多类型的声音(例如行走、钥匙掉落)可能被不正确地检测为警戒信号。因此，在较低环境声电平处，可使用当环境声电平减小时增大的非恒定/可变比例因子。因此，对于环境声电平的较低范围230的第一阈值线260的斜率A1可被设置为小于1，这产生当环境声电平减小时增大的可变比例因子。可变比例因子应用于环境声电平以确定自适应阈值电平。

检测在音频信号中的警戒信号

图3是根据各种实施方案的用于检测在音频信号内的警戒信号的方法步骤的流程图。虽然结合图1-2的系统描述了方法步骤，本领域中的技术人员将理解，配置成以任何顺序执行方法步骤的任何系统在本公开的范围内。

如所示，方法300在步骤305开始，其中声环境处理器120经由音频信号接收周围环境声。音频信号捕获周围环境声，其包括警戒信号和环境声。声环境处理器120对音频信号执行降噪并将经处理的信号传输到带通滤波器130。在步骤310，带通滤波器130接收经处理的信号，应用带通滤波器以产生带通滤波信号并将带通滤波信号(音频输入信号140)传输到快速RMS检测器150和慢速RMS检测器160。输入信号140包含警戒信号和环境声。

在步骤315，快速和慢速RMS检测器150和160每个接收输入信号140。快速和慢速RMS检测器150和160可包括在不同长度的时间段期间测量输入信号140中的音频能的平均RMS电平的时域检测器，快速RMS检测器150的时间段(例如22ms)比慢速RMS检测器160的时间段(例如128ms)短。在一些实施方案中，快速和慢速RMS检测器150和160每个包括首先将所接收的输入信号140整流并将所接收的输入信号140转换成对数(dB单位)阈的对数域RMS检测器。慢速RMS检测器160确定输入信号140的环境声电平并将环境声电平传输到警戒信号检测器170。快速RMS检测器150确定输入信号140的包络电平并将包络电平传输到警戒信号检测器170。

在步骤320，警戒信号检测器170接收输入信号140的环境声电平和包络电平。在步骤325，警戒信号检测器170应用自适应阈值函数以基于环境声电平来确定自适应阈值电平。例如，自适应阈值函数可包括线性函数、分段线性函数或曲线函数。

在步骤330，警戒信号检测器170确定警戒信号是否存在于输入信号140中。警戒信号检测器170通过比较输入信号140的所接收的包络电平与自适应阈值电平来这么做。例如，如果包络电平等于或大于自适应阈值电平，则警戒信号检测器170确定警戒信号存在于输入信号140中。否则，警戒信号检测器170确定警戒信号当前不存在于所接收的输入信号140中。

如果警戒信号检测器170确定(在步骤330—否)警戒信号不存在，则方法300在步骤340继续。如果警戒信号检测器170确定(在步骤330—是)警戒信号存在，则警戒信号检测器170(在步骤335)将控制信号180发送到慢速RMS检测器160以使慢速RMS检测器160不在下一采样点更新环境声电平并继续输出/循环当前环境声电平，直到警戒信号检测器170确定警戒信号不再存在于输入信号140中为止。方法300接着在步骤340继续。

在步骤340，警戒信号检测器170将检测信号发送到检测接收设备190，检测信号指示警戒信号是否由警戒信号检测器170检测到。检测接收设备190接收检测信号并基于检测信号的状态来执行另外的操作。方法300然后继续进行到上面所述的步骤305。在各种实施方案中，可在连续循环中执行方法300的步骤，直到某些事件例如使包括音频处理系统100的设备断电出现为止。

总而言之，在音频处理系统100中，所捕获的音频信号由声环境处理器和带通滤波器处理以向快速RMS检测器150和慢速RMS检测器160提供音频输入信号140，输入信号140包含警戒信号和环境声。慢速RMS检测器160确定被输出到警戒信号检测器170的输入信号140的环境声电平。警戒信号检测器170使用环境声电平使用自适应阈值函数来计算自适应阈值电平。快速RMS检测器150确定被输出到警戒信号检测器170的输入信号140的包络电平。警戒信号检测器170比较包络电平与自适应阈值电平以确定警戒信号是否当前存在于输入信号140中。因为自适应电平根据输入信号140的环境声电平而改变，警戒信号的检测也根据环境声电平而改变。因此，音频处理系统100的警戒信号检测功能自动适合于具有不同环境声电平的变化的声环境，而没有最终用户输入或干预。

本文所述的方法的至少一个优点是，可以用简单和低成本的方式实现音频处理系统，同时也检测在变化的声环境中的警戒信号。本文所述的方法的另一优点是，自适应阈值电平(用于检测警戒信号)基于环境的环境声电平而自动改变，由此，在不同的声环境当中实现警戒信号的准确检测。

各种实施方案的描述为了说明的目的而被提出，但并没有被规定为无遗漏的或限于所公开的实施方案。很多修改和变化将对本领域中的普通技术人员是明显的而不偏离所述实施方案的范围和精神。

当前实施方案的方面可被体现为系统、方法或程序产品。相应地，本公开的方面可采用完全硬件实施方案、完全软件实施方案(包括固件、常驻软件、微代码等)或组合软件和硬件方面的实施方案的形式，这些实施方案都可通常被称为“电路”、“部件”、“模块”或“系统”。此外，本公开的方面可采用体现在一个或多个计算机可读介质中的计算机程序产品的形式，计算机可读介质具有体现在其上的计算机可读程序代码。

可利用一个或多个计算机可读介质的任何组合。计算机可读介质可以是计算机可读信号介质或计算机可读存储介质。计算机可读存储介质可以是例如但不限于电子、磁性、光学、电磁、红外或半导体系统、装置或设备或前述项的任何适当组合。计算机可读存储介质的更具体的例子(非详尽列表)将包括下列项：具有一个或多个电线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪存)、光纤、便携式光盘只读存储器(CD-ROM)、光学存储设备、磁性存储设备或前述项的任何适当组合。在本文档的上下文中，计算机可读存储介质可以是可包含或存储程序用于由或结合指令执行系统、装置或设备来使用的任何有形介质。

上面参考根据本公开的实施方案的方法、装置(系统)和计算机程序产品的流程图图示和/或方框图描述了本公开的方面。将理解，流程图图示和/或方框图的每个块以及在流程图图示和/或方框图中的块的组合可由计算机程序指令实现。这些计算机程序指令可被提供到通用计算机、专用计算机的处理器或其它可编程数据处理装置以产生机器，使得经由计算机的处理器或其它可编程数据处理装置执行的指令使在一个或多个流程图图示和/或方框图中规定的功能/行动的实现成为可能。这样的处理器可以是(但不限于)通用处理器、专用处理器、应用特定处理器或现场可编程处理器或门阵列。

在附图中的流程图和方框图示出根据本公开的各种实施方案的系统、方法和计算机程序产品的可能实现的架构、功能和操作。在这个方面中，在流程图或方框图中的每个块可代表包括用于实现特定的逻辑功能的一个或多个可执行指令的代码的模块、段或部分。还应注意，在一些可选的实现中，在块中提到的功能可与在附图中提到的顺序不同地出现。例如，连续示出的两个块可以事实上实质上同时被执行，或块有时可以按相反的顺序执行，取决于所涉及的功能。还将注意，方框图和/或流程图图示的每个块以及在方框图和/或流程图图示中的块的组合可由执行特定的功能或行动或专用硬件和计算机指令的组合的基于专用硬件的系统实现。

虽然前述内容目的在于本公开的实施方案，可设计本公开的其它和另外的实施方案而不偏离其基本范围和由接下来的权利要求确定的其范围。

Claims

1.一种音频处理系统，其包括：

慢速检测器，其配置成确定与包括环境声的音频输入信号相关的环境声电平；

快速检测器，其配置成确定与所述音频输入信号相关的包络电平；以及

警戒信号检测器，其配置成：

基于所述环境声电平来确定自适应阈值电平；以及

比较所述包络电平与所述自适应阈值电平以确定警戒信号是否存在于所述音频输入信号中。

2.如权利要求1所述的音频处理系统，其中：

所述快速检测器包括在第一时间段期间确定与所述音频输入信号相关的平均能级的时域检测器；以及

所述慢速检测器包括在第二时间段期间确定与所述音频输入信号相关的平均能级的时域检测器，其中所述第二时间段大于所述第一时间段。

3.如权利要求1所述的音频处理系统，其中所述慢速检测器和所述快速检测器中的每个包括对数域均方根(RMS)检测器。

4.如权利要求1所述的音频处理系统，其还包括：

声环境处理器，其用于从麦克风接收音频信号并对所述音频信号执行一个或多个降噪操作以产生经处理的信号；以及

带通滤波器，其使在预定频率范围之外的所述经处理的信号衰减以产生带通滤波信号，其中所述带通滤波信号包括由所述慢速检测器和快速检测器接收的所述音频输入信号。

5.如权利要求1所述的音频处理系统，其中所述警戒信号检测器还配置成将检测信号传输到检测接收设备，其中所述检测信号指示是否已检测到警戒信号。

6.如权利要求1所述的音频处理系统，其中所述警戒信号检测器配置成将自适应阈值函数应用于所述环境声电平以确定所述自适应阈值，其中所述自适应阈值函数包括线性函数、分段线性函数或曲线函数。

7.如权利要求1所述的音频处理系统，其中当所述环境声电平增大时，所述自适应阈值电平增大，以及当所述环境声电平减小时，所述自适应阈值电平减小。

8.如权利要求1所述的音频处理系统，其中所述警戒信号检测器还配置成致使所述慢速检测器抑制更新与所述音频输入信号相关的所述环境声电平，直到所述警戒信号不存在于所述音频输入信号中为止。

9.一种用于检测在音频输入信号内的警戒信号的计算机实现的方法，所述方法包括：

确定与所述音频输入信号相关的环境声电平，其中所述音频输入信号包括来自周围环境的一个或多个声音；

确定与所述音频输入信号相关的包络电平；

基于所述环境声电平来确定自适应阈值电平；以及

10.如权利要求9所述的计算机实现的方法，其中：

确定与所述音频输入信号相关的所述包络电平包括确定在第一时间段期间的所述音频输入信号的平均能级；以及

确定与所述音频输入信号相关的环境声电平包括确定在第二时间段期间的所述音频输入信号的平均能级，所述第二时间段比所述第一时间段长。

11.如权利要求9所述的计算机实现的方法，其中确定所述自适应阈值电平包括将自适应阈值函数应用于所述环境声电平，所述自适应阈值函数包括线性函数、分段线性函数或曲线函数。

12.如权利要求9所述的计算机实现的方法，其中确定所述自适应阈值电平包括将第一自适应阈值函数应用于环境声电平的第一范围的所述环境声电平以及将第二自适应阈值函数应用于环境声电平的第二范围的所述环境声电平。

13.如权利要求12所述的计算机实现的方法，其中：

环境声电平的所述第一范围低于环境声电平的所述第二范围；

所述第一自适应阈值函数包括具有第一斜率的线性函数；以及

所述第二自适应阈值函数包括具有大于所述第一斜率的第二斜率的线性函数。

14.如权利要求13所述的计算机实现的方法，其中所述第一斜率小于1并且所述第二斜率等于1。

15.如权利要求12所述的计算机实现的方法，其中：

对于环境声电平的所述第一范围，所述第一自适应阈值函数产生等于所述环境声电平乘以非恒定比例因子的自适应阈值电平；以及

对于环境声电平的所述第二范围，所述第二自适应阈值函数产生等于所述环境声电平乘以恒定比例因子的自适应阈值电平。

16.如权利要求9所述的计算机实现的方法，其还包括：

当确定警戒信号存在于所述音频输入信号中时，使所述慢速检测器不更新所述音频输入信号的所述环境声电平，直到所述警戒信号不再存在于所述音频输入信号中为止。

17.一种包括指令的计算机可读存储介质，所述指令当被处理器执行时使所述处理器通过执行下列步骤来检测在音频输入信号内的警戒信号：

接收与所述音频输入信号相关的环境声电平，其中所述音频输入信号包括来自周围环境的一个或多个声音；

接收与所述音频输入信号相关的包络电平；

基于所述环境声电平来确定自适应阈值电平；以及

18.如权利要求17所述的计算机可读存储介质，其中：

19.如权利要求17所述的计算机可读存储介质，其中确定所述自适应阈值电平包括将自适应阈值函数应用于所述环境声电平，所述自适应阈值函数包括至少包括第一阈值函数和第二阈值函数的分段线性函数。

20.如权利要求17所述的计算机可读存储介质，其中确定所述自适应阈值电平包括将第一自适应阈值函数应用于环境声电平的第一范围的所述环境声电平以及将第二自适应阈值函数应用于环境声电平的第二范围的所述环境声电平。