CN111316668A

CN111316668A - 扬声器回放的检测

Info

Publication number: CN111316668A
Application number: CN201880072084.6A
Authority: CN
Inventors: J·P·莱索
Original assignee: Cirrus Logic International Semiconductor Ltd
Current assignee: Cirrus Logic International Semiconductor Ltd
Priority date: 2017-11-14
Filing date: 2018-11-13
Publication date: 2020-06-19
Anticipated expiration: 2038-11-13
Also published as: US20200204937A1; GB2581295B; US11051117B2; GB201801659D0; WO2019097216A1; CN111316668B; US20190149932A1; US10616701B2; GB202006210D0; GB2581295A

Abstract

一种确定声音是否由扬声器生成的方法，包括接收代表所述声音的至少一部分的音频信号。所述音频信号被分离在不同的频带中。比较不同的频带的信号内容。基于所述比较，标识信号内容中指示使用扬声器的基于频率的变化。

Description

扬声器回放的检测

技术领域

本文所描述的实施方案涉及用于检测何时信号通过扬声器播放的方法和设备。

背景技术

语音生物测定系统越来越广泛地被使用。在这样的系统中，用户通过在注册阶段期间提供他们的话语的样本来训练系统。在后续的使用中，系统能够在已注册用户和未登记的说话人之间进行辨别。语音生物测定系统原则上可以用于控制对各种服务和系统的访问权。

恶意方试图击败语音生物测定系统的一种方式是获取已注册用户的话语的录音，且回放该录音以试图冒充已注册用户以及获得对旨在限于已注册用户的服务的访问权。

这称为重放攻击或欺骗攻击。

发明内容

根据本发明的一个方面，提供了一种确定声音是否由扬声器生成的方法，该方法包括：

接收代表所述声音的至少一部分的音频信号；

将所述音频信号分离在不同的频带中；

比较不同的频带的信号内容；以及

基于所述比较，标识信号内容中指示使用扬声器的基于频率的变化。

接收代表所述声音的音频信号；

试图在所接收的音频信号中检测由作为扬声器的特性的非线性所产生的特征；以及

如果检测到所述特征，则确定所述声音是由扬声器生成的。

根据本发明的另一方面，提供了一种用于确定声音是否由扬声器生成的系统，该系统被配置用于根据所述方法中的任一方法进行操作。

根据本发明的另一方面，提供了一种包括这种系统的设备。所述设备可以包括移动电话、音频播放器、视频播放器、移动计算平台、游戏设备、遥控器设备、玩具、机器或家庭自动化控制器或家用电器。

根据本发明的另一方面，提供了一种计算机程序产品，包括计算机可读有形介质，以及用于执行根据第一方面的方法的指令。

根据本发明的另一方面，提供了一种非暂时性计算机可读存储介质，在所述非暂时性计算机可读存储介质上存储有计算机可执行指令，当由处理器电路系统执行所述计算机可执行指令时，所述计算机可执行指令使所述处理器电路系统执行根据第一方面的方法。

附图说明

为了更好地理解本发明且示出可以如何实施本发明，现在将参考附图，在附图中：

图1例示了一个智能电话；

图2是例示智能电话的形式的示意图；

图3例示了正在执行重放攻击的一种情形；

图4例示了扬声器的特性；

图5是例示分析音频信号的方法的流程图；

图6是例示分析系统的框图；

图7更详细地例示了图6的系统的一部分；以及

图8例示了图6的系统的一个实施方案。

具体实施方式

下面的描述阐述了根据本公开内容的示例实施方案。对于本领域普通技术人员而言，其他示例实施方案和实施方式将是显而易见的。此外，本领域普通技术人员将认识到，可以代替下面所讨论的实施方案或与下面讨论的实施方案相结合地应用多种等同技术，且所有这样的等同物应被认为是本公开内容所涵盖的。

本文所描述的方法可以在各种各样的设备和系统(例如，移动电话、音频播放器、视频播放器、移动计算平台、游戏设备、遥控器设备、玩具、机器或家庭自动化控制器或家用电器)中实施。然而，为了易于解释一个实施方案，将描述一个例示性实施例，其中实施方式发生在智能电话中。

图1例示了一个智能电话10，该智能电话10具有用于检测周边声音的麦克风12。在正常使用中，麦克风当然用于检测将智能电话10握持在他们的脸部附近的用户的话语。

图2是例示智能电话10的形式的示意图。

具体地，图2示出了智能电话10的多个互连部件。应理解，智能电话10实际上将包含许多其他部件，但是以下描述对于理解本发明是足够的。

因此，图2示出了上面所提及的麦克风12。在某些实施方案中，智能电话10设置有多个麦克风12、12a、12b等。

图2还示出了存储器14，该存储器14实际上可以被设置为单个部件或多个部件。存储器14被设置用于存储数据和程序指令。

图2还示出了处理器16，该处理器16实际上也可以被设置为单个部件或多个部件。例如，处理器16的一个部件可以是智能电话10的应用处理器。

图2还示出了收发器18，该收发器18被设置用于允许智能电话10与外部网络通信。例如，收发器18可以包括用于经由WiFi局域网或经由蜂窝网络建立互联网连接的电路系统。

图2还示出了音频处理电路系统20，用于根据需要对由麦克风12所检测到的音频信号执行操作。例如，音频处理电路系统20可以对音频信号进行滤波，或可执行其他信号处理操作。

在此实施方案中，智能电话10设置有语音生物测定功能且设置有控制功能。因此，智能电话10能够响应于来自已注册用户的口语命令来执行多种功能。生物测定功能能够在来自已注册用户的口语命令和由一个不同的人说出的相同命令之间进行区分。因此，本发明的某些实施方案涉及操作智能电话或具有某种语音可操作性的另一便携式电子设备，例如平板计算机或膝上型计算机、游戏控制台、家庭控制系统、家庭娱乐系统、车载娱乐系统、家用电器等，其中在旨在执行口语命令的设备中执行语音生物测定功能。某些其他实施方案涉及在智能电话或其他设备上执行语音生物测定功能的系统，如果语音生物测定功能能够确认说话人是已注册用户，则智能电话或其他设备将命令发送至一个分立的设备。

在一些实施方案中，虽然在智能电话10或靠近用户定位的其他设备上执行语音生物测定功能，但是使用收发器18将口语命令传输至远程话语识别系统，该远程话语识别系统确定口语命令的含义。例如，话语识别系统可以位于云计算环境中的一个或多个远程服务器上。然后，基于口语命令的含义的信号被返回至智能电话10或其他本地设备。

图3示出了正在执行重放攻击的情形的一个实施例。因此，在图3中，智能电话10设置有语音生物测定功能。在此实施例中，智能电话10至少暂时地拥有一个攻击者，该攻击者具有另一智能电话30。智能电话30已经被用来记录智能电话10的已注册用户的语音。使智能电话30靠近智能电话10的麦克风入口12，且回放已注册用户的语音的录音。如果语音生物测定系统不能够检测它所检测到的已注册用户的语音是录音，则攻击者将获得对旨在仅由已注册用户可访问的一个或多个服务的访问权。

已知的是，由于尺寸约束，智能电话(诸如，智能电话30)通常设置有具有相对低质量的扬声器。因此，通过这种扬声器所回放的已注册用户的语音的录音不会与该用户的语音完美匹配，且这一事实可被用来标识重放攻击。例如，扬声器可以具有某些频率相关的特性，且如果可以在由语音生物测定系统所接收的话语信号中检测到这些频率相关的特性，则可以认为该话语信号由重放攻击产生。

尽管图3例示了所公开的分析音频信号的方法的一种可能用途，但是该方法更普遍地适用于期望确定所检测到的声音是否通过扬声器播放的任何系统。在此实施例中，该方法利用典型的扬声器具有取决于频率的非线性这一事实。这与例如麦克风相反，麦克风具有基本上独立于频率的非线性。

图4例示了典型的扬声器的非线性特性。具体地，图4示出了总谐波失真(THD)随着频率的变化。

在低于扬声器的谐振频率f_R的相对低的频率处，例如在f₁至f₂的范围内，THD通常是恒定的。扬声器在谐振频率处具有大的THD，然后随着频率增大(例如，对于f₃和更高的频率)而下降。

此非线性特性可以被用于检测何时所接收的声音是通过扬声器播放的。

具体地，由于非线性特性是频率相关的，所以可以在不同的频带中检测非线性的影响，从而标识所接收的信号是否由通过扬声器所播放的声音产生的。

图5是例示分析的方法的流程图，且图6是例示分析系统的基本形式的框图。

在该方法的步骤200处，代表声音的音频信号在系统的输入220处被接收。

在输入22处所接收的信号可以直接从麦克风(诸如，麦克风12)接收，或者可能已经经受了一些初始预处理。因此，如果接收了代表声音的第一信号，则可以从代表声音的一部分的第一信号导出第二信号。然后，系统可以试图在第二信号中检测由非线性所产生的特征，该非线性在某些频率处比在其他频率处更大。

例如，可以对所接收的信号进行预处理，以使得第二信号代表声音的话语成分。更具体地，可以对所接收的信号进行预处理，以使得第二信号代表浊音话语。

第一信号可以在语音活动检测器处被接收，且仅当语音活动检测器在第一信号中检测到话语时才导出第二信号。

在步骤202处，将所接收的信号分离在两个或更多个频带中。图6示出了信号被传送至低通滤波器形式的第一滤波器222，且还被传送至高通滤波器形式的第二滤波器228。优选地，低通滤波器的截止频率被选择为低于将预期使用的任何扬声器的谐振频率。类似地，优选地，高通滤波器的截止频率被选择为显著高于将预期使用的任何扬声器的谐振频率。这将具有的效果是，扬声器的非线性从而对所接收的信号的可检测到的影响在低音频频率处将比在高音频频率处更大。

在其他实施方案中，第一滤波器222和第二滤波器228这二者都是带通滤波器，其中它们的相应通带被选择为使得它们被间隔开，这意味着扬声器的非线性从而对所接收的信号的可检测到的影响在两个通带中将是不同的。

在其他实施方案中，设置了两个以上的滤波器，且再次它们可以是带通滤波器，其中它们的相应通带被间隔开。使用三个或更多个频带提高了扬声器的非线性从而对所检测的信号的可检测到的影响在所述通带中将是不同的概率，尽管目的是检测具有明显不能事先知晓的非线性特性的未知扬声器的存在。

因此，在步骤204中，检查不同频带的信号内容。在图6中所示出的实施例中，滤波器222、228的输出被传送至相应的非线性检测器(NLD)模块224、230。因此，在此实施例中，如在步骤206处所示出的，系统试图在所接收的音频信号中检测由非线性所产生的特征。

更具体地，系统试图在所接收的音频信号中检测由随着频率而改变的非线性(例如，在低音频频率处比在高音频频率处更大)所产生的特征。

非线性检测器(NLD)224、230可以采用多种形式，但是非线性对所接收的信号的一种影响是增大信号的不对称性。也就是说，如果信号包含大数目的样本，且样本值是正值和负值的混合，则非线性的一种影响是引入新样本值，该新样本值是输入信号中的值的平方。这些平方值都将为正，因此它们的存在将增大非线性的输出中正值的比例。

因此，简单形式的非线性检测器(NLD)的一种形式在由滤波器222、228所选定的两个或更多个频带的每一频带中测量波形的不对称性。

该方法的步骤206可以包括分析两个或更多个频率分量以获得相应的度量，然后比较所述度量以标识由非线性所产生的特征，该非线性在所述频带的一个频带中比在另一频带中更大。

更具体地，分析两个或更多个频率分量可以包括获得与相应分量的样本值有关的统计度量。统计度量可以是声音的波形的不对称性的测量。更具体地，统计度量可以是样本值的偏度的测量。

图7示出了NLD的一种可能的实施方式。在此实施方式中，可选的非线性增益被施加至所接收的信号的相关频率分量。非线性增益可以是压缩的，或者如图7中所示出的非线性量化器240，该非线性量化器240用于去除具有小值的样本，以使得较大的样本对后续确定具有较大的影响。所得到的信号被传送至块242，该块242用于测量信号的偏度，以获得相关频带的统计度量。

偏度测量块242可以例如形成皮尔逊偏度系数(Pearson coefficient ofskewness)、非参数偏度(non-parametric skew)或四分位偏度系数(quartile skewnesscoefficient)作为偏度的测量。

非参数偏度Sk可以是：

其中，μ是样本值的平均，v是样本值的中值，且σ是样本值的标准偏差。

替代地，可以使用由平均绝对偏差代替标准偏差的非参数偏度。

四分位偏度系数Sq可以是：

其中Q1、Q2和Q3分别是第一四分位值、第二四分位值和第三四分位值。

NLD的替代形式检查从相应频带中的样本所导出的累积分布函数。

图8例示了所使用的累积分布函数的类型。

具体地，图8示出了针对从较低频率f₁延伸至较高频率f₂的第一滤波器通带所获得的累积分布函数。例如，针对传送通过滤波器222、228中的一个滤波器的信号，可以获得累积分布函数。曲线250则示出了信号的基频低于相关频率的帧的百分比。因此，作为例示，累积分布函数250示出了百分比c₂的帧具有低于频率f_c的基频。

在一个实施例中，然后通过将累积分布函数250与参考累积分布函数252进行比较来获得非线性的测量。参考累积分布函数252可以例如具有洛伦兹分布。

累积分布函数250与参考累积分布函数252之间的比较可以借助于竖直距离计算来实现。因此，如上面所提及的，累积分布函数250示出了百分比c₂的帧具有低于频率f_c的基频。类似地，参考累积分布函数252示出了百分比c₁的帧具有低于频率f_c的基频。因此，可以在频率f_c处计算竖直距离(c₂-c₁)。可以针对从f₁延伸至f₂的频带内的所有频率执行相同的计算。然后，这可以被用于形成信号在从f₁至f₂的频带内的非线性的测量。例如，可以通过跨越从f₁至f₂的频带寻找累积分布函数250与参考累积分布函数252之间的最大竖直距离，来获得代表信号在相关频带内的非线性的度量。

可以针对传送通过滤波器222、228中的另一滤波器的信号执行相同的步骤，从而获得代表信号在相关频带内的非线性的统计度量。

在对不同的频带的信号内容执行统计分析以生成相应的统计度量之后，在步骤208中，这些度量被传送至比较块226，如图6中所示出的。

比较块226比较针对不同的频带所获得的统计度量。

例如，如果两个频率分量被滤波器222、228分离开，则可以比较针对这两个频带所获得的度量，以获得两个度量的比率值。

也就是说，如果度量对于第一频带是

且对于第二频带是

则可以形成比率

然后，可以将此比率与一个或多个阈值进行比较。如果该比率高于上限阈值和/或如果该比率低于下限阈值，则可以确定信号可能是通过扬声器播放的。

如果选择了多于两个的频带，则可以例如将针对这些频带的度量成对地进行比较。也就是说，如果度量对于第一频带是

对于第二频带是

对于第三频带是

则可以形成三个比率

和

然后，可以将所有这些比率与一个或多个阈值进行比较。

如果选择第一频带和第二频带使得它们很可能显著低于扬声器的谐振频率且显著高于扬声器的谐振频率，则如果低音频频率分量的样本值的偏度的测量与高音频频率分量的样本值的偏度的测量的比率超过了一个阈值，可以确定所接收的音频信号具有由非线性所产生的特征，该非线性在低音频频率处比在高音频频率处更大。

例如，该比率的典型值可能是1.5:1。因此，为了提供良好的辨别度，可以将该比率的阈值设置为1.3:1。

然而，还已知的是，话语典型地是略微不对称的，且一些说话人的话语自然地比其他说话人的话语更不对称。因此，如果系统具有对关于说话人的声称身份的信息的访问权(如在例如说话人验证系统中通常就是这种情况)，则该比率的阈值可能被适配成考虑该信息。例如，对于具有低程度的自然不对称性的说话人，该比率的阈值可以被设置为比正常更低的值。对于具有高程度的自然不对称性的说话人，该比率的阈值可以被设置为比正常更高的值。

类似地，非线性会随着声压级而变化。因此，可以基于信号水平来调节该比率的阈值。如果所检测到的声音是安静的，则非线性将对所接收的信号具有相对小的影响，所以为该比率设置一个比正常阈值更低的值将是有利的。相反，如果所检测到的声音是响亮的，则非线性将对所接收的信号具有相对大的影响，所以可以为该比率设置一个比正常阈值更高的值。

尽管在此参考确定针对不同的频带所获得的度量的比率，但是应理解，还可以形成度量之间的差异(诸如，两个频率分量的样本值的偏度的测量)，且将此差异与阈值进行比较。

上面描述了一个实施方案，其中从信号获得多个频带中的累积分布函数，且将该累积分布函数与相应的参考累积分布函数进行比较，从而形成频带的非线性的相应测量。然后，可以将针对不同的频带的非线性的这些测量彼此进行比较。

另一可能性是从信号获得多个频带中的相应的累积分布函数，且在比较块226中直接将那些累积分布函数彼此进行比较。例如，该比较可以涉及寻找累积分布函数之间的最大竖直距离(如参考图8所描述的)，以及在累积分布函数与参考累积分布函数之间进行比较。

如果多个频带中与信号有关的累积分布函数之间的差异(例如，以它们之间的竖直距离所表示的差异)超过了阈值，则此可以被比较块226用作对声音是由扬声器所生成的指示。

如果比较块226确定声音是由扬声器所生成的，则它生成扬声器指示输出信号。根据需要，此可以被提供至任何后续处理块。在分析用于确定所接收的音频信号是说话人识别系统还是话语识别系统的一部分的情况下，输出信号可以被用于控制该系统的其余部分所采取的动作。例如，在语音生物测定系统的情况下，如果确定声音可能是由扬声器所生成的，则可以确定声音可能是由对语音生物测定系统的重放攻击产生的。在那种情况下，仅当确定声音不是由扬声器生成时，才可以将所接收的音频信号传送至语音生物测定处理模块。因此，在说话人识别系统中，如果比较块226确定所接收的音频信号是响应于通过扬声器所播放的声音而生成的，则可以使所接收的音频信号包含已注册用户的话语的决策无效。

上面参考了获得与两个或更多个频带有关的显式度量(explicit metrics)，以及比较那些度量从而标识信号内容中指示使用扬声器的基于频率的变化。然而，还可以使用机器学习技术来试图在所接收的音频信号中检测由随着频率而改变的非线性(例如，在低音频频率处比在高音频频率处更大)的特征。机器学习可以例如使用神经网络。

馈送至机器学习技术的数据例如可以是原始频率数据，或者可以是与信号有关的概率数据(例如，每一频带中的样本值的累积分布函数)。

本领域技术人员将认识到，上文所描述的装置和方法的一些方面可以具体化为例如位于非易失性载体介质(诸如，磁盘、CD-ROM或DVD-ROM、程序化存储器诸如只读存储器(固件))上或位于数据载体(诸如，光学信号载体或电信号载体)上的处理器控制代码。对于许多应用，本发明的实施方案将被实施在DSP(数字信号处理器)、ASIC(专用集成电路)或FPGA(现场可编程门阵列)上。因此，代码可以包括常规程序代码或微代码或例如用于设置或控制ASIC或FPGA的代码。代码还可以包括用于动态地配置可重新配置的装置(诸如，可重新编程逻辑门阵列)的代码。类似地，代码可以包括用于硬件描述语言(诸如Verilog TM或VHDL(超高速集成电路硬件描述语言))的代码。如本领域技术人员将理解，代码可以被分布在彼此通信的多个经耦合的部件之间。在适当的情况下，还可以使用在现场可(重新)编程模拟阵列或类似的设备上运行以配置模拟硬件的代码来实施所述实施方案。

注意，如本文中所使用的，术语模块应被用来指代可以至少部分地由专用硬件部件(诸如，自定义电路系统)实施的功能单元或功能块，和/或至少部分地由一个或多个软件处理器或在合适的通用处理器等上运行的适当的代码实施的功能单元或功能块。模块本身可以包括其他模块或功能单元。模块可以由不需要被协同定位且可以被设置在不同的集成电路上和/或在不同的处理器上运行的多个部件或子模块来提供。

实施方案可以在主机设备中实施，尤其是便携式主机设备和/或电池供电主机设备，诸如移动计算设备(例如，膝上型计算机或平板计算机)、游戏控制台、远程控制设备、家庭自动化控制器或家用电器(包括家用温度或照明控制系统)、玩具、机器(诸如，机器人)、音频播放器、视频播放器或移动电话(例如，智能电话)。

应注意，上文所提及的实施方案例示而非限制本发明，且在不偏离随附权利要求的范围的情况下，本领域技术人员将能够设计许多替代实施方案。词语“包括”不排除除了在权利要求中所列出的那些元件或步骤之外的元件或步骤的存在，“一”或“一个”不排除多个，且单个特征或其他单元可以实现权利要求中所记载的若干单元的功能。权利要求中的任何参考数字或参考标注不应被解释为对所述权利要求范围的限制。

Claims

1.一种确定声音是否由扬声器生成的方法，该方法包括：

接收代表所述声音的至少一部分的音频信号；

将所述音频信号分离在不同的频带中；

比较不同的频带的信号内容；以及

2.根据权利要求1所述的方法，其中比较不同的频带的信号内容的步骤包括：

对不同的频带的信号内容执行统计分析以生成统计度量，以及比较针对不同的频带的统计度量。

3.根据权利要求1或2所述的方法，还包括：

如果标识了信号内容中指示使用扬声器的变化，则生成扬声器指示输出信号。

4.根据权利要求1、2或3所述的方法，包括试图通过以下步骤在所接收的音频信号中检测由非线性所产生的特征，该非线性在第一音频频率处比在第二音频频率处更大：

将所接收的音频信号分离为第一音频频率分量和第二音频频率分量；以及

分析所述第一音频频率分量和所述第二音频频率分量。

5.根据权利要求4所述的方法，包括：

分析所述第一音频频率分量和所述第二音频频率分量，以获得相应的度量；以及

比较所述度量，以标识由非线性所产生的特征，该非线性在第一音频频率处比在第二音频频率处更大。

6.根据权利要求4或5所述的方法，其中分析所述第一音频频率分量和所述第二音频频率分量中的至少一个包括获得与相应的分量的样本值有关的统计度量。

7.根据权利要求6所述的方法，其中所述统计度量是所述声音的波形的不对称性的测量。

8.根据权利要求6所述的方法，其中所述统计度量是所述样本值的偏度的测量。

9.根据权利要求8所述的方法，其中所述偏度的测量是皮尔森偏度系数、非参数偏度或四分位偏度系数。

10.根据权利要求8或9在从属于权利要求5时所述的方法，包括：

获得所述第一音频频率分量的样本值的偏度的测量；

获得所述第二音频频率分量的样本值的偏度的测量；

如果所述第一音频频率分量的样本值的偏度的测量与所述第二音频频率分量的样本值的偏度的测量的比率超过了一个阈值，则确定所接收的音频信号具有由非线性所产生的特征，该非线性在第一音频频率处比在第二音频频率处更大。

11.根据权利要求10所述的方法，包括设置所述阈值。

12.根据权利要求10所述的方法，其中所接收的音频信号代表话语，所述方法包括基于说话人的假定身份来设置所述阈值。

13.根据权利要求10所述的方法，包括基于所接收的信号的水平来设置所述阈值。

14.根据权利要求8或9在从属于权利要求5时所述的方法，包括：

获得所述第一音频频率分量的样本值的偏度的测量；

获得所述第二音频频率分量的样本值的偏度的测量；

如果所述第一音频频率分量的样本值的偏度的测量与所述第二音频频率分量的样本值的偏度的测量之间的差异超过了一个阈值，则确定所接收的音频信号具有由非线性所产生的特征，该非线性在第一音频频率处比在第二音频频率处更大。

15.根据权利要求6至14中的一项所述的方法，包括在获得所述统计度量之前，去除具有小样本值的样本。

16.根据权利要求15所述的方法，包括使用非线性量化器来去除具有小样本值的样本。

17.根据权利要求6至14中的一项所述的方法，包括在获得所述统计度量之前，将非线性增益施加至所述样本值。

18.根据权利要求17所述的方法，其中所述非线性增益是压缩。

19.根据权利要求6所述的方法，其中获得与所述相应的分量的样本值有关的统计度量包括与所述相应的分量的样本值有关的累积分布函数。

20.根据权利要求19所述的方法，其中比较不同的频带的信号内容包括：

将每一累积分布函数与针对相应的分量的相应的参考累积分布函数进行比较，以获得它们之间的差异的测量；以及

比较针对相应的分量所获得的所述差异的测量。

21.根据权利要求19所述的方法，其中比较不同的频带的信号内容包括比较与相应的分量有关的累积分布函数。

22.根据任一项前述权利要求所述的方法，用于确定声音是否由具有已知谐振频率的扬声器生成，所述方法包括试图在所接收的音频信号中检测由非线性所产生的特征，该非线性在低于所述已知谐振频率的频率处比在高于所述已知谐振频率的频率处更大。

23.根据任一项前述权利要求所述的方法，包括使用机器学习技术来试图在所接收的音频信号中检测由非线性所产生的特征，该非线性在低音频频率处比在高音频频率处更大。

24.根据权利要求23所述的方法，包括将神经网络用于所述机器学习技术。

25.根据任一项前述权利要求所述的方法，包括：

接收代表所述声音的第一信号；

由所述第一信号导出代表所述声音的一部分的第二信号；以及

试图在所述第二信号中检测由非线性所产生的特征，该非线性在第一音频频率处比在第二音频频率处更大。

26.根据权利要求25所述的方法，其中所述第二信号代表话语。

27.根据权利要求26所述的方法，其中所述第二信号代表浊音话语。

28.根据权利要求25、26或27所述的方法，包括：

在语音活动检测器处接收所述第一信号；以及

仅当所述语音活动检测器在所述第一信号中检测到话语时，才导出代表话语的所述第二信号。

29.根据任一项前述权利要求所述的方法，所述方法用于在语音生物测定系统中使用，还包括：

如果确定所述声音是由扬声器生成的，则确定所述声音可能由对所述语音生物测定系统的重放攻击产生。

30.根据权利要求29所述的方法，包括：

仅当确定所述声音不是由扬声器生成时，才将所接收的音频信号传送至语音生物测定处理模块。

31.一种用于确定声音是否由扬声器生成的系统，该系统包括用于接收代表所述声音的至少一部分的音频信号的输入；以及，处理器；且所述系统被配置用于：

接收代表所述声音的至少一部分的音频信号；

将所述音频信号分离在不同的频带中；

比较不同的频带的信号内容；以及

32.一种包括根据权利要求31所述的系统的设备。

33.根据权利要求32所述的设备，其中所述设备包括移动电话、音频播放器、视频播放器、移动计算平台、游戏设备、遥控器设备、玩具、机器或家庭自动化控制器或家用电器。

34.一种计算机程序产品，包括计算机可读有形介质，以及用于执行根据权利要求1至30中的任一项所述的方法的指令。

35.一种非暂时性计算机可读存储介质，在所述非暂时性计算机可读存储介质上存储有计算机可执行指令，当由处理器电路系统执行所述计算机可执行指令时，所述计算机可执行指令使所述处理器电路系统执行根据权利要求1至30中的任一项所述的方法。

36.一种包括根据权利要求35所述的非暂时性计算机可读存储介质的设备。

37.根据权利要求36所述的设备，其中所述设备包括移动电话、音频播放器、视频播放器、移动计算平台、游戏设备、遥控器设备、玩具、机器或家庭自动化控制器或家用电器。

38.一种确定声音是否由扬声器生成的方法，该方法包括：

接收代表所述声音的音频信号；

如果检测到所述特征，则确定所述声音是由扬声器生成的。