CN107346665A

CN107346665A - 音频检测的方法、装置、设备以及存储介质

Info

Publication number: CN107346665A
Application number: CN201710514177.7A
Authority: CN
Inventors: 肖文鲲; 邱永刚; 辛奇俊
Original assignee: Guangzhou Radium Automatic Control Technology Co Ltd; Guangzhou Shiyuan Electronics Thecnology Co Ltd
Current assignee: Guangzhou Radium Automatic Control Technology Co Ltd; Guangzhou Shiyuan Electronics Thecnology Co Ltd
Priority date: 2017-06-29
Filing date: 2017-06-29
Publication date: 2017-11-14

Abstract

本发明公开了一种音频检测的方法、装置、设备以及存储介质。其中，该方法包括：获取待测设备输出的待测音频信号；计算待测音频信号的频域能量值；将待测音频信号的频域能量值与标准音频信号的频域能量值进行比对，并根据比对结果确定待测设备的音频信号输出功能是否正常。采用上述方法可以优化现有的音频检测方案，简单高效地实现对音频信号输出功能的检测。其中，在计算待测音频信号的频域能量值时，对待测音频信号进行了分帧处理，计算了各待测音频帧的频域能量值，并在待测音频信号的频域能量值与标准音频信号的频域能量值比对时，采用了时移处理，以保证最终得到的比对结果即能保证时域特性也能保证频域特征。

Description

音频检测的方法、装置、设备以及存储介质

技术领域

本发明涉及信号处理技术领域，尤其涉及一种音频检测的方法、装置、设备以及存储介质。

背景技术

一般而言，带有音频信号输出功能的设备在出厂前都会进行音频信号输出功能的检测，以保证出厂设备中音频信号输出功能正常。检测待测设备音频信号输出功能时，通常采用下述两类方案：

方案一、自制一个带有固定输出频率的音频信号作为音频输出信号，并由检测设备计算待测设备输出的该音频输出信号的能量，通过确定输出频率处能量比例的方式判断音频输出信号是否准确，进而确定待测设备的音频信号输出功能是否正常，或者将音频输出信号通过音频播放设备播放出来后，由人工确认该音频输出信号是否准确，进而确定音频信号输出功能是否正常，这类方案在自制音频信号时，需要较高的制作成本以及技术要求，同时，随着数字信号技术的更新需要同步自制新的音频信号，增加了音频信号输出功能的检测成本；

方案二、采用机器学习的方式，由检测设备对不同待测设备输出的不同音频信号进行训练，以通过训练得到的模型进行音频比对，进而确定待测设备音频信号输出功能是否正常，这类方案需要进行大量的训练，对检测设备的计算和存储资源的要求很高，对于使用单片机的检测设备而言，这类方案很难在该检测设备中使用，导致该方案无法广泛推广，同时，随着数字信号技术的不断更新，需要经常重新训练以增加新的音频信号的训练结果，同样增加了音频信号的训练成本。

发明内容

有鉴于此，本发明实施例提供一种音频检测的方法、装置、设备以及存储介质，以优化现有的音频检测方案，简单高效地实现对音频信号输出功能的检测。

第一方面，本发明实施例提供了一种音频检测的方法，包括：

获取待测设备输出的待测音频信号；

计算所述待测音频信号的频域能量值；

将所述待测音频信号的频域能量值与标准音频信号的频域能量值进行比对，并根据比对结果确定所述待测设备的音频信号输出功能是否正常。

第二方面，本发明实施例还提供了一种音频检测的装置，包括：

获取模块，用于获取待测设备输出的待测音频信号；

计算模块，用于计算所述待测音频信号的频域能量值；

比对模块，用于将所述待测音频信号的频域能量值与标准音频信号的频域能量值进行比对，并根据比对结果确定所述待测设备的音频信号输出功能是否正常。

第三方面，本发明实施例还提供了一种音频检测的设备，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如本发明实施例所述的音频检测的方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明实施例所述的音频检测的方法。

上述提供的音频检测的方法、装置、设备以及存储介质，通过获取待测设备输出的待测音频信号，并将计算得到的待测音频信号的频域能量值与标准音频信号的频域能量值进行比对，进而根据比对结果确定待测设备的音频信号输出功能是否正常的技术方案，无需通过人为收听待测音频信号确认检测结果，避免了人工检测时的人为错误因素，同时，无需构造精确的带有固定输出频率的音频信号以及无需利用机器学习方法，降低了检测复杂度以及检测成本，使用现有的单片机检测设备便可以完成待测设备的音频信号输出功能的测试。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1为本发明实施例一提供的一种音频检测的方法的流程图；

图2a为本发明实施例二提供的一种音频检测的方法的流程图；

图2b为待测音频帧的频域能量值的计算方法的流程图；

图2c为待测音频帧的频域能量值与标准音频帧的频域能量值的比对方法流程图；

图2d为多个待测音频帧的频域能量值以及多个标准音频帧的频域能量值分别按照采样时间顺序进行排列的排列示意图；

图2e为向左时移一次后的结果示意图；

图2f为向右时移一次后的结果示意图；

图2g为音频检测系统的示意图；

图2h为音频检测设备音频信号处理流程示意图；

图2i为采样得到的待测音频信号时域波形图；

图2j为音频比对处理的流程示意图

图2k为比对前期处理示意图；

图2l为待测音频信号的频时域向量示意图；

图2m为待测音频信号的频域能量值示意图；

图2n为相似度值曲线示意图；

图3为本发明实施例三提供的一种音频检测的装置的结构示意图；

图4为本发明实施例四提供的一种音频检测的设备的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部内容。

实施例一

图1为本发明实施例一提供的一种音频检测的方法的流程图。本实施例提供的音频检测的方法适用于对带有音频信号输出功能的待测设备进行出厂前音频信号输出功能检测的情景。本实施例提供的音频检测的方法可以由音频检测的装置执行，该音频检测的装置可以通过软件和/或硬件的方式实现，并集成在测试设备中。参考图1，本实施例提供的音频检测的方法具体包括：

S110、获取待测设备输出的待测音频信号。

在本实施例中，待测设备是指具有音频信号输出功能但不具有音频信号播放功能的设备，如机顶盒等。对待测设备的音频信号输出功能进行测试是指确认待测设备中安装的板卡的音频信号输出功能是否正常，进而确认生产的板卡是否为良品。

其中，待测设备可能仅包含一个音频信号输出端口，即仅输出一种格式音频信号，还可能包含多个音频信号输出端口，即输出多种格式音频信号，如机顶盒，其可以输出模拟音频信号、同轴以及光纤信号等。当包含多个音频信号输出端口时，可以使每个音频信号输出端口依次输出待测音频信号，以分别进行测试，还可以使其中至少两个音频信号输出端口同时输出待测音频信号，以同时进行测试。可选的，当待测设备的至少两个音频信号输出端口同时输出待测音频信号时，测试设备可以在获取待测音频信号时，对其进行格式处理，以转换成具有统一格式的数字音频信号，并后续对该数字音频信号进行处理，以实现测试。统一格式的数字音频信号包括但不限定于：待测音频信号的采样率和/或采样位数相同。需要说明的是，测试设备包括至少一个音频信号输入接口。

可选的，在获取待测设备输出的待测音频信号之前，需要先确定标准音频信号，并将标准音频信号作为待测音频信号的基准信号。具体的，标准音频信号以及待测音频信号均为自然音频信号。确定标准音频信号的方式可以为：由测试人员选择一个与待测设备型号相同的且音频信号输出功能正常的标准设备，使待测设备和标准设备分别输出相同的自然音频信号，其中，获取待测设备输出的音频信号为待测试音频信号，获取标准设备输出的音频信号为标准音频信号。确定标准设备的方式可选是：由音频播放设备播放该设备输出的音频信号，并由人工确认该音频信号是否播放正确，如果正确，则说明该设备音频信号输出功能正常，可以作为标准设备。

一般而言，获取待测设备输出的待测音频信号时，同步获取标准设备的标准音频信号。上述两个音频信号均为数字音频信号，且采样率以及采样位数相同。

S120、计算待测音频信号的频域能量值。

具体的，待测音频信号为时域信号，在计算频域能量值时，先将待测音频信号从时域信号转换为频域信号，即得到频域待测音频信号，再计算频域能量值。在计算频域能量值时，可以是通过频域待测音频信号的能量谱确定待测音频信号的频域能量值，还可以对频域待测音频信号进行去虚数处理，如对频域待测音频信号中数据进行求模平方计算，以去掉待测音频信号的虚数，并将计算结果作为待测音频信号的频域能量值。

进一步的，计算标准音频信号的频域能量值，且计算方式与计算待测音频信号的频域能量值的方式相同。

S130、将待测音频信号的频域能量值与标准音频信号的频域能量值进行比对，并根据比对结果确定待测设备的音频信号输出功能是否正常。

两个设备输出同一音频信号时，如果两个音频信号的频域能量值高度相似，那么可以说明输出的两个音频信号高度相似，进而可以说明两个设备的音频信号输出功能相同。因此，本实施例中采用比对待测音频信号的频域能量值与标准音频信号的频域能量值的方式，确定待测设备的信号输出功能是否正常。

可选的，将待测音频信号的频域能量值与标准音频信号的频域能量值进行作差计算，对作差结果取绝对值，以确定待测音频信号与标准音频信号的差异值，并根据差异值确定待测音频信号与标准音频信号的相似度，如果相似度高于一定的相似度阈值，则可以确定待测设备的音频信号输出功能正常，否则，确定待测设备的音频信号输出功能异常。其中，相似度阈值可以根据实际情况设定。还可选的，直接比对待测音频信号的频域能量值与标准音频信号的频域能量值，以直接确定待测音频信号与标准音频信号的差异度，进而确定待测设备的音频信号输出功能是否正常。

一般而言，待测音频信号的频域能量值与标准音频信号的频域能量值进行比对时，是对相同采样时刻的待测音频信号与标准音频信号进行比对。然而，在实际应用中，即使待测音频信号与标准音频信号同时获取，也无法保证相同时刻采样得到的待测音频信号和标准音频信号在时间上完全对齐，这样可能会影响最终得到的比对结果。有鉴于此，在实际比对时，可以任意对上述两个音频信号中的任一个音频信号进行多次时移操作，并将另一个音频信号分别与每次时移后的音频信号进行比对，选择相似度最高或者差异度最小的结果作为待测音频信号与标准音频信号的比对结果。这样得到的比对结果可以同时综合音频信号的时域特性和频域特性，保证了准确性。

本实施例提供的技术方案，通过获取待测设备输出的待测音频信号，并将计算得到的待测音频信号的频域能量值与标准音频信号的频域能量值进行比对，进而根据比对结果确定待测设备的音频信号输出功能是否正常的技术手段，实现了仅需根据自然音频信号对待测设备的音频信号输出功能进行测试，且测试方法简单，降低了检测复杂度以及检测成本，使用现有的单片机检测设备便可以完成测试，同时，无需通过人为收听待测音频信号确认检测结果，避免了人工检测时的人为错误因素。

实施例二

图2a为本发明实施例二提供的一种音频检测的方法的流程图。本实施例提供的方法是在上述实施例的基础上进行具体化。具体的，参考图2a，本实施例提供的音频检测的方法具体包括：

S210、获取待测设备输出的待测音频信号。

S220、将待测音频信号分割成多个待测音频帧。

由于待测音频信号与标准音频信号是分别独立采样获取的，即便待测设备的音频信号输出功能正常，也无法保证相同采样时间的待测音频信号与标准音频信号中采样数据的相位完全相同，在后续进行比对操作时，无法逐个对每个采样点进行比对。因此，本实施例中，将待测音频信号进行分帧处理，并在后续处理时，均以帧为单位进行处理。同样的，将标准音频信号进行分帧处理得到多个标准音频帧，且分帧方法与待测音频信号的分帧方法相同，即待测音频帧的大小与标准音频信号的标准音频帧的大小相等。本实施例中仅对待测音频信号分帧处理进行描述。

具体的，对待测音频信号进行分帧处理后，得到多个待测音频帧向量，记为待测音频帧。其中，每个待测音频帧的大小相同。帧的大小可以根据实际情况确定，比如根据多次测试结果，选择最佳帧的大小。可选的，帧的大小为2的整数次幂，以便于后续时域转频域处理。

一般而言，对待测音频信号分帧处理时，待测音频信号中的数据可以刚好填满每一个帧。如果末尾帧不能被数据填满，则可以用空白数据进行填充，且在后续处理时，忽略空白数据，还可以截掉末尾帧，以保证每个待测音频帧均填满数据。由于，待测音频帧的个数非常多，即使末尾帧用空白数据填充或者截掉末尾帧，对后续比对结果的影响均可以忽略不计。

S230、计算多个待测音频帧的频域能量值。

示例性的，每个待测音频帧的频域能量值计算方法相同。进一步的，使用同样的方法计算每个标准音频帧的频域能量值。

具体的，参考图2b，该步骤具体包括：

S231、分别对多个待测音频帧进行傅里叶变换，以得到多个频域待测音频帧。

具体的，以待测音频帧为单位，进行帧内傅里叶变换，以得到对应的待测音频帧频域向量，记为频域待测音频帧。其中，设置每个待测音频帧的大小为2的整数幂的好处为便于待测音频帧的帧内傅里叶变换。傅里叶变换后将待测音频帧的时域信息变换为频域实数和虚数的比例关系。

进一步的，同样对每个标准音频帧进行傅里叶变换，以得到对应的频域标准音频帧。

S232、对多个频域待测音频帧中数据进行求模，并将求模结果进行平方计算，以得到各待测音频帧的频域能量值。

其中，频域待测音频帧中的数据为采样得到的待测音频信号进行傅里叶变换后的数据。具体的，根据频域能量值可以确定待测音频帧在频域的信号强度。其中，为了消除频域待测音频帧内的时域信息，本实施例中采用取频域待测音频帧中每个数据的模，并在取模后进行平方计算，以得到待测音频帧频域能量向量，记为待测音频帧的频域能量值，该频域能量值中有效的包含了对应的待测音频帧内的频率信息。其中，频域能量值中包括待测音频帧中每个频率点(数据)的子能量值，且每个子能量值按照频率顺序排列，即每个待测音频帧内仅保留频率特性。

进一步的，采用同样计算方法计算每个标准音频帧频域能量向量，记为标准音频帧的频域能量值。

S240、将多个待测音频帧的频域能量值分别与对应的标准音频帧的频域能量值进行比对，并根据比对结果确定待测设备的音频信号输出功能是否正常。

可选的，多个待测音频帧的频域能量值是按照采样时间顺序排列的。同样，多个标准音频帧的频域能量值是按照采样时间顺序排列的。在比对时，仅需根据上述排列顺序进行比对即可。这样做的好处是最终比对时不仅可以综合待测音频信号与标准音频信号的频率特性(频域能量值)，还可以综合待测音频信号与标准音频信号的时域特性(采样时间顺序)，以保证最终得到准确的比对结果。

具体的，参考图2c，该步骤具体可以包括：

S241、分别将每个待测音频帧的频域能量值与对应的标准音频帧的频域能量值进行作差计算。

具体的，将每个待测音频帧的频域能量值与对应的标准音频帧的频域能量值进行作差后，可以确定每个待测音频帧与对应的标准音频帧差异幅度。其中，在作差计算时，将待测音频帧中每个数据的子能量值分别与标准音频帧中对应的每个数据的子能量值进行作差计算。

S242、对作差结果取绝对值，以得到每个待测音频帧对应的子能量差异值。

具体的，作差结果中可能包括正值和负值。由于在后续统计和处理时，仅需要确定待测音频信号与标准音频信号的差异幅度，无需明确待测音频信号的频域能量值是否大于标准音频信号的频域能量值，因此，在得到作差结果后，对作差结果取绝对值，将绝对值后的结果作为当前待测音频帧的子能量差异值。其中，将待测音频帧中每个数据的子能量的作差结果均取绝对值，即每个子能量差值中均包含每个数据对应的子差异值。

可选的，也可以仅根据得到的子能量差异值确定待测设备的音频信号输出功能是否正常。例如，设定能量差异范围，子能量差异值在能量差异范围内说明对应的待测音频帧与标准音频帧相似，假设共有800个待测音频帧以及800个标准音频帧，确定对应的800个子能量差异值后，得到在能量差异范围内的子能量差异值的数量为780个，即共有780个待测音频帧与标准音频帧相似，其高于设定的数量阈值750个，此时，确认待测设备的音频信号输出功能正常。

S243、累加每个子能量差异值，并对累加结果进行归一化处理得到总差异值，通过总差异值确定待测设备的音频信号输出功能是否正常。

具体的，累加每个子能量差异值时，将每个子差异值进行累加。由于累加后得到的结果可能是一个很大的数值，因此，为了衡量累加结果的大小，对累加结果进行归一化处理，并将处理结果作为待测音频信号与标准音频信号的总差异值。归一化处理方式可以根据实际情况进行选择。例如，将各待测音频帧的频域能量值以及各标准音频帧的频域能量值进行加法计算得到总能量和，将累加结果除以总能量和以得到归一化结果。

进一步的，根据总差异值确定待测设备的音频信号输出功能是否正常。如果总差异值越大，则说明待测音频信号与标准音频信号的差异越大，进而可以推测待测设备的音频信号输出功能异常可能性更高。具体的，根据总差异值确定待测设备的音频信号输出功能是否正常可以包括下述任一种方案：

方案一、确定总差异值是否低于预设差异阈值，若低于，则确认待测设备的音频信号输出功能正常，否则，确认待测设备的音频信号输出功能异常。

其中，预设差异阈值可以根据实际情况进行设定。如果总差异值低于预设差异阈值，则可以认为待测音频信号与标准音频信号高度相似，进而确定待测设备的音频信号输出功能正常。反之，则确认待测设备的音频信号输出功能异常。

方案二、对总差异值进行逻辑反转，得到待测音频信号与标准音频信号的相似度值；确认相似度值是否高于预设相似阈值，若高于，则确认待测设备的音频信号输出功能正常，否则，确认待测设备的音频信号输出功能异常。

具体的，总差异值可以表征待测音频信号与标准音频信号的差异程度，如果想确认待测音频信号与标准音频信号的相似程度，则可以对总差异值进行逻辑反转，进而得到待测音频信号与标准音频信号的相似度值。其中，逻辑反转的具体方式本实施例中不作限定。例如，将用1减去总差异值得到的结果作为相似度值。相似度越高，则说明待测音频信号与标准音频信号越相似。

进一步的，预设相似度值可以根据实际情况进行设定。如果相似度值高于预设相似度值，则可以认为待测音频信号与标准音频信号高度相似，进而确定待测设备的音频信号输出功能正常。反之，则确认待测设备的音频信号输出功能异常。

本实施例提供的技术方案，将获取的待测音频信号进行分帧处理，并对各待测音频帧进行帧内处理以得到各待测音频帧的频域能量值，将各待测音频帧的频域能量值分别与对应的标准音频帧的频域能量值进行比对，以得到待测设备的音频信号输出功能是否正常的技术手段，实现了无需通过人为收听待测音频信号确认检测结果，避免了人工检测时的人为错误因素，同时，采用较简单的计算方法确定待测音频帧的频域能量值并进行后续比对，也可以在保证检测结果准确的情况下，降低检测复杂度以及检测成本。

在上述实施例的基础上，待测音频信号与标准音频信号为分别独立采样获取的，由于设备的音频缓存时间等因素，会导致两个设备同时输出同一音频信号时存在延时。即便待测设备的音频信号输出功能正常，也无法保证待测音频信号与标准音频信号时间上不存在时间偏移。所以，在将多个待测音频帧的频域能量值分别与对应的标准音频帧的频域能量值进行比对时，可以先对其中一个的频域能量值进行时移处理，以在后续比对过程中尽可能的弥补时间偏移引起的比对结果不准确的问题。

据此，将多个待测音频帧的频域能量值分别与对应的标准音频帧的频域能量值进行比对时，可以采用下述任一种方案：

方案一、按照第一设定时间间隔，对多个待测音频帧的频域能量值进行时移处理，并将每次时移后的多个待测音频帧的频域能量值分别与对应的标准音频帧的频域能量值进行比对，直到达到时移限值为止；按照设定规则，在与每次时移对应的比对结果中选择最优结果作为最终的比对结果。

其中，第一设定时间间隔与待测音频信号的采样频率以及待测音频帧大小有关。例如，采样频率为48KHz，待测音频帧包括256点数据，即大小为256，那么第一设定时间间隔为256/48000≈0.0053s＝5.33ms，也可以理解为对待测数据帧的频域能量值移动一帧的时长为5.33ms。一般而言，每时移一次，均认为移动一个帧长。

具体的，时移限值也可以称为时移上限，其可以为时移的具体次数，还可以为时移总时长，其中具体的数值可以根据实际情况进行设定。例如，设定时移限值为1s，则对待测音频帧的频域能量值进行时移时，时移最大时间不可超过±1s。又如，设定时移次数为187次，则对待测音频帧的频域能量值进行时移时左右各移动的帧长度最多为187。

进一步的，在时移前，将多个待测音频帧的频域能量值按照采样时间顺序进行排列。同样，将多个标准音频帧的频域能量值按照采样时间顺序进行排列。这样仅需执行一次时移操作，并可以实现对全部待测音频帧的时移，同时，便于后续频域能量值的比对。一般而言，对待测音频信号进行分帧处理后，各待测音频帧间是自动按照采样时间顺序排列的，即使对各待测音频帧进行傅里叶变换以及求得频域能量值，各待测音频帧间的顺序也是不变的。同样，各标准音频帧间的顺序也是不变的。

举例而言，E₁(i)表示第i个待测音频帧的频域能量值，E₂(j)表示第j个标准音频帧的频域能量值。其中，E₁(i)和E₂(j)的总个数相等，当i＝j时，表明对应的待测音频帧和标准音频帧为同一采样时刻获取的数据。设定采样频率为48KHz，待测音频帧包括256点数据，则第一设定时间间隔为5.33ms。设定时移限值为1s，则1s/5.33ms≈187.679，取整得到187，即待测音频帧的音频能量值可以左右移动187个帧长度。当然，也可以每移动一次后，确定当前的移动时长，比如向左移动187个帧长度后，确认当前移动时长已经近似1s，且再向左移动一次便会超过1s，那么则在向左移动到187个帧长度后，停止向左移动。

具体的，图2d为多个待测音频帧的频域能量值以及多个标准音频帧的频域能量值分别按照采样时间顺序进行排列的排列示意图。在时移前，先进行一次比对，即E₁(1)与E₂(1)比对、E₁(2)与E₂(2)比对、……、直到全部比对结束为止，得到该次比对结果。然后，对多个待测音频帧的频域能量值向左时移一次，图2e为向左时移一次后的结果示意图，由图2e可知，待测音频帧向左时移一次后再进行比对时，由E₁(2)与E₂(1)比对、E₁(3)与E₂(2)比对、E₁(4)与E₂(3)比对、……、直到全部比对结束为止，记录比对结果。此时，E₁(1)不与任何标准音频帧的音频能量值进行比对。继续对待测音频帧的频域能量值执行向左时移，并与对应的标准音频帧的音频能量值进行比对，记录比对结果。一般而言，每次比对完成后，确认是否达到时移限值，即确定是否向左移动了187个帧长度，如果没有，则继续向左移动并进行比对，直到达到187个帧长度为止。

进一步的，左移完成后，将待测音频帧恢复至图2d的时间位置。对待测音频帧进行一次右移，图2f为向右时移一次后的结果示意图，由图2f可知，待测音频帧向右时移一次后再进行比对时，由E₁(1)与E₂(2)比对、E₁(2)与E₂(3)比对、E₁(3)与E₂(4)比对、……、直到全部比对结束为止，记录比对结果。此时，E₂(1)不与任何标准音频帧的音频能量值进行比对。同样，每次比对完成后，确认是否达到时移限值，即是否向右移动了187个帧长度，如果没有，则继续向右移动并进行比对，直到达到187个帧长度为止。

此时，得到的比对结果共有187×2+1＝375个，在时移操作得到的全部结果(375个结果)中按照设定规则，选择最优结果作为最终得到的结果。该规则可以根据实际情况设定，以总差异值为例，则设定规则是在全部总差异值中选择最小值作为最终得到的结果，或者对全部总差异值进行逻辑反转时，设定规则是在全部相似度值中选择最大值作为最终得到的结果。

由于待测音频帧的个数以及标准音频帧的个数远远大于时移限值对应的最大移动次数，即使时移后可能会导致部分待测音频帧的频域能量值或者标准音频帧的频域能量值没有对应的比对对象，仍然不会对比对结果造成很大的影响，可以忽略不计。

需要说明的是，上述示例并不限定具体的左右时移顺序。

方案二、按照第二设定时间间隔，对多个标准音频帧的频域能量值进行时移处理，并将多个待测音频帧的频域能量值分别与每次时移后的对应的标准音频帧的频域能量值进行比对，直到达到时移限值为止；在与每次时移对应的比对结果中选择最优结果作为最终的比对结果。

其中，第二设定时间间隔与标准音频信号的采样频率以及待测音频帧大小有关。该方案的具体实现方法与方案一类似，在此不做赘述。

下面举例说明本实施例提供的音频检测的方法：

图2g为音频检测系统的示意图。参考图2g，该音频检测系统具体包括：待测设备21、标准设备22、音频检测设备(测试设备)23。其中，待测设备21和标准设备22同与音频检测设备23连接，并向音频检测设备23同时传输相同的音频信号。标准设备22输出的音频信号称为标准音频信号，待测设备21输出的音频信号称为待测音频信号。

进一步的，参考图2h，其为音频检测设备23音频信号处理流程示意图。从图2h可知，对待测音频信号和标准音频信号的音频采集过程是独立进行的，并在采集后，进行音频比对处理，得到音频相似度，以实现根据音频相似度确定待测设备21的音频信号输出功能是否正常。其中，音频检测设备23采集待测音频信号和标准音频信号的采样率均为48KHz，每个采样点均为16位数据，且采样时长均为5s。其中，图2i为采样得到的待测音频信号时域波形图。在待测设备21的音频信号输出功能正常的情况下，采样得到的标准音频信号与待测音频信号应该是高度相似的。

得到待测音频信号和标准音频信号后，进行音频比对处理。其中，图2j为音频比对处理的流程示意图。参考图2j，在音频比对处理过程中，首先，分别将待测音频信号和标准音频信号分割成帧，并分别进行帧内傅里叶变换以及频域能量值计算，上述过程也可以称之为比对前期处理。确定待测音频信号的音频能量值和标准音频信号的频域能量值后，进行具体的比对处理。

以待测音频信号为例对比对前提处理过程进行具体说明。图2k为比对前期处理示意图，参考图2k，S(1)、S(2)、S(3)、……为采样得到的待测音频信号的原始数据，其中，S(m)代表一个采样点的数据，m＝1、2、3、……。将待测音频信号分割成帧，得到至少一个待测音频帧，且每个待测音频帧中均包括256个采样点，此时，第一个待测音频帧包括数据S(1)-S(256)、第二个待测音频帧包括数据S(257)-S(512)、第三个待测音频帧包括数据S(513)-S(768)，依次类推，直到全部采样数据均分帧完毕。得到的待测音频帧可以称为待测音频帧时域向量，用V(n)表示第n个待测音频帧，其中，n＝1、2、……。进一步的，对每个待测音频帧进行傅里叶变换，得到频域待测音频帧，也可以称为待测音频帧频域向量，用F(n)表示V(n)傅里叶变换后的结果，其中，图2l为待测音频信号的频时域向量示意图，从图2l可以得到待测音频信号的时域特性以及频域特性。对F(n)中的数据进行求模平方计算，即通过计算|F(n)|²得到待测音频信号的频域能量值，也可以称为音频帧频域能量向量，用E₁(n)表示F(n)的频域能量值，图2m为待测音频信号的频域能量值示意图。对标准音频信号进行同样的处理，并用E₂(n)表示标准音频信号的频域能量值。

进一步的，得到E₁(n)和E₂(n)后，E₁(n)和E₂(n)均是按照采样时间顺序排列的。对E₁(n)进行时移，其中，时移限值为1.65s。每次E₁(n)时移一个帧后，判断是否到达时移限值，如果到达时移限值，则统计最小的总差异值，以确定最终的总差异值以及对应时移时间。如果没有达到时移限值，则计算该次时移的总能量差异值。具体为将时移后的E₁(n)和E₂(n)进行作差计算并取绝对值，累加得到总能量差异值DIFF。进一步的，计算E₁(n)和E₂(n)的总能量值，并根据总能量差异值和总能量值进行归一化处理，得到该次时移的总差异值diff。之后，再次对E₁(n)进行时移，并判断是否到达时移限值。其中，以对E₁(n)时移零个帧长为例，则

进一步的，到达时移限值后，将全部得到的diff均进行逻辑反转，得到相似度值S，即S＝1-diff。进一步的，图2n为相似度值曲线示意图，其体现了每次时移后得到的相似度值。根据图2n可知，在时移65个帧长度时，相似度值最大，约为92.64％，即确定最终的总差异值为0.0736,以及相似度值为92.64％。确定对应的时移时间为65×256/48000≈0.3467s。

进一步的，设定相似阈值为90％，那么可以确定92.64％大于90％，进而可以得到待测设备21的音频信号输出功能这样，且待测设备21和标准设备22同时传输相同音频信号的时间差为0.3467s。

实施例三

图3为本发明实施例三提供的一种音频检测的装置的结构示意图。参考图3，该音频检测的装置具体包括：获取模块301、计算模块302以及比对模块303。

其中，获取模块301，用于获取待测设备输出的待测音频信号；计算模块302，用于计算待测音频信号的频域能量值；比对模块303，用于将待测音频信号的频域能量值与标准音频信号的频域能量值进行比对，并根据比对结果确定待测设备的音频信号输出功能是否正常。

在上述实施例的基础上，计算模块302包括：分帧单元，用于将待测音频信号分割成多个待测音频帧，待测音频帧的大小与标准音频信号的标准音频帧的大小相等；能量计算单元，用于计算多个待测音频帧的频域能量值。

相应的，比对模块303具体用于：将多个待测音频帧的频域能量值分别与对应的标准音频帧的频域能量值进行比对，并根据比对结果确定待测设备的音频信号输出功能是否正常。

在上述实施例的基础上，能量计算单元包括：傅里叶变换子单元，用于分别对多个待测音频帧进行傅里叶变换，以得到多个频域待测音频帧；取值处理子单元，用于对多个频域待测音频帧中数据进行求模处理，并将求模结果进行平方计算，以得到各待测音频帧的频域能量值。

在上述实施例的基础上，比对模块303具体包括：作差单元，用于分别将每个待测音频帧的频域能量值与对应的标准音频帧的频域能量值进行作差计算；绝对值单元，用于对作差结果取绝对值，以得到每个待测音频帧对应的子能量差异值；结果确认单元，用于根据比对结果确定待测设备的音频信号输出功能是否正常。

在上述实施例的基础上，结果确认单元具体用于：累加每个子能量差异值，并对累加结果进行归一化处理得到总差异值，通过总差异值确定待测设备的音频信号输出功能是否正常。

在上述实施例的基础上，结果确认单元包括：累加子单元，用于累加每个子能量差异值，并对累加结果进行归一化处理得到总差异值；第一结果确认子单元，用于确定总差异值是否低于预设差异阈值，若低于，则确认待测设备的音频信号输出功能正常，否则，确认待测设备的音频信号输出功能异常；

或者，结果确认单元包括：累加子单元，用于累加每个子能量差异值，并对累加结果进行归一化处理得到总差异值；逻辑反转子单元，用于对总差异值进行逻辑反转，得到待测音频信号与标准音频信号的相似度值；第二结果确认子单元，用于确认相似度值是否高于预设相似阈值，若高于，则确认待测设备的音频信号输出功能正常，否则，确认待测设备的音频信号输出功能异常。

在上述实施例的基础上，比对模块303具体包括：第一时移单元，按照第一设定时间间隔，对多个待测音频帧的频域能量值进行时移处理，并将每次时移后的多个待测音频帧的频域能量值分别与对应的标准音频帧的频域能量值进行比对，直到达到时移限值为止；第一选择单元，用于按照设定规则，在与每次时移对应的比对结果中选择最优结果作为最终的比对结果；第一确认单元，用于根据比对结果确定待测设备的音频信号输出功能是否正常；

或者，比对模块303具体包括：第二时移单元，用于按照第二设定时间间隔，对多个标准音频帧的频域能量值进行时移处理，并将多个待测音频帧的频域能量值分别与每次时移后的对应的标准音频帧的频域能量值进行比对，直到达到时移限值为止；第二选择单元，用于在与每次时移对应的比对结果中选择最优结果作为最终的比对结果；第二确认单元，用于根据比对结果确定待测设备的音频信号输出功能是否正常。

上述提供的一种音频检测的装置可以执行上述任意实施例提供的音频检测的方法，具备相应的功能和有益效果。

实施例四

图4为本发明实施例四提供的一种音频检测的设备的结构示意图。如图4所示，该设备包括处理器40、存储装置41、输入装置42和输出装置43；设备中处理器40的数量可以是一个或多个，图4中以一个处理器40为例；设备中的处理器40、存储装置41、输入装置42和输出装置43可以通过总线或其他方式连接，图4中以通过总线连接为例。

存储装置41作为一种计算机可读存储介质，用于存储一个或多个程序，如本发明实施例中的音频检测的方法对应的程序指令/模块(例如，音频检测的装置中的获取模块301、计算模块302和比对模块303)。处理器40通过运行存储在存储装置41中的软件程序、指令以及模块，从而执行设备的各种功能应用以及数据处理，即实现上述的音频检测的方法。

存储装置41可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据设备的使用所创建的数据等。此外，存储装置41可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储装置41可进一步包括相对于处理器40远程设置的存储器，这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置42可用于接收输入的数字或字符信息，以及产生与设备的用户设置以及功能控制有关的键信号输入，如键盘或者鼠标等，输入装置42还用于接收待测设备以及标准设备输出的待测音频信号以及标准音频信号，并将接收的音频信号发送给处理器40，如音频接口。输出装置43可包括显示屏等显示设备。

本实施例提供的音频检测的设备可以用于执行上述任意实施例提供的音频检测的方法，具备相应的功能和有益效果。

实施例五

本发明实施例五还提供一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行一种音频检测的方法，该方法包括：

获取待测设备输出的待测音频信号；

计算待测音频信号的频域能量值；

将待测音频信号的频域能量值与标准音频信号的频域能量值进行比对，并根据比对结果确定待测设备的音频信号输出功能是否正常。

当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的音频检测的方法操作,还可以执行本发明任意实施例所提供的音频检测的方法中的相关操作。

通过以上关于实施方式的描述，所属领域的技术人员可以清楚地了解到，本发明可借助软件及必需的通用硬件来实现，当然也可以通过硬件实现，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述的音频检测的方法。

值得注意的是，上述音频检测的装置的实施例中，所包括的各个单元和模块只是按照功能逻辑进行划分的，但并不局限于上述的划分，只要能够实现相应的功能即可；另外，各功能单元的具体名称也只是为了便于相互区分，并不用于限制本发明的保护范围。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种音频检测的方法，其特征在于，包括：

获取待测设备输出的待测音频信号；

计算所述待测音频信号的频域能量值；

2.根据权利要求1所述的方法，其特征在于，所述计算所述待测音频信号的频域能量值包括：

将所述待测音频信号分割成多个待测音频帧，所述待测音频帧的大小与标准音频信号的标准音频帧的大小相等；

计算多个所述待测音频帧的频域能量值；

所述将所述待测音频信号的频域能量值与标准音频信号的频域能量值进行比对包括：

将多个所述待测音频帧的频域能量值分别与对应的标准音频帧的频域能量值进行比对。

3.根据权利要求2所述的方法，其特征在于，所述计算多个所述待测音频帧的频域能量值包括：

分别对多个所述待测音频帧进行傅里叶变换，以得到多个频域待测音频帧；

对多个所述频域待测音频帧中数据进行求模，并将求模结果进行平方计算，以得到各所述待测音频帧的频域能量值。

4.根据权利要求2所述的方法，其特征在于，所述将多个所述待测音频帧的频域能量值分别与对应的标准音频帧的频域能量值进行比对包括：

分别将每个所述待测音频帧的频域能量值与对应的标准音频帧的频域能量值进行作差计算；

对作差结果取绝对值，以得到每个所述待测音频帧对应的子能量差异值。

5.根据权利要求4所述的方法，其特征在于，所述根据比对结果确定所述待测设备的音频信号输出功能是否正常包括：

累加每个所述子能量差异值，并对累加结果进行归一化处理得到总差异值，通过所述总差异值确定所述待测设备的音频信号输出功能是否正常。

6.根据权利要求5所述的方法，其特征在于，所述通过所述总差异值确定所述待测设备的音频信号输出功能是否正常包括：

确定所述总差异值是否低于预设差异阈值，若低于，则确认所述待测设备的音频信号输出功能正常，否则，确认所述待测设备的音频信号输出功能异常；或者，

对所述总差异值进行逻辑反转，得到所述待测音频信号与标准音频信号的相似度值；

确认所述相似度值是否高于预设相似阈值，若高于，则确认所述待测设备的音频信号输出功能正常，否则，确认所述待测设备的音频信号输出功能异常。

7.根据权利要求2所述的方法，其特征在于，所述将多个所述待测音频帧的频域能量值分别与对应的标准音频帧的频域能量值进行比对包括：

按照第一设定时间间隔，对所述多个待测音频帧的频域能量值进行时移处理，并将每次时移后的多个所述待测音频帧的频域能量值分别与对应的标准音频帧的频域能量值进行比对，直到达到时移限值为止；或者，

按照第二设定时间间隔，对多个标准音频帧的频域能量值进行时移处理，并将多个所述待测音频帧的频域能量值分别与每次时移后的对应的标准音频帧的频域能量值进行比对，直到达到时移限值为止；

按照设定规则，在与每次时移对应的比对结果中选择最优结果作为最终的比对结果。

8.一种音频检测的装置，其特征在于，包括：

获取模块，用于获取待测设备输出的待测音频信号；

计算模块，用于计算所述待测音频信号的频域能量值；

9.一种音频检测的设备，其特征在于，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-7中任一所述的音频检测的方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-7中任一所述的音频检测的方法。