CN116055975A

CN116055975A - 一种基于心理声学的耳机质量的评估方法

Info

Publication number: CN116055975A
Application number: CN202211697149.0A
Authority: CN
Inventors: 胡耘博; 周学富; 胡中骥
Original assignee: Cosonic Intelligent Technologies Co Ltd
Current assignee: Cosonic Intelligent Technologies Co Ltd
Priority date: 2022-12-28
Filing date: 2022-12-28
Publication date: 2023-05-02

Abstract

本发明公开了一种基于心理声学的耳机质量的评估方法，包括S1：首先给定固定频率与幅值的正弦波激励信号输入耳机，得到测试信号；S2：通过将参考(刺激)信号和得到的测试(响应)信号作为输入，输入PEAQ模型，得到MOV变量；S3：通过先将move变量输入两层神经网络进行训练；S4：重复S1、S2步骤，再通过将MOV输入训练好的神经网络；S5：最终得到被测试的耳机的PDI值，通过选用步进扫频正弦波信号能够反映更真实的人耳的听力范围，进而使得对耳机的质量评估能够得到更加真实的测量数据，对音频信号进行了预处理，本发明中，大大降低了外部因素对耳机质量评估造成的影响，并最终根据PDI数值来评判被测量耳机的质量的好坏，使得测量评估精准。

Description

一种基于心理声学的耳机质量的评估方法

技术领域

本发明涉及耳机质量评估技术领域，具体是一种基于心理声学的耳机质量的评估方法。

背景技术

耳机行业近年来发展迅速，伴随着智能手机、平板电脑、笔记本电脑等数码产品在全球范围内的持续发展和电声产业的大规模国际转移，耳机产品在我国得到了快速发展。但是耳机产品会因为各种原因产生故障，机械和电子设备及产品发出的声音信号能够有效表征其运行状态，若出现故障音，则表明其产品存在故障或质量缺陷。

目前耳机相关产品的质量检测和故障诊断大多采用人工听诊的方法。人工听诊方法存在以下问题，因此，TWS耳机的音效测试在出厂检测中显得十分重要。在TWS耳机音频测试领域，通常是采用人工检测音效然而，这种人工检测的方式会存在以下问题：不同的检测人员对同一音频的判断标准不同；对于长时间才会出现的问题例如无声，卡顿，POP音，无法做到完全的检出；人工检测的识别不够精确，对于非常短时间的异常音无法检出。

为解决上述问题，申请公布号为CN115243183A的发明专利，一种音频检测方法、设备及存储介质，本申请的实施例还提供了一种音频检测方法，包括：接收耳机设备发出的音频信号；对所述音频信号进行数字转化得到待检测音频数据；对所述待检测音频数据的质量进行检测。

上述现有技术中通过接收耳机设备发出的音频信号，将耳机设备发出的音频信号进行数字转化得到待检测音频数据，对待检测音频数据的质量进行检测，实现音频检测自动化测试，提供了一种统一的音频检测方法，从而代替人工检测耳机设备播放的音频质量的方式，从而提高对耳机设备音频检测的精确度，然而，现有技术中对于测量音频信号数据的准确性有待提高，且如何更加精准的检测耳机的质量好坏有待进一步提高，基于此，我们提出一种基于心理声学的耳机质量的评估方法。

发明内容

本发明的目的在于提供一种基于心理声学的耳机质量的评估方法，以解决上述背景技术中提出的问题。

为实现上述目的，本发明提供如下技术方案：

一种基于心理声学的耳机质量的评估方法，其方法步骤如下：

S1：首先给定固定频率与幅值的正弦波激励信号输入耳机，得到测试信号；

S2：通过将参考(刺激)信号和得到的测试(响应)信号作为输入，输入PEAQ模型，得到MOV变量；

S3：通过先将move变量输入两层神经网络进行训练；

S4：重复S1、S2步骤，再通过将MOV输入训练好的神经网络；

S5：最终得到被测试的耳机的PDI值。

作为本发明进一步的方案：所述S1中，首先通过使用20K-20hz的步进扫频正弦波信号作为参考(刺激)信号输入耳机中，从而得到测试(响应)信号。

作为本发明再进一步的方案：所述S2中，通过使用音频信号相关的预处理方法，对测试信号进行预加重的处理来弥补高频的损耗，再通过使用维纳滤波器进行噪声的滤除来达到提高信噪比，进而使用短时能量以及短时过零率的方法判断音频信号的起止点，进而提取到有用的音频数据，通过使用国际电信联盟(ITU)为客观测量感知音频质量而制定的音频质量感知评估(PEAQ)的标准，使用所述S1中的参考(刺激)信号和测试(响应)信号作为输入；然后将输入信号输入PEAQ中基于快速傅立叶变换(FFT)的模型，通过快速傅立叶变换(FFT)的模型将几种心理声学机制的影响应用于信号，例如添加外耳和中耳频率响应、转换到基音域表示、添加与频率相关的内部噪声以及频域和时域扩展，扩展函数分别模拟了频谱听觉滤波器和前向掩蔽效应，最后生成描述参考信号和测试信号不同特性的模型输出变量(MOV)，此模型输出11个MOV，这些MOV被定义为测量不同的现象，包括调制的变化、失真的响度、带宽、可听失真的发生率、噪声与掩模比、失真的检测概率以及误差的谐波结构。

作为本发明再进一步的方案：所述S3中，通过将S2中得到的move变量输入神经网络中，再使用两层人工神经网络来将从音频测试中获得的感知失真等级与目标MOV测量值进行联系起来，以最小化的误差给定PDI值与相应MOV值集的网络预测输出之间的差值。

作为本发明再进一步的方案：所述S4中，首先给定固定频率与幅值的正弦波激励信号输入耳机，得到测试信号。

作为本发明再进一步的方案：所述S4中，再通过将参考(刺激)信号和得到的测试(响应)信号作为输入，输入PEAQ模型，得到MOV变量。

作为本发明再进一步的方案：所述S4中，通过将得到的MOV值输入训练好的神经网络中。

作为本发明再进一步的方案：所述S5中，最终得到被测试的耳机的PDI值(耳机质量指数)，从而确定被测试耳机的质量情况。

与现有技术相比，本发明的有益效果是：

1、本发明基于心理声学的耳机质量的评估方法中，通过选用步进扫频正弦波信号能够反映更真实的人耳的听力范围，进而使得对耳机的质量评估能够得到更加真实的测量数据，对音频信号进行了预处理，能够得到准确的音频信号数据，并通过使用维纳滤波器进行噪声的滤除来达到提高信噪比，使用短时能量以及短时过零率的方法判断音频信号的起止点，提取到有用的音频数据，达到提高检测准确率，解决了外部噪音对耳机质量评估准确度的影响，本发明中，大大降低了外部因素对耳机质量评估造成的影响，并最终根据PDI数值来评判被测量耳机的质量的好坏，使得测量评估精准，且对耳机的质量评估整体效率高。

附图说明

图1为基于心理声学的耳机质量的评估方法的流程示意图。

图2为基于心理声学的耳机质量的评估方法中MOV的输出示意图。

图3为基于心理声学的耳机质量的评估方法中神经网络的结构图。

图4为基于心理声学的耳机质量的评估方法中PDI所代表的值的示意图。

图5为基于心理声学的耳机质量的评估方法中测试的耳机的PDIs。

图6为基于心理声学的耳机质量的评估方法中测试的频率为100Hz时，三个信号的示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1～6，本发明实施例中，一种基于心理声学的耳机质量的评估方法，其方法步骤如下：

S3：通过先将move变量输入两层神经网络进行训练；

S4：重复S1、S2步骤，再通过将MOV输入训练好的神经网络；

S5：最终得到被测试的耳机的PDI值。

所述S1中，首先通过使用20K-20hz的步进扫频正弦波信号作为参考(刺激)信号输入耳机中，从而得到测试(响应)信号。

所述S2中，通过使用音频信号相关的预处理方法，对测试信号进行预加重的处理来弥补高频的损耗，再通过使用维纳滤波器进行噪声的滤除来达到提高信噪比，进而使用短时能量以及短时过零率的方法判断音频信号的起止点，进而提取到有用的音频数据，通过使用国际电信联盟(ITU)为客观测量感知音频质量而制定的音频质量感知评估(PEAQ)的标准，使用所述S1中的参考(刺激)信号和测试(响应)信号作为输入；然后将输入信号输入PEAQ中基于快速傅立叶变换(FFT)的模型，通过快速傅立叶变换(FFT)的模型将几种心理声学机制的影响应用于信号，例如添加外耳和中耳频率响应、转换到基音域表示、添加与频率相关的内部噪声以及频域和时域扩展，扩展函数分别模拟了频谱听觉滤波器和前向掩蔽效应，最后生成描述参考信号和测试信号不同特性的模型输出变量(MOV)，此模型输出11个MOV，这些MOV被定义为测量不同的现象，包括调制的变化、失真的响度、带宽、可听失真的发生率、噪声与掩模比、失真的检测概率以及误差的谐波结构，其流程如图2所示。

所述S3中，通过将S2中得到的move变量输入神经网络中，再使用两层人工神经网络来将从音频测试中获得的感知失真等级与目标MOV测量值进行联系起来，以最小化的误差给定PDI值与相应MOV值集的网络预测输出之间的差值，如图3所示，通过调整其中的权重w_x[i,j]和w_y[j]，实现将误差降至最低。

所述S4中，重复所述S1和S2的步骤，首先给定固定频率与幅值的正弦波激励信号输入耳机，得到测试信号。

所述S4中，再通过将参考(刺激)信号和得到的测试(响应)信号作为输入，输入PEAQ模型，得到MOV变量。

所述S4中，通过将得到的MOV值输入训练好的神经网络中。

所述S5中，最终得到被测试的耳机的PDI值(耳机质量指数)，从而确定被测试耳机的质量情况。

实施例：

通过测试获得测试耳机的PDIs数据，对不同的f1和对应L1进行测试,通过对f1为100、200、500、1k及L1为75、85、95时进行了测试。

①：当f1为100、L1为75时，获得测试耳机的PDI值为1.5；

当f1为200、L1为75时，获得测试耳机的PDI值为1.25；

当f1为500、L1为75时，获得测试耳机的PDI值为1.25；

当f1为1k、L1为75时，获得测试耳机的PDI值为1.25；

②：当f1为100、L1为85时，获得测试耳机的PDI值为2.25；

当f1为200、L1为85时，获得测试耳机的PDI值为1.5；

当f1为500、L1为85时，获得测试耳机的PDI值为1.25；

当f1为1k、L1为85时，获得测试耳机的PDI值为1.5；

③：当f1为100、L1为95时，获得测试耳机的PDI值为4.5；

当f1为200、L1为95时，获得测试耳机的PDI值为2；

当f1为500、L1为95时，获得测试耳机的PDI值为1.5；

当f1为1k、L1为95时，获得测试耳机的PDI值为2；

其中：当获得测试耳机的PDI值在1附近时，为良好-无明显失真；当获得测试耳机的PDI值在2附近时，为良好-信号没有那么清清晰；当获得测试耳机的PDI值在3附近时，为能感知到失真-以音高变化的形式；当获得测试耳机的PDI值在4附近时，为令人反感的失真-感知到多个音调的存在；当获得测试耳机的PDI值在5附近时，为严重失真-例如存在摩擦和嗡嗡声，通过多组测试，更好的了解耳机测试的不同表现。

尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于心理声学的耳机质量的评估方法，其特征在于：其方法步骤如下：

S3：通过先将move变量输入两层神经网络进行训练；

S4：重复S1、S2步骤，再通过将MOV输入训练好的神经网络；

S5：最终得到被测试的耳机的PDI值。

2.根据权利要求1所述的基于心理声学的耳机质量的评估方法，其特征在于：所述S1中，首先通过使用20K-20hz的步进扫频正弦波信号作为参考(刺激)信号输入耳机中，从而得到测试(响应)信号。

3.根据权利要求1所述的基于心理声学的耳机质量的评估方法，其特征在于：所述S2中，通过使用音频信号相关的预处理方法，对测试信号进行预加重的处理来弥补高频的损耗，再通过使用维纳滤波器进行噪声的滤除来达到提高信噪比，进而使用短时能量以及短时过零率的方法判断音频信号的起止点，进而提取到有用的音频数据，通过使用国际电信联盟(ITU)为客观测量感知音频质量而制定的音频质量感知评估(PEAQ)的标准，使用所述S1中的参考(刺激)信号和测试(响应)信号作为输入；然后将输入信号输入PEAQ中基于快速傅立叶变换(FFT)的模型，通过快速傅立叶变换(FFT)的模型将几种心理声学机制的影响应用于信号，例如添加外耳和中耳频率响应、转换到基音域表示、添加与频率相关的内部噪声以及频域和时域扩展，扩展函数分别模拟了频谱听觉滤波器和前向掩蔽效应，最后生成描述参考信号和测试信号不同特性的模型输出变量(MOV)，此模型输出11个MOV，这些MOV被定义为测量不同的现象，包括调制的变化、失真的响度、带宽、可听失真的发生率、噪声与掩模比、失真的检测概率以及误差的谐波结构。

4.根据权利要求1所述的基于心理声学的耳机质量的评估方法，其特征在于：所述S3中，通过将S2中得到的move变量输入神经网络中，再使用两层人工神经网络来将从音频测试中获得的感知失真等级与目标MOV测量值进行联系起来，以最小化的误差给定PDI值与相应MOV值集的网络预测输出之间的差值。

5.根据权利要求1所述的基于心理声学的耳机质量的评估方法，其特征在于：所述S4中，首先给定固定频率与幅值的正弦波激励信号输入耳机，得到测试信号。

6.根据权利要求1所述的基于心理声学的耳机质量的评估方法，其特征在于：所述S4中，再通过将参考(刺激)信号和得到的测试(响应)信号作为输入，输入PEAQ模型，得到MOV变量。

7.根据权利要求1所述的基于心理声学的耳机质量的评估方法，其特征在于：所述S4中，通过将得到的MOV值输入训练好的神经网络中。

8.根据权利要求1所述的基于心理声学的耳机质量的评估方法，其特征在于：所述S5中，最终得到被测试的耳机的PDI值(耳机质量指数)，从而确定被测试耳机的质量情况。