CN115424636B

CN115424636B - 一种基于语音传输指数的音质测量方法及装置

Info

Publication number: CN115424636B
Application number: CN202211373363.0A
Authority: CN
Inventors: 黄海婵; 陈送阳; 郑建辉
Original assignee: Guangzhou Soundbox Acoustic Tech Co ltd
Current assignee: Guangzhou Soundbox Acoustic Tech Co ltd
Priority date: 2022-11-04
Filing date: 2022-11-04
Publication date: 2023-02-03
Anticipated expiration: 2042-11-04
Also published as: CN115424636A

Abstract

本申请公开了一种基于语音传输指数的音质测量方法及装置，其方法包括：爆破气球，爆破气球，采集房间的回声，转化为脉冲信号；绘制声压频谱图；计算各倍频程带宽的中心频率的声压频谱值；对声压频谱曲线进行线性拟合；计算各倍频程带宽的中心频率相对应的混响时间；计算各混响时间的各调制频率的调制传递函数值；计算各调制频率对应的表观信噪比；计算调制频率传输指数；计算所有调制频率的平均调制频率传输指数；对所有混响时间的平均传输指数值计权，得到男声的语音传输指数和女声的语音传输指数；计算平均值测量音质。本申请将爆破气球声为测试音，线性拟合计算混响时间，无需复杂的滤波计算，减小测量音质过程的计算量。

Description

一种基于语音传输指数的音质测量方法及装置

技术领域

本申请涉及室内音质测量技术领域，尤其是涉及一种基于语音传输指数的音质测量方法及装置。

背景技术

语音传输指数是被广泛接受和使用的房间音质客观评价参量，使用室内声学理论来进行测量与计算。具体的，语音传输指数是衡量语音传输质量的一个指标，该指数可以较为全面的反映混响时间信噪比和回声等对语言清晰度的影响，并且考虑了系统失真，心理声学效果（掩蔽效应）等因素。语音传输指数的值的范围为0-1，值越大说明清晰度越好。

语音传输指数与一些较为公认的传统音质客观评价参量如混响时间、背景噪声、明晰度等相比，除了能综合考虑混响时间、信噪比的影响外，混响衰变的细节、房间反射声序列的分布等也可考虑，并与言语可懂度的主观感受直接对应，有着传统音质评价参量所不具备的优势。

现有的一种房间音质测量方法需要使用扩声音箱、麦克风、音频主机，音频主机采用改进的语言传输间接法测量语音传输指数，并根据语言传输指数值对室内音质进行测量。该方法需要扩声音箱播放测试声音，并在房间的多个位置布置麦克风采集测试声音，将测试声音转化为测试信号，传输给音频主机，并计算房间的语音传输指数，再根据该语音传输指数对室内的音质进行测量。但是，该方法由于采集的声音是人的语音，需要测试者对采集到的语音信号进行语音活动检测，将语音分为有话段和无话段，并将有话段和无话段的语音信号通过倍频程滤波器进行滤波，才能计算不同倍频程中心频率的调制传递函数，进而计算语音传输指数和测量音质；滤波过程的计算复杂，会导致测量音质过程计算量大的问题。

发明内容

为此，本申请的实施例提供了一种基于语音传输指数的音质测量方法，能够解决现有的房间音质测量方法滤波过程的计算复杂，导致测量音质过程计算量大的问题，具体技术方案内容如下：

第一方面，本申请提供一种基于语音传输指数的音质测量方法，包括：

爆破气球，设备采集气球爆破时房间的回声，将所述回声转化为脉冲信号；

根据所述脉冲信号绘制声压频谱图；

预设多个倍频程带宽，根据所述声压频谱图计算各倍频程带宽的中心频率的声压频谱值；根据所述声压频谱值绘制声压频谱曲线，对所述声压频谱曲线进行线性拟合，得到拟合直线；根据所述拟合直线的斜率，计算各倍频程带宽的中心频率相对应的混响时间；

预设多个调制频率，根据所述混响时间和所述调制频率，计算各混响时间的各调制频率的调制传递函数值；根据所述调制传递函数值，计算各调制频率对应的表观信噪比；根据所述表观信噪比，计算调制频率传输指数；根据所述调制频率传输指数，计算所有调制频率的平均调制频率传输指数；

预设多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子，根据预设的多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子，对所有混响时间的平均传输指数值进行计权，得到男声的语音传输指数和女声的语音传输指数；计算男声的语音传输指数和女声的语音传输指数的平均值；

根据所述平均值测量音质。

优选的，所述预设多个倍频程带宽，根据所述声压频谱图计算各倍频程带宽的中心频率的声压频谱值，包括：

根据预设的多个倍频程带宽，和各倍频程带宽的中心频率，计算各倍频程带宽的上限频率和下限频率；

根据各倍频程带宽的上限频率、下限频率和频率带宽，计算各倍频程中心频率的声压频谱值。

优选的，所述根据所述拟合直线的斜率，计算各倍频程带宽的中心频率相对应的混响时间，包括：

根据所述声压频谱曲线，得到气球爆破声稳定衰变的声音强度范围；

根据所述声音强度范围和拟合直线的斜率，计算得到各倍频程中心频率相对应的混响时间。

优选的，根据所述声压频谱曲线，得到气球爆破声稳定衰变的声音强度范围，包括：

所述气球爆破声稳定衰变的声音强度范围为，从气球爆破声的声音强度衰变5dB时的声音强度，到气球爆破声的声音强度衰变35dB时的声音强度。

优选的，所述根据所述声压频谱值绘制声压频谱曲线，对所述声压频谱曲线进行线性拟合，得到拟合直线，包括：

将所述拟合直线的表达式设为y=kx+b，其中y为气球爆破声的声音强度，x为气球爆破后的时间，k为拟合直线的斜率，b为拟合直线的截距；

预设多个测量时间点，根据所述声压频谱曲线得到各测量时间点对应的气球爆破声的声音强度；将各测量时间点代入x，将各测量时间点对应的气球爆破声的声音强度代入y，得到所述拟合直线。

优选的，根据所述拟合直线的斜率，计算各倍频程带宽的中心频率相对应的混响时间，包括：

所述拟合直线的斜率的计算公式如下：

其中，k为拟合直线的斜率，n为预设的测量时间点的数量，x_i为第i个测量时间点的时间值，y_i为第i个测量时间点对应的气球爆破声的声音强度，i的取值为从1到n的所有整数。

优选的，所述根据预设的多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子，对所有混响时间的平均传输指数值进行计权，得到男声的语音传输指数和女声的语音传输指数，包括：

男声的语音传输指数和女声的语音传输指数计算公式如下：

当计算男声的语音传输指数时，STI_男女为男声的语音传输指数，当计算女声的语音传输指数时，STI_男女为女声的语音传输指数；

MTI _k为平均调制频率传输指数，k为倍频程中心频率；

当计算男声的语音传输指数时，α_k为男声权重因子，β_k为男声冗余因子；当计算女声的语音传输指数时，α_k为女声权重因子，β_k为女声冗余因子。

优选的，根据所述平均值测量音质，包括：

预设5个音质等级，分别为：不能接受、较差、良好、优秀、非常好，根据所述平均值的范围确定对应的音质等级；

平均值范围在0-0.3时，对应的音质等级为不能接受；

平均值范围在0.3-0.45时，对应的音质等级为较差；

平均值范围在0.45-0.6时，对应的音质等级为良好；

平均值范围在0.6-0.75时，对应的音质等级为优秀；

平均值范围在0.75-1时，对应的音质等级为非常好。

优选的，所述预设多个调制频率，根据所述混响时间和所述调制频率，计算各混响时间的各调制频率的调制传递函数值，包括：

调制传递函数值的计算公式如下：

其中

为倍频程中心频率为k，调制频率为f_m的调制传递函数值，T为混响时间，f_m为调制频率。

优选的，根据所述调制传递函数值，计算各调制频率对应的表观信噪比，包括：

表观信噪比的计算公式如下：

其中

为倍频程中心频率为k，调制频率为f_m的表观信噪比。

对所述表观信噪比进行限制，当所述表观信噪比大于15dB时记为15dB，小于-15dB时记为-15dB。

优选的，根据所述表观信噪比，计算调制频率传输指数，包括：

调制频率传输指数的计算公式如下：

其中

为倍频程中心频率为k，调制频率为f_m的调制频率传输指数

为倍频程中心频率为k，调制频率为f_m的表观信噪比。

第二方面，本申请还提供一种基于语音传输指数的音质测量装置，包括：

采集模块，用于爆破气球，设备采集气球爆破时房间的回声，将所述回声转化为脉冲信号；根据所述脉冲信号绘制声压频谱图；

混响时间测量模块，用于预设多个倍频程带宽，根据所述声压频谱图计算各倍频程带宽的中心频率的声压频谱值；根据所述声压频谱值绘制声压频谱曲线，对所述声压频谱曲线进行线性拟合，得到拟合直线；根据所述拟合直线的斜率，计算各倍频程带宽的中心频率相对应的混响时间；

语音传输指数测量模块，用于预设多个调制频率，根据所述混响时间和所述调制频率，计算各混响时间的各调制频率的调制传递函数值；根据所述调制传递函数值，计算各调制频率对应的表观信噪比；根据所述表观信噪比，计算调制频率传输指数；根据所述调制频率传输指数，计算所有调制频率的平均调制频率传输指数；

音质测量模块，用于根据所述平均值测量音质。

第三方面，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质包括存储的程序，其中，在所述程序运行时控制所述计算机可读存储介质所在设备执行基于语音传输指数的音质测量方法。

第四方面，本申请还提供一种电子设备，包括：处理器和存储器，所述处理器用于运行所述存储器中存储的程序，其中，所述程序运行时执行基于语音传输指数的音质测量方法。

综上所述，与现有技术相比，本申请实施例提供的技术方案带来的有益效果至少包括：

爆破气球，设备采集气球爆破时房间的回声，将所述回声转化为脉冲信号；根据所述脉冲信号绘制声压频谱图；预设多个倍频程带宽，根据所述声压频谱图计算各倍频程带宽的中心频率的声压频谱值；根据所述声压频谱值绘制声压频谱曲线，对所述声压频谱曲线进行线性拟合，得到拟合直线；根据所述拟合直线的斜率，计算各倍频程带宽的中心频率相对应的混响时间；预设多个调制频率，根据所述混响时间和所述调制频率，计算各混响时间的各调制频率的调制传递函数值；再根据调制传递函数值计算语音传输指数，并测量音质。

由于设备采集的是气球爆破的回声，声音较为纯净，同时采用了拟合直线的方法直接计算各倍频程带宽的中心频率相对应的混响时间，再根据混响时间计算调制传递函数值，不用再对声压频谱曲线进行复杂的滤波计算才得到有效的信号，简化了调制传递函数值的计算过程，进而减少了计算语音传输指数和测量音质过程的计算量。

附图说明

图1是本申请一实施例提供的一种基于语音传输指数的音质测量方法的流程图；

图2是本申请一实施例提供的一种基于语音传输指数的音质测量方法的混响时间计算示意图；

图3是本申请一实施例提供的一种基于语音传输指数的音质测量方法的检测底噪操作示意图；

图4是本申请一实施例提供的一种基于语音传输指数的音质测量方法的检测底噪操作另一示意图；

图5是本申请一实施例提供的一种基于语音传输指数的音质测量方法的检测混响时间操作示意图；

图6是本申请一实施例提供的一种基于语音传输指数的音质测量方法的检测混响时间操作另一示意图；

图7是本申请一实施例提供的一种基于语音传输指数的音质测量方法的语音传输指数计算操作示意图；

图8是本申请一实施例提供的一种基于语音传输指数的音质测量方法的音质测量报告图；

图9是本申请一实施例提供的一种基于语音传输指数的音质测量装置的结构框图；

图10是本申请一实施例提供的一种电子设备结构框图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

下面结合说明书附图对本申请实施例作进一步详细描述。

本申请一实施例提供了一种基于语音传输指数的音质测量方法，如图1所示：

S01:爆破气球，设备采集气球爆破时房间的回声，将所述回声转化为脉冲信号，绘制声压频谱图;

具体的，采集气球爆破时房间内回声的脉冲，可以使用带有传声器的电子设备，所述电子设备可以为手机等常用的具有采集声音，储存运算功能的设备。将手机放置在房间内听众较多的区域，距地面1.2m高处；气球爆破位置靠房间的角落，与手机的距离在1.5m以上。手机采集回声的脉冲后，将采集到的脉冲转化为脉冲信号，并对所述脉冲信号进行快速傅里叶变换运算，得到所述脉冲信号的声压信号，然后根据声压信号在手机的处理器生成声压频谱图。

S02：预设多个倍频程带宽，根据所述声压频谱图计算各倍频程带宽的中心频率的声压频谱值；根据所述声压频谱值绘制声压频谱曲线，对所述声压频谱曲线进行线性拟合，得到拟合直线；根据所述拟合直线的斜率，计算各倍频程带宽的中心频率相对应的混响时间；

具体的，预设的多个倍频程带宽可以是频率带宽为89Hz，倍频程中心频率为125Hz，上限频率为177Hz，下限频率为88Hz；频率带宽为178Hz，倍频程中心频率为250Hz，上限频率为355Hz，下限频率为177Hz；频率带宽为355Hz，倍频程中心频率为500Hz，上限频率为710Hz，下限频率为355Hz；频率带宽为710Hz，倍频程中心频率为1000Hz，上限频率为1420Hz，下限频率为710Hz；频率带宽为1420Hz，倍频程中心频率为2000Hz，上限频率为2840Hz，下限频率为1420Hz；频率带宽为2840Hz，倍频程中心频率为4000Hz，上限频率为5680Hz，下限频率为2840Hz；频率带宽为5680Hz，倍频程中心频率为8000Hz，上限频率为11360Hz、下限频率为5680Hz。

可以将拟合直线的表达式设为y=kx+b，其中y为气球爆破声的声音强度，x为气球爆破后的时间，k为拟合直线的斜率，b为拟合直线的截距；

预设多个测量时间点，时间测量点可以根据测量设备的计算能力尽可能多的设置，因为通过设置更多的时间测量点可以得到更多的拟合直线时需要的坐标点，进而对声压频谱曲线进行更准确的线性拟合。预设好测量时间点后，根据声压频谱曲线得到各测量时间点对应的气球爆破声的声音强度；将各测量时间点代入x，将各测量时间点对应的气球爆破声的声音强度代入y，得到拟合直线。

根据拟合直线的斜率，计算各倍频程带宽的中心频率相对应的混响时间，具体的：

可以使用如下的计算公式来计算拟合直线的斜率：

混响时间的计算可以根据所述声压频谱曲线，得到气球爆破声稳定衰变的声音强度范围；根据所述声音强度范围和拟合直线的斜率，计算得到各倍频程中心频率相对应的混响时间。

如图2所示，气球爆破声稳定衰变的声音强度范围为，从气球爆破声的声音强度衰变5dB时的声音强度，到气球爆破声的声音强度衰变35dB时的声音强度。将这一段时间的长度乘以2，就可以计算出各倍频程中心频率相对应的混响时间。

现有技术通过测量衰变60dB的时间来作为混响时间，但是由于背景噪声的影响，衰变60dB的时间难以准确的测量。因此，采用气球爆破声的声音强度衰变5dB的时间，到气球爆破声的声音强度衰变35dB的时间乘以2，以此结果作为替代计算衰变60dB时的混响时间，可以减少背景噪声对混响时间测量的影响。选择从衰变5dB的时间开始，可以减少声音开始衰变之后的前端不稳定信号，使计算出的混响时间更准确。

如图3，图4，图5，图6所示，本实施例提供了基于以上的测量混响时间的方法的操作示意图，主要包括：选择检测时间为20s，然后检测类型选择脉冲，之后测量混响时间前自动检测底噪，以防止由于底噪过大造成测量混响时间不准确的问题。底噪测量完成后开始测量混响时间。经过一段时间后即可得到结果。

S03：预设多个调制频率，根据所述混响时间和所述调制频率，计算各混响时间的各调制频率的调制传递函数值；根据所述调制传递函数值，计算各调制频率对应的表观信噪比；根据所述表观信噪比，计算调制频率传输指数，并计算所有调制频率传输指数的平均值，作为平均调制频率传输指数。

具体的，可以将调制频率f_m的数量设置为14个,分别是0.63Hz、0.8Hz、1Hz、1.25Hz、1.6Hz、2Hz、2.5Hz、3.15Hz、4Hz、5Hz、6.3Hz、8Hz、10Hz、12.5Hz，并且使用如下的调制传递函数值的计算公式：

其中

为倍频程中心频率为k，调制频率为f_m的调制传递函数值，T为混响时间，f_m为调制频率。通过设置数量和间距都比较合适的调制频率，可以在较为准确的计算调制传递函数值的同时，保证运算的效率。

根据调制传递函数值，计算各调制频率对应的表观信噪比，可以采用如下的计算公式：

其中

为倍频程中心频率为k，调制频率为f_m的表观信噪比。

根据相关标准，需要对计算出的表观信噪比进行限制，当所述表观信噪比大于15dB时记为15dB，小于-15dB时记为-15dB。

根据所述表观信噪比，计算调制频率传输指数，可以使用如下的计算公式：

其中

为倍频程中心频率为k，调制频率为f_m的调制频率传输指数

为倍频程中心频率为k，调制频率为f_m的表观信噪比。

S04：预设多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子，根据预设的多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子，对所有混响时间的平均传输指数值进行计权，得到男声的语音传输指数和女声的语音传输指数；计算所述男声的语音传输指数和所述女声的语音传输指数的平均值；

具体的，男声和女声的语音传输指数测量可以采用如下的计算公式：

MTI _k为平均调制频率传输指数，k为倍频程中心频率；

男声权重因子，男声冗余因子，女声权重因子和女声冗余因子的数值，如表1所示：

表1

表1中的权重因子和冗余因子的设置参考了现有的国家标准，具体含义指的是各倍频带对语音传输指数的相对贡献。男声和女声的语音传输指数计算公式参考现行国家标准，在此基础上，考虑了各倍频带对语音传输指数的相对贡献和两相邻倍频带对言语可懂度有贡献信息的重叠部分比例，使计算出的语音传输指数更能准确反映言语可懂度。

如图7所示，基于以上测量语音传输指数的方法，本实施例还提供了一种测量语音传输指数的操作示意图，根据设定好的检测时间为20s，检测类型为脉冲，得到传输指数的测量结果后，可以查看详情或导出音质的评价报告，也可以取消后再次测量。

S05：根据所述平均值测量音质。

具体的，根据平均值测量音质，可以根据表2进行：

表2

表2中的范围指的是男声和女声的语音传输指数的平均值，通过该平均值所在的评价范围，对音质进行测量，可以更好的反映音质的不同级别。

如图8所示，音质测量的结果可以生成音质测量报告，报告包括检测项目，检测设备，检测地点，检测时间，检测时长，检测标准，环境噪声等测量音质的相关信息。报告中检测结果部分的内容，包括各倍频程中心频率相对应的混响时间，混响时间均值，男声和女声的语音传输指数的平均值，以及通过该平均值所在的范围得到的检测结论，以及各倍频程中心频率相对应的混响时间的曲线图。

本实施例提供的技术方案带来的有益效果至少包括：

此外，本实施例提供的技术方案带来的有益效果还包括，减少背景噪声和声音开始衰变之后的前端不稳定信号对混响时间测量的影响，计算出的混响时间更准确；优化设计语音传输指数计算方式，使其更能准确反映言语可懂度；测量音质按等级划分，更好的反映音质的不同级别。

本申请一实施例还提供一种基于语音传输指数的音质测量装置，如图9所示，包括：

采集模块，用于爆破气球，设备采集气球爆破时房间内的脉冲，将所述脉冲转化为脉冲信号；根据所述脉冲信号绘制声压频谱图；

语音传输指数测量模块；

音质测量模块，用于根据所述平均值测量音质。

其中，语音传输指数测量模块还包括调制频率传输指数计算单元，用于预设多个调制频率，根据所述混响时间和所述调制频率，计算各混响时间的各调制频率的调制传递函数值；根据所述调制传递函数值，计算各调制频率对应的表观信噪比；根据所述表观信噪比，计算调制频率传输指数；根据所述调制频率传输指数，计算所有调制频率的平均调制频率传输指数；

男女声语音传输指数计算单元，用于预设多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子，根据预设的多个男声权重因子、多个男声冗余因子、多个女声权重因子和多个女声冗余因子，对所有混响时间的平均传输指数值进行计权，得到男声的语音传输指数和女声的语音传输指数；计算男声的语音传输指数和女声的语音传输指数的平均值。

在本申请一实施例中，提供了一种电子设备，如图10所示，该电子设备包通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中，存储器包括非易失性存储介质和内存储器。该电子设备的非易失性存储介质存储有操作系统，还可存储有计算机程序，该计算机程序被处理器执行时，可使得处理器实现基于语音传输指数的音质测量方法。该内存储器中也可储存有计算机程序，该计算机程序被处理器执行时，可使得处理器执行基于语音传输指数的音质测量方法。本领域技术人员可以理解，图10中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的电子设备的限定，具体的电子设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在本申请一个实施例中，提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令用于使计算机执行上述基于语音传输指数的音质测量方法的步骤。此处基于语音传输指数的音质测量方法的步骤可以是上述各个实施例的基于语音传输指数的音质测量方法中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。

其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random AccessMemory，RAM)等。

以上所述是本申请的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也视为本申请的保护范围。