CN109697990B

CN109697990B - 一种基于虚拟低音算法主观评价的客观评价方法

Info

Publication number: CN109697990B
Application number: CN201811341603.2A
Authority: CN
Inventors: 王旻; 林志斌; 刘晓峻; 狄敏
Original assignee: Jiangsu Province Nanjing University Of Science And Technology Electronic Information Technology Co ltd; Nanjing Nanda Electronic Wisdom Service Robot Research Institute Co ltd; Nanjing University
Current assignee: Jiangsu Province Nanjing University Of Science And Technology Electronic Information Technology Co ltd; Nanjing Nanda Electronic Wisdom Service Robot Research Institute Co ltd; Nanjing University
Priority date: 2018-11-12
Filing date: 2018-11-12
Publication date: 2020-12-11
Anticipated expiration: 2038-11-12
Also published as: CN109697990A

Abstract

本发明公开了一种基于虚拟低音算法主观评价的客观评价方法，将语义细分法和系统范畴法这两种常用的主观评价方法进行了结合，利用多元线性回归分析在PEAQ中BV版本的11个模型输出参量MOVs以及PEAQ的两个输出值ODG、DI和音频频谱重心ASC基础上提出。本发明性能好，能准确地评价虚拟低音算法效果的好坏。

Description

一种基于虚拟低音算法主观评价的客观评价方法

技术领域

本发明涉及一种低音主观评价的客观评价方法，属于音频处理技术领域。

背景技术

随着科技的快速发展与客户需求的不断提高，为了追求更好的视觉享受，音视频设备变得越来越薄，屏占比越来越高，留给扬声器的空间越来越小。受到体积尺寸的影响，小型设备中无法放置尺寸过大的扬声器。口径较小的扬声器通常其谐振频率较高，低频重放能力差。消费者对高品质音乐的追求和小扬声器低音表现力差的矛盾成为了急需改进的问题。

对于该问题，目前多采用均衡器的方法来解决。但简单地通过均衡器提高低频能量容易产生信号畸变，并且会降低扬声器的使用寿命。而利用虚拟低音增强技术实现的低音增强，则避免了上述问题。

虚拟低音技术是利用“虚拟音调”现象实现的。对于一段包含谐波的音频，其基频部分决定了该信号的音调。当将谐波信号中的基频信号除去后，余下谐波分量叠加的信号给人的感受还是之前的音调，只是音色会有变化。虚拟低音技术逆向应用了这个现象，用谐波的组合有效的代替基频的听感，从而达到低音增强的效果。

由于音频音效最终的受众是消费者，所以主观评价才是音频音效算法效果的真实反映，也是最可靠的评价音频音效算法效果的方法。但主观评价方法耗费大量人力、物力和时间，因此采用客观评价方法来评价低音增强效果。

与较为完善的语音信号客观评价方法相比。宽带音频信号的客观评价方法发展的较晚，只是到了上个世纪七十年代末，一些针对可感知音频信号质量的客观评价方法才被陆续提出。在1998年，ITU-R综合了Disturbance Index(DIX)、Noise-to-Mask Ratio(NMR)、Perceptual Audio Quality Measure(PAQM)、PERCEVAL、Perceptual Objective Measure(POM)和The Toolbox Approach这6种方法，最终形成了ITU-R BS.1387(又被称为PEAQ：Perceptual Evaluation of Audio Quality)建议。PEAQ最终以客观差异等级ObjectiveDifference Grade(ODG)的形式进行输出。此外，音频频谱重心Audio Spectrum Centroid(ASC)也被常用来作为低音程度的客观评价参数，ASC是MPEG-7标准中的低级描述符之一，给出了音频材料对数频率功率谱的重心。

上述PEAQ和ASC客观评价方法的主客观皮尔逊相关性系数和双尾显著性见表1，表中括号内的数为双尾显著性。从表1中可以看出，目前传统的客观评价方法在单独对低音效果评分方面主客观性关系数普遍较低。

表1客观评价方法的主客观皮尔逊相关性系数和双尾显著性(括号内)

	ODG	ASC
			丰满度	-0.837(0.005)	0.596(0.090)
力度	-0.688(0.041)	0.357(0.346)

采用PEAQ中BV版本11个模型输出参量MOVs，以及由模型输出参数通过ANN映射得到的输出值DI(Distortion Index)和ODG，和音频频谱重心ASC组合的针对虚拟低音算法效果的客观评价方法。

发明内容

发明目的：本发明的目的在于利用现有的音频质量客观评价方法提出一种新的针对虚拟低音算法效果的客观评价方法，该方法性能好，能准确地评价虚拟低音算法效果的好坏。

技术方案：为实现上述目的，本发明采用的技术方案为：

一种基于虚拟低音算法主观评价的客观评价方法，包括以下步骤：

步骤1，计算以下14种客观评价参数的数值：PEAQ中BV版本11个模型输出参量MOVs：参考信号带宽(BandwidthRef)、测试信号带宽(BandwidthTest)、总信掩比(TotalNMR)、窗选平均调制差异(WinModDiff1)、平均调制差异1(AvgModDiff1)、平均调制差异2(AvgModDiff2)、平均噪声响度的均方根值(RmsNoiseLoud)、受干扰帧的相对分数(RelDistFrames)、检测到失真存在的最大滤波概率(MFPD)、总失真与总严重失真比的对数值(ADB)、误差谐波结构(EHS))、客观差异等级(ODG)、失真指数(DI)、音频频谱重心(ASC)；

步骤2，计算以下分值

C_R＝29.350-29.125ODG-0.001BandwidthRef (1)

C_S＝39.708-45.129ODG-114.626RmsNoiseLoud-23.646EHS+40.304ASC+17.560RelDistFrames (2)；

式中，C_R表示本发明中评价音频材料丰满度程度的客观评分，C_S表示本发明中评价音频材料力度程度的客观评分，其中的ODG、BandwidthRef、RmsNoiseLoud、EHS、ASC和RelDistFrames分别表示各自对应的客观评价参数算得的评分。

优选的：步骤2中的权重系数是由9组音频材料的客观评分分别与虚拟低音丰满度程度的主观评分、虚拟低音力度程度的主观评分使用SPSS中多元线性回归分析得到的。

优选的：音频材料均选取低频成分丰富的流行音乐，并且采用高质量WAV音源。

本发明相比现有技术，具有以下有益效果：

1、将语义细分法和系统范畴法这两种常用的主观评价方法进行了结合，设计出了一种适合本发明的新的主观评价方法。

2、客观评价方法利用多元线性回归分析在PEAQ中BV版本的11个模型输出参量MOVs以及PEAQ的两个输出值ODG、DI和音频频谱重心ASC基础上提出。

3、对于丰满度评分的主客观相关性系数达到0.920，对于力度评分的主客观相关性系数达到0.999，并且相关性显著，性能更好。

附图说明

图1为测试流程图。

具体实施方式

下面结合附图和具体实施例，进一步阐明本发明，应理解这些实例仅用于说明本发明而不用于限制本发明的范围，在阅读了本发明之后，本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。

一种基于虚拟低音算法主观评价的客观评价方法，如图1所示，包括以下步骤：

(1)计算以下14种客观评价参数的数值：PEAQ中BV版本11个模型输出参量MOVs(参考信号带宽(BandwidthRef)，测试信号带宽(BandwidthTest)，总信掩比(Total NMR)，窗选平均调制差异(WinModDiff1)，平均调制差异1(AvgModDiff1)，平均调制差异2(AvgModDiff2)，平均噪声响度的均方根值(RmsNoiseLoud)，受干扰帧的相对分数(RelDistFrames)，检测到失真存在的最大滤波概率(MFPD)，总失真与总严重失真比的对数值(ADB)，误差谐波结构(EHS))，客观差异等级(ODG)，失真指数(DI)，音频频谱重心(ASC)。

(2)计算以下本发明提出的分值

C_R＝29.350-29.125ODG-0.001BandwidthRef (1)

C_S＝39.708-45.129ODG-114.626RmsNoiseLoud-23.646EHS+40.304ASC+17.560RelDistFrames (2)

式中，C_R表示本发明中评价音频材料丰满度(Richness)程度的客观评分，C_S表示本发明中评价音频材料力度(Strength)程度的客观评分。其中的ODG、BandwidthRef、RmsNoiseLoud、EHS、ASC和RelDistFrames分别表示各自对应的客观评价参数算得的评分。

式中的权重系数是由9组音频材料的客观评分分别与虚拟低音丰满度程度的主观评分、虚拟低音力度程度的主观评分使用SPSS中多元线性回归分析得到的。具体如下：

音频材料均选取低频成分丰富的流行音乐，包含了人声(男声、女声)、鼓点、弦乐、钢琴等各种类型的音频材料，并且采用高质量WAV音源。主观听音试验的音频材料包含音频原音与不同程度的经过虚拟低音NLD算法处理后的音频材料。为了将低音听感更加形象化、具体化，通过文献调研，挑选出了两个与低音相关度最高的国际认可的主观参量的评价术语——丰满度和力度。请15位主观听音者对处理前后的共16个音频材料分别从丰满度和力度两方面进行评分。将语义细分法和系统范畴法这两种常用的主观评价方法进行了结合，设计出了一种适合本发明的新的主观评价方法，具体评分标准如下。

表2主观评分标准

本发明的主客观皮尔逊相关性系数和双尾显著性见表3，表中括号内的数为双尾显著性。

表3本发明的主客观皮尔逊相关性系数和双尾显著性(括号内)

下面以虚拟低音NLD(Nonlinear Devices)算法和包含了人声(男声、女声)、鼓点、弦乐、钢琴等各种类型的低频成分丰富的音频材料为例，对本发明的实施做详细说明。

本发明的测试流程图如上图1所示。将所选取的音频材料经过虚拟低音NLD算法进行不同程度的低音增强处理，对每组原音和低音增强后的音频材料根据C程序和MATLAB程序分别计算PEAQ中BV版本的11个模型输出参量MOVs以及PEAQ的两个输出值ODG、DI和音频频谱重心ASC共14个客观测量值，将需要的数值带入不同权重系数的式(1)(2)，就可以得到本发明对每一组原音和低音增强后的音频材料的关于丰满度程度和力度程度的客观评分。

下面利用统计分析，说明本发明拟合模型的可靠性。本发明将9组音频材料的14个客观参数的数值分别与虚拟低音丰满度程度的主观评分、虚拟低音力度程度的主观评分进行多元线性回归分析得到了丰满度和力度的拟合模型。

丰满度模型为：

C_R＝29.350-29.125ODG-0.001BandwidthRef (1)

模型摘要和模型方差分析见表4和表5。

表4丰满度模型摘要

R	R方	调整后R方	标准估算的误差
				0.923	0.852	0.802	4.5713220

表5丰满度模型方差分析ANOVA

力度模型为：

模型摘要和模型方差分析见下表6表7。

表6力度模型摘要

R	R方	调整后R方	标准估算的误差
				0.999	0.998	0.995	0.9176724

表7力度模型方差分析ANOVA

从表格中的数据可以看出，丰满度模型和力度模型的拟合优度很高，分别达到了0.923和0.999，模型的标准误差也很小，分别为4.571和0.918。模型的显著性均低于0.05，验证了模型的有效性。

以上所述仅是本发明的优选实施方式，应当指出：对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种基于虚拟低音算法主观评价的客观评价方法，其特征在于，包括以下步骤：

步骤1，计算以下14种客观评价参数的数值：PEAQ中BV版本11个模型输出参量MOVs：参考信号带宽BandwidthRef、测试信号带宽BandwidthTest、总信掩比Total NMR、窗选平均调制差异WinModDiff1、平均调制差异一AvgModDiff1、平均调制差异二AvgModDiff2、平均噪声响度的均方根值RmsNoiseLoud、受干扰帧的相对分数RelDistFrames、检测到失真存在的最大滤波概率MFPD、总失真与总严重失真比的对数值ADB、误差谐波结构EHS、客观差异等级ODG、失真指数DI、音频频谱重心ASC；

步骤2，计算以下分值：

C_R＝29.350-29.125ODG-0.001BandwidthRef (1)

C_S＝39.708-45.129ODG-114.626RmsNoiseLoud-23.646EHS+40.304ASC+17.560RelDistFrames(2)；

2.根据权利要求1所述基于虚拟低音算法主观评价的客观评价方法，其特征在于：步骤2中的权重系数是由9组音频材料的客观评分分别与虚拟低音丰满度程度的主观评分、虚拟低音力度程度的主观评分使用SPSS中多元线性回归分析得到的。

3.根据权利要求1所述基于虚拟低音算法主观评价的客观评价方法，其特征在于：音频材料均选取低频成分丰富的流行音乐，并且采用高质量WAV音源。

4.根据权利要求1所述基于虚拟低音算法主观评价的客观评价方法，其特征在于：主观听音试验的音频材料包含音频原音与不同程度的经过虚拟低音NLD算法处理后的音频材料。

5.根据权利要求1所述基于虚拟低音算法主观评价的客观评价方法，其特征在于：主观参量的评价术语为丰满度和力度：

主观评分标准