CN109697990B - 一种基于虚拟低音算法主观评价的客观评价方法 - Google Patents

一种基于虚拟低音算法主观评价的客观评价方法 Download PDF

Info

Publication number
CN109697990B
CN109697990B CN201811341603.2A CN201811341603A CN109697990B CN 109697990 B CN109697990 B CN 109697990B CN 201811341603 A CN201811341603 A CN 201811341603A CN 109697990 B CN109697990 B CN 109697990B
Authority
CN
China
Prior art keywords
objective
subjective
virtual bass
audio
method based
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811341603.2A
Other languages
English (en)
Other versions
CN109697990A (zh
Inventor
王旻
林志斌
刘晓峻
狄敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Province Nanjing University Of Science And Technology Electronic Information Technology Co ltd
Nanjing Nanda Electronic Wisdom Service Robot Research Institute Co ltd
Nanjing University
Original Assignee
Jiangsu Province Nanjing University Of Science And Technology Electronic Information Technology Co ltd
Nanjing Nanda Electronic Wisdom Service Robot Research Institute Co ltd
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Province Nanjing University Of Science And Technology Electronic Information Technology Co ltd, Nanjing Nanda Electronic Wisdom Service Robot Research Institute Co ltd, Nanjing University filed Critical Jiangsu Province Nanjing University Of Science And Technology Electronic Information Technology Co ltd
Priority to CN201811341603.2A priority Critical patent/CN109697990B/zh
Publication of CN109697990A publication Critical patent/CN109697990A/zh
Application granted granted Critical
Publication of CN109697990B publication Critical patent/CN109697990B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/60Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals

Abstract

本发明公开了一种基于虚拟低音算法主观评价的客观评价方法,将语义细分法和系统范畴法这两种常用的主观评价方法进行了结合,利用多元线性回归分析在PEAQ中BV版本的11个模型输出参量MOVs以及PEAQ的两个输出值ODG、DI和音频频谱重心ASC基础上提出。本发明性能好,能准确地评价虚拟低音算法效果的好坏。

Description

一种基于虚拟低音算法主观评价的客观评价方法
技术领域
本发明涉及一种低音主观评价的客观评价方法,属于音频处理技术领域。
背景技术
随着科技的快速发展与客户需求的不断提高,为了追求更好的视觉享受,音视频设备变得越来越薄,屏占比越来越高,留给扬声器的空间越来越小。受到体积尺寸的影响,小型设备中无法放置尺寸过大的扬声器。口径较小的扬声器通常其谐振频率较高,低频重放能力差。消费者对高品质音乐的追求和小扬声器低音表现力差的矛盾成为了急需改进的问题。
对于该问题,目前多采用均衡器的方法来解决。但简单地通过均衡器提高低频能量容易产生信号畸变,并且会降低扬声器的使用寿命。而利用虚拟低音增强技术实现的低音增强,则避免了上述问题。
虚拟低音技术是利用“虚拟音调”现象实现的。对于一段包含谐波的音频,其基频部分决定了该信号的音调。当将谐波信号中的基频信号除去后,余下谐波分量叠加的信号给人的感受还是之前的音调,只是音色会有变化。虚拟低音技术逆向应用了这个现象,用谐波的组合有效的代替基频的听感,从而达到低音增强的效果。
由于音频音效最终的受众是消费者,所以主观评价才是音频音效算法效果的真实反映,也是最可靠的评价音频音效算法效果的方法。但主观评价方法耗费大量人力、物力和时间,因此采用客观评价方法来评价低音增强效果。
与较为完善的语音信号客观评价方法相比。宽带音频信号的客观评价方法发展的较晚,只是到了上个世纪七十年代末,一些针对可感知音频信号质量的客观评价方法才被陆续提出。在1998年,ITU-R综合了Disturbance Index(DIX)、Noise-to-Mask Ratio(NMR)、Perceptual Audio Quality Measure(PAQM)、PERCEVAL、Perceptual Objective Measure(POM)和The Toolbox Approach这6种方法,最终形成了ITU-R BS.1387(又被称为PEAQ:Perceptual Evaluation of Audio Quality)建议。PEAQ最终以客观差异等级ObjectiveDifference Grade(ODG)的形式进行输出。此外,音频频谱重心Audio Spectrum Centroid(ASC)也被常用来作为低音程度的客观评价参数,ASC是MPEG-7标准中的低级描述符之一,给出了音频材料对数频率功率谱的重心。
上述PEAQ和ASC客观评价方法的主客观皮尔逊相关性系数和双尾显著性见表1,表中括号内的数为双尾显著性。从表1中可以看出,目前传统的客观评价方法在单独对低音效果评分方面主客观性关系数普遍较低。
表1客观评价方法的主客观皮尔逊相关性系数和双尾显著性(括号内)
ODG ASC
丰满度 -0.837(0.005) 0.596(0.090)
力度 -0.688(0.041) 0.357(0.346)
采用PEAQ中BV版本11个模型输出参量MOVs,以及由模型输出参数通过ANN映射得到的输出值DI(Distortion Index)和ODG,和音频频谱重心ASC组合的针对虚拟低音算法效果的客观评价方法。
发明内容
发明目的:本发明的目的在于利用现有的音频质量客观评价方法提出一种新的针对虚拟低音算法效果的客观评价方法,该方法性能好,能准确地评价虚拟低音算法效果的好坏。
技术方案:为实现上述目的,本发明采用的技术方案为:
一种基于虚拟低音算法主观评价的客观评价方法,包括以下步骤:
步骤1,计算以下14种客观评价参数的数值:PEAQ中BV版本11个模型输出参量MOVs:参考信号带宽(BandwidthRef)、测试信号带宽(BandwidthTest)、总信掩比(TotalNMR)、窗选平均调制差异(WinModDiff1)、平均调制差异1(AvgModDiff1)、平均调制差异2(AvgModDiff2)、平均噪声响度的均方根值(RmsNoiseLoud)、受干扰帧的相对分数(RelDistFrames)、检测到失真存在的最大滤波概率(MFPD)、总失真与总严重失真比的对数值(ADB)、误差谐波结构(EHS))、客观差异等级(ODG)、失真指数(DI)、音频频谱重心(ASC);
步骤2,计算以下分值
CR=29.350-29.125ODG-0.001BandwidthRef (1)
CS=39.708-45.129ODG-114.626RmsNoiseLoud-23.646EHS+40.304ASC+17.560RelDistFrames (2);
式中,CR表示本发明中评价音频材料丰满度程度的客观评分,CS表示本发明中评价音频材料力度程度的客观评分,其中的ODG、BandwidthRef、RmsNoiseLoud、EHS、ASC和RelDistFrames分别表示各自对应的客观评价参数算得的评分。
优选的:步骤2中的权重系数是由9组音频材料的客观评分分别与虚拟低音丰满度程度的主观评分、虚拟低音力度程度的主观评分使用SPSS中多元线性回归分析得到的。
优选的:音频材料均选取低频成分丰富的流行音乐,并且采用高质量WAV音源。
本发明相比现有技术,具有以下有益效果:
1、将语义细分法和系统范畴法这两种常用的主观评价方法进行了结合,设计出了一种适合本发明的新的主观评价方法。
2、客观评价方法利用多元线性回归分析在PEAQ中BV版本的11个模型输出参量MOVs以及PEAQ的两个输出值ODG、DI和音频频谱重心ASC基础上提出。
3、对于丰满度评分的主客观相关性系数达到0.920,对于力度评分的主客观相关性系数达到0.999,并且相关性显著,性能更好。
附图说明
图1为测试流程图。
具体实施方式
下面结合附图和具体实施例,进一步阐明本发明,应理解这些实例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
一种基于虚拟低音算法主观评价的客观评价方法,如图1所示,包括以下步骤:
(1)计算以下14种客观评价参数的数值:PEAQ中BV版本11个模型输出参量MOVs(参考信号带宽(BandwidthRef),测试信号带宽(BandwidthTest),总信掩比(Total NMR),窗选平均调制差异(WinModDiff1),平均调制差异1(AvgModDiff1),平均调制差异2(AvgModDiff2),平均噪声响度的均方根值(RmsNoiseLoud),受干扰帧的相对分数(RelDistFrames),检测到失真存在的最大滤波概率(MFPD),总失真与总严重失真比的对数值(ADB),误差谐波结构(EHS)),客观差异等级(ODG),失真指数(DI),音频频谱重心(ASC)。
(2)计算以下本发明提出的分值
CR=29.350-29.125ODG-0.001BandwidthRef (1)
CS=39.708-45.129ODG-114.626RmsNoiseLoud-23.646EHS+40.304ASC+17.560RelDistFrames (2)
式中,CR表示本发明中评价音频材料丰满度(Richness)程度的客观评分,CS表示本发明中评价音频材料力度(Strength)程度的客观评分。其中的ODG、BandwidthRef、RmsNoiseLoud、EHS、ASC和RelDistFrames分别表示各自对应的客观评价参数算得的评分。
式中的权重系数是由9组音频材料的客观评分分别与虚拟低音丰满度程度的主观评分、虚拟低音力度程度的主观评分使用SPSS中多元线性回归分析得到的。具体如下:
音频材料均选取低频成分丰富的流行音乐,包含了人声(男声、女声)、鼓点、弦乐、钢琴等各种类型的音频材料,并且采用高质量WAV音源。主观听音试验的音频材料包含音频原音与不同程度的经过虚拟低音NLD算法处理后的音频材料。为了将低音听感更加形象化、具体化,通过文献调研,挑选出了两个与低音相关度最高的国际认可的主观参量的评价术语——丰满度和力度。请15位主观听音者对处理前后的共16个音频材料分别从丰满度和力度两方面进行评分。将语义细分法和系统范畴法这两种常用的主观评价方法进行了结合,设计出了一种适合本发明的新的主观评价方法,具体评分标准如下。
表2主观评分标准
Figure BDA0001862710200000041
本发明的主客观皮尔逊相关性系数和双尾显著性见表3,表中括号内的数为双尾显著性。
表3本发明的主客观皮尔逊相关性系数和双尾显著性(括号内)
Figure BDA0001862710200000042
下面以虚拟低音NLD(Nonlinear Devices)算法和包含了人声(男声、女声)、鼓点、弦乐、钢琴等各种类型的低频成分丰富的音频材料为例,对本发明的实施做详细说明。
本发明的测试流程图如上图1所示。将所选取的音频材料经过虚拟低音NLD算法进行不同程度的低音增强处理,对每组原音和低音增强后的音频材料根据C程序和MATLAB程序分别计算PEAQ中BV版本的11个模型输出参量MOVs以及PEAQ的两个输出值ODG、DI和音频频谱重心ASC共14个客观测量值,将需要的数值带入不同权重系数的式(1)(2),就可以得到本发明对每一组原音和低音增强后的音频材料的关于丰满度程度和力度程度的客观评分。
下面利用统计分析,说明本发明拟合模型的可靠性。本发明将9组音频材料的14个客观参数的数值分别与虚拟低音丰满度程度的主观评分、虚拟低音力度程度的主观评分进行多元线性回归分析得到了丰满度和力度的拟合模型。
丰满度模型为:
CR=29.350-29.125ODG-0.001BandwidthRef (1)
模型摘要和模型方差分析见表4和表5。
表4丰满度模型摘要
R R方 调整后R方 标准估算的误差
0.923 0.852 0.802 4.5713220
表5丰满度模型方差分析ANOVA
Figure BDA0001862710200000051
力度模型为:
Figure BDA0001862710200000052
模型摘要和模型方差分析见下表6表7。
表6力度模型摘要
R R方 调整后R方 标准估算的误差
0.999 0.998 0.995 0.9176724
表7力度模型方差分析ANOVA
Figure BDA0001862710200000053
从表格中的数据可以看出,丰满度模型和力度模型的拟合优度很高,分别达到了0.923和0.999,模型的标准误差也很小,分别为4.571和0.918。模型的显著性均低于0.05,验证了模型的有效性。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (5)

1.一种基于虚拟低音算法主观评价的客观评价方法,其特征在于,包括以下步骤:
步骤1,计算以下14种客观评价参数的数值:PEAQ中BV版本11个模型输出参量MOVs:参考信号带宽BandwidthRef、测试信号带宽BandwidthTest、总信掩比Total NMR、窗选平均调制差异WinModDiff1、平均调制差异一AvgModDiff1、平均调制差异二AvgModDiff2、平均噪声响度的均方根值RmsNoiseLoud、受干扰帧的相对分数RelDistFrames、检测到失真存在的最大滤波概率MFPD、总失真与总严重失真比的对数值ADB、误差谐波结构EHS、客观差异等级ODG、失真指数DI、音频频谱重心ASC;
步骤2,计算以下分值:
CR=29.350-29.125ODG-0.001BandwidthRef (1)
CS=39.708-45.129ODG-114.626RmsNoiseLoud-23.646EHS+40.304ASC+17.560RelDistFrames(2);
式中,CR表示本发明中评价音频材料丰满度程度的客观评分,CS表示本发明中评价音频材料力度程度的客观评分,其中的ODG、BandwidthRef、RmsNoiseLoud、EHS、ASC和RelDistFrames分别表示各自对应的客观评价参数算得的评分。
2.根据权利要求1所述基于虚拟低音算法主观评价的客观评价方法,其特征在于:步骤2中的权重系数是由9组音频材料的客观评分分别与虚拟低音丰满度程度的主观评分、虚拟低音力度程度的主观评分使用SPSS中多元线性回归分析得到的。
3.根据权利要求1所述基于虚拟低音算法主观评价的客观评价方法,其特征在于:音频材料均选取低频成分丰富的流行音乐,并且采用高质量WAV音源。
4.根据权利要求1所述基于虚拟低音算法主观评价的客观评价方法,其特征在于:主观听音试验的音频材料包含音频原音与不同程度的经过虚拟低音NLD算法处理后的音频材料。
5.根据权利要求1所述基于虚拟低音算法主观评价的客观评价方法,其特征在于:主观参量的评价术语为丰满度和力度:
主观评分标准
Figure FDA0002670290740000011
CN201811341603.2A 2018-11-12 2018-11-12 一种基于虚拟低音算法主观评价的客观评价方法 Active CN109697990B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811341603.2A CN109697990B (zh) 2018-11-12 2018-11-12 一种基于虚拟低音算法主观评价的客观评价方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811341603.2A CN109697990B (zh) 2018-11-12 2018-11-12 一种基于虚拟低音算法主观评价的客观评价方法

Publications (2)

Publication Number Publication Date
CN109697990A CN109697990A (zh) 2019-04-30
CN109697990B true CN109697990B (zh) 2020-12-11

Family

ID=66230102

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811341603.2A Active CN109697990B (zh) 2018-11-12 2018-11-12 一种基于虚拟低音算法主观评价的客观评价方法

Country Status (1)

Country Link
CN (1) CN109697990B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1538784A (zh) * 2003-04-17 2004-10-20 松下电器产业株式会社 音响信号处理装置及其方法
CN101609686A (zh) * 2009-07-28 2009-12-23 南京大学 基于语音增强算法主观评估的客观评估方法
CN102354500A (zh) * 2011-08-03 2012-02-15 华南理工大学 一种基于谐波控制的虚拟低音增强处理方法
CN202178861U (zh) * 2011-08-03 2012-03-28 华南理工大学 一种基于谐波控制的虚拟低音增强处理装置
CN102568470A (zh) * 2012-01-11 2012-07-11 广州酷狗计算机科技有限公司 一种音频文件音质识别方法及其系统
JP2015191177A (ja) * 2014-03-28 2015-11-02 ブラザー工業株式会社 プログラム、情報処理装置、及びデータ生成方法
CN107221343A (zh) * 2017-05-19 2017-09-29 北京市农林科学院 一种数据质量的评估方法及评估系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1538784A (zh) * 2003-04-17 2004-10-20 松下电器产业株式会社 音响信号处理装置及其方法
CN101609686A (zh) * 2009-07-28 2009-12-23 南京大学 基于语音增强算法主观评估的客观评估方法
CN102354500A (zh) * 2011-08-03 2012-02-15 华南理工大学 一种基于谐波控制的虚拟低音增强处理方法
CN202178861U (zh) * 2011-08-03 2012-03-28 华南理工大学 一种基于谐波控制的虚拟低音增强处理装置
CN102568470A (zh) * 2012-01-11 2012-07-11 广州酷狗计算机科技有限公司 一种音频文件音质识别方法及其系统
JP2015191177A (ja) * 2014-03-28 2015-11-02 ブラザー工業株式会社 プログラム、情報処理装置、及びデータ生成方法
CN107221343A (zh) * 2017-05-19 2017-09-29 北京市农林科学院 一种数据质量的评估方法及评估系统

Also Published As

Publication number Publication date
CN109697990A (zh) 2019-04-30

Similar Documents

Publication Publication Date Title
CN102016995B (zh) 用于处理音频信号的设备及其方法
CN102668374B (zh) 音频录音的自适应动态范围增强
JP2012235310A (ja) 信号処理装置および方法、プログラム、並びにデータ記録媒体
CN111128214A (zh) 音频降噪方法、装置、电子设备及介质
CN109238448B (zh) 一种基于声掩蔽提高城市声环境满意度的方法
CN102354500A (zh) 一种基于谐波控制的虚拟低音增强处理方法
CN104900238A (zh) 一种基于感知滤波的音频实时比对方法
US20190259367A1 (en) Methods and apparatus for processing stereophonic audio content
CN110475181B (zh) 设备配置方法、装置、设备和存储介质
US9373341B2 (en) Method and system for bias corrected speech level determination
CN112669797B (zh) 音频处理方法、装置、电子设备及存储介质
CN109697990B (zh) 一种基于虚拟低音算法主观评价的客观评价方法
CN111696515B (zh) 一种用于教学录播的音频混音方法
Stone et al. Multichannel fast-acting dynamic range compression hinders performance by young, normal-hearing listeners in a two-talker separation task
Francombe et al. Modelling listener distraction resulting from audio-on-audio interference
Mu et al. A timbre matching approach to enhance audio quality of psychoacoustic bass enhancement system
CN112037759B (zh) 抗噪感知敏感度曲线建立及语音合成方法
Schepker et al. Model-based integration of reverberation for noise-adaptive near-end listening enhancement
Mu Perceptual quality improvement and assessment for virtual bass system
Kyon et al. Hi-pass Pink Noise: Its Acoustic Features and Standard Volume
Tereping Listener preference for concert sound levels: Do louder performances sound better?
Ilkowska et al. Sharpness versus brightness: A comparison of magnitude estimates
CN112750451A (zh) 一种提升语音听感的降噪方法
US11380345B2 (en) Real-time voice timbre style transform
CN112511941B (zh) 一种音频输出方法及系统及耳机

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant