CN109697990B - 一种基于虚拟低音算法主观评价的客观评价方法 - Google Patents
一种基于虚拟低音算法主观评价的客观评价方法 Download PDFInfo
- Publication number
- CN109697990B CN109697990B CN201811341603.2A CN201811341603A CN109697990B CN 109697990 B CN109697990 B CN 109697990B CN 201811341603 A CN201811341603 A CN 201811341603A CN 109697990 B CN109697990 B CN 109697990B
- Authority
- CN
- China
- Prior art keywords
- objective
- subjective
- virtual bass
- audio
- method based
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 52
- 230000005484 gravity Effects 0.000 claims abstract description 9
- 238000012417 linear regression Methods 0.000 claims abstract description 6
- 238000012360 testing method Methods 0.000 claims description 7
- 238000001914 filtration Methods 0.000 claims 1
- MRJSJRJCZKKXJR-UHFFFAOYSA-N n-(4-fluorophenyl)-6,7-dimethoxyquinazolin-4-amine;hydrochloride Chemical compound Cl.C=12C=C(OC)C(OC)=CC2=NC=NC=1NC1=CC=C(F)C=C1 MRJSJRJCZKKXJR-UHFFFAOYSA-N 0.000 claims 1
- 238000000034 method Methods 0.000 abstract description 17
- 238000001228 spectrum Methods 0.000 abstract description 3
- 230000000694 effects Effects 0.000 description 11
- 238000000540 analysis of variance Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本发明公开了一种基于虚拟低音算法主观评价的客观评价方法,将语义细分法和系统范畴法这两种常用的主观评价方法进行了结合,利用多元线性回归分析在PEAQ中BV版本的11个模型输出参量MOVs以及PEAQ的两个输出值ODG、DI和音频频谱重心ASC基础上提出。本发明性能好,能准确地评价虚拟低音算法效果的好坏。
Description
技术领域
本发明涉及一种低音主观评价的客观评价方法,属于音频处理技术领域。
背景技术
随着科技的快速发展与客户需求的不断提高,为了追求更好的视觉享受,音视频设备变得越来越薄,屏占比越来越高,留给扬声器的空间越来越小。受到体积尺寸的影响,小型设备中无法放置尺寸过大的扬声器。口径较小的扬声器通常其谐振频率较高,低频重放能力差。消费者对高品质音乐的追求和小扬声器低音表现力差的矛盾成为了急需改进的问题。
对于该问题,目前多采用均衡器的方法来解决。但简单地通过均衡器提高低频能量容易产生信号畸变,并且会降低扬声器的使用寿命。而利用虚拟低音增强技术实现的低音增强,则避免了上述问题。
虚拟低音技术是利用“虚拟音调”现象实现的。对于一段包含谐波的音频,其基频部分决定了该信号的音调。当将谐波信号中的基频信号除去后,余下谐波分量叠加的信号给人的感受还是之前的音调,只是音色会有变化。虚拟低音技术逆向应用了这个现象,用谐波的组合有效的代替基频的听感,从而达到低音增强的效果。
由于音频音效最终的受众是消费者,所以主观评价才是音频音效算法效果的真实反映,也是最可靠的评价音频音效算法效果的方法。但主观评价方法耗费大量人力、物力和时间,因此采用客观评价方法来评价低音增强效果。
与较为完善的语音信号客观评价方法相比。宽带音频信号的客观评价方法发展的较晚,只是到了上个世纪七十年代末,一些针对可感知音频信号质量的客观评价方法才被陆续提出。在1998年,ITU-R综合了Disturbance Index(DIX)、Noise-to-Mask Ratio(NMR)、Perceptual Audio Quality Measure(PAQM)、PERCEVAL、Perceptual Objective Measure(POM)和The Toolbox Approach这6种方法,最终形成了ITU-R BS.1387(又被称为PEAQ:Perceptual Evaluation of Audio Quality)建议。PEAQ最终以客观差异等级ObjectiveDifference Grade(ODG)的形式进行输出。此外,音频频谱重心Audio Spectrum Centroid(ASC)也被常用来作为低音程度的客观评价参数,ASC是MPEG-7标准中的低级描述符之一,给出了音频材料对数频率功率谱的重心。
上述PEAQ和ASC客观评价方法的主客观皮尔逊相关性系数和双尾显著性见表1,表中括号内的数为双尾显著性。从表1中可以看出,目前传统的客观评价方法在单独对低音效果评分方面主客观性关系数普遍较低。
表1客观评价方法的主客观皮尔逊相关性系数和双尾显著性(括号内)
ODG | ASC | |
丰满度 | -0.837(0.005) | 0.596(0.090) |
力度 | -0.688(0.041) | 0.357(0.346) |
采用PEAQ中BV版本11个模型输出参量MOVs,以及由模型输出参数通过ANN映射得到的输出值DI(Distortion Index)和ODG,和音频频谱重心ASC组合的针对虚拟低音算法效果的客观评价方法。
发明内容
发明目的:本发明的目的在于利用现有的音频质量客观评价方法提出一种新的针对虚拟低音算法效果的客观评价方法,该方法性能好,能准确地评价虚拟低音算法效果的好坏。
技术方案:为实现上述目的,本发明采用的技术方案为:
一种基于虚拟低音算法主观评价的客观评价方法,包括以下步骤:
步骤1,计算以下14种客观评价参数的数值:PEAQ中BV版本11个模型输出参量MOVs:参考信号带宽(BandwidthRef)、测试信号带宽(BandwidthTest)、总信掩比(TotalNMR)、窗选平均调制差异(WinModDiff1)、平均调制差异1(AvgModDiff1)、平均调制差异2(AvgModDiff2)、平均噪声响度的均方根值(RmsNoiseLoud)、受干扰帧的相对分数(RelDistFrames)、检测到失真存在的最大滤波概率(MFPD)、总失真与总严重失真比的对数值(ADB)、误差谐波结构(EHS))、客观差异等级(ODG)、失真指数(DI)、音频频谱重心(ASC);
步骤2,计算以下分值
CR=29.350-29.125ODG-0.001BandwidthRef (1)
CS=39.708-45.129ODG-114.626RmsNoiseLoud-23.646EHS+40.304ASC+17.560RelDistFrames (2);
式中,CR表示本发明中评价音频材料丰满度程度的客观评分,CS表示本发明中评价音频材料力度程度的客观评分,其中的ODG、BandwidthRef、RmsNoiseLoud、EHS、ASC和RelDistFrames分别表示各自对应的客观评价参数算得的评分。
优选的:步骤2中的权重系数是由9组音频材料的客观评分分别与虚拟低音丰满度程度的主观评分、虚拟低音力度程度的主观评分使用SPSS中多元线性回归分析得到的。
优选的:音频材料均选取低频成分丰富的流行音乐,并且采用高质量WAV音源。
本发明相比现有技术,具有以下有益效果:
1、将语义细分法和系统范畴法这两种常用的主观评价方法进行了结合,设计出了一种适合本发明的新的主观评价方法。
2、客观评价方法利用多元线性回归分析在PEAQ中BV版本的11个模型输出参量MOVs以及PEAQ的两个输出值ODG、DI和音频频谱重心ASC基础上提出。
3、对于丰满度评分的主客观相关性系数达到0.920,对于力度评分的主客观相关性系数达到0.999,并且相关性显著,性能更好。
附图说明
图1为测试流程图。
具体实施方式
下面结合附图和具体实施例,进一步阐明本发明,应理解这些实例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
一种基于虚拟低音算法主观评价的客观评价方法,如图1所示,包括以下步骤:
(1)计算以下14种客观评价参数的数值:PEAQ中BV版本11个模型输出参量MOVs(参考信号带宽(BandwidthRef),测试信号带宽(BandwidthTest),总信掩比(Total NMR),窗选平均调制差异(WinModDiff1),平均调制差异1(AvgModDiff1),平均调制差异2(AvgModDiff2),平均噪声响度的均方根值(RmsNoiseLoud),受干扰帧的相对分数(RelDistFrames),检测到失真存在的最大滤波概率(MFPD),总失真与总严重失真比的对数值(ADB),误差谐波结构(EHS)),客观差异等级(ODG),失真指数(DI),音频频谱重心(ASC)。
(2)计算以下本发明提出的分值
CR=29.350-29.125ODG-0.001BandwidthRef (1)
CS=39.708-45.129ODG-114.626RmsNoiseLoud-23.646EHS+40.304ASC+17.560RelDistFrames (2)
式中,CR表示本发明中评价音频材料丰满度(Richness)程度的客观评分,CS表示本发明中评价音频材料力度(Strength)程度的客观评分。其中的ODG、BandwidthRef、RmsNoiseLoud、EHS、ASC和RelDistFrames分别表示各自对应的客观评价参数算得的评分。
式中的权重系数是由9组音频材料的客观评分分别与虚拟低音丰满度程度的主观评分、虚拟低音力度程度的主观评分使用SPSS中多元线性回归分析得到的。具体如下:
音频材料均选取低频成分丰富的流行音乐,包含了人声(男声、女声)、鼓点、弦乐、钢琴等各种类型的音频材料,并且采用高质量WAV音源。主观听音试验的音频材料包含音频原音与不同程度的经过虚拟低音NLD算法处理后的音频材料。为了将低音听感更加形象化、具体化,通过文献调研,挑选出了两个与低音相关度最高的国际认可的主观参量的评价术语——丰满度和力度。请15位主观听音者对处理前后的共16个音频材料分别从丰满度和力度两方面进行评分。将语义细分法和系统范畴法这两种常用的主观评价方法进行了结合,设计出了一种适合本发明的新的主观评价方法,具体评分标准如下。
表2主观评分标准
本发明的主客观皮尔逊相关性系数和双尾显著性见表3,表中括号内的数为双尾显著性。
表3本发明的主客观皮尔逊相关性系数和双尾显著性(括号内)
下面以虚拟低音NLD(Nonlinear Devices)算法和包含了人声(男声、女声)、鼓点、弦乐、钢琴等各种类型的低频成分丰富的音频材料为例,对本发明的实施做详细说明。
本发明的测试流程图如上图1所示。将所选取的音频材料经过虚拟低音NLD算法进行不同程度的低音增强处理,对每组原音和低音增强后的音频材料根据C程序和MATLAB程序分别计算PEAQ中BV版本的11个模型输出参量MOVs以及PEAQ的两个输出值ODG、DI和音频频谱重心ASC共14个客观测量值,将需要的数值带入不同权重系数的式(1)(2),就可以得到本发明对每一组原音和低音增强后的音频材料的关于丰满度程度和力度程度的客观评分。
下面利用统计分析,说明本发明拟合模型的可靠性。本发明将9组音频材料的14个客观参数的数值分别与虚拟低音丰满度程度的主观评分、虚拟低音力度程度的主观评分进行多元线性回归分析得到了丰满度和力度的拟合模型。
丰满度模型为:
CR=29.350-29.125ODG-0.001BandwidthRef (1)
模型摘要和模型方差分析见表4和表5。
表4丰满度模型摘要
R | R方 | 调整后R方 | 标准估算的误差 |
0.923 | 0.852 | 0.802 | 4.5713220 |
表5丰满度模型方差分析ANOVA
力度模型为:
模型摘要和模型方差分析见下表6表7。
表6力度模型摘要
R | R方 | 调整后R方 | 标准估算的误差 |
0.999 | 0.998 | 0.995 | 0.9176724 |
表7力度模型方差分析ANOVA
从表格中的数据可以看出,丰满度模型和力度模型的拟合优度很高,分别达到了0.923和0.999,模型的标准误差也很小,分别为4.571和0.918。模型的显著性均低于0.05,验证了模型的有效性。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (5)
1.一种基于虚拟低音算法主观评价的客观评价方法,其特征在于,包括以下步骤:
步骤1,计算以下14种客观评价参数的数值:PEAQ中BV版本11个模型输出参量MOVs:参考信号带宽BandwidthRef、测试信号带宽BandwidthTest、总信掩比Total NMR、窗选平均调制差异WinModDiff1、平均调制差异一AvgModDiff1、平均调制差异二AvgModDiff2、平均噪声响度的均方根值RmsNoiseLoud、受干扰帧的相对分数RelDistFrames、检测到失真存在的最大滤波概率MFPD、总失真与总严重失真比的对数值ADB、误差谐波结构EHS、客观差异等级ODG、失真指数DI、音频频谱重心ASC;
步骤2,计算以下分值:
CR=29.350-29.125ODG-0.001BandwidthRef (1)
CS=39.708-45.129ODG-114.626RmsNoiseLoud-23.646EHS+40.304ASC+17.560RelDistFrames(2);
式中,CR表示本发明中评价音频材料丰满度程度的客观评分,CS表示本发明中评价音频材料力度程度的客观评分,其中的ODG、BandwidthRef、RmsNoiseLoud、EHS、ASC和RelDistFrames分别表示各自对应的客观评价参数算得的评分。
2.根据权利要求1所述基于虚拟低音算法主观评价的客观评价方法,其特征在于:步骤2中的权重系数是由9组音频材料的客观评分分别与虚拟低音丰满度程度的主观评分、虚拟低音力度程度的主观评分使用SPSS中多元线性回归分析得到的。
3.根据权利要求1所述基于虚拟低音算法主观评价的客观评价方法,其特征在于:音频材料均选取低频成分丰富的流行音乐,并且采用高质量WAV音源。
4.根据权利要求1所述基于虚拟低音算法主观评价的客观评价方法,其特征在于:主观听音试验的音频材料包含音频原音与不同程度的经过虚拟低音NLD算法处理后的音频材料。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811341603.2A CN109697990B (zh) | 2018-11-12 | 2018-11-12 | 一种基于虚拟低音算法主观评价的客观评价方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811341603.2A CN109697990B (zh) | 2018-11-12 | 2018-11-12 | 一种基于虚拟低音算法主观评价的客观评价方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109697990A CN109697990A (zh) | 2019-04-30 |
CN109697990B true CN109697990B (zh) | 2020-12-11 |
Family
ID=66230102
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811341603.2A Active CN109697990B (zh) | 2018-11-12 | 2018-11-12 | 一种基于虚拟低音算法主观评价的客观评价方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109697990B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1538784A (zh) * | 2003-04-17 | 2004-10-20 | 松下电器产业株式会社 | 音响信号处理装置及其方法 |
CN101609686A (zh) * | 2009-07-28 | 2009-12-23 | 南京大学 | 基于语音增强算法主观评估的客观评估方法 |
CN102354500A (zh) * | 2011-08-03 | 2012-02-15 | 华南理工大学 | 一种基于谐波控制的虚拟低音增强处理方法 |
CN202178861U (zh) * | 2011-08-03 | 2012-03-28 | 华南理工大学 | 一种基于谐波控制的虚拟低音增强处理装置 |
CN102568470A (zh) * | 2012-01-11 | 2012-07-11 | 广州酷狗计算机科技有限公司 | 一种音频文件音质识别方法及其系统 |
JP2015191177A (ja) * | 2014-03-28 | 2015-11-02 | ブラザー工業株式会社 | プログラム、情報処理装置、及びデータ生成方法 |
CN107221343A (zh) * | 2017-05-19 | 2017-09-29 | 北京市农林科学院 | 一种数据质量的评估方法及评估系统 |
-
2018
- 2018-11-12 CN CN201811341603.2A patent/CN109697990B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1538784A (zh) * | 2003-04-17 | 2004-10-20 | 松下电器产业株式会社 | 音响信号处理装置及其方法 |
CN101609686A (zh) * | 2009-07-28 | 2009-12-23 | 南京大学 | 基于语音增强算法主观评估的客观评估方法 |
CN102354500A (zh) * | 2011-08-03 | 2012-02-15 | 华南理工大学 | 一种基于谐波控制的虚拟低音增强处理方法 |
CN202178861U (zh) * | 2011-08-03 | 2012-03-28 | 华南理工大学 | 一种基于谐波控制的虚拟低音增强处理装置 |
CN102568470A (zh) * | 2012-01-11 | 2012-07-11 | 广州酷狗计算机科技有限公司 | 一种音频文件音质识别方法及其系统 |
JP2015191177A (ja) * | 2014-03-28 | 2015-11-02 | ブラザー工業株式会社 | プログラム、情報処理装置、及びデータ生成方法 |
CN107221343A (zh) * | 2017-05-19 | 2017-09-29 | 北京市农林科学院 | 一种数据质量的评估方法及评估系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109697990A (zh) | 2019-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102016995B (zh) | 用于处理音频信号的设备及其方法 | |
CN102668374B (zh) | 音频录音的自适应动态范围增强 | |
CN111128214B (zh) | 音频降噪方法、装置、电子设备及介质 | |
CN107124149A (zh) | 一种音量调整方法、装置和设备 | |
JP2012235310A (ja) | 信号処理装置および方法、プログラム、並びにデータ記録媒体 | |
JP2000505277A (ja) | バス強調用装置とその方法 | |
CN109238448B (zh) | 一种基于声掩蔽提高城市声环境满意度的方法 | |
US10380989B1 (en) | Methods and apparatus for processing stereophonic audio content | |
CN102354500A (zh) | 一种基于谐波控制的虚拟低音增强处理方法 | |
CN104900238A (zh) | 一种基于感知滤波的音频实时比对方法 | |
CN110475181B (zh) | 设备配置方法、装置、设备和存储介质 | |
CN112669797B (zh) | 音频处理方法、装置、电子设备及存储介质 | |
CN109697990B (zh) | 一种基于虚拟低音算法主观评价的客观评价方法 | |
CN112995854A (zh) | 音频处理方法、装置及电子设备 | |
Shin et al. | Perceptual reinforcement of speech signal based on partial specific loudness | |
Stone et al. | Multichannel fast-acting dynamic range compression hinders performance by young, normal-hearing listeners in a two-talker separation task | |
US10587983B1 (en) | Methods and systems for adjusting clarity of digitized audio signals | |
TWI811762B (zh) | 音質評價方法及使用其之音質評價系統 | |
Mu et al. | A timbre matching approach to enhance audio quality of psychoacoustic bass enhancement system | |
Sung et al. | Descriptors of sound from HVAC&R equipment | |
CN112037759B (zh) | 抗噪感知敏感度曲线建立及语音合成方法 | |
Schepker et al. | Model-based integration of reverberation for noise-adaptive near-end listening enhancement | |
Mu | Perceptual quality improvement and assessment for virtual bass system | |
Tereping | Listener preference for concert sound levels: Do louder performances sound better? | |
Ilkowska et al. | Sharpness versus brightness: A comparison of magnitude estimates |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |