CN102496372A - 一种基于非线性参数拟合的低码率音频质量客观评价方法 - Google Patents

一种基于非线性参数拟合的低码率音频质量客观评价方法 Download PDF

Info

Publication number
CN102496372A
CN102496372A CN2011104211686A CN201110421168A CN102496372A CN 102496372 A CN102496372 A CN 102496372A CN 2011104211686 A CN2011104211686 A CN 2011104211686A CN 201110421168 A CN201110421168 A CN 201110421168A CN 102496372 A CN102496372 A CN 102496372A
Authority
CN
China
Prior art keywords
scale factor
audio
code check
mark
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011104211686A
Other languages
English (en)
Inventor
赵艳明
姜秀华
胡泽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Communication University of China
Original Assignee
Communication University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Communication University of China filed Critical Communication University of China
Priority to CN2011104211686A priority Critical patent/CN102496372A/zh
Publication of CN102496372A publication Critical patent/CN102496372A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了一种用于低码率音频质量客观评价的方法,属于通信领域。该方法的特点在于首先选出一些具有典型特征的音频,进行不同码率的压缩,并对压缩再解压后的音频进行主观评价打分;然后提取出每种码率下的每段音频的码率和尺度因子,在每种码率下独立进行主观评价分数和尺度因子的非线性参数拟合,得到每种码率下各自的拟合公式;从需要进行客观评价的音频流中提取出码率和尺度因子,根据码率选用对应的公式,并把尺度因子代入该公式,计算得到该音频的客观评价分数。其中每种码率下独立的参数拟合,能够消除不同的码率造成的影响,更准确地度量量化造成的质量损伤。对主观评价分数和尺度因子进行非线性参数拟合,能够模拟尺度因子较小或较大时分数较高,而尺度因子居中时分数较低的现象,提高了拟合度,使客观评价较好地模拟主观评价。

Description

一种基于非线性参数拟合的低码率音频质量客观评价方法
技术领域
本发明涉及音频质量客观评价的一种方法,属于通信领域。
背景技术
随着多媒体技术的发展,数字压缩音频被广泛应用于网络、广播、影视和移动多媒体通信等领域。但是,音频压缩是有损压缩,压缩会造成音频质量的下降。为了保障提供给用户较好的音频质量,有必要对压缩后的音频进行质量评价。音频质量的评价方法包括主观评价方法和客观评价方法。
主观评价的结果与人耳的实际感受一致。但是,主观评价需要较大的开销,费时、费力;主观评价受听音者的生理和心理状况、听音环境等条件影响比较大;主观评价不能用于广播电视等业务的音频质量的实时监控。因此,有必要研究音频质量的客观评价方法。
ITU-R BS.1387标准(简称为PEAQ)是迄今为止唯一的音频质量客观评价国际标准。PEAQ是一个全参考的音频质量评价方法,需要参考原始音频进行音频质量客观评价,实际应用时很难获得原始音频;PEAQ适用于高码率的音频质量客观评价,低码率压缩音频中的损伤与高码率压缩时有所不同;PEAQ运算复杂度较高,不适合应用到对实时性要求较高的场合。
徐晓娜提出一种压缩域音频质量客观评价方法。从压缩后的音频流中提取出码率和尺度因子,并采用PEAQ方法对这些音频进行客观评分,用这些音频的PEAQ评分对码率和尺度因子进行线性拟合,得到音频的评分与码率、尺度因子之间的线性拟合公式。对需要进行客观评价的音频进行评分时,提取出该音频的码率和尺度因子,代入上述公式,计算得到客观评价分数。
本发明用主观评价的结果拟合从音频码流中提取出的特征参数-码率和尺度因子,并且每种码率下单独进行非线性参数拟合。每种码率下独立进行参数拟合,可以消除码率的影响,更准确地度量尺度因子对音频质量的影响。非线性参数拟合能够有效地拟合实际情况:尺度因子较大或较小时,音频得分高;尺度因子居中时,音频得分低。
发明内容
为了对低码率压缩后的音频进行无参考客观评价,本发明提出了一种基于非线性参数拟合的低码率音频质量客观评价方法。
为实现上述的发明目的,本发明采用下述的技术方法:
1.音频质量主观评价方法
选取一些具有典型特征的音频,对选中的每段音频分别进行16kbps、24kbps和32kbps码率的压缩,并对压缩再解压后的每段音频进行主观评价,得到每段音频的主观评价分数。
2.压缩域音频质量特征参数提取方法
从压缩后的音频流中提取出能够表征音频质量的特征参数:码率和尺度因子。通常情况下,压缩后的码率越高,则压缩带来的音频损伤越小,音频质量则越好。但是,即使码率相同,不同的音频素材压缩后的质量并不相同。因此,有必要进一步提取能反映这种质量差别的特征参数。尺度因子反映了音频被压缩时的量化等级,而量化是造成压缩音频质量损伤的原因。本方法从压缩后的音频中提取尺度因子来度量音频质量的损伤程度。
3.每种码率下独立的非线性参数拟合方法
在三种码率(16kbps、24kbps和32kbps)下,分别用从压缩后的音频流中提取出的尺度因子来拟合这些音频的主观评价分数,得到三种码率下各自的非线性拟合公式。每种码率下独立进行拟合,能够消除不同的码率造成的影响,更准确地度量量化造成的质量损伤。
尺度因子与主观评价分数的拟合,采用非线性参数拟合。原因如下:尺度因子较小或较大时主观评价分数较高,而尺度因子居中时主观评价分数较低。在同一种码率下,尺度因子较小时,量化步长小,因此压缩带来的失真也小,主观评价分数高;尺度因子大时,压缩带来的失真也大,但是因为尺度因子大的这些音频包含了更丰富的频率成分,即使这时失真较大,人耳也分辨不出这些失真。
4.压缩域音频质量客观评价方法
从需要进行客观评价打分的音频流中提取出码率和尺度因子。根据码率,选用对应的非线性参数拟合公式;把尺度因子代入该公式,计算得到该音频的客观评价分数。
本发明实施例提供的技术方案的有益效果是:
1.在每种码率下独立进行尺度因子与主观评价分数的非线性拟合,拟合准确度高。
2.本方法属于无参考音频质量客观评价方法,不需要参考原始音频,能够应用于不能获取原始音频的场合。
3.本方法计算复杂度低,可以实时运算,实现对音频质量的实时监控。
附图说明
图1为采用基于非线性参数拟合的音频质量客观评价方法对压缩后的音频进行实时评价的示意图
图2为本发明的框架图
图3为非线性参数拟合的流程图
图4为对音频进行客观评价的流程图
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合图对本发明做进一步描述。
图3和图4所示为本发明的流程图。具体流程如下描述。
步骤1.选取10段音频压缩再解压并主观评价打分,用来在步骤3中进行非线性参数拟合,以得到拟合系数。每段音频的长度在10秒到20秒之间,音频素材的类型包括男声、女声、响板、钢琴、交响乐和电影配乐等。分别进行16kbps、24kbps和32kbps码率的压缩,并对压缩再解压后的每段音频进行主观评价,得到压缩后音频的主观评价分数。
步骤2.从压缩后的每段音频流中提取出音频质量特征参数:码率和尺度因子。
步骤3.在每种码率下分别进行主观评价分数和尺度因子的二阶非线性参数拟合,得到各自的非线性拟合公式。
步骤4.从需要进行客观评价打分的音频流中提取出码率和尺度因子。
步骤5.根据码率,选用对应的非线性公式。
步骤6.把尺度因子代入公式,计算得到该音频的客观评价分数。
上面对本发明所述的一种基于非线性参数拟合的低码率音频质量客观评价方法进行了详细的说明,但本发明的具体实现形式并不局限于此。以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.一种基于非线性参数拟合的低码率音频质量客观评价方法,其特征在于:首先选出一些具有典型特征的音频,进行不同码率的压缩,并对压缩再解压后的音频,进行主观评价打分;然后提取出每种码率下的每段音频的码率和尺度因子,在每种码率下独立进行主观评价分数和尺度因子的非线性参数拟合,得到每种码率下各自的拟合公式;从需要进行客观评价的音频流中提取出码率和尺度因子,根据码率选用相应的公式,并把尺度因子代入该公式,计算得到该音频的客观评价分数。
2.如权利要求1所述的每种码率下独立的参数拟合方法,其特征在于,在每种码率下独立进行主观评价分数和尺度因子的拟合,能够消除不同的码率造成的影响,更准确地度量量化造成的质量损伤。
3.如权利要求1所述的基于非线性参数拟合的方法,其特征在于,对主观评价分数和尺度因子进行非线性参数拟合,以使拟合曲线能够实现尺度因子较小或较大时分数较高,而尺度因子居中时分数较低。
CN2011104211686A 2011-12-15 2011-12-15 一种基于非线性参数拟合的低码率音频质量客观评价方法 Pending CN102496372A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011104211686A CN102496372A (zh) 2011-12-15 2011-12-15 一种基于非线性参数拟合的低码率音频质量客观评价方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011104211686A CN102496372A (zh) 2011-12-15 2011-12-15 一种基于非线性参数拟合的低码率音频质量客观评价方法

Publications (1)

Publication Number Publication Date
CN102496372A true CN102496372A (zh) 2012-06-13

Family

ID=46188189

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011104211686A Pending CN102496372A (zh) 2011-12-15 2011-12-15 一种基于非线性参数拟合的低码率音频质量客观评价方法

Country Status (1)

Country Link
CN (1) CN102496372A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10284712B2 (en) 2014-05-05 2019-05-07 Huawei Technologies Co., Ltd. Voice quality evaluation method, apparatus, and system
CN111355949A (zh) * 2020-03-12 2020-06-30 上海交通大学 音视频多媒体数据库的构建及多媒体主观质量评价方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040190633A1 (en) * 2001-05-01 2004-09-30 Walid Ali Composite objective video quality measurement
CN102044248A (zh) * 2009-10-10 2011-05-04 北京理工大学 一种针对流媒体音频质量的客观评测方法
CN102231279A (zh) * 2011-05-11 2011-11-02 武汉大学 基于听觉关注度的音频质量客观评价系统及方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040190633A1 (en) * 2001-05-01 2004-09-30 Walid Ali Composite objective video quality measurement
CN102044248A (zh) * 2009-10-10 2011-05-04 北京理工大学 一种针对流媒体音频质量的客观评测方法
CN102231279A (zh) * 2011-05-11 2011-11-02 武汉大学 基于听觉关注度的音频质量客观评价系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
姜甜等: "音频质量客观评价方法的综合与实现", 《电声技术》 *
徐晓娜等: "压缩域音频质量客观评价算法研究", 《电声技术》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10284712B2 (en) 2014-05-05 2019-05-07 Huawei Technologies Co., Ltd. Voice quality evaluation method, apparatus, and system
CN111355949A (zh) * 2020-03-12 2020-06-30 上海交通大学 音视频多媒体数据库的构建及多媒体主观质量评价方法
CN111355949B (zh) * 2020-03-12 2021-05-25 上海交通大学 音视频多媒体数据库的构建及多媒体主观质量评价方法

Similar Documents

Publication Publication Date Title
CN102496369B (zh) 一种基于失真校正的压缩域音频质量客观评价方法
CN102754151B (zh) 用于对便携式装置内的音频信号的响度进行非破坏性标准化的系统和方法
US11551702B2 (en) Filling of non-coded sub-vectors in transform coded audio signals
CN102792588B (zh) 用于在单个回放模式中结合响度测量的系统
CN100568740C (zh) 编码/解码音频信号的设备和方法
CN103957216B (zh) 基于音频信号特性分类的无参考音频质量评价方法和系统
CN105531759A (zh) 用于下混合音频内容的响度调整
WO2005104094A1 (ja) 符号化装置
US20120116759A1 (en) Method, Computer, Computer Program and Computer Program Product for Speech Quality Estimation
EP3598441A1 (en) Systems and methods for modifying an audio signal using custom psychoacoustic models
RU2312405C2 (ru) Способ осуществления машинной оценки качества звуковых сигналов
CN102496372A (zh) 一种基于非线性参数拟合的低码率音频质量客观评价方法
US20160164480A1 (en) Method, apparatus, and system for analysis, evaluation, measurement and control of audio dynamics processing
KR20050037431A (ko) 신호 처리 시스템, 신호 처리 장치 및 방법, 기록 매체와프로그램
Salovarda et al. Estimating perceptual audio system quality using PEAQ algorithm
CN101751929A (zh) 声音处理方法及装置
CN108877816A (zh) 基于qmdct系数的aac音频重压缩检测方法
Qian et al. Objective audio quality evaluation methon based on compressed domain
Feiten et al. Audio transmission
Fang et al. Research on Evaluation Model of Digital-Analog Interference for IBOC
EP2408206A1 (en) Method for video quality estimation
Saji The Effect of Bit-Errors on Compressed Speech, Music and Images
Park et al. Speech quality measure for voIP using wavelet based bark coherence function.
PARK et al. Bark coherence function for speech quality evaluation over CDMA system
Singh et al. Non-Intrusive Speech Quality with Different Time Scale

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120613