CN103957216B - 基于音频信号特性分类的无参考音频质量评价方法和系统 - Google Patents

基于音频信号特性分类的无参考音频质量评价方法和系统 Download PDF

Info

Publication number
CN103957216B
CN103957216B CN201410196690.2A CN201410196690A CN103957216B CN 103957216 B CN103957216 B CN 103957216B CN 201410196690 A CN201410196690 A CN 201410196690A CN 103957216 B CN103957216 B CN 103957216B
Authority
CN
China
Prior art keywords
audio
quality
packet loss
audio signal
evaluation model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201410196690.2A
Other languages
English (en)
Other versions
CN103957216A (zh
Inventor
胡瑞敏
杨玉红
王衍业
谢松波
董少龙
余洪江
高丽
王晓晨
涂卫平
高戈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University WHU
Original Assignee
Wuhan University WHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University WHU filed Critical Wuhan University WHU
Priority to CN201410196690.2A priority Critical patent/CN103957216B/zh
Publication of CN103957216A publication Critical patent/CN103957216A/zh
Application granted granted Critical
Publication of CN103957216B publication Critical patent/CN103957216B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明提供了一种基于音频信号特性分类的无参考音频质量评价方法和系统,包括步骤:步骤1,基于有参考音频质量评价模型建立训练模型,采用机器学习获取不同类型音频信号的音频质量与网络参数的关系,即无参考音频质量评价模型;步骤2,在音频信号网络传输中,将当前丢包率、当前延迟时间和当前丢包数据的音频信号类型输入无参考音频质量评价模型,获得当前音频质量。本发明对不同类型信号采用不同的质量评价关系式进行质量评价,能更真实地反映用户体验。

Description

基于音频信号特性分类的无参考音频质量评价方法和系统
技术领域
本发明涉及音频质量评价领域,尤其涉及一种基于音频信号特性分类的无参考音频质量评价方法和系统。
背景技术
随着人们生活质量提高,人们对音频有了更高、更多样化的需求,手机上移动音频点播、音频信息和音乐这样的移动音频服务正在快速增长,为了保证用户在音频服务上的良好体验,音频质量评价必不可少。音频质量评价分为主观质量评价和客观质量评价,主观质量评价虽然更能反映用户体验,但是费时、费力,也不适合实时传输,实际应用中往往采用客观质量评价。客观质量评价又分为有参考质量评价和无参考质量评价,有参考质量评价需要原始音作为参考,能够较为准确预测音频质量,但是实际通信时,特别是移动通信环境下,原始音往往不能够获得,此时,就需要无参考质量评价。
现有的无参考音频质量评价都是通过统计网络参数获得,如丢包和延迟,最有代表性的是E-Model模型,但是均未考虑用户对不同类型音频信号感知失真的差异性。
发明内容
针对现有技术存在的不足,本发明提出了一种基于音频信号特性分类的无参考音频质量评价方法和系统,本发明方法和系统考虑了用户对不同类型音频信号感知失真的差异性,可更真实的反应用户体验。
为解决上述问题,本发明采用如下的技术方案:
一、音频信号特性分类的无参考音频质量评价方法,包括步骤:
步骤1,基于有参考音频质量评价模型建立训练模型,采用机器学习获取不同类型音频信号的音频质量与网络参数的关系,即无参考音频质量评价模型,所述的网络参数包括延迟时间和丢包率;
步骤2,在音频信号网络传输中,将当前丢包率、当前延迟时间和当前丢包数据的音频信号类型输入无参考音频质量评价模型,获得当前音频质量。
步骤1进一步包括子步骤:
1.1将原始音经编码、丢包、解码后得到降质音频,利用有参考音频质量评价模型对降质音频进行质量评价得到客观质量得分MOS;
1.2将降质音频延迟产生延迟损伤,在客观质量得分MOS上减去延迟损伤Id,得到音频质量MOSc;
1.3以音频质量MOSc为目标,以延迟时间、丢包率、音频信号类型为输入,通过机器学习方式获得不同类型音频信号的音频质量与网络参数的关系,即无参考音频质量评价模型。
步骤2进一步包括子步骤:
2.1采用不同编码模式分别对不同类型音频信号进行编码获得音频编码信息;
2.2对音频编码信息进行解码,并统计当前丢包率和当前延迟时间,恢复丢包数据的编码模式,获取当前丢包数据的音频信号类型;
2.3将当前丢包率、当前延迟时间和当前丢包数据的音频信号类型输入无参考音频质量评价模型,获得当前音频质量MOSc。
上述音频信号特性分类的无参考音频质量评价方法还包括步骤:
根据当前音频质量调整延迟时间和编码码率,使当前音频质量取最大值。
二、一种音频信号特性分类的无参考音频质量评价系统,包括:
训练模块,基于有参考音频质量评价模型建立训练模型,采用机器学习获取不同类型音频信号的音频质量与网络参数的关系,即无参考音频质量评价模型,所述的网络参数包括延迟时间和丢包率;
质量评价模块,用来在音频信号网络传输中,将当前丢包率、当前延迟时间和当前丢包数据的音频信号类型输入无参考音频质量评价模型,获得当前音频质量。
上述训练模块进一步包括子模块:
有参考音频质量评分模块,用来将原始音经编码、丢包、解码后得到降质音频,利用有参考音频质量评价模型对降质音频进行质量评价得到客观质量得分MOS;
音频质量评分模块,用来将降质音频延迟产生延迟损伤,在客观质量得分MOS上减去延迟损伤Id,得到音频质量MOSc;
机器学习模块,用来以音频质量MOSc为目标,以延迟时间、丢包率、音频信号类型为输入,通过机器学习方式获得不同类型音频信号的音频质量与网络参数的关系,即无参考音频质量评价模型。
上述质量评价模块进一步包括子模块:
编码模块,用来采用不同编码模式分别对不同类型音频信号进行编码获得音频编码信息;
网络参数和音频信号类型获得模块,用来对音频编码信息进行解码,并统计当前丢包率和当前延迟时间,恢复丢包数据的编码模式,获取当前丢包数据的音频信号类型;
质量评价模块,用来将当前丢包率、当前延迟时间和当前丢包数据的音频信号类型输入无参考音频质量评价模型,获得当前音频质量MOSc。
上述音频信号特性分类的无参考音频质量评价系统,还包括网络参数调整模块,用来根据当前音频质量调整延迟时间和编码码率,使当前音频质量取最大值。
本发明根据音频信号特性对音频信号进行分类,基于有参考音频质量评价模型,通过机器学习方式训练适用于不同类型音频信号的无参考音频质量评价模型,采用无参考音频质量评价模型对不同类型音频信号质量进行评价。
本发明可应用于音频网络传输,通过统计丢包数据的丢包率、延迟时间和类型,采用无参考音频质量评价模型对音频质量进行评价,并实时反馈音频质量,自适应调节网络参数,给用户最好的感知体验。
与现有技术相比,本发明具有如下有益效果:
现有无参考音频质量评价模型一般通过统计网络参数(主要包括丢包率和延迟时间)来评价音频质量,但未按照音频信号特性对音频信号进行分类。同种网络条件下,丢包和延迟对瞬变信号和稳态信号造成的影响明显不同。本发明则根据音频信号特性对音频信号进行分类,对不同类型信号采用不同的关系式进行质量评价,能更真实地反映用户体验。
附图说明
图1是训练不同类型音频信号的无参考音频质量评价模型的框图;
图2是本发明无参考音频质量评价模型在音频网络传输中的应用框图。
具体实施方式
本发明可应用于音频网络传输中对音频质量进行评价,通过统计网络传输中丢包数据的丢包率和延迟时间,根据音频信号特性分类,将丢包率和延迟时间送入无参考音频质量评价模块,获得感知音频质量。
以AVS-P10为例,AVS-P10根据音频信号特性将音频信号分为语音信号、瞬变音乐信号、暂稳态音乐信号和稳态音乐信号四类信号,分别用ACELP256、TVC256、TVC512、TVC1024编码模式进行编码,接收端通过编码模式对音频信号进行分类,对于不同编码模式下的丢包,采用对应的关系式获得感知音频质量。
下面结合附图进一步说明本发明的具体实施方式。
见图1,利用有参考音频质量评价模型训练无参考音频质量评价模型的参数,本具体实施中采用的有参考音频质量评价模型为基于用户关注度和抖动失真的PEAQ客观质量评价模型。无参考音频质量评价模型参数训练的具体步骤如下:
首先,将原始音经编码、丢包、解码后得到降质音频,利用有参考音频质量评价模型对降质音频进行质量评价得到客观质量得分MOS(Mean Opinion Score)。
接着,将降质音频延迟产生一个延迟损伤Id,由于有参考音频质量评价模型不含延迟损伤,而实际音频网络传输中必然存在延迟损伤,所以在客观质量得分MOS基础上减去延迟损伤Id,得到音频质量MOSc。
最后,以音频质量MOSc为目标,以延迟时间d、丢包率p、音频信号类型mod为输入,通过机器学习方式,训练神经网络模型,得到不同类型音频信号质量受丢包率和延迟时间影响的关系式:MOSc=f(d,p,mod),即构成无参考音频质量评价模型。本步骤中,将训练样本的丢包率、延迟时间、音频信号类型和音频质量MOSc输入神经网络模型,即可直接获得无参考音频质量评价模型。
见图2,将训练的无参考音频质量评价模型应用于音频网络传输,发送端采用不同编码模式分别对不同类型音频信号进行编码获得音频编码信息。音频编码信息经网络传输到接收端,首先,经过缓冲区,利用常规技术对音频编码信息进行去抖动、根据时间戳对数据包重排序、统计丢包率和延迟时间;然后,经解码器进行解码,并恢复丢包数据的编码模式,从而获取丢包数据的音频信号类型;然后,将当前丢包数据的音频信号类型、当前丢包数据的丢包率和延迟时间传入无参考音频质量评价模型,获得此时的音频质量MOSc,并实时反馈,以便自适应调节相应网络参数,给用户最好的音频感知体验。
下面以AVS-P10编解码标准为例进一步说明本发明在音频网络传输中的应用。发送端以一定码率采用不同编码模式对不同类型音频信号分别进行编码获得音频编码信号,音频编码信号以流的方式在网络中传播。解码端接收到音频编码信号,首先,通过自适应抖动缓冲区,对接收到的数据包进行重排序,并统计丢包率和延迟时间;然后,将重排序后的数据包送入解码器解码,并获取丢包数据的编码模式,即音频信号类型;最后,把丢包率、延迟时间、音频信号类型送入无参考音频质量评价模块,对音频信号进行质量评价,并实时反馈到发送端的编码模块和解码端的缓冲区,通过自适应调节缓冲区大小、编码码率等参数,使音频质量MOSc取最大值,从而给用户提供更好的音频感知体验,并尽可能节省网络资源。

Claims (4)

1.音频信号特性分类的无参考音频质量评价方法,其特征在于,包括步骤:
步骤1,基于有参考音频质量评价模型建立训练模型,采用机器学习获取不同类型音频信号的音频质量与网络参数的关系,即无参考音频质量评价模型,所述的网络参数包括延迟时间和丢包率;
步骤2,在音频信号网络传输中,将当前丢包率、当前延迟时间和当前丢包数据的音频信号类型输入无参考音频质量评价模型,获得当前音频质量;
步骤1进一步包括子步骤:
1.1将原始音经编码、丢包、解码后得到降质音频,利用有参考音频质量评价模型对降质音频进行质量评价得到客观质量得分MOS;
1.2将降质音频延迟产生延迟损伤,在客观质量得分MOS上减去延迟损伤Id,得到音频质量MOSc;
1.3以音频质量MOSc为目标,以延迟时间、丢包率、音频信号类型为输入,通过机器学习方式获得不同类型音频信号的音频质量与网络参数的关系,即无参考音频质量评价模型;
步骤2进一步包括子步骤:
2.1采用不同编码模式分别对不同类型音频信号进行编码获得音频编码信息;
2.2对音频编码信息进行解码,并统计当前丢包率和当前延迟时间,恢复丢包数据的编码模式,获取当前丢包数据的音频信号类型;
2.3将当前丢包率、当前延迟时间和当前丢包数据的音频信号类型输入无参考音频质量评价模型,获得当前音频质量MOSc。
2.如权利要求1所述的音频信号特性分类的无参考音频质量评价方法,其特征在于,还包括步骤:
根据当前音频质量调整延迟时间和编码码率,使当前音频质量取最大值。
3.一种音频信号特性分类的无参考音频质量评价系统,其特征在于,包括:
训练模块,基于有参考音频质量评价模型建立训练模型,采用机器学习获取不同类型音频信号的音频质量与网络参数的关系,即无参考音频质量评价模型,所述的网络参数包括延迟时间和丢包率;
质量评价模块,用来在音频信号网络传输中,将当前丢包率、当前延迟时间和当前丢包数据的音频信号类型输入无参考音频质量评价模型,获得当前音频质量;
所述的训练模块进一步包括子模块:
有参考音频质量评分模块,用来将原始音经编码、丢包、解码后得到降质音频,利用有参考音频质量评价模型对降质音频进行质量评价得到客观质量得分MOS;
音频质量评分模块,用来将降质音频延迟产生延迟损伤,在客观质量得分MOS上减去延迟损伤Id,得到音频质量MOSc;
机器学习模块,用来以音频质量MOSc为目标,以延迟时间、丢包率、音频信号类型为输入,通过机器学习方式获得不同类型音频信号的音频质量与网络参数的关系,即无参考音频质量评价模型;
所述的质量评价模块进一步包括子模块:
编码模块,用来采用不同编码模式分别对不同类型音频信号进行编码获得音频编码信息;
网络参数和音频信号类型获得模块,用来对音频编码信息进行解码,并统计当前丢包率和当前延迟时间,恢复丢包数据的编码模式,获取当前丢包数据的音频信号类型;
质量评价模块,用来将当前丢包率、当前延迟时间和当前丢包数据的音频信号类型输入无参考音频质量评价模型,获得当前音频质量MOSc。
4.如权利要求3所述的音频信号特性分类的无参考音频质量评价系统,其特征在于,还包括:
网络参数调整模块,用来根据当前音频质量调整延迟时间和编码码率,使当前音频质量取最大值。
CN201410196690.2A 2014-05-09 2014-05-09 基于音频信号特性分类的无参考音频质量评价方法和系统 Expired - Fee Related CN103957216B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410196690.2A CN103957216B (zh) 2014-05-09 2014-05-09 基于音频信号特性分类的无参考音频质量评价方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410196690.2A CN103957216B (zh) 2014-05-09 2014-05-09 基于音频信号特性分类的无参考音频质量评价方法和系统

Publications (2)

Publication Number Publication Date
CN103957216A CN103957216A (zh) 2014-07-30
CN103957216B true CN103957216B (zh) 2017-10-03

Family

ID=51334442

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410196690.2A Expired - Fee Related CN103957216B (zh) 2014-05-09 2014-05-09 基于音频信号特性分类的无参考音频质量评价方法和系统

Country Status (1)

Country Link
CN (1) CN103957216B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104575521A (zh) * 2014-12-26 2015-04-29 大连理工大学 一种lte通信系统语音质量的评估方法
CN107221334B (zh) * 2016-11-01 2020-12-29 武汉大学深圳研究院 一种音频带宽扩展的方法及扩展装置
CN108206027A (zh) * 2016-12-20 2018-06-26 北京酷我科技有限公司 一种音频质量评价方法及系统
CN108346434B (zh) * 2017-01-24 2020-12-22 中国移动通信集团安徽有限公司 一种语音质量评估的方法和装置
CN110300003B (zh) * 2018-03-21 2021-01-12 华为技术有限公司 数据处理方法以及客户端
CN108495182A (zh) * 2018-03-23 2018-09-04 山西大学 一种音频质量自调整控制方法
CN110401622B (zh) * 2018-04-25 2022-04-29 中国移动通信有限公司研究院 一种语音质量评估方法、装置、电子设备和存储介质
CN109274813A (zh) * 2018-08-14 2019-01-25 Oppo广东移动通信有限公司 码率优化方法、装置、电子设备以及存储介质
US11133888B2 (en) * 2019-05-06 2021-09-28 Qualcomm Incorporated Codec configuration adaptation based on packet loss rate
CN110503981A (zh) * 2019-08-26 2019-11-26 苏州科达科技股份有限公司 无参考音频客观质量评价方法、装置及存储介质
CN111508528B (zh) * 2020-03-12 2023-02-28 上海交通大学 基于自然音频统计特性的无参考音频质量评价方法和装置
CN111863033B (zh) * 2020-07-30 2023-12-12 北京达佳互联信息技术有限公司 音频质量识别模型的训练方法、装置、服务器和存储介质
CN111968677B (zh) * 2020-08-21 2021-09-07 南京工程学院 面向免验配助听器的语音质量自评估方法
CN112822482B (zh) * 2020-12-31 2022-11-08 上海掌门科技有限公司 一种确定音视频通话的评估得分的方法与设备
CN116343966B (zh) * 2023-03-27 2023-11-17 山东大学 基于延迟因子的概率乘累加结构损伤成像定位方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101616315A (zh) * 2008-06-25 2009-12-30 华为技术有限公司 一种视频质量评价方法、装置和系统
CN102044248A (zh) * 2009-10-10 2011-05-04 北京理工大学 一种针对流媒体音频质量的客观评测方法
CN102496369A (zh) * 2011-12-23 2012-06-13 中国传媒大学 一种基于失真校正的压缩域音频质量客观评价方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101616315A (zh) * 2008-06-25 2009-12-30 华为技术有限公司 一种视频质量评价方法、装置和系统
CN102044248A (zh) * 2009-10-10 2011-05-04 北京理工大学 一种针对流媒体音频质量的客观评测方法
CN102496369A (zh) * 2011-12-23 2012-06-13 中国传媒大学 一种基于失真校正的压缩域音频质量客观评价方法

Also Published As

Publication number Publication date
CN103957216A (zh) 2014-07-30

Similar Documents

Publication Publication Date Title
CN103957216B (zh) 基于音频信号特性分类的无参考音频质量评价方法和系统
CN101523916B (zh) 确定视频质量的方法
EP2767039B1 (en) Quality of user experience testing for video transmissions
CN101636990B (zh) 在通信系统中传输数据的方法
US8874043B2 (en) System and method for determining quality of service of a mobile device
US11748643B2 (en) System and method for machine learning based QoE prediction of voice/video services in wireless networks
CN101854308B (zh) VoIP系统高音质服务网络自适应实现方法
CN103987067B (zh) 一种基于数据挖掘的3g语音业务质量评估方法
KR20150031287A (ko) 오디오 스트림 품질 평가 방법 및 장치
CN109714557A (zh) 视频通话的质量评估方法、装置、电子设备和存储介质
WO2016134564A1 (zh) 一种用户感知评估方法及装置
KR20150003316A (ko) 미디어 품질 평가 방법 및 장치
CN113411218B (zh) 即时通信质量的评价方法、装置和电子设备
CN103354588A (zh) 录放音采样率的确定方法、装置及系统
CN101636786A (zh) 在通信系统中传送数据的方法
CN107979482B (zh) 一种信息处理方法、装置、发送端、去抖动端、接收端
Osmanovic et al. Impact of media-related SIFs on QoE for H. 265/HEVC video streaming
CN105376750B (zh) 语音质量评估方法及设备
CN115132229A (zh) 语音质量评估系统
US11070666B2 (en) Methods and devices for improvements relating to voice quality estimation
Ning et al. A novel QoS-based QoE evaluation method for streaming video service
JP2007329776A (ja) ネットワーク品質分析装置、品質クラス決定装置、ネットワーク品質分析方法、品質クラス決定方法、およびプログラム
Hernandez Rabassa Simulation platform for the planning and design of networks carrying voip traffic
CN1330151C (zh) 一种测量封包型网络传输的目标播放质量的方法
CN106464981A (zh) 视频传输方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20171003

Termination date: 20190509

CF01 Termination of patent right due to non-payment of annual fee