CN108683909B - Vr音视频整体用户体验质量评估方法 - Google Patents

Vr音视频整体用户体验质量评估方法 Download PDF

Info

Publication number
CN108683909B
CN108683909B CN201810760545.0A CN201810760545A CN108683909B CN 108683909 B CN108683909 B CN 108683909B CN 201810760545 A CN201810760545 A CN 201810760545A CN 108683909 B CN108683909 B CN 108683909B
Authority
CN
China
Prior art keywords
video
audio
quality
user experience
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810760545.0A
Other languages
English (en)
Other versions
CN108683909A (zh
Inventor
王晶
罗逸雨
张博
闫昭宇
杨舒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN201810760545.0A priority Critical patent/CN108683909B/zh
Publication of CN108683909A publication Critical patent/CN108683909A/zh
Application granted granted Critical
Publication of CN108683909B publication Critical patent/CN108683909B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • H04N17/004Diagnosis, testing or measuring for television systems or their details for digital television systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

本发明公开的VR音视频整体用户体验质量评估方法,特别涉及虚拟现实环境中的音视频整体用户体验质量评估方法,属于多媒体技术领域。本发明实现方法为:将待测VR音视频和参考VR音视频通过第一层中的视频质量、音频质量、音视频时间相互作用和空间相互作用模型,分别计算出待测VR音视频的视频质量参数、音频质量参数、音视频时间参数和音视频空间参数;将所述四个参数输入第二层中的整体质量融合模型,最终输出待测VR音视频的整体质量分数;所述的空间相互作用模型是由基于用户主观感受而设计的函数关系实现的。本发明能够反映音视频空间相互作用对VR音视频整体用户体验质量的影响,使评估效果更符合用户的主观感受。

Description

VR音视频整体用户体验质量评估方法
技术领域
本发明涉及一种音视频整体用户体验质量评估方法,特别涉及虚拟现实环境中的音视频整体用户体验质量评估,属于多媒体技术领域。
背景技术
虚拟现实(Virtual Reality,简称VR)技术给人们带来了全新的音视频体验,其中全景视频和空间音频是沉浸式体验的不可或缺的组成部分。凭借其良好的用户体验与人机交互性,虚拟现实技术被广泛应用于娱乐、教育、医疗以及工业等诸多领域,在一定程度上改变了原有的生产设计方式。在虚拟现实环境中影响用户体验的不仅仅是全景视频,还有空间音频以及音视频的混合效果,这意味着VR环境下用户体验评估模型与传统视频质量评估有着显著的不同。与此同时,用户对于VR音视频体验的要求也日益增长,如何为用户提供良好的音视频体验已成为近年来相关领域的研究热点。
VR视频指的是对于一个固定的观察点提供水平观测方位角360度,垂直观测方位角180度保证用户自由观看的全景视频。当观看者使用VR头戴式显示器时,计算机或其他设备根据头部的运动信息进行计算并将数据传输回显示器,使用户可以看到全景视频的来自各个方位的图像,带给用户沉浸感。对于VR体验来说,音频的空间感也极其重要。当观看者戴上耳机后,空间音效能保证在虚拟世界中的声音有迹可循,意味着视觉中前方发出的声音会从前方传来,后方发出的声音会从后方传来。
在VR环境下,全景视频和空间音频间的相互作用同样会对用户体验质量造成影响,分为两个方面:时间和空间。音视频时间同步指音频和视频同时开始并且同时结束。音视频时间同步能使音频与视频内容建立联系,相得益彰。音视频空间一致指空间音频(听觉)中音源位置与全景视频(视觉)中音源位置相同。音视频空间一致能营造一种身临其境的气氛,增强真实感与沉浸感。
现有的音视频整体质量评估方法大多针对传统音视频,并未结合VR环境中的全景视频与空间音频特点以及音视频相互作用的影响。我国授权公开号为CN 103379358B的专利“评估多媒体质量的方法和装置”公开了一种评估多媒体质量的方法和装置,但并未考虑到音视频空间相互作用,并不适用于VR环境下的音视频整体用户体验质量评估。
发明内容
本发明公开的VR音视频整体用户体验质量评估方法要解决的技术问题是:提供一种VR音视频整体用户体验质量评估模型实现对VR环境下的音视频整体用户体验质量进行评估,评估效果结合音视频空间相互作用,使评估效果符合用户的主观感受。
所述模型输入为一段损伤VR音视频和一段同样内容的无损VR音视频,输出为损伤VR音视频的整体质量分数。其中,损伤VR音视频也称为待测VR音视频;无损VR音视频也称为参考VR音视频。该模型共分为两层,第一层中含四个子模型:视频质量、音频质量、音视频时间相互作用和音视频空间相互作用模型,第二层为整体质量融合模型。
本发明目的是通过下述技术方案实现。
本发明公开的VR音视频整体用户体验质量评估方法,首先将待测VR音视频和参考VR音视频通过第一层中的视频质量、音频质量、音视频时间相互作用和空间相互作用模型,分别计算出待测VR音视频的视频质量参数、音频质量参数、音视频时间参数和音视频空间参数。然后将所述四个参数输入第二层中的整体质量融合模型,最终输出待测VR音视频的整体质量分数。所述的视频质量、音频质量计算采用视频、音频质量客观评估算法实现。所述的音视频时间相互作用计算采用函数关系f实现。所述的空间相互作用模型采用函数关系g实现。所述的空间相互作用模型是由基于用户主观感受而设计的函数关系g实现的,进而能够反映音视频空间相互作用对VR音视频整体用户体验质量的影响,使评估效果更符合用户的主观感受。
本发明公开的VR音视频整体用户体验质量评估方法,包括如下步骤:
步骤一:将待测VR音视频和参考VR音视频输入到第一层中的视频质量模型中,计算得到待测VR音视频的视频质量分数Qv
所述的视频质量模型用于计算得到待测VR音视频的视频质量分数Qv,采用全参考视频质量客观评估算法,全参考视频质量客观评估算法包括传统视频质量评估算法或者为全景视频质量评估算法。传统视频质量评估算法包括峰值信噪比PSNR、结构相似性SSIM、视频质量度量VQM。
作为优选,采用峰值信噪比PSNR算法,计算方法如公式(1)、(2)所示。
Figure BDA0001727769610000031
Figure BDA0001727769610000032
M为视频帧的长度,N为视频帧的宽度。X代表无损参考视频帧,Y代表对应失真待测视频帧。bits为采样值的比特数。MSE为均方误差。最终得到的PSNR值即为待测VR音视频的视频质量分数Qv
步骤二:将待测VR音视频和参考VR音视频输入到第一层中的音频质量模型中,计算得到待测VR音视频的音频质量分数Qa
所述的音频质量模型用于计算得到待测VR音视频的音频质量分数Qa,采用全参考音频质量客观评估算法,全参考音频质量客观评估算法选用传统音频质量评估算法或者为空间音频质量评估算法。传统音频质量评估算法包括感知音频质量评估PEAQ。
步骤三:将待测VR音视频输入到第一层中的音视频时间相互作用模型中,计算得到待测VR音视频的时间相互作用分数Qt
步骤3.1:提取待测VR音视频的音频时间信息和视频时间信息,计算得到音视频时间差Δt。Δt为正,代表音频超前视频;Δt为负,代表音频滞后视频。
步骤3.2:根据公式(3)计算得到待测VR音视频的时间相互作用分数Qt
Qt=f(Δt) (3)
其中函数关系f为线性、非线性或者为线性与非线性的组合。|Δt|值越大,音视频时间差Δt越大,时间相互作用分数Qt越小,用户体验质量越差。函数关系f是基于用户主观感受而设计的。
作为优选,函数关系f采用指数函数的形式,如公式(4)所示:
Figure BDA0001727769610000033
参数a,b均为正常数,参数b取值范围为(0,1)。参数a,b的具体数值由经验设计或主观实验数据训练得到。|Δt|值越大,音视频时间差|Δt|越大,时间相互作用分数Qt越小,用户体验质量越差,反映出函数关系f能较好地符合用户的主观感受。
步骤四:将待测VR音视频输入到第一层中的音视频空间相互作用模型中,计算得到待测VR音视频的音视频空间相互作用分数Qs
步骤4.1:提取音频中的音源数目及位置信息。音源总数目用正整数n表示,音源位置用三维直角坐标(x,y,z)来表示。
音频中的音源位置信息集合表示为{La1(x,y,z),La2(x,y,z)…Lan(x,y,z)}。
步骤4.2:提取视频中的音源位置信息。视频中音源位置信息集合表示为{Lv1(x,y,z),Lv2(x,y,z)…Lvn(x,y,z)}。视频中音源与音频中的对应音源位置信息中左下脚标序号相同。
步骤4.3:根据两点间距离公式计算音频中音源与视频中音源的距离{d1,d2,…dn}。
根据公式(5)、(6)计算得到待测VR音视频的空间相互作用分数Qs
Figure BDA0001727769610000041
Qs=g(d) (6)
其中函数关系g为线性、非线性或线性与非线性的组合。音频与视频中音源距离平均值d越大,听觉认知与视觉认知差距越大,空间相互作用分数Qs值越小,用户体验质量越差。函数关系g是基于用户主观感受而设计的。
作为优选,函数关系g采用指数函数的形式,如公式(7)所示:
Qs=c1*c2 d (7)
参数c1,c2均为正常数,参数c2取值范围为(0,1)。参数c1,c2的具体数值由经验设计或主观实验数据训练得到。d值越大,音视频间音源的距离差越大,空间相互作用分数Qs越小,用户体验质量越差,反映出函数关系g能较好地符合用户的主观感受。
上述步骤一,二,三和四能够交换顺序,序号不是时间上的先后顺序,只是步骤的标记。
步骤五:将上述四个步骤得出的视频质量分数Qv,音频质量分数Qa,音视频时间相互作用分数Qt和音视频空间相互作用分数Qs输入第二层中的整体质量融合模型,最终输出待测VR音视频的整体质量分数Q。
所述第二层中的整体质量融合模型为线性回归、非线性回归或者神经网络模型。融合模型的参数是基于用户主观感受而设计的。
作为优选,采用神经网络模型。神经网络模型的输入参数为{Qv,Qa,Qt,Qs}。视频质量分数Qv,音频质量分数Qa,音视频时间相互作用分数Qt和音视频空间相互作用分数Qs是通过步骤一到步骤四计算得到的。输出参数为VR音视频整体用户体验质量的主观实验得分。利用训练数据训练得到BP神经网络的参数,使得{Qv,Qa,Qt,Qs}分数融合的结果尽可能接近主观得分,使得BP神经网络模型符合用户的主观感受。
至此,通过步骤一到步骤五,即完成VR音视频整体用户体验质量的评估,评估效果结合音、视频空间相互作用,使评估效果更符合用户的主观感受。
有益效果:
1、本发明公开的VR音视频整体用户体验质量评估方法,在实现VR音视频整体用户体验质量评估时,首次结合VR音视频空间相互作用,并给出基于用户主观感受而设计的函数关系g,进而能够反映音视频空间相互作用对整体用户体验质量的影响,使评估结果更符合用户的主观感受。
2、本发明公开的VR音视频整体用户体验质量评估方法,将步骤四计算得到音视频空间相互作用分数Qs融入传统多媒体质量评估方法,使对VR环境下的音视频整体用户体验质量评估能够反映音视频空间相互作用对整体用户体验质量的影响,使评估结果更符合用户的主观感受。
3、实验表明,本发明公开的VR音视频整体用户体验质量评估方法,通过本方法得到的VR音视频整体质量分数Q与主观实验结果间的相关性较高,反映出本方法具有较高的准确性。
附图说明
图1为本发明中整体质量融合模型优选例BP神经网络结构图;
图2为本发明公开的VR音视频整体用户体验质量评估方法的流程图;
图3为本发明实施例中的结果散点图。
具体实施方式
下面结合附图和实施例对本发明作进一步描述。
本实施例基于两段VR音视频对VR音视频整体用户体验质量评估模型进行说明,其中一段为无损参考音视频Reference.mp4,另一段为有损待测音视频Test.mp4。参考视频与待测视频为内容相同,分辨率4096*2048的经纬图格式全景视频。两个视频均为时长10s,帧率30fps。损伤视频是由无损视频经过H.264压缩编码后得到的。参考视频的码率为50Mbps,待测视频的码率为3Mbps。
参考与待测VR音视频内容为咖啡厅中的对话场景,一共6个音源:背景音,男声,女声,服务员,人群1,人群2。对应6条音频材料时长均为10s(与视频相同),双声道48KHz采样率,WAV格式。
VR音视频制作软件为Unity 3D。
本发明方法的实施步骤如图2所示,具体如下:
步骤一:将待测VR音视频和参考VR音视频输入到第一层中的视频质量模型中,计算得到待测VR音视频的视频质量分数Qv
采用PSNR算法计算待测VR音视频质量分数。计算公式如下:
Figure BDA0001727769610000061
Figure BDA0001727769610000062
X代表无损参考视频帧,Y代表对应失真视频帧。待测VR音视频共300帧,将所有帧的PSNR值取平均即可得待测VR音视频的视频质量分数Qv
步骤二:将待测VR音视频和参考VR音视频输入到第一层中的音频质量模型中,计算得到待测VR音视频的音频质量分数Qa。参考与待测VR音视频中共6个音源:背景音,男声,女声,服务员,人群1,人群2。
使用PEAQ算法计算出所有音频的质量,PEAQ(i)代表第i个音频的质量分数。将所有音频的质量分数取平均值后即可得待测VR音视频的音频质量分数Qa。计算公式如下:
Figure BDA0001727769610000063
步骤三:将待测VR音视频输入到第一层中的音视频时间相互作用模型中,计算得到待测VR音视频的时间相互作用分数Qt
步骤3.1:提取音频时间信息和视频时间信息,得到音视频时间差Δt。Δt为正2s,代表音频超前视频2s。
步骤3.2:计算待测VR音视频的时间相互作用分数Qt
本实例中Qt与Δt为公式(11)所示的函数关系:
Figure BDA0001727769610000071
常数a,b的具体数值由经验设计或主观实验数据训练得到。本实例中采用5分满分制,常数a值取5,常数b值取0.5。
步骤四:将待测VR音视频输入到第一层中的音视频空间相互作用模型中,计算得到音视频空间相互作用分数Qs
步骤4.1:从Unity 3D工程中提取音频中的音源位置信息。待测VR音视频场景中共6个音源:背景音,男声,女声,服务员,人群1,人群2。音频中的音源位置信息集合可在直角坐标系下表示为:
La1(背景音):(0,0,0)
La2(男声):(3.4,-2.2,2.58)
La3(女声):(4.39,-1.29,0.44)
La4(服务员):(1.9,-0.8,-4.29)
La5(人群1):(-4.04,-1,-2)
La6(人群2):(-4.7,-0.8,-0.2)
步骤4.2:从Unity 3D工程中提取视频中的音源位置信息。视频中音源与音频中对应音源位置左下脚标序号相同。视频中的音源位置信息集合可在直角坐标系下表示为:
Lv1(背景音):(0,0,0)
Lv2(男声):(-3.4,2.2,-2.58)
Lv3(女声):(-4.39,1.29,-0.44)
Lv4(服务员):(-1.9,0.8,4.29)
Lv5(人群1):(4.04,1,2)
Lv6(人群2):(4.7,0.8,0.2)
步骤4.3:计算音频中音源与视频中音源的距离{d1,d2,…d6}。
d1=0,d2=9.60,d3=9.19,d4=9.52,d5=9.24,d6=9.54
距离平均值d=7.85,本实例中Qs与d具有公式(12)所示的函数关系:
Qs=c1*c2 d (12)
常数c1,c2的具体数值由经验设计或主观实验数据训练得到。本实例中采用5分满分制,常数c1值取5,常数c2值取0.85。
上述步骤一,二,三和四可以交换顺序,序号不是时间上的先后顺序,只是步骤的标记。
步骤五:将上述四个步骤得出的视频质量分数Qv,音频质量分数Qa,音视频时间相互作用分数Qt和音视频空间相互作用分数Qs输入第二层中的整体质量融合模型,最终输出待测VR音视频的整体质量分数Q。
本实例中使用BP神经网络模型作为融合模型。BP神经网络含4个输入结点,1个输出结点,一个结点数目为12的隐藏层。
BP神经网络参数由主观实验结果训练得到。在上述主观实验中,测试者观看待测VR音视频并对音视频整体质量进行打分。BP神经网络的训练过程为:将通过步骤一到步骤四计算得到的{Qv,Qa,Qt,Qs}分数作为输入,主观实验得分作为输出,使得{Qv,Qa,Qt,Qs}分数融合的结果尽可能接近主观得分,得到的BP神经网络模型符合用户的主观感受。
使用本发明方法对VR音视频数据库中的810条待测VR音视频整体质量进行评估,图3为本方法在本实例中的评估结果散点图。图中散点的横坐标为由本方法计算得到的VR音视频整体质量分数Q,纵坐标为主观实验得分。y=x线上的点横纵坐标相同,代表客观模型评估分数与主观实验得分完全相同。图中散点分布的趋势比较接近y=x线,反映出本方法得到的整体质量分数Q与主观实验结果间的相关性较高,具有较高的准确性。
使用斯皮尔曼秩相关系数SROCC来衡量客观模型评估结果与主观实验结果间的相关性。SROCC值越大,代表本方法得到的整体质量分数Q与主观实验结果间的相关性越高,准确性越高。
表1为采用全部输入参数与去掉某一参数的评估模型性能对比。从表1可得输入无空间相互作用参数时,即输入为{Qv,Qa,Qt}时,SROCC值为0.6737;输入为全部参数,即输入为{Qv,Qa,Qt,Qs}时,SROCC值为最大值0.7514,相比输入无空间相互作用参数时的相关性提高了11.5%。以上数据反映出本方法通过设计函数g来计算音视频空间相互作用分数Qs,并将Qs融入传统多媒体质量评估方法,进而能够反映音视频空间相互作用对整体用户体验质量的影响,使评估结果更符合用户的主观感受,具有较高的准确性。
表1全部输入参数与去掉某一参数对比
输入参数集 SROCC
全部参数 0.7514
无视频质量Q<sub>v</sub> 0.3340
无音频质量Q<sub>a</sub> 0.7316
无时间相互作用参数Q<sub>t</sub> 0.7295
无空间相互作用参数Q<sub>s</sub> 0.6737
以上所述的具体描述,对发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.VR音视频整体用户体验质量评估方法,其特征在于:包括如下步骤,
步骤一:将待测VR音视频和参考VR音视频输入到第一层中的视频质量模型中,计算得到待测VR音视频的视频质量分数Qv
步骤二:将待测VR音视频和参考VR音视频输入到第一层中的音频质量模型中,计算得到待测VR音视频的音频质量分数Qa
步骤三:将待测VR音视频输入到第一层中的音视频时间相互作用模型中,计算得到待测VR音视频的时间相互作用分数Qt
步骤四:将待测VR音视频输入到第一层中的音视频空间相互作用模型中,计算得到待测VR音视频的空间相互作用分数Qs
上述步骤一,二,三和四能够交换顺序,序号不是时间上的先后顺序,只是步骤的标记;
步骤五:将上述四个步骤得出的视频质量分数Qv,音频质量分数Qa,音视频时间相互作用分数Qt和音视频空间相互作用分数Qs输入第二层中的整体质量融合模型,最终输出待测VR音视频的整体质量分数Q;
至此,通过步骤一到步骤五,即完成VR音视频整体用户体验质量的评估,评估效果结合音、视频空间相互作用,使评估效果更符合用户的主观感受;
步骤三具体实现方法为,
步骤3.1:提取待测VR音视频的音频时间信息和视频时间信息,计算得到音视频时间差Δt;Δt为正,代表音频超前视频;Δt为负,代表音频滞后视频;
步骤3.2:根据公式(3)计算得到待测VR音视频的时间相互作用分数Qt
Qt=f(Δt) (3)
其中函数关系f为线性、非线性或者为线性与非线性的组合;|Δt|越大,时间相互作用分数Qt越小,用户体验质量越差;函数关系f是基于用户主观感受而设计的;
步骤四具体实现方法为,
步骤4.1:提取音频中的音源数目及位置信息;音源总数目用正整数n表示,音源位置用三维直角坐标(x,y,z)来表示;
步骤4.2:提取视频中的音源位置信息;
步骤4.3:根据两点间距离公式计算音频中音源与视频中音源的距离{d1,d2,...dn};
根据公式(1)、(2)计算得到待测VR音视频的空间相互作用分数Qs
Figure FDA0002491455890000021
Qs=g(d) (2)
其中函数关系g为线性、非线性或线性与非线性的组合;音频与视频中音源距离平均值d越大,听觉认知与视觉认知差距越大,空间相互作用分数Qs值越小,用户体验质量越差;函数关系g是基于用户主观感受而设计的。
2.如权利要求1所述的VR音视频整体用户体验质量评估方法,其特征在于:步骤一具体实现方法为,
所述的视频质量模型用于计算得到待测VR音视频的视频质量分数Qv,采用全参考视频质量客观评估算法,全参考视频质量客观评估算法选用传统视频质量评估算法;传统视频质量评估算法包括峰值信噪比PSNR、结构相似性SSIM或视频质量度量VQM。
3.如权利要求1或2所述的VR音视频整体用户体验质量评估方法,其特征在于:步骤一采用峰值信噪比PSNR算法,计算方法如公式(4)、(5)所示;
Figure FDA0002491455890000022
Figure FDA0002491455890000023
M为视频帧的长度,N为视频帧的宽度;X代表无损参考视频帧,Y代表对应失真待测视频帧;bits为采样值的比特数;MSE为均方误差;最终得到的PSNR值即为待测VR音视频的视频质量分数Qv
4.如权利要求1所述的VR音视频整体用户体验质量评估方法,其特征在于:步骤二所述的音频质量模型用于计算得到待测VR音视频的音频质量分数Qa,采用全参考音频质量客观评估算法,全参考音频质量客观评估算法选用传统音频质量评估算法;传统音频质量评估算法包括感知音频质量评估PEAQ。
5.如权利要求1所述的VR音视频整体用户体验质量评估方法,其特征在于:步骤三函数关系f采用指数函数的形式,如公式(6)所示:
Figure FDA0002491455890000031
参数a,b均为正常数,参数b取值范围为(0,1);参数a,b的具体数值由经验设计或主观实验数据训练得到;|Δt|越大,时间相互作用分数Qt越小,用户体验质量越差,反映出函数关系f能较好地符合用户的主观感受。
6.如权利要求1所述的VR音视频整体用户体验质量评估方法,其特征在于:步骤四所述函数关系g采用指数函数的形式,如公式(7)所示:
Qs=c1*c2 d (7)
参数c1,c2均为正常数,参数c2取值范围为(0,1);参数c1,c2的具体数值由经验设计或主观实验数据训练得到;d值越大, 音视频间音源的距离差越大,空间相互作用分数Qs越小,用户体验质量越差,反映出函数关系g能较好地符合用户的主观感受。
7.如权利要求1所述的VR音视频整体用户体验质量评估方法,其特征在于:步骤五所述第二层中的整体质量融合模型为线性回归、非线性回归或者神经网络模型;融合模型的参数是基于用户主观感受而设计的。
8.如权利要求7所述的VR音视频整体用户体验质量评估方法,其特征在于:步骤五的整体质量融合模型采用BP神经网络模型;神经网络模型的输入参数为{Qv,Qa,Qt,Qs};视频质量分数Qv,音频质量分数Qa,音视频时间相互作用分数Qt和音视频空间相互作用分数Qs是通过步骤一到步骤四计算得到的;输出参数为VR音视频整体用户体验质量的主观实验得分;利用训练数据训练得到BP神经网络的参数,使得{Qv,Qa,Qt,Qs}分数融合的结果尽可能接近主观得分,使得BP神经网络模型符合用户的主观感受。
CN201810760545.0A 2018-07-12 2018-07-12 Vr音视频整体用户体验质量评估方法 Active CN108683909B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810760545.0A CN108683909B (zh) 2018-07-12 2018-07-12 Vr音视频整体用户体验质量评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810760545.0A CN108683909B (zh) 2018-07-12 2018-07-12 Vr音视频整体用户体验质量评估方法

Publications (2)

Publication Number Publication Date
CN108683909A CN108683909A (zh) 2018-10-19
CN108683909B true CN108683909B (zh) 2020-07-07

Family

ID=63814019

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810760545.0A Active CN108683909B (zh) 2018-07-12 2018-07-12 Vr音视频整体用户体验质量评估方法

Country Status (1)

Country Link
CN (1) CN108683909B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109089112B (zh) * 2018-10-29 2019-12-27 中国传媒大学 一种多声道虚拟声像音视频在线检测方法及装置
CN110505454B (zh) * 2019-08-29 2020-11-10 西安电子科技大学 基于场景模式与用户感知需求的视频供给系统与方法
CN113031756A (zh) * 2019-12-09 2021-06-25 华为技术有限公司 一种评测vr体验临场感的方法、装置及系统
CN111479105B (zh) * 2020-03-12 2021-06-04 上海交通大学 一种视频及音频联合质量评价方法和装置
CN111479107B (zh) * 2020-03-12 2021-06-08 上海交通大学 基于自然音视频统计的无参考音视频联合质量评价方法
CN111479106B (zh) * 2020-03-12 2021-06-29 上海交通大学 一二维质量描述子融合的音视频联合质量评价方法及终端
CN112202800B (zh) * 2020-10-10 2021-10-01 中国科学技术大学 C-ran架构中基于强化学习的vr视频边缘预取方法和系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103379358A (zh) * 2012-04-23 2013-10-30 华为技术有限公司 评估多媒体质量的方法和装置
CN106388833A (zh) * 2016-09-09 2017-02-15 宇龙计算机通信科技(深圳)有限公司 一种虚拟现实心理素质评估方法及评估系统
CN107170468A (zh) * 2017-04-10 2017-09-15 北京理工大学 一种基于两层模型的多声道音频质量评价方法
CN107483920A (zh) * 2017-08-11 2017-12-15 北京理工大学 一种基于多层级质量因子的全景视频评估方法及系统
CN108259893A (zh) * 2018-03-22 2018-07-06 天津大学 基于双流卷积神经网络的虚拟现实视频质量评价方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7873727B2 (en) * 2008-03-13 2011-01-18 Board Of Regents, The University Of Texas Systems System and method for evaluating streaming multimedia quality

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103379358A (zh) * 2012-04-23 2013-10-30 华为技术有限公司 评估多媒体质量的方法和装置
CN106388833A (zh) * 2016-09-09 2017-02-15 宇龙计算机通信科技(深圳)有限公司 一种虚拟现实心理素质评估方法及评估系统
CN107170468A (zh) * 2017-04-10 2017-09-15 北京理工大学 一种基于两层模型的多声道音频质量评价方法
CN107483920A (zh) * 2017-08-11 2017-12-15 北京理工大学 一种基于多层级质量因子的全景视频评估方法及系统
CN108259893A (zh) * 2018-03-22 2018-07-06 天津大学 基于双流卷积神经网络的虚拟现实视频质量评价方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Audio-Visual Multimedia Quality Assessment: A Comprehensive Survey;ZAHID AKHTAR,et al;《IEEE Access》;20171025;第21090 - 21117 页 *

Also Published As

Publication number Publication date
CN108683909A (zh) 2018-10-19

Similar Documents

Publication Publication Date Title
CN108683909B (zh) Vr音视频整体用户体验质量评估方法
Cao et al. Visual quality of compressed mesh and point cloud sequences
Moorthy et al. Visual quality assessment algorithms: what does the future hold?
Abrantes et al. MPEG-4 facial animation technology: Survey, implementation, and results
TW200841736A (en) Systems and methods for providing personal video services
Tamboli et al. Super-multiview content with high angular resolution: 3D quality assessment on horizontal-parallax lightfield display
JP2016527791A (ja) 画像処理方法及び装置
CN110944200B (zh) 一种评估沉浸式视频转码方案的方法
JP2022550372A (ja) オーディオビジュアルコンテンツについてバイノーラルイマーシブオーディオを作成するための方法及びシステム
US11176966B2 (en) Systems and methods for generating and presenting virtual experiences
Garg et al. Geometry-aware multi-task learning for binaural audio generation from video
CN104361583B (zh) 一种确定非对称失真立体图像客观质量的方法
EP3777249A1 (en) An apparatus, a method and a computer program for reproducing spatial audio
Mozhaeva et al. Constant subjective quality database: the research and device of generating video sequences of constant quality
Kim et al. Immersive audio-visual scene reproduction using semantic scene reconstruction from 360 cameras
CN108540925B (zh) 一种个性化头相关传递函数的快速匹配方法
Zhang et al. An audio-visual quality assessment methodology in virtual reality environment
Robotham et al. Audiovisual database with 360 video and higher-order Ambisonics audio for perception, cognition, behavior, and QoE evaluation research
CN113630646A (zh) 一种数据处理方法及装置、设备、存储介质
Horiuchi et al. Interactive music video application for smartphones based on free-viewpoint video and audio rendering
Peksi et al. A Unity Based Platform for Individualized HRTF Research and Development: From On-the-Fly Fast Acquisition to Spatial Audio Renderer
Fremerey et al. Between the frames-Evaluation of various motion interpolation algorithms to improve 360 video quality
WO2020233536A1 (zh) Vr视频质量评估方法及装置
CN107566847B (zh) 一种将触感数据编码为视频流进行保存和传输的方法
CN110401832A (zh) 一种基于时空管道建模的全景视频客观质量评估方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant