CN109005402A - 一种视频的评估方法及装置 - Google Patents
一种视频的评估方法及装置 Download PDFInfo
- Publication number
- CN109005402A CN109005402A CN201710424338.3A CN201710424338A CN109005402A CN 109005402 A CN109005402 A CN 109005402A CN 201710424338 A CN201710424338 A CN 201710424338A CN 109005402 A CN109005402 A CN 109005402A
- Authority
- CN
- China
- Prior art keywords
- video
- parameter
- scoring
- assessment models
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N17/00—Diagnosis, testing or measuring for television systems or their details
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/47—End-user applications
- H04N21/478—Supplemental services, e.g. displaying phone caller identification, shopping application
- H04N21/4788—Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/141—Systems for two-way working between two video terminals, e.g. videophone
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本申请实施例中公开了一种视频的评估方法及装置,该方法为获取视频的音视频参数、网络传输参数和屏幕配置参数;基于视频的音视频参数、网络传输参数和屏幕配置参数,采用视频感知评估模型,获得视频的评分输出集合;获取评分输出集合中包含的用户体验评分,作为视频的评估结果。这样,综合考虑了音视频、网络传输和采用的播放屏幕三个方面对视频的用户体验的影响,并且采用视频感知评估模型进行计算,简化了计算的复杂度,提高了视频评估的精准度和计算的效率,降低了时间成本。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种视频的评估方法及装置。
背景技术
随着通信技术的发展,传统的语音通话逐渐被视频通话所代替,如,长期演进的语音(Voice over Long Term Evolution,VoLTE)视频通话,微信视频通话。但是,由于视频画面存在的不清晰、卡顿以及延迟时间长等问题,影响了用户体验,因此,为确定接收端的视频的质量,对接收端的视频的用户体验进行评估也成为关注的焦点。
现有技术下,对接收端的视频的用户体验进行评估,通常采用以下几种方式:
第一种方式为:通过指定的测试人员,在特定的测试环境中,按照预设的测试标准对视频的质量进行打分,以及对获取的分数进行统计分析,从而获得视频的用户体验评分,作为视频的评估结果。
但是,采用这种方式,对测试环境、测试材料以及测试人员等都有严格的标准,耗时长,过程繁琐,并且容易受到外界条件的干扰,因此,很难在实际的视频评估中进行使用。
第二种方式为:分别获取发送端和接收端的视频数据,然后,将发送端和接收端的视频数据进行帧对帧的对比分析,从而获得视频的评估结果。
但是,采用这种方式,需要进行帧对帧的对比分析,计算的复杂度高,效率低,并且获取的评估结果实际为视频的保真程度,并不是真正意义上的用户体验评分。
第三种方式为:基于视频的编解码方式以及网络传输质量,采用相应的评估公式,确定视频的评估结果。其中,评估公式为A=1+I1*I2,A为视频的评估结果,I1为编解码方式对视频质量的损伤,I2为网络传输质量对视频质量的损伤。
但是,采用这种方式,仅考虑了编解码方式以及网络传输质量对视频的用户体验的影响,获得的视频的评估结果不精确。
发明内容
本申请实施例提供一种视频的评估方法及装置,用于在评估视频质量的用户体验时,提高视频评估的精准度,简化评估计算的复杂度,提高评估计算的效率,降低时间成本。
本申请实施例提供的具体技术方案如下:
第一方面,一种视频感知评估模型的建立方法,包括:
分别获得每一个指定的样本视频的音视频参数、网络传输参数、屏幕配置参数,以及对应的视频评分集合;
基于BP神经网络算法,建立初始视频感知评估模型,其中,初始视频感知评估模型的输入参数为:样本视频的音视频参数、网络传输参数、屏幕配置参数;
分别针对每一个样本视频执行以下步骤;
基于一个样本视频的音视频参数、网络传输参数和对应的屏幕配置参数,采用相应的初始视频感知评估模型,获得一个样本视频的评分输出集合;
基于一个样本视频的评分输出集合的各个参数,分别与一个样本视频的视频评分集合相应的各个参数的差值的平方的和,获得一个样本视频的输出误差;
确定一个样本视频的输出误差低于预设门限值时,对初始视频感知评估模型中包含的各个权值进行调整,获得调整后的初始视频感知评估模型,其中,调整后的初始视频感知评估模型作为下一个样本视频相应的初始视频感知评估模型;
将调整后的初始视频感知评估模型,作为视频感知评估模型。
较佳的,基于BP神经网络算法,建立初始视频感知评估模型,具体包括:
基于BP神经网络算法,确定初始视频感知评估模型的隐含层的节点的输出表达式为:
基于BP神经网络算法,确定初始视频感知评估模型的输出层的节点的输出表达式为:
基于隐含层的节点的输出表达式,输出层的节点的输出表达式,确定初始视频感知评估模型;
其中,初始视频感知评估模型包括输入层、隐含层以及输出层,xi表示输入层的第i个节点的输入,Hj表示隐含层的第j个节点的输出,Yk表示输出层的第k个节点的输出,aij表示节点i与节点j之间的权值,h为隐含层的节点的总数目,akj表示节点k与节点j之间的权值,m表示输入层的节点的总数目0<k<n,,n表示输出层的节点的总数目,i,j,h,k,m,n为自然数。
较佳的,基于一个样本视频的音视频参数、网络传输参数、对应的屏幕配置参数,采用相应的初始视频感知评估模型,获得一个样本视频的评分输出集合,具体包括:
分别获取针对每一个参数预设的归一化系数;
基于一个样本视频的音视频参数、网络传输参数、对应的屏幕配置参数,与相应的归一化系数的比值,获得一个样本视频的归一化后的各个参数;
将归一化后的各个参数,输入相应的初始视频感知评估模型,获得一个样本视频的评分输出集合。
较佳的,屏幕配置参数包括以下参数中的一种或组合:屏幕的分辨率和屏幕的尺寸;
评分输出集合包括音频质量评分、视频质量评分以及音视频质量评分,用户体验评分;
视频评分集合包括音频质量参考评分、视频质量参考评分、音视频质量参考评分和用户体验参考评分;
其中,音视频参数和网络传输参数均用于确定音频质量评分和视频质量评分;音频质量评分、视频质量评分以及屏幕配置参数用于确定音视频质量评分,音视频质量评分和网络传输参数用于确定用户体验评分。
第二方面,一种视频的评估方法,采用第一方面中任一项的方法获得的视频感知评估模型,包括:
获取视频的音视频参数、网络传输参数和屏幕配置参数;
基于视频的音视频参数、网络传输参数和屏幕配置参数,采用视频感知评估模型,获得视频的评分输出集合;
获取评分输出集合中包含的用户体验评分,作为视频的评估结果。
第三方面,一种视频感知评估模型的建立装置,包括:
获取单元,用于分别获得每一个指定的样本视频的音视频参数、网络传输参数、屏幕配置参数,以及对应的视频评分集合;
建立单元,用于基于BP神经网络算法,建立初始视频感知评估模型,其中,初始视频感知评估模型的输入参数为:样本视频的音视频参数、网络传输参数、屏幕配置参数;
执行单元,用于分别针对每一个样本视频执行以下步骤;
基于一个样本视频的音视频参数、网络传输参数和对应的屏幕配置参数,采用相应的初始视频感知评估模型,获得一个样本视频的评分输出集合;
基于一个样本视频的评分输出集合的各个参数,分别与一个样本视频的视频评分集合相应的各个参数的差值的平方的和,获得一个样本视频的输出误差;
确定一个样本视频的输出误差低于预设门限值时,对初始视频感知评估模型中包含的各个权值进行调整,获得调整后的初始视频感知评估模型,其中,调整后的初始视频感知评估模型作为下一个样本视频相应的初始视频感知评估模型;
确定单元,用于将调整后的初始视频感知评估模型,作为视频感知评估模型。
第四方面,一种视频的评估装置,采用第二方面任一项的方法获得的视频感知评估模型,包括:
获取单元,用于获取视频的音视频参数、网络传输参数和屏幕配置参数;
输出单元,用于基于视频的音视频参数、网络传输参数和屏幕配置参数,采用视频感知评估模型,获得视频的评分输出集合;
确定单元,用于获取评分输出集合中包含的用户体验评分,作为视频的评估结果。
第五方面,一种电子设备,其特征在于,包括:一个或多个处理器;以及
一个或多个计算机可读介质,可读介质上存储有用于视频感知评估模型的建立的程序,其中,程序被一个或多个处理器执行时,实现上述第一方面中任一项的方法的步骤。
第六方面,一个或多个计算机可读介质,其特征在于,可读介质上存储有用于视频感知评估模型的建立的程序,其中,程序被一个或多个处理器执行时,使得通信设备执行上述第一方面中任一项的方法。
第七方面,一种电子设备,其特征在于,包括:一个或多个处理器;以及
一个或多个计算机可读介质,可读介质上存储有用于视频的评估的程序,其中,程序被一个或多个处理器执行时,实现上述第二方面中任一项的方法的步骤。
第八方面,一个或多个计算机可读介质,其特征在于,可读介质上存储有用于视频的评估的程序,其中,程序被一个或多个处理器执行时,使得通信设备执行上述第二方面中任一项的方法。
本申请实施例中,获取视频的音视频参数、网络传输参数和屏幕配置参数;基于视频的音视频参数、网络传输参数和屏幕配置参数,采用视频感知评估模型,获得视频的评分输出集合;获取评分输出集合中包含的用户体验评分,作为视频的评估结果。这样,基于视频的音视频参数、网络传输参数和屏幕配置参数,采用视频感知评估模型,获得用户体验评分,综合考虑了音视频、网络传输和采用的播放屏幕三个方面对视频的用户体验的影响,并且采用视频感知评估模型进行计算,简化了计算的复杂度,提高了视频评估的精准度和计算的效率,降低了时间成本。
附图说明
图1a为本申请实施例中视频感知评估模型的建立的方法的流程图;
图1b为BP神经网络的示意图;
图2为本申请实施例中视频的评估方法的流程图;
图3为本申请实施例中视频感知评估模型的建立的装置的示意图;
图4为本申请实施例中视频的评估装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,并不是全部的实施例。基于本申请实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了对视频的用户体验进行评估,提高视频评估的精准度,简化计算的复杂度,提高计算的效率,降低时间成本,本申请实施例中,设计了一种视频的评估方法,该方法为基于视频的音视频参数、网络传输参数和屏幕配置参数,采用视频感知评估模型,获得用户体验评分,作为视频的评估结果。
下面结合附图对本申请优选的实施方式进行详细说明。
参阅图1a所示,本申请实施例中,在对视频进行评估之前,视频感知评估模型的建立的具体流程如下:
步骤100:终端分别获得每一个指定的样本视频的音视频参数、网络传输参数、屏幕配置参数,以及对应的视频评分集合。
具体的,首先,终端分别获得每一个指定的样本视频的音视频参数,其中,音视频参数包括以下参数中的一种或任意组合:音频编码方式、音频编码率、音频采样率、音频带宽、视频编码方式、视频的分辨率、视频编码率、视频帧率以及视频内容复杂度。
接着,终端分别获得每一个指定的样本视频的网络传输参数,其中,网络传输参数包括以下参数中的一种或任意组合:往返时延、音视频异步时延、丢包率以及突发丢包占比。
然后,终端分别获得每一个指定的样本视频的屏幕配置参数,其中,屏幕配置参数包括以下参数中的一种或组合:屏幕的分辨率和屏幕的尺寸。
例如,终端11接收样本视频S,其中,终端11的屏幕的分辨率为854×480像素,尺寸为3.5英寸。
进一步地,终端分别获得每一个指定的样本视频的视频评分集合,其中,视频评分集合包括音频质量参考评分、视频质量参考评分、音视频质量参考评分和用户体验参考评分。用户体验参考评分是通过指定的测试人员在特定的测试环境中对视频的质量的评分获得的。
其中,音视频参数和网络传输参数均用于确定视频的音频质量和视频质量。音视频参数、网络传输参数和屏幕配置参数均用于确定视频的音视频质量以及用于获取用户体验的评估结果。
这样,终端就可以在后续的视频评估过程中,通过视频的语音方面,视频方面,网络方面,以及屏幕配置方面,对视频的用户体验进行综合评估,从而提高视频评估的精准度。
步骤110:终端基于反向传播(Back Propagation,BP)神经网络算法,建立初始视频感知评估模型。
具体的,参阅图1b所示,BP神经网络的示意图。BP神经网络包括输入层,若干隐含层以及输出层。由于对于任何闭区间内的一个连续函数都可以用只含一个隐含层的BP神经网络就可以完成任意的m维到n维的映射,因此,本申请实施例中,采用仅包含一个隐含层的BP神经网络算法建立初始视频感知评估模型。
其中,建立初始视频感知评估模型时,可以采用以下步骤:
首先,终端基于BP神经网络算法,确定初始视频感知评估模型的隐含层的节点的输出表达式为:
然后,终端基于BP神经网络算法,确定初始视频感知评估模型的输出层的节点的输出表达式为:
其中,xi表示输入层的第i个节点的输入,Hj表示隐含层的第j个节点的输出,Yk表示输出层的第k个节点的输出,aij表示节点i与节点j之间的权值,h为隐含层的节点的总数目,akj表示节点k与节点j之间的权值,m表示输入层的节点的总数目,0<k<n,n表示输出层的节点的总数目,i,j,h,k,m,n为自然数,aij和akj初始值是随机确定的。
进一步地,终端基于隐含层的节点的输出表达式,输出层的节点的输出表达式,确定初始视频感知评估模型。
步骤120:终端分别将每一个样本视频的音视频参数、网络传输参数、屏幕配置参数进行归一化。
具体的,本申请实施例中,仅以一个样本视频的各个参数进行归一化为例进行说明。
首先,针对一个样本视频的音视频参数、网络传输参数、屏幕配置参数,终端分别获取针对每一个参数预设的归一化系数。其中,一个参数的归一化系数是基于该参数的取值范围设定的。归一化系数用于使归一化后的参数的取值范围在0-1之间。
然后,终端基于一个样本视频的音视频参数、网络传输参数、对应的屏幕配置参数,与相应的归一化系数的比值,获得一个样本视频的归一化后的各个参数。
例如,屏幕的尺寸的取值范围为0-5,则设定相应的归一化系数为5,则归一化后的屏幕的尺寸的取值范围为0-1。
这样,将每一个参数进行归一化,使各个参数的取值范围均在0-1,从而提高初始视频感知评估模型的速度和灵敏性。
步骤130:终端针对每一个样本视频执行以下步骤:将一个样本视频的归一化后的参数,输入相应的初始视频感知评估模型,并基于获得的评分输出集合,对初始感知评估模型中包含的各个权值进行调整。
具体的,本申请实施例中,以一个样本视频为例,对初始感知评估模型的调整进行说明。
首先,终端将一个样本的归一化后的各个参数,输入相应的初始视频感知评估模型,获得一个样本视频的评分输出集合。
其中,评分输出集合包括音频质量评分、视频质量评分以及音视频质量评分,用户体验评分。
然后,终端基于一个样本视频的评分输出集合的各个参数,分别与一个样本视频的视频评分集合相应的各个参数的差值的平方的和,获得一个样本视频的输出误差。
可选的,确定一个样本视频的输出误差时,可以采用以下公式:
其中,E为输出误差,Dk为视频评分集合中第k个参数,Yk为评分输出集合中第k个参数,n为输出集合中包含的参数的总数目,a,k,n为自然数,可选的,a=2。
例如,视频评分集合中的各个参数依次为:音频质量参考评分、视频质量参考评分、音视频质量参考评分和用户体验参考评分,对应的取值依次为D1=0.1,D2=0.2,D3=0.5,D4=0.4。评分输出集合中的各个参数依次为:音频质量评分、视频质量评分以及音视频质量评分,用户体验评分,对应的取值依次为Y1=0.2,Y2=0.3,Y3=0.6,Y4=0.5,Y5=0.9,a=2,则终端获得输出误差
进一步地,终端确定一个样本视频的输出误差低于预设门限值时,对初始视频感知评估模型中包含的各个权值进行调整,获得调整后的初始视频感知评估模型,其中,调整后的初始视频感知评估模型作为下一个样本视频相应的初始视频感知评估模型。
本申请实施例中,仅一个样本视频为例,对初始视频感知评估模型的调整进行说明,基于相同的原理,可以实现通过其它各个样本视频的参数,对初始视频感知评估模型进行调整。
其中,终端在依次通过每一个样本视频的各个参数,对初始视频感知评估模型进行调整时,将基于一个样本视频,获得的调整后的初始视频感知评估模型,作为下一个样本视频相应的初始视频感知评估模型。
步骤140:终端将调整后的初始视频感知评估模型,作为视频感知评估模型。
这样,终端基于各个样本视频,对初始视频感知评估模型进行训练,从而对初始视频感知评估模型中包含的各个权值不断进行调整,获得最终的视频感知评估模型,进而可以在后续的步骤中,通过获得的视频感知评估模型对视频的用户体验进行评估。
参阅图2所示,本申请实施例中,视频的评估的具体流程如下:
步骤200:终端获取视频的音视频参数、网络传输参数和屏幕配置参数。
步骤210:终端对获取的视频的各个参数进行归一化。
具体的,终端获取针对每一个参数预设的归一化系数,并基于每一个参数与相应的归一化系数的比值,实现视频的各个参数的归一化,获得归一化后的各个参数。
步骤220:终端将归一化后的各个参数,输入视频感知评估模型,获得视频的评分输出集合。
步骤230:终端获取评分输出集合中包含的用户体验评分,作为视频的评估结果。
这样,就可以基于视频的音视频参数、网络传输参数和屏幕配置参数,采用通过BP神经网络算法建立的视频感知评估模型,获得用户体验评分,简化了计算的复杂度,提高了评估的精准度和计算的效率,降低了时间成本。
本申请实施例中,一种电子设备,包括:一个或多个处理器;以及
一个或多个计算机可读介质,可读介质上存储有用于视频感知评估模型的建立的程序,其中,程序被一个或多个处理器执行时,实现上述实施例中的各个步骤。
本申请实施例中,一个或多个计算机可读介质,可读介质上存储有用于视频感知评估模型的建立的程序,其中,程序被一个或多个处理器执行时,使得通信设备可以执行上述实施例中的各个步骤。
本申请实施例中,一种电子设备,包括:一个或多个处理器;以及
一个或多个计算机可读介质,可读介质上存储有用于视频的评估的程序,其中,程序被一个或多个处理器执行时,实现上述实施例中的各个步骤。
本申请实施例中,一个或多个计算机可读介质,可读介质上存储有用于视频的评估的程序,其中,程序被一个或多个处理器执行时,使得通信设备可以执行上述实施例中的各个步骤。
基于上述实施例,参阅图3所示,视频感知评估模型的建立装置的结构示意图,本申请实施例中,视频感知评估模型的建立装置具体包括:
获取单元30,用于分别获得每一个指定的样本视频的音视频参数、网络传输参数、屏幕配置参数,以及对应的视频评分集合;
建立单元31,用于基于BP神经网络算法,建立初始视频感知评估模型,其中,初始视频感知评估模型的输入参数为:样本视频的音视频参数、网络传输参数、屏幕配置参数;
执行单元32,用于分别针对每一个样本视频执行以下步骤;
基于一个样本视频的音视频参数、网络传输参数和对应的屏幕配置参数,采用相应的初始视频感知评估模型,获得一个样本视频的评分输出集合;
基于一个样本视频的评分输出集合的各个参数,分别与一个样本视频的视频评分集合相应的各个参数的差值的平方的和,获得一个样本视频的输出误差;
确定一个样本视频的输出误差低于预设门限值时,对初始视频感知评估模型中包含的各个权值进行调整,获得调整后的初始视频感知评估模型,其中,调整后的初始视频感知评估模型作为下一个样本视频相应的初始视频感知评估模型;
确定单元33,用于将调整后的初始视频感知评估模型,作为视频感知评估模型。
较佳的,在基于BP神经网络算法,建立初始视频感知评估模型时,建立单元31具体用于:
基于BP神经网络算法,确定初始视频感知评估模型的隐含层的节点的输出表达式为:
基于BP神经网络算法,确定初始视频感知评估模型的输出层的节点的输出表达式为:
基于隐含层的节点的输出表达式,输出层的节点的输出表达式,确定初始视频感知评估模型;
其中,初始视频感知评估模型包括输入层、隐含层以及输出层,xi表示输入层的第i个节点的输入,Hj表示隐含层的第j个节点的输出,Yk表示输出层的第k个节点的输出,aij表示节点i与节点j之间的权值,h为隐含层的节点的总数目,akj表示节点k与节点j之间的权值,m表示输入层的节点的总数目0<k<n,,n表示输出层的节点的总数目,i,j,h,k,m,n为自然数。
较佳的,在基于一个样本视频的音视频参数、网络传输参数、对应的屏幕配置参数,采用相应的初始视频感知评估模型,获得一个样本视频的评分输出集合时,执行单元32具体用于:
分别获取针对每一个参数预设的归一化系数;
基于一个样本视频的音视频参数、网络传输参数、对应的屏幕配置参数,与相应的归一化系数的比值,获得一个样本视频的归一化后的各个参数;
将归一化后的各个参数,输入相应的初始视频感知评估模型,获得一个样本视频的评分输出集合。
较佳的,屏幕配置参数包括以下参数中的一种或组合:屏幕的分辨率和屏幕的尺寸;
评分输出集合包括音频质量评分、视频质量评分以及音视频质量评分,用户体验评分;
视频评分集合包括音频质量参考评分、视频质量参考评分、音视频质量参考评分和用户体验参考评分;
其中,音视频参数和网络传输参数均用于确定音频质量评分和视频质量评分;音频质量评分、视频质量评分以及屏幕配置参数用于确定音视频质量评分,音视频质量评分和网络传输参数用于确定用户体验评分。
基于上述实施例,参阅图4所示,视频的评估装置的结构示意图,本申请实施例中,视频的评估装置具体包括:
获取单元40,用于获取视频的音视频参数、网络传输参数和屏幕配置参数;
输出单元41,用于基于视频的音视频参数、网络传输参数和屏幕配置参数,采用视频感知评估模型,获得视频的评分输出集合;
确定单元42,用于获取评分输出集合中包含的用户体验评分,作为视频的评估结果。
本申请实施例中,获取视频的音视频参数、网络传输参数和屏幕配置参数;基于视频的音视频参数、网络传输参数和屏幕配置参数,采用视频感知评估模型,获得视频的评分输出集合;获取评分输出集合中包含的用户体验评分,作为视频的评估结果。这样,基于视频的音视频参数、网络传输参数和屏幕配置参数,采用视频感知评估模型,获得用户体验评分,综合考虑了音视频、网络传输和采用的播放屏幕三个方面对视频的用户体验的影响,并且采用视频感知评估模型进行计算,简化了计算的复杂度,提高了视频评估的精准度和计算的效率,降低了时间成本。
本领域内的技术人员应明白,本申请实施例中的实施例可提供为方法、系统、或计算机程序产品。因此,本申请实施例中可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例中可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请实施例中是参照根据本申请实施例中实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例中的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例中范围的所有变更和修改。
显然,本领域的技术人员可以对本申请实施例中实施例进行各种改动和变型而不脱离本申请实施例中实施例的精神和范围。这样,倘若本申请实施例中实施例的这些修改和变型属于本申请实施例中权利要求及其等同技术的范围之内,则本申请实施例中也意图包含这些改动和变型在内。
Claims (11)
1.一种视频感知评估模型的建立方法,其特征在于,包括:
分别获得每一个指定的样本视频的音视频参数、网络传输参数、屏幕配置参数,以及对应的视频评分集合;
基于反向传播BP神经网络算法,建立初始视频感知评估模型,其中,所述初始视频感知评估模型的输入参数为:样本视频的音视频参数、网络传输参数、屏幕配置参数;
分别针对每一个样本视频执行以下步骤;
基于一个样本视频的音视频参数、网络传输参数和对应的屏幕配置参数,采用相应的初始视频感知评估模型,获得所述一个样本视频的评分输出集合;
基于所述一个样本视频的评分输出集合的各个参数,分别与所述一个样本视频的视频评分集合相应的各个参数的差值的平方的和,获得所述一个样本视频的输出误差;
确定所述一个样本视频的输出误差低于预设门限值时,对所述初始视频感知评估模型中包含的各个权值进行调整,获得调整后的初始视频感知评估模型,其中,所述调整后的初始视频感知评估模型作为下一个样本视频相应的初始视频感知评估模型;
将调整后的初始视频感知评估模型,作为视频感知评估模型。
2.如权利要求1所述的方法,其特征在于,基于BP神经网络算法,建立初始视频感知评估模型,具体包括:
基于所述BP神经网络算法,确定所述初始视频感知评估模型的隐含层的节点的输出表达式为:
基于所述BP神经网络算法,确定所述初始视频感知评估模型的输出层的节点的输出表达式为:
基于所述隐含层的节点的输出表达式,所述输出层的节点的输出表达式,确定初始视频感知评估模型;
其中,所述初始视频感知评估模型包括输入层、隐含层以及输出层,xi表示输入层的第i个节点的输入,Hj表示隐含层的第j个节点的输出,Yk表示输出层的第k个节点的输出,aij表示节点i与节点j之间的权值,h为隐含层的节点的总数目,akj表示节点k与节点j之间的权值,m表示输入层的节点的总数目0<k<n,,n表示输出层的节点的总数目,i,j,h,k,m,n为自然数。
3.如权利要求1所述的方法,其特征在于,基于一个样本视频的音视频参数、网络传输参数、对应的屏幕配置参数,采用相应的初始视频感知评估模型,获得所述一个样本视频的评分输出集合,具体包括:
分别获取针对每一个参数预设的归一化系数;
基于所述一个样本视频的音视频参数、网络传输参数、对应的屏幕配置参数,与相应的归一化系数的比值,获得所述一个样本视频的归一化后的各个参数;
将归一化后的各个参数,输入相应的初始视频感知评估模型,获得所述一个样本视频的评分输出集合。
4.如权利要求1、2或3所述的方法,其特征在于,所述屏幕配置参数包括以下参数中的一种或组合:屏幕的分辨率和屏幕的尺寸;
所述评分输出集合包括音频质量评分、视频质量评分以及音视频质量评分,用户体验评分;
所述视频评分集合包括音频质量参考评分、视频质量参考评分、音视频质量参考评分和用户体验参考评分;
其中,所述音视频参数和所述网络传输参数均用于确定所述音频质量评分和视频质量评分;所述音频质量评分、所述视频质量评分以及所述屏幕配置参数用于确定所述音视频质量评分,所述音视频质量评分和所述网络传输参数用于确定所述用户体验评分。
5.一种视频的评估方法,其特征在于,采用如权利要求1-4任一项所述的方法获得的视频感知评估模型,包括:
获取视频的音视频参数、网络传输参数和屏幕配置参数;
基于所述视频的音视频参数、网络传输参数和屏幕配置参数,采用所述视频感知评估模型,获得所述视频的评分输出集合;
获取所述评分输出集合中包含的用户体验评分,作为所述视频的评估结果。
6.一种视频感知评估模型的建立装置,其特征在于,包括:
获取单元,用于分别获得每一个指定的样本视频的音视频参数、网络传输参数、屏幕配置参数,以及对应的视频评分集合;
建立单元,用于基于反向传播BP神经网络算法,建立初始视频感知评估模型,其中,所述初始视频感知评估模型的输入参数为:样本视频的音视频参数、网络传输参数、屏幕配置参数;
执行单元,用于分别针对每一个样本视频执行以下步骤;
基于一个样本视频的音视频参数、网络传输参数和对应的屏幕配置参数,采用相应的初始视频感知评估模型,获得所述一个样本视频的评分输出集合;
基于所述一个样本视频的评分输出集合的各个参数,分别与所述一个样本视频的视频评分集合相应的各个参数的差值的平方的和,获得所述一个样本视频的输出误差;
确定所述一个样本视频的输出误差低于预设门限值时,对所述初始视频感知评估模型中包含的各个权值进行调整,获得调整后的初始视频感知评估模型,其中,所述调整后的初始视频感知评估模型作为下一个样本视频相应的初始视频感知评估模型;
确定单元,用于将调整后的初始视频感知评估模型,作为视频感知评估模型。
7.一种视频的评估装置,其特征在于,采用如权利要求1-4任一项所述的方法获得的视频感知评估模型,包括:
获取单元,用于获取视频的音视频参数、网络传输参数和屏幕配置参数;
输出单元,用于基于所述视频的音视频参数、网络传输参数和屏幕配置参数,采用所述视频感知评估模型,获得所述视频的评分输出集合;
确定单元,用于获取所述评分输出集合中包含的用户体验评分,作为所述视频的评估结果。
8.一种电子设备,其特征在于,包括:一个或多个处理器;以及
一个或多个计算机可读介质,所述可读介质上存储有用于视频感知评估模型的建立的程序,其中,所述程序被所述一个或多个处理器执行时,实现如权利要求1~4中任意一项所述的方法的步骤。
9.一个或多个计算机可读介质,其特征在于,所述可读介质上存储有用于视频感知评估模型的建立的程序,其中,所述程序被一个或多个处理器执行时,使得通信设备执行如权利要求1至4中任一项所述的方法。
10.一种电子设备,其特征在于,包括:一个或多个处理器;以及
一个或多个计算机可读介质,所述可读介质上存储有用于视频的评估的程序,其中,所述程序被所述一个或多个处理器执行时,实现如权利要求5所述的方法的步骤。
11.一个或多个计算机可读介质,其特征在于,所述可读介质上存储有用于视频的评估的程序,其中,所述程序被一个或多个处理器执行时,使得通信设备执行如权利要求5所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710424338.3A CN109005402A (zh) | 2017-06-07 | 2017-06-07 | 一种视频的评估方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710424338.3A CN109005402A (zh) | 2017-06-07 | 2017-06-07 | 一种视频的评估方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109005402A true CN109005402A (zh) | 2018-12-14 |
Family
ID=64573110
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710424338.3A Pending CN109005402A (zh) | 2017-06-07 | 2017-06-07 | 一种视频的评估方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109005402A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110365970A (zh) * | 2019-07-10 | 2019-10-22 | 广州瀚信通信科技股份有限公司 | 一种基于监督学习评估终端VoLTE视频通话感知方法 |
CN111193923A (zh) * | 2019-09-24 | 2020-05-22 | 腾讯科技(深圳)有限公司 | 视频质量评估方法、装置、电子设备及计算机存储介质 |
CN111340329A (zh) * | 2020-02-05 | 2020-06-26 | 科大讯飞股份有限公司 | 演员评估方法、装置及电子设备 |
CN112261437A (zh) * | 2020-11-19 | 2021-01-22 | 贝壳技术有限公司 | 音视频质量评价方法和装置、可读存储介质、电子设备 |
CN114827617A (zh) * | 2022-06-27 | 2022-07-29 | 致讯科技(天津)有限公司 | 一种基于感知模型的视频编解码方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101715146A (zh) * | 2008-10-08 | 2010-05-26 | 中国移动通信集团公司 | 压缩视频质量评价方法及评价系统 |
CN104023232A (zh) * | 2014-06-27 | 2014-09-03 | 北京邮电大学 | 基于层次分析和多元线性回归的移动视频质量评估方法 |
CN105430383A (zh) * | 2015-12-07 | 2016-03-23 | 广东电网有限责任公司珠海供电局 | 一种视频流媒体业务的体验质量评估方法 |
CN106713901A (zh) * | 2015-11-18 | 2017-05-24 | 华为技术有限公司 | 一种视频质量评价方法及装置 |
-
2017
- 2017-06-07 CN CN201710424338.3A patent/CN109005402A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101715146A (zh) * | 2008-10-08 | 2010-05-26 | 中国移动通信集团公司 | 压缩视频质量评价方法及评价系统 |
CN104023232A (zh) * | 2014-06-27 | 2014-09-03 | 北京邮电大学 | 基于层次分析和多元线性回归的移动视频质量评估方法 |
CN106713901A (zh) * | 2015-11-18 | 2017-05-24 | 华为技术有限公司 | 一种视频质量评价方法及装置 |
CN105430383A (zh) * | 2015-12-07 | 2016-03-23 | 广东电网有限责任公司珠海供电局 | 一种视频流媒体业务的体验质量评估方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110365970A (zh) * | 2019-07-10 | 2019-10-22 | 广州瀚信通信科技股份有限公司 | 一种基于监督学习评估终端VoLTE视频通话感知方法 |
CN111193923A (zh) * | 2019-09-24 | 2020-05-22 | 腾讯科技(深圳)有限公司 | 视频质量评估方法、装置、电子设备及计算机存储介质 |
CN111193923B (zh) * | 2019-09-24 | 2022-06-21 | 腾讯科技(深圳)有限公司 | 视频质量评估方法、装置、电子设备及计算机存储介质 |
CN111340329A (zh) * | 2020-02-05 | 2020-06-26 | 科大讯飞股份有限公司 | 演员评估方法、装置及电子设备 |
CN111340329B (zh) * | 2020-02-05 | 2024-02-20 | 科大讯飞股份有限公司 | 演员评估方法、装置及电子设备 |
CN112261437A (zh) * | 2020-11-19 | 2021-01-22 | 贝壳技术有限公司 | 音视频质量评价方法和装置、可读存储介质、电子设备 |
CN114827617A (zh) * | 2022-06-27 | 2022-07-29 | 致讯科技(天津)有限公司 | 一种基于感知模型的视频编解码方法及系统 |
CN114827617B (zh) * | 2022-06-27 | 2022-10-18 | 致讯科技(天津)有限公司 | 一种基于感知模型的视频编解码方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109005402A (zh) | 一种视频的评估方法及装置 | |
CN109524020B (zh) | 一种语音增强处理方法 | |
US10026418B2 (en) | Abnormal frame detection method and apparatus | |
CN105100789B (zh) | 一种视频质量评价方法 | |
CN107027023A (zh) | 基于神经网络的VoIP无参考视频通信质量客观评价方法 | |
EP3316255A1 (en) | Method, device, and equipment for voice quality assessment | |
CN104485114B (zh) | 一种基于听觉感知特性的语音质量客观评估的方法 | |
CN108346434A (zh) | 一种语音质量评估的方法和装置 | |
CN105282347A (zh) | 语音质量的评估方法及装置 | |
US10284712B2 (en) | Voice quality evaluation method, apparatus, and system | |
CN109714557A (zh) | 视频通话的质量评估方法、装置、电子设备和存储介质 | |
CN112750462B (zh) | 一种音频处理方法、装置及设备 | |
KR20160023767A (ko) | 스피치 신호 품질을 측정하기 위한 시스템들 및 방법들 | |
CN109658935B (zh) | 多通道带噪语音的生成方法及系统 | |
CN105430383A (zh) | 一种视频流媒体业务的体验质量评估方法 | |
CN103067322A (zh) | 评估单通道音频信号中的音频帧的语音质量的方法 | |
CN102014126A (zh) | 一种基于QoS的语音体验质量评测平台及评测方法 | |
CN109976998A (zh) | 一种软件缺陷预测方法、装置和电子设备 | |
CN109285554A (zh) | 一种回声消除方法、服务器、终端及系统 | |
CN108206027A (zh) | 一种音频质量评价方法及系统 | |
WO2017054494A1 (zh) | 一种混音处理方法、装置、设备及存储介质 | |
CN107133892A (zh) | 一种网络钢琴课的实时评价方法及系统 | |
CN109451303A (zh) | 一种针对VR视频中用户体验质量QoE的建模方法 | |
CN106327555A (zh) | 一种获得唇形动画的方法及装置 | |
CN110503982A (zh) | 一种语音质量检测的方法以及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181214 |
|
RJ01 | Rejection of invention patent application after publication |