CN113313682A - 基于时空多尺度分析的无参考视频质量评价方法 - Google Patents

基于时空多尺度分析的无参考视频质量评价方法 Download PDF

Info

Publication number
CN113313682A
CN113313682A CN202110589087.0A CN202110589087A CN113313682A CN 113313682 A CN113313682 A CN 113313682A CN 202110589087 A CN202110589087 A CN 202110589087A CN 113313682 A CN113313682 A CN 113313682A
Authority
CN
China
Prior art keywords
convolution
module
quality evaluation
attention
space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110589087.0A
Other languages
English (en)
Other versions
CN113313682B (zh
Inventor
何立火
汤可凡
高帆
柯俊杰
高新波
路文
张超仑
甘海林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN202110589087.0A priority Critical patent/CN113313682B/zh
Publication of CN113313682A publication Critical patent/CN113313682A/zh
Application granted granted Critical
Publication of CN113313682B publication Critical patent/CN113313682B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details
    • H04N17/004Diagnosis, testing or measuring for television systems or their details for digital television systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30168Image quality inspection

Abstract

本发明提出了一种基于时空多尺度分析的无参考视频质量评价方法,实现步骤为:获取训练样本集和测试样本集;构建基于时空多尺度分析的无参考视频质量评价模型;对无参考视频质量评价模型进行迭代训练;获取无参考视频的质量评价结果。本发明在对无参考视频质量评价模型进行训练和获取质量评价结果的过程中,时空多尺度模块通过下采样得到不同尺度的帧序列局部时空失真特征,时空注意力分析模块对得到的时空失真特征的显著性进行分析,进而获取更为准确待测视频的全局质量表示,避免了现有技术中因为缺失帧序列的失真信息导致视频质量评价准确度较低的技术问题,有效地提高了复杂的无参考多种帧率视频质量评价准确度。

Description

基于时空多尺度分析的无参考视频质量评价方法
技术领域
本发明属于视频处理技术领域,涉及一种视频质量评价方法,具体涉及一种基于时空多尺度分析的无参考视频质量评价方法,可用于对视频质量的改善进行指导。
背景技术
近几年,随着视频技术的飞速发展,数字视频已越来越多地进入人们的工作和日常生活中。通常,视频需经过采集、压缩、传输和解压缩等处理阶段,而在这些处理阶段中,视频往往会产生一些失真现象,这些失真都会造成视频质量的降低。因此,寻找一个准确有效的视频质量评价方法,以指导改善视频质量变得尤为重要。
视频质量评价方法根据对原始视频信息的依赖程度可分为三种:全参考视频质量评价方法、部分参考视频质量评价方法和无参考视频质量评价方法。全参考视频质量评价方法是指把原始参考视频与失真视频在每一个对应帧中的每一个对应像素之间进行比较。部分参考视频质量评价方法则是针对一个视频传输系统,在发送端提取原始视频的一些统计特征,将其通过辅助信道传送到该系统的接收端,并与接收端得到的失真视频的对应特征进行比较,以获得相应的视频质量评价分数。无参考视频质量评价方法则不需要原始视频的任何先验信息,通常使用参考视频或者相应特征的估计值,直接对失真视频进行质量评价,这种方法体现了人类的智能。
无参考视频质量评价方法由于具有灵活性高、实时性好、成本低且不需要任何原始视频信息等优点,成为了视频质量评价领域的研究热点,也是目前发展空间最大、最具实际应用价值的评价方法。传统的无参考视频质量评价方法在面对传统的标准24帧/秒或30帧/秒的视频时有着较好的评价效果,但因为其并未考虑帧速率对人类视频质量感知的影响,使得视频质量评价模型在面对多种帧率视频尤其是高帧率视频的时候,评价效果大打折扣。
为了避免忽略时域失真特征,导致传统的无参考视频质量评价方法无法很好地面对多种帧率视频,基于时空特征信息的无参考视频质量评价方法应运而生,例如,申请公布号为CN112784698A,名称为“一种基于深层次时空信息的无参考视频质量评价方法”的专利申请,该发明利用Resnet-50预训练的深度神经网络,提取顶层的语义层特征后对特征图进行均值聚合与标准差聚合,然后分别从两个方面对时间记忆效应进行建模,在特征整合方面,采用GRU网络对长期依赖关系进行建模,在质量聚合方面,提出主观启发的时间池化模型并将其嵌入到网络中。但是其存在的缺陷在于,该发明仅提取了一个尺度的时空失真特征,获取的失真信息并不足够丰富,导致对于复杂的多种帧率视频的评价准确度仍有所欠佳。
发明内容
本发明的目的在于克服上述现有技术存在的缺陷,提出一种基于时空多尺度分析的无参考视频质量评价方法,用于解决现有技术中存在的失真信息不够丰富导致视频质量评价准确度较低的技术问题。
为实现上述目的,本发明采取的技术方案包括如下步骤:
(1)获取训练样本集Xtrain和测试样本集Xtest
获取自然视频公知数据集中的V个失真视频的帧序列F={fv|1≤v≤V},并随机选取F中半数以上的帧序列及其对应的真实质量分数组成训练样本集Xtrain=(Ftrain;Ytrain),将剩余的帧序列及其对应的真实质量分数组合成测试样本集Xtest=(Ftest;Ytest),其中,fv表示数据集中的第v个帧序列,Ftrain表示训练帧序列集合,
Figure BDA0003088802260000021
表示第v1个训练帧序列,Ytrain表示
Figure BDA0003088802260000022
对应的真实质量分数集合,
Figure BDA0003088802260000023
表示
Figure BDA0003088802260000024
对应的真实质量分数,Ftest表示测试帧序列集合,
Figure BDA0003088802260000025
Figure BDA0003088802260000026
表示第v2个测试帧序列,Ytest表示
Figure BDA0003088802260000027
对应的真实质量分数集合,
Figure BDA0003088802260000028
表示
Figure BDA0003088802260000029
对应的真实质量分数,V≥150,
Figure BDA00030888022600000210
V2=V-V1
(2)构建基于时空多尺度分析的无参考视频质量评价模型H:
构建包括顺次连接的局部失真特征编码模块Henc、时空多尺度模块Hmul和时空注意力分析模块Hpool的无参考视频质量评价模型H,其中,局部失真特征编码模块Henc采用去除最后一个全连接层的VGG-16网络结构;时空多尺度模块Hmul包括并行排布的两个平均池化层及一个由多个平均池化层组成的下采样模块;时空注意力分析模块Hpool包括顺次连接的注意力分析器、归一化层和全连接层,注意力分析器包括多个全连接层;
(3)对无参考视频质量评价模型H进行迭代训练:
(3a)设迭代次数为t,最大迭代次数为T,T≥50,第t次迭代的无参考视频质量评价模型为Ht,并令t=1,Ht=H;
(3b)将训练样本集Xtrain作为无参考视频质量评价模型Ht的输入,局部失真特征编码模块
Figure BDA0003088802260000031
对Ftrain中的每个帧序列
Figure BDA0003088802260000032
逐个进行空间失真特征提取,得到空间失真特征
Figure BDA0003088802260000033
(3c)时空多尺度模块
Figure BDA0003088802260000034
中的两个下采样层及下采样模块分别对
Figure BDA0003088802260000035
提取的
Figure BDA0003088802260000036
进行下采样,得到每个帧序列在不同时空尺度上的局部失真特征表示组合成的局部失真信息
Figure BDA0003088802260000037
其中,
Figure BDA0003088802260000038
表示第v1个帧序列的第i个图像帧的第j个局部失真特征,
Figure BDA0003088802260000039
表示第v1个帧序列包含的图像帧个数,N表示从每个图像帧中提取的局部失真特征个数;
(3d)时空注意力分析模块
Figure BDA00030888022600000310
中的注意力分析器对
Figure BDA00030888022600000311
所采集的
Figure BDA00030888022600000312
进行显著性评估得到注意力权重
Figure BDA00030888022600000313
并通过归一化层对
Figure BDA00030888022600000314
进行归一化,得到最终注意力权重
Figure BDA00030888022600000315
利用
Figure BDA00030888022600000316
Figure BDA00030888022600000317
进行加权得到全局失真特征
Figure BDA00030888022600000318
最后利用全连接层对
Figure BDA00030888022600000319
进行回归得到
Figure BDA00030888022600000320
的预测质量分数
Figure BDA00030888022600000321
则Ftrain的预测质量分数为
Figure BDA00030888022600000322
其中,
Figure BDA00030888022600000323
表示第v1个帧序列的第i个图像帧的第j个局部失真特征对应的注意力权重,
Figure BDA00030888022600000324
表示第v1个帧序列的第i个图像帧的第j个局部失真特征对应的归一化后的注意力权重;
(3e)采用最小绝对误差LAE的公式,通过
Figure BDA0003088802260000041
和Ytrain计算时空注意力分析模块
Figure BDA0003088802260000042
的损失值Lt,并采用反向传播方法,通过损失值Lt计算
Figure BDA0003088802260000043
的权值参数梯度dωt,然后采用随机梯度下降法,通过dωt
Figure BDA0003088802260000044
的权值参数ωt进行更新;
(3f)判断t≥T是否成立,若是,得到训练好的无参考视频质量评价模型H′,否则,令t=t+1,并执行步骤(3b);
(4)获取无参考视频的质量评价结果:
将测试样本集Xtest作为无参考视频质量评价模型H′的输入进行前向传播,得到Xtest的预测质量分数集合
Figure BDA0003088802260000045
其中,
Figure BDA0003088802260000046
表示第v2个帧序列的预测质量分数。
本发明与现有技术相比较,具有以下优点:
本发明在对无参考视频质量评价模型进行训练和获取质量评价结果的过程中,时空多尺度模块中的多个分支对提取的帧序列的空间失真特征进行下采样,得到不同尺度的帧序列局部时空失真特征,时空注意力分析模块中的多层感知器对得到的时空失真特征的显著性进行分析,从而得到局部时空失真特征所对应的注意力权重,然后对局部时空失真特征进行加权,获取更为准确待测视频的全局质量表示,避免了现有技术中因为缺失帧序列的失真信息导致视频质量评价准确度较低的技术问题,有效地提高了复杂的无参考多种帧率视频质量评价准确度。
附图说明
图1是本发明的实现流程图。
具体实施方式
以下结合附图和具体实施例,对本发明作进一步详细描述。
参照图1,本发明包括如下步骤:
步骤1)获取训练样本集Xtrain和测试样本集Xtest
获取自然视频公知数据集中的V个失真视频的帧序列F={fv|1≤v≤V},并随机选取F中半数以上的帧序列及其对应的真实质量分数组成训练样本集Xtrain=(Ftrain;Ytrain),将剩余的帧序列及其对应的真实质量分数组合成测试样本集Xtest=(Ftest;Ytest),其中,fv表示数据集中的第v个帧序列,Ftrain表示训练帧序列集合,
Figure BDA0003088802260000051
表示第v1个训练帧序列,Ytrain表示
Figure BDA0003088802260000052
对应的真实质量分数集合,
Figure BDA0003088802260000053
表示
Figure BDA0003088802260000054
对应的真实质量分数,Ftest表示测试帧序列集合,
Figure BDA0003088802260000055
Figure BDA0003088802260000056
表示第v2个测试帧序列,Ytest表示
Figure BDA0003088802260000057
对应的真实质量分数集合,
Figure BDA0003088802260000058
表示
Figure BDA0003088802260000059
对应的真实质量分数,本实例中,V=150,V1=120,V2=30。
步骤2)构建基于时空多尺度分析的无参考视频质量评价模型H:
构建包括顺次连接的局部失真特征编码模块Henc、时空多尺度模块Hmul和时空注意力分析模块Hpool的无参考视频质量评价模型H,其中,局部失真特征编码模块Henc采用去除最后一个全连接层的VGG-16网络结构;时空多尺度模块Hmul包括并行排布的两个平均池化层及一个由多个平均池化层组成的下采样模块;时空注意力分析模块Hpool包括顺次连接的注意力分析器、归一化层和全连接层,注意力分析器包括多个全连接层。
局部失真特征编码模块Henc包括5个卷积模块和2个全连接层,其具体结构为:第一卷积模块→第二卷积模块→第三卷积模块→第四卷积模块→第五卷积模块→第一全连接层→第二全连接层。
第一卷积模块和第二卷积模块均由2个卷积层和1个最大池化层组成,具体结构为:第一卷积层→第二卷积层→第一最大池化层;卷积层的卷积核大小均为3×3,步长均为1,第一卷积模块的2个卷积层的卷积核数量均为64,第二卷积模块的2个卷积层的卷积核数量均为128。
第三、第四和第五卷积模块均由3个卷积层和1个最大池化层组成,所述卷积模块的具体结构为:第一卷积层→第二卷积层→第三卷积层→第一最大池化层;卷积层的卷积核大小均为3×3,步长均为1,第三卷积模块的3个卷积层的卷积核数量均设置为256,第四、第五卷积模块的3个卷积层的卷积核数量均设置为512。
时空多尺度模块Hmul所包含的下采样模块由2个平均池化层组成。
时空注意力分析模块Hpool所包含的注意力分析器包括2个全连接层。
步骤3)对无参考视频质量评价模型H进行迭代训练:
步骤3a)设迭代次数为t,最大迭代次数为T,第t次迭代的无参考视频质量评价模型为Ht,本实例中,T=50,并令t=1,Ht=H。
步骤3b)将训练样本集Xtrain作为无参考视频质量评价模型Ht的输入,局部失真特征编码模块
Figure BDA0003088802260000061
对Ftrain中的每个帧序列
Figure BDA0003088802260000062
逐个
Figure BDA0003088802260000063
进行空间失真特征提取,得到局部空间失真特征
Figure BDA0003088802260000064
步骤3c)时空多尺度模块Hmul中的两个下采样层及下采样模块分别对
Figure BDA0003088802260000065
提取的
Figure BDA0003088802260000066
进行下采样:第一个下采样层中,通过尺度为4的空间平均池化对
Figure BDA0003088802260000067
进行空间下采样;第二个下采样层中,通过尺度为4的时间平均池化对
Figure BDA0003088802260000068
进行时间下采样;采样模块中,通过尺度分别为2的时间平均池化和间平均池化,对
Figure BDA0003088802260000069
依次进行时间下采样和空间平均池化,从而得到三个尺度的局部时空失真特征矩阵,重新定义这三个局部时空失真特征矩阵的大小使其尺寸统一,并用concat方法将这三个矩阵进行拼接,得到每个帧序列在不同时空尺度上的局部失真特征表示组合成的局部失真信息
Figure BDA00030888022600000610
其中,
Figure BDA00030888022600000611
表示第v1个帧序列的第i个图像帧的第j个局部失真特征,
Figure BDA00030888022600000612
表示第v1个帧序列包含的图像帧个数,N表示从每个图像帧中提取的局部失真特征个数。
利用时空多尺度模块
Figure BDA00030888022600000613
对提取的帧序列的空间失真特征进行下采样,以提取帧序列在不同时空尺度上的局部时空失真特征,丰富帧序列的失真信息,获得了比原始特征图更全面的质量表达,有效地提高了质量评价准确度。
步骤3d)时空注意力分析模块
Figure BDA00030888022600000614
中的注意力分析器对
Figure BDA00030888022600000615
所采集的
Figure BDA00030888022600000616
进行显著性评估得到注意力权重
Figure BDA00030888022600000617
并通过归一化层对
Figure BDA00030888022600000618
进行归一化,将其映射到相同的[0,1]范围内,以消除量纲对数据分析的影响,得到最终注意力权重
Figure BDA0003088802260000071
利用
Figure BDA0003088802260000072
Figure BDA0003088802260000073
进行加权得到全局失真特征
Figure BDA0003088802260000074
最后利用全连接层对
Figure BDA0003088802260000075
进行回归得到
Figure BDA0003088802260000076
的预测质量分数
Figure BDA0003088802260000077
则Ftrain的预测质量分数为
Figure BDA0003088802260000078
其中,
Figure BDA0003088802260000079
表示第v1个帧序列的第i个图像帧的第j个局部失真特征对应的注意力权重,
Figure BDA00030888022600000710
表示第v1个帧序列的第i个图像帧的第j个局部失真特征对应的归一化后的注意力权重,其中:
Figure BDA00030888022600000711
Figure BDA00030888022600000712
Figure BDA00030888022600000713
W1和W2分别表示注意力分析器中两个全连接层的权重,ReLU(·)表示激活函数,e表示自然常数,∑表示求和操作;
Figure BDA00030888022600000714
表示第v1个帧序列的全局失真特征。
时空注意力分析模块
Figure BDA00030888022600000715
不是平等对待所有局部失真特征,而是使用多层感知器分析局部失真特征的显著性,从而得到局部失真特征在各时空域的注意力权重,因此可以更好地应对帧内和帧间的失真不均匀的视频,得到更为准确待测视频的全局质量表示。
步骤3e)采用最小绝对误差LAE的公式,通过
Figure BDA00030888022600000716
和Ytrain计算时空注意力分析模块
Figure BDA00030888022600000717
的损失值Lt,并采用反向传播方法,通过损失值Lt计算
Figure BDA00030888022600000718
的权值参数梯度dωt,然后采用随机梯度下降法,通过dωt
Figure BDA00030888022600000719
的权值参数ωt进行更新,计算公式为:
Figure BDA00030888022600000720
Figure BDA00030888022600000721
ω*=ωt-αdωt
其中,||·||1表示1范数操作,dωt表示
Figure BDA0003088802260000081
的权值参数梯度,
Figure BDA0003088802260000082
表示求偏导数操作,ω*表示更新后的权值参数,α表示学习率,α∈[0,1]。
步骤3f)判断t≥50是否成立,若是,得到训练好的无参考视频质量评价模型H′,否则,令t=t+1,并执行步骤3b)。
步骤4)获取无参考视频的质量评价结果:
将测试样本集Xtest作为无参考视频质量评价模型H′的输入进行前向传播,得到Xtest的预测质量分数集合
Figure BDA0003088802260000083
其中,
Figure BDA0003088802260000084
表示第v2个帧序列的预测质量分数。

Claims (4)

1.一种基于时空多尺度分析的无参考视频质量评价方法,其特征在于,包括如下步骤:
(1)获取训练样本集Xtrain和测试样本集Xtest
获取自然视频公知数据集中的V个失真视频的帧序列F={fv|1≤v≤V},并随机选取F中半数以上的帧序列及其对应的真实质量分数组成训练样本集Xtrain=(Ftrain;Ytrain),将剩余的帧序列及其对应的真实质量分数组合成测试样本集Xtest=(Ftest;Ytest),其中,fv表示数据集中的第v个帧序列,Ftrain表示训练帧序列集合,
Figure FDA0003088802250000011
Figure FDA0003088802250000012
表示第v1个训练帧序列,Ytrain表示
Figure FDA0003088802250000013
对应的真实质量分数集合,
Figure FDA0003088802250000014
Figure FDA0003088802250000015
表示
Figure FDA0003088802250000016
对应的真实质量分数,Ftest表示测试帧序列集合,
Figure FDA0003088802250000017
Figure FDA0003088802250000018
表示第v2个测试帧序列,Ytest表示
Figure FDA0003088802250000019
对应的真实质量分数集合,
Figure FDA00030888022500000110
Figure FDA00030888022500000111
表示
Figure FDA00030888022500000112
对应的真实质量分数,V≥150,
Figure FDA00030888022500000113
V2=V-V1
(2)构建基于时空多尺度分析的无参考视频质量评价模型H:
构建包括顺次连接的局部失真特征编码模块Henc、时空多尺度模块Hmul和时空注意力分析模块Hpool的无参考视频质量评价模型H,其中,局部失真特征编码模块Henc采用去除最后一个全连接层的VGG-16网络结构;时空多尺度模块Hmul包括并行排布的两个平均池化层及一个由多个平均池化层组成的下采样模块;时空注意力分析模块Hpool包括顺次连接的注意力分析器、归一化层和全连接层,注意力分析器包括多个全连接层;
(3)对无参考视频质量评价模型H进行迭代训练:
(3a)设迭代次数为t,最大迭代次数为T,T≥50,第t次迭代的无参考视频质量评价模型为Ht,并令t=1,Ht=H;
(3b)将训练样本集Xtrain作为无参考视频质量评价模型Ht的输入,局部失真特征编码模块
Figure FDA0003088802250000021
对Ftrain中的每个帧序列
Figure FDA0003088802250000022
逐个进行空间失真特征提取,得到空间失真特征
Figure FDA0003088802250000023
(3c)时空多尺度模块
Figure FDA0003088802250000024
中的两个下采样层及下采样模块分别对
Figure FDA0003088802250000025
提取的
Figure FDA0003088802250000026
进行下采样,得到每个帧序列在不同时空尺度上的局部失真特征表示组合成的局部失真信息
Figure FDA0003088802250000027
其中,
Figure FDA0003088802250000028
Figure FDA0003088802250000029
表示第v1个帧序列的第i个图像帧的第j个局部失真特征,
Figure FDA00030888022500000210
表示第v1个帧序列包含的图像帧个数,N表示从每个图像帧中提取的局部失真特征个数;
(3d)时空注意力分析模块
Figure FDA00030888022500000211
中的注意力分析器对
Figure FDA00030888022500000212
所采集的局部失真信息
Figure FDA00030888022500000213
进行显著性评估得到注意力权重
Figure FDA00030888022500000214
并通过归一化层对
Figure FDA00030888022500000215
进行归一化,得到最终注意力权重
Figure FDA00030888022500000216
利用
Figure FDA00030888022500000217
Figure FDA00030888022500000218
进行加权得到全局失真特征
Figure FDA00030888022500000219
最后利用全连接层对
Figure FDA00030888022500000220
进行回归得到
Figure FDA00030888022500000221
的预测质量分数
Figure FDA00030888022500000222
则Ftrain的预测质量分数为
Figure FDA00030888022500000223
其中,
Figure FDA00030888022500000224
表示第v1个帧序列的第i个图像帧的第j个局部失真特征对应的注意力权重,
Figure FDA00030888022500000225
表示第v1个帧序列的第i个图像帧的第j个局部失真特征对应的归一化后的注意力权重;
(3e)采用最小绝对误差LAE的公式,通过
Figure FDA00030888022500000226
和Ytrain计算时空注意力分析模块
Figure FDA00030888022500000227
的损失值Lt,并采用反向传播方法,通过损失值Lt计算
Figure FDA00030888022500000228
的权值参数梯度dωt,然后采用随机梯度下降法,通过dωt
Figure FDA00030888022500000229
的权值参数ωt进行更新;
(3f)判断t≥T是否成立,若是,得到训练好的无参考视频质量评价模型H′,否则,令t=t+1,并执行步骤(3b);
(4)获取无参考视频的质量评价结果:
将测试样本集Xtest作为无参考视频质量评价模型H′的输入进行前向传播,得到Xtest的预测质量分数集合
Figure FDA0003088802250000031
其中,
Figure FDA0003088802250000032
表示第v2个帧序列的预测质量分数。
2.根据权利要求1所述的基于时空多尺度分析的无参考视频质量评价方法,其特征在于,步骤(2)中所述的无参考视频质量评价模型H,其中:
局部失真特征编码模块Henc包括5个卷积模块和2个全连接层,其具体结构为:第一卷积模块→第二卷积模块→第三卷积模块→第四卷积模块→第五卷积模块→第一全连接层→第二全连接层;
第一卷积模块和第二卷积模块均由2个卷积层和1个最大池化层组成,具体结构为:第一卷积层→第二卷积层→第一最大池化层;卷积层的卷积核大小均为3×3,步长均为1,第一卷积模块的2个卷积层的卷积核数量均为64,第二卷积模块的2个卷积层的卷积核数量均为128;
第三、第四和第五卷积模块均由3个卷积层和1个最大池化层组成,所述卷积模块的具体结构为:第一卷积层→第二卷积层→第三卷积层→第一最大池化层;卷积层的卷积核大小均为3×3,步长均为1,第三卷积模块的3个卷积层的卷积核数量均设置为256,第四、第五卷积模块的3个卷积层的卷积核数量均设置为512;
时空多尺度模块Hmul所包含的下采样模块由2个平均池化层组成;
时空注意力分析模块Hpool所包含的注意力分析器包括2个全连接层。
3.根据权利要求1所述的基于时空多尺度分析的无参考视频质量评价方法,其特征在于:步骤(3d)中所述的时空注意力分析模块
Figure FDA0003088802250000033
中的注意力分析器对
Figure FDA0003088802250000034
所采集的
Figure FDA0003088802250000035
进行显著性评估得到注意力权重
Figure FDA0003088802250000036
并通过归一化层对
Figure FDA0003088802250000037
进行归一化,得到最终注意力权重
Figure FDA0003088802250000038
利用
Figure FDA0003088802250000039
Figure FDA00030888022500000310
进行加权得到全局失真特征
Figure FDA00030888022500000311
其中:
Figure FDA00030888022500000312
Figure FDA0003088802250000041
Figure FDA0003088802250000042
W1和W2分别表示注意力分析器中两个全连接层的权重,ReLU(·)表示激活函数,e表示自然常数,∑表示求和操作;
Figure FDA0003088802250000043
表示第v1个帧序列的全局失真特征。
4.根据权利要求1所述的基于三维时空特征分解的无参考视频质量评价方法,其特征在于:步骤(3e)中所述的计算无参考视频质量评价模型Ht中的时空注意力分析模块
Figure FDA0003088802250000044
的损失值Lt、通过损失值Lt计算
Figure FDA0003088802250000045
的权值参数梯度dωt、通过dωt
Figure FDA0003088802250000046
的权值参数ωt进行更新,计算公式为:
Figure FDA0003088802250000047
Figure FDA0003088802250000048
ω*=ωt-αdωt
其中,||·||1表示1范数操作,dωt表示
Figure FDA0003088802250000049
的权值参数梯度,
Figure FDA00030888022500000410
表示求偏导数操作,ω*表示更新后的权值参数,α表示学习率。
CN202110589087.0A 2021-05-28 2021-05-28 基于时空多尺度分析的无参考视频质量评价方法 Active CN113313682B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110589087.0A CN113313682B (zh) 2021-05-28 2021-05-28 基于时空多尺度分析的无参考视频质量评价方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110589087.0A CN113313682B (zh) 2021-05-28 2021-05-28 基于时空多尺度分析的无参考视频质量评价方法

Publications (2)

Publication Number Publication Date
CN113313682A true CN113313682A (zh) 2021-08-27
CN113313682B CN113313682B (zh) 2023-03-21

Family

ID=77375901

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110589087.0A Active CN113313682B (zh) 2021-05-28 2021-05-28 基于时空多尺度分析的无参考视频质量评价方法

Country Status (1)

Country Link
CN (1) CN113313682B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116051482A (zh) * 2022-12-29 2023-05-02 青海大学 一种基于多任务渐进学习的无参考图像质量评价方法
CN117611548A (zh) * 2023-11-22 2024-02-27 武汉大学 一种基于失真信息的图像质量评价方法及系统

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110255589A1 (en) * 2009-08-03 2011-10-20 Droplet Technology, Inc. Methods of compressing data and methods of assessing the same
CN102740119A (zh) * 2011-04-15 2012-10-17 特克特朗尼克公司 用于预测三维视频的主观质量的全参考系统
CN106303507A (zh) * 2015-06-05 2017-01-04 江苏惠纬讯信息科技有限公司 基于时空联合信息的无参考视频质量评估方法
US20170024852A1 (en) * 2015-07-24 2017-01-26 Eth-Zurich Image Processing System for Downscaling Images Using Perceptual Downscaling Method
CN107609492A (zh) * 2017-08-25 2018-01-19 西安电子科技大学 基于脑电信号的失真图像质量感知评价方法
WO2018171109A1 (zh) * 2017-03-23 2018-09-27 北京大学深圳研究生院 基于卷积神经网络的视频动作检测方法
CN110517237A (zh) * 2019-08-20 2019-11-29 西安电子科技大学 基于膨胀三维卷积神经网络的无参考视频质量评价方法
CN111182292A (zh) * 2020-01-05 2020-05-19 西安电子科技大学 无参考视频质量评估方法、系统、视频接收器、智能终端
CN111479109A (zh) * 2020-03-12 2020-07-31 上海交通大学 基于视听联合注意的视频质量评价方法、系统及终端
CN111510710A (zh) * 2020-04-27 2020-08-07 西安电子科技大学 基于脑电信号和时空失真的视频质量评价方法
WO2020173226A1 (zh) * 2019-02-28 2020-09-03 华中科技大学 一种时空行为检测方法
CN112085102A (zh) * 2020-09-10 2020-12-15 西安电子科技大学 基于三维时空特征分解的无参考视频质量评价方法
CN112381866A (zh) * 2020-10-27 2021-02-19 天津大学 一种基于注意力机制的视频比特增强方法

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110255589A1 (en) * 2009-08-03 2011-10-20 Droplet Technology, Inc. Methods of compressing data and methods of assessing the same
CN102740119A (zh) * 2011-04-15 2012-10-17 特克特朗尼克公司 用于预测三维视频的主观质量的全参考系统
CN106303507A (zh) * 2015-06-05 2017-01-04 江苏惠纬讯信息科技有限公司 基于时空联合信息的无参考视频质量评估方法
US20170024852A1 (en) * 2015-07-24 2017-01-26 Eth-Zurich Image Processing System for Downscaling Images Using Perceptual Downscaling Method
WO2018171109A1 (zh) * 2017-03-23 2018-09-27 北京大学深圳研究生院 基于卷积神经网络的视频动作检测方法
CN107609492A (zh) * 2017-08-25 2018-01-19 西安电子科技大学 基于脑电信号的失真图像质量感知评价方法
WO2020173226A1 (zh) * 2019-02-28 2020-09-03 华中科技大学 一种时空行为检测方法
CN110517237A (zh) * 2019-08-20 2019-11-29 西安电子科技大学 基于膨胀三维卷积神经网络的无参考视频质量评价方法
CN111182292A (zh) * 2020-01-05 2020-05-19 西安电子科技大学 无参考视频质量评估方法、系统、视频接收器、智能终端
CN111479109A (zh) * 2020-03-12 2020-07-31 上海交通大学 基于视听联合注意的视频质量评价方法、系统及终端
CN111510710A (zh) * 2020-04-27 2020-08-07 西安电子科技大学 基于脑电信号和时空失真的视频质量评价方法
CN112085102A (zh) * 2020-09-10 2020-12-15 西安电子科技大学 基于三维时空特征分解的无参考视频质量评价方法
CN112381866A (zh) * 2020-10-27 2021-02-19 天津大学 一种基于注意力机制的视频比特增强方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
SHILIN WU 等: "Efficient VR Video Representation and Quality Assessment", 《JOURNAL OF VISUAL COMMUNICATION AND IMAGE REPRESENTATION》 *
YUN ZHANG 等: "Depth perceptual quality assessment for symmetrically and asymmetrically distorted stereoscopic 3D videos", 《SIGNAL PROCESSING: IMAGE COMMUNICATION》 *
ZHU Y 等: "Blind video quality assessment based on spatio-temporal internal generative mechanism", 《2017 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING》 *
朱英豪: "基于深度学习的无参考立体视频质量评价方法的研究与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
贺然: "基于视频内容感知的视频质量评价方法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
高方远 等: "基于深度网络和视觉特性的无参考图像质量评价方法", 《南京师大学报(自然科学版)》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116051482A (zh) * 2022-12-29 2023-05-02 青海大学 一种基于多任务渐进学习的无参考图像质量评价方法
CN116051482B (zh) * 2022-12-29 2024-04-09 青海大学 一种基于多任务渐进学习的无参考图像质量评价方法
CN117611548A (zh) * 2023-11-22 2024-02-27 武汉大学 一种基于失真信息的图像质量评价方法及系统

Also Published As

Publication number Publication date
CN113313682B (zh) 2023-03-21

Similar Documents

Publication Publication Date Title
CN112085102B (zh) 基于三维时空特征分解的无参考视频质量评价方法
CN110111256B (zh) 基于残差蒸馏网络的图像超分辨重建方法
CN113313682B (zh) 基于时空多尺度分析的无参考视频质量评价方法
CN110599468A (zh) 无参考视频质量评估方法及装置
CN114612714A (zh) 基于课程学习的无参考图像质量评价方法
CN112950480A (zh) 一种融合多感受野和密集残差注意的超分辨率重建方法
CN109819256B (zh) 基于特征感知的视频压缩感知方法
CN111598894A (zh) 基于全局信息卷积神经网络的视网膜血管图像分割系统
CN114926883A (zh) 一种满足多种降质模型的人脸图像处理方法
CN114972232A (zh) 基于增量元学习的无参考图像质量评价方法
CN112767385B (zh) 基于显著性策略与特征融合无参考图像质量评价方法
CN113421237A (zh) 基于深度特征迁移学习的无参考图像质量评价方法
CN111711816B (zh) 基于可察知编码效应强度的视频客观质量评价方法
CN117237279A (zh) 一种非均匀失真全景图像盲质量评价方法及系统
CN113298827B (zh) 一种基于DP-Net网络的图像分割方法
CN109829377A (zh) 一种基于深度余弦度量学习的行人重识别方法
CN113313683B (zh) 基于元迁移学习的无参考视频质量评价方法
CN116051421A (zh) 基于多维度的内窥镜图像质量评价方法、装置、设备及介质
CN112488125B (zh) 一种基于高速视觉诊断和bp神经网络的重建方法及系统
CN112270370B (zh) 一种车辆表观毁伤评估方法
CN114785978A (zh) 一种面向视频会议的视频图像质量确定方法
CN110751632B (zh) 基于卷积神经网络的多尺度图像质量检测方法
CN113486821B (zh) 基于时域金字塔的无参考视频质量评价方法
CN113298825B (zh) 一种基于MSF-Net网络的图像分割方法
CN111145150B (zh) 一种通用型无参考图像质量评价方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant