CN111127435B - 基于双流卷积神经网络的无参考图像质量评估方法 - Google Patents

基于双流卷积神经网络的无参考图像质量评估方法 Download PDF

Info

Publication number
CN111127435B
CN111127435B CN201911352653.5A CN201911352653A CN111127435B CN 111127435 B CN111127435 B CN 111127435B CN 201911352653 A CN201911352653 A CN 201911352653A CN 111127435 B CN111127435 B CN 111127435B
Authority
CN
China
Prior art keywords
image
score
neural network
quality evaluation
pair
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911352653.5A
Other languages
English (en)
Other versions
CN111127435A (zh
Inventor
牛玉贞
陈锋
陈沛祥
黄栋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuzhou University
Original Assignee
Fuzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou University filed Critical Fuzhou University
Priority to CN201911352653.5A priority Critical patent/CN111127435B/zh
Publication of CN111127435A publication Critical patent/CN111127435A/zh
Application granted granted Critical
Publication of CN111127435B publication Critical patent/CN111127435B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30168Image quality inspection

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于双流卷积神经网络的无参考图像质量评估方法,包括以下步骤:步骤S1:将失真图像数据进行数据预处理,得到待训练的图像对,作为训练数据;步骤S2:构建双流卷积神经网络模型,并根据得到训练数据训练模型,得到训练好的图像质量评估模型;步骤S3:将待测图像进行预处理,并生成待测图像的图像对,并利用训练好的图像质量评估模型预测待测图像的图像对的质量,根据待测图像的图像对的分数计算待测图像的分数。本发明能显著提高无参照图像质量评估的性能。

Description

基于双流卷积神经网络的无参考图像质量评估方法
技术领域
本发明涉及图像和视频处理以及计算机视觉领域,具体涉及一种基于双流卷积神经网络的无参考图像质量评估方法。
背景技术
数字图像和图像处理技术已经彻底改变了人们获取、查看、使用和共享图片的方式。数字图像的应用领域包括生物医疗、航空航天、工业和农业领域、汽车自动驾驶、军事和视频直播等等。随着多媒体技术的发展,现在人们对图片实时分享、发送和接收,以及即时在线直播的要求越来越高,使得对图像质量评估算法的要求也越来越高。由于带宽的限制和物理设备的特性,图像在获取、存储、压缩和传输等过程中很容易产生失真,失真会影响人们对图像的观感;会不同程度地丢失原始图像中所包含的信息,从而影响人们从图像中获取信息。图像质量评估可以根据图像的失真类型及失真程度来对图像的质量进行评估,从而为后续的图像处理技术,比如图像超分辨率、图像分割、图像去噪和显著性检测等提供基础,是图像处理领域的关键技术之一。
图像质量评估一般有主观和客观之分。主观评估是指由人类来对图像质量进行评估,平均意见得分是一种主观图像质量评估的测量方法,需要许多人类观察员来对图像进行打分。客观图像质量评估是指使用人类主观感知来建立一个数学计算模型,其目标是使机器能够自动对图像或者视频的质量做出评估,并且希望评估结果尽可能接近人类主观评估的结果。相较于主观评估,客观评估应用更广泛。客观评估可以分为三种:无参考型、半参考型和全参考型。全参考型需要原始图像作为对比来评估失真图像的质量,半参考型只需使用部分原始图像的信息,无参考型则完全不需要使用原始图像的信息。由于无参考评估不需要使用原始图像的信息,所以在没有原始图像的实际应用中,无参考图像质量评估更为实用。
现有的评估方法通常使用单一类型的图像作为输入。使用RGB图像作为输入,提取出的特征可以保留更多的细节信息;使用局部归一化图像作为输入,提取出的特征可以保留更多的边缘等结构信息。
发明内容
有鉴于此,本发明的目的在于提供一种基于双流卷积神经网络的无参考图像质量评估方法,能显著提高无参照图像质量评估的性能。
为实现上述目的,本发明采用如下技术方案:
一种基于双流卷积神经网络的无参考图像质量评估方法,包括以下步骤:
步骤S1:将失真图像数据进行数据预处理,得到待训练的图像对,作为训练数据;
步骤S2:构建双流卷积神经网络模型,并根据得到训练数据训练图像质量评估模型,得到训练好的图像质量评估模型;
步骤S3:将待测图像进行预处理,并生成待测图像的图像对,并利用训练好的图像质量评估模型预测待测图像的图像对的质量,根据待测图像的图像对的分数计算待测图像的分数。
进一步的,所述步骤S1具体为:
骤S11:将所有失真图像进行局部归一化处理,给定强度图像I(i,j),计算归一化图像的公式如下:
Figure BDA0002335011790000031
Figure BDA0002335011790000032
Figure BDA0002335011790000033
其中,(i,j)为像素位置,I(i,j)为位置(i,j)处图像I的像素值大小,
Figure BDA0002335011790000034
表示图像I归一化后位置(i,j)处图像I的像素值大小,C为常数,用于防止分母为零的情况出现;K和L为归一化窗口大小,ωk,l是一个二维圆形对称高斯加权函数;
步骤S12:将RGB图像和局部归一化图像有重叠地切分成若干个H×W大小的图像块;
步骤S13:将RGB图像块和对应的局部归一化图像块组合,构成图像对。
进一步的,所述步骤S2具体为:
步骤S21:构建一个双流卷积神经网络结构用于训练无参考图像质量评价模型,网络由两个子网络构成:子网络I和子网络II;子网络I和子网络II的输入分别为步骤S13中构成的图像对中的RGB图像块和局部归一化图像块;
步骤S22:双流卷积神经网络使用均方误差作为损失函数,公式如下,
Figure BDA0002335011790000041
其中,L表示损失函数的值,N代表图像块的数量,xn表示第n个输入,即第n个图像块;f(xn)表示预测分数,Sn表示图像质量的目标值,即主观评估分数;
步骤S24:网络通过多次迭代进行反向传播,在每次迭代中,训练集被分成多个批次进行分批优化;采用基于梯度方差的ADAM方法自适应控制每个参数的分批优化学习率。
进一步的,所述双流卷积神经网络的两个子网络具有完全相同的结构,两个子网络的结构都由13个卷积层和5个池化层组成;
将从两个分支中提取出的图像特征进行特征融合;
特征融合后,经过两个具有512个节点的全连接层,最后使用线性回归,以预测图像质量分数
所有卷积层都由卷积、批标准化和ReLU非线性映射三部分组成BN处理计算公式如下,
Figure BDA0002335011790000042
Figure BDA0002335011790000043
Figure BDA0002335011790000044
其中,m表示一个批次的输入数量,xi表示一个批次中第i个输入,μ和σ2分别是m个输入的均值和方差,
Figure BDA0002335011790000051
是xi标准化为均值为0、方差为1的正态分布的输出,ε是一个极小的正数防止分母为0导致运算出错;对标准化变换后的满足均值为0、方差为1的
Figure BDA0002335011790000052
进行了缩放和平移操作,计算公式如下,
Figure BDA0002335011790000053
其中,
Figure BDA0002335011790000054
满足均值为0、方差为1的标准正态分布,yi是缩放和平移操作后的输出,γ和β是训练中学习的缩放和平移参数。
进一步的,所述步骤S3具体为:
步骤S31:先将所有待测图像做局部归一化处理,然后将RGB图像和局部归一化图像划分成大小为H×W的图像块;将RGB图像块和对应的局部归一化图像块组合,构成图像对;
步骤S32:将图像对作为训练好的图像质量评估模型的输入,得到每个图像对的分数;
步骤S33:通过每个图像对的分数,计算图像的分数,计算公式如下,
Figure BDA0002335011790000055
其中,P表示模型预测出该张测试图像的图像质量得分,N表示该张测试图像划分得到的图像块的数量,pi表示模型预测出的该图像块的质量分数。
本发明与现有技术相比具有以下有益效果:
1、本发明适用于多种失真类型的、不同失真程度的图像质量评估,计算得到的质量评估分数更精准。
2、本发明综合考虑图像的质量评估分数和失真类型之间的联系,对图像的失真信息有更强的表示能力,能显著提高无参照图像质量评估性能
附图说明
图1是本发明方法流程图;
图2是本发明一实施例中双流卷积神经网络模型的结构图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
请参照图1,本发明提供一种基于双流卷积神经网络的无参考图像质量评估方法,包括以下步骤:
步骤S1:将待训练的数据进行数据预处理。
步骤S11:先将所有失真图像进行局部归一化处理,给定强度图像I(i,j),计算归一化值
Figure BDA0002335011790000061
的公式如下:
Figure BDA0002335011790000062
Figure BDA0002335011790000063
Figure BDA0002335011790000064
其中,(i,j)为像素位置,I(i,j)为位置(i,j)处图像I的像素值大小,
Figure BDA0002335011790000065
表示图像I归一化后位置(i,j)处图像I的像素值大小,C为常数,用于防止分母为零的情况出现;K和L为归一化窗口大小。ωk,l是一个二维圆形对称高斯加权函数。
在本实施例中,优选的设置K=L=3。
步骤S12:将所有RGB图像和局部归一化图像有重叠地切分成若干个H×W大小的图像块。
步骤S13:将所有RGB图像块和对应的局部归一化图像块组合,构成图像对。
步骤S2:构建双流卷积神经网络结构,使用所设计的网络训练图像质量评估模型。
步骤S21:设计一个双流卷积神经网络结构用于训练无参考图像质量评价模型,网络由两个子网络构成:子网络I和子网络II。子网络I和子网络II的输入分别为RGB图像和局部归一化图像。
步骤S22:该双流卷积神经网络的两个子网络具有完全相同的结构,两个子网络的结构都由13个卷积层和5个池化层组成。将从两个分支中提取出的图像特征进行特征融合。特征融合后,经过两个具有512个节点的全连接层,最后使用线性回归,以预测图像质量分数。所有卷积层都由卷积、批标准化(Batch Normalization,BN)和ReLU非线性映射三部分组成。BN处理计算公式如下,
Figure BDA0002335011790000071
Figure BDA0002335011790000072
Figure BDA0002335011790000073
其中,m表示一个批次的输入数量,xi表示一个批次中第i个输入,μ和σ2分别是m个输入的均值和方差,
Figure BDA0002335011790000081
是xi标准化为均值为0、方差为1的正态分布的输出,ε是一个极小的正数防止分母为0导致运算出错。同时,为了保证非线性的获得,对标准化变换后的满足均值为0、方差为1的
Figure BDA0002335011790000082
进行了缩放和平移操作,计算公式如下,
Figure BDA0002335011790000083
其中,
Figure BDA0002335011790000084
满足均值为0、方差为1的标准正态分布,yi是缩放和平移操作后的输出,γ和β是训练中学习的缩放和平移参数。
步骤S23:双流卷积神经网络使用均方误差作为损失函数,其公式如下,
Figure BDA0002335011790000085
其中,L表示损失函数的值,N代表图像块的数量,xn表示第n个输入,即第n个图像块。f(xn)表示预测分数,Sn表示图像质量的目标值,即主观评估分数。
步骤S24:网络通过在多次迭代进行反向传播。在每次迭代中,训练集被分成多个批次进行分批优化。我们采用基于梯度方差的ADAM方法自适应控制每个参数的分批优化学习率。
步骤S3:将待测图像进行预处理,并生成图像对,利用训练好的模型预测所生成的图像对的质量,根据图像对的分数计算图像的分数。
步骤S31:先将所有待测图像做局部对比度归一化处理,然后将RGB图像和局部归一化图像划分成大小为H×W的图像块。将RGB图像块和对应的局部归一化图像组合,构成图像对。
步骤S32:将图像对作为训练好模型的输入,得到每个图像对的分数;
步骤S33:通过每个图像对的分数,计算得到图像的分数,计算公式如下,
Figure BDA0002335011790000091
其中,P表示模型预测出该张测试图像的图像质量得分,N表示该张测试图像划分得到的图像块的数量,pi表示模型预测出的该图像块的质量分数。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

Claims (3)

1.一种基于双流卷积神经网络的无参考图像质量评估方法,其特征在于,包括以下步骤:
步骤S1:将失真图像数据进行数据预处理,得到待训练的图像对,作为训练数据;
步骤S2:构建双流卷积神经网络模型,并根据得到训练数据训练图像质量评估模型,得到训练好的图像质量评估模型;
步骤S3:将待测图像进行预处理,并生成待测图像的图像对,并利用训练好的图像质量评估模型预测待测图像的图像对的质量,根据待测图像的图像对的分数计算待测图像的分数;
所述步骤S1具体为:
步骤S11:将所有失真图像进行局部归一化处理,给定强度图像I(i′,j),局部归一化处理的公式如下:
Figure FDA0003842133420000011
Figure FDA0003842133420000012
Figure FDA0003842133420000013
其中,(i′,j)为像素位置,I(i′,j)为位置(i′,j)处图像I的像素值大小,
Figure FDA0003842133420000014
表示图像I局部归一化后位置(i′,j)处图像I的像素值大小,C为常数,用于防止分母为零的情况出现;K和L为归一化窗口大小,ωk,l是一个二维圆形对称高斯加权函数;
步骤S12:将RGB图像和局部归一化图像有重叠地切分成若干个H×W大小的图像块;
步骤S13:将RGB图像块和对应的局部归一化图像块组合,构成图像对
所述步骤S2具体为:
步骤S21:构建一个双流卷积神经网络模型结构用于训练图像质量评估模型,网络由两个子网络构成:子网络I和子网络II;子网络I和子网络II的输入分别为步骤S13中构成的图像对中的RGB图像块和局部归一化图像块;
步骤S22:双流卷积神经网络模型使用均方误差作为损失函数,公式如下,
Figure FDA0003842133420000021
其中,L表示损失函数的值,N代表图像块的数量,xn表示第n个输入,即第n个图像块;f(xn)表示预测分数,Sn表示图像质量的目标值,即主观评估分数;
步骤S23:网络通过多次迭代进行反向传播,在每次迭代中,训练集被分成多个批次进行分批优化;采用基于梯度方差的ADAM方法自适应控制每个参数的分批优化学习率。
2.根据权利要求1所述的基于双流卷积神经网络的无参考图像质量评估方法,其特征在于:所述双流卷积神经网络的两个子网络具有完全相同的结构,两个子网络的结构都由13个卷积层和5个池化层组成;
将从两个分支中提取出的图像特征进行特征融合;
特征融合后,经过两个具有512个节点的全连接层,最后使用线性回归,以预测图像质量分数
所有卷积层都由卷积、批标准化和ReLU非线性映射三部分组成BN处理计算公式如下,
Figure FDA0003842133420000031
Figure FDA0003842133420000032
Figure FDA0003842133420000033
其中,m表示一个批次的输入数量,xi表示一个批次中第i个输入,μ和σ2分别是m个输入的均值和方差,
Figure FDA0003842133420000034
是xi标准化为均值为0、方差为1的正态分布的输出,ε是一个极小的正数防止分母为0导致运算出错;对标准化变换后的满足均值为0、方差为1的
Figure FDA0003842133420000036
进行了缩放和平移操作,计算公式如下,
Figure FDA0003842133420000035
其中,yi是缩放和平移操作后的输出,γ和β是训练中学习的缩放和平移参数。
3.根据权利要求1所述基于双流卷积神经网络的无参考图像质量评估方法,其特征在于,所述步骤S3具体为:
步骤S31:先将所有待测图像做局部归一化处理,然后将RGB图像和局部归一化图像划分成大小为H×W的图像块;将RGB图像块和对应的局部归一化图像块组合,构成图像对;
步骤S32:将图像对作为训练好的图像质量评估模型的输入,得到每个图像对的分数;
步骤S33:通过每个图像对的分数,计算图像的分数,计算公式如下,
Figure FDA0003842133420000041
其中,P表示模型预测出待测试图像的图像质量得分,pi表示模型预测出的该图像块的质量分数。
CN201911352653.5A 2019-12-25 2019-12-25 基于双流卷积神经网络的无参考图像质量评估方法 Active CN111127435B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911352653.5A CN111127435B (zh) 2019-12-25 2019-12-25 基于双流卷积神经网络的无参考图像质量评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911352653.5A CN111127435B (zh) 2019-12-25 2019-12-25 基于双流卷积神经网络的无参考图像质量评估方法

Publications (2)

Publication Number Publication Date
CN111127435A CN111127435A (zh) 2020-05-08
CN111127435B true CN111127435B (zh) 2022-11-15

Family

ID=70502336

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911352653.5A Active CN111127435B (zh) 2019-12-25 2019-12-25 基于双流卷积神经网络的无参考图像质量评估方法

Country Status (1)

Country Link
CN (1) CN111127435B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111815529B (zh) * 2020-06-30 2023-02-07 上海电力大学 一种基于模型融合和数据增强的低质图像分类增强方法
CN112084551A (zh) * 2020-07-03 2020-12-15 邱宇 一种基于对抗生成网络的建筑立面识别与生成方法
CN112508967A (zh) * 2020-12-04 2021-03-16 武汉大学 一种图像质量评价方法及系统
CN112767385B (zh) * 2021-01-29 2022-05-17 天津大学 基于显著性策略与特征融合无参考图像质量评价方法
CN112766419A (zh) * 2021-03-09 2021-05-07 东华理工大学 一种基于多任务学习的图像质量评估方法及装置
CN113361474B (zh) * 2021-07-01 2022-09-09 中国科学技术大学 基于图像块特征提取的双流网络图像伪造检测方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108391121B (zh) * 2018-04-24 2020-10-27 中国科学技术大学 一种基于深度神经网络的无参考立体图像质量评价方法
CN108961245A (zh) * 2018-07-06 2018-12-07 西安电子科技大学 基于双通道深度并行卷积网络的图像质量分类方法
US10503966B1 (en) * 2018-10-11 2019-12-10 Tindei Network Technology (Shanghai) Co., Ltd. Binocular pedestrian detection system having dual-stream deep learning neural network and the methods of using the same
CN109727246B (zh) * 2019-01-26 2022-05-13 福州大学 一种基于孪生网络的对比学习图像质量评估方法

Also Published As

Publication number Publication date
CN111127435A (zh) 2020-05-08

Similar Documents

Publication Publication Date Title
CN111127435B (zh) 基于双流卷积神经网络的无参考图像质量评估方法
Fu et al. Uncertainty inspired underwater image enhancement
CN108428227B (zh) 基于全卷积神经网络的无参考图像质量评价方法
CN109754391B (zh) 一种图像质量评价方法、装置及电子设备
CN106355195B (zh) 用于测量图像清晰度值的系统及其方法
Ou et al. A novel rank learning based no-reference image quality assessment method
Fu et al. Twice mixing: A rank learning based quality assessment approach for underwater image enhancement
CN112348828A (zh) 基于神经网络的实例分割方法和装置以及存储介质
Du et al. Multi-focus image fusion algorithm based on pulse coupled neural networks and modified decision map
CN115393231B (zh) 一种缺陷图像的生成方法、装置、电子设备和存储介质
CN107948635A (zh) 一种基于退化测量的无参考声纳图像质量测评方法
Morzelona Human visual system quality assessment in the images using the IQA model integrated with automated machine learning model
CN109598695B (zh) 一种基于深度学习网络的无参考图像模糊程度估计方法
Liu et al. Source-free unsupervised domain adaptation for blind image quality assessment
CN114187261A (zh) 一种基于多维注意力机制的无参考立体图像质量评价方法
CN112085668B (zh) 一种基于区域自适应自监督学习的图像色调映射的方法
Guofeng et al. Adaptive morphological contrast enhancement based on quantum genetic algorithm for point target detection
Wang et al. A novel singular value decomposition-based similarity measure method for non-local means denoising
CN115937121A (zh) 基于多维度特征融合的无参考图像质量评价方法及系统
Jayageetha et al. Medical image quality assessment using CSO based deep neural network
CN113313683B (zh) 基于元迁移学习的无参考视频质量评价方法
CN114785978A (zh) 一种面向视频会议的视频图像质量确定方法
Dharmalingam et al. Adaptive frost filtered quantile regressive artificial deep structure learning framework for image quality assessment
Ma et al. Reduced-reference stereoscopic image quality assessment based on entropy of gradient primitives
CN110852451B (zh) 基于核函数的递归核自适应滤波方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant