CN110324613A - 一种面向视频传输质量的深度学习图像评价方法 - Google Patents

一种面向视频传输质量的深度学习图像评价方法 Download PDF

Info

Publication number
CN110324613A
CN110324613A CN201910693050.5A CN201910693050A CN110324613A CN 110324613 A CN110324613 A CN 110324613A CN 201910693050 A CN201910693050 A CN 201910693050A CN 110324613 A CN110324613 A CN 110324613A
Authority
CN
China
Prior art keywords
image
size
training
num
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910693050.5A
Other languages
English (en)
Other versions
CN110324613B (zh
Inventor
刘桂雄
蒋晨杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201910693050.5A priority Critical patent/CN110324613B/zh
Publication of CN110324613A publication Critical patent/CN110324613A/zh
Application granted granted Critical
Publication of CN110324613B publication Critical patent/CN110324613B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N17/00Diagnosis, testing or measuring for television systems or their details

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种面向视频传输质量的深度学习图像评价方法,该方法包括:构造用于评价图像质量的孪生神经网络来提取特征,并对于目标图像块特征图、参考图像块特征图进行特征融合,设计出图像质量评价分数计算方法与损失函数来更新网络参数;设置孪生神经网络训练超参数,包括学习率、学习衰减率、最大训练步数、学习率衰减步数、批训练量、训练图像尺寸、单张图像采样量、数据集(训练集、验证集、测试集)分配等;设计出目标图像与参考图像的图像区域分割与块选择方案。

Description

一种面向视频传输质量的深度学习图像评价方法
技术领域
本发明涉及图像质量评价领域,尤其涉及一种基于深度学习的图像质量评价方法。
背景技术
视频图像在传输过程中会因种种原因对最后的传输质量产生较大影响,所以对于图像传输质量的正确评价就显得很重要。现有的图像质量评价技术很多都是依赖人类视觉系统或自然图像统计的计算模型,甚至是人工评价。前者评价分数与人眼主观平均意见分数相关度有时相对较低,容易出现判断不一致的情况;而后者则效率很低,长时间工作容易出现疲劳误差,影响判断准确性,为此寻找一种能高效、准确、智能地评价视频图像传输质量的方法具有重要现实意义。
发明内容
为解决上述技术问题,本发明的目的是提供一种面向视频传输质量的深度学习图像评价方法。
本发明的目的通过以下的技术方案来实现:
一种面向视频传输质量的深度学习图像评价方法,包括:
A构造一对用于评价图像质量的结构相同、权重共享的孪生神经网络,孪生神经网络两端输入尺寸分别为X×Y×3的目标图像块和参考图像块,输出特征图像,对特征图像进行特征融合,回归得到评价分数,根据损失函数及数据标签与评价分数,更新网络参数;
B设置孪生神经网络训练超参数,包括学习率Learning_Rate、学习衰减率Decay_Rate、最大训练步数Max_Steps、学习率衰减步数Decay_Step、批训练量Batch_Size、训练图像尺寸M×N×3、单张图像采样量Sample_num、与数据集的设置;所述数据集包括训练集、验证集与测试集;
C目标图像与参考图像分割成m×n块尺寸符合孪生神经网络输入的目标图像块与参考图像块,并按照横向每km个图像块取1个、纵向每kn个图像块取1个的方式对目标图像与参考图像降采样;
D完成神经网络训练,得到训练模型,实际部署后即可实时评价视频流输入的目标图像质量。
与现有技术相比,本发明具有如下优点:
能高效、准确、智能地评价视频图像传输质量的方法具有重要现实意义。
附图说明
图1是面向视频传输质量的深度学习图像评价方法流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合实施例及附图对本发明作进一步详细的描述。
如图1所示,为面向视频传输质量的深度学习图像评价方法流程,包括以下步骤:
步骤10构造一对用于评价图像质量的结构相同、权重共享的孪生神经网络,孪生神经网络两端输入分别为尺寸为X×Y×3的目标图像块和参考图像块,输出为特征图像,之后对特征图像进行特征融合,回归得到评价分数,根据损失函数和数据标签、评价分数,更新网络参数;
步骤20设置孪生神经网络训练超参数,包括学习率Learning_Rate、学习衰减率Decay_Rate、最大训练步数Max_Steps、学习率衰减步数Decay_Step、批训练量Batch_Size、训练图像尺寸M×N×3、单张图像采样量Sample_num、数据集(训练集、验证集、测试集)设置等;
步骤30目标图像与参考图像分割成m×n块尺寸符合孪生神经网络输入的目标图像与参考图像块,并按照横向每km个图像块取1个、纵向每kn个图像块取1个的方式对目标图像与参考图像降采样;
步骤40完成神经网络训练,得到训练模型,实际部署后即可实时评价视频流输入的目标图像质量;
上述步骤10具体包括:图像块尺寸为64×64×3,孪生神经网络由卷积层、池化层、特征融合、全连接层组成。卷积层采用激活函数为ReLu函数,卷积核大小均为3×3,每次卷积前对特征图像进行边界填充,第1个卷积层输出16张特征图像,每2次卷积输出特征图像进行1次池化、下次卷积输出数量乘2,总共进行12次卷积操作。池化层采用最大池化,池化核大小为2×2,步长为2×2。假设参考图像池化后特征图像为Ireference、目标图像池化后特征图像为Itarget,两者尺寸为1×1×512×Sample_num,将Ireference-Itarget得Idifference,对三者按第二维度进行数据合并得到尺寸为1×3×512×Sample_num的Ifeature,完成特征融合。全连接层包含两层,第一层输入为大小3×512×Sample_num,输出大小为512×Sample_num;第二层输入大小为512×Sample_num,输出大小为Sample_num。
上述步骤10具体包括:通过孪生神经网络生成目标图像块的质量分数q、权重w、偏置b,并对权重归一化得到w′:
计算偏置平均值得到b′:
由此计算出目标图像质量评价分数为:
上述步骤10具体包括:数据集中目标图像质量标签为Q,单次训练包含Batch_size次图像质量评价,单次训练评价分数和标签向量分别和Q,则其损失函数Loss为:
单次训练结束后根据损失函数,利用随机梯度下降算法更新孪生神经网络的参数。
上述步骤20具体包括:Learning_Rate设置为0.001,Decay_Step设置为1000步,Decay_Rate设置为0.9每Decay_Step,Max_Steps设置为200000步,Batch_Size设置为10,训练图像尺寸为512×384×3,由于图像块尺寸为64×64×3,故可分成8×6个小图像块,再按每行2个取一个,每列2个取1个方式,故Sample_num设置为4×3=12块,训练集、验证集、测试集按照数据集60%,20%,20%比例随机抽取组成。
上述步骤30具体包括:每行、每列图像块数量m,n计算方法为:
其中div为相除取整,mod为相除取余。
用Pi,j表示第i行、第j列个图像块,Il:r,u:d,:表示图像Ireference或Itarget上第l行至第r行,第u列至第d列之间的区域,则Pi, j 为:
上述步骤30具体包括:根据m、n、km、kn,可以计算出Sample_num:
Sample_num=(m divkm)×(n divkn)
选取的图像块为:
Pi,j if1≤i≤n,1≤j≤m,(i-1)modkn=0,(j-1)modkm=0。
虽然本发明所揭露的实施方式如上,但所述的内容只是为了便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属技术领域内的技术人员,在不脱离本发明所揭露的精神和范围的前提下,可以在实施的形式上及细节上作任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。

Claims (8)

1.一种面向视频传输质量的深度学习图像评价方法,其特征在于,所述方法包括:
A构造一对用于评价图像质量的结构相同、权重共享的孪生神经网络,孪生神经网络两端输入尺寸分别为X×Y×3的目标图像块和参考图像块,输出特征图像,对特征图像进行特征融合,回归得到评价分数,根据损失函数及数据标签与评价分数,更新网络参数;
B设置孪生神经网络训练超参数,包括学习率Learning_Rate、学习衰减率Decay_Rate、最大训练步数Max_Steps、学习率衰减步数Decay_Step、批训练量Batch_Size、训练图像尺寸M×N×3、单张图像采样量Sample_num、与数据集的设置;所述数据集包括训练集、验证集与测试集;
C目标图像与参考图像分割成m×n块尺寸符合孪生神经网络输入的目标图像块与参考图像块,并按照横向每km个图像块取1个、纵向每kn个图像块取1个的方式对目标图像与参考图像降采样;
D完成神经网络训练,得到训练模型,实际部署后即可实时评价视频流输入的目标图像质量。
2.如权利要求1所述的面向视频传输质量的深度学习图像评价方法,其特征在于,所述步骤A中,目标图像块与参考图像块尺寸分别为64×64×3;所述孪生神经网络由卷积层、池化层、特征融合、全连接层组成;所述卷积层采用激活函数为ReLu函数,卷积核大小均为3×3;所述池化层采用最大池化,池化核大小为2×2,步长为2×2;所述全连接层包含两层,第一层输入为大小3×512×Sample_num,输出大小为512×Sample_num;第二层输入大小为512×Sample_num,输出大小为Sample_num。
3.如权利要求2所述的面向视频传输质量的深度学习图像评价方法,其特征在于,
所述卷积层中每次卷积前对特征图像进行边界填充,第1个卷积层输出16张特征图像,每2次卷积输出特征图像进行1次池化、下次卷积输出数量乘2,总共进行12次卷积操作;
所述池化层中假设参考图像池化后特征图像为Ireference、目标图像池化后特征图像为Itarget,两者尺寸为1×1×512×Sample_num,将Ireference-Itarget得Idifference,对三者按第二维度进行数据合并得到尺寸为1×3×512×Sample_num的Ifeature,完成特征融合。
4.如权利要求1所述的面向视频传输质量的深度学习图像评价方法,其特征在于,所述步骤A中,通过孪生神经网络生成目标图像块的质量分数q、权重w、偏置b,并对权重归一化得到w′:
计算偏置平均值得到b′:
由此计算出目标图像质量评价分数为:
5.如权利要求1所述的面向视频传输质量的深度学习图像评价方法,其特征在于,所述步骤A中,数据集中目标图像质量标签为Q,单次训练包含Batch_size次图像质量评价,单次训练评价分数和标签向量分别和Q,则其损失函数Loss为:
单次训练结束后根据损失函数,利用随机梯度下降算法更新孪生神经网络的参数。
6.如权利要求1所述的面向视频传输质量的深度学习图像评价方法,其特征在于,所述步骤B中,Learning_Rate设置为0.001,Decay_Step设置为1000步,Decay_Rate设置为0.9每Decay_Step,Max_Steps设置为200000步,Batch_Size设置为10,训练图像尺寸为512×384×3,由于图像块尺寸为64×64×3,故可分成8×6个小图像块,再按每行2个取一个,每列2个取1个方式,故Sample_num设置为4×3=12块,训练集、验证集、测试集按照数据集60%,20%,20%比例随机抽取组成。
7.如权利要求1所述的面向视频传输质量的深度学习图像评价方法,其特征在于,所述步骤C中,每行、每列图像块数量m,n计算方法为:
其中div为相除取整,mod为相除取余;
用Pi,j表示第i行、第j列个图像块,Il:r,u:d,:表示图像Ireference或Itarget上第l行至第r行,第u列至第d列之间的区域,则Pi,j为:
8.如权利要求1所述的面向视频传输质量的深度学习图像评价方法,其特征在于,所述步骤B、C中,根据m、n、km、kn,可计算出Sample_num:
Sample_num=(m div km)×(n div kn)
选取的图像块为:
Pi,j if1≤i≤n,1≤j≤m,(i-1)mod kn=0,(j-1)mod km=0。
CN201910693050.5A 2019-07-30 2019-07-30 一种面向视频传输质量的深度学习图像评价方法 Active CN110324613B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910693050.5A CN110324613B (zh) 2019-07-30 2019-07-30 一种面向视频传输质量的深度学习图像评价方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910693050.5A CN110324613B (zh) 2019-07-30 2019-07-30 一种面向视频传输质量的深度学习图像评价方法

Publications (2)

Publication Number Publication Date
CN110324613A true CN110324613A (zh) 2019-10-11
CN110324613B CN110324613B (zh) 2021-06-01

Family

ID=68124910

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910693050.5A Active CN110324613B (zh) 2019-07-30 2019-07-30 一种面向视频传输质量的深度学习图像评价方法

Country Status (1)

Country Link
CN (1) CN110324613B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110913207A (zh) * 2019-12-03 2020-03-24 华南理工大学 一种基于多任务深度学习的视频传输质量评价方法
CN111325736A (zh) * 2020-02-27 2020-06-23 成都航空职业技术学院 一种基于人眼差分图像的视线角度估计方法
CN115100579A (zh) * 2022-08-09 2022-09-23 郑州大学 一种基于优化深度学习的管道中视频损害智能分割系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103841410A (zh) * 2014-03-05 2014-06-04 北京邮电大学 基于图像特征信息的半参考视频QoE客观评估方法
CN105430383A (zh) * 2015-12-07 2016-03-23 广东电网有限责任公司珠海供电局 一种视频流媒体业务的体验质量评估方法
CN109754391A (zh) * 2018-12-18 2019-05-14 北京爱奇艺科技有限公司 一种图像质量评价方法、装置及电子设备
CN109859166A (zh) * 2018-12-26 2019-06-07 上海大学 一种基于多列卷积神经网络的无参3d图像质量评估方法
CN110033446A (zh) * 2019-04-10 2019-07-19 西安电子科技大学 基于孪生网络的增强图像质量评价方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103841410A (zh) * 2014-03-05 2014-06-04 北京邮电大学 基于图像特征信息的半参考视频QoE客观评估方法
CN105430383A (zh) * 2015-12-07 2016-03-23 广东电网有限责任公司珠海供电局 一种视频流媒体业务的体验质量评估方法
CN109754391A (zh) * 2018-12-18 2019-05-14 北京爱奇艺科技有限公司 一种图像质量评价方法、装置及电子设备
CN109859166A (zh) * 2018-12-26 2019-06-07 上海大学 一种基于多列卷积神经网络的无参3d图像质量评估方法
CN110033446A (zh) * 2019-04-10 2019-07-19 西安电子科技大学 基于孪生网络的增强图像质量评价方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110913207A (zh) * 2019-12-03 2020-03-24 华南理工大学 一种基于多任务深度学习的视频传输质量评价方法
CN110913207B (zh) * 2019-12-03 2021-07-13 华南理工大学 一种基于多任务深度学习的视频传输质量评价方法
CN111325736A (zh) * 2020-02-27 2020-06-23 成都航空职业技术学院 一种基于人眼差分图像的视线角度估计方法
CN111325736B (zh) * 2020-02-27 2024-02-27 成都航空职业技术学院 一种基于人眼差分图像的视线角度估计方法
CN115100579A (zh) * 2022-08-09 2022-09-23 郑州大学 一种基于优化深度学习的管道中视频损害智能分割系统
CN115100579B (zh) * 2022-08-09 2024-03-01 郑州大学 一种基于优化深度学习的管道中视频损害智能分割系统

Also Published As

Publication number Publication date
CN110324613B (zh) 2021-06-01

Similar Documents

Publication Publication Date Title
CN110324613A (zh) 一种面向视频传输质量的深度学习图像评价方法
CN106504248A (zh) 基于计算机视觉的车辆损伤判别方法
CN106796716B (zh) 用于为低分辨率图像提供超分辨率的设备和方法
CN103853786B (zh) 数据库参数的优化方法与系统
CN107610123A (zh) 一种基于深度卷积神经网络的图像美学质量评价方法
CN107886503A (zh) 一种消化道解剖位置识别方法及装置
CN106910192A (zh) 一种基于卷积神经网络的图像融合效果评估方法
CN106920215A (zh) 一种全景图像配准效果的检测方法
CN108428227A (zh) 基于全卷积神经网络的无参考图像质量评价方法
CN108665460A (zh) 基于组合神经网络和分类神经网络的图像质量评价方法
CN108229267A (zh) 对象属性检测、神经网络训练、区域检测方法和装置
CN106067161A (zh) 一种对图像进行超分辨的方法
CN110084603A (zh) 训练欺诈交易检测模型的方法、检测方法以及对应装置
CN106650827A (zh) 基于结构指导深度学习的人体姿态估计方法和系统
CN109410261A (zh) 基于金字塔池化模块的单目图像深度估计方法
CN106920224A (zh) 一种评估拼接图像清晰度的方法
CN108363979A (zh) 基于双通道三维卷积神经网络的新生儿疼痛表情识别方法
CN110503635B (zh) 一种基于异构数据融合网络的手骨x光片骨龄评估方法
CN108875794A (zh) 一种基于迁移学习的图像能见度检测方法
CN109167996A (zh) 一种基于卷积神经网络的无参考立体图像质量评价方法
CN109242825A (zh) 一种基于深度学习技术的钢铁表面缺陷识别方法和装置
CN106600595A (zh) 一种基于人工智能算法的人体特征尺寸自动测量方法
CN107396095A (zh) 一种无参考三维图像质量评价方法
CN108389180A (zh) 一种基于深度学习的织物疵点检测方法
CN106991666A (zh) 一种适用于多尺寸图片信息的病害图像识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20191011

Assignee: Guangdong Mingyang Electric Co.,Ltd.

Assignor: SOUTH CHINA University OF TECHNOLOGY

Contract record no.: X2023980047999

Denomination of invention: A Deep Learning Image Evaluation Method for Video Transmission Quality

Granted publication date: 20210601

License type: Common License

Record date: 20231123

EE01 Entry into force of recordation of patent licensing contract