CN110223292B - 图像评估方法、装置及计算机可读存储介质 - Google Patents

图像评估方法、装置及计算机可读存储介质 Download PDF

Info

Publication number
CN110223292B
CN110223292B CN201910535852.3A CN201910535852A CN110223292B CN 110223292 B CN110223292 B CN 110223292B CN 201910535852 A CN201910535852 A CN 201910535852A CN 110223292 B CN110223292 B CN 110223292B
Authority
CN
China
Prior art keywords
neural network
image
distribution information
network model
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910535852.3A
Other languages
English (en)
Other versions
CN110223292A (zh
Inventor
王辰龙
赵雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Meitu Technology Co Ltd
Original Assignee
Xiamen Meitu Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Meitu Technology Co Ltd filed Critical Xiamen Meitu Technology Co Ltd
Priority to CN201910535852.3A priority Critical patent/CN110223292B/zh
Publication of CN110223292A publication Critical patent/CN110223292A/zh
Application granted granted Critical
Publication of CN110223292B publication Critical patent/CN110223292B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本申请实施例提供一种图像评估方法、装置及计算机可读存储介质,涉及图像处理技术领域。所述图像评估方法包括获取待评估图像;基于预设的图像评估模型对所述待评估图像进行计算,得到所述待评估图像的评分分布信息;根据所述评分分布信息计算得到所述待评估图像对应的图像评估值。本申请能够有效提高图像评估结果的准确性。

Description

图像评估方法、装置及计算机可读存储介质
技术领域
本申请涉及图像处理技术领域,具体而言,涉及一种图像评估方法、装置及计算机可读存储介质。
背景技术
随着手机等智能终端的普及,用户可以随时随地进行图像拍摄,但现有的图像评估方法大多是针对专业级的图像进行图像评估时提出的,无法满足用户随手拍摄的日常图像的评估需求。
发明内容
为改善上述问题之一,本申请实施例提供一种图像评估方法、装置及计算机可读存储介质,内容如下。
一方面,本申请实施例提供一种图像评估方法,包括:
获取待评估图像;
基于预设的图像评估模型对所述待评估图像进行计算,得到所述待评估图像的评分分布信息;
根据所述评分分布信息计算得到所述待评估图像对应的图像评估值。
在本申请实施例的选择中,所述图像评估值
Figure BDA0002101143070000011
通过公式
Figure BDA0002101143070000012
计算得到,其中,
Figure BDA0002101143070000013
为所述评分分布信息,X为评分范围,k为索引值,k=1,2,3,…,N。
在本申请实施例的选择中,所述预设的图像评估模型通过下述步骤训练得到:
获取训练数据集,以及待训练的第一神经网络模型,该待训练的第一神经网络模型包括用于特征提取的卷积网络以及用于对该卷积网络提取的特征进行分类的特征分类网络;
锁定所述卷积网络的网络参数后,将所述训练数据集作为所述第一神经网络模型的输入,并通过所述训练数据集对所述第一神经网络模型中的特征分类网络的网络参数进行训练;
当针对所述第一神经网络模型中的特征分类网络进行训练的训练条件满足第一预设需求时停止对该特征分类网络的训练;
解除对所述卷积网络的网络参数的锁定,并将解除参数锁定且完成特征分类网络训练的第一神经网络模型作为第二神经网络模型;
利用所述训练数据集继续对所述第二神经网络模型进行训练,并将训练后的第二神经网络模型作为所述预设的图像评估模型。
在本申请实施例的选择中,在执行所述锁定所述卷积网络的网络参数后,将所述训练数据集作为所述第一神经网络模型的输入的步骤之前,所述预设的图像评估模型的训练步骤还包括:
获取用于迁移学习的预训练神经网络;
利用迁移学习的方式将所述预训练神经网络的网络参数迁移至所述第一神经网络模型。
在本申请实施例的选择中,所述预设的图像评估模型的训练步骤还包括:
根据所述训练后的第二神经网络模型输出的评分分布信息计算该第二神经网络模型的损失函数值;
判断所述损失函数值是否满足第二预设需求,若所述损失函数值不满足第二预设需求,则基于所述训练后的第二神经网络模型以及所述训练数据集再次执行对所述训练后的第二神经网络模型的模型训练,直到根据训练后的第二神经网络模型输出的评分分布信息计算得到的所述损失函数值满足第二预设需求。
在本申请实施例的选择中,所述根据所述训练后的第二神经网络模型输出的评分分布信息计算该第二神经网络模型的损失函数值的步骤,包括:
获取预设的所述训练数据集中的各图像数据的评分分布信息作为参考分布信息,以及将所述训练后的第二神经网络模型输出的评分分布信息作为待评分分布信息;
计算所述参考分布信息中各分布之间的累加欧式分布作为参考累加欧式分布,以及计算所述待评分分布信息中各分布之间的累加欧式分布作为待评估累加欧式分布;
计算所述参考累加欧式分布与所述待评估累加欧式分布之间的欧式距离,作为累加欧式损失;
计算所述参考分布信息的参考期望值,以及计算所述待评分分布信息的待评估期望值,将所述参考期望值与所述待评估期望值之间的差值作为期望差值损失;
根据所述累加欧式损失以及所述期望差值损失计算损失函数值。
在本申请实施例的选择中,所述损失函数值Loss通过公式Loss=LossC+αLossE计算得到,其中,LossC为所述累加欧式损失,
Figure BDA0002101143070000041
Ck为所述参考累加欧式分布,
Figure BDA0002101143070000042
为所述待评估累加欧式分布,N为所述参考累加欧式分布或所述待评估累加欧式分布中分布的数量,k为索引值,k=1,2,3,…,N,α为预设的权重值,LossE为所述期望差值损失。
在本申请实施例的选择中,所述训练数据集中包括AVA数据集和社区图像数据集。
另一方面,本申请实施例还提供一种图像评估装置,所述图像评估装置包括:
图像获取模块,用于获取待评估图像;
第一评估模块,用于基于预设的图像评估模型对所述待评估图像进行计算,得到所述待评估图像的评分分布信息;
第二评估模块,用于根据所述评分分布信息计算得到所述待评估图像对应的图像评估值。
又一方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机指令,在该计算机指令被调用并运行时可执行上述的图像评估方法。
本申请实施例提供的图像评估方法、装置及计算机可读存储介质中,是通过预设的图像评估模型对待处理图像进行计算并输出对应的评分分布信息后,再基于该评分分布信息计算得到所述待评估图像的图像评估值,能够有效提高图像评估的准确性。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的终端设备的方框结构示意图。
图2为本申请实施例提供的图像评估方法的流程示意图。
图3为图2中所示的步骤S12的子流程示意图。
图4为图2中所示的步骤S12的另一子流程示意图。
图5为本申请实施例提供的图像评估方法的另一流程示意图。
图标:10-终端设备;11-图像评估装置;110-图像获取模块;120-第一评估模块;130-第二评估模块;12-处理器;13-计算机可读存储介质。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
如图1所示,为本申请实施例提供的一种应用图像评估方法和装置的终端设备10的方框结构示意图,该终端设备10可以包括,但不限于图像评估装置11、处理器12和计算机可读存储介质13。
其中,所述处理器12与所述计算机可读存储介质13均位于所述终端设备10中且二者分离设置。然而,应当理解的是,所述计算机可读存储介质13也可以是独立于终端设备10之外,且可以由所述处理器12通过总线接口来访问。可替换地,所述计算机可读存储介质13也可以集成到所述处理器12中,例如,可以是高速缓存和/或通用寄存器。
另外,在本实施例中,所述计算机可读存储介质13可用于存储与所述图像评估装置11对应的计算机指令,该计算机指令被所述处理器12调用并运行时,能够执行本申请实施例中给出的图像评估方法。
可以理解的是,图1所示的终端设备10的结构仅为示意,所述终端设备10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。所述终端设备10可以是,但不限于计算机、手机、IPad、服务器、移动上网设备(MID,mobile Internet device)等。
需要说明的是,下述给出的图像评估方法和装置的应用场景可以是在进行如图像排序、重复图像删除等需要根据图像评估值进行的图像处理场景,也可以是在图像社交过程中需要根据图像评估值向用户推荐高质量或富有美感的图像时的图像处理场景,其中,图像社交是指用户将通过手机等智能终端随时随地拍摄的图像发布至社交网络,以获得其他用户的关注或关注其他用户通过社交网络发布的图像时形成的社交场景,本实施例在此不做限制。
基于前述描述,请结合参阅图2,为本申请实施例提供的图像评估方法的流程示意图,该图像评估方法应用于所述终端设备10。所应说明的是,本申请给出的图像评估方法并不以图2以及以下所述的具体顺序为限制。应当理解,本申请所述的图像评估方法中的部分步骤的顺序可以根据实际需要相互交换,或者其中的部分步骤也可以省略或删除。
步骤S11,获取待评估图像。可选地,所述待评估图像可以为,但不限于用户日常生活中通过手机等智能终端随手拍摄并发送至社交网络上的生活照,如风景图像、人物图像等。另外,所述待评估图像中包括至少一张子图像。
在一种实施方式中,为了进一步提高图像评估结果的准确性,在通过步骤S12中给出的图像评估模型对所述待评估图像进行评估之前,可对所述待评估图像进行预处理,该预处理可以包括归一化处理或/和正则化处理等。其中,所述归一化处理的过程可以包括:对所述待评估图像的尺寸进行调整,如将所述待评估图像放大或缩小到一预设值,如224x224等。
另外,所述正则化处理的过程可以包括对所述待处理图像的像素值进行处理使得其像素值落入[-1,1]这一区间。例如,若所述待评估图像的像素值位于[0~255]中,可先将所述待评估图像的像素值减去127.5,然后再除以127.5,得到正则化处理后的像素值。
步骤S12,基于预设的图像评估模型对所述待评估图像进行计算,得到所述待评估图像的评分分布信息。其中,所述预设的图像评估模型可以是通过对如VGG系列、ResNet系列、Inception系列或MobileNet系列的特征提取网络进行训练得到,但由于不同的特征提取网络的侧重点不同,如特征提取效果好的提取速度较慢,速度较快的在精度上会有一定的损失,因此,可根据实际需求进行特征提取网络的选取并进行训练。例如,若本申请实施例给出的图像评估方法最终是应用于工业生产环境,那么用于图像评估的图像评估模型需要具有较高的图像处理速度,对此,可选用MobileNet系列的特征提取网络进行训练得到所述图像评估模型。
另外,所述评分分布信息可以是,但不限于,对所述待评估图像进行计算得到的概率分布。此外,所述概率分布可以为一个10维的向量,如10个评分分布(1~10分)的概率。
步骤S13,根据所述评分分布信息计算得到所述待评估图像对应的图像评估值。其中,假设所述评分分布信息为对所述待评估图像进行计算得到的概率分布,那么,可通过求取所述评分分布信息中的分布概率与评分分布的联合期望,得到所述待评估图像的图像评估值,如1~10分中的一个值。
本实施例中,所述图像评估值
Figure BDA0002101143070000081
可通过公式
Figure BDA0002101143070000082
计算得到,其中,
Figure BDA0002101143070000083
为所述评分分布信息,X为评分范围,k为索引值,k=1,2,3,…,N。
与现有技术相比,上述步骤S11-步骤S13中给出的图像评估方法,在通过预设的图像评估模型对待处理图像进行计算并得到对应的评分分布信息后,基于该评分分布信息计算得到所述待评估图像的图像评估值,能够有效提高图像评估的准确性。同时,在一些实施方式中,还可根据计算得到的图像评估值进行图像推荐、图像排序或图像重删等,以满足不同应用场景下的图像处理需求。
进一步地,在一些实施方式中,上述步骤S12中所述的预设的图像评估模型的训练方式可以不同,例如,为了使得训练得到的图像评估模型的参数更优,且模型训练时间短、收敛快,本申请可采用如图3中所示步骤S120-步骤S124进行模型训练得到所述图像评估模型,具体如下。
步骤S120,获取训练数据集,以及待训练的第一神经网络模型,该待训练的第一神经网络模型包括用于特征提取的卷积网络以及用于对该卷积网络提取的特征进行分类的特征分类网络。
其中,所述训练数据集中可以包括,但不限于AVA(原子视觉动作,Atomic visualactions)数据集或/和社区图像数据集,其中,所述AVA数据集是一种美学视觉分析数据集,来源于1447个摄影挑战赛,大约包含25w张图像,每张图像约210个个人评分,且分布于1~10分之间,每张图像至多含有2个标签。所述社区图像数据集为用户在日常生活中随手拍摄并上传至社交网络的真实图像。
在一些实现方式中,考虑到AVA数据集的泛化性较低,而一般的图像多数来源于用户的日常随意拍摄,因此,为了避免AVA数据集与用户在日常生活中所拍摄的图像差距较大,导致训练得到的图像评估模型的输出结果与真实结果误差较大的问题,本实施例中在选取所述训练数据集时,可将图像社区中的真实图像作为对所述AVA数据集的补充,使得所述训练数据集更加符合实际需要的待评估图像的样式。
需要说明的是,在利用所述训练数据集对所述第一神经网络模型进行训练之前,可先对所述训练数据集中的图像数据进行预处理,并基于预处理后的训练数据集进行模型训练,以增加数据的多样性,即数据增强(DA,Data Augmentation)。其中,关于所述预处理的详细过程可参照前述步骤S11中的描述,本实施例在此不再赘述。
进一步地,关于所述待训练的第一神经网络模型的选取可参照前述步骤S12中关于图像评估模型的描述,本实施例在此不做限制。另外,以所述第一神经网络模型为CNN网络(卷积神经网络,Convolutional Neural Networks)为例,所述第一神经网络模型中的卷积网络可以由卷积层和池化层堆积而成,主要是通过逐层抽象数据的方式将图像像素逐渐地转换为高级特征。所述第一神经网络模型中的特征分类网络可以由多个全连接层连接而成,主要是将已抽象出的高级特征转换为目标类别。全连接层的神经元与前一层中所有激活的神经元全部连接,最后一个全连接层输出类别。
步骤S121,锁定所述卷积网络的网络参数后,将所述训练数据集作为所述第一神经网络模型的输入,并通过所述训练数据集对所述第一神经网络模型中的特征分类网络的网络参数进行训练。其中,通过对卷积网络的网络参数进行锁定,仅对特征分类网络进行优先训练的方式,能够避免在对特征分类网络进行训练时对卷积网络的网络参数造成干扰的问题,同时还可加快特征分类网络的网络参数收敛。尤其当特征分类网络中的全连接层被重新定义,且网络参数随机分布时,采用前述的模型训练方式的优势更加明显。
步骤S122,当针对所述第一神经网络模型中的特征分类网络进行训练的训练条件满足第一预设需求时停止对该特征分类网络的训练。其中,在判断对所述特征分类网络进行训练的训练条件是否满足第一预设需求时的判断标准可以根据实际进行灵活设定,例如,可以是判断对所述特征分类网络进行训练的训练次数是否达到预设值,如50轮次(epoch)等;又例如,也可以是判断对所述特征分类网络进行训练后的网络参数是否达到预设值等,本实施例在此不做限制。
步骤S123,解除对所述卷积网络的网络参数的锁定,并将解除参数锁定且完成特征分类网络训练的第一神经网络模型作为第二神经网络模型;
步骤S124,利用所述训练数据集继续对所述第二神经网络模型进行训练,并将训练后的第二神经网络模型作为所述预设的图像评估模型。其中,该步骤S124是基于前述步骤S121的训练结果,对所述卷积网络和特征分类网络同时进行训练,如同时训练150个轮次(epoch),并将学习率设置的较低,以提升精度。
相对于现有技术,在上述步骤S120-步骤S124中给出的模型训练过程中,是分为两个阶段实现的模型训练,第一阶段是通过对卷积网络进行参数锁定,仅对特征分类网络进行训练;第二阶段是基于第一阶段的训练结果对所述第一神经网络模型中的卷积网络和特征分类网络同时进行训练,以使得模型所学习到的参数更优,且模型训练的时间更短、收敛更快,精度更高。
在一些实施方式中,为了进一步提高训练后的图像评估模型的性能,在本实施例中,所述图像评估模型的训练过程还可以包括:根据所述训练后的第二神经网络模型输出的评分分布信息计算该第二神经网络模型的损失函数值;判断所述损失函数值是否满足第二预设需求,若所述损失函数值不满足第二预设需求,则基于所述训练后的第二神经网络模型以及所述训练数据集再次执行对所述训练后的第二神经网络模型的模型训练,直到根据训练后的第二神经网络模型输出的评分分布信息计算得到的所述损失函数值满足第二预设需求。其中,所述第二预设需求可以根据实际进行设定,例如,在本实施例中,可通过比较损失函数值的收敛速度是否趋于平稳或者是否收敛至预设值等来判定所述损失函数值是否满足第二预设需求,如,当所述损失函数值的收敛速度趋于平稳时,可判定所述损失函数值满足第二预设需求,本实施例在此不做具体限制。
进一步地,如图4所示,所述损失函数值可以通过图5中所示的步骤S125-步骤S129计算得到,具体如下。
步骤S125,获取预设的所述训练数据集中的各图像数据的评分分布信息作为参考分布信息,以及将所述训练后的第二神经网络模型输出的评分分布信息作为待评分分布信息。
其中,根据所述训练数据集的不同,所述参考分布信息的实际计算过程有所不同,例如,当所述训练数据集来源于用户上传到图像社区的真实图像,可通过人工标注等方法对所述训练数据集中的各图像数据进行标注,在标注过程中,可按照S、A、B、C、D五个等级对所述训练数据集中的各图像数据进行划分得到所述参考分布信息。其中,S、A、B、C、D的排列顺序可用于表示图像质量依次下降,如D为违规图像,如涉黄涉暴等。
另,在一些实现方式中,也可以以1~10分的评分个数作为所述评分分布,即所述特征分类网络的输出可以为10维向量,例如,在社区图像数据集中,根据SABCD以随机正态分布生成1~10分的随机评分分布信息,其中,S以10分为中心,A以7~9分为中心,B以4~6分为中心,C以2~3分为中心,D以1分为中心,即10维向量。
步骤S126,计算所述参考分布信息中各分布之间的累加欧式分布作为参考累加欧式分布(Cumulative Distribution),以及计算所述待评分分布信息中各分布之间的累加欧式分布作为待评估累加欧式分布。
步骤S127,计算所述参考累加欧式分布与所述待评估累加欧式分布之间的欧式距离,作为累加欧式损失。
其中,在步骤S126和步骤S127中,由于数据的分布特性可通过累加欧式分布进行表示,数据的距离特性可使用欧式距离进行表示,因此,本申请中可利用累加欧式损失评估两个数据分布之间的距离。下面对累加欧式分布和累加欧式损失的计算过程进行简要说明。
(1)将所述参考分布信息转换为参考累加欧式分布,该参考累加欧式分布向量中任一位的值可根据公式
Figure BDA0002101143070000131
计算得到,也就是说累加欧式分布向量中任一位的值是当前索引的值和当前索引之前全部值的和。例如,假设参考分布信息[1,2,3,4]的累加分布向量可以是[1,3,6,10],其中,C是累加欧式分布,P是参考分布信息,k是分布的索引值,如累加分布C的第k位,就是参考分布信息P的前k个值的和(包含第k位)。需要说明的是,所述待评估累加欧式分布的计算过程可参照前述内容,本实施例在此不再赘述。
(2)可根据公式
Figure BDA0002101143070000132
计算两个累加分布之间的欧式距离,其中,Ck为所述参考累加欧式分布,
Figure BDA0002101143070000133
为所述待评估累加欧式分布,C和
Figure BDA0002101143070000134
是两个等长度的累加分布,N为所述参考累加欧式分布或所述待评估累加欧式分布中分布的数量,k为索引值,k=1,2,3,…,N。
步骤S128,计算所述参考分布信息的参考期望值,以及计算所述待评分分布信息的待评估期望值,将所述参考期望值与所述待评估期望值之间的差值作为期望差值损失。
其中,由于期望差值损失可用于评估评分的正确性,属于回归问题的常用损失函数,因此,在本实施例中,由于所述评分分布信息是一个概率分布(1~10分之间),那么图像的最终评估值就是分布的期望值。可选地,以所述参考期望值为例,该参考期望值可通过公式
Figure BDA0002101143070000141
计算得到,其中,P为所述评分分布信息,X为评分范围,k为索引值,k=1,2,3,…,N。
另外,所述期望差值损失可通过公式
Figure BDA0002101143070000142
计算得到,E为参考期望值,
Figure BDA0002101143070000143
待评估期望值。
步骤S129,根据所述累加欧式损失以及所述期望差值损失计算损失函数值。其中,所述损失函数值Loss可通过公式Loss=LossC+αLossE计算得到,其中,LossC为所述累加欧式损失,α为预设的权重值,一般可以为0或1,LossE为所述期望差值损失。
相对于现有技术主要以回归问题的损失函数为主,如均方误差等,无法利用多人标注的数据标签,使得损失函数计算过程比较单一,导致模型的学习效果较差的问题,本申请中给出的上述步骤S125-步骤S129中给出的损失函数计算方法中,通过使用累加欧式损失和期望差值损失,既可以评估数据分布,又可以评估最终评分,充分利用了多人标注的数据标签,满足业务需求,提升模型的训练效果。
进一步地,考虑到现有技术中在基于如支持向量机(SVM,Support VectorMachine)等机器学习算法进行模型训练以得到最终的图像评估模型时,该图像评估模型一方面无法有效利用海量大数据的优势,另一方面,在模型训练过程中,一般是以模型的随机参数开始训练,导致算法收敛较慢,精度不足,且算法的训练效果较差。对此,本申请实施例除可通过上述步骤S120-步骤S129来提高模型训练速度,确保模型性能之外,还在执行步骤S121之前,通过如图5所示的步骤S14和步骤S15进一步确保模型性能,提高模型训练速度,具体如下。
步骤S14,获取预训练神经网络。其中,所述预训练模型是在大型基准数据集上训练得到的模型,如ImageNet图像数据集,该ImageNet数据集是一个用于视觉对象识别算法研究的大型可视化数据库,包含超过1400万的人工标注图像。
步骤S15,利用迁移学习的方式将所述预训练神经网络的网络参数迁移至所述第一神经网络模型。其中,在计算机视觉领域中,迁移学习是通过复用已有的神经网络模型中的网络参数,而不是从新开始训练,能够快速且精确的建立模型。因此,考虑到本实施例要解决的技术问题也属于图像相关的技术问题,且本申请中进行模型训练的目的是得到一个用于图像评估的图像评估模型,以理解图像的美学信息,因此,本申请可使用迁移学习的方式进行模型训练,例如,可通过加载MobileNet网络在ImageNet数据集中的预训练模型,复用卷积部分的模型参数,将最后的分类部分重新设计,将输出的类别改为所需预测的维度,生成新的全连接部分,如10个评分值的概率就是10维的输出值。
与现有技术相比,本申请采用迁移学习的方式进行第一神经网络模型的训练,能够充分利用大规模的图像数据,降低模型训练时间,提升模型性能。
进一步地,请再次参阅图1,所述图像评估装置11可以理解为上述终端设备10中的处理器12,也可以理解为独立于上述终端设备10或处理器12之外的在终端设备10控制下实现上述图像评估方法的软件功能模块。可选地,所述图像评估装置11可以包括图像获取模块110、第一评估模块120和第二评估模块130,下面分别对该图像评估装置11的各个功能模块的功能进行详细阐述。
所述图像获取模块110,用于获取待评估图像;本实施例中,关于图像获取模块110的描述具体可参考上述步骤S11的详细描述,也即,步骤S11可以由图像获取模块110执行,因而在此不作更多说明。
所述第一评估模块120,用于基于预设的图像评估模型对所述待评估图像进行计算,得到所述待评估图像的评分分布信息;本实施例中,关于第一评估模块120的描述具体可参考上述步骤S12的详细描述,也即,步骤S12可以由第一评估模块120执行,因而在此不作更多说明。
所述第二评估模块130,用于根据所述评分分布信息计算得到所述待评估图像对应的图像评估值。本实施例中,关于第二评估模块130的描述具体可参考上述步骤S13的详细描述,也即,步骤S13可以由第二评估模块130执行,因而在此不作更多说明。
综上,本申请实施例提供的图像评估方法、装置及计算机可读存储介质13,在通过预设的图像评估模型对待处理图像进行计算并输出对应的评分分布信息后,再基于该评分分布信息计算得到所述待评估图像的图像评估值,能够有效提高图像评估的准确性。
以上所述,仅为本申请的各种实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

Claims (5)

1.一种图像评估方法,其特征在于,包括:
获取待评估图像;
基于预设的图像评估模型对所述待评估图像进行计算,得到所述待评估图像的评分分布信息;
根据所述评分分布信息计算得到所述待评估图像对应的图像评估值;
其中,所述预设的图像评估模型通过下述步骤训练得到:
获取训练数据集,以及待训练的第一神经网络模型,该待训练的第一神经网络模型包括用于特征提取的卷积网络以及用于对所述卷积网络提取的特征进行分类的特征分类网络;
锁定所述卷积网络的网络参数后,将所述训练数据集作为所述第一神经网络模型的输入,并通过所述训练数据集对所述第一神经网络模型中的特征分类网络的网络参数进行训练;
当针对所述第一神经网络模型中的特征分类网络进行训练的训练条件满足第一预设需求时停止对该特征分类网络的训练;
解除对所述卷积网络的网络参数的锁定,并将解除参数锁定且完成特征分类网络训练的第一神经网络模型作为第二神经网络模型;
利用所述训练数据集继续对所述第二神经网络模型进行训练,并根据训练后的第二神经网络模型输出的评分分布信息计算该第二神经网络模型的损失函数值;
判断所述损失函数值是否满足第二预设需求,若所述损失函数值不满足第二预设需求,则基于所述训练后的第二神经网络模型以及所述训练数据集再次执行对所述训练后的第二神经网络模型的模型训练,直到根据训练后的第二神经网络模型输出的评分分布信息计算得到的所述损失函数值满足第二预设需求;
将训练后的第二神经网络模型作为所述预设的图像评估模型;
其中,所述根据所述训练后的第二神经网络模型输出的评分分布信息计算该第二神经网络模型的损失函数值的步骤,包括:
获取预设的所述训练数据集中的各图像数据的评分分布信息作为参考分布信息,以及将所述训练后的第二神经网络模型输出的评分分布信息作为待评分分布信息;
计算所述参考分布信息中各分布之间的累加欧式分布作为参考累加欧式分布,以及计算所述待评分分布信息中各分布之间的累加欧式分布作为待评估累加欧式分布;
计算所述参考累加欧式分布与所述待评估累加欧式分布之间的欧式距离,作为累加欧式损失;
计算所述参考分布信息的参考期望值,以及计算所述待评分分布信息的待评估期望值,将所述参考期望值与所述待评估期望值之间的差值作为期望差值损失;
根据所述累加欧式损失以及所述期望差值损失计算损失函数值;
所述图像评估值
Figure FDA0003270645070000031
通过公式
Figure FDA0003270645070000032
计算得到,其中,
Figure FDA0003270645070000033
为所述评分分布信息,X为评分范围,k为索引值,k=1,2,3,...,N;
所述参考分布信息为对所述训练数据集中的各图像数据进行等级划分并标注后获得;
所述损失函数值Loss通过公式Loss=LossC+αLossE计算得到,其中,LossC为所述累加欧式损失,
Figure FDA0003270645070000034
Ck为所述参考累加欧式分布,
Figure FDA0003270645070000035
为所述待评估累加欧式分布,N为所述参考累加欧式分布或所述待评估累加欧式分布中分布的数量,k为索引值,k=1,2,3,…,N,α为预设的权重值,LossE为所述期望差值损失。
2.根据权利要求1所述的图像评估方法,其特征在于,在执行所述锁定所述卷积网络的网络参数后,将所述训练数据集作为所述第一神经网络模型的输入的步骤之前,所述预设的图像评估模型的训练步骤还包括:
获取预训练神经网络;
利用迁移学习的方式将所述预训练神经网络的网络参数迁移至所述第一神经网络模型。
3.根据权利要求1所述的图像评估方法,其特征在于,所述训练数据集中包括AVA数据集和社区图像数据集。
4.一种图像评估装置,其特征在于,所述图像评估装置包括:
图像获取模块,用于获取待评估图像;
第一评估模块,用于基于预设的图像评估模型对所述待评估图像进行计算,得到所述待评估图像的评分分布信息;
第二评估模块,用于根据所述评分分布信息计算得到所述待评估图像对应的图像评估值;
其中,所述预设的图像评估模型由所述图像评估装置通过下述方式训练得到:
获取训练数据集,以及待训练的第一神经网络模型,该待训练的第一神经网络模型包括用于特征提取的卷积网络以及用于对所述卷积网络提取的特征进行分类的特征分类网络;
锁定所述卷积网络的网络参数后,将所述训练数据集作为所述第一神经网络模型的输入,并通过所述训练数据集对所述第一神经网络模型中的特征分类网络的网络参数进行训练;
当针对所述第一神经网络模型中的特征分类网络进行训练的训练条件满足第一预设需求时停止对该特征分类网络的训练;
解除对所述卷积网络的网络参数的锁定,并将解除参数锁定且完成特征分类网络训练的第一神经网络模型作为第二神经网络模型;
利用所述训练数据集继续对所述第二神经网络模型进行训练,并根据训练后的第二神经网络模型输出的评分分布信息计算该第二神经网络模型的损失函数值;
判断所述损失函数值是否满足第二预设需求,若所述损失函数值不满足第二预设需求,则基于所述训练后的第二神经网络模型以及所述训练数据集再次执行对所述训练后的第二神经网络模型的模型训练,直到根据训练后的第二神经网络模型输出的评分分布信息计算得到的所述损失函数值满足第二预设需求;
将训练后的第二神经网络模型作为所述预设的图像评估模型;
其中,所述图像评估装置根据所述训练后的第二神经网络模型输出的评分分布信息计算该第二神经网络模型的损失函数值的方式,包括:
获取预设的所述训练数据集中的各图像数据的评分分布信息作为参考分布信息,以及将所述训练后的第二神经网络模型输出的评分分布信息作为待评分分布信息;
计算所述参考分布信息中各分布之间的累加欧式分布作为参考累加欧式分布,以及计算所述待评分分布信息中各分布之间的累加欧式分布作为待评估累加欧式分布;
计算所述参考累加欧式分布与所述待评估累加欧式分布之间的欧式距离,作为累加欧式损失;
计算所述参考分布信息的参考期望值,以及计算所述待评分分布信息的待评估期望值,将所述参考期望值与所述待评估期望值之间的差值作为期望差值损失;
根据所述累加欧式损失以及所述期望差值损失计算损失函数值;
所述图像评估值
Figure FDA0003270645070000061
通过公式
Figure FDA0003270645070000062
计算得到,其中,
Figure FDA0003270645070000063
为所述评分分布信息,X为评分范围,k为索引值,k=1,2,3,...,N;
所述参考分布信息为对所述训练数据集中的各图像数据进行等级划分并标注后获得;
所述损失函数值Loss通过公式Loss=LossC+αLossE计算得到,其中,LossC为所述累加欧式损失,
Figure FDA0003270645070000064
Ck为所述参考累加欧式分布,
Figure FDA0003270645070000065
为所述待评估累加欧式分布,N为所述参考累加欧式分布或所述待评估累加欧式分布中分布的数量,k为索引值,k=1,2,3,,N,α为预设的权重值,LossE为所述期望差值损失。
5.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机指令,在该计算机指令被调用并运行时可执行上述权利要求1-3中任一项所述的图像评估方法。
CN201910535852.3A 2019-06-20 2019-06-20 图像评估方法、装置及计算机可读存储介质 Active CN110223292B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910535852.3A CN110223292B (zh) 2019-06-20 2019-06-20 图像评估方法、装置及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910535852.3A CN110223292B (zh) 2019-06-20 2019-06-20 图像评估方法、装置及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN110223292A CN110223292A (zh) 2019-09-10
CN110223292B true CN110223292B (zh) 2022-01-25

Family

ID=67814341

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910535852.3A Active CN110223292B (zh) 2019-06-20 2019-06-20 图像评估方法、装置及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110223292B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110908754A (zh) * 2019-11-06 2020-03-24 维沃移动通信有限公司 一种图像显示方法及电子设备
WO2021092808A1 (zh) * 2019-11-13 2021-05-20 深圳市欢太科技有限公司 网络模型的训练方法、图像的处理方法、装置及电子设备
CN113066038B (zh) * 2019-12-13 2024-07-26 阿里巴巴集团控股有限公司 图像评估方法、装置、电子设备及计算机存储介质
CN111199540A (zh) * 2019-12-27 2020-05-26 Oppo广东移动通信有限公司 图像质量评价方法、装置、电子设备及存储介质
CN111476482A (zh) * 2020-04-03 2020-07-31 北京弘远博学科技有限公司 基于人物画像的个性化推荐方法
CN113627419B (zh) * 2020-05-08 2024-07-16 百度在线网络技术(北京)有限公司 兴趣区域评估方法、装置、设备和介质
CN111741330B (zh) * 2020-07-17 2024-01-30 腾讯科技(深圳)有限公司 一种视频内容评估方法、装置、存储介质及计算机设备
CN112614110B (zh) * 2020-12-24 2022-11-04 Oppo(重庆)智能科技有限公司 评估图像质量的方法、装置及终端设备
CN112839167B (zh) * 2020-12-30 2023-06-30 Oppo(重庆)智能科技有限公司 图像处理方法、装置、电子设备及计算机可读介质
CN112733970B (zh) * 2021-03-31 2021-06-18 腾讯科技(深圳)有限公司 图像分类模型处理方法、图像分类方法及装置
CN113259595B (zh) * 2021-06-25 2021-10-08 煤炭科学研究总院 图像采集方法、装置以及存储介质
CN113850785A (zh) * 2021-09-27 2021-12-28 展讯通信(上海)有限公司 图像质量模型的生成、评估方法与系统及其设备与介质
CN117455903B (zh) * 2023-12-18 2024-08-20 深圳市焕想科技有限公司 一种基于图像处理技术的体育器械状态评估方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109215028A (zh) * 2018-11-06 2019-01-15 福州大学 一种基于卷积神经网络的多目标优化图像质量评估方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105184367B (zh) * 2014-06-09 2018-08-14 讯飞智元信息科技有限公司 深度神经网络的模型参数训练方法及系统
CN107644254A (zh) * 2017-09-09 2018-01-30 复旦大学 一种卷积神经网络权重参数量化训练方法及系统
CN109801256B (zh) * 2018-12-15 2023-05-26 华南理工大学 一种基于感兴趣区域和全局特征的图像美学质量评估方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109215028A (zh) * 2018-11-06 2019-01-15 福州大学 一种基于卷积神经网络的多目标优化图像质量评估方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
A deep architecture for unified aesthetic prediction;Naila Murray et al.;《arXiv》;20170816;第1-10页 *
NIMA: Neural Image Assessment;Hossein Talebi et al.;《IEEE TRANSACTIONS ON IMAGE PROCESSING》;20180430;第3998-4011页 *
UNNA: A Unified Neural Network for Aesthetic Assessment;Larbi Abdenebaoui et al.;《2018 International Conference on Content-Based Multimedia Indexing》;20181101;第1-6页 *

Also Published As

Publication number Publication date
CN110223292A (zh) 2019-09-10

Similar Documents

Publication Publication Date Title
CN110223292B (zh) 图像评估方法、装置及计算机可读存储介质
CN110866140B (zh) 图像特征提取模型训练方法、图像搜索方法及计算机设备
CN111325155B (zh) 基于残差式3d cnn和多模态特征融合策略的视频动作识别方法
US20210042580A1 (en) Model training method and apparatus for image recognition, network device, and storage medium
CN108491765B (zh) 一种蔬菜图像的分类识别方法及系统
Tahir et al. An open-ended continual learning for food recognition using class incremental extreme learning machines
EP3084682B1 (en) System and method for identifying faces in unconstrained media
CN109002755B (zh) 基于人脸图像的年龄估计模型构建方法及估计方法
CN109948692B (zh) 基于多颜色空间卷积神经网络及随机森林的计算机生成图片检测方法
CN106503661B (zh) 基于烟花深度信念网络的人脸性别识别方法
CN112614110B (zh) 评估图像质量的方法、装置及终端设备
CN110503149B (zh) 一种图像中局部特征分类方法及系统
JP6107531B2 (ja) 特徴抽出プログラム及び情報処理装置
CN111523483A (zh) 中餐菜品图像识别方法及装置
Wang et al. Efficient yolo: A lightweight model for embedded deep learning object detection
CN104346630A (zh) 一种异构特征融合的云花卉识别方法
CN111694977A (zh) 一种基于数据增强的车辆图像检索方法
CN114882234A (zh) 多尺度轻量级密集连目标检测网络的构建方法
CN115187456A (zh) 基于图像强化处理的文本识别方法、装置、设备及介质
CN117994623A (zh) 一种图像特征向量的获取方法
CN108764233B (zh) 一种基于连续卷积激活的场景字符识别方法
CN114299304A (zh) 一种图像处理方法及相关设备
CN114492634A (zh) 一种细粒度装备图片分类识别方法及系统
CN112016592B (zh) 基于交叉领域类别感知的领域适应语义分割方法及装置
CN117095217A (zh) 多阶段对比知识蒸馏方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant