CN112560903A - 图像美学信息的确定方法、装置、设备及存储介质 - Google Patents
图像美学信息的确定方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN112560903A CN112560903A CN202011385666.5A CN202011385666A CN112560903A CN 112560903 A CN112560903 A CN 112560903A CN 202011385666 A CN202011385666 A CN 202011385666A CN 112560903 A CN112560903 A CN 112560903A
- Authority
- CN
- China
- Prior art keywords
- image
- aesthetic information
- aesthetic
- determination model
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Educational Administration (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Evolutionary Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Multimedia (AREA)
- Game Theory and Decision Science (AREA)
- Probability & Statistics with Applications (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种图像美学信息的确定方法、装置、设备及存储介质,属于计算机视觉技术领域。方法包括:获取待确定美学信息的目标图像以及目标美学信息确定模型,目标美学信息确定模型基于损失函数、训练样本和验证样本训练得到,损失函数用于通过训练样本训练第一图像美学信息确定模型,得到初始图像美学信息确定模型,验证样本用于更新初始图像美学信息确定模型,得到目标图像美学信息确定模型;调用目标图像美学信息确定模型对目标图像进行处理,得到目标图像的美学信息分布;基于目标图像的美学信息分布,确定目标图像的美学信息。该方法可以提高确定图像美学信息的效率,使得图像美学信息的确定过程更加智能化,更加自动化。
Description
技术领域
本申请实施例涉及计算机视觉技术领域,特别涉及一种图像美学信息的确定方法、装置、设备及存储介质。
背景技术
在计算机视觉技术领域中,通过计算机模拟人类的视觉系统和审美感知,实现对图像美感的自动判别,如判断图像高美感、低美感的分类,或者给出图像的美学信息,或者给出图像的美学信息分布,从而得到图像的美学信息。
相关技术中,基于人工标注的方式确定图像的美学信息,也即是将待处理的目标图像展示给目标用户,基于目标用户自身的审美要求,对目标图像进行打分,将目标用户的打分作为目标图像的美学信息,从而获取到目标图像的美学信息。
然而,当需要确定美学信息的图像的数量较多时,需要依次对图像进行打分,需要花费大量的时间,导致图像美学信息的确定效率较低。而且,人工标注的方式智能程度较低,从而导致图像美学信息的确定过程不够智能,不够自动化。
发明内容
本申请实施例提供了一种图像美学信息的确定方法、装置、设备及存储介质,可用于解决相关技术中的问题。所述技术方案如下:
一方面,本申请实施例提供了一种图像美学信息的确定方法,所述方法包括:
获取待确定美学信息的目标图像以及目标美学信息确定模型,所述目标美学信息确定模型基于损失函数、训练样本和验证样本训练得到,所述损失函数用于通过所述训练样本训练第一图像美学信息确定模型,得到初始图像美学信息确定模型,所述验证样本用于更新所述初始图像美学信息确定模型,得到所述目标图像美学信息确定模型;
调用所述目标图像美学信息确定模型对所述目标图像进行处理,得到所述目标图像的美学信息分布;
基于所述目标图像的美学信息分布,确定所述目标图像的美学信息。
在一种可能的实现方式中,所述获取待确定美学信息的目标图像以及目标美学信息确定模型之前,所述方法还包括:
获取所述训练样本,所述训练样本包括多个第一图像以及各个第一图像的参考美学信息分布;
基于所述多个第一图像以及各个第一图像的参考美学信息分布,训练所述第一图像美学信息确定模型,得到所述初始图像美学信息确定模型;
获取所述验证样本,所述验证样本包括多个第二图像,所述验证样本用于更新所述初始图像美学信息确定模型;
基于所述多个第二图像,对所述初始图像美学信息确定模型进行更新,得到所述目标图像美学信息确定模型。
在一种可能的实现方式中,所述基于所述多个第一图像以及各个第一图像的参考美学信息分布,训练所述第一图像美学信息确定模型,得到所述初始图像美学信息确定模型,包括:
调用所述第一图像美学信息确定模型,基于所述多个第一图像以及各个第一图像的参考美学信息分布,得到所述各个第一图像的预测美学信息分布;
根据所述各个第一图像的参考美学信息分布、所述各个第一图像的预测美学信息分布以及所述损失函数,确定所述各个第一图像的损失值;
基于所述各个第一图像的损失值,训练所述第一图像美学信息确定模型,得到所述初始图像美学信息确定模型。
在一种可能的实现方式中,所述基于所述多个第二图像,对所述初始图像美学信息确定模型进行更新,得到所述目标图像美学信息确定模型,包括:
调用所述初始图像美学信息确定模型,基于所述多个第二图像,得到各个第二图像的第一美学信息分布;
获取所述各个第二图像的美学质量标签,所述美学质量标签为人为标注的美学信息;
基于所述各个第二图像的第一美学信息分布和所述各个第二图像的美学质量标签,确定所述各个第二图像的第二美学信息分布;
基于所述各个第二图像的第二美学信息分布以及所述各个第二图像,更新所述初始图像美学信息确定模型,得到所述目标图像美学信息确定模型。
在一种可能的实现方式中,所述根据所述各个第一图像的参考美学信息分布、所述各个第一图像的预测美学信息分布以及所述损失函数,确定所述各个第一图像的损失值,包括:
获取累积分布函数;
基于所述各个第一图像的参考美学信息分布和所述累积分布函数,确定所述各个第一图像的第一函数值;
基于所述各个第一图像的预测美学信息分布和所述累积分布函数,确定所述各个第一图像的第二函数值;
按照所述损失函数,计算所述各个第一图像的第一函数值和所述各个第一图像的第二函数值之间的损失值,得到所述各个第一图像的损失值。
在一种可能的实现方式中,所述基于所述各个第二图像的第一美学信息分布和所述各个第二图像的美学质量标签,确定所述各个第二图像的第二美学信息分布,包括:
基于所述各个第二图像的第一美学信息分布,确定所述各个第二图像的预测美学信息和方差;
基于所述各个第二图像的预测美学信息和所述各个第二图像的美学质量标签,确定所述各个第二图像的参考美学信息;
根据所述各个第二图像的参考美学信息、所述各个第二图像的方差以及正态分布函数,确定所述各个第二图像的第二美学信息分布。
在一种可能的实现方式中,所述基于所述目标图像的美学信息分布,确定所述目标图像的美学信息,包括:
基于所述目标图像的美学信息分布,按照下述公式确定所述目标图像的美学信息S:
S=P1*X1+P2*X2+…+Pi*Xi
其中,所述X1为第一数值,所述X2为第二数值,所述Xi为第i数值,所述P1为所述目标图像的美学信息为所述第一数值的概率,所述P2为所述目标图像的美学信息为所述第二数值的概率,所述Pi为所述目标图像的美学信息为所述第i数值的概率。
另一方面,本申请实施例提供了一种图像美学信息的确定装置,所述装置包括:
获取模块,用于获取待确定美学信息的目标图像以及目标美学信息确定模型,所述目标美学信息确定模型基于损失函数、训练样本和验证样本训练得到,所述损失函数用于通过所述训练样本训练第一图像美学信息确定模型,得到初始图像美学信息确定模型,所述验证样本用于更新所述初始图像美学信息确定模型,得到所述目标图像美学信息确定模型;
处理模块,用于调用所述目标图像美学信息确定模型对所述目标图像进行处理,得到所述目标图像的美学信息分布;
确定模块,用于基于所述目标图像的美学信息分布,确定所述目标图像的美学信息。
在一种可能的实现方式中,所述获取模块,还用于获取所述训练样本,所述训练样本包括多个第一图像以及各个第一图像的参考美学信息分布;
所述装置还包括:
训练模块,用于基于所述多个第一图像以及各个第一图像的参考美学信息分布,训练所述第一图像美学信息确定模型,得到所述初始图像美学信息确定模型;
所述获取模块,还用于获取所述验证样本,所述验证样本包括多个第二图像,所述验证样本用于更新所述初始图像美学信息确定模型;
所述装置还包括:
更新模块,用于基于所述多个第二图像,对所述初始图像美学信息确定模型进行更新,得到所述目标图像美学信息确定模型。
在一种可能的实现方式中,所述训练模块,用于调用所述第一图像美学信息确定模型,基于所述多个第一图像以及各个第一图像的参考美学信息分布,得到所述各个第一图像的预测美学信息分布;
根据所述各个第一图像的参考美学信息分布、所述各个第一图像的预测美学信息分布以及所述损失函数,确定所述各个第一图像的损失值;
基于所述各个第一图像的损失值,训练所述第一图像美学信息确定模型,得到所述初始图像美学信息确定模型。
在一种可能的实现方式中,所述更新模块,用于调用所述初始图像美学信息确定模型,基于所述多个第二图像,得到各个第二图像的第一美学信息分布;
获取所述各个第二图像的美学质量标签,所述美学质量标签为人为标注的美学信息;
基于所述各个第二图像的第一美学信息分布和所述各个第二图像的美学质量标签,确定所述各个第二图像的第二美学信息分布;
基于所述各个第二图像的第二美学信息分布以及所述各个第二图像,更新所述初始图像美学信息确定模型,得到所述目标图像美学信息确定模型。
在一种可能的实现方式中,所述训练模块,用于获取累积分布函数;
基于所述各个第一图像的参考美学信息分布和所述累积分布函数,确定所述各个第一图像的第一函数值;
基于所述各个第一图像的预测美学信息分布和所述累积分布函数,确定所述各个第一图像的第二函数值;
按照所述损失函数,计算所述各个第一图像的第一函数值和所述各个第一图像的第二函数值之间的损失值,得到所述各个第一图像的损失值。
在一种可能的实现方式中,所述更新模块,用于基于所述各个第二图像的第一美学信息分布,确定所述各个第二图像的预测美学信息和方差;
基于所述各个第二图像的预测美学信息和所述各个第二图像的美学质量标签,确定所述各个第二图像的参考美学信息;
根据所述各个第二图像的参考美学信息、所述各个第二图像的方差以及正态分布函数,确定所述各个第二图像的第二美学信息分布。
在一种可能的实现方式中,所述确定模块,用于基于所述目标图像的美学信息分布,按照下述公式确定所述目标图像的美学信息S:
S=P1*X1+P2*X2+…+Pi*Xi
其中,所述X1为第一数值,所述X2为第二数值,所述Xi为第i数值,所述P1为所述目标图像的美学信息为所述第一数值的概率,所述P2为所述目标图像的美学信息为所述第二数值的概率,所述Pi为所述目标图像的美学信息为所述第i数值的概率。
另一方面,本申请实施例提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条程序代码,所述至少一条程序代码由所述处理器加载并执行,以实现上述任一所述的图像美学信息的确定方法。
另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行,以实现上述任一所述的图像美学信息的确定方法。
另一方面,还提供了一种计算机程序或计算机程序产品,所述计算机程序或计算机程序产品中存储有至少一条计算机指令,所述至少一条计算机指令由处理器加载并执行,以实现上述任一所述的图像美学信息的确定方法。
本申请实施例提供的技术方案至少带来如下有益效果:
本申请实施例提供的技术方案采用模型的方式确定目标图像美学信息,这种方式无需人工对每一个待确定美学信息的图像进行打分,可以提高确定图像美学信息的效率,使得图像美学信息的确定过程更加智能化,更加自动化。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种图像美学信息的确定方法的实施环境示意图;
图2是本申请实施例提供的一种图像美学信息的确定方法的流程图;
图3是本申请实施例提供的一种获取目标图像美学信息确定模型的流程图;
图4是本申请实施例提供的一种第一图像美学信息确定模型的训练过程的示意图;
图5是本申请实施例提供的一种初始图像美学信息确定模型的更新过程的示意图;
图6是本申请实施例提供的一种图像美学信息的确定装置的结构示意图;
图7是本申请实施例提供的一种电子设备的结构示意图;
图8是本申请实施例提供的一种服务器的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
图1是本申请实施例提供的一种图像美学信息的确定方法的实施环境示意图,如图1所示,该实施环境包括:电子设备101。
电子设备101可以是智能手机、游戏主机、台式计算机、平板电脑、电子书阅读器、MP3(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)播放器、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器和膝上型便携计算机中的至少一种。电子设备101用于执行本申请实施例提供的图像美学信息的确定方法。
电子设备101可以泛指多个电子设备中的一个,本实施例仅以电子设备101来举例说明。本领域技术人员可以知晓,上述电子设备101的数量可以更多或更少。比如上述电子设备101可以仅为一个,或者上述电子设备101为几十个或几百个,或者更多数量,本申请实施例对电子设备的数量和设备类型不加以限定。
当然,该方法还可应用在服务器中,服务器为一台服务器,或者为多台服务器组成的服务器集群,或者为云计算平台和虚拟化中心中的至少一种,本申请实施例对服务器的类型不加以限定。该方法在服务器中的运行过程与在电子设备中的运行过程一致,本申请实施例仅以该方法运行在电子设备中为例进行说明,并不用来限制该方法的实施环境。
基于上述实施环境,本申请实施例提供了一种图像美学信息的确定方法,以图2所示的本申请实施例提供的一种图像美学信息的确定方法的流程图为例,该方法可由图1中的电子设备101执行。如图2所示,该方法包括下述步骤:
在步骤201中,获取待确定美学信息的目标图像以及目标美学信息确定模型。
在一种可能的实现方式中,待确定美学信息的目标图像为任意类型的图像,本申请实施例对目标图像的图像类型不加以限定。获取待确定美学信息的目标图像的方式也是多种多样的,例如,将用户在图片库中选中的任意一张图像确定为待确定美学信息的目标图像;又例如,将用户上传的任意一张图像确定为待确定美学信息的目标图像,本申请实施例对该目标图像的获取方式也不加以限定。
在一种可能的实现方式中,电子设备中存储有训练好的目标图像美学信息确定模型,电子设备直接调用该目标图像美学信息确定模型,也即是电子设备获取到目标图像美学信息确定模型。或者,电子设备中存储有第一图像美学信息确定模型,电子设备通过对该第一图像美学信息确定模型进行训练得到目标图像美学信息确定模型,也即是电子设备获取到该目标图像美学信息确定模型。其中,对第一图像美学信息确定模型进行训练的过程在图3所示的实施例中进行介绍,在此不再赘述。
在步骤202中,调用目标图像美学信息确定模型对目标图像进行处理,得到目标图像的美学信息分布。
在一种可能的实现方式中,调用目标图像美学信息确定模型对目标图像进行处理,得到目标图像的美学信息分布的过程为:将目标图像输入目标图像美学信息确定模型,由目标图像美学信息确定模型对目标图像进行处理,得到目标图像的图像特征,再由目标图像美学信息确定模型进行目标图像的图像特征,确定目标图像的美学信息分布,也即是基于目标图像美学信息确定模型的输出结果,得到目标图像的美学信息分布。
其中,目标图像的图像特征包括但不限于目标图像的RGB(RED GREEN BLUE,红绿蓝)特征,当然该图像特征还可以是其他特征,本申请实施例对此不加以限定。
需要说明的是,美学信息分布为目标图像的美学信息为1-10分中任一个分值的概率,1-10分中每一个分值的概率相加为1,或者不为1,本申请实施例对此不加以限定。
示例性地,将目标图像输入目标图像美学信息确定模型,基于目标图像美学信息确定模型对目标图像的处理过程,得到目标图像的美学信息分布为:[1,0%]、[2,10%]、[3,5%]、[4,20%]、[5,15%]、[6,10%]、[7,10%]、[8,10%]、[9,10%]、[10,10%],其中,[1,0%]表示第二图像的美学信息为1分的概率为0%,[2,10%]表示第二图像的美学信息为2分的概率为10%,[3,5%]表示第二图像的美学信息为3分的概率为5%,[4,20%]表示第二图像的美学信息为4分的概率为20%,[5,15%]表示第二图像的美学信息为5分的概率为15%,[6,10%]表示第二图像的美学信息为6分的概率为10%,[7,10%]表示第二图像的美学信息为7分的概率为10%,[8,10%]表示第二图像的美学信息为8分的概率为10%,[9,10%]表示第二图像的美学信息为9分的概率为10%,[10,10%]表示第二图像的美学信息为10分的概率为10%。
在步骤203中,基于目标图像的美学信息分布,确定目标图像的美学信息。
在一种可能的实现方式中,基于目标图像的美学信息分布,按照下述公式(1)确定目标图像的美学信息S。
S=P1*X1+P2*X2+…+Pi*Xi (1)
上述公式(1)中,X1为第一数值,例如1,X2为第二数值,例如2,Xi为第十数值,例如10,P1为第二图像的美学信息为第一数值的概率,P2为第二图像的美学信息为第二数值的概率,Pi为第二图像的美学信息为第i数值的概率。
需要说明的是,由于本申请实施例中使用的目标图像美学信息确定模型包括十分类器,因此上述公式(1)中的i的取值为10。当然,当该第一图像美学信息确定模型中包括的分类器为其他数值的分类器时,上述公式(1)中的i的数值随分类器的数值的变化而变化。
示例性地,基于上述步骤202确定的目标图像的美学信息分布以及上述公式(1),确定目标图像的美学信息为S=1*0%+2*10%+3*5%+4*20%+5*15%+6*10%+7*10%+8*10%+9*10%+10*10%=5.9,也即是目标图像的美学信息为5.9分。
上述方法采用模型的方式确定目标图像美学信息,这种方式无需人工对每一个待确定美学信息的图像进行打分,可以提高确定图像美学信息的效率,使得图像美学信息的确定过程更加智能化,更加自动化。
这里是对第一图像美学信息确定模型进行训练,得到目标图像美学信息确定模型的过程,如图3所示,该过程包括下述步骤301至步骤304。
步骤301、获取训练样本,训练样本包括多个第一图像以及各个第一图像的参考美学信息分布。
其中,训练样本为已知图像美学信息分布的样本数据集,示例性地,训练样本为AVA(Aesthetic Visual Analysis,审美视觉分析)数据集,AVA数据集的图像量十分丰富,图像类型也十分丰富,AVA数据集包括25万多张图像,AVA数据集中的每一张图像都由人工进行美学信息的标注,也即是由人工基于自身主观美感对图像的美感进行评分,得到每张图像的图像美学信息分布,美学信息分布为图像为1-10分的分布概率。当然,该训练样本还可以为其他类型的数据集,本申请实施例仅以AVA数据集为例进行说明,并不对此进行限定。
步骤302、基于多个第一图像以及各个第一图像的参考美学信息分布,训练第一图像美学信息确定模型,得到初始图像美学信息确定模型。
在一种可能的实现方式中,基于多个第一图像以及各个第一图像的参考美学信息分布,训练第一图像美学信息确定模型,得到初始图像美学信息确定模型的过程如下:调用第一图像美学信息确定模型,基于多个第一图像以及各个第一图像的参考美学信息分布,得到各个第一图像的预测美学信息分布;根据各个第一图像的参考美学信息分布、各个第一图像的预测美学信息分布以及损失函数,确定各个第一图像的损失值,基于各个第一图像的损失值,训练第一图像美学信息确定模型,得到初始图像美学信息确定模型。
也即是,将多个第一图像以及各个第一图像的参考美学信息分布分别输入第一图像美学信息确定模型,基于第一图像美学信息确定模型对各个第一图像的处理过程,得到各个第一图像的图像特征,再由第一图像美学信息确定模型基于各个第一图像的图像特征进行处理,得到各个第一图像的预测美学信息分布。也即是根据第一图像美学信息确定模型的输出结果,得到各个第一图像的预测美学信息分布。获取累积分布函数,根据各个第一图像的参考美学信息分布和累积分布函数,确定各个第一图像的第一函数值,根据各个第一图像的预测美学信息分布以及累积分布函数,确定各个第一图像的第二函数值;根据各个第一图像的第一函数值、各个第一图像的第二函数值和损失函数,计算各个第一图像的第一函数值和各个第一图像的第二函数值之间的损失值,得到各个第一图像的损失值。
其中,累积分布函数为CDF(CumulativeDistributionFunction,分布函数),损失函数为搬土损失函数(Earth Mover's Dis tance-based Loss,EMD loss),按照下述公式(2)计算第一图像的第一函数值和第一图像的第二函数值之间的损失值。
上述公式(2)中,P为第一图像的第一函数值,P^为第一图像的第二函数值,CDF为累积分布函数,N的取值为10,K的取值范围为[1,N],r的取值为2。
需要说明的是,第一图像的预测美学信息分布包括第一图像为1-10分中的每一个分值的概率。第一图像美学信息确定模型中包括十分类的分类器,十分类的分类器用于确定第一图像为1-10分中每一个分值的概率。第一图像美学信息确定模型为任意类型的神经网络模型,本申请实施例对此不加以限定。示例性地,第一图像美学信息确定模型为卷积(Lenet)神经网络模型,或者为视觉几何网络模型(Visual Geometry Group,VGG)。
如图4所示为本申请实施例提供的一种第一图像美学信息确定模型的训练过程的示意图,在该图4中将第一图像和第一图像的参考美学信息分布输入第一图像美学信息确定模型,得到第一图像的预测美学信息分布,基于第一图像的参考美学信息分布和第一图像的预测美学信息分布,计算第一图像的损失值,基于第一图像的损失值训练第一图像美学信息确定模型,得到初始图像美学信息确定模型。
步骤303、获取验证样本,验证样本包括多个第二图像,验证样本用于更新初始图像美学信息确定模型。
在一种可能的实现方式中,验证样本为需要确定美学信息的图像,验证样本用于对初始图像美学信息确定模型进行更新,得到目标图像美学信息确定模型。验证样本中包括的第二图像可以是任意类型的图像,本申请实施例对此不加以限定,而且第二图像的获取方式也可以是任意方式,本申请实施例对此也不加以限定。
步骤304、基于多个第一图像,对初始图像美学信息确定模型进行更新,得到目标图像美学信息确定模型。
在一种可能的实现方式中,获取到初始图像美学信息确定模型之后,调用初始图像美学信息确定模型,确定验证样本中多个第二图像的第一美学信息分布,也即是将多个第二样本分别输入初始图像美学信息确定模型,基于初始图像美学信息确定模型的输出结果,得到各个第二图像的第一美学信息分布。获取各个第二图像的美学质量标签,美学质量标签为人为标注的美学信息,美学质量标签包括高、中、低三档,高、中、低档分别对应不同的分值范围,示例性地,高档对应的分值范围为8-10分,中档对应的分值范围为4-7分,低档对应的分值范围为1-3分。当然,高、中、低档对应的分值范围该可以是其它,本申请实施例对此不加以限定。根据各个第二图像的第一美学信息分布和各个第二图像的美学质量标签,确定各个第二图像的第二美学信息分布;基于各个第二图像以及各个第二图像的第二美学信息分布,更新初始图像美学信息确定模型,得到目标图像美学信息确定模型。
在一种可能的实现方式中,根据各个第二图像的第一美学信息分布和各个第二图像的美学质量标签,确定各个第二图像的第二美学信息分布的过程如下:基于各个第二图像的第一美学信息分布,确定各个第二图像的预测美学信息和方差;根据各个第二图像的预测美学信息和各个第二图像的美学质量标签,确定各个第二图像的参考美学信息;根据各个第二图像的参考美学信息各个第二图像的方差,以及正态分布函数,确定各个第二图像的第二美学信息分布。
其中,基于各个第二图像的第一美学信息分布,按照上述公式(1)确定各个第二图像的预测美学信息。
需要说明的是,根据各个第二图像的预测美学信息和各个第二图像的美学质量标签,确定各个第二图像的参考美学信息时,当第二图像的预测美学信息不属于第二图像的美学质量标签对应的分值范围时,基于第二图像的美学质量标签对应的分值范围,确定第二图像的参考美学信息。示例性地,将美学质量标签对应的分值范围的平均数或者中位数确定为第二图像的参考美学信息。
示例性地,将第二图像输入初始美学信息确定模型,得到第二图像的第一美学信息分布为:[1,5%]、[2,10%]、[3,10%]、[4,5%]、[5,10%]、[6,20%]、[7,5%]、[8,20%]、[9,5%]、[10,10%],其中,[1,5%]表示第二图像的美学信息为1分的概率为5%,[2,10%]表示第二图像的美学信息为2分的概率为10%,[3,10%]表示第二图像的美学信息为3分的概率为10%,[4,5%]表示第二图像的美学信息为4分的概率为5%,[5,10%]表示第二图像的美学信息为5分的概率为10%,[6,20%]表示第二图像的美学信息为6分的概率为20%,[7,5%]表示第二图像的美学信息为7分的概率为5%,[8,20%]表示第二图像的美学信息为8分的概率为20%,[9,5%]表示第二图像的美学信息为9分的概率为5%,[10,10%]表示第二图像的美学信息为10分的概率为10%。
基于第二图像的第一美学信息分布和上述公式(1),确定出第二图像的预测美学信息为5.85分。假设基于人工的审美标准,获取到的第二图像的美学质量标签为高档,高档对应的分值范围为8-10分,由于第二图像的预测美学信息不属于第二图像的美学质量标签对应的分值范围,基于第二图像的美学质量标签对应的分值范围,确定第二图像的参考美学信息。例如,将第二图像的美学质量标签对应的分值范围的平均数确定为第二图像的参考美学信息,也即是确定第二图像的参考美学信息为9。基于第二图像的参考美学信息,第二图像的方差以及正态分布函数,确定的第二图像的第二美学信息分布为:[1,3%]、[2,12%]、[3,5%]、[4,10%]、[5,5%]、[6,25%]、[7,3%]、[8,22%]、[9,2%]、[10,13%]。
在一种可能的实现方式中,确定出第二图像的参考美学信息分布之后,将第二图像的参考美学信息分布和第二图像输入初始图像美学信息确定模型,基于第二图像的参考美学信息分布和第二图像对初始图像美学信息确定模型进行更新,从而得到目标图像美学信息确定模型。
如图5所示为本申请实施例提供的一种初始图像美学信息确定模型的更新过程的示意图,在该图5中将第二图像输入初始图像美学信息确定模型,得到第二图像的第一美学信息分布,基于第二图像的第一美学信息分布计算第二图像的预测美学信息和方差,基于第二图像的预测美学信息、方差以及第二图像的美学质量标签,确定第二图像的第二美学信息分布,基于第二图像以及第二图像的第二美学信息分布更新初始图像美学信息确定模型,得到目标图像美学信息确定模型。
在一种可能的实现方式中,确定出第二图像的参考美学信息分布之后,还可基于第二图像的参考美学信息分布计算第二图像的美学信息,从而得到第二图像的美学信息。
在一种可能的实现方式中,训练得到目标图像美学信息确定模型之后,还可以确定目标图像美学信息确定模型的准确率,该过程如下:获取五组图像,每组图像包括图像1和图像2,分别将每组图像的图像和图像2输入目标图像美学信息确定模型,基于目标图像美学信息确定模型的输出结果,得到每组图像中图像1和图像2分别对应的美学信息分布,基于图像1和图像2分别对应的美学信息分布,计算图像1和图像2分别的美学信息,再将五组图像分别展示给至少一个用户,由至少一个用户基于自身主观审美确定每组图像中哪一张图像更美观,基于用户的选择和每组图像的美学信息,确定目标图像美学信息确定模型与人类主观审美的匹配度,也即是目标图像美学信息确定模型的准确率。
示例性地,五组图像中,第一组图像中的图像1和图像2的美学信息分别为5分和7分,第二组图像中的图像1和图像2的美学信息分别为4分和6分,第三组图像中的图像1和图像2的美学信息分别为5分和7分,第四组图像中的图像1和图像2的美学信息分别为8分和6分,第五组图像中的图像1和图像2的美学信息分别为6分和4分。由五个用户基于自身主观审美确定的五组图像中更美观的图像是中:第一组图像中更美观的图像是图像1,第二组图像中更美观的图像是图像2,第三组图像中更美观的图像是图像2,第四组图像中更美观的图像是图像1,第五组图像中更美观的图像是图像1。由此可见,五组图像中目标图像美学信息确定模型与人类主观审美只有一组图像的审美不同,从而可以得到目标图像美学信息确定模型的准确率为80%。
该获取目标图像美学信息确定模型的过程使得获取到的目标图像美学信息确定模型不仅考虑到图像本身的图像特征,还考虑到人工的主观审美,使得在提高图像美学信息确定过程的效率的同时,还使得确定的图像的美学信息更符合人类的审美标准,从而使得图像美学信息确定过程更加智能化,自动化。
图6所示为本申请实施例提供的一种图像美学信息的确定装置的结构示意图,如图6所示,该装置包括:
获取模块601,用于获取待确定美学信息的目标图像以及目标美学信息确定模型,该目标美学信息确定模型基于损失函数、训练样本和验证样本训练得到,该损失函数用于通过该训练样本训练第一图像美学信息确定模型,得到初始图像美学信息确定模型,该验证样本用于更新该初始图像美学信息确定模型,得到该目标图像美学信息确定模型;
处理模块602,用于调用该目标图像美学信息确定模型对该目标图像进行处理,得到该目标图像的美学信息分布;
确定模块603,用于基于该目标图像的美学信息分布,确定该目标图像的美学信息。
在一种可能的实现方式中,该获取模块601,还用于获取该训练样本,该训练样本包括多个第一图像以及各个第一图像的参考美学信息分布;
该装置还包括:
训练模块,用于基于该多个第一图像以及各个第一图像的参考美学信息分布,训练该第一图像美学信息确定模型,得到该初始图像美学信息确定模型;
该获取模块601,还用于获取该验证样本,该验证样本包括多个第二图像,该验证样本用于更新该初始图像美学信息确定模型;
该装置还包括:
更新模块,用于基于该多个第二图像,对该初始图像美学信息确定模型进行更新,得到该目标图像美学信息确定模型。
在一种可能的实现方式中,该训练模块,用于调用该第一图像美学信息确定模型,基于该多个第一图像以及各个第一图像的参考美学信息分布,得到该各个第一图像的预测美学信息分布;
根据该各个第一图像的参考美学信息分布、该各个第一图像的预测美学信息分布以及该损失函数,确定该各个第一图像的损失值;
基于该各个第一图像的损失值,训练该第一图像美学信息确定模型,得到该初始图像美学信息确定模型。
在一种可能的实现方式中,该更新模块,用于调用该初始图像美学信息确定模型,基于该多个第二图像,得到各个第二图像的第一美学信息分布;
获取该各个第二图像的美学质量标签,该美学质量标签为人为标注的美学信息;
基于该各个第二图像的第一美学信息分布和该各个第二图像的美学质量标签,确定该各个第二图像的第二美学信息分布;
基于该各个第二图像的第二美学信息分布以及该各个第二图像,更新该初始图像美学信息确定模型,得到该目标图像美学信息确定模型。
在一种可能的实现方式中,该训练模块,用于获取累积分布函数;
基于该各个第一图像的参考美学信息分布和该累积分布函数,确定该各个第一图像的第一函数值;
基于该各个第一图像的预测美学信息分布和该累积分布函数,确定该各个第一图像的第二函数值;
按照该损失函数,计算该各个第一图像的第一函数值和该各个第一图像的第二函数值之间的损失值,得到该各个第一图像的损失值。
在一种可能的实现方式中,该更新模块,用于基于该各个第二图像的第一美学信息分布,确定该各个第二图像的预测美学信息和方差;
基于该各个第二图像的预测美学信息和该各个第二图像的美学质量标签,确定该各个第二图像的参考美学信息;
根据该各个第二图像的参考美学信息、该各个第二图像的方差以及正态分布函数,确定该各个第二图像的第二美学信息分布。
在一种可能的实现方式中,该确定模块603,用于基于该目标图像的美学信息分布,按照下述公式确定该目标图像的美学信息S:
S=P1*X1+P2*X2+…+Pi*Xi
其中,该X1为第一数值,该X2为第二数值,该Xi为第i数值,该P1为该目标图像的美学信息为该第一数值的概率,该P2为该目标图像的美学信息为该第二数值的概率,该Pi为该目标图像的美学信息为该第i数值的概率。
上述装置采用模型的方式确定目标图像美学信息,这种方式无需人工对每一个待确定美学信息的图像进行打分,可以提高确定图像美学信息的效率,使得图像美学信息的确定过程更加智能化,更加自动化。
需要说明的是:上述实施例提供的图像美学信息的确定装置在进行图像美学信息的确定时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将图像美学信息的确定装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的图像美学信息的确定装置与图像美学信息的确定方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图7示出了本申请一个示例性实施例提供的电子设备700的结构框图。该电子设备700可以是便携式移动终端,比如:智能手机、平板电脑、MP3播放器(Moving PictureExperts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(MovingPicture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑或台式电脑。电子设备700还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。
通常,电子设备700包括有:处理器701和存储器702。
处理器701可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器701可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器701也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器701可以集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器701还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器702可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器702还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器702中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器701所执行以实现本申请中方法实施例提供的图像美学信息的确定方法。
在一些实施例中,电子设备700还可选包括有:外围设备接口703和至少一个外围设备。处理器701、存储器702和外围设备接口703之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口703相连。具体地,外围设备包括:射频电路704、显示屏705、摄像头组件706、音频电路707、定位组件708和电源709中的至少一种。
外围设备接口703可被用于将I/O(Input/Output,输入/输出)相关的至少一个外围设备连接到处理器701和存储器702。在一些实施例中,处理器701、存储器702和外围设备接口703被集成在同一芯片或电路板上;在一些其他实施例中,处理器701、存储器702和外围设备接口703中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不加以限定。
射频电路704用于接收和发射RF(Radio Frequency,射频)信号,也称电磁信号。射频电路704通过电磁信号与通信网络以及其他通信设备进行通信。射频电路704将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路704包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路704可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于:万维网、城域网、内联网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或WiFi(Wireless Fidelity,无线保真)网络。在一些实施例中,射频电路704还可以包括NFC(Near Field Communication,近距离无线通信)有关的电路,本申请对此不加以限定。
显示屏705用于显示UI(User Interface,用户界面)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏705是触摸显示屏时,显示屏705还具有采集在显示屏705的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器701进行处理。此时,显示屏705还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏705可以为一个,设置在电子设备700的前面板;在另一些实施例中,显示屏705可以为至少两个,分别设置在电子设备700的不同表面或呈折叠设计;在另一些实施例中,显示屏705可以是柔性显示屏,设置在电子设备700的弯曲表面上或折叠面上。甚至,显示屏705还可以设置成非矩形的不规则图形,也即异形屏。显示屏705可以采用LCD(Liquid Crystal Display,液晶显示屏)、OLED(Organic Light-Emitting Diode,有机发光二极管)等材质制备。
摄像头组件706用于采集图像或视频。可选地,摄像头组件706包括前置摄像头和后置摄像头。通常,前置摄像头设置在终端的前面板,后置摄像头设置在终端的背面。在一些实施例中,后置摄像头为至少两个,分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种,以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR(Virtual Reality,虚拟现实)拍摄功能或者其它融合拍摄功能。在一些实施例中,摄像头组件706还可以包括闪光灯。闪光灯可以是单色温闪光灯,也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合,可以用于不同色温下的光线补偿。
音频电路707可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器701进行处理,或者输入至射频电路704以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在电子设备700的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器701或射频电路704的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路707还可以包括耳机插孔。
定位组件708用于定位电子设备700的当前地理位置,以实现导航或LBS(LocationBased Service,基于位置的服务)。定位组件708可以是基于美国的GPS(GlobalPositioning System,全球定位系统)、中国的北斗系统或俄罗斯的伽利略系统的定位组件。
电源709用于为电子设备700中的各个组件进行供电。电源709可以是交流电、直流电、一次性电池或可充电电池。当电源709包括可充电电池时,该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池,无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。
在一些实施例中,电子设备700还包括有一个或多个传感器710。该一个或多个传感器710包括但不限于:加速度传感器711、陀螺仪传感器712、压力传感器713、指纹传感器714、光学传感器715以及接近传感器716。
加速度传感器711可以检测以电子设备700建立的坐标系的三个坐标轴上的加速度大小。比如,加速度传感器711可以用于检测重力加速度在三个坐标轴上的分量。处理器701可以根据加速度传感器711采集的重力加速度信号,控制显示屏705以横向视图或纵向视图进行用户界面的显示。加速度传感器711还可以用于游戏或者用户的运动数据的采集。
陀螺仪传感器712可以检测电子设备700的机体方向及转动角度,陀螺仪传感器712可以与加速度传感器711协同采集用户对电子设备700的3D动作。处理器701根据陀螺仪传感器712采集的数据,可以实现如下功能:动作感应(比如根据用户的倾斜操作来改变UI)、拍摄时的图像稳定、游戏控制以及惯性导航。
压力传感器713可以设置在电子设备700的侧边框和/或显示屏705的下层。当压力传感器713设置在电子设备700的侧边框时,可以检测用户对电子设备700的握持信号,由处理器701根据压力传感器713采集的握持信号进行左右手识别或快捷操作。当压力传感器713设置在显示屏705的下层时,由处理器701根据用户对显示屏705的压力操作,实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。
指纹传感器714用于采集用户的指纹,由处理器701根据指纹传感器714采集到的指纹识别用户的身份,或者,由指纹传感器714根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时,由处理器701授权该用户执行相关的敏感操作,该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器714可以被设置在电子设备700的正面、背面或侧面。当电子设备700上设置有物理按键或厂商Logo时,指纹传感器714可以与物理按键或厂商Logo集成在一起。
光学传感器715用于采集环境光强度。在一个实施例中,处理器701可以根据光学传感器715采集的环境光强度,控制显示屏705的显示亮度。具体地,当环境光强度较高时,调高显示屏705的显示亮度;当环境光强度较低时,调低显示屏705的显示亮度。在另一个实施例中,处理器701还可以根据光学传感器715采集的环境光强度,动态调整摄像头组件706的拍摄参数。
接近传感器716,也称距离传感器,通常设置在电子设备700的前面板。接近传感器716用于采集用户与电子设备700的正面之间的距离。在一个实施例中,当接近传感器716检测到用户与电子设备700的正面之间的距离逐渐变小时,由处理器701控制显示屏705从亮屏状态切换为息屏状态;当接近传感器716检测到用户与电子设备700的正面之间的距离逐渐变大时,由处理器701控制显示屏705从息屏状态切换为亮屏状态。
本领域技术人员可以理解,图7中示出的结构并不构成对电子设备700的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
图8是本申请实施例提供的一种服务器的结构示意图,该服务器800可因配置或性能不同而产生比较大的差异,可以包括一个或多个处理器(Central Processing Units,CPU)801和一个或多个的存储器802,其中,该一个或多个存储器802中存储有至少一条程序指令,该至少一条程序指令由该一个或多个处理器801加载并执行以实现上述各个方法实施例提供的图像美学信息的确定方法。当然,该服务器800还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器800还可以包括其他用于实现设备功能的部件,在此不做赘述。
在示例性实施例中,还提供了一种计算机可读存储介质,该存储介质中存储有至少一条程序代码,该至少一条程序代码由处理器加载并执行,以实现上述任一种图像美学信息的确定方法。
在示例性实施例中,还提供了一种计算机程序或计算机程序产品,该计算机程序或计算机程序产品中存储有至少一条计算机指令,该至少一条计算机指令由处理器加载并执行,以实现上述任一种图像美学信息的确定方法。
可选地,上述计算机可读存储介质可以是只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、只读光盘(Compact Disc Read-OnlyMemory,CD-ROM)、磁带、软盘和光数据存储设备等。
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
以上所述仅为本申请的示例性实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种图像美学信息的确定方法,其特征在于,所述方法包括:
获取待确定美学信息的目标图像以及目标美学信息确定模型,所述目标美学信息确定模型基于损失函数、训练样本和验证样本训练得到,所述损失函数用于通过所述训练样本训练第一图像美学信息确定模型,得到初始图像美学信息确定模型,所述验证样本用于更新所述初始图像美学信息确定模型,得到所述目标图像美学信息确定模型;
调用所述目标图像美学信息确定模型对所述目标图像进行处理,得到所述目标图像的美学信息分布;
基于所述目标图像的美学信息分布,确定所述目标图像的美学信息。
2.根据权利要求1所述的方法,其特征在于,所述获取待确定美学信息的目标图像以及目标美学信息确定模型之前,所述方法还包括:
获取所述训练样本,所述训练样本包括多个第一图像以及各个第一图像的参考美学信息分布;
基于所述多个第一图像以及各个第一图像的参考美学信息分布,训练所述第一图像美学信息确定模型,得到所述初始图像美学信息确定模型;
获取所述验证样本,所述验证样本包括多个第二图像,所述验证样本用于更新所述初始图像美学信息确定模型;
基于所述多个第二图像,对所述初始图像美学信息确定模型进行更新,得到所述目标图像美学信息确定模型。
3.根据权利要求2所述的方法,其特征在于,所述基于所述多个第一图像以及各个第一图像的参考美学信息分布,训练所述第一图像美学信息确定模型,得到所述初始图像美学信息确定模型,包括:
调用所述第一图像美学信息确定模型,基于所述多个第一图像以及各个第一图像的参考美学信息分布,得到所述各个第一图像的预测美学信息分布;
根据所述各个第一图像的参考美学信息分布、所述各个第一图像的预测美学信息分布以及所述损失函数,确定所述各个第一图像的损失值;
基于所述各个第一图像的损失值,训练所述第一图像美学信息确定模型,得到所述初始图像美学信息确定模型。
4.根据权利要求2所述的方法,其特征在于,所述基于所述多个第二图像,对所述初始图像美学信息确定模型进行更新,得到所述目标图像美学信息确定模型,包括:
调用所述初始图像美学信息确定模型,基于所述多个第二图像,得到各个第二图像的第一美学信息分布;
获取所述各个第二图像的美学质量标签,所述美学质量标签为人为标注的美学信息;
基于所述各个第二图像的第一美学信息分布和所述各个第二图像的美学质量标签,确定所述各个第二图像的第二美学信息分布;
基于所述各个第二图像的第二美学信息分布以及所述各个第二图像,更新所述初始图像美学信息确定模型,得到所述目标图像美学信息确定模型。
5.根据权利要求3所述的方法,其特征在于,所述根据所述各个第一图像的参考美学信息分布、所述各个第一图像的预测美学信息分布以及所述损失函数,确定所述各个第一图像的损失值,包括:
获取累积分布函数;
基于所述各个第一图像的参考美学信息分布和所述累积分布函数,确定所述各个第一图像的第一函数值;
基于所述各个第一图像的预测美学信息分布和所述累积分布函数,确定所述各个第一图像的第二函数值;
按照所述损失函数,计算所述各个第一图像的第一函数值和所述各个第一图像的第二函数值之间的损失值,得到所述各个第一图像的损失值。
6.根据权利要求4所述的方法,其特征在于,所述基于所述各个第二图像的第一美学信息分布和所述各个第二图像的美学质量标签,确定所述各个第二图像的第二美学信息分布,包括:
基于所述各个第二图像的第一美学信息分布,确定所述各个第二图像的预测美学信息和方差;
基于所述各个第二图像的预测美学信息和所述各个第二图像的美学质量标签,确定所述各个第二图像的参考美学信息;
根据所述各个第二图像的参考美学信息、所述各个第二图像的方差以及正态分布函数,确定所述各个第二图像的第二美学信息分布。
7.根据权利要求1-6任一所述的方法,其特征在于,所述基于所述目标图像的美学信息分布,确定所述目标图像的美学信息,包括:
基于所述目标图像的美学信息分布,按照下述公式确定所述目标图像的美学信息S:
S=P1*X1+P2*X2+…+Pi*Xi
其中,所述X1为第一数值,所述X2为第二数值,所述Xi为第i数值,所述P1为所述目标图像的美学信息为所述第一数值的概率,所述P2为所述目标图像的美学信息为所述第二数值的概率,所述Pi为所述目标图像的美学信息为所述第i数值的概率。
8.一种图像美学信息的确定装置,其特征在于,所述装置包括:
获取模块,用于获取待确定美学信息的目标图像以及目标美学信息确定模型,所述目标美学信息确定模型基于损失函数、训练样本和验证样本训练得到,所述损失函数用于通过所述训练样本训练第一图像美学信息确定模型,得到初始图像美学信息确定模型,所述验证样本用于更新所述初始图像美学信息确定模型,得到所述目标图像美学信息确定模型;
处理模块,用于调用所述目标图像美学信息确定模型对所述目标图像进行处理,得到所述目标图像的美学信息分布;
确定模块,用于基于所述目标图像的美学信息分布,确定所述目标图像的美学信息。
9.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条程序代码,所述至少一条程序代码由所述处理器加载并执行,以实现如权利要求1至7任一所述的图像美学信息的确定方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行,以实现如权利要求1至7任一所述的图像美学信息的确定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011385666.5A CN112560903A (zh) | 2020-12-01 | 2020-12-01 | 图像美学信息的确定方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011385666.5A CN112560903A (zh) | 2020-12-01 | 2020-12-01 | 图像美学信息的确定方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112560903A true CN112560903A (zh) | 2021-03-26 |
Family
ID=75046999
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011385666.5A Pending CN112560903A (zh) | 2020-12-01 | 2020-12-01 | 图像美学信息的确定方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112560903A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113255743A (zh) * | 2021-05-12 | 2021-08-13 | 展讯通信(上海)有限公司 | 图像处理方法、装置、电子设备及存储介质 |
-
2020
- 2020-12-01 CN CN202011385666.5A patent/CN112560903A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113255743A (zh) * | 2021-05-12 | 2021-08-13 | 展讯通信(上海)有限公司 | 图像处理方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110139143B (zh) | 虚拟物品显示方法、装置、计算机设备以及存储介质 | |
CN110705614A (zh) | 模型训练方法、装置、电子设备及存储介质 | |
CN111539795A (zh) | 图像处理方法、装置、电子设备及计算机可读存储介质 | |
CN111083554A (zh) | 直播礼物显示的方法和装置 | |
CN110769120A (zh) | 进行消息提醒的方法、装置、设备及存储介质 | |
CN112989198B (zh) | 推送内容的确定方法、装置、设备及计算机可读存储介质 | |
CN112738606B (zh) | 音频文件的处理方法、装置、终端及存储介质 | |
CN112839107A (zh) | 推送内容的确定方法、装置、设备及计算机可读存储介质 | |
CN110335224B (zh) | 图像处理方法、装置、计算机设备及存储介质 | |
CN112560903A (zh) | 图像美学信息的确定方法、装置、设备及存储介质 | |
CN113343709B (zh) | 意图识别模型的训练方法、意图识别方法、装置及设备 | |
CN115798417A (zh) | 背光亮度的确定方法、装置、设备及计算机可读存储介质 | |
CN111063372B (zh) | 确定音高特征的方法、装置、设备及存储介质 | |
CN113920222A (zh) | 获取地图建图数据的方法、装置、设备及可读存储介质 | |
CN110555443B (zh) | 颜色分类方法、装置及存储介质 | |
CN112132472A (zh) | 资源管理方法、装置、电子设备及计算机可读存储介质 | |
CN112990424A (zh) | 神经网络模型训练的方法和装置 | |
CN111916105A (zh) | 语音信号处理方法、装置、电子设备及存储介质 | |
CN111523876A (zh) | 支付方式的显示方法、装置、系统及存储介质 | |
CN111258673A (zh) | 快应用显示方法及终端设备 | |
CN111145723A (zh) | 转换音频的方法、装置、设备以及存储介质 | |
CN110750675A (zh) | 歌词分享方法及装置、存储介质 | |
CN113658283B (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN116681755B (zh) | 位姿预测方法和装置 | |
CN110458289B (zh) | 多媒体分类模型的构建方法、多媒体分类方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |