CN111353532A - 图像生成方法及装置、计算机可读存储介质、电子设备 - Google Patents

图像生成方法及装置、计算机可读存储介质、电子设备 Download PDF

Info

Publication number
CN111353532A
CN111353532A CN202010118133.4A CN202010118133A CN111353532A CN 111353532 A CN111353532 A CN 111353532A CN 202010118133 A CN202010118133 A CN 202010118133A CN 111353532 A CN111353532 A CN 111353532A
Authority
CN
China
Prior art keywords
matched
feature
target
color
feature vectors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010118133.4A
Other languages
English (en)
Inventor
吴桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sankuai Online Technology Co Ltd
Original Assignee
Beijing Sankuai Online Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sankuai Online Technology Co Ltd filed Critical Beijing Sankuai Online Technology Co Ltd
Priority to CN202010118133.4A priority Critical patent/CN111353532A/zh
Publication of CN111353532A publication Critical patent/CN111353532A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本公开涉及计算机领域,提供了一种图像生成方法及装置,方法包括:获取图像模板,通过机器学习模型对图像模板中的修饰元素进行特征提取以获取特征向量,同时通过模糊过滤器对修饰元素进行特征提取以获取颜色特征;将特征向量与特征向量库中的多个待匹配特征向量进行匹配,根据匹配结果确定多个目标待匹配特征向量,其中特征向量库是根据机器学习模型对修饰素材进行特征提取所获取的特征向量形成的;根据与各目标待匹配特征向量对应的修饰素材确定多个待匹配颜色特征,将颜色特征与各待匹配颜色特征进行匹配,根据匹配结果确定多个目标修饰素材;根据图像模板、目标修饰素材和主体素材生成目标图像。本公开提高了图像的生成效率和视觉效果。

Description

图像生成方法及装置、计算机可读存储介质、电子设备
技术领域
本公开涉及计算机领域,特别涉及一种图像生成方法、图像生成装置、计算机可读存储介质及电子设备。
背景技术
随着物质生活的丰富和计算机技术的发展,产品销售逐渐分化出了电商和实体销售,无论是电商还是实体销售,都需要设计与产品相关的宣传材料,以帮助用户了解产品信息。
目前,设计宣传材料的主流方法是基于统计学的方法,但是该方法没有考虑到图像特征,忽略了素材间是否搭配的问题,使得最终形成的宣传材料中的素材不协调,视觉效果欠佳,并且生成效率低,用户体验较差,进一步降低了产品的点击量和购买量。
鉴于此,本领域亟需开发一种新的图像生成方法及装置。
需要说明的是,上述背景技术部分公开的信息仅用于加强对本公开的背景的理解。
发明内容
本公开的实施例提供一种图像生成方法、图像生成装置、计算机可读存储介质及电子设备,进而至少在一定程度上提高了图像的生成效率,并且生成的图像中素材之间相互搭配,提高了图像的视觉效果。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的第一方面,提供一种图像生成方法,包括:
获取图像模板,通过机器学习模型对所述图像模板中的修饰元素进行特征提取以获取与所述修饰元素对应的特征向量,同时通过模糊过滤器对所述修饰元素进行特征提取以获取所述修饰元素的颜色特征;
将所述特征向量与特征向量库中的多个待匹配特征向量进行匹配,根据匹配结果确定多个目标待匹配特征向量,其中所述特征向量库是根据所述机器学习模型对修饰素材进行特征提取所获取的特征向量形成的;
根据与各所述目标待匹配特征向量对应的修饰素材确定多个待匹配颜色特征,将所述颜色特征与各所述待匹配颜色特征进行匹配,根据匹配结果确定多个目标修饰素材;
根据所述图像模板、所述目标修饰素材和主体素材生成目标图像。
在本公开的示例性实施例中,所述通过机器学习模型对所述图像模板中的修饰元素进行特征提取以获取与所述修饰元素对应的特征向量,包括:
将所述修饰元素输入至卷积神经网络模型,通过所述卷积神经网络模型对所述修饰元素进行特征提取,以获取与所述修饰元素对应的语义特征、风格特征和形状特征;
将所述语义特征、所述风格特征和所述形状特征按照预设规则整合,以获取所述特征向量。
在本公开的示例性实施例中,所述通过模糊过滤器对所述修饰元素进行特征提取以获取所述修饰元素的颜色特征,包括:
将所述修饰元素的颜色格式转换为HSV格式;
通过第一模糊过滤器对HSV格式的修饰元素进行处理,以获取第一直方图信息;
通过第二模糊过滤器对所述第一直方图信息进行处理,以获取第二直方图信息,并将所述第二直方图信息作为所述颜色特征。
在本公开的示例性实施例中,所述方法还包括:
获取素材库,通过所述机器学习模型对所述素材库中的多个修饰素材分别进行特征提取以获取与各所述修饰素材对应的特征向量,同时通过所述模糊过滤器对各所述修饰素材进行特征提取以获取所述修饰素材的颜色特征;
将与所述修饰素材对应的特征向量作为所述待匹配特征向量,并存入所述特征向量库中;
将所述修饰素材的颜色特征作为所述待匹配颜色特征,并存入颜色特征库中。
在本公开的示例性实施例中,所述将所述特征向量与特征向量库中的多个待匹配特征向量进行匹配,根据匹配结果确定多个目标待匹配特征向量,包括:
计算所述特征向量与各所述待匹配特征向量之间的余弦相似度;
将所述余弦相似度由大到小排序,以形成相似度序列;
从所述相似度序列中依次获取第一数量的相似度,将所述第一数量的相似度对应的待匹配特征向量作为所述目标待匹配特征向量。
在本公开的示例性实施例中,所述将所述颜色特征与各所述待匹配颜色特征进行匹配,根据匹配结果确定多个目标修饰素材,包括:
计算所述颜色特征与各所述待匹配颜色特征之间的距离;
将所述距离由大到小排序,以形成距离序列;
从所述距离序列中依次获取第二数量的距离,获取与所述第二数量的距离对应的目标待匹配颜色特征,并将所述目标待匹配颜色特征对应的修饰素材作为所述目标修饰素材。
在本公开的示例性实施例中,所述根据所述图像模板、所述目标修饰素材和主体素材生成目标图像,包括:
将所述目标修饰素材中的任意一个作为替换修饰素材;
将所述主体素材插入到所述图像模板中的主体素材图片位,采用所述替换修饰素材替换所述修饰元素,并插入到所述图像模板中的修饰素材图片位,以生成所述目标图像。
根据本公开的第二方面,提供了一种图像生成装置,包括:
特征提取模块,用于获取图像模板,通过机器学习模型对所述图像模板中的修饰元素进行特征提取以获取与所述修饰元素对应的特征向量,同时通过模糊过滤器对所述修饰元素进行特征提取以获取所述修饰元素的颜色特征;
第一匹配模块,用于将所述特征向量与特征向量库中的多个待匹配特征向量进行匹配,根据匹配结果确定多个目标待匹配特征向量,其中所述特征向量库是根据所述机器学习模型对修饰素材进行特征提取所获取的特征向量形成的;
第二匹配模块,用于根据与各所述目标待匹配特征向量对应的修饰素材确定多个待匹配颜色特征,将所述颜色特征与各所述待匹配颜色特征进行匹配,根据匹配结果确定多个目标修饰素材;
图像生成模块,用于根据所述图像模板、所述目标修饰素材和主体素材生成目标图像。
根据本公开的第三方面,提供一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述的图像生成方法。
根据本公开的第四方面,提供一种电子设备,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行上述的图像生成方法。
由上述技术方案可知,本公开示例性实施例中的图像生成方法及装置、计算机可读存储介质、电子设备至少具备以下优点和积极效果:
本公开首先获取图像模板,通过机器学习模型对图像模板中的修饰元素进行特征提取以获取与修饰元素对应的特征向量,同时通过模糊过滤器对修饰元素进行特征提取以获取修饰元素的颜色特征;接着将特征向量与特征向量库中的多个待匹配特征向量进行匹配,以根据匹配结果确定多个目标待匹配特征向量;然后根据目标待匹配特征向量确定与之对应的修饰素材,并将颜色特征与修饰素材对应的待匹配颜色特征进行匹配,以根据匹配结果确定目标修饰素材;最后根据图像模板、目标修饰素材和主体素材生成目标图像。通过本公开的图像生成方法,一方面,提高了图像的生成效率;另一方面,在生成图像的过程中,考虑了图像特征,并且通过本公开的方法获取的目标修饰素材之间在语义、风格、形状及颜色维度上更搭配,提高了图像的视觉效果,进一步提升了用户体验。
本公开应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本公开示例性实施例中图像生成方法的流程示意图;
图2示出本公开示例性实施例中图像生成方法的应用场景示例图;
图3示出本公开示例性实施例中获取修饰元素的颜色特征的流程示意图;
图4示出本公开示例性实施例中获取目标待匹配特征向量的流程示意图;
图5示出本公开示例性实施例中获取目标修饰素材的流程示意图;
图6示出本公开示例性实施例中图像生成装置的结构示意图;
图7示出本公开示例性实施例中用于实现图像生成方法的电子设备示例框图;
图8示意性示出本公开示例性实施例中用于实现图像生成方法的计算机可读存储介质。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
本说明书中使用用语“一个”、“一”、“该”和“所述”用以表示存在一个或多个要素/组成部分/等;用语“包括”和“具有”用以表示开放式的包括在内的意思并且是指除了列出的要素/组成部分/等之外还可存在另外的要素/组成部分/等;用语“第一”和“第二”等仅作为标记使用,不是对其对象的数量限制。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。
本公开提出了一种图像生成方法,图1示出了图像生成方法的流程图,如图1所示,图像生成方法包括:
S110:获取图像模板,通过机器学习模型对所述图像模板中的修饰元素进行特征提取以获取与所述修饰元素对应的特征向量,同时通过模糊过滤器对所述修饰元素进行特征提取以获取所述修饰元素的颜色特征;
S120:将所述特征向量与特征向量库中的多个待匹配特征向量进行匹配,根据匹配结果确定多个目标待匹配特征向量,其中所述特征向量库是根据所述机器学习模型对修饰素材进行特征提取所获取的特征向量形成的;
S130:根据与各所述目标待匹配特征向量对应的修饰素材确定多个待匹配颜色特征,将所述颜色特征与各所述待匹配颜色特征进行匹配,根据匹配结果确定多个目标修饰素材;
S140:根据所述图像模板、所述目标修饰素材和主体素材生成目标图像。
下面基于图2示出的结构对图像生成方法的各个步骤进行详细说明。
在步骤S110中,获取图像模板,通过机器学习模型对所述图像模板中的修饰元素进行特征提取以获取与所述修饰元素对应的特征向量,同时通过模糊过滤器对所述修饰元素进行特征提取以获取所述修饰元素的颜色特征。
在本公开的示例性实施例中,在终端设备201中预先存储有模板库和素材库,其中模板库中包含多个图像模板,根据图像类型的不同,图像模板的大小、版面布局等都不同,每个模板包括背景素材、主体素材、修饰素材、主体素材图片位和修饰素材图片位,其中的主体素材和修饰素材是设计人员在设计模板时选择搭配的,在一个图像模板中,可以有一个主体素材,一个或多个修饰素材,修饰素材用来修饰整个图像并凸显主体素材,提高图像的视觉效果,例如在一个快餐店广告中,主体素材是汉堡,那么可以在广告中的非主体素材图片位上设置气球、小菜、饮料等。素材库分为两个子库,一个子库用于存放主体素材,例如菜品图,一个子库用于存放修饰素材。本公开中的终端设备201包括但不限于智能手机、平板电脑、便携式计算机和台式计算机等电子设备。
在本公开的示例性实施例中,用户可以根据自己所要推广的产品从模板库中选择合适的图像模板,具体的,可以根据推广的产品的类别、用途等信息从模板库中进行匹配获取相应地图像模板。在获取图像模板后,可以通过终端设备201将图像模板发送至服务器202,服务器202 接收到图像模板后,首先获取其中的修饰元素,然后对修饰元素进行处理以从素材库中获取更合适的修饰素材,并对修饰元素进行替换形成新的目标图像。
在本公开的示例性实施例中,由于图像模板中可以包含一个或多个修饰元素,为了使本公开的技术方案更清晰,现以图像模板中只包含一个修饰元素为例进行说明。在获取图像模板中的修饰元素后,可以将其输入至一机器学习模型,通过该机器学习模型对修饰元素进行特征提取,以获取与修饰元素对应的特征向量,该机器学习模型具体可以是多任务卷积神经网络模型,多任务卷积神经网络模型包括主干网络和任务网络,其中主干网络用于对修饰元素进行特征提取,以获取与修饰元素对应的特征向量;任务网络基于主干网络输出的特征向量提取不同类别的信息并输出,任务网络具体包括语义特征提取网络层、风格特征提取网络层和形状特征提取网络层,相应地,通过多任务卷积神经网络模型对修饰元素进行特征提取,可以获取与修饰元素对应的语义特征、风格特征和形状特征。其中,语义特征为与修饰元素对应的类别,如修饰元素是食品、植物、纺织品等,进一步的,修饰元素的语义特征还可以细化为具体的类别,如:风衣、连衣裙、小菜、饮料等等;风格特征为与修饰元素对应的时代、地域等内在特性,例如修饰元素为食品,那么其风格特征可能是中式、日式、泰式等等,同样地,若修饰元素为长裙,那么其风格特征可能是波西米亚风、韩式、中式等等;形状特征为修饰元素的外观形状,例如修饰元素为罐装饮料,那么形状特征为圆柱体,等等。
在本公开的示例性实施例中,在采用多任务卷积神经网络模型对修饰元素进行特征提取之前,可以将素材库中的修饰素材作为训练样本,采用该训练样本对待训练的多任务卷积神经网络模型进行训练,以获取待训练的多任务卷积神经网络模型输出的语义特征、风格特征和形状特征,通过将语义特征与标注的语义特征样本进行比对、将风格特征与标注的风格特征样本进行比对、以及将形状特征与标注的形状特征样本进行比对,以确定损失函数,通过调节待训练的多任务卷积神经网络模型的参数,以使损失函数达到最小,即完成对待训练的多任务卷积神经网络模型的训练,获取稳定的多任务卷积神经网络模型。
在本公开的示例性实施例中,在获取与修饰元素对应的语义特征、风格特征和形状特征后,可以将语义特征、风格特征和形状特征按照预设规则进行整合,以获取与修饰元素对应的特征向量。具体地,可以按照语义特征、风格特征和形状特征的顺序将三个特征进行整合,也可以按照其它的顺序将三个特征进行整合形成特征向量,当然还可以根据其它的顺序整合形成特征向量,本公开实施例对此不作具体限定。
在本公开的示例性实施例中,还可以通过模糊过滤器对修饰元素的颜色特征进行提取,以获取与修饰元素对应的颜色特征。图3示出了获取修饰元素的颜色特征的流程示意图,如图3所示,该流程至少包括步骤S301-S303,具体地:
在步骤S301中,将修饰元素的颜色格式转换为HSV格式。
在本公开的示例性实施例中,图像模板的颜色格式为RGB格式,相应地,修饰元素也为RGB格式的图像,在提取修饰元素的颜色特征之前,可以将修饰元素的颜色格式由RGB格式转换为HSV格式,HSV格式是根据颜色的直观特性创建的一种颜色空间,也称六角锥体模型,其中H 代表色调,指通过物体传播或从物体射出的颜色;S代表饱和度,表示色调中灰色成分的比例,指颜色的纯度或强度;V代表亮度,指颜色相对的明暗程度。通过将颜色格式转换为HSV格式,便于后续模糊过滤器的运算。
在步骤S302中,通过第一模糊过滤器对HSV格式的修饰元素进行处理,以获取第一直方图信息。
在本公开的示例性实施例中,该第一模糊过滤器可以是10-bins模糊过滤器,通过三个通道输入HSV信息,然后输出10个模糊的直方图信息值,10个直方图信息值的含义为:(0)黑色,(1)灰色,(2)白色,(3)红色,(4)橙色,(5)黄色,(6)绿色,(7)青色,(8) 蓝色,(9)品红色,该些直方图信息值即为第一直方图信息。
在步骤S303中,通过第二模糊过滤器对第一直方图信息进行处理,以获取第二直方图信息,并将第二直方图信息作为颜色特征。
在本公开的示例性实施例中,在采用10-bins模糊过滤器对HSV格式的修饰元素进行处理得到第一直方图信息后,可以采用第二模糊过滤器对第一直方图信息进行处理,以获取第二直方图信息,该第二模糊过滤器具体可以是24-bins模糊过滤器,通过将10-bins模糊过滤器输出的每种色区再分为3个H值区域,输入一个10维向量和S、V通道值,输出的是一个24维向量,也就是说,与修饰元素对应的颜色特征为一个 24维的向量,具体包括:(0)黑色,(1)灰色,(2)白色,(3)暗红色,(4)红色,(5)浅红,(6)暗橙色,(7)橙色,(8)浅橙色,(9)暗黄色,(10)黄色,(11)浅黄色,(12)深绿色,(13)绿色, (14)浅绿色,(15)暗青色,(16)青色,(17)浅青色,(18)深蓝色,(19)蓝色,(20)淡蓝色,(21)暗品红色,(22)品红色,(23)浅品红色。
在步骤S120中,将所述特征向量与特征向量库中的多个待匹配特征向量进行匹配,根据匹配结果确定多个目标待匹配特征向量,其中所述特征向量库是根据所述机器学习模型对修饰素材进行特征提取所获取的特征向量形成的。
在本公开的示例性实施例中,在获取与修饰元素对应的特征向量后,可以将特征向量与特征向量库中的多个待匹配特征向量进行匹配,以根据匹配结果确定多个目标待匹配特征向量。其中,特征向量库中的待匹配特征向量是通过机器学习模型,如卷积神经网络,对素材库中的修饰素材进行特征提取所得到的,获取与素材库中的修饰素材对应的待匹配特征向量的方法和获取与修饰元素对应的特征向量的方法相同,在此不再赘述。在获取与修饰素材对应的待匹配特征向量后,将其存入特征向量库中。
在本公开的示例性实施例中,在将修饰元素对应的特征向量与待匹配特征向量进行匹配时,可以计算特征向量与待匹配特征向量之间的余弦相似度,根据余弦相似度确定与修饰元素匹配的修饰素材。余弦相似度又称为余弦相似性,是通过计算两个向量的夹角余弦值来评估它们的相似度,当余弦相似度为1时,表示两个向量的夹角为零,也就是说两个向量最相似;当余弦相似度为-1时,表示两个向量的夹角为180°,也就是说两个向量最不相似。图4示出了获取目标待匹配特征向量的流程示意图,如图4所示,在步骤S401中,计算特征向量与各个待匹配特征向量之间的余弦相似度;在步骤S402中,将余弦相似度由大到小排序,以形成相似度序列;在步骤S403中,从相似度序列中依次获取第一数量的相似度,并将第一数量的想低速对应的待匹配特征向量作为目标待匹配特征向量。其中,第一数量可以根据实际需要设定,但是第一数量必然小于或等于待匹配特征向量的数量。
在步骤S130中,根据与各所述目标待匹配特征向量对应的修饰素材确定多个待匹配颜色特征,将所述颜色特征与各所述待匹配颜色特征进行匹配,根据匹配结果确定多个目标修饰素材。
在本公开的示例性实施例中,获取目标待匹配特征向量后,可以根据目标待匹配特征向量确定与其对应的修饰素材,进而可以从颜色特征库中获取与该修饰素材对应的待匹配颜色特征。待匹配颜色特征是通过对素材库中的修饰素材进行颜色特征提取所获取的,获取与素材库中的修饰素材对应的待匹配颜色特征后可以将其存入颜色特征库中。
在本公开的示例性实施例中,在将修饰元素对应的颜色特征与目标匹配特征向量对应的修饰素材的待匹配颜色特征进行匹配时,可以根据颜色特征与待匹配颜色特征之间的距离确定目标修饰素材,图5示出了获取目标修饰素材的流程示意图,如图5所示,在步骤S501中,计算颜色特征与各个待匹配颜色特征之间的距离;在步骤S502中,将距离由大到小排序,以形成距离序列;在步骤S503中,从距离序列中依次获取第二数量的距离,获取与第二数量的距离对应的目标待匹配颜色特征,并将目标待匹配颜色特征对应的修饰素材作为目标修饰素材。其中,距离可以是欧氏距离、马氏距离等,本公开对此不作具体限定;第二数量也可以根据实际需要设定,但是第二数量小于第一数量。该目标修饰素材即为与图像模板中的修饰元素相似的修饰素材,采用目标修饰素材替换修饰元素,即可形成新的图像。
在步骤S140中,根据所述图像模板、所述目标修饰素材和主体素材生成目标图像。
在本公开的示例性实施例中,在获取目标修饰素材之后,可以将任意一个目标修饰素材作为替换修饰素材,将主体素材插入到图像模板中的主体素材图片位,将修饰元素替换为替换修饰素材,并插入到图像模板中的修饰素材图片位,即可生成目标图像。
在本公开的示例性实施例中,当图像模板中存在多个修饰元素时,可以根据上述实施例中的图像生成方法对每个修饰元素进行处理,获取与各个修饰元素对应的目标修饰素材,然后可以从与各个修饰元素对应的目标修饰素材中任选一个作为与各个修饰元素对应的替换修饰素材,最后根据用户所要推广的产品对应的主体素材、图像模板和与各个修饰元素对应的替换修饰素材形成新的图像。
本公开的图像生成方法可以用于制作广告、海报等宣传材料,该宣传材料可以是以数码图片形式应用于线上平台,例如外卖平台上的食品、饮料、药品、蔬菜、衣服、玩具等的宣传广告或宣传海报,也可以是实体形式的宣传广告页或宣传海报,例如公交站牌、地铁站中悬挂在广告栏中的广告,商品推销员发放的优惠券或产品宣传页,等等。
本公开的图像生成方法能够通过机器学习模型对用户选择的图像模板中的修饰元素进行处理,获取与修饰元素对应的特征向量,同时可以通过模糊过滤器根据颜色特征提取算法提取修饰元素的颜色特征,进而可以根据特征向量与特征向量库中的多个待匹配特征向量之间的相似度确定目标待匹配特征向量,并根据颜色特征和颜色特征库中与目标待匹配特征向量对应的待匹配颜色特征之间距离从目标待匹配特征向量对应的修饰素材中确定目标修饰素材,最终根据主体素材、目标修饰素材和图像模板可以生成目标图像。本公开的图像生成方法一方面能够提高图像的生成效率,另一方面能够考虑图像特征,并考虑修饰素材在语义、风格、形状及颜色维度上的搭配,保证了目标图像中修饰素材之间搭配,提高了目标图像的视觉效果,进一步提升了用户体验。
相应地,本公开还提供了一种图像生成装置,图6示出了图像生成装置的结构示意图,如图6所示,图像生成装置600可以包括特征提取模块601、第一匹配模块602、第二匹配模块603和图像生成模块604。
其中:
特征提取模块601,用于获取图像模板,通过机器学习模型对所述图像模板中的修饰元素进行特征提取以获取与所述修饰元素对应的特征向量,同时通过模糊过滤器对所述修饰元素进行特征提取以获取所述修饰元素的颜色特征;
第一匹配模块602,用于将所述特征向量与特征向量库中的多个待匹配特征向量进行匹配,根据匹配结果确定多个目标待匹配特征向量,其中所述特征向量库是根据所述机器学习模型对修饰素材进行特征提取所获取的特征向量形成的;
第二匹配模块603,用于根据与各所述目标待匹配特征向量对应的修饰素材确定多个待匹配颜色特征,将所述颜色特征与各所述待匹配颜色特征进行匹配,根据匹配结果确定多个目标修饰素材;
图像生成模块604,用于根据所述图像模板、所述目标修饰素材和主体素材生成目标图像。
上述图像生成装置中各模块的具体细节已经在对应的图像生成方法中进行了详细的描述,因此此处不再赘述。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等) 执行根据本公开实施方式的方法。
在本公开的示例性实施例中,还提供了一种能够实现上述方法的电子设备。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
下面参照图7来描述根据本发明的这种实施方式的电子设备700。图 7显示的电子设备700仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,电子设备700以通用计算设备的形式表现。电子设备700 的组件可以包括但不限于:上述至少一个处理单元710、上述至少一个存储单元720、连接不同系统组件(包括存储单元720和处理单元710)的总线730和显示单元740。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元710执行,使得所述处理单元710执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元 710可以执行如图1中所示的步骤S110:获取图像模板,通过机器学习模型对所述图像模板中的修饰元素进行特征提取以获取与所述修饰元素对应的特征向量,同时通过模糊过滤器对所述修饰元素进行特征提取以获取所述修饰元素的颜色特征;S120:将所述特征向量与特征向量库中的多个待匹配特征向量进行匹配,根据匹配结果确定多个目标待匹配特征向量,其中所述特征向量库是根据所述机器学习模型对修饰素材进行特征提取所获取的特征向量形成的;步骤S130:根据与各所述目标待匹配特征向量对应的修饰素材确定多个待匹配颜色特征,将所述颜色特征与各所述待匹配颜色特征进行匹配,根据匹配结果确定多个目标修饰素材;步骤S140:根据所述图像模板、所述目标修饰素材和主体素材生成目标图像。
存储单元720可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)7201和/或高速缓存存储单元7202,还可以进一步包括只读存储单元(ROM)7203。
存储单元720还可以包括具有一组(至少一个)程序模块7205的程序/实用工具7204,这样的程序模块7205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线730可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备700也可以与一个或多个外部设备1100(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备700 交互的设备通信,和/或与使得该电子设备700能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口750进行。并且,电子设备700还可以通过网络适配器760与一个或者多个网络(例如局域网(LAN),广域网 (WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器760 通过总线730与电子设备700的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备700使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是 CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行根据本公开实施方式的方法。
在本公开的示例性实施例中,还提供了一种计算机存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。
参考图8所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品800,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如 Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
此外,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其他实施例。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。

Claims (10)

1.一种图像生成方法,其特征在于,包括:
获取图像模板,通过机器学习模型对所述图像模板中的修饰元素进行特征提取以获取与所述修饰元素对应的特征向量,同时通过模糊过滤器对所述修饰元素进行特征提取以获取所述修饰元素的颜色特征;
将所述特征向量与特征向量库中的多个待匹配特征向量进行匹配,根据匹配结果确定多个目标待匹配特征向量,其中所述特征向量库是根据所述机器学习模型对修饰素材进行特征提取所获取的特征向量形成的;
根据与各所述目标待匹配特征向量对应的修饰素材确定多个待匹配颜色特征,将所述颜色特征与各所述待匹配颜色特征进行匹配,根据匹配结果确定多个目标修饰素材;
根据所述图像模板、所述目标修饰素材和主体素材生成目标图像。
2.根据权利要求1所述的图像生成方法,其特征在于,所述通过机器学习模型对所述图像模板中的修饰元素进行特征提取以获取与所述修饰元素对应的特征向量,包括:
将所述修饰元素输入至卷积神经网络模型,通过所述卷积神经网络模型对所述修饰元素进行特征提取,以获取与所述修饰元素对应的语义特征、风格特征和形状特征;
将所述语义特征、所述风格特征和所述形状特征按照预设规则整合,以获取所述特征向量。
3.根据权利要求1所述的图像生成方法,其特征在于,所述通过模糊过滤器对所述修饰元素进行特征提取以获取所述修饰元素的颜色特征,包括:
将所述修饰元素的颜色格式转换为HSV格式;
通过第一模糊过滤器对HSV格式的修饰元素进行处理,以获取第一直方图信息;
通过第二模糊过滤器对所述第一直方图信息进行处理,以获取第二直方图信息,并将所述第二直方图信息作为所述颜色特征。
4.根据权利要求1所述的图像生成方法,其特征在于,所述方法还包括:
获取素材库,通过所述机器学习模型对所述素材库中的多个修饰素材分别进行特征提取以获取与各所述修饰素材对应的特征向量,同时通过所述模糊过滤器对各所述修饰素材进行特征提取以获取所述修饰素材的颜色特征;
将与所述修饰素材对应的特征向量作为所述待匹配特征向量,并存入所述特征向量库中;
将所述修饰素材的颜色特征作为所述待匹配颜色特征,并存入颜色特征库中。
5.根据权利要求1所述的图像生成方法,其特征在于,所述将所述特征向量与特征向量库中的多个待匹配特征向量进行匹配,根据匹配结果确定多个目标待匹配特征向量,包括:
计算所述特征向量与各所述待匹配特征向量之间的余弦相似度;
将所述余弦相似度由大到小排序,以形成相似度序列;
从所述相似度序列中依次获取第一数量的相似度,将所述第一数量的相似度对应的待匹配特征向量作为所述目标待匹配特征向量。
6.根据权利要求1所述的图像生成方法,其特征在于,所述将所述颜色特征与各所述待匹配颜色特征进行匹配,根据匹配结果确定多个目标修饰素材,包括:
计算所述颜色特征与各所述待匹配颜色特征之间的距离;
将所述距离由大到小排序,以形成距离序列;
从所述距离序列中依次获取第二数量的距离,获取与所述第二数量的距离对应的目标待匹配颜色特征,并将所述目标待匹配颜色特征对应的修饰素材作为所述目标修饰素材。
7.根据权利要求1所述的图像生成方法,其特征在于,所述根据所述图像模板、所述目标修饰素材和主体素材生成目标图像,包括:
将所述目标修饰素材中的任意一个作为替换修饰素材;
将所述主体素材插入到所述图像模板中的主体素材图片位,采用所述替换修饰素材替换所述修饰元素,并插入到所述图像模板中的修饰素材图片位,以生成所述目标图像。
8.一种图像生成装置,其特征在于,包括:
特征提取模块,用于获取图像模板,通过机器学习模型对所述图像模板中的修饰元素进行特征提取以获取与所述修饰元素对应的特征向量,同时通过模糊过滤器对所述修饰元素进行特征提取以获取所述修饰元素的颜色特征;
第一匹配模块,用于将所述特征向量与特征向量库中的多个待匹配特征向量进行匹配,根据匹配结果确定多个目标待匹配特征向量,其中所述特征向量库是根据所述机器学习模型对修饰素材进行特征提取所获取的特征向量形成的;
第二匹配模块,用于根据与各所述目标待匹配特征向量对应的修饰素材确定多个待匹配颜色特征,将所述颜色特征与各所述待匹配颜色特征进行匹配,根据匹配结果确定多个目标修饰素材;
图像生成模块,用于根据所述图像模板、所述目标修饰素材和主体素材生成目标图像。
9.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1~7中任意一项所述的图像生成方法。
10.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1~7中任意一项所述的图像生成方法。
CN202010118133.4A 2020-02-26 2020-02-26 图像生成方法及装置、计算机可读存储介质、电子设备 Pending CN111353532A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010118133.4A CN111353532A (zh) 2020-02-26 2020-02-26 图像生成方法及装置、计算机可读存储介质、电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010118133.4A CN111353532A (zh) 2020-02-26 2020-02-26 图像生成方法及装置、计算机可读存储介质、电子设备

Publications (1)

Publication Number Publication Date
CN111353532A true CN111353532A (zh) 2020-06-30

Family

ID=71194218

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010118133.4A Pending CN111353532A (zh) 2020-02-26 2020-02-26 图像生成方法及装置、计算机可读存储介质、电子设备

Country Status (1)

Country Link
CN (1) CN111353532A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112489230A (zh) * 2020-12-09 2021-03-12 贝壳技术有限公司 用于面片模型的色彩匹配方法、装置以及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101739697A (zh) * 2008-11-25 2010-06-16 王源源 一种图像马赛克拼图的合成方法及系统
WO2016155382A1 (zh) * 2015-03-31 2016-10-06 百度在线网络技术(北京)有限公司 生成马赛克图像的方法和装置
CN108345624A (zh) * 2017-01-24 2018-07-31 阿里巴巴集团控股有限公司 生成页面的方法及装置
US20190114505A1 (en) * 2016-04-14 2019-04-18 Ader Bilgisayar Hizmetleri Ve Ticaret A.S. Content based search and retrieval of trademark images
WO2019113977A1 (zh) * 2017-12-15 2019-06-20 腾讯科技(深圳)有限公司 文章处理方法、装置、服务器及存储介质
CN110598017A (zh) * 2019-08-29 2019-12-20 杭州光云科技股份有限公司 一种基于自学习的商品详情页的生成方法
CN110659371A (zh) * 2019-08-21 2020-01-07 苏宁云计算有限公司 一种目标对象的banner图的批量自动生成方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101739697A (zh) * 2008-11-25 2010-06-16 王源源 一种图像马赛克拼图的合成方法及系统
WO2016155382A1 (zh) * 2015-03-31 2016-10-06 百度在线网络技术(北京)有限公司 生成马赛克图像的方法和装置
US20190114505A1 (en) * 2016-04-14 2019-04-18 Ader Bilgisayar Hizmetleri Ve Ticaret A.S. Content based search and retrieval of trademark images
CN108345624A (zh) * 2017-01-24 2018-07-31 阿里巴巴集团控股有限公司 生成页面的方法及装置
WO2019113977A1 (zh) * 2017-12-15 2019-06-20 腾讯科技(深圳)有限公司 文章处理方法、装置、服务器及存储介质
CN110659371A (zh) * 2019-08-21 2020-01-07 苏宁云计算有限公司 一种目标对象的banner图的批量自动生成方法及装置
CN110598017A (zh) * 2019-08-29 2019-12-20 杭州光云科技股份有限公司 一种基于自学习的商品详情页的生成方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112489230A (zh) * 2020-12-09 2021-03-12 贝壳技术有限公司 用于面片模型的色彩匹配方法、装置以及存储介质

Similar Documents

Publication Publication Date Title
US10984295B2 (en) Font recognition using text localization
US10699166B2 (en) Font attributes for font recognition and similarity
CN109618222B (zh) 一种拼接视频生成方法、装置、终端设备及存储介质
US9824304B2 (en) Determination of font similarity
EP3657300A2 (en) Real-time gesture detection and recognition
CN111832403A (zh) 文档结构识别方法、文档结构识别的模型训练方法和装置
CN111243061B (zh) 一种商品图片的生成方法、装置、系统
US11934953B2 (en) Image detection apparatus and operation method thereof
CN109255355A (zh) 图像处理方法、装置、终端、电子设备及计算机可读介质
CN112163577A (zh) 游戏画面中的文字识别方法、装置、电子设备和存储介质
CN112016545A (zh) 一种包含文本的图像生成方法及装置
Gu et al. Data driven webpage color design
CN117058271A (zh) 用于生成商品主图背景的方法及计算设备
CN114972847A (zh) 图像处理方法及装置
Jahanian et al. Autonomous color theme extraction from images using saliency
CN114461806A (zh) 广告识别模型的训练方法及装置、广告屏蔽方法
Hegemann et al. CoColor: Interactive Exploration of Color Designs
CN111353532A (zh) 图像生成方法及装置、计算机可读存储介质、电子设备
CN113313066A (zh) 图像识别方法、装置、存储介质以及终端
US20220375223A1 (en) Information generation method and apparatus
Escrivá et al. Learn OpenCV 4 by Building Projects: Build real-world computer vision and image processing applications with OpenCV and C++
CN112862558B (zh) 产品详情页面的生成方法和系统、数据处理方法
CN114283422A (zh) 一种手写字体生成方法、装置、电子设备和存储介质
Kumar et al. A CNN Based Air-Writing Recognition Framework for Linguistic Characters
US20240095982A1 (en) Automated Digital Tool Identification from a Rasterized Image

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20200630