CN110378432B - 图片生成方法、装置、介质及电子设备 - Google Patents

图片生成方法、装置、介质及电子设备 Download PDF

Info

Publication number
CN110378432B
CN110378432B CN201910671103.3A CN201910671103A CN110378432B CN 110378432 B CN110378432 B CN 110378432B CN 201910671103 A CN201910671103 A CN 201910671103A CN 110378432 B CN110378432 B CN 110378432B
Authority
CN
China
Prior art keywords
picture
target
region
sub
background template
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910671103.3A
Other languages
English (en)
Other versions
CN110378432A (zh
Inventor
高鹏程
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
阿里巴巴(中国)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 阿里巴巴(中国)有限公司 filed Critical 阿里巴巴(中国)有限公司
Priority to CN201910671103.3A priority Critical patent/CN110378432B/zh
Publication of CN110378432A publication Critical patent/CN110378432A/zh
Application granted granted Critical
Publication of CN110378432B publication Critical patent/CN110378432B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/14Transformations for image registration, e.g. adjusting or mapping for alignment of images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4038Image mosaicing, e.g. composing plane images from plane sub-images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/32Indexing scheme for image data processing or generation, in general involving image mosaicing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明的实施例提供了一种图片生成方法、装置、介质及电子设备,涉及计算机技术领域。该方法包括:获取目标物品图片,并对所述目标物品图片进行分类处理以确定所述目标物品图片对应的物品姿态数据;根据所述物品姿态数据选取对应的背景模板图片;对所述背景模板图片进行识别处理,确定所述背景模板图片中的目标区域;基于所述目标区域,将所述目标物品图片以及所述背景模板图片进行合并处理以生成所述目标物品图片对应的目标图片。本发明实施例的技术方案能够合理地将目标物品图片与背景模板图片进行合并,提高目标图片的和谐度,提升用户的使用体验。

Description

图片生成方法、装置、介质及电子设备
技术领域
本发明的实施例涉及计算机技术领域,更具体地,本发明的实施例涉及图片生成方法、图片生成装置、计算机可读存储介质以及电子设备。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
随着互联网技术的发展,电子商务平台已经成为人们生活中不可缺少的一部分。横幅图片(Banner)可以是指电子商务平台中展示物品或者物品关联属性信息时的待展示/展示图片。
目前的技术方案中,一般是直接给定一个横幅图片模板,并在横幅图片模板中标注好各元素(例如文案、物品等)对应的位置,在使用时直接进行元素的替换得到新的横幅图片。
发明内容
但是,这种技术方案虽然能够快速生成新的横幅图片,但是由于横幅图片中物品的摆放位置较为固定,没有考虑物品的属性信息(例如大小、形状等),因此通过该技术方案生成的横幅图片中物品与背景在视觉上不和谐(例如直接在固定位置区域摆放物品导致物品“悬空”),导致用户使用体验较差。
因此在现有技术中,难以达到令人满意的横幅图片生成方式。
为此,非常需要一种改进的图片生成方法,以使得能够在快速生产横幅图片的同时,保证横幅图片中的物品与背景相适配(在视觉上和谐美观)。
在本上下文中,本发明的实施例期望提供一种图片生成方法、图片生成装置、计算机可读存储介质以及电子设备。
在本发明实施例的第一方面中,提供了一种图片生成方法,包括:获取目标物品图片,并对所述目标物品图片进行分类处理以确定所述目标物品图片对应的物品姿态数据;根据所述物品姿态数据选取对应的背景模板图片;对所述背景模板图片进行识别处理,确定所述背景模板图片中的目标区域;基于所述目标区域,将所述目标物品图片以及所述背景模板图片进行合并处理以生成所述目标物品图片对应的目标图片。
在本发明的一些实施例中,基于前述方案,所述对所述目标物品图片进行分类处理包括:获取预先训练的物品姿态分类模型;根据所述物品姿态分类模型对所述目标物品图片进行分类处理以确定所述目标物品图片对应的物品姿态数据。
在本发明的一些实施例中,基于前述方案,对所述背景模板图片进行识别处理,确定所述背景模板图片中的目标区域包括:基于所述背景模板图片的语义结构信息,确定所述背景模板图片对应的标注区域;根据所述标注区域在所述背景模板图片上的位置坐标确定所述背景模板图片对应的初始区域;对所述初始区域进行目标检测处理以确定所述背景模板图片中的目标区域。
在本发明的一些实施例中,基于前述方案,对所述初始区域进行目标检测处理以确定所述背景模板图片中的目标区域包括:对所述初始区域进行分割处理以确定所述初始区域对应的子区域集合;根据所述子区域集合确定所述背景模板图片中的目标区域。
在本发明的一些实施例中,基于前述方案,根据所述子区域集合确定所述背景模板图片中的目标区域还包括:计算所述子区域集合中多个子区域对应的最小包围盒;创建目标集合,并将多个所述子区域对应的所述最小包围盒填入所述目标集合以对所述目标集合进行初始化处理。
在本发明的一些实施例中,基于前述方案,根据所述子区域集合确定所述背景模板图片中的目标区域还包括:获取所述子区域集合中的第一子区域,并确定所述第一子区域对应的特征值;在所述子区域集合中确定与所述特征值差值最小的第二子区域,并将所述第一子区域与所述第二子区域进行合并生成第三子区域;计算所述第三子区域对应的最小包围盒,并将所述第三子区域对应的最小包围盒填入所述目标集合。
在本发明的一些实施例中,基于前述方案,在将所述第一子区域与所述第二子区域进行合并生成第三子区域之后,所述方法还包括:将合并后的所述第一子区域以及所述第二子区域从所述子区域集合中进行删除处理。
在本发明的一些实施例中,基于前述方案,根据所述子区域集合确定所述背景模板图片中的目标区域包括:计算所述目标集合中每个所述最小包围盒与所述标注区域的特征差值;根据所述特征差值在所述目标集合中选取符合预设条件的所述最小包围盒,并将选取的所述最小包围盒进行拼接处理以生成所述背景模板图片中的目标区域。
在本发明的一些实施例中,基于前述方案,根据所述物品姿态数据选取对应的背景模板图片包括:根据所述物品姿态数据选取对应的候选背景模板图片;分别计算所述目标物品图片对应的第一平均颜色色相以及所述候选背景模板图片对应的第二平均颜色色相;判断所述第一平均颜色色相以及所述第二平均颜色色相对应在色相环中的角度数据是否满足预设区间;如果所述第一平均颜色色相以及所述第二平均颜色色相对应在所述色相环中的所述角度数据不满足预设区间,则根据所述物品姿态数据重新选取新的所述候选背景模板图片;执行上述循环过程,直到所述角度数据满足预设区间,并将最新选取的所述候选背景模板图片作为所述物品姿态数据对应的所述背景模板图片。
在本发明的一些实施例中,基于前述方案,在生成所述目标物品图片对应的目标图片之后,所述方法还包括:根据预设规则计算所述目标图片对应的低层次数据;通过评分模型对所述目标图片进行评分处理,确定所述目标图片对应的高层次数据;通过所述低层次数据以及所述高层次数据进行计算,确定所述目标图片对应的评分数据以使目标对象通过所述评分数据选取所述目标图片。
在本发明实施例的第二方面中,提供了一种图片生成装置,包括:姿态数据确定模块,用于获取目标物品图片,并对所述目标物品图片进行分类处理以确定所述目标物品图片对应的物品姿态数据;背景模板图片选取模块,用于根据所述物品姿态数据选取对应的背景模板图片;目标区域确定模块,用于对所述背景模板图片进行识别处理,确定所述背景模板图片中的目标区域;目标图片生成模块,用于基于所述目标区域,将所述目标物品图片以及所述背景模板图片进行合并处理以生成所述目标物品图片对应的目标图片。
在本发明的一些实施例中,基于前述方案,所述姿态数据确定模块还包括目标物品图片分类单元,所述目标物品图片分类单元被配置为:获取预先训练的物品姿态分类模型;根据所述物品姿态分类模型对所述目标物品图片进行分类处理以确定所述目标物品图片对应的物品姿态数据。
在本发明的一些实施例中,基于前述方案,所述目标区域确定模块还包括初始区域确定单元,所述初始区域确定单元被配置为:基于所述背景模板图片的语义结构信息,确定所述背景模板图片对应的标注区域;根据所述标注区域在所述背景模板图片上的位置坐标确定所述背景模板图片对应的初始区域;对所述初始区域进行目标检测处理以确定所述背景模板图片中的目标区域。
在本发明的一些实施例中,基于前述方案,所述目标区域确定模块还包括:初始区域分割单元,用于对所述初始区域进行分割处理以确定所述初始区域对应的子区域集合;目标区域确定单元,用于根据所述子区域集合确定所述背景模板图片中的目标区域。
在本发明的一些实施例中,基于前述方案,所述目标区域确定单元还被配置为:计算所述子区域集合中多个子区域对应的最小包围盒;创建目标集合,并将多个所述子区域对应的所述最小包围盒填入所述目标集合以对所述目标集合进行初始化处理。
在本发明的一些实施例中,基于前述方案,所述目标区域确定单元还被配置为:获取所述子区域集合中的第一子区域,并确定所述第一子区域对应的特征值;在所述子区域集合中确定与所述特征值差值最小的第二子区域,并将所述第一子区域与所述第二子区域进行合并生成第三子区域;计算所述第三子区域对应的最小包围盒,并将所述第三子区域对应的最小包围盒填入所述目标集合。
在本发明的一些实施例中,基于前述方案,所述图片生成装置还包括子区域删除单元,所述子区域删除单元被配置为:将合并后的所述第一子区域以及所述第二子区域从所述子区域集合中进行删除处理。
在本发明的一些实施例中,基于前述方案,所述目标区域确定单元还被配置为:计算所述目标集合中每个所述最小包围盒与所述标注区域的特征差值;根据所述特征差值在所述目标集合中选取符合预设条件的所述最小包围盒,并将选取的所述最小包围盒进行拼接处理以生成所述背景模板图片中的目标区域。
在本发明的一些实施例中,基于前述方案,所述背景模板图片选取模块还包括色相判断单元,所述色相判断单元被配置为:根据所述物品姿态数据选取对应的候选背景模板图片;分别计算所述目标物品图片对应的第一平均颜色色相以及所述候选背景模板图片对应的第二平均颜色色相;判断所述第一平均颜色色相以及所述第二平均颜色色相对应在色相环中的角度数据是否满足预设区间;如果所述第一平均颜色色相以及所述第二平均颜色色相对应在所述色相环中的所述角度数据不满足预设区间,则根据所述物品姿态数据重新选取新的所述候选背景模板图片;执行上述循环过程,直到所述角度数据满足预设区间,并将最新选取的所述候选背景模板图片作为所述物品姿态数据对应的所述背景模板图片。
在本发明的一些实施例中,基于前述方案,所述图片生成装置还包括子区域删除单元,所述子区域删除单元被配置为:根据预设规则计算所述目标图片对应的低层次数据;通过评分模型对所述目标图片进行评分处理,确定所述目标图片对应的高层次数据;通过所述低层次数据以及所述高层次数据进行计算,确定所述目标图片对应的评分数据以使目标对象通过所述评分数据选取所述目标图片。
在本发明实施例的第三方面中,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的图片生成方法。
在本发明实施例的第四方面中,提供了一种电子设备,包括:处理器;以及存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如上述第一方面所述的图片生成方法。
根据本发明实施例的技术方案,一方面,检测并识别背景模板图片中的目标区域,基于目标区域将目标物品图片与背景模板图片合并得到目标图片,能够在快速地、精确地合成目标图片的同时,保证目标图片中目标物品图片在背景模板图片中的摆放位置的合理性,提升目标图片的和谐度和美观性;另一方面,在将目标物品图片与背景模板图片合并之前,先对目标物品图片进行分类并确定目标物品图片对应的物品姿态数据,通过物品姿态数据选取对应的背景模板图片,可以确保目标物品图片与背景模板图片的匹配度,进一步提升目标图片的和谐度,提升用户的使用体验。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施例的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施例,其中:
图1示意性示出了根据本发明的一些实施例的示例性应用场景的系统架构的示意框图;
图2示意性地示出了根据本发明的一些实施例的图片生成方法的流程示意图;
图3示意性地示出了根据本发明的一些实施例的目标物品图片对应的物品姿态数据的示意图;
图4示意性地示出了根据本发明的一些实施例的背景模板图片中标注区域的示意图;
图5示意性地示出了根据本发明的一些实施例的根据标注区域确定初始区域的流程示意图;
图6示意性地示出了根据本发明的一些实施例的目标区域检测算法的流程示意图;
图7示意性地示出了根据本发明的一些实施例的检测到的目标区域的示意图;
图8示意性地示出了根据本发明的一些实施例的色相和谐度判定的流程示意图;
图9示意性地示出了根据本发明的一些实施例的根据色相环进行色相和谐度判定的示意图;
图10示意性地示出了根据本发明的一些实施例的图片生成装置的示意框图;
图11示意性地示出了根据本发明的示例实施例的存储介质的示意图;以及
图12示意性地示出了根据发明的示例实施例的电子设备的方框图。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考若干示例性实施例来描述本发明的原理和精神。应当理解,给出这些实施例仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施例是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本领域技术人员知道,本发明的实施例可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
根据本发明的实施例,提出了一种图片生成方法、图片生成装置、介质和电子设备。
在本文中,需要理解的是,所涉及的术语,比如色相可以是指色彩的首要特征,是区别各种不同色彩的最准确的标准数据。色相环(Hue circle)可以是指一种以圆形排列的色相光谱(SPECTRUM),色彩是按照光谱在自然中出现的顺序来排列的。此外,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
下面参考本发明的若干代表性实施例,详细阐释本发明的原理和精神。
发明概述
本发明人发现,现有的横幅图片生成方式一般是直接给定一个横幅图片模板,并在横幅图片模板中标注好各元素(例如文案、物品等)对应的位置,在使用时直接进行元素的替换得到新的横幅图片。这种技术方案虽然能够快速生成新的横幅图片,但是由于横幅图片中物品的摆放位置较为固定,没有考虑物品的属性信息(例如大小、形状等),因此通过该技术方案生成的横幅图片中物品与背景在视觉上不和谐(例如直接在固定位置区域摆放物品导致物品“悬空”),导致用户使用体验较差。
基于上述内容,本发明的基本思想在于,对目标物品图片进行分类处理以确定目标物品图片对应的物品姿态数据;根据物品姿态数据选取对应的背景模板图片;对背景模板图片进行识别处理,确定背景模板图片中的目标区域;基于目标区域,将目标物品图片以及背景模板图片进行合并处理以生成目标物品图片对应的目标图片,从而能够确保目标物品图片与背景模板图片的匹配度,提升生成的目标图片的和谐度,提高目标图片的观赏性,进而提升用户的使用体验。
在介绍了本发明的基本原理之后,下面具体介绍本发明的各种非限制性实施例。
应用场景总览
首先参考图1,图1示出了可以应用本公开实施例的一种图片生成方法及装置的示例性应用场景的系统架构的示意框图。
如图1所示,系统架构100可以包括终端设备101、102、103中的一个或多个,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。终端设备101、102、103可以是具有显示屏的各种电子设备,包括但不限于台式计算机、便携式计算机、智能手机和平板电脑等等。应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。
本公开实施例所提供的图片生成方法一般由服务器105执行,相应地,图片生成装置一般设置于服务器105中。但本领域技术人员容易理解的是,本公开实施例所提供的图片生成方法也可以由终端设备101、102、103执行,相应的,图片生成装置也可以设置于终端设备101、102、103中,本示例性实施例中对此不做特殊限定。举例而言,在一种示例性实施例中,可以是用户通过终端设备101、102、103将目标物品图片上传至服务器105,服务器通过本公开实施例所提供的图片生成方法选取对应的背景模板图片,将目标物品图片与背景模板图片合并生成目标图片,并将目标图片传输给终端设备101、102、103等。
应该理解的是,图1所示的应用场景仅是本发明的实施例可以在其中得以实现的一个示例。本发明实施例的适用范围不受到该应用场景任何方面的限制。
示例性方法
下面结合图1的应用场景,参考图2来描述根据本发明示例性实施例的图片生成方法。需要注意的是,上述应用场景仅是为了便于理解本发明的精神和原理而示出,本发明的实施例在此方面不受任何限制。相反,本发明的实施例可以应用于适用的任何场景。
本公开首先提供了一种图片生成方法,该方法执行主体可以是终端,也可以是服务器,本公开对此不做特殊限定,本示例实施例中以服务器执行该方法为例进行说明。
参照图2所示,在步骤S210中,获取目标物品图片,并对目标物品图片进行分类处理以确定目标物品图片对应的物品姿态数据。
在示例实施例中,目标物品图片可以是指仅包含物品主体的图片,例如参考图3所示,目标物品图片可以是图3中的图片301以及图片302。本示例实施例中目标物品图片可以特指前景部分包含物品主体以及背景部分为透明的图片。当然,目标物品图片还可以是其他包含物品主体的图片,本示例实施例对此不做特殊限定。物品姿态数据可以是指目标物品图片中物品主体对应的摆放姿态,例如物品姿态数据可以是适合平面摆放的姿态(如瓶状容器、书本、图画等适合平面摆放的物品),物品姿态数据还可以是不适合平面摆放的姿态(如项链、吊坠、衣服等适合以模特形式展示的物品),当然,此处仅是示意性说明,本示例实施例对此不做特殊限定。
在步骤S220中,根据物品姿态数据选取对应的背景模板图片。
在示例实施例中,背景模板图片可以是指仅包含背景部分的图片模板。该背景模板图片可以通过添置或者替换其中的部分元素(例如文字信息、摆放物品、颜色纹理等元素)而重复使用,并且背景模板图片可以包含提前标注好的语义结构信息,例如参考图4所示,背景模板图片可以是图片401,该图片401可以包含文字信息区域402、物品摆放区域403等,当然,此处仅是示意性说明,不应对本示例实施例成任何特殊限定。
在步骤S230中,对背景模板图片进行识别处理,确定背景模板图片中的目标区域。
在示例实施例中,识别处理可以是指通过相关目标检测处理方式识别背景模板图片中目标区域的处理过程,例如识别处理可以是通过图像处理算法识别目标区域的处理过程,也可以是通过预训练的目标检测模型识别背景模板图片中的目标区域,本示例实施例对此不做特殊限定。目标区域可以是指在背景模板图片中确定的、用于适配物品摆放姿态的区域。
在步骤S240中,基于所述目标区域,将所述目标物品图片以及所述背景模板图片进行合并处理以生成所述目标物品图片对应的目标图片。
在示例实施例中,合并处理可以是指将目标物品图片以及背景模板图片融合生成目标图片的处理过程,例如合并处理可以是指将目标物品图片作为目标图片的前景部分,将背景模板图片作为目标图片的背景部分进行合并的处理过程,当然此处仅是示意性说明,不应对本示例实施例造成任何限定。目标图片可以是指通过目标物品图片以及背景模板图片进行合并处理生成的图片,例如目标图片可以是横幅图片(Banner)。目标图片可以上传到目标位置(例如WEB中的展示位)进行展示,也可以作为候选数据供用户选择,本示例实施例对此不做特殊限定。
根据图2示例实施例的技术方案,一方面,检测并识别背景模板图片中的目标区域,基于目标区域将目标物品图片与背景模板图片合并得到目标图片,能够在快速地、精确地合成目标图片的同时,保证目标图片中目标物品图片在背景模板图片中的摆放位置的合理性,提升目标图片的和谐度和美观性;另一方面,在将目标物品图片与背景模板图片合并之前,先对目标物品图片进行分类并确定目标物品图片对应的物品姿态数据,通过物品姿态数据选取对应的背景模板图片,可以确保目标物品图片与背景模板图片的匹配度,进一步提升目标图片的和谐度,提升用户的使用体验。
在示例实施例中,获取预先训练的物品姿态分类模型;根据物品姿态分类模型对目标物品图片进行分类处理以确定目标物品图片对应的物品姿态数据。物品姿态分类模型可以是指预先训练的能够对图片进行物品姿态分类的机器学习模型,例如物品姿态分类模型可以是能够对图片进行物品姿态分类的神经网络模型,也可以是决策树模型,本示例实施例对此不做特殊限定。在本示例实施例中,可以通过预先人工标注的样本数据对物品姿态分类模型进行训练,以使训练后的物品姿态分类模型可以识别目标物品图片中物品对应的物品姿态数据,例如继续参考图3所示,目标物品图片301中物品的识别结果可以是适合平面摆放的姿态,则认为该物品适合平面摆放;目标物品图片302中物品的识别结果可以是不适合平面摆放的姿态,则认为该物品不适合平面摆放,本示例实施例对此不做特殊限定。通过物品姿态分类模型确定目标物品图片对应的物品姿态数据,能够减少因人工主观确定物品姿态数据的不确定性,提高识别的准确性,提升识别的效率;而且通过物品姿态分类模型确定的物品姿态数据选取合适的背景模板图片,能够提高生成的目标图片的准确性以及和谐度,提高用户的使用体验。
图5示意性地示出了根据本发明的一些实施例的根据标注区域确定初始区域的流程示意图,参考图5所示,步骤S510,基于所述背景模板图片的语义结构信息,确定所述背景模板图片对应的标注区域。
在示例实施例中,语义结构信息可以是指背景模板图片中的人工标注的结构区域,例如继续参考图4所示,语义结构信息可以是背景模板图片401中的文字信息区域402、物品摆放区域403,本示例实施例对此不做特殊限定。标注区域可以是指背景模板图片中预先人工标注的、摆放目标物品图片中的物品的大致区域,例如继续参考图4所示,标注区域可以是背景模板图片401中的物品摆放区域403,当然,此处仅是示意性说明,不应对本公开造成任何特殊限定。
步骤S520,根据所述标注区域在所述背景模板图片上的位置坐标确定所述背景模板图片对应的初始区域。
在示例实施例中,位置坐标可以是指标注区域的顶点在背景模板图片对应的坐标,根据该位置坐标可以在背景模板图片中确定目标物品图片中的物品摆放的预估位置坐标,进一步地根据该预估位置坐标确定摆放物品的可能区域(初始区域)。初始区域可以是指根据标注区域在背景模板图片上的位置坐标确定的、用于摆放目标物品图片中的物品的可能区域,例如继续参考图4所示,初始区域可以是标注区域403周围一定范围内的所有非标注区域(即初始区域可以是预测的、可能用于摆放物品的区域),当然,此处仅是示意性说明,不应对本公开造成任何特殊限定。
步骤S530,对所述初始区域进行目标检测处理以确定所述背景模板图片中的目标区域。
在示例实施例中,目标检测处理可以是指通过相关目标检测处理方式检测背景模板图片中目标区域的处理过程,例如目标检测处理可以是通过图像处理算法识别目标区域的处理过程,也可以是通过预训练的目标检测模型识别背景模板图片中的目标区域,本示例实施例对此不做特殊限定。通过标注区域初步确定初始区域,然后通过初始区域确定目标区域,能够减少目标检测处理时的运算量,提升目标检测处理的效率。
进一步的,对初始区域进行分割处理以确定初始区域对应的子区域集合;根据子区域集合确定背景模板图片中的目标区域。分割处理可以是指将初始区域分成若干个特定的、具有独特性质的区域的处理过程,例如分割处理可以是通过阈值分割方法处理初始区域,也可以是通过区域分割方法处理初始区域,当然,分割处理还可以是通过边缘分割方法处理初始区域,本示例实施例对此不做特殊限定。子区域集合可以是指将初始区域进行分割得到的若干个小区域构成的集合,通过在子区域集合中寻找并合并特征相近的子区域以逐步找到背景模板图片中的目标区域。通过将初始区域分割为子区域继而确定背景模板图片中的目标区域,能够降低检测目标区域时的计算量,提高服务器或终端的处理效率。
具体的,计算子区域集合中多个子区域对应的最小包围盒;创建目标集合,并将多个子区域对应的最小包围盒填入目标集合以对目标集合进行初始化处理。包围盒(Bounding Box)可以是指一种求解离散点集最优包围空间的算法,基本思想是用体积稍大且特性简单的几何体(称为包围盒)来近似地代替复杂的几何对象。在本示例实施例中,最小包围盒可以特指最小包含子区域形状的水平放置的矩形。目标集合可以是指在进行目标区域检测时创建的用于存储各子区域对应的最小包围盒的集合,在识别目标区域检测前,通过将子区域集合中多个子区域对应的最小包围盒填入目标集合以对目标集合进行初始化处理。
具体的,获取子区域集合中的第一子区域,并确定第一子区域对应的特征值;在子区域集合中确定与第一子区域的特征值差值最小的第二子区域,并将第一子区域与第二子区域进行合并生成第三子区域;计算第三子区域对应的最小包围盒,并将第三子区域对应的最小包围盒填入目标集合。第一子区域可以是指子区域集合中的任一子区域。特征值可以是指表征第一子区域的特征数据,例如特征值可以是第一子区域对应的颜色纹理值,也可以是第一子区域对应的大小形状,当然,特征值还可以是第一子区域对应的颜色色相值,本示例实施例对此不做特殊限定。第二子区域可以是指当前的子区域集合中特征值与第一子区域特征值的差值最小的子区域,与第一子区域特征值的差值最小可以认为是第二子区域与第一子区域在子区域集合中最相似(接近),因此将第一子区域与第二子区域合并成一个区域。第三子区域可以是将特征值较为接近的第一子区域与第二子区域合并后生成的新的区域,且在合并生成第三子区域之后,将该第三子区域填入子区域集合中,以进行进一步的子区域合并过程。通过将子区域集合中的特征值相近的子区域进行合并,并将合并后的新的子区域的最小包围盒填入目标集合,能够完善目标集合中的元素,使通过目标集合确定的目标区域更加准确。
可选的,在将第一子区域与第二子区域进行合并生成第三子区域之后,将第三子区域填入子区域集合,并且将合并后的第一子区域以及第二子区域从子区域集合中进行删除处理。在将合并后的第一子区域以及第二子区域在子区域集合删除之后,重新在子区域集合中选取新的第一子区域(可以认为是随机在子区域集合中获取的子区域)以及与第一子区域特征值相接近的新的第二子区域,将新的第一子区域以及新的第二子区域进行合并生成新的第三子区域,并将新的第三子区域填入子区域集合中,同样地将新的第一子区域以及与新的第一子区域特征值相接近的新的第二子区域在当前子区域集合中进行删除。若子区域集合中的子区域数量大于1,则重复执行该循环过程,直到子区域集合中的子区域数量等于1时结束该循环过程。通过将合并后的第一子区域以及第二子区域从子区域集合中进行删除,能够减少服务器或者终端在判断子区域集合中的特征值接近的子区域数量是否均合并完成的步骤中的运算量,提升合并过程的效率。
需要说明的是,本示例实施例中的“第一”、“第二”、“第三”仅是用于区分子区域集合中特征值不相同的两个子区域,并不应对本示例实施例造成任何特殊限定。
进一步的,计算目标集合中每个最小包围盒与标注区域的特征差值;根据特征差值在目标集合中选取符合预设条件的最小包围盒,并将选取的最小包围盒进行拼接处理以生成背景模板图片中的目标区域。特征差值可以是指标注区域与最小包围盒对应的特征值的差值数据。预设条件可以是指特征差值小于或者等于预设阈值,其中预设阈值根据实际情况而定,本示例实施例对其具体数值不做特殊限定。根据目标集合中每个最小包围盒与标注区域的特征差值选取符合预设条件的最小包围盒(可以认为是在目标集合中选取与标注区域特征值最接近的最小包围盒,而与标注区域特征值最接近的最小包围盒可以表征该区域是与标注区域对应的相邻区域,即标注区域对应目标区域的部分区域),并将选取的最小包围盒进行拼接处理生成目标区域(可以认为是在目标集合中选取与标注区域对应的相邻区域,并将相邻区域进行合并生成标注区域对应的目标区域)。
图6示意性地示出了根据本发明的一些实施例的目标区域检测算法的流程示意图。
参考图6所示,步骤S610,基于背景模板图片中的标注区域检测对应的初始区域,通过图像处理方法(例如图像分割)将初始区域进行分割生成子区域集合,并创建一目标集合(空集);
步骤S620,计算子区域集合中每个子区域对应的最小包围盒,并将每个子区域对应的最小包围盒填入目标集合;
步骤S630,挑选当前子区域集合中特征值差值最小的两个子区域,将该两个子区域进行合并生成新的子区域后,将该新的子区域填入子区域集合中并计算该新的子区域对应的最小包围盒,将该最小包围盒填入到目标集合中以对目标集合中的元素进行扩充,同时将合并后的两个子区域从子区域集合中进行删除;
步骤S640,判断当前子区域集合中的子区域数量是否等于1,若判定当前子区域集合中的子区域数量等于1则执行步骤S650,否则执行步骤S630;
步骤S650,选取目标集合中符合预设条件的最小包围盒,并将最小包围盒对应的区域进行拼接处理得到背景模板图片中的目标区域。
图7示意性地示出了根据本发明的一些实施例的检测到的目标区域的示意图,参考图7所示,其中区域704即通过标注区域403确定的目标区域。
图8示意性地示出了根据本发明的一些实施例的色相和谐度判定的流程示意图。
参考图8所示,步骤S810,根据所述物品姿态数据选取对应的候选背景模板图片。
在示例实施例中,候选背景模板图片可以是指目标物品图片的物品姿态数据对应的多个背景模板图片,候选背景模板图片可以预先存储在背景模板图片库中,根据物品姿态数据在该背景模板图片库中选取相应的候选背景模板图片。根据步骤S820至步骤S840的对选取的候选背景模板图片进行筛选,直到找到满足条件的候选背景模板图片,并将该候选背景模板图片作为最终进行合并的背景模板图片。
步骤S820,分别计算所述目标物品图片对应的第一平均颜色色相以及所述候选背景模板图片对应的第二平均颜色色相。
在示例实施例中,色相可以是指色彩的首要特征,是区别各种不同色彩的最准确的标准数据。平均颜色色相可以是指图片中不同颜色的色相值的平均值,在色相和谐理论中可以通过平均颜色色相评判图片或者区域之间是否颜色和谐。第一平均颜色色相可以是指目标物品图片对应的平均颜色色相,第二平均颜色色相可以是指候选背景模板图片对应的平均颜色色相。
需要说明的是,本示例实施例中的“第一”、“第二”仅是用于区分目标物品图片以及背景模板图片对应的平均颜色色相,并不应对本示例实施例造成任何特殊限定。
步骤S830,判断所述第一平均颜色色相以及所述第二平均颜色色相对应在色相环中的角度数据是否满足预设区间。
在示例实施例中,色相环(Hue circle)可以是指一种以圆形排列的色相光谱(SPECTRUM),色彩是按照光谱在自然中出现的顺序来排列的,例如参考图9所示,圆环901可以表示色相环。角度数据可以是指第一平均颜色色相以及第二平均颜色色相分别对应在色相环中之间的角度,例如继续参考图9所示,其中色相环中的角度线902可以表示第一平均颜色色相对应在色相环中的颜色值,角度线903可以表示第二平均颜色色相对应在色相环中的颜色值,角度线902与角度线903之间的角度可以表示第一平均颜色色相以及第二平均颜色色相对应在色相环中的角度数据。预设区间可以是指预先设置的角度区间,例如预设区间可以是角度数据在15°至30°之间,具体数值可以根据实际情况而定或者由用户自定义设置,本示例实施例对此不做特殊限定。
步骤S840,如果第一平均颜色色相以及第二平均颜色色相对应在色相环中的角度数据不满足预设区间,则根据物品姿态数据重新选取新的候选背景模板图片。
在示例实施例中,如果判定第一平均颜色色相以及第二平均颜色色相对应在色相环中的角度数据不满足预设区间,则认为第一平均颜色色相对应的目标物品图片与第二平均颜色色相对应的候选背景模板图片的颜色不和谐,该候选背景模板图片不适合与目标物品图片进行合并,因此需要在背景模板图片库中选取新的候选背景模板图片(即进入循环过程中的步骤S810)。
步骤S850,执行步骤S810至步骤S820的循环过程,直到角度数据满足预设区间,并将最新选取的候选背景模板图片作为目标物品图片的物品姿态数据对应的背景模板图片。
在示例实施例中,如果判定第一平均颜色色相以及第二平均颜色色相对应在色相环中的角度数据满足预设区间,则认为第一平均颜色色相对应的目标物品图片与第二平均颜色色相对应的候选背景模板图片的颜色和谐,因此将该候选背景模板图片作为最终的背景模板图片并与目标物品图片进行合并。
通过选取与目标物品图片的平均颜色色相的角度数据在预设区间的背景模板图片,能够进一步提高生成的目标图片的和谐度,提升目标图片的观赏性,提高用户的使用体验。
可选的,在生成目标物品图片对应的目标图片之后,根据预设规则计算目标图片对应的低层次数据;通过评分模型对目标图片进行评分处理,确定目标图片对应的高层次数据;通过低层次数据以及高层次数据进行计算,确定目标图片对应的评分数据以使目标对象通过评分数据选取目标图片。低层次数据可以是指目标图片对应的底层结构数据,例如低层次数据可以是目标图片中的文字信息整齐度,也可以是目标图片中的文字信息的间距值,当然,低层次数据还可以是文字区域面积的重叠程度,本示例实施例对此不做特殊限定。举例而言,根据预设规则计算目标图片对应的低层次数据可以如关系式(1)所示:
Score txt=a*aligned+b*gap min/gap max+c*(1-area intersection/areaunion)(1)
其中,a,b,c∈[0,1]且a+b+c=1,a,b,c的数值具体根据实际情况而定或者由用户自定义设置,本示例实施例对此不做特殊限定,Score txt可以表示目标图片对应的低层次数据,aligned可以表示目标图片中的文字信息整齐度,aligned∈{0,1},gap min以及gapmax分别表示目标图片中的文字信息的间距最大值以及间距最小值,area intersection以及area union分别表示文字区域面积的交集以及并集。评分模型可以是指预先训练的、对目标图片的整体语义风格进行评分的监督学习模型,例如评分模型可以是预先训练的卷积神经网络(Convolutional Neural Networks,CNN)模型。优选的,可以以样本目标图片为输入,以人工打标得分为标签数据,使用预先训练的卷积神经网络模型进行迁移学习。高层次数据可以是指通过评分模型确定的目标图片对应的语义风格得分,例如,通过评分模型输出最终目标图片对应的高层次数据(风格分数)为Score style∈[0,1]。评分数据可以是指通过低层次数据以及高层次数据计算得到的目标图片的最终得分,例如评分数据可以如关系式(2)所示:
Score banner =x*Score txt +y*Score style (2)
其中,x,y∈[0,1]且x+y=1,x,y的数值具体根据实际情况而定或者由用户自定义设置,本示例实施例对此不做特殊限定,Score banner可以表示目标图片的评分数据。目标对象可以是指通过评分数据选择生成的目标图片的对象,例如目标对象可以是需要目标图片的客户(公司)或者请求展示目标图片的对象,本示例实施例对此不做特殊限定。通过评分模型对生成目标图片进行打分,使目标对象能够根据评分数据选取适合的目标图片,提升用户的使用体验。
示例性装置
在介绍了本发明示例性实施例的方法之后,接下来,参考图10对本发明示例性实施例的图片生成装置。
在图10中,图片生成装置1000可以包括:姿态数据确定模块1010、背景模板图片选取模块1020、目标区域确定模块1030以及目标图片生成模块1040。其中:姿态数据确定模块1010用于获取目标物品图片,并对所述目标物品图片进行分类处理以确定所述目标物品图片对应的物品姿态数据;背景模板图片选取模块1020用于根据所述物品姿态数据选取对应的背景模板图片;目标区域确定模块1030用于对所述背景模板图片进行识别处理,确定所述背景模板图片中的目标区域;目标图片生成模块1040用于基于所述目标区域,将所述目标物品图片以及所述背景模板图片进行合并处理以生成所述目标物品图片对应的目标图片。
在本发明的一些实施例中,基于前述方案,所述姿态数据确定模块1010还包括目标物品图片分类单元,所述目标物品图片分类单元被配置为:获取预先训练的物品姿态分类模型;根据所述物品姿态分类模型对所述目标物品图片进行分类处理以确定所述目标物品图片对应的物品姿态数据。
在本发明的一些实施例中,基于前述方案,所述目标区域确定模块1030还包括初始区域确定单元,所述初始区域确定单元被配置为:基于所述背景模板图片的语义结构信息,确定所述背景模板图片对应的标注区域;根据所述标注区域在所述背景模板图片上的位置坐标确定所述背景模板图片对应的初始区域;对所述初始区域进行目标检测处理以确定所述背景模板图片中的目标区域。
在本发明的一些实施例中,基于前述方案,所述目标区域确定模块1030还包括:初始区域分割单元,用于对所述初始区域进行分割处理以确定所述初始区域对应的子区域集合;目标区域确定单元,用于根据所述子区域集合确定所述背景模板图片中的目标区域。
在本发明的一些实施例中,基于前述方案,所述目标区域确定单元还被配置为:计算所述子区域集合中多个子区域对应的最小包围盒;创建目标集合,并将多个所述子区域对应的所述最小包围盒填入所述目标集合以对所述目标集合进行初始化处理。
在本发明的一些实施例中,基于前述方案,所述目标区域确定单元还被配置为:获取所述子区域集合中的第一子区域,并确定所述第一子区域对应的特征值;在所述子区域集合中确定与所述特征值差值最小的第二子区域,并将所述第一子区域与所述第二子区域进行合并生成第三子区域;计算所述第三子区域对应的最小包围盒,并将所述第三子区域对应的最小包围盒填入所述目标集合。
在本发明的一些实施例中,基于前述方案,所述图片生成装置1000还包括子区域删除单元,所述子区域删除单元被配置为:将合并后的所述第一子区域以及所述第二子区域从所述子区域集合中进行删除处理。
在本发明的一些实施例中,基于前述方案,所述目标区域确定单元还被配置为:计算所述目标集合中每个所述最小包围盒与所述标注区域的特征差值;根据所述特征差值在所述目标集合中选取符合预设条件的所述最小包围盒,并将选取的所述最小包围盒进行拼接处理以生成所述背景模板图片中的目标区域。
在本发明的一些实施例中,基于前述方案,所述背景模板图片选取模块1020还包括色相判断单元,所述色相判断单元被配置为:根据所述物品姿态数据选取对应的候选背景模板图片;分别计算所述目标物品图片对应的第一平均颜色色相以及所述候选背景模板图片对应的第二平均颜色色相;判断所述第一平均颜色色相以及所述第二平均颜色色相对应在色相环中的角度数据是否满足预设区间;如果所述第一平均颜色色相以及所述第二平均颜色色相对应在所述色相环中的所述角度数据不满足预设区间,则根据所述物品姿态数据重新选取新的所述候选背景模板图片;执行上述循环过程,直到所述角度数据满足预设区间,并将最新选取的所述候选背景模板图片作为所述物品姿态数据对应的所述背景模板图片。
在本发明的一些实施例中,基于前述方案,所述图片生成装置1000还包括子区域删除单元,所述子区域删除单元被配置为:根据预设规则计算所述目标图片对应的低层次数据;通过评分模型对所述目标图片进行评分处理,确定所述目标图片对应的高层次数据;通过所述低层次数据以及所述高层次数据进行计算,确定所述目标图片对应的评分数据以使目标对象通过所述评分数据选取所述目标图片。
在本发明实施例的第三方面中,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的图片生成方法。
示例性介质
在介绍了本发明示例性实施例的装置之后,接下来,对本发明示例性实施例的存储介质进行说明。
在一些实施例中,本发明的各个方面还可以实现为一种介质,其上存储有程序代码,当所述程序代码被设备的处理器执行时用于实现本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施例的数据生产方法中的步骤。
例如,所述设备的处理器执行所述程序代码时可以实现如图2中所述的步骤S210,获取目标物品图片,并对所述目标物品图片进行分类处理以确定所述目标物品图片对应的物品姿态数据;步骤S220,根据所述物品姿态数据选取对应的背景模板图片;步骤S230,对所述背景模板图片进行识别处理,确定所述背景模板图片中的目标区域;步骤S240,基于所述目标区域,将所述目标物品图片以及所述背景模板图片进行合并处理以生成所述目标物品图片对应的目标图片。
参考图11所示,描述了根据本发明的实施例的用于实现上述图片生成方法的程序产品1100,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备。
示例性计算设备
在介绍了本发明示例性实施例的图片生成方法、图片生成装置以及存储介质之后,接下来,介绍根据本发明的示例性实施例的电子设备。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施例、完全的软件实施例(包括固件、微代码等),或硬件和软件方面结合的实施例,这里可以统称为“电路”、“模块”或“系统”。
在一些可能的实施例中,根据本发明的电子设备可以至少包括至少一个处理单元、以及至少一个存储单元。其中,所述存储单元存储有程序代码,当所述程序代码被所述处理单元执行时,使得所述处理单元执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施例的数据生产方法中的步骤。例如,所述处理单元可以执行如图2中所示的步骤S210,获取目标物品图片,并对所述目标物品图片进行分类处理以确定所述目标物品图片对应的物品姿态数据;步骤S220,根据所述物品姿态数据选取对应的背景模板图片;步骤S230,对所述背景模板图片进行识别处理,确定所述背景模板图片中的目标区域;步骤S240,基于所述目标区域,将所述目标物品图片以及所述背景模板图片进行合并处理以生成所述目标物品图片对应的目标图片。
下面参照图12来描述根据本发明的示例实施例的电子设备1200。图12所示的电子设备1200仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图12所示,电子设备1200以通用计算设备的形式表现。电子设备1200的组件可以包括但不限于:上述至少一个处理单元1201、上述至少一个存储单元1202、连接不同系统组件(包括存储单元1202和处理单元1201)的总线1203、显示单元。
总线1203表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器、外围总线、图形加速端口、处理器或者使用多种总线结构中的任意总线结构的局域总线。
存储单元1202可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)1221和/或高速缓存存储器1222,还可以进一步包括只读存储器(ROM)1223。
存储单元1202还可以包括具有一组(至少一个)程序模块1224的程序/实用工具1225,这样的程序模块1224包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
电子设备1200也可以与一个或多个外部设备1204(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与电子设备1200交互的设备通信,和/或与使得电子设备1200能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1205进行。并且,电子设备1200还可以通过网络适配器1206与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器1206通过总线1203与电子设备1200的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备1200使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了图片生成装置的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施例,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
虽然已经参考若干具体实施例描述了本发明的精神和原理,但是应该理解,本发明并不限于所公开的具体实施例,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims (10)

1.一种图片生成方法,其特征在于,包括:
获取目标物品图片,并对所述目标物品图片进行分类处理以确定所述目标物品图片对应的物品姿态数据;
根据所述物品姿态数据选取对应的背景模板图片;
对所述背景模板图片进行识别处理,确定所述背景模板图片中的目标区域;
基于所述目标区域,将所述目标物品图片以及所述背景模板图片进行合并处理以生成所述目标物品图片对应的目标图片;
其中,所述目标区域表征为适配所述物品姿态数据的区域。
2.根据权利要求1所述的图片生成方法,其特征在于,所述对所述目标物品图片进行分类处理包括:
获取预先训练的物品姿态分类模型;
根据所述物品姿态分类模型对所述目标物品图片进行分类处理以确定所述目标物品图片对应的物品姿态数据。
3.根据权利要求1所述的图片生成方法,其特征在于,对所述背景模板图片进行识别处理,确定所述背景模板图片中的目标区域包括:
基于所述背景模板图片的语义结构信息,确定所述背景模板图片对应的标注区域;
根据所述标注区域在所述背景模板图片上的位置坐标确定所述背景模板图片对应的初始区域;
对所述初始区域进行目标检测处理以确定所述背景模板图片中的目标区域。
4.根据权利要求3所述的图片生成方法,其特征在于,对所述初始区域进行目标检测处理以确定所述背景模板图片中的目标区域包括:
对所述初始区域进行分割处理以确定所述初始区域对应的子区域集合;
根据所述子区域集合确定所述背景模板图片中的目标区域。
5.根据权利要求4所述的图片生成方法,其特征在于,根据所述子区域集合确定所述背景模板图片中的目标区域还包括:
计算所述子区域集合中多个子区域对应的最小包围盒;
创建目标集合,并将多个所述子区域对应的所述最小包围盒填入所述目标集合以对所述目标集合进行初始化处理。
6.根据权利要求5所述的图片生成方法,其特征在于,根据所述子区域集合确定所述背景模板图片中的目标区域还包括:
获取所述子区域集合中的第一子区域,并确定所述第一子区域对应的特征值;
在所述子区域集合中确定与所述特征值差值最小的第二子区域,并将所述第一子区域与所述第二子区域进行合并生成第三子区域;
计算所述第三子区域对应的最小包围盒,并将所述第三子区域对应的最小包围盒填入所述目标集合。
7.根据权利要求6所述的图片生成方法,其特征在于,根据所述子区域集合确定所述背景模板图片中的目标区域包括:
计算所述目标集合中每个所述最小包围盒与所述标注区域的特征差值;
根据所述特征差值在所述目标集合中选取符合预设条件的所述最小包围盒,并将选取的所述最小包围盒进行拼接处理以生成所述背景模板图片中的目标区域。
8.一种图片生成装置,其特征在于,包括:
姿态数据确定模块,用于获取目标物品图片,并对所述目标物品图片进行分类处理以确定所述目标物品图片对应的物品姿态数据;
背景模板图片选取模块,用于根据所述物品姿态数据选取对应的背景模板图片;
目标区域确定模块,用于对所述背景模板图片进行识别处理,确定所述背景模板图片中的目标区域;
目标图片生成模块,用于基于所述目标区域,将所述目标物品图片以及所述背景模板图片进行合并处理以生成所述目标物品图片对应的目标图片;
其中,所述目标区域表征为适配所述物品姿态数据的区域。
9.一种电子设备,其特征在于,包括:
处理器;以及
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如权利要求1至7中任意一项所述的图片生成方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的图片生成方法。
CN201910671103.3A 2019-07-24 2019-07-24 图片生成方法、装置、介质及电子设备 Active CN110378432B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910671103.3A CN110378432B (zh) 2019-07-24 2019-07-24 图片生成方法、装置、介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910671103.3A CN110378432B (zh) 2019-07-24 2019-07-24 图片生成方法、装置、介质及电子设备

Publications (2)

Publication Number Publication Date
CN110378432A CN110378432A (zh) 2019-10-25
CN110378432B true CN110378432B (zh) 2022-04-12

Family

ID=68255436

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910671103.3A Active CN110378432B (zh) 2019-07-24 2019-07-24 图片生成方法、装置、介质及电子设备

Country Status (1)

Country Link
CN (1) CN110378432B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111583168A (zh) * 2020-06-18 2020-08-25 上海眼控科技股份有限公司 图像合成方法、装置、计算机设备和存储介质
CN112489129A (zh) * 2020-12-18 2021-03-12 深圳市优必选科技股份有限公司 位姿识别模型训练方法、装置、位姿识别方法和终端设备
CN112748978A (zh) * 2020-12-31 2021-05-04 北京达佳互联信息技术有限公司 显示区域确定方法、装置及相关设备
CN113160341B (zh) * 2021-04-27 2022-11-25 中国科学院自动化研究所 一种含有目标物品的x光图像生成方法、系统及设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014120395A1 (en) * 2013-02-04 2014-08-07 Facebook, Inc. Third-party sourcing advertisements from a social networking system
CN105139337A (zh) * 2015-09-10 2015-12-09 北京金山安全软件有限公司 一种图片生成方法及装置
CN107622518A (zh) * 2017-09-20 2018-01-23 广东欧珀移动通信有限公司 图片合成方法、装置、设备及存储介质
CN107808373A (zh) * 2017-11-15 2018-03-16 北京奇虎科技有限公司 基于姿态的样本图像合成方法、装置及计算设备
CN109271604A (zh) * 2018-09-27 2019-01-25 北京奇虎科技有限公司 一种广告布局方法、装置及计算机设备
CN109697445A (zh) * 2017-10-23 2019-04-30 北京京东尚科信息技术有限公司 图片处理方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070219857A1 (en) * 2006-03-14 2007-09-20 Seymour Jonathan C System and method for advertising and selling products and services over a decentralized network

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014120395A1 (en) * 2013-02-04 2014-08-07 Facebook, Inc. Third-party sourcing advertisements from a social networking system
CN105139337A (zh) * 2015-09-10 2015-12-09 北京金山安全软件有限公司 一种图片生成方法及装置
CN107622518A (zh) * 2017-09-20 2018-01-23 广东欧珀移动通信有限公司 图片合成方法、装置、设备及存储介质
CN109697445A (zh) * 2017-10-23 2019-04-30 北京京东尚科信息技术有限公司 图片处理方法和装置
CN107808373A (zh) * 2017-11-15 2018-03-16 北京奇虎科技有限公司 基于姿态的样本图像合成方法、装置及计算设备
CN109271604A (zh) * 2018-09-27 2019-01-25 北京奇虎科技有限公司 一种广告布局方法、装置及计算机设备

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Layout Style Modeling for Automating Banner Design;Yunke Zhang 等;《Thematic Workshops "17: Proceedings of the on Thematic Workshops of ACM Multimedia 2017》;20171031;第451-459页 *
基于深度学习的目标检测算法研究;李明攀;《中国优秀硕士论文电子期刊 信息科技辑》;20181215;正文第40-42页 *
电商场景下的复杂横幅广告参数化设计系统研究;王奇峰;《中国优秀硕士论文电子期刊网 哲学与人文科学辑》;20190115;正文第1-57页 *

Also Published As

Publication number Publication date
CN110378432A (zh) 2019-10-25

Similar Documents

Publication Publication Date Title
CN110378432B (zh) 图片生成方法、装置、介质及电子设备
US9349076B1 (en) Template-based target object detection in an image
US20230136913A1 (en) Generating object masks of object parts utlizing deep learning
US10762678B2 (en) Representing an immersive content feed using extended reality based on relevancy
US11704357B2 (en) Shape-based graphics search
CN114155543A (zh) 神经网络训练方法、文档图像理解方法、装置和设备
CN111598164A (zh) 识别目标对象的属性的方法、装置、电子设备和存储介质
CN113344055A (zh) 图像识别方法、装置、电子设备和介质
JP2019133620A (ja) イメージ内の複数の客体の調和に基づく調和検索方法、コンピュータ装置およびコンピュータプログラム
US20230237777A1 (en) Information processing apparatus, learning apparatus, image recognition apparatus, information processing method, learning method, image recognition method, and non-transitory-computer-readable storage medium
CN113780098A (zh) 文字识别方法、装置、电子设备以及存储介质
US8564594B2 (en) Similar shader search apparatus and method using image feature extraction
CN111738252B (zh) 图像中的文本行检测方法、装置及计算机系统
US11989628B2 (en) Machine teaching complex concepts assisted by computer vision and knowledge reasoning
US20240095782A1 (en) Artificial intelligence machine learning system for classifying images and producing a predetermined visual output
CN109697722B (zh) 用于生成三分图的方法及装置
CN113378958A (zh) 自动标注方法、装置、设备、存储介质及计算机程序产品
CN113837194A (zh) 图像处理方法、图像处理装置、电子设备以及存储介质
US10627984B2 (en) Systems, devices, and methods for dynamic virtual data analysis
CN112070093A (zh) 生成图像分类模型的方法、图像分类方法、装置和设备
CN115809325B (zh) 文档处理模型训练方法、文档处理方法、装置及设备
US20240119732A1 (en) Operation Management System Utilizing a Wearable Device
CN113110782B (zh) 图像的识别方法、装置、计算机设备及存储介质
US11615618B2 (en) Automatic image annotations
CN114139701A (zh) 一种用于边界线提取的神经网络模型训练方法及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20191106

Address after: 310012 G building, 10 floor, A building, Paradise Software Park, 3 West Road, Hangzhou, Xihu District, Zhejiang

Applicant after: Alibaba (China) Co., Ltd.

Address before: Hangzhou City, Zhejiang province 310051 Binjiang District River Street No. 1786 Jianghan Road Longsheng Building Room 803

Applicant before: Netease Koala (Hangzhou) Technology Co., Ltd.

GR01 Patent grant
GR01 Patent grant