WO2024051632A1

WO2024051632A1 - 图像处理方法、装置、介质及设备

Info

Publication number: WO2024051632A1
Application number: PCT/CN2023/116675
Authority: WO
Inventors: 詹科; 刘银星; 张政; 吕晶晶; 王维珍; 阮涛
Original assignee: 北京沃东天骏信息技术有限公司
Priority date: 2022-09-09
Filing date: 2023-09-04
Publication date: 2024-03-14
Also published as: CN115564976A

Abstract

一种图像处理方法、装置、介质及设备。该方法包括：基于目标图像尺寸，确定与所述目标图像尺寸相匹配的基础图像（S110）；提取所述基础图像中的图像元素（S120）；基于所述目标图像尺寸和基础图像尺寸的尺寸差异，以及每个图像元素的形变类型，确定每个图像元素的处理方式，并基于确定的处理方式对所述图像元素进行处理，得到处理后的图像元素（S130）；将处理后的图像元素进行拼接，得到目标图像（S140）。

Description

图像处理方法、装置、介质及设备

本申请要求在2022年9月9日提交中国专利局、申请号为202211104066.6的中国专利申请的优先权，该申请的全部内容通过引用结合在本申请中。

技术领域

本申请实施例涉及图像处理技术领域，例如涉及一种图像处理方法、装置、介质及设备。

背景技术

目前对于图片尺寸扩展的方法主要是通过对原图片的裁剪处理，从而实现图片尺寸的扩展；即先根据当前宽、高与目标尺寸的宽、高计算出两个缩放比，根据较大的那个比例等比缩放，这样新图片会比目标尺寸在宽或者高上有冗余的空间，然后找出上下左右边界中不重要的部分剪裁掉，得到裁剪后的目标图片。

上述图片尺寸扩展方式在实施的过程中会发现：当原图尺寸与目标图的尺寸差异较大时，基于剪裁的方法需要剪裁很大一部分，会裁掉关键区域，比如文字、商品，导致图像丢失了关键数据；以及在对原始图进行拉伸的过程中，导致图像变形验证，降低了视觉效果的协调性。

发明内容

本申请提供了一种图像处理方法、装置、介质及设备，以实现在对图像进行图像裂变处理的过程中，在不丢失图像关键信息的情况下，提高在展示过程中的视觉效果的协调性。

根据本申请的一方面，提供了一种图像处理方法，该方法包括：

基于目标图像尺寸，确定与所述目标图像尺寸相匹配的基础图像；

提取所述基础图像中的图像元素；

基于所述目标图像尺寸和基础图像尺寸的尺寸差异，以及每个图像元素的形变类型，确定每个图像元素的处理方式，并基于确定的处理方式对所述图像元素进行处理，得到处理后的图像元素；

将处理后的图像元素进行拼接，得到目标图像。

根据本申请的另一方面，提供了一种图像处理装置，该装置包括：

基础图像确定模块，设置为基于目标图像尺寸，确定与所述目标图像尺寸相匹配的基础图像；

图像元素提取模块，设置为提取所述基础图像中的图像元素；

图像元素处理模块，设置为基于所述目标图像尺寸和基础图像尺寸的尺寸差异，以及每个图像元素的形变类型，确定每个图像元素的处理方式，并基于确定的处理方式对所述图像元素进行处理，得到处理后的图像元素；

目标图像生成模块，设置为将处理后的图像元素进行拼接，得到目标图像。

根据本申请的另一方面，提供了一种电子设备，所述电子设备包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行本申请任一实施例所述的图像处理方法。

根据本申请的另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使处理器执行时实现本申请任一实施例所述的图像处理方法。

附图说明

图1是本申请实施例提供的一种图像处理方法的流程示意图；

图2是本申请实施例提供的另一种图像处理方法的流程示意图；

图3是本申请实施例提供的另一种图像处理方法的流程示意图；

图4是本申请实施例提供的一种图像处理装置的结构示意图；

图5是本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

图1为本申请实施例提供的一种图像处理方法的流程图，本实施例可适用于对图像尺寸进行修改的情况，该方法可以由图像处理装置来执行，该布控装置可以由软件和/或硬件来实现，该布控装置可以配置在电子计算设备上，包括如下步骤：

步骤110、基于目标图像尺寸，确定与目标图像尺寸相匹配的基础图像。

步骤120、提取基础图像中的图像元素。

步骤130、基于目标图像尺寸和基础图像尺寸的尺寸差异，以及每个图像元素的形变类型，确定每个图像元素的处理方式，并基于确定的处理方式对图像元素进行处理，得到处理后的图像元素。

步骤140、将处理后的图像元素进行拼接，得到目标图像。

在本申请实施例中，目标图像可以理解为需要在预设展示位置进行展示的图像。例如，目标图像可以是展示在当前界面中预设广告推广位进行推广的广告图像；当然目标图像还可以是展示在预设公告位置的公告图像，本实施例对目标图像的图像类型和图像展示位置不作限制。在上述基础上，不同展示位置的展示尺寸不同，相应的会导致同一基础图像在不同展示位置进行展示时的目标图像尺寸不相同；例如在商场外墙展示的海报图像和在公交车展示屏中播放的同一海报图像的目标图像尺寸不相同。为了使基础图像适应在不同展示位置的目标图像尺寸，需要对基础图像进行图像裂变处理，即对图像的尺寸进行扩展处理，从而使裂变得到的目标图像与其所在展示位匹配，从而提高图像在展示过程中的视觉效果的协调性。

需要说明的是，目标图像尺寸可以是基于目标图像在展示时的展示尺寸所确定，为了提高视觉效果的协调性，本实施例中预先设置目标图像尺寸与展示位的展示尺寸保持一致。基础图像可以理解为目标图像裂变之前的图像，换言之，还可以解释为：为了匹配不同的展示位置，预先对同一基础图像设置不同的图像比例；对于任一基础图像，若该基础图像的图像比例与展示位置的尺寸比例一致，则确定该基础图像的图像尺寸，若图像尺寸与展示尺寸一致，则直接将该基础图像作为目标图像在展示位置进行展示；相反的，若该基础图像的图像比例与展示位置的尺寸比例不一致时，则选取与展示位置的尺寸比例最接近的图像比例，并基于两个比例的尺寸差异对该基础图像尺寸进行相应的图像裂变处理，得到该基础图像对应的目标图像在展示位置进行展示。本实施例中，基础图像的图像比例可以包括但不限于3：1、2：1、1：1、1.2：1和0.5：1。图像裂变处理包括图像等比例缩放处理和图像再宽度上和/或在高度上的拉伸处理。

示例性的，获取展示位置的展示尺寸，基于该展示尺寸确定待展示的目标图像的目标图像尺寸，并基于目标图像尺寸所对应的图像比例，确定与目标图像尺寸相匹配的基础图像。其中，相匹配可以理解为目标图像尺寸所对应的图像比例与基础图像的图像比例相等或者目标图像尺寸所对应的图像比例与基础图像的图像比例的差值在预设比例范围内。

示例性的，若确定目标图像尺寸为1000mm*1300mm，相应的可以确定目标图像尺寸对应的图像比例为1:1.3。确定预先设置的基础图像的多个图像比例中是否存在与目标图像尺寸所对应的图像比例一致的图像比例，在预先设置的基础图像的多个图像比例中不存在与目标图像尺寸所对应的图像比例一致的图像比例的情况下，选取与目标图像尺寸的图像比例最接近的图像比例，即本实施例中最接近的图像比例为1:1.2，则该图像比例对应的基础图像则为与目标图像尺寸相匹配的基础图像。

在上述实施例的基础上，对基础图像进行图像裂变处理后得到目标图像，为了提高目标图像中的各图像元素在展示过程中的视觉效果的协调性，需要对基础图像中的图像元素进行提取，并基于目标图像的目标图像尺寸对提取出的图像元素进行重新布局。

本实施例中，图像元素可以理解为基础图像中的图像内容，不同的图像内容所属的元素类型不同。例如，广告图像中的图像元素可以包括logo元素、商品元素、文案元素、人脸元素和人体元素等元素；公告图像中的图像元素可以包括公章元素和文字元素等元素。

可选的，可以基于用户分别触发的对各图像元素的选取指令，确定基础图像中的各图像元素，当然还可以是将基础图像分别输入至各图像元素提取模型中，得到各元素提取模型分别输出的图像元素提取结果。在识别图像元素的过程中，需要识别出各图像元素的元素类型以及元素位置。

示例性的，在用户对当前基础图像进行图像元素选取的过程中，接收用户触发的选取指令确定对应的选取结果。例如，用户触发对商品元素的框选，并输入对应的元素类型为商品元素，则确定用户框选的元素为商品元素，框选的位置区域为商品元素所在的位置。

示例性的，基于预先设定的各元素类型，获取各元素类型分别对应的元素识别模型，例如，各元素识别模型包括但不限于logo元素识别模型、商品元素识别模型、文案元素识别模型、人脸元素识别模型和人体元素识别模型等元素识别模型。将基础图像分别输入至各元素识别模型中，分别得到各元素识别模型所输出的识别结果。以商品元素识别模型为例，将基础图像输入至该商品元素识别模型中，得到该商品元素识别模型输出的元素结果。可选的，元素识别结果可以是分类结果，即当输出结果为1时，则说明该基础图像中包含有商品元素，并且同时输出该商品元素的所在位置，例如输出商品元素在基础图像中所覆盖的图像像素点。当然还可以直接输出基础图像的热图，该热图中商品元素的像素值区别于其他元素，从而可以识别出基础图像中是否存在商品元素，以及存在商品元素时商品元素在基础图像中的位置。

在一些实施例中，在采用各元素识别模型进行元素识别之前，先对各元素识别模型进行模型训练。可选的，任一元素识别模型的训练方法包括：获取背景图和元素数据，对元素数据进行增强处理，得到多个增强元素数据，并将增强元素数据设置在背景图中，得出训练样本图并记录增强元素数据的元素类型和在背景图的设置位置；基于训练样本图、训练样本图对应的元素类型和在背景图的设置位置对待训练的元素识别模型进行迭代训练，以得到训练完成的元素识别模型。

示例性的，对于商品样本数据集的样本构建，可以采用图片合成程序来合成带商品的广告图用来作为训练商品元素识别模型的训练样本。例如，选择一批图片作为背景图，然后选择一批商品在图片上随机粘贴，粘贴的时候就可以知道坐标、类别作为标注信息。粘贴的时候，会随机添加高斯模糊、椒盐噪声、图片翻转、随机裁剪、缩放、颜色通道置换，这些数据增强方法来增加数据集的多样性，有利于提高模型识别的精度。基于商品样本数据集中对应的元素类型和在背景图的设置位置作为样本标签，基于该样本标签分别对待训练的商品元素识别模型进行迭代训练，以得到训练完成的商品元素识别模型。需要说明的是，对于logo元素识别模型、人脸元素识别模型和人体元素识别模型等其他类似于图像识别的元素识别模型均可以采用上述方式进行训练。

在上述各实施例的基础上，类似于图像识别的元素识别模型可以是网络结构模块，诸如卷积神经网络、多层感知器等的结构，对此不作限定。例如，元素识别模型可以是YOLOv5模型。

示例性的，对于文本样本数据集的构建，可以从互联网上下载中文语料库，加上已有的文案库。例如，选择一批图片作为背景图，然后从文案库中随机挑选文案，然后在背景图片上用Python随机写出来，加上旋转、倾斜、投射变换、高斯模糊来增加样本丰富性，从而提高模型识别的精度。

在上述各实施例的基础上，类似于文本识别的元素识别模型可以是网络结构模块，诸如卷积神经网络、多层感知器等的结构，对此不作限定。例如，元素识别模型可以是east模型。

在上述实施例的基础上，当识别出基础图像中的各图像元素时，提取出各图像元素，并对图像元素进行裂变处理。可选的，基于目标图像尺寸和基础图像尺寸的尺寸差异，以及每个图像元素的形变类型，确定每个图像元素的处理方式，并基于确定的处理方式对每个图像元素进行处理，得到处理后的图像元素。

需要解释的是，本实施例中目标图像尺寸和基础图像尺寸的尺寸差异包括等比例缩放差异和/或宽高比差异；图像元素的形变类型包括不可形变、可轻微形变和可形变；不可形变的图像元素的处理方式包括等比例缩放，可轻微形变的图像元素的处理方式包括等比例缩放和预设形变范围内的拉伸，可形变的图像元素的处理方式包括等比例缩放和任意比例的拉伸。

本实施例中，比例缩放差异可以理解为对当前图像的图像长度和图像宽度进行相同比例的放大或者缩小即可消除的差异，换言之，在目标图像尺寸为1000mm*1000mm,基础图像尺寸为500mm*500mm的情况下，目标图像尺寸和基础图像尺寸之间的尺寸通过等比例放大即可以消除比例缩放差异。宽高比差异可以理解为对当前图像的图像长度进行拉伸或者对图像宽度进行拉伸即可消除的差异。换言之，在目标图像尺寸为1000mm*1200mm,基础图像尺寸为 1000mm*1000mm的情况下，目标图像尺寸和基础图像尺寸之间的尺寸通过进行拉伸即可以消除宽高比差异。当然还有一种情况是目标图像尺寸为1000mm*1200mm,基础图像尺寸为500mm*500mm，相应的，目标图像尺寸和基础图像尺寸之间的尺寸通过先进行等比例缩放，再进行拉伸即可以消除图像之间的尺寸差异。

本实施例中，不可形变的图像元素可以理解为在裂变处理的过程中，该图像元素的形状比例需要保持特定比例，不能发生变化；例如广告图像中的logo元素、人脸元素和人体元素等，例如，logo需要保持预设形状，不能变化；可轻微形变的图像元素可以理解为在裂变处理的过程中，该图像元素的形状比例需要保持预设范围的比例，不能发生超出预设范围的比例变化；例如广告图像中的商品元素等，例如，商品的形状可在在预设范围内进行拉宽或者伸高；可形变的图像元素可以理解为在裂变处理的过程中，该图像元素的形状比例不作限定，可任意变化；例如广告图像中的文案元素等，例如，文案中的文字大小和字体可任意改变。

可选的，在目标图像尺寸为1000mm*1000mm,基础图像尺寸为500mm*500mm的情况下，为了消除尺寸差异，对基础图像进行等比例放大处理，由于各形变类型的图像元素均可进行等比例缩放，相应的，可以直接对基础图像中的各图像元素进行2倍的等比例放大处理，得到处理完的各图像元素。

可选的，在目标图像尺寸为1000mm*1200mm,基础图像尺寸为1000mm*1000mm的情况下，为了消除尺寸差异，对基础图像在宽度上进行拉伸处理，在此基础上，若基础图像中包括不可形变的图像元素以及可轻微形变的图像元素，则对不可形变的图像元素不进行拉伸处理；对可轻微形变的图像元素，若尺寸差异在预设形变范围内，则直接对可轻微形变的图像元素基于尺寸差异进行拉伸处理，若尺寸差异不在预设形变范围内，则对可轻微形变的图像元素在预设形变范围内进行拉伸处理；对可任意形变的图像元素直接基于尺寸差异进行拉伸处理，从而得到处理完的各图像元素。

可选的，在目标图像尺寸为1000mm*1200mm,基础图像尺寸为500mm*500mm的情况下，为了消除尺寸差异，可以先对各图像元素进行2倍的放大处理，得到1000mm*1000mm的基础图像，并在此基础上，基于各图像元素的可形变类型，对于不可形变的图像元素不进行拉伸处理、对于可轻微形变的图像元素在宽度上进行预设拉伸范围内的拉伸处理、对于可形变的图像元素在宽度上基于尺寸差异进行拉伸处理，从而得到处理完的各图像元素。

在上述实施例的基础上，将处理后的图像元素进行拼接，得到目标图像。可选的，可以确定目标图像的至少一个布局分布，基于布局分布将处理后的图像元素进行拼接，得到每个布局分布对应的目标图像。

本实施例中，布局分布可以解释为各图像元素在图像中的布局关系。示例性的，布局分布可以包括但不限于上文下图、上图下文、左文右图、左图右文、文字居中两边商品等布局分布。

可选的，若基础图像中不包括图像背景，则可以直接对处理完的图像元素基于各类布局分布进行元素拼接，分别得到每个布局分布对应的拼接图像，将至少一个拼接图像向用户进行展示，并基于用户在所述至少一个拼接图像中对目标图像的选取指令，生成基础图像对应的目标图像。

在一些实施例中，在生成所述至少一个布局分布对应的拼接图像之后，计算每个拼接图像的合理性概率，并基于预设的合理性阈值确定所述至少一个拼接图像中符合合理性要求的拼接图像向用户进行展示，并基于用户在符合合理性要求的拼接图像中对目标图像的选取指令，生成基础图像对应的目标图像；当然也可以在计算出所述至少一个拼接图像的合理性概率之后，直接将合理性概率中概率值最大的拼接图像作为目标图像。当然，还可以基于其他方式确定拼接后的目标图像，本实施例对此不作限定。

本实施例的技术方案，基于目标图像尺寸，确定与目标图像尺寸相匹配的基础图像；提取基础图像中的图像元素；基于目标图像尺寸和基础图像尺寸的尺寸差异，以及每个图像元素的形变类型，确定每个图像元素的处理方式，并基于确定的处理方式对图像元素进行处理，得到处理后的图像元素；将处理后的图像元素进行拼接，得到目标图像。通过上述技术的方案，解决了相关技术在对图像裂变的过程中导致丢失图像元素，以及拉伸图像元素发生形变，从而降低视觉效果的协调性的问题，达到了对图像进行图像裂变处理的过程中，在不丢失图像关键信息的情况下，提高视觉效果的协调性的效果。

图2为本申请实施例提供的另一种图像处理方法的流程图，本申请实施例与上述实施例中各个可选方案可以结合。可选的，在本申请实施例中，提取基础图像中的图像元素，包括：

将基础图像分别输入至多个元素识别模型中，分别得到每个元素识别模型输出的图像元素识别结果，其中，图像元素识别结果中包括各图像元素的位置；

基于图像元素识别结果更新待提取的图像元素，并基于更新后的待提取的图像元素的位置关系确定基础图像的布局类型，基于布局类型提取待提取的图像元素。

如图2所示，本申请实施例的方法包括如下步骤：

步骤210、基于目标图像尺寸，确定与目标图像尺寸相匹配的基础图像。

步骤220、将基础图像分别输入至多个元素识别模型中，分别得到每个元素识别模型输出的图像元素识别结果，其中，图像元素识别结果中包括图像元素的位置。

步骤230、基于图像元素识别结果更新待提取的图像元素，并基于更新后的待提取的图像元素的位置关系确定基础图像的布局类型，基于布局类型提取待提取的图像元素。

步骤240、基于目标图像尺寸和基础图像尺寸的尺寸差异，以及每个图像元素的形变类型，确定每个图像元素的处理方式，并基于确定的处理方式对图像元素进行处理，得到处理后的图像元素。

步骤250、将处理后的图像元素进行拼接，得到目标图像。

在上述各实施例的基础上，由于通过不同类型的元素识别模型对基础图像进行识别，存在一个图像元素被识别为不同类型的图像元素的情况，示例性的，文字形式的logo可被识别为文字和logo，示例性的，包括文字的商品图像可别识别为商品图像和文字，上述基于同一图像元素识别出的图像元素的位置存在重叠。

本实施例的技术方案中，在基于各元素识别模型识别出基础图像中的各图像元素之后，若识别出的各图像元素中的元素位置存在位置重叠，则更新待提取的图像元素，并基于更新后的待提取的图像元素的位置关系确定基础图像的布局类型；基于布局类型提取待提取的图像元素，以实现提高各图像元素的识别准确率。

可选的，确定基础图像的布局类型的方法可以包括：基于各图像元素的位置，确定具有位置重叠关系的多个图像元素；基于各图像元素的优先级，确定具有位置重叠关系的多个图像元素的从属关系，将具有从属关系的多个图像元素更新为一个独立的图像元素；基于基础图像中各独立的图像元素之间的位置关系，确定基础图像的布局类型。

示例性的，基于各元素识别模型输出的各图像元素的位置，并基于各图像元素的位置，确定具有位置重叠关系的多个图像元素。其中，位置重叠可以理解为在基础图像中的相同像素点上设置有至少两种图像元素。基于预先设置的各图像元素的优先级，确定具有位置重叠关系的各图像元素的优先级，进而基于各图像元素的优先级确定具有位置重叠关系的多个图像元素的从属关系，并将具有从属关系的多个图像元素更新为一个独立的图像元素，并基于基础图像中各独立的图像元素之间的位置关系，确定基础图像的布局类型。其中，布局类型包括上文下图、上图下文、左文右图、左图右文、文字居中两边商品等布局类型。

示例性的，若识别出基础图像中的图像元素包括第一文案元素、logo元素、第二文案元素、商品元素和人体元素。基于各图像元素的位置确定出商品元素、人体元素和第二文案元素具有位置重叠关系。获取预先设置的各图像元素的优先级，例如商品元素、人体元素、第二文案元素的优先级依次下降，基于上述优先级关系，确定人体元素和第二文案元素从属于商品元素，则将上述第二文案元素、商品元素和人体元素更新为包括商品、人体和第二文案的独立商品元素。在独立商品元素、第一文案元素、logo元素之间不存在位置重叠，分别为独立图像元素的情况下，确定第一文案元素、logo元素和商品元素之间的位置关系，并基于上述位置关系确定基础图像的布局类型，其中，布局类型基于文案元素、和诸如人脸元素、商品元素、人体元素、logo元素等图像元素之间的相对位置关系确定。

通过确定基础图像的布局类型，基于布局类型对基础图像中的各图像元素进行类型验证，以提高待提取的图像元素的类型和位置的准确性。示例性的，可以是基于布局类型对基础图像进行区域划分，以上图下文为例，将基础图像划分为两部分，即上方的图区域和下方的文案区域，相应的，在上方的图区域进行图元素的提取，在下方的文案区域进行文案元素的提取。在图元素中包括文字的情况，不对图区域进行文案元素的提取，避免图像元素的重复提取。

本实施例的技术方案，通过基于目标图像尺寸，确定与目标图像尺寸相匹配的基础图像；将基础图像分别输入至多个元素识别模型中，分别得到每个元素识别模型输出的图像元素识别结果，其中，图像元素识别结果中包括各图像元素的位置；基于图像元素识别结果更新待提取的图像元素，并基于更新后的待提取的图像元素的位置关系确定基础图像的布局类型，基于布局类型提取待提取的图像元素；基于目标图像尺寸和基础图像尺寸的尺寸差异，以及每个图像元素的形变类型，确定每个图像元素的处理方式，并基于确定的处理方式对各图像元素进行处理，得到处理后的图像元素；将处理后的图像元素进行拼接，得到目标图像。上述技术方案通过在识别出基础图像中的各图像元素具有位置重叠关系的情况下，更新待提取的图像元素，并基于更新后的待提取的图像元素的位置关系确定基础图像的布局类型，达到了提高图像元素识别准确性的效果，从而提升了基于图像元素拼接得到的目标图像在展示的过程中的视觉效果的协调性。

图3为本申请实施例提供的另一种图像处理方法的流程图，本申请实施例与上述实施例中各个可选方案可以结合。可选的，在本申请实施例中，在将处理后的图像元素进行拼接之后，方法还包括：

在拼接后的图像中存在背景扩展区域的情况下，获取背景扩展区域相邻的图像边缘或背景边缘，基于图像边缘或背景边缘的颜色数据得到背景扩展区域对应的衍生背景。

如图3所示，本申请实施例的方法包括如下步骤：

步骤310、基于目标图像尺寸，确定与目标图像尺寸相匹配的基础图像。

步骤320、提取基础图像中的图像元素。

步骤330、基于目标图像尺寸和基础图像尺寸的尺寸差异，以及每个图像元素的形变类型，确定每个图像元素的处理方式，并基于确定的处理方式对图像元素进行处理，得到处理后的图像元素。

步骤340、将处理后的图像元素进行拼接，在拼接后的图像中存在背景扩展区域的情况下，获取背景扩展区域相邻的图像边缘或背景边缘，基于图像边缘或背景边缘的颜色数据得到背景扩展区域对应的衍生背景，得到目标图像。

在上述各发明实施例的技术方案中，介绍了在基础图像中不包括图像背景的情况下，直接将处理后的元素进行拼接并得到目标图像的技术方案，本实施例在此不再赘述。

本申请实施例中，在基础图像中包括图像背景的情况下，对图像背景的裂变处理，以使裂变后的图像背景适应目标图像的图像背景，以提高展示过程中视觉效果的协调性。

可选的，若拼接后的图像与基础图像的图像比例不一致，图像背景的背景元素可拉伸，则可以直接基于拼接后的图像与基础图像的尺寸差异对背景区域进行等比例缩放和/或拉伸处理，得到符合拼接后的图像尺寸的目标背景；将处理后的图像元素在目标背景上进行拼接，得到目标图像。

可选的，若拼接后的图像与基础图像的图像比例不一致，且图像背景中存在不可拉伸的背景元素，则拼接后的图像中可能存在背景扩展区。可选的，背景扩展区可以是在基础图像中的上、下、左、右的任意方向，本实施例对此不作限定。在此情况下，获取拼接后的图像中与背景扩展区域相邻的图像边缘或者背景边缘，并基于图像边缘或背景边缘的颜色数据得到背景扩展区域对应的衍生背景。

示例性的，可以是选取图像边缘或者背景边缘中任意像素点，将该像素点的颜色数据作为背景扩展区域对应的衍生背景；可选的，还可以是将相邻的图像边缘或者背景边缘中预设范围内的各像素点的平均颜色数据作为背景扩展区域对应的衍生背景；可选的，还可以是确定相邻的图像边缘或者背景边缘中预设范围内的各像素点中分别对应的颜色数据，基于数值最大的颜色数据和数值最小的颜色数据的中间颜色数据作为背景扩展区域对应的衍生背景。当然，上述确定衍生背景的方法只是可选实施例，还可以基于与背景扩展区域相邻的图像边缘或者背景边缘的数据情况确定实际的衍生背景生成方法，本实施例对此不作限定。

可选的，若拼接后的图像与基础图像的图像比例不一致，且图像背景中存在不可拉伸的背景元素，但是背景元素中包括重复随意排列的背景元素的情况下，则可以获取基础图像的背景，并基于目标图像尺寸对背景进行剪裁处理，得到符合目标图像尺寸的目标背景；将处理后的图像元素在目标背景上进行拼接，得到目标图像。

示例性的，确定拼接后的图像中的背景扩展区域的区域尺寸，并在基础图像中裁剪与区域尺寸相同尺寸的背景区域，并将裁剪后的背景区域拼接于背景扩展区域的位置，得到符合目标图像尺寸的目标背景，进而将处理后的图像元素在目标背景上进行拼接，得到目标图像。

本实施例的技术方案，包括：基于目标图像尺寸，确定与目标图像尺寸相匹配的基础图像；提取基础图像中的图像元素；基于目标图像尺寸和基础图像尺寸的尺寸差异，以及每个图像元素的形变类型，确定每个图像元素的处理方式，并基于确定的处理方式对各图像元素进行处理，得到处理后的图像元素；将处理后的图像元素进行拼接，在拼接后的图像中存在背景扩展区域的情况下，获取背景扩展区域相邻的图像边缘或背景边缘，基于图像边缘或背景边缘的颜色数据得到背景扩展区域对应的衍生背景，得到目标图像。上述技术方案在基础图像中包括图像背景的情况下，通过对拼接后的图像的背景进行裂变处理，从而使拼接后的图像背景适应展示位置的尺寸，以提升在展示过程中的视觉效果的协调性。

以下是本申请实施例提供的图像处理装置的实施例，本申请实施例所提供的一种图像装置可执行本申请任意实施例所提供的图像处理方法，具备执行方法相应的功能模块。图像处理装置与上述各实施例的图像处理方法属于同一个发明构思，在图像处理装置的实施例中未详尽描述的细节内容，可以参考上述图像处理方法的实施例。

图4为本申请实施例提供的一种图像处理装置的结构图，参见图4，该图像处理装置的结构包括：基础图像确定模块410、图像元素提取模块420、图像元素处理模块430和目标图像生成模块440；其中，

基础图像确定模块410，设置为基于目标图像尺寸，确定与所述目标图像尺寸相匹配的基础图像；

图像元素提取模块420，设置为提取所述基础图像中的图像元素；

图像元素处理模块430，设置为基于所述目标图像尺寸和基础图像尺寸的尺寸差异，以及每个图像元素的形变类型，确定每个图像元素的处理方式，并基于确定的处理方式对所述图像元素进行处理，得到处理后的图像元素；

目标图像生成模块440，设置为将处理后的图像元素进行拼接，得到目标图像。

在上述实施例的技术方案的基础上，可选的，图像元素提取模块420，包括：

图像元素识别结果获取子模块，设置为将所述基础图像分别输入至多个元素识别模型中，分别得到每个所述元素识别模型输出的图像元素识别结果，其中，图像元素识别结果中包括图像元素的位置；

图像元素提取子模块，设置为基于所述图像元素识别结果从所述基础图像中提取各图像元素。

在上述实施例的技术方案的基础上，可选的，该装置还包括：各元素识别模型的模型训练模块；任一元素识别模型的模型训练模块包括：

训练样本图获取单元，设置为获取背景图和元素数据，对所述元素数据进行增强处理，得到多个增强元素数据，并将所述增强元素数据设置在所述背景图中，得出训练样本图并记录所述增强元素数据的元素类型和在背景图的设置位置；

元素识别模型训练单元，设置为基于训练样本图、所述训练样本图对应的元素类型和在背景图的设置位置对待训练的元素识别模型进行迭代训练，以得到训练完成的元素识别模型。

在上述实施例的技术方案的基础上，可选的，图像元素提取子模块，包括：

布局类型确定单元，设置为基于图像元素识别结果更新待提取的图像元素，并基于更新后的待提取的图像元素的位置关系确定所述基础图像的布局类型；

图像元素提取单元，设置为基于所述布局类型提取所述待提取的图像元素。

在上述实施例的技术方案的基础上，可选的，布局类型确定单元，包括：

图像元素确定子单元，设置为基于各图像元素的位置，确定具有位置重叠关系的多个图像元素；

图像元素更新子单元，设置为基于各图像元素的优先级，确定所述具有位置重叠关系的多个图像元素的从属关系，将具有从属关系的多个图像元素更新为一个独立的图像元素；

布局类型确定子单元，设置为基于所述基础图像中各独立的图像元素之间的位置关系，确定所述基础图像的布局类型。

在上述实施例的技术方案的基础上，可选的，所述目标图像尺寸和基础图像尺寸的尺寸差异包括等比例缩放差异和/或宽高比差异；

图像元素的形变类型包括不可形变、可轻微形变和可形变；

所述不可形变的图像元素的处理方式包括等比例缩放，所述可轻微形变的图像元素的处理方式包括等比例缩放和预设形变范围内的拉伸，所述可形变的图像元素的处理方式包括等比例缩放和任意比例的拉伸。

在上述实施例的技术方案的基础上，可选的，目标图像生成模块440，包括：

第一目标图像生成单元，设置为确定目标图像的至少一个布局分布，基于所述至少一个布局分布将处理后的图像元素进行拼接，得到每个布局分布对应的目标图像。

目标背景生成单元，设置为获取所述基础图像的背景，并基于所述目标图像尺寸对所述背景进行剪裁处理，得到符合所述目标图像尺寸的目标背景；

第二目标图像生成单元，设置为将所述将处理后的图像元素在所述目标背景上进行拼接，得到目标图像。

在上述实施例的技术方案的基础上，可选的，该装置还包括：

衍生背景生成模块，设置为在拼接后的图像中存在背景扩展区域的情况下，获取所述背景扩展区域相邻的图像边缘或背景边缘，基于所述图像边缘或背景边缘的颜色数据得到所述背景扩展区域对应的衍生背景。

图5示出了可以用来实施本申请的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图5所示，电子设备10包括至少一个处理器11，以及与至少一个处理器11通信连接的存储器，如只读存储器(Read-Only Memory，ROM)12、随机访问存储器(Random Access Memory，RAM)13等，其中，存储器存储有可被至少一个处理器执行的计算机程序，处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序，来执行各种适当的动作和处理。在RAM 13中，还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(Input/Output，I/O)接口15也连接至总线14。

电子设备10中的多个部件连接至I/O接口15，包括：输入单元16，例如键盘、鼠标等；输出单元17，例如各种类型的显示器、扬声器等；存储单元18，例如磁盘、光盘等；以及通信单元19，例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(Central Processing Unit，CPU)、图形处理单元(Graphics Processing Unit，GPU)、各种专用的人工智能(Artificial Intelligence，AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(Digital Signal Processing，DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理，例如图像处理方法。

在一些实施例中，图像处理方法可被实现为计算机程序，其被有形地包含于计算机可读存储介质，例如存储单元18。在一些实施例中，计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时，可以执行上文描述的图像处理方法的至少一个步骤。备选地，在其他实施例中，处理器11可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行图像处理方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(Field Programmable Gate Array，FPGA)、专用集成电路(Application Specific Integrated Circuit，ASIC)、专用标准产品(Application Specific Standard Parts，ASSP)、芯片上系统的系统(System on Chip，SOC)、负载可编程逻辑设备(Complex Programmable Logic Device，CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在至少一个计算机程序中，该至少一个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本申请的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器，使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本申请的上下文中，计算机可读存储介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。备选地，计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于至少一个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM(Erasable Programmable Read-Only Memory)或快闪存储器)、光纤、便捷式紧凑盘只读存储器(Compact Disc Read-Only Memory，CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在电子设备上实施此处描述的系统和技术，该电子设备具有：用于向用户显示信息的显示装置(例如，CRT(Cathode Ray Tube，阴极射线管)或者LCD(Liquid Crystal Display，液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(Local Area Network，LAN)、广域网(Wide Area Network，WAN)、区块链网络和互联网。

计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与虚拟专用服务器(Virtual Private Server，VPS)服务中，存在的管理难度大，业务扩展性弱的缺陷。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

注意，上述仅为本申请的可选实施例及所运用技术原理。本领域技术人员会理解，本申请不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此，虽然通过以上实施例对本申请进行了较为详细的说明，但是本申请不仅仅限于以上实施例，在不脱离本申请构思的情况下，还可以包括更多其他等效实施例，而本申请的范围由所附的权利要求范围决定。

Claims

一种图像处理方法，包括：

基于目标图像尺寸，确定与所述目标图像尺寸相匹配的基础图像；

提取所述基础图像中的图像元素；

基于所述目标图像尺寸和基础图像尺寸的尺寸差异，以及每个图像元素的形变类型，确定每个图像元素的处理方式，并基于确定的处理方式对所述图像元素进行处理，得到处理后的图像元素；

将处理后的图像元素进行拼接，得到目标图像。
根据权利要求1所述的方法，其中，所述提取所述基础图像中的图像元素，包括：

将所述基础图像分别输入至多个元素识别模型中，分别得到每个所述元素识别模型输出的图像元素识别结果，其中，图像元素识别结果中包括图像元素的位置；

基于所述图像元素识别结果从所述基础图像中提取图像元素。
根据权利要求2所述的方法，其中，任一所述元素识别模型的训练方法，包括：

获取背景图和元素数据，对所述元素数据进行增强处理，得到多个增强元素数据，并将所述增强元素数据设置在所述背景图中，得出训练样本图并记录所述增强元素数据的元素类型和在背景图的设置位置；

基于训练样本图、所述训练样本图对应的元素类型和在背景图的设置位置对待训练的元素识别模型进行迭代训练，以得到训练完成的元素识别模型。
根据权利要求2所述的方法，其中，基于所述图像元素识别结果从所述基础图像中提取图像元素，包括：

基于图像元素识别结果更新待提取的图像元素，并基于更新后的待提取的图像元素的位置关系确定所述基础图像的布局类型；

基于所述布局类型提取所述待提取的图像元素。
根据权利要求4所述的方法，其中，所述基于图像元素识别结果更新待提取的图像元素，并基于更新后的待提取的图像元素的位置关系确定所述基础图像的布局类型，包括：

基于图像元素的位置，确定具有位置重叠关系的多个图像元素；

基于图像元素的优先级，确定所述具有位置重叠关系的多个图像元素的从属关系，将具有从属关系的多个图像元素更新为一个独立的图像元素；

基于所述基础图像中各独立的图像元素之间的位置关系，确定所述基础图像的布局类型。
根据权利要求1所述的方法，其中，所述目标图像尺寸和基础图像尺寸的尺寸差异包括等比例缩放差异和宽高比差异中的至少之一；

图像元素的形变类型包括不可形变、可轻微形变和可形变；

所述不可形变的图像元素的处理方式包括等比例缩放，所述可轻微形变的图像元素的处理方式包括等比例缩放和预设形变范围内的拉伸，所述可形变的图像元素的处理方式包括等比例缩放和任意比例的拉伸。
根据权利要求1所述的方法，其中，所述将处理后的图像元素进行拼接，得到目标图像，包括：

确定目标图像的至少一个布局分布，基于所述至少一个布局分布将处理后的图像元素进行拼接，得到每个布局分布对应的目标图像。
根据权利要求1所述的方法，其中，所述将处理后的图像元素进行拼接，得到目标图像，包括：

获取所述基础图像的背景，并基于所述目标图像尺寸对所述背景进行剪裁处理，得到符合所述目标图像尺寸的目标背景；

将所述将处理后的图像元素在所述目标背景上进行拼接，得到目标图像。
根据权利要求1所述的方法，在将处理后的图像元素进行拼接之后，还包括：

在拼接后的图像中存在背景扩展区域的情况下，获取所述背景扩展区域相邻的图像边缘或背景边缘，基于所述图像边缘或背景边缘的颜色数据得到所述背景扩展区域对应的衍生背景。
一种图像处理装置，包括：

基础图像确定模块，设置为基于目标图像尺寸，确定与所述目标图像尺寸相匹配的基础图像；

图像元素提取模块，设置为提取所述基础图像中的图像元素；

图像元素处理模块，设置为基于所述目标图像尺寸和基础图像尺寸的尺寸差异，以及每个图像元素的形变类型，确定每个图像元素的处理方式，并基于确定的处理方式对所述图像元素进行处理，得到处理后的图像元素；

目标图像生成模块，设置为将处理后的图像元素进行拼接，得到目标图像。
一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-9中任一项所述的图像处理方法。
一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使处理器执行时实现权利要求1-9中任一项所述的图像处理方法。