CN114519754A - 画报生成方法、装置、设备及存储介质 - Google Patents
画报生成方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN114519754A CN114519754A CN202210143117.XA CN202210143117A CN114519754A CN 114519754 A CN114519754 A CN 114519754A CN 202210143117 A CN202210143117 A CN 202210143117A CN 114519754 A CN114519754 A CN 114519754A
- Authority
- CN
- China
- Prior art keywords
- image
- processed
- area
- processing
- pictorial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/12—Edge-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20172—Image enhancement details
- G06T2207/20192—Edge enhancement; Edge preservation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Processing Or Creating Images (AREA)
Abstract
本申请提供一种画报生成方法、装置、设备及计算机可读存储介质,该方法包括:获取待处理图像;基于图像转换模型,根据待处理图像中的人物图像确定目标人物图像;获取预设背景图像和介绍文本,并将目标人物图像设于背景图像的第一区域,以及将介绍文本设于与第一区域邻接的第二区域,得到布局图像;基于画报生成模型,根据布局图像第一区域的第一色彩,调整布局图像中介绍文本的第二色彩,得到画报图像。本申请能够提高画报图像生成速率,以及降低设计画报的成本。本申请还涉及区块链技术,画报图像能够存储于区块链中。
Description
技术领域
本申请涉及图像处理的技术领域,尤其涉及一种画报生成方法、装置、设备及计算机可读存储介质。
背景技术
在保险代理人员或其他代理人员对客户进行自我介绍时,一般通过名片或者海报进行介绍,但代理人员并不擅长制作名片或海报,导致通过代理人员设计出来的海报的观赏性较差,而找擅长的制作海报的人员进行制作会增加成本。以及目前在海报的制作过程中,会通过一些神经网络模型对人像进行风格转换的处理,但这些神经网络模型在对包含多个人像的图片进行处理时,可能会出现错误,并且得到神经网络模型输出的人像图片后,还需要人工在图片中调整每一个人像的位置,增加了人工成本,并且制作海报的效率较慢。
发明内容
本申请的主要目的在于提供一种画报生成方法、装置、设备及计算机可读存储介质,旨在提高制作画报的效率。
第一方面,本申请提供一种画报生成方法,所述画报生成方法包括以下步骤:
获取待处理图像;
基于图像转换模型,根据所述待处理图像中的人物图像确定目标人物图像;
获取预设背景图像和介绍文本,并将所述目标人物图像设于所述背景图像的第一区域,以及将所述介绍文本设于与所述第一区域邻接的第二区域,得到布局图像;
基于画报生成模型,根据所述布局图像第一区域的第一色彩,调整所述布局图像中介绍文本的第二色彩,得到画报图像。
第二方面,本申请还提供一种画报生成装置,所述画报生成装置包括:
图像获取模块,用于获取待处理图像;
图像转换模块,用于基于图像转换模型,根据所述待处理图像中的人物图像确定目标人物图像;
布局图像生成模块,用于获取预设背景图像和介绍文本,并将所述目标人物图像设于所述背景图像的第一区域,以及将所述介绍文本设于与所述第一区域邻接的第二区域,得到布局图像;
画报生成模块,用于基于画报生成模型,根据所述布局图像第一区域的第一色彩,调整所述布局图像中介绍文本的第二色彩,得到画报图像。
第三方面,本申请还提供一种计算机设备,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如上述的画报生成方法的步骤。
第四方面,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如上述的画报生成方法的步骤。
本申请提供一种画报生成方法、装置、设备及计算机可读存储介质,方法包括获取待处理图像;基于图像转换模型,根据所述待处理图像中的人物图像确定目标人物图像;获取预设背景图像和介绍文本,并将所述目标人物图像设于所述背景图像的第一区域,以及将所述介绍文本设于与所述第一区域邻接的第二区域,得到布局图像;基于画报生成模型,根据所述布局图像第一区域的第一色彩,调整所述布局图像中介绍文本的第二色彩,得到画报图像,通过图像转换模型,能够对待处理图像中的人物图像进行风格的转换处理,以得到画报中的人物图像,以及能够通过自动调整人物图像以及介绍文本的位置和色彩,达到自动生成画报的目的,提升画报生成的效率以及减少成本。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种画报生成方法的流程示意图;
图2为实施本实施例提供的画报生成方法的一场景示意图;
图3为本申请实施例提供的一种画报生成方法中的模型结构示意性框图;
图4为本申请实施例提供的一种画报生成装置的示意性框图;
图5为本申请一实施例涉及的计算机设备的结构示意框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
本申请实施例提供一种画报生成方法、装置、计算机设备及计算机可读存储介质。其中,该画报生成方法可应用于终端设备中,该终端设备可以是平板电脑、笔记本电脑、台式电脑等电子设备。也可以应用于服务器中,该服务器可以是单独的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
请参照图1,图1为本申请的实施例提供的一种画报生成方法的流程示意图。
如图1所示,该画报生成方法包括步骤S101至步骤S104。
步骤S101、获取待处理图像;
示例性的,待处理图像可以是集体照片、团队照片,可以理解的,在集体照片中,包括若干个人物,通过对这些人物对应的人物图像进行风格转化处理,以及基于转化风格后的人像进行画报的生成,可以得到风格不同的画报,避免了设计画报的繁琐,减少了设计画报的成本以及提升了画报生成的速率。
可以理解的,生成的画报可以加以文本进行介绍或宣传,并且通过各个人物图像的风格转化还能得到符合各个人物的个性化的画报。
示例性的,可以通过图像获取装置获取待处理图像,例如拍摄装置,以对待处理图像进行画报的生成。
具体的,如图2所示,服务器可以获取源终端发送的待处理图像,并对待处理图像进行画报生成后,将生成的画报发送至目标终端和/或源终端。
步骤S102、基于图像转换模型,根据所述待处理图像中的人物图像确定目标人物图像。
示例性的,通过图像转换模型,对待处理图像中的人物图像进行风格转换,以得到目标人物图像。
可以理解的,风格转换可以是白描风格转换以及卡通风格转换,具体的,可以对人物图像进行边缘轮廓提取处理,以完成白描风格的转换;同理,可以对人物图像进行对抗网络的处理,以完成卡通风格转换。
在一些实施例中,在对人物图像进行风格转换处理之前,对待处理图像进行分割,以得到多个人物图像。
示例性的,待处理图像中可能包含若干个人物图像,且当人物图像大于等于2时,对待处理图像进行风格,以得到多个人物图像。
示例性的,可以对进行分割后得到每一个的人物图像进行风格转化处理,以得到用于置于画报中的目标人物图像。可以理解的,风格转化处理包括但不限于白描风格转化处理和卡通风格转化处理。白描风格用于指示通过多个简单的线条,勾勒出人像的轮廓,以使目标人物图像达到与素描画相同的效果。卡通风格用于指示通过对人像进行色彩调整、人像的卡通化处理,以使目标人物图像达到与卡通人物相同的效果。
示例性的,在同一画报中,不同的人像可以是不同的风格,以达到画报中每个人的个性化体现。
示例性的,可以通过获取人物图像在待处理图像中的坐标位置,并根据人物图像的坐标位置,对待处理图像进行分割,得到多个人物图像。
示例性的,可以对多个人物图像并行处理,以提升画报生成的速率。
在一些实施例中,所述基于图像转换模型,根据所述待处理图像中的人物图像确定目标人物图像,包括:将所述待处理图像输入至所述图像转换模型的第一图像处理子模型,基于所述第一图像处理子模型的向量化处理网络,对待处理图像中的人物图像进行边缘增强处理以及提取处理后人物图像的轮廓特征,得到第一特征矩阵;基于所述第一图像处理子模型的卷积网络,对所述第一特征矩阵进行卷积处理,得到第二特征矩阵;基于所述第一图像处理子模型的译码网络,对所述第二特征矩阵进行权重计算以及对计算结果进行译码处理,得到目标人物图像。
示例性的,图像转换模型包括第一图像处理子模型,可以理解的,第一图像处理子模型可以用于对人物图像进行白描风格的转化,以得到目标人物图像。
示例性的,可以将待处理图像输入至第一图像处理子模型,以根据待处理图像中的人物图像确定目标人物图像;也可以将从待处理图像中分割得到的人物图像输入至第一图像处理子模型,以根据人物图像确定目标人物图像。
为描述方便,以下以将从待处理图像中分割得到的人物图像输入至第一图像处理子模型为例进行说明。
将人物图像输入至第一图像处理子模型的向量化处理网络,在向量化处理网络中,对人物图像进行轮廓边缘增强处理,具体的,可以通过人物图像对应的色彩确定人物的轮廓,并调整对应的特征,以使提取的特征值能够凸显人物的轮廓。具体的,可以对特征提取到的第一特征矩阵对应的特征值进行按比例放大,以凸显人物轮廓的特征。
例如,在未进行边缘增强处理提取轮廓特征得到的第一特征矩阵可以是:
其中,第一列、第三列以及第三行的特征值均用于指示任务凸显的轮廓;
若进行边缘增强处理后,并对处理后的人物图像进行特征提取,得到的第一特征矩阵可以是:
可以理解的,在边缘增强处理后得到的第一特征矩阵能够在计算中凸显轮廓对应的特征值。
可以理解的,上述第一特征矩阵仅为举例说明,并不对本申请中边缘增强处理以及第一特征矩阵予以限定。
示例性的,将从向量化处理网络输出的第一特征矩阵输入至第一图像处理子模型的卷积网络中。在卷积网络中,对第一特征矩阵进行卷积处理,并在卷积处理后,进行池化处理。可以理解的,池化处理是对第一特征矩阵去除冗余的特征值,以加快卷积的计算速率以及防止过拟合的情况发生。可以理解的,在卷积网络中,可以包括多个卷积层以及多个池化层,以对第一特征矩阵进行多次卷积处理以及池化处理。
示例性的,通过卷积网络后,得到第二特征矩阵,并将第二特征矩阵输入至译码网络中。
在译码网络中,对第二特征矩阵进行背景信息的权重计算,可以理解的,可以进一步地去除图像中的背景信息,只保留轮廓信息,以得到类似于素描风格的图像,可以通过背景信息对应的权重矩阵与第二特征矩阵进行计算,以消除背景信息。进行权重计算之后,通过译码器对计算后的特征矩阵进行译码处理,以得到目标人物图像。从而完成对人物图像的白描风格转换。
示例性的,背景信息可以是在边缘增强处理时确定的,可以理解的,在进行边缘增强处理时,确定人物图像的边缘轮廓信息的同时,可以认为在当前人物图像中除边缘轮廓信息的其余信息为背景信息,从而能够确定背景信息对应的权重矩阵。
示例性的,人物图像的边缘轮廓信息包括但不限于头部轮廓、五官轮廓、四肢轮廓以及身体轮廓。
通过图像转换模型中的第一图像处理子模型,能够对人物图像进行白描风格的转换,从而得到置于画报中的目标人物图像。
示例性的,图像转换模型还包括第二图像处理子模型,第二图像处理子模型可以用于对人物图像进行卡通风格的转换。
在一些实施例中,所述基于图像转换模型,根据所述待处理图像中的人物图像确定目标人物图像,包括:将所述待处理图像输入至所述图像转换模型的第二图像处理子模型,基于所述第二图像处理子模型的生成器网络的输入层,对所述待处理的人物图像进行逆卷积及批量归一化处理,得到第一特征图像;基于所述生成器网络的输出层,对所述第一特征图像进行非线性计算,得到待判别图像;基于所述第二图像处理子模型的判别器网络的输入层,对所述待判别图像进行卷积处理和批量归一化处理,得到待判别图像对应的第二特征图像;基于所述判别器网络的输出层,对所述第二特征图像进行真假判断,且若判定为真,将所述第二特征图像对应的待判别图像作为目标人物图像,并输出所述目标人物图像。
示例性的,可以通过第二图像处理子模型中的对抗网络,完成对人物图像的卡通风格转换。
示例性的,将人物图像输入至第二图像处理子模型的生成器网络的输入层,以对人物图像进行特征提取,并对提取的特征进行逆卷积处理以及批量归一化处理,得到第一特征图像。其中,在逆卷积的处理过程中,引入了噪声向量,可以理解的,噪声向量可以是预设的,也可以是生成器网络基于多个输入的人物图像学习得到的。噪声向量可以用于改变人物图像中的特征。
将输入层输出的第一特征图像输入至生成器网络的输出层中,以通过预设的第一激活函数,对第一特征图像进行非线性计算,得到待判别图像,其中,预设的第一激活函数可以是tanh函数,表达式如下:
其中,tanh用于指示待判别图像,e用于指示超越数,x用于指示第一特征图像。
示例性的,得到待判别图像后,将待判别图像输入至第二图像处理子模型的判别器网络的输入层,以对待判别图像进行卷及处理和批量归一化处理,得到待判别图像的第二特征图像,并利用判别器网络的输出层,对第二特征图像进行真假的判断。
示例性的,可以基于第二激活函数对第二特征图像进行真假的判断,具体的,将第二特征图像分割为多个子图像,并通过第二激活函数对第二特征图像的子图像进行分类计算,可以得到第二特征图像中每一个子图像的分类结果,并根据每一个子图像的分类结果,判断第二特征图像的真假。
例如,若判定为真的子图像的数量大于或等于子图像总数量的一半时,确定第二特征图像为真图像;若判定为真的子图像的数量小于子图像总数量的一半时,确定第二特征图像为假图像。
例如,第二特征图像的子图像总数量为500,若为真的子图像的数量为280时,确定该第二特征图像为真图像;若为真的子图像的数量为100时,确定该第二特征图像为假图像。
可以理解的,当判别器网络判定第二特征图像为假图像时,图像转换模型不输出图像,并调整生成器网络的参数、判别器网络的参数以及噪声信息中的至少一项,以再次进行待判别图像的生成以及对待判别图像的判别。
可以理解的,当判别器网络判定第二特征图像为帧图像时,将第二特征图像对应的待判别图像作为目标人物图像,并输出目标人物图像,以完成对人物图像的卡通风格转换。
在一些实施例中,在所述基于图像转换模型,根据所述待处理图像中的人物图像确定目标人物图像之前,还包括:基于图像分割模型,对所述人物图像进行分割,得到所述人物图像的头部区域图像以及身体区域图像;所述基于图像转换模型,根据所述待处理图像中的人物图像确定目标人物图像,包括:基于图像转换模型的第一图像处理子模型,对所述头部区域图像进行边缘轮廓提取处理,得到处理后的头部区域图像;以及对所述身体区域图像进行边缘轮廓提取处理,得到处理后的身体区域图像;和/或基于图像转换模型的第二图像处理子模型,对所述头部区域图像进行卡通图像转换处理,得到处理后的头部区域图像;以及对所述身体区域图像进行卡通图像转换处理,得到处理后的身体区域图像;确定与处理后的头部区域图像对应的处理后的身体区域图像,并将对应的处理后的头部区域图像和处理后的身体区域图像进行拼接,得到目标人物图像。
示例性的,还可以基于图像分割模型,对人物图像进行分割,以得到人物图像对应的头部区域图像以及身体区域图像,并对头部区域图像以及身体区域图像分别进行风格转换处理,并将风格转换处理后的对应的头部区域图像以及身体区域图像进行拼接,得到目标人物图像。
例如,包括人物图像1、2、3,其中,将人物图像1分割为头部区域图像A以及身体区域图像a,将人物图像2分割为头部区域图像B以及身体区域图像图像b,以及将人物图像3分割为头部区域图像C以及身体区域图像c,并对图像A、B、C、a、b、c进行风格转换处理,得到处理后的图像A、B、C、a、b、c,并确定处理后图像A对应的处理后的图像a,对处理后图像A与处理后的图像a进行拼接,得到人物图像1对应的目标人物图像,其他图像参照人物图像1进行同样的处理,在此不再撰述。
示例性的,在图像分割模型中,可以基于预设的人脸检测算法,识别出人物图像中的头部区域,并基于识别得到的头部区域,确定人物图像的头部区域坐标,以及根据头部区域坐标进行分割,以得到头部区域图像以及身体区域图像。
示例性的,在图像分割模型中还可以包括U-Net网络,以对人物图像进行分割,其中,U-Net网络是一种全卷积结构,U型网络具有压缩路径(contracting path)和扩展路径(expansive path),其中,压缩路径(contracting path)和扩展路径(expansive path)至少包括4个处理层且一一对应。
在得到头部区域图像的过程中,通过压缩路径(contracting path)中的每一个处理层对输入的人物图像进行下采样处理,可以理解的,每一个处理层对输入该层的人物图像进行边缘填充以及缩放,经过若干个处理层的处理后,完成下采样处理,得到一个512×512的头部特征图像。
将得到的头部特征图像输入扩展路径(expansive path)以进行上采样处理,在扩展路径(expansive path)中,每一个处理层对头部特征图像进行反卷积操作,具体的,每一个处理层对输入的头部特征图像进行尺寸翻倍,同时将个数去除一半,以及与对应的压缩路径(contracting path)中处理层的人物图像进行拼接,由于压缩路径(contractingpath)中处理层的人物图像与对应的扩展路径(expansive path)处理层的头部特征图像的尺寸不一样,先对压缩路径(contracting path)中处理层的人物图像进行裁剪,然后进行拼接,经过与下采样次数相同次数的反卷积以及拼接后,完成上采样处理,生成并输出头部区域图像。
可以理解的,可以通过调整U-Net网络的参数,以使U-Net网络对人物图像分割得到身体区域图像,具体实施步骤请参照上述过程,在此不再论述。
可以理解的,由于图像转换模型对头部区域进行的风格转化处理较为精准,且在一些情况下,头部区域与身体区域可以是比例不相同的转化,或是不同风格的转化,分别将头部区域图像和对应的身体区域图像输入至图像转换模型中,以使基于图像转换模型中的第一图像处理子模型对头部区域图像和/或对应的身体区域图像进行边缘轮廓提取处理;和/或基于图像转换模型中的第二图像处理子模型对头部区域图像和/或对应的身体区域图像卡通图像转换处理。
在一些实施例中,在所述对所述头部区域图像进行边缘轮廓提取处理和/或卡通图像转换处理之前,还包括:基于预设的特征坐标差计算规则,对所述头部区域图像中的眼部特征对应的坐标进行差值计算,得到眼部特征差值;若所述眼部特征坐标差值小于预设的眼部特征坐标差阈值,对所述头部区域图像进行仿射变换处理,得到位置修正后的头部区域图像,其中,位置修正后的头部区域图像中的眼部特征对应的坐标值大于或等于预设的眼部特征坐标差阈值。
示例性的,由于对头部区域图像进行风格转化时,人像的正脸可以使风格转化的正确率提升,避免出现无法进行风格转化或风格转化后的图像不清晰的情况,因此,判断头部区域图像中的头部水平偏转角是否小于预设水平偏转角阈值,并根据判定的结果对头部区域图像进行处理。
例如,判定头部区域图像中的头部水平偏转角小于预设水平偏转角阈值,对头部区域图像进行图像转换处理;若判定头部区域图像中的头部水平偏转角大于预设水平偏转角阈值,对头部区域图像进行仿射变换处理,以使头部区域图像中的头部水平偏转角小于预设水平偏转角阈值。
例如,可以通过头部区域图像中的眼部特征或耳部特征进行差值计算,并将计算结果与坐标差阈值比较,从而确定头部区域图像中的头部水平偏转角是否大于预设水平偏转角阈值。
具体的,头部区域图像包括左眼和右眼;或左耳和右耳,确定左眼对应的坐标以及右眼对应的坐标,通过左眼坐标与右眼坐标进行差值计算,得到眼部特征差值,并将眼部特征差值与坐标差阈值比较,以确定头部的水平偏转角是否大于预设水平偏转角阈值,并进行对应的处理。
可以理解的,在对图像进行风格转换之前先进行位置修正处理,可以提升图像风格转换的成功率以及真实性。
步骤S103、获取预设背景图像和介绍文本,并将所述目标人物图像设于所述背景图像的第一区域,以及将所述介绍文本设于与所述第一区域邻接的第二区域,得到布局图像。
示例性的,获取预设背景图像以及介绍文本,可以理解的,预设背景图像可以是预先进行设计好的背景图像,也可以是纯颜色的背景图像;介绍文本用于对画报中的集体或团队进行介绍,如团队简介、团队口号等。
示例性的,在获取到的背景图像加入目标人物图像以及介绍文本,以得到布局图像,其中,由于布局需要,目标人物图像与介绍文本不能重叠,因而将目标人物图像设于背景图像的第一区域,并将介绍文本设于背景图像的第二区域,其中,第一区域与第二区域邻接,以避免目标人物图像与介绍文本重合的情况发生。
在一些实施例中,所述将所述目标人物图像设于所述背景图像的第一区域,以及将所述介绍文本设于与所述第一区域邻接的第二区域,包括:响应于区域确定指令,在所述背景图像中确定第一区域以及第二区域,其中,所述第一区域与所述第二区域邻接;确定所述第一区域的第一中心坐标,以及确定目标人物图像的第一对称中心坐标,根据所述第一中心坐标和第一对称中心坐标确定所述目标人物图像的第一目标位置,并调整所述目标人物图像的尺寸大小,以使所述目标人物图像处于所述第一区域并在所述背景图像中的占比属于第一目标比例;确定所述第二区域的第二中心坐标,以及确定介绍文本的第二对称中心坐标,根据所述第二中心坐标和所述第二对称中心坐标确定所述介绍文本的第二目标位置,并调整所述介绍文本中的字符大小、行距以及字符间距中的至少一项,以使所述介绍文本处于所述第二区域并在所述背景图像中的占比属于第二目标比例。
示例性的,响应于用户输入的区域确定指令,在背景图像中确定第一区域以及第二区域,具体的,可以通过多个端点坐标确定第一区域和第二区域,其中,第一区域与第二区域邻接。
确定第一区域之后,根据第一区域的各端点确定第一区域的第一中心坐标,例如第一区域为正方形,且四个端点的坐标分别是(0,0)、(2,0)、(0,2)、(2,2),可以确定第一区域的中心坐标为(1,1),以及根据目标人物图像的对称性,确定目标人物图像的第一对称中心坐标,具体的,可以通过计算目标人物图像的长度和宽度,并根据长度和宽度确定第一对称中心坐标。
示例性的,可以将目标人物图像拟合为一个矩形,以便于计算第一对称中心。可以理解的,若包含多个目标人物图像,可以将多个目标人物图像进行拼接后拟合为一个矩形,以根据该矩形的长度和宽度确定该矩形的第一对称中心。
确定第一中心坐标和第一对称中心坐标后,将第一对称中心坐标调整至与第一中心坐标重合,以使目标人物图像设于第一区域;并调整目标人物图像的尺寸大小,以使目标人物图像在背景图像中的占比属于第一目标比例,如占比比例为20%。
同样的,确定第二区域的第二中心坐标,以及确定介绍文本的第二对称中心坐标,可以理解的,介绍文本可以是通过文本框表征的,通过获取文本框的长度和宽度,可以得到介绍文本的第二对称中心坐标。
将第二对称中心坐标调整至与第二中心坐标重合,以使介绍文本处于第二区域,并调整介绍文本对应文本框的大小,可以理解的,可以通过调整介绍文本中的字体大小、行距以及字符间距中的至少一项来调整文本框的大小,以使调整后的介绍文本在背景图像中的占比为第二目标比例,如占比比例为15%。
示例性的,将目标人物图像以及介绍文本嵌入背景图像的对应位置,以及调整对应的比例后,得到布局图像,可以理解的,由于色彩还未调整,所以可能会存在背景图像与介绍文本和/或目标人物图像中的色彩相同,导致无法显示的情况,因而还需对布局图像的色彩进行调整。
步骤S104、基于画报生成模型,根据所述布局图像第一区域的第一色彩,调整所述布局图像中介绍文本的第二色彩,得到画报图像。
示例性的,通过画报生成模型,可以根据布局图像的第一区域的第一色彩调整介绍文本的第二色彩,从而避免色彩相同和导致介绍文本无法显示的情况。
具体的,可以根据第一区域中目标人物图像中的第一色彩来调整介绍文本中文字的第二色彩。
可以理解的,将目标人物图像的第一色彩和介绍文本的第二色彩区分开,避免色彩接近或相同,而导致画报的观感较差,以及避免由于色彩的原因导致目标人物图像和介绍文本无法显示的情况发生。
示例性的,如图3所示,将待处理图像输入图像转换模型以及将背景图像和介绍文本输入画报生成模型,以得到画报图像。
示例性的,可以将画报图像存储于区块链中,以使在其他终端设备需要获取画报图像时,能够通过向区块链进行广播以获取画报图像。本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
在一些实施例中,所述基于画报生成模型,根据所述布局图像第一区域的第一色彩,调整所述布局图像中介绍文本的第二色彩,包括:基于预设的色彩变换规则,根据所述第一色彩确定第一HSV值,以及根据所述第二色彩确定第二HSV值;对所述第一HSV值和所述第二HSV值进行差值计算,若所述第一HSV值与所述第二HSV值的差值小于预设HSV阈值,调整所述第一HSV值和/或所述第二HSV值,以使第一HSV值与第二HSV值的差值大于所述预设HSV阈值。
示例性的,预设的色彩变换规则可以是色彩变换公式,例如通过第一色彩中的RGB值,确定第一HSV值,可以理解的,H用于指示色彩的色调(Hue),S用于指示色彩的饱和度(Saturation),V用于指示色彩的明度(Value)。
示例性的,得到目标人物图像对应的第一HSV值和介绍文本对应的第二HSV值后,对第一HSV值和第二HSV值进行差值计算,以得到第一HSV值与第二HSV值的差值,并判断第一HSV值与第二HSV值的差值与预设HSV阈值的大小,以根据判定的结果对第一HSV值和/或第二HSV值进行调整。例如,若第一HSV值与第二HSV值的差值小于预设HSV阈值时,增大第一HSV值和/或减小第二HSV值,以使第一HSV值与第二HSV值的差值大于预设HSV阈值。可以理解的,第一HSV值与第二HSV值的差值大于预设HSV阈值,可以使客户在观看目标人物图像和介绍文本时,有足够的色彩辨识度,增加海报图像的观感。
在另一些实施方式中,布局图像还包括第三区域,其中,第三区域与第一区域以及第二区域邻接,第三区域用于指示既不存在目标人物图像也不存在介绍文本的区域,确定第三区域的第三HSV值,并根据第三HSV值,调整第一HSV值和/或第二HSV值。
可以理解的,若第三区域中的色彩与第一区域或第二区域相似或相同,会导致目标人物图像或介绍文本无法很好地在布局图像中显示出来,因而需要根据第三区域对应的第三HSV值对第一HSV值和/或第二HSV值进行调整。
示例性的,计算第一HSV值与第三HSV值的第一差值,以及计算第二HSV值与第三HSV值的第二差值,并判断第一差值与第二预设HSV值,以及第二差值与第二预设HSV值的大小,以判定的结果对第一HSV值和第二HSV值进行调整。可以理解的,若第一差值小于第二预设HSV值,对第一HSV值进行调整;若第二差值小于第二预设HSV值,对第二HSV值进行调整;且调整后的第一HSV值和第二HSV值满足的第一HSV值与第二HSV值的差值小于预设HSV值。
通过调整不同区域的HSV值,可以避免由于色彩相同导致图像无法完全展示,以及能够增强画报的观赏性。
上述实施例提供的画报生成方法,获取待处理图像;基于图像转换模型,根据所述待处理图像中的人物图像确定目标人物图像;获取预设背景图像和介绍文本,并将所述目标人物图像设于所述背景图像的第一区域,以及将所述介绍文本设于与所述第一区域邻接的第二区域,得到布局图像;基于画报生成模型,根据所述布局图像第一区域的第一色彩,调整所述布局图像中介绍文本的第二色彩,得到画报图像。通过图像转换模型对待处理图像中的人物图像进行风格转换,以及通过预设背景图像、介绍文本以及目标人物图像自动生成画报,能够提升画报生成的速率以及减少设计画报的成本。
请参阅图4,图4是本申请一实施例提供的一种画报生成装置100的示意图,该画报生成装置100可以配置于服务器或终端中,用于执行前述的画报生成方法。
如图4所示,该画报生成装置100,包括:图像获取模块110、图像转换模块120、布局图像生成模块130、画报生成模块140。
图像获取模块110,用于获取待处理图像。
图像转换模块120,用于基于图像转换模型,根据所述待处理图像中的人物图像确定目标人物图像。
布局图像生成模块130,用于获取预设背景图像和介绍文本,并将所述目标人物图像设于所述背景图像的第一区域,以及将所述介绍文本设于与所述第一区域邻接的第二区域,得到布局图像。
画报生成模块140,用于基于画报生成模型,根据所述布局图像第一区域的第一色彩,调整所述布局图像中介绍文本的第二色彩,得到画报图像。
示例性的,图像转换模块120还包括向量化处理子模块,卷积处理子模块,译码处理子模块。
向量化处理子模块,用于将所述待处理图像输入至所述图像转换模型的第一图像处理子模型,基于所述第一图像处理子模型的向量化处理网络,对待处理图像中的人物图像进行边缘增强处理以及提取处理后人物图像的轮廓特征,得到第一特征矩阵。
卷积处理子模块,用于基于所述第一图像处理子模型的卷积网络,对所述第一特征矩阵进行卷积处理,得到第二特征矩阵。
译码处理子模块,用于基于所述第一图像处理子模型的译码网络,对所述第二特征矩阵进行权重计算以及对计算结果进行译码处理,得到目标人物图像。
示例性的,图像转换模块120包括生成器网络的输入层子模块,生成器网络的输出层子模块,判别器网络的输入层子模块,判别器网络的输出层子模块。
生成器网络的输入层子模块,用于将所述待处理图像输入至所述图像转换模型的第二图像处理子模型,基于所述第二图像处理子模型的生成器网络的输入层,对所述待处理的人物图像进行逆卷积及批量归一化处理,得到第一特征图像。
生成器网络的输出层子模块,用于基于所述第二图像处理子模型的判别器网络的输入层,对所述待判别图像进行卷积处理和批量归一化处理,得到待判别图像对应的第二特征图像。
判别器网络的输入层子模块,用于基于所述第一特征计算子模型的池化网络,对处理后的第一融合矩阵进行下采样处理,得到第二融合矩阵。
判别器网络的输出层子模块,用于基于所述判别器网络的输出层,对所述第二特征图像进行真假判断,且若判定为真,将所述第二特征图像对应的待判别图像作为目标人物图像,并输出所述目标人物图像。
示例性的,布局图像生成模块130还包括区域确定子模块,目标人物图像调整子模块、介绍文本调整子模块。
区域确定子模块,用于响应于区域确定指令,在所述背景图像中确定第一区域以及第二区域,其中,所述第一区域与所述第二区域邻接。
目标人物图像调整子模块,用于确定所述第一区域的第一中心坐标,以及确定目标人物图像的第一对称中心坐标,根据所述第一中心坐标和第一对称中心坐标确定所述目标人物图像的第一目标位置,并调整所述目标人物图像的尺寸大小,以使所述目标人物图像处于所述第一区域并在所述背景图像中的占比属于第一目标比例。
介绍文本调整子模块,用于确定所述第二区域的第二中心坐标,以及确定介绍文本的第二对称中心坐标,根据所述第二中心坐标和所述第二对称中心坐标确定所述介绍文本的第二目标位置,并调整所述介绍文本中的字符大小、行距以及字符间距中的至少一项,以使所述介绍文本处于所述第二区域并在所述背景图像中的占比属于第二目标比例。
示例性的,画报生成模块140还包括色彩变换子模块、色彩调整子模块。
色彩变换子模块,用于基于预设的色彩变换规则,根据所述第一色彩确定第一HSV值,以及根据所述第二色彩确定第二HSV值。
色彩调整子模块,用于对所述第一HSV值和所述第二HSV值进行差值计算,若所述第一HSV值与所述第二HSV值的差值小于预设HSV阈值,调整所述第一HSV值和/或所述第二HSV值,以使第一HSV值与第二HSV值的差值大于所述预设HSV阈值。
示例性的,画报生成装置100还包括图像分割模块、图像转换模块120还包括图像拼接子模块。
图像分割模块,用于基于图像分割模型,对所述人物图像进行分割,得到所述人物图像的头部区域图像以及身体区域图像。
图像转换模块120,还用于基于图像转换模型的第一图像处理子模型,对所述头部区域图像进行边缘轮廓提取处理,得到处理后的头部区域图像;以及对所述身体区域图像进行边缘轮廓提取处理,得到处理后的身体区域图像;和/或基于图像转换模型的第二图像处理子模型,对所述头部区域图像进行卡通图像转换处理,得到处理后的头部区域图像;以及对所述身体区域图像进行卡通图像转换处理,得到处理后的身体区域图像;
图像拼接子模块,用于确定与处理后的头部区域图像对应的处理后的身体区域图像,并将对应的处理后的头部区域图像和处理后的身体区域图像进行拼接,得到目标人物图像。
示例性的,画报生成装置100还包括特征计算模块,图像调整模块。
特征计算模块,用于基于预设的特征坐标差计算规则,对所述头部区域图像中的眼部特征对应的坐标进行差值计算,得到眼部特征差值。
图像调整模块,用于若所述眼部特征坐标差值小于预设的眼部特征坐标差阈值,对所述头部区域图像进行仿射变换处理,得到位置修正后的头部区域图像,其中,位置修正后的头部区域图像中的眼部特征对应的坐标值大于或等于预设的眼部特征坐标差阈值。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和各模块、单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请的方法,可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
示例性地,上述的方法、装置可以实现为一种计算机程序的形式,该计算机程序可以在如图5所示的计算机设备上运行。
请参阅图5,图5为本申请实施例提供的一种计算机设备的结构示意性框图。该计算机设备可以为服务器或终端。
如图5所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括存储介质和内存储器。
存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行任意一种画报生成方法。
处理器用于提供计算和控制能力,支撑整个计算机设备的运行。
内存储器为存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种画报生成方法。
该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
应当理解的是,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中,在一个实施例中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:
获取待处理图像;
基于图像转换模型,根据所述待处理图像中的人物图像确定目标人物图像;
获取预设背景图像和介绍文本,并将所述目标人物图像设于所述背景图像的第一区域,以及将所述介绍文本设于与所述第一区域邻接的第二区域,得到布局图像;
基于画报生成模型,根据所述布局图像第一区域的第一色彩,调整所述布局图像中介绍文本的第二色彩,得到画报图像。
在一个实施例中,所述处理器在实现基于图像转换模型,根据所述待处理图像中的人物图像确定目标人物图像时,用于实现:
将所述待处理图像输入至所述图像转换模型的第一图像处理子模型,基于所述第一图像处理子模型的向量化处理网络,对待处理图像中的人物图像进行边缘增强处理以及提取处理后人物图像的轮廓特征,得到第一特征矩阵;
基于所述第一图像处理子模型的卷积网络,对所述第一特征矩阵进行卷积处理,得到第二特征矩阵;
基于所述第一图像处理子模型的译码网络,对所述第二特征矩阵进行权重计算以及对计算结果进行译码处理,得到目标人物图像。
在一个实施例中,所述处理器在实现基于图像转换模型,根据所述待处理图像中的人物图像确定目标人物图像时,用于实现:
将所述待处理图像输入至所述图像转换模型的第二图像处理子模型,基于所述第二图像处理子模型的生成器网络的输入层,对所述待处理的人物图像进行逆卷积及批量归一化处理,得到第一特征图像;
基于所述生成器网络的输出层,对所述第一特征图像进行非线性计算,得到待判别图像;
基于所述第二图像处理子模型的判别器网络的输入层,对所述待判别图像进行卷积处理和批量归一化处理,得到待判别图像对应的第二特征图像;
基于所述判别器网络的输出层,对所述第二特征图像进行真假判断,且若判定为真,将所述第二特征图像对应的待判别图像作为目标人物图像,并输出所述目标人物图像。
在一个实施例中,所述处理器在实现将所述目标人物图像设于所述背景图像的第一区域,以及将所述介绍文本设于与所述第一区域邻接的第二区域时,用于实现:响应于区域确定指令,在所述背景图像中确定第一区域以及第二区域,其中,所述第一区域与所述第二区域邻接;
确定所述第一区域的第一中心坐标,以及确定目标人物图像的第一对称中心坐标,根据所述第一中心坐标和第一对称中心坐标确定所述目标人物图像的第一目标位置,并调整所述目标人物图像的尺寸大小,以使所述目标人物图像处于所述第一区域并在所述背景图像中的占比属于第一目标比例;
确定所述第二区域的第二中心坐标,以及确定介绍文本的第二对称中心坐标,根据所述第二中心坐标和所述第二对称中心坐标确定所述介绍文本的第二目标位置,并调整所述介绍文本中的字符大小、行距以及字符间距中的至少一项,以使所述介绍文本处于所述第二区域并在所述背景图像中的占比属于第二目标比例。
在一个实施例中,所述处理器在实现基于画报生成模型,根据所述布局图像第一区域的第一色彩,调整所述布局图像中介绍文本的第二色彩时,用于实现:
基于预设的色彩变换规则,根据所述第一色彩确定第一HSV值,以及根据所述第二色彩确定第二HSV值;
对所述第一HSV值和所述第二HSV值进行差值计算,若所述第一HSV值与所述第二HSV值的差值小于预设HSV阈值,调整所述第一HSV值和/或所述第二HSV值,以使第一HSV值与第二HSV值的差值大于所述预设HSV阈值。
在一个实施例中,所述处理器在实现基于图像转换模型,根据所述待处理图像中的人物图像确定目标人物图像之前,还用于实现:
基于图像分割模型,对所述人物图像进行分割,得到所述人物图像的头部区域图像以及身体区域图像;
所述处理器在实现基于图像转换模型,根据所述待处理图像中的人物图像确定目标人物图像时,用于实现:
基于图像转换模型的第一图像处理子模型,对所述头部区域图像进行边缘轮廓提取处理,得到处理后的头部区域图像;以及对所述身体区域图像进行边缘轮廓提取处理,得到处理后的身体区域图像;和/或基于图像转换模型的第二图像处理子模型,对所述头部区域图像进行卡通图像转换处理,得到处理后的头部区域图像;以及对所述身体区域图像进行卡通图像转换处理,得到处理后的身体区域图像;
确定与处理后的头部区域图像对应的处理后的身体区域图像,并将对应的处理后的头部区域图像和处理后的身体区域图像进行拼接,得到目标人物图像。
在一个实施例中,所述处理器在实现对所述头部区域图像进行边缘轮廓提取处理和/或卡通图像转换处理之前,还用于实现:
基于预设的特征坐标差计算规则,对所述头部区域图像中的眼部特征对应的坐标进行差值计算,得到眼部特征差值;
若所述眼部特征坐标差值小于预设的眼部特征坐标差阈值,对所述头部区域图像进行仿射变换处理,得到位置修正后的头部区域图像,其中,位置修正后的头部区域图像中的眼部特征对应的坐标值大于或等于预设的眼部特征坐标差阈值。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述画报生成的具体工作过程,可以参考前述画报生成控制方法实施例中的对应过程,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序中包括程序指令,所述程序指令被执行时所实现的方法可参照本申请画报生成方法的各个实施例。
其中,所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种画报生成方法,其特征在于,包括:
获取待处理图像;
基于图像转换模型,根据所述待处理图像中的人物图像确定目标人物图像;
获取预设背景图像和介绍文本,并将所述目标人物图像设于所述背景图像的第一区域,以及将所述介绍文本设于与所述第一区域邻接的第二区域,得到布局图像;
基于画报生成模型,根据所述布局图像第一区域的第一色彩,调整所述布局图像中介绍文本的第二色彩,得到画报图像。
2.如权利要求1所述的画报生成方法,其特征在于,所述基于图像转换模型,根据所述待处理图像中的人物图像确定目标人物图像,包括:
将所述待处理图像输入至所述图像转换模型的第一图像处理子模型,基于所述第一图像处理子模型的向量化处理网络,对待处理图像中的人物图像进行边缘增强处理以及提取处理后人物图像的轮廓特征,得到第一特征矩阵;
基于所述第一图像处理子模型的卷积网络,对所述第一特征矩阵进行卷积处理,得到第二特征矩阵;
基于所述第一图像处理子模型的译码网络,对所述第二特征矩阵进行权重计算以及对计算结果进行译码处理,得到目标人物图像。
3.如权利要求1所述的画报生成方法,其特征在于,所述基于图像转换模型,根据所述待处理图像中的人物图像确定目标人物图像,包括:
将所述待处理图像输入至所述图像转换模型的第二图像处理子模型,基于所述第二图像处理子模型的生成器网络的输入层,对所述待处理的人物图像进行逆卷积及批量归一化处理,得到第一特征图像;
基于所述生成器网络的输出层,对所述第一特征图像进行非线性计算,得到待判别图像;
基于所述第二图像处理子模型的判别器网络的输入层,对所述待判别图像进行卷积处理和批量归一化处理,得到待判别图像对应的第二特征图像;
基于所述判别器网络的输出层,对所述第二特征图像进行真假判断,且若判定为真,将所述第二特征图像对应的待判别图像作为目标人物图像,并输出所述目标人物图像。
4.如权利要求1-3任一项所述的画报生成方法,其特征在于,所述将所述目标人物图像设于所述背景图像的第一区域,以及将所述介绍文本设于与所述第一区域邻接的第二区域,包括:
响应于区域确定指令,在所述背景图像中确定第一区域以及第二区域,其中,所述第一区域与所述第二区域邻接;
确定所述第一区域的第一中心坐标,以及确定目标人物图像的第一对称中心坐标,根据所述第一中心坐标和第一对称中心坐标确定所述目标人物图像的第一目标位置,并调整所述目标人物图像的尺寸大小,以使所述目标人物图像处于所述第一区域并在所述背景图像中的占比属于第一目标比例;
确定所述第二区域的第二中心坐标,以及确定介绍文本的第二对称中心坐标,根据所述第二中心坐标和所述第二对称中心坐标确定所述介绍文本的第二目标位置,并调整所述介绍文本中的字符大小、行距以及字符间距中的至少一项,以使所述介绍文本处于所述第二区域并在所述背景图像中的占比属于第二目标比例。
5.如权利要求1-3任一项所述的画报生成方法,其特征在于,所述基于画报生成模型,根据所述布局图像第一区域的第一色彩,调整所述布局图像中介绍文本的第二色彩,包括:
基于预设的色彩变换规则,根据所述第一色彩确定第一HSV值,以及根据所述第二色彩确定第二HSV值;
对所述第一HSV值和所述第二HSV值进行差值计算,若所述第一HSV值与所述第二HSV值的差值小于预设HSV阈值,调整所述第一HSV值和/或所述第二HSV值,以使第一HSV值与第二HSV值的差值大于所述预设HSV阈值。
6.如权利要求1所述的画报生成方法,其特征在于,在所述基于图像转换模型,根据所述待处理图像中的人物图像确定目标人物图像之前,还包括:
基于图像分割模型,对所述人物图像进行分割,得到所述人物图像的头部区域图像以及身体区域图像;
所述基于图像转换模型,根据所述待处理图像中的人物图像确定目标人物图像,包括:
基于图像转换模型的第一图像处理子模型,对所述头部区域图像进行边缘轮廓提取处理,得到处理后的头部区域图像;以及对所述身体区域图像进行边缘轮廓提取处理,得到处理后的身体区域图像;和/或基于图像转换模型的第二图像处理子模型,对所述头部区域图像进行卡通图像转换处理,得到处理后的头部区域图像;以及对所述身体区域图像进行卡通图像转换处理,得到处理后的身体区域图像;
确定与处理后的头部区域图像对应的处理后的身体区域图像,并将对应的处理后的头部区域图像和处理后的身体区域图像进行拼接,得到目标人物图像。
7.如权利要求6所述的画报生成方法,其特征在于,在所述对所述头部区域图像进行边缘轮廓提取处理和/或卡通图像转换处理之前,还包括:
基于预设的特征坐标差计算规则,对所述头部区域图像中的眼部特征对应的坐标进行差值计算,得到眼部特征差值;
若所述眼部特征坐标差值小于预设的眼部特征坐标差阈值,对所述头部区域图像进行仿射变换处理,得到位置修正后的头部区域图像,其中,位置修正后的头部区域图像中的眼部特征对应的坐标值大于或等于预设的眼部特征坐标差阈值。
8.一种画报生成装置,其特征在于,所述画报生成装置包括:
图像获取模块,用于获取待处理图像;
图像转换模块,用于基于图像转换模型,根据所述待处理图像中的人物图像确定目标人物图像;
布局图像生成模块,用于获取预设背景图像和介绍文本,并将所述目标人物图像设于所述背景图像的第一区域,以及将所述介绍文本设于与所述第一区域邻接的第二区域,得到布局图像;
画报生成模块,用于基于画报生成模型,根据所述布局图像第一区域的第一色彩,调整所述布局图像中介绍文本的第二色彩,得到画报图像。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如权利要求1至7中任一项所述的画报生成方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如权利要求1至7中任一项所述的画报生成方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210143117.XA CN114519754A (zh) | 2022-02-16 | 2022-02-16 | 画报生成方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210143117.XA CN114519754A (zh) | 2022-02-16 | 2022-02-16 | 画报生成方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114519754A true CN114519754A (zh) | 2022-05-20 |
Family
ID=81598825
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210143117.XA Pending CN114519754A (zh) | 2022-02-16 | 2022-02-16 | 画报生成方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114519754A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117689782A (zh) * | 2024-02-02 | 2024-03-12 | 腾讯科技(深圳)有限公司 | 一种生成海报图像的方法、装置、设备及存储介质 |
-
2022
- 2022-02-16 CN CN202210143117.XA patent/CN114519754A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117689782A (zh) * | 2024-02-02 | 2024-03-12 | 腾讯科技(深圳)有限公司 | 一种生成海报图像的方法、装置、设备及存储介质 |
CN117689782B (zh) * | 2024-02-02 | 2024-05-28 | 腾讯科技(深圳)有限公司 | 一种生成海报图像的方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112052839B (zh) | 图像数据处理方法、装置、设备以及介质 | |
CN106780293B (zh) | 头部特写肖像的样式传递 | |
WO2018102700A1 (en) | Photorealistic facial texture inference using deep neural networks | |
Zhang et al. | Compositional model-based sketch generator in facial entertainment | |
CN108846792B (zh) | 图像处理方法、装置、电子设备及计算机可读介质 | |
CN111652796A (zh) | 图像处理方法、电子设备及计算机可读存储介质 | |
EP3035236A1 (en) | Four dimensional code, and four dimensional code-based image recognition system and method, and retrieval system and method | |
CN110427972B (zh) | 证件视频特征提取方法、装置、计算机设备和存储介质 | |
US11954828B2 (en) | Portrait stylization framework using a two-path image stylization and blending | |
Mahajan et al. | Swapitup: A face swap application for privacy protection | |
EP3783524A1 (en) | Authentication method and apparatus, and electronic device, computer program, and storage medium | |
US11978216B2 (en) | Patch-based image matting using deep learning | |
CN112330527A (zh) | 图像处理方法、装置、电子设备和介质 | |
Seo et al. | Robust recognition of face with partial variations using local features and statistical learning | |
CN114519754A (zh) | 画报生成方法、装置、设备及存储介质 | |
CN114612595A (zh) | 视频生成方法、装置、计算机设备和存储介质 | |
CN114049290A (zh) | 图像处理方法、装置、设备及存储介质 | |
CN114332895A (zh) | 文本图像合成方法、装置、设备、存储介质和程序产品 | |
CN114359030B (zh) | 一种人脸逆光图片的合成方法 | |
CN117252947A (zh) | 图像处理方法、装置、计算机、存储介质及程序产品 | |
US20220207917A1 (en) | Facial expression image processing method and apparatus, and electronic device | |
JP6931267B2 (ja) | 原画像を目標画像に基づいて変形した表示画像を生成するプログラム、装置及び方法 | |
US20220157030A1 (en) | High Quality AR Cosmetics Simulation via Image Filtering Techniques | |
CN114399495A (zh) | 图像清晰度的计算方法、装置、设备及存储介质 | |
US11423597B2 (en) | Method and system for removing scene text from images |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |