CN111833420B - 基于真人的图画自动生成方法、装置、系统及存储介质 - Google Patents

基于真人的图画自动生成方法、装置、系统及存储介质 Download PDF

Info

Publication number
CN111833420B
CN111833420B CN202010648918.2A CN202010648918A CN111833420B CN 111833420 B CN111833420 B CN 111833420B CN 202010648918 A CN202010648918 A CN 202010648918A CN 111833420 B CN111833420 B CN 111833420B
Authority
CN
China
Prior art keywords
image
point
preset
rendering
hole
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010648918.2A
Other languages
English (en)
Other versions
CN111833420A (zh
Inventor
吴戈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN202010648918.2A priority Critical patent/CN111833420B/zh
Publication of CN111833420A publication Critical patent/CN111833420A/zh
Application granted granted Critical
Publication of CN111833420B publication Critical patent/CN111833420B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T13/00Animation
    • G06T13/203D [Three Dimensional] animation
    • G06T13/403D [Three Dimensional] animation of characters, e.g. humans, animals or virtual beings
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T15/003D [Three Dimensional] image rendering

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Graphics (AREA)
  • Processing Or Creating Images (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例涉及一种基于真人的图画自动生成方法、装置、系统及存储介质,该方法包括:对预获取的原始真人图像进行处理,获取与原始真人图像对应的各个肢体部位标签图像;对第一肢体部位标签图像进行二值化处理后,确定经过二值化处理后的第一肢体部位标签图像中是否存在孔洞;当确定经过二值化处理后的第一肢体部位标签图像中存在孔洞,且孔洞类型为预设类型时,按照预设孔洞修复规则对孔洞进行修复,获取第一图像区域;分别对所有第一图像区域,以及预设定的头部图像区域进行颜色渲染后,获取与原始真人图像对应的图画。实现操作过程自动化,降低成本以及资源的消耗。

Description

基于真人的图画自动生成方法、装置、系统及存储介质
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种基于真人的图画自动生成方法、装置、系统及存储介质。
背景技术
图画作为一种艺术表达形式,将复杂的形象简单化。尤其是将真人做成图画的方式,可以将真人的特点、姿态和动作形象的进行表达,在如今社会越来越受到大众的欢迎。传统的图画制作,一般是设计师或者美工相关专业人员通过对真人的观察和分析,利用专业的绘画技能进行手工绘制。
但是,如果专业绘画人员手工绘制,存在比较明显的弊端。其要求相关人员具有较强的专业技能和丰富的绘画经验,而且图画创作的时间成本较大且质量要求较高,尤其是在视频制作领域,需要将视频中真人逐帧连续手绘成图画人,这个过程的费用成本和时间成本都是消耗巨大的;
现有技术中,还有另一种实现方式,即半自动半手动绘制。该种方式,主要是通过一些特定的边缘检测算法对图像中的人体边缘进行检测,将检测到的边缘像素点进行二值化,形成真人图画的初稿,然后相关专业的绘画人员基于这些粗糙的线条进行二次加工。这种方式虽然要比完全手工的方式缩短生产时间,但制作成本仍然很高,且人力投入依然很大。
那么,如何实现尽量降低人力成本、生产费用成本以及资源的消耗的同时,还能够降低真人图画的创作难度,保证真人图画的质量,成为本申请所要解决的技术问题。
发明内容
鉴于此,为解决现有技术中的上述技术问题,本发明实施例提供一种基于真人的图画自动生成方法、装置、系统及存储介质。
第一方面,本发明实施例提供一种基于真人的图画自动生成方法,该方法包括:
对预获取的原始真人图像进行处理,获取与原始真人图像对应的各个肢体部位标签图像;
对第一肢体部位标签图像进行二值化处理后,确定经过二值化处理后的第一肢体部位标签图像中是否存在孔洞,其中,第一肢体部位标签图像为除头部图像以外的任一肢体部位标签图像;
当确定经过二值化处理后的第一肢体部位标签图像中存在孔洞,且孔洞类型为预设类型时,按照预设孔洞修复规则对孔洞进行修复,获取第一图像区域;
分别对所有第一图像区域,以及预设定的头部图像区域进行颜色渲染后,获取与原始真人图像对应的图画。
在一个可能的实施方式中,当确定经过二值化处理后的第一肢体部位标签图像中存在孔洞后,识别孔洞类型是否为预设类型,具体包括:
获取经过二值化处理后的第一肢体部位标签图像中二值边缘点集合,其中,二值边缘点集合包括至少一个孔洞边缘点子集合;
根据第一孔洞边缘点子集合,确定第一孔洞的轮廓边缘在预设方向的极大值点;
获取以预设方向的极大值点为基准,预设范围内的像素点对应的标签值,并根据预设范围内的像素点对应的标签值确定第一孔洞是否为预设类型,其中,第一孔洞边缘点子集合为至少一个孔洞边缘点子集合中的任一个孔洞边缘点子集合,第一孔洞为第一肢体部位标签图像中任一孔洞。
在一个可能的实施方式中,预设方向包括:第一孔洞的轮廓边缘中的最左方向、最右方向、最上方向,以及最下方向;获取以预设方向的极大值点为基准,预设范围内的像素点对应的标签值,并根据预设范围内的像素点对应的标签值确定第一孔洞是否为预设类型,具体包括:
以最左方向的极大值点为基准,向左移动一个像素点位置,获取第一像素坐标位置;以最右方向的极大值点为基准,向右移动一个像素点位置,获取第二像素坐标位置;以最上方向的极大值点为基准,向上移动一个像素点位置,获取第三像素坐标位置;以最下方向的极值点为基准,向下移动一个像素点位置,获取第四像素坐标位置;
分别在第一肢体部位标签图像中提取第一像素坐标位置至第四像素坐标位置分别对应的标签值;
当确定第一像素坐标位置至第四像素坐标位置分别对应的标签值中,至少三个标签值相等,则确定第一孔洞类型为预设类型。
在一个可能的实施方式中,当确定经过二值化处理后的第一肢体部位标签图像中存在孔洞,且确定孔洞类型为预设类型时,按照预设孔洞修复规则对孔洞进行修复,获取第一图像区域,具体包括:
将预设类型孔洞对应的标签值替换为与第一肢体部位对应的标签值,以完成对预设类型孔洞的修复,获取第一肢体部位标签图像对应的第一图像区域。
在一个可能的实施方式中,分别对所有第一图像区域,以及预设定的头部图像区域进行颜色渲染后,获取与原始真人图像对应的图画,具体包括:
对所有第一图像区域和预设定的头部图像区域的边界进行颜色渲染;和/或,对所有第一图像区域和预设定的头部图像区域内部进行颜色渲染,以获取与原始真人图像对应的图画。
在一个可能的实施方式中,对所有第一图像区域和预设定的头部图像区域内部进行颜色渲染,以获取与原始真人图像对应的图画,具体包括:
利用预设外接矩阵函数,获取与指定图像区域对应的外接矩阵,外接矩阵中的元素包括指定图像区域内所有元素点的像素坐标数据;
根据指定图像区域内所有元素点的像素坐标数据,确定外接矩阵的长和宽;
根据外接矩阵的长和宽,确定图像区域的渲染起始点和终止点;
根据渲染起始点、渲染终止点以及指定图像区域内除渲染起始点和渲染终止点以外的其他像素点之间的位置关系,形成渲染规则;
根据渲染规则和预设渲染颜色,对指定图像区域进行渲染,获取渲染结果;
将渲染结果等比例缩放至预设要求,以获取与原始真人图像对应的图画,其中,指定图像区域为第一图像区域或预设定的头部图像区域。
在一个可能的实施方式中,根据渲染起始点、渲染终止点以及指定图像区域内除渲染起始点和渲染终止点以外的其他像素点之间的位置关系,生成渲染规则,具体包括:
根据预设置的起始点对应的第一颜色权重值,以及指定图像区域内除起始点以外的像素点与起始点之间的距离,确定指定图像区域内除起始点以外的像素点分别对应的第二颜色权重值;
根据第一颜色权重值和所有第二颜色权重值,生成第一距离图;
根据预设置的终止点对应的第三颜色权重值,以及指定图像区域内除终止点以外的像素点与终止点之间的距离,确定指定图像区域内除终止点以外的像素点分别对应的第四颜色权重值;
根据第三颜色权重值和所有第四颜色权重值,生成第二距离图;
根据第一距离图和第二距离图,形成渲染规则。
第二方面,本发明实施例提供一种基于真人的图画自动生成装置,该装置包括:
处理单元,用于对预获取的原始真人图像进行处理,获取与原始真人图像对应的各个肢体部位标签图像;对第一肢体部位标签图像进行二值化处理后,确定经过二值化处理后的第一肢体部位标签图像中是否存在孔洞,其中,第一肢体部位标签图像为除头部图像以外的任一肢体部位标签图像;
修复单元,用于当处理单元确定经过二值化处理后的第一肢体部位标签图像中存在孔洞,且孔洞类型为预设类型时,按照预设孔洞修复规则对孔洞进行修复,获取第一图像区域;
渲染单元,用于分别对所有第一图像区域,以及预设定的头部图像区域进行颜色渲染后,获取与原始真人图像对应的图画。
第三方面,本发明实施例提供一种基于真人的图画自动生成系统,该系统包括:
至少一个处理器和存储器;
处理器用于执行存储器中存储的基于真人的图画自动生成程序,以实现如第一方面任一实施方式所介绍的基于真人的图画自动生成方法。
第四方面,本发明实施例提供一种计算机存储介质,该计算机存储介质存储有一个或者多个程序,一个或者多个程序可被如第三方面所介绍的基于真人的图画自动生成系统执行,以实现如第一方面任一实施方式所介绍的基于真人的图画自动生成方法。
本发明实施例提供的一种基于真人的图画自动生成方法,首先对原始真人图像进行处理,获取各个肢体部位标签图像。然后,对第一肢体部位标签图像进行二值化处理后,确定经过二值化处理后的第一肢体部位标签图像中是否存在孔洞。当确定存在孔洞,且孔洞类型为预设类型时,按照预设孔洞修复规则对孔洞进行修复,获取第一图像区域;最终,分别对所有第一图像区域,以及预设定的头部图像区域进行颜色渲染后,获取与原始真人图像对应的图画。整个流程全部实现自动化,无需专业的工作人员参与工作,大大提升工作效率。工作过程中可以精确的分割出各个肢体部位对应的区域,然后分别进行渲染。最终获取的图画与原始真人图像之间具有较高的相似度。即,在操作过程全部实现自动化,保证图画制作的效率和质量的前提下,大大降低人力成本、生产的制作成本以及资源的消耗。同时,有效的降低了真人简笔画的创作难度,增加了普通用户的创作体验。
附图说明
图1为本发明实施例提供的一种基于真人的图画自动生成方法流程示意图;
图2为本发明提供的原始真人图像和生成的简笔画图像效果对比示意图;
图3为本发明提供的对所有第一图像区域和预设定的头部图像区域内部进行颜色渲染后的效果示意图;
图4为本发明实施例提供的一种基于真人的图画自动生成装置结构示意图;
图5为本发明实施例提供一种基于真人的图画自动生成系统结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为便于对本发明实施例的理解,下面将结合附图以具体实施例做进一步的解释说明,实施例并不构成对本发明实施例的限定。
图1为本发明实施例提供的一种基于真人的图画自动生成方法流程示意图,如图1所示,该方法包括:
步骤110,对预获取的原始真人图像进行处理,获取与原始真人图像对应的各个肢体部位标签图像。
具体的,对预获取的原始真人图像进行处理时,首先对原始真人图像进行图像识别。在一个具体的例子中,可以采用深度卷积神经网络算法实现。例如,采用maskrcnn模型对原始真人图像中的人物进行检测和分割,提取出人像的mask信息。具体实现参见如下公式:
Imask=Fmask(Iimage) (公式1)
Ipeople=Iimage*Imask (公式2)
其中,Iimage为原始真人图像,Imask为人像二值图,Fmask则为maskrcnn模型,Ipeople为提取出来的人像图片,非人像区域像素值为0。
然后,将人像图输入至预构建的人像解析模型,获取各个肢体部位标签图像。
该操作步骤实际上就是对人像图进行人体解析。将人体的各个肢体部位进行识别,从而得到各个肢体部位图像,并采用标签进行识别。例如,获取人体的头部、四肢和身体主干等肢体部位图像,然后采用标签进行标识相应的图像,获取各个肢体部位标签图像。
在一个具体的例子中进行人体解析时,可以采用人像解析模型,例如采用densepos深度学习模型进行处理。该模型在训练时,使用COCODenseposedataset数据集进行训练得到。然后采用经过训练达到预设要求的densepose深度学习模型对本实施例中的人像图进行解析。
具体的,可以将人像图输入至人像解析模型中,其输出结果就是包括人体的头部、主干身体以及四肢的图像,且每一个肢体部位图像对应不同的标签值。
具体获取标签值过程参见如下公式:
Ilabel_set=Fdensepose(Ipeople) (公式3)
其中,Fdensepose为人像解析模型,Ipeople为人像图,具体可以是人像前景三通道图像,背景为黑色。得到的结果Ilabel_set即为各个肢体部位标签图像。且,Ilabel_set为单通道的图像。另外,通过该人像解析模型,还将输出背景图像。背景图像、头部图像、主干身体图像、左胳膊图像、右胳膊图像、左腿图像以及右腿图像等对应的标签值可以分别采用0-6的数值进行表示。
例如,表达式可以表示为:Ilabel_set={Valuebackground=0,Valuehead=1,Valuebody=2,Valueleftarm=3,Valuerigharm=4,Valueleftleg=5,Valuerightleg=6}。
步骤120,对第一肢体部位标签图像进行二值化处理后,确定经过二值化处理后的第一肢体部位标签图像中是否存在孔洞。
步骤130,当确定经过二值化处理后的第一肢体部位标签图像中存在孔洞,且孔洞类型为预设类型时,按照预设孔洞修复规则对孔洞进行修复,获取第一图像区域。
具体的,由上述方法对人像图进行简单的人体解析后,除头部以外的肢体部位标签图像中可能存在孔洞。具体可以包括两种类型的孔洞。
第一种,不同肢体部位标签图像标签值集合中存在异常的背景值(0值)。例如主干肢体部位标签图像中,正常情况下,标签值应该均是2,但是却在这部分图像区域中,出现了标签值为0的区域。
第二种,可能会存在多检测区域。这种情况主要是因为由于不同动作导致肢体部位存在交集产生的孔洞,这类型孔洞实际为真实背景,不需要进行修复。
在上述两种孔洞中,第一种是需要进行优化处理的。也即是本实施例中提及的预设类型孔洞。
在下文中,将详细介绍如何识别第一种类型孔洞和第二种类型孔洞,具体参见如下:
首先,判定对第一肢体部位标签图像进行二值化处理后,图像中是否存在孔洞。
在一个具体的例子中,首先将第一肢体部位标签图像进行二值化处理,将其转换为二值图像。即,将第一肢体部位标签图像中所有非零区域标签值都设置为1,所有标签值为0的区域标签值依然为0。标签值为零的区域,也即是第一肢体部位图像中存在孔洞的区域。
具体确定孔洞类型是否为上文中所说的预设类型,则可以通过如下方式确定:
获取经过二值化处理后的第一肢体部位标签图像中二值边缘点集合,其中,二值边缘点集合包括至少一个孔洞边缘点子集合;
根据第一孔洞边缘点子集合,确定第一孔洞的轮廓边缘在预设方向的极大值点;
获取以预设方向的极大值点为基准,预设范围内的像素点对应的标签值,并根据预设范围内的像素点对应的标签值确定第一孔洞是否为预设类型,其中,第一孔洞边缘点子集合为至少一个孔洞边缘点子集合中的任一个孔洞边缘点子集合,第一孔洞为第一肢体部位标签图像中任一孔洞。
可选的,预设方向包括:第一孔洞的轮廓边缘中的最左方向、最右方向、最上方向,以及最下方向;获取以预设方向的极大值点为基准,预设范围内的像素点对应的标签值,并根据预设范围内的像素点对应的标签值确定第一孔洞是否为预设类型,具体包括:
以最左方向的极大值点为基准,向左移动一个像素点位置,获取第一像素坐标位置;以最右方向的极大值点为基准,向右移动一个像素点位置,获取第二像素坐标位置;以最上方向的极大值点为基准,向上移动一个像素点位置,获取第三像素坐标位置;以最下方向的极值点为基准,向下移动一个像素点位置,获取第四像素坐标位置;
分别在第一肢体部位标签图像中提取第一像素坐标位置至第四像素坐标位置分别对应的标签值;
当确定第一像素坐标位置至第四像素坐标位置分别对应的标签值中,至少三个标签值相等,则确定第一孔洞类型为预设类型。
在一个具体的例子中,可以采用opencv图像处理库中findcontour得到第一肢体部位标签图像的所有二值边缘点的集合Setcontour。在该集合中,包含人体正常的边缘轮廓,也包含了不同的孔洞的边缘集合。Setcontour中元素表示参见如下:Setcontour={set1,set2…setn},其中,seti={(x1,y1),(x2,y2),(x3,y3)....(xi,yi)}。
seti为Setcontour中的一个元素,也是一个子集合,例如是一个孔洞中像素集合,或者是第一肢体部位标签图像中像素集合。seti中所包含的元素就是像素集合。更准确地说,Setcontour表示所有边缘点的集合,seti表示相互独立的轮廓各自的边缘点的集合。
默认所有表示第一肢体部位的区域边缘点构成一个子集合(标签值均为1),每一个独立孔洞的各自轮廓边缘点构成一个子集合(标签值均为0)。那么,孔洞集合个数应该包括n-1个。而此时,孔洞是包括两种的,在区分时,还需要执行如下步骤确定:
在不同的孔洞边缘点子集合中,寻找各自的轮廓边缘点的极值点,例如包括最左、最右、最上和最下等的极值点。即在seti={(x1,y1),(x2,y2),(x3,y3)....(xi,yi)}中进行求值处理,获取如下极大值点:pointmax_left=(min((x1),(x2),(x3)....(xi)),yx_min_left
pointmax_right=(max((x1),(x2),(x3)....(xi)),yx_max_left);
pointmax_top=(xy_max_top,max((y1),(y2),(y3)....(yi)));
pointmax_bottom=(xy_max_bottom,min((y1),(y2),(y3)....(yi)))。
将pointmax_left左移一个像素点,位置记为p1,pointmax_right右移一个像素点,位置记为p2,pointmax_top上移一个像素点,位置记为p3,pointmax_bottom下移一个像素点,位置记为p4,
然后,在第一肢体部位标签图像中寻找P1-P4分别对应的标签值,当且仅当P1-P4中三个以上的标签值都相等(均为第一肢体部位对应的标签值)时,则可以确定第一孔洞为预设类型孔洞,也即是需要修复的孔洞。否则,就是为第二种类型的孔洞,不需要进行处理。
当针对所有孔洞都执行上述操作过程,确定孔洞类型后,就需要对已经识别出为预设类型的孔洞进行修复处理了。
可选的,可以采用如下方式进行修复:
将预设类型孔洞对应的标签值替换为与第一肢体部位对应的标签值,以完成对预设类型孔洞的修复。例如第一肢体部位为左侧胳膊,左侧胳膊的区域中有很多孔洞,预设类型孔洞区域标签值都为0,此时,将这些标签值都替换为3。此时,第一肢体部位标签图像中的孔洞修复工作完成,可以得到与第一肢体部位标签图像对应的第一图像区域,也即是第一肢体部位标签对象通过第一肢体部位标签图像的所有边缘轮廓集合点圈定的区域。
需要说明的是,步骤120至步骤130的操作需要针对除了头部以外的其他肢体部位标签图像都执行一遍,用以修复除头部以外的其他肢体部位标签图像中存在的预设类型孔洞。
再执行完上述操作后,执行步骤140。
步骤140,分别对所有第一图像区域,以及预设定的头部图像区域进行颜色渲染后,获取与原始真人图像对应的图画。
具体的,头部图像区域的标签值不做调整,就是上文中所介绍的标签值为1。具体头部区域的形状可以根据实际情况设定。一般设定为圆形区域。在对第一图像区域和预设定的头部图像区域进行颜色渲染时,可以根据实际情况设定。
例如,对所有第一图像区域和预设定的头部图像区域的边界进行颜色渲染;和/或,对所有第一图像区域和预设定的头部图像区域内部进行颜色渲染,以获取与原始真人图像对应的图画。
在具体执行时,如果是单纯的对第一图像区域和预设定的头部图像区域的边界进行颜色渲染,那么可以采用如下方式:
首先确定色彩渐变范围,例如从深绿(#1bd472):color1,到浅绿(#b8fbd4):color2。然后,利用opencv图像处理库中drawcontour函数将边缘点的集合进行着色。通过该方式,就可以实现对对所有第一图像区域和预设定的头部图像区域的边界进行颜色渲染。
可选的,当对所有第一图像区域和预设定的头部图像区域内部进行颜色渲染,以获取与原始真人图像对应的图画时,可以参见如下方式:
利用预设外接矩阵函数,获取与指定图像区域对应的外接矩阵,外接矩阵中的元素包括指定图像区域内所有元素点的像素坐标数据;
根据指定图像区域内所有元素点的像素坐标数据,确定外接矩阵的长和宽;
根据外接矩阵的长和宽,确定图像区域的渲染起始点和终止点;
根据渲染起始点、渲染终止点以及指定图像区域内除渲染起始点和渲染终止点以外的其他像素点之间的位置关系,形成渲染规则;
根据渲染规则和预设渲染颜色,对指定图像区域进行渲染,获取渲染结果;
将渲染结果等比例缩放至预设要求,以获取与原始真人图像对应的图画,其中,指定图像区域为第一图像区域或预设定的头部图像区域。
在一个具体的例子中,同样以左侧胳膊为例进行说明,首先利用opencv图像处理库中的外接矩阵函数,确定外接矩阵。外接矩阵中的元素包括左胳膊图像区域内所有元素点的像素坐标数据。根据这些像素坐标数据,来确定外接矩阵的长和宽。然后,根据外接矩阵的长和宽,确定图像区域的渲染起始点和终止点。例如,找到宽的两条边的中心点。对应的两个像素点设置为(x1,y1)和(x2,y2)。
然后,在(x1,y1)和(x2,y2)中确定渲染的起始点和终止点。
在一个具体的例子中,如果(x1,y1)所在位置靠近身体主干的左上方区域,则为起始点,(x2,y2)则为终止点;否则为(x2,y2)起始点,(x1,y1)为终止点。具体的判断过程为现有技术,这里不再做过多赘述。
在确定好起始点和终止点后,根据渲染起始点、渲染终止点以及指定图像区域内除渲染起始点和渲染终止点以外的其他像素点之间的位置关系,形成渲染规则。
可选的,在根据渲染起始点、渲染终止点以及指定图像区域内除渲染起始点和渲染终止点以外的其他像素点之间的位置关系,生成渲染规则时,可以通过如下方式实现:
根据预设置的起始点对应的第一颜色权重值,以及指定图像区域内除起始点以外的像素点与起始点之间的距离,确定指定图像区域内除起始点以外的像素点分别对应的第二颜色权重值;
根据第一颜色权重值和所有第二颜色权重值,生成第一距离图;
根据预设置的终止点对应的第三颜色权重值,以及指定图像区域内除终止点以外的像素点与所述终止点之间的距离,确定指定图像区域内除终止点以外的像素点分别对应的第四颜色权重值;
根据第三颜色权重值和所有第四颜色权重值,生成第二距离图;
根据第一距离图和第二距离图,形成渲染规则。
在一个具体的例子中,可以使用opencv图像处理库中的distranceTransform函数求解区域内所有像素点距离目标点的距离,如果目标点的颜色权重值为1,距离目标点最远的像素点,颜色权重值则为0,其他像素点的颜色权重值则在0-1之间。
假设(x1,y1)为起始点,并且作为目标点,那么,可以计算左侧胳膊区域中除了起始点以外的其他像素点与起始点之间的距离,然后确定每一个像素点对应的第二颜色权重值。这些第二颜色权重值和起始点的第一颜色权重值构成第一距离图。
类似的道理,如果将终止点(x1,y1)作为起始点,其对应的颜色权重值同样是1,为了和起始点对应的颜色权重值进行区分,这里定义为第三颜色权重值。左侧胳膊对应的图像区域中处理终止点以外的其他像素点对应的颜色权重值均定义为第四颜色权重值。由第三颜色权重值和所有第四颜色权重值共同构成第二距离图。
然后对第一距离图和第二距离图进行如下处理,生成渲染规则。
之后,根据渲染规则和预设渲染颜色,对指定图像区域进行渲染,获取渲染结果,则可以参见如下公式:
Figure BDA0002572997010000143
其中,image_distranceresult为渲染结果,
Figure BDA0002572997010000141
为第一距离图,
Figure BDA0002572997010000142
为第二距离图,color1和color2为预先设置的颜色。
公式4中,体现的实际是指定图像区域内实现颜色渐变的效果。
需要说明的是,上述渲染方式仅仅是以一个图像区域进行渲染为例进行说明,其他的图像区域执行操作步骤与上述操作过程相同或类似,这里不再赘述。
最终,将渲染结果等比例缩放至预设要求,以获取与原始真人图像对应的图画。
将所有肢体部位标签图像对应的第一图像区域或预设定的头部图像区域均通过上述方式进行颜色渲染操作后,生成的颜色渲染效果图。
图2示意出了原始图像和自动生成的简笔画对比图。左侧为原始图像,右侧为简笔画图像。图像中实际是对线条进行了颜色渲染,基于不是彩色图像,所以颜色效果没有直接进行体现。
参见图3所示,图3为分别对第一图像区域和预设定的头部图像区域内部进行颜色渲染的效果示意图。从图中颜色“轻重”可以看出,实际上体现的颜色效果应该是深浅颜色渐变的,例如,躯干部分,颜色从上到下是由颜色较深,慢慢变浅;而腿部则是从上到下由颜色较浅到逐渐变深。
本发明实施例提供的基于真人的图画自动生成方法,首先对原始真人图像进行处理,获取各个肢体部位标签图像。然后,对第一肢体部位标签图像进行二值化处理后,确定经过二值化处理后的第一肢体部位标签图像中是否存在孔洞。当确定存在孔洞,且孔洞类型为预设类型时,按照预设孔洞修复规则对孔洞进行修复,获取第一图像区域;最终,分别对所有第一图像区域,以及预设定的头部图像区域进行颜色渲染后,获取与原始真人图像对应的图画。整个流程全部实现自动化,无需专业的工作人员参与工作,大大提升工作效率。工作过程中可以精确的分割出各个肢体部位对应的区域,然后分别进行渲染。最终获取的图画与原始真人图像之间具有较高的相似度。即,在操作过程全部实现自动化,保证图画制作的效率和质量的前提下,大大降低人力成本、生产的制作成本以及资源的消耗。同时,有效的降低了真人简笔画的创作难度,增加了普通用户的创作体验。
图4为本发明实施例提供的一种基于真人的图画自动生成装置,该装置包括:处理单元401、修复单元402和渲染单元403。
处理单元401,用于对预获取的原始真人图像进行处理,获取与原始真人图像对应的各个肢体部位标签图像;对第一肢体部位标签图像进行二值化处理后,确定经过二值化处理后的第一肢体部位标签图像中是否存在孔洞,其中,第一肢体部位标签图像为除头部图像以外的任一肢体部位标签图像;
修复单元402,用于当处理单元401确定经过二值化处理后的第一肢体部位标签图像中存在孔洞,且孔洞类型为预设类型时,按照预设孔洞修复规则对孔洞进行修复,获取第一图像区域;
渲染单元403,用于分别对所有第一图像区域,以及预设定的头部图像区域进行颜色渲染后,获取与原始真人图像对应的图画。
可选的,处理单元401具体用于,获取经过二值化处理后的第一肢体部位标签图像中二值边缘点集合,其中,二值边缘点集合包括至少一个孔洞边缘点子集合;
根据第一孔洞边缘点子集合,确定第一孔洞的轮廓边缘在预设方向的极大值点;
获取以预设方向的极大值点为基准,预设范围内的像素点对应的标签值,并根据预设范围内的像素点对应的标签值确定第一孔洞是否为预设类型,其中,第一孔洞边缘点子集合为至少一个孔洞边缘点子集合中的任一个孔洞边缘点子集合,第一孔洞为第一肢体部位标签图像中任一孔洞。
可选的,预设方向包括:第一孔洞的轮廓边缘中的最左方向、最右方向、最上方向,以及最下方向;处理单元401具体用于,以最左方向的极大值点为基准,向左移动一个像素点位置,获取第一像素坐标位置;以最右方向的极大值点为基准,向右移动一个像素点位置,获取第二像素坐标位置;以最上方向的极大值点为基准,向上移动一个像素点位置,获取第三像素坐标位置;以最下方向的极值点为基准,向下移动一个像素点位置,获取第四像素坐标位置;
分别在第一肢体部位标签图像中提取第一像素坐标位置至第四像素坐标位置分别对应的标签值;
当确定第一像素坐标位置至第四像素坐标位置分别对应的标签值中,至少三个标签值相等,则确定第一孔洞类型为预设类型。
可选的,修复单元402具体用于,将预设类型孔洞对应的标签值替换为与第一肢体部位对应的标签值,以完成对预设类型孔洞的修复,获取第一肢体部位标签图像对应的第一图像区域。
可选的,渲染单元403具体用于,对所有第一图像区域和预设定的头部图像区域的边界进行颜色渲染;和/或,对所有第一图像区域和预设定的头部图像区域内部进行颜色渲染,以获取与原始真人图像对应的图画。
可选的,渲染单元403具体用于,利用预设外接矩阵函数,获取与指定图像区域对应的外接矩阵,外接矩阵中的元素包括指定图像区域内所有元素点的像素坐标数据;
根据指定图像区域内所有元素点的像素坐标数据,确定外接矩阵的长和宽;
根据外接矩阵的长和宽,确定图像区域的渲染起始点和终止点;
根据渲染起始点、渲染终止点以及指定图像区域内除渲染起始点和渲染终止点以外的其他像素点之间的位置关系,形成渲染规则;
根据渲染规则和预设渲染颜色,对指定图像区域进行渲染,获取渲染结果;
将渲染结果等比例缩放至预设要求,以获取与原始真人图像对应的图画,其中,指定图像区域为第一图像区域或预设定的头部图像区域。
可选的,渲染单元403具体用于,根据预设置的起始点对应的第一颜色权重值,以及指定图像区域内除起始点以外的像素点与起始点之间的距离,确定指定图像区域内除起始点以外的像素点分别对应的第二颜色权重值;
根据第一颜色权重值和所有第二颜色权重值,生成第一距离图;
根据预设置的终止点对应的第三颜色权重值,以及指定图像区域内除终止点以外的像素点与终止点之间的距离,确定指定图像区域内除终止点以外的像素点分别对应的第四颜色权重值;
根据第三颜色权重值和所有第四颜色权重值,生成第二距离图;
根据第一距离图和第二距离图,形成渲染规则。
本实施例提供的基于真人的图画自动生成装置中各功能部件所执行的功能均已在图1对应的实施例中做了详细介绍,因此这里不再赘述。
本发明实施例提供的一种基于真人的图画自动生成装置,首先对原始真人图像进行处理,获取各个肢体部位标签图像。然后,对第一肢体部位标签图像进行二值化处理后,确定经过二值化处理后的第一肢体部位标签图像中是否存在孔洞。当确定存在孔洞,且孔洞类型为预设类型时,按照预设孔洞修复规则对孔洞进行修复,获取第一图像区域;最终,分别对所有第一图像区域,以及预设定的头部图像区域进行颜色渲染后,获取与原始真人图像对应的图画。整个流程全部实现自动化,无需专业的工作人员参与工作,大大提升工作效率。工作过程中可以精确的分割出各个肢体部位对应的区域,然后分别进行渲染。最终获取的图画与原始真人图像之间具有较高的相似度。即,在操作过程全部实现自动化,保证图画制作的效率和质量的前提下,大大降低人力成本、生产的制作成本以及资源的消耗。同时,有效的降低了真人简笔画的创作难度,增加了普通用户的创作体验。
图5为本发明实施例提供的一种基于真人的图画自动生成系统的结构示意图,图5所示的基于真人的图画自动生成系统500包括:至少一个处理器501、存储器502、至少一个网络接口503和其他用户接口504。基于真人的图画自动生成基于真人的图画自动生成系统500中的各个组件通过总线系统505耦合在一起。可理解,总线系统505用于实现这些组件之间的连接通信。总线系统505除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图5中将各种总线都标为总线系统505。
其中,用户接口504可以包括显示器、键盘或者点击设备(例如,鼠标,轨迹球(trackball)、触感板或者触摸屏等。
可以理解,本发明实施例中的存储器502可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data RateSDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synch link DRAM,SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,DRRAM)。本文描述的存储器502旨在包括但不限于这些和任意其它适合类型的存储器。
在一些实施方式中,存储器502存储了如下的元素,可执行单元或者数据结构,或者他们的子集,或者他们的扩展集:操作系统5021和应用程序5022。
其中,操作系统5021,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序5022,包含各种应用程序,例如媒体播放器(Media Player)、浏览器(Browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序5022中。
在本发明实施例中,通过调用存储器502存储的程序或指令,具体的,可以是应用程序5022中存储的程序或指令,处理器501用于执行各方法实施例所提供的方法步骤,例如包括:
对预获取的原始真人图像进行处理,获取与原始真人图像对应的各个肢体部位标签图像;
对第一肢体部位标签图像进行二值化处理后,确定经过二值化处理后的第一肢体部位标签图像中是否存在孔洞,其中,第一肢体部位标签图像为除头部图像以外的任一肢体部位标签图像;
当确定经过二值化处理后的第一肢体部位标签图像中存在孔洞,且孔洞类型为预设类型时,按照预设孔洞修复规则对孔洞进行修复,获取第一图像区域;
分别对所有第一图像区域,以及预设定的头部图像区域进行颜色渲染后,获取与原始真人图像对应的图画。
可选的,获取经过二值化处理后的第一肢体部位标签图像中二值边缘点集合,其中,二值边缘点集合包括至少一个孔洞边缘点子集合;
根据第一孔洞边缘点子集合,确定第一孔洞的轮廓边缘在预设方向的极大值点;
获取以预设方向的极大值点为基准,预设范围内的像素点对应的标签值,并根据预设范围内的像素点对应的标签值确定第一孔洞是否为预设类型,其中,第一孔洞边缘点子集合为至少一个孔洞边缘点子集合中的任一个孔洞边缘点子集合,第一孔洞为第一肢体部位标签图像中任一孔洞。
可选的,预设方向包括:第一孔洞的轮廓边缘中的最左方向、最右方向、最上方向,以及最下方向;获取以预设方向的极大值点为基准,预设范围内的像素点对应的标签值,并根据预设范围内的像素点对应的标签值确定第一孔洞是否为预设类型,具体包括:
以最左方向的极大值点为基准,向左移动一个像素点位置,获取第一像素坐标位置;以最右方向的极大值点为基准,向右移动一个像素点位置,获取第二像素坐标位置;以最上方向的极大值点为基准,向上移动一个像素点位置,获取第三像素坐标位置;以最下方向的极值点为基准,向下移动一个像素点位置,获取第四像素坐标位置;
分别在第一肢体部位标签图像中提取第一像素坐标位置至第四像素坐标位置分别对应的标签值;
当确定第一像素坐标位置至第四像素坐标位置分别对应的标签值中,至少三个标签值相等,则确定第一孔洞类型为预设类型。
可选的,将预设类型孔洞对应的标签值替换为与第一肢体部位对应的标签值,以完成对预设类型孔洞的修复,获取第一肢体部位标签图像对应的第一图像区域。
可选的,对所有第一图像区域和预设定的头部图像区域的边界进行颜色渲染;和/或,对所有第一图像区域和预设定的头部图像区域内部进行颜色渲染,以获取与原始真人图像对应的图画。
可选的,利用预设外接矩阵函数,获取与指定图像区域对应的外接矩阵,外接矩阵中的元素包括指定图像区域内所有元素点的像素坐标数据;
根据指定图像区域内所有元素点的像素坐标数据,确定外接矩阵的长和宽;
根据外接矩阵的长和宽,确定图像区域的渲染起始点和终止点;
根据渲染起始点、渲染终止点以及指定图像区域内除渲染起始点和渲染终止点以外的其他像素点之间的位置关系,形成渲染规则;
根据渲染规则和预设渲染颜色,对指定图像区域进行渲染,获取渲染结果;
将渲染结果等比例缩放至预设要求,以获取与原始真人图像对应的图画,其中,指定图像区域为第一图像区域或预设定的头部图像区域。
可选的,根据预设置的起始点对应的第一颜色权重值,以及指定图像区域内除起始点以外的像素点与起始点之间的距离,确定指定图像区域内除起始点以外的像素点分别对应的第二颜色权重值;
根据第一颜色权重值和所有第二颜色权重值,生成第一距离图;
根据预设置的终止点对应的第三颜色权重值,以及指定图像区域内除终止点以外的像素点与终止点之间的距离,确定指定图像区域内除终止点以外的像素点分别对应的第四颜色权重值;
根据第三颜色权重值和所有第四颜色权重值,生成第二距离图;
根据第一距离图和第二距离图,形成渲染规则。
上述本发明实施例揭示的方法可以应用于处理器501中,或者由处理器501实现。处理器501可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器501中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器501可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(FieldProgrammable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件单元组合执行完成。软件单元可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器502,处理器501读取存储器502中的信息,结合其硬件完成上述方法的步骤。
可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(ApplicationSpecific Integrated Circuits,ASIC)、数字信号处理器(Digital Signal Processing,DSP)、数字信号处理设备(DSPDevice,DSPD)、可编程逻辑设备(Programmable LogicDevice,PLD)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请功能的其它电子单元或其组合中。
对于软件实现,可通过执行本文功能的单元来实现本文的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
本实施例提供的基于真人的图画自动生成系统可以是如图5中所示的基于真人的图画自动生成系统,可执行如图1中基于真人的图画自动生成方法的所有步骤,进而实现图1所示基于真人的图画自动生成方法的技术效果,具体请参照图1相关描述,为简洁描述,在此不作赘述。
本发明实施例还提供了一种存储介质(计算机可读存储介质)。这里的存储介质存储有一个或者多个程序。其中,存储介质可以包括易失性存储器,例如随机存取存储器;存储器也可以包括非易失性存储器,例如只读存储器、快闪存储器、硬盘或固态硬盘;存储器还可以包括上述种类的存储器的组合。
当存储介质中一个或者多个程序可被一个或者多个处理器执行,以实现上述在基于真人的图画自动生成系统侧执行的基于真人的图画自动生成方法。
处理器用于执行存储器中存储的基于真人的图画自动生成程序,以实现以下在基于真人的图画自动生成系统侧执行的基于真人的图画自动生成方法的步骤:
对预获取的原始真人图像进行处理,获取与原始真人图像对应的各个肢体部位标签图像;
对第一肢体部位标签图像进行二值化处理后,确定经过二值化处理后的第一肢体部位标签图像中是否存在孔洞,其中,第一肢体部位标签图像为除头部图像以外的任一肢体部位标签图像;
当确定经过二值化处理后的第一肢体部位标签图像中存在孔洞,且孔洞类型为预设类型时,按照预设孔洞修复规则对孔洞进行修复,获取第一图像区域;
分别对所有第一图像区域,以及预设定的头部图像区域进行颜色渲染后,获取与原始真人图像对应的图画。
可选的,获取经过二值化处理后的第一肢体部位标签图像中二值边缘点集合,其中,二值边缘点集合包括至少一个孔洞边缘点子集合;
根据第一孔洞边缘点子集合,确定第一孔洞的轮廓边缘在预设方向的极大值点;
获取以预设方向的极大值点为基准,预设范围内的像素点对应的标签值,并根据预设范围内的像素点对应的标签值确定第一孔洞是否为预设类型,其中,第一孔洞边缘点子集合为至少一个孔洞边缘点子集合中的任一个孔洞边缘点子集合,第一孔洞为第一肢体部位标签图像中任一孔洞。
可选的,预设方向包括:第一孔洞的轮廓边缘中的最左方向、最右方向、最上方向,以及最下方向;获取以预设方向的极大值点为基准,预设范围内的像素点对应的标签值,并根据预设范围内的像素点对应的标签值确定第一孔洞是否为预设类型,具体包括:
以最左方向的极大值点为基准,向左移动一个像素点位置,获取第一像素坐标位置;以最右方向的极大值点为基准,向右移动一个像素点位置,获取第二像素坐标位置;以最上方向的极大值点为基准,向上移动一个像素点位置,获取第三像素坐标位置;以最下方向的极值点为基准,向下移动一个像素点位置,获取第四像素坐标位置;
分别在第一肢体部位标签图像中提取第一像素坐标位置至第四像素坐标位置分别对应的标签值;
当确定第一像素坐标位置至第四像素坐标位置分别对应的标签值中,至少三个标签值相等,则确定第一孔洞类型为预设类型。
可选的,将预设类型孔洞对应的标签值替换为与第一肢体部位对应的标签值,以完成对预设类型孔洞的修复,获取第一肢体部位标签图像对应的第一图像区域。
可选的,对所有第一图像区域和预设定的头部图像区域的边界进行颜色渲染;和/或,对所有第一图像区域和预设定的头部图像区域内部进行颜色渲染,以获取与原始真人图像对应的图画。
可选的,利用预设外接矩阵函数,获取与指定图像区域对应的外接矩阵,外接矩阵中的元素包括指定图像区域内所有元素点的像素坐标数据;
根据指定图像区域内所有元素点的像素坐标数据,确定外接矩阵的长和宽;
根据外接矩阵的长和宽,确定图像区域的渲染起始点和终止点;
根据渲染起始点、渲染终止点以及指定图像区域内除渲染起始点和渲染终止点以外的其他像素点之间的位置关系,形成渲染规则;
根据渲染规则和预设渲染颜色,对指定图像区域进行渲染,获取渲染结果;
将渲染结果等比例缩放至预设要求,以获取与原始真人图像对应的图画,其中,指定图像区域为第一图像区域或预设定的头部图像区域。
可选的,根据预设置的起始点对应的第一颜色权重值,以及指定图像区域内除起始点以外的像素点与起始点之间的距离,确定指定图像区域内除起始点以外的像素点分别对应的第二颜色权重值;
根据第一颜色权重值和所有第二颜色权重值,生成第一距离图;
根据预设置的终止点对应的第三颜色权重值,以及指定图像区域内除终止点以外的像素点与终止点之间的距离,确定指定图像区域内除终止点以外的像素点分别对应的第四颜色权重值;
根据第三颜色权重值和所有第四颜色权重值,生成第二距离图;
根据第一距离图和第二距离图,形成渲染规则。
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于真人的图画自动生成方法,其特征在于,所述方法包括:
对预获取的原始真人图像进行处理,获取与所述原始真人图像对应的各个肢体部位标签图像;
对第一肢体部位标签图像进行二值化处理后,确定经过二值化处理后的第一肢体部位标签图像中是否存在孔洞,其中,所述第一肢体部位标签图像为除头部图像以外的任一肢体部位标签图像;
当确定所述经过二值化处理后的第一肢体部位标签图像中存在孔洞,且孔洞类型为预设类型时,按照预设孔洞修复规则对所述孔洞进行修复,获取第一图像区域;
分别对所有第一图像区域,以及预设定的头部图像区域进行颜色渲染后,获取与所述原始真人图像对应的图画。
2.根据权利要求1所述的方法,其特征在于,当确定所述经过二值化处理后的第一肢体部位标签图像中存在孔洞后,识别所述孔洞类型是否为预设类型,具体包括:
获取所述经过二值化处理后的第一肢体部位标签图像中二值边缘点集合,其中,所述二值边缘点集合包括至少一个孔洞边缘点子集合;
根据第一孔洞边缘点子集合,确定所述第一孔洞的轮廓边缘在预设方向的极大值点;
获取以所述预设方向的极大值点为基准,预设范围内的像素点对应的标签值,并根据所述预设范围内的像素点对应的标签值确定所述第一孔洞的类型是否为预设类型,其中,所述第一孔洞边缘点子集合为所述至少一个孔洞边缘点子集合中的任一个孔洞边缘点子集合,所述第一孔洞为所述第一肢体部位标签图像中任一孔洞。
3.根据权利要求2所述的方法,其特征在于,所述预设方向包括:所述第一孔洞的轮廓边缘中的最左方向、最右方向、最上方向,以及最下方向;所述获取以所述预设方向的极大值点为基准,预设范围内的像素点对应的标签值,并根据所述预设范围内的像素点对应的标签值确定所述第一孔洞的类型是否为预设类型,具体包括:
以所述最左方向的极大值点为基准,向左移动一个像素点位置,获取第一像素坐标位置;以所述最右方向的极大值点为基准,向右移动一个像素点位置,获取第二像素坐标位置;以所述最上方向的极大值点为基准,向上移动一个像素点位置,获取第三像素坐标位置;以所述最下方向的极值点为基准,向下移动一个像素点位置,获取第四像素坐标位置;
分别在所述第一肢体部位标签图像中提取所述第一像素坐标位置至所述第四像素坐标位置分别对应的标签值;
当确定所述第一像素坐标位置至所述第四像素坐标位置分别对应的标签值中,至少三个标签值相等,则确定所述第一孔洞的类型为预设类型。
4.根据权利要求2或3所述的方法,其特征在于,所述当确定所述经过二值化处理后的第一肢体部位标签图像中存在孔洞,且确定所述孔洞类型为预设类型时,按照预设孔洞修复规则对所述孔洞进行修复,获取第一图像区域,具体包括:
将预设类型孔洞对应的标签值替换为与第一肢体部位对应的标签值,以完成对所述预设类型孔洞的修复,获取所述第一肢体部位标签图像对应的第一图像区域。
5.根据权利要求1所述的方法,其特征在于,所述分别对所有第一图像区域,以及所述预设定的头部图像区域进行颜色渲染后,获取与所述原始真人图像对应的图画,具体包括:
对所有第一图像区域和所述预设定的头部图像区域的边界进行颜色渲染;和/或,对所有第一图像区域和所述预设定的头部图像区域内部进行颜色渲染,以获取与所述原始真人图像对应的图画。
6.根据权利要求5所述的方法,其特征在于,所述对所有第一图像区域和所述预设定的头部图像区域内部进行颜色渲染,以获取与所述原始真人图像对应的图画,具体包括:
利用预设外接矩阵函数,获取与指定图像区域对应的外接矩阵,所述外接矩阵中的元素包括所述指定图像区域内所有元素点的像素坐标数据;
根据所述指定图像区域内所有元素点的像素坐标数据,确定所述外接矩阵的长和宽;
根据所述外接矩阵的长和宽,确定所述图像区域的渲染起始点和渲染终止点;
根据所述渲染起始点、所述渲染终止点以及所述指定图像区域内除所述渲染起始点和渲染终止点以外的其他像素点之间的位置关系,形成渲染规则;
根据所述渲染规则和预设渲染颜色,对所述指定图像区域进行渲染,获取渲染结果;
将所述渲染结果等比例缩放至预设要求,以获取与所述原始真人图像对应的图画,其中,所述指定图像区域为所述第一图像区域或所述预设定的头部图像区域。
7.根据权利要求6所述的方法,其特征在于,所述根据所述渲染起始点、所述渲染终止点以及所述指定图像区域内除所述渲染起始点和渲染终止点以外的其他像素点之间的位置关系,生成渲染规则,具体包括:
根据预设置的所述起始点对应的第一颜色权重值,以及所述指定图像区域内除所述起始点以外的像素点与所述起始点之间的距离,确定所述指定图像区域内除所述起始点以外的像素点分别对应的第二颜色权重值;
根据所述第一颜色权重值和所有第二颜色权重值,生成第一距离图;
根据预设置的所述终止点对应的第三颜色权重值,以及所述指定图像区域内除所述终止点以外的像素点与所述终止点之间的距离,确定所述指定图像区域内除所述终止点以外的像素点分别对应的第四颜色权重值;
根据所述第三颜色权重值和所有第四颜色权重值,生成第二距离图;
根据所述第一距离图和所述第二距离图,形成所述渲染规则。
8.一种基于真人的图画自动生成装置,其特征在于,所述装置包括:
处理单元,用于对预获取的原始真人图像进行处理,获取与所述原始真人图像对应的各个肢体部位标签图像;对第一肢体部位标签图像进行二值化处理后,确定经过二值化处理后的第一肢体部位标签图像中是否存在孔洞,其中,所述第一肢体部位标签图像为除头部图像以外的任一肢体部位标签图像;
修复单元,用于当所述处理单元确定所述经过二值化处理后的第一肢体部位标签图像中存在孔洞,且孔洞类型为预设类型时,按照预设孔洞修复规则对所述孔洞进行修复,获取第一图像区域;
渲染单元,用于分别对所有第一图像区域,以及预设定的头部图像区域进行颜色渲染后,获取与所述原始真人图像对应的图画。
9.一种基于真人的图画自动生成系统,其特征在于,所述系统包括:至少一个处理器和存储器;
所述处理器用于执行所述存储器中存储的基于真人的图画自动生成程序,以实现权利要求1~7中任一项所述的基于真人的图画自动生成方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有一个或者多个程序,所述一个或者多个程序可被如权利要求9所述的基于真人的图画自动生成系统执行,以实现权利要求1~7中任一项所述的基于真人的图画自动生成方法。
CN202010648918.2A 2020-07-07 2020-07-07 基于真人的图画自动生成方法、装置、系统及存储介质 Active CN111833420B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010648918.2A CN111833420B (zh) 2020-07-07 2020-07-07 基于真人的图画自动生成方法、装置、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010648918.2A CN111833420B (zh) 2020-07-07 2020-07-07 基于真人的图画自动生成方法、装置、系统及存储介质

Publications (2)

Publication Number Publication Date
CN111833420A CN111833420A (zh) 2020-10-27
CN111833420B true CN111833420B (zh) 2023-06-30

Family

ID=72901175

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010648918.2A Active CN111833420B (zh) 2020-07-07 2020-07-07 基于真人的图画自动生成方法、装置、系统及存储介质

Country Status (1)

Country Link
CN (1) CN111833420B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012113438A (ja) * 2010-11-22 2012-06-14 Nippon Hoso Kyokai <Nhk> 姿勢推定装置および姿勢推定プログラム
JP2013190974A (ja) * 2012-03-13 2013-09-26 Satoru Ichimura 情報処理装置および情報処理方法、ならびに、プログラム
JP2015060061A (ja) * 2013-09-18 2015-03-30 日本コントロールシステム株式会社 カラオケ装置、画像出力方法、およびプログラム
WO2017107773A1 (zh) * 2015-12-24 2017-06-29 努比亚技术有限公司 一种局部图像处理方法、装置及计算机存储介质
WO2019047492A1 (zh) * 2017-09-08 2019-03-14 深圳市无牙太赫兹科技有限公司 一种人体图像映射方法、系统及终端设备
WO2019071990A1 (zh) * 2017-10-11 2019-04-18 中兴通讯股份有限公司 图像处理方法及装置
JP2020027462A (ja) * 2018-08-13 2020-02-20 セコム株式会社 画像処理装置
WO2020038207A1 (en) * 2018-08-21 2020-02-27 Huawei Technologies Co., Ltd. Binarization and normalization-based inpainting for removing text
CN111127603A (zh) * 2020-01-06 2020-05-08 北京字节跳动网络技术有限公司 动画生成方法、装置、电子设备及计算机可读存储介质
CN111243050A (zh) * 2020-01-08 2020-06-05 浙江省北大信息技术高等研究院 肖像简笔画生成方法、系统及绘画机器人

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012113438A (ja) * 2010-11-22 2012-06-14 Nippon Hoso Kyokai <Nhk> 姿勢推定装置および姿勢推定プログラム
JP2013190974A (ja) * 2012-03-13 2013-09-26 Satoru Ichimura 情報処理装置および情報処理方法、ならびに、プログラム
JP2015060061A (ja) * 2013-09-18 2015-03-30 日本コントロールシステム株式会社 カラオケ装置、画像出力方法、およびプログラム
WO2017107773A1 (zh) * 2015-12-24 2017-06-29 努比亚技术有限公司 一种局部图像处理方法、装置及计算机存储介质
WO2019047492A1 (zh) * 2017-09-08 2019-03-14 深圳市无牙太赫兹科技有限公司 一种人体图像映射方法、系统及终端设备
WO2019071990A1 (zh) * 2017-10-11 2019-04-18 中兴通讯股份有限公司 图像处理方法及装置
JP2020027462A (ja) * 2018-08-13 2020-02-20 セコム株式会社 画像処理装置
WO2020038207A1 (en) * 2018-08-21 2020-02-27 Huawei Technologies Co., Ltd. Binarization and normalization-based inpainting for removing text
CN111127603A (zh) * 2020-01-06 2020-05-08 北京字节跳动网络技术有限公司 动画生成方法、装置、电子设备及计算机可读存储介质
CN111243050A (zh) * 2020-01-08 2020-06-05 浙江省北大信息技术高等研究院 肖像简笔画生成方法、系统及绘画机器人

Also Published As

Publication number Publication date
CN111833420A (zh) 2020-10-27

Similar Documents

Publication Publication Date Title
US10789504B2 (en) Method and device for extracting information in histogram
CN104866868B (zh) 基于深度神经网络的金属币识别方法和装置
US9449253B2 (en) Learning painting styles for painterly rendering
CN107516316B (zh) 一种在fcn中引入聚焦机制对静态人体图像进行分割的方法
JP6089886B2 (ja) 領域分割方法および検査装置
JP6929322B2 (ja) データ拡張システム、データ拡張方法、及びプログラム
JP7477260B2 (ja) 情報処理装置、情報処理プログラム及び情報処理方法
CN113673338B (zh) 自然场景文本图像字符像素弱监督自动标注方法、系统及介质
CN110582783B (zh) 训练装置、图像识别装置、训练方法和计算机可读信息存储介质
CN106570515A (zh) 处理医学图像的方法和系统
CN115812221A (zh) 图像生成及着色方法及装置
KR20220012788A (ko) 시설 평면도에 포함된 기호 분석 장치 및 방법
CN113158977B (zh) 改进FANnet生成网络的图像字符编辑方法
CN113989167B (zh) 基于种子点自生长的轮廓提取方法、装置、设备及介质
JP3740351B2 (ja) 画像加工装置および方法およびこの方法の実行プログラムを記録した記録媒体
CN112784531A (zh) 一种基于深度学习和部件拼接的中文字形及字库生成方法
Chen et al. A review of image and video colorization: From analogies to deep learning
KR102430743B1 (ko) 데이터 증강 기반 사물 분석 모델 학습 장치 및 방법
CN111833420B (zh) 基于真人的图画自动生成方法、装置、系统及存储介质
CN114299184B (zh) 基于语义匹配的藏式建筑彩绘线稿图上色方法及装置
Martinez-Seis et al. Identification of Static and Dynamic Signs of the Mexican Sign Language Alphabet for Smartphones using Deep Learning and Image Processing.
CN112884074B (zh) 基于决策树的图像设计方法、设备、存储介质及装置
Sun et al. Mural2sketch: A combined line drawing generation method for ancient mural painting
CN114565702A (zh) 文本图像生成方法、装置及电子设备
CN113033656B (zh) 一种基于生成对抗网络的交互式孔探数据扩展方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant