CN117058284A - 图像生成方法、装置和计算机可读存储介质 - Google Patents
图像生成方法、装置和计算机可读存储介质 Download PDFInfo
- Publication number
- CN117058284A CN117058284A CN202311027550.8A CN202311027550A CN117058284A CN 117058284 A CN117058284 A CN 117058284A CN 202311027550 A CN202311027550 A CN 202311027550A CN 117058284 A CN117058284 A CN 117058284A
- Authority
- CN
- China
- Prior art keywords
- image
- skeleton
- rendering
- features
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 75
- 238000009877 rendering Methods 0.000 claims abstract description 359
- 210000000988 bone and bone Anatomy 0.000 claims abstract description 132
- 238000013507 mapping Methods 0.000 claims abstract description 49
- 230000009471 action Effects 0.000 claims abstract description 21
- 238000012545 processing Methods 0.000 claims description 45
- 230000036544 posture Effects 0.000 claims description 25
- 238000010586 diagram Methods 0.000 claims description 23
- 238000000605 extraction Methods 0.000 claims description 22
- 238000012549 training Methods 0.000 claims description 17
- 238000007499 fusion processing Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 9
- 230000008569 process Effects 0.000 description 13
- 238000013473 artificial intelligence Methods 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 10
- 238000004519 manufacturing process Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000009792 diffusion process Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 238000005452 bending Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001427 coherent effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000001815 facial effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T13/00—Animation
- G06T13/20—3D [Three Dimensional] animation
- G06T13/40—3D [Three Dimensional] animation of characters, e.g. humans, animals or virtual beings
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Processing Or Creating Images (AREA)
Abstract
本申请实施例公开了一种图像生成方法、装置和计算机可读存储介质;通过获取骨骼图像,骨骼图像包括配置有预设的骨骼姿势的骨骼结构;采用绘图控制模型对骨骼图像进行特征提取,得到目标骨骼图特征;通过绘图控制模型基于学习到的骨骼图特征和渲染图特征的映射关系,将目标骨骼图特征映射为目标渲染图特征,作为渲染控制特征输入到绘图模型中,骨骼图特征和渲染图特征为分别从匹配的骨骼姿态图和虚拟角色渲染图中提取的特征;通过绘图模型根据渲染控制特征,确定骨骼图像对应的角色渲染图像特征;基于角色渲染图像特征通过绘图模型绘制与骨骼图像中指示的骨骼姿势匹配的角色渲染图像。实现对图像中角色的动作细节进行精准控制,提高图像生成质量。
Description
技术领域
本申请涉及互联网技术领域,具体涉及一种图像生成方法、装置和计算机可读存储介质。
背景技术
传统的动画制作方法需要动画师进行逐帧的创作,动画制作过程需要大量的人力、物力和时间。随着互联网技术的快速发展,动画制作方法也得快速发展,例如,将人工智能(AI)技术应用在动画制作中,采用AI技术生成动画图像,进而大大提高了动画制作的效率和质量。
在对现有技术的研究和实践过程中发现,现有的基于AI动画生成技术的图像生成方法中,在对图像进行调整时,无法对图像画面中角色的动作细节进行精准控制,使得生成的图像质量较差。
发明内容
本申请实施例提供一种图像生成方法、装置和计算机可读存储介质,可以对图像中角色的动作细节进行精准控制,提高图像生成质量。
本申请实施例提供一种图像生成方法,包括:
获取骨骼图像,所述骨骼图像包括配置有预设的骨骼姿势的骨骼结构;
采用绘图控制模型对所述骨骼图像进行特征提取,得到目标骨骼图特征;
通过所述绘图控制模型基于学习到的骨骼图特征和渲染图特征的映射关系,将所述目标骨骼图特征映射为目标渲染图特征,以将所述目标渲染图特征作为渲染控制特征输入到绘图模型中,所述骨骼图特征和渲染图特征为分别从匹配的骨骼姿态图和虚拟角色渲染图中提取的特征;
通过所述绘图模型根据所述渲染控制特征,确定所述骨骼图像对应的角色渲染图像特征;
基于所述角色渲染图像特征通过所述绘图模型绘制出与所述骨骼图像中指示的骨骼姿势匹配的角色渲染图像。
相应的,本申请实施例提供一种图像生成装置,包括:
图像获取单元,用于获取骨骼图像,所述骨骼图像包括配置有预设的骨骼姿势的骨骼结构;
特征提取单元,用于采用绘图控制模型对所述骨骼图像进行特征提取,得到目标骨骼图特征;
特征映射单元,用于通过所述绘图控制模型基于学习到的骨骼图特征和渲染图特征的映射关系,将所述目标骨骼图特征映射为目标渲染图特征,以将所述目标渲染图特征作为渲染控制特征输入到绘图模型中,所述骨骼图特征和渲染图特征为分别从匹配的骨骼姿态图和虚拟角色渲染图中提取的特征;
特征确定单元,用于通过所述绘图模型根据所述渲染控制特征,确定所述骨骼图像对应的角色渲染图像特征;
图像绘制单元,用于基于所述角色渲染图像特征通过所述绘图模型绘制出与所述骨骼图像中指示的骨骼姿势匹配的角色渲染图像。
此外,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行本申请实施例所提供的任一种图像生成方法中的步骤。
此外,本申请实施例还提供一种计算机设备,包括处理器和存储器,所述存储器存储有应用程序,所述处理器用于运行所述存储器内的应用程序实现本申请实施例提供的图像生成方法。
本申请实施例还提供一种计算机程序产品或计算机程序,所述计算机程序产品或计算机程序包括计算机指令,所述计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取所述计算机指令,处理器执行所述计算机指令,使得所述计算机设备执行本申请实施例提供的图像生成方法中的步骤。
本申请实施例通过获取骨骼图像,骨骼图像包括配置有预设的骨骼姿势的骨骼结构;采用绘图控制模型对骨骼图像进行特征提取,得到目标骨骼图特征;通过绘图控制模型基于学习到的骨骼图特征和渲染图特征的映射关系,将目标骨骼图特征映射为目标渲染图特征,以将目标渲染图特征作为渲染控制特征输入到绘图模型中,骨骼图特征和渲染图特征为分别从匹配的骨骼姿态图和虚拟角色渲染图中提取的特征;通过绘图模型根据渲染控制特征,确定骨骼图像对应的角色渲染图像特征;基于角色渲染图像特征通过绘图模型绘制出与骨骼图像中指示的骨骼姿势匹配的角色渲染图像。以此,通过采用绘图控制模型提取配置有预设的骨骼姿势的骨骼结构的骨骼图像的目标骨骼图特征,从而根据绘图控制模型学习到的骨骼图特征和渲染图特征的映射关系,将目标骨骼图特征映射为表征根据骨骼图像指示的骨骼姿势需要绘制的图像的目标渲染图特征,作为渲染控制特征输入到绘图模型中,并通过绘图模型基于渲染控制特征确定指示最终需要绘图的图像的角色渲染图像特征,进而基于角色渲染图像特征通过绘图模型绘制出与骨骼图像中指示的骨骼姿势匹配的角色渲染图像,实现对图像中角色的动作细节进行精准控制,进而提高图像生成质量。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种图像生成方法实施场景示意图;
图2是本申请实施例提供的一种图像生成方法的流程示意图;
图3a是本申请实施例提供的一种图像生成方法的骨骼结构示意图;
图3b是本申请实施例提供的一种图像生成方法的骨骼图示意图;
图4是本申请实施例提供的一种图像生成方法的模型架构示意图;
图5是本申请实施例提供的图像生成装置的结构示意图;
图6是本申请实施例提供的计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例提供一种图像生成方法、装置和计算机可读存储介质。其中,该图像生成装置可以集成在计算机设备中,该计算机设备可以是服务器,也可以是终端等设备。
其中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、网络加速服务(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以包括但不限于手机、电脑、智能语音交互设备、智能家电、车载终端、飞行器等。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
请参阅图1,以图像生成装置集成在计算机设备中为例,图1为本申请实施例所提供的图像生成方法的实施场景示意图,其中,该计算机设备可以为服务器或者终端,该计算机设备可以获取骨骼图像,骨骼图像包括配置有预设的骨骼姿势的骨骼结构;采用绘图控制模型对骨骼图像进行特征提取,得到目标骨骼图特征;通过绘图控制模型基于学习到的骨骼图特征和渲染图特征的映射关系,将目标骨骼图特征映射为目标渲染图特征,以将目标渲染图特征作为渲染控制特征输入到绘图模型中,骨骼图特征和渲染图特征为分别从匹配的骨骼姿态图和虚拟角色渲染图中提取的特征;通过绘图模型根据渲染控制特征,确定骨骼图像对应的角色渲染图像特征;基于角色渲染图像特征通过绘图模型绘制出与骨骼图像中指示的骨骼姿势匹配的角色渲染图像。
需要说明的是,图1所示的图像生成方法的实施环境场景示意图仅仅是一个示例,本申请实施例描述的图像生成方法的实施环境场景是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定。本领域普通技术人员可知,随着数据处理的演变和新业务场景的出现,本申请提供的技术方案对于类似的技术问题,同样适用。
本申请实施例提供的方案具体通过如下实施例进行说明。需要说明的是,以下实施例的描述顺序不作为对实施例优选顺序的限定。
本实施例将从图像生成装置的角度进行描述,该图像生成装置具体可以集成在计算机设备中,该计算机设备可以是终端和/或服务器,本申请在此不作限制。
请参阅图2,图2是本申请实施例提供的图像生成方法的流程示意图。该图像生成方法包括:
在步骤101中,获取骨骼图像。
其中,该骨骼图像可以包括配置有预设的骨骼姿势的骨骼结构,该骨骼姿势可以指示一动作或者姿态,比如,可以指示招手、躺着、坐着、弯腰、叉腰、斜靠等动作或者姿态。
可选的,该骨骼结构可以包括人形或者动物的身体骨骼,以及关联在身体骨骼上的眼睛部件节点,通过在身体骨骼上添加额外的两个眼睛部件,可以根据眼睛的位置,辅助人工智能模型判断角色的面部的朝向,在模型训练过程中,可以使得模型根据眼睛和身体骨骼的位置关系,总结出脸部朝向和身体骨骼之间的规律,进而可以绘制出更加灵活、准确的角色图像,提高图像生成质量。例如,请参考图3a,图3a是本申请实施例提供的一种图像生成方法的骨骼结构示意图,展示了骨骼结构的正面特写、正面半身、正面全身、右前四分之三以及背面特写、背面半身、背面全身、右后四分之三方向的形态,其中,骨骼结构中包括身体骨骼以及眼睛部件。
可选的,获取骨骼图像的方式可以有多种,例如,可以从预设的骨骼动画中提取出骨骼动画帧作为骨骼图像。
其中,该骨骼动画可以为用于指示需要生成的动画中角色的动作、姿态变换情况的动画,在骨骼动画中可以包括角色的骨骼模型,骨骼模型具有互相连接的“骨骼”组成的骨架结构,也即骨骼结构,通过改变骨骼的朝向和位置来为模型生成动画。该骨骼动画帧可以为骨骼动画中的动画帧。
其中,从预设的骨骼动画中提取出骨骼动画帧作为骨骼图像的方式可以有多种,例如,可以获取预设的骨骼动画,响应针对骨骼动画中骨骼模型的骨骼结构显示设置,得到显示骨骼模型的骨骼结构的骨骼动画,对显示骨骼结构的骨骼动画中的骨骼动画帧进行截图处理,得到骨骼动画对应的骨骼图像。
其中,骨骼动画中可以包括骨骼模型,该骨骼模型可以为绑定了三维模型的骨骼,在骨骼绑定了三维模型之后,可以通过移动骨骼结构中的节点来控制骨骼模型的形状和姿势变化。该骨骼结构可以包括身体骨骼,以及关联在身体骨骼上的眼睛部件节点。该身体骨骼可以为玛雅3D制作软件(Maya)内原生的骨骼,可以在该身体骨骼上添加两个眼睛部件,得到最终的骨骼结构。可选的,在骨骼动画制作完成后,可以对骨骼动画中骨骼模型进行骨骼结构显示设置,以在骨骼动画中只显示自定义的骨骼结构,并对只显示骨骼结构的骨骼动画进行逐帧录屏,从而可以在骨骼动画中获取到骨骼图像。
在步骤102中,采用绘图控制模型对骨骼图像进行特征提取,得到目标骨骼图特征。
其中,该绘图控制模型可以为对绘图模型进行绘图控制的模型,该绘图模型可以为基于人工智能(AI)技术进行图像绘制的模型,可以为Stable Diffusion(SD模型,AI动画生成工具)等扩散模型。可选的,该绘图控制模型可以为训练好的控制模型(ControlNet),可以用于控制AI图像生成的插件。该目标骨骼图特征可以表征骨骼图像的特征,可以包括骨骼图像中骨骼结构的摆放姿势、动作等姿态信息。
在步骤103中,通过绘图控制模型基于学习到的骨骼图特征和渲染图特征的映射关系,将目标骨骼图特征映射为目标渲染图特征,以将目标渲染图特征作为渲染控制特征输入到绘图模型中。
其中,该骨骼图特征和渲染图特征可以为分别从匹配的骨骼姿态图和虚拟角色渲染图中提取的特征,该骨骼图特征可以为表征骨骼姿态图的特征,可以包括骨骼姿态图中骨骼结构的姿态信息,该渲染图特征可以为表征虚拟角色渲染图的特征,可以指示虚拟角色在骨骼姿态图指示的骨骼姿势下的渲染结果,以此,绘图控制模型通过在模型训练过程中学习到骨骼图特征和渲染图特征的映射关系,可以获取到根据骨骼图像中指示的骨骼结构的骨骼姿势确定应该渲的画面的能力。该目标渲染图特征可以为绘图控制模型基于学习到的骨骼图特征和渲染图特征的映射关系,对目标骨骼图特征进行特征映射得到的特征,用于指示基于骨骼图像中指示的骨骼姿势应该渲染得到的画面信息,可以作为渲染控制特征输入到绘图模型中,渲染控制特征可以为绘图控制模型输入到绘图模型中,用于控制绘图模型绘制出与骨骼图像中指示的骨骼姿势匹配的角色图像。
可选的,在匹配的骨骼姿态图和虚拟角色渲染图中,虚拟角色渲染图可以为根据骨骼姿态图中骨骼结构进行渲染得到的图像,例如,请参考图3b,图3b是本申请实施例提供的一种图像生成方法的骨骼图示意图,可以通过骨骼姿态图中指示的骨骼结构进行三维模型渲染,得到该骨骼姿态图对应的虚拟角色渲染图。
可选的,绘图控制模型学习骨骼图特征和渲染图特征之间的映射关系的模型训练过程中,骨骼姿态图和虚拟角色渲染图可以配置有相同的描述信息(prompt),从而可以对骨骼姿态图和虚拟角色渲染图以及描述信息进行特征提取,通过描述信息对应的文本特征,将骨骼图特征和渲染图特征在绘图控制模型对应的特征空间中进行特征对齐,从而可以通过训练好的绘图控制模型,根据骨骼图特征在绘图控制模型对应的特征空间中提取出骨骼图特征对应的渲染图特征。
在步骤104中,通过绘图模型根据渲染控制特征,确定骨骼图像对应的角色渲染图像特征。
其中,该角色渲染图像特征可以为根据渲染控制特征确定的、用于通过绘图模型绘制出与骨骼图像中指示的骨骼姿势匹配的角色图像,在该角色图像中角色以骨骼图像中指示的骨骼姿势存在,即基于该角色渲染图像特征可以控制绘图模型绘制出最终需要的图像。
其中,通过绘图模型根据渲染控制特征,确定骨骼图像对应的角色渲染图像特征的方式可以有多种,例如,可以通过绘图模型对预设的图像描述信息进行特征提取,得到文本特征,通过绘图模型基于渲染控制特征和文本特征,获得骨骼图像对应的角色渲染图像特征。
其中,该图像描述信息(prompt)可以为描述需要生成的角色图像中图像内容的信息,该图像内容可以包括颜色、布局、角色等相关信息,在该角色图像中角色以骨骼图像中指示的骨骼姿势存在,并且角色图像中内容与图像描述信息指示的内容匹配,该文本特征可以为表征图像描述信息的特征。
其中,通过绘图模型对预设的图像描述信息进行特征提取,得到文本特征的方式可以有多种,例如,请参考图4,图4是本申请实施例提供的一种图像生成方法的模型架构示意图,其中,左侧为绘图控制模型,绘图控制模型中可以包括第一编码器模块和第一中间处理模块,右侧为绘图模型,绘图模型中可以包括第二编码器模块、第二中间处理模块和第二解码器模块,第一中间处理模型可以通过卷积层与第二中间处理模块进行连接,第一编码器模块可以通过卷积层与第二解码器模块进行连接,第一编码器模块和第二编码器模块中提供编码器(encoder)进行特征编码处理,第二解码器中提供解码器(decoder)进行特征解码处理。以此,可以通过绘图模型的第二编码器模块对预设的图像描述信息进行特征编码,得到图像描述信息对应的文本特征;相应的,通过绘图模型基于渲染控制特征和文本特征,获得骨骼图像对应的角色渲染图像特征的方式可以有多种,例如,可以通过绘图模型中与第二编码器模块连接的第二中间处理模块,接收文本特征和从第一中间处理模块输出的一渲染控制特征,并对文本特征和渲染控制特征进行特征融合处理,得到第一角色渲染图像特征,将第一角色渲染图像特征输入第二解码器模块,通过第二解码器模块对第一角色渲染图像特征以及第一编码器模块输出的一渲染控制特征进行特征融合处理,得到骨骼图像对应的角色渲染图像特征。
其中,第一中间处理模块输出的一渲染控制特征和第一编码器模块输出的一渲染控制特征都为渲染控制特征中的一部分特征,可以为渲染控制特征中输出到第一中间处理模块的特征以及输出到第一编码器模块中的特征。该第一角色渲染图像特征可以为将文本特征和从第一中间处理模块输出的一渲染控制特征进行特征融合后得到的特征。
可选的,该卷积层可以为零卷积层(zero convolution),该第一解码器模块和第二解码器模块中的解码器可以为跳跃连接解码器,通过该解码器可以将第一角色渲染图像特征以及第一编码器模块输出的一渲染控制特征进行特征融合处理,得到骨骼图像对应的角色渲染图像特征。
在步骤105中,基于角色渲染图像特征通过绘图模型绘制出与骨骼图像中指示的骨骼姿势匹配的角色渲染图像。
其中,该角色渲染图像可以为与骨骼图像中指示的骨骼姿势以及图像描述信息匹配的图像,在该角色渲染图像中可以包括虚拟的角色,该角色可以为人物或者动物等对象,该角色渲染图像中虚拟角色的姿势或者动作可以与该骨骼图像中指示的骨骼姿势相同,可选的,在绘图模型中输入图像描述信息时,该角色渲染图像中图像内容可以与图像描述信息描述的图像匹配,且角色渲染图像中虚拟角色的姿势或者动作可以与该骨骼图像中指示的骨骼姿势相同。
可选的,该骨骼图像可以为预设的骨骼动画中的各帧骨骼动画帧,在得到每一帧的骨骼图像对应的角色渲染图像之后,可以基于骨骼动画中各骨骼动画帧对应的角色渲染图像,生成骨骼动画对应的目标动画。
其中,该目标动画可以为根据骨骼动画中每一骨骼动画帧对应的角色渲染图像生成的动画。
其中,传统的动画制作方法需要动画师对动画中的图像进行逐帧的创作,动画制作过程需要大量的人力、物力和时间。随着互联网技术的快速发展,动画制作方法也得快速发展,例如,将人工智能(AI)技术应用在动画制作中,采用AI技术生成动画,进而大大提高了动画制作的效率和质量。然而,现有的基于AI技术的动画图像生成方法中,每一帧动画图像都是独立生成,导致画面间的连贯性较差,进而使得动画中画面闪烁严重,且无法对动画画面中的动作细节进行精准控制,使得生成的动画质量较差,图像生成的效率较低。为此,本申请实施例提供的图像生成方法中,通过根据需要生成的动画预先制作对应的骨骼动画,从而从预设的骨骼动画中提取出骨骼动画帧作为骨骼图像,根据每一帧的骨骼图像中指示的骨骼结构的骨骼姿势绘制出每一帧骨骼图像对应的角色渲染图像,从而可以基于骨骼动画中各骨骼动画帧对应的角色渲染图像,生成骨骼动画对应的连续的目标动画,以此,可以基于骨骼动画生成的连续的角色渲染图像生成目标动画,可以有效提高目标动画的画面连贯性,进而避免现有技术中生成的动画中画面闪烁严重的问题,同时,可以基于骨骼动画的创建,可以对目标动画中的动作细节进行精准控制,提高了生成的动画质量,进而提升图像生成的效率。
在一实施例中,对绘图控制模型进行模型训练的方式可以有多种,例如,可以获取骨骼姿态图以及骨骼姿态图对应的虚拟角色渲染图,对骨骼姿态图进行特征提取,得到骨骼姿态图对应的骨骼图特征,采用预设绘图控制模型对骨骼图特征进行渲染特征映射,得到骨骼图特征对应的渲染图特征,基于渲染图特征,通过绘图模型确定骨骼姿态图对应的预测角色渲染图像特征,根据预测角色渲染图像特征控制绘图模型绘制出预测角色渲染图,根据预测角色渲染图和虚拟角色渲染图,计算绘图损失信息,基于绘图损失信息对预设绘图控制模型进行收敛,得到训练好绘图控制模型。
其中,该骨骼姿态图可以为包括骨骼结构的图像,该骨骼结构被配置有一预设的骨骼姿势,该虚拟角色渲染图基于骨骼姿态图渲染得到,可以为对骨骼姿态图中骨骼结构进行三维模型渲染后得到的图像。该预测角色渲染图像特征可以为绘图模型基于渲染图特征提取出的图像特征,用于采用绘图模型绘制出与骨骼姿态图中指示的骨骼姿势匹配的图像,在该图像中角色的姿势与骨骼姿态图中指示的骨骼姿势相同。该预测角色渲染图可以为基于预测角色渲染图像特征通过绘图模型绘制出的图像。该绘图损失信息可以为表征预测角色渲染图和虚拟角色渲染图之间的差距的信息,用于对预设绘图控制模型的权重参数进行更新。
可选的,该绘图模型可以包括依次连接的第二编码器模块和第二中间处理模块以及第二解码器模块,该预设绘图控制模型可以包括第一编码器模块和第一中间处理模块,第一编码器模块和第二编码器模块的权重参数可以相同,绘图模型在训练过程中权重参数锁定,预设绘图控制模型在训练过程中权重参数未锁定。其中,可以复制第二编码器模块的权重参数作为预设绘图控制模型中第一编码器模块的初始的权重参数,请继续参考图4,第一编码器模块和第二解码器模块基于卷积层进行连接,第一中间处理模块和第二中间处理基于卷积层进行连接。其中,在对预设绘图控制模型的训练过程中,只对预设绘图控制模型中未锁定的权重参数进行更新,采用复制绘图模型的权重参数对预设绘图控制模型进行训练,可以避免在数据集较小的情况下过拟合,并且能够保持从数十亿图像中学习得到的大型的绘图模型的高质量绘图能力。
可选的,获取骨骼姿态图以及骨骼姿态图对应的虚拟角色渲染图的方式可以有多种,例如,可以创建样本骨骼结构,基于预设动作对样本骨骼结构进行姿势调整,得到多个具有不同骨骼姿势的目标骨骼结构,对目标骨骼结构进行截图处理,得到多个骨骼姿态图,将目标骨骼结构与预设的虚拟角色模型进行绑定,并对绑定后的虚拟角色模型进行渲染,得到骨骼姿态图对应的虚拟角色渲染图。
其中,该样本骨骼结构可以为用于对预设绘图控制模型进行训练的骨骼结构,该预设动作可以为预设的多个动作,该目标骨骼结构可以为被配置有一骨骼姿势的骨骼结构。该骨骼姿态图以及该骨骼姿态图对应的虚拟角色渲染图可以配置有相同的图像描述样本,该虚拟角色模型可以为预设的用于与目标骨骼结构绑定的三维模型。
以此,通过本申请提供的图像生成方法,动画师可以直接使用Maya等三维制作软件中的骨骼动画工具进行骨骼动画制作,从而采用绘图控制模型和绘图模型基于骨骼动画中骨骼图像生成目标动画,提高了动画制作效率。同时,绘图控制模型可以根据骨骼图像中的骨骼结构信息,精确地生成相应的三维模型渲染图,从而动画师可以通过调整骨骼结构,精确地控制角色的姿势和动作,从而提高动画的质量。同时,绘图控制模型通过学习骨骼姿态图与对应的虚拟角色渲染图之间的映射关系,可以生成稳定、连贯的动画序列,可以有效避免了传统深度学习方法中常见的画面闪烁问题,提高了动画的稳定性。此外,通过本申请实施例提供的绘图控制模型不仅可以生成传统的人形动画,还可以生成各种创新的动画效果,例如,可以通过调整骨骼图像中的骨骼结构,生成各种非人形的动画效果,从而提高动画的创新性。再有,本申请实施例提供的绘图控制模型的设计基于Maya等经典的三维制作软件中的骨骼动画工具,因此可以兼容Maya软件中的骨骼动画制作流程,动画师可以在使用传统动画制作的方式去进行骨骼动画的常规制作,以最大程度兼容传统动画制作的习惯,提高动画制作与调整的可控性。
由以上可知,本申请实施例通过获取骨骼图像,骨骼图像包括配置有预设的骨骼姿势的骨骼结构;采用绘图控制模型对骨骼图像进行特征提取,得到目标骨骼图特征;通过绘图控制模型基于学习到的骨骼图特征和渲染图特征的映射关系,将目标骨骼图特征映射为目标渲染图特征,以将目标渲染图特征作为渲染控制特征输入到绘图模型中,骨骼图特征和渲染图特征为分别从匹配的骨骼姿态图和虚拟角色渲染图中提取的特征;通过绘图模型根据渲染控制特征,确定骨骼图像对应的角色渲染图像特征;基于角色渲染图像特征通过绘图模型绘制出与骨骼图像中指示的骨骼姿势匹配的角色渲染图像。以此,通过采用绘图控制模型提取配置有预设的骨骼姿势的骨骼结构的骨骼图像的目标骨骼图特征,从而根据绘图控制模型学习到的骨骼图特征和渲染图特征的映射关系,将目标骨骼图特征映射为表征根据骨骼图像指示的骨骼姿势需要绘制的图像的目标渲染图特征,作为渲染控制特征输入到绘图模型中,并通过绘图模型基于渲染控制特征确定指示最终需要绘图的图像的角色渲染图像特征,进而基于角色渲染图像特征通过绘图模型绘制出与骨骼图像中指示的骨骼姿势匹配的角色渲染图像,实现对图像中角色的动作细节进行精准控制,进而提高图像生成质量。
为了更好地实施以上方法,本发明实施例还提供一种图像生成装置,该图像生成装置可以集成在计算机设备中,该计算机设备可以为服务器。
例如,如图5所示,为本申请实施例提供的图像生成装置的结构示意图,该图像生成装置可以包括图像获取单元201、特征提取单元202、特征映射单元203、特征确定单元204和图像绘制单元205,如下:
图像获取单元201,用于获取骨骼图像,骨骼图像包括配置有预设的骨骼姿势的骨骼结构;
特征提取单元202,用于采用绘图控制模型对骨骼图像进行特征提取,得到目标骨骼图特征;
特征映射单元203,用于通过绘图控制模型基于学习到的骨骼图特征和渲染图特征的映射关系,将目标骨骼图特征映射为目标渲染图特征,以将目标渲染图特征作为渲染控制特征输入到绘图模型中,骨骼图特征和渲染图特征为分别从匹配的骨骼姿态图和虚拟角色渲染图中提取的特征;
特征确定单元204,用于通过绘图模型根据渲染控制特征,确定骨骼图像对应的角色渲染图像特征;
图像绘制单元205,用于基于角色渲染图像特征通过绘图模型绘制出与骨骼图像中指示的骨骼姿势匹配的角色渲染图像。
在一些实施例中,特征确定单元204,包括:
文本特征提取子单元,用于通过绘图模型对预设的图像描述信息进行特征提取,得到文本特征;
渲染特征转换子单元,用于通过绘图模型基于渲染控制特征和文本特征,获得骨骼图像对应的角色渲染图像特征。
在一些实施例中,绘图控制模型包括第一编码器模块和第一中间处理模块,该文本特征提取子单元,用于:
通过绘图模型的第二编码器模块对预设的图像描述信息进行特征编码,得到图像描述信息对应的文本特征;
该渲染特征转换子单元,用于;
通过绘图模型中与第二编码器模块连接的第二中间处理模块,接收文本特征和从第一中间处理模块输出的一渲染控制特征,并对文本特征和渲染控制特征进行特征融合处理,得到第一角色渲染图像特征,将第一角色渲染图像特征输入第二解码器模块;
通过第二解码器模块对第一角色渲染图像特征以及第一编码器模块输出的一渲染控制特征进行特征融合处理,得到骨骼图像对应的角色渲染图像特征。
在一些实施例中,该图像获取单元201,包括:
图像提取子单元,用于从预设的骨骼动画中提取出骨骼动画帧作为骨骼图像;
在得到角色渲染图像后,该图像生成装置还包括动画生成单元,用于:
基于骨骼动画中各骨骼动画帧对应的角色渲染图像,生成骨骼动画对应的目标动画。
在一些实施例中,该图像提取子单元,用于:
获取预设的骨骼动画,骨骼动画中包括骨骼模型;
响应针对骨骼动画中骨骼模型的骨骼结构显示设置,得到显示骨骼模型的骨骼结构的骨骼动画,骨骼结构包括身体骨骼,以及关联在身体骨骼上的眼睛部件节点;
对显示骨骼结构的骨骼动画中的骨骼动画帧进行截图处理,得到骨骼动画对应的骨骼图像。
在一些实施例中,该图像生成装置,还包括:
样本图像获取单元,用于获取骨骼姿态图以及骨骼姿态图对应的虚拟角色渲染图,虚拟角色渲染图基于骨骼姿态图渲染得到;
样本特征提取单元,用于对骨骼姿态图进行特征提取,得到骨骼姿态图对应的骨骼图特征;
样本特征映射单元,用于采用预设绘图控制模型对骨骼图特征进行渲染特征映射,得到骨骼图特征对应的渲染图特征;
样本特征确定单元,用于基于渲染图特征,通过绘制模型确定骨骼姿态图对应的预测角色渲染图像特征;
样本图像绘制单元,用于根据预测角色渲染图像特征控制绘图模型绘制出预测角色渲染图;
绘图损失计算单元,用于根据预测角色渲染图和虚拟角色渲染图,计算绘图损失信息;
模型训练单元,用于基于绘图损失信息对预设绘图控制模型进行收敛,得到训练好的绘图控制模型。
在一些实施例中,绘图模型包括依次连接的第二编码器模块和第二中间处理模块以及第二解码器模块,预设绘图控制模型包括第一编码器模块和第一中间处理模块,第一编码器模块和第二编码器模块的权重参数相同,绘图模型在训练过程中权重参数锁定,预设绘图控制模型在训练过程中权重参数未锁定。
在一些实施例中,该样本图像获取单元,用于:
创建样本骨骼结构;
基于预设动作对样本骨骼结构进行姿势调整,得到多个具有不同骨骼姿势的目标骨骼结构;
对目标骨骼结构进行截图处理,得到多个骨骼姿态图;
将目标骨骼结构与预设的虚拟角色模型进行绑定,并对绑定后的虚拟角色模型进行渲染,得到骨骼姿态图对应的虚拟角色渲染图。
具体实施时,以上各个单元可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元的具体实施可参见前面的方法实施例,在此不再赘述。
由以上可知,本申请实施例通过图像获取单元201获取骨骼图像,骨骼图像包括配置有预设的骨骼姿势的骨骼结构;特征提取单元202采用绘图控制模型对骨骼图像进行特征提取,得到目标骨骼图特征;特征映射单元203通过绘图控制模型基于学习到的骨骼图特征和渲染图特征的映射关系,将目标骨骼图特征映射为目标渲染图特征,以将目标渲染图特征作为渲染控制特征输入到绘图模型中,骨骼图特征和渲染图特征为分别从匹配的骨骼姿态图和虚拟角色渲染图中提取的特征;特征确定单元204通过绘图模型根据渲染控制特征,确定骨骼图像对应的角色渲染图像特征;图像绘制单元205基于角色渲染图像特征通过绘图模型绘制出与骨骼图像中指示的骨骼姿势匹配的角色渲染图像。以此,通过采用绘图控制模型提取配置有预设的骨骼姿势的骨骼结构的骨骼图像的目标骨骼图特征,从而根据绘图控制模型学习到的骨骼图特征和渲染图特征的映射关系,将目标骨骼图特征映射为表征根据骨骼图像指示的骨骼姿势需要绘制的图像的目标渲染图特征,作为渲染控制特征输入到绘图模型中,并通过绘图模型基于渲染控制特征确定指示最终需要绘图的图像的角色渲染图像特征,进而基于角色渲染图像特征通过绘图模型绘制出与骨骼图像中指示的骨骼姿势匹配的角色渲染图像,实现对图像中角色的动作细节进行精准控制,进而提高图像生成质量。
本申请实施例还提供一种计算机设备,如图6所示,其示出了本申请实施例所涉及的计算机设备的结构示意图,该计算机设备可以是服务器,具体来讲:
该计算机设备300包括有一个或者一个以上处理核心的处理器301、有一个或一个以上计算机可读存储介质的存储器302及存储在存储器302上并可在处理器上运行的计算机程序。其中,处理器301与存储器302电性连接。本领域技术人员可以理解,图中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
处理器301是计算机设备300的控制中心,利用各种接口和线路连接整个计算机设备300的各个部分,通过运行或加载存储在存储器302内的软件程序和/或模块,以及调用存储在存储器302内的数据,执行计算机设备300的各种功能和处理数据,从而对计算机设备300进行整体监控。
在本申请实施例中,计算机设备300中的处理器301会按照如下的步骤,将一个或一个以上的应用程序的进程对应的指令加载到存储器302中,并由处理器301来运行存储在存储器302中的应用程序,从而实现各种功能:
获取骨骼图像,骨骼图像包括配置有预设的骨骼姿势的骨骼结构;
采用绘图控制模型对骨骼图像进行特征提取,得到目标骨骼图特征;
通过绘图控制模型基于学习到的骨骼图特征和渲染图特征的映射关系,将目标骨骼图特征映射为目标渲染图特征,以将目标渲染图特征作为渲染控制特征输入到绘图模型中,骨骼图特征和渲染图特征为分别从匹配的骨骼姿态图和虚拟角色渲染图中提取的特征;
通过绘图模型根据渲染控制特征,确定骨骼图像对应的角色渲染图像特征;
基于角色渲染图像特征通过绘图模型绘制出与骨骼图像中指示的骨骼姿势匹配的角色渲染图像。
在一些实施例中,通过绘图模型根据渲染控制特征,确定骨骼图像对应的角色渲染图像特征,包括:
通过绘图模型对预设的图像描述信息进行特征提取,得到文本特征;
通过绘图模型基于渲染控制特征和文本特征,获得骨骼图像对应的角色渲染图像特征。
在一些实施例中,绘图控制模型包括第一编码器模块和第一中间处理模块,通过绘图模型对图像描述信息进行特征提取,得到文本特征,包括:
通过绘图模型的第二编码器模块对预设的图像描述信息进行特征编码,得到图像描述信息对应的文本特征;
通过绘图模型基于渲染控制特征和文本特征,获得骨骼图像对应的角色渲染图像特征,包括:
通过绘图模型中与第二编码器模块连接的第二中间处理模块,接收文本特征和从第一中间处理模块输出的一渲染控制特征,并对文本特征和渲染控制特征进行特征融合处理,得到第一角色渲染图像特征,将第一角色渲染图像特征输入第二解码器模块;
通过第二解码器模块对第一角色渲染图像特征以及第一编码器模块输出的一渲染控制特征进行特征融合处理,得到骨骼图像对应的角色渲染图像特征。
在一些实施例中,获取骨骼图像,包括:
从预设的骨骼动画中提取出骨骼动画帧作为骨骼图像;
在得到角色渲染图像后,还包括:
基于骨骼动画中各骨骼动画帧对应的角色渲染图像,生成骨骼动画对应的目标动画。
在一些实施例中,从预设的骨骼动画中提取出骨骼动画帧作为骨骼图像,包括:
获取预设的骨骼动画,骨骼动画中包括骨骼模型;
响应针对骨骼动画中骨骼模型的骨骼结构显示设置,得到显示骨骼模型的骨骼结构的骨骼动画,骨骼结构包括身体骨骼,以及关联在身体骨骼上的眼睛部件节点;
对显示骨骼结构的骨骼动画中的骨骼动画帧进行截图处理,得到骨骼动画对应的骨骼图像。
在一些实施例中,本申请实施例提供的图像生成方法,还包括:
获取骨骼姿态图以及骨骼姿态图对应的虚拟角色渲染图,虚拟角色渲染图基于骨骼姿态图渲染得到;
对骨骼姿态图进行特征提取,得到骨骼姿态图对应的骨骼图特征;
采用预设绘图控制模型对骨骼图特征进行渲染特征映射,得到骨骼图特征对应的渲染图特征;
基于渲染图特征,通过绘图模型确定骨骼姿态图对应的预测角色渲染图像特征;
根据预测角色渲染图像特征控制绘图模型绘制出预测角色渲染图;
根据预测角色渲染图和虚拟角色渲染图,计算绘图损失信息;
基于绘图损失信息对预设绘图控制模型进行收敛,得到训练好的绘图控制模型。
在一些实施例中,绘图模型包括依次连接的第二编码器模块和第二中间处理模块以及第二解码器模块,预设绘图控制模型包括第一编码器模块和第一中间处理模块,第一编码器模块和第二编码器模块的权重参数相同,绘图模型在训练过程中权重参数锁定,预设绘图控制模型在训练过程中权重参数未锁定。
在一些实施例中,获取骨骼姿态图以及骨骼姿态图对应的虚拟角色渲染图,包括:
创建样本骨骼结构;
基于预设动作对样本骨骼结构进行姿势调整,得到多个具有不同骨骼姿势的目标骨骼结构;
对目标骨骼结构进行截图处理,得到多个骨骼姿态图;
将目标骨骼结构与预设的虚拟角色模型进行绑定,并对绑定后的虚拟角色模型进行渲染,得到骨骼姿态图对应的虚拟角色渲染图。
本方案可以通过获取骨骼图像,骨骼图像包括配置有预设的骨骼姿势的骨骼结构;采用绘图控制模型对骨骼图像进行特征提取,得到目标骨骼图特征;通过绘图控制模型基于学习到的骨骼图特征和渲染图特征的映射关系,将目标骨骼图特征映射为目标渲染图特征,以将目标渲染图特征作为渲染控制特征输入到绘图模型中,骨骼图特征和渲染图特征为分别从匹配的骨骼姿态图和虚拟角色渲染图中提取的特征;通过绘图模型根据渲染控制特征,确定骨骼图像对应的角色渲染图像特征;基于角色渲染图像特征通过绘图模型绘制出与骨骼图像中指示的骨骼姿势匹配的角色渲染图像。以此,通过采用绘图控制模型提取配置有预设的骨骼姿势的骨骼结构的骨骼图像的目标骨骼图特征,从而根据绘图控制模型学习到的骨骼图特征和渲染图特征的映射关系,将目标骨骼图特征映射为表征根据骨骼图像指示的骨骼姿势需要绘制的图像的目标渲染图特征,作为渲染控制特征输入到绘图模型中,并通过绘图模型基于渲染控制特征确定指示最终需要绘图的图像的角色渲染图像特征,进而基于角色渲染图像特征通过绘图模型绘制出与骨骼图像中指示的骨骼姿势匹配的角色渲染图像,实现对图像中角色的动作细节进行精准控制,进而提高图像生成质量。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
可选的,如图6所示,计算机设备300还包括:触控显示屏303、射频电路304、音频电路305、输入单元306以及电源307。其中,处理器301分别与触控显示屏303、射频电路304、音频电路305、输入单元306以及电源307电性连接。本领域技术人员可以理解,图6中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
触控显示屏303可用于显示图形用户界面以及接收用户作用于图形用户界面产生的操作指令。触控显示屏303可以包括显示面板和触控面板。其中,显示面板可用于显示由用户输入的信息或提供给用户的信息以及计算机设备的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。可选的,可以采用液晶显示器(LCD,Liquid Crystal Display)、有机发光二极管(OLED,Organic Light-EmittingDiode)等形式来配置显示面板。触控面板可用于收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作),并生成相应的操作指令,且操作指令执行对应程序。可选的,触控面板可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器301,并能接收处理器301发来的命令并加以执行。触控面板可覆盖显示面板,当触控面板检测到在其上或附近的触摸操作后,传送给处理器301以确定触摸事件的类型,随后处理器301根据触摸事件的类型在显示面板上提供相应的视觉输出。在本申请实施例中,可以将触控面板与显示面板集成到触控显示屏303而实现输入和输出功能。但是在某些实施例中,触控面板与触控面板可以作为两个独立的部件来实现输入和输出功能。即触控显示屏303也可以作为输入单元306的一部分实现输入功能。
射频电路304可用于收发射频信号,以通过无线通信与网络设备或其他计算机设备建立无线通讯,与网络设备或其他计算机设备之间收发信号。
音频电路305可以用于通过扬声器、传声器提供用户与计算机设备之间的音频接口。音频电路305可将接收到的音频数据转换后的电信号,传输到扬声器,由扬声器转换为声音信号输出;另一方面,传声器将收集的声音信号转换为电信号,由音频电路305接收后转换为音频数据,再将音频数据输出处理器301处理后,经射频电路304以发送给比如另一计算机设备,或者将音频数据输出至存储器302以便进一步处理。音频电路305还可能包括耳塞插孔,以提供外设耳机与计算机设备的通信。
输入单元306可用于接收输入的数字、字符信息或用户特征信息(例如指纹、虹膜、面部信息等),以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
电源307用于给计算机设备300的各个部件供电。可选的,电源307可以通过电源管理系统与处理器301逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源307还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管图6中未示出,计算机设备300还可以包括摄像头、传感器、无线保真模块、蓝牙模块等,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。应当说明的是,本申请实施例提供的计算机设备与上文实施例中的适用于图像生成方法属于同一构思,其具体实现过程详见以上方法实施例,此处不再赘述。
由上可知,本申请实施例提供的计算机设备,可以通过获取骨骼图像,骨骼图像包括配置有预设的骨骼姿势的骨骼结构;采用绘图控制模型对骨骼图像进行特征提取,得到目标骨骼图特征;通过绘图控制模型基于学习到的骨骼图特征和渲染图特征的映射关系,将目标骨骼图特征映射为目标渲染图特征,以将目标渲染图特征作为渲染控制特征输入到绘图模型中,骨骼图特征和渲染图特征为分别从匹配的骨骼姿态图和虚拟角色渲染图中提取的特征;通过绘图模型根据渲染控制特征,确定骨骼图像对应的角色渲染图像特征;基于角色渲染图像特征通过绘图模型绘制出与骨骼图像中指示的骨骼姿势匹配的角色渲染图像。以此,通过采用绘图控制模型提取配置有预设的骨骼姿势的骨骼结构的骨骼图像的目标骨骼图特征,从而根据绘图控制模型学习到的骨骼图特征和渲染图特征的映射关系,将目标骨骼图特征映射为表征根据骨骼图像指示的骨骼姿势需要绘制的图像的目标渲染图特征,作为渲染控制特征输入到绘图模型中,并通过绘图模型基于渲染控制特征确定指示最终需要绘图的图像的角色渲染图像特征,进而基于角色渲染图像特征通过绘图模型绘制出与骨骼图像中指示的骨骼姿势匹配的角色渲染图像,实现对图像中角色的动作细节进行精准控制,进而提高图像生成质量。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请实施例所提供的任一种图像生成方法中的步骤。例如,该指令可以执行如下步骤:
获取骨骼图像,骨骼图像包括配置有预设的骨骼姿势的骨骼结构;
采用绘图控制模型对骨骼图像进行特征提取,得到目标骨骼图特征;
通过绘图控制模型基于学习到的骨骼图特征和渲染图特征的映射关系,将目标骨骼图特征映射为目标渲染图特征,以将目标渲染图特征作为渲染控制特征输入到绘图模型中,骨骼图特征和渲染图特征为分别从匹配的骨骼姿态图和虚拟角色渲染图中提取的特征;
通过绘图模型根据渲染控制特征,确定骨骼图像对应的角色渲染图像特征;
基于角色渲染图像特征通过绘图模型绘制出与骨骼图像中指示的骨骼姿势匹配的角色渲染图像。
在一些实施例中,通过绘图模型根据渲染控制特征,确定骨骼图像对应的角色渲染图像特征,包括:
通过绘图模型对预设的图像描述信息进行特征提取,得到文本特征;
通过绘图模型基于渲染控制特征和文本特征,获得骨骼图像对应的角色渲染图像特征。
在一些实施例中,绘图控制模型包括第一编码器模块和第一中间处理模块,通过绘图模型对图像描述信息进行特征提取,得到文本特征,包括:
通过绘图模型的第二编码器模块对预设的图像描述信息进行特征编码,得到图像描述信息对应的文本特征;
通过绘图模型基于渲染控制特征和文本特征,获得骨骼图像对应的角色渲染图像特征,包括:
通过绘图模型中与第二编码器模块连接的第二中间处理模块,接收文本特征和从第一中间处理模块输出的一渲染控制特征,并对文本特征和渲染控制特征进行特征融合处理,得到第一角色渲染图像特征,将第一角色渲染图像特征输入第二解码器模块;
通过第二解码器模块对第一角色渲染图像特征以及第一编码器模块输出的一渲染控制特征进行特征融合处理,得到骨骼图像对应的角色渲染图像特征。
在一些实施例中,获取骨骼图像,包括:
从预设的骨骼动画中提取出骨骼动画帧作为骨骼图像;
在得到角色渲染图像后,还包括:
基于骨骼动画中各骨骼动画帧对应的角色渲染图像,生成骨骼动画对应的目标动画。
在一些实施例中,从预设的骨骼动画中提取出骨骼动画帧作为骨骼图像,包括:
获取预设的骨骼动画,骨骼动画中包括骨骼模型;
响应针对骨骼动画中骨骼模型的骨骼结构显示设置,得到显示骨骼模型的骨骼结构的骨骼动画,骨骼结构包括身体骨骼,以及关联在身体骨骼上的眼睛部件节点;
对显示骨骼结构的骨骼动画中的骨骼动画帧进行截图处理,得到骨骼动画对应的骨骼图像。
在一些实施例中,本申请实施例提供的图像生成方法,还包括:
获取骨骼姿态图以及骨骼姿态图对应的虚拟角色渲染图,虚拟角色渲染图基于骨骼姿态图渲染得到;
对骨骼姿态图进行特征提取,得到骨骼姿态图对应的骨骼图特征;
采用预设绘图控制模型对骨骼图特征进行渲染特征映射,得到骨骼图特征对应的渲染图特征;
基于渲染图特征,通过绘图模型确定骨骼姿态图对应的预测角色渲染图像特征;
根据预测角色渲染图像特征控制绘图模型绘制出预测角色渲染图;
根据预测角色渲染图和虚拟角色渲染图,计算绘图损失信息;
基于绘图损失信息对预设绘图控制模型进行收敛,得到训练好的绘图控制模型。
在一些实施例中,绘图模型包括依次连接的第二编码器模块和第二中间处理模块以及第二解码器模块,预设绘图控制模型包括第一编码器模块和第一中间处理模块,第一编码器模块和第二编码器模块的权重参数相同,绘图模型在训练过程中权重参数锁定,预设绘图控制模型在训练过程中权重参数未锁定。
在一些实施例中,获取骨骼姿态图以及骨骼姿态图对应的虚拟角色渲染图,包括:
创建样本骨骼结构;
基于预设动作对样本骨骼结构进行姿势调整,得到多个具有不同骨骼姿势的目标骨骼结构;
对目标骨骼结构进行截图处理,得到多个骨骼姿态图;
将目标骨骼结构与预设的虚拟角色模型进行绑定,并对绑定后的虚拟角色模型进行渲染,得到骨骼姿态图对应的虚拟角色渲染图。
本方案可以通过获取骨骼图像,骨骼图像包括配置有预设的骨骼姿势的骨骼结构;采用绘图控制模型对骨骼图像进行特征提取,得到目标骨骼图特征;通过绘图控制模型基于学习到的骨骼图特征和渲染图特征的映射关系,将目标骨骼图特征映射为目标渲染图特征,以将目标渲染图特征作为渲染控制特征输入到绘图模型中,骨骼图特征和渲染图特征为分别从匹配的骨骼姿态图和虚拟角色渲染图中提取的特征;通过绘图模型根据渲染控制特征,确定骨骼图像对应的角色渲染图像特征;基于角色渲染图像特征通过绘图模型绘制出与骨骼图像中指示的骨骼姿势匹配的角色渲染图像。以此,通过采用绘图控制模型提取配置有预设的骨骼姿势的骨骼结构的骨骼图像的目标骨骼图特征,从而根据绘图控制模型学习到的骨骼图特征和渲染图特征的映射关系,将目标骨骼图特征映射为表征根据骨骼图像指示的骨骼姿势需要绘制的图像的目标渲染图特征,作为渲染控制特征输入到绘图模型中,并通过绘图模型基于渲染控制特征确定指示最终需要绘图的图像的角色渲染图像特征,进而基于角色渲染图像特征通过绘图模型绘制出与骨骼图像中指示的骨骼姿势匹配的角色渲染图像,实现对图像中角色的动作细节进行精准控制,进而提高图像生成质量。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该计算机可读存储介质中所存储的指令,可以执行本申请实施例所提供的任一种图像生成方法中的步骤,因此,可以实现本申请实施例所提供的任一种图像生成方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
其中,根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例提供的各种可选实现方式中提供的方法。
以上对本申请实施例所提供的一种图像生成方法、装置和计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (11)
1.一种图像生成方法,其特征在于,包括:
获取骨骼图像,所述骨骼图像包括配置有预设的骨骼姿势的骨骼结构;
采用绘图控制模型对所述骨骼图像进行特征提取,得到目标骨骼图特征;
通过所述绘图控制模型基于学习到的骨骼图特征和渲染图特征的映射关系,将所述目标骨骼图特征映射为目标渲染图特征,以将所述目标渲染图特征作为渲染控制特征输入到绘图模型中,所述骨骼图特征和渲染图特征为分别从匹配的骨骼姿态图和虚拟角色渲染图中提取的特征;
通过所述绘图模型根据所述渲染控制特征,确定所述骨骼图像对应的角色渲染图像特征;
基于所述角色渲染图像特征通过所述绘图模型绘制出与所述骨骼图像中指示的骨骼姿势匹配的角色渲染图像。
2.如权利要求1所述的图像生成方法,其特征在于,所述通过所述绘图模型根据所述渲染控制特征,确定所述骨骼图像对应的角色渲染图像特征,包括:
通过所述绘图模型对预设的图像描述信息进行特征提取,得到文本特征;
通过所述绘图模型基于所述渲染控制特征和所述文本特征,获得所述骨骼图像对应的角色渲染图像特征。
3.如权利要求2所述的图像生成方法,其特征在于,所述绘图控制模型包括第一编码器模块和第一中间处理模块,所述通过所述绘图模型对预设的图像描述信息进行特征提取,得到文本特征,包括:
通过所述绘图模型的第二编码器模块对预设的图像描述信息进行特征编码,得到所述图像描述信息对应的文本特征;
所述通过所述绘图模型基于所述渲染控制特征和所述文本特征,获得所述骨骼图像对应的角色渲染图像特征,包括:
通过所述绘图模型中与所述第二编码器模块连接的第二中间处理模块,接收所述文本特征和从所述第一中间处理模块输出的一渲染控制特征,并对所述文本特征和所述渲染控制特征进行特征融合处理,得到第一角色渲染图像特征,将所述第一角色渲染图像特征输入第二解码器模块;
通过所述第二解码器模块对所述第一角色渲染图像特征以及所述第一编码器模块输出的一渲染控制特征进行特征融合处理,得到所述骨骼图像对应的角色渲染图像特征。
4.如权利要求1所述的图像生成方法,其特征在于,所述获取骨骼图像,包括:
从预设的骨骼动画中提取出骨骼动画帧作为骨骼图像;
在得到角色渲染图像后,还包括:
基于所述骨骼动画中各骨骼动画帧对应的角色渲染图像,生成所述骨骼动画对应的目标动画。
5.如权利要求4所述的图像生成方法,其特征在于,所述从预设的骨骼动画中提取出骨骼动画帧作为骨骼图像,包括:
获取预设的骨骼动画,所述骨骼动画中包括骨骼模型;
响应针对所述骨骼动画中骨骼模型的骨骼结构显示设置,得到显示所述骨骼模型的骨骼结构的骨骼动画,所述骨骼结构包括身体骨骼,以及关联在所述身体骨骼上的眼睛部件节点;
对显示所述骨骼结构的骨骼动画中的骨骼动画帧进行截图处理,得到所述骨骼动画对应的骨骼图像。
6.如权利要求1至5中任一项所述的图像生成方法,其特征在于,所述采用绘图控制模型对所述骨骼图像进行特征提取之前,还包括:
获取骨骼姿态图以及所述骨骼姿态图对应的虚拟角色渲染图,所述虚拟角色渲染图基于所述骨骼姿态图渲染得到;
对所述骨骼姿态图进行特征提取,得到所述骨骼姿态图对应的骨骼图特征;
采用预设绘图控制模型对所述骨骼图特征进行渲染特征映射,得到所述骨骼图特征对应的渲染图特征;
基于所述渲染图特征,通过绘图模型确定所述骨骼姿态图对应的预测角色渲染图像特征;
根据所述预测角色渲染图像特征控制所述绘图模型绘制出预测角色渲染图;
根据所述预测角色渲染图和所述虚拟角色渲染图,计算绘图损失信息;
基于所述绘图损失信息确定所述预设绘图控制模型是否达到预设收敛条件,当所述预设绘图控制模型达到预设收敛条件时,得到训练好的绘图控制模型。
7.如权利要求6所述的图像生成方法,其特征在于,所述绘图模型包括依次连接的第二编码器模块和第二中间处理模块以及第二解码器模块,所述预设绘图控制模型包括第一编码器模块和第一中间处理模块,所述第一编码器模块和第二编码器模块的权重参数相同,所述绘图模型在训练过程中权重参数锁定,所述预设绘图控制模型在训练过程中权重参数未锁定。
8.如权利要求6所述的图像生成方法,其特征在于,所述获取骨骼姿态图以及所述骨骼姿态图对应的虚拟角色渲染图,包括:
创建样本骨骼结构;
基于预设动作对所述样本骨骼结构进行姿势调整,得到多个具有不同骨骼姿势的目标骨骼结构;
对所述目标骨骼结构进行截图处理,得到多个骨骼姿态图;
将所述目标骨骼结构与预设的虚拟角色模型进行绑定,并对绑定后的虚拟角色模型进行渲染,得到所述骨骼姿态图对应的虚拟角色渲染图。
9.一种图像生成装置,其特征在于,包括:
图像获取单元,用于获取骨骼图像,所述骨骼图像包括配置有预设的骨骼姿势的骨骼结构;
特征提取单元,用于采用绘图控制模型对所述骨骼图像进行特征提取,得到目标骨骼图特征;
特征映射单元,用于通过所述绘图控制模型基于学习到的骨骼图特征和渲染图特征的映射关系,将所述目标骨骼图特征映射为目标渲染图特征,以将所述目标渲染图特征作为渲染控制特征输入到绘图模型中,所述骨骼图特征和渲染图特征为分别从匹配的骨骼姿态图和虚拟角色渲染图中提取的特征;
特征确定单元,用于通过所述绘图模型根据所述渲染控制特征,确定所述骨骼图像对应的角色渲染图像特征;
图像绘制单元,用于基于所述角色渲染图像特征通过所述绘图模型绘制出与所述骨骼图像中指示的骨骼姿势匹配的角色渲染图像。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至8任一项所述的图像生成方法中的步骤。
11.一种计算机设备,其特征在于,包括存储器、处理器以及存储在所述存储器中并可以在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的图像生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311027550.8A CN117058284A (zh) | 2023-08-14 | 2023-08-14 | 图像生成方法、装置和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311027550.8A CN117058284A (zh) | 2023-08-14 | 2023-08-14 | 图像生成方法、装置和计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117058284A true CN117058284A (zh) | 2023-11-14 |
Family
ID=88668746
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311027550.8A Pending CN117058284A (zh) | 2023-08-14 | 2023-08-14 | 图像生成方法、装置和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117058284A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117690190A (zh) * | 2024-01-31 | 2024-03-12 | 吉林大学 | 基于超图文本对比的水下动作识别方法、系统及存储介质 |
-
2023
- 2023-08-14 CN CN202311027550.8A patent/CN117058284A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117690190A (zh) * | 2024-01-31 | 2024-03-12 | 吉林大学 | 基于超图文本对比的水下动作识别方法、系统及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112836064B (zh) | 知识图谱补全方法、装置、存储介质及电子设备 | |
US20230154121A1 (en) | Side-by-side character animation from realtime 3d body motion capture | |
US11823315B2 (en) | Animation making method and apparatus, computing device, and storage medium | |
US20210152751A1 (en) | Model training method, media information synthesis method, and related apparatuses | |
CN112233211B (zh) | 动画制作的方法、装置、存储介质及计算机设备 | |
CN113426117B (zh) | 虚拟相机拍摄参数获取方法、装置、电子设备和存储介质 | |
CN111680123B (zh) | 对话模型的训练方法、装置、计算机设备及存储介质 | |
CN112206517B (zh) | 一种渲染方法、装置、存储介质及计算机设备 | |
CN117058284A (zh) | 图像生成方法、装置和计算机可读存储介质 | |
CN114742925A (zh) | 虚拟对象的蒙皮方法、装置、电子设备和存储介质 | |
CN112206519B (zh) | 实现游戏场景环境变化的方法、装置、存储介质及计算机设备 | |
CN115578494B (zh) | 中间帧的生成方法、装置、设备及存储介质 | |
CN115526967A (zh) | 虚拟模型的动画生成方法、装置、计算机设备及存储介质 | |
CN115645921A (zh) | 游戏指示器的生成方法、装置、计算机设备及存储介质 | |
CN113362435B (zh) | 虚拟对象模型的虚拟部件变化方法、装置、设备及介质 | |
CN116029912A (zh) | 图像处理模型的训练、图像处理方法、装置、设备及介质 | |
CN113824982A (zh) | 一种直播方法、装置、计算机设备及存储介质 | |
CN113222178A (zh) | 模型训练方法、用户界面的生成方法、装置及存储介质 | |
CN113345059B (zh) | 动画生成方法、装置、存储介质及电子设备 | |
CN113559500B (zh) | 动作数据的生成方法、装置、电子设备及存储介质 | |
CN117899469A (zh) | 骨骼处理方法、装置、电子设备和计算机可读存储介质 | |
CN117953150A (zh) | 三维人体重建方法、装置、电子设备及存储介质 | |
CN116758203A (zh) | 环境光遮蔽贴图的生成方法、装置、存储介质及电子设备 | |
CN116543461A (zh) | 一种动作识别方法、装置、计算机设备及存储介质 | |
CN115578779A (zh) | 一种换脸模型的训练、基于视频的换脸方法和相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |