CN118135050A - 美术资源的调整方法、设备及存储介质 - Google Patents
美术资源的调整方法、设备及存储介质 Download PDFInfo
- Publication number
- CN118135050A CN118135050A CN202410546160.XA CN202410546160A CN118135050A CN 118135050 A CN118135050 A CN 118135050A CN 202410546160 A CN202410546160 A CN 202410546160A CN 118135050 A CN118135050 A CN 118135050A
- Authority
- CN
- China
- Prior art keywords
- model
- style
- target
- determining
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 69
- 238000007781 pre-processing Methods 0.000 claims abstract description 40
- 238000012549 training Methods 0.000 claims description 91
- 230000006870 function Effects 0.000 claims description 34
- 238000004590 computer program Methods 0.000 claims description 20
- 239000013598 vector Substances 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 8
- 238000011176 pooling Methods 0.000 claims description 7
- 238000009877 rendering Methods 0.000 claims description 5
- 230000004044 response Effects 0.000 claims description 4
- 230000008569 process Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 239000000463 material Substances 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 7
- 230000005012 migration Effects 0.000 description 7
- 238000013508 migration Methods 0.000 description 7
- QVFWZNCVPCJQOP-UHFFFAOYSA-N chloralodol Chemical compound CC(O)(C)CC(C)OC(O)C(Cl)(Cl)Cl QVFWZNCVPCJQOP-UHFFFAOYSA-N 0.000 description 5
- 230000000007 visual effect Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 3
- 238000009792 diffusion process Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Landscapes
- Processing Or Creating Images (AREA)
Abstract
本申请公开了一种美术资源的调整方法、设备及存储介质,本申请涉及计算机视觉技术领域,所述美术资源的调整方法包括确定输入的风格和参考图,并将所述风格输入预处理模型,输出子模型;将所述子模型以及所述参考图输入精细化控制模型;基于所述精细化控制模型提取所述参考图的目标风格,并根据所述目标风格的关键字标签,将所述目标风格迁移至所述子模型;确定所述参考图的光影以及姿势,并根据所述光影、姿势以及所述子模型,生成目标图片。以提高美术资源的风格置换效率。
Description
技术领域
本申请涉及计算机视觉技术领域,尤其涉及美术资源的调整方法、设备及存储介质。
背景技术
在图片的绘画过程中,要创建、编辑或生成图像,通常是使用创建图形、图像以及各种视觉表现形式的方法和工具,来生成对应的图片。
然而,相关的绘图技术通常针对单一的角色或者场景进行绘图或者修改,当需要对整套美术资源做风格置换时,涉及大量的手动工作,美术设计师需要逐个元素地调整颜色、纹理、线条风格等视觉特征,以确保所有资源都能与目标风格匹配,这导致相关的绘图技术在风格置换时效率较低。
上述内容仅用于辅助理解本申请的技术方案,并不代表承认上述内容是现有技术。
发明内容
本申请的主要目的在于提供一种美术资源的调整方法、设备及存储介质,旨在解决如何提高美术资源的风格置换效率的技术问题。
为实现上述目的,本申请提供的一种美术资源的调整方法,所述美术资源的调整方法包括:
确定输入的风格和参考图,并将所述风格输入预处理模型,输出子模型;
将所述子模型以及所述参考图输入精细化控制模型;
基于所述精细化控制模型提取所述参考图的目标风格,并根据所述目标风格的关键字标签,将所述目标风格迁移至所述子模型;
确定所述参考图的光影以及姿势,并根据所述光影、姿势以及所述子模型,生成目标图片。
在一实施例中,所述预处理模型的训练步骤包括:
获取所述风格以及训练集,其中,所述训练集包括各种美术风格的图片;
将训练集输入生成器中,所述生成器根据所述训练集以及风格生成目标图像;
判别器接收所述目标图像,并根据所述训练集判断所述目标图像是否与所述训练集匹配;
若不匹配,基于所述生成器以及所述判别器执行迭代对抗训练,确定所述预处理模型。
在一实施例中,所述获取所述风格以及训练集的步骤之后,还包括:
根据各风格元素的特征信息确定对应的关键词标签,并将所述关键词标签与所述特征信息关联保存;
对所述训练集中的各个图片预处理,确定各所述图片的目标特征;
根据所述目标特征于数据库中确定匹配的目标关键词标签,并将所述目标关键词标签与所述目标特征关联;
确定所述目标特征对应的权重值,将所述权重值赋予所述目标关键词标签并保存。
在一实施例中,所述确定所述预处理模型的步骤之前,还包括:
获取迭代对抗训练的迭代次数以及批次,并确定对应的损失函数值;
根据所述迭代次数、批次以及对应的损失函数值,构建损失函数曲线;
根据所述损失函数曲线确定所述预处理模型。
在一实施例中,所述基于所述生成器以及所述判别器执行迭代对抗训练,确定所述预处理模型的步骤之后,还包括:
获取模型训练报告;
根据所述训练报告以及损失函数曲线,调整所述迭代对抗训练的训练次数以及处理训练集的轮数;
根据已调整的所述训练次数和所述轮数,执行所述迭代对抗训练。
在一实施例中,所述将所述风格输入预处理模型,输出子模型的步骤包括:
确定所述风格;
根据所述风格确定对应的特征向量;
将所述特征向量输入所述预处理模型中的生成器,生成对应的子模型。
在一实施例中,所述将所述子模型以及所述参考图输入精细化控制模型的步骤之后,还包括:
加载所述子模型,通过卷积层和池化层提取所述子模型的特征;
根据所述特征检测所述子模型的局部特征,并根据所述局部特征将所述子模型分解为子图,其中,所述子图对应于所述子模型的一部分,所述子图至少为一个。
在一实施例中,所述确定所述参考图的光影以及姿势,并根据所述光影、姿势以及所述子模型,生成目标图片的步骤之后,还包括:
响应于客户端的操作,确定所述客户端选择的目标参数;
根据所述目标参数确定对应的场景,以及根据所述场景确定与所述目标参数匹配的风格元素;
将所述风格元素以及所述场景的渲染参数,反馈至所述客户端,以使所述客户端展示所述风格元素以及所述场景对应的美术资源。
此外,为实现上述目的,本申请还提供一种美术资源的调整设备,所述美术资源的调整设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序配置为实现如上所述的美术资源的调整方法的步骤。
此外,为实现上述目的,本申请还提供一种存储介质,所述存储介质为计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的美术资源的调整方法的步骤。
本申请提供了一种美术资源的调整方法,本申请先确定输入的风格和参考图,并将所述风格输入预处理模型,输出子模型;然后将所述子模型以及所述参考图输入精细化控制模型;再基于所述精细化控制模型提取所述参考图的目标风格,并根据所述目标风格的关键字标签,将所述目标风格迁移至所述子模型;最后确定所述参考图的光影以及姿势,并根据所述光影、姿势以及所述子模型,生成目标图片。通过预处理模型和精细化控制模型实现对美术资源的风格置换,从而提高美术资源的风格置换效率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请美术资源的调整方法的第一实施例的流程示意图;
图2为本申请美术资源的调整方法的第二实施例的流程示意图;
图3为本申请美术资源的调整方法的第三实施例的流程示意图;
图4为本申请实施例涉及的美术资源的调整设备的硬件运行环境的架构示意图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图作进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本申请的技术方案,并不用于限定本申请。
为了更好的理解本申请的技术方案,下面将结合说明书附图以及具体的实施方式进行详细的说明。
本申请的主要解决方案是:确定输入的风格和参考图,并将所述风格输入预处理模型,输出子模型;将所述子模型以及所述参考图输入精细化控制模型;基于所述精细化控制模型提取所述参考图的目标风格,并根据所述目标风格的关键字标签,将所述目标风格迁移至所述子模型;确定所述参考图的光影以及姿势,并根据所述光影、姿势以及所述子模型,生成目标图片。
目前,在图片的绘画过程中,要创建、编辑或生成图像,通常是使用创建图形、图像以及各种视觉表现形式的方法和工具,来生成对应的图片。然而,相关的绘图技术通常针对单一的角色或者场景进行绘图或者修改,当需要对整套美术资源做风格置换时,涉及大量的手动工作,美术设计师需要逐个元素地调整颜色、纹理、线条风格等视觉特征,以确保所有资源都能与目标风格匹配,这导致相关的绘图技术在风格置换时效率较低。
本申请通过预处理模型对输入的风格先确定对应的子模型,再通过精细化控制模型迁移参考图的目标风格以及光影和姿势,生成目标图片,从而提高了美术资源的风格置换效率。
需要说明的是,本实施例的执行主体可以是美术资源的调整系统,所述美术资源的调整系统中设置有预处理模型以及精细化控制模型,也可以是一种具有数据处理、网络通信以及程序运行功能的计算服务设备,例如平板电脑、个人电脑、手机等,或者是一种能够实现上述功能的美术资源的调整设备等,本实施例对此并不作具体限定。以下以美术资源的调整系统为执行主体为例,对本实施例及下述各实施例进行说明。
实施例一
基于此,本申请提出第一实施例的美术资源的调整方法,请参照图1,所述美术资源的调整方法包括步骤S10~S40:
步骤S10:确定输入的风格和参考图,并将所述风格输入预处理模型,输出子模型。
在本实施例中,所述风格包括但不限于休闲卡通风格以及美漫风格,所述风格由管理端确定,管理端根据所要生成的美术资源的风格元素确定所述风格,所述参考图是与所述风格匹配的图片或者图像。通过将所述风格输入预处理模型,在所述预处理模型中执行一系列的处理动作,从而输出子模型,其中,所述子模型可以是包含有该风格的图片,也可以是数据集。
此外,所述预处理模型可以是Lora模型,所述Lora模型是利用Lora算法训练的神经网络模型,可以允许神经网络自动调整各层之间的权重,以优化模型性能。在Lora模型中,它将每一层视为一个可加权的特征提取器,通过学习调整各层权重,并利用低秩近似来减少权重矩阵的维度,从而减少模型中可训练参数的数量。具体是在原有权重矩阵上添加一对秩较低的分解矩阵即更新矩阵,进而通过仅训练这些新增的权重,而非整个模型的庞大参数集,以降低训练次数。
可选地,在本实施例中,所述步骤S10包括:
确定所述风格;根据所述风格确定对应的特征向量;将所述特征向量输入所述预处理模型中的生成器,生成对应的子模型。
具体的,当所述风格是以图像的形式表示时,通过计算机视觉技术提取图像特征向量,其中,所述图像特征向量包括图像的颜色分布、纹理、形状、边缘、关键点等信息,如SIFT、SURF、ORB、HOG、LBP等局部特征描述子,再将提取的图像特征向量输入到生成器网络中,生成器网络会根据这些图像特征向量生成具有相似风格的绘画作品,即子模型。
此外,还可以通过深度学习模型提取高层语义特征向量。所述语义特征向量可以用来描述和比较不同图像之间的风格差异,从而实现风格识别、检索、聚类或风格迁移等任务。
步骤S20:将所述子模型以及所述参考图输入精细化控制模型。
在本实施例中,所述参考图包含有所述风格,用以更精细化的调整所述子模型的风格。将所述步骤S10中生成的所述子模型,以及所述参考图输入所述精细化控制模型,所述精细化控制模型可以是ControlNet模型,ControlNet模型是神经网络架构,可以对预训练的大型扩散模型进行控制,其中,ControlNet模型中包括shuffle模型、reference模型与normal模型,shuffle模型可以提取出参考图的风格,再配合提示词将风格迁移到子模型上,reference模型用以配合所述shuffle模型完成风格迁移,normal模型可以确定参考图的光影和姿势,进而调整所述子模型的光影和姿势。
此外,ControlNet模型可以提高对预训练扩散模型的控制精细度,使得模型能够在生成图像时响应特定的空间条件,通过有效的微调过程,ControlNet模型能够将这些局部化条件无缝融入到预训练的图像扩散模型中,使得模型在生成图像时能按照提供的条件进行精细化生成。
可选地,在本实施例中,所述步骤S20之后,还包括:
加载所述子模型,通过卷积层和池化层提取所述子模型的特征;根据所述特征检测所述子模型的局部特征,并根据所述局部特征将所述子模型分解为子图,其中,所述子图对应于所述子模型的一部分,所述子图至少为一个。
具体的,先加载所述子模型,并对所述子模型中的数据集进行标准化以及归一化处理,利用卷积核对预处理后的数据进行卷积操作,生成多个特征图。在每个特征图上应用非线性激活函数,对特征图执行池化操作,进行下采样并生成更低维度的特征图,以保证数据集满足所述精细化控制模型的要求。
此外,通过低秩分解来实现ControlNet模型的预处理功能,将图片分解为多个子图,每个子图对应于图像的一个部分,例如轮廓、纹理等。这种分解可以极大地减少模型的参数量,并使得模型更加高效。在训练过程中,ControlNet模型会根据输入的参考图生成一个预处理图,这个预处理图可以被视为一个模型,用以控制整个绘图过程。
示例性的,先通过卷积层的卷积核对输入的数据集进行滑窗扫描。卷积核在输入数据集上按一定步长和填充规则平移,每次停留时与该位置覆盖的数据元素进行元素-wise乘法,然后将乘积求和得到一个输出值。这个过程相当于对输入数据集的一小块区域应用一个线性变换加上偏置项,其中,一个卷积层通常包含多个卷积核,每个核提取不同的特征。这些核在同一输入数据集上独立操作,产生多个特征图(或称为特征映射、响应图),特征图的数量等于卷积核的数量,每个特征图对应一种特定的特征模式。然后通过池化层对特征图进行下采样,通过池化窗口在特征图上按照步长滑动,对每个窗口内的像素执行所选的池化操作,生成下采样的特征图。
步骤S30:基于所述精细化控制模型提取所述参考图的目标风格,并根据所述目标风格的关键字标签,将所述目标风格迁移至所述子模型。
在本实施例中,通过所述精细化控制模型中的shuffle模型提取所述参考图的目标风格,通过与所述目标风格匹配的关键字标签,其中,所述关键词标签用以描述风格的特征,将所述关键词标签对应的文本嵌入向量,与所述目标风格融合,并根据所述关键词标签指导所述风格迁移过程。
作为一种可选地实施方式,提取所述目标风格的方式,可以先基于Gram矩阵,对于某一层的特征图,计算其每个通道间的Gram矩阵,其中,Gram矩阵的元素是两两通道之间所有像素点对应特征值的内积,反映了各通道间特征统计关系,即图像的全局纹理和色彩分布。然后将待提取风格的图片输入到选定的shuffle模型中,进行前向传播计算,得到各层的特征图。通过对深层卷积层分别计算其特征图的Gram矩阵,得到该层的风格表示。
作为一种风格迁移可选地实施方式,定义损失函数,其中包括内容损失,风格损失,内容损失用以衡量生成图像与参考图在内容特征上的差异,风格损失用以衡量生成图像与参考图在风格特征,即Gram矩阵上的差异。通过梯度下降等优化方法,更新生成图像的像素值,使其在内容损失和风格损失之和最小化,最后通过迭代优化,逐渐融合源内容图像的内容特征和目标风格的目标图片的风格特征,生成目标图片,完成风格迁移。
此外,结合关键词标签进行风格迁移的方式,将源图像通过预训练的shuffle模型提取内容特征,并结合提示词的文本嵌入向量,在保留源图像内容的同时,根据提示词指导风格迁移。
步骤S40:确定所述参考图的光影以及姿势,并根据所述光影、姿势以及所述子模型,生成目标图片。
在本实施例中,通过所述精细化控制模型中的normal模型识别所述参考图的光影以及姿势,根据所述光影以及所述姿势,调整所述子模型中对应的环境参数以及人物动作,从而生成所述目标图片。应当理解的是,还需要确定参考图的轮廓以及纹理,并根据所述参考图的轮廓和纹理,调整所述子模型对应的参数。
在本实施例提供的技术方案中,首先确定输入的风格和参考图,并将所述风格输入预处理模型,输出子模型;然后将所述子模型以及所述参考图输入精细化控制模型;再基于所述精细化控制模型提取所述参考图的目标风格,并根据所述目标风格的关键字标签,将所述目标风格迁移至所述子模型;最后确定所述参考图的光影以及姿势,并根据所述光影、姿势以及所述子模型,生成目标图片。从而提高美术资源的风格置换效率。
实施例二
基于本申请第一实施例,在本申请第二实施例中,与上述实施例一相同或相似的内容,可以参考上文介绍,后续不再赘述。在此基础上,请参照图2,所述预处理模型的训练步骤包括:
步骤S50:获取所述风格以及训练集,其中,所述训练集包括各种美术风格的图片。
在本实施例中,所述风格为需要转换生成的美术风格,包括但不限于休闲卡通风格以及美漫风格,所述训练集为每种风格的美术收集100~2000张素材,所述素材的分辨率不低于512*512。
可选地,在本实施例中,所述步骤S50的步骤之后,还包括:
根据各风格元素的特征信息确定对应的关键词标签,并将所述关键词标签与所述特征信息关联保存;对所述训练集中的各个图片预处理,确定各所述图片的目标特征;根据所述目标特征于数据库中确定匹配的目标关键词标签,并将所述目标关键词标签与所述目标特征关联;确定所述目标特征对应的权重值,将所述权重值赋予所述目标关键词标签并保存。
具体的,首先需要建立一个详尽且结构化的标签体系,包括核心标签“休闲卡通”及其相关的子标签“色彩鲜艳”、“线条简单”、“角色可爱”等。确保标签能够准确捕捉到“休闲卡通”风格的视觉特点。对于图像素材库,按照标签体系对每张图片进行标注。标记出哪些图片具备“休闲卡通”风格的关键特征,并给每个适用标签打上相应的标签。对于特别重要的特征或者风格元素,可以为相应标签分配更高的权重,以通过模型训练的表现来动态调整。
此外,所述风格元素对应有训练集中的图片素材,为每个素材添加尽可能精准的关键词标签,同时对标签做权重区分,对内容关键词与触发词作调整,并添加对应的权重值,以提高模型训练的精准度。
示例性的,要生成“休闲卡通”风格的Lora模型,就需要保留图片素材中“休闲卡通”风格相关的内容作为自带特征,添加触发词“xiuxiankatong”,这样后续填写触发词就会自带此风格。
步骤S60:将训练集输入生成器中,所述生成器根据所述训练集以及风格生成目标图像。
步骤S70:判别器接收所述目标图像,并根据所述训练集判断所述目标图像是否与所述训练集匹配。
在本实施例中,通过生成式对抗网络中的生成器,根据输入的训练集按照指定的所述风格,经过一系列非线性变换后生成与目标数据分布相似的样本,即目标图像,然后将所述目标图像输入所述判别器中,所述判别器区分真实训练集和生成器生成的目标图像,并输出介于0和1之间的一个值,表示对输入数据真实性的置信度,越接近1表示判断为训练集的概率越高,越接近0表示判断为伪造数据的概率越高,进而确定生成器生成的目标图像的匹配度。然后计算判别器的损失,并根据该损失反向传播调整判别器的参数,使其更擅长区分真实与假数据。保持判别器参数不变,通过生成器生成一批假数据,然后计算生成器的损失,反向传播调整生成器参数,使其生成的样本更能让判别器误判为真实。
步骤S80:若不匹配,基于所述生成器以及所述判别器执行迭代对抗训练,确定所述预处理模型。
在本实施例中,当所述判别器输出的值趋近于0时,即不匹配,则继续基于所述生成式对抗网络实现迭代对抗训练,直至达到纳什均衡,即生成器生成的数据无法被判别器准确区分,判别器对真实数据和生成数据的区分能力达到最大。
可选地,在本实施例中,所述确定所述预处理模型的步骤之前,还包括:
获取迭代对抗训练的迭代次数以及批次,并确定对应的损失函数值;根据所述迭代次数、批次以及对应的损失函数值,构建损失函数曲线;根据所述损失函数曲线确定所述预处理模型。
具体的,在上述迭代对抗训练过程中,根据已经训练的迭代次数和批次以及损失函数值,并以迭代次数和批次为横坐标,损失函数值为纵坐标,构建损失函数曲线,如果损失函数曲线随着时间推移逐渐下降并趋于平稳,则说明模型在训练过程中逐步找到了较好的参数组合,正在逼近最优解,则将此时的参数记录,并确定对应的预处理模型。如果训练集上的损失函数曲线持续下降但验证集上的损失函数曲线先降后升,则表示模型出现了过拟合现象,即模型对训练数据过于复杂化的解释导致泛化能力变差,则需要调整训练参数,并继续进行迭代对抗训练,并刷新损失函数曲线,或者通过停止训练、调整学习率、以及增加正则化,重复上述迭代对抗训练过程,直至达到预设的训练轮数或收敛标准,其中,收敛标准是生成器能够生成难以被判别器区分的高质量样本,判别器在此情况下对真实数据和生成数据的区分能力趋于饱和。
可选地,在本实施例中,所述步骤S80之后,还包括:
获取模型训练报告;根据所述训练报告以及损失函数曲线,调整所述迭代对抗训练的训练次数以及处理训练集的轮数;根据已调整的所述训练次数和所述轮数,执行所述迭代对抗训练。
具体的,通过记录每次迭代对抗训练的训练次数以及轮数,并根据损失函数曲线,调整对应的训练次数和轮数,或者通过降低训练次数,提高整个训练素材集的轮数来训练模型,以提高模型训练效率。
在本实施例提供的技术方案中,通过将训练集输入所述生成器中,所述生成器根据所述训练集以及风格生成目标图像;然后所述判别器接收所述目标图像,并根据所述训练集判断所述目标图像是否与所述训练集匹配,若不匹配,基于所述生成器以及所述判别器执行迭代对抗训练,确定所述预处理模型。通过生成式对抗网络训练模型,以提高训练预处理模型的准确度。
基于本申请第一实施例和/或第二实施例,在本申请第三实施例中,与上述实施例一和实施例二相同或相似的内容,可以参考上文介绍,后续不再赘述。在此基础上,请参照图3,所述步骤S40之后,所述美术资源的调整方法还包括:
步骤S90:响应于客户端的操作,确定所述客户端选择的目标参数。
步骤S100:根据所述目标参数确定对应的场景,以及根据所述场景确定与所述目标参数匹配的风格元素。
步骤S110:将所述风格元素以及所述场景的渲染参数,反馈至所述客户端,以使所述客户端展示所述风格元素以及所述场景对应的美术资源。
在本实施例中,客户端与本实施例中的美术资源的调整系统相连接,在用户通过客户端选择需要展示的美术资源时,所述客户端的后台服务端获取用户在客户端上选择的目标参数,所述目标参数可以是关联有关键字的控件,也可以是用户自定义的风格参数,后台服务端将所述目标参数反馈至所述美术资源的调整系统,所述美术资源调整系统根据所述目标参数,基于预设训练模型确定最适配的场景,以及所述场景匹配的风格元素,将所述场景和所述风格元素融合生成对应的美术资源,并将所述美术资源的渲染参数,渲染至所述客户端,使用户在所述客户端中查看到所述美术资源。
在本实施例提供的技术方案中,通过响应于客户端的操作,确定所述客户端选择的目标参数,然后根据所述目标参数确定对应的场景,以及根据所述场景确定与所述目标参数匹配的风格元素,并将所述风格元素以及所述场景的渲染参数,反馈至所述客户端,以使所述客户端展示所述风格元素以及所述场景对应的美术资源,从而可以满足用户对于美术资源的需求。
由于本申请实施例所介绍的系统,为实施本申请实施例的方法所采用的系统,故而基于本申请实施例所介绍的方法,本领域所属人员能够了解该系统的具体结构及变形,故而在此不再赘述。凡是本申请实施例的方法所采用的系统都属于本申请所欲保护的范围。
本申请提供一种美术资源的调整设备,所述美术资源的调整设备包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述实施例一中的美术资源的调整方法。
下面参考图4,其示出了适于用来实现本申请实施例的美术资源的调整设备的结构示意图。本申请实施例中的美术资源的调整设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(Personal Digital Assistant:个人数字助理)、PAD(Portable Application Description:平板电脑)、PMP(Portable Media Player:便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图4示出的美术资源的调整设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图4所示,美术资源的调整设备可以包括处理装置1001(例如核心处理器、图形处理器等),其可以根据存储在只读存储器(ROM:Read Only Memory)1002中的程序或者从存储装置1003加载到随机访问存储器(RAM:Random Access Memory)1004中的程序而执行各种适当的动作和处理。在RAM1004中,还存储有美术资源的调整设备操作所需的各种程序和数据。处理装置1001、ROM1002以及RAM1004通过总线1005彼此相连。输入/输出(I/O)接口1006也连接至总线。通常,以下系统可以连接至I/O接口1006:包括例如触摸屏、触摸板、键盘、鼠标、图像传感器、麦克风、加速度计、陀螺仪等的输入装置1007;包括例如液晶显示器(LCD:Liquid Crystal Display)、扬声器、振动器等的输出装置1008;包括例如磁带、硬盘等的存储装置1003;以及通信装置1009。通信装置1009可以允许美术资源的调整设备与其他设备进行无线或有线通信以交换数据。虽然图中示出了具有各种系统的美术资源的调整设备,但是应理解的是,并不要求实施或具备所有示出的系统。可以替代地实施或具备更多或更少的系统。
特别地,根据本申请公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置从网络上被下载和安装,或者从存储装置1003被安装,或者从ROM1002被安装。在该计算机程序被处理装置1001执行时,执行本申请公开实施例的方法中限定的上述功能。
本申请提供的美术资源的调整设备,采用上述实施例中的美术资源的调整方法,能解决如何提高美术资源的风格置换效率的技术问题。与现有技术相比,本申请提供的美术资源的调整设备的有益效果与上述实施例提供的美术资源的调整方法的有益效果相同,且该美术资源的调整设备中的其他技术特征与上一实施例方法公开的特征相同,在此不做赘述。
应当理解,本申请公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式的描述中,具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
本申请提供一种计算机可读存储介质,具有存储在其上的计算机可读程序指令(即计算机程序),计算机可读程序指令用于执行上述实施例中的美术资源的调整方法。
本申请提供的计算机可读存储介质例如可以是U盘,但不限于电、磁、光、电磁、红外线、或半导体的系统、系统或器件,或者任意以上的组合。计算机可读存储介质的更具体地例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM:Random Access Memory)、只读存储器(ROM:Read Only Memory)、可擦式可编程只读存储器(EPROM:Erasable Programmable Read Only Memory或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM:CD-Read Only Memory)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、系统或者器件使用或者与其结合使用。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(Radio Frequency:射频)等等,或者上述的任意合适的组合。
上述计算机可读存储介质可以是美术资源的调整设备中所包含的;也可以是单独存在,而未装配入美术资源的调整设备中。
上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被美术资源的调整设备执行时,使得美术资源的调整设备:确定输入的风格和参考图,并将所述风格输入预处理模型,输出子模型;将所述子模型以及所述参考图输入精细化控制模型;基于所述精细化控制模型提取所述参考图的目标风格,并根据所述目标风格的关键字标签,将所述目标风格迁移至所述子模型;确定所述参考图的光影以及姿势,并根据所述光影、姿势以及所述子模型,生成目标图片。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN:Local Area Network)或广域网(WAN:Wide Area Network)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块的名称在某种情况下并不构成对该单元本身的限定。
本申请提供的可读存储介质为计算机可读存储介质,所述计算机可读存储介质存储有用于执行上述美术资源的调整方法的计算机可读程序指令(即计算机程序),能够解决如何提高美术资源的风格置换效率的技术问题。与现有技术相比,本申请提供的计算机可读存储介质的有益效果与上述实施例提供的美术资源的调整方法的有益效果相同,在此不做赘述。
本申请实施例提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述的美术资源的调整方法的步骤。
本申请提供的计算机程序产品能够解决如何提高美术资源的风格置换效率的技术问题。与现有技术相比,本申请实施例提供的计算机程序产品的有益效果与上述实施例提供的美术资源的调整方法的有益效果相同,在此不做赘述。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利处理范围内。
Claims (10)
1.一种美术资源的调整方法,其特征在于,所述美术资源的调整方法包括以下步骤:
确定输入的风格和参考图,并将所述风格输入预处理模型,输出子模型;
将所述子模型以及所述参考图输入精细化控制模型;
基于所述精细化控制模型提取所述参考图的目标风格,并根据所述目标风格的关键字标签,将所述目标风格迁移至所述子模型;
确定所述参考图的光影以及姿势,并根据所述光影、姿势以及所述子模型,生成目标图片。
2.如权利要求1所述的方法,其特征在于,所述预处理模型的训练步骤包括:
获取所述风格以及训练集,其中,所述训练集包括各种美术风格的图片;
将所述训练集输入生成器中,所述生成器根据所述训练集以及所述风格生成目标图像;
判别器接收所述目标图像,并根据所述训练集判断所述目标图像是否与所述训练集匹配;
若不匹配,基于所述生成器以及所述判别器执行迭代对抗训练,确定所述预处理模型。
3.如权利要求2所述的方法,其特征在于,所述获取所述风格以及训练集的步骤之后,还包括:
根据各风格元素的特征信息确定对应的关键词标签,并将所述关键词标签与所述特征信息关联保存;
对所述训练集中的各个图片预处理,确定各所述图片的目标特征;
根据所述目标特征于数据库中确定匹配的目标关键词标签,并将所述目标关键词标签与所述目标特征关联;
确定所述目标特征对应的权重值,将所述权重值赋予所述目标关键词标签并保存。
4.如权利要求2所述的方法,其特征在于,所述确定所述预处理模型的步骤之前,还包括:
获取迭代对抗训练的迭代次数以及批次,并确定对应的损失函数值;
根据所述迭代次数、批次以及对应的损失函数值,构建损失函数曲线;
根据所述损失函数曲线确定所述预处理模型。
5.如权利要求2所述的方法,其特征在于,所述基于所述生成器以及所述判别器执行迭代对抗训练,确定所述预处理模型的步骤之后,还包括:
获取模型训练报告;
根据所述训练报告以及损失函数曲线,调整所述迭代对抗训练的训练次数以及处理训练集的轮数;
根据已调整的所述训练次数和所述轮数,执行所述迭代对抗训练。
6.如权利要求1所述的方法,其特征在于,所述将所述风格输入预处理模型,输出子模型的步骤包括:
确定所述风格;
根据所述风格确定对应的特征向量;
将所述特征向量输入所述预处理模型中的生成器,生成对应的子模型。
7.如权利要求1所述的方法,其特征在于,所述将所述子模型以及所述参考图输入精细化控制模型的步骤之后,还包括:
加载所述子模型,通过卷积层和池化层提取所述子模型的特征;
根据所述特征检测所述子模型的局部特征,并根据所述局部特征将所述子模型分解为子图,其中,所述子图对应于所述子模型的一部分,所述子图至少为一个。
8.如权利要求1所述的方法,其特征在于,所述确定所述参考图的光影以及姿势,并根据所述光影、姿势以及所述子模型,生成目标图片的步骤之后,还包括:
响应于客户端的操作,确定所述客户端选择的目标参数;
根据所述目标参数确定对应的场景,以及根据所述场景确定与所述目标参数匹配的风格元素;
将所述风格元素以及所述场景的渲染参数,反馈至所述客户端,以使所述客户端展示所述风格元素以及所述场景对应的美术资源。
9.一种美术资源的调整设备,其特征在于,所述美术资源的调整设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序配置为实现如权利要求1至8任一项所述的美术资源的调整方法的步骤。
10.一种存储介质,其特征在于,所述存储介质为计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8任一项所述的美术资源的调整方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410546160.XA CN118135050A (zh) | 2024-05-06 | 2024-05-06 | 美术资源的调整方法、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410546160.XA CN118135050A (zh) | 2024-05-06 | 2024-05-06 | 美术资源的调整方法、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118135050A true CN118135050A (zh) | 2024-06-04 |
Family
ID=91230475
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410546160.XA Pending CN118135050A (zh) | 2024-05-06 | 2024-05-06 | 美术资源的调整方法、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118135050A (zh) |
-
2024
- 2024-05-06 CN CN202410546160.XA patent/CN118135050A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11436739B2 (en) | Method, apparatus, and storage medium for processing video image | |
CN110622177B (zh) | 实例分割 | |
CN109993102B (zh) | 相似人脸检索方法、装置及存储介质 | |
CN111279362A (zh) | 胶囊神经网络 | |
CN109919077B (zh) | 姿态识别方法、装置、介质和计算设备 | |
CN113761153B (zh) | 基于图片的问答处理方法、装置、可读介质及电子设备 | |
CN113822428A (zh) | 神经网络训练方法及装置、图像分割方法 | |
CN113177559B (zh) | 结合广度和密集卷积神经网络的图像识别方法、系统、设备及介质 | |
US11030726B1 (en) | Image cropping with lossless resolution for generating enhanced image databases | |
US20220366259A1 (en) | Method, apparatus and system for training a neural network, and storage medium storing instructions | |
WO2022161302A1 (zh) | 动作识别方法、装置、设备、存储介质及计算机程序产品 | |
CN115861462B (zh) | 图像生成模型的训练方法、装置、电子设备及存储介质 | |
CN113780326A (zh) | 一种图像处理方法、装置、存储介质及电子设备 | |
KR20210065901A (ko) | 이미지에서의 키 포인트 위치의 인식 방법, 장치, 전자기기 및 매체 | |
US20220301298A1 (en) | Multi-task self-training for learning general representations | |
CN111680491A (zh) | 文档信息的抽取方法、装置和电子设备 | |
CN114299366A (zh) | 一种图像检测方法、装置、电子设备及存储介质 | |
CN114385662A (zh) | 路网更新方法、装置、存储介质及电子设备 | |
CN117315758A (zh) | 面部表情的检测方法、装置、电子设备及存储介质 | |
CN113052143A (zh) | 手写数字生成方法和装置 | |
CN117197292A (zh) | 用于生成图像的方法、装置、设备和存储介质 | |
CN117252947A (zh) | 图像处理方法、装置、计算机、存储介质及程序产品 | |
CN113255819B (zh) | 用于识别信息的方法和装置 | |
CN118135050A (zh) | 美术资源的调整方法、设备及存储介质 | |
CN112990349B (zh) | 书写质量评价方法、装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination |