CN110322529B - 一种基于深度学习辅助艺术绘画的方法 - Google Patents

一种基于深度学习辅助艺术绘画的方法 Download PDF

Info

Publication number
CN110322529B
CN110322529B CN201910629814.4A CN201910629814A CN110322529B CN 110322529 B CN110322529 B CN 110322529B CN 201910629814 A CN201910629814 A CN 201910629814A CN 110322529 B CN110322529 B CN 110322529B
Authority
CN
China
Prior art keywords
auxiliary
layer
convolution
input
assisting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910629814.4A
Other languages
English (en)
Other versions
CN110322529A (zh
Inventor
秦科
惠孛
张栗粽
罗光春
周玉阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201910629814.4A priority Critical patent/CN110322529B/zh
Publication of CN110322529A publication Critical patent/CN110322529A/zh
Application granted granted Critical
Publication of CN110322529B publication Critical patent/CN110322529B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/20Drawing from basic elements, e.g. lines or circles
    • G06T11/206Drawing of charts or graphs
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Abstract

本发明涉及绘画辅助领域,其公开了一种基于深度学习辅助艺术绘画的方法,解决传统技术中的辅助绘画方案存在的绘画内容受限,不能实现个性化绘画,适用范围和应用场景有限的问题。该方法包括:步骤1、采用爬虫获取艺术绘画数据并进行预处理,构建训练数据集;步骤2、构建由多层卷积层、池化层、反卷积层、上采样层及全连接层组成的深度卷积变分自编码网络;步骤3、利用训练数据集在有监督条件下,运用反向传播学习算法对深度卷积变分自编码网络进行训练,获得辅助绘画模型;步骤4、利用辅助绘画模型对用户输入的绘画进行处理,生成辅助绘画结果。本发明用于辅助用户在计算机等设备上进行艺术绘画。

Description

一种基于深度学习辅助艺术绘画的方法
技术领域
本发明涉及绘画辅助领域,特别涉及一种基于深度学习辅助艺术绘画的方法。
背景技术
绘画是一种重要的思想表达方式。而在绘画过程中,特别是利用计算机绘画过程中由于受制于技术水平和设备,大多普通人都不能很好地在绘画中表达自己思想情感同时兼具美感。
目前,有部分服务能够为用户提供预先制作好的素材,只需简单搭配组合就可以完成一幅绘画,如谷歌推出的AutoDraw。在该方案中,数据库中存有大量简笔画图像,并通过训练神经网络模型来识别用户输入,根据识别结果对数据库中图像进行匹配,最后列出匹配结果让用户选择从而替换自己的输入为查询结果图片。如此,通过多次绘画、匹配、替换的流程,用户最终组合出一幅绘画。
专利CN201810753008.3则是针对手绘图案基于绘图路径进行自动绘画。在该专利中,首先需要获取用户手绘图案并计算出其路径,然后通过从大量路径数据中提取的轮廓、布局、走向及风格特征训练的循环神经网络模型计算路径走向,最后依据路径有效性检测方法确保计算得到路径合理并以其更新用户手绘图案,完成自动绘画。其中循环神经网络训练还需要用到路径所属图案的归属种类标签,路径有效性检测依据路径相似度顺序选择有效路径。
上述两种辅助绘画方案均存在一定缺陷:
(1)对于AutoDraw方案,用户只能在预先存储的数据库中选择绘画内容,而无法生成新的内容,要丰富内容只能通过添加数据库内容同时更新匹配模型来实现,因此,绘画内容具有很大的局限性,不能实现个性化绘画。
(2)对于专利CN201810753008.3的方案,只能针对手绘图案生成绘画,其采用的路径预测算法并不适用于绘画其他方面,如色块、渐进等,因此其适用范围和应用场景有限。
发明内容
本发明所要解决的技术问题是:提出一种基于深度学习辅助艺术绘画的方法,解决传统技术中的辅助绘画方案存在的绘画内容受限,不能实现个性化绘画,适用范围和应用场景有限的问题。
本发明解决上述技术问题采用的技术方案是:
一种基于深度学习辅助艺术绘画的方法,包括以下步骤:
步骤1、采用爬虫获取艺术绘画数据并进行预处理,构建训练数据集;
步骤2、构建由多层卷积、池化、反卷积、上采样及全连接组成的深度卷积变分自编码网络;
步骤3、利用训练数据集在有监督条件下,运用反向传播学习算法对深度卷积变分自编码网络进行训练,获得辅助绘画模型;
步骤4、利用辅助绘画模型对用户输入的绘画进行处理,生成辅助绘画结果。
作为进一步优化,步骤1具体包括:
步骤1.1、采用网络爬虫爬取艺术绘画网站并保存其中的绘画图片;
步骤1.2、对绘画图片进行预处理,获取原始绘画图片的简笔线条作为标签,将原始绘画图片作为输入数据,构建训练数据集。
具体的,步骤1.1具体包括:
步骤1.1.1、根据网站规则构造URL获取绘画列表,其中页数从1取值,直到结束页;
步骤1.1.2、由绘画列表解析出所有绘画URL并下载图片数据。
具体的,步骤1.2具体包括:
步骤1.2.1、对每幅爬取得到的绘画图片进行中值滤波:
设绘画图片第i行j列为xij,其中值滤波结果为pij,则中值滤波过程表示为:
pij=median(xi-1j-1,xi-1j,xij-1,xij,xi+1j+1,xi+1j,xij+1)
其中,中值滤波核大小为3,median函数选取参数中值输出;
步骤1.2.2、对中值滤波后的绘画图片进行直方图均衡化操作,获得增强的绘画图片:
Figure GDA0003985488600000021
其中,H(b)为图像原始直方图,H′(a)为其对应的累计分布;
步骤1.2.3、应用Canny算子检测增强的绘画图片中的边缘信息:
首先计算梯度G及梯度角θ:
Figure GDA0003985488600000022
其中,Gx为图像点xij横向梯度值,Gy为图像点xij纵向梯度值;
然后对这些梯度值去除异常点,通过设置Canny算子的上限阈值和下限阈值,只选择高于上限阈值或上下限阈值之间且与上限阈值梯度点相邻的点作为结果输出;
步骤1.2.4、将绘画图片的边缘信息进行二值化处理,得到原始绘画的简笔线条并将其作为标签部分,而原始绘画作为数据输入部分,最终构造出整个训练数据集。
作为进一步优化,步骤2具体包括:
步骤2.1、构建多层卷积、池化组成的深度卷积编码器;
步骤2.2、由深度卷积编码器提取输入图片的高维特征,建立全连接层生成分布参数;
步骤2.3、由上层分布参数采样得到编码结果;
步骤2.4、构建多层反卷积、上采样组成的深度反卷积解码器,根据编码结果来解码输出。
作为进一步优化,步骤3具体包括:
步骤3.1、初始化深度卷积变分自编码网络的参数;
步骤3.2、将步骤1中得到的训练数据集中的数据分批次输入网络模型得到解码输出;
步骤3.3、根据解码输出以及分布参数计算重建损失和KL损失;
步骤3.4、反向传播重建损失和KL损失的均值,更新深度卷积变分自编码模型权重;
步骤3.5、迭代步骤3.2至3.4,直至模型权重趋于收敛,最终获得辅助绘画模型。
具体的,步骤3.1中,采用的初始化过程为随机初始化,设第d层网络权重矩阵为Wd,则初始化表现为:
Figure GDA0003985488600000031
其中,rand为随机数,nd-1为第d-1层的权重总数。
具体的,步骤3.2包括:
步骤3.2.1、将当前批次所有输入数据前向传播得到编码分布参数向量;
步骤3.2.2、对编码分布参数向量进行采样,得到当前批次所有输入数据的编码向量;
步骤3.2.3、对当前批次中的编码向量再解码,最终输出本批次所有重构数据。
具体的,步骤3.3中,根据解码输出以及分布参数计算重建损失和KL损失的方法为:
设对应批次中一个单独样本输出y及其对应标签
Figure GDA0003985488600000032
则重建损失L1的计算公式为:
Figure GDA0003985488600000033
对应KL损失L2的计算公式为:
Figure GDA0003985488600000034
其中,z为所有分布参数向量;
具体的,步骤3.4中,反向传播过程为从最后输出层方向到输入层计算梯度并更新权重参数;
其中,反向的梯度计算过程为:
Figure GDA0003985488600000041
接着,根据下式来更新权重:
Figure GDA0003985488600000042
其中,t为迭代步数,且
Figure GDA0003985488600000043
作为进一步优化,步骤4具体包括:
步骤4.1、客户端将用户输入的绘画以及辅助绘画请求发送至服务端;
步骤4.2、服务端将用户输入的绘画输入至辅助绘画模型,生成辅助绘画结果。
本发明的有益效果是:
将深度卷积变分自编码器网络应用到辅助绘画中,不仅能帮助用户表达自我,还能克服其它方案中不能主动生成新绘画的缺点。本发明通过变分自编码结果智能学习绘画特征并应用到用户绘画中,不需要过多的如路径预测等先验知识,因此适用于多种不同类型绘画,不但能辅助手绘画创作,也能辅助水彩画等其他类型的创作;
不仅如此,通过扩充训练数据和细化模型,本发明还能提供不同风格辅助结果供用户选择与调整,极大降低了绘画难度、解决了普通绘画生成方法个性化不足的问题。
附图说明
图1为实施例中的基于深度学习辅助艺术绘画的方法流程图;
图2为训练数据集的构建流程图;
图3为辅助绘画模型的训练流程图;
图4为用户的获取辅助绘画结果的交互流程图。
具体实施方式
本发明旨在提供一种基于深度学习辅助艺术绘画的方法,解决传统技术中的辅助绘画方案存在的绘画内容受限,不能实现个性化绘画,适用范围和应用场景有限的问题。本发明方法主要包括:训练数据集获取:利用爬虫爬取艺术绘画并进行预处理得到数据及其对应标签以满足后续模型训练要求;深度模型构造:结合深度卷积网络,变分自编码器,构造出能自动通过用户输入生成辅助艺术绘画的网络模型结构;模型训练:利用训练数据、重构损失及KL损失更新模型权重使其学习艺术绘画特点;用户交互:训练完成后的模型通过客户端获取用户输入并据其计算生成艺术绘画作为辅助结果并返还给用户选择,进而根据选择得出最终的绘画。
实施例:
如图1所示,本实施例中的基于深度学习辅助艺术绘画的方法包括:
训练数据获取、网络搭建、模型训练以及辅助绘画四个主要步骤;
其中,训练数据获取和网络搭建都是为了训练出能辅助用户绘画的深度卷积变分自编码模型,从而达到应用模型辅助用户绘画的目的。
训练数据获取包括爬取艺术绘画和数据预处理两个子步骤,从而获得训练数据集;模型训练包括初始化模型参数、将训练集数据输入模型进行解码、根据解码输出来学习模型权重,并不断迭代直至模型收敛几个子步骤;辅助绘画包括根据用户请求输入绘画内容和利用训练好的模型辅助绘画两个子步骤。
下面对各个步骤的实现进行具体描述:
1、训练数据获取以fineartamerican.com网站上的艺术绘画为例,如图2所示,分为下面多个步骤获取并预处理:
1.1、编写爬虫爬取艺术绘画网站并保存其中绘画数据,具体又分为:
1.1.1、根据网站规则构造URL:
https://fineartamerica.com/art/paintings?page=<页数>
获取绘画列表,其中页数从1取值,直到结束页;
1.1.2、由绘画列表解析出所有绘画URL并下载图片数据;
1.2、获得绘画图片数据后,还需对绘画数据预处理,包括二值化、边缘提取等,得到简笔线条作为标签,而原始绘画作为输入,标签和输入组合成训练集,具体操作步骤为:
1.2.1、对每幅爬取得到的绘画图片,进行中值滤波,过滤掉部分噪声,设输入图片第i行j列为xij,其中值滤波结果为pij,那么中值滤波过程就可以表示为:
pij=median(xi-1j-1,xi-1j,xij-1,xij,xi+1j+1,xi+1j,xij+1)
其中中值滤波核大小为3,median函数选取参数中值输出;
1.2.2、对上一步输出进行直方图均衡化操作,从而对图片增强,突出其中细节以便后续步骤处理:
Figure GDA0003985488600000061
其中,H(b)为图像原始直方图,H′(a)为其对应的累计分布;
1.2.3、得到增强的图像后,再对其应用Canny算子取得绘画中的边缘信息:
首先计算梯度及梯度角:
Figure GDA0003985488600000062
其中,Gx为图像点xij横向梯度值,Gy为图像点xij纵向梯度值。然后对这些梯度值去除异常点,然后设置Canny算子上限阈值为200,下限阈值为100,只选择高于上限阈值或上下限阈值之间且与上限阈值梯度点相邻的点作为结果输出;
1.2.4、将图片边缘信息作二值化,得到原始绘画的简笔线条并将其作为标签部分,而原始绘画作为数据输入部分,最终构造出整个训练数据集。
2、针对网络搭建,本发明采用的网络为深度卷积变分自编码结构,具体参数如表1。
表1本发明的网络结构参数
名称 核大小 步长 全连接神经元
conv_1 3×3×32 1 -
conv_2 3×3×128 1 -
maxpool_1 2×2×128 2 -
conv_3 3×3×64 1 -
maxpool_2 2×2×64 2 -
fc_1 - - 2048
fc_2 - - 2048
upsampling_1 2×2×64 2 -
deconv_1 3×3×64 1 -
upsampling_2 2×2×128 2 -
deconv_2 3×3×128 1 -
deconv_3 3×3×32 1 -
output 1×1×3 1  
其中conv为卷积层,对输入进行卷积操作,maxpool为最大池化层网络,fc是全连接层,upsampling为上采样层,deconv为反卷积层。整个网络输入为训练输入数据或用户交互数据,输出则为生成的辅助绘画结果。
该网络的运算原理为:
2.1、输入数据首先通过多层卷积、池化组成的深度卷积编码器,提取出输入的高维特征,其中卷积运算具体为:
Figure GDA0003985488600000071
上式中k为3×3卷积核权重矩阵,Aij为yij对应的输入数据中3×3邻域。每个卷积核通过上式按步长1在输入矩阵中滑动,最终都能得到一个同样大小的二维矩阵,将这些矩阵在第三个维度上组合,就得到输出的三维矩阵。那么同样的,最大池化运算通过下式也能对输入得出三维矩阵输出:
Figure GDA0003985488600000072
2.2、由上层得到的三维特征展开成一维向量后,分别通过两个全连接层生成正态分布参数向量:均值μ,方差σ,具体全连接运算如下:
y=f(Wx+b)
其中W为2048个神经元的权重矩阵,b则是对应偏差,f表示激活函数,本发明采用的激活函数具体运算如下式:
Figure GDA0003985488600000073
2.3通过上述均值μ,方差σ向量,进行随机采样得到采样后的编码向量结果:
y=kσ+μ
其中k为随机采样的均值为0,方差为1的正态分布随机变量;
2.4、由上述采样结果,反展开从而重构出三维矩阵结构,通过构建的多层反卷积、上采样组成的深度反卷积解码器,根据编码结果来解码输出,其中反卷积运算具体为:
Figure GDA0003985488600000074
上式中k为3×3反卷积核权重矩阵,Bij为yij对应的x′中3×3邻域。在本发明中,由于步长为1,那么反卷积输入x′为x沿第三维进行最外层补0操作后的三维矩阵。和卷积层类似,反卷积核通过按步长1在输入上滑动以及多个反卷积结果组合,能输出同样维度和大小的反卷积结果。上采样相同:
yij=max(0,xij)
最终通过输出层卷积,该网络能输出和输入相同维度和大小的图像矩阵,达到了重构原始图像,从而实现了对用户输入进行填色、平滑、风格化等辅助操作。
3、构建好网络后,还需要对其权重参数等训练,得到实用的辅助绘画模型,训练过程如图3所示,具体如下:
3.1、初始化步骤2中的深度卷积变分自编码网络参数,本发明采用的初始化过程为随机初始化,设第d层网络权重矩阵为Wd,那么初始化表现为:
Figure GDA0003985488600000081
其中rand为随机数,nd-1为第d-1层的权重总数;
3.2、将步骤1中得到的训练集数据分批次输入网络模型得出解码输出,具体又可以细分为:
3.2.1、将当前批次所有输入数据前向传播得出编码分布参数,计算过程如前所述,经过卷积、池化以及全连接层后,就能得到当前批次所有输入数据对应的分布参数向量;
3.2.2、根据分布参数向量采样,得出当前批次所有的编码向量;
3.2.3、通过反卷积、上采样以及输出层,分别对批次中的编码向量再解码,最终输出本批次所有重构数据;
3.3、根据解码输出以及分布参数计算重建损失和KL损失之和:
设对应批次中一个单独样本输出y及其对应标签
Figure GDA0003985488600000082
重建损失L1计算为:
Figure GDA0003985488600000083
对应KL损失为:
Figure GDA0003985488600000084
其中,z为所有分布参数向量;
3.4、反向传播上述损失的均值更新深度卷积变分自编码模型权重,其中反向传播过程为从最后输出层方向到输入层计算梯度并更新权重参数,反向的梯度计算过程如下式:
Figure GDA0003985488600000085
从上式可以看出,损失值从最后输出层能通过反向传播达到计算前面层权重梯度的目的。最后根据下式来更新权重:
Figure GDA0003985488600000091
其中,t为迭代步数,且
Figure GDA0003985488600000092
3.5、重复步骤3.2至3.4直到模型权重收敛足够好。
模型训练完成后,就能实现辅助用户绘画的功能了,具体辅助过程描述如图4所示:
4.1、通过客户端请求并得到用户输入的绘画:
本发明采用包含C/S及B/S在内的多样化客户端服务端架构。以B/S为例,用户首先打开本发明提供的网页,然后在其中用鼠标或触摸屏进行简单线条绘画,最后点击辅助按钮,客户端网页就会以用户身份,将辅助绘画请求以及用户输入收集并发往服务后端;
4.2、服务后端得到用户输入后,将其输入训练好的模型,生成保留用户思想并具有艺术感的辅助绘画结果并反馈给用户,具体来说:
4.2.1、服务器将用户输入通过预先训练并加载到内存中的深度卷积变分自编码模型计算分布参数向量,和训练阶段类似,对分布进行采样得到编码向量最终解码该编码向量得出辅助绘画结果;
4.2.2、根据客户端请求参数,服务器将生成的辅助结果返回客户端展现给用户。若有多个不同风格模型,用户只需选择满意的结果即可。
本发明是通过爬取并预处理艺术绘画来模拟用户输入,从而能将其作为输入数据和标签来训练模型对实际用户输入进行艺术加工。之后通过构造深度卷积网络,使得模型能自动对图像特征进行学习应用,减少人工先验知识的参与。这一不仅减轻人工工作量,而且得出的模型更加泛化不依赖特定条件。同时卷积核参数都采用3×3大小,理论上来说,两层连续的3×3大小卷积操作和一层5×5卷积操作等效感受相同,都能提取5×5邻域范围内的特征,但是只用3×3大小卷积能最大限度降低网络权重数量,从而加快收敛降低资源占用。本发明还结合了变分自编码结构,没有直接用卷积网络进行编码,而是将卷积网络输出通过全连接层计算编码分布参数,所以对同一个输入数据,虽然分布参数一致但每次都会进行的随机采样结果不尽相同,能达到转化离散编码空间到连续编码空间的目的。
因此,本发明能基于深度卷积变分自编码网络对用户输入的简单线条绘画进行辅助,生成各式各样的艺术绘画。用应用范围更加广泛的深度方法,从大量数据中寻找解决方案,取代了原来的适用受限的传统方法。实际使用证明,本发明辅助绘画快捷方便且更具创造力。

Claims (9)

1.一种基于深度学习辅助艺术绘画的方法,其特征在于,包括以下步骤:
步骤1、采用爬虫获取艺术绘画数据并进行预处理,构建训练数据集;
步骤2、构建由多层卷积层、池化层、反卷积层、上采样层及全连接层组成的深度卷积变分自编码网络;
步骤3、利用训练数据集在有监督条件下,运用反向传播学习算法对深度卷积变分自编码网络进行训练,获得辅助绘画模型;
步骤4、利用辅助绘画模型对用户输入的绘画进行处理,生成辅助绘画结果;
步骤2具体包括:
步骤2.1、构建多层卷积、池化组成的深度卷积编码器;
步骤2.2、由深度卷积编码器提取输入图片的高维特征,建立全连接层生成分布参数;
步骤2.3、由上层分布参数采样得到编码结果;
步骤2.4、构建多层反卷积、上采样组成的深度反卷积解码器,根据编码结果来解码输出。
2.如权利要求1所述的一种基于深度学习辅助艺术绘画的方法,其特征在于,
步骤1具体包括:
步骤1.1、采用网络爬虫爬取艺术绘画网站并保存其中的绘画图片;
步骤1.2、对绘画图片进行预处理,获取原始绘画图片的简笔线条作为标签,将原始绘画图片作为输入数据,构建训练数据集。
3.如权利要求2所述的一种基于深度学习辅助艺术绘画的方法,其特征在于,
步骤1.1具体包括:
步骤1.1.1、根据网站规则构造URL获取绘画列表,其中页数从1取值,直到结束页;
步骤1.1.2、由绘画列表解析出所有绘画URL并下载图片数据。
4.如权利要求2所述的一种基于深度学习辅助艺术绘画的方法,其特征在于,
步骤1.2具体包括:
步骤1.2.1、对每幅爬取得到的绘画图片进行中值滤波:
设绘画图片第i行j列为xij,其中值滤波结果为pij,则中值滤波过程表示为:
pij=median(xi-1j-1,xi-1j,xij-1,xij,xi+1j+1,xi+1j,xij+1)
其中,中值滤波核大小为3,median函数选取参数中值输出;
步骤1.2.2、对中值滤波后的绘画图片进行直方图均衡化操作,获得增强的绘画图片:
Figure FDA0003985488590000011
其中,H(b)为图像原始直方图,H′(a)为其对应的累计分布;
步骤1.2.3、应用Canny算子检测增强的绘画图片中的边缘信息:
首先计算梯度G及梯度角θ:
Figure FDA0003985488590000021
其中,Gx为图像点xij横向梯度值,Gy为图像点xij纵向梯度值;
然后对这些梯度值去除异常点,通过设置Canny算子的上限阈值和下限阈值,只选择高于上限阈值或上下限阈值之间且与上限阈值梯度点相邻的点作为结果输出;
步骤1.2.4、将绘画图片的边缘信息进行二值化处理,得到原始绘画的简笔线条并将其作为标签部分,而原始绘画作为数据输入部分,最终构造出整个训练数据集。
5.如权利要求1所述的一种基于深度学习辅助艺术绘画的方法,其特征在于,
步骤3具体包括:
步骤3.1、初始化深度卷积变分自编码网络的参数;
步骤3.2、将步骤1中得到的训练数据集中的数据分批次输入网络模型得到解码输出;
步骤3.3、根据解码输出以及分布参数计算重建损失和KL损失;
步骤3.4、反向传播重建损失和KL损失的均值,更新深度卷积变分自编码模型权重;
步骤3.5、迭代步骤3.2至3.4,直至模型权重趋于收敛,最终获得辅助绘画模型。
6.如权利要求5所述的一种基于深度学习辅助艺术绘画的方法,其特征在于,
步骤3.1中,采用的初始化过程为随机初始化,设第d层网络权重矩阵为Wd,则初始化表现为:
Figure FDA0003985488590000022
其中,rand为随机数,nd-1为第d-1层的权重总数。
7.如权利要求5所述的一种基于深度学习辅助艺术绘画的方法,其特征在于,
步骤3.2包括:
步骤3.2.1、将当前批次所有输入数据前向传播得到编码分布参数向量;
步骤3.2.2、对编码分布参数向量进行采样,得到当前批次所有输入数据的编码向量;
步骤3.2.3、对当前批次中的编码向量再解码,最终输出本批次所有重构数据。
8.如权利要求5所述的一种基于深度学习辅助艺术绘画的方法,其特征在于,
步骤3.3中,根据解码输出以及分布参数计算重建损失和KL损失的方法为:
设对应批次中一个单独样本输出y及其对应标签
Figure FDA0003985488590000031
则重建损失L1的计算公式为:
Figure FDA0003985488590000032
对应KL损失L2的计算公式为:
Figure FDA0003985488590000033
其中,z为所有分布参数向量;
步骤3.4中,反向传播过程为从最后输出层方向到输入层计算梯度并更新权重参数;
其中,反向的梯度计算过程为:
Figure FDA0003985488590000034
接着,根据下式来更新权重:
Figure FDA0003985488590000035
其中,t为迭代步数,且
Figure FDA0003985488590000036
9.如权利要求1-8任意一项所述的一种基于深度学习辅助艺术绘画的方法,其特征在于,步骤4具体包括:
步骤4.1、客户端将用户输入的绘画以及辅助绘画请求发送至服务端;
步骤4.2、服务端将用户输入的绘画输入至辅助绘画模型,生成辅助绘画结果。
CN201910629814.4A 2019-07-12 2019-07-12 一种基于深度学习辅助艺术绘画的方法 Active CN110322529B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910629814.4A CN110322529B (zh) 2019-07-12 2019-07-12 一种基于深度学习辅助艺术绘画的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910629814.4A CN110322529B (zh) 2019-07-12 2019-07-12 一种基于深度学习辅助艺术绘画的方法

Publications (2)

Publication Number Publication Date
CN110322529A CN110322529A (zh) 2019-10-11
CN110322529B true CN110322529B (zh) 2023-04-18

Family

ID=68122126

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910629814.4A Active CN110322529B (zh) 2019-07-12 2019-07-12 一种基于深度学习辅助艺术绘画的方法

Country Status (1)

Country Link
CN (1) CN110322529B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110929772A (zh) * 2019-11-15 2020-03-27 北京奇艺世纪科技有限公司 模型训练方法、样本生成方法、装置、电子设备及存储介质
CN111949938B (zh) * 2020-08-13 2023-06-20 抖音视界有限公司 异动信息的确定方法、装置、电子设备和计算机可读介质
CN111932437B (zh) * 2020-10-10 2021-03-05 深圳云天励飞技术股份有限公司 图像处理方法、装置、电子设备及计算机可读存储介质
CN112529978B (zh) * 2020-12-07 2022-10-14 四川大学 一种人机交互式抽象画生成方法
CN113098805B (zh) * 2021-04-01 2022-09-27 清华大学 基于二值化神经网络的高效mimo信道反馈方法及装置
CN113779289A (zh) * 2021-08-25 2021-12-10 广东工业大学 基于人工智能的绘画步骤还原系统
CN116704128B (zh) * 2023-06-15 2023-12-12 北京元跃科技有限公司 一种基于深度学习的单张绘画生成3d模型的方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108062754A (zh) * 2018-01-19 2018-05-22 深圳大学 基于密集网络图像的分割、识别方法和装置
CN109213975A (zh) * 2018-08-23 2019-01-15 重庆邮电大学 一种基于字符层级卷积变分自编码的推特文本表示方法
CN109346063A (zh) * 2018-10-12 2019-02-15 电子科技大学 一种语音数据增强方法
CN109788433A (zh) * 2019-03-13 2019-05-21 东南大学 一种基于深度卷积自编码网络的室内定位轨迹聚类方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106611421B (zh) * 2016-12-30 2019-06-21 西安电子科技大学 基于特征学习和素描线段约束的sar图像分割方法
CN107748798A (zh) * 2017-11-07 2018-03-02 中国石油大学(华东) 一种基于多层视觉表达和深度网络的手绘图像检索方法
CA3028630C (en) * 2018-03-01 2023-10-17 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for identifying risky driving behavior
CN109035357B (zh) * 2018-07-10 2023-01-03 深圳市前海手绘科技文化有限公司 一种人工智能自动绘画方法
CN108961350B (zh) * 2018-07-17 2023-09-19 北京工业大学 一种基于显著度匹配的画风迁移方法
CN109299303B (zh) * 2018-10-19 2022-06-17 中国石油大学(华东) 基于可变形卷积与深度网络的手绘草图检索方法
CN109543749A (zh) * 2018-11-22 2019-03-29 云南大学 基于深度学习的绘画情感分析方法
CN109849576B (zh) * 2019-02-28 2020-04-28 浙江大学 一种参考灰度图辅助绘画的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108062754A (zh) * 2018-01-19 2018-05-22 深圳大学 基于密集网络图像的分割、识别方法和装置
CN109213975A (zh) * 2018-08-23 2019-01-15 重庆邮电大学 一种基于字符层级卷积变分自编码的推特文本表示方法
CN109346063A (zh) * 2018-10-12 2019-02-15 电子科技大学 一种语音数据增强方法
CN109788433A (zh) * 2019-03-13 2019-05-21 东南大学 一种基于深度卷积自编码网络的室内定位轨迹聚类方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Multimodal Trajectory Predictions for Autonomous Driving using Deep Convolutional Networks;Henggang Cui等;《Statistics》;第2卷;1-6 *
一种基于SVM和主动学习的图像检索方法;秦科等;《计算机应用研究》;第33卷(第12期);3836-3838 *
一种引入聚焦机制的静态图像人体分割方法;郭荣幸等;《电视技术》;第41卷(第Z2期);134-139 *

Also Published As

Publication number Publication date
CN110322529A (zh) 2019-10-11

Similar Documents

Publication Publication Date Title
CN110322529B (zh) 一种基于深度学习辅助艺术绘画的方法
Hertz et al. Prompt-to-prompt image editing with cross attention control
Cai et al. PiiGAN: generative adversarial networks for pluralistic image inpainting
Wang et al. Multi-scale dilated convolution of convolutional neural network for image denoising
Le et al. Interactive boundary prediction for object selection
Zhang et al. Face sketch synthesis via sparse representation-based greedy search
CN108647350A (zh) 一种基于双通道网络的图文关联检索方法
KR20200007900A (ko) 관심 포인트 문안의 생성
Ghorai et al. Multiple pyramids based image inpainting using local patch statistics and steering kernel feature
CN111144553B (zh) 一种基于时空记忆注意力的图像描述方法
CN111400591A (zh) 资讯信息推荐方法、装置、电子设备及存储介质
CN107291845A (zh) 一种基于预告片的电影推荐方法及系统
CN110599393B (zh) 图片风格转换方法、装置、设备及计算机可读存储介质
CN108062421A (zh) 一种大规模图片多尺度语义检索方法
CN106407381A (zh) 一种基于人工智能的推送信息的方法和装置
CN109035357B (zh) 一种人工智能自动绘画方法
Sasaki et al. Learning to restore deteriorated line drawing
CN112766021A (zh) 一种基于行人的关键点信息与语义分割信息进行行人重识别的方法
Li et al. Irregular mask image inpainting based on progressive generative adversarial networks
CN112132075B (zh) 图文内容处理方法及介质
Pan et al. Fast human motion transfer based on a meta network
CN110222222B (zh) 基于深层主题自编码模型的多模态检索方法
CN108876422A (zh) 用于信息推广的方法、装置、电子设备及计算机可读介质
CN112989177A (zh) 信息处理方法、装置、电子设备及计算机存储介质
CN109785435A (zh) 一种墙体重建方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant