CN114926705B - 封面设计模型训练方法、介质、装置和计算设备 - Google Patents
封面设计模型训练方法、介质、装置和计算设备 Download PDFInfo
- Publication number
- CN114926705B CN114926705B CN202210513635.6A CN202210513635A CN114926705B CN 114926705 B CN114926705 B CN 114926705B CN 202210513635 A CN202210513635 A CN 202210513635A CN 114926705 B CN114926705 B CN 114926705B
- Authority
- CN
- China
- Prior art keywords
- background
- image
- covers
- training
- cover
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 title claims abstract description 225
- 238000013461 design Methods 0.000 title claims abstract description 120
- 238000000034 method Methods 0.000 title claims abstract description 78
- 239000013598 vector Substances 0.000 claims abstract description 245
- 238000011156 evaluation Methods 0.000 claims abstract description 130
- 238000010586 diagram Methods 0.000 claims description 61
- 238000005034 decoration Methods 0.000 claims description 55
- 230000006870 function Effects 0.000 claims description 36
- 230000004913 activation Effects 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 15
- 238000012163 sequencing technique Methods 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 9
- 239000000284 extract Substances 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 239000003086 colorant Substances 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000012938 design process Methods 0.000 description 3
- 230000008451 emotion Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 208000019901 Anxiety disease Diseases 0.000 description 2
- 230000036506 anxiety Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000003796 beauty Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Databases & Information Systems (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Processing Or Creating Images (AREA)
- Editing Of Facsimile Originals (AREA)
Abstract
本公开的实施方式提供了一种封面设计模型训练方法、介质、装置和计算设备。该方法包括:从前景图库中选取一张前景图像,提取前景图像的图像特征、文案特征以及颜色特征并进行合并,得到第一合并特征;将第一合并特征和背景特征输入背景生成网络,得到生成的背景图;通过排版网络,将前景图分别和所有背景图组装,得到多张第一封面;将多张第一封面输入评价网络,得到第一评分向量;根据生成的背景图、第一封面以及每个第一封面对应的第一评分,对背景生成网络进行训练。通过评价网络训练得到的封面设计模型,本公开的方法可以通过封面设计模型设计封面,相比于通过人工设计封面的方法,可以提高封面设计的效率。
Description
技术领域
本公开的实施方式涉及计算机视觉领域,更具体地,本公开的实施方式涉及一种封面设计模型训练方法、介质、装置和计算设备。
背景技术
本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
当前,为了达到醒目或美观的宣传效果的目的,通常由视觉设计师凭借自身的艺术经验或艺术理解,将图片和素材进行组装,组合出一个可以吸引人注意力的封面。
然而,这种常规做法以人工匹配现有模板的技术为主,这种方法效率较低,当出现封面需求量过大的时候,人工设计是无法满足的。
发明内容
本公开提供一种封面设计模型训练方法、介质、装置和计算设备,用于高效生成封面。
在本公开实施方式的第一方面中,提供了一种封面设计模型训练方法,包括:从前景图库中选取一张前景图,提取所述前景图的图像特征、文案特征以及颜色特征并进行合并,得到第一合并特征;提取背景图库的每个背景的背景特征;所述背景图库和前景图库通过建立得到;所述前景图像中包含前景图以及文案;将所述第一合并特征和所述背景特征输入封面设计模型中的背景生成网络,得到生成的背景图;所述生成的背景图的背景特征与所述第一合并特征最接近;通过排版网络,将所述前景图分别和背景图库中的所有背景组装,得到多张第一封面;将所述多张第一封面输入评价网络,得到第一评分向量,所述第一评分向量包括所述多张第一封面的评分;所述排版网络通过已有的背景图、前景图、装饰图以及文案作为训练集,进行训练得到;所述评价网络通过已有的封面作为训练集,进行训练得到;根据所述生成的背景图、第一封面以及每个第一封面对应的第一评分,对所述背景生成网络进行训练;直至所述生成的背景图为第一评分最高的第一封面对应的背景图,则完成所述背景生成网络的训练。
在本公开的一个实施例中,所述封面设计模型训练方法包括:从背景图库、前景图库、装饰图库以及文案库分别随机选取背景图、前景图、装饰图以及文案;从所述背景图中提取背景特征、从所述前景图中提取图像特征、从所述装饰图中提取图像特征以及从所述文案中提取文案特征,将所述背景特征、图像特征以及文案特征进行合并,得到第二合并特征;所述装饰图库以及文案库通过建立得到;将所述第二合并特征输入所述排版网络,得到位置向量;所述位置向量包含所述前景图位置参数、装饰图位置参数以及文案位置参数;所述前景图位置参数包括前景图在背景图中横坐标、纵坐标以及面积占比;所述装饰图位置参数包括文案在背景图中横坐标、纵坐标以及面积占比;所述文案位置参数包括文案在背景图中横坐标、纵坐标以及面积占比;按照所述位置向量,将所述前景图、所述装饰图以及所述文案布局至所述背景图,得到多个生成封面,并将所述多个生成封面输入评价网络,得到所述多个生成封面的评分值;根据所述多个生成封面的评分值,对所述排版网络进行训练;直至排版网络输出的前景图位置向量、装饰图位置向量以及文案位置向量同时对应的生成封面为评价网络输出的评分值最高的生成封面,则完成所述排版网络的训练。
在本公开的另一个实施例中,所述封面设计模型训练方法包括:计算所述第一合并特征和所述背景图库的每个背景图的背景特征之间的欧氏距离,生成一个距离向量;所述距离向量中的每个欧式距离表征所述第一合并特征和对应的背景特征之间的接近程度;基于交叉熵代价函数,以所述第一评分向量作为标签,以所述距离向量作为输入,对所述背景生成网络进行训练,直至所述背景生成网络生成的背景图为所述距离向量最小的背景图,则完成所述背景生成网络的训练。
在本公开的又一个实施例中,所述封面设计模型训练方法包括:将所述装饰图按照所述装饰图位置参数布局至所述背景图上,得到多个第二封面;将所述多个第二封面输入评价网络,得到所述多个第二封面的评分值;将所述前景图按照所述前景图位置参数布局至所述第二封面上,得到多个第三封面;将所述多个第三封面输入评价网络,得到所述多个第三封面的评分值;将所述文案按照所述文案位置参数布局至所述第三封面上,得到多个第四封面;将所述多个第四封面输入评价网络,得到所述多个第四封面的评分值;其中,所述多个生成封面包括所述多个第二封面、所述多个第三封面和所述多个第四封面;所述根据所述多个生成封面的评分值和预设的代价阈值,对所述排版网络进行训练,包括:根据所述位置向量,生成训练向量,所述训练向量包括横坐标下所述前景图对应的位置向量和所述装饰图对应的位置向量以及所述文案对应的位置向量之和、纵坐标下所述前景图对应的位置向量和所述装饰图对应的位置向量以及所述文案对应的位置向量之和,以及面积占比下所述前景图对应的位置向量和所述装饰图对应的位置向量以及所述文案对应的位置向量之和;基于均方差代价函数,以所述多个生成封面的评分值中的最大评分值作为标签,以所述训练向量作为输入,对所述排版网络进行训练,直至代价值小于预设的第一代价值阈值,则完成所述排版网络的训练。
在本公开的再一个实施例中,所述封面设计模型训练方法包括:从封面库中获取多张第五封面并分成多组,每组包含张数相同的多张第五封面,提取所述第五封面的封面特征;针对每组第五封面,根据用户设定的美观度排序结果,对该组第五封面中的多个封面进行排序;所述封面库通过已有的封面建立得到;将排序后的每组第五封面各自对应的封面特征输入评价网络,输出第二评分向量,根据所述第二评分向量对每组第五封面进行排序,直至和用户设定的美观度排序结果的相似度达到预设的排序阈值,则完成所述评价网络的训练。
在本公开的再一个实施例中,所述封面设计模型训练方法包括:将所述每组封面按照美观度排序依次输入评价网络,得到评价网络输出的第二评分向量;所述第二评分向量包括该组封面中每个封面的评分值;依次针对所述第二评分向量中的每个评分值,计算所述评分值与排序在所述评分值之后的所有评分值的差,得到相减向量;通过激活函数对所述相减向量进行激活处理,基于交叉熵代价函数,以经过激活函数处理的结果作为输入,向1回归,对所述评价网络进行训练,直至代价值小于预设的第二代价值阈值,则完成所述评价网络的训练。
在本公开实施方式的第二方面中,提供了一种封面设计方法,包括:将用户输入的待处理背景颜色、待处理文案、待处理装饰图以及待处理前景图,输入完成训练的封面设计模型,得到第六封面,将该第六封面推送给用户。
在本公开的一个实施例中,所述封面设计方法包括:提取所述待处理背景颜色的颜色特征,提取所述待处理前景图的图像特征、提取所述待处理装饰图的图像特征以及提取所述待处理文案的文案特征进行合并,得到第三合并特征;将所述第三合并特征输入完成训练的封面设计模型的背景生成网络,得到待处理背景图;提取所述待处理背景图的背景特征;将所述待处理背景图的背景特征、所述待处理前景图的图像特征、所述待处理装饰图的图像特征以及所述待处理文案的文案特征进行合并,得到第四合并特征;将所述第四合并特征输入完成训练的封面设计模型的排版网络,得到待处理位置向量;根据所述待处理位置向量,将所述待处理前景图、所述待处理装饰图以及所述待处理文案布局在所述待处理背景图上,得到第六封面。
在本公开实施方式的第三方面中,提供了一种计算机可读存储介质,包括:所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如本公开实施方式的第一方面中任一项所述的封面设计模型训练方法。
在本公开实施方式的第四方面中,提供了一种封面设计模型训练装置,包括:提取模块,用于从前景图库中选取一张前景图,提取所述前景图的图像特征、文案特征以及颜色特征并进行合并,得到第一合并特征;提取背景图库的每个背景的背景特征;所述背景图库和前景图库通过建立得到;所述前景图像中包含前景图以及文案;生成模块,用于将所述第一合并特征和所述背景特征输入封面设计模型中的背景生成网络,得到生成的背景图;所述生成的背景图的背景特征与所述第一合并特征最接近;组装模块,用于通过排版网络,将所述前景图分别和背景图库中的所有背景组装,得到多张第一封面;将所述多张第一封面输入评价网络,得到第一评分向量,所述第一评分向量包括所述多张第一封面的评分;所述排版网络通过已有的背景图、前景图、装饰图以及文案作为训练集,进行训练得到;所述评价网络通过已有的封面作为训练集,进行训练得到;训练模块,用于根据所述生成的背景图、第一封面以及每个第一封面对应的第一评分,对所述背景生成网络进行训练;直至所述生成的背景图为第一评分最高的第一封面对应的背景图,则完成所述背景生成网络的训练。
在本公开的一个实施例中,所述封面设计模型训练装置包括:所述提取模块,还用于从背景图库、前景图库、装饰图库以及文案库分别随机选取背景图、前景图、装饰图以及文案;从所述背景图中提取背景特征、从所述前景图中提取图像特征、从所述装饰图中提取图像特征以及从所述文案中提取文案特征,将所述背景特征、图像特征以及文案特征进行合并,得到第二合并特征;所述装饰图库以及文案库通过建立得到;所述生成模块,还用于将所述第二合并特征输入所述排版网络,得到位置向量;所述位置向量包含所述前景图位置参数、装饰图位置参数以及文案位置参数;所述前景图位置参数包括前景图在背景图中横坐标、纵坐标以及面积占比;所述装饰图位置参数包括文案在背景图中横坐标、纵坐标以及面积占比;所述文案位置参数包括文案在背景图中横坐标、纵坐标以及面积占比;所述生成模块,还用于按照所述位置向量,将所述前景图、所述装饰图以及所述文案布局至所述背景图,得到多个生成封面,并将所述多个生成封面输入评价网络,得到所述多个生成封面的评分值;所述训练模块,还用于根据所述多个生成封面的评分值,对所述排版网络进行训练;直至排版网络输出的前景图位置向量、装饰图位置向量以及文案位置向量同时对应的生成封面为评价网络输出的评分值最高的生成封面,则完成所述排版网络的训练。
在本公开的另一个实施例中,所述封面设计模型训练装置包括:所述训练模块,具体用于计算所述第一合并特征和所述背景图库的每个背景图的背景特征之间的欧氏距离,生成一个距离向量;所述距离向量中的每个欧式距离表征所述第一合并特征和对应的背景特征之间的接近程度;所述训练模块,具体还用于基于交叉熵代价函数,以所述第一评分向量作为标签,以所述距离向量作为输入,对所述背景生成网络进行训练,直至所述背景生成网络生成的背景图为所述距离向量最小的背景图,则完成所述背景生成网络的训练。
在本公开的又一个实施例中,所述封面设计模型训练装置包括:所述生成模块,具体用于将所述装饰图按照所述装饰图位置参数布局至所述背景图上,得到多个第二封面;将所述多个第二封面输入评价网络,得到所述多个第二封面的评分值;所述生成模块,具体还用于将所述前景图按照所述前景图位置参数布局至所述第二封面上,得到多个第三封面;将所述多个第三封面输入评价网络,得到所述多个第三封面的评分值;所述生成模块,具体还用于将所述文案按照所述文案位置参数布局至所述第三封面上,得到多个第四封面;将所述多个第四封面输入评价网络,得到所述多个第四封面的评分值;其中,所述多个生成封面包括所述多个第二封面、所述多个第三封面和所述多个第四封面;所述训练模块,具体用于根据所述位置向量,生成训练向量,所述训练向量包括横坐标下所述前景图对应的位置向量和所述装饰图对应的位置向量以及所述文案对应的位置向量之和、纵坐标下所述前景图对应的位置向量和所述装饰图对应的位置向量以及所述文案对应的位置向量之和,以及面积占比下所述前景图对应的位置向量和所述装饰图对应的位置向量以及所述文案对应的位置向量之和;所述训练模块,具体还用于基于均方差代价函数,以所述多个生成封面的评分值中的最大评分值作为标签,以所述训练向量作为输入,对所述排版网络进行训练,直至代价值小于预设的第一代价值阈值,则完成所述排版网络的训练。
在本公开的再一个实施例中,所述封面设计模型训练装置包括:所述提取模块,还用于从封面库中获取多张第五封面并分成多组,每组包含张数相同的多张第五封面,提取所述第五封面的封面特征;针对每组第五封面,根据用户设定的美观度排序结果,对该组第五封面中的多个封面进行排序;所述封面库通过已有的封面建立得到;所述训练模块,还用于将排序后的每组第五封面各自对应的封面特征输入评价网络,输出的第二评分向量,根据所述第二评分向量对每组第五封面进行排序,直至和用户设定的美观度排序结果的相似度达到预设的排序阈值,则完成所述评价网络的训练。
在本公开的再一个实施例中,所述封面设计模型训练装置包括:所述训练模块,具体用于将排序后的每组第五封面各自对应的封面特征依次输入评价网络,得到评价网络输出的第二评分向量;所述第二评分向量包括该组封面中每个封面的评分值;所述训练模块,具体还用于依次针对所述第二评分向量中的每个评分值,计算所述评分值与排序在所述评分值之后的所有评分值的差,得到相减向量;所述训练模块,具体还用于通过激活函数对所述相减向量进行激活处理,基于交叉熵代价函数,以经过激活函数处理的结果作为输入,向1回归,对所述评价网络进行训练,直至代价值小于预设的第二代价值阈值,则完成所述评价网络的训练。
在本公开实施方式的第五方面中,提供了一种封面设计装置,包括:设计模块,用于将用户输入的待处理背景颜色、待处理文案、待处理装饰图以及待处理前景图,输入完成训练的封面设计模型,得到第六封面,将该第六封面推送给用户。
在本公开的一个实施例中,所述封面设计装置还包括:处理模块,用于提取所述待处理背景颜色的颜色特征,提取所述待处理前景图的图像特征、提取所述待处理装饰图的图像特征以及提取所述待处理文案的文案特征进行合并,得到第三合并特征;将所述第三合并特征输入完成训练的所述封面设计模型的背景生成网络,得到待处理背景图;所述处理模块,还用于提取所述待处理背景图的背景特征;将所述待处理背景图的背景特征、所述待处理前景图的图像特征以及所述待处理文案的文案特征进行合并,得到第四合并特征;将所述第四合并特征输入完成训练的所述封面设计模型的排版网络,得到待处理位置向量;布局模块,用于根据所述待处理位置向量,将所述待处理前景图、所述待处理装饰图以及所述待处理文案布局在所述待处理背景图上,得到第六封面。
在本公开实施方式的第六方面中,提供了一种计算设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述计算设备执行如本公开实施方式的第一方面中任一项所述的封面设计模型训练方法。
根据本公开实施方式的通过评价网络训练得到的封面设计模型设计封面,相比于通过人工设计封面的方法,可以提高封面设计的效率。
附图说明
通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施方式,其中:
图1示意性地示出了根据本公开实施方式的应用场景的示意图;
图2示意性地示出了根据本公开一实施例的提供的封面设计模型训练方法的流程示意图;
图3示意性地示出了根据本公开一实施例提供的排版网络生成封面的示例图;
图4示意性地示出了根据本公开又一实施例提供的背景生成网络训练方法的示例图;
图5示意性地示出了根据本公开一实施例提供的排版网络训练方法的示例图;
图6示意性地示出了根据本公开一实施例提供的评价网络训练方法的流程示意图;
图7示意性地示出了根据本公开一实施例提供的评价网络训练方法的示例图;
图8示意性地示出了根据本公开一实施例提供的封面设计方法的示例图;
图9示意性地示出了根据本公开一实施例提供的存储介质的结构示意图;
图10示意性地示出了根据本公开一实施例提供的封面设计模型训练装置的结构示意图;
图11示意性地示出了根据本公开一实施例提供的封面设计装置的结构示意图;
图12示意性地示出了根据本公开一实施例提供的计算设备的结构示意图。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考若干示例性实施方式来描述本公开的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本公开,而并非以任何方式限制本公开的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本领域技术人员知道,本公开的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
根据本公开的实施方式,提出了一种封面设计模型训练的方法、介质、装置和计算设备。
在本文中,需要理解的是,所涉及的术语含义如下:
BERT(基于转换器的双向编码表征,Bidirectional Encoder Represen tationsfrom Transformers,简称BERT):一种预训练自然语言模型,用于计算词之间的相关度,对相关度归一化,通过相关度和所有词的编码进行加权求和获取目标词的编码;
残差网络:通过捷径连接进行不同深度通道的训练;
注意力网络:主要用来提取文字的高纬度特征。
此外,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
下面参考本公开的若干代表性实施方式,详细阐释本公开的原理和精神。
发明概述
本发明人发现,在相关技术中,通常由人工依靠模板匹配和人工规则的方式,将图像和素材进行组装,生成封面。该方法存在以下不足,当封面需求量过大时,人工设计封面无法满足。
为了解决以上问题。本发明人通过评价网络训练出封面设计模型用于设计封面,相比于通过人工设计封面的方法,可以提高封面设计的效率
在介绍了本公开的基本原理之后,下面具体介绍本公开的各种非限制性实施方式。
应用场景总览
首先参考图1,图1为本公开实施方式提供的应用场景示意图。
如图1所示,当需要生成封面时,可参照图示流程。将前景图、装饰、文案以及颜色作为素材,输入进封面设计模型,以通过封面设计模型来输出生成的封面。
示例性方法
下面结合图1的应用场景,参考图2-8来描述根据本公开示例性实施方式提供的封面设计模型训练方法。需要注意的是,上述应用场景仅是为了便于理解本公开的精神和原理而示出,本公开的实施方式在此方面不受任何限制。相反,本公开的实施方式可以应用于适用的任何场景。
本公开的实施方式的执行主体可以为封面设计模型训练装置,该封面设计模型训练装置的实现有多种。例如,可以为程序软件,也可以为存储有相关计算机程序的介质,例如,U盘等;或者,该装置还可以为集成或安装有相关计算机程序的实体设备,例如,芯片、智能终端、电脑、服务器等。
参考图2,图2为本公开一实施例提供的封面设计模型训练方法的流程示意图。如图2所示,封面设计模型训练方法包括:
S201、从前景图库中选取一张前景图,提取所述前景图的图像特征、文案特征以及颜色特征并进行合并,得到第一合并特征;提取背景图库的每个背景的背景特征;所述背景图库和前景图库通过建立得到;所述前景图像中包含前景图以及文案;
其中,所述图像特征包括人脸关键点位置、图像清晰度以及颜色直方图等。所述文案特征包括文案情感、文案题材以及文案BERT编码特征等。所述颜色特征为前景图包含的颜色。实际应用中,所述神经网络包括但不限于残差网络。所述文案情感包括忧伤、欢乐以及平静等,所述文案题材包括诗歌、叙事以及笑话等,所述文案BERT编码特征通过注意力网络提取获得。所述背景图库通过已有的背景建立。所述前景图库通过已有的前景建立。可以理解,封面设计模型依据多种类型的素材,提取其中的图像特征、文案特征以及颜色特征进行封面设计,可以提高封面设计的丰富度。
S202、将所述第一合并特征和所述背景特征输入封面设计模型中的背景生成网络,得到生成的背景图;所述生成的背景图的背景特征与所述第一合并特征最接近。
其中,所述封面设计模型在多个背景特征中匹配到与第一合并特征最接近的背景特征。可以理解,这里匹配到的背景特征所对应的背景与第一合并特征所对应的前景最匹配。可以理解,通过背景特征和第一合并特征,可以准确地进行背景图生成。
S203、通过排版网络,将所述前景图分别和背景图库中的所有背景组装,得到多张第一封面;将所述多张第一封面输入评价网络,得到第一评分向量,所述第一评分向量包括所述多张第一封面的评分;所述排版网络通过已有的背景图、前景图、装饰图以及文案作为训练集,进行训练得到;所述评价网络通过已有的封面作为训练集,进行训练得到。
其中,每个第一封面输入评价网络,得到对应的第一评分。所述第一评分表征评价网络基于第一封面对应的背景图和前景图,认定的第一封面的美观度。可以理解,通过训练好的评价网络,可以对多张第一封面进行准确的评价。
S204、根据所述生成的背景图、第一封面以及每个第一封面对应的第一评分,对所述背景生成网络进行训练;直至所述生成的背景图为第一评分最高的第一封面对应的背景图,则完成所述背景生成网络的训练。
其中,所述第一评分最高的第一封面对应的背景图和前景图的匹配程度,相比其他第一封面对应的背景图和前景图的匹配程度更高。当生成的背景图为第一评分最高的第一封面对应的背景图,说明当前背景生成网络能够根据前景图,在背景图库中匹配到最合适的背景图,可以认定完成训练。可以理解,通过训练好的评价网络作为标准,对背景生成网络训练,得到的背景生成网络能够根据前景图像准确匹配到合适的背景图。
在一个示例中,S203包括:从背景图库、前景图库、装饰图库以及文案库分别随机选取背景图、前景图、装饰图以及文案;从所述背景图中提取背景特征、从所述前景图中提取图像特征、从所述装饰图中提取图像特征以及从所述文案中提取文案特征,将所述背景特征、图像特征以及文案特征进行合并,得到第二合并特征;所述装饰图库以及文案库通过建立得到;将所述第二合并特征输入所述排版网络,得到位置向量;所述位置向量包含所述前景图位置参数、装饰图位置参数以及文案位置参数;所述前景图位置参数包括前景图在背景图中横坐标、纵坐标以及面积占比;所述装饰图位置参数包括文案在背景图中横坐标、纵坐标以及面积占比;所述文案位置参数包括文案在背景图中横坐标、纵坐标以及面积占比;按照所述位置向量,将所述前景图、所述装饰图以及所述文案布局至所述背景图,得到多个生成封面,并将所述多个生成封面输入评价网络,得到所述多个生成封面的评分值;根据所述多个生成封面的评分值,对所述排版网络进行训练;直至排版网络输出的前景图位置向量、装饰图位置向量以及文案位置向量同时对应的生成封面为评价网络输出的评分值最高的生成封面,则完成所述排版网络的训练。
结合图示的示例对排版网络训练方法进行举例介绍,参考图3,图3为本公开一示例的排版网络生成封面的示例图。图中分别从背景图库、前景图库、装饰图库以及文案库中随机选取背景图、前景图、装饰图以及文案。从所述背景图中提取背景特征、从所述前景图中提取图像特征、从所述装饰图中提取图像特征以及从所述文案中提取文案特征,将所述背景特征、图像特征以及文案特征进行合并,得到第二合并特征。举例来说,假设将所述第二合并特征输入排版网络,输出一个长度为900的向量X={a1a2 a3 b1 b2 b3 c1 c2 c3},其中a1代表前景图在背景图中的横坐标、b1代表装饰图在背景图中的横坐标以及c1代表文案在背景图中的横坐标。a2代表前景图在背景图中的纵坐标、b2代表装饰图在背景图中的纵坐标以及c2代表文案在背景图中的纵坐标。a3代表前景图在背景图中的面积占比、b3代表装饰图在背景图中的面积占比,c3代表文案在背景图中的面积占比。例如,若背景图长为500,高为500时,向量X的子向量a1是25,a2是20,a3是50,则表示前景图应该布局在背景图横坐标为125=(25/100)*500(背景图长),纵坐标为100=(20/100)*500(背景图高)的位置处,并且前景图在背景图中面积占比为50%=50/100。按照位置向量将前景图、装饰图以及文案布局在背景图上,得到生成封面。
示例来说,排版网络根据第二合并特征预测前景图、装饰图以及文案在背景图上的位置向量,按照排版网络预测的位置向量,得到生成封面,通过评价网络对排版网络进行训练,直至位置向量对应的生成封面为评价网络输出的评分值最高的生成封面,说明排版网络的生成封面符合评价网络的评价标准,则完成排版网络的训练。
需要说明的是,本公开不限制随机选取背景图、前景图、装饰图以及文案的数量,例如,一张封面中可以有多个前景图、多个装饰图以及多个文案。本公开不限制向量X的长度。本公开所述封面包括但不限于海报、宣传单页、名片等各类平面设计产品。
基于以上实施方式,本公开实施例所提供的方法,通过训练好的评价网络,对排版网络进行训练,得到准确生成前景图、装饰图以及文案在背景图上的位置向量的排版网络。
在另一个示例中,S204包括:计算所述第一合并特征和所述背景图库的每个背景图的背景特征之间的欧氏距离,生成一个距离向量;所述距离向量中的每个欧式距离表征所述第一合并特征和对应的背景特征之间的接近程度;基于交叉熵代价函数,以所述第一评分向量作为标签,以所述距离向量作为输入,对所述背景生成网络进行训练,直至所述背景生成网络生成的背景图为所述距离向量最小的背景图,则完成所述背景生成网络的训练。
作为一种可实施方式,参考图4,图4为本公开一示例的背景生成网络训练方法的示例图。图中有N张背景图,对应N个背景特征,计算第一合并特征分别与N个背景图对应的背景特征之间的欧式距离,得到N个欧式距离,生成长度为N的距离向量。相应的,第一评分向量的长度也为N。将第一评分向量中最大的评分设置为1,其余评分设置为0。使用交叉熵代价函数,以第一评分向量作为标签,距离向量作为输入对背景生成网络进行训练。其中,交叉熵代价函数在训练过程会将评分为1的第一封面对应的欧氏距离缩小,将评分为0的第一封面对应的欧氏距离扩大。评分为1的第一封面即评价网络认为的最美观的第一封面。通过将评分为1的第一封面对应的欧氏距离缩小,背景生成网络生成的背景图的背景特征更接近第一合并特征,则背景生成网络生成的背景图更匹配前景图像,从而达到训练背景生成网络的目的。
基于以上实施方式,本公开实施例所提供的方法,通过训练好的评价网络,对背景生成网络进行训练,得到能准确生成匹配前景图像的背景图的背景生成网络。
在又一个示例中,所述按照所述位置向量,对所述前景图、所述装饰图以及所述文案布局至所述背景图,得到多个生成封面,并将所述多个生成封面输入评价网络,得到所述多个生成封面的评分值,包括:将所述装饰图按照所述装饰图位置参数布局至所述背景图上,得到多个第二封面;将所述多个第二封面输入评价网络,得到所述多个第二封面的评分值;将所述前景图按照所述前景图位置参数布局至所述第二封面上,得到多个第三封面;将所述多个第三封面输入评价网络,得到所述多个第三封面的评分值;将所述文案按照所述文案位置参数布局至所述第三封面上,得到多个第四封面;将所述多个第四封面输入评价网络,得到所述多个第四封面的评分值;其中,所述多个生成封面包括所述多个第二封面、所述多个第三封面和所述多个第四封面;所述根据所述多个生成封面的评分值和预设的代价阈值,对所述排版网络进行训练,包括:根据所述位置向量,生成训练向量,所述训练向量包括横坐标下所述前景图对应的位置向量和所述装饰图对应的位置向量以及所述文案对应的位置向量之和、纵坐标下所述前景图对应的位置向量和所述装饰图对应的位置向量以及所述文案对应的位置向量之和,以及面积占比下所述前景图对应的位置向量和所述装饰图对应的位置向量以及所述文案对应的位置向量之和;基于均方差代价函数,以所述多个生成封面的评分值中的最大评分值作为标签,以所述训练向量作为输入,对所述排版网络进行训练,直至代价值小于预设的第一代价值阈值,则完成所述排版网络的训练。
结合图示的示例对排版网络训练方法进行举例介绍,参考图5,图5为本公开一示例的排版网络训练方法的示例图。先根据排版网络提供的位置向量将前景图布局到背景图上,使用评价网络进行评分,分数记为reward1。再根据排版网络提供的位置向量将装饰图布局到背景图上,使用评价网络进行评分,分数记为reward2。再根据排版网络提供的位置向量将文案布局到背景图上,使用评价网络进行评分,分数记为reward3。生成评分列表rewards={reward1 reward2 reward3}。
作为一种可实施方式,分别取向量X={a1 a2 a3 b1 b2 b3 c1 c2 c3}的每个子向量的最大数值记为R={A1 A2 A3 B1 B2 B3 C1 C2 C3},对前景图、装饰图以及文案三个部分分别求和,得到R={R1 R2 R3},其中R1=sum(A1 A2 A3),R2=sum(B1 B2 B3),R3=sum(C1 C2 C3)。以rewards作为标签,以R作为输入,对所述排版网络进行训练,直至代价值小于预设的第一代价值阈值,则认为按照排版网络输出的位置向量布局的封面,接近评价网络评价的最高分的封面,则完成所述评价网络的训练。
基于以上实施方式,本公开实施例所提供的方法,通过训练好的评价网络,对排版网络进行训练,得到能准确输出前景图、装饰图以及文案布局的排版网络。
在一个示例中,参考图6,图6为本公开又一实施例提供的评价网络训练方法的流程示意图。如图6所示,对评价网络的训练过程进行示例说明。封面设计模型训练方法还包括:
S301、从封面库中获取多张第五封面并分成多组,每组包含张数相同的多张第五封面;针对每组第五封面,根据用户设定的美观度排序结果,对该组第五封面中的多个封面进行排序;所述封面库通过已有的封面建立得到。
本实施例中,可以随机获取多张第五封面,也可以按照预设的抽样规则获取多张第五封面,举例来说,可以在封面库中每隔预设张数,获取一张第五封面。由专业设计人员得到美观度排序。
S302、将排序后的每组第五封面各自对应的封面特征输入评价网络,输出的第二评分向量,根据所述第二评分向量对每组第五封面进行排序,直至和用户设定的美观度排序结果的相似度达到预设的排序阈值,则完成所述评价网络的训练。
本实施例中,当根据评价网络对每组第五封面的排序与美观度排序的相似度达到预设的排序阈值时,说明当前的评价网络的评价效果达到专业设计人员的评价水平,则完成所述评价网络的训练。可以理解,完成训练的评价网络可以代替人工对封面进行评分。
在一个示例中,S302包括:将排序后的每组第五封面各自对应的封面特征依次输入评价网络,得到评价网络输出的第二评分向量;所述第二评分向量包括该组封面中每个封面的评分值;依次针对所述第二评分向量中的每个评分值,计算所述评分值与排序在所述评分值之后的所有评分值的差,得到相减向量;通过激活函数对所述相减向量进行激活处理,基于交叉熵代价函数,以经过激活函数处理的结果作为输入,向1回归,对所述评价网络进行训练,直至代价值小于预设的第二代价值阈值,则完成所述评价网络的训练。
作为一种可实施方式,参考图7,图7为本公开一示例的评价网络训练方法的示例图。图中将多张第五封面分成N组,每份有M张。每组中美观度最高的第五封面设置序号为0,美观度最低的第五封面设置序号为M-1,例如当M等于4时,美观度最高的第五封面设置序号为0,比序号为0的第五封面美观度低的第五封面设置序号为1,比序号为1的第五封面美观度低的第五封面设置序号为2,比序号为2的第五封面美观度低的第五封面设置序号为3。将每组第五封面按照美观度由高到低排序,取一组第五封面,分别提取各自的封面特征。将封面特征依次输入评价网络,输出每个第五封面对应的第二评分向量。计算第二评分向量中排序靠前的评分值与排序在所述评分值之后的所有评分值的差,得到相减向量。举例说明,评分值50之后的评分值有70、40以及30。分别计算50与70、40以及30的差值,得到-20、10以及20。
可选的,使用激活函数Sigmoid对所述相减向量进行激活处理。
示例来说,Sigmoid函数将相减向量转换为区间(0,1)之间,如果向1进行回归则相减向量值会趋向正无穷。因为相减向量是美观度排序靠前的第五封面对应的评分值减去美观度排序靠后的第五封面对应的评分值,当相减向量趋向正无穷时,则美观度排序靠前的第五封面对应的评分值>美观度排序靠后的第五封面对应的评分值。可以理解,通过计算相减向量的方法,可以对评价网络输出的评分值排序进行训练,提高训练效果,当训练完成后,评价网络对美观度排序越靠前的第五封面的评分值越大。
需要说明的是,本公开不限制激活函数的具体类型。
基于以上实施方式,本公开实施例所提供的方法,通过相减向量对排版网络进行训练,得到能够准确根据封面的美观度进行评分的评价网络。
以上方案,对封面设计模型训练过程进行了示例说明。接下来对应用场景即封面设计过程进行示例说明。
在又一个示例中,封面设计方法,包括:将用户输入的待处理背景颜色、待处理文案、待处理装饰图以及待处理前景图,输入完成训练的封面设计模型,得到第六封面,将该第六封面推送给用户。可以理解,在封面设计的过程中不需要人工判别封面的美观度。
示例来说,完成训练的封面设计模型,达到评价网络的标准,因此在应用过程中生成的第六封面不需要输入评价网络,直接推送给用户。
在又一个示例中,所述将用户输入的待处理背景颜色、待处理文案、待处理装饰图以及待处理前景图,输入完成训练的封面设计模型,得到第六封面,包括:提取所述待处理背景颜色的颜色特征,提取所述待处理前景图的图像特征、提取所述待处理装饰图的图像特征以及提取所述待处理文案的文案特征进行合并,得到第三合并特征;将所述第三合并特征输入完成训练的封面设计模型的背景生成网络,得到待处理背景图;提取所述待处理背景图的背景特征;将所述待处理背景图的背景特征、所述待处理前景图的图像特征、所述待处理装饰图的图像特征以及所述待处理文案的文案特征进行合并,得到第四合并特征;将所述第四合并特征输入完成训练的封面设计模型的排版网络,得到待处理位置向量;根据所述待处理位置向量,将所述待处理前景图、所述待处理装饰图以及所述待处理文案布局在所述待处理背景图上,得到第六封面。
结合图示进行示例说明,参考图8,图8为本公开一示例提供的封面设计方法的示例图。封面设计模型的背景生成网络根据第三合并特征,输出待处理背景图。封面设计模型的排版网络根据第四合并特征,输出位置向量。根据位置向量,将待处理前景图、待处理装饰图以及待处理文案布局在待处理背景图上,得到第六封面。其中,待处理背景图的颜色从用户输入的待处理背景颜色匹配获得,因此第三合并特征包括颜色特征。排版网络是基于待处理背景图进行位置向量匹配,因此第四合并特征包括待处理背景图的背景特征。
基于以上实施方式,通过训练好的封面设计模型生成封面,相比于通过人工设计封面的方法,可以提高封面设计的效率。同时封面设计模型可以代替模板和人工规则对封面美观度的判别,从而设计出更丰富的封面。
本实施例提供的封面设计模型训练方法,从前景图库中选取一张前景图像,提取所述前景图像的图像特征、文案特征以及颜色特征并进行合并,得到第一合并特征;将所述第一合并特征和背景特征输入封面设计模型中的背景生成网络,得到生成的背景图;通过排版网络,将所述前景图分别和背景图库中的所有背景图组装,得到多张第一封面;将所述多张第一封面输入评价网络,得到第一评分向量;根据所述生成的背景图、第一封面以及每个第一封面对应的第一评分,对所述背景生成网络进行训练;直至所述生成的背景图为第一评分最高的第一封面对应的背景图,则完成所述背景生成网络的训练。以上方法,通过评价网络训练得到的封面设计模型设计封面,相比于通过人工设计封面的方法,可以提高封面设计的效率。
示例性介质
在介绍了本公开示例性实施方式的方法之后,接下来,参考图9对本公开示例性实施方式的存储介质进行说明。
参考图9所示,存储介质90中存储着根据本公开的实施方式的用于实现上述方法的程序产品,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本公开的程序产品不限于此。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开公开操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备。
示例性装置
在介绍了本公开示例性实施方式的介质之后,接下来,参考图10对本公开示例性实施方式的封面设计模型训练装置进行说明,用于实现上述任一方法实施例中的方法,其实现原理和技术效果类似,在此不再赘述。
参考图10,图10为本公开一实施例提供的封面设计模型训练装置的结构示意图。如图10所示,封面设计模型训练装置包括:
提取模块101,用于从前景图库中选取一张前景图,提取所述前景图的图像特征、文案特征以及颜色特征并进行合并,得到第一合并特征;提取背景图库的每个背景的背景特征;所述背景图库和前景图库通过建立得到;所述前景图像中包含前景图以及文案;
其中,所述图像特征包括人脸关键点位置、图像清晰度以及颜色直方图等。所述文案特征包括文案情感、文案题材以及文案BERT编码等。所述颜色特征为前景图包含的颜色。实际应用中,所述神经网络包括但不限于残差网络。所述文案情感包括忧伤、欢乐以及平静等,所述文案题材包括诗歌、叙事以及笑话等,所述文案BERT编码通过注意力网络提取获得。所述背景图库通过已有的背景建立。所述前景图库通过已有的前景建立。可以理解,封面设计模型依据多种类型的特征进行封面设计,可以提高封面设计的丰富度。
生成模块102,用于将所述第一合并特征和所述背景特征输入封面设计模型中的背景生成网络,得到生成的背景图;所述生成的背景图的背景特征与所述第一合并特征最接近。
其中,所述封面设计模型在多个背景特征中匹配到与第一合并特征最接近的背景特征。可以理解,这里匹配到的背景特征对应的背景与第一合并特征对应的前景最匹配。可以理解,通过背景特征和第一合并特征,可以准确地进行背景图生成。
组装模块103,用于通过排版网络,将所述前景图分别和背景图库中的所有背景组装,得到多张第一封面;将所述多张第一封面输入评价网络,得到第一评分向量,所述第一评分向量包括所述多张第一封面的评分;所述排版网络通过已有的背景图、前景图、装饰图以及文案作为训练集,进行训练得到;所述评价网络通过已有的封面作为训练集,进行训练得到。
其中,每个第一封面输入评价网络,得到对应的第一评分。所述第一评分表征评价网络认定的第一封面的美观度,即第一封面对应的背景图和前景图的匹配程度。可以理解,通过训练好的评价网络,可以对多张第一封面进行准确的评价。
训练模块104,用于根据所述生成的背景图、第一封面以及每个第一封面对应的第一评分,对所述背景生成网络进行训练;直至所述生成的背景图为第一评分最高的第一封面对应的背景图,则完成所述背景生成网络的训练。
其中,所述第一评分最高的第一封面对应的背景图和前景图的匹配程度,相比其他第一封面对应的背景图和前景图的匹配程度更高。当生成的背景图为第一评分最高的第一封面对应的背景图,说明当前背景生成网络能够根据前景图,在背景图库中匹配到最合适的背景图,可以认定完成训练。可以理解,通过训练好的评价网络作为标准,对背景生成网络训练,得到的背景生成网络能够根据前景图像准确匹配到合适的背景图。
在一个示例中,提取模块101,还用于从背景图库、前景图库、装饰图库以及文案库分别随机选取背景图、前景图、装饰图以及文案;从所述背景图中提取背景特征、从所述前景图中提取图像特征、从所述装饰图中提取图像特征以及从所述文案中提取文案特征,将所述背景特征、图像特征以及文案特征进行合并,得到第二合并特征;所述装饰图库以及文案库通过建立得到;生成模块102,还用于将所述第二合并特征输入所述排版网络,得到位置向量;所述位置向量包含所述前景图位置参数、装饰图位置参数以及文案位置参数;所述前景图位置参数包括前景图在背景图中横坐标、纵坐标以及面积占比;所述装饰图位置参数包括文案在背景图中横坐标、纵坐标以及面积占比;所述文案位置参数包括文案在背景图中横坐标、纵坐标以及面积占比;生成模块102,还用于按照所述位置向量,将所述前景图、所述装饰图以及所述文案布局至所述背景图,得到多个生成封面,并将所述多个生成封面输入评价网络,得到所述多个生成封面的评分值;训练模块104,还用于根据所述多个生成封面的评分值,对所述排版网络进行训练;直至排版网络输出的前景图位置向量、装饰图位置向量以及文案位置向量同时对应的生成封面为评价网络输出的评分值最高的生成封面,则完成所述排版网络的训练。
在另一个示例中,训练模块104,具体用于计算所述第一合并特征和所述背景图库的每个背景图的背景特征之间的欧氏距离,生成一个距离向量;所述距离向量中的每个欧式距离表征所述第一合并特征和对应的背景特征之间的接近程度;训练模块104,具体还用于基于交叉熵代价函数,以所述第一评分向量作为标签,以所述距离向量作为输入,对所述背景生成网络进行训练,直至所述背景生成网络生成的背景图为所述距离向量最小的背景图,则完成所述背景生成网络的训练。
在又一个示例中,生成模块102,具体用于将所述装饰图按照所述装饰图位置参数布局至所述背景图上,得到多个第二封面;将所述多个第二封面输入评价网络,得到所述多个第二封面的评分值;生成模块102,具体还用于将所述前景图按照所述前景图位置参数布局至所述第二封面上,得到多个第三封面;将所述多个第三封面输入评价网络,得到所述多个第三封面的评分值;生成模块102,具体还用于将所述文案按照所述文案位置参数布局至所述第三封面上,得到多个第四封面;将所述多个第四封面输入评价网络,得到所述多个第四封面的评分值;其中,所述多个生成封面包括所述多个第二封面、所述多个第三封面和所述多个第四封面;训练模块104,具体用于根据所述位置向量,生成训练向量,所述训练向量包括横坐标下所述前景图对应的位置向量和所述装饰图对应的位置向量以及所述文案对应的位置向量之和、纵坐标下所述前景图对应的位置向量和所述装饰图对应的位置向量以及所述文案对应的位置向量之和,以及面积占比下所述前景图对应的位置向量和所述装饰图对应的位置向量以及所述文案对应的位置向量之和;训练模块104,具体还用于基于均方差代价函数,以所述多个生成封面的评分值中的最大评分值作为标签,以所述训练向量作为输入,对所述排版网络进行训练,直至代价值小于预设的第一代价值阈值,则完成所述排版网络的训练。
在一个示例中,提取模块101,还用于从封面库中获取多张第五封面并分成多组,每组包含张数相同的多张第五封面;针对每组第五封面,根据用户设定的美观度排序结果,对该组第五封面中的多个封面进行排序;所述封面库通过已有的封面建立得到。训练模块104,还用于将排序后的每组第五封面各自对应的封面特征输入评价网络,输出的第二评分向量,根据所述第二评分向量对每组第五封面进行排序,直至和用户设定的美观度排序结果的相似度达到预设的排序阈值,则完成所述评价网络的训练。
在一个示例中,训练模块104,具体用于将排序后的每组第五封面各自对应的封面特征依次输入评价网络,得到评价网络输出的第二评分向量;所述第二评分向量包括该组封面中每个封面的评分值;训练模块104,具体还用于依次针对所述第二评分向量中的每个评分值,计算所述评分值与排序在所述评分值之后的所有评分值的差,得到相减向量;训练模块104,具体还用于通过激活函数对所述相减向量进行激活处理,基于交叉熵代价函数,以经过激活函数处理的结果作为输入,向1回归,对所述评价网络进行训练,直至代价值小于预设的第二代价值阈值,则完成所述评价网络的训练。
参考图11,图11为本公开一实施例提供的封面设计装置的结构示意图。如图11所示,封面设计装置包括:
设计模块111,用于将用户输入的待处理背景颜色、待处理文案、待处理装饰图以及待处理前景图,输入完成训练的封面设计模型,得到第六封面,将该第六封面推送给用户。可以理解,在封面设计的过程中不需要人工判别封面的美观度。
在又一个示例中,所述装置还包括:处理模块112,用于提取所述待处理背景颜色的颜色特征,提取所述待处理前景图的图像特征、提取所述待处理装饰图的图像特征以及提取所述待处理文案的文案特征进行合并,得到第三合并特征;将所述第三合并特征输入完成训练的封面设计模型的背景生成网络,得到待处理背景图;处理模块112,还用于提取所述待处理背景图的背景特征;将所述待处理背景图的背景特征、所述待处理前景图的图像特征、所述待处理装饰图的图像特征以及所述待处理文案的文案特征进行合并,得到第四合并特征;将所述第四合并特征输入完成训练的封面设计模型的排版网络,得到待处理位置向量;布局模块113,用于根据所述待处理位置向量,将所述待处理前景图、所述待处理装饰图以及所述待处理文案布局在所述待处理背景图上,得到第六封面。
本实施例提供的封面设计模型训练装置,提取模块,用于从前景图库中选取一张前景图像,提取所述前景图像的图像特征、文案特征以及颜色特征并进行合并,得到第一合并特征;生成模块,用于将所述第一合并特征和背景特征输入封面设计模型中的背景生成网络,得到生成的背景图;组装模块,用于通过排版网络,将所述前景图分别和背景图库中的所有背景图组装,得到多张第一封面;将所述多张第一封面输入评价网络,得到第一评分向量;训练模块,用于根据所述生成的背景图、第一封面以及每个第一封面对应的第一评分,对所述背景生成网络进行训练;直至所述生成的背景图为第一评分最高的第一封面对应的背景图,则完成所述背景生成网络的训练。以上装置,通过评价网络训练得到的封面设计模型设计封面,相比于通过人工设计封面的方法,可以提高封面设计的效率。
示例性计算设备
在介绍了本公开示例性实施方式的方法、介质和装置之后,接下来,参考图12对本公开示例性实施方式的计算设备进行说明。
图12显示的计算设备120仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图12所示,计算设备120以通用计算设备的形式表现。计算设备120的组件可以包括但不限于:上述至少一个处理单元1201、上述至少一个存储单元1202,连接不同系统组件(包括处理单元1201和存储单元1202)的总线1203。
总线1203包括数据总线、控制总线和地址总线。
存储单元1202可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)12021和/或高速缓存存储器12022,可以进一步包括非易失性存储器形式的可读介质,例如只读存储器(ROM)12023。
存储单元1202还可以包括具有一组(至少一个)程序模块12024的程序/实用工具12025,这样的程序模块12024包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
计算设备120也可以与一个或多个外部设备1204(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口1205进行。并且,计算设备120还可以通过网络适配器1206与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图12所示,网络适配器1206通过总线1203与计算设备120的其它模块通信。应当理解,尽管图中未示出,可以结合计算设备120使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了封面设计模型训练装置的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
此外,尽管在附图中以特定顺序描述了本公开方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
虽然已经参考若干具体实施方式描述了本公开的精神和原理,但是应该理解,本公开并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本公开旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。
Claims (18)
1.一种封面设计模型训练方法,所述封面设计模型包括背景生成网络以及排版网络,所述方法包括:
从前景图库中选取一张前景图像,提取所述前景图像的图像特征、文案特征以及颜色特征并进行合并,得到第一合并特征;提取背景图库的每个背景图的背景特征;所述背景图库和前景图库通过建立得到;所述前景图像中包含前景图以及文案;
将所述第一合并特征和所述背景特征输入封面设计模型中的背景生成网络,得到生成的背景图;所述生成的背景图的背景特征与所述第一合并特征最接近;
通过排版网络,将所述前景图分别和背景图库中的所有背景图组装,得到多张第一封面;将所述多张第一封面输入评价网络,得到第一评分向量,所述第一评分向量包括所述多张第一封面的评分;所述排版网络通过已有的背景图、前景图、装饰图以及文案作为训练集,进行训练得到;所述评价网络通过已有的封面作为训练集,进行训练得到;
根据所述生成的背景图、第一封面以及每个第一封面对应的第一评分,对所述背景生成网络进行训练;直至所述生成的背景图为第一评分最高的第一封面对应的背景图,则完成所述背景生成网络的训练。
2.根据权利要求1所述的方法,所述排版网络通过已有的背景图、前景图、装饰图以及文案作为训练集,进行训练得到,包括:
从背景图库、前景图库、装饰图库以及文案库分别随机选取背景图、前景图、装饰图以及文案;从所述背景图中提取背景特征、从所述前景图中提取图像特征、从所述装饰图中提取图像特征以及从所述文案中提取文案特征,将所述背景特征、图像特征以及文案特征进行合并,得到第二合并特征;所述装饰图库以及文案库通过建立得到;
将所述第二合并特征输入所述排版网络,得到位置向量;所述位置向量包含所述前景图位置参数、装饰图位置参数以及文案位置参数;所述前景图位置参数包括前景图在背景图中横坐标、纵坐标以及面积占比;所述装饰图位置参数包括文案在背景图中横坐标、纵坐标以及面积占比;所述文案位置参数包括文案在背景图中横坐标、纵坐标以及面积占比;
按照所述位置向量,将所述前景图、所述装饰图以及所述文案布局至所述背景图,得到多个生成封面,并将所述多个生成封面输入评价网络,得到所述多个生成封面的评分值;
根据所述多个生成封面的评分值,对所述排版网络进行训练;直至排版网络输出的前景图位置向量、装饰图位置向量以及文案位置向量同时对应的生成封面为评价网络输出的评分值最高的生成封面,则完成所述排版网络的训练。
3.根据权利要求1所述的方法,所述根据所述生成的背景图、第一封面以及第一封面的第一评分,对所述背景生成网络进行训练,包括:
计算所述第一合并特征和所述背景图库的每个背景图的背景特征之间的欧氏距离,生成一个距离向量;所述距离向量中的每个欧式距离表征所述第一合并特征和对应的背景特征之间的接近程度;
基于交叉熵代价函数,以所述;作为标签,以所述距离向量作为输入,对所述背景生成网络进行训练,直至所述背景生成网络生成的背景图为所述距离向量最小的背景图,则完成所述背景生成网络的训练。
4.根据权利要求2所述的方法,所述按照所述位置向量,对所述前景图、所述装饰图以及所述文案布局至所述背景图,得到多个生成封面,并将所述多个生成封面输入评价网络,得到所述多个生成封面的评分值,包括:
将所述装饰图按照所述装饰图位置参数布局至所述背景图上,得到多个第二封面;将所述多个第二封面输入评价网络,得到所述多个第二封面的评分值;
将所述前景图按照所述前景图位置参数布局至所述第二封面上,得到多个第三封面;将所述多个第三封面输入评价网络,得到所述多个第三封面的评分值;
将所述文案按照所述文案位置参数布局至所述第三封面上,得到多个第四封面;将所述多个第四封面输入评价网络,得到所述多个第四封面的评分值;其中,所述多个生成封面包括所述多个第二封面、所述多个第三封面和所述多个第四封面;
所述根据所述多个生成封面的评分值和预设的代价阈值,对所述排版网络进行训练,包括:
根据所述位置向量,生成训练向量,所述训练向量包括横坐标下所述前景图对应的位置向量和所述装饰图对应的位置向量以及所述文案对应的位置向量之和、纵坐标下所述前景图对应的位置向量和所述装饰图对应的位置向量以及所述文案对应的位置向量之和,以及面积占比下所述前景图对应的位置向量和所述装饰图对应的位置向量以及所述文案对应的位置向量之和;
基于均方差代价函数,以所述多个生成封面的评分值中的最大评分值作为标签,以所述训练向量作为输入,对所述排版网络进行训练,直至代价值小于预设的第一代价值阈值,则完成所述排版网络的训练。
5.根据权利要求1所述的方法,所述方法还包括:
从封面库中获取多张第五封面并分成多组,每组包含张数相同的多张第五封面,提取所述第五封面的封面特征;针对每组第五封面,根据用户设定的美观度排序结果,对该组第五封面中的多个封面进行排序;所述封面库通过已有的封面建立得到;
将排序后的每组第五封面各自对应的封面特征输入评价网络,输出第二评分向量,根据所述第二评分向量对每组第五封面进行排序,直至和用户设定的美观度排序结果的相似度达到预设的排序阈值,则完成所述评价网络的训练。
6.根据权利要求5所述的方法,所述根据所述第二评分向量对每组第五封面进行排序,直至和用户设定的美观度排序结果的相似度达到预设的排序阈值,则完成所述评价网络的训练,包括:
将排序后的每组第五封面各自对应的封面特征依次输入评价网络,得到评价网络输出的第二评分向量;所述第二评分向量包括所述每组第五封面中每个封面的评分值;
依次针对所述第二评分向量中的每个评分值,计算所述评分值与排序在所述评分值之后的所有评分值的差,得到相减向量;
通过激活函数对所述相减向量进行激活处理,基于交叉熵代价函数,以经过激活函数处理的结果作为输入,向1回归,对所述评价网络进行训练,直至代价值小于预设的第二代价值阈值,则完成所述评价网络的训练。
7.一种封面设计方法,所述方法还包括:
将用户输入的待处理背景颜色、待处理文案、待处理装饰图以及待处理前景图,输入完成训练的封面设计模型,得到第六封面,将该第六封面推送给用户,其中,所述封面设计模型为基于权利要求1-6中任一项所述的封面设计模型训练方法生成的。
8.根据权利要求7所述的方法,所述将用户输入的待处理背景颜色、待处理文案、待处理装饰图以及待处理前景图,输入完成训练的封面设计模型,得到第六封面,包括:
提取所述待处理背景颜色的颜色特征,提取所述待处理前景图的图像特征、提取所述待处理装饰图的图像特征以及提取所述待处理文案的文案特征进行合并,得到第三合并特征;将所述第三合并特征输入完成训练的封面设计模型的背景生成网络,得到待处理背景图;
提取所述待处理背景图的背景特征;将所述待处理背景图的背景特征、所述待处理前景图的图像特征、所述待处理装饰图的图像特征以及所述待处理文案的文案特征进行合并,得到第四合并特征;将所述第四合并特征输入完成训练的封面设计模型的排版网络,得到待处理位置向量;
根据所述待处理位置向量,将所述待处理前景图、所述待处理装饰图以及所述待处理文案布局在所述待处理背景图上,得到第六封面。
9.一种计算机可读存储介质,包括:所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1至8中任一项所述的封面设计模型训练方法。
10.一种封面设计模型训练装置,所述封面设计模型包括背景生成网络以及排版网络,所述装置包括:
提取模块,用于从前景图库中选取一张前景图像,提取所述前景图像的图像特征、文案特征以及颜色特征并进行合并,得到第一合并特征;提取背景图库的每个背景图的背景特征;所述背景图库和前景图库通过建立得到;所述前景图像中包含前景图以及文案;
生成模块,用于将所述第一合并特征和所述背景特征输入封面设计模型中的背景生成网络,得到生成的背景图;所述生成的背景图的背景特征与所述第一合并特征最接近;
组装模块,用于通过排版网络,将所述前景图像分别和背景图库中的所有背景图组装,得到多张第一封面;将所述多张第一封面输入评价网络,得到第一评分向量,所述第一评分向量包括所述多张第一封面的评分;所述排版网络通过已有的背景图、前景图、装饰图以及文案作为训练集,进行训练得到;所述评价网络通过已有的封面作为训练集,进行训练得到;
训练模块,用于根据所述生成的背景图、第一封面以及每个第一封面对应的第一评分,对所述背景生成网络进行训练;直至所述生成的背景图为第一评分最高的第一封面对应的背景图,则完成所述背景生成网络的训练。
11.根据权利要求10所述的装置,
所述提取模块,还用于从背景图库、前景图库、装饰图库以及文案库分别随机选取背景图、前景图、装饰图以及文案;从所述背景图中提取背景特征、从所述前景图中提取图像特征、从所述装饰图中提取图像特征以及从所述文案中提取文案特征,将所述背景特征、图像特征以及文案特征进行合并,得到第二合并特征;所述装饰图库以及文案库通过建立得到;
所述生成模块,还用于将所述第二合并特征输入所述排版网络,得到位置向量;所述位置向量包含所述前景图位置参数、装饰图位置参数以及文案位置参数;所述前景图位置参数包括前景图在背景图中横坐标、纵坐标以及面积占比;所述装饰图位置参数包括文案在背景图中横坐标、纵坐标以及面积占比;所述文案位置参数包括文案在背景图中横坐标、纵坐标以及面积占比;
所述生成模块,还用于按照所述位置向量,将所述前景图、所述装饰图以及所述文案布局至所述背景图,得到多个生成封面,并将所述多个生成封面输入评价网络,得到所述多个生成封面的评分值;
所述训练模块,还用于根据所述多个生成封面的评分值,对所述排版网络进行训练;直至排版网络输出的前景图位置向量、装饰图位置向量以及文案位置向量同时对应的生成封面为评价网络输出的评分值最高的生成封面,则完成所述排版网络的训练。
12.根据权利要求10所述的装置,
所述训练模块,具体用于计算所述第一合并特征和所述背景图库的每个背景图的背景特征之间的欧氏距离,生成一个距离向量;所述距离向量中的每个欧式距离表征所述第一合并特征和对应的背景特征之间的接近程度;
所述训练模块,具体还用于基于交叉熵代价函数,以所述第一评分向量作为标签,以所述距离向量作为输入,对所述背景生成网络进行训练,直至所述背景生成网络生成的背景图为所述距离向量最小的背景图,则完成所述背景生成网络的训练。
13.根据权利要求11所述的装置,
所述生成模块,具体用于将所述装饰图按照所述装饰图位置参数布局至所述背景图上,得到多个第二封面;将所述多个第二封面输入评价网络,得到所述多个第二封面的评分值;
所述生成模块,具体还用于将所述前景图按照所述前景图位置参数布局至所述第二封面上,得到多个第三封面;将所述多个第三封面输入评价网络,得到所述多个第三封面的评分值;
所述生成模块,具体还用于将所述文案按照所述文案位置参数布局至所述第三封面上,得到多个第四封面;将所述多个第四封面输入评价网络,得到所述多个第四封面的评分值;其中,所述多个生成封面包括所述多个第二封面、所述多个第三封面和所述多个第四封面;
所述训练模块,具体用于根据所述位置向量,生成训练向量,所述训练向量包括横坐标下所述前景图对应的位置向量和所述装饰图对应的位置向量以及所述文案对应的位置向量之和、纵坐标下所述前景图对应的位置向量和所述装饰图对应的位置向量以及所述文案对应的位置向量之和,以及面积占比下所述前景图对应的位置向量和所述装饰图对应的位置向量以及所述文案对应的位置向量之和;
所述训练模块,具体还用于基于均方差代价函数,以所述多个生成封面的评分值中的最大评分值作为标签,以所述训练向量作为输入,对所述排版网络进行训练,直至代价值小于预设的第一代价值阈值,则完成所述排版网络的训练。
14.根据权利要求10所述的装置,
所述提取模块,还用于从封面库中获取多张第五封面并分成多组,每组包含张数相同的多张第五封面,提取所述第五封面的封面特征;针对每组第五封面,根据用户设定的美观度排序结果,对该组第五封面中的多个封面进行排序;所述封面库通过已有的封面建立得到;
所述训练模块,还用于将排序后的每组第五封面各自对应的封面特征输入评价网络,输出第二评分向量,根据所述第二评分向量对每组第五封面进行排序,直至和用户设定的美观度排序结果的相似度达到预设的排序阈值,则完成所述评价网络的训练。
15.根据权利要求14所述的装置,
所述训练模块,具体用于将排序后的每组第五封面各自对应的封面特征依次输入评价网络,得到评价网络输出的第二评分向量;所述第二评分向量包括所述每组第五封面中每个封面的评分值;
所述训练模块,具体还用于依次针对所述第二评分向量中的每个评分值,计算所述评分值与排序在所述评分值之后的所有评分值的差,得到相减向量;
所述训练模块,具体还用于通过激活函数对所述相减向量进行激活处理,基于交叉熵代价函数,以经过激活函数处理的结果作为输入,向1回归,对所述评价网络进行训练,直至代价值小于预设的第二代价值阈值,则完成所述评价网络的训练。
16.一种封面设计装置,所述装置包括:
设计模块,用于将用户输入的待处理背景颜色、待处理文案、待处理装饰图以及待处理前景图,输入完成训练的封面设计模型,得到第六封面,将该第六封面推送给用户,其中,所述封面设计模型为基于权利要求1-6中任一项所述的封面设计模型训练方法生成的。
17.根据权利要求16所述的装置,所述装置还包括:
处理模块,用于提取所述待处理背景颜色的颜色特征,提取所述待处理前景图的图像特征、提取所述待处理装饰图的图像特征以及提取所述待处理文案的文案特征进行合并,得到第三合并特征;将所述第三合并特征输入完成训练的所述封面设计模型的背景生成网络,得到待处理背景图;
所述处理模块,还用于提取所述待处理背景图的背景特征;将所述待处理背景图的背景特征、所述待处理前景图的图像特征以及所述待处理文案的文案特征进行合并,得到第四合并特征;将所述第四合并特征输入完成训练的所述封面设计模型的排版网络,得到待处理位置向量;
布局模块,用于根据所述待处理位置向量,将所述待处理前景图、所述待处理装饰图以及所述待处理文案布局在所述待处理背景图上,得到第六封面。
18.一种计算设备,包括:
至少一个处理器;
以及与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述计算设备执行如权利要求1至8任一项所述的封面设计模型训练方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210513635.6A CN114926705B (zh) | 2022-05-12 | 2022-05-12 | 封面设计模型训练方法、介质、装置和计算设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210513635.6A CN114926705B (zh) | 2022-05-12 | 2022-05-12 | 封面设计模型训练方法、介质、装置和计算设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114926705A CN114926705A (zh) | 2022-08-19 |
CN114926705B true CN114926705B (zh) | 2024-05-28 |
Family
ID=82807770
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210513635.6A Active CN114926705B (zh) | 2022-05-12 | 2022-05-12 | 封面设计模型训练方法、介质、装置和计算设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114926705B (zh) |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109522950A (zh) * | 2018-11-09 | 2019-03-26 | 网易传媒科技(北京)有限公司 | 图像评分模型训练方法及装置和图像评分方法及装置 |
CN110210347A (zh) * | 2019-05-21 | 2019-09-06 | 赵森 | 一种基于深度学习的彩色套层剪纸智能设计方法 |
CN110263213A (zh) * | 2019-05-22 | 2019-09-20 | 腾讯科技(深圳)有限公司 | 视频推送方法、装置、计算机设备及存储介质 |
CN110795925A (zh) * | 2019-10-12 | 2020-02-14 | 腾讯科技(深圳)有限公司 | 基于人工智能的图文排版方法、图文排版装置及电子设备 |
CN110838131A (zh) * | 2019-11-04 | 2020-02-25 | 网易(杭州)网络有限公司 | 自动抠图的实现方法、装置、电子设备以及介质 |
CN110852332A (zh) * | 2019-10-29 | 2020-02-28 | 腾讯科技(深圳)有限公司 | 训练样本的生成方法、装置、存储介质及电子设备 |
CN111507910A (zh) * | 2020-03-18 | 2020-08-07 | 南方电网科学研究院有限责任公司 | 一种单图像去反光的方法、装置及存储介质 |
CN113255810A (zh) * | 2021-06-04 | 2021-08-13 | 杭州新州网络科技有限公司 | 基于关键决策逻辑设计测试覆盖率的网络模型测试方法 |
CN113780289A (zh) * | 2021-08-05 | 2021-12-10 | 网易(杭州)网络有限公司 | 图像识别方法及装置、存储介质和电子设备 |
CN113919080A (zh) * | 2021-11-11 | 2022-01-11 | 湖南湖大艾盛汽车技术开发有限公司 | 一种基于机器学习的汽车发动机罩力学性能快速评估方法 |
CN113987637A (zh) * | 2021-10-25 | 2022-01-28 | 清华大学 | 基于生成对抗网络的楼盖结构设计方法和装置 |
CN114139495A (zh) * | 2021-11-29 | 2022-03-04 | 合肥高维数据技术有限公司 | 基于自适应生成对抗网络的中文字体风格迁移方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8660366B2 (en) * | 2009-03-18 | 2014-02-25 | Shutterfly, Inc. | Smart creation of photobooks |
AT512977B1 (de) * | 2013-05-22 | 2014-12-15 | Avl List Gmbh | Methode zur Ermittlung eines Modells einer Ausgangsgröße eines technischen Systems |
-
2022
- 2022-05-12 CN CN202210513635.6A patent/CN114926705B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109522950A (zh) * | 2018-11-09 | 2019-03-26 | 网易传媒科技(北京)有限公司 | 图像评分模型训练方法及装置和图像评分方法及装置 |
CN110210347A (zh) * | 2019-05-21 | 2019-09-06 | 赵森 | 一种基于深度学习的彩色套层剪纸智能设计方法 |
CN110263213A (zh) * | 2019-05-22 | 2019-09-20 | 腾讯科技(深圳)有限公司 | 视频推送方法、装置、计算机设备及存储介质 |
CN110795925A (zh) * | 2019-10-12 | 2020-02-14 | 腾讯科技(深圳)有限公司 | 基于人工智能的图文排版方法、图文排版装置及电子设备 |
CN110852332A (zh) * | 2019-10-29 | 2020-02-28 | 腾讯科技(深圳)有限公司 | 训练样本的生成方法、装置、存储介质及电子设备 |
CN110838131A (zh) * | 2019-11-04 | 2020-02-25 | 网易(杭州)网络有限公司 | 自动抠图的实现方法、装置、电子设备以及介质 |
CN111507910A (zh) * | 2020-03-18 | 2020-08-07 | 南方电网科学研究院有限责任公司 | 一种单图像去反光的方法、装置及存储介质 |
CN113255810A (zh) * | 2021-06-04 | 2021-08-13 | 杭州新州网络科技有限公司 | 基于关键决策逻辑设计测试覆盖率的网络模型测试方法 |
CN113780289A (zh) * | 2021-08-05 | 2021-12-10 | 网易(杭州)网络有限公司 | 图像识别方法及装置、存储介质和电子设备 |
CN113987637A (zh) * | 2021-10-25 | 2022-01-28 | 清华大学 | 基于生成对抗网络的楼盖结构设计方法和装置 |
CN113919080A (zh) * | 2021-11-11 | 2022-01-11 | 湖南湖大艾盛汽车技术开发有限公司 | 一种基于机器学习的汽车发动机罩力学性能快速评估方法 |
CN114139495A (zh) * | 2021-11-29 | 2022-03-04 | 合肥高维数据技术有限公司 | 基于自适应生成对抗网络的中文字体风格迁移方法 |
Non-Patent Citations (1)
Title |
---|
Towards Book Cover Design via Layout Graphs;Llados, J et al.;《Lecture Notes in Computer Science》;20211118;第12823卷;第642-657页 * |
Also Published As
Publication number | Publication date |
---|---|
CN114926705A (zh) | 2022-08-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101855597B1 (ko) | 계층적 회귀 신경망을 이용하여 비디오 문절을 캡셔닝하기 위한 시스템 및 방법 | |
CN110795543B (zh) | 基于深度学习的非结构化数据抽取方法、装置及存储介质 | |
KR102577514B1 (ko) | 텍스트 창작 방법, 텍스트 창작 장치, 전자 기기 및 저장 매체 | |
CN108804530B (zh) | 对图像的区域加字幕 | |
CN110717017B (zh) | 一种处理语料的方法 | |
US7668371B2 (en) | System and method for adaptively separating foreground from arbitrary background in presentations | |
CN110798636B (zh) | 字幕生成方法及装置、电子设备 | |
JP6361351B2 (ja) | 発話ワードをランク付けする方法、プログラム及び計算処理システム | |
CN109271542A (zh) | 封面确定方法、装置、设备及可读存储介质 | |
KR102569517B1 (ko) | 번역 방법, 장치 및 전자 기기 | |
MX2008013134A (es) | Clasificacion basada en demografia para busqueda sin restriccion de acceso/web de palabra local. | |
CN111931500A (zh) | 搜索信息的处理方法、装置 | |
CN106339368A (zh) | 文本情感倾向的获取方法及装置 | |
JP2020106910A (ja) | マンガ生成システムおよびマンガ生成方法 | |
US11176332B2 (en) | Linking contextual information to text in time dependent media | |
CN111414561A (zh) | 用于呈现信息的方法和装置 | |
CN110032734B (zh) | 近义词扩展及生成对抗网络模型训练方法和装置 | |
US11653071B2 (en) | Responsive video content alteration | |
US20240086452A1 (en) | Tracking concepts within content in content management systems and adaptive learning systems | |
CN110263218A (zh) | 视频描述文本生成方法、装置、设备和介质 | |
CN110991175A (zh) | 多模态下的文本生成方法、系统、设备及存储介质 | |
CN117830580A (zh) | 图像生成方法、装置、电子设备及存储介质 | |
CN113407766A (zh) | 视觉动画显示方法及相关设备 | |
CN112199502A (zh) | 基于情感的诗句生成方法及装置、电子设备和存储介质 | |
CN111814488B (zh) | 一种诗词生成方法、装置、电子设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |