CN111754401A - 解码器训练方法、高清人脸图像生成方法、装置及计算机设备 - Google Patents
解码器训练方法、高清人脸图像生成方法、装置及计算机设备 Download PDFInfo
- Publication number
- CN111754401A CN111754401A CN202010492926.2A CN202010492926A CN111754401A CN 111754401 A CN111754401 A CN 111754401A CN 202010492926 A CN202010492926 A CN 202010492926A CN 111754401 A CN111754401 A CN 111754401A
- Authority
- CN
- China
- Prior art keywords
- face image
- decoder
- definition
- image
- dimensional vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000012549 training Methods 0.000 title claims abstract description 60
- 239000013598 vector Substances 0.000 claims abstract description 57
- 230000006870 function Effects 0.000 claims description 60
- 230000001815 facial effect Effects 0.000 claims description 34
- 238000004590 computer program Methods 0.000 claims description 14
- 238000004891 communication Methods 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000005070 sampling Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4046—Scaling of whole images or parts thereof, e.g. expanding or contracting using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明提供一种解码器训练方法,所述方法包括:获取第一人脸图像,所述第一人脸图像为分辨率小于第一预设值的低清人脸图像;所述解码器对所述第一人脸图像进行解码,形成对应所述第一人脸图像特征的高维向量,所述高维向量维度高于第二预设值;生成器根据所述高维向量生成第二人脸图像,所述第二人脸图像为分辨率高于第三预设值的高清人脸图像;根据所述第二人脸图像确定损失函数的值,根据所述损失函数的值对所述解码器参数进行调整;在所述损失函数值满足预设条件时,获得训练好的所述解码器。本申请使得解码器根据获取的低清人脸图像输出的高维向量在输入生成器之后,能够生成接近所述低清人脸图像的高清人脸图像。
Description
技术领域
本发明涉及图像处理领域,特别涉及解码器训练方法、高清人脸图像生成方法、装置及计算机设备。
背景技术
随着人工智能技术的发展和应用,在很多场景中需要生成高清晰度的人脸图像,现有技术中有采用随机变量生成高清晰的人脸图像的方法。例如,英伟达发布的照片级真实面部生成软件,该软件采用生成对抗网络(Generative Adversarial Nets, GAN)方法,利用两个神经网络互相训练,图像生成网络试图生成与真实照片无法区分的合成图像,而对抗网络试图分辨出差异,这样训练几个星期后,图像生成网络可以生成能够以假乱真的人脸图像。
但是现有技术采用随机变量生成高清晰的人脸图像,所生成的人脸是随机的,但在实际应用中,经常需要生成指定的人脸的高清晰图片,现有技术中随机生成高清人脸图像的方法无法满足这一需求。而现有技术中,有两种最新技术将模糊的人脸图像处理成较为清晰的人脸图像,一种技术采用图像超分辨率重建方法,另一种技术采用调节网络(Conditioning Network)和优先网络(prior network)优先网络会在低分辨率和高分辨率照片中做出决定,根据概率优先对高分辨率照片进行填充,现有技术都是通过对低分辨率图像进行填充,补充低清图像不包含的新细节,因此现有技术在低清图片高清化的过程中所增加的细节都只是一种“猜测”。
发明内容
为了解决现有技术存在的问题,本发明的至少一个实施例提供了一种解码器训练方法、高清人脸图像生成方法、装置及计算机设备,解决以上背景技术部分提到的各种问题,能够生成指定的人脸图像。
第一方面,本发明实施例提出一种解码器训练方法,所述方法包括:获取第一人脸图像,所述第一人脸图像为分辨率小于第一预设值的低清人脸图像;所述解码器对所述第一人脸图像进行解码,形成对应所述第一人脸图像特征的高维向量,所述高维向量维度高于第二预设值;生成器根据所述高维向量生成第二人脸图像,所述第二人脸图像为分辨率高于第三预设值的高清人脸图像;根据所述第二人脸图像确定损失函数的值,根据所述损失函数的值对所述解码器参数进行调整;在所述损失函数值满足预设条件时,获得训练好的所述解码器。
在一些实施例中,所述损失函数根据所述第一人脸图像特征与所述第二人脸图像特征的距离确定。
在一些实施例中,所述第一人脸图像特征与所述第二人脸图像特征的距离为L2距离,或者cos距离;所述损失函数值满足预设条件为损失函数值小于预设数值。
在一些实施例中,所述获取第一人脸图像包括:获取第三人脸图像,所述第三人脸图像分辨率高于所述第一人脸图像的分辨率;对所述第三人脸图像进行下采样,得到所述第一人脸图像。
在一些实施例中,所述损失函数根据所述第三人脸图像特征与所述第二人脸图像特征的距离确定。
在一些实施例中,所述第三人脸图像特征与所述第二人脸图像特征的距离为L2距离,或者cos距离;所述损失函数值满足预设条件为损失函数值小于预设数值。
第二方面,本发明实施例还提供一种高清人脸图像生成方法,包括:获取待处理低清人脸图像;将所述待处理低清人脸图像输入至如上述第一方面训练好的解码器,所述解码器输出与所述待处理低清人脸图像特征对应的高维向量;生成器根据所述解码器输出的高维向量生成高清人脸图像。
第三方面,本发明实施例还提供一种解码器训练装置,包括:输入层,用于输入训练图像,所述训练图像为分辨率小于第一预设值第一人脸图像;解码器,用于对所述训练图像进行解码得到对应所述训练图像特征的高维向量,所述高维向量维度高于第二预设值;输出层,用于输出所述训练结果,所述训练结果为所述训练图像特征的高维向量;生成器,用于接收所述输出层输出的训练结果,形成第二人脸图像,所述第二人脸图像为分辨率高于第三预设值的高清人脸图像;
损失函数值确定模块,用于确定损失函数的值;调整模块,用于根据所述损失函数的值对所述解码器参数进行调整,以及在所述损失函数值满足预设条件时,获得训练好的所述解码器。
在一些实施例中,所述装置的所述损失函数值确定模块根据所述第一人脸图像特征与所述第二人脸图像特征的距离确定所述损失函数值。
在一些实施例中,所述装置还包括第三人脸图像获取模块,用于获取第三人脸图像,所述第三人脸图像分辨率高于所述第一人脸图像的分辨率;下采样模块,用于对所述第三人脸图像进行下采样,得到所述第一人脸图像。
在一些实施例中,所述装置的所述损失函数值确定模块根据所述第三人脸图像特征与所述第二人脸图像特征的距离确定所述损失函数值。
在一些实施例中,所述装置还包括人脸识别模块,所述人脸识别模块用于获取所述第一人脸图像特征、所述第二人脸图像特征或所述第三人脸图像特征。
在一些实施例中,所述装置的所述人脸识别模块为light_cnn网络,或facenet网络。
第四方面,本发明实施例还提供一种高清人脸图像生成装置,包括:低清人脸图像获取模块,用于获取待处理低清人脸图像;解码器,为上述第三方面训练装置训练得到的解码器;生成器,用于根据所述解码器输出的高维向量生成高清人脸图像。
第五方面,本发明实施例还提供一种计算机设备,包括:至少一个处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;与所述至少一个处理器耦合的存储器,所述存储器存储有可执行指令,其中,所述可执行指令在被所述至少一个处理器执行时使得实现上述第一方面或第二方面中的方法。
第六方面,本发明实施例还提供一种芯片,用于执行上述第一方面中的方法。具体地,该芯片包括:处理器,用于从存储器中调用并运行计算机程序,使得安装有该芯片的设备用于执行上述第一方面或第二方面中的方法。
第七方面,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上第一方面或第二方面的任一项所述的方法。
第八方面,本发明实施例还提供一种计算机程序产品,包括计算机程序指令,该计算机程序指令使得计算机执行上述第一方面中或第二方面的任一项所述的方法。
本发明实施例的解码器训练方法和装置,使得解码器根据获取的低清人脸图像输出的高维向量在输入生成器之后,能够生成接近所述低清人脸图像的高清人脸图像。
本发明实施例的解码器训练方法,在解码器对低清人脸图像进行解码后,形成与之对应的人脸图像特征的高维向量,生成器根据该高维向量生成高清人脸图像,并根据生成的高清人脸图像确定损失函数以训练解码器,从而使得生成人脸图像特征无限接近低清人脸图像,本申请实施例通过深度学习方法训练解码器,使得解码器解码得到的高维向量在经过生成器生成后能得到与指定低清人脸图像对应的高清人脸图像。本实施例高清人脸图像生成方法和装置,采用本申请方法训练得到的解码器对低清人脸图像进行解码,形成对应的高维向量,使得生成器能够根据高维向量直接生成与低清人脸图像对应的高清人脸图像,避免了现有技术在低清图片高清化的过程基于对低分辨率图像进行填充而增加许多猜测的新细节的缺点,通过本申请高清人脸图像生成方法能够更真实的还原人脸图像。
本申请实施例通过使用第二人脸图像调整损失函数,使得最后输出的第二人脸图像和第一人脸图像特征接近,从而训练解码器输入更符合要求的高维向量以输入生成器最终生成与低清人脸的关联的高清人脸图像。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的解码器训练方法的一具体实施例的流程图;
图2本发明的人脸图像生成方法的一具体实施例的流程图;
图3为本发明的解码器训练装置的一具体实施例的结构框图;
图4为本发明的人脸图像生成装置的一具体实施例的结构框图;
图5为本实施例计算机设备基本结构框图。
具体实施方案
以下结合附图和具体实施例对本申请作详细描述,以便更清楚理解本申请的目的、特点和优点。应理解的是,以下结合附图和具体实施例描述的诸方面仅是示例性的,而不应被理解为对本申请的保护范围进行任何限制。除非上下文明确地另外指明,否则单数形式“一”和“所述”包括复数指代物。如本申请中所使用的,用语“第一” 和“第二”可互换使用,以将一个或一类构件分别与另一个或另一类区分开,且不旨在表示独立构件的位置或重要性。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
为了使本技术领域的人员更好地理解本申请方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。
第一方面,本发明实施例提出一种解码器训练方法,图1为本发明的解码器训练方法的一具体实施例的流程图,该方法包括以下步骤:
步骤110,获取第一人脸图像作为训练图像,所述第一人脸图像为分辨率小于第一预设值的低清人脸图像;
在本步骤中,获取一个分辨率较低的人脸图像作为训练图像,例如分辨率为128*128的人脸图像。该人脸图像可以由图像采集装置采集得到,例如,可以是摄像头采集的人脸图像。在环境不可控的情况下,所采集的人脸图像可能因为各种原因导致清晰度不够,当需要获得该清晰度不够的人脸的高清图像时,可以将该清晰度不够的人脸图像作为本申请的第一人脸图像。
步骤120,所述解码器对所述第一人脸图像进行解码,形成对应所述第一人脸图像特征的高维向量,所述高维向量维度高于第二预设值;
在本步骤中,解码器对输入的该低清人脸图像即第一人脸图像进行解码,得到与该低清人脸图像特征对应的高维向量,解码器输出的该高维向量在下一个步骤中将作为生成器的输入。例如,第一人脸图像为分辨率为128*128的人脸图像,在本步骤中,解码器对该人脸图像进行解码,输出的是高维向量,例如512*1的向量。此处高维向量具体的第二预设值可以根据实际需要确定。
生成器输入input是高维向量(1维)比如512*1(就是解码器的output)输出output是高清图片(2维)比如1024*1024
步骤130,生成器根据所述高维向量生成第二人脸图像,所述第二人脸图像为分辨率高于第三预设值的高清人脸图像;
步骤120中解码器输出的例如512*1的高维向量作为生成器的输入,在本步骤中,生成器根据该高维向量生成清晰度较高的第二人脸图像,该第二人脸图像的清晰度比第一人脸图像的清晰度高,其具体分辨率第三预设值可以具体设定。
在本步骤中,可以是,生成器根据512*1的高维向量,生成分辨率为1024*1024的高清人脸图像。在一些实施例中,也可以在将该生成器生产的人脸图像输入对抗网络。因为生成对抗机制不是本发明的核心,在此不做赘述。
步骤140,根据所述第二人脸图像确定损失函数的值,根据所述损失函数的值对所述解码器参数进行调整;
在本申请中,训练解码器的目的是根据输入的低清人脸图像生成与之对应的高清人脸图像。因此可以根据生成的高清人脸图像即第二人脸图像和目标人脸图像之间的相似度作为损失函数值,对解码器参数进行调整。
具体的目标人脸图像可以是步骤110中获取的低清的第一人脸图像,也可是其他的与第一人脸图像具有相同或高相似度的人脸图像。
步骤150,在所述损失函数值满足预设条件时,获得训练好的所述解码器。
当生成的第二人脸图像和目标人脸图像之间的相似度达到预设的程度,则可以认为损失函数值满足预设条件,获得训练好的所述解码器。在所述损失函数值不满足预设条件时,继续输入训练图像以重复执行上述训练过程。其中,损失函数值满足预设条件为损失函数值小于预设数值。该损失函数由生成的人脸图像和目标图像的特征距离确定。
本申请实施例通过使用第二人脸图像调整损失函数,使得最后输出的第二人脸图像和第一人脸图像特征接近,从而训练解码器输入更符合要求的高维向量以输入生成器最终生成与低清人脸的关联的高清人脸图像。
进一步的,以输入的低清人脸图像,即第一人脸图像作为目标图像,损失函数值则根据所述第一人脸图像特征与所述第二人脸图像特征的距离确定。具体的,所述第一人脸图像特征与所述第二人脸图像特征的距离为L2距离,或者cos距离;所述损失函数值满足预设条件L2距离,或者cos距离;小于预设数值。具体的,可以将第一人脸图像和第二人脸图像分别输入人脸识别器,获取各自的特征值,计算两者的特征距离。可以理解的是,特征距离小于预设值,即,相似度高于预设值。
进一步的,所述获取第一人脸图像可以包括:
获取第三人脸图像,所述第三人脸图像分辨率高于所述第一人脸图像的分辨率;对所述第三人脸图像进行下采样,得到所述第一人脸图像。
其中,以原始的高清人脸图像,即第三人脸图像作为目标图像,此时,所述损失函数根据所述第三人脸图像特征与所述第二人脸图像特征的距离确定。具体的,所述第三人脸图像特征与所述第二人脸图像特征的距离为L2距离,或者cos距离;所述损失函数值满足预设条件为L2距离或者cos距离小于预设数值。
通过对已有的高清人脸图像进行下采样得到低清人脸图像,由解码器对该经高清人脸图像下采样得到的低清人脸图像进行处理,进而经生成器生成高清人脸图像,这样在计算损失时,可以通过比对生成器生成的高清人脸图像和原始的高清人脸图像对比进行比对,通过这两者之间的相似度来确定损失,以及调节解码器参数。由于比对的图像是原始高清图像,因此能够进一步提高训练的速度,以及提高训练结果的精度。
第二方面,本发明实施例提出一种高清人脸图像生成方法,图2为本发明的高清人脸图像生成方法的一具体实施例的流程图,该方法包括以下步骤:
步骤210,获取待处理低清人脸图像;
具体步骤可以参见图1对应的实施例的步骤110,获取分辨率低的低清人脸,如128*128的低清人脸。
步骤220,将所述待处理低清人脸图像输入至如上述第一方面所述训练好的解码器,所述解码器输出与所述待处理低清人脸图像特征对应的高维向量;
在本步骤中,将128*128的低清人脸图像输入到训练得到的解码器进行解码,解码器输出与该低清人脸特征对应的512*1的高维向量,作为后续生成器的输入。
步骤230,生成器根据所述解码器输出的高维向量生成高清人脸图像。
生成器将解码器输出的512*1的高维向量作为输入,生成例如1024*1024的高清人脸图像。
本实施例例如训练过的解码器对输入的低清人脸图像进行解码,获取低清人脸图像特征的高维向量,根据该高维向量生成高清人脸图像,从而能够根据输入的人脸形成与之对应的高清晰人脸。采用本申请方法训练得到的解码器对低清人脸图像进行解码,形成对应的高维向量,使得生成器能够根据高维向量直接生成与低清人脸图像对应的高清人脸图像,避免了现有技术在低清图片高清化的过程基于对低分辨率图像进行填充而增加许多猜测的新细节的缺点,通过本申请高清人脸图像生成方法能够更真实的还原人脸图像。
第三方面,本发明实施例提出一种解码器训练装置,图3为本发明的解码器训练装置的一具体实施例的结构示意图,该装置包括:
输入层301,用于输入训练图像,所述训练图像为分辨率小于第一预设值第一人脸图像;
解码器302,用于对所述训练图像进行解码得到对应所述训练图像特征的高维向量,所述高维向量维度高于第二预设值;
输出层303,用于输出所述训练结果,所述训练结果为所述训练图像特征的高维向量;
生成器304,用于接收所述输出层输出的训练结果,形成第二人脸图像,所述第二人脸图像为分辨率高于第三预设值的高清人脸图像;
损失函数值确定模块305,用于确定损失函数的值;
调整模块306,用于根据所述损失函数的值对所述解码器参数进行调整,以及在所述损失函数值满足预设条件时,获得训练好的所述解码器。
在一些实施例中,所述损失函数值确定模块根据所述第一人脸图像特征与所述第二人脸图像特征的距离确定所述损失函数值。
在一些实施例中,该训练装置还包括:
第三人脸图像获取模块,用于获取第三人脸图像,所述第三人脸图像分辨率高于所述第一人脸图像的分辨率;
下采样模块,用于对所述第三人脸图像进行下采样,得到所述第一人脸图像。
其中,所述损失函数值确定模块根据所述第三人脸图像特征与所述第二人脸图像特征的距离确定所述损失函数值。
在一些实施例中,还包括人脸识别模块,所述人脸识别模块用于获取所述第一人脸图像特征、所述第二人脸图像特征或所述第三人脸图像特征。其中,所述人脸识别模块为light_cnn网络,或facenet网络。
在一些实施例中,还可以在生成器之后包括对抗器,具体可以根据现有技术的生成对抗进行设置,本申请不做赘述。
本申请实施例使用第二人脸图像确定和调整损失函数,使得最后输出的第二人脸图像和第一人脸图像特征接近,从而训练解码器输入更符合要求的高维向量以输入生成器最终生成与低清人脸的关联的高清人脸图像。在解码器训练装置中,其具体模块的执行内容可以参照图1对应的训练方式步骤进行,并实现同样的技术效果。
第四方面,本发明实施例提出一种高清人脸图像生成装置,图4为本发明的一具体实施例的结构示意图,该装置包括:
低清人脸图像获取模块401,用于获取待处理低清人脸图像;
解码器402,为根据上述第三方面的装置训练得到的解码器;
生成器403,用于根据所述解码器输出的高维向量生成高清人脸图像。
具体的高清人脸图像生成装置可以参照图2对应的高清人脸图像生成式步骤进行,并实现同样的技术效果。
第五方面,本申请实施例还提供一种计算机设备,所述计算机设备可以为神经网络服务器,具体请参阅图5,图5为本实施例计算机设备基本结构框图。
所述计算机设备5包括通过系统总线相互通信连接存储器51、处理器52、网络接口53。需要指出的是,图中仅示出了具有组件51-53的计算机设备5,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的所述计算机设备5是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable GateArray,FPGA)、数字处理器 (Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备5可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备5可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器51至少包括一种类型的可读存储介质,存储器可以存储可执行指令控制器、微控制器、微处理器、或其他数据处理芯片,至少包括一种类型的可读存储介质。所述可读存储介质包括非易失性存储器(non-volatile memory)或易失性存储器,例如,闪存(flash memory)、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(random access memory,RAM)、只读存储器(read-only memory,ROM)、可擦写可编程只读存储器(erasable programmable read-only memory,EPROM)、电可擦写可编程只读存储器(electrically erasable programmable read-only memory,EEPROM)、可编程只读存储器(programmable read-only memory,PROM)、磁性存储器、磁盘、光盘等,所述RAM可以包括静态RAM或动态RAM。在一些实施例中,所述存储器51可以是所述计算机设备5的内部存储单元,例如,该所述计算机设备5的硬盘或内存。在另一些实施例中,所述存储器51也可以是所述计算机设备5的外部存储设备,例如该所述计算机设备5上配备的插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)等。当然,所述存储器51还可以既包括所述计算机设备5的内部存储单元也包括其外部存储设备。本实施例中,所述存储器51通常用于存储安装于所述计算机设备5的操作系统和各类应用软件,例如用于执行人脸图像生成方法或解码器训练方法的程序代码等。此外,所述存储器51还可以用于暂时地存储已经输出或者将要输出的各类数据。
在本申请实施例中,该处理器52可以是中央处理单元(Central ProcessingUnit, CPU)、或者是图像处理器(Graphic Processing Unit,GPU)。该处理器52还可以是其他通用处理器、数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器,例如单片机等。
该处理器52通常用于控制所述计算机设备5的总体操作。本实施例中,所述存储器51用于存储程序代码或指令,所述程序代码包括计算机操作指令,所述处理器52用于执行所述存储器51存储的程序代码或指令或者处理数据,例如执行人脸图像生成方法或解码器训练方法的程序代码。
本文描述的总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外设部件互连标准(Peripheral Component Interconnect,PCI)总线或扩展工业标准结构(Extended Industry Standard Architecture,EISA)总线等。该总线系统可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
第六方面,本发明实施例还提供一种芯片,用于执行上述第一方面中的方法。具体地,该芯片包括:处理器,用于从存储器中调用并运行计算机程序,使得安装有该芯片的设备用于执行上述人脸图像生成方法或解码器训练的方法。
此外,在第七方面,本发明实施例还提供一种计算机可读存储介质,计算机可读介质可以是计算机可读信号介质或者计算机可读介质。计算机中的处理器读取存储在计算机可读介质中的计算机可读程序代码,使得处理器能够执行在流程图1对应的人脸中每个步骤、或各步骤的组合中规定的功能动作;生成实施在框图的每一块、或各块的组合中规定的功能动作的装置。
计算机可读介质包含但不限于电子、磁性、光学、电磁、红外的存储器或半导体系统、设备或者装置,或者前述的任意适当组合,所述存储器用于存储程序代码或指令,所述程序代码包括计算机操作指令,所述处理器用于执行所述存储器存储的程序代码或指令。
所述存储器和所述处理器的定义,可以参考前述计算机设备实施例的描述,在此不再赘述。所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上第一方面的任一项所述的方法。
第八方面,本发明实施例还提供一种计算机程序产品,包括计算机程序指令,该计算机程序指令使得计算机执行上述第一方面中的方法
本领域技术人员可以明白的是,结合本文中所公开的实施例描述的各示例的单元及算法步骤能够以电子硬件、或者软件和电子硬件的结合来实现。这些功能是以硬件还是软件方式来实现,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以针对每个特定的应用,使用不同的方式来实现所描述的功能,但是这种实现并不应认为超出本申请的范围。
在本申请实施例中,所公开的系统、装置和方法可以通过其它方式来实现。例如,单元的划分仅仅为一种逻辑功能划分,在实际实现时还可以有另外的划分方式。例如,多个单元或组件可以进行组合或者可以集成到另一个系统中。另外,各个单元之间的耦合可以是直接耦合或间接耦合。另外,在本申请实施例中的各功能单元可以集成在一个处理单元中,也可以是单独的物理存在等等。
应理解,在本申请的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请的实施例的实施过程构成任何限定。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在机器可读存储介质中。因此,本申请的技术方案可以以软件产品的形式来体现,该软件产品可以存储在机器可读存储介质中,其可以包括若干指令用以使得电子设备执行本申请实施例所描述的技术方案的全部或部分过程。上述存储介质可以包括ROM、RAM、可移动盘、硬盘、磁盘或者光盘等各种可以存储程序代码的介质。
以上内容仅为本申请的具体实施方式,本申请的保护范围并不局限于此。本领域技术人员在本申请所公开的技术范围内可以进行变化或替换,这些变化或替换都应当在本申请的保护范围之内。
Claims (10)
1.一种解码器训练方法,其特征在于,所述方法包括:
获取第一人脸图像作为训练图像,所述第一人脸图像为分辨率小于第一预设值的低清人脸图像;
所述解码器对所述第一人脸图像进行解码,形成对应所述第一人脸图像特征的高维向量,所述高维向量维度高于第二预设值;
生成器根据所述高维向量生成第二人脸图像,所述第二人脸图像为分辨率高于第三预设值的高清人脸图像;
根据所述第二人脸图像确定损失函数的值,根据所述损失函数的值对所述解码器参数进行调整;
在所述损失函数值满足预设条件时,获得训练好的所述解码器。
2.根据权利要求1所述的方法,其特征在于,所述损失函数根据所述第一人脸图像特征与所述第二人脸图像特征的距离确定。
3.根据权利要求2所述的方法,其特征在于,
所述第一人脸图像特征与所述第二人脸图像特征的距离为L2距离,或者cos距离;
所述损失函数值满足预设条件为损失函数值小于预设数值。
4.根据权利要求1所述的方法,其特征在于,所述获取第一人脸图像包括:
获取第三人脸图像,所述第三人脸图像分辨率高于所述第一人脸图像的分辨率;
对所述第三人脸图像进行下采样,得到所述第一人脸图像。
5.一种高清人脸图像生成方法,其特征在于,包括:
获取待处理低清人脸图像;
将所述待处理低清人脸图像输入至如权利要求1-4中任一项所述训练好的解码器,所述解码器输出与所述待处理低清人脸图像特征对应的高维向量;
生成器根据所述解码器输出的高维向量生成高清人脸图像。
6.一种解码器训练装置,其特征在于,包括:
输入层,用于输入训练图像,所述训练图像为分辨率小于第一预设值第一人脸图像;
解码器,用于对所述训练图像进行解码得到对应所述训练图像特征的高维向量,所述高维向量维度高于第二预设值;
输出层,用于输出所述训练结果,所述训练结果为所述训练图像特征的高维向量;
生成器,用于接收所述输出层输出的训练结果,形成第二人脸图像,所述第二人脸图像为分辨率高于第三预设值的高清人脸图像;
损失函数值确定模块,用于确定损失函数的值;
调整模块,用于根据所述损失函数的值对所述解码器参数进行调整,以及在所述损失函数值满足预设条件时,获得训练好的所述解码器。
7.一种高清人脸图像生成装置,其特征在于,包括:
低清人脸图像获取模块,用于获取待处理低清人脸图像;
解码器,为根据权利要求7的装置训练得到的解码器;
生成器,用于根据所述解码器输出的高维向量生成高清人脸图像。
8.一种计算机设备,其特征在于,包括:至少一个处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;与所述至少一个处理器耦合的存储器,所述存储器存储有可执行指令,其中,所述可执行指令在被所述至少一个处理器执行时使得实现根据权利要求1至4中任一项或权利要求5所述的方法。
9.一种芯片,其特征在于,包括:处理器,用于从存储器中调用并运行计算机程序,使得安装有所述芯片的设备执行:如权利要求1至4中任一项或权利要求5所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上权利要求1至4中任一项或权利要求5所述的方法的步骤。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SG10202005064VA SG10202005064VA (en) | 2020-05-29 | 2020-05-29 | A decoder training method, a high-resolution face image generation method, a device and a computer device |
SG10202005064V | 2020-05-29 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111754401A true CN111754401A (zh) | 2020-10-09 |
Family
ID=72674566
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010492926.2A Pending CN111754401A (zh) | 2020-05-29 | 2020-06-03 | 解码器训练方法、高清人脸图像生成方法、装置及计算机设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111754401A (zh) |
SG (1) | SG10202005064VA (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114022598A (zh) * | 2021-11-09 | 2022-02-08 | 北京百度网讯科技有限公司 | 图像处理方法、模型训练方法、装置、电子设备及介质 |
CN115063876A (zh) * | 2022-08-17 | 2022-09-16 | 季华实验室 | 一种图像识别率提升方法、装置、电子设备和存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109447906A (zh) * | 2018-11-08 | 2019-03-08 | 北京印刷学院 | 一种基于生成对抗网络的图片合成方法 |
CN109685097A (zh) * | 2018-11-08 | 2019-04-26 | 银河水滴科技(北京)有限公司 | 一种基于gan的图像检测方法及装置 |
US20190171936A1 (en) * | 2017-10-26 | 2019-06-06 | Nvidia Corporation | Progressive Modification of Neural Networks |
CN109902767A (zh) * | 2019-04-11 | 2019-06-18 | 网易(杭州)网络有限公司 | 模型训练方法、图像处理方法及装置、设备和介质 |
CN110148085A (zh) * | 2019-04-22 | 2019-08-20 | 智慧眼科技股份有限公司 | 人脸图像超分辨率重建方法及计算机可读取的存储介质 |
CN110290387A (zh) * | 2019-05-17 | 2019-09-27 | 北京大学 | 一种基于生成模型的图像压缩方法 |
US20190304063A1 (en) * | 2018-03-29 | 2019-10-03 | Mitsubishi Electric Research Laboratories, Inc. | System and Method for Learning-Based Image Super-Resolution |
CN110868598A (zh) * | 2019-10-17 | 2020-03-06 | 上海交通大学 | 基于对抗生成网络的视频内容替换方法及系统 |
-
2020
- 2020-05-29 SG SG10202005064VA patent/SG10202005064VA/en unknown
- 2020-06-03 CN CN202010492926.2A patent/CN111754401A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190171936A1 (en) * | 2017-10-26 | 2019-06-06 | Nvidia Corporation | Progressive Modification of Neural Networks |
US20190304063A1 (en) * | 2018-03-29 | 2019-10-03 | Mitsubishi Electric Research Laboratories, Inc. | System and Method for Learning-Based Image Super-Resolution |
CN109447906A (zh) * | 2018-11-08 | 2019-03-08 | 北京印刷学院 | 一种基于生成对抗网络的图片合成方法 |
CN109685097A (zh) * | 2018-11-08 | 2019-04-26 | 银河水滴科技(北京)有限公司 | 一种基于gan的图像检测方法及装置 |
CN109902767A (zh) * | 2019-04-11 | 2019-06-18 | 网易(杭州)网络有限公司 | 模型训练方法、图像处理方法及装置、设备和介质 |
CN110148085A (zh) * | 2019-04-22 | 2019-08-20 | 智慧眼科技股份有限公司 | 人脸图像超分辨率重建方法及计算机可读取的存储介质 |
CN110290387A (zh) * | 2019-05-17 | 2019-09-27 | 北京大学 | 一种基于生成模型的图像压缩方法 |
CN110868598A (zh) * | 2019-10-17 | 2020-03-06 | 上海交通大学 | 基于对抗生成网络的视频内容替换方法及系统 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114022598A (zh) * | 2021-11-09 | 2022-02-08 | 北京百度网讯科技有限公司 | 图像处理方法、模型训练方法、装置、电子设备及介质 |
CN114022598B (zh) * | 2021-11-09 | 2024-02-20 | 北京百度网讯科技有限公司 | 图像处理方法、模型训练方法、装置、电子设备及介质 |
CN115063876A (zh) * | 2022-08-17 | 2022-09-16 | 季华实验室 | 一种图像识别率提升方法、装置、电子设备和存储介质 |
CN115063876B (zh) * | 2022-08-17 | 2022-11-18 | 季华实验室 | 一种图像识别率提升方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
SG10202005064VA (en) | 2021-12-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10614574B2 (en) | Generating image segmentation data using a multi-branch neural network | |
US11410364B2 (en) | Systems and methods for realistic head turns and face animation synthesis on mobile device | |
CN112396613B (zh) | 图像分割方法、装置、计算机设备及存储介质 | |
CN111386536A (zh) | 语义一致的图像样式转换 | |
CN110443863B (zh) | 文本生成图像的方法、电子设备和存储介质 | |
EP3912092A1 (en) | Systems and methods for realistic head turns and face animation synthesis on mobile device | |
US11915355B2 (en) | Realistic head turns and face animation synthesis on mobile device | |
WO2023273628A1 (zh) | 一种视频循环识别方法、装置、计算机设备及存储介质 | |
CN111754401A (zh) | 解码器训练方法、高清人脸图像生成方法、装置及计算机设备 | |
CN113837942A (zh) | 基于srgan的超分辨率图像生成方法、装置、设备及存储介质 | |
CN115631112B (zh) | 一种基于深度学习的建筑轮廓矫正方法及装置 | |
CN114863539A (zh) | 一种基于特征融合的人像关键点检测方法及系统 | |
CN113807361A (zh) | 神经网络、目标检测方法、神经网络训练方法及相关产品 | |
CN113435210A (zh) | 社交图片文本识别方法、装置、计算机设备及存储介质 | |
CN108520532B (zh) | 识别视频中物体运动方向的方法及装置 | |
US20220301348A1 (en) | Face reconstruction using a mesh convolution network | |
JP2024521645A (ja) | 時空間上のアテンションを使用したビデオシーケンスからの物体表現の教師なし学習 | |
CN115760888A (zh) | 图像处理方法、装置、计算机及可读存储介质 | |
CN113808151A (zh) | 直播图像的弱语义轮廓检测方法、装置、设备及存储介质 | |
CN116309274B (zh) | 图像中小目标检测方法、装置、计算机设备及存储介质 | |
CN114677611A (zh) | 数据识别方法、存储介质及设备 | |
CN113761961B (zh) | 一种二维码识别方法和装置 | |
CN114677442B (zh) | 一种基于序列预测的车道线检测系统、装置和方法 | |
CN117974833B (zh) | 图像生成方法、装置、设备、可读存储介质及程序产品 | |
CN111325210B (zh) | 用于输出信息的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |