CN108334904A - 一种基于统一生成对抗网络的多域图像转换技术 - Google Patents

一种基于统一生成对抗网络的多域图像转换技术 Download PDF

Info

Publication number
CN108334904A
CN108334904A CN201810120844.8A CN201810120844A CN108334904A CN 108334904 A CN108334904 A CN 108334904A CN 201810120844 A CN201810120844 A CN 201810120844A CN 108334904 A CN108334904 A CN 108334904A
Authority
CN
China
Prior art keywords
image
domain
label
aiming field
discriminator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201810120844.8A
Other languages
English (en)
Inventor
夏春秋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Vision Technology Co Ltd
Original Assignee
Shenzhen Vision Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Vision Technology Co Ltd filed Critical Shenzhen Vision Technology Co Ltd
Priority to CN201810120844.8A priority Critical patent/CN108334904A/zh
Publication of CN108334904A publication Critical patent/CN108334904A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明中提出的一种基于统一生成对抗网络的多域图像转换技术,其主要内容包括:训练鉴别器、原始域转换到目标域、目标域转换到原始域、蒙蔽鉴别器,其过程为,首先使用一个鉴别器D去学习鉴别真假图像,并把真实图像分类至与其相应的域里面;接着同时把图像和目标域标签作为生成器G的输入,产生一个假图像;再接着,在给定原始域标签的情况下,G尝试根据假图像来重建原始图像;然后D不断学习以区分真实图像和合成的图像,G不断学习以蒙蔽D;最后G试图生成与真图像无区别并且可以被D分类为目标域的图像。本发明使用一个模型来执行多域图像到图像的转换,提高了转换图像的质量,并具有将输入图像灵活转换成任何期望目标图像的能力。

Description

一种基于统一生成对抗网络的多域图像转换技术
技术领域
本发明涉及图像转换领域,尤其是涉及了一种基于统一生成对抗网络的多域图像转换技术。
背景技术
图像到图像转换是一门有效、快速地对图像进行处理和分析的技术,其将定义在原图像空间的图像以某种形式转换到另外的空间,利用空间的特有性质更方便地对图像进行一定的加工和处理,最后再转换回原图像空间以达到所需的效果。高速发展的电子设备使得图像转换的应用范围更加广泛。图像转换技术可以用于人类特征脸的识别与分类,首先提取出目标的脸部图像信息,然后将待识别的人脸投影到新的多维人脸空间,通过简单的分类手段可以完成对人脸的识别与分类。此技术可以用于众多的娱乐软件上,比如改变人脸情绪表情,可以将开心的表情转换成为生气、愤怒、哀伤等其他的表情。
目前,两个领域的图像转换技术取得显著的成功,但是,现有的方法用于处理两个以上的域时在伸缩性以及鲁棒性上存在很大的局限性。其原因在于,这些方法必须为每一对图像域建立不同的模型。另外,这些方法在多域图像转换的任务中效率不高且效果不佳。这是因为,为了学习K个域之间的所有映射关系,它们必须训练K(K-1)个生成器,所以它们效率不高;而且,每个生成器都不能充分利用整个训练数据,导致了生成图像的质量下降。此外,由于每个数据集已经是部分标注的,所以它们无法联合训练不同数据集的域。
本发明提出了一种基于统一生成对抗网络的多域图像转换技术,其过程为,首先使用一个鉴别器D去学习鉴别真假图像,并把真图像分类至其相应的域里面;接着同时把图像和目标域标签作为生成器G的输入,产生一个假图像;再接着在给定原始域标签的情况下,G尝试根据假图像来重建原始图像;然后D不断学习以区分真实图像和合成的图像,G不断学习以蒙蔽D;最后G试图生成与真图像无区别并且可以被D分类为目标域的图像。本发明使用一个模型来执行多域图像到图像的转换,提高了转换图像的质量,并具有将输入图像灵活转换成任何期望目标图像的能力。
发明内容
针对现有方法在处理两个以上的域时存在伸缩性以及鲁棒性方面的局限性,以及这些方法在多域图像转换的任务中效率不高且效果不佳的问题,本发明的目的在于提供一种基于统一生成对抗网络的多域图像转换技术,其过程为,首先使用一个鉴别器D去学习鉴别真假图像,并把真图像分类至其相应的域里面;接着同时把图像和目标域标签作为生成器G的输入,产生一个假图像;再接着在给定原始域标签的情况下,G尝试根据假图像来重建原始图像;然后D不断学习以区分真实图像和合成的图像,G不断学习以蒙蔽D;最后G试图生成与真图像无区别并且可以被D分类为目标域的图像。
为解决上述问题,本发明提供一种基于统一生成对抗网络的多域图像转换技术,其主要内容包括:
(一)训练鉴别器;
(二)原始域转换到目标域;
(三)目标域转换到原始域;
(四)蒙蔽鉴别器。
其中,所述的训练鉴别器,鉴别器可以产生在输入源和目标域标签之间的概率密度,即:D:x→{Dsrc(x),Dcls(x)};为了能够从真实的图像当中鉴别出生成的图像,采用如下的对抗损失函数:
其中,G生成基于输入图像x和目标域标签c的一个图像G(x,c),D用来区分真假图像;生成器G尝试最小化对抗损失函数,而鉴别器D尝试将对抗损失函数进行最大化。
其中,所述的原始域转换到目标域,其目的在于训练一个生成器G,使其学习在不同的域之间的映射;
为此,在目标域标签c条件下,训练G从输入图像x到输出图像y之间的转换,即:G(x,c)→y;通过随机产生目标域标签c,让G可以灵活地对输入图像进行转换;利用一个辅助的分类器,使得单一的鉴别器可以控制多个域。
其中,所述的目标域转换到原始域,把一个循环一致性损失函数应用到生成器中,即:
其中,转换图像G(x,c)以及原始的域标签c′作为G的输入,尝试重建原始的图像x;使用L1范数作为重建损失函数;两次使用了单一生成器,第一次是把原始图像转换到目标域,第二次是由转换得到的图像重建原始图像。
进一步地,所述的重建损失函数,通过最小化对抗损失和分类损失,训练生成器G用于产生按照正确目标域分类的真实图像;对损失函数进行最小化的过程中,并不能保证转换得到的图像仅仅改变了输入图像中与域相关的部分,而保留输入图像其他的所有内容。
进一步地,所述的分类损失,对于给定的一个输入图像x和一个目标域标签c,网络的目的在于将x转换成为输出图像y,而y恰好属于目标域c中的一类;为了达到这一条件,在鉴别器D上面添加一个辅助的分类器,并且当同时优化D和G时,迫使域分类受损;也就是说,将目标函数分为两项:一项是用于优化D的真实图像的域分类损失,另一项是用于优化G的假图像的域分类损失;具体来讲,真实图像的域分类损失定义如下:
其中,Dcls(c′|x)表示由D计算所得的域标签的概率密度;通过对上述目标函数进行最小化,D学习将真实图像x分类到与之相对应的原始域c′;输入图像与域标签数据对(x,c′)由训练数据给出;
另一方面,假图像的域分类损失定义如下:
其中,G对上述目标函数进行最小化,目的在于生成可以根据目标域c进行分类的图像。
其中,所述的蒙蔽识别器,把用于优化G和D的目标函数分别写成:
其中,λcls和λrec是超参数,分别用来调整域分类损失和重建损失相比于对抗损失的重要程度;
由于从不同数据库学习的过程存在着一个问题,即每一个数据库都仅仅具有标签的一部分信息;因为在利用转换得到的图像G(x,c)重建输入图像x时,需要获取标签c′的完整信息,因此网络引入一个掩码矢量和训练策略。
进一步地,所述的掩码矢量,掩码矢量m允许统一生成对抗网络忽略来自于特定数据集的未知标签以及已知标签;在统一生成对抗网络中,使用一个n维独热码矢量来表征掩码矢量m,其中n代表数据库的数目;
另外,标签的统一格式定义如下:
其中,ci表示第i个数据库的标签矢量;明确已知的标签矢量可以使用二进制矢量来表示二值属性或者使用独热码矢量来表示类别属性;剩下的n-1个未知的标签赋值为0。
进一步地,所述的训练策略,使用改进的生成对抗网络,当使用多个数据库训练统一生成对抗网络时,利用公式(7)定义的域标签作为生成器的输入;因此,生成器可以忽略未知的标签,即其值为0,而仅使用已知的标签;
另一方面,拓展鉴别器的辅助分类器,用于生成所有数据库的标签的概率密度;然后,在多任务学习的设置下对模型进行训练,其中鉴别器尝试对仅与已知的标签相关的分类误差进行最小化。
进一步地,所述的改进的生成对抗网络,为了稳固训练过程以及生成更高质量的图像,把公式(1)更换成为带有梯度惩罚项的沃瑟斯坦对抗网络目标函数,即:
其中,是沿着一条直线对一对真实的图像和生成的图像的均匀采样;
统一生成对抗网络的网络架构包括两个以2为下采样步长的卷积层、六个残值区块和两个变换的以2为上采样步长的卷积层。
附图说明
图1是本发明一种基于统一生成对抗网络的多域图像转换技术的系统结构图。
图2是本发明一种基于统一生成对抗网络的多域图像转换技术的单一生成器学习多域映射的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互结合,下面结合附图和具体实施例对本发明作进一步详细说明。
图1是本发明一种基于统一生成对抗网络的多域图像转换技术的系统结构图。主要包括训练鉴别器、原始域转换到目标域、目标域转换到原始域、蒙蔽鉴别器。
其中,所述的训练鉴别器,可以产生在输入源和目标域标签之间的概率密度,即:D:x→{Dsrc(x),Dcls(x)};为了能够从真实的图像当中鉴别出生成的图像,采用如下的对抗损失函数:
其中,G生成基于输入图像x和目标域标签c的一个图像G(x,c),D用来区分真假图像;生成器G尝试最小化对抗损失函数,而鉴别器D尝试将对抗损失函数进行最大化。
其中,所述的目标域转换到原始域,把一个循环一致性损失函数应用到生成器中,即:
其中,转换图像G(x,c)以及原始的域标签c′作为G的输入,尝试重建原始的图像x;使用L1范数作为重建损失函数;两次使用了单一生成器,第一次是把原始图像转换到目标域,第二次是由转换得到的图像重建原始图像。
进一步地,所述的重建损失函数,通过最小化对抗损失和分类损失,训练生成器G用于产生按照正确目标域分类的真实图像;对损失函数进行最小化的过程中,并不能保证转换得到的图像仅仅改变了输入图像中与域相关的部分,而保留输入图像其他的所有内容。
进一步地,所述的分类损失,对于给定的一个输入图像x和一个目标域标签c,网络的目的在于将x转换成为输出图像y,而y恰好属于目标域c中的一类;为了达到这一条件,在鉴别器D上面添加一个辅助的分类器,并且当同时优化D和G时,迫使域分类受损;也就是说,将目标函数分为两项:一项是用于优化D的真实图像的域分类损失,另一项是用于优化G的假图像的域分类损失;具体来讲,真实图像的域分类损失定义如下:
其中,Dcls(c′|x)表示由D计算所得的域标签的概率密度;通过对上述目标函数进行最小化,D学习将真实图像x分类到与之相对应的原始域c′;输入图像与域标签数据对(x,c′)由训练数据给出;
另一方面,假图像的域分类损失定义如下:
其中,G对上述目标函数进行最小化,目的在于生成可以根据目标域c进行分类的图像。
其中,所述的蒙蔽识别器,把用于优化G和D的目标函数分别写成:
其中,λcls和λrec是超参数,分别用来调整域分类损失和重建损失相比于对抗损失的重要程度;
由于从不同数据库学习的过程存在着一个问题,即每一个数据库都仅仅具有标签的一部分信息;因为在利用转换得到的图像G(x,c)重建输入图像x时,需要获取标签c′的完整信息,因此网络引入一个掩码矢量和训练策略。
进一步地,所述的掩码矢量,掩码矢量m允许统一生成对抗网络忽略来自于特定数据集的未知标签以及已知标签;在统一生成对抗网络中,使用一个n维独热码矢量来表征掩码矢量m,其中n代表数据库的数目;
另外,标签的统一格式定义如下:
其中,ci表示第i个数据库的标签矢量;明确已知的标签矢量可以使用二进制矢量来表示二值属性或者使用独热码矢量来表示类别属性;剩下的n-1个未知的标签赋值为0。
进一步地,所述的训练策略,使用改进的生成对抗网络,当使用多个数据库训练统一生成对抗网络时,利用公式(7)定义的域标签作为生成器的输入;因此,生成器可以忽略未知的标签,即其值为0,而仅使用已知的标签;
另一方面,拓展鉴别器的辅助分类器,用于生成所有数据库的标签的概率密度;然后,在多任务学习的设置下对模型进行训练,其中鉴别器尝试对仅与已知的标签相关的分类误差进行最小化。
进一步地,所述的改进的生成对抗网络,为了稳固训练过程以及生成更高质量的图像,把公式(1)更换成为带有梯度惩罚项的沃瑟斯坦对抗网络目标函数,即:
其中,是沿着一条直线对一对真实的图像和生成的图像的均匀采样;
统一生成对抗网络的网络架构包括两个以2为下采样步长的卷积层、六个残值区块和两个变换的以2为上采样步长的卷积层。
图2是本发明一种基于统一生成对抗网络的多域图像转换技术的单一生成器学习多域映射的示意图。在目标域标签c条件下,训练G从输入图像x到输出图像y之间的转换,即:G(x,c)→y;通过随机产生目标域标签c,让G可以灵活地对输入图像进行转换;利用一个辅助的分类器,使得单一的鉴别器可以控制多个域。
对于本领域技术人员,本发明不限制于上述实施例的细节,在不背离本发明的精神和范围的情况下,能够以其他具体形式实现本发明。此外,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围,这些改进和变型也应视为本发明的保护范围。因此,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

Claims (10)

1.一种基于统一生成对抗网络的多域图像转换技术,其特征在于,主要包括训练鉴别器(一);原始域转换到目标域(二);目标域转换到原始域(三);蒙蔽鉴别器(四)。
2.基于权利要求书1所述的训练鉴别器(一),其特征在于,鉴别器可以产生在输入源和目标域标签之间的概率密度,即:D:x→{Dsrc(x),Dcls(x)};为了能够从真实的图像当中鉴别出生成的图像,采用如下的对抗损失函数:
其中,G生成基于输入图像x和目标域标签c的一个图像G(x,c),D用来区分真假图像;生成器G尝试最小化对抗损失函数,而鉴别器D尝试将对抗损失函数进行最大化。
3.基于权利要求书1所述的原始域转换到目标域(二),其特征在于,其目的在于训练一个生成器G,使其学习在不同的域之间的映射;
为此,在目标域标签c条件下,训练G从输入图像x到输出图像y之间的转换,即:G(x,c)→y;通过随机产生目标域标签c,让G可以灵活地对输入图像进行转换;利用一个辅助的分类器,使得单一的鉴别器可以控制多个域。
4.基于权利要求书1所述的目标域转换到原始域(三),其特征在于,把一个循环一致性损失函数应用到生成器中,即:
其中,转换图像G(x,c)以及原始的域标签c′作为G的输入,尝试重建原始的图像x;使用L1范数作为重建损失函数;两次使用了单一生成器,第一次是把原始图像转换到目标域,第二次是由转换得到的图像重建原始图像。
5.基于权利要求书4所述的重建损失函数,其特征在于,通过最小化对抗损失和分类损失,训练生成器G用于产生按照正确目标域分类的真实图像;对损失函数进行最小化的过程中,并不能保证转换得到的图像仅仅改变了输入图像中与域相关的部分,而保留输入图像其他的所有内容。
6.基于权利要求书5所述的分类损失,其特征在于,对于给定的一个输入图像x和一个目标域标签c,网络的目的在于将x转换成为输出图像y,而y恰好属于目标域c中的一类;为了达到这一条件,在鉴别器D上面添加一个辅助的分类器,并且当同时优化D和G时,迫使域分类受损;也就是说,将目标函数分为两项:一项是用于优化D的真实图像的域分类损失,另一项是用于优化G的假图像的域分类损失;具体来讲,真实图像的域分类损失定义如下:
其中,Dcls(c′|x)表示由D计算所得的域标签的概率密度;通过对上述目标函数进行最小化,D学习将真实图像x分类到与之相对应的原始域c′;输入图像与域标签数据对(x,c′)由训练数据给出;
另一方面,假图像的域分类损失定义如下:
其中,G对上述目标函数进行最小化,目的在于生成可以根据目标域c进行分类的图像。
7.基于权利要求书1所述的蒙蔽识别器(四),其特征在于,把用于优化G和D的目标函数分别写成:
其中,λcls和λrec是超参数,分别用来调整域分类损失和重建损失相比于对抗损失的重要程度;
由于从不同数据库学习的过程存在着一个问题,即每一个数据库都仅仅具有标签的一部分信息;因为在利用转换得到的图像G(x,c)重建输入图像x时,需要获取标签c′的完整信息,因此网络引入一个掩码矢量和训练策略。
8.基于权利要求书7所述的掩码矢量,其特征在于,掩码矢量m允许统一生成对抗网络忽略来自于特定数据集的未知标签以及已知标签;在统一生成对抗网络中,使用一个n维独热码矢量来表征掩码矢量m,其中n代表数据库的数目;
另外,标签的统一格式定义如下:
其中,ci表示第i个数据库的标签矢量;明确已知的标签矢量可以使用二进制矢量来表示二值属性或者使用独热码矢量来表示类别属性;剩下的n-1个未知的标签赋值为0。
9.基于权利要求书7所述的训练策略,其特征在于,使用改进的生成对抗网络,当使用多个数据库训练统一生成对抗网络时,利用公式(7)定义的域标签作为生成器的输入;因此,生成器可以忽略未知的标签,即其值为0,而仅使用已知的标签;
另一方面,拓展鉴别器的辅助分类器,用于生成所有数据库的标签的概率密度;然后,在多任务学习的设置下对模型进行训练,其中鉴别器尝试对仅与已知的标签相关的分类误差进行最小化。
10.基于权利要求书9所述的改进的生成对抗网络,其特征在于,为了稳固训练过程以及生成更高质量的图像,把公式(1)更换成为带有梯度惩罚项的沃瑟斯坦对抗网络目标函数,即:
其中,是沿着一条直线对一对真实的图像和生成的图像的均匀采样;
统一生成对抗网络的网络架构包括两个以2为下采样步长的卷积层、六个残值区块和两个变换的以2为上采样步长的卷积层。
CN201810120844.8A 2018-02-07 2018-02-07 一种基于统一生成对抗网络的多域图像转换技术 Withdrawn CN108334904A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810120844.8A CN108334904A (zh) 2018-02-07 2018-02-07 一种基于统一生成对抗网络的多域图像转换技术

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810120844.8A CN108334904A (zh) 2018-02-07 2018-02-07 一种基于统一生成对抗网络的多域图像转换技术

Publications (1)

Publication Number Publication Date
CN108334904A true CN108334904A (zh) 2018-07-27

Family

ID=62928380

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810120844.8A Withdrawn CN108334904A (zh) 2018-02-07 2018-02-07 一种基于统一生成对抗网络的多域图像转换技术

Country Status (1)

Country Link
CN (1) CN108334904A (zh)

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109064430A (zh) * 2018-08-07 2018-12-21 中国人民解放军陆军炮兵防空兵学院 一种针对航拍区域含云图的除云方法和系统
CN109190620A (zh) * 2018-09-03 2019-01-11 苏州科达科技股份有限公司 车牌样本生成方法、系统、设备及存储介质
CN109637634A (zh) * 2018-12-11 2019-04-16 厦门大学 一种基于生成对抗网络的医学图像合成方法
CN109671018A (zh) * 2018-12-12 2019-04-23 华东交通大学 一种基于生成式对抗网络和ResNets技术的图像转换方法及系统
CN109726654A (zh) * 2018-12-19 2019-05-07 河海大学 一种基于生成对抗网络的步态识别方法
CN109753992A (zh) * 2018-12-10 2019-05-14 南京师范大学 基于条件生成对抗网络的无监督域适应图像分类方法
CN109815893A (zh) * 2019-01-23 2019-05-28 中山大学 基于循环生成对抗网络的彩色人脸图像光照域归一化的方法
CN110084863A (zh) * 2019-04-25 2019-08-02 中山大学 一种基于生成对抗网络的多域图像转换方法与系统
CN110147830A (zh) * 2019-05-07 2019-08-20 东软集团股份有限公司 训练影像数据生成网络的方法、影像数据分类方法及装置
CN110276399A (zh) * 2019-06-24 2019-09-24 厦门美图之家科技有限公司 图像转换网络训练方法、装置、计算机设备及存储介质
CN110544239A (zh) * 2019-08-19 2019-12-06 中山大学 基于条件生成对抗网络的多模态mri转换方法、系统及介质
CN110675316A (zh) * 2019-08-29 2020-01-10 中山大学 基于条件生成对抗网络的多域图像转换方法、系统及介质
CN110689561A (zh) * 2019-09-18 2020-01-14 中山大学 基于模块化gan的多模态mri与多模态ct的转换方法、系统及介质
CN111028305A (zh) * 2019-10-18 2020-04-17 平安科技(深圳)有限公司 表情生成方法、装置、设备及存储介质
CN111161239A (zh) * 2019-12-27 2020-05-15 上海联影智能医疗科技有限公司 医学图像分析方法、装置、存储介质及计算机设备
CN111291780A (zh) * 2018-12-07 2020-06-16 深圳光启空间技术有限公司 一种跨域网络训练及图像识别方法
CN111325661A (zh) * 2020-02-21 2020-06-23 京工数演(福州)科技有限公司 一种名为msgan的图像的季节风格转换模型及方法
CN111508588A (zh) * 2019-01-30 2020-08-07 富士通株式会社 训练装置、训练方法和计算机可读记录介质
CN111612861A (zh) * 2019-02-22 2020-09-01 清华大学 一种图像合成方法及装置
CN111862258A (zh) * 2020-07-23 2020-10-30 深圳高性能医疗器械国家研究院有限公司 一种图像金属伪影抑制方法
CN112001398A (zh) * 2020-08-26 2020-11-27 科大讯飞股份有限公司 域适应方法、装置、设备、图像处理方法及存储介质
CN112561864A (zh) * 2020-12-04 2021-03-26 深圳格瑞健康管理有限公司 龋齿图像分类模型的训练方法、系统和存储介质
CN112784930A (zh) * 2021-03-17 2021-05-11 西安电子科技大学 基于cacgan的hrrp识别数据库样本扩充方法
CN113239977A (zh) * 2021-04-22 2021-08-10 武汉大学 多域图像转换模型的训练方法、装置、设备及存储介质
US11158059B1 (en) 2020-04-02 2021-10-26 International Business Machines Corporation Image reconstruction based on edge loss
CN113627538A (zh) * 2021-08-12 2021-11-09 群联电子股份有限公司 训练非对称生成对抗网络产生图像的方法及电子装置
CN115239943A (zh) * 2022-09-23 2022-10-25 杭州医策科技有限公司 图像矫正模型的训练方法及切片图像的色彩矫正方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107123151A (zh) * 2017-04-28 2017-09-01 深圳市唯特视科技有限公司 一种基于变分自动编码器和生成对抗网络的图像转化方法
CN107239766A (zh) * 2017-06-08 2017-10-10 深圳市唯特视科技有限公司 一种利用对抗网络和三维形态模型的大幅度人脸摆正方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107123151A (zh) * 2017-04-28 2017-09-01 深圳市唯特视科技有限公司 一种基于变分自动编码器和生成对抗网络的图像转化方法
CN107239766A (zh) * 2017-06-08 2017-10-10 深圳市唯特视科技有限公司 一种利用对抗网络和三维形态模型的大幅度人脸摆正方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
YUNJEY CHOI ET.AL: "StarGAN: Unified Generative Adversarial Networks for Multi-Domain Image-to-Image Translation", 《ARXIV:1711.09020V1 [CS.CV]》 *

Cited By (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109064430A (zh) * 2018-08-07 2018-12-21 中国人民解放军陆军炮兵防空兵学院 一种针对航拍区域含云图的除云方法和系统
CN109064430B (zh) * 2018-08-07 2020-10-09 中国人民解放军陆军炮兵防空兵学院 一种针对航拍区域含云图的除云方法和系统
CN109190620A (zh) * 2018-09-03 2019-01-11 苏州科达科技股份有限公司 车牌样本生成方法、系统、设备及存储介质
CN111291780A (zh) * 2018-12-07 2020-06-16 深圳光启空间技术有限公司 一种跨域网络训练及图像识别方法
CN109753992B (zh) * 2018-12-10 2020-09-01 南京师范大学 基于条件生成对抗网络的无监督域适应图像分类方法
CN109753992A (zh) * 2018-12-10 2019-05-14 南京师范大学 基于条件生成对抗网络的无监督域适应图像分类方法
CN109637634A (zh) * 2018-12-11 2019-04-16 厦门大学 一种基于生成对抗网络的医学图像合成方法
CN109637634B (zh) * 2018-12-11 2020-10-02 厦门大学 一种基于生成对抗网络的医学图像合成方法
CN109671018A (zh) * 2018-12-12 2019-04-23 华东交通大学 一种基于生成式对抗网络和ResNets技术的图像转换方法及系统
CN109726654A (zh) * 2018-12-19 2019-05-07 河海大学 一种基于生成对抗网络的步态识别方法
CN109815893B (zh) * 2019-01-23 2021-03-26 中山大学 基于循环生成对抗网络的彩色人脸图像光照域归一化的方法
CN109815893A (zh) * 2019-01-23 2019-05-28 中山大学 基于循环生成对抗网络的彩色人脸图像光照域归一化的方法
CN111508588B (zh) * 2019-01-30 2024-03-15 富士通株式会社 训练装置、训练方法和计算机可读记录介质
CN111508588A (zh) * 2019-01-30 2020-08-07 富士通株式会社 训练装置、训练方法和计算机可读记录介质
CN111612861B (zh) * 2019-02-22 2023-04-07 清华大学 一种图像合成方法及装置
CN111612861A (zh) * 2019-02-22 2020-09-01 清华大学 一种图像合成方法及装置
CN110084863B (zh) * 2019-04-25 2020-12-25 中山大学 一种基于生成对抗网络的多域图像转换方法与系统
CN110084863A (zh) * 2019-04-25 2019-08-02 中山大学 一种基于生成对抗网络的多域图像转换方法与系统
CN110147830A (zh) * 2019-05-07 2019-08-20 东软集团股份有限公司 训练影像数据生成网络的方法、影像数据分类方法及装置
CN110276399B (zh) * 2019-06-24 2021-06-04 厦门美图之家科技有限公司 图像转换网络训练方法、装置、计算机设备及存储介质
CN110276399A (zh) * 2019-06-24 2019-09-24 厦门美图之家科技有限公司 图像转换网络训练方法、装置、计算机设备及存储介质
CN110544239A (zh) * 2019-08-19 2019-12-06 中山大学 基于条件生成对抗网络的多模态mri转换方法、系统及介质
CN110544239B (zh) * 2019-08-19 2021-12-17 中山大学 基于条件生成对抗网络的多模态mri转换方法、系统及介质
CN110675316B (zh) * 2019-08-29 2021-07-09 中山大学 基于条件生成对抗网络的多域图像转换方法、系统及介质
CN110675316A (zh) * 2019-08-29 2020-01-10 中山大学 基于条件生成对抗网络的多域图像转换方法、系统及介质
CN110689561A (zh) * 2019-09-18 2020-01-14 中山大学 基于模块化gan的多模态mri与多模态ct的转换方法、系统及介质
WO2021073417A1 (zh) * 2019-10-18 2021-04-22 平安科技(深圳)有限公司 表情生成方法、装置、设备及存储介质
CN111028305A (zh) * 2019-10-18 2020-04-17 平安科技(深圳)有限公司 表情生成方法、装置、设备及存储介质
CN111161239B (zh) * 2019-12-27 2024-02-27 上海联影智能医疗科技有限公司 医学图像分析方法、装置、存储介质及计算机设备
CN111161239A (zh) * 2019-12-27 2020-05-15 上海联影智能医疗科技有限公司 医学图像分析方法、装置、存储介质及计算机设备
CN111325661B (zh) * 2020-02-21 2024-04-09 京工慧创(福州)科技有限公司 一种名为msgan的图像的季节风格转换模型及方法
CN111325661A (zh) * 2020-02-21 2020-06-23 京工数演(福州)科技有限公司 一种名为msgan的图像的季节风格转换模型及方法
US11158059B1 (en) 2020-04-02 2021-10-26 International Business Machines Corporation Image reconstruction based on edge loss
CN111862258A (zh) * 2020-07-23 2020-10-30 深圳高性能医疗器械国家研究院有限公司 一种图像金属伪影抑制方法
CN112001398A (zh) * 2020-08-26 2020-11-27 科大讯飞股份有限公司 域适应方法、装置、设备、图像处理方法及存储介质
CN112001398B (zh) * 2020-08-26 2024-04-12 科大讯飞股份有限公司 域适应方法、装置、设备、图像处理方法及存储介质
CN112561864A (zh) * 2020-12-04 2021-03-26 深圳格瑞健康管理有限公司 龋齿图像分类模型的训练方法、系统和存储介质
CN112561864B (zh) * 2020-12-04 2024-03-29 深圳格瑞健康科技有限公司 龋齿图像分类模型的训练方法、系统和存储介质
CN112784930B (zh) * 2021-03-17 2022-03-04 西安电子科技大学 基于cacgan的hrrp识别数据库样本扩充方法
CN112784930A (zh) * 2021-03-17 2021-05-11 西安电子科技大学 基于cacgan的hrrp识别数据库样本扩充方法
CN113239977A (zh) * 2021-04-22 2021-08-10 武汉大学 多域图像转换模型的训练方法、装置、设备及存储介质
CN113627538A (zh) * 2021-08-12 2021-11-09 群联电子股份有限公司 训练非对称生成对抗网络产生图像的方法及电子装置
CN113627538B (zh) * 2021-08-12 2024-03-01 群联电子股份有限公司 训练非对称生成对抗网络产生图像的方法及电子装置
CN115239943A (zh) * 2022-09-23 2022-10-25 杭州医策科技有限公司 图像矫正模型的训练方法及切片图像的色彩矫正方法

Similar Documents

Publication Publication Date Title
CN108334904A (zh) 一种基于统一生成对抗网络的多域图像转换技术
Chen et al. Cross-position activity recognition with stratified transfer learning
CN110570920B (zh) 一种基于集中注意力模型的实体、关系联合学习方法
CN110135427A (zh) 用于识别图像中的字符的方法、装置、设备和介质
CN109308450A (zh) 一种基于生成对抗网络的脸部变化预测方法
CN111310668B (zh) 一种基于骨架信息的步态识别方法
CN111832468A (zh) 基于生物识别的手势识别方法、装置、计算机设备及介质
CN107491729B (zh) 基于余弦相似度激活的卷积神经网络的手写数字识别方法
CN111126464A (zh) 一种基于无监督域对抗领域适应的图像分类方法
Alhussan et al. Facial Expression Recognition Model Depending on Optimized Support Vector Machine.
Uparkar et al. Vision transformer outperforms deep convolutional neural network-based model in classifying X-ray images
Yang et al. Discriminative semi-supervised dictionary learning with entropy regularization for pattern classification
CN116932722A (zh) 一种基于跨模态数据融合的医学视觉问答方法及系统
CN115995015A (zh) 基于残差卷积与多头自注意力的cxr图像分类方法及系统
Shao et al. A hierarchical model for human action recognition from body-parts
Lonij et al. Open-world visual recognition using knowledge graphs
CN114359656A (zh) 一种基于自监督对比学习的黑色素瘤图像识别方法和存储设备
CN114093507A (zh) 边缘计算网络中基于对比学习的皮肤病智能分类方法
CN110275928A (zh) 迭代式实体关系抽取方法
JP4245872B2 (ja) 類似度判定方法および装置並びにプログラム
CN114170659A (zh) 一种基于注意力机制的面部情感识别方法
CN110889276B (zh) 复数融合特征提取指针式抽取三元组信息的方法、系统及计算机介质
CN107273478A (zh) 一种基于Group Lasso的半监督哈希图像搜索方法
KR102145858B1 (ko) 문서 이미지로부터 인식된 용어를 표준화하기 위한 방법
CN116468043A (zh) 嵌套实体识别方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20180727