CN111833239B - 图像的翻译方法和装置、图像翻译模型的训练方法和装置 - Google Patents
图像的翻译方法和装置、图像翻译模型的训练方法和装置 Download PDFInfo
- Publication number
- CN111833239B CN111833239B CN202010484916.4A CN202010484916A CN111833239B CN 111833239 B CN111833239 B CN 111833239B CN 202010484916 A CN202010484916 A CN 202010484916A CN 111833239 B CN111833239 B CN 111833239B
- Authority
- CN
- China
- Prior art keywords
- image
- domain
- images
- translation
- translated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013519 translation Methods 0.000 title claims abstract description 295
- 238000000034 method Methods 0.000 title claims abstract description 103
- 238000012549 training Methods 0.000 title claims abstract description 66
- 238000012545 processing Methods 0.000 claims abstract description 100
- 239000013598 vector Substances 0.000 claims description 45
- 238000005070 sampling Methods 0.000 claims description 28
- 230000004927 fusion Effects 0.000 claims description 23
- 230000015654 memory Effects 0.000 claims description 19
- 238000012937 correction Methods 0.000 claims description 9
- 230000000694 effects Effects 0.000 abstract description 14
- 238000013135 deep learning Methods 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 22
- 238000010586 diagram Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 13
- 230000009467 reduction Effects 0.000 description 6
- 241000220225 Malus Species 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 210000004709 eyebrow Anatomy 0.000 description 4
- 235000021016 apples Nutrition 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 235000014443 Pyrus communis Nutrition 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/80—Geometric correction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/18—Image warping, e.g. rearranging pixels individually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/149—Segmentation; Edge detection involving deformable models, e.g. active contour models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
- G06T2207/30201—Face
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Processing (AREA)
- Editing Of Facsimile Originals (AREA)
- Image Analysis (AREA)
- Geometry (AREA)
Abstract
本申请公开了图像的翻译方法和装置、图像翻译模型的训练方法和装置,涉及深度学习和图像处理领域。具体实现方案为:获取图像翻译请求,其中,翻译请求中包括原图像;对原图像进行下采样,以生成与原图像对应的缩小图像;根据缩小图像,生成原图像对应的预翻译图像、掩膜图像及与原图像中的每个像素点对应的变形参数,其中,预翻译图像及掩膜图像的尺寸与原图像的尺寸相同;根据变形参数将原图像进行变形处理,以生成变形图像;以及将变形图像、预翻译图像及掩膜图像进行融合,以生成目标翻译图像。由此,在降低图像翻译的运算量的同时,还能够保证图像翻译的效果,并提高翻译出的目标翻译图像的清晰度。
Description
技术领域
本申请涉及图像处理技术领域,具体涉及深度学习和图像处理技术领域,尤其涉及图像的翻译方法和装置、图像翻译模型的训练方法和装置。
背景技术
图像翻译网络能够在不改变图像内容的前提下,将一种类型的图像直接转换为另一种类型的图像,在图像生成、场景分割、图像风格化等领域有着广泛的应用。然而,在对图像进行翻译的过程中,其运算量较大。
相关技术中,一般是通过不断裁剪翻译模型的结构或者直接缩小输入的图像的分辨率等方式来降低图像翻译的运算量。但是,通过上述方式对图像进行翻译时,会导致翻译出的图像的清晰度较低,并且也大大降低了图像翻译的效果。
发明内容
提供了一种图像的翻译方法和装置、图像翻译模型的训练方法和装置、电子设备以及存储介质。
根据第一方面,提供了一种图像的翻译方法,包括:获取图像翻译请求,其中,所述翻译请求中包括原图像;对所述原图像进行下采样,以生成与所述原图像对应的缩小图像;根据所述缩小图像,生成所述原图像对应的预翻译图像、掩膜图像及与所述原图像中的每个像素点对应的变形参数,其中,所述预翻译图像及所述掩膜图像的尺寸与所述原图像的尺寸相同;根据所述变形参数将所述原图像进行变形处理,以生成变形图像;以及将所述变形图像、所述预翻译图像及所述掩膜图像进行融合,以生成目标翻译图像。
根据第二方面,提供了一种图像翻译模型的训练方法,包括:获取训练样本集,其中,所述训练样本集中包括属于第一域的第一图像集、及属于第二域的第二图像集;将所述第一图像集中的图像分别进行下采样,以生成第一缩小图像集;利用第一初始生成器,对所述第一缩小图像集中的图像分别进行处理,以生成第一预翻译图像集、第一掩膜图像集及第一变形参数集,其中,所述第一变形参数集中的每个参数分别与所述第一图像集中的图像中的每个像素点对应;根据所述第一变形参数集,将所述第一图像集中的图像分别进行变形处理,以获取第一变形图像集;将所述第一变形图像集、所述第一预翻译图像集及所述第一掩膜图像集中的对应图像分别进行融合,以获取第三图像集;将所述第三图像集中的图像及所述第二图像集中的图像,分别输入至第一初始判别器,以获取所述第一初始判别器输出的所述第三图像集中的图像分别属于真实图像的第一概率集、及所述第二图像集中的图像分别属于真实图像的第二概率集;以及根据所述第一概率集及所述第二概率集,对所述第一初始生成器及所述第一初始判别器进行修正,以生成属于第一域的目标生成器,其中,所述属于第一域的目标生成器用于将位于第一域的图像翻译成位于第二域的图像。
根据第三方面,提供了一种图像的翻译装置,包括:第一获取模块,用于获取图像翻译请求,其中,所述翻译请求中包括原图像;第一采样模块,用于对所述原图像进行下采样,以生成与所述原图像对应的缩小图像;第一生成模块,用于根据所述缩小图像,生成所述原图像对应的预翻译图像、掩膜图像及与所述原图像中的每个像素点对应的变形参数,其中,所述预翻译图像及所述掩膜图像的尺寸与所述原图像的尺寸相同;第一处理模块,用于根据所述变形参数将所述原图像进行变形处理,以获取变形图像;以及第一融合模块,用于将所述变形图像、所述预翻译图像及所述掩膜图像进行融合,以生成目标翻译图像。
根据第四方面,提供了一种图像翻译模型的训练装置,包括:第二获取模块,用于获取训练样本集,其中,所述训练样本集中包括属于第一域的第一图像集、及属于第二域的第二图像集;第二采样模块,用于将所述第一图像集中的图像分别进行下采样,以生成第一缩小图像集;第二处理模块,用于利用第一初始生成器,对所述第一缩小图像集中的图像分别进行处理,以生成第一预翻译图像集、第一掩膜图像集及第一变形参数集,其中,所述第一变形参数集中的每个参数分别与所述第一图像集中的图像中的每个像素点对应;第三处理模块,用于根据所述第一变形参数集,将所述第一图像集中的图像分别进行变形处理,以获取第一变形图像集;第二融合模块,将所述第一变形图像集、所述第一预翻译图像集及所述第一掩膜图像集中的对应图像分别进行融合,以获取第三图像集;第三获取模块,用于将所述第三图像集中的图像及所述第二图像集中的图像,分别输入至第一初始判别器,以获取所述第一初始判别器输出的所述第三图像集中的图像分别属于真实图像的第一概率集、及所述第二图像集中的图像分别属于真实图像的第二概率集;以及第一修正模块,用于根据所述第一概率集及所述第二概率集,对所述第一初始生成器及所述第一初始判别器进行修正,以生成属于第一域的目标生成器,其中,所述属于第一域的目标生成器用于将位于第一域的图像翻译成位于第二域的图像。
根据第五方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的图像的翻译方法或者图像翻译模型的训练方法。
根据第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如上所述的图像的翻译方法或者图像翻译模型的训练方法。
根据本申请的技术,解决了通过不断裁剪翻译模型的结构或者直接缩小输入的图像的分辨率等方式来降低图像翻译的运算量时,会导致翻译出的图像的清晰度较低,并且也大大降低了图像翻译的效果的技术问题,在降低图像翻译的运算量的同时,还能够保证图像翻译的效果,并提高翻译出的目标翻译图像的清晰度。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1为本申请实施例提供的一种图像的翻译方法的流程示意图;
图2为本申请实施例提供的另一种图像的翻译方法的流程示意图;
图3为本申请实施例提供的又一种图像的翻译方法的流程示意图;
图4为本申请实施例提供的一种图像的翻译装置的结构示意图;
图5为本申请实施例提供的另一种图像的翻译装置的结构示意图;
图6为本申请实施例提供的又一种图像的翻译装置的结构示意图;
图7为本申请实施例提供的一种图像翻译模型的训练方法的流程示意图;
图8为本申请实施例提供的另一种图像翻译模型的训练方法的流程示意图;
图9为本申请实施例提供的一种图像翻译模型的训练装置的结构示意图;
图10为本申请实施例提供的另一种图像翻译模型的训练装置的结构示意图;
图11为本申请实施例提供的又一种图像翻译模型的训练装置的结构示意图;
图12为用来实现本申请实施例的图像的翻译方法或者图像翻译模型的训练方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
下面参考附图描述本申请实施例的图像的翻译方法和装置、图像翻译模型的训练方法和装置以及电子设备和存储介质。
本申请针对相关技术中,通过不断裁剪翻译模型的结构或者直接缩小输入的图像的分辨率等方式来降低图像翻译的运算量时,会导致翻译出的图像的清晰度较低,并且也大大降低了图像翻译的效果的问题,提出一种图像的翻译方法。
本申请提供的图像的翻译方法,首先获取图像翻译请求,其次对图像翻译请求中的原图像进行下采样,以生成与原图像对应的缩小图像,进而根据缩小图像,生成原图像对应的预翻译图像、掩膜图像及与原图像中的每个像素点对应的变形参数,并使得预翻译图像及掩膜图像的尺寸与原图像的尺寸相同,然后根据变形参数将原图像进行变形处理,以生成变形图像,最后将变形图像、预翻译图像及掩膜图像进行融合,以生成目标翻译图像。由此,将原图像进行缩小处理后作为输入,以降低图像翻译的运算量,同时,输出与原图像尺寸相同的目标翻译图像,并在生成的目标翻译图像中,包含由原图像变形生成的变形图像,从而确保在降低图像翻译的运算量的同时,还能够保证图像翻译的效果,并且目标翻译图像充分利用了原始图像输入的高清和丰富的高频细节信息,大大提高了生成的目标翻译图像的清晰度。
图1为本申请实施例提供的一种图像的翻译方法的流程示意图。
需要说明的是,本申请实施例的图像的翻译方法的执行主体为图像的翻译装置,图像的翻译装置可以被配置在电子设备中,以实现在根据变形参数将原图像进行变形处理,以获取变形图像后,再将变形图像、预翻译图像及掩膜图像进行融合,以生成目标翻译图像。其中,电子设备可以是任意能够进行数据处理的终端设备或服务器等,本申请对此不作限制。
如图1所示,图像的翻译方法,可以包括以下步骤:
步骤101,获取图像翻译请求,其中,翻译请求中可包括原图像。
在实际应用中,在不同的场景中可通过不同的实施方式获取图像翻译请求。作为一种可能的实现方式,用户可通过输入框输入图像翻译请求指令。
作为另一种可能的实现方式,当获取到用户对图像翻译程序的触发操作时,认为获取到图像翻译请求,例如,用户点击触控显示屏上的开始进行图像翻译的按钮时,认为获取到图像翻译请求。
作为又一种可能的实现方式,可以预先在图像翻译程序的消息控制类之中设置有钩子函数,从而根据该钩子函数检测图像翻译请求消息。具体地,在用户发送图像翻译请求时,会发送触发消息,此时,消息控制类函数被调用,因此,设置在消息控制类函数的钩子函数可以检测到该消息控制类函数的调用,并根据当前触发消息控制类函数的消息类型可以识别出图像翻译请求消息。
步骤102,对原图像进行下采样,以生成与原图像对应的缩小图像。
其中,对原图像进行下采样(又称降采样),指的是缩小原图像,其目的是使得图像符合显示区域的大小,或者生成对应的缩小图像。举例而言,若一幅图像的尺寸为M*N,在对该图像进行s倍下采样后,可得到尺寸为(M/s)*(N/s)的缩小图像。
也就是说,在从翻译请求中获取到原图像后,对原图像进行缩小,以生成缩小图像,并将缩小图像作为输入,从而大大降低了运算量。举例而言,在男女人脸性别转换的应用场景中,若原图像为男性脸的图像(256*256分辨率),在对原图像进行2倍下采样后,可得到128*128分辨率的缩小图像,此时,特征图的尺寸就会降低为原特征图的尺寸的一半,对应的,理论运算量也将降低为原运算量的0.25倍。
步骤103,根据缩小图像,生成原图像对应的预翻译图像、掩膜图像及与原图像中的每个像素点对应的变形参数。其中,预翻译图像及掩膜图像的尺寸与原图像的尺寸相同。
具体而言,在缩小图像输入后,可对缩小图像进行反卷积操作,以将缩小图像的尺寸放大至原图像的尺寸,然后再对放大后的图像进行处理,以生成与原图像对应的预翻译图像,同时获取掩膜图像及与原图像中的每个像素点对应的变形参数。
其中,变形参数中包括每个像素点对应的x轴方向的平移量及y轴方向的平移量;掩膜图像为一种图像滤镜处理的模板,其中,掩膜图像的主要作用为:用掩模对图像上某些区域作屏蔽,使其不参加处理或不参加处理参数的计算;或者,用相似性变量或图像匹配方法检测和提取图像中与掩模相似的结构特征。
举例而言,仍以男女人脸性别转换为例,若原图像为男性脸的图像(256*256分辨率),对应的缩小图像的分辨率为128*128,首先对缩小图像进行反卷积操作,以将缩小图像的分辨率提高至256*256,并得到分辨率为256*256的图像,然后再将该分辨率为256*256的图像中的男性脸直接转换为女性脸,以生成未融合的女性化脸,即与原图像对应的预翻译图像,同时获取对应的掩膜图像和变形参数,其中,预翻译图像的分辨率为256*256,掩膜图像的分辨率也为256*256,变形参数为256*256组,每组变形参数中包括x轴方向参数及y轴方向参数。
步骤104,根据变形参数将原图像进行变形处理,以获取变形图像。
其中,可通过图像变换工具根据变形参数对原图像进行相应的改变,以生成变形图像。
举例而言,当原图像为原始男性脸的图像,若变形参数中,用于指示男性眉毛区域的变形方式为沿y轴方向变窄,则通过图像变换工具根据变形参数,对原图像进行变形后,获得的变形图像中原始男性脸的眉毛会变窄,从而使其更加接近女性眉毛特征。
步骤105,将变形图像、预翻译图像及掩膜图像进行融合,以生成目标翻译图像。
具体而言,在实际操作过程中,如果仅是通过直接缩小输入的图像的分辨率来降低图像翻译的运算量,那么其输出的图像的分辨率将于输入的图像的分辨率相同,因此,翻译出的图像的清晰度较低,并且也大大降低了图像翻译的效果。
因此,本申请中是先将原图像进行缩小处理后作为输入,以降低图像翻译的运算量,其次再对缩小图像进行处理以生成与原图像的尺寸相同的预翻译图像,同时生成对应的掩膜图像和变形参数,然后根据变形参数将原图像进行变形处理,以获取变形图像,最后将变形图像和预翻译图像按照掩膜图像中的权重进行融合操作以生成目标翻译图像。由此,在降低图像翻译的运算量的同时,还能保证输出的目标翻译图像的尺寸与原图像的尺寸相同,并在生成的目标翻译图像中,包含由原图像变形生成的变形图像,从而使得目标翻译图像充分利用了原始图像输入的高清和丰富的高频细节信息,大大提高了生成的目标翻译图像的清晰度,而且生成的目标翻译图像的背景部分也和原始图片一致,能够实现图像的无缝融合,大大提高了生成的目标翻译图像的自然度。
需要说明的是,在上述实施例中,可通过目标生成器对缩小图像进行处理,以生成原图像对应的预翻译图像、掩膜图像及与原图像中的每个像素点对应的变形参数。其中,在不同的应用场景中,目标生成器的获取方式也是不同的。
作为一种可能的实现方式,可先获取目标翻译图像所属的第一域,以根据目标翻译图像所属的第一域获取目标生成器。对应的,在本申请的一个实施例中,翻译请求中还包括目标翻译图像所属的第一域,因此,在上述步骤101之后,还包括:
根据目标翻译图像所属的第一域,获取目标生成器。
相应的,上述步骤103可包括:
利用目标生成器,对缩小图像进行处理,以生成原图像对应的预翻译图像、掩膜图像及与原图像中的每个像素点对应的变形参数。
其中,在图像翻译领域,利用不同的域来区分原图像与目标翻译图像的区别。举例来说,进行性别翻译时,男性人脸图像和女性人脸图像分别为位于不同域的图像,或者,将图像中的苹果翻译成橘子时,包含苹果的图像和包含橘子的图像分别属于不同的域。
相应的,在本申请中目标翻译图像所属的第一域,为包含某一种指定对象的图像,比如女性人脸的图像,或者,包含苹果的图像等。
具体而言,在对不同的域中的图像进行翻译时,使用的生成器也不同,因此本公开在接收到翻译请求,并从翻译请求中获取到目标翻译图像所属的第一域后,可根据目标翻译图像所属的第一域确定与目标翻译图像所属的第一域对应的生成器。如果与目标翻译图像所属的第一域对应的生成器仅有一种,那么可根据目标翻译图像所属的第一域直接确定出对应的目标生成器。
举例而言,当目标翻译图像所属的第一域为女性人脸时,可确定出与该目标翻译图像对应的生成器仅有男性脸变女性脸的生成器,因此,可确定出目标生成器为男性脸变女性脸的生成器;当目标翻译图像所属的第一域为小孩脸时,可确定出该目标翻译图像对应的生成器仅有老人脸变小孩脸的生成器,因此,可确定出目标生成器为老人脸变小孩脸的生成器。
进一步地,在确定出目标生成器后,可通过目标生成器直接对缩小图像进行处理,以生成原图像对应的预翻译图像、掩膜图像及与原图像中的每个像素点对应的变形参数。
由此,在对缩小图像进行处理之前,能够根据目标翻译图像所属的第一域确定出专属的目标生成器对缩小图像进行相应的处理,从而大大提高了图像处理的效率和准确度。
需要说明的是,在实际操作过程中,也存在与目标翻译图像所属的第一域对应的生成器为多种的情况。
对应地,如果与目标翻译图像所属的第一域对应的生成器有N种,N为大于1的整数,则在上述步骤101之后,还包括:
对原图像进行识别,以确定原图像所属的第二域;以及根据原图像所属的第二域及目标翻译图像所属的第一域,从N种生成器中选取目标生成器。
具体而言,在根据目标翻译图像所属的第一域确定出与目标翻译图像所属的第一域对应的生成器有多种时,可对原图像进行识别,以获取原图像所属的第二域,然后根据目标翻译图像所属的第一域和原图像所属的第二域,从多种生成器中选取出一种生成器以作为目标生成器。
举例而言,当目标翻译图像所属的第一域为包含苹果的图像时,根据该目标翻译图像所属的第一域,可确定出与目标翻译图像所属的第一域对应的生成器有橘子变苹果生成器、鸭梨变苹果生成器、桃子变苹果生成器等多种生成器。此时,如果确定出原图像所属的第二域为包含橘子的图像,则可从上述多个生成器中选取出橘子变苹果生成器作为目标生成器。
进一步地,在确定出目标生成器后,可通过目标生成器直接对缩小图像进行相应的处理,以生成与原图像对应的预翻译图像、掩膜图像及变形参数。
由此,在根据目标翻译图像所属的第一域确定出与其对应的生成器为多种时,进一步根据原图像所属的第二域从多种生成器中选取出唯一的一种生成器作为目标生成器,以对缩小图像进行相应的处理,从而进一步提高了图像处理的效率和准确度。
作为另一种可能的实现方式,还可先获取原图像所属的第二域,以根据原图像所属的第二域获取目标生成器。对应的,在本申请的另一个实施例中,在上述步骤101之后,还包括:
对原图像进行识别,以确定原图像所属的第二域;以及根据原图像所属的第二域,获取目标生成器。
相应的,上述步骤103可包括:
利用目标生成器,对缩小图像进行处理,以生成原图像对应的预翻译图像、掩膜图像及与原图像中的每个像素点对应的变形参数。
具体而言,在获取到原图像后,可对原图像进行识别,以获取原图像所属的第二域。在确定出原图像所属的第二域后,可根据原图像所属的第二域确定与原图像所属的第二域对应的生成器。如果与原图像所属的第二域对应的生成器仅有一种,那么可根据原图像所属的第二域直接确定出对应的目标生成器。
举例而言,当确定出原图像所属的第二域为男性脸时,可确定出与原图像所属的第二域对应的生成器仅有男性脸变女性脸的生成器,因此,可确定出目标生成器为男性脸变女性脸的生成器;当确定出原图像所属的第二域为老人脸时,可确定出与原图像所属的第二域对应的生成器仅有老人脸变小孩脸的生成器,因此,可确定出目标生成器为老人脸变小孩脸的生成器。
进一步地,在确定出目标生成器后,可通过目标生成器直接对缩小图像进行相应的处理,以生成与原图像对应的预翻译图像、掩膜图像及变形参数。
由此,在对缩小图像进行处理之前,能够根据原图像所属的第二域确定出专属的目标生成器对缩小图像进行相应的处理,从而大大提高了图像处理的效率和准确度。
需要说明的是,在实际操作过程中,也存在与原图像所属的第二域对应的生成器为多种的情况。
对应地,如果与原图像所属的第二域对应的生成器有N种,N为大于1的整数,则在上述步骤101之后,还包括:
获取目标翻译图像所属的第一域;以及根据目标翻译图像所属的第一域及原图像所属的第二域,从N种生成器中选取目标生成器。
具体而言,在确定出与原图像所属的第二域对应的生成器有多种时,可获取目标翻译图像所属的第一域。其中,如果在翻译请求中包括目标翻译图像所属的第一域,则可直接从翻译请求中获取目标翻译图像所属的第一域;如果在翻译请求中未包括目标翻译图像所属的第一域,则在确定与原图像所属的第二域对应的生成器有多种时,可弹出目标翻译图像所属的第一域的选择项,以便于用户根据目标翻译图像的图像类型和特征信息进行选择。在确定出目标翻译图像所属的第一域后,可根据目标翻译图像所属的第一域和原图像所属的第二域,从多种生成器中选取出一种生成器以作为目标生成器。
举例而言,当原图像所属的第二域为橘子时,根据原图像所属的第二域,可确定出与原图像所属的第二域对应的生成器有橘子变苹果生成器、橘子变鸭梨生成器、橘子变桃子生成器等多种生成器。此时,如果获取到目标翻译图像所属的第一域为鸭梨,则可从上述多个生成器中选取出橘子变鸭梨生成器作为目标生成器。
进一步地,在确定出目标生成器后,可通过目标生成器直接对缩小图像进行相应的处理,以生成与原图像对应的预翻译图像、掩膜图像及变形参数。
由此,在根据原图像所属的第二域确定出与其对应的生成器为多种时,进一步根据目标翻译图像所属的第一域从多种生成器中选取出唯一的一种生成器作为目标生成器,以对缩小图像进行相应的处理,从而进一步提高了图像处理的效率和准确度。
需要说明的是,在对图像进行处理时,一般是提取出该图像中的特征信息,并通过对特征信息进行相应的处理,以实现对图像的处理。
下面结合图2进行说明,如图2所示,上述步骤103具体包括:
步骤201,对缩小图像进行处理,以确定缩小图像翻译至第一域时对应的第一特征向量。其中,第一域为目标翻译图像所属的域。
其中,第一特征向量为将缩小图像直接转换为目标翻译图像时需要改变的特征向量,该第一特征向量对应的尺寸与缩小图像的尺寸相同。
步骤202,对第一特征向量进行上采样,以生成第二特征向量。
具体而言,由于第一特征向量对应的尺寸与缩小图像的尺寸相同,因此,如果直接根据第一特征向量对缩小图像进行处理,那么得到的预翻译图像及掩膜图像的尺寸与缩小图像的尺寸相同,将导致最终生成目标翻译图像的分辨率较低。因此,需要对第一特征向量进行上采样,即提高第一特征向量对应的尺寸,以生成第二特征向量。
步骤203,根据第二特征向量,生成预翻译图像、掩膜图像及与原图像中的每个像素点对应的变形参数。
具体地,生成器在获取到第二特征向量后,可对第二特征向量进行解码,以根据第二特征向量重建目标对象在第二域中的图像,以生成预翻译图像,并在对目标对象进行重建的过程中,生成掩膜图像及变形参数。
可以理解的是,本公开中,将原图像进行翻译时,实际处理的图像尺寸为缩小后的图像,而仅在将特征向量解码为预翻译图像、掩膜图像及变形参数前,才进行了上采样处理,从而不仅保证了最终生成的预翻译图像、掩膜图像等与原图像尺寸相同,而且极大的减小了图像翻译过程中数据的处理量。
进一步而言,为了生成高清晰度和高自然度的目标翻译图像,在获取到预翻译图像、掩膜图像及变形参数后,还可根据变形参数将原图像进行变形处理,以获取变形图像,并将变形图像和预翻译图像按照掩膜图像中的权重进行融合操作以生成目标翻译图像。
下面结合图3来详细说明如何生成目标翻译图像,如图3所示,上述步骤104具体包括:
步骤301,根据掩膜图像中各像素点的像素值,确定预翻译图像的第一权重及变形图像的第二权重。
步骤302,根据第一权重及第二权重,将预翻译图像中各像素点的像素值与变形图像中各像素点的像素值进行融合,以生成目标翻译图像。
具体而言,可根据掩膜图像中各像素点的像素值,确定预翻译图像的第一权重及变形图像的第二权重,从而根据第一权重和第二权重的权重比,获取目标翻译图像的各像素点中,预翻译图像的像素值与变形图像中的像素值的比值,从而根据该比值将预翻译图像中各像素点的像素值与变形图像中各像素点的像素值进行融合。
在实际使用时,掩膜图像中像素点的像素值,可以是预翻译图像中同一像素点的权重,也可以是变形图像中同一像素点的权重。比如,若掩膜图像中第i个像素点的像素值为0.7,则可以确定预翻译图像中第i个像素点的权重为0.7(或0.3),相应的,变形图像中第i个像素点的权重为0.3(或0.7),若预翻译图像中第i个像素点的像素值为10,变形图像中第i个像素点的像素值为30,那么融合生成的目标翻译图像中第i个像素点的像素值为22或24。
由此,通过将变形图像和预翻译图像中的各像素点的像素值,分别按照掩膜图像的权重进行融合操作,从而使得融合生成的目标翻译图像中各个像素点的像素值即能满足翻译需求,又能够充分体现原始图像的高清和丰富的高频细节信息,从而不仅提高了生成的目标翻译图像的清晰度,而且生成的目标翻译图像的背景部分也和原始图片一致,能够实现图像的无缝融合,大大提高了生成的目标翻译图像的自然度。
需要说明的是,为了使上述实施例中的图像的翻译方法能够应用在电子设备中,并通过电子设备实现实时图像翻译的功能,在对原图像进行缩小以生成缩小图像时,还需要确定图像缩小的比例,以确保调整后的运算量满足电子设备的需求。
因此,在本申请的一个实施例中,在步骤S102之前,还包括:
获取当前所在电子设备的属性参数;根据电子设备的属性参数,确定下采样系数。对应的,步骤S102包括:
根据下采样系数,对原图像进行下采样,以生成与原图像对应的缩小图像。
其中,电子设备的属性参数可包括电子设备的CPU频率、核数等。
具体地,可先根据电子设备的属性参数确定电子设备所能承载的运算量,进而根据该运算量确定出下采样系数,然后根据下采样系数对原图像进行下采样,以生成与原图像对应的缩小图像。
举例而言,若原图像为男性脸的图像的分辨率为256*256,其对应的运算量为X,而根据电子设备的属性参数确定出电子设备所能承载的运算量为0.25X,那么可对原图像进行2倍下采样,以得到128*128分辨率的缩小图像。
由此,根据电子设备的属性参数确定图像缩小的比例,以确保调整后的运算量满足电子设备的需求,从而使得电子设备能够实现实时图像翻译的功能,并且能够保证图像翻译的效果,目标翻译图像的清晰度较高。
综上所述,本申请提供的图像的翻译方法,首先获取图像翻译请求,其次对图像翻译请求中的原图像进行下采样,以生成与原图像对应的缩小图像,进而根据缩小图像,生成原图像对应的预翻译图像、掩膜图像及与原图像中的每个像素点对应的变形参数,并使得预翻译图像及掩膜图像的尺寸与原图像的尺寸相同,然后根据变形参数将原图像进行变形处理,以生成变形图像,最后将变形图像、预翻译图像及掩膜图像进行融合,以生成目标翻译图像。由此,将原图像进行缩小处理后作为输入,以降低图像翻译的运算量,同时,输出与原图像尺寸相同的目标翻译图像,并在生成的目标翻译图像中,包含由原图像变形生成的变形图像,从而确保在降低图像翻译的运算量的同时,还能够保证图像翻译的效果,并且目标翻译图像充分利用了原始图像输入的高清和丰富的高频细节信息,大大提高了生成的目标翻译图像的清晰度。
为了实现上述实施例,本申请实施例还提出一种图像的翻译装置。该图像的翻译装置可设置在电子设备中。图4为本申请实施例提供的一种图像的翻译装置的结构示意图。
如图4所示,该图像的翻译装置400可包括第一获取模块410、第一采样模块420、第一生成模块430、第一处理模块440和第一融合模块450。
其中,第一获取模块410用于获取图像翻译请求,其中,翻译请求中包括原图像;第一采样模块420用于对原图像进行下采样,以生成与原图像对应的缩小图像;第一生成模块430用于根据缩小图像,生成原图像对应的预翻译图像、掩膜图像及与原图像中的每个像素点对应的变形参数,其中,预翻译图像及掩膜图像的尺寸与原图像的尺寸相同;第一处理模块440用于根据变形参数将原图像进行变形处理,以获取变形图像;以及第一融合模块450用于将变形图像、预翻译图像及掩膜图像进行融合,以生成目标翻译图像。
图5为本申请实施例提供的另一种图像的翻译装置的结构示意图。在本申请实施例一种可能的实现方式中,如图5所示,第一生成模块430包括第一处理单元431、第一采样单元432和第一生成单元433。
其中,第一处理单元431用于对缩小图像进行处理,以确定缩小图像翻译至第一域时对应的第一特征向量,其中,第一域为目标翻译图像所属的域;第一采样单元432用于对第一特征向量进行上采样,以生成第二特征向量;第一生成单元433用于根据第二特征向量,生成预翻译图像、掩膜图像及与原图像中的每个像素点对应的变形参数。
在本申请实施例一种可能的实现方式中,翻译请求中还包括目标翻译图像所属的第一域,第一获取模块410在获取图像翻译请求之后,还用于:根据目标翻译图像所属的第一域,获取目标生成器;第一生成模块430具体用于:利用目标生成器,对缩小图像进行处理,以生成原图像对应的预翻译图像、掩膜图像及与原图像中的每个像素点对应的变形参数。
在本申请实施例另一种可能的实现方式中,如果与目标翻译图像所属的第一域对应的生成器有N种,N为大于1的整数,则第一获取模块410在获取图像翻译请求之后,还用于:对原图像进行识别,以确定原图像所属的第二域;以及根据原图像所属的第二域及目标翻译图像所属的第一域,从N种生成器中选取目标生成器。
在本申请实施例又一种可能的实现方式中,第一获取模块410在获取图像翻译请求之后,还用于:对原图像进行识别,以确定原图像所属的第二域;以及根据原图像所属的第二域,获取目标生成器;第一生成模块430具体用于:利用目标生成器,对缩小图像进行处理,以生成原图像对应的预翻译图像、掩膜图像及与原图像中的每个像素点对应的变形参数。
在本申请实施例再一种可能的实现方式中,如果与原图像所属的第二域对应的生成器有N种,N为大于1的整数,则第一获取模块410在获取图像翻译请求之后,还用于:获取目标翻译图像所属的第一域;以及根据目标翻译图像所属的第一域及原图像所属的第二域,从N种生成器中选取目标生成器。
图6为本申请实施例提供的又一种图像的翻译装置的结构示意图。在本申请实施例一种可能的实现方式中,如图6所示,第一融合模块450包括第一确定单元451和第一融合单元452。
其中,第一确定单元451用于根据掩膜图像中各像素点的像素值,确定预翻译图像的第一权重及变形图像的第二权重;第一融合单元452用于根据第一权重及第二权重,将预翻译图像中各像素点的像素值与变形图像中各像素点的像素值进行融合,以生成目标翻译图像。
在本申请实施例一种可能的实现方式中,在对原图像进行下采样,以生成与原图像对应的缩小图像之前,第一采样模块420还用于:获取当前所在电子设备的属性参数;根据电子设备的属性参数,确定下采样系数;第一采样模块420具体用于:根据下采样系数,对原图像进行下采样,以生成与原图像对应的缩小图像。
需要说明的是,本申请实施例的图像的翻译装置中未披露的细节,请参照本申请实施例的图像的翻译方法中所披露的细节,具体这里不再赘述。
本申请实施例的图像的翻译装置,首先通过第一获取模块获取图像翻译请求,其次通过第一采样模块对翻译请求中的原图像进行下采样,以生成与原图像对应的缩小图像,然后通过第一生成模块根据缩小图像,生成原图像对应的与原图像的尺寸相同的预翻译图像、掩膜图像及与原图像中的每个像素点对应的变形参数,进而通过第一处理模块根据变形参数将原图像进行变形处理,以获取变形图像,最后通过第一融合模块将变形图像、预翻译图像及掩膜图像进行融合,以生成目标翻译图像。由此,将原图像进行缩小处理后作为输入,以降低图像翻译的运算量,同时,输出与原图像尺寸相同的目标翻译图像,并在生成的目标翻译图像中,包含由原图像变形生成的变形图像,从而确保在降低图像翻译的运算量的同时,还能够保证图像翻译的效果,并且目标翻译图像充分利用了原始图像输入的高清和丰富的高频细节信息,大大提高了生成的目标翻译图像的清晰度。
为了实现上述实施例,本申请实施例还提出一种图像翻译模型的训练方法,以通过图像翻译模型实现上述的图像的翻译方法。图7为本申请实施例提供的一种图像翻译模型的训练方法的流程示意图。
需要说明的是,本申请实施例的图像翻译模型的训练方法的执行主体为图像翻译模型的训练装置,图像翻译模型的训练装置可以被配置在电子设备中,以实现对图像翻译模型进行训练,从而得到第一生成器。其中,电子设备可以是任意能够进行数据处理的终端设备或服务器等,本申请对此不作限制。
如图7所示,图像翻译模型的训练方法可包括以下步骤:
步骤701,获取训练样本集。
其中,训练样本集中包括属于第一域的第一图像集、及属于第二域的第二图像集。
步骤702,将第一图像集中的图像分别进行下采样,以生成第一缩小图像集。
步骤703,利用第一初始生成器,对第一缩小图像集中的图像分别进行处理,以生成第一预翻译图像集、第一掩膜图像集及第一变形参数集。其中,第一变形参数集中的每个参数分别与第一图像集中的图像中的每个像素点对应。
步骤704,根据第一变形参数集,将第一图像集中的图像分别进行变形处理,以获取第一变形图像集。
步骤705,将第一变形图像集、第一预翻译图像集及第一掩膜图像集中的对应图像分别进行融合,以获取第三图像集。
步骤706,将第三图像集中的图像及第二图像集中的图像,分别输入至第一初始判别器,以获取第一初始判别器输出的第三图像集中的图像分别属于真实图像的第一概率集、及第二图像集中的图像分别属于真实图像的第二概率集。
步骤707,根据第一概率集及第二概率集,对第一初始生成器及第一初始判别器进行修正,以生成属于第一域的目标生成器。其中,属于第一域的目标生成器用于将位于第一域的图像翻译成位于第二域的图像。
其中,第一图像集中的图像分别与第二图像集中的图像一一匹配。
具体而言,当训练样本集中的第一图像集中的图像与第二图像集中的图像一一匹配时,可将第一缩小图像集中的图像作为第一初始生成器的输入,以通过第一初始生成器对第一缩小图像集中的图像分别进行翻译,以获取属于第二域的第三图像集,其中,对第一缩小图像集中的图像分别进行翻译的过程可参见上述实施例中提出的图像的翻译方法,为避免冗余,在此不再详述。
在获取到第三图像集后,可将第三图像集中的图像及第二图像集中的图像,分别输入至第一初始判别器,以通过第一初始判别器输出第三图像集中的图像分别属于真实图像的第一概率集、及第二图像集中的图像分别属于真实图像的第二概率集。此时,可通过比较第一概率集和第二概率集的大小,对第一初始生成器及第一初始判别器进行修正。
其中,当第一概率集与第二概率集偏差较大时,则说明通过第一初始生成器对图像进行翻译时,误差较大,因此,需要对第一初始生成器和第一初始判别器进行相应的修正,以获取属于第一域的目标生成器;当第一概率集与第二概率集偏差较小时,则说明通过第一初始生成器对图像进行翻译时,误差较小,因此,无需对第一初始生成器和第一初始判别器进行相应的修正,可直接将第一初始生成器作为属于第一域的目标生成器。其中,可将属于第一域的目标生成器作为一种图像翻译模型,以将位于第一域的图像翻译成位于第二域的图像。
由此,对图像翻译模型进行训练,并通过训练后的图像翻译模型对图像进行翻译,能够将原图像进行缩小处理后作为输入,以降低图像翻译的运算量,同时,输出与原图像尺寸相同的目标翻译图像,并在生成的目标翻译图像中,包含由原图像变形生成的变形图像,从而确保在降低图像翻译的运算量的同时,还能够保证图像翻译的效果,并且目标翻译图像充分利用了原始图像输入的高清和丰富的高频细节信息,大大提高了生成的目标翻译图像的清晰度。
需要说明的是,在对图像进行处理时,一般是提取出该图像中的特征信息,并通过对特征信息进行相应的处理,以实现对图像的处理。
对应的,步骤703包括:对第一缩小图像集中的图像分别进行处理,以确定缩小图像集中的图像翻译至第二域时对应的第一特征向量集;对第一特征向量集中的第一特征向量分别进行上采样,以生成第二特征向量集;根据第二特征向量集中的第二特征向量,生成第一预翻译图像集、第一掩膜图像集及第一变形参数集。
其中,利用第一初始生成器,对所述第一缩小图像集中的图像分别进行处理,以生成第一预翻译图像集、第一掩膜图像集及第一变形参数集的过程可参见上述实施例中提出的图像的翻译方法,为避免冗余,在此不再详述。
可以理解的是,本公开中,将原图像进行翻译时,实际处理的图像尺寸为缩小后的图像,而仅在将特征向量解码为预翻译图像、掩膜图像及变形参数前,才进行了上采样处理,从而不仅保证了最终生成的预翻译图像、掩膜图像等与原图像尺寸相同,而且极大的减小了图像翻译过程中数据的处理量。
需要说明的是,如果第一图像集中的图像与第二图像集中的图像未匹配,则通过上述实施例获取到的第三图像集中的图像与第二图像集中的图像也不匹配,因此,根据第一概率集及第二概率集并无法准确地对第一初始生成器及第一初始判别器进行修正,从而使得生成的图像翻译模型的误差较大。
因此,在本申请的一个实施例中,当第一图像集中的图像与第二图像集中的图像未匹配时,如图8所示,在上述步骤707之后,该方法还包括:
步骤801,将第三图像集中的图像分别进行下采样,以生成第二缩小图像集;
步骤802,利用第二初始生成器,对第二缩小图像集中的图像分别进行处理,以生成第二预翻译图像集、第二掩膜图像集及第二变形参数集;
步骤803,根据第二变形参数集,将第三图像集中的图像分别进行变形处理,以获取第二变形图像集;
步骤804,将第二变形图像集、第二预翻译图像集及第二掩膜图像集中的对应图像分别进行融合,以获取第四图像集;
步骤805,将第四图像集中的图像及第一图像集中的图像,分别输入至第二初始判别器,以获取第二初始判别器输出的第四图像集中的图像分别属于真实图像的第三概率集、及第一图像集中的图像分别属于真实图像的第四概率集。
步骤806,根据第三概率集及第四概率集,对第一初始生成器、第二初始生成器、第一初始判别器及第二初始判别器进行修正,以生成属于第一域的目标生成器及属于第二域的目标生成器。其中,属于第一域的目标生成器,用于将位于第一域的图像翻译成位于第二域的图像,属于第二域的目标生成器,用于将位于第二域的图像翻译成位于第一域的图像。
具体而言,当训练样本集中的第一图像集中的图像与第二图像集中的图像不匹配时,可将第二缩小图像集中的图像作为第二初始生成器的输入,以通过第二初始生成器对第二缩小图像集中的图像分别进行翻译,以获取属于第一域的第四图像集,其中,对第二缩小图像集中的图像分别进行翻译的过程可参见上述实施例中提出的图像的翻译方法,为避免冗余,在此不再详述。
在获取到第四图像集后,可将第四图像集中的图像及第一图像集中的图像,分别输入至第二初始判别器,以通过第二初始判别器输出第四图像集中的图像分别属于真实图像的第三概率集、及第一图像集中的图像分别属于真实图像的第四概率集。此时,可通过比较第三概率集和第四概率集的大小对第一初始生成器、第二初始生成器、第一初始判别器及第二初始判别器进行修正。
其中,当第三概率集和第四概率集偏差较大时,则说明通过第一初始生成器和第二初始生成器对图像进行翻译时,误差较大,因此,需要对第一初始生成器、第二初始生成器、第一初始判别器及第二初始判别器进行相应的修正,以获取属于第一域的目标生成器和属于第二域的目标生成器;当第三概率集和第四概率集偏差较小时,则说明通过第一初始生成器和第二初始生成器对图像进行翻译时,误差较小,因此,无需对第一初始生成器、第二初始生成器、第一初始判别器及第二初始判别器进行修正,可直接将第一初始生成器作为属于第一域的目标生成器,并将第二初始生成器作为属于第二域的目标生成器。其中,可将属于第一域的目标生成器作为一种图像翻译模型,以将位于第一域的图像翻译成位于第二域的图像,并可将属于第二域的目标生成器作为另一种图像翻译模型,以将位于第二域的图像翻译成位于第一域的图像,其中,该实施例中的属于第一域的目标生成器可与上述实施例中的属于第一域的目标生成器相同,也可以不同,具体可根据实际情况进行选择。
由此,对图像翻译模型进行训练,并通过训练后的图像翻译模型对图像进行翻译,能够将原图像进行缩小处理后作为输入,以降低图像翻译的运算量,同时,输出与原图像尺寸相同的目标翻译图像,并在生成的目标翻译图像中,包含由原图像变形生成的变形图像,从而确保在降低图像翻译的运算量的同时,还能够保证图像翻译的效果,并且目标翻译图像充分利用了原始图像输入的高清和丰富的高频细节信息,大大提高了生成的目标翻译图像的清晰度。
综上所述,本申请提供的图像翻译模型的训练方法,获取训练样本集,其中,训练样本集中包括属于第一域的第一图像集、及属于第二域的第二图像集,并将第一图像集中的图像分别进行下采样,以生成第一缩小图像集,以及利用第一初始生成器,对第一缩小图像集中的图像分别进行处理,以生成第一预翻译图像集、第一掩膜图像集及第一变形参数集,其中,第一变形参数集中的每个参数分别与第一图像集中的图像中的每个像素点对应,并根据第一变形参数集,将第一图像集中的图像分别进行变形处理,以获取第一变形图像集,以及将第一变形图像集、第一预翻译图像集及第一掩膜图像集中的对应图像分别进行融合,以获取第三图像集,并将第三图像集中的图像及第二图像集中的图像,分别输入至第一初始判别器,以获取第一初始判别器输出的第三图像集中的图像分别属于真实图像的第一概率集、及第二图像集中的图像分别属于真实图像的第二概率集以及根据第一概率集及第二概率集,对第一初始生成器及第一初始判别器进行修正,以生成属于第一域的目标生成器,其中,属于第一域的目标生成器用于将位于第一域的图像翻译成位于第二域的图像。由此,对图像翻译模型进行训练,并通过训练后的图像翻译模型对图像进行翻译,能够将原图像进行缩小处理后作为输入,以降低图像翻译的运算量,同时,输出与原图像尺寸相同的目标翻译图像,并在生成的目标翻译图像中,包含由原图像变形生成的变形图像,从而确保在降低图像翻译的运算量的同时,还能够保证图像翻译的效果,并且目标翻译图像充分利用了原始图像输入的高清和丰富的高频细节信息,大大提高了生成的目标翻译图像的清晰度。
为了实现上述实施例,本申请实施例还提出一种图像翻译模型的训练装置。该图像翻译模型的训练装置可设置在电子设备中。图9为本申请实施例提供的一种图像翻译模型的训练装置的结构示意图。
如图9所示,该图像翻译模型的训练装置900可包括第二获取模块901、第二采样模块902、第二处理模块903、第三处理模块904、第二融合模块905、第三获取模块906和第一修正模块907。
其中,第二获取模块901用于获取训练样本集,其中,训练样本集中包括属于第一域的第一图像集、及属于第二域的第二图像集;第二采样模块902用于将第一图像集中的图像分别进行下采样,以生成第一缩小图像集;第二处理模块903用于利用第一初始生成器,对第一缩小图像集中的图像分别进行处理,以生成第一预翻译图像集、第一掩膜图像集及第一变形参数集,其中,第一变形参数集中的每个参数分别与第一图像集中的图像中的每个像素点对应;第三处理模块904用于根据第一变形参数集,将第一图像集中的图像分别进行变形处理,以获取第一变形图像集;第二融合模块905用于将第一变形图像集、第一预翻译图像集及第一掩膜图像集中的对应图像分别进行融合,以获取第三图像集;第三获取模块906用于将第三图像集中的图像及第二图像集中的图像,分别输入至第一初始判别器,以获取第一初始判别器输出的第三图像集中的图像分别属于真实图像的第一概率集、及第二图像集中的图像分别属于真实图像的第二概率集;第一修正模块907用于根据第一概率集及第二概率集,对第一初始生成器及第一初始判别器进行修正,以生成属于第一域的目标生成器,其中,属于第一域的目标生成器用于将位于第一域的图像翻译成位于第二域的图像。
图10为本申请实施例提供的另一种图像翻译模型的训练装置的结构示意图。如图10所示,第二处理模块903包括第二处理单元9031、第二采样单元9032和第二生成单元9033。
其中,第二处理单元9031用于对第一缩小图像集中的图像分别进行处理,以确定缩小图像集中的图像翻译至第二域时对应的第一特征向量集;第二采样单元9032用于对第一特征向量集中的第一特征向量分别进行上采样,以生成第二特征向量集;第二生成单元9033用于根据第二特征向量集中的第二特征向量,生成第一预翻译图像集、第一掩膜图像集及第一变形参数集。
在本申请的一个实施例中,第一图像集中的图像分别与第二图像集中的图像一一匹配。
图11为本申请实施例提供的又一种图像翻译模型的训练装置的结构示意图。在本申请实施例一种可能的实现方式中,如果第一图像集中的图像与第二图像集中的图像未匹配,如图11所示,该训练装置还包括:第三采样模块908、第四处理模块909、第五处理模块910、第三融合模块911、第四获取模块912和第二修正模块913。
其中,第三采样模块908用于将第三图像集中的图像分别进行下采样,以生成第二缩小图像集;第四处理模块909用于利用第二初始生成器,对第二缩小图像集中的图像分别进行处理,以生成第二预翻译图像集、第二掩膜图像集及第二变形参数集;第五处理模块910用于根据第二变形参数集,将第三图像集中的图像分别进行变形处理,以获取第二变形图像集;第三融合模块911用于将第二变形图像集、第二预翻译图像集及第二掩膜图像集中的对应图像分别进行融合,以获取第四图像集;第四获取模块912用于将第四图像集中的图像及第一图像集中的图像,分别输入至第二初始判别器,以获取第二初始判别器输出的第四图像集中的图像分别属于真实图像的第三概率集、及第一图像集中的图像分别属于真实图像的第四概率集;第二修正模块913用于根据第三概率集及第四概率集,对第一初始生成器、第二初始生成器、第一初始判别器及第二初始判别器进行修正,以生成属于第一域的目标生成器及属于第二域的目标生成器,其中,属于第一域的目标生成器,用于将位于第一域的图像翻译成位于第二域的图像,属于第二域的目标生成器,用于将位于第二域的图像翻译成位于第一域的图像。
需要说明的是,本申请实施例的图像翻译模型的训练装置中未披露的细节,请参照本申请实施例的图像翻译模型的训练方法中所披露的细节,具体这里不再赘述。
本申请实施例的图像翻译模型的训练装置,通过第二获取模块获取训练样本集,其中,训练样本集中包括属于第一域的第一图像集、及属于第二域的第二图像集,并通过第二采样模块将第一图像集中的图像分别进行下采样,以生成第一缩小图像集,以及通过第二处理模块利用第一初始生成器,对第一缩小图像集中的图像分别进行处理,以生成第一预翻译图像集、第一掩膜图像集及第一变形参数集,其中,第一变形参数集中的每个参数分别与第一图像集中的图像中的每个像素点对应,并通过第三处理模块根据第一变形参数集,将第一图像集中的图像分别进行变形处理,以获取第一变形图像集,以及通过第二融合模块将第一变形图像集、第一预翻译图像集及第一掩膜图像集中的对应图像分别进行融合,以获取第三图像集,并通过第三获取模块将第三图像集中的图像及第二图像集中的图像,分别输入至第一初始判别器,以获取第一初始判别器输出的第三图像集中的图像分别属于真实图像的第一概率集、及第二图像集中的图像分别属于真实图像的第二概率集,以及通过第一修正模块根据第一概率集及第二概率集,对第一初始生成器及第一初始判别器进行修正,以生成属于第一域的目标生成器,其中,属于第一域的目标生成器用于将位于第一域的图像翻译成位于第二域的图像。由此,对图像翻译模型进行训练,并通过训练后的图像翻译模型对图像进行翻译,能够将原图像进行缩小处理后作为输入,以降低图像翻译的运算量,同时,输出与原图像尺寸相同的目标翻译图像,并在生成的目标翻译图像中,包含由原图像变形生成的变形图像,从而确保在降低图像翻译的运算量的同时,还能够保证图像翻译的效果,并且目标翻译图像充分利用了原始图像输入的高清和丰富的高频细节信息,大大提高了生成的目标翻译图像的清晰度。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图12所示,是根据本申请实施例的图像的翻译方法或者图像翻译模型的训练方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图12所示,该电子设备包括:一个或多个处理器1201、存储器1202,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图12中以一个处理器1201为例。
存储器1202即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的图像的翻译方法或者图像翻译模型的训练方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的图像的翻译方法或者图像翻译模型的训练方法。
存储器1202作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的图像的翻译方法或者图像翻译模型的训练方法对应的程序指令/模块(例如,附图4所示的第一获取模块410、第一采样模块420、第一生成模块430、第一处理模块440和第一融合模块450,附图9所示的第二获取模块901、第二采样模块902、第二处理模块903、第三处理模块904、第二融合模块905、第三获取模块906和第一修正模块907)。处理器1201通过运行存储在存储器1202中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的图像的翻译方法或者图像翻译模型的训练方法。
存储器1202可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储图像翻译的电子设备的使用所创建的数据等。此外,存储器1202可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器1202可选包括相对于处理器1201远程设置的存储器,这些远程存储器可以通过网络连接至图像翻译的电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
图像的翻译方法或者图像翻译模型的训练方法的电子设备还可以包括:输入装置1203和输出装置1204。处理器1201、存储器1202、输入装置1203和输出装置1204可以通过总线或者其他方式连接,图12中以通过总线连接为例。
输入装置1203可接收输入的数字或字符信息,以及产生与图像翻译的电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置1204可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (22)
1.一种图像的翻译方法,包括:
获取图像翻译请求,其中,所述翻译请求中包括原图像;
对所述原图像进行下采样,以生成与所述原图像对应的缩小图像;
根据所述缩小图像,生成所述原图像对应的预翻译图像、掩膜图像及与所述原图像中的每个像素点对应的变形参数,其中,所述预翻译图像及所述掩膜图像的尺寸与所述原图像的尺寸相同;
根据所述变形参数将所述原图像进行变形处理,以生成变形图像;以及
根据所述掩膜图像中各像素点的像素值,确定所述预翻译图像的第一权重及所述变形图像的第二权重;以及
根据所述第一权重及所述第二权重,将所述预翻译图像中各像素点的像素值与所述变形图像中各像素点的像素值进行融合,以生成目标翻译图像。
2.如权利要求1所述的方法,其中,所述根据所述缩小图像,生成所述原图像对应的预翻译图像、掩膜图像及与所述原图像中的每个像素点对应的变形参数,包括:
对所述缩小图像进行处理,以确定所述缩小图像翻译至第一域时对应的第一特征向量,其中,所述第一域为所述目标翻译图像所属的域;
对所述第一特征向量进行上采样,以生成第二特征向量;
根据所述第二特征向量,生成所述预翻译图像、掩膜图像及与所述原图像中的每个像素点对应的变形参数。
3.如权利要求1所述的方法,其中,所述翻译请求中还包括所述目标翻译图像所属的第一域,在所述获取图像翻译请求之后,还包括:
根据所述目标翻译图像所属的第一域,获取目标生成器;
所述根据所述缩小图像,生成所述原图像对应的预翻译图像、掩膜图像及与所述原图像中的每个像素点对应的变形参数,包括:
利用所述目标生成器,对所述缩小图像进行处理,以生成所述原图像对应的预翻译图像、掩膜图像及与所述原图像中的每个像素点对应的变形参数。
4. 如权利要求3所述的方法,其中,如果与所述目标翻译图像所属的第一域对应的生成器有N种,N为大于1的整数,则在所述获取图像翻译请求之后,还包括:
对所述原图像进行识别,以确定所述原图像所属的第二域;以及
根据所述原图像所属的第二域及所述目标翻译图像所属的第一域,从所述N种生成器中选取所述目标生成器。
5. 如权利要求1所述的方法,其中,在所述获取图像翻译请求之后,还包括:
对所述原图像进行识别,以确定所述原图像所属的第二域;以及
根据所述原图像所属的第二域,获取目标生成器;
所述根据所述缩小图像,生成所述原图像对应的预翻译图像、掩膜图像及与所述原图像中的每个像素点对应的变形参数,包括:
利用所述目标生成器,对所述缩小图像进行处理,以生成所述原图像对应的预翻译图像、掩膜图像及与所述原图像中的每个像素点对应的变形参数。
6. 如权利要求5所述的方法,其中,如果与所述原图像所属的第二域对应的生成器有N种,N为大于1的整数,则在所述获取图像翻译请求之后,还包括:
获取目标翻译图像所属的第一域;以及
根据所述目标翻译图像所属的第一域及所述原图像所属的第二域,从所述N种生成器中选取所述目标生成器。
7.如权利要求1-6任一所述的方法,其中,在所述对所述原图像进行下采样,以生成与所述原图像对应的缩小图像之前,还包括:
获取当前所在电子设备的属性参数;
根据所述电子设备的属性参数,确定下采样系数;
所述对所述原图像进行下采样,以生成与所述原图像对应的缩小图像,包括:
根据所述下采样系数,对所述原图像进行下采样,以生成与所述原图像对应的缩小图像。
8.一种图像翻译模型的训练方法,包括:
获取训练样本集,其中,所述训练样本集中包括属于第一域的第一图像集、及属于第二域的第二图像集;
将所述第一图像集中的图像分别进行下采样,以生成第一缩小图像集;
利用第一初始生成器,对所述第一缩小图像集中的图像分别进行处理,以生成第一预翻译图像集、第一掩膜图像集及第一变形参数集,其中,所述第一变形参数集中的每个参数分别与所述第一图像集中的图像中的每个像素点对应;
根据所述第一变形参数集,将所述第一图像集中的图像分别进行变形处理,以获取第一变形图像集;
将所述第一变形图像集、所述第一预翻译图像集及所述第一掩膜图像集中的对应图像分别进行融合,以获取第三图像集;
将所述第三图像集中的图像及所述第二图像集中的图像,分别输入至第一初始判别器,以获取所述第一初始判别器输出的所述第三图像集中的图像分别属于真实图像的第一概率集、及所述第二图像集中的图像分别属于真实图像的第二概率集;以及
根据所述第一概率集及所述第二概率集,对所述第一初始生成器及所述第一初始判别器进行修正,以生成属于第一域的目标生成器,其中,所述属于第一域的目标生成器用于将位于第一域的图像翻译成位于第二域的图像;
其中,如果第一图像集中的图像与所述第二图像集中的图像未匹配,则在所述根据所述第一概率集及所述第二概率集,对所述第一初始生成器及所述第一初始判别器进行修正之后,还包括:
将所述第三图像集中的图像分别进行下采样,以生成第二缩小图像集;
利用第二初始生成器,对所述第二缩小图像集中的图像分别进行处理,以生成第二预翻译图像集、第二掩膜图像集及第二变形参数集;
根据所述第二变形参数集,将所述第三图像集中的图像分别进行变形处理,以获取第二变形图像集;
将所述第二变形图像集、第二预翻译图像集及所述第二掩膜图像集中的对应图像分别进行融合,以获取第四图像集;
将所述第四图像集中的图像及所述第一图像集中的图像,分别输入至第二初始判别器,以获取所述第二初始判别器输出的所述第四图像集中的图像分别属于真实图像的第三概率集、及所述第一图像集中的图像分别属于真实图像的第四概率集;以及
根据所述第三概率集及所述第四概率集,对所述第一初始生成器、所述第二初始生成器、所述第一初始判别器及所述第二初始判别器进行修正,以生成属于第一域的目标生成器及属于第二域的目标生成器,其中,所述属于第一域的目标生成器,用于将位于第一域的图像翻译成位于第二域的图像,所述属于第二域的目标生成器,用于将位于第二域的图像翻译成位于第一域的图像。
9.如权利要求8所述的训练方法,其中,所述利用第一初始生成器,对所述第一缩小图像集中的图像分别进行处理,以生成第一预翻译图像集、第一掩膜图像集及第一变形参数集,包括:
对所述第一缩小图像集中的图像分别进行处理,以确定所述缩小图像集中的图像翻译至所述第二域时对应的第一特征向量集;
对所述第一特征向量集中的第一特征向量分别进行上采样,以生成第二特征向量集;
根据所述第二特征向量集中的第二特征向量,生成所述第一预翻译图像集、所述第一掩膜图像集及所述第一变形参数集。
10.如权利要求8所述的训练方法,其中,所述第一图像集中的图像分别与所述第二图像集中的图像一一匹配。
11.一种图像的翻译装置,包括:
第一获取模块,用于获取图像翻译请求,其中,所述翻译请求中包括原图像;
第一采样模块,用于对所述原图像进行下采样,以生成与所述原图像对应的缩小图像;
第一生成模块,用于根据所述缩小图像,生成所述原图像对应的预翻译图像、掩膜图像及与所述原图像中的每个像素点对应的变形参数,其中,所述预翻译图像及所述掩膜图像的尺寸与所述原图像的尺寸相同;
第一处理模块,用于根据所述变形参数将所述原图像进行变形处理,以获取变形图像;以及
第一融合模块,用于将所述变形图像、所述预翻译图像及所述掩膜图像进行融合,以生成目标翻译图像;
其中,所述第一融合模块包括:
第一确定单元,用于根据所述掩膜图像中各像素点的像素值,确定所述预翻译图像的第一权重及所述变形图像的第二权重;以及
第一融合单元,用于根据所述第一权重及所述第二权重,将所述预翻译图像中各像素点的像素值与所述变形图像中各像素点的像素值进行融合,以生成所述目标翻译图像。
12.如权利要求11所述的装置,其中,所述第一生成模块包括:
第一处理单元,用于对所述缩小图像进行处理,以确定所述缩小图像翻译至第一域时对应的第一特征向量,其中,所述第一域为所述目标翻译图像所属的域;
第一采样单元,用于对所述第一特征向量进行上采样,以生成第二特征向量;
第一生成单元,用于根据所述第二特征向量,生成所述预翻译图像、掩膜图像及与所述原图像中的每个像素点对应的变形参数。
13.如权利要求11所述的装置,其中,所述翻译请求中还包括所述目标翻译图像所属的第一域,所述第一获取模块在所述获取图像翻译请求之后,还用于:
根据所述目标翻译图像所属的第一域,获取目标生成器;
所述第一生成模块具体用于:
利用所述目标生成器,对所述缩小图像进行处理,以生成所述原图像对应的预翻译图像、掩膜图像及与所述原图像中的每个像素点对应的变形参数。
14. 如权利要求13所述的装置,其中,如果与所述目标翻译图像所属的第一域对应的生成器有N种,N为大于1的整数,则所述第一获取模块在所述获取图像翻译请求之后,还用于:
对所述原图像进行识别,以确定所述原图像所属的第二域;以及
根据所述原图像所属的第二域及所述目标翻译图像所属的第一域,从所述N种生成器中选取所述目标生成器。
15. 如权利要求11所述的装置,其中,所述第一获取模块在所述获取图像翻译请求之后,还用于:
对所述原图像进行识别,以确定所述原图像所属的第二域;以及
根据所述原图像所属的第二域,获取目标生成器;
所述第一生成模块具体用于:
利用所述目标生成器,对所述缩小图像进行处理,以生成所述原图像对应的预翻译图像、掩膜图像及与所述原图像中的每个像素点对应的变形参数。
16. 如权利要求15所述的装置,其中,如果与所述原图像所属的第二域对应的生成器有N种,N为大于1的整数,则所述第一获取模块在所述获取图像翻译请求之后,还用于:
获取目标翻译图像所属的第一域;以及
根据所述目标翻译图像所属的第一域及所述原图像所属的第二域,从所述N种生成器中选取所述目标生成器。
17.如权利要求11-16任一所述的装置,其中,在所述对所述原图像进行下采样,以生成与所述原图像对应的缩小图像之前,所述第一采样模块还用于:
获取当前所在电子设备的属性参数;
根据所述电子设备的属性参数,确定下采样系数;
所述第一采样模块具体用于:
根据所述下采样系数,对所述原图像进行下采样,以生成与所述原图像对应的缩小图像。
18.一种图像翻译模型的训练装置,包括:
第二获取模块,用于获取训练样本集,其中,所述训练样本集中包括属于第一域的第一图像集、及属于第二域的第二图像集;
第二采样模块,用于将所述第一图像集中的图像分别进行下采样,以生成第一缩小图像集;
第二处理模块,用于利用第一初始生成器,对所述第一缩小图像集中的图像分别进行处理,以生成第一预翻译图像集、第一掩膜图像集及第一变形参数集,其中,所述第一变形参数集中的每个参数分别与所述第一图像集中的图像中的每个像素点对应;
第三处理模块,用于根据所述第一变形参数集,将所述第一图像集中的图像分别进行变形处理,以获取第一变形图像集;
第二融合模块,用于将所述第一变形图像集、所述第一预翻译图像集及所述第一掩膜图像集中的对应图像分别进行融合,以获取第三图像集;
第三获取模块,用于将所述第三图像集中的图像及所述第二图像集中的图像,分别输入至第一初始判别器,以获取所述第一初始判别器输出的所述第三图像集中的图像分别属于真实图像的第一概率集、及所述第二图像集中的图像分别属于真实图像的第二概率集;以及
第一修正模块,用于根据所述第一概率集及所述第二概率集,对所述第一初始生成器及所述第一初始判别器进行修正,以生成属于第一域的目标生成器,其中,所述属于第一域的目标生成器用于将位于第一域的图像翻译成位于第二域的图像;
其中,如果第一图像集中的图像与所述第二图像集中的图像未匹配,则所述训练装置还包括:
第三采样模块,用于将所述第三图像集中的图像分别进行下采样,以生成第二缩小图像集;
第四处理模块,用于利用第二初始生成器,对所述第二缩小图像集中的图像分别进行处理,以生成第二预翻译图像集、第二掩膜图像集及第二变形参数集;
第五处理模块,用于根据所述第二变形参数集,将所述第三图像集中的图像分别进行变形处理,以获取第二变形图像集;
第三融合模块,用于将所述第二变形图像集、第二预翻译图像集及所述第二掩膜图像集中的对应图像分别进行融合,以获取第四图像集;
第四获取模块,用于将所述第四图像集中的图像及所述第一图像集中的图像,分别输入至第二初始判别器,以获取所述第二初始判别器输出的所述第四图像集中的图像分别属于真实图像的第三概率集、及所述第一图像集中的图像分别属于真实图像的第四概率集;以及
第二修正模块,用于根据所述第三概率集及所述第四概率集,对所述第一初始生成器、所述第二初始生成器、所述第一初始判别器及所述第二初始判别器进行修正,以生成属于第一域的目标生成器及属于第二域的目标生成器,其中,所述属于第一域的目标生成器,用于将位于第一域的图像翻译成位于第二域的图像,所述属于第二域的目标生成器,用于将位于第二域的图像翻译成位于第一域的图像。
19.如权利要求18所述的训练装置,其中,所述第二处理模块包括:
第二处理单元,用于对所述第一缩小图像集中的图像分别进行处理,以确定所述缩小图像集中的图像翻译至所述第二域时对应的第一特征向量集;
第二采样单元,用于对所述第一特征向量集中的第一特征向量分别进行上采样,以生成第二特征向量集;
第二生成单元,用于根据所述第二特征向量集中的第二特征向量,生成所述第一预翻译图像集、所述第一掩膜图像集及所述第一变形参数集。
20.如权利要求18所述的训练装置,其中,所述第一图像集中的图像分别与所述第二图像集中的图像一一匹配。
21. 一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的方法或者权利要求8-10中任一项所述的训练方法。
22.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1-7中任一项所述的方法或者权利要求8-10中任一项所述的训练方法。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010484916.4A CN111833239B (zh) | 2020-06-01 | 2020-06-01 | 图像的翻译方法和装置、图像翻译模型的训练方法和装置 |
US17/115,996 US11508044B2 (en) | 2020-06-01 | 2020-12-09 | Method for translating image, method for training image translation model |
KR1020200183269A KR102461043B1 (ko) | 2020-06-01 | 2020-12-24 | 이미지 번역 방법 및 장치, 이미지 번역 모델의 트레이닝 방법 및 장치 |
JP2020215551A JP7133003B2 (ja) | 2020-06-01 | 2020-12-24 | 画像翻訳方法及び装置、画像翻訳モデルトレーニング方法及び装置 |
EP20217425.6A EP3920129A1 (en) | 2020-06-01 | 2020-12-28 | Method for translating an image, method for training an image translation model, electronic device, storage medium and computer program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010484916.4A CN111833239B (zh) | 2020-06-01 | 2020-06-01 | 图像的翻译方法和装置、图像翻译模型的训练方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111833239A CN111833239A (zh) | 2020-10-27 |
CN111833239B true CN111833239B (zh) | 2023-08-01 |
Family
ID=72897504
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010484916.4A Active CN111833239B (zh) | 2020-06-01 | 2020-06-01 | 图像的翻译方法和装置、图像翻译模型的训练方法和装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11508044B2 (zh) |
EP (1) | EP3920129A1 (zh) |
JP (1) | JP7133003B2 (zh) |
KR (1) | KR102461043B1 (zh) |
CN (1) | CN111833239B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11461559B2 (en) * | 2020-01-28 | 2022-10-04 | Salesforce.Com, Inc. | Mechanism to facilitate image translation |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007081519A2 (en) * | 2005-12-30 | 2007-07-19 | Steven Kays | Genius adaptive design |
CN109711457A (zh) * | 2018-12-20 | 2019-05-03 | 江南大学 | 一种基于改进hu不变矩的快速图像匹配方法及其应用 |
CN109978893A (zh) * | 2019-03-26 | 2019-07-05 | 腾讯科技(深圳)有限公司 | 图像语义分割网络的训练方法、装置、设备及存储介质 |
GB201911577D0 (en) * | 2019-08-13 | 2019-09-25 | Univ Of Hertfordshire Higher Education Corporation | Method and apparatus |
CN110322416A (zh) * | 2019-07-09 | 2019-10-11 | 腾讯科技(深圳)有限公司 | 图像数据处理方法、装置以及计算机可读存储介质 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6807290B2 (en) * | 2000-03-09 | 2004-10-19 | Microsoft Corporation | Rapid computer modeling of faces for animation |
US20150086127A1 (en) * | 2013-09-20 | 2015-03-26 | Samsung Electronics Co., Ltd | Method and image capturing device for generating artificially defocused blurred image |
US9183616B2 (en) * | 2014-01-13 | 2015-11-10 | Arecont Vision, Llc. | System and method for obtaining super image resolution through optical image translation |
AU2015202937A1 (en) * | 2015-05-29 | 2016-12-15 | Canon Kabushiki Kaisha | Systems and methods for registration of images |
US9443316B1 (en) | 2015-07-21 | 2016-09-13 | Sony Corporation | Semi-automatic image segmentation |
US10810556B2 (en) | 2017-02-24 | 2020-10-20 | Mastercard International Incorporated | Systems and methods for managing receipts for payment account transactions |
US20180247201A1 (en) | 2017-02-28 | 2018-08-30 | Nvidia Corporation | Systems and methods for image-to-image translation using variational autoencoders |
US10339642B2 (en) * | 2017-03-30 | 2019-07-02 | Adobe Inc. | Digital image processing through use of an image repository |
US10825219B2 (en) * | 2018-03-22 | 2020-11-03 | Northeastern University | Segmentation guided image generation with adversarial networks |
-
2020
- 2020-06-01 CN CN202010484916.4A patent/CN111833239B/zh active Active
- 2020-12-09 US US17/115,996 patent/US11508044B2/en active Active
- 2020-12-24 KR KR1020200183269A patent/KR102461043B1/ko active IP Right Grant
- 2020-12-24 JP JP2020215551A patent/JP7133003B2/ja active Active
- 2020-12-28 EP EP20217425.6A patent/EP3920129A1/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007081519A2 (en) * | 2005-12-30 | 2007-07-19 | Steven Kays | Genius adaptive design |
CN109711457A (zh) * | 2018-12-20 | 2019-05-03 | 江南大学 | 一种基于改进hu不变矩的快速图像匹配方法及其应用 |
CN109978893A (zh) * | 2019-03-26 | 2019-07-05 | 腾讯科技(深圳)有限公司 | 图像语义分割网络的训练方法、装置、设备及存储介质 |
CN110322416A (zh) * | 2019-07-09 | 2019-10-11 | 腾讯科技(深圳)有限公司 | 图像数据处理方法、装置以及计算机可读存储介质 |
GB201911577D0 (en) * | 2019-08-13 | 2019-09-25 | Univ Of Hertfordshire Higher Education Corporation | Method and apparatus |
Non-Patent Citations (2)
Title |
---|
三维动画图像纹理实时渲染系统设计;孔素然;殷均平;;现代电子技术(第05期);全文 * |
肺部CT图像病变区域检测方法;韩光辉;刘峡壁;郑光远;;自动化学报(第12期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
JP7133003B2 (ja) | 2022-09-07 |
CN111833239A (zh) | 2020-10-27 |
US20210374920A1 (en) | 2021-12-02 |
KR20210148836A (ko) | 2021-12-08 |
KR102461043B1 (ko) | 2022-10-28 |
US11508044B2 (en) | 2022-11-22 |
JP2021190085A (ja) | 2021-12-13 |
EP3920129A1 (en) | 2021-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3852068A1 (en) | Method for training generative network, method for generating near-infrared image and apparatuses | |
US11710215B2 (en) | Face super-resolution realization method and apparatus, electronic device and storage medium | |
US20210209774A1 (en) | Image adjustment method and apparatus, electronic device and storage medium | |
CN111259671B (zh) | 文本实体的语义描述处理方法、装置及设备 | |
JP7228608B2 (ja) | ビデオフレームの処理方法及び処理装置、電子機器、記憶媒体並びにコンピュータプログラム | |
CN111709873B (zh) | 图像转换模型生成器的训练方法和装置 | |
CN111967297B (zh) | 图像的语义分割方法、装置、电子设备及介质 | |
US11810384B2 (en) | Method and apparatus for recognizing text content and electronic device | |
CN111860167A (zh) | 人脸融合模型获取及人脸融合方法、装置及存储介质 | |
CN111507355A (zh) | 一种字符识别方法、装置、设备和存储介质 | |
CN111241838B (zh) | 文本实体的语义关系处理方法、装置及设备 | |
CN111539897A (zh) | 用于生成图像转换模型的方法和装置 | |
CN111340905A (zh) | 图像风格化方法、装置、设备和介质 | |
CN111833239B (zh) | 图像的翻译方法和装置、图像翻译模型的训练方法和装置 | |
CN111833238B (zh) | 图像的翻译方法和装置、图像翻译模型的训练方法和装置 | |
CN112529058A (zh) | 图像生成模型训练方法和装置、图像生成方法和装置 | |
CN113240780B (zh) | 生成动画的方法和装置 | |
CN113160044B (zh) | 深度图像超分辨率方法、训练方法及装置、设备、介质 | |
CN116452741B (zh) | 对象重建方法、对象重建模型的训练方法、装置及设备 | |
CN113901997A (zh) | 图像风格转换方法、装置、设备、存储介质及程序产品 | |
CN117076838A (zh) | 一种数据处理方法、装置、设备及可读存储介质 | |
CN113160046A (zh) | 深度图像超分辨率方法、训练方法及装置、设备、介质 | |
CN117475153A (zh) | 运动目标的分割方法、装置、设备及存储介质 | |
CN118072322A (zh) | 字符生成模型的训练方法、装置、设备及存储介质 | |
CN113378858A (zh) | 图像检测方法、装置、设备、车辆和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |