CN115053263A - 使用人工智能的虚拟脸部生成方法及装置 - Google Patents
使用人工智能的虚拟脸部生成方法及装置 Download PDFInfo
- Publication number
- CN115053263A CN115053263A CN202180012895.9A CN202180012895A CN115053263A CN 115053263 A CN115053263 A CN 115053263A CN 202180012895 A CN202180012895 A CN 202180012895A CN 115053263 A CN115053263 A CN 115053263A
- Authority
- CN
- China
- Prior art keywords
- face
- data
- virtual
- learning
- background
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 43
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 19
- 238000013135 deep learning Methods 0.000 claims abstract description 9
- 230000014509 gene expression Effects 0.000 claims description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 4
- 210000000887 face Anatomy 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 210000000720 eyelash Anatomy 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/60—Editing figures and text; Combining figures or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T13/00—Animation
- G06T13/20—3D [Three Dimensional] animation
- G06T13/40—3D [Three Dimensional] animation of characters, e.g. humans, animals or virtual beings
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T19/00—Manipulating 3D models or images for computer graphics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/002—Image coding using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Multimedia (AREA)
- Computer Hardware Design (AREA)
- Computer Graphics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
- Processing Or Creating Images (AREA)
Abstract
本发明涉及使用人工智能的虚拟脸部生成方法及装置,包括如下的步骤:从虚拟脸部生成装置接收多个脸部源数据和至少一个脸部背景数据并通过深度学习来执行对于推论脸部与实际脸部的比较及学习;以及接收一个脸部背景数据并通过经上述比较及学习的模型来生成由从多个上述脸部源数据推论的脸部与上述一个脸部背景数据的特征合成而成的虚拟脸部数据。
Description
技术领域
本发明的实施例涉及使用人工智能技术来始终生成世界上不存在的虚拟人物的使用人工智能的虚拟脸部生成方法及装置。
背景技术
使用人工智能的脸部生成技术在生成高分辨率的实际脸部方面表现出高度的发展。最近,在多种内容中所使用的脸部合成技术给予人们提供多种内容的机会,但频繁出现合成特定人物脸部的技术被合成到淫秽作品、假新闻等被恶用的事例。并且,即使没有恶用地以良好的目的对特定人物进行合成,也有可能导致对于上述特定人物的肖像权的问题。因此,合成实际存在的人物的技术具有风险较大的问题。
上述背景技术是本发明人为了导出本发明而保留的或者是在导出本发明的过程中学习的技术信息,在申请本发明之前,不一定是向公众公开的公知技术。
发明内容
发明要解决的技术问题
用于解决现有技术的问题的本发明一实施例提供使用人工智能技术来始终生成世界上不存在的虚拟人物的使用人工智能的虚拟脸部生成方法及装置。
本发明的另一实施例提供使用作为人工智能的一个领域的深度学习(deeplearning)的自动编码(autoencoder)技术来始终生成世界上不存在的虚拟人物的使用人工智能的虚拟脸部生成方法及装置。
解决问题的技术方案
本发明的一实施方式包括如下的步骤:从虚拟脸部生成装置接收多个脸部源数据和至少一个脸部背景数据并通过深度学习来执行对于推论脸部与实际脸部的比较及学习;以及接收一个脸部背景数据并通过经上述比较及学习的模型来生成由从多个上述脸部源数据推论的脸部与上述一个脸部背景数据的特征合成而成的虚拟脸部数据。
并且,执行上述比较及学习的步骤包括如下的步骤:上述虚拟脸部生成装置的编码器接收多个上述脸部源数据和至少一个脸部背景数据来编码成多个卷积层;在内网络部中,通过经编码的上述数据分别生成脸部源数据和脸部背景数据的分布区域;在解码器中,将从上述内网络部传递的数据解码复原成多个解卷积层;以及比较经复原的上述数据与原始数据来进行学习。
并且,生成上述虚拟脸部数据的步骤包括如下的步骤:上述虚拟脸部生成装置的编码器接收一个脸部背景数据来进行编码;在内网络部中,使经编码的上述数据通过经上述比较及学习的模型之后导出虚拟脸部的分布区域来将上述分布区域传递到解码器;以及在上述解码器中生成包含推论脸部和背景脸部的特征的虚拟脸部数据。
并且,上述脸部背景数据包含脸部内的表情、眼睛/鼻子/嘴型、眨眼中的至少一种。
并且,本发明的特征在于,上述脸部数据为脸部图像或脸部影像。
本发明的另一实施方式包括:学习部,接收多个脸部源数据和至少一个脸部背景数据并通过深度学习来执行对于推论脸部与实际脸部的比较及学习;以及推论部,接收一个脸部背景数据并通过经上述比较及学习的模型来生成由从多个上述脸部源数据推论的脸部与上述一个脸部背景数据的特征合成而成的虚拟脸部数据。
并且,上述学习部包括:编码器,接收多个上述脸部源数据和至少一个脸部背景数据来编码成多个卷积层;内网络部,通过经编码的上述数据分别生成脸部源数据和脸部背景数据的分布区域;以及解码器,将从上述内网络部传递的数据解码成多个解卷积层。
并且,上述推论部包括:编码器,接收一个脸部背景数据来进行编码;内网络部,使经编码的上述数据通过经上述比较及学习的模型之后导出虚拟脸部的分布区域来将上述分布区域传递到解码器;以及上述解码器,通过解码来生成包含推论脸部和背景脸部的特征在内的虚拟脸部数据。
并且,上述脸部背景数据包含脸部内的表情、眼睛/鼻子/嘴型、眨眼中的至少一种。
并且,本发明的特征在于,上述脸部数据为脸部图像或脸部影像。
除上述之外的实施方式、特征、优点将从以下的附图、发明要求保护范围及发明的详细说明变得更加明确。
发明效果
根据本发明一实施例的使用人工智能的虚拟脸部生成方法及装置,可通过虚拟脸部合成技术来在没有对于特定人物的肖像权问题、恶用事例等的风险的情况下作为多种内容来使用。
而且,能够以多人的数据为基础来使用案例的数量来组合之前未见过的新的虚拟人物来生成多种虚拟人物。
附图说明
图1为示出本发明一实施例的虚拟脸部生成装置的图。
图2为示出在本发明一实施例的虚拟脸部生成装置中的学习方式的图。
图3为示出在本发明一实施例的虚拟脸部生成装置中的推论方式的图。
图4为示出在本发明一实施例的虚拟脸部生成装置中的虚拟脸部生成方式的图。
图5为示出本发明一实施例的虚拟脸部生成方法的流程图。
100:虚拟脸部生成装置
110:编码器
120:内网络部
130:解码器
200:学习部
300:推论部
具体实施方式
本发明可具有多种变换并可具有多种实施例,在图中例示特定实施例并在详细说明中进行详细说明。将参照与附图一同详细后述的实施例,本发明的效果、特征及实现这些的方法变得更加明确。但是,本发明并不局限于以下揭示的实施例,而是可体现为多种形态。
以下,参照附图,详细说明本发明的实施例,当参照附图进行说明时,对相同或对应的结构要素赋予相同的附图标记并省略对其的重复说明。
在以下的实施例中,第一、第二等术语并非为限定性含义,而是用于区分两种结构要素。
在以下的实施例中,除非文脉上明确定义,否则单数的表现包括复数的表现。
在以下的实施例中,包括或具有等术语意味着在说明书上记载的特征或结构要素的存在,并未预先排除一个以上的其他特征或结构要素的附加可能性。
在以下的实施例中,当膜、区域、结构要素等部分位于其他部分之上或上方时,这包括直接位于其他部分之上的情况和在中间形成其他膜、区域、结构要素等的情况。
图中,为了说明的便利,结构要素的尺寸可以放大或缩小。例如,图中所示的各个结构的尺寸及厚度为了说明的便利而随意示出,本发明并不局限于此。
本发明为使用人工智能技术来始终生成世界上不存在的虚拟人物的技术。
图1为示出本发明一实施例的虚拟脸部生成装置的图。
参照图1,虚拟脸部生成装置100可包括学习部200及推论部300。
学习部200可接收多个脸部源(source)数据和至少一个脸部背景(destin ation)数据并通过深度学习来执行对于推论脸部与实际脸部的比较及学习。其中,对于多人的多个脸部源数据可用于虚拟脸部的生成,至少一个脸部背景数据可以为包含与脸部内的表情、眼睛/鼻子/嘴型、眨眼中的至少一种有关的信息的数据。即,脸部背景数据可以包含能够表示对于一人的多种脸部的眼睛、鼻子、嘴、睫毛等的形态和移动的信息,且可包含与多人有关的脸部内动态特征信息,而并非为一人。
推论部300在通过学习部200生成虚拟脸部生成模型之后,接收一个脸部背景数据并通过虚拟脸部生成模型来生成由从多个脸部源数据推论的脸部与一个脸部背景数据的特征合成而成的虚拟脸部数据。
这种学习部200及推论部300可以为在虚拟脸部生成装置100中的结构要素或各个步骤的处理,可以相互共享虚拟脸部生成装置100内的结构要素来使用。
而且,虚拟脸部生成装置100可利用作为人工智能的一个领域的深度学习的自动编码器技术来始终生成世界上不存在的虚拟人物。自动编码器逐级学习神经网络的各个层来使得最终输出再现最初输出,输入层和输出层的维度相同,但隐藏层被设计成维度低于输入层和输出层。对此,在自动编码器中可压缩输入数据来提取特征,基于所提取的特征来输出最大程度再现输入的数据。
而且,自动编码器无法通过具有低纬度的隐藏层将输入直接复制成输出,因此,为了使输出和输入相同而需要进行学习。通过这种学习,自动编码器可以学习输入数据中最重要的特征(feature)。
在图2及图3中具体说明虚拟脸部生成装置100的具体的学习及推论方式。
图2为示出在本发明一实施例的虚拟脸部生成装置中的学习方式的图。
参照图2,虚拟脸部生成装置100的学习部200进行对于脸部数据的学习,可包括编码器110、内网络部120及解码器130。具体地,虚拟脸部生成装置100可包括具有共享加权值的编码器110、解码器130及包括两个独立的内模型的内网络部120。
编码器110由多个卷积层(multi-layer convolution)构成,通过接收源图像和背景图像并对其进行缩略的编码过程来向内网络部120传递。另一方面,虚拟脸部生成装置100可以在所输入的源图像中进行脸部检测、脸部对齐及脸部分割中的至少一个提取过程。而且,针对背景图像,为了与源图像匹配而基本上对整个脸部执行对齐。
在内网络部120中,可以通过内AB部122和内B部124的网络。内AB部122为学习一次源图像和背景图像的网络,内B部124为仅学习背景图像的网络。换句话说,内AB部122生成从源图像数据和背景图像数据提取的特征(隐形编码(latent coding)),内B部124生成 仅从背景图像提取的特征。
对此,在内网络部120中,仅使缩略的图像通过内AB部122和内B部124的网络,可形成背景图像分布区域和源图像分布区域。而且,在内网络部120中,向由多个卷积层构成的解码器130传递的多个图像可通过解码过程复原到原始图像。之后,复原的多个图像通过与原始图像进行比较来计算损失值,所计算的损失值可根据深度学习的反向传播技术来执行学习,由此可以生成虚拟脸部生成模型。
另一方面,当进行学习时,也可以对脸部的各个部位赋予不同的加权值。例如,在脸部中,对眼睛区域赋予比脸颊区域更大的加权值,由此可以生成眼睛更加清晰的脸部。
图3为示出在本发明一实施例的虚拟脸部生成装置中的推论方式的图。
参照图3,虚拟脸部生成装置100的推论部300可生成包含所输入的图像的特征的虚拟脸部,可包括编码器110、内网络部120及解码器130。
编码器110可执行接收对于特定人物的脸部有关的背景图像并对其进行缩略的编码过程来向内网络部120传递。在内网络部120中,仅可通过内AB部122的网络。内B部124仅在学习时通过,在推论时通过内AB部122的网络。由此,可获取脸部的表情、嘴型、眼型等信息,从包含这种特征信息的多个图像找出通过多人的源图像形成的虚拟人物的分布区域。
而且,从内网络部120向解码器130传递的多个图像可通过多个卷积层的解码过程来生成由推论的源脸部和背景图像的特征合成而成的虚拟脸部图像。所生成的图像并非源图像中的相同的脸部,而是可以生成混合有源图像的形态的新的虚拟人物。而且,可将具有这种虚拟脸部的虚拟人物生成为可以为学习背景图像的表情、嘴型、眼型等的人,而非无表情之人。
图4为示出在本发明一实施例的虚拟脸部生成装置中的虚拟脸部生成方式的图。
参照图4,当用作虚拟脸部的多人的脸部图像410作为源图像输入到虚拟脸部生成装置100的学习部200时,包含表情、嘴型、眨眼等信息的至少一人的背景脸部图像420作为背景图像输入。对此,在虚拟脸部生成装置100中,与原始图像进行比较并通过学习来生成虚拟脸部生成用模型。
之后,当在虚拟脸部生成装置100的推论部300输入一人的背景脸部图像420时,在虚拟脸部生成装置100中输出由通过多人的脸部图像410推论的脸部与一人的背景脸部图像420的特征合成而成的虚拟脸部图像430。在本实施例中,使用了各个图像,但可以代替各个图像来使用视频数据。
图5为示出本发明一实施例的虚拟脸部生成方法的流程图。
参照图5,在步骤S500中,当作为具有多个脸部源图像和脸部的特征信息的背景图像输入到虚拟脸部生成装置100的编码器110时,对其进行编码来向内网络部120传递。
在步骤S510中,在内网络部120中生成源图像分布区域和背景图像分布区域。而且,在步骤S520中,通过解码来复原图像,比较复原后的图像与原始图像来进行学习。
之后,在步骤S530中,当背景图像输入到虚拟脸部生成装置100的编码器110时,对其进行编码,在步骤S540中,通过学习了一次内网络部120的源图像和背景图像的网络。
而且,在步骤S550中,生成由通过解码器130解码并推论的源图像和背景图像的特征合成而成的虚拟人物的脸部的图像。
即,在现有的虚拟脸部生成方式中,直接生成可识别的特定人物的脸部,而无法生成新的人物,即使生成新的人物,其产物也随机生成,因此,存在无法始终使用一个虚拟人物的问题。
如图4所示,在本发明一实施例的使用人工智能的虚拟脸部生成方法中,当向在一个时间点学习的虚拟脸部生成装置100输入一个背景脸部图像或影像时,可以生成相同的虚拟人物,由于生成现有人物和其他虚拟人物,使得所生成的脸部并不局限于特定人物,因此,可以均克服瞄准特定人物的恶用事例和特定人物的肖像权问题。并且,以多人的数据为基础来使用案例的数量来组合之前未见过的新的虚拟人物,由此可以生成多种虚拟人物。结果,可通过虚拟人物的生成来解决过去因通过脸部合成技术生成特定艺人而导致的问题,因此,具有如下优点,即,可以积极使用脸部合成技术的先例,并且之后可用于电视剧、电影、新闻等多种内容中。
另一方面,本发明可以在计算机可读记录介质通过计算机可读代码实现。计算机可读记录介质包括存储能够通过计算机系统读取的数据的所有种类的记录装置。作为计算机可读记录介质的一例,包括ROM、RAM、CD-ROM、磁带、软盘、光数据存储装置等。
并且,计算机可读记录介质可分散在通过网络连接的计算机系统,从而可以通过分散方式存储并执行计算机可读代码。而且,用于体现本发明的功能性(functional)程序、代码、代码段可以由本发明所属技术领域的程序员轻松推论。
当对构成本发明的方法的步骤明确地记载顺序或没有相反的记载时,上述步骤可以按适当的顺序执行。本发明并不局限于上述步骤的记载顺序。
在本发明中,所有例或例示性术语(例如,等)的使用仅用于详细说明本发明,除非通过发明要求保护范围限定,本发明的范围并不局限于上述例或例示性术语。并且,对应技术领域的普通技术人员可以知道可在附加多种修改、组合及变更的发明要求保护范围或其等同技术方案的范畴内根据设计条件及要素(factor)构成。
因此,本发明的思想并不局限于上述说明的实施例,后述的发明要求保护范围和与其等同或等价变更的所有范围均属于本发明的思想范畴内。
如上所述,参照图中所示的实施例说明了本发明,但这仅为例示,只要是本发明所属技术领域的普通技术人员就可以进行多种变形及实施例的变形。因此,本发明的真正的技术保护范围通过附加的发明要求保护范围的技术思想定义。
Claims (8)
1.一种使用人工智能的虚拟脸部生成方法,其特征在于,
包括如下的步骤:
从虚拟脸部生成装置接收多个脸部源数据和至少一个脸部背景数据并通过深度学习来执行对于推论脸部与实际脸部的比较及学习;以及
接收一个脸部背景数据并通过经上述比较及学习的模型来生成由从多个上述脸部源数据推论的脸部与上述一个脸部背景数据的特征合成而成的世界上不存在的虚拟人物的脸部数据,
生成上述虚拟人物的脸部数据的步骤包括如下的步骤:
上述虚拟脸部生成装置的编码器接收一个脸部背景数据来进行编码;
在上述虚拟脸部生成装置的内网络部中,使经编码的上述数据通过经上述比较及学习的模型之后导出虚拟脸部的分布区域来将上述分布区域传递到上述虚拟脸部生成装置的解码器;以及
在上述虚拟脸部生成装置的解码器中生成包含从多个上述脸部源数据推论的世界上不存在的虚拟人物的脸部和背景脸部的特征在内的上述虚拟人物的脸部数据。
2.根据权利要求1所述的使用人工智能的虚拟脸部生成方法,其特征在于,执行上述比较及学习的步骤包括如下的步骤:
上述虚拟脸部生成装置的编码器接收多个上述脸部源数据和至少一个脸部背景数据来编码成多个卷积层;
在上述虚拟脸部生成装置的内网络部中,通过经编码的上述数据分别生成脸部源数据和脸部背景数据的分布区域;
在上述虚拟脸部生成装置的解码器中,将从上述内网络部传递的数据解码成多个解卷积层;以及
比较经解码的上述数据与原始数据来进行学习。
3.根据权利要求1所述的使用人工智能的虚拟脸部生成方法,其特征在于,上述脸部背景数据包含脸部内的表情、眼睛/鼻子/嘴型、眨眼中的至少一种。
4.根据权利要求1所述的使用人工智能的虚拟脸部生成方法,其特征在于,上述脸部数据为脸部图像或脸部影像。
5.一种使用人工智能的虚拟脸部生成装置,其特征在于,
包括:
学习部,接收多个脸部源数据和至少一个脸部背景数据并通过深度学习来执行对于推论脸部与实际脸部的比较及学习;以及
推论部,接收一个脸部背景数据并通过经上述比较及学习的模型来生成由从多个上述脸部源数据推论的脸部与上述一个脸部背景数据的特征合成而成的世界上不存在的虚拟人物的脸部数据,
上述推论部包括:
编码器,接收一个脸部背景数据来进行编码;
内网络部,使经编码的上述数据通过经上述比较及学习的模型之后导出虚拟脸部的分布区域来将上述分布区域传递到解码器;以及
上述解码器,通过解码来生成包含从多个上述脸部源数据推论的世界上不存在的虚拟人物的脸部和背景脸部的特征在内的上述虚拟人物的脸部数据。
6.根据权利要求5所述的使用人工智能的虚拟脸部生成装置,其特征在于,上述学习部包括:
编码器,接收多个上述脸部源数据和至少一个脸部背景数据来编码成多个卷积层;
内网络部,通过经编码的上述数据分别生成脸部源数据和脸部背景数据的分布区域;以及
解码器,将从上述内网络部传递的数据解码成多个解卷积层。
7.根据权利要求5所述的使用人工智能的虚拟脸部生成装置,其特征在于,上述脸部背景数据包含脸部内的表情、眼睛/鼻子/嘴型、眨眼中的至少一种。
8.根据权利要求5所述的使用人工智能的虚拟脸部生成装置,其特征在于,上述脸部数据为脸部图像或脸部影像。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020200154369A KR102395083B1 (ko) | 2020-11-18 | 2020-11-18 | 인공지능을 활용한 가상 얼굴 생성 방법 및 장치 |
KR10-2020-0154369 | 2020-11-18 | ||
PCT/KR2021/016658 WO2022108275A1 (ko) | 2020-11-18 | 2021-11-15 | 인공지능을 활용한 가상 얼굴 생성 방법 및 장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115053263A true CN115053263A (zh) | 2022-09-13 |
Family
ID=81591396
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180012895.9A Pending CN115053263A (zh) | 2020-11-18 | 2021-11-15 | 使用人工智能的虚拟脸部生成方法及装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20230343006A1 (zh) |
JP (1) | JP2023552251A (zh) |
KR (1) | KR102395083B1 (zh) |
CN (1) | CN115053263A (zh) |
WO (1) | WO2022108275A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102574021B1 (ko) | 2023-06-19 | 2023-09-04 | 이가람 | 인공지능 모델을 활용하여 영상 데이터 히스토리로부터 추출된 개인화된 이미지 기반으로 반응형 이미지 콘텐츠를 생성하는 방법, 장치 및 시스템 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20080106596A (ko) | 2007-03-22 | 2008-12-09 | 연세대학교 산학협력단 | 가상 얼굴 생성 방법 |
KR101558202B1 (ko) * | 2011-05-23 | 2015-10-12 | 한국전자통신연구원 | 아바타를 이용한 애니메이션 생성 장치 및 방법 |
KR20170050465A (ko) * | 2015-10-30 | 2017-05-11 | 에스케이텔레콤 주식회사 | 얼굴 인식 장치 및 방법 |
TW201931179A (zh) * | 2017-07-13 | 2019-08-01 | 美商美國資生堂公司 | 用於虛擬面部化妝之移除與模擬、快速面部偵測及標記追蹤、降低輸入視訊之延遲及振動的系統與方法,以及用於建議化妝之方法 |
TW202014992A (zh) * | 2018-10-08 | 2020-04-16 | 財團法人資訊工業策進會 | 虛擬臉部模型之表情擬真系統及方法 |
US11580395B2 (en) * | 2018-11-14 | 2023-02-14 | Nvidia Corporation | Generative adversarial neural network assisted video reconstruction |
KR102664688B1 (ko) * | 2019-02-19 | 2024-05-10 | 삼성전자 주식회사 | 가상 캐릭터 기반 촬영 모드를 제공하는 전자 장치 및 이의 동작 방법 |
US11568168B2 (en) * | 2019-04-08 | 2023-01-31 | Shutterstock, Inc. | Generating synthetic photo-realistic images |
-
2020
- 2020-11-18 KR KR1020200154369A patent/KR102395083B1/ko active IP Right Grant
-
2021
- 2021-11-15 CN CN202180012895.9A patent/CN115053263A/zh active Pending
- 2021-11-15 WO PCT/KR2021/016658 patent/WO2022108275A1/ko active Application Filing
- 2021-11-15 US US17/796,875 patent/US20230343006A1/en active Pending
- 2021-11-15 JP JP2022542742A patent/JP2023552251A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2022108275A1 (ko) | 2022-05-27 |
KR102395083B1 (ko) | 2022-05-10 |
JP2023552251A (ja) | 2023-12-15 |
US20230343006A1 (en) | 2023-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11727717B2 (en) | Data-driven, photorealistic social face-trait encoding, prediction, and manipulation using deep neural networks | |
CN111861945B (zh) | 一种文本引导的图像修复方法和系统 | |
CN110738153A (zh) | 异质人脸图像转换方法、装置、电子设备及存储介质 | |
Baek et al. | Generative adversarial ensemble learning for face forensics | |
Liu et al. | Digital cardan grille: A modern approach for information hiding | |
JP2023541745A (ja) | 顔画像処理方法、顔画像処理モデルの訓練方法、装置、機器、及びコンピュータプログラム | |
CN114282013A (zh) | 一种数据处理方法、装置及存储介质 | |
CN115858726A (zh) | 基于互信息方法表示的多阶段多模态情感分析方法 | |
CN115053263A (zh) | 使用人工智能的虚拟脸部生成方法及装置 | |
WO2022166840A1 (zh) | 人脸属性编辑模型的训练方法、人脸属性编辑方法及设备 | |
CN116977457A (zh) | 一种数据处理方法、设备以及计算机可读存储介质 | |
CN117151990B (zh) | 一种基于自注意力编码解码的图像去雾方法 | |
CN113538254A (zh) | 图像恢复方法、装置、电子设备及计算机可读存储介质 | |
CN112990123B (zh) | 图像处理方法、装置、计算机设备和介质 | |
CN113205044B (zh) | 一种基于表征对比预测学习的深度伪造视频检测方法 | |
Teng et al. | Unimodal face classification with multimodal training | |
WO2022252372A1 (zh) | 一种图像处理方法、装置、设备及计算机可读存储介质 | |
CN114694065A (zh) | 视频处理方法、装置、计算机设备及存储介质 | |
CN114612991A (zh) | 攻击人脸图片的转换方法及装置、电子设备及存储介质 | |
Li et al. | An image watermark removal method for secure internet of things applications based on federated learning | |
CN115002294B (zh) | 一种秘密图像无密钥提取方法及相关设备 | |
CN116704588B (zh) | 面部图像的替换方法、装置、设备及存储介质 | |
Salman et al. | Detection of Fake Colorized Images based on Deep Learning | |
EP3985568A1 (en) | Method and apparatus for anonymizing personal information | |
KR20220128181A (ko) | 인공신경망을 활용하여 다양한 표정을 가지는 가상의 얼굴 생성 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20220913 |