CN112734657A

CN112734657A - 基于人工智能和三维模型的云合影方法、装置及存储介质

Info

Publication number: CN112734657A
Application number: CN202011584123.6A
Authority: CN
Inventors: 杨文龙
Original assignee: Individual
Current assignee: Individual
Priority date: 2020-12-28
Filing date: 2020-12-28
Publication date: 2021-04-30
Anticipated expiration: 2040-12-28
Also published as: CN112734657B

Abstract

本发明公开了一种基于人工智能和三维模型的云合影方法、装置及存储介质。方法包括：根据拍摄要求，选取或获取背景场景三维模型和每一合影者的人员三维模型；确定三维拍摄场景及各合影人员模型姿态；在三维拍摄场景中，选择光照条件及拍摄角度拍摄待处理照片；将待处理照片输入预先训练的照片真实化模型，得到真实化照片。可选的，以上操作中需要用到的用户相关的数据或模型，需要用户针对指定合影授权之后才可使用。本发明实施例，优点如下：(1)合影效果类似于真实到场，贴合每个人真实的物理属性，相对于直接抠图或者直接使用GAN生成的方式，效果更好。(2)没有地理位置、用户拍照姿势及拍照同步性的硬性要求，只需要用户授权即可。

Description

基于人工智能和三维模型的云合影方法、装置及存储介质

技术领域

本发明涉及计算机软件技术领域，具体涉及一种基于人工智能和三维模型的云合影方法、装置及存储介质。

背景技术

由于疫情的影响，人们无法出门自由活动，这就给一些需要参加毕业典礼或者社交活动的人带来了不便，目前没有成型的好的不到场的合影方法：目前的合影方法基本是不同的个人照片拼凑在一起，没有场景、体型大小不同、集体表情等特征，给人没有合影的感觉，起不到纪念的作用。如图1所示，现有的云合影方案存在以下问题：(1)不够正式；(2)照片中各个人没有统一的场景或者背景，比较杂乱；(3)各个人的体型姿态差异无法体现；(4)有统一背景，又没有集体统一(或者配合)的表情或者动作(一起笑、一起喊、一起做鬼脸等)；(5)不能凸显是本人授权的合影。

发明内容

针对上述技术缺陷，本发明实施例的目的在于提供一种基于人工智能和三维模型的云合影方法、装置及存储介质。

为实现上述目的，第一方面，本发明实施例提供了一种基于人工智能和三维模型的云合影方法，包括：

根据拍摄要求，选取或获取背景场景三维模型和每一合影者的人员三维模型；

根据所述背景场景三维模型和人员三维模型确定三维拍摄场景；

在所述三维拍摄场景中，选择光照条件及拍摄角度拍摄待处理照片；所述待处理照片为包括多个合影者的二维模型图片；

接收每一合影者的授权，将所述待处理照片输入预先训练的照片真实化模型，得到真实化照片。

作为本申请的一种具体实施方式，获取每一合影者的人员三维模型具体包括：

采用传感器采集方式获取每一合影者的人员三维模型；或

采用深度学习算法从单张或多张二维图片中生成。

作为本申请的一种具体实施方式，确定三维拍摄场景具体包括：

将所述人员三维模型放入所述背景场景三维模型中；

在所述背景场景三维模型中，接收每一合影者对所述人员三维模型的编辑操作，以得到整体的三维拍摄场景；所述编辑操作包括每一合影者的人员三维模型在背景场景模型中的站姿、手势、表情和位置等。

优选地，在本申请的一优选实施方式中，得到真实化照片之后，所述云合影方法还包括：

接收各个合影者对所述真实化图片中自己图像部分的美化操作；所述美化操作包括美颜处理、图像微调或表情变换；

接收合影负责人对各个合影者对自己部分美化之后整体效果的修改或确认。

进一步地，在本申请的某些优选实施中，所述云合影方法还包括训练模型照片真实化模型和表情变换模型，具体为：

获取合影者的真实照片及个人三维模型，采用所述真实照片及个人三维模型训练得到所述照片真实化模型；

采用所述真实照片训练得到所述表情表换模型；

其中，所述照片真实化模型包括条件生成器和判别器1，所述判别器1为照片真实度判别器，用于判断真实照片是否真实；或

所述照片真实化模型包括条件生成器、判别器1和判别器2，所述判别器1为照片真实度判别器，用于判断真实照片是否真实，所述判别器2为人脸身份及位置识别器，用于识别真实化后图片中的人脸及位置，并将人脸及位置与真值进行比较判别；所述真值由所述三维拍摄场景所确定；或

所述照片真实化模型包括条件生成器、判别器1、判别器2和判别器3，所述判别器1为照片真实度判别器，用于判断真实照片是否真实，所述判别器2为人脸身份及位置识别器，用于识别真实化后图片中的人脸及位置，并将人脸及位置与真值进行比较判别；所述真值由所述三维拍摄场景所确定；所述判别器3为人物属性识别器，用于识别真实化后图片中的对应人物的性别、年龄、身高及人种。

类似的及可选的，可以根据需要添加新的判别器用以检查真实化后图片的某些其他属性是否正确。

第二方面，本发明实施例提供了一种基于人工智能和三维模型的云合影装置，包括：

获取单元，用于根据拍摄要求，选取或获取背景场景三维模型和每一合影者的人员三维模型；

确定单元，用于根据所述背景场景三维模型和人员三维模型确定三维拍摄场景；

拍摄单元，用于所述三维拍摄场景中，选择光照条件及拍摄角度拍摄待处理照片；所述待处理照片为包括多个合影者的二维模型图片；

处理单元，用于接收每一合影者的授权，将所述待处理照片输入预先训练的模型照片真实化模型，得到真实化照片。

第三方面，本发明实施例还提供了另一种基于人工智能和三维模型的云合影装置，包括处理器、输入设备、输出设备和存储器，所述处理器、输入设备、输出设备和存储器相互连接，其中，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行上述第一方面的方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，其内存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行上述第一方面的方法。

实施本发明实施例，主要有以下优点：

(1)合影效果类似于真实到场，用户体验好、甚至可能可以达到比实际拍照更好的效果。

(2)相对于直接抠图合影的方式，可以有更好更真实的相对比例(人与人之间、人与物之间等)、互动性(比如不同合影人之间的遮挡、协同动作、搂抱等)、更加一致的光影效果，效果更好。

(3)相对于直接使用GAN(对抗生成网络)生成的照片，更加贴合每个人真实的物理属性(身高、体态等)。

(4)没有地理位置、用户拍照姿势及拍照同步性的硬性要求，只需要用户授权即可。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。

图1是现有技术中云合影的界面图；

图2是本发明实施例提供的基于人工智能和三维模型的云合影方法的一种流程图；

图3是人体三维模型示例图；

图4是场景建模示例图；

图5是模型照片真实化模型训练流程图；

图6是不同表情变换方法效果对比图；

图7是本发明第一实施例提供的基于人工智能和三维模型的云合影装置的结构图；

图8是本发明第二实施例提供的基于人工智能和三维模型的云合影装置的结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

本发明的主要技术原理如下：

·使用单目相机、双目相机或者深度相机，检测拍照人员的(可选：保持特定表情的)三维模型(包含身高体重等信息)

·将各个人员的三维模型放到统一的场景(背景)当中，场景可以是三维也可以是二维的

·选取不同拍照点及拍照角度，拍摄多张照片

·使用深度学习技术，将拍摄的照片进行细节重建，形成质量较高的清晰的照片

·如必要，使用深度学习技术，对照片中(全部或者部分)人员表情进行变换(变换到统一风格等)

·可选进行图像后处理或者美颜等后处理操作。

请参考图2，本发明实施例提供的基于人工智能和三维模型的云合影方法，可以包括如下步骤：

S101，根据拍摄要求，选取或获取背景场景三维模型和每一合影者的人员三维模型。

其中，拍摄要求包括正式或轻松、着装要求以及表情姿态等。

具体地，各个合影者使用传感器获取自己的人员三维模型或系统用深度学习算法从二维照片生成各个合影者的人员三维模型。

其中，传感器采集可采用光学扫描仪、激光雷达、(单目、双目等)相机或者几种传感器相融合等多种方式。

进一步地，根据摄像头三维扫描生成的人体三维模型示例如图3和4所示。

进一步地，激光雷达或激光雷达与摄像头融合的方式请参考：

https://www.ednchina.com/news/5942.html

https://baijiahao.baidu.com/s？id＝1680498261851454168&wfr＝spider&for＝pc

进一步地，背景场景三维模型的选取如下：

场景建模的三维模型可以使用虚拟的三维场景，也可以使用摄像头或激光雷达等传感器到实际场景进行三维建模(用类似上面的方法)。场景建模如图5所示。

S102，根据所述背景场景三维模型和人员三维模型确定三维拍摄场景。

具体地，步骤S102包括：

将所述人员三维模型放入所述背景场景三维模型中；

即，每个合影者选择自己模型在背景三维场景模型中的站姿、手势、表情及位置等。

S103，预览三维拍摄场景的整体效果，接收合影负责人对所述整体效果的修改或确认。

具体地，预览整体效果，例如每个人位置或站姿等，进一步修改或者确认。

S104，在所述三维拍摄场景中，选择光照条件及拍摄角度拍摄待处理照片。

其中，所述待处理照片为包括多个合影者的二维模型图片。

S105，接收每一合影者的授权，将所述待处理照片输入预先训练的真实化模型，得到真实化照片。

具体地，在执行步骤S105之前，需要先训练真实化模型和表情变换模型。

真实化模型是一个(条件)生成模型，其中的(条件)生成器可以使用(条件)VAE(Variational Auto Encoder)或者(条件)GAN(Generative Adversarial Networks)等方法。图5为使用GAN的方法示例，其中有一个条件生成器和三个判别器。

判别器1为照片真实度判别器，用于判断照片是否足够真实，不需要标签数据，也不需要训练照片一一对应，真的真实照片和假的真实照片一起直接送入训练即可；

判别器2是由人脸身份及位置识别器(使用真实照片数据训练，用于识别真实照片中的人脸及位置)加上真值比较模块组成。其中，真值是模型照片中实际的人脸及位置，因为是模型照片是三维模型中生成的，所以这些信息可以直接从三维模型中计算出来。如果识别器从假的真实照片中识别出的结果与真值一致，说明生成的假的真实照片的真实度高。

判别器3由人物属性识别器(使用真实照片数据训练，用于识别真实照片中的对应人物的性别、年龄、身高及人种等人物属性)加上真值比较的模块组成。真值由对应用户自己上传获得。

在图5中，照片真实度判别器为必须，其他两个判别器为可选(人物属性输入也为可选)。具体地，在进行模型训练时，首先使用真实照片集及三维模型信息训练条件生成器及判别器，待训练完成之后，在具体使用时，只需要使用(条件)生成器即可。

S106，接收各个合影者对所述真实化图片中自己图像部分的美化操作。

S107，接收合影负责人对各个合影者对自己部分美化之后整体效果的修改或确认。

具体地，如有必要，进一步做美颜、图像微调或者表情变换等后处理操作。

其中，表情变换可采用表情变换模型，例如StarGAN等。不同表情变换方法效果对比如图6所示。

可选的，在本发明中，合影需要参与的每个人授权(指纹识别或密码等较安全的授权方式)之后才能使用(将这个参与人添加到合影当中去)。其中授权主要是针对：基于用户真实照片训练的、其输出可能涉及到用户隐私信息的(比如人脸)的一些模型，如照片真实化模型、及表情变换模型等需加密，仅供本人授权之后才可针对指定合影或照片使用。

照片真实化模型(人脸识别器需要用到至少一张用户照片)、表情变换模型(需要用到多张用户照片)及人脸识别模型只需要用户上传一定量的自己真实照片即可(或者直接经用户授权后，在之前的视频会议中采集相应视频图片即可)；如果能提前上传用户自己的三维模型用于照片真实化模型的训练，效果更佳。需要说明的是，该步骤只是为了模型训练使用，并且为可选，如果需要用到“人脸识别及位置判别器”或者“表情变换模型”，用户就需要提前上传一些自己的照片，这些照片不需要与真正云拍照时的场景相同，只要是正面照即可。

与现有技术相比，实施本发明实施例的基于人工智能和三维模型的云合影方法，主要有以下优点：

基于相同的发明构思，本发明实施例还提供一种基于人工智能和三维模型的云合影装置。如图7所示，该装置包括：

获取单元10，用于根据拍摄要求，选取或获取背景场景三维模型和每一合影者的人员三维模型；

确定单元11，用于根据所述背景场景三维模型和人员三维模型确定三维拍摄场景；

拍摄单元12，用于所述三维拍摄场景中，选择光照条件及拍摄角度拍摄待处理照片；所述待处理照片为包括多个合影者的二维模型图片；

处理单元13，用于接收每一合影者的授权，将所述待处理照片输入预先训练的模型照片真实化模型，得到真实化照片。

具体地，获取单元10用于：

采用传感器采集方式获取每一合影者的人员三维模型；或

采用深度学习算法从单张或多张二维图片中生成每一合影者的人员三维模型。

具体地，确定单元11用于：

将所述人员三维模型放入所述背景场景三维模型中；

进一步地，处理单元13还用于：

预览所述三维拍摄场景的整体效果；

接收合影负责人对所述整体效果的修改或确认。

进一步地，处理单元13还用于：

进一步地，上述装置还包括训练单元，用于训练照片真实化模型和表情变换模型，具体为：

采用同一人的多张不同表情的真实照片训练表情变换模型；

类似的及可选的，可以根据需要添加新的判别器用以检查真实化后图片的某些其他已知属性是否正确。

可选地，如图8所示，本发明基于人工智能和三维模型的云合影装置可以包括：一个或多个处理器101、一个或多个输入设备102、一个或多个输出设备103和存储器104，上述处理器101、输入设备102、输出设备103和存储器104通过总线105相互连接。存储器104用于存储计算机程序，所述计算机程序包括程序指令，所述处理器101被配置用于调用所述程序指令执行上述方法实施例部分的方法。

应当理解，在本发明实施例中，所称处理器101可以是中央处理单元(CentralProcessing Unit，CPU)、GPU及特殊AI芯片，该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application SpecificIntegrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

输入设备102可以包括键盘等，输出设备103可以包括显示器(LCD等)、扬声器等。

该存储器104可以包括只读存储器和随机存取存储器，并向处理器101提供指令和数据。存储器104的一部分还可以包括非易失性随机存取存储器。例如，存储器104还可以存储设备类型的信息。

具体实现中，本发明实施例中所描述的处理器101、输入设备102、输出设备103可执行本发明实施例提供的基于人工智能和三维模型的云合影方法的实施例中所描述的实现方式，在此不再赘述。

需要说明的是，关于本实施例中系装置的更为具体的描述，请参考前述方法实施例，在此不再赘述。

相应地，本发明实施例提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令被处理器执行时实现：上述基于人工智能和三维模型的云合影方法。

所述计算机可读存储介质可以是前述任一实施例所述的系统的内部存储单元，例如系统的硬盘或内存。所述计算机可读存储介质也可以是所述系统的外部存储设备，例如所述系统上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(SecureDigital,SD)卡，闪存卡(Flash Card)等。进一步地，所述计算机可读存储介质还可以既包括所述系统的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述系统所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接，也可以是电的，机械的或其它的形式连接。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-OnlyMemory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种基于人工智能和三维模型的云合影方法，其特征在于，包括：

2.如权利要求1所述的云合影方法，其特征在于，获取每一合影者的人员三维模型具体包括：

采用传感器采集方式获取每一合影者的人员三维模型；或

3.如权利要求1所述的云合影方法，其特征在于，确定三维拍摄场景具体包括：

将所述人员三维模型放入所述背景场景三维模型中；

在所述背景场景三维模型中，接收每一合影者对自己的所述人员三维模型的编辑操作，以得到整体的三维拍摄场景；所述编辑操作包括每一合影者的人员三维模型在背景场景模型中的站姿、手势、表情和位置。

4.如权利要求3所述的云合影方法，其特征在于，确定三维拍摄场景之后，所述云合影方法还包括：

预览所述三维拍摄场景的整体效果；

接收合影负责人对所述整体效果的修改或确认。

5.如权利要求4所述的云合影方法，其特征在于，得到真实化照片之后，所述云合影方法还包括：

6.如权利要求1所述的云合影方法，其特征在于，所述云合影方法还包括训练照片真实化模型和表情变换模型，具体为：

采用所述真实照片训练得到所述表情表换模型；

所述照片真实化模型包括条件生成器、判别器1、判别器2和判别器3，所述判别器1为照片真实度判别器，用于判断真实照片是否真实；所述判别器2为人脸身份及位置识别器，用于识别真实化后图片中的人脸及位置，并将人脸及位置与真值进行比较判别，所述真值由所述三维拍摄场景所确定；所述判别器3为人物属性识别器，用于识别真实化后图片中的对应人物的性别、年龄、身高及人种。

7.一种基于人工智能和三维模型的云合影装置，其特征在于，包括：

8.如权利要求7所述的云合影装置，其特征在于，所述云合影装置还包括训练单元，用于训练模型照片真实化模型和表情变换模型，具体为：

采用所述真实照片训练得到所述表情表换模型；

9.一种基于人工智能和三维模型的云合影装置，其特征在于，包括处理器、输入设备、输出设备和存储器，所述处理器、输入设备、输出设备和存储器相互连接，其中，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行如权利要求1-6任一项所述的方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行如权利要求1-5任一项所述的方法。