CN113824877A

CN113824877A - 一种全景深图像合成方法、存储介质及智能手机

Info

Publication number: CN113824877A
Application number: CN202110953450.2A
Authority: CN
Inventors: 朱晓璞
Original assignee: Huizhou TCL Cloud Internet Corp Technology Co Ltd
Current assignee: Huizhou TCL Cloud Internet Corp Technology Co Ltd
Priority date: 2021-08-19
Filing date: 2021-08-19
Publication date: 2021-12-21
Anticipated expiration: 2041-08-19
Also published as: US20240331096A1; CN113824877B; WO2023020190A1; EP4391520A1

Abstract

本发明公开了一种全景深图像合成方法、存储介质及智能手机，其中，所述全景深图像合成方法包括步骤：在拍照时，分别对焦锁定至人脸和镜头最远处，对应获取第一图像(人脸对焦图像)和第二图像(远景对焦图像)；对所述第一图像进行人像分割处理，获得人像区域图像；将所述人像区域图像与所述第二图像进行对齐融合，得到融合图像。本发明通过两次对焦拍照，分别用人像对焦和远景对焦拍照，将人脸对焦图像进行AI人像分割并融合至远景对焦图像上，从而实现全景深范围内人像和背景均清晰。

Description

一种全景深图像合成方法、存储介质及智能手机

技术领域

本发明涉及图像合成技术领域，特别涉及一种全景深图像合成方法、存储介质及智能手机。

背景技术

目前智能手机设备的前置自拍摄像头均搭载了自动对焦功能，这可以有效提升拍照时人脸的清晰度。但是由于前置摄像头的景深范围有限，当对焦点在人脸时，背景画面将处在有效景深之外，从而导致背景会出现虚化的现象。

因此，现有技术还有待于改进和发展。

发明内容

本发明要解决的技术问题在于，针对现有技术的不足，提供一种全景深图像合成方法、存储介质及智能手机，旨在解决现有前置摄像头的对焦点在人脸时，背景画面将处在有效景深之外，从而导致背景会出现虚化的问题。

为了解决上述技术问题，本发明所采用的技术方案如下：

一种全景深图像合成方法，其中，包括步骤：

在拍照时，分别对焦锁定至人脸和镜头最远处，对应获取第一图像和第二图像；

对所述第一图像进行人像分割处理，获得人像区域图像；

将所述人像区域图像与所述第二图像进行对齐融合，得到融合图像。

所述的全景深图像合成方法，其中，所述第一图像为人脸对焦图像，获取所述人脸对焦图像的步骤包括：

启动摄像头并检测摄像头预览镜头下是否含有人脸数据；

若检测到所述摄像头预览镜头下含有人脸数据，则启动人脸对焦模式进行拍照，获得人脸对焦图像。

所述的全景深图像合成方法，其中，所述第二图像为远景对焦图像，获取所述远景对焦图像的步骤包括：

在启动人脸对焦模式进行拍照获得人脸对焦图像后，再启动远景对焦模式进行拍照，获得远景对焦图像。

所述的全景深图像合成方法，其中，还包括步骤：

若检测到所述摄像头预览镜头下不含有人脸数据，则启动近景对焦模式，获得近景图像。

所述的全景深图像合成方法，其中，对所述第一图像进行人像分割处理，获得人像区域图像的步骤包括：

采用标注过的包含人脸的图像数据作为训练样本对图像分割神经网络进行训练，得到训练后图像分割神经网络；

将第一图像输入所述训练后图像分割神经网络进行图像分割，得到人像区域图像。

所述的全景深图像合成方法，其中，采用标注过的包含人脸的图像数据作为训练图像对图像分割神经网络进行训练，得到训练后图像分割神经网络的步骤包括：

利用图像分割网络获取训练图像中的至少一个人像所在的目标区域，并获取所述目标区域中的需要分割的人像的位置信息，其中，所述训练图像中标注有需要分割的人像的位置标注信息；

基于所述需要分割的人像的位置信息和所述需要分割的人像的位置标注信息，对所述图像分割神经网络进行训练，得到训练后图像分割神经网络。

所述的全景深图像合成方法，其中，将第一图像输入所述训练后图像分割神经网络进行图像分割，得到人像区域图像的步骤包括：

获取所述第一图像；

利用训练后图像分割神经网络获取第一图像中的至少一个人像所在的目标区域，并获取所述目标区域中的需要分割的人像的位置信息，基于所述人像的位置信息获得所述人像区域图像。

所述的全景深图像合成方法，其中，将所述人像区域图像与所述第二图像进行对齐融合，得到融合图像的步骤包括：

采用像素对齐算法，计算所述人像区域图像相对所述第二图像的偏移，在所述第二图像的对应像素上进行人像区域图像的像素替换，得到所述融合图像。

一种存储介质，其中，其特征在于，所述存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现本发明全景深图像合成方法中的步骤。

一种智能手机，其中，包括处理器，适于实现各指令；以及存储介质，适于存储多条指令，所述指令适于由处理器加载并执行本发明全景深图像合成方法中的步骤。

有益效果：本发明提出了一种全景深图像合成方法，在拍照时，分别对焦锁定至人脸和镜头最远处，对应获取第一图像(人脸对焦图像)和第二图像(远景对焦图像)；对所述第一图像进行人像分割处理，获得人像区域图像；将所述人像区域图像与所述第二图像进行对齐融合，得到融合图像。本发明通过两次对焦拍照，分别用人像对焦和远景对焦拍照，将人脸对焦图像进行AI人像分割并融合至远景对焦图像上，从而实现全景深范围内人像和背景均清晰。

附图说明

图1为一种全景深图像合成方法的流程图。

图2为本发明一种智能手机的原理框图。

具体实施方式

本发明提供一种全景深图像合成方法、存储介质及智能手机，为使本发明的目的、技术方案及效果更加清楚、明确，以下参照附图并举实施例对本发明进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解，当我们称元件被“连接”或“耦接”到另一元件时，它可以直接连接或耦接到其他元件，或者也可以存在中间元件。此外，这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。

本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语(包括技术术语和科学术语)，具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语，应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样被特定定义，否则不会用理想化或过于正式的含义来解释。

请参阅图1，图1为本发明提供的一种全景深图像合成方法的较佳实施例流程图，如图所示，其包括步骤：

S10、在拍照时，分别对焦锁定至人脸和镜头最远处，对应获取第一图像和第二图像；

S20、对所述第一图像进行人像分割处理，获得人像区域图像；

S30、将所述人像区域图像与所述第二图像进行对齐融合，得到融合图像。

本实施例在拍照过程中，通过两次对焦拍照，分别用人脸对焦和远景对焦拍照对应得到第一图像(人脸对焦图像)和第二图像(远景对焦图像)，然后将人脸对焦图像进行AI人像分割并融合至远景对焦图像上，得到融合图像，从而实现全景深范围内人像和背景均清晰。

在一些实施方式中，所述第一图像为人脸对焦图像，获取所述人脸对焦图像的步骤包括：启动摄像头并检测摄像头预览镜头下是否含有人脸数据；若检测到所述摄像头预览镜头下含有人脸数据，则启动人脸对焦模式进行拍照，获得人脸对焦图像；若检测到所述摄像头预览镜头下不含有人脸数据，则启动近景对焦模式，获得近景图像。

在一些实施方式中，所述第二图像为远景对焦图像，获取所述远景对焦图像的步骤包括：在启动人脸对焦模式进行拍照获得人脸对焦图像后，再启动远景对焦模式进行拍照，获得远景对焦图像。本实施例中，所述远景对焦模式通常是指对焦推进至镜头的最远处，待对焦收敛后进行拍照。

在一些实施方式中，所述步骤S20、对所述第一图像进行人像分割处理，获得人像区域图像具体包括：

S21、采用标注过的包含人脸的图像数据作为训练样本对图像分割神经网络进行训练，得到训练后图像分割神经网络；

S22、将第一图像输入所述训练后图像分割神经网络进行图像分割，得到人像区域图像。

本实施例提出一个端到端可训练的神经网络来实现图像的分割处理，将这个端到端可训练的神经网络称为图像分割神经网络。采用本发明实施例的图像分割神经网络对第一图像(人脸对焦图像)中的人像进行分割处理，主要包括以下两步：1)将第一图像划分成多个区段，预测每个区段内覆盖所有人像的ROI，这里，ROI是指在需要处理的图像中以方框、圆、椭圆、不规则多边形等方式勾勒出需要处理的区域，以便进行后续2)中的处理；2)提取每个ROI内的特征，对每个人像的位置进行精确定位。本发明实施例的图像分割神经网络可以应用但不局限于以下场景：

场景一：用户将采集到的包含人像的第一图像通过网络传输到云端，由云端采用本发明实施例的图像分割神经网络对图像进行分割处理。

场景二：用户将采集到的包含人像的第一图像输入到本地计算机设备中，由计算机设备采用本发明实施例的图像分割神经网络对图像进行分割处理。

在一些实施方式中，采用标注过的包含人脸的图像数据作为训练图像对图像分割神经网络进行训练，得到训练后图像分割神经网络的步骤包括：利用图像分割网络获取训练图像中的至少一个人像所在的目标区域，并获取所述目标区域中的需要分割的人像的位置信息，其中，所述训练图像中标注有需要分割的人像的位置标注信息；基于所述需要分割的人像的位置信息和所述需要分割的人像的位置标注信息，对所述图像分割神经网络进行训练，得到训练后图像分割神经网络。

具体来讲，训练图像的数量越多，图像分割神经网络的训练结果越好，另一方面，训练图像的数量越多，需要消耗的计算机资源越多。实际应用中，可以准备数百张或更多的包含有人脸的图像作为训练图像，同时，需要获取训练图像中需要分割的人像的位置标注信息，例如：将需要分割的人像所对应的像素用任意方式表示出来，例如将不同的人像用不同的颜色标识出来，人像的位置标注信息可以由能识别出人像的人通过图形编辑工具来标注出。进一步，需要将位置标注信息转化成需要的格式，从而后续可以通过该位置标注信息来获得标注的人像在训练图像中的位置，这里，将位置标注信息转化成需要的格式包括但不限于热度图、坐标点等。

在本实施例中，所述图像分割神经网络至少包括第一子网络、第二子网络和第三子网络，利用所述第一子网络获取所述训练图像的特征图，利用所述第二子网络对所述训练图像的特征图进行处理，得到训练图像中的至少一个人像所在的目标区域，利用所述第三子网络获取所述目标区域中的需要分割的人像的位置信息。

本实施例中，所述第一子网络的结构不做限定，以分割OCT图像中的视网膜神经层，使用VGG16卷积神经网络为例，将训练图像通过网络的conv1层至conv5层进行处理，得到W×H×C的特征图，其中，W×H为特征图的空间尺寸，C为特征图的通道数。

本实施例中，通过所述第二子网络将所述样本图像按照目标方向划分成多个区段，所述目标方向至少包括垂直方向或水平方向；分别针对所述多个区段中的任一区段，在所述任一区段中确定所述至少一个人像对应的ROI，所述ROI通过第一边界和第二边界确定，所述第一边界和第二边界的方向垂直于所述目标方向；基于所述多个区段中的ROI，确定至少一个人像所在的目标区域。这里，多个区段可以是垂直方向排布的等宽区段，或者水平方向排布的等宽区段；通过第一子网络预测图像的每个等宽区段中覆盖全部人像的区域，作为ROI。这里，预测ROI的方式包括但不局限于回归预测热度图、回归预测坐标、滑窗预测。

本实施例中，通过所述第三子网络分别针对所述多个区段中的任一区段，对所述任一区段中的ROI进行特征提取，基于特征提取结果生成固定高度的特征向量；基于所述固定高度的特征向量，获取所述任一区段中的需要分割的人像的位置信息。这里，通过ROIAlign层或ROI Pooling层从特征图中提取ROI区域的特征，将特征映射到固定高度的特征向量，从而预测每个ROI区域中人像的精确位置，这里，预测人像的精确位置的方式包括但不局限于回归预测热度图、回归预测坐标、滑窗预测。其中，所述目标区域中的需要分割的人像的个数为一个或多个。若ROI中有多个人像，则对每个人像的精确位置分别进行预测。

在一些实施方式中，基于所述需要分割的人像的位置信息和所述需要分割的人像的位置标注信息，对所述图像分割神经网络进行训练，得到训练后图像分割神经网络。

具体来讲，将上述步骤中预测的人像的位置信息输入到损失层，损失层可以根据预测的人像的位置信息来调整图像分割神经网络的参数值，从而对所述图像分割神经网络的参数值进行训练。具体地，基于所述需要分割的人像的位置信息和所述需要分割的人像的位置标注信息，获取第一损失函数值；确定所述第一损失函数值是否满足第一预设条件；响应于所述第一损失函数值不满足第一预设条件，基于所述第一损失函数值对所述图像分割神经网络的参数值进行调整，然后迭代执行如下操作，直至所述第一损失函数值满足第一预设条件：利用图像分割神经网络中的第二子网络获取训练图像中的至少一个人像所在的目标区域，利用所述图像分割神经网络中的第三子网络获取所述目标区域中的需要分割的人像的位置信息。

在一些实施方式中，将第一图像输入所述训练后图像分割神经网络进行图像分割，得到人像区域图像的步骤包括：获取所述第一图像；利用训练后图像分割神经网络获取第一图像中的至少一个人像所在的目标区域，并获取所述目标区域中的需要分割的人像的位置信息，基于所述人像的位置信息获得所述人像区域图像。

本实施例中，所述获取第一图像中的至少一个人像所在的目标区域，包括：将所述第一图像按照目标方向划分成多个区段，所述目标方向至少包括垂直方向或水平方向；分别针对所述多个区段中的任一区段，在所述任一区段中确定所述至少一个人像对应的ROI，所述ROI通过第一边界和第二边界确定，所述第一边界和第二边界的方向垂直于所述目标方向；基于所述多个区段中的ROI，确定至少一个人像所在的目标区域。

本实施例中，所述获取所述目标区域中的需要分割的人像的位置信息，包括：分别针对所述多个区段中的任一区段，对所述任一区段中的ROI进行特征提取，基于特征提取结果生成固定高度的特征向量；基于所述固定高度的特征向量，获取所述任一区段中的需要分割的人像的位置信息。

在一些实施方式中，将所述人像区域图像与所述第二图像进行对齐融合，得到融合图像的步骤包括：采用像素对齐算法，计算所述人像区域图像相对所述第二图像的偏移，在所述第二图像的对应像素上进行人像区域图像的像素替换，得到所述融合图像。

本发明通过两次对焦拍照，分别用人像对焦和远景对焦拍照，将人脸对焦图像进行AI人像分割并融合至远景对焦图像上，从而实现全景深范围内人像和背景均清晰。

在一些实施方式中，还提供一种存储介质，其中，所述存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现本发明全景深图像合成方法中的步骤。

在一些实施方式中，还提供一种智能手机，如图2所示，其包括至少一个处理器(processor)20；显示屏21；以及存储器(memory)22，还可以包括通信接口(CommunicationsInterface)23和总线24。其中，处理器20、显示屏21、存储器22和通信接口23可以通过总线24完成相互间的通信。显示屏21设置为显示初始设置模式中预设的用户引导界面。通信接口23可以传输信息。处理器20可以调用存储器22中的逻辑指令，以执行上述实施例中的方法。

此外，上述的存储器22中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。

存储器22作为一种计算机可读存储介质，可设置为存储软件程序、计算机可执行程序，如本公开实施例中的方法对应的程序指令或模块。处理器20通过运行存储在存储器22中的软件程序、指令或模块，从而执行功能应用以及数据处理，即实现上述实施例中的方法。

存储器22可包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据终端设备的使用所创建的数据等。此外，存储器22可以包括高速随机存取存储器，还可以包括非易失性存储器。例如，U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等多种可以存储程序代码的介质，也可以是暂态存储介质。

此外，上述存储介质以及终端设备中的多条指令处理器加载并执行的具体过程在上述方法中已经详细说明，在这里就不再一一陈述。

包括处理器，适于实现各指令；以及存储介质，适于存储多条指令，所述指令适于由处理器加载并执行本发明所述全景深图像合成方法中的步骤。

其中，包括处理器，适于实现各指令；以及存储介质，适于存储多条指令，所述指令适于由处理器加载并执行本发明所述全景深图像合成方法中的步骤。

综上所述，本发明提出了一种全景深图像合成方法，在拍照时，分别对焦锁定至人脸和镜头最远处，对应获取第一图像(人脸对焦图像)和第二图像(远景对焦图像)；对所述第一图像进行人像分割处理，获得人像区域图像；将所述人像区域图像与所述第二图像进行对齐融合，得到融合图像。本发明通过两次对焦拍照，分别用人像对焦和远景对焦拍照，将人脸对焦图像进行AI人像分割并融合至远景对焦图像上，从而实现全景深范围内人像和背景均清晰。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种全景深图像合成方法，其特征在于，包括步骤：

对所述第一图像进行人像分割处理，获得人像区域图像；

2.根据权利要求1所述的全景深图像合成方法，其特征在于，所述第一图像为人脸对焦图像，获取所述人脸对焦图像的步骤包括：

启动摄像头并检测摄像头预览镜头下是否含有人脸数据；

3.根据权利要求2所述的全景深图像合成方法，其特征在于，所述第二图像为远景对焦图像，获取所述远景对焦图像的步骤包括：

4.根据权利要求2所述的全景深图像合成方法，其特征在于，还包括步骤：

5.根据权利要求2所述的全景深图像合成方法，其特征在于，对所述第一图像进行人像分割处理，获得人像区域图像的步骤包括：

6.根据权利要求5所述的全景深图像合成方法，其特征在于，采用标注过的包含人脸的图像数据作为训练图像对图像分割神经网络进行训练，得到训练后图像分割神经网络的步骤包括：

7.根据权利要求5所述的全景深图像合成方法，其特征在于，将第一图像输入所述训练后图像分割神经网络进行图像分割，得到人像区域图像的步骤包括：

获取所述第一图像；

8.根据权利要求1所述的全景深图像合成方法，其特征在于，将所述人像区域图像与所述第二图像进行对齐融合，得到融合图像的步骤包括：

9.一种存储介质，其特征在于，其特征在于，所述存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现如权利要求1-8任意一项全景深图像合成方法中的步骤。

10.一种智能手机，其特征在于，包括处理器，适于实现各指令；以及存储介质，适于存储多条指令，所述指令适于由处理器加载并执行权利要求1-7任意一项全景深图像合成方法中的步骤。