CN107909583B

CN107909583B - 一种图像处理方法、装置及终端

Info

Publication number: CN107909583B
Application number: CN201711090104.6A
Authority: CN
Inventors: 钱胜尔
Original assignee: Vivo Mobile Communication Co Ltd
Current assignee: Vivo Mobile Communication Co Ltd
Priority date: 2017-11-08
Filing date: 2017-11-08
Publication date: 2020-01-10
Anticipated expiration: 2037-11-08
Also published as: CN107909583A

Abstract

本发明提供一种图像处理方法、装置及终端，该方法包括：获取目标图像；当从所述目标图像中检测到人像时，使用预设的深度卷积神经网络，对所述目标图像中的人像进行分割处理，得到掩码图，其中，在对所述目标图像中的人像进行分割处理时，对所述深度卷积神经网络中的浮点矩阵的格式进行预设处理。本发明在对图像数据进行图像分割计算的过程中，能够提高计算的效率，从而提高对图像分割的效率。

Description

一种图像处理方法、装置及终端

技术领域

本发明涉及通信技术领域，尤其涉及一种图像处理方法、装置及终端。

背景技术

随着终端的普及，使用终端进行拍照已经成为人们生活中的日常。近年来，终端不仅在拍照像素上有所提高，而且能够在拍照的过程中进行图像处理。

现有技术中，终端在对图像进行处理时，通常采用深度学习方法对图像进行处理。例如，终端在对人物图像和背景进行分割时，通常根据大量的标定数据集进行反复迭代的训练，计算人物与背景的边界关系，以达到比较准确的分割效果。然而在采用深度学习方法计算的过程中，采用浮点乘法器进行处理时需要大量的计算资源。这样，当深度网络达到30层时，消耗的时间较长。

可见，现有的终端对图像处理的效率低。

发明内容

本发明实施例提供一种图像处理方法、装置及终端，以解决现有的终端对图像处理的效率低的问题。

为了解决上述问题，本发明是这样实现的：获取目标图像；当从所述目标图像中检测到人像时，使用预设的深度卷积神经网络，对所述目标图像中的人像进行分割处理，得到掩码图，其中，在对所述目标图像中的人像进行分割处理时，对所述深度卷积神经网络中的浮点矩阵的格式进行预设处理。

第一方面，本发明实施例提供了一种图像处理方法，包括：

获取目标图像；

当从所述目标图像中检测到人像时，使用预设的深度卷积神经网络，对所述目标图像中的人像进行分割处理，得到掩码图，其中，在对所述目标图像中的人像进行分割处理时，对所述深度卷积神经网络中的浮点矩阵的格式进行预设处理。

第二方面，本发明实施例还提供一种图像处理装置，包括：

第一获取模块，用于获取目标图像；

分割模块，用于当从所述第一获取模块获取的所述目标图像中检测到人像时，使用预设的深度卷积神经网络，对所述目标图像中的人像进行分割处理，得到掩码图，其中，在对所述目标图像中的人像进行分割处理时，对所述深度卷积神经网络中的浮点矩阵的格式进行预设处理。

第三方面，本发明实施例还提供一种终端，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如上所述的图像处理方法中的步骤。

第四方面，本发明实施例还提供一种可读存储介质，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现如上所述的图像处理方法中的步骤。

本发明实施例在对图像数据进行图像分割计算的过程中，能够提高计算的效率，从而提高对图像分割的效率。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的图像处理方法的流程图之一；

图2是本发明实施例提供的图像处理方法的流程图之二；

图3是本发明实施例提供的图像处理装置的结构图之一；

图4是本发明实施例提供的图像处理装置中的分割模块的结构图；

图5是本发明实施例提供的图像处理装置中的相乘子模块的结构图；

图6是本发明实施例提供的图像处理装置的结构图之二；

图7是本发明实施例提供的图像处理装置的结构图之三；

图8是本发明实施例提供的终端的结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参见图1，图1是本发明实施例提供的图像处理方法的流程图，该方法可以应用于具有数字信号处理器的终端，如图1所示，包括以下步骤：

步骤101、获取目标图像。

其中，目标图像可以是待分割处理的图像，该图像中可以包括人物图像。该图像可以包括终端中存储的图像和拍摄预览时的预览图像。

步骤102、当从所述目标图像中检测到人像时，使用预设的深度卷积神经网络，对所述目标图像中的人像进行分割处理，得到掩码图，其中，在对所述目标图像中的人像进行分割处理时，对所述深度卷积神经网络中的浮点矩阵的格式进行预设处理。

在此步骤中，当检测到目标图像中包含人物图像时，则使用神经网络模型对目标图像中的人物图像进行分割计算，使人物图像和背景图像分离。

常用的语义分割的深度模型为全卷积网络(Fully Convolutional Networks，简称FCN)，它能够通过端到端的自动特征工程，提取图像的特征，并对图像的特征分类，以达到相对准确的分割效果。该模型的前端使用识别网络对每个像素的类别识别，后端通过使用多个特征图的融合上采样达到与输入图大小一致的目的。然而，FCN计算的结果仍然不够精细，上采样的结果比较模糊。

本发明中采用改进的网络模型，即深度卷积神经网络，该网络模型在得到像素的分类结果后，使用全连接的条件随机场，考虑图像中的空间信息，得到的图像更加精细，且避免了在FCN网络中由于像素块而带来的重复存储和多计算卷积的问题。本发明使用的网络模型，将卷积神经网络(Convolutional Neural Network，简称CNN)和循环神经网络(Recurrent Neural Networks，简称RNN)用于统一的架构，实现特征提取，分类器预测和空间规整自动化处理，且图像的边缘纹理更加丰富，能够提高特征提取的精度。

在使用上述深度卷积神经网络对目标图像进行图像分割计算的过程中，将浮点矩阵的格式进行预设处理，从而加速计算过程。例如，先将浮点矩阵进行量化后，再进行矩阵乘，提高对矩阵乘的过程中的计算效率。

本发明实施例中，上述终端可以包括：计算机、手机、平板电脑(Tablet PersonalComputer)、膝上型电脑(Laptop Computer)、个人数字助理(personal digitalassistant，简称PDA)、移动上网装置(Mobile Internet Device，MID)或可穿戴式设备(Wearable Device)等。

本发明实施例的图像处理方法，获取目标图像；当从所述目标图像中检测到人像时，使用预设的深度卷积神经网络，对所述目标图像中的人像进行分割处理，得到掩码图，其中，在对所述目标图像中的人像进行分割处理时，对所述深度卷积神经网络中的浮点矩阵的格式进行预设处理。这样，在对图像数据进行图像分割计算的过程中，能够提高计算的效率，从而提高对图像分割的效率，降低终端的能耗。

参见图2，本实施例与上述实施例的主要区别在于，对深度卷积神经网络中的浮点矩阵进行量化后进行矩阵相乘，得到目标矩阵，并将目标矩阵反量化得到浮点矩阵，从而实现对图像分割的加速计算。图2是本发明实施例提供的图像处理方法的流程图，如图2所示，包括以下步骤：

步骤201、获取目标图像。

此步骤的实现方式可以参见步骤101中的描述，为避免重复，此处不再赘述。

步骤202、当从所述目标图像中检测到人像时，将所述目标图像的图像数据输入到预设的深度卷积神经网络。

在此步骤中，当检测到目标图像中包含人物图像时，则使用神经网络模型对目标图像中的人物图像进行分割计算，使人物图像和背景图像分离。具体地，可以将目标图像的图像数据输入深度卷积神经网络中。

可选的，在所述将所述目标图像的图像数据输入到预设的深度卷积神经网络的步骤之前，所述方法还包括：当从所述目标图像中检测到人像时，获取所述人像中的人脸图像的特征点；利用所述特征点对所述人脸图像进行校正；在此步骤中，将校正后的目标图像的图像数据输入到预设的深度卷积神经网络。

其中，人脸图像的特征点可以包括人脸图像的轮廓上的特征点以及用于表示人脸特征的点，例如，鼻子和眼睛轮廓上的点。根据这些特征点可以获取人脸图像的轮廓和人脸的特征，从而可以将人脸校正。例如，当人物图像相对背景图像为倾斜的图像时，可以将人物图像对齐校正，使人物图像相对背景图像为竖向的图像，并将校正后的图像数据输入深度卷积神经网络当中。这样，能够提高图像处理的精确度，从而提高图像处理的效果。

步骤203、对所述深度卷积神经网络中的浮点矩阵进行量化，得到定点矩阵。

在此步骤中，将输入深度卷积神经网络中的图像数据的浮点矩阵进行量化。具体可以采用如下公式将浮点矩阵量化成8位定点矩阵：

其中，Q_value为量化后的值，R_value为真实值，Scale为尺度，Zero_value为修正值。定点乘法器在计算乘法的时候周期数比浮点乘法器少，因而能够减少计算量以及降低功耗。数字信号处理器不仅支持定点乘加算法的向量化，而且能耗明显低于中央处理器和图形处理器。因此，在具体实施时，本发明可以使用具有数字信号处理器的终端进行加速计算。

在此步骤中，采用并行计算的方式对所述深度卷积神经网络中的浮点矩阵进行量化，得到定点矩阵。利用数字信号处理器的低功耗，以及充分利用数字信号处理器的硬件多线程进行处理。这样，能够提高对浮点矩阵量化的效率，且极大减少了算法带来的功耗。

步骤204、对所述定点矩阵进行矩阵相乘，得到目标矩阵。

在进行矩阵相乘时需要提供零值，若对矩阵中的每个元素都直接加上相应的零值，则会增加计算量以及占用寄存器。为了减少计算量，可以采用以下公式进行计算：

(A+a_offset*P)*(B+b_offset*Q)＝

A*B+a_offset*P*B+A*b_offset*Q+a_offset*b_offset*P*Q

其中，A和B为量化后的矩阵，a_offset为矩阵A量化的误差修正值，b_offset为矩阵B量化的误差修正值，P为与A维度相同，值全为1的矩阵，Q为与B维度相同，值全为1的矩阵。A*B为一般的矩阵乘；a_offset*P*B为将B按列相加，并乘a_offset得到；A*b_offset*Q为将A按行相加，并乘b_offset得到。

在将量化后的矩阵进行矩阵相乘，可以提高计算的效率。

在此步骤中，采用并行计算的方式对所述定点矩阵进行矩阵相乘，得到目标矩阵。这样，能够提高对矩阵相乘计算的效率，从而提高图像处理的效率。

其中，所述深度卷积神经网络中包括卷积核，在此步骤中，获取与所述卷积核对应的转换函数；使用所述转换函数将预设的乘法运算转换为乘法和加法运算；利用转换后的所述乘法和加法运算对所述定点矩阵进行计算，得到目标矩阵。

在该实施方式中，在对定点矩阵进行矩阵相乘时，采用Winograd算法将乘法运算转换为乘法运算和加法运算。其中，Winograd算法的原理是：如果已知一个非负整数在给定的不同模数下对应的余数，若这些模数互素并且已知该整数小于这些模数之积，则该非负整数可唯一确定。

以卷积核大小为3×3，步长为1，采用F(2*2，3*3)为例，使用Winograd算法进行加速计算。

若输出m＝2，滤波器r＝3，输入n＝2+3-1＝4，每个块的大小为n*n＝4*4，每个块按照传统的卷积计算，需要m*m*r*r＝9*4次乘法运算，若采用本发明中的Winograd算法进行快速卷积，需要(m+r-1)²＝n²＝4*4次乘法运算。

可见，采用Winograd算法能够减少乘法运算次数，能够提高计算效率。

针对3×3卷积核，采用Winograd算法可以把6次乘法运算转换为4次乘法与7次加法，针对不同的卷积核采用不同的转换函数，并采用转换后的运算方式进行图像分割计算，可以减少乘法运算。而通过图像处理器运算加法远比乘法快，因此，采用转换后的运算方式能够加快对图像分割的计算速度。在本实施例中，可以采用包括图像处理器的终端进行计算，能够提高计算效率，降低终端能耗。

步骤205、将所述目标矩阵进行反量化，得到浮点矩阵。

对矩阵进行量化得到目标矩阵，并对目标矩阵进行反量化得到浮点矩阵，这样可以提高计算的效率。

在此步骤中，采用并行计算的方式将所述目标矩阵进行反量化，得到浮点矩阵。这样，能够提高对目标矩阵反量化的计算效率，从而提高对图像分割的效率。

步骤206、利用反量化得到的所述浮点矩阵进行图像分割计算，得到掩码图。

在此步骤中，将人物图像从目标图像中分割，并输出分割后的图像的掩码图。

可选的，在所述利用反量化得到的所述浮点矩阵进行图像分割计算，得到掩码图的步骤之后，所述方法还包括：根据所述掩码图确定所述人像的区域；按照预设的滤波方式对所述目标图像中，除所述人像区域外的图像进行滤波。

在该实施方式中，在将人物图像和背景图像分割后，可以输出人物图像的掩码图。根据掩码图的区域可以确定人物图像所在的区域，从而可以对除人物图像以外的图像进行不同强度的滤波，使距离人物图像越远的区域越模糊，越靠近人物图像的区域图像越清晰，从而达到背景虚化的效果。这样，能够提高图像的视觉效果。

本发明实施例的图像处理方法，将图像数据的浮点矩阵进行量化后进行矩阵乘，并对矩阵乘获得的目标矩阵进行反量化，得到浮点矩阵，从而进一步对浮点矩阵进行图像分割计算，这样，能够提高图像分割计算的计算效率，减少计算时间，降低终端的功耗。

参见图3，图3是本发明实施例提供的图像处理装置的结构图，如图3所示，图像处理装置300包括：第一获取模块301和分割模块302。

其中，第一获取模块301，用于获取目标图像；

分割模块302，用于当从所述第一获取模块301获取的所述目标图像中检测到人像时，使用预设的深度卷积神经网络，对所述目标图像中的人像进行分割处理，得到掩码图，其中，在对所述目标图像中的人像进行分割处理时，对所述深度卷积神经网络中的浮点矩阵的格式进行预设处理。

可选的，如图4所示，所述分割模块302包括：

输入子模块3021，用于将所述目标图像的图像数据输入到预设的深度卷积神经网络；

量化子模块3022，用于对所述深度卷积神经网络中的浮点矩阵进行量化，得到定点矩阵；

相乘子模块3023，用于对所述量化子模块3022得到的所述定点矩阵进行矩阵相乘，得到目标矩阵；

反量化子模块3024，用于将所述相乘子模块3023得到的所述目标矩阵进行反量化，得到浮点矩阵；

计算子模块3025，用于利用反量化子模块3024反量化得到的所述浮点矩阵进行图像分割计算，得到掩码图。

可选的，如图5所示，所述深度卷积神经网络模型中包括卷积核，所述相乘子模块3023包括：

获取单元30231，用于获取与所述卷积核对应的转换函数；

转换单元30232，用于使用所述获取单元30231获取的所述转换函数将预设的乘法运算转换为乘法和加法运算；

计算单元30233，用于利用所述转换单元30232转换后的所述乘法和加法运算对所述定点矩阵进行计算，得到目标矩阵。

可选的，所述量化子模块3022具体用于，采用并行计算的方式对所述深度卷积神经网络中的浮点矩阵进行量化，得到定点矩阵；

所述相乘子模块3023具体用于，采用并行计算的方式对所述定点矩阵进行矩阵相乘，得到目标矩阵；

所述反量化子模块3024具体用于，采用并行计算的方式将所述目标矩阵进行反量化，得到浮点矩阵。

可选的，如图6所示，所述图像处理装置300还包括：

第二获取模块303，用于当从所述目标图像中检测到人像时，获取所述人像中的人脸图像的特征点；

校正模块304，用于利用所述第二获取模块303获取的所述特征点对所述人脸图像进行校正；

所述输入子模块3021具体用于，将所述校正模块304校正后的目标图像的图像数据输入到预设的深度卷积神经网络。

可选的，如图7所示，所述图像处理装置300还包括：

确定模块305，用于根据所述掩码图确定所述人像的区域；

滤波模块306，用于按照预设的滤波方式对所述确定模块305确定的所述目标图像中，除所述人像区域外的图像进行滤波。

图像处理装置300能够实现图1至图2的方法实施例中终端实现的各个过程，为避免重复，这里不再赘述。

本发明实施例的图像处理装置300，在对图像数据进行图像分割计算的过程中，能够提高计算的效率，从而提高对图像分割的效率。

图8为实现本发明各个实施例的一种终端的硬件结构示意图，该终端800包括但不限于：射频单元801、网络模块802、音频输出单元803、输入单元804、传感器805、显示单元806、用户输入单元807、接口单元808、存储器809、处理器810、以及电源811等部件。本领域技术人员可以理解，图8中示出的终端结构并不构成对终端的限定，终端可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。在本发明实施例中，终端包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载移动终端、可穿戴设备、以及计步器等。

其中，处理器810，用于获取目标图像；当从所述目标图像中检测到人像时，使用预设的深度卷积神经网络，对所述目标图像中的人像进行分割处理，得到掩码图，其中，在对所述目标图像中的人像进行分割处理时，对所述深度卷积神经网络中的浮点矩阵的格式进行预设处理。

这样，在对图像数据进行图像分割计算的过程中，能够提高计算的效率，从而提高对图像分割的效率。

可选的，处理器810执行所述使用预设的深度卷积神经网络，对所述目标图像中的人像进行分割处理，得到掩码图的步骤，包括：将所述目标图像的图像数据输入到预设的深度卷积神经网络；对所述深度卷积神经网络中的浮点矩阵进行量化，得到定点矩阵；对所述定点矩阵进行矩阵相乘，得到目标矩阵；将所述目标矩阵进行反量化，得到浮点矩阵；利用反量化得到的所述浮点矩阵进行图像分割计算，得到掩码图。

可选的，所述深度卷积神经网络模型中包括卷积核，处理器810执行所述对所述定点矩阵进行矩阵相乘，得到目标矩阵的步骤，包括：获取与所述卷积核对应的转换函数；使用所述转换函数将预设的乘法运算转换为乘法和加法运算；利用转换后的所述乘法和加法运算对所述定点矩阵进行计算，得到目标矩阵。

可选的，处理器810执行所述对所述深度卷积神经网络中的浮点矩阵进行量化，得到定点矩阵的步骤，包括：采用并行计算的方式对所述深度卷积神经网络中的浮点矩阵进行量化，得到定点矩阵；所述对所述定点矩阵进行矩阵相乘，得到目标矩阵的步骤，包括：采用并行计算的方式对所述定点矩阵进行矩阵相乘，得到目标矩阵；所述将所述目标矩阵进行反量化，得到浮点矩阵的步骤，包括：采用并行计算的方式将所述目标矩阵进行反量化，得到浮点矩阵。

可选的，处理器810还用于，在所述将所述目标图像的图像数据输入到预设的深度卷积神经网络的步骤之前，所述方法还包括：当从所述目标图像中检测到人像时，获取所述人像中的人脸图像的特征点；利用所述特征点对所述人脸图像进行校正；处理器810执行所述将所述目标图像的图像数据输入到预设的深度卷积神经网络的步骤，包括：将校正后的目标图像的图像数据输入到预设的深度卷积神经网络。

可选的，处理器810还用于，根据所述掩码图确定所述人像的区域；按照预设的滤波方式对所述目标图像中，除所述人像区域外的图像进行滤波。

应理解的是，本发明实施例中，射频单元801可用于收发信息或通话过程中，信号的接收和发送，具体的，将来自基站的下行数据接收后，给处理器810处理；另外，将上行的数据发送给基站。通常，射频单元801包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外，射频单元801还可以通过无线通信系统与网络和其他设备通信。

终端通过网络模块802为用户提供了无线的宽带互联网访问，如帮助用户收发电子邮件、浏览网页和访问流式媒体等。

音频输出单元803可以将射频单元801或网络模块802接收的或者在存储器809中存储的音频数据转换成音频信号并且输出为声音。而且，音频输出单元803还可以提供与终端800执行的特定功能相关的音频输出(例如，呼叫信号接收声音、消息接收声音等等)。音频输出单元803包括扬声器、蜂鸣器以及受话器等。

输入单元804用于接收音频或视频信号。输入单元804可以包括图形处理器(Graphics Processing Unit，GPU)8041和麦克风8042，图形处理器8041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元806上。经图形处理器8041处理后的图像帧可以存储在存储器809(或其它存储介质)中或者经由射频单元801或网络模块802进行发送。麦克风8042可以接收声音，并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元801发送到移动通信基站的格式输出。

终端800还包括至少一种传感器805，比如光传感器、运动传感器以及其他传感器。具体地，光传感器包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板8061的亮度，接近传感器可在终端800移动到耳边时，关闭显示面板8061和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别终端姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；传感器805还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等，在此不再赘述。

显示单元806用于显示由用户输入的信息或提供给用户的信息。显示单元806可包括显示面板8061，可以采用液晶显示器(Liquid Crystal Display，LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板8061。

用户输入单元807可用于接收输入的数字或字符信息，以及产生与终端的用户设置以及功能控制有关的键信号输入。具体地，用户输入单元807包括触控面板8071以及其他输入设备8072。触控面板8071，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板8071上或在触控面板8071附近的操作)。触控面板8071可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器810，接收处理器810发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板8071。除了触控面板8071，用户输入单元807还可以包括其他输入设备8072。具体地，其他输入设备8072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆，在此不再赘述。

进一步的，触控面板8071可覆盖在显示面板8061上，当触控面板8071检测到在其上或附近的触摸操作后，传送给处理器810以确定触摸事件的类型，随后处理器810根据触摸事件的类型在显示面板8061上提供相应的视觉输出。虽然在图8中，触控面板8071与显示面板8061是作为两个独立的部件来实现终端的输入和输出功能，但是在某些实施例中，可以将触控面板8071与显示面板8061集成而实现终端的输入和输出功能，具体此处不做限定。

接口单元808为外部装置与终端800连接的接口。例如，外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元808可以用于接收来自外部装置的输入(例如，数据信息、电力等等)并且将接收到的输入传输到终端800内的一个或多个元件或者可以用于在终端800和外部装置之间传输数据。

存储器809可用于存储软件程序以及各种数据。存储器809可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器809可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

处理器810是终端的控制中心，利用各种接口和线路连接整个终端的各个部分，通过运行或执行存储在存储器809内的软件程序和/或模块，以及调用存储在存储器809内的数据，执行终端的各种功能和处理数据，从而对终端进行整体监控。处理器810可包括一个或多个处理单元；优选的，处理器810可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器810中。

终端800还可以包括给各个部件供电的电源811(比如电池)，优选的，电源811可以通过电源管理系统与处理器810逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

另外，终端800包括一些未示出的功能模块，在此不再赘述。

优选的，本发明实施例还提供一种终端，包括处理器810，存储器809，存储在存储器809上并可在所述处理器810上运行的计算机程序，该计算机程序被处理器810执行时实现上述图像处理方法实施例中的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

本发明实施例还提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述图像处理方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。其中，所述的计算机可读存储介质，如只读存储器(Read-Only Memory，简称ROM)、随机存取存储器(Random Access Memory，简称RAM)、磁碟或者光盘等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

上面结合附图对本发明的实施例进行了描述，但是本发明并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本发明的启示下，在不脱离本发明宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本发明的保护之内。

Claims

1.一种图像处理方法，其特征在于，包括：

获取目标图像；

当从所述目标图像中检测到人像时，使用预设的深度卷积神经网络，对所述目标图像中的人像进行分割处理，得到掩码图，其中，在对所述目标图像中的人像进行分割处理时，对所述深度卷积神经网络中的浮点矩阵的格式进行预设处理；

所述使用预设的深度卷积神经网络，对所述目标图像中的人像进行分割处理，得到掩码图的步骤，包括：

将所述目标图像的图像数据输入到预设的深度卷积神经网络；

对所述深度卷积神经网络中的浮点矩阵进行量化，得到定点矩阵；

其中，采用如下表达式将浮点矩阵量化成8位定点矩阵：

其中，Q_value为量化后的值，R_value为真实值，Scale为尺度，Zero_value为修正值；

对所述定点矩阵进行矩阵相乘，得到目标矩阵；

将所述目标矩阵进行反量化，得到浮点矩阵；

利用反量化得到的所述浮点矩阵进行图像分割计算，得到掩码图；

所述深度卷积神经网络中包括卷积核，所述对所述定点矩阵进行矩阵相乘，得到目标矩阵的步骤，包括：

获取与所述卷积核对应的转换函数；

使用所述转换函数将预设的乘法运算转换为乘法和加法运算；

利用转换后的所述乘法和加法运算对所述定点矩阵进行计算，得到目标矩阵。

2.根据权利要求1所述的图像处理方法，其特征在于，所述对所述深度卷积神经网络中的浮点矩阵进行量化，得到定点矩阵的步骤，包括：

采用并行计算的方式对所述深度卷积神经网络中的浮点矩阵进行量化，得到定点矩阵；

所述对所述定点矩阵进行矩阵相乘，得到目标矩阵的步骤，包括：

采用并行计算的方式对所述定点矩阵进行矩阵相乘，得到目标矩阵；

所述将所述目标矩阵进行反量化，得到浮点矩阵的步骤，包括：

采用并行计算的方式将所述目标矩阵进行反量化，得到浮点矩阵。

3.一种图像处理装置，其特征在于，包括：

第一获取模块，用于获取目标图像；

分割模块，用于当从所述第一获取模块获取的所述目标图像中检测到人像时，使用预设的深度卷积神经网络，对所述目标图像中的人像进行分割处理，得到掩码图，其中，在对所述目标图像中的人像进行分割处理时，对所述深度卷积神经网络中的浮点矩阵的格式进行预设处理；

所述分割模块包括：

输入子模块，用于将所述目标图像的图像数据输入到预设的深度卷积神经网络；

量化子模块，用于对所述深度卷积神经网络中的浮点矩阵进行量化，得到定点矩阵；

其中，采用如下表达式将浮点矩阵量化成8位定点矩阵：

相乘子模块，用于对所述量化子模块得到的所述定点矩阵进行矩阵相乘，得到目标矩阵；

反量化子模块，用于将所述相乘子模块得到的所述目标矩阵进行反量化，得到浮点矩阵；

计算子模块，用于利用反量化子模块反量化得到的所述浮点矩阵进行图像分割计算，得到掩码图；

所述深度卷积神经网络中包括卷积核，所述相乘子模块包括：

获取单元，用于获取与所述卷积核对应的转换函数；

转换单元，用于使用所述获取单元获取的所述转换函数将预设的乘法运算转换为乘法和加法运算；

计算单元，用于利用所述转换单元转换后的所述乘法和加法运算对所述定点矩阵进行计算，得到目标矩阵。

4.根据权利要求3所述的图像处理装置，其特征在于，所述量化子模块具体用于，采用并行计算的方式对所述深度卷积神经网络中的浮点矩阵进行量化，得到定点矩阵；

所述相乘子模块具体用于，采用并行计算的方式对所述定点矩阵进行矩阵相乘，得到目标矩阵；

所述反量化子模块具体用于，采用并行计算的方式将所述目标矩阵进行反量化，得到浮点矩阵。

5.一种终端，其特征在于，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如权利要求1至2任一项所述的图像处理方法中的步骤。

6.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现如权利要求1至2任一项所述的图像处理方法中的步骤。