CN109117897A

CN109117897A - 基于卷积神经网络的图像处理方法、装置及可读存储介质

Info

Publication number: CN109117897A
Application number: CN201810902229.2A
Authority: CN
Inventors: 杨少雄; 赵晨
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Baidu Online Network Technology Beijing Co Ltd; Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2018-08-09
Filing date: 2018-08-09
Publication date: 2019-01-01

Abstract

本发明提供的基于卷积神经网络的图像处理方法、装置及可读存储介质，通过采用构建卷积神经网络的网络架构，所述架构包括依次连接的卷积层、采用中值池化算法的池化层、全连接层和分类器层；根据采集获得的图像样本集对构建的卷积神经网络进行训练，获得训练完毕的卷积神经网络模型；根据训练完毕的卷积神经网络模型对待识别的图像进行识别；其中，所述训练完毕的卷积神经网络模型中的池化层采用中值池化算法，以使将待识别图像的各区块对应特征值中的中值作为最佳特征值输出至全连接层。从而可利用中值池化算法对卷积神经网络模型进行处理，有效解决了现有技术中由于采用最大值池化算法和均值池化算法而使得图像识别的准确率受到影响的问题。

Description

基于卷积神经网络的图像处理方法、装置及可读存储介质

技术领域

本发明涉及计算机技术，尤其涉及一种基于卷积神经网络的图像处理方法、装置及可读存储介质。

背景技术

图像识别是计算机视觉技术领域的核心分支。卷积神经网络是一种用于图像识别的前馈神经网络模型，其本质上利用了有监督的深度学习算法，通过卷积核运算直接对二维图像进行特征提取并训练分类，以根据训练完毕的卷积神经网络对待识别图像进行识别。

在现有基于卷积神经网络的图像处理方法中，为了更好的提取二维图像中的特征，其卷积神经网络采用了包括有卷积层、池化层、全连接层以及分类器层的输出层的网络架构。其中的池化层用于对上一层的特征通过人为设定的池化窗口大小以及步长进行池化计算，以减小特征的维度，使特征聚合，其常用的池化算法包括最大值池化算法和均值池化算法。

但是，基于最大值池化算法的卷积神经网络在提取特征时，容易忽略图像的背景的信息特征，使得图像识别的准确率受到影响；而基于均值池化算法的卷积神经网络在提取特征时，容易受到信息特征中的包括噪点在内的异常值的干扰，使得图像识别的准确受到影响。因此，亟需一种新的基于卷积神经网络的图像处理方法以克服前述问题。

发明内容

针对上述提及的现有的基于最大值池化算法和均值池化算法的卷积神经网络在提取特征时，容易忽略图像的背景的信息特征以及受到信息特征中的异常值的干扰，从而使得图像识别的准确率受到影响的问题。本发明提供了一种基于卷积神经网络的图像处理方法、装置及可读存储介质。

一方面，本发明提供了一种基于卷积神经网络的图像处理方法，包括：

构建卷积神经网络的网络架构，所述架构包括依次连接的卷积层、采用中值池化算法的池化层、全连接层和分类器层；

根据采集获得的图像样本集对构建的卷积神经网络进行训练，获得训练完毕的卷积神经网络模型。

在其中一种可选的实施方式中，所述根据采集获得的图像样本集对构建的卷积神经网络进行训练，包括：

将采集获得的图像样本集输入所述卷积层，以使所述卷积层提取图像样本集中各输入图像的特征，并向所述池化层输出各输入图像的特征矩阵。

在其中一种可选的实施方式中，还包括：

所述池化层将接收的每个输入图像的特征矩阵划分为若干区块，将每一区块中的特征值按照数值进行排序，将每一区块中的各特征值中的中值作为对应的最佳特征值，向所述全连接层输出每个输入图像的中值池化处理后的特征矩阵，所述中值池化处理后的特征矩阵由各最佳特征值组成。

在其中一种可选的实施方式中，还包括：

所述全连接层对接收的每个输入图像的中值池化处理后的特征矩阵进行处理，以向所述分类器层输出获得的每个输入图像的一维特征矩阵；所述分类器层对每个输入图像的所述一维特征矩阵进行分类，获得每个输入图像的分类结果，根据所述每个输入图像的分类结果对卷积神经网络的网络架构进行反向传播以逐层调整层级权重直至完成训练。

另一方面，本发明还提供了一种基于卷积神经网络的图像处理方法，包括：

采集待识别的图像；

采用训练完毕的卷积神经网络对所述待识别的图像进行识别；其中，所述训练完毕的卷积神经网络模型中的池化层采用中值池化算法，以使将待识别图像的各区块对应特征值中的中值作为最佳特征值输出至全连接层；

所述训练完毕的卷积神经网络是利用权利要求1-4任一项所述的方法训练获得的。

再一方面，本发明提供了一种基于卷积神经网络的图像处理装置，包括：

卷积神经网络建立模块，用于构建卷积神经网络的网络架构，所述架构包括依次连接的卷积层、采用中值池化算法的池化层、全连接层和分类器层；

卷积神经网络训练模块，用于根据采集获得的图像样本集对构建的卷积神经网络进行训练，获得训练完毕的卷积神经网络模型。

在其中一种可选的实施方式中，所述卷积神经网络训练模块，具体用于：

采集模块，用于采集待识别的图像；

识别模块，用于采用训练完毕的卷积神经网络对所述待识别的图像进行识别；其中，所述训练完毕的卷积神经网络模型中的池化层采用中值池化算法，以使将待识别图像的各区块对应特征值中的中值作为最佳特征值输出至全连接层；所述训练完毕的卷积神经网络是利用权利要求1-4任一项所述的方法训练获得的。

再一方面，本发明提供了一种基于卷积神经网络的图像处理装置，包括：存储器、与所述存储器连接的处理器，及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，

所述处理器运行所述计算机程序时执行如前任一项所述的方法。

最后一方面，本发明提供了一种可读存储介质，其特征在于，包括程序，当其在终端上运行时，使得终端执行如前任一项所述的方法。

附图说明

通过上述附图，已示出本公开明确的实施例，后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围，而是通过参考特定实施例为本领域技术人员说明本公开的概念。

图1为现有技术中的网络架构示意图；

图2为本发明实施例一提供的一种基于卷积神经网络的图像处理方法的流程示意图；

图3为本发明实施例二提供的一种基于卷积神经网络的图像处理方法的流程示意图；

图4为本发明实施例三提供的一种基于卷积神经网络的图像处理装置的结构示意图；

图5为本发明实施例四提供的一种基于卷积神经网络的图像处理装置的硬件结构示意图。

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。

图1为现有技术中的网络架构示意图，如图1所示在现有基于卷积神经网络的图像处理方法中，为了更好的提取二维图像中的特征，其卷积神经网络采用了包括有卷积层、池化层、全连接层以及分类器层的输出层的网络架构。其中的池化层用于对上一层的特征通过人为设定的池化窗口大小以及步长进行池化计算，以减小特征的维度，使特征聚合，其常用的池化算法包括最大值池化算法和均值池化算法。

对上述提及的现有的基于最大值池化算法和均值池化算法的卷积神经网络在提取特征时，容易忽略图像的背景的信息特征以及受到信息特征中的异常值的干扰，从而使得图像识别的准确率受到影响的问题，本发明提供了一种基于卷积神经网络的图像处理方法、装置及可读存储介质，其可运用在广泛的利用卷积神经网络进行数据处理的应用场景中，这些应用场景包括但不限制为：手势识别场景、人脸识别场景、物品识别场景等等。

图2为本发明实施例一提供的一种基于卷积神经网络的图像处理方法的流程示意图。

如图2所示，该基于卷积神经网络的图像处理方法包括：

步骤101、构建卷积神经网络的网络架构，所述架构包括依次连接的卷积层、采用中值池化算法的池化层、全连接层和分类器层。

步骤102、根据采集获得的图像样本集对构建的卷积神经网络进行训练，获得训练完毕的卷积神经网络模型。

需要说明的是，本发明提供的基于卷积神经网络的图像处理方法的执行主体具体可为基于卷积神经网络的图像处理装置，该图像识别装置可通过硬件和/或软件的方式实现，其所基于的网络架构与图1所示架构相同。一般可集成于云端服务器中，与存放有各类图像的数据服务器配合使用，此外，图像识别所基于的服务器可与数据服务器为同一服务器，或者为隶属于同一服务器集群的不同服务器，本发明对此均不进行限制。

具体来说，本发明提供了一种基于卷积神经网络的图像处理方法，首先，需要构建一卷积神经网络的网络架构，该卷积神经网络的网络构架包括有可用于提取特征的卷积层和池化层，还包括有用于训练分类的全连接层和分类器层。其中，卷积层和池化层可交迭连接，全连接层的输入端与池化层的输出端连接，全连接层的输出端与分类器层连接。在本实施方式中，池化层采用了中值池化算法操作，以向全连接层输出中值池化处理后的数据。

在对卷积神经网络的网络架构的构建的同时，还需构建用于训练该卷积神经网络的图像样本集。其中需要说明的是，考虑到卷积神经网络对识别任务的差异，构建的图像样本集应于其识别任务匹配。举例来说，当卷积神经网络用于识别手部手势时，该图像样本集应包括有大量的具备手势信息的图像以及每个图像对应的手势类型；当卷积神经网络用于识别人脸图像时，该图像样本集应包括有不同人的多个脸部图像以及每个脸部图像对应的目标人；

当卷积神经网络用于识别物品时，该图像样本集应包括有具备物品影像的图像以及每个图像对应的物品类型。同时，这些图像的获取方式可采用多种形式，例如，通过网络渠道直接获取图像信息，也可采用拍摄终端或采集设备直接拍摄或采集获取；当然，在获得到这些图像信息之后，还可采用人工标注和智能标注的方式获取这些图像信息对应的类型，以便形成可用于对卷积神经网络进行训练的图像样本集。

当完成对图像样本集的获取之后，可利用该图像样本集对前述获得的卷积神经网络进行训练，以获得训练完毕的卷积神经网络模型。

需要说明的是，在现有的卷积神经网络中，池化层一般采用的是最大值池化算法和均值池化算法。其中，最大值池化算法是将图像的各区块对应特征值中的最大值作为各区块的代表，但当区块中特征值的值，差异比较大的时候，最大值并不能显著代表该区块的特征，导致池化后损失了一部分特征。而均值池化算法是是将图像的各区块对应特征值中的平均值作为各区块的代表，但当区块中出现异常值(如噪点)，异常值可能非常大或者非常小，导致区块的特征值的平均值的被显著拉高或拉低，在这种情况下，平均值也不能很好地表示区块的特征。

而本申请采用了中值池化算法的方式进行池化处理操作以克服前述提及的问题。其中，针对于前述的两种情况，将图像的各区块对应特征值中的中值作为各区块的代表能够有效提高对图像的识别准确率。

本发明实施例一提供的基于卷积神经网络的图像处理方法，通过采用构建卷积神经网络的网络架构，所述架构包括依次连接的卷积层、采用中值池化算法的池化层、全连接层和分类器层；根据采集获得的图像样本集对构建的卷积神经网络进行训练，获得训练完毕的卷积神经网络模型；根据训练完毕的卷积神经网络模型对待识别的图像进行识别；其中，所述训练完毕的卷积神经网络模型中的池化层采用中值池化算法，以使将待识别图像的各区块对应特征值中的中值作为最佳特征值输出至全连接层。从而可利用中值池化算法对卷积神经网络模型进行处理，有效解决了现有技术中由于采用最大值池化算法和均值池化算法而使得图像识别的准确率受到影响的问题。

为了更好的描述本发明提供的基于卷积神经网络的图像处理方法，在实施例一的基础上，图3为本发明实施例二提供的一种基于卷积神经网络的图像处理方法的流程示意图。

如图3所示，该图像识别方法包括：

步骤201、构建卷积神经网络的网络架构，所述架构包括依次连接的卷积层、采用中值池化算法的池化层、全连接层和分类器层。

步骤202、将采集获得的图像样本集输入所述卷积层，以使所述卷积层提取图像样本集中各输入图像的特征，并向所述池化层输出各输入图像的特征矩阵；

步骤203、所述池化层将接收的每个输入图像的特征矩阵划分为若干区块，将每一区块中的特征值按照数值进行排序，将每一区块中的各特征值中的中值作为对应的最佳特征值，向所述全连接层输出每个输入图像的中值池化处理后的特征矩阵，所述中值池化处理后的特征矩阵由各最佳特征值组成。

步骤204、所述全连接层对接收的每个输入图像的中值池化处理后的特征矩阵进行处理，以向所述分类器层输出获得的每个输入图像的一维特征矩阵。

步骤205、所述分类器层对每个输入图像的所述一维特征矩阵进行分类，获得每个输入图像的分类结果，根据所述每个输入图像的分类结果对卷积神经网络的网络架构进行反向传播以逐层调整层级权重直至完成训练，获得训练完毕的卷积神经网络模型。

具体来说，在实施例一的基础上，为了进一步描述本发明提供的基于卷积神经网络的图像处理方法，本实施例二提供了一种基于卷积神经网络的图像处理方法的具体实施方式。与实施例一类似的是，需要说明的是，本发明提供的基于卷积神经网络的图像处理方法的执行主体具体可为基于卷积神经网络的图像处理装置，该图像识别装置可通过硬件和/或软件的方式实现。一般可集成于云端服务器中，与存放有各类图像的数据服务器配合使用，此外，图像识别所基于的服务器可与数据服务器为同一服务器，或者为隶属于同一服务器集群的不同服务器，本发明对此均不进行限制。

当完成对图像样本集的获取之后，与前述实施例一不同的是，本实施例二提供的实施方式在利用该图像样本集对前述获得的卷积神经网络进行训练过程中包括如下几个步骤：

将采集获得的图像样本集输入所述卷积层，以使所述卷积层提取图像样本集中各输入图像的特征，并向所述池化层输出各输入图像的特征矩阵。具体来说，图像样本集中一般包括有大量的图像和对应的真实结果。在本步骤中可将图像样本集中的图像采用依次输入的方式输入至卷积层中，以供卷积层针对每一输入图像进行卷积处理，获得每一输入图像的特征，一般来说，提取获得的输入图像的特征将以特征矩阵的形式输出至池化层。

随后，池化层将针对于接收获得的每个输入图像的特征矩阵划分为若干区块，而在每一区块中应包括有若干输入图像的特征值。以任一输入图像为例，池化层获得该输入图像的若干区块之后，将从中选取第一区块，并将该区块中的若干特征值按照数值进行排序，并从中选出位于序列中间位置的那个特征值，该特征值即为中值。池化层可将该中值特征值数作为该区块的最佳特征值，并重复前述步骤以获得每一区块对应的最佳特征值。最后，当确定每一区块对应的最佳特征值之后，池化层将由各最佳特征值组成的特征矩阵输出至全连接层，以作为前述该任一输入图像的中值池化处理后的特征矩阵。当然，针对于其他输入图像也采用类似处理，本实施方式再此不进行赘述。

全连接层对接收的每个输入图像的中值池化处理后的特征矩阵进行处理，以向所述分类器层输出获得的每个输入图像的一维特征矩阵。最后，由分类器层对每个输入图像的所述一维特征矩阵进行分类，获得每个输入图像的分类结果，根据所述每个输入图像的分类结果对卷积神经网络的网络架构进行反向传播以逐层调整层级权重直至完成训练，获得训练完毕的卷积神经网络模型。其中，全连接层和分类器层的处理过程可采用现有方式，本实施方式对其不进行限制，在此不进行赘述。

最后，可根据需求利用训练完毕的卷积神经网络模型对待识别的图像进行识别；其中，所述训练完毕的卷积神经网络模型中的池化层采用中值池化算法，以使将待识别图像的各区块对应特征值中的中值作为最佳特征值输出至全连接层。

本发明实施例二提供的基于卷积神经网络的图像处理方法，通过采用构建卷积神经网络的网络架构，所述架构包括依次连接的卷积层、采用中值池化算法的池化层、全连接层和分类器层；根据采集获得的图像样本集对构建的卷积神经网络进行训练，获得训练完毕的卷积神经网络模型；根据训练完毕的卷积神经网络模型对待识别的图像进行识别；其中，所述训练完毕的卷积神经网络模型中的池化层采用中值池化算法，以使将待识别图像的各区块对应特征值中的中值作为最佳特征值输出至全连接层。从而可利用中值池化算法对卷积神经网络模型进行处理，有效解决了现有技术中由于采用最大值池化算法和均值池化算法而使得图像识别的准确率受到影响的问题。

图4为本发明实施例三提供的一种基于卷积神经网络的图像处理装置的结构示意图，如图4所示，该基于卷积神经网络的图像处理装置，包括：

卷积神经网络训练模块10于构建卷积神经网络的网络架构，所述架构包括依次连接的卷积层、采用中值池化算法的池化层、全连接层和分类器层；根据采集获得的图像样本集对构建的卷积神经网络进行训练，获得训练完毕的卷积神经网络模型；

识别模块20于根据训练完毕的卷积神经网络模型对待识别的图像进行识别；其中，所述训练完毕的卷积神经网络模型中的池化层采用中值池化算法，以使将待识别图像的各区块对应特征值中的中值作为最佳特征值输出至全连接层。

在其中一种可选的实施方式中，所述卷积神经网络训练模块10，具体用于：采集获得的图像样本集输入所述卷积层，以使所述卷积层提取图像样本集中各输入图像的特征，并向所述池化层输出各输入图像的特征矩阵。

在其中一种可选的实施方式中，所述卷积神经网络训练模块10，具体用于：所述池化层将接收的每个输入图像的特征矩阵划分为若干区块，将每一区块中的特征值按照数值进行排序，将每一区块中的各特征值中的中值作为对应的最佳特征值，向所述全连接层输出每个输入图像的中值池化处理后的特征矩阵，所述中值池化处理后的特征矩阵由各最佳特征值组成。

在其中一种可选的实施方式中，所述卷积神经网络训练模块10，具体用于：所述全连接层对接收的每个输入图像的中值池化处理后的特征矩阵进行处理，以向所述分类器层输出获得的每个输入图像的一维特征矩阵；所述分类器层对每个输入图像的所述一维特征矩阵进行分类，获得每个输入图像的分类结果，根据所述每个输入图像的分类结果对卷积神经网络的网络架构进行反向传播以逐层调整层级权重直至完成训练。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统的具体工作过程以及相应的有益效果，可以参考前述方法实施例中的对应过程，在此不再赘述。

本发明实施例三提供的基于卷积神经网络的图像处理装置，通过采用构建卷积神经网络的网络架构，所述架构包括依次连接的卷积层、采用中值池化算法的池化层、全连接层和分类器层；根据采集获得的图像样本集对构建的卷积神经网络进行训练，获得训练完毕的卷积神经网络模型；根据训练完毕的卷积神经网络模型对待识别的图像进行识别；其中，所述训练完毕的卷积神经网络模型中的池化层采用中值池化算法，以使将待识别图像的各区块对应特征值中的中值作为最佳特征值输出至全连接层。从而可利用中值池化算法对卷积神经网络模型进行处理，有效解决了现有技术中由于采用最大值池化算法和均值池化算法而使得图像识别的准确率受到影响的问题。

图5本发明实施例四供的一种基于卷积神经网络的图像处理装置的硬件示意图。如图5示，该基于卷积神经网络的图像处理装置包括：存储器41、处理器42及存储在存储器41上并可在处理器42上运行的计算机程序，处理器42运行计算机程序时执行上述任一实施例的方法。

本发明还提供了一种基于卷积神经网络的图像处理方法，该图像处理方法包括：

采集待识别的图像；

所述训练完毕的卷积神经网络是利用前述任一项方法实施例的实施方式训练获得的。

本发明还提供了一种基于卷积神经网络的图像处理装置，该图像处理装置包括：

采集模块，用于采集待识别的图像；

识别模块，用于采用训练完毕的卷积神经网络对所述待识别的图像进行识别；其中，所述训练完毕的卷积神经网络模型中的池化层采用中值池化算法，以使将待识别图像的各区块对应特征值中的中值作为最佳特征值输出至全连接层；所述训练完毕的卷积神经网络是利用前述任一项方法实施例的实施方式训练获得的。

本发明还提供一种可读存储介质，包括程序，当其在终端上运行时，使得终端执行上述任一实施例的方法。

本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种基于卷积神经网络的图像处理方法，其特征在于，包括：

2.根据权利要求1所述的基于卷积神经网络的图像处理方法，其特征在于，所述根据采集获得的图像样本集对构建的卷积神经网络进行训练，包括：

3.根据权利要求2所述的基于卷积神经网络的图像处理方法，其特征在于，还包括：

4.根据权利要求3所述卷积神经网络的图像识别方法，其特征在于，还包括：

5.一种基于卷积神经网络的图像处理方法，其特征在于，包括：

采集待识别的图像；

6.一种基于卷积神经网络的图像处理装置，其特征在于，包括：

7.根据权利要求6所述的基于卷积神经网络的图像处理装置，其特征在于，所述卷积神经网络训练模块，具体用于：

8.根据权利要求7所述的基于卷积神经网络的图像处理装置，其特征在于，所述卷积神经网络训练模块，具体用于：

9.根据权利要求8所述的基于卷积神经网络的图像处理装置，其特征在于，所述卷积神经网络训练模块，具体用于：

10.一种基于卷积神经网络的图像处理装置，其特征在于，包括：

采集模块，用于采集待识别的图像；

11.一种基于卷积神经网络的图像处理装置，其特征在于，包括：存储器、与所述存储器连接的处理器，及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，

所述处理器运行所述计算机程序时执行权利要求1-6任一项所述的方法。

12.一种可读存储介质，其特征在于，包括程序，当其在终端上运行时，使得终端执行权利要求1-6任一项所述的方法。