CN105096279A

CN105096279A - 一种基于卷积神经网络的数字图像处理方法

Info

Publication number: CN105096279A
Application number: CN201510609134.8A
Authority: CN
Inventors: 张岱; 齐弘文
Original assignee: Chengdu Rongchuang Zhigu Science and Technology Co Ltd
Current assignee: Chengdu Rongchuang Zhigu Science and Technology Co Ltd
Priority date: 2015-09-23
Filing date: 2015-09-23
Publication date: 2015-11-25

Abstract

本发明公开了一种基于卷积神经网络的数字图像处理方法，属于数字图像处理方法技术领域，解决现有技术中不能有效地去除图像中的噪声、增强图像中的边缘或其他感兴趣的区域，从而达不到对图像中感兴趣的目标进行检测和测量的目的的问题。本发明的步骤为：（1）获取原始图像；（2）通过“输入层-卷积层-输出层”结构的卷积神经网络提取原始图像的特征,基于卷积神经网络提取的原始图像的空间特征构造一个新的卷积神经网络；（3）归一化新的卷积神经网络，然后神经元计算出用输入信号将权值和归一化处理后的值，再单独训练每个隐层得到权值，最后获得的神经元输出活性，得到最终图像。本发明用于图像处理。

Description

一种基于卷积神经网络的数字图像处理方法

技术领域

一种基于卷积神经网络的数字图像处理方法，用于图像处理，属于数字图像处理方法技术领域。

背景技术

图像增加方法不能有效的将原本模糊不清甚至根本无法分辨的原始图像处理成清晰的富含大量有用信息的可使用图像，并不能有效地去除图像中的噪声、增强图像中的边缘或其他感兴趣的区域，从而达不到对图像中感兴趣的目标进行检测和测量的目的。

1962年Hubel和Wiesel通过对猫视觉皮层细胞的研究，提出了感受野(Receptivefield)的概念，1984年日本学者Fukushima基于感受野概念提出的神经认知机(Neocognitron)可以看作是卷积神经网络的第一个实现网络，也是感受野概念在人工神经网络领域的首次应用。神经认知机将一个视觉模式分解成许多子模式(特征)，然后进入分层递阶式相连的特征平面进行处理，它试图将视觉系统模型化，使其能够在即使物体有位移或轻微变形的时候，也能完成识别。神经认知机能够利用位移恒定能力从激励模式中学习，并且可识别这些模式的变化形，在其后的应用研究中，Fukushima将神经认知机主要用于手写数字的识别。随后，国内外的研究人员提出多种卷积神经网络形式，在邮政编码识别和人脸识别方面得到了大规模的应用。

发明内容

本发明针对现有技术的不足之处提供了一种基于卷积神经网络的数字图像处理方法，解决现有技术中不能有效地去除图像中的噪声、增强图像中的边缘或其他感兴趣的区域，从而达不到对图像中感兴趣的目标进行检测和测量的目的的问题。

为了实现上述目的，本发明采用的技术方案为：

一种基于卷积神经网络的数字图像处理方法，其特征在于，如下步骤：

(1)获取原始图像；

(2)通过“输入层-卷积层-输出层”结构的卷积神经网络提取原始图像的特征,基于卷积神经网络提取的原始图像的空间特征构造一个新的卷积神经网络；

(3)归一化新的卷积神经网络，然后神经元计算出用输入信号将权值和归一化处理后的值，再单独训练每个隐层得到权值，最后获得的神经元输出活性，得到最终图像。

进一步，所述步骤(2)中，通过卷积神经网络结构提取原始图像的空间特征,基于卷积神经网络提取的原始图像的空间特征构造一个新的卷积神经网络具体步骤如下：

(21)将原始图像直接输入到输入层，神经元提取图像的局部特征；

(22)卷积层包含多个平面，输入层中神经元提取图像的局部特征直接映射到卷积层包含的多个平面上；

(23)卷积层中各平面的神经元提取图像中特定区域的局部特征，并在训练时不断修正卷积层神经元的权值；

(24)输出层输出卷积层特定区域的局部特征，并构成新的卷积神经网络。

进一步，所述步骤(3)中，归一化新的卷积神经网络，然后神经元计算出用输入信号将权值和归一化处理后的值，再单独训练每个隐层得到权值，最后获得的神经元输出活性，得到最终图像可表示为：

其中r(v)是从v处到感受野中心的归一化距离；

C神经元的输出由给出，其中

ψ (x) = \{\begin{matrix} x, x &GreaterEqual; 0 \\ β + x \\ 0, x < 0 \end{matrix},

式中β为一常量，kj是第一级中的卷积层平面的数量，D1是卷积层的感受野，最终得到神经元的输出活性为：

与现有技术相比，本发明的优点在于：

一、有效地去除了图像中的噪声、增强图像中的边缘或其他感兴趣的区域，从而达到了对图像中感兴趣的目标进行检测和测量的目的；

二、网络的输入是多维图像时表现的更为明显，使图像可以直接作为网络的输入，避免了传统识别算法中复杂的特征提取和数据重建过程。卷积网络是为识别二维形状而特殊设计的一个多层感知器，这种网络结构对平移、比例缩放、倾斜或者共他形式的变形具有高度不变性。

附图说明

图1为本发明的卷积神经网络结构示意图；

图2为本发明中卷积神经网络结构中神经元的连接示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步说明。

卷积神经网络是一个多层的神经网络，每层由多个二维平面组成，而每个平面由多个独立神经元组成。网络中包含一些简单元和复杂元，分别记为S-元和C-元。S-元聚合在一起组成S-面，S-面聚合在一起组成S-层，用Us表示。C-元、C-面和C-层(Us)之间存在类似的关系。网络的任一中间级由S-层与C-层串接而成，而输入级只含一层，它直接接受二维视觉模式，样本特征提取步骤已嵌入到卷积神经网络模型的互联结构中。一般地，Us为特征提取层，每个神经元的输入与前一层的局部感受野相连，并提取该局部的特征，一旦该局部特征被提取后，它与其他特征间的位置关系也随之确定下来；Uc是特征映射层，网络的每个计算层由多个特征映射组成，每个特征映射为一个平面，平面上所有神经元的权值相等。特征映射结构采用影响函数核小的sigmoid函数作为卷积网络的激活函数，使得特征映射具有位移不变性。此外，由于一个映射面上的神经元共享权值，因而减少了网络自由参数的个数，降低了网络参数选择的复杂度。卷积神经网络中的每一个特征提取层(S-层)都紧跟着一个用来求局部平均与二次提取的计算层(C-层)，这种特有的两次特征提取结构使网络在识别时对输入样本有较高的畸变容忍能力。

(1)获取原始图像；

(3)归一化新的卷积神经网络，然后神经元计算出用输入信号将权值和归一化处理后的值，再单独训练每个隐层得到权值，最后获得的神经元输出活性，得到最终图像。归一化新的卷积神经网络，然后神经元计算出用输入信号将权值和归一化处理后的值，再单独训练每个隐层得到权值，最后获得的神经元输出活性，得到最终图像可表示为：

其中r(v)是从v处到感受野中心的归一化距离；

C神经元的输出由给出，其中

ψ (x) = \{\begin{matrix} x, x &GreaterEqual; 0 \\ β + x \\ 0, x < 0 \end{matrix},

神经网络用于模式识别的主流是有指导学习网络，无指导学习网络更多的是用于聚类分析。对于有指导的模式识别，

由于任一样本的类别是已知的，样本在空间的分布不再是依据其自然分布倾向来划分，而是要根据同类样本在空间的分布及不同类样本之间的分离程度找一种适当的空间划分方法，或者找到一个分类边界，使得不同类样本分别位于不同的区域内。这就需要一个长时间且复杂的学习过程，不断调整用以划分样本空间的分类边界的位置，使尽可能少的样本被划分到非同类区域中。由于本文主要是检测图像中的人脸，所以可将样本空间分成两类：样本空间和非样本空间，因而本文所使用的学习网络也是有指导的学习网络。卷积网络在本质上是一种输入到输出的映射，它能够学习大量的输入与输出之间的映射关系，而不需要任何输入和输出之间的精确的数学表达式，只要用已知的模式对卷积网络加以训练，网络就具有输入输出对之间的映射能力。卷积网络执行的是有导师训练，所以其样本集是由形如：(输入向量，理想输出向量)的向量对构成的。所有这些向量对，都应该是来源于网络即将模拟的系统的实际“运行”结果。它们可以是从实际运行系统中采集来的。在开始训练前，所有的权都应该用一些不同的小随机数进行初始化。“小随机数”用来保证网络不会因权值过大而进入饱和状态，从而导致训练失败；“不同”用来保证网络可以正常地学习。实际上，如果用相同的数去初始化权矩阵，则网络无能力学习。

Claims

1.一种基于卷积神经网络的数字图像处理方法，其特征在于，如下步骤：

(1)获取原始图像；

(3)归一化新的卷积神经网络，然后神经元计算出用输入信号将权值和归一化处理后的值，

再单独训练每个隐层得到权值，最后获得的神经元输出活性，得到最终图像。

2.根据权利要求1所述的一种基于卷积神经网络的数字图像处理方法，其特征在于：所述步骤(2)中，通过卷积神经网络结构提取原始图像的空间特征,基于卷积神经网络提取的原始图像的空间特征构造一个新的卷积神经网络具体步骤如下：

3.根据权利要求1所述的一种基于卷积神经网络的数字图像处理方法，其特征在于：所述步骤(3)中，归一化新的卷积神经网络，然后神经元计算出用输入信号将权值和归一化处理后的值，再单独训练每个隐层得到权值，最后获得的神经元输出活性，得到最终图像可表示为：

其中r(v)是从v处到感受野中心的归一化距离；

C神经元的输出由给出，其中

ψ (x) = {\begin{matrix} x \\ β + x \\ 0, x < 0 \end{matrix}, x &GreaterEqual; 0,