CN105096279A - 一种基于卷积神经网络的数字图像处理方法 - Google Patents

一种基于卷积神经网络的数字图像处理方法 Download PDF

Info

Publication number
CN105096279A
CN105096279A CN201510609134.8A CN201510609134A CN105096279A CN 105096279 A CN105096279 A CN 105096279A CN 201510609134 A CN201510609134 A CN 201510609134A CN 105096279 A CN105096279 A CN 105096279A
Authority
CN
China
Prior art keywords
convolutional neural
layer
neural networks
convolutional
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510609134.8A
Other languages
English (en)
Inventor
张岱
齐弘文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Rongchuang Zhigu Science and Technology Co Ltd
Original Assignee
Chengdu Rongchuang Zhigu Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Rongchuang Zhigu Science and Technology Co Ltd filed Critical Chengdu Rongchuang Zhigu Science and Technology Co Ltd
Priority to CN201510609134.8A priority Critical patent/CN105096279A/zh
Publication of CN105096279A publication Critical patent/CN105096279A/zh
Pending legal-status Critical Current

Links

Abstract

本发明公开了一种基于卷积神经网络的数字图像处理方法,属于数字图像处理方法技术领域,解决现有技术中不能有效地去除图像中的噪声、增强图像中的边缘或其他感兴趣的区域,从而达不到对图像中感兴趣的目标进行检测和测量的目的的问题。本发明的步骤为:(1)获取原始图像;(2)通过“输入层-卷积层-输出层”结构的卷积神经网络提取原始图像的特征,基于卷积神经网络提取的原始图像的空间特征构造一个新的卷积神经网络;(3)归一化新的卷积神经网络,然后神经元计算出用输入信号将权值和归一化处理后的值,再单独训练每个隐层得到权值,最后获得的神经元输出活性,得到最终图像。本发明用于图像处理。

Description

一种基于卷积神经网络的数字图像处理方法
技术领域
一种基于卷积神经网络的数字图像处理方法,用于图像处理,属于数字图像处理方法技术领域。
背景技术
图像增加方法不能有效的将原本模糊不清甚至根本无法分辨的原始图像处理成清晰的富含大量有用信息的可使用图像,并不能有效地去除图像中的噪声、增强图像中的边缘或其他感兴趣的区域,从而达不到对图像中感兴趣的目标进行检测和测量的目的。
1962年Hubel和Wiesel通过对猫视觉皮层细胞的研究,提出了感受野(Receptivefield)的概念,1984年日本学者Fukushima基于感受野概念提出的神经认知机(Neocognitron)可以看作是卷积神经网络的第一个实现网络,也是感受野概念在人工神经网络领域的首次应用。神经认知机将一个视觉模式分解成许多子模式(特征),然后进入分层递阶式相连的特征平面进行处理,它试图将视觉系统模型化,使其能够在即使物体有位移或轻微变形的时候,也能完成识别。神经认知机能够利用位移恒定能力从激励模式中学习,并且可识别这些模式的变化形,在其后的应用研究中,Fukushima将神经认知机主要用于手写数字的识别。随后,国内外的研究人员提出多种卷积神经网络形式,在邮政编码识别和人脸识别方面得到了大规模的应用。
发明内容
本发明针对现有技术的不足之处提供了一种基于卷积神经网络的数字图像处理方法,解决现有技术中不能有效地去除图像中的噪声、增强图像中的边缘或其他感兴趣的区域,从而达不到对图像中感兴趣的目标进行检测和测量的目的的问题。
为了实现上述目的,本发明采用的技术方案为:
一种基于卷积神经网络的数字图像处理方法,其特征在于,如下步骤:
(1)获取原始图像;
(2)通过“输入层-卷积层-输出层”结构的卷积神经网络提取原始图像的特征,基于卷积神经网络提取的原始图像的空间特征构造一个新的卷积神经网络;
(3)归一化新的卷积神经网络,然后神经元计算出用输入信号将权值和归一化处理后的值,再单独训练每个隐层得到权值,最后获得的神经元输出活性,得到最终图像。
进一步,所述步骤(2)中,通过卷积神经网络结构提取原始图像的空间特征,基于卷积神经网络提取的原始图像的空间特征构造一个新的卷积神经网络具体步骤如下:
(21)将原始图像直接输入到输入层,神经元提取图像的局部特征;
(22)卷积层包含多个平面,输入层中神经元提取图像的局部特征直接映射到卷积层包含的多个平面上;
(23)卷积层中各平面的神经元提取图像中特定区域的局部特征,并在训练时不断修正卷积层神经元的权值;
(24)输出层输出卷积层特定区域的局部特征,并构成新的卷积神经网络。
进一步,所述步骤(3)中,归一化新的卷积神经网络,然后神经元计算出用输入信号将权值和归一化处理后的值,再单独训练每个隐层得到权值,最后获得的神经元输出活性,得到最终图像可表示为:
其中r(v)是从v处到感受野中心的归一化距离;
C神经元的输出由给出,其中 &psi; ( x ) = x , x &GreaterEqual; 0 &beta; + x 0 , x < 0 , 式中β为一常量,kj是第一级中的卷积层平面的数量,D1是卷积层的感受野,最终得到神经元的输出活性为:
与现有技术相比,本发明的优点在于:
一、有效地去除了图像中的噪声、增强图像中的边缘或其他感兴趣的区域,从而达到了对图像中感兴趣的目标进行检测和测量的目的;
二、网络的输入是多维图像时表现的更为明显,使图像可以直接作为网络的输入,避免了传统识别算法中复杂的特征提取和数据重建过程。卷积网络是为识别二维形状而特殊设计的一个多层感知器,这种网络结构对平移、比例缩放、倾斜或者共他形式的变形具有高度不变性。
附图说明
图1为本发明的卷积神经网络结构示意图;
图2为本发明中卷积神经网络结构中神经元的连接示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步说明。
卷积神经网络是一个多层的神经网络,每层由多个二维平面组成,而每个平面由多个独立神经元组成。网络中包含一些简单元和复杂元,分别记为S-元和C-元。S-元聚合在一起组成S-面,S-面聚合在一起组成S-层,用Us表示。C-元、C-面和C-层(Us)之间存在类似的关系。网络的任一中间级由S-层与C-层串接而成,而输入级只含一层,它直接接受二维视觉模式,样本特征提取步骤已嵌入到卷积神经网络模型的互联结构中。一般地,Us为特征提取层,每个神经元的输入与前一层的局部感受野相连,并提取该局部的特征,一旦该局部特征被提取后,它与其他特征间的位置关系也随之确定下来;Uc是特征映射层,网络的每个计算层由多个特征映射组成,每个特征映射为一个平面,平面上所有神经元的权值相等。特征映射结构采用影响函数核小的sigmoid函数作为卷积网络的激活函数,使得特征映射具有位移不变性。此外,由于一个映射面上的神经元共享权值,因而减少了网络自由参数的个数,降低了网络参数选择的复杂度。卷积神经网络中的每一个特征提取层(S-层)都紧跟着一个用来求局部平均与二次提取的计算层(C-层),这种特有的两次特征提取结构使网络在识别时对输入样本有较高的畸变容忍能力。
一种基于卷积神经网络的数字图像处理方法,其特征在于,如下步骤:
(1)获取原始图像;
(2)通过“输入层-卷积层-输出层”结构的卷积神经网络提取原始图像的特征,基于卷积神经网络提取的原始图像的空间特征构造一个新的卷积神经网络;
(3)归一化新的卷积神经网络,然后神经元计算出用输入信号将权值和归一化处理后的值,再单独训练每个隐层得到权值,最后获得的神经元输出活性,得到最终图像。归一化新的卷积神经网络,然后神经元计算出用输入信号将权值和归一化处理后的值,再单独训练每个隐层得到权值,最后获得的神经元输出活性,得到最终图像可表示为:
其中r(v)是从v处到感受野中心的归一化距离;
C神经元的输出由给出,其中 &psi; ( x ) = x , x &GreaterEqual; 0 &beta; + x 0 , x < 0 , 式中β为一常量,kj是第一级中的卷积层平面的数量,D1是卷积层的感受野,最终得到神经元的输出活性为:
神经网络用于模式识别的主流是有指导学习网络,无指导学习网络更多的是用于聚类分析。对于有指导的模式识别,
由于任一样本的类别是已知的,样本在空间的分布不再是依据其自然分布倾向来划分,而是要根据同类样本在空间的分布及不同类样本之间的分离程度找一种适当的空间划分方法,或者找到一个分类边界,使得不同类样本分别位于不同的区域内。这就需要一个长时间且复杂的学习过程,不断调整用以划分样本空间的分类边界的位置,使尽可能少的样本被划分到非同类区域中。由于本文主要是检测图像中的人脸,所以可将样本空间分成两类:样本空间和非样本空间,因而本文所使用的学习网络也是有指导的学习网络。卷积网络在本质上是一种输入到输出的映射,它能够学习大量的输入与输出之间的映射关系,而不需要任何输入和输出之间的精确的数学表达式,只要用已知的模式对卷积网络加以训练,网络就具有输入输出对之间的映射能力。卷积网络执行的是有导师训练,所以其样本集是由形如:(输入向量,理想输出向量)的向量对构成的。所有这些向量对,都应该是来源于网络即将模拟的系统的实际“运行”结果。它们可以是从实际运行系统中采集来的。在开始训练前,所有的权都应该用一些不同的小随机数进行初始化。“小随机数”用来保证网络不会因权值过大而进入饱和状态,从而导致训练失败;“不同”用来保证网络可以正常地学习。实际上,如果用相同的数去初始化权矩阵,则网络无能力学习。

Claims (3)

1.一种基于卷积神经网络的数字图像处理方法,其特征在于,如下步骤:
(1)获取原始图像;
(2)通过“输入层-卷积层-输出层”结构的卷积神经网络提取原始图像的特征,基于卷积神经网络提取的原始图像的空间特征构造一个新的卷积神经网络;
(3)归一化新的卷积神经网络,然后神经元计算出用输入信号将权值和归一化处理后的值,
再单独训练每个隐层得到权值,最后获得的神经元输出活性,得到最终图像。
2.根据权利要求1所述的一种基于卷积神经网络的数字图像处理方法,其特征在于:所述步骤(2)中,通过卷积神经网络结构提取原始图像的空间特征,基于卷积神经网络提取的原始图像的空间特征构造一个新的卷积神经网络具体步骤如下:
(21)将原始图像直接输入到输入层,神经元提取图像的局部特征;
(22)卷积层包含多个平面,输入层中神经元提取图像的局部特征直接映射到卷积层包含的多个平面上;
(23)卷积层中各平面的神经元提取图像中特定区域的局部特征,并在训练时不断修正卷积层神经元的权值;
(24)输出层输出卷积层特定区域的局部特征,并构成新的卷积神经网络。
3.根据权利要求1所述的一种基于卷积神经网络的数字图像处理方法,其特征在于:所述步骤(3)中,归一化新的卷积神经网络,然后神经元计算出用输入信号将权值和归一化处理后的值,再单独训练每个隐层得到权值,最后获得的神经元输出活性,得到最终图像可表示为:
其中r(v)是从v处到感受野中心的归一化距离;
C神经元的输出由给出,其中 &psi; ( x ) = { x &beta; + x 0 , x < 0 , x &GreaterEqual; 0 , 式中β为一常量,kj是第一级中的卷积层平面的数量,D1是卷积层的感受野,最终得到神经元的输出活性为:
CN201510609134.8A 2015-09-23 2015-09-23 一种基于卷积神经网络的数字图像处理方法 Pending CN105096279A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510609134.8A CN105096279A (zh) 2015-09-23 2015-09-23 一种基于卷积神经网络的数字图像处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510609134.8A CN105096279A (zh) 2015-09-23 2015-09-23 一种基于卷积神经网络的数字图像处理方法

Publications (1)

Publication Number Publication Date
CN105096279A true CN105096279A (zh) 2015-11-25

Family

ID=54576630

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510609134.8A Pending CN105096279A (zh) 2015-09-23 2015-09-23 一种基于卷积神经网络的数字图像处理方法

Country Status (1)

Country Link
CN (1) CN105096279A (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105657402A (zh) * 2016-01-18 2016-06-08 深圳市未来媒体技术研究院 一种深度图恢复方法
CN105678292A (zh) * 2015-12-30 2016-06-15 成都数联铭品科技有限公司 基于卷积及递归神经网络的复杂光学文字序列识别系统
CN105740916A (zh) * 2016-03-15 2016-07-06 北京陌上花科技有限公司 图像特征编码方法及装置
CN105760930A (zh) * 2016-02-18 2016-07-13 天津大学 用于aer的多层脉冲神经网络识别系统
CN106127783A (zh) * 2016-07-01 2016-11-16 武汉泰迪智慧科技有限公司 一种基于深度学习的医疗影像识别系统
CN106373112A (zh) * 2016-08-31 2017-02-01 北京比特大陆科技有限公司 图像处理方法、装置和电子设备
CN106408086A (zh) * 2016-09-12 2017-02-15 上海影城有限公司 用于图像优化的深度学习神经网络处理方法及系统
CN106530227A (zh) * 2016-10-27 2017-03-22 北京小米移动软件有限公司 图像复原方法及装置
CN106846261A (zh) * 2016-12-21 2017-06-13 大连海事大学 基于卷积神经网络的水下图像处理方法
WO2017181723A1 (zh) * 2016-04-20 2017-10-26 广州视源电子科技股份有限公司 细纱断裂的检测方法和系统
WO2017198040A1 (en) * 2016-05-19 2017-11-23 Boe Technology Group Co., Ltd. Facial image processing apparatus, facial image processing method, and non-transitory computer-readable storage medium
CN107463962A (zh) * 2017-08-08 2017-12-12 张天君 一种显微人工智能鉴定皮包的方法和系统
WO2018018470A1 (zh) * 2016-07-27 2018-02-01 华为技术有限公司 一种去除图像噪声的方法、装置、设备及卷积神经网络
CN108846842A (zh) * 2018-07-04 2018-11-20 武汉斗鱼网络科技有限公司 一种图像噪声检测方法、装置及电子设备
CN109005409A (zh) * 2018-07-27 2018-12-14 浙江工业大学 一种基于目标检测与跟踪的智能视频编码方法
CN109102468A (zh) * 2018-06-27 2018-12-28 广州视源电子科技股份有限公司 图像增强方法、装置、终端设备及存储介质
CN110462637A (zh) * 2017-03-24 2019-11-15 华为技术有限公司 神经网络数据处理装置和方法
CN112347972A (zh) * 2020-11-18 2021-02-09 合肥湛达智能科技有限公司 一种基于深度学习的高动态感兴趣区域图像处理方法
CN112801125A (zh) * 2019-11-13 2021-05-14 辉达公司 合成用于训练一个或更多个神经网络的数据

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070086655A1 (en) * 2005-10-14 2007-04-19 Microsoft Corporation Unfolded convolution for fast feature extraction
CN104268524A (zh) * 2014-09-24 2015-01-07 朱毅 一种基于动态调整训练目标的卷积神经网络的图像识别方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070086655A1 (en) * 2005-10-14 2007-04-19 Microsoft Corporation Unfolded convolution for fast feature extraction
CN104268524A (zh) * 2014-09-24 2015-01-07 朱毅 一种基于动态调整训练目标的卷积神经网络的图像识别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BEAT FASEL: "Robust face analysis using convolutional neural networks", 《16TH INTERNATIONAL CONFERENCE ON PATTERN RECOGNITION》 *
LIHAO19870926: "卷积神经网络", 《百度文库HTTPS://WENKU.BAIDU.COM/VIEW/CD16FB8302D276A200292E22》 *
赵志宏 等: "基于卷积神经网络LeNet-5的车牌字符识别研究", 《系统仿真学报》 *

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105678292A (zh) * 2015-12-30 2016-06-15 成都数联铭品科技有限公司 基于卷积及递归神经网络的复杂光学文字序列识别系统
CN105657402A (zh) * 2016-01-18 2016-06-08 深圳市未来媒体技术研究院 一种深度图恢复方法
CN105760930A (zh) * 2016-02-18 2016-07-13 天津大学 用于aer的多层脉冲神经网络识别系统
CN105760930B (zh) * 2016-02-18 2018-06-05 天津大学 用于aer的多层脉冲神经网络识别系统
CN105740916A (zh) * 2016-03-15 2016-07-06 北京陌上花科技有限公司 图像特征编码方法及装置
CN105740916B (zh) * 2016-03-15 2019-03-26 北京陌上花科技有限公司 图像特征编码方法及装置
WO2017181723A1 (zh) * 2016-04-20 2017-10-26 广州视源电子科技股份有限公司 细纱断裂的检测方法和系统
WO2017198040A1 (en) * 2016-05-19 2017-11-23 Boe Technology Group Co., Ltd. Facial image processing apparatus, facial image processing method, and non-transitory computer-readable storage medium
US10621415B2 (en) 2016-05-19 2020-04-14 Boe Technology Group Co., Ltd. Facial image processing apparatus, facial image processing method, and non-transitory computer-readable storage medium
CN106127783A (zh) * 2016-07-01 2016-11-16 武汉泰迪智慧科技有限公司 一种基于深度学习的医疗影像识别系统
CN108604369A (zh) * 2016-07-27 2018-09-28 华为技术有限公司 一种去除图像噪声的方法、装置、设备及卷积神经网络
WO2018018470A1 (zh) * 2016-07-27 2018-02-01 华为技术有限公司 一种去除图像噪声的方法、装置、设备及卷积神经网络
CN108604369B (zh) * 2016-07-27 2020-10-27 华为技术有限公司 一种去除图像噪声的方法、装置、设备及卷积神经网络
CN106373112B (zh) * 2016-08-31 2020-08-04 北京比特大陆科技有限公司 图像处理方法、装置和电子设备
CN106373112A (zh) * 2016-08-31 2017-02-01 北京比特大陆科技有限公司 图像处理方法、装置和电子设备
CN106408086A (zh) * 2016-09-12 2017-02-15 上海影城有限公司 用于图像优化的深度学习神经网络处理方法及系统
CN106530227B (zh) * 2016-10-27 2019-08-06 北京小米移动软件有限公司 图像复原方法及装置
CN106530227A (zh) * 2016-10-27 2017-03-22 北京小米移动软件有限公司 图像复原方法及装置
CN106846261A (zh) * 2016-12-21 2017-06-13 大连海事大学 基于卷积神经网络的水下图像处理方法
CN110462637A (zh) * 2017-03-24 2019-11-15 华为技术有限公司 神经网络数据处理装置和方法
CN110462637B (zh) * 2017-03-24 2022-07-19 华为技术有限公司 神经网络数据处理装置和方法
CN107463962A (zh) * 2017-08-08 2017-12-12 张天君 一种显微人工智能鉴定皮包的方法和系统
CN107463962B (zh) * 2017-08-08 2020-06-02 张天君 一种显微人工智能鉴定皮包的方法和系统
CN109102468A (zh) * 2018-06-27 2018-12-28 广州视源电子科技股份有限公司 图像增强方法、装置、终端设备及存储介质
CN109102468B (zh) * 2018-06-27 2021-06-01 广州视源电子科技股份有限公司 图像增强方法、装置、终端设备及存储介质
CN108846842B (zh) * 2018-07-04 2021-04-27 武汉斗鱼网络科技有限公司 一种图像噪声检测方法、装置及电子设备
CN108846842A (zh) * 2018-07-04 2018-11-20 武汉斗鱼网络科技有限公司 一种图像噪声检测方法、装置及电子设备
CN109005409A (zh) * 2018-07-27 2018-12-14 浙江工业大学 一种基于目标检测与跟踪的智能视频编码方法
CN109005409B (zh) * 2018-07-27 2021-04-09 浙江工业大学 一种基于目标检测与跟踪的智能视频编码方法
CN112801125A (zh) * 2019-11-13 2021-05-14 辉达公司 合成用于训练一个或更多个神经网络的数据
CN112347972A (zh) * 2020-11-18 2021-02-09 合肥湛达智能科技有限公司 一种基于深度学习的高动态感兴趣区域图像处理方法

Similar Documents

Publication Publication Date Title
CN105096279A (zh) 一种基于卷积神经网络的数字图像处理方法
Al Bashish et al. A framework for detection and classification of plant leaf and stem diseases
CN105488536B (zh) 一种基于多特征深度学习技术的农田害虫图像识别方法
CN108615010A (zh) 基于平行卷积神经网络特征图融合的人脸表情识别方法
CN106446942A (zh) 基于增量学习的农作物病害识别方法
CN110956111A (zh) 人工智能cnn、lstm神经网络步态识别系统
CN108009525A (zh) 一种基于卷积神经网络的无人机对地特定目标识别方法
CN107451565B (zh) 一种半监督小样本深度学习图像模式分类识别方法
CN106529442A (zh) 一种行人识别方法和装置
CN108416318A (zh) 基于数据增强的合成孔径雷达图像目标深度模型识别方法
CN108985252B (zh) 改进的脉冲深度神经网络的图像分类方法
CN109299701A (zh) 基于gan扩充多人种特征协同选择的人脸年龄估计方法
CN106295124A (zh) 利用多种图像检测技术综合分析基因子图相似概率量的方法
CN101980248A (zh) 基于改进视觉注意力模型的自然场景目标检测方法
Pan et al. A central-point-enhanced convolutional neural network for high-resolution remote-sensing image classification
CN105373777A (zh) 一种用于人脸识别的方法及装置
CN104459668A (zh) 基于深度学习网络的雷达目标识别方法
CN105930812A (zh) 一种基于融合特征稀疏编码模型的车辆品牌类型识别方法
CN110097029B (zh) 基于Highway网络多视角步态识别的身份认证方法
CN103198480A (zh) 基于区域和Kmeans聚类的遥感图像变化检测方法
CN106203450A (zh) 基于深度学习框架对图像进行特征提取的目标检测方法
CN108257151A (zh) 基于显著性分析的PCANet图像变化检测方法
CN113111758A (zh) 一种基于脉冲神经网络的sar图像舰船目标识别方法
CN111539320B (zh) 基于互相学习网络策略的多视角步态识别方法及系统
CN113344045A (zh) 一种结合hog特征提高sar船只分类精度的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20151125