CN106991374A - 基于卷积神经网络和随机森林的手写数字识别方法 - Google Patents

基于卷积神经网络和随机森林的手写数字识别方法 Download PDF

Info

Publication number
CN106991374A
CN106991374A CN201710131513.XA CN201710131513A CN106991374A CN 106991374 A CN106991374 A CN 106991374A CN 201710131513 A CN201710131513 A CN 201710131513A CN 106991374 A CN106991374 A CN 106991374A
Authority
CN
China
Prior art keywords
neural networks
convolutional neural
random forest
sample
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710131513.XA
Other languages
English (en)
Inventor
丁世飞
侯艳路
张楠
张健
赵星宇
曾凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Mining and Technology CUMT
Original Assignee
China University of Mining and Technology CUMT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Mining and Technology CUMT filed Critical China University of Mining and Technology CUMT
Priority to CN201710131513.XA priority Critical patent/CN106991374A/zh
Publication of CN106991374A publication Critical patent/CN106991374A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/333Preprocessing; Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification

Abstract

本发明一种基于卷积神经网络和随机森林的手写体数字识别方法,通过将卷积神经网络提取数字图像的特征,之后将特征交给随机森林完成分类,这样使得模型在提取特征的过程中大大减少了时间,既克服了CNN训练时间过长的问题,又解决了在RF在人工选取特征的缺陷,最后达到了很好的识别效果。

Description

基于卷积神经网络和随机森林的手写数字识别方法
技术领域
本发明涉及模式识别和机器学习领域,具体涉及一种结合卷积神经网络和随机森林的手写数字识别方法。
背景技术
手写数字识别包含在字符识别技术中,是模式识别的一种。处理一些数据信息的关键技术就是手写数字识别,比如财务报表、邮政编码、各种票据等等。手写数字识别的改进和研究不仅具有重大的现实意义和应用价值,还有着极其关键的理论价值。
卷积神经网络(Convolutional Neural Network,CNN)是深度学习算法的一种,广泛应用在图像识别领域。CNN通过一层一层的学习,可以自动从输入图像中提取特征,在面对不同的图像识别任务时都有很好的效果,被认为是通用图像识别系统的代表之一。但是CNN在训练的过程中需要采用BP算法来调整参数,这个过程会消耗大量时间。随机权值的网络在近几年的研究中被证明同样可以取得很好的效果。
随机森林(Random Forests,RF)是Leo Breiman在2001年发表的论文中提出的一种新的机器学习算法,在分类和回归上具有很高的精度,训练速度快并且不容易出现过拟合的问题,在抗噪方面也表现良好,现有的基于随机森林的分类器都依赖手工选取的特征,然而手工选取是非常费力而且需要专业知识的方法,能否选好很大程度上取决于经验和运气。
发明内容
基于以上问题,本发明提出一种基于卷积神经网络和随机森林的手写数字识别方法,用随机权值的CNN提取数字图像的特征,然后交给RF完成分类。这样使得模型在提取特征的过程中大大减少了时间,既克服了CNN训练时间过长的问题,又解决了在RF在人工选取特征的缺陷。
本发明的技术方案如下:一种基于卷积神经网络和随机森林的手写体数字识别方法,具体步骤如下:
步骤1,采集手写数字图像生成训练集和测试集;
步骤2,构造并初始化卷积神经网络:该网络包括:输入层、两个卷积层、两个降采样层和一个全连接层,其中:输入层的数据是手写数字图像,是28*28像素点构成的矩阵,卷积层C1有10个特征图,降采样层S2同样有10个特征图,卷积层C3则有20个特征图,S4层对C3层特征图基础上进行降采样得到20张特征图,此时得到特征数据;
步骤3,训练随机森林分类器,随机森林是一种统计学习理论,它利用bootstrap重抽样方法从原始样本中抽取多个样本,然后对每个bootstrap样本进行决策树建模,然后组成多棵决策树进行预测,最终投票得出预测结果。具体过程如下:
步骤3.1:从样本集中用bootstrap采样选出n个样本;
步骤3.2:从所有属性中随机选择k个属性,选择最佳分割属性作为节点建立CART决策树;
步骤3.3:重复以上两步m次,即建立了m棵CART决策树,这m棵CART决策树形成随机森林,通过投票表决结果,决定数据属于哪一类。
步骤4:手写数字的识别,从卷积神经网络中得到特征数据之后,将特征数据输入到训练好的随机森林分类器中从而得到手写数字识别结果。
通过以上内容可知,本申请提供的是一种基于卷积神经网络和随机森林的手写体数字识别方法,首先手写数字图像的数据集,分为训练集和测试集,然后设计网络的层数、特征图的数目和卷积核的大小等等,之后用随机化权值的卷积神经网络提取数字图像的特征,最后输入到随机森林分类器中完成分类。本申请通过卷积神经网络提取手写数字图像的特征,避免了显示的特征提取,直接将图片作为网络的输入;避免了深度学习训练时间长的缺点,训练时间短;同时识别精度也比较高。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种手写体数字识别方法的流程图。
图2为本申请所使用的卷积神经网络结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
实施例1
如图1所示,本实施例包括以下步骤:
步骤1,采集手写数字图像生成训练集和测试集;
步骤2,构建卷积神经网络:
本实施例中采用的卷积神经网络是深度学习广泛应用的一个模型,尤其在图片领域非常高效,它是一个多层的神经网络,可以完成特征的自动提取和分类。输入层的图像通过若干个可训练的卷积核和偏置进行卷及特征提取之后会在C1得到相应的特征图,然后经过池化之后,加上权值和偏置之后输入到Sigmoid函数再次得到特征图,C3层和S4层特征图的提取与C1层和S2层类似,最终这些特征图连接为一个向量输入到传统的神经网络中,得到输出进而完成分类。
步骤2.1:构造如图2所示的多层神经网络,包括输入层,两个卷积层,两个降采样层和一个全连接层,C层为卷积层,C层中的神经元通过局部感受野(一个卷积核,比如5*5大小)与上层相连接,并通过卷积计算提取该局部的特征,使用单调递增的Sigmoid函数作为激活函数;S层为降采样层,用池化的方法进行二次特征提取。这种C层和S层交替出现的结构使网络对输入样本有较高的畸变容忍能力;
步骤2.2:卷积神经网络的输入为28*28的灰度图,卷积层C1卷积核大小为5*5,有10张特征图,降采样层S2有10张特征图,卷积层C3由S2的10张特征图经卷积而后得到20张特征图,因为特征图的数量较少,为了得到更全面的特征,组合方式采用全连接的方式,降采样层S4有20张特征图,全连接层将S4的20张特征图排列,设置500个节点;
步骤2.3:随机初始化卷积神经网络的权值,将样本(X,Y)输入到网络中,其中X是样本的数据,Y是标签,经过逐层计算得到样本的特征。
步骤3,训练随机森林分类器,随机森林算法是由Leo Breiman提出,其实质是一个包含K个决策树的分类器,这些决策树的形成采用了随机的方法,因此也叫随机决策树,树与树之间是没有关联的。它采用bootstrap重抽样方法从原始样本中抽取n个样本;对每个样本从所有属性中选择k个属性,选择最佳属性作为节点建立CART决策树;重复m次建立m棵CART决策树,这m棵CART形成随机森林,通过投票得到最终投票结果。
步骤3.1:从样本集中用bootstrap采样选出n个样本;
步骤3.2:从所有属性中随机选择k个属性,选择最佳分裂属性作为节点建立CART决策树,其中最佳分裂指数是根据gini指数来选择的:假设集合T中包含N个类别的记录,其中gini指数就是根据式来计算的,其中pj代表类j出现的概率,如果集合T分成m部分N1,N2,…,Nm。那么这个分裂的gini系数就是
对于所有的属性都要遍历所有可能的分裂方式,然后选择具有最小指数的分裂作为分裂标准。然后每棵树任意生长,不进行剪枝。
步骤3.3:重复以上两步m次,即建立了m棵CART决策树,这m棵CART决策树形成随机森林,通过投票表决结果,决定数据属于哪一类。
步骤4,手写数字识别:将卷积神经网络提取得到的测试特征数据输入训练好的随机森林分类器,最终得到测试结果。

Claims (5)

1.一种基于卷积神经网络和随机森林的手写体数字识别方法,其特征在于,包括以下步骤:
步骤1:采集手写数字图像生成训练集和测试集;
步骤2:构造并初始化卷积神经网络:该网络包括:输入层、两个卷积层、两个降采样层和一个全连接层,随机初始化卷积神经网络的权值,将样本输入到网络中,经过逐层计算得到样本的特征。
步骤3:训练随机森林分类器,利用bootstrap重抽样方法从样本中抽取多个样本,然后对每个bootstrap样本进行决策树建模,然后组成多棵决策树进行预测,最终投票得出预测结果;
步骤4:手写数字的识别,从卷积神经网络中得到特征数据之后,将特征数据输入到训练好的随机森林分类器中从而得到手写数字识别结果。
2.根据权利要求1所述的基于卷积神经网络和随机森林的手写数字识别方法,其特征在于,所述步骤1中采集数字图像生成训练集和测试集,都为(X,Y)形式,其中X为数字图像的输入向量,Y为标签。
3.根据权利要求所述的基于卷积神经网络和随机森林的手写数字识别方法,其特征在于,所述步骤2具体为:积神经网络的输入为28*28的灰度图,卷积层C1卷积核大小为5*5,有10张特征图,降采样层S2有10张特征图,卷积层C3由S2的10张特征图经卷积而后得到20张特征图,因为特征图的数量较少,为了得到更全面的特征,组合方式采用全连接的方式,降采样层S4有20张特征图,全连接层将S4的20张特征图排列,设置500个节点;随机初始化卷积神经网络的权值,将样本输入到网络中,经过逐层计算得到样本的特征。
4.根据权利要求所述的基于卷积神经网络和随机森林的手写数字识别方法,其特征在于,所述步骤3具体为:训练随机森林分类器,具体包括:
1、从样本集中用bootstrap采样选出n个样本;
2、所有属性中随机选择k个属性,选择最佳分裂属性作为节点建立CART决策树,其中最佳分裂指数是根据gini指数来选择的:假设集合T中包含N个类别的记录,其中gini指数就是根据式来计算的,其中pj代表类j出现的概率,如果集合T分成m部分N1,N2,…,Nm。那么这个分裂的gini系数就是 gini s p l i t ( T ) = N 1 N g i n i ( T 1 ) + ... + N m N g i n i ( T m )
对于所有的属性都要遍历所有可能的分裂方式,然后选择具有最小指数的分裂作为分裂标准。然后每棵树任意生长,不进行剪枝;
3、重复以上两步m次,即建立了m棵CART决策树,这m棵CART决策树形成随机森林,通过投票表决结果,决定数据属于哪一类。
5.根据权利要求所述的基于卷积神经网络和随机森林的手写数字识别方法,其特征在于,所述步骤4具体为:将卷积神经网络提取得到的测试特征数据输入训练好的随机森林分类器,最终得到测试结果。
CN201710131513.XA 2017-03-07 2017-03-07 基于卷积神经网络和随机森林的手写数字识别方法 Pending CN106991374A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710131513.XA CN106991374A (zh) 2017-03-07 2017-03-07 基于卷积神经网络和随机森林的手写数字识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710131513.XA CN106991374A (zh) 2017-03-07 2017-03-07 基于卷积神经网络和随机森林的手写数字识别方法

Publications (1)

Publication Number Publication Date
CN106991374A true CN106991374A (zh) 2017-07-28

Family

ID=59412185

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710131513.XA Pending CN106991374A (zh) 2017-03-07 2017-03-07 基于卷积神经网络和随机森林的手写数字识别方法

Country Status (1)

Country Link
CN (1) CN106991374A (zh)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107991873A (zh) * 2017-12-11 2018-05-04 中国矿业大学 一种基于卷积神经网络及bp神经网络的地铁杂散电流泄漏等级预测方法
CN108108764A (zh) * 2017-12-26 2018-06-01 东南大学 一种基于随机森林的视觉slam回环检测方法
CN108171144A (zh) * 2017-12-26 2018-06-15 四川大学 信息处理方法、装置、电子设备及存储介质
CN108231067A (zh) * 2018-01-13 2018-06-29 福州大学 基于卷积神经网络与随机森林分类的声音场景识别方法
CN108304889A (zh) * 2018-03-05 2018-07-20 南方医科大学 一种基于深度学习的全数字乳腺成像图像放射组学方法
CN108364036A (zh) * 2017-12-28 2018-08-03 顺丰科技有限公司 一种建模方法、识别方法、装置、存储介质及设备
CN108416390A (zh) * 2018-03-16 2018-08-17 西北工业大学 基于二维卷积降维的手写字体识别方法
CN108737290A (zh) * 2018-05-11 2018-11-02 南开大学 基于负载映射与随机森林的非加密流量识别方法
CN108776805A (zh) * 2018-05-03 2018-11-09 北斗导航位置服务(北京)有限公司 一种建立图像分类模型、图像特征分类的方法及装置
CN109886022A (zh) * 2019-02-20 2019-06-14 北京丁牛科技有限公司 Cms类型识别方法及装置
CN109948692A (zh) * 2019-03-16 2019-06-28 四川大学 基于多颜色空间卷积神经网络及随机森林的计算机生成图片检测方法
CN110084303A (zh) * 2019-04-28 2019-08-02 北京工业大学 一种基于cnn与rf高维多粒度特征选择方法
CN110414483A (zh) * 2019-08-13 2019-11-05 山东浪潮人工智能研究院有限公司 一种基于深度神经网络和随机森林的人脸识别方法及系统
CN111079647A (zh) * 2019-12-17 2020-04-28 国网江苏省电力有限公司检修分公司 一种断路器缺陷识别方法
CN111474186A (zh) * 2020-03-31 2020-07-31 安徽理工大学 一种x光成像和cnn的快递包裹违禁品检测方法
CN111832417A (zh) * 2020-06-16 2020-10-27 杭州电子科技大学 基于cnn-lstm模型和迁移学习的信号调制样式识别方法
CN115064184A (zh) * 2022-06-28 2022-09-16 镁佳(北京)科技有限公司 一种音频文件乐器含量识别向量表示方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103366180A (zh) * 2013-06-14 2013-10-23 山东大学 一种基于自动特征学习的细胞图像分割方法
CN105320961A (zh) * 2015-10-16 2016-02-10 重庆邮电大学 基于卷积神经网络和支持向量机的手写数字识别方法
CN105844300A (zh) * 2016-03-24 2016-08-10 河南师范大学 一种基于随机森林算法的优化分类方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103366180A (zh) * 2013-06-14 2013-10-23 山东大学 一种基于自动特征学习的细胞图像分割方法
CN105320961A (zh) * 2015-10-16 2016-02-10 重庆邮电大学 基于卷积神经网络和支持向量机的手写数字识别方法
CN105844300A (zh) * 2016-03-24 2016-08-10 河南师范大学 一种基于随机森林算法的优化分类方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
周荣强: "视频中手势跟踪与手写数字识别研究", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 *
施荣: "基于深度卷积神经网络的毫米波图像目标检测方法研究", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 *
曹正凤: "随机森林算法优化研究", 《中国博士学位论文全文数据库(社会科学Ⅱ辑)》 *

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107991873B (zh) * 2017-12-11 2020-09-29 中国矿业大学 一种基于卷积神经网络及bp神经网络的地铁杂散电流泄漏等级预测方法
CN107991873A (zh) * 2017-12-11 2018-05-04 中国矿业大学 一种基于卷积神经网络及bp神经网络的地铁杂散电流泄漏等级预测方法
CN108108764A (zh) * 2017-12-26 2018-06-01 东南大学 一种基于随机森林的视觉slam回环检测方法
CN108171144A (zh) * 2017-12-26 2018-06-15 四川大学 信息处理方法、装置、电子设备及存储介质
CN108108764B (zh) * 2017-12-26 2021-12-24 东南大学 一种基于随机森林的视觉slam回环检测方法
CN108171144B (zh) * 2017-12-26 2020-12-11 四川大学 信息处理方法、装置、电子设备及存储介质
CN108364036A (zh) * 2017-12-28 2018-08-03 顺丰科技有限公司 一种建模方法、识别方法、装置、存储介质及设备
CN108231067A (zh) * 2018-01-13 2018-06-29 福州大学 基于卷积神经网络与随机森林分类的声音场景识别方法
CN108304889A (zh) * 2018-03-05 2018-07-20 南方医科大学 一种基于深度学习的全数字乳腺成像图像放射组学方法
CN108416390A (zh) * 2018-03-16 2018-08-17 西北工业大学 基于二维卷积降维的手写字体识别方法
CN108416390B (zh) * 2018-03-16 2019-11-01 西北工业大学 基于二维卷积降维的手写字体识别方法
CN108776805A (zh) * 2018-05-03 2018-11-09 北斗导航位置服务(北京)有限公司 一种建立图像分类模型、图像特征分类的方法及装置
CN108737290A (zh) * 2018-05-11 2018-11-02 南开大学 基于负载映射与随机森林的非加密流量识别方法
CN109886022A (zh) * 2019-02-20 2019-06-14 北京丁牛科技有限公司 Cms类型识别方法及装置
CN109948692B (zh) * 2019-03-16 2020-12-15 四川大学 基于多颜色空间卷积神经网络及随机森林的计算机生成图片检测方法
CN109948692A (zh) * 2019-03-16 2019-06-28 四川大学 基于多颜色空间卷积神经网络及随机森林的计算机生成图片检测方法
CN110084303A (zh) * 2019-04-28 2019-08-02 北京工业大学 一种基于cnn与rf高维多粒度特征选择方法
CN110084303B (zh) * 2019-04-28 2022-02-15 北京工业大学 一种基于cnn与rf的老年人平衡能力特征选择方法
CN110414483A (zh) * 2019-08-13 2019-11-05 山东浪潮人工智能研究院有限公司 一种基于深度神经网络和随机森林的人脸识别方法及系统
CN111079647A (zh) * 2019-12-17 2020-04-28 国网江苏省电力有限公司检修分公司 一种断路器缺陷识别方法
CN111474186A (zh) * 2020-03-31 2020-07-31 安徽理工大学 一种x光成像和cnn的快递包裹违禁品检测方法
CN111832417A (zh) * 2020-06-16 2020-10-27 杭州电子科技大学 基于cnn-lstm模型和迁移学习的信号调制样式识别方法
CN111832417B (zh) * 2020-06-16 2023-09-15 杭州电子科技大学 基于cnn-lstm模型和迁移学习的信号调制样式识别方法
CN115064184A (zh) * 2022-06-28 2022-09-16 镁佳(北京)科技有限公司 一种音频文件乐器含量识别向量表示方法及装置

Similar Documents

Publication Publication Date Title
CN106991374A (zh) 基于卷积神经网络和随机森林的手写数字识别方法
CN110516085B (zh) 基于双向注意力的图像文本互检索方法
CN106326899A (zh) 一种基于高光谱图像和深度学习算法的烟叶分级方法
CN110516596A (zh) 基于Octave卷积的空谱注意力高光谱图像分类方法
CN107798381A (zh) 一种基于卷积神经网络的图像识别方法
Abramson et al. Hailfinder: A Bayesian system for forecasting severe weather
CN104850890B (zh) 基于实例学习和Sadowsky分布的卷积神经网络参数调整方法
CN108062756A (zh) 基于深度全卷积网络和条件随机场的图像语义分割方法
CN105069468A (zh) 基于脊波和深度卷积网络的高光谱图像分类方法
CN108984745A (zh) 一种融合多知识图谱的神经网络文本分类方法
CN109241255A (zh) 一种基于深度学习的意图识别方法
CN107230113A (zh) 一种多模型融合的房产评估方法
CN104050507B (zh) 基于多层神经网络的超光谱图像分类方法
CN106650725A (zh) 基于全卷积神经网络的候选文本框生成和文本检测方法
CN107622272A (zh) 一种图像分类方法及装置
CN106022273A (zh) 基于动态样本选择策略的bp神经网络手写体识别系统
CN102324038B (zh) 一种基于数字图像的植物种类识别方法
CN107316054A (zh) 基于卷积神经网络和支持向量机的非标准字符识别方法
CN106339753A (zh) 一种有效提升卷积神经网络稳健性的方法
CN106529508A (zh) 基于局部和非局部多特征语义高光谱图像分类方法
Dou et al. Time series remote sensing image classification framework using combination of deep learning and multiple classifiers system
CN109446332A (zh) 一种基于特征迁移和自适应学习的人民调解案例分类系统及方法
CN108804677A (zh) 结合多层级注意力机制的深度学习问题分类方法及系统
CN109582782A (zh) 一种基于用弱监督深度学习的文本聚类方法
CN106529503A (zh) 一种集成卷积神经网络人脸情感识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170728