CN110287840B - 手写图像识别方法 - Google Patents
手写图像识别方法 Download PDFInfo
- Publication number
- CN110287840B CN110287840B CN201910521280.3A CN201910521280A CN110287840B CN 110287840 B CN110287840 B CN 110287840B CN 201910521280 A CN201910521280 A CN 201910521280A CN 110287840 B CN110287840 B CN 110287840B
- Authority
- CN
- China
- Prior art keywords
- layer
- image
- neural network
- matrix
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/30—Writer recognition; Reading and verifying signatures
- G06V40/33—Writer recognition; Reading and verifying signatures based only on signature image, e.g. static signature recognition
Abstract
本发明涉及一种手写图像识别方法,对数据集中随机选取数据进行预处理后送入BP神经网络进行训练,训练后BP神经网络对数据进行图像识别,以BP神经网络为核心,针对BP网络进行改进,在大大降低网络复杂度的同时还能增加其判别能力,从而大大增强了分类器的分辨能力,通过改进结构后的算法对手写数字进行识别,极大的降低由于人员经验不足与疏忽大意所造成的诊断失误,从而提高了检测的准确率,减少误判和漏判问题的发生。
Description
技术领域
本发明涉及一种图像识别技术,特别涉及一种手写图像识别方法。
背景技术
手写数字识别是符号识别的一个分支,虽然只是识别简单的10个数字,但却有着非常大的实用价值。在我们的日常生活中,每天都要进行大量的文档处理工作,税单、银行支票、汇款单、信用卡账单的处理,以及邮局信函的分检等等,如何利用计算机字符识别和文档处理技术,使人们从这些繁重的手工劳动中解放出来已成为一个迫切需要解决的问题。手写数字虽然只有10个种类,但很多情况下对识别的精度要求非常高,而且每个人都有不同的字迹,要做到准确地识别还是有一定难度的。况且在实际应用中,手写数字识别的精确度要求要比汉字严格的多,因为数字识别经常用在财务、金融等领域。
发明内容
本发明是针对手写数字识别的问题,提出了一种手写图像识别方法,设计一个增强型的全新模型来实现手写数字的辅助识别,避免由于人员经验不足与疏忽大意,以及字体模糊不清,难以识别所造成的诊断失误,从而提高了检测的诊断率,减少误判和漏判问题的发生。
本发明的技术方案为:一种手写图像识别方法,具体包括如下步骤:
1)从数据集之中,随机选取数据中6万张图片作为训练集,剩余1万组作为测试集,训练集中包含0至9这10个手写数字图片各6千张,测试集10个手写数字图片各1000张,数据集中的图片图像大小为28*28;
2)、对选取的图像进行二值化处理,将待识别图像转换为二进制图像,再将图像大小进行缩放,统一缩放为大小10*10的图像,最后再将此10*10的图像进行重新排列,将其转换为1*100的维度数组;
3)、将训练集经过步骤2)处理后的6万个1*100的维度数组打乱顺序后带入BP神经网络进行训练,利用BP神经网络对此数组进行分类;将训练好的神经网络输入测试集经过步骤2)处理后的1万个1*100的维度数组进行检测,检测训练好的神经网络的识别正确率,正确率达到要求,此训练后神经网络可直接用于识别分类,如正确率达不到要求,则增加测试集重新进行神经网络训练。
所述步骤3)中BP神经网络中BP算法改进方法如下:
3.1)原BP算法中计算第i层到第i+1层的计算公式为:
式中Hi+1表示第i+1层的值,Hi表示第i层的值,ωi(i+1)表示第i层到i+1层的连接权值,ai+1表示第i层到i+1层的连接阈值,n为第i+1层的神经元个数,f为激活函数定义为:
3.2)对连接权值ωi(i+1)进行改进,改进方式如下;
3.2.1)首先定义一个数组矩阵mi(i+1),这个矩阵与ωi(i+1)的行数与列数相同;
3.2.2)再利用均匀随机分布函数,在矩阵mi(i+1)中随机生成[0,1]区间的数据;
3.2.3)最后利用分类函数g(x)对矩阵mi(i+1)中的数据进行分类,将mi(i+1)有一个[0,1]区间的矩阵转换成一个由0和1组成的矩阵,g(x)分类函数如下:
3.2.4)将生成的0,1矩阵mi(i+1)与BP中的连接权值ωi(i+1)进行点乘,生成一个新的数组矩阵,我们将其定义为Si(i+1),其生成公式为:
Si(i+1)=mi(i+1)·ωi(i+1)
3.2.5)这样我们就得到新的第i层到第i+1层的计算公式,其公式为:
本发明的有益效果在于:本发明手写图像识别方法,以BP(back propagation)神经网络为核心,针对BP网络进行改进,在大大降低网络复杂度的同时还能增加其判别能力,从而大大增强了分类器的分辨能力,通过改进结构后的算法对手写数字进行识别,极大的降低由于人员经验不足与疏忽大意所造成的诊断失误,从而提高了检测的准确率,减少误判和漏判问题的发生。
附图说明
图1为本发明手写图像识别方法流程示意图;
图2为本发明改进的BP算法的流程示意图。
具体实施方式
如图1所示手写图像识别方法流程示意图,具体包括如下步骤:
1、从数据集之中,随机选取数据中6万张图片作为训练集,剩余1万组作为测试集,训练集中包含0至9这10个手写数字图片各6千张,测试集10个手写数字图片各1000张。数据集中的图片图像大小为28*28。
2、对选取的图像进行二值化处理,将待识别图像转换为二进制图像。再将图像大小进行缩放,统一缩放为大小10*10的图像,最后再将此10*10的图像进行重新排列,将其转换为1*100的维度数组。
3、将训练集经过步骤2处理后的6万个1*100的维度数组带入BP神经网络进行训练,利用BP神经网络对此数组进行直接分类。在此过程中我们将0-9的图像打乱顺序后全部带入神经网络中。进行训练,将训练好的神经网络输入测试集经过步骤2处理后的1万个1*100的维度数组进行检测,检测训练好的神经网络的识别正确率,正确率达到要求,此训练后神经网络可直接用于识别分类,如正确率达不到要求,则增加测试集重新进行神经网络训练。
如图2所示改进的BP算法的流程示意图,实现如下:
3.1对于原有的BP网络进行改进,原BP算法中计算第i层到第i+1层的计算公式为:
式中Hi+1表示第i+1层的值,Hi表示第i层的值,ωi(i+1)表示第i层到i+1层的连接权值,ai+1表示第i层到i+1层的连接阈值,n为第i+1层的神经元个数,f为激活函数定义为:
x为第i层所得到的结果,作为输入;
3.2对上式中的连接权值ωi(i+1)进行改进,在大大降低网络复杂度的同时还能增加其判别能力,从而大大增强了分类器的分辨能力,改进方式如下;
3.2.1、首先定义一个数组矩阵mi(i+1),这个矩阵与ωi(i+1)的行数与列数相同;
3.2.2、再利用均匀随机分布函数,在矩阵mi(i+1)中随机生成[0,1]区间的数据;
3.2.4、将生成的0,1矩阵mi(i+1)与BP中的连接权值ωi(i+1)进行点乘,生成一个新的数组矩阵,我们将其定义为Si(i+1),其生成公式为:Si(i+1)=mi(i+1)·ωi(i+1)
3.2.5、这样我们就得到新的第i层到第i+1层的计算公式,其公式为:
Claims (1)
1.一种手写图像识别方法,其特征在于,具体包括如下步骤:
1)从数据集之中,随机选取数据中6万张图片作为训练集,剩余1万组作为测试集,训练集中包含0至9这10个手写数字图片各6千张,测试集10个手写数字图片各1000张,数据集中的图片图像大小为28*28;
2)对选取的图像进行二值化处理,将待识别图像转换为二进制图像,再将图像大小进行缩放,统一缩放为大小10*10的图像,最后再将此10*10的图像进行重新排列,将其转换为1*100的维度数组;
3)将训练集经过步骤2)处理后的6万个1*100的维度数组打乱顺序后带入BP神经网络进行训练,利用BP神经网络对此数组进行分类;将训练好的神经网络输入测试集经过步骤2)处理后的1万个1*100的维度数组进行检测,检测训练好的神经网络的识别正确率,正确率达到要求,此训练后神经网络可直接用于识别分类,如正确率达不到要求,则增加测试集重新进行神经网络训练;所述步骤3)中BP神经网络中BP算法改进方法如下:
3.1)原BP算法中计算第i层到第i+1层的计算公式为:
式中Hi+1表示第i+1层的值,Hi表示第i层的值,ωi(i+1)表示第i层到i+1层的连接权值,ai+1表示第i层到i+1层的连接阈值,n为第i+1层的神经元个数,f为激活函数定义为:
3.2)对连接权值ωi(i+1)进行改进,改进方式如下;
3.2.1)首先定义一个数组矩阵mi(i+1),这个矩阵与ωi(i+1)的行数与列数相同;
3.2.2)再利用均匀随机分布函数,在矩阵mi(i+1)中随机生成[0,1]区间的数据;
3.2.3)最后利用分类函数g(x)对矩阵mi(i+1)中的数据进行分类,将mi(i+1)有一个[0,1]区间的矩阵转换成一个由0和1组成的矩阵,g(x)分类函数如下:
3.2.4)将生成的0,1矩阵mi(i+1)与BP中的连接权值ωi(i+1)进行点乘,生成一个新的数组矩阵,将其定义为Si(i+1),其生成公式为:
Si(i+1)=mi(i+1)·ωi(i+1)
3.2.5)这样就得到新的第i层到第i+1层的计算公式,其公式为:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910521280.3A CN110287840B (zh) | 2019-06-17 | 2019-06-17 | 手写图像识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910521280.3A CN110287840B (zh) | 2019-06-17 | 2019-06-17 | 手写图像识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110287840A CN110287840A (zh) | 2019-09-27 |
CN110287840B true CN110287840B (zh) | 2023-03-24 |
Family
ID=68005104
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910521280.3A Active CN110287840B (zh) | 2019-06-17 | 2019-06-17 | 手写图像识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110287840B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5553156A (en) * | 1994-04-12 | 1996-09-03 | Nippondenso Co., Ltd. | Signature recognition apparatus which can be trained with a reduced amount of sample data |
CN107153810A (zh) * | 2016-03-04 | 2017-09-12 | 中国矿业大学 | 一种基于深度学习的手写体数字识别方法及系统 |
CN108734168A (zh) * | 2018-05-18 | 2018-11-02 | 天津科技大学 | 一种手写数字的识别方法 |
CN108805221A (zh) * | 2017-04-28 | 2018-11-13 | 普天信息技术有限公司 | 手写数字识别方法及装置 |
CN109635799A (zh) * | 2018-12-17 | 2019-04-16 | 石家庄科林电气股份有限公司 | 一种燃气表字轮数字的识别方法 |
-
2019
- 2019-06-17 CN CN201910521280.3A patent/CN110287840B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5553156A (en) * | 1994-04-12 | 1996-09-03 | Nippondenso Co., Ltd. | Signature recognition apparatus which can be trained with a reduced amount of sample data |
CN107153810A (zh) * | 2016-03-04 | 2017-09-12 | 中国矿业大学 | 一种基于深度学习的手写体数字识别方法及系统 |
CN108805221A (zh) * | 2017-04-28 | 2018-11-13 | 普天信息技术有限公司 | 手写数字识别方法及装置 |
CN108734168A (zh) * | 2018-05-18 | 2018-11-02 | 天津科技大学 | 一种手写数字的识别方法 |
CN109635799A (zh) * | 2018-12-17 | 2019-04-16 | 石家庄科林电气股份有限公司 | 一种燃气表字轮数字的识别方法 |
Non-Patent Citations (1)
Title |
---|
基于 BP 神经网络的手写数字识别及优化方法;夏少杰;《智能物联技术》;20180718;第19-22页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110287840A (zh) | 2019-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Priya et al. | Online and offline character recognition: A survey | |
Laishram et al. | Simulation and modeling of handwritten Meitei Mayek digits using neural network approach | |
Miah et al. | Handwritten courtesy amount and signature recognition on bank cheque using neural network | |
Widiastuti et al. | Document image extraction system design | |
Susanto et al. | Histogram of gradient in k-nearest neighbor for Javanese alphabet classification | |
Ramteke et al. | Recognition of off-line MODI script: a structure similarity approach | |
Neri et al. | A Convolutional Neural Network for Handwritten Digit Recognition. | |
Hinduja et al. | Enhanced Character Recognition using Deep Neural Network-A Survey | |
CN110287840B (zh) | 手写图像识别方法 | |
Hemanth et al. | CNN-RNN BASED HANDWRITTEN TEXT RECOGNITION. | |
Kim et al. | Digitalizing scheme of handwritten Hanja historical documents | |
Pradeep et al. | An investigation on the performance of hybrid features for feed forward neural network based English handwritten character recognition system | |
Halder et al. | Individuality of isolated Bangla numerals | |
Halder et al. | Individuality of isolated Bangla characters | |
Ali et al. | Two stage classifier for Arabic handwritten character recognition | |
Athoillah et al. | Handwritten arabic numeral character recognition using multi kernel support vector machine | |
Ajao et al. | Yoruba handwriting word recognition quality evaluation of preprocessing attributes using information theory approach | |
Alqudah et al. | Shift and scale invariant recognition of printed numerals | |
Moni et al. | Handwritten character recognition system using a simple feature | |
Vats et al. | Offline Handwritten English Numeral Recognition using Correlation Method | |
Dash et al. | Non-correlated character recognition using artificial neural network | |
Tan et al. | Multiscale region projection method to discriminate between printed and handwritten text on registration forms | |
Syafie et al. | Comparison of Artificial Neural Network and Gaussian Naïve Bayes in Recognition of Hand-Writing Number | |
Halder et al. | Comparison of the classifiers in Bangla handwritten numeral recognition | |
Ramteke et al. | Recognition of offline MODI script |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |