CN110287840B - 手写图像识别方法 - Google Patents

手写图像识别方法 Download PDF

Info

Publication number
CN110287840B
CN110287840B CN201910521280.3A CN201910521280A CN110287840B CN 110287840 B CN110287840 B CN 110287840B CN 201910521280 A CN201910521280 A CN 201910521280A CN 110287840 B CN110287840 B CN 110287840B
Authority
CN
China
Prior art keywords
layer
image
neural network
matrix
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910521280.3A
Other languages
English (en)
Other versions
CN110287840A (zh
Inventor
常敏
陈果
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Shanghai for Science and Technology
Original Assignee
University of Shanghai for Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Shanghai for Science and Technology filed Critical University of Shanghai for Science and Technology
Priority to CN201910521280.3A priority Critical patent/CN110287840B/zh
Publication of CN110287840A publication Critical patent/CN110287840A/zh
Application granted granted Critical
Publication of CN110287840B publication Critical patent/CN110287840B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/30Writer recognition; Reading and verifying signatures
    • G06V40/33Writer recognition; Reading and verifying signatures based only on signature image, e.g. static signature recognition

Abstract

本发明涉及一种手写图像识别方法,对数据集中随机选取数据进行预处理后送入BP神经网络进行训练,训练后BP神经网络对数据进行图像识别,以BP神经网络为核心,针对BP网络进行改进,在大大降低网络复杂度的同时还能增加其判别能力,从而大大增强了分类器的分辨能力,通过改进结构后的算法对手写数字进行识别,极大的降低由于人员经验不足与疏忽大意所造成的诊断失误,从而提高了检测的准确率,减少误判和漏判问题的发生。

Description

手写图像识别方法
技术领域
本发明涉及一种图像识别技术,特别涉及一种手写图像识别方法。
背景技术
手写数字识别是符号识别的一个分支,虽然只是识别简单的10个数字,但却有着非常大的实用价值。在我们的日常生活中,每天都要进行大量的文档处理工作,税单、银行支票、汇款单、信用卡账单的处理,以及邮局信函的分检等等,如何利用计算机字符识别和文档处理技术,使人们从这些繁重的手工劳动中解放出来已成为一个迫切需要解决的问题。手写数字虽然只有10个种类,但很多情况下对识别的精度要求非常高,而且每个人都有不同的字迹,要做到准确地识别还是有一定难度的。况且在实际应用中,手写数字识别的精确度要求要比汉字严格的多,因为数字识别经常用在财务、金融等领域。
发明内容
本发明是针对手写数字识别的问题,提出了一种手写图像识别方法,设计一个增强型的全新模型来实现手写数字的辅助识别,避免由于人员经验不足与疏忽大意,以及字体模糊不清,难以识别所造成的诊断失误,从而提高了检测的诊断率,减少误判和漏判问题的发生。
本发明的技术方案为:一种手写图像识别方法,具体包括如下步骤:
1)从数据集之中,随机选取数据中6万张图片作为训练集,剩余1万组作为测试集,训练集中包含0至9这10个手写数字图片各6千张,测试集10个手写数字图片各1000张,数据集中的图片图像大小为28*28;
2)、对选取的图像进行二值化处理,将待识别图像转换为二进制图像,再将图像大小进行缩放,统一缩放为大小10*10的图像,最后再将此10*10的图像进行重新排列,将其转换为1*100的维度数组;
3)、将训练集经过步骤2)处理后的6万个1*100的维度数组打乱顺序后带入BP神经网络进行训练,利用BP神经网络对此数组进行分类;将训练好的神经网络输入测试集经过步骤2)处理后的1万个1*100的维度数组进行检测,检测训练好的神经网络的识别正确率,正确率达到要求,此训练后神经网络可直接用于识别分类,如正确率达不到要求,则增加测试集重新进行神经网络训练。
所述步骤3)中BP神经网络中BP算法改进方法如下:
3.1)原BP算法中计算第i层到第i+1层的计算公式为:
Figure BDA0002096771220000021
式中Hi+1表示第i+1层的值,Hi表示第i层的值,ωi(i+1)表示第i层到i+1层的连接权值,ai+1表示第i层到i+1层的连接阈值,n为第i+1层的神经元个数,f为激活函数定义为:
Figure BDA0002096771220000022
3.2)对连接权值ωi(i+1)进行改进,改进方式如下;
3.2.1)首先定义一个数组矩阵mi(i+1),这个矩阵与ωi(i+1)的行数与列数相同;
3.2.2)再利用均匀随机分布函数,在矩阵mi(i+1)中随机生成[0,1]区间的数据;
3.2.3)最后利用分类函数g(x)对矩阵mi(i+1)中的数据进行分类,将mi(i+1)有一个[0,1]区间的矩阵转换成一个由0和1组成的矩阵,g(x)分类函数如下:
Figure BDA0002096771220000023
3.2.4)将生成的0,1矩阵mi(i+1)与BP中的连接权值ωi(i+1)进行点乘,生成一个新的数组矩阵,我们将其定义为Si(i+1),其生成公式为:
Si(i+1)=mi(i+1)·ωi(i+1)
3.2.5)这样我们就得到新的第i层到第i+1层的计算公式,其公式为:
Figure BDA0002096771220000024
本发明的有益效果在于:本发明手写图像识别方法,以BP(back propagation)神经网络为核心,针对BP网络进行改进,在大大降低网络复杂度的同时还能增加其判别能力,从而大大增强了分类器的分辨能力,通过改进结构后的算法对手写数字进行识别,极大的降低由于人员经验不足与疏忽大意所造成的诊断失误,从而提高了检测的准确率,减少误判和漏判问题的发生。
附图说明
图1为本发明手写图像识别方法流程示意图;
图2为本发明改进的BP算法的流程示意图。
具体实施方式
如图1所示手写图像识别方法流程示意图,具体包括如下步骤:
1、从数据集之中,随机选取数据中6万张图片作为训练集,剩余1万组作为测试集,训练集中包含0至9这10个手写数字图片各6千张,测试集10个手写数字图片各1000张。数据集中的图片图像大小为28*28。
2、对选取的图像进行二值化处理,将待识别图像转换为二进制图像。再将图像大小进行缩放,统一缩放为大小10*10的图像,最后再将此10*10的图像进行重新排列,将其转换为1*100的维度数组。
3、将训练集经过步骤2处理后的6万个1*100的维度数组带入BP神经网络进行训练,利用BP神经网络对此数组进行直接分类。在此过程中我们将0-9的图像打乱顺序后全部带入神经网络中。进行训练,将训练好的神经网络输入测试集经过步骤2处理后的1万个1*100的维度数组进行检测,检测训练好的神经网络的识别正确率,正确率达到要求,此训练后神经网络可直接用于识别分类,如正确率达不到要求,则增加测试集重新进行神经网络训练。
如图2所示改进的BP算法的流程示意图,实现如下:
3.1对于原有的BP网络进行改进,原BP算法中计算第i层到第i+1层的计算公式为:
Figure BDA0002096771220000041
式中Hi+1表示第i+1层的值,Hi表示第i层的值,ωi(i+1)表示第i层到i+1层的连接权值,ai+1表示第i层到i+1层的连接阈值,n为第i+1层的神经元个数,f为激活函数定义为:
Figure BDA0002096771220000042
x为第i层所得到的结果,作为输入;
3.2对上式中的连接权值ωi(i+1)进行改进,在大大降低网络复杂度的同时还能增加其判别能力,从而大大增强了分类器的分辨能力,改进方式如下;
3.2.1、首先定义一个数组矩阵mi(i+1),这个矩阵与ωi(i+1)的行数与列数相同;
3.2.2、再利用均匀随机分布函数,在矩阵mi(i+1)中随机生成[0,1]区间的数据;
3.2.3、最后利用分类函数g(x)对矩阵mi(i+1)中的数据进行分类,将mi(i+1)有一个[0,1]区间的矩阵转换成一个由0和1组成的矩阵,g(x)分类函数如下:
Figure BDA0002096771220000043
3.2.4、将生成的0,1矩阵mi(i+1)与BP中的连接权值ωi(i+1)进行点乘,生成一个新的数组矩阵,我们将其定义为Si(i+1),其生成公式为:Si(i+1)=mi(i+1)·ωi(i+1)
3.2.5、这样我们就得到新的第i层到第i+1层的计算公式,其公式为:
Figure BDA0002096771220000051
/>

Claims (1)

1.一种手写图像识别方法,其特征在于,具体包括如下步骤:
1)从数据集之中,随机选取数据中6万张图片作为训练集,剩余1万组作为测试集,训练集中包含0至9这10个手写数字图片各6千张,测试集10个手写数字图片各1000张,数据集中的图片图像大小为28*28;
2)对选取的图像进行二值化处理,将待识别图像转换为二进制图像,再将图像大小进行缩放,统一缩放为大小10*10的图像,最后再将此10*10的图像进行重新排列,将其转换为1*100的维度数组;
3)将训练集经过步骤2)处理后的6万个1*100的维度数组打乱顺序后带入BP神经网络进行训练,利用BP神经网络对此数组进行分类;将训练好的神经网络输入测试集经过步骤2)处理后的1万个1*100的维度数组进行检测,检测训练好的神经网络的识别正确率,正确率达到要求,此训练后神经网络可直接用于识别分类,如正确率达不到要求,则增加测试集重新进行神经网络训练;所述步骤3)中BP神经网络中BP算法改进方法如下:
3.1)原BP算法中计算第i层到第i+1层的计算公式为:
Figure FDA0003912807660000011
式中Hi+1表示第i+1层的值,Hi表示第i层的值,ωi(i+1)表示第i层到i+1层的连接权值,ai+1表示第i层到i+1层的连接阈值,n为第i+1层的神经元个数,f为激活函数定义为:
Figure FDA0003912807660000012
3.2)对连接权值ωi(i+1)进行改进,改进方式如下;
3.2.1)首先定义一个数组矩阵mi(i+1),这个矩阵与ωi(i+1)的行数与列数相同;
3.2.2)再利用均匀随机分布函数,在矩阵mi(i+1)中随机生成[0,1]区间的数据;
3.2.3)最后利用分类函数g(x)对矩阵mi(i+1)中的数据进行分类,将mi(i+1)有一个[0,1]区间的矩阵转换成一个由0和1组成的矩阵,g(x)分类函数如下:
Figure FDA0003912807660000021
3.2.4)将生成的0,1矩阵mi(i+1)与BP中的连接权值ωi(i+1)进行点乘,生成一个新的数组矩阵,将其定义为Si(i+1),其生成公式为:
Si(i+1)=mi(i+1)·ωi(i+1)
3.2.5)这样就得到新的第i层到第i+1层的计算公式,其公式为:
Figure FDA0003912807660000022
CN201910521280.3A 2019-06-17 2019-06-17 手写图像识别方法 Active CN110287840B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910521280.3A CN110287840B (zh) 2019-06-17 2019-06-17 手写图像识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910521280.3A CN110287840B (zh) 2019-06-17 2019-06-17 手写图像识别方法

Publications (2)

Publication Number Publication Date
CN110287840A CN110287840A (zh) 2019-09-27
CN110287840B true CN110287840B (zh) 2023-03-24

Family

ID=68005104

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910521280.3A Active CN110287840B (zh) 2019-06-17 2019-06-17 手写图像识别方法

Country Status (1)

Country Link
CN (1) CN110287840B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5553156A (en) * 1994-04-12 1996-09-03 Nippondenso Co., Ltd. Signature recognition apparatus which can be trained with a reduced amount of sample data
CN107153810A (zh) * 2016-03-04 2017-09-12 中国矿业大学 一种基于深度学习的手写体数字识别方法及系统
CN108734168A (zh) * 2018-05-18 2018-11-02 天津科技大学 一种手写数字的识别方法
CN108805221A (zh) * 2017-04-28 2018-11-13 普天信息技术有限公司 手写数字识别方法及装置
CN109635799A (zh) * 2018-12-17 2019-04-16 石家庄科林电气股份有限公司 一种燃气表字轮数字的识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5553156A (en) * 1994-04-12 1996-09-03 Nippondenso Co., Ltd. Signature recognition apparatus which can be trained with a reduced amount of sample data
CN107153810A (zh) * 2016-03-04 2017-09-12 中国矿业大学 一种基于深度学习的手写体数字识别方法及系统
CN108805221A (zh) * 2017-04-28 2018-11-13 普天信息技术有限公司 手写数字识别方法及装置
CN108734168A (zh) * 2018-05-18 2018-11-02 天津科技大学 一种手写数字的识别方法
CN109635799A (zh) * 2018-12-17 2019-04-16 石家庄科林电气股份有限公司 一种燃气表字轮数字的识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于 BP 神经网络的手写数字识别及优化方法;夏少杰;《智能物联技术》;20180718;第19-22页 *

Also Published As

Publication number Publication date
CN110287840A (zh) 2019-09-27

Similar Documents

Publication Publication Date Title
Priya et al. Online and offline character recognition: A survey
Laishram et al. Simulation and modeling of handwritten Meitei Mayek digits using neural network approach
Miah et al. Handwritten courtesy amount and signature recognition on bank cheque using neural network
Widiastuti et al. Document image extraction system design
Susanto et al. Histogram of gradient in k-nearest neighbor for Javanese alphabet classification
Ramteke et al. Recognition of off-line MODI script: a structure similarity approach
Neri et al. A Convolutional Neural Network for Handwritten Digit Recognition.
Hinduja et al. Enhanced Character Recognition using Deep Neural Network-A Survey
CN110287840B (zh) 手写图像识别方法
Hemanth et al. CNN-RNN BASED HANDWRITTEN TEXT RECOGNITION.
Kim et al. Digitalizing scheme of handwritten Hanja historical documents
Pradeep et al. An investigation on the performance of hybrid features for feed forward neural network based English handwritten character recognition system
Halder et al. Individuality of isolated Bangla numerals
Halder et al. Individuality of isolated Bangla characters
Ali et al. Two stage classifier for Arabic handwritten character recognition
Athoillah et al. Handwritten arabic numeral character recognition using multi kernel support vector machine
Ajao et al. Yoruba handwriting word recognition quality evaluation of preprocessing attributes using information theory approach
Alqudah et al. Shift and scale invariant recognition of printed numerals
Moni et al. Handwritten character recognition system using a simple feature
Vats et al. Offline Handwritten English Numeral Recognition using Correlation Method
Dash et al. Non-correlated character recognition using artificial neural network
Tan et al. Multiscale region projection method to discriminate between printed and handwritten text on registration forms
Syafie et al. Comparison of Artificial Neural Network and Gaussian Naïve Bayes in Recognition of Hand-Writing Number
Halder et al. Comparison of the classifiers in Bangla handwritten numeral recognition
Ramteke et al. Recognition of offline MODI script

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant