CN108416390B - 基于二维卷积降维的手写字体识别方法 - Google Patents
基于二维卷积降维的手写字体识别方法 Download PDFInfo
- Publication number
- CN108416390B CN108416390B CN201810216005.6A CN201810216005A CN108416390B CN 108416390 B CN108416390 B CN 108416390B CN 201810216005 A CN201810216005 A CN 201810216005A CN 108416390 B CN108416390 B CN 108416390B
- Authority
- CN
- China
- Prior art keywords
- hand
- written script
- neural networks
- convolutional neural
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
- G06V30/244—Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
- G06V30/245—Font recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Character Discrimination (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种基于二维卷积降维的手写字体识别方法,以解决一些高形变等复杂情况下现有手写识别算法对于高维数据效果不好的问题。首先,通过加入优化层得到特殊的卷积神经网络,使得网络可同时进行识别和降维;然后,设计了新的线性判别分析目标函数,降低优化过程的复杂性,通过优化该函数,可以使网络在识别复杂手写字体时利用的信息维度较低,识别更简单;最后,利用训练好的网络对手写字体图片进行识别,得到识别结果。由于使用了特殊设计的卷积神经网络来优化新的线性判别分析目标函数,可以获得更好的识别性能。
Description
技术领域
本发明属计算机视觉、图形处理技术领域,具体涉及一种基于二维卷积降维的手写字体识别方法。
背景技术
手写字体识别是一个被广泛关注的问题,已有很解决方法被提出,例如早期一些使用模板匹配的方法,如在文献“Chaturvedi S,Titre R N,Sondhiya N.Review ofhandwritten pattern recognition of digits and special characters using feedforward neural network and Izhikevich neural model,Electronic Systems,SignalProcessing and Computing Technologies(ICESC),2014International Conferenceon.IEEE,2014:425-428”中提到的基于模板匹配的方法,以及现在使用的卷积神经网络进行分类的一系列算法,如等人在文献“D,Meier U.Multi-column deepneural networks for offline handwritten Chinese character classification,Neural Networks(IJCNN),2015 International Joint Conference on.IEEE,2015:1-6”提出的方法。但对于形变特别复杂的文字,因其展现出高维度特征,所以识别的难度也会加大。降维作为模式识别的核心问题一直被广泛关注,是解决高维数据处理问题的有效方法,其思想是通过映射从高维原始特征中提取较低维数的分类能力强的特征。在实际的数据采集过程中,观察对象往往需要用多个变量来表示,这些信息被抽象成高维数据,例如字体的不规则形变,颜色、对比度的变化,复杂程的周围环境等。
现有的数据挖掘和处理方法通常对低维数据有效。高维数据由于往往含有大量的冗余信息,如对结果影响较小的变量和与其他变量具有较强相关性的变量,因而降低了算法的效率和数据处理分析的准确性。如何将数据的维数降低到合理的大小,将高维数据转化为低维数据,并保留数据的关键信息是有效识别手写字体图像的关键。
发明内容
为了克服现有技术的不足,本发明提供了一种基于二维卷积降维的手写字体识别方法,以解决一些高形变等复杂情况下现有手写识别算法对于高维数据效果不好的问题,主要使用特殊设计的卷积神经网络来优化线性判别分析目标函数,可以获得更好的识别性能。
一种基于二维卷积降维的手写字体识别方法,其特征在于包括以下步骤:
步骤1:在VGG16网络后面连接一个优化层,得到一个新的卷积神经网络,其中,优化层采用的函数为f(x)=xTW+1bT,x表示VGG16网络的输出,f(x)为新卷积神经网络的输出,W和b分别为待优化的网络参数,1表示元素均为1的n维向量,n与b向量中的元素数目相同;
步骤2:以为卷积神经网络的目标函数,并输入手写字体训练图片样本,采用梯度下降法进行参数优化,得到最优的卷积神经网络;
其中,||·||F表示矩阵的Frobenius范数,为归一化样本标签,Y是以One-hot格式矩阵存储的手写字体训练图片的类别标签,γ为正则化参数,设置为γ=0.0001。
步骤3:利用步骤2得到的卷积神经网络对待识别手写字体图像进行处理,得到识别结果;
步骤4:利用softmax函数计算得到识别结果中每一类的概率,即得到最终的手写字体识别结果。
本发明的有益效果是:通过加入优化层得到特殊的卷积神经网络,使得网络可同时进行识别和降维,并设计了新的线性判别分析目标函数,降低优化过程的复杂性,通过优化该函数,可以使网络在识别复杂手写字体时利用的信息维度较低,识别更简单,从而获得更好的手写字体识别效果。
附图说明
图1是本发明的一种基于二维卷积降维的手写字体识别方法流程图
图2是CVL数据集的手写数字图像示例
图3是USPS数据集的手写数字图像示例
具体实施方式
下面结合附图和实施例对本发明进一步说明,本发明包括但不仅限于下述实施例。
本发明提供了一种基于二维卷积降维的手写字体识别方法,如图1所示,其具体过程如下:
1、构建新的卷积神经网络
一般来说,任意的卷积神经网络都可以进行数据的投影或特征提取,从而实现对数据的降维处理,只是网络的性能和处理时间不同。本发明采用VGG16网络为基础网络,以实现数据的降维处理。在VGG16网络后面连接一个优化层,得到一个新的卷积神经网络。
其中,优化层采用的函数为f(x)=xTW+1bT,x表示VGG16网络的输出,f(x)为新卷积神经网络的输出,W和b分别为待优化的网络参数,1表示元素均为1的n维向量,n与b向量中的元素数目相同,保证了运算的正确性。优化层的作用是从降维结果中提取有关文字类别的信息。所述的VGG16网络为Simonyan等人提出的记录在文献“Simonyan K,ZissermanA.Very deep convolutional networks for large-scale image recognition[J].arXivpreprint arXiv:1409.1556,2014.”中的网络。
2、网络训练
为了使网络同时具备更好的分类性能和降维性能,设计新的线性判别分析目标函数作为卷积神经网络的目标函数为:
其中,||·||F表示矩阵的Frobenius范数,为归一化样本标签,Y是以One-hot格式矩阵存储的手写字体训练图片的类别标签,γ为正则化参数,用于平衡拟合训练并保持参数值较小,可以避免过拟合,本发明设置γ=0.0001。
将手写字体训练图片样本输入卷积神经网络,并采用梯度下降法进行参数优化,得到最优的卷积神经网络。
3、利用步骤2得到的最优的卷积神经网络对待识别手写字体图像进行处理,得到识别结果。
4、利用softmax函数计算得到识别结果中每一类的概率,即得到最终的手写字体识别结果。
为验证本发明方法的有效性,在装有Linux操作系统的服务器上,利用TensorFlow软件进行实验。本实验中分别使用的了三个数据集来测试本发明的有效性:
(1)MNIST数据集,包含60000个用于手写数字识别的示例,其网站为http://yann.lecun.com/exdb/mnist/。
(2)CVL数据集,该数据集由Diem等人在文献“Markus Diem,Stefan Fiel,Angelika Garz,Manuel Keglevic,Florian Kleber,and Robert Sablatnig.Icdar 2013competition on handwritten digit recognition(hdrc 2013).pages 1422–1427,2013”中提出,包含21,780个手写数字图像,每个图像的大小是32*32。图2为该数据集中的手写数字图像示例。
(3)USPS数据集,包含9298个手写数字图像,每个图像的大小是16*16,其网站为https://www.csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/multiclass.html。图3为该数据集中的手写数字图像示例。
不同数据集的识别正确率如表1所示。可以看出,本发明方法对不同测试数据都可获得较高的识别准确度。
表1
MNIST | CVL | USPS |
99.20 | 96.6 | 97.9 |
Claims (1)
1.一种基于二维卷积降维的手写字体识别方法,其特征在于包括以下步骤:
步骤1:在VGG16网络后面连接一个优化层,得到一个新的卷积神经网络,其中,优化层采用的函数为f(x)=xTW+1bT,x表示VGG16网络的输出,f(x)为新卷积神经网络的输出,W和b分别为待优化的网络参数,1表示元素均为1的n维向量,n与b向量中的元素数目相同;
步骤2:以为卷积神经网络的目标函数,并输入手写字体训练图片样本,采用梯度下降法进行参数优化,得到最优的卷积神经网络;
其中,||·||F表示矩阵的Frobenius范数,为归一化样本标签,Y是以One-hot格式矩阵存储的手写字体训练图片的类别标签,γ为正则化参数,设置为γ=0.0001;
步骤3:利用步骤2得到的卷积神经网络对待识别手写字体图像进行处理,得到识别结果;
步骤4:利用softmax函数计算得到识别结果中每一类的概率,即得到最终的手写字体识别结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810216005.6A CN108416390B (zh) | 2018-03-16 | 2018-03-16 | 基于二维卷积降维的手写字体识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810216005.6A CN108416390B (zh) | 2018-03-16 | 2018-03-16 | 基于二维卷积降维的手写字体识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108416390A CN108416390A (zh) | 2018-08-17 |
CN108416390B true CN108416390B (zh) | 2019-11-01 |
Family
ID=63131929
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810216005.6A Active CN108416390B (zh) | 2018-03-16 | 2018-03-16 | 基于二维卷积降维的手写字体识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108416390B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109800754B (zh) * | 2018-12-06 | 2020-11-06 | 杭州电子科技大学 | 一种基于卷积神经网络的古字体分类方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9501724B1 (en) * | 2015-06-09 | 2016-11-22 | Adobe Systems Incorporated | Font recognition and font similarity learning using a deep neural network |
CN106991374A (zh) * | 2017-03-07 | 2017-07-28 | 中国矿业大学 | 基于卷积神经网络和随机森林的手写数字识别方法 |
CN107153810A (zh) * | 2016-03-04 | 2017-09-12 | 中国矿业大学 | 一种基于深度学习的手写体数字识别方法及系统 |
CN107609601A (zh) * | 2017-09-28 | 2018-01-19 | 北京计算机技术及应用研究所 | 一种基于多层卷积神经网络的舰船目标识别方法 |
CN107644006A (zh) * | 2017-09-29 | 2018-01-30 | 北京大学 | 一种基于深度神经网络的手写体中文字库自动生成方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6094506A (en) * | 1995-10-25 | 2000-07-25 | Microsoft Corporation | Automatic generation of probability tables for handwriting recognition systems |
US7146037B2 (en) * | 2002-07-12 | 2006-12-05 | Winbond Electronics Corp. | VLSI neural fuzzy classifier for handwriting recognition |
CN100461205C (zh) * | 2007-01-08 | 2009-02-11 | 中国民航大学 | 基于高维空间凸锥构造的手写体文字识别方法 |
EP3029606A3 (en) * | 2014-11-14 | 2016-09-14 | Thomson Licensing | Method and apparatus for image classification with joint feature adaptation and classifier learning |
US11055537B2 (en) * | 2016-04-26 | 2021-07-06 | Disney Enterprises, Inc. | Systems and methods for determining actions depicted in media contents based on attention weights of media content frames |
US10621486B2 (en) * | 2016-08-12 | 2020-04-14 | Beijing Deephi Intelligent Technology Co., Ltd. | Method for optimizing an artificial neural network (ANN) |
-
2018
- 2018-03-16 CN CN201810216005.6A patent/CN108416390B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9501724B1 (en) * | 2015-06-09 | 2016-11-22 | Adobe Systems Incorporated | Font recognition and font similarity learning using a deep neural network |
CN107153810A (zh) * | 2016-03-04 | 2017-09-12 | 中国矿业大学 | 一种基于深度学习的手写体数字识别方法及系统 |
CN106991374A (zh) * | 2017-03-07 | 2017-07-28 | 中国矿业大学 | 基于卷积神经网络和随机森林的手写数字识别方法 |
CN107609601A (zh) * | 2017-09-28 | 2018-01-19 | 北京计算机技术及应用研究所 | 一种基于多层卷积神经网络的舰船目标识别方法 |
CN107644006A (zh) * | 2017-09-29 | 2018-01-30 | 北京大学 | 一种基于深度神经网络的手写体中文字库自动生成方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108416390A (zh) | 2018-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Memon et al. | Handwritten optical character recognition (OCR): A comprehensive systematic literature review (SLR) | |
Nguyen et al. | Text-independent writer identification using convolutional neural network | |
Khan et al. | KNN and ANN-based recognition of handwritten Pashto letters using zoning features | |
Tang et al. | Text-independent writer identification via CNN features and joint Bayesian | |
Mushtaq et al. | UrduDeepNet: offline handwritten Urdu character recognition using deep neural network | |
CN111652332B (zh) | 基于二分类的深度学习手写中文字符识别方法及系统 | |
CN108664975B (zh) | 一种维吾尔文手写字母识别方法、系统及电子设备 | |
Alrobah et al. | Arabic handwritten recognition using deep learning: A survey | |
Shaikh et al. | Attention based writer independent verification | |
Jehangir et al. | Zernike moments based handwritten Pashto character recognition using linear discriminant analysis | |
Sharma et al. | Recent trends and tools for feature extraction in OCR technology | |
Deore et al. | Histogram of Oriented Gradients Based Off-Line Handwritten Devanagari Characters Recognition Using SVM, K-NN and NN Classifiers. | |
Inunganbi et al. | Meitei Mayek handwritten dataset: compilation, segmentation, and character recognition | |
Goswami et al. | Offline handwritten Gujarati numeral recognition using low-level strokes | |
Khudeyer et al. | Combination of machine learning algorithms and Resnet50 for Arabic Handwritten Classification | |
Elaraby et al. | A Novel Siamese Network for Few/Zero-Shot Handwritten Character Recognition Tasks. | |
Zhang et al. | OCR with the Deep CNN Model for Ligature Script‐Based Languages like Manchu | |
CN108416390B (zh) | 基于二维卷积降维的手写字体识别方法 | |
Gharde et al. | Identification of handwritten simple mathematical equation based on SVM and projection histogram | |
Manjusha et al. | Reduced scattering representation for Malayalam character recognition | |
Lamba et al. | Handwriting Recognition System-A Review | |
Daood et al. | Handwriting detection and recognition of Arabic numbers and characters using deep learning methods | |
Girdher et al. | Comprehensive survey on devanagari OCR | |
Küçükşahin | Design of an offline ottoman character recognition system for translating printed documents to modern turkish | |
Hasan et al. | A new state of art deep learning approach for Bangla handwritten digit recognition using SVM classifier |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |