CN109815809A - 一种基于cnn的英文笔迹鉴别方法 - Google Patents
一种基于cnn的英文笔迹鉴别方法 Download PDFInfo
- Publication number
- CN109815809A CN109815809A CN201811557288.7A CN201811557288A CN109815809A CN 109815809 A CN109815809 A CN 109815809A CN 201811557288 A CN201811557288 A CN 201811557288A CN 109815809 A CN109815809 A CN 109815809A
- Authority
- CN
- China
- Prior art keywords
- layer
- english
- convolutional
- training
- handwriting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
本发明公开了一种基于CNN的英文笔迹鉴别方法,包括:收集来自不同人不同笔迹的英文文档,经过字符分割,获取由英文单词文本组成的数据集,基于数据集构造训练样本集及测试样本集;构造8层卷积神经网络,包括5个卷积层和3个全连接层,最后一个全连接层的输出被送到一个具有10个输出向量的softmax层当中;采用重叠的Pooling,对输入图像的每个像素进行卷积、下采样、池化操作,得到每层的特征图的大小;输入训练样本集,提取字符特征,进行分类训练;将提取的单个英文单词图像统一缩放到320*320*3像素;将手写英文文档进行分割,提取单词,得到测试样本集;利用训练后的神经网络进行英文笔迹鉴定。
Description
技术领域
本发明属于计算机视觉领域,可用于模式识别和司法鉴定等相关领域;更具体的说,它涉及一种英文笔迹鉴别方法,经扩展后可用于其他手写体笔迹的鉴别。
背景技术
英文是世界通用的官方语言,英文字符作为世界文字系统的一个重要组成部分,在社会交往和政治、经济生活中都有着广泛的应用。英文手写体字符是一些重要材料(如:票据、表格、工作记录,以及法律文书)中相关信息的重要表现形式,也是刑事、行政诉讼,以及民事财产纠纷案件判决的重要依据。
英文笔迹按特征可分为:字形特征,运笔特征、变化规律特征和书写习惯的组合特征。目前采取的鉴定方法主要是基于人工进行特征比对,往往需要专业的鉴别人员来进行操作,效率低,准确度差,无法满足实现工程的要求。随着笔迹鉴定技术的不断发展,如何利用计算机技术,将应用形态学、神经网络算法、遗传算法的新技术运用到笔迹鉴定当中,以提高鉴别的效率和准确度,是当前该领域所面临的主要问题。
英文笔迹鉴别的难点在于:英文字符属于一种外文笔迹,具有笔画简单,结构单一,书写难度小,书写多样化程度高等特点;同时这类笔迹鉴定理论不够完善、理论依据不足,虽然目前国内外学者在该领域作了大量的研究工作,但在仍然存在很多不足,缺乏实用性。目前,英文笔迹鉴别的问题主要体现在三个方面:
1)英文笔迹数据集的选取方式及采集;
2)如何利用计算机技术,采用更高效的方法来解决英文笔迹鉴别问题;
3)如何将英文笔迹鉴定和神经网络结合起来,使鉴定效果达到最优。
发明内容
本发明提供了一种基于CNN(卷积神经网络)的英文笔迹鉴别方法,本发明利用采集的英文手写体数据集对构建的CNN网络进行训练,提取相关特征,通过将手写体英文文档分割成单个单词进行鉴别,最终实现英文笔迹的计算机鉴别,以满足实现工程的需要。具体详见下文描述:
一种基于CNN的英文笔迹鉴别方法,所述方法包括以下步骤:
收集来自不同人不同笔迹的英文文档,经过单词分割,获取由英文单词及标点符号文本组成的数据集,基于数据集构造训练样本集及测试样本集;
构造8层卷积神经网络,包括5个卷积层和3个全连接层,最后一个全连接层的输出被送到一个具有10个输出向量的softmax层当中;
采用重叠的Pooling,一个Pooling层是由间隔s个像素的Pooling单元网格组成,每个网格具有一个z*z大小的临近关系,均位于Pooling单元的中心位置,s<z;对输入图像的每个像素进行卷积、下采样、池化操作,得到每层的特征图的大小;
输入训练样本集,提取字符特征,进行分类训练;将提取的单个英文单词图像统一缩放到320*320*3像素,得到测试样本集;
利用训练后的神经网络对训练样本集进行英文笔迹鉴定,得到测试结果。
其中,所述数据集包括:采集10个人的不同笔迹,每人分别手写12张英文文档,其中10张文档中的英文单词,经分割后构成训练数据集;另外2张文档中的英文单词,经分割后构成测试数据集。将训练样本集和测试样本集进行人工分类标记,最终得到训练数据集的单词个数为2000个,测试数据集的单词个数为200个。
其中,所述卷积神经网络利用VGG模型,提取特征向量,包括:
第一层卷积层之后经过RELU1(激活函数)层,NORM1(规范层)层和第一层池化层,在第一层池化层中,采用最大池化,对上一卷积层的特征图,利用[2,2]的步长进行池化操作,得到第二层卷积层的输入特征;
第三层RELU3(激活函数)层之后不经过池化层,直接到达第四层卷积层,第四层卷积层输入的特征图大小与第三层卷积层一致,均为3*3*256像素,共256张;经第四层卷积层后进入RELU4层;
进入fc8(全连接)层,特征图大小为1*1*4096,共59张;随后进入最后一层分类器,将输入英文单词划分为10个不同类别。
本发明提供的技术方案的有益效果是:
第一:考虑到各国人员英文手写习惯不同,本发明并未采用国外已有的数据库,而是注重中国人的使用习惯,采集中国人手写英文文本建立相关数据集,以保证中国人的使用效果,本发明将卷积神经网络应用到手写体英文笔迹鉴定中,并且获得了较高的正确率;
第二,本发明构建了特殊的Pooling(池化)层,该结构的好处在于:在产生相同维度的输出时可有效降低top-1(即概率最大的为正确答案)和top-5(即前5个概率最高的中间包含正确答案)。在CNN的结构中,特征提取层可以将每个神经元的输入与前一层的局部接受域相连,同时提取该局部的特征。一旦局部特征被提取之后,它与其他特征之间的位置关系也随之确定,有助于特征向量的提取。该网络结构收敛快速,不会出现震荡、过拟合的现象,网络能快速趋于稳定,有效节约了训练时间。
第三:本发明可以高效地实现英文笔迹的鉴别,识别准确率可达到100%。算法对光照变化、简单几何形变,以及附加噪声都具有一定的鲁棒性,可用于手写体英文笔迹鉴定的相关领域;算法经过扩展后,也可用于其它文字手写体的笔迹鉴别。
附图说明
图1是一种基于CNN的英文笔迹鉴别方法的流程图;
图2为部分英文文档以及分割后的英文单词数据集的示意图;
其中,(a)为采集到的英文文档;(b)为文档分割后的单词。
图3为英文文档单词分割的投影图;
其中,(a)为英文文档水平投影的直方图;(b)为行分割后行的垂直投影的直方图。
图4为网络的训练图;
图5为英文笔迹鉴定最大概率的统计结果示意图;
表1为本发明方法测试数据集的鉴别准确率。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面对本发明实施方式作进一步地详细描述。
实施例1
一种基于CNN的英文笔迹鉴别方法,参见图1,该方法包括以下步骤:
101:收集来自不同人不同笔迹的英文文档,经过字符分割,获取由英文单词及标点符号文本组成的数据集,基于数据集构造训练样本集及测试样本集;
102:构造8层卷积神经网络,包括5个卷积层和3个全连接层,最后一个全连接层的输出被送到一个具有10个输出向量的softmax层当中;
103:采用重叠的Pooling,一个Pooling层是由间隔s个像素的Pooling单元网格组成,每个网格具有一个z*z大小的临近关系,均位于Pooling单元的中心位置,s<z;对输入图像的每个像素进行卷积、下采样、池化操作,得到每层的特征图的大小;
104:输入训练样本集,提取字符特征,进行分类训练;将提取的单个字符图像统一缩放到320*320*3像素,得到测试样本集;
105:利用训练后的神经网络自动鉴别英文笔迹。
其中,步骤101中的数据集包括:10个人的不同笔迹,每人书写的单词个数为200字左右,训练数据集的单词总个数为2000个,测试数据集的单词总个数为200个。
其中,步骤101中的基于数据集构造训练样本集及测试样本集具体为:
10个人的不同笔迹,每人分别手写12张英文文档,其中10张文档中的英文单词,经分割后构成训练数据集;另外2张文档中的英文单词,经分割后构成测试数据集。将训练样本集和测试样本集进行人工分类标记。
综上所述,本发明实施例通过上述步骤101-步骤105可以高效地实现英文笔迹鉴别,鉴别准确率可达到100%。
实施例2
下面结合具体的实例、计算公式、图1-图3对实施例1中的方案进行进一步地介绍,详见下文描述:
201:获得各英文单词的训练样本集和测试样本集;
首先,对手写英文文档图像进行正射纠正;再利用投影法[1]对实测英文手写文档进行单词分割:先进行图像的水平投影,得到水平方向的投影直方图,根据投影直方图,将手写英文文档中每一行图像分割开来;再进行图像的垂直投影,对每行切割出来的文本图像进行垂直投影,得到垂直方向上的投影直方图,根据二分法原理分割出单个英文字母[2]。
其中,收集10人的手写英文文档单词及相关文本作为数据集,包括10张训练英文文档和2张测试英文文档,并将手写英文文档分割成单个英文单词,如图2所示,分类标记图像信息。最终获得训练样本集单词总个数2000个,测试样本集单词总个数200个。将分割完的英文单词图像大小统一为320*320像素,数据类型设置为320*320*3的uint8型。
202:构建卷积神经网络:
其中,该步骤202具体包括:
1)将统一大小的字符图像导入卷积神经网络,使其成为inputs层,大小为[320,320,3,10]。
2)构造8层卷积神经网络,其中包括5个卷积层和3个全连接层,最后一个全连接层的输出被送到一个具有10个输出向量的softmax层当中。
与传统神经网络不同,本发明采用重叠的Pooling,即一个Pooling层可以认为是由间隔s个像素(本发明中s=2)的Pooling单元网格组成,每个网格具有一个z*z(本发明中z=5)大小的临近关系,均位于Pooling单元的中心位置。当设置s=z时,为传统的局部pooling;设置s<z时,可得到有重叠的池化。对输入图像的每个像素进行卷积、下采样、池化等操作,得到每层的特征图maps的大小。
3)将每层的输出作为下层的输入,经过前后共8个层,最后到达全连接层prob层,通过softmax输出层输出结果,并保存训练后的网络。
203:输入训练样本集,提取字符特征,进行分类训练;
本发明实施例采用softmax分类器,对特征向量进行分类;采用构建的卷积神经网络,对训练样本集进行训练,得到训练后的.mat文件。
其中,BP算法的基本流程如下:随机初始化网络权值和神经元的阈值;根据公式(1)进行前向传播:
分层计算隐层神经元和输出神经元的输入和输出;其中E代表输出误差,d代表真实性,wjk,vij分别代表各层的权值和阈值,xi代表第i层的输入向量,m的取值范围为随卷积层输出向量的改变而改变,n的取值范围为320*320*3*10,l的取值范围为0~1*1*4096*10。
根据公式(2)进行误差反向传播:
其中,θ是反向传播算法的学习速率参数(本发明实施例中θ=0.05),n代表输入向量的个数(本发明实施例中n=320*320*3*10),m代表隐层输出向量的个数(本发明实施例中m随卷积层输出向量的改变而改变),l代表输出层输出向量的个数(本发明实施例中l=1*1*4096*10),上式中的负号表示空间梯度下降,即使得输出误差E改变方向,使误差反向传播。通过以上公式修正权值和阈值,直到满足终止条件。
204:利用训练后的神经网络对英文笔迹进行鉴别。
其中,将测试样本集输入到训练好的卷积神经网络中,即通过输入训练好的.mat文件对测试样本集进行测试,实现各个英文笔迹的自动鉴别,输出测试结果。
综上所述,本发明实施例利用采集的英文手写体数据集,通过将英文文档分割成单个英文单词,再基于构建的神经网络来实现手写体英文笔迹的自动鉴别,以达到实用化的要求。
实施例3
下面结合图4-图5,以及表1,对实施例1和2中的方案进行进一步地介绍,详见下文描述:
该数据集包括:10个人的不同笔迹,每人分别手写12张英文文档,其中10张文档中的英文单词,经分割后构成训练数据集,另外2张文档中的英文单词,经分割后构成测试数据集。将训练样本集和测试样本集进行人工分类标记,最终得到训练数据集的单词个数为2000个,测试数据集的单词个数为200个。
数据集不需要经过复杂的预处理步骤,省去了二值化,噪声去除,倾斜矫正等步骤,图像大小及类型统一为320*320*3unit8型,有助于提高训练样本的稳定性。构建的神经网络利用VGG模型,提取特征向量,对每一个卷积层进行下采样,池化等操作。
第1步:在第一层卷积层中,输入图像卷积后得到一张11*11*3像素的特征图map,随后用64个滤波器与其进行卷积,产生64张特征图maps;
第2步:第一层卷积层之后经过RELU1层,NORM1层和POOL1层,在第一层池化层POOL中,采用最大池化的方法,对上一层卷积层的特征图,利用[2,2]的步长进行池化操作,得到第二层卷积层的输入特征;
第3步:第一层池化层中得到256张大小为5*5*64像素的特征图maps,作为第二层卷积层的输入;
第4步:第二层卷积层之后经过RELU2,NORM2和POOL2层,池化层同样采用最大池化的方法,步长为[2,2],得到第三层卷积层的输入特征;
第5步:第三层卷积层的输入特征为3*3*256像素,共256张;经第三层卷积层后进入RELU3层;
第6步:第三层RELU3层之后不经过池化层,直接到达第四层卷积层,因此,第四层卷积层输入的特征图maps大小与第三层卷积层一致,均为3*3*256像素,共256张;经第四层卷积层后进入RELU4层;
第7步:不经过池化层直接进入第五层卷积层,特征图maps大小为3*3*256像素,共256张;再经过RELU5层和POOL5层,POOL5层采用最大池化的方法,步长为[2,2];
第8步:POOL5池化层之后,进入fc6分支层,特征图maps大小为6*6*256像素,共4096张;随后进入RELU6层;
第9步:进入fc7分支层,特征图maps大小为1*1*4096像素,共4096张;随后进入RELU7层;
第10步:进入fc8层,特征图maps大小为1*1*4096,共10张;随后进入最后一层分类器softmax,将输入英文单词划分为10个不同类别。
对英文笔迹鉴定的测试实验,采用出现概率最大的鉴别结果作为文档的最终鉴别结果。实验结果图5中,横坐标表示不同笔迹,纵坐标表示每种笔迹单词鉴定结果的统计次数,用柱状图表示。从图中可以看出,针对10种不同笔迹,最终鉴别结果均是笔迹本人,最终英文文档笔迹鉴别准确度达到了100%。表1为测试数据集的笔迹鉴别准确度,从表中可以看出,即使不按照最大的正确概率计算,200个单词的鉴定正确率也达到了85%,完全可以满足实用化的要求。
表1测试数据集鉴别准确率(100%)
参考文献
[1]曲宇涛,中文手写体文本分割算法的研究.吉林大学[D],2009.
[2]曹卫,基于二分法的字符垂直投影分割算法[J].软件导刊,2010,9(10):71-72.
[3]李爱农,基于AROP程序包的类Landsat遥感影像配准与正射纠正试验和精度分析[J].遥感技术与应用,2012,27(1):23-32.
本领域技术人员可以理解附图只是一个优选实施例的示意图,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (3)
1.一种基于CNN的英文笔迹鉴别方法,其特征在于,所述方法包括以下步骤:
收集来自不同人不同笔迹的英文文档,经过字符分割,获取由英文单词文本组成的数据集,基于数据集构造训练样本集及测试样本集;
构造8层卷积神经网络,包括5个卷积层和3个全连接层,最后一个全连接层的输出被送到一个具有10个输出向量的softmax层当中;
采用重叠的Pooling,一个Pooling层是由间隔s个像素的Pooling单元网格组成,每个网格具有一个z*z大小的临近关系,均位于Pooling单元的中心位置,s<z;对输入图像的每个像素进行卷积、下采样、池化操作,得到每层的特征图的大小;
输入训练样本集,提取英文单词的细节特征,进行分类训练;将提取的单个英文单词图像统一缩放到320*320*3像素,得到测试样本集;
利用训练后的神经网络对测试样本集的字迹进行鉴别,得到测试结果。
2.根据权利要求1所述的一种基于CNN的英文笔迹鉴别方法,其特征在于:
训练数据集大小为2000个单词,测试数据集大小为200个单词。
3.根据权利要求1所述的一种基于CNN的英文笔迹鉴别方法,其特征在于,
第一层卷积层之后经过激活函数层,规范层和第一层池化层,在第一层池化层中,采用最大池化,对上一卷积层的特征图,利用[2,2]的步长进行池化操作,得到第二层卷积层的输入特征;
第三层激活函数层之后不经过池化层,直接到达第四层卷积层,第四层卷积层输入的特征图大小与第三层卷积层一致,均为3*3*256像素,共256张;经第四层卷积层后进入激活函数层;
进入fc8全连接层,特征图大小为1*1*4096,共10张;随后进入最后一层分类器,将输入不同人的英文笔迹划分为10个不同类别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811557288.7A CN109815809A (zh) | 2018-12-19 | 2018-12-19 | 一种基于cnn的英文笔迹鉴别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811557288.7A CN109815809A (zh) | 2018-12-19 | 2018-12-19 | 一种基于cnn的英文笔迹鉴别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109815809A true CN109815809A (zh) | 2019-05-28 |
Family
ID=66602164
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811557288.7A Pending CN109815809A (zh) | 2018-12-19 | 2018-12-19 | 一种基于cnn的英文笔迹鉴别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109815809A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110659599A (zh) * | 2019-09-19 | 2020-01-07 | 安徽七天教育科技有限公司 | 一种基于扫描试卷的离线笔迹鉴定系统以及使用方法 |
CN113673415A (zh) * | 2021-08-18 | 2021-11-19 | 山东建筑大学 | 一种手写汉字身份鉴别方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104573728A (zh) * | 2015-01-19 | 2015-04-29 | 天津大学 | 一种基于极端学习机的纹理分类方法 |
CN105893968A (zh) * | 2016-03-31 | 2016-08-24 | 华南理工大学 | 基于深度学习的文本无关的端到端的笔迹识别方法 |
CN107464216A (zh) * | 2017-08-03 | 2017-12-12 | 济南大学 | 一种基于多层卷积神经网络的医学图像超分辨率重构方法 |
CN107844740A (zh) * | 2017-09-05 | 2018-03-27 | 中国地质调查局西安地质调查中心 | 一种脱机手写、印刷汉字识别方法及系统 |
-
2018
- 2018-12-19 CN CN201811557288.7A patent/CN109815809A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104573728A (zh) * | 2015-01-19 | 2015-04-29 | 天津大学 | 一种基于极端学习机的纹理分类方法 |
CN105893968A (zh) * | 2016-03-31 | 2016-08-24 | 华南理工大学 | 基于深度学习的文本无关的端到端的笔迹识别方法 |
CN107464216A (zh) * | 2017-08-03 | 2017-12-12 | 济南大学 | 一种基于多层卷积神经网络的医学图像超分辨率重构方法 |
CN107844740A (zh) * | 2017-09-05 | 2018-03-27 | 中国地质调查局西安地质调查中心 | 一种脱机手写、印刷汉字识别方法及系统 |
Non-Patent Citations (2)
Title |
---|
CHEN_YQ: "Tensorflow搭建卷积神经网络识别手写英语字母", 《HTTPS://WWW.CNBLOGS.COM/GREENDEEPSEA/P/8419761.HTML》 * |
张晶等: "基于深度卷积神经网络的手写哈萨克文字母识别方法", 《大连民族大学学报》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110659599A (zh) * | 2019-09-19 | 2020-01-07 | 安徽七天教育科技有限公司 | 一种基于扫描试卷的离线笔迹鉴定系统以及使用方法 |
CN113673415A (zh) * | 2021-08-18 | 2021-11-19 | 山东建筑大学 | 一种手写汉字身份鉴别方法及系统 |
CN113673415B (zh) * | 2021-08-18 | 2022-03-04 | 山东建筑大学 | 一种手写汉字身份鉴别方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102622610B (zh) | 一种基于分类器集成的手写维文字符识别方法 | |
CN109800746A (zh) | 一种基于cnn的手写英文文档识别方法 | |
CN109034044A (zh) | 一种基于融合卷积神经网络的行人再识别方法 | |
CN110334705A (zh) | 一种结合全局和局部信息的场景文本图像的语种识别方法 | |
CN105528575B (zh) | 基于上下文推理的天空检测方法 | |
CN109002834A (zh) | 基于多模态表征的细粒度图像分类方法 | |
CN104408449B (zh) | 智能移动终端场景文字处理方法 | |
CN105205449A (zh) | 基于深度学习的手语识别方法 | |
CN105913053B (zh) | 一种基于稀疏融合的单演多特征的人脸表情识别方法 | |
CN103605972A (zh) | 一种基于分块深度神经网络的非限制环境人脸验证方法 | |
CN105608454A (zh) | 基于文字结构部件检测神经网络的文字检测方法及系统 | |
CN104573711B (zh) | 基于文本‑物体‑场景关系的物体和场景的图像理解方法 | |
Tian et al. | Natural scene text detection with MC–MR candidate extraction and coarse-to-fine filtering | |
CN110472652A (zh) | 基于语义引导的少量样本分类方法 | |
CN107092917A (zh) | 一种基于流形学习的汉字笔画自动提取方法 | |
CN110929746A (zh) | 一种基于深度神经网络的电子卷宗标题定位提取与分类方法 | |
CN110287952A (zh) | 一种维语图片字符的识别方法及系统 | |
CN112597324A (zh) | 一种基于相关滤波的图像哈希索引构建方法、系统及设备 | |
CN107220598A (zh) | 基于深度学习特征和Fisher Vector编码模型的虹膜图像分类方法 | |
CN103927539A (zh) | 离线式维吾尔文手写签名识别的一种高效的特征提取方法 | |
CN106874825A (zh) | 人脸检测的训练方法、检测方法和装置 | |
Jun et al. | Automatic classification and recognition of complex documents based on Faster RCNN | |
CN107832753B (zh) | 一种基于四值权重与多重分类的人脸特征提取方法 | |
CN109815809A (zh) | 一种基于cnn的英文笔迹鉴别方法 | |
Saraf et al. | Devnagari script character recognition using genetic algorithm for get better efficiency |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190528 |
|
RJ01 | Rejection of invention patent application after publication |