CN106570456B - 基于全卷积递归网络的手写汉字文本识别方法 - Google Patents
基于全卷积递归网络的手写汉字文本识别方法 Download PDFInfo
- Publication number
- CN106570456B CN106570456B CN201610895498.1A CN201610895498A CN106570456B CN 106570456 B CN106570456 B CN 106570456B CN 201610895498 A CN201610895498 A CN 201610895498A CN 106570456 B CN106570456 B CN 106570456B
- Authority
- CN
- China
- Prior art keywords
- layer
- recursive networks
- chinese character
- path integral
- full convolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
- G06V30/333—Preprocessing; Feature extraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/196—Recognition using electronic means using sequential comparisons of the image signals with a plurality of references
- G06V30/1983—Syntactic or structural pattern recognition, e.g. symbolic string recognition
- G06V30/1985—Syntactic analysis, e.g. using a grammatical approach
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biomedical Technology (AREA)
- Evolutionary Biology (AREA)
- Health & Medical Sciences (AREA)
- Character Discrimination (AREA)
Abstract
本发明公开了基于全卷积递归网络的手写汉字文本识别方法,包括步骤路径积分层将联机的笔迹信息转化为相应的脱机特征图片;全卷积网络提取脱机特征图片的高维抽象表达,生成相应的响应图;多层双向递归网络将所述响应图的每一帧完成识别并输出一个关于字符集的概率分布;转录层使用前向计算和反向梯度传播的动态规划算法,使得整个手写汉字文本识别模型可以直接基于文本数据进行训练;和语言模型后处理。本发明对于原联机笔迹信息具有不同程度的刻画能力;在没有对手写汉字文本预分割的情况下,可以接受任意长度的输入序列,并输出一个对应的输出序列;整体性能强;采用集束搜索方法嵌入语言模型解码全卷积递归网络,进一步提高了识别率。
Description
技术领域
本发明涉及对计算机用户手写输入计算机的联机手写文档进行手写汉字文本识别的技术,尤其涉及基于全卷积递归网络的手写汉字文本识别方法。
背景技术
手写汉字识别在当今世界是一个有挑战性的问题,并受到很多研究员紧密的关注。很大的字符集、多样性的手写风格和字符连接问题是手写汉字中遇到的主要问题。近年来,手写汉字识别取得了一定的突破,但基于过分割的传统方法依旧没能克服纠正字符错误分割的问题,识别的准确率不高。
发明内容
为克服现有技术的不足,在没有预分割的情况下处理一个任意长度的输入序列,输出相应标签序列,本发明提出基于全卷积递归网络的手写汉字文本识别方法。
本发明的技术方案是这样实现的,基于全卷积递归网络的手写汉字文本识别方法,包括步骤
S1:路径积分层将联机的笔记信息转化为相应的脱机特征图片;
S2:全卷积网络提取所述脱机特征图片的高维抽象表达,生成相应的响应图;
S3:多层双向递归网络将所述响应图的每一帧完成识别并输出一个关于字符集的概率分布;
S4:转录层使用前向计算和反向梯度传播的动态规划算法,使得整个模型可以直接基于文本数据进行训练;
S5:语言模型后处理。
进一步地,步骤S1进一步包括步骤
S11:对联机手写文本数据的笔迹计算一组路径积分特征;
S12:将每组路径积分特征按照相同维度的特征重组成不同的路径积分特征图。
更进一步地,步骤S11包括步骤:假设一个有限长度笔画段P是二维空间的路径,轨迹移动的时间满足,(0<τ1<...<τk<T),然后计算P的k阶路径积分特征;当P是直线时,用Δ0,T表示路径位移,可以通过分段计算求得;计算n阶路径积分特征,就是把路径积分特征做k阶截断,得到的特征集为得到2n+1维的路径积分特征;步骤S12包括步骤:将路径积分特征的每一个维度单独变成一张路径积分特征图。
进一步地,步骤S2中以任意大小的图片作为输入,并输出相应大小的响应图,该响应图中的每个位置对应着原图的一个接收域,且全卷积网络的层与层之间共享卷积响应图。
进一步地,步骤S3中采用采用LSTM为全卷积网络输出的特征序列建模。
进一步地,步骤S4中采用CTC作为转录层。
进一步地,步骤S5包括步骤
S51:通过综合考虑词法限制、语言的先验知识和语言建模纠正一些显而易见的语义错误;
S52:采用集束搜索方式在后处理中嵌入语言模型,提高识别率。
本发明的有益效果在于,与现有技术相比,本发明应用路径积分层将联机的笔迹信息转化成相应的脱机特征图片,并尽可能保持联机信息;路径积分层具有灵活的特性,可以根据具体的情况提取不同阶数的识别特征,从而对于原来的联机笔迹信息具有不同程度的刻画能力;本发明在没有对手写汉字文本预分割的情况下,可以接受任意长度的输入序列,并输出一个对应的输出序列;本发明是端到端可训练的。各组成部件共同训练以相互适应提高框架的整体性能;本发明采用集束搜索方法嵌入语言模型解码全卷积递归网络,进一步提高识别率。
附图说明
图1是本发明基于全卷积递归网络的手写汉字文本识别方法流程图。
图2是本发明方法流程示意图。
图3是本发明一个实施例的路径积分特征的可视化图形。
图4是本发明一个实施例的连续帧在全卷积网络的输出特征序列对应原始数据的重叠接收域图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
基于全卷积递归网络的端到端的手写汉字文本识别方法,整个系统包含五个组成部分:A、路径积分层;B、全卷积网络;C、多层双向递归网络;D、转录层;E、语言模型后处理。
所述组成部分A的作用为:对联机手写文本数据的笔迹计算一组路径积分特征,和将每组路径积分特征按照相同维度的特征重组成不同的路径积分特征图;
所述组成部分B全卷积网络由卷积层和池化层组成,前面四个卷积层后各跟一个池化层,最后是两个卷积层。全卷积网络以任意大小的图片作为输入,并输出相应大小的响应图,该响应图中的每个位置对应着原图的一个“接收域”。全卷积网络通过层与层之间共享卷积响应图使推断和反向传播更有效率。
其中,全卷积网路包括6个卷积层,其中前4个卷积层后跟一个池化层,卷积核的数目从底层到顶层依次是64、128、256、256、512和512。为了使训练快速收敛和防止过拟合,我们在最后一层卷积层后应用了批正则化(BN)。
所述组成部分C为了捕获长期的依赖信息,采用LSTM为全卷积网络输出的特征序列建模;LSTM可以从一个特征序列中捕获上下文信息,这比处理单个字符更有效和更值得信赖;LSTM不局限于固定长度的输入和输出,这使得它可以处理任意长度的序列数据;LSTM可以和全卷积网络连接成一个统一的网络统一训练,这使两者都受益,提高整体性能;多层双向递归网络采用BLSTM,可以从两个输入方向学习更大范围的上下文信息,性能远胜于单向网络;多层双向递归网络是多个BLSTM的叠加,它能为下一步的转录捕获更高阶的抽象信息;全连接层嵌在多层双向递归网络和转录层之间以加强分类。
所述组成部分D为了避免文本分割的难度,采用CTC(connectionist temporalclassification)作为转录层;CTC允许全卷积网络和LSTM在输入图像和他们对应的标签序列没有先验对其的情况下连续训练。
所述组成部分E通过综合考虑词法限制、语言的先验知识和语言建模纠正一些显而易见的语义错误,提高识别率;采用集束搜索方式在后处理中嵌入语言模型,提高识别率。
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的具体实施方式不局限于此。
本发明主要解决联机手写汉字文本书识别及其具体实现,不同于传统的过分依赖于文本分割的方法,全卷积递归网络直接用联机手写汉字文本数据训练,并根据笔记识别出相应的字符序列。
参见图1和图2,本发明包括以下步骤:S1、路径积分层提取笔迹的识别特征;S2、全卷积网络提取输入图片的高维抽象表达;S3、多层双向递归网络识别并输出关于字符集的概率分布;S4、转录层使得整个模型可以直接基于文本行数据进行训练,而且避免了预切分操作;和S5:语言模型后处理。具体来说,首先将笔记信息输入到路径积分层转化成相应的脱机特征图片,并尽可能保留联机信息。之后将得到的特征图片输入到全卷积网络,提取特征图片的高维抽象表达,得到宽度为T,高度为1的响应图(多个通道),响应图中的每一帧特征向量,实际上是原图的一个接收域的描述。然后将全卷积网络输出的响应图输入到多层双向递归网络,该递归网络在接收到输入序列的每一帧时,都会完成识别并输出一个关于字符集的概率分布。也即,若输入序列长度为T,则多层双向递归网络会按时间先后,输出T个关于字符集的概率分布。多层双向递归网络可以基于上下文信息来对输入的每一帧进行识别,从而避免了一些混淆情况。另一方面,它还可以接收不同长度的输入序列,并和全卷积网络组合进行端到端的训练,以进一步提高识别率。接着,把递归网络输出的T个关于字符集的概率分布输入到转录层,转录层借助一套高效的实现前向计算和反向梯度传播的动态规划算法,使得整个模型可以直接基于文本数据进行训练,而且避免了预切分操作。最后,把识别结果结合语言模型进行后期处理,从而进一步提高识别率。
以下分别对本发明的各主要步骤进行详细说明:
请参见图4,步骤S1计算路径积分特征图
计算路径积分特征是用路径积分特征的方法。假设一个有限长度笔画段P是二维空间的路径,轨迹移动的时间,并且0<τ1<...<τk<T,那么P的k阶路径积分特征就是:
当P是直线时,用Δ0,T表示路径位移,分段计算:
计算n阶路径积分特征,得到的特征集表示为
得到的包括路径本身的路径积分特征的维数为2n+1。
在上面步骤中生成了积分的多维路径积分特征,每一个维度可以对应成一副路径积分特征图。生成路径积分示意图如图3所示。
本发明中,设置的全卷积网络包含卷积层和最大池化层;其结构最先为4个卷积层,每个卷积层后面有一个最大池化层(MP);这四个卷积层的卷积核大小为3*3,步长为1*1,padding大小为0*1;四个池化层卷积核大小为2*2,步长为2*2。四层卷积和池化的结构后跟两个卷积层,第一层的卷积核大小为3*1,步长为3*1,padding大小为0*0;第二层卷积核大小为2*2,步长为1*1,padding大小为0*0。最后四层卷积层后还分别跟了一层BN(batchnormalization)层使训练加速收敛和防止过拟合。
请参见图4,全卷积网络接收任意长度的输入图片,输出相应大小的特征响应图。卷积网络的基本操作,如卷积、池化和激活函数具有平移不变性。因此,该响应图中的每个位置对应着原图的一个“接收域”。一个“接收域”是输入图片上的一个矩形区域,这个矩形区域可以被全卷积网络输出的一个高维特征序列代表。相邻层和坐标之间的关系可以用下面的公式表示:
rl=(rl+1-1)×ml+kl (4)
k是卷积核的大小,m是步长,p是该层padding的大小。在全卷积网络中通过从最后的响应图到原始图片递归调用公式(4)到相邻的层可以得到输出的特征序列对应到输入图片中接收域的大小和中心坐标位置。
多层双向递归网络每次接收一帧特征序列,LSTM都会更新它的隐藏状态,并为进一步转录预测一个概率分布。LSTM可以从一个特征序列中捕获上下文信息,这比处理单个字符更有效和更值得信赖;LSTM不局限于固定长度的输入和输出,这使得它可以处理任意长度的序列数据;LSTM可以和全卷积网络连接成一个统一的网络统一训练,这使两者都受益,提高整体性能;多层双向递归网络采用BLSTM,可以从两个输入方向学习更大范围的上下文信息,性能远胜于单向网络;
多层双向递归网络是多个BLSTM的叠加,它能为下一步的转录捕获更高阶的抽象信息;全连接层嵌在多层双向递归网络和转录层之间以加强分类。
步骤S4中,转录层使得整个模型可以直接基于文本行数据进行训练,而且避免了预切分操作
为了避免分割的困难,我们采用CTC作为我们框架的转录层。CTC允许全卷积网络和LSTM在输入图片和相应的标签序列没有先验对齐的情况下连续训练。
我们假设字符集,C包含我们任务中的所有字符,‘blank’代表空的字符。以长度为T的输入序列,作为输入,我们可以得到大量的长度以T标签序列,被称为映射路径,这些映射路径是通过每次给每一步分配一个字符标签,然后把这些标签连接起来形成字符序列。映射路径用表示,它们的概率计算方法如下:
过一个序列到序列的函数,映射路径通过先移除重复的字符标签和空白字符标签,可以被映射到一个转录。例如“apple”可以从“-a-pp-p-l-ee-”或者_a_pp_p_l_ee_’通过规则转换而来。一个转录的总概率可以通过相应的所有映射路径的概率和来计算,如下所示:
借助一套高效的实现前向计算和反向梯度传播的动态规划算法,Transcription层使得整个模型可以直接基于文本行数据进行训练,避免了预切分操作。
步骤S5语言模型后处理中:
统计语言模型(以一个长为T的单词序列为例)以下公式表示:
是序列中第t个单词,代表序列。事实上,在单词序列中离得越近的单词依赖性越强。因此,n-gram模型,这种模型基于给定前n个单词的下一个单词的条件概率,经常表用于实践中:
结合词法限制和语言的先验知识,语言模型可以纠正一些显著的词法错误,提高识别率。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (3)
1.基于全卷积递归网络的手写汉字文本识别方法,其特征在于,包括步骤:
S1:路径积分层将联机的笔迹信息转化为相应的脱机特征图片,包括:
S11:对联机手写文本数据的笔迹计算一组路径积分特征,包括:
假设一个有限长度笔画段P是二维空间的路径,轨迹移动的时间满足,(0<τ1<...<τk<T),然后计算P的k阶路径积分特征;当P是直线时,用Δ0,T表示路径位移,能够通过分段计算求得;计算n阶路径积分特征,就是把路径积分特征做k阶截断,得到的特征集为得到2n+1维的路径积分特征;步骤S12包括步骤:将路径积分特征的每一个维度单独变成一张路径积分特征图;
S12:将每组路径积分特征按照相同维度的特征重组成不同的路径积分特征图;
S2:全卷积递归网络提取所述脱机特征图片的高维抽象表达,生成相应的响应图;
步骤S2中以任意大小的图片作为输入,并输出相应大小的响应图,该响应图中的每个位置对应着原图的一个接收域,且全卷积递归网络的层与层之间共享卷积响应图;
S3:多层双向递归网络将所述响应图的每一帧完成识别并输出一个关于字符集的概率分布;
S4:转录层使用前向计算和反向梯度传播的动态规划算法,使得整个手写汉字文本识别模型能够直接基于文本数据进行训练;
S5:语言模型后处理,包括:
S51:通过综合考虑词法限制、语言的先验知识和语言建模纠正一些显而易见的语义错误;
S52:采用集束搜索方式在后处理中嵌入语言模型,提高识别率。
2.如权利要求1所述的基于全卷积递归网络的手写汉字文本识别方法,其特征在于,步骤S3中采用采用LSTM为全卷积递归网络输出的特征序列建模。
3.如权利要求1所述的基于全卷积递归网络的手写汉字文本识别方法,其特征在于,步骤S4中采用CTC作为转录层。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610895498.1A CN106570456B (zh) | 2016-10-13 | 2016-10-13 | 基于全卷积递归网络的手写汉字文本识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610895498.1A CN106570456B (zh) | 2016-10-13 | 2016-10-13 | 基于全卷积递归网络的手写汉字文本识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106570456A CN106570456A (zh) | 2017-04-19 |
CN106570456B true CN106570456B (zh) | 2019-08-09 |
Family
ID=58532097
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610895498.1A Active CN106570456B (zh) | 2016-10-13 | 2016-10-13 | 基于全卷积递归网络的手写汉字文本识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106570456B (zh) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107844740A (zh) * | 2017-09-05 | 2018-03-27 | 中国地质调查局西安地质调查中心 | 一种脱机手写、印刷汉字识别方法及系统 |
CN108229469A (zh) * | 2017-11-22 | 2018-06-29 | 北京市商汤科技开发有限公司 | 文字的识别方法、装置、存储介质、程序产品和电子设备 |
CN107992211B (zh) * | 2017-12-08 | 2021-03-12 | 中山大学 | 一种基于cnn-lstm的汉字拼写错别字改正方法 |
CN109961068A (zh) * | 2017-12-26 | 2019-07-02 | 阿里巴巴集团控股有限公司 | 图像识别、训练、搜索方法和装置及设备、介质 |
CN108009539B (zh) * | 2017-12-26 | 2021-11-02 | 中山大学 | 一种基于计数聚焦模型的新型文本识别方法 |
CN108364036A (zh) * | 2017-12-28 | 2018-08-03 | 顺丰科技有限公司 | 一种建模方法、识别方法、装置、存储介质及设备 |
CN108491836B (zh) * | 2018-01-25 | 2020-11-24 | 华南理工大学 | 一种自然场景图像中中文文本整体识别方法 |
CN108399419B (zh) * | 2018-01-25 | 2021-02-19 | 华南理工大学 | 基于二维递归网络的自然场景图像中中文文本识别方法 |
CN108509881A (zh) * | 2018-03-22 | 2018-09-07 | 五邑大学 | 一种无切分的脱机手写汉字文本识别方法 |
CN108549860A (zh) * | 2018-04-09 | 2018-09-18 | 深源恒际科技有限公司 | 一种基于深度神经网络的牛脸识别方法 |
CN110533157A (zh) * | 2018-05-23 | 2019-12-03 | 华南理工大学 | 一种基于svd和剪枝用于深度循环神经网络的压缩方法 |
CN108874174B (zh) * | 2018-05-29 | 2020-04-24 | 腾讯科技(深圳)有限公司 | 一种文本纠错方法、装置以及相关设备 |
CN109034279B (zh) * | 2018-06-04 | 2023-04-25 | 平安科技(深圳)有限公司 | 手写模型训练方法、手写字识别方法、装置、设备及介质 |
CN109447078B (zh) * | 2018-10-23 | 2020-11-06 | 四川大学 | 一种自然场景图像敏感文字的检测识别方法 |
CN109376658B (zh) * | 2018-10-26 | 2022-03-08 | 信雅达科技股份有限公司 | 一种基于深度学习的ocr方法 |
CN109583439A (zh) * | 2018-12-04 | 2019-04-05 | 龙马智芯(珠海横琴)科技有限公司 | 文字校正的方法及装置、存储介质、处理器 |
CN111368838A (zh) * | 2018-12-26 | 2020-07-03 | 珠海金山网络游戏科技有限公司 | 一种举报截图的识别方法及装置 |
CN109726715A (zh) * | 2018-12-27 | 2019-05-07 | 信雅达系统工程股份有限公司 | 一种文字图像序列化识别、结构化数据输出方法 |
CN109902622B (zh) * | 2019-02-26 | 2020-06-09 | 中国科学院重庆绿色智能技术研究院 | 一种用于登机牌信息验证的文字检测识别方法 |
CN110210480B (zh) * | 2019-06-05 | 2021-08-10 | 北京旷视科技有限公司 | 文字识别方法、装置、电子设备和计算机可读存储介质 |
CN110969681B (zh) * | 2019-11-29 | 2023-08-29 | 山东浪潮科学研究院有限公司 | 一种基于gan网络的手写体书法文字生成方法 |
CN111738167A (zh) * | 2020-06-24 | 2020-10-02 | 华南理工大学 | 一种无约束手写文本图像的识别方法 |
CN111916050A (zh) * | 2020-08-03 | 2020-11-10 | 北京字节跳动网络技术有限公司 | 语音合成方法、装置、存储介质和电子设备 |
CN113705322B (zh) * | 2021-06-11 | 2024-05-24 | 北京易达图灵科技有限公司 | 基于门限图神经网络的手写汉字识别方法和装置 |
CN113723421B (zh) * | 2021-09-06 | 2023-10-17 | 华南理工大学 | 基于匹配类别嵌入的零样本的汉字识别方法 |
CN114677700A (zh) * | 2022-04-11 | 2022-06-28 | 腾讯科技(深圳)有限公司 | 身份标识的识别方法和装置、存储介质及电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4495644A (en) * | 1981-04-27 | 1985-01-22 | Quest Automation Public Limited Company | Apparatus for signature verification |
CN105512692A (zh) * | 2015-11-30 | 2016-04-20 | 华南理工大学 | 基于blstm的联机手写数学公式符号识别方法 |
CN106022392A (zh) * | 2016-06-02 | 2016-10-12 | 华南理工大学 | 一种深度神经网络样本自动取舍的训练方法 |
-
2016
- 2016-10-13 CN CN201610895498.1A patent/CN106570456B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4495644A (en) * | 1981-04-27 | 1985-01-22 | Quest Automation Public Limited Company | Apparatus for signature verification |
CN105512692A (zh) * | 2015-11-30 | 2016-04-20 | 华南理工大学 | 基于blstm的联机手写数学公式符号识别方法 |
CN106022392A (zh) * | 2016-06-02 | 2016-10-12 | 华南理工大学 | 一种深度神经网络样本自动取舍的训练方法 |
Non-Patent Citations (5)
Title |
---|
Chinese character-level writer identification using path signature feature,DropStroke and deep CNN;Weixin Yang 等;《2015 13th International Conference on Document Analysis and Recognition (ICDAR)》;20150826;第546-550页 * |
Improved deep convolutional neural network for online handwritten Chinese character recognition using domain-specific knowledge;Weixin Yang 等;《2015 13th International Conference on Document Analysis and Recognition (ICDAR)》;20150826;第551-555页 * |
Integration of Paths--A Faithful Representation of Paths by Noncommutative Formal Power Series;K.T. Chen 等;《Transactions of the American Mathematical Society》;19580228;第395页 * |
Sparse arrays of signatures for online character recognition;Graham Benjamin;《arXiv preprint》;20131208;第1-10页 * |
深度学习在手写汉字识别中的应用综述;金连文 等;《自动化学报》;20160830;第42卷(第8期);第1125页第2栏第2段-1134页第2栏第2段 * |
Also Published As
Publication number | Publication date |
---|---|
CN106570456A (zh) | 2017-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106570456B (zh) | 基于全卷积递归网络的手写汉字文本识别方法 | |
Zhu et al. | CAN-NER: Convolutional attention network for Chinese named entity recognition | |
CN109241524B (zh) | 语义解析方法及装置、计算机可读存储介质、电子设备 | |
CN111753081B (zh) | 基于深度skip-gram网络的文本分类的系统和方法 | |
CN108804423B (zh) | 医疗文本特征提取与自动匹配方法和系统 | |
CN106547735A (zh) | 基于深度学习的上下文感知的动态词或字向量的构建及使用方法 | |
CN110196980A (zh) | 一种基于卷积网络在中文分词任务上的领域迁移 | |
Tang et al. | Graph-based multimodal sequential embedding for sign language translation | |
JP7142121B2 (ja) | 文字認識の方法、装置、電子設備、コンピュータ可読記憶媒体、及びプログラム | |
CN110390363A (zh) | 一种图像描述方法 | |
CN105068997B (zh) | 平行语料的构建方法及装置 | |
WO2021098689A1 (zh) | 自然场景的文本识别方法、存储装置和计算机设备 | |
CN104463250A (zh) | 一种基于达芬奇技术的手语识别翻译方法 | |
CN111488732B (zh) | 一种变形关键词检测方法、系统及相关设备 | |
CN111783767B (zh) | 文字识别方法、装置、电子设备及存储介质 | |
Wang et al. | Stroke constrained attention network for online handwritten mathematical expression recognition | |
CN110287952A (zh) | 一种维语图片字符的识别方法及系统 | |
CN114612921B (zh) | 表单识别方法、装置、电子设备和计算机可读介质 | |
CN108427717A (zh) | 一种基于逐步扩展的字母类语系医疗文本关系抽取方法 | |
CN112825129A (zh) | 用于文档处理的位置嵌入 | |
Song et al. | Parallel temporal encoder for sign language translation | |
CN110222338A (zh) | 一种机构名实体识别方法 | |
CN110032920A (zh) | 文字识别匹配方法、设备和装置 | |
EP4170542A2 (en) | Method for sample augmentation | |
US11941346B2 (en) | Systems and methods for long document summarization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |