CN108509881A - 一种无切分的脱机手写汉字文本识别方法 - Google Patents
一种无切分的脱机手写汉字文本识别方法 Download PDFInfo
- Publication number
- CN108509881A CN108509881A CN201810239934.9A CN201810239934A CN108509881A CN 108509881 A CN108509881 A CN 108509881A CN 201810239934 A CN201810239934 A CN 201810239934A CN 108509881 A CN108509881 A CN 108509881A
- Authority
- CN
- China
- Prior art keywords
- text
- image
- sequence
- model
- handwritten chinese
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/32—Digital ink
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
Abstract
本发明涉及一种无切分的脱机手写汉字文本识别方法,包括S1)对脱机手写汉字文本图像进行预处理;S2)构建空间变换网络模型;S3)构建深度卷积神经网络模型;S4)通过深度卷积神经网络模型提取的深度特征构建循环神经网络模型;S5)通过分类器CTC输出序列征标签的概率分布;S6)采用贪婪搜索和基于字典规则搜索得到文本最终的识别结果。本发明通过采用空间变换网络、深度卷积神经网络和循环神经网络相结合的模型,能够针对偏移较大文本行进行校正处理和无切分的识别,提高复杂文本行识别的准确性和鲁棒性;整个模型框架基于迭代算法求解,不需要复杂的过切分预处理,能够较好地减少过切分方法带来的损失,以及能够联合地优化整个模型参数,提高识别的准确率。
Description
技术领域
本发明涉及一种文本识别技术领域,尤其是一种无切分的脱机手写汉字文本识别方法。
背景技术
脱机手写体文本识别是目前文字识别领域的难题之一,与联机手写识别相比,缺少必要的的字符位置和轨迹信息,其中,后者可以根据字符位置和书写经验来近似获得,因此,字符位置的判定对脱机手写体文本识别效率的影响甚大,由于手写体字符书写随意性导致相邻字符之间的位置关系复杂,造成脱机手写文本中的字符位置定位要比印刷体字符定位困难很多,尤其是行倾斜、不规则行片段以及粘连字符的文本中的字符位置判断。
目前,针对手写文本行的识别问题,传统方法主要是基于字符切分和单字符识别的解决方案,字符切分可以将手写汉字文本行切分为基本手写字符序列,然后将切分后的单字符送入单字符的分类器,得到整行的识别结果,常用的切分技术有基于统计分方法、基于字型结构切分和基于识别的汉字统计切分方法等,其中,基于统计的切分方法是根据字符的总体统计分别特征,确定字符之间的界限,判别时,以字符的平均宽度做辅助判别,统计分布特征的代表性和稳定性对切分的正确性及收敛性起到很重要的作用,该方法实用于字符间距较宽,无粘连字符的切分,并且由于手写汉字的笔画之间较为分散或者字符之间有连笔的情况出现,容易造成过度切分或者错误切分,这使得手写汉字的识别难度更大;而且针对单字符的手写汉字识别,由于汉字类别较多以及手写汉字书写的多样性,单字符手写汉字识别的难度也很大。
发明内容
针对现有技术的不足,本发明提供一种无切分的脱机手写汉字文本识别方法。
本发明的技术方案为:一种无切分的脱机手写汉字文本识别方法,包括以下步骤:
S1)、对脱机手写汉字文本图像进行预处理,预处理包括图像尺寸归一化处理、以及图像亮度值反转;
S2)、构建空间变换网络模型,通过该空间变换网络模型校正文本图像的偏移,该空间变换网络模型由定位网络、采样栅格、采样器构成;
S3)、构建深度卷积神经网络模型,通过该模型提取校正偏移文本图像的深度特征;
S4)、通过深度卷积神经网络模型提取的深度特征构建循环神经网络模型,通过该模型对深度序列特征建模;
S5)、通过联结主义时间分类器CTC输出序列特征标签的概率分布,得到初步的识别结果;
S6)、采用贪婪搜索和基于字典规则搜索得到文本最终的识别结果。
进一步的,所述的步骤S1)中,通过图像尺寸归一化处理将文本图像宽度处理为128,并通过图像亮度值反转将文本图像背景和汉字亮度进行反转,具体为:I(i,j)=255-X(i,j),其中,X(i,j)为文本图像第i行第j列像素位置对应的亮度值,I(i,j)为转后文本图像第i行第j列像素位置的亮度值。
进一步的,上述技术方案中,步骤S2)中,具体包括以下步骤:
S201)、将预处理后的文本图像输入定位网络中,计算得到仿射变换参数θ,即θ=floc(I),其中,floc(I)是一个2层的全连接网络,I为预处理后的文本行图像;
S202)、通过仿射变换参数θ得到文本图像的坐标栅格坐标点的仿射变换如下:
其中,是输入文本图像的采样点坐标,Aθ为仿射变换矩阵,为输出栅格的坐标,并且,和当仿射变换矩阵其中,s为缩放分量,tx,ty为输出栅格像素坐标的偏移量,该变换矩阵可以实现裁剪、缩放、平移、旋转和倾斜等变换操作,这些变换实现了空间的注意力机制,使得变换后的图像更关注主要内容信息;
S203)、将文本图像的坐标栅格坐标与文本图像Y输入到采样器,得到校正偏移的文本图像V,即V=fsam(I,Tθ(G)),其中,fsam为采样器函数。
进一步的,上述技术方案中,步骤S3)中,构建的深度卷积神经网络模型为一个18层的残差深度卷积神经网络,残差网络的学习表达式为:
F(x)=H(x)-x,
其中,F(x)为残差映射,H(x)为原始映射,从而根据残差网络结构y=F(x,{Wi})+x,提取图像特征y,其中,Wi为权值参数,x为输入。
进一步的,上述技术方案中,步骤S4)中,所述的循环神经网络模型为2层双向的GRU(Gate Recurrent Unit)网络。
进一步的,上述技术方案中,步骤S5)中,分类器CTC的映射关系为:
通过CTC层输出每一帧序列特征数据的识别概率分布,其中,p(k|y)为序列特征k在序列特征y下的条件概率,p(l|y)为序列特征l在序列特征y下的条件概率,β(k)=l为序列k到序列y的映射,y=y1,...,yT为输入的特征序列,每一个L′是包含所有识别的字符集和一个空白符号,CTC在输出序列时,移除重复项以及空白项。
进一步的,上述技术方案中,步骤S6)中,通过在最大概率附近的几组数据中搜索最大概率路径l*=argmaxl∈DP(l|y)确定真实序列,其中,D是一个对应的字典;
由于可以在最大概率路径附近搜索最佳输出序列,将搜索路径限制在一个范围Nδ(l′)内,其中,δ表示最大的搜索距离,l′是无字典规则的序列,在最大概率路径附近搜索的路径可以表示为从而得到最终的识别结果。
进一步的,所述的18层的残差深度卷积神经网络模型由1个卷积层、16个残差单元和1个全局平均池化层构成。
本发明的有益效果为:通过采用空间变换网络、深度卷积神经网络和循环神经网络相结合的模型,能够针对偏移较大文本行进行校正处理和无切分的识别,提高复杂文本行识别的准确性和鲁棒性;整个模型框架基于迭代算法求解,不需要复杂的过切分预处理,能够较好地减少过切分方法带来的损失,以及能够联合地优化整个模型参数,提高识别的准确率。
附图说明
图1为本发明的流程示意图;
图2为本发明空间变换网络模型的流程图;
图3为本发明残差网络的结构图,其中a为通道相加的残差单元结构图,b为通道串接的残差单元;
图4为本发明18层残差网络的结构图;
图5为本发明双向GRU循环神经网络的结构图。
具体实施方式
下面结合附图对本发明的具体实施方式作进一步说明:
如图1所示,一种无切分的脱机手写汉字文本识别方法,包括以下步骤:
S1)、对脱机手写汉字文本图像进行预处理,预处理包括图像尺寸归一化处理、以及图像亮度值反转,通过图像尺寸归一化处理将文本图像宽度处理为128,由于所采集的脱机手写汉字文本图像的背景颜色是白色,亮度值为255,为了减少计算量,通过图像亮度值反转将文本图像背景和汉字亮度进行反转,具体为:I(i,j)=255-X(i,j),其中,X(i,j)为文本图像第i行第j列像素位置对应的亮度值,I(i,j)为转后文本图像第i行第j列像素位置的亮度值,反转后的文本图像中更多的亮度值为0,图像矩阵更加稀疏,进而减少了计算量;
S2)、构建空间变换网络模型,通过该空间变换网络模型校正文本图像的偏移,该空间变换网络模型由定位网络、采样栅格、采样器构成,如图2所示,其中,定位网络用于求解仿射变换的参数θ,具体包括以下步骤:
S201)、将预处理后的文本图像输入定位网络中,计算得到仿射变换参数θ,即θ=floc(I),其中,floc(I)是一个2层的全连接网络,I为预处理后的文本行图像;
S202)、通过仿射变换参数θ得到文本图像的坐标栅格坐标点的仿射变换如下:
其中,是输入文本图像的采样点坐标,Aθ为仿射变换矩阵,为输出栅格的坐标,并且,和当仿射变换矩阵其中,s为缩放分量,tx,ty为输出栅格像素坐标的偏移量,该变换矩阵可以实现裁剪、缩放、平移、旋转和倾斜等变换操作,这些变换实现了空间的注意力机制,使得变换后的图像更关注主要内容信息;
S203)、将文本图像的坐标栅格坐标与文本图像Y输入到采样器,得到校正偏移的文本图像V,即V=fsam(I,Tθ(G)),其中,fsam为采样器函数;
S3)、构建深度卷积神经网络模型,通过该模型提取校正偏移文本图像的深度特征,深度卷积神经网络模型可以从数据中学习,并提取更为有表征能力的抽象特征,本发明采用一个18层的残差深度卷积神经网络模型,残差网络的学习表达式为:
F(x)=H(x)-x,
其中,F(x)为残差映射,H(x)为原始映射,对于更深层网络结构,残差映射是更稳定的非线性映射方式,假定提取图像特征为y,输入为x,从而根据残差网络结构y=F(x,{Wi})+x,其中,Wi为权值参数,如图3所示,图3(a)的结构采用快捷连接实现残差映射关系,通道维数与输入的通道保持不变,图3(b)是采用通道串接的方式实现残差映射关系,通道维数增加为输入通道的两倍;
如图4所示,该18层的残差深度卷积神经网络模型由1个卷积层、16个残差单元和1个全局平均池化层构成,在整个残差网络结构中,添加批量归一化层(BatchNorm)来加速网络拟合,采用ReLU函数作为非线性的激活函数,残差网络最后一层为全局池化层,用于将特征转换为高度为1的深度抽象特征;
S4)、通过深度卷积神经网络模型提取的深度特征构建循环神经网络模型,通过该模型对深度序列特征建模,其中,所述的循环神经网络模型为2层双向的GRU(GateRecurrent Unit)网络,其基本结构如图5所示;
S5)、通过联结主义时间分类器CTC输出序列特征标签的概率分布,得到初步的识别结果,其中,分类器CTC的映射关系为:通过CTC层输出每一帧序列特征数据的识别概率分布,其中,p(k|y)为序列特征k在序列特征y下的条件概率,p(l|y)为序列特征l在序列特征y下的条件概率,β(k)=l为序列k到序列y的映射,y=y1,...,yT为输入的特征序列,每一个L′是包含所有识别的字符集和一个空白符号,CTC在输出序列时,移除重复项以及空白项,例如序列“信-息息-技-术-中-心心—”会输出新的序列“信息技术中心”;
S6)、采用贪婪搜索和基于字典规则搜索得到文本最终的识别结果,通过在最大概率附近的几组数据中搜索最大概率路径l*=argmaxl∈DP(l|y)确定真实序列,其中,D是一个对应的字典;
由于可以在最大概率路径附近搜索最佳输出序列,将搜索路径限制在一个范围Nδ(l′)内,其中,δ表示最大的搜索距离,l′是无字典规则的序列,在最大概率路径附近搜索的路径可以表示为从而得到最终的识别结果。
上述实施例和说明书中描述的只是说明本发明的原理和最佳实施例,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。
Claims (8)
1.一种无切分的脱机手写汉字文本识别方法,其特征在于,包括以下步骤:
S1)、对脱机手写汉字文本图像进行预处理,预处理包括图像尺寸归一化处理、以及图像亮度值反转;
S2)、构建空间变换网络模型,通过该空间变换网络模型校正文本图像的偏移,该空间变换网络模型由定位网络、采样栅格、采样器构成;
S3)、构建深度卷积神经网络模型,通过该模型提取校正偏移文本图像的深度特征;
S4)、通过深度卷积神经网络模型提取的深度特征构建循环神经网络模型,通过该模型对深度序列特征建模;
S5)、通过联结主义时间分类器CTC输出序列特征标签的概率分布,得到初步的识别结果;
S6)、采用贪婪搜索和基于字典规则搜索得到文本最终的识别结果。
2.根据权利要求1所述的一种无切分的脱机手写汉字文本识别方法,其特征在于:所述的步骤S1)中,通过图像尺寸归一化处理将文本图像宽度处理为128,并通过图像亮度值反转将文本图像背景和汉字亮度进行反转,具体为:I(i,j)=255-X(i,j),其中,X(i,j)为文本图像第i行第j列像素位置对应的亮度值,I(i,j)为转后文本图像第i行第j列像素位置的亮度值。
3.根据权利要求1所述的一种无切分的脱机手写汉字文本识别方法,其特征在于:步骤S2)中,具体包括以下步骤:
S201)、将预处理后的文本图像输入定位网络中,计算得到仿射变换参数θ,即θ=floc(I),其中,floc(I)是一个2层的全连接网络,I为预处理后的文本行图像;
S202)、通过仿射变换参数θ得到文本图像的坐标栅格坐标点的仿射变换如下:
其中,是输入文本图像的采样点坐标,Aθ为仿射变换矩阵,为输出栅格的坐标,并且,和当仿射变换矩阵其中,s为缩放分量,tx,ty为输出栅格像素坐标的偏移量,该变换矩阵可以实现裁剪、缩放、平移、旋转和倾斜等变换操作,这些变换实现了空间的注意力机制,使得变换后的图像更关注主要内容信息;
S203)、将文本图像的坐标栅格坐标与文本图像Y输入到采样器,得到校正偏移的文本图像V,即V=fsam(I,Tθ(G)),其中,fsam为采样器函数。
4.根据权利要求1所述的一种无切分的脱机手写汉字文本识别方法,其特征在于:步骤S3)中,构建的深度卷积神经网络模型为一个18层的残差深度卷积神经网络,残差网络的学习表达式为:
F(x)=H(x)-x,
其中,F(x)为残差映射,H(x)为原始映射,从而根据残差网络结构y=F(x,{Wi})+x,提取图像特征y,其中,Wi为权值参数,x为输入。
5.根据权利要求1所述的一种无切分的脱机手写汉字文本识别方法,其特征在于:步骤S4)中,所述的循环神经网络模型为2层双向的GRU(Gate Recurrent Unit)网络。
6.根据权利要求1所述的一种无切分的脱机手写汉字文本识别方法,其特征在于:步骤S5)中,分类器CTC的映射关系为:通过CTC层输出每一帧序列特征数据的识别概率分布,其中,p(k|y)为序列特征k在序列特征y下的条件概率,p(l|y)为序列特征l在序列特征y下的条件概率,β(k)=l为序列k到序列y的映射,y=y1,...,yT为输入的特征序列,每一个L′是包含所有识别的字符集和一个空白符号,CTC在输出序列时,移除重复项以及空白项。
7.根据权利要求1所述的一种无切分的脱机手写汉字文本识别方法,其特征在于:步骤S6)中,通过在最大概率附近的几组数据中搜索最大概率路径l*=argmaxl∈DP(l|y)确定真实序列,其中,D是一个对应的字典;
由于可以在最大概率路径附近搜索最佳输出序列,将搜索路径限制在一个范围Nδ(l′)内,其中,δ表示最大的搜索距离,l′是无字典规则的序列,在最大概率路径附近搜索的路径可以表示为从而得到最终的识别结果。
8.根据权利要求4所述的一种无切分的脱机手写汉字文本识别方法,其特征在于:所述的18层的残差深度卷积神经网络模型由1个卷积层、16个残差单元和1个全局平均池化层构成。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810239934.9A CN108509881A (zh) | 2018-03-22 | 2018-03-22 | 一种无切分的脱机手写汉字文本识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810239934.9A CN108509881A (zh) | 2018-03-22 | 2018-03-22 | 一种无切分的脱机手写汉字文本识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108509881A true CN108509881A (zh) | 2018-09-07 |
Family
ID=63378062
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810239934.9A Pending CN108509881A (zh) | 2018-03-22 | 2018-03-22 | 一种无切分的脱机手写汉字文本识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108509881A (zh) |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109299717A (zh) * | 2018-09-13 | 2019-02-01 | 网易(杭州)网络有限公司 | 文字识别模型建立及文字识别方法、装置、介质及设备 |
CN109460720A (zh) * | 2018-10-25 | 2019-03-12 | 中科院成都信息技术股份有限公司 | 基于卷积神经网络的选票识别方法 |
CN109492679A (zh) * | 2018-10-24 | 2019-03-19 | 杭州电子科技大学 | 基于注意力机制与联结时间分类损失的文字识别方法 |
CN109543777A (zh) * | 2018-11-28 | 2019-03-29 | 中国科学院自动化研究所 | 手写汉字书写质量评价方法及系统 |
CN109710787A (zh) * | 2018-12-30 | 2019-05-03 | 陕西师范大学 | 基于深度学习的图像描述方法 |
CN109766893A (zh) * | 2019-01-09 | 2019-05-17 | 北京数衍科技有限公司 | 适于购物小票的图片文字识别方法 |
CN109902622A (zh) * | 2019-02-26 | 2019-06-18 | 中国科学院重庆绿色智能技术研究院 | 一种用于登机牌信息验证的文字检测识别方法 |
CN109948714A (zh) * | 2019-03-22 | 2019-06-28 | 华南理工大学 | 基于残差卷积和递归神经网络的中文场景文本行识别方法 |
CN110210480A (zh) * | 2019-06-05 | 2019-09-06 | 北京旷视科技有限公司 | 文字识别方法、装置、电子设备和计算机可读存储介质 |
CN110443127A (zh) * | 2019-06-28 | 2019-11-12 | 天津大学 | 结合残差卷积结构和循环神经网络的乐谱图像识别方法 |
CN110456026A (zh) * | 2019-08-13 | 2019-11-15 | 北京农业信息技术研究中心 | 一种土壤墒情监测方法及装置 |
CN110738090A (zh) * | 2018-07-19 | 2020-01-31 | 塔塔咨询服务公司 | 使用神经网络进行端到端手写文本识别的系统和方法 |
CN110807455A (zh) * | 2019-09-19 | 2020-02-18 | 平安科技(深圳)有限公司 | 基于深度学习的票据检测方法、装置、设备及存储介质 |
CN111241892A (zh) * | 2018-11-29 | 2020-06-05 | 中科视语(北京)科技有限公司 | 一种基于多神经网络模型联合优化的人脸识别方法及系统 |
CN111241891A (zh) * | 2018-11-29 | 2020-06-05 | 中科视语(北京)科技有限公司 | 一种人脸图像切图方法、装置及计算机可读存储介质 |
CN111931778A (zh) * | 2020-07-21 | 2020-11-13 | 浪潮金融信息技术有限公司 | 一种基于行列切分的印刷体字符的识别方法 |
CN112132050A (zh) * | 2020-09-24 | 2020-12-25 | 北京计算机技术及应用研究所 | 联机手写汉字识别算法及可视化关键笔画评估方法 |
CN112633429A (zh) * | 2020-12-21 | 2021-04-09 | 安徽七天教育科技有限公司 | 一种学生手写选择题识别方法 |
CN112651323A (zh) * | 2020-12-22 | 2021-04-13 | 山东山大鸥玛软件股份有限公司 | 一种基于文本行检测的中文手写体识别方法及系统 |
CN113705322A (zh) * | 2021-06-11 | 2021-11-26 | 北京易达图灵科技有限公司 | 基于门限图神经网络的手写汉字识别方法和装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150347860A1 (en) * | 2014-05-30 | 2015-12-03 | Apple Inc. | Systems And Methods For Character Sequence Recognition With No Explicit Segmentation |
CN105512692A (zh) * | 2015-11-30 | 2016-04-20 | 华南理工大学 | 基于blstm的联机手写数学公式符号识别方法 |
CN106408039A (zh) * | 2016-09-14 | 2017-02-15 | 华南理工大学 | 一种基于形变方法进行数据扩展的脱机手写汉字识别方法 |
CN106570456A (zh) * | 2016-10-13 | 2017-04-19 | 华南理工大学 | 基于全卷积递归网络的手写汉字文本识别方法 |
CN107273897A (zh) * | 2017-07-04 | 2017-10-20 | 华中科技大学 | 一种基于深度学习的文字识别方法 |
CN107590497A (zh) * | 2017-09-20 | 2018-01-16 | 重庆邮电大学 | 基于深度卷积神经网络的脱机手写汉字识别方法 |
-
2018
- 2018-03-22 CN CN201810239934.9A patent/CN108509881A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150347860A1 (en) * | 2014-05-30 | 2015-12-03 | Apple Inc. | Systems And Methods For Character Sequence Recognition With No Explicit Segmentation |
CN105512692A (zh) * | 2015-11-30 | 2016-04-20 | 华南理工大学 | 基于blstm的联机手写数学公式符号识别方法 |
CN106408039A (zh) * | 2016-09-14 | 2017-02-15 | 华南理工大学 | 一种基于形变方法进行数据扩展的脱机手写汉字识别方法 |
CN106570456A (zh) * | 2016-10-13 | 2017-04-19 | 华南理工大学 | 基于全卷积递归网络的手写汉字文本识别方法 |
CN107273897A (zh) * | 2017-07-04 | 2017-10-20 | 华中科技大学 | 一种基于深度学习的文字识别方法 |
CN107590497A (zh) * | 2017-09-20 | 2018-01-16 | 重庆邮电大学 | 基于深度卷积神经网络的脱机手写汉字识别方法 |
Non-Patent Citations (3)
Title |
---|
BAOGUANG SHI ETAL: "An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition", 《ARXIV:1507.05717V1》 * |
FANGYI LI ETAL: "Handwritten Chinese Character Reccognition using fuzzy image alignment", 《SOFT COMPUT,HTTPS://LINK.SPRINGER.COM/ARTICLE/10.1007/S00500-015-1923-Y》 * |
姚聪: "自然图像中文字检测与识别研究", 《中国博士学位论文全文数据库 信息科技辑》 * |
Cited By (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110738090A (zh) * | 2018-07-19 | 2020-01-31 | 塔塔咨询服务公司 | 使用神经网络进行端到端手写文本识别的系统和方法 |
CN110738090B (zh) * | 2018-07-19 | 2023-10-27 | 塔塔咨询服务公司 | 使用神经网络进行端到端手写文本识别的系统和方法 |
US10839246B2 (en) | 2018-07-19 | 2020-11-17 | Tata Consultancy Services Limited | Systems and methods for end-to-end handwritten text recognition using neural networks |
CN109299717B (zh) * | 2018-09-13 | 2021-08-17 | 网易(杭州)网络有限公司 | 文字识别模型建立及文字识别方法、装置、介质及设备 |
CN109299717A (zh) * | 2018-09-13 | 2019-02-01 | 网易(杭州)网络有限公司 | 文字识别模型建立及文字识别方法、装置、介质及设备 |
CN109492679A (zh) * | 2018-10-24 | 2019-03-19 | 杭州电子科技大学 | 基于注意力机制与联结时间分类损失的文字识别方法 |
CN109460720A (zh) * | 2018-10-25 | 2019-03-12 | 中科院成都信息技术股份有限公司 | 基于卷积神经网络的选票识别方法 |
CN109543777A (zh) * | 2018-11-28 | 2019-03-29 | 中国科学院自动化研究所 | 手写汉字书写质量评价方法及系统 |
CN111241891A (zh) * | 2018-11-29 | 2020-06-05 | 中科视语(北京)科技有限公司 | 一种人脸图像切图方法、装置及计算机可读存储介质 |
CN111241892A (zh) * | 2018-11-29 | 2020-06-05 | 中科视语(北京)科技有限公司 | 一种基于多神经网络模型联合优化的人脸识别方法及系统 |
CN109710787A (zh) * | 2018-12-30 | 2019-05-03 | 陕西师范大学 | 基于深度学习的图像描述方法 |
CN109710787B (zh) * | 2018-12-30 | 2023-03-28 | 陕西师范大学 | 基于深度学习的图像描述方法 |
CN109766893A (zh) * | 2019-01-09 | 2019-05-17 | 北京数衍科技有限公司 | 适于购物小票的图片文字识别方法 |
CN109902622A (zh) * | 2019-02-26 | 2019-06-18 | 中国科学院重庆绿色智能技术研究院 | 一种用于登机牌信息验证的文字检测识别方法 |
CN109948714A (zh) * | 2019-03-22 | 2019-06-28 | 华南理工大学 | 基于残差卷积和递归神经网络的中文场景文本行识别方法 |
CN109948714B (zh) * | 2019-03-22 | 2022-11-29 | 华南理工大学 | 基于残差卷积和递归神经网络的中文场景文本行识别方法 |
CN110210480B (zh) * | 2019-06-05 | 2021-08-10 | 北京旷视科技有限公司 | 文字识别方法、装置、电子设备和计算机可读存储介质 |
CN110210480A (zh) * | 2019-06-05 | 2019-09-06 | 北京旷视科技有限公司 | 文字识别方法、装置、电子设备和计算机可读存储介质 |
CN110443127A (zh) * | 2019-06-28 | 2019-11-12 | 天津大学 | 结合残差卷积结构和循环神经网络的乐谱图像识别方法 |
CN110456026A (zh) * | 2019-08-13 | 2019-11-15 | 北京农业信息技术研究中心 | 一种土壤墒情监测方法及装置 |
CN110807455A (zh) * | 2019-09-19 | 2020-02-18 | 平安科技(深圳)有限公司 | 基于深度学习的票据检测方法、装置、设备及存储介质 |
CN111931778B (zh) * | 2020-07-21 | 2022-08-09 | 浪潮金融信息技术有限公司 | 一种基于行列切分的印刷体字符的识别方法 |
CN111931778A (zh) * | 2020-07-21 | 2020-11-13 | 浪潮金融信息技术有限公司 | 一种基于行列切分的印刷体字符的识别方法 |
CN112132050B (zh) * | 2020-09-24 | 2024-03-29 | 北京计算机技术及应用研究所 | 联机手写汉字识别算法及可视化关键笔画评估方法 |
CN112132050A (zh) * | 2020-09-24 | 2020-12-25 | 北京计算机技术及应用研究所 | 联机手写汉字识别算法及可视化关键笔画评估方法 |
CN112633429A (zh) * | 2020-12-21 | 2021-04-09 | 安徽七天教育科技有限公司 | 一种学生手写选择题识别方法 |
CN112651323A (zh) * | 2020-12-22 | 2021-04-13 | 山东山大鸥玛软件股份有限公司 | 一种基于文本行检测的中文手写体识别方法及系统 |
CN113705322A (zh) * | 2021-06-11 | 2021-11-26 | 北京易达图灵科技有限公司 | 基于门限图神经网络的手写汉字识别方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108509881A (zh) | 一种无切分的脱机手写汉字文本识别方法 | |
Li et al. | Toward end-to-end car license plate detection and recognition with deep neural networks | |
Mahmoud | Recognition of writer-independent off-line handwritten Arabic (Indian) numerals using hidden Markov models | |
Saady et al. | Amazigh handwritten character recognition based on horizontal and vertical centerline of character | |
CN107844740A (zh) | 一种脱机手写、印刷汉字识别方法及系统 | |
CN108664975B (zh) | 一种维吾尔文手写字母识别方法、系统及电子设备 | |
CN111523622B (zh) | 基于特征图像自学习的机械臂模拟手写笔迹方法 | |
Malakar et al. | A holistic approach for handwritten Hindi word recognition | |
Sajedi | Handwriting recognition of digits, signs, and numerical strings in Persian | |
CN112052845A (zh) | 图像识别方法、装置、设备及存储介质 | |
CN112069900A (zh) | 基于卷积神经网络的票据文字识别方法及系统 | |
CN112580507A (zh) | 一种基于图像矩矫正的深度学习文本字符检测方法 | |
He et al. | Context-aware mathematical expression recognition: An end-to-end framework and a benchmark | |
Yang et al. | Recognition of chinese text in historical documents with page-level annotations | |
Addis et al. | Printed ethiopic script recognition by using lstm networks | |
He et al. | Open set Chinese character recognition using multi-typed attributes | |
Naz et al. | An Ocr system for printed Nasta'liq script: A segmentation based approach | |
Qiu et al. | Geological symbol recognition on geological map using convolutional recurrent neural network with augmented data | |
Dipu et al. | Bangla optical character recognition (ocr) using deep learning based image classification algorithms | |
Kataria et al. | CNN-bidirectional LSTM based optical character recognition of Sanskrit manuscripts: A comprehensive systematic literature review | |
CN115311666A (zh) | 图文识别方法、装置、计算机设备及存储介质 | |
Nath et al. | Improving various offline techniques used for handwritten character recognition: a review | |
Naz et al. | Challenges in baseline detection of cursive script languages | |
Putra et al. | Structural offline handwriting character recognition using Levenshtein distance | |
Wei et al. | Multi-task learning based traditional Mongolian words recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180907 |