CN108154148A - 训练样本的人工合成方法及基于该样本的验证码识别方法 - Google Patents

训练样本的人工合成方法及基于该样本的验证码识别方法 Download PDF

Info

Publication number
CN108154148A
CN108154148A CN201810057556.2A CN201810057556A CN108154148A CN 108154148 A CN108154148 A CN 108154148A CN 201810057556 A CN201810057556 A CN 201810057556A CN 108154148 A CN108154148 A CN 108154148A
Authority
CN
China
Prior art keywords
sample
background
picture
layers
training sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810057556.2A
Other languages
English (en)
Inventor
叶炳坤
王志永
郭建辉
林文东
郑旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen Us Asia Business Tripod Mdt Infotech Ltd
Original Assignee
Xiamen Us Asia Business Tripod Mdt Infotech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen Us Asia Business Tripod Mdt Infotech Ltd filed Critical Xiamen Us Asia Business Tripod Mdt Infotech Ltd
Priority to CN201810057556.2A priority Critical patent/CN108154148A/zh
Publication of CN108154148A publication Critical patent/CN108154148A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/768Arrangements for image or video recognition or understanding using pattern recognition or machine learning using context analysis, e.g. recognition aided by known co-occurring patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种训练样本的人工合成方法及基于该样本的验证码识别方法。训练样本的人工合成方法包括S1、生成验证码词库;S2、生成背景图片库;S3、筛选矩形背景块;S4、收集字体集合;S5、词语与背景块的随机匹配;S6、抠取已写入词语的背景块作为样本。本发明还公开了一种基于该训练样本的验证码识别方法,其包括S1、特征提取;S2、序列标定;S3、识别结果的修正。本发明以人工合成样本的方式获取训练样本,只要设置识别的文字类别,便可生成相应类别的样本,再加入少量的实际网站样本,便可以取得较好的效果,使样本多样化的同时,减少了样本收集投入的大量人力财力。

Description

训练样本的人工合成方法及基于该样本的验证码识别方法
技术领域
本发明涉及互联网技术领域,具体涉及一种训练样本的人工合成方法及基于该样本的验证码识别方法。
背景技术
一般意义上,基于图像的文字识别包括基于扫描文字的光学字符识别(OpticalCharacter Recognition,OCR)和广泛用于网站注册验证的CAPTCHA(CompletelyAutomated Public Turing Test to Tell Computers and Humans Apart,全自动区分计算机和人类的图灵测试)。相比较而言,基于扫描仪的OCR最简单,CAPTCHA最难。
传统的验证码破解主要对字符检测,切割,后对单个字符的识别。该方法只能对传统的背景清晰,文字较为端正简单的验证码进行识别,无法适应复杂背景的验证码文字。当前也有cnn+rnn机器学习的验证码识别方法,但其通过验证码生成器合成训练样本较为单一,人工收集样本工作量大,在实际项目中无法推行应用。
发明内容
本发明的目的在于提供一种训练样本的人工合成方法及基于该样本的验证码识别方法。
为实现上述目的,本发明采用以下技术方案:
训练样本的人工合成方法,合成用作机器学习的训练样本,以实现基于机器学习的验证码识别,包括:
S1、随机选择字符类别、字符个数及字符组合,以生成验证码词库;
S2、收集不包含文字的清晰图片作为背景图片,生成背景图片库;
S3、对背景图片库中的背景图片进行特征提取,提取其语义信息和深度信息,根据提取的语义信息与深度信息在背景图片中筛选可以写入文字的矩形背景块;
S4、收集字体集合;
S5、随机从背景图片库中选取背景图片,随机从词库中选取词语与所选的背景图片中的背景块进行匹配,通过字体集合随机设置所选词语的字体、颜色、大小、变换及倾斜信息;
S6、抠取已写入词语的背景块作为样本。
进一步地,步骤S1中所述的字符类别包括数字、字母、数学符号及汉字,所选字符类别为一种或多种。
进一步地,步骤S2中所述背景图片的宽高大于600*600。
进一步地,步骤S3中采用gPb-UCM方法提取背景图片的语义信息,采用Deepconvolutional neural fields for depth estimation from a single image方法提取背景图片的深度信息。
进一步地,步骤S6具体为:计算背景块的倾斜角度,对背景图片进行该角度的旋转,在旋转后的背景图片上截取保存该背景块,记录label,作为样本。
本发明还提供一种基于人工合成样本的验证码识别方法,包括:
S1、利用CNN对图片进行特征提取,并利用Map-to-Sequence表示成特征向量:所述CNN包括1输入层、5卷积层、3池化层及2归一化层,所述输入层对图片进行缩放处理,所述卷积层获取图片的局部特征,所述池化层对局部特征进行降维,所述归一化层在网络层之间进行预处理的操作;
S2、序列标定:使用双向LSTM识别特征向量,得到每列特征的概率分布,获得初步的识别结果;
S3、去除识别结果中相邻重复的字符以及非字符,得到最终的识别结果。
进一步地,图片的特征提取具体包括:
S11、input层将图片归一化到32*128;
S12、Conv0、Conv1分别设置64、128个5*5的卷积核,BathcNormalization0层输出数据大小为128*28*124,MaxPooling0层win:2*2向下取样,输出数据大小为128*14*62;
S13、Conv2设置256个3*3的卷积核,MaxPooling1层win:2*2向下取样,输出数据大小为256*6*30。Conv3设置384个3*3的卷积核,BathcNormalization1层输出数据大小为384*4*28;
S14、MaxPooling2层设置win:1*2,所以宽度不变,高度缩放为原来的一半,输出数据大小为384*2*128;
S15、Conv4设置512个2*2的卷积核,输出数据大小为512*1*27,得到512*1*27的特征图。
采用上述技术方案后,本发明与背景技术相比,具有如下优点:
本发明以人工合成样本的方式获取训练样本,只要设置识别的文字类别,便可生成相应类别的样本,再加入少量的实际网站样本,便可以取得较好的效果,使样本多样化的同时,减少了样本收集投入的大量人力财力。
本发明通过CNN+LSTM点对点序列识别方法,利用人工合成的训练样本,即可以实现大部分英文数字及中文验证码的识别破解,即在原始训练模型样本的基础上,加入相对应网站的样本继续训练,即可满足实际的应用需求,具有通用性。
附图说明
图1为本发明合成样本的流程图;
图2为采用本发明合成样本方法所获得的训练样本的例图;
图3为本发明验证码识别方法的流程图;
图4为本发明验证码识别方法中所采用的神经网络的设计图;
图5为采用本发明验证码识别方法所识别出的验证码的效果图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例
请参考图1所示,训练样本的人工合成方法,合成用作机器学习的训练样本,以实现基于机器学习的验证码识别,包括以下步骤:
S1、随机选择字符类别、字符个数及字符组合,以生成验证码词库。
步骤S1中所述的字符类别包括数字、字母、数学符号及汉字,所选字符类别为一种或多种。比如字符类别只有数字及字母,即只有0-9和a-z,则相应的字库就有031a2,b2431,IZ,E0....等自由组合(根据需求随机设置字符个数,再随机设置字符),尽可能多地生成的样本词库,包含各种验证码格式。
S2、收集不包含文字的清晰图片作为背景图片,生成背景图片库。
收集的图片宽高大于600*600,图片可以是日常生活中风景照等。
S3、对背景图片库中的背景图片进行特征提取,提取其语义信息和深度信息,根据提取的语义信息与深度信息在背景图片中筛选可以写入文字的矩形背景块。
采用gPb-UCM方法提取背景图片的语义信息,采用Deep convolutional neuralfields for depth estimation from a single image方法提取背景图片的深度信息。
S4、收集字体集合。
根据要识别的验证码,进行字体集合的收集。如,涉及到中文的验证码,集合中的字体必须支持中文,否则写入图片时会是乱码。
S5、随机从背景图片库中选取背景图片,获取其背景块集合的点集,随机从词库中选取词语与所选的背景图片中的背景块进行匹配,通过字体集合随机设置所选词语的字体、颜色、大小、变换及倾斜信息,将词语写入背景图片的背景块中,每个词语设定的颜色应与要写入的背景块颜色区别开,避免同种颜色写入文字导致看不清。
S6、抠取已写入词语的背景块作为样本。
计算背景块的倾斜角度,对背景图片进行该角度的旋转,在旋转后的背景图片上截取保存该背景块,记录label,作为样本。如图2所示的是采用本发明合成样本方法所获得的训练样本的例图。
本发明还提供一种基于人工合成样本的验证码识别方法,如图3所示,包括:
S1、利用CNN对图片进行特征提取,并利用Map-to-Sequence表示成特征向量。所述CNN包括1输入层(Input)、5卷积层(Conv)、3池化层(MaxPooling)及2归一化层(BathcNormalization)。所述输入层对图片进行缩放处理;所述卷积层获取图片的局部特征;所述池化层对局部特征进行降维;所述归一化层在网络层之间进行预处理的操作,即将上一层的输入归一化处理后再进入网络的下一层。
图片的特征提取具体包括:
S11、input层将图片归一化到32*128;即height缩放到32,宽度按高度的比率缩放,也可自定义。本实施例中,宽度设为128,列步骤以宽度为128分析。
S12、Conv0、Conv1分别设置64、128个5*5的卷积核,BathcNormalization0层不改变数据的大小,BathcNormalization0层输出数据大小为128*28*124,MaxPooling0层win:2*2向下取样,输出数据大小为128*14*62。
S13、Conv2设置256个3*3的卷积核,MaxPooling1层win:2*2向下取样,输出数据大小为256*6*30。Conv3设置384个3*3的卷积核,BathcNormalization1层输出数据大小为384*4*28。
S14、MaxPooling2层设置win:1*2,所以宽度不变,高度缩放为原来的一半,输出数据大小为384*2*128。
S15、Conv4设置512个2*2的卷积核,输出数据大小为512*1*27,得到512*1*27的特征图。
S2、序列标定,获得初步识别结果。
使用双向LSTM识别特征向量,得到每列特征的概率分布,获得初步的识别结果。
其中,两个双向Lstm,隐藏节点都是256,Lstm1输出27*1*256,Lstm2输出27*1*nClass(类别数)。
S3、初步识别结果的修正,得到最终的识别结果。
去除识别结果中相邻重复的字符以及非字符,得到最终的识别结果。
例如:对于识别结果为--------hh---e----ll---l-----o---,其中'-'为非字符。正常识别结果中不可能出现相邻重复的结果,如结果中的hh及ll,因此需要对其进行去重。即使图像中会有相邻重复的,比如hello中的l,识别结果中两个l之间也会有非字符隔开;去除非字符,则最终的识别结果为hello。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (7)

1.训练样本的人工合成方法,合成用作机器学习的训练样本,以实现基于机器学习的验证码识别,其特征在于,包括:
S1、随机选择字符类别、字符个数及字符组合,以生成验证码词库;
S2、收集不包含文字的清晰图片作为背景图片,生成背景图片库;
S3、对背景图片库中的背景图片进行特征提取,提取其语义信息和深度信息,根据提取的语义信息与深度信息在背景图片中筛选可以写入文字的矩形背景块;
S4、收集字体集合;
S5、随机从背景图片库中选取背景图片,随机从词库中选取词语与所选的背景图片中的背景块进行匹配,通过字体集合随机设置所选词语的字体、颜色、大小、变换及倾斜信息;
S6、抠取已写入词语的背景块作为样本。
2.如权利要求1所述的训练样本的人工合成方法,其特征在于:步骤S1中所述的字符类别包括数字、字母、数学符号及汉字,所选字符类别为一种或多种。
3.如权利要求1所述的训练样本的人工合成方法,其特征在于:步骤S2中所述背景图片的宽高大于600*600。
4.如权利要求1所述的训练样本的人工合成方法,其特征在于:步骤S3中采用gPb-UCM方法提取背景图片的语义信息,采用Deep convolutional neural fields for depthestimation from a single image方法提取背景图片的深度信息。
5.如权利要求1所述的训练样本的人工合成方法,其特征在于:步骤S6具体为:计算背景块的倾斜角度,对背景图片进行该角度的旋转,在旋转后的背景图片上截取保存该背景块,记录label,作为样本。
6.基于人工合成样本的验证码识别方法,其特征在于,包括:
S1、利用CNN对图片进行特征提取,并利用Map-to-Sequence表示成特征向量:所述CNN包括1输入层、5卷积层、3池化层及2归一化层,所述输入层对图片进行缩放处理,所述卷积层获取图片的局部特征,所述池化层对局部特征进行降维,所述归一化层在网络层之间进行预处理的操作;
S2、序列标定:使用双向LSTM识别特征向量,得到每列特征的概率分布,获得初步的识别结果;
S3、去除识别结果中相邻重复的字符以及非字符,得到最终的识别结果。
7.如权利要求6所述的基于人工合成样本的验证码识别方法,其特征在于:图片的特征提取具体包括:
S11、input层将图片归一化到32*128;
S12、Conv0、Conv1分别设置64、128个5*5的卷积核,BathcNormalization0层输出数据大小为128*28*124,MaxPooling0层win:2*2向下取样,输出数据大小为128*14*62;
S13、Conv2设置256个3*3的卷积核,MaxPooling1层win:2*2向下取样,输出数据大小为256*6*30。Conv3设置384个3*3的卷积核,BathcNormalization1层输出数据大小为384*4*28;
S14、MaxPooling2层设置win:1*2,所以宽度不变,高度缩放为原来的一半,输出数据大小为384*2*128;
S15、Conv4设置512个2*2的卷积核,输出数据大小为512*1*27,得到512*1*27的特征图。
CN201810057556.2A 2018-01-22 2018-01-22 训练样本的人工合成方法及基于该样本的验证码识别方法 Pending CN108154148A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810057556.2A CN108154148A (zh) 2018-01-22 2018-01-22 训练样本的人工合成方法及基于该样本的验证码识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810057556.2A CN108154148A (zh) 2018-01-22 2018-01-22 训练样本的人工合成方法及基于该样本的验证码识别方法

Publications (1)

Publication Number Publication Date
CN108154148A true CN108154148A (zh) 2018-06-12

Family

ID=62461784

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810057556.2A Pending CN108154148A (zh) 2018-01-22 2018-01-22 训练样本的人工合成方法及基于该样本的验证码识别方法

Country Status (1)

Country Link
CN (1) CN108154148A (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109063845A (zh) * 2018-07-15 2018-12-21 大国创新智能科技(东莞)有限公司 基于生成样本的深度学习方法和机器人系统
CN109214378A (zh) * 2018-08-16 2019-01-15 新智数字科技有限公司 一种基于神经网络整体识别计量表读数的方法和系统
CN109272043A (zh) * 2018-09-21 2019-01-25 北京京东金融科技控股有限公司 用于光学字符识别的训练数据生成方法、系统和电子设备
CN109615671A (zh) * 2018-10-25 2019-04-12 北京中关村科金技术有限公司 一种字库样本自动生成方法、计算机装置及可读存储介质
CN109670502A (zh) * 2018-12-18 2019-04-23 成都三零凯天通信实业有限公司 一种基于维语文字识别的训练数据生成系统及方法
CN110163285A (zh) * 2019-05-23 2019-08-23 阳光保险集团股份有限公司 票证识别训练样本合成方法和计算机存储介质
CN110348438A (zh) * 2019-06-29 2019-10-18 上海淇馥信息技术有限公司 一种基于人工神经网络模型的图片字符识别方法、装置和电子设备
CN110503159A (zh) * 2019-08-28 2019-11-26 北京达佳互联信息技术有限公司 文字识别方法、装置、设备及介质
CN110956170A (zh) * 2019-09-30 2020-04-03 京东数字科技控股有限公司 生成护照机读码样本的方法、装置、设备及存储介质
CN111310156A (zh) * 2019-11-28 2020-06-19 苏宁金融科技(南京)有限公司 一种滑块验证码的自动识别方法及系统
CN111368835A (zh) * 2018-12-25 2020-07-03 顺丰科技有限公司 验证码自动识别方法及装置
WO2020186785A1 (zh) * 2019-03-19 2020-09-24 平安科技(深圳)有限公司 样本集构建方法、装置、计算机设备和存储介质
CN111753845A (zh) * 2020-06-30 2020-10-09 北京来也网络科技有限公司 基于ai的验证码图片识别方法、装置、设备及存储介质
WO2020215573A1 (zh) * 2019-04-22 2020-10-29 平安科技(深圳)有限公司 验证码的识别方法、装置、计算机设备和存储介质
WO2021000407A1 (zh) * 2019-07-03 2021-01-07 平安科技(深圳)有限公司 字符验证方法、装置、计算机设备及存储介质
CN113326895A (zh) * 2021-06-25 2021-08-31 湖南星汉数智科技有限公司 客票行程单识别方法、装置、计算机设备和存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101976430A (zh) * 2010-10-29 2011-02-16 赵俊平 一种图片验证码生成方法及其系统
CN102298763A (zh) * 2010-06-28 2011-12-28 腾讯科技(北京)有限公司 一种图片验证码的生成方法及系统
CN102768754A (zh) * 2012-08-03 2012-11-07 网易(杭州)网络有限公司 一种图片验证码的实现方法和装置
CN102904722A (zh) * 2012-09-21 2013-01-30 张仁平 一种用语义和图像元素接合的网络验证方法及系统
CN107085730A (zh) * 2017-03-24 2017-08-22 深圳爱拼信息科技有限公司 一种字符验证码识别的深度学习方法及装置
CN107103225A (zh) * 2017-03-28 2017-08-29 成都优易数据有限公司 一种生成图形验证码的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102298763A (zh) * 2010-06-28 2011-12-28 腾讯科技(北京)有限公司 一种图片验证码的生成方法及系统
CN101976430A (zh) * 2010-10-29 2011-02-16 赵俊平 一种图片验证码生成方法及其系统
CN102768754A (zh) * 2012-08-03 2012-11-07 网易(杭州)网络有限公司 一种图片验证码的实现方法和装置
CN102904722A (zh) * 2012-09-21 2013-01-30 张仁平 一种用语义和图像元素接合的网络验证方法及系统
CN107085730A (zh) * 2017-03-24 2017-08-22 深圳爱拼信息科技有限公司 一种字符验证码识别的深度学习方法及装置
CN107103225A (zh) * 2017-03-28 2017-08-29 成都优易数据有限公司 一种生成图形验证码的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ANKUSH G.等: "Synthetic Data for Text Localisationin Natural Images", 《2016 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 *
BAOGUANG S. 等: "An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition", 《百度学术,HTTP://XUESHU.BAIDU.COM/USERCENTER/PAPER/SHOW?PAPERID=1EC0C3195E415F961373319B491E30B1&SITE=XUESHU_SE&HITARTICLE=1》 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109063845A (zh) * 2018-07-15 2018-12-21 大国创新智能科技(东莞)有限公司 基于生成样本的深度学习方法和机器人系统
CN109063845B (zh) * 2018-07-15 2021-12-07 大国创新智能科技(东莞)有限公司 基于生成样本的深度学习方法和机器人系统
CN109214378A (zh) * 2018-08-16 2019-01-15 新智数字科技有限公司 一种基于神经网络整体识别计量表读数的方法和系统
CN109272043A (zh) * 2018-09-21 2019-01-25 北京京东金融科技控股有限公司 用于光学字符识别的训练数据生成方法、系统和电子设备
CN109615671A (zh) * 2018-10-25 2019-04-12 北京中关村科金技术有限公司 一种字库样本自动生成方法、计算机装置及可读存储介质
CN109670502A (zh) * 2018-12-18 2019-04-23 成都三零凯天通信实业有限公司 一种基于维语文字识别的训练数据生成系统及方法
CN111368835A (zh) * 2018-12-25 2020-07-03 顺丰科技有限公司 验证码自动识别方法及装置
WO2020186785A1 (zh) * 2019-03-19 2020-09-24 平安科技(深圳)有限公司 样本集构建方法、装置、计算机设备和存储介质
WO2020215573A1 (zh) * 2019-04-22 2020-10-29 平安科技(深圳)有限公司 验证码的识别方法、装置、计算机设备和存储介质
CN110163285A (zh) * 2019-05-23 2019-08-23 阳光保险集团股份有限公司 票证识别训练样本合成方法和计算机存储介质
CN110348438A (zh) * 2019-06-29 2019-10-18 上海淇馥信息技术有限公司 一种基于人工神经网络模型的图片字符识别方法、装置和电子设备
WO2021000407A1 (zh) * 2019-07-03 2021-01-07 平安科技(深圳)有限公司 字符验证方法、装置、计算机设备及存储介质
CN110503159A (zh) * 2019-08-28 2019-11-26 北京达佳互联信息技术有限公司 文字识别方法、装置、设备及介质
CN110956170A (zh) * 2019-09-30 2020-04-03 京东数字科技控股有限公司 生成护照机读码样本的方法、装置、设备及存储介质
CN111310156A (zh) * 2019-11-28 2020-06-19 苏宁金融科技(南京)有限公司 一种滑块验证码的自动识别方法及系统
CN111753845A (zh) * 2020-06-30 2020-10-09 北京来也网络科技有限公司 基于ai的验证码图片识别方法、装置、设备及存储介质
CN113326895A (zh) * 2021-06-25 2021-08-31 湖南星汉数智科技有限公司 客票行程单识别方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN108154148A (zh) 训练样本的人工合成方法及基于该样本的验证码识别方法
Ingle et al. A scalable handwritten text recognition system
Sun et al. A robust approach for text detection from natural scene images
Zhao et al. Cutie: Learning to understand documents with convolutional universal text information extractor
Chellapilla et al. Using machine learning to break visual human interaction proofs (HIPs)
JP4142463B2 (ja) パターン認識を容易にするシステムおよび方法
Qiu et al. Hierarchical context features embedding for object detection
Jain et al. Unconstrained scene text and video text recognition for arabic script
Deshpande et al. Fine classification & recognition of hand written devnagari characters with regular expressions & minimum edit distance method.
Halima et al. Nf-savo: Neuro-fuzzy system for arabic video ocr
Ma et al. Residual attention-based multi-scale script identification in scene text images
Sevik et al. Font and Turkish letter recognition in images with deep learning
Harizi et al. Convolutional neural network with joint stepwise character/word modeling based system for scene text recognition
Le et al. A human-inspired recognition system for pre-modern Japanese historical documents
Bartos et al. A Multilingual Handwritten Character Dataset: THE Dataset
Sanjrani et al. Handwritten optical character recognition system for Sindhi numerals
Baek et al. COO: comic onomatopoeia dataset for recognizing arbitrary or truncated texts
Valy et al. Data augmentation and text recognition on Khmer historical manuscripts
Al Ghamdi A novel approach to printed Arabic optical character recognition
Rani et al. Performance analysis of feature extractors and classifiers for script recognition of English and Gurmukhi words
Mostafa et al. An end-to-end ocr framework for robust arabic-handwriting recognition using a novel transformers-based model and an innovative 270 million-words multi-font corpus of classical arabic with diacritics
Tripathi et al. Character recognition: a neural network approach
Tan et al. Radical extraction using affine sparse matrix factorization for printed Chinese characters recognition
Asadi-zeydabadi et al. IDPL-PFOD2: A New Large-Scale Dataset for Printed Farsi Optical Character Recognition
Hu et al. OTS: A One-shot Learning Approach for Text Spotting in Historical Manuscripts

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180612