CN109919147A - 服装吊牌图像中文本识别的方法 - Google Patents

服装吊牌图像中文本识别的方法 Download PDF

Info

Publication number
CN109919147A
CN109919147A CN201910161181.9A CN201910161181A CN109919147A CN 109919147 A CN109919147 A CN 109919147A CN 201910161181 A CN201910161181 A CN 201910161181A CN 109919147 A CN109919147 A CN 109919147A
Authority
CN
China
Prior art keywords
text
identification
line
correction
drop
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910161181.9A
Other languages
English (en)
Inventor
胡玉琛
吴磊彬
林博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Baozun eCommerce Ltd
Original Assignee
Shanghai Baozun eCommerce Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Baozun eCommerce Ltd filed Critical Shanghai Baozun eCommerce Ltd
Priority to CN201910161181.9A priority Critical patent/CN109919147A/zh
Publication of CN109919147A publication Critical patent/CN109919147A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

本发明涉及一种服装吊牌图像中文本识别的方法,包括角度矫正、文本检测、文本识别、文本校正;角度矫正通过计算图片的旋转角度,对其进行旋转矫正;文本检测计算出字符区域的边缘位置进行图片裁剪,然后用简单的文本线构造算法,得到文本行的坐标;文本识别通过卷积循环网络(CRNN)实现文本识别,采用代码合成的不同字体、字号、背景下的图像,以及部分真实场景图片,实现字符分类;文本校正通过词库匹配,并替换为相似度最高的词汇,校正出连贯的词条。其优点表现在:可代替传统人工录入信息的方式,降低了人工录入过程的枯燥和繁琐,同时在时间和成本上做到了极致的压缩,识别结果达到了较高的识别精度,词库匹配校正降低了错误率。

Description

服装吊牌图像中文本识别的方法
技术领域
本发明涉及涉及目标检测和文本识别技术领域,具体地说,是一种服装吊牌图像中文本识别的方法。
背景技术
光学字符识别(英语:Optical Character Recognition,OCR)传统意义上是指对扫描的文档图像进行分析识别处理,获取文字及版面信息的过程。该技术也已进一步应用到场景中的文字识别,即识别自然场景图像中的文字信息。由于自然场景图像中背景极其多样,文本允许多种语言混合,字符可以有不同大小、字体、颜色等,且图像中文字区域可能存在变形、残缺、模糊等,场景中文字识别的难度远大于传统文档图像中的文字识别。目前OCR技术广泛应用于各行各业,相关的应用涉及到身份证识别、票据识别、车牌识别等。常见的OCR流程主要包括以下几个步骤:
1、图像预处理:主要包括二值化,噪声去除,倾斜较正等。
2、字符识别:一种是需要字符分割,首先进行版面分析、分割字符,然后特征提取和降维,最后是分类识别。另一种方法无需分割字符,检测出含有文字的区域进行识别。
3、后处理:根据特定的语言上下文的关系、词匹配,对识别结果进行较正。
目前开源的字符识别引擎包括Tesseract4.0,Calamari等。其中Tesseract4.0的特点是开源免费,支持多语言,多平台,在背景单一字符清晰的情况下识别效果较好,但对于较复杂的场景识别准确率低。Calamari是一种新的开源OCR识别软件,其中使用了最新的Tensorflow框架实现的深度神经网络(DNN),提供了预训练的模型和多模型投票技术,由卷积神经网络(CNNS)和长短时记忆(LSTM)层构成的网络架构通过连接时间分类(CTC)算法进行训练,但该库主要是用来识别印刷体古籍文字,在自然场景图像上的识别效果并没有实验说明,且不具备文本检测的功能。除此之外,基于深度学习通过文字检测和文字识别两步结合实现自然场景文本识别的方法也得到了广泛应用。比如用于文本检测的CTPN,其具体实现流程包含检测小尺度文本候选框,采用循环神经网络(RNN)连接文本框,以及文本行的构造和边缘细化,其检测结果在水平方向的文字效果比较好,但是在其它方向的检测效果相对较差。用于文本识别的CRNN利用卷积神经网络(CNN)和循环神经网络(RNN),以连接时间分类(CTC)作为损失函数进行训练,实现了对任意长度的文本行端到端的检测,但是训练中引入空格标签后测试精度会有所下降。
中国专利文献:CN107194170A,公开日:2017.09.22,公开了一种图像文本识别的方法,所述方法包括:构建单行文本图像训练集;利用所述单行文本图像训练集训练预设的神经网络模型,得到单行文本识别模型;利用所述单行文本识别模型识别随机场景的单行文本图像,得到识别后的文本信息
中国专利文献:CN108090400A,公开日:2018.05.29,公开了一种从文本中识别中文商品名称的方法和装置,有助于准确识别文本中的中文商品名称。该方法包括:保存商品信息词词库;确定文本中的句子属性信息序列;对所述句子属性信息序列依次进行粗判断和细判断;其中,所述粗判断的标准是:所述句子属性信息序列包含中心词、品牌、以及属性,或者包含中心词和一个以上属性;所述细判断的标准是:句子属性信息序列大于第一预设值并且其中不属于所述商品信息词词库的词所占比例小于第二预设值;对于同时满足所述粗判断和细判断的句子属性信息序列,确认其为中文商品名称。
但是关于本发明的一种服装吊牌图像中文本识别的方法目前还未见报道。
发明内容
本发明的目的是,提供一种服装吊牌图像中文本识别的方法。
为实现上述目的,本发明采取的技术方案是:
一种服装吊牌图像中文本识别的方法,所述的服装吊牌图像中文本识别的方法是基于深度学习技术的吊牌识别方案,具体需要进行四个流程;
第一:对图像中文本进行角度校正。由于用户上传的图片中吊牌位置不可避免的会存在倾斜,因此需要检测出吊牌区域的倾斜角度对其进行旋转校正;
第二:进一步检测图片中的文本区域。应用目标检测技术检测存在文本的区域,对输入图像进行裁剪,该预处理可减少后续文本线合成的耗时,提高检测精度。然后对图像中的文本行进行定位,以便后续逐行文字的识别;
第三:对上述步骤中检测到的文本行进行文本识别。识别过程采用了CTPN的网络结构,对包含简体中文、英文、数字等符号的数据集进行了训练;
第四:对上述步骤识别的结果进行后处理,包括分词、词库匹配校正等,进一步提高了识别准确率;
最终将识别结果储存TXT文档。
所述的服装吊牌图像中文本识别的方法包括角度矫正(1)、文本检测(2)、文本识别(3)、文本校正(4);所述的角度矫正(1)通过统计旋转角度的值,剔除异常值,计算出均值作为图片的旋转角度,对其进行旋转矫正;所述的文本检测(2)通过吊牌区域检测的方式计算出字符区域的边缘位置进行图片裁剪然后进行文本行检测,用简单的文本线构造算法,把目标检测分类得到的字符框合并成文本线,得到文本行的坐标;所述的文本识别(3)通过将深度卷积神经网络(DCNN)和循环神经网络(RNN)结合的卷积循环网络(CRNN)实现文本识别。其中卷积层用于特征提取,循环层用于序列标注,最后转录层将循环层所做的每帧预测转换成标签序列。训练集采用代码合成的不同字体、字号、背景下的图像,以及部分真实场景图片,实现字符分类;所述的文本校正(4)通过对识别结果中介绍材质的文本行中的词汇,计算其与词库中字符串的字形相似度,并替换为相似度最高的词汇,校正出连贯的词条。
本发明优点在于:
1、本发明的服装吊牌图像中文本识别的方法,可代替传统人工录入信息的方式,大大的降低了人工录入过程的枯燥和繁琐,同时在时间和成本上做到了极致的压缩。
2、本发明的服装吊牌图像中文本识别的方法,识别结果达到了较高的识别精度,词库匹配校正降低了错误率。
附图说明
附图1是一种服装吊牌图像中文本识别的方法的流程图。
附图2是一种服装吊牌图像中文本识别的方法的原理图。
具体实施方式
下面结合实施例并参照附图对本发明作进一步描述。
附图中涉及的附图标记和组成部分如下所示:
1、角度矫正
2、文本检测
3、文本识别
4、文本校正
实施例1
请参照附图1,附图1是本实施例的一种服装吊牌图像中文本识别的方法的流程图。
所述的服装吊牌图像中文本识别的方法是基于深度学习技术的吊牌识别方案,具体需要进行四个流程;
第一:对图像中文本进行角度校正。由于用户上传的图片中吊牌位置不可避免的会存在倾斜,因此需要检测出吊牌区域的倾斜角度对其进行旋转校正;
第二:进一步检测图片中的文本区域。应用目标检测技术检测存在文本的区域,对输入图像进行裁剪,该预处理可减少后续文本线合成的耗时,提高检测精度。然后对图像中的文本行进行定位,以便后续逐行文字的识别;
第三:对上述步骤中检测到的文本行进行文本识别。识别过程采用了CTPN的网络结构,对包含简体中文、英文、数字等符号的数据集进行了训练;
第四:对上述步骤识别的结果进行后处理,包括分词、词库匹配校正等,进一步提高了识别准确率;
最终将识别结果储存TXT文档。
实施例2
请参照附图2,附图2是本实施例的一种服装吊牌图像中文本识别的方法的原理图。
所述的服装吊牌图像中文本识别的方法包括角度矫正(1)、文本检测(2)、文本识别(3)、文本校正(4);所述的角度矫正(1)通过统计旋转角度的值,剔除异常值,计算出均值作为图片的旋转角度,对其进行旋转矫正;所述的文本检测(2)通过吊牌区域检测的方式计算出字符区域的边缘位置进行图片裁剪然后进行文本行检测,用简单的文本线构造算法,把目标检测分类得到的字符框合并成文本线,得到文本行的坐标;所述的文本识别(3)通过将深度卷积神经网络(DCNN)和循环神经网络(RNN)结合的卷积循环网络(CRNN)实现文本识别。其中卷积层用于特征提取,循环层用于序列标注,最后转录层将循环层所做的每帧预测转换成标签序列。训练集采用代码合成的不同字体、字号、背景下的图像,以及部分真实场景图片,实现字符分类;所述的文本校正(4)通过对识别结果中介绍材质的文本行中的词汇,计算其与词库中字符串的字形相似度,并替换为相似度最高的词汇,校正出连贯的词条。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员,在不脱离本发明原理的前提下,还可以做出若干改进和补充,这些改进和补充也应视为本发明的保护范围。

Claims (2)

1.一种服装吊牌图像中文本识别的方法,其特征在于,所述的服装吊牌图像中文本识别的方法是基于深度学习技术的吊牌识别方案,具体需要进行四个流程;
第一:对图像中文本进行角度校正。由于用户上传的图片中吊牌位置不可避免的会存在倾斜,因此需要检测出吊牌区域的倾斜角度对其进行旋转校正;
第二:进一步检测图片中的文本区域。应用目标检测技术检测存在文本的区域,对输入图像进行裁剪,该预处理可减少后续文本线合成的耗时,提高检测精度。然后对图像中的文本行进行定位,以便后续逐行文字的识别;
第三:对上述步骤中检测到的文本行进行文本识别。识别过程采用了CTPN的网络结构,对包含简体中文、英文、数字等符号的数据集进行了训练;
第四:对上述步骤识别的结果进行后处理,包括分词、词库匹配校正等,进一步提高了识别准确率;
最终将识别结果储存TXT文档。
2.根据权利要求1所述的服装吊牌图像中文本识别的方法,其特征在于,所述的服装吊牌图像中文本识别的方法包括角度矫正(1)、文本检测(2)、文本识别(3)、文本校正(4);所述的角度矫正(1)通过统计旋转角度的值,剔除异常值,计算出均值作为图片的旋转角度,对其进行旋转矫正;所述的文本检测(2)通过吊牌区域检测的方式计算出字符区域的边缘位置进行图片裁剪然后进行文本行检测,用简单的文本线构造算法,把目标检测分类得到的字符框合并成文本线,得到文本行的坐标;所述的文本识别(3)通过将深度卷积神经网络(DCNN)和循环神经网络(RNN)结合的卷积循环网络(CRNN)实现文本识别。其中卷积层用于特征提取,循环层用于序列标注,最后转录层将循环层所做的每帧预测转换成标签序列。训练集采用代码合成的不同字体、字号、背景下的图像,以及部分真实场景图片,实现字符分类;所述的文本校正(4)通过对识别结果中介绍材质的文本行中的词汇,计算其与词库中字符串的字形相似度,并替换为相似度最高的词汇,校正出连贯的词条。
CN201910161181.9A 2019-03-04 2019-03-04 服装吊牌图像中文本识别的方法 Pending CN109919147A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910161181.9A CN109919147A (zh) 2019-03-04 2019-03-04 服装吊牌图像中文本识别的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910161181.9A CN109919147A (zh) 2019-03-04 2019-03-04 服装吊牌图像中文本识别的方法

Publications (1)

Publication Number Publication Date
CN109919147A true CN109919147A (zh) 2019-06-21

Family

ID=66963103

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910161181.9A Pending CN109919147A (zh) 2019-03-04 2019-03-04 服装吊牌图像中文本识别的方法

Country Status (1)

Country Link
CN (1) CN109919147A (zh)

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110322206A (zh) * 2019-07-26 2019-10-11 苏州创腾软件有限公司 一种基于ocr识别的试剂信息录入方法及装置
CN110321893A (zh) * 2019-06-27 2019-10-11 电子科技大学 一种聚焦增强的场景文本识别网络
CN110516676A (zh) * 2019-08-21 2019-11-29 河海大学常州校区 一种基于图像处理的银行卡号识别系统
CN110569839A (zh) * 2019-08-09 2019-12-13 河海大学常州校区 一种基于ctpn和crnn的银行卡号识别方法
CN110659633A (zh) * 2019-08-15 2020-01-07 坎德拉(深圳)科技创新有限公司 图像文本信息的识别方法、装置以及存储介质
CN110781885A (zh) * 2019-10-24 2020-02-11 泰康保险集团股份有限公司 基于图像处理的文本检测方法、装置、介质及电子设备
CN110826562A (zh) * 2019-11-13 2020-02-21 上海赛特斯信息科技股份有限公司 针对服装标签和吊牌实现自动化审核处理的系统及其方法
CN111091124A (zh) * 2019-12-04 2020-05-01 吉林大学 一种书脊文字识别方法
CN111209613A (zh) * 2020-01-10 2020-05-29 杭州涂鸦信息技术有限公司 一种智能产品的快速设计方法及系统
CN111310757A (zh) * 2020-02-07 2020-06-19 北方工业大学 视频弹幕检测识别方法及装置
CN111325117A (zh) * 2020-02-05 2020-06-23 北京字节跳动网络技术有限公司 目标对象识别模型的训练方法、装置和电子设备
CN111414908A (zh) * 2020-03-16 2020-07-14 湖南快乐阳光互动娱乐传媒有限公司 一种视频中字幕字符的识别方法及装置
CN111460205A (zh) * 2020-04-03 2020-07-28 湖州市超视科技有限公司 一种基于边缘计算的化妆品包装说明质检检测系统
CN111461108A (zh) * 2020-02-21 2020-07-28 浙江工业大学 一种医疗单据识别方法
CN111476232A (zh) * 2020-03-11 2020-07-31 华东交通大学 一种洗水唛检测方法、设备和存储介质
CN111626292A (zh) * 2020-05-09 2020-09-04 北京邮电大学 一种基于深度学习技术的楼宇指示标识的文字识别方法
CN111639635A (zh) * 2020-05-26 2020-09-08 广东小天才科技有限公司 一种拍摄图片的处理方法及装置、电子设备、存储介质
CN111898612A (zh) * 2020-06-30 2020-11-06 北京来也网络科技有限公司 结合rpa和ai的ocr识别方法及装置、设备、介质
CN111914838A (zh) * 2020-07-28 2020-11-10 同济大学 一种基于文本行识别的车牌识别方法
CN112016547A (zh) * 2020-08-20 2020-12-01 上海天壤智能科技有限公司 基于深度学习的图像文字识别方法、系统及介质
CN112163559A (zh) * 2020-10-21 2021-01-01 珠海格力电器股份有限公司 一种图纸信息共享方法、设备及手机
CN112307867A (zh) * 2020-03-03 2021-02-02 北京字节跳动网络技术有限公司 用于输出信息的方法和装置
CN112329774A (zh) * 2020-11-10 2021-02-05 杭州微洱网络科技有限公司 基于图像的商品尺码表自动生成方法
CN112396049A (zh) * 2020-11-19 2021-02-23 平安普惠企业管理有限公司 文本纠错方法、装置、计算机设备及存储介质
CN112651417A (zh) * 2019-10-12 2021-04-13 杭州海康威视数字技术股份有限公司 车牌识别方法、装置、设备及存储介质
CN112764599A (zh) * 2019-11-01 2021-05-07 北京搜狗科技发展有限公司 一种数据处理方法、装置和介质
CN112766266A (zh) * 2021-01-29 2021-05-07 云从科技集团股份有限公司 基于分阶段概率统计的文本方向矫正方法、系统及装置
CN113420657A (zh) * 2021-06-23 2021-09-21 平安科技(深圳)有限公司 智能核验方法、装置、计算机设备及存储介质
CN113609365A (zh) * 2021-08-11 2021-11-05 陕西中医药大学 一种中医古籍数据收集整理系统
CN114723664A (zh) * 2022-03-04 2022-07-08 平安普惠企业管理有限公司 衣物分拣方法、装置、计算机可读介质及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103617415A (zh) * 2013-11-19 2014-03-05 北京京东尚科信息技术有限公司 一种自动识别发票的装置和方法
CN109344824A (zh) * 2018-09-21 2019-02-15 泰康保险集团股份有限公司 一种文本行区域检测方法、装置、介质和电子设备
CN109389121A (zh) * 2018-10-30 2019-02-26 金现代信息产业股份有限公司 一种基于深度学习的铭牌识别方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103617415A (zh) * 2013-11-19 2014-03-05 北京京东尚科信息技术有限公司 一种自动识别发票的装置和方法
CN109344824A (zh) * 2018-09-21 2019-02-15 泰康保险集团股份有限公司 一种文本行区域检测方法、装置、介质和电子设备
CN109389121A (zh) * 2018-10-30 2019-02-26 金现代信息产业股份有限公司 一种基于深度学习的铭牌识别方法及系统

Cited By (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110321893A (zh) * 2019-06-27 2019-10-11 电子科技大学 一种聚焦增强的场景文本识别网络
CN110322206A (zh) * 2019-07-26 2019-10-11 苏州创腾软件有限公司 一种基于ocr识别的试剂信息录入方法及装置
CN110569839A (zh) * 2019-08-09 2019-12-13 河海大学常州校区 一种基于ctpn和crnn的银行卡号识别方法
CN110569839B (zh) * 2019-08-09 2023-05-16 河海大学常州校区 一种基于ctpn和crnn的银行卡号识别方法
CN110659633A (zh) * 2019-08-15 2020-01-07 坎德拉(深圳)科技创新有限公司 图像文本信息的识别方法、装置以及存储介质
CN110516676A (zh) * 2019-08-21 2019-11-29 河海大学常州校区 一种基于图像处理的银行卡号识别系统
CN112651417B (zh) * 2019-10-12 2024-06-14 杭州海康威视数字技术股份有限公司 车牌识别方法、装置、设备及存储介质
CN112651417A (zh) * 2019-10-12 2021-04-13 杭州海康威视数字技术股份有限公司 车牌识别方法、装置、设备及存储介质
CN110781885A (zh) * 2019-10-24 2020-02-11 泰康保险集团股份有限公司 基于图像处理的文本检测方法、装置、介质及电子设备
CN112764599B (zh) * 2019-11-01 2023-03-10 北京搜狗科技发展有限公司 一种数据处理方法、装置和介质
CN112764599A (zh) * 2019-11-01 2021-05-07 北京搜狗科技发展有限公司 一种数据处理方法、装置和介质
CN110826562A (zh) * 2019-11-13 2020-02-21 上海赛特斯信息科技股份有限公司 针对服装标签和吊牌实现自动化审核处理的系统及其方法
CN111091124B (zh) * 2019-12-04 2022-06-03 吉林大学 一种书脊文字识别方法
CN111091124A (zh) * 2019-12-04 2020-05-01 吉林大学 一种书脊文字识别方法
CN111209613A (zh) * 2020-01-10 2020-05-29 杭州涂鸦信息技术有限公司 一种智能产品的快速设计方法及系统
CN111209613B (zh) * 2020-01-10 2023-05-12 杭州涂鸦信息技术有限公司 一种智能产品的快速设计方法及系统
CN111325117B (zh) * 2020-02-05 2024-01-26 北京字节跳动网络技术有限公司 目标对象识别模型的训练方法、装置和电子设备
CN111325117A (zh) * 2020-02-05 2020-06-23 北京字节跳动网络技术有限公司 目标对象识别模型的训练方法、装置和电子设备
CN111310757B (zh) * 2020-02-07 2023-08-11 北方工业大学 视频弹幕检测识别方法及装置
CN111310757A (zh) * 2020-02-07 2020-06-19 北方工业大学 视频弹幕检测识别方法及装置
CN111461108A (zh) * 2020-02-21 2020-07-28 浙江工业大学 一种医疗单据识别方法
CN112307867A (zh) * 2020-03-03 2021-02-02 北京字节跳动网络技术有限公司 用于输出信息的方法和装置
CN111476232A (zh) * 2020-03-11 2020-07-31 华东交通大学 一种洗水唛检测方法、设备和存储介质
CN111414908A (zh) * 2020-03-16 2020-07-14 湖南快乐阳光互动娱乐传媒有限公司 一种视频中字幕字符的识别方法及装置
CN111414908B (zh) * 2020-03-16 2023-08-29 湖南快乐阳光互动娱乐传媒有限公司 一种视频中字幕字符的识别方法及装置
CN111460205A (zh) * 2020-04-03 2020-07-28 湖州市超视科技有限公司 一种基于边缘计算的化妆品包装说明质检检测系统
CN111626292A (zh) * 2020-05-09 2020-09-04 北京邮电大学 一种基于深度学习技术的楼宇指示标识的文字识别方法
CN111626292B (zh) * 2020-05-09 2023-06-30 北京邮电大学 一种基于深度学习技术的楼宇指示标识的文字识别方法
CN111639635B (zh) * 2020-05-26 2024-02-27 广东小天才科技有限公司 一种拍摄图片的处理方法及装置、电子设备、存储介质
CN111639635A (zh) * 2020-05-26 2020-09-08 广东小天才科技有限公司 一种拍摄图片的处理方法及装置、电子设备、存储介质
CN111898612A (zh) * 2020-06-30 2020-11-06 北京来也网络科技有限公司 结合rpa和ai的ocr识别方法及装置、设备、介质
CN111914838B (zh) * 2020-07-28 2024-05-31 同济大学 一种基于文本行识别的车牌识别方法
CN111914838A (zh) * 2020-07-28 2020-11-10 同济大学 一种基于文本行识别的车牌识别方法
CN112016547A (zh) * 2020-08-20 2020-12-01 上海天壤智能科技有限公司 基于深度学习的图像文字识别方法、系统及介质
CN112163559A (zh) * 2020-10-21 2021-01-01 珠海格力电器股份有限公司 一种图纸信息共享方法、设备及手机
CN112163559B (zh) * 2020-10-21 2024-06-21 珠海格力电器股份有限公司 一种图纸信息共享方法、设备及手机
CN112329774B (zh) * 2020-11-10 2023-07-28 广州探域科技有限公司 基于图像的商品尺码表自动生成方法
CN112329774A (zh) * 2020-11-10 2021-02-05 杭州微洱网络科技有限公司 基于图像的商品尺码表自动生成方法
CN112396049A (zh) * 2020-11-19 2021-02-23 平安普惠企业管理有限公司 文本纠错方法、装置、计算机设备及存储介质
CN112766266A (zh) * 2021-01-29 2021-05-07 云从科技集团股份有限公司 基于分阶段概率统计的文本方向矫正方法、系统及装置
CN113420657A (zh) * 2021-06-23 2021-09-21 平安科技(深圳)有限公司 智能核验方法、装置、计算机设备及存储介质
CN113609365A (zh) * 2021-08-11 2021-11-05 陕西中医药大学 一种中医古籍数据收集整理系统
CN114723664A (zh) * 2022-03-04 2022-07-08 平安普惠企业管理有限公司 衣物分拣方法、装置、计算机可读介质及电子设备

Similar Documents

Publication Publication Date Title
CN109919147A (zh) 服装吊牌图像中文本识别的方法
Dutta et al. Improving CNN-RNN hybrid networks for handwriting recognition
Fiel et al. Writer identification and retrieval using a convolutional neural network
Breuel et al. High-performance OCR for printed English and Fraktur using LSTM networks
Khorsheed Offline recognition of omnifont Arabic text using the HMM ToolKit (HTK)
Liwicki et al. IAM-OnDB-an on-line English sentence database acquired from handwritten text on a whiteboard
US8311335B2 (en) Model-based comparative measure for vector sequences and word spotting using same
US20100067793A1 (en) Handwritten word spotter using synthesized typed queries
RU2757713C1 (ru) Распознавание рукописного текста посредством нейронных сетей
Elagouni et al. Combining multi-scale character recognition and linguistic knowledge for natural scene text OCR
Liwicki et al. Automatic detection of gender and handedness from on-line handwriting
Fischer Handwriting recognition in historical documents
Das et al. An algorithm for Japanese character recognition
Saba et al. Online versus offline Arabic script classification
Saleem et al. Improvements in BBN's HMM-based offline Arabic handwriting recognition system
Addis et al. Printed ethiopic script recognition by using lstm networks
Singh et al. Handwritten words recognition for legal amounts of bank cheques in English script
US8340428B2 (en) Unsupervised writer style adaptation for handwritten word spotting
Kırlı et al. Automatic writer identification from text line images
Raj et al. Grantha script recognition from ancient palm leaves using histogram of orientation shape context
Pechwitz et al. Comparison of two different feature sets for offline recognition of handwritten arabic words
CN111213157A (zh) 一种基于智能终端的快递信息录入方法及录入系统
Fornés et al. A combination of features for symbol-independent writer identification in old music scores
US9454706B1 (en) Arabic like online alphanumeric character recognition system and method using automatic fuzzy modeling
Pourreza et al. Sub-word based Persian OCR using auto-encoder features and cascade classifier

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination