CN113191348A - 一种基于模板的文本结构化提取方法及工具 - Google Patents

一种基于模板的文本结构化提取方法及工具 Download PDF

Info

Publication number
CN113191348A
CN113191348A CN202110603169.6A CN202110603169A CN113191348A CN 113191348 A CN113191348 A CN 113191348A CN 202110603169 A CN202110603169 A CN 202110603169A CN 113191348 A CN113191348 A CN 113191348A
Authority
CN
China
Prior art keywords
picture
recognized
template
character
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110603169.6A
Other languages
English (en)
Other versions
CN113191348B (zh
Inventor
王本强
王建华
李锐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong New Generation Information Industry Technology Research Institute Co Ltd
Original Assignee
Shandong New Generation Information Industry Technology Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong New Generation Information Industry Technology Research Institute Co Ltd filed Critical Shandong New Generation Information Industry Technology Research Institute Co Ltd
Priority to CN202110603169.6A priority Critical patent/CN113191348B/zh
Publication of CN113191348A publication Critical patent/CN113191348A/zh
Application granted granted Critical
Publication of CN113191348B publication Critical patent/CN113191348B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

本发明公开一种基于模板的文本结构化提取方法,涉及信息提取技术领域,为快速提取文本信息,采用方案包括:制作模板图片;通过字符定位算法定位模板图片中固定信息区域内每个字符的精确位置;获取待识别图片,利用ocr算法对待识别图片进行文字识别,得到多个字符;匹配待识别图片和模板图片,针对两图片中匹配成功的字符串区域,通过字符定位算法抽取匹配成功的字符精确位置,并比对找到相同字符的坐标值,矫正待识别图片,对矫正后的待识别图片再次进行文字识别,得到多个字符;求矫正后字符所在区域与模板图片可变信息区域的交集,选出交集面积最大的区域,并输出该区域的文字信息。本发明还公开一种实现前述方法的文本结构化提取工具。

Description

一种基于模板的文本结构化提取方法及工具
技术领域
本发明涉及信息提取技术领域,具体的说是一种基于模板的文本结构化提取方法及工具。
背景技术
随着行业发展及深度学习技术的落地,文字识别已经在多个行业得到广泛的应用,如金融行业的票据识别,快递物流行业的快速分拣,交通行业的车牌识别、出租车票识别,以及日常生活中的卡证、票据识别等等。OCR(文字识别)已经作为了一种人工智能的能力,节约了大量的人力物力,也提高效率及准确率。
当前,针对不同的业务场景,业务人员收集数据,研发人员对数据进行整理,利用识别相关的技术开发出不同的算法,来满足不同的业务需求。这种处理方法来一个需求就要开发出一种识别算法,费时费力,对公司及相关人员提出了很大的考验。
日常生活中,有很多的文档、票据、卡证,它们都有固定的格式,只是有些区域是不同的,比如身份证,姓名后面具体某个人的名字,性别后面的具体性别,男或女。针对这种有固定格式的文档、票据、卡证,可以设计研发一种,完成想要提取的文字信息。
发明内容
本发明针对目前技术发展的需求和不足之处,提供一种基于模板的文本结构化提取方法及工具。
首先,本发明公开一种基于模板的文本结构化提取方法,解决上述技术问题采用的技术方案如下:
一种基于模板的文本结构化提取方法,其实现过程包括:
步骤S1、基于具有固定格式的样本图片,制作模板图片,并标记模板图片中的固定信息区域和可变信息区域;
步骤S2、通过字符定位算法,定位模板图片中固定信息区域内每个字符的精确位置;
步骤S3、获取待识别图片,调整待识别图片的尺寸,使其与模板图片的大小一致,调整完成后,利用深度学习的ocr算法对待识别图片进行文字识别,得到多个字符;
步骤S4、基于识别字符在待识别图片的位置、以及相邻字符之间的距离,匹配待识别图片和模板图片;
步骤S5、待识别图片和模板图片匹配成功后,针对待识别图片和模板图片中匹配成功的字符串区域,首先通过字符定位算法,定位待识别图片中匹配成功的字符串区域内每个字符的精确位置,随后把待识别图片中定位的字符位置与模板图片中定位的字符位置进行比对,找到相同字符对应的坐标值;
步骤S6、根据相同字符对应的坐标值,基于模板图片矫正待识别图片,对矫正好的待识别图片执行步骤S3,得到多个字符;
步骤S7、求步骤S6识别字符所在可变信息区域与模板图片中可变信息区域的交集,选出交集面积最大的区域作为输出区域,待识别图片的识别结果位于输出区域内;
步骤S8、设定每个字符所属区域的输出规则,对输出区域的字符进行正则化处理后输出。
具体的,执行步骤S2或步骤S5时,通过字符定位算法定位字符精确位置的具体操作流程为:
(1)裁剪模板图片中/待识别图片中的固定信息区域,得到多个文本行;
(2)通过craft的OCR算法,生成文本行所包含字符的热力图;
(3)分割文本行的热力图,得到文本行的前景图像;
(4)通过分割算法,分割文本行的前景图像,得到字符区域所在小框的位置信息;
(5)计算文本行所包含的小框数量和字符数量,在两者相等时,裁剪文本行上的小框,对小框的字符进行灰度及二值化处理,找到字符的边缘外框,将相邻边缘外框合并为一个大框,大框的中心点坐标即为字符在模板图片/待识别图片的中心点位置信息。
具体的,执行步骤S3,利用深度学习的ocr算法对待识别图片进行文字识别,并根据设置的过滤参数过滤掉识别出的小框、太大框、竖框,得到多个字符。
具体的,执行步骤S5,待识别图片和模板图片匹配成功后,求待识别图片和模板图片中匹配成功的字符串区域所构成的最大四边形面积所在的区域,并将该区域作为匹配成功的字符串区域。
优选的,对输出区域的字符进行正则化处理后,以json格式输出。
其次,本发明公开一种基于模板的文本结构化提取工具,解决上述技术问题采用的技术方案如下:
一种基于模板的文本结构化提取工具,其结构包括:
模板制作模块,用于基于具有固定格式的样本图片,制作模板图片,并标记模板图片中的固定信息区域和可变信息区域;
信息抽取模块,用于通过字符定位算法,定位模板图片中/待识别图片中固定信息区域内每个字符的精确位置;
获取调整模块,用于获取待识别图片,调整待识别图片的尺寸,使其与模板图片的大小一致;
文字识别模块,用于利用深度学习的ocr算法对调整完成的待识别图片进行文字识别,得到多个字符;
匹配计算模块,用于利用识别字符在待识别图片的位置、以及相邻字符之间的距离,匹配待识别图片和模板图片,还用于在待识别图片和模板图片匹配成功后,将待识别图片中匹配成功的字符串区域输入信息抽取模块;
精确定位模块,用于将信息抽取模块输出的待识别图片中定位的字符位置与模板图片中定位的字符位置进行比对,找到相同字符对应的坐标值;
矫正再识别模块,用于获取相同字符对应的坐标值,并基于模板图片矫正待识别图片,基于深度学习的ocr算法对矫正后的待识别图片进行文字识别,得到多个字符;
识别区域确定模块,用于求矫正再识别模块输出字符所在可变信息区域与模板图片可变信息区域的交集,选出交集面积最大的区域作为输出区域,待识别图片的识别结果位于输出区域内;
正则处理模块,用于设定每个字符所属区域的输出规则,对输出区域的字符进行正则化处理;
结构化输出模块,用于对正则化处理后的字符进行规范化整理并输出。
具体的,所涉及信息抽取模块通过字符定位算法定位模板图片中/待识别图片中固定信息区域内每个字符的精确位置,具体流程为:
裁剪模板图片中/待识别图片中的固定信息区域,得到多个文本行;
通过craft的OCR算法,生成文本行所包含字符的热力图;
分割文本行的热力图,得到文本行的前景图像;
通过分割算法,分割文本行的前景图像,得到字符区域所在小框的位置信息;
计算文本行所包含的小框数量和字符数量,在两者相等时,裁剪文本行上的小框,对小框的字符进行灰度及二值化处理,找到字符的边缘外框,将相邻边缘外框合并为一个大框,大框的中心点坐标即为字符在模板图片/待识别图片的中心点位置信息。
具体的,所涉及文字识别模块利用深度学习的ocr算法对待识别图片进行文字识别时,根据设置的过滤参数过滤掉识别出的小框、太大框、竖框后,得到多个字符。
具体的,所涉及匹配计算模块在待识别图片和模板图片匹配成功后,首先求待识别图片和模板图片中匹配成功的字符串区域所构成的最大四边形面积所在的区域,并将该区域作为匹配成功的字符串区域,随后将待识别图片中匹配成功的字符串区域输入信息抽取模块。
具体的,所涉及结构化输出模块对正则化处理后的字符进行规范化整理后以json格式输出。
本发明的一种基于模板的文本结构化提取方法及工具,与现有技术相比具有的有益效果是:
(1)本发明通过制作模板、以模板的固定信息与待识别图片的固定信息进行比对定位,确定待识别区域,进而识别并提取待识别区域的文字信息,具有简单快速提取文本信息的优点;
(2)本发明可以适用于具有固定格式的文件,不限于票据文件和卡证文件。
附图说明
附图1是本发明实施例一的方法流程图;
附图2是本发明实施例二的模块连接框图;
附图3是本发明抽取模板图片中字符精确位置的流程图。
附图中各标号信息表示:
1、模板制作模块,2、信息抽取模块,3、获取调整模块,
4、文字识别模块,5、匹配计算模块,6、精确定位模块,
7、矫正再识别模块,8、识别区域确定模块,9、正则处理模块,
10、结构化输出模块。
具体实施方式
为使本发明的技术方案、解决的技术问题和技术效果更加清楚明白,以下结合具体实施例,对本发明的技术方案进行清楚、完整的描述。
实施例一:
结合附图1、3,本实施例提出一种基于模板的文本结构化提取方法,其实现过程包括:
步骤S1、基于具有固定格式的样本图片,制作模板图片,并标记模板图片中的固定信息区域和可变信息区域。
步骤S2、通过字符定位算法,定位模板图片中固定信息区域内每个字符的精确位置,具体操作流程为:
步骤S2.1、裁剪模板图片中的固定信息区域,得到多个文本行;
步骤S2.2、通过craft的OCR算法,生成文本行所包含字符的热力图;
步骤S2.3、分割文本行的热力图,得到文本行的前景图像;
步骤S2.4、通过分割算法,分割文本行的前景图像,得到字符区域所在小框的位置信息;
步骤S2.5、计算文本行所包含的小框数量和字符数量,在两者相等时,裁剪文本行上的小框,对小框的字符进行灰度及二值化处理,找到字符的边缘外框,将相邻边缘外框合并为一个大框,大框的中心点坐标即为字符在模板图片/待识别图片的中心点位置信息。
步骤S3、获取待识别图片,调整待识别图片的尺寸,使其与模板图片的大小一致,调整完成后,利用深度学习的ocr算法对待识别图片进行文字识别,得到多个字符。
执行本步骤时,应当首先过滤掉尺寸与模板图片尺寸相差较大的待识别图片,并设置过滤参数,以过滤掉识别出的小框、太大框、竖框,得到多个字符。
步骤S4、基于识别字符在待识别图片的位置、以及相邻字符之间的距离,匹配待识别图片和模板图片。
步骤S5、待识别图片和模板图片匹配成功后,求待识别图片和模板图片中匹配成功的字符串区域所构成的最大四边形面积所在的区域,并将该区域作为匹配成功的字符串区域,针对匹配成功的字符串区域,其应当从属于固定信息区域,
步骤S5.1、首先通过字符定位算法,抽取待识别图片中固定信息区域内每个字符的精确位置,具体操作流程为:
步骤S5.1.1、裁剪待识别图片中的固定信息区域,得到多个文本行;
步骤S5.1.2、通过craft的OCR算法,生成文本行所包含字符的热力图;
步骤S5.1.3、分割文本行的热力图,得到文本行的前景图像;
步骤S5.1.4、通过分割算法,分割文本行的前景图像,得到字符区域所在小框的位置信息;
步骤S5.1.5、计算文本行所包含的小框数量和字符数量,在两者相等时,裁剪文本行上的小框,对小框的字符进行灰度及二值化处理,找到字符的边缘外框,将相邻边缘外框合并为一个大框,大框的中心点坐标即为字符在模板图片/待识别图片的中心点位置信息。
步骤S5.2、随后把待识别图片中定位的字符位置与模板图片中定位的字符位置进行比对,找到相同字符对应的坐标值。
步骤S6、根据相同字符对应的坐标值,基于模板图片矫正待识别图片,对矫正好的待识别图片执行步骤S3,得到多个字符。
步骤S7、求步骤S6识别字符所在可变信息区域与模板图片中可变信息区域的交集,选出交集面积最大的区域作为输出区域,待识别图片的识别结果位于输出区域内。
步骤S8、设定每个字符所属区域的输出规则,对输出区域的字符进行正则化处理,最后以json格式输出。
实施例二:
结合附图2、3,本实施例提出一种基于模板的文本结构化提取工具,其结构包括模板制作模块1、信息抽取模块2、获取调整模块3、文字识别模块4、匹配计算模块5、精确定位模块6、矫正再识别模块7、识别区域确定模块8、正则处理模块9、结构化输出模块10。
模板制作模块1基于具有固定格式的样本图片,制作模板图片,并标记模板图片中的固定信息区域和可变信息区域。
信息抽取模块2通过字符定位算法,定位模板图片中/待识别图片中固定信息区域内每个字符的精确位置,具体执行流程包括:
(1)裁剪模板图片中/待识别图片中的固定信息区域,得到多个文本行;
(2)通过craft的OCR算法,生成文本行所包含字符的热力图;
(3)分割文本行的热力图,得到文本行的前景图像;
(4)通过分割算法,分割文本行的前景图像,得到字符区域所在小框的位置信息;
(5)计算文本行所包含的小框数量和字符数量,在两者相等时,裁剪文本行上的小框,对小框的字符进行灰度及二值化处理,找到字符的边缘外框,将相邻边缘外框合并为一个大框,大框的中心点坐标即为字符在模板图片/待识别图片的中心点位置信息。
获取调整模块3获取待识别图片,调整待识别图片的尺寸,使其与模板图片的大小一致。
文字识别模块4利用深度学习的ocr算法对调整完成的待识别图片进行文字识别,根据设置的过滤参数过滤掉识别出的小框、太大框、竖框后,得到多个字符。
匹配计算模块5一方面利用识别字符在待识别图片的位置、以及相邻字符之间的距离,匹配待识别图片和模板图片,另一方面在待识别图片和模板图片匹配成功后,首先求待识别图片和模板图片中匹配成功的字符串区域所构成的最大四边形面积所在的区域,并将该区域作为匹配成功的字符串区域,随后将待识别图片中匹配成功的字符串区域,即固定信息区域,输入信息抽取模块2。
精确定位模块6,用于将信息抽取模块2输出的待识别图片中定位的字符位置与模板图片中定位的字符位置进行比对,找到相同字符对应的坐标值。
矫正再识别模块7,用于获取相同字符对应的坐标值,并基于模板图片矫正待识别图片,基于深度学习的ocr算法对矫正后的待识别图片进行文字识别,得到多个字符。
识别区域确定模块8,用于求矫正再识别模块7输出字符所在可变信息区域与模板图片可变信息区域的交集,选出交集面积最大的区域作为输出区域,待识别图片的识别结果位于输出区域内。
正则处理模块9,用于设定每个字符所属区域的输出规则,对输出区域的字符进行正则化处理。
结构化输出模块10对正则化处理后的字符进行规范化整理后以json格式输出。
综上可知,采用本发明的一种基于模板的文本结构化提取方法及工具,可以快速识别并提取待识别区域的文字信息,尤其适用于具有固定格式为文件。
以上应用具体个例对本发明的原理及实施方式进行了详细阐述,这些实施例只是用于帮助理解本发明的核心技术内容。基于本发明的上述具体实施例,本技术领域的技术人员在不脱离本发明原理的前提下,对本发明所作出的任何改进和修饰,皆应落入本发明的专利保护范围。

Claims (10)

1.一种基于模板的文本结构化提取方法,其特征在于,其实现过程包括:
步骤S1、基于具有固定格式的样本图片,制作模板图片,并标记模板图片中的固定信息区域和可变信息区域;
步骤S2、通过字符定位算法,定位模板图片中固定信息区域内每个字符的精确位置;
步骤S3、获取待识别图片,调整待识别图片的尺寸,使其与模板图片的大小一致,调整完成后,利用深度学习的ocr算法对待识别图片进行文字识别,得到多个字符;
步骤S4、基于识别字符在待识别图片的位置、以及相邻字符之间的距离,匹配待识别图片和模板图片;
步骤S5、待识别图片和模板图片匹配成功后,针对待识别图片和模板图片中匹配成功的字符串区域,首先通过字符定位算法,定位待识别图片中匹配成功的字符串区域内每个字符的精确位置,随后把待识别图片中定位的字符位置与模板图片中定位的字符位置进行比对,找到相同字符对应的坐标值;
步骤S6、根据相同字符对应的坐标值,基于模板图片矫正待识别图片,对矫正好的待识别图片执行步骤S3,得到多个字符;
步骤S7、求步骤S6识别字符所在可变信息区域与模板图片中可变信息区域的交集,选出交集面积最大的区域作为输出区域,待识别图片的识别结果位于输出区域内;
步骤S8、设定每个字符所属区域的输出规则,对输出区域的字符进行正则化处理后输出。
2.根据权利要求1所述的一种基于模板的文本结构化提取方法,其特征在于,执行步骤S2或步骤S5时,通过字符定位算法定位字符精确位置的具体操作流程为:
(1)裁剪模板图片中/待识别图片中的固定信息区域,得到多个文本行;
(2)通过craft的OCR算法,生成文本行所包含字符的热力图;
(3)分割文本行的热力图,得到文本行的前景图像;
(4)通过分割算法,分割文本行的前景图像,得到字符区域所在小框的位置信息;
(5)计算文本行所包含的小框数量和字符数量,在两者相等时,裁剪文本行上的小框,对小框的字符进行灰度及二值化处理,找到字符的边缘外框,将相邻边缘外框合并为一个大框,大框的中心点坐标即为字符在模板图片/待识别图片的中心点位置信息。
3.根据权利要求1所述的一种基于模板的文本结构化提取方法,其特征在于,执行步骤S3,利用深度学习的ocr算法对待识别图片进行文字识别,并根据设置的过滤参数过滤掉识别出的小框、太大框、竖框,得到多个字符。
4.根据权利要求1所述的一种基于模板的文本结构化提取方法,其特征在于,执行步骤S5,待识别图片和模板图片匹配成功后,求待识别图片和模板图片中匹配成功的字符串区域所构成的最大四边形面积所在的区域,并将该区域作为匹配成功的字符串区域。
5.根据权利要求1所述的一种基于模板的文本结构化提取方法,其特征在于,对输出区域的字符进行正则化处理后,以json格式输出。
6.一种基于模板的文本结构化提取工具,其特征在于,其结构包括:
模板制作模块,用于基于具有固定格式的样本图片,制作模板图片,并标记模板图片中的固定信息区域和可变信息区域;
信息抽取模块,用于通过字符定位算法,定位模板图片中/待识别图片中固定信息区域内每个字符的精确位置;
获取调整模块,用于获取待识别图片,调整待识别图片的尺寸,使其与模板图片的大小一致;
文字识别模块,用于利用深度学习的ocr算法对调整完成的待识别图片进行文字识别,得到多个字符;
匹配计算模块,用于利用识别字符在待识别图片的位置、以及相邻字符之间的距离,匹配待识别图片和模板图片,还用于在待识别图片和模板图片匹配成功后,将待识别图片中匹配成功的字符串区域输入信息抽取模块;
精确定位模块,用于将信息抽取模块输出的待识别图片中定位的字符位置与模板图片中定位的字符位置进行比对,找到相同字符对应的坐标值;
矫正再识别模块,用于获取相同字符对应的坐标值,并基于模板图片矫正待识别图片,基于深度学习的ocr算法对矫正后的待识别图片进行文字识别,得到多个字符;
识别区域确定模块,用于求矫正再识别模块输出字符所在可变信息区域与模板图片可变信息区域的交集,选出交集面积最大的区域作为输出区域,待识别图片的识别结果位于输出区域内;
正则处理模块,用于设定每个字符所属区域的输出规则,对输出区域的字符进行正则化处理;
结构化输出模块,用于对正则化处理后的字符进行规范化整理并输出。
7.根据权利要求6所述的一种基于模板的文本结构化提取工具,其特征在于,所述信息抽取模块通过字符定位算法定位模板图片中/待识别图片中固定信息区域内每个字符的精确位置,具体流程为:
裁剪模板图片中/待识别图片中的固定信息区域,得到多个文本行;
通过craft的OCR算法,生成文本行所包含字符的热力图;
分割文本行的热力图,得到文本行的前景图像;
通过分割算法,分割文本行的前景图像,得到字符区域所在小框的位置信息;
计算文本行所包含的小框数量和字符数量,在两者相等时,裁剪文本行上的小框,对小框的字符进行灰度及二值化处理,找到字符的边缘外框,将相邻边缘外框合并为一个大框,大框的中心点坐标即为字符在模板图片/待识别图片的中心点位置信息。
8.根据权利要求6所述的一种基于模板的文本结构化提取工具,其特征在于,所述文字识别模块利用深度学习的ocr算法对待识别图片进行文字识别时,根据设置的过滤参数过滤掉识别出的小框、太大框、竖框后,得到多个字符。
9.根据权利要求6所述的一种基于模板的文本结构化提取工具,其特征在于,所述匹配计算模块在待识别图片和模板图片匹配成功后,首先求待识别图片和模板图片中匹配成功的字符串区域所构成的最大四边形面积所在的区域,并将该区域作为匹配成功的字符串区域,随后将待识别图片中匹配成功的字符串区域输入信息抽取模块。
10.根据权利要求6所述的一种基于模板的文本结构化提取工具,其特征在于,所述结构化输出模块对正则化处理后的字符进行规范化整理后以json格式输出。
CN202110603169.6A 2021-05-31 2021-05-31 一种基于模板的文本结构化提取方法及工具 Active CN113191348B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110603169.6A CN113191348B (zh) 2021-05-31 2021-05-31 一种基于模板的文本结构化提取方法及工具

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110603169.6A CN113191348B (zh) 2021-05-31 2021-05-31 一种基于模板的文本结构化提取方法及工具

Publications (2)

Publication Number Publication Date
CN113191348A true CN113191348A (zh) 2021-07-30
CN113191348B CN113191348B (zh) 2023-02-03

Family

ID=76985910

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110603169.6A Active CN113191348B (zh) 2021-05-31 2021-05-31 一种基于模板的文本结构化提取方法及工具

Country Status (1)

Country Link
CN (1) CN113191348B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114120016A (zh) * 2022-01-26 2022-03-01 北京阿丘科技有限公司 字符串提取方法、装置、设备及存储介质
CN115497114A (zh) * 2022-11-18 2022-12-20 中国烟草总公司四川省公司 一种卷烟物流收货票据的结构化信息提取方法

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104112128A (zh) * 2014-06-19 2014-10-22 中国工商银行股份有限公司 应用于票据影像字符识别的数字图像处理系统及方法
CN105260733A (zh) * 2015-09-11 2016-01-20 北京百度网讯科技有限公司 用于处理图像信息的方法和装置
CN105512657A (zh) * 2015-08-20 2016-04-20 北京旷视科技有限公司 字符识别方法和设备
CN106845487A (zh) * 2016-12-30 2017-06-13 佳都新太科技股份有限公司 一种端到端的车牌识别方法
CN108230252A (zh) * 2017-01-24 2018-06-29 深圳市商汤科技有限公司 图像处理方法、装置以及电子设备
CN108596066A (zh) * 2018-04-13 2018-09-28 武汉大学 一种基于卷积神经网络的字符识别方法
CN109086756A (zh) * 2018-06-15 2018-12-25 众安信息技术服务有限公司 一种基于深度神经网络的文本检测分析方法、装置及设备
CN109284756A (zh) * 2018-08-01 2019-01-29 河海大学 一种基于ocr技术的计算机终端保密检查方法
CN110059705A (zh) * 2019-04-22 2019-07-26 厦门商集网络科技有限责任公司 一种基于建模的ocr识别结果判决方法和设备
CN110097048A (zh) * 2019-04-02 2019-08-06 江苏理工学院 一种sot芯片图像快速校正与字符识别方法
CN110503094A (zh) * 2019-08-14 2019-11-26 中国电子科技集团公司第二十八研究所 职业证件照姓名牌识别方法、装置
CN110569832A (zh) * 2018-11-14 2019-12-13 安徽艾睿思智能科技有限公司 基于深度学习注意力机制的文本实时定位识别方法
CN111275697A (zh) * 2020-02-10 2020-06-12 西安交通大学 一种基于orb特征匹配和lk光流法的电池丝印质量检测方法
CN111583097A (zh) * 2019-02-18 2020-08-25 北京三星通信技术研究有限公司 图像处理方法、装置、电子设备及计算机可读存储介质
CN111598083A (zh) * 2020-05-08 2020-08-28 南通大学 一种瓶底合模线上喷印喷码质量检测方法
WO2020173008A1 (zh) * 2019-02-27 2020-09-03 平安科技(深圳)有限公司 一种文本识别方法及装置
WO2020232866A1 (zh) * 2019-05-20 2020-11-26 平安科技(深圳)有限公司 扫描文本分段方法、装置、计算机设备和存储介质
CN112598001A (zh) * 2021-03-08 2021-04-02 中航金城无人系统有限公司 一种基于多模型融合的船舶水尺读数自动识别方法

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104112128A (zh) * 2014-06-19 2014-10-22 中国工商银行股份有限公司 应用于票据影像字符识别的数字图像处理系统及方法
CN105512657A (zh) * 2015-08-20 2016-04-20 北京旷视科技有限公司 字符识别方法和设备
CN105260733A (zh) * 2015-09-11 2016-01-20 北京百度网讯科技有限公司 用于处理图像信息的方法和装置
CN106845487A (zh) * 2016-12-30 2017-06-13 佳都新太科技股份有限公司 一种端到端的车牌识别方法
CN108230252A (zh) * 2017-01-24 2018-06-29 深圳市商汤科技有限公司 图像处理方法、装置以及电子设备
CN108596066A (zh) * 2018-04-13 2018-09-28 武汉大学 一种基于卷积神经网络的字符识别方法
CN109086756A (zh) * 2018-06-15 2018-12-25 众安信息技术服务有限公司 一种基于深度神经网络的文本检测分析方法、装置及设备
CN109284756A (zh) * 2018-08-01 2019-01-29 河海大学 一种基于ocr技术的计算机终端保密检查方法
CN110569832A (zh) * 2018-11-14 2019-12-13 安徽艾睿思智能科技有限公司 基于深度学习注意力机制的文本实时定位识别方法
CN111583097A (zh) * 2019-02-18 2020-08-25 北京三星通信技术研究有限公司 图像处理方法、装置、电子设备及计算机可读存储介质
WO2020173008A1 (zh) * 2019-02-27 2020-09-03 平安科技(深圳)有限公司 一种文本识别方法及装置
CN110097048A (zh) * 2019-04-02 2019-08-06 江苏理工学院 一种sot芯片图像快速校正与字符识别方法
CN110059705A (zh) * 2019-04-22 2019-07-26 厦门商集网络科技有限责任公司 一种基于建模的ocr识别结果判决方法和设备
WO2020232866A1 (zh) * 2019-05-20 2020-11-26 平安科技(深圳)有限公司 扫描文本分段方法、装置、计算机设备和存储介质
CN110503094A (zh) * 2019-08-14 2019-11-26 中国电子科技集团公司第二十八研究所 职业证件照姓名牌识别方法、装置
CN111275697A (zh) * 2020-02-10 2020-06-12 西安交通大学 一种基于orb特征匹配和lk光流法的电池丝印质量检测方法
CN111598083A (zh) * 2020-05-08 2020-08-28 南通大学 一种瓶底合模线上喷印喷码质量检测方法
CN112598001A (zh) * 2021-03-08 2021-04-02 中航金城无人系统有限公司 一种基于多模型融合的船舶水尺读数自动识别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
李奇超等: "设备铭牌字符识别系统的开发与实现", 《宁夏电力》 *
杨芹: "票据影像交换中支票号码自动识别的实现", 《华南金融电脑》 *
董保磊等: "基于双目视觉的无人机悬停精度测量研究", 《计算机工程与应用》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114120016A (zh) * 2022-01-26 2022-03-01 北京阿丘科技有限公司 字符串提取方法、装置、设备及存储介质
CN115497114A (zh) * 2022-11-18 2022-12-20 中国烟草总公司四川省公司 一种卷烟物流收货票据的结构化信息提取方法
CN115497114B (zh) * 2022-11-18 2024-03-12 中国烟草总公司四川省公司 一种卷烟物流收货票据的结构化信息提取方法

Also Published As

Publication number Publication date
CN113191348B (zh) 2023-02-03

Similar Documents

Publication Publication Date Title
CN109376658B (zh) 一种基于深度学习的ocr方法
CN110298338B (zh) 一种文档图像分类方法及装置
CN109241894B (zh) 一种基于表格定位和深度学习的票据内容识别系统和方法
CN110766014A (zh) 票据信息定位方法、系统及计算机可读存储介质
CN109658584B (zh) 一种票据信息识别方法及装置
US8494273B2 (en) Adaptive optical character recognition on a document with distorted characters
CN104408449B (zh) 智能移动终端场景文字处理方法
CN113191348B (zh) 一种基于模板的文本结构化提取方法及工具
CN105512657B (zh) 字符识别方法和设备
CN113569863B (zh) 一种单据稽查的方法、系统、电子设备及存储介质
CN110781877B (zh) 一种图像识别方法、设备及存储介质
CN116071763B (zh) 基于文字识别的教辅图书智能校编系统
CN107195069A (zh) 一种人民币冠字号自动识别方法
CN112507782A (zh) 文本图像的识别方法及装置
CN112528954A (zh) 一种证件图像文字提取方法
CN113901952A (zh) 一种基于深度学习的印刷体与手写体分开文字识别方法
Yindumathi et al. Analysis of image classification for text extraction from bills and invoices
CN111340032A (zh) 一种基于金融领域应用场景的字符识别方法
CN114092938B (zh) 图像的识别处理方法、装置、电子设备及存储介质
CN111461133A (zh) 快递面单品名识别方法、装置、设备及存储介质
CN109635729B (zh) 一种表格识别方法及终端
CN112508000B (zh) 一种用于ocr图像识别模型训练数据生成的方法及设备
CN111914706B (zh) 一种文字检测输出结果质量检测和控制的方法与装置
CN111881880A (zh) 一种基于新型网络的票据文本识别方法
CN115393861B (zh) 一种手写体文本精准分割方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant