CN115588206A - 一种基于数据管理的自动模板文字识别实现系统及方法 - Google Patents
一种基于数据管理的自动模板文字识别实现系统及方法 Download PDFInfo
- Publication number
- CN115588206A CN115588206A CN202211199781.2A CN202211199781A CN115588206A CN 115588206 A CN115588206 A CN 115588206A CN 202211199781 A CN202211199781 A CN 202211199781A CN 115588206 A CN115588206 A CN 115588206A
- Authority
- CN
- China
- Prior art keywords
- template
- information
- module
- character recognition
- data management
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/186—Templates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Character Discrimination (AREA)
Abstract
本发明公开了一种基于数据管理的自动模板文字识别实现系统及方法,属于OCR领域;所述的系统具体包括模板定制模块、任务管理模块、模板数据管理模块、文字识别模块和文本解析模块:所述模板定制模块添加新OCR场景的模板信息,无代码定制场景模板,并将其保存发布;所述任务管理模块接收外部请求的参数与数据;所述模板数据管理模块用于管理模板信息,对模板信息进行编辑处理和业务调配;所述文字识别模块用于管理文字识别引擎,返回初始识别结果;本发明系统通过模板定制、任务管理、模板数据管理、文字识别、文本解析五个模块组成,技术架构清晰,协作开发更方便,任务执行更高效。
Description
技术领域
本发明公开一种基于数据管理的自动模板文字识别实现系统及方法,涉及OCR技术领域。
背景技术
文字识别,亦称光学字符识别(Optical Character Recognition,OCR),是指对文本资料的图像文件进行分析识别处理,获取文字及版面信息的过程,并以文本的形式返回。具体来说,典型的OCR技术路线分为6大步骤,分别是输入、图像预处理、文本方向矫正、文本区域检测、文本识别、输出,每一个环节都需要算法的密切配合,最终达到理想的识别效果,通常情况下的识别准确率可达到96%以上。由于其方便、快捷、准确的优点,广泛用于各类文字采集相关的场景,如交通场景、票据场景、生活场景、教育场景等。
在OCR的应用场景中,OCR技术往往是实现一项业务最重要的一环。尤其地,在面对复杂的文本信息,识别的文字信息需要进一步分析,OCR识别模式将影响最终的信息提取结果。例如,在数字政府建设中,大量的卡、证、照等需要利用OCR技术进行信息提取,这些材料具有版式多样、信息关键字各不相同,甚至同一卡、证、照也会因版次、地区等差异,导致OCR服务通用性较差,不便推广,最终给服务提供商带来了巨大压力,难以落地实施。
随着技术发展,各大技术服务商和研究机构也提出了可定制化的模板来快速实现OCR功能,以求适用种类繁多的场景应用,解决了部分适用问题。然而,一些特定场景提出了技术服务需要具有易部署、适用性强、快速适配更多场景、便于管理等要求,大量技术方案无法满足实际需求。
故现发明一种基于数据管理的自动模板文字识别实现系统及方法,以解决上述问题。
发明内容
本发明针对现有技术的问题,提供一种基于数据管理的自动模板文字识别实现系统及方法,所采用的技术方案为:一种基于数据管理的自动模板文字识别实现系统,所述的系统具体包括模板定制模块、任务管理模块、模板数据管理模块、文字识别模块和文本解析模块:
所述模板定制模块添加新OCR场景的模板信息,无代码定制场景模板,并将其保存发布;
所述任务管理模块接收外部请求的参数与数据;
所述模板数据管理模块用于管理模板信息,对模板信息进行编辑处理和业务调配;
所述文字识别模块用于管理文字识别引擎,返回初始识别结果
所述模板定制模块具体包括信息采集模块、信息处理模块和信息提交模块:
信息采集模块:读入图片,标定并填写信息,保存;
信息处理模块:是输入修正信息,保存;
信息提交模块:将全部信息提交数据管理模块。
所述任务管理模块根据请求参数查询模板数据管理模块种的各类模板信息,将模板信息发送给文字识别模块和文本解析模块,最后将识别结果信息打包返回到请求端;
所述文本解析模块采用多个智能算法,实现模板自动生成、定制返回关键字、个性文本筛查、生僻字纠错、文本偏移纠正功能,最终返回特定格式的有用信息。
一种基于数据管理的自动模板文字识别实现方法,所述的方法具体步骤如下:
S1添加新OCR场景的模板信息,无代码定制场景模板,并将其保存发布;
S2接收外部请求的参数与数据;
S3管理模板信息,对模板信息进行编辑处理和业务调配;
S4用于管理文字识别引擎,返回初始识别结果
所述S1具体步骤如下:
S11读入图片,标定并填写信息,保存;
S12是输入修正信息,保存;
S13将全部信息提交数据管理模块。
所述S2根据请求参数查询模板数据管理模块种的各类模板信息,将模板信息分别进行文字识别和文本解析,最后将识别结果信息打包返回到请求端;
所述S2中的文本解析采用多个智能算法,实现模板自动生成、定制返回关键字、个性文本筛查、生僻字纠错、文本偏移纠正功能,最终返回特定格式的有用信息。
本发明的有益效果为:本发明系统通过模板定制、任务管理、模板数据管理、文字识别、文本解析五个模块组成,技术架构清晰,协作开发更方便,任务执行更高效;
模板定制模块用于添加新OCR场景的模板信息,无代码定制新场景模板,具有快速、高效、可视化操作等优点,用户体验更佳;
任务管理模块控制整个业务流程,便于系统的资源调配、优化升级等;
模板数据管理模块用于管理模板信息,同时提供对模板信息的增、删、改、查和业务调配,以此来满足各类业务需求;
文字识别模块用于管理文字识别引擎,便于开发测试、场景适配,为业务寻求较优的技术方案;
文本解析模块采用多个智能算法,实现模板自动生成、定制返回关键字、个性文本筛查、生僻字纠错、文本偏移纠正等功能,可实现更个性化、更准确的信息输出。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明系统实施例的自动模板文字识别方案流程图;图2是本发明系统实施例的新建模板信息流程图;图3是本发明系统实施例的模板标定区域示例示意图;图4是本发明系统实施例的实施系统图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步说明,以使本领域的技术人员可以更好地理解本发明并能予以实施,但所举实施例不作为对本发明的限定。
实施例一:
一种基于数据管理的自动模板文字识别实现系统,所述的系统具体包括模板定制模块、任务管理模块、模板数据管理模块、文字识别模块和文本解析模块:
所述模板定制模块添加新OCR场景的模板信息,无代码定制场景模板,并将其保存发布;
所述任务管理模块接收外部请求的参数与数据;
所述模板数据管理模块用于管理模板信息,对模板信息进行编辑处理和业务调配;
所述文字识别模块用于管理文字识别引擎,返回初始识别结果;
模板定制模块用于添加新OCR场景的模板信息,通过前端界面上传定制模板的图片,依次在图片上框定版式区域,填写需要定制化返回的关键字、卡证照类型、需剔除的关键字或者字符、需替换的文本等信息,保存并发布模板,模板信息便被提交至模板数据管理模块,最终完成一个新场景的定制;任务管理模块负责接收外部请求的参数与数据,根据请求参数查询模板数据管理模块种的各类模板信息,将模板信息发送给文字识别模块和文本解析模块,最后将识别结果信息打包返回到请求端;模板数据管理模块用于管理模板信息,同时提供对模板信息的增删改查和业务调配;文字识别模块用于管理文字识别引擎,返回初始识别结果;文本解析模块采用多个智能算法,实现模板自动生成、定制返回关键字、个性文本筛查、生僻字纠错、文本偏移纠正等功能,最终返回特定格式的有用信息;
进一步的,所述模板定制模块具体包括信息采集模块、信息处理模块和信息提交模块:
信息采集模块:读入图片,标定并填写信息,保存;
信息处理模块:是输入修正信息,保存;
信息提交模块:将全部信息提交数据管理模块;
进一步的,所述任务管理模块根据请求参数查询模板数据管理模块种的各类模板信息,将模板信息发送给文字识别模块和文本解析模块,最后将识别结果信息打包返回到请求端;
再进一步的,所述文本解析模块采用多个智能算法,实现模板自动生成、定制返回关键字、个性文本筛查、生僻字纠错、文本偏移纠正功能,最终返回特定格式的有用信息;
如图1所示,初始阶段,在没有模板信息的情况下,需要使用模板定制模块标定模板信息,并最终提交到模板数据管理模块;若已经保存模板数据,则不需要重新标定;当接收外部请求时,任务管理模块获取图片和模板ID,然后通过模板数据管理模块查询该模板的信息;接着,文字识别模块识别出文字,并结合这些信息修饰文本,纠错有问题文本;同样地,文本解析模块结合模板信息,将文本信息按照自定义的格式提取出每一事项的信息,并返回给任务管理模块,最终由任务管理模块返回给外部请求;
如图2所示,新建一个模板需要两步来完成:一是读入图片,标定并填写信息,保存;二是输入修正信息,保存;最后,将全部信息提交DB(Data Base,数据库)或者数据管理模块;
如图3所示,其中“------”为框定区域,“xxxx”为文本信息举例,如图所示,示例中按照标定标准标定了6块区域;
如图4所示,将数据库、人工智能计算和任务管理等三个模块存放到服务器上;具体地,数据库用于存放模板信息;人工智能计算模块可以处理模板自动生成、文字识别以及相关的智能算法,其是该系统的计算核心;任务管理模块用来接收外部的服务请求、读取数据库的模板信息、调用人工智能计算模块,并最终返回请求,其是该系统的控制核心。
实施例二:
在实施例一的基础上,创建模板原则:
如果初次使用本系统,需要根据需求创建模板信息;否则,无需创建模板;最主要的需求往往是自定义请求返回的关键字,其通常为英文,以满足跨平台使用;一般地,为了提高标定模板的质量,应遵循以下几个原则:
(1)根据业务需求分别填写“显式的关键字字对”/“非显式的关键字字对”下的“返回的关键字”和“识别的关键字”,前者一般采用英文+“_”的格式(可自定义),后者必须严格按照卡证照上的实际信息填写,点击“添加”按钮按需添加,点击“-”号删除该条记录;
(2)特别地,“识别的关键字”中,易错字可用“.”替代,开头字符可用“^”标识,同一“返回的关键字”对应多个“识别的关键字”时,可用“|”隔开;
(3)特别地,“显式的关键字字对”用于提取类似“关键字:信息”的文本信息,没有此类文本信息提取需求时,可不填(为空);;
(4)特别地,“非显式的关键字字对”用于提取类似“xxxx关键字xxxx”的文本信息,没有此类文本信息提取需求时,可不填(为空);
(5)根据卡证照版式选择“竖版”或者“横版”,默认为竖版,注意修改;
(6)根据需求填写“证件类型”,同一类型的卡证照可以存在多条记录,以满足测试、部署、演示等需求,不建议为空;
(7)根据需要填写“删除的关键字”。
实施例三:
在实施例一的基础上,创建身份证的自动模板:
模板定制模块用于添加新OCR场景的模板信息,通过前端界面上传身份证的模板图片,依次在图片上框定标定区域,填写证件类型、显式的关键字字对、非显式的关键字字对、待剔除文本、替换文本等信息,保存并发布模板,模板信息便被提交至模板数据管理模块,最终完成一个新场景的创建;
根据以上原则,营业执照的标定信息如下:
证件类型:身份证
标定区域:{"horizontal":[{"x1":51,"x2":400,"y1":41,"y2":550}],"vertical":[{"x1":27,"x2":453,"y1":19,"y2":273}]}
显式的关键字字对:[{"key":"name","value":"姓名"},{"key":"gender","value":"性别|性"},{"key":"ethnicity","value":"民族"},{"key":"birth","value":"出生"},{"key":"residential_address","value":"住址"},{"key":"citizen_id_number","value":"公民身.号码"},{"key":"authority","value":"签发机关"},{"key":"valid_period","value":"有效期限"}]
非显式(隐式)的关键字字对:(暂无,根据实际效果补充即可;)
待剔除文本:中华人民共和国|居民身份证
替换文本:(暂无,根据实际效果补充即可;)
实施例四:
在实施例三的基础上,利用创建的身份证模板信息实现文字识别:
任务管理模块负责接收外部请求的参数与数据,此处传入一张测试的身份证图片,根据请求参数查询到身份证的模板信息,将模板信息发送给文字识别模块和文本解析模块,最后将识别结果信息打包返回到请求端,最终返回特定格式的有用信息,如该身份证最终返回信息如下:
实施例五:
一种基于数据管理的自动模板文字识别实现方法,所述的方法具体步骤如下:
S1添加新OCR场景的模板信息,无代码定制场景模板,并将其保存发布;
S2接收外部请求的参数与数据;
S3管理模板信息,对模板信息进行编辑处理和业务调配;
S4用于管理文字识别引擎,返回初始识别结果
进一步的,所述S1具体步骤如下:
S11读入图片,标定并填写信息,保存;
S12是输入修正信息,保存;
S13将全部信息提交数据管理模块;
进一步的,所述S2根据请求参数查询模板数据管理模块种的各类模板信息,将模板信息分别进行文字识别和文本解析,最后将识别结果信息打包返回到请求端;
再进一步的,所述S2中的文本解析采用多个智能算法,实现模板自动生成、定制返回关键字、个性文本筛查、生僻字纠错、文本偏移纠正功能,最终返回特定格式的有用信息。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (8)
1.一种基于数据管理的自动模板文字识别实现系统,其特征是所述的系统具体包括模板定制模块、任务管理模块、模板数据管理模块、文字识别模块和文本解析模块:
所述模板定制模块添加新OCR场景的模板信息,无代码定制场景模板,并将其保存发布;
所述任务管理模块接收外部请求的参数与数据;
所述模板数据管理模块用于管理模板信息,对模板信息进行编辑处理和业务调配;
所述文字识别模块用于管理文字识别引擎,返回初始识别结果
2.根据权利要求1所述的系统,其特征是所述模板定制模块具体包括信息采集模块、信息处理模块和信息提交模块:
信息采集模块:读入图片,标定并填写信息,保存;
信息处理模块:是输入修正信息,保存;
信息提交模块:将全部信息提交数据管理模块。
3.根据权利要求1所述的系统,其特征是所述任务管理模块根据请求参数查询模板数据管理模块种的各类模板信息,将模板信息发送给文字识别模块和文本解析模块,最后将识别结果信息打包返回到请求端;
4.根据权利要求1所述的系统,其特征是所述文本解析模块采用多个智能算法,实现模板自动生成、定制返回关键字、个性文本筛查、生僻字纠错、文本偏移纠正功能,最终返回特定格式的有用信息。
5.一种基于数据管理的自动模板文字识别实现方法,其特征是所述的方法具体步骤如下:
S1添加新OCR场景的模板信息,无代码定制场景模板,并将其保存发布;
S2接收外部请求的参数与数据;
S3管理模板信息,对模板信息进行编辑处理和业务调配;
S4用于管理文字识别引擎,返回初始识别结果
6.根据权利要求5所述的方法,其特征是所述S1具体步骤如下:
S11读入图片,标定并填写信息,保存;
S12是输入修正信息,保存;
S13将全部信息提交数据管理模块。
7.根据权利要求5所述的方法,其特征是所述S2根据请求参数查询模板数据管理模块种的各类模板信息,将模板信息分别进行文字识别和文本解析,最后将识别结果信息打包返回到请求端;
8.根据权利要求5所述的方法,其特征是所述S2中的文本解析采用多个智能算法,实现模板自动生成、定制返回关键字、个性文本筛查、生僻字纠错、文本偏移纠正功能,最终返回特定格式的有用信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211199781.2A CN115588206A (zh) | 2022-09-29 | 2022-09-29 | 一种基于数据管理的自动模板文字识别实现系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211199781.2A CN115588206A (zh) | 2022-09-29 | 2022-09-29 | 一种基于数据管理的自动模板文字识别实现系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115588206A true CN115588206A (zh) | 2023-01-10 |
Family
ID=84778807
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211199781.2A Pending CN115588206A (zh) | 2022-09-29 | 2022-09-29 | 一种基于数据管理的自动模板文字识别实现系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115588206A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117669529A (zh) * | 2024-02-01 | 2024-03-08 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、设备以及介质 |
-
2022
- 2022-09-29 CN CN202211199781.2A patent/CN115588206A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117669529A (zh) * | 2024-02-01 | 2024-03-08 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、设备以及介质 |
CN117669529B (zh) * | 2024-02-01 | 2024-04-30 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、设备以及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110737630B (zh) | 电子归档文件的处理方法、装置、计算机设备及存储介质 | |
CN112783482B (zh) | 一种可视化表单生成方法、装置、设备及存储介质 | |
US20210264556A1 (en) | Automatically attaching optical character recognition data to images | |
CN111221735A (zh) | 一种用于自动生成业务交互测试脚本的系统 | |
CN110020358A (zh) | 用于生成动态页面的方法和装置 | |
CN115588206A (zh) | 一种基于数据管理的自动模板文字识别实现系统及方法 | |
CN115391439B (zh) | 文档数据导出方法、装置、电子设备和存储介质 | |
CN113434175A (zh) | 数据处理方法、装置、存储介质及设备 | |
CN116052186A (zh) | 多模态发票自动分类识别方法、校验方法及系统 | |
CN113590115B (zh) | 一种业务系统代码自动生成方法及装置 | |
CN111258884A (zh) | 一种用于自动生成接口准确性校验脚本的系统 | |
CN112785284B (zh) | 基于结构化文档的报文入库方法及装置 | |
CN114386853A (zh) | 基于通用审核模型的数据审核处理方法、装置及设备 | |
CN115879435B (zh) | 一种智慧工程场景下云端合同生成的方法 | |
KR100762712B1 (ko) | 규칙기반의 전자문서 변환방법 및 그 시스템 | |
CN111581937A (zh) | 文档生成方法、装置、计算机可读介质及电子设备 | |
CN112650600B (zh) | 推送消息内容的方法、装置和计算机设备 | |
CN110597765A (zh) | 一种大零售呼叫中心异构数据源数据处理方法及装置 | |
CN112464629A (zh) | 表单填写方法及装置 | |
CN112783836A (zh) | 信息交换方法、装置及计算机存储介质 | |
CN116362219A (zh) | 信息提取模板生成方法及装置、介质、设备 | |
US20020120641A1 (en) | Tracking status of inbound trading partner documents | |
US8380690B2 (en) | Automating form transcription | |
CN113807070A (zh) | 关于法律文书模板线上编辑及使用的解决方法 | |
CN111046864A (zh) | 一种合同扫描件五要素自动提取方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |