CN115588206A

CN115588206A - 一种基于数据管理的自动模板文字识别实现系统及方法

Info

Publication number: CN115588206A
Application number: CN202211199781.2A
Authority: CN
Inventors: 仇恒坦; 沈壮志; 孙梦璐; 潘震; 李�昊
Original assignee: Inspur Software Co Ltd
Current assignee: Inspur Software Co Ltd
Priority date: 2022-09-29
Filing date: 2022-09-29
Publication date: 2023-01-10

Abstract

本发明公开了一种基于数据管理的自动模板文字识别实现系统及方法，属于OCR领域；所述的系统具体包括模板定制模块、任务管理模块、模板数据管理模块、文字识别模块和文本解析模块：所述模板定制模块添加新OCR场景的模板信息，无代码定制场景模板，并将其保存发布；所述任务管理模块接收外部请求的参数与数据；所述模板数据管理模块用于管理模板信息，对模板信息进行编辑处理和业务调配；所述文字识别模块用于管理文字识别引擎，返回初始识别结果；本发明系统通过模板定制、任务管理、模板数据管理、文字识别、文本解析五个模块组成,技术架构清晰，协作开发更方便，任务执行更高效。

Description

一种基于数据管理的自动模板文字识别实现系统及方法

技术领域

本发明公开一种基于数据管理的自动模板文字识别实现系统及方法，涉及OCR技术领域。

背景技术

文字识别，亦称光学字符识别(Optical Character Recognition,OCR)，是指对文本资料的图像文件进行分析识别处理，获取文字及版面信息的过程，并以文本的形式返回。具体来说，典型的OCR技术路线分为6大步骤，分别是输入、图像预处理、文本方向矫正、文本区域检测、文本识别、输出，每一个环节都需要算法的密切配合，最终达到理想的识别效果，通常情况下的识别准确率可达到96％以上。由于其方便、快捷、准确的优点，广泛用于各类文字采集相关的场景，如交通场景、票据场景、生活场景、教育场景等。

在OCR的应用场景中，OCR技术往往是实现一项业务最重要的一环。尤其地，在面对复杂的文本信息，识别的文字信息需要进一步分析，OCR识别模式将影响最终的信息提取结果。例如，在数字政府建设中，大量的卡、证、照等需要利用OCR技术进行信息提取，这些材料具有版式多样、信息关键字各不相同，甚至同一卡、证、照也会因版次、地区等差异，导致OCR服务通用性较差，不便推广，最终给服务提供商带来了巨大压力，难以落地实施。

随着技术发展，各大技术服务商和研究机构也提出了可定制化的模板来快速实现OCR功能，以求适用种类繁多的场景应用，解决了部分适用问题。然而，一些特定场景提出了技术服务需要具有易部署、适用性强、快速适配更多场景、便于管理等要求，大量技术方案无法满足实际需求。

故现发明一种基于数据管理的自动模板文字识别实现系统及方法，以解决上述问题。

发明内容

本发明针对现有技术的问题，提供一种基于数据管理的自动模板文字识别实现系统及方法，所采用的技术方案为：一种基于数据管理的自动模板文字识别实现系统，所述的系统具体包括模板定制模块、任务管理模块、模板数据管理模块、文字识别模块和文本解析模块：

所述模板定制模块添加新OCR场景的模板信息，无代码定制场景模板，并将其保存发布；

所述任务管理模块接收外部请求的参数与数据；

所述模板数据管理模块用于管理模板信息，对模板信息进行编辑处理和业务调配；

所述文字识别模块用于管理文字识别引擎，返回初始识别结果

所述模板定制模块具体包括信息采集模块、信息处理模块和信息提交模块：

信息采集模块:读入图片，标定并填写信息，保存；

信息处理模块：是输入修正信息，保存；

信息提交模块：将全部信息提交数据管理模块。

所述任务管理模块根据请求参数查询模板数据管理模块种的各类模板信息，将模板信息发送给文字识别模块和文本解析模块，最后将识别结果信息打包返回到请求端；

所述文本解析模块采用多个智能算法，实现模板自动生成、定制返回关键字、个性文本筛查、生僻字纠错、文本偏移纠正功能，最终返回特定格式的有用信息。

一种基于数据管理的自动模板文字识别实现方法，所述的方法具体步骤如下：

S1添加新OCR场景的模板信息，无代码定制场景模板，并将其保存发布；

S2接收外部请求的参数与数据；

S3管理模板信息，对模板信息进行编辑处理和业务调配；

S4用于管理文字识别引擎，返回初始识别结果

所述S1具体步骤如下：

S11读入图片，标定并填写信息，保存；

S12是输入修正信息，保存；

S13将全部信息提交数据管理模块。

所述S2根据请求参数查询模板数据管理模块种的各类模板信息，将模板信息分别进行文字识别和文本解析，最后将识别结果信息打包返回到请求端；

所述S2中的文本解析采用多个智能算法，实现模板自动生成、定制返回关键字、个性文本筛查、生僻字纠错、文本偏移纠正功能，最终返回特定格式的有用信息。

本发明的有益效果为：本发明系统通过模板定制、任务管理、模板数据管理、文字识别、文本解析五个模块组成,技术架构清晰，协作开发更方便，任务执行更高效；

模板定制模块用于添加新OCR场景的模板信息，无代码定制新场景模板，具有快速、高效、可视化操作等优点，用户体验更佳；

任务管理模块控制整个业务流程，便于系统的资源调配、优化升级等；

模板数据管理模块用于管理模板信息，同时提供对模板信息的增、删、改、查和业务调配，以此来满足各类业务需求；

文字识别模块用于管理文字识别引擎，便于开发测试、场景适配，为业务寻求较优的技术方案；

文本解析模块采用多个智能算法，实现模板自动生成、定制返回关键字、个性文本筛查、生僻字纠错、文本偏移纠正等功能，可实现更个性化、更准确的信息输出。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明系统实施例的自动模板文字识别方案流程图；图2是本发明系统实施例的新建模板信息流程图；图3是本发明系统实施例的模板标定区域示例示意图；图4是本发明系统实施例的实施系统图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步说明，以使本领域的技术人员可以更好地理解本发明并能予以实施，但所举实施例不作为对本发明的限定。

实施例一：

一种基于数据管理的自动模板文字识别实现系统，所述的系统具体包括模板定制模块、任务管理模块、模板数据管理模块、文字识别模块和文本解析模块：

所述任务管理模块接收外部请求的参数与数据；

所述文字识别模块用于管理文字识别引擎，返回初始识别结果；

模板定制模块用于添加新OCR场景的模板信息，通过前端界面上传定制模板的图片，依次在图片上框定版式区域，填写需要定制化返回的关键字、卡证照类型、需剔除的关键字或者字符、需替换的文本等信息，保存并发布模板，模板信息便被提交至模板数据管理模块，最终完成一个新场景的定制；任务管理模块负责接收外部请求的参数与数据，根据请求参数查询模板数据管理模块种的各类模板信息，将模板信息发送给文字识别模块和文本解析模块，最后将识别结果信息打包返回到请求端；模板数据管理模块用于管理模板信息，同时提供对模板信息的增删改查和业务调配；文字识别模块用于管理文字识别引擎，返回初始识别结果；文本解析模块采用多个智能算法，实现模板自动生成、定制返回关键字、个性文本筛查、生僻字纠错、文本偏移纠正等功能，最终返回特定格式的有用信息；

进一步的，所述模板定制模块具体包括信息采集模块、信息处理模块和信息提交模块：

信息采集模块:读入图片，标定并填写信息，保存；

信息处理模块：是输入修正信息，保存；

信息提交模块：将全部信息提交数据管理模块；

进一步的，所述任务管理模块根据请求参数查询模板数据管理模块种的各类模板信息，将模板信息发送给文字识别模块和文本解析模块，最后将识别结果信息打包返回到请求端；

再进一步的，所述文本解析模块采用多个智能算法，实现模板自动生成、定制返回关键字、个性文本筛查、生僻字纠错、文本偏移纠正功能，最终返回特定格式的有用信息；

如图1所示，初始阶段，在没有模板信息的情况下，需要使用模板定制模块标定模板信息，并最终提交到模板数据管理模块；若已经保存模板数据，则不需要重新标定；当接收外部请求时，任务管理模块获取图片和模板ID，然后通过模板数据管理模块查询该模板的信息；接着，文字识别模块识别出文字，并结合这些信息修饰文本，纠错有问题文本；同样地，文本解析模块结合模板信息，将文本信息按照自定义的格式提取出每一事项的信息，并返回给任务管理模块，最终由任务管理模块返回给外部请求；

如图2所示，新建一个模板需要两步来完成：一是读入图片，标定并填写信息，保存；二是输入修正信息，保存；最后，将全部信息提交DB(Data Base，数据库)或者数据管理模块；

如图3所示，其中“------”为框定区域，“xxxx”为文本信息举例，如图所示，示例中按照标定标准标定了6块区域；

如图4所示，将数据库、人工智能计算和任务管理等三个模块存放到服务器上；具体地，数据库用于存放模板信息；人工智能计算模块可以处理模板自动生成、文字识别以及相关的智能算法，其是该系统的计算核心；任务管理模块用来接收外部的服务请求、读取数据库的模板信息、调用人工智能计算模块，并最终返回请求，其是该系统的控制核心。

实施例二：

在实施例一的基础上，创建模板原则：

如果初次使用本系统，需要根据需求创建模板信息；否则，无需创建模板；最主要的需求往往是自定义请求返回的关键字，其通常为英文，以满足跨平台使用；一般地，为了提高标定模板的质量，应遵循以下几个原则：

(1)根据业务需求分别填写“显式的关键字字对”/“非显式的关键字字对”下的“返回的关键字”和“识别的关键字”，前者一般采用英文+“_”的格式(可自定义)，后者必须严格按照卡证照上的实际信息填写，点击“添加”按钮按需添加，点击“-”号删除该条记录；

(2)特别地，“识别的关键字”中，易错字可用“.”替代，开头字符可用“^”标识，同一“返回的关键字”对应多个“识别的关键字”时，可用“|”隔开；

(3)特别地，“显式的关键字字对”用于提取类似“关键字：信息”的文本信息，没有此类文本信息提取需求时，可不填(为空)；；

(4)特别地，“非显式的关键字字对”用于提取类似“xxxx关键字xxxx”的文本信息，没有此类文本信息提取需求时，可不填(为空)；

(5)根据卡证照版式选择“竖版”或者“横版”，默认为竖版，注意修改；

(6)根据需求填写“证件类型”，同一类型的卡证照可以存在多条记录，以满足测试、部署、演示等需求，不建议为空；

(7)根据需要填写“删除的关键字”。

实施例三：

在实施例一的基础上，创建身份证的自动模板：

模板定制模块用于添加新OCR场景的模板信息，通过前端界面上传身份证的模板图片，依次在图片上框定标定区域，填写证件类型、显式的关键字字对、非显式的关键字字对、待剔除文本、替换文本等信息，保存并发布模板，模板信息便被提交至模板数据管理模块，最终完成一个新场景的创建；

根据以上原则，营业执照的标定信息如下：

证件类型：身份证

标定区域：{"horizontal":[{"x1":51,"x2":400,"y1":41,"y2":550}],"vertical":[{"x1":27,"x2":453,"y1":19,"y2":273}]}

显式的关键字字对：[{"key":"name","value":"姓名"},{"key":"gender","value":"性别|性"},{"key":"ethnicity","value":"民族"},{"key":"birth","value":"出生"},{"key":"residential_address","value":"住址"},{"key":"citizen_id_number","value":"公民身.号码"},{"key":"authority","value":"签发机关"},{"key":"valid_period","value":"有效期限"}]

非显式(隐式)的关键字字对：(暂无，根据实际效果补充即可；)

待剔除文本：中华人民共和国|居民身份证

替换文本：(暂无，根据实际效果补充即可；)

实施例四：

在实施例三的基础上，利用创建的身份证模板信息实现文字识别：

任务管理模块负责接收外部请求的参数与数据，此处传入一张测试的身份证图片，根据请求参数查询到身份证的模板信息，将模板信息发送给文字识别模块和文本解析模块，最后将识别结果信息打包返回到请求端，最终返回特定格式的有用信息，如该身份证最终返回信息如下：

实施例五：

S2接收外部请求的参数与数据；

S3管理模板信息，对模板信息进行编辑处理和业务调配；

S4用于管理文字识别引擎，返回初始识别结果

进一步的，所述S1具体步骤如下：

S11读入图片，标定并填写信息，保存；

S12是输入修正信息，保存；

S13将全部信息提交数据管理模块；

进一步的，所述S2根据请求参数查询模板数据管理模块种的各类模板信息，将模板信息分别进行文字识别和文本解析，最后将识别结果信息打包返回到请求端；

再进一步的，所述S2中的文本解析采用多个智能算法，实现模板自动生成、定制返回关键字、个性文本筛查、生僻字纠错、文本偏移纠正功能，最终返回特定格式的有用信息。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种基于数据管理的自动模板文字识别实现系统，其特征是所述的系统具体包括模板定制模块、任务管理模块、模板数据管理模块、文字识别模块和文本解析模块：

所述任务管理模块接收外部请求的参数与数据；

2.根据权利要求1所述的系统，其特征是所述模板定制模块具体包括信息采集模块、信息处理模块和信息提交模块：

信息采集模块:读入图片，标定并填写信息，保存；

信息处理模块：是输入修正信息，保存；

信息提交模块：将全部信息提交数据管理模块。

3.根据权利要求1所述的系统，其特征是所述任务管理模块根据请求参数查询模板数据管理模块种的各类模板信息，将模板信息发送给文字识别模块和文本解析模块，最后将识别结果信息打包返回到请求端；

4.根据权利要求1所述的系统，其特征是所述文本解析模块采用多个智能算法，实现模板自动生成、定制返回关键字、个性文本筛查、生僻字纠错、文本偏移纠正功能，最终返回特定格式的有用信息。

5.一种基于数据管理的自动模板文字识别实现方法，其特征是所述的方法具体步骤如下：

S2接收外部请求的参数与数据；

S3管理模板信息，对模板信息进行编辑处理和业务调配；

S4用于管理文字识别引擎，返回初始识别结果

6.根据权利要求5所述的方法，其特征是所述S1具体步骤如下：

S11读入图片，标定并填写信息，保存；

S12是输入修正信息，保存；

S13将全部信息提交数据管理模块。

7.根据权利要求5所述的方法，其特征是所述S2根据请求参数查询模板数据管理模块种的各类模板信息，将模板信息分别进行文字识别和文本解析，最后将识别结果信息打包返回到请求端；

8.根据权利要求5所述的方法，其特征是所述S2中的文本解析采用多个智能算法，实现模板自动生成、定制返回关键字、个性文本筛查、生僻字纠错、文本偏移纠正功能，最终返回特定格式的有用信息。