CN111444794B

CN111444794B - 基于ocr的票据识别辅助方法、设备、存储介质及装置

Info

Publication number: CN111444794B
Application number: CN202010177538.5A
Authority: CN
Inventors: 孟波川; 黄煦; 李建
Original assignee: Acer Beijing Information Technology Co ltd
Current assignee: Acer Beijing Information Technology Co ltd
Priority date: 2020-03-13
Filing date: 2020-03-13
Publication date: 2023-12-12
Anticipated expiration: 2040-03-13
Also published as: CN111444794A

Abstract

公开了一种基于OCR的票据识别辅助方法、设备、存储介质及装置。方法包括：对用户上传的票据图片进行裁切处理以获得票据图片中对应多个不同区域票据字段的多个图像切片，并定义每个图像切片的字段属性；筛选出OCR自动识别算法无法准确识别的模糊图像切片；基于模糊图像切片的字段属性判断模糊图像切片中是否存在隐私信息；若存在隐私信息则对模糊图像切片进行脱敏处理；若不存在隐私信息则直接建立模糊图像切片的人工识别派单任务；将人工识别派单任务同时分发至多个众包人员；接收多个众包人员的接单信息，并将模糊图像切片发送至至少一个接单的众包人员进行人工识别；接收人工识别返回的人工识别字段。有效提高了票据图片的识别精度与效率。

Description

基于OCR的票据识别辅助方法、设备、存储介质及装置

技术领域

本发明涉及OCR识别技术领域，更具体地，涉及一种基于OCR的票据识别辅助方法、设备、存储介质及装置。

背景技术

OCR(Optical Character Recognition，光学字符识别)是模式识别领域中重要的研究方向。近年来，随着移动设备的快速更新迭代，以及移动互联网的快速发展，使得OCR有更为广泛的应用场景，从以往的扫描文件的字符识别，到现在应用到自然场景中图片文字的识别，如识别身份证、银行卡、门牌、票据及各类网络图片中的文字。

在大型企业、机构、医院体检、保险行业等都有海量的票据需要进行信息的采集、录入以及电子化存档。目前票据数字化管理程度还比较低，常采用的手动录入、人工建档的方式劳动强度大、效率低且成本开支大，而且容易出错。虽然目前可以利用机器学习方法基于OCR技术进行票据识别，但识别精度不高，这样就会造成票据多种信息的错误，无法快速建档，提高工作效率。

因此，有必要开发一种基于OCR的票据识别辅助方法，以提高票据图片识别的准确性和识别效率。

发明内容

本发明提出了一种基于OCR的票据识别辅助方法、设备、存储介质及装置，其能够以提高票据图片识别的准确性和识别效率。

根据本发明的一种基于OCR的票据识别辅助方法，包括：

对用户上传的票据图片进行裁切处理，以获得所述票据图片中对应多个不同区域票据字段的多个图像切片，并定义每个图像切片的字段属性；

通过OCR自动识别算法识别每个所述图像切片中的字段，并筛选出所述OCR自动识别算法无法准确识别的模糊图像切片；

基于所述模糊图像切片的字段属性判断所述模糊图像切片中是否存在隐私信息；

若存在隐私信息，则对所述模糊图像切片进行脱敏处理，之后建立所述模糊图像切片的人工识别派单任务；若不存在隐私信息，则直接建立所述模糊图像切片的人工识别派单任务；

将所述人工识别派单任务同时分发至多个众包人员，并接收所述多个众包人员的接单信息；

将所述模糊图像切片发送至至少一个接单的众包人员，所述接单的众包人员对所述模糊图像切片进行人工识别；

接收人工识别返回的人工识别字段。

可选地，对所述模糊图像切片进行脱敏处理，之后建立所述模糊图像切片的人工识别派单任务包括：

对存在隐私信息的所述模糊图像切片进行碎片化处理，以获得所述模糊图像切片的多个碎片图像，并将所述多个碎片图像中的每个碎片图像按照预设规则绑定一个唯一编码，其中每个所述碎片图像中包含所述模糊图像切片中的部分字段；

针对所述多个碎片图像分别建立每个碎片图像的人工识别派单任务。

可选地，针对所述多个碎片图像分别建立每个碎片图像的人工识别派单任务之后，还包括：

将多个碎片图像的多个人工识别派单任务同时分发至多个不同的众包人员；

接收所述多个众包人员的接单信息，并将所述碎片图像及绑定的唯一编码发送至接单的众包人员，所述接单的众包人员对所述模糊图像切片中的字段进行人工识别并返回对应的人工识别字段的结果及绑定的唯一编码；

接收返回的多个人工识别字段的结果，当所述模糊图像切片的所述多个碎片图像均返回人工识别字段的结果后，基于每个人工识别字段的结果绑定的唯一编码按照所述预设规则，将所述多个碎片图像对应的多个人工识别字段的结果进行拼接，以形成对应所述模糊图像切片完整的字段信息。

可选地，建立针对所述模糊图像切片的人工识别派单任务的同时还包括：

设定所述人工识别派单任务的接单时限，以及完成所述人工识别派单任务的反馈时限；

若在所述接单时限内没有众包人员接单或在所述反馈时间内没有任何众包人员完成所述人工识别派单任务，则进行二次分配，将所述人工识别派单任务发送给与上一次不同的众包人员。

可选地，还包括：基于每个用户累计完成所述人工识别派单任务的情况建立每个众包人员的信用值，其中，所述信用值与人工识别字段的结构的正确率正相关，所述信用值与所述反馈时间负相关。

可选地，接收所述多个众包人员的接单信息，并将所述模糊图像切片发送至接单的众包人员包括：

接收所述多个众包人员的接单信息后，获取所述每个接单的众包人员对应的所述信用值，优先将所述模糊图像切片发送至信用值最高的众包人员。

可选地，将所述模糊图像切片发送至至少一个接单的众包人员包括：

将同一个所述模糊图像切片同时发送至多个接单的众包人员，所述多个接单的众包人员分别对所述模糊图像切片进行人工识别并反馈人工识别字段的结果；判断多个人工识别字段是否相同，若相同，则输出将所述人工识别字段作为最终输出字段，若不同，则将所述模糊图像切片重新建立人工识别派单任务进行再次派单，或者将反馈占比最高的相同人工识别字段作为最终输出字段。

本发明还提出一种电子设备，所述电子设备包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述的基于OCR的票据识别辅助方法。

本发明还提出一种非暂态计算机可读存储介质，该非暂态计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行上述的基于OCR的票据识别辅助方法。

本发明还提出一种OCR识别辅助装置，包括：

裁切处理模块，用于对用户上传的票据图片进行裁切处理，以获得所述票据图片中对应多个不同区域票据字段的多个图像切片，并定义每个图像切片的字段属性；

OCR识别模块，用于通过OCR自动识别算法识别每个所述图像切片中的字段，并筛选出所述OCR自动识别算法无法准确识别的模糊图像切片；

脱敏处理模块，用于基于所述模糊图像切片的字段属性判断所述模糊图像切片中是否存在隐私信息，并将存在隐私信息的模糊图像切片进行脱敏处理；

派单模块，用于建立所述模糊图像切片的人工识别派单任务并将所述模糊图像切片发送至接单的众包人员并接收所述多个众包人员的接单信息，之后将所述模糊图像切片发送至至少一个接单的众包人员，并接收人工识别返回的人工识别字段；

其中，若所述脱敏处理模块判断所述模糊图像切片中存在隐私信息，则对所述模糊图像切片进行脱敏处理，之后通过所述派单模块建立所述模糊图像切片的人工识别派单任务；

若所述脱敏处理模块判断所述模糊图像切片中不存在隐私信息，则所述派单模块直接建立所述模糊图像切片的人工识别派单任务；

所述接单的众包人员对所述模糊图像切片进行人工识别。

本发明的有益效果在于：

通过将用户上传的票据图片进行裁切处理后获得该票据图片中对应多个不同区域票据字段的多个图像切片，其中为每个图像切片定义和不同的字段属性，基于图片属性能够判断每个图像切片是否存在隐私信息，并对隐私信息所在的图像切片进行脱敏处理，筛选出所述OCR自动识别算法无法准确识别的模糊图像切片后可以通过众包人工识别的形式进行派单，以获取通过人工辅助识别后模糊图像切片中的字段信息，能够有效提高票据图像识别的准确性，同时节省人力成本并提高识别效率。

本发明的方法和装置具有其它的特性和优点，这些特性和优点从并入本文中的附图和随后的具体实施方式中将是显而易见的，或者将在并入本文中的附图和随后的具体实施方式中进行详细陈述，这些附图和具体实施方式共同用于解释本发明的特定原理。

附图说明

通过结合附图对本发明示例性实施例进行更详细的描述，本发明的上述以及其它目的、特征和优势将变得更加明显，其中，在本发明示例性实施例中，相同的参考标号通常代表相同部件。

图1示出了根据本发明的基于OCR的票据识别辅助方法的步骤的流程图。

具体实施方式

下面将参照附图更详细地描述本发明。虽然附图中显示了本发明的优选实施例，然而应该理解，可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了使本发明更加透彻和完整，并且能够将本发明的范围完整地传达给本领域的技术人员。

如图1所示，根据本发明的一种基于OCR的票据识别辅助方法，包括：

对用户上传的票据图片进行裁切处理，以获得票据图片中对应多个不同区域票据字段的多个图像切片，并定义每个图像切片的字段属性；

通过OCR自动识别算法识别每个图像切片中的字段，并筛选出OCR自动识别算法无法准确识别的模糊图像切片；

基于模糊图像切片的字段属性判断模糊图像切片中是否存在隐私信息；

若存在隐私信息，则对模糊图像切片进行脱敏处理，之后建立模糊图像切片的人工识别派单任务；若不存在隐私信息，则直接建立模糊图像切片的人工识别派单任务；

将人工识别派单任务同时分发至多个众包人员，并接收多个众包人员的接单信息；

将模糊图像切片发送至至少一个接单的众包人员，接单的众包人员对模糊图像切片进行人工识别；

接收人工识别返回的人工识别字段。

具体地，通过将用户上传的票据图片进行裁切处理后获得该票据图片中对应多个不同区域票据字段的多个图像切片，其中为每个图像切片定义和不同的字段属性，基于图片属性能够判断每个图像切片是否存在隐私信息，并对隐私信息所在的图像切片进行脱敏处理，筛选出OCR自动识别算法无法准确识别的模糊图像切片后可以通过众包人工识别的形式进行派单，以获取通过人工辅助识别后模糊图像切片中的字段信息，能够有效提高票据图像识别的准确性，同时节省人力成本并提高识别效率。

其中，模糊图像切片即为图像切片中的字段显示存在倾斜、模糊、重叠等不清晰的情况，这种图像往往OCR自动识别算法无法获取准确的识别结果或根本无法识别，因此需要人工识别才能保证票据识别的准确性。本发明的方案采用外网众包的形式实现人工的补录，众包人员主要由具有专业录入技能的人员为主，通过对票据图片的切割(裁切处理)能够简化录入技能的要求，有益于发展众包人员的数量，实现人工的高效率补录。同时还可以通过资格认证(如在线考试)的形式筛选合格的众包人员并进行分类。

在一个示例中，可以根据具体业务的客户类型建立对应不同客户的识别区域定位模板，进而建立针对所有客户的模板库，如建立不同地区多个医院的常用票据的识别区域定位模板、不同保险公司的票据识别区域定位模板等，即每个不同的客户对应不同的识别区域定位模板，在开始进行票面数据识别时，首先基于现有的OCR识别技术，识别票面的特征，可以对部分区域(如票头名称、编号等区域)进行识别，识别出该票据的类型和单位等信息，基于类型和单位等信息从预先建立的模板库中套取对应匹配的识别区域定位模板。其中，识别区域定位模板包括对应票据图片的中多个必要的票据字段所在位置的多个框选识别区域，其中每个框选识别区域对应不同的字段属性。基于票据图片的票面特征套取与该票据匹配的识别区域定位模板，基于识别区域定位模板将票据图片进行裁切处理，以获得对应不同字段属性的图像切片，可以基于图像切片的字段属性对其中的字段信息进行识别提取并进行结构化数据输出。

其中，必要的票据字段包括医院或保险公司的名称字段、用户名字段、金额字段、药品的名称字段、日期字段等。进一步地，OCR机器识别可以基于采集的海量票据数据作为神经网络的训练样本，实现基于OCR的AI智能识别。在本实施例中，除建立票据模板库以外，还可以建立项目分类库、ICD编码库、药品库、诊疗库、手术编码库、医院库、全国医保库、保险规则库等以实现后台数据库支撑，基于上述数据库能够对于OCR识别结果进行最终的逻辑审核和数据校正。

在一个示例中，对模糊图像切片进行脱敏处理，之后建立模糊图像切片的人工识别派单任务包括：

对存在隐私信息的模糊图像切片进行碎片化处理，以获得模糊图像切片的多个碎片图像，并将多个碎片图像中的每个碎片图像按照预设规则绑定一个唯一编码，其中每个碎片图像中包含模糊图像切片中的部分字段；

针对多个碎片图像分别建立每个碎片图像的人工识别派单任务。

接收多个众包人员的接单信息，并将碎片图像及绑定的唯一编码发送至接单的众包人员，接单的众包人员对模糊图像切片中的字段进行人工识别并返回对应的人工识别字段的结果及绑定的唯一编码；

接收返回的多个人工识别字段的结果，当模糊图像切片的多个碎片图像均返回人工识别字段的结果后，基于每个人工识别字段的结果绑定的唯一编码按照预设规则，将多个碎片图像对应的多个人工识别字段的结果进行拼接，以形成对应模糊图像切片完整的字段信息。

具体地，通过将具有敏感的隐私信息(如身份证号码等)字段的图像切片碎片化处理后，形成多个碎片图像，然后在分别将多个碎片图像分别作为单独的人工识别派单任务分发至不同的多个众包人员，在碎片化处理的同时还需要将每个碎片图像绑定一个唯一编码，每个图像切片打碎形成的多个碎片图像的唯一编码之间具有一定的逻辑关系，在每个碎片图像被众包人员人工识别并返回人工识别的字段结果后，可以基于原有的逻辑关系和多个碎片图像分别绑定的唯一编码进行拼接还原，从而实现隐私信息的脱敏并能够获取对应一个图像切片的完整人工识别字段的输出结果。

在具体实施过程中，在派单之前，还可以利用人工智能技术在确保信息安全的同时针对每个切片图像生成一个简单、通用的文档描述，以利于接单的众包人员快速识别和填写识别结果。

在一个示例中，优选地，建立针对模糊图像切片的人工识别派单任务的同时还包括：设定人工识别派单任务的接单时限，以及完成人工识别派单任务的反馈时限；若在接单时限内没有众包人员接单或在反馈时间内没有任何众包人员完成人工识别派单任务，则进行二次分配，将人工识别派单任务发送给与上一次不同的众包人员。

具体地，通过设置接单时限和结果反馈时限，有利于实现快速派单并使用户快速反馈结果，当无人接单或无人反馈结果时也可以及时进行再次派单给其他众包人员，能够有效提高票据识别的时效性。

具体实施过程中，为提高众包人员的积极性，可以给予众包人员一定的物质奖励，还可以通过建立抢单的机制，将人工识别派单任务只分配给最先接单的众包人员；还可以基于每个用户累计完成人工识别派单任务的情况建立每个众包人员的信用值，其中，信用值与人工识别字段的结构的正确率正相关，信用值与反馈时间负相关，即人工识别出的字段信息准确性高、反馈时间短即可获得较多的信用值和奖励。在接收多个众包人员的接单信息后，获取每个接单的众包人员对应的信用值，优先将模糊图像切片发送至信用值最高的众包人员。能够有效提高众包人员人工识别的积极性，进一步提高票据识别的准确性。还可以借助于人类行为学AI分析，建立动态信用警报，加强众包人员的信用管理。

在一个示例中，根据信用值顺序由高至低向可分配众包人员A分配识别任务，设定反馈时间为30s；A接收识别任务后，在30s内没有完成识别任务，则对识别任务进行二次分配，即将任务分配给除该可分配众包人员外信用值最高的可分配众包人员Z。

在一个示例中，为进一步提高人工识别的准确性，对于一个模糊的图像切片或碎片图像，可以将同一个模糊图像切片或碎片图像同时发送至多个接单的众包人员，多个接单的众包人员分别进行人工识别并反馈人工识别字段的结果；基于多个众包人员的反馈结果，判断反馈的人工识别出的多个人工识别字段是否都相同，若都相同，则输出将人工识别字段作为最终输出字段，若不尽同，则可以将模糊图像切片重新建立人工识别派单任务进行再次派单，直到所有的反馈结果都完全相同；或者将反馈结果中占比最高的一个相同人工识别字段作为最终输出字段。

例如，将同一个模糊图像切片或碎片图像建立人工识别派单任务，并建立派单任务，同时设定接单时限为20s，将人工识别派单任务同时分配至三个众包人员A、B、C，若A、B、C在20s内均未接单则重新派单给众包人员D、E、F；

若三个众包人员A、B、C均在20s内成功接单，(如果是抢单业务则直接将该人工识别派单任务派给接单时间最短的众包人员)，则将反馈时限设为30s，并将模糊图像切片或碎片图像分别发送给A、B、C，若A、B、C在30s内至少一个人没有反馈人工识别字段的结果，则重新派单给D、E、F，并根据反馈时间对反馈的众包人员更新信用值；若A、B、C分别成功反馈各自的识别结果均为X，则直接输出人工识别结果为X，并根据A、B、C的反馈时间更新信用值，若不相同，则重新派单给D、E、F直到三个反馈的结构均相同为止；另一种方式为：若A、B、C分别反馈各自的识别结果为X、X、Y，则可以将X作为人工识别字段的结果，并根据众包人员的正确与否以及反馈时间更新信用值。

最后，将人工识别反馈的票据字段信息进行结构化数据输出，并与ORC自动识别出的票据字段信息进行整合。

本发明还提出一种电子设备，电子设备包括：

至少一个处理器；以及，

与至少一个处理器通信连接的存储器；其中，

存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行上述的基于OCR的票据识别辅助方法。

本发明还提出一种OCR识别辅助装置，包括：

裁切处理模块，用于对用户上传的票据图片进行裁切处理，以获得票据图片中对应多个不同区域票据字段的多个图像切片，并定义每个图像切片的字段属性；

OCR识别模块，用于通过OCR自动识别算法识别每个图像切片中的字段，并筛选出OCR自动识别算法无法准确识别的模糊图像切片；

脱敏处理模块，用于基于模糊图像切片的字段属性判断模糊图像切片中是否存在隐私信息，并将存在隐私信息的模糊图像切片进行脱敏处理；

派单模块，用于建立模糊图像切片的人工识别派单任务并将模糊图像切片发送至接单的众包人员并接收多个众包人员的接单信息，之后将模糊图像切片发送至至少一个接单的众包人员，并接收人工识别返回的人工识别字段；

其中，若脱敏处理模块判断模糊图像切片中存在隐私信息，则对模糊图像切片进行脱敏处理，之后通过派单模块建立模糊图像切片的人工识别派单任务；

若脱敏处理模块判断模糊图像切片中不存在隐私信息，则派单模块直接建立模糊图像切片的人工识别派单任务；

接单的众包人员对模糊图像切片进行人工识别。

综上，本发明的实施例通过专业化的分工，将时效短、工作量大的复杂任务，分解为若干简单、工作量较小的作业，通过众包人工辅助识别的模式，最大限度和最大范围地利用社会的人力资源，进而实现高效、保质的人工辅助票据识别，有效提高了票据图片的识别精度与效率，具有很高的市场推广价值。

以上已经描述了本发明的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。

Claims

1.一种基于OCR的票据识别辅助方法，其特征在于，包括：

接收人工识别返回的人工识别字段；

其中，对所述模糊图像切片进行脱敏处理，之后建立所述模糊图像切片的人工识别派单任务包括：

2.根据权利要求1所述的基于OCR的票据识别辅助方法，其特征在于，针对所述多个碎片图像分别建立每个碎片图像的人工识别派单任务之后，还包括：

3.根据权利要求1所述的基于OCR的票据识别辅助方法，其特征在于，建立针对所述模糊图像切片的人工识别派单任务的同时还包括：

若在所述接单时限内没有众包人员接单或在所述反馈时限内没有任何众包人员完成所述人工识别派单任务，则进行二次分配，将所述人工识别派单任务发送给与上一次不同的众包人员。

4.根据权利要求3所述的基于OCR的票据识别辅助方法，其特征在于，还包括：基于每个用户累计完成所述人工识别派单任务的情况建立每个众包人员的信用值，其中，所述信用值与人工识别字段的结构的正确率正相关，所述信用值与所述反馈时限负相关。

5.根据权利要求3所述的基于OCR的票据识别辅助方法，其特征在于，接收所述多个众包人员的接单信息，并将所述模糊图像切片发送至接单的众包人员包括：

接收所述多个众包人员的接单信息后，获取每个接单的众包人员对应的信用值，优先将所述模糊图像切片发送至信用值最高的众包人员。

6.根据权利要求1所述的基于OCR的票据识别辅助方法，其特征在于，将所述模糊图像切片发送至至少一个接单的众包人员包括：

7.一种电子设备，其特征在于，所述电子设备包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-6任一所述的基于OCR的票据识别辅助方法。

8.一种非暂态计算机可读存储介质，其特征在于，该非暂态计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行权利要求1-6任一所述的基于OCR的票据识别辅助方法。

9.一种OCR识别辅助装置，其特征在于，包括：

脱敏处理模块，用于基于所述模糊图像切片的字段属性判断所述模糊图像切片中是否存在隐私信息，并将存在隐私信息的模糊图像切片进行脱敏处理；对所述模糊图像切片进行脱敏处理包括：对存在隐私信息的所述模糊图像切片进行碎片化处理，以获得所述模糊图像切片的多个碎片图像，并将所述多个碎片图像中的每个碎片图像按照预设规则绑定一个唯一编码，其中每个所述碎片图像中包含所述模糊图像切片中的部分字段；

派单模块，用于建立所述模糊图像切片的人工识别派单任务并将所述模糊图像切片发送至接单的众包人员并接收多个众包人员的接单信息，之后将所述模糊图像切片发送至至少一个接单的众包人员，并接收人工识别返回的人工识别字段；

其中，若所述脱敏处理模块判断所述模糊图像切片中存在隐私信息，则对所述模糊图像切片进行脱敏处理，之后通过所述派单模块针对所述多个碎片图像分别建立每个碎片图像的人工识别派单任务；

所述接单的众包人员对所述模糊图像切片进行人工识别。