CN112801079A

CN112801079A - 一种文本识别方法、装置、终端及存储介质

Info

Publication number: CN112801079A
Application number: CN202011586117.4A
Authority: CN
Inventors: 霍东阳; 曾小辉; 李凯; 吴沫; 赵威; 王雷; 李双龙; 梁栋; 刘涛; 卢海洋
Original assignee: Faw Capital Holdings Ltd
Current assignee: Faw Capital Holdings Ltd
Priority date: 2020-12-29
Filing date: 2020-12-29
Publication date: 2021-05-14

Abstract

本发明公开了一种文本识别方法、装置、终端及存储介质，属于计算机技术领域，包括:获取发起图像识别方发送的影像数据，对所述影像数据进行筛选判断得到合格影像数据；通过所述合格影像数据获取请求信息以及识别成文字数据；通过请求信息和文字数据确定至少一个分词识别数据，将所述识别数据发送给发起图像识别方。本发明进件的清晰度智能化可控，影像件识别率可自优化提升，支持同步异步高并发识别，具有非结构化样本关键字识别能力。

Description

一种文本识别方法、装置、终端及存储介质

技术领域

本发明公开了一种电子签约方法、装置、终端及存储介质，属于电子商务技术领域。

背景技术

目前，在无OCR识别平台之前，多样本影像件内容采集和比对的痛点如下：

(1)样本手工录入体验差效率低：终端用户和录单员需要手工录入身份证、驾驶证、合同、发票、申请单等纸质样本，体验较差效率较低

(2)影像件内容与录入情况审核成本高：需要大量人工进行影像件比对审核工作，人工成本较高

(3)人工比对或录入工作时间长，不可追溯：人工比对或录入时间长，录入内容及比对结果不可追溯，易产生风险。。

发明内容

本发明的目的在于解决传统多样本影像件内容采集效率低的问题，提出一种文本识别方法、装置、终端及存储介质。

本发明所要解决的问题是由以下技术方案实现的：

根据本公开实施例的第一方面，提供一种文本识别方法，所述方法包括：

获取发起图像识别方发送的影像数据，对所述影像数据进行筛选判断得到合格影像数据；

通过所述合格影像数据获取请求信息以及识别成文字数据；

通过请求信息和文字数据确定至少一个分词识别数据，将所述识别数据发送给发起图像识别方。

优选的是，所述获取发起图像识别方发送的影像数据，对所述影像数据进行筛选判断得到合格影像数据，包括：

获取发起图像识别方发送的影像数据，开启接收影像数据操作；

接收到所述影像数据后对其进行图片清晰度识别筛选；

通过图片清晰度识别筛选后得到合格影像数据。

优选的是，所述接收到所述影像数据后对其进行图片清晰度识别筛选，包括：

对所述影像数据进行图片清晰度识别判断是否符合图片清晰度阈值要求：

符合，进行下一步骤；

不符合，重新对影像数据进行接收。

优选的是，所述通过所述合格影像数据确定请求信息以及识别成文字数据包括：

通过合格影像数据确定请求信息，所述请求信息包括结构化及非结构化样本信息；

通过合格影像数据得到标准影像数据；

通过所述请求信息判断请求模式；

通过请求模式和标准影像数据得到文字数据。

优选的是，所述通过所述请求信息判断请求模式，包括：

通过所述请求信息判断请求模式：

当请求模式为同步模式时，进行下一步骤；

当请求模式为异步模式时，通过请求信息获取需要发送给发起图像识别方的消息内容。

优选的是，所述识别数据包括：请求结果、识别结果、比对结果、识别率、精细至各个识别模块识别率、OCR读光原始识别结果和业务字典内容。

优选的是，所述通过请求信息和文字数据确定至少一个分词识别数据，将所述识别数据发送给发起图像识别方，还包括：将所述识别数据上传至结果库，并对所述结果库的数据进行更新。

根据本公开实施例的第二方面，提供一种基于深度学习方法的文本识别装置，所述装置包括：

获取单元，用于获取发起图像识别方发送的影像数据，对所述影像数据进行筛选判断得到合格影像数据；

识别单元，通过所述合格影像数据获取请求信息以及识别成文字数据；

执行单元，通过请求信息和文字数据确定至少一个分词识别数据，将所述识别数据发送给发起图像识别方。

优选的是，所述执行单元还用于：将所述识别数据上传至结果库，并对所述结果库的数据进行更新。

第三方面，提供了一种终端及计算机可读存储介质，所述终端包括处理器和存储器，所述存储器或存储介质中存储有至少一条指令，所述至少一条指令由所述处理器加载并执行以实现如第一方面所述的基于深度学习方法的文本识别方法。

本申请实施例提供的技术方案带来的有益效果至少包括：

本发明提供一种文本识别方法、装置、终端及存储介质，优点如下：

(1)进件的清晰度智能化可控：

基于开源清晰度算法Tenengrad进行了深度学习测试及二次封装，在前端进件过程中将不清晰影像件进行对应阈值判断，进行无监督学习，对影像件进行智能识别和处置。

(2)影像件识别率可自优化提升

利用三层神经网络算法对历史影像件进行定时有监督学习，不断提升算法针对单一样本能力，无人工参与，完全自动优化。

(3)支持同步异步高并发识别

通过高可用多并非架构，针对不同业务及影像件提供同步异步两类识别接口，QPS大于30，TPS小于1s。

(4)非结构化样本关键字识别能力

对于非结构化和自定义的样本，利用自研关键字查找算法，快速查询并比对关键字匹配情况，并返回关键字匹配结果及正确率，供用户自定义决策结果。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种文本识别方法的流程图；

图2是本申请实施例提供的一种文本识别方法的流程图；

图3是本申请实施例提供的一种基于汽车金融零售车秒贷装置的结构示意图；

图4是本申请实施例提供的一种基于汽车金融零售车秒贷装置的结构示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的系统和方法的例子。

实施例一

如图1是根据本申请实施例提供的一种文本识别方法，该方法用于终端中，如图1所示，包括以下步骤：

步骤101，获取发起图像识别方发送的影像数据，对所述影像数据进行筛选判断得到合格影像数据；

步骤102，通过所述合格影像数据获取请求信息以及识别成文字数据；

步骤103，通过请求信息和文字数据确定至少一个分词识别数据，将所述识别数据发送给发起图像识别方。

接收到所述影像数据后对其进行图片清晰度识别筛选；

通过图片清晰度识别筛选后得到合格影像数据。

符合，进行下一步骤；

不符合，重新对影像数据进行接收。

通过合格影像数据得到标准影像数据；

通过所述请求信息判断请求模式；

通过请求模式和标准影像数据得到文字数据。

优选的是，所述通过所述请求信息判断请求模式，包括：

通过所述请求信息判断请求模式：

当请求模式为同步模式时，进行下一步骤；

本申请实施例中，基于开源清晰度算法Tenengrad进行了深度学习测试及二次封装，在前端进件过程中将不清晰影像件进行对应阈值判断，进行无监督学习，对影像件进行智能识别和处置。利用三层神经网络算法对历史影像件进行定时有监督学习，不断提升算法针对单一样本能力，无人工参与，完全自动优化。通过高可用多并非架构，针对不同业务及影像件提供同步异步两类识别接口，QPS大于30，TPS小于1s。对于非结构化和自定义的样本，利用自研关键字查找算法，快速查询并比对关键字匹配情况，并返回关键字匹配结果及正确率，供用户自定义决策结果。

图2是根据一示例性实施例示出的一种文本识别方法的流程图，如图2所示，该方法用于终端中，该方法包括以下步骤：

步骤201，获取发起图像识别方发送的影像数据，对所述影像数据进行筛选判断得到合格影像数据。

获取发起图像识别方发送的影像数据，开启接收影像数据操作。接收到影像数据后对其进行图片清晰度识别筛选，对影像数据进行图片清晰度识别判断是否符合图片清晰度阈值要求：

符合，进行下一步骤；

不符合，重新对影像数据进行接收。

通过图片清晰度识别筛选后得到合格影像数据。

上述对影像数据进行图片清晰度识别判断基于OpenCV开源平台、开源清晰度算法Tenengrad进行了深度学习测试及二次封装，Tenengrad梯度方法利用Sobel算子分别计算水平和垂直方向的梯度，同一场景下梯度值越高，图像越清晰；(a)中图片清晰度阈值是指用平台内累积的大量各类结构化及非结构化样本、经过Sobel算子处理后的图像的平均灰度值来设置各类样本模糊、清晰阈值界限及评判标准，可针对各类业务样本图像内容对初始计算设置的阈值进行调整从而来设定各类样本质量高度。

步骤202，通过合格影像数据确定请求信息。

将请求信息存入数据库内留存，以便于后期跟踪样本图像内容识别情况、历史请求数据内容记录、为平台内部深度识别学习奠定坚实的基础；

上述结构化样本主要囊括：身份找、增值税发票、营业执照、毕业证书、房产证、银行卡、车牌号、机动车发票、驾驶证、行驶证、行驶证副业、汽车vin码、护照、火车票、不动产证、食品经营许可证、银行开户许可证，其余样本列入通用图片即非结构化样本，其中非结构化样本可选择图像内容识别类型：文档识别、纯英文识别和电商图片识别。

步骤203，通过合格影像数据得到标准影像数据。

获取需要识别的图像样本后，对图像路径地址合规性校验、图片大小校验，对请求识别的样本不符合规则、大于指定大小的图片进行压缩处理，最终得到标准影像数据。本步骤主要作用为：各种样本类型图像内容在调取读光识别时处理整合至符合读光识别要求标准、以便于后续进行读光识别。

步骤204，通过所述请求信息判断请求模式，包括：

当请求模式为同步模式时，进行下一步骤；

当请求模式为异步模式时，基于处理非同步识别需求，为异步请求识别增加监听消息接收器的消息的队列，监听消息接收器为RabbitMq集群服务，处理异步请求的接收和发送，获取需要发送给发起图像识别方的消息内容。

步骤205，通过请求模式和标准影像数据得到文字数据。

通过读光识别系统，将身份证、驾驶证、购车发票、增值税发票、营业执照、驾驶证、行驶证等其他非固定模板图片样本识别为文本文字数据，针对读光文字识别后返回的数据进行解析解读、针对非结构化类样本增加重点数据查找内容、及请求样本内容与返回识别结果比对、精确至单个字段内容识别率计算。

步骤206，通过请求信息和文字数据确定至少一个分词识别数据，将所述识别数据发送给发起图像识别方，识别数据包括请求结果、识别结果、比对结果、识别率、精细至各个识别模块识别率、OCR读光原始识别结果、业务字典内容，这几部分返回至发起图像识别方。

步骤207，将所述识别数据上传至结果库，并对所述结果库的数据进行更新。

识别结果收入结果库内，定期针对各个数据样本识别率较低及个别识别常错误字段进行深度学习，基于三层神经网络的有监督深度学习，利用历史样本累积定时做算法更新服务，针对识别率低非结构化关键字做针对性提升，配合针对单一样本进行算法更新升级来提高各样本识别率。

基于相同的技术构思，本申请实施例还提供了一种基于深度学习方法的文本识别装置，如图3所示，所述装置包括：

获取单元310，用于获取发起图像识别方发送的影像数据，对所述影像数据进行筛选判断得到合格影像数据；

识别单元320，通过所述合格影像数据获取请求信息以及识别成文字数据；

执行单元330，通过请求信息和文字数据确定至少一个分词识别数据，将所述识别数据发送给发起图像识别方。

优选的是，所述执行单元330还用于：将所述识别数据上传至结果库，并对所述结果库的数据进行更新。

在示例性实施例中，还提供了一种终端，包括：一个或多个处理器401，用于存储所述一个或多个处理器401可执行指令的存储器402，如图4所示，一个或多个处理器被配置为：执行本发明上述的基于深度学习方法的文本识别方法。

在示例性实施例中，还提供一种非临时性计算机可读存储介质，当所述存储介质中的指令由终端的处理器401执行时，使得终端能够执行本发明上述的基于深度学习方法的文本识别方法。

在示例性实施例中，还提供了一种应用程序产品，包括一条或多条指令，该一条或多条指令可以由上述装置的处理器401执行，以完成上述的基于深度学习方法的文本识别方法。

尽管本发明的实施方案已公开如上，但其并不仅仅限于说明书和实施方式中所列运用。它完全可以被适用于各种适合本发明的领域。对于熟悉本领域的人员而言，可容易地实现另外的修改。因此在不背离权利要求及等同范围所限定的一般概念下，本发明并不限于特定的细节和这里示出与描述的图例。

Claims

1.一种文本识别方法，其特征在于，所述方法包括：

通过所述合格影像数据获取请求信息以及识别成文字数据；

2.根据权利要求1所述的一种文本识别方法，其特征在于，所述获取发起图像识别方发送的影像数据，对所述影像数据进行筛选判断得到合格影像数据，包括：

接收到所述影像数据后对其进行图片清晰度识别筛选；

通过图片清晰度识别筛选后得到合格影像数据。

3.根据权利要求2所述的一种文本识别方法，其特征在于，所述接收到所述影像数据后对其进行图片清晰度识别筛选，包括：

符合，进行下一步骤；

不符合，重新对影像数据进行接收。

4.根据权利要求1所述的一种文本识别方法，其特征在于，所述通过所述合格影像数据确定请求信息以及识别成文字数据包括：

通过合格影像数据得到标准影像数据；

通过所述请求信息判断请求模式；

通过请求模式和标准影像数据得到文字数据。

5.根据权利要求4所述的一种文本识别方法，其特征在于，所述通过所述请求信息判断请求模式，包括：

通过所述请求信息判断请求模式：

当请求模式为同步模式时，进行下一步骤；

6.根据权利要求1所述的一种文本识别方法，其特征在于，所述识别数据包括：请求结果、识别结果、比对结果、识别率、精细至各个识别模块识别率、OCR读光原始识别结果和业务字典内容。

7.根据权利要求1所述的一种文本识别方法，其特征在于，所述通过请求信息和文字数据确定至少一个分词识别数据，将所述识别数据发送给发起图像识别方，还包括：将所述识别数据上传至结果库，并对所述结果库的数据进行更新。

8.一种基于深度学习方法的文本识别装置，其特征在于，所述装置包括：

9.根据权利要求1所述的一种基于深度学习方法的文本识别装置，其特征在于，所述执行单元还用于：将所述识别数据上传至结果库，并对所述结果库的数据进行更新。

10.一种终端及计算机可读存储介质，其特征在于，所述终端包括处理器和存储器，所述存储器或存储介质中存储有至少一条指令，所述至少一条指令由所述处理器加载并执行以实现如权利要求1至7任一所述的基于深度学习方法的文本识别方法。