CN111291619A

CN111291619A - 一种在线识别理赔单据中文字的方法、装置及客户端

Info

Publication number: CN111291619A
Application number: CN202010035314.0A
Authority: CN
Inventors: 周凡; 高俊国; 朱世艾; 雷继斌
Original assignee: Alipay Hangzhou Information Technology Co Ltd
Current assignee: Ant Shengxin (Shanghai) Information Technology Co.,Ltd.
Priority date: 2020-01-14
Filing date: 2020-01-14
Publication date: 2020-06-16

Abstract

本说明书实施例公开了一种在线识别理赔单据中文字的方法、装置及客户端。一种实施例中，可以通过在线拍摄单据和自动文字识别的方式，提高理赔流程自动化处理过程，提高理赔处理效率。在识别处理过程中利用生成式对抗网络技术，对自助拍摄场景下采集的低质量图片进行增强，提高光学字符识别的识别准确率。本说明书实施例中利用生成式对抗网络技术，还可以减少训练模型所需的样本图像数量，并提高图像质量，使得终端设备的模型训练更加快速、便捷，模型训练和识别的处理效率更高。

Description

一种在线识别理赔单据中文字的方法、装置及客户端

技术领域

本说明书实施例方案属于计算机数据处理的技术领域，尤其涉及一种在线识别理赔单据中文字的方法、装置及客户端。

背景技术

随着互联网技术的发展，互联网保险业务发展也越来越快。目前，许多保险公司提供了在线理赔的业务，用户通过拍摄并上传车损现场照片、身份证件等，实现快速、智能的保险理赔。有别于传统线下理赔，在线理赔无需用户前往特定地点，可节省用户的时间，提高理赔处理效率。

在线理赔过程中常常还需要提供理赔所需的各种单据，例如事故中患者医疗的发票、车辆维修的发票、车辆修理清单等等。现有一些在线理赔业务处理过程中，用户可以使用智能终端对单据进行拍摄，然后上传照片。保险公司业务人员收到照片后可以人工识别图片中的信息，然后填写到相应的理赔业务单的表项中，完成后续在线理赔业务的处理。

发明内容

本说明书实施例目的在于提供一种在线识别理赔单据中文字的方法、装置及客户端，可以辅助用户对理赔单据进行拍摄，自动提取单据上的文字信息，可以有效提高单据上文字识别的准确率，提高理赔处理效率和服务体验。

本说明书实施例提供的一种在线识别理赔单据中文字的方法、装置及客户端是包括以下方式实现的：

一种在线识别理赔单据中文字的方法，所述方法包括：

展示在线理赔所需单据的拍摄引导信息；

获取根据拍摄引导信息拍摄得到的理赔单据图像；

利用构建的生成对抗网络对所述理赔单据图像进行处理，得到增强后单据图像；

利用光学字符识别方式识别所述增强后单据图像中的文字信息。

一种在线识别理赔单据中文字的装置，所述装置包括：

引导模块，用于展示在线理赔所需单据的拍摄引导信息；

拍摄模块，用于获取根据拍摄引导信息拍摄得到的理赔单据图像；

增强模块，用于利用构建的生成对抗网络对所述理赔单据图像进行处理，得到增强后单据图像；

识别模块，用于利用光学字符识别方式识别所述增强后单据图像中的文字信息。

一种单据拍摄交互处理设备，包括处理器以及用于存储处理器可执行指令的存储器，所述处理器执行所述指令时实现：

展示在线理赔所需单据的拍摄引导信息；

获取根据拍摄引导信息拍摄得到的理赔单据图像；

一种客户端，包括显示屏、拍摄装置、处理器以及存储处理器可执行指令的存储器，

所述拍摄装置用于单据拍摄；

所述显示屏用户显示拍摄信息，所述处理器执行所述指令时可以实现：

在所述显示屏中展示在线理赔所需单据的拍摄引导信息；

获取根据拍摄引导信息拍摄得到的理赔单据图像；

本说明书实施例提供的一种在线识别理赔单据中文字的方法、装置及客户端，可以通过拍摄引导信息引导用户对单据信息拍摄。可以进一步的利用生成对抗网络对拍摄获取的理赔单据图像进行图像质量增强，提高理赔单据中文字识别的准确率。本说明书提供的实施例在保险理赔场景中，可以通过在线拍摄单据+自动文字识别的方式，提高理赔流程自动化处理过程，提高理赔处理效率。在识别处理过程中利用生成式对抗网络技术(Generative Adversarial Networks，简称GAN)，对自助拍摄场景下采集的低质量图片进行增强，提高光学字符识别(Optical Character Recognition，以下简称OCR)的识别准确率。本说明书实施例中利用生成式对抗网络技术(GAN)，还可以减少训练模型所需的样本图像数量，并提高图像质量，使得终端设备的模型训练更加快速、便捷，模型训练和识别的处理效率更高。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本说明书所述方法实施例的一个处理流程示意图；

图2是本说明书一个实施场景中提示用户单据拍摄的交互场景示意图；

图3是本说明书提供的一种生成对抗网络的模型结构示意图；

图4是本说明书提供的所述方法另一个实施例的处理过程示意图；

图5是本说明书一个实施场景中提示用户单据拍摄的交互场景示意图；

图6是应用本发明实施例的一种在线识别理赔单据中文字的方法的客户端的硬件结构框图；

图7是本说明书提供的可以用于用户客户端一侧的一种在线识别理赔单据中文字的装置实施例的模块结构示意图；

图8是本说明书提供的另一种在线识别理赔单据中文字的装置实施例的模块结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本说明书中的技术方案，下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本说明书中的一部分实施例，而不是全部的实施例。基于本说明书中的一个或多个实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本说明书实施例保护的范围。

目前保险行业在财产险、意外险、健康险等领域，经常会提供在线理赔的方案，让用户对发票、修理清单、医疗单据等文件进行拍摄，上传照片，完成理赔所需材料收集，以便减少用户麻烦，提升理赔服务体验。保险公司在收到照片后，可以使用人工鉴定的方式，也可以在某些环节利用电子设备或计算机完成光学字符识别(OCR)，自动提取单据上的信息，提高工作效率。传统OCR技术在解决扫描仪等专业图像采集设备产生的图像时，具有较好的效果。但对于在线理赔这种业务场景，用户通常是使用普通手机拍照，与保险公司专业的理赔人员或使用的专业的图像采集设备相比，常常因为摄像头光学品质较差、手机性能不足、图片分辨率低、光照不足、拍摄时抖动严重、未准确对焦以及拍照技术不够专业化等各种原因，导致所采集的图像质量较差，难以达到较好的字符识别准确率。

本说明书提供的实施方案可以采用有监督的对抗生成网络，生成对抗网络GAN，实现低质量/低分辨率的单据图片的增强功能，从而提升OCR的识别准确率。本说明书实施例的方案可以应用到拍摄单据的多种客户端中。所述的客户端可以包括发起在线理赔的事故方，也可以是保险公司人员使用的具有拍摄功能(至少具有包括拍照功能)的终端设备，如智能手机、平板电脑、智能穿戴设备、车载设备、专用拍摄设备等。所述的客户端可以具有通信模块，可以与远程的服务器进行通信连接，实现与所述服务器的数据传输。

下面以一个具体的车险在线理赔的应用场景为例对本说明书实施方案进行说明。具体的，图1是本说明书提供的所述一种在线识别理赔单据中文字的方法实施例的流程示意图。虽然本说明书提供了如下述实施例或附图所示的方法操作步骤或装置结构，但基于常规或者无需创造性的劳动在所述方法或装置中可以包括更多或者部分合并后更少的操作步骤或模块单元。在逻辑性上不存在必要因果关系的步骤或结构中，这些步骤的执行顺序或装置的模块结构不限于本说明书实施例或附图所示的执行顺序或模块结构。所述的方法或模块结构的在实际中的装置、服务器或终端产品应用时，可以按照实施例或者附图所示的方法或模块结构进行顺序执行或者并行执行(例如并行处理器或者多线程处理的环境、甚至包括分布式处理、服务器集群的实施环境)。

当然，下述实施例的描述并不对基于本说明书的其他可扩展到的技术方案构成限制。例如其他的实施场景中，本说明书提供的实施方案同样可以应用到其他单据图像拍摄交互，或者是证件的拍摄交互的场景，或者是财务报销、网络购物理赔等的在线识别理赔单据的应用场景。具体的一种实施例如图1所示，本说明书提供的一种在线识别理赔单据中文字的方法的一种实施例中，所述方法可以包括：

S0：展示在线理赔所需单据的拍摄引导信息。

本实施例中，用户可以使用手机等客户端进行车险业务的在线理赔。在线理赔可以需要用户拍摄并上传多种或多个单据。在本实施例中，用户可以直接对单据进行拍摄，也可以经过选择后确定需要拍摄的单据类型/种类等。另一些实施例中客户端也可以按照一定的规则或顺序来提示或指示用户拍摄某个或某些单据。

在本说明书实施例中，可以在所述客户端上展示在线理赔所需单据的拍摄引导信息。所述的拍摄引导信息可以包括如上述所述的用户选择需要拍摄的单据类型或种类的界面，也可以包括展示在拍摄取景框中的引导用户正确拍摄单据的提示信息。例如“请对准发票红章”的文字提醒信息，也可以包括文字、语音、箭头图像、动画等中的一种或多种的结合来实现对准提醒，如图2所示。

S2：获取根据拍摄引导信息拍摄得到的理赔单据图像。

当用户根据拍摄引导信息对单据对准后，可以提示用户可以进行拍摄。用户根据拍摄引导信息完成单据拍摄，可以获得相应的理赔单据图像。

所述的理赔单据图像可以包括用户按下拍摄按钮后终端当前拍摄获取的图片，也可以包括用户从拍摄的多个图片中选择的图片。

S4：利用构建的生成对抗网络对所述理赔单据图像进行处理，得到增强后单据图像。

本实施例中可以采用有监督的对抗生成网络，生成对抗网络GAN，实现低质量/低分辨率的单据图片的增强功能，从而提升OCR的识别准确率。

本实施例中的生成对抗网络(Generative Adversarial Network，GAN)可以是一个基于深度卷积网络结构的网络模型。GAN通过学习数据集的分布，能够生成符合该分布的新数据，不再对“数据集”进行要求，它可以通过单张图像学习内部分布，从而生成不同尺寸、形状和比例的任意图像。生成对抗网络包括两个主要的结构：生成网络(模型)和判别网络(模型)，其处理过程模式示意如下：

生成模型生成一些图片->判别模型学习区分生成的图片和真实图片->生成模型根据判别模型改进自己，生成新的图片->判别模型再学习区分生成的图片和真实图片.....

上述过程可以一直持续，直到生成模型和判别模型别无法提升自己，达到判别模型判断不出真假(图片为生成网络生成的图片和真实图片的概率都为0.5或近似0.5)，这样生成模型可以作为进行预测的生成对抗网络模型。

在本实施例中，一般的，利用生成对抗网络对理赔单据进行处理后的单据图像通常比输入生成对抗网络的理赔单据图像的图像质量更高。当然，在一些实施场中，输入理赔单据图像后生成对抗网络输出得到增强后单据图像可能存在图像质量并未提高或降低的情况，此时可以根据实际场景中图像质量要求或其他设计要求调整生成对抗网络参数，重新获取新的增强后单据图像。或者另一种实施方式中无论所述生成对抗网络输出的增强后单据图像的实际图像质量是否得到增强，均可以使用该增强后单据图像作为后续文字识别等处理的对象。

当然，具体的生成对抗网络的结构和参数设定、模型训练等可以根据实际应用场景进行相应的样本选择和模型设计。本说明书的另一个实施例提供一种生成对抗网络的模型结构，该生成对抗网络可以包括生成网络和判别网络。如图3所示，模型训练时可以使用生成网络和判别网络进行训练，获得一个基于深度卷积网络结构的生成网络。在达到训练要求后可以使用生成网络来生成增强后单据图像。具体的，本说明书提供的所述方法的另一个实施例中，所述构建的生成对抗网络中的生成网络采用编码网络和解码网络结构，其中编码网络包含多层卷积，用于对输入的图像S进行特征抽象表达，表达的特征图像分辨率逐渐降低；解码网络由多个反卷积或者上采样网络组成，将编码网络生成的抽样表达解码并生成图像G(S)，其中图像G(S)的图像质量大于等于图像S的图像质量。

需要说明的，本说明书中所述的图像质量在不同的应用场景或实施例中可以有对应的确定的评价依据。本说明书的一些实施例中可以包括计算机对图像的一些参数进行数据计算得到的量化值，例如图像大小、像素个数、颜色、信噪比、锐化程度、灰度等。本说明书提供的一个实施例中，所述的图像质量至少可以包括分辨率这一参数。所述的分辨率通常指图像中存储的信息量，如每英寸图像内有多少个像素点，分辨率的单位为PPI(PixelsPer Inch)，可以叫做像素每英寸。

本说明书的另一些实施例中，具体的质量可以根据不同的质量评价要求或需求或标准进行设置和确定。例如一些实施例中可以针对图像的拍摄完整性、关照强度、模糊程度等来确定图像质量。或者可以从图像的像素统计、包含的信息内容或信息量、图像的结果等来确定图像质量法。或者可以从图像的信噪比、均方差、信息熵、结构失真度等来确定图像的质量等。当然，也可以结合上述的一种或多种参量来确定图像的质量。

图3中所示的图像S可以理解为相比解码网络的图像G(S)的图像质量较低的低质量图像，G(S)为生成网络生成的高质量图像，x为真实的高质量图像。在图3中，生成网络可以采用编码和解码的设计结构，编码网络包含多层卷积对输入低质量图S进行特征抽象表达，表达的特征图分辨率逐渐降低。解码网络是由多个反卷积或者上采样网络组成，将编码网络生成的抽样表达解码到一个高质量的图片G(S)。第二个是判别网络，用来区分生成网络生成的G(S)和真实的高质量图片X。判别网络采用成对的输入方式(S,G(S))和(S,X)，也就是说网络的目标是区分(S,G(S))和(S,X)。训练过程中产生两个损失函数：区分生成数据和真实数据类别信息的G-loss，以及反映二者像素级别区分度的D-loss。本实施例中采用的对抗训练模式可以实现少量样本训练得到输出图像质量更高的生成网络。在实际使用是，使用生成网络就可以将相对低质量理赔单据图像输入生成网络，得到相对高质量的增强后单据图像。

S6：利用光学字符识别方式识别所述增强后单据图像中的文字信息。

获得增强后单据图像后，可以利用光学字符识别(OCR)，自动提取单据上的文字信息，可以大幅提高工作效率。并且，本实施中OCR识别的图像为经过生成对抗网络进行图像质量增强处理后的图像，图像质量更好，可以有效提高字符识别准确率，进而提高在线理赔业务的处理效率。

本说明书所述方法的另一些实施例中，还可以对识别后的文字信息做进一步校验，以确定识别出的文字信息是否有效或者可用。若识别后确定识别处理的文字信息无效或不可用，可以及时的提醒用户重新拍摄或者转接人工处理，可以防止后续处理流程中发现文字信息无效等让用户重新拍摄单据的情况，可以提高用户体验以及提高在线理赔处理效率。具体的，本说明书提供的所述方法的另一个实施例中，所述方法还可以包括：

S80：按照预设方式确定识别出的所述文字信息的置信程度；

S82：若所述置信程度大于等于预设阈值，则确定从所述理赔单据中识别出的文字为所述文字信息。

所述的置信程度可以表示识别出的文字信息与增强后单据图像中的文字信息对应的可靠程度，可以是概率值的表征形式，也可以是划分的不同等级的表征形式，或者也可以是分值的表征形式等。计算所述置信程度的预设方式可以根据场景需要或业务需要进行设置，如采用一些有监督的机器学习算法(如随机森林、逻辑回归、贝叶斯网络等)对识别出的文字信息以及增强后单据图像进行处理，输出所述文字信息的置信程度(概率值)，或者另一些实施例这种对识别出的文字信息进行分词、关键词检测、语法分析等来确定其置信程度，或者将所述文字信息在指定的数据库中进行查询/匹配，确定其置信程度。若置信程度大于预先设定的预设阈值，则可以将所述文字信息作为从所述理赔单据中识别出来的有效、可用的文字信息。

如前所述，进一步的所述方法还可以包括：

S84：若所述置信程度小于所述预设阈值，则转人工处理或提示用户重新拍摄理赔单据图像。

例如若识别出的一段文字信息的置信程度为0.6，低于设定的预设阈值0.8，可以表示识别出来的文字信息可能存在排版错误或识别错误等，可靠性较低，不能作为在线理赔处理的文字信息内容来使用。图4是本说明书提供的所述方法另一个实施例的处理过程示意图，如图4所示，若置信程度低于预设阈值，此时可以及时的提醒用户重新拍摄或者转接人工处理，可以防止后续处理流程中发现文字信息无效等让用户重新拍摄单据的情况，可以提高用户体验以及提高在线理赔处理效率。

本说明书上述实施例可以通过在线拍摄单据+自动文字识别的方式对用户自助拍摄场景下采集的低质量图片进行增强，提高OCR识别准确率。本说明书的另一些实施例中，可以基于前述从理赔单据中获得的识别准确率更高的文字信息来进一步检验用户拍摄的理赔单据是否符合理赔要求，形成一个正向反馈，进而可以及时的辅助用户拍摄单据或者纠正用户的单据拍摄。具体的，本说明书提供的所述方法的另一个实施例中，所述方法还可以包括：

S100：根据识别出的所述文字信息判断拍摄的理赔单据是否符合理赔要求；

S102：根据判断结果，进行相应的理赔业务处理。

例如一个具体的应用场景中，根据文字信息得知拍摄的是车辆维修开具的发票，而当前车险理赔业务处理需要上传的是住院发票，因此根据识别出的文字信息可以判断用户当前拍摄的单据不符合理赔要求。此时可以在客户端展示提示信息，提示用户拍摄住院发票。或者在拍摄住院发票时，发现识别出的文字信息中没有保护“费用总计”的信息，此时可能是用户拍摄单据时距离较近，“费用总计”未显示在拍摄的取景框中。这种情况下也可以设置为不符合理赔要求，可以提示用户重新拍摄。当然，若符合理赔要求，则可以根据理赔业务处理流程相应的进行下一步处理操作。

本说明书提供的所述方法的另一个实施例中，所述根据识别出的所述文字信息判断拍摄的理赔单据是否符合理赔要求至少包括下述中的一种：

根据识别出的所述文字信息判断所述理赔单据上是否有遗漏的信息。例如上述所述的是否缺少“费用总计”，或者车辆维修单据中车辆的车牌号码或车牌号码不全等。

根据识别出的所述文字信息判断是否有遗漏的未拍摄理赔单据。例如人伤理赔中需要住院发票、医疗费用清单等多种多个发票，根据识别出的文字信息可知还缺少医疗费用清单的票据。此时，可以提示用户再对医疗费用情况的票据进行拍摄。

根据识别出的所述文字信息判断所述理赔单据的类型是否正确。例如在线理赔需要用户上传的为发票联，而用户上传的为记账联，则可以判断用户上传的单据类型存在错误。或者，需要用户上传住宿产生的增值税专用发票，而用户上传的是收取住宿费的收据，从而也可以判断理赔单据的类型不正确。

根据识别出的所述文字信息判断所述理赔单据上的理赔对象名称是否与理赔请求中的理赔的对象名称对应。所述的理赔对象可以根据具体的应用场景进行确定。例如车险事故中理赔请求中的理赔对象是受伤住院的姓名为“张甲”的人，而上传的理赔单据中的住院治疗的人的姓名为“张申”。本实施例中则可以识别出两者理赔对象不对应，可以要求重新拍摄单据，或者提示存在欺诈风险等。

例如图5所示的一个场景示意图，根据识别的文字信息发现拍摄的发票图像中没有开票人的信息，则可以在拍摄的取景窗口中实时展示出提示信息“图像不符合要求，缺少开票人信息，请重新拍摄”。

当然，其他的实施例中还可以包括其他的根据识别出的所述文字信息判断拍摄的理赔单据是否符合理赔要求的具体场景。根据识别出的文字信息进而判断用户拍摄的单据是否符合理赔要求，在不符合的情况下可以及时的提醒用户进行纠正、补充、重拍等，可以避免后续因单据拍摄问题造成的重新拍摄、信息识别错误等问题，提高理赔业务处理效率。结合拍摄引导信息，可以使用户快速清楚拍摄的单据哪里存在问题，以及指导用户快速、便捷的完成单据拍摄，提升了用户在线理赔业务使用体验和终端使用体验。

本说明书中上述方法的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。相关之处参见方法实施例的部分说明即可。

本说明书实施例提供的一种在线识别理赔单据中文字的方法，可以通过拍摄引导信息引导用户对单据信息拍摄。可以进一步的利用生成对抗网络对拍摄获取的理赔单据图像进行图像质量增强，提高理赔单据中文字识别的准确率。本说明书提供的实施例在保险理赔场景中，可以通过在线拍摄单据+自动文字识别的方式，提高理赔流程自动化处理过程，提高理赔处理效率。在识别处理过程中利用生成式对抗网络技术，对自助拍摄场景下采集的低质量图片进行增强，提高光学字符识别的识别准确率。本说明书实施例中利用生成式对抗网络技术，还可以减少训练模型所需的样本图像数量，并提高图像质量，使得终端设备的模型训练更加快速、便捷，模型训练和识别的处理效率更高。

本说明书实施例所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的运算装置中执行。以运行在智能手机客户端上为例，图6是应用本发明实施例的一种在线识别理赔单据中文字的方法的客户端的硬件结构框图。如图6所示，客户端10可以包括一个或多个(图中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输模块106。本领域普通技术人员可以理解，图6所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，客户端10还可包括比图6中所示更多或者更少的组件，例如还可以包括其他的处理硬件，如GPU(Graphics Processing Unit，图像处理器)，或者具有与图6所示不同的配置。

存储器104可用于存储应用软件的软件程序以及模块，如本发明实施例中的搜索方法对应的程序指令/模块，处理器102通过运行存储在存储器104内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的处理方法。存储器104可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器104可进一步包括相对于处理器102远程设置的存储器，这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输模块106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中，传输模块106包括一个网络适配器(Network Interface Controller，NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输模块106可以为射频(Radio Frequency，RF)模块，其用于通过无线方式与互联网进行通讯。

基于上述所述的在线识别理赔单据中文字的方法，本说明书还提供一种在线识别理赔单据中文字的装置。所述的装置可以包括使用了本说明书实施例所述方法的系统(包括分布式系统)、软件(应用)、模块、组件、服务器、客户端等并结合必要的实施硬件的设备装置。基于同一创新构思，本说明书提供的一种实施例中的处理装置如下面的实施例所述。由于装置解决问题的实现方案与方法相似，因此本说明书实施例具体的处理装置的实施可以参见前述方法的实施，重复之处不再赘述。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。具体的，如图7所示，图7是本说明书提供的可以用于用户客户端一侧的一种在线识别理赔单据中文字的装置实施例的模块结构示意图，具体的可以包括：

引导模块701，可以用于展示在线理赔所需单据的拍摄引导信息；

拍摄模块702，可以用于获取根据拍摄引导信息拍摄得到的理赔单据图像；

增强模块703，可以用于利用构建的生成对抗网络对所述理赔单据图像进行处理，得到增强后单据图像；

识别模块704，可以用于利用光学字符识别方式识别所述增强后单据图像中的文字信息。

基于前述方式实施例的描述，本说明书提供的所述装置的另一个实施例中，所述增强模块703构建的生成对抗网络中的生成网络采用编码网络和解码网络结构，其中编码网络包含多层卷积，用于对输入的图像S进行特征抽象表达，表达的特征图像分辨率逐渐降低；解码网络由多个反卷积或者上采样网络组成，将编码网络生成的抽样表达解码并生成图像G(S)，其中图像G(S)的图像质量大于等于图像S的图像质量。

基于前述方式实施例的描述，本说明书提供的所述装置的另一个实施例中，所述装置还可以包括：

置信度判别模块，可以用于按照预设方式确定识别出的所述文字信息的置信程度；以及在若所述置信程度大于等于预设阈值时，确定从所述理赔单据中识别出的文字为所述文字信息。

候选处理模块，可以用于在所述置信程度小于所述预设阈值时，转人工处理或提示用户重新拍摄理赔单据图像。

基于前述方式实施例的描述，本说明书提供的所述装置的另一个实施例中，所述的图像质量至少包括分辨率。

图8是本说明书提供的另一种在线识别理赔单据中文字的装置实施例的模块结构示意图。基于前述方式实施例的描述，本说明书提供的所述装置的另一个实施例中，所述装置还可以包括：

反馈模块705，可以用于根据识别出的所述文字信息判断拍摄的理赔单据是否符合理赔要求；以及，根据判断结果，进行相应的理赔业务处理。

基于前述方式实施例的描述，本说明书提供的所述装置的另一个实施例中，所述根据识别出的所述文字信息判断拍摄的理赔单据是否符合理赔要求至少包括下述中的一种：

根据识别出的所述文字信息判断所述理赔单据上是否有遗漏的信息；

根据识别出的所述文字信息判断是否有遗漏的未拍摄理赔单据；

根据识别出的所述文字信息判断所述理赔单据的类型是否正确；

根据识别出的所述文字信息判断所述理赔单据上的理赔对象名称是否与理赔请求中的理赔的对象名称对应。

本说明书实施例提供的一种在线识别理赔单据中文字的装置，可以通过拍摄引导信息引导用户对单据信息拍摄。可以进一步的利用生成对抗网络对拍摄获取的理赔单据图像进行图像质量增强，提高理赔单据中文字识别的准确率。本说明书提供的实施例在保险理赔场景中，可以通过在线拍摄单据+自动文字识别的方式，提高理赔流程自动化处理过程，提高理赔处理效率。在识别处理过程中利用生成式对抗网络技术，对自助拍摄场景下采集的低质量图片进行增强，提高光学字符识别的识别准确率。本说明书实施例中利用生成式对抗网络技术，还可以减少训练模型所需的样本图像数量，并提高图像质量，使得终端设备的模型训练更加快速、便捷，模型训练和识别的处理效率更高。

需要说明的是，本说明书实施例上述所述的装置，根据相关方法实施例的描述还可以包括其他的实施方式。具体的实现方式可以参照方法实施例的描述，在此不作一一赘述。

本说明书实施例提供的在线识别理赔单据中文字的方法或装置可以在计算机中由处理器执行相应的程序指令来实现，如使用windows操作系统的c++语言在PC端实现，或其他例如Linux、android、iOS系统相对应的应用设计语言集合必要的硬件实现，或者基于量子计算机的处理逻辑实现等。具体的，本说明书提供一种可以实现上述方法的单据拍摄交互处理设备的实施例，所述处理设备可以包括处理器以及用于存储处理器可执行指令的存储器，所述处理器执行所述指令时实现：

展示在线理赔所需单据的拍摄引导信息；

获取根据拍摄引导信息拍摄得到的理赔单据图像；

需要说明的是，本说明书实施例上述所述的处理设备，根据相关方法实施例的描述还可以包括其他的实施方式。具体的实现方式可以参照方法实施例的描述，在此不作一一赘述。

上述的指令可以存储在多种计算机可读存储介质中。所述计算机可读存储介质可以包括用于存储信息的物理装置，可以将信息数字化后再以利用电、磁或者光学等方式的媒体加以存储。本实施例所述的计算机可读存储介质有可以包括：利用电能方式存储信息的装置如，各式存储器，如RAM、ROM等；利用磁能方式存储信息的装置如，硬盘、软盘、磁带、磁芯存储器、磁泡存储器、U盘；利用光学方式存储信息的装置如，CD或DVD。当然，还有其他方式的可读存储介质，例如量子存储器、石墨烯存储器等等。下述所述的装置或服务器或客户端或系统中的指令同上描述。

基于前述所述，本说明书实施例还提供一种客户端，可以包括显示屏、拍摄装置、处理器以及存储处理器可执行指令的存储器。所述的显示屏可以包括触摸屏、液晶显示器、投影设备等显示信息内容的设备。所述的客户端类型可以包括移动终端、专用单据采集设备、车机交互设备、个人电脑等。

所述拍摄装置用于单据拍摄；

在所述显示屏中展示在线理赔所需单据的拍摄引导信息；

获取根据拍摄引导信息拍摄得到的理赔单据图像；

需要说明的是，本说明书实施例上述所述的客户端，根据相关方法实施例的描述还可以包括其他的实施方式。具体的实现方式可以参照方法实施例的描述，在此不作一一赘述。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于硬件+程序类实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

本说明书实施例提供的一种在线识别理赔单据中文字的方法、装置及客户端，可以通过拍摄引导信息引导用户对单据信息拍摄。可以进一步的利用生成对抗网络对拍摄获取的理赔单据图像进行图像质量增强，提高理赔单据中文字识别的准确率。本说明书提供的实施例在保险理赔场景中，可以通过在线拍摄单据+自动文字识别的方式，提高理赔流程自动化处理过程，提高理赔处理效率。在识别处理过程中利用生成式对抗网络技术，对自助拍摄场景下采集的低质量图片进行增强，提高光学字符识别的识别准确率。本说明书实施例中利用生成式对抗网络技术，还可以减少训练模型所需的样本图像数量，并提高图像质量，使得终端设备的模型训练更加快速、便捷，模型训练和识别的处理效率更高。

尽管本说明书实施例内容中提到生成对抗网络的模型结构、ORC算法、图像质量确定、文字信息判断等之类的数据获取、传输、交互、计算、判断等操作和数据描述，但是，本说明书实施例并不局限于必须是符合行业通信标准、机器学习标准模型、标准图像数据处理协议、通信协议和标准数据模型/模板或本说明书实施例所描述的情况。某些行业标准或者使用自定义方式或实施例描述的实施基础上略加修改后的实施方案也可以实现上述实施例相同、等同或相近、或变形后可预料的实施效果。应用这些修改或变形后的数据获取、存储、判断、处理方式等获取的实施例，仍然可以属于本说明书的可选实施方案范围之内。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray，FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等，目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、车载人机交互设备、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

虽然本说明书实施例提供了如实施例或流程图所述的方法操作步骤，但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式，不代表唯一的执行顺序。在实际中的装置或终端产品执行时，可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境，甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下，并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。

为了描述的方便，描述以上装置时以功能分为各种模块分别描述。当然，在实施本说明书实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现，也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

本领域技术人员应明白，本说明书的实施例可提供为方法、系统或计算机程序产品。因此，本说明书实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书实施例，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本说明书实施例的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

以上所述仅为本说明书实施例的实施例而已，并不用于限制本说明书实施例。对于本领域技术人员来说，本说明书实施例可以有各种更改和变化。凡在本说明书实施例的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本说明书实施例的权利要求范围之内。

Claims

1.一种在线识别理赔单据中文字的方法，所述方法包括：

展示在线理赔所需单据的拍摄引导信息；

获取根据拍摄引导信息拍摄得到的理赔单据图像；

2.如权利要求1所述的方法，所述构建的生成对抗网络中的生成网络采用编码网络和解码网络结构，其中编码网络包含多层卷积，用于对输入的图像S进行特征抽象表达，表达的特征图像分辨率逐渐降低；解码网络由多个反卷积或者上采样网络组成，将编码网络生成的抽样表达解码并生成图像G(S)，其中图像G(S)的图像质量大于等于图像S的图像质量。

3.如权利要求1所述的方法，所述方法还包括：

按照预设方式确定识别出的所述文字信息的置信程度；

若所述置信程度大于等于预设阈值，则确定从所述理赔单据中识别出的文字为所述文字信息。

4.如权利要求3所述的方法，所述方法还包括：

若所述置信程度小于所述预设阈值，则转人工处理或提示用户重新拍摄理赔单据图像。

5.如权利要求2所述的方法，其中，所述的图像质量至少包括分辨率。

6.如权利要求1所述的方法，所述方法还包括：

根据识别出的所述文字信息判断拍摄的理赔单据是否符合理赔要求；

根据判断结果，进行相应的理赔业务处理。

7.如权利要求6所述的方法，所述根据识别出的所述文字信息判断拍摄的理赔单据是否符合理赔要求至少包括下述中的一种：

8.一种在线识别理赔单据中文字的装置，所述装置包括：

引导模块，用于展示在线理赔所需单据的拍摄引导信息；

9.如权利要求8所述的装置，所述增强模块构建的生成对抗网络中的生成网络采用编码网络和解码网络结构，其中编码网络包含多层卷积，用于对输入的图像S进行特征抽象表达，表达的特征图像分辨率逐渐降低；解码网络由多个反卷积或者上采样网络组成，将编码网络生成的抽样表达解码并生成图像G(S)，其中图像G(S)的图像质量大于等于图像S的图像质量。

10.如权利要求8所述的装置，所述装置还包括：

置信度判别模块，用于按照预设方式确定识别出的所述文字信息的置信程度；以及在若所述置信程度大于等于预设阈值时，确定从所述理赔单据中识别出的文字为所述文字信息。

11.如权利要求10所述的装置，所述装置还包括：

候选处理模块，用于在所述置信程度小于所述预设阈值时，转人工处理或提示用户重新拍摄理赔单据图像。

12.如权利要求9所述的装置，所述的图像质量至少包括分辨率。

13.如权利要求8所述的装置，所述装置还包括：

反馈模块，用于根据识别出的所述文字信息判断拍摄的理赔单据是否符合理赔要求；以及，根据判断结果，进行相应的理赔业务处理。

14.如权利要求13所述的装置，所述根据识别出的所述文字信息判断拍摄的理赔单据是否符合理赔要求至少包括下述中的一种：

15.一种单据拍摄交互处理设备，包括处理器以及用于存储处理器可执行指令的存储器，所述处理器执行所述指令时实现：

展示在线理赔所需单据的拍摄引导信息；

获取根据拍摄引导信息拍摄得到的理赔单据图像；

16.一种客户端，包括显示屏、拍摄装置、处理器以及存储处理器可执行指令的存储器，所述拍摄装置用于单据拍摄；

在所述显示屏中展示在线理赔所需单据的拍摄引导信息；

获取根据拍摄引导信息拍摄得到的理赔单据图像；