CN111666868A

CN111666868A - 保险单识别方法、装置以及计算机设备

Info

Publication number: CN111666868A
Application number: CN202010493630.2A
Authority: CN
Inventors: 李树凯; 田强; 位双双; 姚灿; 张瑞楠; 赵泽通
Original assignee: Sunshine Life Insurance Co ltd; Sunshine Insurance Group Co Ltd
Current assignee: Sunshine Life Insurance Co ltd; Sunshine Insurance Group Co Ltd
Priority date: 2020-06-03
Filing date: 2020-06-03
Publication date: 2020-09-15

Abstract

本申请提供了一种保险单识别方法、装置以及计算机设备，涉及保险单识别技术领域，缓解了对于多种不同类型的保险单版面，保险单识别的准确度较低的技术问题。该方法包括：基于待识别保险单图像通过训练后的文本检测和识别模型得到所述待识别保险单图像中的保险单数据；将所述保险单数据中的字符与预设保险单类别关键字符进行匹配，根据匹配结果确定所述待识别保险单图像所属的保险单类型；基于所述保险单类型对应的预设标题字段匹配所述保险单识别数据，得到待识别保险单预设标题字段识别结果，匹配所有预设标题字段，最终得到整个保险单图像的识别结果。

Description

保险单识别方法、装置以及计算机设备

技术领域

本申请涉及文本识别技术领域，尤其是涉及一种保险单识别方法、装置以及计算机设备。

背景技术

目前，随着图像处理技术的不断发展，文字识别技术已广泛应用于对各种版面简单的证件识别，例如身份证、银行卡等。

现有的文字识别技术，针对版面简单的证件识别，有较高的准确率。但是，对于复杂多变的文本版面，识别准确率往往较低。在保险领域，保险单作为保险公司和客户之间的重要关系凭证，由于其信息量大，版面复杂，市面上难有一款针对保险单高识别准确率的光学字符识别(Optical Character Recognition，OCR)产品。

发明内容

本发明的目的在于提供一种保险单识别方法、装置以及计算机设备，以缓解对于多种不同类型的保险单版面，保险单识别的准确度较低的技术问题。

第一方面，本申请实施例提供了一种保险单识别方法，所述方法包括：

基于待识别保险单图像通过训练后的文本检测和识别模型得到所述待识别保险单图像中的保险单数据；

将所述保险单数据中的字符与预设保险单类别关键字符进行匹配，根据匹配结果确定所述待识别保险单图像所属的保险单类型；

基于所述保险单类型对应的预设标题字段匹配所述保险单数据，得到待识别保险单预设标题字段识别结果，匹配所有预设标题字段，最终得到整个保险单图像的识别结果。

在一个可能的实现中，所述方法还包括：

基于所述保险单类型对应的预设标题字段匹配保险单识别数据，如果识别数据是以表格形式存在，则需要进行表格数据分析，得到与所述预设标题字段相匹配的表格数据；

基于所述保险单类型对应的预设标题字段匹配保险单识别数据，如果识别数据是以表格形式存在，则需要进行表格数据分析，得到与所述预设标题字段相匹配的表格数据的步骤，包括：

如果与预设标题字段相匹配的数据是以表格的形式存在，则选取用于界定表格范围的基准坐标点，基于所述基准坐标点从所述保险单数据中确定位于所述表格范围内的多个表格数据；

分别对每个所述表格数据按照预设排列规则进行分割，得到多个纵列；

基于多个所述表格数据中相同主题的字段内容，将多个所述表格数据中所述纵列中的字段进行合并，得到目标表格；

将所述目标表格中的表头与字段进行对齐，得到最终表格数据；

基于所述最终表格数据，将预设标题字段与表格表头进行匹配，得到所述与预设标题字段相匹配的表格数据。

在一个可能的实现中，分别对每个所述表格数据按照预设排列规则进行分割，得到多个纵列的步骤，包括：

按照预设排列规则计算所述表格数据中每一个纵列基准框图的坐标点；

针对每个所述基准框图的坐标点，从所述表格数据的框图中确定坐标点差值小于预设差值的目标框图；

将所述目标框图确定为隶属于所述基准框图的目标纵列，基于多个所述目标纵列对所述表格数据的框图进行分割，得到多个纵列。

在一个可能的实现中，基于待识别保险单图像通过训练后的文本检测和识别模型得到所述待识别保险单图像中的保险单数据的步骤，包括：

通过训练后的倾斜文本检测模型对所述待识别保险单图像进行文字检测，得到所述待识别保险单图像中的文本位置；

基于所述文本位置对所述待识别保险单图像中的文本进行切分，将切分结果输入至训练后的文本识别模型，得到保险单数据；所述保险单数据包括字符位置以及与所述字符位置对应的字符内容。

在一个可能的实现中，将所述保险单数据中的字符与预设保险单类别关键字符进行匹配，根据匹配结果确定所述待识别保险单图像所属的保险单类型的步骤，包括：

将所述保险单数据中的字符与预设保险单类别关键字符进行匹配，得到相同字符数量；

如果所述相同字符数量大于预设数量，则确定所述待识别保险单图像中的保险单属于所述预设保险单类别关键字符对应的保险单类型。

在一个可能的实现中，基于所述保险单类型对应的预设标题字段匹配所述保险单数据，得到待识别保险单预设标题字段识别结果，最终得到整个保险单图像的识别结果的步骤，包括：

基于所述保险单类型对应的预设标题字段以及预设匹配字符数量，在所述保险单数据中进行文本查找，得到与所述预设标题字段相匹配的目标保险单数据；所述预设字符数量为所述预设标题字段对应待识别的最少字符数量；

匹配所有预设标题字段，最终得到整个保险单图像的识别结果。

在一个可能的实现中，基于所述保险单类型对应的预设标题字段以及预设匹配字符数量，在所述保险单数据中进行文本查找，得到与所述预设标题字段相匹配的目标保险单数据的步骤，包括：

基于所述保险单类型对应的预设标题字段以及预设字符数量，在所述保险单数据中进行文本查找，得到一个或多个与预设标题字段相匹配的目标保险单数据；

根据上述得到的一个或多个所述目标保险单数据的位置坐标信息，确定与所述预设标题字段对应的目标字符内容，将所述目标字符内容作为目标保险单预设标题字段匹配结果。

第二方面，提供了一种保险单识别装置，包括：

获取模块，用于基于待识别保险单图像通过训练后的文本检测和识别模型得到所述待识别保险单图像中的保险单数据；

匹配模块，用于将所述保险单数据中的字符与预设保险单类别关键字符进行匹配，根据匹配结果确定所述待识别保险单所属的保险单类型；

识别模块，用于基于所述保险单类型对应的预设标题字段匹配所述保险单数据，得到待识别保险单预设标题字段识别结果，匹配所有预设标题字段，最终得到整个保险单图像的识别结果。

第三方面，本申请实施例又提供了一种计算机设备，包括存储器、处理器，所述存储器中存储有可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述的第一方面所述方法。

第四方面，本申请实施例又提供了一种计算机可读存储介质，所述计算机可读存储介质存储有机器可运行指令，所述计算机可运行指令在被处理器调用和运行时，所述计算机可运行指令促使所述处理器运行上述的第一方面所述方法。

本申请实施例带来了以下有益效果：

本申请实施例提供的一种保险单识别方法、装置以及计算机设备，能够基于待识别保险单图像通过训练后的文本检测和识别模型得到待识别保险单图像中的保险单数据，然后，将保险单数据中的字符与预设保险单类别关键字符进行匹配，根据匹配结果确定待识别保险单所属的保险单类型，之后，基于保险单类型对应的预设标题字段匹配保险单识别数据，得到待识别保险单预设标题字段识别结果，最终得到整个保险单图像的识别结果，本方案中，通过将保险单数据中的字符与预设保险单类别关键字符进行匹配，根据匹配结果确定待识别保险单所属的保险单类型，再基于保险单类型对应的预设标题字段匹配保险单识别数据，得到待识别保险单预设标题字段识别结果，能够针对不同类型的保险单进行更具针对性更加精确的保险单识别，可以应对多种不同类型版式，缓解了对于多种不同类型的保险单版面，保险单识别的准确度较低的技术问题。

为使本申请的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本申请具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的保险单识别方法的流程示意图；

图2为本申请实施例提供的保险单识别方法的另一流程示意图；

图3为本申请实施例提供的保险单识别方法中，数组形式保险单数据的一个示例；

图4为本申请实施例提供的泰康保险单表格数据的一个示例；

图5为本申请实施例提供的保险单识别方法中，表格中纵列情况的一个示例；

图6为本申请实施例提供的一种保险单识别装置的结构示意图；

图7为示出了本申请实施例所提供的一种计算机设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合附图对本申请的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例中所提到的术语“包括”和“具有”以及它们的任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括其他没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

目前，针对版面复杂多变的保险单，由于版面信息复杂多变，提取其中的信息并结构化输出是一项技术难题，识别准确率往往较低。例如，保险单作为保险公司信息凭证，由于各保险公司版式不同，导致内容信息复杂，目前没有现成产品和技术方案来识别不同保险单内容。

基于此，本申请实施例提供了一种保险单识别方法、装置以及计算机设备，通过该方法可以缓解对于多种不同类型的保险单版面，保险单识别的准确度较低的技术问题。

下面结合附图对本发明实施例进行进一步地介绍。

图1为本申请实施例提供的一种保险单识别方法的流程示意图。如图1所示，该方法包括：

步骤S110，基于待识别保险单图像通过训练后的文本检测和识别模型得到待识别保险单图像中的保险单数据。

其中，待识别保险单图像可以为带有任何形式保险单的图像。如图2所示，可以将待识别图片输入至保险单的文本检测及识别模型，以对待识别图片进行保险单文本检测及识别。

步骤S120，将保险单数据中的字符与预设保险单类别关键字符进行匹配，根据匹配结果确定待识别保险单图像所属的保险单类型。

如图2所示，在对待识别图片进行保险单文本检测及识别之后，可以对待识别图片中的保险单进行保险单分类。

步骤S130，基于保险单类型对应的预设标题字段匹配保险单数据，得到待识别保险单预设标题字段识别结果，匹配所有预设标题字段，最终得到整个保险单图像的识别结果。

其中，保险单数据可以为任何形式的文本，如字段、表格等。如图2所示，可以利用预设标题字段查找以及分析表格，以输出保单识别结果。

将保险单数据中的字符与预设保险单类别关键字符进行匹配，根据匹配结果确定待识别保险单所属的保险单类型，再基于保险单类型对应的预设标题字段匹配保险单识别数据，得到待识别保险单预设标题字段识别结果，最终得到整个保险单图像的识别结果，能够针对不同类型的保险单进行文本识别，可以应对复杂版式的保险单且实现简洁易于扩展的保险单识别方法。

本申请实施例提供的保险单识别方法可以作为一种保险单的自动识别方法，本申请实施例可以支持不同公司不同版式的保险单识别，以下以某人寿保险单识别为例进行说明。

下面对上述步骤进行详细介绍。

在一些实施例中，上述步骤S110可以包括如下步骤：

步骤a)，通过训练后的倾斜文本检测模型对待识别保险单图像进行文字检测，得到待识别保险单图像中的文本位置；

步骤b)，基于文本位置对待识别保险单图像中的文本进行切分，将切分结果输入至训练后的文本识别模型，得到保险单数据；保险单数据包括字符位置以及与字符位置对应的字符内容。

示例性的，可以将保险单输入到倾斜文本检测模型中，确定图片中文本位置，例如通过框图确定图片中文本位置。

接下来，将每个框图从图片中切出，并输入到识别模型，返回结果分别保存到数组pic_Point和pic_Content，其中pic_Point中存放的为框图文本位置信息，pic_Content为存放的对应框图的识别内容。

下面以框图中文字为泰康人寿保险有限责任公司为例，数据存放形式如图3所示，框图位置信息和内容在数组中的顺序是一一对应的。合并两个数组为一个数组yx_val_sort，数组中的数据格式为[198，294，38，78，‘泰康人寿保险有限责任公司’]，其中数组的排列顺序是按框图纵坐标y值从小到大进行排序。

通过训练后的倾斜文本检测模型和训练后的文本识别模型，利用了基于深度学习的文本检测模型以及文本识别模型可以达到较高的文本框检测准确率和文本识别准确率，且可以通过增加训练样本不断优化模型进一步提高准确率。

在一些实施例中，上述步骤S120可以包括如下步骤：

步骤c)，将保险单数据中所识别的字符内容与预设保险单类别关键字符进行匹配，得到相同字符数量；

步骤d)，如果相同字符数量大于预设数量，则确定待识别保险单图像中的保险单属于预设保险单类别关键字符对应的保险单类型。

由于不同公司对应的保单版面差异较大，因此，保险单识别首先要区分保险单种类归属。下面继续以泰康人寿保险单为例，由于上述步骤中已经识别出整张保险单框图内容，框图坐标信息及内容保存在数组yx_val_sort，以‘泰康人寿’为关键字，遍历yx_val_sort进行弱匹配(匹配到的相同字符数大于等于3，即认为匹配到)，如果匹配的字符数满足匹配规则，即认为此张保险单种类归属为泰康人寿公司保险单，如果匹配失败，则认为保单种类未识别，此时返回保单内容为空。

如果保险单类型匹配到为泰康人寿，则相应的泰康人寿配置文件也已确定，配置文件数据存储是以json格式进行存储。在泰康人寿配置文件中，可以根据实际需求配置需要获取的保单信息内容。以获取保险单‘投保人姓名’为例，可以做如下配置：“key”：“投保人姓名”，“right_chars_num”：4。其中，key为需要匹配的字段信息，right_chars_num为识别此字段信息所需识别的最少字符个数。

在一些实施例中，上述步骤S130可以包括如下步骤：

步骤e)，基于保险单类型对应的预设标题字段以及预设匹配字符数量，在保险单数据中进行文本查找，得到与预设标题字段相匹配的目标保险单数据；预设字符数量为预设标题字段对应待识别的最少字符数量；

步骤f)，匹配所有预设标题字段，最终得到整个保险单图像的识别结果。

例如，字段信息类似于‘投保人姓名：XXX’，是以key-value形式存在的，这种字段的形式可以直接通过预设标题字段匹配的方式进行内容查找。

通过基于预设标题字段以及预设标题字段对应待识别的最少字符数量在保险单数据中进行文本查找，从而得到与预设标题字段相关的目标保险单数据，可以使查找到的目标保险单数据准确性得到提高。

在一些实施例中，上述步骤e)可以包括如下步骤：

步骤g)，基于保险单类型对应的预设标题字段以及预设字符数量，在保险单数据中进行文本查找，得到一个或多个与预设标题字段相匹配的目标保险单数据；

步骤h)，根据上述得到的一个或多个目标保险单数据的位置坐标信息，确定与预设标题字段对应的目标字符内容，将目标字符内容作为目标保险单预设标题字段匹配结果。

例如，‘投保人姓名：XXX’作为一个完整文本框被检测及识别存放在数组yx_val_sort，如果配置文件配置了‘投保人姓名’，相应的会去数组yx_val_sort中查询满足匹配规则的文本框，由于配置文件中设置的right_chars_num值为4，因此遍历yx_val_sort后，有两个文本框满足匹配规则，这两个文本框分别为[68，305，38，55，‘投保人姓名：XXX’]和[75，365，39，75，‘被保险人姓名：YYY’]，根据图3中投保人姓名及被保险人姓名竖向坐标信息，可得出只有[68，305，38，55，‘投保人姓名：XXX’]满足要求。以‘：’作为字符串分隔符，将分隔符右侧的‘XXX’作为投保人姓名信息返回。

通过根据一个或多个目标字符位置的坐标信息，从多个保险单数据中的字符内容中，确定与预设标题字段对应的目标字符内容，利用了更加精确的坐标，能够使确定目标字符内容的过程更加精确。

在一些实施例中，该方法还可以包括如下步骤：

基于保险单类型对应的预设标题字段匹配保险单识别数据，如果识别数据是以表格形式存在，则需要进行表格数据分析，得到与预设标题字段相匹配的表格数据。该步骤还可以包括如下具体步骤：

步骤i)，如果与预设标题字段相匹配的数据是以表格的形式存在，则选取用于界定表格范围的基准坐标点，基于基准坐标点从保险单数据中确定位于表格范围内的多个表格数据；

步骤j)，分别对每个表格数据按照预设排列规则进行分割，得到多个纵列；

步骤k)，基于多个表格数据中相同主题的字段内容，将多个表格数据中纵列中的字段进行合并，得到目标表格；

步骤m)，将目标表格中的表头与字段进行对齐，得到最终表格数据；

步骤n)，基于最终表格数据，将预设标题字段与表格表头进行匹配，得到与预设标题字段相匹配的表格数据。

例如，对于以表格形式存在的‘泰康鑫福年金保险产品计划’信息内容，这就需要完善的表格分析以提取保单信息。

由于表格文字涉及字段拼接，要想获取表格中的对应信息是一项比较复杂的过程。本申请实施例提出了自适应表格分析方法，可以适用情况复杂多变的表格分析，具体表格分析过程如下：

首先，选取基准坐标点界定表格上下范围，如图5所示，其中基准坐标点为A、B、C，对应图4中‘泰康鑫福年金保险产品计划’、‘保险费’、‘保险费合计’，遍历yx_val_sort，匹配到满足条件的框图，并返回相应框图坐标[X_A，Y_A，H_A，W_A]、[X_B，Y_B，H_B，W_B]、[X_C，Y_C，H_C，W_C]，连接A、B两框图中心点，形成直线line1，line1的直线方程为：

Bias1＝Y_A-gradient*X_A+delta1；

其中，gradient＝float(Y_B-Y_A)/float(X_B-X_A)，delta1为上下移动的裕度，此值由保险单种类决定，主要目的是排除干扰框图，例如‘档次/日额(元/天)’，其不属于表格范围内。

以框图C为中心点，求取平行于line1的直线line2，line2的直线方程为：

Bias2＝Y_C–gradient*X_C–delta2；

遍历yx_val_sort，求取所有位于line1和line2之间的框图集合，设为Dic_Set。

接下来，对表格按列分割。不同类型保单，列的对齐方式不尽相同，因此，针对不同类型保单需要在配置文件中率先配置好表格数据中不同列的对齐方式。以图5中的框图分布情况为例，表格可以分为3列，其中第一列框图是按左对齐排列(即表格中的第一列数据是按框图最左侧对齐方式排列)，第二列框图是按中对齐排列(即表格中的第二列数据是按框图中心点对齐方式排列)，第三列框图是按右对齐排列(即表格中的第三列数据是按框图最右侧对齐方式排列)，通过表格按列分割算法，对配置好的表格进行按列分割，将按列分割后的数据存放在New_Dic_Set中。

对表格数据按列分割之后，需要对分割的列进行合并字段处理，由于险种名称的长短不一致，可能出现多框合并才能描述一个险种名称的情况，同样在保险期间一列，也存在此类情况，因此，需要进行多框合并处理。但是由于机器不能像人一样，可以根据上下文关系来确定需要合并的框图，框图合并也是OCR识别版面分析的一个难点，本申请实施例基于保单特点，提出了一种框图合并算法，该框图合并算法流程如下：

首先，确定基准列。针对每一个险种，‘保险费’和险种是一一对应的，而‘保险费’由于数据较为简单，不存在换行情况，因此保险费框图个数是确定的，而‘险种名称’、‘保险期间’等由于保单版面的原因，存在不同程度的换行，每一列的框图个数是不定的，因此可以选‘保险费’列作为标准列，其他列框图合并均以此列作为标准进行处理。

其次，计算New_Dic_Set中需要合并的列。以‘保险费’作为基准列，该列中框图的数量为3，遍历New_Dic_Set中所有列，如果列的框图大于3，则该列中存在需要合并的框图，以图4为例，需要合并的列为第一、二两列，即‘险种名称’和‘保险期间’列需要合并，其他它列不需要合并。

然后，合并险种名称列(一般为第一列)。观察图4发现，‘险种名称’列每个险种均以‘泰康’作为开头，因此只需要遍历‘保险名称’列框图，如果以‘泰康’开头，则记录其在该列中索引，由此可以得到索引列表[1，2，4]，由于‘保险名称’列为5个框图，因此由索引列表和框图个数可以得出，框图3需要合并到2中组成一个完整的险种名称，同理框图5需要合并到4组成一个完成的险种名称。

最后，合并其它列。图4中，除‘险种名称’列之外，‘保险期间’列也需要合并，由于‘保险期间’列没有明显的合并标识，其合并的规则如下：

分别取‘险种名称’列和‘保险期间’列第一个框图中心点坐标，求取两中心点连线斜率，记为gradient。以上述求取的‘险种名称’列索引[1，2，4]为基准，分别求取过框图2和4，斜率为gradient的直线line1、line2，在‘保险期间’列求取与line1和line2竖向距离最近的框图索引，由图4可知索引为4和5，由此可知保险期间列索引为[1，4，5]，由于保险期间列框图个数为5，所以框图2和3需要合并到1中，框图4和5不做处理。

通过上述过程，已经将表格按列分割，并完成字段合并，接下来需要完成表格的表头与内容的对齐，具体对齐过程如下：

匹配表头信息，针对表头中的每一项，遍历yx_val_sort，匹配出相应的框图信息，例如针对‘交费期间’，匹配出‘交费期间’框图信息为[cx,cy,h,w,‘交费期间’]；

匹配表格列信息，针对‘交费期间’，其框图横坐标为cx，遍历New_Dic_Set中每一列第一个框图的横坐标X_i，计算value＝abs(X_i-cx)的最小值，并返回其对应i值，则第i列就为表头‘交费期间’对应列索引，第i列信息即为表头‘交费期间’对应的内容。

通过上述针对表格数据的分割、合并、对齐等过程，可以得到最终表格数据，通过配置预设标题字段，可以得到预设标题字段匹配的表格数据内容。

在一些实施例中，上述步骤j)可以包括如下步骤：

步骤o)，按照预设排列规则计算表格数据中每一个纵列基准框图的坐标点；

步骤p)，针对每个基准框图的坐标点，从表格数据的框图中确定坐标点差值小于预设差值的目标框图；

步骤q)，将目标框图确定为隶属于基准框图的目标纵列，基于多个目标纵列对表格数据的框图进行分割，得到多个纵列。

例如，如图5所示，先求取其中的基准坐标点，遍历Dic_Set中框图，求取框图中心点(cx,cy)之和最小的框图，以此框图作为基准框图，按照框图对齐排列规则，求取基准点Base_X。如果是左对齐，基准点Base_X为基准框图左上角点横坐标，如果是中对齐，基准点Base_X为基准框图中心点横坐标，如果是右对齐，基准点Base_X为基准框图右上角点横坐标。

接下来，以基准坐标点为基础分列。对于图5中第一列，计算出基准框图为A1,由于图5中第一列配置的为左对齐，其基准点值为A1的左上角点横坐标，遍历Dic_Set中每一个框图，求取其左上角点横坐标x与Base_X之间的差值Value，如果Value值小于w/2(w为框图的宽度)，则此框图和基准框图A1为同一列，由此可以求出A2、A3、A4、A5和A1为同一列。将A1、A2、A3、A4、A5作为新的一列存入New_Dic_Set中，然后在Dic_Set中将A1、A2、A3、A4、A5排除，形成新的Dic_Set。

重复上述步骤，便可将Dic_Set所有框图按列分割，数据存在New_Dic_Set。

通过预设排列规则、基准框图的坐标点、坐标点差值小于预设差值的目标框图来确定隶属于基准框图的目标纵列，再基于多个目标纵列对表格数据的框图分割出多个纵列，可以使纵列的分割位置更加准确、精确。

图6提供了一种保险单识别装置的结构示意图。如图6所示，保险单识别装置600包括：

获取模块601，用于基于待识别保险单图像通过训练后的文本检测和识别模型得到待识别保险单图像中的保险单数据；

匹配模块602，用于将保险单数据中的字符与预设保险单类别关键字符进行匹配，根据匹配结果确定待识别保险单图像所属的保险单类型；

识别模块603，用于基于保险单类型对应的预设标题字段匹配保险单数据，得到待识别保险单预设标题字段识别结果，匹配所有预设标题字段，最终得到整个保险单图像的识别结果。

在一些实施例中，获取模块601具体用于：

通过训练后的倾斜文本检测模型对待识别保险单图像进行文字检测，得到待识别保险单图像中的文本位置；

基于文本位置对待识别保险单图像中的文本进行切分，将切分结果输入至训练后的文本识别模型，得到保险单数据；保险单数据包括字符位置以及与字符位置对应的字符内容。

在一些实施例中，匹配模块602具体用于：

将保险单数据中所识别的字符内容与预设保单类别关键字进行匹配，得到相同字符数量；

如果相同字符数量大于预设数量，则确定待识别保险单图像中的保险单属于预设保险单类别关键字符对应的保险单类型。

在一些实施例中，识别模块603具体用于：

基于保险单类型对应的预设标题字段以及预设匹配字符数量，在保险单数据中进行文本查找，得到与预设标题字段相匹配的目标保险单数据；预设字符数量为预设标题字段对应待识别的最少字符数量；

在一些实施例中，识别模块603还用于：

基于保险单类型对应的预设标题字段以及预设字符数量，在保险单数据中进行文本查找，得到一个或多个与预设标题字段相匹配的目标保险单数据；

根据上述得到的一个或多个目标保险单数据的位置坐标信息，确定与预设标题字段对应的目标字符内容，将目标字符内容作为目标保险单预设标题字段匹配结果。

在一些实施例中，该装置还包括：

选取模块，用于基于所述保险单类型对应的预设标题字段匹配保险单识别数据，如果识别数据是以表格形式存在，则需要进行表格数据分析，得到与所述预设标题字段相匹配的表格数据；

该选取模块具体用于：

如果与预设标题字段相匹配的数据是以表格的形式存在，则选取用于界定表格范围的基准坐标点，基于基准坐标点从保险单数据中确定位于表格范围内的多个表格数据；

分别对每个表格数据按照预设排列规则进行分割，得到多个纵列；

基于多个表格数据中相同主题的字段内容，将多个表格数据中纵列中的字段进行合并，得到目标表格；

将目标表格中的表头与字段进行对齐，得到最终表格数据；

基于最终表格数据，将预设标题字段与表格表头进行匹配，得到与预设标题字段相匹配的表格数据。

在一些实施例中，识别模块603具体用于：

按照预设排列规则计算表格数据中每一个纵列基准框图的坐标点；

针对每个基准框图的坐标点，从表格数据的框图中确定坐标点差值小于预设差值的目标框图；

将目标框图确定为隶属于基准框图的目标纵列，基于多个目标纵列对表格数据的框图进行分割，得到多个纵列。

本申请实施例提供的保险单识别装置，与上述实施例提供的保险单识别方法具有相同的技术特征，所以也能解决相同的技术问题，达到相同的技术效果。

如图7所示，本申请实施例提供的一种计算机设备700，包括：处理器701、存储器702和总线，所述存储器702存储有所述处理器701可执行的机器可读指令，当计算机设备运行时，所述处理器701与所述存储器702之间通过总线通信，所述处理器701执行所述机器可读指令，以执行如上述保险单识别方法的步骤。

具体地，上述存储器702和处理器701能够为通用的存储器和处理器，这里不做具体限定，当处理器701运行存储器702存储的计算机程序时，能够执行上述保险单识别方法。

处理器701可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器701中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器701可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(DigitalSignal Processing，简称DSP)、专用集成电路(Application Specific IntegratedCircuit，简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器702，处理器701读取存储器702中的信息，结合其硬件完成上述方法的步骤。

对应于上述保险单识别方法，本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有机器可运行指令，所述计算机可运行指令在被处理器调用和运行时，所述计算机可运行指令促使所述处理器运行上述保险单识别方法的步骤。

本申请实施例所提供的保险单识别装置可以为设备上的特定硬件或者安装于设备上的软件或固件等。本申请实施例所提供的装置，其实现原理及产生的技术效果和前述方法实施例相同，为简要描述，装置实施例部分未提及之处，可参考前述方法实施例中相应内容。所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，前述描述的系统、装置和单元的具体工作过程，均可以参考上述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的实施例中，应该理解到，所揭露装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

再例如，附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请提供的实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述保险单识别方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，简称ROM)、随机存取存储器(Random Access Memory，简称RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释，此外，术语“第一”、“第二”、“第三”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

最后应说明的是：以上所述实施例，仅为本申请的具体实施方式，用以说明本申请的技术方案，而非对其限制，本申请的保护范围并不局限于此，尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本申请实施例技术方案的范围。都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

1.一种保险单识别方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

3.根据权利要求2所述的方法，其特征在于，分别对每个所述表格数据按照预设排列规则进行分割，得到多个纵列的步骤，包括：

4.根据权利要求1所述的方法，其特征在于，基于待识别保险单图像通过训练后的文本检测和识别模型得到所述待识别保险单图像中的保险单数据的步骤，包括：

5.根据权利要求1所述的方法，其特征在于，将所述保险单数据中的字符与预设保险单类别关键字符进行匹配，根据匹配结果确定所述待识别保险单图像所属的保险单类型的步骤，包括：

将所述保险单数据中所识别的字符内容与预设保单类别关键字进行匹配，得到相同字符数量；

6.根据权利要求1所述的方法，其特征在于，基于所述保险单类型对应的预设标题字段匹配所述保险单数据，得到待识别保险单预设标题字段识别结果，匹配所有预设标题字段，最终得到整个保险单图像的识别结果的步骤，包括：

基于所述保险单类型对应的预设标题字段以及预设匹配字符数量，在所述保险单数据中进行文本查找，得到与所述预设标题字段相匹配的目标保险单数据；所述预设匹配字符数量为所述预设标题字段对应待识别的最少字符数量；

7.根据权利要求1所述的方法，其特征在于，基于所述保险单类型对应的预设标题字段以及预设匹配字符数量，在所述保险单数据中进行文本查找，得到与所述预设标题字段相匹配的目标保险单数据的步骤，包括：

8.一种保险单识别装置，其特征在于，包括：

匹配模块，用于将所述保险单数据中的字符与预设保险单类别关键字符进行匹配，根据匹配结果确定所述待识别保险单图像所属的保险单类型；

9.一种计算机设备，包括存储器、处理器，所述存储器中存储有可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现上述权利要求1至7任一项所述的方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有机器可运行指令，所述计算机可运行指令在被处理器调用和运行时，所述计算机可运行指令促使所述处理器运行所述权利要求1至7任一项所述的方法。