CN108109680A

CN108109680A - 一种保险理赔影像包分拣的方法

Info

Publication number: CN108109680A
Application number: CN201711379644.6A
Authority: CN
Inventors: 李进文; 张成栋; 严京旗; 罗宝娟
Original assignee: Nantong Wisdom Intelligent Technology Co Ltd
Current assignee: Nantong Wisdom Intelligent Technology Co Ltd
Priority date: 2017-12-20
Filing date: 2017-12-20
Publication date: 2018-06-01

Abstract

本发明涉及一种保险理赔影像包分拣的方法，所述方法包括如下步骤：步骤110获取影像包中每个影像的图像数据；步骤120对影像图像进行特征检测和识别，得到当前影像所属的类标签；步骤130根据步骤120中得到的类别标签，将当前影像存储到相应的类别集合中。本发明在对影像图像稳定的局部文本或图案特征进行检测和识别的时候，利用识别成功特征的位置信息和相对距离获得特征的邻域目标，通过判断邻域目标是否为设定目标，从而得到准确的影像类别。本方法只提取每个影像稳定的局部特征及其邻域信息加以分析，既提高了分拣的速率也提高了分拣的准确率。

Description

一种保险理赔影像包分拣的方法

技术领域

本发明属于目标检测和图像识别技术领域，具体涉及一种保险理赔影像包分拣的方法。

背景技术

通常，保险公司或医疗保险第三方管理公司（Third Party Administrator forGroup Medical Insurance，简称TPA）收到投保客户的纸质物理件后，需要进行登记、审核、理件，然后进行扫描、定义分拣、录入。在扫描结束到定义分拣之前投保客户的理赔材料成为了一个个独立的影像包。一般，这些影像包由医疗收据、就诊病历、住院清单、身份证复印件、理赔申请书、银行卡复印件，单位证明等多种个人理赔信息组成。目前从登记到定义分拣大约需要1天工时，占据了30%的理赔时效，大量的人力和时间花费在定义及分拣上，并且影响终端客户的理赔体验。

将同类影像从影像包中分拣出来的技术，目前已有应用，比如使用Googletensorflow中对Cifar-10数据集进行分类，利用CNN卷积神经网络（由卷积层、池化层、全连接层组成，通过梯度下降法对参数进行训练），这种神经网络的方法通过多个卷积滤波器提取影像特征，达到影像分类效果。对于特征不显著的非同类影像，比如同一地区的门急诊与住院医疗票据影像，由于影像中文本存在前后两次打印的情况。同时，第二次打印的内容、格式、位置无规律，这种分拣识别方法常常将两者误分。对这种包含变化特征分布的影像仍然可以依据一些特定且稳定的线索来辅助判断影像的归属，提高影像分类的准确性，保证分拣的准确率。

发明内容

本发明提供一种保险理赔影像包分拣的方法以解决目前分拣识别的方法不能对无规律的票据影像进行准确分拣的弊端进行改进。

本发明的具体技术方案如下：

一种保险理赔影像包分拣的方法，该方法按照以下步骤：

步骤110，获取影像包中一个影像的图像数据；

步骤120，对影像图像进行特征检测和识别，得到当前影像所属的类标签；

步骤130，根据步骤120中得到的类别标签，将当前影像存储到相应的类别集合中。

步骤140，结束。

进一步，所述步骤110获取图像数据的方法可为以下方法之一：

方法1、用数码相机拍摄得到的图像数据；

方法2、用手机拍摄得到的图像数据；

方法3、用扫描仪得到的图像数据；

方法4、打开一个预先存在的包含影像图像数据的文件，读取该文件中的数据并按照标准算法解压后得到的图像数据。

进一步，所述步骤120具体包括如下步骤：

步骤210，加载Adaboost、svm模型文件，类别标签k初始设置为0；

步骤220，判断类别标签k是否小于N，如果是，则进入步骤230，如果否，转入步骤280，所述N为影像类别的种类；

步骤230，图像预处理；每一类别的影像图像的质量、尺寸以及局部特征不一样，在利用执行Adaboost检测特征之前，先进行图像预处理；

步骤240，对k特征进行Adaboost检测特征，判断是否有候选目标，如果有，则进入步骤250，如果否，类别标签k加1，即遍历下一种类别的影像，转入步骤220，所述k特征为类别标签k对应影像的特征；

步骤250，对k特征进行svm识别，判断是否识别成功，如果是，则进入步骤260，如果否，类别标签k加1，转入步骤220；

步骤260，基于相对距离定位预定目标，使用svm判断预定目标是否存在，如果是，则进入步骤270，如果否，类别标签k加1，转入步骤220；

步骤270，当前影像找到分类类别标签，返回类别标签，结束；

步骤280，N类别影像特征遍历完成，结束。

进一步，所述步骤210中，Adaboost特征检测模型文件的产生具体包括如下步骤：

步骤310，制作正负样本及其标签，生成正负样本描述文件；

步骤320，Adaboost训练，直至虚警为0，结束训练；

进一步，所述步骤210中svm特征识别模型文件的产生具体包括如下步骤：

步骤410，制作特征和噪声样本及其标签；

步骤420，svm训练。

进一步，所述步骤230中，图像预处理主要包括以下四步：1、旋转矫正；2、亮度均衡化；3、尺寸归一化；4、感兴趣区域ROI粗定位。

本发明的有益效果如下：

1、利用Adaboost直接检测保险理赔影像图像中稳定的局部文本或图案特征，增大了类别区分度，利用svm识别特征确定影像含义，从而提高分拣的准确率。

2、在检测和识别影像图像特征时，同时得到了特征的位置信息，通过相对距离计算邻域预定的目标并进行识别，结合识别结果进行反馈校验，进一步确认了当前影像所属的类别。

3、与常见的全图像特征提取分类相比，本发明只检测每个影像的局部稳定的特征及其识别成功特征的邻域信息加以分析，显著提高了分拣的速度。

附图说明

图1为离线训练特征检测器模型流程图；

图2为离线训练识别器模型的流程图；

图3为本发明影像包分拣方法的流程图；

图4为特征检测与识别在线工作的流程图。

具体实施方式

以下结合附图及实施例对本发明的技术方案进行详细的描述：

实施例一

如图1所示，本发明提出了一种保险理赔影像包分拣的方法，所述方法包括如下步骤：

步骤110：获取影像包中一个影像的图像数据。所述获取影像图像数据的方法可以为以下方法之一：一是用数码相机拍摄得到的图像数据；二是用手机拍摄得到的图像数据；三是用扫描仪得到的图像数据；四是打开一个预先存在的包含影像图像数据的文件，读取该文件中的数据并按照标准算法解压后得到的图像数据。

步骤120：对影像图像进行特征检测和识别，得到当前影像所属的类标签；

如图2所示，步骤120具体包括如下步骤：

步骤210，加载Adaboost、svm模型文件，类别标签k初始设置为0；

影像图像进行特征检测和识别用到机器学习中监督学习技术，因此需要训练检测和识别的模型。

Adaboost特征检测模型文件的产生步骤图3所示，具体包括如下步骤：

步骤310，制作正负样本及其标签，生成正负样本描述文件；其中正样本：为影像图像的局部特征；负样本：不包含正样本的影像图像；正负样本的描述文件：指定了尺寸以及有效区域。

步骤320，Adaboost训练，直至虚警为0，结束训练；svm特征识别模型文件的产生步骤如图4所示，具体包括如下步骤：

步骤410，制作特征和噪声样本及其标签；

步骤420，svm训练，模型文件的训练均在离线阶段完成。

步骤220，判断类别标签k是否小于N，所述N为影像类别的种类，如果是，则进入步骤230，如果否，转入步骤280。

步骤230，图像预处理；每一类别的影像图像的质量、尺寸以及局部特征不一样，在利用执行Adaboost检测特征之前，需要进行图像预处理，预处理主要包括如下四步：1、旋转矫正；2、亮度均衡化；3、尺寸归一化；4、感兴趣区域ROI粗定位。

步骤240，对k特征进行Adaboost检测特征，判断是否有候选目标，如果有，则进入步骤250，如果否，类别标签k加1（即遍历下一种类别的影像），转入步骤220，所述k特征为类别标签k对应影像的特征。

步骤270，当前影像找到分类类别标签，返回类别标签，结束。

步骤280，N类别影像特征遍历完成，结束。

步骤140，结束。

综上所述，本发明提出的一种保险理赔影像包分拣的方法，利用图像处理、目标检测、机器学习等领域的技术，在对影像图像稳定的局部文本或图案特征进行检测和识别的时候，利用识别成功特征的位置信息和相对距离获得特征的邻域目标，通过判断邻域目标是否为设定目标，从而、得到准确的影像类别。本方法只提取每个影像稳定的局部特征及其邻域信息加以分析，既提高了分拣的速率也提高了分拣的准确率。

实施例二

例如，在一般的计算机上，对扫描得到的某市医疗门（急）诊收费票据进行处理，使用本发明所述的方法，经过步骤110获得影像的图像数据后，经过步骤120特征检测和识别后得到识别后的影像信息，例如地名、机构、诊、票据等信息，最后经过步骤130根据类别标签将影像放到相应的类别集合中，放入医疗机构的诊费票据分类中。

实施例三

例如，在一般的计算机上，对扫描得到的某市医疗住院收费票据进行处理，使用本发明所述的方法，经过步骤110获得影像的图像数据后，经过步骤120特征检测和识别后，得到地名、住院、票据等信息，最后经过步骤130根据类别标签将影像放到相应的类别集合中，放入上海市住院的收费票据中。

实施例四

例如，在一般的计算机上，对扫描得到的身份证进行处理，使用本发明所述的方法，经过步骤110获得影像的图像数据后，经过步骤120特征检测和识别后得到共和国、居民身份证等信息，最后经过步骤130根据类别标签将影像放到相应的类别集合中，放入居民身份证的类别中。

实施例五

例如，在一般的计算机上，对扫描得到的银行卡进行处理，使用本发明所述的方法，经过步骤110获得影像的图像数据后，经过步骤120特征检测和识别后，获取银联、银行名称等信息，最后经过步骤130根据类别标签将影像放到相应的类别集合中，放入银联卡的类别中。

实施例六

例如，在一般的计算机上，对扫描得到的出生医学证明进行处理，使用本发明所述的方法，经过步骤110获得影像的图像数据后，经过步骤120特征检测和识别后，获得出生医学证明等信息，最后经过步骤130根据类别标签将影像放到相应的类别集合中，放入出生医学证明类别中。

实施例七

例如，在一般的计算机上，对扫描得到的理赔申请书进行处理，使用本发明所述的方法，经过步骤110获得影像的图像数据后，经过步骤120特征检测和识别后，获得保险名称、保险合同、理赔等信息，最后经过步骤130根据类别标签将影像放到相应的类别集合中，放入相应保险公司的理赔保险合同类别。

实施例八

用国产某品牌智能手机，该手机带有1300万像素后置摄像头，拍摄上海市某三甲医院的机打病历单，使用本发明所述的方法，经过检测影像图像稳定的局部特征及其邻域信息加以分析，得到了影像的类别，完成了分拣定义。

本发明的描述和应用都只是说明性和示意性的，并非是想要将本发明的范围限制在上述实施例中。本领域技术人员还应该清楚的是，在不脱离本发明的精神或本质特征的情况下，本发明可以以其它形式、结构、布置、比例，以及用其它组件、材料和部件来实现，以及在不脱离本发明范围和精神的情况下，可以对这里所披露的实施例进行其它变形和改变。

Claims

1.一种保险理赔影像包分拣的方法，其特征在于，该方法按照以下步骤：

步骤110，获取影像包中一个影像的图像数据；

步骤130，根据步骤120中得到的类别标签，将当前影像存储到相应的类别集合中；

步骤140，结束。

2.根据权利要求1所述的一种保险理赔影像包分拣的方法，其特征在于，所述步骤110获取图像数据的方法可为以下方法之一：

方法1、用数码相机拍摄得到的图像数据；

方法2、用手机拍摄得到的图像数据；

方法3、用扫描仪得到的图像数据；

3.根据权利要求1或2所述的保险理赔影像包分拣的方法，其特征在于，所述步骤120具体包括如下步骤：

步骤210，加载Adaboost、svm模型文件，类别标签k初始设置为0；

步骤280，N类别影像特征遍历完成，结束。

4.根据权利要求3所述的保险理赔影像包分拣的方法，其特征在于：所述步骤210中，Adaboost特征检测模型文件的产生具体包括如下步骤：

步骤310，制作正负样本及其标签，生成正负样本描述文件；

步骤320，Adaboost训练，直至虚警为0，结束训练。

5.根据权利要求3所述的保险理赔影像包分拣的方法，其特征在于：所述步骤210中svm特征识别模型文件的产生具体包括如下步骤：

步骤410，制作特征和噪声样本及其标签；

步骤420，svm训练。

6.根据权利要求3或4或5所述的保险理赔影像包分拣的方法，其特征在于：所述步骤230中，图像预处理主要包括以下四步：1、旋转矫正；2、亮度均衡化；3、尺寸归一化；4、感兴趣区域ROI粗定位。