CN108109680A - 一种保险理赔影像包分拣的方法 - Google Patents

一种保险理赔影像包分拣的方法 Download PDF

Info

Publication number
CN108109680A
CN108109680A CN201711379644.6A CN201711379644A CN108109680A CN 108109680 A CN108109680 A CN 108109680A CN 201711379644 A CN201711379644 A CN 201711379644A CN 108109680 A CN108109680 A CN 108109680A
Authority
CN
China
Prior art keywords
image
feature
class label
insurance
settlement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711379644.6A
Other languages
English (en)
Inventor
李进文
张成栋
严京旗
罗宝娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nantong Wisdom Intelligent Technology Co Ltd
Original Assignee
Nantong Wisdom Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nantong Wisdom Intelligent Technology Co Ltd filed Critical Nantong Wisdom Intelligent Technology Co Ltd
Priority to CN201711379644.6A priority Critical patent/CN108109680A/zh
Publication of CN108109680A publication Critical patent/CN108109680A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种保险理赔影像包分拣的方法,所述方法包括如下步骤:步骤110获取影像包中每个影像的图像数据;步骤120对影像图像进行特征检测和识别,得到当前影像所属的类标签;步骤130根据步骤120中得到的类别标签,将当前影像存储到相应的类别集合中。本发明在对影像图像稳定的局部文本或图案特征进行检测和识别的时候,利用识别成功特征的位置信息和相对距离获得特征的邻域目标,通过判断邻域目标是否为设定目标,从而得到准确的影像类别。本方法只提取每个影像稳定的局部特征及其邻域信息加以分析,既提高了分拣的速率也提高了分拣的准确率。

Description

一种保险理赔影像包分拣的方法
技术领域
本发明属于目标检测和图像识别技术领域,具体涉及一种保险理赔影像包分拣的方法。
背景技术
通常,保险公司或医疗保险第三方管理公司(Third Party Administrator forGroup Medical Insurance,简称TPA)收到投保客户的纸质物理件后,需要进行登记、审核、理件,然后进行扫描、定义分拣、录入。在扫描结束到定义分拣之前投保客户的理赔材料成为了一个个独立的影像包。一般,这些影像包由医疗收据、就诊病历、住院清单、身份证复印件、理赔申请书、银行卡复印件,单位证明等多种个人理赔信息组成。目前从登记到定义分拣大约需要1天工时,占据了30%的理赔时效,大量的人力和时间花费在定义及分拣上,并且影响终端客户的理赔体验。
将同类影像从影像包中分拣出来的技术,目前已有应用,比如使用Googletensorflow中对Cifar-10数据集进行分类,利用CNN卷积神经网络(由卷积层、池化层、全连接层组成,通过梯度下降法对参数进行训练),这种神经网络的方法通过多个卷积滤波器提取影像特征,达到影像分类效果。对于特征不显著的非同类影像,比如同一地区的门急诊与住院医疗票据影像,由于影像中文本存在前后两次打印的情况。同时,第二次打印的内容、格式、位置无规律,这种分拣识别方法常常将两者误分。对这种包含变化特征分布的影像仍然可以依据一些特定且稳定的线索来辅助判断影像的归属,提高影像分类的准确性,保证分拣的准确率。
发明内容
本发明提供一种保险理赔影像包分拣的方法以解决目前分拣识别的方法不能对无规律的票据影像进行准确分拣的弊端进行改进。
本发明的具体技术方案如下:
一种保险理赔影像包分拣的方法,该方法按照以下步骤:
步骤110,获取影像包中一个影像的图像数据;
步骤120,对影像图像进行特征检测和识别,得到当前影像所属的类标签;
步骤130,根据步骤120中得到的类别标签,将当前影像存储到相应的类别集合中。
步骤140,结束。
进一步,所述步骤110获取图像数据的方法可为以下方法之一:
方法1、用数码相机拍摄得到的图像数据;
方法2、用手机拍摄得到的图像数据;
方法3、用扫描仪得到的图像数据;
方法4、打开一个预先存在的包含影像图像数据的文件,读取该文件中的数据并按照标准算法解压后得到的图像数据。
进一步,所述步骤120具体包括如下步骤:
步骤210,加载Adaboost、svm模型文件,类别标签k初始设置为0;
步骤220,判断类别标签k是否小于N,如果是,则进入步骤230,如果否,转入步骤280,所述N为影像类别的种类;
步骤230,图像预处理;每一类别的影像图像的质量、尺寸以及局部特征不一样,在利用执行Adaboost检测特征之前,先进行图像预处理;
步骤240,对k特征进行Adaboost检测特征,判断是否有候选目标,如果有,则进入步骤250,如果否,类别标签k加1,即遍历下一种类别的影像,转入步骤220,所述k特征为类别标签k对应影像的特征;
步骤250,对k特征进行svm识别,判断是否识别成功,如果是,则进入步骤260,如果否,类别标签k加1,转入步骤220;
步骤260,基于相对距离定位预定目标,使用svm判断预定目标是否存在,如果是,则进入步骤270,如果否,类别标签k加1,转入步骤220;
步骤270,当前影像找到分类类别标签,返回类别标签,结束;
步骤280,N类别影像特征遍历完成,结束。
进一步,所述步骤210中,Adaboost特征检测模型文件的产生具体包括如下步骤:
步骤310,制作正负样本及其标签,生成正负样本描述文件;
步骤320,Adaboost训练,直至虚警为0,结束训练;
进一步,所述步骤210中svm特征识别模型文件的产生具体包括如下步骤:
步骤410,制作特征和噪声样本及其标签;
步骤420,svm训练。
进一步,所述步骤230中,图像预处理主要包括以下四步:1、旋转矫正;2、亮度均衡化;3、尺寸归一化;4、感兴趣区域ROI粗定位。
本发明的有益效果如下:
1、利用Adaboost直接检测保险理赔影像图像中稳定的局部文本或图案特征,增大了类别区分度,利用svm识别特征确定影像含义,从而提高分拣的准确率。
2、在检测和识别影像图像特征时,同时得到了特征的位置信息,通过相对距离计算邻域预定的目标并进行识别,结合识别结果进行反馈校验,进一步确认了当前影像所属的类别。
3、与常见的全图像特征提取分类相比,本发明只检测每个影像的局部稳定的特征及其识别成功特征的邻域信息加以分析,显著提高了分拣的速度。
附图说明
图1为离线训练特征检测器模型流程图;
图2为离线训练识别器模型的流程图;
图3为本发明影像包分拣方法的流程图;
图4为特征检测与识别在线工作的流程图。
具体实施方式
以下结合附图及实施例对本发明的技术方案进行详细的描述:
实施例一
如图1所示,本发明提出了一种保险理赔影像包分拣的方法,所述方法包括如下步骤:
步骤110:获取影像包中一个影像的图像数据。所述获取影像图像数据的方法可以为以下方法之一:一是用数码相机拍摄得到的图像数据;二是用手机拍摄得到的图像数据;三是用扫描仪得到的图像数据;四是打开一个预先存在的包含影像图像数据的文件,读取该文件中的数据并按照标准算法解压后得到的图像数据。
步骤120:对影像图像进行特征检测和识别,得到当前影像所属的类标签;
如图2所示,步骤120具体包括如下步骤:
步骤210,加载Adaboost、svm模型文件,类别标签k初始设置为0;
影像图像进行特征检测和识别用到机器学习中监督学习技术,因此需要训练检测和识别的模型。
Adaboost特征检测模型文件的产生步骤图3所示,具体包括如下步骤:
步骤310,制作正负样本及其标签,生成正负样本描述文件;其中正样本:为影像图像的局部特征;负样本:不包含正样本的影像图像;正负样本的描述文件:指定了尺寸以及有效区域。
步骤320,Adaboost训练,直至虚警为0,结束训练;svm特征识别模型文件的产生步骤如图4所示,具体包括如下步骤:
步骤410,制作特征和噪声样本及其标签;
步骤420,svm训练,模型文件的训练均在离线阶段完成。
步骤220,判断类别标签k是否小于N,所述N为影像类别的种类,如果是,则进入步骤230,如果否,转入步骤280。
步骤230,图像预处理;每一类别的影像图像的质量、尺寸以及局部特征不一样,在利用执行Adaboost检测特征之前,需要进行图像预处理,预处理主要包括如下四步:1、旋转矫正;2、亮度均衡化;3、尺寸归一化;4、感兴趣区域ROI粗定位。
步骤240,对k特征进行Adaboost检测特征,判断是否有候选目标,如果有,则进入步骤250,如果否,类别标签k加1(即遍历下一种类别的影像),转入步骤220,所述k特征为类别标签k对应影像的特征。
步骤250,对k特征进行svm识别,判断是否识别成功,如果是,则进入步骤260,如果否,类别标签k加1,转入步骤220;
步骤260,基于相对距离定位预定目标,使用svm判断预定目标是否存在,如果是,则进入步骤270,如果否,类别标签k加1,转入步骤220;
步骤270,当前影像找到分类类别标签,返回类别标签,结束。
步骤280,N类别影像特征遍历完成,结束。
步骤130,根据步骤120中得到的类别标签,将当前影像存储到相应的类别集合中。
步骤140,结束。
综上所述,本发明提出的一种保险理赔影像包分拣的方法,利用图像处理、目标检测、机器学习等领域的技术,在对影像图像稳定的局部文本或图案特征进行检测和识别的时候,利用识别成功特征的位置信息和相对距离获得特征的邻域目标,通过判断邻域目标是否为设定目标,从而、得到准确的影像类别。本方法只提取每个影像稳定的局部特征及其邻域信息加以分析,既提高了分拣的速率也提高了分拣的准确率。
实施例二
例如,在一般的计算机上,对扫描得到的某市医疗门(急)诊收费票据进行处理,使用本发明所述的方法,经过步骤110获得影像的图像数据后,经过步骤120特征检测和识别后得到识别后的影像信息,例如地名、机构、诊、票据等信息,最后经过步骤130根据类别标签将影像放到相应的类别集合中,放入医疗机构的诊费票据分类中。
实施例三
例如,在一般的计算机上,对扫描得到的某市医疗住院收费票据进行处理,使用本发明所述的方法,经过步骤110获得影像的图像数据后,经过步骤120特征检测和识别后,得到地名、住院、票据等信息,最后经过步骤130根据类别标签将影像放到相应的类别集合中,放入上海市住院的收费票据中。
实施例四
例如,在一般的计算机上,对扫描得到的身份证进行处理,使用本发明所述的方法,经过步骤110获得影像的图像数据后,经过步骤120特征检测和识别后得到共和国、居民身份证等信息,最后经过步骤130根据类别标签将影像放到相应的类别集合中,放入居民身份证的类别中。
实施例五
例如,在一般的计算机上,对扫描得到的银行卡进行处理,使用本发明所述的方法,经过步骤110获得影像的图像数据后,经过步骤120特征检测和识别后,获取银联、银行名称等信息,最后经过步骤130根据类别标签将影像放到相应的类别集合中,放入银联卡的类别中。
实施例六
例如,在一般的计算机上,对扫描得到的出生医学证明进行处理,使用本发明所述的方法,经过步骤110获得影像的图像数据后,经过步骤120特征检测和识别后,获得出生医学证明等信息,最后经过步骤130根据类别标签将影像放到相应的类别集合中,放入出生医学证明类别中。
实施例七
例如,在一般的计算机上,对扫描得到的理赔申请书进行处理,使用本发明所述的方法,经过步骤110获得影像的图像数据后,经过步骤120特征检测和识别后,获得保险名称、保险合同、理赔等信息,最后经过步骤130根据类别标签将影像放到相应的类别集合中,放入相应保险公司的理赔保险合同类别。
实施例八
用国产某品牌智能手机,该手机带有1300万像素后置摄像头,拍摄上海市某三甲医院的机打病历单,使用本发明所述的方法,经过检测影像图像稳定的局部特征及其邻域信息加以分析,得到了影像的类别,完成了分拣定义。
本发明的描述和应用都只是说明性和示意性的,并非是想要将本发明的范围限制在上述实施例中。本领域技术人员还应该清楚的是,在不脱离本发明的精神或本质特征的情况下,本发明可以以其它形式、结构、布置、比例,以及用其它组件、材料和部件来实现,以及在不脱离本发明范围和精神的情况下,可以对这里所披露的实施例进行其它变形和改变。

Claims (6)

1.一种保险理赔影像包分拣的方法,其特征在于,该方法按照以下步骤:
步骤110,获取影像包中一个影像的图像数据;
步骤120,对影像图像进行特征检测和识别,得到当前影像所属的类标签;
步骤130,根据步骤120中得到的类别标签,将当前影像存储到相应的类别集合中;
步骤140,结束。
2.根据权利要求1所述的一种保险理赔影像包分拣的方法,其特征在于,所述步骤110获取图像数据的方法可为以下方法之一:
方法1、用数码相机拍摄得到的图像数据;
方法2、用手机拍摄得到的图像数据;
方法3、用扫描仪得到的图像数据;
方法4、打开一个预先存在的包含影像图像数据的文件,读取该文件中的数据并按照标准算法解压后得到的图像数据。
3.根据权利要求1或2所述的保险理赔影像包分拣的方法,其特征在于,所述步骤120具体包括如下步骤:
步骤210,加载Adaboost、svm模型文件,类别标签k初始设置为0;
步骤220,判断类别标签k是否小于N,如果是,则进入步骤230,如果否,转入步骤280,所述N为影像类别的种类;
步骤230,图像预处理;每一类别的影像图像的质量、尺寸以及局部特征不一样,在利用执行Adaboost检测特征之前,先进行图像预处理;
步骤240,对k特征进行Adaboost检测特征,判断是否有候选目标,如果有,则进入步骤250,如果否,类别标签k加1,即遍历下一种类别的影像,转入步骤220,所述k特征为类别标签k对应影像的特征;
步骤250,对k特征进行svm识别,判断是否识别成功,如果是,则进入步骤260,如果否,类别标签k加1,转入步骤220;
步骤260,基于相对距离定位预定目标,使用svm判断预定目标是否存在,如果是,则进入步骤270,如果否,类别标签k加1,转入步骤220;
步骤270,当前影像找到分类类别标签,返回类别标签,结束;
步骤280,N类别影像特征遍历完成,结束。
4.根据权利要求3所述的保险理赔影像包分拣的方法,其特征在于:所述步骤210中,Adaboost特征检测模型文件的产生具体包括如下步骤:
步骤310,制作正负样本及其标签,生成正负样本描述文件;
步骤320,Adaboost训练,直至虚警为0,结束训练。
5.根据权利要求3所述的保险理赔影像包分拣的方法,其特征在于:所述步骤210中svm特征识别模型文件的产生具体包括如下步骤:
步骤410,制作特征和噪声样本及其标签;
步骤420,svm训练。
6.根据权利要求3或4或5所述的保险理赔影像包分拣的方法,其特征在于:所述步骤230中,图像预处理主要包括以下四步:1、旋转矫正;2、亮度均衡化;3、尺寸归一化;4、感兴趣区域ROI粗定位。
CN201711379644.6A 2017-12-20 2017-12-20 一种保险理赔影像包分拣的方法 Pending CN108109680A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711379644.6A CN108109680A (zh) 2017-12-20 2017-12-20 一种保险理赔影像包分拣的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711379644.6A CN108109680A (zh) 2017-12-20 2017-12-20 一种保险理赔影像包分拣的方法

Publications (1)

Publication Number Publication Date
CN108109680A true CN108109680A (zh) 2018-06-01

Family

ID=62211185

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711379644.6A Pending CN108109680A (zh) 2017-12-20 2017-12-20 一种保险理赔影像包分拣的方法

Country Status (1)

Country Link
CN (1) CN108109680A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111860652A (zh) * 2020-07-22 2020-10-30 中国平安财产保险股份有限公司 基于图像检测的动物体重测量方法、装置、设备及介质
CN112085012A (zh) * 2020-09-04 2020-12-15 泰康保险集团股份有限公司 项目名称和类别识别方法及装置
CN113139071A (zh) * 2020-01-30 2021-07-20 虹光精密工业股份有限公司 运用机器学习进行文件分类的文件处理系统及方法
CN111401438B (zh) * 2020-03-13 2023-08-25 德联易控科技(北京)有限公司 图像分拣方法、装置及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103488977A (zh) * 2013-09-22 2014-01-01 江苏美伦影像系统有限公司 基于svm的医学影像管理系统
CN104794432A (zh) * 2015-03-25 2015-07-22 上海交通大学 快速级联式车标视觉检测与识别方法和系统
CN106778913A (zh) * 2017-01-13 2017-05-31 山东大学 一种基于像素级联特征的模糊车牌检测方法
CN106803205A (zh) * 2016-12-27 2017-06-06 北京量子保科技有限公司 一种用于保险自动核赔的系统和方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103488977A (zh) * 2013-09-22 2014-01-01 江苏美伦影像系统有限公司 基于svm的医学影像管理系统
CN104794432A (zh) * 2015-03-25 2015-07-22 上海交通大学 快速级联式车标视觉检测与识别方法和系统
CN106803205A (zh) * 2016-12-27 2017-06-06 北京量子保科技有限公司 一种用于保险自动核赔的系统和方法
CN106778913A (zh) * 2017-01-13 2017-05-31 山东大学 一种基于像素级联特征的模糊车牌检测方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113139071A (zh) * 2020-01-30 2021-07-20 虹光精密工业股份有限公司 运用机器学习进行文件分类的文件处理系统及方法
CN113139071B (zh) * 2020-01-30 2023-10-24 虹光精密工业股份有限公司 运用机器学习进行文件分类的文件处理系统及方法
CN111401438B (zh) * 2020-03-13 2023-08-25 德联易控科技(北京)有限公司 图像分拣方法、装置及系统
CN111860652A (zh) * 2020-07-22 2020-10-30 中国平安财产保险股份有限公司 基于图像检测的动物体重测量方法、装置、设备及介质
CN111860652B (zh) * 2020-07-22 2022-03-29 中国平安财产保险股份有限公司 基于图像检测的动物体重测量方法、装置、设备及介质
CN112085012A (zh) * 2020-09-04 2020-12-15 泰康保险集团股份有限公司 项目名称和类别识别方法及装置
CN112085012B (zh) * 2020-09-04 2024-03-08 泰康保险集团股份有限公司 项目名称和类别识别方法及装置

Similar Documents

Publication Publication Date Title
CN107862303B (zh) 表格类图像的信息识别方法、电子装置及可读存储介质
Gao et al. Automatic change detection in synthetic aperture radar images based on PCANet
CN108109680A (zh) 一种保险理赔影像包分拣的方法
CN101887523B (zh) 利用图片文字与局部不变特征检测图像垃圾邮件的方法
Meena et al. A deep learning based method for image splicing detection
Shan Vehicle License Plate Recognition Based on Text-line Construction and Multilevel RBF Neural Network.
JP2019523954A (ja) 紙幣管理方法、システム、プログラム及び記録媒体
CN105989659B (zh) 一种相似字符识别方法及纸币冠字码识别方法
CN109993201A (zh) 一种图像处理方法、装置和可读存储介质
Wang et al. Leaf image classification with shape context and sift descriptors
CN106503703A (zh) 使用终端设备来识别信用卡号码和到期日期的系统和方法
CN109376631A (zh) 一种基于神经网络的回环检测方法及装置
CN101504781A (zh) 有价文件识别方法及装置
CN106355177A (zh) 一种医疗检验单的检验项信息自动提取方法
Cuevas et al. White blood cell segmentation by circle detection using electromagnetism‐like optimization
Yang et al. Convolutional neural network for smooth filtering detection
CN108509950A (zh) 基于概率特征加权融合的铁路接触网支柱号牌检测识别法
CN113158895A (zh) 票据识别方法、装置、电子设备及存储介质
CN111767879A (zh) 一种活体检测方法
Chugh et al. [Retracted] Image Retrieval Using Different Distance Methods and Color Difference Histogram Descriptor for Human Healthcare
Teymournezhad et al. Detection of counterfeit banknotes by security components based on image processing and GoogLeNet deep learning network
Zhang et al. Research on Surface Defect Detection of Rare‐Earth Magnetic Materials Based on Improved SSD
CN110210467A (zh) 一种文本图像的公式定位方法、图像处理装置、存储介质
CN116363655A (zh) 一种财务票据识别方法及系统
Shi et al. An invoice recognition system using deep learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180601