CN113255642A - 一种用于人伤理赔的医疗票据信息整合方法 - Google Patents

一种用于人伤理赔的医疗票据信息整合方法 Download PDF

Info

Publication number
CN113255642A
CN113255642A CN202110496582.7A CN202110496582A CN113255642A CN 113255642 A CN113255642 A CN 113255642A CN 202110496582 A CN202110496582 A CN 202110496582A CN 113255642 A CN113255642 A CN 113255642A
Authority
CN
China
Prior art keywords
bill
text
information
medical
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110496582.7A
Other languages
English (en)
Inventor
冯韩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingyou Times Information Technology Development Co ltd
Original Assignee
Beijing Jingyou Times Information Technology Development Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingyou Times Information Technology Development Co ltd filed Critical Beijing Jingyou Times Information Technology Development Co ltd
Priority to CN202110496582.7A priority Critical patent/CN113255642A/zh
Publication of CN113255642A publication Critical patent/CN113255642A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/243Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明涉及票据识别技术领域,具体是涉及一种用于人伤理赔的医疗票据信息整合方法,通过图像质量检测→图像处理→建立文本候选区域→结构化存储→修正→匹配分类→命名→数据入库的流程对用于保险结构的医疗票据信息进行整合,通过通过语义检测将票据分为标题候选区和其它候选区,依靠加权和逻辑处理,对票据进行分类的同时,标识票据的所属人、所属医院和所属地区;通过标签检索,可以就理赔人在多地或多医院的就医情况予以线性查看;或对多地区、多医院的同类型就医信息统一显示,从而为保险机构的理赔业务提供信息援助。

Description

一种用于人伤理赔的医疗票据信息整合方法
技术领域
本发明涉及票据识别技术领域,具体是涉及一种用于人伤理赔的医疗票据信息整合方法。
背景技术
鉴于当下医疗信息数据暂未实现跨区域、跨层级、跨部门的联通与共享,保险机构在处理理赔案件时无法直接调用出险人的医疗信息。人伤理赔在处理涉及人伤的车险理赔案件时,平台需要出险人提供住院病历、诊断证明、医疗发票、费用清单、出院小结等一系列相关材料作为理算依据。收到证明材料后,需要投入专业人力资源完成信息采录,只有信息录入理算方法,才能得出理算结果、完成相应理赔。
目前保险结构对出险人提供的医疗票据通常使用人工录入:这种方法效率低、准确率低而且操作人员要一定时间岗前培训和实录训练。
为了解决上述问题,先需要一种用于保险机构的医疗票据信息提取方法。
发明内容
为了实现以上目的,本发明提供了一种用于人伤理赔的医疗票据信息整合方法,对现有的医疗票据OCR识别技术做改进,使其能更好地满足保险机构对医疗票据所需信息的获取,本发明设计方案的具体步骤如下:
S1、采集票据图像,进行人工辅助识别;以票据图像是否存在严重图像不清、凭证种类错误、夹带票、金额不一致为标准,将不合格票据图像筛出并在前端提示;
S2、将经步骤S1筛选后的票据图像进行图像倾斜校正、灰度化处理以及断点处理;
S3、使用基于角点的检测网络对经步骤S2处理后的票据图像进行检测,输出紧密包围文本候选区域的四边形角点,得到多方向文本候选区域;
S4、对步骤S3文本候选区域的文本信息进行单字符切割,得到单字符图像;对所述单字符图像进行识别得到单字符文本;对所述单字符文本进行结构化存储;
S5、对发票中医学术语的语义检测与修正;对比大小写金额对金额数值进行检测修正;
S6、所述步骤S4中文本候选区域中包括标题候选区域,对所述标题候选区域中的文本信息进行语义检测,以此对票据进行分类并命名:包括住院病历、诊断证明、医疗发票、费用清单和出院小结;
S7、根据步骤S4中得到的文本信息,完成对票据所属人、所属医院和所属地区的命名和录入;
S8、高置信度的票据文档自动入库;低置信度的票据文档给出警示,人工校验后入库;
S9、对后续票据进行信息提取时,先检测票据的所属医院标签信息,然后对具有相同所属医院标签的票据进行票据尺寸以及文本候选区域的尺寸信息对比,若尺寸信息适配则标识类型入库;若尺寸信息不适配,则执行步骤S6~S8。
现有的票据识别方法往往着重于票据文字的识别,对于票据的分类也止于同一系统内的不同类型票据,对于跨部门,跨地区的票据识别和分类方法还不完善,因此本发明在传统的票据识别系统上做改进,做到跨区域、跨层级、跨部门的票据信息的联通与共享。
进一步地,所述步骤S2中,图像倾斜校正的具体步骤如下:
S21、不同类型的医疗票据,均存在等长且最长的直线——票据的长边缘,以及等长且第二长的直线——票据的短边缘;
S22、检测票据中长度最长的直线和长度第二长的直线,计算直线的倾斜角度;计算直线倾斜角的具体公式如下:
Figure BDA0003054655530000031
式中,(x1,y1)和(x1,y1)为检测到的目标直线上两点的坐标,θ为直线的倾斜角度;
S23、计算所有检测到的直线的倾斜角度,并求平均值,得到票据图像的倾斜角度;
S24、以票据图像的中心点为坐标原点,将票据图像的每一个像素点进行坐标旋转变换,即得到倾斜校正后的票据图像。
现有的票据图像倾斜矫正系统是以票据中的框线作为基线进行校准的,这种方法对于标准模板的票据而言是有效的。但是,不同医院,不同地区票据的形式差异很大,票面上的框线规则并不统一,若采用传统的框线识别方法,识别率会很低。因此,本发明使用票据的长边和短边作为识别基线,这对于不同大小、规格的票据都是适用的。因此在在票据进行初筛的前提下,使用票据的长短边作为票据图像倾斜校正的基线,识别率能够达到95%以上。
进一步地,所述步骤S3中,基于角点的检测网络的具体检测方法如下:
S31、步骤S2处理后的票据图像首先经过用以提取特征映射图的共享卷积网络;共享网络的骨干是VGG,用于连接低级特征映射和高级语义特征映射,并将这些特征提供给文本检测分支和RoIRotate模块。
S32、检测分支和识别分支在步骤S31的特征映像图上运行;
S321、检测分支采用基于角点检测和位置敏感分割的方案,用来预测文本框;
S322、识别分支的分类编码器采用RNN结构,解码器采用CTC结构;
S33、所述检测网络在识别分支之前还包括将步骤S31的特征映像图的特征与检测分支的文本框结果进行融合的RoIRotate运算环节。
进一步地,所述步骤S321中,角点检测的模块结构如图2所示,图中用正方形框来表示角点,一个正方形代表一个角点,通过默认文本框来回归来确定角点。其中,正方形框的中心点代表角点位置坐标,以角点所属文本框的最短边长作为正方形框的边长。
角点检测的默认文本框对应的输出包含四种角点的信息,每种角点信息有四个候选文本框的分支分值和偏移量;
角点检测采用的预测模块,以卷积的方式预测两个分支的分值和偏移量;
对于每个单元中带有k个默认文本框的m×n特征图,分值分支为每个默认文本框的每个类型角点输出的2个分值,偏移量分支为每个默认文本框的每个类型角点输出的4个偏移量;
其中,分值分支的输出通道是k×q×2,2表示该位置是否有角点存在;偏移量分支的输出通道是k×q×4;q表示角点类型,默认值为4。
进一步地,所述步骤S321中,位置敏感分割的模块结构如下:
在位置敏感分割模块中,使用一个g×g大小的网格,将文本框的边界框R分成多个分块,对于每个分块来说,使用一个分割图来判断该像素是否属于对应分块,因此可处理相近或相互叠加的文本区域。
进一步地,步骤S6中票据类型的命名方法,与步骤S7中票据所属人、所属医院和所属地区的命名方法原理相同,具体如下:
S71、以步骤S4中得到的文本信息判断票据是否包含标题候选区域;
S72、若票据包含标题候选区,则查找所述票据文本信息中是否存在有与词库中存储的票据类型、所属人、所属医院和所属地区匹配的关键词;
S73、若存在匹配关键词,则获取所述关键词对应的正则表达式并验证;
S74、若通过正则表达式验证,则根据所述正则表达式确定所述票据的要素;
S75、根据预设定规则和所述票据文本信息确定所述票据的命名;
S76、若票据不包含标题候选区,则检测其余候选区域,查找是否存在有与词库中存储的票据类型、所属人、所属医院和所属地区匹配的关键词;
S77、若存在匹配关键词,则重复步骤S73~S75,对票据进行命名;
S78、若票据不包含标题候选区,且其余候选区域,不存在有与词库中存储的票据类型、所属人、所属医院和所属地区匹配的关键词,则根据多张票据之间的人员姓名,药品关联性等规则进行检测,提示用户选择或者建立新标签;
S79、处理完成后的票据关键词特征存入票据数据库,供未来其它票据进行比对。
本发明设计的医疗票据信息提取方法,不仅能够通过深度学习的方式将医疗票据进行分类,而且能够将不同区域、不同层级、不同跨部门的医疗票据信通过标签管理联通起来,为保险机构的理赔业务提供信息援助。
进一步地,步骤S5中医学术语修正的具体方法如下:
首先从CNKI、PubMcd等网站上搜索并下载7000多条医学术语形成语言数据库,再对语言数据库中的医学术语打上标签,构成训练模型所需的训练集,将大量的训练样本做矢量化处理后送入RNN网络中,最后得到可实现医学术语修正的RNN网络模型。
与现有的票据识别系统相比,本发明的有益效果是:
(1)本发明提供的人伤理赔的医疗票据信息提取方法,区别于现有技术以框线为结构特征检测票据种类,而是通过通过语义检测将票据分为标题候选区和其它候选区,依靠加权和逻辑处理,对票据进行分类的同时,标识票据的所属人、所属医院和所属地区。通过标签检索,可以就理赔人在多地或多医院的就医情况予以线性查看;或对多地区、多医院的同类型就医信息统一显示。从而为保险机构的理赔业务提供信息援助。
(2)本发明提供的人伤理赔的医疗票据信息提取方法,区别于现有技术用票据关键要素逐一对比的方法,而是先将同一医院的票据通过纸张大小和文本候选区大小进行尺寸检验入库,若不适配则通过关键词检验入库,极大地挺高了票据的检测速率。
附图说明
图1是本发明票据分类方法的流程图;
图2是本发明步骤S3中检测网络的结构示意图;
图3是本发明焦点检测的模块结构;
图4是本发明实验例用以举例说明的住院病历。
具体实施方式
为更进一步阐述本发明所采取的方式和取得的效果,下面将结合附图对本发明的技术方案进行清楚和完整地描述。
实施例
图1为本发明票据分类方法的流程图,可见本发明设计方案的具体步骤如下:
S1、采集票据图像,进行人工辅助识别;以票据图像是否存在严重图像不清、凭证种类错误、夹带票、金额不一致为标准,将不合格票据图像筛出并在前端提示;
S2、将经步骤S1筛选后的票据图像进行图像倾斜校正、灰度化处理以及断点处理;
S3、使用基于角点的检测网络对经步骤S2处理后的票据图像进行检测,输出紧密包围文本候选区域的四边形角点,得到多方向文本候选区域;
S4、对步骤S3文本候选区域的文本信息进行单字符切割,得到单字符图像;对所述单字符图像进行识别得到单字符文本;对所述单字符文本进行结构化存储;
S5、对发票中医学术语的语义检测与修正;对比大小写金额对金额数值进行检测修正;
S6、所述步骤S4中文本候选区域中包括标题候选区域,对所述标题候选区域中的文本信息进行语义检测,以此对票据进行分类并命名:包括住院病历、诊断证明、医疗发票、费用清单和出院小结;
S7、根据步骤S4中得到的文本信息,完成对票据所属人、所属医院和所属地区的命名和录入;
S8、高置信度的票据文档自动入库;低置信度的票据文档给出警示,人工校验后入库;
S9、对后续票据进行信息提取时,先检测票据的所属医院标签信息,然后对具有相同所属医院标签的票据进行票据尺寸以及文本候选区域的尺寸信息对比,若尺寸信息适配则标识类型入库;若尺寸信息不适配,则执行步骤S6~S8。
现有的票据识别方法往往着重于票据文字的识别,对于票据的分类也止于同一系统内的不同类型票据,对于跨部门,跨地区的票据识别和分类方法还不完善,因此本发明在传统的票据识别系统上做改进,做到跨区域、跨层级、跨部门的票据信息的联通与共享。
具体的,所述步骤S2中,图像倾斜校正的具体步骤如下:
S21、不同类型的医疗票据,均存在等长且最长的直线——票据的长边缘,以及等长且第二长的直线——票据的短边缘;
S22、检测票据中长度最长的直线和长度第二长的直线,计算直线的倾斜角度;计算直线倾斜角的具体公式如下:
Figure BDA0003054655530000081
式中,(x1,y1)和(x1,y1)为检测到的目标直线上两点的坐标,θ为直线的倾斜角度;
S23、计算所有检测到的直线的倾斜角度,并求平均值,得到票据图像的倾斜角度;
S24、以票据图像的中心点为坐标原点,将票据图像的每一个像素点进行坐标旋转变换,即得到倾斜校正后的票据图像。
现有的票据图像倾斜矫正系统是以票据中的框线作为基线进行校准的,这种方法对于标准模板的票据而言是有效的。但是,不同医院,不同地区票据的形式差异很大,票面上的框线规则并不统一,若采用传统的框线识别方法,识别率会很低。因此,本发明使用票据的长边和短边作为识别基线,这对于不同大小、规格的票据都是适用的。因此在在票据进行初筛的前提下,使用票据的长短边作为票据图像倾斜校正的基线,识别率能够达到95%以上。
具体的,所述步骤S3中,基于角点的检测网络的具体检测方法如下:
S31、步骤S2处理后的票据图像首先经过用以提取特征映射图的共享卷积网络;共享网络的骨干是VGG,用于连接低级特征映射和高级语义特征映射,并将这些特征提供给文本检测分支和RoIRotate模块。
S32、检测分支和识别分支在步骤S31的特征映像图上运行;
S321、检测分支采用基于角点检测和位置敏感分割的方案,用来预测文本框;
S322、识别分支的分类编码器采用RNN结构,解码器采用CTC结构;
S33、所述检测网络在识别分支之前还包括将步骤S31的特征映像图的特征与检测分支的文本框结果进行融合的RoIRotate运算环节。
具体的,所述步骤S321中,角点检测的模块结构如图2所示,图中用正方形框来表示角点,一个正方形代表一个角点,通过默认文本框来回归来确定角点。其中,正方形框的中心点代表角点位置坐标,以角点所属文本框的最短边长作为正方形框的边长。
角点检测的默认文本框对应的输出包含四种角点的信息,每种角点信息有四个候选文本框的分支分值和偏移量;
角点检测采用的预测模块,以卷积的方式预测两个分支的分值和偏移量;
对于每个单元中带有k个默认文本框的m×n特征图,分值分支为每个默认文本框的每个类型角点输出的2个分值,偏移量分支为每个默认文本框的每个类型角点输出的4个偏移量;
其中,分值分支的输出通道是k×q×2,2表示该位置是否有角点存在;偏移量分支的输出通道是k×q×4;q表示角点类型,默认值为4。
具体的,所述步骤S321中,位置敏感分割的模块结构如图3所示:
在位置敏感分割模块中,使用一个g×g大小的网格,将文本框的边界框R分成多个分块,对于每个分块来说,使用一个分割图来判断该像素是否属于对应分块,因此可处理相近或相互叠加的文本区域。
具体的,步骤S6中票据类型的命名方法,与步骤S7中票据所属人、所属医院和所属地区的命名方法原理相同,具体如下:
S71、以步骤S4中得到的文本信息判断票据是否包含标题候选区域;
S72、若票据包含标题候选区,则查找所述票据文本信息中是否存在有与词库中存储的票据类型、所属人、所属医院和所属地区匹配的关键词;
S73、若存在匹配关键词,则获取所述关键词对应的正则表达式并验证;
S74、若通过正则表达式验证,则根据所述正则表达式确定所述票据的要素;
S75、根据预设定规则和所述票据文本信息确定所述票据的命名;
S76、若票据不包含标题候选区,则检测其余候选区域,查找是否存在有与词库中存储的票据类型、所属人、所属医院和所属地区匹配的关键词;
S77、若存在匹配关键词,则重复步骤S73~S75,对票据进行命名;
S78、若票据不包含标题候选区,且其余候选区域,不存在有与词库中存储的票据类型、所属人、所属医院和所属地区匹配的关键词,则根据多张票据之间的人员姓名,药品关联性等规则进行检测,提示用户选择或者建立新标签;
S79、处理完成后的票据关键词特征存入票据数据库,供未来其它票据进行比对。
本发明设计的医疗票据信息提取方法,不仅能够通过深度学习的方式将医疗票据进行分类,而且能够将不同区域、不同层级、不同跨部门的医疗票据信通过标签管理联通起来,为保险机构的理赔业务提供信息援助。
当需要处理某一理赔案件时,保险机构可通过标签检索,线性浏览理赔人在多地或多医院的就医情况予,从而为保险机构的理赔业务提供信息援助。
具体的,步骤S5中医学术语修正的具体方法如下:
首先从CNKI、PubMcd等网站上搜索并下载7000多条医学术语形成语言数据库,再对语言数据库中的医学术语打上标签,构成训练模型所需的训练集,将大量的训练样本做矢量化处理后送入RNN网络中,最后得到可实现医学术语修正的RNN网络模型。
实验例
本实验例是以上述实施例中记载的方法为基础进行叙述的,旨在阐明本发明设计方法在实际中的应用效果。本实验例还提供了一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如实施例中记载的方案的步骤。
本实验例使用利用上述实施例中记载的技术以及所述电子设备,建立医疗票据数据集,在实际训练时,使用了随机生成的2000张发票图像用于训练,1000张发票图像用于验证。数据集中所有的发票图像的文本区域,都被自动标注,以统一的格式存储。
为了使得合成数据集中的样本更加接近真实机打发票,生成的发票都会经过若干步的加工,加工手段也是随机的。所以,数据集中包含有:污渍、散焦模糊、平面倾斜、空间内倾斜、复杂背景等元素的一种或若干种。这使得数据集更加丰富,提高对系统的鲁棒性要求,进而增强被训练网络的泛化能力。
不同训练样本容量对于票据识别准确率的影响见表1。
表1不同训练样本容量对于票据识别准确率的影响见表1
样本容量/个 100 500 1000 1500 2000
识别率/% 53.4 73.6 83.5 88.9 95.3
表1中的结果表明:当训练网络的样本量增加时,模型识别准确率也随之提高。当样本量较少时,由于此时网络并没有达到收敛状态,因此识别准确率相对较低。当样本量达到2000时,网络处于收敛状态,识别准确率达到90.3%。
如图4所示,以北京大学人民医院的住院病案为例(图中对涉及患者隐私的相关信息已隐去),以此说明本发明的具体的识别结果。
对图4图像进行图像倾斜校正、灰度化处理以及断点处理;对图像检测后输出标题候选区,检测标题候选区,取关键词“北京大学人民医院”,与数据集中有“北京大学人民医院”关键词的票据模板进行尺寸对比,若纸张尺寸、标题候选区尺寸以及其余文本候选区尺寸均适配,则对票据标识“住院病历”标签。
若图4票据因拍摄原因导致纸张折叠或拍摄角度倾斜,导致纸张尺寸、标题候选区尺寸以及其余文本候选区尺寸与模板数据不一致时,检测标题候选区,同时检测到关键词“北京大学人民医院”、“住院病案”、“首页”关键词时,则对票据标识“住院病历”标签。
依照实施例中记载的方法,对图4的住院病历进行命名标识:
“患者名称——住院病历——北京大学人民医院——北京市西直门南大街”。
对具有同一“患者名称”的诊断证明、医疗发票、费用清单和出院小结按名称检索归档,并按照“所属医院”的不同对上述票据进行分类。
至此得到某一患者在北京大学人民医院的住院病历、诊断证明、医疗发票、费用清单和出院小结档案资料,以此档案资料作为理赔时的数据依据。
将上述方法记为实验组,将使用传统CRNN以及FOTS的检测方法分记为对照组1和对照组2,对比三者对于数值、文字以及票据类型的检测准确度,具体见表2。
表2本发明所用方法与传统检测方法的检测性能对比
方法 数值/% 文字/% 票据类型/% 整体/%
对照组1 92.24 91.28 78.65 87.39
对照组2 95.44 95.68 85.77 92.3
实验组 99.59 97.84 90.3 95.91
从表格2中的结果可以发现,本发明使用的方法对于检测到的数值、文字以及票据类型的准确率均高于对照组1和对照组2。其中数值文本和文字文本识别准确率最高,票据类型的识别率低于前两者的原因是因为不同地区、不同医院的同一类型票据往往存在差异,可能两种不同的医疗票据,票据格式却类似,这使得系统在检测时存在误判的可能性;但随着训练样本的增大,对于不同地区、不同医院票据数据样本的收集增加,系统对于票据类型的检测准确度会进一步提高。

Claims (6)

1.一种用于人伤理赔的医疗票据信息整合方法,其特征在于,具体包括以下步骤:
S1、图像质量检测:采集票据图像,进行人工辅助识别;以票据图像是否存在严重图像不清、凭证种类错误、夹带票、金额不一致为标准,将不合格票据图像筛出并在前端提示;
S2、图像处理:将经步骤S1筛选后的票据图像进行图像倾斜校正、灰度化处理以及断点处理;
S3、建立文本候选区域:使用基于角点的检测网络对经步骤S2处理后的票据图像进行检测,输出紧密包围文本候选区域的四边形角点,得到多方向文本候选区域,并记录各文本候选区域的尺寸信息;
S4、结构化存储:对步骤S3文本候选区域的文本信息进行单字符切割,得到单字符图像;对所述单字符图像进行识别得到单字符文本;对所述单字符文本进行结构化存储;
S5、修正:对发票中医学术语的语义检测与修正;对比大小写金额对金额数值进行检测修正;
S6、匹配分类:所述步骤S4中文本候选区域中包括标题候选区域,对所述标题候选区域中的文本信息进行语义检测,以此对票据进行分类并命名:包括住院病历、诊断证明、医疗发票、费用清单和出院小结;
S7、命名:根据步骤S4中得到的文本信息,完成对票据所属人、所属医院和所属地区的命名和录入;
S8、数据入库:高置信度的票据文档自动入库;低置信度的票据文档给出警示,人工校验后入库;
S9、对后续票据进行信息提取时,先检测票据的所属医院标签信息,然后对具有相同所属医院标签的票据进行票据尺寸以及文本候选区域的尺寸信息对比,若尺寸信息适配则标识类型入库;若尺寸信息不适配,则执行步骤S6~S8。
2.如权利要求1所述的一种用于人伤理赔的医疗票据信息整合方法,其特征在于,所述步骤S2中,图像倾斜校正的具体步骤如下:
S21、不同类型的医疗票据,均存在等长且最长的直线——票据的长边缘,以及等长且第二长的直线——票据的短边缘;
S22、检测票据中长度最长的直线和长度第二长的直线,计算直线的倾斜角度;计算直线倾斜角的具体公式如下:
Figure FDA0003054655520000021
式中,(x1,y1)和(x1,y1)为检测到的目标直线上两点的坐标,θ为直线的倾斜角度;
S23、计算所有检测到的直线的倾斜角度,并求平均值,得到票据图像的倾斜角度;
S24、以票据图像的中心点为坐标原点,将票据图像的每一个像素点进行坐标旋转变换,即得到倾斜校正后的票据图像。
3.如权利要求1所述的一种用于人伤理赔的医疗票据信息整合方法,其特征在于,所述步骤S3中,基于角点的检测网络的具体检测方法如下:
S31、步骤S2处理后的票据图像首先经过用以提取特征映射图的共享卷积网络;
S32、检测分支和识别分支在步骤S31的特征映像图上运行;
S321、检测分支采用基于角点检测和位置敏感分割的方案,用来预测文本框;
S322、识别分支的分类编码器采用RNN结构,解码器采用CTC结构;
S33、所述检测网络在识别分支之前还包括将步骤S31的特征映像图的特征与检测分支的文本框结果进行融合的RoIRotate运算环节。
4.如权利要求1所述的一种用于人伤理赔的医疗票据信息整合方法,其特征在于,所述步骤S321中,角点检测的模块结构如下:
角点检测的默认文本框对应的输出包含四种角点的信息,每种角点信息有四个候选文本框的分支分值和偏移量;
角点检测采用的预测模块,以卷积的方式预测两个分支的分值和偏移量;
对于每个单元中带有k个默认文本框的m×n特征图,分值分支为每个默认文本框的每个类型角点输出的2个分值,偏移量分支为每个默认文本框的每个类型角点输出的4个偏移量;
其中,分值分支的输出通道是k×q×2,2表示该位置是否有角点存在;偏移量分支的输出通道是k×q×4;q表示角点类型,默认值为4。
5.如权利要求1所述的一种用于人伤理赔的医疗票据信息整合方法,其特征在于,所述步骤S321中,位置敏感分割的模块结构如下:
在位置敏感分割模块中,使用一个g×g大小的网格,将文本框的边界框R分成多个分块,对于每个分块来说,使用一个分割图来判断该像素是否属于对应分块,因此可处理相近或相互叠加的文本区域。
6.如权利要求1所述的一种用于人伤理赔的医疗票据信息整合方法,其特征在于,步骤S6中票据类型的命名方法,与步骤S7中票据所属人、所属医院和所属地区的命名方法原理相同,具体如下:
S71、以步骤S4中得到的文本信息判断票据是否包含标题候选区域;
S72、若票据包含标题候选区,则查找所述票据文本信息中是否存在有与词库中存储的票据类型、所属人、所属医院和所属地区匹配的关键词;
S73、若存在匹配关键词,则获取所述关键词对应的正则表达式并验证;
S74、若通过正则表达式验证,则根据所述正则表达式确定所述票据的要素;
S75、根据预设定规则和所述票据文本信息确定所述票据的命名;
S76、若票据不包含标题候选区,则检测其余候选区域,查找是否存在有与词库中存储的票据类型、所属人、所属医院和所属地区匹配的关键词;
S77、若存在匹配关键词,则重复步骤S73~S75,对票据进行命名;
S78、若票据不包含标题候选区,且其余候选区域,不存在有与词库中存储的票据类型、所属人、所属医院和所属地区匹配的关键词,则根据多张票据之间的人员姓名,药品关联性等规则进行检测,提示用户选择或者建立新标签;
S79、处理完成后的票据关键词特征存入票据数据库,供未来其它票据进行比对。
CN202110496582.7A 2021-05-07 2021-05-07 一种用于人伤理赔的医疗票据信息整合方法 Pending CN113255642A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110496582.7A CN113255642A (zh) 2021-05-07 2021-05-07 一种用于人伤理赔的医疗票据信息整合方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110496582.7A CN113255642A (zh) 2021-05-07 2021-05-07 一种用于人伤理赔的医疗票据信息整合方法

Publications (1)

Publication Number Publication Date
CN113255642A true CN113255642A (zh) 2021-08-13

Family

ID=77223902

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110496582.7A Pending CN113255642A (zh) 2021-05-07 2021-05-07 一种用于人伤理赔的医疗票据信息整合方法

Country Status (1)

Country Link
CN (1) CN113255642A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113688837A (zh) * 2021-09-29 2021-11-23 平安科技(深圳)有限公司 图像脱敏方法、装置、电子设备及计算机可读存储介质
CN113723508A (zh) * 2021-08-30 2021-11-30 杭州米数科技有限公司 票据图像分类方法、装置、计算设备和存储介质
CN114037991A (zh) * 2021-11-03 2022-02-11 北京百度网讯科技有限公司 图像质量的确定方法、装置、设备以及存储介质
CN115049512A (zh) * 2022-06-27 2022-09-13 安诚财产保险股份有限公司 一种智能理赔核算系统
CN115082728A (zh) * 2022-05-26 2022-09-20 中国平安人寿保险股份有限公司 图片分类方法、装置、设备及介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113723508A (zh) * 2021-08-30 2021-11-30 杭州米数科技有限公司 票据图像分类方法、装置、计算设备和存储介质
CN113723508B (zh) * 2021-08-30 2024-04-19 杭州米数科技有限公司 票据图像分类方法、装置、计算设备和存储介质
CN113688837A (zh) * 2021-09-29 2021-11-23 平安科技(深圳)有限公司 图像脱敏方法、装置、电子设备及计算机可读存储介质
CN114037991A (zh) * 2021-11-03 2022-02-11 北京百度网讯科技有限公司 图像质量的确定方法、装置、设备以及存储介质
CN115082728A (zh) * 2022-05-26 2022-09-20 中国平安人寿保险股份有限公司 图片分类方法、装置、设备及介质
CN115049512A (zh) * 2022-06-27 2022-09-13 安诚财产保险股份有限公司 一种智能理赔核算系统

Similar Documents

Publication Publication Date Title
US20230021040A1 (en) Methods and systems for automated table detection within documents
CN113255642A (zh) 一种用于人伤理赔的医疗票据信息整合方法
US9152859B2 (en) Property record document data verification systems and methods
US20210150338A1 (en) Identification of fields in documents with neural networks without templates
US11080910B2 (en) Method and device for displaying explanation of reference numeral in patent drawing image using artificial intelligence technology based machine learning
CN109101469B (zh) 从数字化文档提取可搜索的信息
US8041956B1 (en) Method and system for biometric authentication
US8520903B2 (en) Method and system of accounting for positional variability of biometric features
US11232300B2 (en) System and method for automatic detection and verification of optical character recognition data
US20070217715A1 (en) Property record document data validation systems and methods
CN112446351B (zh) 医疗票据智能识别方法
JP2004139484A (ja) 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
JP2007172077A (ja) 画像検索システム及び方法及びプログラム
US11232299B2 (en) Identification of blocks of associated words in documents with complex structures
US20210240932A1 (en) Data extraction and ordering based on document layout analysis
CN114092949A (zh) 类别预测模型的训练、界面元素类别的识别方法及装置
CN112396047A (zh) 训练样本生成方法、装置、计算机设备和存储介质
CN114971294A (zh) 数据采集方法、装置、设备及存储介质
US20230138491A1 (en) Continuous learning for document processing and analysis
CN114429542A (zh) 针对医疗化验单的结构化识别方法
US20070217691A1 (en) Property record document title determination systems and methods
US20140181124A1 (en) Method, apparatus, system and storage medium having computer executable instrutions for determination of a measure of similarity and processing of documents
CN116311299A (zh) 表格的结构化数据识别方法、装置及系统
CN110008282A (zh) 交易数据同步对接方法、装置、计算机设备及存储介质
CN112560849B (zh) 基于神经网络算法的文理分割方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination