CN110675270A - 基于发票信息的医保扣费金额的确定方法和装置 - Google Patents

基于发票信息的医保扣费金额的确定方法和装置 Download PDF

Info

Publication number
CN110675270A
CN110675270A CN201910837926.9A CN201910837926A CN110675270A CN 110675270 A CN110675270 A CN 110675270A CN 201910837926 A CN201910837926 A CN 201910837926A CN 110675270 A CN110675270 A CN 110675270A
Authority
CN
China
Prior art keywords
invoice
medical
deduction
information
medical item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910837926.9A
Other languages
English (en)
Inventor
龙科家
孙剑立
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Health Insurance Company of China Ltd
Original Assignee
Ping An Health Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Health Insurance Company of China Ltd filed Critical Ping An Health Insurance Company of China Ltd
Priority to CN201910837926.9A priority Critical patent/CN110675270A/zh
Publication of CN110675270A publication Critical patent/CN110675270A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Artificial Intelligence (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Technology Law (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明实施例提供了一种基于发票信息的医保扣费金额的确定方法和装置。该方法涉及人工智能技术领域,该方法包括:识别发票中预设字段的信息;将发票中预设字段的信息输入预先训练好的模型,模型输出发票包括的医疗项目、医疗项目相关的支出、医疗项目的扣费比例;将模型输出的医疗项目与保险合同中指定的医疗项目进行匹配,筛选出匹配成功的医疗项目;根据医疗项目相关的支出与扣费比例计算每个匹配成功的医疗项目的扣费金额;根据所有匹配成功的医疗项目的扣费金额计算赔付金额;输出赔付金额。本发明实施例提供的技术方案能够解决人工计算赔付金额效率较低的问题。

Description

基于发票信息的医保扣费金额的确定方法和装置
【技术领域】
本发明涉及人工智能领域,尤其涉及一种基于发票信息的医保扣费金额的确定方法和装置。
【背景技术】
由于医保报销的比例不是100%,有些人会选择购买保险公司的医疗保险来进行保障,当客户产生医疗方面的花费后,保险公司需要根据客户的发票来进行赔付(即根据保险合同付款给客户)。
目前,赔付金额的计算由人工完成,效率较低。
【发明内容】
有鉴于此,本发明实施例提供了一种基于发票信息的医保扣费金额的确定方法和装置,用以解决人工计算赔付金额效率较低的问题。
本发明实施例提供了一种基于发票信息的医保扣费金额的确定方法,所述方法包括:识别发票中预设字段的信息;将所述发票中所述预设字段的信息输入预先训练好的模型,所述模型输出所述发票包括的医疗项目、所述医疗项目相关的支出、所述医疗项目的扣费比例;将所述模型输出的所述医疗项目与保险合同中指定的医疗项目进行匹配,筛选出匹配成功的医疗项目;根据医疗项目相关的支出与扣费比例计算每个匹配成功的医疗项目的扣费金额;根据所有匹配成功的医疗项目的扣费金额计算赔付金额;输出所述赔付金额。
进一步地,所述预设字段至少包括以下之一:用于表示所述医疗项目的名称的字段、用于表示每个所述医疗项目产生的费用的字段、用于表示总支付费用的字段。
进一步地,所述医疗项目至少包括以下之一:药品、治疗过程中使用的医疗器械、检查项目。
进一步地,所述识别发票中预设字段的信息,包括:采集发票图像;对所述发票图像进行二值化处理;基于所述发票的版式将二值化处理后的发票图像分割成多个子图像,其中,每个所述子图像包含至少一个所述预设字段的信息;识别每个所述子图像中所述预设字段的信息。
进一步地,所述对所述发票图像进行二值化处理,包括:将所述发票图像进行灰度化处理;将灰度化处理后的发票图像等分为N个子区域,所述N的取值由所述发票上字符的笔画宽度确定;在所述N个子区域中的每个子区域,利用最大类间方差方法确定图像二值化阈值,并根据所述图像二值化阈值对每个所述子区域进行图像二值化处理。
本发明实施例提供了一种基于发票信息的医保扣费金额的确定装置,所述装置包括:识别单元,用于识别发票中预设字段的信息;输入单元,用于将所述发票中所述预设字段的信息输入预先训练好的模型,所述模型输出所述发票包括的医疗项目、所述医疗项目相关的支出、所述医疗项目的扣费比例;筛选单元,用于将所述模型输出的所述医疗项目与保险合同中指定的医疗项目进行匹配,筛选出匹配成功的医疗项目;第一计算单元,用于根据医疗项目相关的支出与扣费比例计算每个匹配成功的医疗项目的扣费金额;第二计算单元,用于根据所有匹配成功的医疗项目的扣费金额计算赔付金额;输出单元,用于输出所述赔付金额。
进一步地,所述预设字段至少包括以下之一:用于表示所述医疗项目的名称的字段、用于表示每个所述医疗项目产生的费用的字段、用于表示总支付费用的字段。
进一步地,所述医疗项目至少包括以下之一:药品、治疗过程中使用的医疗器械、检查项目。
进一步地,所述识别单元包括:采集子单元,用于采集发票图像;二值化处理子单元,用于对所述发票图像进行二值化处理;分割子单元,用于基于所述发票的版式将二值化处理后的发票图像分割成多个子图像,其中,每个所述子图像包含至少一个所述预设字段的信息;识别子单元,用于识别每个所述子图像中所述预设字段的信息。
进一步地,所述二值化处理子单元包括:灰度化处理模块,用于将所述发票图像进行灰度化处理;等分模块,用于将灰度化处理后的发票图像等分为N个子区域,所述N的取值由所述发票上字符的笔画宽度确定;二值化处理模块,用于在所述N个子区域中的每个子区域,利用最大类间方差方法确定图像二值化阈值,并根据所述图像二值化阈值对每个所述子区域进行图像二值化处理。
本发明实施例提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述的基于发票信息的医保扣费金额的确定方法。
本发明实施例提供了一种计算机设备,包括存储器和处理器,所述存储器用于存储包括程序指令的信息,所述处理器用于控制程序指令的执行,所述程序指令被处理器加载并执行时实现上述的基于发票信息的医保扣费金额的确定方法的步骤。
在本发明实施例中,识别发票中预设字段的信息;将发票中预设字段的信息输入预先训练好的模型,模型输出发票包括的医疗项目、医疗项目相关的支出、医疗项目的扣费比例;将模型输出的医疗项目与保险合同中指定的医疗项目进行匹配,筛选出匹配成功的医疗项目;根据医疗项目相关的支出与扣费比例计算每个匹配成功的医疗项目的扣费金额;根据所有匹配成功的医疗项目的扣费金额计算赔付金额;输出赔付金额,解决了人工计算赔付金额效率较低的问题,提高了计算赔付金额的效率。
【附图说明】
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1是根据本发明第一实施例的基于发票信息的医保扣费金额的确定方法的流程图;
图2-1至图2-4是根据本发明一实施例的发票的示意图;
图3是根据本发明第二实施例的基于发票信息的医保扣费金额的确定方法的流程图;
图4是根据本发明第三实施例的基于发票信息的医保扣费金额的确定方法的流程图;
图5是根据本发明第四实施例的基于发票信息的医保扣费金额的确定装置的示意图;
图6是根据本发明第五实施例的基于发票信息的医保扣费金额的确定装置的示意图;
图7是根据本发明第六实施例的基于发票信息的医保扣费金额的确定装置的示意图;
图8是本发明实施例提供的一种计算机设备的示意图。
【具体实施方式】
为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
请参见图1,所示为本发明第一实施例提供的一种基于发票信息的医保扣费金额的确定方法的流程图,包括:
步骤S101,识别发票中预设字段的信息。
发票上包括的信息有:药品名称、药品编码、数量、单价、总价、药品类别等。
药品类别指的是该药品是甲类药、乙类药还是丙类药。
基本医疗保险国家药品目录将药品分为三类:甲类药、乙类药、丙类药。
甲类药,可以全部进入医保报销范围,按医保比例报销。
乙类药,用此类药需个人先按一定的比例承担部分费用后,剩余部分进入医保报销范围,按医保比例报销。
丙类药,这部分的药是不报销的,全部由个人承担。
“甲类”药品是临床治疗必需的,使用广泛、疗效好,同类药品中价格较低的药品;由国家统一制定,各地不得调整,使用“甲类药品”所发生的费用,按基本医疗保险的规定支付。
“乙类”药品是可供临床治疗选择使用,疗效好,同类药品中比“甲类”药品价格略高;“乙类药品”由国家制定,各省、市、区根据当地经济水平、医疗需求和用药习惯适当进行调整,但不能超过国家制定“乙类药品”。
预设字段至少包括以下之一:用于表示医疗项目的名称的字段、用于表示每个医疗项目产生的费用的字段、用于表示总支付费用的字段。
医疗项目至少包括以下之一:药品、治疗过程中使用的医疗器械、检查项目。
步骤S102,将发票中预设字段的信息输入预先训练好的模型,模型输出发票包括的医疗项目、医疗项目相关的支出、医疗项目的扣费比例。
医疗项目的扣费比例与当地政府的政策是有关的,例如,对于同一个医疗项目,上海的扣费比例与石家庄的扣费比例可能是不同的。
模型输出发票中的医疗项目、医疗项目相关的支出、医疗项目的扣费比例,具体地,模型输出发票中药品的名称及其分类、药品相关的支出、药品的扣费比例。需要注意的是,医保报销的部分保险公司无需再赔付。模型输出的药品中可以包含乙类药,乙类药的扣费比例与当地政府的政策是有关的,例如,某市规定乙类药个人承担部分是20%,则扣费比例为20%;再例如,某市规定乙类药个人承担部分是10%,则扣费比例为10%。
上述模型在使用前,需要基于各地的政策、经验等进行训练。不同地区使用的发票上包含的信息不同。第一种情况,发票上包含的药物没有具体的自付比例的,采用基本算法是将该单项收费按照5%、10%、15%、20%的比同比例算出自付值与发票总的自付值匹配。人工专家辅助的方式是人工对此类发票进行扣费,此发票分类自付是0元,说明费用中是没有乙类需要扣费的,故实际的扣费将不再扣除分类自付,此类的结果将会输入模型,模型会记录发票上指示的这个医院的这两个药物是不需要扣费的,下次类似发票进入该系统后也不会再扣这两个药物的自付费用。第二种情况,发票上显示有自付,但是没有比例,总的自付金额费发票上也没有,按照通用规则是扣费失败的。例如,人工会根据经验及查询数据库判断出诊疗费有2元是属于自付的,将扣除2元。系统将记录人工的扣费方法,此类单据再次进入自动扣费系统后,会直接记录上次的扣费结论对诊疗费扣2元。第三种情况,发票只包含了收费药品名字,无自付自费比例,也没有总的自付自费比例。人工处理方式是按照发票开具的省市查询相应的表格,查询对应的药物的自付比例。此结果可以输入给模型,模型可以记忆扣费的结论,当出现无自付比例、无总的自付的情况下,可按照人工的操作方式进行扣费。
下面对上述模型如何进行训练进行说明。
模型训练方法,根据业务需求针对医保就诊的就诊发票挑选出不同医院的发票影像若干(例如,10000张),去除模糊、曝光暗淡、扭曲变形的图像。由资深的业务人员对发票上扣费使用的关键字段进行标注,如图2-1中椭圆所示。通过OCR对发票票面的信息进行解析,将图像上的信息转化为结构化信息。结构化信息结合过去人工扣费总结的扣费经验以及各地医保的目录库,对每一个费用项目进行匹配,满足输出规则时输出扣费结果,替代过去的人工扣费。
因发票的样式具有多样性,故建模过程需要对不同类型的发票进行分别建模。如上海一级、二级、三级医院就诊挂号发票的样式就不相同,需要对各级别医院建立不一样的OCR解析模板,并进行不同的训练及输出规则设置。学习方式也需要设定不同的规则,如上海的一级医院,门诊发票上显示收费为7元,但其实该笔费用由医保全部支付,需全部扣费不再重复赔付。二级及三级医院门诊挂号发票中存在一些费用项虽然发票上标注为乙类或丙类,但实际上该药物或检查费用已纳入了已报名录,此类问题都需要先制定规则,然后设置在模型输出规则之中。
模型训练过程中,使用了以下深度学习技术进行模型的训练。
(1)卷积:即数字图像处理中,采用线性滤波,待处理的平面数字图像可被看做一个大矩阵,图像的每个像素对应着矩阵的每个元素,假设分辨率是1024*768,那么对应的大矩阵的行数=1024,列数=768,用于滤波的是一个滤波器小矩阵(也叫卷积核),滤波器小矩阵一般是个方阵,也就是行数和列数相同,比如常见的用于边缘检测的Sobel算子就是两个3*3的小矩阵,进行滤波就是对于大矩阵中的每个像素,计算它周围像素和滤波器矩阵对应位置元素的乘积,然后把结果相加到一起,最终得到的值就作为该像素的新值,这样就完成了一次滤波。通过卷积将图像进行分区分析,提取分区中的关键信息。此方法可有效处理因打印串行、套打导致数据缺失,避免数据输出错误或趋势。
(2)自然语言处理(NLP):针对输出的数据结果需要与数据库进行匹配,模型训练过程中使用了NLP技术,对词汇进行向量化表示,将发票上“头孢呋辛钠”与系统中的“头孢呋辛注射液”相匹配,确定是否属于医保目录。
(3)梯度策略算法:针对发票上就诊费用信息,结合医保的扣费比例进行穷举计算,先校验发票有无自费,无自费直接进入自付的逻辑校验,如有自费,根据自费金额,例:27.48元(请参见图2-2),每一个细项按照取100%(如表1所示),分别计算值,按照排列组合,匹配自费金额得出,为西药费用代码下有27.48元的自费,自费金额归属到该费用项下回传。
表1
费用项 金额 100%
美能片 239.78 239.78
去氯乳膏 27.48 27.48
甲氨蝶呤片 33.6 33.6
普特彼软膏 131.3 131.3
再校验发票有无自付,无自费直接进入自付的逻辑校验,如有自付,根据自付金额,例:12元(请参见图2-3),每一个细项按照取5%,10%,15%,20%(如表2所示),分别计算值,按照排列组合,匹配自付金额得出,因未匹配出结果,转人工辅助扣费。
表2
费用项 金额 0% 5% 10% 15% 20%
彩色多普勒 150 0 7.5 15 22.5 30
彩色打印照片 12 0 0.6 1.2 1.8 2.4
HCG早孕测定 8 0 0.4 0.8 1.2 1.6
医学影像工作站 30 0 1.5 3 4.5 6
再校验发票有无自付,无自付直接进入自付的逻辑校验,如有自付,根据自付金额,例:9.4元(请参见图2-4),每一个细项按照取5%,10%,15%,20%(如表3所示),分别计算值,按照排列组合,匹配自付金额得出,得出所在自付金额归属到该费用项下回传。
表3
费用项 金额 0% 5% 10% 15% 20%
苯磺酸氨氯地平片 119.52 0 5.976 11.952 17.928 23.904
乳果糖口服液 64.5 0 3.225 6.45 9.675 12.9
金喉剑喷雾剂 38.48 0 1.924 3.848 5.772 7.696
叶酸片 7.93 0 0.3965 0.793 1.1895 1.586
琥珀酸美托洛尔 29.64 0 1.482 2.964 4.446 5.928
整个逻辑是每一步如果有无法匹配或者有多种匹配结果的情况下,都转到人工扣费辅助。
(4)监督学习:针对模型输出的结果进行人工督促监督,对每一个输出结果跑都进行验证,对于输出错误的进行人工干预质检后返回给系统重新训练,直到输出结果正确。
步骤S103,将模型输出的医疗项目与保险合同中指定的医疗项目进行匹配,筛选出匹配成功的医疗项目。
不同的保险合同指定的医疗项目可以不同,例如,赔付金额高的保险合同一般可以指定较多的医疗项目;赔付金额低的保险合同一般指定较少的医疗项目。
步骤S104,根据医疗项目相关的支出与扣费比例计算每个匹配成功的医疗项目的扣费金额。
步骤S105,根据所有匹配成功的医疗项目的扣费金额计算赔付金额。
根据匹配成功的医疗项目的扣费金额计算赔付金额,具体可以是:将所有匹配成功的医疗项目的扣费金额进行相加,得到赔付金额。
例如,假设识别出某一张发票中有A医疗项目和B医疗项目,其中,A医疗项目相关的支出是100元,扣费比例是10%;B医疗项目相关的支出是200元,扣费比例是20%。假设保险合同中指定的医疗项目既包括A医疗项目又包括B医疗项目,则赔付金额为50元(100元×10%+200元×20%=50元)。假设保险合同中指定的医疗项目包括A医疗项目,并且不包括B医疗项目,则赔付金额为10元(100元×10%=10元)。假设保险合同中指定的医疗项目包括B医疗项目,并且不包括A医疗项目,则赔付金额为40元(200元×20%=40元)。
步骤S106,输出赔付金额。
在本发明实施例中,识别发票中预设字段的信息;将发票中预设字段的信息输入预先训练好的模型,模型输出发票包括的医疗项目、医疗项目相关的支出、医疗项目的扣费比例;将模型输出的医疗项目与保险合同中指定的医疗项目进行匹配,筛选出匹配成功的医疗项目;根据医疗项目相关的支出与扣费比例计算每个匹配成功的医疗项目的扣费金额;根据所有匹配成功的医疗项目的扣费金额计算赔付金额;输出赔付金额,解决了人工计算赔付金额效率较低的问题,提高了计算赔付金额的效率。
请参见图3,所示为本发明第二实施例提供的一种基于发票信息的医保扣费金额的确定方法的流程图。图3所示的方法与图1所示的方法相比,区别在于图3所示的方法中,步骤S101具体包括:步骤S201至步骤S204。
步骤S201,采集发票图像。
步骤S202,对发票图像进行二值化处理。
步骤S203,基于发票的版式将二值化处理后的发票图像分割成多个子图像,其中,每个子图像包含至少一个预设字段的信息。
步骤S204,识别每个子图像中预设字段的信息。
识别预设字段的信息,具体地,可以采用OCR(Optical Character Recognition,光学字符识别)方式识别。OCR是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。
对发票图像进行二值化处理是为了适应环境光照等带来的影响,使得能够高准确度地识别出在不同光照下采集的发票图像。
请参见图4,所示为本发明第三实施例提供的一种基于发票信息的医保扣费金额的确定方法的流程图。图4所示的方法与图3所示的方法相比,区别在于图4所示的方法中,步骤S202具体包括:步骤S301至步骤S303。
步骤S301,将发票图像进行灰度化处理。
步骤S302,将灰度化处理后的发票图像等分为N个子区域,N的取值由发票上字符的笔画宽度确定。
步骤S303,在N个子区域中的每个子区域,利用最大类间方差方法确定图像二值化阈值,并根据图像二值化阈值对每个子区域进行图像二值化处理。
基于发票的版式将二值化处理后的发票图像分割成多个子图像,分割成的子图像包括第一类子图像和第二类子图像,第一类子图像是包含单栏文本块的子图像,第二类子图像是包含多栏文本块的子图像。
单栏文本块包括发票涉及的医疗机构名称、医疗机构类型、门诊号、流水号等。
多栏文本块包含药品名称、药品编码、数量、单价、总价、药品类别等。
下面描述对第二类子图像进行识别的过程。本发明实施例中将文本行分为纯数字串(如金额)和中文字符串两种,分别进行识别处理。文本行的识别过程为:首先进行基于垂直投影分析的行字符分割,然后采用动态规划的方法计算最优分割路径,得到字符识别结果。对于纯数字串的识别,对每个候选字符分割块,首先计算八方向梯度特征,并进行降维,然后在降维后的特征矢量空间中,利用最近邻方法进行分类,得到每个候选字符的识别可信度,并代入到文本行识别的最优分割路径计算中。对于中文字符串的识别,对每个候选字符分割块,首先计算八方向梯度特征,并进行降维。在降维后的特征矢量空间中,利用最近邻方法进行分类,得到每个候选字符的识别可信度,并将识别可信度与二元语言模型信息,以及相邻候选字符分割块的宽高比等几何信息进行综合,并将综合后的识别可信度代入到文本行识别的最优分割路径计算中。
请参见图5,所示为本发明第四实施例提供的一种基于发票信息的医保扣费金额的确定装置的示意图,该装置用于执行本发明第一实施例提供的基于发票信息的医保扣费金额的确定方法,该装置包括:识别单元41、输入单元42、筛选单元43、第一计算单元44、第二计算单元45、输出单元46。
识别单元41,用于识别发票中预设字段的信息。
输入单元42,用于将发票中预设字段的信息输入预先训练好的模型,模型输出发票包括的医疗项目、医疗项目相关的支出、医疗项目的扣费比例。
筛选单元43,用于将模型输出的医疗项目与保险合同中指定的医疗项目进行匹配,筛选出匹配成功的医疗项目。
第一计算单元44,用于根据医疗项目相关的支出与扣费比例计算每个匹配成功的医疗项目的扣费金额。
第二计算单元45,用于根据所有匹配成功的医疗项目的扣费金额计算赔付金额。
输出单元46,用于输出赔付金额。
在本发明实施例中,识别发票中预设字段的信息;将发票中预设字段的信息输入预先训练好的模型,模型输出发票包括的医疗项目、医疗项目相关的支出、医疗项目的扣费比例;将模型输出的医疗项目与保险合同中指定的医疗项目进行匹配,筛选出匹配成功的医疗项目;根据医疗项目相关的支出与扣费比例计算每个匹配成功的医疗项目的扣费金额;根据所有匹配成功的医疗项目的扣费金额计算赔付金额;输出赔付金额,解决了人工计算赔付金额效率较低的问题,提高了计算赔付金额的效率。
可选地,预设字段至少包括以下之一:用于表示医疗项目的名称的字段、用于表示每个医疗项目产生的费用的字段、用于表示总支付费用的字段。
可选地,医疗项目至少包括以下之一:药品、治疗过程中使用的医疗器械、检查项目。
请参见图6,所示为本发明第五实施例提供的一种基于发票信息的医保扣费金额的确定装置的示意图,该装置用于执行本发明第二实施例提供的基于发票信息的医保扣费金额的确定方法,与图5所示的装置的区别在于,图6所示的装置的识别单元41具体包括:采集子单元51、二值化处理子单元52、分割子单元53、识别子单元54。
采集子单元51,用于采集发票图像。
二值化处理子单元52,用于对发票图像进行二值化处理。
分割子单元53,用于基于发票的版式将二值化处理后的发票图像分割成多个子图像,其中,每个子图像包含至少一个预设字段的信息。
识别子单元54,用于识别每个子图像中预设字段的信息。
请参见图7,所示为本发明第六实施例提供的一种基于发票信息的医保扣费金额的确定装置的示意图,该装置用于执行本发明第三实施例提供的基于发票信息的医保扣费金额的确定方法,与图6所示的装置的区别在于,图7所示的装置的二值化处理子单元52具体包括:灰度化处理模块61、等分模块62、二值化处理模块63。
灰度化处理模块61,用于将发票图像进行灰度化处理。
等分模块62,用于将灰度化处理后的发票图像等分为N个子区域,N的取值由发票上字符的笔画宽度确定。
二值化处理模块63,用于在N个子区域中的每个子区域,利用最大类间方差方法确定图像二值化阈值,并根据图像二值化阈值对每个子区域进行图像二值化处理。
本发明实施例提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行以下步骤:识别发票中预设字段的信息;将发票中预设字段的信息输入预先训练好的模型,模型输出发票包括的医疗项目、医疗项目相关的支出、医疗项目的扣费比例;将模型输出的医疗项目与保险合同中指定的医疗项目进行匹配,筛选出匹配成功的医疗项目;根据医疗项目相关的支出与扣费比例计算每个匹配成功的医疗项目的扣费金额;根据所有匹配成功的医疗项目的扣费金额计算赔付金额;输出赔付金额。
可选地,在程序运行时控制存储介质所在设备还执行以下步骤:采集发票图像;对发票图像进行二值化处理;基于发票的版式将二值化处理后的发票图像分割成多个子图像,其中,每个子图像包含至少一个预设字段的信息;识别每个子图像中预设字段的信息。
可选地,在程序运行时控制存储介质所在设备还执行以下步骤:将发票图像进行灰度化处理;将灰度化处理后的发票图像等分为N个子区域,N的取值由发票上字符的笔画宽度确定;在N个子区域中的每个子区域,利用最大类间方差方法确定图像二值化阈值,并根据图像二值化阈值对每个子区域进行图像二值化处理。
本发明实施例提供了一种计算机设备,包括存储器和处理器,存储器用于存储包括程序指令的信息,处理器用于控制程序指令的执行,程序指令被处理器加载并执行时实现以下步骤:识别发票中预设字段的信息;将发票中预设字段的信息输入预先训练好的模型,模型输出发票包括的医疗项目、医疗项目相关的支出、医疗项目的扣费比例;将模型输出的医疗项目与保险合同中指定的医疗项目进行匹配,筛选出匹配成功的医疗项目;根据医疗项目相关的支出与扣费比例计算每个匹配成功的医疗项目的扣费金额;根据所有匹配成功的医疗项目的扣费金额计算赔付金额;输出赔付金额。
可选地,程序指令被处理器加载并执行时还实现以下步骤:采集发票图像;对发票图像进行二值化处理;基于发票的版式将二值化处理后的发票图像分割成多个子图像,其中,每个子图像包含至少一个预设字段的信息;识别每个子图像中预设字段的信息。
可选地,程序指令被处理器加载并执行时还实现以下步骤:将发票图像进行灰度化处理;将灰度化处理后的发票图像等分为N个子区域,N的取值由发票上字符的笔画宽度确定;在N个子区域中的每个子区域,利用最大类间方差方法确定图像二值化阈值,并根据图像二值化阈值对每个子区域进行图像二值化处理。
图8是本发明实施例提供的一种计算机设备的示意图。如图8所示,该实施例的计算机设备70包括:处理器71、存储器72以及存储在存储器72中并可在处理器71上运行的计算机程序73,该计算机程序73被处理器71执行时实现实施例中的基于发票信息的医保扣费金额的确定方法,为避免重复,此处不一一赘述。或者,该计算机程序被处理器71执行时实现实施例中基于发票信息的医保扣费金额的确定装置中各模型/单元的功能,为避免重复,此处不一一赘述。
计算机设备70可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。计算机设备可包括,但不仅限于,处理器71、存储器72。本领域技术人员可以理解,图8仅仅是计算机设备70的示例,并不构成对计算机设备70的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如计算机设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器71可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器72可以是计算机设备70的内部存储单元,例如计算机设备70的硬盘或内存。存储器72也可以是计算机设备70的外部存储设备,例如计算机设备70上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器72还可以既包括计算机设备70的内部存储单元也包括外部存储设备。存储器72用于存储计算机程序以及计算机设备所需的其他程序和数据。存储器72还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (10)

1.一种基于发票信息的医保扣费金额的确定方法,其特征在于,所述方法包括:
识别发票中预设字段的信息;
将所述发票中所述预设字段的信息输入预先训练好的模型,所述模型输出所述发票包括的医疗项目、所述医疗项目相关的支出、所述医疗项目的扣费比例;
将所述模型输出的所述医疗项目与保险合同中指定的医疗项目进行匹配,筛选出匹配成功的医疗项目;
根据医疗项目相关的支出与扣费比例计算每个匹配成功的医疗项目的扣费金额;
根据所有匹配成功的医疗项目的扣费金额计算赔付金额;
输出所述赔付金额。
2.根据权利要求1所述的方法,其特征在于,所述预设字段至少包括以下之一:用于表示所述医疗项目的名称的字段、用于表示每个所述医疗项目产生的费用的字段、用于表示总支付费用的字段。
3.根据权利要求1所述的方法,其特征在于,所述医疗项目至少包括以下之一:药品、治疗过程中使用的医疗器械、检查项目。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述识别发票中预设字段的信息,包括:
采集发票图像;
对所述发票图像进行二值化处理;
基于所述发票的版式将二值化处理后的发票图像分割成多个子图像,其中,每个所述子图像包含至少一个所述预设字段的信息;
识别每个所述子图像中所述预设字段的信息。
5.根据权利要求4所述的方法,其特征在于,所述对所述发票图像进行二值化处理,包括:
将所述发票图像进行灰度化处理;
将灰度化处理后的发票图像等分为N个子区域,所述N的取值由所述发票上字符的笔画宽度确定;
在所述N个子区域中的每个子区域,利用最大类间方差方法确定图像二值化阈值,并根据所述图像二值化阈值对每个所述子区域进行图像二值化处理。
6.一种基于发票信息的医保扣费金额的确定装置,其特征在于,所述装置包括:
识别单元,用于识别发票中预设字段的信息;
输入单元,用于将所述发票中所述预设字段的信息输入预先训练好的模型,所述模型输出所述发票包括的医疗项目、所述医疗项目相关的支出、所述医疗项目的扣费比例;
筛选单元,用于将所述模型输出的所述医疗项目与保险合同中指定的医疗项目进行匹配,筛选出匹配成功的医疗项目;
第一计算单元,用于根据医疗项目相关的支出与扣费比例计算每个匹配成功的医疗项目的扣费金额;
第二计算单元,用于根据所有匹配成功的医疗项目的扣费金额计算赔付金额;
输出单元,用于输出所述赔付金额。
7.根据权利要求6所述的装置,其特征在于,所述预设字段至少包括以下之一:用于表示所述医疗项目的名称的字段、用于表示每个所述医疗项目产生的费用的字段、用于表示总支付费用的字段。
8.根据权利要求6所述的装置,其特征在于,所述医疗项目至少包括以下之一:药品、治疗过程中使用的医疗器械、检查项目。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至5中任意一项所述的基于发票信息的医保扣费金额的确定方法。
10.一种计算机设备,包括存储器和处理器,所述存储器用于存储包括程序指令的信息,所述处理器用于控制程序指令的执行,其特征在于:所述程序指令被处理器加载并执行时实现权利要求1至5任意一项所述的基于发票信息的医保扣费金额的确定方法的步骤。
CN201910837926.9A 2019-09-05 2019-09-05 基于发票信息的医保扣费金额的确定方法和装置 Pending CN110675270A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910837926.9A CN110675270A (zh) 2019-09-05 2019-09-05 基于发票信息的医保扣费金额的确定方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910837926.9A CN110675270A (zh) 2019-09-05 2019-09-05 基于发票信息的医保扣费金额的确定方法和装置

Publications (1)

Publication Number Publication Date
CN110675270A true CN110675270A (zh) 2020-01-10

Family

ID=69076521

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910837926.9A Pending CN110675270A (zh) 2019-09-05 2019-09-05 基于发票信息的医保扣费金额的确定方法和装置

Country Status (1)

Country Link
CN (1) CN110675270A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112907137A (zh) * 2021-03-26 2021-06-04 平安科技(深圳)有限公司 医保策略评估方法、装置和计算机设备
CN114445842A (zh) * 2022-01-25 2022-05-06 杭州海量信息技术有限公司 一种用于医疗票据ocr的医保目录匹配方法
CN113743336B (zh) * 2021-09-08 2023-06-20 平安科技(深圳)有限公司 基于深度学习的发票信息识别方法、装置和计算机设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150093018A1 (en) * 2013-09-27 2015-04-02 Kofax, Inc. Systems and methods for three dimensional geometric reconstruction of captured image data
CN105528604A (zh) * 2016-01-31 2016-04-27 华南理工大学 一种基于ocr的票据自动识别与处理系统
CN108257024A (zh) * 2017-04-14 2018-07-06 平安科技(深圳)有限公司 一种理赔案件处理方法和装置
CN108345880A (zh) * 2018-01-26 2018-07-31 金蝶软件(中国)有限公司 发票识别方法、装置、计算机设备和存储介质
CN108520465A (zh) * 2017-09-13 2018-09-11 平安科技(深圳)有限公司 医疗保险理赔方法、装置、计算机设备及存储介质
CN109409326A (zh) * 2018-11-09 2019-03-01 四川长虹电器股份有限公司 一种基于增值税发票电子数据自动记账生成凭证的方法
CN109711402A (zh) * 2018-12-14 2019-05-03 杭州睿琪软件有限公司 一种医疗单据识别方法及计算机可读存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150093018A1 (en) * 2013-09-27 2015-04-02 Kofax, Inc. Systems and methods for three dimensional geometric reconstruction of captured image data
CN105528604A (zh) * 2016-01-31 2016-04-27 华南理工大学 一种基于ocr的票据自动识别与处理系统
CN108257024A (zh) * 2017-04-14 2018-07-06 平安科技(深圳)有限公司 一种理赔案件处理方法和装置
CN108520465A (zh) * 2017-09-13 2018-09-11 平安科技(深圳)有限公司 医疗保险理赔方法、装置、计算机设备及存储介质
CN108345880A (zh) * 2018-01-26 2018-07-31 金蝶软件(中国)有限公司 发票识别方法、装置、计算机设备和存储介质
CN109409326A (zh) * 2018-11-09 2019-03-01 四川长虹电器股份有限公司 一种基于增值税发票电子数据自动记账生成凭证的方法
CN109711402A (zh) * 2018-12-14 2019-05-03 杭州睿琪软件有限公司 一种医疗单据识别方法及计算机可读存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112907137A (zh) * 2021-03-26 2021-06-04 平安科技(深圳)有限公司 医保策略评估方法、装置和计算机设备
CN113743336B (zh) * 2021-09-08 2023-06-20 平安科技(深圳)有限公司 基于深度学习的发票信息识别方法、装置和计算机设备
CN114445842A (zh) * 2022-01-25 2022-05-06 杭州海量信息技术有限公司 一种用于医疗票据ocr的医保目录匹配方法
CN114445842B (zh) * 2022-01-25 2022-09-20 杭州海量信息技术有限公司 一种用于医疗票据ocr的医保目录匹配方法

Similar Documents

Publication Publication Date Title
US9639900B2 (en) Systems and methods for tax data capture and use
CN110675270A (zh) 基于发票信息的医保扣费金额的确定方法和装置
CN112036295B (zh) 票据图像处理方法、装置、存储介质及电子设备
CN109698016A (zh) 疾病自动编码方法及装置
CN110738573A (zh) 基于分类器的数据处理方法、设备、存储介质及装置
KR102145858B1 (ko) 문서 이미지로부터 인식된 용어를 표준화하기 위한 방법
Bart et al. Information extraction by finding repeated structure
Oad et al. Blockchain-enabled transaction scanning method for money laundering detection
CN115206512B (zh) 基于物联网的医院信息管理方法及装置
US11887393B2 (en) End-to-end system for extracting tabular data present in electronic documents and method thereof
CN112885423A (zh) 疾病标签检测方法、装置、电子设备及存储介质
Gupta et al. Application of convolutional neural networks for COVID-19 detection in X-ray images using inceptionV3 and U-Net
AU2023203409B2 (en) Generalizable key-value set extraction from documents using machine learning models
Pandey et al. AI-based Integrated Approach for the Development of Intelligent Document Management System (IDMS)
Kim et al. An automatic icd coding network using partition-based label attention
Lin et al. Automatic receipt recognition system based on artificial intelligence technology
Ding et al. Bone age estimation from carpal radiography images using deep learning
CN111428725A (zh) 数据结构化处理方法、装置和电子设备
CN115101186B (zh) 基于大数据的医院就诊信息管理方法及装置
US20160321499A1 (en) Learn-Sets from Document Images and Stored Values for Extraction Engine Training
CN113886538B (zh) 医保报销信息查询方法、装置、电子设备和存储介质
Chumuang et al. Handwritten character strings on medical prescription reading by using lexicon-driven
Sahoo et al. A multistage framework for respiratory disease detection and assessing severity in chest X-ray images
JP7561114B2 (ja) 情報分析支援方法及び情報分析支援システム
US20240354185A1 (en) Apparatus and method for data fault detection and repair

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination