CN113450922B - 基于账单获取疾病类型的方法、装置、计算机设备及存储介质 - Google Patents

基于账单获取疾病类型的方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN113450922B
CN113450922B CN202110724221.3A CN202110724221A CN113450922B CN 113450922 B CN113450922 B CN 113450922B CN 202110724221 A CN202110724221 A CN 202110724221A CN 113450922 B CN113450922 B CN 113450922B
Authority
CN
China
Prior art keywords
item
disease
charging
toll
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110724221.3A
Other languages
English (en)
Other versions
CN113450922A (zh
Inventor
王燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Pension Insurance Corp
Original Assignee
Ping An Pension Insurance Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Pension Insurance Corp filed Critical Ping An Pension Insurance Corp
Priority to CN202110724221.3A priority Critical patent/CN113450922B/zh
Publication of CN113450922A publication Critical patent/CN113450922A/zh
Application granted granted Critical
Publication of CN113450922B publication Critical patent/CN113450922B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Pathology (AREA)
  • Economics (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Development Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了基于账单获取疾病类型的方法、装置、计算机设备及存储介质,属于数据处理领域。本发明提供的基于账单获取疾病类型的方法可识别账单图像以得到收费数据,利用预设条件对收费数据进行筛选过滤干扰信息获取第一收费项;通过预设疾病模型识别第一收费项是否属于疾病模型中对应的疾病,若是,则可确认第一收费项的疾病类型;若否,可将第一收费项与历史疾病项目集中的数据进行匹配,基于匹配的疾病类型占比确定相应的疾病类型,无需人工操作,用时短、效率高。

Description

基于账单获取疾病类型的方法、装置、计算机设备及存储介质
技术领域
本发明涉及数据处理领域,尤其涉及基于账单获取疾病类型的方法、装置、计算机设备及存储介质。
背景技术
保险作为一种保障机制,已融入到人们的日常生活中。当用户发送保险事故时,可依据与理赔相关的理赔账单向保险公司申请理赔,从而获取理赔费用。目前保险行业理赔业务能够实现自动识别理赔账单上的医疗费用及费用项目等信息,由于理赔账单无疾病诊断信息,因此无法从理赔账单获知疾病类型,需要理赔相关人员人工查询及录入疾病类型,耗时且效率低。
发明内容
针对现有的保险理赔无法从理赔账单中获取疾病类型的问题,现提供一种旨在可自动对理赔账单进行识别以获取疾病类型的基于账单获取疾病类型的方法、装置、计算机设备及存储介质。
为实现上述目的,本发明提供一种基于账单获取疾病类型的方法,包括:
识别账单图像,获取收费数据;
基于预设条件对所述收费数据进行筛选获取第一收费项;
将所述第一收费项输入预设疾病模型进行识别,以获取与所述第一收费项对应的疾病类型;
若未识别出所述第一收费项对应的疾病类型,将所述第一收费项与历史疾病项目集中的数据进行匹配,获取与所述第一收费项匹配的疾病类型,以及所述疾病类型的占比,基于所述占比确定与所述第一收费项对应的疾病类型。
可选的,所述收费数据包括:所述第一收费项和第二收费项;
所述预设条件为:对所述收费数据进行数据清洗,过滤所述收费数据中的所述第二收费项,以获取所述第一收费项。
可选的,在所述将所述第一收费项输入预设疾病模型进行识别,以获取与所述第一收费项对应的疾病类型之前,还包括:
将第一收费项中的各个子项与项目分类表单中各个子项进行匹配,获取相应的匹配度,判断所述匹配度是否大于匹配阈值,若是,将所述第一收费项输入预设疾病模型进行识别,以获取与所述第一收费项对应的疾病类型。
可选的,所述预设疾病模型包括:与第一类疾病关联的药品表单,所述药品表单包括第一类疾病及所述第一类疾病对应的药品子项;
所述第一收费项包括药品类子项、检查类子项、材料类子项、治疗类子项、化验类子项中的至少一类子项;
所述将所述第一收费项输入到预设疾病模型进行识别,以获取与所述第一收费项对应的疾病类型,包括:
将所述第一收费项中的全部药品类子项与所述药品表单中各个第一类疾病对应的药品子项进行匹配,以获取与所述第一收费项中的药品类子项匹配的第一类疾病。
可选的,所述预设疾病模型还包括:与第二类疾病关联的项目表单,所述项目表单包括第二类疾病及所述第二类疾病对应的项目子项;
所述将所述第一收费项输入到预设疾病模型进行识别,以获取与所述第一收费项对应的疾病类型,还包括:
若所述第一收费项中的药品类子项与所述药品表单中第一类疾病对应的药品子项不匹配,将所述第一收费项中的全部子项与所述项目表单中各个第二类疾病对应的项目子项进行匹配,以获取与所述第一收费项中的子项匹配的第二类疾病。
可选的,所述历史疾病项目集包括多个事件,每个事件对应一历史患者的账单费用项以及相应的疾病类型;
若未识别出所述第一收费项对应的疾病类型,将所述第一收费项与历史疾病项目集中的数据进行匹配,获取与所述第一收费项匹配的疾病类型及所述疾病类型的占比,基于所述占比确定与所述第一收费项对应的疾病类型,包括:
依据所述第一收费项遍历所述历史疾病项目集中的各个事件,获取与所述第一收费项中所有子项匹配的事件中的疾病类型;
统计所有匹配的疾病类型的占比,判断占比最大的比例值是否大于或等于占比阈值;
若占比最大的比例值大于或等于所述占比阈值,将所述比例值对应的疾病类型作为所述第一收费项对应的疾病类型。
可选的,所述收费数据包括所述第一收费项和与所述第一收费项对应的金额项;每一疾病类型对应一校验金额;
若未识别出所述第一收费项对应的疾病类型,将所述第一收费项与历史疾病项目集中的数据进行匹配,获取与所述第一收费项匹配的疾病类型及所述疾病类型的占比,基于所述占比确定与所述第一收费项对应的疾病类型,还包括:
若占比最大的比例值小于所述占比阈值,获取所述比例值对应的疾病类型关联的校验金额;
计算所述第一收费项对应的金额项之和,判断金额之和是否大于或等于所述校验金额,若是,将所述比例值对应的疾病类型作为所述第一收费项对应的疾病类型。
为实现上述目的,本发明还提供一种基于账单获取疾病类型的装置,包括:
识别单元,用于识别账单图像,获取收费数据;
筛选单元,用于基于预设条件对所述收费数据进行筛选获取第一收费项;
匹配单元,用于将所述第一收费项输入预设疾病模型进行识别,以获取与所述第一收费项对应的疾病类型;
处理单元,当未识别出所述第一收费项对应的疾病类型时,用于将所述第一收费项与历史疾病项目集中的数据进行匹配,获取与所述第一收费项匹配的疾病类型,以及所述疾病类型的占比,基于所述占比确定与所述第一收费项对应的疾病类型。
为实现上述目的,本发明还提供一种计算机设备,所述计算机设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
为实现上述目的,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
本发明提供的基于账单获取疾病类型的方法、装置、计算机设备及存储介质,可识别账单图像以得到收费数据,利用预设条件对收费数据进行筛选过滤干扰信息获取第一收费项;通过预设疾病模型识别第一收费项是否属于疾病模型中对应的疾病,若是,则可确认第一收费项的疾病类型;若否,可将第一收费项与历史疾病项目集中的数据进行匹配,基于匹配的疾病类型占比确定相应的疾病类型,无需人工操作,用时短、效率高。
附图说明
图1为本发明所述的基于账单获取疾病类型的方法的一种实施例的方法流程图;
图2为本发明将第一收费项与预设疾病模型进行匹配的一种实施例的流程图;
图3为本发明将第一收费项与历史疾病项目集中的数据进行匹配确定疾病类型的一种实施例的流程图;
图4为本发明所述的基于账单获取疾病类型的装置的一种实施例的模块图;
图5为匹配单元的一种实施例的内部模块图;
图6为处理单元的一种实施例的内部模块图;
图7为本发明计算机设备的一个实施例的硬件架构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
本发明提供的基于账单获取疾病类型的方法、装置、计算机设备及存储介质,适用保险领域。本发明可识别账单图像以得到收费数据,利用预设条件对收费数据进行筛选过滤干扰信息获取第一收费项;通过预设疾病模型识别第一收费项是否属于疾病模型中对应的疾病,若是,则可确认第一收费项的疾病类型;若否,可将第一收费项与历史疾病项目集中的数据进行匹配,基于匹配的疾病类型占比确定相应的疾病类型,无需人工操作,用时短、效率高。
实施例一
请参阅图1,本实施例的一种基于账单获取疾病类型的方法,包括以下步骤:
S1. 识别账单图像,获取收费数据。
需要说明的是:所述收费数据包括:所述第一收费项和第二收费项两大类。第二收费项是指患者看病的通用收费项,也可以理解为,无法通过通用收费项推测患者的疾病类型;第一收费项是指患者看病时的非通用收费项,也可以理解为,第一收费项与患者的疾病类型存在关联性,第一收费项可体现患者的疾病类型,如:西药类、中成药类、检查类(如:心电图、CT、B超等),化验类、治疗类、以及材料类等。为进一步保证上述收费数据的私密和安全性,上述收费数据还可以存储于一区块链的节点中。
作为举例而非限定,通用收费项可包括:挂号费、检查费、化验费、煎药、护理费、治疗费(如:点穴、针灸、针刺)、以及材料费(如:注射器、吸入器、采血管、面罩、输液器、吸氧管、空管、静脉注射器、留置针、雾化器、卡等)等。
在实际应用中,账单可以是理赔账单,如:医院开具的就诊发票。
进一步地,步骤S1可通过光学字符识别(Optical Character Recognition,OCR)方法对所述账单图像进行识别,以获取收费数据。
在本实施例中,通过OCR将账单图像中的字符转换为文本格式,以便于进行后续的数据处理。
S2. 基于预设条件对所述收费数据进行筛选获取第一收费项。
在本实施例中,考虑到患者看病时涉及到的收费项一部分是通用收费项、一部分是能够体现患者疾病类型的收费项,因此为了快速有效识别患者的疾病类型,可利用预设条件将收费数据中的通用收费项(即:第二收费项第二收费项)滤除,筛选出非通用的收费项(即:第一收费项),以便于后续对有效的收费项进行识别。
在本实施例中,所述预设条件为:对所述收费数据进行数据清洗,过滤所述收费数据中的所述第二收费项,以获取所述第一收费项。
进一步地,可通过预设条件过滤收费数据中的第二收费项,以及无效内容:空格、大小写字母、阿拉伯数字、标点符号、特殊符号(如:#、%等),以得到符合格式要求的第一收费项,为后续的数据匹配提供保证。
在一实施例中,执行步骤S3之前,还可包括:
A. 将第一收费项中的各个子项与项目分类表单中各个子项进行匹配,获取相应的匹配度,判断所述匹配度是否大于匹配阈值,若是,则执行步骤S3;若否,则结束。
具体地,项目分类表包括:西药项、中成药项(如:感冒清热颗粒)、材料项、检查项、治疗项以及化验项等,每一项可包括多个子项,如:检查项包括心电图、CT检查、B超检查等子项。需要特别说明的是,项目分类表中包括的子项为非通用的收费项。项目分类表中的子项均为符合医疗标准的项目。
在本实施例中,为了提高基于第一收费项对患者疾病类型预测的准确性,可先将第一收费项中的各个子项分别与项目分类表中的子项进行匹配,以辨别第一收费项中的子项数据是否符合医疗标准项目。统计第一收费项中所有子项与项目分类表的匹配度,若匹配度大于匹配阈值(如:70%),则表示第一收费项可用于预设疾病模型的匹配;若匹配度小于或等于匹配阈值,则表示第一收费项中存在大量不符合医疗标准的项目,不利于后续数据匹配,则退出结束。
S3. 将所述第一收费项输入预设疾病模型进行识别,以获取与所述第一收费项对应的疾病类型。
需要说明的是:所述预设疾病模型包括:与第一类疾病关联的药品表单,所述药品表单包括第一类疾病及所述第一类疾病对应的药品子项。
在本实施例中,第一类疾病是指特定的疾病,如:高血压、糖尿病等,患者服用的药品只能治疗相应的疾病,无法治疗其他疾病。第二类疾病是指普通的疾病,如:肺炎、肠炎,病毒性感冒等,患者服用的药品可治疗多种疾病,而非一种特定的疾病。由此可见,治疗第一类疾病的药品与第一类疾病是一对一的关系,治疗第二类疾病的药品与第二类疾病是一对多的关系。
本实施例中,所述第一收费项包括药品类子项、检查类子项、材料类子项、治疗类子项、化验类子项中的至少一类子项。
进一步地,参阅图2所示,步骤S3可包括:
S31. 将所述第一收费项中的全部药品类子项与所述药品表单中各个第一类疾病对应的药品子项进行匹配,以获取与所述第一收费项中的药品类子项匹配的第一类疾病。
在本实施例中,将第一收费项与第一类疾病关联的药品表单中的子项进行匹配,若第一收费项的所有子项与药品表单中的某一第一类疾病中的对应的药品子项均匹配,则表示第一收费项对应的疾病类型属于第一类疾病,根据匹配的药品子项即可确定其对应的具体疾病类型;若第一收费项的所有子项与药品表单中的多个第一类疾病中的对应的药品子项匹配,或第一收费项的部分子项与药品表单中的某一个第一类疾病中的对应的药品子项匹配,则结束退出。
在一优选的实施例中,所述预设疾病模型还包括:与第二类疾病关联的项目表单,所述项目表单包括第二类疾病及所述第二类疾病对应的项目子项;
步骤S3还可包括:
S32. 若所述第一收费项中的药品类子项与所述药品表单中第一类疾病对应的药品子项不匹配,将所述第一收费项中的全部子项与所述项目表单中各个第二类疾病对应的项目子项进行匹配,以获取与所述第一收费项中的子项匹配的第二类疾病。
项目表单可包括必须子项、部分子项及排除子项中的至少一种,其中,必须子项为治疗或检查第二类疾病必须的子项,部分子项为治疗或检查第二类疾病可能采用的子项,排除子项为治疗或检查不能采用的子项。
在本实施例中,通过执行步骤S32将第一收费项与项目表单进行匹配,以鉴别第一收费项是否对应第二类疾病。将第一收费项与项目表单中各个第二类疾病对应的项目子项进行匹配,若第一收费项中的所有子项与项目表单中相应的第二类疾病对应的项目子项匹配,则将与其匹配的子项对应的第二类疾病作为第一收费项对应的疾病类型;若否,则执行步骤S4。
S4. 若未识别出所述第一收费项对应的疾病类型,将所述第一收费项与历史疾病项目集中的数据进行匹配,获取与所述第一收费项匹配的疾病类型,以及所述疾病类型的占比,基于所述占比确定与所述第一收费项对应的疾病类型。
需要说明的是:所述历史疾病项目集包括多个事件,每个事件对应一历史患者的账单费用项以及相应的疾病类型。历史疾病项目集中的子项为非通用的收费项。
在本实施例中,历史疾病项目集中的每个事件对应一历史患者的疾病类型及账单费用项。将第一收费项与历史疾病项目集中的各个事件进行比对,提取与其匹配的事件对应的疾病类型,计算各个匹配的疾病类型的所述占比,以确定与第一收费项对应的疾病类型。
进一步地,参阅图3所示,步骤S4可包括以下步骤:
S41. 依据所述第一收费项遍历所述历史疾病项目集中的各个事件,获取与所述第一收费项中所有子项匹配的事件中的疾病类型。
S42. 统计所有匹配的疾病类型的占比,判断占比最大的比例值是否大于或等于占比阈值,若是,执行步骤S43;若否,执行步骤S44。
S43. 将所述比例值对应的疾病类型作为所述第一收费项对应的疾病类型。
在一实施例中,所述收费数据包括所述第一收费项和与所述第一收费项对应的金额项;每一疾病类型对应一校验金额。在步骤S42中,统计所有匹配的疾病类型的占比,判断占比最大的比例值是否大于占比阈值,若是,执行步骤S43;若否,执行步骤S44。
S44. 获取所述比例值对应的疾病类型关联的校验金额。
S45. 计算所述第一收费项对应的金额项之和,判断金额之和是否大于或等于所述校验金额,若是,将所述比例值对应的疾病类型作为所述第一收费项对应的疾病类型。
在本实施例中,第一收费项与历史疾病项目集中的事件匹配的最大占比小于占比阈值时,可将所述占比由大到小进行排序,统计收费数据的合计金额或第一收费项的合计金额,将计算得到的合计金额分别与匹配的疾病类型的校验金额进行比较,将合金金额大于校验金额的相应疾病类型作为第一收费项对应的疾病类型。若没有,则退出结束。
在实际应用中,基于账单获取疾病类型的方法主要应用于保险理赔,基于患者的疾病类型选择相应的理赔金额进行理赔,若第一收费项对应多种疾病类型,基于疾病类型的校验金额反算错误理赔概率,若概率小于等于理赔阈值(如1%),则可将相应的疾病类型作为第一收费项对应的疾病类型。对于未能实现反推确认诊断类型的费用明细组合可添加到预设疾病模型中,逐步优化模型规则。
在本实施例中,基于账单获取疾病类型的方法可识别账单图像以得到收费数据,利用预设条件对收费数据进行筛选过滤干扰信息获取第一收费项;通过预设疾病模型识别第一收费项是否属于疾病模型中对应的疾病,若是,则可确认第一收费项的疾病类型;若否,可将第一收费项与历史疾病项目集中的数据进行匹配,基于匹配的疾病类型占比确定相应的疾病类型,无需人工操作,用时短、效率高。
实施例二
请参阅图4,本实施例的一种基于账单获取疾病类型的装置1,包括:识别单元11、筛选单元12、匹配单元13和处理单元14。
识别单元11,用于识别账单图像,获取收费数据。
需要说明的是:所述收费数据包括:所述第一收费项和第二收费项两大类。第二收费项是指患者看病的通用收费项,也可以理解为,无法通过通用收费项推测患者的疾病类型;第一收费项是指患者看病时的非通用收费项,也可以理解为,第一收费项与患者的疾病类型存在关联性,第一收费项可体现患者的疾病类型,如:西药类、中成药类、检查类(如:心电图、CT、B超等),化验类、治疗类、以及材料类等。为进一步保证上述收费数据的私密和安全性,上述收费数据还可以存储于一区块链的节点中。
作为举例而非限定,通用收费项可包括:挂号费、检查费、化验费、煎药、护理费、治疗费(如:点穴、针灸、针刺)、以及材料费(如:注射器、吸入器、采血管、面罩、输液器、吸氧管、空管、静脉注射器、留置针、雾化器、卡等)等。
在实际应用中,账单可以是理赔账单,如:医院开具的就诊发票。
进一步地,识别单元11可通过光学字符识别(Optical Character Recognition,OCR)方法对所述账单图像进行识别,以获取收费数据。
在本实施例中,通过OCR将账单图像中的字符转换为文本格式,以便于进行后续的数据处理。
筛选单元12,用于基于预设条件对所述收费数据进行筛选获取第一收费项。
在本实施例中,考虑到患者看病时涉及到的收费项一部分是通用收费项、一部分是能够体现患者疾病类型的收费项,因此为了快速有效识别患者的疾病类型,可利用预设条件将收费数据中的通用收费项(即:第二收费项第二收费项)滤除,筛选出非通用的收费项(即:第一收费项),以便于后续对有效的收费项进行识别。
在本实施例中,所述预设条件为:对所述收费数据进行数据清洗,过滤所述收费数据中的所述第二收费项,以获取所述第一收费项。
进一步地,可通过预设条件过滤收费数据中的第二收费项,以及无效内容:空格、大小写字母、阿拉伯数字、标点符号、特殊符号(如:#、%等),以得到符合格式要求的第一收费项,为后续的数据匹配提供保证。
匹配单元13,用于将所述第一收费项输入预设疾病模型进行识别,以获取与所述第一收费项对应的疾病类型。
需要说明的是:所述预设疾病模型可包括:与第一类疾病关联的药品表单和与第二类疾病关联的项目表单,所述药品表单包括第一类疾病及所述第一类疾病对应的药品子项,所述项目表单包括第二类疾病及所述第二类疾病对应的项目子项。
在本实施例中,第一类疾病是指特定的疾病,如:高血压、糖尿病等,患者服用的药品只能治疗相应的疾病,无法治疗其他疾病。第二类疾病是指普通的疾病,如:肺炎、肠炎,病毒性感冒等,患者服用的药品可治疗多种疾病,而非一种特定的疾病。由此可见,治疗第一类疾病的药品与第一类疾病是一对一的关系,治疗第二类疾病的药品与第二类疾病是一对多的关系。
本实施例中,所述第一收费项包括药品类子项、检查类子项、材料类子项、治疗类子项、化验类子项中的至少一类子项。
进一步地,参阅图5所示,匹配单元13可包括:第一匹配模块131和第二匹配模块132。
第一匹配模块131,用于将所述第一收费项中的全部药品类子项与所述药品表单中各个第一类疾病对应的药品子项进行匹配,以获取与所述第一收费项中的药品类子项匹配的第一类疾病。
在本实施例中,将第一收费项与第一类疾病关联的药品表单中的子项进行匹配,若第一收费项的所有子项与药品表单中的某一第一类疾病中的对应的药品子项均匹配,则表示第一收费项对应的疾病类型属于第一类疾病,根据匹配的药品子项即可确定其对应的具体疾病类型;若第一收费项的所有子项与药品表单中的多个第一类疾病中的对应的药品子项匹配,或第一收费项的部分子项与药品表单中的某一个第一类疾病中的对应的药品子项匹配,则结束退出;若第一收费项的所有子项与药品表单的药品子项均不匹配,则可执行步骤S32将第一收费项与项目表单进行匹配,以鉴别第一收费项是否对应第二类疾病。
第二匹配模块132,当所述第一收费项中的药品类子项与所述药品表单中第一类疾病对应的药品子项不匹配时,用于将所述第一收费项中的全部子项与所述项目表单中各个第二类疾病对应的项目子项进行匹配,以获取与所述第一收费项中的子项匹配的第二类疾病。
项目表单可包括必须子项、部分子项及排除子项中的至少一种,其中,必须子项为治疗或检查第二类疾病必须的子项,部分子项为治疗或检查第二类疾病可能采用的子项,排除子项为治疗或检查不能采用的子项。
在本实施例中,将第一收费项与项目表单中各个第二类疾病对应的项目子项进行匹配,若第一收费项中的所有子项与项目表单中相应的第二类疾病对应的项目子项匹配,则将与其匹配的子项对应的第二类疾病作为第一收费项对应的疾病类型。
处理单元14,当未识别出所述第一收费项对应的疾病类型时,用于将所述第一收费项与历史疾病项目集中的数据进行匹配,获取与所述第一收费项匹配的疾病类型,以及所述疾病类型的占比,基于所述占比确定与所述第一收费项对应的疾病类型。
需要说明的是:所述历史疾病项目集包括多个事件,每个事件对应一历史患者的账单费用项以及相应的疾病类型。历史疾病项目集中的子项为非通用的收费项。
在本实施例中,历史疾病项目集中的每个事件对应一历史患者的疾病类型及账单费用项。将第一收费项与历史疾病项目集中的各个事件进行比对,提取与其匹配的事件对应的疾病类型,计算各个匹配的疾病类型的所述占比,以确定与第一收费项对应的疾病类型。
进一步地,参阅图6所示,处理单元14可包括:遍历模块141、判断模块142、处理模块143、获取模块144和计算模块145。
遍历模块141,用于依据所述第一收费项遍历所述历史疾病项目集中的各个事件,获取与所述第一收费项中所有子项匹配的事件中的疾病类型。
判断模块142,用于统计所有匹配的疾病类型的占比,判断占比最大的比例值是否大于或等于占比阈值。
处理模块143,当占比最大的比例值大于或等于所述占比阈值时,将所述比例值对应的疾病类型作为所述第一收费项对应的疾病类型。
在一实施例中,所述收费数据包括所述第一收费项和与所述第一收费项对应的金额项;每一疾病类型对应一校验金额。
获取模块144,用于获取所述比例值对应的疾病类型关联的校验金额。
计算模块145,用于计算所述第一收费项对应的金额项之和,判断金额之和是否大于或等于所述校验金额,若是,将所述比例值对应的疾病类型作为所述第一收费项对应的疾病类型。
在本实施例中,第一收费项与历史疾病项目集中的事件匹配的最大占比小于占比阈值时,可将所述占比由大到小进行排序,统计收费数据的合计金额或第一收费项的合计金额,将计算得到的合计金额分别与匹配的疾病类型的校验金额进行比较,将合金金额大于校验金额的相应疾病类型作为第一收费项对应的疾病类型。若没有,则退出结束。
在实际应用中,基于账单获取疾病类型的装置1主要应用于保险理赔,基于患者的疾病类型选择相应的理赔金额进行理赔,若第一收费项对应多种疾病类型,基于疾病类型的校验金额反算错误理赔概率,若概率小于等于理赔阈值(如1%),则可将相应的疾病类型作为第一收费项对应的疾病类型。对于未能实现反推确认诊断类型的费用明细组合可添加到预设疾病模型中,逐步优化模型规则。
在本实施例中,基于账单获取疾病类型的装置1通过识别单元11识别账单图像以得到收费数据,利用筛选单元12基于预设条件对收费数据进行筛选过滤干扰信息获取第一收费项;匹配单元13通过预设疾病模型识别第一收费项是否属于疾病模型中对应的疾病,若是,则可确认第一收费项的疾病类型;若否,通过处理单元14将第一收费项与历史疾病项目集中的数据进行匹配,基于匹配的疾病类型占比确定相应的疾病类型,无需人工操作,用时短、效率高。
在优选的实施例中,基于账单获取疾病类型的装置1,还可包括:预处理单元。
预处理单元,用于将第一收费项中的各个子项与项目分类表单中各个子项进行匹配,获取相应的匹配度,判断所述匹配度是否大于匹配阈值,若是,通过匹配单元13将所述第一收费项输入预设疾病模型进行识别,以获取与所述第一收费项对应的疾病类型。
具体地,项目分类表包括:西药项、中成药项(如:感冒清热颗粒)、材料项、检查项、治疗项以及化验项等,每一项可包括多个子项,如:检查项包括心电图、CT检查、B超检查等子项。需要特别说明的是,项目分类表中包括的子项为非通用的收费项。项目分类表中的子项均为符合医疗标准的项目。
在本实施例中,为了提高基于第一收费项对患者疾病类型预测的准确性,可先将第一收费项中的各个子项分别与项目分类表中的子项进行匹配,以辨别第一收费项中的子项数据是否符合医疗标准项目。统计第一收费项中所有子项与项目分类表的匹配度,若匹配度大于匹配阈值(如:70%),则表示第一收费项可用于预设疾病模型的匹配;若匹配度小于或等于匹配阈值,则表示第一收费项中存在大量不符合医疗标准的项目,不利于后续数据匹配,则退出结束。
实施例三
为实现上述目的,本发明还提供一种计算机设备2,该计算机设备2包括多个计算机设备2,实施例二的基于账单获取疾病类型的装置1的组成部分可分散于不同的计算机设备2中,计算机设备2可以是执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。本实施例的计算机设备2至少包括但不限于:可通过系统总线相互通信连接的存储器21、处理器23、网络接口22以及基于账单获取疾病类型的装置1(参考图7)。需要指出的是,图7仅示出了具有组件-的计算机设备2,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
本实施例中,所述存储器21至少包括一种类型的计算机可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器21可以是计算机设备2的内部存储单元,例如该计算机设备2的硬盘或内存。在另一些实施例中,存储器21也可以是计算机设备2的外部存储设备,例如该计算机设备2上配备的插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(Secure Digital, SD)卡,闪存卡(Flash Card)等。当然,所述存储器21还可以既包括计算机设备2的内部存储单元也包括其外部存储设备。本实施例中,存储器21通常用于存储安装于计算机设备2的操作系统和各类应用软件,例如实施例一的基于账单获取疾病类型的方法的程序代码等。此外,存储器21还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器23在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器23通常用于控制计算机设备2的总体操作例如执行与所述计算机设备2进行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器23用于运行所述存储器21中存储的程序代码或者处理数据,例如运行所述的基于账单获取疾病类型的装置1等。
所述网络接口22可包括无线网络接口或有线网络接口,该网络接口22通常用于在所述计算机设备2与其他计算机设备2之间建立通信连接。例如,所述网络接口22用于通过网络将所述计算机设备2与外部终端相连,在所述计算机设备2与外部终端之间的建立数据传输通道和通信连接等。所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobile communication,GSM)、宽带码分多址(WidebandCode Division Multiple Access,WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。
需要指出的是,图7仅示出了具有部件21-23的计算机设备2,但是应理解的是,并不要求实施所有示出的部件,可以替代的实施更多或者更少的部件。
在本实施例中,存储于存储器21中的所述基于账单获取疾病类型的装置1还可以被分割为一个或者多个程序模块,所述一个或者多个程序模块被存储于存储器21中,并由一个或多个处理器(本实施例为处理器23)所执行,以完成本发明。
实施例四
为实现上述目的,本发明还提供一种计算机可读存储介质,其包括多个存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等,其上存储有计算机程序,程序被处理器23执行时实现相应功能。本实施例的计算机可读存储介质用于存储基于账单获取疾病类型的装置1,被处理器23执行时实现实施例一的基于账单获取疾病类型的方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (8)

1.一种基于账单获取疾病类型的方法,其特征在于,包括:
识别账单图像,获取收费数据;
基于预设条件对所述收费数据进行筛选获取第一收费项;
将所述第一收费项输入预设疾病模型进行识别,以获取与所述第一收费项对应的疾病类型;
若未识别出所述第一收费项对应的疾病类型,将所述第一收费项与历史疾病项目集中的数据进行匹配,获取与所述第一收费项匹配的疾病类型,以及所述疾病类型的占比,基于所述占比确定与所述第一收费项对应的疾病类型;其中,所述第一收费项包括:患者看病时的非通用收费项,第二收费项包括:患者看病时的通用收费项;
所述预设疾病模型包括:与第一类疾病关联的药品表单,所述药品表单包括第一类疾病及所述第一类疾病对应的药品子项;
所述第一收费项包括药品类子项、检查类子项、材料类子项、治疗类子项、化验类子项中的至少一类子项;
所述将所述第一收费项输入预设疾病模型进行识别,以获取与所述第一收费项对应的疾病类型,包括:
将所述第一收费项中的全部药品类子项与所述药品表单中各个第一类疾病对应的药品子项进行匹配,以获取与所述第一收费项中的药品类子项匹配的第一类疾病;
所述历史疾病项目集包括多个事件,每个事件对应一历史患者的账单费用项以及相应的疾病类型;
若未识别出所述第一收费项对应的疾病类型,将所述第一收费项与历史疾病项目集中的数据进行匹配,获取与所述第一收费项匹配的疾病类型及所述疾病类型的占比,基于所述占比确定与所述第一收费项对应的疾病类型,包括:
依据所述第一收费项遍历所述历史疾病项目集中的各个事件,获取与所述第一收费项中所有子项匹配的事件中的疾病类型;
统计所有匹配的疾病类型的占比,判断占比最大的比例值是否大于或等于占比阈值;
若占比最大的比例值大于或等于所述占比阈值,将所述比例值对应的疾病类型作为所述第一收费项对应的疾病类型。
2.根据权利要求1所述的基于账单获取疾病类型的方法,其特征在于,所述收费数据包括:所述第一收费项和第二收费项;
所述预设条件为:对所述收费数据进行数据清洗,过滤所述收费数据中的所述第二收费项,以获取所述第一收费项。
3.根据权利要求1所述的基于账单获取疾病类型的方法,其特征在于,在所述将所述第一收费项输入预设疾病模型进行识别,以获取与所述第一收费项对应的疾病类型之前,还包括:
将第一收费项中的各个子项与项目分类表单中各个子项进行匹配,获取相应的匹配度,判断所述匹配度是否大于匹配阈值,若是,将所述第一收费项输入预设疾病模型进行识别,以获取与所述第一收费项对应的疾病类型。
4.根据权利要求1所述的基于账单获取疾病类型的方法,其特征在于,所述预设疾病模型还包括:与第二类疾病关联的项目表单,所述项目表单包括第二类疾病及所述第二类疾病对应的项目子项;
所述将所述第一收费项输入预设疾病模型进行识别,以获取与所述第一收费项对应的疾病类型,还包括:
若所述第一收费项中的药品类子项与所述药品表单中第一类疾病对应的药品子项不匹配,将所述第一收费项中的全部子项与所述项目表单中各个第二类疾病对应的项目子项进行匹配,以获取与所述第一收费项中的子项匹配的第二类疾病。
5.根据权利要求1所述的基于账单获取疾病类型的方法,其特征在于,所述收费数据包括所述第一收费项和与所述第一收费项对应的金额项;每一疾病类型对应一校验金额;
若未识别出所述第一收费项对应的疾病类型,将所述第一收费项与历史疾病项目集中的数据进行匹配,获取与所述第一收费项匹配的疾病类型及所述疾病类型的占比,基于所述占比确定与所述第一收费项对应的疾病类型,还包括:
若占比最大的比例值小于所述占比阈值,获取所述比例值对应的疾病类型关联的校验金额;
计算所述第一收费项对应的金额项之和,判断金额之和是否大于或等于所述校验金额,若是,将所述比例值对应的疾病类型作为所述第一收费项对应的疾病类型。
6.一种基于账单获取疾病类型的装置,其特征在于,包括:
识别单元,用于识别账单图像,获取收费数据;
筛选单元,用于基于预设条件对所述收费数据进行筛选获取第一收费项;
匹配单元,用于将所述第一收费项输入预设疾病模型进行识别,以获取与所述第一收费项对应的疾病类型;
处理单元,当未识别出所述第一收费项对应的疾病类型时,用于将所述第一收费项与历史疾病项目集中的数据进行匹配,获取与所述第一收费项匹配的疾病类型,以及所述疾病类型的占比,基于所述占比确定与所述第一收费项对应的疾病类型;
其中,所述第一收费项包括:患者看病时的非通用收费项,第二收费项包括:患者看病时的通用收费项;
所述预设疾病模型包括:与第一类疾病关联的药品表单,所述药品表单包括第一类疾病及所述第一类疾病对应的药品子项;
所述第一收费项包括药品类子项、检查类子项、材料类子项、治疗类子项、化验类子项中的至少一类子项;
所述将所述第一收费项输入预设疾病模型进行识别,以获取与所述第一收费项对应的疾病类型,包括:
将所述第一收费项中的全部药品类子项与所述药品表单中各个第一类疾病对应的药品子项进行匹配,以获取与所述第一收费项中的药品类子项匹配的第一类疾病;
所述历史疾病项目集包括多个事件,每个事件对应一历史患者的账单费用项以及相应的疾病类型;
若未识别出所述第一收费项对应的疾病类型,将所述第一收费项与历史疾病项目集中的数据进行匹配,获取与所述第一收费项匹配的疾病类型及所述疾病类型的占比,基于所述占比确定与所述第一收费项对应的疾病类型,包括:
依据所述第一收费项遍历所述历史疾病项目集中的各个事件,获取与所述第一收费项中所有子项匹配的事件中的疾病类型;
统计所有匹配的疾病类型的占比,判断占比最大的比例值是否大于或等于占比阈值;
若占比最大的比例值大于或等于所述占比阈值,将所述比例值对应的疾病类型作为所述第一收费项对应的疾病类型。
7.一种计算机设备,其特征在于,所述计算机设备包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现权利要求1至5任一项所述方法的步骤。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5任一项所述方法的步骤。
CN202110724221.3A 2021-06-29 2021-06-29 基于账单获取疾病类型的方法、装置、计算机设备及存储介质 Active CN113450922B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110724221.3A CN113450922B (zh) 2021-06-29 2021-06-29 基于账单获取疾病类型的方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110724221.3A CN113450922B (zh) 2021-06-29 2021-06-29 基于账单获取疾病类型的方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN113450922A CN113450922A (zh) 2021-09-28
CN113450922B true CN113450922B (zh) 2024-04-12

Family

ID=77813677

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110724221.3A Active CN113450922B (zh) 2021-06-29 2021-06-29 基于账单获取疾病类型的方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN113450922B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160096439A (ko) * 2015-02-05 2016-08-16 삼성생명보험주식회사 보험 서비스 제공 방법, 장치 및 컴퓨터 프로그램
CN109615012A (zh) * 2018-12-13 2019-04-12 平安医疗健康管理股份有限公司 基于机器学习的就诊数据异常识别方法、设备及存储介质
CN111429289A (zh) * 2020-03-23 2020-07-17 平安医疗健康管理股份有限公司 单病种识别方法、装置、计算机设备和存储介质
CN112085012A (zh) * 2020-09-04 2020-12-15 泰康保险集团股份有限公司 项目名称和类别识别方法及装置
CN112132624A (zh) * 2020-09-27 2020-12-25 平安医疗健康管理股份有限公司 医疗理赔数据预测系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10282462B2 (en) * 2016-10-31 2019-05-07 Walmart Apollo, Llc Systems, method, and non-transitory computer-readable storage media for multi-modal product classification

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160096439A (ko) * 2015-02-05 2016-08-16 삼성생명보험주식회사 보험 서비스 제공 방법, 장치 및 컴퓨터 프로그램
CN109615012A (zh) * 2018-12-13 2019-04-12 平安医疗健康管理股份有限公司 基于机器学习的就诊数据异常识别方法、设备及存储介质
CN111429289A (zh) * 2020-03-23 2020-07-17 平安医疗健康管理股份有限公司 单病种识别方法、装置、计算机设备和存储介质
CN112085012A (zh) * 2020-09-04 2020-12-15 泰康保险集团股份有限公司 项目名称和类别识别方法及装置
CN112132624A (zh) * 2020-09-27 2020-12-25 平安医疗健康管理股份有限公司 医疗理赔数据预测系统

Also Published As

Publication number Publication date
CN113450922A (zh) 2021-09-28

Similar Documents

Publication Publication Date Title
US11238018B2 (en) Systems and methods for integrating data
US20200294667A1 (en) System and method for machine based medical diagnostic code identification, accumulation, analysis and automatic claim process adjudication
US8688607B2 (en) System and method for detecting healthcare insurance fraud
US7194416B1 (en) Interactive creation and adjudication of health care insurance claims
CN113593686A (zh) 基于drg/dip全流程医疗质量监管的医保综合管理系统及管理方法
Waghade et al. A comprehensive study of healthcare fraud detection based on machine learning
US20050209880A1 (en) Integrated healthcare information system
EP2523136A2 (en) System and a method for providing integrated access management for peritoneal dialysis and hemodialysis
AU667457B2 (en) Real time insurance administration and medical information utility
CN111402070A (zh) 医疗信息识别方法、装置、计算机设备及存储介质
US20030135397A1 (en) Medical billing system to prevent fraud
CN110309930A (zh) 基于人脸识别的预约就诊方法、装置、设备及存储介质
CN104821041A (zh) 基于网络医院的自助缴费方法和系统
CN110570916A (zh) 就诊辅助方法、系统、装置及存储介质
CN113450922B (zh) 基于账单获取疾病类型的方法、装置、计算机设备及存储介质
CN109545320A (zh) 基于数据处理的取药异常确定方法和终端设备
US20180181717A1 (en) Detection of misuse of a benefit system
CN111933245A (zh) 超说明书用药信息处理方法、装置及相关设备
US20050065816A1 (en) Healthcare management information system
CN113393915A (zh) 一种医院用患者就诊信息管理系统
US20160162650A1 (en) Method for automating medical billing
CN112634065A (zh) 一种异地就医单据报销的方法及系统
Harman Topics for our times: new health care data--new horizons for public health.
CN110766004B (zh) 医疗鉴定数据处理方法、装置、电子设备及可读介质
US20130110544A1 (en) Medical data management with disclosure tracking features

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant