CN111428198A - 一种确定异常医疗清单的方法、装置、设备和存储介质 - Google Patents

一种确定异常医疗清单的方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN111428198A
CN111428198A CN202010207777.0A CN202010207777A CN111428198A CN 111428198 A CN111428198 A CN 111428198A CN 202010207777 A CN202010207777 A CN 202010207777A CN 111428198 A CN111428198 A CN 111428198A
Authority
CN
China
Prior art keywords
medical
target
frequent
list
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010207777.0A
Other languages
English (en)
Other versions
CN111428198B (zh
Inventor
刘婧媛
吴东辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Medical and Healthcare Management Co Ltd
Original Assignee
Ping An Medical and Healthcare Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Medical and Healthcare Management Co Ltd filed Critical Ping An Medical and Healthcare Management Co Ltd
Priority to CN202010207777.0A priority Critical patent/CN111428198B/zh
Publication of CN111428198A publication Critical patent/CN111428198A/zh
Application granted granted Critical
Publication of CN111428198B publication Critical patent/CN111428198B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Business, Economics & Management (AREA)
  • Computational Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Technology Law (AREA)
  • Fuzzy Systems (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Strategic Management (AREA)
  • Evolutionary Biology (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Computational Linguistics (AREA)
  • Algebra (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种确定异常医疗清单的方法,解决了现有技术中无法对医疗领域完整性做出检测的技术问题,包括:获取医疗结算数据;从医疗结算数据中提取出属于目标清单类型的目标医疗清单,每个目标医疗清单包括多个医疗项;计算所有目标医疗清单中各个医疗项的支持度,作为第一支持度;根据计算的各个医疗项的第一支持度构建有向图,有向图的节点为医疗项,有向图的有向边为两个医疗项第一支持度的大小顺序;从有向图中筛选出目标清单类型关联的频繁k项集,每个频繁k项集包括多个医疗项,k为大于等于2的整数;根据筛选出的频繁k项集确定目标医疗清单是否存在异常。本发明还公开了确定异常医疗清单的装置、计算机设备和计算机可读存储介质。

Description

一种确定异常医疗清单的方法、装置、设备和存储介质
技术领域
本发明涉及计算机技术领域,具体涉及一种确定异常医疗清单的方法、装置、计算机设备和计算机可读存储介质。
背景技术
医保基金管控的重点之一便是不合理医疗,如治疗方案的不合理和手术检查耗材的不合理。所谓不合理,可以体现在完整性异常方面。但是,在现有医学领域的概念中,并没有关于完整性的明确定义。如,在患者某次住院就诊中治疗项目的完整性,或者某次手术中检查项目及所需耗材的完整性。
针对现有技术中无法对医疗领域完整性做出检测的技术问题,目前尚未提供有效的解决方案。
发明内容
本发明的目的在于提供了一种确定异常医疗清单的方法、装置、计算机设备和计算机可读存储介质,能够解决现有技术中无法对医疗领域完整性做出检测的技术问题。
本发明的一个方面提供了一种确定异常医疗清单的方法,所述方法包括:获取医疗结算数据;从所述医疗结算数据中提取出属于目标清单类型的目标医疗清单,每个所述目标医疗清单包括多个医疗项;计算所有所述目标医疗清单中各个所述医疗项的支持度,作为第一支持度;根据计算的各个所述医疗项的第一支持度构建有向图,所述有向图的节点为所述医疗项,所述有向图的有向边为两个所述医疗项第一支持度的大小顺序;从所述有向图中筛选出所述目标清单类型关联的频繁k项集,每个所述频繁k项集包括多个所述医疗项,k为大于等于2的整数;根据筛选出的所述频繁k项集确定所述目标医疗清单是否存在异常。
可选地,根据计算的各个所述医疗项的第一支持度构建有向图包括:筛选出第一支持度大于等于第一支持度阈值的医疗项;获取筛选出的任意两个所述医疗项作为第一频繁1项集和第二频繁1项集;计算所述第一频繁1项集和所述第二频繁1项集的支持度得到第二支持度;若所述第二支持度大于等于第二支持度阈值,则构建所述第一频繁1项集和所述第二频繁1项集之间的有向边。
可选地,从所述有向图中筛选出所述目标清单类型关联的频繁k项集包括:计算所述有向图中依次存在所述有向边的k个医疗项的置信度;在所述k个医疗项的置信度大于等于置信度阈值时,将所述k个医疗项确定为所述目标清单类型关联的频繁k项集。
可选地,根据筛选出的所述频繁k项集确定所述目标医疗清单是否存在异常包括:针对每个所述频繁k项集,统计包含所述频繁k项集的目标医疗清单的数量;统计所有所述目标医疗清单的数量;在包含所述频繁k项集的目标医疗清单的数量与所有所述目标医疗清单的数量的比值大于等于占比阈值时,将所述频繁k项集确定为完整k项集;根据所有所述完整k项集确定所述目标医疗清单是否存在异常。
可选地,根据所有所述完整k项集确定所述目标医疗清单是否存在异常包括:计算所述目标医疗清单对每个所述完整k项集的覆盖率;根据每个所述覆盖率计算所述目标医疗清单的完整度;在所述目标医疗清单的完整度小于等于完整度阈值时,确定所述目标医疗清单存在异常。
可选地,计算所述目标医疗清单对每个所述完整k项集的覆盖率包括:
Figure BDA0002421746830000021
其中,
Figure BDA0002421746830000022
为覆盖率,V为某个完整k项集,nk为完整k项集V中包含医疗项的个数,
Figure BDA0002421746830000023
为完整k项集V中的医疗项。
可选地,根据每个所述覆盖率和每个所述医疗项占比计算所述目标医疗清单的完整度包括:
Figure BDA0002421746830000031
其中,cp_pctv为完整度,nj为完整j项集中包含医疗项的个数。
本发明的另一个方面提供了一种确定异常医疗清单的装置,所述装置包括:获取模块,用于获取医疗结算数据;提取模块,用于从所述医疗结算数据中提取出属于目标清单类型的目标医疗清单,每个所述目标医疗清单包括多个医疗项;计算模块,用于计算所有所述目标医疗清单中各个所述医疗项的支持度,作为第一支持度;构建模块,用于根据计算的各个所述医疗项的第一支持度构建有向图,所述有向图的节点为所述医疗项,所述有向图的有向边为两个所述医疗项第一支持度的大小顺序;筛选模块,用于从所述有向图中筛选出所述目标清单类型关联的频繁k项集,每个所述频繁k项集包括多个所述医疗项,k为大于等于2的整数;确定模块,用于根据筛选出的所述频繁k项集确定所述目标医疗清单是否存在异常。
可选地,构建模块还用于:筛选出第一支持度大于等于第一支持度阈值的医疗项;获取筛选出的任意两个所述医疗项作为第一频繁1项集和第二频繁1项集;计算所述第一频繁1项集和所述第二频繁1项集的支持度得到第二支持度;若所述第二支持度大于等于第二支持度阈值,则构建所述第一频繁1项集和所述第二频繁1项集之间的有向边。
可选地,筛选模块还用于:计算所述有向图中依次存在所述有向边的k个医疗项的置信度;在所述k个医疗项的置信度大于等于置信度阈值时,将所述k个医疗项确定为所述目标清单类型关联的频繁k项集。
可选地,确定模块还用于:针对每个所述频繁k项集,统计包含所述频繁k项集的目标医疗清单的数量;统计所有所述目标医疗清单的数量;在包含所述频繁k项集的目标医疗清单的数量与所有所述目标医疗清单的数量的比值大于等于占比阈值时,将所述频繁k项集确定为完整k项集;根据所有所述完整k项集确定所述目标医疗清单是否存在异常。
可选地,确定模块在根据所有所述完整k项集确定所述目标医疗清单是否存在异常时还用于:计算所述目标医疗清单对每个所述完整k项集的覆盖率;根据每个所述覆盖率计算所述目标医疗清单的完整度;在所述目标医疗清单的完整度小于等于完整度阈值时,确定所述目标医疗清单存在异常。
可选地,确定模块在计算所述目标医疗清单对每个所述完整k项集的覆盖率时还用于执行如下公式:
Figure BDA0002421746830000041
其中,
Figure BDA0002421746830000042
为覆盖率,V为某个完整k项集,nk为完整k项集V中包含医疗项的个数,
Figure BDA0002421746830000044
为完整k项集V中的医疗项。
可选地,确定模块在根据每个所述覆盖率和每个所述医疗项占比计算所述目标医疗清单的完整度时还用于执行如下公式:
Figure BDA0002421746830000043
其中,cp_pctv为完整度,nj为完整j项集中包含医疗项的个数。
本发明提供的确定异常医疗清单的方法,仅需要扫描一次数据库获取医疗结算数据,然后从扫描到的医疗结算数据中提取出目标清单类型的目标医疗清单,进一步根据目标医疗清单中各个医疗项的第一支持度构建有向图,并从有向图中筛选出目标清单类型所关联的频繁k项集,进而利用频繁k项集对目标医疗清单的完整性进行检测以确定该目标医疗清单是否存在异常,解决了现有技术中无法对医疗领域完整性做出检测的技术问题,且通过频繁k项集对目标医疗清单的完整性进行检测,检测准确率较高,另外,本实施例在检测完整性时只需扫描一次数据库即可,额外提高了处理速度。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示意性示出了根据本发明实施例的确定异常医疗清单的方法的流程图;
图2示意性示出了根据本发明实施例的有向图的示意图;
图3示意性示出了根据本发明实施例的确定异常医疗清单的方案的示意图;
图4示意性示出了根据本发明实施例的确定异常医疗清单的装置的框图;
图5示意性示出了根据本发明实施例的适于实现确定异常医疗清单的方法的计算机设备的框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
本发明的实施例提供了一种确定异常医疗清单的方法,该方法可以仅需要扫描一次数据库即可确定出存在异常的医疗清单,解决了现有技术中无法对医疗领域完整性做出检测的技术问题,且检测准确率和处理速度较高。具体地,图1示意性示出了根据本发明实施例的确定异常医疗清单的方法的流程图,如图1所示,该确定异常医疗清单的方法可以包括步骤S1~步骤S6,其中:
步骤S1,获取医疗结算数据。
本实施例中,可以从医疗数据库中获取医疗结算数据,其中,医疗数据库可以关联多家医院,每家医院定期上传阶段内产生的医疗结算清单。即,医疗结算数据可以包括多条医疗结算清单,其中,每条医疗结算清单对应一个患者,医疗结算清单可以包括该医疗结算清单的清单类型、患者描述信息、就诊医院信息和医疗描述信息等,其中,清单类型可以包括诊断编号,如中草药类型、手术类型或其他类型等,患者描述信息可以包括患者姓名、患者性别、患者年龄、患者身份证号和/或患者社保卡号等信息,就诊医院信息可以包括患者就诊医院的医院名称和/或医院编号等信息,医疗描述信息可以包括诊疗信息和/或药品信息,诊疗信息可以包括检查项目、检查项目统一编码、检查费用、诊疗手段、诊疗手段统一编码和/或诊疗费用等信息,药品信息可以包括药品名称、药品统一编码、药品规格、药品数量和/或药品费用等信息。
步骤S2,从所述医疗结算数据中提取出属于目标清单类型的目标医疗清单,每个所述目标医疗清单包括多个医疗项。
本实施例中,可以先从医疗结算数据中筛选出属于目标清单类型的目标医疗结算清单,然后从每个目标医疗结算清单中提取出目标医疗清单,其中,目标医疗结算清单包含的医疗项可以是医疗描述信息中的部分项或者全部项,如检查项目、检查项目统一编码、诊疗手段、诊疗手段统一编码、药品名称和/或药品统一编码等等。
步骤S3,计算所有所述目标医疗清单中各个所述医疗项的支持度,作为第一支持度。
需要说明的是,本实施例对于目标医疗清单中每个医疗项的支持度均称为第一支持度。其中,计算第一支持度的方法可以为:统计所有所述目标医疗清单的数量;统计包含同一所述医疗项的目标医疗清单的数量;将包含同一所述医疗项的目标医疗清单的数量与所有所述目标医疗清单的数量的比值作为该医疗项的支持度。
例如,目标医疗清单1中包括医疗项A和医疗项D,目标医疗清单2中包括医疗项B和医疗项C,目标医疗清单3中包括医疗项A、医疗项B和医疗项C,将各个医疗项用位向量表示,某个医疗项在某个目标医疗清单中出现记为1反之为0,则医疗项A的位向量为(101),医疗项B的位向量为(011),医疗项C的位向量为(011),医疗项D的位向量为(100),那么医疗项A的支持度为2/3,医疗项B的支持度为2/3,医疗项C的支持度为2/3,医疗项D的支持度为1/3。
步骤S4,根据计算的各个所述医疗项的第一支持度构建有向图,所述有向图的节点为所述医疗项,所述有向图的有向边为两个所述医疗项第一支持度的大小顺序。
本实施例中,构建有向图的目的在于寻找目标清单类型关联的频繁k项集。现有技术中确定频繁k项集的手段是采用Apriori算法多次扫描数据库生成候选k项集,然后从候选k项集中筛选出频繁k项集,Apriori算法虽然减少了候选k项集的数据量,但是需要多次扫描数据库才可以确定出频繁k项集。而本实施例仅需扫描一次数据库根据扫描结果计算出各个医疗项的第一支持度,然后基于计算出的第一支持度构建有向图并执行后续步骤S5基于有向图筛选出频繁k项集。其中,有向图中包括多个节点,节点之间存在有向边,每个节点为一个医疗项,有向边为两个医疗项的第一支持度的大小顺序,如从大到小的方向,或者从小到大的方向。优选地,为了避免有向图构建过程中出现死环,有向边的方向可以是由支持度大的医疗项指向支持度小的医疗项。
可选地,为了降低干扰概率,提高确定异常医疗清单的准确性,本实施例可以剔除出现频率较低的医疗项,并根据出现频率较高的医疗项构建有向图。具体地,步骤S4可以包括步骤S41~步骤S44,其中:
步骤S41,筛选出第一支持度大于等于第一支持度阈值的医疗项;
步骤S42,获取筛选出的任意两个所述医疗项作为第一频繁1项集和第二频繁1项集;
步骤S43,计算所述第一频繁1项集和所述第二频繁1项集的支持度得到第二支持度;
步骤S44,若所述第二支持度大于等于第二支持度阈值,则构建所述第一频繁1项集和所述第二频繁1项集之间的有向边。
本实施例中,首先筛选出第一支持度大于等于第一支持度阈值的医疗项,然后根据筛选出的医疗项构建有向图,其中,筛选出的每个医疗项可以称为一个频繁1项集,有向图即由所有的频繁1项集和频繁1项集之间的有向边构成。对于有向边的构建可以是:针对任意两个频繁1项集,如第一频繁1项集和第二频繁1项集,计算二者的支持度作为第二支持度,在第二支持度大于等于第二支持度阈值时,认为二者的关联性较强,可以构建二者的有向边。其中,为了避免有向图构建过程中出现死环,有向边的方向可以是由支持度大的频繁1项集指向支持度小的频繁1项集。
例如,如图2所示,有向图包括3个频繁1项集:A、B和C,其中,A和B的第二支持度、A和C的第二支持度以及B和C的第二支持度均大于等于第二支持度阈值。
步骤S5,从所述有向图中筛选出所述目标清单类型关联的频繁k项集,每个所述频繁k项集包括多个所述医疗项,k为大于等于2的整数。
其中,频繁k项集可以是由检查项目、检查项目统一编码、诊疗手段、诊疗手段统一编码、药品名称和/或药品统一编码中频繁一起出现的医疗项组成的集合。
本实施例中,为了进一步提高确定异常医疗清单的准确性,在筛选频繁k项集时除了考虑到支持度的因素,还将置信度考虑在内。具体地,步骤S5可以包括步骤S51和步骤S52,其中:
步骤S51,计算所述有向图中依次存在所述有向边的k个医疗项的置信度;
步骤S52,在所述k个医疗项的置信度大于等于置信度阈值时,将所述k个医疗项确定为所述目标清单类型关联的频繁k项集。
本实施例中,所谓将支持度考虑在内即是有向图的k个医疗项中依次存在有向边。如,有向图中存在一关系为:麻醉指向钠测定,钠测定指向钙测定,在k为2时,依次存在有向边的2个医疗项可以为:麻醉和钠测定,钠测定和钙测定;在k为3时,依次存在有向边的3个医疗项为:麻醉、钠测定和钙测定。对于置信度的计算,以麻醉和钠测定为例,置信度为同时包含麻醉和钠测定的目标医疗清单的数量与包含麻醉的目标医疗清单的数量的比值。在麻醉和钠测定的置信度大于等于置信度阈值时,将麻醉和钠测定确定为频繁2项集。
步骤S6,根据筛选出的所述频繁k项集确定目标医疗清单是否存在异常。
具体可以判断目标医疗清单中是否包含所有频繁k项集中的所有医疗项,若是则确定该目标医疗清单不存在异常,否则认为该目标医疗清单存在异常。
可选地,还可以从频繁k项集中进一步筛选出出现频繁度更高的项集,并根据出现频繁度更高的项集确定目标医疗清单是否存在异常。如步骤S6可以包括步骤S61~步骤S64,其中:
步骤S61,针对每个所述频繁k项集,统计包含所述频繁k项集的目标医疗清单的数量;
步骤S62,统计所有所述目标医疗清单的数量;
步骤S63,在包含所述频繁k项集的目标医疗清单的数量与所有所述目标医疗清单的数量的比值大于等于占比阈值时,将所述频繁k项集确定为完整k项集;
步骤S64,根据所有所述完整k项集确定所述目标医疗清单是否存在异常。
本实施例中,针对每个频繁k项集,计算该频繁k项集在目标医疗清单中出现的频繁度,在频繁度较高时则将该频繁k项集作为完整k项集,用于评估目标医疗清单是否存在异常。
比如,判断目标医疗清单中是否包含所有完整k项集中的所有医疗项,若是则确定该目标医疗清单不存在异常,否则认为该目标医疗清单存在异常。或者,判断目标医疗清单对所有完整k项集的包含度是否达到一定数值,若是,则确定该目标医疗清单不存在异常,否则认为该目标医疗清单存在异常,具体地,步骤S64可以包括步骤S641~步骤S643,其中
步骤S641,计算所述目标医疗清单对每个所述完整k项集的覆盖率;
步骤S642,根据每个所述覆盖率计算所述目标医疗清单的完整度;
步骤S643,在所述目标医疗清单的完整度小于等于完整度阈值时,确定所述目标医疗清单存在异常。
本实施例中,计算覆盖率的公式可以为:
Figure BDA0002421746830000101
其中,
Figure BDA0002421746830000102
为覆盖率,V为某个完整k项集,nk为完整k项集V中包含医疗项的个数,
Figure BDA0002421746830000103
为完整k项集V中的医疗项。
计算完整度的公式可以为:
Figure BDA0002421746830000104
其中,cp_pctv为完整度,nj为完整j项集中包含医疗项的个数。
本发明提供的确定异常医疗清单的方法,仅需要扫描一次数据库获取医疗结算数据,然后从扫描到的医疗结算数据中提取出目标清单类型的目标医疗清单,进一步根据目标医疗清单中各个医疗项的第一支持度构建有向图,并从有向图中筛选出目标清单类型所关联的频繁k项集,进而利用频繁k项集对目标医疗清单的完整性进行检测以确定该目标医疗清单是否存在异常,解决了现有技术中无法对医疗领域完整性做出检测的技术问题,且通过频繁k项集对目标医疗清单的完整性进行检测,检测准确率较高,另外,本实施例在检测完整性时只需扫描一次数据库即可,额外提高了处理速度。
图3示意性示出了根据本发明实施例的确定异常医疗清单的方案的示意图。
如图3所示,本实施例可以应用在如下两个方面,同诊断下治疗方案的完整性检测以及同手术下检查和耗材项目的完整性检测。以当次就诊明细中治疗、手术、检查和耗材等作为医疗清单,通过本实施例提供的方法筛选出频繁k项集,从而检测目标医疗清单的完整性是否存在异常。
本发明的实施例提供了一种确定异常医疗清单的装置,该装置与上述实施例所述的确定异常医疗清单的方法相对应,相应的技术特征和技术效果在本实施例中不再详述,相关之处可参考上述实施例。具体地,图4示意性示出了根据本发明实施例的确定异常医疗清单的装置的框图,如图4所示,该确定异常医疗清单的装置400可以包括获取模块401、提取模块402、计算模块403、构建模块404、筛选模块405和确定模块406,其中:
获取模块401,用于获取医疗结算数据;
提取模块402,用于从所述医疗结算数据中提取出属于目标清单类型的目标医疗清单,每个所述目标医疗清单包括多个医疗项;
计算模块403,用于计算所有所述目标医疗清单中各个所述医疗项的支持度,作为第一支持度;
构建模块404,用于根据计算的各个所述医疗项的第一支持度构建有向图,所述有向图的节点为所述医疗项,所述有向图的有向边为两个所述医疗项第一支持度的大小顺序;
筛选模块405,用于从所述有向图中筛选出所述目标清单类型关联的频繁k项集,每个所述频繁k项集包括多个所述医疗项,k为大于等于2的整数;
确定模块406,用于根据筛选出的所述频繁k项集确定所述目标医疗清单是否存在异常。
可选地,构建模块还用于:筛选出第一支持度大于等于第一支持度阈值的医疗项;获取筛选出的任意两个所述医疗项作为第一频繁1项集和第二频繁1项集;计算所述第一频繁1项集和所述第二频繁1项集的支持度得到第二支持度;若所述第二支持度大于等于第二支持度阈值,则构建所述第一频繁1项集和所述第二频繁1项集之间的有向边。
可选地,筛选模块还用于:计算所述有向图中依次存在所述有向边的k个医疗项的置信度;在所述k个医疗项的置信度大于等于置信度阈值时,将所述k个医疗项确定为所述目标清单类型关联的频繁k项集。
可选地,确定模块还用于:针对每个所述频繁k项集,统计包含所述频繁k项集的目标医疗清单的数量;统计所有所述目标医疗清单的数量;在包含所述频繁k项集的目标医疗清单的数量与所有所述目标医疗清单的数量的比值大于等于占比阈值时,将所述频繁k项集确定为完整k项集;根据所有所述完整k项集确定所述目标医疗清单是否存在异常。
可选地,确定模块在根据所有所述完整k项集确定所述目标医疗清单是否存在异常时还用于:计算所述目标医疗清单对每个所述完整k项集的覆盖率;根据每个所述覆盖率计算所述目标医疗清单的完整度;在所述目标医疗清单的完整度小于等于完整度阈值时,确定所述目标医疗清单存在异常。
可选地,确定模块在计算所述目标医疗清单对每个所述完整k项集的覆盖率时还用于执行如下公式:
Figure BDA0002421746830000121
其中,
Figure BDA0002421746830000122
为覆盖率,V为某个完整k项集,nk为完整k项集V中包含医疗项的个数,
Figure BDA0002421746830000123
为完整k项集V中的医疗项。
可选地,确定模块在根据每个所述覆盖率和每个所述医疗项占比计算所述目标医疗清单的完整度时还用于执行如下公式:
Figure BDA0002421746830000124
其中,cp_pctv为完整度,nj为完整j项集中包含医疗项的个数。
图5示意性示出了根据本发明实施例的适于实现确定异常医疗清单的方法的计算机设备的框图。本实施例中,计算机设备500可以是执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。如图5所示,本实施例的计算机设备500至少包括但不限于:可通过系统总线相互通信连接的存储器501、处理器502、网络接口503。需要指出的是,图5仅示出了具有组件501-503的计算机设备300,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
本实施例中,存储器503至少包括一种类型的计算机可读存储介质,可读存储介质包括包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器501可以是计算机设备500的内部存储单元,例如该计算机设备500的硬盘或内存。在另一些实施例中,存储器501也可以是计算机设备500的外部存储设备,例如该计算机设备500上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,存储器501还可以既包括计算机设备500的内部存储单元也包括其外部存储设备。在本实施例中,存储器501通常用于存储安装于计算机设备500的操作系统和各类应用软件,例如确定异常医疗清单的方法的程序代码等,该确定异常医疗清单的方法包括:获取医疗结算数据;从所述医疗结算数据中提取出属于目标清单类型的目标医疗清单,每个所述目标医疗清单包括多个医疗项;计算所有所述目标医疗清单中各个所述医疗项的支持度,作为第一支持度;根据计算的各个所述医疗项的第一支持度构建有向图,所述有向图的节点为所述医疗项,所述有向图的有向边为两个所述医疗项第一支持度的大小顺序;从所述有向图中筛选出所述目标清单类型关联的频繁k项集,每个所述频繁k项集包括多个所述医疗项,k为大于等于2的整数;根据筛选出的所述频繁k项集确定所述目标医疗清单是否存在异常。此外,存储器501还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器502在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器502通常用于控制计算机设备500的总体操作。例如执行与计算机设备500进行数据交互或者通信相关的控制和处理等。本实施例中,处理器502用于运行存储器501中存储的确定异常医疗清单的方法的步骤的程序代码。
在本实施例中,存储于存储器501中的确定异常医疗清单的方法还可以被分割为一个或者多个程序模块,并由一个或多个处理器(本实施例为处理器502)所执行,以完成本发明。
网络接口503可包括无线网络接口或有线网络接口,该网络接口503通常用于在计算机设备500与其他计算机设备之间建立通信链接。例如,网络接口503用于通过网络将计算机设备500与外部终端相连,在计算机设备500与外部终端之间的建立数据传输通道和通信链接等。网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobile communication,简称为GSM)、宽带码分多址(Wideband CodeDivision Multiple Access,简称为WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。
本实施例还提供一种计算机可读存储介质,包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等,其上存储有计算机程序,所述计算机程序被处理器执行时实现确定异常医疗清单的方法的步骤,该确定异常医疗清单的方法包括:获取医疗结算数据;从所述医疗结算数据中提取出属于目标清单类型的目标医疗清单,每个所述目标医疗清单包括多个医疗项;计算所有所述目标医疗清单中各个所述医疗项的支持度,作为第一支持度;根据计算的各个所述医疗项的第一支持度构建有向图,所述有向图的节点为所述医疗项,所述有向图的有向边为两个所述医疗项第一支持度的大小顺序;从所述有向图中筛选出所述目标清单类型关联的频繁k项集,每个所述频繁k项集包括多个所述医疗项,k为大于等于2的整数;根据筛选出的所述频繁k项集确定所述目标医疗清单是否存在异常。
显然,本领域的技术人员应该明白,上述的本发明实施例的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明实施例不限制于任何特定的硬件和软件结合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种确定异常医疗清单的方法,其特征在于,所述方法包括:
获取医疗结算数据;
从所述医疗结算数据中提取出属于目标清单类型的目标医疗清单,每个所述目标医疗清单包括多个医疗项;
计算所有所述目标医疗清单中各个所述医疗项的支持度,作为第一支持度;
根据计算的各个所述医疗项的第一支持度构建有向图,所述有向图的节点为所述医疗项,所述有向图的有向边为两个所述医疗项第一支持度的大小顺序;
从所述有向图中筛选出所述目标清单类型关联的频繁k项集,每个所述频繁k项集包括多个所述医疗项,k为大于等于2的整数;
根据筛选出的所述频繁k项集确定所述目标医疗清单是否存在异常。
2.根据权利要求1所述的方法,其特征在于,根据计算的各个所述医疗项的第一支持度构建有向图包括:
筛选出第一支持度大于等于第一支持度阈值的医疗项;
获取筛选出的任意两个所述医疗项作为第一频繁1项集和第二频繁1项集;
计算所述第一频繁1项集和所述第二频繁1项集的支持度得到第二支持度;
若所述第二支持度大于等于第二支持度阈值,则构建所述第一频繁1项集和所述第二频繁1项集之间的有向边。
3.根据权利要求2所述的方法,其特征在于,从所述有向图中筛选出所述目标清单类型关联的频繁k项集包括:
计算所述有向图中依次存在所述有向边的k个医疗项的置信度;
在所述k个医疗项的置信度大于等于置信度阈值时,将所述k个医疗项确定为所述目标清单类型关联的频繁k项集。
4.根据权利要求1所述的方法,其特征在于,根据筛选出的所述频繁k项集确定所述目标医疗清单是否存在异常包括:
针对每个所述频繁k项集,统计包含所述频繁k项集的目标医疗清单的数量;
统计所有所述目标医疗清单的数量;
在包含所述频繁k项集的目标医疗清单的数量与所有所述目标医疗清单的数量的比值大于等于占比阈值时,将所述频繁k项集确定为完整k项集;
根据所有所述完整k项集确定所述目标医疗清单是否存在异常。
5.根据权利要求4所述的方法,其特征在于,根据所有所述完整k项集确定所述目标医疗清单是否存在异常包括:
计算所述目标医疗清单对每个所述完整k项集的覆盖率;
根据每个所述覆盖率计算所述目标医疗清单的完整度;
在所述目标医疗清单的完整度小于等于完整度阈值时,确定所述目标医疗清单存在异常。
6.根据权利要求5所述的方法,其特征在于,计算所述目标医疗清单对每个所述完整k项集的覆盖率包括:
Figure FDA0002421746820000021
其中,
Figure FDA0002421746820000022
为覆盖率,V为某个完整k项集,nk为完整k项集V中包含医疗项的个数,
Figure FDA0002421746820000023
为完整k项集V中的医疗项。
7.根据权利要求6所述的方法,其特征在于,根据每个所述覆盖率计算所述目标医疗清单的完整度包括:
Figure FDA0002421746820000024
其中,cp-pctv为完整度,nj为完整j项集中包含医疗项的个数。
8.一种确定异常医疗清单的装置,其特征在于,所述装置包括:
获取模块,用于获取医疗结算数据;
提取模块,用于从所述医疗结算数据中提取出属于目标清单类型的目标医疗清单,每个所述目标医疗清单包括多个医疗项;
计算模块,用于计算所有所述目标医疗清单中各个所述医疗项的支持度,作为第一支持度;
构建模块,用于根据计算的各个所述医疗项的第一支持度构建有向图,所述有向图的节点为所述医疗项,所述有向图的有向边为两个所述医疗项第一支持度的大小顺序;
筛选模块,用于从所述有向图中筛选出所述目标清单类型关联的频繁k项集,每个所述频繁k项集包括多个所述医疗项,k为大于等于2的整数;
确定模块,用于根据筛选出的所述频繁k项集确定所述目标医疗清单是否存在异常。
9.一种计算机系统,其包括多个计算机设备,各计算机设备包括存储器.处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述多个计算机设备的处理器执行所述计算机程序时共同实现权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,其包括多个存储介质,各存储介质上存储有计算机程序,其特征在于,所述多个存储介质存储的所述计算机程序被处理器执行时共同实现权利要求1至7任一项所述的方法。
CN202010207777.0A 2020-03-23 2020-03-23 一种确定异常医疗清单的方法、装置、设备和存储介质 Active CN111428198B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010207777.0A CN111428198B (zh) 2020-03-23 2020-03-23 一种确定异常医疗清单的方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010207777.0A CN111428198B (zh) 2020-03-23 2020-03-23 一种确定异常医疗清单的方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN111428198A true CN111428198A (zh) 2020-07-17
CN111428198B CN111428198B (zh) 2023-02-07

Family

ID=71549056

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010207777.0A Active CN111428198B (zh) 2020-03-23 2020-03-23 一种确定异常医疗清单的方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN111428198B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112349399A (zh) * 2020-11-12 2021-02-09 杭州火树科技有限公司 基于关联算法的手术缺漏自动检测方法
CN113850410A (zh) * 2021-08-03 2021-12-28 望海康信(北京)科技股份公司 病种控费项目优化方法、系统及相应设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100105989A1 (en) * 2005-06-08 2010-04-29 Akihiro Inokuchi Medical guide system
CN106384128A (zh) * 2016-09-09 2017-02-08 西安交通大学 一种挖掘时序数据状态关联的方法
CN109859852A (zh) * 2019-01-25 2019-06-07 青海大学 改进的Apriori算法及其在藏医关联挖掘中的应用
CN110766557A (zh) * 2019-09-16 2020-02-07 平安科技(深圳)有限公司 基于图分析的数据异常解析方法、系统和计算机设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100105989A1 (en) * 2005-06-08 2010-04-29 Akihiro Inokuchi Medical guide system
CN106384128A (zh) * 2016-09-09 2017-02-08 西安交通大学 一种挖掘时序数据状态关联的方法
CN109859852A (zh) * 2019-01-25 2019-06-07 青海大学 改进的Apriori算法及其在藏医关联挖掘中的应用
CN110766557A (zh) * 2019-09-16 2020-02-07 平安科技(深圳)有限公司 基于图分析的数据异常解析方法、系统和计算机设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈明,史忠植,王文杰: "一种有效的基于图的关联规则挖掘算法", 《计算机应用》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112349399A (zh) * 2020-11-12 2021-02-09 杭州火树科技有限公司 基于关联算法的手术缺漏自动检测方法
CN112349399B (zh) * 2020-11-12 2022-05-24 杭州火树科技有限公司 基于关联算法的手术缺漏自动检测方法
CN113850410A (zh) * 2021-08-03 2021-12-28 望海康信(北京)科技股份公司 病种控费项目优化方法、系统及相应设备和存储介质
CN113850410B (zh) * 2021-08-03 2022-11-22 望海康信(北京)科技股份公司 病种控费项目优化方法、系统及相应设备和存储介质

Also Published As

Publication number Publication date
CN111428198B (zh) 2023-02-07

Similar Documents

Publication Publication Date Title
CN108876636B (zh) 理赔智能风控方法、系统、计算机设备及存储介质
CN112365987B (zh) 诊断数据异常检测方法、装置、计算机设备及存储介质
US10592837B2 (en) Identifying security risks via analysis of multi-level analytical records
US11651330B2 (en) Machine learning for dynamically updating a user interface
US10891352B1 (en) Code vector embeddings for similarity metrics
CN110060750B (zh) 医疗数据推送方法、系统、计算机设备及可读存储介质
CN111428198B (zh) 一种确定异常医疗清单的方法、装置、设备和存储介质
US10269447B2 (en) Algorithm, data pipeline, and method to detect inaccuracies in comorbidity documentation
Tran et al. A framework for feature extraction from hospital medical data with applications in risk prediction
US20230154582A1 (en) Dynamic database updates using probabilistic determinations
CN112131277B (zh) 基于大数据的医疗数据异常分析方法、装置和计算机设备
US20200202519A1 (en) Vulnerable plaque identification method, application server thereof, and computer readable medium
CN111430036A (zh) 异常手术行为的医疗信息识别方法及装置
CN110782996A (zh) 医疗数据库的构建方法、装置、计算机设备和存储介质
US20210174968A1 (en) Visualization of Social Determinants of Health
US20200097301A1 (en) Predicting relevance using neural networks to dynamically update a user interface
US20120041784A1 (en) Computerized Surveillance of Medical Treatment
Wang et al. Comparing and integrating US COVID-19 data from multiple sources with anomaly detection and repairing
CN109102845B (zh) 医疗单据审核方法、装置、计算机设备和存储介质
Chen et al. Using explainable boosting machines (ebms) to detect common flaws in data
US20200258634A1 (en) Machine learning for automatically providing notifications and providing content dynamically
CN114255837A (zh) 数据查询方法、装置、计算机可读存储介质及电子设备
Moradi et al. Hierarchical spatio-temporal change-point detection
CN112364857B (zh) 基于数值抽取的图像识别方法、装置及存储介质
US11948203B2 (en) Methods and systems for behavior signal generation and processing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant