CN109545382A - 一种基于大数据的雷同病例识别方法及计算设备 - Google Patents

一种基于大数据的雷同病例识别方法及计算设备 Download PDF

Info

Publication number
CN109545382A
CN109545382A CN201811284814.7A CN201811284814A CN109545382A CN 109545382 A CN109545382 A CN 109545382A CN 201811284814 A CN201811284814 A CN 201811284814A CN 109545382 A CN109545382 A CN 109545382A
Authority
CN
China
Prior art keywords
case
data item
concentrates
cases
collection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811284814.7A
Other languages
English (en)
Inventor
南致超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201811284814.7A priority Critical patent/CN109545382A/zh
Publication of CN109545382A publication Critical patent/CN109545382A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明实施例公开了一种基于大数据的雷同病例识别方法及计算设备,该方法包括:计算设备接收第一病例集,所述第一病例集包括多个病例,单个病例的病例数据包括多个数据项;计算所述第一病例集中的第一病例的雷同率,所述第一病例为所述第一病例集中任意一个病例,所述第一病例的雷同率为所述第一病例包括的数据项的种数与所述第一病例集中所有病例所包括的数据项的总种数的比值;判断所述第一病例的雷同率是否大于第一比例阈值,如果是,则输出用于提示所述第一病例为雷同病例的提示信息,进而实现雷同病例的识别,以进一步对该雷同病例进行审核,避免病例造假。

Description

一种基于大数据的雷同病例识别方法及计算设备
技术领域
本发明涉及医疗管理技术领域,具体涉及一种基于大数据的雷同病例识别方法及计算设备。
背景技术
随着国家公共医疗的布局和医疗改革的不断深入,支付制度改革是系统工程是医保管理理念和医保经办机构角色发生重大转变的体现。推行按照病种付费,充分体现了支付制度才是全面医改的关键所在。
所谓按病种付费,就是指通过统一的疾病诊断分类,科学地制定出每一种疾病的定额偿付标准,社保机构按照该标准与住院人次,向定点医疗机构支付住院费用,使得医疗资源利用标准化,即医疗机构资源消耗与所治疗的住院病人的数量、疾病复杂程度和服务强度成正比。简而言之,就是明确规定某一种疾病该花多少钱,从而既避免了医疗单位滥用医疗服务项目、重复项目和分解项目,防止医院小病大治,又保证了医疗服务质量。
标准化的医疗信息对于医疗信息大数据应用于按病种收费的支付方式非常重要,医疗信息的标准化是实现医疗大数据进行应用的前提。病种的分类目前通常采用国际疾病分类(international Classification of diseases,ICD)。ICD-10根据病因、部位、病理及临床表现等特征将疾病划分为21章节、26000多种病种,并对各个病种进行编码。然而,对于中国的医疗的整体环境来说,各个地区常见的病种远远少于26000,且医疗人员在记录病例时,由于现有技术中病种的多样性、复杂性,医务人员往往不按照国际的标准来等级,各个地区有地区化的语言描述,给按病种付费的实施带来一定困难。
按照规定,各地确定按病种付费支付标准时,应充分考虑医疗服务成本、既往实际发生费用、医保基金承受能力和参保人负担水平等因素,结合病种主要操作和治疗方式,通过与医疗机构协商谈判合理确定,如何根据各地的医疗情况确定支付标准,如何管理按病种付费的医疗费用,检测和分析病例、医疗付费标准等都是目前急需解决的技术问题。
发明内容
本发明实施例提供了一种基于大数据的雷同病例识别方法及计算设备,可以实现雷同病例的识别,以进一步对该雷同病例进行审核,避免病例造假。
第一方面,本发明实施例提供一种基于大数据的雷同病例识别方法,包括:
接收第一病例集,所述第一病例集包括多个病例,单个病例的病例数据包括多个数据项;
计算所述第一病例集中的第一病例的雷同率,所述第一病例为所述第一病例集中任意一个病例,所述第一病例的雷同率为所述第一病例包括的数据项的种数与所述第一病例集中所有病例所包括的数据项的总种数的比值;
判断所述第一病例的雷同率是否大于第一比例阈值,如果是,则输出用于提示所述第一病例为雷同病例的提示信息。
在本申请的一种实现中,所述获取第一病例集包括:
接收第二病例集,从所述第二病例集中筛选出满足第一筛选条件的病例,得到所述第一病例集,所述第一筛选条件包括以下一种或多种的组合:
医院为第一医院;
就诊时间在第一时间区间的范围之内;
参保人为第一参保人;
主治医师为第一医师。
可选地,所述方法还包括:根据筛选条件与比例值的对应关系,确定所述第一筛选条件对应的第一比例阈值。
在本申请的又一种实现中,所述数据项为药品的标识。
在本申请的又一种实现中,病例i的雷同率通过下述公式计算:
Pi=Ni/N
N=∑iNi
其中,i为第一病例集中病例的索引,i为正整数,Pi为所述病例i的雷同率,Ni为所述病例i包括的数据项的种数,N为所述第一病例集中所有病例所包括的数据项的总种数。
在本申请的又一种实现中,所述方法还包括:
根据所述第一病例集中的所有病例的雷同率,确定所述第一病例集中所有的雷同病例;
可视化显示所述第一病例集中所有的雷同病例。
可选地,所述可视化显示根据所述第一病例集中所有的雷同病例包括:
统计第三病例集中第一数据项出现的频次,显示第一图像,所述第一图像包括所述第一数据项与所述第一数据项的频次的对应关系;
其中,所述第三病例集为所述第一病例集中所有的雷同病例的集合,所述第一数据项为所述第三病例集中任一病例所包括的任一种数据项。
第二方面,本申请实施例还提供了一种计算设备,包括:
接收单元,用于接收第一病例集,所述第一病例集包括多个病例,单个病例的病例数据包括多个数据项;
第一计算单元,用于计算所述第一病例集中的第一病例的雷同率,所述第一病例为所述第一病例集中任意一个病例,所述第一病例的雷同率为所述第一病例包括的数据项的种数与所述第一病例集中所有病例所包括的数据项的总种数的比值;
判断单元,用于判断所述第一病例的雷同率是否大于第一比例阈值;
输出单元,用于在所述判断单元的判断结果为是时,输出用于提示所述第一病例为雷同病例的提示信息。
在本申请的一种实现中,接收单元具体用于:接收第二病例集,从所述第二病例集中筛选出满足第一筛选条件的病例,得到所述第一病例集,所述第一筛选条件包括以下一种或多种的组合:
医院为第一医院;
就诊时间在第一时间区间的范围之内;
参保人为第一参保人;
主治医师为第一医师。
可选地,所述计算设备还包括:确定单元,用于根据筛选条件与比例值的对应关系,确定所述第一筛选条件对应的第一比例阈值。
在本申请的又一种实现中,所述数据项为药品的标识。
在本申请的又一种实现中,病例i的雷同率通过下述公式计算:
Pi=Ni/N
N=∑iNi
其中,i为第一病例集中病例的索引,i为正整数,Pi为所述病例i的雷同率,Ni为所述病例i包括的数据项的种数,N为所述第一病例集中所有病例所包括的数据项的总种数。
在本申请的又一种实现中,所述计算设备还包括可视化单元,用于:
根据所述第一病例集中的所有病例的雷同率,确定所述第一病例集中所有的雷同病例;
可视化显示所述第一病例集中所有的雷同病例。
可选地,所述可视化单元执行所述可视化显示根据所述第一病例集中所有的雷同病例,包括:
统计第三病例集中第一数据项出现的频次,显示第一图像,所述第一图像包括所述第一数据项与所述第一数据项的频次的对应关系;
其中,所述第三病例集为所述第一病例集中所有的雷同病例的集合,所述第一数据项为所述第三病例集中任一病例所包括的任一种数据项。
第三方面,本申请实施例还提供了一种计算设备,包括处理器、存储器以及通信模块,所述处理器耦合所述存储器、通信模块,所述处理器用于调用所述存储器存储的程序代码执行:
通过所述通信模块接收第一病例集,所述第一病例集包括多个病例,单个病例的病例数据包括多个数据项;
计算所述第一病例集中的第一病例的雷同率,所述第一病例为所述第一病例集中任意一个病例,所述第一病例的雷同率为所述第一病例包括的数据项的种数与所述第一病例集中所有病例所包括的数据项的总种数的比值;
判断所述第一病例的雷同率是否大于第一比例阈值,如果是,则通过输出装置输出用于提示所述第一病例为雷同病例的提示信息。
在本申请的一种实现中,所述处理器执行所述通过所述通信模块接收第一病例集,具体包括执行:
通过所述通信模块接收第二病例集,从所述第二病例集中筛选出满足第一筛选条件的病例,得到所述第一病例集,所述第一筛选条件包括以下一种或多种的组合:
医院为第一医院;
就诊时间在第一时间区间的范围之内;
参保人为第一参保人;
主治医师为第一医师。
在本申请的又一种实现中,所述处理器还用于执行:
根据筛选条件与比例值的对应关系,确定所述第一筛选条件对应的第一比例阈值。
在本申请的又一种实现中,所述数据项为药品的标识。
在本申请的又一种实现中,病例i的雷同率通过下述公式计算:
Pi=Ni/N
N=∑iNi
其中,i为第一病例集中病例的索引,i为正整数,Pi为所述病例i的雷同率,Ni为所述病例i包括的数据项的种数,N为所述第一病例集中所有病例所包括的数据项的总种数。
在本申请的又一种实现中,所述处理器还用于执行:
根据所述第一病例集中的所有病例的雷同率,确定所述第一病例集中所有的雷同病例;
可视化显示所述第一病例集中所有的雷同病例。
可选地,所述处理器执行所述可视化显示根据所述第一病例集中所有的雷同病例,具体包括执行:
统计第三病例集中第一数据项出现的频次,显示第一图像,所述第一图像包括所述第一数据项与所述第一数据项的频次的对应关系;
其中,所述第三病例集为所述第一病例集中所有的雷同病例的集合,所述第一数据项为所述第三病例集中任一病例所包括的任一种数据项。
第四方面,本申请实施例还提供了一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述任意一种基于大数据的雷同病例识别方法。
第五方面,本申请实施例还提供了一种计算机程序,所述计算机程序包括计算机软件指令,所述计算机软件指令当被处理器执行时实现如第一方面所述的任意一种基于大数据的雷同病例识别方法。
综上,本发明实施例计算设备通过接收第一病例集,所述第一病例集包括多个病例,单个病例的病例数据包括多个数据项;计算所述第一病例集中的第一病例的雷同率,所述第一病例为所述第一病例集中任意一个病例,所述第一病例的雷同率为所述第一病例包括的数据项的种数与所述第一病例集中所有病例所包括的数据项的总种数的比值;判断所述第一病例的雷同率是否大于第一比例阈值,如果是,则输出用于提示所述第一病例为雷同病例的提示信息,进而实现雷同病例的识别,以进一步对该雷同病例进行审核,避免病例造假。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种医保管理平台的功能架构图;
图2为本发明实施例提供的一种雷同病例识别方法的流程图;
图3为本发明实施例提供的另一种雷同病例识别方法的流程图;
图4为本发明实施例提供的一种计算设备的结构示意图;
图5为本发明实施例提供的又一种计算设备的结构示意图;
图6为本发明实施例提供的又一种计算设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
为了更好理解本发明实施例,下面先对本发明实施例适用的医保管理平台的各个功能进行描述,请参阅图1,图1为本发明实施例提供的一种医保管理平台的功能架构图,该医保管理平台可以运行在计算设备中,为医保管理平台的运行商提供的一系列和病例、医保、病种分值等相关的功能,该医保管理平台包括但不限于如下部分或全部功能的实现:
病种编码,医保管理平台可以根据输入病例的病例数据对该病例中主诊断得到的病种进行编码,该病种编码方法可以采用ICD-10编码(本申请中也称六位码编码)、也可以采用其他编码方法,例如四位码编码(即六位码的前4位)、三位码编码(即六位码的前3位)等。可以理解,可以通过某一地区发生病例集通过病种编码方法建立适用该地区的病种分类字典,病种分类字典包括M个病种分类的名称以及与该M个病种分类的名称一一对应的M个病种分类码,M为正整数。可选地,计算设备可以基于医保管理平台识别病例数据中有医务人员填写的诊断名称、病种编码等信息识别到该病例对应的病种分类,进而将该病种分类对应的病种分类码补充到病例数据中,以便于进一步地计算该病例的病种分值,进而实现按病种付费、基于病种分值进行病例数据真实性的检测等功能。
病种分值计算,医保管理平台可以存储病种与病种分值的对应关系表或者包含病种分值计算程序,可以通过病例中病种名称、病种编码等确定该病例中参保人(即病人)所患病种分类,进而根据病种分类与病种分值的对应关系或者病种分值计算程序等基于病种分类确定病种分值的实现过程确定该病例的病种分值。其中,病种分值为地区(比如,国家、省或市等)基于病例大数据确定的用于计算医疗费用(比如预测医保费用、预测总费用等)的标准分值。具体的,可以建立病种分值字典,该病种分值字典包括多个病种分类的标识与多个基础病种分值的一一对应关系,再根据病例的实际情况(比如参保人年龄、患病的严重程度、所在医院、所属科室等信息)在基础病种分值的基础上进行调整,以得到适合该病例的病种分值。病种分值与医疗费用呈正相关关系,即病种分值越高,该病种的医疗费用越高。
病例数据的统计分析,医保管理平台可以按照评估周期(比如,月度、季度、年度等)对该地区内各个医院上报的病例进行统计分析。上述对病例的统计分析可以支持按月度、季度、年度等进行统计分析,支持对不同医院、不同费用区间、不同病种等中的一种或多种的组合进行发生例数、总费用、实际医保费用、预测医保费用等的统计分析,以基于统计分析结果对下个评估周期所采用的各个病种的病种分值进行调整。应理解,基于统计分析结果还可以实现对其他功能,比如基于统计得到的各个医院的收入和支出对医院的医院级别系数进行调整等,对此,本申请实施例不作限定。
病例的真实性检测,医保管理平台可以基于病例中的病例数据对该病例的真实性进行检测,当检测到该病例包含虚假数据时,对该病例进行标记、输出该病例包含虚假数据的提示消息等,以便于医保管理平台的运行商及时识别到问题病例,并分析问题病例原因。
雷同病例的识别,医保管理平台可以对识别雷同病例,即病例中数据项相似度比较高的病例,进而进一步分析雷同病例,并分析雷同病例的成因。
数据可视化,医保管理平台可以对病例数据的统计分析功能得到的统计分析结果进行可视化,也可以对问题病例或雷同病例等进行统计分析的结果进行可视化,以便于医保管理平台的运行商统计和分析。
本申请中,计算设备可以包括但不限于移动电话、移动电脑、平板电脑、媒体播放器、计算机、服务器等包含数据处理功能的设备。运行医保管理平台各个功能的计算设备可以接收到来自医院等机构或个体上报的病例。
不限于图1所示,本申请提供的医保管理平台还可以包括其他功能的实现,例如,病种分值的优化等,对此,本申请实施例不作限定。
本发明实施例提供一种基于大数据的雷同病例识别方法及计算设备,计算对病例集中病例的雷同率,确定病例集中的雷同病例,其目的在于筛选出病例集中病例进行雷同病例,以便于医保费用管理人员或计算机对该雷同病例进行进一步地分析。可以理解,管理人员可以人工审核该雷同病例的真实性,也可以通过计算设备进一步判断该雷同病例的真实性。
请参见图2,图2是本申请提供的一种基于大数据的雷同病例识别方法的流程示意图。在图2实施例中,以雷同病例识别方法的执行主体为计算设备(运行病例管理平台各个功能的设备)为例来描述,可以理解,该雷同病例识别方法还可以由其他终端或服务器等具备数据处理功能的设备,对此,本申请实施例不作限定。如图2所示,该方法可以包括但不限于如下部分或全部步骤:
S2:获取第一病例集,第一病例集包括多个病例,单个病例的病例数据包括多个数据项。
病例为由医院针对病人记录的病人诊断治疗过程。病例数据可以包括多个数据项,例如,病例数据中的数据项可以包括但不限于病例数据中记录的:医院、参保人、病种分类、主治医师、就诊时间、就诊类型、一个或多个诊断项、一个或多个治疗项、一个或多个药品项、费用项等数据项。
其中,就诊类型可以包括门诊和住院。病种分类可以是国际疾病分类(ICD)中病种,也可以是国家或各个地区提供的病种分类字典中病种分类。诊断项可以包括用于确诊参保人所发生病种所发生的疾病检查或诊断方式,例如血压检查、抽血检查、心电图诊断、内窥镜诊断、核磁共振诊断、超声波检查、体检诊断、手术探查诊断等。治疗项可以包括治疗方式,包括但不限于阑尾手术、异物摘除术、人工剥离胎盘术、肠切除术、经皮静脉内支架置入术等各专业手术分类目录中的项,艾灸、针刺、拔罐、推拿等中医中的治疗方式。药品项为参保人在治疗期间使用的药品,可以是药品的通用名称或商品名称。费用项可以为病人在治疗过程中产生的手术费、住院费、检测费、挂号费、药品费、总费用等中的一种或多种的组合。
应理解,一个药品项为一个数据项,例如,病例中可能记录了两次“阿莫西林,1盒”,这两个药品项为两个数据项,但同属于一种数据项;又例如,病例中可能记录了一次“阿莫西林,1盒”、一次“利福平,1瓶”,则这两个药品项为两个数据项,但为不同种类的数据项。同理,一个诊断项即为一个数据项,一个诊断项即为一个数据项。
第一病例集为第一地区在第一评估周期发生的病例的集合,第一地区可以是北京市、深圳市、广东省等由医保管理平台的运营商确定的区域。评估周期可以是周、月、季度、或年等时间区间,例如,第一评估周期可以是当前时间所在评估周期的上一个评估周期。
本发明一实施例中,如图3所示,第一病例集可以是第一地区在第一评估周期发生的病例的集合中经过筛选的病例组合的集合,其中,获取第一病例集的一种实现方式可以包括如下步骤:
S21:计算设备接收第二病例集,第二病例集可以为第一地区在第一评估周期发生的病例的集合。其中,第二病例集可以是第一地区在第一评估周期发生的病例的集合。
S22:从第二病例集中筛选出满足第一筛选条件的病例,得到所述第一病例集。
其中,第一筛选条件包括以下一种或多种的组合:
医院为第一医院;
就诊时间在第一时间区间的范围之内;
参保人为第一参保人;
主治医师为第一医师。
例如,计算设备可以获取到各个医院上报的病例(即第二病例集),根据病例中的就诊时间筛选出就诊时间在第一时间区间的病例,得到第一病例集。其中,第一时间区间可以以周、月、或者天划分出的时间段,也可以是接收用户输入的第一时间区间,本申请不作限定。其中,第一时间区间在第一评估周期所确定的时间内。
又例如,计算设备可以根据病例中的病例中的参保人和就诊时间筛选出就诊时间在第一时间区间且参保人为第一参保人的病例。可以理解,当在短时间内,第一参保人发生多次雷同病例,则说明该雷同病例可能为假病例,存在套取医保费用的风险。
可以理解,可以通过病例中的一个或多个数据项从获取到各个医院上报的病例中筛选出需要检测其雷同率的第一病例集。
S4:计算第一病例集中的第一病例的雷同率,第一病例为第一病例集中任意一个病例,第一病例的雷同率为第一病例包括的数据项的种数与第一病例集中所有病例所包括的数据项的总种数的比值。
第一病例集包括病例i,病例i的雷同率可以通过下述公式计算:
Pi=Ni/N
N=∑iNi
其中,i为第一病例集中病例的索引,i为正整数,Pi为病例i的雷同率,Ni为病例i包括的数据项的种数,N为第一病例集中所有病例所包括的数据项的总种数。
对于病例来说,通常包括非常多的药品,即药品项对于病例的雷同率贡献最大,此时可以认为病例中的药品项的雷同率即为病例的雷同率。可选地,用于计算雷同率的数据项可以是药品项。同理,病例i的雷同率可以通过下述公式计算:
Pi=Mi/M
M=∑iMi
其中,i为第一病例集中病例的索引,i为正整数,Pi为病例i的雷同率,Mi为病例i包括的药品的种数,M为第一病例集中所有病例所包括的药品的总种数。
S6:判断第一病例的雷同率是否大于第一比例阈值。
可以理解,计算设备可以根据各个病例的雷同率,筛选出第一病例集中雷同率大于第一比例阈值的病例,即雷同病例。
当判断结果为是时,第一病例为雷同病例,计算设备可以执行S8;否则,计算设备可以结束流程,也可以检测下一个病例的雷同率,还可以,改变第一病例集的第一筛选条件,重新筛选出第一病例集,并重新执行S4,本发明实施例不做限定。
应理解,第一比例阈值可以是40%、60%、75%、82%、90%或其他数值,本申请实施例不作限定。
可选地,针对不同的筛选条件得到的第一病例集,该第一比例阈值可以不同。计算设备可以存储筛选条件和比例值的对应关系。该方法还可以包括:计算设备根据筛选条件与比例值的对应关系,确定所述第一筛选条件对应的第一比例阈值。
应理解,计算设备可以通过表的形式或其他数据存储结构,预先存储筛选条件和比例值的对应关系。各个筛选条件对应的比例值的设置,可以为医保管理人员根据具体筛选条件而定。可选地,通过的筛选条件筛选得到的病例越多,则该筛选条件对应的比例值可以约小。
S8:输出用于提示所述第一病例为雷同病例的提示信息。
当第一病例的雷同率大于第一比例阈值,第一病例为雷同病例,计算设备输出用于提示所述第一病例为雷同病例的提示信息,输出的方式包括但不限于显示提示信息、语音提示等,计算设备也可以添加标注信息,以指示该第一病例为异常病例。
本发明一实施例中,如图3所示,S8之后,该方法还可以包括但不限于如下步骤:
S91:根据第一病例集中的所有病例的雷同率,确定第一病例集中所有的雷同病例。可选地,计算设备可以统一对第一病例集中所有的雷同病例进行提示。例如,显示列表,该列表包括第一病例集中所有的雷同病例。
S92:可视化显示所述第一病例集中所有的雷同病例。
可选地,S92的一种实现方式可以是:计算设备统计第三病例集中第一数据项出现的频次,显示第一图像,该第一图像包括第一数据项与第一数据项的频次对应关系。其中,第三病例集为第一病例集中所有的雷同病例的集合,第一数据项为第三病例集中任一病例所包括的任一种数据项。
应理解,第一数据项的频次可以为第一数据项的在第三病例集中所有的病例出现的总次数;也可以是占比,即该第一数据项的在第三病例集中所有的病例出现的总次数与第三病例集中所有病例包括的数据项的总个数的比值。
应理解,第一图像可以包括第三病例集中每一个数据项以及该第三病例集中每一个数据项分别对应的频次。
可选地,该第一图像还可以包括第一病例集中的雷同病例的所在医院和例数的对应关系、第一病例集中的雷同病例的主治医师和例数的对应关系、第一病例集中的雷同病例的病种分类和例数的对应关系等,对此,本发明实施例不作限定。
可见,通过对雷同病例进行进一步分析,以识别雷同病例的原因。
还应理解,病种分类为病种分类字典中的项,该病种分类字典包括多个病种分类以及与所述多个病种分类一一对应的病种分类码,病种分类码为ICD编码或ICD编码的前N位码,所述N为小于6的正整数。
对于病种分类字典中病种分类码为ICD编码的前N位码来说,选择病种的ICD编码的前四位、前三位还是前二位,取决于样本病例集中病例的病种分类为ICD编码的前四位的例数,比如大于10例,选“四位码”作为病种分类码;若小于10例,选“三位码”作为病种分类码。该病种分类的编码方式可以减少病种分类,得到更加贴近当前医疗地区的医疗环境,使得病种分类的分类方式和按病种支付方式可以更好地应用于当地。
可见,本发明实施例计算设备通过获取第一病例集,所述第一病例集包括多个病例,单个病例的病例数据包括多个数据项;计算所述第一病例集中的第一病例的雷同率,所述第一病例为所述第一病例集中任意一个病例,所述第一病例的雷同率为所述第一病例包括的数据项的种数与所述第一病例集中所有病例所包括的数据项的总种数的比值;判断所述第一病例的雷同率是否大于第一比例阈值,如果是,则输出用于提示所述第一病例为雷同病例的提示信息,进而实现雷同病例的识别,以进一步对该雷同病例进行审核,避免病例造假。
下面介绍发明实施例涉及的装置。
请参阅图4计算设备40,包括但不限于:接收单元41、第一计算单元42、判断单元43和输出单元44等。其中,
接收单元41,用于接收第一病例集,所述第一病例集包括多个病例,单个病例的病例数据包括多个数据项;
第一计算单元42,用于计算所述第一病例集中的第一病例的雷同率,所述第一病例为所述第一病例集中任意一个病例,所述第一病例的雷同率为所述第一病例包括的数据项的种数与所述第一病例集中所有病例所包括的数据项的总种数的比值;
判断单元43,用于判断所述第一病例的雷同率是否大于第一比例阈值;
输出单元44,用于在所述判断单元的判断结果为是时,输出用于提示所述第一病例为雷同病例的提示信息。
在本申请的一种实现中,接收单元具体41用于:接收第二病例集,从所述第二病例集中筛选出满足第一筛选条件的病例,得到所述第一病例集,所述第一筛选条件包括以下一种或多种的组合:
医院为第一医院;
就诊时间在第一时间区间的范围之内;
参保人为第一参保人;
主治医师为第一医师。
请参阅图5所示的计算设备,该计算设备50除包括图4中计算设备40中各个单元外,还可以包括确定单元45。
其中,确定单元45,用于根据筛选条件与比例值的对应关系,确定所述第一筛选条件对应的第一比例阈值。
在本申请的又一种实现中,所述数据项为药品的标识。
在本申请的又一种实现中,病例i的雷同率通过下述公式计算:
Pi=Ni/N
N=∑iNi
其中,i为第一病例集中病例的索引,i为正整数,Pi为所述病例i的雷同率,Ni为所述病例i包括的数据项的种数,N为所述第一病例集中所有病例所包括的数据项的总种数。
在本申请的又一种实现中,所述计算设备还包括可视化单元46,用于:
根据所述第一病例集中的所有病例的雷同率,确定所述第一病例集中所有的雷同病例;
可视化显示所述第一病例集中所有的雷同病例。
可选地,所述可视化单元46执行所述可视化显示根据所述第一病例集中所有的雷同病例,包括:
统计第三病例集中第一数据项出现的频次,显示第一图像,所述第一图像包括所述第一数据项与所述第一数据项的频次的对应关系;
其中,所述第三病例集为所述第一病例集中所有的雷同病例的集合,所述第一数据项为所述第三病例集中任一病例所包括的任一种数据项。
需要说明的是,上述计算设备的各个单元的具体实现可以参见上述方法实施例中相关描述,本申请不再赘述。
如图6所示的计算设备,该计算设备600可包括:基带芯片610、存储器615(一个或多个计算机可读存储介质)、通信模块616(例如,射频(RF)模块6161和/或通信接口6162)、外围系统617、通信接口623。这些部件可在一个或多个通信总线614上通信。
外围系统617主要用于实现计算设备610和用户/外部环境之间的交互功能,主要包括计算设备600的输入/输出装置。具体实现中,外围系统617可包括:触摸屏控制器618、摄像头控制器619、音频控制器620以及传感器管理模块621。其中,各个控制器可与各自对应的外围设备(如触摸屏623、摄像头624、音频电路625以及传感器626)耦合。需要说明的,外围系统617还可以包括其他I/O外设。
基带芯片610可集成包括:一个或多个处理器611、时钟模块622以及电源管理模块613。集成于基带芯片610中的时钟模块622主要用于为处理器611产生数据传输和时序控制所需要的时钟。集成于基带芯片610中的电源管理模块613主要用于为处理器611、射频模块6161以及外围系统提供稳定的、高精确度的电压。
射频(RF)模块6161用于接收和发送射频信号,主要集成了计算设备600的接收器和发射器。射频(RF)模块6161通过射频信号与通信网络和其他通信设备通信。具体实现中,射频(RF)模块6161可包括但不限于:天线系统、RF收发器、一个或多个放大器、调谐器、一个或多个振荡器、数字信号处理器、CODEC芯片、SIM卡和存储介质等。在一些实施例中,可在单独的芯片上实现射频(RF)模块6161。
通信模块616用于计算设备600与其他设备之间的数据交换。
存储器615与处理器611耦合,用于存储各种软件程序和/或多组指令。具体实现中,存储器615可包括高速随机存取的存储器,并且也可包括非易失性存储器,例如一个或多个磁盘存储设备、闪存设备或其他非易失性固态存储设备。存储器615可以存储操作系统(下述简称系统),例如ANDROID,IOS,WINDOWS,或者LINUX等嵌入式操作系统。存储器615还可以存储网络通信程序,该网络通信程序可用于与一个或多个附加设备,一个或多个计算设备设备,一个或多个网络设备进行通信。存储器615还可以存储用户接口程序,该用户接口程序可以通过图形化的操作界面将应用程序的内容形象逼真的显示出来,并通过菜单、对话框以及按键等输入控件接收用户对应用程序的控制操作。
存储器615还可以存储一个或多个应用程序。如图6所示,这些应用程序可包括:社交应用程序(例如Facebook),图像管理应用程序(例如相册),地图类应用程序(例如谷歌地图),浏览器(例如Safari,Google Chrome)等等。
本申请中,处理器611可用于读取和执行计算机可读指令。具体的,处理器611可用于调用存储于存储器615中的程序,例如本申请提供的病种分值计算方法的实现程序,并执行该程序包含的指令。
具体的,处理器611可用于调用存储于存储器615中的程序,如本申请提供的病种分值计算方法的实现程序,并执行下述流程:
通过所述通信模块616接收第一病例集,所述第一病例集包括多个病例,单个病例的病例数据包括多个数据项;
计算所述第一病例集中的第一病例的雷同率,所述第一病例为所述第一病例集中任意一个病例,所述第一病例的雷同率为所述第一病例包括的数据项的种数与所述第一病例集中所有病例所包括的数据项的总种数的比值;
判断所述第一病例的雷同率是否大于第一比例阈值,如果是,则通过输出装置输出用于提示所述第一病例为雷同病例的提示信息。
在本申请的一种实现中,所述处理器611执行所述通过所述通信模块接收第一病例集,具体包括执行:
通过所述通信模块616接收第二病例集,从所述第二病例集中筛选出满足第一筛选条件的病例,得到所述第一病例集,所述第一筛选条件包括以下一种或多种的组合:
医院为第一医院;
就诊时间在第一时间区间的范围之内;
参保人为第一参保人;
主治医师为第一医师。
在本申请的又一种实现中,所述处理器611还用于执行:
根据筛选条件与比例值的对应关系,确定所述第一筛选条件对应的第一比例阈值。
在本申请的又一种实现中,所述数据项为药品的标识。
在本申请的又一种实现中,病例i的雷同率通过下述公式计算:
Pi=Ni/N
N=∑iNi
其中,i为第一病例集中病例的索引,i为正整数,Pi为所述病例i的雷同率,Ni为所述病例i包括的数据项的种数,N为所述第一病例集中所有病例所包括的数据项的总种数。
在本申请的又一种实现中,所述处理器611还用于执行:
根据所述第一病例集中的所有病例的雷同率,确定所述第一病例集中所有的雷同病例;
可视化显示所述第一病例集中所有的雷同病例。
可选地,所述处理器611执行所述可视化显示根据所述第一病例集中所有的雷同病例,具体包括执行:
统计第三病例集中第一数据项出现的频次,通过输出装置(比如显示器)显示第一图像,所述第一图像包括所述第一数据项与所述第一数据项的频次的对应关系;
其中,所述第三病例集为所述第一病例集中所有的雷同病例的集合,所述第一数据项为所述第三病例集中任一病例所包括的任一种数据项。
可以理解,上述各个流程和各个功能单元的具体实现可以参照上述方法实施例中相关描述,本申请实施例不再赘述。
应当理解,计算设备600仅为本发明实施例提供的一个例子,并且,计算设备600可具有比示出的部件更多或更少的部件,可以组合两个或更多个部件,或者可具有部件的不同配置实现。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本发明实施例装置中的模块可以根据实际需要进行合并、划分和删减。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (10)

1.一种基于大数据的雷同病例识别方法,其特征在于,包括:
接收第一病例集,所述第一病例集包括多个病例,单个病例的病例数据包括多个数据项;
计算所述第一病例集中的第一病例的雷同率,所述第一病例的雷同率为所述第一病例包括的数据项的种数与所述第一病例集中所有病例所包括的数据项的总种数的比值;
判断所述第一病例的雷同率是否大于第一比例阈值,如果是,则输出用于提示所述第一病例为雷同病例的提示信息。
2.如权利要求1所述的方法,其特征在于,所述计算设备接收第一病例集包括:
接收第二病例集,从所述第二病例集中筛选出满足第一筛选条件的病例,得到所述第一病例集,所述第一筛选条件包括以下一种或多种的组合:
医院为第一医院;
就诊时间在第一时间区间的范围之内;
参保人为第一参保人;
主治医师为第一医师。
3.如权利要求2所述的方法,其特征在于,所述方法还包括:
根据筛选条件与比例值的对应关系,确定所述第一筛选条件对应的第一比例阈值。
4.如权利要求1所述的方法,其特征在于,所述数据项为药品的标识;
病例i的雷同率可以通过下述公式计算:
其中,i为所述第一病例集中病例的索引,i为正整数,Pi为所述病例i的雷同率,Mi为所述病例i包括的药品的种数,M为所述第一病例集中所有病例所包括的药品的总种数。
5.如权利要求1-3任一所述的方法,其特征在于,病例i的雷同率通过下述公式计算:
其中,i为所述第一病例集中病例的索引,i为正整数,Pi为所述病例i的雷同率,Ni为所述病例i包括的数据项的种数,N为所述第一病例集中所有病例所包括的数据项的总种数。
6.如权利要求1-4任一所述的方法,其特征在于,所述方法还包括:
根据所述第一病例集中的所有病例的雷同率,确定所述第一病例集中所有的雷同病例;
可视化显示所述第一病例集中所有的雷同病例。
7.如权利要求6所述的方法,其特征在于,所述可视化显示根据所述第一病例集中所有的雷同病例包括:
统计第三病例集中第一数据项出现的频次,显示第一图像,所述第一图像包括所述第一数据项与所述第一数据项的频次的对应关系;
其中,所述第三病例集为所述第一病例集中所有的雷同病例的集合,所述第一数据项为所述第三病例集中任一病例所包括的任一种数据项。
8.一种计算设备,其特征在于,包括处理器、存储器以及通信模块,所述处理器耦合所述存储器、所述通信模块,所述处理器用于调用所述存储器存储的程序代码执行如权利要求1-7中任一项权利要求所述的基于大数据的雷同病例识别方法。
9.一种计算设备,其特征在于,包括:
接收单元,用于接收第一病例集,所述第一病例集包括多个病例,单个病例的病例数据包括多个数据项;
第一计算单元,用于计算所述第一病例集中的第一病例的雷同率,所述第一病例为所述第一病例集中任意一个病例,所述第一病例的雷同率为所述第一病例包括的数据项的种数与所述第一病例集中所有病例所包括的数据项的总种数的比值;
判断单元,用于判断所述第一病例的雷同率是否大于第一比例阈值;
输出单元,用于在所述判断单元的判断结果为是时,输出用于提示所述第一病例为雷同病例的提示信息。
10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7中任一项权利要求所述的基于大数据的雷同病例识别方法。
CN201811284814.7A 2018-10-30 2018-10-30 一种基于大数据的雷同病例识别方法及计算设备 Pending CN109545382A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811284814.7A CN109545382A (zh) 2018-10-30 2018-10-30 一种基于大数据的雷同病例识别方法及计算设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811284814.7A CN109545382A (zh) 2018-10-30 2018-10-30 一种基于大数据的雷同病例识别方法及计算设备

Publications (1)

Publication Number Publication Date
CN109545382A true CN109545382A (zh) 2019-03-29

Family

ID=65846205

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811284814.7A Pending CN109545382A (zh) 2018-10-30 2018-10-30 一种基于大数据的雷同病例识别方法及计算设备

Country Status (1)

Country Link
CN (1) CN109545382A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112635072A (zh) * 2020-12-31 2021-04-09 大连东软教育科技集团有限公司 基于相似度计算的icu相似病例检索方法、系统及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08297704A (ja) * 1995-02-28 1996-11-12 Daikin Ind Ltd 健康保険証自動認識方法および装置、並びに老人医療保険証自動認識方法および装置
JP2014029644A (ja) * 2012-07-31 2014-02-13 Panasonic Corp 類似症例検索装置および類似症例検索方法
CN104598764A (zh) * 2015-02-16 2015-05-06 上海市疾病预防控制中心 基于电子病历实现异常病例和事件数据监测的系统及方法
CN107609980A (zh) * 2017-09-07 2018-01-19 平安医疗健康管理股份有限公司 医疗数据处理方法、装置、计算机设备及存储介质
CN107644366A (zh) * 2017-09-28 2018-01-30 携程旅游信息技术(上海)有限公司 订单欺诈识别方法、系统、存储介质和电子设备
CN107870976A (zh) * 2017-09-25 2018-04-03 平安科技(深圳)有限公司 简历识别装置、方法及计算机可读存储介质
CN107958007A (zh) * 2016-10-18 2018-04-24 浙江格林蓝德信息技术有限公司 病例信息检索方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08297704A (ja) * 1995-02-28 1996-11-12 Daikin Ind Ltd 健康保険証自動認識方法および装置、並びに老人医療保険証自動認識方法および装置
JP2014029644A (ja) * 2012-07-31 2014-02-13 Panasonic Corp 類似症例検索装置および類似症例検索方法
CN104598764A (zh) * 2015-02-16 2015-05-06 上海市疾病预防控制中心 基于电子病历实现异常病例和事件数据监测的系统及方法
CN107958007A (zh) * 2016-10-18 2018-04-24 浙江格林蓝德信息技术有限公司 病例信息检索方法及装置
CN107609980A (zh) * 2017-09-07 2018-01-19 平安医疗健康管理股份有限公司 医疗数据处理方法、装置、计算机设备及存储介质
CN107870976A (zh) * 2017-09-25 2018-04-03 平安科技(深圳)有限公司 简历识别装置、方法及计算机可读存储介质
CN107644366A (zh) * 2017-09-28 2018-01-30 携程旅游信息技术(上海)有限公司 订单欺诈识别方法、系统、存储介质和电子设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112635072A (zh) * 2020-12-31 2021-04-09 大连东软教育科技集团有限公司 基于相似度计算的icu相似病例检索方法、系统及存储介质

Similar Documents

Publication Publication Date Title
CN107085817B (zh) 医疗系统
CN109545387A (zh) 一种基于神经网络的异常病例识别方法及计算设备
US20160342753A1 (en) Method and apparatus for healthcare predictive decision technology platform
CN109544376A (zh) 一种基于数据分析的异常病例识别方法及计算设备
Waghade et al. A comprehensive study of healthcare fraud detection based on machine learning
CN107368750A (zh) 基于区块链的电子病历的实现方法及装置
CN103324831A (zh) 一种远程问诊系统
CN107767929A (zh) 病例报告表填写方法、装置、电子设备及存储介质
US20150302156A1 (en) Systems and methods for processing and displaying health and medical data, performing work tasks and delivering services
CN110111867A (zh) 基于智能药箱的监测处理方法、智能药箱及存储介质
WO2019006920A1 (zh) 基于医生问诊的慢病患者健康检查系统及方法
CN111475713A (zh) 医生信息推荐方法、装置、电子设备、系统及存储介质
US20230122360A1 (en) Integrated data capture using aliasing schemes
CN107767924A (zh) 原始数据核对方法、装置、电子设备及存储介质
CN109523399A (zh) 一种医疗数据处理方法、装置、设备及存储介质
Al Otaibi Internet of Things (IoT) Saudi Arabia healthcare systems: state-of-the-art, future opportunities and open challenges
Lian et al. Research on hierarchical data fusion of intelligent medical monitoring
CN108461136A (zh) 智能体检方法、系统以及电子设备
CN114023423A (zh) 一种智能交班方法、装置以及设备
CN104622448A (zh) 一种用于电子血压计的数据采集与管理系统及方法
CN109493243A (zh) 一种基于神经网络的病种分值校验方法及计算设备
CN109377059A (zh) 一种基于风险管控的数据处理方法及设备
CN109523406A (zh) 一种基于数据分析的病种分值计算方法及计算设备
CN109545382A (zh) 一种基于大数据的雷同病例识别方法及计算设备
CN113657550A (zh) 基于分层计算的患者标记方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination