CN111180028B - 一种基于医疗大数据的患者画像特异性规则筛选方法及装置 - Google Patents
一种基于医疗大数据的患者画像特异性规则筛选方法及装置 Download PDFInfo
- Publication number
- CN111180028B CN111180028B CN201911370625.6A CN201911370625A CN111180028B CN 111180028 B CN111180028 B CN 111180028B CN 201911370625 A CN201911370625 A CN 201911370625A CN 111180028 B CN111180028 B CN 111180028B
- Authority
- CN
- China
- Prior art keywords
- diagnosis
- patient
- specificity
- treatment
- medical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Epidemiology (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Technology Law (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本发明提出了一种基于医疗大数据的患者画像特异性规则筛选方法及装置,所述方法包括以下步骤:从预先配置的医疗数据库中获取指定时间段内的多个待检验字段所对应的医疗数据;将医疗数据,依据诊断进行分组,提取出每个诊断所对应的治疗项目,将所述治疗项目与分组内除去该治疗项目对应的诊断之外的其余全部诊断的治疗项目进行对比,并依据预先配置的患者画像特异性规则方法,计算所述治疗项目与其对应的诊断的特异性数值;获取待筛选地区所有患者的住院记录,提取每个患者住院过程的诊断和治疗项目;计算每个患者住院的特异性参考值;对特异性参考值低于设定值的患者标记为可疑。本发明能够快速锁定范围人群,并发现可疑人员,提高了筛查效率。
Description
技术领域
本发明涉及用医疗数据筛选,尤其涉及一种基于医疗大数据的患者画像特异性规则筛选方法。
背景技术
在部分地区有部分人利用假住院、假诊断、假治疗等套取医保资金,这不利于医保的长期、稳定发展,对需要正常用保的患者造成了伤害,因此需要对这部分骗保人群进行筛查。
目前,对目标人群的筛查和判断主要采用人工的方式,由于人工检验效率极低,在每年产生海量就诊信息的现状下,完全跟不上发现骗保人群的进度,而大批雇佣专业医生进行审核,在医疗资源紧缺的现代,又显得不太可能。
发明内容
本发明提出了一种基于医疗大数据的患者画像特异性规则筛选方法,能够快速锁定范围人群,并发现可疑人员,提高了筛查效率。
本发明的技术方案是这样实现的:
一种基于医疗大数据的患者画像特异性规则筛选方法,包括以下步骤:
步骤1:从预先配置的医疗数据库中获取指定时间段内的多个待检验字段所对应的医疗数据;
步骤2:将医疗数据,依据诊断进行分组,提取出每个诊断所对应的治疗项目,将所述治疗项目与分组内除去该治疗项目对应的诊断之外的其余全部诊断的治疗项目进行对比,并依据预先配置的患者画像特异性规则方法,计算所述治疗项目与其对应的诊断的特异性数值;
步骤3:获取待筛选地区所有患者的住院记录,提取每个患者住院过程的诊断和治疗项目;依据步骤2计算的特异性数值,计算每个患者住院的特异性参考值;
步骤4:对特异性参考值低于设定值的患者标记为可疑。
进一步地,步骤2中,所述患者画像特异性规则方法包括:
在指定时间段内,所述治疗项目在分组内除该治疗项目对应的诊断之外的其余全部诊断中出现的次数与特异性数值成反比。
进一步地,步骤3中,计算每个患者住院的特异性参考值的方法包括:提取患者每个治疗项目与诊断的特异性数值,依据所有治疗项目与诊断的特异性数值,获得患者住院过程中的特异性参考值。
进一步地,依据所有治疗项目与诊断的特异性数值,获得患者住院过程中的特异性参考值的方法包括:
将所有治疗项目与诊断的特异性数值相加,然后求平均值的倒数,以该平均值的倒数为患者住院过程中的特异性参考值。
进一步地,步骤1中,所述待检验字段包括:年龄、是否医保、诊断、住院天数,以及住院期间的化验、检查、治疗、用药。
进一步地,所述医疗数据库通过如下方式创建:
采集各医疗数据中的基础数据和业务数据,并基于数据模型对上述各字段内容执行相应填充;其中,所述基础数据包括:机构信息,医护人员信息,诊断信息,医疗服务项目,医疗服务价格,所述业务数据包括:患者人员信息,就诊信息,收费明细,处方信息,医嘱信息。
进一步地,在步骤2之前,先对医疗数据进行预处理,包括:包括:将治疗项目中的药品和检查用其相对应的国家医保分类名称代替,并且去除医疗数据中的非医保项目,所述非医保项目包括:中药、住院费、垃圾处理费。
进一步地,在步骤4之后还包括:
将可疑患者依据可信值进从小到大进行排序,并输出排序结果。
一种用于上述的基于医疗大数据的患者画像特异性规则筛选方法的医疗数据检测装置,其特征在于,包括:
获取单元:用于从医疗数据库中获取指定时间段内的多个待检测字段所对应的医疗数据;将医疗数据,依据诊断进行分组,提取出每个诊断所对应的治疗项目;
确定单元:用于根据预先配置的患者画像特异性规则脚本,计算诊断与对应的治疗项目的特异性数值;分析待筛选地区每个患者住院的可信值;其中,所述患者画像特异性规则脚本能够将所述治疗项目与分组内除该治疗项目对应的诊断之外的其余全部诊断的治疗项目进行对比,获取在指定时间段内,所述治疗项目在分组内除该治疗项目对应的诊断之外的其余全部诊断中出现的次数;
检测单元:用于将可信值低于设定值的患者标记为可疑,并将可疑患者依据可信值进行排序,并输出排序结果。
进一步地,还包括人工审核模块,用于对可疑患者进行人工审核。
附图说明
附图示出了本公开的示例性实施方式,并与其说明一起用于解释本公开的原理,其中包括了这些附图以提供对本公开的进一步理解,并且附图包括在本说明书中并构成本说明书的一部分。
图1是本公开实施例一的方法的流程图;
图2是本公开实施例二的原来框图;
具体实施方式
下面结合附图和实施方式对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施方式仅用于解释相关内容,而非对本公开的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本公开相关的部分。
需要说明的是,在不冲突的情况下,本公开中的实施方式及实施方式中的特征可以相互组合。下面将参考附图并结合实施方式来详细说明本公开。
实施例一:
一种基于医疗大数据的患者画像特异性规则筛选方法,包括以下步骤:
步骤1:从预先配置的医疗数据库中获取指定时间段内的多个待检验字段所对应的医疗数据;
其中,所述指定时间段可以自然年为时间段,例如:以每年1月1日-12月31日为指定时间段;
步骤2:将医疗数据,依据诊断进行分组,提取出每个诊断所对应的治疗项目,将所述治疗项目与分组内除去该治疗项目对应的诊断之外的其余全部诊断的治疗项目进行对比,并依据预先配置的患者画像特异性规则方法,计算所述治疗项目与其对应的诊断的特异性数值;
在步骤2之前,先对医疗数据进行预处理,包括:包括:将治疗项目中的药品和检查用其相对应的国家医保分类名称代替,并且去除医疗数据中的非医保项目,所述非医保项目包括:中药、住院费、垃圾处理费。
步骤3:获取待筛选地区所有患者的住院记录,提取每个患者住院过程的诊断和治疗项目;依据步骤2计算的特异性数值,计算每个患者住院的特异性参考值;
步骤4:对特异性参考值低于设定值的患者标记为可疑。
其中,所述医疗数据包括患者的诊断和医生依据该诊断所开具的治疗项目,所述治疗项目包括:药品、检查、化验、治疗等项目;
所述待检验字段包括:年龄、是否医保、诊断、住院天数,以及住院期间的化验、检查、治疗、用药。
本实施例中,所述医疗数据库通过如下方式创建:
采集各医疗数据中的基础数据和业务数据,并基于数据模型对上述各字段内容执行相应填充;其中,所述基础数据包括:机构信息,医护人员信息,诊断信息,医疗服务项目,医疗服务价格,所述业务数据包括:患者人员信息,就诊信息,收费明细,处方信息,医嘱信息。
本实施例以临床经验为指导编制出发现骗保人群的数据特征的规则,用数据库为基础,利用统计学习和机器学习相结合,将就诊患者计算出相对应的特异性参考值,依据特异性参考值排名,快速锁定范围人群并发现嫌疑人。
具体的来说,所述患者画像特异性规则方法包括:
在指定时间段内,所述治疗项目在分组内除该治疗项目对应的诊断之外的其余全部诊断中出现的次数与特异性数值成反比。即,所述诊断对应的治疗项目在同分组的不相干的诊断中出现的次数越少,说明该治疗方案与其对应的真的特异性越高,则特异性数值越高;
计算每个患者住院的可信值的方法包括:提取患者每个治疗项目与诊断的特异性数值,依据所有治疗项目与诊断的特异性数值,获得患者住院过程中的真实性相关数值。
本实施例中,依据所有治疗项目与诊断的特异性数值,获得患者住院过程中的特异性参考值的方法包括:
将所有治疗项目与诊断的特异性数值相加,然后求平均值的倒数,以该平均值的倒数为患者住院过程中的特异性参考值。
如果某个患者特异性参考值越高,越说明该患者住院中的诊断所采用的治疗项目与绝大多数患者相符,其住院的真实性越好,由此数值做小到大的排序,可以得出风险人群的排序,然后人工重点排查,可以极大的减轻人工劳动强度,节省人力,且兼具了准确度和速度的双重优点。
因此,本实施例在步骤4之后还包括:
将可疑患者依据特异性参考值进从小到大进行排序,并输出排序结果。特异性参考值越小,则其住院的真实性越可疑,通过数值的排序。
本实施例提供的一种基于医疗大数据的患者画像特异性规则筛选方法将需要筛查地区所有患者的医疗数据,依据诊断进行分组,和医生依据诊断所开具的各种药品、检查、化验、治疗等治疗项目作为就诊特征,将所有治疗项目匹配除与之相对应的诊断之外的其余所有诊断,分析其特异性,利用软件进行筛查,将计算结果得到的特异性参考值,进行排序,特异性参考值越低,越为需重点监测的高风险人群,然后再由人工进行重点排查。
实施例二:
本实施例依据医疗数据检测装置进行医疗数据的筛查。
一种基于大数据的医疗数据检测装置,包括:
获取单元:用于从医疗数据库中获取指定时间段内的多个待检测字段所对应的医疗数据;将医疗数据,依据诊断进行分组,提取出每个诊断所对应的治疗项目;
确定单元:用于根据预先配置的患者画像特异性规则脚本,计算诊断与对应的治疗项目的特异性数值;分析待筛选地区每个患者住院的可信值;其中,所述患者画像特异性规则脚本能够将所述治疗项目与分组内除该治疗项目对应的诊断之外的其余全部诊断的治疗项目进行对比,获取在指定时间段内,所述治疗项目在分组内除该治疗项目对应的诊断之外的其余全部诊断中出现的次数。
检测单元:用于将可信值低于设定值的患者标记为可疑,并将可疑患者依据可信值进行排序,并输出排序结果。
所述医疗数据检测装置,还包括人工审核模块,用于对可疑患者进行人工审核,人工审核完成后,可将人工审核结果输入医疗数据检测装置中。
本实施例所述的医疗数据检测装置可应用于各种配置的计算机电脑,可适配各种配置的计算机操作系统。
本领域的技术人员应当理解,上述实施方式仅仅是为了清楚地说明本发明,而并非是对本发明的范围进行限定。对于所属领域的技术人员而言,在上述发明的基础上还可以做出其它变化或变型,并且这些变化或变型仍处于本发明的范围内。
Claims (7)
1.一种基于医疗大数据的患者画像特异性规则筛选方法,其特征在于,包括以下步骤:
步骤1:从预先配置的医疗数据库中获取指定时间段内的多个待检验字段所对应的医疗数据;
步骤2:将医疗数据,依据诊断进行分组,提取出每个诊断所对应的治疗项目,将所述治疗项目与分组内除去该治疗项目对应的诊断之外的其余全部诊断的治疗项目进行对比,并依据预先配置的患者画像特异性规则方法,计算所述治疗项目与其对应的诊断的特异性数值;
所述患者画像特异性规则方法包括:在指定时间段内,所述治疗项目在分组内除该治疗项目对应的诊断之外的其余全部诊断中出现的次数与特异性数值成反比;
步骤3:获取待筛选地区所有患者的住院记录,提取每个患者住院过程的诊断和治疗项目;依据步骤2计算的特异性数值,计算每个患者住院的特异性参考值;
所述计算每个患者住院的特异性参考值的方法包括:提取患者每个治疗项目与诊断的特异性数值,依据所有治疗项目与诊断的特异性数值,获得患者住院过程中的特异性参考值;
所述依据所有治疗项目与诊断的特异性数值,获得患者住院过程中的特异性参考值的方法包括:将所有治疗项目与诊断的特异性数值相加,然后求平均值的倒数,以该平均值的倒数为患者住院过程中的特异性参考值;
步骤4:对特异性参考值低于设定值的患者标记为可疑。
2.如权利要求1所述的基于医疗大数据的患者画像特异性规则筛选方法,其特征在于,步骤1中,所述待检验字段包括:年龄、是否医保、诊断、住院天数,以及住院期间的化验、检查、治疗、用药。
3.如权利要求1所述的基于医疗大数据的患者画像特异性规则筛选方法,其特征在于,所述医疗数据库通过如下方式创建:
采集各医疗数据中的基础数据和业务数据,并基于数据模型对上述各字段内容执行相应填充;其中,所述基础数据包括:机构信息,医护人员信息,诊断信息,医疗服务项目,医疗服务价格,所述业务数据包括:患者人员信息,就诊信息,收费明细,处方信息,医嘱信息。
4.如权利要求1所述的基于医疗大数据的患者画像特异性规则筛选方法,其特征在于,在步骤2之前,先对医疗数据进行预处理,包括:包括:将治疗项目中的药品和检查用其相对应的国家医保分类名称代替,并且去除医疗数据中的非医保项目,所述非医保项目包括:中药、住院费、垃圾处理费。
5.如权利要求1所述的基于医疗大数据的患者画像特异性规则筛选方法,其特征在于,在步骤4之后还包括:
将可疑患者依据可信值进从小到大进行排序,并输出排序结果。
6.一种用于如权利要求1-5任一项所述的基于医疗大数据的患者画像特异性规则筛选方法的医疗数据检测装置,其特征在于,包括:
获取单元:用于从医疗数据库中获取指定时间段内的多个待检测字段所对应的医疗数据;将医疗数据,依据诊断进行分组,提取出每个诊断所对应的治疗项目;
确定单元:用于将所述治疗项目与分组内除去该治疗项目对应的诊断之外的其余全部诊断的治疗项目进行对比,并依据预先配置的患者画像特异性规则方法,计算所述治疗项目与其对应的诊断的特异性数值;
所述患者画像特异性规则方法包括:在指定时间段内,所述治疗项目在分组内除该治疗项目对应的诊断之外的其余全部诊断中出现的次数与特异性数值成反比;
所述确定单元还用于获取待筛选地区所有患者的住院记录,提取每个患者住院过程的诊断和治疗项目;依据计算的所述特异性数值,计算每个患者住院的特异性参考值;
所述确定单元还用于提取患者每个治疗项目与诊断的特异性数值,依据所有治疗项目与诊断的特异性数值,获得患者住院过程中的特异性参考值;
所述确定单元还用于将所有治疗项目与诊断的特异性数值相加,然后求平均值的倒数,以该平均值的倒数为患者住院过程中的特异性参考值;
检测单元:用于对特异性参考值低于设定值的患者标记为可疑。
7.如权利要求6所述的医疗数据检测装置,其特征在于,还包括人工审核模块,用于对可疑患者进行人工审核。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911370625.6A CN111180028B (zh) | 2019-12-26 | 2019-12-26 | 一种基于医疗大数据的患者画像特异性规则筛选方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911370625.6A CN111180028B (zh) | 2019-12-26 | 2019-12-26 | 一种基于医疗大数据的患者画像特异性规则筛选方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111180028A CN111180028A (zh) | 2020-05-19 |
CN111180028B true CN111180028B (zh) | 2023-05-30 |
Family
ID=70657483
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911370625.6A Active CN111180028B (zh) | 2019-12-26 | 2019-12-26 | 一种基于医疗大数据的患者画像特异性规则筛选方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111180028B (zh) |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005267551A (ja) * | 2004-03-22 | 2005-09-29 | Fuji Photo Film Co Ltd | 医療データ保管方法並びにそれに用いる端末及びサーバ |
CN105893766B (zh) * | 2016-04-06 | 2022-03-18 | 成都数联易康科技有限公司 | 基于数据挖掘的分级诊疗评估方法 |
CN107564569A (zh) * | 2016-06-30 | 2018-01-09 | 诺基亚技术有限公司 | 基于计算机的医患双向对接方法及系统 |
CN107451400A (zh) * | 2017-07-11 | 2017-12-08 | 武汉金豆医疗数据科技有限公司 | 一种医疗行为监控方法和系统 |
CN109523265A (zh) * | 2018-10-16 | 2019-03-26 | 易保互联医疗信息科技(北京)有限公司 | 医保结算全流程自动审核方法及系统 |
CN109543956A (zh) * | 2018-10-27 | 2019-03-29 | 平安医疗健康管理股份有限公司 | 基于数据分析的违规医疗机构的检测方法及相关设备 |
CN109727147B (zh) * | 2018-12-14 | 2023-08-22 | 中国平安财产保险股份有限公司 | 医疗费用智能计算方法、装置、计算机设备和存储介质 |
CN109766329B (zh) * | 2018-12-29 | 2022-10-25 | 湖南网数科技有限公司 | 一种支持交换共享的临床数据单元生成方法和装置 |
CN110136013A (zh) * | 2019-05-21 | 2019-08-16 | 四川久远银海软件股份有限公司 | 一种医保信息控制方法与装置 |
-
2019
- 2019-12-26 CN CN201911370625.6A patent/CN111180028B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN111180028A (zh) | 2020-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8589420B2 (en) | Medical information system and program for same | |
TWI596564B (zh) | Method and device for extracting harmful cases of medicine | |
US20030149597A1 (en) | System for supporting clinical decision-making | |
Park et al. | Methods for clinical evaluation of artificial intelligence algorithms for medical diagnosis | |
CN111180027B (zh) | 一种基于医疗大数据的患者画像相关性规则筛选方法及装置 | |
CN106415555A (zh) | 用于病理学报告与放射学报告的相关联的系统和方法 | |
Elkins et al. | Coding neuroradiology reports for the Northern Manhattan Stroke Study: a comparison of natural language processing and manual review | |
US7996242B2 (en) | Automatically developing neuropsychiatric treatment plans based on neuroimage data | |
US7418120B2 (en) | Method and system for structuring dynamic data | |
CN112635011A (zh) | 疾病诊断方法、疾病诊断系统和可读存储介质 | |
JP5732015B2 (ja) | グラフ作成装置およびグラフ作成方法並びにグラフ作成プログラム | |
US20130159022A1 (en) | Clinical state timeline | |
US20090136111A1 (en) | System and method of diagnosing a medical condition | |
US20220285011A1 (en) | Document creation support apparatus, document creation support method, and program | |
Boone et al. | Systematic review: Bias in imaging studies-the effect of manipulating clinical context, recall bias and reporting intensity | |
CN113948168A (zh) | 医疗数据评价实际应用系统及医疗数据评价实际应用方法 | |
Saifee et al. | Development and validation of automated visual field report extraction platform using computer vision tools | |
Restrepo et al. | Ophthalmology Optical Coherence Tomography Databases for Artificial Intelligence Algorithm: A Review | |
CN111180028B (zh) | 一种基于医疗大数据的患者画像特异性规则筛选方法及装置 | |
Hubbard et al. | Identification of abnormal screening mammogram interpretation using Medicare claims data | |
JP2008217426A (ja) | 症例登録システム | |
WO2021167018A1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
Sathish Kumar et al. | Artificial intelligence based health indicator extraction and disease symptoms identification using medical hypothesis models | |
Nelson et al. | Development of an electronic breast pathology database in a community health system | |
CN113470775A (zh) | 信息采集方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |