CN105335618A - 一种病人特征刻画方法和基于该特征刻画方法的挂床行为检测方法 - Google Patents
一种病人特征刻画方法和基于该特征刻画方法的挂床行为检测方法 Download PDFInfo
- Publication number
- CN105335618A CN105335618A CN201510758469.6A CN201510758469A CN105335618A CN 105335618 A CN105335618 A CN 105335618A CN 201510758469 A CN201510758469 A CN 201510758469A CN 105335618 A CN105335618 A CN 105335618A
- Authority
- CN
- China
- Prior art keywords
- patient
- hospitalization
- hospital
- behavior
- anomaly
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明公开了一种病人特征刻画方法和基于该特征刻画方法的挂床行为检测方法解决医疗保险中的挂床就医骗保行为问题。利用统计和机器学习相结合,可有效地刻画病人的住院行为,减少人工判别工作量。病人特征刻画从病人住院特征和病人基本个人信息进行刻画。挂床行为检测方法构建了挂床行为模型,由特征刻画-聚类分析-人工筛选-机器学习建立模型四个流程来构建模型。该挂床行为检测方法利用统计和机器学习相结合,有效的甄别挂床就医行为,对病人的住院行为进行特征刻画,有效地刻画病人,利用聚类的方法,筛选出离群点,聚类能够大量减少正常的数据,减少人工筛选阶段的工作量;在挂床行为模型建立后,利用此模型对病人的住院行为进行预测。
Description
技术领域
本发明涉及一种病人特征刻画方法和基于该特征刻画方法的挂床行为检测方法。
背景技术
随着社会经济的发展,国家为了给老百姓提供更好的医保环境,医保政策越来越好。然而总有一些人,通过一些虚假的就医行为来骗取医保,严重的损害了其他真正需要医保救治的人的权益。一般可以通过医保人员的就医数据来帮助社保机构来进一步检测出异常数据,但是医院每天产生大量的原始医保数据,如果仅通过人工手段来进行异常检测的话,不仅速度慢,浪费人力,且难保证准确度。再加上医院每天的数据都是动态增加,又加大人工处理的难度。
挂床又称“假住院”,通过挂床住院“病人”享受医保医疗报销,医院也可从中“套取”医保基金而“创收”。目前在“挂床”这种虚假就医行为的甄别的方面主要采取的是相对原始的方法,主要是工作人员在医院蹲点守候,例如当发现有病人在医院有住院的记录但是该病人实际上并没有在该医院进行住院治疗,就是“挂床”住院,就可以认定该病人是挂床。这种方法不但浪费人力财力,而且会起到事倍功半的效果。
利用聚类算法可以有效地筛选异常数据,将具有相似特征的病人聚集在一起,利用聚类算法可以大大的减少人工参与阶段的的工作量。但是一些常用的聚类算法,并不能起到较好的效果。例如:K-means算法K是事先给定的,这个K值的选定是非常难以估计的。很多时候,事先并不知道给定的数据集应该分成多少个类别才最合适;初始聚类中心的选择对聚类结果有较大的影响,一旦初始值选择的不好,可能无法得到有效的聚类结果;K-means算法需要不断地进行样本分类调整,不断地计算调整后的新的聚类中心,因此当数据量非常大时,算法的时间开销是非常大的。
在这里本发明提出了一种针对挂床行为的检测方法,利用统计技术和机器学习相结合,通过病人的住院特征画像、人工的参与确认、机器学习构建挂床就医模型,可以实现对挂床行为的有效甄别。通过此过程,能够显著的减少工作量,提高工作效率,并且在模型的不断优化的过程中,对挂床行为的检测的精确度也会越来越高。
发明内容
本发明的目的在于克服现有技术的不足,提供一种病人特征刻画方法和基于该特征刻画方法的挂床行为检测方法,该挂床行为检测方法利用统计和机器学习相结合,对病人的住院行为进行特征画像、聚类、人工参与和机器学习,有效的甄别挂床就医行为,对病人的住院行为进行特征刻画,有效地刻画病人,利用聚类的方法,筛选出离群点,大量减少正常的数据,减少人工筛选阶段的工作量;在挂床行为模型建立后,利用此模型对病人的住院行为进行预测。
本发明的目的是通过以下技术方案来实现的:一种病人特征刻画方法,它包括病人住院特征刻画和病人基本个人信息刻画,所述的病人住院特征刻画从病人患病种数t1、住院次数t2、报销费用t3、是否有床位重叠t4、是否存在团体住院t5五个方面来进行刻画,病人住院特征表示为F1={t1,t2,t3,t4,t5},所述的病人基本个人信息刻画从病人的年龄s1、职业s2、文化程度s3、性别s4、收入s5和收入是否稳定s6来进行,病人基本个人信息表示为F2={s1,s2,s3,s4,s5,s6},病人特征画像G表示为G=F1||F2。
所述的病人患病种数t1的异常度表示方式为
其中t1代表患病种数,α代表病人在患病种数方面的异常程度的底数;
病人住院次数t2的异常程度表示为
(t2-1)*β公式2
其中t2代表病人患病次数,β代表病人在住院次数方面的异常程度的参数;
所述的报销费用t3异常度由病人实际报销费用t3和预计报销费用t3′的比值表示,比值越大,异常度越大;当有床位重叠表示存在挂床行为;
所述的是否存在团体住院的异常程度表示为
e=nη公式3
其中e代表病人在团体住院方面的异常程度,n代表与该病人有相交住院区间且相交天数大于阈值A的病人数,η代表病人在团体住院方面的异常程度的常数。
基于病人特征刻画方法的挂床行为监测方法,它包括如下步骤:
S1:特征刻画,根据病人住院特征和基本个人信息对病人特征进行刻画;
S2:病人特征聚类,利用聚类算法将离群的病人检测出来;
S3:病人特征人工筛选,将聚类检测出的离群的病人进行人工筛选;
S4:挂床行为模型建立,结合步骤S3标注出的异常数据和步骤S2确定的正常数据建立挂床行为模型;
S5:新住院信息检测,利用挂床模型筛选挂床就医的病人。
所述的病人特征聚类基于DBSCAN算法以半径和最小包含点数为参数来进行聚类。
所述的病人特征人工筛选通过人工参与进行确认,通过专业人员进行实地考察、追踪、走访或在医院蹲点守候的方式进行筛选确认,对挂床就医病人进行标注。
所述的挂床行为模型建立利用机器学习的算法构建挂床行为的模型,机器学习算法包括随机森林算法。
本发明的有益效果是:本发明提供了一种病人特征刻画方法和基于该特征刻画方法的挂床行为检测方法,该挂床行为检测方法利用统计和机器学习相结合,对病人的住院行为进行特征画像、聚类、人工参与和机器学习,有效的甄别挂床就医行为,对病人的住院行为进行特征刻画,有效地刻画病人,利用聚类的方法,筛选出离群点,理论上可以对存在挂床就医行为的病人达到100%的召回率,聚类能够大量减少正常的数据,减少人工筛选阶段的工作量;在挂床行为模型建立后,利用此模型对病人的住院行为进行预测。
附图说明
图1为特征刻画示意图;
图2为挂床检测流程图;
图3为新住院信息检测流程图。
具体实施方式
下面结合附图进一步详细描述本发明的技术方案,但本发明的保护范围不局限于以下所述。
如图1所示,一种病人特征刻画方法,它包括病人住院特征刻画和病人基本个人信息刻画,所述的病人住院特征刻画从病人患病种数t1、住院次数t2、报销费用t3、是否有床位重叠t4、是否存在团体住院t5五个方面来进行刻画,病人住院特征表示为F1={t1,t2,t3,t4,t5},所述的病人基本个人信息刻画从病人的年龄s1、职业s2、文化程度s3、性别s4、收入s5和收入是否稳定s6来进行,病人基本个人信息表示为F2={s1,s2,s3,s4,s5,s6},病人特征画像G表示为G=F1||F2。
一个正常的病人所患的病种数只能是少数的,若是患的病种数超过一定的限度,该病人的可疑度是成指数型增长的。病人患病种数t1的异常度表示方式为
其中t1代表患病种数,α代表病人在患病种数方面的异常程度的底数。当患有一种病时,病人的患病程度为0;当患两种病时病人的异常程度是α。底数α可以在多次试验后得到的一个较为合理的结果。
由病人的历史住院信息得到病人所换的病种数t1,并初始化每个病人的异常程度ω。
由病人的异常程度得到病人所在科室的异常程度E。主要利用公式:
S1代表该病人在该科室的住院次数,S代表病人总的住院次数,ω代表病人的异常程度。利用此公式依次处理每一个病人,得到该科室总的异常程度,为了消除每个科室住院人数的差异,本发明利用科室的平均异常程度代表科室的异常程度,利用公式:
E代表科室总的异常程度,S2代表科室总的住院人数
利用该医院异常程度最大的科室的异常程度Emax代表该医院的异常程度H,因为若一个医院的科室有问题就有很大的可能说明这个医院有问题。最后会得到所有医院在病人所患病种数方面异常程度的排名,便于比较。
经过试验,可以得出:病人的患病种数t1是对病人的住院行为的一个很好的刻画。
一个正常的病人的住院次数不应该过高,若是一个病人的住院次数过高,该病人的异常程度是不断增长的。病人住院次数t2的异常程度表示为
(t2-1)*β公式2
其中t2代表病人患病次数,β代表病人在住院次数方面的异常程度的参数。当病人的住院次数为1次时,病人的异常程度位0,当病人的住院次数为2时,病人的异常程度为β。参数β是在多次试验后得到的一个结果。
所述的报销费用t3异常度由病人实际报销费用t3和预计报销费用t3′的比值表示,比值越大,异常度越大。以医院某一年的数据为例,有一条曲线对这一年的医院的收入进行拟合,若是实际的收入Z与预测收入在z’的差距过大,就说明该医院在这个月份存在一定的问题。再着重查看在该月该医院的科室,是否也是在该月份出现了较大的增长幅度,着重查看该科室的病人的一些其他的住院信息,例如是否是经常住院的病人,是否是患病种数很多的病人,该病人与其他的病人是否出现床位重叠的状况,最后利用这种方法也会获得一定数量的异常的病人,由人工进行参与筛选标注。
当有床位重叠表示存在挂床行为,若是同一张床位在同一时间住了多位病人,那么就可以得出该医院在这方面存在问题,有“挂床”住院的嫌疑。
从医院的角度考虑,“挂床”行为肯定不是单一病人的一种行为,肯定会有一批与医院建立合作的关系的病人,这样达到的效果会更好,相比一个偶尔挂床的病人,这部分病人更值得医院的信赖,病人和医院都能获得一定的利益。
考查病人的住院日期D,取最早的住院时间D1和最晚的住院时间D2作为病人住院日期的区间,对每一个病人做相同的处理,得到每个病人的住院区间。考查病人之间住院日期的有重合的这一部分病人,考查这部分病人在相同的住院期间的患病状况γ,住院次数δ,得病状况ε。查看这部分病人是否有可疑的病种∈(主要排除慢性病的情况),是否患相同的病θ,基于这种考查会得到一部分可疑的病人,再将这部分由人工参与筛查确认,并由此来进一步考查科室医院。
从上所述可以得到对待团体住院行为时,病人异常程度的表示方法:依次处理每个病人的住院日期(最早的住院时间D1和最晚的住院时间D2)并且存储病人的每条住院记录,得到每个病人的住院区间。选定一个病人,依次处理剩下的病人,若与该病人的住院区间相交并且在相交的时间段内,病人的单条住院记录相交天数大于一定阈值ɑ,则将病人的异常程度增加η(η为常数),以此得到每个病人在团体住院方面的异常程度e,e越大病人的异常程度越高。可得:
e=nη公式3
其中e代表病人在团体住院方面的异常程度,n代表与该病人有相交住院区间且相交天数大于阈值A的病人个数,η代表病人在团体住院方面的异常程度的常数。
如图2所示,基于病人特征刻画方法的挂床行为监测方法,它包括如下步骤:
S1:特征刻画,根据病人住院特征和基本个人信息对病人特征进行刻画;
S2:病人特征聚类,利用聚类算法将离群的病人检测出来;
S3:病人特征人工筛选,将聚类检测出的离群的病人进行人工筛选;
S4:挂床行为模型建立,结合步骤S3标注出的异常数据和步骤S2确定的正常数据建立挂床行为模型;
S5:新住院信息检测,利用挂床模型筛选挂床就医的病人。
所述的病人特征聚类基于DBSCAN算法以半径和最小包含点数为参数来进行聚类,,参数的不同会导致不同的召回率和准确率。半径和最小包含点数需要经过多次试验才可确定合适的值。DBSCAN算法,该算法对异常数据可以达到100%的召回率,但其准确率相对较低,但是相比于庞大的病人的住院记录,利用DBSCAN算法筛选出的离群点数据仅占原始数据的10%左右,在进行虚假就医行为的筛选时,极大地减少了工作量。
所述的病人特征人工筛选通过人工参与进行确认,通过专业人员进行实地考察、追踪、走访或在医院蹲点守候的方式进行筛选确认,对挂床就医病人进行标注。
所述的挂床行为模型建立利用机器学习的算法构建挂床行为的模型,机器学习算法包括随机森林算法。
如图3所示,一条病人住院信息到达之后,利用模型可直接对数据进行分类。
Claims (6)
1.一种病人特征刻画方法,其特征在于:它包括病人住院特征刻画和病人基本个人信息刻画,所述的病人住院特征刻画从病人患病种数t1、住院次数t2、报销费用t3、是否有床位重叠t4、是否存在团体住院t5五个方面来进行刻画,病人住院特征表示为F1={t1,t2,t3,t4,t5},所述的病人基本个人信息刻画从病人的年龄s1、职业s2、文化程度s3、性别s4、收入s5和收入是否稳定s6来进行,病人基本个人信息表示为F2={s1,s2,s3,s4,s5,s6},病人特征画像G表示为G=F1||F2。
2.根据权利要求1所述的一种病人特征刻画方法,其特征在于:所述的病人患病种数t1的异常度表示方式为
其中t1代表患病种数,α代表病人在患病种数方面的异常程度的底数;
病人住院次数t2的异常程度表示为
(t2-1)*β公式2
其中t2代表病人患病次数,β代表病人在住院次数方面的异常程度的参数;
所述的报销费用t3异常度由病人实际报销费用t3和预计报销费用t3′的比值表示,比值越大,异常度越大;当有床位重叠表示存在挂床行为;
所述的是否存在团体住院的异常程度表示为
e=nη公式3
其中e代表病人在团体住院方面的异常程度,n代表与该病人有相交住院区间且相交天数大于阈值A的病人数,η代表病人在团体住院方面的异常程度的常数。
3.基于权利要求1-2中任意一项所述的病人特征刻画方法的挂床行为监测方法,其特征在于:它包括如下步骤:
S1:特征刻画,根据病人住院特征和基本个人信息对病人特征进行刻画;
S2:病人特征聚类,利用聚类算法将离群的病人检测出来;
S3:病人特征人工筛选,将聚类检测出的离群的病人进行人工筛选;
S4:挂床行为模型建立,结合步骤S3标注出的异常数据和步骤S2确定的正常数据建立挂床行为模型;
S5:新住院信息检测,利用挂床模型筛选挂床就医的病人。
4.根据权利要求3所述的基于病人特征刻画方法的挂床行为监测方法,其特征在于:所述的病人特征聚类基于DBSCAN算法以半径和最小包含点数为参数来进行聚类。
5.根据权利要求3所述的基于病人特征刻画方法的挂床行为监测方法,其特征在于:所述的病人特征人工筛选通过人工参与进行确认,通过专业人员进行实地考察、追踪、走访或在医院蹲点守候的方式进行筛选确认,对挂床就医病人进行标注。
6.根据权利要求3所述的基于病人特征刻画方法的挂床行为监测方法,其特征在于:所述的挂床行为模型建立利用机器学习的算法构建挂床行为的模型,机器学习算法包括随机森林算法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510758469.6A CN105335618B (zh) | 2015-11-10 | 2015-11-10 | 一种基于对病人特征进行刻画的挂床行为监测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510758469.6A CN105335618B (zh) | 2015-11-10 | 2015-11-10 | 一种基于对病人特征进行刻画的挂床行为监测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105335618A true CN105335618A (zh) | 2016-02-17 |
CN105335618B CN105335618B (zh) | 2018-01-30 |
Family
ID=55286138
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510758469.6A Active CN105335618B (zh) | 2015-11-10 | 2015-11-10 | 一种基于对病人特征进行刻画的挂床行为监测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105335618B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108899068A (zh) * | 2018-06-14 | 2018-11-27 | 四川久远银海软件股份有限公司 | 一种异常治疗时间确定方法与装置 |
CN109508869A (zh) * | 2018-10-23 | 2019-03-22 | 平安医疗健康管理股份有限公司 | 一种基于数据处理的风险检测方法和装置 |
CN109544424A (zh) * | 2018-10-27 | 2019-03-29 | 平安医疗健康管理股份有限公司 | 一种基于生物特征识别的住院监管方法及相关设备 |
CN109545317A (zh) * | 2018-10-30 | 2019-03-29 | 平安科技(深圳)有限公司 | 基于住院预测模型判定住院行为的方法及相关产品 |
CN109978701A (zh) * | 2019-04-01 | 2019-07-05 | 太平洋医疗健康管理有限公司 | 个人住院概率预测方法及系统 |
CN110321424A (zh) * | 2019-06-14 | 2019-10-11 | 电子科技大学 | 一种基于深度学习的艾滋病人员行为分析方法 |
WO2020082788A1 (zh) * | 2018-10-27 | 2020-04-30 | 平安医疗健康管理股份有限公司 | 一种医疗数据处理方法、装置、设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009054554A1 (en) * | 2007-10-23 | 2009-04-30 | Seo-O Telecom Co., Ltd | The patient's state cognition system and method for preventing unreasonable demand of the insurance |
CN104408547A (zh) * | 2014-10-30 | 2015-03-11 | 浙江网新恒天软件有限公司 | 一种基于数据挖掘的医保欺诈行为的检测方法 |
-
2015
- 2015-11-10 CN CN201510758469.6A patent/CN105335618B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009054554A1 (en) * | 2007-10-23 | 2009-04-30 | Seo-O Telecom Co., Ltd | The patient's state cognition system and method for preventing unreasonable demand of the insurance |
CN104408547A (zh) * | 2014-10-30 | 2015-03-11 | 浙江网新恒天软件有限公司 | 一种基于数据挖掘的医保欺诈行为的检测方法 |
Non-Patent Citations (1)
Title |
---|
沈小庆 等: "数据挖掘技术在医保病人恶意配药在线监测中的应用", 《卫生经济研究》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108899068A (zh) * | 2018-06-14 | 2018-11-27 | 四川久远银海软件股份有限公司 | 一种异常治疗时间确定方法与装置 |
CN109508869A (zh) * | 2018-10-23 | 2019-03-22 | 平安医疗健康管理股份有限公司 | 一种基于数据处理的风险检测方法和装置 |
CN109508869B (zh) * | 2018-10-23 | 2023-09-22 | 平安医疗健康管理股份有限公司 | 一种基于数据处理的风险检测方法和装置 |
CN109544424A (zh) * | 2018-10-27 | 2019-03-29 | 平安医疗健康管理股份有限公司 | 一种基于生物特征识别的住院监管方法及相关设备 |
WO2020082788A1 (zh) * | 2018-10-27 | 2020-04-30 | 平安医疗健康管理股份有限公司 | 一种医疗数据处理方法、装置、设备及存储介质 |
CN109545317A (zh) * | 2018-10-30 | 2019-03-29 | 平安科技(深圳)有限公司 | 基于住院预测模型判定住院行为的方法及相关产品 |
CN109978701A (zh) * | 2019-04-01 | 2019-07-05 | 太平洋医疗健康管理有限公司 | 个人住院概率预测方法及系统 |
CN110321424A (zh) * | 2019-06-14 | 2019-10-11 | 电子科技大学 | 一种基于深度学习的艾滋病人员行为分析方法 |
CN110321424B (zh) * | 2019-06-14 | 2021-07-27 | 电子科技大学 | 一种基于深度学习的艾滋病人员行为分析方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105335618B (zh) | 2018-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105335618A (zh) | 一种病人特征刻画方法和基于该特征刻画方法的挂床行为检测方法 | |
Flokou et al. | A window-DEA based efficiency evaluation of the public hospital sector in Greece during the 5-year economic crisis | |
Rhee et al. | Medical utilization and cost in patients with overlap syndrome of chronic obstructive pulmonary disease and asthma | |
US9734289B2 (en) | Clinical outcome tracking and analysis | |
Olsen et al. | Socioeconomic position and stage at diagnosis of head and neck cancer–a nationwide study from DAHANCA | |
Baarnes et al. | Incidence and long-term outcome of severe asthma–COPD overlap compared to asthma and COPD alone: a 35-year prospective study of 57,053 middle-aged adults | |
Yu et al. | Assessing the importance of predictors in unplanned hospital readmissions for chronic obstructive pulmonary disease | |
Ding et al. | Asthma-chronic obstructive pulmonary disease overlap syndrome in the urban Chinese population: prevalence and disease burden using the 2010, 2012, and 2013 China National Health and wellness surveys | |
US20170061086A1 (en) | Cna-guided care for improving clinical outcomes and decreasing total cost of care | |
Zhong et al. | The efficiency of primary health care institutions in the counties of Hunan Province, China: data from 2009 to 2017 | |
Zhou et al. | The role of CAT in evaluating the response to treatment of patients with AECOPD | |
Tsiligianni et al. | Morning and night symptoms in primary care COPD patients: a cross-sectional and longitudinal study. An UNLOCK study from the IPCRG | |
JP7355415B2 (ja) | 臨床転帰を改善し、総治療費を低減するためのcnaガイドケア | |
Lukens | State variation in health care spending and the politics of state Medicaid policy | |
Solbjør et al. | Mammography screening and trust: the case of interval breast cancer | |
Rogers et al. | CARES: improving the care and disposition of psychiatric patients in the pediatric emergency department | |
Ejiofor et al. | Patterns and characterization of COPD exacerbations using real-time data collection | |
Afifi et al. | Impact of disease management on health care utilization: Evidence from the “Florida: A Healthy State (FAHS)” Medicaid Program | |
Dalal et al. | Costs of inpatient and emergency department care for chronic obstructive pulmonary disease in an elderly Medicare population | |
Tao et al. | Assessing the impacts of hierarchical healthcare system on the accessibility and spatial equality of healthcare services in Shenzhen, China | |
Rootmensen et al. | Clinical phenotypes of obstructive airway diseases in an outpatient population | |
McKenna et al. | Is HIT a hit? The impact of health information technology on inpatient hospital outcomes | |
Jiang et al. | Day-to-day variability of parameters recorded by home noninvasive positive pressure ventilation for detection of severe acute exacerbations in COPD | |
Roychowdhury et al. | Spirometry utilization among patients with asthma | |
Kamran et al. | Evaluation of Sepsis Prediction Models before Onset of Treatment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |