CN113723674A - 一种基于大数据相关性的医疗风险预测方法 - Google Patents

一种基于大数据相关性的医疗风险预测方法 Download PDF

Info

Publication number
CN113723674A
CN113723674A CN202110948630.1A CN202110948630A CN113723674A CN 113723674 A CN113723674 A CN 113723674A CN 202110948630 A CN202110948630 A CN 202110948630A CN 113723674 A CN113723674 A CN 113723674A
Authority
CN
China
Prior art keywords
model
regression
factors
prediction method
big data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110948630.1A
Other languages
English (en)
Inventor
赵大平
王琪
赵景越
任诗芳
孙伟贤
孙嘉明
马源坤
黄嬖
郝忠华
韩改弟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Winning Health Technology Group Co Ltd
Original Assignee
Winning Health Technology Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Winning Health Technology Group Co Ltd filed Critical Winning Health Technology Group Co Ltd
Priority to CN202110948630.1A priority Critical patent/CN113723674A/zh
Publication of CN113723674A publication Critical patent/CN113723674A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/22Social work or social welfare, e.g. community support activities or counselling services

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Theoretical Computer Science (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Educational Administration (AREA)
  • Child & Adolescent Psychology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开一种基于大数据相关性的医疗风险预测方法,包括如下步骤:指定目标指标,采集被研究医院中与目标指标相关联的临床数据,并对所述临床数据进行预处理,确定相关因素;目标指标作为因变量,将处理后的相关因素作为自变量带入不同回归算法模型中,采用F检测通过回归结果对不同回归算法模型显著性进行检验,确定相关因素的相关系数和自变量的筛选;根据历史结构化措施库以及相关因素的相关系数构建风险预估模型。本发明具有可以风险预测及提供改进措施的能力,有效降低了医疗风险。

Description

一种基于大数据相关性的医疗风险预测方法
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于大数据相关性的医疗风险预测方法。
背景技术
市面上针对医疗运营、质量、服务等相关指标及其影响的因素的应用,均以预置指标为前提,借用回归算法针对人为主观已选定的部分因素进行回归分析。
由于受到预置因素的影响,分析的视角和范围易出现偏颇,难以找到根因,分析和改进易流于表面,甚至出现方向性的错误。针对以上描述现状,可见,如图2所示,现有技术中存在以下明显缺点:
1)、影响因素人为选定,无法客观判定影响指标的根因因素,直接导致分析结果及针对结果的措施易出现偏差;
2)、采用单一相关性算法,无法判断此算法是否与需要计算的指标及其因素性质相匹配;
3)、未进行后期措施和措施实施进行分析和推荐设计,功能不完善;
4)、无法进行指标分析及指标相关影响因素的持续性跟踪对比。
发明内容
为了解决上述技术问题,本发明提出一种基于大数据相关性的医疗风险预测方法,具有可以风险预测及提供改进措施的能力,有效降低了医疗风险。
为了达到上述目的,本发明的技术方案如下:
一种基于大数据相关性的医疗风险预测方法,包括如下步骤:
指定目标指标,采集被研究医院中与目标指标相关联的临床数据,并对所述临床数据进行预处理,确定相关因素;
目标指标作为因变量,将处理后的相关因素作为自变量带入不同回归算法模型中,采用F检测通过回归结果对不同回归算法模型显著性进行检验,确定相关因素的相关系数和自变量的筛选;
根据历史结构化措施库以及相关因素的相关系数构建风险预估模型。
优选地,所述预处理包括极值剔除、聚类转化、因子分析和可信度分析。
优选地,所述不同回归算法模型包括分层回归模型、逐步回归模型,多元logit模型,有序logit模型,多因素方差模型、协方差模型、岭回归模型、分层聚类模型、曲线回归模型、PLS回归模型、LASSO回归模型、RFM模型、非线性回归模型、卡方检验模型、COX回归模型和poisson回归模型等。
优选地,所述将处理后的相关因素作为自变量带入不同回归算法模型中,计算出的不同回归结果,将不同回归结果中的因变量值和自变量值分别带入实际操作业务中,通过临床使用者针对不同结果做出有效性的评价,根据评价结果确定相关因素对应的最优算法模型。
优选地,还包括如下步骤:将临床患者诊疗过程中临床数据带入风险预估模型,得到对应的改进措施。
优选地,还包括如下步骤:将改进措施的文本进行后结构化文本标记措施标签,并加入历史结构化措施库中,实时更新风险预估模型。
优选地,还包括如下步骤:采用决策树算法绘制整体决策模型,将临床患者诊疗过程中实际的相关因素数据以及相关因素的相关系数带入整体决策模型中,计算风险因素值,实时判断风险因素值是否超过预设阈值,若超过,则展示影响最强的相关因素,并发送预警信息至预关联的单位或个人。
基于上述技术方案,本发明的有益效果是:
1)、本发明通过数据信效度分析得出目前纳入统计因素数据的可利用程度,用以确保进入相关性算法的数据是真实可用的,确保回归算法结果的有效;
2)、本发明引入算法学习机制,针对连续性数据和非连续型数据代入不同的算法,并且通过针对有效因素实施的措施的有效性和利用现有数据代入相关系数预测指标的准确性,判断不同算法的适用性,用于后期针对类似数据则采用有效的算法。如分段性数据采用分层回归模型,连续性数据采用协方差模型等;
3)、本发明针对已有的措施进行后结构化文本标签标记,通过采用措施后指标变化判断有效措施。后期针对相同因素出现问题的时候采用根据标签推荐措施。
附图说明
下面结合附图对本发明的具体实施方式作进一步详细的说明。
图1是一个实施例中一种基于大数据相关性的医疗风险预测方法流程图;
图2是现有技术中医疗风险中的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
随着电子病历大数据的积累,以及人工智能技术的发展,数据驱动的预测方法应运而生。如图1所示,本实施例提供一种基于大数据相关性的医疗风险预测方法,具体包括如下步骤:
目前针对国家要求的评级评审和监测上报指标200+,以其中患者住院日作为案例进行描述。在此次设计中,指定目标指标Y为患者住院日,采集被研究医院中与目标指标相关联的临床数据,确定相关因素X包括连续性数据和非连续性数据,其中连续性数据包括患者年龄、在院天数、确诊时间、医技耗时、手术等待时间、手术持续时间、平均护理时长等;非连续型数据包括患者性别、居住地、职业、医保类型、疾病类型、危重类型、护理级别、诊断类别、多学科情况、出院方式、入院类型、指定医师、是否陪护、陪护方式、陪护人员等,并对所述临床数据进行预处理;
目标指标作为因变量,将预处理后的相关因素作为自变量分别带入不同回归算法模型中,采用F检测通过回归结果对不同回归算法模型显著性进行检验,确定相关因素的相关系数和自变量的筛选,不同回归算法模型包括分层回归模型、逐步回归模型,多元logit模型,有序logit模型,多因素方差模型、协方差模型、岭回归模型、分层聚类模型、曲线回归模型、PLS回归模型、LASSO回归模型、RFM模型、非线性回归模型、卡方检验模型、COX回归模型和poisson回归模型等;
根据历史结构化措施库以及相关因素的相关系数构建风险预估模型。
本实施例中,预处理包括极值剔除、聚类转化、因子分析和可信度分析。通过可信度分析作为回归分析的前序步骤进行数据验证,用以确保进入相关性的回归算法的数据是真实可用的,确保回归算法结果的有效。
进一步,还包括如下步骤:将处理后的相关因素作为自变量带入不同回归算法模型中,计算出的不同回归结果,将不同回归结果中的因变量值和自变量值分别带入实际操作业务中,形成业务报告,并针对业务报告做出临床打分,逐步最终确定逐步回归模型适用于此指标,并得出算法报告如下:
将院内临床患者的诊疗数据作为自变量,而将患者住院日作为因变量进行逐步回归分析,经过模型自动识别,最终筛选后的自变量包括:患者性别、患者年龄、疾病类型、危重类型、入院类型、出院方式和医保类型一共7项在模型中。模型通过F检验(F=218.887,p=0.000<0.05),说明模型有效。针对模型的多重共线性进行检验发现,模型中VIF值全部均小于5,意味着不存在着共线性问题;并且D-W值在数字2附近,因而说明模型不存在自相关性,样本数据之间并没有关联关系,模型较好。
将X、Y值业务定义带入实际操作业务中,翻译业务报告如下:
数值型相关因素中,患者年龄与患者住院日出现显著正相关,患者年龄每增长1岁,住院日增长约0.065天;非数值相关因素分析可见,女性(患者性别)、重症(危重类型)、手术(疾病类型)、120急救转入(入院类型)、医保支付(医保类型)、治愈出院(出院方式)的患者住院日明显增加。
同时根据患者年龄、女性、重症等措施标签,结合历史结构化措施库给出推荐建议如下:
1)针对女性患者进行数据单独分析;
2)120急救转入的患者平均住院日较高,针对120急救转入的患者的诊疗路径闭环分析各环节平均耗时;
3)针对欠费患者进行标记和欠费预警报备流程。
进一步,还包括如下步骤:采用决策树算法绘制整体决策模型,确定相关因素在流程中的对应环节节点位置的可期望值;将临床患者诊疗过程中实际的相关因素数据以及相关因素的相关系数带入整体决策模型中,计算风险因素值,实时判断风险因素值是否超过预设阈值,若超过,则展示影响最强的相关因素,并发送预警信息至预关联的单位或个人,有效帮助医院降低风险发生概率。
以上所述仅为本发明所公开的一种基于大数据相关性的医疗风险预测方法的优选实施方式,并非用于限定本说明书实施例的保护范围。凡在本说明书实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本说明书实施例的保护范围之内。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书实施例中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

Claims (7)

1.一种基于大数据相关性的医疗风险预测方法,其特征在于,包括如下步骤:
指定目标指标,采集被研究医院中与目标指标相关联的临床数据,并对所述临床数据进行预处理,确定相关因素;
目标指标作为因变量,将处理后的相关因素作为自变量带入不同回归算法模型中,采用F检测通过回归结果对不同回归算法模型显著性进行检验,确定相关因素的相关系数和自变量的筛选;
根据历史结构化措施库以及相关因素的相关系数构建风险预估模型。
2.根据权利要求1所述的一种基于大数据相关性的医疗风险预测方法,其特征在于,所述预处理包括极值剔除、聚类转化、因子分析和可信度分析。
3.根据权利要求1所述的一种基于大数据相关性的医疗风险预测方法,其特征在于,所述不同回归算法模型包括分层回归模型、逐步回归模型,多元logit模型,有序logit模型,多因素方差模型、协方差模型、岭回归模型、分层聚类模型、曲线回归模型、PLS回归模型、LASSO回归模型、RFM模型、非线性回归模型、卡方检验模型、COX回归模型和poisson回归模型。
4.根据权利要求1所述的一种基于大数据相关性的医疗风险预测方法,其特征在于,所述将处理后的相关因素作为自变量带入不同回归算法模型中,计算出的不同回归结果,将不同回归结果中的因变量值和自变量值分别带入实际操作业务中,通过临床使用者针对不同结果做出有效性的评价,根据评价结果确定相关因素对应的最优算法模型。
5.根据权利要求1所述的一种基于大数据相关性的医疗风险预测方法,其特征在于,还包括如下步骤:
将临床患者诊疗过程中临床数据带入风险预估模型,得到对应的改进措施。
6.根据权利要求5所述的一种基于大数据相关性的医疗风险预测方法,其特征在于,还包括如下步骤:将改进措施的文本进行后结构化文本标记措施标签,并加入历史结构化措施库中,实时更新风险预估模型。
7.根据权利要求1所述的一种基于大数据相关性的医疗风险预测方法,其特征在于,还包括如下步骤:
采用决策树算法绘制整体决策模型,将临床患者诊疗过程中实际的相关因素数据以及相关因素的相关系数带入整体决策模型中,计算风险因素值,实时判断风险因素值是否超过预设阈值,若超过,则展示影响最强的相关因素,并发送预警信息至预关联的单位或个人。
CN202110948630.1A 2021-08-18 2021-08-18 一种基于大数据相关性的医疗风险预测方法 Pending CN113723674A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110948630.1A CN113723674A (zh) 2021-08-18 2021-08-18 一种基于大数据相关性的医疗风险预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110948630.1A CN113723674A (zh) 2021-08-18 2021-08-18 一种基于大数据相关性的医疗风险预测方法

Publications (1)

Publication Number Publication Date
CN113723674A true CN113723674A (zh) 2021-11-30

Family

ID=78676729

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110948630.1A Pending CN113723674A (zh) 2021-08-18 2021-08-18 一种基于大数据相关性的医疗风险预测方法

Country Status (1)

Country Link
CN (1) CN113723674A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116542401A (zh) * 2023-07-05 2023-08-04 江南大学附属医院 一种住院诊疗服务单元的医保超支预测方法与系统

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105046406A (zh) * 2015-06-25 2015-11-11 成都厚立信息技术有限公司 住院病人医疗管理质量评估方法
CN105279395A (zh) * 2015-10-20 2016-01-27 北京工业大学 一种hiv-1整合酶突变株对evg耐药倍数变化值的预测方法
CN110634571A (zh) * 2019-09-20 2019-12-31 四川省人民医院 肝移植术后预后预测系统
CN110716512A (zh) * 2019-09-02 2020-01-21 华电电力科学研究院有限公司 一种基于燃煤电站运行数据的环保装备性能预测方法
CN110931134A (zh) * 2019-12-03 2020-03-27 南通大学 一种基于大数据挖掘模型预测住院压力性损伤愈合的方法
CN111123188A (zh) * 2019-12-20 2020-05-08 国网山东省电力公司电力科学研究院 基于改进最小二乘法的电能表综合检定方法及系统
CN111968747A (zh) * 2020-08-20 2020-11-20 卫宁健康科技集团股份有限公司 Vte智能防治管理系统
CN112199557A (zh) * 2020-10-15 2021-01-08 北京如易堂科技有限公司 一种发明内容推荐工具、电子设备及计算机可存储介质
CN112215012A (zh) * 2020-10-22 2021-01-12 国网福建省电力有限公司 基于条件随机场的配电网检修单安全措施语义解析方法
CN112232447A (zh) * 2020-12-14 2021-01-15 国网江西省电力有限公司电力科学研究院 一种电力设备状态监测数据的完整样本集的构建方法
CN112652361A (zh) * 2020-12-29 2021-04-13 中国医科大学附属盛京医院 一种基于gbdt模型的骨髓瘤高风险筛查方法及其应用
CN113096804A (zh) * 2021-04-08 2021-07-09 武汉爱尔眼科医院有限公司 一种干眼症患者数据统计系统

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105046406A (zh) * 2015-06-25 2015-11-11 成都厚立信息技术有限公司 住院病人医疗管理质量评估方法
CN105279395A (zh) * 2015-10-20 2016-01-27 北京工业大学 一种hiv-1整合酶突变株对evg耐药倍数变化值的预测方法
CN110716512A (zh) * 2019-09-02 2020-01-21 华电电力科学研究院有限公司 一种基于燃煤电站运行数据的环保装备性能预测方法
CN110634571A (zh) * 2019-09-20 2019-12-31 四川省人民医院 肝移植术后预后预测系统
CN110931134A (zh) * 2019-12-03 2020-03-27 南通大学 一种基于大数据挖掘模型预测住院压力性损伤愈合的方法
CN111123188A (zh) * 2019-12-20 2020-05-08 国网山东省电力公司电力科学研究院 基于改进最小二乘法的电能表综合检定方法及系统
CN111968747A (zh) * 2020-08-20 2020-11-20 卫宁健康科技集团股份有限公司 Vte智能防治管理系统
CN112199557A (zh) * 2020-10-15 2021-01-08 北京如易堂科技有限公司 一种发明内容推荐工具、电子设备及计算机可存储介质
CN112215012A (zh) * 2020-10-22 2021-01-12 国网福建省电力有限公司 基于条件随机场的配电网检修单安全措施语义解析方法
CN112232447A (zh) * 2020-12-14 2021-01-15 国网江西省电力有限公司电力科学研究院 一种电力设备状态监测数据的完整样本集的构建方法
CN112652361A (zh) * 2020-12-29 2021-04-13 中国医科大学附属盛京医院 一种基于gbdt模型的骨髓瘤高风险筛查方法及其应用
CN113096804A (zh) * 2021-04-08 2021-07-09 武汉爱尔眼科医院有限公司 一种干眼症患者数据统计系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116542401A (zh) * 2023-07-05 2023-08-04 江南大学附属医院 一种住院诊疗服务单元的医保超支预测方法与系统
CN116542401B (zh) * 2023-07-05 2023-09-19 江南大学附属医院 一种住院诊疗服务单元的医保超支预测方法与系统

Similar Documents

Publication Publication Date Title
US11922348B2 (en) Generating final abnormality data for medical scans based on utilizing a set of sub-models
CN108648827B (zh) 心脑血管疾病风险预测方法及装置
US20220051771A1 (en) Report generating system and methods for use therewith
Conesa et al. Bayesian hierarchical Poisson models with a hidden Markov structure for the detection of influenza epidemic outbreaks
KR102342770B1 (ko) 질병 예측치의 분포를 이용한 건강관리 상담 시스템
US20220037019A1 (en) Medical scan artifact detection system and methods for use therewith
US20240312575A1 (en) System and method for automatically determining serious adverse events
US20120041784A1 (en) Computerized Surveillance of Medical Treatment
CN112562863A (zh) 流行病监测预警方法、装置、电子设备
CN116779190A (zh) 一种基于物联网的医疗平台用户随访管理系统及方法
CN116884612A (zh) 疾病风险等级的智能分析方法、装置、设备及存储介质
CN113723674A (zh) 一种基于大数据相关性的医疗风险预测方法
CN116959715B (zh) 一种基于时序演进过程解释的疾病预后预测系统
US20160357934A1 (en) Diabetes onset and progression prediction using a computerized model
WO2023217737A1 (en) Health data enrichment for improved medical diagnostics
Zhang et al. Real-time Prediction for Mechanical Ventilation in COVID-19 Patients using A Multi-task Gaussian Process Multi-objective Self-attention Network
Sayed et al. A Novel Deep Learning Approach for Forecasting Myocardial Infarction Occurrences with Time Series Patient Data
CN112562854A (zh) 一种高龄人员精准医疗关怀服务推荐方法及系统
Markus et al. Why predicting risk can’t identify ‘risk factors’: empirical assessment of model stability in machine learning across observational health databases
Malik et al. Heart Disease Prediction Using Artificial Intelligence
Eswari et al. An Intelligent System to Predict Diabetic Retinal Diseases Based on Diabetic Attributes
CN117954088A (zh) 慢性肾脏病的血尿酸阈值计算方法、装置及介质
Kokilavani et al. Machine Learning–Based Case Studies for Healthcare Analytics: Electronic Health Records, Smart Health Monitoring, Disease Prediction, Precision Medicine, and Clinical Support Systems
CN117012379A (zh) 目标对象的健康管理系统、方法、设备、介质及程序产品
He Analyzing, optimizing, and explaining hospital miscoding for coding practice improvement

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination