CN104766127A - 一种预测患者手术后住院天数的方法 - Google Patents
一种预测患者手术后住院天数的方法 Download PDFInfo
- Publication number
- CN104766127A CN104766127A CN201410000220.4A CN201410000220A CN104766127A CN 104766127 A CN104766127 A CN 104766127A CN 201410000220 A CN201410000220 A CN 201410000220A CN 104766127 A CN104766127 A CN 104766127A
- Authority
- CN
- China
- Prior art keywords
- data
- patient
- medical
- model
- record
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及医疗信息化领域,提供了一种对手术后住院天数的预测建模方法和系统,用于实现基于当前区域医疗卫生条件下手术后住院天数的预测。预测建模方法主要步骤:访问读取数据库的患者病案记录,选取目标疾病病种;对患者病案记录进行数据预处理;建立基于不同准则的并行数据模型,分别采用不同数据挖掘分类算法建立子模型;实现并行子模块的融合输出,获得最终模型。系统主要包括:用于连接获取区域医疗卫生信息平台中病案数据的系统数据模块,运行实现本发明中所提出方法的系统建模模块以及用于执行模型计算给出预测结果的系统执行模块。
Description
技术领域
本技术涉及应用于医疗信息化领域,具体而言,涉及一种用于对患者术后住院天数预测的数据挖掘系统和方法。
背景技术
患者的平均住院天数是一个评价医疗效益和效率、医疗质量和技术水平的重要参数。住院天数与医院医疗资源的分配、患者的治疗成本、满意度等都有很大的相关性。而且随着医疗保险改革以及临床路径等现代化医院管理的发展,对患者手术后的住院天数的分类预测具有重要意义。
另一方面,随着计算机技术的发展,医疗行业的信息化也在飞速发展。医院信息管理系统,医疗图像管理系统等信息化建设逐渐普及到每一所医院中,使得医疗资源分配得到极大改善,信息化程度得到极大的提高。近年来,随着电子病例(EMR)和电子健康档案(HER)的出现,医疗信息化的方向也逐渐由面向医院的信息化建设向面向社会的医疗信息化建设发展。各省市都在积极建立自己的地区级的医疗信息共享合作平台,促进医疗资源共享,提高医疗服务质量,降低医疗费用。地区级的医疗信息平台不仅仅为医疗资源带来便利,同时也为医疗的数据挖掘提供了数据源。
数据挖掘是针对医疗大数据分析的有效工具,它能通过对医疗数据的挖掘,获得医疗事件的关联信息,为医疗服务提供依据。近年来,数据挖掘被广泛应用于医疗领域,在医疗资源利用,医疗辅助诊断,医疗护理,基因分析等方面都有成功的应用。随着医疗平台的建设,医疗大数据的整合,这为数据挖掘提供了更广阔的发展空间。
然而,在实际的医院信息化建设过程中,为各医院信息化建设服务的厂商不同,使得所建立的电子健康档案在不同程度上存在差异。因而展现在区域级医疗信息共享平台上的医疗数据就存在数据不完整,数据内容不一致等大量疏漏。当前这种现状对医疗数据的挖掘开发与利用,带来了极大地困难。
因此,我们需要研究寻找合适的方法来实现对当前已有的大量医疗数据的开发利用与挖掘分析,使之充分发挥作用,提高医疗质量和医疗资源的利用率。
发明内容
本发明针对地区现有医疗数据条件提出一种对医疗资源预测的数据建模方法和系统。具体地说,本发明涉及一种预测患者手术后住院天数的建模方法和系统。
根据本发明的一个方面,提出一种患者手术后住院天数预测的建模方法。所述方法主要包括以下步骤:访问读取医疗数据库的患者病案记录,选取目标疾病病种,其中医疗数据库是指保存有患者病案的数据库,患者病案记录内容包括患者情况的基本信息,患者手术基本信息等结构化数据信息;对患者病案记录进行数据预处理,其中包含,根据选定的疾病病种,筛选患者病案记录中与手术后天数相关的因素等数据域,对相关数据域进行数据清洗量化等预处理操作;利用预处理过的患者病案记录数据,分别采用不同数据挖掘分类算法,基于不同准则对患者手术后住院天数建立多个并行的预测模型;在建立多个并行的预测模型基础上,选取一种恰当的融合规则将上述建立的多个模型的分析结果进行统一集成实现并行子模块的融合输出,得到最终模型结果。
根据本发明的另一个方面,提出一种预测患者手术后住院天数的系统,所述的系统主要包括:系统数据模块,与历史数据源连接,供系统建模使用,其中,历史数据源为区域级医疗卫生信息平台所能提供的病案数据库;系统建模模块,对手术后住院天数问题进行建模,并保存模型参数,其中,建模方法采用本发明提出的手术后住院天数预测方法;系统执行模块,对患者的手术后住院护理天数进行实时预测,以及根据新的数据,进一步调整系统模型,其中,预测结果可通过输入待预测患者的病案数据,根据已建立的模型进行计算得到。
本发明的一个优点在于通过数据挖掘技术并充分利用数据本身所隐含的特征,融合多种建模方法,提高了患者手术后住院天数的预测的准确性,这将有助于提高医院的医疗资源利用率,改善医患关系。
本发明的另一个优点在于能够在数据质量存在问题的条件下,利用最少的数据特征尽可能地给出精确的预测分析结果。
附图说明
图1 根据本申请的手术后住院天数预测建模方法主要流程的图解说明。
图2 根据本申请的手术后住院天数预测系统的图解说明。
具体实施方式
为了充分利用现有的医疗数据,提高医疗资源的利用率,本发明提出了一种患者手术后住院天数预测的建模方法和系统。
根据本发明的一个方面,提出一种患者手术后住院天数预测的建模方法。参考图1中的流程,所述方法主要包括以下步骤:首先,访问读取医疗数据库的患者病案记录,选取目标疾病病种,其中医疗数据库是指保存有患者病案的数据库,患者病案记录内容包括患者情况的基本信息,患者手术基本信息等结构化数据信息。目标疾病病种的选定通常由方法的操作者预先设定。在一个实施例中,病案数据库中有病案基本信息表,手术信息表,肿瘤信息表,诊断信息表等表,本例中可以根据治疗单位代码,病案编号,住院次数等数据域在病案信息基本表与手术信息表中检索,获取患者病案记录。
其次,对患者病案记录进行数据预处理,其中包含,选定某一特定的目标疾病病种,筛选患者病案记录中与手术后天数有关的因素等数据域,对相关数据域进行数据清洗量化等预处理操作。
在一个实施例中,首先根据目标疾病病种的代码与是否手术信息对患者病案数据进行筛选,保留患有目标疾病病种及有手术记录的患者的病案数据,然后选择其中与手术后住院天数有关的特征数据域,如手术信息表中的手术切口,麻醉方式,手术级别等信息,病人信息基本表中的年龄,治疗单位代码,性别,诊断等信息,删除若干与目标结果变量无关的数据域,如病案编号等。优选的,选择手术日期与出院日期的差值作为手术后住院天数的目标结果变量,记为y。
由于当前医疗信息化建设存在的标准不统一造成数据不一致以及数据本身的特性等问题,数据的清洗量化工作在系统中占有重要地位。数据的预处理主要包括,异常值的检测,数据量化处理,空白数据的处理,重新编码等。
在一个实施例中,患者可能在一次住院过程中有多次手术记录,在数据预处理过程中,需要使患者的病案数据保持。在其该次住院过程病案记录中的多次手术记录中,选择其最后一次手术的信息作为该条病案记录中的手术信息,其最后一次手术的术后天数作为目标结果变量。同时,增加一个布尔型变量的数据域标识患者是否多次手术。
在另一个实施例中,对年龄进行量化,根据在当前目标疾病病种的患者数据中年龄的统计分布,按照年龄大小分为6-10个组。并用分组的组号代替原年龄的数值,作为患者记录中的年龄记录。
在另一个实施例中,对于选定的与手术后住院天数相关的数据域中存在空白数据的患者病案记录,采取剔除该条患者病案记录的策略。
针对不合理数据的预处理,在一个实施例中,我们选择删除与整体存在较大偏差且出现比例少于0.1%的数据。在另一个实施例中,寻找当前目标疾病病种的专家知识,建立简单专家知识库,根据专家知识规则,删除数据源中出现不寻常数据。
经过该步骤的处理之后,得到的患者病案记录 x i 数据长度统一,数据内容信息可靠性增强,满足数据挖掘的要求。
第三,将预处理过的患者病案记录( x i ,y)作为训练数据,选取多种数据挖掘算法,对患者手术后住院天数进行预测,建立多个并行的预测模型f k ( x i ),k∈N。其中,数据挖掘算法可采用分类的数据挖掘算法,如贝叶斯网络,神经网络,决策树,支持向量机等。在一个实施例中,我们选择贝叶斯网络,BP后向传播神经网络,CART决策树(classification and regression trees,回归决策树),CHAID决策树(chi-squared automatic interaction detection trees,卡方自动交互检测树)算法分别建立并行的子模型f k ( x i ),k∈{1,2,3,4}。这四种算法分别基于不同的准则,能够从不同侧面对数据进行训练剖析。
需要特别指出的是,在该实施例中,对于贝叶斯网络,CHAID决策树算法,目标结果变量y必须是离散的类别号,因此我们分别在模型建立和模型计算的时候额外增加一步预处理和后处理的步骤。其中,在建立模型,利用历史数据对模型进行训练的过程中,增加一步预处理,即:对目标结果变量y采取先离散化,将手术后住院天数的数值型连续变量y量化为离散型类别编号y class 。在模型建立后,根据模型进行计算预测的时候,增加一步后处理,将预测得到的离散的类别编码y’替换为类别中心点的手术后住院天数的数值变量。其中对目标结果预测变量的量化可采取分箱的策略实现,分箱的距离以2-5为宜,即以目标结果变量的2-5个单位为距离进行离散化。
最后,我们选取一种恰当的融合规则将上述建立的多个模型的分析结果进行统一集成,实现并行子模块的融合输出,得到最终模型结果即F( x i )=integrat(f 1 ( x i ), f 2 ( x i ),…, f n ( x i ))。其中,融合的规则可采用算术平均,加权平均,投票法等方式来实现。在一个实施例中,我们采取贝叶斯网络,CART决策树,CHAID决策树,神经网络的方法进行训练,建立子模型。结合贝叶斯网络具有反映因果关系的良好特性以及决策树算法易于发现数据中频繁模式的特点,我们选择0.4,0.2,0.2,0.2的权重值分配,通过F( x i )=∑4 k=1 a k f k ( x i )进行模型集成得到最终分类预测模型,其中a k 为分别对应上述权重值。
根据本发明的另一方面,我们提出一个预测手术后住院天数的系统,以下将根据图2的系统图解说明,描述系统主要组成与功能。
系统数据模块01,与数据源连接,获取系统建模所需的历史数据,供系统建模使用,其中,历史数据源为区域级医疗卫生信息平台所能提供的病案数据库。在一个实施例中,系统数据模块01通过网络连接与区域级医疗卫生信息平台的病案数据数据库04相连,读入其存储的地区所有治疗单位的历年数据,其中包含过去患者的病案基本信息,手术信息,诊断信息,肿瘤信息等。系统的管理员根据系统需要,设定目标疾病病种参数。
系统建模模块02,以系统数据模块01中读入的数据作为建模的数据集,设定目标疾病病种参数,采用本发明提出的手术后住院天数预测方法对问题建模。模型建立后,对模型的参数进行保存,以保证后续预测能顺利进行。通常,保存至系统的外部存储器05。
系统执行模块03,实现对患者的手术后住院护理天数的预测,以及维护系统模型的正确性,其中,预测结果可通过外部存储器05读取系统建模模块中已建立的模型参数,对输入的待预测患者病案记录数据进行计算而得到。
在一个实施例中,系统执行模块读取待预测患者的患者病案信息,根据从外存储器中读取已建立的模型参数进行计算,并将计算结果输出。
在另一个实施例中,系统执行模块可以定期或者不定期地调用执行系统建模模块02,对问题进行重新建模,保证系统模型的正确性和及时性。
Claims (8)
1.一种预测患者术后住院天数的方法,其主要步骤包括:
访问病案数据库,获取患者的病案数据,选定目标疾病病种;
对患者病案数据记录进行筛选与清洗等预处理工作;
利用预处理后的病案数据,采用数据挖掘算法,对患者术后住院天数建立预测模型。
2.如权利要求1中所述的方法,病案数据库中的病案数据,其特征是:根据卫生部制定的统一标准进行录入的结构化数据。
3.如权利要求1中所述的方法,数据预处理,其特征是:根据目标疾病病种筛选患者病案记录,选取其中部分相关特征数据域,并对这些数据域的数据进行量化,异常值检测,空白数据处理或重新编码的操作。
4.如权利要求3中所述,相关特征数据域,其特征是:与手术后天数预测有相关关系,该数据域的内容信息必须在手术结束时刻之前可获得,且一旦获得即确定、不可更改。
5.如权利要求1中所述的数据挖掘算法,其特征是:采用多个分类器算法进行训练,然后融合多分类器结果进行输出,得到最终预测结果。
6.一种预测患者术后住院天数的系统,其主要包括:
系统数据模块,通过网络连接数据库,可获取数据供系统建模使用;
系统建模模块,实现与应用权利要求1中所述的方法,并对已建立的模型参数进行保存;
系统执行模块,对待预测患者的记录通过已建立的模型进行计算,并维护模型的正确性。
7.如权利要求6中,系统数据模块的数据库,其特征是:地区级的区域卫生医疗信息平台中对本地区内医疗单位的患者病案记录等信息汇总。
8.如权利要求6中,系统执行模型,其特征是:可对待预测患者记录通过系统建立的模型进行计算,给出预测结果;定期或不定期调用执行系统建模模块,对已建立的模型进行更新,保证其正确性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410000220.4A CN104766127A (zh) | 2014-01-02 | 2014-01-02 | 一种预测患者手术后住院天数的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410000220.4A CN104766127A (zh) | 2014-01-02 | 2014-01-02 | 一种预测患者手术后住院天数的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104766127A true CN104766127A (zh) | 2015-07-08 |
Family
ID=53647941
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410000220.4A Pending CN104766127A (zh) | 2014-01-02 | 2014-01-02 | 一种预测患者手术后住院天数的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104766127A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109934719A (zh) * | 2017-12-18 | 2019-06-25 | 北京亚信数据有限公司 | 医保违规行为的检测方法及检测装置、医保控费系统 |
CN109949936A (zh) * | 2019-03-13 | 2019-06-28 | 成都数联易康科技有限公司 | 一种基于深度学习混合模型的再住院风险预测方法 |
CN110691548A (zh) * | 2017-07-28 | 2020-01-14 | 谷歌有限责任公司 | 用于从电子健康记录中预测和总结医疗事件的系统和方法 |
CN112200374A (zh) * | 2020-10-15 | 2021-01-08 | 平安国际智慧城市科技股份有限公司 | 医疗数据处理方法、装置、电子设备及介质 |
WO2021031147A1 (en) * | 2019-08-21 | 2021-02-25 | L'oreal | Computing device, method and apparatus for recommending at least one of makeup palette or hair coloration scheme |
CN112584791A (zh) * | 2018-06-19 | 2021-03-30 | 托尼尔公司 | 用于诊断肩部疾患的神经网络 |
CN113196411A (zh) * | 2018-11-13 | 2021-07-30 | 皇家飞利浦有限公司 | 用于辅助提供用于消融处置的模板处置参数的系统 |
CN113393939A (zh) * | 2021-04-26 | 2021-09-14 | 上海米健信息技术有限公司 | 重症监护室患者住院天数预测方法及系统 |
CN114664451A (zh) * | 2022-05-19 | 2022-06-24 | 浙江省肿瘤医院 | 用于预测直肠癌患者术后出院准备度的模型 |
CN116504415A (zh) * | 2023-06-20 | 2023-07-28 | 中国人民解放军总医院 | 基于数据分析的医疗信息处理系统及方法 |
CN116665901A (zh) * | 2023-06-08 | 2023-08-29 | 华北理工大学 | Copd急性加重期患者超时长住院的评分系统 |
-
2014
- 2014-01-02 CN CN201410000220.4A patent/CN104766127A/zh active Pending
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11935634B2 (en) | 2017-07-28 | 2024-03-19 | Google Llc | System and method for predicting and summarizing medical events from electronic health records |
CN110691548A (zh) * | 2017-07-28 | 2020-01-14 | 谷歌有限责任公司 | 用于从电子健康记录中预测和总结医疗事件的系统和方法 |
US11398299B2 (en) | 2017-07-28 | 2022-07-26 | Google Llc | System and method for predicting and summarizing medical events from electronic health records |
US11410756B2 (en) | 2017-07-28 | 2022-08-09 | Google Llc | System and method for predicting and summarizing medical events from electronic health records |
CN109934719A (zh) * | 2017-12-18 | 2019-06-25 | 北京亚信数据有限公司 | 医保违规行为的检测方法及检测装置、医保控费系统 |
CN112584791A (zh) * | 2018-06-19 | 2021-03-30 | 托尼尔公司 | 用于诊断肩部疾患的神经网络 |
CN113196411A (zh) * | 2018-11-13 | 2021-07-30 | 皇家飞利浦有限公司 | 用于辅助提供用于消融处置的模板处置参数的系统 |
CN109949936A (zh) * | 2019-03-13 | 2019-06-28 | 成都数联易康科技有限公司 | 一种基于深度学习混合模型的再住院风险预测方法 |
WO2021031147A1 (en) * | 2019-08-21 | 2021-02-25 | L'oreal | Computing device, method and apparatus for recommending at least one of makeup palette or hair coloration scheme |
CN112200374A (zh) * | 2020-10-15 | 2021-01-08 | 平安国际智慧城市科技股份有限公司 | 医疗数据处理方法、装置、电子设备及介质 |
CN113393939A (zh) * | 2021-04-26 | 2021-09-14 | 上海米健信息技术有限公司 | 重症监护室患者住院天数预测方法及系统 |
CN113393939B (zh) * | 2021-04-26 | 2024-05-28 | 上海米健信息技术有限公司 | 重症监护室患者住院天数预测方法及系统 |
CN114664451A (zh) * | 2022-05-19 | 2022-06-24 | 浙江省肿瘤医院 | 用于预测直肠癌患者术后出院准备度的模型 |
CN116665901A (zh) * | 2023-06-08 | 2023-08-29 | 华北理工大学 | Copd急性加重期患者超时长住院的评分系统 |
CN116504415B (zh) * | 2023-06-20 | 2023-09-08 | 中国人民解放军总医院 | 基于数据分析的医疗信息处理系统及方法 |
CN116504415A (zh) * | 2023-06-20 | 2023-07-28 | 中国人民解放军总医院 | 基于数据分析的医疗信息处理系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104766127A (zh) | 一种预测患者手术后住院天数的方法 | |
CN110415831B (zh) | 一种医疗大数据云服务分析平台 | |
Xie et al. | A decomposition-ensemble approach for tourism forecasting | |
Ersado et al. | Productivity and land enhancing technologies in northern Ethiopia: Health, public investments, and sequential adoption | |
Wu et al. | Knowledge stock, exploration, and innovation: Research on the United States electromedical device industry | |
US20130253942A1 (en) | Methods and Apparatus for Smart Healthcare Decision Analytics and Support | |
Çakır et al. | A software tool for determination of breast cancer treatment methods using data mining approach | |
US8015136B1 (en) | Algorithmic method for generating a medical utilization profile for a patient and to be used for medical risk analysis decisioning | |
Lucidi et al. | A simulation-based multiobjective optimization approach for health care service management | |
CN108197737A (zh) | 一种建立医保住院费用预测模型的方法及系统 | |
NZ537623A (en) | Method for training a learning-capable system | |
Lee et al. | Prediction of emergency department patient disposition decision for proactive resource allocation for admission | |
Amalnick et al. | An intelligent algorithm for final product demand forecasting in pharmaceutical units | |
CN107145723A (zh) | 基于人工神经网络的医院流程管理系统 | |
Silva Filho et al. | A decision-making tool for demand forecasting of blood components | |
Filipe et al. | Predict hourly patient discharge probability in Intensive Care Units using Data Mining | |
Erekat et al. | Efficient operating room planning using an ensemble learning approach to predict surgery cancellations | |
Sutradhar et al. | Repeated assessments of symptom severity improve predictions for risk of death among patients with cancer | |
CN107591204A (zh) | 基于时序画像图的再住院预测方法和系统 | |
Jie | RETRACTED ARTICLE: Precision and intelligent agricultural decision support system based on big data analysis | |
Pratyaksa et al. | Arima implementation to predict the amount of antiseptic medicine usage in veterinary hospital | |
Ersado et al. | Productivity and land enhancing technologies in Northern Ethiopia: Health, public investments, and sequential adoption | |
JP7479604B2 (ja) | 機械学習を用いた退院日予測方法及び装置 | |
Srikanth et al. | AN EFFICIENT PATIENT INFLOW PREDICTION MODEL FOR HOSPITAL RESOURCE MANAGEMENT. | |
Jiang et al. | Using Data Mining to Analyze Patient Discharge Data for an Urban Hospital. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20150708 |