CN111081377A - 一种坏死性急性胰腺炎患者手术时机预测模型 - Google Patents
一种坏死性急性胰腺炎患者手术时机预测模型 Download PDFInfo
- Publication number
- CN111081377A CN111081377A CN202010057757.XA CN202010057757A CN111081377A CN 111081377 A CN111081377 A CN 111081377A CN 202010057757 A CN202010057757 A CN 202010057757A CN 111081377 A CN111081377 A CN 111081377A
- Authority
- CN
- China
- Prior art keywords
- data
- model
- patient
- acute pancreatitis
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 206010033645 Pancreatitis Diseases 0.000 title claims abstract description 21
- 206010033647 Pancreatitis acute Diseases 0.000 title claims abstract description 21
- 201000003229 acute pancreatitis Diseases 0.000 title claims abstract description 21
- 230000001338 necrotic effect Effects 0.000 title claims abstract description 8
- 206010053159 Organ failure Diseases 0.000 claims abstract description 7
- 230000034994 death Effects 0.000 claims abstract description 6
- 238000004140 cleaning Methods 0.000 claims abstract description 4
- 230000007246 mechanism Effects 0.000 claims abstract description 4
- 238000013507 mapping Methods 0.000 claims abstract description 3
- 238000000034 method Methods 0.000 claims description 28
- 230000008569 process Effects 0.000 claims description 24
- 230000006870 function Effects 0.000 claims description 13
- 238000012549 training Methods 0.000 claims description 6
- 238000001356 surgical procedure Methods 0.000 claims description 5
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 210000002569 neuron Anatomy 0.000 claims description 3
- 238000005457 optimization Methods 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 206010028851 Necrosis Diseases 0.000 abstract description 12
- 230000017074 necrotic cell death Effects 0.000 abstract description 12
- 238000004393 prognosis Methods 0.000 abstract description 2
- 201000010099 disease Diseases 0.000 description 5
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 5
- 238000011161 development Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Public Health (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Epidemiology (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种坏死性急性胰腺炎患者手术时机预测模型,包括以下步骤:S100、收集并清洗病例数据,病例数据包括病人的入院数据和住院数据;S200、对病例数据进行整理得到预处理数据,预处理数据的序列形式为{Variables,Time};S300、对预处理数据中的类别型变量使用Embedding机制进行one‑hot编码,然后再映射到实向量空间中;S400、对S300得到的数据进行归一化后,引入LSTM模型,LSTM模型为多任务模型,LSTM模型的输出层设置病人入院后48小时死亡情况、剩余住院天数、是否发生器官衰竭、是否进行手术四个结局指标。本发明能够根据每一位急性胰腺炎坏死患者的特点确定其最佳手术时机,以改善急性胰腺炎坏死手术患者预后情况。
Description
技术领域
本发明涉及神经网络领域,尤其涉及一种坏死性急性胰腺炎患者手术时机预测模型。
背景技术
目前我国几乎没有关于坏死性急性胰腺炎患者手术时机的预测模型;众所周知,不同疾病的时间序列特征以及变量特征是不同的,虽然已经存在其他已知的若干疾病的预测模型,但由于上述差异的存在,不能直接套用。以往关于疾病预测的模型主要集中于传统的统计学方法,由于数据的异构性,大多数难以考虑复杂的时间信息,也难以模拟患者真实的疾病发展状态。
国内外指南建议急性胰腺炎坏死患者手术时机尽量延迟在四周以后,但并未给出哪些患者可以在四周前手术的具体建议,或给出针对个体建议的最佳手术时机。不是所有急性胰腺炎坏死患者都能等到四周以后手术,且能等到四周以后手术的急性胰腺炎坏死患者也存在究竟延迟到什么时候才是最佳的手术时机选择的问题。
发明内容
本发明旨在提供一种坏死性急性胰腺炎患者手术时机预测模型,采用带有时序数据分析能力的长短时神经网络模型根据急性胰腺炎坏死患者入院时的基本情况以及住院中病情的进展情况动态预测急性胰腺炎坏死患者最佳手术时机,从而根据每一位急性胰腺炎坏死患者的特点确定其最佳手术时机,以改善急性胰腺炎坏死手术患者预后情况。
为达到上述目的,本发明是采用以下技术方案实现的:
本发明公开一种坏死性急性胰腺炎患者手术时机预测模型,包括以下步骤:
S100、收集并清洗病例数据,病例数据包括病人的入院数据和住院数据;
S200、对病例数据进行整理得到预处理数据,预处理数据的序列形式为{Variables,Time};
S300、对预处理数据中的类别型变量使用Embedding机制进行one-hot编码,然后再映射到实向量空间中;
S400、对S300得到的数据进行归一化后,引入LSTM模型,LSTM模型为多任务模型,LSTM模型的输出层设置病人入院后48小时死亡情况、剩余住院天数、是否发生器官衰竭、是否进行手术四个结局指标。
优选的,步骤S400中,
LSTM模型的训练过程包括前向过程、后向过程,前向过程的公式为,
ij=σi(xjWxi+hj-1Whi+bi) (1)
fj=σf(xtWxf+hj-1Whf+bf) (2)
cj=ft⊙cj-1+it⊙σc(xjWxc+hj-1Whc+bc) (3)
oj=σo(xtWxo+hj-1Who+bo) (4)
hj=σj⊙σh(cj) (5)
其中,dT代表T时刻是否发生器官衰竭,m代表是否死亡,lT代表T时刻的剩余住院时间,pi代表是否进行手术。
优选的,前向过程中的损失函数公式为,
ψ=λd·ψd+λl·ψl+λm·ψm+λp·ψp (14)
其中CE代表交叉熵函数,λd,λm,λl,λp分别是各部分损失函数的权重,以超参数的形式引入。
优选的,LSTM模型的超参数信息采用网格搜索法寻优,选出在验证集上表现最优的参数组合作为模型最终结果。
优选的,超参数信息包括神经元个数,隐含层层数。
优选的,后向过程实际为参数优化过程,采用Adam算法进行反向传播求解。
优选的,病例数据包括人口特征数据,HIS系统、LIS系统、RIS系统、CIS系统的信息。
本发明的有益效果:
1、本发明提出了一种输出组合,使预测模型训练的过程中能够更全面的考虑患者的信息。
2、本发明纳入的变量多,能够较为完整的描述患者在院内的疾病自然过程。
3、本发明能够为每一位患者提供个性化的手术时机建议。
附图说明
图1为本发明的概念示意图;
图2为本发明中LSTM的模型结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图,对本发明进行进一步详细说明。
LSTM,即Long short term network,是指长短时神经网络模型。
HIS医院信息系统hospital information system;
LIS实验室信息系统laboratory information system;
RIS放射信息系统Radiological information system;
CIS临床信息系统Clinical information system。
如图1、图2所示,本发明收集四川大学华西医院10年急性胰腺炎患者电子病历数据,并进行数据清洗。
采用图2所示的LSTM网络结构针对急性胰腺炎坏死患者电子病历数据进行时序建模,
采用图1所示的流程,预测不同时刻的死亡风险,从而得到最佳手术时机。模型采用多个输出的方式,所构造的损失函数也由各部分的输出加权求和产生,这种设计使得模型在训练的时候能够考虑多方面的信息。
在网络的输入层,对于类别型变量使用Embedding机制进行one-hot编码,然后再映射到合适维度的实向量空间中,数值事件值归一化后直接引入。
输出层设置病人入院后48小时死亡情况,剩余住院天数,是否发生器官衰竭,是否进行手术四个结局指标。损失函数分别采用交叉熵函数和平方误差函数。
实际使用时,开发语言采用python3.5版本,涉及的包包括numpy、pytorch。提取华西胰腺外科10年的病人的入院和住院数据,主要包括人口特征数据,HIS系统、LIS系统、RIS系统、CIS系统的信息,并进行清洗,整理成{Variables,Time}的序列形式。通过输入到图2所示模型进行训练,整个训练过程分为前向过程和后向过程,前向过程由公式1-9定义,为多输出的LSTM前向过程;
ij=σi(xjWxi+hj-1Whi+bi) (1)
fj=σf(xtWxf+hj-1Whf+bf) (2)
cj=ft⊙cj-1+it⊙σc(xjWxc+hj-1Whc+bc) (3)
oj=σo(xtWxo+hj-1Who+bo) (4)
hj=σj⊙σh(cj) (5)
ψ=λd·ψd+λl·ψl+λm·ψm+λp·ψp (14)
其中,dT代表T时刻是否发生器官衰竭,
m代表是否死亡,
lT代表T时刻的剩余住院时间,以天为时间单位,
pi代表是否进行手术,
CE代表交叉熵函数,
λd,λm,λl,λp分别是各部分损失函数的权重,以超参数的形式引入。后向过程实际为参数优化过程,采用Adam算法进行反向传播求解。损失函数由公式10-14定义。神经元个数,隐含层层数等超参数信息采用网格搜索法寻优,选出在验证集上表现最优的参数组合作为模型最终结果。
当然,本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。
Claims (7)
1.一种坏死性急性胰腺炎患者手术时机预测模型,其特征在于包括以下步骤:
S100、收集并清洗病例数据,病例数据包括病人的入院数据和住院数据;
S200、对病例数据进行整理得到预处理数据,预处理数据的序列形式为{Variables,Time};
S300、对预处理数据中的类别型变量使用Embedding机制进行one-hot编码,然后再映射到实向量空间中;
S400、对S300得到的数据进行归一化后,引入LSTM模型,LSTM模型为多任务模型,LSTM模型的输出层设置病人入院后48小时死亡情况、剩余住院天数、是否发生器官衰竭、是否进行手术四个结局指标。
4.根据权利要求2或3所述的预测模型,其特征在于:LSTM模型的超参数信息采用网格搜索法寻优,选出在验证集上表现最优的参数组合作为模型最终结果。
5.根据权利要求4所述的预测模型,其特征在于:超参数信息包括神经元个数,隐含层层数。
6.根据权利要求5所述的预测模型,其特征在于:后向过程实际为参数优化过程,采用Adam算法进行反向传播求解。
7.根据权利要求1所述的预测模型,其特征在于:病例数据包括人口特征数据,HIS系统、LIS系统、RIS系统、CIS系统的信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010057757.XA CN111081377A (zh) | 2020-01-16 | 2020-01-16 | 一种坏死性急性胰腺炎患者手术时机预测模型 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010057757.XA CN111081377A (zh) | 2020-01-16 | 2020-01-16 | 一种坏死性急性胰腺炎患者手术时机预测模型 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111081377A true CN111081377A (zh) | 2020-04-28 |
Family
ID=70324292
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010057757.XA Pending CN111081377A (zh) | 2020-01-16 | 2020-01-16 | 一种坏死性急性胰腺炎患者手术时机预测模型 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111081377A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112331349A (zh) * | 2020-11-03 | 2021-02-05 | 四川大学华西医院 | 一种脑卒中复发监测模型及监测方法 |
CN112967816A (zh) * | 2021-04-26 | 2021-06-15 | 四川大学华西医院 | 一种用于急性胰腺炎器官衰竭预测的计算机设备和系统 |
CN115171905A (zh) * | 2022-06-20 | 2022-10-11 | 复旦大学 | 一种基于独热编码无监督聚类的肿瘤患者相似性计算方法 |
CN115240854A (zh) * | 2022-07-29 | 2022-10-25 | 中国医学科学院北京协和医院 | 一种胰腺炎预后数据的处理方法及其系统 |
CN115331819A (zh) * | 2022-07-29 | 2022-11-11 | 中国医学科学院北京协和医院 | 一种基于人工智能的胰腺炎预后数据处理方法及其系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3172481U (ja) * | 2011-09-28 | 2011-12-22 | 有限会社 杉浦技術士事務所 | 手術スケジュール決定装置 |
CN104992058A (zh) * | 2015-06-25 | 2015-10-21 | 成都厚立信息技术有限公司 | 疾病风险调整模型建立方法 |
CN106295180A (zh) * | 2016-08-10 | 2017-01-04 | 中国人民解放军第三军医大学第三附属医院 | 老年骨科手术风险预测方法 |
CN108597579A (zh) * | 2018-05-11 | 2018-09-28 | 北京爱康宜诚医疗器材有限公司 | 手术时间的确定方法及装置、存储介质、电子装置 |
CN109559804A (zh) * | 2018-10-12 | 2019-04-02 | 中山大学中山眼科中心 | 一种围手术期信息处理管理系统 |
US10426551B2 (en) * | 2016-12-09 | 2019-10-01 | Microsoft Technology Licensing, Llc | Personalized refractive surgery recommendations for eye patients |
-
2020
- 2020-01-16 CN CN202010057757.XA patent/CN111081377A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3172481U (ja) * | 2011-09-28 | 2011-12-22 | 有限会社 杉浦技術士事務所 | 手術スケジュール決定装置 |
CN104992058A (zh) * | 2015-06-25 | 2015-10-21 | 成都厚立信息技术有限公司 | 疾病风险调整模型建立方法 |
CN106295180A (zh) * | 2016-08-10 | 2017-01-04 | 中国人民解放军第三军医大学第三附属医院 | 老年骨科手术风险预测方法 |
US10426551B2 (en) * | 2016-12-09 | 2019-10-01 | Microsoft Technology Licensing, Llc | Personalized refractive surgery recommendations for eye patients |
CN108597579A (zh) * | 2018-05-11 | 2018-09-28 | 北京爱康宜诚医疗器材有限公司 | 手术时间的确定方法及装置、存储介质、电子装置 |
CN109559804A (zh) * | 2018-10-12 | 2019-04-02 | 中山大学中山眼科中心 | 一种围手术期信息处理管理系统 |
Non-Patent Citations (4)
Title |
---|
HUILONG DUAN ET.AL.: ""On Clinical Event Prediction in Patient Treatment Trajectory Using Longitudinal Electronic Health Records"", 《IEEE》 * |
刘亦娇: ""基于趋势因子预处理和循环神经网络的股指预测研究"", 《万方》 * |
周永生: ""基于LSTM神经网络的PM2.5预测"", 《万方》 * |
张蕾: ""基于神经网络的蛋白质二级结构预测算法研究"", 《万方》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112331349A (zh) * | 2020-11-03 | 2021-02-05 | 四川大学华西医院 | 一种脑卒中复发监测模型及监测方法 |
CN112331349B (zh) * | 2020-11-03 | 2023-04-07 | 四川大学华西医院 | 一种脑卒中复发监测系统 |
CN112967816A (zh) * | 2021-04-26 | 2021-06-15 | 四川大学华西医院 | 一种用于急性胰腺炎器官衰竭预测的计算机设备和系统 |
WO2022226843A1 (zh) * | 2021-04-26 | 2022-11-03 | 四川大学华西医院 | 一种用于急性胰腺炎器官衰竭预测的计算机设备和系统 |
CN112967816B (zh) * | 2021-04-26 | 2023-08-15 | 四川大学华西医院 | 一种急性胰腺炎器官衰竭预测方法、计算机设备和系统 |
CN115171905A (zh) * | 2022-06-20 | 2022-10-11 | 复旦大学 | 一种基于独热编码无监督聚类的肿瘤患者相似性计算方法 |
CN115240854A (zh) * | 2022-07-29 | 2022-10-25 | 中国医学科学院北京协和医院 | 一种胰腺炎预后数据的处理方法及其系统 |
CN115331819A (zh) * | 2022-07-29 | 2022-11-11 | 中国医学科学院北京协和医院 | 一种基于人工智能的胰腺炎预后数据处理方法及其系统 |
CN115240854B (zh) * | 2022-07-29 | 2023-10-03 | 中国医学科学院北京协和医院 | 一种胰腺炎预后数据的处理方法及其系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111081377A (zh) | 一种坏死性急性胰腺炎患者手术时机预测模型 | |
Waring et al. | Automated machine learning: Review of the state-of-the-art and opportunities for healthcare | |
Jiang et al. | Modified genetic algorithm-based feature selection combined with pre-trained deep neural network for demand forecasting in outpatient department | |
CN104572583B (zh) | 用于数据致密化的方法和系统 | |
US7801839B2 (en) | Method for training a learning-capable system | |
Yang et al. | Test-cost sensitive classification on data with missing values | |
TWI778289B (zh) | 控制方法以及醫學系統 | |
CN111243752A (zh) | 一种急性胰腺炎诱发器官衰竭的预测模型 | |
JP2020194414A (ja) | データ分析装置、データ分析方法、およびデータ分析プログラム | |
CN115862848A (zh) | 基于临床数据筛选和医学知识图谱的疾病预测系统和装置 | |
CN112967816A (zh) | 一种用于急性胰腺炎器官衰竭预测的计算机设备和系统 | |
CN116759100A (zh) | 基于联邦学习构建慢性心血管疾病大模型方法 | |
CN112116685A (zh) | 基于多粒度奖励机制的多注意力融合网络的图像字幕生成方法 | |
WO2023025956A1 (en) | Method and system for deconvolution of bulk rna-sequencing data | |
Ahmed et al. | An integrated optimization and machine learning approach to predict the admission status of emergency patients | |
Cui et al. | Medskim: Denoised health risk prediction via skimming medical claims data | |
Sudharson et al. | Enhancing the Efficiency of Lung Disease Prediction using CatBoost and Expectation Maximization Algorithms | |
Poulain et al. | Transformer-based multi-target regression on electronic health records for primordial prevention of cardiovascular disease | |
JP2020042645A (ja) | 時系列データ分析装置、時系列データ分析方法、および時系列データ分析プログラム | |
CN115565669B (zh) | 一种基于gan和多任务学习的癌症生存分析方法 | |
KR20220111215A (ko) | 자기주의 기반 심층 신경망 모델을 이용한 약물-표적 상호작용 예측 장치 및 그 방법 | |
Yazid et al. | Clinical pathway variance prediction using artificial neural network for acute decompensated heart failure clinical pathway | |
Attiya et al. | A Proposed Approach for Predicting Liver Disease | |
Lu | Hardware-Efficient Automated Machine Learning Using Neural Architecture Search: Methods and Applications | |
Kumar et al. | Modeling and representation of software framework cost estimation using convolution neural networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200428 |