CN113436727A - 基于病人检测信息对潜在治疗方案治愈概率打分的方法 - Google Patents
基于病人检测信息对潜在治疗方案治愈概率打分的方法 Download PDFInfo
- Publication number
- CN113436727A CN113436727A CN202110738375.8A CN202110738375A CN113436727A CN 113436727 A CN113436727 A CN 113436727A CN 202110738375 A CN202110738375 A CN 202110738375A CN 113436727 A CN113436727 A CN 113436727A
- Authority
- CN
- China
- Prior art keywords
- layer
- detail structure
- convolution
- day
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/10—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/20—ICT specially adapted for the handling or processing of medical references relating to practices or guidelines
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Physics & Mathematics (AREA)
- Biophysics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioethics (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medicinal Chemistry (AREA)
- Apparatus For Radiation Diagnosis (AREA)
Abstract
本发明属于深度学习分析领域,公开了一种基于病人检测信息对潜在治疗方案治愈概率打分的方法,该方法包括以下步骤:(S1)收集训练用数据;(S2)建立逻辑回归模型并训练;(S3)分别建立unet模型和三维卷积神经网络模型并训练;(S4)补全训练用数据,得到训练用数据对应的任意一位病人在治疗过程中每一天的生存情况得分;(S5)建立长短期记忆网络LSTM模型并训练;(S6)随机潜在治疗方案,预测得到第N+2天的生存情况得分,从而即可完成对该潜在治疗方案的打分。本发明通过对方法及系统的整体流程设计等进行改进,能够从大数据分析的角度具体量化病人的情况,对潜在治疗方案治愈概率进行打分。
Description
技术领域
本发明属于深度学习分析领域,更具体地,涉及一种基于病人检测信息对潜在治疗方案治愈概率打分的方法,与该方法相对应的系统,同样能够基于病人检测信息对潜在治疗方案治愈概率进行打分。
背景技术
针对一类疾病,病人的各项检测值往往蕴含大量信息。目前医生针对病人的治疗基于经验和自身对病人情况的判断,个体差异较大,可能出现各种原因导致的误诊,给出诊断方案时也可能考虑不周。
肺部疾病,除了在临床检查信息(如血检、尿检)上有体现外,往往还可以通过患者肺部CT图像进行判断。综合各种数据往往能得到相对准确的结果。同时目前并没有对治疗方案实时更新的预测方法,本发明希望利用病人的检查结果及治疗方案,给出治愈概率打分较高的治疗方案,为医生提供合理的建议和参考。
发明内容
针对现有技术的以上缺陷或改进需求,本发明的目的在于提供一种基于病人检测信息对潜在治疗方案治愈概率打分的方法及系统,其中通过对方法的整体流程设计、及相应系统的功能模块设置等进行改进,能够从大数据分析的角度具体量化病人的情况,对潜在治疗方案治愈概率进行打分;进一步的,基于本发明方法及系统得到的治愈概率打分高的潜在治疗方案,相当于给出了合理的潜在诊断及治疗建议,为医生提供参考,为提供治疗方案给出了一个新途径。相较于现有技术往往需要医生依靠自身经验给出判断与治疗方案,利用本发明,能够基于数据分析与深度学习对病人情况和治疗方案进行判定,可以为医生提供参考、建议,开辟了一种区别于传统的新途径。
为实现上述目的,按照本发明的一个方面,提供了一种基于病人检测信息对潜在治疗方案治愈概率打分的方法,其特征在于,针对种类预先选定的肺部疾病,该方法包括以下步骤:
(S1)针对预先已知结局是死亡还是治愈出院的患有该肺部疾病的病人,收集他们入院后的临床检查结果、入院后的肺部CT图像以及入院后每一天的治疗方式,作为训练用数据;
其中,所述临床检查结果为血检结果和尿检结果;每一天的治疗方式,包括:针对预先选定的多种药物中每一种药物是否使用,以及预先设定的多种通风方案中每一种通风方案是否使用;
(S2)根据训练用数据中的临床检查结果,编制表格,该表格中的每一列用于代表相应的一项检测,每一行代表一个病人某一天的检测值;
建立逻辑回归模型,利用所述表格中的每一行数据、并以该行数据所对应的病人结局为标签,对该逻辑回归模型进行训练,使训练后的逻辑回归模型能够以某一病人的临床检查结果为输入,预测该病人基于临床信息的临床信息检测当天的生存情况得分;
(S3)分别建立unet模型和三维卷积神经网络模型,利用训练用数据中的肺部CT图像对它们进行训练,其中,就某一个训练样本:
首先将3D肺部CT图像切片为若干张2D肺部CT图像切片,利用所述unet模型提取每一张2D肺部CT图像切片中的肺实质区域;接着,利用每一张2D肺部CT图像切片中的肺实质区域,对3D肺部CT图像进行处理,得到3D肺部CT图像中肺实质区域的最大外接立方体;然后,将该立方体缩放至预先设定的统一尺寸,并以该训练样本所对应的病人结局为标签,对所述三维卷积神经网络模型进行训练;
如此利用训练用数据中的肺部CT图像所有训练样本,使训练后的unet模型和训练后的三维卷积神经网络模型配合能够以某一病人的肺部CT图像为输入,预测该病人基于肺部CT图像的肺部CT检测当天的生存情况得分;
(S4)针对训练用数据,依据结局是死亡还是治愈出院将训练用数据分为两类,对于其中的任意一类,根据这一类病人的生存情况得分随入院治疗天数变化趋势,用得到的基于临床信息的生存情况得分、基于肺部CT图像的生存情况得分利用二次函数线性回归共同拟合补全训练用数据对应的这一类病人中任意一位病人在治疗过程中每一天的生存情况得分;
如此,即可得到训练用数据对应的任意一位病人在治疗过程中每一天的生存情况得分,收集作为入院治疗天数-生存情况得分关系数据集;
(S5)建立长短期记忆网络LSTM模型,根据训练用数据中入院后每一天的治疗方式,以病人入院后连续N天的治疗方式及步骤(S4)得到的这连续N天的生存情况得分作为一个训练样本,以及步骤(S4)得到的第N+1天该病人的生存情况得分作为标签,训练所述长短期记忆网络LSTM模型;使训练后的长短期记忆网络LSTM模型能够以某一病人的N天的治疗方式及这连续N天的生存情况得分为输入,预测该病人第N+1天的生存情况得分;
其中,N为大于等于3的正整数;
(S6)收集患有该肺部疾病的病人入院后的临床检查结果及肺部CT图像,将临床检查结果输入至训练后的逻辑回归模型,将肺部CT图像输入至训练后的unet模型和训练后的三维卷积神经网络模型中,从而分别得到临床信息检测当天的生存情况得分、以及肺部CT检测当天的生存情况得分;然后,将它们并入所述步骤(S4)得到的所述入院治疗天数-生存情况得分关系数据集中,再次利用二次函数线性回归拟合,补全该病人自入院后每一天的生存情况得分;
针对预先选定的多种药物和预先选定的多种通风方案,根据从病人入院到离开医院过程中某一天每一种药物是否使用、以及每一种通风方案是否使用,随机排列组合后,得到若干种治疗方案;根据预先设定的每天允许施加的药物种类的上限要求、以及预先设定的每天允许施加的通风方案的上限要求,从中筛选出满足要求的作为潜在治疗方案;
利用训练后的长短期记忆网络LSTM模型,将该病人入院后连续N天的治疗方式及这连续N天的生存情况得分作为输入,预测得到第N+1天的生存情况得分,并以预测得到第N+1天的生存情况得分作为更新后的第N+1天的生存情况得分;然后,随机潜在治疗方案作为第N+1天的治疗方案,同样利用训练后的长短期记忆网络LSTM模型,通过预测得到第N+2天生存情况得分,将该第N+2天生存情况得分作为对该潜在治疗方案的打分,即可完成对该潜在治疗方案的打分。
作为本发明的进一步优选,所述步骤(S2)中,所述第一表格中的每一列的数据用于代表相应的一项治疗方式是否使用,具体满足:使用为1,未使用为0。
作为本发明的进一步优选,所述步骤(S3)中,所述unet模型包括七个细节结构,其中,第一个细节结构为输入层,第二个细节结构和第三个细节结构为下采样层,第四个细节结构设置为跳跃连接,第五个细节结构和第六个细节结构为上采样层,第七个细节结构为全连接和输出层;
所述第二个细节结构和所述第三个细节结构均依次包括一层卷积层、一层Dropout层、一层卷积层、一层最大池化层与一层批标准化层;其中,所述第三个细节结构中每一个所述卷积层的卷积核个数彼此相等,所述第二个细节结构中每一个所述卷积层的卷积核个数彼此相等;优选的,所述第三个细节结构中每一个所述卷积层的卷积核个数均为8,所述第二个细节结构中每一个所述卷积层的卷积核个数均为16;
所述第五个细节结构和所述第六个细节结构均依次包括一层反卷积层、一层批标准化层和两层卷积层;其中,所述第六个细节结构中每一个所述卷积层的卷积核个数彼此相等;所述第五个细节结构中每一个所述卷积层的卷积核个数彼此相等;所述第六个细节结构中任意一个所述卷积层的卷积核个数是所述第五个细节结构中任意一个所述卷积层的卷积核个数的一半;并且,对于所述第五个细节结构和所述第六个细节结构,在反卷积层与批标准化层之间,还设置有用于将反卷积后的矩阵与所述第二个细节结构和所述第三个细节结构中间得到的大小相同的矩阵拼接的运算;
所述第七个细节结构依次包括一个卷积层和一个激活层。
作为本发明的进一步优选,所述步骤(S3)中,所述三维卷积神经网络模型包括六个细节结构,其中,
第一个细节结构为输入层,用于输入肺实质区域的最大外接立方体;
第二个细节结构和第三个细节结构均依次包括一层卷积层、一层Dropout层、一层卷积层、一层最大池化层与一层批标准化层;所述第三个细节结构中每一个所述卷积层的卷积核个数彼此相等,所述第二个细节结构中每一个所述卷积层的卷积核个数彼此相等;优选的,所述第三个细节结构中每一个所述卷积层的卷积核个数均为128,所述第二个细节结构中每一个所述卷积层的卷积核个数均为64;
第四个细节结构依次包括一个Dropout层和一个Flatten层;
第五个细节结构包括一个全连接层,其激活函数为relu;
第六个细节结构依次包括一个批标准层、一个激活层、一个Dropout层和一个输出全连接层。
作为本发明的进一步优选,所述种类预先选定的肺部疾病为新型冠状病毒肺炎;
所述步骤(S6)中,所述预先设定的每天允许施加的药物种类的上限要求为不超过3种,所述预先设定的每天允许施加的通风方案的上限要求为不超过1种。
按照本发明的另一方面,本发明提供了一种基于病人检测信息对潜在治疗方案治愈概率打分的系统,其特征在于,包括:
逻辑回归模型功能模块:用于以某一病人的临床检查结果为输入,预测该病人基于临床信息的临床信息检测当天的生存情况得分;
unet模型和三维卷积神经网络模型组合功能模块:用于以某一病人的肺部CT图像为输入,预测该病人基于肺部CT图像的肺部CT检测当天的生存情况得分;
生存概率得分补全功能模块:用于对得到的基于临床信息的生存情况得分、基于肺部CT图像的生存情况得分利用二次函数线性回归共同拟合补全病人在治疗过程中每一天的生存情况得分;
长短期记忆网络LSTM模型功能模块:用于以病人入院后连续N天的治疗方式及这连续N天的生存情况得分作为输入,预测得到第N+1天的生存情况得分,并以预测得到第N+1天的生存情况得分作为更新后的第N+1天的生存情况得分;并且,用于以随机潜在治疗方案作为第N+1天的治疗方案,通过预测得到第N+2天生存情况得分,将该第N+2天生存情况得分作为对该潜在治疗方案的打分,即可完成对该潜在治疗方案的打分。
作为本发明的进一步优选,所述unet模型包括七个细节结构,其中,第一个细节结构为输入层,第二个细节结构和第三个细节结构为下采样层,第四个细节结构设置为跳跃连接,第五个细节结构和第六个细节结构为上采样层,第七个细节结构为全连接和输出层;
所述第二个细节结构和所述第三个细节结构均依次包括一层卷积层、一层Dropout层、一层卷积层、一层最大池化层与一层批标准化层;其中,所述第三个细节结构中每一个所述卷积层的卷积核个数彼此相等,所述第二个细节结构中每一个所述卷积层的卷积核个数彼此相等;优选的,所述第三个细节结构中每一个所述卷积层的卷积核个数均为8,所述第二个细节结构中每一个所述卷积层的卷积核个数均为16;
所述第五个细节结构和所述第六个细节结构均依次包括一层反卷积层、一层批标准化层和两层卷积层;其中,所述第六个细节结构中每一个所述卷积层的卷积核个数彼此相等;所述第五个细节结构中每一个所述卷积层的卷积核个数彼此相等;所述第六个细节结构中任意一个所述卷积层的卷积核个数是所述第五个细节结构中任意一个所述卷积层的卷积核个数的一半;并且,对于所述第五个细节结构和所述第六个细节结构,在反卷积层与批标准化层之间,还设置有用于将反卷积后的矩阵与所述第二个细节结构和所述第三个细节结构中间得到的大小相同的矩阵拼接的运算;
所述第七个细节结构依次包括一个卷积层和一个激活层。
作为本发明的进一步优选,所述三维卷积神经网络模型包括六个细节结构,其中,
第一个细节结构为输入层,用于输入肺实质区域的最大外接立方体;
第二个细节结构和第三个细节结构均依次包括一层卷积层、一层Dropout层、一层卷积层、一层最大池化层与一层批标准化层;所述第三个细节结构中每一个所述卷积层的卷积核个数彼此相等,所述第二个细节结构中每一个所述卷积层的卷积核个数彼此相等;优选的,所述第三个细节结构中每一个所述卷积层的卷积核个数均为128,所述第二个细节结构中每一个所述卷积层的卷积核个数均为64;
第四个细节结构依次包括一个Dropout层和一个Flatten层;
第五个细节结构包括一个全连接层,其激活函数为relu;
第六个细节结构依次包括一个批标准层、一个激活层、一个Dropout层和一个输出全连接层。
通过本发明所构思的以上技术方案,能够取得以下有益效果:
(1)本发明中的基于病人检测信息对潜在治疗方案治愈概率打分的方法及系统,具有普遍性,对各类在肺部有病灶的疾病都适用,有助于人们从各种类型的病人的检查结果中挖掘信息。
(2)基于本发明,可以收集一组病人队列的各项临床检查信息和CT信息,预测病人临床检查或CT检测当天的生存情况得分并利用线性拟合预测病人住院治疗过程中每一天的得分,进而与病人每一天的治疗方案关联,达到利用n天的治疗方案与生存情况得分预测n+1天的得分并以此为基础找到提升生存情况得分的治疗方案的目的(n≥3)。
附图说明
图1是本发明基于病人检测信息对潜在治疗方案治愈概率打分的方法及系统的流程示意图。
图2是本发明实施例所建立的基于病人检测信息对潜在治疗方案治愈概率打分的方法及系统中CT和临床信息预测出的生存情况得分的对比图(图中均以结局当天记为第0天,往前即对应住院期间)。其中,图2中的(a)对应基于CT得到的生存情况得分(即,surviverate,或cure possibility),图中所有的点是所有病人每一次CT预测出的生存情况得分;图2中的(b)对应基于临床检测(CF)得到的生存情况得分,图中所有的点是所有病人每一次临床检测信息预测出的生存情况得分。同时,在图2中的(a)、(b)、(c)中还分别示出了单独基于CT、单独临床数据、同时基于临床数据与CT(CF&CT)预测的、由已知结局为治愈出院(cured)的病人数据的生存情况得分拟合曲线和已知结局为死亡(dead)的病人数据的生存概率得分拟合曲线;由图2中的(a)、(b)、(c)中的任意一者均可以看出,由已知结局为治愈出院(cured)的病人数据和由已知结局为死亡(dead)的病人数据拟合得到的两条生存概率得分拟合曲线有明显差异。
图3是本发明实施例所建立的基于病人检测信息对潜在治疗方案治愈概率打分的方法及系统中单独CT、单独临床检测结果(CF)、以及CT与临床检测结果相结合(即,CF&CT)的性能展示图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
下面以肺部疾病为新型冠状病毒肺炎为例,对本发明进行详细介绍(当然,除新型冠状病毒肺炎外,本发明也适用于其他肺部疾病,如肺结核等)。
实施例1
发明人从华中科技大学同济医学院附属梨园医院收集了由340位新型冠状病毒肺炎患者组成的队列共340人,收集他们的临床检查信息及CT结果,治疗方案及最后的结局。临床信息指临床检测的各项目值,包括血检和尿检等常规检测结果以及核酸检测结果;治疗方案指从病人入院到出院过程中每一天的用药和治疗方式,可包括抗病毒药物、中药及中成药、抗菌药物、抗炎症因子风暴和通气方案这几类(例如,可以是如下表表1所示的三十种,每一种记为一项治疗方式);结局分为死亡和治愈出院两类,若有病人转院则因情况不明不计入。
表1
收集所有病人的临床检查信息(并不要求临床检查每一日都进行);所有病人的临床信息可以汇集到一张表,每列对应一项检测,每行为一个病人一天的检测值;将该表格所对应的矩阵,与病人结局进行十倍交叉的逻辑回归训练(逻辑回归所使用的模型可直接参照现有技术建立,本发明使用的是Understanding logistic regression analysis inclinical reports:an introduction中详细记载的模型),可预测出每个病人在这些天数中来自临床信息的生存情况得分(该生存情况得分随入院治疗天数变化,如图2中的(b)所示)。该生存情况得分在0到1之间,越接近于1则越健康,反之越危险。
同时,病人一次CT检测获得一组CT图像(同样不要求CT检测每一日都进行),图像可以以dcm的格式呈现,进一步的,可以:
先利用unet模型提取每一张CT图像中的肺实质;unet模型框架来自原型来自Unet神经网络,Unet模型最初发表于《U-Net:Convolutional Networks for Biomedical ImageSegmentation》。在本发明中,unet模型其网络结构尤其可包括七个细节结构,第一个细节结构为输入层,第二和第三个为下采样层,第四个细节结构设置为跳跃连接(以防止梯度消失),第五和第六个细节结构为上采样层,第七个为全连接和输出层。例如:
第二个、第三个细节结构均依次包括一层卷积层、一层Dropout层、一层卷积层、一层最大池化层与一层批标准化层;为了层层提取特征,优选的,第三个细节结构中的任意一个卷积层的卷积核个数均为8,而第二个细节结构中的卷积层卷积核个数均为16。
第五个、第六个细节结构均依次包括一层反卷积层、一层批标准化层和两层卷积层,该第五个细节结构和第六个细节结构中,第六个细节结构中任意一个卷积层的卷积核个数彼此相同,第五个细节结构中任意一个卷积层的卷积核个数彼此相同,第六个细节结构中任意一个卷积层的卷积核个数是第五个细节结构中任意一个卷积层的卷积核个数的一半,例如,第五个细节结构中任意一个卷积层的卷积核个数均为16,而第六个细节结构中任意一个的卷积层卷积核个数均为8;并且,对于第五个、第六个细节结构,在反卷积层与批标准化层之间,还设置有用于将反卷积后的矩阵与第二个至第三个细节结构中间得到的大小相同的矩阵拼接的运算。
第七个细节结构包括一个卷积层和一个激活层,激活层将输出两个代表像素是否在肺实质中的两个分数。
提取后的图像仅有肺实质部分是白色,其余为黑色。
然后,将每一张CT图叠加成3D结构,肺实质为白色镂空洞;将肺实质的最大外接立方体提取出来,所有人的肺部缩放成64(像素)×128(像素)×128(像素)大小。肺实质立方体(作为训练数据)与病人结局(作为标签数据)关联进行五倍交叉三维卷积神经网络训练,获得病人来自CT的生存情况得分。此处使用的卷积神经网络模型原型来自2015年发表的论文《Very Deep Convolutional Networks for Large-Scale Image Recognition》中提出的VGG16。在本发明中,该三维卷积神经网络模型尤其可包括六个细节结构,例如:
第一个细节结构为输入层;用于输入肺实质立方体;
第二个和第三个细节结构均依次包括一层卷积层、一层Dropout层、一层卷积层、一层最大池化层与一层批标准化层,为了层层提取特征,第三个细节结构中任意一个卷积层的卷积核个数均为128,而第二个结构中任意一个卷积层的卷积核个数均为64。
第四个细节结构依次包括一个Dropout层和一个Flatten层使张量扁平化;第五个细节结构包括一个全连接层,其激活函数为relu。后续连接的第六个细节结构依次包括一个批标准层、一个激活层、一个Dropout层和一个输出全连接层。输出全连接层将输出两个代表根据CT判断病人治愈出院或死亡的两个概率分数,记其中代表病人治愈出院的概率分数为“生存情况得分”(并且,代表病人死亡的概率分数等于1减去生存情况得分)。
根据标签数据(即病人是治愈出院,还是死亡)对病人数据进行划分,已知结局为治愈出院的病人数据记为一类,已知结局为死亡的病人数据记为另一类,根据这两类病人各自的生存情况得分变化趋势,用得到的来自临床检查结果和CT的所有得分利用二次函数线性回归共同拟合补全任意一位病人在治疗过程中每一天的生存情况得分。如此,即可得到任意一位病人在治疗过程中每一天的生存情况得分,收集作为入院治疗天数-生存情况得分关系数据集(数据集不再区分结局是死亡还是治愈出院)。
进一步的,可以将治疗过程按每三天划分,每次划分推后一天(例如,住院第1天、住院第2天、住院第3天为第一组,住院第2天、住院第3天、住院第4天为第二组;依此类推),训练数据为三天的治疗过程与这三天此病人的生存情况得分,其标签为第四天的生存情况得分(对于第二组,标签则是第五天的生存情况得分;依此类推)。这样将所有病人的治疗过程与生存情况得分关联,训练LSTM(长短期记忆网络)模型。与现有技术一致,LSTM模型是解决需要长期信息的问题的常用模型,在RNN(循环神经网络)的基础上改良长期依赖问题。模型可由三层细节结构构成,包括两层LSTM层和一层全连接层。例如,LSTM层的输出维度分别为16和32,激活函数默认tanh。全连接层输出维度为1,表示预测的病人生存情况得分。
此处利用模型能够通过已有的治疗方案和检查结果预测下一天的生存情况得分,经过一百万次随机更改治疗方案后取让预测后生存情况得分最高的方案(如表1所示的每项治疗方式,经排列组合后,将存在2的30次方种可能性),作为潜在的治疗方案,以达到预测让病人存活可能性最高的治疗方案的目的。具体的治疗方法将包括每种具体药物在当天是否使用,使用则为1,不使用则为0,随机得到1和0组成的序列参与预测。另外,根据新冠肺炎治疗方法的实际情况,可限制通气方式每天最多一种,其他药物治疗每天最多三种(可根据这些要求对全部一百万次随机更改治疗方案中不满足这些条件的,预先进行剔除)。
最后在另一个病人队列中检验方案是否合理。例如,针对某一位病人,可以将其临床检查结果输入至上述逻辑回归模型中得到临床信息检测当天的生存情况得分,将其CT图像输入至由上述UNET模型和上述三维卷积神经网络组成配合形成的网络中,得到肺部CT检测当天的生存情况得分;然后,将它们并入上述入院治疗天数-生存情况得分关系数据集中,利用二次函数线性回归拟合,补全该病人自入院后每一天的生存情况得分;可以取入院后连续的3天,将这3天的已有治疗方案及这3天对应的生存情况得分输入至上述LSTM模型中,预测得到第四天的生存情况得分,作为更新后的第四天的生存情况得分;然后,随机第四天的治疗方案,将第二天、第三天及第四天的治疗方案与第二天、第三天及第四天的生存情况得分输入至上述LSTM模型中,由此预测第五天的生存情况得分;该第五天的生存情况得分即为对第四天治疗方案的打分。根据第五天的生存情况得分即可判断第四天的治疗方案是否可采纳(第五天的生存情况得分分数越高,采纳后的可靠性越高)。如此重复即可得到这个病人队列中全部病人的潜在治疗方案。
可见,上述预测流程,能通过数据分析和深度学习为医生提供合理的建议和参考。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种基于病人检测信息对潜在治疗方案治愈概率打分的方法,其特征在于,针对种类预先选定的肺部疾病,该方法包括以下步骤:
(S1)针对预先已知结局是死亡还是治愈出院的患有该肺部疾病的病人,收集他们入院后的临床检查结果、入院后的肺部CT图像以及入院后每一天的治疗方式,作为训练用数据;
其中,所述临床检查结果为血检结果和尿检结果;每一天的治疗方式,包括:针对预先选定的多种药物中每一种药物是否使用,以及预先设定的多种通风方案中每一种通风方案是否使用;
(S2)根据训练用数据中的临床检查结果,编制表格,该表格中的每一列用于代表相应的一项检测,每一行代表一个病人某一天的检测值;
建立逻辑回归模型,利用所述表格中的每一行数据、并以该行数据所对应的病人结局为标签,对该逻辑回归模型进行训练,使训练后的逻辑回归模型能够以某一病人的临床检查结果为输入,预测该病人基于临床信息的临床信息检测当天的生存情况得分;
(S3)分别建立unet模型和三维卷积神经网络模型,利用训练用数据中的肺部CT图像对它们进行训练,其中,就某一个训练样本:
首先将3D肺部CT图像切片为若干张2D肺部CT图像切片,利用所述unet模型提取每一张2D肺部CT图像切片中的肺实质区域;接着,利用每一张2D肺部CT图像切片中的肺实质区域,对3D肺部CT图像进行处理,得到3D肺部CT图像中肺实质区域的最大外接立方体;然后,将该立方体缩放至预先设定的统一尺寸,并以该训练样本所对应的病人结局为标签,对所述三维卷积神经网络模型进行训练;
如此利用训练用数据中的肺部CT图像所有训练样本,使训练后的unet模型和训练后的三维卷积神经网络模型配合能够以某一病人的肺部CT图像为输入,预测该病人基于肺部CT图像的肺部CT检测当天的生存情况得分;
(S4)针对训练用数据,依据结局是死亡还是治愈出院将训练用数据分为两类,对于其中的任意一类,根据这一类病人的生存情况得分随入院治疗天数变化趋势,用得到的基于临床信息的生存情况得分、基于肺部CT图像的生存情况得分利用二次函数线性回归共同拟合补全训练用数据对应的这一类病人中任意一位病人在治疗过程中每一天的生存情况得分;
如此,即可得到训练用数据对应的任意一位病人在治疗过程中每一天的生存情况得分,收集作为入院治疗天数-生存情况得分关系数据集;
(S5)建立长短期记忆网络LSTM模型,根据训练用数据中入院后每一天的治疗方式,以病人入院后连续N天的治疗方式及步骤(S4)得到的这连续N天的生存情况得分作为一个训练样本,以及步骤(S4)得到的第N+1天该病人的生存情况得分作为标签,训练所述长短期记忆网络LSTM模型;使训练后的长短期记忆网络LSTM模型能够以某一病人的N天的治疗方式及这连续N天的生存情况得分为输入,预测该病人第N+1天的生存情况得分;
其中,N为大于等于3的正整数;
(S6)收集患有该肺部疾病的病人入院后的临床检查结果及肺部CT图像,将临床检查结果输入至训练后的逻辑回归模型,将肺部CT图像输入至训练后的unet模型和训练后的三维卷积神经网络模型中,从而分别得到临床信息检测当天的生存情况得分、以及肺部CT检测当天的生存情况得分;然后,将它们并入所述步骤(S4)得到的所述入院治疗天数-生存情况得分关系数据集中,再次利用二次函数线性回归拟合,补全该病人自入院后每一天的生存情况得分;
针对预先选定的多种药物和预先选定的多种通风方案,根据从病人入院到离开医院过程中某一天每一种药物是否使用、以及每一种通风方案是否使用,随机排列组合后,得到若干种治疗方案;根据预先设定的每天允许施加的药物种类的上限要求、以及预先设定的每天允许施加的通风方案的上限要求,从中筛选出满足要求的作为潜在治疗方案;
利用训练后的长短期记忆网络LSTM模型,将该病人入院后连续N天的治疗方式及这连续N天的生存情况得分作为输入,预测得到第N+1天的生存情况得分,并以预测得到第N+1天的生存情况得分作为更新后的第N+1天的生存情况得分;然后,随机潜在治疗方案作为第N+1天的治疗方案,同样利用训练后的长短期记忆网络LSTM模型,通过预测得到第N+2天生存情况得分,将该第N+2天生存情况得分作为对该潜在治疗方案的打分,即可完成对该潜在治疗方案的打分。
2.如权利要求1所述方法,其特征在于,所述步骤(S2)中,所述第一表格中的每一列的数据用于代表相应的一项治疗方式是否使用,具体满足:使用为1,未使用为0。
3.如权利要求1所述方法,其特征在于,所述步骤(S3)中,所述unet模型包括七个细节结构,其中,第一个细节结构为输入层,第二个细节结构和第三个细节结构为下采样层,第四个细节结构设置为跳跃连接,第五个细节结构和第六个细节结构为上采样层,第七个细节结构为全连接和输出层;
所述第二个细节结构和所述第三个细节结构均依次包括一层卷积层、一层Dropout层、一层卷积层、一层最大池化层与一层批标准化层;其中,所述第三个细节结构中每一个所述卷积层的卷积核个数彼此相等,所述第二个细节结构中每一个所述卷积层的卷积核个数彼此相等;优选的,所述第三个细节结构中每一个所述卷积层的卷积核个数均为8,所述第二个细节结构中每一个所述卷积层的卷积核个数均为16;
所述第五个细节结构和所述第六个细节结构均依次包括一层反卷积层、一层批标准化层和两层卷积层;其中,所述第六个细节结构中每一个所述卷积层的卷积核个数彼此相等;所述第五个细节结构中每一个所述卷积层的卷积核个数彼此相等;所述第六个细节结构中任意一个所述卷积层的卷积核个数是所述第五个细节结构中任意一个所述卷积层的卷积核个数的一半;并且,对于所述第五个细节结构和所述第六个细节结构,在反卷积层与批标准化层之间,还设置有用于将反卷积后的矩阵与所述第二个细节结构和所述第三个细节结构中间得到的大小相同的矩阵拼接的运算;
所述第七个细节结构依次包括一个卷积层和一个激活层。
4.如权利要求1所述方法,其特征在于,所述步骤(S3)中,所述三维卷积神经网络模型包括六个细节结构,其中,
第一个细节结构为输入层,用于输入肺实质区域的最大外接立方体;
第二个细节结构和第三个细节结构均依次包括一层卷积层、一层Dropout层、一层卷积层、一层最大池化层与一层批标准化层;所述第三个细节结构中每一个所述卷积层的卷积核个数彼此相等,所述第二个细节结构中每一个所述卷积层的卷积核个数彼此相等;优选的,所述第三个细节结构中每一个所述卷积层的卷积核个数均为128,所述第二个细节结构中每一个所述卷积层的卷积核个数均为64;
第四个细节结构依次包括一个Dropout层和一个Flatten层;
第五个细节结构包括一个全连接层,其激活函数为relu;
第六个细节结构依次包括一个批标准层、一个激活层、一个Dropout层和一个输出全连接层。
5.如权利要求1所述方法,其特征在于,所述种类预先选定的肺部疾病为新型冠状病毒肺炎;
所述步骤(S6)中,所述预先设定的每天允许施加的药物种类的上限要求为不超过3种,所述预先设定的每天允许施加的通风方案的上限要求为不超过1种。
6.一种基于病人检测信息对潜在治疗方案治愈概率打分的系统,其特征在于,包括:
逻辑回归模型功能模块:用于以某一病人的临床检查结果为输入,预测该病人基于临床信息的临床信息检测当天的生存情况得分;
unet模型和三维卷积神经网络模型组合功能模块:用于以某一病人的肺部CT图像为输入,预测该病人基于肺部CT图像的肺部CT检测当天的生存情况得分;
生存概率得分补全功能模块:用于对得到的基于临床信息的生存情况得分、基于肺部CT图像的生存情况得分利用二次函数线性回归共同拟合补全病人在治疗过程中每一天的生存情况得分;
长短期记忆网络LSTM模型功能模块:用于以病人入院后连续N天的治疗方式及这连续N天的生存情况得分作为输入,预测得到第N+1天的生存情况得分,并以预测得到第N+1天的生存情况得分作为更新后的第N+1天的生存情况得分;并且,用于以随机潜在治疗方案作为第N+1天的治疗方案,通过预测得到第N+2天生存情况得分,将该第N+2天生存情况得分作为对该潜在治疗方案的打分,即可完成对该潜在治疗方案的打分。
7.如权利要求6所述系统,其特征在于,所述unet模型包括七个细节结构,其中,第一个细节结构为输入层,第二个细节结构和第三个细节结构为下采样层,第四个细节结构设置为跳跃连接,第五个细节结构和第六个细节结构为上采样层,第七个细节结构为全连接和输出层;
所述第二个细节结构和所述第三个细节结构均依次包括一层卷积层、一层Dropout层、一层卷积层、一层最大池化层与一层批标准化层;其中,所述第三个细节结构中每一个所述卷积层的卷积核个数彼此相等,所述第二个细节结构中每一个所述卷积层的卷积核个数彼此相等;优选的,所述第三个细节结构中每一个所述卷积层的卷积核个数均为8,所述第二个细节结构中每一个所述卷积层的卷积核个数均为16;
所述第五个细节结构和所述第六个细节结构均依次包括一层反卷积层、一层批标准化层和两层卷积层;其中,所述第六个细节结构中每一个所述卷积层的卷积核个数彼此相等;所述第五个细节结构中每一个所述卷积层的卷积核个数彼此相等;所述第六个细节结构中任意一个所述卷积层的卷积核个数是所述第五个细节结构中任意一个所述卷积层的卷积核个数的一半;并且,对于所述第五个细节结构和所述第六个细节结构,在反卷积层与批标准化层之间,还设置有用于将反卷积后的矩阵与所述第二个细节结构和所述第三个细节结构中间得到的大小相同的矩阵拼接的运算;
所述第七个细节结构依次包括一个卷积层和一个激活层。
8.如权利要求6所述系统,其特征在于,所述三维卷积神经网络模型包括六个细节结构,其中,
第一个细节结构为输入层,用于输入肺实质区域的最大外接立方体;
第二个细节结构和第三个细节结构均依次包括一层卷积层、一层Dropout层、一层卷积层、一层最大池化层与一层批标准化层;所述第三个细节结构中每一个所述卷积层的卷积核个数彼此相等,所述第二个细节结构中每一个所述卷积层的卷积核个数彼此相等;优选的,所述第三个细节结构中每一个所述卷积层的卷积核个数均为128,所述第二个细节结构中每一个所述卷积层的卷积核个数均为64;
第四个细节结构依次包括一个Dropout层和一个Flatten层;
第五个细节结构包括一个全连接层,其激活函数为relu;
第六个细节结构依次包括一个批标准层、一个激活层、一个Dropout层和一个输出全连接层。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110738375.8A CN113436727B (zh) | 2021-06-30 | 2021-06-30 | 基于病人检测信息对潜在治疗方案治愈概率打分的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110738375.8A CN113436727B (zh) | 2021-06-30 | 2021-06-30 | 基于病人检测信息对潜在治疗方案治愈概率打分的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113436727A true CN113436727A (zh) | 2021-09-24 |
CN113436727B CN113436727B (zh) | 2022-07-12 |
Family
ID=77758168
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110738375.8A Active CN113436727B (zh) | 2021-06-30 | 2021-06-30 | 基于病人检测信息对潜在治疗方案治愈概率打分的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113436727B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116386901A (zh) * | 2023-06-05 | 2023-07-04 | 南方医科大学南方医院 | 乙肝临床治愈预测模型构建方法及装置、预测方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108763872A (zh) * | 2018-04-25 | 2018-11-06 | 华中科技大学 | 一种分析预测癌症突变影响lir模体功能的方法 |
CN110880362A (zh) * | 2019-11-12 | 2020-03-13 | 南京航空航天大学 | 一种大规模医疗数据知识挖掘与治疗方案推荐系统 |
US20210015438A1 (en) * | 2019-07-16 | 2021-01-21 | Siemens Healthcare Gmbh | Deep learning for perfusion in medical imaging |
CN112349427A (zh) * | 2020-10-21 | 2021-02-09 | 上海中医药大学 | 一种基于舌象和深度残差卷积神经网络的糖尿病预测方法 |
CN112447304A (zh) * | 2020-11-25 | 2021-03-05 | 深圳市华嘉生物智能科技有限公司 | 判断传染疾病发展的视觉检测方法及装置 |
CN112990344A (zh) * | 2021-04-09 | 2021-06-18 | 重庆大学 | 一种肺结节多视图分类方法 |
-
2021
- 2021-06-30 CN CN202110738375.8A patent/CN113436727B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108763872A (zh) * | 2018-04-25 | 2018-11-06 | 华中科技大学 | 一种分析预测癌症突变影响lir模体功能的方法 |
US20210015438A1 (en) * | 2019-07-16 | 2021-01-21 | Siemens Healthcare Gmbh | Deep learning for perfusion in medical imaging |
CN110880362A (zh) * | 2019-11-12 | 2020-03-13 | 南京航空航天大学 | 一种大规模医疗数据知识挖掘与治疗方案推荐系统 |
CN112349427A (zh) * | 2020-10-21 | 2021-02-09 | 上海中医药大学 | 一种基于舌象和深度残差卷积神经网络的糖尿病预测方法 |
CN112447304A (zh) * | 2020-11-25 | 2021-03-05 | 深圳市华嘉生物智能科技有限公司 | 判断传染疾病发展的视觉检测方法及装置 |
CN112990344A (zh) * | 2021-04-09 | 2021-06-18 | 重庆大学 | 一种肺结节多视图分类方法 |
Non-Patent Citations (1)
Title |
---|
柏芸: "低剂量胸腔CT肺部影像的肺结节计算机辅助诊断方法研究", 《西南交通大学学报》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116386901A (zh) * | 2023-06-05 | 2023-07-04 | 南方医科大学南方医院 | 乙肝临床治愈预测模型构建方法及装置、预测方法及装置 |
CN116386901B (zh) * | 2023-06-05 | 2024-01-30 | 南方医科大学南方医院 | 乙肝临床治愈预测模型构建方法及装置、预测方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113436727B (zh) | 2022-07-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kumar et al. | Novel deep transfer learning model for COVID-19 patient detection using X-ray chest images | |
Long et al. | BloodCaps: A capsule network based model for the multiclassification of human peripheral blood cells | |
Yarnold et al. | Predicting in‐hospital mortality of patients with AIDS‐related Pneumocystis carinii pneumonia: an example of hierarchically optimal classification tree analysis | |
Huddar et al. | Predicting complications in critical care using heterogeneous clinical data | |
Strzelecki et al. | Machine learning for biomedical application | |
CN110136836A (zh) | 一种基于体检报告聚类分析的疾病预测方法 | |
Stoean et al. | Automated detection of presymptomatic conditions in Spinocerebellar Ataxia type 2 using Monte Carlo dropout and deep neural network techniques with electrooculogram signals | |
WO2022060948A1 (en) | Systems and methods for automatically notifying a caregiver that a patient requires medical intervention | |
CN111612278A (zh) | 生命状态预测方法、装置、电子设备及存储介质 | |
Lan et al. | Multi-view convolutional neural network with leader and long-tail particle swarm optimizer for enhancing heart disease and breast cancer detection | |
CN113436727B (zh) | 基于病人检测信息对潜在治疗方案治愈概率打分的方法 | |
Bostanci et al. | Machine learning analysis of RNA-seq data for diagnostic and prognostic prediction of colon cancer | |
Narayanan et al. | Leveraging machine learning methods for multiple disease prediction using Python ML libraries and flask API | |
Xu et al. | Diagnosis of Alzheimer’s disease based on the modified tresnet | |
Dillard et al. | Perceptions of the COVID-19 pandemic among women with infertility: correlations with dispositional optimism | |
Mirzajani | Prediction and diagnosis of diabetes by using data mining techniques | |
US20240136025A1 (en) | Compound function prediction method based on neural network and connectivity map algorithm | |
Chiang et al. | Deep learning-based automatic detection of ASPECTS in acute ischemic stroke: improving stroke assessment on CT scans | |
Govindan et al. | A Framework for Early Detection of Glaucoma in Retinal Fundus Images Using Deep Learning | |
Ma et al. | A mixed visual encoding model based on the larger-scale receptive field for human brain activity | |
Everitt | Numerical approaches to classification | |
Sarkar et al. | Artificial Intelligence and Machine Learning in Healthcare | |
Liuzzi et al. | Predicting SARS-CoV-2 infection duration at hospital admission: a deep learning solution | |
Nagovitsyn et al. | Artificial Intelligence Program for Predicting Wrestlers’ Sports Performances | |
Remaigui et al. | A New Deep Learning Architecture for Pneumonia Detection in Pediatrics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |