CN113160986A - 用于预测全身炎症反应综合征发展的模型构建方法及系统 - Google Patents

用于预测全身炎症反应综合征发展的模型构建方法及系统 Download PDF

Info

Publication number
CN113160986A
CN113160986A CN202110440787.3A CN202110440787A CN113160986A CN 113160986 A CN113160986 A CN 113160986A CN 202110440787 A CN202110440787 A CN 202110440787A CN 113160986 A CN113160986 A CN 113160986A
Authority
CN
China
Prior art keywords
data
model
factor
development
disease
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110440787.3A
Other languages
English (en)
Other versions
CN113160986B (zh
Inventor
刘小红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qiaoen Beijing Biotechnology Co ltd
Original Assignee
Qiaoen Beijing Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qiaoen Beijing Biotechnology Co ltd filed Critical Qiaoen Beijing Biotechnology Co ltd
Priority to CN202110440787.3A priority Critical patent/CN113160986B/zh
Publication of CN113160986A publication Critical patent/CN113160986A/zh
Application granted granted Critical
Publication of CN113160986B publication Critical patent/CN113160986B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • A61B5/7267Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7275Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Psychiatry (AREA)
  • Molecular Biology (AREA)
  • Physiology (AREA)
  • Primary Health Care (AREA)
  • Signal Processing (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Biophysics (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Evolutionary Computation (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明公布了一种全身炎症反应综合征的疾病发展预测分析方法及系统,包括:构建全身炎症反应综合征患者临床表征因子和病理生理因子全期时序数据集;基于深度学习方法,建立全身炎症反应综合征患者临床表征因子和病理生理因子与疾病预后发展阶段的关联关系模型;对预测模型进行持续迭代和优化,提高模型预测的准确性;并构建全身炎症反应综合征的疾病发展预测系统,实现对新增病例的预后发展评价,能够用于全身炎症反应综合征患者预后风险评估,为临床早期干预提供技术支撑,降低死亡率。本发明耦合了疾病发展过程中的关键病理生理因子,可用于其他炎性相关疾病的预后评价,以及炎性相关疾病的药物开发和药物评价。

Description

用于预测全身炎症反应综合征发展的模型构建方法及系统
技术领域
本发明涉及疾病发展风险预测模型构建分析技术与人工智能技术,尤其涉及一种用于预测全身炎症反应综合征发展的模型构建方法及系统。
背景技术
全身炎症反应综合征(systemic inflammatory response syndrome,SIRS)是由感染或非感染因素引起的一种过度的全身性炎症反应,过度的炎症因子继而转向攻击自身的组织和细胞,从而导致多器官功能衰竭。全身炎症反应综合征的发展变化迅速,目前对于全身炎症反应综合征重症患者的治疗手段却相对有限,是造成该疾病死亡率居高不下的一个重要原因。因此,建立一种有效的疾病预后分析预测模型及系统,为疾病预后发展提供精确评价辅助,对于降低该病死亡率有着十分重要的意义。
现有对SIRS发展预测分析主要采用NEWS、QSOF、SIRS等评分标准进行,而这些评分所使用的数据主要是体温、呼吸频率、心率、血压、意识状态、氧饱和度等一些表层数据,缺乏对病理生理因子的充分考虑,难以实现对SIRS疾病发展的精准预测。存在这一问题的原因主要有两点:其一是临床表征因子数据所提供的信息有限,在没有病理生理因子数据支撑的情况下,很难对疾病预后进行准确判断;其二,临床表征因子和病理生理因子众多且组合关系复杂,其复杂度已经远远超出医务人员个人经验和人工分析能力。总之,在缺乏作为主导疾病发生、发展与转归的病理生理因子支撑下,单一依靠表征因子的传统疾病发展预测方法,难以实现对疾病发展的精准预测。利用大数据、人工智能等信息前沿技术,将疾病的临床表征因子与病理生理因子进行耦合并开展深度分析,能够提高该疾病预后判断的精准度,进而降低死亡率。
发明内容
本发明的目的在于,基于SIRS的发病机制和治疗方法,利用临床中所采集的临床表征因子和病理生理因子数据,综合分子生物学、免疫学、细胞生物学、基因组学、蛋白组学、临床医学等学科知识和方法进行协同应用,并通过大数据、人工智能等前沿信息技术,分析复杂的海量数据,挖掘疾病发生发展和转归中的重要信息,建立一种基于临床因子和病理生理因子综合作用下用于预测SIRS病情发展的分析模型新方法,同时建立一套能够用于实际使用的系统。
本发明提供一种用于预测全身炎症反应综合征发展的分析模型构建方法及系统,包括以下部分:构建全身炎症反应综合征患者临床表征因子和病理生理因子全期时序数据集;基于深度学习方法,建立全身炎症反应综合征患者临床表征因子和病理生理因子与疾病预后发展阶段的关联关系模型;集成全期时序数据集和关联关系模型,构建全身炎症反应综合征的疾病发展预测系统,实现对新增病例的预后发展评价,同时将新增病例补充到数据集中,对预测模型进行持续迭代和优化,提高模型预测的准确性。
本发明提出的全身炎症反应综合征患者临床表征因子和病理生理因子全期时序数据集,包括临床表征因子数据集和病理生理调节因子数据集。临床表征数据集包括但不局限于病因、年龄、性别、家族史、症状、体征、体格、疾病发展阶段。病理生理因子数据集包括但不局限于实验室检测、生物学检测、细胞学检测、病原学检测、基因检测等多种条件下检测的结果数据。数据集的时序性主要体现在两个方面。其一是针对单一患者,数据集中包括其在疾病发展各个阶段的数据,比如该患者在败血症综合征、早期败血症休克、难治性败血症休克等阶段的临床表征因子数据集和病理生理因子数据集。其二是将全部的数据集根据疾病发展的7个阶段,进行分阶段标识,每个阶段包含不同的患者,实现全数据集的时序划分。需要说明的是,对于单个患者,其数据可以是某个阶段的一条记录,也可以是多个阶段的多条记录,其记录的多少并不做严格的要求。数据集的构建还包括数据的预处理,以及对数据集进行划分并形成后续模型构建所需要的训练数据集和测试数据集。此处的数据预处理包括数据清理、数据集成、数据变换等。数据清理主要完成对不完整记录的人工或自动补全,将存在明显信息错误的噪声记录进行滤除等,确保每一条数据的完整性和合理性。其中的人工补全是指依靠人工的方法,通过病例对照,完成对记录中的缺失项进行填补;自动补全是针对某一患者的缺失信息记录,从该患者的已有记录中,通过直接拷贝、插值等方法完成对所缺项的填补。数据集成主要通过维度规约和变换,完成对分布在多个单位或部门数据集的综合与集成,形成完整、统一的集中存储数据库甚至数据仓库。数据变换主要完成对数据的规范化化处理、离散化处理、稀疏化处理等。通过数据预处理,形成干净完整、一致性好的临床表征因子数据集和病理生理因子数据集,同时形成用于模型构建的训练数据集和测试数据集。
本发明提出的全身炎症反应综合征患者临床表征因子和病理生理因子与疾病预后发展阶段的关联关系模型,主要包括以下内容。关联关系模型分为整体预测模型和单病例预测模型。基于预处理之后得到的数据,按照3:1的比例分为模型训练数据集和模型测试数据集。模型训练数据集用于训练关联关系模型,模型测试数据集用于测试训练生成的关联关系模型。预处理得到模型训练数据集包含的临床表征因子矩阵和生理病理因子矩阵,作为整体训练预测的输入矩阵。模型输出矩阵为疾病预后发展的痊愈、全身感染或脓毒症、败血症综合征、早期败血症休克、难治性败血症休克、MODS发生肝肾脑等器官功能障碍中的任一组合、死亡等7种状态的预测值。整体预测模型利用密集连接卷积神经网络提取临床表征因子和生理病理因子的特征值,多层感知机拼接计算临床表征因子和生理病理因子的特征值,得到疾病预后发展状态预测值。采用随机梯度下降法,计算疾病预后发展状态预测值与真实值之间的平均损失,调整密集连接卷积神经网络和多层感知机的参数,迭代训练模型使的平均损失值趋近稳定。根据整体预测模型的预测值和阈值的比较判断是否使用单病例预测模型。单病例预测模型步骤与整体预测步骤相同,不同之处在于得到的预测值是单个病例的预测值而不是7种疾病预后的预测值。若不使用单病例预测模型,则使用整体预测模型,否则整体预测模型和单病例预测模型一起作用,作为全身炎症反应综合征患者临床表征因子和病理生理因子与疾病预后发展阶段的关联关系模型。之后使用测试数据对关联关系模型进行验证测试。
具体实施时,本发明实现的全身炎症反应综合征的疾病发展预测系统主要包括数据输入模块、数据存储与管理模块、数据预处理模块、模型集成与训练模块以及结果可视化与输出模块。
与现有技术相比,本发明的有益效果:
本发明提供一种用于预测全身炎症反应综合征发展的分析模型构建方法及系统,具体内容包含以下几部分:构建全身炎症反应综合征患者临床表征、病理生理因子表达等数据库;建立全身炎症反应综合征患者临床表征因子和病理生理因子关联关系,以及用于预测全身炎症反应综合征发展的分析模型;构建全身炎症反应综合征的疾病发展预测系统,用于对患者进行疾病状态评估和后期发展预测。该发明能够为从病理生理学角度为全身炎症反应综合征患者临床早期干预提供技术支撑,提高诊疗精准性,降低死亡率。同时,该系统是基于炎症发生发展机理中的重要环节而建立的,由其建立的生物学关系也是独立的,其独立性决定了它也能够为其它炎症相关性疾病提供评价,为相关药物的开发和评价提供技术平台。
本发明针对SIRS精准的预后判断与治疗问题,提出一种基于临床表征因子和病理调节因子群体耦合作用下用于预测SIRS的分析模型构建方法,同时建立SIRS患者诊疗与预测系统。本发明将实验室检测、生物学检测、细胞学检测、病原学检测、基因检测指标的功能与SIRS患者的临床诊疗资料结合起来,通过数据分析、模型计算等过程,发现临床表征因子与病理生理因子间多对多关联关系,挖掘病例发展趋势,基于此建立一种SIRS疾病发展的预测系统。该发明有望能够在全身炎症反应综合征早期阶段对该病的发展趋势做出准确预测,为其治疗提出精细化的指导方案。同时,该发明也可为相关药物开发和筛选提供重要技术支撑,也为其它炎症相关疾病的诊疗提供技术指导。
附图说明
图1为本发明构建的数据库与数据预处理方法的流程框图。
图2为本发明构建的全身炎症反应综合征患者预测模型方法的流程框图。
图3为本发明构建的全身炎症反应综合征患者预测系统的结构框图。
图4为本发明构建的全身炎症反应综合征患者预测系统的模型及数据集。
具体实施方式
下面结合附图,通过实施例进一步描述本发明,但不以任何方式限制本发明的范围。
本发明提出一种用于预测全身炎症反应综合征发展的分析模型构建方法及系统。系统主要包括数据输入模块、数据存储与管理模块、数据预处理模块、模型集成与训练模块以及结果可视化与输出模块。数据输入模块,实现对临床表征因子和病理生理因子的数据进行录入,录入的方式可以是自动或手动。数据存储与管理模块,用于存储和管理基础数据、中间数据和结果数据。其中基础数据为临床表征因子和病理生理因子等原始数据,中间数据为临床表征因子和病理生理因子特征值、模型过程参数等,结果数据为模型最终参数、病例推理结果等。数据管理包括对数据的导入/导出、备份/恢复、添加/删除、更新、查询等。数据预处理模块,用于对临床表征因子和病理生理因子的数据集进行噪声滤除、数值转换、归一化处理等,进而得到临床表征因子矩阵、病理生理因子矩阵、辅助矩阵,以及训练数据集、测试数据集等。模型集成与训练模块,用于集成密集连接卷积神经网络模型、多层感知机模型、随机梯度下降算法和损失函数等,输入临床表征因子矩阵、病理生理因子矩阵、辅助矩阵,输出疾病预后发展阶段矩阵,得到疾病发展初步预测模型,调节超参数,使平均损失最小,得到最终训练模型。疾病发展阶段预测模块,用于对新增病例进行预后状态评价,给出评价结果。同时,将新增病例通过数据输入模块补充到数据集中,用于对预测模型进行持续迭代和优化,提高模型预测的准确性。结果可视化与输出模块,用于对基础数据、中间数据和结果数据进行可视化分析与处理,以及模型计算、参数调整、结果输出进行可视化,同时通过文本、图表、图形等形式对结果进行输出。
本发明的实施可以分为5个阶段,分别是数据库构建阶段、数据预处理阶段、模型构建阶段、系统建立阶段、系统应用与模型优化阶段。
数据库构建阶段,可以参照图1实施。具体步骤包括获取患者病例源、数据提取、临床表征数据库和病理生理数据库构建、数据分装等4步。全身炎症反应综合征患者病例来源包括但不局限于:新型冠状病毒(COVID-19)、流感病毒、MERS病毒、人类间质性肺炎病毒等原始临床记录结数据,其数据内容、格式无特殊性要求。数据提取是通过数据字段匹配、格式转换、数据填充等相关方法,从原始病例数据中,按照本发明所需要的病例数据结构,形成临床表征因子记录和病理生理因子记录。临床表征数据库和病理生理数据库构建,首先是根据临床表征因子和病理生理因子所需要关注的要素,确定数据表及表中每个字段的类型、约束等,而后建立表与表之间的关系,建立数据库的存储、备份、查询、数据一致性约束等操作,最后把提取出的临床表征因子和病理生理因子数据存入相应数据库中。数据分装则是根据数据集的时序性需要,将临床表征数据库和病理生理数据库中的集中存储的数据,按照单个病理时序要求以及多病例阶段发展情况,将数据进行分拆和重新组装。针对单病例时序数据,则根据病例的ID号,将与此ID号相关的所有数据进行提取,形成单病例时序数据集。多病例阶段数据集建立,是根据痊愈、全身感染或脓毒症、败血症综合征、早期败血症休克、难治性败血症休克、MODS发生肝肾脑等器官功能障碍中的任一组合、死亡等7个阶段,从数据库中分别提取处于相应阶段的数据记录,组合形成阶段数据集。
数据预处理阶段,可以参照图1实施。针对单病例时序数据集和多病例阶段数据集中存在的噪声、不一致性等问题,进行数据预处理。预处理包括数据清理、数据集成、数据变换等。数据清理主要完成对不完整记录的人工或自动补全,将存在明显信息错误的噪声记录进行滤除等,确保每一条数据的完整性和合理性。其中的人工补全是指依靠人工的方法,通过病例对照,完成对记录中的缺失项进行填补;自动补全是针对某一患者的缺失信息记录,从该患者的已有记录中,通过直接拷贝、插值等方法完成对所缺项的填补。数据集成主要通过维度规约和变换,完成对分布在多个单位或部门数据集的综合与集成,形成完整、统一的集中存储数据库甚至数据仓库。数据变换主要完成对数据的规范化化处理、离散化处理、稀疏化处理等。通过数据预处理,形成干净完整、一致性好的临床表征因子数据集和病理生理因子数据集,同时形成用于模型构建的训练数据集和测试数据集。
对预处理得到的临床表征因子数据,按照疾病病重表现程度和临床表征的特征将临床表征因子数据编码为二维矩阵,并将其分为临床表征因子训练数据集和临床表征因子测试数据集;对预处理得到病理生理因子数据,按照疾病病重表现程度和病理生理的特征将病理生理因子数据编码为二维矩阵,并将其分为病理生理因子训练数据集和病理生理因子测试数据集。使用密集卷积神经网络和多层感知机对数据进行训练可以根据输入矩阵,预测不同的疾病预后状态,多层感知机最终的输出为一个0到1之间的数值,表示对输入的临床表征因子和病理生理因子的疾病状态预测值。收集病人对应的疾病的7种后续状态(痊愈、全身感染或脓毒症、败血症综合征、早期败血症休克、难治性败血症休克、MODS发生肝肾脑等器官功能障碍中的任一组合、死亡),将其按照状态严重程度编码为0到1之间的数值,0代表后续完全健康的状态,1代表后续死亡的状态。做0-1数值处理之后的7种后续状态作为模型训练的标签。
将临床表征因子矩阵和病理生理因子矩阵分别连接到两个密集连接卷积神经网络的输入端,进行卷积特征提取。然后通过多层感知机预测疾病的状态值。循环执行以下步骤,直至模型收敛并且预测准确率达到最优,保存模型及模型的参数。
(1)使用密集卷积神经网络对临床表征因子和病理生理因子的输入数据进行卷积和特征提取。其中,密集卷积神经网络的每一层输入数据为原始输入数据和之前所有层的输出数据的拼接。第i层的输出表达式为:xi=Hi([input,x1,x2...,xi-2,xi-1])。xi表示密集卷积神经网络的第i层的卷积输出,代表对前i-1层的输出以及原始数据的拼接,Hi表示对拼接后的归一化,非线性化处理以及卷积计算。
(2)将临床表征因子矩阵连接的密集卷积神经网络的输出和病理生理因子矩阵连接的密集卷积神经网络的输出,作为多层感知机的输入,计算当前的疾病预测状态值yi p进而计算预测状态值和实际疾病的状态值的最小误差值:
Figure BDA0003034980150000061
n是训练数据集样本的个数,yi是收集到的实际病例的疾病状态值,yi p是多层感知机预测的疾病状态值。
(3)根据反向传播公式,使用策略梯度算法更新密集卷积神经网络和多层感知机,直到最小误差值收敛并且达到最小值。
反向传播更新感知机的公式:
Figure BDA0003034980150000062
y是多层感知机的输出,li是多层感知机第i层的输出,Wi是第i层的权值矩阵,αi是第i层的学习率。
反向传播更新密集连接卷积神经网络的公式:
Figure BDA0003034980150000071
L代表密集卷积神经网络的输出,li代表密集卷积神经网络的第i层输出,convi代表密集卷积神经网络的第i层输入,oi代表li经过归一化和非线性之后的输出结果,Wi是第i层的权值矩阵,αi是第i层的学习率。
测试单元,将测试数据集的临床表征因子矩阵和病理生理因子矩阵输入模型的输入端,得到模型输出的预测疾病严重值,预测值和测试数据的真实值做差,差值在预计范围内,说明模型可靠,否则扩大数据集重新训练。
在全身炎症反应综合征的疾病发展预测系统建立阶段,需要建立数据输入模块、数据存储与管理模块、疾病发展阶段预测模块、模型集成与训练模块、病例预测模块以及结果可视化与输出模块。数据输入模块,通过条形码扫描、二维码扫描、键盘鼠标等外设,对临床表征因子和病理生理因子的数据提取与录入。同时,数据输入模块集成数据导入功能,对历史数据进行的批量转化和导入。数据存储与管理模块,通过集成的数据库平台,存储和管理基础数据、中间数据和结果数据,用于系统运行全周期所有数据的存储与管理。其中基础数据为原始病例数据、临床表征数据库、病理生理数据库、单病例时序数据集、多病例阶段数据集等;中间数据为临床表征因子和病理生理因子特征值、模型过程参数、临床表征因子数据集、病例生理因子数据集,以及用于预测模型建立的训练数据集和测试数据集;结果数据为模型最终参数、病例推理结果等。数据管理包括对数据的导入/导出、备份/恢复、添加/删除、更新、查询等。数据预处理模块,对单病例时序数据集和多病例阶段数据集进行集成、清理、变换,通过集成维归约算法和数据变化算法实现成对数据的集成,通过集成数据补全和噪声数据滤除算法实现对数据的清理,通过集成规范化处理、离散化处理、稀疏化处理等算法实现对数据的变换。数据变换完成后,首先形成临床表征因子数据集和病理生理因子数据集,在此基础上将数据进行划分并形成用于后续模型构建需要的训练数据集和测试数据集。模型集成与训练模块,集成密集连接卷积神经网络模型、多层感知机模型、随机梯度下降算法和多种损失函数,将临床表征因子矩阵、病理生理因子矩阵、辅助矩阵作为输入,输出疾病预后发展阶段矩阵,首先得到疾病发展初步预测模型。针对初步预测模型,选择损失函数,调节超参数;当平均损失最小时,所对应的参数作为最终的训练结果模型参数,此时得到最终训练模型。疾病发展阶段预测模块的运行,是基于最终训练完成的疾病发展预测模型。本模块将输入的新到病例作为输入,通过模型运算,得到对新增病例进行预后状态评价,给出评价结果。病例预测完成后,将新增病例通过数据输入模块补充到数据库和数据集中,成为历史病例,用于对预测模型进行持续迭代和优化,提高模型预测的准确性。结果可视化与输出模块,集成文本、图表、图形等各种可视化表达方法,对基础数据、中间数据、结果数据,以及模型构建相关的模型计算、参数调整、计算过程分析等进行可视化与输出,输出的结果可以是计算机屏幕、打印设备、投影显示设备、虚拟现实设备等。
系统应用与模型优化阶段,主要基于本发明构建的预测系统,完成对新增病例的状态分析和疾病发展预测,同时随着病例的不断扩增,对疾病发展阶段预测模型进行的迭代,实现对模型的持续优化。具体实施过程如下。第一步,在医院和医疗检测机构等相关单位布设本系统,接入云端病例数据服务或导入已经处理完毕的历史大样本数据到本地数据库,对系统进行调试,利用集成的测试数据集对模型进行测试,确保系统预测功能处于完好状态。第二步,新患者接诊,通过临床诊断获取其临床表征数据,同时确定其属于所处疾病发展的阶段,并将以上结果输入系统。第三步,获取患者的生物样本,对患者进行生物检测,获取患者的病理生理数据,并将结果输入系统。第四步,运行病例预测模块,对患者的疾病发展阶段进行评估,并将结果输出。第五步,将该患者的数据追加到系统数据库中,同时启动模型优化程序,完成对模型的优化,而后等待下一位患者。通过以上步骤的循环,实现对数据库的扩充,持续对疾病发展预测模型进行迭代优化,提高预测的准确性和系统的应用价值。
需要注意的是,公布实施例的目的在于帮助进一步理解本发明,但是本领域的技术人员可以理解:在不脱离本发明及所附权利要求的范围内,各种替换和修改都是可能的。因此,本发明不应局限于实施例所公开的内容,本发明要求保护的范围以权利要求书界定的范围为准。

Claims (9)

1.一种用于预测全身炎症反应综合征发展的分析模型构建方法,包括以下步骤:
S1.构建全身炎症反应综合征患者临床表征因子和病理生理因子全期时序数据集;
全期时序数据集包括全期时序性临床表征数据集、全期时序性病理生理因子数据集;
数据集构建过程包括采用数据预处理方法,并形成临床表征因子矩阵和生理病理矩阵,以及构建模型所需的训练数据集和测试数据集;
S2.基于深度学习方法,建立全身炎症反应综合征患者临床表征因子和病理生理因子与疾病预后发展阶段的关联关系模型;包括如下步骤:
S21输入矩阵包括临床表征因子矩阵和病理生理因子矩阵,输出矩阵为疾病预后发展状态矩阵;
S22利用密集连接卷积神经网络提取临床表征因子、病理生理因子、疾病预后发展状态特征值;
S23利用多层感知机拼合临床表征因子和病理生理因子的特征值,推理得到疾病预后发展状态值;
S24采用随机梯度下降法计算疾病预后发展状态推理值与真实值之间的平均损失,调整密集连接卷积神经网络和多层感知机的参数,使得平均损失最小;
S3.集成全期时序数据集和关联关系模型,构建全身炎症反应综合征的疾病发展预测系统,实现对新增病例的预后发展评价,同时将新增病例补充到数据集中,对预测模型进行持续迭代和优化,提高模型预测的准确性。
2.如权利要求1所述用于预测全身炎症反应综合征发展的分析模型构建方法,其特征是:
全期时序性临床表征数据集包括各种病因、各种发展阶段、个体不同治疗方案下的全身炎症反应综合征患者性别、年龄、现病史、既往史、家族史、个人史、症状、体征、体格检查信息的一般临床病历资料;
全期时序性病理生理因子数据集包括各种病因、各种发展阶段、个体不同治疗方案下的全身炎症反应综合征患者一般实验室检测、生物学检测、细胞学检测、病原学检测、基因检测结果数据;
数据集构建过程的预处理方法包括数据清理、数据集成、数据规约、数据变换方法。
3.如权利要求1所述用于预测全身炎症反应综合征发展的分析模型构建方法,其特征是,步骤S2中:
疾病预后发展状态包括痊愈、全身感染或脓毒症、败血症综合征、早期败血症休克、难治性败血症休克、MODS发生肝肾脑等器官功能障碍中的任一组合或死亡。
4.如权利要求1所述用于预测全身炎症反应综合征发展的分析模型构建方法,其特征是,具体包括数据库构建阶段、数据预处理阶段、模型构建阶段、系统建立阶段、系统应用与模型优化阶段。
5.如权利要求4所述用于预测全身炎症反应综合征发展的分析模型构建方法,其特征是,数据库构建阶段具体步骤包括获取患者病例源、数据提取、临床表征数据库和病理生理数据库构建、数据分装;
全身炎症反应综合征患者病例源包括:新型冠状病毒COVID-19、流感病毒、MERS病毒、人类间质性肺炎病毒临床记录结果数据;
数据提取具体通过数据字段匹配、格式转换、数据填充方法,根据原始数据形成临床表征因子记录和病理生理因子记录;
临床表征数据库和病理生理数据库构建:首先根据临床表征因子和病理生理因子确定数据表及表中每个字段的类型及约束,而后建立表与表之间的关系,建立数据库的存储、备份、查询、数据一致性约束操作,最后把提取出的临床表征因子和病理生理因子数据存入相应数据库中;
数据分装具体根据数据集的时序性,将临床表征数据库和病理生理数据库中的集中存储的数据,按照单个病理时序要求以及多病例阶段发展情况,将数据进行分拆和重新组装。
6.如权利要求4所述用于预测全身炎症反应综合征发展的分析模型构建方法,其特征是,对预处理阶段得到的临床表征因子数据,按照疾病病重表现程度和临床表征的特征将临床表征因子数据编码为二维矩阵,并将其分为临床表征因子训练数据集和临床表征因子测试数据集;对预处理阶段得到病理生理因子数据,按照疾病病重表现程度和病理生理的特征将病理生理因子数据编码为二维矩阵,并将其分为病理生理因子训练数据集和病理生理因子测试数据集。
7.如权利要求6所述用于预测全身炎症反应综合征发展的分析模型构建方法,其特征是,使用密集卷积神经网络和多层感知机对数据进行训练,具体根据输入矩阵预测不同的疾病预后状态,多层感知机的输出为一个0到1之间的数值,表示对输入的临床表征因子和病理生理因子的疾病状态预测值;收集病人对应的疾病后续状态,按照状态严重程度编码为0到1之间的数值,0代表后续完全健康的状态,1代表后续死亡的状态;将进行0-1数值处理之后的后续状态作为模型训练的标签。
8.如权利要求1所述用于预测全身炎症反应综合征发展的分析模型构建方法,其特征是,将临床表征因子矩阵和病理生理因子矩阵分别连接到两个密集连接卷积神经网络的输入端,进行卷积特征提取;然后通过多层感知机预测疾病的状态值;循环执行以下步骤,直至模型收敛并且预测准确率达到最优,保存模型及模型的参数:
1)使用密集卷积神经网络对临床表征因子和病理生理因子的输入数据进行卷积和特征提取;其中,密集卷积神经网络的每一层输入数据为原始输入数据和之前所有层的输出数据的拼接;第i层的输出表达式为:xi=Hi([input,x1,x2...,xi-2,xi-1]);xi表示密集卷积神经网络的第i层的卷积输出,代表对前i-1层的输出以及原始数据的拼接,Hi表示对拼接后的归一化,非线性化处理以及卷积计算;
2)将临床表征因子矩阵连接的密集卷积神经网络的输出和病理生理因子矩阵连接的密集卷积神经网络的输出作为多层感知机的输入,计算当前的疾病预测状态值yi p进而计算预测状态值和实际疾病的状态值的最小误差值:
Figure FDA0003034980140000031
n是训练数据集样本的个数,yi是收集到的实际病例的疾病状态值,yi p是多层感知机预测的疾病状态值;
3)使用反向传播和策略梯度算法更新密集卷积神经网络和多层感知机,直到最小误差值收敛并且达到最小值。
9.利用权利要求1~8所述用于预测全身炎症反应综合征发展的分析模型构建方法实现的全身炎症反应综合征的疾病发展预测分析系统,其特征在于,包括如下模块:
S31数据输入模块,用于通过自动或手动方法完成对临床表征因子和病理生理因子的数据进行录入;
S32数据存储与管理模块,用于存储和管理基础数据、中间数据和结果数据;其中基础数据为临床表征因子和病理生理因子原始数据,中间数据为临床表征因子和病理生理因子特征值、模型过程参数,结果数据为模型最终参数、病例推理结果;
S33数据预处理模块,用于对临床表征因子和病理生理因子的数据集进行数据清理、数据集成、数据变换,进而得到临床表征因子矩阵、病理生理因子矩阵、辅助矩阵,以及训练数据集、测试数据集;
S34模型集成与训练模块,用于集成密集连接卷积神经网络模型、多层感知机模型、随机梯度下降算法和损失函数,输入临床表征因子矩阵、病理生理因子矩阵、辅助矩阵,输出疾病预后发展阶段矩阵,得到疾病发展初步预测模型,调节超参数,使平均损失最小,得到最终训练模型;
S35疾病发展阶段预测模块,用于对新增病例进行预后状态评价,给出评价结果;同时将新增病例通过数据输入模块补充到数据集中,用于对预测模型进行持续迭代和优化,提高模型预测的准确性;
S36结果可视化与输出,用于对基础数据、中间数据和结果数据进行可视化分析与处理,以及模型计算、参数调整、结果输出进行可视化,同时对结果进行输出。
CN202110440787.3A 2021-04-23 2021-04-23 用于预测全身炎症反应综合征发展的模型构建方法及系统 Active CN113160986B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110440787.3A CN113160986B (zh) 2021-04-23 2021-04-23 用于预测全身炎症反应综合征发展的模型构建方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110440787.3A CN113160986B (zh) 2021-04-23 2021-04-23 用于预测全身炎症反应综合征发展的模型构建方法及系统

Publications (2)

Publication Number Publication Date
CN113160986A true CN113160986A (zh) 2021-07-23
CN113160986B CN113160986B (zh) 2023-12-15

Family

ID=76870069

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110440787.3A Active CN113160986B (zh) 2021-04-23 2021-04-23 用于预测全身炎症反应综合征发展的模型构建方法及系统

Country Status (1)

Country Link
CN (1) CN113160986B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113707295A (zh) * 2021-08-24 2021-11-26 中山大学附属第三医院(中山大学肝脏病医院) 老年人术后全身炎症反应综合征的预测方法及系统
CN115576278A (zh) * 2022-09-30 2023-01-06 常州大学 基于时态均衡分析的多智能体多任务分层连续控制方法
WO2024016407A1 (zh) * 2022-07-21 2024-01-25 上海交通大学 一种基于异质性的细胞代谢网络建模方法及其应用

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102472756A (zh) * 2009-07-31 2012-05-23 百奥科瑞茨生命科学公司 用于预测与炎症相关的器官衰竭发作的可能性的方法
CN104662173A (zh) * 2012-07-26 2015-05-27 加利福尼亚大学董事会 自闭症和其它发育障碍的筛查、诊断和预后
CN105766793A (zh) * 2016-03-16 2016-07-20 中山大学 一种家畜开放核心群的构建方法
CN110755045A (zh) * 2019-10-30 2020-02-07 湖南财政经济学院 一种皮肤病综合数据分析诊断辅助系统及信息处理方法
CN110827993A (zh) * 2019-11-21 2020-02-21 北京航空航天大学 基于集成学习的早期死亡风险评估模型建立方法及装置
CN110957036A (zh) * 2019-10-24 2020-04-03 中国人民解放军总医院 一种基于因果推理构建的疾病预后风险评估模型的方法
CN111292853A (zh) * 2020-01-15 2020-06-16 长春理工大学 基于多参数的心血管疾病风险预测网络模型及其构建方法
CN111951975A (zh) * 2020-08-19 2020-11-17 哈尔滨工业大学 一种基于深度学习模型gpt-2的脓毒症早期预警方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102472756A (zh) * 2009-07-31 2012-05-23 百奥科瑞茨生命科学公司 用于预测与炎症相关的器官衰竭发作的可能性的方法
US20120202240A1 (en) * 2009-07-31 2012-08-09 Biocrates Life Sciences Ag Method for Predicting the likelihood of an Onset of an Inflammation Associated Organ Failure
CN104662173A (zh) * 2012-07-26 2015-05-27 加利福尼亚大学董事会 自闭症和其它发育障碍的筛查、诊断和预后
CN105766793A (zh) * 2016-03-16 2016-07-20 中山大学 一种家畜开放核心群的构建方法
CN110957036A (zh) * 2019-10-24 2020-04-03 中国人民解放军总医院 一种基于因果推理构建的疾病预后风险评估模型的方法
CN110755045A (zh) * 2019-10-30 2020-02-07 湖南财政经济学院 一种皮肤病综合数据分析诊断辅助系统及信息处理方法
CN110827993A (zh) * 2019-11-21 2020-02-21 北京航空航天大学 基于集成学习的早期死亡风险评估模型建立方法及装置
CN111292853A (zh) * 2020-01-15 2020-06-16 长春理工大学 基于多参数的心血管疾病风险预测网络模型及其构建方法
CN111951975A (zh) * 2020-08-19 2020-11-17 哈尔滨工业大学 一种基于深度学习模型gpt-2的脓毒症早期预警方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
周新泽;郝磊;毛勤生;: "从全身炎症反应综合征角度评判急性胰腺炎预后及其临床价值", 中国现代医学杂志, no. 04 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113707295A (zh) * 2021-08-24 2021-11-26 中山大学附属第三医院(中山大学肝脏病医院) 老年人术后全身炎症反应综合征的预测方法及系统
WO2024016407A1 (zh) * 2022-07-21 2024-01-25 上海交通大学 一种基于异质性的细胞代谢网络建模方法及其应用
CN115576278A (zh) * 2022-09-30 2023-01-06 常州大学 基于时态均衡分析的多智能体多任务分层连续控制方法
CN115576278B (zh) * 2022-09-30 2023-08-04 常州大学 基于时态均衡分析的多智能体多任务分层连续控制方法

Also Published As

Publication number Publication date
CN113160986B (zh) 2023-12-15

Similar Documents

Publication Publication Date Title
CN113160986B (zh) 用于预测全身炎症反应综合征发展的模型构建方法及系统
CN111951975B (zh) 一种基于深度学习模型gpt-2的脓毒症早期预警方法
CN111261282A (zh) 一种基于机器学习的脓毒症早期预测方法
CN113421652A (zh) 对医疗数据进行分析的方法、训练模型的方法及分析仪
CN104572583B (zh) 用于数据致密化的方法和系统
CN110246577B (zh) 一种基于人工智能辅助妊娠期糖尿病遗传风险预测的方法
CN112967803A (zh) 基于集成模型的急诊患者早期死亡率预测方法及系统
CN117253614A (zh) 基于大数据分析的糖尿病风险预警方法
CN113270192A (zh) 基于动静态数据结合与深度自编码器的血透风险预测系统
CN114023441A (zh) 基于可解释机器学习模型的严重aki早期风险评估模型、装置及其开发方法
CN111312401A (zh) 一种基于多标签学习的体检后慢性疾病预后系统
Pavithra et al. Hybrid feature selection technique for prediction of cardiovascular diseases
CN109360658A (zh) 一种基于词向量模型的疾病模式挖掘方法及装置
CN113936801A (zh) 基于机器学习融合的全麻有创收缩压预测方法与系统
CN114783603A (zh) 基于多源图神经网络融合的患病风险预测方法及系统
CN116246773A (zh) 一种知识和数据结合的辅助诊疗模型
CN112542242A (zh) 数据转换/症状评分
CN115862850A (zh) 基于纵向多维数据的肝细胞癌监测模型的建模方法及装置
CN115116612A (zh) 一种儿童患者病情智能风险评估系统及方法
CN116959715B (zh) 一种基于时序演进过程解释的疾病预后预测系统
CN117038096A (zh) 一种基于低资源医疗数据与知识挖掘的慢性疾病预测方法
CN116564553A (zh) 一种基于共病特征的用药效果预测方法
CN116313080A (zh) 一种基于迁移学习的葡萄糖浓度预测方法及设备
CN115719625A (zh) 融合知识图谱和深度学习的糖尿病预测方法及系统
CN113990502A (zh) 一种基于异构图神经网络的icu心衰预测系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant