CN117554628A - 用于mods早期预警的炎症因子组合物、模型及试剂盒 - Google Patents

用于mods早期预警的炎症因子组合物、模型及试剂盒 Download PDF

Info

Publication number
CN117554628A
CN117554628A CN202410041130.3A CN202410041130A CN117554628A CN 117554628 A CN117554628 A CN 117554628A CN 202410041130 A CN202410041130 A CN 202410041130A CN 117554628 A CN117554628 A CN 117554628A
Authority
CN
China
Prior art keywords
mods
cytokines
model
cytokine
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202410041130.3A
Other languages
English (en)
Other versions
CN117554628B (zh
Inventor
常盼盼
李睿
王天兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University Peoples Hospital
Original Assignee
Peking University Peoples Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University Peoples Hospital filed Critical Peking University Peoples Hospital
Priority to CN202410041130.3A priority Critical patent/CN117554628B/zh
Publication of CN117554628A publication Critical patent/CN117554628A/zh
Application granted granted Critical
Publication of CN117554628B publication Critical patent/CN117554628B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6863Cytokines, i.e. immune system proteins modifying a biological response such as cell growth proliferation or differentiation, e.g. TNF, CNF, GM-CSF, lymphotoxin, MIF or their receptors
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6863Cytokines, i.e. immune system proteins modifying a biological response such as cell growth proliferation or differentiation, e.g. TNF, CNF, GM-CSF, lymphotoxin, MIF or their receptors
    • G01N33/6866Interferon
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6863Cytokines, i.e. immune system proteins modifying a biological response such as cell growth proliferation or differentiation, e.g. TNF, CNF, GM-CSF, lymphotoxin, MIF or their receptors
    • G01N33/6869Interleukin
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/60Complex ways of combining multiple protein biomarkers for diagnosis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/70Mechanisms involved in disease identification
    • G01N2800/7095Inflammation

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Cell Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • General Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • Food Science & Technology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Physiology (AREA)
  • Biophysics (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本申请提供的用于MODS早期预警的炎症因子组合物、模型及试剂盒,其中,炎症因子组合物包括:IL_6、IL_8、IFN_gama、sTNF_RII、BLC、IL_1RA,能够精准快速预测严重创伤早期由炎症因子风暴导致的MODS,有助于提高严重创伤的救治成功率。

Description

用于MODS早期预警的炎症因子组合物、模型及试剂盒
技术领域
本申请涉及MODS发生风险评估技术领域,尤其涉及一种用于MODS早期预警的炎症因子组合物、模型及试剂盒。
背景技术
创伤是全球性的公共健康问题,随着医疗水平的进步,创伤后出血导致的死亡率已大大降低。然而,止血后创伤带来的继发损伤并未停止。严重创伤导致的全身炎症反应(Systemic inflammatory response syndrome,SIRS)及多器官功能障碍综合征(multipleorgan dysfunction syndrome,MODS)的继发损伤成为此类患者预后不良、治疗效果不佳的主要原因,约占创伤总死亡率的三分之二,但目前临床上尚无有效的MODS发生的标志物及风险评估策略。
发明内容
有鉴于此,本申请的目的在于提出一种用于MODS早期预警的炎症因子组合物、模型及试剂盒,以能够对由炎症因子风暴导致的MODS进行预警。
基于上述目的,本申请提供了一种用于MODS早期预警的炎症因子组合物,包括:IL_6、IL_8、IFN_gama(或称为IFN_γ)、sTNF_RII、BLC和IL_1RA。
基于同一种发明构思,本申请还提供了一种用于MODS早期预警的风险评估模型,其所述模型的构建方法包括:
获取预处理后的原始数据集,所述原始数据集包括多个MODS样本,每一所述MODS样本中均包括多个细胞因子及其对应的浓度值;
基于所述预处理后的原始数据集,分析每个细胞因子与MODS之间的关系,并确定多个特征细胞因子;
基于多个所述特征细胞因子构建初始MODS风险评估模型;
对所述初始MODS风险评估模型进行训练,并计算该训练过程中的多个所述特征细胞因子的模型纳入频率,将所述模型纳入频率高于预设值的特征细胞因子IL_6、IL_8、IFN_gama、sTNF_RII、BLC、IL_1RA作为目标细胞因子;
基于所述目标细胞因子构建目标MODS风险评估模型。
进一步,所述获取预处理后的原始数据集,包括:
获取原始数据集;
将原始数据集中的每一所述细胞因子的浓度值进行标准化处理,得到预处理的数据集。
进一步,所述基于所述预处理后的原始数据集,分析每个细胞因子与MODS之间的关系,并确定多个特征细胞因子,包括:
基于预处理后的原始数据集,应用描述性统计方法确定每种细胞因子与MODS发生的初始概率关系,并基于该初始概率关系,确定多种第一细胞因子;
应用单变量逻辑回归模型分析每种第一细胞因子与MODS发生的第一概率关系,并基于该第一概率关系,确定多种第二细胞因子;
应用多变量逻辑回归模型分析多种第二细胞因子与MODS发生的第二概率关系,并基于该第二概率关系,确定多个特征细胞因子。
进一步,所述应用多变量逻辑回归模型分析多种第二细胞因子与MODS发生的第二概率关系,并基于该第二概率关系,确定多个特征细胞因子,包括:
在每一所述MODS样本中的多个第二细胞因子中确立多个第二细胞因子子集;
将每一第二细胞因子子集的因子水平代入所述多变量逻辑回归模型中进行计算,并得到多个过程计算模型,每一所述过程计算模型均用以表示一第二细胞因子子集与MODS发生的第二概率关系;
基于每一第二细胞因子子集与MODS发生的第二概率关系,在多个所述过程计算模型中筛选优化过程计算模型,计算多个优化过程计算模型中涉及的第二细胞因子的模型纳入频率,并将所述模型纳入频率高于预设值的第二细胞因子作为特征细胞因子。
进一步,所述基于多个所述特征细胞因子构建初始MODS风险评估模型,包括:
基于预处理后的原始数据集,采用最大似然估计法计算每一所述特征细胞因子的初始似然估计,将所述初始似然估计作为每一所述特征细胞因子的初始模型参数;
基于多个所述特征细胞因子及与每一所述特征细胞因子对应的初始模型参数构建初始MODS风险评估模型。
进一步,所述对所述初始MODS风险评估模型进行训练,并计算该训练过程中的多个所述特征细胞因子的模型纳入频率,将所述模型纳入频率高于预设值的特征细胞因子IL_6、IL_8、IFN_gama、sTNF_RII、BLC、IL_1RA作为目标细胞因子,包括:
对预处理后的原始数据集进行有放回的重抽样,并形成多个样本集,每一所述样本集包括多个MODS样本;
在每一所述MODS样本中的多个特征细胞因子中确立多个特征细胞因子子集;
将每一特征细胞因子子集的因子水平代入所述初始MODS风险评估模型中进行训练,并得到多个过程训练模型,每一所述过程训练模型均用以表示一特征细胞因子子集与MODS发生的关系;
基于特征细胞因子子集与MODS发生的关系,在多个所述过程训练模型中筛选优化过程训练模型,计算多个优化过程训练模型中涉及的特征细胞因子的模型纳入频率,并将所述模型纳入频率高于预设值的特征细胞因子IL_6、IL_8、IFN_gama、sTNF_RII、BLC、IL_1RA作为特征细胞因子。
进一步,所述基于所述目标细胞因子构建目标MODS风险评估模型,包括:
基于多个样本集,采用最大似然估计法计算每一所述目标细胞因子的目标似然估计,将所述目标似然估计作为对应的所述目标细胞因子的目标模型参数;
基于多个所述目标细胞因子及与每一所述目标细胞因子对应的目标模型参数构建MODS目标风险评估模型。
进一步, 所述目标MODS风险评估模型,包括:
其中,为预测值,x1、x2、x3、x4、x5、x6为模型变量,分别对应IL_6、IL_8、IFN_gama、sTNF_RII、BLC、IL_1RA的标准浓度值,β0、β1、β2、β3、β4、β5、β6为模型参数。
基于同一发明构思,本申请还在于公开一种用于MODS早期预警的试剂盒,包括用于检测IL_6、IL_8、IFN_gama、sTNF_RII、BLC、IL_1RA浓度的配体。
从上面所述可以看出,本申请提供的炎症因子组合物IL_6、IL_8、IFN_gama、sTNF_RII、BLC、IL_1RA能对MODS发生起到早期预警作用,其联合预测的ROC曲线下面积为0.972,预警效能优异。且从病理生理机制上来看,6个因子“均匀”分布在固有免疫过程中不同的岗位上(中性粒,单核细胞/巨噬细胞,T细胞,B细胞),起着不同的功能(激活,促炎,募集,抑炎),基本没有相互重合。这从一定程度上证明我们的筛选机制是科学合理的,覆盖了严重创伤后过度免疫反应的全过程,正是因为如此,联合后有优异的表现。综上,本发明的炎症因子组合物、模型及试剂盒能够快速精准预测严重创伤患者炎症因子风暴MODS的发生,能够极大的改善临床对于严重创伤救治的成功率。
附图说明
为了更清楚地说明本申请或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例的MODS风险评估模型构建方法的流程示意图;
图2为本申请实施例2的ROC曲线图;
图3为本申请实施例3的ROC曲线图;
图4为本申请实施例4的ROC曲线图;
图5为本申请实施例5的ROC曲线图;
图6为本申请实施例中各目标细胞因子的ROC曲线图;
图7为本申请实施例2中涉及的42种特征细胞因子的差异热图;
图8为本申请实施例的MODS风险评估模型构建装置的结构示意图;
图9为本申请实施例的电子设备示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本申请进一步详细说明。
需要说明的是,除非另外定义,本申请实施例使用的技术术语或者科学术语应当为本申请所属领域内具有一般技能的人士所理解的通常意义。本申请实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
创伤后免疫系统应答复杂,机体应对失血和组织损伤引起免疫反应不同于感染,有观点认为免疫系统的异常导致了SIRS,以及MODS的发生。创伤早期,在机械致伤因子的作用下,损伤部位坏死细胞释放损伤相关分子模式(damage-associated molecularpatterns,DAMPs)激活免疫细胞如中心粒细胞和单核细胞,启动防御保护机制;但是在某些情况下,大量细胞因子、炎症介质瞬间产生并大量释放,可以引起炎症级联,免疫失调造成MODS,甚至死亡,这一过程给疾病的治疗带来巨大障碍。
炎症因子风暴或细胞因子释放综合征是一种危及生命的全身性炎症反应,涉及循环细胞因子水平升高和免疫细胞过度激活,可由包括:各种疗法、病原体、癌症、自身免疫疾病等因素引发。其本质是机体针对外界刺激所产生的一种过度免疫现象:细胞因子不受控制,大量释放,导致系统性炎症。近年来大量研究期望通过探索相关疾病的炎症因子风暴去解释SIRS导致的MODS。但目前炎症因子风暴缺乏分级标准及明确的临床指标,且没有对严重创伤/失血性休克后炎症因子风暴的相关研究。严重创伤/失血性休克后细胞因子过度释放导致的细胞因子风暴,是诱发SIRS与远隔器官损伤的病理生理基础,是造成创伤后SIRS及MODS的重要因素。
基于此,本申请即以严重创伤患者外周血中的细胞因子为基础,筛选由多种目标细胞因子组成的炎症因子组合物,构建MODS风险评估模型,以能够对严重创伤早期由炎症因子风暴可能导致的MODS进行预警。
以下结合附图来详细说明本申请的实施例。
参考图1,本申请提供了一种MODS风险评估模型构建方法,具体包括如下步骤:
S100、获取预处理后的原始数据集,所述原始数据集包括多个MODS样本,每一所述MODS样本中均包括多个细胞因子及其对应的浓度值。
作为示例性实施例,每一MODS样本即对应一研究对象的外周血中的各细胞因子及及其对应的浓度值,使用流式分析仪可以分析测得的研究对象外周血中各细胞因子的浓度值,多个样本即可构建出一个原始数据集。
作为示例性实施例,对原始数据集的预处理过程可以包括数据除杂,同一样本中的同一细胞因子浓度值的求平均计算,或对于细胞因子浓度值的校正等。
S200、基于所述预处理后的原始数据集,分析每个细胞因子与MODS之间的关系,并确定多个特征细胞因子。
本步骤即基于预处理后的原始数据集,筛选与MODS发生之间关系较大的细胞因子,并将筛选出的细胞因子称之为特征细胞因子。
示例性的,该筛选过程可以包括对细胞因子的分类、基于单细胞因子的筛选、基于多细胞因子的筛选等。该筛选过程也可以认为是基于与MODS发生之间的关系对多个细胞因子的重要性进行排序的过程,并将重要性排名靠前的多个细胞因子作为特征细胞因子。
S300、基于多个所述特征细胞因子构建初始MODS风险评估模型。
本步骤即基于S200步骤筛选出的特征细胞因子构建的风险评估模型,因原始数据集的样本数有限,该风险评估模型仅能作为初始的评估模型,为后续S400步骤中用大数据量的样本进行训练提供基础。
S400、对所述初始MODS风险评估模型进行训练,并计算该训练过程中的多个所述特征细胞因子的模型纳入频率,将所述模型纳入频率高于预设值的特征细胞因子作为目标细胞因子。
本步骤中可以用有放回的重抽样法得到批量的样本集,每一样本集中包含多个MODS样本,由此即可以用该批量的样本集训练初始MODS风险评估模型,每一次训练即会基于一样本集的样本数据以部分特征细胞因子的因子水平为模型变量,计算其与MODS发生之间的关系进行重要性评估。由此,可以统计在多次训练过程中作为模型变量体现的特征细胞因子,并统计多个特征细胞因子作为模型变量的模型纳入频率,模型纳入频率越高,说明该细胞因子与MODS发生之间的关系越大,即可以将模型纳入频率高于预设值的特征细胞因子作为目标细胞因子。
S500、基于所述目标细胞因子构建目标MODS风险评估模型。
本步骤即基于S400步骤筛选出的目标细胞因子构建的目标风险评估模型,该评估模型以目标细胞因子的浓度值作为变量,将与MODS发生之间的概率关系作为结果输出。该目标MODS风险模型可用于后续创伤患者外周血分析过程中,使用流式分析仪可以分析测得的研究对象外周血中各细胞因子的浓度值,并提取目标细胞因子的浓度值,代入该MODS风险评估模型中,得到该患者与MODS发生之间的概率关系,为后续患者的治疗提供有利依据。
在一些实施例中,步骤S100获取预处理后的原始数据集,包括:
获取原始数据集;
将原始数据集中的每一所述细胞因子的浓度值进行标准化处理,得到预处理的数据集。
其中,对每一所述细胞因子的浓度值进行标准化处理涉及的公式如下:
其中,是第i个细胞因子的原始测量值,/>、/>分别是第i个细胞因子浓度值的平均值和标准差,/>是第i个细胞因子的标准浓度值。
另外,在对细胞因子的浓度值进行标准化前,可以先对多个浓度值数据除杂,例如除掉最大值和/或最小值等。
需要说明的是,为保证检测数据的准确性,在对研究对象的外周血进行检测时,会平行检测多次,由此在每一个样本中一细胞因子可能对应多个浓度值,但是为了避免一个细胞因子对应多个浓度值的情况影响后续步骤,因此,将每一个样本中的细胞因子的浓度均进行标准化处理。
在一些实施例中,步骤S200基于所述预处理后的原始数据集,分析每个细胞因子与MODS之间的关系,并确定多个特征细胞因子,包括:
S201、基于预处理后的原始数据集,应用描述性统计方法确定每种细胞因子与MODS发生的初始概率关系,并基于该初始概率关系,确定多种第一细胞因子。
示例性的,该描述性统计方法为将多个细胞因子按照是否为炎症因子进行分类,因MODS发生与炎症因子息息相关,因此,可以在众多细胞因子中标记炎症因子,其中,是否为炎症因子即为细胞因子与MODS发生的初始概率关系,如果是炎症因子,则与MODS发生的初始概率关系较大,并将多个细胞因子中的炎症因子筛选出来作为第一细胞因子。
示例性的,该描述性统计方法为对研究对象中患者与健康志愿者细胞因子水平的差异性描述,差异性越大的细胞因子与MODS发生的初始概率关系较大,即该差异性即本步骤中的初始概率关系,将差异性大于预设值的多个细胞因子确定为第一细胞因子。
示例性的,可以将上述炎症因子的筛选及细胞因子水平的差异性描述结合,确定多种第一细胞因子。
S202、应用单变量逻辑回归模型分析每种第一细胞因子与MODS发生的第一概率关系,并基于该第一概率关系,确定多种第二细胞因子。
示例性的,该单变量逻辑回归模型如下:
p是给定细胞因子水平下发生MODS的概率,是模型参数,/>第i个细胞因子的模型参数,且,本步骤中的/>和/>均可以为随机数。
上述单变量逻辑回归模型在该步骤中的执行过程如下:将预处理后的每个样本中的第一细胞因子的标准浓度值代入该模型,即可得到该第一细胞因子与MODS发生之间的概率。将多个第一细胞因子与MODS发生之间的概率进行排序,将概率高于预设值的多个第一细胞因子确定为第二细胞因子,即本步骤在多个第一细胞因子中筛选出与MODS发生关系更重要的多种第二细胞因子。
S203、应用多变量逻辑回归模型分析多种第二细胞因子与MODS发生的第二概率关系,并基于该第二概率关系,确定多个特征细胞因子。
该步骤S203还可以进一步描述为:
S2031、在每一所述MODS样本中的多个第二细胞因子中确立多个第二细胞因子子集
本步骤即为在预处理后的原始数据集中,选取全部第二细胞因子中的部分形成多个第二细胞因子子集。
示例性地,第二细胞因子共有90种,可以随机选择其中的部分第二细胞因子作为第二细胞因子子集,每个子集的第二细胞因子的个数可以相同也可以不同。
S2032、将每一第二细胞因子子集的因子水平代入所述多变量逻辑回归模型中进行计算,并得到多个过程计算模型,每一所述过程计算模型均用以表示一第二细胞因子子集与MODS发生的第二概率关系;
本步骤即将每一MODS样本中的多个第二细胞因子子集的标准浓度值代入初始MODS风险评估模型中进行计算,得到多个过程计算模型,即可得到该多个第二细胞因子子集与MODS发生之间的概率。与此同时,多个第二细胞因子子集代入多变量逻辑回归模型后可以得到多个过程计算模型。
S2033、基于每一第二细胞因子子集与MODS发生的第二概率关系,在多个所述过程计算模型中筛选优化过程计算模型,计算多个优化过程计算模型中涉及的第二细胞因子的模型纳入频率,并将所述模型纳入频率高于预设值的第二细胞因子作为特征细胞因子。
示例性地,可以将全部过程计算模型进行MODS发生概率的排序,将MODS发生概率高于预设值的过程计算模型作为优化过程计算模型,将所有优化过程计算模型中模型纳入频率高于预设值的多种第二细胞因子作为特征细胞因子。
示例性的,该多变量逻辑回归模型如下:
p是给定细胞因子水平下发生MODS的概率,是模型参数,/>第i个细胞因子的模型参数,且,本步骤中的/>和/>均可以为随机数。
本实施例即为基于细胞因子与MODS发生之间的关系,对原始数据集中的多个细胞因子进行多级别层层筛选的过程,首先通过描述性统计方法在多个细胞因子中确定第一细胞因子,接着通过单变量逻辑回归模型在多个第一细胞因子中确定第二细胞因子,之后通过多变量逻辑回归模型在多种第二细胞因子中确定特征细胞因子,该层层递进的筛选过程可以在多个细胞因子中精准的筛选出与MODS发生关系较高的多个特征细胞因子。
在一些实施例中,步骤S300所述基于多个所述特征细胞因子构建初始MODS风险评估模型,包括:
S301、基于预处理后的原始数据集,采用最大似然估计法计算每一所述特征细胞因子的初始似然估计,将所述初始似然估计作为每一所述特征细胞因子的初始模型参数。
示例性的,本实施例要建立的风险评估模型为多变量逻辑模型,S203步骤中已经确定了多个特征细胞因子,该多个特征细胞因子的标准浓度值(或称因子水平)可以作为该模型的模型变量,本步骤需要对其模型参数进行最大似然估计法计算。
示例性的,对于每一特征细胞因子采用最大似然估计法(MLE)求解初始模型参数的过程如下:
是模型参数β的似然函数,/>是模型参数β的最大似然估计(即所述初始似然估计),yi是第i 个样本的实际情况,n 是样本总数。
S302、基于多个所述特征细胞因子及与每一所述特征细胞因子对应的初始模型参数构建初始MODS风险评估模型。
示例性地,当特征细胞因子有i个时,该初始MODS风险评估模型如下:
本实施例即基于S200步骤筛选出的特征细胞因子构建的风险评估模型,因原始数据集的样本数有限,该风险评估模型仅能作为初始的评估模型,为后续S400步骤中用大数据量的样本进行训练提供基础。
在一些实施例中,步骤S400所述对所述初始MODS风险评估模型进行训练,并计算该训练过程中的多个所述特征细胞因子的模型纳入频率,将所述模型纳入频率高于预设值的特征细胞因子作为目标细胞因子,包括:
S401、对预处理后的原始数据集进行有放回的重抽样,并形成多个样本集,每一所述样本集包括多个MODS样本;
示例性的,可以利用Bootstrap方法进行有放回的重抽样,具体地,可以对预处理的原始数据集进行1000次重抽样,产生1000个Bootstrap样本集,每一所述样本集包括多个MODS样本,且每一样本集中的MODS样本个数可以相同,也可以不同。
S402、在每一所述MODS样本中的多个特征细胞因子中确立多个特征细胞因子子集。
本步骤即为在Bootstrap样本集中,选取全部特征细胞因子中的部分形成多个特征细胞因子子集。
示例性地,特征细胞因子共有44种,可以随机选择其中的部分第二细胞因子作为第二细胞因子子集,每个子集的第二细胞因子的个数可以相同也可以不同。
S403、将每一特征细胞因子子集的因子水平代入所述初始MODS风险评估模型中进行训练,并得到多个过程训练模型,每一所述过程训练模型均用以表示一特征细胞因子子集与MODS发生的关系;
本步骤即将每一样本集中每个MODS样本中的多个特征细胞因子子集的标准浓度值代入初始MODS风险评估模型中进行训练,得到多个过程训练模型,即可得到该多个特征细胞因子子集与MODS发生之间的概率。换句话说,每一样本集训练初始MODS风险评估模型后可以得到多个过程训练模型。
S404、基于特征细胞因子子集与MODS发生的关系,在多个所述过程训练模型中筛选优化过程训练模型,计算多个优化过程训练模型中涉及的特征细胞因子的模型纳入频率,并将所述模型纳入频率高于预设值的特征细胞因子作为特征细胞因子。
示例性地,可以在每一样本集中提取MODS发生概率高于预设值的过程训练模型作为优化过程训练模型,将全部样本集中提取的所有优化过程训练模型中模型纳入频率高于预设值的多个特征细胞因子作为目标细胞因子。
示例性地,可以将全部样本集中的多个过程训练模型进行MODS发生概率的排序,将MODS发生概率高于预设值的过程训练模型作为优化过程训练模型,将所有优化过程训练模型中模型纳入频率高于预设值的多个特征细胞因子作为目标细胞因子。
其中,模型纳入频率也可以理解为在所有优化过程训练模型中出现的概率。
本实施例用有放回的重抽样法得到批量的样本集,每一样本集中包含多个MODS样本,由此即可以用该批量的样本集训练初始MODS风险评估模型,每一次训练即会基于一样本集的样本数据以部分特征细胞因子的因子水平为模型变量,计算其与MODS发生之间的关系进行重要性评估。由此,可以统计在多次训练过程中作为模型变量体现的特征细胞因子,并统计多个特征细胞因子作为模型变量的模型纳入频率,模型纳入频率越高,说明该细胞因子与MODS发生之间的关系越大,即可以将模型纳入频率高于预设值的特征细胞因子作为目标细胞因子。该模型训练的过程即对目标细胞因子筛选的过程,因本实施例中样本量较大,且筛选过程始终以部分特征细胞因子与MODS发生的关系为基准,因此,筛选出的目标细胞因子会更准确。
在一些实施例中,基于所述目标细胞因子构建目标MODS风险评估模型,包括:
基于多个样本集,采用最大似然估计法计算每一所述目标细胞因子的目标似然估计,将所述目标似然估计作为对应的所述目标细胞因子的目标模型参数;
示例性地,对Bootstrap样本集中的每一目标细胞因子的目标似然估计的计算过程如下:
L b(β)是第 b 次MODS样本的似然函数,是模型参数β的最大似然估计(即所述目标似然估计)。
基于多个所述目标细胞因子及与每一所述目标细胞因子对应的目标模型参数构建MODS目标风险评估模型。
示例性地,当特征细胞因子有6个时,该目标MODS风险评估模型如下:
本实施例即基于S400步骤筛选出的目标细胞因子构建的目标风险评估模型,该评估模型以目标细胞因子的浓度值作为变量,将与MODS发生之间的概率关系作为结果输出。该目标MODS风险模型可用于后续创伤患者外周血分析过程中,使用流式分析仪可以分析测得的研究对象外周血中各细胞因子的浓度值,并提取目标细胞因子的浓度值,代入该MODS风险评估模型中,得到该患者与MODS发生之间的概率关系,为后续患者的治疗提供有利依据。
需要说明的是,本申请通过以下四种方式构建了所述目标MODS风险评估模型,(1)利用Logistic逻辑回归模型并结合Bootstrap方法构建的目标MODS风险评估模型;(2)利用随机森林法结合Bootstrap方法构建构建的目标MODS风险评估模型;(3)利用Lasso逻辑回归模型构建的目标MODS风险评估模型;(4)利用GBDT模型结合Bootstrap方法构建的目标MODS风险评估模型。其中,第(1)中方式的构建过程即以上实施例描述的过程,以下实施例用以描述第一种构建方式的构建结果及后续三种构建过程及构建结果,并对以上四种方式构建的目标MODS风险评估模型的MODS预测效能进行评判。
实施例1研究对象的纳入标准、排除标准
前述实施例提及的研究对象的纳入标准为:
(1)ISS>15的多创伤患者;
(2)签署知情同意书。
其中,研究对象的排除标准为:
(1)明确诊断GCS>9或AIS>3的颅脑伤;
(2)明确有感染灶或患有感染性疾病,有较高感染风险;
(3)妊娠女性、哺乳期妇女、心脑血管疾病及呼吸系统疾病急性发作期、HIV等) ;
(4)影响生存的严重原发性疾病(如不能切除的肿瘤、血液病等);
(5)近6个月内使用过免疫抑制剂,和/或使用过细胞毒性药物;
(6)精神类疾病患者;
(7)30天内参加过其他临床试验者;
(8)研究者判断不能完成或不宜参加本试验者。
基于以上研究对象的纳入标准和排除标准,选定的研究对象的人口学特征如表1所示。
表1 研究对象的人口学特征
对于研究对象中患者的随访计划为:入院后前7天每天随访一次,14天随访一次,28天随访一次,随访内容包括:(1)MODS是否发生,关于创伤患者器官功能损伤的临床诊断方法为:连续两天或两天以上(不包括前48小时)序贯器官衰竭评分(Sequential OrganFailure Assessment,SOFA)大于等于5分;(2)28天生存率;(3)机械通气时间、ICU留观时间、住院时间、住院花费等。
由表1所示,符合纳入标准的患者35例,均收集患者入院当天外周血作为样本,17例健康志愿者作为对照。本步骤中即收集35例患者入院当天的外周血中各细胞因子及其浓度值、及17例健康志愿者的外周血中各细胞因子及其浓度值作为MODS样本,形成原始数据集。
实施例2利用Logistic逻辑回归模型并结合Bootstrap方法构建的目标MODS风险评估模型
构建过程即以上实施例描述的过程,并还可以以如下方式进行描述:
1. 数据准备和预处理:
对每个细胞因子浓度测量值进行标准化处理:
其中,是第i个细胞因子的原始测量值,/>、/>分别是第i个细胞因子浓度值的平均值和标准差,/>是第i个细胞因子的标准浓度值。
2. 初步筛选:
采用描述性统计方法来初步分析,并筛选出120种第一细胞因子。
应用单变量Logistic回归模型分析每种第一细胞因子与MODS发生的关系,并筛选出90种第二细胞因子:
p是给定细胞因子水平下发生MODS的概率,是模型参数,/>第i个细胞因子的模型参数。
3. 特征细胞因子选择:
采用多变量Logistic逻辑回归模型分析多种第二细胞因子与MODS发生的关系,并筛选出如表2所示的44种特征细胞因子:
p 是给定细胞因子水平下发生MODS的概率,是模型参数,/>第i个细胞因子的模型参数。
且采用Wilcoxon-Mann-Whitney test比较健康人和严重创伤患者的因子水平中该44种细胞因子在两个人群之间的差异是否具有统计学意义,结果表明,表2中的44种细胞因子中除IL_3和IL_33外的42种细胞因子均具有统计学意义,其差异热图如图7所示。
4. 建立初始MODS风险评估模型:
使用选定的44种特征细胞因子作为变量构建Logistic回归模型(即初始MODS风险评估模型)。
采用最大似然估计法(MLE)求解模型参数:
是模型参数β的似然函数,/>是模型参数β的最大似然估计,yi是第i 个样本的实际情况,n 是样本总数。
构建的初始MODS风险评估模型如下:
5. 初始MODS风险评估模型的训练与优化:
利用Bootstrap方法对原始数据集进行1000次重抽样,产生1000个Bootstrap样本集。基于Bootstrap样本集对初始MODS风险评估模型进行训练,并在44种特征细胞因子中筛选出6个目标细胞因子,具体见表2。
6.目标MODS风险评估模型的构建
使用选定的6种目标细胞因子作为变量构建Logistic回归模型;并通过对Bootstrap样本集计算逻辑回归模型的参数:
L b(β) 是第 b 次Bootstrap样本的似然函数,是模型参数β的最大似然估计。
构建的目标MODS风险评估模型如下:
其中,各模型参数的数值具体见表3。
ROC曲线分析选定的6种目标细胞因子对MODS的预警效能:将受试者的IL_6、IL_8、IFN_gama、sTNF_RII、BLC、IL_1RA等6种目标细胞因子的标准浓度值带入目标MODS风险评估模型,计算预测值。该/>的Cut-off point为0.8208166。即,如果/>则患者发生MODS风险较高,/>则患者发生MODS风险较低。
基于受试者的IL_6、IL_8、IFN_gama、sTNF_RII、BLC、IL_1RA等6种目标细胞因子标的准浓度值绘制ROC曲线,如图2所示。结果显示该6种目标细胞因子的ROC曲线下面积是0.9722,一致率:0.9118(95%CI:0.7632, 0.9814),Kappa:0.8247,特异度:1.0000,灵敏度:0.8333。ROC曲线下面积较高,且特异度、灵敏度均较好,说明该6种因子的联合预测效能较好,即模型具有比较好的MODS预警效能。
表2 实施例2中44种特征细胞因子的模型纳入频率
表3 实施例2的目标MODS风险评估模型中的模型参数表
实施例3利用随机森林法结合Bootstrap方法构建严重创伤后炎症因子风暴MODS预测模型
1. 数据准备和预处理:
对每个细胞因子浓度测量值进行标准化处理:
其中,是第i个细胞因子的原始测量值,/>、/>分别是第i个细胞因子浓度值的平均值和标准差,/>是第i个细胞因子的标准浓度值。
2. 特征选择与初步筛选:
应用随机森林算法进行特征重要性评分,并选定44种特征(即特征细胞因子)。特征重要性可以通过平均不纯度减少或平均精确率增加来计算。
3. 随机森林模型构建(即初始MODS风险评估模型的构建):
使用Bootstrap抽样方法创建多个训练数据集。对于每个训练数据集,使用以下步骤创建一棵决策树:
从44种特征中随机选择特征子集。
选取最佳分割特征和分割点以最大化信息增益(IG)或最小化基尼不纯度(GiniImpurity):
其中,D p是父节点的数据集,f 是分割特征,D j是第 j 个子节点的数据集,N jN p分别是子节点和父节点的样本数量,p k是第 k 类别的样本比例。
4. 随机森林模型训练与聚合:
训练大量决策树并聚合其的预测结果来形成随机森林模型。聚合预测结果的方法可以是多数投票法:
其中,B 是决策树的数量,是第 B 棵树的预测结果。
5. 特征选择优化:
对每个Bootstrap样本集训练的随机森林计算特征重要性,并记录每个特征的选取频率。
选择在多个Bootstrap样本集中重要性排名前6的目标细胞因子作为最终特征,如表4所示。
6. 基于6个目标细胞因子的因子水平及模型参数构建Logistic回归模型,即目标MODS风险评估模型,其中,模型参数可以通过最大似然函数法基于Bootstrap样本集计算得到。
构建的目标MODS风险评估模型如下:
其中,各模型参数的数值具体见表5。
7. ROC曲线分析选定的6种目标细胞因子对MODS的预警效能:
将受试者的sTNF_RII、IL_8、Fractalkine、IL_23、IL_13、IGFBP_4等6种目标细胞因子的标准浓度值带入目标MODS风险评估模型,计算预测值。该/>的Cut-offpoint为0.4332870。如果/>则患者发生MODS风险较高,如果则患者发生MODS风险较低。
基于受试者的sTNF_RII、IL_8、Fractalkine、IL_23、IL_13、IGFBP_4等6种目标细胞因子的标准浓度值绘制ROC曲线,如图3所示。结果显示该6种目标细胞因子的ROC曲线下面积是0.8090,一致率:0.7941(95%CI:0.6210,0.9130),Kappa:0.5854,特异度:0.7500,灵敏度:0.8333。
由此可见,本实施例中的ROC曲线下面积、特异度、灵敏度均较实施例2的低,说明该模型的MODS预警效能没有实施例2的好。
表4 实施例3中44种特征细胞因子的模型纳入频率
表5 实施例3的目标MODS风险评估模型中的模型参数表
实施例4利用Lasso逻辑回归模型构建的目标MODS风险评估模型
1. 数据准备和预处理:
对每个细胞因子浓度测量值进行标准化处理:
/>
其中,是第i个细胞因子的原始测量值,/>、/>分别是第i个细胞因子浓度值的平均值和标准差,/>是第i个细胞因子的标准浓度值。
2. Lasso模型构建(即初始MODS风险评估模型的构建):
使用Lasso模型分析细胞因子与MODS发生的关系。
Lasso模型通过在普通最小二乘估计的基础上加入L1正则化项来进行特征选择和正则化。
Lasso回归的优化问题公式:
其中,yi是响应变量,xij是预测变量,βj是回归系数,N是样本数,p是特征数,λ是正则化参数。
3. 参数优化和模型训练:
使用交叉验证来确定最佳的正则化参数λ,λ设定为0.1。
训练Lasso模型,同时进行特征选择,即由多种特征细胞因子中选择6种目标细胞因子。
4. 基于6个目标细胞因子的因子水平及模型参数构建Logistic回归模型,即目标MODS风险评估模型,其中,模型参数可以通过最大似然函数法基于预处理后的原始数据集计算得到的。
构建的目标MODS风险评估模型如下:
其中,各模型参数的数值具体见表6。
5. ROC曲线分析选定的6种目标细胞因子对MODS的预警效能:
将受试者的IL_8、IL_6、IL_13、IFN_gama、BLC、Fractalkine等6种目标细胞因子的标准浓度值带入目标MODS风险评估模型,计算预测值。该/>的Cut-off point为0.4787222,如果/>则患者发生MODS风险较高,/>则患者发生MODS风险较低。
基于受试者的IL_8、IL_6、IL_13、IFN_gama、BLC、Fractalkine等6种目标细胞因子的标准浓度值绘制ROC曲线,如图4所示。结果显示该6种目标细胞因子的ROC曲线下面积是0.8438,一致率:0.7941(95%CI:0.6210,0.9130),Kappa:0.5911,特异度:0.7222,灵敏度:0.8750。
由此可见,本实施例中的ROC曲线下面积、特异度、灵敏度均较实施例2的低,说明该模型的MODS预警效能没有实施例2的好。
表6 实施例4的目标MODS风险评估模型中的模型参数表
实施例5利用GBDT模型结合Bootstrap方法构建的目标MODS风险评估模型
1. 数据准备和预处理:
对每个细胞因子浓度测量值进行标准化处理:
其中,是第i个细胞因子的原始测量值,/>、/>分别是第i个细胞因子浓度值的平均值和标准差,/>是第i个细胞因子的标准浓度值。
2. GBDT模型构建(目标MODS风险评估模型):
使用GBDT模型分析细胞因子与MODS的关系:
初始化GBDT模型,设定基学习器为决策树。
逐步添加决策树,每棵树学习前一步的残差。
GBDT迭代更新公式:
其中,Fm(x) 是第 m 步的模型,ν是学习率,γjm是第 m 棵树的第 j 个叶节点的值,Rjm是第 m 棵树的第 j 个叶节点的区域。
本实施例建模的GBDT模型包含5层,共32个叶子节点的树模型,数据自上而下进行流转,由顶点流转到最终的所有叶子节点,流转模式以第一层为例,细胞因子的标准浓度值分别经过该层的节点,按照每个节点训练所得的阈值做判断,决定向下一层流转时应该经过哪个分支,以此类推,当数据流转完最后一层时,该层所有叶子节点的输出将进行累加,累加后的值作为模型的预测值
3. 特征选择优化:
利用Bootstrap方法对原始数据集进行1000次重抽样,产生1000个Bootstrap样本集。基于Bootstrap样本集对初始MODS风险评估模型进行训练,由24种特征细胞因子中筛选出6个目标细胞因子,具体见表7。
4. ROC曲线分析选定的6种目标细胞因子对MODS的预警效能:
将受试者的Fractalkine、IL-12p70、sFasL、IL-3、IL-23、Myoglobin等6种目标细胞因子的标准浓度值带入目标MODS风险评估模型,计算预测值。该/>的Cut-offpoint为0.4332870。如果/>则患者发生MODS风险较高,如果/>则患者发生MODS风险较低。
基于受试者的Fractalkine、IL-12p70、sFasL、IL-3、IL-23、Myoglobin等6种目标细胞因子的标准浓度值绘制ROC曲线,如图5所示。结果显示该6种目标细胞因子的ROC曲线下面积是 0.9635,一致率:0.90844(96%CI:0.7314,0.9575),Kappa:0.7902,特异度:1.0000,灵敏度:0.9473。
由此可见,本实施例中的ROC曲线下面积较实施例2的低,说明该模型的MODS预警效能没有实施例2的好。
表7 实施例5中24种特征细胞因子的模型纳入频率
通过上述实施例2-实施例5的描述,当初始MODS风险评估模型为GBDT,Lasso回归模型,随机森林以及logistics回归模型时,在模型训练过程中,其对应选中的6种目标细胞因子的ROC曲线下面积分别为:0.9635,0.9722,0.809和0.8438。综上我们选择预测效能最高的Logistic回归模型座位初始MODS风险评估模型,并利用其训练过程中筛选的IL_6、IL_8、IFN_gama、sTNF_RII、BLC、IL_1RA等6种细胞因子,构建严重创伤后炎症因子风暴的MODS预警模型,以具有更好的MODS预警效能。
实施例6应用实施例2中6种目标细胞因子的检测配体组成快速联合诊断试剂盒
本实施例使用磁珠抗体(即所述配体)结合多通道检测小分子的方法检测6种目标细胞因子的浓度。检测方法如下:
1、前期准备
(1)重悬混合好的磁珠:将预先混好的用于检测IL_6、IL_8、IFN_gama、sTNF_RII、BLC、IL_1RA浓度的磁珠超声处理1 min,震荡1 min。
(2)准备洗脱缓冲液:将20X 洗涤液置于室温,使其中的盐充分溶解。将2.5ml的20X 洗涤液溶于47.5 ml水,贮存于4℃,上限1个月。
(3)准备标准品:将标准品溶于250 ul 体系缓冲液。
室温静置10分钟,这一管作为C7,然后稀释3倍做C6-C0,C0就是只有体系缓冲液。C7取100ul,然后25ul加入75ul作为C6,以此类推。
(4)将5ml 体系缓冲液加入 Matrix B(玻璃瓶),震荡混匀,室温静置15 min,注意matrix B配成溶液后置于-70以下温度保存,可以上限保存1个月。
2、样品收集
使用促凝管收集病人0.1ml外周血,4℃静置40分钟,3000 rpm离心15分钟,小心吸取上清。
3、实验流程
(1)使所有试剂温度达到室温(20-25C)
实验过程中注意避免液体撒出和光照,使用配套平板。
(2)取出25ul血清与25ul体系缓冲液混匀,再与150ul Matrix B混匀。Standard25ul加入25ul matrix B和实验组各25ul加入25ul assay buffer。
(3)震荡beads 30s,25 ul加入上述混合液。注意加样的时候要时不时震荡beads,防止其沉底。
(4)25℃震荡孵育3小时,650 rpm。
(5)400g 5 分钟。
(6)用枪仔细且迅速吸掉上清,不要倾倒。
(7)用200 ul wash buffer洗,重悬起来静置一分钟,重复上面两步2遍。
(8)向每孔加入25 ul检测抗体。
(9)用新的铝箔纸封好,室温震荡孵育1.5小时,650 rpm。
(10)不要洗,直接加25ul SA-PE。
(11)用新的铝箔纸封好,震荡650 rpm 45分钟. 离心后小心吸掉杂交液,加入200ul wash buffer,保存过夜。
(12)400g 5 分钟,吸掉。
(13)120ul wash buffer重悬
(14)最好是当天检测。如果可以用读板检测,要保证每一板读之前震荡悬起来beads。
4、数据分析
使用流式分析仪进行流式分析,然后数据用在线或者可下载的LEGENDplex进行定量确定细胞因子浓度。
应用本实施例的试剂盒测得的6种目标细胞因子对实施例2中的目标MODS风险评估模型的验证示例如下:
(1)模型验证示例一:
42岁女性患者,多发伤ISS29分,SOFA评分8分,伤后一周内发生MODS。
创伤后早期血清IL_6、IL_8、IFN_gama、sTNF_RII、BLC、IL_1RA(单位均为pg/ml)水平分别为,311.87,139.59,0.0001,1592.10, 62.399,2536.3。
带入实施例2中的目标MODS风险评估模型计算大于Cut-off值0.8208166,发生创伤后炎症因子风暴MODS风险极高,阳性病例预测正确。
(2)模型应用示例二:
50岁女性患者,多发伤ISS26分,SOFA评分6分,伤后未发生MODS。
创伤后早期血清IL_6、IL_8、IFN_gama、sTNF_RII、BLC、IL_1RA(单位均为pg/ml)水平分别为,102.11,166.63,0.002,1207.96,40.014,28914.7。
带入上述公式计算小于Cut-off值0.8208166,发生创伤后炎症因子风暴MODS风险极低,阴性病例预测正确。
另外,本申请还分别研究了IL_6、IL_8、IFN_gama、sTNF_RII、BLC、IL_1RA每一个因子的特征和生物学意义,并比较了单因子的预测效能,来进一步证实本发明的科学性。首先,IFN_gama通常被认为是一种促炎细胞因子,也叫巨噬细胞活化因子,主要由自然杀伤细胞(NK细胞)和CD4+/CD8+ T细胞产生。本研究发现创伤后,IFN_gama较健康患者显著降低。在严重创伤后由于CD4+ T细胞的大量减少,IFN_gama降低是合理科学,同时IFN_gama降低也提示严重创伤后期会导致免疫抑制诱发感染的易感性增高。IL_6是急性应答的关键介质,最经典的促炎因子,涉及了几乎所有类型的炎症反应,其在模型中的意义更像是“阳性对照”,证明本模型的合理性,IL_6在严重创伤后明显升高。IL_8称为趋化因子CXCL8是巨噬细胞和上皮细胞等分泌的细胞因子。IL_8结合趋化因子受体白细胞介素-8受体α(IL8RA,又叫CXCR1)和白细胞介素-8受体β(IL8RB, 又叫CXCR2)而对中性粒细胞有细胞趋化作用而实现其对炎症反应的调节,IL_8在严重创伤后明显升高。B-淋巴细胞趋化因子(BLC),主要由helper T分泌,对B细胞起到诱导募集的作用,BLC在严重创伤后明显降低。BLC虽然在创伤相关研究中并无报道,但是严重创伤后B细胞和T细胞明显减少是已被证实的,故此结果也是科学合理的。白细胞介素1受体拮抗剂(IL_1RA)是人体内产生的能够拮抗IL-1β和α的蛋白,主要跟IL-1受体结合,可由多种免疫细胞分析产生,IL_1RA在严重创伤后明显上升。sTNF_RII是TNF-α的受体,与TNF-α结合后主要起促炎作用,sTNF_RII在严重创伤后明显上升。目前尚无看到sTNF_RII作为创伤检测指标出现。
进一步,本申请还评估了该6种目标细胞因子的单独预测能力,如图6所示,其中,IL_6、IL_8、IFN_gama、sTNF_RII、BLC、IL_1RA的ROC曲线下面积分别为0.764,0.733,0.618,0.661,0.747,0.490,均低于联合预测效能0.972,结果提示6种因子的联合诊断效能是最佳的。
从病理生理机制上来看,6个因子“均匀”分布在固有免疫过程中不同的岗位上(中性粒,单核细胞/巨噬细胞,T细胞,B细胞),起着不同的功能(激活,促炎,募集,抑炎),基本没有相互重合。这从一定程度上证明我们的筛选机制是科学合理的,覆盖了严重创伤后过度免疫反应的全过程,正是因为如此,联合后有优异的表现。
且,MODS的发生本质上是全身炎症反应即炎症因子风暴对远隔器官的打击,故本发明仅找到创伤特异性的炎症因子就能很好的预测MODS的发生,不需要特别关注年龄、性别、并发症等带来的影响。
综上,本发明利用以上炎症因子组合物能够快速精准预测严重创伤患者炎症因子风暴MODS的发生,能够极大的改善临床对于严重创伤救治的成功率。
需要说明的是,本申请实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本申请实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的方法。
需要说明的是,上述对本申请的一些实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于上述实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
基于同一发明构思,与上述任意实施例方法相对应的,本申请还提供了一种MODS风险评估模型构建装置。
参考图8,所述MODS风险评估模型构建装置,包括:
获取模块601,用以获取预处理后的原始数据集,所述原始数据集包括多个MODS样本,每一所述MODS样本中均包括多个细胞因子及其对应的浓度值;
第一筛选模块602,用以基于所述预处理后的原始数据集,分析每个细胞因子与MODS之间的关系,并确定多个特征细胞因子;
初始模型构建模块603,用以基于多个所述特征细胞因子构建初始MODS风险评估模型;
第二筛选模块604,用以对所述初始MODS风险评估模型进行训练,并计算该训练过程中的多个所述特征细胞因子的模型纳入频率,将所述模型纳入频率高于预设值的特征细胞因子作为目标细胞因子;
目标模型构建模块605,用以基于所述目标细胞因子构建目标MODS风险评估模型。
为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本申请时可以把各模块的功能在同一个或多个软件和/或硬件中实现。
上述实施例的装置用于实现前述任一实施例中相应的MODS风险评估模型构建方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
基于同一发明构思,与上述任意实施例方法相对应的,本申请还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上任意一实施例所述的MODS风险评估模型构建方法。
图9示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图, 该设备可以包括:处理器1010、存储器1020、输入/输出接口1030、通信接口1040和总线 1050。其中处理器1010、存储器1020、输入/输出接口1030和通信接口1040通过总线1050实现彼此之间在设备内部的通信连接。
处理器1010可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器1020可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1020可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1020中,并由处理器1010来调用执行。
输入/输出接口1030用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口1040用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线1050包括一通路,在设备的各个组件(例如处理器1010、存储器1020、输入/输出接口1030和通信接口1040)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器1010、存储器1020、输入/输出接口1030、通信接口1040以及总线1050,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
上述实施例的电子设备用于实现前述任一实施例中相应的MODS风险评估模型构建方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
基于同一发明构思,与上述任意实施例方法相对应的,本申请还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行如上任一实施例所述的MODS风险评估模型构建方法。
本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
上述实施例的存储介质存储的计算机指令用于使所述计算机执行如上任一实施例所述的MODS风险评估模型构建方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本申请的范围(包括权利要求)被限于这些例子;在本申请的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本申请实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本申请实施例难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本申请实施例难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本申请实施例的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本申请的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本申请实施例。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本申请的具体实施例对本申请进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本申请实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本申请实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种用于MODS早期预警的炎症因子组合物,其特征在于,包括:IL_6、IL_8、IFN_gama、sTNF_RII、BLC和IL_1RA。
2.一种用于MODS早期预警的风险评估模型,其特征在于,所述模型的构建方法包括:
获取预处理后的原始数据集,所述原始数据集包括多个MODS样本,每一所述MODS样本中均包括多个细胞因子及其对应的浓度值;
基于所述预处理后的原始数据集,分析每个细胞因子与MODS之间的关系,并确定多个特征细胞因子;
基于多个所述特征细胞因子构建初始MODS风险评估模型;
对所述初始MODS风险评估模型进行训练,并计算该训练过程中的多个所述特征细胞因子的模型纳入频率,将所述模型纳入频率高于预设值的特征细胞因子IL_6、IL_8、IFN_gama、sTNF_RII、BLC、IL_1RA作为目标细胞因子;
基于所述目标细胞因子构建目标MODS风险评估模型。
3.根据权利要求2所述的用于MODS早期预警的风险评估模型,其特征在于,所述获取预处理后的原始数据集,包括:
获取原始数据集;
将原始数据集中的每一所述细胞因子的浓度值进行标准化处理,得到预处理的数据集。
4.根据权利要求2所述的用于MODS早期预警的风险评估模型,其特征在于,所述基于所述预处理后的原始数据集,分析每个细胞因子与MODS之间的关系,并确定多个特征细胞因子,包括:
基于预处理后的原始数据集,应用描述性统计方法确定每种细胞因子与MODS发生的初始概率关系,并基于该初始概率关系,确定多种第一细胞因子;
应用单变量逻辑回归模型分析每种第一细胞因子与MODS发生的第一概率关系,并基于该第一概率关系,确定多种第二细胞因子;
应用多变量逻辑回归模型分析多种第二细胞因子与MODS发生的第二概率关系,并基于该第二概率关系,确定多个特征细胞因子。
5.根据权利要求4所述的用于MODS早期预警的风险评估模型,其特征在于,所述应用多变量逻辑回归模型分析多种第二细胞因子与MODS发生的第二概率关系,并基于该第二概率关系,确定多个特征细胞因子,包括:
在每一所述MODS样本中的多个第二细胞因子中确立多个第二细胞因子子集;
将每一第二细胞因子子集的因子水平代入所述多变量逻辑回归模型中进行计算,并得到多个过程计算模型,每一所述过程计算模型均用以表示一第二细胞因子子集与MODS发生的第二概率关系;
基于每一第二细胞因子子集与MODS发生的第二概率关系,在多个所述过程计算模型中筛选优化过程计算模型,计算多个优化过程计算模型中涉及的第二细胞因子的模型纳入频率,并将所述模型纳入频率高于预设值的第二细胞因子作为特征细胞因子。
6.根据权利要求4所述的用于MODS早期预警的风险评估模型,其特征在于,所述基于多个所述特征细胞因子构建初始MODS风险评估模型,包括:
基于预处理后的原始数据集,采用最大似然估计法计算每一所述特征细胞因子的初始似然估计,将所述初始似然估计作为每一所述特征细胞因子的初始模型参数;
基于多个所述特征细胞因子及与每一所述特征细胞因子对应的初始模型参数构建初始MODS风险评估模型。
7.根据权利要求6所述的用于MODS早期预警的风险评估模型,其特征在于,所述对所述初始MODS风险评估模型进行训练,并计算该训练过程中的多个所述特征细胞因子的模型纳入频率,将所述模型纳入频率高于预设值的特征细胞因子IL_6、IL_8、IFN_gama、sTNF_RII、BLC、IL_1RA作为目标细胞因子,包括:
对预处理后的原始数据集进行有放回的重抽样,并形成多个样本集,每一所述样本集包括多个MODS样本;
在每一所述MODS样本中的多个特征细胞因子中确立多个特征细胞因子子集;
将每一特征细胞因子子集的因子水平代入所述初始MODS风险评估模型中进行训练,并得到多个过程训练模型,每一所述过程训练模型均用以表示一特征细胞因子子集与MODS发生的关系;
基于特征细胞因子子集与MODS发生的关系,在多个所述过程训练模型中筛选优化过程训练模型,计算多个优化过程训练模型中涉及的特征细胞因子的模型纳入频率,并将所述模型纳入频率高于预设值的特征细胞因子IL_6、IL_8、IFN_gama、sTNF_RII、BLC、IL_1RA作为特征细胞因子。
8.根据权利要求7所述的用于MODS早期预警的风险评估模型,其特征在于,所述基于所述目标细胞因子构建目标MODS风险评估模型,包括:
基于多个样本集,采用最大似然估计法计算每一所述目标细胞因子的目标似然估计,将所述目标似然估计作为对应的所述目标细胞因子的目标模型参数;
基于多个所述目标细胞因子及与每一所述目标细胞因子对应的目标模型参数构建MODS目标风险评估模型。
9.根据权利要求2所述的用于MODS早期预警的风险评估模型,其特征在于,
所述目标MODS风险评估模型为:
其中,为预测值,x1、x2、x3、x4、x5、x6为模型变量,分别对应IL_6、IL_8、IFN_gama、sTNF_RII、BLC、IL_1RA的标准浓度值,β0、β1、β2、β3、β4、β5、β6为模型参数。
10.一种用于MODS早期预警的试剂盒,其特征在于,包括用于检测IL_6、IL_8、IFN_gama、sTNF_RII、BLC、IL_1RA浓度的配体。
CN202410041130.3A 2024-01-11 2024-01-11 用于mods早期预警的炎症因子组合物、模型及试剂盒 Active CN117554628B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410041130.3A CN117554628B (zh) 2024-01-11 2024-01-11 用于mods早期预警的炎症因子组合物、模型及试剂盒

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410041130.3A CN117554628B (zh) 2024-01-11 2024-01-11 用于mods早期预警的炎症因子组合物、模型及试剂盒

Publications (2)

Publication Number Publication Date
CN117554628A true CN117554628A (zh) 2024-02-13
CN117554628B CN117554628B (zh) 2024-03-12

Family

ID=89815147

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410041130.3A Active CN117554628B (zh) 2024-01-11 2024-01-11 用于mods早期预警的炎症因子组合物、模型及试剂盒

Country Status (1)

Country Link
CN (1) CN117554628B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070092911A1 (en) * 2005-10-03 2007-04-26 Buechler Kenneth F Methods and compositions for diagnosis and /or prognosis in systemic inflammatory response syndromes
CN101261229A (zh) * 2008-04-11 2008-09-10 中国人民解放军第三军医大学第三附属医院 创伤血清对炎性细胞NF-κB的激活作用检测及其用途
US20090075831A1 (en) * 2004-10-13 2009-03-19 Stefan Russwurm Method for differentiating between the non-infectious and infectious causes of multiple organ failure
CN101396441A (zh) * 2007-09-26 2009-04-01 首都医科大学附属北京友谊医院 一种治疗多脏器功能不全综合征时血瘀症的中药组合物
CN104777109A (zh) * 2015-03-16 2015-07-15 首都儿科研究所附属儿童医院 一种脓毒症诊断方法及试剂
CN110431425A (zh) * 2017-02-02 2019-11-08 B.R.A.H.M.S 有限公司 proADM作为指示不良事件的标志物
WO2022212914A1 (en) * 2021-04-01 2022-10-06 Ampio Pharmaceuticals, Inc. Methods of treating viral diseases

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090075831A1 (en) * 2004-10-13 2009-03-19 Stefan Russwurm Method for differentiating between the non-infectious and infectious causes of multiple organ failure
US20070092911A1 (en) * 2005-10-03 2007-04-26 Buechler Kenneth F Methods and compositions for diagnosis and /or prognosis in systemic inflammatory response syndromes
CN101396441A (zh) * 2007-09-26 2009-04-01 首都医科大学附属北京友谊医院 一种治疗多脏器功能不全综合征时血瘀症的中药组合物
CN101261229A (zh) * 2008-04-11 2008-09-10 中国人民解放军第三军医大学第三附属医院 创伤血清对炎性细胞NF-κB的激活作用检测及其用途
CN104777109A (zh) * 2015-03-16 2015-07-15 首都儿科研究所附属儿童医院 一种脓毒症诊断方法及试剂
CN110431425A (zh) * 2017-02-02 2019-11-08 B.R.A.H.M.S 有限公司 proADM作为指示不良事件的标志物
WO2022212914A1 (en) * 2021-04-01 2022-10-06 Ampio Pharmaceuticals, Inc. Methods of treating viral diseases

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
FRINK M 等: "IL-6 predicts organ dysfunction and mortality in patients with multiple injuries", SCAND J TRAUMA RESUSC EMERG MED, 27 September 2009 (2009-09-27), pages 1 - 7 *
GUIQING LI 等: "Effects of rhubarb TNF-α, IL-1 and IL-6 in patients with SIRS and MODS", INTEGRATED TRADITIONAL CHINESE AND WESTERN MEDICINE IN PRACTICE OF CRITICAL CARE MEDICINE, 31 January 2000 (2000-01-31), pages 1 - 5 *
姬晓伟;陆建红;周庆;占林兵;季爱琴;李丽琴;闵丽姗;胡北平;汪永斌;戴利成;谢波;: "白细胞介素-8、C反应蛋白及降钙素原与创伤性多器官功能障碍综合征发生及预后的相关性", 生物技术通讯, no. 06, 30 November 2015 (2015-11-30), pages 830 - 832 *
张晓华 等: "抗细胞因子治疗脓毒症的进展", 北京军区医药, vol. 13, no. 04, 31 August 2001 (2001-08-31), pages 241 - 242 *
谭波;陈媛媛;王兴勇;许峰;: "大鼠MODS发病机制探讨", 重庆医科大学学报, no. 10, 15 October 2007 (2007-10-15), pages 1041 - 1045 *
马玉东;孟凡鑫;宋岩;: "血清IL-6、CRP和PCT水平对严重多发伤后MODS的预测价值", 解剖科学进展, no. 01, 20 January 2013 (2013-01-20), pages 32 - 34 *
黎洪棉, 梁自乾: "大面积深度烧伤后全身炎症反应综合征的研究现状", 中国临床康复, no. 18, 5 June 2006 (2006-06-05), pages 200 - 202 *

Also Published As

Publication number Publication date
CN117554628B (zh) 2024-03-12

Similar Documents

Publication Publication Date Title
JP6621520B2 (ja) マルチマーカーリスク層別化
US20200005901A1 (en) Cancer classifier models, machine learning systems and methods of use
Fortino et al. Machine-learning–driven biomarker discovery for the discrimination between allergic and irritant contact dermatitis
EP3249408A1 (en) Methods of identification and diagnosis of lung diseases using classification systems and kits thereof
CN111640509A (zh) 一种宫颈癌术后复发风险预测方法及系统
JP2020507838A (ja) 対象特有の肺炎転記を予測するための教師付き学習を使用するためのシステムおよび方法
RU2017129983A (ru) Способ применения информации о сложной группе биомаркеров для диагностики злокачественной опухоли легкого у субъекта и диагностический набор и вычислительная система с её использованием.
JP2020522690A (ja) 肺疾病の特定又はモニタリング方法及びシステム
JP2020507746A (ja) 対象特有の菌血症転記を予測するための教師付き学習を使用するためのシステムおよび方法
JP2023526241A (ja) 複数の機械学習モデルに基づく臨床予測器
CN105209631A (zh) 使用所测分析物改进疾病诊断的方法
CN112735592B (zh) 肺癌预后模型的构建方法及应用方法、电子设备
US20230263477A1 (en) Universal pan cancer classifier models, machine learning systems and methods of use
Lamb et al. Development of an interstitial cystitis risk score for bladder permeability
CN113270188A (zh) 食管鳞癌根治术后患者预后预测模型构建方法及装置
Laino et al. An individualized algorithm to predict mortality in COVID-19 pneumonia: a machine learning based study
CN114188014A (zh) 一种患者院内不良预后预测模型构建方法、系统及应用
CN117554628B (zh) 用于mods早期预警的炎症因子组合物、模型及试剂盒
CN117558452B (zh) Mods风险评估模型构建方法、装置、设备及介质
Xue et al. Machine learning for the prediction of acute kidney injury in patients after cardiac surgery
Zhu et al. A new method for classifying different phenotypes of kidney transplantation
Roškar et al. Models including preoperative plasma levels of angiogenic factors, leptin and IL-8 as potential biomarkers of endometrial cancer
EP3790987A1 (en) Genome-wide classifiers for detection of subacute transplant rejection and other transplant conditions
Wang et al. Dimension-agnostic and granularity-based spatially variable gene identification
Leventhal et al. An interpretable machine learning pipeline based on transcriptomics predicts phenotypes of lupus patients

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant