CN116497116A - 一种预测急性移植物抗宿主病的基因标志物及其应用 - Google Patents

一种预测急性移植物抗宿主病的基因标志物及其应用 Download PDF

Info

Publication number
CN116497116A
CN116497116A CN202310592189.7A CN202310592189A CN116497116A CN 116497116 A CN116497116 A CN 116497116A CN 202310592189 A CN202310592189 A CN 202310592189A CN 116497116 A CN116497116 A CN 116497116A
Authority
CN
China
Prior art keywords
host disease
versus
acute graft
genes
predicting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310592189.7A
Other languages
English (en)
Inventor
裴晓磊
翟卫华
韩明哲
姜尔烈
王佳丽
刘佳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Hematology and Blood Diseases Hospital of CAMS and PUMC
Original Assignee
Institute of Hematology and Blood Diseases Hospital of CAMS and PUMC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Hematology and Blood Diseases Hospital of CAMS and PUMC filed Critical Institute of Hematology and Blood Diseases Hospital of CAMS and PUMC
Priority to CN202310592189.7A priority Critical patent/CN116497116A/zh
Publication of CN116497116A publication Critical patent/CN116497116A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biotechnology (AREA)
  • Artificial Intelligence (AREA)
  • Public Health (AREA)
  • Organic Chemistry (AREA)
  • Evolutionary Computation (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Epidemiology (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Zoology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Wood Science & Technology (AREA)
  • Pathology (AREA)
  • Genetics & Genomics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Molecular Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Bioethics (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)

Abstract

本发明公开了一种预测急性移植物抗宿主病的基因标志物及其应用。所述基因标志物包括:(1)DDX5、BLNK、OGG1、SLC16A11、UTS2B、ABHD17C、STING1、CAMK1D、TIGD6、TUBA4A、CBX6、RFX2、TEME19、ADAM8、SLC25A29、SLC24A3、NAB2、BAMBI、IL2、ABCC6和EARS2的组合,或,(2)CAMK1D、OGG1、NAB、IL2、STING1、ADAM8和TIGD6的组合。本发明首次发现所述基因标志物能够预测急性移植物抗宿主病,基因标志物组合可作为预测急性移植物抗宿主病新的分子标志物,还可用于构建预测急性移植物抗宿主病模型应用于急性移植物抗宿主病的预测,能够更稳定、经济、准确且更早期地预测急性移植物抗宿主病。

Description

一种预测急性移植物抗宿主病的基因标志物及其应用
技术领域
本发明属于分子生物化学技术领域,涉及一种预测急性移植物抗宿主病的基因标志物及其应用。
背景技术
同种异基因造血干细胞移植(allo-HSCT)目前在临床上应用广泛,主要依据供、受者HLA抗原基因的匹配程度来选择供者。急性移植物抗宿主病(aGVHD)是其常见的并发症、发病率约40%。临床上缺乏有效的aGVHD预测手段,aGVHD的预防及治疗方法亦有限,部分患者起病急、病情进展快、严重影响移植预后。
目前,对GVHD发生机制的研究有很多,GVHD在细胞层面和组织器官层面的发生机制较为复杂,尤其是无法反映出供者来源免疫细胞对受者细胞上的“抗原”的反应能力。混合淋巴细胞培养(MLC)是指将供、受者的外周血PBMC按照一定比例混合后,经过培养,观察PBMC的活化和增殖情况。虽然经典的供/受者混合淋巴细胞培养在一定程度上反映出供者免疫细胞对受者抗原的反应能力,但是,已有多个独立的临床研究发现,MLC后观察增殖不能精准预测allo-HSCT后aGVHD发生风险,不能反映免疫排斥,MLC后免疫排斥导致的免疫细胞活化比增殖更为敏感。
目前也有采用检测细胞因子表达水平来预测GVHD,例如CN111549126A公开了一种用于预测或诊断GVHD的试剂盒、GVHD的风险计算方法和应用,所述细胞因子包括:TIM-3、MMP-3、IL-2R、IL-6、IL-8、CD30、ST2、TNFRI、HGF、REG3a、MIG、Elafin、骨调素和颗粒酶A。通过该细胞因子组合可高通量、快速有效地测定GVHD,通过动态监测细胞因子组合的变化,可直接或间接地分析和判断GVHD的程度。CN110988364A公开了一种应用流式细胞术检测移植后GVHD相关细胞因子的方法及检测试剂盒,能够同时快速均相检测GVHD诊断与预后相关细胞因子IL-6、IL-8、ST2、Reg3α、Elafin、TNFR1、可溶性IL-2R、HGF中的一项或多项不同组合的指标,实现单样本多重检测,节省时间和资源,软件自动分析结果,更加客观准确,检测安全,样本用量少,检测细胞因子表达水平为诊断治疗GVHD提供一种新的途径。
综上所述,目前仍缺乏有效精确预测GVHD的方法。如何提供一种预测急性移植物抗宿主病的基因标志物,实现稳定、经济、准确且更早期地预测急性移植物抗宿主病,已成为目前生物技术领域亟待解决的问题之一。
发明内容
针对现有技术的不足和实际需求,本发明提供一种预测急性移植物抗宿主病的基因标志物及其应用,解决了现有预测急性移植物抗宿主病的方法不能准确且更早期预测急性移植物抗宿主病的问题,实现了精准预测aGVHD,结合造血干细胞移植前供受者的HLA基因配型,可以选择更安全、有效的供者,此外,对造血干细胞移植后其他严重并发症的发生也具有非常高的预测准确性,有助于临床预防方案的实施。
为达到此发明目的,本发明采用以下技术方案:
第一方面,本发明提供了一种预测急性移植物抗宿主病的基因标志物,所述基因标志物包括:
(1)DDX5、BLNK、OGG1、SLC16A11、UTS2B、ABHD17C、STING1、CAMK1D、TIGD6、TUBA4A、CBX6、RFX2、TEME19、ADAM8、SLC25A29、SLC24A3、NAB2、BAMBI、IL2、ABCC6和EARS2的组合,或,
(2)CAMK1D、OGG1、NAB、IL2、STING1、ADAM8和TIGD6的组合。
本发明首次发现所述基因标志物能够预测急性移植物抗宿主病,基因标志物组合可作为预测急性移植物抗宿主病新的分子标志物,还可用于构建预测急性移植物抗宿主病模型应用于急性移植物抗宿主病的预测,能够更稳定、经济、准确且更早期地预测急性移植物抗宿主病。
第二方面,本发明提供了第一方面所述的预测急性移植物抗宿主病的基因标志物和/或其检测试剂在制备急性移植物抗宿主病检测产品中的应用。
第三方面,本发明提供了一种检测急性移植物抗宿主病的试剂盒,所述试剂盒包括用于检测第一方面所述的预测急性移植物抗宿主病的基因标志物的试剂。
优选地,所述试剂包括核酸提取试剂和/或核酸纯化试剂。
第四方面,本发明提供了第一方面所述的预测急性移植物抗宿主病的基因标志物和/或其检测试剂在构建预测急性移植物抗宿主病的模型或制备预测急性移植物抗宿主病的装置中的应用。
第五方面,本发明提供了一种构建预测急性移植物抗宿主病的模型的方法,其特征在于,所述方法包括以下步骤:
(1)提取样本细胞进行测序,获取基因转录组表达水平,收集预后信息;
(2)将预后信息随机分为训练组和测试组,使用训练组数据的每个基因的转录水平表达数据作为输入信息,患者GVHD的发病程度作为输出信息,使用计算每个基因预测GVHD的AUC数值,选取AUC>0.65或AUC<-0.35的基因作为候选基因;
(3)根据候选基因在不同个体中的表达水平,筛选相关系数最低的40-60个基因,使用机器学习算法构建筛选出的基因对GVHD的预测。
优选地,步骤(1)中所述预后信息包括GVHD的发生时间、发生部位、严重程度和主要症状。
优选地,步骤(3)中所述筛选的标准为:(a)首先选取0-II度aGVHD和Ⅲ-IV度aGVHD组之间差异表达的单基因的AUC值最高的前20个基因和AUC值最低的前20个基因;(b)其次对(a)中的40个基因进行相关性分析,若相关性分数高于0.4,则保留其中AUC值最高的基因,排除其中其他基因,最后剩余的基因作为候选预测特征基因。
优选地,所述待测样本包括不同供者和受者的外周血单个核细胞。
优选地,所述外周血单个核细胞进行了混合淋巴细胞反应。
优选地,所述机器学习算法包括经典决策树模型、随机森林模型或支持向量机模型中任意一种。
第六方面,本发明提供了一种预测急性移植物抗宿主病的模型,所述预测急性移植物抗宿主病的模型由第五方面所述的构建预测急性移植物抗宿主病的模型的方法构建得到。
第七方面,本发明提供了一种预测急性移植物抗宿主病的装置,所述装置包括:
模型构建模块和预测模块;
所述模型构建模块用于执行包括:
(1)提取样本细胞进行测序,获取基因转录组表达水平,收集预后信息;
(2)将预后信息随机分为训练组和测试组,使用训练组数据的每个基因的转录水平表达数据作为输入信息,患者GVHD的发病程度作为输出信息,使用计算每个基因预测GVHD的AUC数值,选取AUC>0.65或AUC<-0.35的基因作为候选基因;
(3)根据候选基因在不同个体中的表达水平,筛选相关系数最低的40-60个基因,使用机器学习算法构建筛选出的基因对GVHD的预测;
所述预测模块用于执行包括:
利用模型构建模块构建的预测急性移植物抗宿主病的模型预测待测样本急性移植物抗宿主病。
与现有技术相比,本发明具有如下有益效果:
(1)本发明使用全基因转录组表达水平来代表免疫细胞的活化,收集患者移植前各项常规指标外,加入混合淋巴细胞培养后的全基因转录组数据,并作为主要参考自变量,能显著提高机器学习算法预测GVHD的准确率,能够更精准预测aGVHD;
(2)本发明结合造血干细胞移植前供受者的HLA基因配型,可以选择更安全、有效的供者;
(3)本发明对造血干细胞移植后重度GVHD和其他严重并发症的发生具有非常高的预测准确性,有助于临床预防方案的实施。
附图说明
图1为本发明中造血干细胞移植后重度GVHD预测模型的构建过程图;
图2为在外部验证样本中,经典决策树模型对造血干细胞移植后各级GVHD的分类预测能力图;
图3为机器学习模型筛选的预测GVHD相关的特征基因集图;
图4为在外部验证样本中,随机森林模型对造血干细胞移植后各级GVHD的分类预测能力图;
图5为在外部验证样本中,支持向量机模型对造血干细胞移植后各级GVHD的分类预测能力图。
具体实施方式
为进一步阐述本发明所采取的技术手段及其效果,以下结合实施例和附图对本发明作进一步地说明。可以理解的是,此处所描述的具体实施方式仅仅用于解释本发明,而非对本发明的限定。
实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件,或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可通过正规渠道商购获得的常规产品。
实施例1
本实施例构建造血干细胞移植后重度移植物抗宿主病(GVHD)预测模型。
收集145对供受者外周血淋巴细胞混合培养后bulk RNA测序结果,对测序结果进行分析,获得每对供受者的淋巴细胞基因转录组表达水平,同时收集145例患者的预后信息,包括移植物抗宿主病的发生时间、发生部位、严重程度、患者移植后有无复发,有无死亡的情况。将145例患者数据随机分为训练组和测试组,使用训练组数据的每个基因的转录水平表达数据作为输入信息,患者移植物抗宿主病的发病程度(0-I为轻度,II-IV为中重度)作为输出信息,使用ROC(受试者工作特征曲线)算法计算每个基因对GVHD的预测,计算每个基因预测GVHD的AUC数值,选取AUC>0.65和AUC<-0.35的基因作为候选基因。再根据每个候选基因在不同个体中的表达水平,筛选相关系数最低的50个基因,使用经典决策树算法、随机森林算法和支持向量机(SVM)算法构建多基因对GVHD的预测。最后使用测试组的基因表达数据和GVHD发病情况对三种机器学习模型进行测试,获得预测性能。
实施例2
经典决策树模型对造血干细胞移植后各级GVHD的分类预测能力评估。
在经典决策树模型中,我们计算并获得候选基因集的相对表达水平,患者的GVHD发病情况分为0-I、I-II、II-III和III-IV度,获得主要基因和GVHD严重程度的预测路线。如图2所示,通过关键基因的水平决策,经典决策树模型对GVHD分类的决策准确率超过90%。
实施例3
机器学习模型筛选的预测GVHD相关的特征基因集。
我们获取候选基因(50个基因)的表达水平与GVHD发生程度的对应关系后,使用随机森林算法和SVM算法筛选关键特征基因,根据递减基尼系数进行排序,如图3所示,获得最高的20个基因,作为机器学习预测模型特征基因,其中经典决策树的决策基因与机器学习预测模型特征基因存在大比例重合。
实施例4
随机森林模型对造血干细胞移植后各级GVHD的分类预测能力评估。
我们通过机器学习预测模型特征基因集与随机森林算法结合,构建预测造血干细胞移植后重度GVHD的随机森林预测模型,在训练集中,我们使用5次交叉验证的方法,将随机森林模型的参数进行优化,再使用验证集对训练好的随机森林模型进行验证,获得的预测性能如图4所示,预测准确率高达90%。
实施例5
支持向量机模型对造血干细胞移植后各级GVHD的分类预测能力评估。
我们通过机器学习预测模型特征基因集与SVM算法结合,构建预测造血干细胞移植后重度GVHD的SVM预测模型,我们使用SVM基本参数为:线性核心、cost=0.1。在训练集中,我们使用5次交叉验证的方法,将SVM模型的参数进行优化,再使用验证集对训练好的SVM模型进行验证,获得的预测性能如图4所示,预测准确率高达92%。
综上所述,本发明首次发现所述基因标志物能够预测急性移植物抗宿主病,基因标志物组合可作为预测急性移植物抗宿主病新的分子标志物,还可用于构建预测急性移植物抗宿主病模型应用于急性移植物抗宿主病的预测,能够更稳定、经济、准确且更早期地预测急性移植物抗宿主病。
申请人声明,本发明通过上述实施例来说明本发明的详细方法,但本发明并不局限于上述详细方法,即不意味着本发明必须依赖上述详细方法才能实施。所属技术领域的技术人员应该明了,对本发明的任何改进,对本发明产品各原料的等效替换及辅助成分的添加、具体方式的选择等,均落在本发明的保护范围和公开范围之内。

Claims (10)

1.一种预测急性移植物抗宿主病的基因标志物,其特征在于,所述基因标志物包括:
(1)DDX5、BLNK、OGG1、SLC16A11、UTS2B、ABHD17C、STING1、CAMK1D、TIGD6、TUBA4A、CBX6、RFX2、TEME19、ADAM8、SLC25A29、SLC24A3、NAB2、BAMBI、IL2、ABCC6和EARS2的组合,或,
(2)CAMK1D、OGG1、NAB、IL2、STING1、ADAM8和TIGD6的组合。
2.权利要求1所述的预测急性移植物抗宿主病的基因标志物和/或其检测试剂在制备急性移植物抗宿主病检测产品中的应用。
3.一种检测急性移植物抗宿主病的试剂盒,其特征在于,所述试剂盒包括用于检测权利要求1所述的预测急性移植物抗宿主病的基因标志物的试剂;
优选地,所述试剂包括核酸提取试剂和/或核酸纯化试剂。
4.权利要求1所述的预测急性移植物抗宿主病的基因标志物和/或其检测试剂在构建预测急性移植物抗宿主病的模型或制备预测急性移植物抗宿主病的装置中的应用。
5.一种构建预测急性移植物抗宿主病的模型的方法,其特征在于,所述方法包括以下步骤:
(1)提取样本细胞进行测序,获取基因转录组表达水平,收集预后信息;
(2)将预后信息随机分为训练组和测试组,使用训练组数据的每个基因的转录水平表达数据作为输入信息,患者GVHD的发病程度作为输出信息,使用计算每个基因预测GVHD的AUC数值,选取AUC>0.65或AUC<-0.35的基因作为候选基因;
(3)根据候选基因在不同个体中的表达水平,筛选相关系数最低的40-60个基因,使用机器学习算法构建筛选出的基因对GVHD的预测。
6.根据权利要求5所述的构建预测急性移植物抗宿主病的方法,其特征在于,步骤(1)中所述预后信息包括GVHD的发生时间、发生部位、严重程度和主要症状。
7.根据权利要求5所述的构建预测急性移植物抗宿主病的模型的方法,其特征在于,步骤(3)中所述筛选的标准为:(a)首先选取0-II度aGVHD和Ⅲ-IV度aGVHD组之间差异表达的单基因的AUC值最高的前20个基因和AUC值最低的前20个基因;(b)其次对(a)中的40个基因进行相关性分析,若相关性分数高于0.4,则保留其中AUC值最高的基因,排除其中其他基因,最后剩余的基因作为候选预测特征基因。
8.根据权利要求5-7任一项所述的构建预测急性移植物抗宿主病的模型的方法,其特征在于,所述待测样本包括:不同供者和受者的外周血单个核细胞;
优选地,所述外周血单个核细胞进行了混合淋巴细胞反应;
优选地,所述机器学习算法包括经典决策树模型、随机森林模型或支持向量机模型中任意一种。
9.一种预测急性移植物抗宿主病的模型,其特征在于,所述预测急性移植物抗宿主病的模型由权利要求5-8任一项所述的构建预测急性移植物抗宿主病的模型的方法构建得到。
10.一种预测急性移植物抗宿主病的装置,其特征在于,所述装置包括:
模型构建模块和预测模块;
所述模型构建模块用于执行包括:
(1)提取样本细胞进行测序,获取基因转录组表达水平,收集预后信息;
(2)将预后信息随机分为训练组和测试组,使用训练组数据的每个基因的转录水平表达数据作为输入信息,患者GVHD的发病程度作为输出信息,使用计算每个基因预测GVHD的AUC数值,选取AUC>0.65或AUC<-0.35的基因作为候选基因;
(3)根据候选基因在不同个体中的表达水平,筛选相关系数最低的40-60个基因,使用机器学习算法构建筛选出的基因对GVHD的预测;
所述预测模块用于执行包括:
利用模型构建模块构建的预测急性移植物抗宿主病的模型预测待测样本急性移植物抗宿主病。
CN202310592189.7A 2023-05-23 2023-05-23 一种预测急性移植物抗宿主病的基因标志物及其应用 Pending CN116497116A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310592189.7A CN116497116A (zh) 2023-05-23 2023-05-23 一种预测急性移植物抗宿主病的基因标志物及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310592189.7A CN116497116A (zh) 2023-05-23 2023-05-23 一种预测急性移植物抗宿主病的基因标志物及其应用

Publications (1)

Publication Number Publication Date
CN116497116A true CN116497116A (zh) 2023-07-28

Family

ID=87316567

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310592189.7A Pending CN116497116A (zh) 2023-05-23 2023-05-23 一种预测急性移植物抗宿主病的基因标志物及其应用

Country Status (1)

Country Link
CN (1) CN116497116A (zh)

Similar Documents

Publication Publication Date Title
Der et al. Single cell RNA sequencing to dissect the molecular heterogeneity in lupus nephritis
Chaussabel et al. A modular analysis framework for blood genomics studies: application to systemic lupus erythematosus
US9752191B2 (en) Gene expression profiles associated with chronic allograft nephropathy
CN110577998A (zh) 预测肝癌术后早期复发风险分子模型的构建及其应用评估
CN107532214A (zh) 用于败血症诊断的方法
CN110246539B (zh) 一种免疫力水平评估的方法及装置
CN111394456B (zh) 早期肺腺癌患者预后评估系统及其应用
CN101208602A (zh) 脓毒症的诊断
CN105219844A (zh) 一种谱筛查十一种疾病的基因标志物组合、试剂盒以及疾病风险预测模型
CN112063699B (zh) 一种用于研究hiv感染者免疫衰老机制的系统
CN112313497A (zh) 使用微流式细胞术诊断疾病的方法
CN112831562A (zh) 一种用于预测肝癌患者切除术后复发风险的生物标志物组合、试剂盒
CN107208131A (zh) 用于肺癌分型的方法
WO2021219829A1 (en) Cell-type identification
CN113234829A (zh) 结肠癌预后评估基因集及其构建方法
Beadle et al. Application of the Banff Human Organ Transplant Panel to kidney transplant biopsies with features suspicious for antibody-mediated rejection
CN116497116A (zh) 一种预测急性移植物抗宿主病的基因标志物及其应用
CN114822827B (zh) 一种慢性阻塞性肺疾病急性加重预测系统和预测方法
CN111088360A (zh) Pd1-ctla4和/或pdl2-ctla4在制备预测aml预后试剂盒中的应用
CN116287204A (zh) 检测特征基因的突变情况在制备静脉血栓栓塞症风险检测产品中的应用
RU2715633C2 (ru) Способ идентификации в иммунном репертуаре cdr3 участков, ассоциированных с заболеваниями
US20230028910A1 (en) Method for diagnosing cutaneous t-cell lymphoma diseases
CN113584175A (zh) 一组评估肾乳头状细胞癌进展风险的分子标记及其筛选方法和应用
CN113564246A (zh) 单细胞测序作为标志物在制备诊断原发性干燥综合征中的应用
WO2020236745A1 (en) Immunorepertoire wellness assessment systems and methods

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination