CN116497116A

CN116497116A - 一种预测急性移植物抗宿主病的基因标志物及其应用

Info

Publication number: CN116497116A
Application number: CN202310592189.7A
Authority: CN
Inventors: 裴晓磊; 翟卫华; 韩明哲; 姜尔烈; 王佳丽; 刘佳
Original assignee: Institute of Hematology and Blood Diseases Hospital of CAMS and PUMC
Current assignee: Institute of Hematology and Blood Diseases Hospital of CAMS and PUMC
Priority date: 2023-05-23
Filing date: 2023-05-23
Publication date: 2023-07-28

Abstract

本发明公开了一种预测急性移植物抗宿主病的基因标志物及其应用。所述基因标志物包括：(1)DDX5、BLNK、OGG1、SLC16A11、UTS2B、ABHD17C、STING1、CAMK1D、TIGD6、TUBA4A、CBX6、RFX2、TEME19、ADAM8、SLC25A29、SLC24A3、NAB2、BAMBI、IL2、ABCC6和EARS2的组合，或，(2)CAMK1D、OGG1、NAB、IL2、STING1、ADAM8和TIGD6的组合。本发明首次发现所述基因标志物能够预测急性移植物抗宿主病，基因标志物组合可作为预测急性移植物抗宿主病新的分子标志物，还可用于构建预测急性移植物抗宿主病模型应用于急性移植物抗宿主病的预测，能够更稳定、经济、准确且更早期地预测急性移植物抗宿主病。

Description

一种预测急性移植物抗宿主病的基因标志物及其应用

技术领域

本发明属于分子生物化学技术领域，涉及一种预测急性移植物抗宿主病的基因标志物及其应用。

背景技术

同种异基因造血干细胞移植(allo-HSCT)目前在临床上应用广泛，主要依据供、受者HLA抗原基因的匹配程度来选择供者。急性移植物抗宿主病(aGVHD)是其常见的并发症、发病率约40％。临床上缺乏有效的aGVHD预测手段，aGVHD的预防及治疗方法亦有限，部分患者起病急、病情进展快、严重影响移植预后。

目前，对GVHD发生机制的研究有很多，GVHD在细胞层面和组织器官层面的发生机制较为复杂，尤其是无法反映出供者来源免疫细胞对受者细胞上的“抗原”的反应能力。混合淋巴细胞培养(MLC)是指将供、受者的外周血PBMC按照一定比例混合后，经过培养，观察PBMC的活化和增殖情况。虽然经典的供/受者混合淋巴细胞培养在一定程度上反映出供者免疫细胞对受者抗原的反应能力，但是，已有多个独立的临床研究发现，MLC后观察增殖不能精准预测allo-HSCT后aGVHD发生风险，不能反映免疫排斥，MLC后免疫排斥导致的免疫细胞活化比增殖更为敏感。

目前也有采用检测细胞因子表达水平来预测GVHD，例如CN111549126A公开了一种用于预测或诊断GVHD的试剂盒、GVHD的风险计算方法和应用，所述细胞因子包括：TIM-3、MMP-3、IL-2R、IL-6、IL-8、CD30、ST2、TNFRI、HGF、REG3a、MIG、Elafin、骨调素和颗粒酶A。通过该细胞因子组合可高通量、快速有效地测定GVHD，通过动态监测细胞因子组合的变化，可直接或间接地分析和判断GVHD的程度。CN110988364A公开了一种应用流式细胞术检测移植后GVHD相关细胞因子的方法及检测试剂盒，能够同时快速均相检测GVHD诊断与预后相关细胞因子IL-6、IL-8、ST2、Reg3α、Elafin、TNFR1、可溶性IL-2R、HGF中的一项或多项不同组合的指标，实现单样本多重检测，节省时间和资源，软件自动分析结果，更加客观准确，检测安全，样本用量少，检测细胞因子表达水平为诊断治疗GVHD提供一种新的途径。

综上所述，目前仍缺乏有效精确预测GVHD的方法。如何提供一种预测急性移植物抗宿主病的基因标志物，实现稳定、经济、准确且更早期地预测急性移植物抗宿主病，已成为目前生物技术领域亟待解决的问题之一。

发明内容

针对现有技术的不足和实际需求，本发明提供一种预测急性移植物抗宿主病的基因标志物及其应用，解决了现有预测急性移植物抗宿主病的方法不能准确且更早期预测急性移植物抗宿主病的问题，实现了精准预测aGVHD，结合造血干细胞移植前供受者的HLA基因配型，可以选择更安全、有效的供者，此外，对造血干细胞移植后其他严重并发症的发生也具有非常高的预测准确性，有助于临床预防方案的实施。

为达到此发明目的，本发明采用以下技术方案：

第一方面，本发明提供了一种预测急性移植物抗宿主病的基因标志物，所述基因标志物包括：

(1)DDX5、BLNK、OGG1、SLC16A11、UTS2B、ABHD17C、STING1、CAMK1D、TIGD6、TUBA4A、CBX6、RFX2、TEME19、ADAM8、SLC25A29、SLC24A3、NAB2、BAMBI、IL2、ABCC6和EARS2的组合，或，

(2)CAMK1D、OGG1、NAB、IL2、STING1、ADAM8和TIGD6的组合。

本发明首次发现所述基因标志物能够预测急性移植物抗宿主病，基因标志物组合可作为预测急性移植物抗宿主病新的分子标志物，还可用于构建预测急性移植物抗宿主病模型应用于急性移植物抗宿主病的预测，能够更稳定、经济、准确且更早期地预测急性移植物抗宿主病。

第二方面，本发明提供了第一方面所述的预测急性移植物抗宿主病的基因标志物和/或其检测试剂在制备急性移植物抗宿主病检测产品中的应用。

第三方面，本发明提供了一种检测急性移植物抗宿主病的试剂盒，所述试剂盒包括用于检测第一方面所述的预测急性移植物抗宿主病的基因标志物的试剂。

优选地，所述试剂包括核酸提取试剂和/或核酸纯化试剂。

第四方面，本发明提供了第一方面所述的预测急性移植物抗宿主病的基因标志物和/或其检测试剂在构建预测急性移植物抗宿主病的模型或制备预测急性移植物抗宿主病的装置中的应用。

第五方面，本发明提供了一种构建预测急性移植物抗宿主病的模型的方法，其特征在于，所述方法包括以下步骤：

(1)提取样本细胞进行测序，获取基因转录组表达水平，收集预后信息；

(2)将预后信息随机分为训练组和测试组，使用训练组数据的每个基因的转录水平表达数据作为输入信息，患者GVHD的发病程度作为输出信息，使用计算每个基因预测GVHD的AUC数值，选取AUC>0.65或AUC<-0.35的基因作为候选基因；

(3)根据候选基因在不同个体中的表达水平，筛选相关系数最低的40-60个基因，使用机器学习算法构建筛选出的基因对GVHD的预测。

优选地，步骤(1)中所述预后信息包括GVHD的发生时间、发生部位、严重程度和主要症状。

优选地，步骤(3)中所述筛选的标准为：(a)首先选取0-II度aGVHD和Ⅲ-IV度aGVHD组之间差异表达的单基因的AUC值最高的前20个基因和AUC值最低的前20个基因；(b)其次对(a)中的40个基因进行相关性分析，若相关性分数高于0.4，则保留其中AUC值最高的基因，排除其中其他基因，最后剩余的基因作为候选预测特征基因。

优选地，所述待测样本包括不同供者和受者的外周血单个核细胞。

优选地，所述外周血单个核细胞进行了混合淋巴细胞反应。

优选地，所述机器学习算法包括经典决策树模型、随机森林模型或支持向量机模型中任意一种。

第六方面，本发明提供了一种预测急性移植物抗宿主病的模型，所述预测急性移植物抗宿主病的模型由第五方面所述的构建预测急性移植物抗宿主病的模型的方法构建得到。

第七方面，本发明提供了一种预测急性移植物抗宿主病的装置，所述装置包括：

模型构建模块和预测模块；

所述模型构建模块用于执行包括：

(3)根据候选基因在不同个体中的表达水平，筛选相关系数最低的40-60个基因，使用机器学习算法构建筛选出的基因对GVHD的预测；

所述预测模块用于执行包括：

利用模型构建模块构建的预测急性移植物抗宿主病的模型预测待测样本急性移植物抗宿主病。

与现有技术相比，本发明具有如下有益效果：

(1)本发明使用全基因转录组表达水平来代表免疫细胞的活化，收集患者移植前各项常规指标外，加入混合淋巴细胞培养后的全基因转录组数据，并作为主要参考自变量，能显著提高机器学习算法预测GVHD的准确率，能够更精准预测aGVHD；

(2)本发明结合造血干细胞移植前供受者的HLA基因配型，可以选择更安全、有效的供者；

(3)本发明对造血干细胞移植后重度GVHD和其他严重并发症的发生具有非常高的预测准确性，有助于临床预防方案的实施。

附图说明

图1为本发明中造血干细胞移植后重度GVHD预测模型的构建过程图；

图2为在外部验证样本中，经典决策树模型对造血干细胞移植后各级GVHD的分类预测能力图；

图3为机器学习模型筛选的预测GVHD相关的特征基因集图；

图4为在外部验证样本中，随机森林模型对造血干细胞移植后各级GVHD的分类预测能力图；

图5为在外部验证样本中，支持向量机模型对造血干细胞移植后各级GVHD的分类预测能力图。

具体实施方式

为进一步阐述本发明所采取的技术手段及其效果，以下结合实施例和附图对本发明作进一步地说明。可以理解的是，此处所描述的具体实施方式仅仅用于解释本发明，而非对本发明的限定。

实施例中未注明具体技术或条件者，按照本领域内的文献所描述的技术或条件，或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者，均为可通过正规渠道商购获得的常规产品。

实施例1

本实施例构建造血干细胞移植后重度移植物抗宿主病(GVHD)预测模型。

收集145对供受者外周血淋巴细胞混合培养后bulk RNA测序结果，对测序结果进行分析，获得每对供受者的淋巴细胞基因转录组表达水平，同时收集145例患者的预后信息，包括移植物抗宿主病的发生时间、发生部位、严重程度、患者移植后有无复发，有无死亡的情况。将145例患者数据随机分为训练组和测试组，使用训练组数据的每个基因的转录水平表达数据作为输入信息，患者移植物抗宿主病的发病程度(0-I为轻度，II-IV为中重度)作为输出信息，使用ROC(受试者工作特征曲线)算法计算每个基因对GVHD的预测，计算每个基因预测GVHD的AUC数值，选取AUC>0.65和AUC<-0.35的基因作为候选基因。再根据每个候选基因在不同个体中的表达水平，筛选相关系数最低的50个基因，使用经典决策树算法、随机森林算法和支持向量机(SVM)算法构建多基因对GVHD的预测。最后使用测试组的基因表达数据和GVHD发病情况对三种机器学习模型进行测试，获得预测性能。

实施例2

经典决策树模型对造血干细胞移植后各级GVHD的分类预测能力评估。

在经典决策树模型中，我们计算并获得候选基因集的相对表达水平，患者的GVHD发病情况分为0-I、I-II、II-III和III-IV度，获得主要基因和GVHD严重程度的预测路线。如图2所示，通过关键基因的水平决策，经典决策树模型对GVHD分类的决策准确率超过90％。

实施例3

机器学习模型筛选的预测GVHD相关的特征基因集。

我们获取候选基因(50个基因)的表达水平与GVHD发生程度的对应关系后，使用随机森林算法和SVM算法筛选关键特征基因，根据递减基尼系数进行排序，如图3所示，获得最高的20个基因，作为机器学习预测模型特征基因，其中经典决策树的决策基因与机器学习预测模型特征基因存在大比例重合。

实施例4

随机森林模型对造血干细胞移植后各级GVHD的分类预测能力评估。

我们通过机器学习预测模型特征基因集与随机森林算法结合，构建预测造血干细胞移植后重度GVHD的随机森林预测模型，在训练集中，我们使用5次交叉验证的方法，将随机森林模型的参数进行优化，再使用验证集对训练好的随机森林模型进行验证，获得的预测性能如图4所示，预测准确率高达90％。

实施例5

支持向量机模型对造血干细胞移植后各级GVHD的分类预测能力评估。

我们通过机器学习预测模型特征基因集与SVM算法结合，构建预测造血干细胞移植后重度GVHD的SVM预测模型，我们使用SVM基本参数为：线性核心、cost＝0.1。在训练集中，我们使用5次交叉验证的方法，将SVM模型的参数进行优化，再使用验证集对训练好的SVM模型进行验证，获得的预测性能如图4所示，预测准确率高达92％。

综上所述，本发明首次发现所述基因标志物能够预测急性移植物抗宿主病，基因标志物组合可作为预测急性移植物抗宿主病新的分子标志物，还可用于构建预测急性移植物抗宿主病模型应用于急性移植物抗宿主病的预测，能够更稳定、经济、准确且更早期地预测急性移植物抗宿主病。

申请人声明，本发明通过上述实施例来说明本发明的详细方法，但本发明并不局限于上述详细方法，即不意味着本发明必须依赖上述详细方法才能实施。所属技术领域的技术人员应该明了，对本发明的任何改进，对本发明产品各原料的等效替换及辅助成分的添加、具体方式的选择等，均落在本发明的保护范围和公开范围之内。

Claims

1.一种预测急性移植物抗宿主病的基因标志物，其特征在于，所述基因标志物包括：

(2)CAMK1D、OGG1、NAB、IL2、STING1、ADAM8和TIGD6的组合。

2.权利要求1所述的预测急性移植物抗宿主病的基因标志物和/或其检测试剂在制备急性移植物抗宿主病检测产品中的应用。

3.一种检测急性移植物抗宿主病的试剂盒，其特征在于，所述试剂盒包括用于检测权利要求1所述的预测急性移植物抗宿主病的基因标志物的试剂；

优选地，所述试剂包括核酸提取试剂和/或核酸纯化试剂。

4.权利要求1所述的预测急性移植物抗宿主病的基因标志物和/或其检测试剂在构建预测急性移植物抗宿主病的模型或制备预测急性移植物抗宿主病的装置中的应用。

5.一种构建预测急性移植物抗宿主病的模型的方法，其特征在于，所述方法包括以下步骤：

6.根据权利要求5所述的构建预测急性移植物抗宿主病的方法，其特征在于，步骤(1)中所述预后信息包括GVHD的发生时间、发生部位、严重程度和主要症状。

7.根据权利要求5所述的构建预测急性移植物抗宿主病的模型的方法，其特征在于，步骤(3)中所述筛选的标准为：(a)首先选取0-II度aGVHD和Ⅲ-IV度aGVHD组之间差异表达的单基因的AUC值最高的前20个基因和AUC值最低的前20个基因；(b)其次对(a)中的40个基因进行相关性分析，若相关性分数高于0.4，则保留其中AUC值最高的基因，排除其中其他基因，最后剩余的基因作为候选预测特征基因。

8.根据权利要求5-7任一项所述的构建预测急性移植物抗宿主病的模型的方法，其特征在于，所述待测样本包括：不同供者和受者的外周血单个核细胞；

优选地，所述外周血单个核细胞进行了混合淋巴细胞反应；

9.一种预测急性移植物抗宿主病的模型，其特征在于，所述预测急性移植物抗宿主病的模型由权利要求5-8任一项所述的构建预测急性移植物抗宿主病的模型的方法构建得到。

10.一种预测急性移植物抗宿主病的装置，其特征在于，所述装置包括：

模型构建模块和预测模块；

所述模型构建模块用于执行包括：

所述预测模块用于执行包括：