多发性硬化的诊断miRNA概况
技术领域
本发明涉及一种诊断多发性硬化(multiple sclerosis)的方法。
背景技术
最近,分子诊断已经受到越来越多的关注。分子诊断发现了进入疾病的临床诊断(特别是传染性病原体的检测、基因组突变的检测、病变细胞的检测和对疾病诱因的危险因子的识别)的入口。
特别地,通过确定组织中的基因表达,核酸分析在疾病的研究和诊断方面开辟了新的极具前景的可能性。
待检测的目标核酸包括基因组DNA、表达mRNA和其它例如微RNA(MicroRNA)(简称miRNA)的RNA。miRNA是一类新的具有各种生物功能的小型RNA(A.Keller et al.,Nat Methods.20118(10):841-3)。它们是发现于真核细胞的短(平均为20~24个核苷酸)核糖核酸(RNA)分子。在哺乳动物中已经确定有数百种不同种类的微RNA(即数百个不同的序列)。它们对于后转录的基因调控来说是重要的,并且与靶信使RNA转录物(mRNAs)上的互补序列结合,这可导致翻译阻抑或靶退化(target degradation)和基因沉默。因此,也可将它们用作为研究、诊断和治疗目的而使用的生物标记。
多发性硬化(MS)是中枢神经系统的炎症自身免疫病,其中大脑和脊髓的轴突周围的髓鞘受到破坏,从而导致脱髓鞘和瘢痕形成以及广泛的临床信号和症状。可以将MS归类成不同的疾病亚类,包括复发/缓解MS(RRMS)、继发进展MS、原发进展MS和进展复发MS。复发-缓解亚类以不可预测的复发为特征,后续相对安静(缓解)的数月至数年的时间段内没有任何疾病活性的新迹象。复发-缓解亚类通常以临床孤立综合征(CIS)为起点。在CIS中,患者遭受暗示脱髓鞘的攻击。通常CIS标志着MS的开始。
多发性硬化的诊断通常涉及不同临床数据、成像数据和实验数据的分析。一些患者在携带MS生活数年之后才被诊断患病。
综合征可以和其它疾病和医学问题相似。为了诊断需要得到MS病变传播的临床、成像、实验和放射学数据,这会是费时的、昂贵的且困难的。可以实施脑脊液(CSF)的测试以助于诊断MS,然而,为了获得CSF会涉及腰穿刺这一令人不愉悦的且冒险的步骤。
因此,亟需一种有效的、简单的、可信赖的MS诊断测试。
定义
除非另有声明,本文所使用的技术和科学术语的含义与本发明所属领域的普通技术人员通常所理解的含义相同。
如本文所使用的术语“多发性硬化”或“MS”涉及神经系统的炎症疾病,并意指包括疾病的全部临床阶段和亚类,包括MS的临床孤立综合征(CIS)、复发/缓解MS(RRMS)、继发进展MS、原发进展MS和进展复发MS。
如本文所使用的术语疾病的“预测结果(predicting an outcome)”是指既包括预测接受给定治疗的患者的结果,也包括没有接受治疗的患者的预后。
本发明含义范围内的“结果”是在疾病过程中达到的明确状态。该疾病结果可能是例如临床状态,例如“疾病的复发”、“疾病的缓解”、“治疗应答”、疾病阶段或等级等。
“风险”理解为受试者或患者发展或到达某种疾病结果的可能性。本发明上下文中的术语“风险”不是意指表达与患者健康相关的任何正面或负面的含义,而仅仅是指给定事件或状态出现或发展的概率(proability)或可能性(likelihood)。
术语“临床数据”涉及和患者的健康状况相关的全部可得数据和信息,包括但不限于年龄、性别、体重、绝经的/激素的状态、疾病发生学数据、病历数据、通过体外诊断方法例如血液或尿液测试得到的数据、通过成像方法例如x-射线、计算机断层摄影术、MRI、PET、SPECT、超声得到的数据、电生理学数据、遗传分析、基因表达分析、活检评估、手术中的发现。
如本文所使用的术语患者的“样品的归类”涉及用至少两个类别中的至少一个类别关联所述样品。这些类别可以是例如“高风险”和“低风险”,高的、中等的或低的风险,其中风险是在某一时间段内出现某一事件例如疾病出现、疾病进展等的概率。它还可以表示疾病的有利的或不利的临床结果的类别、给定治疗的应答或非应答等。通过使用算法、特别是判别函数(discriminant function)可以进行归类。算法的简单实例是根据在某一阈值以上或以下的第一定量参数例如目标核酸的表达水平进行归类。患者样品的归类可以用于预测疾病的结果或发展疾病的风险。可能使用多个目标核酸的总分数而不是使用单个目标核酸的表达水平。而且,可以将附加数据和第一定量参数组合使用。这种附加数据可能是来自患者的临床数据,例如性别、年龄、患者体重、疾病等级等。
“判别函数(discriminant function)”是用于对客体或事件归类的一组变量的函数。因此,根据从患者、样品或事件得到的数据或参数,判别函数允许将患者、样品或事件归类成一个类别或多个类别。这种归类是本领域技术人员熟知的标准仪器的统计分析。例如,根据从所述患者、样品或事件得到的数据可以将患者归类为“高风险”或“低风险”、“需要治疗”或“不需要治疗”或者其它类别。归类不是限制于“高和低”,而是可以划分为多个类别、等级等。进行归类的判别函数的实例包括但不限于由以下定义的判别函数:支持向量机(SVM),k-最近邻(kNN),(朴素)贝叶斯模型,或者例如在亚群发现、决策树、数据的逻辑分析(LAD)等中的分段定义函数。术语“表达水平”是指例如目标核酸表达的确定水平。术语“表达水平的式样(patternof expression level)”是指,与例如来自对照的参照核酸或例如在DNA-芯片分析中计算的平均表达值相比较的确定表达水平。式样不限于两组基因的比较,而是还涉及基因和参照基因或样品的多重比较。还可以通过比较和测量下文所公开的多组目标核酸得到和确定某一表达水平式样,并表现出这些转录物彼此之间的相对丰度。相对于在不同组织中的表达、患者对健康对照等,还可以评估表达水平。
在本发明的含义范围内的“参照的表达水平式样”应该理解为可以用于和另一个表达水平的式样相比较的任何表达水平的式样。在本发明优选的实施方式中,参照的表达水平式样为例如在充当参照组的健康或患病个体的组中观察到的表达水平的平均式样。
在本发明的上下文中,“样品”或“生物样品”是衍生自生物有机体的或者已经接触过生物有机体的样品。生物样品的实例是细胞、组织、体液、活检试样、血液、尿液、唾液(saliva)、痰(sputum)、血浆、血清、细胞培养上清液等。
“探针”是能够和特定生物分子特异性结合或相互作用的分子或物质。术语“引物(primer)”、“引物对”或“探针”应该具有分子生物学领域的技术人员所知晓的这些术语的通常含义。在本发明的优选实施方式中,“引物”、“引物对”和“探针”是指具有和待检测或量化的靶分子或靶序列的区域等同的、互补的、属于同系物的或同源的寡核苷酸或多核苷酸,从而引物、引物对或探针能够和待检测或量化的靶分子例如靶核酸、RNA、DNA、cDNA、基因、转录物、肽、多肽或蛋白质特异性地结合。正如本文所理解的,引物本身可以充当探针。本文所理解的“探针”也可以包括例如引物对和内标记探针的组合,正如在许多商业可得的qPCR方法中常见的。
“基因”是一组包含以控制方式产生功能性RNA产物所必要的信息的核酸片段。“基因产物”是通过基因转录或表达产生的生物分子,例如mRNA或翻译得到的蛋白质。
“miRNA”是短的、天然存在的RNA分子,并应该具有本领域技术人员所理解的通常含义。“衍生自miRNA的分子”是由miRNA模板例如cDNA以化学的方式或以酶的方式产生的分子。
术语“阵列(array)”是指在装置例如芯片装置上的可寻址位置的排列。位置的数目可以是从几个至至少数百个或者数千个。每个位置表示独立的反应位点。阵列包括但不限于核酸阵列、蛋白质阵列和抗体阵列。核酸阵列是指包括核酸探针的阵列,例如寡核苷酸、多核苷酸或基因的较大部分。阵列上的核酸优选是单链的。“微阵列”是指生物芯片或生物学芯片,即具有每cm2至少约100个固定化探针的离散区域的密度的区域的阵列。
“基于PCR的方法(PCR-based method)”是指包括聚合酶链反应PCR的方法。这是通过使用一种、两种或更多种引物进行体外酶促复制来指数式扩增核酸例如DNA或RNA的方法。对于RNA扩增而言,可以使用逆转录作为第一步。基于PCR的方法包括特别适用于表达水平分析的动态或定量PCR(qPCR)。当涉及确定表达水平时,例如可以使用基于PCR的方法以检测指定mRNA的存在,这通过(1)在逆转录酶的帮助下将完全mRNA库(所谓的转录物组)逆转录成cDNA和(2)在各自引物的帮助下检测指定cDNA的存在。该方法通常称为逆转录酶PCR(rtPCR)。术语“基于PCR的方法”包括两终点PCR应用以及应用特定荧光团或嵌入染料的动态/实时PCR技术,所述特定荧光团或嵌入染料发出作为扩增目标的函数的荧光信号和允许监测并量化目标。量化方法可以借助外标法标准曲线绝对化,或者相对于对照内标。
术语“下一代测序(next generation sequencing)”或“高通量测序(highthroughput sequencing)”是指使测序过程平行化从而同时制造数千个或数百万个序列的高通量测序技术。实例包括大规模平行签名测序法(MPSS)、群落测序法、454焦磷酸测序法、Illunima(Solexa)测序法、SOLID测序法、离子半导体测序法(Ion semiconductor sequencing)、DNA纳米球测序法(DNAnanoball sequencing)、Helioscope(TM)单分子测序法、单分子SMRT(TM)测序法、单分子实时(RNAP)测序法、纳米孔DNA测序法。
术语“标志(marker)”或“生物标志”是指生物分子,例如核酸、肽、蛋白质、激素等,能够检测它们的出现或浓度并与已知状态例如病状或者临床结果例如治疗应答联系起来。
发明目的
本发明的技术问题是提供能够诊断多发性硬化、预测发展多发性硬化的风险或者预测多发性硬化的结果的生物标志。
发明内容
在详细描述本发明之前,应当理解本发明不受限于所描述方法的方法步骤的具体组成部分,因为所述方法可以变化。还应该理解本文所使用的术语仅仅是用于描述具体实施方式的目的,而不旨在是限定性的。必须指出,正如在说明书和所附的权利要求中所使用的,单数形式“一种(a)”、“一种(an)”和“这种(the)”包括单数的和/或复数的代表物,除非上下文以其它方式清楚地表明。还应该理解复数形式包括单数的和/或复数的代表物,除非上下文清楚地另行说明。另外,还应当理解,在给出以数值为界的参数范围的情形时,应该认为这些范围包括这些界限值。
最通常来说,本发明涉及收集对诊断、预后、预测多发性硬化特别是CIS/RRMS有用的miRNA标志。
本发明涉及一种诊断多发性硬化、预测发展多发性硬化的风险或预测多发性硬化的结果的方法,所述方法包括以下步骤:
a)在来自所述患者的样品中确定至少一种选自由hsa-miR-16-2-3p、hsa-miR-22-5p、hsa-miR-125b-5p、hsa-miR-629-5p、hsa-miR-100-5p、hsa-miR-20a-5p、hsa-miR-l5la-3p和hsa-miR-7-1-3p组成的组的miRNA的表达水平;
b)比较在步骤a)中确定的一种或多种表达水平的式样和一种或多种参照的表达水平式样;以及
c)由步骤b)中的比较结果诊断多发性硬化、预测发展多发性硬化的风险或预测多发性硬化的结果。
本发明还涉及一种对患有多发性硬化或处于发展多发性硬化的风险的患者的样品进行归类的方法,所述方法包括以下步骤:
a)在来自所述患者的所述样品中确定至少一种选自由hsa-miR-16-2-3p、hsa-miR-22-5p、hsa-miR-125b-5p、hsa-miR-629-5p、hsa-miR-100-5p、hsa-miR-20a-5p、hsa-miR-l5la-3p和hsa-miR-7-1-3p组成的组的miRNA的表达水平;
b)比较步骤a)中确定的一种或多种表达水平的式样和一种或多种参照的表达水平式样;以及
c)依据步骤b)中的比较结果将所述患者的样品归类为至少两个类别中的一个。
所述归类能够指示多发性硬化的诊断、发展多发性硬化的风险的预测和多发性硬化的结果的预测。
所述类别可以是健康的/患病的、低风险/高风险、发展疾病的低风险/高风险等。
优选地,在来自所述患者的所述样品中能够确定选自由hsa-miR-16-2-3p、hsa-miR-22-5p、hsa-miR-125b-5p、hsa-miR-629-5p、hsa-miR-100-5p、hsa-miR-20a-5p、hsa-miR-l5la-3p和hsa-miR-7-1-3p组成的组的2、3、4、5、6、7或8种miRNA的表达水平。
可以通过在至少一个健康受试者中确定至少一种选自由hsa-miR-16-2-3p、hsa-miR-22-5p、hsa-miR-125b-5p、hsa-miR-629-5p、hsa-miR-100-5p、hsa-miR-20a-5p、hsa-miR-l5la-3p和hsa-miR-7-1-3p组成的组的miRNA的表达水平来获得参照的表达水平式样。
对步骤a)中确定的至少一种miRNA的表达水平分配数值落入本发明的范围。
通过使用算法以得到相对于参照的一种或多种表达水平式样归一化的表达水平来运用算法实施步骤b)也落入本发明的范围。
将算法应用于在步骤a)中确定的至少一种miRNA的表达水平数值以得到能够对样品进行归类或发展多发性硬化的风险的诊断、预后或预测或多发性硬化的结果的预测的疾病分数落入本发明的范围。所述算法的非限定性实例是相对于阈值比较表达水平的数值,以便将结果划分为两类中的一类,例如高风险/低风险、患病的/健康的等。所述算法的另一个非限定性实例是例如通过加和将多个表达水平的数值组合以得到总分数。可以通过乘以代表miRNA表达水平的因子或数值、代表临床数据的数值或者其它因子将各个加和归一化或加权。
应用判别函数来归类结果、诊断疾病或者预测结果或风险落入本发明的范围。
根据本发明的一方面,所述样品选自由血液样品、血清样品和血浆样品组成的组。
根据本发明的另一方面,所述样品为血液样品。
根据本发明的一方面,本发明的方法包括在步骤a)中确定所述miRNA:hsa-miR-16-2-3p、hsa-miR-20a-5p和hsa-miR-7-1-3p的表达水平。
根据本发明的一方面,本发明的方法包括在步骤a)中确定所述miRNA:hsa-miR-22-5p、hsa-miR-125b-5p、hsa-miR-16-2-3p、hsa-miR-100-5p、hsa-miR-20a-5p、hsa-miR-151a-3p和hsa-miR-7-1-3p的表达水平。
根据本发明的一方面,本发明的方法包括在步骤a)中确定选自由hsa-miR-22-5p、hsa-miR-125b-5p、hsa-miR-629-5p、hsa-miR-16-2-3p、hsa-miR-100-5p、hsa-miR-20a-5p、hsa-miR-151a-3p和hsa-miR-7-1-3p组成的组的全部miRNA的表达水平。
本发明还涉及一种在患有多发性硬化或处于发展多发性硬化的风险的患者中诊断多发性硬化、预测发展多发性硬化的风险或预测多发性硬化的结果的试剂盒,所述试剂盒包括:
-用于在来自所述患者的样品中确定至少一种miRNA的表达水平的装置,所述miRNA选自由hsa-miR-22-5p、hsa-miR-125b-5p、hsa-miR-629-5p、hsa-miR-16-2-3p、hsa-miR-100-5p、hsa-miR-20a-5p、hsa-miR-151a-3p和hsa-miR-7-1-3p组成的组;以及
-至少一种用于和来自所述样品的至少一种miRNA的表达水平进行比较的参照的表达水平式样。
用于确定所述至少一种miRNA的表达水平的装置可以包括:用于检测或扩增所述至少一种miRNA的寡核苷酸探针,用于基于阵列的方法、基于PCR的方法、基于测序的方法确定表达水平的装置,或适合用于确定表达水平的任何其它装置。
可以以数值信息、特别是以在任何合适信息载体上的计算机编码信息的形式提供所述参照的表达水平式样。
本发明还涉及一种在患有多发性硬化或处于发展多发性硬化的风险的患者中诊断多发性硬化、预测发展多发性硬化的风险或预测多发性硬化的结果的计算机程序产品,其包括:
-用于接收代表在患者样品中的至少一种miRNA表达水平的数据的装置,所述miRNA选自由hsa-miR-16-2-3p、hsa-miR-22-5p、hsa-miR-125b-5p、hsa-miR-629-5p、hsa-miR-100-5p、hsa-miR-20a-5p、hsa-miR-151a-3p和hsa-miR-7-1-3p组成的组,
-用于接收代表至少一种用于和来自所述样品的至少一种miRNA的表达水平进行比较的参照的表达水平式样的数据的装置,
-用于比较代表在所述患者样品中的至少一种miRNA的表达水平的所述数据的装置,和
-用于由步骤b)中的比较结果确定多发性硬化的诊断、发展多发性硬化的风险的预测或多发性硬化的结果的预测的装置。
计算机程序产品可以在存储式电子介质例如固态存储器、磁盘、CD等上提供。它可以本地存储在计算机上。它可以以基于网络的程序或应用(包括基于网络或互联网的应用)的形式运行。它可以在诊断设备例如分析器仪器上运行。它可以可操作地连接用于输出信息的设备,例如显示器、打印机等。
本文进一步公开了一种用于确定miRNA生物标志的方法,所述miRNA生物标志用于在患者中诊断疾病、预测发展所述疾病的风险或预测所述疾病的结果,所述方法包括以下步骤:
a)通过使用高通量测序方法,对照至少一个参照样品来确定在患有所述疾病的患者的至少一个样品中差异表达的多种miRNA,
b)通过使用核酸阵列,对照另一个参照样品来确定在另一个患有所述疾病的患者的另一个样品中差异表达的另外多种miRNA,
c)比较在步骤(a)中确定的所述多种miRNA和在步骤(b)中确定的所述另外多种miRNA以确定至少一种在步骤(a)和(b)中均差异表达的miRNA,以及任选地
d)通过PCR方法确认所述至少一种miRNA的差异表达。
具体实施方式
在下文的说明书和各个实施例的附图中进一步公开了本发明目的的额外细节、特点、特征和优点,这些实施例以示例性的方式说明了本发明的优选实施方式。然而,无论如何这些实施例都不应该理解为对本发明范围的限定。
本发明涉及用miRNA标志诊断多发性硬化的方法。
在具有非典型表象的患者中和在可能涉及炎症脱髓鞘的第一神经缺欠期间,多发性硬化的诊断是挑战性的。具体地,难于诊断通常呈现疾病早期阶段的CIS/RRMS。然而,特别希望具有针对该疾病阶段的可靠的诊断测试,因为在这一早期疾病阶段期间治疗介入的时机更好。诊断RRMS因其能够呈现多种不同神经症状而是挑战性的。为了确定用于诊断MS的生物标记,通过使用下一代测序、微阵列分析和qRT-PCR获得了来自患有临床孤立综合征(CIS)或复发-缓解MS(RRMS)的初次治疗(treatment-naive)的患者的全血样品中的miRNA表达式样的综合分析。在患有CIS/RRMS的患者中,确定了明显失调(deregulated)的miRNA,根据微RNA疾病数据库过去没有将明显失控的miRNA和MS联系起来。这些miRNA能够潜在地充当用于MS的未来诊断生物标志,并有助于在患有MS的患者中诊断、监测疾病活性和评估治疗应答。
在附图中,
图1示出了用于确定miRNA标志的方法的概述;
图2示出了miRNA的数目和检测到这些miRNA的样品的频率;
图3示出了通过NGS确定的8种最失调的miRNA;
图4示出了通过微阵列分析确定的8种最失调的miRNA;
图5示出了表明通过NGS和微阵列确定的明显失调的miRNA的Venn图;
图6示出了8种miRNA的qRT-PCR验证;
图7示出了使用NGS、微阵列和qRT-PCR的8种miRNA的表达分析的比较;
图8示出了经审查的miRNA标志的疾病关联的频率。
图1:方案概述。采用包括NGS、微阵列和qRT-PCR的三种实验方法在患有CIS/RRMS的患者中综合分析miRNA的表达。
图2:miRNA的数目和检测到这些miRNA的样品的频率。蓝色曲线表示NGS的结果,而红色曲线表示微阵列的结果。借助NGS,353种miRNA在全部研究的样品的至少半数中是可检测的,而借助微阵列分析,228种miRNA在全部研究的样品的至少半数中是可检测的(参见虚线)。
图3:由NGS确定的8种最失调的miRNA(p值<0.01)。在x轴上,示出了8种不同miRNA的对照样品(黑色)的中位值和MS样品(浅灰色)的中位值及其标准偏差的柱(bar),y轴呈现读数。
图4:由微阵列分析确定的8种最失调的miRNA(p值<0.01)。在x轴上,示出了8种不同miRNA的对照样品(黑色)的中位值和MS样品(浅灰色)的中位值及其标准偏差的柱,y轴呈现信号强度。
图5:示出了通过NGS和微阵列确定的明显失调的miRNA的Venn图。通过微阵列分析我们确定了8种miRNA,而通过NGS我们确定了38种在MS中明显失调的miRNA。使用这两种方法都确定了三种miRNA,即hsa-miR-16-2-3p、hsa-miR-20a-3p和hsa-miR-7-1-3p。
图6:8种miRNA的qRT-PCR验证。柱状图示出了8种经测试的候选MS标志的ΔCT值和标准偏差。
图7:使用NGS、微阵列和qRT-PCR的8种miRNA的表达分析的比较。柱的高度代表每种miRNA和所使用的每种分析方法(NGS=黑色柱,微阵列=白色柱,qRT-PCR=阴影柱)的对数化的倍数变化。我们得到了除一个miRNA(hsa-miR-629-5p)外的全部miRNA的一致结果。
图8:疾病关联的频率。该图示出了存储于HMDD数据库中的全部miRNA的疾病相关的频率。
为了在患有CIS/RRMS的患者中综合分析miRNA的概况,正如图1所具体示出的,采用三个实验阶段。第一,在38个患者和对照者的组中实施使用NGS的筛选,然后实施使用96个年龄和性别匹配的病例和对照者的扩充组的微阵列筛选。分析两组高通量数据组得到了8种miRNA候选者,通过qRT-PCR在20个个体(5个CIS、5个RRMS和10个年龄和性别匹配的对照)中分析这8种miRNA候选者。患有CIS/RRMS的患者和健康对照者的详细特征记载于表1中。为了排除作为致混淆因素的免疫调制或免疫抑制治疗,只有初次治疗的患者包括在本工作中。
患者和样品制备
从根据McDonald 2005标准诊断为CIS(n=25)或RRMS(n=25)的50个患者中收集大约5mL的血液于PAXgene Blood RNA试管(Becton,Dickinson,海德堡,德国)。涵盖50个年龄(+/-4年)和性别匹配的健康成年者作为对照(表1)。
使用PAXgene Blood miRNA试剂盒(Qiagen)按照厂家推荐分离包括miRNA的全部RNA。分离后的RNA储存于-80℃下。使用生物分析仪2100(Agilent)分析RNA的完整性,并使用NanoDrop 2000(thermo Scientific)测量浓度和纯度。总共四个样品(三个对照和一个RRMS)不满足质量标准,并从研究中排除。
NGS筛选
最初,对取自16个患有CIS/RRMS的患者和22个对照者的38个样品进行高通量筛选。总的来说,发现总共835种miRNA在至少单一样品中表达。图2示出了miRNA的数目和检测到这些miRNA的样品的频率(蓝色曲线)。如图所示,在全部研究样品中的至少半数中353种miRNA是可检测的,证明了在研究的血液样品中各种miRNA的高丰度。后续的归一化t-测试示出了总共38种明显地(未调整的(non-adjusted))失调的miRNA。8种最失调的miRNA(p-值<0.01)示于图3中。然而,在针对多重测试的调整之后,没有miRNA保持显著的,因为诸多特征(最小p-值为0.155)。这8种miRNA包括5种下调miRNA,即hsa-miR-361-5p、hsa-miR-7-1-3p、hsa-miR-548o-3p、hsa-miR-151a-3p和hsa-miR-548am-3p,以及3种上调miRNA,即hsa-miR-22-5p、hsa-miR-27a-5p、hsa-miR-4677-3p。总的来说,在CIS/RRMS中38种失调的miRNA中16种是下调的而22种是上调的。
TruSeq Small RNA制备试剂盒(Illumina)用于产生多路测序文库,其随后使用50bp片段测序方案(fragment sequencing protocol)在HiSeq2000系统(Illumina)上测序。使用CASAVA 1.8软件包(Illumina)多路解编所得到的测序读数,并且使用FastQC工具(Babraham公司)检验质量。使用miRDeep2流水线(miRDeep2pipeline)进行最初测绘分析以确保已经测序大部分的miRNA。
总的来说,在两组多路库(pool)中分析来自n=16个患者(5个RRMS,11个CIS)和n=22个对照者的38个样品。平均来说,每个样品得到了150~200万个高质量的测序读数(共计9500万个读数),其中高达70%包含miRNA信息。
首先通过切下3′接头序列预加工原始illumina读数。这通过来自FASTX-Toolkit的fastx_clipper程序来完成。除去剪切后短于18个核苷酸的读数。使剩余的读数骤减,即该步骤后只得到了每个样品独特的读数及其频率。该步骤缩短了用于大量测绘读数的时间。对于剩余步骤,使用miRDeep2流水线。这些步骤包括测绘相对于基因组(hg19)的读数、测绘相对于来自miRBase发布v18的miRNA前体序列的读数、总结样品的计数以及预测新颖性miRNA。
微阵列筛选
接下来,使用包含1205种miRNA的微阵列(代表miRBase v16的内容),筛选来自49个患有CIS/RRMS的患者和47个对照者的96个年龄和性别匹配的样品的扩充组。对于测序结果,首先评价所检测的miRNA的数目。正如图2中红色曲线所示,微阵列研究比NGS检测到明显更少的miRNA(p=6.5*10-7)。在至少一个样品中,检测到382种miRNA(通过NGS至少在单一样品中检测到835种miRNA中的46%),在全部样品中的至少50%中检测到228种miRNA(相比于测序方法中的353种miRNA)。不希望受限于该理论,据认为这可能是由于两个不同原因:第一,微阵列实验受限于miRBasev16的内容,而测序可以发现全部存在的人类miRNA;以及,测序方法还通常比微阵列实验更灵敏。38种由测序确定的明显(未调整的)失调的miRNA的更深入分析也反映了这一点。当然,7种(18.4%)没有包含于SurePrint8x60K Human v16miRNA微阵列,而还有14种(36.8%)包含于该微阵列中但是没有被检测出。在微阵列实验中,检测到总共8种明显失调的miRNA。对于NGS实验,没有调整多重测试的p值以使得数值在不同方法之间是可比较的。图4示出了各种标志。对于测序方法,在患有CIS/RRMS的患者中5种miRNA是下调的(hsa-miR-146b-5p、hsa-miR-7-1-3p、hsa-miR-20a、hsa-miR-3653和hsa-miR-20b),而3种是上调miRNA(hsa-miR-16-2-3p、hsa-miR-574-5p、hsa-miR-1202)。
使用SurePrint 8x60K Human v 16miRNA微阵列(Agilent,CatNo G4870A)按照使用说明实施微阵列分析,所述SurePrint 8x60K Human v 16miRNA微阵列包括40份1205种miRBase v16的miRNA(http://www.mirbase.org/)。简而言之,使用miRNA Complete Labeling和Hyb试剂盒处理全部100ng的总RNA以产生荧光标记的miRNA。标记反应后,在真空离心管中干燥该混合物并将其重新悬浮于包含杂交缓冲液和封闭剂的杂交混合物中。然后,装填并培养微阵列。为了验证标记和杂交是否成功,以合适的步骤加入标记和杂交的外标对照(spike-in control)。在几个洗涤步骤后,用Agilent MicroarrayScanner在3微米下以双通路模式扫描微阵列。使用Feature Extraction软件进一步处理微阵列扫描数据。
NGS和微阵列分析之间明显失调的miRNA的交集
如上所述,通过NGS检测到38种明显失调的(未调整的)miRNA,而用微阵列分析检测到8种明显失调的(未调整的)miRNA。这些分别对应于所测量的miRNA的1.9%和0.7%,因此这两组之间的偶然交集是极不可能的。然而,值得一提的是,有三种miRNA的交集,包括hsa-miR-16-2-3p、hsa-miR-20a-5p、hsa-miR-7-1-3p(参见图5)。一百万次置换测试确认这种交集是高度显著的(p=0.004)。此外,通过NGS确定的38种miRNA中的5种在微阵列分析中表现出相同的调节趋势。然而,这五种miRNA(包括hsa-miR-22a-5p、hsa-miR-125b-5p、hsa-miR-629-5p、hsa-miR-100-5p和hsa-miR-151-5p)的调节并非是统计显著的(p>0.05)。通过这两种方法确定的3种明显失调的miRNA和另外5种miRNA以及在这两组实验中它们的表达值和显著值列于表2中。
qRT-PCR分析
使用qRT-PCR进一步分析这8种miRNA。能够确认这8种miRNA中的七种,然而,根据qRT-PCR的结果,4种miRNA(hsa-miR-22-5p、hsa-miR-629-5p、hsa-miR-20a-5p和hsa-miR-151-3p)并非明显地失调。与NGS和微阵列分析相反,对照中hsa-miR-629-5p比MS患者表现出稍微的但不是显著(p=0.71)更高的表达。表2还包括qRT-PCR验证(qRT-PCR validation)的结果。图6示出了qRT-PCR验证的ΔCT值和标准偏差。图7使得使用NGS、微阵列和qRT-PCR的8种miRNA的表达分析的对比直观化。
组成一组20个年龄和性别相匹配的患者和对照样品,其也用于微阵列和NGS分析。患者组包括5个CIS患者和5个RRMS患者。对于qRT-PCR验证,选择3种在微阵列和NGS中均明显失调的miRNA,和5种根据NGS显示是失调的并表现出相同调节趋势的但是在微阵列分析中不是明显失调的miRNA。使用Taqman qRT-PCR体系(Applied Biosystems)进行qRT-PCR。使用小RNA RNU6B和RNU48作为内源性对照。
8种miRNA的关联性
对于8种一致的miRNA,从HMDD数据库中提取(即公开物描述了在所考虑的疾病中活性失调(dys-regulated)的各种miRNA)已知疾病的相互联系(图8)。计算8种miRNA中每一种的疾病相互联系的数目并将它们和8种miRNA疾病相互联系的平均值进行比较,发现本文所描述的miRNA的明显增加的数目,即所检测到的miRNA通常和不同的疾病相关联。除1种miRNA外的8种全部miRNA与超过8种疾病相关联,暗示不同的miRNA对CIS/RRMS不是特异性的(参见图8)。然而,没有发现具有和CIS/RRMSmiRNA组相同式样的疾病,说明这种miRNA组具有增加的CIS/RRMS的特异性。
通过采用用于前体分子的miRNA富集分析,发现8种miRNA中的4种,即hsa-miR-20a、hsa-miR-100、hsa-miR-125b和hsa-miR-16-2,和免疫应答相关。类似地,4种miRNA,即hsa-miR-20a、hsa-miR-7-1、hsa-miR-22和hsa-miR-16-2,和激素调节相关。考虑到疾病关联,早先将hsa-miR-100、hsa-miR-125b、hsa-miR-7-1和hsa-miR-16-2与肾上腺皮质癌相关。根据HMDD,迄今为止在CIS/RRMS中没有记载这8种miRNA中的任一种。然而,先前已经报道相比于对照,hsa-miR-22(在本筛选中5种miRNA中的一种)在患有MS的患者的血浆和CD4+CD25+调节性T细胞中上调。而且,当比较当前结果和我们自身关于多发性硬化的最初研究时,发现显著的交集。具体而言,我们确认hsa-miR-629(p=0.0009)以及hsa-miR-100(p=0.04)在MS中为显著上调,而我们发现hsa-miR-20a为下调(p=0.0009)。类似地,hsa-miR-125b是上调的,尽管几乎偏离了0.05的显著阈值(p=0.06)。最初的研究和本工作之间的交集似乎是非常有意义的,考虑到使用了不同的实验装置(不同的微阵列平台)并研究了完全独立的群组(并非全部患者初次治疗,没有年龄和性别匹配的对照)。
总的来说,本文给出了相比于年龄和性别匹配的对照个体,在包括CIS患者和RRMS患者的初次治疗MS患者的血液中的miRNA表达的综合分析。采用NGS和微阵列分析,确定了一组8种miRNA,其中在MS患者的血液中,5种miRNA是上调的(hsa-miR-22-5p、hsa-miR-125b-5p、hsa-miR-629-5p、hsa-miR-16-2-3p和hsa-miR-100-5p),3种miRNA是下调的(hsa-miR-20a-5p、hsa-miR-151a-3p和hsa-miR-7-1-3p)。使用qRT-PCR,我们能够针对除一种miRNA(hsa-miR-629-5p)外的全部miRNA确认这些结果。根据HMDD,迄今为止,这8种miRNA从未和MS相关联。然而,过去已经报道一种miRNA在MS患者的血浆和调节性T细胞中上调。和我们先前关于MS的数据进行比较,我们检测到显著的交集。富集分析揭示了miRNA中的半数分别和免疫应答、激素调节或肾上腺皮质癌相关。这些结果发现了一组有望充当潜在有用生物标记的miRNA,其在患有MS的患者中用于诊断、用于监测疾病活动或用于评估治疗应答。已经确认的标记组合允许简单、直接、可靠的诊断测试。针对这些miRNA的进一步分子生物学分析可能有助于加深对这种多因素疾病的理解。
表1:对该研究所涉及的患者的表征。最后三列使用“x”指明使用了微阵列、NGS和/或qRT-PCR的样品。最后两行表明患者和对照的总体分布。按照CIS和RRMS单独给出MS患者。
表2a:在NGS和微阵列分析以及使用qRT-PCR验证中失调的miRNA。对于NGS分析,给出读数;对于微阵列分析,给出信号强度值;对于qRT-PCR,给出Ct值。相比于对照,红色字体表示在MS中各种miRNA的上调性,绿色字体表示在MS中的下调性。请注意Ct值,其值越高表示表达越低。
表2b:miRNA序列
SEQ序号 |
miRNA |
序列 |
1 |
hsa-miR-22-5p |
aguucuucaguggcaagcuuua |
2 |
hsa-miR-125b-5p |
ucccugagacccuaacuuguga |
3 |
hsa-miR-629-5p |
uggguuuacguugggagaacu |
4 |
hsa-miR-16-2-3p |
ccaauauuacugugcugcuuua |
5 |
hsa-miR-100-5p |
aacccguagauccgaacuugug |
6 |
hsa-miR-20a-5p |
uaaagugcuuauagugcagguag |
7 |
hsa-miR-151a-3p |
cuagacugaagcuccuugagg |
8 |
hsa-miR-7-1-3p |
caacaaaucacagucugccaua |