一种区分反应性淋巴结节增生与淋巴瘤的miRNA测定方法
技术领域
本发明属于分子生物学领域,具体涉及一种区分反应性淋巴结节增生与淋巴瘤的miRNA测定方法。
背景技术
淋巴瘤是一组起源于起源于淋巴造血系统中的B细胞、T细胞和NK细胞的全身性恶性肿瘤,依据病理学特征分为霍奇金淋巴瘤和非霍奇金淋巴瘤。90%以上的淋巴瘤患者诊断为非霍奇金淋巴瘤,各组织器官均可受累。临床上怀疑淋巴瘤时,可以做淋巴结或其他受累组织或器官的病理切片检查(活检)以确诊。
淋巴瘤的诊断主要是通过淋巴结切除活检并结合免疫组化进行诊断及免疫分型,是一种有创的检查手段。由于其发病部位可出现在全身淋巴结内或结外任何组织,有时会造成病理标本的难于获得,另外,病变部位常伴有感染、坏死等情况,导致病理诊断困难,需多次活检。根据NCCN2015年的推荐,细针穿刺(FNA)或空芯针活检不能作为淋巴瘤初始诊断的依据,但在某些情况下(淋巴结不易切取或切除活检时),FNA或空芯针活检只要取到足够组织,或结合恰当的辅助鉴别诊断技术(免疫组化、流式细胞学检查、PCR检测bcl2基因突变、IgH、TCR基因重排、FISH检测可能的染色体易位)可以为诊断提供一定的信息,但由于辅助鉴别诊断技术的局限,很难做出诊断。因此,寻找一种简单、快速、无创或微创、特异的诊断方法对淋巴瘤进行诊断及分型极其重要。
microRNA是一类进化保守的内源性非编码单链RNA小分子,在细胞内起到调控细胞分化、增殖、凋亡等多种生理功能。成熟miRNA是一类由22个碱基(nt)组成的单链RNA小分子,镶嵌于一种特殊的Argonaute(Ago)蛋白质中,作用于特定的mRNA靶点而影响到蛋白质翻译,在转录水平或转录后水平调节基因的表达,在生命过程中起着重要的调控作用。
miR-150参与造血过程中血干细胞的分化调控,在成熟、休眠期的B和T淋巴细胞中均具有特征性的高表达。成熟B细胞从pro-到pre-B-细胞的转换受到miR-34a的调控。miR-34a调控的关键因子是FOXP1转录因子,成熟B-细胞中这个因子同时也受到miR-150的调控。在pro/pre-B细胞中,miR-150还调控着MYB转录因子,通过对MYB表达水平的精细调控控制的血细胞的生成及B-细胞的正常发育。miR-150的提前表达可以阻止pro-B细胞到pre-B细胞的转化,进而影响B-细胞成熟。miR-150的减少能促进B1-细胞的扩增及抗体的生产。
miR-155由非编码RNA BIC所编码,其表达受到BCR活化的诱导。miR-155缺失导致形成受损的GC B-细胞和亚型转换抗原特异性抗体的分泌减少。miR-155也调节造血转录因子PU.1的表达,miR-155缺陷的小鼠PU.1的表达上调,损伤IgG1+细胞的产生。miR-155在淋巴瘤细胞中具有上调,参与促进癌症发生。使其成为最具潜力的无创诊断生物标记物。Metzler等人发现,在BIC基因上具有一段138个核苷酸的保守序列,编码miR-155的发夹结构。该研究组还发现在Burkitt淋巴瘤中,miR-155表达量上升了100倍,此外的研究也发现,Hodgkin淋巴瘤等肿瘤中miR-155水平也有提高。因此,mir-155可能是作为一个癌基因和MYC协同作用,而其正常功能是在B细胞的分化中起作用,其可能的靶基因是那些对抗MYC信号通路的基因。
很多miRNA基因位点位于和癌症相关的脆性位点的区域,在肿瘤发生过程中呈现异常的表达。许多miRNA的表达与肿瘤的发病机理相关,具有肿瘤抑制因子及致癌基因的作用。He等人发表的论文发现在散布的B细胞淋巴瘤、滤泡型淋巴瘤、套细胞淋瘤等肿瘤中常常有13q31位点的扩增。而在这一扩增区域的唯一的基因就是一个非编码蛋白的RNA,C13orf25,这个转录本编码了miR-17~92簇,其中包含了7个miRNAs:miR-17-5p,miR-17-3p,miR-18a,miR-19a,miR-20a,miR-19b-1,and miR-92-1。他们由此推断,这个基因簇的过表达与肿瘤形成有关,而后通过实验研究证明,过表达Myc和miR-17~92簇的淋巴癌与仅有Myc过表达肿瘤相比较,具有更强的增殖能力,更低的细胞死亡率。这些实验证实,miR-17~92簇中的miRNAs可以协同地行使癌基因的功能,其靶基因可能是在MYC过表达条件下激活的凋亡蛋白。当凋亡途径被miR-17~92簇去除,MYC可以诱导细胞不受控制地增殖,这导致了肿瘤发生。miR-21是公认的与细胞生长促进因子,在众多实验中miR-21的表达水平的升高是唯一能得到重复的结论之一。总之,各种miRNA已被证明行事一样直接监管机构的B细胞发育和分化。因此,B细胞恶性肿瘤出现miR-34a、miR-155、miR-150和miR-17~92簇异常表达并不奇怪。
miRNA表达差异谱可以用来对淋巴瘤进行分期和分型分析。新近研究显示,采用9种miRNA标记可以对DLBCL(GCB-DLBCL),活化B细胞样DLBCL(ABC-DLBCL),原发性纵隔DLBCL(PMBCL)亚型进行细分,这9种miRNA分别是miR-146b-5p、miR-146a、miR-21、miR-155、miR-100、miR-222、miR-363、miR-574-3p、miR-574-5p;采用miR-17~92簇16种miRNA也可对这3种亚型进行细分,分别是miR-17-5p,miR-17-3p,miR-18a,miR-19a,miR-20a,miR-20b,miR-92,miR-106a,miR-29a/c,miR-100,miR-199a,miR-140,miR-630,miR-16;其他细分DLBCL的miRNA标记分别为:miR-125b(GCB-DLBCL高表达),miR-100,miR-125b,miR-130a(ABC.DLBCL和PMBCL的高表达),miR-222和let-7f(3种淋巴瘤均出现缺失或低表达),miR-13和miR-223(与免疫调节和其他B细胞肿瘤关联),miR-424(造血系统相关)。miR-155通常在DLBCL表达显著降低,靶基因通常包括PU.1、AID和SOCS1在DLBCL表达显著增高。伯基特淋巴瘤(Burkitt Lymphoma,BL)是可能来源于滤泡生发中心细胞的高度恶性B细胞肿瘤,miR-143,miR-145,miR-9和miR-34b呈现低表达状态,且其表达水平与细胞增殖呈负相关,而miR-17-5p和miR-20a则表达上调。滤泡性淋巴瘤(Follicular Lymphoma,FL)是最常见的惰性NHL,被认为是生发中心起源B细胞肿瘤,其进展缓慢通常需要数年或数十年才能进展成为临床肿瘤,90%该型淋巴瘤最终转换成DLBCL。miR-l24a,miR-155,miR-328,miR-326,miR-302c,miR-345,miR-373,miR-210在FL组织中高表达,miR-29afb/c,miR-142-3p/5p,miR-150和miR-15a/b低表达,特别是与造血作用相关的miR-150和miR 155以及与肿瘤进展相关的miR-210,miR-10a,miR-17-5p,和miR-145能作为其分型和预后的分子标记。Lisio等报道用128个miRNA的指纹谱对淋巴瘤BL,DLBCL,MCL,SMZL,CLL,FL,NMZL和MZL/MALT以及非肿瘤样本的测定,分类的准确率达到86.4%。
上述文献报道说明,淋巴瘤亚类分类可以由多个miRNA表达差异确定。淋巴瘤为极度异质性的肿瘤,至少可分为48种淋巴瘤类型,具有复杂而相互不兼容的miRNA表达谱,根据现有的文献和专利报道,需要对上百种miRNA进行同时定量分析才能将反应性增生样本从众多类型的淋巴瘤中遴选出来。受现行技术的局限,给其临床实施带来巨大挑战。现行的miRNA高通量测定技术还很粗放,如miR-seq或芯片杂交(microarray),精确度在2倍以上,灵敏度更差,并且需要利用纯化的RNA作为鉴定材料,加大测定的随机误差,无法达到临床应用中对miRNA定量的客观性和通量的要求。而RT-qPCR技术面临通量低和内源参照的困扰,不适合如此复杂的高通量检测工作。尽管反应性增生的miRNA表达谱表现出与淋巴瘤miRNA表达谱的巨大差异,可以通过miRNA谱差异对二者进行区分,但从技术实施的角度考量,其测定的复杂性、客观性和准确度的要求都对现行检测技术造成挑战,导致尚无有实际临床用途的反应性增生与淋巴瘤的miRNA诊断谱的报道。
发明内容
本发明的发明目的在于:针对上述存在的问题,提供一种区分反应性淋巴结节增生与淋巴瘤的miRNA测定方法,以解决上述问题。
本发明采用的技术方案是这样的:一种区分反应性淋巴结节增生与淋巴瘤的miRNA测定方法,对细针穿刺、组织活检或福尔马林固定-石蜡包埋切片的样本中相关miRNA的数目进行定量测定,然后对所测得的miRNA数目进行分类对比分析,从而预测样本来自淋巴结节反应性增生还是淋巴瘤。
作为优选的技术方案:在进行定量测定前,对所述样本进行预处理,所述预处理的方式为加热处理。
作为进一步优选的技术方案:预处理时,用的预处理试剂为质量百分含量为0.5%的SDS和蛋白酶-K。
采用SDS-蛋白酶-K(即SDS-PK)裂解法对组织样本的预处理,高浓度SDS防止核酸酶对RNA的降解,蛋白酶-K在55℃温浴下降解蛋白质,处理后的样本可在-20℃冰箱中长期保存。经该法处理的样本可直接用于RT和PCR反应。
作为优选的技术方案:所述定量测定的方法为miRFLP定量测定法。
本申请的发明人开发出了通过DNA片段长度多态性荧光定量分析来完成miRNA的分子数绝对定量检测的方法(即miRFLP定量测定法,其方法详见申请号为2014103626962的中国专利申请),该方法可以抗衡RNA纯化、样本杂质及机器、操作、耗材等外在因素对miRNA测定结果的影响,客观地获得多个miRNA在待测样本中的绝对拷贝数,灵敏度达到10个分子数。采用miRFLP测定法,对上述样本中特定miRNA的定量测定比较,预测淋巴结节反应性增生与淋巴瘤的预测准确度达到97.77%。
作为进一步优选的技术方案:对miRNA数目进行校正,校正的参照为样本中let-7f或miR-21的绝对数目。
本方法所获得的miRNA测定结果,以let-7f为参照校正后,淋巴组织来源的miR-150和miR-155相对值均大于100,而非淋巴组织来源的相对值均小于50。该方法所获得的miRNA测定结果,可以用来鉴定样本是否来源于淋巴组织,或排除非淋巴组织来源的肿瘤或增生。
作为优选的技术方案:所述定量测定的方法为RT-qPCR相对定量测定法。
优选对RT-qPCR相对定量测定法进行校正,校正的参照为样本中let-7f或miR-21的相对数值或扩增循环数。
作为优选的技术方案:所述的相关miRNA选自miR-21-5p、miR-378a-3p、miR-146a、miR-17-5p、miR-146b、miR-181a、miR-150、miR-155中的至少一种。
经检验证明,该方法所测得的该组miRNA对淋巴结节增生与淋巴瘤的预测准确度达到97.77%。
作为优选的技术方案:所述的相关miRNA选自miR-150、miR-155、miR-146b、let-7f中的至少一种;其结果用于鉴定淋巴结增生与DLBCL淋巴瘤的诊断准确率为96.49%。
作为优选的技术方案:所述的相关miRNA选自miR-146b、miR-16-5p、miR-155、miR-181a-5p、let-7f中的至少一种;测定结果用于鉴别DLBCL与NK/T细胞淋巴瘤的诊断准确率为91.38%。
本发明中,优选对miRNA逆转录产物及PCR反应物进行富集,富集时采用生物素-琼脂糖链霉素偶联试剂或链霉素磁珠。
本发明还涉及miRFLP定量测定时,所需的欧米伽引物序列、适配寡聚核苷酸链序列、PCR引物序列,将含有这些序列的片段制成试剂盒。
淋巴瘤中表现出差异表达的miRNA达数百种,这与miRNA本身数量多的特性和淋巴瘤发生机制的高度异质性有关。淋巴瘤均源于淋巴组织,或多或少保留着淋巴细胞的一些组织特性。miRNA的表达具有组织专一性的特征,如miR-150和miR-155的高表达就是与淋巴细胞的发育成熟密切相关的,可以作为淋巴细胞的检出指标。我们对NCBI中心的SRA数据库中31个来源于B-细胞和淋巴瘤样本的miRNA二代测序数据子集进行了系统地分析,根据在正常B-细胞和各类淋巴瘤中表达的差异,和对文献报道的分析,共筛出21个与B-淋巴瘤相关的miRNA待选物-let-7f,miR-378a,miR-21,miR-29a,miR-146a,miR-191,miR-25,miR-92a,miR-423,miR-146b,miR-155,miR-101,miR-26a-5p,miR-181a,miR-16,miR-192,miR-107,miR-423,miR-17,miR-34a,miR-150。表2a和表2b罗列了SRA注册号和遴选出的候选miRNA。分析结果同我们用miRFLP定量测定法测到的相关miRNA的绝对数目有很大差距,现行技术的粗放导致不能精确地利用细微的miRNA表达差异,但总体趋势具有一定程度的一致性,可以作为miRNA粗选时的参考。
我们首先对组织样本和培养的细胞用SDS-PK裂解法进行处理,对比Trizol法提取的RNA质量,发现SDS-PK裂解法得出RNA产量与后者相当,并能在-20℃的冰箱中保存。SDS-PK裂解法将等体积的裂解液加入组织或细胞悬液,然后在55℃完成对蛋白质(包括核酸酶)的降解。裂解后的溶液经稀释可以直接上样,用于对样本中miRNA和RNA的定量测定。处理过程简单,RNA没有丢失,高浓度SDS防止核酸酶对RNA的降解,极大地方便了对微量组织,如细针穿刺样本中miRNA和RNA的测定。裂解液中miRNA的实际含量甚微,以至需要在稀释液中加入细菌RNA作为保护剂,保护待测的目标RNA,防止容器和转移器皿的吸附。用miRFLP测定法对两种不同处理方法得到的RNA进行miRNA计数,所测的miRNA数目没有显著差别。
裂解液中的RNA浓度可以用Qubit RNA试剂盒进行直接测定,因此样本中所含miRNA数目,可以用样本RNA浓度进行标定。表3a比较了样本中每纳克RNA为单位含有的miRNA数目,可以看出Let-7f在不同亚型的淋巴瘤样本中均有高水平的表达,其组间的误差范围是所有的测定miRNA中最低的,与我们对SRA文库分析所得一致。以Let-7f为基准,对测定的miRNA数目进行校正,减少不同类型淋巴瘤组内的误差范围,支持以Let-7f作为miRNA数目参照物的用法。该结果优于用RNA浓度作校正,因为Qubit RNA的浓度测定过程带来额外的测定误差,而miRFLP测定法中,所有的miRNA的测定均在同一反应下完成,没有上样误差,因此以样本中Let-7f为基准的校正方式给出的组内误差最小。
本发明完成了不同类型淋巴瘤样本RNA的处理,并分别用miRFLP分析法对所含miRNA进行了定量测定。本发明采用miRFLP测定法得到的淋巴瘤和反应性增生样本的miRNA数目,以Let-7f的绝对数目为基准进行校正,通过比较两种组织校正后的miRNA表达谱,使用贝叶斯网络(NaiveBayes)、支持向量机(libSVM)、J48、Logistic回归分析和回归分类模型(Classification Via Regression)筛选得到分类准确度最高的分类模型为支持向量机模型。由5个miRNA谱(miR-150,miR-146a,miR-17-5p,miR-155,let-7f)组成的支持向量机分类器,预测样本来自淋巴结节增生或淋巴瘤,其预测准确度达到97.77%。由4个miRNA谱(miR-150,miR-146b,miR-155,let-7f)组成的支持向量机分类器,预测样本是来自淋巴结节增生与DLBCL,预测准确度达到96.49%。由6个miRNA谱(miR-150,miR-146b,miR-155,miR-17-5p,miR-21,let-7f)组成的支持向量机分类器,区分反应性增生,DLBCL与NK/T细胞淋巴瘤,预测准确度达到91.38%。
SDS-PK裂解法也可与RT-qPCR测定法联合,用于对样本中所述miRNA的定量测定。为了验证这种可能,我们设计了以let-7f为参照的miR-150/miR-155RT-qPCR测定实验,结果证实这种组合的有效性。利用合适的内参标准RNA,RT-qPCR测定法可以排除样本个体差异和反应效率的影响,对不同样本中的少量miRNA进行相对定量测定,达到区分反应性增生与淋巴瘤的目的。
本发明进一步应用是制备任何用于区分反应性增生与淋巴瘤的miRNA测定的试剂或试剂盒套装。本发明可以单独进行商业化利用,也可以作为特定应用试剂盒的组成部分。本发明也包括在任何试剂盒、服务、指导和手册中利用免抽提SDS-PK裂解法对样本的前处理方法,用于与之相配合不同的miRNA测定方法。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围
综上所述,由于采用了上述技术方案,本发明的有益效果是:采用本发明的方法预测样本是来反应性自淋巴结节增生或淋巴瘤,其预测准确度高,可达到97.77%。
附图说明
图1:5-miRNA谱鉴别淋巴结节增生与淋巴瘤的ROC图;
图2:4-miRNA谱鉴别淋巴结节增生与DLBCL淋巴瘤的ROC图;
图3:5-miRNA谱鉴别DLBCL与NK/T细胞淋巴瘤的ROC图;
图4:不同样本中miR-150相对含量比较图;
图5:不同样本中miR-155相对含量比较图;
图6:不同样本中miR-17相对含量比较图;
图7:不同样本中miR-146a相对含量比较图;
图8:不同数目miR-150参照物RT-qPCR测定曲线。图中的数值为每个PCR反应中所
参入的miR-150分子数目;
图9:miR-150参照物及样本RT-qPCR的熔解曲线。标注为空白对照。
具体实施方式
下面结合附图,对本发明作详细的说明。
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例1:样本收集、细胞培养
淋巴瘤样本为收集于2007年1月–2015年10月间病理结果确诊的淋巴瘤患者存档蜡块及临床资料,另随机选取淋巴结反应性增生病理标本作为对照。FFPE样本为淋巴瘤初治患者,均有明确病理诊断和免疫组织化学诊断,未行任何相关肿瘤治疗。弥漫大B细胞淋巴瘤分期采用Ann Arbor分期系统。
表1:样本信息
细针穿刺样本为活检的淋巴瘤样本的一部分,并由相同样本的病理分析结果证实。
H1299、A549、H460或Hela细胞培养于含有10%FBS的RPMI培养基的100mm的培养平皿,置于5%CO2的37℃培养箱中培养至80%-90%的饱和度。除去上清后,依据实验设计的需求,加入Trizol试剂或SDS-PK裂解液对细胞总RNA进行提取。
实施例2:SDS-PK裂解法、总RNA的纯化、定量测定和FFPE样本的脱蜡处理
SDS-PK裂解法:可用此法处理的样本类型为经液氮中碾磨的组织、脱蜡处理后的组织或细胞的悬浮液。具体做法为,在组织或细胞样本中加入等体积的2xSDS-PK裂解液。混匀后在55℃条件下加60分钟,加热过程中需不时混匀。加热完成后,离心去除杂质,转移上清到新的PE管,可在-20℃冰箱保存至少6个月。
2x SDS-PK裂解液:1%SDS,2ug/ul PK。
Trizol RNA纯化步骤按照厂家的说明书进行。RNA沉淀溶解于0.5%的SDS溶液中,可在-20℃冰箱保存至少6个月。
PPFE样本的脱蜡处理:1.FFPE样品中添加1毫升二甲苯,涵盖所有石蜡切片,关闭盖子,涡旋混匀10秒钟,然后在55℃孵化10分钟。2.用移液器除去上清液,并添加1毫升新鲜二甲苯,55℃孵育5分钟。3.室温下15000g离心2分钟。4.除去上清液。不要任何残留。5.加入1毫升乙醇(100%),旋涡震荡混合。6.室温下15000g离心2分钟,尽量除去上清液,在室温下蒸发10分钟,直到所有残余乙醇消失。
Qubit荧光光度计2.0RNA的定量测定:将RNA试剂以1:200的比例稀释,按厂家的使用说明配制标准液并对仪器进行校正。然后将10μl RNA溶液稀释到190μl的Qubit工作液,25℃保温2分钟后将样品管置于Qubit 2.0荧光光度计测定,获得RNA的浓度值。
实施例3:miRFLP测定法对样本中特定miRNA的测定
免抽提miRFLP直接测定法的操作过程如下:将待测样本用含有10ng/ul细菌RNA的RSB(RNA Solution Buffer)以1:50稀释,目标miRNA与动态miRNA标准混合均匀,经过miRNA逆转录、cDNA加尾修饰、用琼脂糖链霉素偶联试剂对生物素标记的欧米伽产物进行富集和纯化、荧光PCR同步扩增处理,最后用DNA测序仪进行DNA片段长度和荧光定量的分析。具体的操作步骤在我们发表的文献和先前的专利中已有详细描述(Xie,2015;PCT/CN2013/070525;CN2014103626962)。
实施例4:淋巴细胞及淋巴瘤SRA文库中差异表达的miRNA。
从NCBI的短RNA文库(SRA)中下载了31个淋巴细胞和淋巴瘤的miRNA测序数据。通过对各个数据集中所有miRNA读数的排序,我们发现let-7f为所有样本共有,且有极高的表达。以接近let-7f测序读数的整数100,000为准,对所有miRNA进行校正,分析表达差异,并结合文献报道,确定了21个区分淋巴结节增生和淋巴瘤的待选miRNA。见表2a,b,c。
表2a:SRA文库中区分淋巴结节增生和淋巴瘤的待选miRNA。
sample |
Run |
let-7f |
miR-378a |
miR-21 |
miR-29a |
miR-146a |
miR-191 |
miR-25 |
Naive B Cell(Naive39) |
SRR015358 |
100,000 |
563 |
2,756 |
2,669 |
83 |
507 |
1,163 |
Naive B Cell(Naive138) |
SRR015362 |
100,000 |
4,224 |
6,435 |
4,023 |
379 |
918 |
3,496 |
Memory B cells(MMSS) |
SRR015361 |
100,000 |
1,224 |
4,261 |
3,015 |
382 |
470 |
1,004 |
Memory B cells(MM139) |
SRR015365 |
100,000 |
3,353 |
10,877 |
5,648 |
1,710 |
1,116 |
3,770 |
Plasma B cells(PC137) |
SRR015360 |
100,000 |
222 |
2,789 |
2,339 |
324 |
575 |
1,052 |
Plasma B cells(PC44) |
SRR015364 |
100,000 |
358 |
2,225 |
2,148 |
239 |
586 |
1,429 |
Activated B cell(primary human) |
SRR033719 |
100,000 |
1,162 |
2,892 |
4,769 |
422 |
350 |
1,168 |
EBV-transformed B cell(primary human) |
SRR096521 |
100,000 |
1,356 |
12,155 |
3,143 |
790 |
591 |
985 |
Germinal Center B cell(GC136) |
SRR015359 |
100,000 |
829 |
4,097 |
1,258 |
150 |
2,279 |
3,251 |
Germinal Center B cell(GC40) |
SRR015363 |
100,000 |
565 |
6,608 |
1,503 |
1,578 |
1,756 |
7,143 |
Diffuse Large B cell lymphoma(LY3Cell Line) |
SRR033721 |
100,000 |
1,258 |
11,250 |
5,235 |
61 |
792 |
1,217 |
Diffuse Large B cell lymphoma(primary Human) |
SRR033711 |
100,000 |
9,318 |
9,246 |
3,187 |
3,087 |
2,138 |
1,914 |
Diffuse Large B cell lymphoma(Bjab CellLine) |
SRR033732 |
100,000 |
113,318 |
156,548 |
32,962 |
5 |
33,370 |
124,413 |
Burkitt Lymphoma(primary Human) |
SRR033712 |
100,000 |
9,671 |
3,827 |
1,293 |
45 |
2,013 |
2,290 |
Burkitt Lymphoma(Ramos Cell Line) |
SRR033713 |
100,000 |
3,309 |
419 |
1,437 |
63 |
1,312 |
1,771 |
Burkitt Lymphoma(Daudi human Cell Line) |
SRR033714 |
100,000 |
4,169 |
536 |
935 |
6 |
653 |
2,441 |
Mantle cell Lymphoma(Mino cell line) |
SRR033715 |
100,000 |
1,458 |
411 |
318 |
75 |
487 |
1,794 |
Mantle cell lymphoma(Primary Human) |
SRR033716 |
100,000 |
2,085 |
12,097 |
1,951 |
543 |
765 |
1,426 |
Mantle cell Lymphoma(Primary Human) |
SRR033717 |
100,000 |
1,319 |
8,927 |
2,642 |
782 |
737 |
1,175 |
Hodkgin lymphoma(L1236human cell line) |
SRR033723 |
100,000 |
1,008 |
4,913 |
4,309 |
146 |
1,613 |
3,256 |
Hodkgin lymphoma(L428human cell line) |
SRR033724 |
100,000 |
2,926 |
33,034 |
9,351 |
57 |
1,320 |
3,530 |
ansformed follicular lymphoma(primary Human) |
SRR033710 |
100,000 |
7,026 |
20,676 |
3,789 |
1,171 |
2,029 |
2,590 |
HIV lymphoma(Primary human) |
SRR033727 |
100,000 |
507 |
10,011 |
3,732 |
416 |
1,396 |
2,192 |
Marginal Zone lymphoma(Primary human) |
SRR033728 |
100,000 |
60 |
5,537 |
4,591 |
85 |
476 |
1,423 |
Marginal Zone lymphoma(Primary human) |
SRR033729 |
100,000 |
825 |
7,917 |
3,365 |
1,706 |
1,767 |
1,942 |
Lymphoblastic lymphoma(Primary human) |
SRR033730 |
100,000 |
338 |
1,969 |
1,053 |
42 |
1,481 |
3,554 |
Chronic lymphocytic leukemia(Primary human) |
SRR033725 |
100,000 |
1,069 |
6,753 |
5,628 |
30 |
190 |
1,950 |
Chronic lymphocytic Leukemia(primary human) |
SRR033726 |
100,000 |
931 |
13,247 |
10,884 |
41 |
491 |
937 |
Multiple Myeloma(U266human cell line) |
SRR033718 |
100,000 |
8,339 |
17,908 |
35,235 |
1,674 |
14,723 |
12,227 |
Multiple Myeloma(H929human cell line) |
SRR033731 |
100,000 |
992 |
403 |
2,068 |
320 |
324 |
1,835 |
Multiple Myeloma(KMS12human cell line) |
SRR033722 |
100,000 |
26,249 |
7,375 |
47,388 |
7,331 |
27,381 |
30,422 |
表2b:SRA文库中区分淋巴结节增生和淋巴瘤的待选miRNA
sample |
Run |
miR-92a |
miR-423 |
miR-146 |
miR-155 |
miR-101 |
miR-26a-5p |
miR-181a |
Naive B Cell(Naive39) |
SRR015358 |
1,183 |
3,446 |
303 |
155 |
2,294 |
788 |
726 |
Naive B Cell(Naive138) |
SRR015362 |
4,728 |
12,359 |
596 |
310 |
5,676 |
681 |
1,165 |
Memory B cells(MMSS) |
SRR015361 |
1,261 |
3,843 |
244 |
108 |
2,025 |
1,324 |
129 |
Memory B cells(MM139) |
SRR015365 |
4,931 |
10,047 |
987 |
526 |
6,345 |
1,189 |
837 |
Plasma B cells(PC137) |
SRR015360 |
434 |
3,635 |
61 |
178 |
394 |
499 |
1,656 |
Plasma B cells(PC44) |
SRR015364 |
287 |
1,791 |
71 |
248 |
722 |
523 |
3,189 |
Activated B cell(Primary human) |
SRR033719 |
3,056 |
7,052 |
376 |
538 |
7,711 |
893 |
927 |
EBV-transformed B cell(primary human) |
SRR096521 |
1,040 |
1,204 |
414 |
2,560 |
973 |
114 |
167 |
Germinal Center B cell(GC136) |
SRR015359 |
1,126 |
4,192 |
64 |
166 |
346 |
402 |
1,530 |
Germinal Center B cell(GC40) |
SRR015363 |
6,778 |
12,085 |
257 |
610 |
743 |
419 |
2,955 |
Diffuse Large B cell lymphoma(LY3Cell Line) |
SRR033721 |
1,932 |
562 |
68 |
1,737 |
1,049 |
170 |
95 |
Diffuse Large B cell lymphoma(PrimaryHuman) |
SRR033711 |
1,394 |
1,058 |
848 |
816 |
638 |
239 |
530 |
Diffuse Large B cell lymphoma(Bjab CellLine) |
SRR03373322 |
95,105 |
43,643 |
14,944 |
232 |
10,843 |
3,683 |
11,563 |
Burkitt Lymphoma(primary Human) |
SRR033712 |
3,623 |
2,101 |
2,914 |
30 |
522 |
471 |
2,158 |
Burkitt Lymphoma(Ramos Cell Line) |
SRR033713 |
2,735 |
2,034 |
18 |
0 |
1,887 |
324 |
362 |
Burkitt Lymphoma(Daudi human Cell Line) |
SRR033714 |
749 |
406 |
46 |
4 |
1,058 |
88 |
562 |
Mantle cell Lymphoma(Mino cell line) |
SRR033715 |
237 |
357 |
27 |
112 |
359 |
71 |
616 |
Mantle cell lymphoma(Primary Human) |
SRR033716 |
547 |
911 |
631 |
3,101 |
1,294 |
241 |
210 |
Mantle cell Lymphoma(primary Human) |
SRR033717 |
830 |
672 |
898 |
3,073 |
682 |
124 |
871 |
Hodkgin lymphoma(L1236human cell line) |
SRR033723 |
2,441 |
483 |
114 |
1,037 |
1,173 |
112 |
281 |
Hodkgin lymphoma(L428human cell Line) |
SRR033724 |
840 |
582 |
23 |
25 |
2,621 |
63 |
4 |
ansformed follicular lymphoma(primaryHuman) |
SRR033710 |
5,091 |
945 |
3,264 |
155 |
1,840 |
1,325 |
1,484 |
HIV lymphoma(Primary human) |
SRR033727 |
6,423 |
4,182 |
202 |
232 |
890 |
537 |
2,448 |
Marginal Zone lymphoma(Primary human) |
SRR033728 |
571 |
1,147 |
124 |
208 |
1,554 |
737 |
357 |
Marginal Zone lymphoma(Primary human) |
SRR033729 |
3,996 |
6,231 |
1,732 |
1,323 |
1,203 |
1,749 |
9,171 |
Lymphoblastic lymphoma(Primary human) |
SRR033730 |
2,056 |
2,067 |
413 |
107 |
300 |
1,039 |
12,303 |
Chronic lrmphocytic leukemia(Primary human) |
SRR033725 |
1,185 |
1,605 |
247 |
39 |
7,639 |
1,274 |
2 |
Chronic lymphocytic Leukemia(Primary human) |
SRR033726 |
1,411 |
1,789 |
224 |
652 |
8,841 |
1,387 |
3 |
Multiple Myeloma(U266human cell line) |
SRR033718 |
2,544 |
6,114 |
126 |
2 |
3,512 |
1,206 |
1,814 |
Multiple Myeloma(H929human cell line) |
SRR033731 |
3,762 |
2,266 |
8 |
0 |
1,002 |
261 |
0 |
Multiple Myeloma(KMS12human cell line) |
SRR033722 |
26,189 |
7,790 |
2,308 |
946 |
8,763 |
1,585 |
5,045 |
表2c:SRA文库中区分淋巴结节增生和淋巴瘤的待选miRNA
sample |
Run |
miR-16 |
miR-192 |
miR-107 |
miR-423 |
miR-17 |
miR-34a |
miR-150 |
Naive B cell(Naive39) |
SRR015358 |
517 |
551 |
15 |
201 |
22 |
0 |
31 |
Naive B Cell(Naive138) |
SRR015362 |
600 |
991 |
15 |
492 |
0 |
0 |
89 |
Memory B cells(MMSS) |
SRR015361 |
369 |
425 |
11 |
259 |
14 |
0 |
49 |
Memory B cells(MM139) |
SRR015365 |
363 |
1,105 |
52 |
578 |
107 |
0 |
104 |
Plasma B cells(PC137) |
SRR015360 |
344 |
232 |
12 |
123 |
23 |
0 |
2 |
Plasma B cells(PC44) |
SRR015364 |
256 |
405 |
16 |
179 |
28 |
0 |
4 |
Activated B cell(Primary human) |
SRR033719 |
365 |
412 |
14 |
287 |
21 |
0 |
40 |
EBV-transformed B cell(primary human) |
SRR096521 |
261 |
105 |
39 |
167 |
45 |
5 |
0 |
Germinal Center B cell(GC136) |
SRR015359 |
414 |
619 |
99 |
327 |
101 |
0 |
2 |
Germinal Center B cell(GC40) |
SRR015363 |
532 |
479 |
120 |
457 |
80 |
2 |
14 |
Diffuse Large B cell lymphoma(Ly3Cell Line) |
SRR033721 |
550 |
1,318 |
35 |
106 |
131 |
0 |
0 |
Diffuse Large B cell lymphoma(Primary Human) |
SRR033711 |
406 |
344 |
116 |
101 |
94 |
3 |
0 |
Diffuse Large B cell lymphoma(Bjab Cell Line) |
SRR033732 |
9,204 |
20,698 |
8,744 |
5,884 |
5,619 |
0 |
9 |
Burkitt Lymphoma(Primary Human) |
SRR033712 |
579 |
895 |
164 |
304 |
271 |
3 |
0 |
Burkitt Lymphoma(Ramos Cell Line) |
SRR033713 |
385 |
480 |
68 |
186 |
261 |
0 |
0 |
Burkitt Lymphoma(Daudi human Cell Line) |
SRR033714 |
220 |
1,465 |
65 |
106 |
284 |
0 |
0 |
Mantle cell Lymphoma(Mino cell line) |
SRR033715 |
65 |
208 |
268 |
27 |
71 |
0 |
0 |
Mantle cell lymphoma(Primary Human) |
SRR033716 |
207 |
1,778 |
64 |
98 |
58 |
14 |
0 |
Mantle cell Lymphoma(Primary Human) |
SRR033717 |
229 |
3,461 |
77 |
58 |
86 |
9 |
0 |
Hodkgin lymphoma(L1236human cell line) |
SRR033723 |
243 |
341 |
280 |
165 |
191 |
0 |
0 |
Hodkgin lymphoma(L428human cell line) |
SRR033724 |
267 |
491 |
117 |
136 |
143 |
1 |
0 |
ansformed follicular lymphoma(Primary Human) |
SRR033710 |
352 |
1,248 |
98 |
274 |
183 |
5 |
27 |
HIV lymphoma(Primary human) |
SRR033727 |
485 |
594 |
166 |
173 |
75 |
8 |
3 |
Marginal Zone lymphoma(Primary human) |
SRR033728 |
241 |
382 |
152 |
61 |
5 |
3 |
28 |
Marginal Zone lymphoma(Primary human) |
SRR033729 |
1,047 |
300 |
153 |
206 |
43 |
28 |
107 |
Lymphoblastic lymphoma(Primary human) |
SRR033730 |
405 |
188 |
375 |
128 |
42 |
2 |
8 |
Chronic lymphocytic leukemia(Primary human) |
SRR033725 |
283 |
402 |
30 |
163 |
12 |
2 |
87 |
Chronic lymphocytic Leukemia(Primary human) |
SRR033726 |
1,197 |
477 |
19 |
157 |
23 |
3 |
112 |
Multiple Myeloma(U266human cell line) |
SRR033718 |
3,196 |
6,864 |
710 |
821 |
176 |
52 |
1 |
Multiple Myeloma(H929human cell line) |
SRR033731 |
244 |
236 |
82 |
212 |
134 |
0 |
0 |
Multiple Myeloma(KMS12human cell line) |
SRR033722 |
3,109 |
1,869 |
6,031 |
2,185 |
2,965 |
0 |
3 |
实施例5:支持向量机预测器为区分反应性增生与DLBC的最佳分类模型
利用LibSVM3.11软件构建支持向量机分类模型。将反应性增生与DLBC,共55个样本的miRNA测定结果,以let-7作为标准化的对照校准,使用GainRation进行特征选取,根据每个特征的得分进行排秩,依次添加特征,通过5折交叉检验获得分类器的准确度。当准确率达到最高时,停止添加特征,然后使用支持向量机(libSVM)进行分类测试。用贝叶斯网络(NaiveBayes)、支持向量机(libSVM)、J48、Logistic回归分析和回归分类模型(Classification Via Regression)对同组数据进行筛选,均得到90%以上的分类准确度。表3显示以不同miRNA组合为特征,使用不同分类模型所得的分类准确度,最好的分类模型为支持向量机模型。该模型被用于本发明的数据分析。
表3:不同分类模型对反应性增生与DLBC分类预测的准确率。
实施例6:反应性增生、淋巴瘤和培养细胞的miRNA表达差异。
样本经SDS-PK裂解法处理后,用QubitRNA定量法测定其总RNA的含量,并对其中的8个miRNA的数量用miRFLP测定法进行测定。测定结果分别以RNA重量或let-7f为参照进行校正,校正后结果列于表4a和表4b。培养的细胞为来源于肺组织的肺癌细胞,可以由miR-150/155的差异区分。以let-7f为参照调整后,淋巴组织来源的miR-150/155相对值均大于100,而非淋巴组织来源的相对值均小于50。miR-150及miR-155的高表达可以用来鉴定样本是否来源于淋巴组织。
表4a:以RNA重量为参照进行校正后反应性增生、淋巴瘤和培养细胞的miRNA表达量。
表4b:以let-7f为参照进行校正后反应性增生、淋巴瘤和培养细胞的miRNA表达量。
实施例6:反应性增生与肿瘤:反应性增生18例,淋巴瘤117例。
数据分析:分别对反应性增生与淋巴瘤两类样本的每种miRNA统计均值,标准差以及95%CI,最后对每种miRNA在两类样本中的差异进行T检验。表5在反应性增生与淋巴瘤中,各个miRNA在两类样本中的均值,标准差,95%CI及T检验P值。T检验中,P值越小,表明在反应性增生与淋巴瘤两类样本中,该miRNA的差异越显著。从T检验的结果中,我们发现最显著的4个差异miRNA(miR-150,miR-155,miR-146a,miR-17-5p)恰好为我们构建分类器性能最好时使用的特征。
表5:反应性增生与淋巴瘤中,各miRNA在两类样本中的均值,标准差,95%CI及T检验P值。
表6:使用不同特征构建反应性增生与淋巴瘤分类器及五折交叉检验获得的准确率。
分类器预测差异样本:以概率为0.5时的截止值为判定标准,淋巴瘤全部预测正确。
不同样本中miR-150、miR-155、miR-146a、miR-17-5p的相对含量比较如图4-7所示。
采用5种miRNA,即“5-miRNA谱”鉴别淋巴结节增生与淋巴瘤的ROC图以及最佳截止值如图1所示;这5种miRNA分别为:miR-150,miR-155,miR-146a,miR-17和let-7f;
图1中:淋巴瘤为阳性,反应性增生为阴性,此预测器的AUC为0.9986,以概率>0.813时的截止值为判定标准,即概率>0.813判定为该样本为阳性时,预测器性能最好,假阳性率为0,阳性率为0.9829,准确率为97.77%。
实施例7:反应性增生与DLBCL。
数据分析:分别对反应性增生(18例)与DLBCL淋巴瘤(39例)两类样本的每种miRNA统计均值,标准差以及95%CI,最后对每种miRNA在两类样本中的差异进行T检验。表7在反应性增生与DLBCL淋巴瘤中,各个miRNA在两类样本中的均值,标准差,95%CI及T检验P值。T检验中,P值越小,表明在反应性增生与淋巴瘤两类样本中,该miRNA的差异越显著。从T检验的结果中,我们发现最显著的4个差异miRNA(miR-150,miR-155,miR-17-5p及miR-146b)恰好为我们构建分类器性能最好时使用的特征。
表7:在反应性增生与DBLC中,各miRNA在两类样本中的均值,标准差,95%CI及t检验P值。
表8:使用不同特征构建反应性增生与DLBC分类器及5折交叉检验获得的准确率。
结论:将单个miRNA作为分类特征,miR-150的分类准确率最高,其次是miR-155,但是作为特征组合,miR-155区分反应性增生与DLBCL时对分类器没有贡献。分类器预测差异样本:以概率为0.5作为判断截止值,既概率值>0.5时,判定此样本为DLBC。结论:DLBCL全部预测正确。
采用4种miRNA,即“4-miRNA谱”鉴别淋巴结节增生与DLBCL淋巴瘤的ROC图以及最佳截止值如图2所示;这4种miRNA分别为:miR-150,miR-155,miR-146b和let-7f,准确率96.49%。
图2中:DLBC为阳性,反应性增生为阴性。此预测器的AUC为0.9972,截止值为0.6949,即概率值>0.6949判定为该样本为阳性时,预测器性能最好,假阳性为0,阳性率为0.9487。
实施例8:DLBC与NK/T细胞淋巴瘤,共有样本58例,其中DLBC 39例,NK/T细胞淋巴瘤19例。
数据分析:分别对DLBCL淋巴瘤(39例)与NK/T细胞淋巴瘤(58例)两类样本的每种miRNA统计均值,标准差以及95%CI,最后对每种miRNA在两类样本中的差异进行T检验。
表9在DLBC与NK/T细胞淋巴瘤中,各个miRNA在两类样本中的均值,标准差,95%CI及T检验P值。T检验中,P值越小,表明在反应性增生与淋巴瘤两类样本中,该miRNA的差异越显著。从T检验的结果中,我们发现最显著的4个差异miRNA(miR-146b,miR-16-5p,miR-155,miR-181a-5p)恰好为我们构建分类器性能最好时使用的特征。
表9:在DLBC与NK/T细胞淋巴瘤中,各miRNA在两类样本中的均值,标准差,95%CI及t检验P值。
表10:使用不同特征构建DLBC与NK/T细胞淋巴瘤分类器及5折交叉检验获得的准确率。
注:只使用miR-146b,miR-16-5p,miR-155,miR-181a-5p作为特征对DLBC与NK/T细胞淋巴瘤分类时,准确率达到最大值。分类器预测差异样本:截止值为0.5,既概率>0.5时,判定此样本为DLBC。
采用5种miRNA,即“5-miRNA谱”鉴别鉴别DLBCL与NK/T细胞淋巴瘤的ROC图以及最佳截止值如图3所示;这5种miRNA分别为:miR-146b,miR-16-5p,miR-155,miR-181a-5p和let-7f,准确率91.38%。
图3中,DLBC为阳性,NK/T细胞淋巴瘤为阴性。此预测器的AUC为0.9919,最佳截止值为0.7868,即概率>0.7868判定为该样本为阳性时,预测器性能最好,假阳性为0,阳性率为0.9231。区分反应性增生与淋巴瘤,反应性增生与DLBC效果较好,分类效果显著,但区分DLBC与NK/T细胞淋巴瘤效果不佳,虽然AUC较大,但区分两类的概率界限不明显。
实施例9:细针穿刺样本的测定结果
发明人对4个细针穿刺样本进行SDS-PK裂解处理,并对总RNA进行了Qubit RNA定量测定,和miRFLP测定法对8个miRNA数目的定量测定。以样本中let-7f的测定为方法的参照,与表12b中相应类型淋巴瘤比较,各个miRNA相对值均有一致性。
表11:细针穿刺样本中miRNA的测定值,以样本中let-7f的测定为方法的参照。
实施例10:淋巴瘤主要类型的miRNA统计结果
发明人对淋巴结节增生及淋巴瘤FFPE样本用SDS-PK裂解法进行了处理,对裂解液中总RNA含量用Qubit RNA试剂进行测定,并对其中的8个miRNA的数量用miRFLP测定法进行测定。测定结果分别以RNA重量或let-7f为参照进行校正,校正后结果列于表12a和表12b。表12a:淋巴结节增生及各大类淋巴瘤FFPE样本中每纳克RNA中所含miRNA的绝对数目。
表12b:以let-7f为参照,淋巴结节增生及各大类淋巴瘤FFPE样本中miRNA的相对数目。
实施例11:RT-qPCR测定法相对定量与miRFLP测定结果的比较。
miRFLP测定法的最终结果可以同过荧光毛细管电泳进行多目标的同时测定,也可用RT-qPCR方法分别对所测的miRNA测定出相对循环数。两者的操作过程极为接近。miRFLP直接测定法将待测目标miRNA与动态miRNA标准混合均匀,经过miRNA逆转录、cDNA加尾修饰、用琼脂糖链霉素偶联试剂对生物素标记的欧米伽产物进行富集和纯化、荧光PCR同步扩增处理,最后用DNA测序仪进行DNA片段长度和荧光定量的分析。在miRFLP直接测定法的操作过程用加入SybrGreen的qPCR测定代替荧光PCR同步扩增处理和DNA测序仪进行的DNA片段长度荧光定量分析即可改变为qPCR的定量测定方法。进行荧光PCR扩增,PCR反应条件为:95℃2分钟,45次温度循环:95℃15秒-60℃1分钟-72℃30秒-荧光读数,最后在72℃孵化5分钟,DNA熔解曲线收集。图8显示了不同数目miR-150参照物的RT-qPCR测定曲线。图中的数值为每个PCR反应中所参入的miR-150分子数目。图9为miR-150参照物及样本RT-qPCR的熔解曲线。荧光染料SybrGreen可以测定PCR每个循环后PCR产物的扩增量,相同PCR产物具有共同的DNA熔解温度,可以用来衡量PCR扩增的专一程度。图中所有参照物和样本均扩增出了特异的miR-150产物,而空白对照没有扩增出具有miR-150特征的PCR产物。表13为空白对照、miRNA参照分子及样本中三种miRNA的RT-qPCR测定循环值。每个样本分别测定三次。以miRNA参照物的测定值做出标准曲线,可将miRNA的Ct值转换为绝对数目。表14列出了利用RT-qPCR和miRFLP测定法分别对4个FFPE样本miRNA数目的测定结果。两种测定方法得到极为接近的结果。通过对let-7f为参照进行比对,均可用于对淋巴瘤的区分。RT-qPCR测定法需要对每个miRNA进行独立的反应,不可避免的增加上样和测定误差。对更多目标进行测定时,增加实际测定的困难。另外,许多种类荧光标记的探针也可用来代替SybrGreen染料,得到更准确的定量结果。
表13:空白对照、miRNA参照分子及样本中三种miRNA的RT-qPCR测定值。每个样本分别测定三次。
表14:利用两种不同方法分别对4个FFPE样本miRNA的测定结果比较。