CN110628880A - 一种同步使用信使rna与基因组dna模板检测基因变异的方法 - Google Patents
一种同步使用信使rna与基因组dna模板检测基因变异的方法 Download PDFInfo
- Publication number
- CN110628880A CN110628880A CN201910947353.5A CN201910947353A CN110628880A CN 110628880 A CN110628880 A CN 110628880A CN 201910947353 A CN201910947353 A CN 201910947353A CN 110628880 A CN110628880 A CN 110628880A
- Authority
- CN
- China
- Prior art keywords
- primer
- sequence
- nucleic acid
- library
- stranded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6858—Allele-specific amplification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/16—Primer sets for multiplex assays
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Immunology (AREA)
- Biotechnology (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种同步使用信使RNA与基因组DNA模板进行高通量测序的文库构建,以检测对应的基因变异类型的方法,该方法包括对总核酸样本进行反转录、接头连接、靶标特异性线性扩增,然后使用巢式靶标特异性引物对靶序列进行扩增。本发明的检测方法基于基因组DNA与信使RNA序列的差别,设计对应的引物,从而达到在一个反应体系中同时检测出两种核酸模板中融合与突变的目的。
Description
技术领域
本发明涉及基因变异检测技术领域,尤其是一种同步使用信使RNA与基因组DNA模板进行高通量测序检测基因变异的方法。
背景技术
真核生物的基因由外显子及内含子交替组成。内含子占基因序列的大部分,以ALK基因为例,全长为728kb(千碱基,以下同),其中外显子为6kb,其余为内含子序列。基因通过转录反应合成前体RNA(hnRNA),再通过剪切反应去除内含子序列,使外显子拼接成为信使RNA(mRNA),用于翻译合成蛋白(如图4)。
肿瘤的基因变异可大致划分为:单碱基置换突变(SNV)、插入/缺失突变(Indel)、DNA拷贝数变异(CNV)、基因融合、RNA表达量差异。单碱基置换突变及插入/缺失突变合称突变,在肿瘤中最为常见,如单是EGFR一个基因的突变就占到中国肺癌患者的约40%。基因融合,又称染色体重排或易位,是正常基因组中位于不同区域的两个或以上序列发生断裂重组从而拼接成一段新的序列。一些特殊的变异,如一段序列的倒置,或基因的异常剪切,也可被归为融合。基因融合是一种常见的肿瘤发生机制,也是靶向治疗的重要靶点,如肺癌中多发的EML4-ALK基因融合,为克唑替尼的作用靶点。
高通量测序技术在过去的十年里彻底改变了基因组学领域。每次运行可并行获得数百万条以上的序列信息。靶向测序是指针对指定的靶标区域进行的高通量测序,提供了具有适当广度和深度的测序数据,从而允许检测临床相关的基因变异。肿瘤基因变异的复杂性决定了靶向测序是有效发现变异的手段,针对的靶标区域为肿瘤基因的特定位点,如药物作用的靶点或揭示肿瘤分型或疗效的分子生物标志物。
组织样本含有两类核酸,DNA主要由染色体的基因组DNA、线粒体DNA及染色体外DNA构成,RNA由未剪切修饰的前体RNA、剪切修饰的信使RNA、非编码RNA(ncRNA)、核糖体RNA(rRNA)、转运RNA(tRNA)构成。靶向测序可使用基因组DNA(gDNA)为模板,也可使用信使RNA(mRNA)为模板构建文库,各有优劣。靶向测序的关键是选择性地从核酸样本中捕获或富集靶标区域。发生在外显子上的突变造成信使RNA序列改变,进而导致蛋白的氨基酸变异而改变其功能,而内含子发生的突变则在剪切反应中被去除,不会传导为氨基酸变异。所以检测突变适合使用基因组DNA为模板,只需要将靶标区域设为基因的外显子,而无需检测内含子。
但是基因融合则不同,无论拼接点的发生区域,融合均导致嵌合体蛋白的产生。因此,如果使用基因组DNA为检测模板就需要不仅要覆盖外显子也要覆盖内含子,造成靶标区域过大。而如果使用信使RNA为模板就只需要覆盖剪切反应形成的嵌合体信使RNA产物即可,极大压缩了需要覆盖的靶标区域。
然而,突变在基因组DNA模板上可通过上下两条互补链同一位置的碱基改变进行验证,而信使RNA模板为单链无法进行这种验证。信使RNA的化学性质也较不稳定,容易因水解、环境因素、转录差错等造成碱基缺损,因此不适合用于检测突变。另外,在一些情况下,如血浆游离肿瘤核酸的液体活检,或长期保存降解严重的组织样本,无法获得可供检测的信使RNA,此时只能使用基因组DNA为模板检测融合。
由于在肺癌等实体肿瘤中突变占据主要比例,目前的高通量测序还是以基因组DNA建库为主流,而以信使RNA检测融合为补充。在近年来,融合变异的重要性及检测困难得到高度重视,但在临床实践中分别做DNA测序和RNA测序的使用成本、检测周期、样本品质均不理想,诸如活检样本和福尔马林固定石蜡包埋(FFPE)切片等临床样本,仅提供了少量的起始材料,难以满足两次检测的用量。
近来也有同时检测两种核酸模板的流程,但仍将两类核酸分别进行处理,并未全程合并在一起在进行,导致过程繁琐。目前,还没有完全合并使用基因组DNA与信使RNA模板建库的方案的报道。
发明内容
基于上述问题,本发明的目的在于克服上述现有技术的不足之处而提供一种同步使用信使RNA与基因组DNA模板进行高通量测序检测基因变异的方法。
为实现上述目的,本发明采取的技术方案包括以下几个方面:
在第一个方面,本发明提供了一种同步使用信使RNA与基因组DNA模板进行高通量测序检测基因变异的方法,包括如下步骤:
1)提供含有基因组DNA和信使RNA的核酸样本,通过反转录使得核酸样本中的信使RNA转化为双链的互补DNA(cDNA),得到含有双链cDNA及基因组DNA的核酸样本;
2)将步骤1)所得含有双链cDNA及基因组DNA的核酸样本打断,得到随机分布的核酸片段;
3)连接文库接头至步骤2)所得核酸片段,得到连接产物;
4)将步骤3)所得连接产物与第一引物池和DNA聚合酶混合,连接产物经高温解聚成两条单链核酸,其中一条含有靶标序列的单链与第一引物经退火结合,并延伸反应至文库接头的单链末端,得到一条以含有文库接头和靶标序列的核酸为模板的单链复制产物;
5)重复至少一次与步骤4)相同的变温循环,得到多条所述单链复制产物;
6)将步骤5)所得单链复制产物与通用接头引物、适配引物和第二引物池混合,进行PCR扩增获得测序用文库,文库中序列结构依次为测序芯片的第一结合序列—文库接头—靶标序列—第二引物共同序列—测序芯片的第二结合序列,其中,所述通用接头引物的5’端包含一段对应于测序芯片的第一结合序列,3’端包含一段与文库接头单链结构末端相同的序列,所述适配引物5’端包含一段对应于测序芯片的第二结合序列,3’端包含一段与第二引物共同序列相同的序列;
7)将步骤6)所得文库进行高通量测序,分析所述靶标序列是否发生了融合或/和突变。
优选地,步骤5)中重复1~100次与步骤4)相同的变温循环;更优选重复19次与步骤4)相同的变温循环。
在一些实施方案中,所述第一引物根据核酸模板设计,包括以下几种类型:
a、一条结合于靶标基因的外显子并指向潜在的融合拼接点的引物,用于从信使RNA模板检测该方向发生的融合;
b、一条结合于靶标基因的内含子且延伸方向指向临近外显子的引物,用于从基因组DNA模板检测所述外显子的突变;
c、一组结合于靶标基因的内含子并指向潜在的融合拼接点的引物,该组引物堆叠设置从而覆盖整个内含子,用于从基因组DNA模板检测该方向发生的融合。
在一些实施方案中,核酸模板包括基因组DNA。在一些实施方案中,核酸模板包括cDNA。在一些实施方案中,通过逆转录总RNA中的信使RNA而获得cDNA。在一些实施方案中,核酸样本包含基因组DNA和cDNA两者。在一些实施方案中,核酸模板是无细胞的基因组DNA。
在一些实施方案中,核酸样本来源于血液样本。在一些实施方案中,核酸样本来源于细胞或组织样本。在一些实施方案中,核酸样本来源于肿瘤活检样本。在一些实施方案中,核酸样本来源于福尔马林固定石蜡包埋(FFPE)样本。
在一些实施方案中,基因变异选自染色体重排、剪接变异、点突变、缺失、插入、拷贝数变异以及它们的组合。
在一些实施方案中,各类型的所述第一引物为多重引物,针对不同的靶标序列。
在一些实施方案中,所述第一引物的5’端包括一段第一引物共同序列。优选地,第一引物共同序列长度为至少13个碱基且不与靶标基因结合。由此,该第一引物共同序列使得两条第一引物扩增形成的产物的5’及3’端互补成为双链,在高温下难以解聚,从而抑制第一引物之间的相互扩增。
在一些实施方案中,所述第一引物池含有a类型第一引物,以及b类型和/或c类型第一引物。
在一些实施方案中,所述第二引物池含有与第一引物池中类型相同的第二引物。
在一些实施方案中,所述第二引物相对于第一引物是嵌套的;优选地,所述第二引物的方向与第一引物相同,所述第二引物3’端位置位于第一引物3’端的下游,且第二引物3’端距离第一引物3’端至少3个碱基,第二引物的5’端位置与第一引物5’端位置相同或位于第一引物下游。
在一些实施方案中,所述第二引物5’端包括一段第二引物共同序列。优选地,所述第二引物共同序列长度为至少13个碱基且不与靶标基因结合。更优选地,第二引物共同序列不与第一引物共同序列或其互补序列结合。由此,该第二引物共同序列使得两条第二引物扩增形成的产物的5’及3’端互补成为双链,在高温下难以解聚,从而抑制第二引物之间的相互扩增。第二引物共同序列不与第一引物共同序列或其互补序列结合。
在一些实施方案中,所述步骤3)中文库接头由两条部分序列互补的单链寡核苷酸组成,两条单链的互补部分构成一个双链结构,非互补部分构成单链结构。
在一些优选实施方案中,为了适合连接反应,所述双链结构的末端为双链平齐的平整末端或一链突出的粘性末端。
在一些实施方案中,为了区分各接头,所述文库接头含有一段第一标签序列。
在一些实施方案中,所述适配引物包含一段第二标签序列;优选地,所述第二标签序列位于所述适配引物中间;更优选地,使用所述第一标签序列和/或第二标签序列区分核酸样本。
在一些实施方案中,所述步骤1)还包括一次纯化,以除去未反应的反转录试剂。
在一些实施方案中,所述步骤3)还包括一次纯化,以除去未参与连接反应的文库接头。
在一些实施方案中,所述步骤5)还包括一次纯化,以除去未反应的第一引物池。
在一些实施方案中,所述步骤6)还包括一次纯化,以除去未反应的通用接头引物、适配引物和第二引物池。
本申请另一个方面提供了用于同步检测含有基因组DNA和信使RNA的核酸样本中基因变异的试剂盒,包括第一引物池和第二引物池,其中,第一引物根据核酸模板设计,包括以下几种类型:
a、一条结合于靶标基因的外显子并指向潜在的融合拼接点的引物,用于从信使RNA模板检测该方向发生的融合;
b、一条结合于靶标基因的内含子且延伸方向指向临近外显子的引物,用于从基因组DNA模板检测所述外显子的突变;
c、一组结合于靶标基因的内含子并指向潜在的融合拼接点的引物,该组引物堆叠设置从而覆盖整个内含子,用于从基因组DNA模板检测该方向发生的融合;第一引物池含有a类型第一引物,以及b类型和/或c类型第一引物;
所述第二引物相对第一引物是嵌套的,且第二引物类型与第一引物相同。
在一些实施方案中,该试剂盒用于诊断癌症。在一些实施方案中,癌症是肺癌、乳腺癌或结肠直肠癌,优选为肺癌。在一些实施方案中,所述基因变异为基因融合,所述融合基因为ALK、BRAF、EGFR、ESR1、ETV6、FGFR1、FGFR2、FGFR3、FGR、MET、NRG1、NTRK1、NTRK2、NTRK3、RET、ROS1基因中的任一者或多者。在一些实施方案中,所述基因变异为基因突变,所述突变基因为AKT1、ALK、BRAF、EGFR、ERBB2、FGFR1、FGFR2、FGFR3、KRAS、MET、NRAS、PIK3CA、ROS1基因中的任一者或多者。
在一些实施方案中,所述第二引物的方向与第一引物相同,所述第二引物3’端位置位于第一引物3’端的下游,且第二引物3’端距离第一引物3’端至少3个碱基,第二引物的5’端位置与第一引物5’端位置相同或位于第一引物下游。
在一些实施方案中,所述第二引物5’端包括一段第二引物共同序列。优选地,其长度为至少13个碱基且不与靶标基因结合。更优选地,第二引物共同序列不与第一引物共同序列或其互补序列结合。
在一些实施方案中,试剂盒还包括文库接头,文库接头由两条部分序列互补的单链寡核苷酸组成,两条单链的互补部分构成一个双链结构,非互补部分构成单链结构。
在一些实施方案中,所述双链结构的末端为双链平齐的平整末端或一链突出的粘性末端,以适合连接反应;优选地,所述文库接头含有一段第一标签序列。
在一些实施方案中,试剂盒还包括通用接头引物,通用接头引物的5’端包含一段对应于测序芯片的第一结合序列,3’端包含一段与文库接头单链结构末端相同的序列。
在一些实施方案中,试剂盒还包括适配引物,适配引物5’端包含一段对应于测序芯片的第二结合序列,3’端包含一段与第二引物共同序列相同的序列。
在一些实施方案中,在适配引物5’端序列和3’端序列之间包含一段第二标签序列;优选地,使用第一标签序列和/或第二标签序列区分核酸样本。
作为本发明的又一个方面,本发明还提供了一种诊断个体的疾病的方法,包括使用上述的方法或/和上述的试剂盒检测来自所述个体的核酸样本中所关注基因的与所述疾病相关的基因变异,从而提供对所述疾病的诊断。
综上所述,本发明的有益效果为:
采用本发明的检测方法和试剂盒可在一个反应体系中同时检测出两种核酸模板(基因组DNA和信使RNA)中融合及突变;
本发明的检测方法和试剂盒具有临床易用性,相比现有技术更方便;
除了常见的变异能被有效检出外,也增加了发现罕见变异的机会,对肿瘤靶向治疗的科学研究及临床应用具有重要意义。
附图说明
图1为三种类型的第一引物的结合区域示意图;
图2为引物与接头结构示意图;
图3为本发明中建库反应步骤示意图;
图4为基因组DNA与信使RNA的结构示意图;
图5为肺癌队列中样本核酸质量与年份的列图,其中,显示为1095份肺癌样本的核酸质量统计,以管家基因的信使RNA与基因组DNA信号判定核酸质量,可见绝大多数新采集的样本(本项目实施时间为2018年)核酸符合双模板检测要求,即使库存达到4年的样本,仍然有部分符合检测要求;
图6为一例EGFR L858R点突变的序列对比图,其显示为EGFR基因的L858R点突变,使用IGV视图软件做出,下标框为EGFR第21号外显子的参考基因组碱基及氨基酸序列;实体灰色部分为实测序列与参考基因组一致的碱基部分,双垂直线限定标注为突变的碱基;
图7为一例EGFR第19号外显子缺失突变的序列对比图,其显示为EGFR基因的第19外显子部分序列缺失,使用IGV视图软件做出,下标框为EGFR19号外显子的参考基因组碱基及氨基酸序列;实体灰色部分为实测序列与参考基因组一致的碱基部分,黑色实线为缺失的15个碱基;
图8为一例ALK基因融合的序列比对图,其显示为融合伙伴EML4基因及癌基因ALK的融合从信使RNA模板检出,下标显示为基因的内含子(箭头实线)及外显子(长条框);灰色部分为与参考基因组一致的序列,交错灰度部分为碱基不一致(即比对到对方基因区域)的序列,图中可见为两个外显子的拼接;
图9为一例NTRK1基因融合的序列比对图,其显示为融合伙伴TPR基因及癌基因NTRK1的融合从信使RNA模板检出,下标显示为基因的内含子(箭头实线)及外显子(长条框);灰色部分为与参考基因组一致的序列,交错灰度部分为碱基不一致(即比对到对方基因区域)的序列,图中可见为两个外显子的拼接;
图10为一例罕见的MET基因间融合的序列比对图,其显示为融合伙伴HLA-DRB1基因及癌基因MET的融合从信使RNA模板检出,下标显示为基因的内含子(箭头实线)及外显子(长条框);灰色部分为与参考基因组一致的序列,交错灰度部分为碱基不一致(比对到对方基因区域)的序列,图中可见为两个外显子的拼接;
图11为一例MET基因的第14外显子跳切的序列比对图,其显示为癌基因MET的第14外显子跳切从信使RNA模板检出,下标显示为基因的内含子(箭头实线)及外显子(长条框);灰色部分为与参考基因组一致的序列,图中可见为部分测序序列无第14外显子序列;
图12为双标签标记的样本示例,用于多个样本在同一批次检测时降低交叉污染。其所示为两个样本的标记情况,先使用第二标签对混合测序的样本进行拆分,从中随机抽取10000条序列统计携带的第一标签,可见上方的样本(第二标签第10号)获得8700条配对正确的第一标签第10号(87%),污染较少,而下方样本(第二标签第11号)正确配对的第一标签第11号仅5031条(50.3%),被其它样本污染严重。
具体实施方式
根据随后的具体实施方式和所附权利要求书,本发明的这些方面和其他方面以及优点将变得显而易见。应当理解,本文所述的各个实施方案的一种、一些或所有特性可以组合起来形成本发明的其他实施方案,就如同每个组合都被单独且明确地公开一样。
在一些实施例中,本发明提供一种同步使用信使RNA与基因组DNA模板进行高通量测序的文库构建,以检测对应的基因变异类型的方法,所述方法包括对总核酸样本进行反转录、接头连接、靶标特异性线性扩增,然后使用巢式靶标特异性引物对靶序列进行扩增;具体地,本发明的检测方法包括如下步骤:
1)根据核酸模板设计如下几种类型的第一引物(如图1):
a.一条结合于靶标基因的外显子并指向潜在的融合拼接点的引物,用于从信使RNA模板检测该方向发生的融合;
b.一条结合于靶标检测基因的内含子且延伸方向为指向临近的外显子的引物,用于从基因组DNA模板检测该外显子的突变;
c.一组结合于靶标基因的内含子并指向潜在的融合拼接点的引物,堆叠设置从而覆盖整个内含子,用于从基因组DNA模板检测该方向发生的融合;
其中,各类型的第一引物均可为多重,即针对不同的靶标序列设计相应的引物;第一引物的5’端包括一段第一引物共同序列;
2)混合第一引物成为第一引物池,其含有a类型,以及b或c类型二者中至少一种;
3)设计相同类型的第二引物,对应于第一引物为嵌套的,即第二引物的方向与第一引物相同,其3’端位置位于第一引物3’端的下游,第二引物的5’端位置与第一引物5’端位置相同或位于其下游,其中,第二引物的5’端包括一段第二引物共同序列,其与第一引物共同序列不同;
4)混合第二引物成为第二引物池;
5)设计一组文库接头,由两条部分序列互补的单链寡核苷酸组成(如图2):两条单链的互补部分构成一个双链结构,非互补部分构成单链结构;双链结构的末端为适合连接反应,如双链平齐的平整末端或一链突出的粘性末端;文库接头可含有一段序列为区分各接头的标签,即第一标签序列;
6)设计一条通用接头引物,其5’端包含一段对应于测序芯片的第一结合序列,3’端包含一段与文库接头单链结构末端相同的序列;
7)设计一组适配引物,其5’端包含一段对应于测序芯片的第二结合序列,3’端包含一段与第二引物共同序列相同的序列,在两段序列之间可包含一段序列为区分不同各适配引物的标签,即第二标签序列;
8)将同时含有基因组DNA及信使RNA的核酸样本进行反转录反应,使其中的信使RNA转化为双链结构的互补DNA(即cDNA)(如图3);然后纯化去除未反应的反转录试剂;
9)将上述反应产物打断成为随机分布的核酸片段;
10)连接文库接头至上述核酸片段,通过双链结构的末端进行连接反应;然后纯化去除未参与反应的文库接头;
11)将连接产物与第一引物池以及耐高温DNA聚合酶混合,使连接产物经高温解聚成两条单链核酸,并使第一引物与其中一个单链的靶标序列降温退火结合,并延伸反应达到文库接头的单链末端,从而获得一条以连接的核酸为模板的单链复制产物;
12)多次进行变温循环以获得多条相同的单链复制产物,然后纯化去除未反应的第一引物池;
13)将单链复制产物与通用接头引物、适配引物、第二引物池混合,进行PCR扩增,从而获得测序用文库,该文库的序列结构依次为:测序芯片的第一结合序列-文库接头-靶标序列-第二引物共同序列-测序芯片的第二结合序列;然后纯化去除未反应的通用接头引物、适配引物、第二引物池;
14)将步骤13)所得文库进行高通量测序,分析靶标序列是否含有融合或突变。
下面对本发明中涉及的一些定义、方法与操作和应用进行必要的说明。
I.定义
本文可互换使用的“多核苷酸”或“核酸”是指任何长度的核苷酸聚合物,并且包括脱氧核糖核酸(DNA)和核糖核酸(RNA)。核苷酸可以是脱氧核糖核苷酸、核糖核苷酸、经修饰的核苷酸或碱基,和/或其类似物,或者可以通过DNA或RNA聚合酶而掺入聚合物中的任何底物。多核苷酸可以包含经修饰的核苷酸,诸如甲基化的核苷酸及其类似物。
如本文所用的“寡核苷酸”通常是指较短的、通常为单链的、通常合成的多核苷酸,其长度一般但不一定不超过约200个核苷酸。术语“寡核苷酸”和“多核苷酸”并非相互排斥的。以上关于多核苷酸的描述同等地且完全适用于寡核苷酸。
术语“3’”通常是指多核苷酸或寡核苷酸中位于同一多核苷酸或寡核苷酸中另一区域或位置下游的区域或位置。
术语“5’”通常是指多核苷酸或寡核苷酸中位于同一多核苷酸或寡核苷酸中另一区域或位置上游的区域或位置。
如本文所用的“核酸模板”是指存在于用作靶标富集和测序的起始材料的核酸样本中的多核苷酸。
核酸模板可以指其双链或单链。
“互补”是指核苷酸碱基G、A、T、C和U之间的氢键合碱基对形成偏好,使得当两个给定的多核苷酸或核苷酸序列彼此退火结合时,在DNA中A与T配对并且G与C配对,在RNA中G与C配对并且A与U配对。如本文所用,“基本上互补”是指两段序列在全长或部分区间具有至少90%互补性(例如90%互补、95%互补、98%互补、99%互补或100%互补)。如本文所用,“基本上相同”是指两段序列在全长或部分区间具有至少90%同一性(例如90%同一性、95%同一性、98%同一性、99%同一性或100%同一性)。
“引物”通常是较短的单链多核苷酸,通常具有游离的3'-OH基团,其通过与靶序列互补而结合至所关注的靶标,然后促进与靶标互补的多核苷酸的聚合。
本文可互换使用的“杂交”、“退火”和“退火结合”是指因碱基互补形成的氢键合碱基对形成热力学稳定的复合物。氢键可以通过Watson-Crick碱基配对、Hoogstein结合或通过任何其他序列特异性方式而出现。
如本文所用,术语“特异性地杂交”或“特异性地退火”是指核酸与互补序列的核酸杂交。如本文所用,核酸分子的一部分可以与另一核酸分子上的互补序列特异性地杂交。也就是说,核酸序列的整个长度不一定需要与此类序列的一部分杂交以“与另一个分子特异性地杂交”,例如,在分子的5'末端可以存在一段未杂交的核苷酸,而同一分子的3'末端的一段序列与另一分子特异性地杂交。
如本文所用,当在对靶核酸具有特异性的引物的上下文中使用时,“特异性”是指引物和靶标之间的互补性水平,使得存在这样的退火温度,在该退火温度下,引物将退火至靶标核酸并介导靶标核酸的扩增,并且将不退火至样本中存在的非靶标序列或介导该非靶标序列的扩增。
本文使用的“接头”是指可连接至多核苷酸片段的寡核苷酸。
如本文使用的关于两个多核苷酸(诸如接头和多核苷酸片段)而言的术语“连接”是指两个单独的多核苷酸共价连接,以产生具有连续主链的单个更大的多核苷酸。
本文可互换使用的术语“变性”或“解离”是指将核酸双链体分离成两条单链。
如本文所用的“扩增”通常是指产生期望序列的两个或更多个拷贝的过程。扩增反应的组分可以包括但不限于,例如引物、多核苷酸模板、聚合酶、核苷酸、dNTP等。
“聚合酶链反应扩增”或“PCR扩增”是指以几何级数扩增核酸模板的方法,通过两条方向相对且特异结合于核酸模板的寡核苷酸为引物而实现。PCR是本领域技术人员所熟知的;参见,例如美国专利No.4,683,195和4,683,202;和Innis等人1990年编辑的“PCRProtocols:A Guide to Methods”。PCR扩增导致靶核苷酸序列的数量呈指数增加。
“线性扩增”是指以线性关系扩增核酸模板的方法,通过一条特异结合于核酸模板的寡核苷酸为引物实现。因为每个循环都是以原始的核酸为模板,错误合成的碱基不会被传导到后续循环,不同靶标模板的扩增效率差异也不会被指数累计,故而线性扩增的保真度和均一性优于PCR扩增,但得率低于PCR扩增。
“扩增产物”或“扩增子”是指扩增反应产生的寡核苷酸,其为特定靶标核酸模板链和/或其互补序列的一部分的拷贝。扩增产物还可以包含对引物具有特异性的序列,并且该序列侧接靶核酸的序列和/或其互补序列。“反应混合物”是组分(例如一种或多种多肽、核酸和/或引物)的组合,其在合适的条件下反应以进行特定的反应,例如线性扩增反应或PCR扩增反应。
术语“富集”是指相对于在处理之前初始存在于所述样本中的整体核酸序列水平而言,增加样本中特定核酸序列的相对丰度的过程。因此,富集步骤提供了相对百分比或分数增加量,而不是直接增加量,例如所关注核酸序列的绝对拷贝数。如本文所用,术语“文库”是指核酸序列的集合。
术语“确定”、“检测”、“测量”、“评价”、“评估”、“验定”和“分析”在本文中可互换地使用以指代任何形式的测量,并且包括确定某一元素存在与否。这些术语包括定量确定和/或定性确定。
本文可互换使用的“变异”和“基因变异”是指与参考序列相比所关注序列中的任何序列改变。参考序列可以是野生型序列,或人们希望将所关注序列与之进行比较的序列。变异包括但不限于:基因融合、拷贝数目变异(CNV)、插入、缺失、剪接变异和单核苷酸突变。
如本文所用,术语“突变”专指“插入缺失突变”及“单核苷酸突变”。
如本文所用,术语“单核苷酸突变”或“点突变”或简称的“SNV”是指基因组序列中特定位置处的单个核苷酸发生的置换变化。当可供选择的等位基因以可观的频率出现在群体中(例如,在群体中至少1%)时,SNV也被称为“单核苷酸多态性”或“SNP”。
如本文所用,术语“插入缺失突变”或其简称的“Indel”,或“插入突变”、“缺失突变”是指基因组序列中特定位置处的核苷酸发生的插入或缺失变化。
如本文所用,术语“基因融合”或其简称“融合”,以及“染色体易位”、“重排”,是指处在正常基因组不同位置的两个基因或序列发生了重组拼接,形成一段新的序列。同一基因内的序列倒置和/或剪切变异也可视为基因融合。
Ⅱ.方法与操作
引物和接头
在本文所述的方法中使用了寡核苷酸接头和引物,包括通用接头、靶标特异性引物(即第一引物和第二引物)、通用接头引物和适配引物。本文描述的引物和接头可经特别设计和优化以获得高特异性、灵敏度、效率(例如,连接、引物延伸、PCR扩增或NGS测序)和/或对某些类型的序列(诸如具有高GC含量的序列)具有较低偏差。
本文所述的引物被设计成特异性地退火至核酸模板中已知的核苷酸序列。在一些实施方案中,引物包含与核酸模板中的链互补或基本上互补的序列,所述引物其特异性地退火至所述核酸模板。
本文使用的引物通常是单链的,长度不超过约100个核苷酸,但至少约10个核苷酸。
在一些实施方案中,本文公开的引物被设计成使得它们可以在约55-72℃的退火温度下特异性地退火至靶标序列。在一些实施方案中,引物的退火温度Tm可使用如下公式来计算:Tm=AH/(AS+R*ln(C/4))+16.6log([K+]/(l+0.7[K+]))-273.15,其中ΔH是螺旋形成的焓;AS是螺旋形成的熵;R是摩尔气体常数(1.987cal/℃×mol);C是核酸浓度;并且[K+]是盐浓度。参见Frieir等人的PNAS 1986 83:9373-9377。
可以使用以下设计原则中的任何一个或多个来优化引物的设计。例如,对于低覆盖率,难以富集包含高GC含量序列的靶核苷酸序列,可以将引物设计为覆盖相邻的序列。还可以对引物序列进行修饰,以减少引物的二级结构并提高其杂交效率。可以修改引物长度或引物中与其模板特异性地杂交的那部分的长度,以平衡相同类别内不同引物的解链杂交动力学。可以对用于相同靶标区正向链和反向链的不同取向的引物进行修饰,以具有不同的结合效率。
接头和引物在该方法的每个步骤中均以合适的浓度使用。在一些实施方案中,优化了接头、第一引物、第二引物、通用接头引物和适配引物中任两者或更多者的浓度之间的比率。例如,可以对不同外部引物组和内部引物组的相对浓度进行调整,以增加或减少具有某些所关注基因座的靶核苷酸的覆盖范围。
在一些实施方案中,接头和或适配引物包含标签序列。标签序列是一段固定的核苷酸序列,通过测序获得标签序列从而将文库测序结果拆分给对应标记的核酸样本,从而使得多个核酸样本的文库可合并在一起测序。
在一些实施方案中,接头包含随机和/或简并设计的分子条码。分子条码也被称为“单分子索引”或“UMI”。每个接头分子的分子条码可以是不同的,因为其含有随机设计的(即四种核碱基A、C、T、G中的任一者)或简并设计(即一组至少两种类型的核碱基中的一种,例如B=C/G/T、D=A/G/T、H=A/C/T、V=A/C/G、W=A/T、S=C/G、R=A/G、Y=C/T)核苷酸的核苷酸序列。本文使用带分子条码的接头与核酸模板进行连接,再进行随后的线性扩增和PCR扩增及测序,从而可以将带有相同分子条码的多个测序读数归并至单一的核酸模板分子,以校正由扩增及测序引起的错误及效率差异。分子条码还可包含与组合物中的所有通用接头具有相同同一性的核苷酸(即,“恒定”或特异性设计的核苷酸)。可将恒定的核碱基置于随机或简并设计序列的任一侧上,或散布在随机或简并设计的核苷酸中。分子条码中随机和/或简并设计的核碱基的数目取决于核酸样本的复杂性。在一些实施方案中,分子条码包含至少约5个随机和/或简并设计的核碱基。在一些实施方案中,分子条码可以是连续的,也可以是散布的。
核酸样本
本文所述的核酸样本包含基因组DNA或其片段以及信使RNA。在一些实施方案中,核酸样本包含cDNA或其片段。在一些实施方案中,核酸样本包含基因组DNA和cDNA的混合物。
在一些实施方案中,核酸样本来源于细胞或组织样本。在一些实施方案中,核酸样本来源于细胞系样本或来源于培养细胞。在一些实施方案中,核酸样本来源于基因工程细胞系。在一些实施方案中,核酸样本来源于用CRISPR基因编辑技术工程化的细胞。在一些实施方案中,核酸样本来源于免疫细胞,诸如T细胞、B细胞。在一些实施方案中,核酸样本来源于肿瘤细胞。在一些实施方案中,核酸样本来源于来自健康个体的生物样本。
在一些实施方案中,生物样本还包含蛋白质、细胞、流体、生物流体、防腐剂和/或其他物质。作为非限制性示例,样本可以是脸颊拭子、血液、血清、血浆、痰、脑脊液、尿液、泪液、肺泡分离物、胸膜液、心包液、囊肿液、肿瘤组织、组织、活体组织、唾液、抽吸物或它们的组合。在一些实施方案中,生物样本通过切除或活检获得。
在一些实施方案中,核酸样本来源于个体活检样本。在一些实施方案中,核酸样本来源于肿瘤活检,诸如未治疗的活检组织或治疗后的活检组织。在一些实施方案中,核酸样本来源于个体的福尔马林固定和/或石蜡包埋的活检组织。
在一些实施方案中,生物样本或核酸样本中的核酸模板可在用于本文所述的方法中之前被分离、富集或纯化。
在一些实施方案中,包含RNA的核酸样本不被处理以消减核糖体RNA用于cDNA测序。在一些实施方案中,包含RNA的核酸样本在任何步骤中未被机械或酶剪切。
如本文所用,“下一代测序”或“NGS”是指由于并行读出数千至数百万个测序反应而能够以高于常规测序方法(例如,Sanger测序)的可能速度对寡核苷酸进行测序的技术。下一代测序方法的非限制性示例包括MPSS大规模平行测序(Lynx Therapeutics公司)、454焦磷酸测序(454Life Sciences/Roche Diagnostics公司)、固相可逆染料终止子测序(Solexa/Illumina公司)、SOLiD技术(Applied Biosystems公司)、离子半导体测序(IONTORRENT)、DNA纳米球测序(Complete Genomics公司、华大基因),以及可由PacificBiosciences公司、Intelligen Bio-systems公司、Oxford Nanopore Technologies公司和Helicos Biosciences公司提供的技术。
另外的步骤
本文所述的方法可以包括另外的步骤,包括但不限于片段化、酶消化和/或纯化步骤。
适用于本文所述方法的许多测序方法所提供的测序运行具有数十至数百个核苷酸碱基的最佳读段长度。在一些实施方案中,在连接步骤之前将核酸模板片段化可以通过例如剪切或酶促反应来实现。在一些实施方案中,核酸模板未被剪切或酶促消化。在一些实施方案中,可以在进行逆转录之前剪切RNA。
在一些实施方案中,包括一个或多个纯化步骤,从而去除未反应的接头和引物、聚合酶和核苷酸。核酸纯化工序是本领域已知的,用于纯化引物延伸产物和PCR扩增产物的试剂盒可以商购获得,例如,贝克曼库尔特公司(Beckman Coulter)的微珠。
本文所述的方法还可包括一个或多个数据分析步骤。可使用各种方法分析测序读段。在一些实施方案中,使用自动化过程诸如计算机软件分析测序读段,以检测靶标基因处的变异。在一些实施方案中,基于测序读段中分子条码的序列,鉴定来源于相同核酸模板的扩增子的测序读段并将其合并到单个序列中。在一些实施方案中,同时分析来源于基因组DNA模板和信使RNA模板的核苷酸序列。
本文所述的一些实施方案包括将核苷酸样本中的靶核苷酸序列与参考序列进行比较,以及/或者将一个样本的靶核苷酸序列与参考样本的靶核苷酸序列进行比较。可从数据库获得参考序列和参考值。参考样本可来源于来自健康或野生型个体、组织或细胞的样本。例如,在一些实施方案中,分析来自个体的肿瘤细胞的靶核苷酸序列,并将其与来自相同个体的健康细胞的靶核苷酸序列进行比较以提供诊断。
III.应用
可使用本文所述的方法检测多种变异。
在一些实施方案中,本发明的方法可检测多种变异。本文所检测的变异不限于单一类型。在一些实施方案中,所述多种变异选自基因融合、剪接变异、点突变、缺失、插入以及它们的组合。
上述方法可用于多种应用,包括但不限于临床诊断和预后以及用于基因工程的工具。在一些实施方案中,提供了诊断个体的疾病(诸如遗传性疾病或癌症)的方法,包括使用本文所述方法中的任一种检测在来自个体的核酸样本中所关注基因座处的与疾病相关的变异,从而提供对疾病的诊断。
在一些实施方案中,该方法提供与治疗疾病诸如遗传性疾病或癌症有关的信息。在一些实施方案中,该方法用于帮助治疗疾病。在一些实施方案中,检测与疾病相关的多种变异。在一些实施方案中,变异是与遗传性疾病或癌症相关的已知变异。在一些实施方案中,变异与癌基因或肿瘤抑制子相关。在一些实施方案中,变异是融合癌基因。
在一些实施方案中,该方法用于癌症的诊断。在一些实施方案中,癌症是肺癌、乳腺癌或结肠直肠癌。在一些实施方案中,癌症是非小细胞肺癌。在一些实施方案中,该方法检测与癌症相关的SNV、插入缺失、CNV、基因融合和/或异常RNA表达。
本领域技术人员将会理解,可以对所示的本发明进行各种变型、组合和/或修改,而不脱离如广泛描述的本发明的实质。
为更好的说明本发明的目的、技术方案和优点,下面将结合附图和具体实施例对本发明作进一步说明。如无特别说明,本发明中实验方法均为常规方法;如无特别说明,本发明中的系统、试剂或材料均可从市场上或其它公开渠道获得;如无特别说明,本发明中的试剂浓度均为质量浓度。
实施例1根据本发明的方法/原则制造的一个人肿瘤多基因融合及突变联合检测试剂盒的组成及使用方法
本实施例的人肿瘤多基因融合及突变联合检测试剂盒包括寡核苷酸序列:如下表1所示。
表1用于靶标富集的示例性寡核苷酸序列
表1列举了:
·三种类型的第一引物及第二引物各一条,分别为信使RNA模板检测NRG基因第6号外显子为拼接点且融合伙伴位于5’端的融合、基因组DNA模板检测BRAF基因11号外显子的突变、基因组DNA模板检测ALK基因第19号内含子上融合伙伴位于5’端的融合;
·四个文库接头,可供构建四个样本文库混合测序;
·一条通用接头引物;
·四条适配引物。
更多的文库接头及测序适配引物可根据上述同样的方法/原则设计获得,搭配建库操作所需的酶及缓冲液,从而组成一套可同时处理48个肺癌组织样本的多基因变异检测试剂盒,如表2所示。
表2检测试剂盒的组分
根据待检测区域的核酸序列特异性设计出多重引物,混合成第一引物池(GA)及第二引物池(GB),即获得一个肿瘤基因变异高通量测序检测试剂盒。其检测范围如表3所示,使用了82对第一引物及第二引物以信使RNA模板检测16个基因84个外显子为拼接点的融合、82对引物以基因组DNA为模板检测13个基因共41个外显子中的突变(每个外显子设计正反两条链的引物),以及129对引物以基因组DNA模板检测4个基因15个内含子的基因融合。
表3检测范围及变异类型列表
本实施例的检测试剂盒的使用方法:
1.样本处理与准备
使用可提取总核酸的试剂盒对样本核酸进行处理。
使用Qubit评估核酸浓度,推荐使用qPCR(PreQC核酸质控)评估核酸品质。
样本准备:取DNA量为50-300ng,RNA量为100-500ng,且RNA/DNA比值≥0.3,用无核酸酶水补足到10μL。
2.文库构建
2.1核酸处理
2.1.1将0.2mL PCR管置于冰上,按照下表配制混合液1。
组分 | 体积 |
RS缓冲液 | 2.0μL |
待测样本 | 10.0μL |
总体积 | 12.0μL |
使用移液器吹吸混匀反应液,短暂离心收集液体。将PCR管放置于PCR仪中按照以下条件进行孵育,完成后置于冰上。
2.1.2按照下表,在冰上配制混合液2。
组分 | 体积 |
FS缓冲液 | 6.0μL |
FS酶 | 1.0μL |
步骤2.1.1反应产物 | 12.0μL |
总体积 | 19.0μL |
使用移液器吹吸混匀反应液,短暂离心收集液体。将PCR管放置于PCR仪中按照以下条件进行孵育。
2.1.3按照下表,在冰上配制混合液3。
组分 | 体积 |
SS缓冲液 | 8.5μL |
SS酶 | 2.5μL |
步骤2.1.2反应产物 | 19.0μL |
总体积 | 30.0μL |
使用移液器吹吸混匀反应液,短暂离心收集液体。将PCR管放置于PCR仪中按照以下条件进行孵育。
2.1.4磁珠纯化:54μL(1.8×)文库纯化磁珠,2次170μL 80%乙醇洗涤,11μLTEL缓冲液洗脱。
2.2扩增前处理
2.2.1按照以下条件进行设置,并运行。
按照下表,在冰上配制混合液4。
组分 | 体积 |
FB缓冲液 | 2.0μL |
FB酶 | 3.0μL |
FC缓冲液 | 2.5μL |
FC酶 | 0.5μL |
步骤2.1.4纯化产物 | 10.0μL |
总体积 | 18.0μL |
使用移液器吹吸混匀反应液,短暂离心收集液体。确认PCR仪温度维持在4℃,再将PCR管放入,点击SKIP按钮,跳过步骤1,进行后续步骤孵育。
2.2.2按照下表,在冰上配制混合液5。
组分 | 体积 |
步骤2.2.1反应产物 | 18.0μL |
文库接头(ZA###)* | 2.0μL |
FD酶** | 1.0μL |
总体积 | 21.0μL |
注:*文库接头在冰上化冻,严禁用手或室温化冻!**FD酶最后加入!
使用移液器吹吸混匀反应液,短暂离心收集液体。将PCR管放置于PCR仪中按照以下条件进行孵育。
注:8连管正面从左到右对应序号递增(如ZA001,ZA002……ZA008),正确记录样本与文库接头(ZA###)对应关系。
2.2.3按照下表,在冰上配制混合液6。
组分 | 体积 |
FE酶 | 1.0μL |
步骤2.2.2反应产物 | 21.0μL |
总体积 | 22.0μL |
使用移液器吹吸混匀反应液,短暂离心收集液体。将PCR管放置于PCR仪中按照以下条件进行孵育。
2.2.4磁珠纯化:24.4μL(1.1×)文库纯化磁珠,2次170μL 80%乙醇洗涤,13μLTEL缓冲液洗脱。
2.3延伸及扩增处理
2.3.1按照下表,在冰上配制混合液7。
组分 | 体积 |
PCR反应液 | 15.0μL |
GA | 2.0μL |
步骤2.2.4纯化产物 | 13.0μL |
总体积 | 30.0μL |
使用移液器吹吸混匀反应液,短暂离心收集液体。将PCR管放置于PCR仪中按照以下条件进行孵育。
注:不同PCR仪升降温速率有差异,若使用ABI Veriti PCR仪升降温速率调节为4%,此步骤反应时间约8小时。
2.3.2磁珠纯化:42μL(1.4×)文库纯化磁珠,2次170μL 80%乙醇洗涤,11μLTEL缓冲液洗脱。
2.3.3按照下表,在冰上配制混合液8。
组分 | 体积 |
PCR反应液 | 15.0μL |
GB032T | 2.0μL |
文库标签(ZI###)*** | 2.0μL |
步骤2.3.2纯化产物 | 11.0μL |
总体积 | 30.0μL |
***8连管正面从左到右对应序号递增(如ZI001,ZI002……ZI008),使用的ZI必须 与ZA同号并记录。
使用移液器吹吸混匀反应液,短暂离心收集液体。将PCR管放置于PCR仪中按照以下条件进行孵育。
+注:可根据实际需求适当调整循环数。
2.3.4磁珠纯化:24μL(0.8×)文库纯化磁珠,2次170μL 80%乙醇洗涤,30μLTEL缓冲液洗脱。
3.文库质控
3.1文库定量:取1μL文库稀释10000倍,使用PostQC文库定量试剂盒(深圳恒特基因有限公司生产)或KAPA Library Quantification Kit(KAPABiosystems公司生产)进行qPCR定量分析。若文库浓度≥300pM,定量合格。
3.2文库定性:使用qPCR产物进行琼脂糖凝胶电泳(参考条件:浓度1%,电压5-7V/cm,时间30min)。若片段长度分布在200-600bp,符合预期范围。
注:文库如不能立即测序,应保存于-20℃,时间不超过1个月,且保持期间避免反复冻融,冻融不得超过4次。
4测序
4.1文库混合
a)将文库接头不同的待测序文库混合并调整至终浓度为4nM,终体积5μL。
b)若混合文库体积小于终体积,则以洗脱缓冲液补足至终体积。若混合文库体积大于终体积,则进行1.5×磁珠纯化,以终体积洗脱。
4.2上机
a)依据Illumina公司的上机处理方案对混合文库变性处理。
b)装入测序试剂盒用Illumina公司生产的基因测序仪NextSeq 550Dx上机测序。
5生物信息分析
将测序获得的原始数据传输至PANO-Call《人肿瘤个体化二代测序数据分析系统》(深圳恒特基因有限公司开发)进行分析,获得判读结果。
【数据分析和阳性判断值】
本实施例的试剂盒检测结果分析采用《人肿瘤个体化二代测序数据分析系统》(以下简称分析系统)对原始数据进行分析。分析系统实现从NextSeq 550Dx原始数据下机到报告的自动化分析。相关数据分析流程和阳性判断值如下:
5.1.数据预处理:起始分析数据为Illumina默认的过滤后(Q>30)数据,使用Illumina公司的bcl2fastq v2.20软件将NextSeq 550Dx测序生成的bcl文件转化成样本对应的fastq文件。使用分析系统的数据预处理模块(基于bbduk软件v38.06)去除建库过程中引入的接头序列以及低质量碱基片段(碱基平均质量小于20的以及长度小于30bp的片段)。
5.2.数据比对:使用分析系统的序列比对模块(基于BWA MEM v0.7.1)将fastq文件中的碱基序列比对至hg19(GRCh37)人类参考基因组上生成bam文件,并根据基因组坐标对bam文件进行排序。
5.3.数据质控:使用分析系统的数据质控模块计算每个样本的Q30碱基占比、序列比对至参考基因组比例、建库复杂度、目标区域的平均测序深度等参数。
5.4.变异分析:使用分析系统的突变鉴定模块(基于UMI序列群、断点和正负模板的自建BinGo算法)分析样本中的点突变和插入缺失突变,使用分析系统的融合分析模块(基于自建的SplitFusion算法)分析样本中的融合。
5.5.注释:使用分析系统的注释模块对鉴定出的点突变、插入缺失和基因融合进行HGVS格式和COSMIC数据库、Clinvar数据库、dbSNP数据库注释。
检测结果分析判定方法如下:
1.阴性对照品(NC)的检测结果应为阴性,若其中有变异检出,说明环境中可能存在核酸污染源,则此批次检测结果无效。
2.阳性对照品(PC)的检测结果应为EGFR/BRAF/KRAS/ALK/ROS1/MET/RET基因变异对应阳性,如果变异未检出,说明试剂盒性能不理想或操作过程有误,则此批次检测结果无效。
3.样本标记错误及交叉污染评估:检查与第二标签对应的第一标签条数,若低于70%,则为标记错误或交叉污染,则此样本检测结果无效(参见图12)。
实施例2使用实施例1试剂盒和操作方法对数份肿瘤组织样本检测(由分析系统获得变异结果的多个报告表)
表4突变的检出表
表5融合的检出表
表6 3个不同核酸品质的样本的融合检出表
·表4为一个突变检出表,所示结果为BRAF基因的1406碱基G>C突变,该突变导致G469A氨基酸变异,突变丰度为12.94%,公用变异数据库记录号为COSM460。
·表5为一个融合阳性样本的检出表,检出结果为CD74融合伙伴与NRG1癌基因的融合转录本,形成一个同翻译框的嵌合蛋白。
·表6显示3个核酸质量不同的样本从基因组DNA与信使RNA模板检出融合的情况:
οA样本为融合伙伴CCDC6与靶基因RET发生融合,RNA质量良好,从基因组DNA模板及信使RNA模板均检测为融合阳性,其中基因组DNA模板检测结果为拼接点位于两个基因的内含子,而信使RNA模板检测结果为CCDC6外显子1号与RET外显子12号间的嵌合转录本。两者结果互相印证吻合。
οB样本为融合伙伴EML4与靶基因ALK发生融合,因为RNA严重降解,仅能从基因组DNA模板发现融合阳性。
οC样本为融合伙伴TPM3与靶基因ROS1发生融合,RNA质量良好,但仅从信使RNA模板发现融合阳性,信号强烈,为TPM3外显子8号与ROS1外显子35号间的嵌合转录本。未能从基因组DNA模板发现相应融合,推测为基因组DNA模板检出灵敏度不如信使RNA,造成漏检。
实施例3使用实施例1的试剂盒和方法对1095个肺癌组织样本进行融合与突变联检
本实施例为与医疗机构共同开展的对中国的肺癌患者组织切片的热点突变与融合联合检测回顾性研究结果。实录患者样本1095例,共发现热点突变449例,融合78例。表7展示了本实施例所有样本的变异统计情况。
表7肺癌临床样本检测突变及融合统计表
使用实施例1的试剂盒以一个管家基因的信使RNA与基因组DNA测序条数比例为内参,对核酸总体质量进行了评估。管家基因是生物学术语,指在组织中表达水平稳定,不易受调控影响的基因,故经常被用于衡量总体表达水平。本实施例中评估核酸质量可靠的样本为678份(见图5及表7),其中为突变或融合阳性的例数为382份。
本实施例在一次检测中,除了覆盖肺癌常见的基因突变(如EGFR的L858R与19外显子缺失占总样本数31%)(见图6、图7)及ALK等基因融合外(见图8),还发现了众多罕见的融合病例。举例如下:
·NTRK1融合3例,占比0.3%,符合预期。NTRK1在肺癌占比约0.1-0.3%,故经常被忽略,但却是近来的靶向药研究重点。其中一例NTRK1融合见图9。
·NTRK2融合6例,占比0.5%。NTRK2在肺癌中极少报道,一般认为远低于NTRK1。本实施例发现NTRK2比例高于NTRK1,且集中发生于约170例肺鳞癌中,而在800余例肺腺癌则没有发现,为具有临床意义的重要发现。NTRK的病例见表8。
表8肺癌队列中的NTRK阳性病例
·MET与其它基因间的融合1例(参见图10)。肺癌的MET的第14外显子跳切(视为基因内融合)报道较多(1-3%),本队列也发现6例(参见图11)。但MET与其它基因间融合却罕有报道,目前仅在高加索人群发现一例HLA-DRB1与MET发生融合(Davies KD等,Dramaticresponse to crizotinib in a patient with lung cancer positive for an HLA-DRB1-MET gene fusion.JCO Precision Oncology 2017;1:1-6)。本实施例发现的MET融合为第二例,也是中国人群中的首例,融合伙伴同样为HLA-DRB1,并揭示MET基因融合的致癌机制与第14外显子跳切相同,对靶向药物开发具有指导作用。
综上所述,采用本发明的检测方法和试剂盒可提高临床易用性,能更方便地检测出融合及突变,因此,除了常见的变异能被有效检出外,也增加了发现罕见变异的机会,对肿瘤靶向治疗的科学研究及临床应用具有重要意义。
本文提及的所有出版物,专利,专利申请和公开的专利申请的公开内容在此通过引用整体并入本文。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。
Claims (10)
1.一种同步使用信使RNA与基因组DNA模板进行高通量测序检测基因变异的方法,包括如下步骤:
1)提供含有基因组DNA和信使RNA的核酸样本,通过反转录使得核酸样本中的信使RNA转化为双链的cDNA,得到含有双链cDNA及基因组DNA的核酸样本;
2)将步骤1)所得含有双链cDNA及基因组DNA的核酸样本打断,得到随机分布的核酸片段;
3)连接文库接头至步骤2)所得核酸片段,得到连接产物;
4)将步骤3)所得连接产物与第一引物池和DNA聚合酶混合,连接产物经高温解聚成两条单链核酸,其中一条含有靶标序列的单链与第一引物经退火结合,并延伸反应至文库接头的单链末端,得到一条以含有文库接头和靶标序列的核酸为模板的单链复制产物;
5)重复至少一次与步骤4)相同的变温循环,得到多条所述单链复制产物;
6)将步骤5)所得单链复制产物与通用接头引物、适配引物和第二引物池混合,进行PCR扩增获得测序用文库,文库中序列结构依次为测序芯片的第一结合序列—文库接头—靶标序列—第二引物共同序列—测序芯片的第二结合序列,其中,所述通用接头引物的5’端包含一段对应于测序芯片的第一结合序列,3’端包含一段与文库接头单链结构末端相同的序列,所述适配引物5’端包含一段对应于测序芯片的第二结合序列,3’端包含一段与第二引物共同序列相同的序列;
7)将步骤6)所得文库进行高通量测序,分析所述靶标序列是否发生了融合或/和突变。
2.权利要求1的方法,其中,所述第一引物根据核酸模板设计,包括以下几种类型:
a、一条结合于靶标基因的外显子并指向潜在的融合拼接点的引物,用于从信使RNA模板检测该方向发生的融合;
b、一条结合于靶标基因的内含子且延伸方向指向临近外显子的引物,用于从基因组DNA模板检测所述外显子的突变;
c、一组结合于靶标基因的内含子并指向潜在的融合拼接点的引物,该组引物堆叠设置从而覆盖整个内含子,用于从基因组DNA模板检测该方向发生的融合。
3.权利要求1或2的方法,其中:
(1)各类型的所述第一引物为多重引物,针对不同的靶标序列;
(2)所述第一引物的5’端包括一段第一引物共同序列,第一引物共同序列长度为至少13个碱基且不与靶标基因结合;
(3)所述第一引物池含有a类型第一引物,以及b类型和/或c类型第一引物;
(4)所述第二引物池含有与第一引物池中类型相同的第二引物,可选地,所述第二引物相对于第一引物是嵌套的,更优选地,所述第二引物的方向与第一引物相同,所述第二引物3’端位置位于第一引物3’端的下游,且第二引物3’端距离第一引物3’端至少3个碱基,第二引物的5’端位置与第一引物5’端位置相同或位于第一引物下游;
(5)所述第二引物5’端包括一段第二引物共同序列,所述第二引物共同序列长度为至少13个碱基且不与靶标基因结合。
4.权利要求1的方法,其中,所述步骤3)中文库接头由两条部分序列互补的单链寡核苷酸组成,两条单链的互补部分构成一个双链结构,非互补部分构成单链结构,
可选地,所述双链结构的末端为双链平齐的平整末端或一链突出的粘性末端;可选地,所述文库接头含有一段第一标签序列。
5.权利要求4的方法,其中,所述适配引物包含一段第二标签序列,优选地,使用所述第一标签序列和/或第二标签序列区分核酸样本。
6.权利要求1的方法,其中:
(1)所述步骤1)还包括一次纯化,以除去未反应的反转录试剂;
(2)所述步骤3)还包括一次纯化,以除去未参与连接反应的文库接头;
(3)所述步骤5)还包括一次纯化,以除去未反应的第一引物池;
(4)所述步骤6)还包括一次纯化,以除去未反应的通用接头引物、适配引物和第二引物池。
7.用于同步检测含有基因组DNA和信使RNA的核酸样本中基因变异的试剂盒,包括第一引物池和第二引物池,其中,第一引物根据核酸模板设计,包括以下几种类型:
a、一条结合于靶标基因的外显子并指向潜在的融合拼接点的引物,用于从信使RNA模板检测该方向发生的融合;
b、一条结合于靶标基因的内含子且延伸方向指向临近外显子的引物,用于从基因组DNA模板检测所述外显子的突变;
c、一组结合于靶标基因的内含子并指向潜在的融合拼接点的引物,该组引物堆叠设置从而覆盖整个内含子,用于从基因组DNA模板检测该方向发生的融合;第一引物池含有a类型第一引物,以及b类型和/或c类型第一引物;
所述第二引物相对第一引物是嵌套的,且第二引物类型与第一引物相同。
8.权利要求7的试剂盒,其中:
(1)所述第二引物的方向与第一引物相同,所述第二引物3’端位置位于第一引物3’端的下游,且第二引物3’端距离第一引物3’端至少3个碱基,第二引物的5’端位置与第一引物5’端位置相同或位于第一引物下游;
(2)所述第一引物的5’端包括一段第一引物共同序列,所述第二引物5’端包括一段第二引物共同序列,优选地,第二引物共同序列不与第一引物共同序列或其互补序列结合。
9.权利要求7的试剂盒,其中还包括:
(a)文库接头,所述文库接头由两条部分序列互补的单链寡核苷酸组成,两条单链的互补部分构成一个双链结构,非互补部分构成单链结构,优选地,所述双链结构的末端为双链平齐的平整末端或一链突出的粘性末端,以适合连接反应,更优选地,所述文库接头含有一段第一标签序列;
(b)通用接头引物,所述通用接头引物的5’端包含一段对应于测序芯片的第一结合序列,3’端包含一段与文库接头单链结构末端相同的序列;以及
(c)适配引物,所述适配引物5’端包含一段对应于测序芯片的第二结合序列,3’端包含一段与第二引物共同序列相同的序列,优选地,在适配引物5’端序列和3’端序列之间包含一段第二标签序列,更优选地,使用第一标签序列和/或第二标签序列区分核酸样本。
10.一种诊断个体的疾病的方法,包括使用根据权利要求1~6任一项所述的方法或/和权利要求7~9任一项所述的试剂盒检测来自所述个体的核酸样本中所关注基因的与所述疾病相关的基因变异,从而提供对所述疾病的诊断。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910947353.5A CN110628880B (zh) | 2019-09-30 | 2019-09-30 | 一种同步使用信使rna与基因组dna模板检测基因变异的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910947353.5A CN110628880B (zh) | 2019-09-30 | 2019-09-30 | 一种同步使用信使rna与基因组dna模板检测基因变异的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110628880A true CN110628880A (zh) | 2019-12-31 |
CN110628880B CN110628880B (zh) | 2021-03-16 |
Family
ID=68975651
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910947353.5A Active CN110628880B (zh) | 2019-09-30 | 2019-09-30 | 一种同步使用信使rna与基因组dna模板检测基因变异的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110628880B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110352251A (zh) * | 2017-03-08 | 2019-10-18 | 豪夫迈·罗氏有限公司 | 引物延伸靶标富集及对其的包括同时富集dna和rna的改进 |
CN112063689A (zh) * | 2020-08-21 | 2020-12-11 | 上海思路迪生物医学科技有限公司 | 一种高效rna反转录方法及rna和dna同步建库方法 |
CN112094915A (zh) * | 2020-11-17 | 2020-12-18 | 苏州科贝生物技术有限公司 | 一种肉瘤融合基因和/或突变联合检测引物组及试剂盒 |
CN112251501A (zh) * | 2020-10-28 | 2021-01-22 | 深圳人体密码基因科技有限公司 | 一种内参基因集合及其筛选方法、通用引物组、试剂盒、反应体系及应用 |
CN112280864A (zh) * | 2020-11-13 | 2021-01-29 | 苏州科贝生物技术有限公司 | 一种甲状腺多基因联合检测试剂盒 |
CN112301115A (zh) * | 2020-09-22 | 2021-02-02 | 厦门艾德生物医药科技股份有限公司 | 一种基于高通量测序的FGFRs基因突变的检测方法及探针序列 |
WO2021027706A1 (zh) * | 2019-08-09 | 2021-02-18 | 深圳市真迈生物科技有限公司 | 捕获核酸分子的方法、核酸文库的制备方法及测序方法 |
WO2022089033A1 (zh) * | 2020-10-29 | 2022-05-05 | 无锡臻和生物科技有限公司 | 检测基因突变及表达量的方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014116881A1 (en) * | 2013-01-23 | 2014-07-31 | Reproductive Genetics And Technology Solutions, Llc | Compositions and methods for genetic analysis of embryos |
CN108220392A (zh) * | 2017-08-01 | 2018-06-29 | 深圳恒特基因有限公司 | 富集和确定靶核苷酸序列的方法 |
-
2019
- 2019-09-30 CN CN201910947353.5A patent/CN110628880B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014116881A1 (en) * | 2013-01-23 | 2014-07-31 | Reproductive Genetics And Technology Solutions, Llc | Compositions and methods for genetic analysis of embryos |
CN108220392A (zh) * | 2017-08-01 | 2018-06-29 | 深圳恒特基因有限公司 | 富集和确定靶核苷酸序列的方法 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110352251A (zh) * | 2017-03-08 | 2019-10-18 | 豪夫迈·罗氏有限公司 | 引物延伸靶标富集及对其的包括同时富集dna和rna的改进 |
WO2021027706A1 (zh) * | 2019-08-09 | 2021-02-18 | 深圳市真迈生物科技有限公司 | 捕获核酸分子的方法、核酸文库的制备方法及测序方法 |
CN112063689A (zh) * | 2020-08-21 | 2020-12-11 | 上海思路迪生物医学科技有限公司 | 一种高效rna反转录方法及rna和dna同步建库方法 |
CN112301115A (zh) * | 2020-09-22 | 2021-02-02 | 厦门艾德生物医药科技股份有限公司 | 一种基于高通量测序的FGFRs基因突变的检测方法及探针序列 |
CN112301115B (zh) * | 2020-09-22 | 2022-12-09 | 厦门艾德生物医药科技股份有限公司 | 一种基于高通量测序的FGFRs基因突变的检测方法及探针序列 |
CN112251501A (zh) * | 2020-10-28 | 2021-01-22 | 深圳人体密码基因科技有限公司 | 一种内参基因集合及其筛选方法、通用引物组、试剂盒、反应体系及应用 |
WO2022089033A1 (zh) * | 2020-10-29 | 2022-05-05 | 无锡臻和生物科技有限公司 | 检测基因突变及表达量的方法及装置 |
CN112280864A (zh) * | 2020-11-13 | 2021-01-29 | 苏州科贝生物技术有限公司 | 一种甲状腺多基因联合检测试剂盒 |
CN112280864B (zh) * | 2020-11-13 | 2021-06-15 | 苏州科贝生物技术有限公司 | 一种甲状腺多基因联合检测试剂盒 |
CN112094915A (zh) * | 2020-11-17 | 2020-12-18 | 苏州科贝生物技术有限公司 | 一种肉瘤融合基因和/或突变联合检测引物组及试剂盒 |
Also Published As
Publication number | Publication date |
---|---|
CN110628880B (zh) | 2021-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110628880B (zh) | 一种同步使用信使rna与基因组dna模板检测基因变异的方法 | |
US20230348992A1 (en) | Methylation markers for diagnosing hepatocellular carcinoma and lung cancer | |
US20210095341A1 (en) | Multiplex 5mc marker barcode counting for methylation detection in cell free dna | |
US20210324468A1 (en) | Compositions and methods for screening mutations in thyroid cancer | |
RU2752700C2 (ru) | Способы и композиции для днк-профилирования | |
US10544467B2 (en) | Solid tumor methylation markers and uses thereof | |
US11396678B2 (en) | Breast and ovarian cancer methylation markers and uses thereof | |
CN111742062A (zh) | 用于诊断癌症的甲基化标志物 | |
WO2017087560A1 (en) | Nucleic acids and methods for detecting methylation status | |
US20190300964A1 (en) | Colon cancer methylation markers and uses thereof | |
US20190300965A1 (en) | Liver cancer methylation markers and uses thereof | |
EP3481952A1 (en) | Leukemia methylation markers and uses thereof | |
US11608518B2 (en) | Methods for analyzing nucleic acids | |
EP2699695A2 (en) | Prostate cancer markers | |
WO2017193044A1 (en) | Noninvasive prenatal diagnostic | |
KR20170133270A (ko) | 분자 바코딩을 이용한 초병렬 시퀀싱을 위한 라이브러리 제조방법 및 그의 용도 | |
EP4219763A2 (en) | Method for quantifying gene fusion dna | |
CN116219016A (zh) | 一种甲状腺结节良恶性检测方法、试剂盒和应用 | |
CN114277114A (zh) | 一种扩增子测序添加唯一性标识符的方法及应用 | |
CN118600567A (zh) | 一种dna文库及其构建方法及其应用 | |
Awasthi et al. | Module 2: evaluation of next generation sequencing as an alternative to pyrosequencing | |
CN114703267A (zh) | 一种基于加尾引物设计的Sanger测序方法 | |
CN118581217A (zh) | 一种用于mlh1基因启动子区域的甲基化核酸序列及试剂盒 | |
CN114634982A (zh) | 一种检测多核苷酸变异的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |