基于单分子靶向测序技术检测EGFR/KRAS/BRAF基因突变位点的探针、方法、试剂及其应用
技术领域
本发明属于分子生物学领域,特别是涉及一种基于单分子靶向测序技术检测EGFR/KRAS/BRAF基因突变位点的探针、方法、试剂及其应用,以及一种无创检测基因突变位点的方法。
背景技术
表皮生长因子受体(epidermalgrowthfactorreceptor,EGFR)是位于7号染色体短臂上的原癌基因C-erbB-1(HER-1)的表达产物,是表皮生长因子受体家族(HER)中的4个成员之一,HER家族在细胞生理过程中发挥重要的调节作用。EGFR酪氨酸激酶区域的突变主要发生在18~21号外显子,其中19和21号外显子突变占总突变的90%。EGFR信号传导的异常是导致多种肿瘤发生的原因。研究表明,EGFR在多种肿瘤中都有表达,如结直肠癌、乳腺癌、胰腺癌、前列腺癌和非小细胞肺癌等。
K-ras基因是一种原癌基因,长约35kb,位于12号染色体短臂上,是ras基因家族成员之一,编码KRAS蛋白。K-ras基因常见的突变位点位于2号外显子的12号密码子和13号密码子上、3号外显子的6l号密码子,其中有7个突变热点:G12C、G12R、G12S、G12V、G12D、G12A、G13V/D,占K-ras基因总突变的98%以上。研究表明体细胞K-ras基因突变与多种人类恶性肿瘤,如肺癌、白血病、黏蛋白腺癌、胰腺癌、结直肠癌有关,而生殖细胞K-ras基因突变与努南综合征和心脏-面部-皮肤(cardio-facio-cutaneous,CFC)综合征相关。
BRAF基因是一种原癌基因,定位于7号染色体上,编码丝/苏氨酸特异性激酶。约90%的BRAF基因突变发生在外显子15的1799位核苷酸上,T突变为A,导致缬氨酸被谷氨酸取代(V600E)。BRAF基因突变在黑色素瘤、结直肠癌、神经胶质瘤、肉瘤、卵巢癌、乳腺癌以及肺癌等肿瘤细胞系中的发生率依次为59%、18%、11%、9%、14%、2%、3%;此外,BRAFV600E在甲状腺乳头状癌中的发生率高达35.8%。BRAF基因突变是晚期及复发性结直肠癌最重要的预后指标之一,与患者较差的总体生存期密切相关。
目前常见的检测这三个基因突变的方法有Sanger测序法和荧光定量PCR法。Sanger测序法中,单对引物可检测多个突变,但对多个基因、或同一基因的不同外显子上的突变位点就需分别进行扩增测序,操作繁琐,并且灵敏度较低约20%,假阴性率较高。荧光定量PCR法虽然灵敏度高,但每对引物只能检测一种突变,且每种突变需单独建立一个PCR反应体系,同时检测多个样本多个突变位点操作繁琐。这两种方法对样本的需要量都较大,不适合同时检测多个基因突变位点。
高通量测序法(NGS)虽然灵敏度高,同时可检测多个突变位点,但其建库流程复杂,操作繁琐,时间长,成本高。
发明内容
鉴于此,本发明提供了一种基于单分子靶向测序技术检测EGFR/KRAS/BRAF基因突变位点的探针、方法和应用。本发明还提供了一种用于单分子靶向测序的样品的制备方法。
第一方面,本发明提供了一种基于单分子靶向测序技术检测EGFR/KRAS/BRAF基因突变位点的探针,包括检测EGFR、KRAS和BRAF基因中一个或多个基因的突变位点的一条或多条探针,所述探针的核苷酸序列为SEQIDNO:1~SEQIDNO:16所示序列中的一条或多条。
具体地,如SEQIDNO:1~SEQIDNO:16所示探针如下表1所示。
表1.SEQIDNO:1~SEQIDNO:16所示探针
具体地,具有SEQIDNO:1、SEQIDNO:2所示序列的探针用于检测EGFR基因的外显子18区域的突变位点;具体地,具有SEQIDNO:3、SEQIDNO:4所示序列的探针用于检测EGFR基因的外显子19区域的突变位点;具体地,具有SEQIDNO:5~SEQIDNO:8所示序列的探针用于检测EGFR基因的外显子20区域的突变位点;具体地,具有SEQIDNO:9、SEQIDNO:10所示序列的探针用于检测EGFR基因的外显子21区域的突变位点;具体地,具有SEQIDNO:11、SEQIDNO:12所示序列的探针用于检测KRAS基因的外显子2区域的突变位点;具体地,具有SEQIDNO:13、SEQIDNO:14所示序列的探针用于检测KRAS基因的外显子3区域的突变位点;具体地,具有SEQIDNO:15、SEQIDNO:16所示序列的探针用于检测BRAF基因的外显子15区域的突变位点。
在本发明一实施例中,所述SEQIDNO:1~SEQIDNO:16任一所示序列的5’端连接有-(CH2)n-poly(T)m-、-poly(T)m-或-(CH2)n-,其中,n、m为自然数。
优选地,n为6-10的自然数。
优选地,m为10-30的自然数。
优选地,n、m均为10。
在本发明一实施例中,所述的多条探针检测EGFR、KRAS和BRAF基因中任意两个或三个基因的突变位点;其中,所述EGFR基因的突变位点位于:EGFR基因的外显子18~外显子21区域中的至少一个;所述KRAS基因的突变位点位于:KRAS基因的外显子2~外显子3区域中的至少一个;所述BRAF基因的突变位点位于:BRAF基因的外显子15区域。
优选地,所述多条探针为SEQIDNO:1~SEQIDNO:16所示的核苷酸序列组成的探针组。
本领域技术人员可以理解的,若摸索的检测探针(比如,SEQIDNO:1~SEQIDNO:16所示的核苷酸序列组成的探针组)获得了较佳的杂交效果,一般情况下,设计探针的时候,适当的将探针组中任一一条探针序列的长度延长或截短0~3个碱基,也可以获得不错的检测效果,也应纳入本发明保护范围。
第二方面,本发明提供了一种用于单分子靶向测序的样品的制备方法,包括:通过封阻反应在待测DNA片段的3’端修饰双脱氧核糖核酸,获得3’端修饰有双脱氧核糖核酸的待测DNA片段;其中,封阻反应中,脱氧核糖核酸与待修饰的DNA片段的摩尔比为1:25~1:200。
在本发明一实施例中,所述的在待测DNA片段选自PCR产物、片段化的基因组DNA或经纯化的血液中的游离DNA。
在本发明一实施例中,所述的PCR产物为采用多重PCR引物扩增待测样品所得的多重PCR产物,其中,所述的多重PCR引物为引物组,所述引物组中各引物的核苷酸序列为SEQIDNO:17~SEQIDNO:30所示。
在本发明一实施例中,所述的双脱氧核糖核酸修饰有光学检测标记。
可以理解的是,本领域技术人员可以采用任一常规的方法在待测DNA片段的上修饰双脱氧核糖核酸;比如,可参照二代高通量测序文库构建方法中加A的方法进行DNA片段的封阻;相比之下,本发明后续实施例中采用的封阻方法更佳,因为即便是对于对片段化的基因组进行封阻,本发明后续实施例中采用的封阻方法也不需要进行末端补平即可直接进行封阻反应,操作非常简便。更优选地,可采用TerminalTransferaseKit(NEB,M0315L)或等同的试剂体系进行封阻反应。更进一步地,本申请人对该商用试剂盒的封阻反应条件进行多次优化,摸索出较佳的对DNA片段的3’端修饰双脱氧核糖核酸的封阻反应条件,当脱氧核糖核酸与待修饰的DNA片段的摩尔比为1:100时,封阻效率可达到98%以上;而即使在该摩尔比为1:25~1:200时,封阻效率仍然可达到70%~9%以上。
相比现有二代测序文库的制备,本发明第二方面提供了的用于单分子靶向测序的样品的制备方法所获得的3’端修饰有双脱氧核糖核酸的待测DNA片段,可直接用于单分子靶向测序,与5’端连接到基底表面的靶向引物进行杂交,进行测序反应;而不需要进行添加测序接头(adaptor)等步骤,极大简化了测序样品文库的制备步骤。
第三方面,本发明提供了一种基于单分子靶向测序技术检测EGFR/KRAS/BRAF基因突变位点的方法,包括如下步骤:
(i)将靶向引物的5’端连接到基底表面;其中,所述的靶向引物为本发明第一方面所述的探针;
(ii)提供或制备待测模板核酸,其中,所述的待测模板核酸的3’端修饰有带光学检测标记的双脱氧核糖核酸;将所述待测模板核酸与所述步骤(i)中连接到基底表面上的靶向引物进行杂交,形成杂交的靶向引物/模板核酸复合物;
(iii)对所述靶向引物/模板核酸复合物进行成像;
(iv)将所述靶向引物/模板核酸复合物、聚合酶以及一种或多种带光学检测标记的核苷酸混合,通过聚合酶反应将一种或多种带光学检测标记的核苷酸添加至靶向引物链的3’端;获得延伸产物;其中,所述带光学检测标记的核苷酸还具有可断裂的基团;
(v)对延伸后的靶向引物/模板核酸复合物进行成像,并结合步骤(iii)中靶向引物/模板核酸复合物的定位结果,进行图像比对和纠偏,以鉴定模板核酸上的待测核苷酸序列;
(vi)除去延伸产物上带光学检测标记的核苷酸的可断裂的基团:
(vii)重复步骤(iii)至(vi)一次或多次以鉴定所述模板核酸中的1个或多个核苷酸。
本发明通过延伸反应、成像检测和切除光学检测标记分子的反复循环,实现单分子靶向测序技术(SMTS)实时测序。
如本发明所述的,所述的“待测DNA片段”与“待测模板核酸”可以互换。
可以理解的是,可采用本领域常规的探针固定方法将本发明第一方面的探针序列(即所述步骤(i)中的靶向引物)的5’端连接到基底表面。但申请人在研究过程中发现,不同的固定方法(比如靶向引物的序列、杂交温度、杂交时间等因素)会影响后续靶向引物与模板核酸的杂交效果。
在本发明一实施例中,当本发明第一方面的探针为5’端连接有-(CH2)n-poly(T)m-、-poly(T)m-或-(CH2)n-的SEQIDNO:1~SEQIDNO:16所示序列中的一条或多条时,所述步骤(i)中,靶向引物的5’端连接到基底表面的方式具体为:先对本发明第一方面的探针上连接的-(CH2)n-poly(T)m-、-poly(T)或-(CH2)n-5’端的甲基上修饰氨基,再通过氨基将与基底表面的环氧基连接,从而将靶向引物的5’端连接到基底表面。
较佳地,所述通过5’端修饰的氨基将靶向引物连接到表面修饰有环氧基的基底(包括但不限于玻璃基底、石英基底等)的步骤包括:
a)将环氧基修饰的玻璃基底或石英基底浸泡在含0.4-3.2nM靶向引物的固定液中(优选45min-120min);清洗基底;
b)将基底浸入磷酸盐钝化液中,摇晃(优选10-15小时);清洗基底,获得所述表面固定有靶向引物的基底。
在该实施方式中,进一步优选地,步骤a中,所述固定液为0.02-0.3M的K2HPO4溶液。
在该实施方式中,进一步优选地,步骤a中,所述固定液中靶向引物的浓度优选为0.8-3.2nM,进一步优选为0.8-1.6nM。
在该实施方式中,进一步优选地,步骤a中,采用3xSSC+0.1%Triton,3xSSC,150mMK2HPO4pH=8.5清洗基底。
在该实施方式中,进一步优选地,步骤b中,摇晃的条件为置于摇床上摇晃(优选为40-80转/分钟)。
在该实施方式中,进一步优选地,步骤b中,磷酸盐钝化液为pH=9.0,0.2-1M(优选0.2-0.8M)K2HPO4溶液。
在本发明一实施例中,所述步骤(ii)中,所述末端带光学检测标记的双脱氧核糖核酸为末端修饰有光学检测标记的ddATP、ddGTP、ddCTP、ddTTP中的一种或多种。
在本发明一实施例中,所述步骤(ii)中,所述的获得末端修饰有光学检测标记的模板核酸为采用本发明第二方面所述的方法制备获得。
在本发明一实施例中,步骤(iv)中,所述核苷酸的可断裂的基团为光可裂解的终止基团、化学断裂的终止基团或酶催化断裂的终止基团。
在本发明一实施例中,步骤(ii)所述末端带光学检测标记的模板核酸,以及步骤(iv)所采用的带光学检测标记的核苷酸中,所述的“光学检测标记”为荧光标记;进一步优选地,所述荧光标记物选自荧光素,罗丹明,花青,Cy5,Cy3中的一种或多种。
优选地,步骤(iv)所采用的带光学检测标记的核苷酸中,所述带有荧光标记的核苷酸为单色可逆末端终止子或多色可逆末端终止子。如本发明所述的,单色可逆末端终止子为A、T、C、G中的任一种均带有相同的荧光标记;每次循环只添加一种核苷酸;多色可逆末端终止子为A、T、C、G各自带有互不相同的荧光标记,每次循环可同时添加多种核苷酸,并通过对不同的荧光标记分别读取各核苷酸的荧光信息。
在本发明一实施例中,所述步骤(iii)中,对所述靶向引物/模板核酸复合物进行成像的步骤包括:
在每个延伸循环反应中,对同一位点的靶向引物/模板核酸复合物中的模板核酸在延伸反应前进行成像。
在本发明一优选实施例中,在步骤(iv)的延伸反应之前的步骤(iii)中,通过全内反射显微镜(TIRF)采集光学图像来对所述靶向引物/模板核酸复合物进行成像,以精确定位靶向引物/模板核酸复合物中的模板核酸所处的位置。
在本发明一实施例中,步骤(iv)中所述的聚合酶选自逆转录酶或DNA聚合酶。
在本发明一实施例中,步骤(iv)还包括对获得的延伸产物进行清洗。
在本发明一实施例中,所述步骤(v)中,所述的对延伸后的靶向引物/模板核酸复合物进行成像的步骤包括:
在延伸反应后的同一时间点,对靶向引物/模板核酸复合物中的模板核酸、以及在该延伸反应中结合到靶向引物链3’端的带光学检测标记的核苷酸进行成像。
在本发明一优选实施例中,所述(v)的步骤包括:通过全内反射显微镜(TIRF)采集光学图像来对延伸后的靶向引物/模板核酸复合物进行成像,以鉴定步骤(iv)引入的核苷酸种类。
本发明提供的单分子靶向测序方法中的图像采集步骤优选采用全内反射显微系统(TIRF),提升信噪比。本发明提供的方法在每次步骤(iv)的延伸反应之后分别对靶向引物上延伸的带荧光标记的核苷酸和带荧光标记的模板核酸拍照,并结合延伸反应之前的步骤(iii)对带荧光标记的模板核酸的成像;通过对同一个坐标视野的前后两次成像,纠正进行拍照时,由于载物台的轻微移动或样品漂移产生的些许偏差。
在本发明一实施例中,所述步骤(v)中,所述的进行图像比对和纠偏的步骤包括:
1)对同一位点的靶向引物/模板核酸复合物(基于模板核酸上光学检测标记的定位)在延伸反应前后不同时间点的成像进行图像比对和纠偏;以及
2)对该位点的靶向引物/模板核酸复合物(基于模板核酸上光学检测标记的定位)在该延伸反应后的成像与该延伸反应中结合到该位点的带光学检测标记核苷酸的成像进行图像比对和纠偏。
较佳地,在该实施例中,所述1)和2)两种对图像进行比对和纠偏的步骤具体可采用如下对不同时间点对同一位置拍摄的多个单分子图像的比对和纠偏的方法实现,具体包括:
1、首先读取第一时间点的单分子成像图片,然后再读取第二时间点的单分子成像图片,均在matlab里面保存为uint16格式的矩阵;
2、对第一时间点的单分子成像图片矩阵进行二维傅里叶变换,保存变换后的矩阵fft_ref;
3、对第二时间点的单分子成像图片矩阵进行二维傅里叶变换,保存变换后的矩阵fft_frame;
4、取两个时间点图片傅里叶变换后的矩阵的卷积prod=fft_ref.*conj(fft_frame);
5、对prod矩阵进行二维傅里叶反变换得到矩阵cc=ifft2(prod);
6、对cc这个矩阵进行fftshift变换,找到变换后矩阵最大值的坐标,再减去原始图片大小的一半,得到的不同时间点图片的偏移量;
7、最后再根据偏移量对第二时间点的图片用circshift函数来矫正偏移量。
可以理解的是,进行图像比对和纠偏时,所述的“第一时间点”和“第二时间点”表示不同的时间点,并不代表时间先后顺序。比如,在1)中对图像进行比对和纠偏的步骤中,第一时间点的图像可以为:步骤(iii)中对靶向引物/模板核酸复合物中的模板核酸在延伸反应前进行成像所得图像;则第二时间点的图像为:步骤(v)中延伸反应后,对同一位点的靶向引物/模板核酸复合物中的模板核酸进行成像所得图像。再比如,在2)中图像进行比对和纠偏的步骤中,第一时间点的图像可以为:步骤(v)中延伸反应后,对靶向引物/模板核酸复合物中的模板核酸进行成像所得图像;则第二时间点的图像为:步骤(v)中延伸反应后,对在该延伸反应中结合到同一位点的靶向引物链3’端的带光学检测标记的核苷酸进行成像所得图像。
在本发明一实施例中,所述单分子靶向测序方法还包括对测序结果进行生物信息学分析。
在本发明一实施例中,步骤(vi)还包括对除去光学检测标记处理后的延伸产物进行清洗。
在本发明一实施例中,还包括同步地对多个模板核酸测序。
第四方面,本发明提供了一种检测EGFR/KRAS/BRAF基因突变位点的试剂盒,包括如第一方面所述的基于单分子靶向测序技术检测EGFR/KRAS/BRAF基因突变位点的探针。
第五方面,本发明提供了一种检测EGFR/KRAS/BRAF基因突变位点的测序芯片,所述测序芯片上固定有第一方面所述的基于单分子靶向测序技术检测EGFR/KRAS/BRAF基因突变位点的探针。
第六方面,本发明提供了一种如第一方面所述的基于单分子靶向测序技术检测EGFR/KRAS/BRAF基因突变位点的探针、第二方面所述的用于单分子靶向测序的样品的制备方法、第三方面所述的基于单分子靶向测序技术检测EGFR/KRAS/BRAF基因突变位点的方法、第四方面所述的检测EGFR/KRAS/BRAF基因突变位点的试剂盒或第五方面所述的检测EGFR/KRAS/BRAF基因突变位点的测序芯片在检测EGFR/KRAS/BRAF基因突变位点中的应用。
如本发明所述的,所述“EGFR/KRAS/BRAF基因突变位点”表示EGFR、KRAS、BRAF三个基因中的一个或多个。
本发明提供的基于单分子靶向测序技术检测EGFR/KRAS/BRAF基因突变位点的探针、方法、及应用的有益效果为:本发明提供了检测EGFR、KRAS和BRAF基因突变位点的探针,包含了这三个基因的一个或多个外显子区域突变位点的检测探针,优选覆盖了EGFR18~21号外显子、KRAS2号、3号外显子和BRAF15号外显子,包括了EGFR、KRAS和BRAF基因的主要突变位点。
本发明提供的基于单分子靶向测序技术检测EGFR/KRAS/BRAF基因突变位点的方法中,测序芯片表面的探针最多可同时覆盖29种EGFR突变位点、17种KRAS突变位点、7种BRAF突变位点,且采用了优化后的样品制备步骤,极大简化了测序前样本的制备流程,降低了测序成本,缩短了测序时间。
附图说明
图1为本发明实施例提供的单分子测序原理示意图;
图2为本发明实施例对靶向引物进行固定的原理图。
具体实施方式
本发明采用单分子靶向测序装置或系统进行单分子靶向测序。可以理解的是,本发明采用的单分子靶向测序装置或系统可用于对平面基底进行成像,其中基底结合有靶向引物。在用于测序时,本发明提供的方装置、系统可选地包括:
基底,用于结合一条或多条靶向引物;
流路系统,用于可控地操控各种试剂(例如緩冲剂、酶、荧光标记核苷酸等)在基底所在的芯片腔室内的进出;
温度控制系统,用于调节和维持芯片腔室内的温度;
光学系统,包括激光光源(例如一个或多个激光器),所述光学系统用于激发荧光;
检测器组件(例如EMCCD相机等),用于检测和记录荧光信号;
计算机,具有用于控制系统(比如流路系统,温控系统,光学和检测系统、图像系统。还包括数据分析软件)的各个组件。
为进一步说明本发明的有益效果,本发明提供了如下实施例。
在本发明一实施例中,本发明提供的单分子测序技术采用了单分子测序装置,包括如下步骤:将模板/引物双链与基底表面上的环氧基团共价结合;进行边测序边合成(SBS)反应对掺入的核苷酸进行光学检测。
在本发明一实施例中,核酸模板分子包括脱氧核糖核酸(DNA)。核酸模板分子可以从含有各种其它成分,如蛋白质,脂质和非模板核酸等从生物样品中分离的成分。核酸模板分子可以来自动物,植物,细菌,真菌,或任何其他细胞生物体获得。本发明的生物样品包括病毒(DNA或RNA病毒)。核酸模板分子可以直接从生物体获得的生物样品,例如从血液,尿,脑脊髓液,精液,唾液,痰,粪便或其他组织获得。任何组织或体液样品可以用作核酸在本发明中使用的来源。核酸模板分子也可以从培养的细胞,如原代细胞培养物或细胞系中分离。样品还可以是从生物样品提取的总RNA或基因组DNA。
核酸从生物样品提取后通常被打断以产生合适的片段进行分析获得的。一般而言,随机打断为200bp左右的片段。在一个实施方案中,从生物样品中提取的核酸通过超声处理打断。一般地,从生物样品中提取的核酸的各种技术为行业内常规技术,例如Maniatis等人所述的《分子克隆实验室手册》,冷泉港,NY,第280-281(1982)。通常,单个核酸模板分子的长度可以为约5个碱基至约20kb。核酸分子可以是单链的,双链的,或双链的单链区(例如,茎和环结构)。
靶向引物(与待测核酸片段的部分序列互补)尽可能覆盖所需待测序基因片段,稳定高效的捕获靶向DNA片段,比如针对HBV病毒的测序,需要尽可能设计覆盖所有的基因突变点和耐药位点的靶向引物。靶向引物一般固定在光学透明的经过修饰的基底上面。基底表面需要经过化学修饰以便于靶向引物通过化学键或者物理吸附作用固定在基底表面。基底为具有低的天然荧光或基本上不发荧光的任何合适的载体。
在一个优选的实施方案中,用于本发明的基底可以是二维或三维的,并且可以包括一个平坦表面(例如,玻璃载玻片),或者可以是其他形状。本发明的基底可以包括玻璃(例如,可控孔度玻璃(CPG)),石英,塑料(如聚苯乙烯,不限于低交联和高交联的聚苯乙烯),聚碳酸酯,聚丙烯和聚甲基丙烯酸甲酯(methymethacrylate),丙烯酸共聚物,聚酰胺,硅,金属(例如,烷基硫醇(alkanethiolate)-衍生金),纤维素,尼龙,乳胶,葡聚糖,凝胶基质(例如,硅胶),聚丙烯醛,或复合材料。
合适的三维基底包括,例如,球,微粒,珠,膜,载玻片,平板,微机械加工的芯片,管(例如,毛细管),微孔,微流体装置,通道,过滤器,或任何其它合适用于锚定核酸的结构。基底可包括具有靶向引物区域的平面阵列或矩阵,比如包括核苷衍生的CPG和聚苯乙烯基底片;衍生的磁基底片等。
靶向引物(优选地,靶向引物5’端包括聚胸腺嘧啶核苷酸(聚dT)的寡核酸链)通过行业内常规的化学键或者物理吸附作用固定在基底表面,可以直接或间接(如通过生物素)固定在基底表面。在一个具体实施方案中,我们使用的是经环氧硅烷处理的低荧光玻璃表面,其表面的环氧键可以和靶向引物末端的氨基进行化学键合。在一些实施方案中,靶向引物分子的5’端连接聚胸腺嘧啶核苷酸(聚dT)的寡核酸链的3’端,聚dT寡核酸链的5’端通过氨基与基底表面的环氧键键合。在一个优选的实施方案中,靶向引物分子的5’端顺次连接有聚胸腺嘧啶核苷酸(聚dT)的寡核酸链、烷基链(比如,-(CH2)6-)和末端氨基,其中,聚dT寡核酸链的3’端与靶向引物分子的5’端相连,聚dT寡核酸链的5’端与烷基链相连,烷基链通过氨基与基底表面的环氧键键合。
固定好的引物密度要求为在保证单分子级别的分散度上,尽可能的密度高一些,这样可以保证尽可能高的测序通量。在一实施方案中,基底可以采用行业内其他处理方式,以改善核酸附着效率。在其他实施方案中,可以对本发明中使用的基片进行处理,以降低背景噪音。用于对基底进行修饰的环氧化物还可以为环氧化物的衍生物。
在基底固定了靶向引物之后,还需要经过化学钝化处理以消除未封闭的环氧基团和防止测序过程中的产生的非特异性吸附带来的噪声。表面钝化处理有很多种方法,由于测序中的荧光标记的碱基分子是负电的,在我们的具体实验中,使用磷酸盐来封闭玻璃表面的环氧基团,并产生负电层,以减小负电性的碱基吸附。
结合本发明采用的单分子靶向测序装置或系统,本发明提供的单分子测序方法,包括:
(i)将靶向引物的5’端连接到基底表面;其中,所述的靶向引物为本发明第一方面所述的探针;
(ii)提供或制备待测模板核酸,其中,所述的待测模板核酸的3’端修饰有带光学检测标记的双脱氧核糖核酸;将所述待测模板核酸与所述步骤(i)中连接到基底表面上的靶向引物进行杂交,形成杂交的靶向引物/模板核酸复合物;
(iii)对所述靶向引物/模板核酸复合物进行成像;
(iv)将所述靶向引物/模板核酸复合物、聚合酶以及一种或多种带光学检测标记的核苷酸混合,通过聚合酶反应将一种或多种带光学检测标记的核苷酸添加至靶向引物链的3’端;获得延伸产物;其中,所述带光学检测标记的核苷酸还具有可断裂的基团;
(v)对延伸后的靶向引物/模板核酸复合物进行成像,并结合步骤(iii)中靶向引物/模板核酸复合物的定位结果,进行图像比对和纠偏,以鉴定模板核酸上的待测核苷酸序列;
(vi)除去延伸产物上带光学检测标记的核苷酸的可断裂的基团:
(vii)重复步骤(iii)至(vi)一次或多次以鉴定所述模板核酸中的1个或多个核苷酸。
在一具体实施方案中,如图1所示,为本发明单分子测序原理示意图。测序前需要首先将待的跟疾病相关的待测序列打断成小片段DNA模板,DNA模板的末端标记有可供光学检测的标记分子,从而通过光学显微镜进行记录和定位DNA模板的坐标;同时在基底上随机固定多个5’端包括聚dT的靶向引物(本发明第一方面所述的探针);将小片段DNA模板与固定好的引物进行杂交并精确定位,通过全内反射显微镜(TIRF)采集光学图像来精确定位杂交后小片段DNA模板所处的位置;逐次加入带有检测标记的核苷酸及聚合酶的混合液孵育,洗涤,进行光学成像,记录本次反应的点位;之后再加入试剂以切除延伸点位的荧光分子,洗涤,加帽,准备好下一个核苷酸的延伸反应。通过延伸反应、成像检测和切除荧光分子的反复循环,就可以实现实时测序。
本发明提供的单分子测序方法采用到的聚合酶,优选为降低核酸外切酶活性的Klenow聚合酶。可选地,本发明可用核酸聚合酶包括但不限于本领域文献记载或商用的DNA聚合酶,RNA聚合酶,逆转录酶,和/或任何上述聚合酶突变形式。
在本发明一实施方案中,每个循环反应中,采用的带有检测标记的核苷酸为多色核苷酸(比如,四种核苷酸分别带不同的待测标记),可同时加入同一个循环反应的反应体系。本发明采用的核苷酸上的检测标记可选自行业内常规标记,包括但不限于:荧光素,罗丹明,花青,Cy5,Cy3,BODIPY,Alexa及其衍生物等。
以单分子测序为标志的第三代测序的技术,需采用循环可逆终结(cyclicreversibletermination,CRT)的办法来实现单个核苷酸的延伸以提高测序准确度。即当某一个带有抑制基团的核苷酸加到DNA链上之后,可以阻止下一个核苷酸的延伸;在温和条件下该抑制核苷酸可以被除去从而使该DNA链得以继续延伸。每增加一个核苷酸,可以通过对其所带荧光的检测实现对该DNA链的实时测序。这样一个带抑制基团的核苷酸被称作终止子(terminator)。在本发明一实施方案中,采用的带有检测标记的核苷酸为可切除荧光标记的单色或者多色可逆末端终止子。在本发明一优选实施方案中,可逆末端终止子为光可断裂的荧光标记可逆终端化合物。在本发明另一优选实施方案中,可逆末端终止子为化学断裂或酶催化断裂的荧光标记可逆终端化合物。
在一些实施方案中,至少3个,至少5个,至少10个,至少20个,至少30个,至少50个,至少100个,至少500个,至少1000个或至少10000个连续循环反应用于延伸特异性杂交有模板链的靶向引物,每次循环,延伸1个带荧光标记可逆终止子,每进入下一次循环之前,带荧光标记可逆终止子去掉其荧光标记及抑制基团。
鉴于边合成边测序的原理需要精确的温度控制和经历多次化学冲洗,测序样品被封装在一个设计好的微流体控制系统,保证精准的温度和试剂流动。为保证测序的通量,在本发明一优选实施方案中,可以设置多个通道。装配好的样品最终被放置在一个可观察单分子信号的全内反射光学显微镜上面。光学信号包括荧光,拉曼,散射等。在本发明一具体实验中,观察的光学信号是单分子的荧光信号。为防止定位信号和测序信号发生重叠,本发明使用不同激发信号分别激发定位荧光分子和测序标记分子。在多次成像过程中,荧光分子会发生淬灭,导致测序信号丢失和测序读长短,为改善这些问题,本发明特别关注了荧光淬灭问题,并在成像时通过加入研发的成像试剂,缩短曝光时间,减弱激发强度等手段来保证测序的准确性。
在本发明一实施方案中,本发明提供的单分子测序方法还包括:图像采集过程。图像采集采用的是全内反射显微系统(TIRF),单分子信号非常弱,TIRF系统能够显著降低背景噪音,从而提升信噪比。本发明实施例中采用的系统为双色激光光路系统,每次采集图像之前,需要按照化学冲洗流程对封装在微流控系统的样品进行处理,然后进行拍照,为了防止样品漂移,定位信息需要每次延伸反应之前进行拍照,然后碱基延伸后再拍照以获得测序信号。
本发明提供的单分子靶向测序方法中的图像采集步骤优选采用全内反射显微系统(TIRF),提升信噪比。本发明提供的方法在每次步骤(iv)的延伸反应之前进行一次拍照,然后在每次步骤(iv)的碱基延伸后再拍照一次;通过对同一个坐标视野的前后两次成像,纠正进行拍照时,由于载物台的轻微移动或样品漂移产生的些许偏差。
在本发明一实施方案中,对每次步骤(iv)的延伸反应前后不同时间点的成像进行图像比对和纠偏,步骤包括:
1)对同一位点的靶向引物/模板核酸复合物(基于模板核酸上光学检测标记的定位)在延伸反应前后不同时间点的成像进行图像比对和纠偏;以及
2)对该位点的靶向引物/模板核酸复合物(基于模板核酸上光学检测标记的定位)在该延伸反应后的成像与该延伸反应中结合到该位点的带光学检测标记核苷酸的成像进行图像比对和纠偏。
较佳地,在该实施例中,所述1)和2)两种对图像进行比对和纠偏的步骤具体可采用如下对不同时间点对同一位置拍摄的多个单分子图像进行比对和纠偏的方法实现:
1、首先读取第一时间点的单分子成像图片,然后再读取第二时间点的单分子成像图片,均在matlab里面保存为uint16格式的矩阵;
2、对第一时间点的单分子成像图片矩阵进行二维傅里叶变换,保存变换后的矩阵fft_ref;
3、对第二时间点的单分子成像图片矩阵进行二维傅里叶变换,保存变换后的矩阵fft_frame;
4、取两个时间点图片傅里叶变换后的矩阵的卷积prod=fft_ref.*conj(fft_frame);
5、对prod矩阵进行二维傅里叶反变换得到矩阵cc=ifft2(prod);
6、对cc这个矩阵进行fftshift变换,找到变换后矩阵最大值的坐标,再减去原始图片大小的一半,得到的不同时间点图片的偏移量;
7、最后再根据偏移量对第二时间点的图片用circshift函数来矫正偏移量。
在本发明一实施方案中,本发明提供的单分子测序方法还包括:图像处理过程。在成像步骤中,每次核苷酸延伸反应所获的图像可能有几十或者上千个视野。对于图像的处理,需要精准计算出每个反应的坐标位置并记录;在之后的每次碱基延伸过程中所获的图像要经过图像处理软件进行位置纠偏,以校对化学冲洗过程以及样品移动造成的位置漂移。然后再进行图像重叠,对有测序反应的位置进行逐次叠加、计算以获得每个位置的碱基序列。
在本发明一实施方案中,本发明提供的单分子测序方法还包括:生物信息学分析过程。在所获得的碱基序列的基础上,通过碱基判定和比对,最终获得所测DNA片段的完整序列。生物信息学介入以完成对该片段的生物学意义的分析,并帮助医生判断药物的选择,疾病的筛查等。
具体实施例
材料及试剂说明:
待测样品:来源于深圳第二人民医院。非特殊说明,本发明实施例采用的试剂均为市售商品,本发明实施例采用的数据库均为公开的在线数据库。
20xSSC:在800ml水中溶解175.3gNaCl和88.2g柠檬酸钠,加入数滴10mol/lNaOH溶液调节pH值至7.0,加水定容至1L,分装后高压灭菌。SSC是分子生物学上最为标准的印迹及分子杂交处理液,20*SSC用于杂交实验变性及清洗常用浓缩型缓冲液。
发明实施例采用的试剂均为市售商品,本发明实施例采用的数据库均为公开的在线数据库。
具体地,本发明多重PCR引物如表2所示:
表2.多重PCR引物序列
设计引物:采用Oligo7.0和MFEprimer-2.0对引物二聚体以及茎环错配进行分析,在包含突变位点的外显子两端设计引物,扩增的序列平均长度在150bp左右,且14对引物的退火温度基本一致。
本实施例提供的引物组覆盖了EGFR18~21号外显子、KRAS2号~3号外显子和BRAF15号外显子基因突变位点。由于很小的序列变化将导致引物扩增效果显著降低,发明人分别针对不同目的区域的不同区段设计了多组多重PCR引物组,在经过预实验筛选后,综合产物片段长度和点突变覆盖范围,本发明选取了扩增效果最佳的引物组,如上表1所示。
通过生工生物工程公司合成如表2所示引物序列;并合成表1所示序列的探针,合成探针中,表1所示各探针序列的5’端用NH2-(CH)10-TTTTTTTTTT-修饰。
本发明提供的具有表1所示序列的探针可覆盖如下表3中所示的突变位点:
表3.本发明提供的探针覆盖的突变位点
实施例1对PCR产物进行单分子靶向测序的样品的制备方法
本发明实施例提供了一种用于单分子靶向测序的样品的制备方法,包括如下步骤:
1、多重PCR
从医院获取包含癌细胞的组织,采用QIAampDNAMiniKit(51304)试剂盒提取基因组DNA,并用Nanodrop2000(Thermo)测定DNA的浓度及纯度,然后保存基因组DNA。
采用表2中的14对引物进行多重PCR,多重PCR体系及PCR参数如下:
反应体系:参照QIAGEN公司MultiplexPCR试剂盒(货号:206143)配置。
循环参数:
最后用Qiagen纯化试剂盒纯化获得30ulPCR产物。
2、测定双链DNA浓度并计算3’端摩尔浓度
使用Qubit检测:使用dsDNABRAssayKit,参照Qubit使用说明书。计算3’端摩尔浓度。
3、封阻反应
使用TerminalTransferaseKit(NEB,M0315L)进行封阻反应。
按以下反应体系混合,
BlockingMasterMix
|
1× |
Terminal Transferase 10X Buffer |
5μL |
CoCl2(2.5mM) |
5μL |
Terminal Transferase Enzyme(20U/μL) |
0.5μL |
ddATP(100μM) |
3μL |
Distilled water |
6.5μL |
Total |
20μL |
在PCR管中将样品稀释成3pmols,30μL。在95℃放至5min,然后迅速至冰上变性
在样品PCR管中加入15μLBlockingMasterMix,混匀并离心
放置PCR仪中进行以下反应
37℃ |
60min |
70℃ |
10min |
4℃ |
forever |
反应后,将所得样品可存储在-20℃。备用。
实施例2对gDNA进行单分子靶向测序的样品的制备方法
本发明实施例提供了一种用于单分子靶向测序的样品的制备方法,包括如下步骤:
1、从医院获取包含癌细胞的组织,采用QIAampDNAMiniKit(51304)试剂盒提取基因组DNA,并用Nanodrop2000(Thermo)测定DNA的浓度及纯度,然后保存基因组DNA。
DNA片段化
在无菌的PCR管中加入以下成分
DNA(5ng-3μg) |
1~16μL |
10×Fragmentase Reaction Buffer v2 |
2μL |
Sterile Water |
variable |
dsDNA Fragmentase(货号:M0348S) |
2μL |
Total |
20μL |
在37℃孵育30min,然后70℃放置10min。
2、电泳判断
取2~3ul反应产物进行电泳,使用凝胶成像仪照相并判断DNA片段化后的产物是否集中在200bp。
如果是,则继续进行后续反应。
3、磁珠纯化
1)从4℃冰箱取出磁珠,室温放置30min,振荡混匀;
2)将上述反应产物(18ul)转移至1.5mlEP管,加入1.8倍(32.4ul)磁珠液,混匀,静置2min;
3)将试管置于磁力架(invitrogen,12321D)上,静置3min,至上清澄清;
4)小心吸去上清(尽量吸取干净,但勿吸到磁珠);
5)加入200ul80%乙醇(乙醇需现配),吹打十次以上,吸去乙醇,勿碰到磁珠;
6)重复(5)一次;
7)将EP管50℃加热2-3min,待至半湿状态,磁珠出现龟裂时取出;
8)加入25ulddH2O溶解,混匀(勿使用振荡器,使用枪吹打),稍离心,静置5min,放置到磁力架上,上清澄清时,小心移出上清液。
4、测定双链DNA浓度并计算3’端摩尔浓度(参照实施例1)
5、封阻反应(参照实施例1),获得样品存储在-20℃。备用。
实施例3对游离DNA进行单分子靶向测序的样品的制备方法
本发明实施例提供了一种用于单分子靶向测序的样品的制备方法,包括如下步骤:
1、使用QIAampCirculatingNucleicAcidKit从10ml血液中提取游离DNA,用40μL洗脱(cell-freeDNA)或用大体积洗脱,再用SpeedVacConcentrator浓缩至40μL。
2、封阻反应
1)取36.5ulcell-freeDNA至PCR管中,95℃放至5min,然后迅速至冰上变性。
2)按以下反应体系混合,
Terminal Transferase 10X Buffer |
5μL |
CoCl2(2.5mM) |
5μL |
Terminal Transferase Enzyme(20U/μL) |
0.5μL |
ddATP(100μM) |
3μL |
cell-free DNA |
36.5μL |
Total |
50μL |
3)放置PCR仪中进行以下反应
此时,样品可存储在-20℃
本发明实施例1-3制备的样品可直接用于与芯片表面的探针进行杂交,并进行单分子测序。其中,所述实施例1-3中的ddATP为末端标记荧光的ddATP(具体为ddATP-Cy3),则可获得末端修饰有荧光标记的DNA片段,并用于后续单分子测序中与芯片表面的探针进行杂交。
实施例4DNA芯片固定
图2为本发明实施例对靶向引物进行固定的原理图。图2包括a-b,a为在环氧基玻片上固定靶向引物DNA示意图,b为在修饰有其他基团的玻片上固定靶向引物的流程示意图。该技术利用了环氧基团本身不稳定,张力较大,能和修饰有-NH2的DNA发生化学反应的优点,通过新的-CH2-NH-这个共价键将待固定的DNA单链固定在修饰有环氧基团的芯片表面。该固定技术仅是本发明的一种具体实施例,本发明方法的优化对所有的固定载体和DNA序列均有效。DNA序列5’端连有可以和芯片发生化学反应的基团,如氨基、醛基、羧基、巯基等;3’端用单分子荧光物质修饰,如Cy3、Cy5,目的在于统计固定的数目。
如图2所示,本发明实施例提供了一种DNA芯片固定方法,具体包括如下步骤:
1)将待固定序列的芯片用氮气枪吹净待用,所述基底表面带有环氧基,基底玻片来自于为SCHOTT公司的环氧基修饰的系列玻片);
2)用固定液(0.02-0.3MK2HPO4,本实施例中采用0.2M)将实施例1-3任意一个所制备的用于单分子靶向测序的DNA样品稀释成浓度为800-1600pM(本实施例中采用0.8nM),将芯片浸泡在DNA-固定液中45min-120min(本实施例中采用60min),固定液没过芯片即可;
3)然后依次用3xSSC+0.1%Triton,3xSSC,150mMK2HPO4pH=8.5,清洗芯片;
4)再用pH=9.0,0.2-1MK2HPO4(本实施例中采用1M)溶液稍稍没过芯片即可,于室温下在摇床上以40-80转/分钟(r/min,本实施例中采用80r/min)摇晃15小时。
5)依次用PBS,150mMHepes+150mMNaCl清洗芯片,最后再用双蒸水清洗芯片。
6)通过荧光显微镜对固定好的芯片进行照相,每个芯片拍连续的20个视野,然后统计每张照片的单分子荧光点数,计算每个视野下荧光点数的平均值。重复2-3次并统计固定上的序列数目,固定密度为2500-4000。
实施例5DNA单分子测序
具体地,以一具体样品为例,本发明实施例提供的一种基于单分子靶向测序技术检测EGFR/KRAS/BRAF基因突变位点,包括:
1.测序反应:取实施例4所得的基底上随机固定有多个探针的芯片;将实施例1-3中的任一个所制备的DNA样品与固定好的引物进行杂交并精确定位,通过全内反射显微镜(TIRF)采集光学图像来精确定位杂交后模板所处的位置;逐次加入带有可切除荧光标记的单色或者多色末端终止子及聚合酶的混合液孵育,洗涤,进行光学成像,记录本次反应的点位;之后再加入试剂以切除延伸点位的荧光分子,洗涤,加帽,准备好下一个核苷酸的延伸反应。通过延伸反应、成像检测和切除荧光分子的反复循环,就可以实现实时测序。
2.图像采集:图像采集采用的是全内反射显微系统(TIRF),因为单分子信号非常弱,TIRF系统能够显著降低背景噪音,从而提升信噪比。这个系统为双色激光光路系统,每次采集图像之前,需要按照化学冲洗流程对封装在微流控系统的样品进行处理,然后进行拍照,为了防止样品漂移,定位信息需要每次延伸反应之前进行拍照,然后碱基延伸后再拍照以获得测序信号。
3.图像处理:在步骤1中,本发明依据所需测序要求进行成像,每次碱基延伸反应所获的图像可能有几十或者上千个视野。对于图像的处理,需要精准计算出每个反应的坐标位置并记录;再之后的每次碱基延伸过程中所获的图像,要经过图像处理软件进行位置纠偏,校对所经历的化学冲洗过程以及样品移动造成的位置漂移。然后再进行图像重叠,对有测序反应的位置进行逐次叠加以获得每个位置的碱基序列。
4.生物信息学分析:在所获得的碱基序列的基础上,通过碱基判定和比对,最终获得所测DNA片段的完整序列。生物信息学介入以完成对该片段的生物学意义的分析,并帮助医生判断药物的选择,疾病的筛查等。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。