利用具有荧光切换性质荧光团的核苷酸底物分子进行测序的
方法
技术领域
本发明涉及一种高通量测序方法,属于基因测序领域。
背景介绍
高通量测序仪是近几年高速发展的技术。高通量测序,相较于传统桑格测序,最大的优势是可以同时读出海量的序列信息。虽然准确度不如传统测序方法,但由于海量数据分析,便可得出超出序列本身的信息,如基因表达量、拷贝数变异。
当今主流测序仪均使用SBS(sequencing by synthesis边合成边测序)方法,如solexa/illumina、454、iontorrent等。这些测序仪的结构相似,都包括流体系统,光学系统,和芯片系统。测序反应在芯片内发生。测序过程也很相似,都包括:将反应液通入芯片,发生SBS反应,采集信号,冲洗,进行下一轮。这样的周期性过程。随着周期的增多,测出连续的单碱基非兼并序列信息(如ACTGACTG)。然而,高通量测序仪无法彻底消除测序错误。测序错误可能来源于:反应偶然错误或累积错误,信号采集错误,信号矫正带来的误差等等。现有测序仪中,这些化学或光学、软件上带来的错误,或成为噪声,在单个读出位点无法被识别。只能通过深度测序,利用同一序列在不同位点的多次读取进行消除。更准确的读出是高通量测序发展的重要方向。但现有技术对准确度的优化,多集中在优化化学反应本身以及后续图像信号处理上,没有从测序逻辑上进行革新。
本发明涉及一种荧光切换性质的荧光团进行测序的方法。荧光切换性质的荧光团进行测序使用末端磷酸标记的核苷酸底物。荧光切换性质的荧光团的底物是通式为:在5’多磷酸末端或中间修饰有一种具有荧光切换性质的荧光团。其特点是,在4,5,6,或更多磷酸的脱氧核糖核苷酸(包括A,C,G,T,U以及其他核苷酸)的末端磷酸上或者中间磷酸上修饰有荧光切换的荧光团,并且在碱基和3’羟基上没有标记。这个荧光团在修饰在磷酸上时与磷酸脱离时的吸收光谱与/或发射光谱不同。测序又连续的、相似的周期(cycle)构成。每个周期内包含进样,反应和信号采集,和清洗未反应的反应物分子等步骤构成。在前人报道的方法中,每次进入一个碱基的底物分子,若不正确配对,则无反应发生;若正确配对,则聚合酶将底物分子连接至3‘尾端,并且释放出多磷酸修饰的荧光分子,并且荧光光谱发生变化。若可以与homopolymer连续配对,则有成倍数的光谱改变。在实际应用中,倾向使用被标记在末端磷酸上无吸收,释放状态为高量子产率的荧光切换性质荧光团作为底物分子的修饰标记,例如甲基荧光素,含卤代的甲基荧光素,DDAO,resorufin,CN104844674中涉及的荧光分子,等等。四种底物分子可以标记有不同的荧光分子。测序过程由ACGTACGT…或任意的循环或不循环进样过程进样,在有限的周期内含有底物分子的反应液进行测序反应。通过每个cycle得到的延伸信息,得到DNA序列。
发明内容
本发明涉及一种利用具有荧光切换性质荧光团的核苷酸底物分子进行测序的方法:利用5’端多磷酸修饰有荧光切换性质的荧光团的核苷酸底物分子进行测序;所述的荧光切换性质指的是测序后荧光信号相比测序反应前有明显改变;首先,将待测的核苷酸序列片段固定,然后通入含有核苷酸底物分子的反应液;使用酶将核苷酸底物上面的荧光团释放,从而导致荧光切换。
根据优选的技术方案,当连续测序的时候,优选进一步包括,利用清洗液清除残留的反应液以及荧光分子,然后进行下一轮测序反应。
根据优选的技术方案,在低温下进入反应液,然后加热到酶反应温度,再检测荧光信号。
根据优选的技术方案,所述的核苷酸底物分子指的是含有A、G、C、T碱基的核苷酸分子,或者含有A、G、C、U碱基的核苷酸分子;其中所述的C是甲基化的C或者未甲基化的C。
根据优选的技术方案,所述的5’端多磷酸修饰有荧光切换性质的荧光团的核苷酸底物分子,指的是5’末端磷酸修饰有荧光切换性质的荧光团的核苷酸底物分子。
根据优选的技术方案,不同的核苷酸底物分子根据碱基不同,可以连接一种荧光团,进行单色测序;也可以连接多种荧光团,进行多色测序。
根据优选的技术方案,所述的荧光切换性质指的是每一步的测序反应后,荧光信号相比于测序反应前有明显增强或者有明显减弱或者发射光频率范围有明显改变。
根据优选的技术方案,所述的荧光切换性质指的是每一步的测序反应后,荧光信号相比于测序反应前有明显增强。
根据优选的技术方案,将包含核苷酸底物分子的反应液用于测序,所述的核苷酸底物分子是A、G、C、T核苷酸分子中的任意两种或三种的混合物;或者所述的核苷酸底物分子是A、G、C、U核苷酸分子中的任意两种或三种的混合物。
根据优选的技术方案,将包含核苷酸底物分子的反应液用于测序,所述的核苷酸底物分子是A、G、C、T核苷酸分子中的任意一种;或者所述的核苷酸底物分子是A、G、C、U核苷酸分子中的任意一种。
本发明涉及一种利用具有荧光切换性质荧光团的核苷酸底物分子进行测序的方法,利用前面任一项所述的方法进行测序,其特征在于,每轮测序使用一套反应液组,每套反应液组至少包括两个反应液,每个反应液包含A、G、C、T核苷酸分子中的至少一种,或者每个反应液包含A、G、C、U核苷酸分子中的至少一种;将待测的核苷酸序列片段固定,通入一套反应液组中的一个反应液;检测、记录荧光信息;每次通入一个反应液,将同一反应液组中的其它反应液依次通入,并且每次检测、记录荧光信息;其中,所述反应液组中,至少有一个反应液包含两种或者三种不同的核苷酸分子。
本发明涉及一种利用具有荧光切换性质荧光团的核苷酸底物分子进行测序的方法,利用前面任一项所述的方法进行测序,其特征在于,每轮测序使用一套反应液组,每套反应液组包括两个反应液,每个反应液包含两种不同碱基的核苷酸;其中一个反应液中的核苷酸可以和待测核苷酸序列上的两种碱基互补,另一个反应液中的核苷酸可以和待测核酸序列上的另外两种碱基互补;首先,将待测的核苷酸序列片段固定,通入一套反应液组中的第一个反应液;检测、记录荧光信息;然后通入同一套反应液组中的第二个反应液;检测、记录荧光信息;两个反应液循环加入,通过荧光信息获得待测核苷酸底物的编码信息。
根据优选的技术方案,当通入反应液之后,可以将进行反应的反应室封闭,然后检测、记录荧光信息。
根据优选的技术方案,通入反应液后,用油充满反应室外面的空间,从而将反应室隔离、封闭。
根据优选的技术方案,所述的多磷酸核苷酸底物指的是具有4-8个磷酸分子的核苷酸;
根据优选的技术方案,可以用一套反应液组进行一轮测序,也可以用两套反应液组进行两轮测序,也可以用三套反应液组进行三轮测序。
根据优选的技术方案,步骤使用酶将具有荧光切换性质的荧光团的核苷酸底物上面的荧光团释放中,所述的酶包括DNA聚合酶和/或碱式磷酸酶。
根据优选的技术方案,用一套反应液组进行一轮测序,获得简并的编码结果。
根据优选的技术方案,用两套反应液组进行两轮测序,获得碱基序列信息。
根据优选的技术方案,用三套反应液进行三轮测序,在两轮测序结果的基础上,利用三轮测序间的互信息,进行错误校验。
根据优选的技术方案,所述的反应液中包含了所述酶,即将反应液通入待测的基因片段所在的反应区域的时候,其包含的酶将具有荧光切换性质荧光团的核苷酸底物上的荧光团释放。
根据优选的技术方案,所述的反应液和所述的酶不同时加入;即首先通入一套反应液组中的一个反应液,通入酶溶液;然后通入同一套反应液组中的第二个反应液,通入酶溶液。
根据优选的技术方案,所述的具有荧光切换性质荧光团,指的是具有甲基荧光素,含卤代的甲基荧光素,DDAO,resorufin类结构的荧光团。
根据优选的技术方案,所述的使用酶将具有荧光切换性质的荧光团的核苷酸底物上面的荧光团释放,优选指的是首先使用DNA聚合酶将多磷酸取代的荧光团释放,然后使用磷酸酶将取代多磷酸切除,从而释放荧光团。
根据优选的技术方案,当反应液包含两种或两种以上不同碱基的核苷酸的时候,可以将该反应液简单拆分成两种或者更多种反应液,每种反应液中包含一种或者一种以上的核苷酸;通入该反应液的顺序可以做出相应适当调整;并且,至少一种反应液中含有两种或者三种不同碱基的核苷酸。
本发明一种高通量测序的方法,利用前面任一项所述的方法进行测序,其特征在于,测序反应在芯片上进行,芯片上有多个反应室,将待测的核苷酸序列片段固定在反应室内。
本发明涉及一种荧光切换性质荧光团的核苷酸分子进行测序的方法,这种方法降低了背景信号,提高了获得的信号的准确性。使得更加微弱信息的采集变得容易。相比于传统测序,比如ILLUMINA测序方法,其可以允许更密集的测序反应室排列,并且使得测序成本更低。更进一步,本发明将荧光切换测序和多碱基测序联合使用,其取得了预想不到的效果。比如,将荧光切换的多碱基测序,提供了数据冗余和校验的特性,这样使得测序数据的准确性进一步提高。而且,3端不封闭的测序还使得测序反应并不需要实时采集信息,更提高了信号的准确性。独立于测序化学原理本身,可与不同的测序化学配合。更进一步的,荧光切换性质的2+2(每次进入两个碱基的测序方式),相比于其它的多碱基测序,优势明显,数据解析相对容易,并且提供了数据冗余和校验的特性。其特殊的信号获得方式和获得效率,使得其在基因测序方向有很大的应用前景。荧光切换的多碱基测序,相比于非荧光切换的多碱基测序,降低了错误率,并且使得反应更加简单。本发明的荧光切换的多核苷酸方法,其测序的准确度可以达到99.99%,超越ILLUMINA测序的读长,可以达到300nt以上,并且原料成本低廉。其采用先反应然后扫描的方法,无通量的限制。其单论反应时间比较短,可以做到快速的检测。采用荧光切换和多种核苷酸分子混合测序的策略,可以延长每个反应周期的测序读长以及每个反应周期的信息量。比如,illumina测序每个反应周期读长为1nt(1碱基),信息量为2bit。2+2(每次进入两个不同碱基的核苷酸分子,一共两种反应液)单色测序,每个反应周期的读长为2nt,信息量为2bit。2+2双色测序,每个反应周期的读长为2nt,信息量约为3.4bit。
本发明中所涉及的单词基本为本领域的通用说法,为了进一步的表述清楚,下面对于本发明涉及的用词做进一步的解释。
荧光发生、荧光发生荧光团:一些荧光团具有取代基发生改变时,荧光光谱(吸收和反射光谱)发生变化的特性,称为荧光切换。
当在特定的激发和采集(发射)条件下,采集到的信号强度上升,称为荧光发生。
核苷酸和核苷酸标记:核苷酸分子包括核糖骨架,糖苷位置上的碱基分子,以及核糖骨架上的5位羟基上连接的多磷酸链构成。核糖环的2C上可以连接有羟基(成为核糖核苷酸),或仅连接有H(称为脱氧核糖核苷酸)。碱基分子可以为4中主要碱基:ACGT,和尿嘧啶,和修饰了的碱基如甲基化、羟甲基化等。磷酸骨架的数量可以为1-8个。在多个位置可以修饰分子团。碱基上,核糖骨架的3C羟基上,磷酸上。修饰的位置可以有一个或多个。如磷酸上修饰了荧光团,3C上修饰有乙炔基。
3C上未修饰的多磷酸核苷酸底物(大于三个磷酸),在发生聚合酶链式反应时,一直保持有3位活性羟基。只要接下来的碱基依旧可以配对,则聚合酶反应会持续发生,直到缺少配对碱基或结合了3C非羟基的核苷酸分子。
荧光发生核苷酸:磷酸末端标记有可被磷酸水解过程切换的荧光发生荧光团的核苷酸分子,简称荧光发生核苷酸。磷酸链的长度可为4-8。
不重要的:磷酸可为末端,或侧链上。标记个数可为1个或多个。多个标记可相同或不同。
更精确的讲,叫聚合酶荧光发生核苷酸,也可能有荧光发生的核苷酸,不标记在磷酸位置上,也不用聚合酶做荧光发生。
核苷酸分子可为核糖核苷酸、脱氧核糖核苷酸、或3’C上修饰了的(脱氧)核糖核苷酸
荧光发生核苷酸聚合酶反应:荧光发生核苷酸聚合酶反应使用荧光发生核苷酸,核酸聚合酶(DNA聚合酶),磷酸酶,与核酸底物一起。首先DNA聚合酶将荧光发生核苷酸聚合进入核酸底物中,释放出磷酸化的荧光发生荧光团,再进一步被磷酸酶水解去除磷酸,释放荧光状态改变的荧光发生荧光团。
荧光发生测序:利用荧光发生核苷酸聚合酶反应,检测荧光发生荧光团的荧光改变(光强和光谱),便可以得到聚合酶发生反应的信息。
荧光发生测序反应液:包含荧光发生核苷酸,核酸聚合酶(DNA聚合酶),磷酸酶。
荧光发生核苷酸可为一种或多种。核苷酸种类可为一种或多种。多种可分别标记有相同或不同的荧光发生底物。
一套荧光发生测序反应液:包含2种以上荧光发生测序反应液。例如包含特定浓度的A,C,G,T的四种反应液。或包含特定浓度(AC),(GT)的两种反应液。
一个荧光测序反应周期:使用一种测序反应液,进行一次荧光发生聚合酶反应,并检测荧光信号。
一轮荧光发生测序反应:使用一套荧光发生测序反应液,按照确定顺序依次进行使用这套荧光发生测序反应液的成员进行测序反应周期。
一组荧光发生测序反应:包含一轮或多轮荧光发生测序。
单碱基分辨率测序:一种实现方式是(2+2单色两套),第一个反应液由两种碱基混合(如AC),第二个反应液由另外两种碱基混合(则为GT),两个反应液交替进行测序。这时每cycle延伸的碱基会变多。在N轮测序后,延伸碱基为2N nt。携带信息为2N bit。完成上述测序的,有3个组合,AC/GT,AG/CT,AT/CG;或按照标准简并碱基(degenerate nucleotide)标识,写作M/K,R/Y,W/S。三种组合可以分别测序,或再完成一套测序后,再重新测序。测得DNA序列上第i个碱基,一定在两套测序中的某唯一cycle中被聚合酶配对反应并释放信号。每套测序中,测出该碱基的可能进样周期都有两种,所以共有2x 2=4种可能的情况。正好对应于4种碱基。测序组合的先后顺序不影响碱基的推断。
进一步的具体实施中,再进行二套不同的测序后,进行使用第三套不同的反应液组合进行测序。测得DNA序列上第i个碱基,一定在三套测序中的某唯一cycle中被聚合酶配对反应并释放信号。每套测序中,测出该碱基的可能进样周期都有两种,所以共有2x 2x 2=8种可能的情况。只有其中4种是合理的,另外四种不合理。在真实荧光切换测序中,测序很可能出现插入或缺失错误。针对某一碱基,3套测序中的一套出现测序错误,则无法正确推断出序列,并可断定,3套测序中的一套或多套在此处定有测序错误出现。
这种错误可以被矫正。因为当单套数据中的测序错误被修正时,后续的大量错误会一并被修正。
另一种的具体实施,2+2双色两轮,第一个反应液由两种碱基混合,并且携带不同的荧光标记(如A-X/C-Y),第二个反应液由另外两种碱基混合(则为G-X/T-Y)。这时每cycle延伸的碱基会变多,平均为2nt。携带信息为3.4bit。
具体实施方式
为了进一步阐明本发明,现列出如下具体实施方式。其中所涉及的具体的参数、步骤等,为本领域的常规知识。具体实施方式和实施例并不限制本发明的保护范围。
实施例1.
2+2测序,单色:配置3套反应液,每套两瓶,每瓶有两种标记有荧光基团的碱基,荧光基团均为X。一套中的两瓶反应液,恰好包含完整的4种碱基。6瓶溶液互不重复。
|
第一瓶 |
第二瓶 |
第一套 |
AX+CX |
GX+TX |
第二套 |
AX+GX |
CX+TX |
第三套 |
AX+TX |
CX+GX |
完整的测序过程包括三轮,三轮依次进行。每轮的测序过程分别使用上述三套试剂。除此之外完全相同(使用相同的测序引物,反应条件完全相同)。
每轮测序包含:
1.将测序引物杂交在已经制备好的DNA阵列上
2.开始测序过程。重复2.1-2.4过程有限次。
2.1进第一瓶试剂。反应并采集荧光信号。
2.2清洗flowcell中的全部残留反应液和产生的荧光分子
2.3进第二瓶试剂。反应并采集荧光信号。
2.2清洗flowcell中的全部残留反应液和产生的荧光分子
3.将延伸过的测序引物解旋。
至此,便可进行下一轮实验。
准备反应液:
配制测序反应液洗液,简称洗液,含有:
20mM Tris-HCl pH 8.8
10mM(NH4)2SO4
50mM KCl
2mM MgSO4
0.1%20
配制测序反应液母液(简称母液),含有:
20mM Tris-HCl pH 8.8
10mM(NH4)2SO4
50mM KCl
2mM MgSO4
0.1%20
8000unit/mL Bst polymerase
100unit/mL CIP
配制三组测序反应液,共六瓶。分别为:
1A、母液+20uM dA4P-TG+20uM dC4P-TG
1B、母液+20uM dG4P-TG+20uM dG4P-TG
2A、母液+20uM dA4P-TG+20uM dG4P-TG
2B、母液+20uM dC4P-TG+20uM dG4P-TG
3A、母液+20uM dA4P-TG+20uM dT4P-TG
3B、母液+20uM dC4P-TG+20uM dG4P-TG
配制好的反应液和母液,置于4c冰箱或冰上待用。
杂交测序引物:
将测序芯片内注入测序引物溶液(10uM溶解于1X SSC buffer),升温至90度,在以5摄氏度/min的速度降温至40度。用洗液冲洗掉测序引物溶液。
进行第一次测序:
将测序芯片置于测序仪上。
使用第一组反应液进行测序。遵循如下流程。
1,通入洗液10mL,冲洗芯片
2,将芯片降温至4摄氏度
3,通入100uL反应液1A
4,将芯片升温至65摄氏度
5,等待1min
6,用473nm激光激发,拍摄荧光图像。
7,通入洗液10mL,冲洗芯片
8,将芯片降温至4摄氏度
9,通入100uL反应液1B
10,将芯片升温至65摄氏度
11,等待1min
12,用473nm激光激发,拍摄荧光图像。
重复1-12的步骤50次,得到100个荧光信号。
实施例2.
在实施例1的基础上,进行第二次测序:
将芯片降温至室温。通入200uL 0.1M NaOH溶液。变性全部在第一次测序中延伸的DNA双链。再通入10mL洗液,彻底冲洗残留的NaOH和变性的单链DNA。
根据前述方式,再次杂交测序引物。
使用第二组反应液进行测序。遵循如下流程:
1,通入洗液10mL,冲洗芯片
2,将芯片降温至4摄氏度
3,通入100uL反应液2A
4,将芯片升温至65摄氏度
5,等待1min
6,用473nm激光激发,拍摄荧光图像。
7,通入洗液10mL,冲洗芯片
8,将芯片降温至4摄氏度
9,通入100uL反应液2B
10,将芯片升温至65摄氏度
11,等待1min
12,用473nm激光激发,拍摄荧光图像。
重复1-12的步骤50次,得到100个荧光信号。
实施例3.
在实施例2的基础上,进行第三次测序
将芯片降温至室温。通入200uL 0.1M NaOH溶液。变性全部在第一次测序中延伸的DNA双链。再通入10mL洗液,彻底冲洗残留的NaOH和变性的单链DNA。
根据前述方式,再次杂交测序引物。
使用第三组反应液进行测序。遵循如下流程。
1,通入洗液10mL,冲洗芯片
2,将芯片降温至4摄氏度
3,通入100uL反应液3A
4,将芯片升温至65摄氏度
5,等待1min
6,用473nm激光激发,拍摄荧光图像。
7,通入洗液10mL,冲洗芯片
8,将芯片降温至4摄氏度
9,通入100uL反应液3B
10,将芯片升温至65摄氏度
11,等待1min
12,用473nm激光激发,拍摄荧光图像。
重复1-12的步骤50次,得到100个荧光信号。
测序结束
实施例4
配置3套反应液,每套两瓶,每瓶有两种碱基。两种碱基标记有不同的荧光发色团,以便进行区分,发射波长不同。
在本例中,全部碱基均使用两种发色基团:X和Y。一套中的两瓶反应液,恰好包含完整的4种碱基。6瓶溶液互不重复。
|
第一瓶 |
第二瓶 |
第一套 |
AX+CY |
GX+TY |
第二套 |
AX+GY |
CX+TY |
第三套 |
AX+TY |
CX+GY |
完整的测序过程包括三轮,三轮依次进行。每轮的测序过程分别使用上述三套试剂。除此之外完全相同。
每轮测序包含:
1将测序引物杂交在已经制备好的DNA阵列上
2开始测序过程。重复2.1-2.4过程有限次。
2.1进第一瓶试剂。反应并采集两个波长的荧光信号。
2.2清洗flowcell中的全部残留反应液和产生的荧光分子
2.3进第二瓶试剂。反应并采集两个波长的荧光信号。
2.2清洗flowcell中的全部残留反应液和产生的荧光分子
3将延伸过的测序引物解旋。
至此,便可进行下一轮实验。
对比例1:
本例涉及4种3端封闭的核苷酸分子,该基团可阻碍聚合酶分子将此核苷酸分子作为底物连续延伸,封闭的基团可在特殊条件下切除,并生成羟基。每种核苷酸分子标记有不同的荧光分子团,此分子团不包含荧光切换性质的荧光团,并可在特定条件下切除。荧光分子记为W,X,Y,Z。底物分子为W-A,X-C,Y-G,Z-T。
试剂一:主测序反应液。包含4种3端封闭的标记有荧光的核苷酸分子和可以识别该底物的聚合酶。
试剂二:清洗液。
试剂三:去封闭液。包含切除3端封闭基团和荧光基团的试剂。
测序时,先将测序引物杂交在模板链上。
将试剂一与杂交后的模板混合,并发生聚合酶反应。反应后使用试剂二将未反应的测序液冲洗干净。并采集荧光信号,并判断延伸的一个碱基种类。之后,将试剂三通入,将全部3端封闭基团和荧光基团切除。清洗后进行下一轮反应。
这种测序方法无法拥有数据冗余和校验的特性。
对比例2.
使用非荧光切换性质的核苷酸测序。本实施例和实施例1类似。只是在荧光标记不在磷酸上。
本例涉及4种核苷酸分子,均可在互补配对的条件下自由被聚合酶延伸。每种核苷酸分子的碱基上标记有相同的的荧光分子团,此分子团包含不荧光切换性质,并可在特定条件下切除。
配置3套反应液,每套两瓶,恰好包含完整的4种碱基。6瓶溶液互不重复。
|
第一瓶 |
第二瓶 |
第一套 |
AX+CX |
GX+TX |
第二套 |
AX+GX |
CX+TX |
第三套 |
AX+TX |
CX+GX |
完整的测序过程包括三轮,三轮依次进行。每轮的测序过程分别使用上述三套试剂。除此之外完全相同(使用相同的测序引物,反应条件完全相同)。
每轮测序包含:
1.将测序引物杂交在已经制备好的DNA阵列上
2.开始测序过程。重复2.1-2.4过程有限次。
2.1引入第一瓶试剂。反应。
2.2清洗flowcell中的全部残留反应液和产生的荧光分子
2.3采集荧光信号。
2.4引入切除试剂,将荧光标记基团切除。
2.1引入第二瓶试剂。反应。
2.2清洗flowcell中的全部残留反应液和产生的荧光分子
2.3采集荧光信号。
2.4引入切除试剂,将荧光标记基团切除。
3.将延伸过的测序引物解旋。
至此,便可进行下一轮实验。三轮测序后测序实验结束。
用非荧光切换性质的底物,需要引入切割试剂,测序步骤延长。并且在生成的双链DNA上留下分子伤疤,阻碍进一步延伸。
本发明具体实施方式中的具体实施例,仅仅是对于本发明的进一步说明,并不够构成成本发明的限制因素。