CN112280842B - 一种3’端羟基可逆封闭核苷酸合成测序法 - Google Patents
一种3’端羟基可逆封闭核苷酸合成测序法 Download PDFInfo
- Publication number
- CN112280842B CN112280842B CN202011152063.0A CN202011152063A CN112280842B CN 112280842 B CN112280842 B CN 112280842B CN 202011152063 A CN202011152063 A CN 202011152063A CN 112280842 B CN112280842 B CN 112280842B
- Authority
- CN
- China
- Prior art keywords
- sequencing
- information
- hydroxyl
- nucleotide
- reaction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000002773 nucleotide Substances 0.000 title claims abstract description 63
- 125000003729 nucleotide group Chemical group 0.000 title claims abstract description 60
- 230000002441 reversible effect Effects 0.000 title claims abstract description 22
- 238000001308 synthesis method Methods 0.000 title claims description 9
- 238000012163 sequencing technique Methods 0.000 claims abstract description 186
- 238000006243 chemical reaction Methods 0.000 claims abstract description 78
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 33
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 27
- 239000000178 monomer Substances 0.000 claims abstract description 22
- 239000003550 marker Substances 0.000 claims abstract description 21
- 238000002372 labelling Methods 0.000 claims abstract description 12
- 125000002887 hydroxy group Chemical group [H]O* 0.000 claims abstract description 8
- 108020004414 DNA Proteins 0.000 claims description 17
- 239000003795 chemical substances by application Substances 0.000 claims description 13
- 230000000295 complement effect Effects 0.000 claims description 12
- 150000007523 nucleic acids Chemical group 0.000 claims description 12
- 238000000034 method Methods 0.000 claims description 8
- 238000003860 storage Methods 0.000 claims description 8
- 108091034117 Oligonucleotide Proteins 0.000 claims description 7
- 239000012634 fragment Substances 0.000 claims description 7
- 125000004122 cyclic group Chemical group 0.000 claims description 5
- 239000000839 emulsion Substances 0.000 claims description 5
- 238000009396 hybridization Methods 0.000 claims description 4
- 230000001404 mediated effect Effects 0.000 claims description 4
- 239000011325 microbead Substances 0.000 claims description 4
- 238000002360 preparation method Methods 0.000 claims description 4
- 238000012070 whole genome sequencing analysis Methods 0.000 claims description 4
- 102000053602 DNA Human genes 0.000 claims description 3
- 102000003960 Ligases Human genes 0.000 claims description 3
- 108090000364 Ligases Proteins 0.000 claims description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 claims description 3
- 230000003321 amplification Effects 0.000 claims description 3
- 238000004925 denaturation Methods 0.000 claims description 3
- 230000036425 denaturation Effects 0.000 claims description 3
- 238000001976 enzyme digestion Methods 0.000 claims description 3
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 3
- 239000002096 quantum dot Substances 0.000 claims description 2
- 239000000523 sample Substances 0.000 claims description 2
- 239000000126 substance Substances 0.000 claims description 2
- 238000006116 polymerization reaction Methods 0.000 description 7
- 238000001712 DNA sequencing Methods 0.000 description 5
- 239000000049 pigment Substances 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- 239000000975 dye Substances 0.000 description 3
- 229920001519 homopolymer Polymers 0.000 description 3
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- IVRMZWNICZWHMI-UHFFFAOYSA-N azide group Chemical group [N-]=[N+]=[N-] IVRMZWNICZWHMI-UHFFFAOYSA-N 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 239000007850 fluorescent dye Substances 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 1
- 238000000018 DNA microarray Methods 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000010511 deprotection reaction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-N diphosphoric acid Chemical compound OP(O)(=O)OP(O)(O)=O XPPKVPWEQAFLFU-UHFFFAOYSA-N 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000005669 field effect Effects 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- -1 hydrogen ions Chemical class 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 125000001436 propyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 229940005657 pyrophosphoric acid Drugs 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 229920002554 vinyl polymer Polymers 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种3’端羟基可逆封闭核苷酸合成测序法,包括单色标记或单次扫描双色标记核苷酸合成测序。单色标记测序:四种3’端羟基可逆封闭的脱氧核苷酸单体中X、Y两个不同的脱氧核苷酸单体用同一种标记物标记记为X*、Y*,另外两个脱氧核苷酸Z、W不标记,每次测序反应最多产生一个核苷酸的合成,比较标记物信息强度与背景数值,得到一个测序编码信息XY或者ZW,然后活化3’端羟基进行下一个测序反应,并获得由(XY)、(WZ)这些编码构成测序信息;单次扫描双色标记测序:将上述四种脱氧核苷酸单体分两组分别进行不同标记,进行奇数和偶数次的单次测序,分别得到两组编码,通过比较两组编码中选出相同的碱基即完成对测序信息的解码,得到具体的碱基信息。
Description
技术领域
本发明涉及基因测序方法,特别涉及一种3’端羟基可逆封闭核苷酸合成测序法。
背景技术
随着DNA结构的发现,人们在理解基因组在健康和疾病中的复杂性和多样性方面取得了巨大的进步。人类基因组计划的开展和完成使人类步入了后基因时代,分子生物学等相关学科得到了迅猛发展。DNA测序技术已成为现代生物学研究的常规手段之一,推动我们对健康和疾病的理解取得革命性的进步。高通量DNA测序平台的推出大幅度降低了DNA测序成本,对当代生物学、医学等领域的研究产生了巨大的影响,同时,也是医学大数据的主要来源之一。目前市场上的成熟的商品化高通量DNA测序仪主要包括Roche公司的基于乳液PCR产物的454基因组测序仪;Illumina公司和Solexa technology公司合作开发的基于桥式扩增-DNA芯片延伸的Illumina测序仪;以及Applied Biosestems公司的基于乳液PCR产物的杂交-酶连接-酶切割的SOLiD测序仪、pH敏感场效应管阵列芯片的Ion Torrent测序仪。
在现有的合成测序技术中,主要通过两种方式实现:第一种是通过单个碱基的添加来确定每次合成的碱基的种类和数量,这种方式需要四个独立的反应来完成所有模板的一个碱基的测定从而会增加测序时间;第二种是采用循环可逆终止子,是指在合成反应中加入3’端羟基可逆封闭的特殊核苷酸单体,这样每次反应只能延伸一个核苷酸,而且每个单体带有4种不同的标记,通过采集四色荧光之后从而确定每次合成的碱基种类和数量,这种方式在测定下一个碱基前需要进行3’羟基的脱保护处理,而每增加一步反应将导致反应效率的降低,最终导致测序长度的下降。此外,这种让每个核苷酸携带不同标记,虽然能够直接通过读取荧光强度最大者为测序信息,可是也存在四种不同染料的发射波长可能重迭影响结果、标记成本高以及需要扫描四种染料而造成制造费用和测序时间的增加等问题,因此,如果采用单色标记方法实施高通量DNA测序,不仅测序仪器的复杂程度可以降低,扫描时间也能减少75%,从而也能缩短测序时长。“一种3’端可逆封闭的两核苷酸实时合成测序方法”(中国发明专利号:201610592035.8)通过两次平行合成测序来解码待测模板的碱基信息,能克服同聚物或者类准同聚物的问题,提高测序的准确度。该方法完全采用未标记的3’端可逆封闭的核苷酸,将四个核苷酸分成两组进行测序反应,通过检测焦磷酸或者氢离子来判断测序反应是否发生,只适合于实时合成测序、即需要单独的反应池,而每个单独的反应池需要占用一定的空间,限制了DNA测序通量,同时也提高了芯片制备架构费用;此外,该方法的第二个不足是由于每次测序反应只采用了四种类中的两种核苷酸,另外两种核苷酸因为缺失而容易造成错配核苷酸的合成,引起测序错误。虽然单个测序反应发生错配核苷酸的合成效率很低,但这些错误的积累将对测序长度造成危害,因此,该方法不是合成测序的最优选择。
发明内容
发明目的:本发明目的是提供一种3’端羟基可逆封闭核苷酸合成测序法,缩短测序时间,提高序列测定的长度及准确度,从而实现待测核酸序列的高通量检测。
技术方案:本发明提供一种3’端羟基可逆封闭核苷酸合成测序法,包括单色标记或单次扫描双色标记核苷酸合成测序;
单色标记的核苷酸合成测序:测序反应由四种3’端羟基可逆封闭的脱氧核苷酸单体同时进行,其中X、Y两个不同的脱氧核苷酸单体用同一种标记物标记记为X*、Y*(X、Y为碱基A、G、C、T四种中的两种),另外两个脱氧核苷酸Z、W不标记(Z、W为碱基A、G、C、T四种中除X、Y对应两种外的剩余两种),每次测序反应最多只能产生一个核苷酸的合成,通过比较标记物信息强度与背景数值,得到一个测序编码信息XY或者ZW,然后活化3’端羟基进行下一个测序反应,整个测序包括对同一模板进行若干个测序反应,并获得由(XY)、(WZ)这些编码构成测序信息;
单次扫描双色标记核苷酸合成测序:在(A*1、G*1、C*2、T*2)/(A*1、C*1、G*2、T*2)的循环测反应为,在奇数次的单次测序反应中,同时加入A*1、G*1、C*2、T*2进行延伸反应,通过单次扫描获得两种不同标记物信息强度,得到一个编码(AG)或者(CT);在偶数次的单次测序反应中,同时加入A*1、C*1、G*2、T*2,通过单次扫描获得两种不同标记物信息强度,得到一个编码(AC)或者(GT)。在(A*1、T*1、C*2、G*2)/(A*1、G*1、C*2、T*2)的循环测反应为,在奇数次的单次测序反应中,同时加入A*1、T*1、C*2、G*2,通过单次扫描获得两种不同标记物信息强度,得到一个编码(AT)或者(CG);在偶数次的单次测序反应中,同时加入A*1、G*1、C*2、T*2,通过单次扫描获得两种不同标记物信息强度,得到一个编码(AG)或者(CT),然后通过比较两组对应编码中选出相同的碱基即完成对测序信息的解码,得到具体的碱基信息,其中,*1表示一种标记,*2表示另一种标记。
进一步地,单色标记的核苷酸合成测序包括如下步骤:
(1)准备3’端羟基可逆封闭核苷酸单体并进行单色标记;
(2)人全基因组模板制备:将人基因组制成碱基片段,将这些片段化核酸序列用一对通用连接子进行连接,其中的一个通用连接子的寡核酸序列与扩增引物的序列完全互补,而另一个连接子的寡核酸序列包含了所有测序引物的序列信息,将这些连接臂连接的片段化核酸序列与固定连接子互补序列到微珠进行乳液并行PCR反应,扩增片段化的人全基因组,通过酶切或者变性得到人全基因组测序模板;
(3)测序引物的杂交:将5’端固定的模板与能和3’端连接子互补的引物杂交,杂交引物作为所有人全基因组DNA模板的测序引物;
(4)测序:
第一组测序反应:将5’端固定的模板与能和3’端连接子互补的引物杂交,得到一组由编码(AG)、(CT)构成的测序信息;
第二组测序反应:清除第一组测序反应中的测序引物,得到单链DNA模板,然后再一次与测序引物进行杂交,得到一组由编码(AC)、(GT)构成的测序信息;
(5)解码:利用每个模板两组测序中得到碱基片段的编码信息,解码组装出相应的碱基序列信息;
(6)序列组装:利用所有模板的碱基序列信息,组装成人全基因组序列。
进一步地,所述3’端羟基是被3′-O-叠氮甲基、3′-O-烯丙基、3’-O-乙烯丙基、3′-O-氨基基团可逆封闭。
进一步地,X*、Y*、W和Z四种碱基,形成三种独立的不同核苷酸组合:(A*、G*、C、T),(A*、C*、G、T),(A*、T*、C、G)与对应的(C*、T*、A、G),(G*、T*、A、C),(G*、C*、A、T)产生相同的测序信息,每种组合可以单独用于一组循环测序,也可以两种或者两种以上的组合按照给定的规则或顺序进行一组循环测序。
进一步地,所述测序信息是通过比较测序反应的单色标记信息强度与背景数值而获得:当单色标记强度的数值高于背景数值,则测序信息为标记单体核苷酸组合的编码(XY);当单色标记强度与背景数值接近,则未标记的两核苷酸组合编码(WZ)即为测序信息。
进一步地,一组核苷酸组合循环测序可以获得待测核酸片段的编码信息,可用于DNA存储信息的读取。
进一步地,所述解码两组或者两组不同核苷酸组合循环测序的编码信息,可以获得待测核酸片段的具体碱基信息。
进一步地,所述标记物包括量子点及具有光、电、磁可以测定特定信息的物质。
进一步地,包括聚合酶介导的延伸反应测序以及连接酶介导的连接测序,在连接测序中测序探针为一段特定的寡核苷酸序列。
本发明原理如下:
本发明将四种3’端羟基可逆封闭的脱氧核苷酸单体分成两类,一类X、Y两个不同的碱基标记同一种染料;另一类W、Z两个不同碱基不标记。由于四个不同碱基可以满足所有待测序列的延伸要求,即每个待测序DNA模板一定发生、且只能发生一个单体的聚合反应。当测序结果为扫描荧光强度明显高于背景数值时,就可以判断发生了X或者Y单体的聚合反应,虽然我们不能具体到是碱基X、还是碱基Y发生的,但可以用一个编码表示(XY);当测序结果为扫描荧光强度与背景数值相当时,就可以判断发生了W或者Z单体的聚合反应,虽然我们不能具体到是碱基W、还是碱基Z发生的,但可以用一个编码表示(WZ)。当一个测序反应完成后,通过活化3’端羟基便进行下一个测序反应,实现循环测序。也就是说每进行一个测序反应,待测序列就可以获得(XY)或者(WZ)这样的一个编码,进行若干个测序反应,便获得若干个由这些编码构成测序信息。很明显这些编码信息并未直接给出具体的碱基信息,但在DNA存储中,如果采取简单的二进制编码,那么DNA编码序列的读取也不需要涉及具体的碱基信息,通过将一组核苷酸组合循环测序的(XY)、(WZ)编码转化为1、0编码,就可用于DNA存储信息的读取,提高DNA存储信息的读取速度。当需要读取待测序列的具体碱基信息时,通过两组及其两组以上的不同核苷酸组合循环测序获得的两组及其两组以上编码信息、并对其进行解码便可以获得待测核酸片段的具体碱基信息。
以下进行进一步的解释说明:
(1)
(2)
(3)
以上是本发明一种单色标记的核苷酸合成测序对包含3’-CGTCACGTGG-5’的模板DNA序列的测序信息的结果。(1)为(A*、G*、C、T)循环合成测序的信息。其中,第一行为测序反应进行的个数;第二行为每个测序反应得到的编码信息;第三行为测序编码信息转换的二进制编码信息。(2)为(A*、G*、C、T),(A*、C*、G、T)两组单色标记的核苷酸循环合成测序信息及其解码结果。其中,第一行是(A*、G*、C、T)每个合成测序反应获得的对应编码测序信息:在单次测序反应中,同时加入A*、G*、C、T,其中A*和G*用同一标记物(如Cy5等)标记,C和T不作标记,通过扫描标记物信息强度,得到一个编码(AG)或者(CT)。第二行是(A*、C*、G、T)每个合成测序反应获得的对应编码测序信息:在单次测序反应中,同时加入A*、C*、G、T,其中A*和C*用同一标记物(如Cy5等)标记,G和T不作标记,通过扫描标记物信息强度,得到一个编码(AC)或者(GT)。第三行为第一、二行编码信息的解码结果:解码即从两组对应编码中选出相同的碱基即可。(3)为(A*、G*、C、T)/(A*、C*、G、T),(A*、T*、C、G)/(A*、G*、C、T)两组单色标记的核苷酸循环合成测序信息及其解码结果。其中,第一行是(A*、G*、C、T)/(A*、C*、G、T)每个合成测序反应获得的对应编码测序信息:即在奇数次的单次测序反应中,同时加入A*、G*、C、T,通过扫描标记物信息强度,得到一个编码(AG)或者(CT);在偶数次的单次测序反应中,同时加入A*、C*、G、T,通过扫描标记物信息强度,得到一个编码(AC)或者(GT)。第二行是(A*、T*、C、G)/(A*、G*、C、T)每个合成测序反应获得的对应编码测序信息:即在奇数次的单次测序反应中,同时加入A*、T*、C、G,通过扫描标记物信息强度,得到一个编码(AT)或者(CG);在偶数次的单次测序反应中,同时加入A*、G*、C、T,通过扫描标记物信息强度,得到一个编码(AG)或者(CT)。第三行为第一、二行编码信息的解码结果:解码即从两组对应编码中选出相同的碱基即可。
以上是本发明单次扫描双色标记核苷酸合成测序对包含3’-CGTCACGTGG-5’的模板DNA序列测序信息及其解码碱基序列结果。其中,所有核苷酸均为3’端羟基可逆封闭的脱氧核苷酸,核苷酸标注*1表示一种标记(如颜料Cy3),*2表示另一种标记(如颜料Cy5),这两种颜料在激发光作用下可以同时收集两种颜料的发射光强度,即单次扫描可以获得两种不同颜料的标记强度。在(A*1、G*1、C*2、T*2)/(A*1、C*1、G*2、T*2)的循环测反应为,在奇数次的单次测序反应中,同时加入A*1、G*1、C*2、T*2进行延伸反应,通过单次扫描获得两种不同标记物信息强度,得到一个编码(AG)或者(CT);在偶数次的单次测序反应中,同时加入A*1、C*1、G*2、T*2,通过单次扫描获得两种不同标记物信息强度,得到一个编码(AC)或者(GT)。在(A*1、T*1、C*2、G*2)/(A*1、G*1、C*2、T*2)的循环测反应为,在奇数次的单次测序反应中,同时加入A*1、T*1、C*2、G*2,通过单次扫描获得两种不同标记物信息强度,得到一个编码(AT)或者(CG);在偶数次的单次测序反应中,同时加入A*1、G*1、C*2、T*2,通过单次扫描获得两种不同标记物信息强度,得到一个编码(AG)或者(CT)。然后通过比较两组对应编码中选出相同的碱基即完成对测序信息的解码,得到具体的碱基信息。
有益效果:本发明具有如下优势:
1.采用单色标记的方法进行测序反应,不仅能减少由于不同标记物信息发生重迭产生干扰而造成的测序错误,同时能减少测序仪所需要的光学等器件,降低测序仪器的制造成本。
2.由于每增加一种标记就需要花费采集该标记物的扫描时间,因此采用单色标记的方法比传统四色标记进行测序反应能够减少75%的扫描时间,从而有效缩短测序所需时长。
3.本发明采用3’端可逆封闭苷酸进行合成测序,可以消除现有合成测序对同聚物片段的测序错误,大大提高序列测定的准确性。
4.本发明采用的一种标记物标记两种不同碱基的编码技术,这与DNA存储中,采取简单的二进制编码碱基信息完全对应,因此通过将一组核苷酸组合循环测序的编码信息转化为1、0编码,就可用于DNA存储信息的读取,提高DNA存储信息的读取速度。
5.本发明采用的是双碱基编码同一标记技术,通过两组测序信息来对应一个碱基、而不是传统的一组测序信息对应一个碱基,这样每个碱基都会被检测两次,因此出错率明显降低。当采用两组循环测序(其中至少有一组采用两种不同核苷酸合成循环测序)、或者两组以上测序时,测序信息具有校正功能。
6.本发明适用面广,可以直接采用商品化的3’端可逆封闭核苷酸进行合成测序,可以大大降低测序成本;也可以与现有合成测序平台兼容,且可以根据使用的标记物对仪器进行简化,降低测序仪成本。
具体实施方式
本实施例是单色荧光标记的3’端羟基可逆封闭核苷酸合成测序法测定人全基因组:
1.核苷酸单体及其单色标记的核苷酸单体:分别合成或者市场购买下列3’端羟基可逆封闭核苷酸:3’-O-N3-dATP,3’-O-N3-dTTP,3’-O-N3-dCTP,3’-O-N3-dGTP(分别用A、T、C、G表示);3’-O-N3-dATP-Cy5,3’-O-N3-dCTP-Cy5,3’-O-N3-dGTP-Cy5(分别用A*、C*、G*表示)。
2.人全基因组模板制备:按照文献(Shendure J,et al.Science,2005,309(5741):1728-1732)制备人的全基因组测序模板。将人基因组用酶切割(或者超声破碎)成大小为50~1000碱基的片段,并在连接酶的作用下将这些片段化核酸序列用一对通用连接子进行连接,其中的一个通用连接子的寡核酸序列与扩增引物的序列完全互补,而另一个连接子的寡核酸序列包含了所有测序引物的序列信息。将这些连接臂连接的片段化核酸序列与固定连接子互补序列到微珠进行乳液并行PCR反应,扩增片段化的人全基因组。并将这些微珠固定到平板基片上,通过酶切或者变性得到人全基因组测序模板。
3.测序引物的杂交:将5’端固定的模板与能和3’端连接子互补的引物杂交,杂交引物作为所有人全基因组DNA模板的测序引物。
4.测序:
第一组测序反应:将5’端固定的模板与能和3’端连接子互补的引物杂交。
(1)同时将Cy5标记的3’端羟基可逆封闭的核苷酸(A*+G*)/(A+G)按照2:1的浓度(单个未标记单体浓度为50uM)和单体浓度为50uM未标记荧光染料的3’端羟基可逆封闭的核苷酸(C+T)加到反应体系中进行合成测序反应,反应完成后进行扫描分析,得到一个碱基编码(AG)或者(CT)。
(2)加入100mM TCEP(pH=9)65℃下孵育10min,切除掉3’端的叠氮基团,活化3’端羟基。
(3)按照上述(1)~(2)步骤循环进行合成测序,得到一组由编码(AG)、(CT)构成的测序信息。然后再进行第二组测序反应。
第二组测序反应:清除第一组测序反应中的测序引物,得到单链DNA模板,然后再一次与测序引物进行杂交。
(1)同时将Cy5标记的3’端羟基可逆封闭的核苷酸(A*+C*))/(A+C)按照2:1的浓度(单个未标记单体浓度为50uM)和单体浓度为50uM未标记荧光染料的3’端羟基可逆封闭的核苷酸(G+T)加到反应体系中进行合成测序反应,反应完成后进行扫描分析,得到一个碱基编码(AC)或者(GT)。
(2)加入100mM TCEP(pH=9)65℃下孵育10min,切除掉3’端的叠氮基团,活化3’端羟基。
(3)按照上述(1)~(2)步骤循环进行合成测序,得到一组由编码(AC)、(GT)构成的测序信息。
5.解码:利用每个模板两组测序中得到碱基片段的编码信息,解码组装出相应的碱基序列信息。
6.序列组装:利用所有模板的碱基序列信息,组装成人全基因组序列。
Claims (6)
1.一种3’端羟基可逆封闭核苷酸合成测序法,其特征在于:包括如下步骤:
(1)准备3’端羟基可逆封闭核苷酸单体并进行单色标记;
(2)人全基因组模板制备:将人基因组制成碱基片段,将这些片段化核酸序列用一对通用连接子进行连接,其中的一个通用连接子的寡核酸序列与扩增引物的序列完全互补,而另一个连接子的寡核酸序列包含了所有测序引物的序列信息,将这些连接臂连接的片段化核酸序列与固定连接子互补序列到微珠进行乳液并行PCR反应,扩增片段化的人全基因组,通过酶切或者变性得到人全基因组测序模板;
(3)测序引物的杂交:将5’端固定的模板与能和3’端连接子互补的引物杂交,杂交引物作为所有人全基因组DNA模板的测序引物;
(4)测序:
第一组测序反应:将5’端固定的模板与能和3’端连接子互补的引物杂交,得到一组由编码AG、CT构成的测序信息;
第二组测序反应:清除第一组测序反应中的测序引物,得到单链DNA模板,然后再一次与测序引物进行杂交,得到一组由编码AC、GT构成的测序信息;
(5)解码:利用每个模板两组测序中得到碱基片段的编码信息,解码组装出相应的碱基序列信息;
(6)序列组装:利用所有模板的碱基序列信息,组装成人全基因组序列;
所述步骤(4)中的测序反应包括单色标记或单次扫描双色标记核苷酸合成测序;
单色标记的核苷酸合成测序:测序反应由四种3’端羟基可逆封闭的脱氧核苷酸单体同时进行,其中X、Y两个不同的脱氧核苷酸单体用同一种标记物标记记为X*、Y*,X、Y为碱基A、G、C、T四种中的两种,另外两个脱氧核苷酸Z、W不标记,Z、W为碱基A、G、C、T四种中除X、Y对应两种外的剩余两种,每次测序反应最多产生一个核苷酸的合成,通过比较标记物信息强度与背景数值,得到一个测序编码信息XY或者ZW,然后活化3’端羟基进行下一个测序反应,整个测序包括对同一模板进行若干个测序反应,并获得由XY、WZ这些编码构成测序信息;X*、Y*、W和Z四种碱基,形成三种独立的不同核苷酸组合:(A*、G*、C、T),(A*、C*、G、T),(A*、T*、C、G)与对应的(C*、T*、A、G),(G*、T*、A、C),(G*、C*、A、T)产生相同的测序信息,每种组合可以单独用于一组循环测序,也可以两种或者两种以上的组合按照给定的规则或顺序进行一组循环测序;所述测序信息是通过比较测序反应的单色标记信息强度与背景数值而获得:当单色标记强度的数值高于背景数值,则测序信息为标记单体核苷酸组合的编码XY;当单色标记强度与背景数值接近,则未标记的两核苷酸组合编码WZ即为测序信息;
单次扫描双色标记核苷酸合成测序:在(A*1、G*1、C*2、T*2)/(A*1、C*1、G*2、T*2)的循环测序反应为,在奇数次的单次测序反应中,同时加入A*1、G*1、C*2、T*2进行延伸反应,通过单次扫描获得两种不同标记物信息强度,得到一个编码AG或者CT; 在偶数次的单次测序反应中,同时加入A*1、C*1、G*2、T*2, 通过单次扫描获得两种不同标记物信息强度,得到一个编码AC或者GT;在(A*1、T*1、C*2、G*2)/(A*1、G*1、C*2、T*2)的循环测序反应为,在奇数次的单次测序反应中,同时加入A*1、T*1、C*2、G*2,通过单次扫描获得两种不同标记物信息强度,得到一个编码AT或者CG;在偶数次的单次测序反应中,同时加入A*1、G*1、C*2、T*2,通过单次扫描获得两种不同标记物信息强度,得到一个编码AG或者CT,然后通过比较两组对应编码中选出相同的碱基即完成对测序信息的解码,得到具体的碱基信息,其中,*1表示一种标记,*2表示另一种标记。
2.根据权利要求1所述的3’端羟基可逆封闭核苷酸合成测序法,其特征在于:所述3’端羟基是被3'-O-叠氮甲基、3'-O-烯丙基、3’-O-乙烯丙基、3'-O-氨基基团可逆封闭。
3.根据权利要求1所述的3’端羟基可逆封闭核苷酸合成测序法,其特征在于:一组核苷酸组合循环测序可以获得待测核酸片段的编码信息,可用于DNA存储信息的读取。
4.根据权利要求1所述的3’端羟基可逆封闭核苷酸合成测序法,其特征在于:所述解码两组或者两组不同核苷酸组合循环测序的编码信息,可以获得待测核酸片段的具体碱基信息。
5.根据权利要求1所述的3’端羟基可逆封闭核苷酸合成测序法,其特征在于:所述标记物包括量子点及具有光、电、磁可以测定特定信息的物质。
6.根据权利要求1所述的3’端羟基可逆封闭核苷酸合成测序法,其特征在于:包括聚合酶介导的延伸反应测序以及连接酶介导的连接测序,在连接测序中测序探针为一段特定的寡核苷酸序列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011152063.0A CN112280842B (zh) | 2020-10-23 | 2020-10-23 | 一种3’端羟基可逆封闭核苷酸合成测序法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011152063.0A CN112280842B (zh) | 2020-10-23 | 2020-10-23 | 一种3’端羟基可逆封闭核苷酸合成测序法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112280842A CN112280842A (zh) | 2021-01-29 |
CN112280842B true CN112280842B (zh) | 2023-10-27 |
Family
ID=74424881
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011152063.0A Active CN112280842B (zh) | 2020-10-23 | 2020-10-23 | 一种3’端羟基可逆封闭核苷酸合成测序法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112280842B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106434866A (zh) * | 2016-07-25 | 2017-02-22 | 东南大学 | 一种3’端可逆封闭的两核苷酸实时合成测序方法 |
-
2020
- 2020-10-23 CN CN202011152063.0A patent/CN112280842B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106434866A (zh) * | 2016-07-25 | 2017-02-22 | 东南大学 | 一种3’端可逆封闭的两核苷酸实时合成测序方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112280842A (zh) | 2021-01-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10662473B2 (en) | Methods and compositions for efficient base calling in sequencing reactions | |
ES2873850T3 (es) | Bibliotecas de secuenciación de próxima generación | |
EP2768972B2 (en) | Methods and compositions for nucleic acid sequencing | |
ES2889875T3 (es) | Secuenciación a partir de cebadores múltiples para incrementar la velocidad y la densidad de los datos | |
ES2626058T3 (es) | Cebadores y métodos de amplificación | |
CN102634586B (zh) | 一种两核苷酸实时合成dna解码测序方法 | |
CN102329884B (zh) | 两核苷酸同时合成dna测序方法及其应用 | |
CN1932033A (zh) | 基于微阵列芯片的核酸测序方法 | |
JP2005537030A (ja) | 核酸を分析する方法 | |
US20170357665A1 (en) | Systems and methods for genomic manipulations and analysis | |
CN101633961B (zh) | 循环“连接-延伸”基因组测序法 | |
ES2701750T3 (es) | Procedimientos para secuenciar un ácido nucleico | |
Guzvic | The History of DNA Sequencing/ISTORIJAT SEKVENCIRANJA DNK | |
CN106434866B (zh) | 一种3’端可逆封闭的两核苷酸实时合成测序方法 | |
CN108165618B (zh) | 一种包含核苷酸和3’端可逆封闭核苷酸的dna测序方法 | |
CN107849598B (zh) | 簇中的表面引物的增强利用 | |
JP3949378B2 (ja) | ポリヌクレオチド配列の変異を決定するための方法 | |
CN112280842B (zh) | 一种3’端羟基可逆封闭核苷酸合成测序法 | |
CN101693918B (zh) | 一种提高核酸内切酶v切割位置特异性的方法 | |
CN105219865B (zh) | 一种基于三色荧光标记的核酸测序方法 | |
CN1414110A (zh) | 利用具有3'至5'外切酶活性的多聚酶进行基因序列分析 | |
CN115323043A (zh) | 一种基于核苷酸二聚体为单体的合成测序方法 | |
WO2024106109A1 (ja) | 電気泳動の移動度を改変する修飾基質を用いた遺伝子検出 | |
CN112840405A (zh) | 允许快速和永久擦除的基于杂交的dna信息存储 | |
Gaikwad | Source of Genomic Resources-The genome sequencing facility |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |