CN116574790A - 一种多核苷酸的测序方法 - Google Patents
一种多核苷酸的测序方法 Download PDFInfo
- Publication number
- CN116574790A CN116574790A CN202310344371.0A CN202310344371A CN116574790A CN 116574790 A CN116574790 A CN 116574790A CN 202310344371 A CN202310344371 A CN 202310344371A CN 116574790 A CN116574790 A CN 116574790A
- Authority
- CN
- China
- Prior art keywords
- sequencing
- reaction
- reagent
- nucleotide monomers
- cycle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 373
- 108091033319 polynucleotide Proteins 0.000 title claims abstract description 20
- 102000040430 polynucleotide Human genes 0.000 title claims abstract description 20
- 239000002157 polynucleotide Substances 0.000 title claims abstract description 20
- 238000006243 chemical reaction Methods 0.000 claims abstract description 143
- 239000002773 nucleotide Substances 0.000 claims abstract description 129
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 129
- 239000000178 monomer Substances 0.000 claims abstract description 84
- 238000000034 method Methods 0.000 claims abstract description 72
- 239000003153 chemical reaction reagent Substances 0.000 claims description 133
- 238000009826 distribution Methods 0.000 claims description 13
- 238000012937 correction Methods 0.000 claims description 12
- 150000007523 nucleic acids Chemical group 0.000 claims description 5
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 3
- 239000000758 substrate Substances 0.000 abstract description 25
- 238000011084 recovery Methods 0.000 abstract 1
- 239000012071 phase Substances 0.000 description 70
- 238000005070 sampling Methods 0.000 description 35
- 108020004414 DNA Proteins 0.000 description 32
- 239000000243 solution Substances 0.000 description 28
- 238000002347 injection Methods 0.000 description 20
- 239000007924 injection Substances 0.000 description 20
- 230000008569 process Effects 0.000 description 17
- 239000012295 chemical reaction liquid Substances 0.000 description 8
- 238000006911 enzymatic reaction Methods 0.000 description 8
- 238000010348 incorporation Methods 0.000 description 8
- 238000012360 testing method Methods 0.000 description 8
- 241000894007 species Species 0.000 description 7
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 6
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 6
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 6
- 238000012165 high-throughput sequencing Methods 0.000 description 5
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000005406 washing Methods 0.000 description 4
- 229930024421 Adenine Natural products 0.000 description 3
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 3
- 229960000643 adenine Drugs 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 229940104302 cytosine Drugs 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 108090000623 proteins and genes Proteins 0.000 description 3
- 229940113082 thymine Drugs 0.000 description 3
- 229940035893 uracil Drugs 0.000 description 3
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 230000004544 DNA amplification Effects 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 2
- 235000011180 diphosphates Nutrition 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 239000012535 impurity Substances 0.000 description 2
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 2
- 235000019341 magnesium sulphate Nutrition 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 239000011541 reaction mixture Substances 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 238000005842 biochemical reaction Methods 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000007812 electrochemical assay Methods 0.000 description 1
- 238000001917 fluorescence detection Methods 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- -1 hydrogen ions Chemical class 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 239000004005 microsphere Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000005257 nucleotidylation Effects 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 231100000812 repeated exposure Toxicity 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 238000007086 side reaction Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开一种多核苷酸的测序方法。在多碱基底物进行测序的时候,特别是每次进入可检测标记的两种不同的核苷酸单体的时候,在部分的测序反应中,将其中的一种核苷酸单体去除,从而达到降低失相造成的信号偏差的目的。相比于现有技术,在长读长的条件下,依然可以得到较高的主相位比例,即较低的失相程度,具有较高的信噪比,更有利于信号的复原。
Description
技术领域
本发明涉及一种多核苷酸的测序方法,属于基因测序领域。
背景技术
在第二代基因测序技术中,目前通常采用的方案的都是边合成边测序(SBS)的方法,需要借助化学反应过程,不同的碱基反应释放出不同的信号,通过检测这些信号来判断所测到的碱基序列是什么。
在测序过程中,需要大量相同的DNA分子同时反应来放大信号。但是由于化学反应存在反应不完全的情况,会造成少量DNA分子比其他分子落后,即滞后(或称lag);由于底物的中的杂质,也会造成少量DNA分子比其他分子反应超前(或称lead)。由于超前和滞后反应的存在,同一克隆的分子之间的测序反应逐渐丧失同步性,即失相,失相会随着测序反应的进行而积累,最终将对碱基识别(base calling)造成严重干扰,缩短了测序读长。
Ion torrent的专利(CN201610091056.1)试图通过改变4种核苷酸的进样顺序来缓解失相所造成的信号偏差。例如的,使用改进的12轮循环进样流程:AGA-TCT-GAG-CTC。其特点是每12轮循环由4组“XYX”形式的进样流程组成,每组中重复加入的X使滞后序列进一步延伸,缓解了失相问题。但是在2+2简并测序中,以MK测序为例,正常的进样顺序是MKMKMKMKMK或者KMKMKMKMKM,由于信号的特殊性,不再能通过改变进样顺序来缓解失相导致的信号偏差。因此,需要开发一种适用于2+2简并测序的测序方法以缓解失相导致的信号偏差。
发明内容
本发明公开一种多核苷酸的测序方法,其特征在于,包括:
提供多条固定的多核苷酸模板链;
提供测序试剂,按照预先测序反应顺序进行反应;在所述预先测序反应顺序中,主要包括两种不同的测序试剂:第一测序试剂和第二测序试剂;在测序反应循环中,两种测序试剂交替循环加入;其中所述第一测序试剂包含具有可检测标记的两种不同的核苷酸单体;所述第二测序试剂包含具有可检测标记的两种不同的核苷酸单体,且所述两种不同的核苷酸单体不同于所述第一测序试剂中存在的所述核苷酸单体,并且其中所述第二测序试剂是在提供了所述第一测序试剂随后提供的,将所述核苷酸单体掺入所述多核苷酸之后检测所述可检测标记生成的信号;
在预先选定的部分测序反应循环中,通入的测序试剂仅包含按照所述预先测序反应顺序应加入的测序试剂中的两种核苷酸单体中的一种;
所述测序反应指的是3’端不封闭的测序反应。
根据优选的实施方式,第一测序试剂包含A,C,第二测序试剂包含G,T;当预先选定的测序反应循环按照预先反应顺序应加入第一测序试剂时,该测序试剂可以只包含A或者只包含C;当预先选定的测序反应循环原本应加入第二测序试剂时,该测序试剂可以只包含G或者只包含T。
根据优选的实施方式,第一测序试剂包含A,G,第二测序试剂包含C,T;当预先选定的测序反应循环按照预先反应顺序应加入第一测序试剂时,该测序试剂可以只包含A或者只包含G;当预先选定的测序反应循环原本应加入第二测序试剂时,该测序试剂可以只包含C或者只包含T。
根据优选的实施方式,第一测序试剂包含A,T,第二测序试剂包含C,G;当预先选定的测序反应循环按照预先反应顺序应加入第一测序试剂时,该测序试剂可以只包含A或者只包含T;当预先选定的测序反应循环原本应加入第二测序试剂时,该测序试剂可以只包含C或者只包含G。
根据优选的实施方式,所述部分测序反应循环占所有反应循环的比例不高于35%,优选的不高于25%。
根据优选的实施方式,在预先选定的部分测序循环中,加入的一种核苷酸单体共有一种核苷酸,选自A,G,C,T(或U),且所述一种核苷酸单体的分布是近似均匀的。
根据优选的实施方式,在预先选定的部分测序循环中,加入的一种核苷酸单体共有两种核苷酸,选自A,G,C,T(或U),且所述两种核苷酸单体的数量是接近的,两种核苷酸单体的分布是近似均匀的。
根据优选的实施方式,在预先选定的部分测序循环中,加入的一种核苷酸单体共有三种核苷酸,选自A,G,C,T(或U),且所述三种核苷酸单体的数量是接近的,三种核苷酸单体的分布是近似均匀的。
根据优选的实施方式,在预先选定的部分测序循环中,加入的一种核苷酸单体共有四种核苷酸,选自A,G,C,T(或U),且四种核苷酸单体的数量是接近的,A,G,C,T(或U)四种核苷酸单体的分布是近似均匀的。
根据优选的实施方式,在预先选定的部分测序循环中,相邻的奇数测序循环加入的不是同一种类的核苷酸单体,相邻的偶数测序循环加入的不是同一种类的核苷酸单体。
根据优选的实施方式,所述预先选定的部分测序反应循环不是连续的反应循环。
根据优选的实施方式,所述预先选定的部分测序反应循环是连续的反应循环。
本发明还公开一种对核酸序列信息进行校正的方法,其特征在于,根据前述任一项的方法测序得到测序信号,并对测序信号进行错误校正。
本发明的有益之处
本发明能够在2+2简并测序的条件下,用部分单碱基进样来替换简并碱基进样以降低失相造成的信号偏差,相比于现有技术,具有如下优势:
1.在长读长的条件下,依然可以得到较高的主相位比例,即较低的失相程度,具有较高的信噪比,更有利于信号的复原,有利于进行更精确的base calling,具备了实现超长读长测序的可能性。
2.本方法还能够兼容错误校正编码方法,借助此校正方法进一步提高测序准确度,进而得到高准确度的长读长序列。
附图说明
附图示出了一个或多个示例性方面,并用于解释各种示例性方面的原理。附图仅仅是示例性和解释性的,不应被解释为以任何方式进行限制。
图1.测序过程可能发生的超前和滞后错误的示意图。
图2.本发明实施方式的测序主相位比例结果图,图2A为使用常规进样流程的结果,图2B为使用本发明的进样流程的结果,图中横坐标为循环数,纵坐标指示主相位比例,比较两图可以看出,使用本发明的进样流程可以大大减缓失相,在靠后的测序循环反应进行时依然能够维持较高的主相位比例。
图3.本发明实施方式的利用传统2+2简并碱基进样流程测序后的待测序列1的理想测序信号和真实测序信号图。
图4.本发明实施方式的使用MKMKMGMKMKMTMKMKAKMKMKCK flow下待测序列1的理想测序信号和真实测序信号图。
图5.本发明实施方式的信号合并后的待测序列1的理想测序信号和真实测序信号图。
图6.本发明实施方式的利用传统2+2简并碱基进样流程测序后的待测序列2的理想测序信号和真实测序信号图。
图7.本发明实施方式的使用MKMKMGAKMKMTCK flow下待测序列2的理想测序信号和真实测序信号图。
图8.本发明实施方式的信号合并后的待测序列2的理想测序信号和真实测序信号图。
图9.本发明实施方式的利用传统2+2简并碱基进样流程测序后的待测序列3的理想测序信号和真实测序信号图。
图10.本发明实施方式的使用MKMKMGATCKMKMK flow下待测序列3的理想测序信号和真实测序信号图。
图11.本发明实施方式的信号合并后的待测序列3的理想测序信号和真实测序信号图。
具体实施方式
当前主流的高通量测序技术大多采用边合成边测序的方式,且会将每一条待测DNA分子扩增成多条DNA组成的簇,从而放大可检测信号。理想情况下,一簇DNA中的每个分子在测序过程中都是同步的,所以周期性反应所获得的测序信号就直接反映出待测DNA的序列信息。然而,在真实的测序体系中,各个分子间从来都不是完美同步的。由于反应不完全或者反应体系中杂质引起的副反应,一簇DNA中的各个分子会逐渐失去同步性,反映到测序过程中,就会使测序信号变得紊乱,而无法直接反映DNA的序列信息。这一现象称为“失相”,即分子间信号“相位”的失谐。失相问题极大地限制了高通量测序的读长和准确性。本发明提供一种测序方法,可以缓解失相,提高测序的读长。
除非本文另外特别指出,本文所用的核酸化学,生物化学,遗传学和分子生物学的术语和符号遵循本领域的标准文章和文本的术语和符号。
术语解释
边合成边测序(合成测序)
通常,合成测序(SBS)可以指通过聚合酶延伸反应确定靶多核苷酸的核苷酸序列的方法。在各种实施方案中,所述方法序列可以以任何合适的方式提供一个或多个模板多核苷酸链。在一些实施方案中,模板链被固定,例如的,可以偶联到载体上或与载体相关联,常见的载体包括微粒,珠粒,微球,磁球等,并被装载到反应室中。在其它实施方案中,模板多核苷酸链可以与底物表面结合,与载体偶联或不偶联。
3’端不封闭的测序反应
指的是测序反应的核苷酸底物的3’端不是封闭的,而是包含可以自由延伸的羟基,在一个测序反应循环中,掺入的核苷酸底物可以是一种或两种。
2+2测序
或称2+2简并测序,本发明所指的2+2简并测序中,包括两种不同的测序试剂:即第一测序试剂和第二测序试剂;第一和第二测序试剂循环加入;其中第一测序试剂包含具有可检测标记的两种不同的核苷酸单体;第二测序试剂包含具有可检测标记的两种核苷酸单体,且所述两种核苷酸单体不同于第一测序试剂中存在的所述核苷酸单体,并且其中第二测序试剂是在提供了第一测序试剂随后提供的,将核苷酸单体掺入所述文库之后检测可检测标记生成的荧光信号。其中,第一测序试剂和第二测序试剂中的核苷酸单体选自由以下组合组成的组:
1)一种测序试剂中的腺嘌呤(A)核苷酸单体和胸腺嘧啶(T)/尿嘧啶(U)核苷酸单体以及另一种测序试剂中的胞嘧啶(C)核苷酸单体和鸟嘌呤(G)核苷酸单体;
2)一种测序试剂中的腺嘌呤(A)核苷酸单体和鸟嘌呤(G)核苷酸单体以及另一种测序试剂中的胞嘧啶(C)核苷酸单体和胸腺嘧啶(T)/尿嘧啶(U)核苷酸单体;和
3)一种测序试剂中的腺嘌呤(A)核苷酸单体和胞嘧啶(C)核苷酸单体以及另一种测序试剂中的鸟嘌呤(G)核苷酸单体和胸腺嘧啶(T)/尿嘧啶(U)核苷酸单体。
可检测标记
本发明中的标记指的是生色的、生荧光的、或是化学发光的分子、质量标记、电化学标记或其组合。质量标记是适合于质谱仪的小分子量部分,由于质量不同而很容易区别于其他组分。电化学标记是容易氧化或还原的物种。它们允许可测定的物种通过存在的任何一个颜色、荧光发射、化学发光、质量变化、电化学测定或其组合被测定。在各种方法中,所检测的产物或组分的量可以与所掺入的核苷酸的数量单调相关。
测序反应循环
测序反应循环,或简称为cycle,指的是将一种特定的测序试剂加入芯片进行核苷酸延伸反应,进行测序信号采集,反应后进行洗脱,即为一个cycle。在一种测序试剂中,可以只包含一种核苷酸单体,即A,G,C,或T(或U)中的一种,或者包含两种核苷酸单体(选自A,G,C,T(或U))。
简并碱基
根据IUPAC的核酸符号,用表1中的字母表示本发明中的简并碱基。例如,M代表A和/或C碱基。M进样流程指的是,本次测序试剂中的底物为M简并碱基。
表1.表示简并碱基的字母
字母 | 所代表的碱基 |
M | AC |
K | GT |
R | AG |
Y | CT |
W | AT |
S | CG |
B | CGT |
D | AGT |
H | ACT |
V | ACG |
反应室
本文中,反应室指的是在其中可以限制反应的任何区域,包括,例如的,“微阱”、“微坑”、“孔”和“微孔”(以上名词可互换使用)。反应室可以包括:其中固体衬底的物理或化学属性可以允许目标反应的局部化,和衬底表面上的可以特异性地结合目标分析物的不连续区域(诸如具有与这样的表面共价连接的寡核苷酸的不连续区域)等。反应室可以是中空的,或者具有界限清楚的形状和体积,所述形状和体积可以生产在衬底中。这些后述类型的反应室在本文中被称作微孔或微坑,可以使用任意合适的微型制造技术来制造,且可以具有可根据特定用途选择的体积、形状、高径比(例如,基底宽度与孔深度之比)和其它尺寸特征,所述特定用途包括发生的反应的性质以及采用的试剂、副产物和标记技术(如果有的话)。反应室也可以是在没有孔的衬底上的基本上平坦的区域等。反应室可以排列为阵列,所述阵列可以是元件(例如的,微孔)的基本上平面的一维或二维排列。二维阵列的列(或行)的数目可以相同或不同。优选地,所述阵列包含至少100,000个室。反应室的阵列还可以是在没有孔的基本上平坦的衬底上的不连续区域的阵列。
测序试剂
本文中,“测序试剂”通常表示含有反应进行所必需的任何反应物的溶液,反应物可以包括,例如的,在反应过程中维持预定pH的缓冲剂、盐、酶、辅因子、清除剂等。重要的,测序试剂中包含核苷酸单体底物分子,本发明中的测序试剂包含一种或两种核苷酸单体。
失相
基于DNA扩增的高通量测序技术中一个不可避免的限制因素是失相(dephasing),即一批相同序列的DNA分子的新生链在合成过程中失去同步性。这主要是由预期之外的核苷酸被聚合酶掺入或不完全延伸所造成。为了放大测序信号,高通量测序技术普遍在测序前将待测DNA进行扩增,形成DNA团簇。理想情况下,同一DNA分子扩增形成的团簇中的所有分子在测序的每一轮都应被合成出同样长度的新生链,这样测序信号与被合成的新生链一一对应,可以获得序列信息。然而,实际测序中,由于错配或杂质核苷酸的存在,DNA团簇中一部分分子的延伸长度高于预期值,造成“超前”(lead);一部分分子因反应不完全而未被聚合酶延伸,延伸长度低于预期值,造成“滞后”(lag)。超前和滞后使得DNA团簇中的分子具有不同的延伸长度,而这一差异会随着测序反应的进行而不断增大,使得测序信号与实际序列之间的关系越来越弱,造成测序错误,严重限制读长的增加。在基于DNA扩增的高通量测序技术中,失相是限制测序读长的主要原因之一。例如的,若某一DNA新生链已延伸至第n个碱基,当前酶促反应中所加入的核苷酸恰好和待测DNA模板上的第n+1至第n+m个碱基互补配对,则理想情况下,在该次酶促反应中该DNA新生链将延伸至第n+m个碱基。如果该DNA新生链在该次酶促反应中实际延伸超过了第n+m个碱基,则称该DNA新生链在该次反应中发生超前现象(如图1的“超前”部分图像所示);如果该DNA新生链在该次酶促反应中实际延伸不足第n+m个碱基,则称该DNA新生链在该次酶促反应中发生滞后现象(如图1的“滞后”部分图像所示)。超前现象和滞后现象合称失相现象。对于在该次酶促反应中实际延伸至第n+m个碱基的DNA新生链,其所处的相位为主相位。主相位对应的新生链的数目与该次酶促反应中所有新生链的总数之比即称作主相位比例,以图1所示为例,此次酶促反应共延伸6条新生链,其中4条是主相位,2条为失相相位,则主相位比例为66.7%。图1中所画6个DNA分子只是简略表示,不代表实际测序中也只有6个DNA分子(实际测序中有多个DNA分子)。
上面指出了本发明中所涉及术语的一般性含义。上述术语,均为本领域的常规含义,为了避免引起歧义,再次阐述。上述术语并无特殊含义。
发明详述
在典型的测序反应中,引物与模板多核苷酸链退火以形成引物-模板双链体,聚合酶可操作地与引物-模板双链体结合,使得其能够将核苷酸掺入引物的3'端。如本文所用,“可操作结合”可以指将引物退火到模板链上,使得引物的3'端可以被聚合酶延伸,并且聚合酶结合到引物-模板双链体上,或者在其附近,以便当核苷酸底物流动时可以发生延伸。对引物-模板-聚合酶复合物进行不同核苷酸的重复暴露。如果掺入核苷酸,则检测由掺入反应产生的信号。可以进行洗涤步骤以在下一次核苷酸暴露之前除去未掺入的核苷酸。在核苷酸添加、引物延伸和信号获取的重复循环之后,可以确定模板链的核苷酸序列。本发明的核苷酸底物具有可以自由延伸的羟基,即一次核苷酸流动过程可以掺入的核苷酸的个数可能是多个,此即为3’端不封闭的测序反应。
在示例性的常规SBS方法中,四种核苷酸底物以相同的顺序被顺序地和重复地递送(流动)。例如的,以2+2测序为例,每个cycle递送的核苷酸底物有两种,以MK进样流程为例,所递送的第一种测序试剂包含两种核苷酸(A,C),然后递送第二种测序试剂,也包含两种核苷酸底物(G,T),此后重复该组合。
本发明公开的测序方法,是在常规的2+2测序的基础上对底物的进样流程做出了调整,部分测序循环中只进样一种核苷酸底物(区别于2+2测序每个测序循环均进样两种核苷酸底物),可以在特定的cycle对特定的序列的错误相位进行修正,既可以对超前相位进行校正,也可以对滞后相位进行校正。
1.对超前相位的校正举例说明如下:
第n个cycle
第n+1个cycle
第n+2个cycle
1)当测序flow进样到M时,序列的主相位停在对应的M上,但是超前相位已经进行到了下一个相位的M上,造成了信号的错误,主相位强度的缺失。
2)当测序flow进样到G时,由于待测序列的主相位待反应的碱基是G,而超前相位待反应的碱基是T,导致主相位会继续反应并释放信号,而超前相位无法继续反应则会停留在M上,不能继续前进,造成了“等待”主相位的效果。3)当测序flow进样到下一个M时,主相位和超前相位的DNA分子都会停留在同一个相位的M上,形成了相位合并。
2.对滞后相位的校正举例说明如下:
第n个cycle
第n+1个cycle
第n+2个cycle
1)当测序flow进样到M时,序列的主相位停在对应的M上,但是滞后相位还停留在上一个相位的M上,造成了信号的错误,主相位强度的缺失。
2)但是当测序flow进样到G时,由于待测序列的主相位待反应的碱基是T,而滞后相位待反应的碱基是G,导致滞后相位会继续反应并释放信号,而主相位无法继续反应则会停留在M上,不能继续前进,造成了“等待”滞后相位的效果。
3)当测序flow进样到下一个M时,主相位和滞后相位的DNA分子都会停留在同一个相位的M上,形成了相位合并。
由上述对超前和滞后错误相位的校正的两个例子可以看出,本发明的测序进样的有益效果是非常明显的,因为使用常规的2+2进样方法进行测序时,偶然发生的失相无法被及时校正回来,失相会随着测序的进行而逐渐积累,导致主相位比例逐渐降低,最终无法进行准确的碱基识别,导致测序读长的缩短。而本发明的进样方法,通过将部分测序循环的双碱基进样替换为单碱基进样,可以将偶然发生的低频失相及时校正回来,主相位比例可以维持在较高的水平,能够满足碱基识别的要求,从而大大增加测序的读长。
具体的,本发明公开一种多核苷酸的测序方法,其特征在于,
提供多条固定的多核苷酸模板链;
在测序反应中,主要包括两种不同的测序试剂:第一测序试剂和第二测序试剂;在测序反应循环中,两种测序试剂交替循环加入;其中所述第一测序试剂包含具有可检测标记的两种不同的核苷酸单体;所述第二测序试剂包含具有可检测标记的两种不同的核苷酸单体,且所述两种不同的核苷酸单体不同于所述第一测序试剂中存在的所述核苷酸单体,并且其中所述第二测序试剂是在提供了所述第一测序试剂随后提供的,将所述核苷酸单体掺入所述多核苷酸之后检测所述可检测标记生成的信号;
在预先选定的部分测序反应循环中,通入的测序试剂仅包含按照预先反应顺序应加入的第一或第二测序试剂中的两种核苷酸单体中的一种;
所述测序反应指的是3’端不封闭的测序反应。
相同的含义,本发明提供一种多核苷酸的测序方法,其特征在于,包括:
提供多条固定的多核苷酸模板链;
提供测序试剂,按照预先测序反应顺序进行反应;在所述预先测序反应顺序中,主要包括两种不同的测序试剂:第一测序试剂和第二测序试剂;在测序反应循环中,两种测序试剂交替循环加入;其中所述第一测序试剂包含具有可检测标记的两种不同的核苷酸单体;所述第二测序试剂包含具有可检测标记的两种不同的核苷酸单体,且所述两种不同的核苷酸单体均不同于所述第一测序试剂中存在的所述核苷酸单体,并且其中所述第二测序试剂是在提供了所述第一测序试剂随后提供的,将所述核苷酸单体掺入所述多核苷酸之后检测所述可检测标记生成的信号;
在预先测序反应顺序进行的部分反应中包括替代的测序反应;所述替代的测序反应中通入的测序试剂仅包含按照所述预先测序反应顺序应加入的测序试剂中的两种核苷酸单体中的一种;
所述测序反应指的是3’端不封闭的测序反应。
在优选的实施方式中,本发明采用如下方法对DNA进行测序。本发明所涉及的基因测序方法可以参考专利CN201510822361.9。将待测DNA固定在固相表面,杂交上测序引物,不断实施测序反应并检测反应所释放的信号。每一次反应包括如下步骤:向反应器(芯片)加入含有核苷酸底物、酶等反应所必需试剂的反应液,发生特定生化反应,检测反应所释放的信号,清洗反应器。所加入的核苷酸可以是天然的脱氧核苷酸,也可以是带有化学修饰基团的核苷酸,但其3’端为羟基,即可以发生自由延伸。每一次反应所加入的核苷酸种类可以为1种或2种(选自A,C,G,T(或U))。
在优选的实施方式中,第一测序试剂包含A,C,第二测序试剂包含G,T;当预先选定的测序反应循环按照预先反应顺序应加入第一测序试剂时,该测序试剂可以只包含A或者只包含C;当预先选定的测序反应循环原本应加入第二测序试剂时,该测序试剂可以只包含G或者只包含T。
在优选的实施方式中,第一测序试剂包含A,T,第二测序试剂包含C,G;当预先选定的测序反应循环按照预先反应顺序应加入第一测序试剂时,该测序试剂可以只包含A或者只包含T;当预先选定的测序反应循环原本应加入第二测序试剂时,该测序试剂可以只包含C或者只包含G。
在优选的实施方式中,第一测序试剂包含A,G,第二测序试剂包含C,T;当预先选定的测序反应循环按照预先反应顺序应加入第一测序试剂时,该测序试剂可以只包含A或者只包含G;当预先选定的测序反应循环原本应加入第二测序试剂时,该测序试剂可以只包含C或者只包含T。
以常规的MK进样流程为例说明,第一测序试剂包含(A,C),第二测序试剂包含(G,T),常规的MK进样为:MKMKMKMKMKMK…,本发明的进样顺序,例如的,可以是MKMKMKAKCKMGMTMK…,或者的,MKMKMKAGCTMKMKMK…,或者的,MKMKMKMKAKCKMKMK…,或者的,MKMKMKMKMTMGMKMK…,或者的,MKMKMKMKAKMKMGMK…,或者的,MKMKMKMKMTCKMKMK…,还可以是上述进样顺序的组合。
在优选的实施方式中,部分单碱基测序反应循环占所有反应循环的比例不高于35%,优选的不高于25%。例如的,对于长度为500bp的待测核酸序列,测通该序列需要上百个cycle,可以预先确定碱基进样顺序,并重复该进样顺序,直到将该序列测完,例如的,假设需要300个cycle,则可以预先确定长度为20或30或40或50或60…的碱基进样流,并不断重复该进样流,直到达到期望的总数;特别的,碱基进样流的长度可以与总数相等,即若总cycle为300,则可以设计长度为300的碱基进样流,而不涉及重复。可选的,还可以包括一类的碱基进样流和随后的不同类的碱基进样流,且两类流可以具有相同的长度或不同的长度。预先确定的进样流的长短并不影响本发明的实质,只要满足单碱基流所占比例不高于35%,优选的,不高于25%。
在某些实施方案中,这样的应用可以随在序列读出中的位置而变化(例如,单碱基进样可以在特定序列读出长度以后触发或增加,或者通常可以在序列读出的更晚阶段更频繁地使用),这在下述情况下可能是有用的:超前和/或滞后在读出的更晚阶段或在更长的读出中增加。
在优选的实施方式中,对于序列未知的待测序列,在预先选定的部分测序循环中,加入的一种核苷酸单体是同一种核苷酸,且该种单核苷酸的分布应近似均匀,例如的,对于MK进样流程,可以是MKMKAKMKMKAKMKMKAKMKMKAK…。
在优选的实施方式中,在预先选定的所有单碱基测序循环中,加入的核苷酸单体可以是两种核苷酸,且该两种单核苷酸的分布应近似均匀,例如的,对于MK进样流程,可以是MKMKAKMKMKCKMKMKAKMKMKCK…。本发明中所出现的用于近似均匀可以认为是一种准确的描述。在例子MKMKAKMKMKCKMKMKAKMKMKCK…中,其A与C是近似均匀即可,并不需要完全的相同的比例。例如的,MKMKAKMKMKCKMKMKAKMKMKCK更换为MKMKAKMKMKMKMKMKAKMKMKCK,虽然测序反应不同,但是并不会造成方法的根本性缺陷。另外的,上面的例子中,出现3次A与2次C也是可以接受的。实际的测序中,测序的读长可以是100-300次,在测序反应中个,替代其中的部分循环,A与C的大致比例相同。本文中的描述,近似均匀在考虑到实际测序环境,是准确的。
在优选的实施方式中,在预先选定的所有单碱基测序循环中,加入的核苷酸单体可以是三种核苷酸,且该三种单核苷酸的分布应近似均匀,例如的,对于MK进样流程,可以是MKMKAKMKCKMKMKMGMKMKAKMKCKMKMKMG…。
更优选的,在预先选定的部分测序循环中,A,G,C,T(或U)四种核苷酸单体的数量是接近的,且A,G,C,T(或U)四种核苷酸单体的分布是近似均匀的。例如的,四种核苷酸单体的数量之比接近1,优选的,四种核苷酸单体的数量相同。此外,四种核苷酸单体的分布应近似均匀,应避免出现的情况是在临近的cycle中,重复出现某种核苷酸单体,而在其余cycle中,该种核苷酸单体的频率显著低于其余的核苷酸单体。
特别的,在预先选定的部分测序循环中,相邻的奇数测序循环加入的不是同一种类的核苷酸单体,相邻的偶数测序循环加入的不是同一种类的核苷酸单体。以MK进样流程为例进行说明,对于常规的MKMKMKMKMKMK…进样顺序,当单碱基进样循环为相邻的奇数循环,即都是M时,可以是MKAKCKMKMKMK…,也可以是MKAKMKAKMKMK…,而不能是MKAKAKMKMKMK…。
虽然本发明教导的多个实施方式可以有利地与基于荧光检测的测序方法结合使用,所述基于荧光的测序方法如在本文中和中国专利CN201510822361.9所述,通过引用整体并入本文。此外,本发明的教导也可以与其他检测方法结合使用,例如的,包括通过掺入反应释放出的焦磷酸盐(PPi)的检测;基于pH检测的测序方法;还有一些可以检测与核苷酸结合的标记的合成测序技术,所述标记包括,例如的,荧光标记、质量标记、和/或化学发光标记(在该情况下,可以在工作流中在下一个合成和检测循环之前包括灭活步骤(例如的,通过化学裂解或光漂白);更一般地,还包括这样的方法:核苷酸掺入反应会产生或导致具有特定性质的产物或组分,所述性质能够被监测和用于检测掺入事件,包括,例如的,浓度(例如,焦磷酸盐和/或氢离子)和信号(例如的,荧光、化学发光、光发生)的变化,在该情况下,检测的产物或组分的量可以与掺入事件的数目等呈线性相关,从而用于核苷酸的定量测定。
测序试剂(包含核苷酸底物)的流动可以以任何合适的方式提供,包括通过移液管或通过连接到流动室的管或通道进行输送。对于每个测序试剂流,持续时间、浓度和/或其他流参数可以相同或不同。在测序循环的每个洗涤步骤中,洗涤溶液(通常具有预定的pH)用于除去前一步骤的残余底物,以防止在随后的循环中引入错误。同样,每个洗涤流的持续时间、组成和/或浓度可以相同或不同。
对于失相导致的测序结果中的序列信息错误,可以利用校正方法进行校正,申请人之前申请的专利(CN201610899880.X)详细描述了错误校正方法,在此上述专利的全文以引用的方式并入本专利。特别的,本发明所公开的测序方法可以与上述错误校正方法兼容,具体的,以MK轮测序为例,进样顺序如下:MKMKMGMKMKMTMKMKAKMKMKCKMKMKMGMKMKMTMKMKAKM KMKCK
以第一个单碱基进样cycle的G为例,可以分为以下三种情况分别进行分析:
1)此cycle对应的待测序列模板只有若干G:
MKMKMGMKMK→测序得到的信号与正常的MK进样流程中得到的信号没有区别,可以正常进行ECC校正,即按照正常的MK轮次信号处理。
2)此cycle对应的待测序列模板由T开头:
MKMKM00KMK→则可知该cycle和下一cycle都将是“零”信号,则可以将这两个cycle信号删除即可,合并两个为0的cycle,缩短2个cycle,得到正常的MK信号。
3)此cycle对应的待测序列模板由G开头,且不仅含有G:
MKMKMG0KMK→可知其下一cycle将是“零”信号,则可以将该cycle,下两个cycle,一共3个cycle合并为一个cycle进行处理即可进行ECC校正。合并G0K 3个cycle为1个K,缩短2个cycle,得到正常的MK信号。
实施例1
不同进样流程对应的主相位比例
一.MK进样流程
对于长度为500bp的模板DNA进行测序反应,测序反应包括如下步骤:
1.将测序引物杂交在已经制备好的DNA阵列上。
2.开始测序反应。可重复2.1-2.4步骤多次。
2.1.向测序反应混合物(例如,在流动池(flowcell)中)中加入第一反应液(例如,A+C),使反应进行,从荧光基团X采集荧光信号。
2.2.清洗流动池中的全部残留反应液和荧光分子。
2.3.向测序反应混合物中加入第二反应液(例如,G+T),使反应进行,采集荧光信号。
2.4.清洗流动池中的全部残留反应液和荧光分子。
3.将延伸过的测序引物解旋。
本实施例中使用的溶液可如下制备。测序反应液的清洗液包含:20Mm Tris-HClpH 8.8;10mM(NH4)2SO4;50mM KCl;2mM MgSO4;和0.1%测序反应的主溶液包含:20mM Tris-HCl pH 8.8;10mM(NH4)2SO4;50mM KCl;2mM MgSO4;0.1%/>8000单位/mL,Bst聚合酶;和100单位/mL CIP(碱性磷酸酶,牛肠)。
测序反应液如下制备:
第一反应液(简称为M):主溶液+20μM dA6P-TG+20μM dC6P-TG
第二反应液(简称为K):主溶液+20μM dG6P-TG+20μM dT6P-TG
将所制备的反应液和主溶液置于4℃冰箱或冰上待用。
为了杂交测序引物,将测序引物溶液(10μM在1×SSC缓冲液中的引物)注射到测序芯片中,加热至90℃,然后以5℃/分钟的速率冷却至40℃。然后用清洗液洗去测序引物溶液。
为进行测序反应,将测序芯片置于测序仪上。为进行使用第一组反应液的测序,按以下步骤进行:
1.加入10mL清洗液,以冲洗芯片。
2.将芯片降温至4℃。
3.加入100μL第一反应液。
4.将芯片加热至65℃。
5.等待1分钟。
6.在473nm激发激光波长下,拍摄荧光图像。
7.加入10mL清洗液,以冲洗芯片。
8.将芯片降温至4℃。
9.加入100μL第二反应液。
10.将芯片加热至65℃。
11.等待1分钟。
12.在473nm激发激光波长下,拍摄荧光图像。
13.重复1-12的步骤多次,以测序完成500bp的序列。
14.测序结果分析图参见图1,图中横坐标表示读长,纵坐标表示测序主相位比例,可见当测序读长为250bp左右时,主相位比例低于50%;测序读长的最大值在250bp左右。
二.MK部分单碱基进样
本实施例大部分操作步骤同上,在此仅说明不同的步骤:
测序反应液除了第一反应液(简称为M)和第二反应液(简称为K),还包括以下四种仅包含一种核苷酸底物的反应液,即:
第三反应液(简称为A):主溶液+20μM dA6P-TG
第四反应液(简称为C):主溶液+20μM dC6P-TG
第五反应液(简称为G):主溶液+20μM dG6P-TG
第六反应液(简称为T):主溶液+20μM dT6P-TG
简并序列的进样流程改为:MKMKMGMKMKMTMKMKAKMKMKCK
测序结果分析图参见图2,图中横坐标表示读长,纵坐标表示测序主相位比例,可见当测序读长为300bp以上时,主相位比例依然高于50%,对于大多数reads,这一比例接近60%,且测序读长的最大值在300~350bp。对比MK进样顺序的结果可明显得出,部分单碱基进样流程可以大大提高主相位比例,得到的测序reads的读长更长。
实施例2
以一条500bp序列作为待测序列1:
CGTAGAGCGTGAAGTTAGGATCGAGGCGCTAGTCTGCAGAAGGAGGTGAT
GCGTTTGTCAACAATAGCCCTTCCTTCCTTCACGCGGCCGGGCCTGTACTCT
ACTCCCAGGGAATGTAATTCCTTTGGCTGCGGGGGTGAGGTTTTACCAATA
GCCAATGTCCGTAGGAGCGCTGAGATAGGCGGTTCTATAATTAGTCTCGGA
CGGACGCCCAAGGTCTGTACCCGCAGAACGGCCGACCCTCGCTTCACCAC
GCGATGATCATATGGGGCGCTCATAAGAGGTGTTAATAACGGGCCCAACGC
ACCCTACCAGTTGCTAGCAAAGGGTTTGGGTCATGCGGAAATAGTTGAAAT
GTTGCCACATTGACACAGCACCTCGTAGTCGGCACGCGACTTAAAATGCGG
AATCCCATATGTATACTCTATCTGTCCACGGTTACGAGATCTATGCTGAGTTC
GAATAAACGATGGCACCTACTGGCGCAAGAGACACTCCCT
首先,按照实施例1的MK进样流程对上述序列1进行传统2+2测序,得到测序信号(简称为真实信号)。该flow下的理想信号和真实信号(真实信号指的是测序信号经过归一化,但未经过失相校正)如图3所示,其中,横坐标为测序循环数,纵坐标为归一化信号值,可见,对于信号值较低的测序循环,真实信号与理想信号较为接近,对于信号值较高的测序循环,真实信号与理想信号差异较大,且随着测序反应的进行,真实信号越来越偏离理想信号。
将上述MK进样流程更换为MKMKMGMKMKMTMKMKAKMKMKCK进样流程,其余实验步骤与传统2+2测序相同,对上述待测序列1进行测序,该测序的理想信号和真实信号如图4所示,可见对于所有的测序循环,真实信号与理想信号都非常接近,二者之间的微小差异对于正确的碱基读取影响不大。
在此基础上,使用信号合并的流程,部分单碱基进样流程可以得到和传统2+2flow下完全一致的理想信号,其对应的真实信号如图5所示,相对于传统2+2flow,部分单碱基进样流程的真实信号与理想信号更为接近。
实施例3
以一条500bp序列作为待测序列2:
TTTGGAGCAGGGTCCTCGCCGTCTCTCGTGAACAATCGGTTAAGCGCTTAG
GCTGCTAGAGTTACGGGTACGTTCACCCCTTCAGGCATATGGAGCCAAGCG
TGTATCCCAGAACAAGCTTGTGCACGAGCTAGTCTACGCTGGATGACATGA
GACGCCGCAGTGATGTGATCAGTGCGGAGCGAATTTATTAAGCGATGTGAC
TAGGCACCGTCACCTAATCCGCTTCGGCCAGTTGATATTTCGTTACGACATC
CGCAAATTCCGGGCATGGTGAACAAGATTAGCATGAAACATTGAGCTGTCC
CCGTTACGAAACTCGAAGACAGGAAGAATTGTTCGATCCCCCTTCCATGGT
TAATACACTCTGCCATGCCCACGGGATCGGACAGATAGCTGGACAACTCCG
TGCATCAAAACTTCTACGGGAGGTGGAGGCAAGACGCACGAACAATTGAT
TCGCCCAGGGTTGATTAGCGACCGCTGAAATAAGATAGTAG
首先,按照实施例1的MK进样流程对上述序列2进行传统2+2测序,得到测序信号(简称为真实信号)。该flow下的理想信号和真实信号如图6所示,其中,横坐标为测序循环数,纵坐标为归一化信号值,可见,对于信号值较低的测序循环,真实信号与理想信号较为接近,对于信号值较高的测序循环,真实信号与理想信号差异较大,且随着测序反应的进行,真实信号越来越偏离理想信号。
将上述MK进样流程更换为MKMKMGAKMKMTCK进样流程,其余实验步骤与传统2+2测序相同,对上述待测序列2进行测序,该测序的理想信号和真实信号如图7所示,可见对于所有的测序循环,真实信号与理想信号都非常接近,二者之间的微小差异对于正确的碱基读取影响不大。
在此基础上,使用信号合并的流程,部分单碱基进样流程可以得到和传统2+2flow下完全一致的理想信号,其对应的真实信号如图8所示,相对于传统2+2flow,部分单碱基进样流程的真实信号与理想信号更为接近。
实施例4
以一条500bp序列作为待测序列3:
TCGAGCCCAATTCCAGACTACGTTTTGTCATGACACATCTCGTGTTAAGAC
AGGTCCTAGTACCTCTCCATGTCGTTCTCAAGTAACTTGTCCATTAAATTTT
CACGTAGACTCGCGGATGAGTGATCGTTCACGTTATCAGCCGTGTTGATGA
CGGGAACCCACGATCTTATATGGAACAGAGGACTCACTATCAATGCTGCCT
GATCCGTAGTAGAGGGATCGACTAACAACATGCTAGGCAATGAGTTATCAC
GAAACTTTCCAAACCACACTCCCCCACTCCAGTGTGAAATTAAGTCCTTGA
TTGACTGGGAGACTCATTATTTAGGATGATATCGCTGTTCTTAGTGGTTCATT
CTATAAGGAAGTCCACTCCGTATTTTTAACTAAGACGCATAAGATGTTCGGT
TTAGGGTAGTTTGTTCGCCGCGTGTTCTCTTCACTTGCTCTTCAAATGGGTT
CCAGATTAGATACTATAGCGATGGGTATACCCGACG
首先,按照实施例1的MK进样流程对上述序列3进行传统2+2测序,得到测序信号(简称为真实信号)。该flow下的理想信号和真实信号如图9所示,其中,横坐标为测序循环数,纵坐标为归一化信号值,可见,对于信号值较低的测序循环,真实信号与理想信号较为接近,对于信号值较高的测序循环,真实信号与理想信号差异较大,且随着测序反应的进行,真实信号越来越偏离理想信号。将上述MK进样流程更换为MKMKMGATCKMKMK进样流程,其余实验步骤与传统2+2测序相同,对上述待测序列3进行测序,该测序的理想信号和真实信号如图10所示,可见对于所有的测序循环,真实信号与理想信号都非常接近,二者之间的微小差异对于正确的碱基读取影响不大。
在此基础上,使用信号合并的流程,部分单碱基进样流程可以得到和传统2+2flow下完全一致的理想信号,其对应的真实信号如图11所示,相对于传统2+2flow,部分单碱基进样流程的真实信号与理想信号更为接近。
以上实施例是结合具体的实施方式对本申请所作的进一步详细说明,不能认定本申请的具体实施只局限于这些说明。对于本申请所属技术领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干简单推演或替换。因此,凡是所属技术领域的普通技术人员在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。
Claims (11)
1.一种多核苷酸的测序方法,其特征在于,包括:
提供多条固定的多核苷酸模板链;
提供测序试剂,按照预先测序反应顺序进行反应;在所述预先测序反应顺序中,主要包括两种不同的测序试剂:第一测序试剂和第二测序试剂;在测序反应循环中,两种测序试剂交替循环加入;其中所述第一测序试剂包含具有可检测标记的两种不同的核苷酸单体;所述第二测序试剂包含具有可检测标记的两种不同的核苷酸单体,且所述两种不同的核苷酸单体均不同于所述第一测序试剂中存在的所述核苷酸单体,并且其中所述第二测序试剂是在提供了所述第一测序试剂随后提供的,将所述核苷酸单体掺入所述多核苷酸之后检测所述可检测标记生成的信号;
在预先选定的部分测序反应循环中,通入的测序试剂仅包含按照所述预先测序反应顺序应加入的测序试剂中的两种核苷酸单体中的一种;
所述测序反应指的是3’端不封闭的测序反应。
2.根据权利要求1所述的方法,其特征在于,第一测序试剂包含A,C,第二测序试剂包含G,T;当预先选定的测序反应循环按照预先反应顺序应加入第一测序试剂时,该测序试剂可以只包含A或者只包含C;当预先选定的测序反应循环原本应加入第二测序试剂时,该测序试剂可以只包含G或者只包含T。
3.根据权利要求1所述的方法,其特征在于,第一测序试剂包含A,G,第二测序试剂包含C,T;当预先选定的测序反应循环按照预先反应顺序应加入第一测序试剂时,该测序试剂可以只包含A或者只包含G;当预先选定的测序反应循环原本应加入第二测序试剂时,该测序试剂可以只包含C或者只包含T。
4.根据权利要求1所述的方法,其特征在于,第一测序试剂包含A,T,第二测序试剂包含C,G;当预先选定的测序反应循环按照预先反应顺序应加入第一测序试剂时,该测序试剂可以只包含A或者只包含T;当预先选定的测序反应循环原本应加入第二测序试剂时,该测序试剂可以只包含C或者只包含G。
5.根据权利要求2-4任一项所述的方法,其特征在于,所述预先选定的部分测序反应循环占所有反应循环的比例不高于35%,优选的不高于25%。
6.根据权利要求5所述的方法,其特征在于,在预先选定的部分测序循环中,加入的核苷酸单体共有一种核苷酸,选自A,G,C,T(或U),且所述一种核苷酸单体的分布是近似均匀的。
7.根据权利要求5所述的方法,其特征在于,在预先选定的部分测序循环中,加入的核苷酸单体共有两种类型,选自A,G,C,T(或U),且两种核苷酸单体的数量是接近的,两种核苷酸单体的分布是近似均匀的。
8.根据权利要求5所述的方法,其特征在于,在预先选定的部分测序循环中,加入的核苷酸单体共有三种类型,选自A,G,C,T(或U),且三种核苷酸单体的数量是接近的,三种核苷酸单体的分布是近似均匀的。
9.根据权利要求5所述的方法,其特征在于,在预先选定的部分测序循环中,加入的核苷酸单体共有四种类型,选自A,G,C,T(或U),且四种核苷酸单体的数量是接近的,A,G,C,T(或U)四种核苷酸单体的分布是近似均匀的。
10.根据权利要求6-9任一项所述的方法,其特征在于,在预先选定的部分测序循环中,相邻的奇数测序循环加入的不是同一种类的核苷酸单体,相邻的偶数测序循环加入的不是同一种类的核苷酸单体。
11.一种对核酸序列信息进行校正的方法,其特征在于,根据权利要求1-10任一项所述的方法测序得到测序信号,并对所述测序信号进行错误校正。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310344371.0A CN116574790A (zh) | 2023-04-03 | 2023-04-03 | 一种多核苷酸的测序方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310344371.0A CN116574790A (zh) | 2023-04-03 | 2023-04-03 | 一种多核苷酸的测序方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116574790A true CN116574790A (zh) | 2023-08-11 |
Family
ID=87534831
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310344371.0A Pending CN116574790A (zh) | 2023-04-03 | 2023-04-03 | 一种多核苷酸的测序方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116574790A (zh) |
-
2023
- 2023-04-03 CN CN202310344371.0A patent/CN116574790A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11634768B2 (en) | Methods for indexing samples and sequencing multiple polynucleotide templates | |
US7378242B2 (en) | DNA sequence detection by limited primer extension | |
EP3133169B1 (en) | Methods for selecting and amplifying polynucleotides | |
JP5118056B2 (ja) | ポリヌクレオチド増幅 | |
EP4168578B1 (en) | Compositions and methods for in situ single cell analysis using enzymatic nucleic acid extension | |
CN112654714B (zh) | 用于测序的引物寡核苷酸 | |
US20160239732A1 (en) | System and method for using nucleic acid barcodes to monitor biological, chemical, and biochemical materials and processes | |
EP3093342B1 (en) | Rna micro-array for detecting interaction between protein and rna containing a higher order structure | |
CN113811617A (zh) | 用于蛋白质组学剖析及表征的方法和系统 | |
US20110003703A1 (en) | Nucleic Acid Hybridization and Detection Using Enzymatic Reactions on a Microarray | |
CN116574790A (zh) | 一种多核苷酸的测序方法 | |
CN110818757A (zh) | 核苷酸类似物以及筛选dna聚合酶的方法 | |
KR20240024835A (ko) | 비이드-기반 핵산의 조합 인덱싱을 위한 방법 및 조성물 | |
US20230295696A1 (en) | Method for loading nucleic acid molecule on solid support | |
CN106916882B (zh) | 用于辨识核苷酸基因多型性的基因型鉴定芯片的双重等位基因特异性聚合酶链锁反应的方法 | |
WO2021262422A9 (en) | Method and system of dna and rna detection | |
CN115843315A (zh) | 用于校准流通池中核酸文库接种效率的方法 | |
US20040248104A1 (en) | Methods and reagents for profiling quantities of nucleic acids | |
Kowalczyk | Just Enough Knowledge… | |
Slavík et al. | MiRNA expression microarray | |
US20080096196A1 (en) | Method for Analyzing Samples by Means of Hybridization | |
Lowe | ACID REPEAT SEQUENCES BY $8 $8 2i DISCONTINUOUS PRIMER EXTENSION | |
JP2004147501A (ja) | Dnaの高感度検出法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |