CN116710573A - 插入段和标识无变性测序方法 - Google Patents
插入段和标识无变性测序方法 Download PDFInfo
- Publication number
- CN116710573A CN116710573A CN202180083385.0A CN202180083385A CN116710573A CN 116710573 A CN116710573 A CN 116710573A CN 202180083385 A CN202180083385 A CN 202180083385A CN 116710573 A CN116710573 A CN 116710573A
- Authority
- CN
- China
- Prior art keywords
- primer
- sequencing
- insert
- nucleotide
- tag
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 203
- 230000037431 insertion Effects 0.000 title claims abstract description 35
- 238000003780 insertion Methods 0.000 title claims abstract description 34
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 185
- 239000002773 nucleotide Substances 0.000 claims abstract description 180
- 238000000034 method Methods 0.000 claims abstract description 95
- 230000000903 blocking effect Effects 0.000 claims abstract description 29
- 102000040430 polynucleotide Human genes 0.000 claims description 135
- 108091033319 polynucleotide Proteins 0.000 claims description 135
- 239000002157 polynucleotide Substances 0.000 claims description 135
- 230000000295 complement effect Effects 0.000 claims description 57
- 238000000137 annealing Methods 0.000 claims description 24
- 239000005546 dideoxynucleotide Substances 0.000 claims description 12
- 238000002372 labelling Methods 0.000 claims description 4
- 238000004925 denaturation Methods 0.000 abstract description 16
- 230000036425 denaturation Effects 0.000 abstract description 16
- 230000015572 biosynthetic process Effects 0.000 abstract description 3
- 239000000523 sample Substances 0.000 description 25
- 150000007523 nucleic acids Chemical class 0.000 description 20
- 108020004414 DNA Proteins 0.000 description 19
- 102000053602 DNA Human genes 0.000 description 19
- 230000003321 amplification Effects 0.000 description 17
- 239000012634 fragment Substances 0.000 description 17
- 238000003199 nucleic acid amplification method Methods 0.000 description 17
- 102000039446 nucleic acids Human genes 0.000 description 17
- 108020004707 nucleic acids Proteins 0.000 description 17
- 238000002474 experimental method Methods 0.000 description 16
- 239000002777 nucleoside Substances 0.000 description 16
- 238000006243 chemical reaction Methods 0.000 description 15
- 238000003752 polymerase chain reaction Methods 0.000 description 13
- 229910019142 PO4 Inorganic materials 0.000 description 12
- 238000009396 hybridization Methods 0.000 description 12
- 150000003833 nucleoside derivatives Chemical class 0.000 description 12
- 235000021317 phosphate Nutrition 0.000 description 12
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 10
- 239000010452 phosphate Substances 0.000 description 10
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 9
- 108091034117 Oligonucleotide Proteins 0.000 description 8
- 150000001875 compounds Chemical class 0.000 description 8
- 229910052739 hydrogen Inorganic materials 0.000 description 8
- 239000001257 hydrogen Substances 0.000 description 8
- 229920000388 Polyphosphate Polymers 0.000 description 7
- -1 deazapurine Chemical compound 0.000 description 7
- 239000003446 ligand Substances 0.000 description 7
- 239000001205 polyphosphate Substances 0.000 description 7
- 235000011176 polyphosphates Nutrition 0.000 description 7
- 239000000126 substance Substances 0.000 description 7
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 6
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 238000007481 next generation sequencing Methods 0.000 description 6
- 239000007787 solid Substances 0.000 description 6
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 6
- 108090001008 Avidin Proteins 0.000 description 5
- 108010090804 Streptavidin Proteins 0.000 description 5
- 102000008579 Transposases Human genes 0.000 description 5
- 108010020764 Transposases Proteins 0.000 description 5
- 229960002685 biotin Drugs 0.000 description 5
- 235000020958 biotin Nutrition 0.000 description 5
- 239000011616 biotin Substances 0.000 description 5
- 239000000839 emulsion Substances 0.000 description 5
- 238000010348 incorporation Methods 0.000 description 5
- 125000003835 nucleoside group Chemical group 0.000 description 5
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 description 4
- 238000012165 high-throughput sequencing Methods 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 235000000346 sugar Nutrition 0.000 description 4
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 3
- 229930024421 Adenine Natural products 0.000 description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 3
- 108700011259 MicroRNAs Proteins 0.000 description 3
- 108091093037 Peptide nucleic acid Proteins 0.000 description 3
- 229960000643 adenine Drugs 0.000 description 3
- 229940104302 cytosine Drugs 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 239000007850 fluorescent dye Substances 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 239000002679 microRNA Substances 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 150000003212 purines Chemical class 0.000 description 3
- 150000003230 pyrimidines Chemical class 0.000 description 3
- 229940113082 thymine Drugs 0.000 description 3
- YKBGVTZYEHREMT-KVQBGUIXSA-N 2'-deoxyguanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 YKBGVTZYEHREMT-KVQBGUIXSA-N 0.000 description 2
- FSASIHFSFGAIJM-UHFFFAOYSA-N 3-methyladenine Chemical compound CN1C=NC(N)=C2N=CN=C12 FSASIHFSFGAIJM-UHFFFAOYSA-N 0.000 description 2
- XTWYTFMLZFPYCI-KQYNXXCUSA-N 5'-adenylphosphoric acid Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XTWYTFMLZFPYCI-KQYNXXCUSA-N 0.000 description 2
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- XTWYTFMLZFPYCI-UHFFFAOYSA-N Adenosine diphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(O)=O)C(O)C1O XTWYTFMLZFPYCI-UHFFFAOYSA-N 0.000 description 2
- 108091093088 Amplicon Proteins 0.000 description 2
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 108020004635 Complementary DNA Proteins 0.000 description 2
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 108020005196 Mitochondrial DNA Proteins 0.000 description 2
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 229960005305 adenosine Drugs 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 239000012472 biological sample Substances 0.000 description 2
- WTEOIRVLGSZEPR-UHFFFAOYSA-N boron trifluoride Chemical compound FB(F)F WTEOIRVLGSZEPR-UHFFFAOYSA-N 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 238000010804 cDNA synthesis Methods 0.000 description 2
- 229910052799 carbon Inorganic materials 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 150000001768 cations Chemical class 0.000 description 2
- 125000003636 chemical group Chemical group 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 125000000524 functional group Chemical group 0.000 description 2
- 125000000623 heterocyclic group Chemical group 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 238000004949 mass spectrometry Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- 238000007841 sequencing by ligation Methods 0.000 description 2
- GEHJYWRUCIMESM-UHFFFAOYSA-L sodium sulfite Chemical compound [Na+].[Na+].[O-]S([O-])=O GEHJYWRUCIMESM-UHFFFAOYSA-L 0.000 description 2
- 229920006132 styrene block copolymer Polymers 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 239000001226 triphosphate Substances 0.000 description 2
- 235000011178 triphosphate Nutrition 0.000 description 2
- WKKCYLSCLQVWFD-UHFFFAOYSA-N 1,2-dihydropyrimidin-4-amine Chemical compound N=C1NCNC=C1 WKKCYLSCLQVWFD-UHFFFAOYSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- VGONTNSXDCQUGY-RRKCRQDMSA-N 2'-deoxyinosine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=CNC2=O)=C2N=C1 VGONTNSXDCQUGY-RRKCRQDMSA-N 0.000 description 1
- ZDTFMPXQUSBYRL-UUOKFMHZSA-N 2-Aminoadenosine Chemical compound C12=NC(N)=NC(N)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ZDTFMPXQUSBYRL-UUOKFMHZSA-N 0.000 description 1
- MWBWWFOAEOYUST-UHFFFAOYSA-N 2-aminopurine Chemical compound NC1=NC=C2N=CNC2=N1 MWBWWFOAEOYUST-UHFFFAOYSA-N 0.000 description 1
- CKTSBUTUHBMZGZ-ULQXZJNLSA-N 4-amino-1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-tritiopyrimidin-2-one Chemical compound O=C1N=C(N)C([3H])=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-ULQXZJNLSA-N 0.000 description 1
- LQLQRFGHAALLLE-UHFFFAOYSA-N 5-bromouracil Chemical compound BrC1=CNC(=O)NC1=O LQLQRFGHAALLLE-UHFFFAOYSA-N 0.000 description 1
- BXJHWYVXLGLDMZ-UHFFFAOYSA-N 6-O-methylguanine Chemical compound COC1=NC(N)=NC2=C1NC=N2 BXJHWYVXLGLDMZ-UHFFFAOYSA-N 0.000 description 1
- UBKVUFQGVWHZIR-UHFFFAOYSA-N 8-oxoguanine Chemical compound O=C1NC(N)=NC2=NC(=O)N=C21 UBKVUFQGVWHZIR-UHFFFAOYSA-N 0.000 description 1
- PVKSNHVPLWYQGJ-KQYNXXCUSA-N AMP-PNP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)NP(O)(O)=O)[C@@H](O)[C@H]1O PVKSNHVPLWYQGJ-KQYNXXCUSA-N 0.000 description 1
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 1
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 1
- 229910015900 BF3 Inorganic materials 0.000 description 1
- 101100206389 Caenorhabditis elegans tag-124 gene Proteins 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 238000001069 Raman spectroscopy Methods 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 229940045686 antimetabolites antineoplastic purine analogs Drugs 0.000 description 1
- 229940045688 antineoplastic antimetabolites pyrimidine analogues Drugs 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 150000001615 biotins Chemical class 0.000 description 1
- QTPILKSJIOLICA-UHFFFAOYSA-N bis[hydroxy(phosphonooxy)phosphoryl] hydrogen phosphate Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(=O)OP(O)(=O)OP(O)(O)=O QTPILKSJIOLICA-UHFFFAOYSA-N 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 125000002837 carbocyclic group Chemical group 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- VGONTNSXDCQUGY-UHFFFAOYSA-N desoxyinosine Natural products C1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 VGONTNSXDCQUGY-UHFFFAOYSA-N 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000007847 digital PCR Methods 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000835 electrochemical detection Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 230000007071 enzymatic hydrolysis Effects 0.000 description 1
- 238000006047 enzymatic hydrolysis reaction Methods 0.000 description 1
- 230000032050 esterification Effects 0.000 description 1
- 238000005886 esterification reaction Methods 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 125000005843 halogen group Chemical group 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 125000000879 imine group Chemical group 0.000 description 1
- 230000003100 immobilizing effect Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 239000011325 microbead Substances 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 108091005601 modified peptides Chemical class 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 238000001668 nucleic acid synthesis Methods 0.000 description 1
- 150000002972 pentoses Chemical group 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 150000004713 phosphodiesters Chemical class 0.000 description 1
- 150000003014 phosphoric acid esters Chemical class 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- 238000010791 quenching Methods 0.000 description 1
- 230000000171 quenching effect Effects 0.000 description 1
- 239000012857 radioactive material Substances 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 150000003291 riboses Chemical class 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 235000010265 sodium sulphite Nutrition 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 235000021092 sugar substitutes Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 239000004291 sulphur dioxide Substances 0.000 description 1
- 239000003765 sweetening agent Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6853—Nucleic acid amplification reactions using modified primers or templates
- C12Q1/6855—Ligating adaptors
Abstract
本发明公开了用于二代测序的方法和试剂盒。在一些实施例中,本方法包括没有中间变性步骤的插入段测序和标识测序。本发明还提出插入段序列减弱的测序信号,使用未标记核苷酸形成双链插入段结构,以及使用合成阻断核苷酸。
Description
相关申请的交叉引用
本申请要求2021年01月08日提交的美国专利申请号17/144,900的优先权,其全部内容通过引用并入本文。
技术领域
本发明公开了用于二代测序的方法和试剂盒。
背景技术
二代测序(NGS)已经彻底改变了分子生物学,使确定基因组序列的速度大大加快,成本大大降低。为了对脱氧核糖核酸(DNA)和其他多核苷酸进行二代测序,必须对多核苷酸进行处理以用于测序系统,通常是通过添加具有已知序列的寡核苷酸,一般称为接头(adaptor)。这些已知的接头使多核苷酸能与测序系统兼容,例如通过添加将退火以与测序仪流动芯片上的寡核苷酸互补的序列。接头可以包含多个功能区,如用于连接测序仪、测序引物退火和/或生物样品索引的区域(即样品条形码(SBC)或唯一分子条形码(MBC))。SBC和MBC可以与未知DNA序列(插入段)的目的多核苷酸样品一起测序,以分别识别所述插入段的生物来源和独特性。
边合成边测序(SBS)系统使用四个荧光标记的核苷酸对流动芯片表面的数千万个簇进行并行测序。在每个测序周期中,单个标记的脱氧核苷三磷酸(dNTP)添加到核酸链中。核苷酸标签作为聚合的终止剂,因此在每个dNTP并入后,荧光染料被成像以识别碱基,然后进行酶解以并入下一个核苷酸。由于所有四个可逆的终止子结合的dNTPs(A、C、T、G)都是以单独的分子形式存在,自然竞争使并入的偏差最小。每个核苷酸的识别是根据每个周期中测量的标签的信号进行的。其结果是一种按顺序识别目的多核苷酸中的每个核苷酸的测序方法。
在许多SBS系统中,通过标记核苷酸形成互补链来对插入段进行测序,然后通过变性将所述插入段测序合成的链去除。所述变性步骤是有必要的,因为来自插入段的测序信号会干扰后续的标识测序。
在一些情况中,多核苷酸如DNA通过一个或多个接头贴附在测序系统(如流动芯片、微珠)的固体表面上,并进行扩增以增加信号强度。一般来说,通过将样品分割成多核苷酸片段,将一个或多个接头附着在片段上形成多核苷酸结构体,并对多核苷酸片段进行扩增,测序文库被制备以用于测序。这些片段可以用一个或多个扩增引物进行扩增。在SBS系统中,测序引物与多核苷酸结构体上的引物结合位点杂交,随着测序引物延伸,以酶促方式添加标记的双脱氧核苷酸。检测和分析标记的双脱氧核苷酸的信号,从而确定序列。
目的多核苷酸可以用单端或双端测序方法进行分析。单端测序方法包括从一端向相反端读取基因组片段。单端测序读取为每个片段读取一次,对应于片段两端之一的n个碱基对,其中n是测序周期数。双端测序方法包括从一端到另一端读取一个核酸片段,直至读取指定的长度,然后从片段的另一端开始再进行一轮读取。对于双端测序方法,需进行正向序列读取和反向序列读取,并将数据配对形成邻接序列。这些序列与参考样本进行比对,以确定变异。
NGS测序系统(如上述系统)通常需要在开始新的引物退火和测序之前,将由加入的标记核苷酸形成的先前合成的链变性(与插入段分离)。例如,在对SBCs和/或MBCs进行测序的第二测序引物退火之前需对插入段进行测序后产生的互补链进行变性。或者,在对DNA片段进行测序的引物退火之前,需对SBCs和/或MBCs进行测序时产生的合成链进行变性。
然而,变性步骤是耗时的,并且可能破坏DNA片段,也有可能引入测序误差。因此,本领域需要一种不需要变性步骤的测序方法,特别是具有与高通量测序分析结合效用的测序方法。
发明内容
本发明提供了用于二次测序的方法和试剂盒。本方法一般包括对存在于多核苷酸结构体中的插入段和标识进行测序,并且没有变性步骤,从而减少测序时间,避免潜在的测序误差,和/或提供其他优势等。
本发明的这些和其他特点和优点从下面的详细描述以及所附的权利要求来看是显而易见的。
附图说明
本发明将结合附图进行详细描述。本发明的特征不一定按实际比例示出。
图1是包括插入段和接头的示例性的多核苷酸结构体。
图2是本测序方法的一个实施例,其中标记核苷酸加入第一引物中,形成双链插入段部分,并且在标识测序之前所述双链插入段部分未变性。
图3是本测序方法的一个实施例,其中标记核苷酸加入用于插入段测序的第一引物中,之后在标识测序之前加入未标记核苷酸。
图4是本测序方法的一个实施例,其中标记核苷酸加入用于插入段测序的第一引物中,之后在标识测序之前加入阻断核苷酸以停止插入段测序。
图5是本测序方法的一些实施例的结果数据。
术语定义
需要理解的是,本发明中使用的术语仅用于描述特定实施例,不能理解为对本发明的限制。本发明中定义的术语是在本发明技术领域普遍理解和接受的定义术语的技术和科学含义之内的。
在本发明中,术语“多核苷酸”用于描述任何长度的聚合物,例如,大于约10个碱基、大于约100个碱基、大于约500个碱基、大于1000个碱基,直至约10,000个或更多碱基;由核苷酸组成,例如,脱氧核糖核苷酸或核糖核苷酸;或人工合成的化合物(例如,美国专利号5,948,902及其中引用的参考文献中所述的肽核酸(PNA),它可以与天然存在的核酸以类似于两个天然存在的核酸的序列特定方式进行杂交,例如,可以参与沃森-克里克(Watson-Crick)碱基配对相互作用。天然存在的核苷酸包括鸟嘌呤、胞嘧啶、腺嘌呤和胸腺嘧啶(分别为G、C、A和T)。
在本发明中,术语“核苷”是包括嘌呤、脱氮嘌呤或与糖或糖的替代品(例如1'位或同等位置上的碳环或无环连接物,包括2′-脱氧和2′-羟基、2′,3′-脱氧形式以及其他取代物)相连的嘧啶碱基的化合物。
在本发明中,术语“核苷多磷酸盐”是指具有两个或更多磷酸基团的核苷的磷酸酯,例如三磷酸腺苷和五磷酸脱氧鸟苷。核苷多磷酸盐可以包含连接至末端磷酸或内源磷酸的化学基团。例如,核苷多磷酸盐可以包括连接至末端磷酸或多磷酸链中的内源磷酸的分子,该分子带有电化学标签、质谱标签、电荷阻断标签、或显色标签、化学发光标签、荧光染料或荧光淬灭标签。可用作标签的化学基团的其他例子包括发色团、酶、抗原、重金属、磁探针、磷光团、放射性材料、散射或荧光纳米粒子、拉曼信号生成分子和电化学检测分子。此外,在本发明中,术语“核苷多磷酸盐”是指核苷的磷酸酯,它可以包括亚胺基团或磷酸链的其他修饰。例如,腺苷亚氨二磷酸盐(AMP-PNP)和脱氧胞嘧啶5′-(γ-硫代三磷酸)及类似物,如二磷酸腺苷(ADP)。核苷多磷酸盐还包括三氟化硼(BeF3)。
在本发明中,术语“核苷酸”是指核苷的磷酸酯,其中酯化位点通常对应于连接至戊糖C-5位置的羟基。在某些情况下,核苷酸包括核苷多磷酸盐。然而,术语“添加的核苷酸”,“并入的核苷酸”均是指作为寡核苷酸或多核苷酸链一部分的核苷酸残基。
术语“核苷”、“核苷酸”、“脱氧核苷”和“脱氧核苷酸”旨在包括那些不仅含有已知嘌呤和嘧啶碱基,而且还含有其他已改性杂环碱基的分子。这种改性包括甲基化嘌呤或嘧啶、酰化嘌呤或嘧啶、烷基化核糖或其他杂环。此外,“核苷”、“核苷酸”、“脱氧核苷”和“脱氧核苷酸”包括不仅含有常规核糖和脱氧核糖糖类,而且还含有其他糖类的分子。改性核苷、核苷酸、脱氧核苷或脱氧核苷酸还包括对糖分子上的改性,例如,其中一个或多个羟基被卤素原子或脂族基团取代,或被官能化为醚、胺等。
在本发明中,天然核苷酸或核苷定义为腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)和胞嘧啶(C)。这些核苷酸或核苷的某些改性天然存在,这点已得到证实。然而,自然发生的影响氢键碱基配对的A、T、G和C的改性是非天然存在的。例如,2-氨基腺苷在自然界中存在,但不是本发明中“天然存在的”核苷酸或核苷。自然形成的不影响碱基配对并天然存在的改性核苷酸或核苷的其他非限制性例子包括5-甲基胞嘧啶、3-甲基腺嘌呤、O(6)-甲基鸟嘌呤和8-氧代鸟嘌呤等。核苷酸包括任何天然形成或人工合成的核苷酸或核苷酸类似物。示例性地,核苷酸包括脱氧腺苷、脱氧胞苷、脱氧鸟苷、脱氧胸苷、腺苷、胞苷、鸟苷和尿苷的磷酸酯。其他核苷酸包括腺嘌呤、胞嘧啶、鸟嘌呤、胸腺嘧啶碱基、黄嘌呤或次黄嘌呤、5-溴尿嘧啶、2-氨基嘌呤、脱氧肌苷、或甲基化胞嘧啶,如5-甲基胞嘧啶和N4-甲氧基脱氧胞嘧啶。还包括多核苷酸模拟物的碱基,例如甲基化核酸,如2′-O-methRNA、肽核酸、改性肽核酸、锁核酸或任意其他像核苷酸或碱基一样发挥作用的结构性分子,例如,与DNA或RNA中的一个或多个碱基表现出碱基互补性和/或能够进行碱基互补结合,并包括链终止类似物。如果一个核苷酸与一个特定的核苷酸类关于至少一个碱基有共同的碱基互补性,则所述核苷酸对应于该特定的核苷酸类。
在本发明中,除了嘌呤和嘧啶之外,改性核苷酸或类似物包括能够与一种或多种天然存在的核苷酸或与另一种核苷酸类似物形成氢键的任何化合物。任何与T或T的衍生物形成至少两个氢键的化合物被认为是A的类似物或改性A。类似地,任何与A或A的衍生物形成至少两个氢键的化合物被认为是T的类似物或改性T。类似地,任何与G或G的衍生物形成至少两个氢键的化合物被认为是C的类似物或改性C。类似地,任何与C或C的衍生物形成至少两个氢键的化合物被认为是G的类似物或改性G。根据此技术方案,一些化合物将被认为是A类似物和G类似物(嘌呤类似物)或T类似物和C类似物(嘧啶类似物)。
在本发明中,术语“多核苷酸结构体”是指连结或以其他方式连接至另一核酸(如接头)的多核苷酸。例如,多核苷酸结构体可包含待测序的DNA插入段、用于流动芯片附着的捕获位点、标识DNA序列(如SBC和MBC)、以及第一和第二引物的引物结合位点。
在本发明中,术语“插入段”是指用于测序和/或其他分析的目的多核苷酸。插入段可以存在于多核苷酸结构体中,以通过NGS进行测序。插入段可以是单链或双链的当连接至接头以形成多核苷酸结构体时通常是双链DNA。在本发明中,“DNA插入段”可以是指一个特定序列和/或其补充物。一个DNA插入段可以包含一个靶序列。一个“靶序列”可以在体外或体内细胞基因组内的核酸中,它可以是任何形式的单链或双链核酸。
在本发明中,术语“捕获位点”是指用于将多核苷酸结构体附着至流动芯片或其他表面而配置的核酸序列,以用于NGS测序或其他分析处理。
在本发明中,术语“标识”是指可用于识别特定多核苷酸结构体的核酸序列。一个“标识”可以是用于识别特定生物样品的“样品条形码”或“SBC”序列。一个“标识”也可以指一个“分子条形码”,用于识别样品中存在的唯一分子。此外,一个“标识”可以同时包含一个SBC和一个MBC。
在本发明中,术语“引物结合位点”是指寡核苷酸或多核苷酸内配置的用于与引物杂交结合的位点,以便通过如引物延伸扩增相邻序列或测序。引物结合位点一般与序列的3'端相邻,以提供测序数据。相应地,测序引物一般与和插入段相邻的引物结合位点结合,使与要测序的插入段互补的核苷酸加入至测序引物的3'端。引物结合位点可以是形成于目的多核苷酸中的序列,也可以是通过添加包含引物结合位点的接头添加至多核苷酸的序列。含有引物结合位点的接头可以通过连结、使用转座酶、引物延伸或其他技术来添加。
“杂交结合(Hybridization or hybridizing)”是指完全或部分互补的核酸链在特定的杂交结合条件下集合在一起,形成双链结构或区域,其中两个组成链通过氢键连接。尽管氢键通常在腺嘌呤和胸腺嘧啶或尿嘧啶(A和T或U)或胞嘧啶和鸟嘌呤(C和G)之间形成,但其他碱基对也可以形成(例如,Adams et al.,“The Biochemistry of the NucleicAcids,”11th ed.,1992)。
术语“引物”是指在与多核苷酸模板(如引物结合位点)形成双链体时,能够作为核酸合成的起始点,并从其3'端沿模板延伸而形成延伸双链体的寡核苷酸。在延伸过程中添加的核苷酸序列由多核苷酸模板序列决定。引物可作为DNA聚合酶、RNA聚合酶或逆转录酶催化的核苷酸聚合的起始点。无论是酶合成还是人工合成的引物,其长度可以为4-1000个或更多碱基(如长度为10-500个碱基)。
在本发明中,术语“引物延伸”是指通过使用聚合酶将特定核苷酸退火至引物的3'端以延伸引物。
术语“接头”是指连接至目的多核苷酸以形成人工合成多核苷酸或多核苷酸结构体的核酸分子。接头可以是单链或双链的,它可以包括DNA、RNA和/或人工核苷酸。接头可以位于目的多核苷酸的末端,也可以位于中间或内部。接头可以向多核苷酸结构体添加一个或多个功能区,如提供用于扩增或测序的引物结合位点或添加标识。例如,接头可以包括一个第一引物结合位点,一个标识(如SBC和/或MBC),一个第二引物结合位点,和一个捕获位点。接头还可以包括一个通用引物和/或通用引物位点,包括用于测序的引物位点。进一步地,接头可以包含一个或多个不同类型或用于不同目的的条形码,如分子条形码、样品条形码和/或靶向条形码。
术语“测序”是指确定一个或多个核苷酸的种类,即确定一个核苷酸是G、A、T或C。
术语“获得双链体”是指通过以下方式制得的双链体,例如:a)将一种核酸(如寡核苷酸)与另一种核酸杂交结合;b)延伸引物,所述引物以某核酸为模板并与其杂交结合(从而将具有第一引物的第一双链转化为包括延伸引物的第二双链);或c)切开较长的双链分子,之后使用外切酶从切入位点去除核苷酸。
在本发明中,序列的“部分”或“片段”是指序列中小于完整序列的任意部分(例如,核苷酸子序列或氨基酸子序列)。多核苷酸的部分可以为任意长度,例如,长度至少为5、10、15、20、25、30、40、50、75、100、150、200、300、500或更多核苷酸。指导序列的一部分可以是指导序列的约50%、40%、30%、20%或10%,例如,指导序列的三分之一或更短,或长度为7、6、5、4、3或2个核苷酸。
在本发明中,数字范围包括定义所述范围的数字。需要注意的是,为了说明目的,化学结构和公式可以拉长或放大。
在本说明书和权利要求书中,除其普通含义外,术语“实质上”或“基本上”是指在本领域普通技术人员可接受的限度或程度内。例如,“基本上取消了”是指本领域技术人员认为取消是可以接受的。
在本说明书和权利要求书中,除其普通含义外,术语“近似”和“大约”是指在本领域普通技术人员可接受的限度或数量之内。术语“大约”通常指的是指所述数字允许有±15%的变化。例如,“大约10”可表示8.7-1.15的范围。例如,“大致相同”是指本领域的普通技术人员认为相比较的事物是相同的。
在本说明书和权利要求书中,除非上下文明确提示了其他情况,术语“一”、“一个”和“所述”并非特指单数,也可以包括复数。因此,例如,“一个引物”可以包括一个引物和多个引物。在本发明中,诸如术语第一、第二、第三等的序号并不意味着第一事件发生在第二事件之前(除非上下文另有说明);相反,它们可用来区分不同的事件。除非另有说明,具有第一和第二要素的方法或装置还可以包括第三、第四、第五等要素。
在本发明中,提供了一些数值的范围。可以理解的是,所述范围的上限和下限之间的每个中间值也被公开。如果所述范围包括所述一个或两个极限值,不包括所述极限值的任何一个或两个的范围也包括在本发明中。
在本发明中提到的所有专利和公布都明确地通过引用而并入本文。对任何公布的引用是为了其在申请日期之前的披露,不应理解为本权利要求无权优先于所述公布。此外,所提供的公布日期可能与实际公布日期不同,而实际出版日期可以单独确认。
显而易见,本领域的技术人员在阅读本公开内容时,本文所描述和说明的每个实施例都具有各自的组件和特征,这些组件和特征可以与其他实施例的任何一个的特征分离或结合,而不偏离本发明的范围或精神。任何引述的方法都可以按照引述的事件顺序或在逻辑上可能的任何其他顺序来进行。
具体实施方式
本发明技术提供了用于测序的方法,所述方法可在对多核苷酸结构体中存在的插入段和标识进行测序之间减少或避免变性。图1示出了可通过本方法进行测序的包括一个插入段和两个标识的示例性多核苷酸结构体100。也可以考虑在本方法中采用其他排列方式的多核苷酸结构体。
特别地,图1示出了一个包括一个插入段110和连接在插入段110两端的接头120、130的示例性多核苷酸结构体100。所述多核苷酸结构体100包括一条上链102和一条下链104,对于多数测序系统,所述链102、104将在引入测序仪之前被分开。任何一条或两条链102、104均可用于测序。由于引物结合位点相对于标识和插入段的3'-5'定位,底链104更常用于多数测序系统。所述插入段110可以是任何目的多核苷酸,接头120、130通过连接以方便插入段110进行二代测序。所述接头120包括若干功能区以助于测序,如第一引物结合位点122,测序引物与之结合,以便对插入段110进行测序。所述接头120还包括一个样品标识124,一个分子标识126,和一个第二引物结合位点128。第二测序引物将与第二引物结合点128结合,以便对分子标识126和样品标识124进行测序。通过在不同时间向测序系统添加第一和第二测序引物,用户可以决定系统是否对插入段110或标识124、126进行测序。接头130包括一个捕获位点132,用于将多核苷酸结构体100附着在测序系统中的载体(如具有与捕获位点132互补的引物的流动芯片)上。因此,所述示例性多核苷酸结构体100包括一个用于附着流动芯片的捕获位点、一个待测序的DNA片段、包括待测序分子和样品标识的DNA标识序列,以及分别与插入段和标识序列相邻的用于第一和第二测序引物的引物结合位点。然而,可以考虑将本方法和试剂盒用于其他排列方式的多核苷酸结构体,如只包括一个接头的多核苷酸结构体,或包括具有额外功能区或更少功能区的接头的多核苷酸结构体。
所述插入段可以是其序列为目的序列的任何多核苷酸,包括基因组DNA(gDNA)、衍生于RNA模板(如信使RNA(mRNA)或微小RNA(microRNA))的互补DNA(cDNA)、线粒体DNA(mtDNA)、和RNA(例如mRNA、microRNA或其他多核苷酸)。所述插入段可以是任何来源,如微生物、病毒、真菌、植物或哺乳动物。所述插入段可以是任何合适的碱基长度,通常根据需要使用的测序系统来选择。
所述插入段可以通过任何合适的方法获得。在一些实施例中,包括基因组DNA的样品可以使用任何合适的技术进行破碎,例如物理破碎、酶破碎或化学剪切破碎。在一些实施例中,多核苷酸使用物理破碎方法进行破碎,如超声、声学破碎或流体动力剪切。在一些实施例中,多核苷酸使用限制酶进行破碎。在一些实施例中,多核苷酸使用一种酶进行破碎,如脱氧核糖核酸酶(DNase I)或转座酶。在一些实施例中,多核苷酸使用化学剪切法进行破碎,如在金属阳离子环境下的热消解法。在一些实施例中,多核苷酸是随机破碎的。在一些实施例中,多核苷酸可以用亚硫酸钠或其他化学改性剂处理。在一些实施例中,多核苷酸片段用来填充测序文库。
在一些实施例中,所述插入段具有至少约30、50、70、100或更长的碱基长度,或至多约2,000、1,000、800、500、200、120或更短的碱基长度。上述任何一个最小值和最大值均可以结合起来,组成所述插入段的碱基长度范围。
各种接头在本领域是已知的,可以用于或修饰用于本方法和试剂盒。例如,合适的接头包括可以连接至多核苷酸以产生具有不同5'末端的测序文库的Y接头。接头可以是独立的序列(如A/B接头),其中A接头连接至多核苷酸的一端,B接头连接至多核苷酸的另一端。接头可以是茎环接头,其中发夹环连接至多核苷酸的一端;其一部分(通常是茎)可以在扩增或测序前被裂解。接头可以通过任何合适的技术连接至插入段,包括但不限于连结、使用转座酶、杂交结合(hybridization)和/或引物延伸。例如,通常在准备好用于连结的插入段之后,接头可以通过末端修复和末端平滑连结至插入段的两端。又如,可以通过使用转座酶将包含接头的转座子插入多核苷酸以连接接头,从而在由多核苷酸形成的插入段的末端提供接头。
在一些实施例中,多核苷酸结构体包括、基本包括或包含用于标识测序的引物结合位点、一个或多个标识、用于插入段测序的引物结合位点、插入段、以及可选的捕获位点。所述多核苷酸结构体可以作为单链分子、双链分子或具有单链部分和双链部分的分子提供。在一些实施例中,标识包括一个样品标识和/或一个分子标识。在一些实施例中,所述插入段包括一个5'端和一个3'端,引物结合位点与插入段的一端相邻。在一些实施例中,引物结合位点与样品标识或分子标识相邻。在一些实施例中,单链多核苷酸结构体包括、基本包括或包含(按5'-3'顺序或按3'-5'顺序)一个用于标识测序的引物结合位点、一个或多个标识、一个用于插入段测序的引物结合位点、一个插入段和可选的一个捕获点。
在一些实施例中,本方法使用了在一些系统中若干测序周期后发生的信号强度下降。例如,在一些SBS系统中,在测序周期中逐一添加标记核苷酸到与插入段互补的链上。随着周期的增加,标记产生的信号的强度降低。可见,在第一引物延伸的大约70个测序周期后,如果从第二个引物开始测序,则添加后续标记核苷酸而产生的信号可以被忽略或减弱。也就是说,为标识测序而延伸的第二引物的信号将明显强于第一引物延伸的信号。因此,即使在继续延伸第一引物且不使与插入段互补的链变性的情况下,也可以延伸第二引物进行标识测序。
例如,如图2所示,可以根据所需测序周期数,从第一测序引物对插入段进行初步测序。图2示出了本测序方法的一个实施例,其中对包括插入段210、样品标识224和分子标识226的链204进行测序。所述链204通过其捕获位点232附着在测序仪的表面上。第一引物240与第一引物结合点222结合,以便对插入段210进行测序。当通过引物延伸添加标记核苷酸,会产生一条与插入段210互补的链242,从而形成一个双链插入段部分。在进行一定数量的测序周期后(例如,至少70个测序周期,以形成具有大约70个核苷酸的互补链242),向测序系统(例如,提供给多核苷酸进行测序的流动芯片)提供第二引物250。第二引物250与第二引物结合点228结合,并通过添加标记核苷酸进行延伸。因此,标识224、226进行测序,形成双链标识部分252。延伸第二引物250,并且在没有将互补链242与插入段210分离的中间变性步骤的情况下对所述标识进行测序。在加入第二测序引物之前,由加入互补链242的标记核苷酸所产生的信号大幅减少,以至所述信号对来自双链标识部分252的新标识测序信号的影响可以忽略不计。在一些实施例中,在进行添加第二引物或标识测序周期之前,至少要进行30、35、40、45、50、55、60、65、70、75、80、85、90、95、100或更多的插入段测序周期。在一些实施例中,测序系统在添加第二引物之前确定来自插入段测序的信号水平是否低于阈值。在一些实施例中,测序系统在加入第二引物之前检测来自插入段测序的插入段信号水平,并根据插入段信号水平调整对检测到的标识信号水平的解读。
在一些实施例中,本技术提供了没有变性步骤的对多核苷酸结构体测序的方法。在一些实施例中,多核苷酸结构体包括一个插入段和一个标识。在一些实施例中,通过将第一引物退火至多核苷酸结构体的插入段3′的引物结合位点以对插入段进行测序。所述方法还包括通过添加与插入段互补的标记核苷酸来延伸第一引物,并检测添加的标记核苷酸以确定插入段序列,其中第一引物的延伸形成由插入段和与插入段互补的链组成的双链插入段部分。在一些实施例中,通过将第二引物退火至多核苷酸结构体的与标识3′的引物结合位点以对标识进行测序,通过添加与标识互补的标记核苷酸来延伸第二引物,并检测添加的标记核苷酸以确定标识序列。
在一些实施例中,本发明方法包括在加入标记核苷酸后,通过继续延伸与插入段互补的链来延伸双链插入段部分,直到基本上所有的插入段都是双链。链的延伸可以用未标记核苷酸而不是标记核苷酸互补,直到互补链基本上完全延伸插入段。因此,在本方法的一些实施例中,用第一引物与标记核苷酸对片段进行测序,然后加入未标记核苷酸(例如,没有荧光标记或其他改性的天然核苷酸(A、G、T和C))进行测序反应,以完成剩余插入段的合成。与一些NGS平台中使用的标记核苷酸不同,未标记核苷酸(可以是天然核苷酸)可以在没有任何附加化学步骤或DNA聚合酶突变的情况下加入。一旦未标记核苷酸加入,形成与整个插入段序列互补的链,从而形成双链插入段部分,没有剩余插入段用于将附加核苷酸添加到插入段上。之后,第二测序引物退火至第二引物位点,并加入标记核苷酸,以便对标识进行测序。因此,标识(如MBC和/或SBC)测序无需变性,因为无需延伸其他单链插入段。在一些实施例中,所述方法也是可行的,因为使用未标记天然核苷酸对后续测序步骤的影响最小。
图3示出了本测序方法的一些实施例,其中对包括插入段310、样品标识324和分子标识326的链304进行测序。所述链304通过其捕获位点332附着在测序仪的表面上。第一引物340与第一引物结合点322结合,以便插入段310测序。当标记核苷酸通过引物延伸加入时,会产生一条与插入段310互补的链342,从而形成一个双链插入段部分。执行所需数量的测序周期(例如,至少30、35、40、45、50、55、60、65、70、75、80、85、90、95、100或更多的测序周期),从而通过延伸第一引物340形成互补链342。在所需的测序周期数之后,将未标记核苷酸加入到测序反应中,引物延伸继续进行,延伸插入段310的所需长度形成一条链346,例如基本上全部的插入段310。可选地,在加入未标记核苷酸之前除去标记核苷酸。在一些实施例中,由于没有标记和/或没有检测标记,未标记核苷酸的添加比标记核苷酸的添加进行得更快。在形成由基本全部(或另一个所需长度)插入段310组成的双链插入段部分后,加入第二引物350与第二引物结合位点328结合。第二引物350通过添加标记核苷酸进行延伸,并对标识进行测序,从而形成双链标识部分352。由于链346占用了插入段310的所需长度,标记核苷酸不能与插入段310杂交结合,且不会产生信号。
在一些实施例中,本发明方法包括在添加标记核苷酸后向双链结构部分添加一种或多种阻断核苷酸。在本实施例中,一旦插入段测序进行足够多的测序周期,可以通过添加3'-脱氧核苷酸或其他聚合阻断核苷酸来阻断插入段进行下一个周期的测序。3'-脱氧核苷酸可以添加至链3'端,由于没有3'-OH基团,因此可以阻止进一步添加任何核苷酸。其他阻断核苷酸包括2',3'-二脱氧核苷酸、Acyclonucleotide等。在延伸第一引物得到的链被阻断后,第二测序引物可以退火至第二引物结合位点进行标识测序。
图4示出了本测序方法的一些实施例,其中对包括插入段410、样品标识424和分子标识426的链404进行测序。所述链404通过其捕获位点432附着在测序仪的表面上。第一引物440与第一引物结合点422结合,以进行插入段410测序。当标记核苷酸通过引物延伸加入时,会产生一条与插入段410互补的链442,从而形成双链插入段部分。执行所需数量的测序周期(例如,至少30、35、40、45、50、55、60、65、70、75、80、85、90、95、100或更多测序周期),从而通过延伸第一引物440形成互补链442。在所需数量的测序周期数后,再向测序反应中加入一个阻断核苷酸448,形成链442的引物延伸停止。在加入阻断核苷酸之前,不需要去除标记核苷酸。一般来说,在加入第二引物450和额外的标记核苷酸进行标识测序之前,从流动芯片中去除任何剩余的没有被并入链442末端的阻断核苷酸。第二引物450与第二引物结合点428结合。第二引物450通过添加标记核苷酸进行延伸,并对标识进行测序,从而形成双链标识部分452。
在本发明测序方法的一些实施例中,第一测序引物和第一引物结合位点提供来自标识(SBC和/或MBC)的测序数据,而第二测序引物和第二引物结合位点提供来自插入段的测序数据,在标识测序和插入段测序之间没有变性步骤。因此,本技术提供了在标识测序和插入段测序之间没有变性步骤的多核苷酸结构体测序方法。在一些实施例中,多核苷酸结构体包括一个插入段和一个标识。在一些实施例中,通过将第一引物退火至多核苷酸结构体的标识3'的区域对标识进行测序,通过添加与标识互补的标记核苷酸延伸第一引物,并检测添加的标记核苷酸以确定标识的序列,其中第一引物的延伸形成包括标识和与标识互补的链的双链标识部分。在一些实施例中,通过将第二引物退火至多核苷酸结构体中插入段3'的区域进行插入段测序,通过添加与插入段互补的标记核苷酸延伸第二引物,并检测添加的标记核苷酸以确定插入段的序列
在一些实施例中,所述方法包括在将第二引物退火至多核苷酸结构体之前,将第一引物延伸所需的周期或长度,从而对标识进行测序。在一些实施例中,所述方法包括在延伸第二引物之前将与标识互补的链连结至第二引物。
在一些实施方案中,本方法包括用第一引物对多核苷酸结构体的标识进行测序,之后通过添加与标识互补的未标记核苷酸延伸双链标识部分,直到互补链延伸基本全部的标识或标识的所需部分。
在一些实施例中,本方法包括用第一引物对多核苷酸结构体的标识进行测序,之后在加入第二引物和标记核苷酸以及对插入段进行测序之前向双链标识部分加入阻断核苷酸。在一些实施例中,阻断核苷酸是2',3'-双脱氧核苷酸。
本发明技术的另一方面提供了如上所述用于执行本测序方法的试剂盒。用于对目的多核苷酸进行测序的试剂盒包括一个或多个接头;一个或多个引物;标记核苷酸;以及(a)未标记核苷酸;和/或(b)阻断核苷酸。在一些实施例中,阻断核苷酸是双脱氧核苷酸。在一些实施例中,试剂盒进一步包括一对与一个或多个接头中存在的序列互补或相同的引物。所述试剂盒还可以包括合适的反应试剂(如缓冲剂等)用于DNA制备、扩增或测序方法。试剂盒的各种成分可以存在于单独的容器中,或者根据需要将某些兼容的成分预先组合至一个容器中。例如,在一些实施例中,引物和标记核苷酸可以混合在一起,即在一个容器中。除上述试剂外,试剂盒还可包括上述方法中使用的任何额外成分,如一种或多种酶和/或缓冲剂等。
在一些实施例中,本发明的方法和试剂盒用于检测突变的存在、位置或缺失,如单核苷酸多态性(SNP)或目的多核苷酸中的基因组重排。在一些实施例中,本方法包括对多核苷酸结构体进行单端测序或双端测序。
本方法包括在同一方向对第一和第二引物延伸部分进行测序。来自第一和第二引物延伸的组合序列数据有利于读段比对和识别插入段和插入段中的突变。在同一方向上产生的读段组合使得识别更准确。
本方法可作为高通量测序方法(如二代测序(NGS)方法)的一部分。在一些实施例中,高通量测序方法包括三个步骤:制备文库、固定化和测序。多核苷酸样品通常被破碎,接头连接至片段的一端或两端以形成测序文库。接头可以是线性接头、环形接头或泡形接头(bubble adaptor)。测序文库分子被固定在固体载体上,并进行测序反应以确定多核苷酸序列。高通量测序方法可以采用乳液PCR(Emulsion PCR)、桥式PCR(Bridge-PCR)或滚环(Rolling Circle)扩增来提供原始多核苷酸结构体的克隆或复制品。
聚合酶在PCR过程中往往会出错(最常见的是核苷酸的错误结合),如果这些错误发生在早期周期,它们会在测序数据分析中显示为变体。分子标识可用于区分PCR错误和插入段中的实际变体。分子条形码是指待扩增的池中的每个多核苷酸都附有一个唯一的分子标识。具有不同分子标识的序列读段代表不同的原始插入段,而具有相同标识的读段是来自同一原始插入段的PCR复制的结果。美国专利8,481,292(群体遗传学技术有限公司Population Genetics Technologies Ltd.)中公开了称为多义碱基区(DBR)的分子条形码。DBRs是附着在样品中存在的分子上的随机序列标签。DBRs和其他分子条形码能够将样品制备过程中的PCR错误与原始多核苷酸中存在的突变和其他变体区分开来。
如上所述,本发明方法的多个实施例包括将一个或多个接头连接至插入段上以形成多核苷酸结构体。接头可以在扩增之前或之后连接至插入段上,在一些实施例中,多核苷酸结构体是多核苷酸扩增子。接头可以通过任何合适的技术进行连接,例如通过连结、使用转座酶、杂交结合(hybridization)和/或引物延伸。在一些实施例中,插入段与接头一端或两端连结。在连结反应中,两个或多个核酸分子(如插入段和接头)的末端之间形成共价键或连接。键合或连接的性质可以不同,连结可以通过酶促或化学方法进行。连结通常以酶促法进行,以在一个多核苷酸或寡核苷酸的末端核苷酸的5'碳与另一个多核苷酸或寡核苷酸的3'碳之间形成一个磷酸二酯连接。在一些实施例中,接头是一个Y接头,其可以产生具有不同5'端的文库并具有适合在Illumina MiniSeq、NextSeq和HiSeq 3000/4000测序仪器上使用的P5和P7引物位点。
在一些实施例中,本方法包括在插入段连接至接头之前和/或之后对插入段进行扩增。在一些实施例中,接头位于多核苷酸中目的序列的5'-端,并且接头为目的序列的扩增提供引物位点。适配的多核苷酸用第一扩增引物和第二扩增引物进行扩增。第一扩增引物对多核苷酸中的靶序列具有序列特异性,并能与靶序列的一部分(目的多核苷酸)杂交结合。第二条扩增引物能够与接头的引物位点或目的多核苷酸的靶向引物位点杂交结合。在扩增步骤中,第一扩增引物与靶序列杂交结合,第二引物与接头上的序列引物位点杂交结合。在一些实施例中,第一扩增引物在适配多核苷酸的5'-端杂交结合。本方法的引物应足够大,以与插入段的靶序列充分杂交结合。
可以使用任何合适的方法扩增插入段。在一些实施例中,使用聚合酶链反应(PCR)扩增插入段。一般来说,PCR包括多核苷酸链的变性(例如,DNA解链),引物退火至变性的多核苷酸链,以及引物与聚合酶延伸以合成互补多核苷酸。所述过程一般需要DNA聚合酶、正向和反向引物、三磷酸脱氧核苷、二价阳离子和缓冲溶液。在一些实施例中,插入段是线性扩增的。在一些实施例中,插入段是用乳液PCR(Emulsion PCR)、桥式PCR(Bridge-PCR)或滚环(Rolling Circle)扩增的。扩增后的插入段可以用合适的测序方法进行分析,以确定碱基对的顺序。
在一些实施例中,插入段、多核苷酸结构体和/或引物中的一个或多个被固定在固体载体上。扩增引物和/或插入段的固定便于冲洗多核苷酸,以去除任何不需要的类(例如,脱氧核苷酸)。在一些实施例中,多核苷酸结构体包括一个或多个附在固体载体上的接头,使多核苷酸固定在载体上。在一些实施例中,多核苷酸结构体被固定在流动芯片或载玻片的表面上。在一些实施例中,多核苷酸结构体被固定在微滴孔或磁珠上。在一些实施例中,固体载体可涂覆有连接至官能团或分子的聚合物。在一些实施例中,固体载体可以携带氨基、羟基或羧基等官能团,或携带用于连接接头的亲和素或链霉亲和素等分子。
多核苷酸结构体可以包括结合配体,例如生物素分子,以促进插入段富集或分离。插入段可以连接至包含结合配体的接头上,或使用包含结合配体的一个或多个引物扩增插入段。在一些实施例中,本方法包括在互为结合配体的物质之间形成复合物,如生物素化的引物延伸产物和负载于固体的亲和素或链霉亲和素。本方法还可以包括通过互为结合配体的物质的结合来富集包含含有结合配体的多核苷酸结构体的样品。蛋白质亲和素和链霉亲和素与生物素和某些生物素类似物形成异常紧密的复合体。一般来说,当生物素通过其羧基侧链与第二分子耦合时,产生的耦合物仍然被亲和素或链霉亲和素紧密结合。在制备这种耦合物时,第二分子被“生物素化”。实用的结合配体包括生物素:亲和素,生物素:链霉亲和素,抗体:抗原和互补核酸。
用于二代测序的多核苷酸的制备通常在二代测序之前采用靶向富集,并且本方法可以包括一种或多种靶向富集协议。通过对一个或多个所需插入段进行富集,测序可以更有针对性,并且减少工作量和费用和/或实现高覆盖深度。目前用于二代测序的富集协议包括基于杂交结合的捕获协议(hybridization-based capture protocol),如安捷伦(Agilent)的SureSelect Hybrid Capture和因美纳(Illumina)的TruSeq Capture。其他示例包括基于PCR的协议,如安捷伦的HaloPlex;赛默飞(ThermoFisher)的AmpliSeq;因美纳(Illumina)的TruSeq Amplicon;以及Raindance的乳液/数字PCR。
如上所述,可以通过引物延伸对多核苷酸结构体进行测序。引物延伸通过检测作为第一引物延伸的产物并入的碱基来确定序列,可以确定多核苷酸结构体的至少一部分插入段(或一些实施例中的标识序列)。第二引物延伸通过检测作为第二引物延伸的产物并入的碱基来确定序列,可以检测标识(或一些实施例中的插入段序列)。
在一些实施例中,以可逆染料终止子为标签通过SBS测序法来进行测序。在一些实施例中,可以通过边连结边测序(SBL)法进行测序。在一些实施例中,可以通过单分子测序进行测序。在一些实施例中,可以通过焦磷酸测序法进行测序。多核苷酸可以使用任何合适的反应方法进行测序。在一些实施例中,可使用单个核苷酸(即对应于G、A、T或C的核苷酸)完成单个反应周期,所述方法涉及检测是否并入核苷酸。如果并入一个核苷酸,即已知所述核苷酸的种类。在本实施例中,所述方法可能涉及连续循环所有四个核苷酸(即对应于G、A、T和C的核苷酸),并且应并入其中一个核苷酸。在本实施例中,例如,核苷酸的并入可以通过检测焦磷酸释放、质子释放或荧光来检测,所述方法是已知的。例如,在一些实施例中,链终止子核苷酸可以是末端磷酸标记的荧光核苷酸(即具有连接至末端磷酸的荧光团的核苷酸),并且识别步骤包括荧光读取。在其他实施例中,链终止子核苷酸可以是一个包括在末端磷酸上具有淬灭剂的荧光核苷酸。在所述实施例中,并入核苷酸可去除核苷酸的淬灭剂,从而检测到荧光标记。在其他实施例中,末端磷酸标记链终止子核苷酸可以在末端磷酸上设置质谱标记、电荷标记、电荷阻断标记、化学发光标记、氧化还原标记或其他可检测标记。
在一些实施例中,可以使用所有四种核苷酸(即对应于G、A、T和C的核苷酸)进行单次反应循环,每个核苷酸用不同的荧光团标记。在所述实施例中,测序步骤可以包括将对应于G、A、T和C的四种链终止子加入至扩增的多核苷酸中,其中四种链终止子包括不同的荧光团。在所述实施例中,识别步骤可以包括识别四种链终止子中的哪一种被添加到引物的末端。
测序步骤可以使用单端测序法进行,即在同一方向上读取第一引物延伸和第二引物延伸序列。在一些实施例中,使用被配置为用于单端测序的测序仪对多核苷酸进行测序。在一些实施例中,所述方法包括连续实时监测测序反应(即核苷酸的并入)。通过在链式延伸反应混合物中加入“检测酶”,以同时进行引物延伸和检测,或信号生成和反应,来实现所述方法。在一些实施例中,引物延伸反应首先作为第一反应步骤单独进行,随后进行单独的“检测”反应来检测引物延伸产物。
示例1
在所述示例中,本测序方法的各种实施例在插入段测序和标识测序之间没有变性步骤。多核苷酸结构体按以下方法制备:用Covaris型号E220剪切DNA,用安捷伦SureSelectXT HS靶富集系统进行末端修复、加尾(A-tailing)、连结和PCR扩增。所述示例中使用的插入段是人类基因组DNA(NA12878),具有样品标识的接头被连接至已知插入段,由此插入段序列和标识序列之间的关联是已知的,并且可以用来评估实验方法。多核苷酸结构体通过12轮PCR进行扩增。富集多核苷酸结构体被收集并在SBS测序仪上进行测序,其中多核苷酸结构体附着在流动芯片上。除了下面描述的各种实验差异外,引物、核苷酸和聚合酶添加至流动芯片中,按照正常的操作程序进行引物扩增反应。测序数据根据标识序列进行分组,插入段序列根据其相关的标识序列分配至样品组。统计误配的插入段序列和标识序列,并用于评估测序方法的性能。
实验A和B作为本实施例的对照,即用第一测序引物进行插入段测序,从而形成双链插入段部分,其包括插入段和在测序过程中用标记核苷酸延伸第一引物形成的互补链。根据现有技术方法,在通过用标记核苷酸延伸第二引物以对标识进行测序之前进行变性步骤,以分离互补链与插入段。在实验C和D中,以同样的方式对插入段进行测序,但在添加用于标识的第二条测序引物并用于标识测序之前,通过用标记核苷酸延伸第一条引物形成的互补链并没有变性。标识的测序引物(即第二条测序引物)是在进行了用于插入段测序的七十次测序周期后加入的。在实验E和F中,对插入段进行了七十个测序周期,之后在测序反应中加入阻断核苷酸(2',3'-双脱氧核苷酸)以防止双链插入段部分继续延伸。随后从流动芯片移除阻断核苷酸,并将标识的测序引物与标记核苷酸一起引入流动芯片。这些实验(实验E和F)在加入第二个测序引物之前也没有使双链插入段部分变性。实验G和H与其他实验不同,首先对标识进行测序,然后对插入段进行测序;然而,与实验C至F一样,使用第一个引物测序产生的双链部分并没有变性。在实验G和H中,引入流动芯片的第一个引物是用来对标识进行测序的,它退火至标识3'端的引物结合点。用标记核苷酸对标识进行测序,形成其中一条链基本上与标识完全互补的双链标识部分。加入第二个引物,使之退火至插入段3'端的第二个引物结合点。在这些多核苷酸结构体中,标识与插入段的引物结合位点相邻。在开始对插入段进行测序之前,双链标识部分连结至第二引物上,从而消除了与初始多核苷酸结构体互补链上的任何空隙。加入标记核苷酸,在对插入段进行测序时形成与插入段互补的链。
根据具有误配的测序读段的比例来评估性能,其结果总结在图5中。对照组(实验A和B)中95.3-93.5%的读段具有0或1个误配。实验C和D中88.1-89.3%的读段具有0或1个以上误配。实验E和F中91.5-92.0%的读段具有0或1个误配。实验G因不明原因而失败,但实验H表明,98%(对照组97%)的读段具有2个或更少的误配。
因此,以上实验表明,本测序方法可以为插入段和标识生成高质量测序数据,并且在插入段测序和标识测序之间没有变性步骤。
示例性实施例
实施例1一种对多核苷酸结构体中的插入段和标识进行测序的方法,所述方法包括将第一引物退火至多核苷酸结构体中插入段3'的区域,通过添加与插入段互补的标记核苷酸延伸第一引物,并检测添加的标记核苷酸以确定插入段序列,其中第一引物的延伸形成包含插入段和与插入段互补的链的双链插入段部分;将第二引物退火至多核苷酸结构体中标识3'的区域;通过添加与标识互补的标记核苷酸延伸第二引物,并检测添加的标记核苷酸以确定标识序列,其中双链插入段部分在退火和延伸第二引物之前未变性。
实施例2根据实施例1所示的方法,所述方法包括延伸第一引物,并在退火第二引物前检测添加的标记核苷酸至少七十个测序周期。
实施例3根据实施例1所示的方法,进一步包括在添加标记核苷酸后,通过添加未标记核苷酸以延伸双链插入段部分,直至互补链完全延伸插入段。
实施例4根据实施例1所示的方法,进一步包括在加入标记核苷酸之后,向双链插入段部分加入阻断核苷酸。
实施例5根据实施例4所示的方法,其中所述阻断核苷酸是双脱氧核苷酸。
实施例6根据前述任一实施例所示的方法,其中所述多核苷酸结构体包括捕获位点、用于第一引物的第一引物结合位点、标识、用于第二引物的第二引物结合位点以及插入段。
实施例7根据实施例6所示的方法,其中所述标识包括样品标识和/或分子标识。
实施例8根据实施例6或7所示的方法,其中第一引物结合位点与插入段的5'端邻接。
实施例9根据实施例6、7或8所示的方法,其中第二引物结合位点与样品标识或分子标识邻接。
实施例10一种对多核苷酸结构体中的插入段和标识进行测序的方法,所述方法包括:将第一引物退火至多核苷酸结构体中标识3'的区域,通过添加与标识互补的标记核苷酸延伸第一引物,并检测添加的标记核苷酸以确定标识序列,其中第一引物的延伸形成包括标识和与标识互补的链的双链标识部分;将第二引物退火至多核苷酸结构体中插入段3'的区域;通过添加与插入段互补的标记核苷酸延伸第二引物,并检测添加的标记核苷酸以确定插入段序列,其中双链插入段部分在退火和延伸第二引物之前未变性。
实施例11根据实施例10所示的方法,所述方法包括在延伸第二引物之前,将与标识互补的链连结至第二引物。
实施例12根据实施例10所示的方法,进一步包括在添加标记核苷酸后,通过添加未标记核苷酸延伸双链标识部分,直至互补链完全延伸所有标识。
实施例13根据实施例10所示的方法,进一步包括在添加标记核苷酸后,向双链标识部分添加阻断核苷酸。
实施例14根据实施例13所示的方法,其中所述阻断核苷酸是双脱氧核苷酸。
实施例15根据实施例10至14中任一项所示的方法,其中所述多核苷酸结构体包括捕获位点、用于第一引物的第一引物结合位点、标识、用于第二引物的第二引物结合位点以及插入段。
实施例16根据实施例15所示的方法,其中所述标识包括样品标识和/或分子标识。
实施例17根据实施例15或16所示的方法,其中所述标识包括5'端和3'端,并且第一引物结合位点与标识的5'端邻接。
实施例18根据实施例15、16或17所示的方法,其中第二引物结合位点与插入段的5'端邻接。
实施例19一种用于对目的多核苷酸进行测序的试剂盒,所述试剂盒包括:一个或多个接头;一个或多个引物;标记核苷酸;以及(a)未标记核苷酸和/或(b)阻断核苷酸。
实施例20根据实施例19所示的试剂盒,包括阻断核苷酸,其中所述阻断核苷酸是双脱氧核苷酸。
鉴于本公开内容应当指出,所述发明方法可以按照本发明指导实施。此外,各种部件、材料、结构和参数仅用于说明和举例,而不包括任何限制性意义。鉴于本公开内容,本发明可以在其他应用中实施,并且可以确定实施这些应用的部件、材料、结构和设备仍然在本发明权利要求的范围内。
Claims (20)
1.一种对多核苷酸结构体中的插入段和标识进行测序的方法,包括:
将第一引物退火至多核苷酸结构体中插入段3'的区域,
通过添加与插入段互补的标记核苷酸延伸第一引物,
并检测添加的标记核苷酸以确定插入段序列,其中
第一引物的延伸形成包括插入段和与插入段互补的链的双链插入段部分;
将第二引物退火至多核苷酸结构体中标识3'的区域;
通过添加与标识互补的标记核苷酸延伸第二引物,并检测添加的标记核苷酸以确定标识序列,其中
双链插入段部分在退火和延伸第二引物之前未变性。
2.根据权利要求1的方法,所述方法包括延伸第一引物,并在第二引物退火前检测添加的标记核苷酸至少七十个测序周期。
3.根据权利要求1的方法,进一步包括在添加标记核苷酸后,通过添加未标记核苷酸以延伸双链插入段部分,直至互补链完全延伸插入段。
4.根据权利要求1的方法,进一步包括在加入标记核苷酸之后,向双链插入段部分加入阻断核苷酸。
5.根据权利要求4的方法,其中所述阻断核苷酸是双脱氧核苷酸。
6.根据权利要求1的方法,其中所述多核苷酸结构体包括捕获位点、用于第一引物的第一引物结合位点、标识、用于第二引物的第二引物结合位点以及插入段。
7.根据权利要求6的方法,其中所述标识包括样品标识和/或分子标识。
8.根据权利要求6的方法,其中第一引物结合位点与插入段的5'端邻接。
9.根据权利要求6的方法,其中第二引物结合位点与样品标识或分子标识邻接。
10.一种对多核苷酸结构体中的插入段和标识进行测序的方法,包括:
将第一引物退火至多核苷酸结构体中标识3'的区域;
通过添加与标识互补的标记核苷酸延伸第一引物,并检测添加的标记核苷酸以确定标识序列,其中第一引物的延伸形成包括标识和与标识互补的链的双链标识部分;
将第二引物退火至多核苷酸结构体中插入段3'的区域;
通过添加与插入段互补的标记核苷酸延伸第二引物,并检测添加的标记核苷酸以确定插入段序列,其中
双链标识部分在退火和延伸第二引物之前未变性。
11.根据权利要求10的方法,所述方法包括在延伸第二引物之前,将与标识互补的链连结至第二引物。
12.根据权利要求10的方法,进一步包括在添加标记核苷酸后,通过添加未标记核苷酸延伸双链标识部分,直至互补链完全延伸标识。
13.根据权利要求10的方法,进一步包括在添加标记核苷酸后,向双链标识部分添加阻断核苷酸。
14.根据权利要求13的方法,其中所述阻断核苷酸是双脱氧核苷酸。
15.根据权利要求10的方法,其中所述多核苷酸结构体包括捕获位点、用于第一引物的第一引物结合位点、标识、用于第二引物的第二引物结合位点以及插入段。
16.根据权利要求15的方法,其中所述标识包括样品标识和/或分子标识。
17.根据权利要求15的方法,其中所述标识包括5'端和3'端,并且第一引物结合位点与标识的5'端邻接。
18.根据权利要求15的方法,其中第二引物结合位点与插入段的5'端邻接。
19.一种用于对目的多核苷酸进行测序的试剂盒,所述试剂盒包括:
一个或多个接头;
一个或多个引物;
标记核苷酸;以及
(a)未标记的核苷酸和/或(b)阻断核苷酸。
20.根据权利要求19的试剂盒,所述试剂盒包括阻断核苷酸,其中所述阻断核苷酸是双脱氧核苷酸。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US17/144,900 US20220220550A1 (en) | 2021-01-08 | 2021-01-08 | Sequencing an insert and an identifier without denaturation |
US17/144900 | 2021-01-08 | ||
PCT/US2021/062222 WO2022150135A1 (en) | 2021-01-08 | 2021-12-07 | Sequencing an insert and an identifier without denaturation |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116710573A true CN116710573A (zh) | 2023-09-05 |
Family
ID=82322780
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180083385.0A Pending CN116710573A (zh) | 2021-01-08 | 2021-12-07 | 插入段和标识无变性测序方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220220550A1 (zh) |
EP (1) | EP4274911A1 (zh) |
JP (1) | JP2024502293A (zh) |
CN (1) | CN116710573A (zh) |
WO (1) | WO2022150135A1 (zh) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3017063B1 (en) * | 2013-07-03 | 2017-04-05 | Illumina, Inc. | Sequencing by orthogonal synthesis |
WO2015073711A1 (en) * | 2013-11-13 | 2015-05-21 | Nugen Technologies, Inc. | Compositions and methods for identification of a duplicate sequencing read |
WO2017218979A1 (en) * | 2016-06-17 | 2017-12-21 | The Broad Institute, Inc. | Unbiased detection of nucleic acid modifications |
EP3507365A4 (en) * | 2016-08-30 | 2020-05-06 | Metabiotech Corporation | METHOD AND COMPOSITIONS FOR PHASE CONTROLLED SEQUENCING |
WO2019002366A1 (en) * | 2017-06-27 | 2019-01-03 | F. Hoffmann-La Roche Ag | MODULAR ADAPTERS OF NUCLEIC ACID |
US20210189460A1 (en) * | 2018-04-25 | 2021-06-24 | Qiagen Sciences Llc | Sequential paired-end sequencing |
-
2021
- 2021-01-08 US US17/144,900 patent/US20220220550A1/en active Pending
- 2021-12-07 CN CN202180083385.0A patent/CN116710573A/zh active Pending
- 2021-12-07 WO PCT/US2021/062222 patent/WO2022150135A1/en active Application Filing
- 2021-12-07 JP JP2023539019A patent/JP2024502293A/ja active Pending
- 2021-12-07 EP EP21918047.8A patent/EP4274911A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4274911A1 (en) | 2023-11-15 |
JP2024502293A (ja) | 2024-01-18 |
WO2022150135A1 (en) | 2022-07-14 |
US20220220550A1 (en) | 2022-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2705165B1 (en) | Quantitative nuclease protection assay (qnpa) and sequencing (qnps) improvements | |
CN109689888B (zh) | 无细胞核酸标准品及其用途 | |
US20100120034A1 (en) | Methylation analysis of mate pairs | |
US9822394B2 (en) | Nucleic acid sample preparation | |
JP2016511007A (ja) | 鎖になったrnaまたはdnaのライブラリを生成するための方法、組成物およびキット | |
CN104080958A (zh) | 用于定向核酸扩增和测序的组合物和方法 | |
WO2012003374A2 (en) | Targeted sequencing library preparation by genomic dna circularization | |
WO2017177017A1 (en) | Methods of quantifying target nucleic acids and identifying sequence variants | |
CN117778531A (zh) | 分子库制备方法以及其组合物和用途 | |
US20220364169A1 (en) | Sequencing method for genomic rearrangement detection | |
CN111801427B (zh) | 用于单分子的单链环状dna模板的产生 | |
US20170175182A1 (en) | Transposase-mediated barcoding of fragmented dna | |
US20220259587A1 (en) | Methods for generating, and sequencing from, asymmetric adaptors on the ends of polynucleotide templates comprising hairpin loops | |
JP7134186B2 (ja) | Rnaおよびdnaからの核酸ライブラリーの作製 | |
EP3198064B1 (en) | Methods for sample preparation | |
KR20240024835A (ko) | 비이드-기반 핵산의 조합 인덱싱을 위한 방법 및 조성물 | |
KR20230124636A (ko) | 멀티플렉스 반응에서 표적 서열의 고 감응성 검출을위한 조성물 및 방법 | |
CN116710573A (zh) | 插入段和标识无变性测序方法 | |
CN110468179A (zh) | 选择性扩增核酸序列的方法 | |
WO2018009677A1 (en) | Fast target enrichment by multiplexed relay pcr with modified bubble primers | |
AU2022419500A1 (en) | Periodate compositions and methods for chemical cleavage of surface-bound polynucleotides | |
WO2023122499A1 (en) | Periodate compositions and methods for chemical cleavage of surface-bound polynucleotides | |
EP4347872A2 (en) | Oligo-modified nucleotide analogues for nucleic acid preparation | |
CN115279918A (zh) | 用于测序的新型核酸模板结构 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |