JP2024502293A - 変性のない挿入物および識別子の配列決定 - Google Patents
変性のない挿入物および識別子の配列決定 Download PDFInfo
- Publication number
- JP2024502293A JP2024502293A JP2023539019A JP2023539019A JP2024502293A JP 2024502293 A JP2024502293 A JP 2024502293A JP 2023539019 A JP2023539019 A JP 2023539019A JP 2023539019 A JP2023539019 A JP 2023539019A JP 2024502293 A JP2024502293 A JP 2024502293A
- Authority
- JP
- Japan
- Prior art keywords
- primer
- identifier
- insert
- sequencing
- nucleotide
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 183
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 189
- 239000002773 nucleotide Substances 0.000 claims abstract description 184
- 238000000034 method Methods 0.000 claims abstract description 101
- 230000000903 blocking effect Effects 0.000 claims abstract description 29
- 102000040430 polynucleotide Human genes 0.000 claims description 134
- 108091033319 polynucleotide Proteins 0.000 claims description 134
- 239000002157 polynucleotide Substances 0.000 claims description 134
- 230000000295 complement effect Effects 0.000 claims description 57
- 238000000137 annealing Methods 0.000 claims description 20
- 239000005546 dideoxynucleotide Substances 0.000 claims description 12
- 238000007481 next generation sequencing Methods 0.000 abstract description 16
- 238000004925 denaturation Methods 0.000 abstract description 12
- 230000036425 denaturation Effects 0.000 abstract description 12
- 238000010586 diagram Methods 0.000 abstract 1
- 239000000523 sample Substances 0.000 description 23
- 150000007523 nucleic acids Chemical class 0.000 description 20
- 108020004414 DNA Proteins 0.000 description 19
- 102000053602 DNA Human genes 0.000 description 19
- 230000003321 amplification Effects 0.000 description 19
- 238000003199 nucleic acid amplification method Methods 0.000 description 19
- 102000039446 nucleic acids Human genes 0.000 description 17
- 108020004707 nucleic acids Proteins 0.000 description 17
- 238000006243 chemical reaction Methods 0.000 description 16
- 238000002474 experimental method Methods 0.000 description 16
- 239000002777 nucleoside Substances 0.000 description 16
- 238000003752 polymerase chain reaction Methods 0.000 description 13
- 150000003833 nucleoside derivatives Chemical class 0.000 description 12
- 239000012634 fragment Substances 0.000 description 11
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical group N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 10
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 10
- 150000001875 compounds Chemical class 0.000 description 9
- 108091034117 Oligonucleotide Proteins 0.000 description 8
- 229910019142 PO4 Inorganic materials 0.000 description 8
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 8
- 238000009396 hybridization Methods 0.000 description 8
- 229910052739 hydrogen Inorganic materials 0.000 description 8
- 239000001257 hydrogen Substances 0.000 description 8
- 235000021317 phosphate Nutrition 0.000 description 8
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 8
- 229920000388 Polyphosphate Polymers 0.000 description 7
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 7
- 239000001205 polyphosphate Substances 0.000 description 7
- 235000011176 polyphosphates Nutrition 0.000 description 7
- 230000037452 priming Effects 0.000 description 7
- 238000010348 incorporation Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 239000007787 solid Substances 0.000 description 6
- 108090001008 Avidin Proteins 0.000 description 5
- 108010090804 Streptavidin Proteins 0.000 description 5
- 102000008579 Transposases Human genes 0.000 description 5
- 108010020764 Transposases Proteins 0.000 description 5
- 229960002685 biotin Drugs 0.000 description 5
- 235000020958 biotin Nutrition 0.000 description 5
- 239000011616 biotin Substances 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000013467 fragmentation Methods 0.000 description 5
- 238000006062 fragmentation reaction Methods 0.000 description 5
- 125000003835 nucleoside group Chemical group 0.000 description 5
- 239000010452 phosphate Substances 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 235000000346 sugar Nutrition 0.000 description 5
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 4
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 4
- 229930024421 Adenine Natural products 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 description 4
- 229960000643 adenine Drugs 0.000 description 4
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 229940104302 cytosine Drugs 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000012165 high-throughput sequencing Methods 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 229940113082 thymine Drugs 0.000 description 4
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 3
- 108700011259 MicroRNAs Proteins 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 229910052799 carbon Inorganic materials 0.000 description 3
- -1 deoxyribose sugars Chemical class 0.000 description 3
- 239000000839 emulsion Substances 0.000 description 3
- 150000002148 esters Chemical class 0.000 description 3
- 239000007850 fluorescent dye Substances 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 239000002679 microRNA Substances 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 150000003013 phosphoric acid derivatives Chemical group 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 150000003212 purines Chemical class 0.000 description 3
- 150000003230 pyrimidines Chemical class 0.000 description 3
- 238000010008 shearing Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- WKKCYLSCLQVWFD-UHFFFAOYSA-N 1,2-dihydropyrimidin-4-amine Chemical compound N=C1NCNC=C1 WKKCYLSCLQVWFD-UHFFFAOYSA-N 0.000 description 2
- YKBGVTZYEHREMT-KVQBGUIXSA-N 2'-deoxyguanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 YKBGVTZYEHREMT-KVQBGUIXSA-N 0.000 description 2
- FSASIHFSFGAIJM-UHFFFAOYSA-N 3-methyladenine Chemical compound CN1C=NC(N)=C2N=CN=C12 FSASIHFSFGAIJM-UHFFFAOYSA-N 0.000 description 2
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- 108091093088 Amplicon Proteins 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 108020004635 Complementary DNA Proteins 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 108020005196 Mitochondrial DNA Proteins 0.000 description 2
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 2
- 238000001069 Raman spectroscopy Methods 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000012472 biological sample Substances 0.000 description 2
- 238000010804 cDNA synthesis Methods 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 150000001768 cations Chemical class 0.000 description 2
- 125000003636 chemical group Chemical group 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 125000000524 functional group Chemical group 0.000 description 2
- 125000000623 heterocyclic group Chemical group 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- 235000021092 sugar substitutes Nutrition 0.000 description 2
- 239000003765 sweetening agent Substances 0.000 description 2
- 235000011178 triphosphate Nutrition 0.000 description 2
- 239000001226 triphosphate Substances 0.000 description 2
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- VGONTNSXDCQUGY-RRKCRQDMSA-N 2'-deoxyinosine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=CNC2=O)=C2N=C1 VGONTNSXDCQUGY-RRKCRQDMSA-N 0.000 description 1
- ZDTFMPXQUSBYRL-UUOKFMHZSA-N 2-Aminoadenosine Chemical compound C12=NC(N)=NC(N)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ZDTFMPXQUSBYRL-UUOKFMHZSA-N 0.000 description 1
- MWBWWFOAEOYUST-UHFFFAOYSA-N 2-aminopurine Chemical compound NC1=NC=C2N=CNC2=N1 MWBWWFOAEOYUST-UHFFFAOYSA-N 0.000 description 1
- CKTSBUTUHBMZGZ-ULQXZJNLSA-N 4-amino-1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-tritiopyrimidin-2-one Chemical compound O=C1N=C(N)C([3H])=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 CKTSBUTUHBMZGZ-ULQXZJNLSA-N 0.000 description 1
- 125000001572 5'-adenylyl group Chemical group C=12N=C([H])N=C(N([H])[H])C=1N=C([H])N2[C@@]1([H])[C@@](O[H])([H])[C@@](O[H])([H])[C@](C(OP(=O)(O[H])[*])([H])[H])([H])O1 0.000 description 1
- LQLQRFGHAALLLE-UHFFFAOYSA-N 5-bromouracil Chemical compound BrC1=CNC(=O)NC1=O LQLQRFGHAALLLE-UHFFFAOYSA-N 0.000 description 1
- UBKVUFQGVWHZIR-UHFFFAOYSA-N 8-oxoguanine Chemical compound O=C1NC(N)=NC2=NC(=O)N=C21 UBKVUFQGVWHZIR-UHFFFAOYSA-N 0.000 description 1
- PVKSNHVPLWYQGJ-KQYNXXCUSA-N AMP-PNP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)NP(O)(O)=O)[C@@H](O)[C@H]1O PVKSNHVPLWYQGJ-KQYNXXCUSA-N 0.000 description 1
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 1
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 102100034343 Integrase Human genes 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 108091093037 Peptide nucleic acid Proteins 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- DWAQJAXMDSEUJJ-UHFFFAOYSA-M Sodium bisulfite Chemical compound [Na+].OS([O-])=O DWAQJAXMDSEUJJ-UHFFFAOYSA-M 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 229940045686 antimetabolites antineoplastic purine analogs Drugs 0.000 description 1
- 229940045688 antineoplastic antimetabolites pyrimidine analogues Drugs 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 150000001615 biotins Chemical class 0.000 description 1
- QTPILKSJIOLICA-UHFFFAOYSA-N bis[hydroxy(phosphonooxy)phosphoryl] hydrogen phosphate Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(=O)OP(O)(=O)OP(O)(O)=O QTPILKSJIOLICA-UHFFFAOYSA-N 0.000 description 1
- 125000002837 carbocyclic group Chemical group 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007850 degeneration Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- VGONTNSXDCQUGY-UHFFFAOYSA-N desoxyinosine Natural products C1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 VGONTNSXDCQUGY-UHFFFAOYSA-N 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000007847 digital PCR Methods 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000835 electrochemical detection Methods 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 230000032050 esterification Effects 0.000 description 1
- 238000005886 esterification reaction Methods 0.000 description 1
- 150000002170 ethers Chemical class 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 125000005843 halogen group Chemical group 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 125000005462 imide group Chemical group 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 108091005601 modified peptides Proteins 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 238000001668 nucleic acid synthesis Methods 0.000 description 1
- 238000011017 operating method Methods 0.000 description 1
- 150000002972 pentoses Chemical class 0.000 description 1
- 150000003014 phosphoric acid esters Chemical class 0.000 description 1
- 238000005498 polishing Methods 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- 238000010791 quenching Methods 0.000 description 1
- 230000000171 quenching effect Effects 0.000 description 1
- 239000000941 radioactive substance Substances 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 150000003291 riboses Chemical class 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000007841 sequencing by ligation Methods 0.000 description 1
- 230000009919 sequestration Effects 0.000 description 1
- 235000010267 sodium hydrogen sulphite Nutrition 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 239000004291 sulphur dioxide Substances 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6853—Nucleic acid amplification reactions using modified primers or templates
- C12Q1/6855—Ligating adaptors
Abstract
【課題】次世代シーケンシング用の方法およびキットを開示する。【解決手段】いくつかの実施形態では、本方法は、挿入物を配列決定すること、および、介入的な変性ステップなしで挿入物を配列決定することを備えている。挿入物配列からの低減されたシーケンシング信号、二本鎖挿入物構築物を形成するための非標識ヌクレオチドの使用、および、合成のブロッキングヌクレオチドの使用についても検討する。【選択図】図1
Description
次世代シーケンシング手法用の方法およびキットを開示する。
本願は、2021年1月8日に出願された米国特許出願第17/144,900号明細書の優先権を主張するものであり、その内容は、全体が参照により本明細書に組み込まれる。
次世代シーケンシング(NGS)は分子生物学に大改革をもたらしてきており、ゲノム配列を判定することを著しく速め、より安価にしている。デオキシリボ核酸(DNA)および他のポリヌクレオチドに対してNGSを行うために、通常、アダプターと一般に呼ばれる公知の配列を有するオリゴヌクレオチドの追加によって、シーケンシングシステムとの使用のためにポリヌクレオチドを調製しなければならない。これらの公知のアダプターは、シーケンサーのフローセルにおいて相補的なオリゴヌクレオチドにアニールすることになる配列を追加することなどにより、ポリヌクレオチドをシステムに適合させる。アダプターは、シーケンシング器具への付着、シーケンシングプライマーのアニーリング、および/または、生体試料(すなわち、サンプルバーコード(SBC)もしくは特有の分子バーコード(MBC)))のインデックス化用の領域などの、複数の機能領域を含んでいてもよい。SBCおよびMBCは、不明のDNA配列(挿入物)を、対象となるポリヌクレオチド試料とともに配列決定して、挿入物の生物源および特異性をそれぞれ識別できる。
合成(SBS)システムによるシーケンシング(配列決定)では、4つの蛍光標識ヌクレオチドを使用して、フローセル表面の数千万のクラスターを平行に配列決定する。各シーケンシングサイクル中に、単一の標識化したデオキシヌクレオシド三リン酸(dNTP)を、核酸鎖に追加する。ヌクレオチド標識は、重合の終結部位(terminator)として働くため、各dNTP取り込み後に、蛍光染料が、塩基を識別するために撮像され、次いで、酵素的に開裂されて、次のヌクレオチドの取り込みを可能にする。4つの可逆的な終結部位結合dNTP(A、C、T、G)すべては、単一の別個の分子として存在するため、自然競争により取り込みバイアスが最小化される。各ヌクレオチドの識別は、各サイクル中に測定された標識からの信号に基づき、行われる。その結果が、対象となるポリヌクレオチド中の各ヌクレオチドを連続的に識別するシーケンシング方法である。
多くの合成によるシーケンシング(sequencing-by-synthesis)システムでは、挿入物は、標識ヌクレオチドからの相補的なストランドを形成することにより配列決定され、次いで、この挿入物シーケンシングから合成されたストランドが、変性により除去される。挿入物からのシーケンシング信号は識別子の続くシーケンシングに干渉すると信じられているため、この変性ステップが必要であると信じられている。
いくつかの形式では、DNAなどのポリヌクレオチドが、(フローセル、ビーズなどの)シーケンシングシステムにおいて、1つまたはそれ以上のアダプターを介して固体表面に添付されており、かつ、信号強度を増すために増幅される。一般に、ポリヌクレオチド構築物を形成するために1つもしくはそれ以上のアダプターを断片に付着した状態での、ポリヌクレオチド断片への試料の断片化と、ポリヌクレオチド断片の増幅とにより、ライブラリがシーケンシング用に調製される。断片を、1つまたはそれ以上の増幅プライマーで増幅できる。合成によるシーケンシングシステムでは、シーケンシングプライマーが、ポリヌクレオチド構築物のプライマー結合部位にハイブリダイズし、標識ジデオキシヌクレオチドが、シーケンシングプライマーが伸長される際に、酵素的に追加される。配列を判定するために、標識ジデオキシヌクレオチドからの信号が検知および分析される。
対象となるポリヌクレオチドを、シングルエンドまたはペアエンドシーケンシング方法を使用して分析してもよい。シングルエンドシーケンシング方法は、断片の一方の末端から反対側の末端に向かって、ゲノム断片を読み取ることを含んでいる。シングルエンドシーケンシングリードにより、断片の2つの末端の一方のn塩基対に対応する断面ごとに1回の読み取りが行われ、その際、nはシーケンシングサイクルの回数となる。ペアエンド方法は、核酸断片を一方の末端から他の末端へ、特定のリード長まで読み取ることと、断片の反対側からの読み取りという、その後の別のラウンドとを含んでいる。ペアエンド方法について、順方向配列リードおよび逆方向配列リードが行われて、データが隣接する配列へと対合される。配列は、参照試料と適合されて、バリアントを識別する。
上述したものなどのNGSシーケンシングシステムは一般に、標識ヌクレオチドを追加した結果として形成された、事前に合成されたストランドが、新たなプライマーアニーリングおよびシーケンシングを開始する前に変性される(挿入物から分離される)ことを必要とする。例えば、挿入物を配列決定した結果として生成された相補的なストランドが、SBCおよび/またはMBCを配列決定するために、第2のシーケンシングプライマーをアニールする前に変性される。あるいは、SBCおよび/またはMBCを配列決定したときに生成される、合成されたストランドが、DNA挿入物を配列決定するためにプライマーをアニールする前に変性される。
しかし、変性は、時間のかかるステップであり、かつ、DNA挿入物を損傷して、場合によってはシーケンシングエラーを持ち込むことがある。したがって、変性ステップを必要としないシーケンシング方法が、その方法が高スループットのシーケンシング分析と組み合わせて有用性を持つ場合に特に、この分野に対して有益な貢献を為すであろう。
The Biochemistry of the Nucleic Acids(第11版、1992年、Adams他)
本開示は、次世代シーケンシング用の方法およびキットを提供する。本方法は全体として、挿入物を配列決定することと、変性ステップを介在させることなく、ポリヌクレオチド構築物中に存在する識別子を配列決定することとを備えており、それにより、シーケンシングに必要とされる時間を低減し、生じ得るシーケンシングエラーを回避し、かつ/または、他の利点をもたらす。
本発明のこれらおよび他の特徴および利点は、添付の特許請求の範囲と併せて、以下の詳細な説明から明らかとなるであろう。
本教示は、添付図面とともに読むことで、以下の詳細な説明から、最もよく理解される。特徴は、必ずしも正確な比率で描かれていない。
本明細書で使用する専門用語が、特定の実施形態を説明することのみを目的としており、限定することを意図していないことを理解されたい。定義された用語は、本教示の技術分野で一般に理解され受け入れられる、定義された用語の技術的および科学的な意味への追加である。
「ポリヌクレオチド」という用語は本明細書において、例えば、約10個の塩基より大きい、約100個の塩基より大きい、約500個の塩基より大きい、約1000個の塩基より大きい、約10,000個までまたはそれ以上の塩基の、任意の長さのポリマーであって、ヌクレオチド(例えば、デオキシリボヌクレオチドもしくはリボヌクレオチド)で構成された、または、例えば2つの天然に存在する核酸がワトソンクリック塩基対合相互作用に参加できるものに類似した、天然に存在する核酸により配列に特有の仕方でハイブリダイズできる、合成的に生成された化合物(例えば、特許文献1、および、その中で引用された参考文献に記載のPNA)で構成されたポリマーを説明するために使用される。天然に存在するヌクレオチドには、グアニン、シトシン、アデニンおよびチミン(それぞれG、C、AおよびT)が含まれる。
本明細書で定義される際、「ヌクレオシド」という用語は、1'位置または均等な位置で炭素環式または非環式リンカーなどの糖または糖置換体(sugar substitute)に結合されたプリン、デアザプリンまたはピリミジン塩基を含み、かつ、2'-デオキシおよび2'-ヒドロキシル、2',3'-ジデオキシ形態ならびに他の置換を含む化合物のことである。
「ヌクレオシドポリリン酸塩」という用語は本明細書で使用する際、2つまたはそれ以上のリン酸基を有する、ヌクレオシドのリン酸エステルを指す。アデノシン三リン酸およびデオキシグアノシン五リン酸(deoxyguanosine pentaphosphate)がヌクレオシドポリリン酸塩の例である。ヌクレオシドポリリン酸塩は、末端リン酸塩または内部リン酸塩(internal phosphate)に付着した化学基を含んでいてもよい。例えば、ヌクレオシドポリリン酸塩は、ポリリン酸鎖中の末端リン酸塩または内部リン酸塩に付着した電気化学的標識(electrochemical label)、質量タグ、チャージ封鎖標識、または、色原体標識(chromogenic label)、化学発光標識、蛍光染料、または、蛍光消光標識を有する分子を含んでいてもよい。標識として使用してもよい化学基のさらなる例には、発色団、酵素、抗原、重金属、磁気プローブ、燐光発光基(phosphorescent group)、放射性物質、分散または蛍光ナノ粒子、ラマン信号生成部分(Raman signal generating moiety)、および、電気化学的検出部分が含まれる。くわえて、「ヌクレオシドポリリン酸塩」という用語は本明細書で使用する際、イミド基、または、リン酸鎖に対する他の修飾を備えていてもよい、ヌクレオシドのリン酸エステルを指す。例えば、アデニリルイミドリン酸塩(adenylyl imidophosphate)(AMP-PNP)およびデオキシシトシン5'-(ガンマ-チオ三リン酸塩(gamma-thiotriphosphate))およびADP.BeF3などの類似体が、ヌクレオシドポリリン酸塩のさらなる例である。
「ヌクレオチド」という用語は本明細書で使用する際、エステル化部位が通常、ペントース糖のC-5位置に付着したヒドロキシル基に対応している、ヌクレオシドのリン酸エステルを指す。ある場合、ヌクレオチドはヌクレオシドポリリン酸塩を備えている。しかし、「追加のヌクレオチド」、「取り込まれたヌクレオチド」、「追加されたヌクレオチド」および「取り込み後のヌクレオチド」という用語はすべて、オリゴヌクレオチドまたはポリヌクレオチド鎖の一部であるヌクレオチド残基を指す。
「ヌクレオシド」、「ヌクレオチド」、「デオキシヌクレオシド」および「デオキシヌクレオチド」という用語は、公知のプリンおよびピリミジン塩基だけでなく、修飾されている他の複素環塩基をも含む、これらの部分が含まれることを意図している。このような修飾には、メチル化プリンまたはピリミジン、アシル化プリンまたはピリミジン、アルキル化リボースまたは他の複素環が含まれる。くわえて、「ヌクレオシド」、「ヌクレオチド」、「デオキシヌクレオシド」および「デオキシヌクレオチド」には、従来のリボースおよびデオキシリボース糖だけでなく他の糖も同様に含むこれらの部分が含まれる。修飾ヌクレオシド、ヌクレオチド、デオキシヌクレオシドまたはデオキシヌクレオチドは、糖部分に対する修飾をも含んでおり、例えば、その際、ヒドロキシル基の1つまたはそれ以上が、ハロゲン原子もしくは脂肪族基に置き換えられており、または、エーテル、アミンなどとして官能化されている。
天然のヌクレオチドまたはヌクレオシドを本明細書において、アデニン(A)、チミン(T)、グアニン(G)およびシトシン(C)と定義する。これらのヌクレオチドまたはヌクレオシドの特定の修飾は天然に存在することが認められている。しかし、水素結合による塩基対合に影響する天然に存在するA、T、GおよびCの修飾は、非天然存在であるとみなされている。例えば、2-アミノアデノシンは天然に形成されるが、本明細書で用語が使用される際の、「天然に存在する」ヌクレオチドまたはヌクレオシドではない。塩基対合に影響せず、かつ天然に存在するとみなされる、天然に存在する修飾ヌクレオチドまたはヌクレオシドの他の非限定的な例は、5-メチルシトシン、3-メチルアデニン、O(6)-メチルグアニン、8-オキソグアニンなどである。ヌクレオチドには、任意のヌクレオチドまたはヌクレオチド類似体が、天然に存在しても合成であっても含まれる。例示的なヌクレオチドには、デオキシアデノシン、デオキシシチジン、デオキシグアノシン、デオキシチミジン、アデノシン、シチジン、グアノシンおよびウリジンのリン酸エステルが含まれる。他のヌクレオチドには、アデニン、シトシン、グアニン、チミン塩基、キサンチンもしくはヒポキサンチン、5-ブロモウラシル、2-アミノプリン、デオキシイノシン、または、5-メチルシトシンなどのメチル化シトシン、および、N4-メトキシデオキシシトシン(N4-methoxydeoxycytosine)が含まれる。例えばメチル化核酸などのポリヌクレオチド模倣体、2'-O-methRNA、ペプチド核酸、修飾ペプチド核酸、ロック核酸、および、DNAもしくはRNA中に存在する1つまたはそれ以上の塩基との塩基の相補性を示すことにより、かつ/または、塩基相補性の取り込みが可能であることにより、実質的に例えばヌクレオチドまたは塩基のように機能できる他の構造的部分も含まれ、かつ、連鎖停止類似体を含んでいる。ヌクレオチドは、特定のヌクレオチド種が少なくとも1つの塩基に関して塩基の相補性を共有している場合、ヌクレオチド種に対応する。
プリンおよびピリミジンに加えて、修飾ヌクレオチドまたは類似体は、本明細書で使用する際に、1つもしくはそれ以上の天然に存在するヌクレオチドと、または、別のヌクレオチド類似体と水素結合を形成できる任意の化合物を含んでいる。TまたはTの誘導体と、少なくとも2つの水素結合を形成する化合物は、Aの類似体または修飾Aであるとみなされる。同様に、AまたはAの誘導体と少なくとも2つの水素結合を形成する化合物は、Tの類似体または修飾Tであるとみなされる。同様に、GまたはGの誘導体と少なくとも2つの水素結合を形成する化合物は、Cの類似体または修飾Cであるとみなされる。同様に、CまたはCの誘導体と少なくとも2つの水素結合を形成する化合物は、Gの類似体または修飾Gであるとみなされる。この枠組みの下で、いくつかの化合物は、例えばA類似体およびG類似体(プリン類似体)の両方またはT類似体およびC類似体(ピリミジン類似体)の両方であるとみなされることになると認識される。
本明細書で使用する際、「ポリヌクレオチド構築物」という用語は、アダプターなどの別の核酸にライゲートされた、または他の仕方で付着されたポリヌクレオチドを指す。例えば、ポリヌクレオチド構築物は、配列決定されることになるDNA挿入物、フローセル付着(flow cell attachment)用のキャプチャー部位、SBCおよびMBCなどの識別子DNA配列、ならびに、第1および第2のプライマー用のプライマー結合部位を含んでいてもよい。
本明細書で使用する際、「挿入物」という用語は、シーケンシングおよび/または他の分析のために望ましいであろう、対象となるポリヌクレオチドを指す。挿入物は、NGSにより配列決定されることになる、ポリヌクレオチド構築物中に存在していてもよい。挿入物は一本鎖であっても、または二本鎖であってもよく、アダプターに付着されてポリヌクレオチド構築物を形成する場合、しばしば二本鎖DNAとなる。「DNA挿入物」は、本明細書で使用する際、特定の配列、または、その相補体、または両方を指してもよい。DNA挿入物は、標的配列を含んでいてもよい。「標的配列」は、細胞のゲノム内で、+試験管内または生体内の核酸内にあってもよく、一本鎖または二本鎖核酸のいずれの形態であってもよい。
本明細書で使用する際、「キャプチャー部位」という用語は、NGSシーケンシングまたは他の分析処理のため、フローセルまたは他の表面へのポリヌクレオチド構築物の付着用に構成された核酸配列を指す。
本明細書で使用する際、「識別子」という用語は、特定のポリヌクレオチド構築物を識別するのに使用できる核酸配列を指す。「識別子」は、特定の生体試料を識別するための「サンプルバーコード」または「SBC」配列であってもよい。「識別子」は、試料中に存在する特有の分子の識別用の「分子バーコード」をも指してもよい。また、「識別子」は、SBCおよびMBCの両方を含んでいてもよい。
本明細書で使用する際、「プライマー結合部位」という用語は、プライマーへのハイブリダイズ用に構成され、その結果、隣接した配列がプライマー伸長などにより増幅または配列決定できる、オリゴヌクレオチドまたはポリヌクレオチド内の部位を指す。プライマー結合部位は一般に、配列の3'末端に隣接しており、それについてシーケンシングデータを提供するよう設計されている。したがって、シーケンシングプライマーは一般に、配列決定されることになる挿入物に相補的なヌクレオチドをシーケンシングプライマーの3'末端に追加するように、挿入物に隣接したプライマー結合部位に結合する。プライマー結合部位は、対象となるポリヌクレオチドに存在する配列であっても、または、プライマー結合部位を備えるアダプターを追加することによりポリヌクレオチドに追加される配列であってもよい。プライマー結合部位を含むアダプターは、ライゲーションにより、トランスポーゼース(transposase)の使用により、プライマー伸長により、または、他の技術により追加できる。
「ハイブリダイゼーション」または「ハイブリダイズ」は、全部または一部が相補的な核酸ストランドが、特定のハイブリダイゼーション条件下で集合して、2つの成分ストランド(constituent strand)が水素結合により結び合わされる二本鎖構造または領域を形成する処理を指す。水素結合は通常、アデニンおよびチミンもしくはウラシル(AおよびTまたはC)、または、シトシンおよびグアニン(CおよびG)の間に形成されるが、他の塩基対が形成してもよい(例えば非特許文献1)。
「プライマー」という用語は、(プライマー結合部位などの)ポリヌクレオチドテンプレートで二本鎖を形成する際に、伸長二本鎖が形成されるよう、核酸合成の開始点として働くことができ、かつ、3'末端からテンプレートに沿って伸長されることができる、オリゴヌクレオチドを意味する。伸長処理中に追加されたヌクレオチドの配列は、ポリヌクレオチドテンプレートの配列により判定される。プライマーが、DNAポリメラーゼ、RNAポリメラーゼまたは逆転写酵素により触媒作用を受けたヌクレオチド重合用の開始点として機能する。プライマーは、酵素的に形成されていても、または合成であっても、4~1000個の塩基またはそれ以上の長さ(例えば10~500個の塩基)であってもよい。
本明細書で使用する際、「プライマー伸長」という用語は、ポリメラーゼを使用して特定のヌクレオチドをプライマーの3'末端にアニールすることによる、プライマーの伸長を指す。
「アダプター」という用語は、合成ポリヌクレオチドまたはポリヌクレオチド構築物を形成するために、対象となるポリヌクレオチドに付着された、核酸分子を指す。アダプターは一本鎖または二本鎖であってもよく、DNA、RNAおよび/または人工ヌクレオチドを備えていてもよい。アダプターは、対象となるポリヌクレオチドの末端に位置していてもよく、または、中間部もしくは内部に位置していてもよい。アダプターは、増幅用のプライマー結合部位を提供する、または、識別子を配列決定もしくは追加するなど、ポリヌクレオチド構築物に1つまたはそれ以上の機能領域を追加できる。例として、アダプターは、第1のプライマー結合部位、SBCおよび/またはMBCなどの識別子、第2のプライマー結合部位、ならびに、キャプチャー部位を含んでいてもよい。アダプターは、シーケンシング用のプライミング部位を含めて、ユニバーサルプライマーおよび/またはユニバーサルプライミング部位をも含んでいてもよい。さらなる例として、アダプターは、分子バーコード、サンプルバーコードおよび/または標的特異的バーコードなどの、さまざまな種類の、または、さまざまな目的のための、1つまたはそれ以上のバーコードを含んでいてもよい。
「シーケンシング(配列決定)」という用語は、1つまたはそれ以上のヌクレオチドの正体を、すなわち、ヌクレオチドがG、A、TまたはCであるかを、判定することを指す。
「二本鎖を得る」という用語は、例えば、a)1つの核酸(例えばオリゴヌクレオチド)を別のものにハイブリダイズすること、b)、核酸をテンプレートとして使用して核酸にハイブリダイズされているプライマーを伸長(し、それにより、第1のプライマーを有する第1の二本鎖を、伸長プライマーを備える第2の二本鎖へと変換)すること、または、c)より長い二本鎖分子に切れ目を入れ(より長い二本鎖分子をニックし)、次いで、エクソヌクレアーゼを使用して切れ目(ニック)部位からヌクレオチドを除去することにより形成された二本鎖を指す。
本明細書で使用する際、配列の「一部」または「断片」という用語は、配列全体よりも小さい配列(例えば、ヌクレオチド配列またはアミノ酸部分列)の任意の部分を指す。ポリヌクレオチドの一部は、任意の長さ(例えば、少なくとも5、10、15、20、25、30、40、50、75、100、150、200、300または500個またはそれ以上のヌクレオチドの長さ)であってもよい。ガイド配列の一部は、ガイド配列の約50%、40%、30%、20%、10%、例えばガイド配列の3分の1以下、例えば7、6、5、4、3または2個のヌクレオチドの長さであってもよい。
本開示において、数値範囲は、範囲を規定する数字を含んでいる。化学構造および化学式が例示の目的で延長または拡張されてもよいことを認識されたい。
本明細書および添付の特許請求の範囲で使用する際に、かつ、それらの通常の意味に加えて、「実質的な」および「実質的に」という用語は、当業者にとって許容可能な限界または程度内であることを意味する。例えば、「実質的に中止された」は、当業者であれば中止を許容可能であるとみなすという意味である。
本明細書および添付の特許請求の範囲で使用する際に、かつ、その通常の意味に加えて、「およそ」および「約」という用語は、当業者にとって許容可能な限界または量内であることを意味する。「約」という用語は一般に、示された数字のプラスまたはマイナス15%を指す。例えば、「約10」は、8.7~1.15の範囲を示してもよい。例えば、「およそ同じ」は、比較している品目が当業者にとって同じであるとみなせることを意味する。
本明細書および添付の特許請求の範囲で使用する際、「1つの」および「前記」という用語は、文脈が明らかに別の意味を示していない限り、単数および複数の言及の両方を含む。ゆえに、例えば、「1つのプライマー」は、1つのプライマーおよび複数のプライマーを含む。本開示では、第1、第2、第3などの序数は、(文脈が明らかに別の意味を示唆していない限り)第1の事象が第2の事象の前に起きることを意味しない。むしろ、これらは、異なる事象を互いに区別するために使用される。第1または第2の要素を有する方法またはキットが、別の意味が示唆されていない限り、第3、第4、第5などをも含んでいてもよい。
本明細書で開示される際、複数の値の範囲が示されている。こうした範囲の上限および下限の間に入る各値も、明示的に開示されていると理解される。記載の範囲が限度の1つまたは両方を含む場合、これら含まれる限度のいずれかまたは両方を除く範囲も、本発明に含まれる。
本明細書で参照した特許および出版物はすべて、参照により明示的に組み込まれる。出版物の引用は、出願日前のその開示についてであり、本願請求項が、かかる出版物に先行する資格がないことの容認であるとみなすべきではない。さらに、示される出版物の日付は、独立して確認できる実際の刊行日と異なっている場合がある。
この開示を読む際に当業者にとって明らかなように、本明細書で説明および例示する個々の実施形態はそれぞれ、本教示の範囲または精神を逸脱することなく、他の複数の実施形態のいずれかの特徴と容易に分離または組み合わせできる、別個の構成要素および特徴を有している。列挙した方法のいずれも、列挙した事象の順序で、または、論理的に可能な他の任意の順序で行うことができる。
本技術は、ポリヌクレオチド構築物中に存在する挿入物および識別子を配列決定する間の、変性の使用を低減または回避する、シーケンシング用の方法を提供する。図1は、本方法によるシーケンシングであってもよい、挿入物および2つの識別子を備える、例示的なポリヌクレオチド構築物100を示している。無論、ポリヌクレオチド構築物の他の構成も本方法で採用できると考えられる。
より詳しくは、図1は、挿入物110と、挿入物110の各末端に付着されたアダプター120、130とを備える、例示的なポリヌクレオチド構築物100を示している。ポリヌクレオチド構築物100は、トップストランド102およびボトムストランド104を備えているが、多くのシーケンシングシステムに関し、ストランド102、104は、シーケンシング器具への導入前に分離されることになる。ストランド102、104のいずれかまたは両方は、シーケンシング用に使用されてもよいが、ボトムストランド104が、識別子および挿入物に関して、プライマー結合部位の3'から5'への測位のために、多くのシーケンシングシステムと一緒に、より容易に使用される。挿入物110は、対象となるいずれのポリヌクレオチドであってもよく、アダプター120、130は、挿入物110の次世代シーケンシングを促進するために付着される。アダプター120は、挿入物110を配列決定するためにシーケンシングプライマーが結合することになる、第1のプライマー結合部位122などの、シーケンシングを促進するための複数の機能領域を備えている。アダプター120は、試料識別子124、分子識別子126および第2のプライマー結合部位128をも備えている。第2のシーケンシングプライマーは、分子識別子126および試料識別子124を配列決定するために、第2のプライマー結合部位128に結合することになる。第1および第2のシーケンシングプライマーを異なる時間にシーケンシングシステムに追加することにより、ユーザは、システムがシーケンシングを挿入物110で行うことになるか、または識別子124、126で行うことになるかを決定する。アダプター130はキャプチャー部位132を備えており、キャプチャー部位132は、(キャプチャー部位132に相補的なプライマーを有するフローセルなどの)シーケンシングシステムにおいて、ポリヌクレオチド構築物100を支持体に付着させることになる。このように、例示的なポリヌクレオチド構築物100は、フローセル付着用のキャプチャー部位と、配列決定されることになるDNA挿入物と、配列決定されることになる分子および試料識別子を含むDNA識別子配列と、挿入物および識別子配列にそれぞれ隣接する第1および第2のシーケンシングプライマー用のプライマー結合部位とを含んでいる。しかし、アダプターを1つだけ備える、または、追加の機能領域もしくはより少ない機能領域を有するアダプターを備える、ポリヌクレオチド構築物などの、ポリヌクレオチド構築物の他の構成をも、本方法およびキットとともに使用してもよいと考えられる。
挿入物は、ゲノムDNA(gDNA)、RNAテンプレート(例えば、メッセンジャーRNA(mRNA)またはマイクロRNA(マイクロRNA))から導出された相補的なDNA(cDNA)、ミトコンドリアDNA(mtDNA)、mRNAなどのRNA、マイクロRNA、および、他のポリヌクレオチドを含む、その配列が対象となる任意のポリヌクレオチドであってもよい。挿入物は、微生物、ウイルス、菌類、植物または哺乳動物などの、いずれの起源であってもよい。挿入物はいずれの適切な塩基長であってもよく、これは一般に、使用されることになるシーケンシングシステムに基づいて選択されることになる。
挿入物は、任意の適切な機構によって取得されてもよい。いくつかの実施形態では、ゲノムDNAを備える試料が、物理的な断片化、酵素的な断片化または化学剪断断片化などによる、いずれかの適切な技術を使用して断片化される。いくつかの実施形態では、ポリヌクレオチドは、超音波処理、音響剪断(acoustic shearing)または水力学剪断(hydrodynamic shearing)などの、物理的な断片化方法を使用して断片化される。いくつかの実施形態では、ポリヌクレオチドは、制限酵素を使用して断片化される。いくつかの実施形態では、ポリヌクレオチドは、DNase Iまたはトランスポーゼースなどの酵素を使用して断片化される。いくつかの実施形態では、ポリヌクレオチドは、金属カチオンの存在中での加熱温浸(heat digestion)などの化学的な剪断方法を使用して断片化される。いくつかの実施形態では、ポリヌクレオチドは、ランダムに断片化される。いくつかの実施形態では、ポリヌクレオチドは、亜硫酸水素ナトリウム(sodium bisulfite)または他の化学修飾剤で処理できる。いくつかの実施形態では、ポリヌクレオチド断片が、シーケンシングライブラリを格納するのに使用される。
いくつかの実施形態では、挿入物は、少なくとも約30,約50、約70,約100もしくはそれより長い塩基長、または、最大で約2,000、約1,000、約800、約500、約200、約120もしくはそれより短い塩基長を有している。上述した下限および上限を組み合わせて、挿入物の塩基長に関する範囲を形成できる。
さまざまなアダプターがこの分野において公知であり、本方法およびキットにおける使用のために、使用または変更できる。例えば、適切なアダプターは、さまざまな5'末端を有するライブラリを生成するためにポリヌクレオチドに付着できるYアダプターを含んでいる。アダプターは、Aアダプターがポリヌクレオチドの1つの末端に付着され、かつ、Bアダプターがポリヌクレオチドの反対側の末端に付着される、別個の配列(例えばA/Bアダプター)であってもよい。アダプターは、ステムループアダプターであってもよく、ステムループアダプターでは、ヘアピンループがポリヌクレオチドの末端に付着されており、一部(通常はステム(幹))を、増幅またはシーケンシング前に開裂できる。アダプターは、ライゲーション(結紮)、トランスポーゼースの使用、ハイブリダイゼーション、および/または、プライマー伸長を含むがこれらに限定されない、任意の適切な技術により、挿入物に付着できる。例えば、アダプターは、通常、末端修復(end-repairing)および仕上げ(polishing)などにより、ライゲーションのために挿入物を調製したのちに、挿入物の末端にライゲート(結紮)されてもよい。別の例として、アダプターを、トランスポーゼースを使用して、アダプターを備えるトランスポゾンをポリヌクレオチドに挿入することにより、付着させてもよく、それにより、ポリヌクレオチドから形成した挿入物の末端にアダプターが設けられる。
いくつかの実施形態では、ポリヌクレオチド構築物は、識別子を配列決定するためのプライマー結合部位と、1つまたはそれ以上の識別子と、挿入物を配列決定するためのプライマー結合部位と、挿入物と、任意でキャプチャー部位と、を備えており、から本質的に成っており、または、から成っている。ポリヌクレオチド構築物は、一本鎖分子、二本鎖分子、または、一本鎖部分および二本鎖部分を有する分子として設けることができる。いくつかの実施形態では、識別子は、試料識別子、または分子識別子、または両方を備えている。いくつかの実施形態では、挿入物は、5'末端および3'末端を備えており、プライマー結合部位が、挿入物の末端の1つに近接している。いくつかの実施形態では、プライマー結合部位が、試料識別子または分子識別子に近接している。いくつかの実施形態では、一本鎖ポリヌクレオチド構築物(single-stranded polynucleotide construct)が(5'から3'の順序または3'から5'の順序で)、識別子を配列決定するためのプライマー結合部位と、1つまたはそれ以上の識別子と、挿入物を配列決定するためのプライマー結合部位と、挿入物と、任意でキャプチャー部位と、を備えており、から本質的に成っており、または、から成っている。
いくつかの実施形態では、本方法は、いくつかのシステムにおける複数のシーケンシングサイクルの後に生じる信号強度の低下に影響を与える。例えば、いくつかの合成によるシーケンシングシステムでは、標識ヌクレオチドが一つずつ、シーケンシングサイクルにおいて、挿入物に相補的なストランドに追加される。サイクルが進むにつれて、標識から生成される信号は、強度が低下する。第1のプライマーが伸長される約70回のシーケンシングサイクル後に、続く標識ヌクレオチドが追加されて生成される信号を、シーケンシングが第2のプライマーで始まった場合、無視または度外視できることが分かっている。すなわち、識別子シーケンシング用に伸長されている第2のプライマーからの信号は、第1のプライマー伸長からの信号に比べて、明確に強くなることになる。したがって、第1のプライマーを伸長することが続いており、かつ、挿入物に相補的なストランドを変性しなかった場合でも、第2のプライマーを伸長して識別子を配列決定できる。
例えば、図2に示すように、挿入物を、所望の数のシーケンシングサイクル用に、第1のシーケンシングプライマーからまず、配列決定できる。図2は、挿入物210を備えるストランド204と、試料識別子224と、分子識別子226とが配列決定される、本シーケンシング方法の実施形態を示している。ストランド204は、そのキャプチャー部位232により、シーケンシング器具中の表面に付着される。第1のプライマー240が、挿入物210を配列決定するために、第1のプライマー結合部位222に結合する。標識ヌクレオチドがプライマー伸長により追加されると、挿入物210に相補的なストランド242が結果として生じ、それにより二本鎖挿入物部分(double-stranded insert portion)が形成される。複数のシーケンシングサイクルを行った(例えば、少なくとも70回のシーケンシングサイクル。それにより、およそ70個のヌクレオチドの相補的なストランド242が形成される)のち、第2のプライマー250がシーケンシングシステムに(例えば、ポリヌクレオチドが配列決定されているフローセルに)供給される。第2のプライマー250は、第2のプライマー結合部位228に結合し、標識ヌクレオチドの追加により伸長される。このようにして、識別子224、226が配列決定され、二本鎖識別子部分252を形成する。相補的なストランド242を挿入物210から分離する介入的な変性ステップなしで、第2のプライマー250は伸長され、かつ、識別子は配列決定される。相補的なストランド242に追加されている標識ヌクレオチドにより生成される信号は、第2のシーケンシングプライマーの追加に先立って十分に低減されて、低減された信号は、二本鎖識別子部分252からの新たな識別子シーケンシング信号に対して、取るに足りない影響しか持たなくなる。いくつかの実施形態では、少なくとも30、35、40、45、50、55、60、65、70、75、80、85、90、95、100またはそれ以上の挿入物シーケンシングサイクルが、第2のプライマーの追加または識別子シーケンシングサイクルを行う前に行われる。いくつかの実施形態では、シーケンシングシステムにより、挿入物シーケンシングからの信号水準が、第2のプライマーが追加される前に、閾値であるか、または閾値未満であるかが判定される。いくつかの実施形態では、シーケンシングシステムにより、挿入物シーケンシングからの挿入信号水準が、第2のプライマーを追加する前に検知されて、挿入物信号水準に基づき、検知された識別子信号水準の解釈(interpretation)を調整する。
いくつかの実施形態では、本技術により、変性ステップなしでポリヌクレオチド構築物を配列決定するための方法が提供される。いくつかの実施形態では、ポリヌクレオチド構築物は挿入物および識別子を備えている。いくつかの実施形態では、挿入物は、3'から挿入物へのプライマー結合部位にて第1のプライマーをポリヌクレオチド構築物にアニールすることにより、配列決定される。本方法は、挿入物に相補的な標識ヌクレオチドの追加により第1のプライマーを伸長すること、および、追加された標識ヌクレオチドを検知して挿入物の配列を判定することをも備えており、その際、第1のプライマーの伸長により、挿入物と、挿入物に相補的なストランドとを備える二本鎖挿入物部分が形成される。いくつかの実施形態では、次いで、識別子が、3'から識別子へのプライマー結合部位にて第2のプライマーをポリヌクレオチド構築物にアニールし、識別子に相補的な標識ヌクレオチドの追加により第2のプライマーを伸長し、かつ、追加された標識ヌクレオチドを検知して識別子の配列を判定することにより、配列決定される。
いくつかの実施形態では、本方法は、挿入物の実質的にすべてが二本鎖化されるまで、挿入物に相補的なストランドを伸長し続けることにより、標識ヌクレオチドの追加後に二本鎖挿入物部分を伸長することを備えている。ストランドの伸長を、相補的なストランドが挿入物に対して実質的に完全に伸長するまで、相補的な標識ヌクレオチドよりも非標識ヌクレオチで続けることができる。このように、本方法のいくつかの実施形態では、第1のプライマーが標識ヌクレオチドとともに使用されて挿入物を配列決定し、次いで、非標識ヌクレオチド(例えば、蛍光標識または他の修飾を有さない天然のヌクレオチド(A、G、TおよびC))をシーケンシング反応に追加して、残った挿入物について合成を完了する。いくつかのNGSプラットフォームで利用される標識ヌクレオチドと異なり、(天然のヌクレオチドであってもよい)非標識ヌクレオチドは、追加の化学的なステップまたはDNAポリメラーゼ変異体なしで取り込むことができる。非標識ヌクレオチドが追加されて挿入物配列に相補的なストランドが形成されて、それにより二本鎖挿入物部分が形成されると、挿入物への追加的なヌクレオチド追加のための挿入物は残っていない。次いで、第2のシーケンシングプライマーが第2のプライマー部位にアニールされ、かつ、識別子を配列決定するために標識ヌクレオチドが追加される。このように、識別子(例えばMBCおよび/またはSBC)を配列決定するために変性は必要でない。これは、伸長されるべく残っている他の一本鎖挿入物が存在しないためである。いくつかの実施形態では、この手法は、非標識の天然のヌクレオチドの使用が、続くシーケンシングステップに対して最小の影響しか持たないゆえに、望ましくもある。
図3は、挿入物310と、試料識別子324と、分子識別子326とを備えるストランド304が配列決定される、本シーケンシング方法のいくつかの実施形態を示している。ストランド304は、そのキャプチャー部位332により、シーケンシング器具における表面に付着される。挿入物310を配列決定するために、第1のプライマー340が第1のプライマー結合部位322に結合する。標識ヌクレオチドがプライマー伸長により追加されると、挿入物310に相補的なストランド342が結果として生じ、それにより二本鎖挿入物部分が形成される。所望の数のシーケンシングサイクルが行われ(例えば、少なくとも30、35、40、45、50、55、60、65、70、75、80、85、90、95、100またはそれ以上のシーケンシングサイクル)、それにより相補的なストランド342を、第1のプライマー340を伸長することによって形成する。所望の数のシーケンシングサイクル後に、非標識ヌクレオチドがシーケンシング反応に追加され、プライマー伸長が、挿入物310の実質的に全部などの、挿入物310の所望の長さにわたって伸長するストランド346で継続する。任意で、標識ヌクレオチドは、非標識ヌクレオチドの追加前に除去される。いくつかの実施形態では、非標識ヌクレオチドの追加は、標識が存在しない、かつ/または、標識の検知がないために、標識ヌクレオチドの追加よりも、かなり急速に進行する。挿入物310の実質的に全部(または別の所望の長さ)を備える二本鎖挿入物部分を形成したのち、第2のプライマー結合部位328と結合する第2のプライマー350が追加される。第2のプライマー350が標識ヌクレオチドにより伸長され、かつ、識別子が配列決定され、それにより、二本鎖識別子部分352が形成される。ストランド346が、挿入物310の所望の長さを占めているため、標識ヌクレオチドは、挿入物310にハイブリダイズできず、信号を生成しないことになる。
いくつかの実施形態では、本方法は、標識ヌクレオチドの追加後に、1つまたはそれ以上のブロッキングヌクレオチドを二本鎖構築物部分に追加することを備えている。このような実施形態では、挿入物が十分な数のシーケンシングサイクルについて配列決定されると、挿入物シーケンシングを、別のサイクルについて、3'-デオキシヌクレオチドまたは他の重合ブロッキングヌクレオチドの追加によりブロックできる。3'-デオキシヌクレオチドは、ストランドの3'末端に追加でき、3'-OH基が存在しないゆえに、ヌクレオチドのさらなる追加をブロックする。ブロッキングヌクレオチドの他の例は、2'3'-ジデオキシヌクレオチド、アシクロヌクレオチド(Acyclonucleotide)などである。第1のプライマーから伸長したストランドがブロックされたのち、第2のシーケンシングプライマーを第2のプライマー結合部位にアニールして、識別子を配列決定できる。
図4は、挿入物410と、試料識別子424と、分子識別子426とを備えるストランド404が配列決定される、本シーケンシング方法のいくつかの実施形態を示している。ストランド404は、そのキャプチャー部位432により、シーケンシング器具における表面に付着される。挿入物410を配列決定するために、第1のプライマー440が第1のプライマー結合部位422に結合する。標識ヌクレオチドがプライマー伸長により追加されると、挿入物410に相補的なストランド442が結果として生じ、それにより二本鎖挿入物部分が形成される。所望の数のシーケンシングサイクルが行われ(例えば、少なくとも30、35、40、45、50、55、60、65、70、75、80、85、90、95、100またはそれ以上のシーケンシングサイクル)、それにより相補的なストランド342を、第1のプライマー440を伸長することによって形成する。所望の数のシーケンシングサイクル後に、もう1つのブロッキングヌクレオチド448がシーケンシングサイクル反応に追加され、ストランド442を形成するプライマー伸長が停止する。ブロッキングヌクレオチドの追加前に、標識ヌクレオチドを除去する必要はない。一般に、ストランド442の末端で取り込まれずに残ったブロッキングヌクレオチドは、識別子シーケンシングのための第2のプライマー450および追加の標識ヌクレオチドの追加前に、フローセルから除去される。第2のプライマー450が、第2のプライマー結合部位428と結合する。第2のプライマー450が標識ヌクレオチドの追加により伸長され、かつ、識別子が配列決定され、それにより、二本鎖識別子部分452が形成される。
本シーケンシング方法のいくつかの実施形態では、識別子の配列決定と挿入物の配列決定との間の変性ステップなしで、第1のシーケンシングプライマーおよび第1のプライマー結合部位により、識別子(SBCおよび/またはMBC)からのシーケンシングデータが供給される一方、第2のシーケンシングプライマーおよび第2のプライマー結合部位により、挿入物からのシーケンシングデータが供給される。このように、本技術により、識別子の配列決定と挿入物の配列決定との間の変性ステップなしで、ポリヌクレオチド構築物を配列決定するための方法が提供される。いくつかの実施形態では、ポリヌクレオチド構築物は、挿入物および識別子を備えている。いくつかの実施形態では、識別子は、3'から識別子へのポリヌクレオチド構築物の領域に第1のプライマーをアニールし、識別子に相補的な標識ヌクレオチドの追加により第1のプライマーを伸長し、かつ、追加された標識ヌクレオチドを検知して挿入物の配列を判定することによって、配列決定され、その際、第1のプライマーの伸長により、識別子と、識別子に相補的なストランドとを備える二本鎖識別子部分が形成される。いくつかの実施形態では、次いで、挿入物は、3'から挿入物へのポリヌクレオチド構築物の領域に第2のプライマーをアニールし、挿入物に相補的な標識ヌクレオチドの追加により第2のプライマーを伸長し、かつ、追加された標識ヌクレオチドを検知して挿入物の配列を判定することにより、配列決定される。
いくつかの実施形態では、本方法は、所望の期間または長さについて第1のプライマーを伸長させ、それにより、第2のプライマーをポリヌクレオチド構築物にアニールする前に、識別子を配列決定することを備えている。いくつかの実施形態では、本方法は、第2のプライマーを伸長する前に、識別子に相補的なストランドを第2のプライマーにライゲートすることを備えている。
いくつかの実施形態では、本方法は、第1のプライマーでポリヌクレオチド構築物の識別子を配列決定し、次いで、識別子に相補的な非標識ヌクレオチドを、相補的なストランドが実質的にすべての識別子に対して、または識別子の所望の部分に対して伸長するまで、追加することにより、二本鎖識別子部分を伸長することを備えている。
いくつかの実施形態では、本方法は、第1のプライマーでポリヌクレオチド構築物の識別子を配列決定し、次いで、第2のプライマーおよび標識ヌクレオチドの追加ならびに挿入物のシーケンシング前に、二本鎖識別子部分にブロッキングヌクレオチドを追加することを備えている。いくつかの実施形態では、ブロッキングヌクレオチドは2'3'-ジデオキシヌクレオチドである。
本技術の別の局面として、上述したように、本シーケンシング方法を行うために、キットを提供する。対象となるポリヌクレオチドを配列決定するためのキットは、1つまたはそれ以上のアダプターと、1つまたはそれ以上のプライマーと、標識ヌクレオチドと、(a)非標識ヌクレオチド、および、(b)ブロッキングヌクレオチドの一方または両方とを備えている。いくつかの実施形態では、ブロッキングヌクレオチドはジデオキシヌクレオチドである。いくつかの実施形態では、キットはさらに、1つまたはそれ以上のアダプターに存在する配列と相補的または同じ、プライマーの対を備えている。キットは追加で、DNA調製、増幅またはシーケンシング方法を行うのに適した反応試薬(例えばバッファなど)を備えていてもよい。要望に応じて、キットのさまざまな構成要素が別個の入れ物に入っていてもよく、または、特定の相性のよい構成要素を単一の入れ物に事前にまとめていてもよい。例えば、いくつかの実施形態では、プライマーおよび標識ヌクレオチドが混じっていても、すなわち単一の入れ物内にあってもよい。上述した試薬に加えて、キットが、上述した方法で使用する追加の構成要素のいずれか(例えば、1つもしくはそれ以上の酵素および/またはバッファなど)を含んでいてもよい。
いくつかの実施形態では、本方法およびキットは、対象となるポリヌクレオチドにおける単一ヌクレオチド多型(SNP)またはゲノム再編成などの変異の存在、位置または非存在を検知するのに使用される。いくつかの実施形態では、本方法は、ポリヌクレオチド構築物のシングルエンドシーケンシングまたはペアエンドシーケンシングを備えている。
本方法は、同じ方向に第1および第2のプライマー伸長を配列決定することを備えている。第1および第2のプライマー伸長からの組み合わされた配列データにより、挿入物の、および、挿入物における変異の、リードアライメントおよび識別が促進される。同じ方向に生成されたリードの組み合わせによって、より正確な識別が可能となる。
本方法は、次世代シーケンシング(NGS)法などの高スループットのシーケンシング方法の一部として使用してもよい。いくつかの実施形態では、高スループットのシーケンシング方法は、ライブラリ調製、固定化(immobilization)およびシーケンシングという3つのステップを備えている。ポリヌクレオチド試料は一般に断片化され、アダプターが断片の一端または両端に付着されてシーケンシングライブラリを形成する。アダプターは線形アダプター(linear adaptor)、環状アダプター(circular adaptor)またはバブルアダプター(bubble adaptor)であってもよい。シーケンシングライブラリ分子は固体支持体上で固定化され、シーケンシング反応が行われてポリヌクレオチド配列が識別される。高スループットのシーケンシング方法では、エマルジョンPCR、ブリッジPCRまたはローリングサークル増幅を採用して、元のポリヌクレオチド構築物のコロニーまたはコピーを供給してもよい。
ポリメラーゼはPCR中にエラーを生じる傾向があり(最も頻繁であるのがヌクレオチドの誤取り込み(mis-incorporation))、これらのエラーが早期のサイクル中に起きた場合、シーケンシングデータの分析におけるバリアントととして現れる。分子識別子を使用して、挿入物中の実際のバリアントから、PCRエラーを識別できる。分子バーコードの概念とは、増幅されることになる貯留中の各ポリヌクレオチドが、特有の分子識別子に付着されることである。異なる分子バーコードを有する配列リードが、異なる元の挿入物を表す一方で、同じ識別子を有するリードが、同じ元の挿入物からのPCR複製物の産物となる。縮重塩基領域(DBR)と呼ばれる分子バーコードが、特許文献2に開示されている。DBRは、試料中に存在する分子に付着されたランダム配列タグである。DBRおよび他の分子バーコードにより、変異からの試料調製中のPCRエラーと、元のポリヌクレオチド中に存在していた他のバリアントとを区別することが可能となる。
上で検討したように、本方法の多くの実施形態は、挿入物に1つまたはそれ以上のアダプターを付着してポリヌクレオチド構築物を形成することを備えている。アダプターは、増幅前または増幅後に付着でき、かつ、いくつかの実施形態では、ポリヌクレオチド構築物はポリヌクレオチドアンプリコンである。アダプターは、ライゲーション、トランスポーゼースの使用、ハイブリダイゼーションおよび/またはプライマー伸長などの任意の適切な技術により付着できる。いくつかの実施形態では、挿入物は、アダプターで、一端または両端においてライゲートされる。ライゲーション反応では、共有結合または連結が、2つまたはそれ以上の(挿入物およびアダプターなどの)核酸分子の終端の間に形成される。結合または連結の性質は変化してもよく、かつ、ライゲーションは酵素的または化学的に行われてもよい。ライゲーションは通常、酵素的に行われて、1つのポリヌクレオチドまたはオリゴヌクレオチドの末端ヌクレオチドの5'炭素と、別のポリヌクレオチドまたはオリゴヌクレオチドの3'炭素との間にホスホジエステル結合を形成する。いくつかの実施形態では、アダプターは、さまざまな5'末端を有するライブラリであって、かつ、Illumina MiniSeq、NextSeqおよびHiSeq 3000/4000シーケンシング器具(Illumina MiniSeq, NextSeq, and HiSeq 3000/4000 sequencing instruments)において使用するのに適したP5およびP7プライミング部位を有するライブラリを生成できる、Yアダプターである。
いくつかの実施形態では、本方法は、挿入物を、アダプターに付着させる前および/または後に、増幅することを備えている。いくつかの実施形態では、アダプターは、ポリヌクレオチド中で、対象となる配列の5'末端に位置しており、アダプターは、対象となる配列の増幅用に、プライミング部位を提供する。適合されたポリヌクレオチドは、第1の増幅プライマーおよび第2の増幅プライマーを使用して増幅される。第1の増幅プライマーは、ポリヌクレオチド中の標的配列に関して、配列特異性を有しており、標的配列(対象となるポリヌクレオチド)の部分にハイブリダイズできる。第2の増幅プライマーは、アダプターのプライミング部位に、または、対象となるポリヌクレオチドの標的特異的プライミング部位にハイブリダイズできる。増幅ステップ中に、第1の増幅プライマーは標的配列にハイブリダイズし、第2の増幅プライマーはアダプターの配列プライミング部位にハイブリダイズする。いくつかの実施形態では、第1の増幅プライマーは、適合されたポリヌクレオチドの5'末端においてハイブリダイズする。本方法のプライマーは、挿入物の標的配列との適切なハイブリダイゼーションを提供するのに、十分な大きさでなければならない。
挿入物を、いずれかの適切な方法で増幅してもよい。いくつかの実施形態では、挿入物は、ポリメラーゼ連鎖反応(PCR)を使用して増幅される。一般に、PCRは、ポリヌクレオチドストランドの変性(例えばDNA融解)、変性されたポリヌクレオチドストランドへのプライマーのアニーリング、および、相補的なポリヌクレオチドを合成するための、ポリメラーゼでのプライマーの伸長を備えている。処理は一般に、DNAポリメラーゼ、順および逆方向プライマー、デオキシヌクレオシド三リン酸、二価カチオン、ならびに、緩衝液を必要とする。いくつかの実施形態では、挿入物は、線形増幅により増幅される。いくつかの実施形態では、挿入物は、エマルジョンPCR、ブリッジPCRまたはローリングサークル増幅を使用して増幅される。増幅された挿入物を分析し、適切なシーケンシング方法を使用して塩基対の順序を判定してもよい。
いくつかの実施形態では、1つまたはそれ以上の挿入物、ポリヌクレオチド構築物および/またはプライマーを、固体支持体に固定する。増幅プライマーおよび/または挿入物の固定化により、ポリヌクレオチドの洗浄を促進して、任意の望ましくない種(例えばデオキシヌクレオチド)を除去できる。いくつかの実施形態では、ポリヌクレオチド構築物が、固体支持体に付着してポリヌクレオチドが支持体に固定されるようにする、1つまたはそれ以上のアダプターを備えている。いくつかの実施形態では、ポリヌクレオチド構築物は、フローセルまたはスライドガラスの表面に固定される。いくつかの実施形態では、ポリヌクレオチド構築物は、マイクロタイターウェルまたは電磁ビーズに固定される。いくつかの実施形態では、固体支持体は、官能基または部分に付着されたポリマーで被覆されていてもよい。いくつかの実施形態では、固体支持体は、アミノ、ヒドロキシルもしくはカルボキシル基などの官能基、または、アダプターの付着用のアビジンもしくはストレプトアビジンなどの他の部分を有していてもよい。
ポリヌクレオチド構築物は、挿入物の濃縮または分離を促進するために、ビオチン部分などの結合パートナーを備えていてもよい。挿入物を、結合パートナーを備えるアダプターに付着してもよく、または、挿入物を、結合パートナーを備える1つまたはそれ以上のプライマーを使用して、増幅してもよい。いくつかの実施形態では、本方法は、ビオチニル化したプライマー伸長産物および固体支持されたアビジンもしくはストレプトアビジンなどの相互結合パートナー(reciprocal binding partner)の間に錯体を形成することを備えている。この方法は、相互結合パートナーを結合することにより、結合パートナーを備えるポリヌクレオチド構築物を含む試料を濃縮することをも含んでいてもよい。タンパク質アビジンおよびストレプトアビジンは、ビオチンおよび特定のビオチン類似体(biotin analog)とともに、極めて密着した錯体を形成する。一般に、ビオチンが第2の分子に、その側鎖カルボキシル基(carboxyl side chain)を通じて結合されるとき、結果として生じた複合体は、アビジンまたはストレプトアビジンにより、依然として密着して結合されている。第2の分子は、このような複合体が調製されると、「ビオチニル化され」ていると言われる。有用な結合パートナーには、ビオチン:アビジン、ビオチン:ストレプトアビジン、抗体:抗原、および、相補的な核酸が含まれる。
次世代シーケンシング用のポリヌクレオチドの調製では、次世代シーケンシング前の標的濃縮がしばしば採用され、1つまたはそれ以上の標的濃縮プロトコルを本方法に含めることができる。1つまたはそれ以上の所望の挿入物についての濃縮により、シーケンシングを、より少ない労力および費用で、かつ、高いカバレッジの深さで、より集中させることができる。次世代シーケンシング用の本濃縮プロトコルの例には、アジレントのSureSelect Hybrid CaptureおよびイルミナのTruSeq Captureなどのハイブリダイゼーションベースのキャプチャープロトコルが含まれる。他の例には、アジレントのHaloPlex、サーモフィッシャーのAmpliSeq、イルミナのTruSeq Amplicon、および、レインダンスのエマルジョン/デジタルPCRなどのPCRベースのプロトコルが含まれる。
上述したように、ポリヌクレオチド構築物は、プライマー伸長により配列決定できる。プライマー伸長では、第1のプライマーからの伸長の結果として取り込まれる塩基を検知することにより配列を判定して、ポリヌクレオチド構築物の挿入物(または、いくつかの実施形態では識別子配列)の少なくとも一部の判定を可能にする。第2のプライマー伸長では、第2のプライマーからの伸長の結果として取り込まれる塩基を検知することにより配列を判定して、識別子(または、いくつかの実施形態では挿入物配列)の検知を可能にする。
いくつかの実施形態では、可逆性染料ターミネータ(reversible dye terminator)を標識として、合成によるシーケンシングにより、シーケンシングが行われる。いくつかの実施形態では、シーケンシングが、ライゲーションによるシーケンシングにより行われる。いくつかの実施形態では、シーケンシングが、単一分子シーケンシングにより行われる。いくつかの実施形態では、シーケンシングが、パイロシーケンシングにより行われる。ポリヌクレオチドは、任意の適切な反応方法を使用して、配列決定されてもよい。いくつかの実施形態では、単一のヌクレオチド(すなわち、G、A、TまたはCに対応するヌクレオチド)を使用して、単一の反応サイクルを行ってもよく、本方法は、ヌクレオチドが取り込まれているかを検知することを含む。ヌクレオチドが取り込まれていれば、ヌクレオチドの正体が明らかになる。このような実施形態では、本方法は、4つのヌクレオチド(すなわち、G、A、TおよびCに対応するヌクレオチド)すべてを連続してサイクルすることを含んでいてもよく、ヌクレオチドの1つが取り込まれなければならない。このような実施形態では、例えばピロリン酸塩放出、プロトン放出または蛍光発光を検知することによって、ヌクレオチドの追加を検知してもよく、それらについての方法は公知である。例えば、いくつかの実施形態では、連鎖停止ヌクレオチド(chain terminator nucleotide)は、末端リン酸塩標識蛍光ヌクレオチド(terminal phosphate labeled fluorescent nucleotide)(すなわち、末端リン酸塩に付着されたフルオロフォアを有するヌクレオチド)であってもよく、識別ステップは、蛍光発光を読み取ることを備えている。他の実施形態では、連鎖停止ヌクレオチドは、末端リン酸塩に対する消光剤(quencher)を備える蛍光ヌクレオチドであってもよい。このような実施形態では、ヌクレオチドの取り込みにより、ヌクレオチドから消光剤が除去されて、それにより蛍光標識を検知することが可能となる。他の実施形態では、末端リン酸塩標識連鎖停止ヌクレオチド(terminal phosphate labeled chain terminator nucleotide)は、質量タグ(mass tag)、チャージ標識(charge label)、チャージ封鎖標識(charge blockade label)、化学発光標識(chemiluminescent label)、酸化還元標識(redox label)、または、他の検知可能な標識で、末端リン酸塩に標識化されていてもよい。
いくつかの実施形態では、単一の反応サイクルが、それぞれが異なるフルオロフォアで標識化された、4つのヌクレオチド(すなわち、G、A、TおよびCに対応するヌクレオチド)すべてを使用して行われてもよい。このような実施形態では、シーケンシングステップは、増幅されたポリヌクレオチドに、G、A、TおよびCに対応する4つの連鎖停止剤を追加することを備えていてもよく、その際、4つの連鎖停止剤は、異なるフルオロフォアを備えている。このような実施形態では、識別ステップは、4つの連鎖停止剤のいずれがプライマーの末端に追加されているかを識別することを備えていてもよい。
シーケンシングステップは、シングルエンドシーケンシングを使用して行うことができる。すなわち、第1のプライマー伸長および第2のプライマー伸長配列が、同じ方向に読み取られる。いくつかの実施形態では、シングルエンドシーケンシング用に構成されたシーケンシング器具を使用して、ポリヌクレオチドを配列決定する。いくつかの実施形態では、本方法は、シーケンシング反応(すなわちヌクレオチドの取り込み)を、リアルタイムで継続的に監視することを備えている。これは、同時に鎖延長反応混合物に「検出酵素」を含めることにより、プライマー伸長および検知または信号生成反応を行うことによって、簡単に実現される場合がある。いくつかの実施形態では、プライマー伸長反応がまず、第1の反応ステップとして別個に行われ、それに、プライマー伸長産物が続いて検出される、別個の「検出」反応が続く。
実施例1
この実施例では、シーケンシングの本方法のさまざまな実施形態を、挿入物シーケンシングと識別子シーケンシングとの間の変性ステップなしに行った。ポリヌクレオチド構築物を、以下のやり方で調製した。DNAをコバリスのモデルE220で剪断し、かつ、末端修復、A-テーリング、ライゲーションおよびPCR増幅を、アジレントのSureSelect XT HS標的濃縮システムで行った。この実施例のために使用された挿入物は、ヒトゲノムDNA(NA12878)であり、試料識別子を有するアダプターが公知の挿入物に付着されて、その結果、挿入物配列と識別子配列との間の会合が分かり、実験的方法を評価するのに使用できた。ポリヌクレオチド構築物を、12ラウンドのPCRにより増幅した。ポリヌクレオチド構築物は、合成によるシーケンシング器具でのシーケンシング用に貯留され、そこでポリヌクレオチド構築物はフローセルに付着された。プライマー、ヌクレオチドおよびポリメラーゼを、さまざまな実験用に以下に記載した相違を除き通常の操作手順に従って、プライマー伸長反応のために、フローセルに追加した。シーケンシングデータを識別子配列に基づき、挿入配列を試料基(sample group)にそれらの関連する識別子配列に基づいて割り当てた状態で、逆多重化(demultiplex)した。挿入配列および識別子配列の不一致を計数し、シーケンシング方法の性能を評価するのに使用した。
実施例1
この実施例では、シーケンシングの本方法のさまざまな実施形態を、挿入物シーケンシングと識別子シーケンシングとの間の変性ステップなしに行った。ポリヌクレオチド構築物を、以下のやり方で調製した。DNAをコバリスのモデルE220で剪断し、かつ、末端修復、A-テーリング、ライゲーションおよびPCR増幅を、アジレントのSureSelect XT HS標的濃縮システムで行った。この実施例のために使用された挿入物は、ヒトゲノムDNA(NA12878)であり、試料識別子を有するアダプターが公知の挿入物に付着されて、その結果、挿入物配列と識別子配列との間の会合が分かり、実験的方法を評価するのに使用できた。ポリヌクレオチド構築物を、12ラウンドのPCRにより増幅した。ポリヌクレオチド構築物は、合成によるシーケンシング器具でのシーケンシング用に貯留され、そこでポリヌクレオチド構築物はフローセルに付着された。プライマー、ヌクレオチドおよびポリメラーゼを、さまざまな実験用に以下に記載した相違を除き通常の操作手順に従って、プライマー伸長反応のために、フローセルに追加した。シーケンシングデータを識別子配列に基づき、挿入配列を試料基(sample group)にそれらの関連する識別子配列に基づいて割り当てた状態で、逆多重化(demultiplex)した。挿入配列および識別子配列の不一致を計数し、シーケンシング方法の性能を評価するのに使用した。
実験AおよびBが実施例用の制御として働き、その際、挿入物シーケンシングが第1のシーケンシングプライマーで行われて、結果として二本鎖挿入物部分の形成につながった。二本鎖挿入物部分は、挿入物と、シーケンシングの過程で標識ヌクレオチドとの第1のプライマーの伸長により形成される相補的なストランドとを備えている。既存の方法に従って、変性ステップを行い、第2のプライマーを標識ヌクレオチドで伸長することにより識別子を配列決定する前に、相補的なストランドを挿入物から分離した。実験CおよびDでは、挿入物を同じ仕方で配列決定したが、標識ヌクレオチドでの第1のプライマーの伸長により形成された相補的なストランドを、識別子用の第2のシーケンシングプライマーを追加して識別子を配列決定するために使用する前に変性させることはしなかった。識別子用のシーケンシングプライマー(すなわち第2のシーケンシングプライマー)を、70回のシーケンシングサイクルを挿入物シーケンシングのために行ったあとで追加した。実験EおよびFでは、挿入物を70回のシーケンシングサイクルで配列決定し、次いで、ブロッキングヌクレオチド(2'3'-ジデオキシヌクレオチド)をシーケンシング反応に追加して、二本鎖挿入物部分の連続した伸長を防止した。次いで、ブロッキングヌクレオチドをフローセルから除去し、識別子用のシーケンシングプライマーを、標識ヌクレオチドとともに、フローセルに導入した。これらの実験でも、第2のシーケンシングプライマーを追加する前に、二本鎖挿入物部分を変性することはしなかった。実験GおよびHは、識別子がまず配列決定され、次いで、挿入物が配列決定されたという点で、他の実験と異なっている。しかし、これらは、第1のプライマーでのシーケンシングから生じた二本鎖部分が変性されなかったという点で、実験CおよびFと同様である。実験GおよびHでは、フローセルに導入された第1のプライマーが、識別子を配列決定するためのものであり、これは、3'から挿入物へのプライマー結合部位にアニールした。識別子を標識ヌクレオチドで配列決定したところ、結果として、実質的にすべての識別子と相補的なストランドを有する二本鎖識別子部分の形成につながった。3'から挿入物への第2のプライマー結合部位にアニールした第2のプライマーを追加した。これらのポリヌクレオチド構築物において、識別子は、挿入物用のプライマー結合部位に隣接している。挿入物シーケンシングを開始する前に、二本鎖識別子部分を第2のプライマーにライゲートし、それにより、当初のポリヌクレオチド構築物に相補的なストランドにおけるあらゆるギャップを除去した。標識ヌクレオチドを追加し、挿入物を配列決定する際に、挿入物に相補的なストランドを形成した。
性能を、不一致を有するシーケンシングリードの割合に基づき評価した。結果を図5に要約する。制御(実験AおよびB)により、0または1の不一致を有するリードが95.3~93.5%生成された。実験CおよびDにより、0または1以上の不一致のリードが88.1~89.3%生成された。実験EおよびFにより、0または1の不一致を有するリードが91.5~92.0%生成された。実験Gは、不明な理由により失敗したが、実験Hは、リードの~98%(制御下の~97%)を2以下の不一致で逆多重化できることを示唆した。
したがって、これらの実験により、本シーケンシング方法を使用して、挿入物シーケンシングと識別子シーケンシングとの間の変性ステップなしに、挿入物および識別子用の高品質シーケンシングデータを生成できることが実証される。
例示的な実施形態
実施形態1 ポリヌクレオチド構築物中の挿入物および識別子を配列決定するための方法であって、3'から前記挿入物への前記ポリヌクレオチド構築物の領域に、第1のプライマーをアニールするステップと、前記挿入物に相補的な標識ヌクレオチドの追加によって、前記第1のプライマーを伸長し、かつ、前記追加された標識ヌクレオチドを検知して前記挿入物の配列を判定するステップであって、前記第1のプライマーの前記伸長により、前記挿入物を備える二本鎖挿入物部分および前記挿入物に相補的なストランドが形成されるステップと、3'から前記識別子への前記ポリヌクレオチド構築物の領域に、第2のプライマーをアニールするステップと、前記識別子に相補的な標識ヌクレオチドの追加によって、前記第2のプライマーを伸長し、かつ、前記追加された標識ヌクレオチドを検知して前記識別子の配列を判定するステップとを備え、前記二本鎖挿入物部分は、前記第2のプライマーをアニールおよび伸長する前に変性されない、方法。
例示的な実施形態
実施形態1 ポリヌクレオチド構築物中の挿入物および識別子を配列決定するための方法であって、3'から前記挿入物への前記ポリヌクレオチド構築物の領域に、第1のプライマーをアニールするステップと、前記挿入物に相補的な標識ヌクレオチドの追加によって、前記第1のプライマーを伸長し、かつ、前記追加された標識ヌクレオチドを検知して前記挿入物の配列を判定するステップであって、前記第1のプライマーの前記伸長により、前記挿入物を備える二本鎖挿入物部分および前記挿入物に相補的なストランドが形成されるステップと、3'から前記識別子への前記ポリヌクレオチド構築物の領域に、第2のプライマーをアニールするステップと、前記識別子に相補的な標識ヌクレオチドの追加によって、前記第2のプライマーを伸長し、かつ、前記追加された標識ヌクレオチドを検知して前記識別子の配列を判定するステップとを備え、前記二本鎖挿入物部分は、前記第2のプライマーをアニールおよび伸長する前に変性されない、方法。
実施形態2 前記第2のプライマーをアニールする前に、前記第1のプライマーを伸長し、かつ、少なくとも70回のシーケンシングサイクルについて前記追加された標識ヌクレオチドを検知するステップを含む、実施形態1に記載の方法。
実施形態3 前記相補的なストランドがすべて前記挿入物に対して伸長するまで非標識ヌクレオチドを追加することにより、前記標識ヌクレオチドの前記追加後に前記二本鎖挿入物部分を伸長するステップをさらに含む、実施形態1に記載の方法。
実施形態4 前記標識ヌクレオチドの前記追加後に、前記二本鎖挿入物部分にブロッキングヌクレオチドを追加するステップをさらに含む、実施形態1に記載の方法。
実施形態5 前記ブロッキングヌクレオチドはジデオキシヌクレオチドである、実施形態4に記載の方法。
実施形態6 前記ポリヌクレオチド構築物は、キャプチャー部位、前記第1のプライマーのための第1のプライマー結合部位、識別子、前記第2のプライマーのための第2のプライマー結合部位、および、挿入物を備えている、実施形態1~5のいずれか1項に記載の方法。
実施形態7 前記識別子は、試料識別子、または、分子識別子、または、両方を備えている、実施形態6に記載の方法。
実施形態8 前記第1のプライマー結合部位は、前記挿入物の5'末端に近接している、実施形態6または7に記載の方法。
実施形態9 前記第2のプライマー結合部位は、試料識別子または分子識別子に近接している、実施形態6~8のいずれか1項に記載の方法。
実施形態10 ポリヌクレオチド構築物中の挿入物および識別子を配列決定するための方法であって、3'から前記識別子への前記ポリヌクレオチド構築物の領域に、第1のプライマーをアニールするステップと、前記識別子に相補的な標識ヌクレオチドの追加によって、前記第1のプライマーを伸長し、かつ、前記追加された標識ヌクレオチドを検知して前記識別子の配列を判定するステップであって、前記第1のプライマーの前記伸長により、前記識別子を備える二本鎖識別子部分および前記識別子に相補的なストランドが形成されるステップと、3'から前記挿入物への前記ポリヌクレオチド構築物の領域に隣接して、第2のプライマーをアニールするステップと、前記挿入物に相補的な標識ヌクレオチドの追加によって、前記第2のプライマーを伸長し、かつ、前記標識ヌクレオチドを検知して前記挿入物の配列を判定するステップとを備え、前記二本鎖識別子部分は、前記第2のプライマーをアニールおよび伸長する前に変性されない、方法。
実施形態11 前記第2のプライマーを伸長する前に、前記識別子に相補的な前記ストランドを、前記第2のプライマーにライゲートするステップを含む、実施形態10に記載の方法。
実施形態12 前記相補的なストランドが前記識別子の実質的に全部に対して伸長するまで非標識ヌクレオチドを追加することにより、前記標識ヌクレオチドの追加後に前記二本鎖識別子部分を伸長するステップをさらに含む、実施形態10に記載の方法。
実施形態13 前記標識ヌクレオチドの追加後に、ブロッキングヌクレオチドを前記二本鎖識別子部分に追加するステップをさらに含む、実施形態10に記載の方法。
実施形態14 前記ブロッキングヌクレオチドはジデオキシヌクレオチドである、実施形態13に記載の方法。
実施形態15 前記ポリヌクレオチド構築物は、キャプチャー部位、前記第1のプライマーのための第1のプライマー結合部位、識別子、前記第2のプライマーのための第2のプライマー結合部位、および、前記挿入物を備えている、実施形態10~14のいずれか1項に記載の方法。
実施形態16 前記識別子は、試料識別子、または、分子識別子、または、両方を備えている、実施形態15に記載の方法。
実施形態17 前記識別子は、5'末端および3'末端を備えており、前記第1のプライマー結合部位は、前記識別子の前記5'末端に近接している、実施形態15または16に記載の方法。
実施形態18 前記第2のプライマー結合部位は、前記挿入物の5'末端に近接している、実施形態15~17のいずれか1項に記載の方法。
実施形態19 対象となるポリヌクレオチドを配列決定するためのキットであって、1つまたはそれ以上のアダプターと、1つまたはそれ以上のプライマーと、標識ヌクレオチドと、(a)非標識ヌクレオチド、および、(b)ブロッキングヌクレオチドの一方または両方を備える、キット。
実施形態20 ブロッキングヌクレオチドを備え、前記ブロッキングヌクレオチドはジデオキシヌクレオチドである、実施形態19に記載のキット。
この開示に鑑み、本方法が、本教示に調和して実施できることに留意されたい。さらに、さまざまな構成要素、材料、構造およびパラメータが、単なる説明および例として、何ら限定的な意味でなく、含まれる。この開示に鑑み、添付の特許請求の範囲を逸脱することなく、本教示を他の用途で実施でき、かつ、これらの用途を実施するための構成要素、材料、構造および機器を決定できる。
Claims (20)
- ポリヌクレオチド構築物中の挿入物および識別子を配列決定するための方法であって、
3'から前記挿入物への前記ポリヌクレオチド構築物の領域に、第1のプライマーをアニールするステップと、
前記挿入物に相補的な標識ヌクレオチドの追加によって、前記第1のプライマーを伸長し、かつ、前記追加された標識ヌクレオチドを検知して前記挿入物の配列を判定するステップであって、前記第1のプライマーの前記伸長により、前記挿入物を備える二本鎖挿入物部分および前記挿入物に相補的なストランドが形成されるステップと、
3'から前記識別子への前記ポリヌクレオチド構築物の領域に、第2のプライマーをアニールするステップと、
前記識別子に相補的な標識ヌクレオチドの追加によって、前記第2のプライマーを伸長し、かつ、前記追加された標識ヌクレオチドを検知して前記識別子の配列を判定するステップとを備え、
前記二本鎖挿入物部分は、前記第2のプライマーをアニールおよび伸長する前に変性されない、方法。 - 前記第2のプライマーをアニールする前に、前記第1のプライマーを伸長し、かつ、少なくとも70回のシーケンシングサイクルについて前記追加された標識ヌクレオチドを検知するステップを含む、請求項1に記載の方法。
- 前記相補的なストランドがすべて前記挿入物に対して伸長するまで非標識ヌクレオチドを追加することにより、前記標識ヌクレオチドの前記追加後に前記二本鎖挿入物部分を伸長するステップをさらに含む、請求項1に記載の方法。
- 前記標識ヌクレオチドの前記追加後に、前記二本鎖挿入物部分にブロッキングヌクレオチドを追加するステップをさらに含む、請求項1に記載の方法。
- 前記ブロッキングヌクレオチドはジデオキシヌクレオチドである、請求項4に記載の方法。
- 前記ポリヌクレオチド構築物は、キャプチャー部位、前記第1のプライマーのための第1のプライマー結合部位、識別子、前記第2のプライマーのための第2のプライマー結合部位、および、挿入物を備えている、請求項1に記載の方法。
- 前記識別子は、試料識別子、または、分子識別子、または、両方を備えている、請求項6に記載の方法。
- 前記第1のプライマー結合部位は、前記挿入物の5'末端に近接している、請求項6に記載の方法。
- 前記第2のプライマー結合部位は、試料識別子または分子識別子に近接している、請求項6に記載の方法。
- ポリヌクレオチド構築物中の挿入物および識別子を配列決定するための方法であって、
3'から前記識別子への前記ポリヌクレオチド構築物の領域に、第1のプライマーをアニールするステップと、
前記識別子に相補的な標識ヌクレオチドの追加によって、前記第1のプライマーを伸長し、かつ、前記追加された標識ヌクレオチドを検知して前記識別子の配列を判定するステップであって、前記第1のプライマーの前記伸長により、前記識別子を備える二本鎖識別子部分および前記識別子に相補的なストランドが形成されるステップと、
3'から前記挿入物への前記ポリヌクレオチド構築物の領域に隣接して、第2のプライマーをアニールするステップと、
前記挿入物に相補的な標識ヌクレオチドの追加によって、前記第2のプライマーを伸長し、かつ、前記標識ヌクレオチドを検知して前記挿入物の配列を判定するステップとを備え、
前記二本鎖識別子部分は、前記第2のプライマーをアニールおよび伸長する前に変性されない、方法。 - 前記第2のプライマーを伸長する前に、前記識別子に相補的な前記ストランドを、前記第2のプライマーにライゲートするステップを含む、請求項10に記載の方法。
- 前記相補的なストランドが前記識別子の実質的に全部に対して伸長するまで非標識ヌクレオチドを追加することにより、前記標識ヌクレオチドの追加後に前記二本鎖識別子部分を伸長するステップをさらに含む、請求項10に記載の方法。
- 前記標識ヌクレオチドの追加後に、ブロッキングヌクレオチドを前記二本鎖識別子部分に追加するステップをさらに含む、請求項10に記載の方法。
- 前記ブロッキングヌクレオチドはジデオキシヌクレオチドである、請求項13に記載の方法。
- 前記ポリヌクレオチド構築物は、キャプチャー部位、前記第1のプライマーのための第1のプライマー結合部位、識別子、前記第2のプライマーのための第2のプライマー結合部位、および、前記挿入物を備えている、請求項10に記載の方法。
- 前記識別子は、試料識別子、または、分子識別子、または、両方を備えている、請求項15に記載の方法。
- 前記識別子は、5'末端および3'末端を備えており、前記第1のプライマー結合部位は、前記識別子の前記5'末端に近接している、請求項15に記載の方法。
- 前記第2のプライマー結合部位は、前記挿入物の5'末端に近接している、請求項15に記載の方法。
- 対象となるポリヌクレオチドを配列決定するためのキットであって、
1つまたはそれ以上のアダプターと、
1つまたはそれ以上のプライマーと、
標識ヌクレオチドと、
(a)非標識ヌクレオチド、および、(b)ブロッキングヌクレオチドの一方または両方を備える、キット。 - ブロッキングヌクレオチドを備え、前記ブロッキングヌクレオチドはジデオキシヌクレオチドである、請求項19に記載のキット。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US17/144,900 | 2021-01-08 | ||
US17/144,900 US20220220550A1 (en) | 2021-01-08 | 2021-01-08 | Sequencing an insert and an identifier without denaturation |
PCT/US2021/062222 WO2022150135A1 (en) | 2021-01-08 | 2021-12-07 | Sequencing an insert and an identifier without denaturation |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024502293A true JP2024502293A (ja) | 2024-01-18 |
Family
ID=82322780
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023539019A Pending JP2024502293A (ja) | 2021-01-08 | 2021-12-07 | 変性のない挿入物および識別子の配列決定 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220220550A1 (ja) |
EP (1) | EP4274911A1 (ja) |
JP (1) | JP2024502293A (ja) |
CN (1) | CN116710573A (ja) |
WO (1) | WO2022150135A1 (ja) |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ES2628485T3 (es) * | 2013-07-03 | 2017-08-03 | Illumina, Inc. | Secuenciación mediante síntesis ortogonal |
CN105849264B (zh) * | 2013-11-13 | 2019-09-27 | 纽亘技术公司 | 用于鉴别重复测序读数的组合物和方法 |
WO2017218979A1 (en) * | 2016-06-17 | 2017-12-21 | The Broad Institute, Inc. | Unbiased detection of nucleic acid modifications |
WO2018045109A1 (en) * | 2016-08-30 | 2018-03-08 | Metabiotech Corporation | Methods and compositions for phased sequencing |
WO2019002366A1 (en) * | 2017-06-27 | 2019-01-03 | F. Hoffmann-La Roche Ag | MODULAR ADAPTERS OF NUCLEIC ACID |
WO2019209946A1 (en) * | 2018-04-25 | 2019-10-31 | Qiagen Sciences Llc | Sequential paired-end sequencing |
-
2021
- 2021-01-08 US US17/144,900 patent/US20220220550A1/en active Pending
- 2021-12-07 JP JP2023539019A patent/JP2024502293A/ja active Pending
- 2021-12-07 EP EP21918047.8A patent/EP4274911A1/en active Pending
- 2021-12-07 WO PCT/US2021/062222 patent/WO2022150135A1/en active Application Filing
- 2021-12-07 CN CN202180083385.0A patent/CN116710573A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4274911A1 (en) | 2023-11-15 |
WO2022150135A1 (en) | 2022-07-14 |
US20220220550A1 (en) | 2022-07-14 |
CN116710573A (zh) | 2023-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110191961B (zh) | 制备经不对称标签化的测序文库的方法 | |
EP3036359B1 (en) | Next-generation sequencing libraries | |
US8034568B2 (en) | Isothermal nucleic acid amplification methods and compositions | |
US10988795B2 (en) | Synthesis of double-stranded nucleic acids | |
EP2867366B1 (en) | Method for isothermal dna amplification starting from an rna template in a single reaction mixture | |
US20100120034A1 (en) | Methylation analysis of mate pairs | |
EP3601593B1 (en) | Universal hairpin primers | |
CN104736722A (zh) | 样品制备方法 | |
CN110741092A (zh) | 扩增dna以维持甲基化状态的方法 | |
US20220364169A1 (en) | Sequencing method for genomic rearrangement detection | |
CN117778531A (zh) | 分子库制备方法以及其组合物和用途 | |
US20190169603A1 (en) | Compositions and Methods for Labeling Target Nucleic Acid Molecules | |
US20170175182A1 (en) | Transposase-mediated barcoding of fragmented dna | |
US20220267848A1 (en) | Detection and quantification of rare variants with low-depth sequencing via selective allele enrichment or depletion | |
JP7134186B2 (ja) | Rnaおよびdnaからの核酸ライブラリーの作製 | |
US20220220550A1 (en) | Sequencing an insert and an identifier without denaturation | |
KR20230124636A (ko) | 멀티플렉스 반응에서 표적 서열의 고 감응성 검출을위한 조성물 및 방법 | |
WO2023035110A1 (zh) | 一种用于分析靶多核苷酸的序列的方法 | |
WO2018009677A1 (en) | Fast target enrichment by multiplexed relay pcr with modified bubble primers | |
WO2023122499A1 (en) | Periodate compositions and methods for chemical cleavage of surface-bound polynucleotides | |
WO2023122491A1 (en) | Periodate compositions and methods for chemical cleavage of surface-bound polynucleotides | |
EP4118231A1 (en) | Novel nucleic acid template structure for sequencing |