JP2023506631A - 共有結合で閉端された核酸分子末端を使用したngsライブラリー調製 - Google Patents
共有結合で閉端された核酸分子末端を使用したngsライブラリー調製 Download PDFInfo
- Publication number
- JP2023506631A JP2023506631A JP2022535868A JP2022535868A JP2023506631A JP 2023506631 A JP2023506631 A JP 2023506631A JP 2022535868 A JP2022535868 A JP 2022535868A JP 2022535868 A JP2022535868 A JP 2022535868A JP 2023506631 A JP2023506631 A JP 2023506631A
- Authority
- JP
- Japan
- Prior art keywords
- nucleic acid
- acid molecule
- sequence
- adapter
- acid molecules
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 600
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 595
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 595
- 238000002360 preparation method Methods 0.000 title description 9
- 238000000034 method Methods 0.000 claims abstract description 169
- 238000012163 sequencing technique Methods 0.000 claims abstract description 69
- 108060002716 Exonuclease Proteins 0.000 claims abstract description 47
- 102000013165 exonuclease Human genes 0.000 claims abstract description 47
- 230000003321 amplification Effects 0.000 claims abstract description 45
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 45
- 101710163270 Nuclease Proteins 0.000 claims description 61
- GNFTZDOKVXKIBK-UHFFFAOYSA-N 3-(2-methoxyethoxy)benzohydrazide Chemical compound COCCOC1=CC=CC(C(=O)NN)=C1 GNFTZDOKVXKIBK-UHFFFAOYSA-N 0.000 claims description 35
- 108091008146 restriction endonucleases Proteins 0.000 claims description 23
- 108091033409 CRISPR Proteins 0.000 claims description 17
- FGUUSXIOTUKUDN-IBGZPJMESA-N C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 Chemical compound C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 FGUUSXIOTUKUDN-IBGZPJMESA-N 0.000 claims description 16
- 238000013467 fragmentation Methods 0.000 claims description 15
- 238000006062 fragmentation reaction Methods 0.000 claims description 15
- 238000000137 annealing Methods 0.000 claims description 14
- 230000005783 single-strand break Effects 0.000 claims description 6
- 238000012350 deep sequencing Methods 0.000 claims description 2
- 238000010354 CRISPR gene editing Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 abstract 1
- 239000000523 sample Substances 0.000 description 90
- 108020004414 DNA Proteins 0.000 description 75
- 125000003729 nucleotide group Chemical group 0.000 description 58
- 239000002773 nucleotide Substances 0.000 description 56
- 108090000623 proteins and genes Proteins 0.000 description 39
- 102000004169 proteins and genes Human genes 0.000 description 30
- 235000018102 proteins Nutrition 0.000 description 29
- 108010042407 Endonucleases Proteins 0.000 description 28
- 102000004533 Endonucleases Human genes 0.000 description 28
- 108091034117 Oligonucleotide Proteins 0.000 description 23
- 108020005004 Guide RNA Proteins 0.000 description 21
- 230000000295 complement effect Effects 0.000 description 21
- 239000012634 fragment Substances 0.000 description 21
- 210000004027 cell Anatomy 0.000 description 20
- 102000004190 Enzymes Human genes 0.000 description 19
- 108090000790 Enzymes Proteins 0.000 description 19
- 238000006243 chemical reaction Methods 0.000 description 19
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 18
- 102000053602 DNA Human genes 0.000 description 18
- 108091093088 Amplicon Proteins 0.000 description 16
- 241000196324 Embryophyta Species 0.000 description 16
- 238000003776 cleavage reaction Methods 0.000 description 16
- 230000007017 scission Effects 0.000 description 16
- 230000000694 effects Effects 0.000 description 14
- 238000005516 engineering process Methods 0.000 description 13
- 238000000746 purification Methods 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 10
- 239000003795 chemical substances by application Substances 0.000 description 10
- 230000005782 double-strand break Effects 0.000 description 10
- 230000009467 reduction Effects 0.000 description 10
- 238000011160 research Methods 0.000 description 10
- 230000000670 limiting effect Effects 0.000 description 9
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 9
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 8
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 8
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 8
- 230000015556 catabolic process Effects 0.000 description 8
- 238000006731 degradation reaction Methods 0.000 description 8
- 108091028043 Nucleic acid sequence Proteins 0.000 description 7
- 108091028113 Trans-activating crRNA Proteins 0.000 description 7
- 108010020764 Transposases Proteins 0.000 description 7
- 102000008579 Transposases Human genes 0.000 description 7
- 238000007792 addition Methods 0.000 description 7
- 238000010367 cloning Methods 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 102000040430 polynucleotide Human genes 0.000 description 7
- 108091033319 polynucleotide Proteins 0.000 description 7
- 239000002157 polynucleotide Substances 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 108091027544 Subgenomic mRNA Proteins 0.000 description 6
- 230000029087 digestion Effects 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 238000007481 next generation sequencing Methods 0.000 description 6
- 239000011541 reaction mixture Substances 0.000 description 6
- 230000008439 repair process Effects 0.000 description 6
- 108091035707 Consensus sequence Proteins 0.000 description 5
- 108010046914 Exodeoxyribonuclease V Proteins 0.000 description 5
- 102000019236 Exonuclease V Human genes 0.000 description 5
- 208000005652 acute fatty liver of pregnancy Diseases 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- 239000011324 bead Substances 0.000 description 5
- 230000000593 degrading effect Effects 0.000 description 5
- -1 deoxyribose sugars Chemical class 0.000 description 5
- 238000013461 design Methods 0.000 description 5
- 230000006862 enzymatic digestion Effects 0.000 description 5
- 230000000415 inactivating effect Effects 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 239000013612 plasmid Substances 0.000 description 5
- 239000007858 starting material Substances 0.000 description 5
- 230000008685 targeting Effects 0.000 description 5
- 210000001519 tissue Anatomy 0.000 description 5
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000007672 fourth generation sequencing Methods 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 230000002779 inactivation Effects 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 238000011176 pooling Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000001105 regulatory effect Effects 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 3
- 108010067770 Endopeptidase K Proteins 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 3
- 239000013611 chromosomal DNA Substances 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 210000003463 organelle Anatomy 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 230000001681 protective effect Effects 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 238000010008 shearing Methods 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 235000000346 sugar Nutrition 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 2
- 235000009854 Cucurbita moschata Nutrition 0.000 description 2
- 240000001980 Cucurbita pepo Species 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 108010007577 Exodeoxyribonuclease I Proteins 0.000 description 2
- 102100029075 Exonuclease 1 Human genes 0.000 description 2
- 241000282414 Homo sapiens Species 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- 108091092740 Organellar DNA Proteins 0.000 description 2
- 108091081548 Palindromic sequence Proteins 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 238000012300 Sequence Analysis Methods 0.000 description 2
- 241000193996 Streptococcus pyogenes Species 0.000 description 2
- 238000010459 TALEN Methods 0.000 description 2
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 2
- 210000004507 artificial chromosome Anatomy 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 210000001124 body fluid Anatomy 0.000 description 2
- 235000013339 cereals Nutrition 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 230000001973 epigenetic effect Effects 0.000 description 2
- 108010052305 exodeoxyribonuclease III Proteins 0.000 description 2
- 230000001036 exonucleolytic effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000007850 fluorescent dye Substances 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 125000000623 heterocyclic group Chemical group 0.000 description 2
- 150000002500 ions Chemical class 0.000 description 2
- 235000019689 luncheon sausage Nutrition 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 210000003470 mitochondria Anatomy 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 238000007838 multiplex ligation-dependent probe amplification Methods 0.000 description 2
- 125000003835 nucleoside group Chemical group 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 239000011148 porous material Substances 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 108090000765 processed proteins & peptides Proteins 0.000 description 2
- 235000019833 protease Nutrition 0.000 description 2
- 150000003212 purines Chemical class 0.000 description 2
- 150000003230 pyrimidines Chemical class 0.000 description 2
- 230000002285 radioactive effect Effects 0.000 description 2
- 239000011535 reaction buffer Substances 0.000 description 2
- 230000003252 repetitive effect Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 238000005096 rolling process Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- 241001515965 unidentified phage Species 0.000 description 2
- VGONTNSXDCQUGY-RRKCRQDMSA-N 2'-deoxyinosine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=CNC2=O)=C2N=C1 VGONTNSXDCQUGY-RRKCRQDMSA-N 0.000 description 1
- MXHRCPNRJAMMIM-SHYZEUOFSA-N 2'-deoxyuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-SHYZEUOFSA-N 0.000 description 1
- 241000093740 Acidaminococcus sp. Species 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- 235000000832 Ayote Nutrition 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 1
- 241000589969 Borreliella burgdorferi Species 0.000 description 1
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 1
- 240000002791 Brassica napus Species 0.000 description 1
- 235000006008 Brassica napus var napus Nutrition 0.000 description 1
- 240000007124 Brassica oleracea Species 0.000 description 1
- 235000003899 Brassica oleracea var acephala Nutrition 0.000 description 1
- 235000011299 Brassica oleracea var botrytis Nutrition 0.000 description 1
- 235000011301 Brassica oleracea var capitata Nutrition 0.000 description 1
- 235000001169 Brassica oleracea var oleracea Nutrition 0.000 description 1
- 240000003259 Brassica oleracea var. botrytis Species 0.000 description 1
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 1
- 244000188595 Brassica sinapistrum Species 0.000 description 1
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 1
- 238000010443 CRISPR/Cpf1 gene editing Methods 0.000 description 1
- 241000589875 Campylobacter jejuni Species 0.000 description 1
- 235000002566 Capsicum Nutrition 0.000 description 1
- 235000008534 Capsicum annuum var annuum Nutrition 0.000 description 1
- 240000008384 Capsicum annuum var. annuum Species 0.000 description 1
- 240000008574 Capsicum frutescens Species 0.000 description 1
- 244000298479 Cichorium intybus Species 0.000 description 1
- 235000007542 Cichorium intybus Nutrition 0.000 description 1
- 244000241235 Citrullus lanatus Species 0.000 description 1
- 235000012828 Citrullus lanatus var citroides Nutrition 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- 241000186227 Corynebacterium diphtheriae Species 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 101150074775 Csf1 gene Proteins 0.000 description 1
- 241000219112 Cucumis Species 0.000 description 1
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 description 1
- 240000008067 Cucumis sativus Species 0.000 description 1
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 description 1
- 235000009852 Cucurbita pepo Nutrition 0.000 description 1
- 235000009804 Cucurbita pepo subsp pepo Nutrition 0.000 description 1
- 241000219130 Cucurbita pepo subsp. pepo Species 0.000 description 1
- 235000003954 Cucurbita pepo var melopepo Nutrition 0.000 description 1
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 102000004594 DNA Polymerase I Human genes 0.000 description 1
- 108010017826 DNA Polymerase I Proteins 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 241000124092 Escherichia virus N15 Species 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 241000589601 Francisella Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 241000193385 Geobacillus stearothermophilus Species 0.000 description 1
- 241001468175 Geobacillus thermodenitrificans Species 0.000 description 1
- 241000219146 Gossypium Species 0.000 description 1
- 241001299659 Halomonas aquamarina Species 0.000 description 1
- 244000020551 Helianthus annuus Species 0.000 description 1
- 235000003222 Helianthus annuus Nutrition 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- 206010020649 Hyperkeratosis Diseases 0.000 description 1
- 241000588749 Klebsiella oxytoca Species 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- 240000008415 Lactuca sativa Species 0.000 description 1
- 235000003228 Lactuca sativa Nutrition 0.000 description 1
- 241000186805 Listeria innocua Species 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 241000916865 Microsage Species 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 101150101095 Mmp12 gene Proteins 0.000 description 1
- 229910003177 MnII Inorganic materials 0.000 description 1
- 241000588650 Neisseria meningitidis Species 0.000 description 1
- 108091093105 Nuclear DNA Proteins 0.000 description 1
- 108091005461 Nucleic proteins Chemical group 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 108010010677 Phosphodiesterase I Proteins 0.000 description 1
- 208000020584 Polyploidy Diseases 0.000 description 1
- 241000605861 Prevotella Species 0.000 description 1
- 241001135221 Prevotella intermedia Species 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 241000209056 Secale Species 0.000 description 1
- 235000007238 Secale cereale Nutrition 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 244000061458 Solanum melongena Species 0.000 description 1
- 235000002597 Solanum melongena Nutrition 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 240000003829 Sorghum propinquum Species 0.000 description 1
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 1
- 241000202917 Spiroplasma Species 0.000 description 1
- 241000194056 Streptococcus iniae Species 0.000 description 1
- 241000194020 Streptococcus thermophilus Species 0.000 description 1
- 235000021536 Sugar beet Nutrition 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- 108010012306 Tn5 transposase Proteins 0.000 description 1
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- 108010064978 Type II Site-Specific Deoxyribonucleases Proteins 0.000 description 1
- 101710159648 Uncharacterized protein Proteins 0.000 description 1
- 241000607284 Vibrio sp. Species 0.000 description 1
- 241000219094 Vitaceae Species 0.000 description 1
- 241000607734 Yersinia <bacteria> Species 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- FJJCIZWZNKZHII-UHFFFAOYSA-N [4,6-bis(cyanoamino)-1,3,5-triazin-2-yl]cyanamide Chemical compound N#CNC1=NC(NC#N)=NC(NC#N)=N1 FJJCIZWZNKZHII-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 239000001390 capsicum minimum Substances 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000006037 cell lysis Effects 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 230000000536 complexating effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000005860 defense response to virus Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- VGONTNSXDCQUGY-UHFFFAOYSA-N desoxyinosine Natural products C1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 VGONTNSXDCQUGY-UHFFFAOYSA-N 0.000 description 1
- MXHRCPNRJAMMIM-UHFFFAOYSA-N desoxyuridine Natural products C1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-UHFFFAOYSA-N 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 230000008995 epigenetic change Effects 0.000 description 1
- 150000002170 ethers Chemical class 0.000 description 1
- LYCAIKOWRPUZTN-UHFFFAOYSA-N ethylene glycol Natural products OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 230000007614 genetic variation Effects 0.000 description 1
- 235000021021 grapes Nutrition 0.000 description 1
- 125000005843 halogen group Chemical group 0.000 description 1
- 239000010903 husk Substances 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000011901 isothermal amplification Methods 0.000 description 1
- 101150044508 key gene Proteins 0.000 description 1
- 238000007834 ligase chain reaction Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000011528 liquid biopsy Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 208000024191 minimally invasive lung adenocarcinoma Diseases 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 238000002663 nebulization Methods 0.000 description 1
- 239000002777 nucleoside Substances 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 210000001850 polyploid cell Anatomy 0.000 description 1
- 102000004196 processed proteins & peptides Human genes 0.000 description 1
- 125000006239 protecting group Chemical group 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- 235000015136 pumpkin Nutrition 0.000 description 1
- 150000003291 riboses Chemical class 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 235000002020 sage Nutrition 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 238000007841 sequencing by ligation Methods 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 108010068698 spleen exonuclease Proteins 0.000 description 1
- 235000020354 squash Nutrition 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000011410 subtraction method Methods 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 230000009469 supplementation Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000007671 third-generation sequencing Methods 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1093—General methods of preparing gene libraries, not provided for in other subgroups
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6853—Nucleic acid amplification reactions using modified primers or templates
- C12Q1/6855—Ligating adaptors
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Analytical Chemistry (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Immunology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Plant Pathology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Saccharide Compounds (AREA)
Abstract
本発明は、プロテロメラーゼ認識配列、好ましくはTeINプロテロメラーゼ認識配列を含むアダプターに関する。本発明のアダプターは、核酸分子ライブラリーを調製するために使用することができる。本発明は、プロテロメラーゼ認識配列を含む1つ又は複数のアダプターを使用して核酸分子ライブラリーを産生するための方法にも関する。アダプターをプロテロメラーゼと接触させて、アダプターの末端を切断及び閉端することができる。前記閉端アダプターは、例えば、エキソヌクレアーゼ処理から保護される。本発明の方法は、プロテロメラーゼ認識配列を有するアダプターを使用した増幅方法及び配列決定法にさらに関する。【選択図】 図1
Description
本発明は、遺伝子研究の分野、より詳細には、例えば、核酸サンプルの配列分析及び処理のための標的化核酸単離の分野にある。ライブラリー調製のための及び核酸サンプルの複雑性を低減するための新しい方法及び手段が開示される。
遺伝子研究の重要な要素は、例えば、公知のバリアントの遺伝子型を判定するか、又は配列の変化若しくはバリアントを特定するための、規定のDNA遺伝子座の配列分析である。このような分析は、多くの場合、多重方式で行う必要があり、例えば、特定の遺伝子座のセットを多数のサンプルで分析する必要がある。
理想的なアッセイは、スクリーニングすることが必要とされるサンプル及び遺伝子座の数に関して柔軟であり、精度が高く、様々なシーケンスプラットフォームに適しているものである。断片のコレクションに由来する核酸のサブセットを分析する場合、目的の断片を濃縮する必要性が存在することが多い。濃縮は、標的核酸の選択(例えば、精製又は増幅)によって、又は不要な核酸の除去によって実施することができる。理想的には、濃縮ステップは増幅を含まない。例えば、米国特許出願公開第2014/0134610号には、II型制限酵素を使用してサンプル中の核酸を断片化した後、保護アダプターを連結し、続いてエキソヌクレアーゼを使用して捕捉されていない核酸のすべてを分解することによる、複雑性の低減方法が記載されている。国際公開第2016/028887号では、この方法が、プログラム可能なエンドヌクレアーゼ、すなわち、サンプルの核酸を断片化するためのCRISPR-エンドヌクレアーゼを使用することによって改良されている。
ほとんどの用途では、次世代配列決定(NGS)の最初のステップは、ライブラリーを調製することである。NGSのライブラリー調製は、様々なプロトコルを使用して実施することができる。PacBioプラットフォームを使用したロングリードシーケンシングライブラリーの場合、ヘアピンアダプターを、核酸分子の末端に連結する。こうしたヘアピンアダプターを付加して、エキソヌクレアーゼ処理を使用して未アダプター連結分子をすべて除去し、インプット核酸分子の複数の通過をまたぐ配列決定読み取りを生成することができる。後者は、配列決定された核酸分子の高度に正確なコンセンサス配列の作出を可能にする。ヘアピンアダプターの付加は、インプット核酸分子の任意選択の断片化から始まり、続いて断片末端を末端処理し、3’A付着(又は「粘着」)末端を付加する複数のステップを含む。任意選択で、この末端処理ステップ中に修復ステップを実施して、核酸分子内の損傷位置(例えば、ニック)を除去することができる。
こうした別々のステップの代わりに、トランスポザーゼ酵素を使用して、断片化ステップ及びアダプター付加ステップを組み合わせて1つのステップ(タグメンテーション)にしてもよい。タグメンテーションは、例えば、Illumina Nextera及びOxford Nanopore Technologies(ONT)迅速ライブラリー調製プロトコルで広く使用されている。トランスポザーゼ反応後に修復ステップを実施すると、ほとんどの核酸断片は、それらの末端にアダプターを含むことになる。しかしながら、断片化又はタグメンテーションは、相当にランダムな核酸断片を作出する。
本発明の目的は、例えば、その後の配列決定及び/又はクローニングのために核酸分子ライブラリーを調製するための新規な方法を提供することであり、好ましくは、この方法は、目的の核酸に関してライブラリーを濃縮するステップを含む。
本発明は、以下の付番した実施形態に要約され得る。
実施形態1.少なくとも部分的に二本鎖であり、プロテロメラーゼ認識配列、好ましくはTeINプロテロメラーゼ認識配列を含むアダプター。
実施形態2.アダプターが、識別子配列をさらに含む、実施形態1に記載のアダプター。
実施形態3.アダプターが、少なくとも1つの付着末端を含む、実施形態1又は2に記載のアダプター。
実施形態4.核酸分子ライブラリーを調製するための方法であって、
a)少なくとも第1及び第2の核酸分子を含むサンプルを用意するステップであり、第1の核酸分子が第2の核酸分子に存在しない第1の標的配列を含み、任意選択で第2の核酸分子が第2の標的配列を含む、ステップと;
b)実施形態1~3のいずれか1つで定義したアダプターを、第1及び第2の核酸分子の末端に連結して、アダプター連結核酸分子を用意するステップと;
c)アダプター連結核酸分子を、プロテロメラーゼ、好ましくはTeINプロテロメラーゼと接触させて切断し、切断された末端を共有結合で閉端して、閉端末端を含む第1及び第2の核酸分子をもたらすステップと;
d)閉端末端を含む第1の核酸分子を第1の標的配列にて切断して、1つの開端末端及び1つの閉端末端を含む第1の核酸を用意するステップと
を含む方法。
a)少なくとも第1及び第2の核酸分子を含むサンプルを用意するステップであり、第1の核酸分子が第2の核酸分子に存在しない第1の標的配列を含み、任意選択で第2の核酸分子が第2の標的配列を含む、ステップと;
b)実施形態1~3のいずれか1つで定義したアダプターを、第1及び第2の核酸分子の末端に連結して、アダプター連結核酸分子を用意するステップと;
c)アダプター連結核酸分子を、プロテロメラーゼ、好ましくはTeINプロテロメラーゼと接触させて切断し、切断された末端を共有結合で閉端して、閉端末端を含む第1及び第2の核酸分子をもたらすステップと;
d)閉端末端を含む第1の核酸分子を第1の標的配列にて切断して、1つの開端末端及び1つの閉端末端を含む第1の核酸を用意するステップと
を含む方法。
実施形態5.ステップa)のサンプルが、第1及び第2の核酸分子並びに複数のさらなる核酸分子を含む、実施形態4に記載の方法。
実施形態6.ステップd)の第1の核酸分子が、プログラム可能なヌクレアーゼ又は制限エンドヌクレアーゼによって切断される、実施形態4又は5に記載の方法。
実施形態7.プログラム可能なヌクレアーゼが、RNA誘導型CRISPRヌクレアーゼである、実施形態6に記載の方法。
実施形態8.ステップa)の第1及び第2の核酸分子が、断片化、好ましくはゲノム核酸分子の断片化によって用意される、実施形態4~7のいずれか1つに記載の方法。
実施形態9.ステップb)のアダプターが、タグメンテーションによって連結される、実施形態8に記載の方法。
実施形態10.ステップc)において閉端末端を含む核酸分子を得た後だが、ステップd)において閉端末端を含む第1の核酸分子を切断する前に、サンプルをエキソヌクレアーゼに曝露するステップc1)を含む、実施形態4~9のいずれか1つに記載の方法。
実施形態11.ステップd)において1つの開端末端及び1つの閉端末端を含む第1の核酸分子を得た後で、サンプルをエキソヌクレアーゼに曝露するステップe)を含む、実施形態4~9のいずれか1つに記載の方法。
実施形態12.閉端末端を含む第2の核酸分子を第2の標的配列にて切断して、1つの開端末端及び1つの閉端末端を含む第2の核酸をもたらすステップf)を含む、実施形態11に記載の方法。
実施形態13.1つの開端末端及び1つの閉端末端を含む第1の核酸分子又は任意選択で第2の核酸分子の開端末端にさらなるアダプターを連結するステップg)を含み、さらなるアダプターは、増幅プライマー結合部位及び配列プライマー結合部位のうちの少なくとも1つ及び任意選択で識別子配列を含む、実施形態4~12のいずれか1つに記載の方法。
実施形態14.核酸分子ライブラリーが、複数のサンプルから調製され、好ましくは複数のサンプルが、好ましくはステップc)、ステップd)、ステップe)、ステップf)の前に、又はステップg)の前にプールされる、実施形態4~13のいずれか1つに記載の方法。
実施形態15.サンプルが、ステップg)の後にプールされる、実施形態13に記載の方法。
実施形態16.ステップc)において分子をTeINプロテロメラーゼと接触させる前に、ステップb)においてアダプター連結核酸分子を修復して、一本鎖切断を除去する、実施形態4~13のいずれか1つに記載の方法。
実施形態17.核酸分子ライブラリーを増幅するための方法であって、
実施形態13~16のいずれか1つで定義した核酸分子ライブラリーを調製するステップと;
i)ステップd)において得られる1つの開端末端及び1つの閉端末端を含む第1の核酸分子にアニーリングする第1のプライマー及び任意選択で第2のプライマー;
ii)ステップf)において得られる1つの開端末端及び1つの閉端末端を含む第2の核酸分子にアニーリングする第1のプライマー及び任意選択で第2のプライマー;
iii)ステップg)で定義したさらなるアダプターにアニーリングする第1のプライマー及び任意選択で第2のプライマー;並びに
iv)i)又はii)で定義した第1のプライマー及びiii)で定義した第2のプライマーの組合せ
のうちの少なくとも1つを使用して核酸分子ライブラリーを増幅するステップと
を含む方法。
実施形態13~16のいずれか1つで定義した核酸分子ライブラリーを調製するステップと;
i)ステップd)において得られる1つの開端末端及び1つの閉端末端を含む第1の核酸分子にアニーリングする第1のプライマー及び任意選択で第2のプライマー;
ii)ステップf)において得られる1つの開端末端及び1つの閉端末端を含む第2の核酸分子にアニーリングする第1のプライマー及び任意選択で第2のプライマー;
iii)ステップg)で定義したさらなるアダプターにアニーリングする第1のプライマー及び任意選択で第2のプライマー;並びに
iv)i)又はii)で定義した第1のプライマー及びiii)で定義した第2のプライマーの組合せ
のうちの少なくとも1つを使用して核酸分子ライブラリーを増幅するステップと
を含む方法。
実施形態18.第1及び第2の核酸分子を含むサンプル中の目的の配列を分析するための方法であって、
実施形態13~16のいずれか1つで定義した核酸分子ライブラリーを調製するステップと、
任意選択で、実施形態17で定義した調製された核酸分子を増幅するステップと、
核酸分子ライブラリーを、配列決定する、好ましくはディープシーケンシングするステップと
を含む方法。
実施形態13~16のいずれか1つで定義した核酸分子ライブラリーを調製するステップと、
任意選択で、実施形態17で定義した調製された核酸分子を増幅するステップと、
核酸分子ライブラリーを、配列決定する、好ましくはディープシーケンシングするステップと
を含む方法。
実施形態19.実施形態1~3のいずれか1つで定義した1つ又は複数のアダプターと;
任意選択で、プロテロメラーゼ、好ましくはTeINプロテロメラーゼと
を含むキットオブパーツ。
任意選択で、プロテロメラーゼ、好ましくはTeINプロテロメラーゼと
を含むキットオブパーツ。
定義
本発明の方法、組成物、使用及び他の態様に関する各種用語は、本明細書及び特許請求の範囲の全体にわたって使用される。そのような用語には、特段の明示のない限り、本発明が関係する技術分野における通常の意味が付与されるものとする。他の詳細に定義された用語は、本明細書で提供された定義と一致する方法で解釈されるものとする。本明細書に記載のものと類似の又は同等の任意の方法及び材料を本発明の試験の実施において使用することができ、好ましい材料及び方法は本明細書に記載されている。
本発明の方法、組成物、使用及び他の態様に関する各種用語は、本明細書及び特許請求の範囲の全体にわたって使用される。そのような用語には、特段の明示のない限り、本発明が関係する技術分野における通常の意味が付与されるものとする。他の詳細に定義された用語は、本明細書で提供された定義と一致する方法で解釈されるものとする。本明細書に記載のものと類似の又は同等の任意の方法及び材料を本発明の試験の実施において使用することができ、好ましい材料及び方法は本明細書に記載されている。
本発明の方法において使用される従来の技術を実施する方法は、当業者には明らかである。分子生物学、生化学、計算化学、細胞培養、組換えDNA、バイオインフォマティクス、ゲノミクス、配列決定及び関連する分野における従来の技術の実施は、当業者には周知であり、例えば、以下の文献:Sambrookら、Molecular Cloning. A Laboratory Manual, 2nd Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N. Y., 1989; Ausubelら、Current Protocols in Molecular Biology, John Wiley & Sons, New York, 1987及び定期的更新;並びにthe series Methods in Enzymology, Academic Press, San Diegoで論じられている。
「A」、「an」、及び「the」:これらの単数形の用語は、文脈で特に明示されていない限り、複数の指示物を含む。したがって、例えば、「細胞(a cell)」への言及は、2つ以上の細胞の組合せなどを含む。
本明細書で使用される場合、用語の「約」とは、わずかな変動を記載及び説明するために使用される。例えば、この用語は、±10%以下、例えば、±5%以下、±4%以下、±3%以下、±2%以下、±1%以下、±0.5%以下、±0.1%、又は±0.05%以下を意味し得る。さらに、量、比率、及び他の数値が本明細書において範囲形式で示されている場合がある。そのような範囲形式は、便宜的且つ簡潔にするために使用されており、範囲の制限として明示的に示した数値を含むように柔軟に理解されるべきであるが、あたかも各数値及び部分的範囲が明示的に示されているように、その範囲内に含まれるすべての個々の数値又は部分的範囲もまた含むように理解されたい。例えば、約1~約200の範囲の比は、約1~約200の明示的に記載された範囲を含むが、約2、約3、及び約4などの個々の比、並びに約10~約50、約20~約100などの部分的範囲も含むものと理解されたい。
本明細書で使用される場合、用語の「アダプター」とは、好ましくは限定された長さ、例えば約10~約200、若しくは約10~約100塩基を有するか、又は約10~約80、若しくは約10~約50、若しくは約10~約30塩基対の長さを有する、他の核酸の末端に、例えば、二本鎖DNA分子の一方の鎖又は両方の鎖に結合され得る、好ましくは連結され得る一本鎖、二本鎖、部分的二本鎖、Y字型又はヘアピン核酸分子であり、好ましくは化学的に合成される。アダプターの二本鎖構造は、相互に塩基対を形成する2つの別個のオリゴヌクレオチド分子によって、又は単一オリゴヌクレオチド鎖のヘアピン構造によって形成され得る。明らかなように、アダプターの結合可能な末端は、制限酵素及び/又はプログラム可能なヌクレアーゼによる切断で生じるオーバーハングと互換性があるように、任意選択で連結可能であるように設計することができるか、非鋳型伸長反応の付加(例えば、3’-A付加)の後に生成されたオーバーハングと互換性があるように設計することができるか、又は平滑末端を有し得る。
「及び/又は」:用語の「及び/又は」とは、1つ又は複数の記載した事例が単独で、又は記載した事例の少なくとも1つと組み合わせて、記載したすべての事例に至るまで起こり得る状況を意味する。
核酸又は核酸反応に関して使用される「増幅」とは、特定の核酸、例えば、標的核酸又はタグ付き核酸などのコピーを作製するin vitroの方法を意味する。核酸を増幅する多数の方法が当技術分野では公知であり、増幅反応には、ポリメラーゼ連鎖反応、リガーゼ連鎖反応、鎖置換増幅反応、ローリングサークル増幅反応、転写介在増幅法、例えばNASBA(例えば、米国特許第5,409,818号)、ループ介在増幅法(例えば、米国特許第6,410,278号に記載されているようなループ形成配列を使用する「LAMP」増幅)、及び等温増幅反応が含まれる。増幅される核酸は、DNA若しくはRNA、又は修飾されたDNA及び/若しくはRNAを含む、DNAとRNAの混合物を含むか、それらからなるか、又はそれらに由来するDNAであり得る。1つ又は複数の核酸分子の増幅から生じる産物(すなわち「増幅産物」)は、出発核酸がDNA、RNA、又はその両方であるかどうかにかかわらず、DNA若しくはRNAのいずれか、又はDNA及びRNAのヌクレオシド若しくはヌクレオチドの両方の混合物であり得、又はそれらは修飾されたDNA若しくはRNAのヌクレオシド若しくはヌクレオチドを含み得る。
「コピー」とは、限定するものではないが、特定の配列に対して完全な配列相補性又は完全な配列同一性を有する配列であり得る。或いは、コピーは、必ずしもこの特定の配列に対して完全な配列相補性又は同一性を有するわけではなく、例えば、ある程度の配列変異は許容される。例えば、コピーは、ヌクレオチド類似体、例えば、デオキシイノシン若しくはデオキシウリジン、意図的な配列改変(例えば、特定の配列にハイブリダイズ可能であるが相補的ではない配列を含むプライマーを介して導入される配列改変)、及び/又は増幅中に生じる配列エラーを含み得る。
用語の「相補性」とは、本明細書では、完全に相補的な鎖(例えば、第2の鎖又は逆鎖)に対する配列の配列同一性として定義される。例えば、100%相補的(又は完全に相補的)である配列は、本明細書では、相補鎖と100%の配列同一性を有するものと理解され、例えば、80%相補的である配列は、本明細書では、(完全に)相補的な鎖に対して80%の配列同一性を有するものと理解される。
「含む」:この用語は、包括的で制限はなく、排他的ではないと解釈される。詳しくは、この用語及びその変化形は、指定した特徴、ステップ、又は構成要素が含まれることを意味する。これらの用語は、他の特徴、ステップ、又は構成要素の存在を排除するものと解釈されるべきではない。
「構築物」又は「核酸構築物」又は「ベクター」:これは、組換えDNA技術の使用によって得られる人工核酸分子を意味し、多くの場合、構築物に含まれるDNA領域を宿主細胞で発現させる目的で、外因性DNAを宿主細胞に送達するために使用され得る。構築物のベクター骨格は、例えば、(キメラ)遺伝子が組み込まれているプラスミドであってもよく、又は適切な転写調節配列が既に存在している場合(例えば(誘導性)プロモーター)、所望のヌクレオチド配列(例えばコード配列)のみが転写調節配列の下流に組み込まれる。ベクターは、分子クローニングにおけるそれらの使用を容易にするために、さらなる遺伝要素、例えば、選択可能なマーカー、複数のクローニング部位などを含むことができる。
本明細書で使用される場合、用語の「二本鎖」及び「二重鎖」とは、塩基対を形成する、すなわち、一緒にハイブリダイズする2つの相補ポリヌクレオチドを述べている。相補ヌクレオチド鎖は、当技術分野では逆相補としても公知である。
用語の「有効量」とは、本明細書で使用される場合、所望の生物学的効果を誘発するのに十分である生物学的活性剤の量を意味する。例えば、いくつかの実施形態では、エキソヌクレアーゼの有効量は、保護されていない核酸の切断を誘導するのに十分なエキソヌクレアーゼの量を意味することができる。当業者には明らかであるように、薬剤の有効量は、様々な要因、例えば使用される薬剤、薬剤が使用される条件、及び所望の生物学的効果、例えば、検出されるヌクレアーゼ切断の程度などに応じて変動し得る。
「例示的」:この用語は「例、事例、又は実例として有用である」ことを意味し、本明細書で開示されている他の構成を排除するものと解釈されるべきではない。
「発現」:これは、適切な調節領域、特にプロモーターに作動可能に連結されているDNA領域が、次にタンパク質又はペプチドに翻訳され得るRNAに転写されるプロセスを意味する。
「ガイド配列」とは、本明細書では、RNA又はDNA誘導型エンドヌクレアーゼをRNA又はDNA分子中の特定の部位に向ける配列として理解されたい。gRNA-CAS複合体の文脈において、「ガイド配列」は、本明細書では、gRNA-CAS複合体を二重鎖DNA中の特定の部位に標的化するために必要とされる、sgRNA又はcrRNAのセクションとしてさらに理解されたい。
gRNA-CAS複合体は、本明細書では、CRISPR-エンドヌクレアーゼ又はCRISPR-ヌクレアーゼとも呼ばれ、ガイドRNAと複合体化又はハイブリダイズされ、そのガイドRNAはcrRNA及び/又はtracrRNA、又はsgRNAであり得る、CASタンパク質であると理解されたい。
「同一性」及び「類似性」は、公知の方法により容易に算出することができる。「配列同一性」及び「配列類似性」は、グローバル又はローカルアラインメントアルゴリズムを使用し、2つの配列の長さに応じて、2つのペプチド配列又は2つのヌクレオチド配列のアラインメントによって決定することができる。同様の長さの配列は、好ましくは、配列を全長にわたり最適に整列するグローバルアラインメントアルゴリズム(例えば、Needleman Wunsch)を使用して整列されるが、実質的に異なる長さの配列は、好ましくは、ローカルアライメントアルゴリズム(例えば、Smith Waterman)を使用して整列される。配列は、(例えば、デフォルトパラメータを使用してプログラムGAP又はBESTFITにより最適に整列される場合に)、(下記で定義した)配列同一性の少なくとも特定のパーセンテージを共有する場合、「実質的に同一の」又は「本質的に類似の」と呼ばれ得る。GAPは、Needleman及びWunschのグローバルアライメントアルゴリズムを使用して、2つの配列をその全長(完全長)にわたり整列し、一致の数を最大化し、ギャップの数を最小化する。グローバルアライメントは、2つの配列が類似の長さを有する場合に配列の同一性を決定するのに適切に使用される。一般的には、GAPデフォルトパラメータは、ギャップ作成ペナルティ(gap creation penalty)=50(ヌクレオチド)/8(タンパク質)及びギャップ伸長ペナルティ(gap extension penalty)=3(ヌクレオチド)/2(タンパク質)と共に使用される。ヌクレオチドの場合、使用されるデフォルトスコアリングマトリックスはnwsgapdnaであり、タンパク質の場合、デフォルトスコアリングマトリックスはBlosum62である(Henikoff&Henikoff、1992、PNAS 89、915~919)。配列アラインメント及び配列同一性パーセンテージのスコアは、コンピュータープログラム、例えば、Accelrys Inc., 9685 Scranton Road, San Diego, CA 92121-3752 USAから入手可能なGCG Wisconsin Package、バージョン10.3を使用し、又はオープンソースソフトウェア、例えば、上記のGAPと同じパラメータを使用するか、若しくはデフォルト設定を使用するEmbossWIN バージョン2.10.0のプログラム「needle」(グローバルNeedleman Wunschアルゴリズムを使用)若しくは「water」(ローカルSmith Watermanアルゴリズムを使用)を使用して決定することができる(「needle」及び「water」の両方、並びにタンパク質アラインメント及びDNAアライメントの両方において、デフォルトギャップ作成ペナルティは10.0であり、デフォルトギャップ伸長ペナルティは0.5である;デフォルトスコアリングマトリックスは、タンパク質についてはBlosum62であり、DNAについてはDNAFullである)。配列が実質的に異なる全長を有する場合は、ローカルアラインメント、例えばSmith Watermanアルゴリズムを使用するものが好ましい。
或いは、類似性又は同一性のパーセンテージは、アルゴリズム、例えばFASTA、BLASTなどを使用して、公共データベースに対して検索することにより決定することができる。したがって、本発明の核酸配列及びタンパク質配列は、「クエリ配列」としてさらに使用することができ、例えば、他のファミリーメンバー又は関連配列を同定するために、公共データベースに対して検索を実施することができる。このような検索は、Altschulら (1990) J. Mol. Biol. 215:403~10のBLASTn及びBLASTxプログラム(バージョン2.0)を使用して実施することができる。BLASTヌクレオチド検索は、NBLASTプログラム、スコア=100、ワード長=12を用いて実施し、本発明の核酸分子に相同なヌクレオチド配列を得ることができる。BLASTタンパク質検索は、BLASTxプログラム、スコア=50、ワード長=3を用いて実施し、本発明のタンパク質分子に相同なアミノ酸配列を得ることができる。比較の目的でギャップを加えたアライメントを得るには、Altschulら, (1997) Nucleic Acids Res. 25(17): 3389~3402に記載のように、Gapped BLASTを利用することができる。BLAST及びGapped BLASTのプログラムを利用する場合、それぞれのプログラムのデフォルトパラメータ(例えば、BLASTx及びBLASTn)を使用することができる。http://www.ncbi.nlm.nih.gov/の米国国立バイオテクノロジー情報センター(National Center for Biotechnology Information)のホームページを参照されたい。
用語の「ヌクレオチド」には、限定するものではないが、グアニン、シトシン、アデニン、及びチミン(それぞれ、G、C、A及びT)を含む、天然に存在するヌクレオチドが含まれる。用語の「ヌクレオチド」とは、公知のプリン塩基及びピリミジン塩基だけでなく、修飾された他の複素環式塩基も含むそれらの部分を含むことをさらに意図する。そのような修飾には、メチル化されたプリン又はピリミジン、アシル化されたプリン又はピリミジン、アルキル化されたリボース又は他の複素環が含まれる。さらに、用語の「ヌクレオチド」には、ハプテン又は蛍光標識を含み、従来のリボース及びデオキシリボース糖だけでなく、他の糖も同様に含み得るそれらの部分が含まれる。修飾されたヌクレオシド又はヌクレオチドはまた、糖部分の修飾を含み、例えば、1つ若しくは複数のヒドロキシル基がハロゲン原子若しくは脂肪族基で置き換えられているか、又はエーテル、アミンなどとして官能基化されている。
用語の「核酸」、「ポリヌクレオチド」及び「核酸分子」とは、本明細書では互換的に使用され、ヌクレオチド、例えば、デオキシリボヌクレオチド又はリボヌクレオチドからなる任意の長さのポリマー、例えば、約2塩基より大きく、約10塩基より大きく、約100塩基より大きく、約500塩基より大きく、1000塩基より大きく、最大約10,000又はそれ以上の塩基のポリマーのことを記述し、酵素的又は合成的に生成され得る(例えば、米国特許第5,948,902号及び本明細書で引用されている参考文献に記載されているPNA)。核酸は、天然に存在する2つの核酸の配列に類似する配列特異的な方法で天然に存在する核酸とハイブリダイズすることができ、例えば、ワトソン-クリック型塩基対形成の相互作用に関与し得る。さらに、核酸及びポリヌクレオチドは、細胞、組織、及び/又は体液から単離することができる(また任意選択で、断片化することができる)。核酸は、例えば、ゲノムDNA(gDNA)、ミトコンドリア、無細胞DNA(cfDNA)、ライブラリー由来のDNA及び/又はライブラリー由来のRNAであり得る。
本明細書で使用される場合、用語の「核酸サンプル」又は「核酸を含むサンプル」とは、核酸を含む任意のサンプルを示し、サンプルは、典型的には、必ずではないが、液体の形態中に、1つ又は複数の目的の核酸分子を含む材料又は材料の混合物に関する。1つ又は複数の目的の核酸分子は、好ましくは、目的の配列を含む。目的の核酸分子は、好ましくは、本明細書で定義した第1の核酸分子又は第2の核酸分子である。核酸サンプルは、好ましくは、目的の配列を含む。本発明の方法において出発物質として使用される核酸サンプルは、任意の供給源、例えば、全ゲノム、染色体のコレクション、単一の染色体、1つ又は複数の染色体又は転写された遺伝子に由来する1つ又は複数の領域からのものであってもよく、生物学的供給源又は実験的供給源、例えば、核酸ライブラリーから直接精製され得る。核酸サンプルは、ヒト若しくは他の種(例えば、植物、細菌、真菌、藻類、古細菌など)であり得る同じ個体から、又は同じ種の異なる個体から、又は異なる種の異なる個体から得ることができる。例えば、核酸サンプルは、細胞、組織、生検、体液、ゲノムDNAライブラリー、cDNAライブラリー及び/又はRNAライブラリー由来のものであり得る。核酸サンプルは、好ましくは、少なくとも第1の核酸分子及び第2の核酸分子を含む。
用語の「目的の配列」とは、限定するものではないが、細胞内に好ましくは存在する任意の遺伝子配列、例えば、遺伝子、遺伝子の一部、又は遺伝子内の若しくは遺伝子に隣接する非コード配列などを含む。目的の配列は、染色体、エピソーム、オルガネラゲノム、例えば、ミトコンドリアゲノム若しくは葉緑体ゲノム、又は遺伝物質の本体とは独立して存在することができる遺伝物質、例えば、感染ウイルスゲノム、プラスミド、エピソーム、トランスポゾンなどに存在し得る。目的の配列は、遺伝子のコード配列内、転写された非コード配列内、例えば、リーダー配列、トレーラー配列又はイントロン内にあり得る。前記の目的の核酸配列は、二本鎖核酸又は一本鎖核酸に存在し得る。好ましくは、目的の配列は、第1の核酸分子又は第2の核酸分子に存在する。
目的の配列は、限定するものではないが、多型、例えばSNPを有するか、又は有することが疑われる配列であり得る。
本明細書で使用される場合、用語の「オリゴヌクレオチド」とは、ヌクレオチドの、好ましくは約2~200ヌクレオチド、又は最大500ヌクレオチドの長さの一本鎖多量体を意味する。オリゴヌクレオチドは合成であってもよく、又は酵素的に作製されてもよく、いくつかの実施形態では、約10~50ヌクレオチドの長さである。オリゴヌクレオチドは、リボヌクレオチド単量体(すなわち、オリゴリボヌクレオチドであり得る)又はデオキシリボヌクレオチド単量体を含み得る。オリゴヌクレオチドは、例えば、約10~20、20~30、30~40、40~50、50~60、60~70、70~80、80~100、100~150、150~200、又は約200~250ヌクレオチドの長さであり得る。
「植物」:これは、植物細胞、植物プロトプラスト、植物が再生され得る植物細胞組織培養物、植物カルス、植物塊、及び植物又は植物の一部、例えば胚、花粉、胚珠、種子、葉、花、枝、果実、穀粒、穂、穂軸、殻、茎、根、根端、葯、粒などの無傷の植物細胞を含む。植物の非限定的な例としては、作物及び栽培植物、例えば、大麦、キャベツ、キャノーラ、キャッサバ、カリフラワー、チコリ、ワタ、キュウリ、ナス、ブドウ、トウガラシ、レタス、トウモロコシ、メロン、アブラナ、ジャガイモ、カボチャ、米、ライムギ、モロコシ、カボチャ、サトウキビ、テンサイ、ヒマワリ、ピーマン、トマト、スイカ、小麦、及びズッキーニなどが挙げられる。
「プロトスペーサー配列」は、ガイドRNA、より詳しくはcrRNA、又はsgRNAの場合にはガイドRNAのcrRNA部分内のガイド配列に認識又はハイブリダイズされ得る配列である。本発明の文脈における「プロトスペーサー配列」は、標的配列、つまり本明細書で定義した第1又は第2の核酸分子に存在する配列の例であることが本明細書では理解される。
「エンドヌクレアーゼ」は、その標的部位又は認識部位に結合した際、二重鎖DNAのうちの少なくとも1つの鎖又はRNA分子の鎖を加水分解する酵素である。エンドヌクレアーゼは、本明細書では、部位特異的エンドヌクレアーゼと理解されたく、用語の「エンドヌクレアーゼ」及び「ヌクレアーゼ」は、本明細書では互換的に使用される。制限エンドヌクレアーゼは、本明細書では、二重鎖の両鎖を同時に加水分解し、DNAに二本鎖切断を導入するエンドヌクレアーゼとして理解されたい。「ニッキング」エンドヌクレアーゼは、二重鎖の1つの鎖のみを加水分解し、切断されるというよりはむしろ「切れ目が入れられた」DNA分子を生成するエンドヌクレアーゼである。
「エキソヌクレアーゼ」は、本明細書では、ポリヌクレオチドの末端(エキソ)から1つ又は複数のヌクレオチドを切断する任意の酵素として定義される。
「複雑性を低減すること」又は「複雑性の低減」とは、本明細書では、複雑な核酸サンプル、例えば、ゲノムDNAに由来するサンプル、リキッドバイオプシーに由来するcfDNA、単離されたRNAサンプルなどの低減として理解するものとする。複雑性の低減は、好ましくは複雑な出発物質内に含まれる目的の配列を含む1つ若しくは複数の特異的な核酸の濃縮、及び/又はサンプルのサブセットの生成をもたらし、サブセットは、好ましくは複雑な出発物質内に含まれる目的の配列を含む1つ若しくは複数の特異的な核酸を含むか又はからなり、好ましくは目的の配列を含まない非特異的核酸は、出発物質中の非特異的核酸の量と比較して、つまり複雑性の低減前と比較して、量が少なくとも20%、30%、40%、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%又は99%低減される。
複雑性の低減は、一般に、さらなる分析ステップ又は方法ステップ、例えば、増幅、バーコード、シーケンシング、エピジェネティック変化の決定などの前に実施される。好ましくは、複雑性の低減は、再現可能な複雑性の低減であり、これは、同じサンプルの複雑性が同じ方法を使用して低減される場合、ランダムな複雑性の低減とは対照的に、同じか又は少なくとも同等のサブセットが得られることを意味する。
複雑性の低減方法の例としては、例えば、AFLP(登録商標)(Keygene N.V., the Netherlands;例えば、欧州特許第0534858号を参照されたい)、任意プライムPCR増幅、キャプチャープローブハイブリダイゼーション、Dongにより記載されている方法(例えば、国際公開第03/012118号、国際公開第00/24939号を参照されたい)、及び指標付け連結(Unrau P.及びDeugau K.V.(1994) Gene 145:163~169)、国際公開第2006/137733号;国際公開第2007/037678号;国際公開第2007/073165号;国際公開第2007/073171号、米国特許出願公開第2005/260628号、国際公開第03/010328号、米国特許出願公開第2004/10153号に記載されている方法、ゲノム分割(例えば、国際公開第2004/022758号を参照されたい)、遺伝子発現連続分析(SAGE;例えば、Velculescuら,1995,上記を参照、及びMatsumuraら,1999,The Plant Journal, vol.20(6):719~726を参照されたい)及びSAGEの変法(例えば、Powell,1998,Nucleic Acids Research, vol.26(14):3445~3446;並びにKenzelmann及びMuhlemann,1999,Nucleic Acids Research,vol.27(3):917~918を参照されたい)、MicroSAGE(例えば、Datsonら,1999,Nucleic Acids Research,vol.27(5):1300~1307を参照されたい)超並列シグネチャーシーケンシング(Massively Parallel Signature Sequencing)(MPSS;例えば、Brennerら,2000,Nature Biotechnology,vol.18:630~634、及びBrennerら,2000,PNAS,vol.97(4):1665~1670を参照されたい)、自己サブトラクト型cDNAライブラリー(Lavederら,2002,Nucleic Acids Research,vol.30(9):e38)、リアルタイム多重連結依存プローブ増幅(RT-MLPA;例えば、Elderingら,2003,vol.31(23):el53を参照されたい)、高カバー率発現プロファイリング(HiCEP;例えば、Fukumuraら,2003,Nucleic Acids Research,vol.31(16):e94を参照されたい)、Rothら(Rothら,2004,Nature Biotechnology,vol.22(4):418~426)に開示されているユニバーサルマイクロアレイシステム、トランスクリプトームサブトラクション法(例えば、Liら, Nucleic Acids Research,vol.33(16):el36を参照されたい)、及び断片ディスプレイ(例えば、Metsisら,2004,Nucleic Acids Research,vol.32(16):el27を参照されたい)が挙げられる。
「配列」又は「ヌクレオチド配列」:これは、核酸の又は核酸内のヌクレオチドの順序を意味する。言い換えると、核酸のヌクレオチドの任意の順序は、配列又は核酸配列と呼ぶことができる。例えば、標的配列は、DNA二重鎖の一本鎖に含まれるヌクレオチドの順序である。
用語の「配列決定」とは、本明細書で使用される場合、ポリヌクレオチドの少なくとも10個の連続するヌクレオチドの同一性(例えば、少なくとも20個、少なくとも50個、少なくとも100個、又は少なくとも200個以上の連続するヌクレオチドの同一性)が得られる方法を意味する。用語の「次世代配列決定」とは、例えば、現在Illumina、Life Technologies、PacBio及びRocheなどによって採用されているような、いわゆる並列化された合成による配列決定又はライゲーションプラットフォームによる配列決定を意味する。次世代配列決定法には、Oxford Nanopore Technologies(ONT)によって商品化されたようなナノポアシーケンシング法、又はLife Technologiesによって商品化されたIon Torrentテクノロジーなどの電子検出ベースの方法も含まれ得る。好ましくは、次世代配列決定法は、ナノポアシーケンシング法、好ましくはナノポア選択的シーケンシング法である。
「ナノポア選択的シーケンシング」は、Oxford Nanopore又はOnteraなどのナノポアシーケンシング技術を使用してリアルタイムで単一分子を選択的に配列決定し、非標的配列を拒絶するために、ストリーミングナノポア電流シグナル又は塩基コールを参照配列にマッピングすることであると理解されるべきである。シーケンサーは、生成されているデータに応じて、核酸の配列決定を追求するか、又は終了して、非標的分子を排出しナノポアが新しい配列決定読み取りに利用可能になるのに十分な特定の短い期間にわたって特定のポアの電圧の極性を反転させることによって核酸を配列決定ポアから除去するかのいずれかを行うように操作される。ナノポア選択的シーケンシング法の例は、Payneら、 2020 (Nanopore adaptive sequencing for mixed samples, whole exome capture and targeted panels, February 3, 2020; DOI: 10.1101/2020.02.03.926956)及びKovakaら、2020(Targeted nanopore sequencing by real-time mapping of raw electrical signal with UNCALLED, February 3, 2020; doi: 10.1101/2020.02.03.931923)に記載されている。これら文献は、参照により本明細書に組み込まれる。
本発明の文脈における「第1の核酸分子」は、一本鎖又は二本鎖の核酸の、より小さな若しくはより長いストレッチ又は選択された部分であり得る。本発明の方法を実施する前は、第1の核酸分子は、より大きな核酸分子内に、例えば、分析しようとするサンプル中に存在するより大きな核酸分子内に含まれ得る。好ましくは、第1の核酸分子は、第1の標的配列を含む。
本発明の文脈における「第2の核酸分子」は、一本鎖又は二本鎖の核酸の、より小さな若しくはより長いストレッチ又は選択された部分であり得る。本発明の方法を実施する前は、第2の核酸分子は、より大きな核酸分子内に、例えば、分析しようとするサンプル中に存在するより大きな核酸分子内に含まれ得る。第1の核酸分子は、同じより大きな核酸分子に存在し得る。或いは、第1及び第2の核酸分子は、別々のより大きな核酸分子に存在し、別々のより大きな核酸分子は、同じサンプルに存在する。いくつかの実施形態において、第2の核酸分子は、第2の標的配列を含み得る。
第1及び第2の核酸分子のうちの少なくとも1つは、目的の配列を含み得る。好ましくは、第1の核酸分子は、目的の配列を含む。代替的な実施形態では、第2の核酸分子は、目的の配列を含む。
目的の配列は、核酸サンプル内の任意の配列、例えば、遺伝子、遺伝子複合体、遺伝子座、偽遺伝子、調節領域、高度反復性領域、多型領域、又はそれらの一部であり得る。目的の配列はまた、表現型又は疾患を示す遺伝的変異又はエピジェネティック変異を含む領域であり得る。目的の配列は、好ましくは、限定するものではないが、コピー、増幅、配列決定、及び/又は核酸調査のための他の手順などの、さらなる分析又は作用の対象である。
「標的配列」は、本明細書では、本明細書で定義した第1又は第2の核酸分子に存在する配列であると定義され、この配列は、本明細書で定義したヌクレアーゼ及びニッカーゼのうちの少なくとも1つによって認識される。
いくつかの態様では、本発明の方法で使用される核酸分子の複数又は「セット」は、濃縮のために選択される1つ又は複数の目的の配列を含む。任意選択で、そのようなセットは、構造的又は機能的に関連する核酸分子からなる。本発明の文脈における核酸分子は、限定するものではないが、DNA、RNA、BNA(架橋核酸)、LNA(ロックド核酸)、PNA(ペプチド核酸)、モルホリノ核酸、グリコール核酸、スレオス核酸、メチル化DNAなどのエピジェネティック的に修飾されたヌクレオチド、並びにそれらの模倣体及び組合せを含む、天然及び非天然両方の人工又は非標準のヌクレオチドを含み得る。
好ましくは、目的の配列は、二重鎖DNAの一本鎖のヌクレオチドの小さな又はより長い連続ストレッチ(つまりポリヌクレオチド)であり、前記二重鎖DNAは、目的の配列に対して相補的な配列を含む相補鎖をさらに含む。好ましくは、前記二重鎖DNAは、ゲノムDNA(gDNA)及び/又は無細胞DNA(cfDNA)である。
本発明者らは、プロテロメラーゼ認識部位を含むアダプターをライブラリー調製のために使用し得ることを発見した。特に、プロテロメラーゼ酵素の認識部位を含むアダプターを、核酸分子に連結することができ、こうした核酸分子は、二本鎖であるか又はアダプター連結後に二本鎖になるかのいずれかである。その後、こうしたアダプターはプロテロメラーゼ酵素によって切断され、同時に核酸分子の末端が共有結合で閉端される。核酸分子の両末端がこのように閉端されている場合、分子は、遊離「末端」ヌクレオチドを欠如するため、エキソヌクレアーゼ分解から保護される。
対応する上鎖の3’末端ヌクレオチドが、対応する下鎖の5’末端ヌクレオチドに共有結合で連結されている二本鎖核酸の末端は、本明細書では「閉端末端」であると注釈付けされる。同様に、対応する上鎖の5’末端ヌクレオチドが、対応する下鎖の3’末端ヌクレオチドに共有結合で連結されている二本鎖核酸の末端も、本明細書では「閉端末端」であると注釈付けされる。したがって、「閉端末端」は、反対側の鎖の末端核酸が互いに共有結合で連結されていない二本鎖核酸の末端であると本明細書では理解される「開端末端」とは対照的に、反対側の鎖の末端核酸が互いに共有結合で連結されている二本鎖核酸の末端であると本明細書では理解される。
本明細書に詳述されている新規のライブラリー調製方法の場合、好ましくは、特定の核酸サンプルに存在する核酸分子はすべて、プロテロメラーゼアダプターで両側がタグ付けされており、したがってプロテロメラーゼ処理時に切断されて、5’又は3’修飾酵素に非感受性である共有結合で閉端された核酸分子がもたらされる。プロテロメラーゼ処理サンプルのエキソヌクレアーゼ処理の任意選択ステップを追加して、両末端が共有結合で閉端されていないあらゆる考え得る核酸分子を除去することができる。その後、(共有結合で閉端された)核酸分子を、例えば、標的化又はプログラム可能なエンドヌクレアーゼを使用することによって選択的に開端することができる。すべての核酸分子が依然として反応混合物中に存在するものの、例えば、配列決定アダプターを開端末端に連結して、それによりこうした開端断片を配列決定に直ぐ使えるように選択的に準備することによって、最後の開端反応で切断されたものだけを、その後の(配列決定)プロセスで使用することができる。或いは、エキソヌクレアーゼ処理を使用して開端断片を分解し、それによりさらなる処理のために未開端核酸分子を濃縮してもよい。例えば、こうした未開端分子は、例えば、こうした未開端分子を標的とするプログラム可能なエンドヌクレアーゼを使用して、第2ラウンドの選択的開端で開端することができる。
上記で言及したアプローチは、少なくとも以下の利点を有する。
核酸分子の末端にバーコードを付加し、その後サンプルをプールすることができ、その後でさらなるサンプル調製ステップが実施される。
通常は1標的遺伝子座当たり2つのgRNAが使用されるのとは対照的に、遺伝子座の標的化には単一のCRISPR酵素/ガイド複合体しか必要とされない。
このアプローチは、原理的に、配列決定プラットフォームに依存しない。
このアプローチを使用すると、増幅ステップを用いずに核酸分子を標的とすることでき、それにより天然塩基修飾の検出が可能になる。
言及したアプローチは、任意の長さの核酸分子に、つまり短い分子(<1Kbp)又は長い分子(>5Kbp)に適用することができる。
したがって、第1の態様では、本発明は、プロテロメラーゼ認識配列を含むアダプターに関する。好ましくは、アダプターは、TeINプロテロメラーゼ認識配列を含む。好ましくは、アダプターは、本発明の方法で使用するためのものである。好ましくは、アダプターは、本発明の方法で使用される核酸分子に連結することができる。
アダプターは一本鎖であってもよい。一本鎖アダプターは、好ましくは、本発明の方法で使用される核酸分子にハイブリダイズすることが可能なセクションを好ましくはその3’末端に含む。一本鎖アダプターは、好ましくは、核酸分子の一本鎖オーバーハングに、好ましくは、核酸分子の3’オーバーハングにハイブリダイズすることができる。アニーリングした一本鎖アダプターの一本鎖部分は、その後、限定するものではないが、クレノウ(当業者には、5’->3’ポリメラーゼ活性及び3’->5’エキソヌクレアーゼ活性を有するが5’->3’エキソヌクレアーゼ活性を欠如することが知られている)又はBst-ポリメラーゼ(当業者には、5’->3’ポリメラーゼ活性及び鎖置換活性を有するが、3’->5’エキソヌクレアーゼ活性を欠如する、バチルス・ステアロサーモフィルス(Bacillus stearothermophilus)に由来するDNAポリメラーゼであることが知られている)などのポリメラーゼを使用して補充することができる、つまり二本鎖にすることができる。補充ステップは、任意選択で、二本鎖プロテロメラーゼ認識配列の生成をもたらす。
好ましくは、アダプターは、少なくとも部分的に二本鎖である。本明細書で定義した本発明の方法では、少なくとも部分的に二本鎖のアダプターを核酸分子に連結することができる。好ましくは、アダプターのヌクレオチドのうちの少なくとも15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、又は100%は、二本鎖である。好ましくは、プロテロメラーゼ認識配列は、二本鎖である。アダプターは、100%又は「完全に」二本鎖であってもよい。アダプターは、アダプターを核酸分子に連結した後で、例えばDNAポリメラーゼを使用してアダプターの一本鎖部分を補充することによって、完全に二本鎖になり得る。
好ましくは、少なくとも部分的に二本鎖のアダプターは、互いに少なくとも部分的にアニーリングすることができる2つの一本鎖分子を含み、つまり二本鎖アダプターは、好ましくは、本明細書で定義した核酸分子にアダプターを連結する前に2つの開端末端を含む。
少なくとも部分的に二本鎖のアダプターの一方の末端を核酸分子に連結することができる。したがって、好ましくは、核酸分子に連結されている少なくとも一方の末端は二本鎖である。アダプターの二本鎖末端の少なくとも一方の末端は、平滑末端又は付着末端又は「粘着」末端であり得る。好ましくは、アダプターは、少なくとも1つの付着末端を含む。好ましくは、核酸分子に連結されているアダプターの末端は、核酸分子の末端と適合する末端を有する。例えば、核酸分子がAオーバーハングを有する末端を含む場合、アダプターは、好ましくは、Tオーバーハングを有する末端を含む。同様に、核酸分子が、酵素消化によって得られ、1、2、3、4、5つ又はそれ以上のヌクレオチドのオーバーハングが後とに残る場合、アダプターは、好ましくは、核酸分子のオーバーハングに相補的な、それぞれ1、2、3、4、5つ又はそれ以上のヌクレオチドのオーバーハングを含む。
アダプターの他方の末端は、好ましくは、核酸分子又はアダプターに連結され得ない。アダプター末端の連結を遮断する任意の手段が、本発明の方法での使用に適切である。非限定的な例として、アダプターの他方の末端は一本鎖であってもよく、又は非適合性のオーバーハングを含む。
本発明のアダプターは、プロテロメラーゼ認識配列、好ましくは、TeINプロテロメラーゼ認識配列を含む。プロテロメラーゼ認識配列は、DNAテンプレートにおけるその存在が、プロテロメラーゼの酵素活性による閉端された直鎖状のDNAへの変換を可能にする任意のDNA配列である。言い換えれば、プロテロメラーゼ認識配列は、共有結合で閉端された直鎖状のDNAを形成するためのプロテロメラーゼによる二本鎖DNAの切断及び再連結に必要である。典型的には、プロテロメラーゼ認識配列は、完全回文配列、つまり2重の回転対称性を有する二本鎖DNA配列を含む。
完全逆方向リピートの長さは、特定の生物に応じて異なる。ボレリア・ブルグドルフェリ(Borrelia burgdorferi)では、完全逆方向リピートは14塩基対長である。様々な中温性バクテリオファージでは、完全逆方向リピートは、22塩基対長又はそれよりも長い。また、いくつかの場合では、例えば、大腸菌(E.coli)N15の場合では、中央完全逆方向回文配列は逆方向リピート配列に隣接し、つまりより大きな不完全逆方向回文配列の一部を形成する。
本発明で使用されるプロテロメラーゼ認識配列は、好ましくは、少なくとも14塩基対長の二本鎖回文(完全逆方向リピート)配列を含む。好ましい完全逆方向リピート配列としては、配列番号1~9の配列及びそれらのバリアントが挙げられる。配列番号1(NCATNNTANNCGNNTANNATGN)は、22塩基コンセンサス配列である。例えば、国際公開第2010/086626号に開示の通り、完全逆方向リピートの塩基対は特定の位置が保存されているが、配列は他の位置では柔軟性である可能性がある。したがって、好ましくは、配列番号1は、本発明の方法においてプロテロメラーゼと共に使用するための完全逆方向リピート配列の最小コンセンサス配列である。プロテロメラーゼ認識配列は、参照により本明細書に組み込まれる国際公開第2010/086626号に記載の配列を有し得る。
好ましくは、プロテロメラーゼ認識配列は、配列番号10と少なくとも80%、85%、90%、95%、96%、97%、98%、99%、又は100%配列同一性を有する。配列番号10の配列は、
5’-TATCAGCACACAATTGCCCATTATACGCGCGTATAATGGACTATTGTGTGCTGATA-3’
である。
5’-TATCAGCACACAATTGCCCATTATACGCGCGTATAATGGACTATTGTGTGCTGATA-3’
である。
好ましくは、プロテロメラーゼは、アダプター配列を、認識配列の28~29位にて切断し、切断された末端を閉端する。
アダプターは、プロテロメラーゼ認識配列からなっていてもよい。或いは、アダプターは、追加のヌクレオチドを含み得る。アダプターは、識別子配列又は「バーコード」又は「タグ」を含み得る。識別子は、好ましくは、サンプル識別子及びUMIのうちの少なくとも1つである。好ましくは、認識配列は、切断され切断された末端が閉端された後も、核酸分子の一部のままである。
UMIは、アダプター内の別々の配列であってもよく、又はプロテロメラーゼ認識配列が縮重ヌクレオチドを含む場合は、こうした縮重ヌクレオチドを使用して、識別子を導入してもよい。例えば、1つのサンプルのプロテロメラーゼ認識配列における縮重ヌクレオチドの場合では、アダプターをこの認識配列内の1つ又は複数の特定のヌクレオチドと共に使用することができるが、第2の及びさらなるサンプルでは、この位置には他の特定のヌクレオチドが使用され、それによりプロテロメラーゼ認識配列内に識別子配列が作出される。アダプターは、サンプル識別子及びUMIを含み得る。
サンプル識別子は、核酸分子の配列を特定のサンプルに関連付けることができる。例えば、本発明の方法で使用されるアダプターは、特定のサンプルに特異的な識別子配列を含み得る。各追加サンプルを、前記追加サンプルに特異的な識別子配列を有するアダプターを使用して処理することができる。その後、処理したサンプルをプールすることができ、サンプル識別子配列を使用して、得られた配列を特定のサンプルに割り当てることができる。
UMIは、核酸分子に特異的な、つまり本発明の方法に使用される各核酸分子に対して固有である、実質的に固有な、好ましくは完全に固有な配列又はバーコードである。UMIは、ランダムな、疑似ランダムな、又は部分的にランダムな、又は非ランダムなヌクレオチド配列を有し得る。UMIを使用して、配列決定読み取りが由来する起源分子を一意的に特定することができる。例えば、増幅された核酸分子の読み取りは、各起源核酸分子の単一のコンセンサス配列に集束し得る。上記で示したように、UMIは、完全に又は実質的に固有であり得る。完全に固有であるとは、本発明の方法で用意されるすべてのアダプター連結核酸分子が、本発明の方法で使用されるさらなるアダプター連結核酸分子に含まれるすべての他のタグとは異なる固有のタグを含むことであると本明細書では理解されるべきである。実質的に固有であるとは、本発明の方法で用意される各アダプター連結核酸分子はランダムUMIを含むが、こうしたアダプター連結核酸分子のうち同じUMIを含み得るパーセンテージが低いことであると本明細書では理解されるべきである。好ましくは、同じ配列を含むまったく同じ分子を同じUMIでタグ付けする可能性が無視できる場合、実質的に固有の分子識別子が使用される。好ましくは、UMIは、核酸分子の特定の配列に関して完全に固有である。UMIは、好ましくは、この固有性を保証するのに十分な長さを有する。いくつかの実装形態では、固有性がより低い分子識別子(つまり、上記に示した実質的に固有の識別子)を、他の識別技術と一緒に使用して、配列決定プロセス中に各核酸分子が一意的に特定されることを保証することができる。
識別子配列は、長さが約2~100ヌクレオチド塩基又はそれ以上の範囲であってもよく、好ましくは、約4~16ヌクレオチド塩基の長さを有する。識別子配列は、連続配列であってもよく、又はいくつかのサブユニットに分割されていてもよい。こうしたサブユニットの各々。こうしたサブユニットは、単一のアダプターに存在してもよく、又は別々のアダプターに存在してもよい。例えば、核酸分子が2つのアダプターにより隣接されている場合、こうした2つのアダプターの各々は、識別子配列のサブユニットを含み得る。コンセンサス配列を得るために、本発明の方法で得られた配列読み取りを、2つのサブユニットの各々の情報に基づいてグループ化することができる。
好ましくは、識別子配列は、2つ又はそれよりも多くの連続した同一の塩基を含まない。さらに、好ましくは、識別子配列間には、少なくとも2つ、好ましくは少なくとも3つの塩基に違いが存在する。
本発明で使用するためのアダプターを設計及び構築するための手段は、当業者に周知であり、本発明は、いかなる特定のアダプター設計及び/又は構築にも限定されない。非限定的な例として、2つのオリゴヌクレオチドを構築し、制御された条件下で互いにアニーリングさせて、本発明で使用するための少なくとも部分的に二本鎖のアダプターを得ることができる。さらなる非限定的な例として、長いオリゴヌクレオチド及び短いオリゴヌクレオチドを構築することができ、短いオリゴヌクレオチドは、長いオリゴヌクレオチドの末端にアニーリングすることができる。好ましくは、短いオリゴヌクレオチドの少なくとも60%、65%、70%、75%、80%、85%、90%、95%、又は100%のヌクレオチドは、長いオリゴヌクレオチドにアニーリングすることができる。好ましくは、短いオリゴヌクレオチドは、長いオリゴヌクレオチドのセクションに対して100%相補的である。好ましくは、この相補的セクションは、プロテロメラーゼ認識配列の3’に、例えば、認識配列の3’から1、2、3、4、5、6、7、8、9、10ヌクレオチド又はそれ以上に位置する。相補的セクションは、プロテロメラーゼ認識配列と長いオリゴヌクレオチドの3’末端との間に位置し得る。相補的セクションは、長いオリゴヌクレオチドの3’末端に位置し得る。或いは、相補的セクションは、長いオリゴヌクレオチドの3’末端の上流に、例えば、長いオリゴヌクレオチドの3’末端の上流の少なくとも1、2、3、4、5、6、7、8、9、10、15ヌクレオチド又はそれ以上に位置し得る。短いオリゴヌクレオチド及び長いオリゴヌクレオチドをアニーリングさせた後、相補セクションの5’に位置する長いオリゴヌクレオチドの部分を補充し、したがって二本鎖アダプターを産生させることができ、この二本鎖アダプターは、3’オーバーハングを有してもよく、その場合この3’オーバーハングは、長いオリゴヌクレオチドの3’末端である。一本鎖配列を補充すること、つまり二本鎖配列を生成することは、限定するものではないが、クレノフ(Klenov)ポリメラーゼ又はBST-ポリメラーゼなどの、任意の従来のポリメラーゼを使用して行うことができる。好ましいポリメラーゼは、BST-ポリメラーゼである。
任意選択で、本発明のアダプターは、プロテロメラーゼ認識配列と核酸分子に対する連結のためのアダプター部分との間に制限酵素認識部位をさらに含む。
さらなる態様では、本発明は、核酸分子ライブラリーを調製するための方法に関する。好ましくは、この方法は、以下のステップ:
a)少なくとも第1及び第2の核酸分子を含むサンプルを用意するステップであって、第1の核酸分子が、第2の核酸分子に存在しない第1の標的配列を含む、ステップ;
b)本明細書で定義した、つまりプロテロメラーゼ認識配列を含むアダプターを、第1の核酸分子の末端に連結して、アダプター連結核酸分子を用意するステップ;
c)アダプター連結核酸分子をプロテロメラーゼと接触させて切断し、切断された末端を共有結合で閉端して、閉端末端を含む第1の核酸分子をもたらすステップ;並びに
d)閉端末端を含む第1の核酸分子を切断して、1つの開端末端及び1つの閉端末端を含む第1の核酸を用意するステップ
のうちの1つ又は複数を含む。
さらなる態様では、本発明は、核酸分子ライブラリーを調製するための方法に関する。好ましくは、この方法は、以下のステップ:
a)少なくとも第1及び第2の核酸分子を含むサンプルを用意するステップであって、第1の核酸分子が、第2の核酸分子に存在しない第1の標的配列を含む、ステップ;
b)本明細書で定義した、つまりプロテロメラーゼ認識配列を含むアダプターを、第1の核酸分子の末端に連結して、アダプター連結核酸分子を用意するステップ;
c)アダプター連結核酸分子をプロテロメラーゼと接触させて切断し、切断された末端を共有結合で閉端して、閉端末端を含む第1の核酸分子をもたらすステップ;並びに
d)閉端末端を含む第1の核酸分子を切断して、1つの開端末端及び1つの閉端末端を含む第1の核酸を用意するステップ
のうちの1つ又は複数を含む。
任意選択で、第2の核酸分子又はそのアンプリコンの末端には、プロテロメラーゼ認識配列を含むアダプターを連結させない。そのような実施形態内では、第2の核酸分子は、例えば、ステップcとdとの間のエキソヌクレアーゼ処理によって排除される。特定の核酸分子に対する選択的アダプター連結は、ステップbの選択的アダプター連結に適切な特定の末端を第1の核酸分子に作出することによって達成でき、こうした特定の末端は、第2の核酸分子の末端には作出されない。例えば、特定の付着末端は、限定するものではないが、第1の標的配列の上流にある配列を標的とする第1のcrRNA及び第1の標的配列の下流にある配列を標的とする第2のcrRNAを組み合わせた、Cpf1などのV型CRISPRエンドヌクレアーゼなど、そのような付着末端を作出することが可能な特定のエンドヌクレアーゼによって作出することができる。そのような実施形態内では、ステップbで使用されるアダプターは、第1の核酸分子に対する連結のために、このようにして作出された付着末端に対する連結に適合するオーバーハングを、アダプター側に含むべきである。この実施形態内では、閉端された第1の核酸分子は、ステップdにおいて、アダプター内の特定の配列での切断によって開端することができる。例えば、連結側とプロテロメラーゼ認識配列との間に、特定の制限酵素認識部位を含むアダプターを使用する場合。或いは、閉端された第1の核酸分子は、ステップdにおいて、第1の標的配列などの、第1の核酸分子内の配列での切断によって開端することができる。
或いは、本発明の方法のステップbにおいて、アダプターは、第1及び第2の核酸分子の両方に連結される。そのような実施形態内では、ステップcで得られた閉端された第2の核酸分子は、ステップdの前に、閉端された第1の核酸分子を含む反応混合物から特異的に排除され得る。これは、閉端された第2の核酸分子を、閉端された第1の核酸分子に存在しない特定の配列、つまり第2の標的配列にて切断することによって達成され得る。そのような実施形態内では、本明細書で定義した方法の第2の核酸分子は、第1の核酸分子に存在しない第2の標的配列を含む。その後の開端された第2の核酸分子は、エキソヌクレアーゼ処理によって排除され得る。第2の核酸分子はこの段階では存在しないため、閉端された第1の核酸は、特異的な又は非特異的な方法で、例えば、本明細書の上記に示したアダプター内の配列にて又は第1の核酸分子に存在する配列にて切断することによって開端することができる。閉端された第2の核酸分子がステップdの前に排除されない方法の場合、この閉端された第2の核酸分子は、ステップdにおいて、閉端された第1の核酸分子を含む反応混合物中に依然として存在する。そのような設計では、好ましくは、第2の核酸分子に存在しない第1の標的配列にて切断することによって第1の核酸を選択的に開端する。そのような方法は、好ましくは、以下のステップ:
a)少なくとも第1及び第2の核酸分子を含むサンプルを用意するステップであって、第1の核酸分子が第2の核酸分子に存在しない第1の標的配列を含み、任意選択で第2の核酸分子が第2の標的配列を含む、ステップと;
b)本明細書で定義した、つまりプロテロメラーゼ認識配列を含むアダプターを、第1及び第2の核酸分子の末端に連結して、アダプター連結核酸分子を用意するステップと;
c)アダプター連結核酸分子をプロテロメラーゼと接触させて切断し、切断された末端を共有結合で閉端して、閉端末端を含む第1及び第2の核酸分子をもたらすステップと;
d)閉端末端を含む第1の核酸分子を第1の標的配列にて切断して、1つの開端末端及び1つの閉端末端を含む第1の核酸を用意するステップと
を含む。
a)少なくとも第1及び第2の核酸分子を含むサンプルを用意するステップであって、第1の核酸分子が第2の核酸分子に存在しない第1の標的配列を含み、任意選択で第2の核酸分子が第2の標的配列を含む、ステップと;
b)本明細書で定義した、つまりプロテロメラーゼ認識配列を含むアダプターを、第1及び第2の核酸分子の末端に連結して、アダプター連結核酸分子を用意するステップと;
c)アダプター連結核酸分子をプロテロメラーゼと接触させて切断し、切断された末端を共有結合で閉端して、閉端末端を含む第1及び第2の核酸分子をもたらすステップと;
d)閉端末端を含む第1の核酸分子を第1の標的配列にて切断して、1つの開端末端及び1つの閉端末端を含む第1の核酸を用意するステップと
を含む。
好ましいプロテロメラーゼは、TeINプロテロメラーゼである。
有効数の成分が本発明の方法において使用されることを本明細書では理解されたい。本発明の方法によって調製される核酸分子ライブラリーは、好ましくは、限定するものではないが、クローニング、増幅、及び配列決定などの核酸分子のさらなる処理に適している。したがって、追加の態様では、本発明はまた、本明細書に記載のステップを使用して、核酸分子ライブラリーをクローニングするための方法、核酸分子ライブラリーを増幅するための方法、又は核酸分子ライブラリーを配列決定するための方法に関する。
好ましくは、調製された核酸分子ライブラリーは、目的の配列を含む核酸分子が濃縮されている。「濃縮された」は、(i)目的の配列を有していない核酸分子をさらなる処理ステップから選択的に除外することによって、又は(ii)目的の配列を有する核酸分子をさらなる処理ステップのために選択的に含めることによってのいずれかによって、目的の配列を有していない核酸分子を低減又は排除することを意味すると本明細書では理解される。選択的に除外された核酸分子は、例えば、エキソヌクレアーゼ処理によって分解され得る。選択的に含まれる核酸分子は、例えば、クローニング、増幅、及び/又は配列決定され得る。
調製された核酸ライブラリーは、好ましくは、1つの閉端末端及び1つの開端末端を有する核酸分子を含む。
一実施形態では、本明細書で定義した方法は、少なくとも第1及び第2の核酸分子を含むサンプルを用意するステップa)を含む。好ましくは、第1の核酸分子は、第2の核酸分子に存在しない第1の標的配列を含む。好ましくは、第2の核酸分子は、第2の標的配列を含む。任意選択で、第2の標的配列は、第1の核酸分子にも存在する。或いは、第2の標的配列は、第1の核酸分子には存在しない。
好ましくは、第1の核酸分子は、目的の配列を含み、第2の核酸分子は、前記目的の配列を含まない。この実施形態では、第1の核酸分子が、調製された核酸分子ライブラリーに存在することになり、好ましくはさらに処理されることになる。
代替的な実施形態では、第1の核酸分子は、目的の配列を含まないが、第2の核酸分子は、前記目的の配列を含む。この実施形態では、第2の核酸分子が、調製された核酸分子ライブラリーに存在することになり、好ましくはさらに処理されることになる。
少なくとも第1及び第2の核酸分子を含むサンプルは、任意の供給源、例えば、ヒト、動物、植物、微生物由来のものであってよく、細胞に対して内因性又は外因性のあらゆるもの、例えば、ゲノムDNA、染色体DNA、人工染色体、プラスミドDNA、若しくはエピソームDNA、cDNA、RNA、ミトコンドリアであってもよく、又はBAC若しくはYACなどの人工ライブラリーであってもよい。DNAは、核DNA又はオルガネラDNAであり得る。好ましくは、DNAは染色体DNAであり、好ましくは細胞に内因性である。好ましくは、本発明の方法の出発物質として使用されるサンプル中に存在する第1の、第2の、及び任意選択でさらなる核酸分子は、ゲノムDNA、染色体DNA、オルガネラDNA、ミトコンドリアDNA、人工染色体、プラスミドDNA、エピソームDNA、cDNAなどのDNA、及びRNAのうちのいずれか1つである。
第1及び第2の核酸分子は、例えば、細胞溶解及び任意選択でオルガネラの溶解によって用意される長い核酸分子であり得る。本発明の方法で使用される核酸分子は、少なくとも約50kb、100kb、150kb、200kb、300kb、400kb、500kb、600kb、700kb、800kb、900kb、又は少なくとも約1000kb(1Mb)のサイズを有し得る。本発明で使用するための第1及び/又は第2の核酸は、高分子量(HMW)核酸又は超高分子量(uHMW)核酸であり得る。uHMW核酸は、少なくとも1Mbの長さを有し得る。本発明の方法で使用される核酸分子は、少なくとも1.1Mb、1.3Mb、1.5Mb、1.7Mb、2Mb、2.5Mb、3Mb、4Mb、5Mb、6Mb、7Mb、8Mb、9Mb、又は少なくとも約10Mbのサイズを有し得る。
或いは、長い核酸分子をまず断片化して、第1及び第2の核酸分子をもたらしてもよい。したがって、一実施形態では、ステップa)の第1及び第2の核酸分子は、断片化によって用意される。断片化は、好ましくは、ゲノム核酸分子の断片化である。
当業者であれば、より長い核酸分子を断片化するための手段に精通しており、本発明は、より長い核酸分子を断片化するためのいかなる特定の手段にも限定されない。断片化された核酸は、好ましくは、断片化されたゲノムDNAである。DNA、特にゲノムDNAは、当技術分野で公知の任意の適切な方法を使用して断片化され得る。DNA断片化の方法としては、限定するものではないが、酵素消化及び機械的力が挙げられる。
機械的力を使用した核酸分子の断片化の非限定的な例としては、音響剪断、噴霧、超音波処理、ポイントシンク剪断(point-sink shearing)、針剪断、及びフレンチプレスセルの使用が挙げられる。
本明細書で定義した第1及び第2の核酸分子のうちの少なくとも1つを含む核酸分子を断片化するための酵素消化としては、限定するものではないが、エンドヌクレアーゼ制限が挙げられる。例えば、AFLP(登録商標)技術で使用されるものなどの酵素消化は、核酸サンプルの複雑性の低減をさらにもたらすことができる。当業者であれば、DNA断片化のためにどの酵素を選択すべきかを知っている。非限定的な例として、核酸サンプルの断片化には、少なくとも1つの高頻度切断剤及び少なくとも1つの低頻度切断剤を使用することができる。限定するものではないがMseIなどの高頻度切断剤は、好ましくは、約3~5bpの認識部位を有する。限定するものではないがEcoRIなどの低頻度切断剤は、好ましくは、>5bpの認識部位を有する。
特定の実施形態では、特にサンプルが、比較的大きなゲノムを含むか又は由来する場合、より短いサイズの制限断片のより大きなセットを得るために、低頻度又は高頻度切断剤である第3の酵素を使用することが好ましい場合がある。
本発明の方法は、いかなる特定の制限エンドヌクレアーゼにも限定されない。エンドヌクレアーゼは、EcoRI、Msel、PstlなどのII型エンドヌクレアーゼであり得る。特定の実施形態では、限定するものではないが、Acelll、AIwI、AIwXI、Alw26I、Bbvl、BbvII、Bbsl、Bed、Bce83I、Bcefl、Bcgl、Binl、Bsal、Bsgl、BsmAI、BsmFl、BspMI、EarI、EciI、Eco3ll、Eco57I、Esp3I、Faul、Fokl、Gsul、Hgal、HinGUII、Hphl、Ksp632I、MboII、Mmel、MnII、NgoVIII、PIeI、RIeAI、Sapl、SfaNI、TaqJI、及びZthll IIIなどのIIS型又はIII型エンドヌクレアーゼ、つまり認識配列が制限部位から遠位に位置するエンドヌクレアーゼを使用することができる。制限断片は、使用するエンドヌクレアーゼに応じて、平滑末端であってもよく、又は突出末端を有してもよい。
好ましい実施形態では、高頻度切断剤及び低頻度切断剤のうち少なくとも1つの認識部位は、目的の配列内又は近近傍にあり、例えば、高頻繁切断剤又は低頻度切断剤の認識部位は、目的の配列から約0~10000、10~5000、50~1000、又は約100~500塩基に位置する。
本明細書に開示の本方法は、AFLP(登録商標)技術において、例えば倍数体細胞にも使用され得る。AFLP(登録商標)技術は、例えば、参照により本明細書に組み込まれる国際公開第2007/114693号、国際公開第2006/137733号、及び国際公開第2007/073165号により詳細に記載されている。当技術分野に記載のAFLP(登録商標)技術は、本明細書に記載のプロテロメラーゼ認識配列を含むアダプターを、制限核酸サンプルに付着させることによって改変することができる。
さらに、又は或いは、プログラム可能なヌクレアーゼを使用して、好ましくはCRISPRヌクレアーゼ、ジンクフィンガーヌクレアーゼ、TALEN、及びメガヌクレアーゼのうちの少なくとも1つを使用して、核酸サンプルを消化してもよい。
任意選択で、第1及び/又は第2の核酸分子は、A尾部を含むように、好ましくは、プロテロメラーゼ認識配列を含み、さらにTオーバーハングを含む、部分的又は完全に二本鎖のアダプターに対する連結を容易にするように改変されていてもよい。したがって、断片化核酸にアダプターをアニーリングさせる前に、本発明の方法は、任意選択で、断片化核酸サンプルをA尾部化するステップを含んでいてもよい。A尾部化反応は、当技術分野で周知であり、当業者であれば、例えばクレノウ断片(エキソ-)を使用するなど、A尾部化反応を実施する方法を明快に理解している。
第1及び第2の核酸分子のうちの少なくとも1つを含む核酸サンプルは、複数のさらなる核酸分子を含み得る。したがって、いくつかの実施形態では、核酸サンプルは、第1の核酸分子のみ及び第2の核酸分子のみを含む。他の実施形態では、核酸サンプルは、複数の他の核酸分子に加えて、第1の核酸分子、第2の核酸分子を含む。好ましくは、前記さらなる核酸分子は、第1の標的配列を含まない。任意選択で、さらなる核酸分子は、第2の標的配列を含まない。この複数の他の核酸分子は、第1及び第2の核酸分子が由来する同じ生物、同じ組織、同じ細胞、同じオルガネラ、及び/又は同じ分子のうちの少なくとも1つに由来し得る。
第1の核酸分子を含む核酸サンプルはまた、複数の第1の核酸分子を含む核酸サンプルを含み得ることが本明細書では理解される。同様に、第2の核酸分子を含む核酸サンプルはまた、複数の第2の核酸分子を含む核酸サンプルを含み得ることが本明細書では理解される。好ましくは、第1の核酸分子は、第2の核酸分子が由来する同じ生物、同じ組織、同じ細胞、同じオルガネラ、及び/又は同じ分子に由来する。第1及び第2の核酸分子は、1つ又は複数のヌクレオチドを除いて、本質的に同じ配列を有し得る。非限定的な例として、第1及び第2の核酸分子は、対立遺伝子バリアントであり得る。或いは、第1及び第2の核酸分子は、非常に異なっていてもよく、例えば、40%、30%、20%、10%、又は5%未満の配列同一性を有し得る。本発明で使用される第1の核酸分子及び第2の核酸分子間の主な違いは、第1の核酸分子が、第2の核酸分子に存在しない標的配列を含むことである。
任意選択で、第2の核酸分子は、第2の標的配列を含み得る。この第2の標的配列は、第1の核酸分子に存在してもよく、又は存在しなくともよい。
一実施形態では、この方法は、b)アダプターを、第1及び第2の核酸分子の末端に連結して、アダプター連結核酸分子を用意するステップを含む。アダプターは、好ましくは、本明細書で定義したアダプター、つまりプロテロメラーゼ認識配列を含むアダプターである。アダプターは、好ましくは、第1の核酸分子の両末端及び第2の核酸分子の両末端に連結される。好ましくは、アダプターは、サンプル中に存在する核酸の少なくとも80%、85%、90%、95%、96%、97%、98%、99%、又は100%の両末端に連結される。好ましくは、連結ステップ後、サンプル中のすべての核酸分子は、両末端にアダプターを含む。別の言い方をすれば、好ましくは、サンプル中のすべての又は実質的にすべての核酸は、共有結合で連結されたアダプターによって両側が隣接されている。アダプターの連結は、当業者に公知の任意の従来方法を使用して実施することができ、本発明は、いかなる特定の連結方法又は連結酵素(リガーゼ)にも限定されない。好ましくは、連結を容易にするため、アダプターは、例えば、制限エンドヌクレアーゼの使用及びアダプターにある適合性付着末端により得られる核酸分子を使用することによって、核酸分子の末端と適合する末端を含む。
一実施形態では、断片化核酸分子を末端処理して平滑末端を作出し、続いて3’A付着オーバーハングを追加してもよい。末端処理ステップは、当技術分野で公知の任意の従来手段を使用して実施することができる。同様に、3’Aオーバーハングの付加は、当業者に公知の任意の従来方法を使用して達成することができる。その後、3’Aオーバーハングを含む核酸分子を、5’Tオーバーハングを含む適合性アダプターに連結することができる。
一実施形態では、断片化のステップ及びアダプター連結のステップは、例えば、タグメンテーションによって、単一のステップに組み合わせることができる。この実施形態では、ステップb)のアダプターは、好ましくは、Tn5トランスポザーゼを使用してタグメンテーションによって連結される。トランスポザーゼは、長いDNA分子を短い核酸分子へとランダムに切断し、アダプターは、切断地点のいずれ側にも連結され得る。タグメンテーション又は「トランスポザーゼ媒介性断片化及びタグ付け」は、例えば、Nextera(商標)のワークフローに例示されるように、当業者に周知のプロセスである。アダプターは、タグメンテーション反応での使用にアダプターを適合させる配列を含み得る。好ましくは、タグメンテーション反応に使用されるアダプターは、トランスポザーゼ配列をさらに含む。トランスポザーゼ配列は、好ましくは、タグメンテーション反応に使用されるトランスポザーゼと適合性である。タグメンテーション反応に続いて修復ステップを行って、すべての又は実質的にすべての生成された核酸分子が両側にアダプターを含むことを保証することができる。したがって、任意選択でタグメンテーションによって得られる、連結されたアダプターを含む核酸分子を修復して、あらゆる一本鎖切断を除去することができる。好ましくは、修復ステップは、ステップc)において分子をTeINプロテロメラーゼと接触させる前に行われる。そのような修復ステップは、当技術分野で公知の任意の従来手段を使用して実施することができる。
任意選択で、プロテロメラーゼ認識配列は、アダプターの代わりにプライマーにより核酸分子に付着する。好ましくは、前記プライマーは、
i)少なくとも第1及び/又は第2の核酸分子に存在するプライマー結合部位に、又は前記少なくとも第1及び/又は第2の核酸分子に連結されているアダプターの任意選択でユニバーサルなプライマー結合部位にアニーリングするための3’末端;並びに
ii)そのようなプライマーの5’尾部にあるプロテロメラーゼ認識部位
を含む。
i)少なくとも第1及び/又は第2の核酸分子に存在するプライマー結合部位に、又は前記少なくとも第1及び/又は第2の核酸分子に連結されているアダプターの任意選択でユニバーサルなプライマー結合部位にアニーリングするための3’末端;並びに
ii)そのようなプライマーの5’尾部にあるプロテロメラーゼ認識部位
を含む。
任意選択で、プライマー結合部位は、固有の配列、つまり第1及び/又は第2の核酸分子にのみ存在する配列である。こうしたプライマーのうちの1つ又は複数を使用して、第1及び/又は第2の核酸分子をテンプレートとして使用したPCRにより産生されたアンプリコンにプロテロメラーゼ配列を導入することができる。そのような実施形態内では、ステップb)において、本明細書で定義したアダプターを第1の核酸分子及び任意選択の第2の核酸分子の末端に連結してアダプター連結核酸分子を用意する代わりに、プロテロメラーゼ認識部位を含む少なくとも1つのプライマーを使用して第1の核酸分子及び任意選択の第2の核酸分子を増幅し、次いで、プロテロメラーゼ処理して閉端することができる得られたアンプリコンに対してその後のステップが実施される。或いは、プロテロメラーゼ配列は、変性、プライマーのアニーリング、一本鎖オーバーハングにおける塩基補充の単一のステップにより導入され得る。
したがって、(部分的)二本鎖アダプターによる連結の代わりに、プライマー又はタグメンテーションによりアダプターを付着させるこうした実施形態では、「連結する」又は「連結」という用語は、本明細書で使用される場合、「付着させる」又は「付着」という用語に置き換えることができる。
一実施形態では、本発明の方法は、アダプター連結核酸分子を、プロテロメラーゼと接触させて切断し、切断された末端を共有結合で閉端して、閉端末端を含む第1及び第2の核酸分子をもたらすステップc)を含む。好ましいプロテロメラーゼは、TeINプロテロメラーゼである。
好ましくは、第1の核酸分子は、分子の両末端(つまり、5’末端及び3’末端)にアダプターを含み、第2の核酸分子は、分子の両末端にアダプターを含み、前記アダプターは、プロテロメラーゼ認識配列を有する。アダプターを含む第1及び第2の分子を適切な条件下でプロテロメラーゼと接触させることにより、アダプターの切断又は「制限」がもたらされる。同時に、プロテロメラーゼは、核酸分子を共有結合で閉端して、閉端された第1の核酸及び閉端された第2の核酸をもたらすことができる。閉端された直鎖状のDNA分子は、典型的には、共有結合で閉端された末端を含み、末端ヌクレオチドの喪失又は損傷から保護がもたらされる。
本発明で使用するための好ましいプロテロメラーゼは、バクテリオファージプロテロメラーゼである。プロテロメラーゼは、ハロモナス・アクアマリナ(Halomonas aquamarina)に由来するphiHAP-1、エルシニア・エンテロコリチカ(Yersinia enterolytica)に由来するPY54、クレブシエラ・オキシトカ(Klebsiella oxytoca)に由来するphiKO2、ビブリオ種(Vibrio sp.)に由来するVP882、及び大腸菌(Escherichia coli)由来のN15、又はそれらのいずれかのバリアントからなる群から選択され得る。プロテロメラーゼは、参照により本明細書に組み込まれる国際公開第2010/086626号に記載のアミノ配列を有し得る。バクテリオファージN15(TeIN)プロテロメラーゼ又はそのバリアントの使用が特に好ましい。好ましいプロテロメラーゼは、配列番号11と少なくとも80%、85%、90%、95%、96%、97%、98%、99%、又は100%配列同一性の配列を有する。バリアントとしては、それらのホモログ又は変異体が挙げられる。変異体は、天然配列に対して短縮、置換、又は欠失を含む。バリアントは、好ましくは、上記に記載のプロテロメラーゼ認識配列を含むテンプレートから、閉端された直鎖状のDNAを産生する。
この方法は、任意選択で、ステップc)において閉端末端を含む核酸分子を得た後だが、ステップd)において閉端末端を含む第1の核酸分子を切断する前に、サンプルをエキソヌクレアーゼに曝露するステップc1)を含み得る。したがって、一実施形態では、本発明の方法は、
a)少なくとも第1及び第2の核酸分子を含むサンプルを用意するステップであって、第1の核酸分子が第2の核酸分子に存在しない第1の標的配列を含み、任意選択で第2の核酸分子が第2の標的配列を含む、ステップと;
b)本明細書で定義した、つまりプロテロメラーゼ認識配列を含むアダプターを、第1及び第2の核酸分子の末端に連結して、アダプター連結核酸分子を用意するステップと;
c)アダプター連結核酸分子をプロテロメラーゼと接触させて切断し、切断された末端を共有結合で閉端して、閉端末端を含む第1及び第2の核酸分子をもたらすステップと;
c1)閉端末端を含む第1及び第2の核酸分子を含むサンプルをエキソヌクレアーゼに曝露するステップと;
d)閉端末端を含む第1の核酸分子を第1の標的配列にて切断して、1つの開端末端及び1つの閉端末端を含む第1の核酸を用意するステップと
を含む。
a)少なくとも第1及び第2の核酸分子を含むサンプルを用意するステップであって、第1の核酸分子が第2の核酸分子に存在しない第1の標的配列を含み、任意選択で第2の核酸分子が第2の標的配列を含む、ステップと;
b)本明細書で定義した、つまりプロテロメラーゼ認識配列を含むアダプターを、第1及び第2の核酸分子の末端に連結して、アダプター連結核酸分子を用意するステップと;
c)アダプター連結核酸分子をプロテロメラーゼと接触させて切断し、切断された末端を共有結合で閉端して、閉端末端を含む第1及び第2の核酸分子をもたらすステップと;
c1)閉端末端を含む第1及び第2の核酸分子を含むサンプルをエキソヌクレアーゼに曝露するステップと;
d)閉端末端を含む第1の核酸分子を第1の標的配列にて切断して、1つの開端末端及び1つの閉端末端を含む第1の核酸を用意するステップと
を含む。
エキソヌクレアーゼは、2つの閉端末端を含まない、つまり1つ又は2つの開端末端を含む任意の核酸分子を消化し得る。そのような核酸分子は、例えば、限定するものではないが、アダプターを有してない核酸分子、開端末端を有する1つ若しくは2つのアダプターを有する核酸分子、並びに/又は1つの開端末端及び1つの閉端末端を有する切断された核酸分子である。
2つの閉端末端を有する核酸分子は分解から保護されるが、非保護断片は分解され、目的の配列を含む核酸分子、つまり第1の核酸分子又は任意選択で第2の核酸分子の濃縮又は複雑性の低減がもたらされる。したがって、一実施形態では、本発明の方法は、核酸サンプルの望ましくない(非標的)部分を除去するアプローチをとる。非限定的な例として、ステップb)のアダプターを、例えば、酵素消化によって作出された、選択的付着オーバーハングを有する核酸分子に連結してもよい。その後、アダプターを含む分子は、ステップc)において閉端され、ステップc1)におけるエキソヌクレアーゼ処理は、2つの閉端末端を有しない任意の核酸分子を消化することができる。したがって、ステップc1)におけるエキソヌクレアーゼ処理は、閉端末端を含む核酸分子の濃縮をもたらすことができる。
エキソヌクレアーゼは、エキソヌクレアーゼI、III、V、VII、VIII、若しくは関連する酵素、又はそれらの任意の組合せであり得る。エキソヌクレアーゼIIIは、ニックを認識し、ssDNAのピースが形成されるまでニックをギャップまで伸長する。エキソヌクレアーゼVIIは、このssDNAを分解することができる。エキソヌクレアーゼIもまた、ssDNAを分解する。ExoIII及びExoVIIは、本発明の方法のステップc)において使用するためのエキソヌクレアーゼの好ましい組合せである。
エキソヌクレアーゼVは、ssDNAとdsDNAを3’から5’と5’から3’の両方の方向に分解することが可能である。したがって、好ましい実施形態では、本発明の方法のステップc)におけるエキソヌクレアーゼは、3’から5’及び5’から3’の両方向でssDNA及びdsDNAを分解することが可能なエキソヌクレアーゼ、好ましくはエキソヌクレアーゼVである。
非標的配列を分解するための方法に関するさらなる情報は、すべての目的のためにその全体が参照により本明細書に組み込まれる、米国特許出願公開第2014/0134610号で提供されている。
ステップc1)は、好ましくは、エキソヌクレアーゼが実質的にすべての非保護断片を分解するのに十分な条件(例えば、時間、温度、酵素濃度)で実施される。好ましくは、ステップc1)は、エキソヌクレアーゼがすべての非保護断片を分解するのに十分な条件及び時間で実施される。ステップc1)は、好ましくは、約1分~約12時間、好ましくは30分間にわたって、約10~90℃、好ましくは約37℃で実施される。
ステップc1)の後、エキソヌクレアーゼは、例えば、限定するものではないが、プロテイナーゼ、例えばプロテイナーゼK処理、又は熱不活性化のうちの少なくとも1つによって不活性化してもよい。そのような技術は当技術分野においては標準的であり、当業者は、エキソヌクレアーゼを不活性化する方法を明快に理解している。好ましい不活性化ステップは、サンプルを約50~90℃、好ましくは約75℃の温度で、約1~120分間、好ましくは約10分間、加熱することである。
一実施形態では、本発明の方法は、閉端末端を含む第1の核酸分子を第1の標的配列にて切断して、1つの開端末端及び1つの閉端末端を含む第1の核酸を用意するステップd)を含む。「切断」は、二本鎖切断を生成することであると本明細書では理解される。二本鎖切断は、ヌクレアーゼを使用することによって、又は反対側の鎖を切断する2つのニッカーゼを使用することによって作出され得る。二本鎖切断は、第1の核酸分子及び任意選択で第2の核酸分子の平滑開端末端を作出し得る。したがって、切断後、切断された核酸分子は、1つの開端平滑末端及び1つの閉端末端を有し得る。或いは、二本鎖切断は、切断された核酸分子の付着開端末端を作出し得る。したがって、切断後、切断された核酸分子は、1つの開端付着末端及び1つの閉端末端を有し得る。
好ましくは、ステップd)の第1の核酸分子は、プログラム可能なヌクレアーゼ又は制限エンドヌクレアーゼによって切断される。したがって、第1の核酸分子は、第2の核酸分子に存在しない標的配列を含む。第1の核酸分子は、標的配列を1つよりも多く含み得、例えば、第1の核酸分子は、標的配列を1、2、3、4、5、6つ又はそれ以上含み得る。一実施形態では、第2の核酸分子は、第1の核酸分子に存在しない標的配列を含み得る。第2の核酸分子は、標的配列を1つよりも多く含み得、例えば、第2の核酸分子は、標的配列を1、2、3、4、5、6つ又はそれ以上含み得る。
当業者であれば、このステップは、追加の核酸分子、例えば、少なくとも第3の、第4の、又は第5の、又はさらなる核酸分子に拡張し得ることを容易に理解する。各核酸分子は、任意選択で、他の核酸分子のいずれにも存在しない標的配列を含み得る。
したがって、核酸サンプルは、目的の配列を含む少なくとも1つの核酸分子、つまり本明細書で定義した第1の核酸分子又は任意選択で本明細書で定義した第2の核酸分子を含むと本明細書では理解される。したがって、別の表現をすると、核酸サンプルは、少なくとも約50、100、150、200、250、300、350、400、450、500、750、1000個又はそれ以上の目的の配列など、1、2、3、4、5、6、7、8、9、10又はそれ以上の目的の配列を含み得、好ましくは、サンプル内の各々の目的の配列は異なる標的配列を有する。本発明の方法は、核酸サンプルからのこうした目的の配列の同時濃縮を提供することができる。したがって、任意選択で、本発明の方法のステップd)において、核酸サンプルから核酸分子を濃縮するために複数のgRNA-CAS複合体が添加される。好ましくは、こうした複数のgRNA-CAS複合体は、同じCRISPR-ヌクレアーゼを含み得るが、それらのgRNAが異なっていてもよい。例えば、目的の配列を含む各核酸分子には、異なるgRNA分子を使用することができる。本発明の方法では、例えば、少なくとも約50、100、150、200、250、300、350、400、450、500、750、1000個又はそれ以上の核酸分子、好ましくは少なくとも約50、100、150、200、250、300、350、400、450、500、750、1000個又はそれ以上のgRNA分子を使用することができる。
閉端末端を含む第1の核酸分子及び任意選択で第2の核酸分子は、制限エンドヌクレアーゼによって切断され得る。第1及び第2の核酸分子が切断される実施形態では、第1及び第2の核酸分子は、異なるエンドヌクレアーゼによって切断される。任意の配列特異的エンドヌクレアーゼが、本発明での使用に適切であり得る。エンドヌクレアーゼは、いわゆる「制限エンドヌクレアーゼ」又は「制限酵素」、例えば、I型、II型、III型、IV型、又はV型制限エンドヌクレアーゼであり得る。好ましい制限エンドヌクレアーゼは、II型制限エンドヌクレアーゼ、好ましくはIIP型又はIIS型である。ステップa)における断片化が、DNAを制限酵素で切断することによって実施される場合、ステップd)において使用される酵素は、好ましくは、異なるエンドヌクレアーゼである。
第1の核酸分子及び任意選択で第2の核酸分子は、プログラム可能なヌクレアーゼによって切断され得る。第1及び第2の核酸分子が切断される実施形態では、第1及び第2の核酸分子は、異なるプログラム可能なヌクレアーゼ、つまり異なる標的配列を認識するプログラム可能なヌクレアーゼによって切断される。プログラム可能なヌクレアーゼは、ジンクフィンガーヌクレアーゼ、メガヌクレアーゼ、TALエフェクターヌクレアーゼ、及びRNA誘導型CRISPRヌクレアーゼからなる群から選択され得る。好ましくは、プログラム可能なヌクレアーゼは、RNA誘導型CRISPR(クラスター化した規則的な配置の短い回文配列リピート)ヌクレアーゼである。
RNA誘導型CRISPR-ヌクレアーゼは、好ましくは、gRNA-Cas複合体の一部である。gRNA-CAS複合体は、ガイドRNAと複合体を形成したCRISPR関連(CAS)タンパク質又はCRISPR-ヌクレアーゼであると本明細書では理解されるべきである。CRISPR-ヌクレアーゼは、ヌクレアーゼドメインと、ガイドRNAと相互作用する少なくとも1つのドメインとを含む。ガイドRNAと複合体を形成する場合、CRISPR-ヌクレアーゼは、ガイドRNAによって標的配列に誘導される。ガイドRNAは、CRISPR-ヌクレアーゼと、並びに標的配列と相互作用することにより、ガイド配列を介して特定の標的配列を含む部位に方向づけられると、CRISPR-ヌクレアーゼは標的配列に切断を導入することができる。好ましくは、CRISPR-ヌクレアーゼは、ヌクレアーゼの一方のドメイン又は両方のドメインがそれぞれ触媒的に活性である場合、標的配列に一本鎖切断又は二本鎖切断を導入することができる。当業者であれば、CRISPR-ヌクレアーゼと組み合わせると、第1の核酸分子及び/又は任意選択で第2の核酸分子の所定の標的部位における一本鎖切断又は二本鎖切断の導入が達成されるようにガイドRNAを設計する方法について十分に承知している。
CRISPR-ヌクレアーゼは、一般的に6つの主要な型(I型~VI型)に分類することができ、これらはコア要素の内容及び配列に基づき、さらに亜型に分類される(Makarovaら,2011,Nat Rev Microbiol 9:467~77、及びWrightら,2016,Cell 164(1-2):29~44)。一般に、CRISPR-CASシステム複合体の2つの重要な要素は、CRISPR-ヌクレアーゼ及びcrRNAである。CrRNAは、インベーダーDNAに由来するスペーサー配列が点在している短い反復配列からなる。CASタンパク質は、様々な活性、例えばヌクレアーゼ活性を有する。したがって、gRNA-CAS複合体は、特定の配列を標的とするメカニズム、並びにその配列に対するある特定の酵素活性を提供する。
I型CRISPR-CASシステムは、典型的には、ヘリカーゼ活性とDNase活性を別々に有するCas3タンパク質を含む。例えば、1-E型システムでは、crRNAは、Cascadeと呼ばれるマルチサブユニットエフェクター複合体(抗ウイルス防御のCRISPR関連複合体)に組み込まれ(Brounsら,2008,Science 321:960~4)、これが二重鎖DNAに特異的に結合し、Cas3タンパク質による分解を誘発する(Sinkunasら,2011,EMSO J 30:1335~1342;Beloglazovaら,2011,EMBO J 30:616~627)。
II型CRISPR-CASシステムは、二重鎖DNAを特異的に切断することが可能な、単一タンパク質(約160KDa)であるシグネチャーCas9タンパク質を含む。Cas9タンパク質は、典型的には2つのヌクレアーゼドメインを含んでおり、アミノ末端近くのRuvC様ヌクレアーゼドメインと、タンパク質の中央付近のHNH(又はMcrA様)ヌクレアーゼドメインである。Cas9タンパク質のそれぞれのヌクレアーゼドメインは、二重らせんの一本鎖を切断することに特化されている(Jinekら,2012,Science 337(6096):816~821)。Cas9タンパク質は、II型CRISPR/-CASシステムのCASタンパク質の一例であり、crRNA及びトランス活性化crRNA(tracrRNA)と呼ばれる第2のRNAと組み合わせた場合、エンドヌクレアーゼを形成し、これが侵入してきた病原体DNAを標的化し、crRNAによって定められた病原体ゲノム上の位置にDNA二本鎖切断(DSB)を導入することにより分解する。Jinekら(2012,Science 337:816~820)は、crRNAとtracrRNAの必須部分を融合することによって生成される一本鎖キメラガイドRNA(sgRNA)が、Cas9タンパク質と組み合わせて機能的なエンドヌクレアーゼを形成することができることを示した。
III型CRISPR-CASシステムは、ポリメラーゼ及びRAMPモジュールを含む。III型システムは、亜型のIII-AとIII-Bにさらに分けることができる。III-A型CRISPR-CASシステムは、プラスミドを標的とすることが明らかになっており、III-A型システムのポリメラーゼ様タンパク質は、DNAの特異的切断に関与している(Marraffini及びSontheimer,2008,Science 322:1843~1845)。III-B型CRISPR-CASシステムはまた、RNAを標的とすることが明らかになっている(Haleら,2009,Cell 139:945~956)。
IV型CRISPR-CASシステムは、カスケード様複合体の一部を形成することが示されている特性決定されていないタンパク質であるCsf1が含まれるが、これらのシステムは、多くの場合、関連するCRISPRアレイを有していない単離されたcas遺伝子として確認されている。
V型CRISPR-CASシステムである、Prevotella由来のクラスター化した規則的な配置の短い回文配列リピート(Clustered Regularly Interspaced Short Palindromic Repeats)及びFrancisella 1又はCRISPR/Cpf1が最近報告されている。Cpf1遺伝子はCRISPR遺伝子座と関係しており、crRNAを使用してDNAを標的とするエンドヌクレアーゼをコードしている。Cpf1はCas9よりも小さく単純なエンドヌクレアーゼであり、CRISPR-Cas9システムの制限のいくつかを克服し得る。Cpf1は、tracrRNAを欠失している単一RNA-誘導型エンドヌクレアーゼであり、Tリッチプロトスペーサー隣接モチーフを利用する。Cpf1は、互い違いのDNA二本鎖切断を介してDNAを切断する(Zetscheら(2015) Cell 163(3):759~771)。V型CRISPR-CASシステムは、好ましくは、Cpf1、C2c1及びC2c3のうちの少なくとも1つを含む。
VI型CRISPR-CASシステムは、RNaseA活性を含むCas13aタンパク質を含み得る。標的核酸断片がRNAである場合、本発明の方法の少なくとも第1及び第2のgRNA-CAS複合体は、Cas13a、例えば限定するものではないが、例えばGootenbergら,Science.2017 Apr 28;356(6336):438~442に記載されているような、レプトトリキア・ワディ(Leptotreichia wadee)由来のCas13a(LwCas13a)又はレプトトリキア・シャーイイ(Leptotrichia shahii)由来のCas13a(LshCas13a)を含み得る。
本発明の方法のgRNA-CAS複合体は、本明細書で上記に定義した任意のCRISPR-ヌクレアーゼを含み得る。好ましくは、本発明の方法で使用されるgRNA-CAS複合体は、II型CRISPR-ヌクレアーゼ、例えばCas9(例えば、配列番号13によってコードされる配列番号12のタンパク質、若しくは配列番号14のタンパク質)、又はV型CRISPR-ヌクレアーゼ、例えばCpf1(例えば、配列番号16によってコードされる配列番号15のタンパク質)、又はMad7(例えば、配列番号17若しくは18のタンパク質)、又はそれらに由来するタンパク質であって、好ましくは前記タンパク質に対してその全長にわたって少なくとも約70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、若しくは99%配列同一性を有するタンパク質を含む。
好ましくは、本発明の方法のgRNA-CAS複合体は、II型CRISPR-ヌクレアーゼ、好ましくはCas9ヌクレアーゼを含む。
当業者は、CRISPR-ヌクレアーゼを含むCRISPR-CASシステムの様々な成分を調製する方法を知っている。従来技術において、その設計及び使用に関する多数の報告を利用することができる。例えば、ガイドRNAの設計及びCASタンパク質(ストレプトコッカス・ピオゲネス(S.pyogenes)から最初に得られた)との併用に関するHaeusslerらによる概説(J Genet Genomics.(2016)43(5):239~50.doi:10.1016/j.jgg.2016.04.008.)又はLeeら(Plant Biotechnology Journal(2016)14(2)448~462)による概説を参照されたい。
一般に、CRISPRヌクレアーゼ、例えばCas9は、2つの触媒的に活性なヌクレアーゼドメインを含む。例えば、Cas9タンパク質は、RuvC様ヌクレアーゼドメイン及びHNH様ヌクレアーゼドメインを含み得る。RuvCドメイン及びHNHドメインは一緒に機能し、両方とも一本鎖を切断し、DNAに二本鎖切断を行う(Jinekら,Science,337:816~821)。デッド型CRISPR-ヌクレアーゼは、いずれのヌクレアーゼドメインも切断活性を示さないような修飾を含む。本発明の方法で使用されるgRNA-CAS複合体のCRISPR-ヌクレアーゼは、ヌクレアーゼドメインの1つが変異したことにより、もはや機能せず(すなわち、ヌクレアーゼ活性がない)、それによりニッカーゼを生成する、CRISPR-ヌクレアーゼのバリアントであり得る。例は、D10A変異又はH840A変異のいずれかを有するSpCas9バリアントである。好ましくは、gRNA-CAS複合体のヌクレアーゼは、デッド型ヌクレアーゼではない。好ましくは、gRNA-CAS複合体のCRISPR-ヌクレアーゼは、ニッカーゼ又は(エンド)ヌクレアーゼのいずれかである。
本発明の方法で使用し得るgRNA-CAS複合体は、Cas9タンパク質若しくはバリアント全体を含むか若しくはそれからなっていてもよく、又はそれらの断片を含んでいてもよい。好ましくは、そのような断片は、crRNA及びtracrRNA又はsgRNAに結合し、ヌクレアーゼ活性又はニッカーゼ活性のうちの少なくとも1つを維持する。
好ましくは、gRNA-CAS複合体は、Cas9タンパク質を含む。Cas9タンパク質は、細菌のストレプトコッカス・ピオゲネス(Streptococcus pyogenes)由来のもの(SpCas9; NCBI Reference Sequence NC_017053.1; UniProtKB-Q99ZW2)、ゲオバチルス・サーモデニトリフィカンス(Geobacillus thermodenitrificans)由来のもの(UniProtKB-A0A178TEJ9)、コリネバクテリウム・アルサラス(Corynebacterium ulcerous)由来のもの(NCBI Refs: NC_015683.1, NC_017317.1);コリネバクテリウム・ジフテリエ(Corynebacterium diphtheria)由来のもの(NCBI Refs: NC_016782.1, NC_016786.1);スピロプラズマ・シルフィディコーラ(Spiroplasma syrphidicola)由来のもの(NCBI Ref: NC_021284.1);プレボテラ・インターメディア(Prevotella intermedia)由来のもの(NCBI Ref: NC_017861.1);スピロプラズマ・タイワネンス(Spiroplasma taiwanense)由来のもの(NCBI Ref: NC_021846.1);ストレプトコッカス・イニエ(Streptococcus iniae)由来のもの(NCBI Ref: NC_021314.1);ベルリエラ・バルティカ(Belliella baltica)由来のもの(NCBI Ref: NC_018010.1);シクロフレキサス・トルキスル(Psychroflexus torquisl)由来のもの(NCBI Ref: NC_018721.1);ストレプトコッカス・サーモフィルス(Streptococcus thermophilus)由来のもの(NCBI Ref: YP_820832.1);リステリア・イノキュア(Listeria innocua)由来のもの(NCBI Ref: NP_472073.1);カンピロバクター・ジェジュニ(Campylobacter jejuni)由来のもの(NCBI Ref: YP_002344900.1);又はナイセリア・メニンギティディス(Neisseria meningitidis)由来のもの(NCBI Ref: YP_002342100.1)であり得る。SpCas9に相同な不活性化HNH又はRuvCドメインを有する、これらからのCas9バリアント例えばSpCas9_D10A若しくはSpCas9_H840A、又はSpCas9タンパク質のD10若しくはH840に対応する位置に同等の置換を有し、ニッカーゼを生じさせるCas9が包含される。
プログラム可能なヌクレアーゼは、Cpf1、例えばアシダミノコッカス属の種(Acidaminococcus sp);UniProtKB-U2UMQ6に由来し得る。バリアントは、RuvC又はNUCドメインがもはやヌクレアーゼ活性を有していない、不活性化RuvC又はNUCドメインを有するCpf1ニッカーゼであり得る。当業者は、当技術分野で利用可能な技術、例えば、部位特異的突然変異誘発、PCR媒介突然変異誘発、及び不活性化RuvC又はNUCドメインなどの不活性化ヌクレアーゼを可能にする全遺伝子合成などについて十分に知っている。不活性NUCドメインを有するCpf1ニッカーゼの例は、Cpf1R1226Aである(Gaoら Cell Research(2016)26:901~913、Yamanoら Cell(2016)165(4):949~962を参照されたい)。このバリアントにおいては、NUCドメインでアルギニンがアラニン(R1226A)へ変換されており、NUCドメインが不活性化される。
gRNA-CAS複合体は、プロトスペーサー配列としても注釈付けられる核酸分子中の標的配列又は「標的部位」へと複合体を方向づけるCRISPR-ヌクレアーゼ関連ガイドRNAをさらに含む。ガイドRNAは、好ましくは、核酸分子内の目的の配列の近くに、その配列に、又はその配列内にあり、sgRNA、又はcrRNAとtracrRNAの組合せ(例えば、Cas9の場合)、又はcrRNAのみ(例えば、Cpf1の場合)であってもよい、gRNA-CAS複合体をプロトスペーサー配列に標的化するためのガイド配列を含む。任意選択で、1つ以上のタイプのガイドRNAを同一の実験において使用することができ、例えば、2つ以上の異なる目的の核酸分子を対象とするか、又は同じ目的の核酸分子でさえも対象とすることできる。
任意選択の実施形態では、本発明の方法は、ミスマッチ部位のヘテロ二重鎖を認識及び切断する酵素を使用することによって、多型検出及び/又は遺伝的変異検出を行うためのものである。そのような実施形態内では、1つ又は複数のヌクレオチドサンプルを断片化し、その後、本発明の方法のステップb)の前又は後で少なくとも1ラウンドの変性及びアニーリングに供する。次いで、本発明の方法のステップc)の後、CEL Iなどの、ヘテロ二重鎖を認識及び切断する酵素で、又は参照により本明細書に組み込まれるLanghans MT及びPalladino MJ(Curr Istumes Mol Biol.2009;11(1):1~12)に記載の酵素で、閉端された核酸を処理することができる。これにより、ヘテロ二重鎖を含む二本鎖DNA分子のみの開端がもたらされ、次いでそれらをさらなる処理(例えば、配列決定アダプターをこうした開端末端に連結し、その後の配列決定を行うことによる)のために選択的に含めてもよく、又はさらなる処理(例えば、こうした断片をエキソヌクレアーゼ処理によって分解することによる)のために選択的に除外してもよい。
一実施形態では、この方法は、ステップd)において1つの開端末端及び1つの閉端末端を含む第1の核酸分子を得た後、サンプルをエキソヌクレアーゼに曝露するステップe)を含み得る。したがって、この実施形態では、第1の核酸は開端末端を含み、第2の核酸は2つの閉端末端を含む。したがって、第2の核酸分子は、エキソヌクレアーゼ分解から保護されることになるが、第1の核酸分子は保護されないだろう。したがって、エキソヌクレアーゼへの曝露は、第1の核酸の消化をもたらすが、第2の核酸の消化はもたらさない。この実施形態では、第2の核酸分子は、好ましくは、目的の配列を含む。
エキソヌクレアーゼは、任意選択で、ステップc1)において本明細書で定義した同じ又は同様の条件下での、ステップc1)において本明細書で定義したエキソヌクレアーゼであり得る。好ましくは、エキソヌクレアーゼ消化は、少なくとも1つの開端末端を含むすべての又は実質的にすべての核酸分子の消化をもたらす。したがって、この実施形態では、本発明の方法は、
a)少なくとも第1及び第2の核酸分子を含むサンプルを用意するステップであって、第1の核酸分子が第2の核酸分子に存在しない第1の標的配列を含み、任意選択で第2の核酸分子が第2の標的配列を含む、ステップと;
b)本明細書で定義した、つまりプロテロメラーゼ認識配列を含むアダプターを、第1及び第2の核酸分子の末端に連結して、アダプター連結核酸分子を用意するステップと;
c)アダプター連結核酸分子をプロテロメラーゼと接触させて切断し、切断された末端を共有結合で閉端して、閉端末端を含む第1及び第2の核酸分子をもたらすステップと;
d)閉端末端を含む第1の核酸分子を第1の標的配列にて切断して、1つの開端末端及び1つの閉端末端を含む第1の核酸を用意するステップと;
e)サンプルをエキソヌクレアーゼに曝露するステップと
を含み得る。
a)少なくとも第1及び第2の核酸分子を含むサンプルを用意するステップであって、第1の核酸分子が第2の核酸分子に存在しない第1の標的配列を含み、任意選択で第2の核酸分子が第2の標的配列を含む、ステップと;
b)本明細書で定義した、つまりプロテロメラーゼ認識配列を含むアダプターを、第1及び第2の核酸分子の末端に連結して、アダプター連結核酸分子を用意するステップと;
c)アダプター連結核酸分子をプロテロメラーゼと接触させて切断し、切断された末端を共有結合で閉端して、閉端末端を含む第1及び第2の核酸分子をもたらすステップと;
d)閉端末端を含む第1の核酸分子を第1の標的配列にて切断して、1つの開端末端及び1つの閉端末端を含む第1の核酸を用意するステップと;
e)サンプルをエキソヌクレアーゼに曝露するステップと
を含み得る。
任意選択で、この方法は、ステップc)とd)との間に、本明細書の上記に記載のステップc1)をさらに含み得る。
任意選択で、ステップe)は、制限エンドヌクレアーゼ及び/又はプログラム可能なヌクレアーゼを除去及び/又は不活性化するステップe1)、続いてサンプルをエキソヌクレアーゼに曝露するステップe2)を含み得る。
ステップe1)は、サンプルを適切な温度に加熱して、制限エンドヌクレアーゼ及び/又はプログラム可能なヌクレアーゼを除去及び/又は不活性化することを含み得る。非限定的な例として、温度は、少なくとも40℃、45℃、50℃、55℃、60℃、65℃、70℃、75℃、80℃又はそれ以上に上昇させてもよい。温度は、少なくとも約5’、10’、15’、20’、25’、30’、35’、40’、45’、50’、55’、60’(分間)又はそれ以上の期間、上昇させてもよい。
或いは、又はさらに、ステップe1)は、切断された第1の核酸分子を精製することを含み得る。切断された第1の核酸分子の精製は、AMPureビーズベース精製プロセス、並びに/又は限定するものではないがプロテイナーゼKによる消化などプロテイナーゼを用いた、制限エンドヌクレアーゼ及び/若しくはプログラム可能なヌクレアーゼの部分的若しくは完全な消化などの、任意の従来手段を使用して実施することができる。
その後、2つの閉端末端を含む第2の核酸分子を標的配列にて切断してもよい。したがって、本発明の方法は、閉端末端を含む第2の核酸分子を第2の標的配列にて切断して、1つの開端末端及び1つの閉端末端を含む第2の核酸をもたらすステップf)をさらに含み得る。第2の核酸分子の標的配列は、好ましくは、第1の核酸分子には存在しない。しかしながら、この実施形態内では、第2の核酸分子の切断が行われる時点では第1の核酸分子は既に除去されているため、任意選択で、第2の核酸分子の標的配列は、第1の核酸分子にも存在する。好ましくは、本発明の方法は、
a)少なくとも第1及び第2の核酸分子を含むサンプルを用意するステップであって、第1の核酸分子が第2の核酸分子に存在しない第1の標的配列を含み、任意選択で第2の核酸分子が第2の標的配列を含む、ステップと;
b)本明細書で定義した、つまりプロテロメラーゼ認識配列を含むアダプターを、第1及び第2の核酸分子の末端に連結して、アダプター連結核酸分子を用意するステップと;
c)アダプター連結核酸分子をプロテロメラーゼと接触させて切断し、切断された末端を共有結合で閉端して、閉端末端を含む第1及び第2の核酸分子をもたらすステップと;
d)閉端末端を含む第1の核酸分子を第1の標的配列にて切断して、1つの開端末端及び1つの閉端末端を含む第1の核酸を用意するステップと;
e)サンプルをエキソヌクレアーゼに曝露するステップと;
f)閉端末端を含む第2の核酸分子を第2の標的配列にて切断して、1つの開端末端及び1つの閉端末端を含む第2の核酸をもたらすステップと
を含み得る。
a)少なくとも第1及び第2の核酸分子を含むサンプルを用意するステップであって、第1の核酸分子が第2の核酸分子に存在しない第1の標的配列を含み、任意選択で第2の核酸分子が第2の標的配列を含む、ステップと;
b)本明細書で定義した、つまりプロテロメラーゼ認識配列を含むアダプターを、第1及び第2の核酸分子の末端に連結して、アダプター連結核酸分子を用意するステップと;
c)アダプター連結核酸分子をプロテロメラーゼと接触させて切断し、切断された末端を共有結合で閉端して、閉端末端を含む第1及び第2の核酸分子をもたらすステップと;
d)閉端末端を含む第1の核酸分子を第1の標的配列にて切断して、1つの開端末端及び1つの閉端末端を含む第1の核酸を用意するステップと;
e)サンプルをエキソヌクレアーゼに曝露するステップと;
f)閉端末端を含む第2の核酸分子を第2の標的配列にて切断して、1つの開端末端及び1つの閉端末端を含む第2の核酸をもたらすステップと
を含み得る。
任意選択で、この方法は、ステップc)とd)との間に、本明細書の上記に記載のステップc1)をさらに含み得る。
好ましくは、ステップf)の第2の核酸分子は、プログラム可能なヌクレアーゼ又は制限エンドヌクレアーゼ、好ましくはステップd)で定義した制限エンドヌクレアーゼ又はステップd)で定義したプログラム可能なヌクレアーゼによって切断される。好ましくは、ステップf)の第2の核酸分子は、プログラム可能なヌクレアーゼを使用して、好ましくはCRISPRヌクレアーゼ、ジンクフィンガーヌクレアーゼ、TALEN、及びメガヌクレアーゼのうちの少なくとも1つを使用して消化され得る。好ましくは、第2の核酸分子は、RNA誘導型CRISPRヌクレアーゼによって消化される。第1及び第2の核酸分子を切断するために使用されるCRISPRヌクレアーゼは、同じであってもよく又は異なっていてもよい。第1及び第2の核酸分子を切断するために使用されるCRISPRヌクレアーゼが同じである場合、CRISPRヌクレアーゼに結合しているガイドRNA配列は同じではない。別の表現をすると、CRISPRヌクレアーゼを使用して第1及び第2の核酸分子を切断する場合、第1の核酸分子を認識及び切断するgRNA-Cas複合体は、第2の核酸分子を認識及び切断する異なるgRNA-Cas複合体であることが本明細書では理解される。
この方法は、追加の(又は「さらなる」)アダプターを、1つの開端末端及び1つの閉端末端を含む第1及び第2の核酸分子のうちの少なくとも1つの開端末端に連結するステップg)をさらに含み得る。
したがって、一実施形態では、この方法は、ステップa)、ステップb)、ステップc)、ステップd)、及びステップg)を含み得る。任意選択で、この方法は、ステップa)、ステップb)、ステップc)、ステップc1)、ステップd)、及びステップg)を含み得る。この実施形態では、追加のアダプターは、第1の核酸分子の開端末端に連結される。第1の核酸分子は、好ましくは、目的の配列を含む。
別の実施形態では、この方法は、ステップa)、ステップb)、ステップc)、ステップd)、ステップe)、ステップf)、及びステップg)を含み得る。任意選択で、この方法は、ステップa)、ステップb)、ステップc)、ステップc1)、ステップd)、ステップe)、及びステップg)を含み得る。この実施形態では、追加のアダプターは、第2の核酸分子の開端末端に連結される。第2の核酸分子は、好ましくは、目的の配列を含む。
追加のアダプターは、増幅及び/又は配列決定に適したアダプターであり得る。追加のアダプターは、配列決定アダプターであってもよく、例えば、Roche 454A及び454Bシーケンシング、ILLUMINA(商標)SOLEXA(商標)シーケンシング、Applied BiosystemsのSOLID(商標)シーケンシング、Pacific BiosciencesのSMRT(商標)シーケンシング、Pollonator Polonyシーケンシング、Oxford Nanopore Technologies(ONT)、Onteraシーケンシング、又はComplete Genomicsシーケンシングを可能にする機能性ドメインを含む。
したがって、好ましくは、追加のアダプターは、少なくとも1つの配列決定プライマー結合部位を含み、及び/又は追加のアダプターは、少なくとも1つの増幅プライマー結合部位を含む。追加のアダプターは、少なくとも2つの配列決定プライマー結合部位を含み得、及び/又はさらなるアダプターは、少なくとも2つの増幅プライマー結合部位を含み得る。追加のアダプターは、一本鎖、二本鎖、部分的に二本鎖、Y字型、又はヘアピン核酸分子であり得る。好ましくは、アダプターは、ヘアピンアダプター又はY字型アダプターである。
ステムループアダプター又はヘアピンアダプターは一本鎖であるが、それらの末端は相補的であり、その結果、アダプターはそれ自体で折り返され、二本鎖部分と一本鎖ループが生じる。ステムループアダプターは、直鎖状の二本鎖核酸分子の末端に連結され得る。例えば、ステムループアダプターがステップg)において対応する第1又は第2の核酸分子の開端末端に接合される場合、末端ヌクレオチドは存在しない。したがって、得られる分子は末端ヌクレオチドを欠如する。
ステップg)の第1又は第2の核酸分子は、環状化可能なアダプターに連結され得る。この点において、開端末端を含む核酸分子は、断片のいずれかの側の適合性構造の自己環化によって環化され得るか(これは、アダプター連結により、若しくは連結されたアダプターの制限酵素消化の結果として生じ得る)、又は所望の断片の末端に相補的なセレクタープローブへのハイブリダイゼーションによって環化され得る。伸長及び連結の最終ステップは、共有結合で閉じた環状の、任意選択で二本鎖のポリヌクレオチドを生成する。
追加のアダプターは、保護アダプターであってもよい。この文脈では、保護アダプターは、エキソヌクレアーゼ消化のためのアダプターによって捕捉される核酸分子を保護するように特別に設計されたアダプターであると本明細書では理解されるべきある。そのようなアダプターは、化学的部分若しくは保護基(例えばホスホロチオエート)を含むことによって、或いは末端ヌクレオチドの欠如(ヘアピン若しくはステムループアダプター、又は環化可能なアダプター)のいずれかによって、エキソヌクレアーゼによる分解から保護することが好ましい。
任意選択で、追加のアダプターは、識別子配列、好ましくは本明細書で定義した識別子配列を含む。
好ましくは、核酸分子ライブラリーは、複数のサンプルから調製される。任意選択で、本発明の方法は多重化され、すなわち、複数の核酸サンプルに対して、例えば、少なくとも約10、20、30、40、50、60、70、80、90、100、500、1000又はそれより多くの核酸サンプルに対して同時に適用される。したがって、この方法は、複数のサンプルに対して並行して実施することができ、「並行して」とは、実質的に同時であるが、各サンプルが別々の反応チューブ又は容器で処理されることであると本明細書では理解されるべきである。
さらに、又は或いは、本発明の方法の1つ又は複数のステップは、プールされたサンプルに対して実施することができる。第1及び/又は第2の核酸分子を元のサンプルまで遡るために、サンプルをプールする前に第1及び/又は第2の核酸分子を識別子でタグ付けすることができる。そのような識別子は、任意の検出可能な実体、例えば限定するものではないが、放射性標識又は蛍光標識であり得るが、好ましくは定義された長さの、特定のヌクレオチド配列又はヌクレオチド配列の組合せであるのが好ましい。さらに、又は或いは、サンプルは、独創的なプーリング戦略、例えば限定するものではないが、2D及び3Dプーリング戦略を使用してプールすることができ、それによって、プール後、各サンプルは、少なくとも2つ又は3つのプールにそれぞれ含まれる。特定の核酸分子は、第1及び/又は第2の核酸分子を含む対応するプールの座標を使用することによって、元のサンプルまで遡ることができる。複数のサンプルは、ステップb)、ステップc)、ステップd)、ステップe)、ステップf)の前、又はステップg)の前、又はステップg)の後でプールすることができる。
本明細書に記載のステップa)とb)との間で、ステップb)とc)との間で、ステップc)とd)との間で、及び/又はステップd)の後で、核酸サンプルを精製してもよく、及び/又は反応酵素を不活性化してもよい。
本発明の実施形態では、本明細書に記載のステップc)とc1)との間で及び/又はステップc1)とd)との間で、核酸サンプルを精製してもよく、及び/又は反応酵素を不活性化してもよい。
本発明の実施形態では、本明細書に記載のステップd)とe)との間で、e)とf)との間で、ステップf)とg)との間で、ステップd)とg)との間で、及び/又はステップg)の後で、核酸サンプルを精製してもよく、及び/又は反応酵素を不活性化してもよい。
複合体、酵素、遊離ヌクレオチド、考え得る遊離アダプター、及び考え得る小型無関連核酸分子を除去するために、精製ステップ、例えば、AMPureビーズベース精製プロセスが含まれていてもよい。精製後に、第1の核酸分子及び/又は任意選択で第2の核酸分子を回収し、単一分子配列決定などのさらなる処理及び/又は分析に供することができる。
任意選択の精製ステップは、プロテイナーゼK処理である。或いは、又はさらに、前記精製は、以下のステップ:
i. 核酸サンプルを、第1の核酸分子及び/又は任意選択で第2の核酸分子に特異的及び効果的に結合する1つ又は複数の固体支持体に曝露するステップと;任意選択で、
ii. 1つ又は複数の固体支持体を洗浄し、1つ又は複数の固体支持体から第1の核酸分子及び/又は任意選択で第2の核酸分子を溶出させるステップと
を含み得る。
i. 核酸サンプルを、第1の核酸分子及び/又は任意選択で第2の核酸分子に特異的及び効果的に結合する1つ又は複数の固体支持体に曝露するステップと;任意選択で、
ii. 1つ又は複数の固体支持体を洗浄し、1つ又は複数の固体支持体から第1の核酸分子及び/又は任意選択で第2の核酸分子を溶出させるステップと
を含み得る。
1つ又は複数の固体支持体は、限定するものではないが、Ampureビーズであり得る。精製後に少なくとも1つの単離された核酸分子が得られるため、本明細書で定義した方法は、核酸サンプルから1つ又は複数の核酸分子を単離するための方法であると考えることもできる。
本発明の方法は、サイズ選択ステップをさらに含み得る。任意選択で、サイズ選択ステップは、本発明の方法のステップb)の前、ステップb)とc)の間、ステップc)とd)の間、及び/又はステップd)の後に実施される。
一実施形態では、サイズ選択ステップは、本発明のステップc)とc1)との間で、及び/又はステップc1)とd)との間で実施される。
一実施形態では、サイズ選択ステップは、本発明のステップd)とe)との間で、ステップe)とf)との間で、ステップf)とg)との間で、又はステップg)の後で実施される。
或いは、さらなる精製、不活性化、及び/又はサイズ選択ステップは存在しない。したがって、一実施形態では、本発明の方法は、ステップa)、b)、c)、d)、e)、f)、及びg)の間に、又はステップg)後にいかなる精製ステップも必要としない。さらに、又は或いは、本発明の方法は、ステップa)、b)、c)、d)、e)、f)、及びg)の間に、又はステップg)後にいかなる不活性化ステップも必要としない。さらに、又は或いは、本発明の方法は、ステップa)、b)、c)、d)、e)、f)、及びg)の間に、又はステップg)後にいかなるサイズ選択ステップも必要としない。
本発明の方法は、1つ又は複数の標的核酸分子を配列決定するステップが続き得る。本明細書で定義した方法はまた、したがって、核酸サンプルから1つ又は複数の標的核酸分子を配列決定するための方法と考えることもできる。
好ましくは、配列決定ステップは、プロテロメラーゼ認識配列を含むアダプターの付加後に実施される。好ましくは、配列決定ステップは、ステップc)後で、つまり環状核酸分子の配列決定後に実施される。好ましくは、配列決定ステップは、さらなるアダプターの付加後に実施される。好ましくは、配列決定ステップは、ステップg)後に実施される。第1及び第2の核酸分子のうちの少なくとも1つの配列決定は、ステップb)後、ステップc1)後、ステップd)後、ステップe)後、又はステップf)後に実施することができる。
任意選択で、本発明の方法は、増幅ステップをさらに含む。増幅ステップは、アダプターを含む核酸分子を閉端した後で実施することができ、アダプターは、プロテロメラーゼ認識配列を含む。好ましくは、増幅ステップは、ステップc)後に、つまり環状核酸分子の増幅後に実施される。任意選択で、増幅ステップは、さらなるアダプターを第1又は第2の核酸分子にアニーリングさせた後で実施される。好ましくは、増幅ステップは、ステップg)後に実施される。第1及び第2の核酸分子のうちの少なくとも1つの増幅は、ステップa)後、ステップb)後、ステップc1)後、ステップd)後、ステップe)後、及び/又はステップf)後に実施することができる。増幅は、PCRによって、又は当技術分野で公知の任意の増幅方法によって実施することができる。
一実施形態では、本発明の方法は、増幅ステップ及び/又はクローニングステップを含まない配列決定法である。エピジェネティックな情報(例えば、5-mC、6-mAなど)がアンプリコンで失われるので、増幅ステップの減少は有益である。さらなる増幅は、アンプリコンに多様性を導入することができ(例えば、増幅中のエラーを介して)、その結果、それらのヌクレオチド配列は元のサンプルを反映しない。同様に、標的領域の別の生物へのクローニングは、多くの場合、元のサンプル核酸中に存在する修飾が維持されないため、いくつかの実施形態では、さらなる分析のために濃縮される標的配列は、典型的には、本明細書の方法では増幅及び/又はクローニングされない。
一態様では、本発明の方法は、核酸分子ライブラリーを増幅するための方法に関する。この方法は、好ましくは、本明細書で定義した核酸分子ライブラリーを調製するステップを含む。核酸分子ライブラリーは、好ましくは、
本明細書で定義したステップa)、b)、及びc);
本明細書で定義したステップa)、b)、c)、及びc1);
本明細書で定義したステップa)、b)、c)、及びd);
本明細書で定義したステップa)、b)、c)、c1)、及びd);
本明細書で定義したステップa)、b)、c)、d)、及びg);
本明細書で定義したステップa)、b)、c)、c1)、d)、及びg);
本明細書で定義したステップa)、b)、c)、d)、及びe);
本明細書で定義したステップa)、b)、c)、c1)、d)、及びe);
本明細書で定義したステップa)、b)、c)、d)、e)、及びf);
本明細書で定義したステップa)、b)、c)、c1)、d)、e)、及びf);
本明細書で定義したステップa)、b)、c)、d)、e)、f)、及びg);
本明細書で定義したステップa)、b)、c)、c1)、d)、e)、f)、及びg)
のうちの少なくとも1つを使用して調製される。
本明細書で定義したステップa)、b)、及びc);
本明細書で定義したステップa)、b)、c)、及びc1);
本明細書で定義したステップa)、b)、c)、及びd);
本明細書で定義したステップa)、b)、c)、c1)、及びd);
本明細書で定義したステップa)、b)、c)、d)、及びg);
本明細書で定義したステップa)、b)、c)、c1)、d)、及びg);
本明細書で定義したステップa)、b)、c)、d)、及びe);
本明細書で定義したステップa)、b)、c)、c1)、d)、及びe);
本明細書で定義したステップa)、b)、c)、d)、e)、及びf);
本明細書で定義したステップa)、b)、c)、c1)、d)、e)、及びf);
本明細書で定義したステップa)、b)、c)、d)、e)、f)、及びg);
本明細書で定義したステップa)、b)、c)、c1)、d)、e)、f)、及びg)
のうちの少なくとも1つを使用して調製される。
この方法は、核酸分子ライブラリーを増幅するステップをさらに含む。
増幅は、単一のプライマーを使用して、例えば「ローリングサークル」増幅によって実施することができる。単一のプライマーは、好ましくは、
i)ステップd)において得られる1つの開端末端及び1つの閉端末端を含む第1の核酸分子にアニーリングするプライマー;
ii)ステップf)において得られる1つの開端末端及び1つの閉端末端を含む第2の核酸分子にアニーリングするプライマー;並びに
iii)ステップg)で定義したさらなるアダプターにアニーリングするプライマー
のうちの少なくとも1つである。
増幅は、単一のプライマーを使用して、例えば「ローリングサークル」増幅によって実施することができる。単一のプライマーは、好ましくは、
i)ステップd)において得られる1つの開端末端及び1つの閉端末端を含む第1の核酸分子にアニーリングするプライマー;
ii)ステップf)において得られる1つの開端末端及び1つの閉端末端を含む第2の核酸分子にアニーリングするプライマー;並びに
iii)ステップg)で定義したさらなるアダプターにアニーリングするプライマー
のうちの少なくとも1つである。
或いは、又はさらに、増幅は、プライマー対を使用して、つまり第1及び第2のプライマーを使用して実施することができ、対応する第1及び/又は第2の核酸分子の増幅を可能にするように、好ましくは、第1及び第2のプライマーは、第1の核酸分子にアニーリングすることができ、並びに/又は第1及び第2のプライマーは、第2の核酸分子にアニーリングすることができる。
好ましくは、プライマー対は、第1の核酸分子に、好ましくは本明細書で定義したステップa)、b)、c)、c1)、d)、又はステップg)で得られる第1の核酸分子にアニーリングすることができる第1のプライマー及び第2のプライマーを含む。好ましくは、プライマー対は、本明細書で定義したステップd)又はステップg)で得られる1つの開端末端及び1つの開端末端を含む第1の核酸分子にアニーリングすることができる第1のプライマー及び第2のプライマーを含む。
或いは、又はさらに、プライマー対は、第2の核酸分子に、好ましくは、本明細書で定義したステップa)、b)、c)、c1)、d)、e)、f)、又はステップg)で得られる第2の核酸分子にアニーリングすることができる第1のプライマー及び第2のプライマーを含み得る。好ましくは、プライマー対は、本明細書で定義したステップf)又はステップg)で得られる1つの開端末端及び1つの開端末端を含む第2の核酸分子にアニーリングすることができる第1のプライマー及び第2のプライマーを含む。
好ましくは、プライマー対の第1のプライマーは、プライマー対の第2のプライマーと相補的ではないか又は実質的に相補的ではない。
一実施形態では、第1及び第2のプライマーのうちの少なくとも1つは、アダプターに、好ましくは本明細書で定義したプロテロメラーゼ認識配列を含むアダプターに及び/又はステップg)で定義したさらなるアダプターに存在する配列にアニーリングすることができる。
第1及び第2のプライマーは、同じアダプターに、好ましくは本明細書で定義したステップg)のアダプターに存在する第1の配列及び第2の配列にアニーリングすることができる。非限定的な例として、アダプターは、Y字型アダプターであってもよく、第1のプライマー結合部位は、Y字型アダプターの第1の一本鎖アームに存在してもよく、第2のプライマー結合部位は、Y字型アダプターの他方の一本鎖アームに存在してもよい。
或いは、又はさらに、第1の増幅プライマーは、第1の核酸分子に存在する配列にアニーリングすることができ、第2の増幅プライマーは、アダプターに、好ましくは、プロテロメラーゼ認識配列を含むアダプターに又は本明細書で定義したステップg)のさらなるアダプターに存在する配列にアニーリングすることができる。
或いは、又はさらに、第1の増幅プライマーは、第2の核酸分子に存在する配列にアニーリングすることができ、第2の増幅プライマーは、アダプターに、好ましくは、プロテロメラーゼ認識配列を含むアダプターに又は本明細書で定義したステップg)のさらなるアダプターに存在する配列にアニーリングすることができる。
或いは、又はさらに、第1の増幅プライマーは、プロテロメラーゼ認識配列を含むアダプターに存在する配列にアニーリングすることができ、第2の増幅プライマーは、本明細書で定義したステップg)のさらなるアダプターに存在する配列にアニーリングすることができる。
さらなる態様では、本発明は、第1及び第2の核酸分子を含むサンプル中の目的の配列を分析するための方法に関する。この方法は、好ましくは、本明細書で定義した核酸分子ライブラリーを調製するステップを含む。
サンプルは、少なくとも第1及び第2の核酸分子を含み得る。第1及び/又は第2の核酸分子は、より長い核酸分子の一部であり得る。核酸サンプルは、第1及び第2の核酸分子を含む、複数の核酸分子を含み得る。
本明細書に詳述されているように、調製された核酸ライブラリーは、好ましくは、第1及び第2の核酸分子のうちの少なくとも1つを含む。一実施形態では、調製された核酸ライブラリーは、第1の核酸分子を含むが、第2の核酸分子を含まない。代替的な実施形態では、調製された核酸ライブラリーは、第2の核酸分子を含むが、第1の核酸分子を含まない。
前記第1又は第2の核酸分子は、好ましくは、目的の配列を含む。核酸分子ライブラリーは、好ましくは、
本明細書で定義したステップa)、b)、及びc);
本明細書で定義したステップa)、b)、c)、及びc1);
本明細書で定義したステップa)、b)、c)、d)、及びg);
本明細書で定義したステップa)、b)、c)、c1)、d)、及びg);
本明細書で定義したステップa)、b)、c)、d)、e)、f)、及びg);並びに
本明細書で定義したステップa)、b)、c)、c1)、d)、e)、f)、及びg)
のうちの少なくとも1つを使用して調製される。
本明細書で定義したステップa)、b)、及びc);
本明細書で定義したステップa)、b)、c)、及びc1);
本明細書で定義したステップa)、b)、c)、d)、及びg);
本明細書で定義したステップa)、b)、c)、c1)、d)、及びg);
本明細書で定義したステップa)、b)、c)、d)、e)、f)、及びg);並びに
本明細書で定義したステップa)、b)、c)、c1)、d)、e)、f)、及びg)
のうちの少なくとも1つを使用して調製される。
この方法は、好ましくは、調製された核酸分子ライブラリーを分析するステップをさらに含む。分析は、当技術分野で公知の任意の従来手段を使用して実施することができる。分析は、
標識、例えば放射性標識又は蛍光標識を使用して配列を検出すること;
調製された核酸分子ライブラリーのサイズを分析すること;
ライブラリーを、任意選択でその一部をベクターにクローニングし、任意選択で続いて遺伝子発現及び/又は制限分析を行うこと;並びに
核酸分子ライブラリーを配列決定すること
のうちの少なくとも1つを含み得る。
標識、例えば放射性標識又は蛍光標識を使用して配列を検出すること;
調製された核酸分子ライブラリーのサイズを分析すること;
ライブラリーを、任意選択でその一部をベクターにクローニングし、任意選択で続いて遺伝子発現及び/又は制限分析を行うこと;並びに
核酸分子ライブラリーを配列決定すること
のうちの少なくとも1つを含み得る。
好ましくは、調製された核酸分子ライブラリーは、配列決定、好ましくはディープシーケンシングされる。配列決定は、ILLUMINA(商標)、SOLEXA(商標)シーケンシング、Ion Torrentシーケンシング、Pacific BiosciencesのSMRT(商標)シーケンシング、Sangerシーケンシング、Genapsys、Pollonator Polonyシーケンシング、Oxford Nanopore Technologies(ONT)、Onteraシーケンシング、及びComplete Genomicsシーケンシングのうちの少なくとも1つを含み得る。
好ましい実施形態では、調製された核酸分子ライブラリーは、ナノポア選択的シーケンシングによって配列決定される。ナノポア選択的シーケンシングでは、リアルタイムシーケンシング中、生成されたデータ(直流電流シグナル又はこうした電流シグナルから変換された塩基コール)を、1つ又は複数の参照配列と比較する。標的配列のヌクレオチドの設定数又はシグナルの量を参照配列とアラインする場合、配列決定を進行させ、そうでない場合は、電流を反転させ、それによりポアから核酸が除去され、ポアが新しい核酸の配列決定に利用可能になるだろう。ヌクレオチドの設定数は、読み取られた核酸の少なくとも最初の50、60、70、80、90、100、150、200、250、300、350、400、450、又は500ヌクレオチドであり得る。1つ又は複数の参照配列は、多数の異なる配列であり得る。好ましくは、こうした参照配列の各々は、本発明の方法によって得られる核酸分子ライブラリーの標的核酸断片の配列と、少なくとも50、60、70、80、90、92、93、94、95、96、97、98、99、又は100%同一である。一実施形態では、参照配列の各々は、本発明の方法によって得られる核酸分子ライブラリーの標的核酸断片のうちの1つ又は複数の配列の特定のサブセットと、少なくとも50、60、70、80、90、92、93、94、95、96、97、98、99、又は100%同一である。ナノポア選択的シーケンシングによって特定のサブセットを選択的に配列決定する利点の1つは、調製された核酸分子ライブラリーを使用して、異なる配列決定実行において異なるサブセットを配列決定することができることである。
一実施形態では、プロテロメラーゼ認識配列を含むアダプターは、配列決定プライマーに対する少なくとも1つの結合部位を含む。
或いは、又はさらに、ステップg)のさらなるアダプターは、配列決定プライマーに対する少なくとも1つの結合部位を含む。ステップg)のさらなるアダプターは、2つの配列決定プライマーに対する2つの異なる結合部位を含み得る。非限定的な例として、ステップg)のアダプターは、Y字型アダプターであってもよく、第1の配列決定プライマー結合部位は、Y字型アダプターの第1の一本鎖アームに存在してもよく、第2の配列決定プライマー結合部位は、Y字型アダプターの他方の一本鎖アームに存在してもよい。
一態様では、本発明は、目的の配列を含む核酸分子について核酸サンプルを濃縮するための方法に関する。この方法は、好ましくは、本明細書の上記で詳述した少なくとも方法ステップa)~d)を使用するが、ステップc1)、ステップe)、ステップf)、及び/又はステップg)など、本明細書で詳述した追加のステップのいずれかを使用してもよい。
一態様では、本発明は、本明細書に記載の本発明の方法を実施するためのキットオブパーツに関する。好ましくは、キットオブパーツは、本明細書で定義した方法で使用するためのものである。好ましくは、キットオブパーツは、本明細書で定義したプロテロメラーゼ認識配列を含む少なくとも1つ又は複数のアダプターを含む。
本明細書で定義した方法で使用するためのアダプターは、好ましくは、本発明の方法のステップd)及び/又はステップf)で使用される制限エンドヌクレアーゼ又はプログラム可能なヌクレアーゼの認識部位を含まない。より好ましくは、プロテロメラーゼ認識配列と第1及び/又は第2の核酸分子に連結した末端との間に位置するアダプターの部分は、本発明の方法のステップd)及び/又はステップf)で使用される制限エンドヌクレアーゼ又はプログラム可能なヌクレアーゼの認識部位を含まない。
1つ又は複数のアダプターは、1つのバイアルに組み合わせてもよく又は別々のバイアルに存在してもよく、例えば、1つのバイアルのアダプターは、同じ識別子配列、好ましくは同じサンプル識別子配列を含む。キットオブパーツは、本明細書で定義したプロテロメラーゼを含むバイアルをさらに含み得る。
キットオブパーツは、本明細書に記載の方法を実行するための1つ又は複数の試薬を含み得る。したがって、キットオブパーツは、
本明細書で定義したプロテロメラーゼ認識配列を含むアダプターを含む1つ又は複数のバイアル;
ステップg)のための本明細書で定義したさらなるアダプターを含む1つ又は複数のバイアル;
本明細書で定義したプロテロメラーゼを含む1つ又は複数のバイアル;
本明細書で定義したgRNA-CAS複合体を含む1つ又は複数のバイアル;
CRISPR-CASタンパク質と複合体を形成してgRNA-CAS複合体を形成するためのgRNAを含む1つ又は複数のバイアル、及び前記CRISPR-CASタンパク質を含むさらなるバイアル;
1つ又は複数のエキソヌクレアーゼを含むさらなるバイアル
のうちの少なくとも1つを含み得る。
本明細書で定義したプロテロメラーゼ認識配列を含むアダプターを含む1つ又は複数のバイアル;
ステップg)のための本明細書で定義したさらなるアダプターを含む1つ又は複数のバイアル;
本明細書で定義したプロテロメラーゼを含む1つ又は複数のバイアル;
本明細書で定義したgRNA-CAS複合体を含む1つ又は複数のバイアル;
CRISPR-CASタンパク質と複合体を形成してgRNA-CAS複合体を形成するためのgRNAを含む1つ又は複数のバイアル、及び前記CRISPR-CASタンパク質を含むさらなるバイアル;
1つ又は複数のエキソヌクレアーゼを含むさらなるバイアル
のうちの少なくとも1つを含み得る。
好ましくは、キットは、本明細書で定義した1つ又は複数のgRNAを含む少なくとも2、4、10、20、30、又は50個のバイアルを含む。好ましくは、キット内のいずれかのバイアルの容量は、100mL、50mL、20mL、10mL、5mL、4mL、3mL、2mL、又は1mLを超えない。
試薬は、凍結乾燥された形態で存在していてもよく、又は適切なバッファー中に存在していてもよい。キットはまた、本発明を実施するのに必要な任意の他の構成要素、例えば、バッファー、ピペット、マイクロタイタープレート、及び書面の説明書を含むことができる。本発明のキットのためのそのような他の構成要素は、当業者には公知である。
一態様では、本発明は、
(i)核酸分子ライブラリーの調製;
(ii)核酸分子ライブラリーの増幅;及び
(iii)サンプル中の目的の配列の分析
のうちの少なくとも1つのための本明細書で定義したプロテロメラーゼ認識配列を含むアダプターの使用に関する。
(i)核酸分子ライブラリーの調製;
(ii)核酸分子ライブラリーの増幅;及び
(iii)サンプル中の目的の配列の分析
のうちの少なくとも1つのための本明細書で定義したプロテロメラーゼ認識配列を含むアダプターの使用に関する。
材料及び方法
TeIN認識部位を含むアダプターを、
オリゴ19_04626(100μM):2μl
オリゴ19_03053(100μM):2μl
を組み合わせることにより調製した。
TeIN認識部位を含むアダプターを、
オリゴ19_04626(100μM):2μl
オリゴ19_03053(100μM):2μl
を組み合わせることにより調製した。
オリゴの配列:
19_04626 5’-AGGACCGGATCAACTTATCAGCACACAATTGCCCATTATACGCGCGTATAATGGACTATTGTGTGCTGATAAAGAAAGTTGTCGGTGTCTTTGTGAGATGTGTATAAGAGACAGT-3’(配列番号19)
19_03053 5’-CTGTCTCTTATACACATCTCACAAAGACACCGACAACTTTCTTTATCAGCACACAATAGTCCATTATACGCGCGTATAATGGGCAATTGTGTGCTGATAAGTTGATCCGGTCCT-3’(配列番号20)。5’末端は好ましくはリン酸化されている。
19_04626 5’-AGGACCGGATCAACTTATCAGCACACAATTGCCCATTATACGCGCGTATAATGGACTATTGTGTGCTGATAAAGAAAGTTGTCGGTGTCTTTGTGAGATGTGTATAAGAGACAGT-3’(配列番号19)
19_03053 5’-CTGTCTCTTATACACATCTCACAAAGACACCGACAACTTTCTTTATCAGCACACAATAGTCCATTATACGCGCGTATAATGGGCAATTGTGTGCTGATAAGTTGATCCGGTCCT-3’(配列番号20)。5’末端は好ましくはリン酸化されている。
オリゴのハイブリダイゼーションを可能にするため、以下の熱プロファイルを使用した:
95℃で10分間
90℃で1分間
温度を1℃/サイクルで60回下降させる
4℃を維持
得られたアダプター溶液(50μM)を15μM濃度に希釈した。
95℃で10分間
90℃で1分間
温度を1℃/サイクルで60回下降させる
4℃を維持
得られたアダプター溶液(50μM)を15μM濃度に希釈した。
この実施例のインプット材料は、ラムダDNAに由来する1Kbpアンプリコンだった。
以下の設定を使用して増幅を実施した:
ラムダDNA5ng/μl 5μl
MilliQ水 9.3μl
PCRバッファー 4μl
25mM dNTP(各々) 0.2μl
Herculaseポリメラーゼ 0.5μl
フォワードプライマー(10μM) 0.5μl
リバースプライマー(10μM) 0.5μl
フォワードプライマー:18_03029:5’-TCACGCTGATTTACAGCGGCA-3’(配列番号21)
リバースプライマー:18_03032:5’-CGATGCTGATTGCCGTTCCG-3’(配列番号22)
以下の設定を使用して増幅を実施した:
ラムダDNA5ng/μl 5μl
MilliQ水 9.3μl
PCRバッファー 4μl
25mM dNTP(各々) 0.2μl
Herculaseポリメラーゼ 0.5μl
フォワードプライマー(10μM) 0.5μl
リバースプライマー(10μM) 0.5μl
フォワードプライマー:18_03029:5’-TCACGCTGATTTACAGCGGCA-3’(配列番号21)
リバースプライマー:18_03032:5’-CGATGCTGATTGCCGTTCCG-3’(配列番号22)
増幅のための熱プロファイルは、以下の通りだった:
95℃で2分間
95℃で30秒間
65℃で30秒間->温度を0.7℃/サイクルで低減させる
72℃で4分間
13サイクル
95℃で30秒間
56℃で30秒間
72℃で5分間
25サイクル
72℃で2分間
12℃で維持
95℃で2分間
95℃で30秒間
65℃で30秒間->温度を0.7℃/サイクルで低減させる
72℃で4分間
13サイクル
95℃で30秒間
56℃で30秒間
72℃で5分間
25サイクル
72℃で2分間
12℃で維持
得られたアンプリコンを0.8×精製し、20ul MQで溶出した。QubitBRで濃度を測定した:554ng/μl
精製したアンプリコンを末端修復し、A尾部化した。
精製したアンプリコンを末端修復し、A尾部化した。
末端修復(2つの反応を実施):
2μlの精製アンプリコン
7μlのNEBNext Ultra II End Prep反応バッファー(New England Biolabs Inc.)
3μlのNEBNext Ultra II End Prep酵素混合物(New England Biolabs Inc.)
48μl MilliQ水
総容積=60μl->20℃で30分間、65℃で30分間インキュベートし、さらなる使用まで4℃で維持。
2μlの精製アンプリコン
7μlのNEBNext Ultra II End Prep反応バッファー(New England Biolabs Inc.)
3μlのNEBNext Ultra II End Prep酵素混合物(New England Biolabs Inc.)
48μl MilliQ水
総容積=60μl->20℃で30分間、65℃で30分間インキュベートし、さらなる使用まで4℃で維持。
アダプター連結:
60μlのNEBNext Ultra II End Prep反応混合物(New England Biolabs Inc.)
30μlのNEBNext Ultra II連結マスター混合物(New England Biolabs Inc.)
1μlのNEBNext連結エンハンサー(New England Biolabs Inc.)
2.5μlアダプター(50μM)
総容積=93.5μl->15℃で20分間インキュベート
得られた連結サンプルを、1:1のAmpureビーズを使用して精製し、20μlのMilliQ水で溶出した。
60μlのNEBNext Ultra II End Prep反応混合物(New England Biolabs Inc.)
30μlのNEBNext Ultra II連結マスター混合物(New England Biolabs Inc.)
1μlのNEBNext連結エンハンサー(New England Biolabs Inc.)
2.5μlアダプター(50μM)
総容積=93.5μl->15℃で20分間インキュベート
得られた連結サンプルを、1:1のAmpureビーズを使用して精製し、20μlのMilliQ水で溶出した。
残留アダプターを除去するため、追加のAmpure精製(0.75×)を実施した。
アダプター連結産物の濃度は40ng/μlである。
アダプター連結産物をTeINで処理して、末端を共有結合で閉端した。
アダプター連結産物 4μl
ThermoPol反応バッファー(10×)(New England Biolabs Inc.) 2μl
TeINプロテロメラーゼ(New England Biolabs Inc.) 2μl
MilliQ水 12μl
アダプター連結産物 4μl
ThermoPol反応バッファー(10×)(New England Biolabs Inc.) 2μl
TeINプロテロメラーゼ(New England Biolabs Inc.) 2μl
MilliQ水 12μl
反応混合物をピペッティングによって穏やかに混合し、手短に遠心分離し、30℃で30分間インキュベートした。75℃で5分間インキュベートすることによって酵素を不活性化した。
得られたサンプルを、1:1のAmpureビーズを使用して精製し、15μlのMilliQ水で溶出した。
エキソヌクレアーゼ保護を検証するため、TeIN処理サンプルをエキソヌクレアーゼVと共にインキュベートした。
サンプル 10μl
NEBバッファー3.1(10×) 2.0μl
ATP(100mM) 1.0μl
エキソヌクレアーゼV(10ユニット) 1.0μl
MilliQ水 6.0μl
反応混合物を37℃で60分間インキュベートした。エキソヌクレアーゼを70℃で30分間不活性化した。
サンプル 10μl
NEBバッファー3.1(10×) 2.0μl
ATP(100mM) 1.0μl
エキソヌクレアーゼV(10ユニット) 1.0μl
MilliQ水 6.0μl
反応混合物を37℃で60分間インキュベートした。エキソヌクレアーゼを70℃で30分間不活性化した。
サンプルを、Ampure(1×)を使用して精製し、10ulのMilliQ水で溶出した。
結果
バイオアナライザー分析の結果は図1に示されている。手短に言えば、
アンプリコン及びアダプター連結アンプリコンは、エキソヌクレアーゼVを使用して容易に分解される。
バイオアナライザー分析の結果は図1に示されている。手短に言えば、
アンプリコン及びアダプター連結アンプリコンは、エキソヌクレアーゼVを使用して容易に分解される。
アダプター連結アンプリコン及びTeIN処理アンプリコンは、エキソヌクレアーゼ分解に耐性である。
結論
DNA断片の末端をTeINを使用して共有結合で閉端することによって、エキソヌクレアーゼV耐性断片がもたらされる。
DNA断片の末端をTeINを使用して共有結合で閉端することによって、エキソヌクレアーゼV耐性断片がもたらされる。
Claims (17)
- 少なくとも部分的に二本鎖であり、プロテロメラーゼ認識配列、好ましくはTeINプロテロメラーゼ認識配列を含むアダプター。
- 識別子配列をさらに含む、請求項1に記載のアダプター。
- 少なくとも1つの付着末端を含む、請求項1又は2に記載のアダプター。
- 核酸分子ライブラリーを調製するための方法であって、
a)少なくとも第1及び第2の核酸分子を含むサンプルを用意するステップであり、前記第1の核酸分子が前記第2の核酸分子に存在しない第1の標的配列を含み、任意選択で前記第2の核酸分子が第2の標的配列を含む、ステップと;
b)請求項1~3のいずれか一項で定義したアダプターを、前記第1及び第2の核酸分子の末端に連結して、アダプター連結核酸分子を用意するステップと;
c)前記アダプター連結核酸分子を、プロテロメラーゼ、好ましくはTeINプロテロメラーゼと接触させて切断し、切断された末端を共有結合で閉端して、閉端末端を含む第1及び第2の核酸分子をもたらすステップと;
d)前記閉端末端を含む前記第1の核酸分子を前記第1の標的配列にて切断して、1つの開端末端及び1つの閉端末端を含む第1の核酸を用意するステップと
を含む方法。 - ステップa)の前記サンプルが、前記第1及び第2の核酸分子、並びに複数のさらなる核酸分子を含む、請求項4に記載の方法。
- ステップd)の前記第1の核酸分子が、プログラム可能なヌクレアーゼ又は制限エンドヌクレアーゼによって切断され、好ましくは、前記プログラム可能なヌクレアーゼが、RNA誘導型CRISPRヌクレアーゼである、請求項4又は5に記載の方法。
- ステップa)の前記第1及び第2の核酸分子が、断片化、好ましくはゲノム核酸分子の断片化によって用意され、好ましくは、ステップb)の前記アダプターが、タグメンテーションによって連結される、請求項4~6のいずれか一項に記載の方法。
- ステップc)において閉端末端を含む前記核酸分子を得た後だが、ステップd)において前記閉端末端を含む前記第1の核酸分子を切断する前に、前記サンプルをエキソヌクレアーゼに曝露するステップc1)を含む、請求項4~7のいずれか一項に記載の方法。
- ステップd)において1つの開端末端及び1つの閉端末端を含む前記第1の核酸分子を得た後、前記サンプルをエキソヌクレアーゼに曝露するステップe)を含み、好ましくは、前記閉端末端を含む前記第2の核酸分子を前記第2の標的配列にて切断して、1つの開端末端及び1つの閉端末端を含む第2の核酸をもたらすステップf)を含む、請求項4~7のいずれか一項に記載の方法。
- 1つの開端末端及び1つの閉端末端を含む前記第1の核酸分子又は任意選択で前記第2の核酸分子の開端末端にさらなるアダプターを連結するステップg)を含み、前記さらなるアダプターが、増幅プライマー結合部位及び配列プライマー結合部位のうちの少なくとも1つ並びに任意選択で識別子配列を含む、請求項4~9のいずれか一項に記載の方法。
- 核酸分子ライブラリーが、複数のサンプルから調製され、好ましくは前記複数のサンプルが、好ましくはステップc)、ステップd)、ステップe)、ステップf)の前に、若しくはステップg)の前にプールされるか、又は好ましくは、前記サンプルが、ステップg)の後でプールされる、請求項4~10のいずれか一項に記載の方法。
- ステップb)において、前記アダプター連結核酸分子を、ステップc)において前記分子をTeINプロテロメラーゼと接触させる前に修復して一本鎖切断を除去する、請求項4~11のいずれか一項に記載の方法。
- 核酸分子ライブラリーを増幅するための方法であって、
請求項4~12のいずれか一項で定義した核酸分子ライブラリーを調製するステップと;
i)ステップd)において得られる1つの開端末端及び1つの閉端末端を含む前記第1の核酸分子にアニーリングする第1のプライマー及び任意選択で第2のプライマー;
ii)ステップf)において得られる1つの開端末端及び1つの閉端末端を含む前記第2の核酸分子にアニーリングする第1のプライマー及び任意選択で第2のプライマー;
iii)ステップg)で定義した前記さらなるアダプターにアニーリングする第1のプライマー及び任意選択で第2のプライマー;並びに
iv)i)又はii)で定義した第1のプライマー及びiii)で定義した第2のプライマーの組合せ
のうちの少なくとも1つを使用して前記核酸分子ライブラリーを増幅するステップと
を含む方法。 - 第1及び第2の核酸分子を含むサンプル中の目的の配列を分析するための方法であって、
請求項4~12のいずれか一項で定義した核酸分子ライブラリーを調製するステップと;
任意選択で、請求項13で定義した前記調製された核酸分子を増幅するステップと;
前記核酸分子ライブラリーを配列決定、好ましくはディープシーケンシングするステップと
を含む方法。 - 請求項1~3のいずれか一項で定義した1つ又は複数のアダプターと;
任意選択で、プロテロメラーゼ、好ましくはTeINプロテロメラーゼと
を含むキットオブパーツ。 - 請求項4~14のいずれか一項に記載の方法で使用するための、請求項15に記載のキットオブパーツ。
- 請求項4~14のいずれか一項に記載の方法で使用するための、請求項1~3のいずれか一項に記載のアダプター。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP19218832.4 | 2019-12-20 | ||
EP19218832 | 2019-12-20 | ||
PCT/EP2020/086887 WO2021123062A1 (en) | 2019-12-20 | 2020-12-17 | Ngs library preparation using covalently closed nucleic acid molecule ends |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023506631A true JP2023506631A (ja) | 2023-02-17 |
Family
ID=69005314
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022535868A Pending JP2023506631A (ja) | 2019-12-20 | 2020-12-17 | 共有結合で閉端された核酸分子末端を使用したngsライブラリー調製 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20220333100A1 (ja) |
EP (1) | EP4077661A1 (ja) |
JP (1) | JP2023506631A (ja) |
AU (1) | AU2020407850A1 (ja) |
CA (1) | CA3161280A1 (ja) |
WO (1) | WO2021123062A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB202114206D0 (en) * | 2021-10-04 | 2021-11-17 | Genome Res Ltd | Novel method |
WO2024121354A1 (en) | 2022-12-08 | 2024-06-13 | Keygene N.V. | Duplex sequencing with covalently closed dna ends |
EP4410992A1 (en) * | 2023-02-01 | 2024-08-07 | 4basebio, S.L.U. | Linear dna with enhanced resistance against exonucleases and methods for the production thereof |
WO2024209000A1 (en) * | 2023-04-04 | 2024-10-10 | Keygene N.V. | Linkers for duplex sequencing |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA1340807C (en) | 1988-02-24 | 1999-11-02 | Lawrence T. Malek | Nucleic acid amplification process |
CZ291877B6 (cs) | 1991-09-24 | 2003-06-18 | Keygene N.V. | Způsob amplifikace přinejmenším jednoho restrikčního fragmentu z výchozí DNA a způsob přípravy sestavy amplifikovaných restrikčních fragmentů |
US5948902A (en) | 1997-11-20 | 1999-09-07 | South Alabama Medical Science Foundation | Antisense oligonucleotides to human serine/threonine protein phosphatase genes |
AU2144000A (en) | 1998-10-27 | 2000-05-15 | Affymetrix, Inc. | Complexity management and analysis of genomic dna |
EP2045337B1 (en) | 1998-11-09 | 2011-08-24 | Eiken Kagaku Kabushiki Kaisha | Process for synthesizing nucleic acid |
US6958225B2 (en) | 1999-10-27 | 2005-10-25 | Affymetrix, Inc. | Complexity management of genomic DNA |
US6756501B2 (en) | 2001-07-10 | 2004-06-29 | E. I. Du Pont De Nemours And Company | Manufacture of 3-methyl-tetrahydrofuran from alpha-methylene-gamma-butyrolactone in a single step process |
US6872529B2 (en) | 2001-07-25 | 2005-03-29 | Affymetrix, Inc. | Complexity management of genomic DNA |
ATE358182T1 (de) | 2002-09-05 | 2007-04-15 | Plant Bioscience Ltd | Genomteilung |
CN102925561B (zh) | 2005-06-23 | 2015-09-09 | 科因股份有限公司 | 用于多态性的高通量鉴定和检测的策略 |
ATE453728T1 (de) | 2005-09-29 | 2010-01-15 | Keygene Nv | Screening mutagenisierter populationen mit hohem durchsatz |
WO2007073165A1 (en) | 2005-12-22 | 2007-06-28 | Keygene N.V. | Method for high-throughput aflp-based polymorphism detection |
EP1966394B1 (en) | 2005-12-22 | 2012-07-25 | Keygene N.V. | Improved strategies for transcript profiling using high throughput sequencing technologies |
ES2645661T3 (es) | 2006-04-04 | 2017-12-07 | Keygene N.V. | Detección de alto rendimiento de marcadores moleculares basada en fragmentos de restricción |
GB0901593D0 (en) | 2009-01-30 | 2009-03-11 | Touchlight Genetics Ltd | Production of closed linear DNA |
EP2692870A1 (en) * | 2012-08-03 | 2014-02-05 | Alacris Theranostics GmbH | Method for nucleic acid amplification |
WO2014071070A1 (en) | 2012-11-01 | 2014-05-08 | Pacific Biosciences Of California, Inc. | Compositions and methods for selection of nucleic acids |
EP3633047B1 (en) | 2014-08-19 | 2022-12-28 | Pacific Biosciences of California, Inc. | Method of sequencing nucleic acids based on an enrichment of nucleic acids |
EP3763823A1 (en) * | 2016-08-16 | 2021-01-13 | Touchlight IP Limited | Closed linear dna production |
TW201936201A (zh) * | 2017-12-14 | 2019-09-16 | 美商堅固生物科技公司 | 基因之非病毒生產及遞送 |
WO2019217785A1 (en) * | 2018-05-10 | 2019-11-14 | St. Jude Children's Research Hospital, Inc. | High-throughput method for characterizing the genome-wide activity of editing nucleases in vitro |
-
2020
- 2020-12-17 WO PCT/EP2020/086887 patent/WO2021123062A1/en unknown
- 2020-12-17 EP EP20833854.1A patent/EP4077661A1/en active Pending
- 2020-12-17 JP JP2022535868A patent/JP2023506631A/ja active Pending
- 2020-12-17 AU AU2020407850A patent/AU2020407850A1/en active Pending
- 2020-12-17 CA CA3161280A patent/CA3161280A1/en active Pending
-
2022
- 2022-06-17 US US17/843,612 patent/US20220333100A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP4077661A1 (en) | 2022-10-26 |
AU2020407850A1 (en) | 2022-06-30 |
US20220333100A1 (en) | 2022-10-20 |
WO2021123062A1 (en) | 2021-06-24 |
CA3161280A1 (en) | 2021-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11692213B2 (en) | Compositions and methods for targeted depletion, enrichment, and partitioning of nucleic acids using CRISPR/Cas system proteins | |
AU2016319110B2 (en) | Full interrogation of nuclease DSBs and sequencing (FIND-seq) | |
JP2020191885A (ja) | シークエンシングによって評価されるゲノムワイドでバイアスのないDSBの同定(GUIDE−Seq) | |
JP2023506631A (ja) | 共有結合で閉端された核酸分子末端を使用したngsライブラリー調製 | |
US20230056763A1 (en) | Methods of targeted sequencing | |
JP7460539B2 (ja) | 核酸を結合、修飾、および切断する物質の基質選択性および部位のためのin vitroでの高感度アッセイ | |
US20220389416A1 (en) | COMPOSITIONS AND METHODS FOR CONSTRUCTING STRAND SPECIFIC cDNA LIBRARIES | |
JP7530355B2 (ja) | エンドヌクレアーゼ保護による標的化濃縮 | |
WO2018227025A1 (en) | Creation and use of guide nucleic acids | |
JP6063443B2 (ja) | トランスジーン境界の高スループット分析 | |
US11371095B2 (en) | High-throughput method for characterizing the genome-wide activity of editing nucleases in vitro (Change-Seq) | |
US20210198719A1 (en) | Nucleic acid sequence enrichment by defined nucleic acid-directed endonuclease digestion | |
US20230407366A1 (en) | Targeted sequence addition | |
WO2024121354A1 (en) | Duplex sequencing with covalently closed dna ends | |
US20240002904A1 (en) | Targeted enrichment using nanopore selective sequencing | |
WO2024209000A1 (en) | Linkers for duplex sequencing | |
CN117015602A (zh) | 分析细胞中蛋白质编码变体的表达 | |
WO2023137292A1 (en) | Methods and compositions for transcriptome analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231214 |