JP2023508795A - Dnaおよびrna修飾の濃縮および検出のための方法およびキット、ならびに機能モチーフ - Google Patents
Dnaおよびrna修飾の濃縮および検出のための方法およびキット、ならびに機能モチーフ Download PDFInfo
- Publication number
- JP2023508795A JP2023508795A JP2021569030A JP2021569030A JP2023508795A JP 2023508795 A JP2023508795 A JP 2023508795A JP 2021569030 A JP2021569030 A JP 2021569030A JP 2021569030 A JP2021569030 A JP 2021569030A JP 2023508795 A JP2023508795 A JP 2023508795A
- Authority
- JP
- Japan
- Prior art keywords
- nucleic acid
- acid molecule
- sequencing
- dna
- primers
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 192
- 238000001514 detection method Methods 0.000 title description 13
- 230000026279 RNA modification Effects 0.000 title description 7
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 246
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 242
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 242
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 63
- 239000002773 nucleotide Substances 0.000 claims abstract description 58
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 50
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 50
- 230000003321 amplification Effects 0.000 claims abstract description 30
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 30
- 238000013507 mapping Methods 0.000 claims abstract description 24
- 101100175482 Glycine max CG-3 gene Proteins 0.000 claims abstract description 21
- 230000000295 complement effect Effects 0.000 claims abstract description 11
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 135
- 108020004414 DNA Proteins 0.000 claims description 96
- 238000012163 sequencing technique Methods 0.000 claims description 92
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 claims description 81
- 239000000523 sample Substances 0.000 claims description 80
- 229940035893 uracil Drugs 0.000 claims description 40
- 229940104302 cytosine Drugs 0.000 claims description 34
- 238000006243 chemical reaction Methods 0.000 claims description 33
- 108010077544 Chromatin Proteins 0.000 claims description 31
- 210000003483 chromatin Anatomy 0.000 claims description 31
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 claims description 29
- 238000004458 analytical method Methods 0.000 claims description 28
- 102000004190 Enzymes Human genes 0.000 claims description 23
- 108090000790 Enzymes Proteins 0.000 claims description 23
- 102100040263 DNA dC->dU-editing enzyme APOBEC-3A Human genes 0.000 claims description 21
- 101000964378 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3A Proteins 0.000 claims description 21
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims description 20
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 claims description 20
- 230000004048 modification Effects 0.000 claims description 19
- 238000012986 modification Methods 0.000 claims description 19
- 238000011282 treatment Methods 0.000 claims description 18
- 108090000623 proteins and genes Proteins 0.000 claims description 16
- 102000004169 proteins and genes Human genes 0.000 claims description 14
- BLQMCTXZEMGOJM-UHFFFAOYSA-N 5-carboxycytosine Chemical compound NC=1NC(=O)N=CC=1C(O)=O BLQMCTXZEMGOJM-UHFFFAOYSA-N 0.000 claims description 13
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 13
- 210000004027 cell Anatomy 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 13
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 12
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 claims description 12
- 238000002487 chromatin immunoprecipitation Methods 0.000 claims description 12
- FHSISDGOVSHJRW-UHFFFAOYSA-N 5-formylcytosine Chemical compound NC1=NC(=O)NC=C1C=O FHSISDGOVSHJRW-UHFFFAOYSA-N 0.000 claims description 11
- 102000053602 DNA Human genes 0.000 claims description 11
- 201000010099 disease Diseases 0.000 claims description 11
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 11
- 239000012634 fragment Substances 0.000 claims description 11
- 230000037452 priming Effects 0.000 claims description 11
- 239000000090 biomarker Substances 0.000 claims description 10
- 229960002685 biotin Drugs 0.000 claims description 10
- 235000020958 biotin Nutrition 0.000 claims description 10
- 239000011616 biotin Substances 0.000 claims description 10
- 238000001712 DNA sequencing Methods 0.000 claims description 9
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims description 9
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 claims description 9
- 101000653360 Homo sapiens Methylcytosine dioxygenase TET1 Proteins 0.000 claims description 9
- 238000009396 hybridization Methods 0.000 claims description 9
- 239000007787 solid Substances 0.000 claims description 9
- 238000007619 statistical method Methods 0.000 claims description 9
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims description 7
- 102100030819 Methylcytosine dioxygenase TET1 Human genes 0.000 claims description 7
- -1 Phi29 polymerase Proteins 0.000 claims description 7
- 238000011529 RT qPCR Methods 0.000 claims description 7
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical group O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 claims description 7
- 230000027455 binding Effects 0.000 claims description 7
- 230000008439 repair process Effects 0.000 claims description 7
- 108030004080 Methylcytosine dioxygenases Proteins 0.000 claims description 6
- 150000002500 ions Chemical class 0.000 claims description 6
- 235000019689 luncheon sausage Nutrition 0.000 claims description 6
- 239000011807 nanoball Substances 0.000 claims description 6
- 238000012175 pyrosequencing Methods 0.000 claims description 6
- 239000004065 semiconductor Substances 0.000 claims description 6
- 230000005945 translocation Effects 0.000 claims description 6
- 241000713869 Moloney murine leukemia virus Species 0.000 claims description 5
- 238000004132 cross linking Methods 0.000 claims description 5
- 230000001575 pathological effect Effects 0.000 claims description 5
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical class O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 claims description 4
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 claims description 4
- 108010033040 Histones Proteins 0.000 claims description 4
- 102000006947 Histones Human genes 0.000 claims description 4
- 108010006785 Taq Polymerase Proteins 0.000 claims description 4
- 239000012472 biological sample Substances 0.000 claims description 4
- 230000002068 genetic effect Effects 0.000 claims description 4
- 239000000203 mixture Substances 0.000 claims description 4
- 210000001519 tissue Anatomy 0.000 claims description 4
- VGONTNSXDCQUGY-RRKCRQDMSA-N 2'-deoxyinosine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=CNC2=O)=C2N=C1 VGONTNSXDCQUGY-RRKCRQDMSA-N 0.000 claims description 3
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 claims description 3
- LOJNBPNACKZWAI-UHFFFAOYSA-N 3-nitro-1h-pyrrole Chemical compound [O-][N+](=O)C=1C=CNC=1 LOJNBPNACKZWAI-UHFFFAOYSA-N 0.000 claims description 3
- OZFPSOBLQZPIAV-UHFFFAOYSA-N 5-nitro-1h-indole Chemical compound [O-][N+](=O)C1=CC=C2NC=CC2=C1 OZFPSOBLQZPIAV-UHFFFAOYSA-N 0.000 claims description 3
- 241000282412 Homo Species 0.000 claims description 3
- 102100034343 Integrase Human genes 0.000 claims description 3
- 241000699670 Mus sp. Species 0.000 claims description 3
- 241000224436 Naegleria Species 0.000 claims description 3
- MRWXACSTFXYYMV-UHFFFAOYSA-N Nebularine Natural products OC1C(O)C(CO)OC1N1C2=NC=NC=C2N=C1 MRWXACSTFXYYMV-UHFFFAOYSA-N 0.000 claims description 3
- 108010002747 Pfu DNA polymerase Proteins 0.000 claims description 3
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 claims description 3
- 125000000217 alkyl group Chemical group 0.000 claims description 3
- IVRMZWNICZWHMI-UHFFFAOYSA-N azide group Chemical group [N-]=[N+]=[N-] IVRMZWNICZWHMI-UHFFFAOYSA-N 0.000 claims description 3
- MRWXACSTFXYYMV-FDDDBJFASA-N nebularine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC=C2N=C1 MRWXACSTFXYYMV-FDDDBJFASA-N 0.000 claims description 3
- 238000010008 shearing Methods 0.000 claims description 3
- 235000000346 sugar Nutrition 0.000 claims description 3
- QUHGSDZVAPFNLV-UHFFFAOYSA-N 4-[(5-acetamidofuran-2-carbonyl)amino]-n-[3-(dimethylamino)propyl]-1-propylpyrrole-2-carboxamide Chemical compound C1=C(C(=O)NCCCN(C)C)N(CCC)C=C1NC(=O)C1=CC=C(NC(C)=O)O1 QUHGSDZVAPFNLV-UHFFFAOYSA-N 0.000 claims description 2
- 241000271566 Aves Species 0.000 claims description 2
- 108010001572 Basic-Leucine Zipper Transcription Factors Proteins 0.000 claims description 2
- 102000000806 Basic-Leucine Zipper Transcription Factors Human genes 0.000 claims description 2
- 108010017826 DNA Polymerase I Proteins 0.000 claims description 2
- 230000004568 DNA-binding Effects 0.000 claims description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 claims description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 claims description 2
- 102000000340 Glucosyltransferases Human genes 0.000 claims description 2
- 108010055629 Glucosyltransferases Proteins 0.000 claims description 2
- 108010036115 Histone Methyltransferases Proteins 0.000 claims description 2
- 102000011787 Histone Methyltransferases Human genes 0.000 claims description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims description 2
- DWAQJAXMDSEUJJ-UHFFFAOYSA-M Sodium bisulfite Chemical compound [Na+].OS([O-])=O DWAQJAXMDSEUJJ-UHFFFAOYSA-M 0.000 claims description 2
- 241000700605 Viruses Species 0.000 claims description 2
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 claims description 2
- 102000023732 binding proteins Human genes 0.000 claims description 2
- 108091008324 binding proteins Proteins 0.000 claims description 2
- 238000013506 data mapping Methods 0.000 claims description 2
- 239000012133 immunoprecipitate Substances 0.000 claims description 2
- 230000003834 intracellular effect Effects 0.000 claims description 2
- 108700009084 lexitropsin Proteins 0.000 claims description 2
- 238000002844 melting Methods 0.000 claims description 2
- 230000008018 melting Effects 0.000 claims description 2
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 claims description 2
- 238000000630 nucleic acid simulation Methods 0.000 claims description 2
- 230000007115 recruitment Effects 0.000 claims description 2
- 235000010267 sodium hydrogen sulphite Nutrition 0.000 claims description 2
- 238000001308 synthesis method Methods 0.000 claims description 2
- 229910052725 zinc Inorganic materials 0.000 claims description 2
- 239000011701 zinc Substances 0.000 claims description 2
- 125000000548 ribosyl group Chemical class C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 claims 1
- 238000012165 high-throughput sequencing Methods 0.000 abstract description 9
- 230000011987 methylation Effects 0.000 description 18
- 238000007069 methylation reaction Methods 0.000 description 18
- 238000003752 polymerase chain reaction Methods 0.000 description 18
- 238000001369 bisulfite sequencing Methods 0.000 description 15
- 238000002360 preparation method Methods 0.000 description 8
- 238000000018 DNA microarray Methods 0.000 description 7
- 102000040430 polynucleotide Human genes 0.000 description 7
- 108091033319 polynucleotide Proteins 0.000 description 7
- 239000002157 polynucleotide Substances 0.000 description 7
- 108091029523 CpG island Proteins 0.000 description 6
- 206010028980 Neoplasm Diseases 0.000 description 6
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 6
- 238000013461 design Methods 0.000 description 6
- 238000006073 displacement reaction Methods 0.000 description 6
- 239000000047 product Substances 0.000 description 6
- 230000008836 DNA modification Effects 0.000 description 5
- 238000003556 assay Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 201000011510 cancer Diseases 0.000 description 5
- 230000009615 deamination Effects 0.000 description 5
- 238000006481 deamination reaction Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 4
- 241000713838 Avian myeloblastosis virus Species 0.000 description 4
- 108091029430 CpG site Proteins 0.000 description 4
- 230000007067 DNA methylation Effects 0.000 description 4
- 108060002716 Exonuclease Proteins 0.000 description 4
- 230000003197 catalytic effect Effects 0.000 description 4
- 102000013165 exonuclease Human genes 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 238000007481 next generation sequencing Methods 0.000 description 4
- 238000005096 rolling process Methods 0.000 description 4
- 238000007397 LAMP assay Methods 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 238000012408 PCR amplification Methods 0.000 description 3
- 108010090804 Streptavidin Proteins 0.000 description 3
- 108091023040 Transcription factor Proteins 0.000 description 3
- 102000040945 Transcription factor Human genes 0.000 description 3
- 230000032683 aging Effects 0.000 description 3
- 238000004873 anchoring Methods 0.000 description 3
- 238000001574 biopsy Methods 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000013595 glycosylation Effects 0.000 description 3
- 238000006206 glycosylation reaction Methods 0.000 description 3
- 238000007855 methylation-specific PCR Methods 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 3
- POQQFTOTXNRFIL-UHFFFAOYSA-N (2-oxo-1h-pyrimidin-6-yl)carbamic acid Chemical compound OC(=O)NC1=CC=NC(=O)N1 POQQFTOTXNRFIL-UHFFFAOYSA-N 0.000 description 2
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 2
- HWPZZUQOWRWFDB-UHFFFAOYSA-N 1-methylcytosine Chemical compound CN1C=CC(N)=NC1=O HWPZZUQOWRWFDB-UHFFFAOYSA-N 0.000 description 2
- MJEQLGCFPLHMNV-UHFFFAOYSA-N 4-amino-1-(hydroxymethyl)pyrimidin-2-one Chemical compound NC=1C=CN(CO)C(=O)N=1 MJEQLGCFPLHMNV-UHFFFAOYSA-N 0.000 description 2
- 229930024421 Adenine Natural products 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 2
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 2
- 101100170601 Drosophila melanogaster Tet gene Proteins 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- 101710149086 Nuclease S1 Proteins 0.000 description 2
- 238000002944 PCR assay Methods 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 229960000643 adenine Drugs 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 210000001124 body fluid Anatomy 0.000 description 2
- 125000002680 canonical nucleotide group Chemical group 0.000 description 2
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 2
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 2
- 238000002405 diagnostic procedure Methods 0.000 description 2
- 230000001973 epigenetic effect Effects 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 230000030279 gene silencing Effects 0.000 description 2
- 238000012226 gene silencing method Methods 0.000 description 2
- 238000012252 genetic analysis Methods 0.000 description 2
- 229910052588 hydroxylapatite Inorganic materials 0.000 description 2
- 239000003607 modifier Substances 0.000 description 2
- 210000004789 organ system Anatomy 0.000 description 2
- 230000007170 pathology Effects 0.000 description 2
- XYJRXVWERLGGKC-UHFFFAOYSA-D pentacalcium;hydroxide;triphosphate Chemical compound [OH-].[Ca+2].[Ca+2].[Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O XYJRXVWERLGGKC-UHFFFAOYSA-D 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 238000010839 reverse transcription Methods 0.000 description 2
- 239000000377 silicon dioxide Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 229940104230 thymidine Drugs 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 238000012070 whole genome sequencing analysis Methods 0.000 description 2
- AUTOLBMXDDTRRT-JGVFFNPUSA-N (4R,5S)-dethiobiotin Chemical compound C[C@@H]1NC(=O)N[C@@H]1CCCCCC(O)=O AUTOLBMXDDTRRT-JGVFFNPUSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- HCGYMSSYSAKGPK-UHFFFAOYSA-N 2-nitro-1h-indole Chemical compound C1=CC=C2NC([N+](=O)[O-])=CC2=C1 HCGYMSSYSAKGPK-UHFFFAOYSA-N 0.000 description 1
- 108010079649 APOBEC-1 Deaminase Proteins 0.000 description 1
- 108010004483 APOBEC-3G Deaminase Proteins 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 208000024827 Alzheimer disease Diseases 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 101001029785 Aspergillus flavus (strain ATCC 200026 / FGSC A1120 / IAM 13836 / NRRL 3357 / JCM 12722 / SRRC 167) Alpha-ketoglutarate-dependent oxygenase Proteins 0.000 description 1
- 206010003694 Atrophy Diseases 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 102100040397 C->U-editing enzyme APOBEC-1 Human genes 0.000 description 1
- 102100040399 C->U-editing enzyme APOBEC-2 Human genes 0.000 description 1
- 102100034808 CCAAT/enhancer-binding protein alpha Human genes 0.000 description 1
- 108010014064 CCCTC-Binding Factor Proteins 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 241001466804 Carnivora Species 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 108091028732 Concatemer Proteins 0.000 description 1
- 208000020406 Creutzfeldt Jacob disease Diseases 0.000 description 1
- 208000003407 Creutzfeldt-Jakob Syndrome Diseases 0.000 description 1
- 208000010859 Creutzfeldt-Jakob disease Diseases 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- 102100026846 Cytidine deaminase Human genes 0.000 description 1
- 108010031325 Cytidine deaminase Proteins 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 102100040262 DNA dC->dU-editing enzyme APOBEC-3B Human genes 0.000 description 1
- 102100040261 DNA dC->dU-editing enzyme APOBEC-3C Human genes 0.000 description 1
- 102100040264 DNA dC->dU-editing enzyme APOBEC-3D Human genes 0.000 description 1
- 102100040266 DNA dC->dU-editing enzyme APOBEC-3F Human genes 0.000 description 1
- 102100038076 DNA dC->dU-editing enzyme APOBEC-3G Human genes 0.000 description 1
- 102100038050 DNA dC->dU-editing enzyme APOBEC-3H Human genes 0.000 description 1
- 101710082737 DNA dC->dU-editing enzyme APOBEC-3H Proteins 0.000 description 1
- 230000030933 DNA methylation on cytosine Effects 0.000 description 1
- 206010058314 Dysplasia Diseases 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 241000701533 Escherichia virus T4 Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- CWYNVVGOOAEACU-UHFFFAOYSA-N Fe2+ Chemical compound [Fe+2] CWYNVVGOOAEACU-UHFFFAOYSA-N 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 208000024412 Friedreich ataxia Diseases 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 241000282575 Gorilla Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 102100039869 Histone H2B type F-S Human genes 0.000 description 1
- 101000964322 Homo sapiens C->U-editing enzyme APOBEC-2 Proteins 0.000 description 1
- 101000945515 Homo sapiens CCAAT/enhancer-binding protein alpha Proteins 0.000 description 1
- 101000964385 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3B Proteins 0.000 description 1
- 101000964383 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3C Proteins 0.000 description 1
- 101000964382 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3D Proteins 0.000 description 1
- 101000964377 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3F Proteins 0.000 description 1
- 101001035372 Homo sapiens Histone H2B type F-S Proteins 0.000 description 1
- 101000653374 Homo sapiens Methylcytosine dioxygenase TET2 Proteins 0.000 description 1
- 101000653369 Homo sapiens Methylcytosine dioxygenase TET3 Proteins 0.000 description 1
- 101000800426 Homo sapiens Putative C->U-editing enzyme APOBEC-4 Proteins 0.000 description 1
- 208000025500 Hutchinson-Gilford progeria syndrome Diseases 0.000 description 1
- 206010020880 Hypertrophy Diseases 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 241000283953 Lagomorpha Species 0.000 description 1
- 238000000585 Mann–Whitney U test Methods 0.000 description 1
- 102000006890 Methyl-CpG-Binding Protein 2 Human genes 0.000 description 1
- 108010072388 Methyl-CpG-Binding Protein 2 Proteins 0.000 description 1
- 102100030803 Methylcytosine dioxygenase TET2 Human genes 0.000 description 1
- 102100030812 Methylcytosine dioxygenase TET3 Human genes 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 241000714177 Murine leukemia virus Species 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 241000224437 Naegleria gruberi Species 0.000 description 1
- 208000012902 Nervous system disease Diseases 0.000 description 1
- 208000025966 Neurological disease Diseases 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 241000282579 Pan Species 0.000 description 1
- 241000282520 Papio Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 108091093037 Peptide nucleic acid Proteins 0.000 description 1
- 241000283089 Perissodactyla Species 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- 208000007932 Progeria Diseases 0.000 description 1
- 102100033091 Putative C->U-editing enzyme APOBEC-4 Human genes 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 101710088729 Single-stranded nucleic acid-binding protein Proteins 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 241001493546 Suina Species 0.000 description 1
- LSNNMFCWUKXFEE-UHFFFAOYSA-N Sulfurous acid Chemical class OS(O)=O LSNNMFCWUKXFEE-UHFFFAOYSA-N 0.000 description 1
- 102100027671 Transcriptional repressor CTCF Human genes 0.000 description 1
- 102000008579 Transposases Human genes 0.000 description 1
- 108010020764 Transposases Proteins 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000002152 alkylating effect Effects 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 206010002026 amyotrophic lateral sclerosis Diseases 0.000 description 1
- 238000000540 analysis of variance Methods 0.000 description 1
- 230000037444 atrophy Effects 0.000 description 1
- 150000001540 azides Chemical class 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 108020001778 catalytic domains Proteins 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000000356 contaminant Substances 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000001079 digestive effect Effects 0.000 description 1
- VHILMKFSCRWWIJ-UHFFFAOYSA-N dimethyl acetylenedicarboxylate Chemical compound COC(=O)C#CC(=O)OC VHILMKFSCRWWIJ-UHFFFAOYSA-N 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 230000002124 endocrine Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000005558 fluorometry Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 238000013412 genome amplification Methods 0.000 description 1
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 210000002216 heart Anatomy 0.000 description 1
- 238000003505 heat denaturation Methods 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-M hydrogensulfate Chemical compound OS([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-M 0.000 description 1
- 125000004029 hydroxymethyl group Chemical group [H]OC([H])([H])* 0.000 description 1
- 238000007031 hydroxymethylation reaction Methods 0.000 description 1
- 230000006607 hypermethylation Effects 0.000 description 1
- 206010020718 hyperplasia Diseases 0.000 description 1
- 238000001114 immunoprecipitation Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 210000001613 integumentary system Anatomy 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 238000012417 linear regression Methods 0.000 description 1
- 108700041430 link Proteins 0.000 description 1
- 238000011528 liquid biopsy Methods 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 201000006417 multiple sclerosis Diseases 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 230000003387 muscular Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 230000007171 neuropathology Effects 0.000 description 1
- 102000044158 nucleic acid binding protein Human genes 0.000 description 1
- 108700020942 nucleic acid binding protein Proteins 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 238000007427 paired t-test Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 210000002381 plasma Anatomy 0.000 description 1
- 230000002028 premature Effects 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 238000000611 regression analysis Methods 0.000 description 1
- 230000001850 reproductive effect Effects 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 150000003290 ribose derivatives Chemical class 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 238000001629 sign test Methods 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 101150118377 tet gene Proteins 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 230000002485 urinary effect Effects 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6858—Allele-specific amplification
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Immunology (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Physics & Mathematics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本明細書では、核酸内の修飾ヌクレオチド残基をマッピングする方法が提供される。方法は、非標的または標的の修飾および未修飾ヌクレオチド残基が変換されて別のヌクレオチドを形成している(たとえば「C」が「T」に変換されている)核酸試料を準備することを含む。次に、該変換核酸について、1組のアンカー塩基プライマーを用いて、第2鎖合成を実施する。このアンカー塩基プライマーの組の各プライマーは、3'末端に標的ヌクレオチドに相補的な1つまたは複数のアンカー塩基(たとえば「G」または「CpG」)、および完全にまたは部分的に縮重した配列の組であり得る1組の配列から選択されるヌクレオチドの配列を含む。たとえば該配列は、5'-XnG-3'および/または5'-X(n-1)CG-3'であり得、Xは任意の塩基であり、n = 2~25である。二本鎖核酸産物を、たとえば増幅およびハイスループットシーケンシングにより分析することができる。
Description
関連出願の相互参照
本願は、2019年12月23日に出願された米国特許仮出願第62/953,080号の優先日の恩典を主張するものであり、その内容の全文が参照により本明細書に組み入れられる。
本願は、2019年12月23日に出願された米国特許仮出願第62/953,080号の優先日の恩典を主張するものであり、その内容の全文が参照により本明細書に組み入れられる。
背景
エピジェネティクスとは、遺伝子の違いの結果ではない、細胞間および生物間の表現型の違いを指す。DNAのメチル化のパターンは、表現型のエピジェネティック的違いを生じさせ得、たとえば遺伝子発現パターンの変化をもたらす。DNAのメチル化は、典型的にはシトシン残基に生じる。これには、たとえば、5位炭素におけるメチル化が含まれる。このメチル化の形態としては、5-メチルシトシン(「5mC」)および5-ヒドロキシメチルシトシン(「5hmC」)が挙げられる。5-メチルシトシンのもっと酸化された形態としては、5-ホルミルシトシン(「5fC」)および5-カルボキシシトシン(「5caC」)が挙げられる。シトシンのメチル化は、典型的にはCpG部位で生じ、そこではヌクレオチド配列は「CG」である。CpG部位は、「CpGアイランド」と呼ばれるクラスターとして生じる傾向がある。ヒトでは、遺伝子プロモーターの約70%がCpGアイランドを含んでいる。プロモーターのCpGアイランドに複数のメチル化CpG部位が存在することにより、安定した遺伝子サイレンシングがもたらされる。メチル化は、がんおよび老化との関連が知られている。がんでは、遺伝子サイレンシングは、プロモーターアイランドの過剰なメチル化のせいであり得る。
エピジェネティクスとは、遺伝子の違いの結果ではない、細胞間および生物間の表現型の違いを指す。DNAのメチル化のパターンは、表現型のエピジェネティック的違いを生じさせ得、たとえば遺伝子発現パターンの変化をもたらす。DNAのメチル化は、典型的にはシトシン残基に生じる。これには、たとえば、5位炭素におけるメチル化が含まれる。このメチル化の形態としては、5-メチルシトシン(「5mC」)および5-ヒドロキシメチルシトシン(「5hmC」)が挙げられる。5-メチルシトシンのもっと酸化された形態としては、5-ホルミルシトシン(「5fC」)および5-カルボキシシトシン(「5caC」)が挙げられる。シトシンのメチル化は、典型的にはCpG部位で生じ、そこではヌクレオチド配列は「CG」である。CpG部位は、「CpGアイランド」と呼ばれるクラスターとして生じる傾向がある。ヒトでは、遺伝子プロモーターの約70%がCpGアイランドを含んでいる。プロモーターのCpGアイランドに複数のメチル化CpG部位が存在することにより、安定した遺伝子サイレンシングがもたらされる。メチル化は、がんおよび老化との関連が知られている。がんでは、遺伝子サイレンシングは、プロモーターアイランドの過剰なメチル化のせいであり得る。
DNAのメチル化パターンのマッピングは、重要研究分野になっている。現在いくつかのマッピングが使用されている。これらの方法に共通のアプローチは、DNA分子内の様々な形態のシトシンをウラシルに変換すること、変換された分子のシーケンシングを行うこと、および得られた配列を無変換分子の配列と、またはゲノムデータベース中の配列と、たとえばマッピング技法により比較することである。
メチル化パターンのマッピングの最も一般的な方法の一つが、バイサルファイトシーケンシングである。DNAをバイサルファイトで処理すると、シトシン残基がウラシルに変換されるが、5-メチルシトシンまたは5-ヒドロキシメチルシトシン残基は変換されない。これには4-アミノ基の4-カルボニル基への変換が関与しているため、このプロセスは、脱アミノ化とも呼ばれている。第2鎖の合成で、Gは導入されたUと対を形成し、増幅中は「CG」ではなく「TA」として増える。マッピング後、配列内の「C」の存在は、もとの未修飾の5-メチルシトシンまたは5-ヒドロキシメチルシトシンを表す。「T」の存在は、もとの「C」(または5-ホルミルシトシンもしくは5-カルボキシシトシン)を表す。
このストラテジーのバリエーションとしては、テン-イレブン転座メチルシトシンジオキシゲナーゼ(「TET」)および/またはAPOBEC3A(「A3A」)の使用が挙げられる。TETは、5mC、5hmC、および5fCを5caCに変換する。バイサルファイトは、5caCをウラシルに変換することができる。たとえばグルコシル化により5hmC基を保護する方法と併せると、A3Aは、Cおよび5mCをウラシルに変換するが、5hmCを変換しない。グルコシル化は、たとえばT4ベータ-グルコシル-トランスフェラーゼにより実施され得る。5mCまたは5hmCだけのマッピングのストラテジーを考案することができる。
様々な脱アミノ化ストラテジーにより処理したDNAの配列を決定して、DNA内のメチル化部位をマッピングすることができる。そのような方法の一つは、全ゲノムシーケンシングである。しかし、ゲノム内のメチル化パターンの位置を突き止めることができるかぎりでは、全ゲノムシーケンシングは非効率的であり得る。メチル化などの修飾を含むDNAに関するDNA濃縮の方法は公知である。
既存のエピジェネティクス技術は、以下のものなどの、特定の核酸修飾、たとえばメチル化を濃縮し、シーケンシングを行い、かつ/または検出するいくつかの方法を含む。
1.メチル化CpGを特異的に認識する能力のある修飾特異的抗体またはタンパク質/タンパク質ドメインを利用した濃縮ベースの方法(MeDIPおよびMBD-Seq/MIRA-Seq/メチルキャップ-seq)
2.全ゲノムバイサルファイトシーケンシング
3.リデュースト・レプリゼンテーション(Reduced representation)バイサルファイトシーケンシング
4.メチル化特異的(q)PCR
5.バイサルファイト-PCR
1.メチル化CpGを特異的に認識する能力のある修飾特異的抗体またはタンパク質/タンパク質ドメインを利用した濃縮ベースの方法(MeDIPおよびMBD-Seq/MIRA-Seq/メチルキャップ-seq)
2.全ゲノムバイサルファイトシーケンシング
3.リデュースト・レプリゼンテーション(Reduced representation)バイサルファイトシーケンシング
4.メチル化特異的(q)PCR
5.バイサルファイト-PCR
たとえばJames G. Herman et al.の“Methylation-specific PCR: a novel PCR assay for methylation status of CpG islands” PNAS (1996)(非特許文献1)を参照されたい。
James G. Herman et al."Methylation-specific PCR: a novel PCR assay for methylation status of CpG islands" PNAS (1996)
本明細書に組み入れられ、かつその一部を形成する添付の図面は、例示的態様を説明するほか、本明細書とともに、これらの態様および当業者には明白になるその他の態様をなし、かつ使用することができるよう、さらに役立つ。以下の図面とともに、本発明をより具体的に記載していく。
概要
本明細書では、修飾塩基を含む核酸分子を分析する方法が提供される。方法は、核酸内のシトシンなどの1つまたは複数の非標的塩基をウラシルなどの別の塩基に変換すること、それからGまたはCpGの3’アンカー塩基を有するプライマー(典型的には1組の縮重プライマー)を用いて第2鎖合成を実施することを含む。第2鎖合成の産物は、非標的塩基がアンカー「G」をもつプライマーの鋳型になれない「U」に変換されている結果として、標的塩基(たとえばメチルシトシンまたはヒドロキシメチルシトシン)を含む配列が濃縮されている、1組の二本鎖核酸分子である。
本明細書では、修飾塩基を含む核酸分子を分析する方法が提供される。方法は、核酸内のシトシンなどの1つまたは複数の非標的塩基をウラシルなどの別の塩基に変換すること、それからGまたはCpGの3’アンカー塩基を有するプライマー(典型的には1組の縮重プライマー)を用いて第2鎖合成を実施することを含む。第2鎖合成の産物は、非標的塩基がアンカー「G」をもつプライマーの鋳型になれない「U」に変換されている結果として、標的塩基(たとえばメチルシトシンまたはヒドロキシメチルシトシン)を含む配列が濃縮されている、1組の二本鎖核酸分子である。
詳細な説明
I.はじめに
本明細書で提供される方法、具体的にはABBS態様は、以下を含めいくつかの点で既存の技術よりも優れている。
1.)関心対象の修飾が見出されるDNAまたはRNAの領域のみを濃縮することで、シーケンシングによるDNA/RNA修飾の分析のコストを低減する。これは、関心対象の部位の高いデータカバレッジを得るのにあまり深いシーケンシングを行う必要がないことを意味する。
2.)アンカー塩基ランダムプライミング(一般的な修飾バイアス増幅ストラテジー)を塩基対特異的プローブと組み合わせることにより、診断アッセイの設計が簡易化される。
3.)この方法ではDNA/RNA修飾の密度が潜在的に高い領域を濃縮するので、DNAまたはRNA修飾をマッピングするのにピーク抽出アプローチを、ならびにABBSデータに対しバイサルファイト分析(C→T転換)を使用できるため、分析が簡易化される。
I.はじめに
本明細書で提供される方法、具体的にはABBS態様は、以下を含めいくつかの点で既存の技術よりも優れている。
1.)関心対象の修飾が見出されるDNAまたはRNAの領域のみを濃縮することで、シーケンシングによるDNA/RNA修飾の分析のコストを低減する。これは、関心対象の部位の高いデータカバレッジを得るのにあまり深いシーケンシングを行う必要がないことを意味する。
2.)アンカー塩基ランダムプライミング(一般的な修飾バイアス増幅ストラテジー)を塩基対特異的プローブと組み合わせることにより、診断アッセイの設計が簡易化される。
3.)この方法ではDNA/RNA修飾の密度が潜在的に高い領域を濃縮するので、DNAまたはRNA修飾をマッピングするのにピーク抽出アプローチを、ならびにABBSデータに対しバイサルファイト分析(C→T転換)を使用できるため、分析が簡易化される。
本明細書で開示されるのは、関心対象の(たとえば細菌、ウイルス、ヒト)ゲノム全体で、バイサルファイト修飾DNAを濃縮する、特定する、かつマッピングする方法である。方法はまた、以下に詳述するように、バイサルファイトを使わないシトシン分析法とも両立できる。
既存の技術と比較して、これらの方法、具体的にはABBS態様の4つのユニークな局面としては、以下が挙げられる。
1.)(MeDIPまたはhMeDIPのように)抗体または(MIRA-SeqにおけるMBD2b/MBD3L、およびメチルキャップ-seqにおけるMeCP2などの)修飾特異的結合タンパク質を使う必要なしに、全ゲノムから修飾シトシン(たとえばメチル化CpG)を濃縮しかつ一塩基分解能によりシーケンシングを行う手段の提供。
2.)(メチル化特異的PCRアッセイのように)ゲノム内の所定の部位に対する特異的なプライマーを設計する必要なしに、修飾シトシンを増幅しかつ検出する手段の提供。
3.)多重診断アッセイに組み入れられる能力。DNA/RNA修飾部位から増幅する高度に一般化されたスキームを提供することにより、関心対象の領域に特異的なプライマーおよびプローブの組ではなく、関心対象の領域の特異性プローブ(たとえば、TaqManハイブリダイゼーションプローブ)を設計するだけでよくなる。したがって、このストラテジーはアッセイ設計をかなり簡易化する。
4.)ゲノム全体の5mCおよび5hmCまたは他の「oxi-mC」(5hmC、5fC、および5caC)の分布を分析する酵素的方法と完全に統合される能力(たとえばTET支援バイサルファイトシーケンシングおよびAPOBEC結合(coupled)エピジェネティックシーケンシング(ACE-Seq))。一方、MeDIP、hMeDIP、MIRA-Seq、またはメチルキャップ-seqのような技法は、(1)これらがABBSのような一塩基分解能を提供しないため、(2)タンパク質によっては他の種と交差反応する場合があり(たとえばMeCP2は、5mCだけでなく5hmCも認識できる)、特異性が低くなるため、また(3)これらの技法はどれも、タンパク質も抗体も必要としないABBSの技法ほどユニバーサルではないため、それができない。
1.)(MeDIPまたはhMeDIPのように)抗体または(MIRA-SeqにおけるMBD2b/MBD3L、およびメチルキャップ-seqにおけるMeCP2などの)修飾特異的結合タンパク質を使う必要なしに、全ゲノムから修飾シトシン(たとえばメチル化CpG)を濃縮しかつ一塩基分解能によりシーケンシングを行う手段の提供。
2.)(メチル化特異的PCRアッセイのように)ゲノム内の所定の部位に対する特異的なプライマーを設計する必要なしに、修飾シトシンを増幅しかつ検出する手段の提供。
3.)多重診断アッセイに組み入れられる能力。DNA/RNA修飾部位から増幅する高度に一般化されたスキームを提供することにより、関心対象の領域に特異的なプライマーおよびプローブの組ではなく、関心対象の領域の特異性プローブ(たとえば、TaqManハイブリダイゼーションプローブ)を設計するだけでよくなる。したがって、このストラテジーはアッセイ設計をかなり簡易化する。
4.)ゲノム全体の5mCおよび5hmCまたは他の「oxi-mC」(5hmC、5fC、および5caC)の分布を分析する酵素的方法と完全に統合される能力(たとえばTET支援バイサルファイトシーケンシングおよびAPOBEC結合(coupled)エピジェネティックシーケンシング(ACE-Seq))。一方、MeDIP、hMeDIP、MIRA-Seq、またはメチルキャップ-seqのような技法は、(1)これらがABBSのような一塩基分解能を提供しないため、(2)タンパク質によっては他の種と交差反応する場合があり(たとえばMeCP2は、5mCだけでなく5hmCも認識できる)、特異性が低くなるため、また(3)これらの技法はどれも、タンパク質も抗体も必要としないABBSの技法ほどユニバーサルではないため、それができない。
本明細書に開示される方法は、以下を実現する。
1.)塩基対分解能により、バイサルファイト/APOBEC/AID感受性および非感受性DNAおよびRNA修飾を検出する高スループットの方法を可能にする。
2.)バイサルファイト/APOBEC/AIDクラスの酵素による修飾に抵抗性の部位(たとえばバイサルファイトはメチル化C、AID/APOBECクラスの酵素はグルコシル-hmCおよび5fC/5caC)において、核酸増幅のアンカリングの手段を提供し、これらのバイサルファイト/APOBEC/AID抵抗性の座からの迅速な全ゲノム増幅を促進する。
3.)DNA/RNA修飾の特異的かつ多重的検出を可能にするたとえばTaqManプローブ、分子ビーコン、パドロックプローブといった一般的な分子検出法の効率的な統合を可能にする。
4.)診断および臨床の用途でのバイサルファイト/Apobec3A感受性バイオマーカーの特定および追跡を可能にする。
1.)塩基対分解能により、バイサルファイト/APOBEC/AID感受性および非感受性DNAおよびRNA修飾を検出する高スループットの方法を可能にする。
2.)バイサルファイト/APOBEC/AIDクラスの酵素による修飾に抵抗性の部位(たとえばバイサルファイトはメチル化C、AID/APOBECクラスの酵素はグルコシル-hmCおよび5fC/5caC)において、核酸増幅のアンカリングの手段を提供し、これらのバイサルファイト/APOBEC/AID抵抗性の座からの迅速な全ゲノム増幅を促進する。
3.)DNA/RNA修飾の特異的かつ多重的検出を可能にするたとえばTaqManプローブ、分子ビーコン、パドロックプローブといった一般的な分子検出法の効率的な統合を可能にする。
4.)診断および臨床の用途でのバイサルファイト/Apobec3A感受性バイオマーカーの特定および追跡を可能にする。
たとえばAB HiC態様の追加のメリットが、本明細書で論じられる。
II.修飾シトシン残基を含む配列に関する核酸の濃縮
本明細書で提供される方法は、選択されたシトシン残基の修飾を有する核酸の濃縮を可能にする。濃縮は、より深い配列分析、およびより効率のよい修飾残基の特定を可能にする。方法は、非標的形態のシトシンを非シトシンヌクレオチド残基に変換すること、およびプライマーの3’位に「G」または「CG」残基を有する1組の縮重プライマーを用いて、残りのシトシン形態の残基を含む核酸分子の第2鎖を合成することを含み得る。プライマーの末端ヌクレオチドは、そこから伸長が進行するアンカーとして機能する。伸長は無変換シトシン残基から進行するので、標的シトシン修飾を含むゲノムの領域が濃縮されることになる。
本明細書で提供される方法は、選択されたシトシン残基の修飾を有する核酸の濃縮を可能にする。濃縮は、より深い配列分析、およびより効率のよい修飾残基の特定を可能にする。方法は、非標的形態のシトシンを非シトシンヌクレオチド残基に変換すること、およびプライマーの3’位に「G」または「CG」残基を有する1組の縮重プライマーを用いて、残りのシトシン形態の残基を含む核酸分子の第2鎖を合成することを含み得る。プライマーの末端ヌクレオチドは、そこから伸長が進行するアンカーとして機能する。伸長は無変換シトシン残基から進行するので、標的シトシン修飾を含むゲノムの領域が濃縮されることになる。
A.核酸を含む試料
核酸は、たとえばウイルス、またはあらゆる生命体の1つもしくは複数の細胞、もしくはミクロビオームを含め、あらゆる生物学的試料を供給源とし得る。これには原核生物(たとえば古細菌および細菌)および真核生物(たとえば植物、動物、および真菌)の両方が含まれる。動物としては、限定ではないが、昆虫類、魚類、両生類、爬虫類、鳥類、および哺乳類が挙げられる。哺乳類としては、限定ではないが、肉食動物(たとえばイヌおよびネコ)、偶蹄目(たとえばウシ、ヤギ、ヒツジ、ブタ)、ウサギ類(たとえばウサギ)、奇蹄類(たとえばウマ)、げっ歯類(たとえばマウス、ラット)、および霊長類(たとえばヒトおよび非ヒト霊長類(たとえばサル、チンパンジー、ヒヒ、ゴリラ))が挙げられる。
核酸は、たとえばウイルス、またはあらゆる生命体の1つもしくは複数の細胞、もしくはミクロビオームを含め、あらゆる生物学的試料を供給源とし得る。これには原核生物(たとえば古細菌および細菌)および真核生物(たとえば植物、動物、および真菌)の両方が含まれる。動物としては、限定ではないが、昆虫類、魚類、両生類、爬虫類、鳥類、および哺乳類が挙げられる。哺乳類としては、限定ではないが、肉食動物(たとえばイヌおよびネコ)、偶蹄目(たとえばウシ、ヤギ、ヒツジ、ブタ)、ウサギ類(たとえばウサギ)、奇蹄類(たとえばウマ)、げっ歯類(たとえばマウス、ラット)、および霊長類(たとえばヒトおよび非ヒト霊長類(たとえばサル、チンパンジー、ヒヒ、ゴリラ))が挙げられる。
核酸は、細胞系、組織、器官、または体液に由来し得る。動物のあらゆる器官または器官系に由来する細胞。そのような器官としては、限定ではないが、心臓、脳、腎臓、肝臓、肺、筋肉、血液が挙げられる。核酸の供給源となり得る体液としては、限定ではないが、血液、血漿、血清、唾液、痰、粘液、リンパ液、尿、精液、脳脊髄液、または羊水が挙げられる。器官系としては、限定ではないが、筋肉系、消化系、呼吸系、泌尿系、生殖系、内分泌系、循環系、神経系、および外皮系が挙げられる。試料は、たとえば生検により調製され得る。これには、固形組織生検および液体生検の両方が含まれる。試料は、セルフリーDNA(「cfDNA」)、たとえば循環腫瘍DNAを含み得る。核酸断片は、約100~約800ヌクレオチドまたは350~450ヌクレオチド、たとえば約400ヌクレオチドの長さを有し得る。cfDNAは、典型的には、約120~220ヌクレオチドのサイズを有する。
核酸を含む試料は、病的状態を有する、または有すると考えられる対象を供給源とし得る。そのような状態としては、限定ではないが、たとえばがん(たとえばがん生検試料)を含む、過形成、肥大、萎縮、および異形成が挙げられる。他の病理としては、神経疾患(たとえばアルツハイマー病、筋萎縮性側索硬化症、クロイツフェルトヤコブ病、フリートライヒ運動失調症、多発性硬化症)が挙げられる。
核酸は、ネイキッド核酸、つまりタンパク質が結合していない核酸であり得る。あるいは、核酸はクロマチンの形態であり得る。本明細書で使用する場合、「クロマチン」という用語は、DNAとヒストンおよび/または非ヒストンタンパク質との複合体を指す。
核酸を含む試料は、特定の暦年齢を有する対象を供給源とし得る。メチル化のパターンは年齢と関連があるので、早老または遅老を予測することができる。
DNAは、クロマチンの形態で精製され得る。クロマチンからのDNAは、クロマチン免疫沈降(ChIP)およびトランスポゾン支援クロマチン免疫沈降などの方法により濃縮され得る。ChIP法は、典型的には、タンパク質を核酸と共有結合させるためにクロマチンを架橋することを含む。クロマチンは、まだ細胞内にあるときに架橋することができる。それからクロマチンをせん断することができる。ヒストンなどの特定のタンパク質が結合した核酸を、該標的タンパク質に対する抗体を用いて免疫沈降することができる。トランスポゾン支援クロマチン免疫沈降では、標的タンパク質に対する抗体を直接または間接的にトランスポソームに付加させる。トランスポソームは、トランスポゾンに結合したトランスポサーゼを含む。トランスポゾンはその標的を見つけるとDNAに挿入される。トランスポゾンがプライマー結合部位を備えている場合、プライマー結合部位間に位置する核酸を増幅することができる(たとえばJelinek et al.の米国特許第10,689,643号を参照)。
B.ヌクレオチドおよびそれらの修飾形態
RNAおよびDNAのヌクレオチドは、未変性の形態でも、様々な修飾形態でも存在し得る。シトシンはいくつかの異なる形態で存在し得る。
RNAおよびDNAのヌクレオチドは、未変性の形態でも、様々な修飾形態でも存在し得る。シトシンはいくつかの異なる形態で存在し得る。
「修飾ヌクレオチド」という用語は、シトシン、アデニン、グアニン、チミンまたはウラシルの誘導体を指す。「修飾シトシン」という用語は、典型的には、5位に化学部分を有する状態で誘導されたシトシンの誘導体を指す。例示的修飾シトシンとしては、酸化状態の昇順に、5メチルシトシン(「5mC」)、5ヒドロキシメチルシトシン(「5hmC」)、5ホルミルシトシン(「5fC」)、および5カルボキシルシトシン(「5caC」)が挙げられる。シトシンの別の修飾形態は、N-4-アセチルデオキシシチジン(「N4-acdC」)である。(たとえば2020年12月22日出願の国際公開公報PCT/US2020/066741を参照)。
塩基と違って、文字によりヌクレオチドに言及する場合、特に明言しないかぎり、「リボ」バージョンまたは「デオキシリボ」バージョンのいずれかを指し得る。一般に、DNAのヌクレオチドは「デオキシリボ」バージョンとなり、RNAのヌクレオチドは「リボ」形態ということになる。
本明細書に開示される特定の方法では、シトシンの4-アミノ基がカルボニル基に変換され得る。このプロセスは「脱アミノ化」と呼ばれる。この例では、該塩基はウラシルになっている。4位のアミノ基をカルボニル基で置換することによるシトシンまたは修飾シトシンの脱アミノ化は、シトシンまたは修飾シトシンをウラシルに変換する。
C.変換ストラテジー
核酸におけるメチル化またはヒドロキシメチル化などの特定の塩基修飾を検出する方法は、非標的形態の塩基および/または修飾形態の塩基を、もとの塩基以外の塩基または塩基形態に変換することを含み得る。本明細書で使用する場合、「非標的」形態の塩基は、可能な形態の塩基のサブセットを指す。たとえば、シトシン形態の場合、「5hmC」が「標的」形態であり得、「C」、「5mC」、「5fC」、および「5caC」が非標的形態であり得る。他の態様では、「5mC」および「5hmC」が「標的」形態であり得、「C」、「5fC」、および「5caC」が非標的形態であり得る。「非塩基」残基、たとえば「非シトシン」残基は、異なる塩基形態を指す。たとえば「非シトシン」塩基は典型的にはウラシルということになるが、グアニン、アデニン、またはチミジン、およびその修飾形態を含む場合もある。いくつかの変換ストラテジーが公知である。
核酸におけるメチル化またはヒドロキシメチル化などの特定の塩基修飾を検出する方法は、非標的形態の塩基および/または修飾形態の塩基を、もとの塩基以外の塩基または塩基形態に変換することを含み得る。本明細書で使用する場合、「非標的」形態の塩基は、可能な形態の塩基のサブセットを指す。たとえば、シトシン形態の場合、「5hmC」が「標的」形態であり得、「C」、「5mC」、「5fC」、および「5caC」が非標的形態であり得る。他の態様では、「5mC」および「5hmC」が「標的」形態であり得、「C」、「5fC」、および「5caC」が非標的形態であり得る。「非塩基」残基、たとえば「非シトシン」残基は、異なる塩基形態を指す。たとえば「非シトシン」塩基は典型的にはウラシルということになるが、グアニン、アデニン、またはチミジン、およびその修飾形態を含む場合もある。いくつかの変換ストラテジーが公知である。
1.バイサルファイトシーケンシング
核酸のバイサルファイト処理は、5mCおよび5hmC以外のシトシン形態の残基を、脱アミノ化のプロセスによりウラシルに変換する。シーケンシングを行うと、5mCおよび5hmC(「標的形態」)はシトシンとして読み出され、非メチル化シトシンであるホルミルシトシンおよびカルボキシルシトシン(「非標的形態」)はチミンとして読み出される。
核酸のバイサルファイト処理は、5mCおよび5hmC以外のシトシン形態の残基を、脱アミノ化のプロセスによりウラシルに変換する。シーケンシングを行うと、5mCおよび5hmC(「標的形態」)はシトシンとして読み出され、非メチル化シトシンであるホルミルシトシンおよびカルボキシルシトシン(「非標的形態」)はチミンとして読み出される。
2.TETシーケンシング
テン-イレブン転座メチルシトシンジオキシゲナーゼ(「TET」)は、5mC、5hmC、および5fCを5caCに変換する。TETは、ヒト、マウス、または無脊椎動物(たとえば、ネグレリア(Naegleria)、ショウジョウバエ(dTet、またの名をDMADまたはCG43444))などのいくつかの異なる種から入手可能である。哺乳動物のTETとしては、TET1、TET2、およびTET3が挙げられる。TET酵素はそれぞれ、Fe(II)/α-KG-依存性オキシゲナーゼのファミリーに見られる重要な金属結合性残基を含有する二本鎖βヘリックスフォールドを有するコア触媒ドメインをもつ。これらの触媒ドメインは、変換工程で用いることもできる。したがって、特に明言しないかぎり、「TET」は全酵素または機能性触媒ドメインを指す。
テン-イレブン転座メチルシトシンジオキシゲナーゼ(「TET」)は、5mC、5hmC、および5fCを5caCに変換する。TETは、ヒト、マウス、または無脊椎動物(たとえば、ネグレリア(Naegleria)、ショウジョウバエ(dTet、またの名をDMADまたはCG43444))などのいくつかの異なる種から入手可能である。哺乳動物のTETとしては、TET1、TET2、およびTET3が挙げられる。TET酵素はそれぞれ、Fe(II)/α-KG-依存性オキシゲナーゼのファミリーに見られる重要な金属結合性残基を含有する二本鎖βヘリックスフォールドを有するコア触媒ドメインをもつ。これらの触媒ドメインは、変換工程で用いることもできる。したがって、特に明言しないかぎり、「TET」は全酵素または機能性触媒ドメインを指す。
この酵素は、核酸内の5hmC残基を検出する方法で用いることができる。方法は、次のように進行することができる。核酸内の5hmC残基をグルコシル化により保護する。これは、たとえば組み換えファージT4ベータ-グルコシルトランスフェラーゼを用いて行われ得る。次に、核酸をTET酵素(普通はTET1または原生生物ネグレリア・グルベリ(Naegleria gruberi)に由来するNgTETホモログ)で処理すると、シトシン、5mC、および5fCなどの無保護形態のシトシンが5caCに変換される。核酸をバイサルファイトでさらに処理すると、5caCがウラシルに変換される。シーケンシングを行うと、5hmC(「標的形態」)がシトシンとして読み出され、他のシトシン形態(「非標的形態」)はチミジンとして読み出される。
3.A3Aシーケンシング
AID/APOBECは、シチジンを脱アミノ化してウリジンにすることによりDNAおよびRNAに変異を挿入することができる一群のシチジンデアミナーゼである。AID/APOBECファミリーの酵素としては、次のヒト酵素が挙げられる:APOBEC1、APOBEC2、APOBEC3A(「A3A」)、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F、APOBEC3G、APOBEC3H、APOBEC4、活性化誘導(シチジン)デアミナーゼ(AID)。これらの酵素はシトシンおよび5mCをウラシルに変換するが、5hmC、5fC、または5caCは修飾しない(または修飾しても効率は極めて低い)。このクラスの酵素は、修飾形態のシトシンを互いに区別することなく検出する方法に用いられ得る。この方法の一つのバージョンでは、まず、5mC、5hmC、および5fCを5caCに酸化するTET酵素で核酸を処理する。その次のA3Aでの処理はシトシンをウラシルに変換するが、5caCは変換に対し抵抗性を保つ。シーケンシングを行うと、5mC、5hmC、5fC、および5caC(「標的形態」)がシトシンとして読み出され、天然の未修飾シトシン(「非標的形態」)はチミジンとして読み出される。
AID/APOBECは、シチジンを脱アミノ化してウリジンにすることによりDNAおよびRNAに変異を挿入することができる一群のシチジンデアミナーゼである。AID/APOBECファミリーの酵素としては、次のヒト酵素が挙げられる:APOBEC1、APOBEC2、APOBEC3A(「A3A」)、APOBEC3B、APOBEC3C、APOBEC3D、APOBEC3F、APOBEC3G、APOBEC3H、APOBEC4、活性化誘導(シチジン)デアミナーゼ(AID)。これらの酵素はシトシンおよび5mCをウラシルに変換するが、5hmC、5fC、または5caCは修飾しない(または修飾しても効率は極めて低い)。このクラスの酵素は、修飾形態のシトシンを互いに区別することなく検出する方法に用いられ得る。この方法の一つのバージョンでは、まず、5mC、5hmC、および5fCを5caCに酸化するTET酵素で核酸を処理する。その次のA3Aでの処理はシトシンをウラシルに変換するが、5caCは変換に対し抵抗性を保つ。シーケンシングを行うと、5mC、5hmC、5fC、および5caC(「標的形態」)がシトシンとして読み出され、天然の未修飾シトシン(「非標的形態」)はチミジンとして読み出される。
D.第2鎖合成
核酸分子中の非標的ヌクレオチドが非塩基(たとえば非シトシン)残基に変換された後、標的ヌクレオチドを含む核酸を、無変換部位をアンカーとする第2鎖合成により濃縮することができる。第2鎖合成は、変換核酸分子にプライマーまたは1組のプライマーをハイブリダイズさせること、続いてポリメラーゼを用いてプライマーを伸長させることを含む。特定の態様では、ポリメラーゼは、5’-3’エクソヌクレアーゼおよび/または鎖置換活性を有する。プライマーが核酸内の標的部位にハイブリダイズするので、標的ヌクレオチドを含む二本鎖分子が濃縮されることになる。
核酸分子中の非標的ヌクレオチドが非塩基(たとえば非シトシン)残基に変換された後、標的ヌクレオチドを含む核酸を、無変換部位をアンカーとする第2鎖合成により濃縮することができる。第2鎖合成は、変換核酸分子にプライマーまたは1組のプライマーをハイブリダイズさせること、続いてポリメラーゼを用いてプライマーを伸長させることを含む。特定の態様では、ポリメラーゼは、5’-3’エクソヌクレアーゼおよび/または鎖置換活性を有する。プライマーが核酸内の標的部位にハイブリダイズするので、標的ヌクレオチドを含む二本鎖分子が濃縮されることになる。
1.アンカー伸長プライマー
本明細書に記載される方法で使用される伸長プライマーは、5’-Xn-G-3’、または5’-X(n-1)-CG-3’というヌクレオチド配列を含み得、ここで「X」は任意の塩基である。「G」は該分子の3’末端に位置する。いくつかの態様では、「n」は2~25、12~25、3~10、4~7、または約5である(たとえばプライミング配列はヘキサマーである)。プライマーは個別に準備することができる。しかし典型的には、一度の第2鎖合成操作で一緒に使用される組として準備される。
本明細書に記載される方法で使用される伸長プライマーは、5’-Xn-G-3’、または5’-X(n-1)-CG-3’というヌクレオチド配列を含み得、ここで「X」は任意の塩基である。「G」は該分子の3’末端に位置する。いくつかの態様では、「n」は2~25、12~25、3~10、4~7、または約5である(たとえばプライミング配列はヘキサマーである)。プライマーは個別に準備することができる。しかし典型的には、一度の第2鎖合成操作で一緒に使用される組として準備される。
「X」は、任意の位置で、次のいずれかであり得る:「N」 = A、C、T/U、G;「H」 = A、C、T/U;および「I」 = イレギュラー塩基、たとえば(1)その塩基に修飾のあるレギュラー塩基(A、C、T/U、G)(「Q」)または(2)ユニバーサル塩基(「J」)。本明細書で使用する場合、「ユニバーサル塩基」は、2つ以上の標準塩基と結合する、したがって縮重塩基として機能する塩基である。例示的なユニバーサル塩基は、(デオキシ)イノシン、ネブラリン、3-ニトロピロール、5-ニトロインドールである。
したがって、たとえば一態様では、プライマーの組のプライマーは、配列5’-XXXXXG-3’もしくは5’-XXXXCG-3’;5’-NNNNNG-3’もしくは3’-NNNNCG-3’;5’-IIIIIG-3’もしくは5’-IIIICG-3’;5’-QQQQQG-3’もしくは5’-QQQQCG-3’;5’-JJJJJG-3’もしくは5’-JJJJCG-3’、またはこれらの塩基の任意の組み合わせを有するヘキサマーである。
「Xn」または「X(n-1)」を含む1組のプライマーは、縮重した配列の組を含み得る。1組の縮重プライマーは、いくつかの位置にある数の決まった可能な塩基を含む配列を有するオリゴヌクレオチド分子の集合体であり、その結果、様々な位置でのすべての可能な選択ヌクレオチドの組み合わせを網羅する類似配列を有するプライマー集団となっている。たとえば、配列5’-NNNNNG-3’を有する1組の縮重プライマーは、「N」が占めている各位置に4つの標準ヌクレオチド(A、C、G、T/U)のそれぞれが存在し得るプライマーを含むことになる。そのような配列の組は、完全に縮重している。
あるいは、プライマーの組は、部分的に縮重している、または偏っている場合がある。たとえば、特定の塩基が、ランダムと比較して、組のなかで大きな比率を占め得る。たとえば、塩基「C」が、ランダムよりも頻繁に存在し得る。これは、プライマーの一部として転写因子モチーフを使って、このモチーフ上のシトシン修飾をゲノムワイドに分析したいような場合である。
いくつかのプライマー設計プログラムが利用できる(いろいろあるが、たとえばOLIGO、OSP、Primer Master、PRIDE、Primer3)。これらのプログラムは、C/G含率などの特定の基準に合わせたプライマーの組を設計することができる。
他の態様では、配列「Xn」または「Xn-1」は、関心対象の標的核酸モチーフ配列を表す。たとえば、モチーフ配列は、転写因子のモチーフであるCCTCに逆相補的な「GAGG」であり得る。モチーフは、NF-KB、CTCF、BORIS、YY1、TBP、AP-1、CEBP、HOXタンパク質などの転写因子のモチーフであり得る。
プライマーは、たとえばアダプター配列、試料バーコード、および分子バーコードの1つまたは複数を含む補助配列を備えることができる。したがって、たとえば、プライマーは、配列5’-[アダプター配列]-[試料バーコード]-[分子バーコード]-Xn-G-3’、または5’-[アダプター配列]-[試料バーコード]-[分子バーコード]-X(n-1)-CG-3’を有することができる。
特定の態様では、プライマーは、シーケンサープラットフォームに特異的なアダプター配列を含み得る。そのような配列は、典型的には、増幅プライマー配列を含むことになる。たとえば、Illuminaシーケンサーでは、アダプターはp5およびp7配列を含む。
試料バーコードは、異なる試料に由来するが、典型的には一度のシーケンシング操作で配列決定される核酸分子を区別するのに用いられるヌクレオチド配列である。異なる試料には異なるバーコード配列を付ける。典型的には試料バーコードは約6~約20ヌクレオチドである。
分子バーコードは、試料中のもとの分子を区別するのに用いられる1組のバーコードである。試料中の核酸分子をユニークバーコード付けすることができ、つまり、各分子に異なるバーコードが結合している。あるいは、核酸分子を非ユニークバーコード付けすることができ、つまり、試料中の分子に付けるのに用いられる相異なるバーコード配列の数は、試料中のユニーク分子の数よりも少ない。ユニークバーコードの場合、同一のもとの分子から増幅した分子の配列リードは同一のバーコードをもつことになるので、それによって区別することができる。非ユニークバーコードの場合、バーコードからの、および標的分子からの配列情報を用いて、同一のもとの分子から増幅した配列リードを決定することができる。分子バーコードは、典型的には約6~約20ヌクレオチドである。
本明細書に開示される方法で用いられる伸長プライマーは、プライマーとしての機能と両立可能な、任意の形態の核酸または核酸類似体を含み得る。これには、限定ではないが、DNA、RNA、ロックド核酸(「LNA」)、ペプチド核酸(「PNA」)、修飾塩基、リボース、デオキシリボース、修飾糖を含むポリヌクレオチド、およびたとえばA、T、C、G、またはU以外の非標準ヌクレオチドを含むポリヌクレオチドを含む、プライマーが含まれる。例としては、限定ではないが、イノシンまたはニトロインドールなどのユニバーサル塩基類似体が挙げられる。
他の態様では、プライマーは、分子反転プローブまたはパドロックプローブとしての機能のための配列を含み得る。たとえば、プライマーは、プライミング配列5’-Xn-G-3’または5’-X(n-1)-CG-3’、分子の5’末端に位置する標的ヌクレオチド配列にハイブリダイズする第2のヌクレオチド配列、およびプライミング配列と第2の配列との間に位置するリンカー配列を含み得る。
2.プライマーの伸長
専門家は、変換核酸から、標的の修飾ヌクレオチドを含む配列が濃縮された二本鎖核酸の集団を作製する。このプロセスは、変換核酸を変性させて一本鎖核酸を準備することを含む。3’末端にアンカー塩基「G」または複数のアンカー塩基「CpG」を含む1組のプライマーを、ハイブリダイゼーション条件下で変性させた核酸と接触させ、ハイブリダイズさせる。
専門家は、変換核酸から、標的の修飾ヌクレオチドを含む配列が濃縮された二本鎖核酸の集団を作製する。このプロセスは、変換核酸を変性させて一本鎖核酸を準備することを含む。3’末端にアンカー塩基「G」または複数のアンカー塩基「CpG」を含む1組のプライマーを、ハイブリダイゼーション条件下で変性させた核酸と接触させ、ハイブリダイズさせる。
適切なポリメラーゼを用いてプライマーを伸長させる。ポリメラーゼは、中温性または好熱性ポリメラーゼであり得る。たとえば、ポリメラーゼは、クレノウエクソ-ポリメラーゼ、クレノウポリメラーゼ、DNAポリメラーゼI、T4 DNAポリメラーゼ、Phi29 DNAポリメラーゼ、BST DNAポリメラーゼ、Taqポリメラーゼ、pfuポリメラーゼ、およびリバーストランスクリプターゼ(たとえば、モロニーマウス白血病ウイルス(M-MLV)、トリ骨髄芽球症ウイルス(AMV)、およびそれらの変異/改変バージョンであり得る。特定の態様では、ポリメラーゼは、5’-3’エクソヌクレアーゼまたは鎖置換活性を有する。そうすれば、いくつかのプライマーが互いの近くでハイブリダイズした場合、他のプライマーの最上流でハイブリダイズしたプライマーが、該プライマーの下流でハイブリダイズした伸長するポリヌクレオチドを消化するかまたは置換することにより、最長の伸長産物を作ることになる。
RNAの逆転写の場合、dUTPヌクレオチドを用いることができる。dUTPを含有する鎖はライブラリー調製中に増幅されないので、RNA-seq用の鎖情報が保存される。
プライマー伸長の産物は、修飾塩基を含む配列が濃縮された二本鎖ポリヌクレオチドの集合体となる。この集合体をライブラリー調製に供することができる。
E.ライブラリーの調製
1.二本鎖核酸の単離
二本鎖核酸を、いくつかの方法で、残りの一本鎖核酸から分離することができる。一態様では、組成物を、たとえば限定ではないがヌクレアーゼS1などの一本鎖ヌクレアーゼに供して、一本鎖分子を消化させることができる。別の態様では、一本鎖核酸と二本鎖核酸とを、既知の方法により、互いから分画することができる。そのような態様の一つでは、DNAは、シリカ粒子およびヒドロキシアパタイトなどの二本鎖核酸に対する高親和性および一本鎖核酸に対する低親和性を有するシリカベースの方法または非シリカベースの方法を用いて単離される。これらは、DNAをシリカ粒子もしくは膜に、またはDNAグレードのBio-Gel HTPヒドロキシアパタイトに結合させること、および他の夾雑物から分離することを含み得る。一態様では、抗二本鎖DNA抗イディオタイプ抗体などの二本鎖核酸結合タンパク質の使用により、二本鎖核酸を特異的に濃縮することができる。一態様では、抗一本鎖DNA抗イディオタイプ抗体などの一本鎖核酸結合タンパク質により、一本鎖核酸を除去することができる(ネガティブ選択)。一態様では、プライマーは、たとえばビオチンまたはデスチオビオチンなどのキャプチャー部分を備えている。したがって、プライマー伸長により生成した二本鎖分子はビオチン化されていることになる。これらの分子は、ストレプトアビジンなどのキャプチャー部分のパートナーで捕捉して単離することができ、一本鎖DNA分子は、限定ではないがヌクレアーゼS1などの一本鎖ヌクレアーゼにより消化することができる。
1.二本鎖核酸の単離
二本鎖核酸を、いくつかの方法で、残りの一本鎖核酸から分離することができる。一態様では、組成物を、たとえば限定ではないがヌクレアーゼS1などの一本鎖ヌクレアーゼに供して、一本鎖分子を消化させることができる。別の態様では、一本鎖核酸と二本鎖核酸とを、既知の方法により、互いから分画することができる。そのような態様の一つでは、DNAは、シリカ粒子およびヒドロキシアパタイトなどの二本鎖核酸に対する高親和性および一本鎖核酸に対する低親和性を有するシリカベースの方法または非シリカベースの方法を用いて単離される。これらは、DNAをシリカ粒子もしくは膜に、またはDNAグレードのBio-Gel HTPヒドロキシアパタイトに結合させること、および他の夾雑物から分離することを含み得る。一態様では、抗二本鎖DNA抗イディオタイプ抗体などの二本鎖核酸結合タンパク質の使用により、二本鎖核酸を特異的に濃縮することができる。一態様では、抗一本鎖DNA抗イディオタイプ抗体などの一本鎖核酸結合タンパク質により、一本鎖核酸を除去することができる(ネガティブ選択)。一態様では、プライマーは、たとえばビオチンまたはデスチオビオチンなどのキャプチャー部分を備えている。したがって、プライマー伸長により生成した二本鎖分子はビオチン化されていることになる。これらの分子は、ストレプトアビジンなどのキャプチャー部分のパートナーで捕捉して単離することができ、一本鎖DNA分子は、限定ではないがヌクレアーゼS1などの一本鎖ヌクレアーゼにより消化することができる。
末端修復およびアダプター連結の後、キャプチャー配列を用いて標的核酸配列を単離することができる。キャプチャー配列は、標的配列を有する核酸分子にハイブリダイズする能力のあるヌクレオチド配列を含むポリヌクレオチドである。標的配列は、ハイブリダイズすると、ハイブリダイズした配列を捕捉する。典型的には、プローブは、ビオチンなどのキャプチャー部分を含むか、または磁気誘因性粒子などの固体支持体に結合させられて、非結合物からの結合物の分離を可能にする。
2.末端修復およびアダプター連結
断片化に供されたポリヌクレオチド、またはセルフリーDNAは、典型的には、アダプター連結前に末端修復を要する一本鎖オーバーハングを有する末端を含む。末端修復は、たとえば、5’オーバーハングを除去し3’オーバーハングの埋め込みをするクレノウポリメラーゼなどの酵素により達成され得る。その結果、平滑末端の分子となる。アダプターは、平滑末端連結により、平滑末端DNAに直接結合させることができる。あるいは、平滑末端分子の3’末端を「A尾部化」して、1ヌクレオチド「A」オーバーハングを産生してもよい。したがって、5’末端に1つの「T」オーバーハングを有するシーケンシングアダプターを結合させることができる。
断片化に供されたポリヌクレオチド、またはセルフリーDNAは、典型的には、アダプター連結前に末端修復を要する一本鎖オーバーハングを有する末端を含む。末端修復は、たとえば、5’オーバーハングを除去し3’オーバーハングの埋め込みをするクレノウポリメラーゼなどの酵素により達成され得る。その結果、平滑末端の分子となる。アダプターは、平滑末端連結により、平滑末端DNAに直接結合させることができる。あるいは、平滑末端分子の3’末端を「A尾部化」して、1ヌクレオチド「A」オーバーハングを産生してもよい。したがって、5’末端に1つの「T」オーバーハングを有するシーケンシングアダプターを結合させることができる。
あるいは、上述したように、プライマー分子が本明細書に記載されるようにアダプター配列をさらに含んでいるプライマー伸長反応によって、標的ポリヌクレオチドはアダプターを備えることができる。この場合、ポリメラーゼによる伸長後、DNAは3’末端にアジドddNTPが付けられている。次に、アルキル5’を含むアダプターを、クリックケミストリーにより結合させることができる。それからDNAをPCR増幅することができ、さらに分析することができる(たとえば図5A~Bを参照)。
別の態様では、二本鎖ステムにメチル化C残基を含む、ヘアピンループを含むアダプター分子が連結され、そしてバイサルファイトおよびプライマーのアンカリング後、Phi29/Φ29ポリメラーゼなどの強力な置換活性を有する酵素を用いて「ローリングサークル」介在ライブラリーを作製する(たとえば図6A~Eを参照)。
なお、シーケンサープライマー配列、試料バーコード、および分子バーコードなどの補助配列を、二本鎖分子に連結されるアダプター内に備えていてもよい。
3.核酸の増幅
二本鎖核酸を増幅することができる。増幅は、典型的には、プライマーハイブリダイゼーション配列を含むアダプターを備えた核酸に対し実施される。二本鎖核酸は、任意の公知の増幅方式により増幅され得る。これには、限定ではないが、ポリメラーゼ連鎖反応(PCR)増幅、定量PCR、ローリングサークル増幅、多置換増幅、ループ介在等温増幅(LAMP)、逆転写ループ介在等温増幅(RT-LAMP)、鎖置換増幅(SDA)、ヘリカーゼ依存性増幅(HDA)、または転写介在増幅(TMA)が含まれる。説明を簡潔にするため、反応はPCRに関して論じることにする。他の増幅方法に必要な調節は、当業者には容易に明らかになろう。
二本鎖核酸を増幅することができる。増幅は、典型的には、プライマーハイブリダイゼーション配列を含むアダプターを備えた核酸に対し実施される。二本鎖核酸は、任意の公知の増幅方式により増幅され得る。これには、限定ではないが、ポリメラーゼ連鎖反応(PCR)増幅、定量PCR、ローリングサークル増幅、多置換増幅、ループ介在等温増幅(LAMP)、逆転写ループ介在等温増幅(RT-LAMP)、鎖置換増幅(SDA)、ヘリカーゼ依存性増幅(HDA)、または転写介在増幅(TMA)が含まれる。説明を簡潔にするため、反応はPCRに関して論じることにする。他の増幅方法に必要な調節は、当業者には容易に明らかになろう。
III.核酸の分析
次に、増幅ありまたはなしで、二本鎖核酸分子を分析に供することができる。
次に、増幅ありまたはなしで、二本鎖核酸分子を分析に供することができる。
A.核酸のシーケンシング
一態様では、核酸シーケンシングにより二本鎖核酸を分析する。典型的には、核酸は、ハイスループットシーケンシングを用いて配列決定される。本明細書で使用する場合、「ハイスループットシーケンシング」という用語は、何千という核酸分子の同時またはほぼ同時のシーケンシングを指す。ハイスループットシーケンシングは、「次世代シーケンシング」または「超並列シーケンシング」と呼ばれることもある。ハイスループットシーケンシングのプラットフォームとしては、限定ではないが、超並列シグネチャーシーケンシング(MPSS)、Polonyシーケンシング、454パイロシーケンシング、Illumina(Solexa)シーケンシング、SOLiDシーケンシング、Ion Torrent半導体シーケンシング、DNAナノボールシーケンシング、Heliscope一分子シーケンシング、一分子リアルタイム(SMRT)シーケンシング(PacBio)、およびナノポアDNAシーケンシング(たとえばOxford Nanopore)が挙げられる。
一態様では、核酸シーケンシングにより二本鎖核酸を分析する。典型的には、核酸は、ハイスループットシーケンシングを用いて配列決定される。本明細書で使用する場合、「ハイスループットシーケンシング」という用語は、何千という核酸分子の同時またはほぼ同時のシーケンシングを指す。ハイスループットシーケンシングは、「次世代シーケンシング」または「超並列シーケンシング」と呼ばれることもある。ハイスループットシーケンシングのプラットフォームとしては、限定ではないが、超並列シグネチャーシーケンシング(MPSS)、Polonyシーケンシング、454パイロシーケンシング、Illumina(Solexa)シーケンシング、SOLiDシーケンシング、Ion Torrent半導体シーケンシング、DNAナノボールシーケンシング、Heliscope一分子シーケンシング、一分子リアルタイム(SMRT)シーケンシング(PacBio)、およびナノポアDNAシーケンシング(たとえばOxford Nanopore)が挙げられる。
B.核酸配列の分析
核酸シーケンシングは配列リードを生成する。配列リードは、典型的には、配列リードを参照ゲノムに対しマッピングすることにより分析される。たとえば、現在のヒトゲノム参照配列はhg38であり、たとえばNCBIのウェブサイトからアクセス可能である。分析対象の遺伝子座は、ゲノム内の1ヌクレオチド位置、またはゲノムの配列もしくはプロモーター領域などの周辺領域を含めた領域、たとえば遺伝子、または染色体であり得る。
核酸シーケンシングは配列リードを生成する。配列リードは、典型的には、配列リードを参照ゲノムに対しマッピングすることにより分析される。たとえば、現在のヒトゲノム参照配列はhg38であり、たとえばNCBIのウェブサイトからアクセス可能である。分析対象の遺伝子座は、ゲノム内の1ヌクレオチド位置、またはゲノムの配列もしくはプロモーター領域などの周辺領域を含めた領域、たとえば遺伝子、または染色体であり得る。
配列を参照ゲノムに対しマッピングした後、結果をいくつかの方法で分析することができる。分析の一つの方法は、「ピーク分析」と呼ばれる。この方法では、参照ゲノム全体の座に対する配列リードのマッピング数が決定され得る。核酸は、修飾ヌクレオチドを含む配列が濃縮されているので、たとえば、X軸がゲノムを表し、「Y」軸がそれに対するリードマッピング数を表すグラフにおいて、多数の配列リードがリードの「ピーク」として現れる。ピークは、ヌクレオチド修飾の座を表すことができる。
別の方法は、一塩基分解能の分析を含む。この方法では、1ヌクレオチドを1つの座として用いて、配列リードを参照ゲノムに対し比較する。非シトシン形態のヌクレオチドに変換されたシトシン形態のヌクレオチドは、参照ゲノムに対しミスマッチとして現れることになる。たとえば、参照ゲノム内のシトシン残基は、配列リード内のチミジン残基とマッチするであろう。配列リード内のシトシン残基とマッチする参照ゲノム内のシトシン残基は、標的の修飾ヌクレオチドを表す。
C.DNAマイクロアレイ分析
いくつかの態様では、本明細書に記載される方法により調製された核酸を、DNAマイクロアレイを用いて分析することができる。DNAマイクロアレイは、比較ゲノムハイブリダイゼーション、クロマチン免疫沈降分析、およびSNP検出に使用され得る。「DNAチップ」とも呼ばれるDNAマイクロアレイは固体支持体であって、オリゴヌクレオチドプローブが所定の位置にアドレス可能に結合している。この一連の核酸プローブに試料核酸を接触させると、試料核酸は相補的またはほぼ相補的な配列を有するプローブとハイブリダイズする。試料核酸がハイブリダイズした場所を決定することができる。そしてこの情報を使って、試料核酸の素性または配列を決定することができる。DNAマイクロアレイは、核酸分子を配列特異的に検出できるので、参照ゲノムでは「C」として読み取られる塩基が本明細書に記載される方法で処理された後は「T」に置き換わっているような改変配列の検出に有用である。DNAマイクロアレイは、実験室で調製してもよいし、たとえばAffymetrix(ThermoFisher)から購入してもよい。
いくつかの態様では、本明細書に記載される方法により調製された核酸を、DNAマイクロアレイを用いて分析することができる。DNAマイクロアレイは、比較ゲノムハイブリダイゼーション、クロマチン免疫沈降分析、およびSNP検出に使用され得る。「DNAチップ」とも呼ばれるDNAマイクロアレイは固体支持体であって、オリゴヌクレオチドプローブが所定の位置にアドレス可能に結合している。この一連の核酸プローブに試料核酸を接触させると、試料核酸は相補的またはほぼ相補的な配列を有するプローブとハイブリダイズする。試料核酸がハイブリダイズした場所を決定することができる。そしてこの情報を使って、試料核酸の素性または配列を決定することができる。DNAマイクロアレイは、核酸分子を配列特異的に検出できるので、参照ゲノムでは「C」として読み取られる塩基が本明細書に記載される方法で処理された後は「T」に置き換わっているような改変配列の検出に有用である。DNAマイクロアレイは、実験室で調製してもよいし、たとえばAffymetrix(ThermoFisher)から購入してもよい。
D.他の検出方法
他の方法を使って核酸を検出することもできる。それらの方法は、増幅プロセス中に行うことができ、また、アンカーベースのバイサルファイト濃縮の読み取り情報として用いることができる。
他の方法を使って核酸を検出することもできる。それらの方法は、増幅プロセス中に行うことができ、また、アンカーベースのバイサルファイト濃縮の読み取り情報として用いることができる。
1.TaqMan
TaqManプローブ検出では、標的DNA分子用のプローブが、フルオロフォアおよびクエンチャー部分を含む。PCR中、標的DNA上にプライマーを伸長させているTaqポリメラーゼが、その5’-3’エクソヌクレアーゼ活性を使って、ハイブリダイズしたTaqManプローブからヌクレオチドを切断し、そうすることでフルオロフォアを放出する。フルオロフォアは、クエンチャーから切り離されると、検出可能な蛍光を発する。
TaqManプローブ検出では、標的DNA分子用のプローブが、フルオロフォアおよびクエンチャー部分を含む。PCR中、標的DNA上にプライマーを伸長させているTaqポリメラーゼが、その5’-3’エクソヌクレアーゼ活性を使って、ハイブリダイズしたTaqManプローブからヌクレオチドを切断し、そうすることでフルオロフォアを放出する。フルオロフォアは、クエンチャーから切り離されると、検出可能な蛍光を発する。
2.分子ビーコン
分子ビーコンは、ステム・ループ構造の形態の核酸である。ステムは、相補的ヌクレオチドにより分子両端に形成される。典型的には、分子の5’末端にフルオロフォアを結合させ、分子の3’末端にクエンチャーを結合させる。ビーコンのループは、標的分子内の標的ヌクレオチド配列に相補的なヌクレオチド配列を含む。ビーコンが標的配列を有する分子とハイブリダイズすると、フルオロフォアとクエンチャーとが物理的に分離され、検出可能な蛍光を生じる。
分子ビーコンは、ステム・ループ構造の形態の核酸である。ステムは、相補的ヌクレオチドにより分子両端に形成される。典型的には、分子の5’末端にフルオロフォアを結合させ、分子の3’末端にクエンチャーを結合させる。ビーコンのループは、標的分子内の標的ヌクレオチド配列に相補的なヌクレオチド配列を含む。ビーコンが標的配列を有する分子とハイブリダイズすると、フルオロフォアとクエンチャーとが物理的に分離され、検出可能な蛍光を生じる。
3.パドロックプローブおよび分子反転プローブ
パドロックプローブおよび分子反転プローブは、一本鎖核酸分子であって、標的分子に相補的な配列をその両端に含む。パドロックプローブを用いる標的指向性バイサルファイトシーケンシングでは、パドロックプローブが準備される。各パドロックプローブは、2つの標的特異的キャプチャーアームに挟まれた共通リンカー配列を有する。リンカー配列は、ユニバーサルプライマーのプライミング部位を含む。複数のパドロックプローブが、交互のDNA鎖上の部分的に重複する領域のCpGアイランドをカバーする。パドロックプローブのライブラリーを、バイサルファイト変換ゲノムDNAにアニールさせ、3’末端を伸長させて5’と連結させ、エクソヌクレアーゼで直鎖DNAを除去した後、一対の共通プライマーを用いてすべての環状化パドロックプローブをPCR増幅する。分子反転プローブでは、両端が標的核酸分子に結合し、ギャップ、たとえば一塩基ギャップを残す。
パドロックプローブおよび分子反転プローブは、一本鎖核酸分子であって、標的分子に相補的な配列をその両端に含む。パドロックプローブを用いる標的指向性バイサルファイトシーケンシングでは、パドロックプローブが準備される。各パドロックプローブは、2つの標的特異的キャプチャーアームに挟まれた共通リンカー配列を有する。リンカー配列は、ユニバーサルプライマーのプライミング部位を含む。複数のパドロックプローブが、交互のDNA鎖上の部分的に重複する領域のCpGアイランドをカバーする。パドロックプローブのライブラリーを、バイサルファイト変換ゲノムDNAにアニールさせ、3’末端を伸長させて5’と連結させ、エクソヌクレアーゼで直鎖DNAを除去した後、一対の共通プライマーを用いてすべての環状化パドロックプローブをPCR増幅する。分子反転プローブでは、両端が標的核酸分子に結合し、ギャップ、たとえば一塩基ギャップを残す。
分子反転プローブは、標的核酸内の標的領域に相補的な配列を有する両端、典型的にはプローブ放出切断部位により分離されている一対のPCRプライマー結合部位、ハイブリダイゼーションベースの検出用タグ配列、およびタグ放出切断部位を含み得る。標的核酸にハイブリダイズすると、ハイブリダイゼーション部位のギャップがリガーゼにより、またはポリメラーゼおよびリガーゼにより埋められ得る。プローブ放出部位の切断により一本鎖プローブが生じる。プローブのPCRプライマー部位からのPCRは、標的配列およびキャプチャー配列を増幅する。増幅した分子を、タグ配列を用いての濃縮により単離することができる。その後タグ配列を放出することができる。
4.qPCR
別の方法では、配列をqPCRにより検出する。qPCRでは、DNAをPCRにより増幅し、ここで検出可能に標識されたヌクレオチドが増幅産物に組み入れられる。標識の検出率および検出量が、試料中の標的の量の指標となる。
別の方法では、配列をqPCRにより検出する。qPCRでは、DNAをPCRにより増幅し、ここで検出可能に標識されたヌクレオチドが増幅産物に組み入れられる。標識の検出率および検出量が、試料中の標的の量の指標となる。
IV.診断方法
標的/非標的塩基を修飾するよう処理された核酸分子のアンカー塩基の濃縮を、バイオマーカーとしての修飾塩基の検出を含む診断方法に用いることができる。バイオマーカーを発見する方法では、一方は診断されるべき病気を有しており、他方はその病気をもたない、2つの対象群由来の試料が準備される。病気は、限定ではないが、遺伝的病気、がん、早老症または促進老化などの年齢関連の病気、細胞病理、神経病理、その他を含め、任意の病態であり得る。
標的/非標的塩基を修飾するよう処理された核酸分子のアンカー塩基の濃縮を、バイオマーカーとしての修飾塩基の検出を含む診断方法に用いることができる。バイオマーカーを発見する方法では、一方は診断されるべき病気を有しており、他方はその病気をもたない、2つの対象群由来の試料が準備される。病気は、限定ではないが、遺伝的病気、がん、早老症または促進老化などの年齢関連の病気、細胞病理、神経病理、その他を含め、任意の病態であり得る。
本明細書に記載される方法は、異なる群それぞれの各試料の塩基修飾パターンの遺伝子解析をもたらすために用いられる。この遺伝子解析は、配列情報の形態をとり得る。データをデータセットとしてまとめ、統計学的分析に供して、2群を区別するモデルを生成する。このために、当技術分野で公知の任意の統計学的方法を用いることができる。そのような方法またはツールとしては、限定ではないが、相関、ピアソンの相関、スピアマンの相関、カイ二乗、平均/分散の比較(たとえば、対応T検定、独立T検定、ANOVA)回帰分析(たとえば、単回帰、重回帰、線形回帰、非線形回帰、ロジスティック回帰、多項式回帰、段階的回帰、リッジ回帰、ラッソ回帰、エラスティックネット回帰)、またはノンパラメトリック分析(たとえば、ウィルコクソンの順位和検定、ウィルコクソンの符号順位検定、符号検定)が挙げられる。そのようなツールは、MATLAB、JMP Statistical Software、およびSASなどの市販されている統計学パッケージに含まれる。そのような方法は、特定のバイオマーカープロファイルを特定の状態に分類するのに使えるモデルまたは分類子を生成する。統計学的分析は、オペレーターが実行してもよいし、機械学習により実行してもよい。そのような分析の結果は、修飾塩基、たとえば修飾シトシン残基の場所についての情報を用いて、試料が採取された対象を病気を有するかまたは有さないかに分類するモデルである。
病気を診断するモデルが確立されると、そのモデルを対象の診断に用いることができる。そのような方法では、対象由来の核酸を含む試料が準備される。核酸を、本明細書に記載される方法に供する。処理した核酸を分析して配列データなどの特徴データを生成する。該モデルを該配列データに適用して、該試料を適当なカテゴリーに分類する。
たとえば、検出の方法は、(1)対象由来の生物学的試料からDNAを準備すること;(2)本明細書に記載されるアンカー塩基第2鎖合成により、修飾シトシン残基を含む配列が濃縮された二本鎖核酸分子を生成すること;(3)バイオマーカーとして機能する二本鎖分子内の修飾シトシン残基の場所を、遺伝子座に対しマッピングすること、を含み得る。バイオマーカーの存在は、該バイオマーカーと関連づけられる病気の指標である。
方法は、本明細書に記載されるマッピングストラテジーのいずれかを含み得る。さらに、検出は、限定ではないが、DNAシーケンシング、PCR、qPCR、バイオマーカーに対する標識プローブのハイブリダイゼーション、TaqMan増幅、または分子ビーコンによる検出を含め、特定のヌクレオチド配列を検出する当技術分野で公知の任意の方法により行うことができる。
例示的態様
本発明の例示的態様は、限定されないが、以下を含む。
1. a)変換核酸分子を産生するために、試料中の標的核酸分子内の非標的形態のシトシンおよび/または修飾シトシンを化学的または酵素的に非シトシン残基に変換する工程;
b)1組のプライマーを、変性させた変換核酸分子とハイブリダイズさせ、かつ前記プライマーを伸長させて二本鎖核酸分子を産生することにより、前記変性させた変換核酸分子について第2鎖合成を実施する工程であって、前記プライマーが、ヌクレオチド配列5’-XnG-3’および/または5’-X(n-1)CG-3’を含み、ここでXは任意の塩基であり、n = 2~25である、第2鎖合成を実施する工程;ならびに
c)前記二本鎖核酸分子を分析する工程
を含む、方法。
2. n = 5~20、または4~9、または5である、態様1記載の方法。
3. 前記プライマーがヘキサマーである、態様1記載の方法。
4. XがN、H、I、Q、またはJのいずれかであり得る、態様1記載の方法。
5. XnGまたはX(n-1)CGが、NnGもしくはN(n-1)CG、HnGもしくはH(n-1)CG、InGもしくはI(n-1)CG、QnGもしくはQ(n-1)CG、JnGもしくはJ(n-1)CG、またはそれらの組み合わせから選択される、態様1記載の方法。
6. XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、態様1記載の方法。
7. 前記プライマーがヘキサマーである、態様1記載の方法。
8. 配列XnGまたはX(n-1)CGに関し、前記プライマーの組が完全に縮重している、態様1~7のいずれか記載の方法。
9. 前記標的核酸分子がヒトDNAを含む、態様1記載の方法。
10. 前記核酸が、病的組織または細胞、たとえばがん性細胞に由来する、態様1記載の方法。
11. 前記標的核酸分子が、精製DNAもしくはRNA、またはクロマチンを含む、態様1記載の方法。
12. 前記標的核酸が、約150ヌクレオチド~約700ヌクレオチドの長さを有する、態様1記載の方法。
13. 化学的または酵素的に変換する工程が、バイサルファイト、テン-イレブン転座メチルシトシンジオキシゲナーゼ酵素(「TET」)、およびAID/APOBEC酵素クラスの酵素(たとえばAPOBEC3A(「A3A」))の1つまたは複数での処理を含む、態様1記載の方法。
14. シトシンの標的形態が、5メチルシトシン(「5mC」)、5ヒドロキシメチルシトシン(「5hmC」)、5ホルミルシトシン(「5fC」)、および5カルボキシルシトシン(「5caC」)の1つまたは複数を含む、態様1記載の方法。
15. 化学的または酵素的に変換する工程が、5mCおよび5hmC以外のシトシン形態をウラシルに変換することを含む、態様1記載の方法。
16. 化学的または酵素的に変換する工程が、5hmC以外のシトシン形態をウラシルに変換することを含む、態様1記載の方法。
17. 化学的または酵素的に変換する工程が、シトシンをウラシルに変換するが、5mC、5hmC、5fC、または5caCはウラシルに変換しないことを含む、態様1記載の方法。
18. 非シトシン残基がウラシルである、態様1記載の方法。
19. 前記プライマーが、DNA、RNA、LNA、またはPNAを含む、態様1記載の方法。
20. 前記プライマーが、修飾リボースまたはデオキシリボースを含む、態様1記載の方法。
21. 前記プライマーが、前記プライマーの融解温度を変える修飾糖残基を含む、態様1記載の方法。
22. 前記プライマーが、アダプター配列および/またはユニバーサルプライミング配列をさらに含む、態様1記載の方法。
23. 前記アダプター配列が、P3およびP5を含む、態様22記載の方法。
24. 前記アダプター配列が、P3およびP5を含む、態様22記載の方法。
25. 前記プライマーが、試料バーコード配列を含む、態様1記載の方法。
26. 前記プライマーが、分子バーコード配列を含む、態様1記載の方法。
27. 前記プライマーが、アダプター配列および/またはユニバーサルプライミング配列をさらに含む、態様1記載の方法。
28. 第2鎖合成が、中温性または好熱性DNAポリメラーゼを用いて実施される、態様1記載の方法。
29. 第2鎖合成が、エクソ-ポリメラーゼを用いて実施される、態様1記載の方法。
30. 第2鎖合成が、クレノウエクソ-ポリメラーゼ、クレノウポリメラーゼ、T4 DNAポリメラーゼ、Taqポリメラーゼ、pfuポリメラーゼ、DNAポリメラーゼI、Phi29ポリメラーゼ、およびリバーストランスクリプターゼ(たとえば、モロニーマウス白血病ウイルス(M-MLV)、トリ骨髄芽球症ウイルス(AMV)、ならびにそれらの変異/改変バージョンから選択されるポリメラーゼを用いて実施される、態様1記載の方法。
31. 前記プライマーがビオチン化されており、方法が、ビオチンを含む二本鎖核酸分子を捕捉する工程をさらに含む、態様1記載の方法。
32. 前記核酸分子に3’末端アジド(N3)基を導入する工程;
5’-3-トリアゾール結合によりアルキル化アダプターを結合させてアダプター付き分子を産生する工程;ならびに
前記分子の5’および3’末端に相補的な1組のプライマーを用いて前記アダプター付き分子を増幅する工程
をさらに含む、態様31記載の方法。
33. アダプター付き核酸分子を産生するために、プライマー伸長後に、シーケンサー特異的アダプターを前記核酸分子に結合させる工程を含む、態様1記載の方法。
34. 結合させる工程が、末端修復、任意選択によりヌクレオチドオーバーハングの追加、および前記アダプターと平滑末端またはオーバーハングとの連結を含む、態様33記載の方法。
35. 前記アダプターが、Polonyシーケンシング、454パイロシーケンシング、Illumina(Solexa)シーケンシング、SOLiDシーケンシング、Ion Torrent半導体シーケンシング、DNAナノボールシーケンシング、Heliscope一分子シーケンシング、一分子リアルタイム(SMRT)シーケンシング、およびナノポアDNAシーケンシングによるシーケンシングに特異的である、態様33記載の方法。
36. 前記二本鎖分子がプライマーハイブリダイゼーション配列を備えており、方法が、前記二本鎖核酸分子を増幅する工程を含む、態様1記載の方法。
37. 標的ヌクレオチド配列を含む核酸の配列捕捉をさらに含む、態様1記載の方法。
38. 分析する工程が、
配列リードを産生するために、核酸増幅ありまたはなしで、前記二本鎖核酸分子のシーケンシングを行うこと
を含む、態様1記載の方法。
39. シーケンシングが、Polonyシーケンシング、454パイロシーケンシング、Illumina(Solexa)シーケンシング、SOLiDシーケンシング、Ion Torrent半導体シーケンシング、DNAナノボールシーケンシング、Heliscope一分子シーケンシング、一分子リアルタイム(SMRT)シーケンシング、またはナノポアDNAシーケンシングにより実施される、態様38記載の方法。
40. 分析が、ピーク分析またはSNP分析を含む、態様39記載の方法。
41. 前記配列リードを参照ゲノムに対しマッピングする工程を含む、態様39記載の方法。
42. 参照ゲノム内のシトシン残基に対しマッピングする前記配列リード内の1つまたは複数のシトシン残基の遺伝子座をマッピングする工程、および/または前記参照ゲノム内のシトシン残基に対しマッピングする前記配列リード内の1つまたは複数のチミジン残基の遺伝子座をマッピングする工程をさらに含み、ここで前記参照ゲノム内のシトシン残基に対しマッピングする配列リード内のシトシン残基が、配列リードを産生するためにシーケンシングされた核酸分子内の修飾シトシン残基を表す、態様41記載の方法。
43. 分析する工程が、DNAアレイ分析を含む、態様1記載の方法。
44. 前記核酸がRNAを含んでおり、第2鎖合成がdUTPヌクレオチドを用いる、態様1記載の方法。
45. 標的DNA分子が、
i)(任意選択により細胞内の)クロマチンを含む試料を準備すること;
ii)前記クロマチンにおいてタンパク質をDNAに架橋すること;任意選択により、前記架橋したクロマチンを断片化すること;および
iii)クロマチン免疫沈降(ChIP)により前記クロマチンから標的核酸分子を単離すること
により準備される、態様1記載の方法。
46. 前記免疫沈降が、ヒストン、DNAポリメラーゼ、RNAポリメラーゼ、メチル結合タンパク質と結合している核酸配列、または以下のドメイン:bZIPドメイン、DNA結合性ドメイン、ヘリックス-ループ-ヘリックス、ヘリックス-ターン-ヘリックス、MG-box、ロイシンジッパー、レキシトロプシン、核酸シミュレーション、ジンクフィンガー、ヒストンメチラーゼ、動員タンパク質、Swi6を含有するタンパク質と結合している核酸配列を標的とする、態様45記載の方法。
47. 標的DNA分子が、
i)クロマチンを含む試料を準備すること;
ii)前記クロマチンにおいて(たとえばホルムアルデヒドを用いて)タンパク質をDNAに架橋すること;
iii)クロマチンを消化して断片化クロマチンを作製すること;
iv)前記断片化クロマチンにビオチンを導入してビオチン化クロマチンを産生すること;
v)前記ビオチン化クロマチン断片同士を連結すること;
vi)前記連結断片を脱架橋、抽出、およびせん断すること;ならびに
vii)前記せん断したビオチン化断片を単離すること
48. DNA中のバイサルファイト非反応性シトシンをマッピングする方法であって、
a)断片化されていてもよい核酸分子を含む試料を準備する工程;
b)前記核酸分子をバイサルファイトで処理する工程であって、処理によって未修飾シトシン残基がウラシルに変換される、処理する工程;
c)1組のプライマーを、変性させた変換核酸分子とハイブリダイズさせ、かつ前記プライマーを伸長させて二本鎖核酸分子を産生することにより、前記変性させた変換核酸分子について第2鎖合成を実施する工程であって、前記プライマーが、ヌクレオチド配列5’-XnG-3’および/または5’-X(n-1)CG-3’を含み、Xが任意の塩基であり、n = 2~25である、第2鎖合成を実施する工程;
d)前記二本鎖核酸分子に対し末端修復およびアダプター連結を実施して、アダプター付き核酸分子を産生する工程;
e)(たとえばPCRまたはqPCRにより)前記アダプター付き核酸分子を増幅する工程;ならびに
f)前記増幅した核酸分子のシーケンシングを行う工程
を含む、方法。
49. XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、態様48記載の方法。
50. a)断片化されていてもよい核酸分子を含む試料を準備する工程;
b)前記核酸分子内の5-ヒドロキシメチルシトシン(「5hmC」)残基を保護する工程;
c)5-メチルシトシン(「5mC」)および/または5-ホルミルシトシン(「5fC」)を5-カルボキシルシトシン(「5caC」)残基に変換する工程;
d)前記核酸内のC、および5caC残基をウラシルに変換する工程;
e)1組のプライマーを、変性させた変換核酸分子とハイブリダイズさせ、かつ前記プライマーを伸長させて二本鎖核酸分子を産生することにより、前記変性させた変換核酸分子について第2鎖合成を実施する工程であって、前記プライマーが、ヌクレオチド配列5’-XnG-3’および/または5’-X(n-1)CG-3’を含み、Xが任意の塩基であり、n = 2~25である、第2鎖合成を実施する工程;
f)前記二本鎖核酸分子にアダプターを結合させて、アダプター付き核酸分子を産生する工程;
g)(たとえばPCRにより)前記アダプター付き核酸分子を増幅する工程;ならびに
h)前記増幅した核酸分子のシーケンシングを行う工程
を含む、方法。
51. XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、態様50記載の方法。
52. 5mCおよび/または5fCが、TETでの処理により5caCに変換される、態様50記載の方法。
53. 5hmCが、たとえばT4グルコシルトランスフェラーゼを用いたグルコシル化により保護される、態様50記載の方法。
54. a)断片化されていてもよい核酸分子を含む試料を準備する工程;
b)5-メチルシトシン(「5mC」)、5-ヒドロキシメチルシトシン(「5hmC」)、および/または5-ホルミルシトシン(「5fC」)を5-カルボキシルシトシン(「5caC」)残基に変換する工程;
c)たとえばAPOBEC/AID酵素クラスの酵素を用いて、前記核酸内のC残基をウラシルに変換する工程;
d)1組のプライマーを、変性させた変換核酸分子とハイブリダイズさせ、かつ前記プライマーを伸長させて二本鎖核酸分子を産生することにより、前記変性させた変換核酸分子について第2鎖合成を実施する工程であって、前記プライマーが、ヌクレオチド配列5’-XnG-3’および/または5’-X(n-1)CG-3’を含み、ここでXは任意の塩基であり、n = 2~25である、第2鎖合成を実施する工程;
e)前記二本鎖核酸分子にアダプターを結合させて、アダプター付き核酸分子を産生する工程;
f)(たとえばPCRにより)前記アダプター付き核酸分子を増幅する工程;ならびに
g)たとえばシーケンシングまたはDNAアレイ分析により、前記増幅した核酸分子を分析する工程
を含む、方法。
55. XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、態様54記載の方法。
56. 以下:
(a)ヌクレオチド配列を含む1組のプライマーであって、前記プライマーがヌクレオチド配列5’-XnG-3’および/または5’-X(n-1)CG-3’を含み、Xが任意の塩基であり、n = 2~25である、1組のプライマー;
(b)1つまたは複数の容器であって、それぞれの容器が(i)ナトリウムバイサルファイト、(2)テン-イレブン転座メチルシトシンジオキシゲナーゼ1(「TET1」)、T4ベータ-グルコシル-トランスフェラーゼ、APOBEC3A(「A3A」)、またはAID/APOBECクラスのデアミナーゼからの酵素のうち1つを含む、容器
を含む、キット。
57. XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、態様56記載の方法。
58. ヒト、マウス、または無脊椎動物(たとえばネグレリア(Naegleria)、ショウジョウバエ(Drosophila))由来のTET1を含む、態様56記載のキット。
59. 「X」が、たとえば(デオキシ)イノシン、ネブラリン、3-ニトロピロール、5-ニトロインドールから選択される、少なくとも1つのユニバーサル塩基を含む、態様56記載のキット。
60. 以下:
(a)ヌクレオチド配列5’-XnG-3’および/または5’-X(n-1)CG-3’を含む1組のプライマーであって、Xが任意の塩基であり、n = 2~25である、1組のプライマー;
(b)標的核酸分子内の全部ではないが少なくとも1つの形態のシトシンまたは修飾シトシンがウラシルに変換されている、核酸分子
を含む、キット。
62. 以下:
(a)ヌクレオチド配列5’-XnG-3’および/または5’-X(n-1)CG-3’を含む1組のプライマーであって、Xが任意の塩基であり、n = 2~25であり、前記プライマーがタグ、たとえばビオチンを含んでいる、1組のプライマー;
(b)3'-アジド-ddGTP;
(c)5’アルキルオリゴ;ならびに
(d)標的核酸分子内の全部ではないが少なくとも1つの形態のシトシンまたは修飾シトシンが に変換されている、核酸分子
を含む、キット。
63. 以下:
a)一本鎖核酸分子の集団;ならびに
b)前記aにハイブリダイズした、ヌクレオチド配列5’-HnG-3’および/または5’-H(n-1)CG-3’を含む1組のプライマーであって、Xが任意の塩基であり、n = 2~25である、1組のプライマー
を含む、組成物。
64. XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、態様63記載の方法。
65. 試料を病的または非病的と分類するモデルを生成する方法であって、
a)病状を有する第1の組の対象に由来する第1の組の核酸分子、および病状を有さない第2の組の対象に由来する第2の組の核酸分子を準備する工程;
b)前記試料中の核酸分子を以下:
(i)変換核酸分子を産生するために、試料中の標的核酸分子内の非標的形態のシトシンおよび/または修飾シトシンを化学的または酵素的に非シトシン残基に変換すること;
(ii)1組のプライマーを、変性させた変換核酸分子とハイブリダイズさせ、かつ前記プライマーを伸長させて二本鎖核酸分子を産生することにより、前記変性させた変換核酸分子について第2鎖合成を実施することであって、前記プライマーが、ヌクレオチド配列5’-XnG-3’および/または5’-X(n-1)CG-3’を含み、ここでXは任意の塩基であり、n = 2~25である、第2鎖合成を実施すること
により処理する工程;ならびに
c)前記二本鎖核酸分子を分析して、前記試料中の塩基修飾をマッピングするデータを産生する工程;
d)前記試料中の塩基修飾の位置の違いを比較するために前記データの統計学的分析を実施する工程であって、前記統計学的分析が、試料を病的または非病的と分類するモデルを産生する、統計学的分析を実施する工程
を含む、方法。
66. XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、態様65記載の方法。
67. (a)対象由来の生物学的試料からのDNAを準備する工程;
(b)試料中の標的核酸分子内の非標的形態のシトシンおよび/または修飾シトシンを化学的または酵素的に非シトシン残基に変換して、変換核酸分子を産生する工程;
(c)1組のプライマーを、変性させた変換核酸分子とハイブリダイズさせ、かつ前記プライマーを伸長させて二本鎖核酸分子を産生することにより、前記変性させた変換核酸分子について第2鎖合成を実施する工程であって、前記プライマーが、ヌクレオチド配列5’-XnG-3’および/または5’-X(n-1)CG-3’を含み、ここでXは任意の塩基であり、n = 2~25である、第2鎖合成を実施する工程;
(d)本明細書に記載されるアンカー塩基第2鎖合成方法により、修飾シトシン残基を含む配列が濃縮された二本鎖核酸分子を生成する工程;ならびに
(e)前記二本鎖分子内の修飾シトシン残基の場所を、遺伝子座に対しマッピングする工程
を含む、方法。
68. XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、態様67記載の方法。
69. 前記マッピングされた修飾シトシン残基がバイオマーカーである、態様67記載の方法。
本発明の例示的態様は、限定されないが、以下を含む。
1. a)変換核酸分子を産生するために、試料中の標的核酸分子内の非標的形態のシトシンおよび/または修飾シトシンを化学的または酵素的に非シトシン残基に変換する工程;
b)1組のプライマーを、変性させた変換核酸分子とハイブリダイズさせ、かつ前記プライマーを伸長させて二本鎖核酸分子を産生することにより、前記変性させた変換核酸分子について第2鎖合成を実施する工程であって、前記プライマーが、ヌクレオチド配列5’-XnG-3’および/または5’-X(n-1)CG-3’を含み、ここでXは任意の塩基であり、n = 2~25である、第2鎖合成を実施する工程;ならびに
c)前記二本鎖核酸分子を分析する工程
を含む、方法。
2. n = 5~20、または4~9、または5である、態様1記載の方法。
3. 前記プライマーがヘキサマーである、態様1記載の方法。
4. XがN、H、I、Q、またはJのいずれかであり得る、態様1記載の方法。
5. XnGまたはX(n-1)CGが、NnGもしくはN(n-1)CG、HnGもしくはH(n-1)CG、InGもしくはI(n-1)CG、QnGもしくはQ(n-1)CG、JnGもしくはJ(n-1)CG、またはそれらの組み合わせから選択される、態様1記載の方法。
6. XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、態様1記載の方法。
7. 前記プライマーがヘキサマーである、態様1記載の方法。
8. 配列XnGまたはX(n-1)CGに関し、前記プライマーの組が完全に縮重している、態様1~7のいずれか記載の方法。
9. 前記標的核酸分子がヒトDNAを含む、態様1記載の方法。
10. 前記核酸が、病的組織または細胞、たとえばがん性細胞に由来する、態様1記載の方法。
11. 前記標的核酸分子が、精製DNAもしくはRNA、またはクロマチンを含む、態様1記載の方法。
12. 前記標的核酸が、約150ヌクレオチド~約700ヌクレオチドの長さを有する、態様1記載の方法。
13. 化学的または酵素的に変換する工程が、バイサルファイト、テン-イレブン転座メチルシトシンジオキシゲナーゼ酵素(「TET」)、およびAID/APOBEC酵素クラスの酵素(たとえばAPOBEC3A(「A3A」))の1つまたは複数での処理を含む、態様1記載の方法。
14. シトシンの標的形態が、5メチルシトシン(「5mC」)、5ヒドロキシメチルシトシン(「5hmC」)、5ホルミルシトシン(「5fC」)、および5カルボキシルシトシン(「5caC」)の1つまたは複数を含む、態様1記載の方法。
15. 化学的または酵素的に変換する工程が、5mCおよび5hmC以外のシトシン形態をウラシルに変換することを含む、態様1記載の方法。
16. 化学的または酵素的に変換する工程が、5hmC以外のシトシン形態をウラシルに変換することを含む、態様1記載の方法。
17. 化学的または酵素的に変換する工程が、シトシンをウラシルに変換するが、5mC、5hmC、5fC、または5caCはウラシルに変換しないことを含む、態様1記載の方法。
18. 非シトシン残基がウラシルである、態様1記載の方法。
19. 前記プライマーが、DNA、RNA、LNA、またはPNAを含む、態様1記載の方法。
20. 前記プライマーが、修飾リボースまたはデオキシリボースを含む、態様1記載の方法。
21. 前記プライマーが、前記プライマーの融解温度を変える修飾糖残基を含む、態様1記載の方法。
22. 前記プライマーが、アダプター配列および/またはユニバーサルプライミング配列をさらに含む、態様1記載の方法。
23. 前記アダプター配列が、P3およびP5を含む、態様22記載の方法。
24. 前記アダプター配列が、P3およびP5を含む、態様22記載の方法。
25. 前記プライマーが、試料バーコード配列を含む、態様1記載の方法。
26. 前記プライマーが、分子バーコード配列を含む、態様1記載の方法。
27. 前記プライマーが、アダプター配列および/またはユニバーサルプライミング配列をさらに含む、態様1記載の方法。
28. 第2鎖合成が、中温性または好熱性DNAポリメラーゼを用いて実施される、態様1記載の方法。
29. 第2鎖合成が、エクソ-ポリメラーゼを用いて実施される、態様1記載の方法。
30. 第2鎖合成が、クレノウエクソ-ポリメラーゼ、クレノウポリメラーゼ、T4 DNAポリメラーゼ、Taqポリメラーゼ、pfuポリメラーゼ、DNAポリメラーゼI、Phi29ポリメラーゼ、およびリバーストランスクリプターゼ(たとえば、モロニーマウス白血病ウイルス(M-MLV)、トリ骨髄芽球症ウイルス(AMV)、ならびにそれらの変異/改変バージョンから選択されるポリメラーゼを用いて実施される、態様1記載の方法。
31. 前記プライマーがビオチン化されており、方法が、ビオチンを含む二本鎖核酸分子を捕捉する工程をさらに含む、態様1記載の方法。
32. 前記核酸分子に3’末端アジド(N3)基を導入する工程;
5’-3-トリアゾール結合によりアルキル化アダプターを結合させてアダプター付き分子を産生する工程;ならびに
前記分子の5’および3’末端に相補的な1組のプライマーを用いて前記アダプター付き分子を増幅する工程
をさらに含む、態様31記載の方法。
33. アダプター付き核酸分子を産生するために、プライマー伸長後に、シーケンサー特異的アダプターを前記核酸分子に結合させる工程を含む、態様1記載の方法。
34. 結合させる工程が、末端修復、任意選択によりヌクレオチドオーバーハングの追加、および前記アダプターと平滑末端またはオーバーハングとの連結を含む、態様33記載の方法。
35. 前記アダプターが、Polonyシーケンシング、454パイロシーケンシング、Illumina(Solexa)シーケンシング、SOLiDシーケンシング、Ion Torrent半導体シーケンシング、DNAナノボールシーケンシング、Heliscope一分子シーケンシング、一分子リアルタイム(SMRT)シーケンシング、およびナノポアDNAシーケンシングによるシーケンシングに特異的である、態様33記載の方法。
36. 前記二本鎖分子がプライマーハイブリダイゼーション配列を備えており、方法が、前記二本鎖核酸分子を増幅する工程を含む、態様1記載の方法。
37. 標的ヌクレオチド配列を含む核酸の配列捕捉をさらに含む、態様1記載の方法。
38. 分析する工程が、
配列リードを産生するために、核酸増幅ありまたはなしで、前記二本鎖核酸分子のシーケンシングを行うこと
を含む、態様1記載の方法。
39. シーケンシングが、Polonyシーケンシング、454パイロシーケンシング、Illumina(Solexa)シーケンシング、SOLiDシーケンシング、Ion Torrent半導体シーケンシング、DNAナノボールシーケンシング、Heliscope一分子シーケンシング、一分子リアルタイム(SMRT)シーケンシング、またはナノポアDNAシーケンシングにより実施される、態様38記載の方法。
40. 分析が、ピーク分析またはSNP分析を含む、態様39記載の方法。
41. 前記配列リードを参照ゲノムに対しマッピングする工程を含む、態様39記載の方法。
42. 参照ゲノム内のシトシン残基に対しマッピングする前記配列リード内の1つまたは複数のシトシン残基の遺伝子座をマッピングする工程、および/または前記参照ゲノム内のシトシン残基に対しマッピングする前記配列リード内の1つまたは複数のチミジン残基の遺伝子座をマッピングする工程をさらに含み、ここで前記参照ゲノム内のシトシン残基に対しマッピングする配列リード内のシトシン残基が、配列リードを産生するためにシーケンシングされた核酸分子内の修飾シトシン残基を表す、態様41記載の方法。
43. 分析する工程が、DNAアレイ分析を含む、態様1記載の方法。
44. 前記核酸がRNAを含んでおり、第2鎖合成がdUTPヌクレオチドを用いる、態様1記載の方法。
45. 標的DNA分子が、
i)(任意選択により細胞内の)クロマチンを含む試料を準備すること;
ii)前記クロマチンにおいてタンパク質をDNAに架橋すること;任意選択により、前記架橋したクロマチンを断片化すること;および
iii)クロマチン免疫沈降(ChIP)により前記クロマチンから標的核酸分子を単離すること
により準備される、態様1記載の方法。
46. 前記免疫沈降が、ヒストン、DNAポリメラーゼ、RNAポリメラーゼ、メチル結合タンパク質と結合している核酸配列、または以下のドメイン:bZIPドメイン、DNA結合性ドメイン、ヘリックス-ループ-ヘリックス、ヘリックス-ターン-ヘリックス、MG-box、ロイシンジッパー、レキシトロプシン、核酸シミュレーション、ジンクフィンガー、ヒストンメチラーゼ、動員タンパク質、Swi6を含有するタンパク質と結合している核酸配列を標的とする、態様45記載の方法。
47. 標的DNA分子が、
i)クロマチンを含む試料を準備すること;
ii)前記クロマチンにおいて(たとえばホルムアルデヒドを用いて)タンパク質をDNAに架橋すること;
iii)クロマチンを消化して断片化クロマチンを作製すること;
iv)前記断片化クロマチンにビオチンを導入してビオチン化クロマチンを産生すること;
v)前記ビオチン化クロマチン断片同士を連結すること;
vi)前記連結断片を脱架橋、抽出、およびせん断すること;ならびに
vii)前記せん断したビオチン化断片を単離すること
48. DNA中のバイサルファイト非反応性シトシンをマッピングする方法であって、
a)断片化されていてもよい核酸分子を含む試料を準備する工程;
b)前記核酸分子をバイサルファイトで処理する工程であって、処理によって未修飾シトシン残基がウラシルに変換される、処理する工程;
c)1組のプライマーを、変性させた変換核酸分子とハイブリダイズさせ、かつ前記プライマーを伸長させて二本鎖核酸分子を産生することにより、前記変性させた変換核酸分子について第2鎖合成を実施する工程であって、前記プライマーが、ヌクレオチド配列5’-XnG-3’および/または5’-X(n-1)CG-3’を含み、Xが任意の塩基であり、n = 2~25である、第2鎖合成を実施する工程;
d)前記二本鎖核酸分子に対し末端修復およびアダプター連結を実施して、アダプター付き核酸分子を産生する工程;
e)(たとえばPCRまたはqPCRにより)前記アダプター付き核酸分子を増幅する工程;ならびに
f)前記増幅した核酸分子のシーケンシングを行う工程
を含む、方法。
49. XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、態様48記載の方法。
50. a)断片化されていてもよい核酸分子を含む試料を準備する工程;
b)前記核酸分子内の5-ヒドロキシメチルシトシン(「5hmC」)残基を保護する工程;
c)5-メチルシトシン(「5mC」)および/または5-ホルミルシトシン(「5fC」)を5-カルボキシルシトシン(「5caC」)残基に変換する工程;
d)前記核酸内のC、および5caC残基をウラシルに変換する工程;
e)1組のプライマーを、変性させた変換核酸分子とハイブリダイズさせ、かつ前記プライマーを伸長させて二本鎖核酸分子を産生することにより、前記変性させた変換核酸分子について第2鎖合成を実施する工程であって、前記プライマーが、ヌクレオチド配列5’-XnG-3’および/または5’-X(n-1)CG-3’を含み、Xが任意の塩基であり、n = 2~25である、第2鎖合成を実施する工程;
f)前記二本鎖核酸分子にアダプターを結合させて、アダプター付き核酸分子を産生する工程;
g)(たとえばPCRにより)前記アダプター付き核酸分子を増幅する工程;ならびに
h)前記増幅した核酸分子のシーケンシングを行う工程
を含む、方法。
51. XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、態様50記載の方法。
52. 5mCおよび/または5fCが、TETでの処理により5caCに変換される、態様50記載の方法。
53. 5hmCが、たとえばT4グルコシルトランスフェラーゼを用いたグルコシル化により保護される、態様50記載の方法。
54. a)断片化されていてもよい核酸分子を含む試料を準備する工程;
b)5-メチルシトシン(「5mC」)、5-ヒドロキシメチルシトシン(「5hmC」)、および/または5-ホルミルシトシン(「5fC」)を5-カルボキシルシトシン(「5caC」)残基に変換する工程;
c)たとえばAPOBEC/AID酵素クラスの酵素を用いて、前記核酸内のC残基をウラシルに変換する工程;
d)1組のプライマーを、変性させた変換核酸分子とハイブリダイズさせ、かつ前記プライマーを伸長させて二本鎖核酸分子を産生することにより、前記変性させた変換核酸分子について第2鎖合成を実施する工程であって、前記プライマーが、ヌクレオチド配列5’-XnG-3’および/または5’-X(n-1)CG-3’を含み、ここでXは任意の塩基であり、n = 2~25である、第2鎖合成を実施する工程;
e)前記二本鎖核酸分子にアダプターを結合させて、アダプター付き核酸分子を産生する工程;
f)(たとえばPCRにより)前記アダプター付き核酸分子を増幅する工程;ならびに
g)たとえばシーケンシングまたはDNAアレイ分析により、前記増幅した核酸分子を分析する工程
を含む、方法。
55. XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、態様54記載の方法。
56. 以下:
(a)ヌクレオチド配列を含む1組のプライマーであって、前記プライマーがヌクレオチド配列5’-XnG-3’および/または5’-X(n-1)CG-3’を含み、Xが任意の塩基であり、n = 2~25である、1組のプライマー;
(b)1つまたは複数の容器であって、それぞれの容器が(i)ナトリウムバイサルファイト、(2)テン-イレブン転座メチルシトシンジオキシゲナーゼ1(「TET1」)、T4ベータ-グルコシル-トランスフェラーゼ、APOBEC3A(「A3A」)、またはAID/APOBECクラスのデアミナーゼからの酵素のうち1つを含む、容器
を含む、キット。
57. XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、態様56記載の方法。
58. ヒト、マウス、または無脊椎動物(たとえばネグレリア(Naegleria)、ショウジョウバエ(Drosophila))由来のTET1を含む、態様56記載のキット。
59. 「X」が、たとえば(デオキシ)イノシン、ネブラリン、3-ニトロピロール、5-ニトロインドールから選択される、少なくとも1つのユニバーサル塩基を含む、態様56記載のキット。
60. 以下:
(a)ヌクレオチド配列5’-XnG-3’および/または5’-X(n-1)CG-3’を含む1組のプライマーであって、Xが任意の塩基であり、n = 2~25である、1組のプライマー;
(b)標的核酸分子内の全部ではないが少なくとも1つの形態のシトシンまたは修飾シトシンがウラシルに変換されている、核酸分子
を含む、キット。
62. 以下:
(a)ヌクレオチド配列5’-XnG-3’および/または5’-X(n-1)CG-3’を含む1組のプライマーであって、Xが任意の塩基であり、n = 2~25であり、前記プライマーがタグ、たとえばビオチンを含んでいる、1組のプライマー;
(b)3'-アジド-ddGTP;
(c)5’アルキルオリゴ;ならびに
(d)標的核酸分子内の全部ではないが少なくとも1つの形態のシトシンまたは修飾シトシンが に変換されている、核酸分子
を含む、キット。
63. 以下:
a)一本鎖核酸分子の集団;ならびに
b)前記aにハイブリダイズした、ヌクレオチド配列5’-HnG-3’および/または5’-H(n-1)CG-3’を含む1組のプライマーであって、Xが任意の塩基であり、n = 2~25である、1組のプライマー
を含む、組成物。
64. XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、態様63記載の方法。
65. 試料を病的または非病的と分類するモデルを生成する方法であって、
a)病状を有する第1の組の対象に由来する第1の組の核酸分子、および病状を有さない第2の組の対象に由来する第2の組の核酸分子を準備する工程;
b)前記試料中の核酸分子を以下:
(i)変換核酸分子を産生するために、試料中の標的核酸分子内の非標的形態のシトシンおよび/または修飾シトシンを化学的または酵素的に非シトシン残基に変換すること;
(ii)1組のプライマーを、変性させた変換核酸分子とハイブリダイズさせ、かつ前記プライマーを伸長させて二本鎖核酸分子を産生することにより、前記変性させた変換核酸分子について第2鎖合成を実施することであって、前記プライマーが、ヌクレオチド配列5’-XnG-3’および/または5’-X(n-1)CG-3’を含み、ここでXは任意の塩基であり、n = 2~25である、第2鎖合成を実施すること
により処理する工程;ならびに
c)前記二本鎖核酸分子を分析して、前記試料中の塩基修飾をマッピングするデータを産生する工程;
d)前記試料中の塩基修飾の位置の違いを比較するために前記データの統計学的分析を実施する工程であって、前記統計学的分析が、試料を病的または非病的と分類するモデルを産生する、統計学的分析を実施する工程
を含む、方法。
66. XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、態様65記載の方法。
67. (a)対象由来の生物学的試料からのDNAを準備する工程;
(b)試料中の標的核酸分子内の非標的形態のシトシンおよび/または修飾シトシンを化学的または酵素的に非シトシン残基に変換して、変換核酸分子を産生する工程;
(c)1組のプライマーを、変性させた変換核酸分子とハイブリダイズさせ、かつ前記プライマーを伸長させて二本鎖核酸分子を産生することにより、前記変性させた変換核酸分子について第2鎖合成を実施する工程であって、前記プライマーが、ヌクレオチド配列5’-XnG-3’および/または5’-X(n-1)CG-3’を含み、ここでXは任意の塩基であり、n = 2~25である、第2鎖合成を実施する工程;
(d)本明細書に記載されるアンカー塩基第2鎖合成方法により、修飾シトシン残基を含む配列が濃縮された二本鎖核酸分子を生成する工程;ならびに
(e)前記二本鎖分子内の修飾シトシン残基の場所を、遺伝子座に対しマッピングする工程
を含む、方法。
68. XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、態様67記載の方法。
69. 前記マッピングされた修飾シトシン残基がバイオマーカーである、態様67記載の方法。
I. AB-BS(ABBSまたはABBAとも呼ばれる)
この方法は、DNAまたはRNAに存在する5mCおよび5hmC塩基はバイサルファイトと反応しないが、未修飾シトシン、5-ホルミルシトシン、および5-カルボキシシトシンは(そしておそらくはその他のまだ同定されていない修飾シトシンも)脱アミノ化され、効率よくウラシルに変換される、という事実を利用するものである。これらのウラシル部位は、クレノウエクソ-ポリメラーゼを用いての第2鎖合成後、アデニンと塩基対を形成し、したがってもとの親系統のDNAにおけるバイサルファイト反応性Cはすべてウラシルに変換され、PCRおよび/またはシーケンシングではTとして読み出される。これを利用して、本発明は、第2鎖合成中にランダムプライミングストラテジーを用いてゲノム内に存在する任意の不反応シトシン(たとえば5mCおよび5hmC)からDNAを増幅することを可能にし、ここでプライマーは、5’-HHHHHG-3’(HはGではない)(もしくは特にCpGメチル化を濃縮する際は5’-HHHHCG-3’)、または5’-NNNNNG-3’(N = A、C、G、T/U)(もしくは特にCpGメチル化を濃縮する際は5’-NNNNCG-3’)という構造を有する。3’末端のGは、バイサルファイトと反応しなかった任意のCにプライマーをアンカリングさせ、内側および5’のHは、存在する場合は、プライマーがCと部分的にハイブリダイズすることを阻止する。したがって、これらのアンカープライマーから駆動されるPCR増幅は、ゲノムにおけるメチル化および/またはヒドロキシメチル化領域を優先的に増幅することになる。
この方法は、DNAまたはRNAに存在する5mCおよび5hmC塩基はバイサルファイトと反応しないが、未修飾シトシン、5-ホルミルシトシン、および5-カルボキシシトシンは(そしておそらくはその他のまだ同定されていない修飾シトシンも)脱アミノ化され、効率よくウラシルに変換される、という事実を利用するものである。これらのウラシル部位は、クレノウエクソ-ポリメラーゼを用いての第2鎖合成後、アデニンと塩基対を形成し、したがってもとの親系統のDNAにおけるバイサルファイト反応性Cはすべてウラシルに変換され、PCRおよび/またはシーケンシングではTとして読み出される。これを利用して、本発明は、第2鎖合成中にランダムプライミングストラテジーを用いてゲノム内に存在する任意の不反応シトシン(たとえば5mCおよび5hmC)からDNAを増幅することを可能にし、ここでプライマーは、5’-HHHHHG-3’(HはGではない)(もしくは特にCpGメチル化を濃縮する際は5’-HHHHCG-3’)、または5’-NNNNNG-3’(N = A、C、G、T/U)(もしくは特にCpGメチル化を濃縮する際は5’-NNNNCG-3’)という構造を有する。3’末端のGは、バイサルファイトと反応しなかった任意のCにプライマーをアンカリングさせ、内側および5’のHは、存在する場合は、プライマーがCと部分的にハイブリダイズすることを阻止する。したがって、これらのアンカープライマーから駆動されるPCR増幅は、ゲノムにおけるメチル化および/またはヒドロキシメチル化領域を優先的に増幅することになる。
プロトコル
1/ (高効率なバイサルファイト変換を測定するため)0.5%の非メチル化ラムダDNAを添加した500 ngのDNA、EZ DNAメチル化ライトニングキット(Zymo Research Corp.)をプロトコルどおりに用いてのバイサルファイト変換。
2/ ナノドロップ(Nanodrop)定量化。
3/ 第2鎖合成:
1. 94℃で5分間
2. 4℃で5分間→5分後、溶液に5 μLのクレノウエクソ-(NEB、5 U/μL)を加え、よく混ぜる。
3. 5%のペースで4℃から37℃に漸増。
4. 37℃で60分間
5. 75℃で15分間、その後4℃/∞
4/ QiagenのMinEluteカラムを用い、洗浄2回、20 μLのトリス-HCl pH 8.0 10 mMでの溶出により、dsDNAを精製後、Qubit 2.0 dsDNA HSキットを用いて定量化。
5/ 出発材料2.5 ngの2s Swiftによるライブラリー
1/ (高効率なバイサルファイト変換を測定するため)0.5%の非メチル化ラムダDNAを添加した500 ngのDNA、EZ DNAメチル化ライトニングキット(Zymo Research Corp.)をプロトコルどおりに用いてのバイサルファイト変換。
2/ ナノドロップ(Nanodrop)定量化。
3/ 第2鎖合成:
1. 94℃で5分間
2. 4℃で5分間→5分後、溶液に5 μLのクレノウエクソ-(NEB、5 U/μL)を加え、よく混ぜる。
3. 5%のペースで4℃から37℃に漸増。
4. 37℃で60分間
5. 75℃で15分間、その後4℃/∞
4/ QiagenのMinEluteカラムを用い、洗浄2回、20 μLのトリス-HCl pH 8.0 10 mMでの溶出により、dsDNAを精製後、Qubit 2.0 dsDNA HSキットを用いて定量化。
5/ 出発材料2.5 ngの2s Swiftによるライブラリー
追加実施例:
II. AB-TAB-Seq(アンカー塩基Tet支援バイサルファイトシーケンシング)
工程:
1. 最初に、Active Motifのヒドロキシメチルコレクター-Seq(Hydroxymethyl Collector-Seq)キット(#55019)に概説されている条件で、組み換えT4ファージベータ-グルコシルトランスフェラーゼ(Active Motif cat# 81249)を用いて5hmC塩基をグルコシル化により保護する。
2. 5mCおよび5fCを組み換えTET1酵素(Active Motifのcat #81148)により酸化して5-カルボキシルシトシンを形成するが、グルコシル化5hmCはインタクトのままである。
3. 次に、酸化DNAをバイサルファイトと反応させて、ゲノム全体の未修飾シトシンおよび5-カルボキシシトシン基を脱アミノ化する。
4. 次いでDNAを精製し(Active MotifのChIP IP DNA精製キット(Purification Kit))、上述のようにクレノウエクソ-、アンカーオリゴを用いてプロセスし、二本鎖DNAライブラリーを調製する。
5. 形成したライブラリーのNGSにより、濃縮された5hmCの領域をゲノムから特定する。
II. AB-TAB-Seq(アンカー塩基Tet支援バイサルファイトシーケンシング)
工程:
1. 最初に、Active Motifのヒドロキシメチルコレクター-Seq(Hydroxymethyl Collector-Seq)キット(#55019)に概説されている条件で、組み換えT4ファージベータ-グルコシルトランスフェラーゼ(Active Motif cat# 81249)を用いて5hmC塩基をグルコシル化により保護する。
2. 5mCおよび5fCを組み換えTET1酵素(Active Motifのcat #81148)により酸化して5-カルボキシルシトシンを形成するが、グルコシル化5hmCはインタクトのままである。
3. 次に、酸化DNAをバイサルファイトと反応させて、ゲノム全体の未修飾シトシンおよび5-カルボキシシトシン基を脱アミノ化する。
4. 次いでDNAを精製し(Active MotifのChIP IP DNA精製キット(Purification Kit))、上述のようにクレノウエクソ-、アンカーオリゴを用いてプロセスし、二本鎖DNAライブラリーを調製する。
5. 形成したライブラリーのNGSにより、濃縮された5hmCの領域をゲノムから特定する。
III. AB-A3A-Seq(アンカー塩基A3A支援シーケンシング)。図面を参照のこと。
工程:
1. 組み換えTET1酵素でDNAを処理して、5mC、5hmC、5fC塩基を5caCに変換するが、未修飾シトシンはインタクトのままである。
2. 次に、TET1酸化DNAを組み換えAPOBEC3A(A3A)で処理して未修飾シトシンを脱アミノ化し、これらの塩基をウラシルに変換する。TET1により形成した5caC部位はどれも、A3Aに影響されないままである。
3. 次いでDNAを精製し(Active MotifのChIP IP DNA精製キット(Purification Kit))、上述のようにクレノウエクソ-、アンカーオリゴを用いてプロセスし、二本鎖DNAライブラリーを調製する。
4. 形成したライブラリーのNGSにより、濃縮された修飾TET酸化塩基の領域をゲノムから特定する。
工程:
1. 組み換えTET1酵素でDNAを処理して、5mC、5hmC、5fC塩基を5caCに変換するが、未修飾シトシンはインタクトのままである。
2. 次に、TET1酸化DNAを組み換えAPOBEC3A(A3A)で処理して未修飾シトシンを脱アミノ化し、これらの塩基をウラシルに変換する。TET1により形成した5caC部位はどれも、A3Aに影響されないままである。
3. 次いでDNAを精製し(Active MotifのChIP IP DNA精製キット(Purification Kit))、上述のようにクレノウエクソ-、アンカーオリゴを用いてプロセスし、二本鎖DNAライブラリーを調製する。
4. 形成したライブラリーのNGSにより、濃縮された修飾TET酸化塩基の領域をゲノムから特定する。
IV. AB-HiC
この態様では、(相互作用する座をマッピングするために)「HiC」で使用されたDNA(たとえばLieberman-Aiden et al., Science (2009) Vol. 326, Issue 5950, pp. 289-293)を断片化および熱変性に供する。次に、中温性ポリメラーゼが、モチーフコンセンサスを含む(モチーフコンセンサスにアンカリングされた)短いプライマーを用いて第2鎖を合成する。(本案ではNNNNNGまたはHHHHHGが強調されるが、本明細書に記載される任意のプライマー、および本明細書でモチーフにより例示されているようなライブラリー調製に用いられる二本鎖DNAを作ることができるプライマーを使用することができる。)(http://genome.ucsc.edu/FAQ/FAQformat#format1のブラウザー・エクステンシブル・データ(Brower Extensible Data)「BED」ファイルで)シーケンシングおよび標的ゲノム領域外のリードのフィルタリング後、特定の相互作用が抽出される。この方法は、(普通は約10億リードが必要とされる)通常のHiCと比べてかなり安価である。この具体的事例の場合、たとえばヘキサマーを含むプライマーは、シーケンシング費用を数百倍低減するであろう。
この態様では、(相互作用する座をマッピングするために)「HiC」で使用されたDNA(たとえばLieberman-Aiden et al., Science (2009) Vol. 326, Issue 5950, pp. 289-293)を断片化および熱変性に供する。次に、中温性ポリメラーゼが、モチーフコンセンサスを含む(モチーフコンセンサスにアンカリングされた)短いプライマーを用いて第2鎖を合成する。(本案ではNNNNNGまたはHHHHHGが強調されるが、本明細書に記載される任意のプライマー、および本明細書でモチーフにより例示されているようなライブラリー調製に用いられる二本鎖DNAを作ることができるプライマーを使用することができる。)(http://genome.ucsc.edu/FAQ/FAQformat#format1のブラウザー・エクステンシブル・データ(Brower Extensible Data)「BED」ファイルで)シーケンシングおよび標的ゲノム領域外のリードのフィルタリング後、特定の相互作用が抽出される。この方法は、(普通は約10億リードが必要とされる)通常のHiCと比べてかなり安価である。この具体的事例の場合、たとえばヘキサマーを含むプライマーは、シーケンシング費用を数百倍低減するであろう。
単離核酸を分析する。分析には、たとえば核酸シーケンシング、PCR、qPCR等が含まれ得る。後の分析のために一般に配列決定を行う。本明細書に記載される方法は、概してハイスループットシーケンシング法を使用する。本明細書で使用する場合、「ハイスループットシーケンシング」という用語は、何千という核酸分子の同時またはほぼ同時のシーケンシングを指す。ハイスループットシーケンシングは、「次世代シーケンシング」または「超並列シーケンシング」と呼ばれることもある。ハイスループットシーケンシングのプラットフォームとしては、限定ではないが、超並列シグネチャーシーケンシング(MPSS)、Polonyシーケンシング、454パイロシーケンシング、Illumina(Solexa)シーケンシング、SOLiDシーケンシング、Ion Torrent半導体シーケンシング、DNAナノボールシーケンシング(Complete Genomics)、Heliscope一分子シーケンシング、一分子リアルタイム(SMRT)シーケンシング(PacBio)、およびナノポアDNAシーケンシング(たとえばOxford Nanopore)が挙げられる。シーケンシングにより生成された核酸のヌクレオチド配列を本明細書では「配列情報」、「配列リード」、または「配列データ」と呼ぶ。
HiC:プロセスを簡単にまとめると、細胞をホルムアルデヒドで架橋する;DNAを制限酵素で消化して5'オーバーハングを残す;ビオチン化残基を含め、5'オーバーハングを埋める;得られた平滑末端断片を、架橋DNA断片間の連結イベントに好都合な希釈条件下で連結する(透過性細胞におけるインサイチュー連結も一つの選択肢である)。得られたDNA試料は、もともと核内で空間的に近接していた、接合部がビオチン標識されている断片からなる連結産物を含む。DNAのせん断、およびストレプトアビジンビーズを用いてビオチン含有断片を選別することにより、HiCライブラリーを作製する。次にこのライブラリーを超並列DNAシーケンシングにより分析して、相互作用する断片の一覧を生成する。
本明細書で使用する場合、特に明言しないかぎり、次の意味が適用される。「~することができる」という言葉は、強制の意味(すなわち、~でなくてはならない、という意味)ではなく、容認の意味(すなわち、~する可能性を有する、という意味)で使用される。「含む(include)」、「含む(including)」、および「含む(includes)」等の言葉は、限定ではないが、「~を含む」を意味する。単数形の「1つの(a)」、「1つの(an)」、および「その(the)」は、複数形も含む。したがって、たとえば、「1つの要素(an element)」への言及は、「1つまたは複数の」などの1つまたは複数の要素を指す他の用語および語句の使用にかかわらず、2つ以上の要素の組み合わせも含む。「少なくとも1つの」という語句は、「1つの」、「1つ以上の」、「1つまたは複数の」、および「複数」を含む。「または」という用語は、特に明言しないかぎり、排他的ではなく、すなわち「および」と「または」の両方を包含する。修飾語と一連の連続物との間の「のいずれか」という用語は、その修飾語が、その一連の連続物の各メンバーを修飾することを意味する。したがって、たとえば「少なくとも1、2、または3のいずれか」は、「少なくとも1、少なくとも2、または少なくとも3」を意味する。「~から本質的になる」という用語は、記載の要素、および言明している組み合わせの基本的かつ新規な特徴に重大な影響を与えないその他の要素を含む、ということを指す。
本明細書および図面は、本発明を開示の特定の形態に限定する意図はなく、むしろその意図は、添付の請求項に定められる本発明の趣旨および範囲内であらゆる改造物、均等物、および代替物を網羅することである、と理解すべきである。本発明の様々な局面のさらなる改造および代替の態様は、本明細書に鑑み当業者には明らかになる。したがって、本明細書および図面は、単に説明的なものであって、本発明を実施する一般的な方法を当業者に教示するためのものである、と解釈すべきである。本明細書に示され、かつ記載される本発明の諸形態は、諸態様の例と考えるべきであることを理解されたい。本明細書に説明されかつ記載された要素および材料を別のもので置き換えることもでき、部分およびプロセスを逆にすることも省略することもでき、また本発明の特定の特徴を独立して利用することもでき、それらはすべて、本発明の明細書の利益を受けた後当業者には明白になろう。添付の請求項に記載される本発明の趣旨および範囲から逸脱することなく、本明細書に記載される要素に変更を加えることができる。本明細書で用いた見出しは単に編成上のものであり、本明細書の範囲を限定するために使ったものではない。
本明細書に記載したすべての刊行物、特許、特許出願は、個々の刊行物、特許、特許出願が、参照により組み入れられることがあたかも具体的かつ個別に表明されたも同然に、参照により本明細書に組み入れられる。
I. AB-BS(ABBSまたはABBAとも呼ばれる)
この方法は、DNAまたはRNAに存在する5mCおよび5hmC塩基はバイサルファイトと反応しないが、未修飾シトシン、5-ホルミルシトシン、および5-カルボキシシトシンは(そしておそらくはその他のまだ同定されていない修飾シトシンも)脱アミノ化され、効率よくウラシルに変換される、という事実を利用するものである。これらのウラシル部位は、クレノウエクソ-ポリメラーゼを用いての第2鎖合成後、アデニンと塩基対を形成し、したがってDNAのもとの親鎖におけるバイサルファイト反応性Cはすべてウラシルに変換され、PCRおよび/またはシーケンシングではTとして読み出される。これを利用して、本発明は、第2鎖合成中にランダムプライミングストラテジーを用いてゲノム内に存在する任意の不反応シトシン(たとえば5mCおよび5hmC)からDNAを増幅することを可能にし、ここでプライマーは、5’-HHHHHG-3’(HはGではない)(もしくは特にCpGメチル化を濃縮する際は5’-HHHHCG-3’)、または5’-NNNNNG-3’(N = A、C、G、T/U)(もしくは特にCpGメチル化を濃縮する際は5’-NNNNCG-3’)という構造を有する。3’末端のGは、バイサルファイトと反応しなかった任意のCにプライマーをアンカリングさせ、内側および5’のHは、存在する場合は、プライマーがCと部分的にハイブリダイズすることを阻止する。したがって、これらのアンカープライマーから駆動されるPCR増幅は、ゲノムにおけるメチル化および/またはヒドロキシメチル化領域を優先的に増幅することになる。
この方法は、DNAまたはRNAに存在する5mCおよび5hmC塩基はバイサルファイトと反応しないが、未修飾シトシン、5-ホルミルシトシン、および5-カルボキシシトシンは(そしておそらくはその他のまだ同定されていない修飾シトシンも)脱アミノ化され、効率よくウラシルに変換される、という事実を利用するものである。これらのウラシル部位は、クレノウエクソ-ポリメラーゼを用いての第2鎖合成後、アデニンと塩基対を形成し、したがってDNAのもとの親鎖におけるバイサルファイト反応性Cはすべてウラシルに変換され、PCRおよび/またはシーケンシングではTとして読み出される。これを利用して、本発明は、第2鎖合成中にランダムプライミングストラテジーを用いてゲノム内に存在する任意の不反応シトシン(たとえば5mCおよび5hmC)からDNAを増幅することを可能にし、ここでプライマーは、5’-HHHHHG-3’(HはGではない)(もしくは特にCpGメチル化を濃縮する際は5’-HHHHCG-3’)、または5’-NNNNNG-3’(N = A、C、G、T/U)(もしくは特にCpGメチル化を濃縮する際は5’-NNNNCG-3’)という構造を有する。3’末端のGは、バイサルファイトと反応しなかった任意のCにプライマーをアンカリングさせ、内側および5’のHは、存在する場合は、プライマーがCと部分的にハイブリダイズすることを阻止する。したがって、これらのアンカープライマーから駆動されるPCR増幅は、ゲノムにおけるメチル化および/またはヒドロキシメチル化領域を優先的に増幅することになる。
Claims (69)
- a)変換核酸分子を産生するために、試料中の標的核酸分子内の非標的形態のシトシンおよび/または修飾シトシンを化学的または酵素的に非シトシン残基に変換する工程;
b)1組のプライマーを、変性させた変換核酸分子とハイブリダイズさせ、かつ前記プライマーを伸長させて二本鎖核酸分子を産生することにより、前記変性させた変換核酸分子について第2鎖合成を実施する工程であって、前記プライマーが、ヌクレオチド配列5’-XnG-3’および/または5’-X(n-1)CG-3’を含み、ここでXは任意の塩基であり、n = 2~25である、第2鎖合成を実施する工程;ならびに
c)前記二本鎖核酸分子を分析する工程
を含む、方法。 - n = 5~20、または4~9、または5である、請求項1記載の方法。
- 前記プライマーがヘキサマーである、請求項1記載の方法。
- XがN、H、I、Q、またはJのいずれかであり得る、請求項1記載の方法。
- XnGまたはX(n-1)CGが、NnGもしくはN(n-1)CG、HnGもしくはH(n-1)CG、InGもしくはI(n-1)CG、QnGもしくはQ(n-1)CG、JnGもしくはJ(n-1)CG、またはそれらの組み合わせから選択される、請求項1記載の方法。
- XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、請求項1記載の方法。
- 前記プライマーがヘキサマーである、請求項1記載の方法。
- 配列XnGまたはX(n-1)CGに関し、前記プライマーの組が完全に縮重している、請求項1~7のいずれか記載の方法。
- 前記標的核酸分子がヒトDNAを含む、請求項1記載の方法。
- 前記核酸が、病的組織または細胞、たとえばがん性細胞に由来する、請求項1記載の方法。
- 前記標的核酸分子が、精製DNAもしくはRNA、またはクロマチンを含む、請求項1記載の方法。
- 前記標的核酸が、約150ヌクレオチド~約700ヌクレオチドの長さを有する、請求項1記載の方法。
- 化学的または酵素的に変換する工程が、バイサルファイト、テン-イレブン転座メチルシトシンジオキシゲナーゼ酵素(「TET」)、およびAID/APOBEC酵素クラスの酵素(たとえばAPOBEC3A(「A3A」))の1つまたは複数での処理を含む、請求項1記載の方法。
- シトシンの標的形態が、5メチルシトシン(「5mC」)、5ヒドロキシメチルシトシン(「5hmC」)、5ホルミルシトシン(「5fC」)、および5カルボキシルシトシン(「5caC」)の1つまたは複数を含む、請求項1記載の方法。
- 化学的または酵素的に変換する工程が、5mCおよび5hmC以外のシトシン形態をウラシルに変換することを含む、請求項1記載の方法。
- 化学的または酵素的に変換する工程が、5hmC以外のシトシン形態をウラシルに変換することを含む、請求項1記載の方法。
- 化学的または酵素的に変換する工程が、シトシンをウラシルに変換するが、5mC、5hmC、5fC、または5caCはウラシルに変換しないことを含む、請求項1記載の方法。
- 非シトシン残基がウラシルである、請求項1記載の方法。
- 前記プライマーが、DNA、RNA、LNA、またはPNAを含む、請求項1記載の方法。
- 前記プライマーが、修飾リボースまたはデオキシリボースを含む、請求項1記載の方法。
- 前記プライマーが、前記プライマーの融解温度を変える修飾糖残基を含む、請求項1記載の方法。
- 前記プライマーが、アダプター配列および/またはユニバーサルプライミング配列をさらに含む、請求項1記載の方法。
- 前記アダプター配列が、P3およびP5を含む、請求項22記載の方法。
- 前記アダプター配列が、P3およびP5を含む、請求項22記載の方法。
- 前記プライマーが、試料バーコード配列を含む、請求項1記載の方法。
- 前記プライマーが、分子バーコード配列を含む、請求項1記載の方法。
- 前記プライマーが、アダプター配列および/またはユニバーサルプライミング配列をさらに含む、請求項1記載の方法。
- 第2鎖合成が、中温性または好熱性DNAポリメラーゼを用いて実施される、請求項1記載の方法。
- 第2鎖合成が、エクソ-ポリメラーゼを用いて実施される、請求項1記載の方法。
- 第2鎖合成が、クレノウエクソ-ポリメラーゼ、クレノウポリメラーゼ、T4 DNAポリメラーゼ、Taqポリメラーゼ、pfuポリメラーゼ、DNAポリメラーゼI、Phi29ポリメラーゼ、およびリバーストランスクリプターゼ(たとえば、モロニーマウス白血病ウイルス(M-MLV)、トリ骨髄芽球症ウイルス(AMV)、ならびにそれらの変異/改変バージョンから選択されるポリメラーゼを用いて実施される、請求項1記載の方法。
- 前記プライマーがビオチン化されており、方法が、ビオチンを含む二本鎖核酸分子を捕捉する工程をさらに含む、請求項1記載の方法。
- 前記核酸分子に3’末端アジド(N3)基を導入する工程;
5’-3-トリアゾール結合によりアルキル化アダプターを結合させてアダプター付き分子を産生する工程;ならびに
前記分子の5’および3’末端に相補的な1組のプライマーを用いて前記アダプター付き分子を増幅する工程
をさらに含む、請求項31記載の方法。 - アダプター付き核酸分子を産生するために、プライマー伸長後に、シーケンサー特異的アダプターを前記核酸分子に結合させる工程を含む、請求項1記載の方法。
- 結合させる工程が、末端修復、任意選択によりヌクレオチドオーバーハングの追加、および前記アダプターと平滑末端またはオーバーハングとの連結を含む、請求項33記載の方法。
- 前記アダプターが、Polonyシーケンシング、454パイロシーケンシング、Illumina(Solexa)シーケンシング、SOLiDシーケンシング、Ion Torrent半導体シーケンシング、DNAナノボールシーケンシング、Heliscope一分子シーケンシング、一分子リアルタイム(SMRT)シーケンシング、およびナノポアDNAシーケンシングによるシーケンシングに特異的である、請求項33記載の方法。
- 前記二本鎖分子がプライマーハイブリダイゼーション配列を備えており、方法が、前記二本鎖核酸分子を増幅する工程を含む、請求項1記載の方法。
- 標的ヌクレオチド配列を含む核酸の配列捕捉をさらに含む、請求項1記載の方法。
- 分析する工程が、
配列リードを産生するために、核酸増幅ありまたはなしで、前記二本鎖核酸分子のシーケンシングを行うこと
を含む、請求項1記載の方法。 - シーケンシングが、Polonyシーケンシング、454パイロシーケンシング、Illumina(Solexa)シーケンシング、SOLiDシーケンシング、Ion Torrent半導体シーケンシング、DNAナノボールシーケンシング、Heliscope一分子シーケンシング、一分子リアルタイム(SMRT)シーケンシング、またはナノポアDNAシーケンシングにより実施される、請求項38記載の方法。
- 分析が、ピーク分析またはSNP分析を含む、請求項39記載の方法。
- 前記配列リードを参照ゲノムに対しマッピングする工程を含む、請求項39記載の方法。
- 参照ゲノム内のシトシン残基に対しマッピングする前記配列リード内の1つまたは複数のシトシン残基の遺伝子座をマッピングする工程、および/または前記参照ゲノム内のシトシン残基に対しマッピングする前記配列リード内の1つまたは複数のチミジン残基の遺伝子座をマッピングする工程をさらに含み、ここで前記参照ゲノム内のシトシン残基に対しマッピングする配列リード内のシトシン残基が、配列リードを産生するためにシーケンシングされた核酸分子内の修飾シトシン残基を表す、請求項41記載の方法。
- 分析する工程が、DNAアレイ分析を含む、請求項1記載の方法。
- 前記核酸がRNAを含んでおり、第2鎖合成がdUTPヌクレオチドを用いる、請求項1記載の方法。
- 標的DNA分子が、
i)(任意選択により細胞内の)クロマチンを含む試料を準備すること;
ii)前記クロマチンにおいてタンパク質をDNAに架橋すること;任意選択により、前記架橋したクロマチンを断片化すること;および
iii)クロマチン免疫沈降(ChIP)により前記クロマチンから標的核酸分子を単離すること
により準備される、請求項1記載の方法。 - 前記免疫沈降が、ヒストン、DNAポリメラーゼ、RNAポリメラーゼ、メチル結合タンパク質と結合している核酸配列、または以下のドメイン:bZIPドメイン、DNA結合性ドメイン、ヘリックス-ループ-ヘリックス、ヘリックス-ターン-ヘリックス、MG-box、ロイシンジッパー、レキシトロプシン、核酸シミュレーション、ジンクフィンガー、ヒストンメチラーゼ、動員タンパク質、Swi6を含有するタンパク質と結合している核酸配列を標的とする、請求項45記載の方法。
- 標的DNA分子が、
i)クロマチンを含む試料を準備すること;
ii)前記クロマチンにおいて(たとえばホルムアルデヒドを用いて)タンパク質をDNAに架橋すること;
iii)クロマチンを消化して断片化クロマチンを作製すること;
iv)前記断片化クロマチンにビオチンを導入してビオチン化クロマチンを産生すること;
v)前記ビオチン化クロマチン断片同士を連結すること;
vi)前記連結断片を脱架橋、抽出、およびせん断すること;ならびに
vii)前記せん断したビオチン化断片を単離すること
により準備される、請求項1記載の方法。 - DNA中のバイサルファイト非反応性シトシンをマッピングする方法であって、
a)断片化されていてもよい核酸分子を含む試料を準備する工程;
b)前記核酸分子をバイサルファイトで処理する工程であって、処理によって未修飾シトシン残基がウラシルに変換される、処理する工程;
c)1組のプライマーを、変性させた変換核酸分子とハイブリダイズさせ、かつ前記プライマーを伸長させて二本鎖核酸分子を産生することにより、前記変性させた変換核酸分子について第2鎖合成を実施する工程であって、前記プライマーが、ヌクレオチド配列5’-XnG-3’および/または5’-X(n-1)CG-3’を含み、Xが任意の塩基であり、n = 2~25である、第2鎖合成を実施する工程;
d)前記二本鎖核酸分子に対し末端修復およびアダプター連結を実施して、アダプター付き核酸分子を産生する工程;
e)(たとえばPCRまたはqPCRにより)前記アダプター付き核酸分子を増幅する工程;ならびに
f)前記増幅した核酸分子のシーケンシングを行う工程
を含む、方法。 - XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、請求項48記載の方法。
- a)断片化されていてもよい核酸分子を含む試料を準備する工程;
b)前記核酸分子内の5-ヒドロキシメチルシトシン(「5hmC」)残基を保護する工程;
c)5-メチルシトシン(「5mC」)および/または5-ホルミルシトシン(「5fC」)を5-カルボキシルシトシン(「5caC」)残基に変換する工程;
d)前記核酸内のC、および5caC残基をウラシルに変換する工程;
e)1組のプライマーを、変性させた変換核酸分子とハイブリダイズさせ、かつ前記プライマーを伸長させて二本鎖核酸分子を産生することにより、前記変性させた変換核酸分子について第2鎖合成を実施する工程であって、前記プライマーが、ヌクレオチド配列5’-XnG-3’および/または5’-X(n-1)CG-3’を含み、Xが任意の塩基であり、n = 2~25である、第2鎖合成を実施する工程;
f)前記二本鎖核酸分子にアダプターを結合させて、アダプター付き核酸分子を産生する工程;
g)(たとえばPCRにより)前記アダプター付き核酸分子を増幅する工程;ならびに
h)前記増幅した核酸分子のシーケンシングを行う工程
を含む、方法。 - XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、請求項50記載の方法。
- 5mCおよび/または5fCが、TETでの処理により5caCに変換される、請求項50記載の方法。
- 5hmCが、たとえばT4グルコシルトランスフェラーゼを用いたグルコシル化により保護される、請求項50記載の方法。
- a)断片化されていてもよい核酸分子を含む試料を準備する工程;
b)5-メチルシトシン(「5mC」)、5-ヒドロキシメチルシトシン(「5hmC」)、および/または5-ホルミルシトシン(「5fC」)を5-カルボキシルシトシン(「5caC」)残基に変換する工程;
c)たとえばAPOBEC/AID酵素クラスの酵素を用いて、前記核酸内のC残基をウラシルに変換する工程;
d)1組のプライマーを、変性させた変換核酸分子とハイブリダイズさせ、かつ前記プライマーを伸長させて二本鎖核酸分子を産生することにより、前記変性させた変換核酸分子について第2鎖合成を実施する工程であって、前記プライマーが、ヌクレオチド配列5’-XnG-3’および/または5’-X(n-1)CG-3’を含み、ここでXは任意の塩基であり、n = 2~25である、第2鎖合成を実施する工程;
e)前記二本鎖核酸分子にアダプターを結合させて、アダプター付き核酸分子を産生する工程;
f)(たとえばPCRにより)前記アダプター付き核酸分子を増幅する工程;ならびに
g)たとえばシーケンシングまたはDNAアレイ分析により、前記増幅した核酸分子を分析する工程
を含む、方法。 - XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、請求項54記載の方法。
- 以下:
(a)ヌクレオチド配列を含む1組のプライマーであって、前記プライマーがヌクレオチド配列5’-XnG-3’および/または5’-X(n-1)CG-3’を含み、Xが任意の塩基であり、n = 2~25である、1組のプライマー;
(b)1つまたは複数の容器であって、それぞれの容器が(i)ナトリウムバイサルファイト、(2)テン-イレブン転座メチルシトシンジオキシゲナーゼ1(「TET1」)、T4ベータ-グルコシル-トランスフェラーゼ、APOBEC3A(「A3A」)、またはAID/APOBECクラスのデアミナーゼからの酵素のうち1つを含む、容器
を含む、キット。 - XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、請求項56記載の方法。
- ヒト、マウス、または無脊椎動物(たとえばネグレリア(Naegleria)、ショウジョウバエ(Drosophila))由来のTET1を含む、請求項56記載のキット。
- 「X」が、たとえば(デオキシ)イノシン、ネブラリン、3-ニトロピロール、5-ニトロインドールから選択される、少なくとも1つのユニバーサル塩基を含む、請求項56記載のキット。
- 以下:
(a)ヌクレオチド配列5’-XnG-3’および/または5’-X(n-1)CG-3’を含む1組のプライマーであって、Xが任意の塩基であり、n = 2~25である、1組のプライマー;
(b)標的核酸分子内の全部ではないが少なくとも1つの形態のシトシンまたは修飾シトシンがウラシルに変換されている、核酸分子
を含む、キット。 - XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、請求項60記載の方法。
- 以下:
(a)ヌクレオチド配列5’-XnG-3’および/または5’-X(n-1)CG-3’を含む1組のプライマーであって、Xが任意の塩基であり、n = 2~25であり、前記プライマーがタグ、たとえばビオチンを含んでいる、1組のプライマー;
(b)3'-アジド-ddGTP;
(c)5’アルキルオリゴ;ならびに
(d)標的核酸分子内の全部ではないが少なくとも1つの形態のシトシンまたは修飾シトシンが に変換されている、核酸分子
を含む、キット。 - 以下:
a)一本鎖核酸分子の集団;ならびに
b)前記aにハイブリダイズした、ヌクレオチド配列5’-HnG-3’および/または5’-H(n-1)CG-3’を含む1組のプライマーであって、Xが任意の塩基であり、n = 2~25である、1組のプライマー
を含む、組成物。 - XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、請求項63記載の方法。
- 試料を病的または非病的と分類するモデルを生成する方法であって、
a)病状を有する第1の組の対象に由来する第1の組の核酸分子、および病状を有さない第2の組の対象に由来する第2の組の核酸分子を準備する工程;
b)前記試料中の核酸分子を以下:
(i)変換核酸分子を産生するために、試料中の標的核酸分子内の非標的形態のシトシンおよび/または修飾シトシンを化学的または酵素的に非シトシン残基に変換すること;
(ii)1組のプライマーを、変性させた変換核酸分子とハイブリダイズさせ、かつ前記プライマーを伸長させて二本鎖核酸分子を産生することにより、前記変性させた変換核酸分子について第2鎖合成を実施することであって、前記プライマーが、ヌクレオチド配列5’-XnG-3’および/または5’-X(n-1)CG-3’を含み、ここでXは任意の塩基であり、n = 2~25である、第2鎖合成を実施すること
により処理する工程;ならびに
c)前記二本鎖核酸分子を分析して、前記試料中の塩基修飾をマッピングするデータを産生する工程;
d)前記試料中の塩基修飾の位置の違いを比較するために前記データの統計学的分析を実施する工程であって、前記統計学的分析が、試料を病的または非病的と分類するモデルを産生する、統計学的分析を実施する工程
を含む、方法。 - XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、請求項65記載の方法。
- (a)対象由来の生物学的試料からのDNAを準備する工程;
(b)試料中の標的核酸分子内の非標的形態のシトシンおよび/または修飾シトシンを化学的または酵素的に非シトシン残基に変換して、変換核酸分子を産生する工程;
(c)1組のプライマーを、変性させた変換核酸分子とハイブリダイズさせ、かつ前記プライマーを伸長させて二本鎖核酸分子を産生することにより、前記変性させた変換核酸分子について第2鎖合成を実施する工程であって、前記プライマーが、ヌクレオチド配列5’-XnG-3’および/または5’-X(n-1)CG-3’を含み、ここでXは任意の塩基であり、n = 2~25である、第2鎖合成を実施する工程;
(d)本明細書に記載されるアンカー塩基第2鎖合成方法により、修飾シトシン残基を含む配列が濃縮された二本鎖核酸分子を生成する工程;ならびに
(e)前記二本鎖分子内の修飾シトシン残基の場所を、遺伝子座に対しマッピングする工程
を含む、方法。 - XnGが5’-NNNNNG-3’または5’-HHHHHG-3’であり、X(n-1)CGが5’-NNNNCG-3’または5’-HHHHCG-3’である、請求項67記載の方法。
- 前記マッピングされた修飾シトシン残基がバイオマーカーである、請求項67記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962953080P | 2019-12-23 | 2019-12-23 | |
US62/953,080 | 2019-12-23 | ||
PCT/US2020/066986 WO2021133999A1 (en) | 2019-12-23 | 2020-12-23 | Methods and kits for the enrichment and detection of dna and rna modifications and functional motifs |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023508795A true JP2023508795A (ja) | 2023-03-06 |
Family
ID=76575145
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021569030A Pending JP2023508795A (ja) | 2019-12-23 | 2020-12-23 | Dnaおよびrna修飾の濃縮および検出のための方法およびキット、ならびに機能モチーフ |
Country Status (6)
Country | Link |
---|---|
US (1) | US20220162675A1 (ja) |
EP (1) | EP3959342A4 (ja) |
JP (1) | JP2023508795A (ja) |
CN (1) | CN114072525A (ja) |
CA (1) | CA3162799A1 (ja) |
WO (1) | WO2021133999A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4034676A1 (en) | 2020-07-30 | 2022-08-03 | Cambridge Epigenetix Limited | Compositions and methods for nucleic acid analysis |
CN118215743A (zh) * | 2021-11-04 | 2024-06-18 | 通用诊断股份公司 | 用于制备用于基因测序的生物样品的系统和方法 |
CN115323035B (zh) * | 2022-10-18 | 2023-02-10 | 翌圣生物科技(上海)股份有限公司 | 一种检测tet酶氧化能力的方法 |
CN117343929B (zh) * | 2023-12-06 | 2024-04-05 | 广州迈景基因医学科技有限公司 | 一种pcr随机引物及用其加强靶向富集的方法 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003144172A (ja) * | 2001-11-16 | 2003-05-20 | Nisshinbo Ind Inc | メチル化検出用オリゴヌクレオチド固定化基板 |
WO2008130516A1 (en) * | 2007-04-11 | 2008-10-30 | Manel Esteller | Epigenetic biomarkers for early detection, therapeutic effectiveness, and relapse monitoring of cancer |
WO2009091847A2 (en) * | 2008-01-14 | 2009-07-23 | Life Technologies Corporation | Compositions, methods and systems for single molecule sequencing |
US10689643B2 (en) | 2011-11-22 | 2020-06-23 | Active Motif, Inc. | Targeted transposition for use in epigenetic studies |
WO2013163207A1 (en) * | 2012-04-24 | 2013-10-31 | Pacific Biosciences Of California, Inc. | Identification of 5-methyl-c in nucleic acid templates |
US20130310550A1 (en) * | 2012-05-15 | 2013-11-21 | Anthony P. Shuber | Primers for analyzing methylated sequences and methods of use thereof |
CN104250663B (zh) * | 2013-06-27 | 2017-09-15 | 北京大学 | 甲基化CpG岛的高通量测序检测方法 |
EP3239302A4 (en) * | 2014-12-26 | 2018-05-23 | Peking University | Method for detecting differentially methylated cpg islands associated with abnormal state of human body |
CA2980327A1 (en) * | 2015-03-26 | 2016-09-29 | Quest Diagnostics Investments Incorporated | Alignment and variant sequencing analysis pipeline |
WO2017035821A1 (zh) * | 2015-09-02 | 2017-03-09 | 中国科学院北京基因组研究所 | RNA 5mC重亚硫酸盐测序的文库构建方法及其应用 |
US10260088B2 (en) * | 2015-10-30 | 2019-04-16 | New England Biolabs, Inc. | Compositions and methods for analyzing modified nucleotides |
CN105986035A (zh) * | 2016-07-02 | 2016-10-05 | 杭州艾迪康医学检验中心有限公司 | Sfrp1基因启动子甲基化检测的引物和检测方法 |
CN109182465B (zh) * | 2018-08-03 | 2021-12-17 | 中山大学 | 一种高通量核酸表观遗传修饰定量分析方法 |
-
2020
- 2020-12-23 CA CA3162799A patent/CA3162799A1/en active Pending
- 2020-12-23 EP EP20906164.7A patent/EP3959342A4/en active Pending
- 2020-12-23 CN CN202080049544.0A patent/CN114072525A/zh active Pending
- 2020-12-23 WO PCT/US2020/066986 patent/WO2021133999A1/en unknown
- 2020-12-23 JP JP2021569030A patent/JP2023508795A/ja active Pending
- 2020-12-23 US US17/616,147 patent/US20220162675A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CA3162799A1 (en) | 2021-07-01 |
EP3959342A1 (en) | 2022-03-02 |
WO2021133999A1 (en) | 2021-07-01 |
US20220162675A1 (en) | 2022-05-26 |
EP3959342A4 (en) | 2023-05-24 |
CN114072525A (zh) | 2022-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220162675A1 (en) | Methods and kits for the enrichment and detection of dna and rna modifications and functional motifs | |
CN111032881A (zh) | 核酸的精确和大规模平行定量 | |
JP2010535513A (ja) | 高スループット亜硫酸水素dnaシークエンシングのための方法および組成物ならびに有用性 | |
EP2722401B1 (en) | Addition of an adaptor by invasive cleavage | |
WO2013192292A1 (en) | Massively-parallel multiplex locus-specific nucleic acid sequence analysis | |
US11608518B2 (en) | Methods for analyzing nucleic acids | |
CA3225385A1 (en) | Modified adapters for enzymatic dna deamination and methods of use thereof for epigenetic sequencing of free and immobilized dna | |
Tost | Current and emerging technologies for the analysis of the genome-wide and locus-specific DNA methylation patterns | |
Halabian et al. | Laboratory methods to decipher epigenetic signatures: a comparative review | |
CN110869515A (zh) | 用于基因组重排检测的测序方法 | |
Tost | Current and emerging technologies for the analysis of the genome-wide and locus-specific DNA methylation patterns | |
EP3022321B1 (en) | Mirror bisulfite analysis | |
US11898202B2 (en) | Methods for accurate parallel quantification of nucleic acids in dilute or non-purified samples | |
US20220162676A1 (en) | Methods and Kits for Detection of N-4-acetyldeoxycytidine in DNA | |
US20060240431A1 (en) | Oligonucletide guided analysis of gene expression | |
US11905555B2 (en) | Methods for the amplification of bisulfite-treated DNA | |
EP4296372A1 (en) | Method to detect and discriminate cytosine modifications | |
JP2024035110A (ja) | 変異核酸の正確な並行定量するための高感度方法 | |
JP2024035109A (ja) | 核酸の正確な並行検出及び定量のための方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220725 Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220202 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231011 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20240207 |