JP2023551072A - Rnaおよびdna修飾の多重プロファイリング - Google Patents
Rnaおよびdna修飾の多重プロファイリング Download PDFInfo
- Publication number
- JP2023551072A JP2023551072A JP2023555121A JP2023555121A JP2023551072A JP 2023551072 A JP2023551072 A JP 2023551072A JP 2023555121 A JP2023555121 A JP 2023555121A JP 2023555121 A JP2023555121 A JP 2023555121A JP 2023551072 A JP2023551072 A JP 2023551072A
- Authority
- JP
- Japan
- Prior art keywords
- nucleic acid
- target nucleic
- binding molecule
- rna
- barcode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000026279 RNA modification Effects 0.000 title abstract description 65
- 230000008836 DNA modification Effects 0.000 title abstract description 32
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 789
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 773
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 772
- 238000000034 method Methods 0.000 claims abstract description 224
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 107
- 230000004048 modification Effects 0.000 claims abstract description 106
- 238000012986 modification Methods 0.000 claims abstract description 106
- 238000012163 sequencing technique Methods 0.000 claims abstract description 55
- 239000000203 mixture Substances 0.000 claims abstract description 35
- 230000003902 lesion Effects 0.000 claims abstract description 11
- 230000027455 binding Effects 0.000 claims description 638
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 262
- 108020004414 DNA Proteins 0.000 claims description 206
- 102000004190 Enzymes Human genes 0.000 claims description 121
- 108090000790 Enzymes Proteins 0.000 claims description 121
- 239000011324 bead Substances 0.000 claims description 118
- 102000004169 proteins and genes Human genes 0.000 claims description 100
- 239000000758 substrate Substances 0.000 claims description 83
- 125000003729 nucleotide group Chemical group 0.000 claims description 81
- 239000002773 nucleotide Substances 0.000 claims description 80
- 238000006243 chemical reaction Methods 0.000 claims description 77
- 239000012634 fragment Substances 0.000 claims description 68
- 108091034117 Oligonucleotide Proteins 0.000 claims description 55
- 238000012546 transfer Methods 0.000 claims description 52
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 47
- 108010020764 Transposases Proteins 0.000 claims description 36
- 102000008579 Transposases Human genes 0.000 claims description 36
- 238000003776 cleavage reaction Methods 0.000 claims description 35
- 230000007017 scission Effects 0.000 claims description 35
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 34
- 230000000295 complement effect Effects 0.000 claims description 23
- 230000003546 nucleic acid damage Effects 0.000 claims description 22
- 230000035772 mutation Effects 0.000 claims description 21
- OGHAROSJZRTIOK-KQYNXXCUSA-O 7-methylguanosine Chemical compound C1=2N=C(N)NC(=O)C=2[N+](C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OGHAROSJZRTIOK-KQYNXXCUSA-O 0.000 claims description 19
- 239000002777 nucleoside Substances 0.000 claims description 19
- 102000000311 Cytosine Deaminase Human genes 0.000 claims description 18
- 108010080611 Cytosine Deaminase Proteins 0.000 claims description 18
- 101000964378 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3A Proteins 0.000 claims description 18
- 102100034343 Integrase Human genes 0.000 claims description 18
- 229960003786 inosine Drugs 0.000 claims description 18
- 108010079649 APOBEC-1 Deaminase Proteins 0.000 claims description 17
- 102100040397 C->U-editing enzyme APOBEC-1 Human genes 0.000 claims description 17
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 claims description 17
- 229930010555 Inosine Natural products 0.000 claims description 17
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 claims description 17
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 claims description 17
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 claims description 17
- 102100040263 DNA dC->dU-editing enzyme APOBEC-3A Human genes 0.000 claims description 16
- 230000003197 catalytic effect Effects 0.000 claims description 16
- 150000003833 nucleoside derivatives Chemical class 0.000 claims description 16
- 125000003835 nucleoside group Chemical group 0.000 claims description 16
- 239000000126 substance Substances 0.000 claims description 15
- 230000002441 reversible effect Effects 0.000 claims description 14
- 230000015572 biosynthetic process Effects 0.000 claims description 13
- 230000008569 process Effects 0.000 claims description 13
- 238000013518 transcription Methods 0.000 claims description 13
- 230000035897 transcription Effects 0.000 claims description 13
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 claims description 12
- ZAYHVCMSTBRABG-JXOAFFINSA-N 5-methylcytidine Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZAYHVCMSTBRABG-JXOAFFINSA-N 0.000 claims description 12
- 102000055025 Adenosine deaminases Human genes 0.000 claims description 12
- 101800000120 Host translation inhibitor nsp1 Proteins 0.000 claims description 12
- 101800000517 Leader protein Proteins 0.000 claims description 12
- 101800000512 Non-structural protein 1 Proteins 0.000 claims description 12
- 229930185560 Pseudouridine Natural products 0.000 claims description 12
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 claims description 12
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 claims description 12
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 claims description 12
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N(6)-methyladenosine Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 claims description 11
- 230000006378 damage Effects 0.000 claims description 11
- 229920000642 polymer Polymers 0.000 claims description 11
- DKGDFQNNQSTBHA-UHFFFAOYSA-N pyrimidine;1h-pyrimidin-2-one Chemical compound C1=CN=CN=C1.O=C1N=CC=CN1 DKGDFQNNQSTBHA-UHFFFAOYSA-N 0.000 claims description 11
- OCMSXKMNYAHJMU-JXOAFFINSA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-oxopyrimidine-5-carbaldehyde Chemical compound C1=C(C=O)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 OCMSXKMNYAHJMU-JXOAFFINSA-N 0.000 claims description 10
- NFEXJLMYXXIWPI-JXOAFFINSA-N 5-Hydroxymethylcytidine Chemical compound C1=C(CO)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NFEXJLMYXXIWPI-JXOAFFINSA-N 0.000 claims description 10
- ZAYHVCMSTBRABG-UHFFFAOYSA-N 5-Methylcytidine Natural products O=C1N=C(N)C(C)=CN1C1C(O)C(O)C(CO)O1 ZAYHVCMSTBRABG-UHFFFAOYSA-N 0.000 claims description 10
- 208000035657 Abasia Diseases 0.000 claims description 10
- 230000029936 alkylation Effects 0.000 claims description 10
- 238000005804 alkylation reaction Methods 0.000 claims description 10
- GFYLSDSUCHVORB-IOSLPCCCSA-N 1-methyladenosine Chemical compound C1=NC=2C(=N)N(C)C=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O GFYLSDSUCHVORB-IOSLPCCCSA-N 0.000 claims description 9
- UBKVUFQGVWHZIR-UHFFFAOYSA-N 8-oxoguanine Chemical compound O=C1NC(N)=NC2=NC(=O)N=C21 UBKVUFQGVWHZIR-UHFFFAOYSA-N 0.000 claims description 9
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 claims description 9
- SLEHROROQDYRAW-KQYNXXCUSA-N N(2)-methylguanosine Chemical compound C1=NC=2C(=O)NC(NC)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O SLEHROROQDYRAW-KQYNXXCUSA-N 0.000 claims description 9
- 239000003795 chemical substances by application Substances 0.000 claims description 9
- 229960004316 cisplatin Drugs 0.000 claims description 9
- ZPTBLXKRQACLCR-XVFCMESISA-N dihydrouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)CC1 ZPTBLXKRQACLCR-XVFCMESISA-N 0.000 claims description 9
- 239000000539 dimer Substances 0.000 claims description 9
- 238000004519 manufacturing process Methods 0.000 claims description 9
- DWRXFEITVBNRMK-JXOAFFINSA-N ribothymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 DWRXFEITVBNRMK-JXOAFFINSA-N 0.000 claims description 9
- DURPCDWAXYKPIO-STAMCERTSA-N (2r,3s,5r)-5-(6-amino-6-methyl-8h-purin-9-yl)-2-(hydroxymethyl)oxolan-3-ol Chemical compound C1N=C2C(C)(N)N=CN=C2N1[C@H]1C[C@H](O)[C@@H](CO)O1 DURPCDWAXYKPIO-STAMCERTSA-N 0.000 claims description 8
- UTQUILVPBZEHTK-ZOQUXTDFSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-3-methylpyrimidine-2,4-dione Chemical compound O=C1N(C)C(=O)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UTQUILVPBZEHTK-ZOQUXTDFSA-N 0.000 claims description 8
- UTAIYTHAJQNQDW-KQYNXXCUSA-N 1-methylguanosine Chemical compound C1=NC=2C(=O)N(C)C(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O UTAIYTHAJQNQDW-KQYNXXCUSA-N 0.000 claims description 8
- NVKAMPJSWMHVDK-GITKWUPZSA-N 2-amino-9-[(2r,3r,4r,5r)-3,4-dihydroxy-5-(hydroxymethyl)-3-methyloxolan-2-yl]-3h-purin-6-one Chemical compound C[C@@]1(O)[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC(N)=NC(O)=C2N=C1 NVKAMPJSWMHVDK-GITKWUPZSA-N 0.000 claims description 8
- RDPUKVRQKWBSPK-UHFFFAOYSA-N 3-Methylcytidine Natural products O=C1N(C)C(=N)C=CN1C1C(O)C(O)C(CO)O1 RDPUKVRQKWBSPK-UHFFFAOYSA-N 0.000 claims description 8
- UTQUILVPBZEHTK-UHFFFAOYSA-N 3-Methyluridine Natural products O=C1N(C)C(=O)C=CN1C1C(O)C(O)C(CO)O1 UTQUILVPBZEHTK-UHFFFAOYSA-N 0.000 claims description 8
- RDPUKVRQKWBSPK-ZOQUXTDFSA-N 3-methylcytidine Chemical compound O=C1N(C)C(=N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RDPUKVRQKWBSPK-ZOQUXTDFSA-N 0.000 claims description 8
- QBADNGFALQJSIH-XLPZGREQSA-N 4-amino-1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-oxopyrimidine-5-carbaldehyde Chemical compound C1=C(C=O)C(N)=NC(=O)N1[C@@H]1O[C@H](CO)[C@@H](O)C1 QBADNGFALQJSIH-XLPZGREQSA-N 0.000 claims description 8
- FHPQEVWDHUHVGT-RRKCRQDMSA-N 4-amino-1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-oxopyrimidine-5-carboxylic acid Chemical compound C1=C(C(O)=O)C(N)=NC(=O)N1[C@@H]1O[C@H](CO)[C@@H](O)C1 FHPQEVWDHUHVGT-RRKCRQDMSA-N 0.000 claims description 8
- HMUOMFLFUUHUPE-XLPZGREQSA-N 4-amino-1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-(hydroxymethyl)pyrimidin-2-one Chemical compound C1=C(CO)C(N)=NC(=O)N1[C@@H]1O[C@H](CO)[C@@H](O)C1 HMUOMFLFUUHUPE-XLPZGREQSA-N 0.000 claims description 8
- LUCHPKXVUGJYGU-XLPZGREQSA-N 5-methyl-2'-deoxycytidine Chemical compound O=C1N=C(N)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 LUCHPKXVUGJYGU-XLPZGREQSA-N 0.000 claims description 8
- BXJHWYVXLGLDMZ-UHFFFAOYSA-N 6-O-methylguanine Chemical compound COC1=NC(N)=NC2=C1NC=N2 BXJHWYVXLGLDMZ-UHFFFAOYSA-N 0.000 claims description 8
- 241000588724 Escherichia coli Species 0.000 claims description 8
- NIDVTARKFBZMOT-PEBGCTIMSA-N N(4)-acetylcytidine Chemical compound O=C1N=C(NC(=O)C)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NIDVTARKFBZMOT-PEBGCTIMSA-N 0.000 claims description 8
- 102100037011 RNA cytidine acetyltransferase Human genes 0.000 claims description 8
- 108010012306 Tn5 transposase Proteins 0.000 claims description 8
- 108091027569 Z-DNA Proteins 0.000 claims description 8
- DQEPMTIXHXSFOR-UHFFFAOYSA-N benzo[a]pyrene diol epoxide I Chemical class C1=C2C(C3OC3C(C3O)O)=C3C=C(C=C3)C2=C2C3=CC=CC2=C1 DQEPMTIXHXSFOR-UHFFFAOYSA-N 0.000 claims description 8
- 230000011987 methylation Effects 0.000 claims description 8
- 238000007069 methylation reaction Methods 0.000 claims description 8
- 230000001590 oxidative effect Effects 0.000 claims description 8
- LQMSDHNRPMNYLK-RRKCRQDMSA-N 2-[2-amino-9-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]purin-6-yl]oxyacetic acid Chemical compound C12=NC(N)=NC(OCC(O)=O)=C2N=CN1[C@H]1C[C@H](O)[C@@H](CO)O1 LQMSDHNRPMNYLK-RRKCRQDMSA-N 0.000 claims description 7
- 102100030461 Alpha-ketoglutarate-dependent dioxygenase FTO Human genes 0.000 claims description 7
- HYOROLAKTFTGMP-ZYPUDGPYSA-N 6-amino-3-[(2R,4S,5R)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-6-methyl-1H-pyrimidin-2-one Chemical compound CC1(NC(N([C@H]2C[C@H](O)[C@@H](CO)O2)C=C1)=O)N HYOROLAKTFTGMP-ZYPUDGPYSA-N 0.000 claims description 6
- 102100039086 Alpha-ketoglutarate-dependent dioxygenase alkB homolog 3 Human genes 0.000 claims description 6
- 101001062620 Homo sapiens Alpha-ketoglutarate-dependent dioxygenase FTO Proteins 0.000 claims description 6
- 101001024635 Homo sapiens RNA cytidine acetyltransferase Proteins 0.000 claims description 6
- 102100040619 N6-adenosine-methyltransferase catalytic subunit Human genes 0.000 claims description 6
- 101710124239 Poly(A) polymerase Proteins 0.000 claims description 6
- 102100030662 U8 snoRNA-decapping enzyme Human genes 0.000 claims description 6
- 101000959152 Homo sapiens Alpha-ketoglutarate-dependent dioxygenase alkB homolog 3 Proteins 0.000 claims description 5
- 101000967135 Homo sapiens N6-adenosine-methyltransferase catalytic subunit Proteins 0.000 claims description 5
- 101001108656 Homo sapiens RNA cytosine C(5)-methyltransferase NSUN2 Proteins 0.000 claims description 5
- 101000959153 Homo sapiens RNA demethylase ALKBH5 Proteins 0.000 claims description 5
- 101000991942 Homo sapiens U8 snoRNA-decapping enzyme Proteins 0.000 claims description 5
- 102100021555 RNA cytosine C(5)-methyltransferase NSUN2 Human genes 0.000 claims description 5
- 102100039083 RNA demethylase ALKBH5 Human genes 0.000 claims description 5
- 239000003153 chemical reaction reagent Substances 0.000 claims description 5
- VTGOHKSTWXHQJK-UHFFFAOYSA-N pyrimidin-2-ol Chemical compound OC1=NC=CC=N1 VTGOHKSTWXHQJK-UHFFFAOYSA-N 0.000 claims description 5
- 102100028986 tRNA-dihydrouridine(20) synthase [NAD(P)+]-like Human genes 0.000 claims description 5
- 102100023900 3'-5' RNA helicase YTHDC2 Human genes 0.000 claims description 4
- 108091081406 G-quadruplex Proteins 0.000 claims description 4
- 101000976336 Homo sapiens 3'-5' RNA helicase YTHDC2 Proteins 0.000 claims description 4
- 101000838340 Homo sapiens tRNA-dihydrouridine(20) synthase [NAD(P)+]-like Proteins 0.000 claims description 4
- 108010066587 tRNA Methyltransferases Proteins 0.000 claims description 4
- 102000018477 tRNA Methyltransferases Human genes 0.000 claims description 4
- 108091023037 Aptamer Proteins 0.000 claims description 3
- 101001012525 Homo sapiens mRNA N(3)-methylcytidine methyltransferase METTL8 Proteins 0.000 claims description 3
- 108010061833 Integrases Proteins 0.000 claims description 3
- 230000001939 inductive effect Effects 0.000 claims description 3
- 102100029741 mRNA N(3)-methylcytidine methyltransferase METTL8 Human genes 0.000 claims description 3
- 108010049718 pseudouridine synthases Proteins 0.000 claims description 3
- 230000005855 radiation Effects 0.000 claims description 3
- DNYQNXJGNKQOQK-LKEWCRSYSA-N 1-[(2r,4s,5r)-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-4-(methylamino)pyrimidin-2-one Chemical compound O=C1N=C(NC)C=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 DNYQNXJGNKQOQK-LKEWCRSYSA-N 0.000 claims description 2
- 101001013582 Homo sapiens N6-adenosine-methyltransferase non-catalytic subunit Proteins 0.000 claims description 2
- 101000990485 Homo sapiens RNA N6-adenosine-methyltransferase METTL16 Proteins 0.000 claims description 2
- 102100031578 N6-adenosine-methyltransferase non-catalytic subunit Human genes 0.000 claims description 2
- 102100030522 RNA N6-adenosine-methyltransferase METTL16 Human genes 0.000 claims description 2
- 239000011159 matrix material Substances 0.000 claims description 2
- BVAMAHMOUQYYPL-UHFFFAOYSA-N N1=CN=CC=C1.C1=CCC1 Chemical class N1=CN=CC=C1.C1=CCC1 BVAMAHMOUQYYPL-UHFFFAOYSA-N 0.000 claims 1
- 108091028664 Ribonucleotide Proteins 0.000 claims 1
- 241000235346 Schizosaccharomyces Species 0.000 claims 1
- 238000010382 chemical cross-linking Methods 0.000 claims 1
- 239000002336 ribonucleotide Substances 0.000 claims 1
- 125000002652 ribonucleotide group Chemical group 0.000 claims 1
- 238000010586 diagram Methods 0.000 abstract description 26
- 230000004807 localization Effects 0.000 abstract description 9
- 238000001712 DNA sequencing Methods 0.000 abstract description 8
- 238000003559 RNA-seq method Methods 0.000 abstract description 5
- 125000006850 spacer group Chemical group 0.000 description 90
- 235000018102 proteins Nutrition 0.000 description 85
- 230000000694 effects Effects 0.000 description 37
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 36
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 29
- 239000000523 sample Substances 0.000 description 28
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 26
- 229920001223 polyethylene glycol Polymers 0.000 description 26
- 238000003752 polymerase chain reaction Methods 0.000 description 26
- 239000002299 complementary DNA Substances 0.000 description 25
- 238000002372 labelling Methods 0.000 description 25
- 102000053602 DNA Human genes 0.000 description 22
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 22
- 210000004027 cell Anatomy 0.000 description 21
- 238000009396 hybridization Methods 0.000 description 21
- 238000002360 preparation method Methods 0.000 description 21
- 230000009615 deamination Effects 0.000 description 20
- 238000006481 deamination reaction Methods 0.000 description 20
- 238000003556 assay Methods 0.000 description 19
- 239000000243 solution Substances 0.000 description 19
- 229940035893 uracil Drugs 0.000 description 18
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 17
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 17
- 101710120037 Toxin CcdB Proteins 0.000 description 17
- 238000004458 analytical method Methods 0.000 description 17
- 239000000047 product Substances 0.000 description 17
- -1 rRNA Proteins 0.000 description 16
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 15
- 108010090804 Streptavidin Proteins 0.000 description 15
- 229960002685 biotin Drugs 0.000 description 15
- 235000020958 biotin Nutrition 0.000 description 15
- 239000011616 biotin Substances 0.000 description 15
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 15
- 108020001507 fusion proteins Proteins 0.000 description 15
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 14
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 14
- 102000037865 fusion proteins Human genes 0.000 description 14
- 238000010839 reverse transcription Methods 0.000 description 14
- 239000002202 Polyethylene glycol Substances 0.000 description 13
- 239000000872 buffer Substances 0.000 description 13
- KOUZWQLNUJWNIA-UHFFFAOYSA-N 2-hydrazinylpyridine-3-carboxamide Chemical compound NNC1=NC=CC=C1C(N)=O KOUZWQLNUJWNIA-UHFFFAOYSA-N 0.000 description 12
- 229940104302 cytosine Drugs 0.000 description 12
- 238000000926 separation method Methods 0.000 description 12
- 102100028875 Formylglycine-generating enzyme Human genes 0.000 description 11
- 101710192607 Formylglycine-generating enzyme Proteins 0.000 description 11
- 101710192761 Serine-type anaerobic sulfatase-maturating enzyme Proteins 0.000 description 11
- 238000004132 cross linking Methods 0.000 description 11
- 239000000463 material Substances 0.000 description 11
- 206010028980 Neoplasm Diseases 0.000 description 10
- 150000001413 amino acids Chemical group 0.000 description 10
- 238000013459 approach Methods 0.000 description 10
- 201000011510 cancer Diseases 0.000 description 10
- 201000010099 disease Diseases 0.000 description 10
- 238000000338 in vitro Methods 0.000 description 10
- 108020004999 messenger RNA Proteins 0.000 description 10
- 238000003199 nucleic acid amplification method Methods 0.000 description 10
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 9
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 9
- 229960005305 adenosine Drugs 0.000 description 9
- 229940024606 amino acid Drugs 0.000 description 9
- 230000003321 amplification Effects 0.000 description 9
- 239000000427 antigen Substances 0.000 description 9
- 108091007433 antigens Proteins 0.000 description 9
- 102000036639 antigens Human genes 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 230000000670 limiting effect Effects 0.000 description 9
- 238000006276 transfer reaction Methods 0.000 description 9
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 8
- 102000005381 Cytidine Deaminase Human genes 0.000 description 8
- 108010031325 Cytidine deaminase Proteins 0.000 description 8
- 102000004594 DNA Polymerase I Human genes 0.000 description 8
- 108010017826 DNA Polymerase I Proteins 0.000 description 8
- 230000005778 DNA damage Effects 0.000 description 8
- 231100000277 DNA damage Toxicity 0.000 description 8
- 238000002965 ELISA Methods 0.000 description 8
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 8
- 101710086015 RNA ligase Proteins 0.000 description 8
- 239000013614 RNA sample Substances 0.000 description 8
- 235000001014 amino acid Nutrition 0.000 description 8
- 238000007385 chemical modification Methods 0.000 description 8
- 238000002474 experimental method Methods 0.000 description 8
- 230000014509 gene expression Effects 0.000 description 8
- 239000011780 sodium chloride Substances 0.000 description 8
- 230000008685 targeting Effects 0.000 description 8
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 8
- 102100029791 Double-stranded RNA-specific adenosine deaminase Human genes 0.000 description 7
- 101000865408 Homo sapiens Double-stranded RNA-specific adenosine deaminase Proteins 0.000 description 7
- 102000003960 Ligases Human genes 0.000 description 7
- 108090000364 Ligases Proteins 0.000 description 7
- UGJBHEZMOKVTIM-UHFFFAOYSA-N N-formylglycine Chemical compound OC(=O)CNC=O UGJBHEZMOKVTIM-UHFFFAOYSA-N 0.000 description 7
- 108010092505 SpyTag peptide Proteins 0.000 description 7
- 108020004566 Transfer RNA Proteins 0.000 description 7
- 230000008901 benefit Effects 0.000 description 7
- 238000001514 detection method Methods 0.000 description 7
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 7
- 230000004927 fusion Effects 0.000 description 7
- 230000003993 interaction Effects 0.000 description 7
- 239000002953 phosphate buffered saline Substances 0.000 description 7
- 102000004196 processed proteins & peptides Human genes 0.000 description 7
- 238000005406 washing Methods 0.000 description 7
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 6
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 6
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 6
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 6
- 229910019142 PO4 Inorganic materials 0.000 description 6
- 229920001213 Polysorbate 20 Polymers 0.000 description 6
- 229920002684 Sepharose Polymers 0.000 description 6
- 108020004682 Single-Stranded DNA Proteins 0.000 description 6
- 150000001412 amines Chemical class 0.000 description 6
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 6
- 238000010276 construction Methods 0.000 description 6
- 238000010168 coupling process Methods 0.000 description 6
- 238000005859 coupling reaction Methods 0.000 description 6
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 6
- 238000013461 design Methods 0.000 description 6
- UQLDLKMNUJERMK-UHFFFAOYSA-L di(octadecanoyloxy)lead Chemical compound [Pb+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O UQLDLKMNUJERMK-UHFFFAOYSA-L 0.000 description 6
- 238000010494 dissociation reaction Methods 0.000 description 6
- 230000005593 dissociations Effects 0.000 description 6
- 230000008995 epigenetic change Effects 0.000 description 6
- 230000001973 epigenetic effect Effects 0.000 description 6
- 239000000284 extract Substances 0.000 description 6
- 238000001502 gel electrophoresis Methods 0.000 description 6
- 230000001965 increasing effect Effects 0.000 description 6
- 235000021317 phosphate Nutrition 0.000 description 6
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 6
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 6
- 239000006228 supernatant Substances 0.000 description 6
- 230000014616 translation Effects 0.000 description 6
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 5
- 108010047041 Complementarity Determining Regions Proteins 0.000 description 5
- 102000012410 DNA Ligases Human genes 0.000 description 5
- 108010061982 DNA Ligases Proteins 0.000 description 5
- 101000744745 Homo sapiens YTH domain-containing family protein 2 Proteins 0.000 description 5
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 5
- NQTADLQHYWFPDB-UHFFFAOYSA-N N-Hydroxysuccinimide Chemical compound ON1C(=O)CCC1=O NQTADLQHYWFPDB-UHFFFAOYSA-N 0.000 description 5
- 108091007494 Nucleic acid- binding domains Proteins 0.000 description 5
- 238000012408 PCR amplification Methods 0.000 description 5
- 108010003723 Single-Domain Antibodies Proteins 0.000 description 5
- 239000007983 Tris buffer Substances 0.000 description 5
- 230000008878 coupling Effects 0.000 description 5
- 208000035475 disorder Diseases 0.000 description 5
- 238000009826 distribution Methods 0.000 description 5
- 230000036541 health Effects 0.000 description 5
- 229940127121 immunoconjugate Drugs 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 5
- 239000010452 phosphate Substances 0.000 description 5
- 238000011002 quantification Methods 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 5
- ANOJXMUSDYSKET-UHFFFAOYSA-N 2-[2-[2-(2-aminoethoxy)ethoxy]ethoxy]ethanol Chemical compound NCCOCCOCCOCCO ANOJXMUSDYSKET-UHFFFAOYSA-N 0.000 description 4
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 4
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 4
- 108020004635 Complementary DNA Proteins 0.000 description 4
- 101710163270 Nuclease Proteins 0.000 description 4
- 102100039644 YTH domain-containing family protein 2 Human genes 0.000 description 4
- 238000010461 azide-alkyne cycloaddition reaction Methods 0.000 description 4
- 210000004899 c-terminal region Anatomy 0.000 description 4
- 238000010804 cDNA synthesis Methods 0.000 description 4
- 239000001913 cellulose Substances 0.000 description 4
- 229920002678 cellulose Polymers 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 235000018417 cysteine Nutrition 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 230000002255 enzymatic effect Effects 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 229920001519 homopolymer Polymers 0.000 description 4
- 230000001976 improved effect Effects 0.000 description 4
- 238000011065 in-situ storage Methods 0.000 description 4
- 229910001629 magnesium chloride Inorganic materials 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 238000002161 passivation Methods 0.000 description 4
- 229920001610 polycaprolactone Polymers 0.000 description 4
- 229920001184 polypeptide Polymers 0.000 description 4
- 108020001580 protein domains Proteins 0.000 description 4
- 230000008439 repair process Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 108091008146 restriction endonucleases Proteins 0.000 description 4
- 239000004055 small Interfering RNA Substances 0.000 description 4
- 229920001059 synthetic polymer Polymers 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 229940113082 thymine Drugs 0.000 description 4
- 210000001519 tissue Anatomy 0.000 description 4
- URYYVOIYTNXXBN-OWOJBTEDSA-N trans-cyclooctene Chemical compound C1CCC\C=C\CC1 URYYVOIYTNXXBN-OWOJBTEDSA-N 0.000 description 4
- 238000011282 treatment Methods 0.000 description 4
- 239000001226 triphosphate Substances 0.000 description 4
- 235000011178 triphosphate Nutrition 0.000 description 4
- SHDYDABQVJGHLD-UHFFFAOYSA-N 1-[2-[2-(2-aminoethoxy)ethoxy]ethyl]pyrrole-2,5-dione Chemical compound NCCOCCOCCN1C(=O)C=CC1=O SHDYDABQVJGHLD-UHFFFAOYSA-N 0.000 description 3
- OAKPWEUQDVLTCN-NKWVEPMBSA-N 2',3'-Dideoxyadenosine-5-triphosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1CC[C@@H](CO[P@@](O)(=O)O[P@](O)(=O)OP(O)(O)=O)O1 OAKPWEUQDVLTCN-NKWVEPMBSA-N 0.000 description 3
- 102000015619 APOBEC Deaminases Human genes 0.000 description 3
- 108010024100 APOBEC Deaminases Proteins 0.000 description 3
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 3
- 108700028369 Alleles Proteins 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- 108060003951 Immunoglobulin Proteins 0.000 description 3
- PEEHTFAAVSWFBL-UHFFFAOYSA-N Maleimide Chemical compound O=C1NC(=O)C=C1 PEEHTFAAVSWFBL-UHFFFAOYSA-N 0.000 description 3
- 108060004795 Methyltransferase Proteins 0.000 description 3
- 239000004793 Polystyrene Substances 0.000 description 3
- 108700040121 Protein Methyltransferases Proteins 0.000 description 3
- 102000055027 Protein Methyltransferases Human genes 0.000 description 3
- 238000011529 RT qPCR Methods 0.000 description 3
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 3
- 150000001345 alkine derivatives Chemical group 0.000 description 3
- 125000003277 amino group Chemical group 0.000 description 3
- 238000002820 assay format Methods 0.000 description 3
- 150000001540 azides Chemical class 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 230000021615 conjugation Effects 0.000 description 3
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 3
- 125000000151 cysteine group Chemical class N[C@@H](CS)C(=O)* 0.000 description 3
- 238000003936 denaturing gel electrophoresis Methods 0.000 description 3
- 239000003599 detergent Substances 0.000 description 3
- 230000003301 hydrolyzing effect Effects 0.000 description 3
- 230000003100 immobilizing effect Effects 0.000 description 3
- 102000018358 immunoglobulin Human genes 0.000 description 3
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 3
- 108010026228 mRNA guanylyltransferase Proteins 0.000 description 3
- 238000007481 next generation sequencing Methods 0.000 description 3
- 230000009871 nonspecific binding Effects 0.000 description 3
- 238000007899 nucleic acid hybridization Methods 0.000 description 3
- 230000003647 oxidation Effects 0.000 description 3
- 238000007254 oxidation reaction Methods 0.000 description 3
- XEBWQGVWTUSTLN-UHFFFAOYSA-M phenylmercury acetate Chemical compound CC(=O)O[Hg]C1=CC=CC=C1 XEBWQGVWTUSTLN-UHFFFAOYSA-M 0.000 description 3
- 239000013612 plasmid Substances 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 229920002223 polystyrene Polymers 0.000 description 3
- 230000037452 priming Effects 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 238000000638 solvent extraction Methods 0.000 description 3
- 108090000250 sortase A Proteins 0.000 description 3
- 230000009870 specific binding Effects 0.000 description 3
- 238000010561 standard procedure Methods 0.000 description 3
- 235000000346 sugar Nutrition 0.000 description 3
- VZQXUWKZDSEQRR-SDBHATRESA-N 2-methylthio-N(6)-(Delta(2)-isopentenyl)adenosine Chemical compound C12=NC(SC)=NC(NCC=C(C)C)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VZQXUWKZDSEQRR-SDBHATRESA-N 0.000 description 2
- HLZXTFWTDIBXDF-PNHWDRBUSA-N 5-methoxycarbonylmethyl-2-thiouridine Chemical compound S=C1NC(=O)C(CC(=O)OC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 HLZXTFWTDIBXDF-PNHWDRBUSA-N 0.000 description 2
- YIZYCHKPHCPKHZ-PNHWDRBUSA-N 5-methoxycarbonylmethyluridine Chemical compound O=C1NC(=O)C(CC(=O)OC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 YIZYCHKPHCPKHZ-PNHWDRBUSA-N 0.000 description 2
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 2
- 108010052875 Adenine deaminase Proteins 0.000 description 2
- 229920000936 Agarose Polymers 0.000 description 2
- 108091093088 Amplicon Proteins 0.000 description 2
- 108010032595 Antibody Binding Sites Proteins 0.000 description 2
- 101710095342 Apolipoprotein B Proteins 0.000 description 2
- 102100040202 Apolipoprotein B-100 Human genes 0.000 description 2
- 241000713838 Avian myeloblastosis virus Species 0.000 description 2
- 102100038712 Cap-specific mRNA (nucleoside-2'-O-)-methyltransferase 1 Human genes 0.000 description 2
- 229920001661 Chitosan Polymers 0.000 description 2
- 238000010442 DNA editing Methods 0.000 description 2
- 108010082610 Deoxyribonuclease (Pyrimidine Dimer) Proteins 0.000 description 2
- 102000004099 Deoxyribonuclease (Pyrimidine Dimer) Human genes 0.000 description 2
- 238000006117 Diels-Alder cycloaddition reaction Methods 0.000 description 2
- 102100038191 Double-stranded RNA-specific editase 1 Human genes 0.000 description 2
- 102100035074 Elongator complex protein 3 Human genes 0.000 description 2
- GHASVSINZRGABV-UHFFFAOYSA-N Fluorouracil Chemical compound FC1=CNC(=O)NC1=O GHASVSINZRGABV-UHFFFAOYSA-N 0.000 description 2
- 102100031249 H/ACA ribonucleoprotein complex subunit DKC1 Human genes 0.000 description 2
- 101000742223 Homo sapiens Double-stranded RNA-specific editase 1 Proteins 0.000 description 2
- 101000877382 Homo sapiens Elongator complex protein 3 Proteins 0.000 description 2
- 101000844866 Homo sapiens H/ACA ribonucleoprotein complex subunit DKC1 Proteins 0.000 description 2
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 2
- 101000973947 Homo sapiens Probable 28S rRNA (cytosine(4447)-C(5))-methyltransferase Proteins 0.000 description 2
- 101000935533 Homo sapiens RNA 5'-monophosphate methyltransferase Proteins 0.000 description 2
- 101000897669 Homo sapiens Small RNA 2'-O-methyltransferase Proteins 0.000 description 2
- KFZMGEQAYNKOFK-UHFFFAOYSA-N Isopropanol Chemical compound CC(C)O KFZMGEQAYNKOFK-UHFFFAOYSA-N 0.000 description 2
- 238000007397 LAMP assay Methods 0.000 description 2
- JLVVSXFLKOJNIY-UHFFFAOYSA-N Magnesium ion Chemical compound [Mg+2] JLVVSXFLKOJNIY-UHFFFAOYSA-N 0.000 description 2
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 2
- 102000016397 Methyltransferase Human genes 0.000 description 2
- 102100038450 Mitochondrial tRNA methylthiotransferase CDK5RAP1 Human genes 0.000 description 2
- 241000713869 Moloney murine leukemia virus Species 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- 108010010677 Phosphodiesterase I Proteins 0.000 description 2
- 229920002594 Polyethylene Glycol 8000 Polymers 0.000 description 2
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 2
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 2
- 102100027142 Probable 18S rRNA (guanine-N(7))-methyltransferase Human genes 0.000 description 2
- 102100022407 Probable 28S rRNA (cytosine(4447)-C(5))-methyltransferase Human genes 0.000 description 2
- 102100040294 Protein unc-50 homolog Human genes 0.000 description 2
- 102100027924 RNA 5'-monophosphate methyltransferase Human genes 0.000 description 2
- 101710160924 RNA cytidine acetyltransferase Proteins 0.000 description 2
- 101710188535 RNA ligase 2 Proteins 0.000 description 2
- 101710204104 RNA-editing ligase 2, mitochondrial Proteins 0.000 description 2
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 2
- 102100021887 Small RNA 2'-O-methyltransferase Human genes 0.000 description 2
- UIIMBOGNXHQVGW-UHFFFAOYSA-M Sodium bicarbonate Chemical compound [Na+].OC([O-])=O UIIMBOGNXHQVGW-UHFFFAOYSA-M 0.000 description 2
- 108010048586 SpyCatcher peptide Proteins 0.000 description 2
- 108010076818 TEV protease Proteins 0.000 description 2
- DPOPAJRDYZGTIR-UHFFFAOYSA-N Tetrazine Chemical compound C1=CN=NN=N1 DPOPAJRDYZGTIR-UHFFFAOYSA-N 0.000 description 2
- 101710166315 U2 small nuclear ribonucleoprotein auxiliary factor 35 kDa subunit-related protein 2 Proteins 0.000 description 2
- 108020004417 Untranslated RNA Proteins 0.000 description 2
- 102000039634 Untranslated RNA Human genes 0.000 description 2
- 229910052770 Uranium Inorganic materials 0.000 description 2
- 238000001261 affinity purification Methods 0.000 description 2
- 150000001299 aldehydes Chemical class 0.000 description 2
- 125000002355 alkine group Chemical group 0.000 description 2
- 239000007864 aqueous solution Substances 0.000 description 2
- IVRMZWNICZWHMI-UHFFFAOYSA-N azide group Chemical group [N-]=[N+]=[N-] IVRMZWNICZWHMI-UHFFFAOYSA-N 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 239000011230 binding agent Substances 0.000 description 2
- 238000006664 bond formation reaction Methods 0.000 description 2
- 150000001720 carbohydrates Chemical class 0.000 description 2
- 235000014633 carbohydrates Nutrition 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 229940044683 chemotherapy drug Drugs 0.000 description 2
- 238000012650 click reaction Methods 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 238000011278 co-treatment Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 108091036078 conserved sequence Proteins 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000006352 cycloaddition reaction Methods 0.000 description 2
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 2
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 2
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007717 exclusion Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 229960002949 fluorouracil Drugs 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 230000030279 gene silencing Effects 0.000 description 2
- 238000012226 gene silencing method Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 125000001475 halogen functional group Chemical group 0.000 description 2
- 150000007857 hydrazones Chemical class 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 239000000543 intermediate Substances 0.000 description 2
- 150000002500 ions Chemical class 0.000 description 2
- 235000019136 lipoic acid Nutrition 0.000 description 2
- 230000017156 mRNA modification Effects 0.000 description 2
- 239000011777 magnesium Substances 0.000 description 2
- 229910001425 magnesium ion Inorganic materials 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 230000009149 molecular binding Effects 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- 102000044158 nucleic acid binding protein Human genes 0.000 description 2
- 108700020942 nucleic acid binding protein Proteins 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- UEZVMMHDMIWARA-UHFFFAOYSA-M phosphonate Chemical compound [O-]P(=O)=O UEZVMMHDMIWARA-UHFFFAOYSA-M 0.000 description 2
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 2
- 229920000747 poly(lactic acid) Polymers 0.000 description 2
- 229920002401 polyacrylamide Polymers 0.000 description 2
- 239000004626 polylactic acid Substances 0.000 description 2
- 229920000193 polymethacrylate Polymers 0.000 description 2
- 229920000136 polysorbate Polymers 0.000 description 2
- 239000002244 precipitate Substances 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 239000000700 radioactive tracer Substances 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000011347 resin Substances 0.000 description 2
- 229920005989 resin Polymers 0.000 description 2
- 101150033305 rtcB gene Proteins 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 102100025028 tRNA (guanine-N(7)-)-methyltransferase Human genes 0.000 description 2
- 102100023397 tRNA dimethylallyltransferase Human genes 0.000 description 2
- 229960002663 thioctic acid Drugs 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 2
- 238000013396 workstream Methods 0.000 description 2
- FBKFDSUZBVDZIX-FFGDOFBPSA-N (4s)-4-[[(2s)-2-[[(2s)-2-[[2-[[(2s)-2-[[(2s)-2-acetamido-3-phenylpropanoyl]amino]-4-methylsulfanylbutanoyl]amino]-2-methylpropanoyl]amino]-3-[4-(phosphonomethyl)phenyl]propanoyl]amino]-3-(6-chloro-1h-indol-3-yl)propanoyl]amino]-5-[[1-[[(2s)-1-amino-4-meth Chemical compound C([C@@H](C(=O)N[C@@H](CCSC)C(=O)NC(C)(C)C(=O)N[C@@H](CC=1C=CC(CP(O)(O)=O)=CC=1)C(=O)N[C@@H](CC=1C2=CC=C(Cl)C=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)NC1(CC1)C(=O)N[C@@H](CC(C)C)C(N)=O)NC(C)=O)C1=CC=CC=C1 FBKFDSUZBVDZIX-FFGDOFBPSA-N 0.000 description 1
- 102100031592 12S rRNA N4-methylcytidine (m4C) methyltransferase Human genes 0.000 description 1
- WVXRAFOPTSTNLL-NKWVEPMBSA-N 2',3'-dideoxyadenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1CC[C@@H](CO)O1 WVXRAFOPTSTNLL-NKWVEPMBSA-N 0.000 description 1
- YKBGVTZYEHREMT-KVQBGUIXSA-N 2'-deoxyguanosine Chemical group C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](CO)O1 YKBGVTZYEHREMT-KVQBGUIXSA-N 0.000 description 1
- SXGZJKUKBWWHRA-UHFFFAOYSA-N 2-(N-morpholiniumyl)ethanesulfonate Chemical compound [O-]S(=O)(=O)CC[NH+]1CCOCC1 SXGZJKUKBWWHRA-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- KZMAWJRXKGLWGS-UHFFFAOYSA-N 2-chloro-n-[4-(4-methoxyphenyl)-1,3-thiazol-2-yl]-n-(3-methoxypropyl)acetamide Chemical class S1C(N(C(=O)CCl)CCCOC)=NC(C=2C=CC(OC)=CC=2)=C1 KZMAWJRXKGLWGS-UHFFFAOYSA-N 0.000 description 1
- KPGXRSRHYNQIFN-UHFFFAOYSA-N 2-oxoglutaric acid Chemical compound OC(=O)CCC(=O)C(O)=O KPGXRSRHYNQIFN-UHFFFAOYSA-N 0.000 description 1
- NOIIUHRQUVNIDD-UHFFFAOYSA-N 3-[[oxo(pyridin-4-yl)methyl]hydrazo]-N-(phenylmethyl)propanamide Chemical compound C=1C=CC=CC=1CNC(=O)CCNNC(=O)C1=CC=NC=C1 NOIIUHRQUVNIDD-UHFFFAOYSA-N 0.000 description 1
- KOLPWZCZXAMXKS-UHFFFAOYSA-N 3-methylcytosine Chemical compound CN1C(N)=CC=NC1=O KOLPWZCZXAMXKS-UHFFFAOYSA-N 0.000 description 1
- AUDYZXNUHIIGRB-UHFFFAOYSA-N 3-thiophen-2-ylpyrrole-2,5-dione Chemical compound O=C1NC(=O)C(C=2SC=CC=2)=C1 AUDYZXNUHIIGRB-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- YUDSCJBUWTYENI-VPCXQMTMSA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)-2-methyloxolan-2-yl]pyrimidin-2-one Chemical compound C1=CC(N)=NC(=O)N1[C@]1(C)O[C@H](CO)[C@@H](O)[C@H]1O YUDSCJBUWTYENI-VPCXQMTMSA-N 0.000 description 1
- ZYEWPVTXYBLWRT-UHFFFAOYSA-N 5-Uridinacetamid Natural products O=C1NC(=O)C(CC(=O)N)=CN1C1C(O)C(O)C(CO)O1 ZYEWPVTXYBLWRT-UHFFFAOYSA-N 0.000 description 1
- ZYEWPVTXYBLWRT-VPCXQMTMSA-N 5-carbamoylmethyluridine Chemical compound O=C1NC(=O)C(CC(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZYEWPVTXYBLWRT-VPCXQMTMSA-N 0.000 description 1
- USVMJSALORZVDV-UHFFFAOYSA-N 6-(gamma,gamma-dimethylallylamino)purine riboside Natural products C1=NC=2C(NCC=C(C)C)=NC=NC=2N1C1OC(CO)C(O)C1O USVMJSALORZVDV-UHFFFAOYSA-N 0.000 description 1
- 108091034151 7SK RNA Proteins 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 108010087979 Alpha-Ketoglutarate-Dependent Dioxygenase AlkB Homolog 3 Proteins 0.000 description 1
- 108010016119 Alpha-Ketoglutarate-Dependent Dioxygenase FTO Proteins 0.000 description 1
- 102000052866 Amino Acyl-tRNA Synthetases Human genes 0.000 description 1
- 108700028939 Amino Acyl-tRNA Synthetases Proteins 0.000 description 1
- 108020005098 Anticodon Proteins 0.000 description 1
- 108020005544 Antisense RNA Proteins 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- FMMWHPNWAFZXNH-UHFFFAOYSA-N Benz[a]pyrene Chemical class C1=C2C3=CC=CC=C3C=C(C=C3)C2=C2C3=CC=CC2=C1 FMMWHPNWAFZXNH-UHFFFAOYSA-N 0.000 description 1
- 108091079001 CRISPR RNA Proteins 0.000 description 1
- 241000282832 Camelidae Species 0.000 description 1
- 101710203121 Cap-specific mRNA (nucleoside-2'-O-)-methyltransferase 1 Proteins 0.000 description 1
- 102100038716 Cap-specific mRNA (nucleoside-2'-O-)-methyltransferase 2 Human genes 0.000 description 1
- 101710203126 Cap-specific mRNA (nucleoside-2'-O-)-methyltransferase 2 Proteins 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 description 1
- 108020004998 Chloroplast DNA Proteins 0.000 description 1
- 241000251730 Chondrichthyes Species 0.000 description 1
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 description 1
- 101000916659 Coffea arabica Probable caffeine synthase 3 Proteins 0.000 description 1
- 101000895742 Coffea canephora Probable caffeine synthase MTL2 Proteins 0.000 description 1
- 208000028698 Cognitive impairment Diseases 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 241000711573 Coronaviridae Species 0.000 description 1
- 206010011224 Cough Diseases 0.000 description 1
- 239000004971 Cross linker Substances 0.000 description 1
- VMQMZMRVKUZKQL-UHFFFAOYSA-N Cu+ Chemical compound [Cu+] VMQMZMRVKUZKQL-UHFFFAOYSA-N 0.000 description 1
- 102100039600 Cytoplasmic tRNA 2-thiolation protein 1 Human genes 0.000 description 1
- 108010009540 DNA (Cytosine-5-)-Methyltransferase 1 Proteins 0.000 description 1
- 102100036279 DNA (cytosine-5)-methyltransferase 1 Human genes 0.000 description 1
- 108090001056 DNA (cytosine-5-)-methyltransferases Proteins 0.000 description 1
- 102000004863 DNA (cytosine-5-)-methyltransferases Human genes 0.000 description 1
- 241000238557 Decapoda Species 0.000 description 1
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 description 1
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 1
- 108010028143 Dioxygenases Proteins 0.000 description 1
- 102000016680 Dioxygenases Human genes 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 102000000331 Double-stranded RNA-binding domains Human genes 0.000 description 1
- 108050008793 Double-stranded RNA-binding domains Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 238000012286 ELISA Assay Methods 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 101001095863 Enterobacteria phage T4 RNA ligase 1 Proteins 0.000 description 1
- 239000004593 Epoxy Substances 0.000 description 1
- 101900063352 Escherichia coli DNA ligase Proteins 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 241000710781 Flaviviridae Species 0.000 description 1
- 102000002464 Galactosidases Human genes 0.000 description 1
- 108010093031 Galactosidases Proteins 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 108020005004 Guide RNA Proteins 0.000 description 1
- 108010002459 HIV Integrase Proteins 0.000 description 1
- 108091027305 Heteroduplex Proteins 0.000 description 1
- 102000006947 Histones Human genes 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 101001013578 Homo sapiens 12S rRNA N4-methylcytidine (m4C) methyltransferase Proteins 0.000 description 1
- 101000883304 Homo sapiens Cap-specific mRNA (nucleoside-2'-O-)-methyltransferase 1 Proteins 0.000 description 1
- 101000746181 Homo sapiens Cytoplasmic tRNA 2-thiolation protein 1 Proteins 0.000 description 1
- 101000882884 Homo sapiens Mitochondrial tRNA methylthiotransferase CDK5RAP1 Proteins 0.000 description 1
- 101000836620 Homo sapiens Nucleic acid dioxygenase ALKBH1 Proteins 0.000 description 1
- 101000984960 Homo sapiens Probable 18S rRNA (guanine-N(7))-methyltransferase Proteins 0.000 description 1
- 101001039684 Homo sapiens mRNA cap guanine-N7 methyltransferase Proteins 0.000 description 1
- 101000848450 Homo sapiens tRNA (guanine(26)-N(2))-dimethyltransferase Proteins 0.000 description 1
- 101000830183 Homo sapiens tRNA (guanine-N(7)-)-methyltransferase Proteins 0.000 description 1
- 101000582267 Homo sapiens tRNA N(3)-methylcytidine methyltransferase METTL2B Proteins 0.000 description 1
- 101000624356 Homo sapiens tRNA dimethylallyltransferase Proteins 0.000 description 1
- 101000760832 Homo sapiens tRNA wybutosine-synthesizing protein 2 homolog Proteins 0.000 description 1
- 238000006736 Huisgen cycloaddition reaction Methods 0.000 description 1
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 1
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 1
- 239000007836 KH2PO4 Substances 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 108020005198 Long Noncoding RNA Proteins 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 101710118984 Mitochondrial tRNA methylthiotransferase CDK5RAP1 Proteins 0.000 description 1
- IJCKBIINTQEGLY-UHFFFAOYSA-N N(4)-acetylcytosine Chemical compound CC(=O)NC1=CC=NC(=O)N1 IJCKBIINTQEGLY-UHFFFAOYSA-N 0.000 description 1
- USVMJSALORZVDV-SDBHATRESA-N N(6)-(Delta(2)-isopentenyl)adenosine Chemical compound C1=NC=2C(NCC=C(C)C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O USVMJSALORZVDV-SDBHATRESA-N 0.000 description 1
- 108010046068 N-Acetyllactosamine Synthase Proteins 0.000 description 1
- KFEUJDWYNGMDBV-LODBTCKLSA-N N-acetyllactosamine Chemical group O[C@@H]1[C@@H](NC(=O)C)[C@H](O)O[C@H](CO)[C@H]1O[C@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 KFEUJDWYNGMDBV-LODBTCKLSA-N 0.000 description 1
- 101710158306 N6-adenosine-methyltransferase catalytic subunit Proteins 0.000 description 1
- VQAYFKKCNSOZKM-UHFFFAOYSA-N NSC 29409 Natural products C1=NC=2C(NC)=NC=NC=2N1C1OC(CO)C(O)C1O VQAYFKKCNSOZKM-UHFFFAOYSA-N 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 102100027051 Nucleic acid dioxygenase ALKBH1 Human genes 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- VZQXUWKZDSEQRR-UHFFFAOYSA-N Nucleosid Natural products C12=NC(SC)=NC(NCC=C(C)C)=C2N=CN1C1OC(CO)C(O)C1O VZQXUWKZDSEQRR-UHFFFAOYSA-N 0.000 description 1
- KRWMERLEINMZFT-UHFFFAOYSA-N O6-benzylguanine Chemical compound C=12NC=NC2=NC(N)=NC=1OCC1=CC=CC=C1 KRWMERLEINMZFT-UHFFFAOYSA-N 0.000 description 1
- 229960005524 O6-benzylguanine Drugs 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 240000007019 Oxalis corniculata Species 0.000 description 1
- 101000669384 Papaver somniferum Reticuline N-methyltransferase Proteins 0.000 description 1
- 108091007412 Piwi-interacting RNA Proteins 0.000 description 1
- 101710096832 Probable 18S rRNA (guanine-N(7))-methyltransferase Proteins 0.000 description 1
- 102100024952 Protein CBFA2T1 Human genes 0.000 description 1
- 102100039156 Queuine tRNA-ribosyltransferase catalytic subunit 1 Human genes 0.000 description 1
- 101710118693 Queuine tRNA-ribosyltransferase catalytic subunit 1 Proteins 0.000 description 1
- 108090000944 RNA Helicases Proteins 0.000 description 1
- 102000004409 RNA Helicases Human genes 0.000 description 1
- 238000010357 RNA editing Methods 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 108090000621 Ribonuclease P Proteins 0.000 description 1
- 102000004167 Ribonuclease P Human genes 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 108091061750 Signal recognition particle RNA Proteins 0.000 description 1
- 108091092920 SmY RNA Proteins 0.000 description 1
- 108091007415 Small Cajal body-specific RNA Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 241001237710 Smyrna Species 0.000 description 1
- 239000012505 Superdex™ Substances 0.000 description 1
- 101710137500 T7 RNA polymerase Proteins 0.000 description 1
- 108010040002 Tumor Suppressor Proteins Proteins 0.000 description 1
- 102000001742 Tumor Suppressor Proteins Human genes 0.000 description 1
- 101710157282 U8 snoRNA-decapping enzyme Proteins 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 125000003172 aldehyde group Chemical group 0.000 description 1
- 150000001350 alkyl halides Chemical class 0.000 description 1
- 239000002168 alkylating agent Substances 0.000 description 1
- 229940100198 alkylating agent Drugs 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 239000012062 aqueous buffer Substances 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- 230000001363 autoimmune Effects 0.000 description 1
- 238000011888 autopsy Methods 0.000 description 1
- 125000000852 azido group Chemical group *N=[N+]=[N-] 0.000 description 1
- ICCBZGUDUOMNOF-UHFFFAOYSA-N azidoamine Chemical group NN=[N+]=[N-] ICCBZGUDUOMNOF-UHFFFAOYSA-N 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 125000002619 bicyclic group Chemical group 0.000 description 1
- 230000001588 bifunctional effect Effects 0.000 description 1
- 239000012148 binding buffer Substances 0.000 description 1
- 239000003124 biologic agent Substances 0.000 description 1
- 230000031018 biological processes and functions Effects 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 108010068032 caltractin Proteins 0.000 description 1
- 238000005251 capillar electrophoresis Methods 0.000 description 1
- 150000001718 carbodiimides Chemical class 0.000 description 1
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 230000011748 cell maturation Effects 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 108091092328 cellular RNA Proteins 0.000 description 1
- 230000030570 cellular localization Effects 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- DQLATGHUWYMOKM-UHFFFAOYSA-L cisplatin Chemical compound N[Pt](N)(Cl)Cl DQLATGHUWYMOKM-UHFFFAOYSA-L 0.000 description 1
- 208000010877 cognitive disease Diseases 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 230000009918 complex formation Effects 0.000 description 1
- 230000001268 conjugating effect Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 150000004696 coordination complex Chemical class 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- UPUOLJWYFICKJI-UHFFFAOYSA-N cyclobutane;pyrimidine Chemical class C1CCC1.C1=CN=CN=C1 UPUOLJWYFICKJI-UHFFFAOYSA-N 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 231100000433 cytotoxic Toxicity 0.000 description 1
- 229940127089 cytotoxic agent Drugs 0.000 description 1
- 230000001472 cytotoxic effect Effects 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 230000006240 deamidation Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000017858 demethylation Effects 0.000 description 1
- 238000010520 demethylation reaction Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 230000000779 depleting effect Effects 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000007865 diluting Methods 0.000 description 1
- 238000006471 dimerization reaction Methods 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- BNIILDVGGAEEIG-UHFFFAOYSA-L disodium hydrogen phosphate Chemical compound [Na+].[Na+].OP([O-])([O-])=O BNIILDVGGAEEIG-UHFFFAOYSA-L 0.000 description 1
- 229910000397 disodium phosphate Inorganic materials 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 239000012039 electrophile Substances 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000009881 electrostatic interaction Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 125000003700 epoxy group Chemical group 0.000 description 1
- 238000001704 evaporation Methods 0.000 description 1
- 230000008020 evaporation Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- XRECTZIEBJDKEO-UHFFFAOYSA-N flucytosine Chemical compound NC1=NC(=O)NC=C1F XRECTZIEBJDKEO-UHFFFAOYSA-N 0.000 description 1
- 229960004413 flucytosine Drugs 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical group O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- 239000007850 fluorescent dye Substances 0.000 description 1
- 239000011888 foil Substances 0.000 description 1
- 101150110946 gatC gene Proteins 0.000 description 1
- 229960005277 gemcitabine Drugs 0.000 description 1
- SDUQYLNIPVEERB-QPPQHZFASA-N gemcitabine Chemical compound O=C1N=C(N)C=CN1[C@H]1C(F)(F)[C@H](O)[C@@H](CO)O1 SDUQYLNIPVEERB-QPPQHZFASA-N 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 238000010362 genome editing Methods 0.000 description 1
- 125000003147 glycosyl group Chemical group 0.000 description 1
- 239000012145 high-salt buffer Substances 0.000 description 1
- 102000056351 human YTHDF2 Human genes 0.000 description 1
- 229930195733 hydrocarbon Natural products 0.000 description 1
- 150000002430 hydrocarbons Chemical class 0.000 description 1
- 230000007062 hydrolysis Effects 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 230000003053 immunization Effects 0.000 description 1
- 102000028557 immunoglobulin binding proteins Human genes 0.000 description 1
- 108091009323 immunoglobulin binding proteins Proteins 0.000 description 1
- 229940072221 immunoglobulins Drugs 0.000 description 1
- 239000012133 immunoprecipitate Substances 0.000 description 1
- 238000001114 immunoprecipitation Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000009655 industrial fermentation Methods 0.000 description 1
- 210000005007 innate immune system Anatomy 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000012160 loading buffer Substances 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 102100040949 mRNA cap guanine-N7 methyltransferase Human genes 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 125000005439 maleimidyl group Chemical group C1(C=CC(N1*)=O)=O 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- HLZXTFWTDIBXDF-UHFFFAOYSA-N mcm5sU Natural products COC(=O)Cc1cn(C2OC(CO)C(O)C2O)c(=S)[nH]c1=O HLZXTFWTDIBXDF-UHFFFAOYSA-N 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 150000002730 mercury Chemical class 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 230000007102 metabolic function Effects 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 108010068249 mitochondrial RNA-processing endoribonuclease Proteins 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 1
- 235000019796 monopotassium phosphate Nutrition 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 230000010807 negative regulation of binding Effects 0.000 description 1
- 230000003188 neurobehavioral effect Effects 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 231100000065 noncytotoxic Toxicity 0.000 description 1
- 230000002020 noncytotoxic effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003499 nucleic acid array Methods 0.000 description 1
- 230000009437 off-target effect Effects 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000004792 oxidative damage Effects 0.000 description 1
- 150000002923 oximes Chemical class 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- MXHCPCSDRGLRER-UHFFFAOYSA-N pentaglycine Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(O)=O MXHCPCSDRGLRER-UHFFFAOYSA-N 0.000 description 1
- 239000008194 pharmaceutical composition Substances 0.000 description 1
- 239000000546 pharmaceutical excipient Substances 0.000 description 1
- 150000004713 phosphodiesters Chemical group 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 229910052697 platinum Inorganic materials 0.000 description 1
- 239000003495 polar organic solvent Substances 0.000 description 1
- 229920001606 poly(lactic acid-co-glycolic acid) Polymers 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- GNSKLFRGEWLPPA-UHFFFAOYSA-M potassium dihydrogen phosphate Chemical compound [K+].OP(O)([O-])=O GNSKLFRGEWLPPA-UHFFFAOYSA-M 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 238000004886 process control Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- YMXFJTUQQVLJEN-UHFFFAOYSA-N pyrimidine Chemical compound C1=CN=CN=C1.C1=CN=CN=C1 YMXFJTUQQVLJEN-UHFFFAOYSA-N 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- 238000001959 radiotherapy Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000001850 reproductive effect Effects 0.000 description 1
- 230000000241 respiratory effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000013207 serial dilution Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 150000003384 small molecules Chemical class 0.000 description 1
- 108091029842 small nuclear ribonucleic acid Proteins 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 235000017557 sodium bicarbonate Nutrition 0.000 description 1
- 229910000030 sodium bicarbonate Inorganic materials 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 238000000935 solvent evaporation Methods 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 239000012134 supernatant fraction Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000000946 synaptic effect Effects 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 102100032270 tRNA (cytosine(38)-C(5))-methyltransferase Human genes 0.000 description 1
- 101710184308 tRNA (cytosine(38)-C(5))-methyltransferase Proteins 0.000 description 1
- 102100034541 tRNA (guanine(26)-N(2))-dimethyltransferase Human genes 0.000 description 1
- 101710112043 tRNA (guanine-N(7)-)-methyltransferase Proteins 0.000 description 1
- 102100030609 tRNA N(3)-methylcytidine methyltransferase METTL2B Human genes 0.000 description 1
- 101710103876 tRNA dimethylallyltransferase Proteins 0.000 description 1
- 102100024563 tRNA wybutosine-synthesizing protein 2 homolog Human genes 0.000 description 1
- 101710126368 tRNA-dihydrouridine(20) synthase [NAD(P)+]-like Proteins 0.000 description 1
- 238000011191 terminal modification Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 125000002088 tosyl group Chemical group [H]C1=C([H])C(=C([H])C([H])=C1C([H])([H])[H])S(*)(=O)=O 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010008314 tyrosine-tubulin Proteins 0.000 description 1
- YIZYCHKPHCPKHZ-UHFFFAOYSA-N uridine-5-acetic acid methyl ester Natural products COC(=O)Cc1cn(C2OC(CO)C(O)C2O)c(=O)[nH]c1=O YIZYCHKPHCPKHZ-UHFFFAOYSA-N 0.000 description 1
- 229910052720 vanadium Inorganic materials 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6804—Nucleic acid analysis using immunogens
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Pathology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Saccharide Compounds (AREA)
Abstract
本発明は、トランスクリプトームおよびゲノムにわたるRNAおよびDNA修飾の多重プロファイリングのための組成物および方法を提供する。本方法は、標的核酸の非古典的特徴(例えば、塩基修飾、骨格修飾、損傷および/または構造的要素)の分子認識、およびこの認識事象からの情報をバーコードを用いて標的核酸の隣接遺伝子配列に書き込む工程を組み合わせる。得られたバーコード化核酸は、次に配列決定ライブラリーに変換され、DNA/RNA配列決定法によって読み取られる。この工程により、バーコードの配列が明らかになり、標的核酸中の非古典的特徴と相関する。本明細書に記載のハイスループット・プロファイリング法は、標的核酸中の1以上の修飾の局在化を可能にする。この方法はまた、複数またはすべてのDNA/RNA修飾の性質および位置を並行して同定することを可能にする。【選択図】図4A
Description
関連出願の相互参照
本出願は、2021年5月26日に出願された米国仮特許出願第63/193,402号および2020年11月25日に出願された米国仮特許出願第63/118,409号に対して優先権の利益を主張するものであり、これらの各出願は、あらゆる目的のために、引用によりその全体が本明細書に組み込まれる。
本出願は、2021年5月26日に出願された米国仮特許出願第63/193,402号および2020年11月25日に出願された米国仮特許出願第63/118,409号に対して優先権の利益を主張するものであり、これらの各出願は、あらゆる目的のために、引用によりその全体が本明細書に組み込まれる。
技術分野
本開示は、一般に、RNAおよびDNAを含む核酸の構造または非古典的特徴に対するエピトランスクリプトーム、エピジェネティック、その他の修飾の同定および解析に関する。
本開示は、一般に、RNAおよびDNAを含む核酸の構造または非古典的特徴に対するエピトランスクリプトーム、エピジェネティック、その他の修飾の同定および解析に関する。
連邦政府資金援助条項
本発明は、米国国立ヒトゲノム研究所から授与された助成金番号1R43HG012170-01による米国政府の支援を受けて行われた。米国政府は発明に対して一定の権利を有する。
本発明は、米国国立ヒトゲノム研究所から授与された助成金番号1R43HG012170-01による米国政府の支援を受けて行われた。米国政府は発明に対して一定の権利を有する。
配列一覧
本出願には、ASCIIフォーマットで電子的に提出された配列表リストが含まれており、引用によりその全体が本明細書中に包含される。2021年11月24日に作成された当該ASCIIコピーは、ALID_001_02WO_SeqList_ST25.txtと名付けられ、サイズは40キロバイトである。
本出願には、ASCIIフォーマットで電子的に提出された配列表リストが含まれており、引用によりその全体が本明細書中に包含される。2021年11月24日に作成された当該ASCIIコピーは、ALID_001_02WO_SeqList_ST25.txtと名付けられ、サイズは40キロバイトである。
背景
ヌクレオチドの化学変化を含むエピジェネティックな変化は広範囲に及び、遺伝子発現、遺伝子サイレンシング、DNA損傷への応答などの生物学的プロセスにおいて重要な役割を果たしている。同様に、エピトランスクリプトーム修飾として知られるRNAの化学修飾は、転写中あるいは転写後に細胞内で頻繁に起こる。
ヌクレオチドの化学変化を含むエピジェネティックな変化は広範囲に及び、遺伝子発現、遺伝子サイレンシング、DNA損傷への応答などの生物学的プロセスにおいて重要な役割を果たしている。同様に、エピトランスクリプトーム修飾として知られるRNAの化学修飾は、転写中あるいは転写後に細胞内で頻繁に起こる。
ほとんどすべてのタイプの癌、認知機能障害、呼吸器系、循環器系、生殖器系、自己免疫系、神経行動系の病気など、多様な疾患、行動、その他の健康指標が、DNAのエピジェネティックな変化と相関している。しかし、ゲノム全体におけるエピジェネティックな変化の分布、特に健康および疾患との関連については、ほとんど知られていない。エピトランスクリプトーム修飾の機能はいくつか知られているが、細胞内RNA全体におけるこれらの修飾位置を特定し定量化する分析法がないため、多くは知られていない。現在のところ、エピトランススクリプトームRNA修飾の相関レベルおよびそれらの細胞内での変化についてはほとんど何もわかっていない。
化学的誘導体化法、分子認識法(通常、濃縮および検出の両方に抗体を使用)、逆転写による塩基配列決定法を組み合わせることで、限られた数のDNAおよびRNAの修飾に対するプロファイリング法が提供されていた。しかし、これらの方法は感度が高くなく、核酸の分解/フラグメント化を引き起こし、一塩基分解能で修飾の位置を同定できないことが多い。さらに、これらの方法は多重化には適していない。一般的なエピトランスクリプトームRNA修飾の塩基配列を決定する既存の方法は、検出された修飾の数(一桁以上異なる)および修飾位置の両方において、しばしば相反する所見を与える。
従って、DNAおよびRNAの修飾を同定、分析、定量、位置特定するための改良された組成物および方法が当技術分野で必要とされている。このような進歩は、健康および疾患における生物学の重要な制御メカニズムの発見、ならびに医学における新たな治療パラダイムの開発に道を開き得る。
概要
本発明は、RNAおよびDNAを含む核酸の構造に対するエピトランスクリプトーム、エピジェネティック、その他の化学的修飾を同定および分析するための組成物および方法を提供する。本発明は、潜在的に無制限の数のDNAおよび/またはRNA修飾を一分子レベルで同時にプロファイリングするための、高度に並列化された、高感度、高精度、高スループットの方法を提供する。
本発明は、RNAおよびDNAを含む核酸の構造に対するエピトランスクリプトーム、エピジェネティック、その他の化学的修飾を同定および分析するための組成物および方法を提供する。本発明は、潜在的に無制限の数のDNAおよび/またはRNA修飾を一分子レベルで同時にプロファイリングするための、高度に並列化された、高感度、高精度、高スループットの方法を提供する。
いくつかの態様において、本発明は、結合ドメインおよびアダプターを含む核酸結合分子を提供し、ここで、結合ドメインは、DNAまたはRNAの非古典的特徴に特異的に結合し、かつアダプターは、結合ドメインによって特異的に結合される非古典的特徴に特異的な核酸バーコード配列を含む。
いくつかの態様において、本発明は、核酸結合分子を作製する方法を提供し、この方法は、アダプターを結合ドメインに結合させて、アダプター-結合ドメインコンジュゲートを形成することを含む。
いくつかの態様において、本発明は、複数の標的核酸を分析するための方法を提供し、該方法は、標的核酸を、本明細書に記載の核酸結合分子と接触させる工程;(i)バーコード化核酸のオフターゲット生成を実質的に阻止する環境下で、核酸バーコードを標的核酸にトランスファーしてバーコード化標的核酸を生成する工程、または(ii)標的核酸のバーコード化コピーを生成する工程のいずれか;非古典的特徴の位置がバーコード化標的核酸またはバーコード化標的核酸コピーの一次核酸配列に基づいて同定可能であるように、バーコード化標的核酸またはバーコード化標的核酸コピーを改変する工程;ならびに、バーコード化標的核酸の塩基配列を決定する工程、を含む。
いくつかの態様において、本発明は、複数の標的核酸中の2以上の非古典的特徴を検出および/または定量するための方法を提供し、該方法は、標的核酸を少なくとも2つの核酸結合分子と接触させる工程であって、各核酸結合分子が結合ドメインおよびアダプターを含み、各核酸結合分子の結合ドメインが、DNAまたはRNAの異なる非古典的特徴に結合し、アダプターが、各結合ドメインによって特異的に結合される非古典的特徴に特異的な核酸バーコード配列を含む工程;(i)バーコード化核酸のオフターゲット生成を実質的に阻止する環境下で、バーコード化標的核酸を生成するために、核酸バーコードを標的核酸にトランスファーする、または(ii)標的核酸のバーコード化コピーを生成する工程;非古典的特徴の位置がバーコード化標的核酸またはバーコード化標的核酸コピーの一次核酸配列に基づいて同定できるように、バーコード化標的核酸またはバーコード化標的核酸コピーを改変する工程のいずれか;ならびに、バーコード化標的核酸の塩基配列を決定する工程、を含む。
いくつかの態様において、本発明は、標的核酸中の非古典的特徴を検出するための方法を提供し、該方法は、標的核酸を、本明細書に記載の核酸結合分子と接触させる工程;バーコード化核酸のオフターゲット生成を実質的に阻止する環境下で、(i)核酸バーコードを標的核酸にトランスファーしてバーコード化標的核酸を生成する工程、または(ii)標的核酸のバーコード化コピーを生成する工程のいずれか;ならびに、標的核酸またはそのコピー中のバーコードの存在を検出する工程、を含む。
いくつかの態様において、本開示は、標的核酸中の非古典的特徴の位置を一塩基分解能で決定するための方法を提供し、該方法は以下の工程を含む:標的核酸を、本明細書に記載の核酸結合分子に接触させる工程;(i)バーコード化核酸のオフターゲット生成を実質的に防止する環境下で、核酸バーコードを標的核酸に転写してバーコード化標的核酸を生成する工程、または(ii)標的核酸のバーコード化コピーを生成する工程のいずれか;ならびに、標的核酸またはそのコピー中のバーコードの存在を検出する工程;ここで、核酸結合分子は、以下の1以上が可能な結合ドメインを含む:標的核酸に変異を誘導すること、またはポリメラーゼバイパスを防止することにより、標的核酸のコピー間に切断を引き起こすこと。
いくつかの態様において、本発明は、塩基編集酵素を含む核酸結合分子を提供し、ここで塩基編集酵素はデアミナーゼである。
また本明細書では、標的核酸に結合した核酸結合分子を含む複合体も提供する。
また、本明細書で提供されるのは、本明細書に記載の核酸結合分子に結合した基質である。
また、本明細書には、本明細書に記載の核酸結合分子に結合したポリマーも提供される。
本発明のこれらの面および他の面は、以下の詳細な説明、特許請求の範囲、態様、方法、化合物、および/または組成物、ならびに関連する背景情報および参考文献を参照することにより明らかとなり得る。
詳細な説明
本発明は、トランスクリプトームおよびゲノムのそれぞれにわたるRNAおよびDNA修飾の多重プロファイリングのための組成物および方法を提供する。この方法は、標的核酸の非古典的特徴(例えば、塩基修飾、骨格修飾、損傷、および/または構造的要素)の分子認識と、この認識事象からの情報をバーコードを用いて標的核酸の隣接遺伝子配列に書き込む工程とを組み合わせている。得られたバーコード化核酸は、次に配列決定ライブラリーに変換され、例えばDNA/RNA配列決定法または他の方法によって読み取られる。この工程により、バーコードの配列が明らかになり、標的核酸の非古典的特徴と相関する。塩基配列決定により、標的核酸中の非古典的特徴の局在を確認することもできる。本明細書に記載のハイスループット・プロファイリング法は、複数またはすべてのDNA/RNA修飾の性質および位置を並行して同定することを可能にする。これらの方法では、DNA/RNA修飾の存在量および化学量論も決定できる。
本発明は、トランスクリプトームおよびゲノムのそれぞれにわたるRNAおよびDNA修飾の多重プロファイリングのための組成物および方法を提供する。この方法は、標的核酸の非古典的特徴(例えば、塩基修飾、骨格修飾、損傷、および/または構造的要素)の分子認識と、この認識事象からの情報をバーコードを用いて標的核酸の隣接遺伝子配列に書き込む工程とを組み合わせている。得られたバーコード化核酸は、次に配列決定ライブラリーに変換され、例えばDNA/RNA配列決定法または他の方法によって読み取られる。この工程により、バーコードの配列が明らかになり、標的核酸の非古典的特徴と相関する。塩基配列決定により、標的核酸中の非古典的特徴の局在を確認することもできる。本明細書に記載のハイスループット・プロファイリング法は、複数またはすべてのDNA/RNA修飾の性質および位置を並行して同定することを可能にする。これらの方法では、DNA/RNA修飾の存在量および化学量論も決定できる。
いくつかの態様では、本明細書に記載の方法は、標的核酸上の修飾を同定するだけでなく、標的核酸上の修飾を1塩基ほどの高分解能で局在化するためにも用いられる。
本発明は、以下に、例示的かつ限定されない態様で、かつ添付図面を用いてより詳細に説明される。しかしながら、本発明は、多くの異なる形態で具体化され得るものであり、以下に示す態様に限定して解釈されるべきではない。むしろ、これらの態様は、本明細書の記載を完全にし、当業者に本明細書に記載された範囲を伝えるために提供される。
別段の定義がない限り、本明細書で用いるすべての技術用語および科学用語は、本発明が属する技術分野における当業者によって一般的に理解されるのと同じ意味を有する。本明細書の詳細な説明で用いられる用語は、特定の態様を説明するためだけのものであり、限定を意図するものではない。
すべての刊行物、特許出願、特許、GenBank/Uniprotまたは他の受託番号、および本明細書に記載される他の参考文献は、すべての目的のために引用によりその内容全体が本明細書に包含される。
定義
以下の用語は、本明細書および添付の特許請求の範囲において用いられる。
以下の用語は、本明細書および添付の特許請求の範囲において用いられる。
単数形の“a”、“an”、および“the”は、文脈上そうでないことが明らかな場合を除き、複数形も含むものとする。
さらに、ポリヌクレオチドまたはポリペプチド配列の長さの量、用量、時間、温度などの測定可能な値に言及するとき、本明細書で用いる用語“約”とは、規定量の±20%、±10%、±5%、±1%、±0.5%、またはさらに±0.1%の変動を包含することを意味する。
また、本明細書で用いる“および/または”は、関連する列挙された項目の1以上の何れかの可能な組み合わせ、ならびに代替的に解釈されるとき、組み合わせの欠失(“または”)を意味し、それらを包含する。
他にこれと異なる記載がない限り、本明細書に記載される種々の特徴は、何れかの組み合わせで使用できることが特に意図されている。さらに、いくつかの態様では、本明細書に記載の特徴または特徴の組み合わせのいずれかを除外または省略できる。さらに説明すると、例えば、本明細書において、特定のDNA塩基がA、T、Gおよび/またはCから選択され得ることが示されている場合、この用語は、その塩基がこれらの塩基の何れかのサブセット、例えばA、T、GまたはC;A、TまたはC;TまたはG;Cのみ等から選択され得ることも示しており、かかるサブコンビネーションがそれぞれ本明細書において明示的に記載されているかのように記載される。さらに、かかる用語は、指定された塩基の1以上が除外されうることも示している。例えば、いくつかの態様では、核酸はA、TまたはGではない;Aではない;GまたはCではない等、そのような可能性のある各除外が本明細書に明示されているかのように記載される。
本明細書で用いる用語“減少”、“低減”、“低下”および類似の用語は、少なくとも約10%、約15%、約20%、約25%、約35%、約50%、約75%、約80%、約85%、約90%、約95%、約97%またはそれ以上の減少を意味する。
本明細書で用いる用語“増加”、“改善”、“増強”、“強化”、および類似の用語は、少なくとも約10%、約15%、約20%、約25%、約50%、約75%、約100%、約150%、約200%、約300%、約400%、約500%またはそれ以上の増加を示す。
用語“エピジェネティック変化”とは、本明細書では、その細胞または生物のDNAの一次配列(すなわち、A、T、CおよびG)にコードされていない、生細胞、生物などにおける表現型の変化を意味するために用いられる。エピジェネティックな変化には、例えば、ヌクレオチドおよび/またはヒストン(すなわち、核内のDNAのコイル化およびパッケージングに関与するタンパク質)の化学的変化が含まれ得る。例示的なDNAヌクレオチド修飾には、一般的なエピジェネティックマーカーである5-メチルシチジン(5mC)およびその酸化産物である5-ヒドロキシメチルシチジン(5hmC)、5-ホルミルシチジン(5fC)、5-カルボキシメチルシチジン(5caC)などが含まれる。5mCは遺伝子サイレンシングにおけるその役割でよく知られているが、5mCの脱メチル化経路における酸化中間体5hmC、5fCおよび5caCの代謝機能を示唆する証拠が増えている。さらに代謝的に関連するDNA修飾には、酸化、アルキル化、二量体化、架橋、その他DNA損傷に関連する化学修飾ヌクレオチドがある。このようなDNA修飾は毒性を理解する上で重要であるが、損傷が生じた際のゲノム全体におけるその分布はよくわかっていない。DNA修飾は、例えばプロモーターおよびゲノムの他の領域におけるG-四重鎖の動態に関与するなど、さらなる制御的役割を担っている可能性がある。
本明細書で用いる用語“エピトランスクリプトーム変化”とは、転写中または転写後に起こるRNAの化学修飾を意味する。核酸塩基、リボース、ホスホジエステル骨格への化学変化を含め、170以上の異なるRNA修飾が知られている。RNA修飾は、mRNA、tRNA、rRNA、lncRNA、miRNAなど、全てのRNAタイプに見出だされ、RNAの構造および動態を変化させたり、タンパク質など他の生体分子によるRNAの分子認識を変化させたりすることによって、細胞の表現型を変化させ得る。エピトランスクリプトームの天然化学RNA修飾は、RNAプロセシング、スプライシング、ポリアデニル化、編集、構造、安定性、局在化、翻訳開始、遺伝子発現など、RNA代謝における幅広い機能を制御している。エピトランススクリプトームは、細胞タイプ、代謝状態、健康状態によって異なり、細胞の表現型および機能の分化に重要な役割を果たし(しかし、あまり理解されていない)、同一の一次遺伝配列を有する同一生物の細胞間の劇的な表現型の違いを説明するのに役立っている。エピトランススクリプトームの変化は疾患と相関する。例えば、mRNAおよびncRNAの修飾は、がん幹細胞の分化過程において、時空間的な遺伝子発現の変化を制御することが知られており、それによって疾患の進行に組織化した役割を果たしている。さらに、RNA修飾は、RNAウイルス(例えば、コロナウイルス科およびフラビウイルス科)が宿主を裏切り、自然免疫系を回避する重要な機序であることが強く予期される。
用語“ゲノム”とは、細胞または細胞集団に含まれるすべてのDNA、あるいは特定のタイプのDNA分子(例えば、コーディングDNA、非コーディングDNA、ミトコンドリアDNA、または葉緑体DNA)の選択を意味する。用語“トランスクリプトーム”とは、1つの細胞または細胞集団で産生されるすべてのRNA分子、あるいは完全なトランスクリプトームに含まれる特定の種類のRNA分子の選択(例えば、mRNA 対 ncRNA、またはmRNAトランスクリプトーム内の特定のmRNA)を意味する。いくつかの態様では、トランスクリプトームは、コーディングRNA(すなわち、タンパク質に翻訳されるRNA、例えばmRNA)および非コーディングRNAなどの複数の異なるタイプのRNAを含む。トランスクリプトーム中に見出される様々なタイプのRNA分子の限定されないリストには、修飾ヌクレオシドを含み得るものが含まれる:7SK RNA、シグナル認識粒子RNA、アンチセンスRNA、CRISPR RNA、ガイドRNA、ロング非コーディングRNA、マイクロRNA、メッセンジャーRNA、piwi相互作用RNA、リピート関連siRNA、レトロトランスポゾン、リボヌクレアーゼMRP、リボヌクレアーゼP、リボソームRNA、カハール小体(small Cajal body)特異的RNA、小干渉RNA、smY RNA、小核RNA、およびトランス作用siRNA。
本明細書で用いる用語、核酸の“非古典的特徴”とは、その一次配列とは別個の核酸の特徴を意味する。例えば、非古典的特徴とは、DNAまたはRNA塩基、あるいはDNAまたはRNA骨格に対する化学的修飾であり得るる。いくつかの態様では、非古典的特徴は、ヘアピンまたはループのような構造配列であってもよい。いくつかの態様では、非古典的特徴は、DNAまたはRNA損傷のような核酸損傷であり得る。他の例示的な非古典的構造としては、Z-DNA構造、G-四重鎖、i-モチーフ、バルジ、脱塩基部位、三重鎖、三方向結合、十字形構造、四重ループ、リボースジッパー、シュードノットなどが挙げられるが、これらに限定されない。DNAおよびRNAを含む核酸は、多くの非古典的特徴を含む。これらの修飾の頻度はRNAおよび特徴の種類によって大きく異なるが、修飾のクラスターが発生することもある。いくつかの態様では、非古典的特徴はDNAおよび/またはRNAの損傷に起因し得る。本明細書で用いる用語“非古典的特徴”および“改変”とは、当業者であれば文脈上理解されるように、互換的に使用できる。
本明細書で用いる用語“標的核酸”とは、1以上の非古典的特徴を含む核酸を意味する。本明細書に記載の核酸結合分子は、分子の結合ドメインが非古典的特徴を認識するとき、標的核酸に結合できる。
本明細書で用いる用語“基質”とは、何れかの固体支持体を意味するために用いられる。例えば、基質はビーズ、チップ、プレート、スライド、ディッシュ、3次元マトリックスなどである。本明細書に記載されているように、本明細書に記載されている核酸結合分子は、1以上の基質に結合してもよく、基質は1以上の核酸結合分子に結合してもよい。基質は種々の材料で形成できる。いくつかの態様では、基質は樹脂、膜、繊維、ポリマーである。いくつかの態様において、基質は、セファロース、アガロース、セルロース、ポリスチレン、ポリメタクリレート、および/またはポリアクリルアミドを含む。いくつかの態様では、基質は合成ポリマーなどのポリマーを含む。合成ポリマーの限定されないリストには、ポリ(エチレン)グリコール、ポリイソシアノペプチドポリマー、ポリ乳酸-コ-グリコール酸、ポリ(ε-カプロラクトン)(PCL)、ポリ乳酸、ポリ(3-ヒドロキシ酪酸-コ-3-ヒドロキシバレレート)(PHBV)、キトサンおよびセルロースが含まれる。
本明細書で用いる用語“バーコード”とは、合成産生された核酸を意味する。固有のバーコードを特定の核酸修飾に割り当てて、本明細書に記載の方法においてそれらの修飾を特異的に同定できるようにしてもよい。したがって、バーコードは、本明細書に記載される1以上の方法において、その改変を同定するために特別に用いられるとき、非古典的改変に対して“ユニーク”である。バーコードは、固相オリゴヌクレオチド合成など、当技術分野で知られている方法を用いて製造できる。ある態様では、バーコードはDNAバーコードであってもよい(すなわち、DNA配列を含んでいてもよい)。いくつかの態様において、バーコードは、ペプチド核酸(PNA)またはロック核酸(LNA)などの合成DNA構造を含んでいてもよい。いくつかの態様では、合成DNA構造は、1以上の修飾塩基を含んでいてもよい。ある態様では、バーコードはRNAバーコードであってもよい(すなわち、RNA配列を含んでいてもよい)。バーコードはどのような長さであってもよく、例えば、約4から約150ヌクレオチド長の範囲であり得る。いくつかの態様において、バーコードは、約4~約20ヌクレオチド長、例えば、約4ヌクレオチド長、約5ヌクレオチド長、約6ヌクレオチド長、約7ヌクレオチド長、約8ヌクレオチド長、約9ヌクレオチド長、約10ヌクレオチド長、約11ヌクレオチド長、約12ヌクレオチド長、約13ヌクレオチド長、約14ヌクレオチド長、約15ヌクレオチド長、約16ヌクレオチド長、約17ヌクレオチド長、約18ヌクレオチド長、約19ヌクレオチド長、または約20ヌクレオチド長である。通常、バーコードは、既知の生物のゲノムにはない、合理的に設計された配列を含み得る。しかしながら、いくつかの態様では、バーコードは既知の配列を含み得る。例えば、バーコード配列は、病原体または他の生物学的物質に関連するシグネチャーを含み得る。ある態様では、バーコードは、配列決定反応を促進するように構成された配列を含んでいてもよい。用語“バーコード”および“アダプター”とは、本明細書で互換的に用いられ得る。当技術分野で理解されるように、アダプターは、いくつかの態様では、バーコードで構成される。いくつかの態様では、アダプターは、以下に説明され、図2A-2Gに示されるように、バーコードおよび1以上の追加要素を含み得る。
用語“増幅”とは、核酸に関して使われるとき、その核酸のコピーを生成することを意味する。核酸は、例えばポリメラーゼ連鎖反応(PCR)を用いて増幅できる。核酸増幅の代替法としては、ヘリカーゼ依存性増幅(HAD)、リコンビナーゼポリメラーゼ増幅(RPA)、ループ介在等温増幅(LAMP)、核酸配列ベース増幅(NASBA)、自家持続配列複製法(3SR)およびローリングサークル増幅(RCA)などが含まれる。
本明細書で用いる用語“複合体内アダプタートランスファー”または“複合体内バーコードトランスファー”とは、核酸結合分子がそれに結合している間に、アダプターおよび/またはバーコードが標的核酸(例えば、DNAまたはRNA)にトランスファーすることを意味する。したがって、本明細書中、用語“複合体”とは、標的核酸とその同族核酸結合タンパク質との間に形成される複合体を意味する。
本明細書で用いる用語“クロストーク”、“バーコードクロストーク”、および類似の用語は、核酸バーコードの標的外トランスファーを意味する。例えば、バーコードのクロストークは、核酸結合分子のバーコードが、核酸結合分子の結合ドメインに結合していない核酸にトランスファーされるときに起こり得る。
用語“DNAアドレス”とは、プログラム可能な結合エレメントとして用いられ、特定の結合事象を促進するDNAまたはRNA配列および/またはその相補体を意味する。例えば、デアミナーゼは、標的DNAまたはRNA配列(例えば、第2のDNAアドレス)に結合するDNAまたはRNA配列(すなわち、第1のDNAアドレス)に結合し、デアミナーゼをそこに誘導できる。第1のDNAアドレスと第2のDNAアドレスとの結合が、例えば図14Bに示されている(例えば、アドレス1およびアドレス1’)。
“DNA損傷”または“RNA損傷”などの“核酸損傷”は、内因性プロセスおよび/または外因性薬剤の結果として起こりうる核酸の化学的修飾である。例えば、DNA損傷は、酸化的損傷(8-オキソグアニンなど)、炭化した肉およびタバコの煙に含まれるような親電子物質およびアルキル化剤との反応(ベンゾ[a]ピレン付加物およびアルキル化核酸塩基)、紫外線損傷(シクロブタンピリミジン二量体および6-4ピリミジン-ピリミジン光生成物)、金属錯体形成(水銀錯体およびプラチナ架橋)などによって引き起こされる。内因性プロセスによって生じるDNA損傷は頻繁に起こる。DNA損傷は通常、様々な修復酵素によって修復されるか、遺伝暗号の複製中に損傷バイパスポリメラーゼによってバイパスされる。不自然な細胞増殖および成長をもたらす突然変異は、がん発生を駆動する。変異は通常のDNA配列決定で容易に検出できるが、損傷自体は標準的なDNA配列決定ワークフローでは検出できない。損傷はゲノム全体に一様に分布しているわけではなく、修復の効果はDNA遺伝子座および細胞状態に関連している。さらに、最も一般的ながん化学療法薬(シスプラチン、ゲムシタビンなど)はDNA損傷を誘発し、そのため、ヒトゲノム全体のDNA損傷をマッピングすることは、老化と癌の病因を理解し、癌化学治療薬の有効性を向上させ、毒性を低下させるための大きな可能性を提供する。
核酸結合分子およびその製造方法
本明細書で提供されるのは、結合ドメインおよびアダプターを含む核酸結合分子であり、それぞれについて以下にさらに詳しく説明する。
本明細書で提供されるのは、結合ドメインおよびアダプターを含む核酸結合分子であり、それぞれについて以下にさらに詳しく説明する。
アダプター
本明細書で用いる用語“アダプター”とは、DNAまたはRNA分子の末端に結合でき、何らかの機能を付与する何れかの短い核酸配列を意味する。例えば、いくつかの態様では、アダプターはDNAまたはRNA分子の配列決定および/または同定を容易にできる。
本明細書で用いる用語“アダプター”とは、DNAまたはRNA分子の末端に結合でき、何らかの機能を付与する何れかの短い核酸配列を意味する。例えば、いくつかの態様では、アダプターはDNAまたはRNA分子の配列決定および/または同定を容易にできる。
ある態様では、アダプターは5’リン酸を含む。いくつかの態様では、アダプターは3’リン酸を含む。ある態様では、アダプターは5’リン酸および3’リン酸を含む。いくつかの態様では、アダプターは一本鎖である。いくつかの態様では、アダプターは二本鎖である。いくつかの態様では、二本鎖アダプターは、相補的オリゴヌクレオチドにハイブリダイズした一本鎖アダプターを含み得る。
いくつかの態様では、アダプターは切断可能である。例えば、アダプターは1以上の切断部位を含んでいてもよい。開裂部位は、例えば、1個以上のウラシル塩基、酵素(例えば、制限酵素または他のヌクレアーゼ)によって認識される配列、または合成化学部分を含み得る。
いくつかの態様では、アダプターはユニバーサルフォワードプライマー(UFP)を含む。いくつかの態様において、アダプターはユニバーサルリバースプライマー(URP)を含む。いくつかの態様では、アダプターはUFPおよびURPを含む。いくつかの態様では、アダプターはUFPまたはURPで構成される。UFPおよびURP配列は、天然には存在しないDNA配列であり、標的核酸(またはそのコピー)に導入された配列のみを選択的に増幅できる。配列決定中、UFPおよび/またはURPはDNA標的にアニールされ、新しいDNA分子(すなわち、そのコピー)の伸長のための開始部位を提供する。例示的なUFPおよびURPのリストは、lslabs.com/resources/universal-primer-listのワールドワイドウェブアドレスで見ることができる。いくつかの態様において、アダプターに用いられる(そして標的核酸にトランスファーされる)ユニバーサルプライマー配列は、確立されたDNA配列決定プラットフォームと互換性があり、下流のPCR反応においてIllumina P5およびP7のような表面アダプターを導入するために用いられ得る。
いくつかの態様では、アダプターは、改変コード化バーコード(MBC)などのバーコードを含んでいてもよい。MBCは短いユニークな核酸配列である。各MBCは、特定のエピジェネティック修飾またはエピトランススクリプトーム修飾に関連して用いられ、その同定および/または解析に役立つ。例えば、MBCは、特定の非古典的特徴に特異的な結合ドメインに結合したアダプターに用いられ得る。いくつかの態様では、アダプターはバーコードで構成され得る。いくつかの態様では、アダプターはMBCで構成され得る。
ある態様では、アダプターはユニークな分子識別子(UMI)を含み得る。UMIは、4 [UMIの長さ] 個のユニークな変異体を有する短いランダム配列で構成されている。例えば、10塩基長のUMIは1,048,576(410)のユニークな分子をコードできる。UMIは、PCR増幅バイアスおよびエラーを補正するために、配列決定リードの絶対的定量に用いられる。例えば、RNAサンプルは100コピーの転写産物Aおよび100コピーの転写産物Bを含み得る。転写産物Bの方がより効率的に増幅するため、PCR増幅後、1Mコピーの転写産物Aおよび2Mコピーの転写産物Bが検出され得る。転写産物Aに対してUMIを使用するとき、100UMI変異体の10,000コピーが検出され、転写産物Bに対しては100 UMI変異体の20,000コピーが検出される。リード数を数える代わりにUMI変異体の数を数えることで、分子の絶対数がわかる。
通常、UMIの長さはUMIの衝突(collision)を避けるために選択される。UMIの衝突とは、同じ配列および同じUMIを有するが、2つの異なるゲノム分子に由来する2つのリードを観察する事象と定義される。UMIの衝突は、用いられるUMIの数、ユニーク対立遺伝子の数、および集団における各対立遺伝子の頻度の関数である。UMIの理想的な長さは、配列決定プラットフォームのエラー率および配列決定深度によっても変わる。エラー率の高い配列決定プラットフォームでは、UMIのエラーが偶発的なUMIの衝突を引き起こす可能性があるため、より長いUMIが必要となる。選択した遺伝子座の配列決定深度が全ゲノム配列決定よりも深い評定配列では、異なるゲノム分子からの多くの対立遺伝子が同じ配列を共有するため、より長いUMIも使用される。過剰に長いUMIは、より多くの配列決定サイクル数を必要とするため、実際の標的配列のリードが短くなるために避けられる。また、長いUMIはPCR反応においてミスプライミングを引き起こし、配列決定の乱れを生じる可能性がある。UMIは通常、約3から約25ヌクレオチド長の範囲である。いくつかの態様において、UMIは、約3~約20ヌクレオチド長、例えば、約3ヌクレオチド長、約4ヌクレオチド長、約5ヌクレオチド長、約6ヌクレオチド長、約7ヌクレオチド長、約8ヌクレオチド長、約9ヌクレオチド長、約10ヌクレオチド長、約11ヌクレオチド長、約12ヌクレオチド長、約13ヌクレオチド長、約14ヌクレオチド長、約15ヌクレオチド長、約16ヌクレオチド長、約17ヌクレオチド長、約18ヌクレオチド長、約19ヌクレオチド長、または約20ヌクレオチド長である。いくつかの態様では、UMIは8ヌクレオチド長であってもよい。いくつかの態様では、UMIは10ヌクレオチド長であってもよい。
図2A-2Gは、例示的な核酸アダプターの構造を示しており、凡例はそこで用いられている各要素の説明を示す。これらのアダプターには、参照しやすいようにタイプA、タイプB、タイプC、タイプD、タイプE、タイプFおよびタイプGのラベルが付けられている。
図2Aに示したアダプター(タイプA)は、UFP配列またはURP配列のいずれかを含み得る最小限のアダプターを表す。タイプAアダプターは、非古典的核酸特徴の同定または分析に用いられ得る配列を含まず、代わりにライブラリー構築に使用される。いくつかの態様では、タイプAアダプターは非古典的特徴を含まない核酸分子に結合される。いくつかの態様では、タイプAアダプターは、標的核酸の他端にバーコード化アダプターを導入した後、非古典的特徴を含む核酸分子に結合される。例えば、タイプAアダプターは、1以上のバーコードが付加された後、PCR増幅のために核酸をキャップし、調製するために使用できる。
図2B-2Gに示したアダプターはそれぞれ、非古典的DNA/RNA特徴(例えば、修飾塩基)の1つに特異的なMBCを含む。図2Bに示すように、タイプBアダプターは、cDNAの環化を伴うライブラリー調製ワークフローに使用できる。これらは切断部位(CLS)を含む。タイプBアダプターの切断はPCR増幅前に行ってもよい。図2Cに示すように、タイプCアダプターはCLSを欠き、ユニバーサルプライマー領域を1つだけ含んでいる。タイプCアダプターは、例えばライゲーション反応によるバーコード導入に使用できる。これらは、Smart-Seq技術による鋳型スイッチングオリゴヌクレオチドまたは他のアダプターライゲーションなどの第二鎖合成法と組み合わせてもよい。図2Dに示すように、タイプDアダプターはプライマー伸長によるエンコード用に特別に設計されている。タイプDアダプターは、3’末端スペーサー(SP)を1つ、あるいは両端に2つのスペーサー領域(例えばSP1、SP2)を有する。反応は、短いスペーサー領域(SP)を標的核酸の3’末端にライゲーションし、相補的スペーサーを有するタイプDアダプターを結合させることによって開始される。スペーサーは、すべての核酸結合分子およびサイクルにわたって普遍的であってもよく、核酸結合分子の各タイプに固有であってもよく、またはバーコード化の各サイクルに固有であってもよい。いくつかの態様では、アダプターは、1つ、2つ、3つ、または4つのスペーサーを含む。いくつかの態様では、アダプターは1つのスペーサーを含む。いくつかの態様では、アダプターは2つのスペーサーを含む。いくつかの態様において、スペーサーは、3ヌクレオチド長、4ヌクレオチド長、5ヌクレオチド長、6ヌクレオチド長、7ヌクレオチド長、8ヌクレオチド長、9ヌクレオチド長、10ヌクレオチド長、11ヌクレオチド長、12ヌクレオチド長、13ヌクレオチド長、14ヌクレオチド長、15ヌクレオチド長、16ヌクレオチド長、17ヌクレオチド長、18ヌクレオチド長、19ヌクレオチド長または20ヌクレオチド長である。いくつかの態様において、スペーサーは6ヌクレオチド長である。いくつかの態様において、スペーサーは7ヌクレオチド長である。いくつかの態様では、スペーサーは8ヌクレオチド長である。いくつかの態様において、スペーサーは配列番号19を含む。タイプDアダプターは、例えば、プライマー伸長反応による1回のバーコード転写、または複数の連続したバーコード転写に使用できる。複数サイクルのバーコーディングは、各サイクルにおいて1つだけ、または非古典的特徴のサブセットだけを調べるために使用できる。例えば、第1のコード化サイクルでは、m5Cに特異的な核酸結合分子を用いることができる。第2のコード化サイクルでは、m6Aに特異的な核酸結合分子を用いることができる。第3のコード化サイクルは、イノシンなどに特異的な核酸結合分子を用いることができる。別の態様では、第1サイクルはm5Cおよびm6Aを試用し、第2サイクルはイノシンを試用してもよい。別の態様では、第1のエンコード化サイクルはすべての非古典的特徴を試用し、第2のエンコード化サイクルはすべての非古典的特徴を2回目に試用し得る。図2Eに示すように、タイプEアダプターは、アダプターを含む核酸結合分子を介して配置されたとき、修飾部近傍の標的核酸に結合するランダムな足(feet)を有するヘアピンの形をとる。足はランダムな配列でも、目的の領域でもよい。さらに、核酸二重鎖の融解温度を上昇させ、逆転写酵素およびDNAポリメラーゼによる鎖置換に対する修飾塩基を含んでいることもある。いくつかの態様では、ヘアピンのステム領域は安定にアニールし、冗長な配列決定内容を最小限にするために可能な限り短い。スペーサーと同様に、ステムはすべての核酸結合分子に普遍的であるか、または多様である。いくつかの態様では、ループ領域は切断可能である。タイプEアダプターは、例えば、内部プライミングやロングリード構築に用いられ得る。図2Fに示すように、タイプFはタイプEアダプターを改良したもので、切断されたループで構成されている。タイプFアダプターの全体的な構造は、Y字型、L字型、またはそれらの組み合わせである。図2Gに示すように、タイプGアダプターはDNAアドレスを含むことによってタイプDアダプターに由来する。DNAアドレスは、何れのアダプター・アーキテクチャにも含めることができる。
いくつかの態様では、アダプターはUFP、URP、またはUFPおよびURPを含む。いくつかの態様では、アダプターはUFPおよび/またはURPを含み、さらにMBCも含む。いくつかの態様では、アダプターは、UFPおよび/またはURP、MBC、およびUMIを含む。いくつかの態様では、アダプターは、UFPおよび/またはURP、MBC、UMIおよびCLSを含む。いくつかの態様では、アダプターは、UFPおよび/またはURP、MBC、UMI、CLS、およびSPを含む。いくつかの態様では、アダプターは、UFP、CLS、URP、UMI、およびMBCを含む。いくつかの態様では、アダプターは、UFP、UMI、およびMBCを含む。いくつかの態様では、アダプターは、URP、UMI、およびMBCを含む。いくつかの態様では、アダプターは、第1のSP、MBC、UMI、および第2のSPを含む。
いくつかの態様では、アダプターはヘアピン形状を有する。いくつかの態様では、MBCを含むアダプターはヘアピン形状を有する。いくつかの態様では、MBCを含むアダプターはヘアピン形状を有し、ヘアピンは、4~20塩基対の長さのステム領域、および2つのランダムなまたは標的化された足とからなり、各足の長さは約4~10塩基対である。
いくつかの態様では、アダプターはL字型、Y字型、またはそれらの組み合わせを有する。いくつかの態様では、L字形状またはY字形状を有するアダプターは、UFP、MBC、およびURPを含む。いくつかの態様において、L字形状またはY字形状を有するアダプターは、UFP、MBC、およびURPを含み、アダプターは、約4~約20塩基対の長さを有するステム領域を含み、さらに、ランダムまたは標的化された足を含み、各足は、約4~10塩基対の長さを有する。
本明細書に記載のアダプターは、いくつかの態様では、結合ドメインとアダプターの連結を補助するリンカーなど、1以上のリンカーを含んでいてもよい。リンカーとしては、ポリエチレングリコール、炭化水素、ペプチド、DNAまたはRNAが挙げられる。リンカーの長さは様々である。DNAまたはRNAの非古典的特徴が核酸配列の5’末端または3’末端から離れた場所にある場合には、より長いリンカーを使用できる。より短いリンカーは、DNAまたはRNAの非古典的特徴が核酸配列の5’末端または3’末端に比較的近い位置にある場合に使用される。
いくつかの態様では、アダプター、またはその中に含まれるリンカー配列は切断可能である。例えば、アダプターは1以上の切断部位を含んでいてもよい。アダプターは化学的、光化学的、酵素的に切断可能であってもよい。開裂部位は、例えば、1個または数個のウラシル塩基、酵素(例えば、制限酵素または他のヌクレアーゼ)によって認識される配列、または合成化学部分、例えば、ジスルフィド、炭酸エステル、ヒドラゾン、シス-アコニチル、または(β-グルクロニド)を含み得る。
以下にさらに詳しく述べるように、アダプターは、バーコードトランスファー反応を用いて、一本鎖または二本鎖の標的核酸(例えば、DNAまたはRNA)に融合させることができる。
いくつかの態様において、プライマー伸長は、RNA標的に3’ポリ-rAテイルを付加することを含む。いくつかの態様では、プライマー伸長は、図23Aに示されているように、RNA標的に3’ポリ-rAテイルを付加することを含む。3’ポリ-rAテイルは、何れかの公知のポリ(A)ポリメラーゼ(例えば、大腸菌ポリ(A)ポリメラーゼ)を用いたポリアデニル化によって付加される。いくつかの態様では、RNA標的はポリ(A)ポリメラーゼおよび競合ポリdTオリゴヌクレオチドと共にインキュベートされる。ポリ(A)ポリメラーゼと競合するポリdTオリゴヌクレオチドとの共処理は、付加された3’ポリ-rAテイルの長さを制御する。通常、ポリアデニル化によって、平均3’ポリ-rAテイル長は約150塩基となる。いくつかの態様において、3’ポリ-rAテイルの長さは、約5塩基長、約10塩基長、約15塩基長、約20塩基長、約25塩基長、約30塩基長、約35塩基長、約40塩基長、約45塩基長、約50塩基長、約55塩基長、または約60塩基長である。
いくつかの態様において、プライマー伸長は、3’ポリ-Uテイル、3’ポリ-Gテイル、3’ポリ-Aテイルまたは3’ポリ-GテイルをRNA標的に付加することを含む。ホモポリマーテイルは、公知のポリ(U)ポリメラーゼ(例えば、分裂酵母;Schizosaccharomyces pombe Cid1)を用いて付加される。いくつかの態様では、RNA標的をポリ(U)ポリメラーゼ、GTPおよび競合ポリdCオリゴヌクレオチドと共にインキュベートする。ポリ(U)ポリメラーゼおよび競合するポリdCオリゴヌクレオチドとの共処理は、付加された3’ポリGテイルの長さを制御する。いくつかの態様において、3’ポリGテイルの長さは、約5塩基長、約10塩基長、約15塩基長、約20塩基長、約25塩基長、約30塩基長、約35塩基長、約40塩基長、約45塩基長、約50塩基長、約55塩基長、または約60塩基長である。
いくつかの態様では、アダプターは配列番号56を含む。いくつかの態様では、アダプターは配列番号57を含む。いくつかの態様では、アダプターは配列番号6を含む。いくつかの態様では、スペーサーを含むアダプターは配列番号25を含む。いくつかの態様では、スペーサーを含むアダプターは配列番号26を含む。いくつかの態様では、スペーサーを含むアダプターは配列番号27を含む。いくつかの態様では、スペーサーを含むアダプターは配列番号38を含む。いくつかの態様において、ビオチンアダプターは配列番号33を含む。いくつかの態様では、DBCO標識アダプターは配列番号22を含む。いくつかの態様では、環状(clicked)アダプターは配列番号39を含む。
結合ドメイン
本明細書で用いる用語“結合ドメイン”とは、修飾ヌクレオシドのような標的核酸の非古典的特徴に結合する核酸、ポリペプチドなどを意味する。用語“結合ドメイン”は、当業者には文脈から理解され得るように、本明細書中、“結合剤”、“認識エレメント”、“抗体”などの用語と互換的に用いられ得る。いくつかの態様では、結合ドメインは標的核酸の非古典的特徴に結合する。いくつかの態様では、結合ドメインは、非古典的特徴に隣接する何れかの核酸特徴にも結合しない。いくつかの態様において、結合ドメインは、(i)標的核酸の非古典的特徴、および(ii)非古典的特徴に隣接する1以上の核酸特徴(例えば、核酸塩基、糖、リン酸、またはそれらの組み合わせ)の両方に結合する。いくつかの態様では、結合ドメインは保存配列モチーフに結合し得る。例えば、m6Aはしばしば以下のモチーフに生じる:GG(m6A)CT。したがって、結合ドメインがm6Aに結合するとき、それに隣接する1以上の核酸(例えば、GGまたはCT)にも結合し得る。別の例として、結合ドメインはtRNAのアンチコドンループの全部または一部に結合できる。いくつかの態様において、結合ドメインはtRNAと結合し、ここで、結合ドメインはtRNA上の修飾および既知の配列と結合する。
本明細書で用いる用語“結合ドメイン”とは、修飾ヌクレオシドのような標的核酸の非古典的特徴に結合する核酸、ポリペプチドなどを意味する。用語“結合ドメイン”は、当業者には文脈から理解され得るように、本明細書中、“結合剤”、“認識エレメント”、“抗体”などの用語と互換的に用いられ得る。いくつかの態様では、結合ドメインは標的核酸の非古典的特徴に結合する。いくつかの態様では、結合ドメインは、非古典的特徴に隣接する何れかの核酸特徴にも結合しない。いくつかの態様において、結合ドメインは、(i)標的核酸の非古典的特徴、および(ii)非古典的特徴に隣接する1以上の核酸特徴(例えば、核酸塩基、糖、リン酸、またはそれらの組み合わせ)の両方に結合する。いくつかの態様では、結合ドメインは保存配列モチーフに結合し得る。例えば、m6Aはしばしば以下のモチーフに生じる:GG(m6A)CT。したがって、結合ドメインがm6Aに結合するとき、それに隣接する1以上の核酸(例えば、GGまたはCT)にも結合し得る。別の例として、結合ドメインはtRNAのアンチコドンループの全部または一部に結合できる。いくつかの態様において、結合ドメインはtRNAと結合し、ここで、結合ドメインはtRNA上の修飾および既知の配列と結合する。
本明細書に記載の核酸結合分子は、1以上の結合ドメインを含み、結合ドメインはDNAまたはRNAの非古典的特徴に特異的に結合する。本明細書に記載される結合ドメインは、標的核酸の非古典的特徴を認識して結合できるタンパク質、核酸、またはそのフラグメントもしくは誘導体である。例えば、いくつかの態様において、結合ドメインは、抗体、アプタマー、リーダータンパク質、ライタータンパク質、イレイサータンパク質、人工高分子スキャフォールド、人工タンパク質スキャフォールド、または選択的共有結合キャプチャー試薬、またはそれらのフラグメントもしくは誘導体を含む。いくつかの態様において、結合ドメインは、IgG抗体、抗原結合フラグメント(Fab)、一本鎖可変フラグメント(scFv)、または重鎖もしくは軽鎖単一ドメイン(VHおよびVL)を含む。いくつかの態様において、結合ドメインは、重鎖抗体(hcAb)またはhcAbのVHHドメイン(ナノボディ)を含む。いくつかの態様において、結合ドメインは、アデクチン、アフィボディ、アフィリン、アンチカリン、アトリマー、アビマー、二環式ペプチド、センチリン、シスノット、ダーピン、フィノマー、クニッツドメイン、オボディまたはプロネクチンなどの人工タンパク質スキャフォールドを含む。
IgG抗体は免疫グロブリンの主なアイソタイプである。IgGは2本の同一の重鎖および2本の同一の軽鎖を含み、共有結合でジスルフィド結合を介して安定化されている。IgGは、重鎖(VH)および軽鎖(VL)の可変N末端ドメインおよび6つの相補性決定領域(CDR)を介して抗原を認識する。いくつかの修飾DNAおよびRNA塩基に結合する抗体は市販されている。例えば、Active MotifおよびSigma社など、いくつかのものがhm5Cに特異的な抗体を販売している。ユーロジェンテック社。(Belgium)はm5Cに結合するモノクローナル抗体を販売している。Megabase Research Products社(米国)は、m5C 6-メチルアデノシンおよび7-メチルグアノシンに結合するウサギのポリクローナル血清を販売している。Abcam社(米国)は、RNA修飾m6 A、ac4 C、m1 A、m2,2 G、m4 C、m2 A、m6,6 Aおよびm8 Aに対する組み換え抗体を販売している。
修飾塩基に結合する抗体もまた、当業者に公知の方法に従って開発できる。いくつかの態様では、抗体はモノクローナル抗体、ポリクローナル抗体、またはそれらの機能的フラグメントもしくは変異体である。本明細書で用いる用語“抗体”と語は、必要な特異性を有する結合ドメインを有するあらゆる特異的結合物質を対象とする。したがって、この用語は、天然か合成か、モノクローナルかポリクローナルかを問わず、免疫グロブリン結合ドメインを含むあらゆるポリペプチドを含む、抗体フラグメント、誘導体、機能的等価物、抗体のホモログをカバーする。免疫グロブリン結合ドメイン、またはそれと同等のものと他のポリペプチドとの融合体からなるキメラ分子も含まれる。
いくつかの態様では、結合ドメインはナノボディを含んでいてもよい。ナノボディは、ラクダ類およびいくつかの軟骨魚類が産生するように、重鎖抗体の単一の可変ドメイン(VHH)を含む。VHHドメインは、IgG抗体のCDRに比べて拡大された3つのCDRからなり、IgGと同程度の大きさ(すなわち、約800Å2)の抗原相互作用表面を提供する。ナノボディは、IgG抗体と同様の親和性で抗原と結合するが、それに対していくつかの利点がある:小さい(15kDa)、ジスルフィド結合が少ないため還元環境に弱い、より可溶性である、翻訳後グリコシル化がない。ナノボディは細菌発現系で生産できるため、ファージおよびその他のディスプレイ技術によって親和性および特異性を成熟させることができる。その他の利点としては、熱安定性および溶解性の向上、部位特異的標識への容易なアプローチが挙げられる。ナノボディはサイズが小さいため、凸状のパラトープを形成でき、アクセスしにくい抗原との結合に適している。ナノボディを産生するための例示的な方法には、それぞれの動物(例えば、ラクダ)を目的の抗原で免疫すること、既存のナイーブライブラリーをさらに進化させること、またはそれらの組み合わせが含まれる。
いくつかの態様では、結合ドメインは、リーダータンパク質、ライタータンパク質、またはイレイサータンパク質を含む。“リーダータンパク質”とは、DNAまたはRNA上の特定の化学修飾を選択的に認識して結合するタンパク質である。“ライタータンパク質”とは、DNAまたはRNAに特定の化学修飾を加えるタンパク質である。“イレイサータンパク質”とは、DNAまたはRNAから特定の化学修飾を取り除く酵素である。いくつかの態様では、結合ドメインは、リーダータンパク質、ライタータンパク質、またはイレイサータンパク質のフラグメントまたは誘導体を含む。いくつかの態様では、結合ドメインは、核酸結合を保持するが酵素活性を欠くように操作された形態などの、リーダー、ライター、またはイレイサータンパク質の操作された形態を含む。本明細書に記載の結合ドメインに用いられ得る、例示的なリーダータンパク質、ライタータンパク質、イレイサータンパク質を表1および表2に示す。その他のリーダータンパク質、ライタータンパク質、イレイサータンパク質は、以下のワールド・ワイド・ウェブ・アドレスに掲載されている:rnawre.bio2db.com。
凡例:W:ライター、E:イレーサー、R:リーダー、TS:腫瘍抑制因子、Onc:癌遺伝子。
RNA修飾:m1A:1-メチルアデノシン、ms2i6A:2-メチルチオ-N6-イソペンテニルアデノシン,i6A:N6-イソペンテニルアデノシン,m6A:N6-メチルアデノシン,m3C:3-メチルシトシン、m5C:5-メチルシトシン、ac4C:N4-アセチルシトシン、m7Gpp(pN):7-メチルグアノシンキャップ、m7G:7-メチルグアノシン内部、m2,2G:N2,N2,-ジメチルグアノシン、m2G:N2-メチルグアノシン、Q:ケウオシン、yW et al:ウィブトシンおよび誘導体、m5U:5-メチルウリジン、ncm5U:5-カルバモイル-メチルウリジン、mcm5U:5-メトキシカルボニル-メチルウリジン、mcm5s2U:5-メトキシカルボニルメチル-2-チオウリジン、D.ジヒドロウリジン、Ψ:シュードウリジン、Nm:2’-O-メチルヌクレオチド、m(pN):5’リン酸モノメチル化、A-to-I:アデノシンの脱アミノ化、C-to-U:シトシンの脱アミノ化。RNA修飾酵素:ADAR1-3:アデノシンデアミナーゼ RNA特異的1-3、ALKBH1/3/5/8:AlkBホモログ1/3/5/8,APOBEC1/3G:アポリポタンパク質B mRNA 編集触媒サブユニット1/3G,BCDIN3D:BCDIN3ドメイン含有RNAメチルトランスフェラーゼ,BUD23:RRNAメチルトランスフェラーゼおよびリボソーム成熟因子,CDK5RAP1:CDK5調節サブユニット関連タンパク質1,CMTR1/2:キャップメチルトランスフェラーゼ1/2,CTU1/2:細胞質チオウリジラーゼサブユニット1/2,DKC1:ジスケリンシュードウリジンシンターゼ1,DNMT2:tRNA アスパラギン酸メチルトランスフェラーゼ1,DUS2:ジヒドロウリジンシンターゼ2,ELP3:エロンゲーターアセチルトランスフェラーゼ複合体サブユニット3,FTO:FTOα-ケトグルタル酸依存性ジオキシゲナーゼ、HENMT1:HENメチルトランスフェラーゼ1、METTL1/2/3/6/8/14/16:メチルトランスフェラーゼライク-1/2/3/6/8/16、NAT10:N-アセチルトランスフェラーゼ10、NSUN1-5:NOP2/Sun RNAメチルトランスフェラーゼ1-5,NUDT16:Nudixヒドロラーゼ16,RNMT:RNAグアノシン-7メチルトランスフェラーゼ,TGT:Queuine TRNA-リボシルトランスフェラーゼ触媒サブユニット1,TRIT1:tRNAイソペンテニル転移酵素1、TRMT1/2A/2B1/5/6/10C/11/61A/61B/112:tRNAメチルトランスフェラーゼサブユニット、TYW2:tRNA-YW合成タンパク質2ホモログ。
いくつかの態様では、結合ドメインはリーダータンパク質を含む。いくつかの態様において、結合ドメインは、は、NUDTおよび予備YTHDから選択されるリーダータンパク質を含む。NUDTはU8 snoRNAデキャッピング酵素である(例えば、Uniprotアクセッション番号Q96DE0を参照)。YTHDC2は3’-5’RNAヘリカーゼである(例えば、Uniprotアクセッション番号Q9H6S0を参照)。いくつかの態様において、結合ドメインは、NUDT16またはYTHDC2のフラグメントまたは誘導体を含む。
いくつかの態様では、結合ドメインはライタータンパク質を含む。いくつかの態様において、結合ドメインは、DNTM1、DNTM3 A/B、NAT10、METTL3、METTL8、METTL15、TRM、BMT、DUS2、PUS、およびNSUN2から選択されるライタータンパク質を含む。DNMT1およびDNTM3 A/BはDNA(シトシン-5)メチルトランスフェラーゼである。NAT10はRNAシチジンアセチルトランスフェラーゼである(例えば、Uniprotアクセッション番号Q9H0A0を参照)。METTL3は、N6-アデノシン-メチルトラスフェラーゼ触媒サブユニットである(例えば、Uniprotアクセッション番号Q86U44を参照)。NSUN2はRNAシトシンC(5)-メチルトランスフェラーゼである(例えば、Uniprotアクセッション番号Q08J23を参照)。いくつかの態様において、結合ドメインは、NAT10、METTL3、またはNSUN2のフラグメントまたは誘導体であるライタータンパク質を含む。
いくつかの態様では、結合ドメインはイレイサータンパク質を含む。いくつかの態様において、結合ドメインは、FTO、ALKBH3、およびALKBH5から選択される操作されたイレイサータンパク質を含む。FTOはα-ケトグルタル酸依存性ジオキシゲナーゼである(例えば、Uniprotアクセッション番号Q9C0B1を参照)。ALKBH3は、α-ケトグルタル酸依存性ジオキシゲナーゼalkBホモログ3である(例えば、Uniprotアクセッション番号Q96Q83を参照)。ALKBH5はRNA脱メチル化酵素である(例えば、Uniprotアクセッション番号Q6P6C2を参照)。いくつかの態様において、結合ドメインは、FTO、ALKBH3、またはALKBH5のフラグメントまたは誘導体であるライタータンパク質を含む。
結合ドメインは、DNAまたはRNAの非古典的特徴に結合するように選択および/または操作され得る。例えば、非古典的特徴は、修飾された塩基、DNA損傷、修飾された骨格、または構造的要素である。いくつかの態様では、結合ドメインは2以上の非古典的能に結合し得る。いくつかの態様では、結合ドメインは同じ結合モチーフを有する変異ファミリーと結合する。例えば、いくつかの態様では、結合ドメインは、5-メチルシチジン(5mC)およびその酸化生成物である5-ヒドロキシメチルシチジン(5hmC)、5-ホルミルシチジン(5fC)と結合する。
いくつかの態様では、結合ドメインは修飾塩基および/またはヌクレオシドに結合する。いくつかの態様において、結合ドメインは、少なくとも1つ、少なくとも2つ、または少なくとも3つの修飾ヌクレオシドと接触する。いくつかの態様において、結合ドメインは、少なくとも1つの修飾ヌクレオシドと接触する。いくつかの態様において、結合ドメインは、少なくとも1つの修飾ヌクレオシドおよびそれに隣接する1以上のヌクレオチドと接触する。ヒトおよび他の生物で生じ得る例示的な修飾ヌクレオシドを表3Aに示す。ヒトにおいて発現することが知られている修飾ヌクレオシドを表3Bに示す。その他の修飾塩基およびヌクレオシドは、genesilico.pl/modomics/modificationsのワールドワイドウェブアドレスに掲載されている。
いくつかの態様において、結合ドメインは、以下の修飾ヌクレオシドの1以上に結合する:3-メチルシチジン(m3C)、5-メチルシチジン(m5C)、N4-アセチルシチジン(ac4C)、シュードウリジン(Ψ)、1-メチルアデノシン(m1A)、N6-メチルアデノシン(m6A)、イノシン(I)、7-メチルグアノシン(m7G)、ジヒドロウリジン(D)、3-メチルウリジン(m3U)、5-メチルウリジン(m5U)、1-メチルグアノシン(m1G)、N2-メチルグアノシン(m2G)、5-メチルデオキシシチジン(m5dC)、N4-メチルデオキシシチジン、5-ヒドロキシメチルシチジン(5-hmC)、5-ヒドロキシメチルデオキシシチジン(5hmdC)、5-カルボキシデオキシシチジン(5cadC)、5-ホルミルシチジン(5fC)、5-ホルミルデオキシシチジン(5fdC)、6-メチルデオキシアデノシン、N7-メチルグアノシン(m7G)、2,7,2’-メチルグアノシン、またはリボースメチル化(Nm)。
いくつかの態様において、非古典的特徴は、以下である:3-メチルシチジン(m3C)、5-メチルシチジン(m5C)、N4-アセチルシチジン(ac4C)、シュードウリジン(Ψ)、1-メチルアデノシン(m1A)、N6-メチルアデノシン(m6A)、イノシン(I)、7-メチルグアノシン(m7G)、ジヒドロウリジン(D)、3-メチルウリジン(m3U)、5-メチルウリジン(m5U)、1-メチルグアノシン(m1G)、N2-メチルグアノシン(m2G)、5-メチルデオキシシチジン(m5dC)、N4-メチルデオキシシチジン、5-ヒドロキシメチルシチジン(5-hmC)、5-ヒドロキシメチルデオキシシチジン(5hmdC)、5-カルボキシデオキシシチジン(5cadC)、5-ホルミルシチジン(5fC)、5-ホルミルデオキシシチジン(5fdC)、6-メチルデオキシアデノシン、N7-メチルグアノシン(m7G)、2,7,2 ’-メチルグアノシン、またはリボースメチル化(Nm)。
いくつかの態様において、結合ドメインは、天然に生じる酸化的もしくは紫外線誘発性損傷、または外因性薬剤による大きな付加体形成もしくは塩基アルキル化に起因する核酸損傷に結合する。いくつかの態様において、核酸損傷は、該損傷が、8-オキソグアニン(8-oxoG)、1以上の脱塩基部位、シス-プラチン架橋、ベンゾ(a)ピレンジオールエポキシド(BPDE)付加物、シクロブテンピリミジン二量体(CPD)、ピリミジン-ピリミドン(6-4)光生成物(6-4PP)、6-O-メチルグアニン(O6-MedG)、またはO6-(カルボキシメチル)-2’-デオキシグアノシン(O6-CMdG)である。いくつかの態様において、非古典的特徴は、天然に生じる酸化的もしくは紫外線誘発性損傷、または外因性薬剤による大きな付加体形成もしくは塩基アルキル化に起因する核酸損傷である。いくつかの態様において、核酸損傷は、該損傷が、8-オキソグアニン(8-oxoG)、1つ以上の脱塩基部位、シス-プラチン架橋、ベンゾ(a)ピレンジオールエポキシド(BPDE)付加物、シクロブテンピリミジン二量体(CPD)、ピリミジン-ピリミドン(6-4)光生成物(6-4PP)、6-O-メチルグアニン(O6-MedG)、またはO6-(カルボキシメチル)-2’-デオキシグアノシン(O6-CMdG)である。
いくつかの態様では、結合ドメインは構造的要素に結合する。構造的要素は、例えばヘアピンやループであってもよい。他の例示的な構造的要素としては、Z-DNA構造、G-四重鎖、i-モチーフ、バルジ、三重鎖、三方向結合、十字形構造、四重鎖ループ、リボースジッパー、シュードノットなどが挙げられるが、これらに限定されるものではない。
核酸結合分子およびその製造方法
本発明は、結合ドメインおよびアダプターを含む核酸結合分子を提供する。本明細書に記載の核酸結合分子の例示的な構造を図1Dに示す。結合ドメインは、DNAまたはRNAの非古典的特徴に特異的に結合する。アダプターは、結合ドメインによって特異的に結合される非古典的特徴に特有の核酸バーコード配列を含む。
本発明は、結合ドメインおよびアダプターを含む核酸結合分子を提供する。本明細書に記載の核酸結合分子の例示的な構造を図1Dに示す。結合ドメインは、DNAまたはRNAの非古典的特徴に特異的に結合する。アダプターは、結合ドメインによって特異的に結合される非古典的特徴に特有の核酸バーコード配列を含む。
いくつかの態様において、本明細書に記載の核酸結合分子は、1以上の付加的な特徴をさらに含み得る。例えば、いくつかの態様では、結合ドメインおよびアダプターを含む核酸結合分子は、酵素またはその触媒フラグメントをさらに含んでいてもよい。いくつかの態様では、結合ドメインおよびアダプターを含む核酸結合分子は、触媒活性を欠く酵素(またはそのフラグメント)をさらに含み得る。いくつかの態様において、酵素はDNA N-グリコシラーゼもしくはRNA N-グリコシラーゼ、またはそれらの触媒フラグメントもしくは変異体である。これらの酵素は、逆転写を停止させる脱塩基部位を作り出す。
いくつかの態様では、核酸結合分子は塩基編集酵素を含んでいてもよい。いくつかの態様では、酵素はDNAメチラーゼ、RNAメチラーゼ、またはシュードウリジン合成酵素である。塩基編集酵素は、例えば、APOBECファミリーのシチジンデアミナーゼ、ADARファミリーのアデノシンデアミナーゼ、またはそれらの触媒フラグメントもしくは変異体であってもよい。いくつかの態様では、塩基編集酵素はAPOBEC1である。いくつかの態様において、ベースとなる編集酵素はAPOBEC3Aである。いくつかの態様において、シチジンデアミナーゼは、デアミナーゼの溶解性を高めるためにマルトース結合ドメインを含む。いくつかの態様において、シチジンデアミナーゼは、デアミナーゼの溶解性を高めるためにスパイキャッチャー(SpyCatcher)ペプチドを含む。いくつかの態様において、シチジンデアミナーゼは、デアミナーゼの溶解性を高めるために、マルトース結合ドメインおよびスパイキャッチャーペプチドを含む。いくつかの態様において、核酸結合分子はトランスポザーゼを含んでいてもよい。トランスポザーゼは、例えば、DDEトランスポザーゼ、チロシン(Y)トランスポザーゼ、セリン(S)トランスポザーゼ、Y2トランスポザーゼまたはY1トランスポザーゼであってもよい。いくつかの態様において、トランスポザーゼはTn5トランスポザーゼ、またはそのフラグメントもしくは誘導体である。いくつかの態様において、トランスポザーゼはSleeping Beautyトランスポザーゼ、またはそのフラグメントもしくは誘導体である。いくつかの態様では、核酸結合分子は、HIVインテグラーゼなどのインテグラーゼを含んでいてもよい。
本明細書に記載の核酸結合分子は、RNAと特異的に結合することもあれば、DNAと特異的に結合することもある。いくつかの態様では、核酸結合分子はRNAおよびDNAの両方に結合できる。いくつかの態様では、核酸結合分子は、図1Aに示す修飾ヌクレオシドのような、1以上の非古典的特徴を有する二本鎖核酸に特異的に結合できる。いくつかの態様では、核酸結合分子は、図1Bに示す修飾ヌクレオシド、または図1Cに示す構造的特徴のような、1以上の非古典的特徴を有する一本鎖核酸に特異的に結合できる。
いくつかの態様では、核酸結合分子が標的核酸の非古典的特徴に結合することで、DNAアダプターが標的核酸の5’または3’末端に近接して配置される。例えば、図1Eは、二本鎖標的核酸上の修飾ヌクレオシドへの核酸結合分子の結合を描いており、これにより二本鎖バーコードが標的核酸の3’末端に近接して配置される。図1Fは、一本鎖標的核酸上の修飾ヌクレオシドへの核酸結合分子の結合を描いており、これにより標的核酸の3’末端に近接して一本鎖バーコードが配置される。図1Gは、核酸結合分子が標的核酸の構造的特徴に結合し、バーコードをその3’末端に近接させる様子を示す。
核酸結合分子は、標準的な分子生物学的および/または化学的技術を用いて作製できる。例えば、いくつかの態様では、結合ドメインはアダプターに結合され、結合ドメイン-アダプター結合体を形成する。いくつかの態様では、DNAアダプターはリンカーを含み、結合ドメインはリンカーを介してアダプターに結合される。カップリング工程は、いくつかの態様において、共有結合的であっても非共有結合的であってもよい。
アダプター(例えば、リンカーを含むアダプター)は、いくつかの異なる方法を用いて結合ドメインに結合させることができる。いくつかの態様では、アダプターは、ランダムなタグ付けによって結合ドメインに共有結合できる。例えば、アダプター上のNHSで活性化された残基は、結合ドメインの表面に露出したタンパク質リジン残基の1以上のアミン基と反応し得る。同様に、マレイミドで活性化されたアダプターは、結合ドメインの天然または人工のシステインと反応し得る。当業者には理解されるように、結合ドメインに連結されるアダプターの数は、それぞれ反応性リジン残基またはシステイン残基の数、および反応条件の選択によって変化し得る。
部位選択的カップリング法も使用できる。部位特異的カップリングは、結合ドメインの機能への影響を回避し、再現性のある材料製造を可能にする。結合ドメインの部位選択的な内部タグ付けは、アミノアシルtRNA合成酵素/tRNA対を操作した細胞株を用いて、非天然アミノ酸を遺伝子的に組み込むことで達成できる。組み込まれた非天然アミノ酸は、生体直交型反応を起こし得る部位を示す。一般的に用いられるのは、銅触媒によるアジドアルキン環化付加反応(CuAAC)、光活性化1,3-双極性環化付加反応、歪み促進アジドアルキン環化付加反応(SPAAC)、または逆電子要求型ディールス・アルダー環化付加反応(IEDDA)を起こしうる部位を有するアミノ酸である。結合ドメインのC末端またはN末端タグ付けのための例示的で汎用性のある方法は、タンパク質タグまたはペプチドタグの使用を含む。SNAP-tag、Halo-tag、Spy-tag、Snoop-tag、Isopeptag、Dog-tag、Sdy-tag、Clip-tagなどのタンパク質タグは、結合ドメインを発現する遺伝子にクローニングすることで、結合ドメインをタンパク質タグ融合タンパク質として発現させることができる小さなタンパク質またはペプチドである。このようなタンパク質タグは、特定のペプチドまたは基質との共有結合形成を自己触媒し得る。例えば、スパイキャッチャーは113残基のタンパク質で、あらゆるDNA配列に容易に結合できる13残基のペプチドSpyTagを認識する。いくつかの態様では、スパイキャッチャーは配列番号12を含む。いくつかの態様において、SpyTagは配列番号10を含む。結合ドメインの分子量によっては、より小さなペプチドタグが好ましい場合もある。ペプチドタグは通常10-12アミノ酸長で、酵素を介したカップリング反応で作用する。いくつかの態様において、C末端へのタグのためのペプチドは、配列番号11(LCxPxR、xは何れかのアミノ酸である)を含む。結合ドメインおよびアダプターを結合させるための酵素を介する反応の例としては、(a)AP-ペプチド標識結合およびビオチン-DNAを連結するためのビオチン-リガーゼの使用(例えば、ビオチンリンカー)、(b)LAP-ペプチド標識結合ドメインおよびリポ酸-DNAを連結するためのリポ酸リガーゼの使用(例えば、リポ酸リンカー)、(c)Tub-tag標識結合ドメインおよびチロシン修飾DNAを連結するためのチューブリンチロシンリガーゼの使用(例えば、チロシン修飾リンカー)、(d)LPxTGペプチドおよびグリシン修飾DNAと反応するソルターゼ-Aの使用(例えば、グリシン修飾リンカー)などが挙げられるが、これらに限定されない。さらに、一群の金属イオン認識タグおよび低分子結合モチーフを用いることもできる。ペプチドタグ付けのもう一つの方法は、内因性の細胞機構をリダイレクトして、組換えタンパク質にアルデヒドを導入することである。この方法は、保存された13残基のコンセンサス配列内でシステインをホルミルグリシン(FGly)に共翻訳的に変換するホルミルグリシン生成酵素(FGE)を利用する。得られたアルデヒドタグは、DNAに結合する反応性アミンで容易に修飾できる。
いくつかの態様では、アダプターは生体直交型化学反応を介して結合ドメインに結合される。いくつかの態様では、結合ドメインは、バーコードの結合を促進するDNAオリゴヌクレオチドを含む。DNAオリゴヌクレオチドは、アミノ、アジド、ビオチン、アルキンで修飾されたものが容易に市販されている。アルキンおよびアジドオリゴは、銅触媒を用いたアジド-アルキン環化付加反応、またはストレインプロモートを用いたアジド-アルキン環化付加反応において、非天然アミノ酸と結合させることができる。アミノオリゴヌクレオチドはホルミルグリシンと反応し、ホルミルグリシン生成酵素(FGE)によって13aaの保存配列内の結合ドメインに導入される。
本明細書に記載の核酸結合分子が標的核酸に結合すると、複合体が形成される。いくつかの態様において、複合体の核酸結合分子は、標的核酸に共有結合していてもよい。例えば、核酸結合分子は標的核酸と化学的および/または光化学的に結合していてもよい。
アダプター/バーコード転送反応
本明細書に記載の核酸結合分子は、バーコードを含むアダプターのような、アダプターを標的核酸にトランスファーさせるために使用できる。したがって、いくつかの態様では、本明細書に記載の核酸結合分子は、標的核酸にバーコードをトランスファーするために使用され得る。バーコードは、MBC、すなわち、核酸結合分子の結合ドメインによって特異的に結合される非古典的機能に固有のバーコードであってもよい。アダプターが導入された標的核酸は、本明細書では“標識標的核酸”、“標識標的”または類似の用語で呼ばれる。バーコードが転写された標的核酸は、本明細書では“バーコード化標的核酸”、“バーコード化標的”または類似の用語で呼ばれる。アダプターが標的核酸に転移される反応を、本明細書では“アダプター転移反応”と呼ぶ。同様に、バーコードが標的核酸にトランスファーされる反応を、本明細書では“バーコード転移反応”と呼ぶ。
本明細書に記載の核酸結合分子は、バーコードを含むアダプターのような、アダプターを標的核酸にトランスファーさせるために使用できる。したがって、いくつかの態様では、本明細書に記載の核酸結合分子は、標的核酸にバーコードをトランスファーするために使用され得る。バーコードは、MBC、すなわち、核酸結合分子の結合ドメインによって特異的に結合される非古典的機能に固有のバーコードであってもよい。アダプターが導入された標的核酸は、本明細書では“標識標的核酸”、“標識標的”または類似の用語で呼ばれる。バーコードが転写された標的核酸は、本明細書では“バーコード化標的核酸”、“バーコード化標的”または類似の用語で呼ばれる。アダプターが標的核酸に転移される反応を、本明細書では“アダプター転移反応”と呼ぶ。同様に、バーコードが標的核酸にトランスファーされる反応を、本明細書では“バーコード転移反応”と呼ぶ。
アダプター/バーコードトランスファーの目的は、アダプター/バーコードを標的核酸分子に共有結合させることである。例えば、いくつかの態様では、バーコードを標的核酸の5’末端または3’末端に共有結合させることにより、バーコードを標的核酸にトランスファーする。いくつかの態様において、バーコードは、バーコードまたはその相補体を標的核酸の5’末端または3’末端に共有結合させることによって標的核酸にトランスファーされる。標識/バーコード化された核酸分子は、いくつかの態様では、下流の工程で配列決定されることがある。いくつかの態様では、標識標的核酸のコピーを配列決定できる。図3A-3Eはアダプター/バーコード転移反応の例を示す。
アダプター転移に用いられる酵素はDNAおよびRNAの標的核酸で異なり、アダプターの構造によって変わる。標的DNAへのアダプター/バーコードの導入は、T4 DNAリガーゼ、CircLigase、Klenowフラグメント、Bsu DNAポリメラーゼなどの1以上の酵素を用いて行うことができる。標的RNAへのアダプター/バーコードの導入は、例えばT4 RNAリガーゼ、T4 RNAリガーゼ2、RtcBリガーゼなどを用いて行うことができる。例えば、図3Aは、一本鎖DNAアダプター(例えば、バーコードを含む、またはバーコードを含むアダプター)と一本鎖標的核酸とのライゲーションを示している。標的核酸がRNAであるいくつかの態様では、アダプターは5’リン酸を含み、T4 RNAリガーゼによって触媒される。あるいは、アダプターを5’-プレアデニル化し、T4 RNAリガーゼ2によってトランスファーさせ、ATPの必要性をなくし、反応を1回のターンオーバーに制限することもできる。あるいは、リン酸化されていないアダプターを用いてもよく、RtcBリガーゼを用いて3’-リン酸化RNAにトランスファーさせてもよい。標的核酸がDNAであるいくつかの態様では、アダプター/バーコードはCircLigaseによって触媒される反応でトランスファーされ得る。
スプリント(splint)ライゲーションは、アダプター/バーコードを標的核酸に導入するためにも使用できる。スプリントライゲーションでは、架橋するDNAまたはRNAオリゴヌクレオチドを用いて2つの核酸を結合させる。例えば、2つのRNA(例えば、標的RNAおよびアダプター/バーコード)のスプリントライゲーションは、T4リガーゼと、RNAに相補的な橋渡しRNAオリゴヌクレオチドを用いて行うことができる。例えば、図3Bに示すスプリント核酸構築物は、スプリントライゲーションを用いて作成できる。SplintRリガーゼは、RNAの3’末端を5’pDNAに接続するために使用される。標的分子がDNAのとき、T4 DNAリガーゼ、T3 DNAリガーゼ、T7 DNAリガーゼ、大腸菌DNAリガーゼなどの酵素を用いて、スプリントDNAライゲーションを行うことができる。
スプリント伸長およびプライマー伸長は、アダプター/バーコードの標的核酸への導入に使用できる他の方法である。“スプリント”とは、ライゲーションジャンクションにまたがる配列のことである。プライマーが用いられるとき、プライマーは一般的に、ライゲーションジャンクションをまたがない。図3Cは、スプリント伸長によるアダプタートランスファーを示しており、アダプター配列をスプリントとして用いて、標的核酸分子の配列のコピーが作られる。標的核酸分子がRNAのとき、この反応はトリ骨髄芽球症ウイルス(Avian Myeloblastosis Virus (AMV))リバーストランスクリプターゼおよびモロニ-マウス白血病ウイルス(M-MuLV、MMLV)のような逆転写酵素により、DNAアダプターの3’末端が完全または部分的に一致したものによって触媒される。したがって、スプリントの3’末端には、ランダム塩基または乱雑に(promiscuously)塩基対を形成する合成ユニバーサル塩基が含まれ得る。標的分子がDNAであるとき、プライマーは、3’→5’エキソヌクレアーゼ活性を有するか有しないかに関わらず、何れかの適切なDNAポリメラーゼによって伸長され得る。
いくつかの態様では、アダプター/バーコードを標的核酸にトランスファーするために、テンプレート伸長を用い得る。図3Dはプライマー伸長による直接アダプタートランスファーを示し、アダプターは結合したアダプターのコピーを鋳型として標的核酸にポリメラーゼによってコピーされる。いくつかの態様では、ポリメラーゼは短いスペーサー配列を可能にする温度で働き、3’から5’へのエキソヌクレアーゼ活性および3’テイリング活性を有さない。DNAアダプター/バーコードの場合、この反応はDNAポリメラーゼ、例えばクレノウ(Klenow)フラグメント、T7、T4またはBsu DNAポリメラーゼによって触媒される。図3Dは、マルチサイクルのエンコーディングプロセスの一部として実行することも、シングルサイクルとして実行することもできる。いくつかの態様では、生成されたバーコード化核酸は、最終工程としてユニバーサルプライマーでキャップされる。ユニバーサルプライマーは逆転写の開始部位となる。いくつかの態様において、逆転写プライマーは、配列番号8を含む。
さらに、二本鎖ライゲーションも、アダプター/バーコードを標的核酸にトランスファーさせるために用い得る。例えば、図3Eは、アダプター/バーコードトランスファーのための二本鎖ライゲーションを示す。いくつかの態様では、標的核酸分子は二本鎖DNA、またはRNA/DNAハイブリッドであってもよく、平滑末端または粘着末端のいずれかを有していてもよい。二本鎖DNAの平滑末端および粘着末端のライゲーションは、T4、T3、T7または大腸菌リガーゼによって触媒される。
いくつかの態様では、アダプター/バーコードを標的核酸に導入するために、化学的ライゲーションが用いられ得る。
空間的分離による複合体内アダプター/バーコードトランスファーの促進方法
アダプター/バーコードの複合体内トランスファーは、反応に関与する分子を空間的に分離することで促進され得る。具体的には、核酸結合分子が、それが結合している標的核酸としか相互作用できないように、核酸結合分子、標的核酸、および/または標的核酸に結合した核酸結合分子を含む複合体を分離することによって、トランスファーを促進できる。
アダプター/バーコードの複合体内トランスファーは、反応に関与する分子を空間的に分離することで促進され得る。具体的には、核酸結合分子が、それが結合している標的核酸としか相互作用できないように、核酸結合分子、標的核酸、および/または標的核酸に結合した核酸結合分子を含む複合体を分離することによって、トランスファーを促進できる。
バーコードトランスファーは、空間的な分離が可能ないくつかの異なる環境で行われることがある。空間的分離は、例えば、溶液中で標的核酸に結合した核酸結合分子を含む複合体を高希釈することによって達成できる。溶液は、そこに存在する標的核酸に結合した核酸結合分子を含む複合体を空間的に分離できるように、十分に希釈されていなければならない。このような空間的分離は、複合体内のバーコードトランスファーを促進し、核酸結合分子複合体間のバーコードトランスファーを実質的に防止する。いくつかの態様において、希釈溶液中の複合体の濃度は、10nM未満、1nM未満、0.1nM未満、0.01nM未満、または0.001nM未満である。
いくつかの態様では、空間的分離は表面固定化によって達成できる。例えば、本明細書に記載の核酸結合分子は、基質と結合させることによって固定化できる。各基質は、1種の核酸結合分子のみを含んでいてもよいし(図5A)、少なくとも2種、少なくとも3種、少なくとも4種、少なくとも5種、またはそれ以上の種類の核酸結合分子を含んでいてもよい(図5B)。核酸結合分子のそれぞれの“タイプ”は、異なる非古典的特徴に結合し、かつ/または異なるバーコードを構成する。いくつかの態様において、第1の核酸結合分子は、基質の表面上で第2の核酸結合分子から空間的に分離されている。表面結合能および形式は、標的分子および修飾の絶対的または相対的定量を可能にするように調整できる。
核酸結合分子が結合され得る例示的な基質としては、例えば、ビーズ、チップ、プレート、スライド、皿、または三次元マトリックスが挙げられる。いくつかの態様では、基質は、樹脂、膜、繊維、ポリマーである。いくつかの態様において、基質は、セファロース、アガロース、セルロース、ポリスチレン、ポリメタクリレート、および/またはポリアクリルアミドを含むビーズなどのビーズである。いくつかの態様では、支持体は磁気ビーズである。いくつかの態様では、支持体は合成ポリマーなどのポリマーである。合成ポリマーの限定されないリストには、ポリスチレン、ポリ(エチレン)グリコール、ポリイソシアノペプチドポリマー、ポリ乳酸-コ-グリコール酸、ポリ(ε-カプロラクトン)(PCL)、ポリ乳酸、ポリ(3-ヒドロキシ酪酸-コ-3-ヒドロキシバレレート)(PHBV)、キトサン、セルロースなどが含まれる。
核酸結合分子は、基質表面に直接結合させることができる。例えば、分子は1以上の共有結合または非共有結合によって基質に直接結合できる。基質が3Dマトリックスまたは他の3D構造である態様では、核酸結合分子は基質の複数の表面に結合していてもよい。
いくつかの態様では、核酸結合分子は基質の表面に間接的に結合され得る。例えば、核酸結合分子は捕捉分子を介して間接的に基質表面に結合させることができ、捕捉分子は基質に直接結合される。捕捉分子は、基質と核酸結合分子および/または標的核酸の両方に結合または連結できる核酸、タンパク質、糖、化学リンカーなどであってよい。いくつかの態様では、捕捉分子は核酸結合分子に結合する。いくつかの態様では、捕捉分子は、核酸結合分子の結合ドメインまたはアダプター(例えば、アダプターのリンカー)に結合する。いくつかの態様では、捕捉分子は標的核酸に結合する。いくつかの態様では、捕捉分子は標的核酸の配列または構造的特徴に結合する(図5C)。例えば、いくつかの態様では、捕捉分子は標的核酸のポリAテイルまたは特定のDNAもしくはRNA配列に結合できる。
いくつかの態様では、標的核酸は、反応性化学基を介して基質の表面に直接結合され得る。例えば、核酸標的をアジド基で修飾し、アルキン装飾ビーズおよびCu触媒クリックケミストリーを行う。他の例は、トランス-シクロオクテン(TCO)/メチル-テトラジン、DBCO/アジドである。
いくつかの態様では、各核酸結合分子が1つの標的核酸としか相互作用できないように、基質表面上で第1の核酸結合分子を第2の核酸結合分子から分離する。いくつかの態様において、第1の核酸結合分子は、第2の核酸結合分子から少なくとも50nm離れている。例えば、第1の核酸結合分子と第2の核酸結合分子は、約50nm~約500nm、例えば、約50nm~約100nm、約100nm~約150nm、約150nm~約200nm、約200nm~約250nm、約250nm~約300nm、約300nm~約350nm、約350nm~約400nm、約400nm~約450nm、または約450nm~約500nmだけ離れていてもよい。いくつかの態様では、第1および第2の核酸結合分子は約500nm以上離れていてもよい。
一般に、核酸結合分子(または標的核酸)を基質に結合させる目的は、アダプターおよび/またはバーコードの複合体内トランスファーを確実にすることである。空間的に分離した2以上の核酸結合分子を含む基質は、当業者に公知の方法を用いて製造できる。図4A-4Dは、核酸結合分子または標的核酸を基質に結合させ、基質上に固定化する方法の限定されない例を提供する。これらの例を以下に詳しく説明する。図5A-5Cは、核酸結合分子または標的核酸をビーズに固定化する方法の限定されない例を示す。
核酸結合分子と基質との結合
図4Aは、基質に直接的または間接的に結合した核酸結合分子を示す。いくつかの態様において、複数の核酸結合分子は、部位特異的化学を用いて基質上に固定化され得る。例えば、いくつかの態様では、核酸結合分子の結合ドメインは、基質上に固定化できる部位、およびDNAアダプターを繋ぎとめるための部位を含んでいてもよい。結合ドメインの基質表面への結合は、結合ドメインの末端に自己触媒タンパク質タグ(例えば、スパイキャッチャー、ソルターゼA、SNAPタグ、Haloタグ、CLIPタグ)を融合させることによって促進される。結合ドメイン上のこれらのタンパク質タグは、基質表面上の同族反応性部位と共有結合で反応させることができる。例えば、スパイキャッチャータンパク質を結合ドメインに人工的に組み込むことができる。スパイタグはスパイタグタンパク質(13aaペプチド)と共有結合を形成する。スパイタグが基質表面に結合している場合、スパイキャッチャーに結合した結合ドメインおよびスパイタグの反応は、結合ドメインを基質に共有結合させる役割を果たす。同様に、結合ドメインをソルターゼAタグと融合させ、基質表面に結合したペンタグリシンと反応させることもできる。別の例として、結合ドメインをSNAPタグと融合させ、基質表面に結合したO6-ベンジルグアニンと反応させることもできる。いくつかの態様では、結合ドメインはCLIPタグと融合され、基質表面に結合したO2-ベンジルシトシンと反応するために使用され得る。いくつかの態様では、結合ドメインは、基質表面に存在するハロゲン化アルキルと反応するために使用され得るHaloタグと融合され得る。
図4Aは、基質に直接的または間接的に結合した核酸結合分子を示す。いくつかの態様において、複数の核酸結合分子は、部位特異的化学を用いて基質上に固定化され得る。例えば、いくつかの態様では、核酸結合分子の結合ドメインは、基質上に固定化できる部位、およびDNAアダプターを繋ぎとめるための部位を含んでいてもよい。結合ドメインの基質表面への結合は、結合ドメインの末端に自己触媒タンパク質タグ(例えば、スパイキャッチャー、ソルターゼA、SNAPタグ、Haloタグ、CLIPタグ)を融合させることによって促進される。結合ドメイン上のこれらのタンパク質タグは、基質表面上の同族反応性部位と共有結合で反応させることができる。例えば、スパイキャッチャータンパク質を結合ドメインに人工的に組み込むことができる。スパイタグはスパイタグタンパク質(13aaペプチド)と共有結合を形成する。スパイタグが基質表面に結合している場合、スパイキャッチャーに結合した結合ドメインおよびスパイタグの反応は、結合ドメインを基質に共有結合させる役割を果たす。同様に、結合ドメインをソルターゼAタグと融合させ、基質表面に結合したペンタグリシンと反応させることもできる。別の例として、結合ドメインをSNAPタグと融合させ、基質表面に結合したO6-ベンジルグアニンと反応させることもできる。いくつかの態様では、結合ドメインはCLIPタグと融合され、基質表面に結合したO2-ベンジルシトシンと反応するために使用され得る。いくつかの態様では、結合ドメインは、基質表面に存在するハロゲン化アルキルと反応するために使用され得るHaloタグと融合され得る。
いくつかの態様では、結合分子はビオチン部分を含んでいてもよい。このような結合分子は、ビオチンと結合する捕捉分子(例えば、ストレプトアビジン)によって基質表面に固定化できる。
図17A-Bは、ナノボディサイズ(図17A)および3つの相補性決定領域(CDR)を含む分子構造(図17B)を示す。図17Bは、チオール-マレイミド化学を介してN末端に部位特異的に結合したDNAアダプターを示す。脱アミナーゼスパイキャッチャー融合タンパク質は、C末端スパイタグペプチドに部位特異的に結合されている。核酸結合分子の表面固定化は、アミノオキシ官能基化表面と、ホルミルグリシン生成酵素(FGE)によって共翻訳的にホルミルグリシンに変換される内部13aaペプチドとの反応によって達成される。図17Cは、(i)抗体を含む結合ドメインをバーコード標識して核酸結合分子を形成し、(ii)核酸結合分子を基質表面に部位特異的に固定化する例を示す。この例では、DNAバーコードは、核酸結合分子を形成するために、ホルミルグリシン生成酵素(FGE)によって共翻訳的にホルミルグリシンに変換される内部13アミノ酸ペプチドを介して、抗体軽鎖のC末端ドメインに部位特異的に結合される。核酸結合分子の表面固定化は、スパイタグおよびスパイキャッチャーの反応によって達成される。スパイタグは13aaの短いペプチドで、抗体重鎖のC末端上に作製される。基質表面にはスパイキャッチャータンパク質が適切な密度で提示されている。スパイタグのC末端とスパイキャッチャーのN末端は自発的に反応し、イソペプチド結合を形成する。
標的核酸と基質との結合
図4Bは、捕捉分子を介して間接的に基質に結合した核酸結合分子を示す。この例では、捕捉分子は標的核酸のポリAテイルに結合する核酸配列を含むが、標的核酸上の他のユニークな塩基配列を用いてもよい。図4Cは、捕捉分子を介して基質に間接的に結合した標的核酸を示し、捕捉分子は標的核酸に結合する(すなわち、標的核酸の一次配列、または二次構造に特異的である)ハイブリダイゼーションプローブである。図4Dは、共有結合を介して基質に直接結合した標的核酸を示す。
図4Bは、捕捉分子を介して間接的に基質に結合した核酸結合分子を示す。この例では、捕捉分子は標的核酸のポリAテイルに結合する核酸配列を含むが、標的核酸上の他のユニークな塩基配列を用いてもよい。図4Cは、捕捉分子を介して基質に間接的に結合した標的核酸を示し、捕捉分子は標的核酸に結合する(すなわち、標的核酸の一次配列、または二次構造に特異的である)ハイブリダイゼーションプローブである。図4Dは、共有結合を介して基質に直接結合した標的核酸を示す。
したがって、いくつかの態様では、基質は、標的核酸の特徴にハイブリダイズするオリゴヌクレオチド捕捉分子で装飾され得る。例えば、mRNAは、ポリdTオリゴヌクレオチドまたは遺伝子特異的配列を含むキャプチャー分子へのハイブリダイゼーションによって捕捉できる。いくつかの態様では、捕捉分子は、核酸結合分子を物理的に分離するために低い表面密度で存在する。例えば、図4B、図4Cおよび図4Dに示す基質結合スキームでは、一般的に低表面密度が用いられる。標的核酸は、該標的核酸が核酸結合分子に結合する前または後に、捕捉分子にハイブリダイズできる。核酸結合分子から標的核酸へのバーコードトランスファーは、いくつかの態様では、表面結合状態(すなわち、標的核酸が基質に結合しているとき)で起こり得る。
ハイブリダイゼーションによる標的核酸捕捉用のビーズは、表面活性化ビーズに5’-アミノ修飾オリゴヌクレオチドを直接結合させることによって調製できる。表面活性化ビーズは、共有結合のためにエポキシ基、トシル基、カルボン酸基、またはアミン基を提示し得る。カルボキシビーズは通常、ペプチド結合形成を促進するためにカルボジイミドと反応させる必要があり、アミンビーズは通常、二官能性NHS-リンカーを必要とする。いくつかの態様では、ビーズの表面は非特異的結合を防ぐために不動態化(passivated)されている。不動態化(passivation)は、いくつかの態様では、同じ連結化学を有するポリエチレングリコール(PEG)分子を共移植することによって達成できる。例えば、5’-アミノ修飾オリゴヌクレオチドおよびアミノ末端ポリエチレングリコール(PEG)は、平均して、ほとんどの基質部位がオリゴヌクレオチドを空間的に分離させる役割を果たすPEG分子によって占有されるように用いられる。オリゴヌクレオチドとPEG分子の比率を変えることで、捕捉分子の表面密度を調整できる。
いくつかの態様では、ビーズはmTet(テトラジン)およびカルボキシ-PEGで作られたセファロースビーズである。mTetとカルボキシPEGの比率を下げると、標的核酸間の架橋が減少する。いくつかの態様において、mTet:カルボキシ-PEG比は、1:500、1:600、1:700、1:800、1:900、1:1000、1:1100、1:1200、1:1300、1:1400、1:500、1:1000、1:2000、1:3000、1:4000、1:5000、1:6000、1:7000、1:8000、1:9000、または1:10000である。いくつかの態様において、mTet:カルボキシ-PEG比は1:1000である。
結合ドメイン-酵素コンジュゲート
本発明はまた、酵素またはそのフラグメントに結合した結合ドメインを含むコンジュゲートも提供する。酵素またはそのフラグメントは、触媒的に活性であっても触媒的に不活性であってもよい。いくつかの態様において、酵素またはそのフラグメントは、結合ドメインに共有結合的または非共有結合的に結合され得る。例えば、酵素またはフラグメントを結合ドメインに合成的に結合させたり、遺伝的に結合ドメインに融合させたりできる。いくつかの態様において、結合ドメインと酵素(またはフラグメント)は、単一の転写産物として発現され得る(例えば、融合タンパク質として)。いくつかの態様では、結合ドメインはリンカーを介して酵素(またはフラグメント)に結合される。
本発明はまた、酵素またはそのフラグメントに結合した結合ドメインを含むコンジュゲートも提供する。酵素またはそのフラグメントは、触媒的に活性であっても触媒的に不活性であってもよい。いくつかの態様において、酵素またはそのフラグメントは、結合ドメインに共有結合的または非共有結合的に結合され得る。例えば、酵素またはフラグメントを結合ドメインに合成的に結合させたり、遺伝的に結合ドメインに融合させたりできる。いくつかの態様において、結合ドメインと酵素(またはフラグメント)は、単一の転写産物として発現され得る(例えば、融合タンパク質として)。いくつかの態様では、結合ドメインはリンカーを介して酵素(またはフラグメント)に結合される。
いくつかの態様では、酵素は核酸塩基編集酵素(本明細書では塩基編集酵素とも呼ばれる)であってもよい。塩基編集酵素は、例えば、アデノシンデアミナーゼ、シトシンデアミナーゼ、グリコシラーゼ、メチラーゼ、デメチラーゼ、ジオキシゲナーゼ、またはDNAもしくはRNAの1以上の核酸塩基を修飾する他の酵素であってもよい。
ある態様では、酵素はトランスポザーゼであってもよい。いくつかの態様では、酵素はTn5トランスポザーゼである。トランスポザーゼは原核生物および真核生物の両方に存在し、'カット・アンド・ペースト’メカニズムで、定義されたDNAエレメント(トランスポゾン)をゲノムの別の部分に移動させる触媒となる。トランスポザーゼは多くの生物医学的適用に広く用いられている。例えば、大腸菌由来の高活性Tn5トランスポザーゼは、二本鎖の合成19bpモザイク末端(ME)認識配列に結合でき、この配列はあらゆる配列決定アダプターに付加できる。いくつかの態様において、ME-アダプターは、CTGTCTCTTATACACATCT;配列番号58を含む。いくつかの態様において、ME-アダプターは、AGATGTGTATAAGAGACAG;配列番号59を含む。いくつかの態様において、ME-アダプターは、TTTGTGAUGCGATGAACTCAGAGTGCTTNNNNNNNNNNNNAGATGTGTATAAGAGACAG;配列番号60を含み、ここで、Nはバーコードである。いくつかの態様において、配列番号58を含むモザイク末端は、配列番号60を含むME-アダプターにハイブリダイズされる。各トランスポザーゼ分子は同時に2つのMEタグ付きアダプターを付加する。Tn5トランスポザーゼは、二本鎖DNAまたはRNA/DNAヘテロ二本鎖を基質とするインビトロタグメンテーション反応(標的配列をフラグメント化し、配列決定アダプターで同時にタグ付けする)に利用されてきた。タグメンテーションの大きな利点は、使用する核酸の量を減らし、アッセイワークフローを大幅に簡略化できることである。タグメンテーションは一般的にピコグラム単位のDNAまたはRNAを用いて行われ、単一細胞アプローチに成功している。
いくつかの態様において、結合ドメイン-酵素コンジュゲートは、RNA修飾、DNA修飾、またはRNAおよびDNA修飾の両方と特異的に結合し、トランスポザーゼを標的核酸に誘導する結合ドメインを含む。修飾特異的結合ドメインに結合したトランスポザーゼは、RNA/DNA二重鎖に特異的バーコードを挿入し、ユニバーサルプライマー部位およびリバースプライマー部位を付加する。タグメンテーションはマグネシウムイオンに依存しており、マグネシウムイオンの添加によってタグメンテーションが引き起こされ得る。タグ付けされた二重鎖の長さは反応条件によって異なり、30塩基対という短さに最適化できる。したがって、標的化タグメンテーションは、DNAまたはRNA修飾を最大30塩基対の塩基分解能で検出できる。
いくつかの態様では、トランスポザーゼはDNA/RNA修飾を認識する結合ドメインに直接テザー結合または融合されないことがある。いくつかの態様において、トランスポザーゼは、DNA/RNA修飾を認識する結合ドメインの構造的要素に共有結合的または非共有結合的に結合するペプチドまたはタンパク質ドメインにテザー結合または融合され得る。いくつかの態様では、結合ドメイン、例えば抗体はスパイタグペプチドと遺伝子融合しており、一方トランスポザーゼはスパイキャッチャータンパク質と遺伝子融合している。スパイタグおよびスパイキャッチャーは自発的に共有結合を形成し、トランスポザーゼを修飾部位に標的化する。いくつかの態様では、トランスポザーゼはプロテインA、G、またはLに遺伝的に融合している。いくつかの態様では、トランスポザーゼはプロテインGに遺伝的に融合している。いくつかの態様では、トランスポザーゼはプロテインLに遺伝的に融合している。プロテインA、G、またはLは、IgG抗体の特定の領域に結合し、DNAまたはRNA修飾結合抗体にトランスポザーゼ活性を向ける。
いくつかの態様では、トランスポザーゼは結合ドメインに共有結合したMEタグ付きアダプターに結合できる。アダプターはMEタグのついた一本鎖として存在し、ME相補体のハイブリダイゼーションがトランスポザーゼのインサイチュウ付加の引き金となる。結合ドメインは2以上のMEアダプター分子を提示し、トランスポザーゼに2つのアダプターを付加できるようにできる。いくつかの態様では、ME-アダプター分子は同じ配列を有する。いくつかの態様では、MEアダプター分子は異なる配列を有する。いくつかの態様では、ME-アダプターはDNAまたはRNA修飾に特異的なバーコードを含む。
シトシンデアミナーゼは、シトシンのウラシルへの加水分解的脱アミノ化を触媒し、C-G塩基対をT-A塩基対に変異させる。APOBEC(アポリポタンパク質B mRNA 編集触媒ポリペプチド様)ファミリーのシトシンデアミナーゼは、ヒトの健康および疾患において多様で重要な機能を有する。すべてのAPOBEC酵素は一本鎖DNAおよびRNAに結合するが、RNA塩基を脱アミド化するのは一部の酵素だけである。特にAPOBEC1およびAPOBEC3AはDNAおよびRNAを修飾する。大腸菌のシトシンデアミナーゼCodAは、5-フルオロシトシン(5Fc)から5-フルオロウラシル(5FU)への変換を触媒する。この活性により、細胞毒性のない前駆体から細胞毒性のある化学療法剤が形成される。APOBEC酵素は二本鎖DNAを処理するように設計されている。
RNAに作用するアデノシンデアミナーゼ(ADAR)は、アデノシンからイノシンへの加水分解的脱アミノ化を触媒する。イノシンは細胞機構においてグアニンのように作用するため、これはA-T塩基対をG-C塩基対に変異させることに等しい。ヒトのアデノシン脱アミノ化には2種の酵素が関与している:ADAR1およびADAR2である。ADARタンパク質は、二本鎖RNA結合ドメインおよびC末端デアミナーゼドメインを含むモジュール構造を有する。ADAR活性には二本鎖RNAが必要であるが、最近の報告では、RNA/DNAヘテロ二本鎖のDNA鎖上でのADAR活性が示されている。最近、ADAR2はアデノシンからイノシンへの変換に加え、シトシンからウラシルへの変換も行うように設計された。
いくつかの態様において、結合ドメイン-酵素コンジュゲートは、RNAおよび/またはDNA修飾に特異的に結合し、シトシンおよびアデノシンデアミナーゼを標的核酸に誘導する結合ドメインを含む。標的部位において、脱アミナーゼ酵素はDNA/RNAの非古典的特徴の位置を示すシングルポイント位置(single point location)を導入する。塩基編集は、修飾を局在化させるためのもう一つの方法であり、この目的のためにタンパク質および核酸を光架橋することによって切断型cDNAを生成することに代わるものである。いくつかの態様では、切断部位を導入するために、シトシンからウラシルへの編集が用いられ得る。
いくつかの態様では、塩基編集酵素は、DNA/RNA修飾を認識する結合ドメインに直接テザー結合または融合していない場合がある。その代わりに、塩基編集酵素は、図6A-6Cに示すように、DNA/RNA修飾を認識する結合ドメインの構造的要素に共有結合的または非共有結合的に結合するペプチドまたはタンパク質ドメインにテザー結合または融合させ得る。例えば、RNA/DNA修飾を認識する結合ドメインは一次抗体であり、デアミナーゼ酵素は二次抗体に繋留または融合される(図6A)。いくつかの態様では、結合ドメイン、例えばナノボディは、DNAアドレス、リンカー、バーコードを含むDNAアダプターを示す。デアミナーゼはDNAアドレスに相補的な配列で標識され、DNAハイブリダイゼーションによって酵素を修飾部位に標的化する(図6B)。いくつかの態様では、結合ドメイン、例えばナノボディはスパイタグペプチドと遺伝子融合しており、一方、脱アミナーゼはスパイキャッチャータンパク質と遺伝子融合している。スパイタグおよびスパイキャッチャーは自発的に共有結合を形成し、脱アミナーゼを修飾部位に誘導する(図6C)。いくつかの態様において、デアミナーゼは、一次抗体に結合するプロテインGに融合される(図6D)。いくつかの態様において、酵素は、プロテインA(UniProtアクセッション番号P38507 & P02976)、プロテインG(UniProtionアクセッション番号Q54181 & P19909)、またはプロテインL(UniProtionアクセッション番号Q51918)に融合した塩基編集酵素である。いくつかの態様では、酵素は、プロテインAに融合した塩基編集酵素である。いくつかの態様では、酵素は、プロテインGに融合した塩基編集酵素である。いくつかの態様では、酵素は、プロテインLに融合した塩基編集酵素である。
いくつかの態様において、コンジュゲートは、(i)核酸結合分子およびペプチドタグ、ならびに(ii)ペプチドタグおよび共有結合反応ができるタンパク質に融合した酵素またはそのフラグメントを含む。いくつかの態様において、コンジュゲートは、(i)ペプチドタグを含む酵素またはそのフラグメント、および(ii)ペプチドタグと共有結合反応し得るタンパク質に融合した核酸結合分子を含む。いくつかの態様において、コンジュゲートは、(i)核酸結合分子およびタンパク質タグ、ならびに(ii)タンパク質タグと共有結合反応できるペプチドタグに融合した酵素またはそのフラグメントを含む。いくつかの態様では、コンジュゲートは、(i)核酸結合分子と、(ii)結合ドメインの特定領域に高親和性で結合できるタンパク質に融合した酵素またはそのフラグメントとを含む。いくつかの態様において、ペプチドタグはスパイタグである。いくつかの態様では、酵素はデアミナーゼである。いくつかの態様において、ペプチドタグと共有結合的に反応し得るタンパク質は、スパイキャッチャータンパク質である。
いくつかの態様において、コンジュゲートは、(i)核酸結合分子およびペプチドタグ、ならびに(ii)ペプチドタグと共有結合反応できるタンパク質タグに融合した酵素またはそのフラグメントを含む。いくつかの態様において、コンジュゲートは、(i)ペプチドタグを含む酵素またはそのフラグメント、および(ii)ペプチドタグと共有結合反応し得るタンパク質タグに融合した核酸結合分子を含む。いくつかの態様において、コンジュゲートは、(i)核酸結合分子およびタンパク質タグ、および(ii)タンパク質タグと共有結合的に反応できるペプチドタグに融合した酵素またはそのフラグメントを含む。いくつかの態様では、コンジュゲートは、(i)核酸結合分子と、(ii)結合ドメインの特定領域に高親和性で結合できるタンパク質タグと融合した酵素またはそのフラグメントとを含む。いくつかの態様において、ペプチドタグはスパイタグである。いくつかの態様では、酵素はデアミナーゼである。いくつかの態様において、ペプチドタグと共有結合反応し得るタンパク質は、スパイキャッチャータンパク質である。
いくつかの態様において、コンジュゲートは共有結合である。いくつかの態様において、コンジュゲートは非共有結合である。
標的核酸修飾または編集による非古典的特徴の局在化を含む核酸分析法
上記のような複合体内バーコードトランスファーが可能な本明細書に記載の核酸結合分子は、核酸を分析する種々の方法、特に標的核酸上の非古典的特徴を認識するために用いられ得る。従って、本発明は、トランスクリプトームおよびゲノムにわたるRNAおよびDNA修飾の多重プロファイリング法を含む、標的核酸上の非古典的特徴を分析する方法を提供する。これらの方法では、核酸結合分子の結合ドメインによって、RNAまたはDNAの非古典的特徴が認識される。その後、アダプターまたはその一部(例えば、バーコード)が核酸結合分子から標的核酸に転移される(すなわち、標識/バーコード化標的核酸が生成される)。バーコードは標的核酸によって結合される特定の非古典的特徴に固有であるため、この工程は認識イベントからの情報を標的核酸の核酸配列に書き込む役割を果たす。バーコード化された標的核酸は、配列決定ライブラリーに変換され、DNA/RNA配列決定法で読み取られる。この工程により、バーコードの配列が明らかになり、標的核酸の非古典的特徴と相関する。塩基配列決定により、標的核酸中の非古典的徴の局在を確認することもできる。本明細書に記載されているハイスループット・プロファイリング法は、複数またはすべてのDNA/RNA修飾の性質と位置を並行して同定することを可能にする。
上記のような複合体内バーコードトランスファーが可能な本明細書に記載の核酸結合分子は、核酸を分析する種々の方法、特に標的核酸上の非古典的特徴を認識するために用いられ得る。従って、本発明は、トランスクリプトームおよびゲノムにわたるRNAおよびDNA修飾の多重プロファイリング法を含む、標的核酸上の非古典的特徴を分析する方法を提供する。これらの方法では、核酸結合分子の結合ドメインによって、RNAまたはDNAの非古典的特徴が認識される。その後、アダプターまたはその一部(例えば、バーコード)が核酸結合分子から標的核酸に転移される(すなわち、標識/バーコード化標的核酸が生成される)。バーコードは標的核酸によって結合される特定の非古典的特徴に固有であるため、この工程は認識イベントからの情報を標的核酸の核酸配列に書き込む役割を果たす。バーコード化された標的核酸は、配列決定ライブラリーに変換され、DNA/RNA配列決定法で読み取られる。この工程により、バーコードの配列が明らかになり、標的核酸の非古典的特徴と相関する。塩基配列決定により、標的核酸中の非古典的徴の局在を確認することもできる。本明細書に記載されているハイスループット・プロファイリング法は、複数またはすべてのDNA/RNA修飾の性質と位置を並行して同定することを可能にする。
本明細書に記載の方法は、以下に記載の一連の工程を含む。当業者には理解され得るように、いくつかの態様では、様々な工程が省略され、および/または異なる順序で実行されてもよい。
核酸結合分子と標的核酸との接触
いくつかの態様において、本明細書に記載の方法は、1以上の核酸結合分子を1以上の標的核酸と接触させる工程を含む。標的核酸は、DNA、RNA、またはDNAおよびRNAの組み合わせを含む。標的核酸は、例えば、生物の細胞や組織から単離できる。いくつかの態様では、標的核酸はフラグメント化されていてもよい。
いくつかの態様において、本明細書に記載の方法は、1以上の核酸結合分子を1以上の標的核酸と接触させる工程を含む。標的核酸は、DNA、RNA、またはDNAおよびRNAの組み合わせを含む。標的核酸は、例えば、生物の細胞や組織から単離できる。いくつかの態様では、標的核酸はフラグメント化されていてもよい。
核酸結合分子と標的核酸との接触は、溶液中で起こりうる。例えば、1以上の標的核酸を含む組成物を、1以上の核酸結合分子を含む組成物と接触させることができる。いくつかの態様では、接触は希薄溶液中で起こり、1つの核酸結合分子のみが各標的核酸と相互作用しうる。
いくつかの態様では、接触は基質上で起こる。例えば、1以上の標的核酸を基質に結合させ、1以上の核酸結合分子を基質に結合した標的核酸に接触させることができる。いくつかの態様では、1以上の核酸結合分子を基質に結合させてもよく、1以上の標的核酸を、基質に結合した核酸結合分子と接触させてもよい。核酸結合分子を含む基質、およびその製造方法は、上述し、図4A-4Dおよび図5A-5Cに示す。
標的核酸は、1種の核酸結合タンパク質のみと接触させてもよく(すなわち、1種の非古典的特徴を検出するため)、またはいくつかの態様では、標的核酸は、複数の非古典的特徴を検出するために、2種以上の核酸結合分子と接触させてもよい。例えば、標的核酸は、少なくとも1種、少なくとも2種、少なくとも3種、少なくとも4種、少なくとも5種、少なくとも6種、少なくとも7種、少なくとも8種、少なくとも9種、少なくとも10種、またはそれ以上の異なるタイプの核酸結合分子と接触させることができる。いくつかの態様において、標的核酸は、1~5、5~10、10~25、25~50、50~100、100~150、150~175、175~200、またはそれ以上の異なるタイプの核酸結合分子と接触させることができる。複数種類の核酸結合分子を用いる場合、接触は同時に行ってもよいし(すなわち、標的核酸は、異なる非古典的特徴を認識する複数の核酸結合分子と同時に接触させられる)、順次行ってもよい(すなわち、標的核酸を、第1の非古典的特徴を認識する第1の核酸結合分子と接触させ、その後、第2の非古典的特徴を認識する第2の核酸結合分子と接触させる)。
いくつかの態様では、標的核酸は、核酸結合分子の第1のプールと接触され、その後核酸結合分子の第2のプールと接触される。いくつかの態様において、プールは、異なるタイプの核酸結合分子(すなわち、異なるタイプの非古典的特徴を認識する)を含み得る。いくつかの態様において、プールはそれぞれ、1~5、5~10、10~25、25~50、50~100、100~150、150~175、175~200、またはそれ以上の異なるタイプの核酸結合分子を含み得る。
バーコードトランスファー
各核酸結合分子は、標的核酸の非古典的特徴と特異的に結合し、核酸のアダプターを標的核酸の3’末端または5’末端のいずれかに近接させる。その後、アダプター(例えば、バーコードを含む、またはバーコードを含むアダプター)を標的核酸に移すことができる。いくつかの態様では、転写は、バーコード化核酸のオフターゲット生成を実質的に防止する環境下で行われる。このような環境は、例えば、標的核酸が互いに相互作用できない(すなわち、1つの核酸結合分子のみが各標的核酸と相互作用しうる)環境であってもよい。これは、例えば、バーコード転写反応を希薄な溶液中で行うことによって、あるいは標的核酸または核酸結合分子のいずれかを基質上に固定化し、それらの空間的分離を達成することによって、達成できる。いくつかの態様では、トランスファーは標的核酸をコピーすることによって行われ、標的核酸の標識/バーコード化コピーを生成する。例えば、バーコードが標的核酸に転写された場合、または標的核酸に近接された場合、ポリメラーゼ連鎖反応(PCR)を用いて標的核酸のバーコード化コピーを生成できる。
各核酸結合分子は、標的核酸の非古典的特徴と特異的に結合し、核酸のアダプターを標的核酸の3’末端または5’末端のいずれかに近接させる。その後、アダプター(例えば、バーコードを含む、またはバーコードを含むアダプター)を標的核酸に移すことができる。いくつかの態様では、転写は、バーコード化核酸のオフターゲット生成を実質的に防止する環境下で行われる。このような環境は、例えば、標的核酸が互いに相互作用できない(すなわち、1つの核酸結合分子のみが各標的核酸と相互作用しうる)環境であってもよい。これは、例えば、バーコード転写反応を希薄な溶液中で行うことによって、あるいは標的核酸または核酸結合分子のいずれかを基質上に固定化し、それらの空間的分離を達成することによって、達成できる。いくつかの態様では、トランスファーは標的核酸をコピーすることによって行われ、標的核酸の標識/バーコード化コピーを生成する。例えば、バーコードが標的核酸に転写された場合、または標的核酸に近接された場合、ポリメラーゼ連鎖反応(PCR)を用いて標的核酸のバーコード化コピーを生成できる。
バーコードトランスファー反応および空間的分離は上記の通りであり、図3A-3Eに記載されている。
標的核酸(またはそのコピー)の改変
いくつかの態様において、本方法は、バーコード化標的核酸(複数可)またはバーコード化コピー(複数可)を改変する工程を含み得る。この修飾は、核酸結合分子が非古典的特徴に結合した後に起こる可能性があり、いくつかの態様では、バーコードが標的核酸にトランスファーされた(または標的核酸のバーコード化コピーが生成された)後に起こり得る。
いくつかの態様において、本方法は、バーコード化標的核酸(複数可)またはバーコード化コピー(複数可)を改変する工程を含み得る。この修飾は、核酸結合分子が非古典的特徴に結合した後に起こる可能性があり、いくつかの態様では、バーコードが標的核酸にトランスファーされた(または標的核酸のバーコード化コピーが生成された)後に起こり得る。
修飾は、非古典的特徴の位置がバーコード化標的核酸またはそのバーコード化コピーの一次核酸配列に基づいて識別可能であり、したがって下流の配列決定工程で検出され得るように行われる。この目的のために、多くの異なるタイプの改変が行われる。例えば、いくつかの態様において、修飾は、標的核酸(またはそのバーコード化コピー)のコピー中のポリメラーゼバイパスを防止し得る。
いくつかの態様において、修飾は、部分的には、核酸結合分子の結合ドメインを化学的に修飾することによって達成される。これは、いくつかの態様では、結合ドメインが結合している間、標的核酸のコピー中に切断を誘導し得る。
いくつかの態様において、修飾は、核酸結合分子(または結合ドメインなどのそのフラグメント)を標的核酸(またはそのバーコード化コピー)に光化学的に連結することを含む。核酸およびタンパク質を光化学的に連結する方法は当業者に知られている。例えば、光化学的結合は、核酸結合分子と標的核酸を含む複合体を紫外線(UV)に曝すことによって誘導できる。
いくつかの態様において、修飾は、核酸結合分子が標的核酸に結合する部位またはその近傍の塩基を編集することを含む。例えば、シトシンデアミナーゼまたはアデノシンデアミナーゼを用いて塩基を編集できる。塩基編集分子は、要すれば、核酸結合分子またはその一部と結合してもよいし、核酸結合分子を認識する結合剤、例えば一次抗体-DNAアダプター結合体に結合する二次抗体と結合してもよい(図6A-6C)。アデノシンデアミナーゼはアデノシン(A)をイノシン(I)に変換し、増幅酵素はシトシン(C)と塩基対を作り、チミン(T)からシトシン(C)への変異を導入する。シトシンデアミナーゼは、修飾部位の近くにあるシトシン(C)をウラシル(U)に変換し、グアニン(G)からアデノシン(A)への変異を導入する。非古典的特徴を局在化するもう一つの方法は、NEB(登録商標)社のUSER(商標)(ウラシル脱グリコシラーゼおよびエンドヌクレアーゼVIIIの混合酵素)によってウラシル(U)を切断することであり、これにより切断されたリードが生成される。
増幅および配列決定
標的核酸(またはそのバーコード化コピー)が改変された後、それを増幅し、配列決定できる。この工程によってバーコードの配列が明らかになり、標的核酸中の核酸結合分子がもともと結合していた非古典的特徴と相関する。塩基配列の決定により、切断フラグメントの長さも明らかになり、標的核酸中の非古典的特徴を局在化できる。塩基配列の決定によって、非古典的特徴の近くに変異が見つかることもあり、そこから非古典的特徴の位置が情報的に導き出されることもある。変異は、脱アミナーゼ酵素による塩基編集の結果であり得るか、核酸標的をコピーするために用いられる酵素(標的がDNAの場合はDNAポリメラーゼ、標的がRNAの場合は逆転写酵素)の塩基挿入エラー率が増加した結果かもしれない。非古典的特徴は、酵素的バイパスエラー率を自然に増加させるかもしれないし、非古典的特徴を化学的に修飾することによって効果を増幅させるかもしれない。
標的核酸(またはそのバーコード化コピー)が改変された後、それを増幅し、配列決定できる。この工程によってバーコードの配列が明らかになり、標的核酸中の核酸結合分子がもともと結合していた非古典的特徴と相関する。塩基配列の決定により、切断フラグメントの長さも明らかになり、標的核酸中の非古典的特徴を局在化できる。塩基配列の決定によって、非古典的特徴の近くに変異が見つかることもあり、そこから非古典的特徴の位置が情報的に導き出されることもある。変異は、脱アミナーゼ酵素による塩基編集の結果であり得るか、核酸標的をコピーするために用いられる酵素(標的がDNAの場合はDNAポリメラーゼ、標的がRNAの場合は逆転写酵素)の塩基挿入エラー率が増加した結果かもしれない。非古典的特徴は、酵素的バイパスエラー率を自然に増加させるかもしれないし、非古典的特徴を化学的に修飾することによって効果を増幅させるかもしれない。
したがって、ある態様では、本明細書に記載の方法は、バーコード化標的核酸またはそのコピーを配列決定する工程を含み得る。配列決定工程は、当技術分野で知られている何れかの適切な方法を用いて実施できる。例えば、配列決定は、次世代シーケンシング(NGS)法、超並列シーケンシング法、またはディープシーケンシング法を用いて実施できる。本発明の方法で使用できるNGSプラットフォームは多数ある。例えば、Illumina(登録商標) (Solexa(登録商標))のシーケンシングは、各塩基が蛍光シグナルを発すると同時にDNA塩基を識別し、核酸鎖に加えることで機能する。Roche(登録商標) 454シークエンシングは、ポリメラーゼによってヌクレオチドがDNAの新しい鎖に組み込まれた後、蛍光を用いてピロリン酸の遊離を検出する技術であるパイロシーケンシングに基づく。Ion Torrent(プロトン/PGMシーケンス)は、DNAポリメラーゼによる個々のヌクレオチドの組み込みからプロトン(H+)の直接放出を測定する。
いくつかの態様では、標的核酸を検出するために配列決定は必須ではない。例えば、PCRを用いて標的核酸を検出できる。例えば、PCRは、標的核酸(例えば、バーコード)が存在するかどうかを検出するために使用できる。いくつかの態様では、標的核酸は、蛍光プローブ(例えば、蛍光標識ハイブリダイゼーションプローブ)を用いて検出される。いくつかの態様では、マイクロアレイまたは他の核酸アレイを用いて標的核酸を検出する。本明細書に記載の標的核酸を検出する方法の何れかから得られた配列決定結果またはデータを解析する方法は、当業者に公知である。例えば、配列決定結果の解析には標準的なバイオインフォマティクス手法が用いられる。
いくつかの態様では、核酸結合分子を介する反応によるバーコードの付加を検出するために、配列決定は必要とされない。例えば、DNA/RNA修飾の存在は、核酸電気泳動、蛍光ハイブリダイゼーションプローブ、PCR、またはバーコードによって誘発され得る他の核酸増幅法を用いて、関連するバーコードを検出することによって確認され得る。
標的核酸上の非古典的特徴の同定、定量、または局在化のための例示的方法
いくつかの態様において、本明細書に記載の方法は、標的核酸上の修飾(すなわち、非古典的特徴)を同定するだけでなく、修飾を定量化し、標的核酸上の修飾を1塩基ほどの高分解能で局在化するために用いられ得る(例えば、図8参照)。いくつかの態様では、この方法は、2塩基、3塩基、4塩基、5塩基、6塩基、7塩基、8塩基、9塩基または10塩基という高分解能での修飾の局在化を可能にする。
いくつかの態様において、本明細書に記載の方法は、標的核酸上の修飾(すなわち、非古典的特徴)を同定するだけでなく、修飾を定量化し、標的核酸上の修飾を1塩基ほどの高分解能で局在化するために用いられ得る(例えば、図8参照)。いくつかの態様では、この方法は、2塩基、3塩基、4塩基、5塩基、6塩基、7塩基、8塩基、9塩基または10塩基という高分解能での修飾の局在化を可能にする。
いくつかの態様では、図7に概説した二重ワークストリーム(dual-workstream)アプローチに示すように、修飾および非修飾RNA転写物を含むRNAサンプルが提供される。この図では、修飾されていないRNA転写物は“転写物A”と表示され、タイプ1およびタイプ2のRNA修飾はあらゆるタイプの修飾を表している。RNAサンプルの各転写物は、非古典的特徴を含んでいても、含んでいなくてもよい。
次に、RNA転写物をビーズと接触させ、ビーズを非古典的特徴(すなわち、図7のタイプ1および/またはタイプ2のRNA修飾)に特異的な核酸結合分子と直接的または間接的に結合させる。修飾されたRNA分子はビーズに結合し、未修飾のRNAは上清に残る。RNA修飾のレベルを定量するために、両画分(基質結合画分および上清画分)を処理し、配列決定ライブラリーに変換できる。未修飾RNA分子は、UFPおよびURPを含むアダプターで両端をキャップされ、一方、修飾RNA分子は、その修飾を示す(すなわち、それに結合した核酸結合分子から転写される)バーコードを受け取る。
図7に示すように、正規化プローブ(対照)は、相対定量を可能にするために、両方のワークストリーム(表面結合、上清)にスパイクできる。さらに、核酸結合分子のアダプターに存在する可能性のあるユニークな分子識別子をカウントすることによって、絶対定量を達成できる。多くのRNA修飾は低いコピー数で起こる。従って、スプリットワークフローには、所定のシーケンス深度で低コピー数の転写産物に対して最適な感度を提供する比率で、修飾画分および非修飾画分を組み合わせることができるという利点がある。このスプリットワークフローにより、RNA修飾の化学量論および存在量を測定できる。“化学量論”は相対数であり、非古典的特徴を含む特定の遺伝子座のコピー数を、その遺伝子座の全コピー数で割ったものとして計算される。“存在量”とは、ある遺伝子座における核酸の非古典的特徴の絶対的出現数のことである。
いくつかの態様では、複数の標的核酸を分析する方法は、ライゲーションによるバーコードトランスファーによるRNAプロファイリングと、cDNA切断による非古典的特徴の局在化(例えば、図8を参照)とを含み得る。いくつかの態様において、本方法は、例えば、RNA修飾を保存する条件を用いてRNAを物理的または化学的に断片化することにより、RNAサンプルを枯渇または濃縮することを含む(図8、工程Aを参照)。その後、1以上の核酸結合分子をRNAサンプルに加えることができる。核酸結合分子の結合ドメインはRNA修飾を認識し、アダプター(例えば、DNAバーコードを含むアダプター)をRNA標的(図8の工程Bを参照)の末端に並置する。いくつかの態様において、逆転写酵素が認識エレメントを越えてコピーすることを防止するマーク(すなわち、修飾)を生成するために、標的RNAおよび核酸結合分子の結合ドメインは架橋(例えば、光化学的に架橋)され得る。いくつかの態様では、ポリメラーゼ-RNA相互作用を破壊する、および/または同じ目的のために関与できる付加的な反応性基を提示する認識エレメントを選択し、操作することによって、架橋することなく停止点を作成できる(図8、工程Dを参照)。その後、一本鎖アダプターライゲーションを使って逆転写のためのプライマー結合部位を提供し、プライマー伸長によってcDNAを合成できる(図8、工程Fを参照)。cDNAは、転写物の末端がRNA修飾の位置を示すように合成される。修飾が局在化する分解能は、切断メカニズムの性質に依存する。
cDNA分子は環化されていてもよい。例えば、タイプBアダプターを有するcDNA分子は、Circligaseによって環化できる(図8、工程Hを参照)。環化されたcDNAを切断すると、鎖特異的な直鎖状cDNAフラグメントが得られ、PCR増幅を用いて配列決定ライブラリーに容易に変換できる(図8、工程Iを参照)。プライマーは、配列決定などの下流工程に有用なアダプターピースを導入するために使用され得る。
図9は、切断部位を作るためのバーコーディングおよび酵素的塩基編集(例えば、ウラシルの付加)によるDNA修飾を分析する方法を示す。DNAは二本鎖であり、デアミナーゼ酵素による塩基編集は一本鎖の核酸を必要とするため、最初の工程はDNA鎖を分離することである。これは、標準的なプロトコール(すなわち、末端修復、A-テイリング、アダプターライゲーション)に従って、DNAフラグメントの末端にY字型アダプターをライゲーションすることによって行うことができる。いくつかの態様では、Y字型アダプターの一方のアームは、化学的ハンドルとして5’アジド基を含む。二本鎖DNAを95%ホルムアミドで変性させた後、磁気ビーズなどのビーズに結合させることができる。例えば、表面に露出したアルキン基(100nm2あたり1個のアルキン基密度)を有する磁気ビーズを添加できる。Cu(I)の添加は、核酸のビーズへの共有結合を誘発する。相補的DNA鎖はビーズ表面にランダムに付着し、互いに空間的に離れているため、生理的緩衝液条件下ではハイブリダイズできない。ビーズに結合した一本鎖DNAは、核酸結合分子およびDNA修飾を示すバーコードと接触できる。その後、ライゲーションによってバーコードを一本鎖標的核酸にトランスファーできる。次に、例えば核酸結合分子の結合ドメインに特異的な抗体(例えば、抗マウス抗体)と塩基編集酵素(例えば、シトシンデアミナーゼ)を含む結合ドメイン-酵素結合体を添加する。結合ドメイン-酵素結合体が核酸結合分子の結合ドメインと接触すると、酵素(シトシンデアミナーゼ)は一本鎖標的核酸の塩基を編集する(例えば、修飾部近傍のシトシン(C)をウラシル(U)に変化させる)。脱アミナーゼは不活性化され、USER(ウラシル脱グリコシラーゼおよびエンドヌクレアーゼVIIIの混合物)の添加によってDNA鎖が切断される。DNAポリメラーゼによるプライマー伸長は、DNA修飾の位置を示す切断リードを生成する。リードはライブラリーに変換され、標準的な方法で塩基配列を決定できる。
いくつかの態様では、複数の標的核酸を分析する方法を用いて、反応ごとに1種のDNAまたはRNA修飾を検出/定量できる。いくつかの態様では、複数の標的核酸を分析する方法は、図10に示すように、サンプル分割によって複数のDNAまたはRNA修飾を検出するために適合させ得る。例えば、アデニンデアミナーゼのような塩基編集酵素と結合した結合ドメインを各反応に導入できる。アデニンデアミナーゼはアデニン(A)をイノシン(I)に変換し、T→C変異を誘発し、RNA修飾部位を示す。図10に示す分割スキームでは、テザーアダプターのない結合ドメインが用いられる。各パーティションには1種の結合ドメイン-デアミナーゼ結合体のみが含まれ、免疫沈降後にタイプCアダプターが各パーティションに加えられ、濃縮された標的にライゲーションされる。タイプCバーコードを付けると、RNA Seqライブラリー調製前にスプリット反応をプールできる。
いくつかの態様では、多重修飾プロファイリングおよび塩基編集を組み合わせることができる。図11は、バーコードライゲーションおよびアデノシンデアミナーゼによる塩基編集を用いたRNAプロファイリングの方法を示す。工程は、結合ドメイン-酵素結合体がアデノシンデアミナーゼを含むことを除けば、図9に示したワークフローと同様である。アデノシン(A)をイノシン(I)に変換して修飾の位置を示し、逆転写によって第1鎖を合成した後、鎖情報を保持する方法で第2鎖のcDNAを合成する。第2鎖にウラシルのみを組み込むことによって、第2鎖はUSER切断によって除去できる。鎖RNAライブラリー調製は、編集された鎖のみが増幅されるため、塩基編集を行う場合に有利である。
本明細書に記載の方法は、2以上の修飾(すなわち、非古典的特徴)を含むDNAまたはRNAを分析するためにも用いられ得る。例えば、図12に示すように、標的RNAの5’末端および3’末端にそれぞれリバースアダプターおよびフォワードアダプターを付加するために、2サイクルのプロファイリングを採用できる。最初の工程は、標的RNAフラグメントのリン酸化された5’末端に、遊離3’OHを有するリバースアダプターをライゲーションすることである。アダプターは5’末端を介して核酸結合分子に結合しており、3’末端は自由である。5’末端に最も近い核酸結合分子は、3’末端に近い認識要素よりも有利である可能性が高い。バーコードは核酸結合分子からトランスファーされ、核酸結合分子の残りは5’末端に化学的に結合したままである。その後、アダプターの構造が異なる核酸結合分子を追加し、5’末端が遊離したフォワードアダプターに結合させることができる。アダプターは3’末端を介して核酸結合分子に結合しており、5’末端は遊離のリン酸化末端である。最初のサイクルで用いた核酸結合分子を除去するための条件によっては、その結合ドメインが再び結合し、すでにコードされている部位へのアクセスをブロックする可能性があり、二重プロファイリングの可能性が低くなる。第2サイクルの核酸結合分子からのバーコードトランスファーは、スプリントオリゴを伸長することによって(例えば、逆転写酵素によって)達成され得る。この方法では、PCRで増幅可能なフォワードプライマーおよびリバースプライマーを有するcDNAフラグメントが得られ、塩基配列決定の準備が整う。
図13は、任意の数のRNA修飾(例えば、2、3、4、5、6、7、8、9、10、またはそれ以上のRNA修飾)をプロファイリングするための例示的な反応スキームを提供する。最初の工程では、一本鎖スペーサーを標的核酸にライゲーションする。次に、タイプDアダプターを有する核酸結合分子を加える。一致するRNA修飾が存在すれば、核酸結合分子の結合ドメインが結合し、タイプDアダプターのスペーサー領域がアニールする。バーコードおよびスペーサーは、Klenowフラグメント、Bsuポリメラーゼ、T4およびT7ポリメラーゼ、BstポリメラーゼなどのDNAポリメラーゼによってコピーされる。次に、核酸結合分子を除去し、標的核酸を第2の核酸結合分子(すなわち、結合特異性の異なる核酸結合分子)と接触させ、3’末端に別のバーコードを付加する。最後のサイクルでは、3’末端をユニバーサルプライマー(UFPまたはURPなど)でキャップし、逆転写酵素のプライマーとして用いる。
図14Bは、修飾分析の各サイクルにおいて、標的RNA鎖に沿って同じタイプの修飾のコピーが複数存在し、デアミナーゼが相補的DNAアドレスのハイブリダイゼーションを介して結合ドメインに標的化される状況に対処する方法を示す。1以上の同じ修飾の存在は、図13に記載されているように、タイプDアダプターから生じたタイプGアダプターによるバーコード転写によって示される。この方法で用いられる結合ドメイン-タイプGアダプター結合体には、DNAアドレスであるアドレス1が含まれている。この結合ドメインの結合に続いて、プライマー伸長によるバーコード導入が開始される。各修飾の位置をマークするために、シチジンデアミナーゼおよび相補的DNAアドレス(アドレス1’)を含むコンジュゲートが添加され、結合ドメイン-タイプDアダプターコンジュゲートのアドレス(アドレス1)に結合する。デアミナーゼは、サイクル1ですべての修飾部位を編集できる。第2サイクルでは、もう一方のRNA修飾に特異的な、アドレス2を含む異なる結合ドメイン-タイプDアダプター結合体が導入される。プライマーの伸長が開始され、続いて適合するシチジンデアミナーゼおよびアドレス2’が添加され、2番目の修飾タイプの位置をマークするために編集が許可される。
図15A-15Dは、タグメンテーションを用いたバーコードの方法を示している。この方法は、トランスポザーゼに結合した結合ドメインを含む二量体核酸結合分子を用いる。トランスポザーゼ分子には、特定のRNA修飾を示す二本鎖DNAアダプターが付加されている。トランスポザーゼは二本鎖DNAアダプターに結合し、二本鎖DNA基質の5’末端にライゲーションすることによって、アダプターを切断し挿入する。3’末端にはタグを付けず、生じたギャップはポリメラーゼ反応によって埋めることができる。いくつかの態様では、トランスポザーゼはDNA/RNAヘテロ二重鎖を基質として用い得る。タグメンテーション反応は通常200-300ntの長さのフラグメントを生成し、サンプルインプット(input)によって最適化できる。いくつかの態様では、核酸結合分子-トランスポザーゼ結合体を、フラグメント化されていない全RNAまたは濃縮/欠失したRNAに添加する。修飾されたRNA塩基を認識すると、トランスポザーゼは特定のバーコードをRNA/DNA二重鎖に挿入し、ユニバーサルプライマー部位およびリバースプライマー部位を付加する。適切なポリメラーゼを用いてギャップを埋めることで、ライブラリー調製は完了する。タグメンテーションは、特定のバーコードによってRNA修飾部位をフレーミングし、位置情報は、位置分解能を最適化する長さにトランスポザーゼ・リンカーを作製することによって得られる。
図16は、タイプEアダプターを用いたロングリード構築と組み合わせた多重修飾のプロファイリング法を示す。タイプEアダプターは、バーコードおよび修飾の近傍でハイブリダイズする短いランダムフィートを含む。適切なリンカーおよびフィートの設計により、それらはRNA上に配列し、RNA修飾の順序および種類を表す。ギャップは逆転写酵素で埋められ、ライゲーションで結合される。鋳型スイッチングにsmart-Seqアプローチを用いることで、鎖情報は保持される。Smart-Seqは、短いポリC配列で平滑末端をテイリングする逆転写酵素の特性を利用している。ポリCテイルは短いLNA-GGGプライマーでプライミングされ、2本目の鎖合成を開始する。
いくつかの態様において、複数の標的核酸を分析する方法は、(i)標的核酸を、本明細書に記載の核酸結合分子と接触させる工程;(ii)(a)バーコード化核酸のオフターゲット生成を実質的に防止する環境において、核酸バーコードを標的核酸に転写してバーコード化標的核酸を生成する工程、または(b)標的核酸のバーコード化コピーを生成する工程;(iii)非古典的特徴の位置がバーコード化標的核酸またはそのバーコード化コピーの一次核酸配列に基づいて同定可能であるように、バーコード化標的核酸またはそのバーコード化コピーを改変する工程;および(vi)バーコード化標的核酸を配列決定する工程、を含む。いくつかの態様において、工程(i)~(iii)は、少なくとも1回(例えば、少なくとも2回、少なくとも3回、少なくとも4回、少なくとも5回、少なくとも6回、少なくとも7回、少なくとも8回、少なくとも9回、少なくとも10回、またはそれ以上)繰り返される。いくつかの態様では、工程(i)~(iii)を繰り返すたびに異なる核酸結合分子を用いる。いくつかの態様では、工程(i)~(iii)を繰り返すたびに、同じ核酸結合分子を使用する。いくつかの態様において、本方法は、配列決定前にバーコード化標的核酸またはそのコピーを増幅することを含む。
いくつかの態様において、複数の標的核酸中の2以上の非古典的特徴を検出し、または定量するための方法は、(i)標的核酸を少なくとも2つの核酸結合分子と接触させる工程であって、各核酸結合分子が結合ドメインおよびアダプターを含み;ここで、各核酸結合分子の結合ドメインが、DNAまたはRNAの異なる非古典的特徴に結合し;ここで、アダプターが、各結合ドメインによって特異的に結合される非古典的特徴に特異的な核酸バーコード配列を含む、工程;(ii)(a)バーコード化核酸の標的外生成を実質的に防止する環境下で、バーコード化標的核酸を生成するために、核酸バーコードを標的核酸にトランスファーさせるか、または(b)標的核酸のバーコード化コピーを生成する;(iii)非古典的特徴の位置がバーコード化標的核酸またはそのバーコード化コピーの一次核酸配列に基づいて同定可能であるように、バーコード化標的核酸またはそのバーコード化コピーを改変する工程;および(vi)バーコード化標的核酸を配列決定する工程、を含む。いくつかの態様において、本方法は、配列決定前にバーコード化標的核酸またはそのコピーを増幅することを含む。
いくつかの態様において、標的核酸中の非古典的特徴を検出する方法は、(i)標的核酸を、本明細書に記載されるような核酸結合分子と接触させる工程;(ii)(a)バーコード化核酸のオフターゲット生成を実質的に防止する環境において、核酸バーコードを標的核酸に転写してバーコード化標的核酸を生成するか、または(b)標的核酸のバーコード化コピーを生成する工程;および(iii)標的核酸またはそのコピー中のバーコードの存在を検出する工程、を含む。
標的核酸中の非古典的特徴の位置を1塩基分解能で決定する方法であって、該方法は、(i)標的核酸を、本明細書に記載の核酸結合分子と接触させる工程;(ii)バーコード化核酸のオフターゲット生成を実質的に防止する環境において、核酸バーコードを標的核酸にトランスファーして、バーコード化標的核酸を生成する工程;および(iii)標的核酸またはそのコピー中のバーコードの存在を検出する工程、を包含し、ここで、核酸結合分子は、以下の1以上が可能な結合ドメインを含む:標的核酸に変異を誘導する;またはポリメラーゼバイパスを防止し、従って標的核酸のコピーの間に切断を引き起こす。いくつかの態様では、工程(i)~(iii)を少なくとも1回繰り返す。いくつかの態様では、工程(i)~(iii)を繰り返すたびに異なる核酸結合分子を用いる。いくつかの態様では、工程(i)~(iii)を繰り返すたびに、同じ核酸結合分子を用いる。
本明細書に記載の方法は、疾患、障害または状態を診断するために使用できる。例えば、いくつかの態様において、本方法は、それを必要とする対象において癌を診断するために用いられ得る。いくつかの態様では、キットは、1以上の治療に対する反応など、疾患、障害または状態を経時的にモニタリングするために用いられ得る。例えば、本キットは、がんの治療(すなわち、化学療法、放射線療法など)を受けている対象におけるエピジェネティックおよび/またはエピトランススクリプトームの経時的変化をモニタリングするために使用できる。いくつかの態様では、本方法は、それを必要とする対象からの細胞または組織を分析するために用いられ得る。例えば、血液サンプル、生検サンプル、剖検サンプルなどから単離された細胞や組織における非古典的特徴を検出するために、本方法を用い得る。
いくつかの態様において、本方法は、工業的発酵に用いられる細胞など、1以上の製品の生産に商業的に用いられる細胞におけるエピジェネティックな変化を検出および/またはモニタリングするために用いられ得る。いくつかの態様において、本方法は、植物細胞または組織におけるエピジェネティックな変化を検出および/またはモニタリングするために用いられ得る。
核酸結合分子を含む組成物
本発明はまた、本明細書に記載の1以上の核酸結合分子を含む組成物も提供する。いくつかの態様では、組成物は1種以上の核酸結合分子を含む。例えば、組成物は、第1の非古典的特徴に結合する第1の核酸結合分子、および第2の非古典的特徴に結合する第2の核酸結合分子を含み得る。いくつかの態様において、組成物は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25以上の異なるタイプの核酸結合分子を含み得る。
本発明はまた、本明細書に記載の1以上の核酸結合分子を含む組成物も提供する。いくつかの態様では、組成物は1種以上の核酸結合分子を含む。例えば、組成物は、第1の非古典的特徴に結合する第1の核酸結合分子、および第2の非古典的特徴に結合する第2の核酸結合分子を含み得る。いくつかの態様において、組成物は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、または25以上の異なるタイプの核酸結合分子を含み得る。
また、本明細書には、1以上の複合体を含む組成物が提供され、各複合体は標的核酸に結合した核酸結合分子を含む。
いくつかの態様において、本明細書に記載の組成物は、1以上の担体、賦形剤、緩衝剤などを含む。組成物は、約0.5、約1.0、約1.5、約2.0、約2.5、約3.0、約3.5、約4.0、約4.5、約5.0、約5.5、約6.0、約6.5、約7.0、約7.5、約8.0、約8.5、約9.0、約9.5、約10.0、約10.5、約11.0、約11.5、約12.0、約12.5、約13.0、約13.5、または約14.0のpHを有し得る。いくつかの態様において、組成物は医薬組成物である。
核酸分析用キット
本明細書に記載の核酸結合分子は、キットで(例えば、キットの成分として)提供できる。例えば、キットは、核酸結合分子、またはその1以上の成分、および情報資料を含み得る。情報資料は、例えば、本明細書に記載の方法および/または核酸結合分子の使用に関する説明資料、教示資料、販売資料、またはその他の資料であり得る。キットの情報資料の形式は限定されない。いくつかの態様において、情報提供物質は、核酸結合分子の生産に関する情報、分子量、濃度、有効期限、バッチまたは生産地情報などを含み得る。いくつかの態様では、情報資料は、キットを用いて診断または評価され得る障害および/または病状のリストを含み得る。
本明細書に記載の核酸結合分子は、キットで(例えば、キットの成分として)提供できる。例えば、キットは、核酸結合分子、またはその1以上の成分、および情報資料を含み得る。情報資料は、例えば、本明細書に記載の方法および/または核酸結合分子の使用に関する説明資料、教示資料、販売資料、またはその他の資料であり得る。キットの情報資料の形式は限定されない。いくつかの態様において、情報提供物質は、核酸結合分子の生産に関する情報、分子量、濃度、有効期限、バッチまたは生産地情報などを含み得る。いくつかの態様では、情報資料は、キットを用いて診断または評価され得る障害および/または病状のリストを含み得る。
いくつかの態様において、核酸結合分子は、本明細書に記載の方法に使用するのに適切な方法(例えば、使いやすいチューブ、適切な濃度など)で提供され得る。いくつかの態様では、キットは使用前に核酸結合分子の何らかの調製または操作を必要とする場合がある。いくつかの態様において、核酸結合分子は、液体、乾燥、または凍結乾燥の形態で提供される。いくつかの態様では、核酸結合分子は水溶液で提供される。いくつかの態様では、核酸結合分子は、滅菌された核酸遊離溶液で提供される。いくつかの態様では、核酸結合分子は、分子自体を構成し得る核酸以外に核酸を実質的に含まない組成物中で提供される。
いくつかの態様において、キットは、1以上のシリンジ、チューブ、アンプル、ホイルパッケージ、またはブリスターパックを含み得る。キットの容器は、気密性、防水性(すなわち、水分または蒸発の変化を防ぐ)、および/または遮光性を備え得る。
いくつかの態様では、キットは、標的核酸の集団を分析する方法など、本明細書に記載の方法の1以上を実施するために用いられ得る。いくつかの態様において、キットは疾患、障害または病状を診断するために使用できる。例えば、いくつかの態様では、キットは癌の診断に使用できる。いくつかの態様では、キットは、1以上の治療に対する反応など、疾患、障害、または状態を経時的にモニタリングするために用いられ得る。例えば、本キットは、癌の治療を受けている対象のエピジェネティックおよび/またはエピトランススクリプトームの経時的変化をモニタリングするために使用できる。
実施例
以下の限定されない例は、本発明の組成物および方法の態様をさらに例示する。
以下の限定されない例は、本発明の組成物および方法の態様をさらに例示する。
実施例1:結合ドメインの設計、選択、特性評価
結合ドメインは、N6-メチルアデノシン(m6A)、シュードウリジン(Ψ)、イノシン(I)および5-メチルシトシン(m5C)に結合する核酸結合分子(BAC(=結合ドメインアダプター結合体)とも呼ばれる)に使用するために設計されている。最初に、市販の抗体のスクリーニングが行われた。有利な特性を有する抗体(モノクローナル抗体など)を選択した。
結合ドメインは、N6-メチルアデノシン(m6A)、シュードウリジン(Ψ)、イノシン(I)および5-メチルシトシン(m5C)に結合する核酸結合分子(BAC(=結合ドメインアダプター結合体)とも呼ばれる)に使用するために設計されている。最初に、市販の抗体のスクリーニングが行われた。有利な特性を有する抗体(モノクローナル抗体など)を選択した。
最初の抗体特性化はプレートELISAによって行われた。表4に示すm6A(配列番号1)、Ψ(配列番号2)、I(配列番号3)またはm5C(配列番号4)を含むビオチン化RNAオリゴヌクレオチド(Horizon Discovery)、および非修飾対照オリゴヌクレオチド(配列番号5)を、ストレプトアビジンでコートした96ウェルプレート(Thermo Fisher, カタログ番号15125)に4℃で添加し、リン酸緩衝生理食塩水(PBS)で洗浄した。別の実験では、オリゴヌクレオチドを逆転写によってRNA/DNAヘテロ二重鎖に変換する(Protoscript II, NEB カタログ番号M0368L)ことにより、二重鎖RNA修飾に結合する抗体の能力を評価した。RNA配列は安定した二次構造をとるため、RNA修飾の提示はしばしば二重鎖になり、塩基対の状態とは無関係に修飾を認識する抗体が優れていると考えられている。抗体をプレートに加え、22℃で60分間インキュベートした。結合していない抗体を洗浄し、アルカリホスファターゼ(AP)標識検出抗体(Thermo Fisher, カタログ番号31430および31460)。未結合の検出抗体を洗浄した後、AP基質をプレートに添加し(Thermo Fisher, カタログ番号34028)、450nmでの吸光度検出で結合抗体の有無を判定した。
抗体結合の親和性は、アッセイに使用する抗体の量を滴定し、得られた曲線を結合モデルに当てはめることで評価した。図19は、m6Aに対する良好な結合特性を有する抗体のサブセット(Thermo Fisher, カタログ番号61755 (Ab01)、MA5-33030 (Ab02)(Synaptic Systems カタログ番号345E11 (Ab05))、m5C(Thermo Fisher, カタログ番号MA5-24694(Ab16))、I(Diagenode、カタログ番号C15200251(Ab10))およびΨ(Diagenode、カタログ番号C15200247(Ab11)、MBL、カタログ番号D347-3(Ab19))の結合曲線を示す。シュードウリジン抗体以外のすべての抗体は、一本鎖RNA中の抗原とサブナノモル解離定数KD (親和性の指標)で結合し、100倍以上の特異性を示した。シュードウリジン抗体はナノモル程度の親和性しかなく、特異性は約10倍であった。Ab02、Ab05、Ab16は、RNA/DNAヘテロ二重鎖に強い結合を示すため、特に望ましい。このELISA形式から得られる解離定数はアビディティ(avidity)の結果であり、表面上のRNA鎖の密度が高いため、両抗体アームは修飾塩基に結合できる。この二座結合様式(bidentate binding mode)は解離速度を遅くし、全体的な親和性を高めることが知られている。本明細書で示したデータに基づけば、1分子1:1複合体における親和性は低くなると予想される。Ab05、Ab10、Ab16、Ab19がさらなる分析のために選ばれた。
実施例2:結合ドメインの変異プロファイルおよび切断パターンの決定
変異プロファイルおよび切断パターンは、(1)実施例1で同定された抗体、または(2)その誘導体(例えば、実施例1の抗体のCDR配列を含むscFv)のいずれかについて特徴付けられ得る。具体的には、実施例1に記載される結合ドメインが核酸標的に結合する。結合ドメインおよびヌクレオチドは架橋されている。標的ヌクレオチドをアダプター結合させた後、逆転写を用いてcDNAを作製し、PCR増幅して配列決定し、標的ヌクレオチドの変異および切断プロファイルを評価する。
変異プロファイルおよび切断パターンは、(1)実施例1で同定された抗体、または(2)その誘導体(例えば、実施例1の抗体のCDR配列を含むscFv)のいずれかについて特徴付けられ得る。具体的には、実施例1に記載される結合ドメインが核酸標的に結合する。結合ドメインおよびヌクレオチドは架橋されている。標的ヌクレオチドをアダプター結合させた後、逆転写を用いてcDNAを作製し、PCR増幅して配列決定し、標的ヌクレオチドの変異および切断プロファイルを評価する。
最初に、抗体結合RNA鎖の逆転写から生じる突然変異パターンを、インビトロで転写されたRNAを用いて評価する。まず、AmpliScribe(商標)T7 High Yield Transcription Kit (Lucigen)を用いて、修飾および非修飾ヌクレオチド三リン酸(NTP)(TriLink)の比率を変化させながら、500ヌクレオチドのRNAをインビトロで転写することにより、1以上の修飾(m6A、Ψ、および/またはm5C)を含むRNAを生成する。転写産物は、RNAフラグメント化試薬(Thermo)を用いて50から150ヌクレオチドのサイズに断片化され、各候補抗体と共にインキュベートされる。
UV架橋が修飾部位での逆転写の切断を誘導するかどうかを調べるために、各抗体-RNA複合体溶液にUV光(例えば、約0.15J/cm2、254nm)を照射する。架橋後、抗体-RNA複合体は、プロテインA/Gダイナビーズ(Thermo)に捕捉される。プロテインA/Gは抗体のFc領域と高い親和性で結合する。その後、RNAの3’末端をポリヌクレオチドキナーゼ(NEB)で脱リン酸化し、DNAアダプターをT4 RNAリガーゼ(NEB)でライゲーションする。アダプターは5’末端でプレアデニル化されている:5rApp/AGATCGGAAGAGCGGTTCAG/3ddC、ここで5rAppは5’プレアデニル化を意味し、3ddcは3’ジデオキシ-Cを意味する(配列番号6)。
アダプターをライゲーションしたRNAはビーズから溶出され、精製され、ライゲーションしたアダプターと相補的なオリゴヌクレオチド(すなわち逆転写酵素プライマー)でプライミングされる。逆転写酵素プライマーは、下流での環化を可能にするために5’リン酸化されており、縮重塩基でフレーム化された4文字のバーコード、BamHI制限部位(gatc、配列番号7)、ならびにフォワードおよびリバースプライマー結合部位:5’P-NNAACCNNNAGATCGGAAGAGCGTCGTGgatcCTGAACCGC-3’(配列番号8)を含む。
逆転写を行い、cDNAを作製する。逆転写は、各酵素の変異パターンおよび切断パターンを比較できるように、例えばSuperscript III(Thermo社)を含む逆転写酵素のパネルを用いて行われる。AMPureビーズ(Agencourt)を用いてcDNAのサイズ選択を行った後、CircLigase II(Lucigen)を用いて60℃で環化し、BamHI制限酵素で切断する。ライブラリーは適切な配列決定アダプターでPCR増幅され、MiSeq装置(Illumina)で配列決定される。リードは参照RNA配列に対してアラインメントされ、突然変異および切断のパターンが評価される。
実施例3:結合ドメインのランダム標識による核酸結合分子の調製
核酸結合分子は、実施例1に記載の抗体にDNAオリゴヌクレオチドをアミン反応性化学で結合させることにより調製した。アミノ修飾DNAオリゴヌクレオチドは、オリゴヌクレオチド結合キット(Oligonucleotide Conjugation Kit)(Vector Labs, カタログ番号S-9011-1)を用いて抗体にランダムに結合させた。最初の工程は、アミノ末端DNAオリゴヌクレオチドを4FB架橋剤で修飾し、抗体のリジン残基をHyNic試薬で修飾することであった。活性化されたオリゴヌクレオチドと抗体を単純に混合するだけで、両者の間に共有結合が形成される。
核酸結合分子は、実施例1に記載の抗体にDNAオリゴヌクレオチドをアミン反応性化学で結合させることにより調製した。アミノ修飾DNAオリゴヌクレオチドは、オリゴヌクレオチド結合キット(Oligonucleotide Conjugation Kit)(Vector Labs, カタログ番号S-9011-1)を用いて抗体にランダムに結合させた。最初の工程は、アミノ末端DNAオリゴヌクレオチドを4FB架橋剤で修飾し、抗体のリジン残基をHyNic試薬で修飾することであった。活性化されたオリゴヌクレオチドと抗体を単純に混合するだけで、両者の間に共有結合が形成される。
標識の化学量論はSDSゲル電気泳動で評価し、機能は実施例1に記載したようにプレートELISAで確認した。図20AはAb01のオリゴヌクレオチド標識の効率がHyNic濃度(すなわち0、10、25、50倍モル過剰)に反応してどのように変化したかを示している。10倍モル過剰のHyNicでは、0、1または2個のオリゴヌクレオチドを有する抗体結合体が存在したが、50倍モル過剰のHyNicではオリゴヌクレオチドの数は1~7個であった。
バーコードアッセイに使用するには、機能に重要なリジン残基の標識を避けながら、非標識抗体の量を最小にするHyNic濃度が好ましい。実際には、最適なHyNic比はIgGアイソタイプおよびパラトープ(paratope)の配列によって変わった(図20B)。Ab05は抗体あたり最大8個、Ab10は最大5個、Ab16は最大3個、Ab19は最大1個のオリゴヌクレオチドを示した。図20Bのすべての標識反応に用いられたアダプターは同じであり、プライマー伸長によるバーコード化のために設計され(タイプ2Dアダプター)、結合ドメインに結合するためのPEGリンカー(iSp18)、ブロックされた3’末端(3SpC3)および5’アミン(5AmMC6)を含む(/5AmMC6/T/iSp18/TATAAGAGACAGACACAGGCCACTCAGTCTAT/3SpC3/;配列番号9)。プライマー伸長によるバーコーディングおよびシーケンシングにおける一般的な使用のためのアダプターは、以下の構造を有する:
配列番号56(5AmMC6 =5’アミン、iSp18 =PEGリンカー, イタリック体= Illuminaアダプター、NNN =UMI、下線= 7b MBC (修飾エンコードバーコード)、太字= 8bスペーサー、3SpC3 = 3’ブロッキング基)。PEGリンカーは、効率的なバーコード転送のための空間的柔軟性を付加する。オリゴヌクレオチドの配列、可能な末端修飾、およびテザリングの方向は、各核酸結合分子の特定の必要性に基づいて変更できる。
配列番号56(5AmMC6 =5’アミン、iSp18 =PEGリンカー, イタリック体= Illuminaアダプター、NNN =UMI、下線= 7b MBC (修飾エンコードバーコード)、太字= 8bスペーサー、3SpC3 = 3’ブロッキング基)。PEGリンカーは、効率的なバーコード転送のための空間的柔軟性を付加する。オリゴヌクレオチドの配列、可能な末端修飾、およびテザリングの方向は、各核酸結合分子の特定の必要性に基づいて変更できる。
オリゴヌクレオチドで標識した後の抗体結合活性を確認するために、実施例1に記載したELISA実験を行った。標識前と標識後の同じ抗体の結合曲線を比較すると、Ab05、Ab16、Ab10はすべて活性を失ったが、Ab05はKDが15倍以上失われ、最も悪いヒットであった(図21A-21C)。しかしながら、これらの実験は、ヌクレオチド修飾の同定に用いる結合ドメインとしての抗体の検出可能な結合を証明している。
実施例4:抗体の糖鎖ドメインの部位特異的標識を用いた核酸結合分子の調製
結合活性の阻害を避けるため、Ab05を部位特異的にSiteClick 抗体アジド修飾キット(Thermo Fisher, カタログ番号S20026)を用いて部位特異的に標識した。SiteClick標識は、酵素を用いてIgG抗体の重鎖にアジド部分を特異的に結合させ、抗原結合ドメインが抗原標的に結合するために変化しないことを保証する。この部位選択性は、アイソタイプおよび宿主種に関係なく、本質的にすべてのIgG抗体に存在する糖鎖ドメインを標的とすることで達成された。ガラクトシダーゼは、β-1,4-ガラクトシル転移酵素を用いて、β-1,4結合D-ガラクトピラノシル残基の加水分解と、その後のアジド-ガラクトピラノシルの結合を触媒する。一旦アジド修飾されると、DBCO(ジベンゾシクロオクチル)標識アダプター(例えば、DBCO/5AmMC6/T/iSp18/TATAAGA GAC AGACAGGCCACTCAGTCTAT/3SpC3/;配列番号22)がFc領域に結合され、1つまたは2つのアダプターを示す抗体が得られたが、いくつかの非標識抗体も得られた(図21D)。ELISAアッセイでは、部位特異的標識抗体の結合親和性が変化していないことが確認された(図21E)。
結合活性の阻害を避けるため、Ab05を部位特異的にSiteClick 抗体アジド修飾キット(Thermo Fisher, カタログ番号S20026)を用いて部位特異的に標識した。SiteClick標識は、酵素を用いてIgG抗体の重鎖にアジド部分を特異的に結合させ、抗原結合ドメインが抗原標的に結合するために変化しないことを保証する。この部位選択性は、アイソタイプおよび宿主種に関係なく、本質的にすべてのIgG抗体に存在する糖鎖ドメインを標的とすることで達成された。ガラクトシダーゼは、β-1,4-ガラクトシル転移酵素を用いて、β-1,4結合D-ガラクトピラノシル残基の加水分解と、その後のアジド-ガラクトピラノシルの結合を触媒する。一旦アジド修飾されると、DBCO(ジベンゾシクロオクチル)標識アダプター(例えば、DBCO/5AmMC6/T/iSp18/TATAAGA GAC AGACAGGCCACTCAGTCTAT/3SpC3/;配列番号22)がFc領域に結合され、1つまたは2つのアダプターを示す抗体が得られたが、いくつかの非標識抗体も得られた(図21D)。ELISAアッセイでは、部位特異的標識抗体の結合親和性が変化していないことが確認された(図21E)。
実施例5:遺伝子工学による部位特異的標識を利用した核酸結合分子の調製およびビーズへの固定化
核酸結合分子をビーズベースのアッセイに用いるとき、分子は結合活性を維持する向きで表面に固定化される。このようなアッセイで用いる核酸結合分子を再現性よく調製するために、結合ドメイン(例えば、抗体またはそのフラグメント)の部位特異的標識が用いられる。以下の方法は、あらゆるタンパク質結合ドメインに適応可能であり、抗体に限定されるものではない。
核酸結合分子をビーズベースのアッセイに用いるとき、分子は結合活性を維持する向きで表面に固定化される。このようなアッセイで用いる核酸結合分子を再現性よく調製するために、結合ドメイン(例えば、抗体またはそのフラグメント)の部位特異的標識が用いられる。以下の方法は、あらゆるタンパク質結合ドメインに適応可能であり、抗体に限定されるものではない。
最初に、抗体は次のように設計される。Spytagペプチド(AHIVMVDAYKPTK、配列番号10)を、抗体重鎖のC末端に融合させる。抗体軽鎖のC末端は、LCxPxR(式中、xは何れかのアミノ酸であり得る)という短いペプチドで修飾されている(配列番号11)。このペプチドはホルミルグリシン生成酵素(FGE)の基質である。こうして、抗体は2つのペプチド融合タグを含んで発現および精製される(図17C)。
FGEを発現する細菌発現系が選択される。この酵素はホルミルグリシンを共翻訳的に導入する。ホルミルグリシンのアルデヒド基は反応性の化学ハンドルであり、アミノ基をオキシムまたはヒドラゾンに変換した後、アミノDNAを結合させるために用いられる。
核酸結合分子をビーズに固定化するために、ビーズはスパイキャッチャータンパク質で装飾されている。スパイキャッチャーのN末端は、核酸結合分子の結合ドメインが示すC末端のスパイタグと迅速かつ完全に反応し、共有結合のイソペプチド結合を形成する。天然のスパイキャッチャーは139アミノ酸タンパク質であり、システインを含まない:msyyhhhhhh dydipttenl yfqgamvdtl sglsseqgqs gdmtieedsa thikfskrde dgkelagatm elrdssgkti stwisdgqvk dfylypgkyt fvetaapdgy evataitftv neqgqvtvng katkgdahi (配列番号12)。マレイミド化学による表面カップリングを可能にするために、C末端にシステイン変異が1つ導入されている(実施例9を参照)。
実施例6:プロテインGビーズへの核酸結合分子の固定化および核酸標的沈降
核酸修飾の多重検出のための最も単純なアッセイ形式を図5Aに示す。ビーズには、1種の核酸結合分子のみが添加され、“ビーズタイプ”を表す。複数の核酸修飾を同時に調べるために、いくつかのタイプのビーズを組み合わせ、核酸標的と混合する。ビーズタイプの核酸結合分子はすべて同じ標的を免疫沈降させるので、その表面密度を厳密に制御する必要はない。ある核酸結合ドメインに結合しているが、隣接する核酸結合分子によってバーコード化されている標的は、正しく同定される。
核酸修飾の多重検出のための最も単純なアッセイ形式を図5Aに示す。ビーズには、1種の核酸結合分子のみが添加され、“ビーズタイプ”を表す。複数の核酸修飾を同時に調べるために、いくつかのタイプのビーズを組み合わせ、核酸標的と混合する。ビーズタイプの核酸結合分子はすべて同じ標的を免疫沈降させるので、その表面密度を厳密に制御する必要はない。ある核酸結合ドメインに結合しているが、隣接する核酸結合分子によってバーコード化されている標的は、正しく同定される。
IgG抗体を固定化するユニバーサルな方法は、市販のプロテインGビーズを用いることである。プロテインGは、C群およびG群溶連菌に発現する免疫グロブリン結合タンパク質である。65kDa(G148プロテインG)および58kDa(C40プロテインG)の細胞表面タンパク質で、ほとんどのIgGアイソタイプのFabおよびFc領域に結合する。この実施例では、ランダムにアダプター標識した核酸結合分子をプロテインGビーズに固定化し、修飾RNA配列を特異的に沈降することを説明する。
m6A(Ab05)、m5C(Ab16)およびI(Ab10)に対する非標識抗体を磁性プロテインGダイナビーズ(Thermo Fisher, カタログ番号10009D)上に添加した。50μLのダイナビーズを洗浄し、PBST(0.1% Tween(登録商標)20界面活性剤入りPBS)中200μLの抗体(0.05μg/μL)と共にインキュベートした。抗体を22℃で20分間結合させた後、200μLのPBSTでビーズを洗浄した。ロードしたビーズを22℃で1時間、合成RNA標的の混合物に暴露した。各標的は、表5に示すように、単一の修飾(m6A(配列番号13)、m5C(配列番号18)、I(イノシン)(配列番号16)、または修飾なし)を示す。標的はフルオレセイン(FAM)で5’修飾され、ゲル上でのレシオメトリック検出(ratiometric detection)を可能にした。PBSTで洗浄後、免疫沈降したRNAを2xTBUサンプルローディングバッファー(Thermo Fisher, カタログ番号LC6876)を用いて70℃で2分間リカバーさせた。標的を15% TBUゲル(Thermo Fisher, カタログ番号EC62755BOX)で定量した(図22)。すべての抗体は、特異性のレベルに差はあれ、同種の標的に対して明確な選好性を示した。後者はほとんどの抗体と標的の組み合わせで10倍と同等かそれ以上であり、ELISA測定で予測された値よりも低かった(実施例1)。この所見は、RNA標的ではなく抗体を固定化したインバーテッドフォーマット(inverted format)ではアビディティがないこと、および洗浄手順のストリンジェンシーの違いに起因する。
実施例7:プライマー伸長によるランダムなRNA配列プールのバーコード化
プライマー伸長によるバーコード化には、標的RNAの3’末端に合理的に設計された配列(スペーサー、SP;図2Dおよび3Dを参照)の存在が必要である。プライマー伸長によるバーコード用のアダプターは、スペーサーに相補的な配列を含む。アダプターを標的スペーサーにハイブリダイズさせると、DNAポリメラーゼまたは逆転写酵素によって伸長可能な凹型3’末端が形成され、バーコード配列が標的RNAにコピーされる。以下の例は、テイリング反応またはライゲーション反応を用いて、RNA配列の無作為なプールにスペーサーでタグを付ける方法を提供する(図23A)。
プライマー伸長によるバーコード化には、標的RNAの3’末端に合理的に設計された配列(スペーサー、SP;図2Dおよび3Dを参照)の存在が必要である。プライマー伸長によるバーコード用のアダプターは、スペーサーに相補的な配列を含む。アダプターを標的スペーサーにハイブリダイズさせると、DNAポリメラーゼまたは逆転写酵素によって伸長可能な凹型3’末端が形成され、バーコード配列が標的RNAにコピーされる。以下の例は、テイリング反応またはライゲーション反応を用いて、RNA配列の無作為なプールにスペーサーでタグを付ける方法を提供する(図23A)。
最初の方法は、RNA標的に3’ポリrAテイルを付加するものであった。変性30b RNA配列(rN30)を、1mMのATP存在下で大腸菌ポリ(A)ポリメラーゼ(NEB, カタログ番号M0276 L)を用いてポリアデニル化した。ランダムな30b RNA分子(5’-FAM-(rN)30;配列番号23)のプールに付加されたAの数は、平均150b付近の広いガウス分布を有する。A-テイルのサイズ調整は、所望の長さの競合ポリ(dT)オリゴヌクレオチドを過剰に反応に加えることによって得られた。競合体はA-テイルに結合し、ポリメラーゼの位置をずらし、反応を中止させた。図23Bは、ポリ(dT)20オリゴヌクレオチドをテイリング反応に加えることによる20bスペーサーの生成を示す。図23Cは、対応する長さのポリ(dT)オリゴヌクレオチドをテイリング反応に加えることによって、10、20および30bのスペーサーを生成し、温度の影響を調べたものである。20bおよび30bのポリ(dT)競合体は望ましいスペーサー長をもたらしたが、10b競合体はスペーサー長をコントロールできなかった。これは、10b A/T二重鎖が試験した反応温度では安定でないためと思われる。より短いホモポリマーテイルは、GTPまたはCTPと相補的な10b競合体オリゴヌクレオチドの存在下で、ポリ(U)ポリメラーゼを用いて作成できる。このアプローチは、所定の反応温度で競合体をホモポリマーテイルにハイブリダイズさせることができる何れかのスペーサー長に伸長可能である。
メッセンジャーRNA(mRNA)には3’-A-テイルがあり、このテイルは固定化ポリdTプローブにmRNA分子を選択的にハイブリダイズさせるために広く利用されている。スペーサー結合方法を提供することはさておき、この方法で何れかのRNA集団をA-テイル化し、図4Bに記載のハイブリダイゼーションによってビーズに固定化できる。
2つ目の方法は、酵素ライゲーションを用いた。何れかの塩基配列を含むスペーサーは、T4 RNAリガーゼI(NEB, カタログ番号M0204L)により触媒される3’ライゲーションにより導入された。この反応には、脱リン酸化されたRNAの3’末端および5’-リン酸化DNAスペーサーが必要である。図23Dは、10b、20b、30bおよび50bのサイズの5’-リン酸化DNA配列(それぞれ配列番号28-31、表6参照)と30bの縮重RNAライブラリー(配列番号23)とのライゲーションを示す。サイズ範囲は、スペーサーの導入(一般的なスペーサーサイズは約10bである)および図3Aに記載のライゲーションによるバーコード化(一般的なアダプターサイズは25b以上である)に有用な情報を提供するために選択された。スペーサーまたはアダプターをライゲーションする標準的な条件は同じである:反応は、最適化されたライゲーションバッファー(500nM RNA標的、2.5μM 5’リン酸化DNA、50mM Tris pH7.5、10mM MgCl2、1mM DTT、0.5mM ATP、20% PEG-8000および0.5ユニット/μL T4 RNAリガーゼI)を用いて、室温で1時間インキュベートした。ライゲーション産物を変性ゲル電気泳動で分析した。ゲルの定量から、中程度の長さのDNA配列(20bおよび30b)では反応が最も速く進み、とても短い配列(10b)および長い配列(50b)では反応が遅くなることが示された(図23D)。したがって、一般的なスペーサーライゲーションは、変換を最大化するために一晩行い、同じライゲーション反応によるバーコーディング用のアダプターは50bを超えないように設計した。
プライマー伸長によるバーコード化のためのアダプターを示す核酸結合分子は、非古典的特徴を介して特異的に、かつスペーサーを介して非特異的に、標的RNAと接触する。ライゲーションによるバーコーディングと比較すると、結合様式が一価から二価に変化するため、設計されたアビディティが追加される。これは結合親和性を高めるチャンスである一方、結合特異性を低下させるリスクを有している。特異性に悪影響を与えないためには、スペーサーの相互作用は、非古典的特徴がない場合には維持できないほど弱い必要がある。したがって、スペーサーはできるだけ短いが、ポリメラーゼの結合を可能にし、特にRNAによって形成される分子内二次構造と効果的に競合するのに十分な長さが必要である。
核酸結合分子がない場合のプライマー伸長に対するスペーサーの長さの影響(遊離アダプターの相補体の合成とも言う)を、一般的な構造の複雑さを有する50b RNA配列(配列番号13)を用いて、図23Eに示す。表6に示した50b DNA標的(配列番号15)および18b RNA標的(配列番号24)を並行して試験し、構造の複雑さから生じ得る差異を決定した。すべての標的は、配列ACTGAGTG(配列番号19)の3’DNAスペーサーを示した。標的に対して1倍または5倍過剰に溶液中に適用されたアダプターは、8b、10bまたは12bの相補的スペーサー(表5に示す配列番号25-27および38)を含んだ。一般的なプライマー伸長反応には、10mM Tris pH7.9、2mM MgCl2、100uM dNTP、0.1% Tween-20、1μMの標的、1μMまたは5μMのアダプター、0.25ユニット/μLのKlenowフラグメント(3’→5’エキソ)、および要すれば6%DMSOが含まれる。標準反応条件は、22℃で5分間のプライマー伸長であった。その結果、スペーサーの長さに関係なく、長いRNAはDNAおよび短いRNAに比べて伸長性が低いことが示された。高温(37℃で5分)、DMSOの存在、および高いアダプター濃度(標的より5倍過剰)などの分子内二次構造を不安定にする条件では、長いスペーサーが有利であった(図23F)。この発見は、スペーサーのアクセスはRNAの二次構造によって妨げられ、12bスペーサーでさえも、付加的な手段によって構造が不安定化されない限り、安定なRNAの二次構造には容易に侵入できないことを示唆している。以下の実施例8は、核酸結合分子が介在するとプライマー伸長がより容易になることを示している。ここで、結合ドメインによる抗原認識は、アダプターをRNA標的の直ぐ近くに固定し、アダプターの局所的な高濃度を引き起こし、その結果酵素反応が加速される(“近接効果(proximity effect)”)。
実施例8:免疫沈降RNAへのバーコードトランスファー
本実施例は実施例6の拡張形であり、非標識抗体の代わりにランダムアダプター標識抗体をプロテインGビーズに添加し、プライマー伸長またはライゲーションによって免疫沈降核酸標的へのバーコードトランスファーを誘導した。
本実施例は実施例6の拡張形であり、非標識抗体の代わりにランダムアダプター標識抗体をプロテインGビーズに添加し、プライマー伸長またはライゲーションによって免疫沈降核酸標的へのバーコードトランスファーを誘導した。
プロテインGビーズに、m6A核酸結合分子(8bまたは12bスペーサープライマー伸長アダプター付きAb05)、m5C核酸結合分子(8bスペーサープライマー伸長アダプター付きAb16)またはI核酸結合分子(8bまたは12bスペーサープライマー伸長アダプター付きAb05およびAb10)を個別に添加した。
それぞれのビーズを、2種のRNA標的またはDNA標的の混合物と共にインキュベートした。Ab05およびAb16ビーズを表7に示すm6Aおよびm5C RNA標的(配列番号13および14)と共にインキュベートした。Ab10ビーズをm5CおよびI DNA標的(配列番号15および16)と共にインキュベートした。RNA鎖をビーズに結合させ、リン酸緩衝生理食塩水(PBS)を用いて未結合の核酸を除去するために洗浄した。その後、ビーズをKlenowフラグメントを含むプライマー伸長バッファーに懸濁させた。
得られた産物(すなわち、バーコードにより伸長された標的RNA)を15%TBUゲルで可視化し、産物の長さおよび量を分析した(図24A)。8bスペーサープライマー伸長アダプターを用いたAb16は、m5C RNA標的を正しくバーコード化した。m6A標的のバックグラウンドバーコードは検出されず、反応の特異性が証明された。12bスペーサーのAb05はm6A RNA標的を正しくバーコード化したが、8bスペーサーバージョンはどの標的も沈降できなかった。非標識のAb05はm6A標的を容易に沈降したことから、12bスペーサーのさらなる安定化が結合に必要な程度まで標識が結合親和性を弱めたことが示唆された。Ab10も同じ現象を示した。12bスペーサー版は標的を沈降させたが、8bスペーサー版は沈降させなかった。しかしながら、Ab10は完全に特異性を失い、スペーサー相互作用が抗体の選択性を上回っていた。図24Bは、Ab05の活性およびAb10の特異性が8bスペーサーを用いて回復し、抗体部位を選択的に標識することで結合ドメインの障害を回避できることを示している。まとめると、プライマー伸長反応は抗体を介した形式では高い効率で機能するが、ランダム標識は、12bスペーサーの存在下で、結合親和性を弱め得る(例えば、Ab05)、あるいは特異性に悪影響を与え得る(例えば、Ab10)。実施例7のプライマー伸長は、12bスペーサーがRNA伸長には必要かもしれないことを示唆しているが、このデータセットは、近接効果が反応を加速させ、12bスペーサーは長すぎ、特異性の欠如につながり得ることを明確に示している。したがって、将来の核酸結合分子は、図24Bで示したように、8bスペーサーアダプターで標識され得る。
プライマーライゲーションによるバーコーディングでは、安定化スペーサー相互作用は見られなかった。図24Cは、環状アダプター(配列番号39)で標識されたAb01による、m6A標識RNA標的(配列番号17)のバーコード化を示す。ライゲーションによるバーコーディングおよび配列による解析のためのアダプター配列は、以下の構造を有した:
配列番号57(5Phos=5’リン酸、太字=MBC、NNN=UMI、イタリック体=イルミナアダプター、iSP18=PEGリンカー、3AmMO=3’アミン)。ライゲーション条件は実施例6に記載したものと同じであった。反応収率は、遊離アダプターのライゲーションより約10%高く、やはり近接による加速が証明された。
実施例9:核酸結合分子を1分子間隔で含むビーズの調製
プロテインA/Gダイナビーズに固定化した抗体による核酸標的の沈降がCHIP-Seqの標準的な方法であるが、本実施例で用いるビーズは、複数の利点を提供するためにカスタム化されている:(i)改善された表面不動態化によって偽陽性が回避される(不動態化された表面はビーズへの非特異的結合を回避するので、修飾核酸の結合は実質的に核酸結合分子との相互作用を介する);(ii)ビーズ表面上の核酸結合分子の密度は、例えば図5Bのバーコード化に必要な表面上の分子間の適切な空間的分離を提供するために、調節可能である;(iii)ビーズは、抗体Fc領域以外の他の認識要素の捕捉および/または共移植を容易にするように設計できる;(iv)核酸結合分子は共有結合しており、ワークフロー工程中に共溶出しない;および(v)複数のタイプの核酸結合分子を表面上に存在させることができ、これはいくつかの用途に関連する。
プロテインA/Gダイナビーズに固定化した抗体による核酸標的の沈降がCHIP-Seqの標準的な方法であるが、本実施例で用いるビーズは、複数の利点を提供するためにカスタム化されている:(i)改善された表面不動態化によって偽陽性が回避される(不動態化された表面はビーズへの非特異的結合を回避するので、修飾核酸の結合は実質的に核酸結合分子との相互作用を介する);(ii)ビーズ表面上の核酸結合分子の密度は、例えば図5Bのバーコード化に必要な表面上の分子間の適切な空間的分離を提供するために、調節可能である;(iii)ビーズは、抗体Fc領域以外の他の認識要素の捕捉および/または共移植を容易にするように設計できる;(iv)核酸結合分子は共有結合しており、ワークフロー工程中に共溶出しない;および(v)複数のタイプの核酸結合分子を表面上に存在させることができ、これはいくつかの用途に関連する。
カルボキシル化ダイナビーズ(Thermo)は、アミノ-PEG4-アルコール(Broadpharm、BP-20589)およびMal(マレイミド)-PEG2-アミン(Broadpharm、BP-23313)の二元系混合物で表面コーティングされている。Mal(マレイミド)-PEG2-アミンはシステインで修飾されたスパイキャッチャーを結合させるために用いられ、アミノ-PEG-アルコールは核酸結合分子を空隙化し、非特異的結合に対してビーズ表面を不動態化する。アミノ-PEG4-アルコールとMal-PEG2-アミン(すなわち、不動態化分子:活性化分子)の比率は、約100nm2ごとに1つのスパイキャッチャー分子を固定化するように調整される。これにより、核酸結合分子は空間的に分離され、標的RNAに結合したときに他の分子から隔離されるため、分子内バーコードトランスファーが確実に行われる。
25mMのMES pH5(2-(N-モルホリノ)エタンスルホン酸)でダイナビーズを洗浄した後、100μLのビーズの懸濁液に、25mMのMES pH5で50μLの新鮮なEDC(N-(3-ジメチルアミノプロピル)-N’-エチルカルボジイミド塩酸塩)および50μLのNHS(N-ヒドロキシスクシンイミド)を添加する。室温で30分間反応させる。その後、上清を除去し、ビーズを再度洗浄する。EDC/NHS工程後、ダイナビーズをアミノ-PEG4-アルコールおよびMAL-PEG2-アミンの二元系混合物でコーティングする。マレイミド基は次の工程でスパイキャッチャーに共有結合される。スパイキャッチャーを20mM Tris pH7に溶解させ、システイン基をTCEP(トリス(2-カルボキシエチル)ホスフィン)で還元する。マレイミド活性化ビーズおよびスパイキャッチャータンパク質を混合し、室温で2時間反応させる。ビーズを洗浄した後、スパイタグDNAコンジュゲートおよびスパイキャッチャータンパク質を反応させ、コンジュゲートをqPCRで定量することにより、ビーズあたりのスパイキャッチャータンパク質の数を算出する。スパイキャッチャー装飾ビーズを、実施例4に記載のスパイタグ-バインダー-バーコード結合体と反応させる。
実施例10:捕捉プローブ密度を調整可能な不動態化ビーズの調製
図4Cに記載の標的化核酸修飾分析では、ビーズ上に目的の核酸配列を捕捉し、その後に非古典的特徴をコード化する。コード化複合体の表面密度を精密に制御することで分離させ、隣接する分子間の架橋を防ぐ。以下の方法は、種々の捕捉プローブ密度のビーズの調製について記載する。
図4Cに記載の標的化核酸修飾分析では、ビーズ上に目的の核酸配列を捕捉し、その後に非古典的特徴をコード化する。コード化複合体の表面密度を精密に制御することで分離させ、隣接する分子間の架橋を防ぐ。以下の方法は、種々の捕捉プローブ密度のビーズの調製について記載する。
多孔性NHS活性化セファロースビーズ(Cytiva, カタログ番号17071601)を100%イソプロパノールおよび1mM HClで洗浄した。ビーズを不動態化し化学的機能化するために、0.25M炭酸水素ナトリウム緩衝液pH8、0.5M NaCl、40mM COOH-PEG4-アミン(不動態化分子;Broadpharm、カタログ番号BP-20423)および可変量のmTet(テトラジン)-PEG4-アミン(官能基化分子;Broadpharm,カタログ番号BP-22435)中、室温で16時間インキュベートした。mTet-PEG:カルボキシ-PEG比が1:1,000、1:10,000、1:100,000のビーズを、40μM、400μM、4,000μMのmTet-PEGを用いて調製した。100%カルボキシ-PEGビーズを作製し、バックグラウンドを測定した。DNA捕捉プローブ(CATCTGACGCTGCCGACGATTTTTT/3AmMO/;配列番号20)の3’アミンをNHS-PEG-TCO(trans-cyclooctene)(Broadpharm, カタログ番号BP-22418)で活性化させ、1x PBST(137mM NaCl、2.7mM KCl、10mM Na2HPO4、1.8mM KH2PO4、0.1% Tween(登録商標) 20界面活性剤)中、22℃で16時間、mTetと共に反応させることによりビーズ上に固定した。mTet/TCO対は、生理的条件下で800M-1s-1以上の速度で起こり、ジヒドロピリダジン結合を形成する、よく研究された逆需要型ディールス・アルダー付加環化反応である。
増幅可能なトレーサーオリゴヌクレオチド(TCGTCGGCAGCGTCAGATGATTGTGTTAGGCTAGTAAGTAGATGGATTAGACCGTCGAGTGAGTAGAGTACGTAGTGCA、配列番号21)をビーズ上の捕捉プローブにハイブリダイズさせた後、qPCRにより捕捉プローブ密度を決定した。閾値サイクル(Ct)値は、検量線に基づいて1ビーズあたりのDNA分子数に変換された(図25)。mTet-PEGが10倍増加するごとに、10倍多くのトレーサー・オリゴヌクレオチドを捕捉でき、理論予測と一致した。近傍相互作用を防ぐ距離でコード化複合体を間隔をあけるmTet濃度を実験的に決定した(実施例12参照)。バックグラウンドは低く、mTet不含有ビーズで検出されたDNA鎖の数は、最高密度のビーズで検出された分子の0.1%に相当した。
実施例11:モデル核酸結合ドメインおよびライゲーションを用いた溶液中での近接バーコーディング
ストレプトアビジンおよびビオチンの解離定数は約10-14mol/Lのオーダーであり、自然界で知られている最も強い親和性相互作用の一つであり、修飾RNA塩基に対する抗体の一般的な親和性よりも桁違いに強い。結合ドメインとしてのストレプトアビジンおよびビオチン化ライゲーションアダプターを含む単純な核酸結合分子が設計された。この方法の目的は、非常に高い親和性および特異性を有する結合ドメインを用いて、核酸結合分子のバーコードを、その分子が結合している標的RNAにのみトランスファーすることである。このようなモデル系は、プロセス制御として、また核酸結合分子の親和性が準無限である場合のバーコーディングの上限を探る上で有用である。
ストレプトアビジンおよびビオチンの解離定数は約10-14mol/Lのオーダーであり、自然界で知られている最も強い親和性相互作用の一つであり、修飾RNA塩基に対する抗体の一般的な親和性よりも桁違いに強い。結合ドメインとしてのストレプトアビジンおよびビオチン化ライゲーションアダプターを含む単純な核酸結合分子が設計された。この方法の目的は、非常に高い親和性および特異性を有する結合ドメインを用いて、核酸結合分子のバーコードを、その分子が結合している標的RNAにのみトランスファーすることである。このようなモデル系は、プロセス制御として、また核酸結合分子の親和性が準無限である場合のバーコーディングの上限を探る上で有用である。
ストレプトアビジンおよびビオチンアダプター(配列番号33)を低イオン強度緩衝液(10mM Tris pH7.5、50mM NaCl、1mM EDTA、0.05% Tween-20)中で1:1、1:2、1:3、1:4の比率で混合し、得られた複合体を天然の8% TBEゲルを用いた電気泳動で分析した(図26A)。ストレプトアビジンの4つのビオチン結合ポケットのうち3つは、ビオチンアダプターの濃度を増加させると埋まった。1:2の比率は、非標識ストレプトアビジンが存在せず、ビオチン化RNA標的の結合に利用可能な結合ポケットがあるため、コード化に最適である。
溶液中での近接性コード化を証明するために、ストレプトアビジン核酸結合分子をm6A修飾RNA(オフターゲット;配列番号32)およびビオチンRNA(オンターゲット;配列番号40)の等モル混合物と混合した。RNA鎖は色素標識され、ゲル電気泳動によってオンターゲットおよびオフターゲットのコード化を区別するためにサイズが異なっていた。ライゲーションは、50mM Tris-HCl pH7.5、10mM MgCl2、1mM DTT、0.5mM ATP、400nM 1:2ストレプトアビジン-ビオチン-アダプター結合体、および100nMの各RNA標的を用い、22℃で1時間行った。ライゲーション反応中のPEG-8000濃度は、分子クラウディングによって平均分子間間隔を調節するために0から25%まで変化させた。ライゲーション後、ストレプトアビジンは、ゲル解析を容易にするために、USER(NEB, カタログ番号M5505L)を用いてアダプターをウラシル1個で切断することにより、アダプターから切り離された。分子クラウディングは生体分子が利用できる体積を減少させ、濃度を効果的に増加させた。この結果は、分子間の間隔が大きい低PEG濃度では特異的なバーコード化が予測されるのに対し、高PEG濃度では分子が凝縮され、架橋が誘発されるという理論と一致した(図26B)。本実施例で観察された架橋は、ストレプトアビジン結合体が正しいビオチン-RNAに結合しているにもかかわらず、近接しているが結合していない別のm6A RNAをバーコード化したときに生じた。本実施例は、溶液中でオンターゲットバーコーディングが可能であることを示している。
実施例12:1分子ビーズ上のRNAの配列特異的捕捉によるバーコードトランスファーおよびモデル核酸結合ドメインを用いたバーコード化
この実施例では、ストレプトアビジン由来の同じモデル結合ドメイン、および実施例11に記載したのと同じ実験デザインを用いる。しかしながら、ライゲーション反応は、実施例10に記載したように調製した固定化ビーズ上で行った。ビーズは、mTet:カルボキシ-PEGの比が1:100のセファロースビーズ、またはmTet:カルボキシ-PEGの比が1:1000のセファロースビーズ、の2種類用いた。
この実施例では、ストレプトアビジン由来の同じモデル結合ドメイン、および実施例11に記載したのと同じ実験デザインを用いる。しかしながら、ライゲーション反応は、実施例10に記載したように調製した固定化ビーズ上で行った。ビーズは、mTet:カルボキシ-PEGの比が1:100のセファロースビーズ、またはmTet:カルボキシ-PEGの比が1:1000のセファロースビーズ、の2種類用いた。
各反応は、2,000個の1:100 mTET/カルボキシビーズまたは20,000個の1:1,000 mTET/カルボキシビーズを捕捉DNA(配列番号20)で装飾したものを含む。ビーズをビオチン(配列番号31)およびm6A RNA(配列番号32)の混合物(1.5μM)と共に、0.1% Tween20を含む80μLの5XSSCバッファー中、37℃で1時間インキュベートした。両RNA標的は、ビーズ上の捕捉プローブと相補的な21b領域を示した。ハイブリダイゼーション終了後、200μLの高塩PBST(0.1% Tween20および360mM NaClを含むPBS)で2回、100μLのPBT(0.1% Tween20および360mM NaClを含むPBS)で1回洗浄し、結合していない標的を除去した。ビーズを高塩PBST中でストレプトアビジン-アダプター結合体と共に20分間インキュベートした。過剰量のコンジュゲートを、RNA標的について記載のように洗浄した。ライゲーションおよび分析を実施例11と同様に行った。図26Bは、1:1,000 mTET/カルボキシビーズを用いたビオチン標的の特異的バーコーディング、および1:100 mTET/カルボキシビーズを用いた架橋を示す。この実施例では、架橋は、1:100 mTET/カルボキシビーズの密度が高いほど、RNA標的が表面に密着した結果であった。
実施例13:ライゲーションおよびPCRによって測定されるプライマー伸長を用いる溶液中でのバーコードトランスファー
以下の方法の目的は、核酸結合タンパク質(すなわち、実施例3および4に記載の核酸結合タンパク質)のバーコードを、その分子が結合している標的RNAに排他的にトランスファーさせることである。
以下の方法の目的は、核酸結合タンパク質(すなわち、実施例3および4に記載の核酸結合タンパク質)のバーコードを、その分子が結合している標的RNAに排他的にトランスファーさせることである。
m6Aおよびm5C修飾を有する標的RNA(図18Aおよび18B)およびそれらの同族核酸結合分子を混合し、結合させる。バーコードトランスファー反応は溶液中で行われ、バーコードトランスファー機構はライゲーションまたはプライマー伸長のいずれかである。ライゲーションによるバーコードトランスファーの場合、バーコードは5’末端を介して核酸結合分子(すなわち抗体)の結合ドメインに結合され、バーコードの3’末端はあらかじめアデニル化されている。ライゲーションは、T4 RNAリガーゼIIの添加によって開始される。プライマー伸長によるバーコードトランスファーでは、標的RNAの3’末端に短いスペーサー配列が付加され、バーコードはスペーサーに相補的な領域を含む。スペーサー伸長は、KlenowフラグメントなどのDNAポリメラーゼおよびdNTP(デオキシリボヌクレオチド三リン酸)を用いて、37℃で5分間行う。
バーコードトランスファー効率、およびオフターゲットバーコードは、モデルオリゴヌクレオチド系を用いたPCRによって測定される。正しいバーコードおよび誤ったバーコードの対形成は、図18Aおよび18Bに記載されているように、PCR産物の長さに基づいて決定される。具体的には、バーコードトランスファー反応の完了後、反応産物をPCR増幅し、産物のサイズをゲル電気泳動によって可視化する。予想外のサイズのバンドは、オフターゲットバーコード転移の発生を示す。この反応スキームは、最大のバーコードトランスファー効率および最小のオフターゲット活性のために、アダプターの構造、酵素の選択および反応条件を最適化するために用いられる。
実施例14:RNAの配列特異的捕捉によるバーコードトランスファー
標的RNAそのものをビーズの表面に結合させるときにも、バーコードトランスファーを行うことができる(図4C)。標的RNAは、核酸ハイブリダイゼーションによってビーズ表面に捕捉される(すなわち、ビーズ表面への標的RNAの捕捉は、核酸結合分子による標的RNAの修飾の認識によって変わらない)。核酸ハイブリダイゼーションによる標的捕捉は、目的のゲノムまたはトランスクリプトーム領域の選択的濃縮を可能にする。
標的RNAそのものをビーズの表面に結合させるときにも、バーコードトランスファーを行うことができる(図4C)。標的RNAは、核酸ハイブリダイゼーションによってビーズ表面に捕捉される(すなわち、ビーズ表面への標的RNAの捕捉は、核酸結合分子による標的RNAの修飾の認識によって変わらない)。核酸ハイブリダイゼーションによる標的捕捉は、目的のゲノムまたはトランスクリプトーム領域の選択的濃縮を可能にする。
システイン修飾スパイキャッチャーの代わりに、チオール化DNAオリゴヌクレオチドが固定化されており、このチオール化DNAオリゴヌクレオチドの配列は標的RNAの領域に相補的である。これらの捕捉オリゴヌクレオチドは、分子内バーコード転移反応の特異性を確保するために、ビーズ表面上に100nm2あたり1分子以下で存在する。m6Aおよびm5Cモデルオリゴヌクレオチド(図18Aおよび18B)は、ハイブリダイゼーションバッファー中に捕捉される。洗浄後、m6Aおよびm5Cに結合できる核酸結合分子のプールを加える。次に、実施例6および7に記載のように、ライゲーションまたはプライマー伸長によってバーコード転写反応を行う。バーコード導入効率および特異性をPCRによって測定する。
実施例15:結合ドメイン-シトシンデアミナーゼ結合体の調製および塩基編集の測定
シトシンデアミナーゼは、シトシンのウラシルへの加水分解的脱アミノ化(C-to-U変異)を触媒する。この酵素は遺伝子編集に用いられており、触媒的に不活性なCas9-ガイドRNA複合体への融合によって目的の遺伝子領域に標的化される。この実施例では、シトシンデアミナーゼは結合ドメイン(例えば、抗体結合)によってRNA修飾に標的化された。その目的は、デアミナーゼ活性をRNA修飾に近接した数塩基のウィンドウに制限する結合ドメイン-デアミナーゼ結合体を設計することであった。
シトシンデアミナーゼは、シトシンのウラシルへの加水分解的脱アミノ化(C-to-U変異)を触媒する。この酵素は遺伝子編集に用いられており、触媒的に不活性なCas9-ガイドRNA複合体への融合によって目的の遺伝子領域に標的化される。この実施例では、シトシンデアミナーゼは結合ドメイン(例えば、抗体結合)によってRNA修飾に標的化された。その目的は、デアミナーゼ活性をRNA修飾に近接した数塩基のウィンドウに制限する結合ドメイン-デアミナーゼ結合体を設計することであった。
ほとんどのシトシンデアミナーゼは一本鎖DNAに作用する。APOBEC1およびAPOBEC3Aは、RNA編集活性を有することが知られている唯一の酵素であり、ラットAPOBEC1(Uniprotアクセッション番号P38483)は、触媒的に不活性なCas9-ガイドRNA複合体を介する標的化RNA編集に成功裏に用いられている。ヒトYTHDF2(Uniprotアクセッション番号Q9Y5A9)は、天然のm6Aリーダータンパク質であり、配列によってKD =150-1200nMの範囲の解離定数でm6Aと結合する。m6A標的結合ドメイン-デアミナーゼ結合体を得るために、2つのアプローチを用いた。1つは、APOBEC1をYTHDF2に直接融合させるアプローチであった(Meyer, K. Nature Methods 16, 1275-1280 (2019))。もう1つのアプローチは、スパイタグをAPOBEC1に、スパイキャッチャーをYTHDF2に融合させ、アッセイワークフローの一部として共有結合体を形成するように反応させることであった。
初めに、3つの融合構築物を大腸菌細胞で発現させた:(1)ラットAPOBEC1(aa1~229およびYTHDF2の結合ドメイン(aa385~579)を含むAPOBEC1-YTH-His(図27および配列番号34)、(2)同じAPOBEC1およびスパイタグ002を含むAPOBEC1-スパイタグ-His(図27および配列番号35)、(3)表6に提供されるのと同じYTHDF2フラグメントおよびスパイキャッチャー002(図27および配列番号36)を含むスパイキャッチャー-YTH-His、(4)マルトース結合ドメイン(MBD)、TEVプロテアーゼ切断部位(TEV)、および上記のAPOBEC1およびスパイキャッチャーを含むMBD-TEV-APOBEC1-スパイキャッチャー-His。スパイタグ002およびスパイキャッチャー002は、共有結合ペプチドタグとしてはこれまでに報告された中で最速の反応速度を示すSpyシステムの最新版である。遺伝子はコドン最適化され、合成され、C-末端his-タグを有するフレーム中でpET-30aベクターにクローン化され、BL21細胞で発現された。図28は、15℃で16時間後および37℃で4時間後に同様の誘導を示した。しかしながら、可溶性画分にはスパイキャッチャー-YTH-Hisのみが存在し、APOBEC含有タンパク質はほとんど不溶性であった。APOBECの溶解性の問題を解決するために、MBD-TEV-APOBEC1-スパイキャッチャー-Hisを作製した。このタンパク質は、APOBECの両端に、優れた溶解性で知られるマルトース結合ドメイン(MBD)およびスパイキャッチャーを配したものである。MBDの除去を可能にするためにTEV切断部位を導入した。この構築物は、特に15℃で16時間発現させると可溶性タンパク質を産生した(図28)。核酸との静電的相互作用を破壊するため、細胞を高塩緩衝液で溶解し、ヌクレアーゼ(50mM Tris、500mM NaCl、1mM TCEP、pH 8.0、ヌクレアーゼ(Thermo Fisher, カタログ番号88700)で処理した。MBDまたはNiカラムへの結合はいずれも中程度で、どちらのアフィニティタグも十分にアクセスできないことが示された。溶出した画分をプールし、サイズ排除精製(Superdex 200 カラム)にかけた(図29Aおよび29B)。開発された最初のデアミナーゼ結合体は溶解性に欠けるが、これらのデータは、目的のヌクレオチド修飾に近接してデアミナーゼ活性を制限する適用のための、可溶性タンパク質タグ-デアミナーゼ結合体の作成を証明している。
実施例16:バーコード、cDNA切断および環化によるRNAプロファイリング
この実施例では、標的RNA上の修飾は、核酸結合分子による認識と、それに続くRNA標的へのバーコードの転写によって同定される。修飾の位置は、逆転写の間のcDNAの切断によって明らかにされる(図8)。これは、核酸結合分子の結合ドメインの架橋によって誘導されるか、またはそれに応じて操作された結合ドメインによって誘導される。
この実施例では、標的RNA上の修飾は、核酸結合分子による認識と、それに続くRNA標的へのバーコードの転写によって同定される。修飾の位置は、逆転写の間のcDNAの切断によって明らかにされる(図8)。これは、核酸結合分子の結合ドメインの架橋によって誘導されるか、またはそれに応じて操作された結合ドメインによって誘導される。
Total Human Reference RNA(Thermo社製)を、リボRNAを枯渇させ、マグネシウム(Mg2+)イオンと共に95℃でインキュベートすることにより、平均100~150ヌクレオチドのサイズに断片化する。RNAの3’末端は、T4ポリヌクレオチドキナーゼ(NEB)およびエビアルカリホスファターゼ(NEB)を用いて脱リン酸化する。N6-メチルアデノシン(m6A)、シュードウリジン(Ψ)、5-メチルシトシン(m5C)を含む対照RNAオリゴヌクレオチド、および修飾のない類似オリゴヌクレオチドを陽性対照として既知濃度でRNAサンプルにスパイクする。
RNA修飾m6A、またはm5Cを認識する核酸結合分子を表示するビーズは、実施例4および5に記載の方法を用いて作製される。各ビーズタイプは、単一種の核酸結合分子を表示する。アダプターの設計は図2Bに記載した通りである。ビーズを混合し、結合バッファー中でRNAサンプルと共にインキュベートし、その後0.15 J cm-2 (254nm)のUV光で架橋する。上清には未修飾RNAが含まれるが、修飾RNAはビーズに結合している。
RNA修飾の存在量および化学量論を測定するために、非修飾RNA画分および修飾RNA画分を、分割(split)ワークフローを用いてRNA-Seqライブラリーに変換する(図7参照)。非修飾RNA画分のバーコード化を以下のように行う:タイプBアダプター(図2B)を上清に加え、T4 RNAリガーゼを用いてRNAの3’末端にライゲーションする。アダプターは核酸結合分子には結合しておらず、すべての未修飾RNA鎖は同じアダプターおよびバーコードを受け取る。必要に応じて、RNAはエタノール入りRLTバッファー(Qiagen)中で、Dynabeads(商標) MyOne(商標) 生理食塩水(Thermo Fisher)への物理的吸着を用いてアッセイ工程中に精製される。修飾RNAの場合、バーコードはビーズ固定化核酸結合分子からRNA分子にトランスファーされる。RNA分子は核酸結合分子を介してビーズに結合したままである。この工程後、すべてのプロトコール工程は、非修飾RNAおよび修飾RNAで同一である。ユニバーサルプライマーが添加され、Superscript III(Thermo社)によって伸長され、cDNAは修飾部位で切断される。環状cDNAを形成するために、CircLigase II(Lucigen)と共に60℃でインキュベートすることにより、分子内ライゲーションが開始される。制限酵素でアダプターをUFP領域とURP領域の間で切断した後(図2B)、cDNAを、配列決定アダプターを用いたPCRによってライブラリーに変換する。修飾画分および非修飾画分を配列決定前に合わせ、2000万リードで配列決定する。m6A、Ψ、m5Cのタイプ、数および位置は、以下のように情報提供される。対照オリゴヌクレオチドを、並列ライブラリー調製中の非効率性を考慮するための対照として用いる。
実施例17:バーコーディングおよび塩基編集による修飾プロファイリングを伴う標的捕捉および鎖RNAライブラリー調製
この実施例では、特定のRNA配列がハイブリダイゼーションによって濃縮され、ライブラリー調製中に鎖情報が保持される。単一分子間隔の捕捉プローブを有するビーズを、実施例10に記載したように調製する。各ビーズタイプは、特定のRNA遺伝子座に対する捕捉プローブを表示し、ビーズタイプは、何れかの数のRNA遺伝子座に対応するようにプールされる。
この実施例では、特定のRNA配列がハイブリダイゼーションによって濃縮され、ライブラリー調製中に鎖情報が保持される。単一分子間隔の捕捉プローブを有するビーズを、実施例10に記載したように調製する。各ビーズタイプは、特定のRNA遺伝子座に対する捕捉プローブを表示し、ビーズタイプは、何れかの数のRNA遺伝子座に対応するようにプールされる。
断片化したRNAを、ハイブリダイゼーションバッファー(5×クエン酸生理食塩水(SSC)、40%ホルムアミド、0.1%Tween-20洗剤)中、ビーズプールとともに37℃で16時間インキュベートする。RNA鎖は修飾状態に関係なく捕捉プローブに結合する。10種の修飾に対して核酸結合分子のプールを加える。核酸結合分子は、スパイタグ(配列番号10)を軽鎖のC末端に遺伝子工学的に導入した修飾特異的IgG抗体を含む。修飾の位置標識のために、デアミナーゼ-スパイキャッチャー融合タンパク質を添加し、このタンパク質はスパイタグと迅速に反応し、C-to-U変異で修飾の位置を標識する。タンパク質コンジュゲートを除去した後、遊離アダプターを用いた2回目のライゲーション工程で、RNAの修飾されていない部分をバーコード化する。ある遺伝子座について、修飾化学量論は修飾バーコードの数を全バーコードで割ったものに相当する。その後、第一鎖cDNA合成を標準的方法を用いて行い、第2鎖をdUTPの存在下で合成した。得られたライブラリーをUSER酵素(NEB)で処理して、2本目の鎖を除去し、そうして鎖情報を保存する。その後、DNAシークエンシングにより、RNAサンプル中のすべての部位におけるRNA修飾の位置を同定する。
実施例18:鎖分離、バーコード化および塩基編集によるDNA修飾のプロファイリング
この実施例では、アダプター結合DNAのビーズへの共有結合固定化を用いて、鎖分離の保持を強制し、非古典的特徴の正確な位置をマーキングするための一本鎖特異的シトシンデアミナーゼによる塩基編集を可能にする(図9)。
この実施例では、アダプター結合DNAのビーズへの共有結合固定化を用いて、鎖分離の保持を強制し、非古典的特徴の正確な位置をマーキングするための一本鎖特異的シトシンデアミナーゼによる塩基編集を可能にする(図9)。
DNAサンプルは、せん断力または当業者に知られている他の一般的な方法を用いて断片化される。DNA鎖の末端修復およびA-テイリングの後、Y字型アダプターが両末端にライゲーションされる。これらのアダプターは、合成オリゴヌクレオチドの広く利用されている修飾である3’-アジド修飾を特徴とする。二重鎖DNAの変性(鎖分離)に適した条件下(例えば、エタノールやアセトニトリルのような極性有機溶媒中、あるいはホルムアミドの95%水溶液中)で、クリック反応を用いて一本鎖DNAを基質に一分子間隔で共有結合させる。このクリック反応は、Cu(I)触媒によるアジド-DNAと低密度の表面結合アルキンとの間のアジド-アルキン環化付加反応、歪み促進アジド-アルキン環化付加反応、またはこのハウステン化学の他の変形であり得る。
固定化後、変性条件を除去し(例えば、溶媒交換または溶媒蒸発によって)、そのバーコードに連結された核酸結合分子とともに緩衝水溶液を導入する。その後、非古典的特徴を特異的に認識することによって決定されるように、T4 DNAリガーゼによって触媒されるスプリントDNAライゲーションによって、バーコードトランスファーが行われる。
バーコードトランスファーの完了後、シトシンデアミナーゼと結合した二次抗体を導入し、非古典的特徴の部位に近接してC-to-U塩基編集を行う。塩基編集後、DNA鎖はUSER切断を用いて基質から切断される。次にプライマーが導入されアダプターに結合し、DNAポリメラーゼがウラシルの部位で切断されたcDNA合成に用いられる。ライブラリー調製およびDNA配列決定により、DNAサンプル中のすべての部位における非古典的特徴の位置が同定される。
実施例19:2サイクルのRNA修飾プロファイリングおよび塩基編集を伴うDNAライブラリー調製
この実施例では、複数の修飾およびその発生が、同じRNA標的鎖上で検出される。これは、核酸結合分子による修飾認識と、それに続くプライマー伸長によるバーコード転写の2ラウンドによって達成される(図14Aおよび14Bに示される)。各プライマー伸長後、同じタイプの複数の修飾の存在が塩基編集によって記録される。
この実施例では、複数の修飾およびその発生が、同じRNA標的鎖上で検出される。これは、核酸結合分子による修飾認識と、それに続くプライマー伸長によるバーコード転写の2ラウンドによって達成される(図14Aおよび14Bに示される)。各プライマー伸長後、同じタイプの複数の修飾の存在が塩基編集によって記録される。
編集サイクルを区別するために、最初のサイクルではアデノシンデアミナーゼによる塩基編集(A-to-I変異)が行われ、2番目のcyRNAは化学的に平均200-300bpのサイズに断片化される。プライマー伸長によるバーコード導入を可能にするため、短い8塩基のスペーサーがRNAの3’末端にライゲーションされる。このスペーサーは、入ってくるバーコードおよびユニバーサルプライマーのハイブリダイゼーション部位として機能する。ライゲーションされたRNA断片は、1種のビーズを用いて免疫沈降され、約2時間結合させる。ビーズを洗浄した後、KlenowフラグメントおよびdNTPを用いて、37℃で約5分間インキュベートすることにより、バーコードトランスファーを行う。この工程で、DNA標的が結合しているビーズのタイプをマークする。
修飾の位置は、修飾部位の近くにAからIへの変異を導入することによってコードされる。この目的のために、二次抗体-アデノシンデアミナーゼ結合体を添加し、反応させる。
編集が完了したら、RNAを溶出し、第2のビーズタイプで免疫沈降させる。バーコードトランスファーおよび塩基編集を繰り返すが、今回はCからUへの変異を導入したシトシンデアミナーゼで塩基編集が行われる。2回目のサイクルで転写されるバーコードには、DNA標的を増幅可能にするためのユニバーサルプライマーキャップが含まれている。ウラシル修飾を許容するDNAポリメラーゼを用いたアダプターPCRにより、塩基配列決定のためのライブラリーが作製される。
実施例20:インビトロ翻訳および機能試験のためのAPOBEC-スパイキャッチャー融合タンパク質の設計
この実施例では、標的化脱アミノ化のために設計された脱アミナーゼ酵素の発現に、無細胞のインビトロ翻訳系を用いる。大腸菌でのAPOBEC1の発現で観察された溶解性およびタンパク質のフォールディングの問題は、APOBECのDNA編集活性が宿主細胞のゲノムを損傷するため、細胞毒性に起因すると考えられる。インビトロ翻訳系は、毒性があり発現が困難なタンパク質によく用いられる。図30は、XTENリンカーを介してスパイキャッチャーに融合したAPOBEC1およびAPOBEC3A(E109A)のアミノ酸配列を示す(それぞれ配列番号42および43)。実施例15で用いた遺伝子とは対照的に、親和性精製のためのhisタグおよび不要なGSリンカーは、酵素の構造的障害を最小限にするために省略した。APOBEC1融合タンパク質については、T7プロモーター領域を有するプライマーを用いて、配列番号37を発現するプラスミドから遺伝子をPCR増幅した。APOBEC3A酵素は、APOBEC3A(E109A)配列(IDT)を有するgblockにクローニングすることにより、同じプラスミドから構築した。両酵素は、PURExpress(登録商標) インビトロタンパク質合成キット(New England Biolabs)を用いて、スパイキャッチャー融合を用いて発現させた。各PCR増幅遺伝子500ngをインプットとして、製造業者のプロトコールに従って反応を組み立てた。37℃で5時間、タンパク質を発現させた。
この実施例では、標的化脱アミノ化のために設計された脱アミナーゼ酵素の発現に、無細胞のインビトロ翻訳系を用いる。大腸菌でのAPOBEC1の発現で観察された溶解性およびタンパク質のフォールディングの問題は、APOBECのDNA編集活性が宿主細胞のゲノムを損傷するため、細胞毒性に起因すると考えられる。インビトロ翻訳系は、毒性があり発現が困難なタンパク質によく用いられる。図30は、XTENリンカーを介してスパイキャッチャーに融合したAPOBEC1およびAPOBEC3A(E109A)のアミノ酸配列を示す(それぞれ配列番号42および43)。実施例15で用いた遺伝子とは対照的に、親和性精製のためのhisタグおよび不要なGSリンカーは、酵素の構造的障害を最小限にするために省略した。APOBEC1融合タンパク質については、T7プロモーター領域を有するプライマーを用いて、配列番号37を発現するプラスミドから遺伝子をPCR増幅した。APOBEC3A酵素は、APOBEC3A(E109A)配列(IDT)を有するgblockにクローニングすることにより、同じプラスミドから構築した。両酵素は、PURExpress(登録商標) インビトロタンパク質合成キット(New England Biolabs)を用いて、スパイキャッチャー融合を用いて発現させた。各PCR増幅遺伝子500ngをインプットとして、製造業者のプロトコールに従って反応を組み立てた。37℃で5時間、タンパク質を発現させた。
酵素活性は、FAMで標識したDNAオリゴヌクレオチドに、目的の酵素を含む未精製の無細胞抽出物を加えて測定した。シチジンデアミナーゼ活性はCをUに変換し、次いでUSER酵素(NEB)によって切断された。図31は、37℃で30分間インキュベートした後、無細胞抽出液の濃度を下げながら観察された切断産物を示す。最も濃縮された反応は、10μLの反応液(100nM FAM-DNA、10mM ビス-トリス-プロパン-HCl pH7、10mM MgCl2、100μg/mL BSA)中に1.25μLの無細胞抽出物を含んだ。無細胞抽出液をさらに1:2、1:4、1:8、1:16に希釈した。APOBEC1Aは弱い脱アミノ化活性を示し、これはスパイキャッチャータンパク質存在下で増強された。比較すると、APOBEC3AはAPOBEC1Aよりも少なくとも10倍活性が高かったが、スパイキャッチャー融合体を添加すると、穏やかに阻害された。
これらの結果は、触媒的に活性なAPOBEC1およびAPOBEC3A融合酵素をインビトロ翻訳系で発現させることが可能であることを確認するものである。
実施例21:APOBEC-スパイキャッチャー融合タンパク質による標的化脱アミノ化
この実施例は、APOBEC-スパイキャッチャー融合タンパク質が、スパイキャッチャーおよびスパイタグの相互作用を介してDNA鎖の特定の部位に標的化できることを示す。共有結合性のスパイキャッチャー/スパイタグ反応により、デアミナーゼ活性が付着部位近傍の領域に限定される。
この実施例は、APOBEC-スパイキャッチャー融合タンパク質が、スパイキャッチャーおよびスパイタグの相互作用を介してDNA鎖の特定の部位に標的化できることを示す。共有結合性のスパイキャッチャー/スパイタグ反応により、デアミナーゼ活性が付着部位近傍の領域に限定される。
図32は、デアミナーゼ活性ウィンドウのサイズを測定するために用いた被毒プライマーアッセイ(PPA)を記載する。複数のCを一定の間隔で含むDNAまたはRNA鋳型を、FAM標識プライマーとハイブリダイズさせた。プライマーの伸長は、DNA鋳型をデアミナーゼで処理した後、dCTP、dTTP、dGTPおよびddATPとDNAポリメラーゼ(DNA鋳型の場合はKlenowフラグメント)または逆転写酵素(RNA鋳型の場合はM-MLV)の存在下で行った。C-to-U編集の存在はddATPの取り込みを促し、プライマーの終結を引き起こした。伸長産物のサイズ分布を変性ゲル電気泳動で分析し、塩基編集部位を特定した。
最初に、PPAアッセイを市販のAPOBEC3A(New England Biolabs)を用いて試験した。図33は、APOBEC3AがDNA鋳型(UおよびC鋳型は、それぞれ配列番号44および45である)上では高活性であったが、RNA(UおよびC鋳型は、それぞれ配列番号46および47である)上では弱活性を有していたことを示す。従って、この酵素は、DNA中の非古典的特徴の位置をマークするのに適した候補である。
デアミナーゼを図6Cに示すような非古典的特徴に標的化する能力を試験するために、簡略化したモデル系を用いた(図34)。スパイタグ標識結合ドメインを用いるのではなく、スパイタグペプチドをDNA鎖(例えば配列番号50)にチミン位置で直接結合させた。スパイタグペプチドは、チミンにおける最初のC(配列番号48)から26b離れた遠位側、またはチミンにおける最初のC(配列番号49)から2b離れた近位側に結合した。
図35は、APOBEC3A融合タンパク質を用いて実施した標的化脱アミノ化アッセイの結果を示す。100nMのDNA鋳型(スパイタグ有無下)を、脱アミノ化バッファー(10mM ビス-トリス-プロパン-HCl pH7、10mM MgCl2、100μg/mL BSA)中、42μLの総反応容量中で、APOBEC3AおよびAPOBEC3A-スパイキャッチャーを含む7.6μLの無細胞抽出物と共にインキュベートした。1分、3分、8分、15分後に8μLの時間点を採取し、脱アミナーゼを直ちに95℃で熱失活させた。Klenow DNAポリメラーゼミックス1μLを反応液に加え、終濃度10μM dTTP、10μM dCTP、10μM dGTP、200μM ddATPおよび0.2ユニット/μLのKlenow DNAポリメラーゼexo(-)を得た。PPA反応を37℃で10分間進行させ、変性ゲル電気泳動で分析した。FAM標識プライマー(配列番号51)を用いて、編集の位置を特定した。
図35は、スパイキャッチャーを融合したAPOBEC3Aと融合していないAPOBEC3Aで観察されたゲルバンディングパターンの明確な違いを示している。スパイキャッチャーおよびスパイタグがない場合、様々な大きさの編集された(停止した)バンドによって示されるように、7つのCのそれぞれが等しく編集されている。両者の存在下では、プライマー+2および+7のバンドのみが時間とともに蓄積し、酵素の到達範囲が狭いことを示している。これらの失敗に終わった生成物の蓄積は、スパイタグが近位に付着している場合により顕著であった。
この実施例は、スパイタグ/スパイキャッチャーを介してAPOBEC3Aを反応部位に繋ぎ止めることにより、部位特異的脱アミノ化を強制した最初の例を示す。
実施例22:DNA/RNAヘテロ二重鎖の2プレックス標的タグメンテーション
この実施例では、RNA修飾特異的バーコーディングは、標的化タグメンテーションによって促進される。これは、タグメンテーションが可能なモザイクエンド(ME)アダプターをRNA特異的抗体に結合させることにより達成される。抗体をRNA修飾に結合させた後、Tn5トランスポザーゼを抗体結合MEアダプターにロードすることにより、活性トランスポソームがインサイチュウで組み立てられる。これにより、トランスポザーゼが修飾部位に標的化され、部位特異的タグメンテーションが可能になり、修飾部位に隣接してバーコード化されたアダプターが挿入される。
この実施例では、RNA修飾特異的バーコーディングは、標的化タグメンテーションによって促進される。これは、タグメンテーションが可能なモザイクエンド(ME)アダプターをRNA特異的抗体に結合させることにより達成される。抗体をRNA修飾に結合させた後、Tn5トランスポザーゼを抗体結合MEアダプターにロードすることにより、活性トランスポソームがインサイチュウで組み立てられる。これにより、トランスポザーゼが修飾部位に標的化され、部位特異的タグメンテーションが可能になり、修飾部位に隣接してバーコード化されたアダプターが挿入される。
m6A特異的抗体を2つのバーコード化i5-ME配列(i5-ME-BC1)で修飾し、m5C特異的抗体をサイトクリックケミストリーを用いて他の2つのi5-ME配列(i5-ME-BC2)に結合させる(実施例4)。改変対照RNA鋳型は、プラスミドDNAをT7 RNAポリメラーゼでインビトロ転写することにより作製する。PhiXゲノムの2000bpのPCRアンプリコン(NEB, カタログ番号N3023S)をm6A三リン酸存在下で転写し、M13mp18一本鎖DNAの2000bpのPCRアンプリコン(NEB, カタログ番号N4040S)をm5C三リン酸存在下で転写する。両配列は配列特異的ハイブリダイゼーションプローブを介して磁気ビーズ上に捕捉される(図36、工程A)。捕捉されたRNAは、SuperScript IIリバーストランスクリプターゼのためのプライマーとして捕捉プローブを用いて逆転写される(図36、工程B)。固定化されたRNA/DNA二重鎖に個別または異なるバーコード化i5-ME-抗体結合体のプールを添加し、飽和結合に達するまでインキュベートする(図36、工程C)。次に、機能的トランスポソームがインサイチュウで組み立てられる:最初の工程では、表面に結合したi5-ME-抗体結合体に遊離のTn5およびME’オリゴを加えることにより、抗体結合i5-Tn5モノマーが生成される(図36、工程D)。Tn5は、今、二本鎖となったi5-ME/ME’アダプターに結合する。第2の工程では、i7-ME/ME’アダプターをあらかじめ付加したTn5が付加され、i5-/i7-Tn5二量体が生じる(図36、工程E)。トランスポソームのアセンブリー後、MgCl2含有バッファーを添加することによりタグメンテーションが開始され(図36、工程F)、図15A-15Dに示すように、バーコード化されたアダプターを有する生成物が形成される。タグメンテーションによりRNA/DNA断片がビーズから放出され、上清のサイズプロファイルがPCRの前後でキャピラリー電気泳動により分析される。得られたリードの配列決定およびPhiXまたはM13ゲノムへのアラインメントにより、M13リードにはm5C特異的バーコードが、PhiXリードにはm6A特異的バーコードが正しく割り当てられていることが確認された。このように、このプロセスでは、標的化タグメンテーションによって、1回の反応で1以上のRNA修飾を検出することができる。
種々の態様
添付の特許請求の範囲にかかわらず、以下の番号付けされた態様も本発明の一部を構成する。
1.i)結合ドメイン、および
ii)アダプター、
を含む核酸結合分子であって、前記結合ドメインは、DNAまたはRNAの非古典的特徴に特異的に結合し、前記アダプターは、結合ドメインによって特異的に結合される非古典的特徴に特有の核酸バーコード配列を含む、核酸結合分子
2.結合ドメインが、抗体、ナノボディ、アプタマー、リーダータンパク質、ライタータンパク質、イレイサータンパク質、人工高分子スキャフォールド、人工タンパク質スキャフォールド、または選択的共有結合キャプチャー試薬、またはそれらのフラグメントもしくは誘導体を含む、態様1に記載の核酸結合分子。
3.リーダータンパク質が、NUDT16またはYTHDC2、またはそれらのフラグメントもしくは誘導体である、態様2に記載の核酸結合分子。
4.ライタータンパク質が、DNTM1、DNTM3A/B、NAT10、METTL3、METTL8、METTL14、METTL16、TRM、BMT、DUS2、PUS、またはNSUN2、またはそれらのフラグメントもしくは誘導体である、態様2に記載の核酸結合分子。
5.イレイサータンパク質が、FTO、ALKBH3またはALKBH5、またはそれらのフラグメントもしくは誘導体である、態様2に記載の核酸結合分子。
6.結合ドメインが触媒活性を有さない、態様2に記載の核酸結合分子。
7.アダプターが切断可能である、態様1~6のいずれか1つに記載の核酸結合分子。
8.アダプターが、ユニバーサルフォワードプライマー(UFP)およびユニバーサルリバースプライマー(URP)の少なくとも1つを含む、態様1~7のいずれか1つに記載の核酸結合分子。
9.アダプターがユニーク分子識別子(UMI)を含む、態様1~8のいずれか1つに記載の核酸結合分子。
10.非古典的特徴が修飾ヌクレオシドである、態様1~9のいずれか1つに記載の核酸結合分子。
11.修飾ヌクレオシドが、3-メチルシチジン(m3C)、5-メチルシチジン(m5C)、N4-アセチルシチジン(ac4C)、シュードウリジン(Ψ)、1-メチルアデノシン(m1A)、N6-メチルアデノシン(m6A)、イノシン(I)、7-メチルグアノシン(m7G)、ジヒドロウリジン(D)、3-メチルウリジン(m3U)、5-メチルウリジン(m5U)、1-メチルグアノシン(m1G)、N2-メチルグアノシン(m2G)、5-メチルデオキシシチジン(m5dC)、N4-メチルデオキシシチジン、5-ヒドロキシメチルシチジン(5-hmC)、5-ヒドロキシメチルデオキシシチジン(5hmdC)、5-カルボキシデオキシシチジン(5cadC)、5-ホルミルシチジン(5fC)、5-ホルミルデオキシシチジン(5fdC)、6-メチルデオキシアデノシン、N7-メチルグアノシン(m7G)、2,7,2’-メチルグアノシン、またはリボースメチル化(Nm)である、態様10に記載の核酸結合分子。
12.非古典的特徴が核酸損傷である、態様1~9のいずれか1つ記載の核酸結合分子。
13.核酸損傷が、酸化プロセスまたは紫外線との接触に起因するものである、態様12に記載の方法。
14.核酸損傷が、外因性薬剤による大きい付加体形成または塩基アルキル化に起因する、態様12に記載の方法。
15.損傷が、8-オキソグアニン(8-oxoG)、1以上の脱塩基部位、シス-プラチン架橋、ベンゾ(a)ピレンジオールエポキシド(BPDE)付加体、シクロブテンピリミジン二量体(CPD)、ピリミジン-ピリミドン(6-4)光生成物(6-4PP)、6-O-メチルグアニン(O6-MedG)、またはO6-(カルボキシメチル)-2’-デオキシグアノシン(O6-CMdG)である、請求項12に記載の核酸結合分子。
16.非古典的特徴が構造的要素である、態様1~9のいずれか1つに記載の核酸結合分子。
17.構造的要素が、ヘアピン、ループ、Z-DNA構造、G-四重鎖、i-モチーフ、バルジ、三重鎖、三叉結合、十字形構造、四重鎖、リボースジッパー、またはシュードノットである、態様16に記載の核酸結合分子。
18.結合ドメインが、少なくとも1つの修飾ヌクレオシドと接触している、態様1~17のいずれか1つに記載の核酸結合分子。
19.結合ドメインが、修飾ヌクレオシドおよびそれに隣接する1以上のヌクレオチドと接触している、態様1~18のいずれか1つに記載の核酸結合分子。
20.アダプターがリンカーを含み、結合ドメインがリンカーに結合している、態様1~19のいずれか1つに記載の核酸結合分子。
21.核酸結合分子が、酵素またはその触媒フラグメントもしくは誘導体をさらに含む、態様1~20のいずれか1つに記載の核酸結合分子。
22.酵素が塩基編集酵素である、態様21に記載の核酸結合分子。
23.塩基編集酵素がシトシンデアミナーゼまたはアデノシンデアミナーゼである、態様22に記載の核酸結合分子。
24.塩基編集酵素において、APOBEC1もしくはAPOBEC3A、またはそれらの触媒フラグメントもしくは誘導体である、態様23に記載の核酸結合分子。
25.酵素が、DNAもしくはRNAメチラーゼ、またはシュードウリジン合成酵素、またはそれらの触媒フラグメントもしくは誘導体である、態様23に記載の核酸結合分子。
26.酵素がDNA N-グリコシラーゼまたはRNA N-グリコシラーゼである、態様21に記載の核酸結合分子。
27.酵素がトランスポザーゼまたはインテグラーゼである、態様21に記載の核酸結合分子。
28.酵素が触媒活性を欠く、態様21に記載の核酸結合分子。
29.結合ドメインおよび酵素またはそのフラグメントを含むコンジュゲートであって、結合ドメインが態様1~28のいずれか1つに記載の核酸結合分子に結合する、コンジュゲート。
30.結合ドメインとそのフラグメントの酵素とが共有結合している、態様29に記載のコンジュゲート。
31.結合ドメインおよび酵素またはそのフラグメントが非共有結合している、態様29に記載のコンジュゲート。
32.酵素がTn5トランスポザーゼである、態様29~31のいずれか1つに記載のコンジュゲート。
33.タグメンターゼ(tagmentase)がプロテインA、G、またはLと融合している、態様32に記載のコンジュゲート。
34.i)ペプチドタグをさらに含む、態様1~28のいずれか1つに記載の核酸結合分子、および(ii)ペプチドタグと共有結合的に反応し得るタンパク質タグに融合した酵素またはそのフラグメント、を含むコンジュゲート。
35.i)タンパク質タグをさらに含む、態様1~28のいずれか1つに記載の核酸結合分子、および(ii)タンパク質タグと共有結合的に反応し得るペプチドタグに融合した酵素またはそのフラグメント、を含むコンジュゲート。
36.ペプチドタグがSpytagである、態様34~35のいずれか一項に記載のコンジュゲート。
37.酵素がデアミナーゼであり、スパイキャッチャータンパク質に融合される、態様34~36のいずれか1つに記載のコンジュゲート。
38.i)態様1~28のいずれか1つに記載の核酸結合分子と、(ii)結合ドメインの特定の領域に高親和性で結合し得るタンパク質に融合した酵素またはそのフラグメントとを含むコンジュゲート。
39.結合ドメインがIgG抗体またはそのフラグメントである、態様38に記載のコンジュゲート。
40.酵素が、プロテインA、GまたはLに融合したデアミナーゼである、態様39に記載のコンジュゲート。
41.i)核酸タグをさらに含む、態様1~28のいずれか1つに記載の核酸結合分子、および(ii)核酸結合分子の核酸タグにハイブリダイズし得る相補的核酸タグに融合した酵素またはそのフラグメント、を含むコンジュゲート。
42.標的核酸に結合した、態様1~28のいずれか1つに記載の核酸結合分子を含む複合体。
43.核酸結合分子および標的核酸が共有結合している、態様42に記載の複合体。
44.態様1~28のいずれか1つに記載の核酸結合分子に結合した基質。
45.基質が、ビーズ、チップ、プレート、スライド、ディッシュ、または3次元マトリックスである、態様44に記載の基質。
46.核酸結合分子が基質の表面に結合している、態様45に記載の基質。
47.核酸結合分子が、捕捉分子を介して間接的に基質の表面に結合され、前記捕捉分子が基質に直接結合される、態様46に記載の基質。
48.捕捉分子が核酸結合分子を結合する、態様47に記載の基質。
49.捕捉分子が標的核酸と結合している、態様47に記載の基質。
50.核酸結合分子が、捕捉分子に結合している標的核酸に結合する、態様47に記載の基質。
51.核酸結合分子が、基質の表面上で第2の核酸結合分子から空間的に分離されている、態様44~50のいずれか1つに記載の基質。
52.態様1~28のいずれか1つに記載の核酸結合分子に結合したポリマー。
53.態様1~28のいずれか1つに記載の核酸結合分子の製造方法であって、結合ドメインをアダプターにカップリングさせて、結合ドメイン-アダプターコンジュゲートを形成することを含む、製造方法。
54.複数の標的核酸を分析する方法であって、
(i)標的核酸を、態様1~28のいずれか1つに記載の核酸結合分子と接触させる工程;
(ii)(a)バーコード化核酸のオフターゲット生成を実質的に阻止する環境下で、核酸バーコードを標的核酸に転写してバーコード化標的核酸を生成するか、または(b)標的核酸のバーコード化コピーを生成する工程;
(iii)非古典的特徴の位置がバーコード化標的核酸またはそのバーコード化コピーの一次核酸配列に基づいて識別可能であるように、バーコード化標的核酸またはそのバーコード化コピーを改変する工程;および
(iv)バーコード化標的核酸の塩基配列を決定する工程
を含む、分析方法。
55.バーコード転写を容易にするために、工程(i)の前に、標的核酸の3’末端に短い核酸配列を付加することを含む、態様54に記載の方法。
56.工程(i)~(iii)を少なくとも1回繰り返す、態様54に記載の方法。
57.工程(i)~(iii)を繰り返すたびに、異なる核酸結合分子を使用する、態様56に記載の方法。
58.工程(i)~(iii)を繰り返すたびに、同じ核酸結合分子を使用する、態様56に記載の方法。
59.核酸バーコードが、一本鎖ライゲーション、スプリントライゲーション、プライマー伸長、または二本鎖ライゲーションによって酵素的に標的核酸にトランスファーされる、態様21に記載の方法。
60.核酸バーコードが、プライマー伸長によって標的核酸にトランスファーされ、ここで、プライマー伸長が、標的核酸の3’末端へのユニバーサル配列を有する核酸のライゲーションによって始まる、態様59に記載の方法。
61.核酸バーコードが、プライマー伸長によって標的RNAにトランスファーされ、ここで、プライマー伸長が、1種のリボヌクレオチドおよび競合する相補的なポリ-dT、ポリ-dA、ポリ-dG、またはポリ-dCオリゴヌクレオチドと組み合わせて、大腸菌ポリ(A)ポリメラーゼまたはシゾサッカロマイセス・ポンビーCid1のポリ(U)ポリメラーゼを用いて、標的核酸の3’末端を酵素的にテイル付加することによって始まる、態様60に記載の方法。
62.配列決定前に、バーコード化標的核酸またはそのコピーを増幅することを含む、態様54~61のいずれか1つに記載の方法。
63.標的核酸が、DNA、RNA、またはそれらの混合物を含む、態様54~61のいずれか1つに記載の方法。
64.標的核酸が少なくとも1つの非古典的特徴を含む、態様54~63のいずれか1つに記載の方法。
65.非古典的特徴が修飾ヌクレオシドである、態様64に記載の方法。
66.修飾ヌクレオシドが、3-メチルシチジン(m3C)、5-メチルシチジン(m5C)、N4-アセチルシチジン(ac4C)、シュードウリジン(Ψ)、1-メチルアデノシン(m1A)、N6-メチルアデノシン(m6A)、イノシン(I)、7-メチルグアノシン(m7G)、ジヒドロウリジン(D)、3-メチルウリジン(m3U)、5-メチルウリジン(m5U)、1-メチルグアノシン(m1G)、N2-メチルグアノシン(m2G)、5-メチルデオキシシチジン(m5dC)、N4-メチルデオキシシチジン、5-ヒドロキシメチルシチジン(5-hmC)、5-ヒドロキシメチルデオキシシチジン(5hmdC)、5-カルボキシデオキシシチジン(5cadC)、5-ホルミルシチジン(5fC)、5-ホルミルデオキシシチジン(5fdC)、6-メチルデオキシアデノシン、N7-メチルグアノシン(m7G)、2,7,2’-メチルグアノシン、またはリボースメチル化(Nm)である、態様61に記載の方法。
67.非古典的特徴が核酸損傷である、態様64に記載の方法。
68.核酸損傷が、酸化プロセスまたは紫外線との接触に起因する、態様67に記載の方法。
69.核酸損傷が、外因性薬剤による大きい付加体形成または塩基アルキル化に起因する、態様67に記載の方法。
70.損傷が、8-オキソグアニン(8-oxoG)、1以上の脱塩基部位、シス-プラチン架橋、ベンゾ(a)ピレンジオールエポキシド(BPDE)付加体、シクロブテンピリミジン二量体(CPD)、ピリミジン-ピリミドン(6-4)光生成物(6-4PP)、6-O-メチルグアニン(O6-MedG)、またはO6-(カルボキシメチル)-2’-デオキシグアノシン(O6-CMdG)である、態様64に記載の核酸結合分子。
71.非古典的特徴が構造的要素である、態様64に記載の方法。
72.構造的要素が、ヘアピン、ループ、Z-DNA構造、G-四重鎖、i-モチーフ、バルジ、三重鎖、三叉結合、十字形構造、テトラループ、リボースジッパー、またはシュードノットである、態様71に記載の方法。
73.核酸結合分子が基質の表面に結合され、他の核酸結合分子から空間的に分離され、各標的核酸が1つの標的核酸結合分子としか接触できないようにする、態様54~72のいずれか1つに記載の方法。
74.核酸バーコードが、該バーコードまたはその相補体を標的核酸の5’末端または3’末端に共有結合させることによって標的核酸にトランスファーされる、態様54~73のいずれか一項に記載の方法。
75.核酸バーコードが、一本鎖ライゲーション、スプリントライゲーション、プライマー伸長、または二本鎖ライゲーションによって酵素的に標的核酸にトランスファーされる、態様54~73のいずれか1つに記載の方法。
76.核酸バーコードが、化学ライゲーションによって標的核酸にトランスファーされる、態様54~73のいずれか1つに記載の方法。
77.修飾が、核酸結合分子を標的核酸に光化学的または化学的に連結することを含む、態様54~76のいずれか1つに記載の方法。
78.結合ドメインが、核酸標的との共有結合反応を促進する配向で化学架橋部分を提示する、態様54~77のいずれか1つに記載の方法。
79.修飾が、核酸結合分子が標的核酸に結合する部位またはその近傍の塩基を編集することを含む、態様54~77のいずれか一項に記載の方法。
80.複数の標的核酸中の2以上の非古典的特徴を検出する方法および/または定量する方法であって、
(i)標的核酸を少なくとも2つの核酸結合分子と接触させる工程であって、各核酸結合分子は結合ドメインおよびアダプターを含み、各核酸結合分子の結合ドメインがDNAまたはRNAの異なる非古典的特徴に結合し、アダプターは各結合ドメインによって特異的に結合される非古典的特徴に特異的な核酸バーコード配列を含む、工程;
(ii)(a)バーコード化核酸のオフターゲット生成を実質的に防止する環境下で、核酸バーコードを標的核酸にトランスファーしてバーコード化標的核酸を生成するか、または(b)標的核酸のバーコード化コピーを生成する、工程;
(iii)非古典的特徴の位置がバーコード化標的核酸またはそのバーコード化コピーの一次核酸配列に基づいて同定可能であるように、バーコード化標的核酸またはそのバーコード化コピーを改変する工程;および
(vi)バーコード化された標的核酸の塩基配列を決定する工程
を含む、方法。
81.配列決定の前に、バーコード化標的核酸またはそのコピーを増幅することを含む、態様80に記載の方法。
82.標的核酸が、DNA、RNA、またはそれらの混合物を含む、態様80または81に記載の方法。
83.非古典的特徴の少なくとも1つが修飾ヌクレオシドである、態様80~82のいずれか1つに記載の方法。
84.修飾ヌクレオシドが、3-メチルシチジン(m3C)、5-メチルシチジン(m5C)、N4-アセチルシチジン(ac4C)、シュードウリジン(Ψ)、1-メチルアデノシン(m1A)、N6-メチルアデノシン(m6A)、イノシン(I)、7-メチルグアノシン(m7G)、ジヒドロウリジン(D)、3-メチルウリジン(m3U)、5-メチルウリジン(m5U)、1-メチルグアノシン(m1G)、N2-メチルグアノシン(m2G)、5-メチルデオキシシチジン(m5dC)、N4-メチルデオキシシチジン、5-ヒドロキシメチルシチジン(5-hmC)、5-ヒドロキシメチルデオキシシチジン(5hmdC)、5-カルボキシデオキシシチジン(5cadC)、5-ホルミルシチジン(5fC)、5-ホルミルデオキシシチジン(5fdC)、6-メチルデオキシアデノシン、N7-メチルグアノシン(m7G)、2,7,2’-メチルグアノシン、またはリボースメチル化(Nm)である、態様83に記載の方法。
85.非古典的特徴が核酸損傷である、態様82に記載の方法。
86.核酸損傷が、酸化プロセスまたは紫外線との接触に起因する、態様85に記載の方法。
87.核酸損傷が、外因性薬剤による大きい付加体形成または塩基アルキル化に起因する、態様85に記載の方法。
88.損傷が、8-オキソグアニン(8-oxoG)、1以上の脱塩基部位、シス-プラチン架橋、ベンゾ(a)ピレンジオールエポキシド(BPDE)付加体、シクロブテンピリミジン二量体(CPD)、ピリミジン-ピリミドン(6-4)光生成物(6-4PP)、6-O-メチルグアニン(O6-MedG)、またはO6-(カルボキシメチル)-2’-デオキシグアノシン(O6-CMdG)である、態様82に記載の核酸結合分子。
89.非古典的特徴の少なくとも1つが構造的要素である、態様80~82のいずれか1つに記載の方法。
90.構造的要素が、ヘアピン、ループ、Z-DNA構造、G-四重鎖、i-モチーフ、バルジ、三重鎖、三叉結合、十字形構造、四重ループ、リボースジッパー、または偽結合である、態様89に記載の方法。
91.核酸結合分子が基質の表面に結合され、各標的核酸が1つの標的核酸結合分子のみに接触できるように空間的に分離されている、態様80~90のいずれか1つに記載の方法。
92.核酸バーコードが、バーコードまたはその相補体を標的核酸の5’末端または3’末端に共有結合させることによって標的核酸に転移される、態様80~91のいずれか1つに記載の方法。
93.核酸バーコードが、一本鎖ライゲーション、スプリントライゲーション、プライマー伸長、または二本鎖ライゲーションによって酵素的に標的核酸に転移される、態様80~91のいずれか1つに記載の方法。
94.核酸バーコードが、化学ライゲーションによって標的核酸に転写される、態様80~90のいずれか一項に記載の方法。
95.修飾が、核酸結合分子を標的核酸に光化学的に連結することを含む、態様80~94のいずれか1つに記載の方法。
96.修飾が、核酸結合分子が標的核酸に結合する部位またはその近傍の塩基を編集することを含む、態様80~94のいずれか1つに記載の方法。
97.標的核酸中の非古典的特徴を検出する方法であって、
(i)標的核酸を、態様1~28のいずれか1つに記載の核酸結合分子と接触させる工程;
(ii)(a)バーコード化標的核酸のオフターゲット生成を実質的に防止する環境下で、核酸バーコードを標的核酸にトランスファーしてバーコード化標的核酸を生成する工程;および
(iii)標的核酸またはそのコピー中のバーコードの存在を検出する工程
を含む、方法。
98.非古典的特徴が修飾ヌクレオシドである、態様97に記載の方法。
99.修飾ヌクレオシドが、3-メチルシチジン(m3C)、5-メチルシチジン(m5C)、N4-アセチルシチジン(ac4C)、シュードウリジン(Ψ)、1-メチルアデノシン(m1A)、N6-メチルアデノシン(m6A)、イノシン(I)、7-メチルグアノシン(m7G)、ジヒドロウリジン(D)、3-メチルウリジン(m3U)、5-メチルウリジン(m5U)、1-メチルグアノシン(m1G)、N2-メチルグアノシン(m2G)、5-メチルデオキシシチジン(m5dC)、N4-メチルデオキシシチジン、5-ヒドロキシメチルシチジン(5-hmC)、5-ヒドロキシメチルデオキシシチジン(5hmdC)、5-カルボキシデオキシシチジン(5cadC)、5-ホルミルシチジン(5fC)、5-ホルミルデオキシシチジン(5fdC)、6-メチルデオキシアデノシン、N7-メチルグアノシン(m7G)、2,7,2’-メチルグアノシン、またはリボースメチル化(Nm)である、態様98に記載の方法。
100.非古典的特徴が核酸損傷である、態様97に記載の方法。
101.核酸損傷が、酸化プロセスまたは紫外線との接触に起因する、態様100に記載の方法。
102.核酸損傷が、外因性薬剤による大きい付加体形成または塩基アルキル化に起因する、態様100に記載の方法。
103.損傷が、8-オキソグアニン(8-oxoG)、1以上の脱塩基部位、シス-プラチン架橋、ベンゾ(a)ピレンジオールエポキシド(BPDE)付加体、シクロブテンピリミジン二量体(CPD)、ピリミジン-ピリミドン(6-4)光生成物(6-4PP)、6-O-メチルグアニン(O6-MedG)、またはO6-(カルボキシメチル)-2’-デオキシグアノシン(O6-CMdG)である、態様100に記載の方法。
104.非古典的特徴が構造的要素である、態様100に記載の方法。
105.構造的要素が、ヘアピン、ループ、Z-DNA構造、G-四重鎖、i-モチーフ、バルジ、三重鎖、三叉結合、十字形構造、四重鎖、リボースジッパー、または偽結合である、請求項104に記載の方法。
106.トランスファーが、バーコードまたはその相補体を標的核酸の5’末端または3’末端に共有結合させることを含む、態様97~105のいずれか一項に記載の方法。
107.核酸バーコードが、一本鎖ライゲーション、スプリントライゲーション、スプリント伸長、テンプレート伸長、または二本鎖ライゲーションによって標的核酸にトランスファーされる、態様97~105のいずれか1つに記載の方法。
108.核酸バーコードが、化学ライゲーションによって標的核酸にトランスファーされる、態様97~105のいずれか1つに記載の方法。
109.工程(i)~(iii)を少なくとも1回繰り返す、態様97~108のいずれか1つに記載の方法。
110.バーコードの存在を検出することが、バーコード化標的核酸またはそのバーコード化コピーを改変することを含む、態様97~109のいずれか1つに記載の方法。
111.バーコードの存在を検出することが、バーコード化標的核酸またはそのコピーを増幅することを含む、態様97~109のいずれか1つに記載の方法。
112.バーコードの存在を検出することが、バーコード化標的核酸を配列決定することを含む、態様97~109のいずれか1つに記載の方法。
113.標的核酸中の非古典的特徴の位置を、一塩基分解能の近傍または一塩基分解能で決定する方法であって
(i)標的核酸を、態様1~28のいずれか1つに記載の核酸結合分子と接触させる工程;
(ii)バーコード化された標的核酸のオフターゲット生成を実質的に防止する環境下で、バーコード化された標的核酸を生成するために、核酸バーコードを標的核酸にトランスファーする工程;および
(iii)標的核酸またはそのコピー中のバーコードの存在を検出する工程;
ここで、核酸結合分子は、以下のうちの1以上が可能な結合ドメインを含む:
(a)標的核酸に変異を誘導する;または
(b)ポリメラーゼのバイパスを防ぎ、標的核酸のコピー中に切断を引き起こす工程
を含む、方法。
114.ポリメラーゼバイパスを防止することが、核酸結合分子を標的核酸に化学的または光化学的に連結することを含む、態様113に記載の方法。
115.ポリメラーゼバイパスを防止することが、標的核酸のコピーの間に切断を誘導するように結合ドメインを化学的に改変することを含む、態様113に記載の方法。
116.非古典的特徴が修飾ヌクレオシドである、態様113~115のいずれか1つに記載の方法。
117.修飾ヌクレオシドが、3-メチルシチジン(m3C)、5-メチルシチジン(m5C)、N4-アセチルシチジン(ac4C)、シュードウリジン(Ψ)、1-メチルアデノシン(m1A)、N6-メチルアデノシン(m6A)、イノシン(I)、7-メチルグアノシン(m7G)、ジヒドロウリジン(D)、3-メチルウリジン(m3U)、5-メチルウリジン(m5U)、1-メチルグアノシン(m1G)、N2-メチルグアノシン(m2G)、5-メチルデオキシシチジン(m5dC)、N4-メチルデオキシシチジン、5-ヒドロキシメチルシチジン(5-hmC)、5-ヒドロキシメチルデオキシシチジン(5hmdC)、5-カルボキシデオキシシチジン(5cadC)、5-ホルミルシチジン(5fC)、5-ホルミルデオキシシチジン(5fdC)、6-メチルデオキシアデノシン、N7-メチルグアノシン(m7G)、2,7,2’-メチルグアノシン、またはリボースメチル化(Nm)である、態様116に記載の方法。
118.非古典的特徴が核酸損傷である、態様113~115のいずれか1つに記載の方法。
119.核酸損傷が、酸化的過程または紫外線との接触に起因する、態様118に記載の方法。
120.核酸損傷が、外因性薬剤による大きい付加体形成または塩基アルキル化に起因する、態様118に記載の方法。
121.損傷が、8-オキソグアニン(8-oxoG)、1以上の脱塩基部位、シス-プラチン架橋、ベンゾ(a)ピレンジオールエポキシド(BPDE)付加体、シクロブテンピリミジン二量体(CPD)、ピリミジン-ピリミドン(6-4)光生成物(6-4PP)、6-O-メチルグアニン(O6-MedG)、またはO6-(カルボキシメチル)-2’-デオキシグアノシン(O6-CMdG)であ、態様118に記載の方法。
122.非古典的特徴が構造的要素である、態様113~115のいずれか1つに記載の方法。
123.構造的要素が、ヘアピン、ループ、Z-DNA構造、G-四重鎖、iモチーフ、バルジ、三重鎖、三叉結合、十字形構造、四重ループ、リボースジッパー、または偽結合である、態様122に記載の方法。
124.トランスファーが、バーコードまたはその相補体を標的核酸の5’末端または3’末端に共有結合させることを含む、態様113~123のいずれか1つに記載の方法。
125.工程(i)~(iii)を少なくとも1回繰り返す、態様113~123のいずれか1つに記載の方法。
126.工程(i)~(iii)を繰り返すたびに、異なる核酸結合分子を使用する、態様124に記載の方法。
127.工程(i)~(iii)を繰り返すたびに、同じ核酸結合分子を使用する、態様124に記載の方法。
128.バーコードの存在を検出することが、バーコード化標的核酸またはそのバーコード化コピーを改変することを含む、態様113~127のいずれか1つに記載の方法。
129.バーコードの存在を検出することが、バーコード化標的核酸またはそのコピーを増幅することを含む、態様113~127のいずれか1つに記載の方法。
130.バーコードの存在を検出することが、バーコード化標的核酸を配列決定することを含む、態様113~127のいずれか1つに記載の方法。
131.バーコードの存在を検出することが、核酸および核酸結合分子のアダプターを配列決定することを含む、態様113~127のいずれか1つに記載の方法。
132.核酸バーコードを標的核酸にトランスファーさせることが、バーコードまたはその相補体を標的核酸の5’末端または3’末端に共有結合させることを含む、態様113~131のいずれか一項に記載の方法。
添付の特許請求の範囲にかかわらず、以下の番号付けされた態様も本発明の一部を構成する。
1.i)結合ドメイン、および
ii)アダプター、
を含む核酸結合分子であって、前記結合ドメインは、DNAまたはRNAの非古典的特徴に特異的に結合し、前記アダプターは、結合ドメインによって特異的に結合される非古典的特徴に特有の核酸バーコード配列を含む、核酸結合分子
2.結合ドメインが、抗体、ナノボディ、アプタマー、リーダータンパク質、ライタータンパク質、イレイサータンパク質、人工高分子スキャフォールド、人工タンパク質スキャフォールド、または選択的共有結合キャプチャー試薬、またはそれらのフラグメントもしくは誘導体を含む、態様1に記載の核酸結合分子。
3.リーダータンパク質が、NUDT16またはYTHDC2、またはそれらのフラグメントもしくは誘導体である、態様2に記載の核酸結合分子。
4.ライタータンパク質が、DNTM1、DNTM3A/B、NAT10、METTL3、METTL8、METTL14、METTL16、TRM、BMT、DUS2、PUS、またはNSUN2、またはそれらのフラグメントもしくは誘導体である、態様2に記載の核酸結合分子。
5.イレイサータンパク質が、FTO、ALKBH3またはALKBH5、またはそれらのフラグメントもしくは誘導体である、態様2に記載の核酸結合分子。
6.結合ドメインが触媒活性を有さない、態様2に記載の核酸結合分子。
7.アダプターが切断可能である、態様1~6のいずれか1つに記載の核酸結合分子。
8.アダプターが、ユニバーサルフォワードプライマー(UFP)およびユニバーサルリバースプライマー(URP)の少なくとも1つを含む、態様1~7のいずれか1つに記載の核酸結合分子。
9.アダプターがユニーク分子識別子(UMI)を含む、態様1~8のいずれか1つに記載の核酸結合分子。
10.非古典的特徴が修飾ヌクレオシドである、態様1~9のいずれか1つに記載の核酸結合分子。
11.修飾ヌクレオシドが、3-メチルシチジン(m3C)、5-メチルシチジン(m5C)、N4-アセチルシチジン(ac4C)、シュードウリジン(Ψ)、1-メチルアデノシン(m1A)、N6-メチルアデノシン(m6A)、イノシン(I)、7-メチルグアノシン(m7G)、ジヒドロウリジン(D)、3-メチルウリジン(m3U)、5-メチルウリジン(m5U)、1-メチルグアノシン(m1G)、N2-メチルグアノシン(m2G)、5-メチルデオキシシチジン(m5dC)、N4-メチルデオキシシチジン、5-ヒドロキシメチルシチジン(5-hmC)、5-ヒドロキシメチルデオキシシチジン(5hmdC)、5-カルボキシデオキシシチジン(5cadC)、5-ホルミルシチジン(5fC)、5-ホルミルデオキシシチジン(5fdC)、6-メチルデオキシアデノシン、N7-メチルグアノシン(m7G)、2,7,2’-メチルグアノシン、またはリボースメチル化(Nm)である、態様10に記載の核酸結合分子。
12.非古典的特徴が核酸損傷である、態様1~9のいずれか1つ記載の核酸結合分子。
13.核酸損傷が、酸化プロセスまたは紫外線との接触に起因するものである、態様12に記載の方法。
14.核酸損傷が、外因性薬剤による大きい付加体形成または塩基アルキル化に起因する、態様12に記載の方法。
15.損傷が、8-オキソグアニン(8-oxoG)、1以上の脱塩基部位、シス-プラチン架橋、ベンゾ(a)ピレンジオールエポキシド(BPDE)付加体、シクロブテンピリミジン二量体(CPD)、ピリミジン-ピリミドン(6-4)光生成物(6-4PP)、6-O-メチルグアニン(O6-MedG)、またはO6-(カルボキシメチル)-2’-デオキシグアノシン(O6-CMdG)である、請求項12に記載の核酸結合分子。
16.非古典的特徴が構造的要素である、態様1~9のいずれか1つに記載の核酸結合分子。
17.構造的要素が、ヘアピン、ループ、Z-DNA構造、G-四重鎖、i-モチーフ、バルジ、三重鎖、三叉結合、十字形構造、四重鎖、リボースジッパー、またはシュードノットである、態様16に記載の核酸結合分子。
18.結合ドメインが、少なくとも1つの修飾ヌクレオシドと接触している、態様1~17のいずれか1つに記載の核酸結合分子。
19.結合ドメインが、修飾ヌクレオシドおよびそれに隣接する1以上のヌクレオチドと接触している、態様1~18のいずれか1つに記載の核酸結合分子。
20.アダプターがリンカーを含み、結合ドメインがリンカーに結合している、態様1~19のいずれか1つに記載の核酸結合分子。
21.核酸結合分子が、酵素またはその触媒フラグメントもしくは誘導体をさらに含む、態様1~20のいずれか1つに記載の核酸結合分子。
22.酵素が塩基編集酵素である、態様21に記載の核酸結合分子。
23.塩基編集酵素がシトシンデアミナーゼまたはアデノシンデアミナーゼである、態様22に記載の核酸結合分子。
24.塩基編集酵素において、APOBEC1もしくはAPOBEC3A、またはそれらの触媒フラグメントもしくは誘導体である、態様23に記載の核酸結合分子。
25.酵素が、DNAもしくはRNAメチラーゼ、またはシュードウリジン合成酵素、またはそれらの触媒フラグメントもしくは誘導体である、態様23に記載の核酸結合分子。
26.酵素がDNA N-グリコシラーゼまたはRNA N-グリコシラーゼである、態様21に記載の核酸結合分子。
27.酵素がトランスポザーゼまたはインテグラーゼである、態様21に記載の核酸結合分子。
28.酵素が触媒活性を欠く、態様21に記載の核酸結合分子。
29.結合ドメインおよび酵素またはそのフラグメントを含むコンジュゲートであって、結合ドメインが態様1~28のいずれか1つに記載の核酸結合分子に結合する、コンジュゲート。
30.結合ドメインとそのフラグメントの酵素とが共有結合している、態様29に記載のコンジュゲート。
31.結合ドメインおよび酵素またはそのフラグメントが非共有結合している、態様29に記載のコンジュゲート。
32.酵素がTn5トランスポザーゼである、態様29~31のいずれか1つに記載のコンジュゲート。
33.タグメンターゼ(tagmentase)がプロテインA、G、またはLと融合している、態様32に記載のコンジュゲート。
34.i)ペプチドタグをさらに含む、態様1~28のいずれか1つに記載の核酸結合分子、および(ii)ペプチドタグと共有結合的に反応し得るタンパク質タグに融合した酵素またはそのフラグメント、を含むコンジュゲート。
35.i)タンパク質タグをさらに含む、態様1~28のいずれか1つに記載の核酸結合分子、および(ii)タンパク質タグと共有結合的に反応し得るペプチドタグに融合した酵素またはそのフラグメント、を含むコンジュゲート。
36.ペプチドタグがSpytagである、態様34~35のいずれか一項に記載のコンジュゲート。
37.酵素がデアミナーゼであり、スパイキャッチャータンパク質に融合される、態様34~36のいずれか1つに記載のコンジュゲート。
38.i)態様1~28のいずれか1つに記載の核酸結合分子と、(ii)結合ドメインの特定の領域に高親和性で結合し得るタンパク質に融合した酵素またはそのフラグメントとを含むコンジュゲート。
39.結合ドメインがIgG抗体またはそのフラグメントである、態様38に記載のコンジュゲート。
40.酵素が、プロテインA、GまたはLに融合したデアミナーゼである、態様39に記載のコンジュゲート。
41.i)核酸タグをさらに含む、態様1~28のいずれか1つに記載の核酸結合分子、および(ii)核酸結合分子の核酸タグにハイブリダイズし得る相補的核酸タグに融合した酵素またはそのフラグメント、を含むコンジュゲート。
42.標的核酸に結合した、態様1~28のいずれか1つに記載の核酸結合分子を含む複合体。
43.核酸結合分子および標的核酸が共有結合している、態様42に記載の複合体。
44.態様1~28のいずれか1つに記載の核酸結合分子に結合した基質。
45.基質が、ビーズ、チップ、プレート、スライド、ディッシュ、または3次元マトリックスである、態様44に記載の基質。
46.核酸結合分子が基質の表面に結合している、態様45に記載の基質。
47.核酸結合分子が、捕捉分子を介して間接的に基質の表面に結合され、前記捕捉分子が基質に直接結合される、態様46に記載の基質。
48.捕捉分子が核酸結合分子を結合する、態様47に記載の基質。
49.捕捉分子が標的核酸と結合している、態様47に記載の基質。
50.核酸結合分子が、捕捉分子に結合している標的核酸に結合する、態様47に記載の基質。
51.核酸結合分子が、基質の表面上で第2の核酸結合分子から空間的に分離されている、態様44~50のいずれか1つに記載の基質。
52.態様1~28のいずれか1つに記載の核酸結合分子に結合したポリマー。
53.態様1~28のいずれか1つに記載の核酸結合分子の製造方法であって、結合ドメインをアダプターにカップリングさせて、結合ドメイン-アダプターコンジュゲートを形成することを含む、製造方法。
54.複数の標的核酸を分析する方法であって、
(i)標的核酸を、態様1~28のいずれか1つに記載の核酸結合分子と接触させる工程;
(ii)(a)バーコード化核酸のオフターゲット生成を実質的に阻止する環境下で、核酸バーコードを標的核酸に転写してバーコード化標的核酸を生成するか、または(b)標的核酸のバーコード化コピーを生成する工程;
(iii)非古典的特徴の位置がバーコード化標的核酸またはそのバーコード化コピーの一次核酸配列に基づいて識別可能であるように、バーコード化標的核酸またはそのバーコード化コピーを改変する工程;および
(iv)バーコード化標的核酸の塩基配列を決定する工程
を含む、分析方法。
55.バーコード転写を容易にするために、工程(i)の前に、標的核酸の3’末端に短い核酸配列を付加することを含む、態様54に記載の方法。
56.工程(i)~(iii)を少なくとも1回繰り返す、態様54に記載の方法。
57.工程(i)~(iii)を繰り返すたびに、異なる核酸結合分子を使用する、態様56に記載の方法。
58.工程(i)~(iii)を繰り返すたびに、同じ核酸結合分子を使用する、態様56に記載の方法。
59.核酸バーコードが、一本鎖ライゲーション、スプリントライゲーション、プライマー伸長、または二本鎖ライゲーションによって酵素的に標的核酸にトランスファーされる、態様21に記載の方法。
60.核酸バーコードが、プライマー伸長によって標的核酸にトランスファーされ、ここで、プライマー伸長が、標的核酸の3’末端へのユニバーサル配列を有する核酸のライゲーションによって始まる、態様59に記載の方法。
61.核酸バーコードが、プライマー伸長によって標的RNAにトランスファーされ、ここで、プライマー伸長が、1種のリボヌクレオチドおよび競合する相補的なポリ-dT、ポリ-dA、ポリ-dG、またはポリ-dCオリゴヌクレオチドと組み合わせて、大腸菌ポリ(A)ポリメラーゼまたはシゾサッカロマイセス・ポンビーCid1のポリ(U)ポリメラーゼを用いて、標的核酸の3’末端を酵素的にテイル付加することによって始まる、態様60に記載の方法。
62.配列決定前に、バーコード化標的核酸またはそのコピーを増幅することを含む、態様54~61のいずれか1つに記載の方法。
63.標的核酸が、DNA、RNA、またはそれらの混合物を含む、態様54~61のいずれか1つに記載の方法。
64.標的核酸が少なくとも1つの非古典的特徴を含む、態様54~63のいずれか1つに記載の方法。
65.非古典的特徴が修飾ヌクレオシドである、態様64に記載の方法。
66.修飾ヌクレオシドが、3-メチルシチジン(m3C)、5-メチルシチジン(m5C)、N4-アセチルシチジン(ac4C)、シュードウリジン(Ψ)、1-メチルアデノシン(m1A)、N6-メチルアデノシン(m6A)、イノシン(I)、7-メチルグアノシン(m7G)、ジヒドロウリジン(D)、3-メチルウリジン(m3U)、5-メチルウリジン(m5U)、1-メチルグアノシン(m1G)、N2-メチルグアノシン(m2G)、5-メチルデオキシシチジン(m5dC)、N4-メチルデオキシシチジン、5-ヒドロキシメチルシチジン(5-hmC)、5-ヒドロキシメチルデオキシシチジン(5hmdC)、5-カルボキシデオキシシチジン(5cadC)、5-ホルミルシチジン(5fC)、5-ホルミルデオキシシチジン(5fdC)、6-メチルデオキシアデノシン、N7-メチルグアノシン(m7G)、2,7,2’-メチルグアノシン、またはリボースメチル化(Nm)である、態様61に記載の方法。
67.非古典的特徴が核酸損傷である、態様64に記載の方法。
68.核酸損傷が、酸化プロセスまたは紫外線との接触に起因する、態様67に記載の方法。
69.核酸損傷が、外因性薬剤による大きい付加体形成または塩基アルキル化に起因する、態様67に記載の方法。
70.損傷が、8-オキソグアニン(8-oxoG)、1以上の脱塩基部位、シス-プラチン架橋、ベンゾ(a)ピレンジオールエポキシド(BPDE)付加体、シクロブテンピリミジン二量体(CPD)、ピリミジン-ピリミドン(6-4)光生成物(6-4PP)、6-O-メチルグアニン(O6-MedG)、またはO6-(カルボキシメチル)-2’-デオキシグアノシン(O6-CMdG)である、態様64に記載の核酸結合分子。
71.非古典的特徴が構造的要素である、態様64に記載の方法。
72.構造的要素が、ヘアピン、ループ、Z-DNA構造、G-四重鎖、i-モチーフ、バルジ、三重鎖、三叉結合、十字形構造、テトラループ、リボースジッパー、またはシュードノットである、態様71に記載の方法。
73.核酸結合分子が基質の表面に結合され、他の核酸結合分子から空間的に分離され、各標的核酸が1つの標的核酸結合分子としか接触できないようにする、態様54~72のいずれか1つに記載の方法。
74.核酸バーコードが、該バーコードまたはその相補体を標的核酸の5’末端または3’末端に共有結合させることによって標的核酸にトランスファーされる、態様54~73のいずれか一項に記載の方法。
75.核酸バーコードが、一本鎖ライゲーション、スプリントライゲーション、プライマー伸長、または二本鎖ライゲーションによって酵素的に標的核酸にトランスファーされる、態様54~73のいずれか1つに記載の方法。
76.核酸バーコードが、化学ライゲーションによって標的核酸にトランスファーされる、態様54~73のいずれか1つに記載の方法。
77.修飾が、核酸結合分子を標的核酸に光化学的または化学的に連結することを含む、態様54~76のいずれか1つに記載の方法。
78.結合ドメインが、核酸標的との共有結合反応を促進する配向で化学架橋部分を提示する、態様54~77のいずれか1つに記載の方法。
79.修飾が、核酸結合分子が標的核酸に結合する部位またはその近傍の塩基を編集することを含む、態様54~77のいずれか一項に記載の方法。
80.複数の標的核酸中の2以上の非古典的特徴を検出する方法および/または定量する方法であって、
(i)標的核酸を少なくとも2つの核酸結合分子と接触させる工程であって、各核酸結合分子は結合ドメインおよびアダプターを含み、各核酸結合分子の結合ドメインがDNAまたはRNAの異なる非古典的特徴に結合し、アダプターは各結合ドメインによって特異的に結合される非古典的特徴に特異的な核酸バーコード配列を含む、工程;
(ii)(a)バーコード化核酸のオフターゲット生成を実質的に防止する環境下で、核酸バーコードを標的核酸にトランスファーしてバーコード化標的核酸を生成するか、または(b)標的核酸のバーコード化コピーを生成する、工程;
(iii)非古典的特徴の位置がバーコード化標的核酸またはそのバーコード化コピーの一次核酸配列に基づいて同定可能であるように、バーコード化標的核酸またはそのバーコード化コピーを改変する工程;および
(vi)バーコード化された標的核酸の塩基配列を決定する工程
を含む、方法。
81.配列決定の前に、バーコード化標的核酸またはそのコピーを増幅することを含む、態様80に記載の方法。
82.標的核酸が、DNA、RNA、またはそれらの混合物を含む、態様80または81に記載の方法。
83.非古典的特徴の少なくとも1つが修飾ヌクレオシドである、態様80~82のいずれか1つに記載の方法。
84.修飾ヌクレオシドが、3-メチルシチジン(m3C)、5-メチルシチジン(m5C)、N4-アセチルシチジン(ac4C)、シュードウリジン(Ψ)、1-メチルアデノシン(m1A)、N6-メチルアデノシン(m6A)、イノシン(I)、7-メチルグアノシン(m7G)、ジヒドロウリジン(D)、3-メチルウリジン(m3U)、5-メチルウリジン(m5U)、1-メチルグアノシン(m1G)、N2-メチルグアノシン(m2G)、5-メチルデオキシシチジン(m5dC)、N4-メチルデオキシシチジン、5-ヒドロキシメチルシチジン(5-hmC)、5-ヒドロキシメチルデオキシシチジン(5hmdC)、5-カルボキシデオキシシチジン(5cadC)、5-ホルミルシチジン(5fC)、5-ホルミルデオキシシチジン(5fdC)、6-メチルデオキシアデノシン、N7-メチルグアノシン(m7G)、2,7,2’-メチルグアノシン、またはリボースメチル化(Nm)である、態様83に記載の方法。
85.非古典的特徴が核酸損傷である、態様82に記載の方法。
86.核酸損傷が、酸化プロセスまたは紫外線との接触に起因する、態様85に記載の方法。
87.核酸損傷が、外因性薬剤による大きい付加体形成または塩基アルキル化に起因する、態様85に記載の方法。
88.損傷が、8-オキソグアニン(8-oxoG)、1以上の脱塩基部位、シス-プラチン架橋、ベンゾ(a)ピレンジオールエポキシド(BPDE)付加体、シクロブテンピリミジン二量体(CPD)、ピリミジン-ピリミドン(6-4)光生成物(6-4PP)、6-O-メチルグアニン(O6-MedG)、またはO6-(カルボキシメチル)-2’-デオキシグアノシン(O6-CMdG)である、態様82に記載の核酸結合分子。
89.非古典的特徴の少なくとも1つが構造的要素である、態様80~82のいずれか1つに記載の方法。
90.構造的要素が、ヘアピン、ループ、Z-DNA構造、G-四重鎖、i-モチーフ、バルジ、三重鎖、三叉結合、十字形構造、四重ループ、リボースジッパー、または偽結合である、態様89に記載の方法。
91.核酸結合分子が基質の表面に結合され、各標的核酸が1つの標的核酸結合分子のみに接触できるように空間的に分離されている、態様80~90のいずれか1つに記載の方法。
92.核酸バーコードが、バーコードまたはその相補体を標的核酸の5’末端または3’末端に共有結合させることによって標的核酸に転移される、態様80~91のいずれか1つに記載の方法。
93.核酸バーコードが、一本鎖ライゲーション、スプリントライゲーション、プライマー伸長、または二本鎖ライゲーションによって酵素的に標的核酸に転移される、態様80~91のいずれか1つに記載の方法。
94.核酸バーコードが、化学ライゲーションによって標的核酸に転写される、態様80~90のいずれか一項に記載の方法。
95.修飾が、核酸結合分子を標的核酸に光化学的に連結することを含む、態様80~94のいずれか1つに記載の方法。
96.修飾が、核酸結合分子が標的核酸に結合する部位またはその近傍の塩基を編集することを含む、態様80~94のいずれか1つに記載の方法。
97.標的核酸中の非古典的特徴を検出する方法であって、
(i)標的核酸を、態様1~28のいずれか1つに記載の核酸結合分子と接触させる工程;
(ii)(a)バーコード化標的核酸のオフターゲット生成を実質的に防止する環境下で、核酸バーコードを標的核酸にトランスファーしてバーコード化標的核酸を生成する工程;および
(iii)標的核酸またはそのコピー中のバーコードの存在を検出する工程
を含む、方法。
98.非古典的特徴が修飾ヌクレオシドである、態様97に記載の方法。
99.修飾ヌクレオシドが、3-メチルシチジン(m3C)、5-メチルシチジン(m5C)、N4-アセチルシチジン(ac4C)、シュードウリジン(Ψ)、1-メチルアデノシン(m1A)、N6-メチルアデノシン(m6A)、イノシン(I)、7-メチルグアノシン(m7G)、ジヒドロウリジン(D)、3-メチルウリジン(m3U)、5-メチルウリジン(m5U)、1-メチルグアノシン(m1G)、N2-メチルグアノシン(m2G)、5-メチルデオキシシチジン(m5dC)、N4-メチルデオキシシチジン、5-ヒドロキシメチルシチジン(5-hmC)、5-ヒドロキシメチルデオキシシチジン(5hmdC)、5-カルボキシデオキシシチジン(5cadC)、5-ホルミルシチジン(5fC)、5-ホルミルデオキシシチジン(5fdC)、6-メチルデオキシアデノシン、N7-メチルグアノシン(m7G)、2,7,2’-メチルグアノシン、またはリボースメチル化(Nm)である、態様98に記載の方法。
100.非古典的特徴が核酸損傷である、態様97に記載の方法。
101.核酸損傷が、酸化プロセスまたは紫外線との接触に起因する、態様100に記載の方法。
102.核酸損傷が、外因性薬剤による大きい付加体形成または塩基アルキル化に起因する、態様100に記載の方法。
103.損傷が、8-オキソグアニン(8-oxoG)、1以上の脱塩基部位、シス-プラチン架橋、ベンゾ(a)ピレンジオールエポキシド(BPDE)付加体、シクロブテンピリミジン二量体(CPD)、ピリミジン-ピリミドン(6-4)光生成物(6-4PP)、6-O-メチルグアニン(O6-MedG)、またはO6-(カルボキシメチル)-2’-デオキシグアノシン(O6-CMdG)である、態様100に記載の方法。
104.非古典的特徴が構造的要素である、態様100に記載の方法。
105.構造的要素が、ヘアピン、ループ、Z-DNA構造、G-四重鎖、i-モチーフ、バルジ、三重鎖、三叉結合、十字形構造、四重鎖、リボースジッパー、または偽結合である、請求項104に記載の方法。
106.トランスファーが、バーコードまたはその相補体を標的核酸の5’末端または3’末端に共有結合させることを含む、態様97~105のいずれか一項に記載の方法。
107.核酸バーコードが、一本鎖ライゲーション、スプリントライゲーション、スプリント伸長、テンプレート伸長、または二本鎖ライゲーションによって標的核酸にトランスファーされる、態様97~105のいずれか1つに記載の方法。
108.核酸バーコードが、化学ライゲーションによって標的核酸にトランスファーされる、態様97~105のいずれか1つに記載の方法。
109.工程(i)~(iii)を少なくとも1回繰り返す、態様97~108のいずれか1つに記載の方法。
110.バーコードの存在を検出することが、バーコード化標的核酸またはそのバーコード化コピーを改変することを含む、態様97~109のいずれか1つに記載の方法。
111.バーコードの存在を検出することが、バーコード化標的核酸またはそのコピーを増幅することを含む、態様97~109のいずれか1つに記載の方法。
112.バーコードの存在を検出することが、バーコード化標的核酸を配列決定することを含む、態様97~109のいずれか1つに記載の方法。
113.標的核酸中の非古典的特徴の位置を、一塩基分解能の近傍または一塩基分解能で決定する方法であって
(i)標的核酸を、態様1~28のいずれか1つに記載の核酸結合分子と接触させる工程;
(ii)バーコード化された標的核酸のオフターゲット生成を実質的に防止する環境下で、バーコード化された標的核酸を生成するために、核酸バーコードを標的核酸にトランスファーする工程;および
(iii)標的核酸またはそのコピー中のバーコードの存在を検出する工程;
ここで、核酸結合分子は、以下のうちの1以上が可能な結合ドメインを含む:
(a)標的核酸に変異を誘導する;または
(b)ポリメラーゼのバイパスを防ぎ、標的核酸のコピー中に切断を引き起こす工程
を含む、方法。
114.ポリメラーゼバイパスを防止することが、核酸結合分子を標的核酸に化学的または光化学的に連結することを含む、態様113に記載の方法。
115.ポリメラーゼバイパスを防止することが、標的核酸のコピーの間に切断を誘導するように結合ドメインを化学的に改変することを含む、態様113に記載の方法。
116.非古典的特徴が修飾ヌクレオシドである、態様113~115のいずれか1つに記載の方法。
117.修飾ヌクレオシドが、3-メチルシチジン(m3C)、5-メチルシチジン(m5C)、N4-アセチルシチジン(ac4C)、シュードウリジン(Ψ)、1-メチルアデノシン(m1A)、N6-メチルアデノシン(m6A)、イノシン(I)、7-メチルグアノシン(m7G)、ジヒドロウリジン(D)、3-メチルウリジン(m3U)、5-メチルウリジン(m5U)、1-メチルグアノシン(m1G)、N2-メチルグアノシン(m2G)、5-メチルデオキシシチジン(m5dC)、N4-メチルデオキシシチジン、5-ヒドロキシメチルシチジン(5-hmC)、5-ヒドロキシメチルデオキシシチジン(5hmdC)、5-カルボキシデオキシシチジン(5cadC)、5-ホルミルシチジン(5fC)、5-ホルミルデオキシシチジン(5fdC)、6-メチルデオキシアデノシン、N7-メチルグアノシン(m7G)、2,7,2’-メチルグアノシン、またはリボースメチル化(Nm)である、態様116に記載の方法。
118.非古典的特徴が核酸損傷である、態様113~115のいずれか1つに記載の方法。
119.核酸損傷が、酸化的過程または紫外線との接触に起因する、態様118に記載の方法。
120.核酸損傷が、外因性薬剤による大きい付加体形成または塩基アルキル化に起因する、態様118に記載の方法。
121.損傷が、8-オキソグアニン(8-oxoG)、1以上の脱塩基部位、シス-プラチン架橋、ベンゾ(a)ピレンジオールエポキシド(BPDE)付加体、シクロブテンピリミジン二量体(CPD)、ピリミジン-ピリミドン(6-4)光生成物(6-4PP)、6-O-メチルグアニン(O6-MedG)、またはO6-(カルボキシメチル)-2’-デオキシグアノシン(O6-CMdG)であ、態様118に記載の方法。
122.非古典的特徴が構造的要素である、態様113~115のいずれか1つに記載の方法。
123.構造的要素が、ヘアピン、ループ、Z-DNA構造、G-四重鎖、iモチーフ、バルジ、三重鎖、三叉結合、十字形構造、四重ループ、リボースジッパー、または偽結合である、態様122に記載の方法。
124.トランスファーが、バーコードまたはその相補体を標的核酸の5’末端または3’末端に共有結合させることを含む、態様113~123のいずれか1つに記載の方法。
125.工程(i)~(iii)を少なくとも1回繰り返す、態様113~123のいずれか1つに記載の方法。
126.工程(i)~(iii)を繰り返すたびに、異なる核酸結合分子を使用する、態様124に記載の方法。
127.工程(i)~(iii)を繰り返すたびに、同じ核酸結合分子を使用する、態様124に記載の方法。
128.バーコードの存在を検出することが、バーコード化標的核酸またはそのバーコード化コピーを改変することを含む、態様113~127のいずれか1つに記載の方法。
129.バーコードの存在を検出することが、バーコード化標的核酸またはそのコピーを増幅することを含む、態様113~127のいずれか1つに記載の方法。
130.バーコードの存在を検出することが、バーコード化標的核酸を配列決定することを含む、態様113~127のいずれか1つに記載の方法。
131.バーコードの存在を検出することが、核酸および核酸結合分子のアダプターを配列決定することを含む、態様113~127のいずれか1つに記載の方法。
132.核酸バーコードを標的核酸にトランスファーさせることが、バーコードまたはその相補体を標的核酸の5’末端または3’末端に共有結合させることを含む、態様113~131のいずれか一項に記載の方法。
Claims (132)
- i)結合ドメイン、および
ii)アダプター、
を含む核酸結合分子であって、前記結合ドメインは、DNAまたはRNAの非古典的特徴に特異的に結合し、前記アダプターは、結合ドメインによって特異的に結合される非古典的特徴に特有の核酸バーコード配列を含む、核酸結合分子。 - 結合ドメインが、抗体、ナノボディ、アプタマー、リーダータンパク質、ライタータンパク質、イレイサータンパク質、人工高分子スキャフォールド、人工タンパク質スキャフォールド、または選択的共有結合キャプチャー試薬、またはそれらのフラグメントもしくは誘導体を含む、請求項1に記載の核酸結合分子。
- リーダータンパク質が、NUDT16またはYTHDC2、またはそれらのフラグメントもしくは誘導体である、請求項2に記載の核酸結合分子。
- ライタータンパク質が、DNTM1、DNTM3A/B、NAT10、METTL3、METTL8、METTL14、METTL16、TRM、BMT、DUS2、PUS、またはNSUN2、またはそれらのフラグメントもしくは誘導体である、請求項2に記載の核酸結合分子。
- イレイサータンパク質が、FTO、ALKBH3またはALKBH5、またはそれらのフラグメントもしくは誘導体である、請求項2に記載の核酸結合分子。
- 結合ドメインが触媒活性を有さない、請求項2に記載の核酸結合分子。
- アダプターが切断可能である、請求項1から6のいずれか一項に記載の核酸結合分子。
- アダプターがユニバーサルフォワードプライマー(UFP)およびユニバーサルリバースプライマー(URP)の少なくとも1つを含む、請求項1から7のいずれか一項に記載の核酸結合分子。
- アダプターがユニーク分子識別子(UMI)を含む、請求項1から8のいずれか一項に記載の核酸結合分子。
- 非古典的特徴が修飾ヌクレオシドである、請求項1から9のいずれか一項に記載の核酸結合分子。
- 修飾ヌクレオシドが、3-メチルシチジン(m3C)、5-メチルシチジン(m5C)、N4-アセチルシチジン(ac4C)、シュードウリジン(Ψ)、1-メチルアデノシン(m1A)、N6-メチルアデノシン(m6A)、イノシン(I)、7-メチルグアノシン(m7G)、ジヒドロウリジン(D)、3-メチルウリジン(m3U)、5-メチルウリジン(m5U)、1-メチルグアノシン(m1G)、N2-メチルグアノシン(m2G)、5-メチルデオキシシチジン(m5dC)、N4-メチルデオキシシチジン、5-ヒドロキシメチルシチジン(5-hmC)、5-ヒドロキシメチルデオキシシチジン(5hmdC)、5-カルボキシデオキシシチジン(5cadC)、5-ホルミルシチジン(5fC)、5-ホルミルデオキシシチジン(5fdC)、6-メチルデオキシアデノシン、N7-メチルグアノシン(m7G)、2,7,2’-メチルグアノシン、またはリボースメチル化(Nm)である、請求項10に記載の核酸結合分子
- 非古典的特徴が核酸損傷である、請求項1から9のいずれか一項に記載の核酸結合分子。
- 核酸損傷が酸化プロセスまたは紫外線との接触に起因するものである、請求項12記載の方法。
- 核酸損傷が外因性薬剤による大きい付加体形成または塩基アルキル化に起因する、請求項12に記載の方法。
- 損傷が、8-オキソグアニン(8-oxoG)、1以上の脱塩基部位、シス-プラチン架橋、ベンゾ(a)ピレンジオールエポキシド(BPDE)付加体、シクロブテンピリミジン二量体(CPD)、ピリミジン-ピリミドン(6-4)光生成物(6-4PP)、6-O-メチルグアニン(O6-MedG)、またはO6-(カルボキシメチル)-2’-デオキシグアノシン(O6-CMdG)である、請求項12に記載の核酸結合分子。
- 非古典的特徴が構造的要素である、請求項1から9のいずれか一項に記載の核酸結合分子。
- 構造的要素が、ヘアピン、ループ、Z-DNA構造、G-四重鎖、三重鎖、i-モチーフ、バルジ、三重鎖、三叉結合、十字形構造、四重鎖、リボースジッパー、またはシュードノットである、請求項16に記載の核酸結合分子。
- 結合ドメインが少なくとも1つの修飾ヌクレオシドと接触している、請求項1から17のいずれか一項に記載の核酸結合分子。
- 結合ドメインが修飾ヌクレオシドおよびそれに隣接する1以上のヌクレオチドと接触している、請求項1から18のいずれか一項に記載の核酸結合分子。
- アダプターがリンカーを含み、結合ドメインがリンカーに結合している、請求項1から19のいずれか一項に記載の核酸結合分子。
- 核酸結合分子が、酵素またはその触媒フラグメントもしくは誘導体をさらに含む、請求項1から20のいずれか一項に記載の核酸結合分子。
- 酵素が塩基編集酵素である、請求項21に記載の核酸結合分子。
- 塩基編集酵素がシトシンデアミナーゼまたはアデノシンデアミナーゼである、請求項22に記載の核酸結合分子。
- 塩基編集酵素が、APOBEC1またはAPOBEC3A、またはそれらの触媒フラグメントもしくは誘導体である、請求項23に記載の核酸結合分子。
- 塩基編集酵素が、DNAもしくはRNAメチラーゼ、またはシュードウリジン合成酵素、またはそれらの触媒フラグメントもしくは誘導体である、請求項23に記載の核酸結合分子。
- 酵素が、DNA N-グリコシラーゼまたはRNA N-グリコシラーゼである、請求項21に記載の核酸結合分子。
- 酵素がトランスポザーゼまたはインテグラーゼである、請求項21に記載の核酸結合分子。
- 酵素が触媒活性を欠く、請求項21に記載の核酸結合分子。
- 結合ドメインおよび酵素またはそのフラグメントを含むコンジュゲートであって、前記結合ドメインが請求項1から28のいずれか一項に記載の核酸結合分子に結合する、コンジュゲート。
- 結合ドメインおよびそのフラグメントの酵素が共有結合している、請求項29に記載のコンジュゲート。
- 結合ドメインおよび酵素またはそのフラグメントが非共有結合している、請求項29に記載のコンジュゲート。
- 酵素がTn5トランスポザーゼである、請求項29から31のいずれか一項に記載のコンジュゲート。
- タグメンターゼがプロテインA、GまたはLと融合している、請求項32に記載のコンジュゲート。
- (i)ペプチドタグをさらに含む、請求項1から28のいずれか一項に記載の核酸結合分子、および(ii)ペプチドタグと共有結合反応し得るタンパク質タグに融合した酵素またはそのフラグメント、を含むコンジュゲート。
- (i)タンパク質タグをさらに含む、請求項1から28のいずれか一項に記載の核酸結合分子、および(ii)タンパク質タグと共有結合反応し得るペプチドタグに融合した酵素またはそのフラグメント、を含むコンジュゲート。
- ペプチドタグがSpytagである、請求項34から35のいずれか一項に記載のコンジュゲート。
- 酵素がデアミナーゼであり、Spycatcherタンパク質に融合している、請求項34から36のいずれか一項に記載のコンジュゲート。
- (i)請求項1から28のいずれか一項に記載の核酸結合分子、および(ii)結合ドメインの特定領域に高親和性で結合し得るタンパク質に融合した酵素またはそのフラグメント、を含むコンジュゲート。
- 結合ドメインがIgG抗体またはそのフラグメントである、請求項38に記載のコンジュゲート。
- 酵素がプロテインA、GまたはLに融合したデアミナーゼである、請求項39に記載のコンジュゲート。
- (i)核酸タグをさらに含む、請求項1から28のいずれか一項に記載の核酸結合分子、および(ii)核酸結合分子の核酸タグにハイブリダイズし得る相補的核酸タグに融合した酵素またはそのフラグメント、を含むコンジュゲート。
- 標的核酸に結合した請求項1から28のいずれか一項に記載の核酸結合分子を含む複合体。
- 核酸結合分子および標的核酸が共有結合している、請求項42に記載の複合体。
- 請求項1から28のいずれか一項に記載の核酸結合分子に結合した基質。
- 基質が、ビーズ、チップ、プレート、スライド、ディッシュ、または3次元マトリックスである、請求項44に記載の基質。
- 核酸結合分子が基質の表面に結合している、請求項45に記載の基質。
- 核酸結合分子が、捕捉分子を介して間接的に基質の表面に結合され、前記捕捉分子が基質に直接結合されている、請求項46に記載の基質。
- 捕捉分子が核酸結合分子に結合している、請求項47に記載の基質。
- 捕捉分子が標的核酸と結合している、請求項47に記載の基質。
- 核酸結合分子が、捕捉分子に結合している標的核酸に結合する、請求項47に記載の基質。
- 核酸結合分子が、基質の表面上で第2の核酸結合分子から空間的に分離されている、請求項44から50のいずれか一項に記載の基質。
- 請求項1から28のいずれか一項に記載の核酸結合分子に結合したポリマー。
- 請求項1から28のいずれか一項に記載の核酸結合分子の製造方法であって、結合ドメインをアダプターに結合させて、結合ドメイン-アダプターコンジュゲートを形成することを含む、製造方法。
- 複数の標的核酸を分析する方法であって、
(i)標的核酸を請求項1から28のいずれか一項に記載の核酸結合分子と接触させる工程;
(ii)(a)バーコード化核酸のオフターゲット生成を実質的に阻止する環境下で、核酸バーコードを標的核酸へと移してバーコード化標的核酸を生成するか、または(b)標的核酸のバーコード化コピーを生成する、工程;
(iii)非古典的特徴の位置がバーコード化標的核酸またはそのバーコード化コピーの一次核酸配列に基づいて同定可能であるように、バーコード化標的核酸またはそのバーコード化コピーを改変する工程;および
(iv)バーコード化標的核酸の配列を決定する工程
を含む、分析方法。 - バーコードの転写を容易にするために、工程(i)の前に標的核酸の3’末端に短い核酸配列を付加することを含む、請求項54に記載の方法。
- 工程(i)~(iii)を少なくとも1回繰り返す、請求項54に記載の方法。
- 工程(i)~(iii)を反復するたびに異なる核酸結合分子を用いる、請求項56に記載の方法。
- 工程(i)~(iii)を反復するたびに同じ核酸結合分子を用いる、請求項56に記載の方法。
- 核酸バーコードが、一本鎖ライゲーション、スプリントライゲーション、プライマー伸長、または二本鎖ライゲーションにより酵素的に標的核酸にトランスファーされる、請求項21に記載の方法。
- 核酸バーコードが、プライマー伸長によって標的核酸に移され、ここでプライマー伸長が、標的核酸の3’末端へのユニバーサル配列を有する核酸のライゲーションによって始まる、請求項59に記載の方法。
- 核酸バーコードが、プライマー伸長によって標的RNAに移され、ここでプライマー伸長が、1種のリボヌクレオチドおよび競合する相補的なポリ-dT、ポリ-dA、ポリ-dG、またはポリ-dCオリゴヌクレオチドとともに、大腸菌ポリ(A)ポリメラーゼまたはシゾサッカロマイセス・ポンビーCid1のポリ(U)ポリメラーゼを用いて、標的核酸の3’末端を酵素的にテイル付加することによって始まる、請求項60に記載の方法。
- 配列決定前に、バーコード化標的核酸またはそのコピーを増幅することを含む、請求項54から61のいずれか一項に記載の方法。
- 標的核酸がDNA、RNAまたはそれらの混合物を含む、請求項54から61のいずれか一項に記載の方法。
- 標的核酸が少なくとも1つの非古典的特徴を含む、請求項54から63のいずれか一項に記載の方法。
- 非古典的特徴が修飾ヌクレオシドである、請求項64に記載の方法。
- 修飾ヌクレオシドが、3-メチルシチジン(m3C)、5-メチルシチジン(m5C)、N4-アセチルシチジン(ac4C)、シュードウリジン(Ψ)、1-メチルアデノシン(m1A)、N6-メチルアデノシン(m6A)、イノシン(I)、7-メチルグアノシン(m7G)、ジヒドロウリジン(D)、3-メチルウリジン(m3U)、5-メチルウリジン(m5U)、1-メチルグアノシン(m1G)、N2-メチルグアノシン(m2G)、5-メチルデオキシシチジン(m5dC)、N4-メチルデオキシシチジン、5-ヒドロキシメチルシチジン(5-hmC)、5-ヒドロキシメチルデオキシシチジン(5hmdC)、5-カルボキシデオキシシチジン(5cadC)、5-ホルミルシチジン(5fC)、5-ホルミルデオキシシチジン(5fdC)、6-メチルデオキシアデノシン、N7-メチルグアノシン(m7G)、2,7,2’-メチルグアノシン、またはリボースメチル化(Nm)である、請求項61に記載の方法。
- 非古典的特徴が核酸損傷である、請求項64に記載の方法。
- 核酸損傷が酸化プロセスまたは紫外線との接触に起因する、請求項67記載の方法。
- 核酸損傷が、外因性薬剤による大きい付加体形成または塩基アルキル化に起因する、請求項67に記載の方法。
- 損傷が、8-オキソグアニン(8-oxoG)、1以上の脱塩基部位、シス-プラチン架橋、ベンゾ(a)ピレンジオールエポキシド(BPDE)付加体、シクロブテンピリミジン二量体(CPD)、ピリミジン-ピリミドン(6-4)光生成物(6-4PP)、6-O-メチルグアニン(O6-MedG)、またはO6-(カルボキシメチル)-2’-デオキシグアノシン(O6-CMdG)である、請求項64に記載の核酸結合分子。
- 非古典的特徴が構造的要素である、請求項64に記載の方法。
- 構造的要素が、ヘアピン、ループ、Z-DNA構造、G-四重鎖、三重鎖、i-モチーフ、バルジ、三重鎖、三叉結合、十字形構造、四重ループ、リボースジッパー、またはシュードノットである、請求項71に記載の方法。
- 核酸結合分子が基質の表面に結合され、他の核酸結合分子から空間的に分離され、各標的核酸が1つの標的核酸結合分子にのみ接触できるようにする、請求項54から72のいずれか一項に記載の方法。
- 核酸バーコードが、該バーコードまたはその相補体を標的核酸の5’末端または3’末端に共有結合させることにより標的核酸に転写される、請求項54から73のいずれか一項に記載の方法。
- 核酸バーコードが、一本鎖ライゲーション、スプリントライゲーション、プライマー伸長、または二本鎖ライゲーションによって酵素的に標的核酸にトランスファーされる、請求項54から73のいずれか一項に記載の方法。
- 核酸バーコードが、化学的ライゲーションによって標的核酸にトランスファーされる、請求項54~73のいずれか一項に記載の方法。
- 修飾が、核酸結合分子を標的核酸に光化学的または化学的に連結することを含む、請求項54から76のいずれか一項に記載の方法。
- 結合ドメインが、核酸標的との共有結合反応を促進する配向で化学架橋部分を提示する、請求項54から77のいずれか一項に記載の方法。
- 修飾が、核酸結合分子が標的核酸に結合する部位またはその近傍の塩基を編集することを含む、請求項54から77のいずれか一項に記載の方法。
- 複数の標的核酸における2以上の非古典的特徴を検出する方法および/または定量する方法であって、
(i)標的核酸を少なくとも2つの核酸結合分子と接触させる工程であって、各核酸結合分子が結合ドメインおよびアダプターを含み、各核酸結合分子の結合ドメインがDNAまたはRNAの異なる非古典的特徴に結合し、アダプターが各結合ドメインによって特異的に結合される非古典的特徴に特異的な核酸バーコード配列を含む、工程;
(ii)(a)バーコード化核酸のオフターゲット生成を実質的に阻止する環境下で、バーコード化標的核酸を生成するために、核酸バーコードを標的核酸にトランスファーさせるか、または(b)標的核酸のバーコード化コピーを生成する、工程;
(iii)非古典的特徴の位置がバーコード化標的核酸またはそのバーコード化コピーの一次核酸配列に基づいて同定可能であるように、バーコード化標的核酸またはそのバーコード化コピーを改変する工程;および
(vi)バーコード化標的核酸を配列決定する工程
を含む、方法。 - 配列決定の前に、バーコード化標的核酸またはそのコピーを増幅することを含む、請求項80に記載の方法。
- 標的核酸がDNA、RNAまたはそれらの混合物を含む、請求項80または81に記載の方法。
- 非古典的特徴の少なくとも1つが修飾ヌクレオシドである、請求項80から82のいずれか一項に記載の方法。
- 修飾ヌクレオシドが、3-メチルシチジン(m3C)、5-メチルシチジン(m5C)、N4-アセチルシチジン(ac4C)、シュードウリジン(Ψ)、1-メチルアデノシン(m1A)、N6-メチルアデノシン(m6A)、イノシン(I)、7-メチルグアノシン(m7G)、ジヒドロウリジン(D)、3-メチルウリジン(m3U)、5-メチルウリジン(m5U)、1-メチルグアノシン(m1G)、N2-メチルグアノシン(m2G)、5-メチルデオキシシチジン(m5dC)、N4-メチルデオキシシチジン、5-ヒドロキシメチルシチジン(5-hmC)、5-ヒドロキシメチルデオキシシチジン(5hmdC)、5-カルボキシデオキシシチジン(5cadC)、5-ホルミルシチジン(5fC)、5-ホルミルデオキシシチジン(5fdC)、6-メチルデオキシアデノシン、N7-メチルグアノシン(m7G)、2,7,2’-メチルグアノシン、またはリボースメチル化(Nm)である、請求項83に記載の方法。
- 非古典的特徴が核酸損傷である、請求項82に記載の方法。
- 核酸損傷が酸化プロセスまたは紫外線との接触に起因する、請求項85に記載の方法。
- 核酸損傷が、外因性薬剤による大きい付加体形成または塩基アルキル化に起因する、請求項85に記載の方法。
- 損傷が、8-オキソグアニン(8-oxoG)、1以上の脱塩基部位、シス-プラチン架橋、ベンゾ(a)ピレンジオールエポキシド(BPDE)付加体、シクロブテンピリミジン二量体(CPD)、ピリミジン-ピリミドン(6-4)光生成物(6-4PP)、6-O-メチルグアニン(O6-MedG)、またはO6-(カルボキシメチル)-2’-デオキシグアノシン(O6-CMdG)である、請求項82に記載の核酸結合分子。
- 非古典的特徴の少なくとも1つが構造的要素である、請求項80から82のいずれか一項に記載の方法。
- 構造的要素が、ヘアピン、ループ、Z-DNA構造、G-四重鎖、三重鎖、i-モチーフ、バルジ、三重鎖、三叉結合、十字形構造、四重ループ、リボースジッパー、またはシュードノットである、請求項89に記載の方法。
- 核酸結合分子が基質の表面に結合され、各標的核酸が1つの標的核酸結合分子のみに接触できるように空間的に分離されている、請求項80から90のいずれか一項に記載の方法。
- 核酸バーコードが、バーコードまたはその相補体を標的核酸の5’末端または3’末端に共有結合させることにより標的核酸にトランスファーされる、請求項80から91のいずれか一項に記載の方法。
- 核酸バーコードが、一本鎖ライゲーション、スプリントライゲーション、プライマー伸長、または二本鎖ライゲーションにより酵素的に標的核酸にトランスファーされる、請求項80から91のいずれか一項に記載の方法。
- 核酸バーコードが、化学的ライゲーションによって標的核酸にトランスファーされる、請求項80から90のいずれか一項に記載の方法。
- 修飾が、核酸結合分子を標的核酸に光化学的に連結することを含む、請求項80から94のいずれか1項に記載の方法。
- 修飾が、核酸結合分子が標的核酸に結合している部位またはその近傍の塩基を編集することを含む、請求項80から94のいずれか一項に記載の方法。
- 標的核酸における非古典的特徴を検出する方法であって、
(i)標的核酸を請求項1から28のいずれか一項に記載の核酸結合分子と接触させる工程;
(ii)バーコード化核酸のオフターゲット生成を実質的に阻止する環境下で、(a)核酸バーコードを標的核酸にトランスファーしてバーコード化標的核酸を生成する工程;および
(iii)標的核酸またはそのコピー中のバーコードの存在を検出する工程
を含む、方法。 - 非古典的特徴が修飾ヌクレオシドである、請求項97に記載の方法。
- 修飾ヌクレオシドが、3-メチルシチジン(m3C)、5-メチルシチジン(m5C)、N4-アセチルシチジン(ac4C)、シュードウリジン(Ψ)、1-メチルアデノシン(m1A)、N6-メチルアデノシン(m6A)、イノシン(I)、7-メチルグアノシン(m7G)、ジヒドロウリジン(D)、3-メチルウリジン(m3U)、5-メチルウリジン(m5U)、1-メチルグアノシン(m1G)、N2-メチルグアノシン(m2G)、5-メチルデオキシシチジン(m5dC)、N4-メチルデオキシシチジン、5-ヒドロキシメチルシチジン(5-hmC)、5-ヒドロキシメチルデオキシシチジン(5hmdC)、5-カルボキシデオキシシチジン(5cadC)、5-ホルミルシチジン(5fC)、5-ホルミルデオキシシチジン(5fdC)、6-メチルデオキシアデノシン、N7-メチルグアノシン(m7G)、2,7,2’-メチルグアノシン、またはリボースメチル化(Nm)である、請求項98に記載の方法。
- 非古典的特徴が核酸損傷である、請求項97に記載の方法。
- 核酸損傷が酸化的過程または紫外線との接触に起因する、請求項100に記載の方法。
- 核酸損傷が、外因性薬剤による大きい付加体形成または塩基アルキル化に起因する、請求項100に記載の方法。
- 損傷が、8-オキソグアニン(8-oxoG)、1以上の脱塩基部位、シス-プラチン架橋、ベンゾ(a)ピレンジオールエポキシド(BPDE)付加体、シクロブテンピリミジン二量体(CPD)、ピリミジン-ピリミドン(6-4)光生成物(6-4PP)、6-O-メチルグアニン(O6-MedG)、またはO6-(カルボキシメチル)-2’-デオキシグアノシン(O6-CMdG)である、請求項100に記載の方法。
- 非古典的特徴が構造的要素である、請求項100に記載の方法。
- 構造的要素が、ヘアピン、ループ、Z-DNA構造、G-四重鎖、三重鎖、i-モチーフ、バルジ、三重鎖、三叉結合、十字形構造、四重ループ、リボースジッパー、またはシュードノットである、請求項104に記載の方法。
- トランスファーが、バーコードまたはその相補体を標的核酸の5’末端または3’末端に共有結合させることを含む、請求項97から105のいずれか一項に記載の方法。
- 核酸バーコードが、一本鎖ライゲーション、スプリントライゲーション、スプリント伸長、テンプレート伸長、または二本鎖ライゲーションによって標的核酸に転移される、請求項97から105のいずれか一項に記載の方法。
- 核酸バーコードが、化学ライゲーションによって標的核酸に転写される、請求項97から105のいずれか一項に記載の方法。
- 工程(i)~(iii)を少なくとも1回反復する、請求項97から108のいずれか一項に記載の方法。
- バーコードの存在を検出することが、バーコード化標的核酸またはそのバーコード化コピーを改変することを含む、請求項97から109のいずれか一項に記載の方法。
- バーコードの存在を検出することが、バーコード化標的核酸またはそのコピーを増幅することを包含する、請求項97から109のいずれか一項に記載の方法。
- バーコードの存在を検出することが、バーコード化標的核酸を配列決定することを包含する、請求項97から109のいずれか一項に記載の方法。
- 標的核酸中の非古典的特徴の位置を、一塩基分解能付近または一塩基分解能で決定するための方法であって、
(i)標的核酸を請求項1から28のいずれか一項に記載の核酸結合分子と接触させる工程;
(ii)バーコード化核酸のオフターゲット生成を実質的に阻止する環境下で、核酸バーコードを標的核酸にトランスファーしてバーコード化標的核酸を生成する工程;および
(iii)標的核酸またはそのコピー中のバーコードの存在を検出する工程;
ここで、核酸結合分子は、以下のうち1以上が可能な結合ドメインを含む:
(c)標的核酸に変異を誘発する;または
(d)ポリメラーゼバイパスを阻止することにより、標的核酸のコピー間に切断を引き起こす、
を含む、方法。 - ポリメラーゼバイパスを阻止することが、核酸結合分子を標的核酸に化学的または光化学的に連結することを含む、請求項113に記載の方法。
- ポリメラーゼバイパスを防止することが、標的核酸のコピー間に切断を誘発するように結合ドメインを化学的に改変することを含む、請求項113に記載の方法。
- 非古典的特徴が修飾ヌクレオシドである、請求項113から115のいずれか一項に記載の方法。
- 修飾ヌクレオシドが、3-メチルシチジン(m3C)、5-メチルシチジン(m5C)、N4-アセチルシチジン(ac4C)、シュードウリジン(Ψ)、1-メチルアデノシン(m1A)、N6-メチルアデノシン(m6A)、イノシン(I)、7-メチルグアノシン(m7G)、ジヒドロウリジン(D)、3-メチルウリジン(m3U)、5-メチルウリジン(m5U)、1-メチルグアノシン(m1G)、N2-メチルグアノシン(m2G)、5-メチルデオキシシチジン(m5dC)、N4-メチルデオキシシチジン、5-ヒドロキシメチルシチジン(5-hmC)、5-ヒドロキシメチルデオキシシチジン(5hmdC)、5-カルボキシデオキシシチジン(5cadC)、5-ホルミルシチジン(5fC)、5-ホルミルデオキシシチジン(5fdC)、6-メチルデオキシアデノシン、N7-メチルグアノシン(m7G)、2,7,2’-メチルグアノシン、またはリボースメチル化(Nm)である、請求項116に記載の方法。
- 非古典的特徴が核酸損傷である、請求項113から115のいずれか一項に記載の方法。
- 核酸損傷が酸化的過程または紫外線との接触に起因する、請求項118に記載の方法。
- 核酸損傷が、外因性薬剤による大きい付加体形成または塩基アルキル化に起因する、請求項118に記載の方法。
- 前記損傷が、8-オキソグアニン(8-oxoG)、1以上の脱塩基部位、シス-プラチン架橋、ベンゾ(a)ピレンジオールエポキシド(BPDE)付加体、シクロブテンピリミジン二量体(CPD)、ピリミジン-ピリミドン(6-4)光生成物(6-4PP)、6-O-メチルグアニン(O6-MedG)、またはO6-(カルボキシメチル)-2’-デオキシグアノシン(O6-CMdG)である、請求項118に記載の方法。
- 非古典的特徴が構造的要素である、請求項113から115のいずれか一項に記載の方法。
- 構造的要素が、ヘアピン、ループ、Z-DNA構造、G-四重鎖、三重鎖、i-モチーフ、バルジ、三重鎖、三方結合、十字形構造、四重鎖、リボースジッパー、またはシュードノットである、請求項122に記載の方法。
- トランスファーが、バーコードまたはその相補体を標的核酸の5’末端または3’末端に共有結合させることを含む、請求項113から123のいずれか一項に記載の方法。
- 工程(i)~(iii)を少なくとも1回反復する、請求項113から123のいずれか一項に記載の方法。
- 工程(i)~(iii)を反復する毎に、異なる核酸結合分子が用いられる、請求項124に記載の方法。
- 工程(i)~(iii)を反復する毎に、同じ核酸結合分子を用いる、請求項124に記載の方法。
- バーコードの存在を検出することが、バーコード化標的核酸またはそのバーコード化コピーを改変することを含む、請求項113から127のいずれか一項に記載の方法。
- バーコードの存在を検出することが、バーコード化標的核酸またはそのコピーを増幅することを包含する、請求項113から127のいずれか一項に記載の方法。
- バーコードの存在を検出することが、バーコード化標的核酸を配列決定することを包含する、請求項113から127のいずれか一項に記載の方法。
- バーコードの存在を検出することが、核酸および核酸結合分子のアダプターを配列決定することを包含する、請求項113から127のいずれか一項に記載の方法。
- 核酸バーコードを標的核酸にトランスファーさせることが、バーコードまたはその相補体を標的核酸の5’末端または3’末端に共有結合させることを含む、請求項113から131のいずれか一項に記載の方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063118409P | 2020-11-25 | 2020-11-25 | |
US63/118,409 | 2020-11-25 | ||
US202163193402P | 2021-05-26 | 2021-05-26 | |
US63/193,402 | 2021-05-26 | ||
PCT/US2021/060829 WO2022115608A1 (en) | 2020-11-25 | 2021-11-24 | Multiplexed profiling of rna and dna modifications |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023551072A true JP2023551072A (ja) | 2023-12-06 |
Family
ID=79019247
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023555121A Pending JP2023551072A (ja) | 2020-11-25 | 2021-11-24 | Rnaおよびdna修飾の多重プロファイリング |
Country Status (6)
Country | Link |
---|---|
US (3) | US11773425B2 (ja) |
EP (1) | EP4251760A1 (ja) |
JP (1) | JP2023551072A (ja) |
AU (1) | AU2021385367A1 (ja) |
CA (1) | CA3199189A1 (ja) |
WO (1) | WO2022115608A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8835358B2 (en) | 2009-12-15 | 2014-09-16 | Cellular Research, Inc. | Digital counting of individual molecules by stochastic attachment of diverse labels |
WO2023097295A1 (en) * | 2021-11-24 | 2023-06-01 | Alida Biosciences, Inc. | Rna and dna analysis using engineered surfaces |
CN115386966B (zh) * | 2022-10-26 | 2023-03-21 | 北京寻因生物科技有限公司 | Dna表观修饰的建库方法、测序方法及其建库试剂盒 |
WO2024097718A1 (en) * | 2022-11-02 | 2024-05-10 | Becton, Dickinson And Company | Polymerase mediated end modification of abseq |
WO2024112948A1 (en) | 2022-11-23 | 2024-05-30 | Alida Biosciences, Inc. | Chromatin profiling compositions and methods |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6096526A (en) * | 1998-05-20 | 2000-08-01 | Incyte Pharmaceuticals, Inc. | Human nucleic acid methylases |
US20050136414A1 (en) * | 2003-12-23 | 2005-06-23 | Kevin Gunderson | Methods and compositions for making locus-specific arrays |
US9222936B2 (en) * | 2007-04-18 | 2015-12-29 | Solulink, Inc. | Methods and/or use of oligonucleotide conjugates for suppressing background due to cross-hybridization |
US9714948B2 (en) * | 2014-10-27 | 2017-07-25 | Yingjian Wang | Method for high-throughput protein detection with two antibody microarrays |
US11401544B2 (en) * | 2017-05-05 | 2022-08-02 | The United States Of America, As Represented By The Secretary, Department Of Health And Human Services | Methods of preparing a re-usable single cell and methods for analyzing the epigenome, transcriptome, and genome of a single cell |
US20200355673A1 (en) * | 2017-11-22 | 2020-11-12 | The University Of Chicago | Chemical probe-dependent evaluation of protein activity and uses thereof |
US10871467B2 (en) * | 2017-12-13 | 2020-12-22 | Cannaptic Biosciences, LLC | Cannabinoid profiling using nanopore transduction |
US20220111019A1 (en) * | 2018-09-19 | 2022-04-14 | Virginia Tech Intellectual Properties, Inc. | Brca1 modulating compounds, formulations thereof, and uses thereof |
EP4004231A1 (en) * | 2019-07-22 | 2022-06-01 | Becton, Dickinson and Company | Single cell chromatin immunoprecipitation sequencing assay |
WO2021076656A1 (en) * | 2019-10-15 | 2021-04-22 | University Of Massachusetts | Rna editor-enhanced rna trans-splicing |
-
2021
- 2021-11-24 JP JP2023555121A patent/JP2023551072A/ja active Pending
- 2021-11-24 WO PCT/US2021/060829 patent/WO2022115608A1/en active Application Filing
- 2021-11-24 EP EP21830371.7A patent/EP4251760A1/en active Pending
- 2021-11-24 AU AU2021385367A patent/AU2021385367A1/en active Pending
- 2021-11-24 CA CA3199189A patent/CA3199189A1/en active Pending
-
2022
- 2022-03-28 US US17/706,493 patent/US11773425B2/en active Active
- 2022-03-28 US US17/706,470 patent/US20220298542A1/en active Pending
-
2023
- 2023-10-02 US US18/479,622 patent/US20240110222A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20240110222A1 (en) | 2024-04-04 |
CA3199189A1 (en) | 2022-06-02 |
AU2021385367A1 (en) | 2023-06-29 |
WO2022115608A1 (en) | 2022-06-02 |
WO2022115608A9 (en) | 2023-06-15 |
US20220298542A1 (en) | 2022-09-22 |
EP4251760A1 (en) | 2023-10-04 |
AU2021385367A9 (en) | 2024-05-30 |
US20220298543A1 (en) | 2022-09-22 |
US11773425B2 (en) | 2023-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11965209B2 (en) | Method for obtaining structural information concerning an encoded molecule and method for selecting compounds | |
JP2023551072A (ja) | Rnaおよびdna修飾の多重プロファイリング | |
US11459602B2 (en) | Method for generating double stranded DNA libraries and sequencing methods for the identification of methylated cytosines | |
US11466307B2 (en) | Compositions for RNA-chromatin interaction analysis and uses thereof | |
DK2348125T3 (en) | Process for the synthesis of a bifunctional complex | |
JP7026248B2 (ja) | 二本鎖dnaを増幅するための方法およびキット | |
CN102317475A (zh) | 单链dna的不依赖模板的连接 | |
US20190264201A1 (en) | Dna library construction of immobilized chromatin immunoprecipitated dna | |
SG185239A1 (en) | Method for identifying nucleic acids bound to an analyte | |
JP2023539169A (ja) | 二本鎖切断を単離するための方法 | |
US20240002921A1 (en) | Rna and dna analysis using engineered surfaces | |
CN116964220A (zh) | Rna和dna修饰的多路复用分析 | |
WO2024112948A1 (en) | Chromatin profiling compositions and methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20231222 |