KR20240055098A - 화학적 변형을 갖는 가이드 rna를 사용하는 방법 - Google Patents
화학적 변형을 갖는 가이드 rna를 사용하는 방법 Download PDFInfo
- Publication number
- KR20240055098A KR20240055098A KR1020247011826A KR20247011826A KR20240055098A KR 20240055098 A KR20240055098 A KR 20240055098A KR 1020247011826 A KR1020247011826 A KR 1020247011826A KR 20247011826 A KR20247011826 A KR 20247011826A KR 20240055098 A KR20240055098 A KR 20240055098A
- Authority
- KR
- South Korea
- Prior art keywords
- cells
- target
- guide rna
- modified
- nucleotides
- Prior art date
Links
- 108020005004 Guide RNA Proteins 0.000 title claims abstract description 418
- 238000000034 method Methods 0.000 title claims abstract description 209
- 238000007385 chemical modification Methods 0.000 title description 11
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 244
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 82
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 75
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 75
- 230000014509 gene expression Effects 0.000 claims abstract description 57
- 238000000338 in vitro Methods 0.000 claims abstract description 18
- 210000004027 cell Anatomy 0.000 claims description 369
- 108090000623 proteins and genes Proteins 0.000 claims description 333
- 102000004169 proteins and genes Human genes 0.000 claims description 283
- 239000002773 nucleotide Substances 0.000 claims description 185
- 230000004048 modification Effects 0.000 claims description 148
- 238000012986 modification Methods 0.000 claims description 148
- 108091033409 CRISPR Proteins 0.000 claims description 128
- 108020004999 messenger RNA Proteins 0.000 claims description 82
- 101710163270 Nuclease Proteins 0.000 claims description 81
- 210000002966 serum Anatomy 0.000 claims description 41
- 102000004389 Ribonucleoproteins Human genes 0.000 claims description 32
- 108010081734 Ribonucleoproteins Proteins 0.000 claims description 32
- ZJAOAACCNHFJAH-UHFFFAOYSA-N phosphonoformic acid Chemical compound OC(=O)P(O)(O)=O ZJAOAACCNHFJAH-UHFFFAOYSA-N 0.000 claims description 27
- 238000001727 in vivo Methods 0.000 claims description 22
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 claims description 21
- 230000033228 biological regulation Effects 0.000 claims description 20
- 239000006143 cell culture medium Substances 0.000 claims description 18
- 239000012530 fluid Substances 0.000 claims description 18
- 239000002105 nanoparticle Substances 0.000 claims description 18
- 230000001105 regulatory effect Effects 0.000 claims description 13
- XUYJLQHKOGNDPB-UHFFFAOYSA-N phosphonoacetic acid Chemical group OC(=O)CP(O)(O)=O XUYJLQHKOGNDPB-UHFFFAOYSA-N 0.000 claims description 8
- 210000001124 body fluid Anatomy 0.000 claims description 7
- 230000003834 intracellular effect Effects 0.000 claims description 7
- 210000001175 cerebrospinal fluid Anatomy 0.000 claims description 6
- 238000010354 CRISPR gene editing Methods 0.000 claims 1
- 108020004414 DNA Proteins 0.000 abstract description 91
- 239000000203 mixture Substances 0.000 abstract description 19
- 238000010453 CRISPR/Cas method Methods 0.000 abstract description 10
- 108091032973 (ribonucleotides)n+m Proteins 0.000 abstract description 4
- 230000000694 effects Effects 0.000 description 98
- 102000053602 DNA Human genes 0.000 description 89
- 108090000765 processed proteins & peptides Proteins 0.000 description 61
- 229920002477 rna polymer Polymers 0.000 description 55
- 229920001184 polypeptide Polymers 0.000 description 54
- 102000004196 processed proteins & peptides Human genes 0.000 description 54
- 102100031780 Endonuclease Human genes 0.000 description 50
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 49
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 37
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 36
- 230000027455 binding Effects 0.000 description 36
- 102000040430 polynucleotide Human genes 0.000 description 36
- 108091033319 polynucleotide Proteins 0.000 description 36
- 239000002157 polynucleotide Substances 0.000 description 36
- 238000001890 transfection Methods 0.000 description 36
- 102000004190 Enzymes Human genes 0.000 description 34
- 108090000790 Enzymes Proteins 0.000 description 34
- 230000035772 mutation Effects 0.000 description 31
- 238000010362 genome editing Methods 0.000 description 28
- 108020001507 fusion proteins Proteins 0.000 description 26
- 102000037865 fusion proteins Human genes 0.000 description 26
- 239000000872 buffer Substances 0.000 description 24
- 239000000306 component Substances 0.000 description 24
- 239000013604 expression vector Substances 0.000 description 24
- 101001048956 Homo sapiens Homeobox protein EMX1 Proteins 0.000 description 22
- 230000006870 function Effects 0.000 description 22
- 108091028043 Nucleic acid sequence Proteins 0.000 description 21
- 239000012634 fragment Substances 0.000 description 21
- 230000001404 mediated effect Effects 0.000 description 21
- 238000011282 treatment Methods 0.000 description 20
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 19
- 238000002474 experimental method Methods 0.000 description 19
- 230000008685 targeting Effects 0.000 description 19
- 238000013518 transcription Methods 0.000 description 19
- 230000035897 transcription Effects 0.000 description 19
- 102100023823 Homeobox protein EMX1 Human genes 0.000 description 18
- 108091079001 CRISPR RNA Proteins 0.000 description 17
- 210000001744 T-lymphocyte Anatomy 0.000 description 17
- -1 deaminases Proteins 0.000 description 17
- 230000004913 activation Effects 0.000 description 16
- 239000002609 medium Substances 0.000 description 16
- 102100021519 Hemoglobin subunit beta Human genes 0.000 description 15
- 201000010099 disease Diseases 0.000 description 15
- 241001465754 Metazoa Species 0.000 description 14
- 108091028113 Trans-activating crRNA Proteins 0.000 description 14
- 238000003776 cleavage reaction Methods 0.000 description 14
- 238000013461 design Methods 0.000 description 14
- 230000007017 scission Effects 0.000 description 14
- 210000000130 stem cell Anatomy 0.000 description 14
- 238000006467 substitution reaction Methods 0.000 description 14
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 13
- 108091027544 Subgenomic mRNA Proteins 0.000 description 13
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 13
- 230000037431 insertion Effects 0.000 description 13
- 238000003780 insertion Methods 0.000 description 13
- 108010043471 Core Binding Factor Alpha 2 Subunit Proteins 0.000 description 12
- 108091034117 Oligonucleotide Proteins 0.000 description 12
- 102100025373 Runt-related transcription factor 1 Human genes 0.000 description 12
- 239000003795 chemical substances by application Substances 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 12
- 102100030768 ETS domain-containing transcription factor ERF Human genes 0.000 description 11
- 101000938776 Homo sapiens ETS domain-containing transcription factor ERF Proteins 0.000 description 11
- 230000000295 complement effect Effects 0.000 description 10
- 230000037430 deletion Effects 0.000 description 10
- 238000012217 deletion Methods 0.000 description 10
- 230000005782 double-strand break Effects 0.000 description 10
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 10
- 239000002777 nucleoside Substances 0.000 description 10
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 10
- 238000010446 CRISPR interference Methods 0.000 description 9
- 150000001413 amino acids Chemical class 0.000 description 9
- 229920000642 polymer Polymers 0.000 description 9
- 238000003259 recombinant expression Methods 0.000 description 9
- 238000005406 washing Methods 0.000 description 9
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 8
- 208000026350 Inborn Genetic disease Diseases 0.000 description 8
- 102220557642 Sperm acrosome-associated protein 5_D10N_mutation Human genes 0.000 description 8
- 241000193996 Streptococcus pyogenes Species 0.000 description 8
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 8
- 238000004458 analytical method Methods 0.000 description 8
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical group O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 8
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 8
- 239000012636 effector Substances 0.000 description 8
- 230000004927 fusion Effects 0.000 description 8
- 208000016361 genetic disease Diseases 0.000 description 8
- 230000006872 improvement Effects 0.000 description 8
- 230000006780 non-homologous end joining Effects 0.000 description 8
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 8
- 230000002829 reductive effect Effects 0.000 description 8
- 239000000126 substance Substances 0.000 description 8
- 239000013598 vector Substances 0.000 description 8
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 7
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 7
- 102100026846 Cytidine deaminase Human genes 0.000 description 7
- 108010031325 Cytidine deaminase Proteins 0.000 description 7
- 230000007018 DNA scission Effects 0.000 description 7
- DILVWDXOASDRPN-MROZADKFSA-N [(2r,3r,4r)-3,4,5-trihydroxy-1-oxopentan-2-yl] dihydrogen phosphate Chemical compound OC[C@@H](O)[C@@H](O)[C@H](C=O)OP(O)(O)=O DILVWDXOASDRPN-MROZADKFSA-N 0.000 description 7
- 238000012761 co-transfection Methods 0.000 description 7
- 229910052739 hydrogen Inorganic materials 0.000 description 7
- 239000001257 hydrogen Substances 0.000 description 7
- 239000011541 reaction mixture Substances 0.000 description 7
- 125000002652 ribonucleotide group Chemical group 0.000 description 7
- 210000001519 tissue Anatomy 0.000 description 7
- 230000003612 virological effect Effects 0.000 description 7
- YIMATHOGWXZHFX-WCTZXXKLSA-N (2r,3r,4r,5r)-5-(hydroxymethyl)-3-(2-methoxyethoxy)oxolane-2,4-diol Chemical compound COCCO[C@H]1[C@H](O)O[C@H](CO)[C@H]1O YIMATHOGWXZHFX-WCTZXXKLSA-N 0.000 description 6
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 6
- 102000004678 Exoribonucleases Human genes 0.000 description 6
- 108010002700 Exoribonucleases Proteins 0.000 description 6
- 101150013707 HBB gene Proteins 0.000 description 6
- 230000007022 RNA scission Effects 0.000 description 6
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 6
- 101710172430 Uracil-DNA glycosylase inhibitor Proteins 0.000 description 6
- 241000700605 Viruses Species 0.000 description 6
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 6
- 238000013459 approach Methods 0.000 description 6
- 239000010839 body fluid Substances 0.000 description 6
- 238000004113 cell culture Methods 0.000 description 6
- 238000004520 electroporation Methods 0.000 description 6
- 239000012091 fetal bovine serum Substances 0.000 description 6
- 210000002865 immune cell Anatomy 0.000 description 6
- 238000010348 incorporation Methods 0.000 description 6
- 230000000670 limiting effect Effects 0.000 description 6
- 238000001638 lipofection Methods 0.000 description 6
- 210000005105 peripheral blood lymphocyte Anatomy 0.000 description 6
- 210000003819 peripheral blood mononuclear cell Anatomy 0.000 description 6
- 238000011084 recovery Methods 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 230000037426 transcriptional repression Effects 0.000 description 6
- 238000013519 translation Methods 0.000 description 6
- 238000011144 upstream manufacturing Methods 0.000 description 6
- 108700028369 Alleles Proteins 0.000 description 5
- 108091093088 Amplicon Proteins 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 5
- 230000033616 DNA repair Effects 0.000 description 5
- 108010033040 Histones Proteins 0.000 description 5
- 241000282412 Homo Species 0.000 description 5
- 241000713869 Moloney murine leukemia virus Species 0.000 description 5
- 206010028980 Neoplasm Diseases 0.000 description 5
- 102100022433 Single-stranded DNA cytosine deaminase Human genes 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 239000006227 byproduct Substances 0.000 description 5
- 210000004748 cultured cell Anatomy 0.000 description 5
- 238000012350 deep sequencing Methods 0.000 description 5
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 5
- 208000015181 infectious disease Diseases 0.000 description 5
- 239000002502 liposome Substances 0.000 description 5
- 125000003835 nucleoside group Chemical group 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 230000002103 transcriptional effect Effects 0.000 description 5
- 229940045145 uridine Drugs 0.000 description 5
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 4
- 108091027075 5S-rRNA precursor Proteins 0.000 description 4
- 229930024421 Adenine Natural products 0.000 description 4
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 4
- 102000055025 Adenosine deaminases Human genes 0.000 description 4
- 108091023037 Aptamer Proteins 0.000 description 4
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 4
- 108700004991 Cas12a Proteins 0.000 description 4
- 108010093099 Endoribonucleases Proteins 0.000 description 4
- 108060002716 Exonuclease Proteins 0.000 description 4
- 101000914514 Homo sapiens T-cell-specific surface glycoprotein CD28 Proteins 0.000 description 4
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 4
- 238000011529 RT qPCR Methods 0.000 description 4
- 102000006382 Ribonucleases Human genes 0.000 description 4
- 108010083644 Ribonucleases Proteins 0.000 description 4
- 101710143275 Single-stranded DNA cytosine deaminase Proteins 0.000 description 4
- 102100027213 T-cell-specific surface glycoprotein CD28 Human genes 0.000 description 4
- 108700009124 Transcription Initiation Site Proteins 0.000 description 4
- 229960000643 adenine Drugs 0.000 description 4
- 229960005305 adenosine Drugs 0.000 description 4
- 125000003275 alpha amino acid group Chemical group 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 210000004369 blood Anatomy 0.000 description 4
- 239000008280 blood Substances 0.000 description 4
- 210000000601 blood cell Anatomy 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 4
- 108020001778 catalytic domains Proteins 0.000 description 4
- 230000003197 catalytic effect Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 229940104302 cytosine Drugs 0.000 description 4
- 230000002950 deficient Effects 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 208000035475 disorder Diseases 0.000 description 4
- 102000013165 exonuclease Human genes 0.000 description 4
- 238000009396 hybridization Methods 0.000 description 4
- 230000005764 inhibitory process Effects 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 238000000520 microinjection Methods 0.000 description 4
- 150000003833 nucleoside derivatives Chemical class 0.000 description 4
- 230000009437 off-target effect Effects 0.000 description 4
- 239000002245 particle Substances 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 210000004986 primary T-cell Anatomy 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 239000012429 reaction media Substances 0.000 description 4
- 238000009738 saturating Methods 0.000 description 4
- 238000012163 sequencing technique Methods 0.000 description 4
- 208000024891 symptom Diseases 0.000 description 4
- 101710199622 tRNA-specific adenosine deaminase Proteins 0.000 description 4
- 230000001225 therapeutic effect Effects 0.000 description 4
- 229940113082 thymine Drugs 0.000 description 4
- 108091006106 transcriptional activators Proteins 0.000 description 4
- ZLOIGESWDJYCTF-XVFCMESISA-N 4-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=S)C=C1 ZLOIGESWDJYCTF-XVFCMESISA-N 0.000 description 3
- ZAYHVCMSTBRABG-UHFFFAOYSA-N 5-Methylcytidine Natural products O=C1N=C(N)C(C)=CN1C1C(O)C(O)C(CO)O1 ZAYHVCMSTBRABG-UHFFFAOYSA-N 0.000 description 3
- ZAYHVCMSTBRABG-JXOAFFINSA-N 5-methylcytidine Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZAYHVCMSTBRABG-JXOAFFINSA-N 0.000 description 3
- 102100036301 C-C chemokine receptor type 7 Human genes 0.000 description 3
- 102100027207 CD27 antigen Human genes 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- 241000701022 Cytomegalovirus Species 0.000 description 3
- 230000004568 DNA-binding Effects 0.000 description 3
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 3
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 3
- 108010042407 Endonucleases Proteins 0.000 description 3
- 102100030013 Endoribonuclease Human genes 0.000 description 3
- 239000012571 GlutaMAX medium Substances 0.000 description 3
- 102000011787 Histone Methyltransferases Human genes 0.000 description 3
- 108010036115 Histone Methyltransferases Proteins 0.000 description 3
- 101000716065 Homo sapiens C-C chemokine receptor type 7 Proteins 0.000 description 3
- 101000914511 Homo sapiens CD27 antigen Proteins 0.000 description 3
- 101001018097 Homo sapiens L-selectin Proteins 0.000 description 3
- 102100033467 L-selectin Human genes 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- 102000055027 Protein Methyltransferases Human genes 0.000 description 3
- 108700040121 Protein Methyltransferases Proteins 0.000 description 3
- 102100039156 Queuine tRNA-ribosyltransferase catalytic subunit 1 Human genes 0.000 description 3
- 239000012980 RPMI-1640 medium Substances 0.000 description 3
- 108091028664 Ribonucleotide Proteins 0.000 description 3
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 3
- 241000714474 Rous sarcoma virus Species 0.000 description 3
- 241000700584 Simplexvirus Species 0.000 description 3
- 241000194020 Streptococcus thermophilus Species 0.000 description 3
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical group OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 3
- 102000040945 Transcription factor Human genes 0.000 description 3
- 108091023040 Transcription factor Proteins 0.000 description 3
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 3
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 230000033590 base-excision repair Effects 0.000 description 3
- 201000011510 cancer Diseases 0.000 description 3
- 229910052799 carbon Inorganic materials 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000009472 formulation Methods 0.000 description 3
- 238000001502 gel electrophoresis Methods 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 239000001963 growth medium Substances 0.000 description 3
- 210000003494 hepatocyte Anatomy 0.000 description 3
- 239000004615 ingredient Substances 0.000 description 3
- 238000001990 intravenous administration Methods 0.000 description 3
- 150000002632 lipids Chemical class 0.000 description 3
- 239000011859 microparticle Substances 0.000 description 3
- 210000001616 monocyte Anatomy 0.000 description 3
- 239000000178 monomer Substances 0.000 description 3
- 210000000822 natural killer cell Anatomy 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 3
- 239000010452 phosphate Substances 0.000 description 3
- 210000002381 plasma Anatomy 0.000 description 3
- 239000013612 plasmid Substances 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 108010061997 queuine tRNA-ribosyltransferase Proteins 0.000 description 3
- 230000014493 regulation of gene expression Effects 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 239000002336 ribonucleotide Substances 0.000 description 3
- 230000005783 single-strand break Effects 0.000 description 3
- 238000010561 standard procedure Methods 0.000 description 3
- 238000002560 therapeutic procedure Methods 0.000 description 3
- 108091006107 transcriptional repressors Proteins 0.000 description 3
- 241000701161 unidentified adenovirus Species 0.000 description 3
- 229940035893 uracil Drugs 0.000 description 3
- MXYRZDAGKTVQIL-IOSLPCCCSA-N (2r,3r,4s,5r)-2-(6-aminopurin-9-yl)-5-(hydroxymethyl)-2-methyloxolane-3,4-diol Chemical compound C1=NC2=C(N)N=CN=C2N1[C@]1(C)O[C@H](CO)[C@@H](O)[C@H]1O MXYRZDAGKTVQIL-IOSLPCCCSA-N 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 2
- HXVKEKIORVUWDR-FDDDBJFASA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-(methylaminomethyl)-2-sulfanylidenepyrimidin-4-one Chemical compound S=C1NC(=O)C(CNC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 HXVKEKIORVUWDR-FDDDBJFASA-N 0.000 description 2
- PZNPLUBHRSSFHT-RRHRGVEJSA-N 1-hexadecanoyl-2-octadecanoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCCCC(=O)O[C@@H](COP([O-])(=O)OCC[N+](C)(C)C)COC(=O)CCCCCCCCCCCCCCC PZNPLUBHRSSFHT-RRHRGVEJSA-N 0.000 description 2
- MWBWWFOAEOYUST-UHFFFAOYSA-N 2-aminopurine Chemical compound NC1=NC=C2N=CNC2=N1 MWBWWFOAEOYUST-UHFFFAOYSA-N 0.000 description 2
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 2
- VZQXUWKZDSEQRR-SDBHATRESA-N 2-methylthio-N(6)-(Delta(2)-isopentenyl)adenosine Chemical compound C12=NC(SC)=NC(NCC=C(C)C)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VZQXUWKZDSEQRR-SDBHATRESA-N 0.000 description 2
- GJTBSTBJLVYKAU-XVFCMESISA-N 2-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=S)NC(=O)C=C1 GJTBSTBJLVYKAU-XVFCMESISA-N 0.000 description 2
- ZLOIGESWDJYCTF-UHFFFAOYSA-N 4-Thiouridine Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=S)C=C1 ZLOIGESWDJYCTF-UHFFFAOYSA-N 0.000 description 2
- OVONXEQGWXGFJD-UHFFFAOYSA-N 4-sulfanylidene-1h-pyrimidin-2-one Chemical compound SC=1C=CNC(=O)N=1 OVONXEQGWXGFJD-UHFFFAOYSA-N 0.000 description 2
- OIVLITBTBDPEFK-UHFFFAOYSA-N 5,6-dihydrouracil Chemical compound O=C1CCNC(=O)N1 OIVLITBTBDPEFK-UHFFFAOYSA-N 0.000 description 2
- VSCNRXVDHRNJOA-PNHWDRBUSA-N 5-(carboxymethylaminomethyl)uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(CNCC(O)=O)=C1 VSCNRXVDHRNJOA-PNHWDRBUSA-N 0.000 description 2
- VKLFQTYNHLDMDP-PNHWDRBUSA-N 5-carboxymethylaminomethyl-2-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=S)NC(=O)C(CNCC(O)=O)=C1 VKLFQTYNHLDMDP-PNHWDRBUSA-N 0.000 description 2
- QXDXBKZJFLRLCM-UAKXSSHOSA-N 5-hydroxyuridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(O)=C1 QXDXBKZJFLRLCM-UAKXSSHOSA-N 0.000 description 2
- YIZYCHKPHCPKHZ-PNHWDRBUSA-N 5-methoxycarbonylmethyluridine Chemical compound O=C1NC(=O)C(CC(=O)OC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 YIZYCHKPHCPKHZ-PNHWDRBUSA-N 0.000 description 2
- ZXIATBNUWJBBGT-JXOAFFINSA-N 5-methoxyuridine Chemical compound O=C1NC(=O)C(OC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZXIATBNUWJBBGT-JXOAFFINSA-N 0.000 description 2
- SNNBPMAXGYBMHM-JXOAFFINSA-N 5-methyl-2-thiouridine Chemical compound S=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 SNNBPMAXGYBMHM-JXOAFFINSA-N 0.000 description 2
- PNWOYKVCNDZOLS-UHFFFAOYSA-N 6-amino-5-chloro-1h-pyrimidin-2-one Chemical compound NC=1NC(=O)N=CC=1Cl PNWOYKVCNDZOLS-UHFFFAOYSA-N 0.000 description 2
- CLGFIVUFZRGQRP-UHFFFAOYSA-N 7,8-dihydro-8-oxoguanine Chemical class O=C1NC(N)=NC2=C1NC(=O)N2 CLGFIVUFZRGQRP-UHFFFAOYSA-N 0.000 description 2
- RGKBRPAAQSHTED-UHFFFAOYSA-N 8-oxoadenine Chemical compound NC1=NC=NC2=C1NC(=O)N2 RGKBRPAAQSHTED-UHFFFAOYSA-N 0.000 description 2
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 2
- 108010013043 Acetylesterase Proteins 0.000 description 2
- 101710142939 Adenosine deaminase 1 Proteins 0.000 description 2
- 101710095342 Apolipoprotein B Proteins 0.000 description 2
- 102100040202 Apolipoprotein B-100 Human genes 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 241000271566 Aves Species 0.000 description 2
- 241000589941 Azospirillum Species 0.000 description 2
- 241000606125 Bacteroides Species 0.000 description 2
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 2
- 210000001266 CD8-positive T-lymphocyte Anatomy 0.000 description 2
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 2
- 101150069031 CSN2 gene Proteins 0.000 description 2
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 2
- 208000024172 Cardiovascular disease Diseases 0.000 description 2
- 108010077544 Chromatin Proteins 0.000 description 2
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 2
- 102000000311 Cytosine Deaminase Human genes 0.000 description 2
- 108010080611 Cytosine Deaminase Proteins 0.000 description 2
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 2
- 241000702421 Dependoparvovirus Species 0.000 description 2
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 102000004533 Endonucleases Human genes 0.000 description 2
- 241000702189 Escherichia virus Mu Species 0.000 description 2
- 108091029865 Exogenous DNA Proteins 0.000 description 2
- 241000589601 Francisella Species 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 2
- 208000009329 Graft vs Host Disease Diseases 0.000 description 2
- 102000029812 HNH nuclease Human genes 0.000 description 2
- 108060003760 HNH nuclease Proteins 0.000 description 2
- 102100032606 Heat shock factor protein 1 Human genes 0.000 description 2
- 102100031573 Hematopoietic progenitor cell antigen CD34 Human genes 0.000 description 2
- 101710160287 Heterochromatin protein 1 Proteins 0.000 description 2
- 102000003893 Histone acetyltransferases Human genes 0.000 description 2
- 108090000246 Histone acetyltransferases Proteins 0.000 description 2
- 108090000353 Histone deacetylase Proteins 0.000 description 2
- 102000003964 Histone deacetylase Human genes 0.000 description 2
- 101000867525 Homo sapiens Heat shock factor protein 1 Proteins 0.000 description 2
- 101000777663 Homo sapiens Hematopoietic progenitor cell antigen CD34 Proteins 0.000 description 2
- 101001105486 Homo sapiens Proteasome subunit alpha type-7 Proteins 0.000 description 2
- 241000725303 Human immunodeficiency virus Species 0.000 description 2
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 2
- 229930010555 Inosine Natural products 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- 241000186660 Lactobacillus Species 0.000 description 2
- 208000019693 Lung disease Diseases 0.000 description 2
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 2
- 108060004795 Methyltransferase Proteins 0.000 description 2
- 102000016397 Methyltransferase Human genes 0.000 description 2
- 108010085220 Multiprotein Complexes Proteins 0.000 description 2
- 102000007474 Multiprotein Complexes Human genes 0.000 description 2
- 241000714177 Murine leukemia virus Species 0.000 description 2
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 2
- SLEHROROQDYRAW-KQYNXXCUSA-N N(2)-methylguanosine Chemical compound C1=NC=2C(=O)NC(NC)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O SLEHROROQDYRAW-KQYNXXCUSA-N 0.000 description 2
- UNUYMBPXEFMLNW-DWVDDHQFSA-N N-[(9-beta-D-ribofuranosylpurin-6-yl)carbamoyl]threonine Chemical compound C1=NC=2C(NC(=O)N[C@@H]([C@H](O)C)C(O)=O)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O UNUYMBPXEFMLNW-DWVDDHQFSA-N 0.000 description 2
- 241000588650 Neisseria meningitidis Species 0.000 description 2
- 208000012902 Nervous system disease Diseases 0.000 description 2
- 208000025966 Neurological disease Diseases 0.000 description 2
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 2
- 241001386753 Parvibaculum Species 0.000 description 2
- 229920002873 Polyethylenimine Polymers 0.000 description 2
- 241000605861 Prevotella Species 0.000 description 2
- 102100021201 Proteasome subunit alpha type-7 Human genes 0.000 description 2
- 238000003559 RNA-seq method Methods 0.000 description 2
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 2
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 2
- 102000018120 Recombinases Human genes 0.000 description 2
- 108010091086 Recombinases Proteins 0.000 description 2
- 229940122208 Ribonuclease inhibitor Drugs 0.000 description 2
- 101710141795 Ribonuclease inhibitor Proteins 0.000 description 2
- 102100037968 Ribonuclease inhibitor Human genes 0.000 description 2
- 241000589892 Treponema denticola Species 0.000 description 2
- 102000006943 Uracil-DNA Glycosidase Human genes 0.000 description 2
- 108010072685 Uracil-DNA Glycosidase Proteins 0.000 description 2
- 102100037111 Uracil-DNA glycosylase Human genes 0.000 description 2
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 2
- 241000605939 Wolinella succinogenes Species 0.000 description 2
- YXNIEZJFCGTDKV-UHFFFAOYSA-N X-Nucleosid Natural products O=C1N(CCC(N)C(O)=O)C(=O)C=CN1C1C(O)C(O)C(CO)O1 YXNIEZJFCGTDKV-UHFFFAOYSA-N 0.000 description 2
- 240000008042 Zea mays Species 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 2
- MVCRZALXJBDOKF-JPZHCBQBSA-N beta-hydroxywybutosine 5'-monophosphate Chemical compound C1=NC=2C(=O)N3C(CC(O)[C@H](NC(=O)OC)C(=O)OC)=C(C)N=C3N(C)C=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O MVCRZALXJBDOKF-JPZHCBQBSA-N 0.000 description 2
- 239000001506 calcium phosphate Substances 0.000 description 2
- 229910000389 calcium phosphate Inorganic materials 0.000 description 2
- 235000011010 calcium phosphates Nutrition 0.000 description 2
- 238000005251 capillar electrophoresis Methods 0.000 description 2
- 101150055766 cat gene Proteins 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 210000003483 chromatin Anatomy 0.000 description 2
- 238000010668 complexation reaction Methods 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 101150055601 cops2 gene Proteins 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000012258 culturing Methods 0.000 description 2
- 230000001627 detrimental effect Effects 0.000 description 2
- ZPTBLXKRQACLCR-XVFCMESISA-N dihydrouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)CC1 ZPTBLXKRQACLCR-XVFCMESISA-N 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 230000001973 epigenetic effect Effects 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 238000000684 flow cytometry Methods 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 230000030279 gene silencing Effects 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- 238000011194 good manufacturing practice Methods 0.000 description 2
- 208000024908 graft versus host disease Diseases 0.000 description 2
- 125000005843 halogen group Chemical group 0.000 description 2
- 210000005260 human cell Anatomy 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 230000000415 inactivating effect Effects 0.000 description 2
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 229960003786 inosine Drugs 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 210000000936 intestine Anatomy 0.000 description 2
- 238000007918 intramuscular administration Methods 0.000 description 2
- 238000007912 intraperitoneal administration Methods 0.000 description 2
- 229910052740 iodine Inorganic materials 0.000 description 2
- 208000017169 kidney disease Diseases 0.000 description 2
- 229940039696 lactobacillus Drugs 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 208000019423 liver disease Diseases 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 238000004949 mass spectrometry Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 210000002901 mesenchymal stem cell Anatomy 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 239000002539 nanocarrier Substances 0.000 description 2
- 210000000581 natural killer T-cell Anatomy 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 210000001178 neural stem cell Anatomy 0.000 description 2
- 229940046166 oligodeoxynucleotide Drugs 0.000 description 2
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 2
- UEZVMMHDMIWARA-UHFFFAOYSA-M phosphonate Chemical compound [O-]P(=O)=O UEZVMMHDMIWARA-UHFFFAOYSA-M 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 230000000069 prophylactic effect Effects 0.000 description 2
- 230000007026 protein scission Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 150000003212 purines Chemical class 0.000 description 2
- 125000000561 purinyl group Chemical group N1=C(N=C2N=CNC2=C1)* 0.000 description 2
- 238000007634 remodeling Methods 0.000 description 2
- 238000004007 reversed phase HPLC Methods 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 239000003161 ribonuclease inhibitor Substances 0.000 description 2
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 2
- DWRXFEITVBNRMK-JXOAFFINSA-N ribothymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 DWRXFEITVBNRMK-JXOAFFINSA-N 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 239000000344 soap Substances 0.000 description 2
- 230000009870 specific binding Effects 0.000 description 2
- 238000007920 subcutaneous administration Methods 0.000 description 2
- 230000002195 synergetic effect Effects 0.000 description 2
- WYWHKKSPHMUBEB-UHFFFAOYSA-N tioguanine Chemical class N1C(N)=NC(=S)C2=C1N=CN2 WYWHKKSPHMUBEB-UHFFFAOYSA-N 0.000 description 2
- 230000005029 transcription elongation Effects 0.000 description 2
- 230000005026 transcription initiation Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 2
- 239000001226 triphosphate Substances 0.000 description 2
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- GCSQTDKOWUJPAX-GIWSHQQXSA-N (2r,3r,4r,5r)-3-amino-2-(6-aminopurin-9-yl)-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@@]1(N)O GCSQTDKOWUJPAX-GIWSHQQXSA-N 0.000 description 1
- UUDVSZSQPFXQQM-GIWSHQQXSA-N (2r,3s,4r,5r)-2-(6-aminopurin-9-yl)-3-fluoro-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@]1(O)F UUDVSZSQPFXQQM-GIWSHQQXSA-N 0.000 description 1
- PHFMCMDFWSZKGD-IOSLPCCCSA-N (2r,3s,4r,5r)-2-(hydroxymethyl)-5-[6-(methylamino)-2-methylsulfanylpurin-9-yl]oxolane-3,4-diol Chemical compound C1=NC=2C(NC)=NC(SC)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O PHFMCMDFWSZKGD-IOSLPCCCSA-N 0.000 description 1
- MYUOTPIQBPUQQU-CKTDUXNWSA-N (2s,3r)-2-amino-n-[[9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-methylsulfanylpurin-6-yl]carbamoyl]-3-hydroxybutanamide Chemical compound C12=NC(SC)=NC(NC(=O)NC(=O)[C@@H](N)[C@@H](C)O)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O MYUOTPIQBPUQQU-CKTDUXNWSA-N 0.000 description 1
- GPTUGCGYEMEAOC-IBZYUGMLSA-N (2s,3r)-2-amino-n-[[9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]purin-6-yl]-methylcarbamoyl]-3-hydroxybutanamide Chemical compound C1=NC=2C(N(C)C(=O)NC(=O)[C@@H](N)[C@H](O)C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O GPTUGCGYEMEAOC-IBZYUGMLSA-N 0.000 description 1
- XBBQCOKPWNZHFX-TYASJMOZSA-N (3r,4s,5r)-2-[(2r,3r,4r,5r)-2-(6-aminopurin-9-yl)-4-hydroxy-5-(hydroxymethyl)oxolan-3-yl]oxy-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound O([C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C=2N=CN=C(C=2N=C1)N)C1O[C@H](CO)[C@@H](O)[C@H]1O XBBQCOKPWNZHFX-TYASJMOZSA-N 0.000 description 1
- OPBADCAFNMWRJK-UHFFFAOYSA-N 1,4,2-dithiazolidine-3-thione Chemical compound S=C1NSCS1 OPBADCAFNMWRJK-UHFFFAOYSA-N 0.000 description 1
- ODDDVFDZBGTKDX-VPCXQMTMSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)-2-methyloxolan-2-yl]pyrimidine-2,4-dione Chemical compound C1=CC(=O)NC(=O)N1[C@]1(C)O[C@H](CO)[C@@H](O)[C@H]1O ODDDVFDZBGTKDX-VPCXQMTMSA-N 0.000 description 1
- XIJAZGMFHRTBFY-FDDDBJFASA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-$l^{1}-selanyl-5-(methylaminomethyl)pyrimidin-4-one Chemical compound [Se]C1=NC(=O)C(CNC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 XIJAZGMFHRTBFY-FDDDBJFASA-N 0.000 description 1
- UTQUILVPBZEHTK-ZOQUXTDFSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-3-methylpyrimidine-2,4-dione Chemical compound O=C1N(C)C(=O)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UTQUILVPBZEHTK-ZOQUXTDFSA-N 0.000 description 1
- RKSLVDIXBGWPIS-UAKXSSHOSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-iodopyrimidine-2,4-dione Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 RKSLVDIXBGWPIS-UAKXSSHOSA-N 0.000 description 1
- BTFXIEGOSDSOGN-KWCDMSRLSA-N 1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-5-methyl-1,3-diazinane-2,4-dione Chemical compound O=C1NC(=O)C(C)CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 BTFXIEGOSDSOGN-KWCDMSRLSA-N 0.000 description 1
- QPHRQMAYYMYWFW-FJGDRVTGSA-N 1-[(2r,3s,4r,5r)-3-fluoro-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]pyrimidine-2,4-dione Chemical compound O[C@]1(F)[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 QPHRQMAYYMYWFW-FJGDRVTGSA-N 0.000 description 1
- GFYLSDSUCHVORB-IOSLPCCCSA-N 1-methyladenosine Chemical compound C1=NC=2C(=N)N(C)C=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O GFYLSDSUCHVORB-IOSLPCCCSA-N 0.000 description 1
- UTAIYTHAJQNQDW-KQYNXXCUSA-N 1-methylguanosine Chemical compound C1=NC=2C(=O)N(C)C(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O UTAIYTHAJQNQDW-KQYNXXCUSA-N 0.000 description 1
- WJNGQIYEQLPJMN-IOSLPCCCSA-N 1-methylinosine Chemical compound C1=NC=2C(=O)N(C)C=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O WJNGQIYEQLPJMN-IOSLPCCCSA-N 0.000 description 1
- CQKMBZHLOYVGHW-UHFFFAOYSA-N 10407-64-4 Natural products NC1C(O)C(CO)OC1N1C2=NC=NC(N)=C2N=C1 CQKMBZHLOYVGHW-UHFFFAOYSA-N 0.000 description 1
- OVYNGSFVYRPRCG-UHFFFAOYSA-N 2'-O-Methylguanosine Natural products COC1C(O)C(CO)OC1N1C(NC(N)=NC2=O)=C2N=C1 OVYNGSFVYRPRCG-UHFFFAOYSA-N 0.000 description 1
- OVYNGSFVYRPRCG-KQYNXXCUSA-N 2'-O-methylguanosine Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=C(N)NC2=O)=C2N=C1 OVYNGSFVYRPRCG-KQYNXXCUSA-N 0.000 description 1
- HPHXOIULGYVAKW-IOSLPCCCSA-N 2'-O-methylinosine Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=CNC2=O)=C2N=C1 HPHXOIULGYVAKW-IOSLPCCCSA-N 0.000 description 1
- HPHXOIULGYVAKW-UHFFFAOYSA-N 2'-O-methylinosine Natural products COC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 HPHXOIULGYVAKW-UHFFFAOYSA-N 0.000 description 1
- VGONTNSXDCQUGY-RRKCRQDMSA-N 2'-deoxyinosine Chemical group C1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=CNC2=O)=C2N=C1 VGONTNSXDCQUGY-RRKCRQDMSA-N 0.000 description 1
- MXHRCPNRJAMMIM-SHYZEUOFSA-N 2'-deoxyuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-SHYZEUOFSA-N 0.000 description 1
- YUCFXTKBZFABID-WOUKDFQISA-N 2-(dimethylamino)-9-[(2r,3r,4r,5r)-4-hydroxy-5-(hydroxymethyl)-3-methoxyoxolan-2-yl]-3h-purin-6-one Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(NC(=NC2=O)N(C)C)=C2N=C1 YUCFXTKBZFABID-WOUKDFQISA-N 0.000 description 1
- IQZWKGWOBPJWMX-UHFFFAOYSA-N 2-Methyladenosine Natural products C12=NC(C)=NC(N)=C2N=CN1C1OC(CO)C(O)C1O IQZWKGWOBPJWMX-UHFFFAOYSA-N 0.000 description 1
- VHXUHQJRMXUOST-PNHWDRBUSA-N 2-[1-[(2r,3r,4r,5r)-4-hydroxy-5-(hydroxymethyl)-3-methoxyoxolan-2-yl]-2,4-dioxopyrimidin-5-yl]acetamide Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(CC(N)=O)=C1 VHXUHQJRMXUOST-PNHWDRBUSA-N 0.000 description 1
- BIRQNXWAXWLATA-IOSLPCCCSA-N 2-amino-7-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-4-oxo-1h-pyrrolo[2,3-d]pyrimidine-5-carbonitrile Chemical compound C1=C(C#N)C=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O BIRQNXWAXWLATA-IOSLPCCCSA-N 0.000 description 1
- NTYZLKZZBRSAPT-DBINCYRJSA-N 2-amino-9-[(2r,3r,4r,5r)-3-[(3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]oxy-4-hydroxy-5-(hydroxymethyl)oxolan-2-yl]-3h-purin-6-one Chemical compound O([C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C=NC=2C(=O)N=C(NC=21)N)C1O[C@H](CO)[C@@H](O)[C@H]1O NTYZLKZZBRSAPT-DBINCYRJSA-N 0.000 description 1
- JHHVAMWVEXQFGC-AEHJODJJSA-N 2-amino-9-[(2r,3r,4r,5r)-3-amino-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-3h-purin-6-one Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@@]1(N)O JHHVAMWVEXQFGC-AEHJODJJSA-N 0.000 description 1
- JLYURAYAEKVGQJ-IOSLPCCCSA-N 2-amino-9-[(2r,3r,4r,5r)-4-hydroxy-5-(hydroxymethyl)-3-methoxyoxolan-2-yl]-1-methylpurin-6-one Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=C(N)N(C)C2=O)=C2N=C1 JLYURAYAEKVGQJ-IOSLPCCCSA-N 0.000 description 1
- QNIZHKITBISILC-RPKMEZRRSA-N 2-amino-9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)-2-methyloxolan-2-yl]-3h-purin-6-one Chemical compound C1=NC(C(NC(N)=N2)=O)=C2N1[C@]1(C)O[C@H](CO)[C@@H](O)[C@H]1O QNIZHKITBISILC-RPKMEZRRSA-N 0.000 description 1
- BGTXMQUSDNMLDW-AEHJODJJSA-N 2-amino-9-[(2r,3s,4r,5r)-3-fluoro-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-3h-purin-6-one Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@]1(O)F BGTXMQUSDNMLDW-AEHJODJJSA-N 0.000 description 1
- PBFLIOAJBULBHI-JJNLEZRASA-N 2-amino-n-[[9-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]purin-6-yl]carbamoyl]acetamide Chemical compound C1=NC=2C(NC(=O)NC(=O)CN)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O PBFLIOAJBULBHI-JJNLEZRASA-N 0.000 description 1
- XMSMHKMPBNTBOD-UHFFFAOYSA-N 2-dimethylamino-6-hydroxypurine Chemical compound N1C(N(C)C)=NC(=O)C2=C1N=CN2 XMSMHKMPBNTBOD-UHFFFAOYSA-N 0.000 description 1
- VWSLLSXLURJCDF-UHFFFAOYSA-N 2-methyl-4,5-dihydro-1h-imidazole Chemical compound CC1=NCCN1 VWSLLSXLURJCDF-UHFFFAOYSA-N 0.000 description 1
- IQZWKGWOBPJWMX-IOSLPCCCSA-N 2-methyladenosine Chemical compound C12=NC(C)=NC(N)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O IQZWKGWOBPJWMX-IOSLPCCCSA-N 0.000 description 1
- QEWSGVMSLPHELX-UHFFFAOYSA-N 2-methylthio-N6-(cis-hydroxyisopentenyl) adenosine Chemical compound C12=NC(SC)=NC(NCC=C(C)CO)=C2N=CN1C1OC(CO)C(O)C1O QEWSGVMSLPHELX-UHFFFAOYSA-N 0.000 description 1
- UKVQBONVSSLJBB-UHFFFAOYSA-N 2-pyridin-2-ylacetonitrile Chemical compound N#CCC1=CC=CC=N1 UKVQBONVSSLJBB-UHFFFAOYSA-N 0.000 description 1
- GIIGHSIIKVOWKZ-UHFFFAOYSA-N 2h-triazolo[4,5-d]pyrimidine Chemical class N1=CN=CC2=NNN=C21 GIIGHSIIKVOWKZ-UHFFFAOYSA-N 0.000 description 1
- 108020005345 3' Untranslated Regions Proteins 0.000 description 1
- YXNIEZJFCGTDKV-JANFQQFMSA-N 3-(3-amino-3-carboxypropyl)uridine Chemical compound O=C1N(CCC(N)C(O)=O)C(=O)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 YXNIEZJFCGTDKV-JANFQQFMSA-N 0.000 description 1
- RDPUKVRQKWBSPK-UHFFFAOYSA-N 3-Methylcytidine Natural products O=C1N(C)C(=N)C=CN1C1C(O)C(O)C(CO)O1 RDPUKVRQKWBSPK-UHFFFAOYSA-N 0.000 description 1
- UTQUILVPBZEHTK-UHFFFAOYSA-N 3-Methyluridine Natural products O=C1N(C)C(=O)C=CN1C1C(O)C(O)C(CO)O1 UTQUILVPBZEHTK-UHFFFAOYSA-N 0.000 description 1
- BINGDNLMMYSZFR-QYVSTXNMSA-N 3-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-6,7-dimethyl-5h-imidazo[1,2-a]purin-9-one Chemical compound C1=NC=2C(=O)N3C(C)=C(C)N=C3NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O BINGDNLMMYSZFR-QYVSTXNMSA-N 0.000 description 1
- RDPUKVRQKWBSPK-ZOQUXTDFSA-N 3-methylcytidine Chemical compound O=C1N(C)C(=N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 RDPUKVRQKWBSPK-ZOQUXTDFSA-N 0.000 description 1
- LMZHZBVAKAMCEG-FJGDRVTGSA-N 4-amino-1-[(2r,3r,4r,5r)-3-amino-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]pyrimidin-2-one Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@@](O)(N)[C@H](O)[C@@H](CO)O1 LMZHZBVAKAMCEG-FJGDRVTGSA-N 0.000 description 1
- YBBDRHCNZBVLGT-FDDDBJFASA-N 4-amino-1-[(2r,3r,4r,5r)-4-hydroxy-5-(hydroxymethyl)-3-methoxyoxolan-2-yl]-2-oxopyrimidine-5-carbaldehyde Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)N=C(N)C(C=O)=C1 YBBDRHCNZBVLGT-FDDDBJFASA-N 0.000 description 1
- YUDSCJBUWTYENI-VPCXQMTMSA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)-2-methyloxolan-2-yl]pyrimidin-2-one Chemical compound C1=CC(N)=NC(=O)N1[C@]1(C)O[C@H](CO)[C@@H](O)[C@H]1O YUDSCJBUWTYENI-VPCXQMTMSA-N 0.000 description 1
- OCMSXKMNYAHJMU-JXOAFFINSA-N 4-amino-1-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-2-oxopyrimidine-5-carbaldehyde Chemical compound C1=C(C=O)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 OCMSXKMNYAHJMU-JXOAFFINSA-N 0.000 description 1
- PJWBTAIPBFWVHX-FJGDRVTGSA-N 4-amino-1-[(2r,3s,4r,5r)-3-fluoro-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]pyrimidin-2-one Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@](F)(O)[C@H](O)[C@@H](CO)O1 PJWBTAIPBFWVHX-FJGDRVTGSA-N 0.000 description 1
- QUZQVVNSDQCAOL-WOUKDFQISA-N 4-demethylwyosine Chemical compound N1C(C)=CN(C(C=2N=C3)=O)C1=NC=2N3[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O QUZQVVNSDQCAOL-WOUKDFQISA-N 0.000 description 1
- 108020003589 5' Untranslated Regions Proteins 0.000 description 1
- YHRRPHCORALGKQ-UHFFFAOYSA-N 5,2'-O-dimethyluridine Chemical compound COC1C(O)C(CO)OC1N1C(=O)NC(=O)C(C)=C1 YHRRPHCORALGKQ-UHFFFAOYSA-N 0.000 description 1
- UVGCZRPOXXYZKH-QADQDURISA-N 5-(carboxyhydroxymethyl)uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(C(O)C(O)=O)=C1 UVGCZRPOXXYZKH-QADQDURISA-N 0.000 description 1
- FAWQJBLSWXIJLA-VPCXQMTMSA-N 5-(carboxymethyl)uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(CC(O)=O)=C1 FAWQJBLSWXIJLA-VPCXQMTMSA-N 0.000 description 1
- NFEXJLMYXXIWPI-JXOAFFINSA-N 5-Hydroxymethylcytidine Chemical compound C1=C(CO)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NFEXJLMYXXIWPI-JXOAFFINSA-N 0.000 description 1
- ZYEWPVTXYBLWRT-UHFFFAOYSA-N 5-Uridinacetamid Natural products O=C1NC(=O)C(CC(=O)N)=CN1C1C(O)C(O)C(CO)O1 ZYEWPVTXYBLWRT-UHFFFAOYSA-N 0.000 description 1
- MMUBPEFMCTVKTR-IBNKKVAHSA-N 5-[(2s,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)-2-methyloxolan-2-yl]-1h-pyrimidine-2,4-dione Chemical compound C=1NC(=O)NC(=O)C=1[C@]1(C)O[C@H](CO)[C@@H](O)[C@H]1O MMUBPEFMCTVKTR-IBNKKVAHSA-N 0.000 description 1
- BISHACNKZIBDFM-UHFFFAOYSA-N 5-amino-1h-pyrimidine-2,4-dione Chemical compound NC1=CNC(=O)NC1=O BISHACNKZIBDFM-UHFFFAOYSA-N 0.000 description 1
- LOEDKMLIGFMQKR-JXOAFFINSA-N 5-aminomethyl-2-thiouridine Chemical compound S=C1NC(=O)C(CN)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 LOEDKMLIGFMQKR-JXOAFFINSA-N 0.000 description 1
- LQLQRFGHAALLLE-UHFFFAOYSA-N 5-bromouracil Chemical compound BrC1=CNC(=O)NC1=O LQLQRFGHAALLLE-UHFFFAOYSA-N 0.000 description 1
- ZYEWPVTXYBLWRT-VPCXQMTMSA-N 5-carbamoylmethyluridine Chemical compound O=C1NC(=O)C(CC(=O)N)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZYEWPVTXYBLWRT-VPCXQMTMSA-N 0.000 description 1
- ZFTBZKVVGZNMJR-UHFFFAOYSA-N 5-chlorouracil Chemical compound ClC1=CNC(=O)NC1=O ZFTBZKVVGZNMJR-UHFFFAOYSA-N 0.000 description 1
- STRZQWQNZQMHQR-UAKXSSHOSA-N 5-fluorocytidine Chemical compound C1=C(F)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 STRZQWQNZQMHQR-UAKXSSHOSA-N 0.000 description 1
- FHIDNBAQOFJWCA-UAKXSSHOSA-N 5-fluorouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(F)=C1 FHIDNBAQOFJWCA-UAKXSSHOSA-N 0.000 description 1
- JDBGXEHEIRGOBU-UHFFFAOYSA-N 5-hydroxymethyluracil Chemical compound OCC1=CNC(=O)NC1=O JDBGXEHEIRGOBU-UHFFFAOYSA-N 0.000 description 1
- HLZXTFWTDIBXDF-PNHWDRBUSA-N 5-methoxycarbonylmethyl-2-thiouridine Chemical compound S=C1NC(=O)C(CC(=O)OC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 HLZXTFWTDIBXDF-PNHWDRBUSA-N 0.000 description 1
- HXVKEKIORVUWDR-UHFFFAOYSA-N 5-methylaminomethyl-2-thiouridine Natural products S=C1NC(=O)C(CNC)=CN1C1C(O)C(O)C(CO)O1 HXVKEKIORVUWDR-UHFFFAOYSA-N 0.000 description 1
- ZXQHKBUIXRFZBV-FDDDBJFASA-N 5-methylaminomethyluridine Chemical compound O=C1NC(=O)C(CNC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZXQHKBUIXRFZBV-FDDDBJFASA-N 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- USVMJSALORZVDV-UHFFFAOYSA-N 6-(gamma,gamma-dimethylallylamino)purine riboside Natural products C1=NC=2C(NCC=C(C)C)=NC=NC=2N1C1OC(CO)C(O)C1O USVMJSALORZVDV-UHFFFAOYSA-N 0.000 description 1
- QFVKLKDEXOWFSL-UHFFFAOYSA-N 6-amino-5-bromo-1h-pyrimidin-2-one Chemical compound NC=1NC(=O)N=CC=1Br QFVKLKDEXOWFSL-UHFFFAOYSA-N 0.000 description 1
- NLLCDONDZDHLCI-UHFFFAOYSA-N 6-amino-5-hydroxy-1h-pyrimidin-2-one Chemical compound NC=1NC(=O)N=CC=1O NLLCDONDZDHLCI-UHFFFAOYSA-N 0.000 description 1
- RYYIULNRIVUMTQ-UHFFFAOYSA-N 6-chloroguanine Chemical class NC1=NC(Cl)=C2N=CNC2=N1 RYYIULNRIVUMTQ-UHFFFAOYSA-N 0.000 description 1
- LOSIULRWFAEMFL-UHFFFAOYSA-N 7-deazaguanine Chemical compound O=C1NC(N)=NC2=C1CC=N2 LOSIULRWFAEMFL-UHFFFAOYSA-N 0.000 description 1
- ZCYVEMRRCGMTRW-UHFFFAOYSA-N 7553-56-2 Chemical compound [I] ZCYVEMRRCGMTRW-UHFFFAOYSA-N 0.000 description 1
- LPXQRXLUHJKZIE-UHFFFAOYSA-N 8-azaguanine Chemical compound NC1=NC(O)=C2NN=NC2=N1 LPXQRXLUHJKZIE-UHFFFAOYSA-N 0.000 description 1
- 229960005508 8-azaguanine Drugs 0.000 description 1
- JSRIPIORIMCGTG-WOUKDFQISA-N 9-[(2R,3R,4R,5R)-4-hydroxy-5-(hydroxymethyl)-3-methoxyoxolan-2-yl]-1-methylpurin-6-one Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=CN(C)C2=O)=C2N=C1 JSRIPIORIMCGTG-WOUKDFQISA-N 0.000 description 1
- OJTAZBNWKTYVFJ-IOSLPCCCSA-N 9-[(2r,3r,4r,5r)-4-hydroxy-5-(hydroxymethyl)-3-methoxyoxolan-2-yl]-2-(methylamino)-3h-purin-6-one Chemical compound C1=2NC(NC)=NC(=O)C=2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1OC OJTAZBNWKTYVFJ-IOSLPCCCSA-N 0.000 description 1
- 108010029988 AICDA (activation-induced cytidine deaminase) Proteins 0.000 description 1
- 108010004483 APOBEC-3G Deaminase Proteins 0.000 description 1
- 241001430193 Absiella dolichum Species 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 241000604451 Acidaminococcus Species 0.000 description 1
- 241001134630 Acidothermus cellulolyticus Species 0.000 description 1
- 241000460100 Acidovorax ebreus Species 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 102100033647 Activity-regulated cytoskeleton-associated protein Human genes 0.000 description 1
- 102100036664 Adenosine deaminase Human genes 0.000 description 1
- 241000702462 Akkermansia muciniphila Species 0.000 description 1
- 101100385358 Alicyclobacillus acidoterrestris (strain ATCC 49025 / DSM 3922 / CIP 106132 / NCIMB 13137 / GD3B) cas12b gene Proteins 0.000 description 1
- 208000024827 Alzheimer disease Diseases 0.000 description 1
- 241001621924 Aminomonas paucivorans Species 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- 206010003805 Autism Diseases 0.000 description 1
- 208000020706 Autistic disease Diseases 0.000 description 1
- 208000023275 Autoimmune disease Diseases 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 241000714230 Avian leukemia virus Species 0.000 description 1
- 241000193755 Bacillus cereus Species 0.000 description 1
- 241000186016 Bifidobacterium bifidum Species 0.000 description 1
- 241000186020 Bifidobacterium dentium Species 0.000 description 1
- 241001608472 Bifidobacterium longum Species 0.000 description 1
- 108090000732 Bis(5'-nucleosyl)-tetraphosphatase (asymmetrical) Proteins 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 241000589173 Bradyrhizobium Species 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 102100040399 C->U-editing enzyme APOBEC-2 Human genes 0.000 description 1
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 description 1
- 238000010443 CRISPR/Cpf1 gene editing Methods 0.000 description 1
- 101150018129 CSF2 gene Proteins 0.000 description 1
- 241000589876 Campylobacter Species 0.000 description 1
- 241000589875 Campylobacter jejuni Species 0.000 description 1
- 241001453245 Campylobacter jejuni subsp. jejuni Species 0.000 description 1
- 241000327160 Candidatus Puniceispirillum marinum Species 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000190885 Capnocytophaga ochracea Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 241001443867 Catenibacterium mitsuokai Species 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 1
- 241000193468 Clostridium perfringens Species 0.000 description 1
- 241000243321 Cnidaria Species 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 241000220677 Coprococcus catus Species 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- MIKUYHXYGGJMLM-UUOKFMHZSA-N Crotonoside Chemical compound C1=NC2=C(N)NC(=O)N=C2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O MIKUYHXYGGJMLM-UUOKFMHZSA-N 0.000 description 1
- 101150074775 Csf1 gene Proteins 0.000 description 1
- 201000003883 Cystic fibrosis Diseases 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- 102100040263 DNA dC->dU-editing enzyme APOBEC-3A Human genes 0.000 description 1
- 102100040262 DNA dC->dU-editing enzyme APOBEC-3B Human genes 0.000 description 1
- 102100040261 DNA dC->dU-editing enzyme APOBEC-3C Human genes 0.000 description 1
- 102100040264 DNA dC->dU-editing enzyme APOBEC-3D Human genes 0.000 description 1
- 102100040266 DNA dC->dU-editing enzyme APOBEC-3F Human genes 0.000 description 1
- 102100038076 DNA dC->dU-editing enzyme APOBEC-3G Human genes 0.000 description 1
- 102100038050 DNA dC->dU-editing enzyme APOBEC-3H Human genes 0.000 description 1
- 101710082737 DNA dC->dU-editing enzyme APOBEC-3H Proteins 0.000 description 1
- 238000010442 DNA editing Methods 0.000 description 1
- 102000021107 DNA end binding proteins Human genes 0.000 description 1
- 108091011122 DNA end binding proteins Proteins 0.000 description 1
- 102000003844 DNA helicases Human genes 0.000 description 1
- 108090000133 DNA helicases Proteins 0.000 description 1
- 230000007067 DNA methylation Effects 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 241000983824 Dinoroseobacter Species 0.000 description 1
- 241001595867 Dinoroseobacter shibae Species 0.000 description 1
- 102100038191 Double-stranded RNA-specific editase 1 Human genes 0.000 description 1
- 102100024692 Double-stranded RNA-specific editase B2 Human genes 0.000 description 1
- 206010013801 Duchenne Muscular Dystrophy Diseases 0.000 description 1
- 241000258955 Echinodermata Species 0.000 description 1
- 241001338691 Elusimicrobium minutum Species 0.000 description 1
- 102000002494 Endoribonucleases Human genes 0.000 description 1
- 241000991587 Enterovirus C Species 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000186394 Eubacterium Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000605896 Fibrobacter succinogenes Species 0.000 description 1
- 241000178967 Filifactor Species 0.000 description 1
- 241001282092 Filifactor alocis Species 0.000 description 1
- 241000192016 Finegoldia magna Species 0.000 description 1
- 241000589565 Flavobacterium Species 0.000 description 1
- 241000604777 Flavobacterium columnare Species 0.000 description 1
- GHASVSINZRGABV-UHFFFAOYSA-N Fluorouracil Chemical compound FC1=CNC(=O)NC1=O GHASVSINZRGABV-UHFFFAOYSA-N 0.000 description 1
- 241000589599 Francisella tularensis subsp. novicida Species 0.000 description 1
- 241000605986 Fusobacterium nucleatum Species 0.000 description 1
- 101150106478 GPS1 gene Proteins 0.000 description 1
- 241000032681 Gluconacetobacter Species 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Natural products C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 1
- 208000031886 HIV Infections Diseases 0.000 description 1
- 208000037357 HIV infectious disease Diseases 0.000 description 1
- 241000590006 Helicobacter mustelae Species 0.000 description 1
- 108010068250 Herpes Simplex Virus Protein Vmw65 Proteins 0.000 description 1
- 102000008157 Histone Demethylases Human genes 0.000 description 1
- 108010074870 Histone Demethylases Proteins 0.000 description 1
- 101000720051 Homo sapiens Adenosine deaminase 2 Proteins 0.000 description 1
- 101000964322 Homo sapiens C->U-editing enzyme APOBEC-2 Proteins 0.000 description 1
- 101000964378 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3A Proteins 0.000 description 1
- 101000964385 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3B Proteins 0.000 description 1
- 101000964383 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3C Proteins 0.000 description 1
- 101000964382 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3D Proteins 0.000 description 1
- 101000964377 Homo sapiens DNA dC->dU-editing enzyme APOBEC-3F Proteins 0.000 description 1
- 101000742223 Homo sapiens Double-stranded RNA-specific editase 1 Proteins 0.000 description 1
- 101000686486 Homo sapiens Double-stranded RNA-specific editase B2 Proteins 0.000 description 1
- 101001055157 Homo sapiens Interleukin-15 Proteins 0.000 description 1
- 101000960969 Homo sapiens Interleukin-5 Proteins 0.000 description 1
- 101001043807 Homo sapiens Interleukin-7 Proteins 0.000 description 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 101000653360 Homo sapiens Methylcytosine dioxygenase TET1 Proteins 0.000 description 1
- 101000799048 Homo sapiens Probable inactive tRNA-specific adenosine deaminase-like protein 3 Proteins 0.000 description 1
- 101000800426 Homo sapiens Putative C->U-editing enzyme APOBEC-4 Proteins 0.000 description 1
- 101000657352 Homo sapiens Transcriptional adapter 2-alpha Proteins 0.000 description 1
- 101000799057 Homo sapiens tRNA-specific adenosine deaminase 2 Proteins 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- 101150047851 IL2RG gene Proteins 0.000 description 1
- 241000411974 Ilyobacter polytropus Species 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- 229930182816 L-glutamine Natural products 0.000 description 1
- 241000186606 Lactobacillus gasseri Species 0.000 description 1
- 241000218588 Lactobacillus rhamnosus Species 0.000 description 1
- 241000589248 Legionella Species 0.000 description 1
- 241000589242 Legionella pneumophila Species 0.000 description 1
- 208000007764 Legionnaires' Disease Diseases 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- 241000186805 Listeria innocua Species 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 1
- 102100030819 Methylcytosine dioxygenase TET1 Human genes 0.000 description 1
- 241000713333 Mouse mammary tumor virus Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- 108010021466 Mutant Proteins Proteins 0.000 description 1
- 102000008300 Mutant Proteins Human genes 0.000 description 1
- 241000204031 Mycoplasma Species 0.000 description 1
- 241001148552 Mycoplasma canis Species 0.000 description 1
- 241000204022 Mycoplasma gallisepticum Species 0.000 description 1
- 241000202964 Mycoplasma mobile Species 0.000 description 1
- 241001148556 Mycoplasma ovipneumoniae Species 0.000 description 1
- 241000202942 Mycoplasma synoviae Species 0.000 description 1
- 241000713883 Myeloproliferative sarcoma virus Species 0.000 description 1
- IYYIBFCJILKPCO-WOUKDFQISA-O N(2),N(2),N(7)-trimethylguanosine Chemical compound C1=2NC(N(C)C)=NC(=O)C=2N(C)C=[N+]1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O IYYIBFCJILKPCO-WOUKDFQISA-O 0.000 description 1
- RSPURTUNRHNVGF-IOSLPCCCSA-N N(2),N(2)-dimethylguanosine Chemical compound C1=NC=2C(=O)NC(N(C)C)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O RSPURTUNRHNVGF-IOSLPCCCSA-N 0.000 description 1
- ZBYRSRLCXTUFLJ-IOSLPCCCSA-O N(2),N(7)-dimethylguanosine Chemical compound CNC=1NC(C=2[N+](=CN([C@H]3[C@H](O)[C@H](O)[C@@H](CO)O3)C=2N=1)C)=O ZBYRSRLCXTUFLJ-IOSLPCCCSA-O 0.000 description 1
- NIDVTARKFBZMOT-PEBGCTIMSA-N N(4)-acetylcytidine Chemical compound O=C1N=C(NC(=O)C)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NIDVTARKFBZMOT-PEBGCTIMSA-N 0.000 description 1
- USVMJSALORZVDV-SDBHATRESA-N N(6)-(Delta(2)-isopentenyl)adenosine Chemical compound C1=NC=2C(NCC=C(C)C)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O USVMJSALORZVDV-SDBHATRESA-N 0.000 description 1
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N(6)-methyladenosine Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 description 1
- SLLVJTURCPWLTP-UHFFFAOYSA-N N-[9-[3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]purin-6-yl]acetamide Chemical compound C1=NC=2C(NC(=O)C)=NC=NC=2N1C1OC(CO)C(O)C1O SLLVJTURCPWLTP-UHFFFAOYSA-N 0.000 description 1
- OXZZMWVZYFVMKG-UHFFFAOYSA-N N-diazo-[hydroxy(phosphonooxy)phosphoryl]oxyphosphonamidic acid Chemical compound [N-]=[N+]=NP(=O)(O)OP(=O)(O)OP(=O)(O)O OXZZMWVZYFVMKG-UHFFFAOYSA-N 0.000 description 1
- LZCNWAXLJWBRJE-ZOQUXTDFSA-N N4-Methylcytidine Chemical compound O=C1N=C(NC)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 LZCNWAXLJWBRJE-ZOQUXTDFSA-N 0.000 description 1
- GOSWTRUMMSCNCW-UHFFFAOYSA-N N6-(cis-hydroxyisopentenyl)adenosine Chemical compound C1=NC=2C(NCC=C(CO)C)=NC=NC=2N1C1OC(CO)C(O)C1O GOSWTRUMMSCNCW-UHFFFAOYSA-N 0.000 description 1
- VQAYFKKCNSOZKM-UHFFFAOYSA-N NSC 29409 Natural products C1=NC=2C(NC)=NC=NC=2N1C1OC(CO)C(O)C1O VQAYFKKCNSOZKM-UHFFFAOYSA-N 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 1
- 101100385413 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) csm-3 gene Proteins 0.000 description 1
- 241000135938 Nitratifractor Species 0.000 description 1
- 241000135933 Nitratifractor salsuginis Species 0.000 description 1
- 241000605156 Nitrobacter hamburgensis Species 0.000 description 1
- 229940122426 Nuclease inhibitor Drugs 0.000 description 1
- 101710141454 Nucleoprotein Proteins 0.000 description 1
- VZQXUWKZDSEQRR-UHFFFAOYSA-N Nucleosid Natural products C12=NC(SC)=NC(NCC=C(C)C)=C2N=CN1C1OC(CO)C(O)C1O VZQXUWKZDSEQRR-UHFFFAOYSA-N 0.000 description 1
- JXNORPPTKDEAIZ-QOCRDCMYSA-N O-4''-alpha-D-mannosylqueuosine Chemical compound NC(N1)=NC(N([C@@H]([C@@H]2O)O[C@H](CO)[C@H]2O)C=C2CN[C@H]([C@H]3O)C=C[C@@H]3O[C@H]([C@H]([C@H]3O)O)O[C@H](CO)[C@H]3O)=C2C1=O JXNORPPTKDEAIZ-QOCRDCMYSA-N 0.000 description 1
- 241000385061 Oenococcus kitaharae Species 0.000 description 1
- 241000927555 Olsenella uli Species 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 241000260425 Parasutterella excrementihominis Species 0.000 description 1
- 208000018737 Parkinson disease Diseases 0.000 description 1
- 241000606856 Pasteurella multocida Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 108091093037 Peptide nucleic acid Proteins 0.000 description 1
- 241000374256 Peptoniphilus duerdenii Species 0.000 description 1
- 241001141020 Prevotella micans Species 0.000 description 1
- 241000605860 Prevotella ruminicola Species 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 102000029797 Prion Human genes 0.000 description 1
- 108091000054 Prion Proteins 0.000 description 1
- 102100034006 Probable inactive tRNA-specific adenosine deaminase-like protein 3 Human genes 0.000 description 1
- 229930185560 Pseudouridine Chemical group 0.000 description 1
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Chemical group OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 1
- 102100033091 Putative C->U-editing enzyme APOBEC-4 Human genes 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 108090000944 RNA Helicases Proteins 0.000 description 1
- 102000004409 RNA Helicases Human genes 0.000 description 1
- 108010003817 RNA polymerase omega subunit Proteins 0.000 description 1
- 230000006819 RNA synthesis Effects 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 108091030071 RNAI Proteins 0.000 description 1
- 241001135508 Ralstonia syzygii Species 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 101100047461 Rattus norvegicus Trpm8 gene Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 241000190950 Rhodopseudomonas palustris Species 0.000 description 1
- 241000190984 Rhodospirillum rubrum Species 0.000 description 1
- 102000000505 Ribonucleotide Reductases Human genes 0.000 description 1
- 108010041388 Ribonucleotide Reductases Proteins 0.000 description 1
- 241000605947 Roseburia Species 0.000 description 1
- 241000398180 Roseburia intestinalis Species 0.000 description 1
- 241000192029 Ruminococcus albus Species 0.000 description 1
- 206010039491 Sarcoma Diseases 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 241001464874 Solobacterium moorei Species 0.000 description 1
- 241000949716 Sphaerochaeta Species 0.000 description 1
- 206010055047 Splenic necrosis Diseases 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 241000794282 Staphylococcus pseudintermedius Species 0.000 description 1
- 241000194017 Streptococcus Species 0.000 description 1
- 241000194019 Streptococcus mutans Species 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical group [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 241000123710 Sutterella Species 0.000 description 1
- 241000123713 Sutterella wadsworthensis Species 0.000 description 1
- 241000255588 Tephritidae Species 0.000 description 1
- 241000283907 Tragelaphus oryx Species 0.000 description 1
- 102100034777 Transcriptional adapter 2-alpha Human genes 0.000 description 1
- 102100032467 Transmembrane protease serine 13 Human genes 0.000 description 1
- 241000589886 Treponema Species 0.000 description 1
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 108091026822 U6 spliceosomal RNA Proteins 0.000 description 1
- 241000700618 Vaccinia virus Species 0.000 description 1
- 241001148134 Veillonella Species 0.000 description 1
- 241001447269 Verminephrobacter eiseniae Species 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- JCZSFCLRSONYLH-UHFFFAOYSA-N Wyosine Natural products N=1C(C)=CN(C(C=2N=C3)=O)C=1N(C)C=2N3C1OC(CO)C(O)C1O JCZSFCLRSONYLH-UHFFFAOYSA-N 0.000 description 1
- 235000007244 Zea mays Nutrition 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- OWNKJJAVEHMKCW-XVFCMESISA-N [(2r,3s,4r,5r)-4-amino-5-(2,4-dioxopyrimidin-1-yl)-3-hydroxyoxolan-2-yl]methyl dihydrogen phosphate Chemical compound N[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 OWNKJJAVEHMKCW-XVFCMESISA-N 0.000 description 1
- TVGUROHJABCRTB-MHJQXXNXSA-N [(2r,3s,4r,5s)-5-[(2r,3r,4r,5r)-2-(2-amino-6-oxo-3h-purin-9-yl)-4-hydroxy-5-(hydroxymethyl)oxolan-3-yl]oxy-3,4-dihydroxyoxolan-2-yl]methyl dihydrogen phosphate Chemical compound O([C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C=NC=2C(=O)N=C(NC=21)N)[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O TVGUROHJABCRTB-MHJQXXNXSA-N 0.000 description 1
- 241001531188 [Eubacterium] rectale Species 0.000 description 1
- PQIHYNWPAJABTB-QCNRFFRDSA-N [O-]S(CCNC[S+]=C(N1)N([C@@H]([C@@H]2O)O[C@H](CO)[C@H]2O)C=CC1=O)(=O)=O Chemical compound [O-]S(CCNC[S+]=C(N1)N([C@@H]([C@@H]2O)O[C@H](CO)[C@H]2O)C=CC1=O)(=O)=O PQIHYNWPAJABTB-QCNRFFRDSA-N 0.000 description 1
- JPNBLHSBLCCTEO-VPCXQMTMSA-N [[(2r,3r,4r,5r)-5-(2,4-dioxopyrimidin-1-yl)-3,4-dihydroxy-4-methyloxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C[C@@]1(O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 JPNBLHSBLCCTEO-VPCXQMTMSA-N 0.000 description 1
- HCXHLIFQJYSIBK-XVFCMESISA-N [[(2r,3r,4r,5r)-5-(2,4-dioxopyrimidin-1-yl)-4-fluoro-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound F[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 HCXHLIFQJYSIBK-XVFCMESISA-N 0.000 description 1
- YCZSHICNESTART-ZOQUXTDFSA-N [[(2r,3r,4r,5r)-5-(4-amino-2-oxopyrimidin-1-yl)-3-hydroxy-4-methoxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound CO[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)N=C(N)C=C1 YCZSHICNESTART-ZOQUXTDFSA-N 0.000 description 1
- YKEIUAOIVAXJRI-XVFCMESISA-N [[(2r,3r,4r,5r)-5-(4-amino-2-oxopyrimidin-1-yl)-4-fluoro-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](F)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 YKEIUAOIVAXJRI-XVFCMESISA-N 0.000 description 1
- RJZLOYMABJJGTA-XVFCMESISA-N [[(2r,3s,4r,5r)-4-amino-5-(2,4-dioxopyrimidin-1-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound N[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 RJZLOYMABJJGTA-XVFCMESISA-N 0.000 description 1
- WNVZQYHBHSLUHJ-XVFCMESISA-N [[(2r,3s,4r,5r)-4-amino-5-(4-amino-2-oxopyrimidin-1-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound N[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)N=C(N)C=C1 WNVZQYHBHSLUHJ-XVFCMESISA-N 0.000 description 1
- JKLOYZCVXRYXFE-XVFCMESISA-N [[(2r,3s,4r,5r)-4-azido-5-(2,4-dioxopyrimidin-1-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound [N-]=[N+]=N[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 JKLOYZCVXRYXFE-XVFCMESISA-N 0.000 description 1
- HWSNFUNJICGTGY-XVFCMESISA-N [[(2r,3s,4r,5r)-5-(4-amino-2-oxopyrimidin-1-yl)-4-azido-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](N=[N+]=[N-])[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HWSNFUNJICGTGY-XVFCMESISA-N 0.000 description 1
- 102000005421 acetyltransferase Human genes 0.000 description 1
- 108020002494 acetyltransferase Proteins 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 230000033289 adaptive immune response Effects 0.000 description 1
- 150000003838 adenosines Chemical class 0.000 description 1
- 210000004504 adult stem cell Anatomy 0.000 description 1
- 238000012382 advanced drug delivery Methods 0.000 description 1
- 125000003342 alkenyl group Chemical group 0.000 description 1
- 125000000304 alkynyl group Chemical group 0.000 description 1
- XQJHRCVXRAJIDY-UHFFFAOYSA-N aminophosphine Chemical compound PN XQJHRCVXRAJIDY-UHFFFAOYSA-N 0.000 description 1
- 206010002026 amyotrophic lateral sclerosis Diseases 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 238000005349 anion exchange Methods 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 238000003149 assay kit Methods 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000037429 base substitution Effects 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Chemical group OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 1
- 229940002008 bifidobacterium bifidum Drugs 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 239000012888 bovine serum Substances 0.000 description 1
- 229940098773 bovine serum albumin Drugs 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 238000010805 cDNA synthesis kit Methods 0.000 description 1
- TWFZGCMQGLPBSX-UHFFFAOYSA-N carbendazim Chemical compound C1=CC=C2NC(NC(=O)OC)=NC2=C1 TWFZGCMQGLPBSX-UHFFFAOYSA-N 0.000 description 1
- 239000001569 carbon dioxide Substances 0.000 description 1
- 229910002092 carbon dioxide Inorganic materials 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 239000002026 chloroform extract Substances 0.000 description 1
- MYSWGUAQZAJSOK-UHFFFAOYSA-N ciprofloxacin Chemical compound C12=CC(N3CCNCC3)=C(F)C=C2C(=O)C(C(=O)O)=CN1C1CC1 MYSWGUAQZAJSOK-UHFFFAOYSA-N 0.000 description 1
- HGCIXCUEYOPUTN-UHFFFAOYSA-N cis-cyclohexene Natural products C1CCC=CC1 HGCIXCUEYOPUTN-UHFFFAOYSA-N 0.000 description 1
- 230000015271 coagulation Effects 0.000 description 1
- 238000005345 coagulation Methods 0.000 description 1
- 239000000084 colloidal system Substances 0.000 description 1
- 238000002648 combination therapy Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000005289 controlled pore glass Substances 0.000 description 1
- 238000013270 controlled release Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000009615 deamination Effects 0.000 description 1
- 238000006481 deamination reaction Methods 0.000 description 1
- 230000003413 degradative effect Effects 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- MXHRCPNRJAMMIM-UHFFFAOYSA-N desoxyuridine Natural products C1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-UHFFFAOYSA-N 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 206010013023 diphtheria Diseases 0.000 description 1
- 208000037765 diseases and disorders Diseases 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 210000003162 effector t lymphocyte Anatomy 0.000 description 1
- 210000001671 embryonic stem cell Anatomy 0.000 description 1
- 230000008519 endogenous mechanism Effects 0.000 description 1
- 230000002616 endonucleolytic effect Effects 0.000 description 1
- 230000004049 epigenetic modification Effects 0.000 description 1
- 238000012236 epigenome editing Methods 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 208000030533 eye disease Diseases 0.000 description 1
- 239000012894 fetal calf serum Substances 0.000 description 1
- 230000001605 fetal effect Effects 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- XRECTZIEBJDKEO-UHFFFAOYSA-N flucytosine Chemical compound NC1=NC(=O)NC=C1F XRECTZIEBJDKEO-UHFFFAOYSA-N 0.000 description 1
- 229960004413 flucytosine Drugs 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 229960002949 fluorouracil Drugs 0.000 description 1
- 229920001002 functional polymer Polymers 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000009395 genetic defect Effects 0.000 description 1
- 239000006481 glucose medium Substances 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 210000002064 heart cell Anatomy 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 229920001519 homopolymer Polymers 0.000 description 1
- 102000056003 human IL15 Human genes 0.000 description 1
- 102000055228 human IL5 Human genes 0.000 description 1
- 102000052622 human IL7 Human genes 0.000 description 1
- 208000033519 human immunodeficiency virus infectious disease Diseases 0.000 description 1
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 238000009169 immunotherapy Methods 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007917 intracranial administration Methods 0.000 description 1
- 238000007913 intrathecal administration Methods 0.000 description 1
- 238000007914 intraventricular administration Methods 0.000 description 1
- 239000011630 iodine Substances 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 201000006370 kidney failure Diseases 0.000 description 1
- 229940115932 legionella pneumophila Drugs 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 1
- 210000005229 liver cell Anatomy 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- 238000001819 mass spectrum Methods 0.000 description 1
- 239000012092 media component Substances 0.000 description 1
- 239000012533 medium component Substances 0.000 description 1
- 210000003071 memory t lymphocyte Anatomy 0.000 description 1
- 208000030159 metabolic disease Diseases 0.000 description 1
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 1
- XOTXNXXJZCFUOA-UGKPPGOTSA-N methyl 2-[1-[(2r,3r,4r,5r)-4-hydroxy-5-(hydroxymethyl)-3-methoxyoxolan-2-yl]-2,4-dioxopyrimidin-5-yl]acetate Chemical compound CO[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(CC(=O)OC)=C1 XOTXNXXJZCFUOA-UGKPPGOTSA-N 0.000 description 1
- WZRYXYRWFAPPBJ-PNHWDRBUSA-N methyl uridin-5-yloxyacetate Chemical compound O=C1NC(=O)C(OCC(=O)OC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 WZRYXYRWFAPPBJ-PNHWDRBUSA-N 0.000 description 1
- YACKEPLHDIMKIO-UHFFFAOYSA-N methylphosphonic acid Chemical compound CP(O)(O)=O YACKEPLHDIMKIO-UHFFFAOYSA-N 0.000 description 1
- 239000000693 micelle Substances 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 239000003094 microcapsule Substances 0.000 description 1
- 238000000765 microspectrophotometry Methods 0.000 description 1
- 239000004005 microsphere Substances 0.000 description 1
- 101150084874 mimG gene Proteins 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 239000003607 modifier Substances 0.000 description 1
- 230000004879 molecular function Effects 0.000 description 1
- 235000019799 monosodium phosphate Nutrition 0.000 description 1
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 210000000663 muscle cell Anatomy 0.000 description 1
- 230000003387 muscular Effects 0.000 description 1
- 201000006938 muscular dystrophy Diseases 0.000 description 1
- 229910052754 neon Inorganic materials 0.000 description 1
- GKAOGPIIYCISHV-UHFFFAOYSA-N neon atom Chemical compound [Ne] GKAOGPIIYCISHV-UHFFFAOYSA-N 0.000 description 1
- 230000000926 neurological effect Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 230000030648 nucleus localization Effects 0.000 description 1
- 239000007764 o/w emulsion Substances 0.000 description 1
- 230000009438 off-target cleavage Effects 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 238000007911 parenteral administration Methods 0.000 description 1
- 229940051027 pasteurella multocida Drugs 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- XEBWQGVWTUSTLN-UHFFFAOYSA-M phenylmercury acetate Chemical compound CC(=O)O[Hg]C1=CC=CC=C1 XEBWQGVWTUSTLN-UHFFFAOYSA-M 0.000 description 1
- 150000008298 phosphoramidates Chemical class 0.000 description 1
- 150000008300 phosphoramidites Chemical class 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 210000001778 pluripotent stem cell Anatomy 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 230000023603 positive regulation of transcription initiation, DNA-dependent Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical group O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 1
- PSHHQIGKVLIVBD-UHFFFAOYSA-N purine-2,4-diamine Chemical class C1=NC(N)=NC2(N)N=CN=C21 PSHHQIGKVLIVBD-UHFFFAOYSA-N 0.000 description 1
- 238000000275 quality assurance Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 230000037425 regulation of transcription Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000009712 regulation of translation Effects 0.000 description 1
- 230000001718 repressive effect Effects 0.000 description 1
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 150000003290 ribose derivatives Chemical class 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 108091069025 single-strand RNA Proteins 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 210000004927 skin cell Anatomy 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 201000009032 substance abuse Diseases 0.000 description 1
- 231100000736 substance abuse Toxicity 0.000 description 1
- 208000011117 substance-related disease Diseases 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000000829 suppository Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 102100034045 tRNA-specific adenosine deaminase 2 Human genes 0.000 description 1
- 239000013076 target substance Substances 0.000 description 1
- 238000011191 terminal modification Methods 0.000 description 1
- 108010066651 thiophosphatase Proteins 0.000 description 1
- 229960003087 tioguanine Drugs 0.000 description 1
- 238000004448 titration Methods 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 230000006098 transglycosylation Effects 0.000 description 1
- 238000005918 transglycosylation reaction Methods 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 241001430294 unidentified retrovirus Species 0.000 description 1
- RVCNQQGZJWVLIP-VPCXQMTMSA-N uridin-5-yloxyacetic acid Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(OCC(O)=O)=C1 RVCNQQGZJWVLIP-VPCXQMTMSA-N 0.000 description 1
- YIZYCHKPHCPKHZ-UHFFFAOYSA-N uridine-5-acetic acid methyl ester Natural products COC(=O)Cc1cn(C2OC(CO)C(O)C2O)c(=O)[nH]c1=O YIZYCHKPHCPKHZ-UHFFFAOYSA-N 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- 239000000277 virosome Substances 0.000 description 1
- JCZSFCLRSONYLH-QYVSTXNMSA-N wyosin Chemical compound N=1C(C)=CN(C(C=2N=C3)=O)C=1N(C)C=2N3[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JCZSFCLRSONYLH-QYVSTXNMSA-N 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/31—Chemical structure of the backbone
- C12N2310/312—Phosphonates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/31—Chemical structure of the backbone
- C12N2310/315—Phosphorothioates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/32—Chemical structure of the sugar
- C12N2310/321—2'-O-R Modification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/50—Methods for regulating/modulating their activity
- C12N2320/51—Methods for regulating/modulating their activity modulating the chemical stability, e.g. nuclease-resistance
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Mycology (AREA)
- Cell Biology (AREA)
- Enzymes And Modification Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
하나 이상의 화학적으로 변형된 뉴클레오티드를 혼입하는 변형된 가이드 RNA(gRNA)를 사용하여, 시험관내 또는 세포내에서 표적 핵산(예컨대, 표적 DNA 또는 표적 RNA)의 CRISPR/Cas 기반 편집을 유도하거나, 표적 핵산의 발현을 조절하기 위한 조성물 및 방법이 본원에 제공된다. 일부 양상에서, 이러한 변형된 gRNA는 어려운 조건하에 탁월한 성능을 제공한다.
Description
관련 출원의 교차-참조
본 출원은 미국 가출원 번호 63/243,985(2021년 9월 14일에 출원됨) 및 63/339,737(2022년 5월 9일에 출원됨)에 대한 우선권을 주장하며, 이들 각각의 전체 내용은 본원에 참고로 인용된다.
기술분야
본 개시내용은 분자생물학 분야에 관한 것이다. 특히, 본 개시내용은 주기적 간격으로 분포하는 짧은 회문구조 반복서열의 클러스터(clusters of regularly interspaced short palindromic repeats, CRISPR) 기술에 관한 것이다.
천연 원핵생물 CRISPR-Cas 시스템은 일정한 길이의 가변 서열이 중간에 삽입된 짧은 반복부의 배열(즉, 주기적 간격으로 분포하는 짧은 회문식 반복 클러스터(clusters of regularly interspaced short palindromic repeats) 또는 "CRISPR"), 및 CRISPR 관련("Cas") 단백질을 포함한다. 전사된 CRISPR 배열의 RNA는 Cas 단백질의 하위 집합에 의해 작은 가이드 RNA(guide RNA)로 처리되며, 이는 일반적으로 하기 논의된 바와 같이 2개의 성분을 갖는다. 6개 이상의 상이한 시스템인 유형 I, 유형 II, 유형 III, 유형 IV, 유형 V 및 유형 VI이 존재한다. RNA를 성숙한 crRNA로 처리하는 데 관여하는 효소는 이들 6개의 시스템에서 상이하다. 천연 원핵생물 유형 II 시스템에서 가이드 RNA("gRNA")는 CRISPR RNA("crRNA") 및 트랜스-작용 RNA("tracrRNA")로 지칭되는 2개의 짧은 비인코딩 RNA 분절을 포함한다. 천연 유형 V 시스템에서, 가이드 RNA는 tracrRNA 분절 없이 Cas12(예를 들어, Cas12a는 Cpf1로도 공지되어 있음) 단백질과 활성 복합체를 형성하기에 충분한 crRNA를 포함한다. gRNA는 Cas 단백질과 복합체(리보핵단백질 "RNP" 복합체)를 형성한다. gRNA:Cas 단백질 복합체는 프로토스페이서 인접 모티프("PAM") 및 프로토스페이서(protospacer)(gRNA의 일부에 상보적인 서열을 가짐)를 갖는 표적 폴리뉴클레오티드 서열에 결합한다. gRNA:Cas 단백질 복합체에 의한 표적 폴리뉴클레오티드의 인식 및 결합은 표적 폴리뉴클레오티드의 절단을 유도한다. 천연 CRISPR-Cas 시스템은 원핵생물에서 면역 체계로서 기능하고, 이때 gRNA:Cas 단백질 복합체는 진핵생물의 RNAi와 유사한 방식으로 외인성 유전 요소를 인식하고 침묵시켜 플라스미드 및 파지와 같은 외인성 유전 요소에 대한 저항성을 부여한다.
CRISPR 기법은 많은 향상과 개선을 거쳤으며 계속해서 개발되고 있다. 초기 접근법에는 CRISPR-Cas 시스템을 사용하여 표적 DNA의 가닥 둘 다를 절단하는 것이 포함되며, 이중 가닥 절단으로 인한 상동성 재조합 또는 비상동성 말단 결합을 통해 편집이 이루어진다. 최신 기법에는 유전자 발현 조절 및 기타 유전자 편집 방법이 포함된다. 예를 들어, 프라임 편집(prime editing)은 DNA 내 표적 서열 편집을 위한 CRISPR 기반 기술이고, 염기전환(transversion) 및 전이 돌연변이(transition mutation)와 같은 다양한 형태의 염기 치환을 가능하게 한다. 또한, 이는 최대 약 700 bp 길이의 대규모 삭제를 포함하여 정확한 삽입 및 삭제를 가능하게 한다. 특히 프라임 편집은 외인성 DNA 복구 주형을 요하지 않는다. 대신, 목적하는 편집을 포함하는 중합 주형이 가이드 RNA에 포함되어 있으며, 이는 중합효소(예컨대, 역전사효소)와 융합된 Cas 단백질과 복합체를 형성한다. 표적 부위에 결합하면, Cas 단백질이 표적 부위에 닉을 생성(nicking)하고 중합효소는 중합 주형을 사용하여 새로운 DNA 가닥을 합성할 수 있다. 염기 편집은 시티딘 데아미나제와 같은 염기 편집자 효소가 Cas 단백질 및 가이드 RNA와 함께 전달되는 또 다른 유전자 편집 기법이다. 염기 편집자 효소는 gRNA:Cas 단백질 복합체에 의해 표적 부위로 이동하고, 탈아미노화를 촉매하여 표적 부위에서 시티딘 잔기의 돌연변이를 일으킨다. 유전자 발현의 조절은, 예를 들어, 절단 활성은 없지만 gRNA와 복합체를 형성하여 표적 부위에 결합할 수 있는 Cas 단백질에 전사 활성화제 또는 억제제를 융합함으로써 달성될 수 있다. 결과적으로, 전사 활성화제 또는 억제제는 표적 부위에서 유전자 발현을 조절할 수 있다. 따라서, 이 기법은 각각 CRISPRa 및 CRISPRi라고 불리며, 여기서 "a"는 활성화를 나타내고 "i"는 억제를 나타낸다.
이러한 발전에도 불구하고, CRISPR 기술에 대한 추가 개선, 특히 CRISPR 기반 시스템의 효율성 및 안정성 개선, 예를 들어, CRISPR-기반 유전자 편집 또는 조절의 채택을 강화하기 위한 필요성이 당업계에 존재한다.
도 1은 표적 부위에서 indel 생성을 위해 HBB 유전자가 표적화된 20만 개의 HepG2 세포에 형질감염시키기 위해 증가하는 양의 gRNA를 고정된 양의 Cas9 단백질과 혼합한 적정 연구의 결과를 나타내는 그래프이다. 이러한 결과는 편집을 위한 형질감염된 성분의 포화량 개념을 나타내고, 이때 증가하는 양은 편집 활성의 정체기(plateau)에 도달하고 양의 추가 증가는 일정한 수의 세포에서 편집 수율을 증가시키지 않는다.
도 2는 아포화량(sub-saturating amounts)의 Cas mRNA 및 gRNA(20만개의 세포에 대해 0.0625 pmol의 Cas9 mRNA 및 10 pmol의 gRNA)로 형질감염된 HepG2 세포에서 PBS 완충액으로 세포를 세척하여 잔류 혈청을 제거한 후 HBB의 표적적중 및 표적이탈 편집을 나타내는 그래프이다.
도 3은 아포화량의 Cas mRNA 및 gRNA(20만개의 세포에 대해 0.0625 pmol의 Cas9 mRNA 및 10의 pmol gRNA)로 형질감염된 HepG2 세포에서 PBS 완충액으로 세포를 세척하여 잔류 혈청을 제거한 후 HBB의 표적적중 및 표적이탈 편집을 나타내는 그래프이다.
도 4는 아포화량의 Cas mRNA 및 gRNA(20만개의 세포에 대해 0.5 pmol의 Cas9 mRNA 및 30 pmol의 gRNA)로 형질감염된 HepG2 세포에서 형질감염에 앞서 잔류 혈청을 제거하기 위해 세포가 완충액으로 세척되지 않았을 때 HBB의 표적적중 및 표적이탈 편집을 나타내는 그래프이다.
도 5는 아포화량의 Cas 단백질 및 gRNA(20만개의 세포에 대해 12.5 pmol의 Cas9 단백질 및 30 pmol의 sgRNA)로 형질감염된 HepG2 세포에서 형질감염에 앞서 혈청을 제거하기 위해 세포가 완충액으로 세척되지 않았을 때 HBB의 표적적중 및 표적이탈 편집을 나타내는 그래프이다.
도 6은 5' 및 3' 말단에 3xMS(상단), 또는 5' 말단에 3xMS 및 3' 말단에 3xMP(하단)를 혼입하는 2개의 예시적인 gRNA를 도시한다.
도 7은 K562 세포에서 화학적으로 변형된 gRNA의 상대적 수준을 시간에 따라 평가한 실험 결과를 나타낸 그래프이다. PBS 완충액으로 세포를 세척하여 잔류 혈청을 제거한 후, Cas 단백질의 부재하에 세포를 gRNA로 형질감염시켰다.
도 8은 아포화량의 Cas9 mRNA 및 gRNA(20만개의 세포에 대해 0.0625 pmol의 Cas9 mRNA 및 5 pmol의 sgRNA)로 형질감염된 1차 인간 T 세포에서 PBS 완충액으로 세포를 세척하여 잔류 혈청을 제거한 후, HBB의 표적이탈 편집을 나타내는 그래프이다.
도 9는 변형되지 않은 gRNA를 사용한 대조군과 비교하여 3' 말단에 MS 또는 MP를 갖는 화학적으로 변형된 gRNA를 사용한 K562 세포에서 HBB의 시티딘 염기 편집의 결과를 나타낸 그래프이다. 세포를 gRNA, 및 시티딘 데아미나제에 융합된 Cas9 니카아제를 인코딩하는 mRNA로 공동-형질감염시켰다.
도 10은 예시적인 CRISPR-Cas 시스템을 사용한 프라임 편집을 나타낸 예이다.
도 11은 화학적으로 변형된 pegRNA의 초기 세트를 사용하여 K562 세포에서 EMX1의 프라임 편집 효과를 나타내는 그래프이다. 세포를 pegRNA, 및 역전사효소에 융합된 Cas9 니카아제를 인코딩하는 mRNA로 공동-형질감염시켰다.
도 12는 화학적으로 변형된 pegRNA의 초기 세트를 사용하여 Jurkat 세포에서 EMX1의 프라임 편집 효과를 나타내는 그래프이다. 세포를 pegRNA, 및 역전사효소에 융합된 Cas9 니카아제를 인코딩하는 mRNA로 공동-형질감염시켰다.
도 13은 화학적으로 변형된 pegRNA의 제2 세트를 사용하여 K562 세포에서 EMX1의 프라임 편집의 효율성을 나타내는 그래프이다. 세포를 pegRNA, 및 역전사효소에 융합된 Cas9 니카아제를 인코딩하는 mRNA로 공동-형질감염시켰다.
도 14는 화학적으로 변형된 pegRNA의 제2 세트를 사용하여 Jurkat 세포에서 EMX1의 프라임 편집 효과를 나타내는 그래프이다. 세포를 pegRNA, 및 역전사효소에 융합된 Cas9 니카아제를 인코딩하는 mRNA로 공동-형질감염시켰다.
도 15는 화학적으로 변형된 pegRNA의 초기 세트를 사용하여 K562 세포에서 RUNX1의 프라임 편집의 효율성을 나타내는 그래프이다. 세포를 pegRNA, 및 역전사효소에 융합된 Cas9 니카아제를 인코딩하는 mRNA로 공동-형질감염시켰다.
도 16은 화학적으로 변형된 pegRNA의 초기 세트를 사용하여 Jurkat 세포에서 RUNX1의 프라임 편집 효과를 나타내는 그래프이다. 세포를 pegRNA, 및 역전사효소에 융합된 Cas9 니카아제를 인코딩하는 mRNA로 공동-형질감염시켰다.
도 17은 본원에 개시된 pegRNA에 혼입될 수 있는 화학적으로 변형된 뉴클레오티드의 2개의 예인 2'-O-메틸-3'-포스포로티오에이트(MS) 및 2'-O-메틸-3'-포스포노아세테이트(MP)의 화학 구조를 예시한다.
도 18은 예시적인 표적 서열을 사용한 EMX1 및 RUNX1의 프라임 편집을 도시한다.
도 19는 562 세포에서 EMX1의 프라임 편집을 평가한 실험 결과를 나타낸 그래프이다. 이 경우, 프라임 편집을 사용하여 EMX1의 PAM을 넉아웃(knockout)하였다. 세포를 pegRNA, 및 역전사효소에 융합된 Cas9 니카아제를 인코딩하는 mRNA로 공동-형질감염시켰다.
도 20은 Jurkat 세포에서 EMX1의 프라임 편집을 평가한 실험 결과를 나타낸 그래프이다. 이 경우, 프라임 편집을 사용하여 EMX1의 PAM을 넉아웃하였다. 세포를 pegRNA, 및 역전사효소에 융합된 Cas9 니카아제를 인코딩하는 mRNA로 공동-형질감염시켰다.
도 21은 K562 세포에서 RUNX1의 프라임 편집을 평가한 실험 결과를 나타낸 그래프이다. 이 경우, 프라임 편집을 사용하여 RUNX1에 3-염기 삽입을 도입하였다. 세포를 pegRNA, 및 역전사효소에 융합된 Cas9 니카아제를 인코딩하는 mRNA로 공동-형질감염시켰다.
도 22는 Jurkat 세포에서 RUNX1의 프라임 편집을 평가한 실험 결과를 나타낸 그래프이다. 이 경우, 프라임 편집을 사용하여 RUNX1에 3-염기 삽입을 도입하였다. 세포를 pegRNA, 및 역전사효소에 융합된 Cas9 니카아제를 인코딩하는 mRNA로 공동-형질감염시켰다.
도 23은 Cas9 단백질을 인코딩하는 sgRNA 및 mRNA로 공동-형질감염된 헹굼되지 않은(unrinsed) HepG2 세포에서 HBB 겸형 적혈구 대립유전자(및 공지된 유전자간 표적이탈 유전자좌)의 편집을 평가한 실험의 결과를 나타내는 그래프이다.
도 24는 Cas9 단백질에 의해 예비-복합체화된(pre-complexed) 화학적으로 변형된 sgRNA로부터 형성된 리보핵단백질(RNP) 복합체로 형질감염된 헹굼되지 않은 HepG2 세포에서 HBB 겸형 적혈구 대립유전자(및 공지된 유전자간 표적이탈 유전자좌)의 편집을 평가한 실험의 결과를 나타내는 그래프이다.
도 25는 Cas9 단백질에 의해 예비-복합체화된 화학적으로 변형된 163-mer sgRNA에 의해 형성된 리보핵단백질(RNP) 복합체로 형질감염된 헹굼되지 않은 HepG2 세포에서 HBB 겸형 적혈구 대립유전자(및 공지된 유전자간 표적이탈 유전자좌)의 편집을 평가한 실험의 결과를 나타내는 그래프이다. 163-mer sgRNA는 CRISPRa SAM 시스템용으로 설계되었지만, 이를 CRISPRa에 의한 유전자 활성화에 사용하는 대신 indel을 생성하기 위해 SpCas9 단백질과 함께 사용하였다.
도 2는 아포화량(sub-saturating amounts)의 Cas mRNA 및 gRNA(20만개의 세포에 대해 0.0625 pmol의 Cas9 mRNA 및 10 pmol의 gRNA)로 형질감염된 HepG2 세포에서 PBS 완충액으로 세포를 세척하여 잔류 혈청을 제거한 후 HBB의 표적적중 및 표적이탈 편집을 나타내는 그래프이다.
도 3은 아포화량의 Cas mRNA 및 gRNA(20만개의 세포에 대해 0.0625 pmol의 Cas9 mRNA 및 10의 pmol gRNA)로 형질감염된 HepG2 세포에서 PBS 완충액으로 세포를 세척하여 잔류 혈청을 제거한 후 HBB의 표적적중 및 표적이탈 편집을 나타내는 그래프이다.
도 4는 아포화량의 Cas mRNA 및 gRNA(20만개의 세포에 대해 0.5 pmol의 Cas9 mRNA 및 30 pmol의 gRNA)로 형질감염된 HepG2 세포에서 형질감염에 앞서 잔류 혈청을 제거하기 위해 세포가 완충액으로 세척되지 않았을 때 HBB의 표적적중 및 표적이탈 편집을 나타내는 그래프이다.
도 5는 아포화량의 Cas 단백질 및 gRNA(20만개의 세포에 대해 12.5 pmol의 Cas9 단백질 및 30 pmol의 sgRNA)로 형질감염된 HepG2 세포에서 형질감염에 앞서 혈청을 제거하기 위해 세포가 완충액으로 세척되지 않았을 때 HBB의 표적적중 및 표적이탈 편집을 나타내는 그래프이다.
도 6은 5' 및 3' 말단에 3xMS(상단), 또는 5' 말단에 3xMS 및 3' 말단에 3xMP(하단)를 혼입하는 2개의 예시적인 gRNA를 도시한다.
도 7은 K562 세포에서 화학적으로 변형된 gRNA의 상대적 수준을 시간에 따라 평가한 실험 결과를 나타낸 그래프이다. PBS 완충액으로 세포를 세척하여 잔류 혈청을 제거한 후, Cas 단백질의 부재하에 세포를 gRNA로 형질감염시켰다.
도 8은 아포화량의 Cas9 mRNA 및 gRNA(20만개의 세포에 대해 0.0625 pmol의 Cas9 mRNA 및 5 pmol의 sgRNA)로 형질감염된 1차 인간 T 세포에서 PBS 완충액으로 세포를 세척하여 잔류 혈청을 제거한 후, HBB의 표적이탈 편집을 나타내는 그래프이다.
도 9는 변형되지 않은 gRNA를 사용한 대조군과 비교하여 3' 말단에 MS 또는 MP를 갖는 화학적으로 변형된 gRNA를 사용한 K562 세포에서 HBB의 시티딘 염기 편집의 결과를 나타낸 그래프이다. 세포를 gRNA, 및 시티딘 데아미나제에 융합된 Cas9 니카아제를 인코딩하는 mRNA로 공동-형질감염시켰다.
도 10은 예시적인 CRISPR-Cas 시스템을 사용한 프라임 편집을 나타낸 예이다.
도 11은 화학적으로 변형된 pegRNA의 초기 세트를 사용하여 K562 세포에서 EMX1의 프라임 편집 효과를 나타내는 그래프이다. 세포를 pegRNA, 및 역전사효소에 융합된 Cas9 니카아제를 인코딩하는 mRNA로 공동-형질감염시켰다.
도 12는 화학적으로 변형된 pegRNA의 초기 세트를 사용하여 Jurkat 세포에서 EMX1의 프라임 편집 효과를 나타내는 그래프이다. 세포를 pegRNA, 및 역전사효소에 융합된 Cas9 니카아제를 인코딩하는 mRNA로 공동-형질감염시켰다.
도 13은 화학적으로 변형된 pegRNA의 제2 세트를 사용하여 K562 세포에서 EMX1의 프라임 편집의 효율성을 나타내는 그래프이다. 세포를 pegRNA, 및 역전사효소에 융합된 Cas9 니카아제를 인코딩하는 mRNA로 공동-형질감염시켰다.
도 14는 화학적으로 변형된 pegRNA의 제2 세트를 사용하여 Jurkat 세포에서 EMX1의 프라임 편집 효과를 나타내는 그래프이다. 세포를 pegRNA, 및 역전사효소에 융합된 Cas9 니카아제를 인코딩하는 mRNA로 공동-형질감염시켰다.
도 15는 화학적으로 변형된 pegRNA의 초기 세트를 사용하여 K562 세포에서 RUNX1의 프라임 편집의 효율성을 나타내는 그래프이다. 세포를 pegRNA, 및 역전사효소에 융합된 Cas9 니카아제를 인코딩하는 mRNA로 공동-형질감염시켰다.
도 16은 화학적으로 변형된 pegRNA의 초기 세트를 사용하여 Jurkat 세포에서 RUNX1의 프라임 편집 효과를 나타내는 그래프이다. 세포를 pegRNA, 및 역전사효소에 융합된 Cas9 니카아제를 인코딩하는 mRNA로 공동-형질감염시켰다.
도 17은 본원에 개시된 pegRNA에 혼입될 수 있는 화학적으로 변형된 뉴클레오티드의 2개의 예인 2'-O-메틸-3'-포스포로티오에이트(MS) 및 2'-O-메틸-3'-포스포노아세테이트(MP)의 화학 구조를 예시한다.
도 18은 예시적인 표적 서열을 사용한 EMX1 및 RUNX1의 프라임 편집을 도시한다.
도 19는 562 세포에서 EMX1의 프라임 편집을 평가한 실험 결과를 나타낸 그래프이다. 이 경우, 프라임 편집을 사용하여 EMX1의 PAM을 넉아웃(knockout)하였다. 세포를 pegRNA, 및 역전사효소에 융합된 Cas9 니카아제를 인코딩하는 mRNA로 공동-형질감염시켰다.
도 20은 Jurkat 세포에서 EMX1의 프라임 편집을 평가한 실험 결과를 나타낸 그래프이다. 이 경우, 프라임 편집을 사용하여 EMX1의 PAM을 넉아웃하였다. 세포를 pegRNA, 및 역전사효소에 융합된 Cas9 니카아제를 인코딩하는 mRNA로 공동-형질감염시켰다.
도 21은 K562 세포에서 RUNX1의 프라임 편집을 평가한 실험 결과를 나타낸 그래프이다. 이 경우, 프라임 편집을 사용하여 RUNX1에 3-염기 삽입을 도입하였다. 세포를 pegRNA, 및 역전사효소에 융합된 Cas9 니카아제를 인코딩하는 mRNA로 공동-형질감염시켰다.
도 22는 Jurkat 세포에서 RUNX1의 프라임 편집을 평가한 실험 결과를 나타낸 그래프이다. 이 경우, 프라임 편집을 사용하여 RUNX1에 3-염기 삽입을 도입하였다. 세포를 pegRNA, 및 역전사효소에 융합된 Cas9 니카아제를 인코딩하는 mRNA로 공동-형질감염시켰다.
도 23은 Cas9 단백질을 인코딩하는 sgRNA 및 mRNA로 공동-형질감염된 헹굼되지 않은(unrinsed) HepG2 세포에서 HBB 겸형 적혈구 대립유전자(및 공지된 유전자간 표적이탈 유전자좌)의 편집을 평가한 실험의 결과를 나타내는 그래프이다.
도 24는 Cas9 단백질에 의해 예비-복합체화된(pre-complexed) 화학적으로 변형된 sgRNA로부터 형성된 리보핵단백질(RNP) 복합체로 형질감염된 헹굼되지 않은 HepG2 세포에서 HBB 겸형 적혈구 대립유전자(및 공지된 유전자간 표적이탈 유전자좌)의 편집을 평가한 실험의 결과를 나타내는 그래프이다.
도 25는 Cas9 단백질에 의해 예비-복합체화된 화학적으로 변형된 163-mer sgRNA에 의해 형성된 리보핵단백질(RNP) 복합체로 형질감염된 헹굼되지 않은 HepG2 세포에서 HBB 겸형 적혈구 대립유전자(및 공지된 유전자간 표적이탈 유전자좌)의 편집을 평가한 실험의 결과를 나타내는 그래프이다. 163-mer sgRNA는 CRISPRa SAM 시스템용으로 설계되었지만, 이를 CRISPRa에 의한 유전자 활성화에 사용하는 대신 indel을 생성하기 위해 SpCas9 단백질과 함께 사용하였다.
본원에서는 세포(예를 들어, 생체외 치료에 사용하기 위한 1차 세포) 또는 생체내 세포(예를 들어, 인간과 같은 대상의 장기 또는 조직내 세포)에서 CRISPR/Cas-기반 게놈 편집 및/또는 유전자 별현의 조절을 위한 방법이 제공된다. 특히, 본원에 제공된 방법은, 상응하는 비변형된 gRNA에 비해 유전자 편집 또는 조절에서 증대된 활성 또는 수율을 갖는 화학적으로 변형된 가이드(modified guide) RNA(gRNA)를 사용한다. 일부 양상에서, 본 개시내용은 Cas 단백질, Cas 단백질을 인코딩하는 mRNA, 또는 Cas 단백질을 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 발현 벡터와 함께 표적 핵산에 하이브리드화되는 화학적으로 변형된 gRNA를 도입함으로써 세포에서 표적 핵산의 서열을 편집하거나, 표적 핵산의 발현을 조절하는 방법을 제공한다. 일부 양상에서, Cas 단백질은 뉴클레아제 활성(예컨대, dCas9)을 결여하거나, 니카아제 활성을 보유하는 변이체일 수 있다. 일부 양상에서, Cas 단백질은 Cas 폴리펩티드 및 역전사효소 폴리펩티드를 포함하는 융합 단백질로서 제공된다. 일부 양상에서, 본 개시내용은 유전자 질환과 연관된 유전자 돌연변이를 (환자의 게놈 DNA를 편집함으로써 또는 상기 질환과 연관된 유전자의 발현을 조절함으로써) 교정하기에 충분한 양의 화학적으로 변형된 RNA를 투여함으로써 대상에서 상기 유전자 질환을 예방하거나 치료하는 방법을 제공한다.
본 개시내용의 양상들은 당업계의 기술에 속하는 면역학, 생화학, 화학, 분자생물학, 미생물학, 세포생물학, 유전체학 및 재조합 DNA의 통상적인 기술들을 이용한다(문헌[Sambrook, Fritsch and Maniatis, Molecular Cloning: A Laboratory Manual, 2nd edition (1989)], [Current Protocols in Molecular Biology (F. M. Ausubel, et al. eds., (1987)], [the series Methods in Enzymology (Academic Press, Inc.): PCR 2: A Practical Approach (M. J. MacPherson, B. D. Hames and G. R. Taylor eds. (1995)], [Harlow and Lane, eds. (1988)], [Antibodies, A Laboratory Manual, and Animal Cell Culture (R. I. Freshney, ed. (1987)] 참고).
시판되지 않는 올리고뉴클레오티드는, 예를 들어, 문헌[Van Devanter et. al., Nucleic Acids Res. 12:6159-6168 (1984)]에 기재된 바와 같이, 자동 합성기를 사용하여, 문헌[Beaucage and Caruthers, Tetrahedron Lett. 22:1859-1862 (1981)]에 처음 기재된 고체상 포스포르아미다이트 트라이에스터 방법에 따라서 화학적으로 합성될 수 있다. 올리고뉴클레오티드의 정제는 임의의 당업계에 알려진 전략, 예를 들어, 문헌[Pearson and Reanier, J. Chrom. 255:137-149 (1983)]에 기재된 바와 같은 천연 아크릴아미드 겔 전기영동 또는 음이온-교환 고성능 액체 크로마토그래피(HPLC)를 사용하여 수행한다.
정의 및 약어
구체적으로 달리 나타내지 않는 한, 본원에서 사용된 모든 기술 용어 및 과학 용어들은 당업자에 의해 통상적으로 이해되는 바와 동일한 의미를 갖는다. 또한, 본원에 기재된 방법 또는 물질과 유사하거나 등가인 임의의 방법 또는 물질이 본원에 기재된 방법 및 조성물의 제조의 실시에 사용될 수 있다. 본 발명의 목적을 위해, 하기의 용어들을 정의한다.
본원에서 사용된 단수형 표현은 1개의 구성원을 갖는 양태를 포함할 뿐 아니라 1개보다 많은 구성원을 갖는 양태도 포함한다. 예를 들어, 단수형 표현은 문맥에서 명확하게 달리 지시하지 않는 한 복수의 언급대상을 포함한다. 따라서, 예를 들어, "세포"에 대한 언급은 다수의 상기 세포들을 포함하고, "약제"에 대한 언급은 당업계에 숙련된 자에게 공지된 하나 이상의 약제들 등에 대한 언급을 포함한다.
"CRISPR 관련 단백질" 또는 "Cas 단백질" 또는 "Cas 폴리펩티드"라는 용어는 야생형 Cas 단백질, 이의 단편, 또는 이의 돌연변이체 또는 변이체를 의미한다. "Cas 돌연변이체" 또는 "Cas 변이체"라는 용어는 야생형 Cas 단백질의 단백질 또는 폴리펩티드 유도체, 예를 들어, 하나 이상의 점 돌연변이, 삽입, 결실, 절단을 갖는 단백질, 융합 단백질 또는 이들의 조합을 의미한다. 특정 양태에서, "Cas 돌연변이체" 또는 "Cas 변이체"는 Cas 단백질의 뉴클레아제 활성을 실질적으로 유지한다. 특정 양태에서, "Cas 돌연변이체" 또는 "Cas 변이체"는 뉴클레아제 도메인 중 하나 또는 둘 모두가 불활성이도록 돌연변이된다(이 단백질은 각각 Cas 니카아제 또는 데드 Cas 단백질로 지칭될 수 있음). 특정 양태에서, "Cas 돌연변이체" 또는 "Cas 변이체"는 뉴클레아제 활성을 갖는다. 특정 양태에서, "Cas 돌연변이체" 또는 "Cas 변이체"는 야생형 대응물의 뉴클레아제 활성 중 일부 또는 전부가 결여되어 있다. "CRISPR 관련 단백질" 또는 "Cas 단백질"이라는 용어는 다양한 원핵생물 종의 야생형 Cpf1 단백질(Cas12a라고도 함)(Prevotella 및 Francisella 1 리보핵단백질 또는 CRISPR/Cpf1 리보핵단백질로부터의 클러스터화된 주기적 간격으로 분포하는 짧은 회문구조 반복서열에 대해 명명됨), 이의 단편, 또는 이의 돌연변이 또는 변이체를 또한 포함한다. Cas 단백질은 유형 I, 유형 II, 유형 III, 유형 IV, 유형 V 및 유형 VI의 6가지 CRISPR 시스템 중 하나를 포함하되, 이에 한정되지 않는 임의의 CRISPR 관련 단백질이 포함된다.
Cas 단백질의 "뉴클레아제 도메인"이라는 용어는 DNA 절단에 대한 촉매 활성을 보유하는 단백질내의 폴리펩티드 서열 또는 도메인을 의미한다. Cas9는 일반적으로 PAM 서열의 상류에서 이중 가닥 절단을 촉매한다. 뉴클레아제 도메인은 단일 폴리펩티드 쇄에 함유될 수 있거나, 절단 활성은 2개(또는 그 이상)의 폴리펩티드의 결합으로 인해 발생할 수 있다. 단일 뉴클레아제 도메인은 주어진 폴리펩티드내에서 아미노산의 하나 초과의 단리된 스트레치(stretch)로 구성될 수 있다. 이들 도메인의 예에는 RuvC-유사 모티프(서열번호 1의 아미노산 7 내지 22, 759 내지 766 및 982 내지 989) 및 HNH 모티프(아미노산 837 내지 863)이 포함되고, 문헌[Gasiunas et al. (2012) Proc. Natl. Acad. Sci. USA 109:39, E2579-E2586] 및 WO 2013/176772를 참고한다.
"gRNA 기능성"을 갖는 합성 가이드 RNA("gRNA")는 Cas 단백질과 회합하여 리보핵단백질(RNP) 복합체를 형성하는 것과 같은 자연 발생 가이드 RNA의 기능 중 하나 이상, 또는 Cas 단백질과의 회합에서 가이드 RNA에 의해 수행되는 기능(즉, RNP 복합체의 기능)을 갖는 것이다. 특정 양태에서, 기능성에는 표적 폴리뉴클레오티드에 대한 결합이 포함된다. 특정 양태에서, 기능성은 Cas 단백질 또는 gRNA:Cas 단백질 복합체를 표적 폴리뉴클레오티드에 대해 표적화하는 것을 포함한다. 특정 양태에서, 기능성에는 표적 폴리뉴클레오티드에 닉을 생성하는 것이 포함된다. 특정 양태에서, 기능성에는 표적 폴리뉴클레오티드를 절단하는 것이 포함된다. 특정 양태에서, 기능성은 Cas 단백질과 회합하거나 이에 결합하는 것을 포함한다. 예를 들어, Cas 단백질은, 융합된 단백질 또는 그 부분이 표적 부위에서 그 기능을 발휘할 수 있도록, 전사 인자 인핸서 또는 억제인자, 데아미나제 단백질, 역전사효소, 중합효소와 같은 하나 이상의 단백질 또는 이의 일부에 융합된 "데드(dead)" Cas 단백질(dCas)이 되도록 조작될 수 있다. 특정 양태에서, 기능성은 염기 편집 기능성을 포함한다. 다른 양태에서, 기능성은 프라임 편집 기능성을 포함한다. 특정 양태에서, 기능성은 유전자 발현의 활성화, 억제 또는 간섭을 포함한다. 다른 양태에서, 기능성은 후생적 변형을 포함한다. 특정 양태에서, 기능성은 조작된 Cas 단백질을 갖는 인공 CRISPR-Cas 시스템을 비롯한 Cas 단백질을 갖는 CRISPR-Cas 시스템에서 가이드 RNA의 임의의 다른 공지된 기능이다. 특정 양태에서, 기능성은 천연 가이드 RNA의 임의의 다른 기능이다. 합성 가이드 RNA는 자연 발생 가이드 RNA보다 더 크거나 더 작은 정도로 gRNA 기능성을 가질 수 있다. 특정 양태에서, 합성 가이드 RNA는 유사한 자연 발생 가이드 RNA와 비교하여 하나의 기능에 대해서는 더 큰 활성을 갖고 다른 기능에 대해서는 더 적은 활성을 가질 수 있다.
단일 가닥 "닉 생성(nicking)" 활성을 갖는 Cas 단백질은 야생형 Cas 단백질과 비교하여 dsDNA의 두 가닥 중 하나를 절단하는 능력이 감소된 Cas 돌연변이 또는 Cas 변이체를 비롯한 Cas 단백질을 의미한다. 예를 들어, 특정 양태에서, 단일 가닥 닉 생성 활성을 갖는 Cas 단백질은 RuvC 도메인(또는 HNH 도메인)의 기능을 감소시키고 결과적으로 표적 DNA의 하나의 가닥을 절단하는 능력을 감소시키는 돌연변이(예를 들어, 아미노산 치환)를 갖는다. 이러한 변이체의 예에는 S. pyogenes Cas9에서 D10A, H839A/H840A 및/또는 N863A 치환이 포함되며, 또한 다른 종의 Cas9 효소의 등가 부위에 동일하거나 유사한 치환이 포함된다.
"결합" 활성을 갖거나 표적 폴리뉴클레오티드에 "결합"하는 Cas 단백질은 가이드 RNA와 복합체를 형성하고, 이러한 복합체에 있을 때, 가이드 RNA가 염기쌍을 형성하는 가이드 RNA의 염기와 다른 폴리뉴클레오티드 사이의 수소 결합을 통해 표적 폴리뉴클레오티드 서열과 같은 다른 폴리뉴클레오티드와 하이브리드화하는 Cas 단백질을 의미한다. 수소 결합은 왓슨-크릭 염기쌍 결합이나 기타 서열 특정 방식으로 발생할 수 있다. 하이브리드는 듀플렉스(duplex)를 형성하는 2개의 가닥, 다중 가닥 트리플렉스(triplex)를 형성하는 3개 이상의 가닥, 또는 이들의 임의의 조합을 포함할 수 있다.
"CRISPR 시스템"은 유전자 편집, DNA 절단, DNA 닉 생성, DNA 결합, 유전자 발현 조절, CRISPR 활성화(CRISPRa), CRISPR 간섭(CRISPRi)을 포함하되, 이에 한정되지 않는 기능 또는 효과, 및 Cas 단백질을 다른 효과기에 연결하여 Cas 단백질에 의해 인식되는 표적 서열에 대한 효과기 기능을 달성함으로써 달성할 수 있는 임의의 다른 기능을 제공하기 위해 하나 이상의 Cas 단백질과 하나 이상의 gRNA를 이용하는 시스템이다. 예를 들어, 뉴클레아제가 없는 Cas 단백질은 전사 인자, 데아미나제, 메틸라제, 역전사효소 등에 융합될 수 있다. 생성된 융합 단백질은 표적에 대한 가이드 RNA의 존재 하에 표적을 편집하거나, 표적의 전사를 조절하거나, 표적을 탈아미노화하거나, 표적을 메틸화하는 데 사용될 수 있다. 또 다른 예로서, 프라임 편집에서 Cas 단백질은 역전사효소 또는 다른 중합효소(임의적으로 융합 단백질)와 함께 사용되어 pegRNA의 존재하에 표적 핵산을 편집한다.
"융합 단백질"은 서로 공유결합으로 연결된 2개 이상의 펩티드 서열(즉, 아미노산 서열)(상기 2개의 펩티드 서열은 자연에서는 공유결합으로 연결되지 않음)을 포함하는 단백질이다. 2개의 펩티드 서열은 (이들 사이의 결합에 의해) 직접적으로 또는 (이들 사이의 링커(상기 링커는 제3 펩티드 서열을 포함하지만, 이에 제한되지 않는 임의의 화학 구조를 포함할 수 있음)에 의해) 간접적으로 연결될 수 있다.
"프라임 편집자"는 Cas 단백질과 역전사효소 활성 둘 다를 갖는 분자 또는 여러 분자의 집합이다. 일부 양태에서, Cas 단백질은 니카아제다. 일부 양태에서, 프라임 편집자는 Cas 단백질과 역전사효소 둘 다를 포함하는 융합 단백질이다. 본 개시내용의 다른 곳에 표시된 바와 같이, 다른 중합효소가 역전사효소 대신 프라임 편집에 사용될 수 있으므로, 프라임 편집자는 RT(역전사효소) 대신 역전사효소가 아닌 중합효소를 포함할 수 있다. 다양한 버전의 프라임 편집자가 개발되었으며 PE1, PE2, PE3 등으로 지칭된다. 예를 들어, "PE2"는 Cas9(H840A) 니카아제 및 MMLV RT의 변이체([NLS]-[Cas9(H840A)]-[링커]- [MMLV_RT(D200N)(T330P)(L603W)(T306K)(W313F)] 구조를 가짐), 및 목적하는 pegRNA를 포함하는 융합 단백질(PE2 단백질)을 포함하는 PE 복합체를 나타낸다. "PE3"은 PE2 단백질과 복합체를 형성하고 편집되지 않은 DNA 가닥에 닉을 도입하여 세포가 표적 영역을 복구하도록 자극하는 제2 가닥 닉 생성 가이드 RNA와 PE2를 지칭하고, 이는 편집물을 게놈에 혼입하는 것을 용이하게 한다(문헌[Anzalone et al. 2019]; Liu의 WO 2020/191153 참고). 프라임 편집자는 본 개시내용의 다른 부분에서 상세히 기재된 바와 같이 프라임 편집 gRNA 또는 "pegRNA"로 지칭되는 특수화된 gRNA를 사용한다.
"염기 편집자" 또는 "BE"는 Cas 단백질(또는 돌연변이 단백질)과 데아미나제 또는 트랜스글리코실화 활성 둘 다를 갖는 분자 또는 여러 분자의 집합이다. 염기 편집자(BE)는 전형적으로 Cas 도메인과 뉴클레오티드 변형 도메인(예컨대, 천연 또는 진화된 데아미나제, 예를 들어, 시티딘 데아미나제, 예를 들어, APOBEC1("아포지단백질 B mRNA 편집자 효소, 촉매 폴리펩티드 1"), CDA("시티딘 데아미나제"), 및 AID("활성화-유도 시티딘 데아미나제") 또는 아데노신 데아미나제, 예를 들어, TadA(세균성 tRNA-특이적 아데노신 데아미나제))의 융합이다. 현재까지 2개의 클래스의 데아미나제 염기 편집자가 일반적으로 기재된 바 있다: 시토신 염기 표적 C:G 염기쌍을 T:A 염기쌍으로 변환하는 편집자("CBE"), 및 A:T 염기쌍을 G:C 염기쌍으로 변환하는 아데노신 염기 편집자("ABE"). 종합적으로, 이러한 2개의 클래스의 염기 편집자는 가능한 모든 전이 돌연변이(C에서 T로, G에서 A로, A에서 G로, T에서 C로, C에서 U로, A에서 U로)의 표적화된 설치를 가능하게 하고, 문헌[Gaudelli, N.M. et al, Programmable base editing of A:T to G:C in genomic DNA without DNA cleavage. Nature 551, 464-471 (2017)](이는 본원에 참고로 인용됨)을 참고한다. 염기 편집에서 사용되는 또 다른 뉴클레오티드 변형 도메인은 트랜스글리코실라제 도메인, 예컨대 야생형 tRNA 구아닌 트랜스글리코실라제(TGT), 또는 이의 변이체, 예컨대 리보스-핵염기 글리코시드 결합에서 제1 핵염기(즉, 티민)를 제2 핵염기로 대체하는 TGT이다. 트랜스글리코실라제 편집자는 티민에서 구아닌으로 또는 "TGBE"(또는 아데닌에서 시토신으로 또는 "ACBE") 전환 염기 편집자를 제공한다. 일부 경우, 염기 편집자는 또한 세포 DNA 복구 과정을 변경하여 결과적인 단일 뉴클레오티드 변화의 효율성 및/또는 안정성을 증가시키는 단백질 또는 도메인을 포함할 수 있다. 일부 양태에서, 염기 편집자는 하나 이상의 NLS(핵 국소화 서열(nuclear localization sequence))를 포함하고, 하나 이상의 우라실-DNA 글리코실라제 억제제(UGI) 도메인을 추가로 포함할 수 있으며, 이는 우라실-DNA 글리코실라제를 억제하여 C에서 T로의 염기 편집자 단백질의 염기 편집 효율을 향상시킬 수 있다. 일부 양태에서, Cas 도메인은 니카아제(예컨대, nCas9)이다. 일부 양태에서, Cas 단백질은 완전히 뉴클레아제-불활성화된 단백질 또는 데드 Cas9 "dCas9"이다. 일부 양태에서, 염기 편집자는 Cas 단백질(또는 이의 일부)과 데아미나제(또는 이의 일부) 둘 다를 포함하는 융합 단백질이다. 일부 양태에서, 염기 편집자는 Cas 단백질(또는 이의 일부)과 트랜스글리코실라제(또는 이의 일부) 둘 다를 포함하는 융합 단백질이다. PAM 호환성이 상이하거나 확장된 염기 편집자(참고: 문헌[Kim, Y.B. et al. Increasing the genome-targeting scope and precision of base editing with engineered Cas9-cytidine deaminase fusions. Nature biotechnology 35, 371-376 (2017)]; [Hu, J.H. et al. Evolved Cas9 variants with broad PAM compatibility and high DNA specificity. Nature 556, 57-63 (2018)]; [Li, X. et al. Base editing with a Cpf1-cytidine deaminase fusion. Nature biotechnology 36, 324-327 (2018)]), 표적이탈 활성이 감소된 고충실도 염기 편집자(참고: 문헌[Hu, J.H. et al. Evolved Cas9 variants with broad PAM compatibility and high DNA specificity. Nature 556, 57-63 (2018)]; [Rees, H.A. et al. Improving the DNA specificity and applicability of base editing through protein engineering and protein delivery. Nat Commun 8, 15790 (2017)]; [Kleinstiver, B.P., Pattanayak, V., Prew, M.S. & Nature, T.-S.Q. High-fidelity CRISPR-Cas9 nucleases with no detectable genome-wide off-target effects. Nature (2016)]; [Chen, J.S. et al. Enhanced proofreading governs CRISPR-Cas9 targeting accuracy. Nature 550, 407-410 (2017)]; [Slaymaker, I.M. et al. Rationally engineered Cas9 nucleases with improved specificity. Science 351, 84-88 (2016)]), 더 좁은 편집 윈도우(통상적으로 약 5개의 뉴클레오티드 폭)를 갖는 염기 편집자(참고: 문헌[Kim, Y.B. et al. Increasing the genome-targeting scope and precision of base editing with engineered Cas9-cytidine deaminase fusions. Nature biotechnology 35, 371-376 (2017)]), 및 감소된 부산물을 갖는 시티딘 염기 편집자(BE4)(참고: 문헌[Komor, A.C. et al. Improved base excision repair inhibition and bacteriophage Mu Gam protein yields C:G-to-T:A base editors with higher efficiency and product purity. Sci Adv 3, eaao4774 (2017)])와 같이, 이전 시스템에 비해 개선된 다양한 버전의 염기 편집자가 개발되었다. 염기 편집자의 다양한 버전은 BE1, BE2, BE3, BE4 등으로 지칭된다. 프라임 편집자와 달리, 염기 편집자는 목적하는 서열 위치에서 핵산을 표적화하는 염기 편집자의 Cas 효과기 부분을 프로그래밍하는 "통상적인" gRNA(예컨대, Cas9 스타일 또는 Cpf1 스타일)와 협동하여 기능한다.
"가이드 RNA"(또는 "gRNA")는 일반적으로 Cas 단백질에 결합하고 Cas 단백질을 표적 폴리뉴클레오티드내의 특정 위치(예컨대, DNA)에 대해 표적화하는 데 도움을 줄 수 있는 RNA 분자(또는 집합적으로 RNA 분자의 군)를 의미한다. 따라서, 가이드 RNA는 표적 서열에 하이브리드화할 수 있는 가이드 서열을 포함하고, 가이드 RNA의 또 다른 부분("스캐폴드(scaffold)")은 Cas 단백질에 결합하여 가이드 RNA와 Cas 단백질의 리보핵단백질(RNP) 복합체를 형성하는 기능을 한다. Cas9 스타일과 Cpf1 스타일의 가이드 RNA를 포함하되, 이에 한정되지 않는 다양한 스타일의 가이드 RNA가 있다. 가이드 RNA의 "Cas9 스타일"은 crRNA 분절과 tracrRNA 분절을 포함한다. 본원에 사용된 용어 "crRNA" 또는 "crRNA 분절"은 폴리뉴클레오티드-표적화 가이드 서열을 포함하는 RNA 분자 또는 이의 부분; Cas 단백질과 상호작용하는 데 도움이 되는 스캐폴드 서열; 및 임의적으로 5'-돌출부 서열을 지칭한다. 본원에 사용된 용어 "tracrRNA" 또는 "tracrRNA 분절"은 Cas9와 같은 CRISPR 관련 단백질과 상호작용할 수 있는 단백질-결합 분절을 포함하는 RNA 분자 또는 이의 부분을 의미한다. Cas9 외에도 Cas9 스타일의 가이드 RNA를 사용하는 다른 Cas 단백질이 있으며, "Cas9 스타일"이라는 용어에서 "Cas9"라는 단어는 단지 이 스타일을 사용하는 다양한 Cas 단백질의 대표적인 구성원을 지정하기 위해 사용된다. "Cpf1 스타일"은 가이드 서열의 5' 위치에 있는 스캐폴드를 포함하는 1-분자 가이드 RNA이다. 문헌에서, Cpf1 가이드 RNA는 통상적으로 crRNA만을 갖고 tracrRNA는 갖지 않는 것으로 설명된다. 용어에 관계없이, 모든 가이드 RNA에는 표적에 결합하는 가이드 서열과 Cas 단백질과 상호작용할 수 있는 스캐폴드 영역이 있다는 점에 유의해야 한다. 특수화된 gRNA(pegRNA)를 사용하는 프라임 편집과 달리, 염기 편집은 통상적인 gRNA(예컨대, Cas9 스타일 및 Cpf1 스타일)를 사용한다.
"가이드 RNA"라는 용어는 하나의 분자에 모든 기능적 부분을 포함하는 단일 가이드 RNA("sgRNA")를 포함한다. 예를 들어, Cas9 스타일의 sgRNA에서는, crRNA 분절과 tracrRNA 분절이 동일한 RNA 분자에 위치한다. 또 다른 예로서, Cpf1 가이드 RNA는 자연적으로 단일 가이드 RNA 분자이다. "가이드 RNA"라는 용어는 또한 집합적으로 2개 이상의 RNA 분자의 군을 포함하고, 예를 들어, crRNA 분절과 tracrRNA 분절은 별도의 RNA 분자에 위치할 수 있다. 또한, 본원에 사용된 용어 "gRNA"는 프라임 편집(pegRNA), 염기 편집 및 유전자 발현 조절, 및 gRNA를 사용하는 임의의 다른 CRISPR 기술에 사용되는 가이드 RNA를 포함한다.
임의적으로, "가이드 RNA"는 gRNA와 관련된 Cas 단백질의 기능과 함께 분자 기능을 수행하는 동족 폴리펩티드 또는 효소에 의해 인식되고 결합될 때 하나 이상의 보조 기능을 제공하는 하나 이상의 추가 분절을 포함할 수 있다. 예를 들어, 프라임 편집을 위한 gRNA(일반적으로 "pegRNA"로 지칭됨)는 프라이머 결합 부위 및 역전사효소 주형을 포함할 수 있다. 또 다른 예에서, gRNA는 앱타머-결합 폴리펩티드를 인식하고 이에 결합하는 하나 이상의 앱타머(예컨대, MS2 앱타머)를 형성하는 하나 이상의 폴리뉴클레오티드 분절을 포함할 수 있다(임의적으로, 다른 폴리펩티드에 융합되고(예컨대, MS2-p65-HSF1), 이는 Cas 단백질 또는 Cas 융합 단백질(예컨대, dCas9-VP64)과 함께 전사 활성화와 같은 보조적 기능을 하고, 상기 시스템은 상승작용적 활성화 매개자(synergistic activation mediator) "SAM" 시스템으로 공지되어 있고, 문헌[S. Konermann et al., Genome-scale transcriptional activation by an engineered CRISPR-Cas9 complex. Nature. 517, 583-588 (2015)], 및 [M. A. Horlbeck et al., Compact and highly active next-generation libraries for CRISPR-mediated gene repression and activation. eLife. 5, e19760 (2016)]을 참고한다).
임의적으로, "가이드 RNA"는, 예를 들어, 엔도뉴클레아제 및/또는 엑소뉴클레아제와 같은 뉴클레아제에 의해 발생할 수 있는 분해를 방해하여 gRNA의 안정성을 증가시킬 수 있는 추가 폴리뉴클레오티드 분절(예컨대, 3' 말단(또는 5' 말단) 폴리우리딘 테일(tail), 헤어핀, 줄기 루프(stem loop), 토루프(toeloop) 등)을 포함할 수 있다.
용어 "가이드 서열"은 표적 폴리뉴클레오티드내의 표적 서열과 부분적 또는 완전한 상보성을 가지며 Cas 단백질에 의해 촉진되는 염기쌍 형성에 의해 표적 서열과 하이브리드화될 수 있는 gRNA(또는 pegRNA)내의 연속적인 뉴클레오티드 서열을 의미한다. 일부 경우에서, 표적 서열은 PAM 부위(PAM 서열)에 인접해 있다. 일부 경우에서, 표적 서열이 PAM 서열의 바로 상류에 위치할 수도 있다. 가이드 서열에 하이브리드화하는 표적 서열은 PAM 서열의 보체로부터 바로 하류에 있을 수 있다. Cpf1과 같은 다른 예에서, 가이드 서열에 하이브리드화되는 표적 서열의 위치는 PAM 서열의 보체로부터 상류일 수 있다.
가이드 서열은 약 14개의 뉴클레오티드만큼 짧을 수도 있고 약 30개의 뉴클레오티드만큼 길 수도 있다. 일반적인 가이드 서열의 길이는 15, 16, 17, 18, 19, 20, 21, 22, 23 및 24개의 뉴클레오티드다. 가이드 서열의 길이는 상기 언급한 CRISPR-Cas 시스템의 2개의 클래스와 6개의 유형에 따라 상이하다. Cas9의 합성 가이드 서열은 통상적으로 20개의 뉴클레오티드 길이이지만 더 길 수도 있고 더 짧을 수도 있다. 가이드 서열이 20개의 뉴클레오티드보다 짧을 때, 이는 일반적으로 20개의 뉴클레오티드 가이드 서열과 비교하여 5' 말단에서 결실이다. 예를 들어, 가이드 서열은 표적 서열에 상보적인 20개의 뉴클레오티드로 구성될 수 있다. 즉, 가이드 서열은 DNA와 RNA 사이의 A/U 차이를 제외하고는 PAM 서열 상류의 20개의 뉴클레오티드와 동일하다. 이러한 가이드 서열이 5' 말단에서 3개의 뉴클레오티드에 의해 절단되면, 20-뉴클레오티드 가이드 서열의 뉴클레오티드 4는 이제 17-mer에서 뉴클레오티드 1이 되고, 20-뉴클레오티드 가이드 서열의 뉴클레오티드 5는 이제 17-mer에서 뉴클레오티드 2가 되는 등이다. 새 위치는 17-mer 가이드 서열의 원래 위치에서 3을 뺀 값이다.
본원에서 용어 "프라임 편집 가이드 RNA"(또는 "pegRNA")는 핵산의 표적 서열에 대한 하나 이상의 편집물을 인코딩하는 역전사효소 주형 서열, 및 표적 영역의 서열 결합 부위(표적 부위라고도 함)에 결합할 수 있는 프라이머를 포함하는 가이드 RNA(gRNA)를 의미한다. 예를 들어, pegRNA는 표적 영역의 서열에 대한 하나 이상의 뉴클레오티드 치환, 삽입 또는 결실을 포함하는 역전사효소 주형 서열을 포함할 수 있다. pegRNA는 Cas 단백질과 복합체를 형성하고 일반적으로 세포 게놈의 표적 영역내의 표적 서열에 하이브리드화하여 표적 영역의 서열을 편집하는 기능을 갖는다. 일부 양태에서, 이론에 한정되지 않고, pegRNA는 Cas 단백질과 RNP 복합체를 형성하고 표적 영역의 표적 서열과 결합하고, Cas 단백질은 표적 영역의 하나의 가닥에 닉을 생성하여 플랩(flap)을 생성하고, pegRNA의 프라이머 결합 부위는 플랩과 하이브리드화되고, 역전사효소는 플랩을, 주형으로 사용되는 pegRNA의 하이브리드화된 역전사효소 주형의 프라이머로 사용하여 플랩의 닉이 있는 말단 부분에 새로운 DNA 서열을 합성한 후, 목적하는 편집물을 함유하게 되고, 궁극적으로, 이러한 새로운 DNA 서열은 표적 영역의 원래 서열을 대체하여 표적의 편집을 야기한다.
"pegRNA"는 역전사효소 주형 및 5' 말단 또는 3' 말단 근처의 프라이머 결합 부위를 포함할 수 있다. "프라임 편집 말단"은 가이드 서열보다 역전사효소 주형 및 프라이머 결합 부위에 더 가까운 pegRNA의 한쪽 5' 또는 3' 말단이다. pegRNA의 다른 쪽 말단은 "원위 말단"이며, 역전사효소 주형이나 프라이머 결합 부위보다 가이드 서열에 더 가깝다. 따라서, 이러한 성분의 순서는 5' 또는 3' 방향이다:
프라임 편집 말단 - (프라이머 결합 부위 및 역전사 주형) - (가이드 서열 및 스캐폴드) - 원위 말단
이때, 괄호는, 그 안에 언급된 2개의 분절이 pegRNA의 스타일(예컨대, Cas9 스타일 또는 Cpf1 스타일)과 프라임 편집 말단의 위치(즉, 5' 말단 또는 3' 말단)에 따라 순서가 전환될 수 있음을 의미한다. pegRNA가, 단일 가이드 RNA가 아니지만 하나 이상의 RNA 분자를 포함하는 경우, 프라임 편집 말단은 이러한 성분을 포함하는 RNA 분자의 프라이머 결합 부위 및 역전사효소 주형에 더 가까운 말단을 지칭하는 반면, 상기 RNA 분자의 반대쪽 말단은 원위 말단이다. 가이드 서열은 프라임 편집 말단 및 원위 말단을 보유하는 RNA 분자와는 별개인 pegRNA의 다른 RNA 분자에 있을 수 있다.
"닉 생성 가이드 RNA" 또는 "닉 생성 gRNA"는 표적 영역내에서 또는 그 근처에서 편집되지 않는 가닥의 닉을 유발하기 위해 프라임 편집에 임의적으로 추가될 수 있는 가이드 RNA(pegRNA 아님)이다. 이러한 닉은 프라임 편집이 일어나는 세포를 자극하여 관련 영역, 즉, 대상체 영역을 복구하는 데 도움이 된다.
"연장 테일(extension tail)"은 pegRNA와 같은 가이드 RNA의 5' 말단 또는 3' 말단에 추가될 수 있는 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 뉴클레오티드의 뉴클레오티드 스트레치이다. "폴리(N) 테일"은 동일한 핵염기를 갖는 1 내지 10개의 뉴클레오티드, 예컨대, A, U, C 또는 T를 함유하는 동종중합체 연장 테일이다. "폴리우리딘 테일" 또는 "폴리U 테일"는 1 내지 10개의 우리딘을 함유하는 폴리(N) 테일이다. 마찬가지로, "폴리A 테일"는 1 내지 10개의 아데노신을 함유한다.
용어 "핵산", "뉴클레오티드" 또는 "폴리뉴클레오티드"는 단일-, 이중- 또는 다중-가닥 형태의 데옥시리보핵산(DNA), 리보핵산(RNA) 및 이의 중합체를 지칭한다. 상기 용어는 단일-, 이중- 또는 다중-가닥 DNA 또는 RNA, 게놈 DNA, cDNA, DNA-RNA 하이브리드, 또는 퓨린 및/또는 피리미딘 염기 또는 다른 천연, 화학적으로 변형된, 생화학적으로 변형된, 비-천연, 합성 또는 유도체화된 뉴클레오티드 염기를 포함하는 중합체를 포함하나, 이로 한정되지는 않는다. 일부 양태에서, 핵산은 DNA, RNA 및 이의 유사체들의 혼합물을 포함할 수 있다. 구체적으로 한정되지 않는 한, 상기 용어는 기준 핵산과 유사한 결합 성질을 갖는 천연 뉴클레오티드의 공지된 유사체를 함유하는 핵산을 포함한다. 달리 나타내지 않는 한, 특정한 핵산 서열은 또한 암묵적으로 이의 보존적으로 변형된 변이체(예를 들어, 동의 코돈 치환(degenerate codon substitution)), 대립유전자, 이종상동체, 단일 뉴클레오티드 다형체(SNP) 및 상보적 서열뿐 아니라, 명확하게 나타낸 서열을 포함한다. 특히, 동의 코돈 치환은, 하나 이상의 선택된(또는 모든) 코돈들의 3번째 위치가 혼합-염기 및/또는 데옥시이노신 잔기로 치환된 서열을 생성시킴으로써 달성될 수 있다[Batzer et al., Nucleic Acid Res. 19:5081 (1991); Ohtsuka et al., J. Biol. Chem. 260:2605-2608 (1985)]; 및 [Rossolini et al., Mol . Cell. Probes 8:91-98 (1994)]. 용어 "핵산"은 유전자, cDNA, 및 유전자에 의해 인코딩된 mRNA와 상호교환적으로 사용된다.
용어 "뉴클레오티드 유사체" 또는 "변형된 뉴클레오티드"는 뉴클레오시드의 질소성 염기(예를 들어, 시토신(C), 티민(T) 또는 우라실(U), 아데닌(A) 또는 구아닌(G))내에 또는 위에, 또는 뉴클레오시드의 당 모이어티(sugar moiety)(예를 들어, 리보스, 데옥시리보스, 변형된 리보스, 변형된 데옥시리보스, 6-원 당 유사체, 또는 개방-쇄 당 유사체)내에 또는 위에, 또는 포스페이트에 하나 이상의 화학 변형(예를 들어, 치환)을 함유하는 뉴클레오티드를 지칭한다.
용어 "유전자" 또는 "폴리펩티드를 인코딩하는 뉴클레오티드 서열"은 폴리펩티드 쇄를 생성하는데 수반된 DNA의 분절을 의미한다. 상기 DNA 분절은 유전자 산물의 전사/번역, 및 전사/번역의 조절에 수반된 코딩 영역(리더 또는 트레일러) 이전 및 이후의 영역들 뿐 아니라, 개개 코딩 분절(엑손) 사이의 개재 서열(인트론)을 포함할 수 있다.
용어 "폴리펩티드", "펩티드" 및 "단백질"은 본원에서 아미노산 잔기들의 중합체를 말하기 위해 상호교환적으로 사용된다. 상기 용어는 하나 이상의 아미노산 잔기가 상응하는 천연 아미노산의 인공적 화학 모방체인 아미노산 중합체 뿐 아니라, 천연 아미노산 중합체 및 비-천연 아미노산 중합체에도 적용된다. 본원에서 사용된 바와 같이, 상기 용어는 아미노산 잔기들이 공유 펩티드 결합에 의해 연결된, 전장 단백질을 포함하여 임의의 길이를 갖는 아미노산 쇄를 포함한다.
"핵산", "폴리뉴클레오티드" 또는 "올리고뉴클레오티드"라는 용어는 DNA 분자, RNA 분자 또는 이들의 유사체를 의미한다. 본원에 사용된 용어 "핵산", "폴리뉴클레오티드" 및 "올리고뉴클레오티드"는 cDNA, 게놈 DNA 또는 합성 DNA와 같은 DNA 분자 및 가이드 RNA, 메신저 RNA 또는 합성 RNA와 같은 RNA 분자를 포함하지만, 이에 한정되지는 않는다. 또한, 본원에 사용된 용어에는 단일 가닥 및 이중 가닥 형태가 포함된다.
"하이브리드화" 또는 "하이브리드화함"이라는 용어는 완전히 또는 부분적으로 상보적인 폴리뉴클레오티드 가닥이 적절한 하이브리드화 조건하에 함께 모여 이중 가닥 구조 또는 영역을 형성하는 과정을 지칭하고, 이때 2개의 구성 가닥은 수소 결합에 의해 연결된다. 본원에 사용된 용어 "부분 하이브리드화"는 이중 가닥 구조 또는 영역이 하나 이상의 돌출(bulge) 또는 불일치(mismatch)를 함유하는 경우를 포함한다. 일반적으로 아데닌(A)과 티민(T), 아데닌(A)과 우라실(U) 또는 시토신(C)과 구아닌(G) 사이에 수소 결합이 형성되지만, 다른 비표준적인 염기쌍도 형성될 수 있다(예컨대, 문헌[Adams et al., "The Biochemistry of the Nucleic Acids," 11th ed., 1992] 참고). 변형된 뉴클레오티드는 비표준적인 방식으로 하이브리드화를 허용하거나 촉진하는 수소 결합을 형성할 수 있는 것으로 고려된다.
용어 "상보성"은 전통적인 왓슨-크릭 또는 다른 비-전통적 유형에 의해 또 다른 핵산 서열과 수소 결합을 형성하는 핵산의 능력을 지칭한다. % 상보성은 제2 핵산 서열과 수소 결합(예를 들어, 왓슨-크릭 염기쌍 형성)을 형성할 수 있는 핵산 분자내 잔기들의 백분율을 나타낸다(예를 들어, 10개 중에서 5, 6, 7, 8, 9 또는 10개는 50%, 60%, 70%, 80%, 90% 및 100% 상보적임). "완전히 상보적"은 핵산 서열의 모든 인접 잔기들이 제2 핵산 서열내 동일한 수의 인접 잔기들과 수소 결합할 것을 의미한다. 본원에서 사용된 바와 같이 "실질적으로 상보적"은 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45 또는 50개 이상의 뉴클레오티드들의 영역에 대해 적어도 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%. 97%, 98%, 99%, 또는 100%인 상보성의 정도를 지칭하거나, 엄격한 조건하에서 하이브리드화되는 2개의 핵산을 지칭한다.
본원에 사용된 서열의 "부분", "분절", "요소" 또는 "단편"이라는 용어는 전체 서열보다 작은 서열의 임의의 부분(예를 들어, 뉴클레오티드 하위 서열 또는 아미노산 하위 서열)을 의미한다. 폴리뉴클레오티드의 부분, 분절, 요소 또는 단편은 1개 초과, 예를 들어, 적어도 5, 10, 15, 20, 25, 30, 40, 50, 75, 100, 150, 200, 300, 또는 500개 또는 그 이상의 뉴클레오티드의 길이인 임의의 길이의 것일 수 있다.
본원에 사용된 용어 "올리고뉴클레오티드"는 뉴클레오티드의 다량체를 의미한다. 예를 들어, 올리고뉴클레오티드는 길이로 약 2 내지 약 200개의 뉴클레오티드, 약 50개 이하의 뉴클레오티드, 약 100개 이하의 뉴클레오티드, 약 500개 이하의 뉴클레오티드, 또는 2 내지 500의 임의의 정수 값의 뉴클레오티드 수를 가질 수 있다. 일부 양태에서, 올리고뉴클레오티드는 30 내지 300개의 뉴클레오티드 길이 또는 30 내지 400개의 뉴클레오티드 길이일 수 있다. 올리고뉴클레오티드는 리보뉴클레오티드 단량체(즉, 올리고리보뉴클레오티드일 수 있음) 및/또는 데옥시리보뉴클레오티드 단량체를 함유할 수 있다. 올리고뉴클레오티드는 10 내지 20, 21 내지 30, 31 내지 40, 41 내지 50, 51 내지 60, 61 내지 70, 71 내지 80, 80 내지 100, 100 내지 150, 150 내지 200, 200 내지 250, 250 내지 300, 300 내지 350, 또는 350 내지 400개, 또는 상기 범위들 사이의 임의의 정수 값의 뉴클레오티드 길이일 수 있다.
"재조합 발현 벡터"는 숙주 세포에서 특정 폴리뉴클레오티드 서열의 전사를 허용하는 일련의 특정 핵산 요소들을 갖는, 재조합적으로 또는 합성적으로 생성된 핵산 구조물이다. 발현 벡터는 플라스미드, 바이러스 게놈 또는 핵산 단편의 일부일 수 있다. 전형적으로, 발현 벡터는 프로모터에 작동가능하게 연결된, 전사될 폴리뉴클레오티드를 포함한다. 이와 관련하여 "작동가능하게 연결된"은 인코딩 서열의 전사를 유도하는 프로모터와 같은 요소들의 적절한 생물학적 기능을 허용하는 상대적 위치에 놓인 2개 이상의 유전자 요소, 예를 들어, 폴리뉴클레오티드 인코딩 서열 및 프로모터를 의미한다. 용어 "프로모터"는 본원에서 핵산의 전사를 유도하는 핵산 조절 서열의 배열을 말하기 위해 사용된다. 본원에서 사용된 바와 같이, 프로모터는 중합효소 유형 II 프로모터의 경우에서 TATA 요소와 같은, 전사 개시 부위 부근의 필수적인 핵산 서열을 포함한다. 프로모터는 또한 임의적으로, 전사 개시 부위로부터 수천개 염기쌍만큼 멀리 위치할 수 있는 원위 증폭인자(enhancer) 또는 억제인자(repressor) 요소를 포함한다. 발현 벡터에 존재할 수 있는 다른 요소들로는 전사를 증대시키고(예를 들어, 증폭인자) 전사를 종료시키는(예를 들어, 종결인자(terminator)) 요소들 뿐 아니라, 발현 벡터로부터 생성된 재조합 단백질에 특정한 결합 친화도 또는 항원성을 제공하는 요소들이 포함된다.
"재조합"은 유전적으로 변형된 폴리뉴클레오티드, 폴리펩티드, 세포, 조직 또는 유기체를 지칭한다. 예를 들어, 재조합 폴리뉴클레오티드(또는 재조합 폴리뉴클레오티드의 복사체 또는 보체)는 공지된 방법을 이용하여 제조된 것이다. 제2 폴리뉴클레오티드(예를 들어, 인코딩 서열)에 작동가능하게 연결된 프로모터를 포함하는 재조합 발현 카세트는 인간 조작의 결과로서(예를 들어, 문헌[Sambrook et al., Molecular Cloning - A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York, (1989)] 또는 [Current Protocols in Molecular Biology Volumes 1-3, John Wiley & Sons, Inc. (1994-1998)]에 기재된 방법에 의해) 제2 폴리뉴클레오티드에 이종인 프로모터를 포함할 수 있다. 재조합 발현 카세트(또는 발현 벡터)는 전형적으로 자연에서 발견되지 않는 조합으로 폴리뉴클레오티드를 포함한다. 예를 들어, 인간 조작된 제한효소 부위 또는 플라스미드 벡터 서열은 프로모터 측면에 위치하거나 프로모터를 다른 서열들로부터 분리시킬 수 있다. 재조합 단백질은 재조합 폴리뉴클레오티드로부터 발현되는 단백질이며, 재조합 세포, 조직 및 유기체는 재조합 서열(폴리뉴클레오티드 및/또는 폴리펩티드)을 포함하는 것들이다.
핵산 표적의 "편집"은 표적의 뉴클레오티드 서열에 변화를 일으키는 것을 의미한다. 변화는 각각 단일 뉴클레오티드 또는 다중 뉴클레오티드의 삽입, 결실 또는 치환일 수 있다. 다수의 뉴클레오티드가 삽입, 삭제 또는 치환되는 경우, 뉴클레오티드는 연속적일 수도 있고 연속적이지 않을 수도 있다. 변경은 임의의 상기 사항의 조합일 수 있다. "편집"은 "염기 편집" 및 "프라임 편집" 기술을 포함한다.
"편집 효율"은 하나 이상의 세포에서 달성된 Cas-유도된 편집의 척도이다. 표적 및 잠재적인 표적이탈 부위에서의 게놈 편집의 결과는 당업계에 공지된 표준 방법, 예를 들어, 게놈 DNA 시퀀싱, RNA 시퀀싱, 또는 관심 표적 부위 및 임의의 표적이탈 부위의 PCR 앰플리콘의 심층 시퀀싱을 사용하여 측정될 수 있다. 또한, 게놈 DNA의 indel 돌연변이는 SURVEYOR® 돌연변이 검출 키트(Integrated DNA Technologies, Coralville, Iowa) 또는 Guide-it™ indel Identification Kit(Clontech, Mountain View, CA)를 사용하여 확인할 수 있다. 또한, 단백질의 존재 여부를 측정하는 기법(예컨대, 겔 또는 모세관 전기영동, 웨스턴 블롯팅, 유동 세포측정 또는 질량 분석 기법을 사용하여 단백질 코딩 유전자를 도입하거나 넉아웃시키는 것을 목적으로 하는 편집의 효율성을 정량화할 수 있다. 이러한 기법은 벌크(bulk) 제조 또는 단일 세포 수준의 세포 집단에 적용될 수 있다. 일부 양태에서, 효율은 벌크 또는 단일 세포 수준에서 측정된 세포 집단의 정확한 편집물의 수를 사용하여 측정된다. 일부 양태에서, 효율은 정확하게 편집된 표적의 백분율, 또는 정확한 유전자형 또는 표현형을 나타내는 세포의 개수 또는 백분율로서 측정된다.
"유전자 발현을 조절함"은 특정 유전자 산물의 발현을 변경(감소 또는 활성화)하는 것을 의미한다. CRISPR 활성화 또는 "CRISPRa"는 유전자의 활성화를 의미하는 반면, CRISPR 간섭 또는 "CRISPRi"는 유전자 발현의 간섭을 의미한다. 두 시스템 모두 융합되거나 전사 효과기(활성화제 또는 억제자)와의 조합으로 상호작용하는 뉴클레아제 결핍 Cas 단백질(dCas9)을 사용한다. CRISPRa는 앞서 기재한 바와 같이 SAM 시스템(dCas9-VP64)에서 수행될 수 있다. 유전자 특이적 CRISPRa와 함께 사용될 때, MS2 앱타머를 포함하는 gRNA는 MS2-p65-HSF1 융합체를 표적 유전자의 전사 시작 부위(TSS)에 모집(recruiting)하여 활성화를 시작한다. CRISPRa 및 CRISPRi는 둘 다 다중 방식(예컨대, 다중 유전자의 표적화)으로 수행되고 조합될 수 있다. CRISPRoff는 유전자 발현을 유전적으로 변경할 수 있는 DNA 메틸화와 억제성 히스톤 변형을 확립하는 데드 Cas9 융합 단백질로 구성된 프로그래밍가능한 후생적 기억 기록기(programmable epigenetic memory writer)이다(문헌[Nunez et al., Genome-wide programmable transcriptional memory by CRISPR-based epigenome editing, Cell. (2021) 184(9):2503-2519]).
"유전자 발현 조절 효율"은, 예를 들어, qRT-PCR 또는 RNA 시퀀싱과 같이 다양한 RNA의 상대적 또는 절대적 수준을 측정하는 기법, 또는 젤 또는 모세관 전기영동, 웨스턴 블롯팅, 유세포 분석 또는 질량 분석 기법과 같이 단백질의 상대적 또는 절대 수준을 측정하는 다양한 방법으로 측정될 수 있다. 이러한 기법은 대량 제조 또는 단일 세포 수준의 세포 집단에 적용될 수 있다. 일부 양태에서, 효율은 벌크 또는 단일 세포 수준에서 측정된 세포 집단의 표적 유전자로부터 발현된 단백질 또는 RNA의 양을 사용하여 측정된다.
용어 "단일 뉴클레오티드 다형성" 또는 "SNP"는 대립유전자 내부를 포함하여, 폴리뉴클레오티드에 의한 단일 뉴클레오티드의 변화를 지칭한다. 이는 1개의 뉴클레오티드의 또 다른 뉴클레오티드에 의한 치환 뿐 아니라, 단일 뉴클레오티드의 결실 또는 삽입을 포함할 수 있다. 가장 전형적으로, SNP는 이중대립유전자 마커이지만, 3중- 및 4중-대립유전자 마커도 또한 존재할 수 있다. 비제한적인 예로써, SNP A\C를 포함하는 핵산 분자는 다형성 위치에 C 또는 A를 포함할 수 있다.
본원에 사용된 "뉴클레아제"는 핵산의 뉴클레오티드 사이의 포스포다이에스터 결합을 절단할 수 있는 효소를 의미한다. 뉴클레아제는 DNA 및/또는 RNA 분자의 단일 및/또는 이중 가닥 절단 둘 다에 다양하게 영향을 미칠 수 있다. 살아있는 유기체에서, 이는 DNA 복구의 여러 양상에 필수적인 장치이다. 본원에 사용된 뉴클레아제는 엑소뉴클레아제 및 엔도뉴클레아제 둘 다를 의미하며, 리보뉴클레아제 및 데옥시리보뉴클레아제를 포함한다.
용어 "1차 세포"는 다세포 유기체로부터 직접 단리된 세포를 의미한다. 다세포 유기체로부터 직접 단리된 세포를 의미한다. 1차 세포는 일반적으로 집단 배가(population doubling)를 거의 겪지 않으므로 연속(종양 또는 인위적으로 불멸화) 세포주와 비교하여 자신이 파생된 조직의 주요 기능 성분을 더 잘 대표한다. 일부 경우에서, 1차 세포는 단리된 후, 즉시 사용되는 세포이다. 다른 경우에는 1차 세포가 무기한으로 분열할 수 없으므로 시험관내에서 장기간 배양될 수 없다.
"뉴클레아제-함유 유체"라는 용어는 뉴클레아제가 존재하는 임의의 매질을 지칭하기 위해 본원에서 사용된다. 예를 들어, 배지는 세포 배양 배지 또는 세포 배양 배지에서 유래한 배지일 수 있고, 이는 세포를 세척하거나 세척하지 않되, 원래 배지에 함유된 모든 성분을 제거함 없이 세포가 세포 배양 배지로부터 새로운 배지로 옮겨져, 뉴클레아제를 여전히 함유할 수 있음을 의미한다. 예를 들어, 세포를 세척하지 않거나 세포 배양 배지의 실질적으로 모든 성분을 제거하지 않고 세포를 세포 배양 배지로부터 반응 배지로 옮길 수 있으므로, 세포를 gRNA 및 Cas 단백질(RNP) 또는 gRNA 및 편집 Cas 효과기를 인코딩하는 mRNA 또는 DNA 벡터와 접촉시킬 때 뉴클레아제가 존재할 수 있다. 유체는 혈청, 인간 혈청, 동물 혈청, 소 혈청(BSA), 태아 혈청, 뇌척수액(CSF) 또 다른 체액일 수 있다.
용어 "배양하다", "배양하는", "성장하다", "성장하는", "유지하다", "유지하는", "증식시키다(expand)", "증식시키는(expanding)" 등은, 세포 배양균 자체 또는 배양 과정에 대해 언급할 때, 세포(예를 들어, 1차 세포)가 통제된 조건하에서, 예를 들어, 생존에 적합한 조건하에서 이의 정상적인 환경 외에서 유지되는 것을 의미하는 것으로 상호교환적으로 사용될 수 있다. 배양된 세포는 생존하게 되고, 배양은 세포 성장, 정체, 분화 또는 분열을 야기할 수 있다. 상기 용어는, 일부 세포가 자연적으로 사멸하거나 노쇠할 수 있기 때문에, 배양물중 모든 세포가 생존하거나 성장하거나 분열하는 것을 의미하지는 않는다. 세포는 전형적으로 배지중에서 배양되며, 상기 배지는 배양 과정동안 교체될 수 있다.
용어 "대상", "환자" 및 "개체"는 본원에서 인간 또는 동물을 포함하는 것으로 상호교환적으로 사용된다. 예를 들어, 동물 대상은 포유동물, 영장류(예를 들어, 원숭이), 가축 동물(예를 들어, 말, 소, 양, 돼지 또는 염소), 반려 동물(예를 들어, 개, 고양이), 실험실 시험 동물(예를 들어, 마우스, 래트, 기니 피그, 조류), 수의과적으로 중요한 동물, 또는 경제적으로 중요한 동물일 수 있다.
본원에서 사용된 용어 "투여하는"은 대상에게 경구 투여, 국소 접촉, 좌약으로서 투여, 정맥내, 복강내, 근육내, 병변내, 척추강내, 비강내 또는 피하 투여를 포함한다. 투여는 비경구 및 경점막을 포함한 임의의 경로(예를 들어, 구강, 설하, 구개, 잇몸, 코, 질, 직장 또는 경피)에 의한다. 비경구 투여는, 예를 들어, 정맥내, 근육내, 소동맥내, 피내, 피하, 복강내, 심실내 및 두개내를 포함한다. 다른 전달 방식으로는 리포좀 제형, 정맥내 주입, 경피용 패치 등의 사용이 포함되나, 이로 한정되지는 않는다.
용어 "치료하는"은 치료 이점 및/또는 예방 이점을 포함하나 이로 한정되지는 않는 유리하거나 바람직한 결과를 얻기 위한 접근방법을 지칭한다. 치료 이점은 치료중인 하나 이상의 질환, 병태 또는 증상에서 임의의 치료적으로 적절한 개선 또는 상기 질환, 병태 또는 증상에 대한 효과를 의미한다. 예방 이점을 위해서, 조성물은 특정 질환, 병태 또는 증상이 발생할 위험이 있는 대상에게, 또는 질환, 병태 또는 증상이 아직 뚜렷해지지 않았을지라도 질환의 하나 이상의 생리학적 증상을 보고하는 대상에게 투여될 수 있다.
용어 "효과량" 또는 "충분량"은 유리하거나 바람직한 결과를 수행하기에 충분한 약제(예를 들어, Cas 단백질, 변형된 gRNA/pegRNA 등)의 양을 지칭한다. 치료 효과량은 다음의 하나 이상에 따라 달라질 수 있다: 치료되는 대상 및 질환 상태, 대상의 체중 및 연령, 질환 상태의 중증도, 투여 방식 등(이것들은 당업계에 통상의 기술을 가진 자에 의해 용이하게 결정될 수 있음). 특정량은 다음 중 하나 이상에 따라 달라질 수 있다: 선택된 특정 약제, 표적 세포 유형, 대상내 표적 세포의 위치, 후속 투약 요법, 다른 약제와 함께 투여되는지 여부, 투여 시기, 및 운반되는 물리적 전달 시스템.
본원에 개시된 바와 같이, 다수의 값 범위가 제공된다. 해당 범위의 상한과 하한 사이의 각각의 중간 값도 구체적으로 고려되는 것으로 이해된다. 명시된 범위에 포함된 각각의 더 작은 범위 또는 중간 값도 구체적으로 고려된다. "약"이라는 용어는 일반적으로 표시된 수치의 ±10%를 의미한다. 예를 들어, "약 10%"는 9% 내지 11%의 범위를 나타낼 수 있고, "약 20"은 18 내지 22를 의미할 수 있다. "약"의 다른 의미는 반올림과 같이 문맥에서 명백할 수 있으므로, 예를 들어, "약 1"은 0.5 내지 1.4를 의미할 수도 있다.
몇몇 화학적으로 변형된 뉴클레오티드가 본원에 기재되어 있다. 각각의 MS, MP 및 MSP는 상응하는 변형, 또는 상응하는 변형을 포함하는 뉴클레오티드를 의미할 수 있음에 유의한다. 하기 약어가 관련 상황에서 사용될 것이다:
"PACE": 포스포노아세테이트
"MS": 2'-O-메틸-3'-포스포로티오에이트
"MP": 2'-O-메틸-3'-포스포노아세테이트
"MSP": 2'-O-메틸-3'-티오포스포노아세테이트
"2'-MOE": 2'-O-메톡시에틸
명세서 전반에 걸쳐 용어의 다른 정의가 나타날 수 있다.
본 발명은 특정 위치에서 가이드 RNA의 특정 변형이 가이드 RNA를 뉴클레아제에 의한 분해에 대한 추가 저항성을 갖게 한다는 것을 입증한다. 이는 생체내에서 뉴클레아제 활성이 높기 때문에 CRISPR 매개 유전자 편집 또는 유전자 발현 조절을 위한 가이드 RNA의 생체내 전달에 특히 중요하다. 예를 들어, 혈청 및 뇌척수액(CSF)과 같은 체액은 상대적으로 풍부한 뉴클레아제를 함유한다. 이러한 어려운 환경에서는, 가이드 RNA가 분해되는 경향이 있어 가이드 RNA의 농도가 더 높은 성능을 달성할 수 있는 수준(즉, 아포화 상태)에 도달하지 못한다. 따라서, 가이드 RNA 농도의 증가와 이에 따른 유전자 편집 및 유전자 발현 조절의 가능성의 증가는 이 산업에서 중요할 것이다. 본 발명은 특정 가이드 RNA, 예를 들어, 5' 말단에 포스포로티오에이트 변형 및 3' 말단에 포스포노카복실레이트 또는 티오포스포노카복실레이트 변형을 갖는 가이드 RNA가 혈청 존재하에서도 변형되지 않았거나 다른 변형을 포함하는 대응물(예컨대, 포스포노카복실레이트 또는 티오포스포노카복실레이트 대신 포스포로티오에이트를 사용하지만 그 외에는 동일함)보다 더 높은 CRISPR 활성을 유도한다는 놀라운 발견을 제공한다.
마찬가지로, 체외 치료를 위해 CRISPR 매개 편집/조절이 적용되는 세포는 통상적으로 혈청을 함유하는 세포 배양 배지에 있거나, 피험자로부터 새로 수확된 경우, 환경에서 체액을 포함한다. 따라서, 혈청이나 체액에 존재하는 뉴클레아제는 세포에 전달되는 가이드 RNA를 저하시키고 CRISPR 매개 편집/조절의 효율성을 감소시킨다. 혈청이나 체액의 양을 낮추기 위해 CRISPR 처리 전에 세포를 세척할 수 있지만, 과도한 세척은 세포 건강에 해로울 수 있다. 더욱이, CRISPR 매개 편집/조절은 가이드 RNA 및 기타 CRISPR 효과기가 세포에 추가된 직후에 수행되지 않으며, 세포는 일정 기간 동안 배양되어야 한다. 혈청 없이 배양하는 것은 세포에 해로운 경우가 많으며, 세포가 나중에 환자에게 전달되기 때문에 체외 치료의 위험 요소이다. 뉴클레아제 분해에 더욱 저항성이 있는 본 발명의 변형된 가이드 RNA는 이러한 문제를 해결하기 위한 상당한 개선이다.
본 발명의 변형된 가이드 RNA는, "네이키드(naked)" 방식으로 세포내로 도입되고 뉴클레아제에 직접 노출될 때, 예를 들어, 공동-형질감염되거나 다르게는 Cas 단백질을 인코딩하는 DNA 또는 mRNA와 함께 전달될 때 유용하다. 그러나, 가이드 RNA가 네이키드가 아닌 경우에도, 예를 들어, Cas 단백질이 있는 리보핵단백질(RNP)에 존재하거나 Cas 단백질이 있거나 없는 나노입자에 존재하는 경우에도 본원에 기재된 변형이 유리하다.
본 개시내용의 한 양상에서, 세포내 핵산에서 표적 영역을 편집하거나 표적 영역내 표적 유전자의 발현을 조절하기 위한 방법이 제공된다. 방법은 a) CRISPR 관련("Cas") 단백질, 및 b) 5' 말단 및 3' 말단을 포함하는 변형된 가이드 RNA, 표적 영역에서 표적 서열에 하이브리드화할 수 있는 가이드 서열, 및 Cas 단백질과 상호작용하는 스캐폴드 영역을 세포에 제공하는 단계를 포함한다. 변형된 가이드 RNA는 또한 5' 말단의 5개의 뉴클레오티드내에 하나 이상의 포스포로티오에이트 변형, 및 3' 말단의 5개의 뉴클레오티드내에 2개 이상의 연속적인 포스포노카복실레이트 또는 티오포스포노카복실레이트 변형을 포함한다. 세포는 뉴클레아제-함유 체액의 존재하에 생체외에 존재하거나, 생체내에 존재한다. 본 발명의 방법에서 Cas 단백질 및 변형된 가이드 RNA를 세포에 제공하는 것은 표적 영역의 편집 또는 표적 유전자의 발현 조절을 야기한다.
일부 양태에서, 변형된 가이드 RNA는 3' 말단의 5개의 뉴클레오티드내에 2, 3, 4 또는 5개의 포스포노카복실레이트 또는 티오포스포노카복실레이트 변형을 포함한다. gRNA의 3' 말단의 5개의 뉴클레오티드내의 2개 이상의 연속적인 포스포노카복실레이트 또는 티오포스포노카복실레이트 변형은 적어도 2, 3, 4 또는 5개의 MP 뉴클레오티드를 포함할 수 있으며, 이는 2개의 연속적인 변형된 뉴클레오티드 및 1개 또는 2개의 불연속적인 변형 뉴클레오티드, 3개의 연속적인 변형 뉴클레오티드 및 1개의 불연속적인 변형 뉴클레오티드, 2쌍의 2개의 연속적인 변형 뉴클레오티드, 또는 5개의 연속적인 변형 뉴클레오티드를 포함하여 임의의 순서로 배열될 수 있다. 일부 양태에서, 변형된 가이드 RNA는 3' 말단의 5개의 뉴클레오티드내에 적어도 2개, 적어도 3개, 적어도 4개 또는 5개의 연속적인 MP 뉴클레오티드를 포함한다. 일부 양태에서, 변형된 가이드 RNA는 5' 말단의 5개의 뉴클레오티드내에 1, 2, 3, 4 또는 5개의 포스포로티오에이트 변형을 포함한다. gRNA의 5' 말단의 5개의 뉴클레오티드내의 하나 이상의 포스포로티오에이트 변형은 적어도 1개, 적어도 2개, 적어도 3개, 적어도 4개 또는 5개의 MS 뉴클레오티드를 포함할 수 있으며, 이는 연속적인 또는 불연속적인 것을 포함하여 임의의 순서로 배열될 수 있다. 본 발명의 방법의 일부 양태에서, 변형된 가이드 RNA는 5' 말단의 5개의 뉴클레오티드내에 적어도 2개, 적어도 3개, 적어도 4개 또는 5개의 연속적인 MS 뉴클레오티드를 포함한다. gRNA의 3' 또는 5' 말단의 5개의 뉴클레오티드내의 하나 이상의 변형된 뉴클레오티드는 독립적으로 선택될 수 있다(예를 들어, 변형된 뉴클레오티드의 수 및/또는 순서는 gRNA의 5' 및 3' 말단에서 상이할 수 있음).
일부 양태에서, 변형된 가이드 RNA는 5' 말단 및 3' 말단내의 5개의 뉴클레오티드 외부에 위치한 변형된 뉴클레오티드를 추가로 포함한다. 변형된 가이드 RNA는 (예를 들어, US 10,767,175에 기재된 바와 같이) 표적 특이성을 향상시키는 가이드 서열에 하나 이상의 변형을 포함할 수 있다. 예를 들어, 변형된 가이드 RNA는 변형된 가이드 서열의 위치 5 또는 위치 11에 변형된 뉴클레오티드를 포함할 수 있다.
일부 양태에서, 변형된 가이드 RNA는 단일 가이드 RNA이다. 일부 양태에서, 가이드 RNA는 정확히 또는 적어도 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199 또는 200개의 뉴클레오티드, 및/또는 180, 179, 178, 177, 176, 175, 174, 173, 172, 171, 170, 169, 168, 167, 166, 165, 164, 163, 162, 161, 159, 158, 157, 156, 155, 154, 153, 152, 151, 150, 149, 148, 147, 146, 145, 144, 143, 142, 141, 140, 139, 138, 137, 136, 135, 134, 133, 132, 131, 130, 129, 128, 127, 126, 125, 124, 123, 122, 121 또는 120개 이하의 뉴클레오티드를 포함하는 단일 가이드 RNA이다. 전술한 최소값과 최대값 중 임의의 것이 조합되어 최소값이 최대값보다 작은 범위를 형성할 수 있는 것이 명백히 고려된다.
일부 양태에서, Cas 단백질은 Cas 단백질 또는 이의 변이체 또는 융합 단백질을 인코딩하는 mRNA로서 세포에 제공된다. 일부 양태에서, Cas 단백질은 Cas 단백질 또는 이의 변이체 또는 융합 단백질을 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 발현 벡터로서 세포에 제공된다. 세포는 Cas 단백질을 인코딩하는 mRNA 또는 발현 벡터로 별도로 또는 변형된 가이드 RNA와 함께 형질감염될 수 있다. 일부 양태에서, 세포는 변형된 가이드 RNA 및 Cas 단백질을 인코딩하는 mRNA 또는 발현 벡터로 공동-형질감염된다. 공동-형질감염될 때, 변형된 가이드 RNA 및 Cas 단백질을 인코딩하는 mRNA 또는 발현 벡터는 별도의 전달 시스템 또는 단일 전달 시스템으로 세포에 제공될 수 있다. 다르게는, 세포는 Cas 단백질을 인코딩하는 mRNA 또는 발현 벡터로 형질감염되기 전 또는 후에 변형된 가이드 RNA로 형질감염될 수 있다. 세포는 전기천공, 미세주사, 리포펙션(lipofection) 또는 나노입자 또는 기타 전달 시스템에 대한 노출에 의해 형질감염될 수 있다(하기 더 자세히 설명됨). 일부 양태에서, Cas 단백질 및/또는 변형된 가이드 RNA를 인코딩하는 mRNA 또는 발현 벡터는 나노입자, 예를 들어, 지질 나노입자로 제공된다.
일부 양태에서, Cas 단백질과 변형된 가이드 RNA는 리보핵단백질(RNP) 복합체로서 제공된다. 변형된 가이드 RNA는 Cas 단백질 또는 이의 변이체 또는 융합 단백질과 복합체화되어 세포내 도입을 위한 RNP를 형성할 수 있다. RNP는 전기천공, 미세주사, 바이러스 유사 입자, 리포펙션 또는 나노입자 또는 기타 전달 시스템에 대한 노출과 같은 다른 전달 시스템(하기 더 자세히 설명됨)에서 세포에 제공될 수 있다. 일부 양태에서, Cas 단백질 및/또는 변형된 가이드 RNA는 나노입자, 예를 들어, 지질 나노입자로 제공된다.
일부 양태에서, 편집되거나 조절될 세포는 생체외에 존재한다. 다른 양태에서, 편집되거나 조절되는 세포는 생체내에 존재한다. 본 발명의 방법은 혈청을 포함하는 배지에서 앞서 배양된 생체외 세포(상기 세포는 상기 혈청 또는 하나 이상의 상기 혈청 성분으로부터 불완전하게 분리됨)의 핵산에서 표적 영역을 편집하거나 표적 영역에서 표적 유전자의 발현을 조절하는 데 사용될 수 있다. 예를 들어, 상기 방법은 세포를 세척하지 않거나 세포를 광범위하게 세척하지 않고 세포 배양 배지로부터 반응 배지로 세포를 옮기는 것을 포함할 수 있다. 일부 양태에서, 변형된 가이드 RNA 및 Cas 단백질은 혈청 또는 하나 이상의 혈청 성분, 예컨대 혈액, 혈장 또는 혈청 중 생체내 세포의 존재하에 세포에 제공된다.
일부 양태에서, 세포는 표적 영역을 각각 포함하는 세포 집단이다. 예를 들어, 세포 집단은 세포 배양물이거나 세포 배양물로부터 유래될 수 있다. 세포 또는 세포 집단은 변형된 가이드 RNA 및 Cas 단백질이 세포에 제공되기 전에 세포 배양 배지 또는 뉴클레아제-함유 유체내에 있을 수 있고, 일부 양태에서, 편집 성분을 도입하기 전에, 세포는 세척되지만 세포 배양 배지, 또는 뉴클레아제가 여전히 존재하도록 하는 세포 배양 배지의 하나 이상의 성분으로부터 완전히 제거되지는 않는다. 예를 들어, 세포를 세척하지 않거나 세포 배양 배지의 실질적으로 모든 성분을 제거하지 않고 세포를 세포 배양 배지에서 반응 배지로 옮길 수 있다. 다르게는, 세포 또는 세포 집단은 변형된 가이드 RNA 및 Cas 단백질을 제공하는 시점에 세포 배양 배지에 존재할 수 있다. 이러한 양태에서, 세포 배양 배지는 세포내 표적 서열을 편집하거나 조절하기 위한 반응 배지로서 기능할 수 있다. 일부 양태에서, 세포는 혈청 또는 하나 이상의 다른 배지 성분, 예컨대 인간 또는 동물 기원의 하나 이상의 천연 단백질을 포함하는 세포 배양 배지내에 있거나 이로부터 전달된다. 일부 양태에서, 세포는 소 혈청 알부민, 말 혈청, 또는 소 태아 혈청을 포함하는 세포 배양 배지내에 있거나 이로부터 전달된다.
일부 양태에서, 변형된 가이드 RNA를 세포에 제공함으로써 발생하는 편집 또는 발현 조절은, 변형된 가이드 RNA와 변형되지 않은 것 외에는 동일한 변형되지 않은 가이드 RNA에 의해 야기되는 편집 또는 조절보다 적어도 10%, 적어도 20%, 적어도 25%, 또는 적어도 50% 더 효율적이다. 예를 들어, 본 발명의 방법은 변형된 가이드 RNA와 변형되지 않은 것 외에는 동일한 변형되지 않은 가이드 RNA를 사용하는 상응하는 방법에서 수득한 수율보다 적어도 10%, 적어도 20%, 적어도 25%, 또는 적어도 50% 더 높은 평균 indel 수율 또는 평균 편집물 수율을 갖는다. 일부 양태에서, 변형된 가이드 RNA를 세포에 제공함으로써 발생하는 편집 또는 조절은 변형된 가이드 RNA와 변형되지 않은 것 외에는 동일한 변형되지 않은 가이드 RNA에 의해 발생하는 편집 또는 조절보다 적어도 2배, 적어도 3배, 또는 적어도 5배 더 효율적이다. 예를 들어, 본 발명의 방법은 변형된 가이드 RNA와 변형되지 않은 것 외에는 동일한 변형되지 않은 가이드 RNA를 사용하는 상응하는 방법보다 적어도 2배, 적어도 3배, 또는 적어도 5배 더 높은 평균 indel 수율 또는 평균 편집 수율을 갖는다.
본 발명에서, 다수의 표적 영역에 대해 다수의 변형된 gRNA를 사용함에 의해, 다중화(multiplexing)가 고려된다. 일부 양태에서, 본원의 2개의 변형된 가이드 RNA는 동일한 세포에서, 바람직하게는 동시에 2개의 상이한 표적 영역을 편집(또는 조절)하는 데 사용된다. 일부 양태에서, 다중화 방식에서, 변형된 가이드 RNA는 제1 표적 영역을 편집하는 데 사용되고, 제2 변형된 가이드 RNA는 표적 영역(제1 표적 영역과 동일하거나 상이할 수 있음)의 발현을 조절하는 데 사용된다.
최근 몇 년 동안 CRISPR 기반 기법은 (예컨대, 유전적 결함 교정을 위한) 잠재적으로 혁신적인 치료로서 부상하였다. 그러나, CRISPR 시스템의 사용은 실질적인 문제로 인해 제한되어 왔다. 특히, CRISPR-Cas 성분의 생체내 전달을 위한 가이드 RNA(gRNA)를 안정화하는 방법이 필요하다. 이전 연구에서는 화학적으로 변형된 뉴클레오티드를 갖는 gRNA의 사용을 조사하였다. 본원에 설명된 바와 같이, 본 개시내용은 gRNA의 3' 말단에 특정 변형된 뉴클레오티드의 혼입이 Cas 단백질을 인코딩하는 gRNA 및 mRNA 또는 DNA가 어려운 조건에서 세포에 도입(예컨대, 공동-형질감염)되는 경우에서 탁월한 향상으로서, 표적 핵산의 Cas-매개된 편집 또는 조절의 수율을 향상시킬 수 있다는 놀라운 발견에 부분적으로 기초한다.
일부 양상에서, 본원에 개시된 가이드 RNA는 가이드 RNA가 하기와 같은 하나 이상의 어려운 조건하에 세포내로 도입되는 적용에서 특히 유리할 수 있다:
i. 세포가 혈청(예를 들어, 소 태아 혈청)을 포함하는 배지에 있음;
ii. 세포가 혈청을 포함하는 배지에서 미리 배양되었고, 가이드 RNA가 도입될 때 혈청이 여전히 존재함;
iii. 세포가 하나 이상의 뉴클레아제를 포함하는 배지에서 미리 배양되었고, 가이드 RNA가 도입될 때 뉴클레아제가 여전히 존재함;
iv. 세포가 상대적으로 높은 수준의 뉴클레아제 활성, 예컨대, 하나 이상의 뉴클레아제의 상대적으로 높은 발현을 가짐;
v. 세포가 상대적으로 낮은 수준의 뉴클레아제 억제제 활성, 예컨대 뉴클레아제 억제제의 상대적으로 낮은 발현을 가짐;
vi. 변형된 가이드 RNA가 세포내로 전달되기 전에 Cas 단백질과 복합체를 형성하지 않음;
vii. 세포가 생체내에 존재함; 및
viii. 적용가능한 경우 이들의 조합.
포화의 개념은 당업계에 잘 공지되어 있다. 물질이 "포화 수준"에 있을 때, 물질의 양을 더 이상 증가시켜도 활성이 더 높아지지는 않는다. "아포화 수준"은 포화 수준보다 낮으며 대상 물질을 더 많이 첨가하면 활성이 더 높아질 수 있다. 기존 분석법을 사용하여 경험적으로 포화 임계값을 결정할 수 있다. 예를 들어, 도 1은 합성 gRNA의 양을 증가시고 Cas 단백질의 양을 일정하게 하여 공동-형질감염 후 Cas 편집 활성을 평가한 분석 결과를 나타낸다. 상기 도면에서 볼 수 있듯이 Cas-매개된 편집 활성은 gRNA 수준이 20만 개의 세포의 형질감염에 대한 포화점에 도달할 때 gRNA 25 내지 31.25 피코몰에서 정체되었다.
다수의 경우, 화학 반응에 필요한 포화 수준의 성분을 사용하는 것이 바람직하다. 그러나, 이러한 조건은 항상 실현가능한 것은 아니며, 특히 하나 이상의 화합물의 포화 수준으로 인간이나 동물을 치료하는 것이 가능하지 않거나 안전하지 않을 수 있는 치료의 경우 더욱 그렇다. CRISPR 기반 치료의 경우, 형질감염 효율성은 일반적으로 치료의 효과를 제한하는 병목 현상이다. 예를 들어, 현재 CRISR 기반 치료는 일반적으로 gRNA 및 Cas 단백질을 인코딩하는 mRNA를 사용하여 환자의 하나 이상의 세포에 공동-형질감염을 요구한다. 형질감염 효율이 낮은 경우, 하나 또는 두 성분 모두 치료 효과에 필요한 효과량보다 낮은 수준으로 전달될 수 있다. 본원에 개시된 변형된 가이드 RNA 구축물은 아포화 수준으로 형질감염될 때에도 일반적으로 높은 수준의 Cas 편집 활성을 나타낸다는 점에서 당업계의 이러한 요구를 해결한다. 실제로, 합성 gRNA의 3' 말단에 하나 이상의 포스포노카복실레이트 변형을 혼입하는 것은 Cas mRNA와 합성 gRNA의 공동-형질감염을 포함하는 CRISPR 기반 방법에 특히 유리하다.
상기 언급한 바와 같이, 본 개시내용은 또한 아포화량으로 형질감염될 때와 같은 어려운 조건하에 높은 수준의 프라임 편집 활성을 유지하는 변형된 pegRNA 구축물 및 방법을 제공한다. 전통적인 가이드 RNA(gRNA)의 구조는 프라임 편집 gRNA(pegRNA)의 구조와 현저히 다르며, 본 개시 이전에는 pegRNA의 화학적 변형이 그 활성에 어떻게 영향을 미치는지 불분명하였기에 상기 결과는 특히 놀랍다. 특히, pegRNA는 전형적인 gRNA(예컨대, 역전사효소 주형 및 프라이머 결합 부위 서열)와 비교하여 이의 3' 부분 말단에 추가 서열을 함유하고, pegRNA의 3' 말단은 다른 CRISPR-Cas 시스템에서의 전형적인 gRNA의 3' 말단과는 상이한 프라임 편집에서의 기능을 수행한다. 따라서, pegRNA의 3' 말단에서 포스포리보스(또는 다른 화학적) 변형은 프라이머 결합 부위 서열(DNA 표적 부위의 닉이 있는 가닥의 3' 말단에 하이브리드화되어, 역전사효소가 생성된 RNA:DNA 듀플렉스를 닉이 있는 3' 말단의 프라이머 연장을 위한 허용되는 기질로서 인식하게 하여 프라임 편집을 성취함)의 역할을 방해할 가능성이 있다.
이러한 이해를 바탕으로, RNA:DNA 듀플렉스의 RNA 분절에서 MS 및 MP와 같은 일부 포스포리보스 변형이 상기 듀플렉스에 대한 역전사효소의 친화력을 방해하거나 감소시킬 수 있고, 이에 따라 프라임 편집 활성을 감소시킬 것으로 예상될 수 있다. 또한, 포스포리보스가 변형된 위치 및/또는 위치 조합(MS, MSP 또는 MP 등)은 프라임 편집에서 역전사효소 기능을 방해하여 프라임 편집 활성을 감소시킬 것으로 예상될 수 있다. 역전사효소가 전형적으로 프라임 편집에 사용되는 Moloney 뮤린 백혈병 바이러스(MMLV)의 가까운 친척인 이종성 뮤린 백혈병 바이러스 관련 바이러스의 역전사효소의 듀플렉스-복합 폴리펩티드 단편의 부분과 RNA:DNA 듀플렉스 사이의 복합체의 공개된 공결정 구조는 RNA:DNA 듀플렉스에서 RNA 가닥의 3' 말단과 상호작용하는 역전사효소의 부분을 결여하여(문헌[Nowak et al., Nucl. Acids Res. 2013, 3874-3887]), 프라임 편집에서 pegRNA의 3' 말단에서 중요할 수 있는 RNA 단백질 접촉에 대한 정보의 결여를 당업계에 남겼다.
본 개시내용은 3' 말단에 하나 이상의 MP 변형을 포함하고 임의적으로 5' 말단에 하나 이상의 변형을 포함하는 변형된 gRNA 또는 pegRNA가, 특히 변형된 가이드 RNA가 아포화 수준의 세포내로 형질감염되는 경우에, Cas-매개된 편집 활성을 향상시킬 수 있다는 놀라운 발견에 부분적으로 기초한다. 하기 더 자세히 논의된 바와 같이, 약 100nt 길이일 수 있는 화학적으로 합성된 단일 가이드 RNA와 일반적으로 더 긴 pegRNA의 다양한 설계를 배양된 인간 세포에서 Cas 단백질 또는 Cas 단백질을 인코딩하는 mRNA와 공동-형질감염시켰고, gRNA/pegRNA의 3' 말단에서의 포스포리보스에 MS 또는 MP 변형을 추가했을 때 증가된 활성이 관찰되었다.
다양한 3' 및/또는 5' 말단 변형의 영향을 평가하기 위해, 일련의 HBB 유전자를 표적화하는 합성 gRNA를, 표 1에 나열된 gRNA의 3' 말단에 MS 또는 MP 포스포리보스 변형을 체계적으로 혼입함으로써 생성하였다. 5' 및 3' 최종 변형은 각각의 합성 gRNA의 명칭으로 표시되고, 예를 들어, HBB-101-3xMS,3xMP는 gRNA의 5' 말단에 3개의 MS 변형 및 3' 말단에 3개의 MP 변형을 갖는 HBB 유전자의 가이드 RNA를 의미한다. 변형의 정확한 위치는 도 1에 도시된 서열에 밑줄로 표시된다. 명칭은 또한 RNA 길이를 나타내고, 예를 들어, HBB-101-등은 101개의 뉴클레오티드로 구성된 HBB 유전자를 타겟으로 하는 sgRNA 가닥을 의미한다. 마찬가지로, HBB-99-등도 sgRNA 가닥이 99개의 뉴클레오티드로 구성됨을 의미한다. 표 1에 정의된 서열에 의해 구체화된 바와 같이, 상기 및 유사 길이들 사이의 서열 길이의 차이는 sgRNA의 말단의 3' 말단에서 짧은 폴리우리딘(polyU) 테일에서의 우리딘의 상이한 수에 있다. 표 1에 나열된 예에서, 3'폴리U 테일은 3, 4, 5, 6 또는 7개의 연속된 유리딘으로 구성된다(참고 지점으로서, 천연 tracrRNA 상의 3' 폴리U 테일은 일반적으로 7개의 연속적인 우리딘으로 구성됨). 또한, 가이드 서열의 변형은 표적 유전자의 명칭과 RNA 길이 뒤에 표시된다. 예를 들어, HBB-102-11MP-3xMS,3xMP는 5' 말단에 3개의 MS 변형 및 3' 말단에 3개의 MP 변형을 갖고 가이드 서열의 위치 11에 MP 변형을 포함하는 102개의 뉴클레오티드로 구성된 HBB 유전자에 대한 가이드 RNA를 의미한다. 변형의 정확한 위치는 표 1(및 표 2 내지 4)에 표시된 서열에서 밑줄로 표시되며, 가이드 서열의 MP 변형은 밑줄 친 굵은 글씨로 표시된다.
[표 1]
HBB 유전자를 표적화하는 예시적인 합성 gRNA
gRNA의 3' 말단에서 화학적 변형의 수와 유형은 아포화량의 gRNA가 세포내로 전달되는(예를 들어, 핵감염(nucleofection)에 의해) 조건하에 DNA 편집에 대한 효능을 실질적으로 향상시킬 수 있다. 이러한 이점은 리보핵단백질(RNP) 복합체로서 Cas 단백질과 복합체로 공동-형질감염되는 것과 대조적으로 Cas 단백질을 인코딩하는 mRNA와 공동-형질감염된 gRNA를 사용하는 방법에서 특히 두드러진다. gRNA에 혼입된 화학적 변형의 수와 유형은 또한 Cas RNP 복합체의 편집 효율성을 향상시킬 수 있으며, 이는 혈청(뉴클레아제를 포함하는 것으로 공지되어 있음)을 포함하는 성장 배지에 현탁된 세포의 형질감염과 관련하여 여기에 제공된 데이터에 의해 기재된다. 예를 들어, 도 4 및 5를 참고한다. 본원에 기재된 실험 데이터는 또한 형질감염된 gRNA 서열의 특정 화학적 변형 및 특정 서열 위치가 편집 수율을 향상시키는 데 특히 유리할 수 있음을 나타낸다(예컨대, gRNA의 3' 말단의 연속적인 3' 말단 포스포리보스에 하나 이상의 MP 변형을 혼입함에 의함).
본원에 기재된 임의의 5' 및 3' 말단 변형은 표적 특이성을 향상시키는 gRNA의 가이드 서열의 변형과 임의적으로 조합될 수 있다(예를 들어, US 10,767,175에 기재된 바와 같음). 예를 들어, 3' 말단의 MP 변형(예컨대, 3' 말단으로부터 제2 뉴클레오티드에 있는 MP, 이는 3' 말단으로부터의 제1 뉴클레오티드간 연결기가 포스포노아세테이트를 포함함을 의미함)은 gRNA 또는 pegRNA의 가이드 서열의 부분에서 위치 5 또는 11(20개의 뉴클레오티드 가이드 서열의 가이드 서열의 5' 말단으로부터 카운팅됨)의 MP 또는 다른 변형과 조합될 수 있고, 이는 표 1에 예시되고 도 2 내지 5에서 시험된 바와 같다.
화학적 변형은 목적하는 서열을 생성하기 위해 아미다이트 커플링의 선택 주기에서 화학적으로 변형된 포스포르아미다이트를 사용함으로써 gRNA의 화학적 합성 중에 혼입될 수 있다. 일단 합성되면, 화학적으로 변형된 gRNA는 유전자 편집 또는 조절을 위해 변형되지 않은 gRNA와 동일한 방식으로 사용된다. 바람직한 양태는 화학적으로 변형된 합성 gRNA를 Cas 단백질을 인코딩하는 mRNA 또는 DNA와 공동-형질감염시키는 것이다. 화학적 변형은 전기천공, 리포펙션 또는 gRNA 및/또는 Cas 단백질을 인코딩하는 mRNA로 충전된 나노입자에 대한 살아있는 세포 또는 조직의 노출에 의해 전달되는 경우를 포함하여 형질감염된 세포에서 gRNA의 활성을 향상시킨다.
예시적인 합성 pegRNA는 아래 표 2 및 3에 나와 있다. 이들 pegRNA는 3' 말단에 MS 또는 MP 포스포리보스 변형을 체계적으로 혼입함으로써 변형되었다. 5' 및 3' 말단 변형은 각각의 합성 pegRNA의 명칭에 표시되며 이는 또한 표적 유전자를 나타낸다. 예를 들어, "EMX1-peg-3xMS,3xMP"는 pegRNA의 5' 말단에 3개의 MS 변형 및 3' 말단에 3개의 MP 변형을 갖는 EMX1 유전자의 pegRNA를 의미한다. 변형의 정확한 위치는 표 2에 표시된 서열에 밑줄로 표시되어 있다. pegRNA 설계 중 일부는 pegRNA 명칭에서 "+3'UU", "+3'UUU" 또는 "+3'UUUU"로 표시된 3' 말단에 추가된 짧은 폴리우리딘 트랙(track)(즉, 폴리U 테일)을 갖는다.
[표 2]
EMX1 유전자를 표적화하는 예시적인 합성 pegRNA
[표 3]
EMX1 유전자를 표적화하는 예시적인 합성 pegRNA
[표 4]
IL2RG 유전자를 표적화하는 예시적인 합성 gRNA
하기 기재된 예에서 입증된 바와 같이, pegRNA의 3' 말단에서 화학적 변형의 사용은 프라임 편집자에 의한 합성 pegRNA의 효능을 (3' 말단에서 변형되지 않은 pegRNA에 비해) 실질적으로 향상시킨다. 원래 문헌에 보고된 바와 같이 pegRNA 및 프라임 편집자가 DNA 벡터로 형질감염된 세포에서 구성적으로 발현될 때, 편집 활성이 지속되는 것과는 반대로, 편집 활성 기간을 제한하려고 할 때, 프라임 편집을 위해 합성 pegRNA를 사용하는 것이 바람직할 수 있다(문헌[Anzalone et al. 2019] 참고). 본 개시내용은 또한 pegRNA 서열의 데이터 특정 화학적 변형 및 특정 서열 위치가 3' 말단(3' 말단에 하류 폴리U 테일을 추가하지 않음)에서 프라이머 결합 분절로 종결되는 pegRNA 가닥의 연속 3' 말단 포스포리보스에서 2개의 MP 변형을 혼입하는 것과 같은 일부 양상에서 특히 유리할 수 있음을 입증한다.
A. 예시적인 CRISPR/Cas 시스템
게놈 변형의 CRISPR/Cas 시스템은 Cas 단백질(예를 들어, Cas9 뉴클레아제), 및 Cas 단백질을 표적 DNA에 표적화하는 가이드 서열 및 Cas 단백질과 상호작용하는 스캐폴드 영역(예를 들어, tracrRNA)을 함유하는 DNA-표적화 RNA(예를 들어, 변형된 gRNA)를 포함한다. 일부 경우에서, D10A, H840A, D839A 및 H863A 중 하나 이상의 돌연변이를 함유하는 Cas9 돌연변이체와 같은 Cas 단백질의 변이체가 사용될 수 있다. 다른 경우에서, 목적하는 성질(예를 들어, 단일- 또는 이중-가닥 파손을 생성하고/거나 유전자 발현을 조절할 수 있음)을 갖는 Cas 단백질 또는 이의 변이체의 단편이 사용될 수 있다. 공여체 복구 주형은 일부 CRISPR 적용례에 사용될 수 있고, 이는, 예컨대 형광 단백질 또는 항생물질 내성 마커와 같은 리포터 폴리펩티드를 인코딩하는 뉴클레오티드 서열, 및 표적 DNA에 상동성이고 유전자 변형 부위의 측면에 위치하는 상동성 팔(arm)을 포함할 수 있다. 다르게는, 공여체 복구 주형은 단일-가닥 올리고데옥시뉴클레오티드(ssODN)일 수 있다. 일부 양상에서, CRISPR/CAS 시스템은 프라임 편집자로 작용할 수 있는 Cas 단백질(예를 들어, 역전사효소 단백질 또는 이의 도메인에 융합된 니카아제 활성을 나타내는 Cas 단백질을 포함하는 융합 단백질)을 포함할 수 있다. 프라임 편집자는 프라임 편집으로 지칭되는 과정에 의해 표적 핵산의 서열을 변형하기 위해 표적 핵산의 서열에 대한 하나 이상의 편집물을 포함하는 역전사효소 주형을 혼입하는 pegRNA와 함께 사용될 수 있다.
1. Cas 단백질 및 이의 변이체
CRISPR(주기적 간격으로 분포하는 회문구조 반복서열)/Cas(CRISPR-관련 단백질) 뉴클레아제 시스템은 세균에서 발견되었지만, 게놈 편집/유전자 발현의 조절을 위해 진핵세포(예컨대, 포유동물)에서 사용되어 왔다. 상기 시스템은 많은 미생물성 세균 및 고세균의 후천성 면역 반응의 일부를 기반으로 한다. 바이러스 또는 플라스미드가 이러한 미생물에 침입할 때, 침입체의 DNA의 분절들은 미생물 게놈내의 CRISPR 유전자좌(또는 "CRISPR 배열")에 혼입된다. CRISPR 유전자좌의 발현은 비-코딩 CRISPR RNA(crRNA)를 생성한다. 유형 II CRISPR 시스템에서, crRNA는 이어서 부분 상보성을 갖는 영역을 통해 tracrRNA로 지칭되는 또 다른 유형의 RNA와 결합하여 Cas(예를 들어, Cas9) 단백질을 "프로토스페이서"로 불리는 표적 DNA내 crRNA에 상동성인 영역으로 유도한다. Cas(예를 들어, Cas9) 단백질은 DNA를 절단하여 crRNA 전사체내에 함유된 20-뉴클레오티드 가이드 서열에 의해 특정된 부위들에서의 이중-가닥 파손에서 평활 말단(blunt end)을 생성한다. Cas(예를 들어, Cas9) 단백질은 부위-특이적 DNA 인식 및 절단에 crRNA 및 tracrRNA를 둘 다 필요로 한다. 상기 시스템은 crRNA 및 tracrRNA가 1개의 분자(단일 가이드 RNA 또는 "sgRNA")로 융합될 수 있도록 조작된다(예를 들어, 문헌[Jinek et al. (2012) Science, 337:816-821]; [Jinek et al. (2013) eLife, 2:e00471]; [Segal (2013) eLife, 2:e00563] 참고). 따라서, CRISPR/Cas 시스템은 세포의 게놈내 목적하는 표적에서 이중-가닥 파손을 유발하도록 조작될 수 있으며, 세포의 내인성 메카니즘을 이용하여 상동성 지향 복구(HDR) 또는 비상동 말단 접합(NHEJ)에 의해 상기 유도된 파손을 복구할 수 있다.
일부 양태에서, Cas 단백질은 DNA 절단 활성을 갖는다. Cas 단백질은 표적 DNA 서열내 한 위치에서 1개 또는 2개 가닥 모두의 절단을 유도할 수 있다. 예를 들어, Cas 단백질은 표적 DNA 서열의 단일 가닥을 절단하는 하나 이상의 불활성화 촉매 도메인을 갖는 니카아제일 수 있다(예컨대, 프라임 편집자 Cas 단백질의 경우).
Cas 단백질의 비제한적인 예로는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(Csn1 및 Csx12로도 알려짐), Cas10, Cas11, Cas12, Cas13, Cas14, CasΦ, CasX, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cpf1, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 이의 동족체, 이의 변이체, 이의 단편, 이의 돌연변이체 및 이의 유도체가 포함된다. Cas 단백질에는 6개 이상의 유형(유형 I 내지 VI)과 33개 이상의 하위 유형이 있다(예를 들어, [Makarova et al., Nat. Rev. Microbiol., 2020, 18:2, 67-83] 참고). 유형 II Cas 단백질에는 Cas1, Cas2, Csn2 및 Cas9가 포함된다. Cas 단백질은 당업자에게 공지되어 있다. 예를 들어, 스트렙토코커스 피오게네스(Streptococcus pyogenes) 야생형 Cas9 폴리펩티드의 아미노산 서열은, 예를 들어, NBCI Ref. 서열번호 NP_269215에 나타나 있으며, 스트렙토코커스 써모필루스(Streptococcus thermophilus) 야생형 Cas9 폴리펩티드의 아미노산 서열은, 예를 들어, NBCI Ref. 서열번호 WP_011681470에 나타나 있다. 본 개시내용의 양상에 유용한 CRISPR-관련 엔도뉴클레아제는, 예를 들어, US 9,267,135; 9,745,610; 및 10,266,850에 개시되어 있다.
Cas 단백질, 예를 들어, Cas9 폴리펩티드는 하기를 포함하나 이로 한정되지는 않는 다양한 세균 종들로부터 유도될 수 있다: 베일로넬라 아티피칼(Veillonella atypical), 푸소박테리움 뉴클레아툼(Fusobacterium nucleatum), 필리팩터 알로시스(Filifactor alocis), 솔로박테리움 무레이(Solobacterium moorei), 코프로코커스 카투스(Coprococcus catus), 트레포네마 덴티콜라(Treponema denticola), 펩토니필루스 두에르데니(Peptoniphilus duerdenii), 카테니박테리움 미츠오카이(Catenibacterium mitsuokai), 스트렙토코커스 뮤탄스(Streptococcus mutans), 리스테리아 이노쿠아(Listeria innocua), 스태필로코커스 슈도인터메디우스(Staphylococcus pseudintermedius), 애시드아미노코커스 인테스틴(Apcidaminococcus intestine), 올세넬라 울리(Olsenella uli), 오에노코커스 키타하라에(Oenococcus kitaharae), 비피도박테리움 비피덤(Bifidobacterium bifidum), 락토바실러스 람노서스(Lactobacillus rhamnosus), 락토바실러스 가세리(Lactobacillus gasseri), 피네골디아 마그나(Finegoldia magna), 미코플라스마 모빌(Mycoplasma mobile), 미코플라스마 갈리셉티쿰(Mycoplasma gallisepticum), 미코플라스마 오비뉴모니아에(Mycoplasma ovipneumoniae), 미코플라스마 카니스(Mycoplasma canis), 미코플라스마 시노비아에(Mycoplasma synoviae), 유박테리움 렉테일(Eubacterium rectale), 스트렙토코커스 써모필루스(Streptococcus thermophilus), 유박테리움 돌리쿰(Eubacterium dolichum), 락토바실러스 코리니포미스 아종 토르켄스(Lsactobacillus coryniformis subsp. Torquens), 일리오박터 폴리트로푸스(Ilyobacter polytropus), 루미노코커스 알부스(Ruminococcus albus), 아케르만시아 무시니필라(Akkermansia muciniphila), 아시도터머스 셀룰로라이티쿠스(Acidothermus cellulolyticus), 비피도박테리움 롱검(Bifidobacterium longum), 비피도박테리움 덴티움(Bifidobacterium dentium), 코리네박테리움 디프테리아(Cmorynebacterium diphtheria), 엘루시마이크로븀 미누텀(Elusimicrobium minutum), 니트라티프랙터 살수기니스(Nitratifractor salsuginis), 스파에로카에타 글로버스(Spphaerochaeta globus), 피브로박터 숙시노게네스 아종 숙시노게네스(Fibrobacter succinogenes subsp. Succinogenes), 박테로이데스 카프노시토파가 오크라세아(Bacteroides Capnocytophaga ochracea), 로도슈도모나스 팔루스트리스(Rhodopseudomonas palustris), 프레보텔라 미칸스(Prevotella micans), 프레보텔라 루미니콜라(Prevotella ruminicola), 플라보박테리움 콜룸나르(Flavobacterium columnare), 아미노모나스 파우시보란스(Aminomonas paucivorans), 로도스피릴룸 루브럼(Rhodospirillum rubrum), 칸디다투스 푸니세이스피릴룸 마리눔(Candidatus Puniceispirillum marinum), 베르미네프로박터 에이세니아(Verminephrobacter eiseniae), 랄스토니아 시지기(Ralstonia syzygii), 디노로세오박터 시바에(Dinoroseobacter shibae), 아조스피릴룸(Azospirillum), 니트로박터 함부르겐시스(Nitrobacter hamburgensis), 브라디리조븀(Bradyrhizobium), 울리넬라 숙시노게네스(Wolinella succinogenes), 캄필로박터 제주니 아종 제주니(Campylobacter jejuni subsp. Jejuni), 헬리코박터 무스텔라(Hxelicobacter mustelae), 바실러스 세레우스(Bacillus cereus), 아시도보락스 에브레우스(Acidovorax ebreus), 클로스트리듐 퍼프린겐스(Clostridium perfringens), 파르비바쿨럼 라바멘티보란스(Parvibaculum lavamentivorans), 로세부리아 인테스티날리스(Roseburia intestinalis), 나이세리아 메닌지티디스(Neisseria meningitidis), 파스튜렐라 멀토시다 아종 멀토시다(Pasteurella multocida subsp. Multocida), 수테렐라 와즈워텐시스(Sutterella wadsworthensis), 프로테오박테리움(proteobacterium), 레지오넬라 뉴모필라(Legionella pneumophila), 파라수테렐라 엑스크레멘티호미니스(Parasutterella excrementihominis), 울리넬라 숙시노게네스(Wolinella succinogenes), 및 프란시셀라 노비시다(Fsrancisella novicida).
"Cas9"는 RNA-유도 이중-가닥 DNA-결합 뉴클레아제 단백질 또는 니카아제 단백질을 지칭한다. 야생형 Cas9 뉴클레아제는 상이한 DNA 가닥을 절단하는 2개의 기능성 도메인, 예를 들어, RuvC 및 HNH를 갖는다. Cas9는 2개의 기능성 도메인이 모두 활성일 때 게놈 DNA(표적 DNA)에서 이중-가닥 파손을 유도할 수 있다. Cas9 효소는 다음으로 이루어진 군에 속하는 세균들로부터 유도된 Cas9 단백질의 하나 이상의 촉매 도메인을 포함할 수 있다: 코리네박터(Corynebacter), 수테렐라(Sutterella), 레지오넬라(Legionella), 트레포네마(Treponema), 필리팩터(Filifactor), 유박테리움(Eubacterium), 스트렙토코커스(Streptococcus), 락토바실러스(Lactobacillus), 미코플라스마(Mycoplasma), 박터로이데스(Bacteroides), 플라비볼라(Flaviivola), 플라보박테리움(Flavobacterium), 스파에로카에타(Sphaerochaeta), 아조스피릴룸(Azospirillum), 글루코나세토박터(Gluconacetobacter), 나이세리아(Neisseria), 로세부리아(Roseburia), 파르비바쿨럼(Parvibaculum), 스태필로코커스(Staphylococcus), 니트라티프락터(Nitratifractor), 및 캄필로박터(Campylobacter). 일부 양태에서, 상기 2개의 촉매 도메인은 상이한 세균 종들로부터 유도된다.
"Cas12"(변이체 Cas12a(Cpf1로도 알려짐), Cas12b, c2c1, c2c3, CasX 및 CasY 포함)는 혼합 알파/베타 도메인, RuvC-I에 이어서 나선형 영역, RuvC-II 및 징크 핑거-유사 도메인(zinc finger-like domain) 또는 니카아제 단백질을 함유하는 RNA-가이드되는 이중 가닥 DNA 결합 뉴클레아제 단백질을 의미한다. 야생형 Cas12 뉴클레아제는 dsDNA 표적 서열에 엇갈린 5' 오버행(staggered 5' overhang)을 생성하며 tracrRNA가 필요하지 않다. Cas12와 이의 변이체는 표적 dsDNA에서 5' AT-풍부 PAM 서열을 인식한다. Cas12a 단백질의 Nuc로 지칭되는 삽입 도메인이 표적 가닥 절단을 담당하는 것으로 입증되었다. Cas12 효소는 프란시셀라 및 프레보텔라로 이루어진 군에 속하는 세균으로부터 유래된 Cas12 단백질의 하나 이상의 촉매 도메인을 포함할 수 있다.
Cas9 단백질의 유용한 변이체들은 단일 불활성 촉매 도메인, 예를 들어, RuvC- 또는 HNH- 효소(둘 다 니카아제임)를 포함할 수 있다. 이러한 Cas 단백질은, 예컨대 프라임 편집의 맥락에서 유용하다. Cas9 니카아제는 단지 1개의 활성 기능성 도메인을 가지며 표적 DNA의 1개 가닥만을 절단함으로써, 단일-가닥 파손 또는 닉(nick)을 유발할 수 있다. 일부 양태에서, Cas 단백질은 적어도 D10A 돌연변이를 갖는 돌연변이 Cas9 뉴클레아제이고 Cas9 니카아제이다. 다른 양태에서, Cas 단백질은 적어도 H840A 돌연변이를 갖는 돌연변이 Cas9 뉴클레아제이고 Cas9 니카아제이다. Cas 단백질은 Cas9 니카아제에 존재하는 돌연변이의 다른 예로는, 비제한적으로, N854A 및 N863A가 포함된다. 반대쪽 DNA 가닥을 표적화하는 2개 이상의 DNA-표적화 RNA가 사용되는 경우, 이중-가닥 파손은 Cas9 니카아제를 사용하여 도입될 수 있다. 엇갈린 이중-닉 유도된 이중-가닥 파손(staggered double-nick-induced double-strand break)은 NHEJ 또는 HDR에 의해 복구될 수 있다(문헌[Ran et al., 2013, Cell, 154:1380-1389]; [Anzalone et al. Nature 576:7785, 2019, 149-15)]. 상기 유전자 편집 전략은 HDR을 촉진하고 부산물로서 indel 돌연변이의 빈도를 감소시킨다. Cas9 뉴클레아제 또는 니카아제의 비제한적인 예는, 예를 들어, US 8,895,308; 8,889,418; 8,865,406; 9,267,135; 및 9,738,908, 및 US 2014/0186919에 기재되어 있다. Cas9 뉴클레아제 또는 니카아제는 표적 세포 또는 표적 유기체에 대해 코돈-최적화될 수 있다.
일부 양태에서, Cas 단백질은 RuvC1 및 HNH 뉴클레아제 도메인의 2개의 침묵 돌연변이(D10A 및 H840A)를 함유하는 Cas9 폴리펩티드일 수 있으며, 이는 dCas9로 지칭된다(문헌[Jinek et al., Science, 2012, 337:816-821]; [Qi et al., Cell, 152(5):1173-1183]). 한 양태에서, 스트렙토코커스 피오게네스로부터의 dCas9 폴리펩티드는 위치 D10, G12, G17, E762, H840, N854, N863, H982, H983, A984, D986, A987 또는 이들의 임의의 조합에 하나 이상의 돌연변이를 포함한다. 상기 dCas9 폴리펩티드 및 이의 변이체에 대한 설명은, 예를 들어, WO 2013/176772에 제공되어 있다. dCas9 효소는 D10, E762, H983 또는 D986에서의 돌연변이뿐 아니라, H840 또는 N863에서의 돌연변이를 함유할 수 있다. 일부 경우에서, dCas9 효소는 D10A 또는 D10N 돌연변이를 함유한다. 또한, dCas9 효소는 H840A, H840Y, 또는 H840N을 포함할 수 있다. 일부 양태에서, 본 개시내용의 양상에 사용되는 dCas9 효소는 D10A 및 H840A; D10A 및 H840Y; D10A 및 H840N; D10N 및 H840A; D10N 및 H840Y; 또는 D10N 및 H840N을 포함한다. 치환은, Cas9 폴리펩티드가 촉매적으로 불활성이 되고 표적 DNA에 결합할 수 있게 하기 위한 보존적 또는 비-보존적 치환일 수 있다.
dCas9 폴리펩티드는 촉매적으로 불활성이고 뉴클레아제 활성을 결여한다. 일부 경우에서, dCas9 효소 또는 이의 변이체 또는 단편은 표적 서열의 전사를 차단할 수 있고, 일부 경우에서는 RNA 중합효소를 차단할 수 있다. 다른 경우에서, 예컨대, 전사 활성제 폴리펩티드에 결합될 때, dCas9 효소 또는 이의 변이체 또는 단편은 표적 서열의 전사를 활성화시킬 수 있다. 일부 양태에서, Cas 단백질 또는 단백질 변이체는 하나 이상의 NLS 서열을 포함한다.
일부 양태에서, Cas 단백질은 임의적인 개재 링커와 함께 제2 단백질의 하나 이상의 이종 기능성 도메인에 융합된 하나 이상의 Cas 뉴클레아제 도메인을 포함하는 융합 단백질일 수 있으며, 이때 링커는 융합 단백질의 활성을 방해하지 않는다. 이러한 맥락에서 이종성은 기능성 도메인이 Cas 단백질 이외의 단백질로부터 유래하는 것임을 의미한다. 일부 양태에서, 이종 기능성 도메인은 효소 도메인 및/또는 결합 도메인을 포함한다. 일부 양태에서, 이종 효소 도메인은 뉴클레아제, 니카아제, 재조합효소, 데아미나제, 메틸트랜스퍼라제, 중합효소, 역전사효소, 메틸라제, 아세틸라제, 아세틸트랜스퍼라제, 전사 활성화제, 또는 전사 억제인자 도메인이다. 일부 양태에서, 이종 효소 도메인은 염기 편집 활성, 뉴클레오티드 데아미나제 활성, 메틸라제 활성, 데메틸라제 활성, 번역 활성화 활성, 번역 억제 활성, 전사 활성화 활성, 전사 억제 활성, 전사 방출 인자 활성, 염색질 변형 또는 리모델링 활성, 히스톤 변형 활성, 뉴클레아제 활성, 단일 가닥 RNA 절단 활성, 이중 가닥 RNA 절단 활성, 단일 가닥 DNA 절단 활성, 이중 가닥 DNA 절단 활성, 핵산 결합 활성, 검출가능한 활성, 또는 이들의 임의의 조합을 포함한다.
일부 양태에서, Cas 단백질은, 예를 들어, APOBEC1을 포함하는 아포지단백질 B mRNA 편집자 효소, 촉매 폴리펩티드 유사(APOBEC) 계열의 데아미나제, 예컨대 APOBEC1, APOBEC2, APOBEC3A, APOBEC3B, APOBEC3C, APOBEC3D/E, APOBEC3F, APOBEC3G, APOBEC3H 또는 APOBEC4; 활성화-유도된 시티딘 데아미나제(AID), 예를 들어, 활성화-유도된 시티딘 데아미나제(AICDA); 시토신 데아미나제 1(CDA1) 또는 CDA2; 또는 tRNA에 작용하는 시토신 데아미나제(CDAT)로부터의 시티딘 데아미나제 도메인과 같은 염기 편집자인 이종 기능성 도메인을 포함한다. 일부 양태에서, 이종 기능성 도메인은 아데노신 DNA 염기를 변형하는 데아미나제이고, 예를 들어, 데아미나제는 아데노신 데아미나제 1(ADA1), ADA2; RNA 1(ADAR1), ADAR2, ADAR3에 작용하는 아데노신 데아미나제; tRNA 1(ADAT1), ADAT2, ADAT3에 작용하는 아데노신 데아미나제; 및 자연 발생 또는 조작된 tRNA-특이적 아데노신 데아미나제(TadA)이다. 일부 양태에서, 이종 기능성 도메인은 생물학적 테더(tether)이다. 일부 양태에서, 생물학적 테더는 MS2, Csy4 또는 람다 N 단백질이다. 일부 양태에서, 이종 기능성 도메인은 FokI이다.
일부 양태에서, Cas 단백질은 내인성 DNA 복구 또는 염기 절제 복구(BER) 경로를 억제하거나 향상시키는 효소, 도메인 또는 펩티드인 이종 기능성 도메인, 예를 들어, BER을 개시하기 위해 우라실 DNA 글리코실라제(UDG, 우라실 N-글리코실라제 또는 UNG로도 알려짐) 매개되는 우라실 절제를 억제하는 우라실 DNA 글리코실라제 억제제(UGI); 또는 박테리오파지 Mu로부터의 Gam과 같은 DNA 말단 결합 단백질을 포함한다.
일부 양태에서, Cas 단백질은 전사 활성화 도메인인 이종 기능성 도메인, 예를 들어, VP64 도메인, p65 도메인, MyoD1 도메인 또는 HSF1 도메인을 포함한다. 일부 양태에서, Cas 단백질은 전사 억제 도메인인 이종 기능성 도메인, 예를 들어, 크루펠 관련 박스(KRAB) 도메인, ERF 억제 도메인(ERD), mSin3A 상호작용 도메인(SID) 도메인, SID4X 도메인, NuE 도메인 또는 NcoR 도메인을 포함한다. 일부 양태에서, Cas 단백질은 뉴클레아제 도메인인 이종 기능성 도메인, 예를 들어, Fok1 도메인을 포함한다. 일부 양태에서, Cas 단백질은 전사 침묵 도메인, 예를 들어, 이종염색질 단백질 1(HP1), 예를 들어, HP1a 또는 HP1D를 포함한다. 일부 양태에서, Cas 단백질의 이종 기능성 도메인은 DNA의 메틸화 상태를 변형하는 효소이다. 일부 양태에서, DNA의 메틸화 상태를 변형하는 효소는 DNA 메틸트랜스퍼라제(DNMT) 또는 TET 단백질이다. 일부 양태에서, TET 단백질은 TET1이다. 일부 양태에서, Cas 단백질의 이종 기능성 도메인은 히스톤 서브유닛(subunit)을 변형하는 효소이다. 일부 양태에서, 히스톤 서브유닛을 변형하는 효소는 히스톤 아세틸트랜스퍼라제(HAT), 히스톤 데아세틸라제(HDAC), 히스톤 메틸트랜스퍼라제(HMT) 또는 히스톤 데메틸라제이다.
유전자 조절(예컨대, 표적 DNA의 전사 조절)을 위해 dCas9와 같은 뉴클레아제 결핍 Cas 단백질이 전사 활성화 또는 전사 억제에 사용될 수 있다. 뉴클레아제-결여(null) Cas 단백질을 사용하여 유전자 발현을 비활성화하는 방법은, 예를 들어, 문헌[Larson et al., Nat. Protoc., 2013, 8(11):2180-2196]에 기재되어 있다.
일부 양태에서, Cas 단백질은 하나 이상의 핵 국소화 신호(NLS) 도메인을 포함한다. 하나 이상의 NLS 도메인은 효과기 단백질(예를 들어, C2c2)의 말단에 또는 근처에 또는 근접하게 위치할 수 있고, 2개 이상의 NLS가 있는 경우, 2개 각각은 효과기 단백질(예컨대, C2c2)의 말단에 또는 그 근처에 또는 그에 근접하게 위치할 수 있다.
일부 양태에서, Cas 단백질을 인코딩하는 뉴클레오티드 서열은 재조합 발현 벡터에 존재한다. 특정한 경우에서, 재조합 발현 벡터는 바이러스 구조물, 예를 들어, 재조합 아데노-연관 바이러스 구조물, 재조합 아데노바이러스 구조물, 재조합 렌티바이러스 구조물 등이다. 예를 들어, 바이러스 벡터는 우두 바이러스, 소아마비 바이러스, 아데노바이러스, 아데노-연관 바이러스, SV40, 단순 헤르페스 바이러스, 인간 면역결핍 바이러스 등을 기반으로 할 수 있다. 레트로바이러스 벡터는 뮤린 백혈병 바이러스, 비장 괴사 바이러스, 및 라우스(Rous) 육종 바이러스, 하비(Harvey) 육종 바이러스, 조류 백혈병 바이러스, 렌티바이러스, 인간 면역결핍 바이러스, 골수증식성 육종 바이러스, 유방 종양 바이러스 등과 같은 레트로바이러스로부터 유도된 벡터를 기반으로 할 수 있다. 유용한 발현 벡터는 당업계에 기술을 가진 자들에게 공지되어 있으며, 많은 벡터들이 상업적으로 시판된다. 하기의 벡터들은 진핵 숙주 세포에 대한 예로써 제공된다: pXT1, pSG5, pSVK3, pBPV, pMSG, 및 pSVLSV40. 그러나, 숙주 세포와 양립가능한 경우 임의의 다른 벡터도 사용할 수 있다.
사용된 표적 세포/발현 시스템에 따라서, 프로모터, 전사 증폭인자, 전사 종결인자 등을 포함한 많은 전사 및 번역 조절 요소들 중 임의의 요소가 발현 벡터에 사용될 수 있다. 유용한 프로모터는 바이러스 또는 임의의 유기체, 예를 들어, 원핵 또는 진핵 유기체로부터 유도될 수 있다. 적합한 프로모터로는 SV40 초기발현 프로모터, 마우스 유방 종양 바이러스 긴 말단 반복서열(LTR) 프로모터, 아데노바이러스 주요 후기발현 프로모터(Ad MLP); 단순 헤르페스 바이러스(HSV) 프로모터, 사이토메갈로바이러스(CMV) 프로모터, 예를 들어, CMV 급속 초기발현 프로모터 영역(CMVIE), 라우스 육종 바이러스(RSV) 프로모터, 인간 U6 소핵 프로모터(U6), 증폭된 U6 프로모터, 인간 H1 프로모터(H1) 등이 포함되나, 이로 한정되지는 않는다.
Cas 단백질은, Cas 폴리펩티드, Cas 폴리펩티드를 인코딩하는 mRNA, 또는 Cas 폴리펩티드를 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 발현 벡터로서 세포(예를 들어, 생체외 치료를 위한 1차 세포와 같은 세포, 또는 환자에서와 같은 생체내 세포)내에 도입될 수 있다.
2. 화학적으로 변형된 가이드 RNA(gRNA)
게놈 변형의 CRISPR/Cas 시스템에 사용하기 위한 변형된 gRNA는 전형적으로, 표적 핵산 서열에 상보적인 가이드 서열, 및 Cas 단백질과 상호작용하는 스캐폴드 영역을 포함한다.
변형된 가이드 RNA의 가이드 서열은, 표적 서열과 하이브리드화되고 표적 서열에 대한 CRISPR 복합체의 서열-특이적 결합을 유도하기 위해 표적 폴리뉴클레오티드 서열(예를 들어, 표적 DNA 서열)과 충분한 상보성을 갖는 임의의 폴리뉴클레오티드 서열일 수 있다. 일부 양태에서, 변형된 가이드 RNA의 가이드 서열과 이의 상응하는 서열 사이의 상보성 정도는, 적합한 정렬 알고리즘을 이용하여 최적으로 정렬될 때, 약 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97.5% 또는 99% 이상이거나, 그보다 더 크다. 최적 정렬은 서열을 정렬시키기 위한 임의의 적절한 알고리즘을 사용하여 결정될 수 있으며, 상기 알고리즘의 비제한적인 예로는 스미스-워터만(Smith-Waterman) 알고리즘, 니들만-분쉬(Needleman-Wunsch) 알고리즘, 버로우즈-휠러 변환(Burrows-Wheeler Transform)을 기반으로 하는 알고리즘(예를 들어, 버로우즈 휠러 정렬자(Burrows Wheeler Aligner)), ClustalW, Clustal X, BLAT, Novoalign(노보크래프트 테크놀로지스(Novocraft Technologies), ELAND(일루미나, 미국 캘리포니아주 샌디에이고), SOAP(soap.genomics.org.cn에서 이용가능), 및 Maq(maq.sourceforge. net에서 이용가능)가 포함된다. 일부 양태에서, 가이드 서열은 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50 또는 75개 이상 뉴클레오티드의 길이이다. 일부 경우에서, 가이드 서열은 약 20개의 뉴클레오티드의 길이이다. 다른 경우에서, 가이드 서열은 약 15개의 뉴클레오티드의 길이이다. 다른 경우에서, 가이드 서열은 약 25개의 뉴클레오티드의 길이이다. 표적 서열에 대한 CRISPR 복합체의 서열-특이적 결합을 유도하는 가이드 서열의 능력은 임의의 적합한 분석에 의해 평가될 수 있다. 결합은 직접적으로, 또는, 예를 들어 프록시(proxy)로서 편집 또는 절단을 사용함으로써 간접적으로 평가될 수 있다. 예를 들어, 시험될 가이드 서열을 포함하여, CRISPR 복합체를 형성하기에 충분한 CRISPR 시스템의 성분들이, 예를 들어, CRISPR 서열의 성분들을 인코딩하는 벡터를 사용한 형질감염에 의해 상응하는 표적 서열을 갖는 숙주 세포에 제공될 수 있으며, 이어서 표적 서열내의 편집 또는 절단을 평가할 수 있다. 유사하게, 표적 폴리뉴클레오티드 서열의 절단은, 표적 서열, 시험될 가이드 서열을 포함한 CRISPR 복합체의 성분들 및 시험 가이드 서열과 상이한 대조군 가이드 서열을 제공하고, 시험 가이드 서열과 대조군 가이드 서열 반응 사이에 표적 서열에서의 결합 또는 절단 비율을 비교함으로써 시험관에서 평가될 수 있다.
가이드 RNA의 뉴클레오티드 서열은 임의의 전술한 웹-기반 소프트웨어를 사용하여 선별할 수 있다. DNA-표적화 RNA를 선택하기 위한 고려사항들로는 사용될 Cas 단백질(예를 들어, Cas9 폴리펩티드)에 대한 PAM 서열, 및 표적이탈 변형을 최소화하기 위한 전략이 포함된다. CRISPR Design Tool과 같은 도구들은 변형된 gRNA를 제조하고, 표적 변형 효율을 평가하고/하거나 표적이탈 부위(off-target site)에서의 절단을 평가하기 위한 서열들을 제공할 수 있다. 변형된 가이드 RNA의 서열을 선별하기 위한 또 다른 고려사항은 가이드 서열내 2차 구조의 정도를 감소시키는 것을 포함한다. 2차 구조는 임의의 적합한 폴리뉴클레오티드 접힘 알고리즘에 의해 결정될 수 있다. 일부 프로그램들은 최소 깁스(Gibbs) 자유 에너지를 계산하는 것을 기반으로 한다. 적합한 알고리즘의 예로는 mFold[Zuker and Stiegler, Nucleic Acids Res, 9 (1981), 133-148], UNAFold 패키지[Markham et al., Methods Mol Biol, 2008, 453:3-31] 및 RNA접힘 형태 ViennaRNA 패키지가 포함된다.
가이드 서열의 하나 이상의 뉴클레오티드 및/또는 변형된 가이드 RNA의 스캐폴드 영역의 하나 이상의 뉴클레오티드는 변형된 뉴클레오티드일 수 있다. 예를 들어, 약 20개의 뉴클레오티드 길이인 가이드 서열은 하나 이상, 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 이상의 변형된 뉴클레오티드를 가질 수 있다. 일부 경우에서, 가이드 서열은 적어도 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 이상의 변형된 뉴클레오티드를 포함한다. 다른 경우에서, 가이드 서열은 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 19 또는 20개 이상의 변형된 뉴클레오티드를 포함한다. 변형된 뉴클레오티드는 가이드 서열의 임의의 핵산 위치에 위치할 수 있다. 즉, 변형된 뉴클레오티드는 가이드 서열의 첫 번째 및/또는 마지막 뉴클레오티드에 또는 그 부근에, 및/또는 그 사이의 임의의 위치에 존재할 수 있다. 예를 들어, 20개의 뉴클레오티드의 길이인 가이드 서열의 경우, 하나 이상의 변형된 뉴클레오티드가 가이드 서열의 핵산 위치 1, 위치 2, 위치 3, 위치 4, 위치 5, 위치 6, 위치 7, 위치 8, 위치 9, 위치 10, 위치 11, 위치 12, 위치 13, 위치 14, 위치 15, 위치 16, 위치 17, 위치 18, 위치 19, 및/또는 위치 20에 위치할 수 있다. 특정한 경우에서, 가이드 서열의 약 10% 내지 약 30%, 예를 들어, 약 10% 내지 약 25%, 약 10% 내지 약 20%, 약 10% 내지 약 15%, 약 15% 내지 약 30%, 약 20% 내지 약 30%, 또는 약 25% 내지 약 30%가 변형된 뉴클레오티드를 포함할 수 있다. 다른 경우에서, 가이드 서열의 약 10% 내지 약 30%, 예를 들어, 약 10%, 약 11%, 약 12%, 약 13%, 약 14%, 약 15%, 약 16%, 약 17%, 약 18%, 약 19%, 약 20%, 약 21%, 약 22%, 약 23%, 약 24%, 약 25%, 약 26%, 약 27%, 약 28%, 약 29%, 또는 약 30%가 변형된 뉴클레오티드를 포함할 수 있다.
일부 양태에서, 변형된 가이드 RNA의 스캐폴드 영역은 하나 이상의 변형된 뉴클레오티드를 함유한다. 예를 들어, 약 80개의 뉴클레오티드의 길이인 스캐폴드 영역은 하나 이상, 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 76, 77, 78, 79 또는 80개 이상의 변형된 뉴클레오티드를 가질 수 있다. 일부 경우에서, 스캐폴드 영역은 적어도 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 이상의 변형된 뉴클레오티드를 포함한다. 다른 경우에서, 스캐폴드 영역은 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 19 또는 20개 이상의 변형된 뉴클레오티드를 포함한다. 변형된 뉴클레오티드는 스캐폴드 영역의 임의의 핵산 위치에 위치할 수 있다. 예를 들어, 변형된 뉴클레오티드는 스캐폴드 영역의 첫 번째 및/또는 마지막 뉴클레오티드에 또는 그 부근에, 및/또는 그 사이의 임의의 위치에 존재할 수 있다. 예를 들어, 약 80개의 뉴클레오티드의 길이인 스캐폴드 영역의 경우, 하나 이상의 변형된 뉴클레오티드가 상기 서열의 핵산 위치 1, 위치 2, 위치 3, 위치 4, 위치 5, 위치 6, 위치 7, 위치 8, 위치 9, 위치 10, 위치 11, 위치 12, 위치 13, 위치 14, 위치 15, 위치 16, 위치 17, 위치 18, 위치 19, 위치 20, 위치 21, 위치 22, 위치 23, 위치 24, 위치 25, 위치 26, 위치 27, 위치 28, 위치 29, 위치 30, 위치 31, 위치 32, 위치 33, 위치 34, 위치 35, 위치 36, 위치 37, 위치 38, 위치 39, 위치 40, 위치 41, 위치 42, 위치 43, 위치 44, 위치 45, 위치 46, 위치 47, 위치 48, 위치 49, 위치 50, 위치 51, 위치 52, 위치 53, 위치 54, 위치 55, 위치 56, 위치 57, 위치 58, 위치 59, 위치 60, 위치 61, 위치 62, 위치 63, 위치 64, 위치 65, 위치 66, 위치 67, 위치 68, 위치 69, 위치 70, 위치 71, 위치 72, 위치 73, 위치 74, 위치 75, 위치 76, 위치 77, 위치 78, 위치 79, 및/또는 위치 80에 위치할 수 있다. 일부 경우에서, 스캐폴드 영역의 약 1% 내지 약 10%, 예를 들어, 약 1% 내지 약 8%, 약 1% 내지 약 5%, 약 5% 내지 약 10%, 또는 약 3% 내지 약 7%가 변형된 뉴클레오티드를 포함할 수 있다. 다른 경우에서, 스캐폴드 서열의 약 1% 내지 약 10%, 예를 들어, 약 1%, 약 2%, 약 3%, 약 4%, 약 5%, 약 6%, 약 7%, 약 8%, 약 9%, 또는 약 10%가 변형된 뉴클레오티드를 포함할 수 있다.
가이드 RNA의 변형된 뉴클레오티드는 리보스(예를 들어, 당)기, 포스페이트기, 핵염기 또는 이의 임의의 조합에서의 변형을 포함할 수 있다. 일부 양태에서, 리보스기에서의 변형은 리보스의 2' 위치에서의 변형을 포함한다.
일부 양태에서, 변형된 뉴클레오티드는 2'-플루오로-아라비노 핵산, 트라이사이클-DNA(tc-DNA), 펩티드 핵산, 사이클로헥센 핵산(CeNA), 잠금 핵산(LNA), 에틸렌-가교 핵산(ENA), 제노 핵산(XNA), 포스포다이아미데이트 모폴리노, 또는 이들의 조합을 포함한다.
변형된 뉴클레오티드 또는 뉴클레오티드 유사체들은 당- 및/또는 주쇄-변형된 리보뉴클레오티드를 포함할 수 있다(즉, 포스페이트-당 주쇄에 변형을 포함할 수 있음). 예를 들어, 천연 또는 자연적 RNA의 포스포다이에스터 결합은 질소 또는 황 이종원자중 적어도 1개를 포함하도록 변형될 수 있다. 일부 주쇄-변형된 리보뉴클레오티드에서, 인접 리보뉴클레오티드에 연결하는 포스포에스터기는 변형된 기, 예를 들어, 포스포로티오에이트기의 변형된 기로 대체될 수 있다. 바람직한 당-변형된 리보뉴클레오티드에서, 2' 모이어티는 H, OR, R, 할로, SH, SR, NH2, NHR, NR2 또는 ON으로부터 선택된 기이고, 여기서 R은 C1-C6 알킬, 알케닐 또는 알키닐이고, 할로는 F, Cl, Br 또는 I이다.
일부 양태에서, 변형된 뉴클레오티드는 당 변형을 함유한다. 당 변형의 비제한적인 예로는 2'-데옥시-2'-플루오로-올리고리보뉴클레오티드(2'-플루오로-2'-데옥시시티딘-5'-트라이포스페이트, 2'-플루오로-2'-데옥시우리딘-5'-트라이포스페이트), 2'-데옥시-2'-데아민 올리고리보뉴클레오티드(2'-아미노-2'-데옥시시티딘-5'-트라이포스페이트, 2'-아미노-2'-데옥시우리딘-5'-트라이포스페이트), 2'-O-알킬 올리고리보뉴클레오티드, 2'-데옥시-2'-C-알킬 올리고리보뉴클레오티드(2'-O-메틸시티딘-5'-트라이포스페이트, 2'-메틸우리딘-5'-트라이포스페이트), 2'-C-알킬 올리고리보뉴클레오티드, 및 이의 이성질체(2'-아라시티딘-5'-트라이포스페이트, 2'-아라우리딘-5'-트라이포스페이트), 아지도트라이포스페이트(2'-아지도-2'-데옥시시티딘-5'-트라이포스페이트, 2'-아지도-2'-데옥시우리딘-5'-트라이포스페이트), 및 이들의 조합이 포함된다.
일부 양태에서, 변형된 가이드 RNA는 하나 이상의 2'-플루오로, 2'-아미노 및/또는 2'-티오 변형을 함유한다. 일부 경우에서, 상기 변형은 2'-플루오로-시티딘, 2'-플루오로-우리딘, 2'-플루오로-아데노신, 2'-플루오로-구아노신, 2'-아미노-시티딘, 2'-아미노-우리딘, 2'-아미노-아데노신, 2'-아미노-구아노신, 2,6-다이아미노퓨린, 4-티오-우리딘, 5-아미노-알릴-우리딘, 5-브로모-우리딘, 5-요오도-우리딘, 5-메틸-시티딘, 리보-티미딘, 2-아미노퓨린, 2'-아미노-부티릴-피렌-우리딘, 5-플루오로-시티딘, 및/또는 5-플루오로-우리딘이다.
96개보다 많은 천연 뉴클레오시드 변형이 포유동물 RNA에서 발견되었다(예를 들어, 문헌[Limbach et al., Nucleic Acids Research, 22(12):2183-2196 (1994)] 참고). 뉴클레오티드 및 변형된 뉴클레오티드 및 뉴클레오시드의 제조는 당업계에 공지되어 있으며, 예를 들어, US 4,373,071, US 4,458,066, US 4,500,707, US 4,668,777, US 4,973,679, US 5,047,524, US 5,132,418, US 5,153,319, US 5,262,530 및 US 5,700,642에 기재되어 있다. 본원에 기재된 바와 같이 사용하기에 적합한 많은 변형 뉴클레오시드 및 변형된 뉴클레오티드가 상업적으로 시판한다. 뉴클레오시드는 천연 뉴클레오시드의 유사체일 수 있다. 일부 경우에서, 상기 유사체는 다이하이드로우리딘, 메틸아데노신, 메틸시티딘, 메틸우리딘, 메틸슈도우리딘, 티오우리딘, 데옥시시토딘 및 데옥시우리딘이다.
일부 경우에서, 본원에 기재된 변형된 가이드 RNA는 핵염기-변형된 리보뉴클레오티드, 즉, 천연 핵염기 대신 하나 이상의 비-천연 핵염기를 함유하는 리보뉴클레오티드를 포함한다. 변형 뉴클레오시드 및 변형된 뉴클레오티드에 혼입될 수 있는 변형된 핵염기의 비제한적인 예로는 다음이 포함된다: m5C(5-메틸시티딘), m5U(5-메틸우리딘), m6A(N6-메틸아데노신), s2U(2-티오우리딘), Um(2'-0-메틸우리딘), m1A(1-메틸아데노신), m2A(2-메틸아데노신), Am(2-1-O-메틸아데노신), ms2m6A(2-메틸티오-N6-메틸아데노신), i6A(N6-이소펜테닐아데노신), ms2i6A(2-메틸티오-N6-이소펜테닐아데노신), io6A(N6-(시스-하이드록시이소펜테닐)아데노신), ms2io6A(2-메틸티오-N6-(시스-하이드록시이소펜테닐)아데노신), g6A(N6-글리시닐카바모일아데노신), t6A(N6-트레오닐카바모일아데노신), ms2t6A(2-메틸티오-N6-트레오닐카바모일아데노신), m6t6A(N6-메틸-N6-트레오닐카바모일아데노신), hn6A(N6-하이드록시노르발릴카바모일아데노신), ms2hn6A(2-메틸티오-N6-하이드록시노르발릴카바모일아데노신), Ar(p)(2'-O-리보실아데노신(포스페이트)), I(이노신), m11(1-메틸이노신), m'Im(1,2'-O-다이메틸이노신), m3C(3-메틸시티딘), Cm(2T-O-메틸시티딘), s2C(2-티오시티딘), ac4C(N4-아세틸시티딘), f5C(5-포밀시티딘), m5Cm(5,2-O-다이메틸시티딘), ac4Cm(N4-아세틸-2TO-메틸시티딘), k2C(라이시딘), m1G(1-메틸구아노신), m2G(N2-메틸구아노신), m7G(7-메틸구아노신), Gm(2'-O-메틸구아노신), m22G(N2,N2-다이메틸구아노신), m2Gm(N2,2'-O-다이메틸구아노신), m22Gm(N2,N2,2'-O-트라이메틸구아노신), Gr(p)(2'-O-리보실구아노신(포스페이트)), yW(와이부토신), o2yW(퍼옥시와이부토신), OHyW(하이드록시와이부토신), OHyW*(저변형된 하이드록시와이부토신), imG(와이오신), mimG(메틸구아노신), Q(케오신), oQ(에폭시케오신), galQ(갈락토실-케오신), manQ(만노실-케오신), preQo(7-시아노-7-데아자구아노신), preQi(7-아미노메틸-7-데아자구아노신), G(아르케오신), D(다이하이드로우리딘), m5Um(5,2'-O-다이메틸우리딘), s4U(4-티오우리딘), m5s2U(5-메틸-2-티오우리딘), s2Um(2-티오-2'-O-메틸우리딘), acp3U(3-(3-아미노-3-카복시프로필)우리딘), ho5U(5-하이드록시우리딘), mo5U(5-메톡시우리딘), cmo5U(우리딘 5-옥시아세트산), mcmo5U(우리딘 5-옥시아세트산 메틸 에스터), chm5U(5-(카복시하이드록시메틸)우리딘)), mchm5U(5-(카복시하이드록시메틸)우리딘 메틸 에스터), mcm5U(5-메톡시카보닐메틸우리딘), mcm5Um(S-메톡시카보닐메틸-2-O-메틸우리딘), mcm5s2U(5-메톡시카보닐메틸-2-티오우리딘), nm5s2U(5-아미노메틸-2-티오우리딘), mnm5U(5-메틸아미노메틸우리딘), mnm5s2U(5-메틸아미노메틸-2-티오우리딘), mnm5se2U(5-메틸아미노메틸-2-셀레노우리딘), ncm5U(5-카바모일메틸우리딘), ncm5Um(5-카바모일메틸-2'-O-메틸우리딘), cmnm5U(5-카복시메틸아미노메틸우리딘), cnmm5Um(5-카복시메틸아미노메틸-2-L-O-메틸우리딘), cmnm5s2U(5-카복시메틸아미노메틸-2-티오우리딘), m62A(N6,N6-다이메틸아데노신), Tm(2'-O-메틸이노신), m4C(N4-메틸시티딘), m4Cm(N4,2-O-다이메틸시티딘), hm5C(5-하이드록시메틸시티딘), m3U(3-메틸우리딘), cm5U(5-카복시메틸우리딘), m6Am(N6,T-O-다이메틸아데노신), m62Am(N6,N6,O-2-트라이메틸아데노신), m2'7G(N2,7-다이메틸구아노신), m2'2'7G(N2,N2,7-트라이메틸구아노신), m3Um(3,2T-O-다이메틸우리딘), m5D(5-메틸다이하이드로우리딘), f5Cm(5-포밀-2'-O-메틸시티딘), m1Gm(1,2'-O-다이메틸구아노신), m'Am(1,2-0-다이메틸아데노신)이리노메틸우리딘), tm5s2U(S-타우리노메틸-2-티오우리딘)), imG-14(4-데메틸 구아노신), imG2(이소구아노신), 또는 ac6A(N6-아세틸아데노신), 하이포잔틴, 이노신, 8-옥소-아데닌, 이의 7-치환된 유도체, 다이하이드로우라실, 슈도우라실, 2-티오우라실, 4-티오우라실, 5-아미노우라실, 5-(C1-C6)-알킬우라실, 5-메틸우라실, 5-(C2-C6)-알케닐우라실, 5-(C2-C6)-알키닐우라실, 5-(하이드록시메틸)우라실, 5-클로로우라실, 5-플루오로우라실, 5-브로모우라실, 5-하이드록시시토신, 5-(C1-C6)-알킬시토신, 5-메틸시토신, 5-(C2-C6)-알케닐시토신, 5-(C2-C6)-알키닐시토신, 5-클로로시토신, 5-플루오로시토신, 5-브로모시토신, N2-다이메틸구아닌, 7-데아자구아닌, 8-아자구아닌, 7-데아자-7-치환된 구아닌, 7-데아자-7-(C2-C6)알키닐구아닌, 7-데아자-8-치환된 구아닌, 8-하이드록시구아닌, 6-티오구아닌, 8-옥소구아닌, 2-아미노퓨린, 2-아미노-6-클로로퓨린, 2,4-다이아미노퓨린, 2,6-다이아미노퓨린, 8-아자퓨린, 치환된 7-데아자퓨린, 7-데아자-7-치환된 퓨린, 7-데아자-8-치환된 퓨린, 및 이들의 조합.
일부 양태에서, 가이드 RNA의 포스페이트 골격(backbone)은 변화된다. 변형된 gRNA는 하나 이상의 포스포로티오에이트, 포스포르아미데이트(예를 들어, N3'-P5'-포스포르아미데이트(NP)), 2'-O-메톡시-에틸(2'MOE), 2'-O-메틸-에틸(2'ME), 및/또는 메틸포스포네이트 연결기를 포함할 수 있다.
특정 양태에서, 가이드 RNA의 가이드 서열의 하나 이상의 변형된 뉴클레오티드 및/또는 스캐폴드 영역의 하나 이상의 변형된 뉴클레오티드는 2'-O-메틸(M) 뉴클레오티드, 2'-O-메틸 3'-포스포로티오에이트(MS) 뉴클레오티드, 2'-O-메틸 3'-포스포노아세테이트(MP) 뉴클레오티드, 2'-O-메틸-3'티오PACE(MSP) 뉴클레오티드 또는 이들의 조합을 포함한다. 일부 경우에서, 가이드 RNA는 하나 이상의 MS 뉴클레오티드를 포함한다. 다른 경우에서, 가이드 RNA는 하나 이상의 MP/MSP 뉴클레오티드를 포함한다. 또 다른 경우에서, 가이드 RNA는 하나 이상의 MS 뉴클레오티드 및 하나 이상의 MP/MSP 뉴클레오티드를 포함한다. 추가적인 경우에서, 가이드 RNA는 M 뉴클레오티드를 포함하지 않는다. 특정한 경우에서, 가이드 RNA는 하나 이상의 MS 뉴클레오티드 및/또는 하나 이상의 MP/MSP 뉴클레오티드를 포함하고, 하나 이상의 M 뉴클레오티드를 추가로 포함한다. 특정한 다른 경우에서, MS 뉴클레오티드 및/또는 MP/MSP 뉴클레오티드는 가이드 RNA에 존재하는 유일한 변형된 뉴클레오티드이다.
일부 양상에서, 본원에 기재된 변형된 가이드 RNA 및 Cas 단백질(또는 이를 인코딩하는 mRNA)은 특정 양, 비율 또는 범위로 조성물(예를 들어, CRISPR/Cas 반응 혼합물)에 존재할 수 있다. 예를 들어, 반응 혼합물은 하기를 포함할 수 있다: a) 1 내지 200 pmol의 가이드 RNA; b) 1 내지 100 pmol의 Cas 단백질, 또는 0.01 내지 3.0 pmol의 Cas 단백질을 인코딩하는 DNA 또는 mRNA; c) 가이드 RNA 및 Cas 단백질(몰비 0.1:1 내지 3:1); 및/또는 d) 1:1 내지 200:1의 몰비의 가이드 RNA 및 Cas 단백질을 인코딩하는 DNA 또는 mRNA. 예를 들어, 일부 양상에서, 반응 혼합물은 복수의 세포; 및 i) 100,000개의 세포당 1 내지 100 pmol의 가이드 RNA(또는 pegRNA) 및/또는 ii) 100,000개의 세포당 1 내지 50 pmol의 Cas 단백질 또는 0.01 내지 3.0 pmol의 Cas 단백질을 인코딩하는 DNA 또는 mRNA를 포함한다. 유사하게, 일부 양상에서, 반응 혼합물은 Cas 단백질을 인코딩하는 DNA 또는 mRNA 1 pmol당 적어도, 약 또는 최대 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190 또는 200 pmol, 또는 전술한 값의 임의의 조합으로 제한되는 범위내의 양의 가이드 RNA를 포함할 수 있다. 일부 양상에서, Cas 단백질을 인코딩하는 DNA 또는 mRNA에 대한 가이드 RNA의 몰비는 적어도, 약 또는 최대 200:1, 190:1, 180:1, 170:1, 160:1, 150:1, 140:1, 130:1, 120:1, 110:1, 100:1, 90:1, 80:1, 70:1, 60:1, 50:1, 40:1, 30:1, 20:1 또는 10:1, 또는 전술한 비율의 조합으로 제한되는 범위내의 비율이다. 일부 양상에서, 본 개시내용에 따른 반응 혼합물은 Cas 단백질 1 pmol당 적어도, 약 또는 최대 1.0, 1.1, 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2.0, 2.1, 2.2, 2.3, 2.4, 2.5, 2.6, 2.7, 2.8, 2.9 또는 3.0 pmol, 또는 전술한 값의 임의의 조합으로 제한되는 범위내의 양의 가이드 RNA를 포함한다.
본원에 기재된 임의의 변형들은 변형된 gRNA의 가이드 서열 및/또는 스캐폴드 영역에 조합 및 혼입될 수 있음을 유의해야 한다.
일부 경우에서, 가이드 RNA는 줄기 루프, 예를 들어, MS2 줄기 루프 또는 테트라루프와 같은 구조적 변형을 또한 포함한다.
가이드 RNA는 당업계에 통상의 기술을 가진 자에게 공지된 임의의 방법에 의해 합성될 수 있다. 변형된 gRNA는 2'-O-티오노카바메이트-보호된 뉴클레오시드 포스포르아미다이트를 사용하여 합성될 수 있다. 방법들은, 예를 들어, 문헌[Dellinger et al., J.American Chemical Society 133, 11540-11556 (2011)]; [Threlfall et al., Organic & Biomolecular Chemistry 10, 746-754 (2012)]; 및 [Dellinger et al., J. American Chemical Society 125, 940-950 (2003)]에 기재되어 있다.
화학적으로 변형된 gRNA 또는 pegRNA는 모든 CRISPR 관련 기술(예컨대, RNA-가이드되는 기술)에 의해 사용될 수 있다. 본원에 기재된 바와 같이, 가이드 RNA는 임의의 조작된 또는 인공 Cas9 폴리펩티드를 포함하여 임의의 Cas 단백질 또는 이의 변이체 또는 단편에 대한 가이드 역할을 할 수 있다. 변형된 gRNA 또는 pegRNA는 생체외 치료 또는 생체내 치료(예컨대, 동물)를 위해 분리된 1차 세포의 DNA 및/또는 RNA 분자를 표적화할 수 있다. 본 문서에 공개된 방법은 게놈 편집, 유전자 조절, 영상화 및 기타 CRISPR 기반 적용례에 적용될 수 있다.
3. 공여체 복구 주형
일부 양태에서, 본 개시내용은 Cas 단백질(예를 들어, Cas9 뉴클레아제) 절단 부위의 양쪽에서 표적 DNA 서열(예를 들어, 표적 유전자 또는 유전자좌)의 부분과 상동성인 2개의 상동성 팔을 포함하는 재조합 공여체 복구 주형을 제공한다. 특정 예에서, 재조합 공여체 복구 주형은 리포터 폴리펩티드(예를 들어, 검출가능한 폴리펩티드, 형광 폴리펩티드 또는 선택 가능한 마커)를 인코딩하는 뉴클레오티드 서열을 포함하는 리포터 카세트, 및 Cas 단백질 절단 부위의 양쪽에 있는 표적 DNA 부분에 리포터 카세트 옆에 있고 상동성인 2개의 상동성 암을 포함한다. 리포터 카세트는 자가절단 펩티드, 하나 이상의 핵 국소화 신호 및/또는 형광 폴리펩티드, 예를 들어, 수퍼폴더 GFP(superfolder GFP, sfGFP)를 인코딩하는 서열을 추가로 포함할 수 있다.
일부 양태에서, 상동성 팔은 길이가 동일하다. 다른 양태에서, 상동성 팔은 길이가 다르다. 상동성 팔은 적어도 약 10개 염기쌍(bp), 예를 들어, 적어도 약 10 bp, 15 bp, 20 bp, 25 bp, 30 bp, 35 bp, 45 bp, 55 bp, 65 bp, 75 bp, 85 bp, 95 bp, 100 bp, 150 bp, 200 bp, 250 bp, 300 bp, 350 bp, 400 bp, 450 bp, 500 bp, 550 bp, 600 bp, 650 bp, 700 bp, 750 bp, 800 bp, 850 bp, 900 bp, 950 bp, 1000 bp, 1.1 킬로베이스(kb), 1.2 kb, 1.3 kb, 1.4 kb, 1.5 kb, 1.6 kb, 1.7 kb, 1.8 kb, 1.9 kb, 2.0 kb, 2.1 kb, 2.2 kb, 2.3 kb, 2.4 kb, 2.5 kb, 2.6 kb, 2.7 kb, 2.8 kb, 2.9 kb, 3.0 kb, 3.1 kb, 3.2 kb, 3.3 kb, 3.4 kb, 3.5 kb, 3.6 kb, 3.7 kb, 3.8 kb, 3.9 kb, 4.0 kb, 또는 그 이상일 수 있다. 상동성 팔은 약 10 bp 내지 약 4 kb, 예를 들어, 약 10 bp 내지 약 20 bp, 약 10 bp 내지 약 50 bp, 약 10 bp 내지 약 100 bp, 약 10 bp 내지 약 200 bp, 약 10 bp 내지 약 500 bp, 약 10 bp 내지 약 1 kb, 약 10 bp 내지 약 2 kb, 약 10 bp 내지 약 4 kb, 약 100 bp 내지 약 200 bp, 약 100 bp 내지 약 500 bp, 약 100 bp 내지 약 1 kb, 약 100 bp 내지 약 2 kb, 약 100 bp 내지 약 4 kb, 약 500 bp 내지 약 1 kb, 약 500 bp 내지 약 2 kb, 약 500 bp 내지 약 4 kb, 약 1 kb 내지 약 2 kb, 약 1 kb 내지 약 2 kb, 약 1 kb 내지 약 4 kb, 또는 약 2 kb 내지 약 4 kb일 수 있다.
공여체 복구 주형은 발현 벡터에 복제될 수 있다. 당업자에게 공지된 통상적인 바이러스 및 비-바이러스 기반 발현 벡터가 사용될 수 있다.
재조합 공여체 복구 주형 대신 단일 가닥 올리고데옥시뉴클레오티드(ssODN) 공여체 주형을 상동 재조합 매개 복구에 사용할 수 있다. ssODN은 표적 DNA내에 짧은 변형을 도입하는 데 유용하다. 예를 들어, ssODN은 SNP와 같은 유전적 돌연변이를 정확하게 변형하는 데 적합하다. ssODN은 Cas 단백질 절단 표적 부위의 각각의 측면에 2개의 플랭킹(flanking) 상동 서열을 포함할 수 있으며 표적 DNA에 대해 센스 또는 안티센스 방향으로 배향될 수 있다. 각각의 플랭킹 서열은 적어도 약 10개 염기쌍(bp), 예를 들어, 적어도 약 10 bp, 15 bp, 20 bp, 25 bp, 30 bp, 35 bp, 40 bp, 45 bp, 50 bp, 55 bp, 60 bp, 65 bp, 70 bp, 75 bp, 80 bp, 85 bp, 90 bp, 95 bp, 100 bp, 150 bp, 200 bp, 250 bp, 300 bp, 350 bp, 400 bp, 450 bp, 500 bp, 550 bp, 600 bp, 650 bp, 700 bp, 750 bp, 800 bp, 850 bp, 900 bp, 950 bp, 1 kb, 2 kb, 4 kb, 또는 그 이상일 수 있다. 일부 양태에서, 각각의 상동성 팔은 약 10 bp 내지 약 4 kb, 예를 들어, 약 10 bp 내지 약 20 bp, 약 10 bp 내지 약 50 bp, 약 10 bp 내지 약 100 bp, 약 10 bp 내지 약 200 bp, 약 10 bp 내지 약 500 bp, 약 10 bp 내지 약 1 kb, 약 10 bp 내지 약 2 kb, 약 10 bp 내지 약 4 kb, 약 100 bp 내지 약 200 bp, 약 100 bp 내지 약 500 bp, 약 100 bp 내지 약 1 kb, 약 100 bp 내지 약 2 kb, 약 100 bp 내지 약 4 kb, 약 500 bp 내지 약 1 kb, 약 500 bp 내지 약 2 kb, 약 500 bp 내지 약 4 kb, 약 1 kb 내지 약 2 kb, 약 1 kb 내지 약 2 kb, 약 1 kb 내지 약 4 kb, 또는 약 2 kb 내지 약 4 kb이다. ssODN은 적어도 약 25개의 뉴클레오티드(nt), 예를 들어, 적어도 약 25 nt, 30 nt, 35 nt, 40 nt, 45 nt, 50 nt, 55 nt, 60 nt, 65 nt, 70 nt, 75 nt, 80 nt, 85 nt, 90 nt, 95 nt, 100 nt, 150 nt, 200 nt, 250 nt, 300 nt, 또는 그 이상 길이일 수 있다. 일부 양태에서, ssODN은 약 25 내지 약 50 nt; 약 50 내지 약 100 nt; 약 100 내지 약 150 nt; 약 150 내지 약 200 nt; 약 200 내지 약 250 nt; 약 250 내지 약 300 nt; 또는 약 25 내지 약 300 nt 길이이다.
일부 양태에서, ssODN 주형은 하나 이상, 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 200, 300, 400, 500개 또는 그 이상의 본원에 기재된 변형된 뉴클레오티드를 포함한다. 일부 예에서, ssODN 서열의 적어도 1%, 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 99%는 변형된 뉴클레오티드를 포함한다. 일부 양태에서, 변형된 뉴클레오티드는 ssODN의 말단 단부 중 하나 또는 둘 다에 위치한다. 변형된 뉴클레오티드는 제1, 제2, 제3, 제4, 제5, 제6, 제7, 제8, 제9 또는 제10 말단 뉴클레오티드 또는 이들의 임의의 조합에 있을 수 있다. 예를 들어, 변형된 뉴클레오티드는 ssODN 주형의 양쪽 말단에서의 3개의 말단 뉴클레오티드에 있을 수 있다. 추가적으로, 변형된 뉴클레오티드는 말단 단부의 내부에 위치할 수 있다.
일부 양상(예컨대, 프라임 편집)에서는, 외인성 DNA 복구 주형이 필요하지 않다. 예를 들어, 본원에 기재된 변형된 pegRNA는 표적 핵산의 프라임 편집을 수행할 때 프라임 편집자 Cas 단백질에 의해 주형으로 사용되는 표적 핵산에 대한 하나 이상의 편집물을 포함하는 역전사효소 서열을 (예를 들어, 프라이머 결합 부위 서열에 근접한 3' 말단에) 포함한다.
4. 표적 DNA
CRISPR/Cas 시스템에서, 표적 DNA 서열에 프로토스페이서 인접 모티프(PAM) 서열이 바로 뒤따를 수 있다. 표적 DNA 부위는 사용된 Cas 단백질의 세균 종에 특이적인 PAM 서열의 5'에 인접하여 위치할 수 있다. 예를 들어, 스트렙토코커스 피오게네스-유래 Cas9의 PAM 서열은 NGG이고; 나이세리아 메닌지티디스-유래 Cas9의 PAM 서열은 NNNNGATT; 스트렙토코커스 써모필루스-유래 Cas9의 PAM 서열은 NNAGAA이고; 트레포네마 덴티콜라-유래 Cas9의 PAM 서열은 NAAAAC이다. 일부 양태에서, PAM 서열은 5'-NGG(여기서, N은 임의의 뉴클레오티드임); 5'-NRG(여기서, N은 임의의 뉴클레오티드이고, R은 퓨린임); 또는 5'-NNGRR(여기서, N은 임의의 뉴클레오티드이고, R은 퓨린임)일 수 있다. 스트렙토코커스 피오게네스 시스템의 경우, DNA-표적화 RNA(예를 들어, 변형된 gRNA)의 가이드 서열이 반대 가닥과 염기쌍을 형성하여 PAM 서열의 약 3-염기쌍 위쪽에서 절단되는 것을 매개하도록, 선택된 표적 DNA 서열은 5'-NGG PAM(여기서, N은 임의의 뉴클레오티드임)의 바로 앞에 위치(예를 들어, 5'에 위치)해야 한다.
일부 양태에서, DNA-표적화 RNA(예를 들어, 가이드 RNA)의 가이드 서열과 이의 상응하는 표적 DNA 서열 사이의 상보성 정도는, 적절한 정렬 알고리즘을 사용하여 최적으로 정렬될 때, 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상이다. 최적 정렬은 서열을 정렬시키기 위한 임의의 적절한 알고리즘을 사용하여 결정될 수 있으며, 상기 알고리즘의 비제한적인 예로는 스미스-워터만 알고리즘, 니들만-분쉬 알고리즘, 버로우즈-휠러 변환을 기반으로 하는 알고리즘(예를 들어, 버로우즈 휠러 정렬자), ClustalW, Clustal X, BLAT, Novoalign(노보크래프트 테크놀로지스, 셀랑고르, 말레이시아), 및 ELAND(일루미나, 미국 캘리포니아주 샌디에이고)가 포함된다.
표적 DNA 부위는 ZiFiT Targeter 소프트웨어(문헌[Sander et al., 2007, Nucleic Acids Res, 35:599-605]; [Sander et al., 2010, Nucleic Acids Res, 38:462-468]), E-CRISP(문헌[Heigwer et al., 2014, Nat Methods, 11:122-123]), RGEN Tools(문헌[Bae et al., 2014, Bioinformatics, 30(10):1473-1475]), CasFinder(문헌[Aach et al., 2014, bioRxiv]), DNA2.0 gNRA Design Tool(DNA2.0, 미국 캘리포니아주 멘로파크) 및 CRISPick Design Tool(브로드 인스티튜트(Broad Institute), 미국 매사추세츠주 케임브리지)과 같은 웹-기반 소프트웨어를 사용하여 사전정의된 게놈 서열(유전자)에서 선택될 수 있다. 상기 도구들은 게놈 서열(예를 들어, 관심대상인 유전자 또는 유전자좌)을 분석하고 유전자 편집에 적합한 표적 부위를 확인한다. 각각의 DNA-표적화 RNA(예를 들어, 변형된 gRNA)에 대한 표적이탈 유전자 변형을 평가하기 위해, 표적이탈 부위의 컴퓨터에 의한 예측은 염기쌍 형성 불일치 존재, 위치 및 분포의 정량적 특이성 분석을 기반으로 이루어진다.
5. 유전자 발현 조절
CRISPR/Cas 시스템은 유전자 발현을 억제하거나 유전자 발현을 활성화하는 것과 같이 유전자 발현을 조절하는 데 사용될 수 있다. 비제한적인 예로서, Cas9 변이체 또는 단편과 표적 DNA 서열에 결합할 수 있는 gRNA를 포함하는 복합체는 RNA 중합효소에 의한 전사 개시 및/또는 신장을 차단하거나 방해할 수 있다. 이는 결국 표적 DNA의 유전자 발현을 억제하거나 억압할 수 있다. 다르게는, 상이한 Cas9 변이체 또는 단편과 표적 DNA 서열에 결합할 수 있는 gRNA를 포함하는 복합체는 표적 DNA의 유전자 발현을 유도하거나 활성화할 수 있다.
유전자 발현을 불활성화하거나 감소시키기 위해 CRISPR 간섭(CRISPRi)을 수행하는 방법에 대한 자세한 설명은, 예를 들어, 문헌[Larson et al., Nature Protocols, 2013, 8(11):2180-2196], 및 [Qi et al., Cell, 152, 2013, 1173-1183]에서 찾을 수 있다. CRISPRi에서 gRNA-Cas9 변이체 복합체는 단백질 인코딩 영역의 비주형 가닥에 결합하여 전사 신장을 차단할 수 있다. 일부 경우, gRNA-Cas9 변이체 복합체가 유전자의 프로모터 영역에 결합할 때, 복합체가 전사 개시를 방지하거나 방해한다.
유전자 발현을 증가시키기 위해 CRISPR 활성화를 수행하는 방법에 대한 자세한 설명은, 예를 들어, 문헌[Cheng et al., Cell Research, 2013, 23:1163-1171], [Konerman et al., Nature, 2015, 517:583-588], 및 US 8,697,359에서 찾을 수 있다.
CRISPR 기반 유전자 발현 제어를 위해, 엔도뉴클레오타이드 활성이 결여된 Cas 단백질(예컨대, Cas9 폴리펩티드)의 촉매적으로 불활성인 변이체를 사용할 수 있다. 일부 양태에서, Cas 단백질은 RuvC 유사 및 HNH 뉴클레아제 도메인에 2개 이상의 점 돌연변이를 포함하는 Cas9 변이체이다. 일부 양태에서, Cas9 변이체는 dCas9로 지칭되는 D10A 및 H840A 아미노산 치환을 갖는다(문헌[Jinek et al., Science, 2012, 337:816-821]; [Qi et al., Cell, 152(5):1173-1183]). 일부 경우에, 스트렙토코커스 피오게네스의 dCas9 폴리펩티드는 위치 D10, G12, G17, E762, H840, N854, N863, H982, H983, A984, D986, A987 또는 이들의 임의의 조합에 하나 이상의 돌연변이를 포함한다. 이러한 dCas9 폴리펩티드 및 이의 변이체에 대한 설명은, 예를 들어, WO 2013/176772에 제공된다. dCas9 효소는 D10, E762, H983 또는 D986의 돌연변이, 및 H840 또는 N863의 돌연변이를 함유할 수 있다. 일부 경우, dCas9 효소는 D10A 또는 D10N 돌연변이를 함유한다. 또한, dCas9 효소는 H840A, H840Y 또는 H840N을 포함할 수 있다. 일부 경우, dCas9 효소가 D10A 및 H840A; D10A 및 H840Y; D10A 및 H840N; D10N 및 H840A; D10N 및 H840Y; 또는 D10N 및 H840N 치환을 포함한다. 상기 치환은 Cas9 폴리펩티드를 촉매적으로 불활성화하고 표적 DNA에 결합할 수 있도록 하는 보존적 또는 비보존적 치환일 수 있다.
특정 양태에서, dCas9 폴리펩티드는 뉴클레아제 활성에 결함이 있는 것과 같이 촉매적으로 불활성이다. 일부 경우, dCas9 효소 또는 이의 변이체나 단편이 표적 서열의 전사를 차단할 수 있고, 일부 경우, RNA 중합효소를 차단할 수 있다. 다른 경우에, dCas9 효소 또는 이의 변이체 또는 단편은 표적 서열의 전사를 활성화할 수 있다.
특정 양태에서, 내핵분해 활성이 결여된 Cas9 변이체(예를 들어, dCas9)는 전사 억제 도메인, 예를 들어, Kruppel 관련 박스(KRAB) 도메인, 또는 전사 활성화 도메인, 예를 들어, VP16 전사활성화 도메인에 융합될 수 있다. 일부 양태에서, Cas9 변이체는 dCas9와 전사 인자, 예를 들어, RNA 중합효소 오메가 인자, 열 충격 인자 1 또는 이의 단편을 포함하는 융합 폴리펩티드이다. 다른 양태에서, Cas9 변이체는 dCas9와 DNA 메틸라제, 히스톤 아세틸라제 또는 이의 단편을 포함하는 융합 폴리펩티드이다.
RNA 결합 및/또는 RNA 절단에 의해 매개되는 유전자 발현의 CRISPR 기반 제어를 위해, 예를 들어, 문헌[O'Connell et al., Nature, 2014, 516:263-266]에 기재된 바와 같이, 엔도리보뉴클레아제 활성을 갖는 적합한 Cas 단백질(예컨대, Cas9 폴리펩티드) 변이체가 사용될 수 있다. 다른 유용한 Cas 단백질(예를 들어, Cas9) 변이체는, 예를 들어, US 9,745,610에 기재되어 있다. RNA를 절단할 수 있는 다른 CRISPR 관련 효소는 Csy4 엔도리보뉴클레아제, CRISPR 관련 Cas6 효소, Cas5 계열 구성원 효소, Cas6 계열 구성원 효소, 유형 I CRISPR 시스템 엔도리보뉴클레아제, 유형 II CRISPR 시스템 엔도리보뉴클레아제, 유형 III CRISPR 시스템 엔도리보뉴클레아제 및 이의 변이체를 포함한다.
CRISPR 기반 RNA 절단의 일부 양태에서, PAM 서열(예컨대, PAMmer)을 함유하는 DNA 올리고뉴클레오티드는 단일 가닥 RNA 전사물에 결합하고 절단하기 위해 본 문서에 기재된 변형된 gRNA 및 Cas 단백질(예컨대, Cas9) 변이체와 함께 사용된다. 적합한 PAMmer 서열의 상세한 설명은, 예를 들어, 문헌[O'Connell et al., Nature, 2014, 516:263-266]에서 찾을 수 있다.
일부 양태에서, 복수의 변형된 gRNA 및/또는 pegRNA는 표적 유전자의 유전자 발현을 조절하기 위해 표적 유전자의 상이한 영역을 표적화하는 데 사용된다. 복수의 변형된 gRNA 및/또는 pegRNA는 각각의 변형된 gRNA 단독에 비해 단일 표적 유전자의 유전자 발현의 상승적 조절(예를 들어, 억제 또는 활성화)을 제공할 수 있다. 다른 양태에서, 복수의 변형된 gRNA/pegRNA는 2개 이상의 상이한 표적 유전자의 유전자 발현을 조절하는 데 사용된다.
B. 생체외 세포
본 발명의 방법의 일부 양상에서, 표적 서열은 세포내에 있다. 본 발명의 방법은 1차 세포, 불멸화된 세포, 세포주로부터의 세포, 세포 배양물로부터의 세포 등을 포함하여 임의의 관심 세포에서 핵산의 표적 서열을 편집, 조절, 절단, 닉 생성 또는 결합하는 데 사용될 수 있다. 일부 양태에서, 세포는 하나 이상의 조건을 갖는 세포 유형이다. 예를 들어, 높은 뉴클레아제(예컨대, 리보뉴클레아제, 엑소뉴클레아제, 엑소리보뉴클레아제) 발현, 농도 및/또는 활성을 갖는 세포, 예를 들어, 특정 뉴클레아제가 높은 세포 유형이다.
본원에 개시된 조성물 및 방법은 관심 1차 세포에서 표적 핵산의 발현을 편집하거나 조절하는 데 사용될 수 있다. 1차 세포는 임의의 다세포 유기체로부터 단리된 세포, 예를 들어, 식물 세포(예컨대, 쌀 세포, 밀 세포, 토마토 세포, 애기장대(Arabidopsis thaliana) 세포, 옥수수(Zea mays) 세포 등), 다세포 원생생물로부터의 세포, 다세포 진균으로부터의 세포, 무척추 동물(예를 들어, 과실파리, 자포동물, 극피동물, 선충 등)로부터의 세포 또는 척추 동물(예를 들어, 어류, 양서류, 파충류, 조류, 포유동물 등)로부터의 세포와 같은 동물 세포, 인간으로부터의 세포, 건강한 인간으로부터의 세포, 인간 환자로부터의 세포, 암 환자로부터의 세포 등일 수 있다. 일부 경우에서, 게놈 편집물 또는 유도된 유전자 조절을 갖는 1차 세포는 대상(예를 들어, 환자)에게 이식될 수 있다. 예를 들어, 1차 세포는 치료될 대상(예를 들어, 환자)으로부터 유도될 수 있다.
줄기 세포, 예를 들어, 배아 줄기 세포, 유도 만능 줄기 세포, 성인 줄기 세포(예컨대, 중간엽 줄기 세포, 신경 줄기 세포, 조혈 줄기 세포, 장기 줄기 세포), 전구 세포, 체세포(예컨대, 섬유아세포, 간세포(hepatocyte), 심장 세포, 간 세포(liver cell), 췌장 세포, 근육 세포, 피부 세포, 혈액 세포, 신경 세포, 면역 세포), 및 몸, 예를 들어, 인체의 임의의 다른 세포와 같은 임의의 유형의 1차 세포가 유리할 수 있다. 1차 세포는 전형적으로 대상, 예를 들어, 동물 대상 또는 인간 대상으로부터 유도될 수 있으며, 제한된 계대수동안 시험관내에서 성장될 수 있다. 일부 양태에서, 상기 세포는 질환 세포이거나, 질환을 갖는 대상으로부터 유도된다. 예를 들어, 상기 세포는 암 또는 종양 세포일 수 있다.
1차 세포는 임의의 표준 방법에 의해 대상으로부터 채취될 수 있다. 예를 들어, 피부, 근육, 골수, 비장, 간, 신장, 췌장, 폐, 장, 위 등과 같은 조직으로부터의 세포는 조직 생검 또는 세침 흡인에 의해 채취될 수 있다. 혈액 세포 및/또는 면역 세포는 전혈, 혈장 또는 혈청으로부터 단리될 수 있다. 일부 경우에서, 적합한 1차 세포로는 말초혈 단핵 세포(PBMC), 말초혈 림프구(PBL), 및 T 세포, 자연 살해 세포, 단핵구, 자연 살해 T 세포, 단핵구-전구체 세포, 조혈 줄기 및 전구 세포(HSPC), 예를 들어, CD34+ HSPC, 또는 비-만능 줄기 세포와 같은(이로 한정되지는 않는다) 다른 혈액 세포 부분군이 포함된다. 일부 경우에서, 상기 세포는 종양 침윤 세포(TIL), CD3+ T 세포, CD4+ T 세포, CD8+ T 세포, 또는 임의의 다른 유형의 T 세포와 같은 임의의 T 세포를 포함하나 이로 한정되지는 않는 임의의 면역 세포일 수 있다. T 세포는 또한 기억 T 세포, 기억 줄기 T 세포, 또는 효과기 T 세포를 포함할 수 있다. T 세포는 또한 특정 집단 및 표현형으로 편중될 수 있다. 예를 들어, T 세포는 표현형으로 CD45RO(-), CCR7(+), CD45RA(+), CD62L(+), CD27(+), CD28(+) 및/또는 IL-7Ra(+)를 포함하도록 편중될 수 있다. CD45RO(-), CCR7(+), CD45RA(+), CD62L(+), CD27(+), CD28(+) 및/또는 IL-7Ra(+)를 포함한 목록으로부터 선택된 하나 이상의 마커를 포함하는 적절한 세포가 선택될 수 있다. 유도 만능 줄기 세포는, 예를 들어, US 7,682,828, US 8,058,065, US 8,530,238, US 8,871,504, US 8,900,871 및 US 8,791,248에 기재된 표준 프로토콜에 따라서 분화 세포로부터 생성될 수 있다.
C. 생체외 치료
본원에 기재된 방법은 생체외 치료에 사용될 수 있다. 생체외 치료는 유기체 밖에서 생성되거나 변형된 조성물(예를 들어, 세포)을 대상(예를 들어, 환자)에게 투여하는 것을 포함할 수 있다. 일부 양태에서, 상기 조성물(예를 들어, 세포를 포함함)은 본원에 개시된 방법에 의해 생성되거나 변형될 수 있다. 예를 들어, 생체외 치료는 유기체 밖에서 생성되거나 변형된 1차 세포를 대상(예를 들어, 환자)에게 투여하는 것을 포함할 수 있으며, 이때 상기 1차 세포는, 1차 세포내 표적 핵산을 하나 이상의 본원에 기재된 변형된 gRNA 및 Cas 단백질(예를 들어, Cas9 폴리펩티드) 또는 이의 변이체 또는 단편, Cas 단백질(예를 들어, Cas9 폴리펩티드)을 인코딩하는 mRNA 또는 이의 변이체 또는 단편, 또는 Cas 단백질(예를 들어, Cas9 폴리펩티드)을 인코딩하는 뉴클레오티드 서열 또는 이의 변이체 또는 단편을 포함하는 재조합 발현 벡터와 접촉시키는 것을 포함하는 본 발명의 방법에 따라서 시험관내에서 배양 및 편집/조절하였다.
일부 양태에서, 조성물(예를 들어, 세포)은 생체외 치료에 의해 치료될 대상(예를 들어, 환자)으로부터 유도될 수 있다. 일부 양태에서, 생체외 치료는 세포-기반 치료, 예를 들어, 입양 면역치료를 포함할 수 있다.
일부 양태에서, 생체외 치료에 사용되는 조성물은 세포일 수 있다. 상기 세포는 말초혈 단핵 세포(PBMC), 말초혈 림프구(PBL), 및 기타 혈액 세포 부분군을 포함하나 이로 한정되지는 않는 1차 세포일 수 있다. 1차 세포는 면역 세포일 수 있다. 1차 세포는 T 세포(예를 들어, CD3+ T 세포, CD4+ T 세포, 및/또는 CD8+ T 세포), 자연 살해 세포, 단핵구, 자연 살해 T 세포, 단핵구-전구체 세포, 조혈 줄기 세포 또는 비-만능 줄기 세포, 줄기 세포 또는 전구 세포일 수 있다. 1차 세포는 CD34+ HSPC와 같은 조혈 줄기 또는 전구 세포(HSPC)일 수 있다. 1차 세포는 인간 세포일 수 있다. 1차 세포는 단리되고, 선별되고/되거나 배양될 수 있다. 1차 세포는 생체 외에서 증식될 수 있다. 1차 세포는 생체내에서 증식될 수 있다. 1차 세포는 CD45RO(-), CCR7(+), CD45RA(+), CD62L(+), CD27(+), CD28(+), 및/또는 IL-7Rα(+)일 수 있다. 1차 세포는 세포를 수용하는 대상에게 자가유래성일 수 있다. 또는, 1차 세포는 대상에게 비-자가유래성일 수 있다. 1차 세포는 우수 제조 기준(GMP) 상용성 시약일 수 있다. 1차 세포는 암, 감염, 자가면역 질환 또는 이식편-대-숙주 질환(GVHD)을 포함한 질환들을 갖거나 위험에 있는 대상에서 이러한 질환들을 치료하기 위한 병용 치료의 일부일 수 있다.
생체외 치료의 비제한적인 예로서, 1차 세포는 1차 세포내의 표적 핵산을 Cas 단백질 및 변형된 gRNA와 접촉시키기 전에 다세포 유기체(예를 들어, 식물, 다세포 원생생물, 다세포 진균, 무척추 동물, 척추 동물, 예컨대 인간 등)로부터 단리될 수 있다. 표적 핵산을 Cas 단백질 및 가이드 RNA와 접촉시킨 후, 1차 세포 또는 이의 자손세포(예를 들어, 1차 세포로부터 유도된 세포)는 다세포 유기체로 복귀될 수 있다.
일부 양태에서, Cas 단백질 및 가이드 RNA는, 예컨대 혈청-함유 유체로의 도입 또는 살아있는 유기체(예를 들어, 전혈, 혈장 또는 혈청)로부터의 도입에 의해 살아있는 유기체에 도입된다.
D. 표적
세포내에
핵산 및/또는 폴리펩티드를 도입하는 방법
표적 세포(숙주 세포)내에 폴리펩티드 및 핵산을 도입하는 방법은 당업계에 공지되어 있으며, 본 발명에서, 핵산(예를 들어, Cas 단백질을 인코딩하는 뉴클레오티드 서열, 변형된 가이드 RNA, 상동성 지향 복구(HDR) 등을 위한 공여체 복구 주형), 폴리펩티드(예컨대, Cas 단백질, 중합효소, 데아미나제 등) 또는 RNP(예컨대, gRNA/Cas 단백질 복합체)를 세포, 예를 들어, 1차 세포, 예컨대 줄기 세포, 전구 세포, 또는 분화된 세포에 도입하는 데 사용될 수 있다. 적절한 방법의 비제한적인 예로는 전기천공, 바이러스 또는 박테리오파지 감염, 형질감염, 미세주입, 접합, 원형질체 융합, 리포펙션, 인산칼슘 침전, 폴리에틸렌이민(PEI)-매개 형질감염, DEAE-덱스트란 매개 형질감염, 리포좀-매개 형질감염, 입자 총 기술, 인산칼슘 침전, 직접 미세주입, 나노입자-매개 전달(예컨대, 액체 나노입자-매개 전달, 중합체 나노입자-매개 전달, 하이브리드 지질-고분자 나노입자-매개 전달) 등이 포함된다.
일부 양태에서, CRISPR 시스템의 성분들은 전달 시스템을 이용하여 세포내에 도입될 수 있다. 특정한 경우에서, 상기 전달 시스템은 나노입자, 미세입자(예를 들어, 중합체 미세중합체), 리포좀, 미셀, 비로좀, 바이러스 입자, 바이러스-유사 입자(VLP), 핵산 복합체, 형질감염제, 전기천공제(예를 들어, 네온(NEON) 형질감염 시스템 이용), 핵내도입제, 리포펙션제, 및/또는 전달될 성분을 포함하는 완충 시스템을 포함한다. 예를 들어, 상기 성분들은 양이온성 서브미크론(submicron) 수중유적형 유화액내에 캡슐화되거나 패키징되도록 리포펙션제와 혼합될 수 있다. 또는, 상기 성분들은 전달 시스템없이, 예를 들어, 수용액으로서 전달될 수 있다.
리포좀을 제조하고 리포좀내에 폴리펩티드 및 핵산을 캡슐화하는 방법은, 예를 들어, 문헌[Methods and Protocols, Volume 1: Pharmaceutical Nanocarriers: Methods and Protocols. (ed. Weissig). Humana Press, 2009] 및 [Heyes et al. (2005) J Controlled Release 107:276-87]에 기재되어 있다. 미세입자를 제조하고 폴리펩티드 및 핵산을 캡슐화하는 방법은, 예를 들어, 문헌[Functional Polymer Colloids and Microparticles volume 4 (Microspheres, microcapsules & liposomes). (eds. Arshady & Guyot). Citus Books, 2002] 및 [Microparticulate Systems for the Delivery of Proteins and Vaccines. (eds. Cohen & Bernstein). CRC Press, 1996]에 기재되어 있다. 나노입자, 예컨대, 지질, 중합체 또는 하이브리드 지질-중합체 나노입자의 제조에 대한 리뷰를 위해 문헌[Advanced Drug Delivery Reviews 2021, Volume 168]을 참고한다.
E. 게놈 편집 효율을 평가하는 방법
정확한 게놈 편집 변형의 존재를 기능적으로 시험하기 위해, 표적 DNA를 당업계의 전문가들에게 공지된 표준 방법에 의해 분석할 수 있다. 예를 들어, indel 돌연변이는 SURVEYOR® 돌연변이 검출 키트(Integrated DNA Technologies, 미국 아이오와주 코럴빌) 또는 Guide-it™ indel 확인 키트(Guide-it™ Indel Identification Kit)(Clontech), 미국 캘리포니아주 마운틴뷰)를 사용하여 시퀀싱에 의해 확인할 수 있다. 상동성 지향 복구(HDR), 염기 편집 또는 프라임 편집-매개 편집물은 시퀀싱 또는 RFLP 분석과 함께 PCR-기반 방법에 의해 검출할 수 있다. PCR-기반 키트의 비제한적인 예로는 Guide-it 돌연변이 검출 키트(Guide-it Mutation Detection Kit)(Clontech) 및 GeneArt® 게놈 절단 검출 키트(GeneArt® Genomic Cleavage Detection Kit)(Life Technologies, 미국 캘리포니아주 칼즈배드)가 포함된다. 심층 시퀀싱도 또한, 특히 많은 수의 샘플 또는 잠재적인 표적/표적이탈 부위에 사용될 수 있다.
특정 양태에서, 게놈 편집의 효율(예를 들어, 특이성)은 표적적중 및 표적이탈 경우를 포함하여 모든 게놈 편집 경우의 수 또는 %에 대한 표적적중 게놈 편집 경우의 수 또는 %에 상응한다. 일부 양태에서, 표적 영역의 편집의 효율성은 단일 세포 또는 세포 집단 수준에서 해당 표적 영역의 예상되는 편집 수에 상응한다.
일부 양태에서, 본원에 기재된 변형된 gRNA는 상응하는 비변형된 gRNA에 비해 1차 세포와 같은 세포내 표적 DNA 서열의 게놈 편집을 증대시킬 수 있다. 게놈 편집은 상동성 지향 복구(HDR)(예컨대, 삽입, 삭제 또는 점 돌연변이), 프라임 편집, 염기 편집 또는 비상동 말단 접합(NHEJ)을 포함할 수 있다.
특정 양태에서, 세포내 표적 DNA 서열의 뉴클레아제-매개 게놈 편집 효율은 상응하는 비변형된 gRNA 서열에 비해 본원에 기재된 가이드 RNA의 존재하에서 적어도 약 5%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 0.5배, 0.6배, 0.7배, 0.8배, 0.9배, 1배, 1.1배, 1.2배, 1.3배, 1.4배, 1.5배, 2배, 2.5배, 3배, 3.5배, 4배, 4.5배, 5배, 5.5배, 6배, 6.5배, 7배, 7.5배, 8배, 8.5배, 9배, 9.5배, 10배, 15배, 20배, 25배, 30배, 35배, 40배, 45배 또는 50배 이상만큼 증대된다. 일부 다른 양태에서, 효율은 상이한 변형을 갖는 상응하는 gRNA와 비교되며, 상기 기재된 향상 수준을 달성한다. 예를 들어, 5' 말단에 1x, 2x 또는 3x MS, 및 3' 말단에 2x, 3x 또는 4x MP 또는 MSP를 갖는 gRNA는 MP/MSP(예컨대, 5' 말단의 1x, 2x 또는 3x MS 및 3' 말단의 2x, 3x 또는 4x MS) 대신에 동일한 수의 MS를 갖는 gRNA와 비교될 수 있다.
F. 대상체에서 유전 질환을 예방 또는 치료하는 방법
변형된 gRNA는 유전자 질환의 표적화 뉴클레아제-기반 치료에 적용될 수 있다. 1차 환자 세포의 게놈내 유전자 돌연변이를 정밀하게 교정하기 위한 현행 접근방법들은 매우 비효율적일 수 있다(종종 1% 미만의 세포들이 정밀하게 편집될 수 있음). 본원에 기재된 변형된 gRNA는 게놈 편집 활성을 증대시키고 게놈 편집-기반 치료의 효능을 증가시킬 수 있다. 특정 양태에서, 변형된 gRNA는 유전자 질환을 갖는 대상에서 유전자의 생체내 유전자 편집에 사용될 수 있다. 변형된 gRNA는 임의의 적합한 투여 경로를 통해서 및 뉴클레아제-기반 치료의 효과를 증대(예를 들어, 게놈 편집 효율을 개선)시키기에 충분한 용량 또는 양으로 대상에게 투여될 수 있다.
본원에서는 질환과 연관된 유전자 돌연변이를 교정함으로써 그를 필요로 하는 대상에서 유전자 질환을 예방하거나 치료하는 방법이 제공된다. 상기 방법은 대상에게 본원에 기재된 변형된 가이드 RNA를 돌연변이를 교정하기에 충분한 양으로 투여하는 것을 포함한다. 본원에서는 또한 질환과 연관된 유전자 돌연변이를 교정함으로써 그를 필요로 하는 대상에서 유전자 질환을 예방하거나 치료하기 위한 약제의 제조에 있어서 본원에 기재된 변형된 가이드 RNA의 용도가 제공된다. 변형된 가이드 RNA는 Cas 단백질(예를 들어, Cas9 폴리펩티드), Cas 단백질을 인코딩하는 mRNA, 또는 Cas 단백질을 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 발현 벡터를 또한 포함하는 조성물에 함유될 수 있다. 일부 경우에, 변형된 가이드 RNA는 상기 기재된 전달 시스템에 포함된다.
상기 방법에 의해 교정될 수 있는 유전자 질환으로는 X 염색체-관련 중증 복합 면역 결핍, 겸상적혈구 빈혈증, 지중해빈혈, 혈우병, 종양형성, 암, 노인성 황반 변성, 조현병, 트라이뉴클레오티드 반복 장애, 취약 X 증후군, 프리온-관련 장애, 근위축성 측색 경화증, 약물 남용, 자폐증, 알츠하이머 질환, 파킨슨 질환, 낭성 섬유증, 혈액 및 응고 질환 또는 장애, 염증, 면역-관련 질환 또는 장애, 대사 질환, 간 질환 및 장애, 신장 질환 및 장애, 근육/골격 질환 및 장애(예를 들어, 근이영양증, 듀켄(Duchenne)씨 근이영양증), 신경학 및 신경 질환 및 장애, 심혈관 질환 및 장애, 폐 질환 및 장애, 눈 질환 및 장애, 바이러스 감염(예를 들어, HIV 감염) 등이 포함되나, 이로 한정되지는 않는다.
실시예
본 교시의 양상은 다음 실시예에 비추어 더 잘 이해될 수 있으며, 이는 어떤 방식으로든 본 발명의 교시의 범주를 한정하는 것으로 해석되어서는 안된다.
다양한 일반적인 방법 및 시약이 하기 실시예에서 사용되었으며, 실시예의 이해를 돕기 위해 하기 기재되지만, 제조, 시험 및 기타 세부사항의 변형 및 대안이 본원의 교시에 따라 사용될 수 있다는 것을 이해해야 한다.
gRNA 및 mRNA의 제조. RNA 올리고머는 앞서 기재된 절차에 따라 제어된 세공(pore) 유리(LGC)에서 2'-O-티오노카바메이트로 보호된 뉴클레오시드 포스포르아미다이트(Sigma-Aldrich 및 Hongene)를 사용하여 Dr. Oligo 48 및 96 합성기(Biolytic Lab Performance Inc.)에서 합성하였다. MP 변형 RNA의 합성에 사용된 2'-O-메틸-3'-O-(다이이소프로필아미노)-포스피노아세트산-1,1-다이메틸시아노에틸 에스터-5'-O-다이메톡시트리틸 뉴클레오시드는 Glen Research 및 Hongene에서 구입하였다. 포스포로티오에이트 함유 올리고머의 경우, 커플링 반응 후 요오드 산화 단계를, 피리딘-아세토니트릴(3:2) 혼합물 중 3-((N,N-다이메틸아미노메틸리덴)아미노)-3H-1,2,4-다이티아졸-5-티온의 0.05 M 용액을 6분 동안 사용하는 황화 단계로 대체하였다. 달리 명시하지 않는 한, 고체상 RNA 합성용 시약은 Glen Research 및 Honeywell에서 구입하였다. MP 변형된 gRNA에 혼입된 포스포노아세테이트 변형을 상기 시판되는 보호된 뉴클레오시드 포스피노아미다이트 단량체를 사용하여 선행 문헌(상기 문헌[Dellinger et al., 2003] 및 [Threlfall et al., 2012] 참고)으로부터 적용된 프로토콜을 사용하여 합성하였다. 모든 올리고뉴클레오티드는 역상 고성능 액체 크로마토그래피(RP-HPLC)를 사용하여 정제하였으며, Agilent 6545 Q-TOF(비행 시간(time-of-flight)) 질량 스펙트럼계에 커플링된 Agilent 1290 Infinity series LC system을 사용하여 액체 크로마토그래피-질량 스펙트럼분석(LC-MS)에 의해 분석하였다. 모든 경우에, 정제된 gRNA의 질량 스펙트럼에서 다중 전하 상태를 포함하는 일련의 피크의 디컨볼루션(deconvolution)에 의해 측정된 질량은 교정된 계기의 오차내에서 예상 질량과 일치하여(이 분석에 사용된 품질 보증에 대한 사양은, 정제된 gRNA의 관찰된 질량이 계산된 질량의 0.01% 이내인 것임), 각각의 합성 gRNA의 조성을 확인하였다.
5-메톡시우리딘으로 완전 치환된 CleanCap Cas9 mRNA를 TriLink로부터 구입하였다(L-7206). BE4-Gam 단백질 및 PE2 단백질 각각을 인코딩하는 BE4-Gam mRNA 및 PE2 mRNA를, TriLink가 자사 전용의 5' 및 3' UTR을 추가한 코딩 서열을 제공하여 TriLink에서 맞춤형 주문으로 구입하였다. 맞춤형 mRNA는 5-메틸시티딘과 슈도우리딘으로 완전히 대체되었고 CleanCap AG로 캡핑되었으며 폴리A 테일이 있었다.
세포 배양 및 핵감염. 인간 K562 세포를 ATCC에서 입수하고 RPMI 1640 + 10% 소태아혈청(gibco)으로 보충된 GlutaMax 배지(gibco)에서 배양하였다. K562 세포(계대 번호 4 내지 14 이내)를, 시티딘 염기 편집을 위해 PBS 완충액에서 6 μL의 125 피코몰의 gRNA 및 1.87 피코몰의 BE4-Gam mRNA와 조합되거나, 또는 프라임 편집을 위해 PBS 완충액에서 100 피코몰의 닉 생성 gRNA 및 1.35 피코몰의 PE2 mRNA를 갖는 8 μL의 125 피코몰의 pegRNA와 조합된 20 μL의 SF 완충액에서 형질감염당 20만개의 세포로 Lonza SF 세포주 키트(V4SC-2960)를 사용하여 제조업체의 지침에 따라 Lonza 4D-Nucleofector(96-웰 셔틀 장치(shuttle device), 프로그램 FF-120)를 사용하여 핵감염(nucleofecting)시켰다. 세포를 주위 산소 및 5% 이산화탄소에서 37℃에서 배양하고 형질감염 후 48시간에 수확하였다.
인간 Jurkat 클론 E6-1 세포를 ATCC에서 입수하고 10% 소 태아 혈청으로 보충된 RPMI 1640 + GlutaMax 배지에서 배양하였다. Jurkat 세포(계대 번호 7 내지 20 이내)를 PBS 완충액에서 8 μL의 125 피코몰의 pegRNA, 100 피코몰의 닉 생성 gRNA 및 1.35 피코몰의 PE2 mRNA와 조합된 20 μL의 SE 완충액에서 20만개의 세포로 Lonza SE 세포주 키트(V4SC-1960)를 사용하여 핵감염시켰다(프로그램 CL-120). 배양된 세포를 형질감염 72시간 후에 수확하였다.
인간 HepG2 세포를 ATCC에서 입수하고 10% 소 태아 혈청으로 보충된 둘베코 변형 이글 배지(Dulbecco's Modified Eagle's Medium, DMEM) + L-글루타민 + 4.5 g/L D-글루코스 배지(gibco)에서 배양하였다. HepG2 세포(계대 번호 4 내지 13)를 배양 배지로부터 스핀 다운(spin down)하고 PBS로 헹구거나 헹구지 않고 다시 스핀 다운하였다. 세포를 Lonza SF 세포주 키트(V4SC-2960)를 사용하여 PBS 완충액 중 3 μL의 10 피코몰 gRNA 및 0.0625 피코몰의 Cas9 mRNA와 조합된 20 μL의 SF 완충액 중 20만 개의 세포를 사용하여 핵감염시키거나(프로그램 EH-100), 20 μL의 SF 완충액 중 20만 개의 세포를 PBS 완충액 중 5 μL의 30 피코몰 gRNA 및 0.5 피코몰의 Cas9 mRNA 또는 12.5 피코몰의 S. pyogenes Cas9(SpCas9) 단백질(Aldeveron)과 조합함으로써 잔류 혈청의 존재하에 핵감염시켰다. 163-mer gRNA의 경우, 20만 개의 세포를 PBS 완충액 중 5 μL의 125 피코몰의 163-mer gRNA 및 50 피코몰의 SpCas9 단백질과 조합함으로써 잔류 혈청 및 SF 완충액 존재하에 마찬가지로 핵감염시켰다. 모든 RNP 형질감염의 경우, gRNA는 약 20분 동안 실온에서 조합하고 인큐베이션함으로써 PBS 완충액 내 SpCas9 단백질(Aldevron)과 예비-복합체화한 후, SF 완충액 내 세포와 조합하여 핵감염시켰다. mRNA 형질감염의 경우, gRNA를 마찬가지로 PBS 완충액에서 Cas9 mRNA(TriLink)와 조합하고 핵감염을 위해 SF 완충액에서 세포와 조합될 때까지 약 20분 동안 얼음 위에 보관하였다. 배양된 HepG2 세포를 형질감염 후 약 72시간에 수확하였다.
인간 1차 T 세포(LP, CR, CD3+, NS)를 AllCells(Alameda, CA)에서 입수하고 10% 소 태아 혈청, 5 ng/mL의 인간 IL-7 및 5 ng/mL의 인간 IL-15(gibco)가 보충된 RPMI 1640 + GlutaMax 배지에서 배양하였다. 1차 T 세포를 3:1의 비드 대 세포 농도에서 항-인간 CD3/CD28 자성 Dynabeads(Thermo Fisher)를 사용하여 48시간 동안 활성화시켰다. 비드 제거된 1차 T 세포를 Lonza P3 1차 세포 키트(V4SP-3960)를 사용하여 PBS 완충액 중 2.7 μL의 5 피코몰 gRNA 및 0.0625 피코몰의 Cas9 mRNA와 조합된 20 μL의 P3 완충액 중 20만 개의 세포에 의해 핵감염시켰다(프로그램 EO-115). 배양된 세포는 형질감염 후 7일째에 수확하였다. 배양 기간 내내 T 세포는 배지의 mL당 대략 1M 세포의 밀도로 유지되었다. 전기천공 후, 2일마다 추가 배지를 추가하였다.
qRT-PCR 분석. 인간 K562 세포를 상기와 같이 배양하였고, 복제당 20만 개의 세포를 기재한 바와 같이 125 피코몰의 gRNA(Cas9 mRNA 또는 단백질 없음)로 핵감염시켰다. 각 시점마다, 세포를 1.7-mL의 Eppendorf 튜브에 수집하고 PBS로 헹군 후 750 μL의 Qiazol에 재현탁하고 실온에서 5분 동안 보관한 후 -20℃ 냉동고로 옮겼다. QiaCube HT에서 miRNeasy 키트(Qiagen)를 사용하여 Qiazol과 클로로포름 추출물로부터 PBS 중 전체 RNA를 분리한 후, Protoscript II 제1 가닥 cDNA 합성 키트(NEB)를 사용하여 즉시 역전사하였다. 단리된 RNA의 전체 양에 대한 정규화(ΔCt로서 계산됨)를 위해, qRT-PCR을 TaqPath ProAmp 마스터 믹스(master mix)와 2개의 TaqMan MGB 프로브(하나는 FAM으로 라벨링된 gRNA을 위한 것이고, 다른 하나는 VIC(Thermo Fisher)로 라벨링된 U6 snRNA를 위한 것임)를 사용하여 Applied Biosystems QuantStudio 6 Flex 기기에서 수행하였다. 3반복 샘플에 대한 ΔCt 값을 평균내고 관찰된 최저 평균 ΔCt 값으로 정규화하여 ΔΔCt 값을 계산하였다. 상대 gRNA 수준은 2-ΔΔCt로서 계산하였다.
표적화된 게놈 변형의 PCR - 표적화된 심층 시퀀싱 및 정량화. 게놈 DNA 정제 및 PCR 표적화 심층 시퀀싱 라이브러리의 구축은 앞서 설명한 바와 같이 수행하였다. Qubit dsDNA BR 분석 키트(Thermo Fisher)를 사용하여 라이브러리 농도를 측정하였다. 쌍 형성-말단(paired end) 2x220-bp 판독은 20.5% PhiX와 함께 0.8 ng/μL의 PCR-증폭된 라이브러리로 MiSeq(Illumina)에서 시퀀싱하였다.
FLASH 버전 1.2.11 소프트웨어를 사용하여 쌍 형성-말단 판독을 병합한 후 기본 매개변수로 설정된 BWA-MEM 소프트웨어(bwa-0.7.10)를 사용하여 인간 게놈에 매핑(mapping)하였다. 판독은 삽입 또는 삭제가 Cas9 절단 부위의 10bp내에서 발견되었는지 여부에 따라 indel을 갖는지 또는 갖지 않는지를 채점되었다. 프라임 편집 분석의 경우, 판독에서 목적하는 편집물이 확인되면 판독은 편집물을 갖는 것으로 채점되었다. 시티딘 염기 편집 분석의 경우, 시티딘이 PAM 부위의 10 내지 20bp 상류의 윈도우(window)내에서 편집된 경우 판독은 염기가 편집된 것으로 채점되었다. 각각의 실험의 각각의 반복에 대해 매핑된 판독은 매핑된 앰플리콘 유전자좌에 따라 분리되었으며 indel 또는 편집물의 유무에 따라 비닝(binning)되었다. 빈(bin)당 판독 수의 집계는 각 유전자좌에서 생성된 %indel 또는 %edit를 계산하는 데 사용되었다. 플롯에 대한 indel 또는 편집물 수율 및 표준 편차는 %indel 또는 %edit의 로짓 변환(logit transformation)에 의해 계산되어, ln(r/(1-r))로 변환되었고, 이때 r은 특정 유전자좌당 %indel 또는 %edit이며, 정규 분포에 거의 근접한다. 3반복 모의 형질감염은 평균 모의 대조군(mean mock control)(또는 음성 대조군)을 제공하였고, 상응하는 음성 대조군보다 유의하게 더 높은(t-검정 p<0.05) 평균 indel 수율 또는 평균 편집물 수율을 나타내는 3반복 샘플은 상기 배경으로서 간주하였다.
실시예 1
본 실시예에서는 3' 말단에 2'-O-메틸-3'-포스포노아세테이트(MP) 및 2'-O-메틸-3'-포스포로티오에이트(MS) 변형을 갖는 가이드 RNA의 안정성을 평가하였다. 형질감염된 세포의 3' 말단에 MS 또는 MP 변형을 갖는 단일 가이드 RNA의 상대적 수명을 평가하기 위해, 가이드 RNA를 5' 말단의 처음 3개의 뉴클레오티드간 연결기에서 MS 변형 및 3' 말단에서 마지막 3개의 뉴클레오티드간 연결기에서 MS 변형(3xMS,3xMS로 표시됨), 또는 3' 말단에서 뉴클레오티드간 연결기에서 2, 3 또는 4개의 연속적인 MP 변형(각각 3xMS,2xMP; 3xMS,3xMP; 및 3xMS,4xMP로 표시됨)으로 합성하였다. 각각의 변형된 gRNA를 Cas9가 없는 인간 K562 세포에 개별적으로 형질감염시켰고, qRT-PCR을 사용하여 형질감염 후 1 내지 96시간의 일련의 시점에서 수집된 세포에 남아 있는 sgRNA의 상대적인 양을 측정하였다.
도 7에 도시된 바와 같이, 3' 말단에서 MP(2, 3 또는 4개의 연속적인 MP)로 변형된 임의의 gRNA에 비해, 형질감염 후 1시간, 6시간 및 24시간에 걸쳐 검출된 3xMS,3xMS gRNA의 상대적 수준에서 훨씬 더 급격한 감소가 관찰되었다. 구체적으로, 형질감염 1시간 후, 형질감염된 gRNA의 상대적인 양은 3' 말단 보호의 4개 변형 모두에서 오류 막대가 크게 겹치면서 단지 2.6배까지만 상이하였지만, 형질감염 후 6시간에는 훨씬 더 큰 차이가 관찰되었고, 이때 3xMS,3xMS-보호된 gRNA의 나머지 양은 3xMS,3xMP- 및 3xMS,4xMP-보호된 gRNA(0.341 내지 0.351)의 약 1/10(0.039)의 상대적 수준으로 떨어졌다. 3' 말단에서 3xMS로부터 2xMP로부터 3xMP로부터 4xMP로의 논리적 진행에서 3' 말단 보호 수준에 따라 달라지는 24시간 시점에서 차이가 더욱 커져 약 250배에 이르는 잔류 gRNA 수준을 야기하였고, 이는 3' 말단 보호의 수준과 일관되었다. 따라서, 복합체화되지 않은 gRNA의 3' 말단에 MP 변형을 혼입하는 것은, 특히 MS-단독 변형된 gRNA와 평행 시험된 3개의 상이한 MP-변형된 gRNA에 대한 크기의 1 내지 2배로, MS 변형에 비해 형질감염된 세포의 안정성을 크게 향상시킬 수 있는 것으로 밝혀졌다. 3' 말단에 3개 또는 4개의 연속적인 MP를 갖는 설계는 훨씬 더 긴 시점(형질감염 후 72시간 및 96시간)에 걸쳐 유리 gRNA의 수명을 연장시킬 수 있다.
실시예
2
포스포네이트 변형은 DNA 및 RNA 올리고뉴클레오티드에 안정하게 혼입될 수 있으며 포스포로티오에이트에 비해 뉴클레아제에 대한 저항성을 증가시키는 것으로 입증되었다. 20-nt 가이드 서열 부분에 MP를 혼입하여 gRNA의 특이성을 강화하기 위해 MP의 사용을 조사한 선행 보고서에서, 위치 5 또는 11(가이드 서열의 5' 말단에서 계산됨)과 같은 특정 서열 위치에서의 MP가 표적이탈 편집을 현저히 감소시키는 한편, 높은 표적적중 편집을 유지할 수 있는 것으로 밝혀졌다(예컨대 문헌[Ryan et al., Nucleic Acids Research 46, 792-803 (2018)]에 기재됨). 그러나, 일부 가이드 서열에서는 gRNA의 5' 말단에서 처음 1개, 2개 또는 3개의 뉴클레오티드내에 MP 변형을 혼입하는 것은 이의 표적적중 절단 활성이 감소시키거나 표적이탈 절단 활성 및 이에 따른 더 낮은 특이성을 증가시킬 수 있는 것으로 보고되었다(예컨대 문헌[Ryan et al., 2018] 참고).
가이드 RNA에서 포스포네이트 변형의 잠재적인 유용성을 더 자세히 조사하기 위해, 3' 말단에서 상이한 수의 연속적인 2'-O-메틸-3'-포스포노아세테이트(2'-O-메틸-3'-PACE 또는 "MP") 변형을 포함하는 gRNA의 성능을 상기 말단에 2'-O-메틸-3'-포스포로티오에이트(또는 "MS") 변형을 갖는 가이드 RNA와 비교하여 평가하였다. 이 연구의 결과는 문헌["Ryan et al. Phosphonoacetate Modifications Enhance the Stability and Editing Yields of Guide RNAs for Cas9 Editors." Biochemistry (2022) doi.org/10.1021/acs.biochem.1c00768.]에 추가로 기재되어 있다.
이 실험은 HBB를 표적 유전자로 사용하여 화학적으로 변형된 가이드 RNA와 Cas 단백질을 인코딩하는 mRNA의 비교적 낮은(아포화) 양으로 HepG2 세포를 공동-형질감염한 후 Cas 활성을 평가하도록 설계하였다. 이러한 아포화량은 세포의 표적 영역을 편집하는 데 어려운 조건을 구성한다.
3개의 세트의 샘플에 대해, Cas9를 인코딩하는 mRNA를, HBB를 표적화하는 변형된 gRNA에 의해 인간 간세포(HepG2 세포)에 공동-형질감염시켰다(상기 표 1 참고). HepG2 세포의 네 번째 세트의 경우, HBB의 동일한 부위를 표적화하는 변형된 gRNA를 정제된 재조합 Cas9 단백질과 예비-복합체화하여 RNP를 형성한 후 세포에 형질감염시켰다. 각각의 형질감염을 별도로 배양된 세포의 3반복(triplicate) 샘플에서 수행하였다. 게놈 DNA를 수확하고, HBB 유전자 및 유전자간 표적이탈 부위에 특이적인 프라이머를 사용하여 HBB 표적적중 및 표적이탈 서열을 각각 증폭하여 시퀀싱된 앰플리콘을 생성하고, 표적 및 표적이탈 부위에서의 편집의 정도("%indel")를 시퀀싱 결과로부터 결정하였다. ON과 OFF는 각각 표적적중 서열 및 표적이탈 서열을 나타낸다. 유전자간 표적이탈 유전자좌를, HBB 유전자에서 선택된 표적 서열을 표적화할 때 높은 부수적 활성을 겪는 것으로 공지되어 있기 때문에 모니터링하였다. 표 1에 기재된 변형된 gRNA에 대한 편집 수율은 도 2 내지 5에 막대 그래프로서 플로팅된다.
도 2 내지 5에 의해 입증된 바와 같이, HBB를 표적화하는 변형된 가이드 RNA와 Cas 단백질(또는 변형된 가이드 RNA의 RNP 복합체)을 인코딩하는 mRNA의 아포화 수준을 사용한 공동-형질감염은 동일한 양의 변형되지 않은 gRNA로 공동-형질감염된 샘플에 비해 더 높은 수준의 편집 수율을 야기하였다. 또한, 변형된 gRNA의 3' 말단에 2, 3 또는 4개의 MP 변형의 추가는 편집 수율이 점진적으로 높게 증가하게 하였으며, 3' 말단에 3개의 MS 변형을 포함하는 변형된 gRNA에 비해 상당한 증가가 있었다. 예를 들어, 도 2 및 4를 참고한다. 도 3 및 5에 도시된 바와 같이, 위치 5 또는 11(gRNA의 20-nt 가이드 서열의 5' 말단에서 카운팅)에 MP 변형의 포함은 표적이탈 활성을 또한 감소시켰다. 특히, gRNA의 위치 5에 MP의 포함은 편집 수율에 최소한의 영향을 주면서 표적이탈 활성을 실질적으로 감소시켰다.
3' 말단의 MP 변형이 HepG2 세포에서 편집 수율을 크게 향상시키는 것으로 추가로 관찰되었다(도 3). 예를 들어, 3' 말단에서 2, 3 또는 4개의 연속적인 MP 변형을 갖는 설계는 3' 말단에서 3xMS를 갖는 유사한 설계에 비해 2배 이상 더 많은 Cas9 매개 indel을 야기하였다(3' 말단에서, 2xMP, 3xMP 및 4xMP 변형의 경우 표적적중 부위에서 81% 내지 83% 대 3xMS의 경우 38%). 2xMP, 3xMP 및 4xMP 변형이 3' 말단에서 3xMS를 사용할 때보다 1.3배 더 높은 수준의 표적적중 indel을 제공한다는 점에서 증가가 더 완만했지만 1차 인간 T 세포에 형질감염된 동일한 gRNA에 대해 유사한 경향이 관찰되었다(도 8). gRNA의 20-nt 가이드 서열 부분의 위치 5에서 추가 MP의 혼입은 특이성을 강화하기 위한 수단으로 선행 보고된 바와 같이 높은 표적 편집 효율성을 유지하는 한편, 세포 유형 둘 다에서 OFF1 부위의 편집을 크게 감소시켰다(예컨대, 문헌[Ryan et al., 2018] 참고). 실제로, OFF1 부위의 indel은 위치 5에 MP를 혼입함으로써 HepG2 세포에서 7 내지 10배 감소했고, 유사하게 1차 T 세포에서는 6 내지 7배 감소하였다.
도 9에 도시된 바와 같이, 화학적으로 변형된 gRNA의 사용도 염기 편집자와 함께 평가하였다. 염기 편집자는 이중 가닥 절단을 생성하지 않고 세포내 게놈 DNA를 편집할 수 있는 다양한 데아미나제 중 하나에 융합된 Cas9 니카아제(nCas9) 또는 데드 Cas9(dCas9)를 중심으로 구축된 대체 게놈 편집 시스템의 부류이다. 시티딘 염기 편집자(CBE)와 아데노신 염기 편집자(ABE) 둘 다가 보고되었으며, 이는 염기 편집에 대한 다양한 변형에 영감을 주었다. 이러한 gRNA의 3' 말단에서 MS 변형과 대조적으로 MP 변형을 사용하는 것의 잠재적 이점을 CBE, 즉, BE4-Gam mRNA의 맥락에서 시험하였다. 3' 말단에 MS를 갖는 대체 설계에 비해 3' 말단에 MP로 변형된 gRNA로 공동-형질감염된 K562 세포에서 CBE mRNA를 사용함에 의해 1.4배 더 높은 수준의 시티딘 편집이 관찰되었다.
실시예 3
본 실시예는 화학적으로 합성된 pegRNA의 3' 말단에서 2'-O-메틸-3'-포스포노아세테이트(MP) 및 2'-O-메틸-3'-포스포로티오에이트(MS) 변형의 사용을 평가하였다. EMX1에서 PAM을 넉아웃시키거나 RUNX1에 3염기 삽입을 도입하는 문헌으로부터 채택된 프라임 편집을 위한 2개의 접근법을 탐색하기 위한 실험을 수행하였고, 상기 접근법 둘 다는 15개의 뉴클레오티드를 포함하는 프라이머 결합 서열을 갖는 pegRNA를 이용한다. 본 실험에서 평가된 특정 서열 편집물이 도 18에 도시되어 있다. 프라임 편집자를 인코딩하는 mRNA(이 경우, Cas9 니카아제와 MMLV 유래 역전사효소를 포함하는 융합 단백질)를 EMX1 유전자를 표적화하는 pegRNA와 함께 K562 또는 Jurkat 세포에 도입하였다. 각각의 형질감염을 별도로 배양된 세포의 3반복 샘플에서 수행하였다. 게놈 DNA를 수확하고, EMX1에 특이적인 프라이머를 사용하여 EMX1 표적 서열을 증폭시켜 시퀀싱된 앰플리콘을 생성하고, 서열 분석 결과로부터 프라임 편집("%Edit") 정도를 결정하였다. 또한, 시퀀싱 결과로부터 EMX1 표적 서열의 니카아제 부위에서 원하지 않는 indel 형성 정도("%indel")를 결정하였다. 이러한 indel은 프라임 편집의 부산물로 공지되어 있으며 일반적으로 바람직하지 않은 것으로 간주된다(문헌[Anzalone et al. 2019] 참고). 프라임 편집 수율 및 pegRNA당 indel 부산물 수율은 도 11 내지 16에 막대 그래프로 표시되어 있다. 이 분석에 사용된 서열은 표 2에 나타낸 서열로부터 선택하였다. 도 11 및 12에서의 데이터는 EMX1을 표적화하는 pegRNA의 제1 뱃취(batch) 합성을 사용하여 수득하였고, 도 13 및 14의 데이터는 EMX1을 표적으로 하는 pegRNA의 제2 뱃취 합성을 사용하여 수득하였다. 제2 뱃취 합성에서는 동일한 서열 중 일부가 다시 합성되었다. 반대로, 도 15 및 16의 데이터는 RUNX1을 표적화하는 pegRNA를 사용하여(즉, 표 3에 기재된 서열을 사용하여) 수득하였다.
도 11 내지 도 16에 도시된 결과에 의해 예시된 바와 같이, pegRNA의 5' 말단과 3' 말단에 각각 화학적 변형으로서 MS 및 MP 뉴클레오티드의 포함은 프라임 편집 활성을 증가시킨다. pegRNA의 3' 말단에 변형된 뉴클레오티드를 갖는 구축물의 향상된 활성은 pegRNA의 3' 말단이 추가 기능 부위(예컨대, 프라이머 결합 부위 및 역전사효소 주형 서열)를 함유하는 사실을 고려하면 특히 놀랍다. 상기 언급한 바와 같이, 본 개시 이전에는 이 부위에 화학적으로 변형된 뉴클레오티드(예를 들어, MS 및/또는 MP)의 포함이 pegRNA의 이러한 다른 3' 말단 성분에 의해 제공되는 기능을 방해할 것이라고 예상되었을 것이다.
실시예 4
본 실시예는 화학적으로 합성된 pegRNA의 3' 말단에 MP 또는 MS 변형이 혼입되는 것을 평가하였다. 본 실험에 사용된 방법은 상기 기재된 방법과 일치한다. 즉, EMX1에서 PAM을 넉아웃하거나 RUNX1에서 3-염기 삽입을 도입하기 위해 프라임 편집 접근법을 채택하였다. K562 세포를 프라임 편집자 mRNA(이 경우 Cas9 니카아제와 MMLV 유래 역전사효소로 구성된 융합 단백질) 및 5' 말단에서 3xMS로 변형된 합성 pegRNA, 및 EMX1 또는 RUNX1을 편집하기 위한 3' 말단에서의 다양한 변형 방식(제시된 바와 같음)에 의해 공동-형질감염시켰다. EMX1 또는 RUNX1 편집을 위해 동일한 pegRNA를 사용하여 Jurkat 세포도 마찬가지로 형질감염시켰다. 편집 수율을 목적하는 편집(%Edit) 및 임의의 오염성 indel 부산물(%By-indel) 둘 다에 대한 표적 유전자좌의 PCR 앰플리콘의 심층 시퀀싱을 통해 측정하였다. 관련 도면의 막대는 표준 편차에 의한 평균을 나타낸다(n = 3).
도 19 내지 22에 도시된 바와 같이, 상기 실험은 표적 둘 다에 대해 3' 말단에 3xMS를 갖는 pegRNA를, 3' 말단에 1, 2 또는 3개의 연속적인 MP를 갖는 대체 설계와 비교하였다(각각은 K562 또는 Jurkat 세포에서 PE2 mRNA로 공동-형질감염됨). 결과는 3' 말단에 MP 변형을 갖는 pegRNA가 우수한 성능을 나타내고 3xMS와 비슷하거나 경우에 따라 다소 더 높은 편집 수율을 달성할 수 있음을 나타낸다. 여기에서 시험한 2개의 pegRNA 서열의 경우, 3' 말단에서 2xMP 및/또는 3xMP에 의한 설계는 3' 말단에서 1xMP에 의한 설계보다 일관되게 더 우수한 성능을 나타냈다(구체적으로 1.2 내지 1.4배 더 우수함).
실시예 5
본 실시예는 화학적으로 합성된 gRNA의 3' 말단에서 MP 변형의 사용 혈청이 있는 경우 편집 수율을 최대화하는 데 도움이 되는 것을 입증하였다. CRISPR-Cas 성분이 (나노담체(nanocarrier) 또는 기타 세포 침투성 제제에 의해) 생체내에서 전달될 때 발생할 수 있는 더 가혹한 세포 환경을 모의하기 위해, Cas9 mRNA를 gRNA와 함께 배양 배지에서 단리된 세포(뉴클레아제를 함유하는 것으로 공지된 잔류 혈청을 제거하기 위해 PBS 완충액으로 헹구지 않음)에 공동-형질감염시키는 실험을 수행하였다.
본 실험에 사용된 방법은 상기 기재된 방법과 일치한다. 그러나, 이 실험 조건에서는 상당한 수준의 편집을 달성하기 위해 더 많은 양의 gRNA 및 Cas9 mRNA가 필요했으며, 특히 형질감염당 3배 더 많은 gRNA 및 8배 더 많은 Cas9 mRNA가 실험에 사용되었고, 이는 도 3에 도시된 데이터를 야기한 실험(형질감염당 동일한 수의 세포를 완충액으로 세척한 후 CRISPR-Cas 성분을 도입한)과 비교하여 도 23에 도시된 데이터를 얻었다.
본 연구의 결과에 따라, 세포로부터 헹굼되지 않은 혈청에서 세포외 뉴클레아제가 형질감염된 RNA를 분해하는 것으로 나타났다. 본 발명자들은 3' 말단에 MP 변형을 갖는 gRNA가, 헹굼되지 않은 HepG2 세포에 Cas9 mRNA와 함께 공동-형질감염되었을 때, 3' 말단에 MS 변형을 갖는 gRNA에 비해 실질적으로 (자릿수(order-of-magnitude) 이상만큼) 더 높은 편집 수율을 제공하는 것을 발견하였다(도 23). 구체적으로, 3' 말단에 하나 이상의 MP를 갖는 gRNA의 편집 수율은 15% 내지 44%인 반면, 3' 말단에 3xMS에 의해서는 2% 미만이었다.
평행 실험에서, 각 gRNA의 RNP 버전을 PBS 완충액 중 Cas9 단백질과의 예비-복합체화에 의해 제조하고, 헹굼되지 않은 HepG2 세포의 분취량에 형질감염시켰다. 예상대로, 변형되지 않은 gRNA와 3xMS 변형된 gRNA는 Cas9 mRNA와 함께 공동-형질감염되었을 때보다 RNP 제형으로서 더 높은 indel 수율을 제공하고, 이는 RNP에서 Cas9 단백질과 gRNA의 예비-복합체화가 gRNA를 핵분해성 분해로부터 보호하는 데 도움이 되기 때문이다(도 24 대 도 23에 도시된 결과를 비교함). 3' 말단에 MP 대 MS 변형을 갖는 gRNA를 혼입하는 RNP 사이의 편집 효율성 개선이 Cas9 mRNA와의 공동-형질감염에서 이러한 변형을 사용할 때만큼 극적이지는 않았지만, 3' 말단에 MP를 사용한 설계는 3' 말단에서 3xMS를 갖는 비교 대상의 설계보다 현저히 더 높은 Cas9-매개된 indel을 제공하였다(3' 말단에서 2xMP, 3xMP 및 4xMP 변형의 경우 표적적중 부위에서의 70% 내지 73%의 indel 대 3' 말단에서 3xMS의 경우 52%, 약 1.3배 차이)(도 24 참고). CRISPRa SAM 시스템용으로 설계되었지만 CRISPRa에 의한 유전자 활성화를 위해 indel을 사용하는 대신 indel을 생성하기 위해 RNP 제형에서 SpCas9 단백질과 함께 사용된 합성 163-mer gRNA의 다른 세트에 대해서도 유사한 결과가 관찰되었다(도 25).
예시적인 양태
섹션 A
양태 A1. 하나 이상의 어려운 조건(challenging condition)하에 핵산에서 표적 영역을 편집하는 방법으로서, 하기를 포함하는 방법:
a) CRISPR 관련("Cas") 단백질, 및
b) 표적 영역에 하이브리드화할 수 있는 가이드 서열 및 Cas 단백질과 상호작용하는 스캐폴드를 포함하는 변형된 가이드 RNA
를 제공하는 단계
(이때, 상기 변형된 가이드 RNA는 5' 말단 및 3' 말단을 포함하고, 상기 변형된 가이드 RNA는 3' 말단의 5개의 뉴클레오티드내에 하나 이상의 변형된 뉴클레오티드를 포함하고, 상기 하나 이상의 변형된 뉴클레오티드는 2' 변형 및 뉴클레오티드간 연결기 변형을 갖는 하나 이상의 뉴클레오티드를 포함하고, 상기 2' 변형은 2'-O-메틸, 2'-플루오로, 2'-O-메톡시에틸(2'-MOE) 및 2'-데옥시로부터 선택되고, 상기 뉴클레오티드간 연결기 변형은 포스포노카복실레이트 또는 티오포스포노카복실레이트이고,
이때, 상기 하나 이상의 어려운 조건은 다음으로 이루어진 군으로부터 선택된다:
i. 표적 영역 또는 표적 영역을 포함하는 세포가 혈청(예를 들어, 소 태아 혈청)을 포함하는 배지내에 있음;
ii. 표적 영역을 포함하는 세포가 혈청을 포함하는 배지에서 미리 배양되었고, 세포가 혈청으로부터 불완전하게 분리됨;
iii. 표적 영역을 포함하는 세포가 하나 이상의 엑소리보뉴클레아제를 포함하는 배지에서 미리 배양되었고, 세포가 하나 이상의 엑소리보뉴클레아제로부터 불완전하게 분리됨;
iv. 표적 영역을 포함하는 세포가 상대적으로 높은 수준의 엑소리보뉴클레아제 활성, 예컨대 하나 이상의 엑소리보뉴클레아제의 상재적으로 높은 발현을 가짐;
v. 표적 영역을 포함하는 세포가 상대적으로 낮은 수준의 리보뉴클레아제 억제제 활성, 예컨대 상대적으로 낮은 리보뉴클레아제 억제제 발현을 가짐;
vi. 변형된 가이드 RNA가 표적 영역을 포함하는 세포내로 전달되기 전에 Cas 단백질과의 복합체가 아님; 및
vii. 이들의 적용가능한 조합
(이때, 상기 Cas 단백질 및 상기 변형된 가이드 RNA는 상기 표적 영역을 편집하는 복합체를 형성함)).
양태 A2. 양태 A1에 있어서, 뉴클레오티드간 연결기 변형이 포스포노카복실레이트인, 방법.
양태 A3. 양태 A2에 있어서, 포스포노카복실레이트가 포스포노아세테이트인, 방법.
양태 A4. 양태 A1에 있어서, 티오포스포노카복실레이트가 티오포스포노아세테이트인, 방법.
양태 A5. 양태 A1 내지 A4 중 어느 하나에 있어서, Cas 단백질이 Cas 단백질을 인코딩하는 mRNA로서 도입되는, 방법.
양태 A6. 양태 A1 내지 A4 중 어느 하나에 있어서, Cas 단백질이 Cas 단백질을 인코딩하는 발현 벡터로서 도입되는, 방법.
양태 A7. 양태 A5 또는 A6에 있어서, Cas 단백질을 인코딩하는 mRNA 또는 발현 벡터가 표적 영역에 도입될 때 나노입자에 함유되는, 방법.
양태 A8. 양태 A1 내지 A4 중 어느 하나에 있어서, Cas 단백질 및 가이드 RNA가 리보핵단백질(RNP) 복합체로서 도입되는, 방법.
양태 A9. 상기 양태 중 어느 하나에 있어서, 2' 변형이 2'-O-메틸인, 방법.
양태 A10. 양태 A1 내지 A8 중 어느 하나에 있어서, 2' 변형이 2'-플루오로인, 방법.
양태 A11. 양태 A1 내지 A8 중 어느 하나에 있어서, 2' 변형이 2'-MOE인, 방법.
양태 A12. 양태 A1 내지 A8 중 어느 하나에 있어서, 2' 변형이 2'-데옥시인, 방법.
양태 A13. 상기 양태 중 어느 하나에 있어서, 하나 이상의 편집물이 하나 이상의 단일 뉴클레오티드 변화, 하나 이상의 뉴클레오티드의 삽입 및/또는 하나 이상의 뉴클레오티드의 결실을 포함하는, 방법.
양태 A14. 상기 양태 중 어느 하나에 있어서, 표적 영역이 무세포 분석에서 존재하는, 방법.
양태 A15. 양태 A14에 있어서, 세포로부터 핵산을 추출하여(예컨대, 세포를 용해시킴에 의함) 추출된 핵산 및 하나 이상의 다른 세포 성분, 예컨대 엑소리보뉴클레아제 또는 다른 효소를 포함하는 분석 혼합물을 형성하는 단계, 및 상기 분석 혼합물에 가이드 RNA를 도입하는 단계를 추가로 포함하는 방법.
양태 A16. 상기 양태 중 어느 하나에 있어서, 표적 영역이 높은 리보뉴클레아제 발현, 농도 및/또는 활성을 갖는 세포, 예를 들어, 특정 뉴클레아제가 높은 세포 유형에 존재하는, 방법.
양태 A17. 양태 A16에 있어서, 세포가 1차 세포를 포함하는, 방법.
양태 A18. 양태 A17에 있어서, 세포가 생체외에 존재하고, 살아있는 유기체로부터 세포를 분리하기 위한 하나 이상의 단계를 추가로 포함하는 방법. 상기 세포는 반응 혼합물로 분리될 수 있거나, 분리된 세포는 반응 혼합물로 전달될 수 있다.
양태 A19. 양태 A16 내지 A18 중 어느 하나에 있어서, 변형된 가이드 RNA 및 Cas 단백질을 세포내의 표적 영역에 도입하기 전에 상기 세포가 다세포 유기체로부터 단리되는, 방법.
양태 A20. 양태 A19에 있어서, 세포 또는 이의 자손이 변형된 가이드 RNA 및 Cas 단백질을 세포내 표적 부위에 도입한 후 다세포 유기체로 복귀되는, 방법.
양태 A21. 양태 A16 내지 A20 중 어느 하나에 있어서, 세포가 1차 세포인, 방법.
양태 A22. 양태 A21에 있어서, 1차 세포가 줄기 세포 또는 면역 세포인, 방법.
양태 A23. 양태 A22에 있어서, 줄기 세포가 조혈 줄기 및 전구 세포(HSPC), 중간엽 줄기 세포, 신경 줄기 세포 또는 기관 줄기 세포인, 방법.
양태 A24. 양태 A22에 있어서, 면역 세포가 T 세포, 자연 살해 세포, 단핵구, 말초 혈액 단핵 세포(PBMC) 또는 말초 혈액 림프구(PBL)인, 방법.
양태 A25. 양태 A24에 있어서, 세포가 T 세포인, 방법.
양태 A26. 양태 A16 내지 A20 중 어느 하나에 있어서, 세포가 간세포인, 방법.
양태 A27. 양태 A16 내지 A26 중 어느 하나에 있어서, 세포가 각각 표적 영역을 포함하는 세포 집단인, 방법.
양태 A28. 양태 A16 내지 A27 중 어느 하나에 있어서, 세포가 세포 배양물에 존재하고, 세포가 혈청 또는 하나 이상의 다른 배지 성분을 포함하는 세포 배양 배지에 존재하는, 방법.
양태 A29. 양태 A28에 있어서, Cas 단백질 및 변형된 가이드 RNA가 도입되기 전에 세포가 세포 배양 배지로부터 분리되지 않는, 방법.
양태 A30. 양태 A1 내지 13 및 A16 내지 A29 중 어느 하나에 있어서, Cas 단백질 및 변형된 가이드 RNA가 살아있는 유기체에 도입되는, 방법.
양태 A31. 양태 A30에 있어서, Cas 단백질 및 변형된 가이드 RNA가 살아있는 유기체내의 또는 이로부터의 혈청-함유 유체에 도입되는, 방법.
양태 A32. 상기 양태 중 어느 하나에 있어서, 편집이 프라임 편집이고, 변형된 가이드 RNA가 목적하는 편집물을 포함하는 영역을 추가로 포함하는, 방법.
양태 A33. 상기 양태 중 어느 하나에 있어서, 편집이 상동성-유도 복구(HDR), 비상동 말단 접합(NHEJ), 프라임 편집, 또는 염기 편집을 포함하는, 방법.
양태 A34. 상기 양태 중 어느 하나에 있어서, Cas 단백질이 Cas9 또는 Cas12 단백질인, 방법.
양태 A35. 상기 양태 중 어느 하나에 있어서, Cas 단백질이 DNA의 단일 가닥에 닉을 생성할 수 있는 Cas 니카아제인, 방법.
양태 A36. 상기 양태 중 어느 하나에 있어서, Cas 단백질이 Cas 도메인 및 이종 기능성 도메인을 포함하는 융합 단백질이고, 상기 이종 기능성 도메인이 염기 편집 활성, 뉴클레오티드 데아미나제 활성, 트랜스글리코실라제 활성, 메틸라제 활성, 데메틸라제 활성, 역전사효소 활성, 중합효소 활성, 번역 활성화 활성, 번역 억제 활성, 전사 활성화 활성, 전사 억제 활성, 전사 방출 인자 활성, 염색질 변형 또는 리모델링 활성, 히스톤 변형 활성, 뉴클레아제 활성, 단일 가닥 RNA 절단 활성, 이중 가닥 RNA 절단 활성, 단일 가닥 DNA 절단 활성, 이중 가닥 DNA 절단 활성, 핵산 결합 활성, 검출가능한 활성, 또는 이들의 임의의 조합을 포함하는, 방법.
양태 A37. 양태 A36에 있어서, 융합 단백질이 Cas 니카아제 도메인 및 뉴클레오티드 데아미나제를 포함하는, 방법.
양태 A38. 양태 A36에 있어서, 뉴클레오티드 데아미나제가 아데노신 데아미나제 또는 시티딘 데아미나제인, 방법.
양태 A39. 양태 A36에 있어서, 융합 단백질이 하나 이상의 핵산 변형 도메인을 포함하는, 방법.
양태 A40. 양태 A36에 있어서, 핵산 변형 도메인이 DNA 중합효소 도메인, 재조합효소 도메인, 리보뉴클레오티드 환원효소 도메인, 메틸트랜스퍼라제 도메인, 다이아데노신 테트라포스페이트 가수분해효소 도메인, DNA 헬리카제 도메인 또는 RNA 헬리카제 도메인인, 방법.
양태 A41. 양태 A36에 있어서, 융합 단백질이 Cas 니카아제 도메인 및 역전사효소 도메인을 포함하는, 방법.
양태 A42. 상기 양태 중 어느 하나에 있어서, 가이드 RNA가 단일 가이드 RNA인, 방법.
양태 A43. 양태 A42에 있어서, 변형된 가이드 RNA가 적어도 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 198, 199 또는 200개의 뉴클레오티드; 및/또는
180, 179, 178, 177, 176, 175, 174, 173, 172, 171, 170, 169, 168, 167, 166, 165, 164, 163, 162, 161, 159, 158, 157, 156, 155, 154, 153, 152, 151, 150, 149, 148, 147, 146, 145, 144, 143, 142, 141, 140, 139, 138, 137, 136, 135, 134, 133, 132, 131, 130, 129, 128, 127, 126, 125, 124, 123, 122, 121 또는 120개 이하의 뉴클레오티드
를 포함하는 단일 가이드 RNA인, 방법.
양태 A44. 상기 양태 중 어느 하나에 있어서, 가이드 RNA가 5' 말단의 5개의 뉴클레오티드내에, 다르게는 5' 말단의 3개의 뉴클레오티드내에 하나 이상의 변형된 뉴클레오티드를 추가로 포함하는, 방법.
양태 A45. 양태 A44에 있어서, 5' 말단의 하나 이상의 변형된 뉴클레오티드가 2' 변형 및 뉴클레오티드간 연결기 변형을 갖는 하나 이상의 뉴클레오티드를 포함하고, 상기 2' 변형이 2'-O-메틸, 2'-플루오로, 2'-O- 메톡시에틸(2'-MOE) 및 2'-데옥시로부터 선택되고, 상기 뉴클레오티드간 연결기 변형이 포스포노카복실레이트, 티오포스포노카복실레이트 및 포스포로티오에이트로부터 선택되는, 방법.
양태 A46. 상기 양태 중 어느 하나에 있어서, 가이드 RNA가 상기 가이드 RNA의 5' 말단 및 3' 말단 둘 다로부터의 5개 이상의 뉴클레오티드 이외에 하나 이상의 위치에 하나 이상의 변형된 뉴클레오티드를 추가로 포함하는, 방법.
양태 A47. 하나 이상의 어려운 조건하에 세포내 핵산의 표적 영역에서 표적 유전자의 발현을 조절하는 방법으로서, 하기를 포함하는 방법:
a) CRISPR 관련("Cas") 단백질, 또는 Cas 단백질을 인코딩하는 DNA 또는 mRNA, 및
b) 표적 영역에 하이브리드화할 수 있는 가이드 서열 및 Cas 단백질과 상호작용하는 영역을 포함하는 변형된 가이드 RNA
를 제공하는 단계
(이때, 상기 변형된 가이드 RNA는 5' 말단 및 3' 말단을 포함하고, 상기 변형된 가이드 RNA는 3' 말단의 5개의 뉴클레오티드내의 하나 이상의 변형된 뉴클레오티드를 추가로 포함하고, 상기 하나 이상의 변형된 뉴클레오티드는 2' 변형 및 뉴클레오티드간 연결기 변형을 갖는 하나 이상의 뉴클레오티드를 포함하고, 상기 2' 변형은 2'-O-메틸, 2'-플루오로, 2'-O-메톡시에틸(2'-MOE) 및 2'-데옥시로부터 선택되고, 상기 뉴클레오티드간 연결기 변형은 포스포노카복실레이트 또는 티오포스포노카복실레이트이고, 상기 Cas 단백질 및 상기 변형된 가이드 RNA는 표적 영역의 발현을 조절하는 복합체를 형성함).
양태 A48. 양태 A47에 있어서, Cas 단백질 또는 변형된 가이드 RNA가 후생적 변형자, 또는 전사 또는 번역 활성화 또는 억제 신호를 추가로 포함하는, 방법.
양태 A49. 양태 A47에 있어서, Cas 단백질이 불활성 Cas 뉴클레아제 도메인, 및 전사 활성화 도메인 및 전사 억제 도메인으로부터 선택된 이종 기능성 도메인을 포함하는 융합 단백질인, 방법.
양태 A50. 양태 A49에 있어서, 이종 기능성 도메인이 전사 활성화 도메인인, 방법.
양태 A51. 양태 A50에 있어서, 전사 활성화 도메인이 VP64 도메인, p65 도메인, MyoD1 도메인 또는 HSF1 도메인인, 방법.
양태 A52. 양태 A49에 있어서, 이종 기능성 도메인이 전사 억제 도메인인, 방법.
양태 A53. 양태 A52에 있어서, 전사 억제 도메인이 KRAB 도메인, SID 도메인, SID4X 도메인, NuE 도메인 또는 NcoR 도메인인, 방법.
양태 A54. 하나 이상의 어려운 조건하에 핵산에서 표적 영역을 프라임 편집하는 방법으로서, 하기를 포함하는 방법:
a) 핵산의 단일 가닥에 닉을 생성할 수 있는 Cas 단백질;
역전사효소; 및
하기를 포함하는 변형된 프라임 편집 가이드 RNA("pegRNA")
를 제공하는 단계:
i) 표적 영역에 하이브리드화할 수 있는 가이드 서열,
ii) Cas 단백질과 상호작용하는 영역,
iii) 핵산의 서열에 대한 하나 이상의 편집물을 포함하는 역전사효소 주형 서열, 및
iv) 표적 영역의 보체에 결합할 수 있는 프라이머 결합 부위 서열
(이때, 변형된 pegRNA는 5' 말단 및 3' 말단을 포함하고, 상기 변형된 pegRNA는 3' 말단의 5개의 뉴클레오티드내에 하나 이상의 변형된 뉴클레오티드를 추가로 포함하고, 상기 하나 이상의 변형된 뉴클레오티드는 2' 변형 및 뉴클레오티드간 연결기 변형을 갖는 하나 이상의 뉴클레오티드를 포함하고, 상기 2' 변형은 2'-O-메틸, 2'-플루오로, 2'-O-메톡시에틸(2'-MOE) 및 2'-데옥시로부터 선택되고, 뉴클레오티드간 연결기 변형은 포스포노카복실레이트 또는 티오포스포노카복실레이트이고, Cas 단백질과 변형된 가이드 RNA는 표적 영역을 편집하는 복합체를 형성함).
양태 A55. 양태 A54에 있어서, Cas 단백질 및 역전사효소가 링커에 의해 연결되어 융합 단백질을 형성하는, 방법.
양태 A56. 상기 양태 중 어느 하나에 있어서, 가이드 RNA가 5' 말단의 5개의 뉴클레오티드내에 하나 이상의 포스포로티오에이트 뉴클레오티드간 연결기, 및 3' 말단의 5개의 뉴클레오티드내에 2개 이상의 연속적인 포스포노카복실레이트 또는 티오포스포노카복실레이트 뉴클레오티드간 연결기를 포함하는, 방법.
양태 A57. 상기 양태 중 어느 하나에 있어서, 가이드 RNA가 5' 말단의 5개의 뉴클레오티드내에 하나 이상의 포스포로티오에이트 뉴클레오티드간 연결기, 및 3' 말단의 5개의 뉴클레오티드내에 2개 이상의 연속적인 포스포노아세테이트 또는 티오포스포노아세테이트 뉴클레오티드간 연결기를 포함하는, 방법.
양태 A58. 상기 양태 중 어느 하나에 있어서, 가이드 RNA가 5' 말단의 5개의 뉴클레오티드내에 하나 이상의 MS, 및 3' 말단의 5개의 뉴클레오티드내에 2개 이상의 연속적인 MP 또는 MSP를 포함하는, 방법.
양태 A59. 상기 양태 중 어느 하나에 있어서, 가이드 RNA가 5' 말단의 5개의 뉴클레오티드내에 3개의 MS, 및 3' 말단의 5개의 뉴클레오티드내에 3개의 MP 또는 MSP를 포함하는, 방법.
양태 A60. 상기 양태 중 어느 하나에 있어서, 표적 유전자의 발현의 편집 및/또는 조절이 다중화된 방식으로(즉, 2개 이상의 표적 유전자 또는 2개 이상의 표적 영역에 대해) 수행되는, 방법.
섹션 B
양태 B1. 세포내 핵산에서 표적 영역을 편집하는 방법으로서, 세포에 하기를 제공하는 단계를 포함하는 방법:
a) CRISPR 관련("Cas") 단백질, 및
b) 5' 말단 및 3' 말단을 포함하는 변형된 가이드 RNA,
표적 영역에서 표적 서열에 하이브리드화할 수 있는 가이드 서열,
Cas 단백질과 상호작용하는 스캐폴드 영역, 및
5' 말단의 5개의 뉴클레오티드내에 하나 이상의 포스포로티오에이트 변형, 및 3' 말단의 5개의 뉴클레오티드내에 2개 이상의 연속적인 포스포노카복실레이트 또는 티오포스포노카복실레이트 변형
(이때, 상기 세포는 뉴클레아제-함유 유체의 존재하에 생체외에 존재하거나, 생체내에 존재하고, 상기 제공하는 단계는 표적 유전자의 편집을 야기함).
양태 B1.1. 세포내 핵산에서 표적 영역을 편집하는 방법으로서, 세포에 하기를 제공하는 단계를 포함하는 방법:
a) CRISPR 관련("Cas") 단백질, 및
b) 5' 말단 및 3' 말단을 포함하는 프라임 편집 가이드 RNA(pegRNA)인 변형된 가이드 RNA
(이때, 5' 말단 및 3' 말단 중 하나는 프라임 편집 말단이고 다른 하나는 원위 말단이고, 상기 변형된 가이드 RNA는
표적 영역에서 표적 서열에 하이브리드화할 수 있는 가이드 서열,
Cas 단백질과 상호작용하는 스캐폴드 영역, 및
원위 말단의 5개의 뉴클레오티드내에 하나 이상의 포스포로티오에이트 변형, 및 프라임 편집 말단의 5개의 뉴클레오티드내에 2개 이상의 연속적인 포스포노카복실레이트 또는 티오포스포노카복실레이트 변형
을 포함하고, 상기 세포는 뉴클레아제-함유 유체의 존재하에 생체외에 존재하거나, 생체내에 존재하고, 상기 제공하는 단계는 표적 영역의 편집을 야기함).
양태 B2. 양태 B1 또는 B1.1에 있어서, 상기 편집이 변형된 가이드 RNA와 변형되지 않은 것 외에는 동일한 비변형된 gRNA에 의한 것보다 더 높은 효율로 수행되는, 방법.
양태 B3. 세포내 핵산의 표적 영역에서 표적 유전자의 발현을 조절하는 방법으로서, 세포에 하기를 제공하는 단계를 포함하는 방법:
a) CRISPR 관련("Cas") 단백질, 및
b) 5' 말단 및 3' 말단을 포함하는 변형된 가이드 RNA,
표적 영역에서 표적 서열에 하이브리드화할 수 있는 가이드 서열,
Cas 단백질과 상호작용하는 스캐폴드 영역, 및
5' 말단의 5개의 뉴클레오티드내에 하나 이상의 포스포로티오에이트 변형, 및 3' 말단의 5개의 뉴클레오티드내에 2개 이상의 연속적인 포스포노카복실레이트 또는 티오포스포노카복실레이트 변형
(이때, 상기 세포는 뉴클레아제-함유 유체의 존재하에 생체외에 존재하거나, 생체내에 존재하고, 상기 제공하는 단계는 표적 유전자의 발현을 조절함).
양태 B4. 양태 B3에 있어서, 변형된 가이드 RNA와 변형되지 않은 것 외에는 동일한 비변형된 gRNA에 의한 것보다 더 높은 효율로 조절이 수행되는, 방법.
양태 B5. 상기 B 양태 중 어느 하나에 있어서, 세포가 생체내에 존재하는, 방법.
양태 B6. 상기 B 양태 중 어느 하나에 있어서, 세포가 뉴클레아제-함유 유체의 존재하에 생체외에 존재하는, 방법.
양태 B7. 상기 B 양태 중 어느 하나에 있어서, 변형된 가이드 RNA가 5' 말단의 5개의 뉴클레오티드내에 2개 이상의 연속적인 2'-O-메틸-3'-포스포로티오에이트(MS)를 포함하는 방법(예외: 본 양태가 양태 B1.1에 종속되는 경우 "원위 말단"이 "5' 말단" 대신 사용됨).
양태 B8. 전술한 B 양태 중 어느 하나에 있어서, 포스포노카복실레이트는 포스포노아세테이트이고, 티오포스포노카복실레이트는 티오포스포노아세테이트인, 방법.
양태 B9. 전술한 B 양태 중 어느 하나에 있어서, 변형된 가이드 RNA가 3' 말단의 5개의 뉴클레오티드내에 2개 이상의 연속적인 2'-O-메틸-3'-포스포노아세테이트(MP) 또는 2'-O-메틸-3'-티오포스포노아세테이트(MSP)를 포함하는, 방법(예외: 본 양태가 양태 B1.1에 종속될 때 "프라임 종결 말단" 대신 "5' 말단"이 사용됨).
양태 B10. 상기 B 양태 중 어느 하나에 있어서, 변형된 가이드 RNA가 5' 말단 및 3' 말단내의 5개의 뉴클레오티드 외부에 위치하는 변형된 뉴클레오티드를 추가로 포함하는, 방법.
양태 B11. 상기 B 양태 중 어느 하나에 있어서, 변형된 가이드 RNA가 단일 가이드 RNA인, 방법.
양태 B12. 상기 B 양태 중 어느 하나에 있어서, Cas 단백질이 Cas 단백질을 인코딩하는 mRNA로서 제공되는, 방법.
양태 B13. 양태 B1 내지 B11 중 어느 하나에 있어서, Cas 단백질이 Cas 단백질을 인코딩하는 DNA로서 제공되는, 방법.
양태 B14. 양태 B13에 있어서, DNA가 바이러스 발현 벡터인, 방법.
양태 B15. 양태 B1 내지 B11 중 어느 하나에 있어서, Cas 단백질 및 변형된 가이드 RNA가 리보핵단백질(RNP) 복합체로서 제공되는, 방법.
양태 B16. 양태 B1 내지 B11 중 어느 하나에 있어서, Cas 단백질 및/또는 변형된 가이드 RNA가 나노입자로 제공되는, 방법.
양태 B17. 상기 B 양태 중 어느 하나에 있어서, 효율이 5% 이상만큼 더 높은, 방법.
양태 B18. 상기 B 양태 중 어느 하나에 있어서, 효율이 10% 이상만큼 더 높은, 방법.
양태 B19. 상기 B 양태 중 어느 하나에 있어서, 효율이 15% 이상만큼 더 높은, 방법.
양태 B20. 상기 B 양태 중 어느 하나에 있어서, 효율이 20% 이상만큼 더 높은, 방법.
양태 B21. 상기 B 양태 중 어느 하나에 있어서, 효율이 25% 이상만큼 더 높은, 방법.
양태 B22. 상기 B 양태 중 어느 하나에 있어서, 효율이 30% 이상만큼 더 높은, 방법.
양태 B23. 상기 B 양태 중 어느 하나에 있어서, 효율이 35% 이상만큼 더 높은, 방법.
양태 B24. 상기 B 양태 중 어느 하나에 있어서, 효율이 40% 이상만큼 더 높은, 방법.
양태 B25. 상기 B 양태 중 어느 하나에 있어서, 효율이 45% 이상만큼 더 높은, 방법.
양태 B26. 상기 B 양태 중 어느 하나에 있어서, 효율이 50% 이상만큼 더 높은, 방법.
양태 B27. 상기 B 양태 중 어느 하나에 있어서, Cas 단백질이 DNA의 가닥 둘 다를 절단할 수 있는, 방법.
양태 B28. 양태 B1 내지 B26 중 어느 하나에 있어서, Cas 단백질이 니카아제인, 방법.
양태 B29. 양태 B1 내지 B26 중 어느 하나에 있어서, Cas 단백질이 뉴클레아제 활성을 갖지 않는, 방법.
양태 B30. 상기 B 양태 중 어느 하나에 있어서, Cas 단백질이 이종 단백질을 추가로 포함하는 융합 단백질의 일부인, 방법.
양태 B31. 상기 B 양태 중 어느 하나에 있어서, Cas 단백질이 유형 II Cas 단백질인, 방법.
양태 B32. 상기 B 양태 중 어느 하나에 있어서, Cas 단백질이 Cas9 단백질, 또는 이의 변이체 또는 단편인, 방법.
양태 B33. 양태 B32에 있어서, Cas9 단백질이 스트렙토코커스 피오게네스로부터의 것인, 방법.
양태 B34. 양태 B1 내지 B32 중 어느 하나에 있어서, Cas 단백질이 Cpf1 단백질, 또는 이의 변이체 또는 단편인, 방법.
양태 B35. 상기 B 양태 중 어느 하나에 있어서, Cas 단백질이 2개 이상의 상이한 야생형 Cas 단백질로부터의 서열을 갖는 하이브리드 단백질인, 방법.
양태 B36. 상기 B 양태 중 어느 하나에 있어서, 변형된 가이드 RNA가 40 내지 70개의 뉴클레오티드 길이인, 방법.
양태 B37. 상기 B 양태 중 어느 하나에 있어서, 변형된 가이드 RNA가 40 내지 100개의 뉴클레오티드 길이인, 방법.
양태 B38. 양태 B1 내지 B35 중 어느 하나에 있어서, 변형된 가이드 RNA가 90 내지 110개의 뉴클레오티드 길이인, 방법.
양태 B39. 양태 B1 내지 B35 중 어느 하나에 있어서, 변형된 가이드 RNA가 90 내지 130개의 뉴클레오티드 길이인, 방법.
양태 B40. 양태 B1 내지 B35 중 어느 하나에 있어서, 변형된 가이드 RNA가 130 내지 160개의 뉴클레오티드 길이인, 방법.
양태 B41. 양태 B1 내지 B35 중 어느 하나에 있어서, 변형된 가이드 RNA가 160 내지 200개의 뉴클레오티드 길이인, 방법.
양태 B42. 상기 B 양태 중 어느 하나에 있어서, 변형된 가이드 RNA가 pegRNA인, 방법.
양태 B43. 상기 B 양태 중 어느 하나에 있어서, 포스포로티오에이트, 포스포노카복실레이트 또는 티오포스포노카복실레이트 변형이, 2'-O-메틸 변형을 또한 포함하는 뉴클레오티드에 각각 존재하는, 방법.
양태 B44. 상기 B 양태 중 어느 하나에 있어서, 하기를 포함하는 제2 변형된 가이드 RNA를 사용하여 세포내의 제2 표적 영역을 편집하는 단계를 추가로 포함하는 방법:
5' 말단 및 3' 말단,
제2 표적 영역의 제2 표적 서열에 하이브리드화할 수 있는 가이드 서열, 및
5' 말단의 5개의 뉴클레오티드내의 하나 이상의 포스포로티오에이트 변형(단, 본 양태가 B1.1에 종속되는 경우, 이는 원위 말단일 것임), 및 3' 말단의 5개의 뉴클레오티드내의 2개 이상의 연속적인 포스포노카복실레이트 또는 티오포스포노카복실레이트 변형(단, 본 양태가 B1.1에 종속되는 경우, 이것이 프라임 편집 말단일 것임).
양태 B45. 상기 B 양태 중 어느 하나에 있어서, 하기를 포함하는 제3 변형 가이드 RNA를 사용하여 세포내 제3 표적 영역에서 제3 표적 유전자의 발현을 조절하는 단계를 추가로 포함하는 방법:
5' 말단 및 3' 말단,
제3 표적 영역의 제3 표적 서열에 하이브리드화할 수 있는 가이드 서열, 및
5' 말단의 5개의 뉴클레오티드내의 하나 이상의 포스포로티오에이트 변형, 및 3' 말단의 5개의 뉴클레오티드내의 2개 이상의 연속적인 포스포노카복실레이트 또는 티오포스포노카복실레이트 변형.
양태 B46. 상기 B 양태 중 어느 하나에 있어서, 뉴클레아제가 엑소뉴클레아제인, 방법.
양태 B47. 상기 B 양태 중 어느 하나에 있어서, 뉴클레아제가 리보뉴클레아제인, 방법.
섹션 C
양태 C1. 세포내의 제1 표적 영역 및 제2 표적 영역을 포함하는 2개 이상의 핵산 표적 영역을 편집하는 방법으로서, 세포에 하기를 제공하는 단계를 포함하는 방법:
a) CRISPR 관련("Cas") 단백질;
b) 5' 말단 및 3' 말단을 포함하는 제1 변형 가이드 RNA,
제1 표적 영역내의 제1 표적 서열에 하이브리드화할 수 있는 제1 가이드 서열,
Cas 단백질과 상호작용하는 스캐폴드 영역, 및
5' 말단의 5개의 뉴클레오티드내에 하나 이상의 포스포로티오에이트 변형, 및 3' 말단의 5개의 뉴클레오티드내에 2개 이상의 연속적인 포스포노카복실레이트 또는 티오포스포노카복실레이트 변형; 및
c) 5' 말단 및 3' 말단을 포함하는 제2 변형 가이드 RNA,
제2 표적 영역의 제2 표적 서열에 하이브리드화할 수 있는 제2 가이드 서열,
Cas 단백질과 상호작용하는 스캐폴드 영역, 및
5' 말단의 5개의 뉴클레오티드내에 하나 이상의 포스포로티오에이트 변형, 및 3' 말단의 5개의 뉴클레오티드내에 2개 이상의 연속적인 포스포노카복실레이트 또는 티오포스포노카복실레이트 변형
(이때, 상기 세포는 뉴클레아제-함유 유체의 존재하에 생체외에 존재하거나, 생체내에 존재하고, 상기 제공하는 단계는 제1 및 제2 표적 영역의 편집을 야기함).
양태 C2. 세포에서 적어도 제1 표적 영역내의 제1 표적 유전자 및 제2 표적 영역내의 제2 표적 유전자의 발현을 조절하는 방법으로서, 세포에 제공하는 단계를 포함하는 방법:
a) CRISPR 관련("Cas") 단백질;
b) 5' 말단 및 3' 말단을 포함하는 제1 변형 가이드 RNA,
제1 표적 영역내의 제1 표적 서열에 하이브리드화할 수 있는 제1 가이드 서열,
Cas 단백질과 상호작용하는 스캐폴드 영역, 및
5' 말단의 5개의 뉴클레오티드내에 하나 이상의 포스포로티오에이트 변형, 및 3' 말단의 5개의 뉴클레오티드내에 2개 이상의 연속적인 포스포노카복실레이트 또는 티오포스포노카복실레이트 변형; 및
c) 5' 말단 및 3' 말단을 포함하는 제2 변형 가이드 RNA,
제2 표적 영역의 제2 표적 서열에 하이브리드화할 수 있는 제2 가이드 서열,
Cas 단백질과 상호작용하는 스캐폴드 영역, 및
5' 말단의 5개의 뉴클레오티드내에 하나 이상의 포스포로티오에이트 변형, 및 3' 말단의 5개의 뉴클레오티드내에 2개 이상의 연속적인 포스포노카복실레이트 또는 티오포스포노카복실레이트 변형
(이때, 상기 세포는 뉴클레아제-함유 유체의 존재하에 생체외에 존재하거나, 생체내에 존재하고, 상기 제공하는 단계는 제1 및 제2 표적 유전자의 발현의 조절을 야기함).
양태 C3. 양태 C1 또는 C2에 있어서, 제1 표적 영역의 편집 또는 제1 표적 유전자의 조절이, 제1 변형 가이드 RNA와 변형되지 않은 것 외에는 동일한 비변형 가이드 RNA의 효율보다 더 높은 제1 효율을 갖는, 방법.
양태 C4. 양태 C3에 있어서, 제2 표적 영역의 편집 또는 제2 표적 유전자의 조절이, 제2 변형 가이드 RNA와 변형되지 않은 것 외에는 동일한 비변형 가이드 RNA의 효율보다 더 높은 제2 효율을 갖는, 방법.
양태 C5. 상기 C 양태 중 어느 하나에 있어서, 세포가 생체내에 존재하는, 방법.
양태 C6. 양태 C1 내지 C4 중 어느 하나에 있어서, 세포가 뉴클레아제-함유 유체의 존재하에 생체외에 존재하는, 방법.
양태 C7. 상기 C 양태 중 어느 하나에 있어서, A 양태 또는 B 양태 각각으로부터 적용가능한 추가 제한을 추가로 포함하는 방법.
예시적이거나 바람직한 양태에 대한 전술한 설명은 청구범위에 의해 정의된 본 발명을 한정하기보다는 예시하는 것으로 받아들여져야 한다. 용이하게 이해될 수 있듯이, 위에 설명된 특징들의 다양한 변형 및 조합이 청구범위에 설명된 본 개시내용을 벗어나지 않고 활용될 수 있다. 이러한 변형은 본 개시내용의 범위로부터 벗어나는 것으로 간주되지 않으며, 이러한 모든 변형은 하기 청구범위의 범주내에 포함되도록 의도된다. 본원에 인용된 모든 참고문헌은 그 전체가 참고로 인용된다.
본원에 언급된 모든 간행물, 특허 및 특허 출원은 각각의 개별 간행물, 특허 또는 특허 출원이 참조로 포함되도록 구체적이고 개별적으로 표시된 것과 동일한 정도로 본원에 참고로 인용된다.
Claims (18)
- a) CRISPR 관련(Cas) 단백질; 및
b) 5' 말단 및 3' 말단을 포함하는 변형된 가이드(modified guide) RNA,
표적 영역에서 표적 서열에 하이브리드화할 수 있는 가이드 서열,
Cas 단백질과 상호작용하는 스캐폴드 영역(scaffold region), 및
5' 말단의 5개의 뉴클레오티드내에 하나 이상의 포스포로티오에이트 변형, 및 3' 말단의 5개의 뉴클레오티드내에 2개 이상의 연속적인 포스포노카복실레이트 또는 티오포스포노카복실레이트 변형
을 세포에 제공하는 단계를 포함하는, 세포내 핵산에서 표적 영역을 편집하거나 표적 영역내 표적 유전자의 발현을 조절하는 방법으로서,
상기 세포가 뉴클레아제-함유 유체의 존재하에 생체외에 존재하거나 생체내에 존재하고, 상기 제공하는 단계가 표적 영역의 편집 또는 표적 유전자의 발현의 조절을 야기하는, 방법. - 제1항에 있어서,
포스포로티오에이트, 포스포노카복실레이트 및 티오포스포노카복실레이트 변형이 2'-O-메틸을 또한 포함하는 뉴클레오티드에 각각 존재하는, 방법. - 제1항 또는 제2항에 있어서,
변형된 가이드 RNA가 5' 말단의 5개의 뉴클레오티드내에 2개 이상의 연속적인 2'-O-메틸-3'-포스포로티오에이트(MS)를 포함하는, 방법. - 제1항 내지 제3항 중 어느 한 항에 있어서,
포스포노카복실레이트가 포스포노아세테이트이고, 티오포스포노카복실레이트가 티오포스포노아세테이트인, 방법. - 제3항에 있어서,
변형된 가이드 RNA가 3' 말단의 5개의 뉴클레오티드내에 2개 이상의 연속적인 2'-O-메틸-3'-포스포노아세테이트(MP) 또는 2'-O-메틸-3'-티오포스포노아세테이트(MSP)를 포함하는, 방법. - 제1항 내지 제5항 중 어느 한 항에 있어서,
변형된 가이드 RNA가 5' 말단 및 3' 말단내의 5개의 뉴클레오티드 외부에 위치하는 변형된 뉴클레오티드를 추가로 포함하는, 방법. - 제1항 내지 제6항 중 어느 한 항에 있어서,
변형된 가이드 RNA가 단일 가이드 RNA인, 방법. - 제1항 내지 제7항 중 어느 한 항에 있어서,
Cas 단백질이 Cas 단백질을 인코딩하는 mRNA로서 제공되는, 방법. - 제1항 내지 제8항 중 어느 한 항에 있어서,
Cas 단백질 및 변형된 가이드 RNA가 리보핵단백질(RNP) 복합체로서 제공되는, 방법. - 제1항 내지 제9항 중 어느 한 항에 있어서,
Cas 단백질 및/또는 변형된 가이드 RNA가 나노입자로 제공되는, 방법. - 제1항 내지 제10항 중 어느 한 항에 있어서,
편집 또는 조절이, 변형된 가이드 RNA와 변형되지 않은 것 외에는 동일한 비변형된 gRNA에 의한 것보다 더 높은 효율로 수행되는, 방법. - 제11항에 있어서,
효율이 10% 이상만큼 더 높은, 방법. - 제1항 내지 제12항 중 어느 한 항에 있어서,
뉴클레아제-함유 유체가 혈청인, 방법. - 제1항 내지 제13항 중 어느 한 항에 있어서,
뉴클레아제-함유 유체가 뇌척수액(CSF)인, 방법. - 제1항 내지 제14항 중 어느 한 항에 있어서,
뉴클레아제-함유 유체가 세포 배양 배지인, 방법. - 제1항 내지 제15항 중 어느 한 항에 있어서,
뉴클레아제-함유 유체가 체액인, 방법. - 제1항 내지 제16항 중 어느 한 항에 있어서,
세포가 생체내에 존재하는, 방법. - 제1항 내지 제17항 중 어느 한 항에 있어서,
세포가 뉴클레아제-함유 유체의 존재하에 생체외에 존재하는, 방법.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163243985P | 2021-09-14 | 2021-09-14 | |
US63/243,985 | 2021-09-14 | ||
US202263339737P | 2022-05-09 | 2022-05-09 | |
US63/339,737 | 2022-05-09 | ||
PCT/US2022/043553 WO2023043856A1 (en) | 2021-09-14 | 2022-09-14 | Methods for using guide rnas with chemical modifications |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20240055098A true KR20240055098A (ko) | 2024-04-26 |
Family
ID=85603468
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020247011826A KR20240055098A (ko) | 2021-09-14 | 2022-09-14 | 화학적 변형을 갖는 가이드 rna를 사용하는 방법 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20230340468A1 (ko) |
EP (1) | EP4402266A1 (ko) |
JP (1) | JP2024533448A (ko) |
KR (1) | KR20240055098A (ko) |
AU (1) | AU2022346785A1 (ko) |
WO (1) | WO2023043856A1 (ko) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2015355546B2 (en) * | 2014-12-03 | 2021-10-14 | Agilent Technologies, Inc. | Guide RNA with chemical modifications |
WO2017053729A1 (en) * | 2015-09-25 | 2017-03-30 | The Board Of Trustees Of The Leland Stanford Junior University | Nuclease-mediated genome editing of primary cells and enrichment thereof |
WO2019084664A1 (en) * | 2017-11-02 | 2019-05-09 | The Governors Of The University Of Alberta | Chemically-modified guide rnas to improve crispr-cas protein specificity |
WO2019126037A1 (en) * | 2017-12-19 | 2019-06-27 | City Of Hope | Modified tracrrnas grnas, and uses thereof |
EP3752632A4 (en) * | 2018-03-19 | 2022-07-13 | University of Massachusetts | MODIFIED GUIDE RNAS FOR CRISPR GENOME EDITING |
-
2022
- 2022-09-14 WO PCT/US2022/043553 patent/WO2023043856A1/en active Application Filing
- 2022-09-14 JP JP2024515702A patent/JP2024533448A/ja active Pending
- 2022-09-14 US US17/945,060 patent/US20230340468A1/en active Pending
- 2022-09-14 KR KR1020247011826A patent/KR20240055098A/ko unknown
- 2022-09-14 AU AU2022346785A patent/AU2022346785A1/en active Pending
- 2022-09-14 EP EP22870647.9A patent/EP4402266A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
AU2022346785A1 (en) | 2024-04-18 |
WO2023043856A1 (en) | 2023-03-23 |
US20230340468A1 (en) | 2023-10-26 |
JP2024533448A (ja) | 2024-09-12 |
EP4402266A1 (en) | 2024-07-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2022204254B2 (en) | Chemically modified guide rnas for crispr/cas-mediated gene regulation | |
US20230026726A1 (en) | Crispr/cas-related methods and compositions for treating sickle cell disease | |
CN109153994A (zh) | 用于治疗β-血红蛋白病的CRISPR/CAS相关方法和组合物 | |
EP3129485A2 (en) | Crispr/cas-related methods and compositions for treating cystic fibrosis | |
CN116209755A (zh) | 可编程核酸酶和使用方法 | |
US20240218354A1 (en) | Guide rnas with chemical modification for prime editing | |
US20230340468A1 (en) | Methods for using guide rnas with chemical modifications | |
CA3230928A1 (en) | Methods for using guide rnas with chemical modifications | |
CN118043465A (zh) | 用于使用具有化学修饰的指导rna的方法 |