KR102629128B1 - 화학적 변형을 갖는 가이드 rna - Google Patents
화학적 변형을 갖는 가이드 rna Download PDFInfo
- Publication number
- KR102629128B1 KR102629128B1 KR1020177018311A KR20177018311A KR102629128B1 KR 102629128 B1 KR102629128 B1 KR 102629128B1 KR 1020177018311 A KR1020177018311 A KR 1020177018311A KR 20177018311 A KR20177018311 A KR 20177018311A KR 102629128 B1 KR102629128 B1 KR 102629128B1
- Authority
- KR
- South Korea
- Prior art keywords
- guide rna
- sequence
- methyl
- modification
- modifications
- Prior art date
Links
- 108020005004 Guide RNA Proteins 0.000 title claims abstract description 692
- 238000007385 chemical modification Methods 0.000 title description 16
- 238000012986 modification Methods 0.000 claims description 500
- 230000004048 modification Effects 0.000 claims description 499
- 125000003729 nucleotide group Chemical group 0.000 claims description 332
- 108090000623 proteins and genes Proteins 0.000 claims description 297
- 239000002773 nucleotide Substances 0.000 claims description 280
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 191
- 102000040430 polynucleotide Human genes 0.000 claims description 145
- 108091033319 polynucleotide Proteins 0.000 claims description 145
- 239000002157 polynucleotide Substances 0.000 claims description 145
- 238000000034 method Methods 0.000 claims description 106
- 108091028113 Trans-activating crRNA Proteins 0.000 claims description 63
- XUYJLQHKOGNDPB-UHFFFAOYSA-N phosphonoacetic acid Chemical compound OC(=O)CP(O)(O)=O XUYJLQHKOGNDPB-UHFFFAOYSA-N 0.000 claims description 56
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 44
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 claims description 38
- 238000000338 in vitro Methods 0.000 claims description 26
- 230000014509 gene expression Effects 0.000 claims description 25
- 230000015572 biosynthetic process Effects 0.000 claims description 23
- 239000007850 fluorescent dye Substances 0.000 claims description 20
- DWRXFEITVBNRMK-JXOAFFINSA-N ribothymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 DWRXFEITVBNRMK-JXOAFFINSA-N 0.000 claims description 19
- 230000000295 complement effect Effects 0.000 claims description 18
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 claims description 17
- 238000003786 synthesis reaction Methods 0.000 claims description 17
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 claims description 15
- 229940104302 cytosine Drugs 0.000 claims description 11
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 10
- 230000001105 regulatory effect Effects 0.000 claims description 8
- ZEMGGZBWXRYJHK-UHFFFAOYSA-N thiouracil Chemical compound O=C1C=CNC(=S)N1 ZEMGGZBWXRYJHK-UHFFFAOYSA-N 0.000 claims 4
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 claims 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 claims 1
- 229940036565 thiouracil antithyroid preparations Drugs 0.000 claims 1
- 108091033409 CRISPR Proteins 0.000 abstract description 134
- 238000010354 CRISPR gene editing Methods 0.000 abstract description 42
- 108091081548 Palindromic sequence Proteins 0.000 abstract description 2
- 235000018102 proteins Nutrition 0.000 description 246
- 102000004169 proteins and genes Human genes 0.000 description 246
- 239000002336 ribonucleotide Substances 0.000 description 102
- 108091028664 Ribonucleotide Proteins 0.000 description 99
- 210000004027 cell Anatomy 0.000 description 91
- 125000002652 ribonucleotide group Chemical group 0.000 description 88
- 108020004414 DNA Proteins 0.000 description 82
- 101710163270 Nuclease Proteins 0.000 description 79
- 238000003776 cleavage reaction Methods 0.000 description 62
- 230000007017 scission Effects 0.000 description 62
- 230000027455 binding Effects 0.000 description 40
- -1 e.g. Proteins 0.000 description 38
- 150000007523 nucleic acids Chemical class 0.000 description 38
- 230000000694 effects Effects 0.000 description 37
- 102000039446 nucleic acids Human genes 0.000 description 37
- 108020004707 nucleic acids Proteins 0.000 description 37
- 235000000346 sugar Nutrition 0.000 description 37
- 108020001507 fusion proteins Proteins 0.000 description 35
- 102000037865 fusion proteins Human genes 0.000 description 35
- 125000005647 linker group Chemical group 0.000 description 28
- 108020004999 messenger RNA Proteins 0.000 description 28
- 230000003993 interaction Effects 0.000 description 27
- 238000001890 transfection Methods 0.000 description 26
- 229910052799 carbon Inorganic materials 0.000 description 25
- 108090000765 processed proteins & peptides Proteins 0.000 description 25
- OVONXEQGWXGFJD-UHFFFAOYSA-N 4-sulfanylidene-1h-pyrimidin-2-one Chemical compound SC=1C=CNC(=O)N=1 OVONXEQGWXGFJD-UHFFFAOYSA-N 0.000 description 24
- 102000004196 processed proteins & peptides Human genes 0.000 description 24
- 108091027544 Subgenomic mRNA Proteins 0.000 description 20
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 20
- 108091034117 Oligonucleotide Proteins 0.000 description 19
- 150000004713 phosphodiesters Chemical class 0.000 description 19
- 229920001184 polypeptide Polymers 0.000 description 19
- 230000006870 function Effects 0.000 description 18
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 18
- 150000008163 sugars Chemical class 0.000 description 18
- 238000010362 genome editing Methods 0.000 description 17
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 description 16
- 239000013612 plasmid Substances 0.000 description 16
- 125000000217 alkyl group Chemical group 0.000 description 15
- 238000006243 chemical reaction Methods 0.000 description 15
- 230000001965 increasing effect Effects 0.000 description 15
- PEHVGBZKEYRQSX-UHFFFAOYSA-N 7-deaza-adenine Chemical compound NC1=NC=NC2=C1C=CN2 PEHVGBZKEYRQSX-UHFFFAOYSA-N 0.000 description 14
- 150000001413 amino acids Chemical class 0.000 description 14
- 239000000975 dye Substances 0.000 description 14
- YPFDHNVEDLHUCE-UHFFFAOYSA-N propane-1,3-diol Chemical compound OCCCO YPFDHNVEDLHUCE-UHFFFAOYSA-N 0.000 description 14
- 210000005260 human cell Anatomy 0.000 description 13
- 238000001727 in vivo Methods 0.000 description 13
- 230000035772 mutation Effects 0.000 description 13
- 108010060818 Toll-Like Receptor 9 Proteins 0.000 description 12
- 102100033117 Toll-like receptor 9 Human genes 0.000 description 12
- 239000004215 Carbon black (E152) Substances 0.000 description 11
- 102100031573 Hematopoietic progenitor cell antigen CD34 Human genes 0.000 description 11
- 101000777663 Homo sapiens Hematopoietic progenitor cell antigen CD34 Proteins 0.000 description 11
- 235000001014 amino acid Nutrition 0.000 description 11
- 238000003556 assay Methods 0.000 description 11
- 102000014908 clathrin light chain Human genes 0.000 description 11
- 108060001644 clathrin light chain Proteins 0.000 description 11
- 229930195733 hydrocarbon Natural products 0.000 description 11
- 239000000203 mixture Substances 0.000 description 11
- 229920002401 polyacrylamide Polymers 0.000 description 11
- 239000000126 substance Substances 0.000 description 11
- 230000008685 targeting Effects 0.000 description 11
- 238000013518 transcription Methods 0.000 description 11
- 108010042407 Endonucleases Proteins 0.000 description 10
- 102000004533 Endonucleases Human genes 0.000 description 10
- 102100039087 Peptidyl-alpha-hydroxyglycine alpha-amidating lyase Human genes 0.000 description 10
- 241000193996 Streptococcus pyogenes Species 0.000 description 10
- 229940024606 amino acid Drugs 0.000 description 10
- 230000021615 conjugation Effects 0.000 description 10
- NAGJZTKCGNOGPW-UHFFFAOYSA-K dioxido-sulfanylidene-sulfido-$l^{5}-phosphane Chemical compound [O-]P([O-])([S-])=S NAGJZTKCGNOGPW-UHFFFAOYSA-K 0.000 description 10
- 239000012636 effector Substances 0.000 description 10
- 238000002744 homologous recombination Methods 0.000 description 10
- 230000006801 homologous recombination Effects 0.000 description 10
- 229910052757 nitrogen Inorganic materials 0.000 description 10
- PWEBUXCTKOWPCW-UHFFFAOYSA-L squarate Chemical compound [O-]C1=C([O-])C(=O)C1=O PWEBUXCTKOWPCW-UHFFFAOYSA-L 0.000 description 10
- 230000035897 transcription Effects 0.000 description 10
- LOSIULRWFAEMFL-UHFFFAOYSA-N 7-deazaguanine Chemical compound O=C1NC(N)=NC2=C1CC=N2 LOSIULRWFAEMFL-UHFFFAOYSA-N 0.000 description 9
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 9
- 210000001744 T-lymphocyte Anatomy 0.000 description 9
- 230000004913 activation Effects 0.000 description 9
- 238000009396 hybridization Methods 0.000 description 9
- 239000000758 substrate Substances 0.000 description 9
- 238000011144 upstream manufacturing Methods 0.000 description 9
- JDBGXEHEIRGOBU-UHFFFAOYSA-N 5-hydroxymethyluracil Chemical compound OCC1=CNC(=O)NC1=O JDBGXEHEIRGOBU-UHFFFAOYSA-N 0.000 description 8
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 8
- UJBCLAXPPIDQEE-UHFFFAOYSA-N 5-prop-1-ynyl-1h-pyrimidine-2,4-dione Chemical compound CC#CC1=CNC(=O)NC1=O UJBCLAXPPIDQEE-UHFFFAOYSA-N 0.000 description 8
- PPYAFPNEHGRGIQ-UHFFFAOYSA-N 6-amino-5-ethynyl-1h-pyrimidin-2-one Chemical compound NC1=NC(=O)NC=C1C#C PPYAFPNEHGRGIQ-UHFFFAOYSA-N 0.000 description 8
- QNNARSZPGNJZIX-UHFFFAOYSA-N 6-amino-5-prop-1-ynyl-1h-pyrimidin-2-one Chemical compound CC#CC1=CNC(=O)N=C1N QNNARSZPGNJZIX-UHFFFAOYSA-N 0.000 description 8
- LHCPRYRLDOSKHK-UHFFFAOYSA-N 7-deaza-8-aza-adenine Chemical compound NC1=NC=NC2=C1C=NN2 LHCPRYRLDOSKHK-UHFFFAOYSA-N 0.000 description 8
- 229960005508 8-azaguanine Drugs 0.000 description 8
- 108091023037 Aptamer Proteins 0.000 description 8
- 239000002202 Polyethylene glycol Substances 0.000 description 8
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 8
- 230000015556 catabolic process Effects 0.000 description 8
- 238000006731 degradation reaction Methods 0.000 description 8
- 230000005782 double-strand break Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 150000002148 esters Chemical group 0.000 description 8
- OVBPIULPVIDEAO-LBPRGKRZSA-N folic acid Chemical compound C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-LBPRGKRZSA-N 0.000 description 8
- YACKEPLHDIMKIO-UHFFFAOYSA-N methylphosphonic acid Chemical compound CP(O)(O)=O YACKEPLHDIMKIO-UHFFFAOYSA-N 0.000 description 8
- 229920001223 polyethylene glycol Polymers 0.000 description 8
- 210000004986 primary T-cell Anatomy 0.000 description 8
- 230000000717 retained effect Effects 0.000 description 8
- 210000000130 stem cell Anatomy 0.000 description 8
- 238000006467 substitution reaction Methods 0.000 description 8
- WYWHKKSPHMUBEB-UHFFFAOYSA-N tioguanine Chemical compound N1C(N)=NC(=S)C2=C1N=CN2 WYWHKKSPHMUBEB-UHFFFAOYSA-N 0.000 description 8
- 210000000623 ulna Anatomy 0.000 description 8
- 102000004190 Enzymes Human genes 0.000 description 7
- 108090000790 Enzymes Proteins 0.000 description 7
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 7
- 230000037430 deletion Effects 0.000 description 7
- 238000012217 deletion Methods 0.000 description 7
- JOZGNYDSEBIJDH-UHFFFAOYSA-N eniluracil Chemical compound O=C1NC=C(C#C)C(=O)N1 JOZGNYDSEBIJDH-UHFFFAOYSA-N 0.000 description 7
- 230000004049 epigenetic modification Effects 0.000 description 7
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 7
- 108010034529 leucyl-lysine Proteins 0.000 description 7
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 7
- 239000000047 product Substances 0.000 description 7
- 239000007787 solid Substances 0.000 description 7
- MWBWWFOAEOYUST-UHFFFAOYSA-N 2-aminopurine Chemical compound NC1=NC=C2N=CNC2=N1 MWBWWFOAEOYUST-UHFFFAOYSA-N 0.000 description 6
- GJTBSTBJLVYKAU-XVFCMESISA-N 2-thiouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=S)NC(=O)C=C1 GJTBSTBJLVYKAU-XVFCMESISA-N 0.000 description 6
- 102100035875 C-C chemokine receptor type 5 Human genes 0.000 description 6
- 101710149870 C-C chemokine receptor type 5 Proteins 0.000 description 6
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 6
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 239000003153 chemical reaction reagent Substances 0.000 description 6
- 239000012634 fragment Substances 0.000 description 6
- 230000037431 insertion Effects 0.000 description 6
- 238000003780 insertion Methods 0.000 description 6
- DRAVOWXCEBXPTN-UHFFFAOYSA-N isoguanine Chemical compound NC1=NC(=O)NC2=C1NC=N2 DRAVOWXCEBXPTN-UHFFFAOYSA-N 0.000 description 6
- 239000003550 marker Substances 0.000 description 6
- 230000009437 off-target effect Effects 0.000 description 6
- ZJAOAACCNHFJAH-UHFFFAOYSA-N phosphonoformic acid Chemical group OC(=O)P(O)(O)=O ZJAOAACCNHFJAH-UHFFFAOYSA-N 0.000 description 6
- 210000001519 tissue Anatomy 0.000 description 6
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 5
- 102100025169 Max-binding protein MNT Human genes 0.000 description 5
- 229910019142 PO4 Inorganic materials 0.000 description 5
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 5
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 5
- 108010062796 arginyllysine Proteins 0.000 description 5
- 108010092854 aspartyllysine Proteins 0.000 description 5
- 230000002950 deficient Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 5
- 108091006047 fluorescent proteins Proteins 0.000 description 5
- 102000034287 fluorescent proteins Human genes 0.000 description 5
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 5
- 230000003308 immunostimulating effect Effects 0.000 description 5
- 230000002401 inhibitory effect Effects 0.000 description 5
- 150000002632 lipids Chemical class 0.000 description 5
- 108010054155 lysyllysine Proteins 0.000 description 5
- 230000001404 mediated effect Effects 0.000 description 5
- 239000000178 monomer Substances 0.000 description 5
- 235000021317 phosphate Nutrition 0.000 description 5
- 238000000746 purification Methods 0.000 description 5
- 230000002829 reductive effect Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 230000000638 stimulation Effects 0.000 description 5
- 229910052717 sulfur Inorganic materials 0.000 description 5
- 108091006107 transcriptional repressors Proteins 0.000 description 5
- 229940035893 uracil Drugs 0.000 description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 4
- YIMATHOGWXZHFX-WCTZXXKLSA-N (2r,3r,4r,5r)-5-(hydroxymethyl)-3-(2-methoxyethoxy)oxolane-2,4-diol Chemical compound COCCO[C@H]1[C@H](O)O[C@H](CO)[C@H]1O YIMATHOGWXZHFX-WCTZXXKLSA-N 0.000 description 4
- ZDTFMPXQUSBYRL-UUOKFMHZSA-N 2-Aminoadenosine Chemical class C12=NC(N)=NC(N)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O ZDTFMPXQUSBYRL-UUOKFMHZSA-N 0.000 description 4
- ZAYHVCMSTBRABG-JXOAFFINSA-N 5-methylcytidine Chemical class O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZAYHVCMSTBRABG-JXOAFFINSA-N 0.000 description 4
- TWGNOYAGHYUFFR-UHFFFAOYSA-N 5-methylpyrimidine Chemical compound CC1=CN=CN=C1 TWGNOYAGHYUFFR-UHFFFAOYSA-N 0.000 description 4
- DCPSTSVLRXOYGS-UHFFFAOYSA-N 6-amino-1h-pyrimidine-2-thione Chemical compound NC1=CC=NC(S)=N1 DCPSTSVLRXOYGS-UHFFFAOYSA-N 0.000 description 4
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- 108010070675 Glutathione transferase Proteins 0.000 description 4
- 102100029100 Hematopoietic prostaglandin D synthase Human genes 0.000 description 4
- 229930010555 Inosine Natural products 0.000 description 4
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 4
- OVBPIULPVIDEAO-UHFFFAOYSA-N N-Pteroyl-L-glutaminsaeure Natural products C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)NC(CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-UHFFFAOYSA-N 0.000 description 4
- 102000004389 Ribonucleoproteins Human genes 0.000 description 4
- 108010081734 Ribonucleoproteins Proteins 0.000 description 4
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 4
- 108700009124 Transcription Initiation Site Proteins 0.000 description 4
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Natural products O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 4
- 239000005547 deoxyribonucleotide Substances 0.000 description 4
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 4
- 230000011559 double-strand break repair via nonhomologous end joining Effects 0.000 description 4
- 230000002255 enzymatic effect Effects 0.000 description 4
- 229960000304 folic acid Drugs 0.000 description 4
- 235000019152 folic acid Nutrition 0.000 description 4
- 239000011724 folic acid Substances 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 125000001475 halogen functional group Chemical group 0.000 description 4
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 4
- 229910052739 hydrogen Inorganic materials 0.000 description 4
- 239000001257 hydrogen Substances 0.000 description 4
- 229960003786 inosine Drugs 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 210000004962 mammalian cell Anatomy 0.000 description 4
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 description 4
- 229920001542 oligosaccharide Polymers 0.000 description 4
- 150000002482 oligosaccharides Chemical class 0.000 description 4
- 239000010452 phosphate Substances 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 230000005783 single-strand break Effects 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 150000003431 steroids Chemical class 0.000 description 4
- 229960003087 tioguanine Drugs 0.000 description 4
- 150000003852 triazoles Chemical class 0.000 description 4
- 239000011782 vitamin Substances 0.000 description 4
- 235000013343 vitamin Nutrition 0.000 description 4
- 229940088594 vitamin Drugs 0.000 description 4
- 229930003231 vitamin Natural products 0.000 description 4
- LLJFNWVJKMVHIL-UHFFFAOYSA-N (2-methoxy-2-oxoethyl)phosphonic acid Chemical compound COC(=O)CP(O)(O)=O LLJFNWVJKMVHIL-UHFFFAOYSA-N 0.000 description 3
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 3
- ZAYHVCMSTBRABG-UHFFFAOYSA-N 5-Methylcytidine Natural products O=C1N=C(N)C(C)=CN1C1C(O)C(O)C(CO)O1 ZAYHVCMSTBRABG-UHFFFAOYSA-N 0.000 description 3
- VOBFOFTXJVSVTJ-UHFFFAOYSA-N 5-prop-2-enyl-1h-pyrimidine-2,4-dione Chemical compound C=CCC1=CNC(=O)NC1=O VOBFOFTXJVSVTJ-UHFFFAOYSA-N 0.000 description 3
- 229930024421 Adenine Natural products 0.000 description 3
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 3
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 3
- 108010051109 Cell-Penetrating Peptides Proteins 0.000 description 3
- 102000020313 Cell-Penetrating Peptides Human genes 0.000 description 3
- 108020004638 Circular DNA Proteins 0.000 description 3
- 108091026890 Coding region Proteins 0.000 description 3
- 102220605874 Cytosolic arginine sensor for mTORC1 subunit 2_D10A_mutation Human genes 0.000 description 3
- 230000007018 DNA scission Effects 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 3
- 101000889276 Homo sapiens Cytotoxic T-lymphocyte protein 4 Proteins 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 3
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 3
- 229960000643 adenine Drugs 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 3
- 125000005600 alkyl phosphonate group Chemical group 0.000 description 3
- 238000003491 array Methods 0.000 description 3
- 239000011324 bead Substances 0.000 description 3
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 3
- 230000002759 chromosomal effect Effects 0.000 description 3
- 238000005520 cutting process Methods 0.000 description 3
- 238000004520 electroporation Methods 0.000 description 3
- 210000003527 eukaryotic cell Anatomy 0.000 description 3
- 125000000524 functional group Chemical group 0.000 description 3
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 3
- 108010050848 glycylleucine Proteins 0.000 description 3
- 238000004128 high performance liquid chromatography Methods 0.000 description 3
- 108010025306 histidylleucine Proteins 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 108010057821 leucylproline Proteins 0.000 description 3
- 239000003446 ligand Substances 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 239000002105 nanoparticle Substances 0.000 description 3
- 108091027963 non-coding RNA Proteins 0.000 description 3
- 102000042567 non-coding RNA Human genes 0.000 description 3
- 210000004940 nucleus Anatomy 0.000 description 3
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 235000004252 protein component Nutrition 0.000 description 3
- 108010054624 red fluorescent protein Proteins 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000005945 translocation Effects 0.000 description 3
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 3
- 229940045145 uridine Drugs 0.000 description 3
- 108010073969 valyllysine Proteins 0.000 description 3
- XQCZBXHVTFVIFE-UHFFFAOYSA-N 2-amino-4-hydroxypyrimidine Chemical compound NC1=NC=CC(O)=N1 XQCZBXHVTFVIFE-UHFFFAOYSA-N 0.000 description 2
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 2
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 2
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 2
- 108091093088 Amplicon Proteins 0.000 description 2
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 2
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 2
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 2
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 2
- BDMIFVIWCNLDCT-CIUDSAMLSA-N Asn-Arg-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O BDMIFVIWCNLDCT-CIUDSAMLSA-N 0.000 description 2
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 2
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 2
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 2
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 108090001008 Avidin Proteins 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 101710201279 Biotin carboxyl carrier protein Proteins 0.000 description 2
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 2
- 229940045513 CTLA4 antagonist Drugs 0.000 description 2
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 2
- 101000709520 Chlamydia trachomatis serovar L2 (strain 434/Bu / ATCC VR-902B) Atypical response regulator protein ChxR Proteins 0.000 description 2
- 102000005636 Cyclic AMP Response Element-Binding Protein Human genes 0.000 description 2
- 108010045171 Cyclic AMP Response Element-Binding Protein Proteins 0.000 description 2
- 102100039498 Cytotoxic T-lymphocyte protein 4 Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 108010053770 Deoxyribonucleases Proteins 0.000 description 2
- 102000016911 Deoxyribonucleases Human genes 0.000 description 2
- YZCKVEUIGOORGS-OUBTZVSYSA-N Deuterium Chemical compound [2H] YZCKVEUIGOORGS-OUBTZVSYSA-N 0.000 description 2
- RTZKZFJDLAIYFH-UHFFFAOYSA-N Diethyl ether Chemical compound CCOCC RTZKZFJDLAIYFH-UHFFFAOYSA-N 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 108010067770 Endopeptidase K Proteins 0.000 description 2
- 108060002716 Exonuclease Proteins 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- MFORDNZDKAVNSR-SRVKXCTJSA-N Gln-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O MFORDNZDKAVNSR-SRVKXCTJSA-N 0.000 description 2
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 2
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 102100030385 Granzyme B Human genes 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 241000700721 Hepatitis B virus Species 0.000 description 2
- 108010068250 Herpes Simplex Virus Protein Vmw65 Proteins 0.000 description 2
- 101001055227 Homo sapiens Cytokine receptor common subunit gamma Proteins 0.000 description 2
- 101001009603 Homo sapiens Granzyme B Proteins 0.000 description 2
- 101001033000 Homo sapiens Granzyme H Proteins 0.000 description 2
- 241000725303 Human immunodeficiency virus Species 0.000 description 2
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 2
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 2
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 2
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 2
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 2
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 2
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 2
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 2
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 2
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 2
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 2
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 2
- 108020005196 Mitochondrial DNA Proteins 0.000 description 2
- 108010085220 Multiprotein Complexes Proteins 0.000 description 2
- 102000007474 Multiprotein Complexes Human genes 0.000 description 2
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 2
- 108010047562 NGR peptide Proteins 0.000 description 2
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 2
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 2
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 2
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 2
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 2
- 101710149951 Protein Tat Proteins 0.000 description 2
- 102100024261 Protocadherin alpha-4 Human genes 0.000 description 2
- 101710167874 Protocadherin alpha-4 Proteins 0.000 description 2
- 229930185560 Pseudouridine Natural products 0.000 description 2
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 2
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 2
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 2
- UYLKOSODXYSWMQ-XGEHTFHBSA-N Ser-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CO)N)O UYLKOSODXYSWMQ-XGEHTFHBSA-N 0.000 description 2
- 241000700584 Simplexvirus Species 0.000 description 2
- PFNFFQXMRSDOHW-UHFFFAOYSA-N Spermine Natural products NCCCNCCCCNCCCN PFNFFQXMRSDOHW-UHFFFAOYSA-N 0.000 description 2
- 108010090804 Streptavidin Proteins 0.000 description 2
- 101100166147 Streptococcus thermophilus cas9 gene Proteins 0.000 description 2
- 102100036407 Thioredoxin Human genes 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- DZBUGLKDJFMEHC-UHFFFAOYSA-N acridine Chemical compound C1=CC=CC2=CC3=CC=CC=C3N=C21 DZBUGLKDJFMEHC-UHFFFAOYSA-N 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 229960005305 adenosine Drugs 0.000 description 2
- 150000001336 alkenes Chemical class 0.000 description 2
- 150000001345 alkine derivatives Chemical class 0.000 description 2
- 125000003368 amide group Chemical group 0.000 description 2
- 150000001412 amines Chemical class 0.000 description 2
- 125000000539 amino acid group Chemical group 0.000 description 2
- 125000003277 amino group Chemical group 0.000 description 2
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 229960002685 biotin Drugs 0.000 description 2
- 235000020958 biotin Nutrition 0.000 description 2
- 239000011616 biotin Substances 0.000 description 2
- 210000001124 body fluid Anatomy 0.000 description 2
- 239000010839 body fluid Substances 0.000 description 2
- 125000001246 bromo group Chemical group Br* 0.000 description 2
- 102100029387 cAMP-responsive element modulator Human genes 0.000 description 2
- 101710152311 cAMP-responsive element modulator Proteins 0.000 description 2
- 125000003917 carbamoyl group Chemical group [H]N([H])C(*)=O 0.000 description 2
- 210000003855 cell nucleus Anatomy 0.000 description 2
- 102000021178 chitin binding proteins Human genes 0.000 description 2
- 108091011157 chitin binding proteins Proteins 0.000 description 2
- 125000001309 chloro group Chemical group Cl* 0.000 description 2
- 238000012761 co-transfection Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 239000013078 crystal Substances 0.000 description 2
- 210000004748 cultured cell Anatomy 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 229910052805 deuterium Inorganic materials 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 102000013165 exonuclease Human genes 0.000 description 2
- 230000001036 exonucleolytic effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 125000005842 heteroatom Chemical group 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 102000049902 human IL2RG Human genes 0.000 description 2
- 230000028993 immune response Effects 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 239000004615 ingredient Substances 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- 230000000155 isotopic effect Effects 0.000 description 2
- 238000001638 lipofection Methods 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 238000004895 liquid chromatography mass spectrometry Methods 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 108010005942 methionylglycine Proteins 0.000 description 2
- 238000002493 microarray Methods 0.000 description 2
- 231100000219 mutagenic Toxicity 0.000 description 2
- 230000003505 mutagenic effect Effects 0.000 description 2
- 230000006780 non-homologous end joining Effects 0.000 description 2
- 230000001293 nucleolytic effect Effects 0.000 description 2
- 239000002777 nucleoside Substances 0.000 description 2
- 230000030648 nucleus localization Effects 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 230000030589 organelle localization Effects 0.000 description 2
- 239000005022 packaging material Substances 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 210000005259 peripheral blood Anatomy 0.000 description 2
- 239000011886 peripheral blood Substances 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- UEZVMMHDMIWARA-UHFFFAOYSA-M phosphonate Chemical compound [O-]P(=O)=O UEZVMMHDMIWARA-UHFFFAOYSA-M 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 2
- 102000005962 receptors Human genes 0.000 description 2
- 108020003175 receptors Proteins 0.000 description 2
- WPPDXAHGCGPUPK-UHFFFAOYSA-N red 2 Chemical compound C1=CC=CC=C1C(C1=CC=CC=C11)=C(C=2C=3C4=CC=C5C6=CC=C7C8=C(C=9C=CC=CC=9)C9=CC=CC=C9C(C=9C=CC=CC=9)=C8C8=CC=C(C6=C87)C(C=35)=CC=2)C4=C1C1=CC=CC=C1 WPPDXAHGCGPUPK-UHFFFAOYSA-N 0.000 description 2
- 230000014493 regulation of gene expression Effects 0.000 description 2
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 238000004007 reversed phase HPLC Methods 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 229910052594 sapphire Inorganic materials 0.000 description 2
- 239000010980 sapphire Substances 0.000 description 2
- 239000000377 silicon dioxide Substances 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- 229940063675 spermine Drugs 0.000 description 2
- 125000000475 sulfinyl group Chemical group [*:2]S([*:1])=O 0.000 description 2
- 108700029760 synthetic LTSP Proteins 0.000 description 2
- 238000010381 tandem affinity purification Methods 0.000 description 2
- 108060008226 thioredoxin Proteins 0.000 description 2
- 229940094937 thioredoxin Drugs 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- 238000004448 titration Methods 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- OQGMXBRSTMPDTL-KQYNXXCUSA-N (2r,3r,4s,5r)-2-[2-amino-6-(methoxyamino)purin-9-yl]-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound C1=NC=2C(NOC)=NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OQGMXBRSTMPDTL-KQYNXXCUSA-N 0.000 description 1
- RRBGTUQJDFBWNN-MUGJNUQGSA-N (2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-2,6-diaminohexanoyl]amino]hexanoyl]amino]hexanoyl]amino]hexanoic acid Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O RRBGTUQJDFBWNN-MUGJNUQGSA-N 0.000 description 1
- FYGDTMLNYKFZSV-URKRLVJHSA-N (2s,3r,4s,5s,6r)-2-[(2r,4r,5r,6s)-4,5-dihydroxy-2-(hydroxymethyl)-6-[(2r,4r,5r,6s)-4,5,6-trihydroxy-2-(hydroxymethyl)oxan-3-yl]oxyoxan-3-yl]oxy-6-(hydroxymethyl)oxane-3,4,5-triol Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@H]1OC1[C@@H](CO)O[C@@H](OC2[C@H](O[C@H](O)[C@H](O)[C@H]2O)CO)[C@H](O)[C@H]1O FYGDTMLNYKFZSV-URKRLVJHSA-N 0.000 description 1
- QGKMIGUHVLGJBR-UHFFFAOYSA-M (4z)-1-(3-methylbutyl)-4-[[1-(3-methylbutyl)quinolin-1-ium-4-yl]methylidene]quinoline;iodide Chemical compound [I-].C12=CC=CC=C2N(CCC(C)C)C=CC1=CC1=CC=[N+](CCC(C)C)C2=CC=CC=C12 QGKMIGUHVLGJBR-UHFFFAOYSA-M 0.000 description 1
- 125000006273 (C1-C3) alkyl group Chemical group 0.000 description 1
- 229920002818 (Hydroxyethyl)methacrylate Polymers 0.000 description 1
- TWQVZFCNOMQQQV-UHFFFAOYSA-N 1,2,4-dithiazole-3-thione Chemical group S=C1N=CSS1 TWQVZFCNOMQQQV-UHFFFAOYSA-N 0.000 description 1
- OQCFWECOQNPQCG-UHFFFAOYSA-N 1,3,4,8-tetrahydropyrimido[4,5-c]oxazin-7-one Chemical compound C1CONC2=C1C=NC(=O)N2 OQCFWECOQNPQCG-UHFFFAOYSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- YMHOBZXQZVXHBM-UHFFFAOYSA-N 2,5-dimethoxy-4-bromophenethylamine Chemical compound COC1=CC(CCN)=C(OC)C=C1Br YMHOBZXQZVXHBM-UHFFFAOYSA-N 0.000 description 1
- GXPCCSYVSYFRDU-LJWNLINESA-N 2-[[(2s)-2-[[(2s)-2-[[2-[[(2s)-2-[[(2s)-2-amino-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]acetyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]acetic acid Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O)C1=CC=CC=C1 GXPCCSYVSYFRDU-LJWNLINESA-N 0.000 description 1
- YKUFMYSNUQLIQS-UHFFFAOYSA-N 2-amino-5-methyl-1h-pyrimidin-6-one Chemical compound CC1=CNC(N)=NC1=O YKUFMYSNUQLIQS-UHFFFAOYSA-N 0.000 description 1
- CRYCZDRIXVHNQB-UHFFFAOYSA-N 2-amino-8-bromo-3,7-dihydropurin-6-one Chemical compound N1C(N)=NC(=O)C2=C1N=C(Br)N2 CRYCZDRIXVHNQB-UHFFFAOYSA-N 0.000 description 1
- OTDJAMXESTUWLO-UUOKFMHZSA-N 2-amino-9-[(2R,3R,4S,5R)-3,4-dihydroxy-5-(hydroxymethyl)-2-oxolanyl]-3H-purine-6-thione Chemical class C12=NC(N)=NC(S)=C2N=CN1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OTDJAMXESTUWLO-UUOKFMHZSA-N 0.000 description 1
- UKVQBONVSSLJBB-UHFFFAOYSA-N 2-pyridin-2-ylacetonitrile Chemical compound N#CCC1=CC=CC=N1 UKVQBONVSSLJBB-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 108091027075 5S-rRNA precursor Proteins 0.000 description 1
- ZCYVEMRRCGMTRW-UHFFFAOYSA-N 7553-56-2 Chemical compound [I] ZCYVEMRRCGMTRW-UHFFFAOYSA-N 0.000 description 1
- UBKVUFQGVWHZIR-UHFFFAOYSA-N 8-oxoguanine Chemical compound O=C1NC(N)=NC2=NC(=O)N=C21 UBKVUFQGVWHZIR-UHFFFAOYSA-N 0.000 description 1
- 239000013607 AAV vector Substances 0.000 description 1
- 208000035657 Abasia Diseases 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical group CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 1
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 1
- NXSFUECZFORGOG-CIUDSAMLSA-N Ala-Asn-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NXSFUECZFORGOG-CIUDSAMLSA-N 0.000 description 1
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 1
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 1
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 1
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 1
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 1
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 1
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 1
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 1
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 1
- TVUFMYKTYXTRPY-HERUPUMHSA-N Ala-Trp-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O TVUFMYKTYXTRPY-HERUPUMHSA-N 0.000 description 1
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 1
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 1
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 1
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 1
- RRGPUNYIPJXJBU-GUBZILKMSA-N Arg-Asp-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O RRGPUNYIPJXJBU-GUBZILKMSA-N 0.000 description 1
- TTXYKSADPSNOIF-IHRRRGAJSA-N Arg-Asp-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O TTXYKSADPSNOIF-IHRRRGAJSA-N 0.000 description 1
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 1
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 1
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 1
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 1
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 1
- RKQRHMKFNBYOTN-IHRRRGAJSA-N Arg-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N RKQRHMKFNBYOTN-IHRRRGAJSA-N 0.000 description 1
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 1
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 1
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 1
- GRRXPUAICOGISM-RWMBFGLXSA-N Arg-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GRRXPUAICOGISM-RWMBFGLXSA-N 0.000 description 1
- PYZPXCZNQSEHDT-GUBZILKMSA-N Arg-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N PYZPXCZNQSEHDT-GUBZILKMSA-N 0.000 description 1
- KSUALAGYYLQSHJ-RCWTZXSCSA-N Arg-Met-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSUALAGYYLQSHJ-RCWTZXSCSA-N 0.000 description 1
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 1
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- YCYXHLZRUSJITQ-SRVKXCTJSA-N Arg-Pro-Pro Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 YCYXHLZRUSJITQ-SRVKXCTJSA-N 0.000 description 1
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 1
- AOJYORNRFWWEIV-IHRRRGAJSA-N Arg-Tyr-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 AOJYORNRFWWEIV-IHRRRGAJSA-N 0.000 description 1
- IZSMEUDYADKZTJ-KJEVXHAQSA-N Arg-Tyr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IZSMEUDYADKZTJ-KJEVXHAQSA-N 0.000 description 1
- FMYQECOAIFGQGU-CYDGBPFRSA-N Arg-Val-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMYQECOAIFGQGU-CYDGBPFRSA-N 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 1
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 1
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 1
- QYXNFROWLZPWPC-FXQIFTODSA-N Asn-Glu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QYXNFROWLZPWPC-FXQIFTODSA-N 0.000 description 1
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 1
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 1
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 1
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 1
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 1
- YUUIAUXBNOHFRJ-IHRRRGAJSA-N Asn-Phe-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O YUUIAUXBNOHFRJ-IHRRRGAJSA-N 0.000 description 1
- KTDWFWNZLLFEFU-KKUMJFAQSA-N Asn-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O KTDWFWNZLLFEFU-KKUMJFAQSA-N 0.000 description 1
- CGYKCTPUGXFPMG-IHPCNDPISA-N Asn-Tyr-Trp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CGYKCTPUGXFPMG-IHPCNDPISA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 1
- WSOKZUVWBXVJHX-CIUDSAMLSA-N Asp-Arg-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O WSOKZUVWBXVJHX-CIUDSAMLSA-N 0.000 description 1
- MFMJRYHVLLEMQM-DCAQKATOSA-N Asp-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N MFMJRYHVLLEMQM-DCAQKATOSA-N 0.000 description 1
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 1
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 1
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 1
- DXQOQMCLWWADMU-ACZMJKKPSA-N Asp-Gln-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DXQOQMCLWWADMU-ACZMJKKPSA-N 0.000 description 1
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 1
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 1
- TVIZQBFURPLQDV-DJFWLOJKSA-N Asp-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N TVIZQBFURPLQDV-DJFWLOJKSA-N 0.000 description 1
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 1
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 1
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 1
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 1
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 1
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 1
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 1
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 1
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 1
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 1
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 101710192393 Attachment protein G3P Proteins 0.000 description 1
- 108091005950 Azurite Proteins 0.000 description 1
- 108020000946 Bacterial DNA Proteins 0.000 description 1
- 229920002498 Beta-glucan Polymers 0.000 description 1
- 108091079001 CRISPR RNA Proteins 0.000 description 1
- 101150018129 CSF2 gene Proteins 0.000 description 1
- 101150069031 CSN2 gene Proteins 0.000 description 1
- 102000000584 Calmodulin Human genes 0.000 description 1
- 108010041952 Calmodulin Proteins 0.000 description 1
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 description 1
- 108010010737 Ceruletide Proteins 0.000 description 1
- 108010012236 Chemokines Proteins 0.000 description 1
- 102000019034 Chemokines Human genes 0.000 description 1
- 241000579895 Chlorostilbon Species 0.000 description 1
- 108091005960 Citrine Proteins 0.000 description 1
- 101150075848 Clta gene Proteins 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- 108020004394 Complementary RNA Proteins 0.000 description 1
- 102100031673 Corneodesmosin Human genes 0.000 description 1
- 101710139375 Corneodesmosin Proteins 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- 108091005943 CyPet Proteins 0.000 description 1
- 229920000858 Cyclodextrin Polymers 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical group OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 238000005698 Diels-Alder reaction Methods 0.000 description 1
- SHIBSTMRCDJXLN-UHFFFAOYSA-N Digoxigenin Natural products C1CC(C2C(C3(C)CCC(O)CC3CC2)CC2O)(O)C2(C)C1C1=CC(=O)OC1 SHIBSTMRCDJXLN-UHFFFAOYSA-N 0.000 description 1
- 108091005941 EBFP Proteins 0.000 description 1
- 108091005947 EBFP2 Proteins 0.000 description 1
- 108091005942 ECFP Proteins 0.000 description 1
- 235000016623 Fragaria vesca Nutrition 0.000 description 1
- 240000009088 Fragaria x ananassa Species 0.000 description 1
- 235000011363 Fragaria x ananassa Nutrition 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 108010001515 Galectin 4 Proteins 0.000 description 1
- 102100039556 Galectin-4 Human genes 0.000 description 1
- 101710179596 Gene 3 protein Proteins 0.000 description 1
- PHZYLYASFWHLHJ-FXQIFTODSA-N Gln-Asn-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PHZYLYASFWHLHJ-FXQIFTODSA-N 0.000 description 1
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 1
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 1
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 1
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 1
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 1
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 1
- NNXIQPMZGZUFJJ-AVGNSLFASA-N Gln-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N NNXIQPMZGZUFJJ-AVGNSLFASA-N 0.000 description 1
- GIVHPCWYVWUUSG-HVTMNAMFSA-N Gln-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GIVHPCWYVWUUSG-HVTMNAMFSA-N 0.000 description 1
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 1
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 1
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 1
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 1
- WTJIWXMJESRHMM-XDTLVQLUSA-N Gln-Tyr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O WTJIWXMJESRHMM-XDTLVQLUSA-N 0.000 description 1
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 1
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 1
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 1
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 1
- ZXQPJYWZSFGWJB-AVGNSLFASA-N Glu-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N ZXQPJYWZSFGWJB-AVGNSLFASA-N 0.000 description 1
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 1
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 1
- VOORMNJKNBGYGK-YUMQZZPRSA-N Glu-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N VOORMNJKNBGYGK-YUMQZZPRSA-N 0.000 description 1
- XOFYVODYSNKPDK-AVGNSLFASA-N Glu-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOFYVODYSNKPDK-AVGNSLFASA-N 0.000 description 1
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 1
- WTMZXOPHTIVFCP-QEWYBTABSA-N Glu-Ile-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WTMZXOPHTIVFCP-QEWYBTABSA-N 0.000 description 1
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 1
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 1
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 1
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 1
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 1
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 1
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 1
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 1
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 1
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 1
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 1
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 1
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 1
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 1
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 1
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 1
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 1
- RCHFYMASWAZQQZ-ZANVPECISA-N Gly-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)CN)=CNC2=C1 RCHFYMASWAZQQZ-ZANVPECISA-N 0.000 description 1
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 1
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- 102000001554 Hemoglobins Human genes 0.000 description 1
- 108010054147 Hemoglobins Proteins 0.000 description 1
- IPIVXQQRZXEUGW-UWJYBYFXSA-N His-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IPIVXQQRZXEUGW-UWJYBYFXSA-N 0.000 description 1
- XINDHUAGVGCNSF-QSFUFRPTSA-N His-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XINDHUAGVGCNSF-QSFUFRPTSA-N 0.000 description 1
- SVHKVHBPTOMLTO-DCAQKATOSA-N His-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SVHKVHBPTOMLTO-DCAQKATOSA-N 0.000 description 1
- MVADCDSCFTXCBT-CIUDSAMLSA-N His-Asp-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MVADCDSCFTXCBT-CIUDSAMLSA-N 0.000 description 1
- IMCHNUANCIGUKS-SRVKXCTJSA-N His-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IMCHNUANCIGUKS-SRVKXCTJSA-N 0.000 description 1
- XMENRVZYPBKBIL-AVGNSLFASA-N His-Glu-His Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XMENRVZYPBKBIL-AVGNSLFASA-N 0.000 description 1
- JCOSMKPAOYDKRO-AVGNSLFASA-N His-Glu-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N JCOSMKPAOYDKRO-AVGNSLFASA-N 0.000 description 1
- ZSKJIISDJXJQPV-BZSNNMDCSA-N His-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 ZSKJIISDJXJQPV-BZSNNMDCSA-N 0.000 description 1
- SVVULKPWDBIPCO-BZSNNMDCSA-N His-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SVVULKPWDBIPCO-BZSNNMDCSA-N 0.000 description 1
- WCHONUZTYDQMBY-PYJNHQTQSA-N His-Pro-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WCHONUZTYDQMBY-PYJNHQTQSA-N 0.000 description 1
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 1
- 102000008157 Histone Demethylases Human genes 0.000 description 1
- 108010074870 Histone Demethylases Proteins 0.000 description 1
- 102000011787 Histone Methyltransferases Human genes 0.000 description 1
- 108010036115 Histone Methyltransferases Proteins 0.000 description 1
- 102000003893 Histone acetyltransferases Human genes 0.000 description 1
- 108090000246 Histone acetyltransferases Proteins 0.000 description 1
- 102000043851 Histone deacetylase domains Human genes 0.000 description 1
- 108700038236 Histone deacetylase domains Proteins 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 101100006533 Homo sapiens CLTA gene Proteins 0.000 description 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 101001116937 Homo sapiens Protocadherin alpha-4 Proteins 0.000 description 1
- 101000766306 Homo sapiens Serotransferrin Proteins 0.000 description 1
- 101000831496 Homo sapiens Toll-like receptor 3 Proteins 0.000 description 1
- 101000669402 Homo sapiens Toll-like receptor 7 Proteins 0.000 description 1
- 101000800483 Homo sapiens Toll-like receptor 8 Proteins 0.000 description 1
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 1
- 108700003968 Human immunodeficiency virus 1 tat peptide (49-57) Proteins 0.000 description 1
- WOBHKFSMXKNTIM-UHFFFAOYSA-N Hydroxyethyl methacrylate Chemical compound CC(=C)C(=O)OCCO WOBHKFSMXKNTIM-UHFFFAOYSA-N 0.000 description 1
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 1
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 1
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 1
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 1
- KUHFPGIVBOCRMV-MNXVOIDGSA-N Ile-Gln-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N KUHFPGIVBOCRMV-MNXVOIDGSA-N 0.000 description 1
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 1
- LGMUPVWZEYYUMU-YVNDNENWSA-N Ile-Glu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LGMUPVWZEYYUMU-YVNDNENWSA-N 0.000 description 1
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 1
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 1
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 1
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 1
- HYLIOBDWPQNLKI-HVTMNAMFSA-N Ile-His-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HYLIOBDWPQNLKI-HVTMNAMFSA-N 0.000 description 1
- HUWYGQOISIJNMK-SIGLWIIPSA-N Ile-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HUWYGQOISIJNMK-SIGLWIIPSA-N 0.000 description 1
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 1
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 1
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 1
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 1
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 1
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 1
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 1
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 1
- RVNOXPZHMUWCLW-GMOBBJLQSA-N Ile-Met-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RVNOXPZHMUWCLW-GMOBBJLQSA-N 0.000 description 1
- RCMNUBZKIIJCOI-ZPFDUUQYSA-N Ile-Met-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RCMNUBZKIIJCOI-ZPFDUUQYSA-N 0.000 description 1
- CIDLJWVDMNDKPT-FIRPJDEBSA-N Ile-Phe-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N CIDLJWVDMNDKPT-FIRPJDEBSA-N 0.000 description 1
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 1
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- JSLIXOUMAOUGBN-JUKXBJQTSA-N Ile-Tyr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JSLIXOUMAOUGBN-JUKXBJQTSA-N 0.000 description 1
- DLEBSGAVWRPTIX-PEDHHIEDSA-N Ile-Val-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)[C@@H](C)CC DLEBSGAVWRPTIX-PEDHHIEDSA-N 0.000 description 1
- SWNRZNLXMXRCJC-VKOGCVSHSA-N Ile-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 SWNRZNLXMXRCJC-VKOGCVSHSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 102000012355 Integrin beta1 Human genes 0.000 description 1
- 108010022222 Integrin beta1 Proteins 0.000 description 1
- 101710198693 Invasin Proteins 0.000 description 1
- 229930194542 Keto Natural products 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- UBORTCNDUKBEOP-UHFFFAOYSA-N L-xanthosine Natural products OC1C(O)C(CO)OC1N1C(NC(=O)NC2=O)=C2N=C1 UBORTCNDUKBEOP-UHFFFAOYSA-N 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 1
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 1
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- GOFJOGXGMPHOGL-DCAQKATOSA-N Leu-Ser-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C GOFJOGXGMPHOGL-DCAQKATOSA-N 0.000 description 1
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 1
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 1
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 1
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 1
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 1
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 1
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 1
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 1
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 1
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 1
- PHHYNOUOUWYQRO-XIRDDKMYSA-N Lys-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N PHHYNOUOUWYQRO-XIRDDKMYSA-N 0.000 description 1
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 1
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 1
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 1
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 1
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 1
- WGLAORUKDGRINI-WDCWCFNPSA-N Lys-Glu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGLAORUKDGRINI-WDCWCFNPSA-N 0.000 description 1
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 1
- XNKDCYABMBBEKN-IUCAKERBSA-N Lys-Gly-Gln Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O XNKDCYABMBBEKN-IUCAKERBSA-N 0.000 description 1
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 1
- SPCHLZUWJTYZFC-IHRRRGAJSA-N Lys-His-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O SPCHLZUWJTYZFC-IHRRRGAJSA-N 0.000 description 1
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 1
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 1
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 1
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- KJIXWRWPOCKYLD-IHRRRGAJSA-N Lys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N KJIXWRWPOCKYLD-IHRRRGAJSA-N 0.000 description 1
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 1
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 1
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 1
- WQDKIVRHTQYJSN-DCAQKATOSA-N Lys-Ser-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WQDKIVRHTQYJSN-DCAQKATOSA-N 0.000 description 1
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 1
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 1
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 1
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 1
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 1
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 1
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 1
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 1
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 1
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 1
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 1
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 1
- FZUNSVYYPYJYAP-NAKRPEOUSA-N Met-Ile-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O FZUNSVYYPYJYAP-NAKRPEOUSA-N 0.000 description 1
- QGRJTULYDZUBAY-ZPFDUUQYSA-N Met-Ile-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGRJTULYDZUBAY-ZPFDUUQYSA-N 0.000 description 1
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 1
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 1
- KSIPKXNIQOWMIC-RCWTZXSCSA-N Met-Thr-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KSIPKXNIQOWMIC-RCWTZXSCSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- VVQNEPGJFQJSBK-UHFFFAOYSA-N Methyl methacrylate Chemical compound COC(=O)C(C)=C VVQNEPGJFQJSBK-UHFFFAOYSA-N 0.000 description 1
- 102000006890 Methyl-CpG-Binding Protein 2 Human genes 0.000 description 1
- 108010072388 Methyl-CpG-Binding Protein 2 Proteins 0.000 description 1
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 102000016397 Methyltransferase Human genes 0.000 description 1
- 241000192041 Micrococcus Species 0.000 description 1
- 108010086093 Mung Bean Nuclease Proteins 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- MRWXACSTFXYYMV-UHFFFAOYSA-N Nebularine Natural products OC1C(O)C(CO)OC1N1C2=NC=NC=C2N=C1 MRWXACSTFXYYMV-UHFFFAOYSA-N 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 101100385413 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) csm-3 gene Proteins 0.000 description 1
- 101100083259 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) pho-4 gene Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 108010088535 Pep-1 peptide Proteins 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 1
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 1
- SWZKMTDPQXLQRD-XVSYOHENSA-N Phe-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWZKMTDPQXLQRD-XVSYOHENSA-N 0.000 description 1
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 1
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 1
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 1
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 1
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 1
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 1
- BSHMIVKDJQGLNT-ACRUOGEOSA-N Phe-Lys-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 BSHMIVKDJQGLNT-ACRUOGEOSA-N 0.000 description 1
- TXJJXEXCZBHDNA-ACRUOGEOSA-N Phe-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N TXJJXEXCZBHDNA-ACRUOGEOSA-N 0.000 description 1
- RBRNEFJTEHPDSL-ACRUOGEOSA-N Phe-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 RBRNEFJTEHPDSL-ACRUOGEOSA-N 0.000 description 1
- DBNGDEAQXGFGRA-ACRUOGEOSA-N Phe-Tyr-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DBNGDEAQXGFGRA-ACRUOGEOSA-N 0.000 description 1
- YUPRIZTWANWWHK-DZKIICNBSA-N Phe-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N YUPRIZTWANWWHK-DZKIICNBSA-N 0.000 description 1
- ABLZXFCXXLZCGV-UHFFFAOYSA-N Phosphorous acid Chemical group OP(O)=O ABLZXFCXXLZCGV-UHFFFAOYSA-N 0.000 description 1
- 229920000388 Polyphosphate Polymers 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- 239000004372 Polyvinyl alcohol Substances 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- OBVCYFIHIIYIQF-CIUDSAMLSA-N Pro-Asn-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OBVCYFIHIIYIQF-CIUDSAMLSA-N 0.000 description 1
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 1
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 1
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 1
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 1
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 1
- CDGABSWLRMECHC-IHRRRGAJSA-N Pro-Lys-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CDGABSWLRMECHC-IHRRRGAJSA-N 0.000 description 1
- FNGOXVQBBCMFKV-CIUDSAMLSA-N Pro-Ser-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O FNGOXVQBBCMFKV-CIUDSAMLSA-N 0.000 description 1
- QDDJNKWPTJHROJ-UFYCRDLUSA-N Pro-Tyr-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 QDDJNKWPTJHROJ-UFYCRDLUSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 108010003201 RGH 0205 Proteins 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 108091030071 RNAI Proteins 0.000 description 1
- 101100047461 Rattus norvegicus Trpm8 gene Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 108020004422 Riboswitch Proteins 0.000 description 1
- 235000011034 Rubus glaucus Nutrition 0.000 description 1
- 244000235659 Rubus idaeus Species 0.000 description 1
- 235000009122 Rubus idaeus Nutrition 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 101001025539 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Homothallic switching endonuclease Proteins 0.000 description 1
- 229920005654 Sephadex Polymers 0.000 description 1
- 239000012507 Sephadex™ Substances 0.000 description 1
- 229920002684 Sepharose Polymers 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- KYKKKSWGEPFUMR-NAKRPEOUSA-N Ser-Arg-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KYKKKSWGEPFUMR-NAKRPEOUSA-N 0.000 description 1
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 1
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 1
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 1
- BQWCDDAISCPDQV-XHNCKOQMSA-N Ser-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N)C(=O)O BQWCDDAISCPDQV-XHNCKOQMSA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 1
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 1
- WEQAYODCJHZSJZ-KKUMJFAQSA-N Ser-His-Tyr Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 WEQAYODCJHZSJZ-KKUMJFAQSA-N 0.000 description 1
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 1
- LWMQRHDTXHQQOV-MXAVVETBSA-N Ser-Ile-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LWMQRHDTXHQQOV-MXAVVETBSA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 1
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 1
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 108091027967 Small hairpin RNA Proteins 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 101100166144 Staphylococcus aureus cas9 gene Proteins 0.000 description 1
- 241000194017 Streptococcus Species 0.000 description 1
- 241000194020 Streptococcus thermophilus Species 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 230000024932 T cell mediated immunity Effects 0.000 description 1
- 239000004809 Teflon Substances 0.000 description 1
- 229920006362 Teflon® Polymers 0.000 description 1
- 101710192266 Tegument protein VP22 Proteins 0.000 description 1
- 206010043395 Thalassaemia sickle cell Diseases 0.000 description 1
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 1
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 1
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 1
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 1
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 1
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 1
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 1
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 1
- VULNJDORNLBPNG-SWRJLBSHSA-N Thr-Glu-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VULNJDORNLBPNG-SWRJLBSHSA-N 0.000 description 1
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- YSXYEJWDHBCTDJ-DVJZZOLTSA-N Thr-Gly-Trp Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O YSXYEJWDHBCTDJ-DVJZZOLTSA-N 0.000 description 1
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 1
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 1
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 1
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 1
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 1
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 1
- BGHVVGPELPHRCI-HZTRNQAASA-N Thr-Trp-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)N)O BGHVVGPELPHRCI-HZTRNQAASA-N 0.000 description 1
- ABCLYRRGTZNIFU-BWAGICSOSA-N Thr-Tyr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O ABCLYRRGTZNIFU-BWAGICSOSA-N 0.000 description 1
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 1
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 1
- 102000002689 Toll-like receptor Human genes 0.000 description 1
- 108020000411 Toll-like receptor Proteins 0.000 description 1
- 102100024324 Toll-like receptor 3 Human genes 0.000 description 1
- 102100039390 Toll-like receptor 7 Human genes 0.000 description 1
- 102100033110 Toll-like receptor 8 Human genes 0.000 description 1
- 102000005747 Transcription Factor RelA Human genes 0.000 description 1
- 108010031154 Transcription Factor RelA Proteins 0.000 description 1
- 102100038313 Transcription factor E2-alpha Human genes 0.000 description 1
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 1
- 108010033576 Transferrin Receptors Proteins 0.000 description 1
- 102100026144 Transferrin receptor protein 1 Human genes 0.000 description 1
- UJRIVCPPPMYCNA-HOCLYGCPSA-N Trp-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N UJRIVCPPPMYCNA-HOCLYGCPSA-N 0.000 description 1
- IYHRKILQAQWODS-VJBMBRPKSA-N Trp-Trp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IYHRKILQAQWODS-VJBMBRPKSA-N 0.000 description 1
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 1
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 1
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 1
- KIJLSRYAUGGZIN-CFMVVWHZSA-N Tyr-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KIJLSRYAUGGZIN-CFMVVWHZSA-N 0.000 description 1
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 1
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 1
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 1
- JXGUUJMPCRXMSO-HJOGWXRNSA-N Tyr-Phe-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 JXGUUJMPCRXMSO-HJOGWXRNSA-N 0.000 description 1
- VBFVQTPETKJCQW-RPTUDFQQSA-N Tyr-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VBFVQTPETKJCQW-RPTUDFQQSA-N 0.000 description 1
- RCMWNNJFKNDKQR-UFYCRDLUSA-N Tyr-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 RCMWNNJFKNDKQR-UFYCRDLUSA-N 0.000 description 1
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 1
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 1
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 1
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 1
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 1
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 1
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 1
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 1
- VLOYGOZDPGYWFO-LAEOZQHASA-N Val-Asp-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VLOYGOZDPGYWFO-LAEOZQHASA-N 0.000 description 1
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 1
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 1
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 1
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 1
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 1
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 1
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 1
- JVGHIFMSFBZDHH-WPRPVWTQSA-N Val-Met-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N JVGHIFMSFBZDHH-WPRPVWTQSA-N 0.000 description 1
- UEPLNXPLHJUYPT-AVGNSLFASA-N Val-Met-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O UEPLNXPLHJUYPT-AVGNSLFASA-N 0.000 description 1
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 1
- MIAZWUMFUURQNP-YDHLFZDLSA-N Val-Tyr-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N MIAZWUMFUURQNP-YDHLFZDLSA-N 0.000 description 1
- VTIAEOKFUJJBTC-YDHLFZDLSA-N Val-Tyr-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VTIAEOKFUJJBTC-YDHLFZDLSA-N 0.000 description 1
- GUIYPEKUEMQBIK-JSGCOSHPSA-N Val-Tyr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)NCC(O)=O GUIYPEKUEMQBIK-JSGCOSHPSA-N 0.000 description 1
- 241000545067 Venus Species 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 108091060592 XDNA Proteins 0.000 description 1
- UBORTCNDUKBEOP-HAVMAKPUSA-N Xanthosine Natural products O[C@@H]1[C@H](O)[C@H](CO)O[C@H]1N1C(NC(=O)NC2=O)=C2N=C1 UBORTCNDUKBEOP-HAVMAKPUSA-N 0.000 description 1
- 108091029474 Y RNA Proteins 0.000 description 1
- JCAQMQLAHNGVPY-UUOKFMHZSA-N [(2r,3s,4r,5r)-3,4-dihydroxy-5-(2,2,4-trioxo-1h-imidazo[4,5-c][1,2,6]thiadiazin-7-yl)oxolan-2-yl]methyl dihydrogen phosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(NS(=O)(=O)NC2=O)=C2N=C1 JCAQMQLAHNGVPY-UUOKFMHZSA-N 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 108010081404 acein-2 Proteins 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 108010047495 alanylglycine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 125000000129 anionic group Chemical group 0.000 description 1
- 239000007798 antifreeze agent Substances 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 1
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- IVRMZWNICZWHMI-UHFFFAOYSA-N azide group Chemical group [N-]=[N+]=[N-] IVRMZWNICZWHMI-UHFFFAOYSA-N 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 125000002619 bicyclic group Chemical group 0.000 description 1
- 229920002988 biodegradable polymer Polymers 0.000 description 1
- 239000004621 biodegradable polymer Substances 0.000 description 1
- 229920001222 biopolymer Polymers 0.000 description 1
- 108091005948 blue fluorescent proteins Proteins 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 125000002915 carbonyl group Chemical group [*:2]C([*:1])=O 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 239000013592 cell lysate Substances 0.000 description 1
- 210000004671 cell-free system Anatomy 0.000 description 1
- YRALAIOMGQZKOW-HYAOXDFASA-N ceruletide Chemical compound C([C@@H](C(=O)N[C@H](C(=O)NCC(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(N)=O)[C@@H](C)O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H]1NC(=O)CC1)C1=CC=C(OS(O)(=O)=O)C=C1 YRALAIOMGQZKOW-HYAOXDFASA-N 0.000 description 1
- 150000005829 chemical entities Chemical class 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 210000001726 chromosome structure Anatomy 0.000 description 1
- 239000011035 citrine Substances 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 238000010668 complexation reaction Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 229920001577 copolymer Polymers 0.000 description 1
- 101150055601 cops2 gene Proteins 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 239000012043 crude product Substances 0.000 description 1
- 108010082025 cyan fluorescent protein Proteins 0.000 description 1
- ATDGTVJJHBUTRL-UHFFFAOYSA-N cyanogen bromide Chemical compound BrC#N ATDGTVJJHBUTRL-UHFFFAOYSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 231100000433 cytotoxic Toxicity 0.000 description 1
- 230000001472 cytotoxic effect Effects 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000012350 deep sequencing Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 150000001993 dienes Chemical group 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- QONQRTHLHBTMGP-UHFFFAOYSA-N digitoxigenin Natural products CC12CCC(C3(CCC(O)CC3CC3)C)C3C11OC1CC2C1=CC(=O)OC1 QONQRTHLHBTMGP-UHFFFAOYSA-N 0.000 description 1
- SHIBSTMRCDJXLN-KCZCNTNESA-N digoxigenin Chemical compound C1([C@@H]2[C@@]3([C@@](CC2)(O)[C@H]2[C@@H]([C@@]4(C)CC[C@H](O)C[C@H]4CC2)C[C@H]3O)C)=CC(=O)OC1 SHIBSTMRCDJXLN-KCZCNTNESA-N 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 239000010976 emerald Substances 0.000 description 1
- 229910052876 emerald Inorganic materials 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000007515 enzymatic degradation Effects 0.000 description 1
- 125000004185 ester group Chemical group 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 239000010419 fine particle Substances 0.000 description 1
- 108010021843 fluorescent protein 583 Proteins 0.000 description 1
- 239000011888 foil Substances 0.000 description 1
- 238000003197 gene knockdown Methods 0.000 description 1
- 230000009368 gene silencing by RNA Effects 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 229910052736 halogen Inorganic materials 0.000 description 1
- 125000005843 halogen group Chemical group 0.000 description 1
- 150000002367 halogens Chemical class 0.000 description 1
- 125000004404 heteroalkyl group Chemical group 0.000 description 1
- 125000000623 heterocyclic group Chemical group 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 102000043321 human CTLA4 Human genes 0.000 description 1
- 102000057930 human PCDHA4 Human genes 0.000 description 1
- 150000002430 hydrocarbons Chemical class 0.000 description 1
- 210000000987 immune system Anatomy 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 229910052740 iodine Inorganic materials 0.000 description 1
- 239000011630 iodine Substances 0.000 description 1
- 125000002346 iodo group Chemical group I* 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 150000002540 isothiocyanates Chemical class 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 125000000468 ketone group Chemical group 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 239000008176 lyophilized powder Substances 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 238000001819 mass spectrum Methods 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 150000004702 methyl esters Chemical class 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 208000025113 myeloid leukemia Diseases 0.000 description 1
- HOGDNTQCSIKEEV-UHFFFAOYSA-N n'-hydroxybutanediamide Chemical compound NC(=O)CCC(=O)NO HOGDNTQCSIKEEV-UHFFFAOYSA-N 0.000 description 1
- MRWXACSTFXYYMV-FDDDBJFASA-N nebularine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC=C2N=C1 MRWXACSTFXYYMV-FDDDBJFASA-N 0.000 description 1
- 150000003833 nucleoside derivatives Chemical class 0.000 description 1
- 229940124276 oligodeoxyribonucleotide Drugs 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 239000000123 paper Substances 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- LFGREXWGYUGZLY-UHFFFAOYSA-N phosphoryl Chemical group [P]=O LFGREXWGYUGZLY-UHFFFAOYSA-N 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 108010025488 pinealon Proteins 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 108010011110 polyarginine Proteins 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 239000001205 polyphosphate Substances 0.000 description 1
- 235000011176 polyphosphates Nutrition 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 229920002451 polyvinyl alcohol Polymers 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 235000019419 proteases Nutrition 0.000 description 1
- 125000006239 protecting group Chemical group 0.000 description 1
- 125000000714 pyrimidinyl group Chemical group 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 1
- HFHDHCJBZVLPGP-UHFFFAOYSA-N schardinger α-dextrin Chemical compound O1C(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(O)C2O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC2C(O)C(O)C1OC2CO HFHDHCJBZVLPGP-UHFFFAOYSA-N 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 1
- 208000007056 sickle cell anemia Diseases 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
- 229910052814 silicon oxide Inorganic materials 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000004055 small Interfering RNA Substances 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 125000000547 substituted alkyl group Chemical group 0.000 description 1
- 125000000446 sulfanediyl group Chemical group *S* 0.000 description 1
- YRALAIOMGQZKOW-UHFFFAOYSA-N sulfated caerulein Natural products C=1C=CC=CC=1CC(C(N)=O)NC(=O)C(CC(O)=O)NC(=O)C(CCSC)NC(=O)C(CC=1C2=CC=CC=C2NC=1)NC(=O)CNC(=O)C(C(C)O)NC(=O)C(NC(=O)C(CC(O)=O)NC(=O)C(CCC(N)=O)NC(=O)C1NC(=O)CC1)CC1=CC=C(OS(O)(=O)=O)C=C1 YRALAIOMGQZKOW-UHFFFAOYSA-N 0.000 description 1
- 238000005486 sulfidation Methods 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 229920002994 synthetic fiber Polymers 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 125000002813 thiocarbonyl group Chemical group *C(*)=S 0.000 description 1
- 125000003396 thiol group Chemical group [H]S* 0.000 description 1
- 150000003573 thiols Chemical group 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 239000012096 transfection reagent Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- GWBUNZLLLLDXMD-UHFFFAOYSA-H tricopper;dicarbonate;dihydroxide Chemical compound [OH-].[OH-].[Cu+2].[Cu+2].[Cu+2].[O-]C([O-])=O.[O-]C([O-])=O GWBUNZLLLLDXMD-UHFFFAOYSA-H 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
- 108010012567 tyrosyl-glycyl-glycyl-phenylalanyl Proteins 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- 150000003722 vitamin derivatives Chemical class 0.000 description 1
- 238000002424 x-ray crystallography Methods 0.000 description 1
- UBORTCNDUKBEOP-UUOKFMHZSA-N xanthosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(NC(=O)NC2=O)=C2N=C1 UBORTCNDUKBEOP-UUOKFMHZSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H21/00—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
- C07H21/02—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with ribosyl as saccharide radical
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/31—Chemical structure of the backbone
- C12N2310/312—Phosphonates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/31—Chemical structure of the backbone
- C12N2310/315—Phosphorothioates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/32—Chemical structure of the sugar
- C12N2310/321—2'-O-R Modification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/32—Chemical structure of the sugar
- C12N2310/322—2'-R Modification
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/32—Chemical structure of the sugar
- C12N2310/323—Chemical structure of the sugar modified ring structure
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/32—Chemical structure of the sugar
- C12N2310/323—Chemical structure of the sugar modified ring structure
- C12N2310/3231—Chemical structure of the sugar modified ring structure having an additional ring, e.g. LNA, ENA
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/33—Chemical structure of the base
- C12N2310/333—Modified A
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/33—Chemical structure of the base
- C12N2310/335—Modified T or U
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/34—Spatial arrangement of the modifications
- C12N2310/346—Spatial arrangement of the modifications having a combination of backbone and sugar modifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/35—Nature of the modification
- C12N2310/351—Conjugate
- C12N2310/3517—Marker; Tag
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/50—Physical structure
- C12N2310/53—Physical structure partially self-complementary or closed
- C12N2310/531—Stem-loop; Hairpin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/50—Methods for regulating/modulating their activity
- C12N2320/51—Methods for regulating/modulating their activity modulating the chemical stability, e.g. nuclease-resistance
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/50—Methods for regulating/modulating their activity
- C12N2320/53—Methods for regulating/modulating their activity reducing unwanted side-effects
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2330/00—Production
- C12N2330/30—Production chemically synthesised
- C12N2330/31—Libraries, arrays
Abstract
본 발명은 변형된 가이드 RNA, 및 간헐적으로 반복되는 회문구조 염기서열 집합체(크리스퍼)/크리스퍼-결합된(Cas) 시스템에서의 그의 용도에 관한 것이다.
Description
본 발명은 분자 생물학 분야에 관한 것이다. 특히, 본 발명은 간헐적으로 반복되는 회문구조 염기서열 집합체(크리스퍼(CRISPR)) 기술에 관한 것이다.
고유 원핵생물 크리스퍼-Cas 시스템은 일정한 길이의 개재 가변 서열을 갖는 짧은 반복부의 배열(즉 간헐적으로 반복되는 회문구조 염기서열 집합체, 또는 "크리스퍼") 및 크리스퍼-결합된("Cas") 단백질을 포함한다. 전사된 크리스퍼 배열의 RNA는 상기 Cas 단백질의 부분집합에 의해 작은 가이드 RNA(일반적으로 하기에 논의되는 바와 같은 2개의 성분을 갖는다)로 가공된다. 적어도 3개의 상이한 시스템들: I형, II형 및 III형이 존재한다. 상기 RNA의 성숙한 crRNA로의 가공에 관련된 효소들은 상기 3개의 시스템에서 상이하다. 고유 원핵생물 시스템에서, 상기 가이드 RNA("gRNA")는 크리스퍼 RNA("crRNA") 및 트랜스-작용 RNA("tracrRNA")라 칭하는 2개의 짧은, 비-암호화 RNA 종들을 포함한다. 예시적인 시스템에서, 상기 gRNA는 Cas 뉴클레아제와 복합체를 형성한다. 상기 gRNA:Cas 뉴클레아제 복합체는 프로토스페이서(protospacer) 인접 동기("PAM") 및 프로토스페이서를 갖는 표적 폴리뉴클레오타이드 서열(상기 gRNA의 일부에 상보성인 서열이다)에 결합한다. 상기 gRNA:Cas 뉴클레아제 복합체에 의한 상기 표적 폴리뉴클레오타이드의 인식 및 결합은 상기 표적 폴리뉴클레오타이드의 절단을 유도한다. 상기 고유 크리스퍼-Cas 시스템은 원핵생물에서 면역 시스템으로서 기능하며, 이때 gRNA:Cas 뉴클레아제 복합체는 진핵생물 유기체에서 RNAi와 유사한 방식으로 외인성 유전 요소를 인식하고 침묵시키며, 이에 의해 외인성 유전 요소, 예를 들어 플라스미드 및 파지에 대한 내성을 부여한다.
단일-가이드 RNA("sgRNA")가 천연 crRNA와 tracrRNA 간에 형성된 복합체를 대체할 수 있음이 입증되었다.
sgRNA를 포함한 gRNA의 개발과 관련된 고려사항은 특이성, 안정성 및 기능성을 포함한다. 특이성은 특정한 gRNA:Cas 뉴클레아제 복합체가 목적하는 표적 서열에 결합하고/하거나 상기 서열을 절단하는 능력을 지칭하는 반면, 목적하는 표적으로부터 서열 및/또는 위치가 상이한 폴리뉴클레오타이드의 결합 및/또는 절단은 거의 또는 전혀 발생하지 않는다. 따라서, 특이성은 상기 gRNA:Cas 뉴클레아제 복합체의 표적-외 효과를 최소화함을 지칭한다. 안정성은 효소, 예를 들어 뉴클레아제, 및 세포-내 및 세포-외 환경에 존재하는 다른 물질들에 의한 분해에 저항하는 상기 gRNA의 능력을 지칭한다.
따라서, 핵산분해적 분해에 대한 증가된 내성, 표적 폴리뉴클레오타이드에 대한 증가된 결합 친화성, 및/또는 감소된 표적-외 효과를 갖는 반면, 그럼에도 불구하고 gRNA 기능성을 갖는, sgRNA를 포함한 gRNA를 제공할 필요가 있다. gRNA의 개발과 관련된 추가의 고려사항은 형질감염성 및 면역자극 성질을 포함한다. 따라서, 세포, 특히 진핵생물 세포의 핵내로의 효율적이고 적정 가능한 형질감염성을 갖고 형질감염된 세포에서 면역자극 성질을 최소로 갖거나 갖지 않는, sgRNA를 포함한 gRNA를 제공할 필요가 있다. gRNA에 대한 또 다른 중요한 고려사항은 목적하는 gRNA 기능성을 허용하기에 충분한 기간 동안 상기 gRNA를 목적하는 세포, 조직, 체액 또는 유기체내로 전달하고 여기에서 유지시키기에 유효한 수단을 제공하는 것이다.
도 1은 예시적인 크리스퍼-Cas 시스템의 도식적 모델을 도시하는 다이어그램 세트이다. 여기에 도시된 예시적인 시스템은 Cas 뉴클레아제를 갖는 II형 시스템이다. 본 특정 예에서, 상기 Cas 뉴클레아제는 Cas9 뉴클레아제이다. 상기 Cas9 뉴클레아제는 PAM 서열[여기에서 상기 PAM 서열은 NGG의 3-nt 서열(이때 N은 A, G, C 또는 T이다)이나, 다른 PAM 서열들도 존재하는 것으로 공지되어 있다]을 인식한다. 상기 sgRNA는 가이드 서열, crRNA 서열 또는 분절, 및 tracrRNA 서열 또는 분절을 포함한다. 상기 sgRNA의 가이드 서열은 상기 PAM 서열의 바로 상류의 DNA 표적과 하이브리드화한다. 여기에 도시된 예에서, Cas9는 상기 PAM 서열(화살표) 상류의 이중-가닥 끊김을 매개한다.
도 2a는 예시적인 크리스퍼-Cas9-매개된 절단 분석을 도시하는 다이어그램이다.
도 2b는 도 4의 데이터를 생성시키는데 사용되는 생화학적 절단 분석에 대한 성분들 및 그들의 농도를 도시하는 표이다.
도 2c는 상기 생화학적 절단 분석을 위한 스트렙토코커스 피오게네스(Streptococcus pyogenes) Cas9 뉴클레아제의 적정을 도시하는 다이어그램이다.
도 2d는 상기 생화학적 절단 분석을 위한 예시적인 sgRNA의 적정을 도시하는 다이어그램이다. 본 예에서 kanC1이라 명명하는 sgRNA는 가나마이신 내성 유전자 중의 상보성 서열에 표적화된다.
도 3은 시험관내에서 정제된 성분을 사용하는 상기 생화학적 절단 분석에 예시적인 조건 및 과정을 도시한다.
도 4는 상기 절단 분석에서 예시적인 변형된 가이드 RNA를 사용하여 획득된 데이터를 도시하는 표이다.
도 5a는 본 출원에 개시된 예시적인 가이드 RNA를 도시한다.
도 5b는 본 출원에 개시된 예시적인 단일 가이드 RNA(sgRNA)를 도시한다.
도 6은 적어도 2개(예를 들어, 제1 변형 및 제2 변형)의 화학적 변형을 갖는 예시적인 가이드 RNA를 도시하는 표이다. 각각의 숫자는 지시되는 바와 같은 변형을 나타내며 각각의 "x"는 가이드 RNA 중의 변형들의 조합을 가리킨다. 몇몇 실시태양에서, 상기 제1 및 제2 변형은 단일 뉴클레오타이드상에 존재한다. 몇몇 실시태양에서, 상기 제1 및 제2 변형은 별도의 뉴클레오타이드상에 존재한다.
도 7은 적어도 3개의 화학적 변형을 갖는 가이드 RNA의 예시적인 유형들을 도시한다. 도 7의 하부 부분은 다수 유형의 변형들을 나열한다. 도 7의 상부 부분의 표는 이중 변형("이중 변형", 2가지 유형의 변형의 조합)이 단일 변형("단일 변형", 한 가지 유형의 변형)과 어떻게 병행될 수 있는지를 가리킨다. "x"는 가이드 RNA에서 상응하는 이중 변형 및 단일 변형의 존재를 가리킨다.
도 8a 및 8b는 시험관내 시험에 대한 형광단-변형된 CLTA1 sgRNA를 도시한다. 도 8a에서, CLTA1에 대한 sgRNA의 RNA 서열을 도시하며, 형광 염료 또는 표지가 상기 sgRNA에 부착될 수 있는 위치를 포함한다. 도 8b는 문헌[Nishimasu et al., Cell (2014) 156, 1-15]에 보고된 바와 같은, Cas9:sgRNA 복합체의 X선 결정학에 의해 측정된 구조를 도시한다.
도 9a는 CTLA1 표적에 대한 특이성을 개선하고자 하는 노력으로 몇몇 위치(3, 9 및 11번 위치)에서 2-티오유리딘에 의해 변형된 CTLA1 sgRNA를 도시한다. 도 9b는 2-티오U에 의해 변형된 gRNA가, 표적-외 부위가 U-G 동요 짝짓기를 수반하는 경우, 상기 gRNA의 표적 특이성을 증가시킬 수 있음을 도시한다. 특히, CTLA1_2-티오U+11은 표적-외 서열 CLTA1 OFF3(5' 가닥 중 11번째 위치에 T에서 C로의 돌연변이를 갖는다)의 훨씬 더 낮은 절단을 가졌다.
도 10은 가이드 RNA 스캐폴드 2차 구조를 도시하며, 문헌[Jiang et al., Science (2015) 345:6242, 1477-81]에 보고된 바와 같은, Cas9의 아미노산과 비공유 결합 상호작용을 나타낸다.
도 11a 및 11b는 인간 세포주에서 유전자 파괴가 높은 빈도의 인델(indel) 및 상동성 재조합(HR)과 함께, 문헌[Hendel et al., Nat. Biotechnol. (2015) 33:9, 985-9]에 보고된 바와 같이, 본 명세서에 개시된 합성되고 화학적으로 변형된 sgRNA를 사용하여 성취될 수 있음을 보이는 실험 결과를 예시한다.
도 12a, 12b, 12c 및 12d는 본 명세서에 기재된 바와 같은 화학적으로 변형된 sgRNA를 사용하여, 문헌[Hendel et al., Nat. Biotechnol. (2015) 33:9, 985-9]에 보고된 바와 같이, 자극된 1차 인간 T 세포뿐만 아니라 CD34+ 조혈모세포 및 전구세포(HSPC)에서 높은 빈도의 유전자 파괴 또는 표적화된 게놈 편집을 성취할 수 있음을 나타내는 실험 결과를 예시한다.
도 2a는 예시적인 크리스퍼-Cas9-매개된 절단 분석을 도시하는 다이어그램이다.
도 2b는 도 4의 데이터를 생성시키는데 사용되는 생화학적 절단 분석에 대한 성분들 및 그들의 농도를 도시하는 표이다.
도 2c는 상기 생화학적 절단 분석을 위한 스트렙토코커스 피오게네스(Streptococcus pyogenes) Cas9 뉴클레아제의 적정을 도시하는 다이어그램이다.
도 2d는 상기 생화학적 절단 분석을 위한 예시적인 sgRNA의 적정을 도시하는 다이어그램이다. 본 예에서 kanC1이라 명명하는 sgRNA는 가나마이신 내성 유전자 중의 상보성 서열에 표적화된다.
도 3은 시험관내에서 정제된 성분을 사용하는 상기 생화학적 절단 분석에 예시적인 조건 및 과정을 도시한다.
도 4는 상기 절단 분석에서 예시적인 변형된 가이드 RNA를 사용하여 획득된 데이터를 도시하는 표이다.
도 5a는 본 출원에 개시된 예시적인 가이드 RNA를 도시한다.
도 5b는 본 출원에 개시된 예시적인 단일 가이드 RNA(sgRNA)를 도시한다.
도 6은 적어도 2개(예를 들어, 제1 변형 및 제2 변형)의 화학적 변형을 갖는 예시적인 가이드 RNA를 도시하는 표이다. 각각의 숫자는 지시되는 바와 같은 변형을 나타내며 각각의 "x"는 가이드 RNA 중의 변형들의 조합을 가리킨다. 몇몇 실시태양에서, 상기 제1 및 제2 변형은 단일 뉴클레오타이드상에 존재한다. 몇몇 실시태양에서, 상기 제1 및 제2 변형은 별도의 뉴클레오타이드상에 존재한다.
도 7은 적어도 3개의 화학적 변형을 갖는 가이드 RNA의 예시적인 유형들을 도시한다. 도 7의 하부 부분은 다수 유형의 변형들을 나열한다. 도 7의 상부 부분의 표는 이중 변형("이중 변형", 2가지 유형의 변형의 조합)이 단일 변형("단일 변형", 한 가지 유형의 변형)과 어떻게 병행될 수 있는지를 가리킨다. "x"는 가이드 RNA에서 상응하는 이중 변형 및 단일 변형의 존재를 가리킨다.
도 8a 및 8b는 시험관내 시험에 대한 형광단-변형된 CLTA1 sgRNA를 도시한다. 도 8a에서, CLTA1에 대한 sgRNA의 RNA 서열을 도시하며, 형광 염료 또는 표지가 상기 sgRNA에 부착될 수 있는 위치를 포함한다. 도 8b는 문헌[Nishimasu et al., Cell (2014) 156, 1-15]에 보고된 바와 같은, Cas9:sgRNA 복합체의 X선 결정학에 의해 측정된 구조를 도시한다.
도 9a는 CTLA1 표적에 대한 특이성을 개선하고자 하는 노력으로 몇몇 위치(3, 9 및 11번 위치)에서 2-티오유리딘에 의해 변형된 CTLA1 sgRNA를 도시한다. 도 9b는 2-티오U에 의해 변형된 gRNA가, 표적-외 부위가 U-G 동요 짝짓기를 수반하는 경우, 상기 gRNA의 표적 특이성을 증가시킬 수 있음을 도시한다. 특히, CTLA1_2-티오U+11은 표적-외 서열 CLTA1 OFF3(5' 가닥 중 11번째 위치에 T에서 C로의 돌연변이를 갖는다)의 훨씬 더 낮은 절단을 가졌다.
도 10은 가이드 RNA 스캐폴드 2차 구조를 도시하며, 문헌[Jiang et al., Science (2015) 345:6242, 1477-81]에 보고된 바와 같은, Cas9의 아미노산과 비공유 결합 상호작용을 나타낸다.
도 11a 및 11b는 인간 세포주에서 유전자 파괴가 높은 빈도의 인델(indel) 및 상동성 재조합(HR)과 함께, 문헌[Hendel et al., Nat. Biotechnol. (2015) 33:9, 985-9]에 보고된 바와 같이, 본 명세서에 개시된 합성되고 화학적으로 변형된 sgRNA를 사용하여 성취될 수 있음을 보이는 실험 결과를 예시한다.
도 12a, 12b, 12c 및 12d는 본 명세서에 기재된 바와 같은 화학적으로 변형된 sgRNA를 사용하여, 문헌[Hendel et al., Nat. Biotechnol. (2015) 33:9, 985-9]에 보고된 바와 같이, 자극된 1차 인간 T 세포뿐만 아니라 CD34+ 조혈모세포 및 전구세포(HSPC)에서 높은 빈도의 유전자 파괴 또는 표적화된 게놈 편집을 성취할 수 있음을 나타내는 실험 결과를 예시한다.
본 발명은 적어도 부분적으로, gRNA에 대한 몇몇 화학적 변형이 크리스퍼-Cas 시스템에 의해 허용된다는 뜻밖의 발견에 근거한다. 특히, 상기 gRNA의 안정성을 증가시키고, gRNA 하이브리드화 상호작용의 열안정성을 변경시키고, 및/또는 Cas:gRNA 복합체형성의 표적-외 효과를 감소시키는 것으로 여겨지는 몇몇 화학적 변형들은 표적 폴리뉴클레오타이드의 틈 형성(nicking) 및/또는 절단에 대한 Cas:gRNA 결합의 효능을 실질적으로 손상시키지 않는다. 더욱 또한, 몇몇 화학적 변형들은, 세포, 특히 진핵생물 세포의 핵내로의 효율적이고 적정 가능한 형질감염성을 갖고 및/또는 형질감염된 세포에서 면역자극 성질을 최소로 갖거나 갖지 않는, sgRNA를 포함한 gRNA를 제공하는 것으로 여겨진다. 몇몇 화학적 변형들은 목적하는 gRNA 기능성을 허용하기에 충분한 기간 동안 목적하는 세포, 조직, 체액 또는 유기체내로 유효하게 전달되고 상기 중에서 유지될 수 있는, sgRNA를 포함한 gRNA를 제공하는 것으로 여겨진다.
I. 정의
본 명세서에 사용되는 "가이드 RNA"란 용어는 일반적으로 Cas 단백질에 결합할 수 있고 상기 Cas 단백질을 표적 폴리뉴클레오타이드(예를 들어, DNA)내의 특정 위치에 표적화하는 것을 도울 수 있는 RNA 분자(또는 집합적으로 RNA 분자들의 그룹)를 지칭한다. 가이드 RNA는 crRNA 분절 및 tracrRNA 분절을 포함할 수 있다. 본 명세서에 사용되는 "crRNA" 또는 "crRNA 분절"이란 용어는 폴리뉴클레오타이드-표적화 가이드 서열, 줄기 서열 및 임의로 5'-오버행 서열을 포함하는 RNA 분자 또는 그의 부분을 지칭한다. 본 명세서에 사용되는 "tracrRNA" 또는 "tracrRNA 분절"이란 용어는 단백질-결합 분절(예를 들어, 상기 단백질-결합 분절은 크리스퍼-결합된 단백질, 예를 들어 Cas9와 상호작용할 수 있다)을 포함하는 RNA 분자 또는 그의 부분을 지칭한다. 상기 "가이드 RNA"란 용어는 단일 가이드 RNA(sgRNA)를 포함하며, 이때 상기 crRNA 분절 및 상기 tracrRNA 분절은 동일한 RNA 분자 중에 위치한다. "가이드 RNA"란 용어는 또한 집합적으로 2개 이상의 RNA 분자들의 그룹을 포함하며, 이때 상기 crRNA 및 상기 tracrRNA 분절은 별도의 RNA 분자 중에 위치한다.
"스캐폴드"란 용어는 실질적으로 동일하거나 천연 생물종들에 걸쳐 고도로 보존되는 서열을 포함하는 가이드 RNA 분자의 부분을 지칭한다. 스캐폴드는, 고유 crRNA 및 tracrRNA 중에 보존되지 않는 서열을 포함하는 임의의 비천연 부분을 제외하고, 상기 tracrRNA 분절 및 상기 crRNA 분절의 5' 단부 또는 그 부근의 폴리뉴클레오타이드-표적화 가이드 서열 이외의 crRNA 분절의 부분을 포함한다.
"핵산", "폴리뉴클레오타이드" 또는 "올리고뉴클레오타이드"란 용어는 DNA 분자, RNA 분자 또는 이들의 유사체를 지칭한다. 본 명세서에 사용되는 "핵산", "폴리뉴클레오타이드" 및 "올리고뉴클레오타이드"란 용어는 비제한적으로 DNA 분자, 예를 들어 cDNA, 게놈 DNA 또는 합성 DNA 및 RNA 분자, 예를 들어 가이드 RNA, 전령 RNA 또는 합성 RNA를 포함한다. 더욱이, 본 명세서에 사용되는 "핵산" 및 "폴리뉴클레오타이드"란 용어는 단일-가닥 및 이중-가닥 형태를 포함한다.
올리고뉴클레오타이드 또는 폴리뉴클레오타이드와 관련하여 "변형"이란 용어는 비제한적으로 (a) 단부 변형, 예를 들어 5' 단부 변형 또는 3' 단부 변형, (b) 염기의 교체 또는 제거를 포함한 핵염기(또는 "염기") 변형, (c) 2', 3' 및/또는 4' 위치의 변형을 포함한 당 변형, 및 (d) 포스포다이에스터 결합의 변형 또는 교체를 포함한 주쇄 변형을 포함한다. "변형된 뉴클레오타이드"란 용어는 일반적으로 상기 염기, 당, 및 뉴클레오타이드 포스페이트를 포함한 포스포다이에스터 결합 또는 주쇄 부분 중 하나 이상의 화학 구조에 대한 변형을 갖는 뉴클레오타이드를 지칭한다.
"Z" 및 "P"란 용어는, 예를 들어 문헌["Artificially expanded genetic information system: a new base pair with an alternative hydrogen bonding pattern" Yang,Z., Hutter,D., Sheng,P., Sismour,A.M. and Benner,S.A. (2006) Nucleic Acids Res., 34, 6095-101](상기 문헌은 내용 전체가 본 명세서에 참고로 인용된다)에 기재된 바와 같은 스티븐 베너(Steven Benner)와 동료에 의해 개발된 뉴클레오타이드, 핵염기 또는 핵염기 유사체를 지칭한다.
용어 "xA", "xG", "xC", "xT", 또는 "x(A,G,C,T)" 및 "yA", "yG", "yC", "yT", 또는 "y(A,G,C,T)"는 문헌["Synthesis and Properties of Size-Expanded DNAs: Toward Designed, Functional Genetic Systems"; Andrew T. Krueger, Haige Lu, Alex H. F. Lee, and Eric T. Kool (2007) Acc. Chem. Res., 40, 141-50](상기 문헌은 내용 전체가 본 명세서에 참고로 인용된다)에서 크루에거(Krueger) 등에 의해 기재된 바와 같은 뉴클레오타이드, 핵염기, 또는 핵염기 유사체를 지칭한다.
"비구조화 핵산" 또는 "UNA"란 용어는 US7371580(그의 내용은 전체가 본 명세서에 참고로 인용된다)에 기재된 바와 같은 뉴클레오타이드, 핵염기 또는 핵염기 유사체를 지칭한다. 비구조화 핵산, 또는 UNA 변형을 또한 "의사-상보성" 뉴클레오타이드, 핵염기 또는 핵염기 유사체라 지칭한다(예를 들어, 문헌[Lahoud et al. (1991) Nucl. Acids Res., 36: 10, 3409-19]을 참조하시오).
"PACE" 및 "티오PACE"란 용어는 각각 포스포노아세테이트 또는 티오포스포노아세테이트기를 함유하는 뉴클레오타이드간 포스포다이에스터 결합 유사체를 지칭한다. 이들 변형은 포스포노카복실레이트 부분, 포스포노카복실레이트 에스터 부분, 티오포스포노카복실레이트 부분 및 티오포스포노카복실레이트 에스터 부분을 포함한 광범위한 화합물 부류에 속한다. 이들 결합을 각각 화학식 P(CR1R2)nCOOR 및 (S)-P(CR1R2)nCOOR(여기에서 n은 0 내지 6의 정수이고, R1 및 R2는 각각 독립적으로 H, 알킬 및 치환된 알킬로 이루어진 군 중에서 선택된다)에 의해 기재할 수 있다. 이들 변형 중 일부는 문헌[Yamada et al. "Synthesis and Biochemical Evaluation of Phosphonoformate Oligodeoxyribonucleotides" Christina M. Yamada, Douglas J. Dellinger and Marvin H. Caruthers (2006) 7. Am. Chem. Soc. 128: 15, 5251-61](상기 문헌은 내용 전체가 본 명세서에 참고로 인용된다)에 기재되어 있다.
본 명세서에 사용되는 "변형"은 변형되지 않은 리보뉴클레오타이드, 즉 아데노신, 구아노신, 시티딘 및 유리딘 리보뉴클레오타이드에서 발견되는 것과 상이한 화학 부분 또는 화학 구조의 부분을 지칭한다. 상기 "변형"이란 용어는 변형의 유형을 지칭할 수도 있다. 예를 들어, "동일한 변형"은 동일한 유형의 변형을 의미하며, "변형된 뉴클레오타이드가 동일하다"는 변형된 뉴클레오타이드가 동일한 유형(들)의 변형을 갖는 반면 염기(A, G, C, U 등)는 상이할 수도 있음을 의미한다. 유사하게, "2개의 변형"을 갖는 가이드 RNA는 2개 유형의 변형(동일한 뉴클레오타이드 중에 있을 수도, 있지 않을 수도 있다)을 갖는 가이드 RNA이며, 각각의 유형은 상기 가이드 RNA 중의 다수의 뉴클레오타이드 중에 존재할 수 있다. 유사하게, "3개의 변형"을 갖는 가이드 RNA는 3개 유형의 변형(동일한 뉴클레오타이드 중에 있을 수도, 있지 않을 수도 있다)을 갖는 가이드 RNA이며, 각각의 유형은 다수의 뉴클레오타이드 중에 존재할 수 있다.
본 명세서에 사용되는 "표적 폴리뉴클레오타이드" 또는 "표적"이란 용어는 표적 핵산 서열을 함유하는 폴리뉴클레오타이드를 지칭한다. 표적 폴리뉴클레오타이드는 단일-가닥 또는 이중-가닥일 수 있으며, 몇몇 실시태양에서, 이중-가닥 DNA이다. 몇몇 실시태양에서, 상기 표적 폴리뉴클레오타이드는 단일-가닥 RNA이다. 본 명세서에 사용되는 바와 같은 "표적 핵산 서열" 또는 "표적 서열"은 크리스퍼 시스템을 사용하여 결합시키거나, 틈을 형성시키거나, 절단시키기를 원하는 특정 서열 또는 그의 보체를 의미한다.
"하이브리드화" 또는 "하이브리드화하는"이란 용어는 전적으로 또는 부분적으로 상보성인 폴리뉴클레오타이드 가닥들이 함께 적합한 하이브리드화 조건하에서 이중-가닥 구조 또는 영역(여기에서 상기 2개의 구성 가닥들은 수소 결합에 의해 결합된다)을 형성하는 과정을 지칭한다. 본 명세서에 사용되는 "부분적인 하이브리드화"란 용어는 상기 이중-가닥 구조 또는 영역이 하나 이상의 벌지 또는 불합치를 함유하는 경우를 포함한다. 수소 결합은 전형적으로 아데닌과 티민 또는 아데닌과 유라실(A와 T 또는 A와 U) 또는 시토신과 구아닌(C와 G) 사이에 형성되지만, 다른 비정규 염기쌍을 형성할 수도 있다(예를 들어, 문헌[Adams et ai, "The Biochemistry of the Nucleic Acids, " 11th ed., 1992]을 참조하시오). 변형된 뉴클레오타이드가, 하이브리드화를 허용하거나 촉진하는 수소 결합을 형성할 수도 있음이 고려된다.
"절단" 또는 "절단하는"이란 용어는 폴리뉴클레오타이드의 리보실포스포다이에스터 주쇄 중의 공유 포스포다이에스터 결합의 끊김을 지칭한다. 상기 "절단" 또는 "절단하는"이란 용어는 단일-가닥 끊김 및 이중-가닥 끊김을 모두 포함한다. 이중-가닥 절단은 2개의 별도의 단일-가닥 절단 사건의 결과로서 발생할 수 있다. 절단은 평활 단부 또는 엇갈린 단부를 생성시킬 수 있다.
"크리스퍼-결합된 단백질" 또는 "Cas 단백질"이란 용어는 야생형 Cas 단백질, 그의 단편, 또는 그의 돌연변이체 또는 변체를 지칭한다. "Cas 돌연변이체" 또는 "Cas 변체"란 용어는 야생형 Cas·단백질의 단백질 또는 폴리펩타이드 유도체, 예를 들어 하나 이상의 점 돌연변이, 삽입, 결실, 절두, 융합 단백질 또는 이들의 조합을 갖는 단백질을 지칭한다. 몇몇 실시태양에서, 상기 "Cas 돌연변이체" 또는 "Cas 변체"는 실질적으로 상기 Cas 단백질의 뉴클레아제 활성을 유지한다. 몇몇 실시태양에서, 상기 "Cas 돌연변이체" 또는 "Cas 변체"는 하나 또는 2개의 뉴클레아제 도메인이 모두 불활성이도록 돌연변이된다. 몇몇 실시태양에서, 상기 "Cas 돌연변이체" 또는 "Cas 변체"는 뉴클레아제 활성을 갖는다. 몇몇 실시태양에서, 상기 "Cas 돌연변이체" 또는 "Cas 변체"는 그의 야생형 대응물의 뉴클레아제 활성 중 일부 또는 전부가 없다.
Cas 단백질의 "뉴클레아제 도메인"이란 용어는 DNA 절단에 대한 촉매 활성을 갖는 단백질내의 폴리펩타이드 서열 또는 도메인을 지칭한다. 뉴클레아제 도메인은 단일 폴리펩타이드 쇄 중에 함유되거나, 절단 활성이 2개(또는 그 이상)의 폴리펩타이드의 결합으로부터 생성될 수 있다. 단일 뉴클레아제 도메인은 주어진 폴리펩타이드내 아미노산의 하나 초과의 단리된 신장부로 이루어질 수 있다. 이들 도메인의 예는 RuvC-형 동기(서열번호 1에서 아미노산 7-22, 759-766 및 982-989) 및 HNH 동기(aa 837-863)를 포함한다. 문헌[Gasiunas et al. (2012) Proc. Natl. Acad. Sci. USA, 109:39, E2579-E2586] 및 WO2013176772를 참조하시오.
"gRNA 기능성"을 갖는 합성 가이드 RNA는 천연 가이드 RNA의 기능들 중 하나 이상, 예를 들어 Cas 단백질과 결합하는 기능, 또는 Cas 단백질과 함께 상기 가이드 RNA에 의해 수행되는 기능을 갖는 것이다. 몇몇 실시태양에서, 상기 기능성은 표적 폴리뉴클레오타이드와 결합함을 포함한다. 몇몇 실시태양에서, 상기 기능성은 Cas 단백질 또는 gRNA:Cas 단백질 복합체를 표적 폴리뉴클레오타이드에 표적화함을 포함한다. 몇몇 실시태양에서, 상기 기능성은 표적 폴리뉴클레오타이드에 틈을 형성시킴을 포함한다. 몇몇 실시태양에서, 상기 기능성은 표적 폴리뉴클레오타이드를 절단함을 포함한다. 몇몇 실시태양에서, 상기 기능성은 Cas 단백질과 회합하거나 결합함을 포함한다. 몇몇 실시태양에서, 상기 기능성은 Cas 단백질을 갖는 크리스퍼-Cas 시스템, 예를 들어 조작된 Cas 단백질을 갖는 인공 크리스퍼-Cas 시스템에서 가이드 RNA의 임의의 다른 공지된 기능이다. 몇몇 실시태양에서, 상기 기능성은 천연 가이드 RNA의 임의의 다른 기능이다. 상기 합성 가이드 RNA는 gRNA 기능성을 천연 가이드 RNA보다 더 크거나 더 적은 정도로 가질 수 있다. 몇몇 실시태양에서, 합성 가이드 RNA는 유사한 천연 가이드 RNA에 비해 하나의 성질에 관하여 더 큰 기능성을 갖고 또 다른 성질에 관하여 덜한 기능성을 가질 수 있다.
"단일-가닥 틈 형성 활성을 갖는 Cas 단백질"은 야생형 Cas 단백질에 비해 dsDNA의 2개 가닥 중 하나를 절단하는 능력이 감소된 Cas 단백질(Cas 돌연변이체 또는 Cas 변체 포함)을 지칭한다. 예를 들어, 몇몇 실시태양에서, 단일-가닥 틈 형성 활성을 갖는 Cas 단백질은, RuvC 도메인(또는 HNH 도메인)의 기능을 감소시키고 결과적으로 표적 DNA의 하나의 가닥을 절단시키는 능력을 감소시키는 돌연변이(예를 들어, 아미노산 치환)를 갖는다. 상기와 같은 변체의 예는 스트렙토코커스 피오게네스 Cas9에서 D10A, H839A/H840A, 및/또는 N863A 치환을 포함하며, 다른 종들의 Cas9 효소 중 동일한 부위에서의 동일하거나 유사한 치환을 또한 포함한다.
본 명세서에 사용되는 바와 같이, 서열의 "부분" 또는 "단편"이란 용어는 완전한 서열보다 작은 서열(예를 들어, 뉴클레오타이드 하위서열 또는 아미노산 하위서열)의 임의의 부분을 지칭한다. 폴리뉴클레오타이드의 부분은 임의의 길이, 예를 들어 적어도 5, 10, 15, 20, 25, 30, 40, 50, 75, 100, 150, 200, 300 또는 500개 또는 그 이상의 뉴클레오타이드 길이일 수 있다. 가이드 서열의 일부는 상기 가이드 서열의 약 50%, 40%, 30%, 20%, 10%, 예를 들어 상기 가이드 서열의 1/3, 또는 더 짧은, 예를 들어 7, 6, 5, 4, 3, 또는 2개 뉴클레오타이드의 길이일 수 있다.
분자와 관련하여 "로부터 유래된"이란 용어는 모 분자 또는 상기 모 분자로부터의 정보를 사용하여 단리되거나 제조된 분자를 지칭한다. 예를 들어, Cas9 단일 돌연변이 니카제 및 Cas9 이중 돌연변이 삭제-뉴클레아제는 야생형 Cas9 단백질로부터 유래된다.
2개 이상의 폴리뉴클레오타이드(또는 2개 이상의 폴리펩타이드)와 관련하여 "실질적으로 동일한"이란 용어는 서열 비교 연산을 사용하거나 시각적 검사에 의해 최대의 상응성으로 비교 및 정렬했을 때, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 90-95%, 적어도 약 95%, 적어도 약 98%, 적어도 약 99% 이상의 뉴클레오타이드(또는 아미노산) 서열 일치성을 갖는 서열 또는 하위서열을 지칭한다. 바람직하게, 폴리뉴클레오타이드들간의 "실질적인 일치성"은 상기 폴리뉴클레오타이드의 영역에 걸쳐 적어도 약 50개 뉴클레오타이드 길이, 적어도 약 100개 뉴클레오타이드 길이, 적어도 약 200개 뉴클레오타이드 길이, 적어도 약 300개 뉴클레오타이드 길이, 적어도 약 500개 뉴클레오타이드 길이로 존재하거나, 상기 폴리뉴클레오타이드의 전체 길이에 걸쳐 존재한다. 바람직하게, 상기 폴리펩타이드간의 "실질적인 일치성"은 상기 폴리펩타이드의 영역에 걸쳐 적어도 약 50개 아미노산 잔기, 적어도 약 100개 아미노산 잔기의 길이로 존재하거나, 상기 폴리펩타이드의 전체 길이에 걸쳐 존재한다.
본 명세서에 개시되는 바와 같이, 다수의 값의 범위가 제공된다. 각각의 사이 값, 하한 단위의 1/10, 상기 범위의 상한과 하한 사이가 또한 구체적으로 고려되는 것으로 안다. 진술된 범위에 의해 포함되는 각각의 보다 작은 범위 또는 사이 값이 또한 구체적으로 고려된다. "약"이란 용어는 일반적으로, 지시된 수의 + 또는 - 10%를 지칭한다. 예를 들어, "약 10%"는 9% 내지 11%의 범위를 가리킬 수 있고, "약 20"은 18 내지 22를 의미할 수 있다. "약"의 다른 의미는 내용상 자명할 수 있다, 예를 들어 반올림, 따라서 예를 들어 "약 1"은 또한 0.5 내지 1.4를 의미할 수 있다.
II. 크리스퍼-매개된 서열-특이성 결합 및/또는 절단
도 1에 DNA의 크리스퍼-Cas9-매개된 서열-특이성 절단의 다이어그램을 도시한다. 상기 가이드 RNA는, 5' 도메인, 내부에 위치한 염기-쌍 줄기, 및 3' 도메인내의 예시적인 20-뉴클레오타이드(20-nt) 가이드 서열(다른 가이드 서열은, 예를 들어 길이가 약 15 내지 약 30 nt일 수 있다)을 갖는 sgRNA로서 묘사된다. 상기 가이드 서열은 DNA 표적 중 예시적인 20-nt 표적 서열에 상보성이다. 상기 줄기는 crRNA 중 반복 서열에 상응하며 tracrRNA 중의 서열에 상보성이다. 상기 가이드 RNA의 3' 도메인은 Cas9 뉴클레아제에 결합하는 tracrRNA의 3' 도메인에 상응한다. 상기 Cas9:가이드 RNA 복합체는 Cas9에 의해 인식되는 PAM 서열의 바로 상류의 프로토스페이서 또는 표적 DNA 서열에 결합하고 이를 절단한다. 도 1에서, 3-nt PAM 서열을 예시하나; 4-nt 및 5-nt PAM 서열을 포함하여 다른 PAM 서열들이 공지되어 있다. 도 1에 예시된 시스템에서, DNA 중의 표적 서열의 2개의 가닥은 모두 화살표로 지시된 부위에서 Cas9에 의해 절단된다.
III. 가이드 RNA
적어도 하나의 태양에서, 본 발명은 가이드 RNA 기능성을 갖는 화학적으로 변형된 가이드 RNA를 포함한다. 4개의 정규 리보뉴클레오타이드, 즉 A, C, G 및 U(비천연이든 천연이든 간에) 이외의 임의의 뉴클레오타이드(예를 들어, 슈도유리딘, 이노신 또는 데옥시뉴클레오타이드)를 포함하는 가이드 RNA는 화학적으로 변형된 가이드 RNA이다. 마찬가지로 천연 포스포다이에스테르 뉴클레오타이드간 결합 이외의 임의의 주쇄 또는 뉴클레오타이드간 결합을 포함하는 가이드 RNA는 화학적 변형을 가지며, 따라서 화학적으로 변형된 RNA이다. 몇몇 실시태양에서, 상기 유지되는 기능성은 Cas 단백질과의 결합을 포함한다. 몇몇 실시태양에서, 상기 유지되는 기능성은 표적 폴리뉴클레오타이드와의 결합을 포함한다. 몇몇 실시태양에서, 상기 유지되는 기능성은 Cas 단백질 또는 gRNA:Cas 단백질 복합체를 표적 폴리뉴클레오타이드에 표적화함을 포함한다. 몇몇 실시태양에서, 상기 유지되는 기능성은 gRNA:Cas 단백질 복합체에 의한 표적 폴리뉴클레오타이드의 틈 형성을 포함한다. 몇몇 실시태양에서, 상기 유지되는 기능성은 gRNA:Cas 단백질 복합체에 의한 표적 폴리뉴클레오타이드의 절단을 포함한다. 몇몇 실시태양에서, 상기 유지되는 기능성은 Cas 단백질을 갖는 크리스퍼-Cas 시스템, 예를 들어 조작된 Cas 단백질을 갖는 인공 크리스퍼-Cas 시스템에서 가이드 RNA의 임의의 다른 공지된 기능이다. 몇몇 실시태양에서, 상기 유지되는 기능성은 천연 가이드 RNA의 임의의 다른 기능이다.
A. 예시적인 변형
몇몇 실시태양에서, 상기 가이드 RNA에 통합된 뉴클레오타이드 당 변형은 2'-O-C1-4알킬, 예를 들어 2'-O-메틸(2'-OMe), 2'-데옥시(2'-H), 2'-O-C1- 3알킬-O-C1- 3알킬, 예를 들어 2'-메톡시에틸("2'-MOE"), 2'-플루오로("2'-F"), 2'-아미노("2'-NH2"), 2'-아라비노실("2'-아라비노") 뉴클레오타이드, 2'-F-아라비노실("2'-F-아라비노") 뉴클레오타이드, 2'-잠금 핵산("LNA")뉴클레오타이드, 2'-열림 핵산("ULNA") 뉴클레오타이드, L 형태의 당("L-당") 및 4'-티오리보실 뉴클레오타이드로 이루어진 군 중에서 선택된다. 몇몇 실시태양에서, 상기 가이드 RNA에 통합된 뉴클레오타이드간 결합 변형은 포스포로티오에이트 "P(S)"(P(S)), 포스포노카복실레이트(P(CH2)nCOOR), 예를 들어 포스포노아세테이트 "PACE"(P(CH2COO-)), 티오포스포노카복실레이트((S)P(CH2)nCOOR), 예를 들어 티오포스포노아세테이트 "티오PACE"((S)P(CH2COO-)), 알킬포스포네이트(P(C1- 3알킬)), 예를 들어 메틸포스포네이트-P(CH3), 보라노포스포네이트(P(BH3)) 및 포스포로다이티오에이트(P(S)2)로 이루어진 군 중에서 선택된다.
몇몇 실시태양에서, 상기 가이드 RNA에 통합된 핵염기("염기") 변형은 2-티오유라실("2-티오U"), 2-티오시토신("2-티오C"), 4-티오유라실("4-티오U"), 6-티오구아닌("6-티오G"), 2-아미노아데닌("2-아미노A"), 2-아미노퓨린, 슈도유라실, 하이포잔틴, 7-데아자구아닌, 7-데아자-8-아자구아닌, 7-데아자아데닌, 7-데아자-8-아자아데닌, 5-메틸시토신("5-메틸C"), 5-메틸유라실("5-메틸U"), 5-하이드록시메틸시토신, 5-하이드록시메틸유라실, 5,6-데하이드로유라실, 5-프로피닐시토신, 5-프로피닐유라실, 5-에티닐시토신, 5-에티닐유라실, 5-알릴유라실("5-알릴U"), 5-알릴시토신("5-알릴C"), 5-아미노알릴유라실("5-아미노알릴U"), 5-아미노알릴-시토신("5-아미노알릴C"), 비염기성 뉴클레오타이드, Z 염기, P 염기, 비구조화 핵산("UNA"), 아이소구아닌("아이소G"), 아이소시토신("아이소C")[문헌["Enzymatic Incorporation of a New Base pair into DNA and RNA Extends the Genetic Alphabet." Piccirilli, J. A.; Krauch, T.; Moroney, S. E.; Benner, S. A. (1990) Nature, 343, 33]에 기재된 바와 같은), 5-메틸-2-피리미딘[문헌[Rappaport, H. P. (1993) Biochemistry, 32, 3047]에 기재된 바와 같은], x(A,G,C,T) 및 y(A,G,C,T)로 이루어진 군 중에서 선택된다.
몇몇 실시태양에서, 하나 이상의 동위원소 변형이 뉴클레오타이드 당, 핵염기, 포스포다이에스터 결합 및/또는 뉴클레오타이드 포스페이트상에 도입된다. 상기와 같은 변형은 추적자로서 사용되는 하나 이상의 15N, 13C, 14C, 중수소, 3H, 32P, 125I, 131I 원자 또는 다른 원자 또는 원소를 포함하는 뉴클레오타이드를 포함한다.
몇몇 실시태양에서, 상기 가이드 RNA에 통합되는 "단부" 변형은 PEG(폴리에틸렌글리콜), 탄화수소 링커(헤테로원자(O,S,N)-치환된 탄화수소 스페이서; 할로-치환된 탄화수소 스페이서; 케토-, 카복실-, 아미도-, 티오닐-, 카바모일-, 티오노카바모일-함유 탄화수소 스페이서 포함), 스페르민 링커, 링커에 부착된 형광 염료(예를 들어, 플루오레세인, 로다민, 시아닌)를 포함하는 염료, 예를 들어 6-플루오레세인-헥실, 소광제(예를 들어, 답실, BHQ) 및 다른 표지(예를 들어, 비오틴, 디곡시제닌, 아크리딘, 스트렙트아비딘, 아비딘, 펩타이드 및/또는 단백질)로 이루어진 군 중에서 선택된다. 몇몇 실시태양에서, "단부" 변형은 상기 가이드 RNA의, 올리고뉴클레오타이드(데옥시뉴클레오타이드 및/또는 리보뉴클레오타이드 포함), 펩타이드, 단백질, 당, 올리고사카라이드, 스테로이드, 지질, 폴산, 비타민 및/또는 다른 분자를 포함하는 또 다른 분자에의 접합(또는 결찰)을 포함한다. 몇몇 실시태양에서, 상기 가이드 RNA에 통합된 "단부" 변형은 링커, 예를 들어 2-(4-부틸아미도플루오레세인)프로판-1,3-다이올 비스(포스포다이에스터) 링커(하기에 묘사됨)(이는 포스포다이에스터 결합으로서 통합되고 상기 가이드 RNA 중의 2개의 뉴클레오타이드 사이의 어디에나 통합될 수 있다)를 통해 상기 가이드 RNA 서열에 내부적으로 위치한다.
다른 링커는, 예를 들어 예시로서, 비제한적으로 하기를 포함한다:
몇몇 실시태양에서, 상기 단부 변형은 말단 작용기, 예를 들어 아민, 티올(또는 설프하이드릴), 하이드록실, 카복실, 카보닐, 티오닐, 티오카보닐, 카바모일, 티오카바모일, 포스포릴, 알켄, 알킨, 할로겐 또는 작용기-종결된 링커(이들 중 어느 하나는 후속으로 목적하는 부분, 예를 들어 형광 염료 또는 비-형광 표지 또는 태그에 접합될 수 있다) 또는 임의의 다른 분자, 예를 들어 올리고뉴클레오타이드(앱타머를 포함하여, 데옥시뉴클레오타이드 및/또는 리보뉴클레오타이드를 포함한다), 아미노산, 펩타이드, 단백질, 당, 올리고사카라이드, 스테로이드, 지질, 폴산, 비타민을 포함한다. 상기 접합은 당해 분야에 주지된 표준 화학, 예를 들어 비제한적으로 N-하이드록시숙신아미드, 아이소티오시아네이트, DCC(또는 DCI)를 통한 커플링, 및/또는 문헌["Bioconjugate Techniques" by Greg T. Hermanson, Publisher Eslsevier Science, 3rd ed. (2013)](상기 문헌의 내용은 전체가 본 명세서에 참고로 인용된다)에 기재된 바와 같은 임의의 다른 표준 방법을 사용한다.
몇몇 실시태양에서, 상기 표지 또는 염료는 상기 gRNA 중의 변형된 뉴클레오타이드에 부착되거나 접합된다. 형광 염료 또는 다른 부분, 예를 들어 비-형광 표지 또는 태그(예를 들어, 비오틴, 아비딘, 스트렙트아비딘, 또는 동위원소 표지, 예를 들어 15N, 13C, 14C, 중수소, 3H, 32P, 125I 등을 함유하는 부분) 또는 임의의 다른 분자, 예를 들어 올리고뉴클레오타이드(앱타머를 포함하여, 데옥시뉴클레오타이드 및/또는 리보뉴클레오타이드를 포함한다), 아미노산, 펩타이드, 단백질, 당, 올리고사카라이드, 스테로이드, 지질, 폴산, 비타민 또는 다른 분자의 접합을 소위 "클릭" 화학 또는 소위 "스쿠아레이트" 접합 화학을 사용하여 수행할 수 있다. 상기 "클릭" 화학은 아지드 부분과 알킨 부분의 [3+2] 가환을 지칭하며, 이는, 예를 들어 문헌[El-Sagheer, A.H and Brown, T. "Click chemistry with DNA", Chem. Soc. Rev., 2010, 39, 1388-1405] 및 문헌[Mojibul, H.M. and XiaoHua, P., DNA-associated click chemistry, Sci. China Chem., 2014, 57:2, 215-31](상기 문헌의 내용은 전체가 본 명세서에 참고로 인용된다)에 기재된 바와 같이, 하기의 반응식에 나타내는 바와 같은 2개의 부분 사이의 트라이아졸로 결합을 유도한다:
몇몇 실시태양에서, 상기 접합을 선택적 가환, 예를 들어 알켄 부분과 π-접합된 다이엔 부분의 딜스-알더[4+2] 가환에 의해 수행할 수 있다.
상기 "스쿠아레이트" 접합 화학은 2개의 부분(각각 아민을 갖는다)을 스쿠아레이트 유도체를 통해 결합시켜 스쿠아레이트 부분을 함유하는 스쿠아레이트 접합체를 생성시킨다(예를 들어, 문헌[Tietze et al. (1991) Chem. Ber., 124, 1215-21](상기 문헌은 내용 전체가 본 명세서에 참고로 인용된다). 예를 들어, 링커 아민을 함유하는 플루오레세인을 하기의 반응식에 기재된 바와 같이 스쿠아레이트 링커를 통해 아민을 함유하는 올리고리보뉴클레오타이드에 접합시킨다. 상기 스쿠아레이트 링커의 일례를 하기 반응식에 묘사한다:
몇몇 실시태양에서, 상기 가이드 RNA에 통합되는 화학적 변형은 2'-O-C1- 4알킬, 2'-H, 2'-O-C1- 3알킬-O-C1- 3알킬, 2'-F, 2'-NH2, 2'-아라비노, 2'-F-아라비노, 4'-티오리보실, 2-티오U, 2-티오C, 4-티오U, 6-티오G, 2-아미노A, 2-아미노퓨린, 슈도유라실, 하이포잔틴, 7-데아자구아닌, 7-데아자-8-아자구아닌, 7-데아자아데닌, 7-데아자-8-아자아데닌, 5-메틸C, 5-메틸U, 5-하이드록시메틸시토신, 5-하이드록시메틸유라실, 5,6-데하이드로유라실, 5-프로피닐시토신, 5-프로피닐유라실, 5-에티닐시토신, 5-에티닐유라실, 5-알릴U, 5-알릴C, 5-아미노알릴유라실, 5-아미노알릴-시토신, 비염기성 뉴클레오타이드("abN"), Z, P, UNA, 아이소C, 아이소G, 5-메틸-피리미딘, x(A,G,C,T) 및 y(A,G,C,T), 포스포로티오에이트 뉴클레오타이드간 결합, 포스포노아세테이트 뉴클레오타이드간 결합, 티오포스포노아세테이트 뉴클레오타이드간 결합, 메틸포스포네이트 뉴클레오타이드간 결합, 보라노포스페이트 뉴클레오타이드간 결합, 포스포로다이티오에이트 뉴클레오타이드간 결합, 4'-티오리보실 뉴클레오타이드, 잠금 핵산("LNA") 뉴클레오타이드, 열림 핵산("ULNA") 뉴클레오타이드, 알킬 스페이서, 헤테로알킬(N,O,S) 스페이서, 5'- 및/또는 3'-알킬 종결된 뉴클레오타이드, 유니캡, 자연으로부터 알려진 5'-말단 캡, xRNA 염기("xDNA" 염기와 유사함), yRNA 염기("yDNA" 염기와 유사함), PEG 치환체, 또는 염료 또는 비-형광 표지(또는 태그) 또는 상술한 바와 같은 다른 부분에 대한 접합된 링커로 이루어진 군 중에서 선택된다. 예시적인 변형된 뉴클레오타이드를 또한 표 2에 묘사한다.
[표 2]
본 명세서에 기재된 바와 같이 몇몇 비천연 염기쌍(예를 들어, 아이소G 및 아이소C, Z 염기 및 P 염기; 문헌[Zhang et al. (2015) J. Am. Chem. Soc.]을 참조하시오)이 상기 가이드 RNA 2차 구조의 열안정성에 영향을 미치는데 유리할 수 있다. 상기 변형을 사용하여 상기 가이드 RNA 스캐폴드와 가이드 RNA 서열의 다른 도메인과의 잘못접힘을 방지할 수 있다.
최근의 가이드 RNA:Cas9 단백질 구조 정보(도 10, 문헌[Jiang et al. 2015, Science]에 보고된 바와 같은) 및 생체내/시험관내 기능적 돌연변이 연구(예를 들어, 문헌[Briner et al. 2014, Mol. Cell, 56, 333-9]을 참조하시오)는 상기 가이드 RNA 스캐폴드가 우세하게 구조적으로 보존됨을 가리킨다. 이는 Cas9에 의한 기능성을 위해 가이드 RNA의 보존된 도메인의 정확한 접힘의 중요성을 보강한다. 도 10은 Cas9의 아미노산과 상호작용을 나타내는, 상기 가이드 RNA 스캐폴드 2차 구조를 도시한다. 상기 가이드 RNA 질소 염기의 대부분은 Cas9 단백질과의 결합 상호작용에 관여하지 않는다.
상기 sgRNA 스캐폴드의 인접 서열은 잘못 접힘 및 따라서 오기능의 가능성을 증가시킨다. 상기 20 nt 가이드 표적화 서열, 상기 스캐폴드 영역의 5'은 각 표적에 대해 사용자-특이적이며, 따라서 잘못 접힘의 가능성은 가변성이거나 표적-특이적이다. 또한, 다수의 최근 등장한 크리스퍼-Cas 응용은 상기 스캐폴드, 예를 들어 크리스퍼디스플레이(문헌[Schechner et al., Nat. Methods 2015]) 및 크리스퍼-i/-a(문헌[Chen et al., Cell 2013])(이들은 적합하게 기능하기 위해서 정확하고 독립적으로 접힐 필요가 있는 리보스위치 또는 앱타머이다)의 3'에 기능성 서열을 달고 있다. 주어진 sgRNA의 각각의 기능성 도메인(즉 표적화 가이드, 스캐폴드, 앱타머)이 모듈식으로, 독립적인 방식으로 확실히 접히도록, 상기 구조적으로 보존된 스캐폴드 염기쌍을 비천연의, 직교 염기쌍(예를 들어, 아이소G 및 아이소C; Z 염기 및 P 염기)으로 치환하고, 일부 실시태양에서, 독점적으로 비천연의, 직교 염기쌍으로 치환시킬 수 있다. 이는 상기 sgRNA 스캐폴드 서열이 상기 표적-짝짓기 가이드 서열의 요소 또는 상기 가이드 RNA에 통합된 다른 비-고유 도메인, 예를 들어 상기 가이드 RNA상의 임의의 앱타머 서열 또는 임의의 비-고유 5' 또는 3' 오버행과 2차 구조로 안정하게 상호작용하지 않을 것임을 보장한다. 한편으로, 상기 언급된 비천연의, 직교 염기쌍을, 존재할 수도 있는 임의의 비-고유 오버행 또는 앱타머에 통합시키고, 따라서 상기 스캐폴드 서열(들)의 잘못 접힘을 수반하는 2차 구조를 방지할 수 있었다.
B. 적어도 하나의 변형을 갖는 가이드 RNA
하나의 태양에서, 본 기술은 변형된 gRNA를 구성하는, 적어도 하나의 변형을 갖는 가이드 RNA를 제공한다.
몇몇 실시태양에서, 상기 변형된 gRNA는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50개의 변형된 뉴클레오타이드를 포함한다. 다른 실시태양에서, 상기 변형된 gRNA는 적어도 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130 또는 140개의 변형된 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 모든 뉴클레오타이드가 변형된다. 몇몇 실시태양에서, 상기 변형은 모두 동일하다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는 모두 동일한 유형의 변형을 갖는다. 몇몇 실시태양에서, 상기 변형된 gRNA는 상이하게 변형된 뉴클레오타이드의 조합을 포함한다. 몇몇 실시태양에서, 상기 변형된 gRNA는 2개 이상의 변형된 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 변형된 gRNA는 3개 이상의 변형된 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는 연속적으로 배열된다. 몇몇 실시태양에서, 상기 변형된 gRNA는 변형된 뉴클레오타이드의 적어도 하나의 연속적인 신장부를 포함한다. 몇몇 실시태양에서, 상기 변형된 gRNA는 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50개의 변형된 뉴클레오타이드의 연속적인 신장부를 포함한다. 각각의 변형된 뉴클레오타이드는 독립적으로 하나 이상 유형의 변형을 포함할 수 있다. 몇몇 실시태양에서, 변형된 뉴클레오타이드는 상기 변형된 gRNA의 서열에서 연속적이지 않거나, 일부 그러나 전부가 연속성이지는 않다.
몇몇 실시태양에서, 상기 변형은 상기 가이드 RNA의 5' 부분내에 있다. 몇몇 실시태양에서, 상기 변형은 상기 가이드 RNA의 5' 부분의 처음 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형은 상기 가이드 RNA의 5' 부분의 처음 3개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형은 상기 가이드 RNA의 3' 부분내에 있다. 몇몇 실시태양에서, 상기 변형은 상기 가이드 RNA의 3' 부분의 처음 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형은 상기 가이드 RNA의 3' 부분의 처음 3개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형은 상기 가이드 RNA의 내부 영역내에(즉 5' 단부와 3' 단부 사이에) 있다.
몇몇 실시태양에서, 상기 변형은, 예를 들어 뉴클레아제에 의한 분해로부터 상기 가이드 RNA를 보호하기 위해서 또는 다른 목적을 위해서 상기 가이드 RNA의 5' 부분 또는 3' 부분에, 특히 상기 5' 부분의 처음 5 또는 10개 뉴클레오타이드내에 또는 상기 3' 부분의 마지막 5 또는 10개 뉴클레오타이드내에 통합된다. 일부 다른 실시태양에서, 상기 변형은, 예를 들어 뉴클레아제에 의한 분해로부터 상기 가이드 RNA를 보호하기 위해서 또는 다른 목적을 위해서 상기 가이드 RNA의 5' 부분 및 3' 부분 모두에, 특히 상기 5' 부분의 처음 5 또는 10개 뉴클레오타이드내에 및 상기 3' 부분의 마지막 5 또는 10개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 하나 초과 유형의 변형이 상기 가이드 RNA의 5' 부분 및 3' 부분 모두에 존재한다. 몇몇 실시태양에서, 상기 변형은 상기 가이드 RNA의 5' 단부, 3' 단부, 및 내부 서열내에 위치한다. 몇몇 실시태양에서, 가이드 RNA는 상기 가이드 RNA의 5' 또는 3' 부분 중의 40개 이하, 한편으로 20개 이하, 한편으로 15개 이하, 한편으로 10개 이하, 한편으로 5개 이하, 한편으로 3개 이하의 데옥시리보뉴클레오타이드 잔기를 포함한다.
몇몇 실시태양에서, 상기 변형은 상기 가이드 RNA의 crRNA 분절내에 있다. 몇몇 실시태양에서, 상기 변형은 상기 crRNA의 가이드 서열내에 있다. 몇몇 실시태양에서, 상기 변형은 상기 crRNA 분절의 처음 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형은 상기 crRNA 분절의 처음 3개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형은 상기 crRNA 분절의 5'-오버행내에 있다. 몇몇 실시태양에서, 상기 변형은 상기 가이드 RNA의 tracrRNA 분절내에 있다. 몇몇 실시태양에서, 상기 변형은 상기 가이드 RNA의 tracrRNA 분절의 마지막 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형은 상기 가이드 RNA의 tracrRNA 분절의 마지막 3개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 가이드 RNA가 단일 가이드 RNA인 경우, 상기 변형은 상기 가이드 RNA의 고리내에 위치한다. 몇몇 실시태양에서, 상기 하나 이상의 변형은 상기 고리 L 영역내에 있다. 몇몇 실시태양에서, 상기 변형은 상술한 바와 같이, 예를 들어 2-(3-염료/표지/태그-아미도)프로판아미도)프로판-1,3-다이올 비스(포스포다이에스터) 링커 또는 상기 고리 또는 L 영역 중의 뉴클레오타이드의 변형된 염기에의 접합에 의해 2개의 뉴클레오타이드 사이에 통합된 링커에 접합된 염료, 비-형광 표지 또는 태그를 포함한다.
몇몇 실시태양에서, 상기 변형은 단부 변형, 예를 들어 5' 단부 변형 또는 3' 단부 변형을 포함한다. 단부 변형의 예는 비제한적으로 인산화(천연 포스페이트 또는 폴리포스페이트로서 또는 변형된 포스포네이트기, 예를 들어 알킬포스포네이트, 포스포노카복실레이트, 포스포노아세테이트, 보라노포스포네이트, 포스포로티오에이트, 포스포로다이티오에이트 등으로서), 비오틴화, 접합성 또는 접합된 분자, 링커, 염료, 표지, 태그, 작용기(예를 들어, 비제한적으로 5'-아미노, 5'-티오, 5'-아미도, 5'카복시 등), 역전된 결합, 또는 에테르, 폴리에틸렌 글리콜(PEG), 에스터, 하이드록실, 아릴, 할로, 포스포다이에스터, 바이사이클릭, 헤테로사이클릭 또는 다른 유기 작용기를 포함할 수 있는 탄화수소 부분을 포함한다. 몇몇 실시태양에서, 상기 단부 변형은 다이메톡시트리틸을 포함한다.
몇몇 실시태양에서, 상기 변형은 변형된 염기를 포함한다. 본 명세서에 사용되는 "변형되지 않은" 염기는 퓨린 염기 아데닌(A) 및 구아닌(G), 및 피리미딘 염기 티민(T), 시토신(C) 및 유라실(U)을 포함한다. 변형된 염기의 예는 비제한적으로 합성 및 천연 염기, 예를 들어 2-티오U, 2-티오C, 4-티오U, 6-티오G, 2-아미노A, 2-아미노P, 슈도유라실, 하이포잔틴, 7-데아자구아닌, 7-데아자-8-아자구아닌, 7-데아자아데닌, 7-데아자-8-아자아데닌, 5-메틸C, 5-메틸U, 5-하이드록시메틸시토신, 5-하이드록시메틸유라실, 5,6-데하이드로유라실, 5-프로피닐시토신, 5-프로피닐유라실, 5-에티닐시토신, 5-에티닐유라실, 5-알릴U, 5-알릴C, 5-아미노알릴-유라실, 및 5-아미노알릴-시토신을 포함한다. 몇몇 실시태양에서, 상기 변형은 비염기성 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 변형은 비표준 퓨린 또는 피리미딘 구조, 예를 들어 Z 또는 P, 아이소C 또는 아이소G, UNA, 5-메틸피리미딘, x(A,G,C,T) 또는 y(A,G,C,T)를 포함한다. 몇몇 실시태양에서, 상기 변형된 gRNA는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50개의 변형된 염기를 포함한다. 다른 실시태양에서, 상기 변형된 gRNA는 적어도 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130 또는 140개의 변형된 염기를 포함한다. 몇몇 실시태양에서, gRNA 중의 모든 염기가 변형된다.
몇몇 실시태양에서, 상기 변형은 변형된 당을 포함한다. 변형된 당의 예는 비제한적으로 2' 위치의 변형 또는 4' 위치의 변형을 갖는 당을 포함한다. 예를 들어, 몇몇 실시태양에서, 상기 당은 2'-O-C1- 4알킬, 예를 들어 2'-O-메틸(2'-OMe)을 포함한다. 몇몇 실시태양에서, 상기 당은 2'-O-C1- 3알킬-O-C1- 3알킬, 예를 들어 2'-메톡시에톡시(2'-O-CH2CH2OCH3)(또한 2'-O-(2-메톡시에틸) 또는 2'-MOE로서 공지됨)를 포함한다. 몇몇 실시태양에서, 상기 당은 2'-할로, 예를 들어 2'-F, 2'-Br, 2'-Cl 또는 2'-I를 포함한다. 몇몇 실시태양에서, 상기 당은 2'-NH2를 포함한다. 몇몇 실시태양에서, 상기 당은 2'-H(예를 들어, 데옥시뉴클레오타이드)를 포함한다. 몇몇 실시태양에서, 상기 당은 2'-아라비노 또는 2'-F-아라비노를 포함한다. 몇몇 실시태양에서, 상기 당은 2'-LNA 또는 2'-ULNA를 포함한다. 몇몇 실시태양에서, 상기 당은 4'-티오리보실을 포함한다. 몇몇 실시태양에서, 상기 변형된 gRNA는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50개의 변형된 당을 포함한다. 다른 실시태양에서, 상기 변형된 gRNA는 적어도 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130 또는 140개의 변형된 당을 포함한다. 몇몇 실시태양에서, gRNA 중의 모든 당이 변형된다.
몇몇 실시태양에서, 상기 변형은 변형된 주쇄(즉 천연 포스포다이에스터 이외의 뉴클레오타이드간 결합)를 포함한다. 변형된 뉴클레오타이드간 결합의 예는 비제한적으로 포스포로티오에이트 뉴클레오타이드간 결합, 키랄 포스포로티오에이트 뉴클레오타이드간 결합, 포스포로다이티오에이트 뉴클레오타이드간 결합, 보라노포스포네이트 뉴클레오타이드간 결합, C1- 4알킬 포스포네이트 뉴클레오타이드간 결합, 예를 들어 메틸포스포네이트 뉴클레오타이드간 결합, 보라노포스포네이트 뉴클레오타이드간 결합, 포스포노카복실레이트 뉴클레오타이드간 결합, 예를 들어 포스포노아세테이트 뉴클레오타이드간 결합, 포스포노카복실레이트 에스터 뉴클레오타이드간 결합, 예를 들어 포스포노아세테이트 에스터 뉴클레오타이드간 결합, 티오포스포노카복실레이트 뉴클레오타이드간 결합, 예를 들어 티오포스포노아세테이트 뉴클레오타이드간 결합, 티오포스포노카복실레이트 에스터 뉴클레오타이드간 결합, 예를 들어 티오포스포노아세테이트 에스터 뉴클레오타이드간 결합을 포함한다. 다양한 염, 혼합된 염 및 유리산 형태들이 또한 포함된다. 몇몇 실시태양에서, 상기 변형된 gRNA는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50개의 변형된 뉴클레오타이드간 결합을 포함한다. 다른 실시태양에서, 상기 변형된 gRNA는 적어도 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130 또는 140개의 변형된 뉴클레오타이드간 결합을 포함한다. 몇몇 실시태양에서, gRNA 중의 모든 뉴클레오타이드간 결합이 변형된다.
몇몇 실시태양에서, 상기 변형은 2'-O-C1- 4알킬, 2'-H, 2'-O-C1- 3알킬-O-C1- 3알킬, 2'-F, 2'-NH2, 2'-아라비노, 2'-F-아라비노, 2'-LNA, 2'-ULNA, 4'-티오리보실, 2-티오U, 2-티오C, 4-티오U, 6-티오G, 2-아미노A, 2-아미노P, 슈도유라실, 하이포잔틴, 7-데아자구아닌, 7-데아자-8-아자구아닌, 7-데아자아데닌, 7-데아자-8-아자아데닌, 5-MeC, 5-MeU, 5-하이드록시메틸시토신, 5-하이드록시메틸유라실, 5,6-데하이드로유라실, 5-프로피닐시토신, 5-프로피닐유라실, 5-에티닐시토신, 5-에티닐유라실, 5-알릴U, 5-알릴C, 5-아미노알릴유라실, 5-아미노알릴-시토신, 비염기성 뉴클레오타이드, Z, P, UNA, 아이소C, 아이소G, 5-메틸-피리미딘, x(A,G,C,T), y(A,G,C,T), 3'-포스포로티오에이트기, 3'-포스포노아세테이트기, 3'-포스포노아세테이트 에스터기, 3'-티오포스포노아세테이트기, 3'-티오포스포노아세테이트 에스터기, 3'-메틸포스포네이트기, 3-보라노포스포네이트기, 3'-포스포로다이티오에이트기, 또는 이들의 조합이다.
몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는 2'-O-메틸-3'-포스포로티오에이트를 포함한다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는 2'-O-메틸-3'-포스포노아세테이트를 포함한다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는 2'-O-메틸-3'-티오포스포노아세테이트를 포함한다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는 Z 염기를 포함한다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는 2'-할로-3'-포스포로티오에이트를 포함한다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는 2'-할로-3'-포스포노아세테이트를 포함한다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는 2'-할로-3'-티오포스포노아세테이트를 포함한다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는 2'-플루오로-3'-포스포로티오에이트를 포함한다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는 2'-플루오로-3'-포스포노아세테이트를 포함한다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는 2'-플루오로-3'-티오포스포노아세테이트를 포함한다.
몇몇 실시태양에서, 상기 가이드 RNA는 하기 화학식 I에 의해 나타내는 올리고뉴클레오타이드를 포함한다:
[화학식 I]
W-Y 또는 Y-W
상기 식에서,
W는 적어도 하나의 변형을 포함하는 올리고뉴클레오타이드의 뉴클레오타이드 또는 뉴클레오타이드의 신장부를 나타내고;
Y는 상기 올리고뉴클레오타이드의 변형되지 않은 부분을 나타낸다.
몇몇 실시태양에서, W는 상기 가이드 RNA의 5' 부분내에 있다. 몇몇 실시태양에서, W는 적어도 부분적으로 상기 가이드 RNA의 5' 부분의 처음 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, W는 적어도 부분적으로 상기 가이드 RNA의 5' 부분의 처음 3개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, W는 상기 가이드 RNA의 3' 부분내에 있다. 몇몇 실시태양에서, W는 적어도 부분적으로 상기 가이드 RNA의 3' 부분의 처음 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, W는 적어도 부분적으로 상기 가이드 RNA의 3' 부분의 처음 3개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, W는 상기 가이드 RNA의 내부 영역내에(즉 5' 단부와 3' 단부 사이에) 있다.
몇몇 실시태양에서, W는 단부 변형, 예를 들어 상술한 바와 같은 5' 단부 변형 또는 3' 단부 변형을 포함한다. 몇몇 실시태양에서, 상기 단부 변형은 다이메톡시트리틸을 포함한다.
몇몇 실시태양에서, W는 상술한 바와 같은 변형된 염기를 포함한다. 몇몇 실시태양에서, W는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50개의 변형된 염기를 포함한다. 다른 실시태양에서, W는 적어도 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130 또는 140개의 변형된 염기를 포함한다. 몇몇 실시태양에서, gRNA 중의 모든 염기가 변형된다.
몇몇 실시태양에서, W는 상술한 바와 같은 변형된 당을 포함한다. 몇몇 실시태양에서, W는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50개의 변형된 당을 포함한다. 다른 실시태양에서, W는 적어도 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130 또는 140개의 변형된 당을 포함한다. 몇몇 실시태양에서, gRNA 중의 모든 당이 변형된다.
몇몇 실시태양에서, W는 상술한 바와 같은 변형된 주쇄(즉 포스포다이에스터 이외의 뉴클레오타이드간 결합)를 포함한다. 몇몇 실시태양에서, W는 1 초과, 예를 들어 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50개의 변형된 뉴클레오타이드간 결합을 포함한다. 다른 실시태양에서, W는 적어도 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130 또는 140개의 변형된 뉴클레오타이드간 결합을 포함한다. 몇몇 실시태양에서, gRNA 중의 모든 뉴클레오타이드간 결합이 변형된다.
몇몇 실시태양에서, W는 2'-O-C1- 4알킬, 2'-H, 2'-O-C1- 3알킬-O-C1- 3알킬, 2'-F, 2'-NH2, 2'-아라비노, 2'-F-아라비노, 2'-LNA, 2'-ULNA, 4'-티오리보실, 2-티오U, 2-티오C, 4-티오U, 6-티오G, 2-아미노A, 2-아미노P, 슈도유라실, 하이포잔틴, 7-데아자구아닌, 7-데아자-8-아자구아닌, 7-데아자아데닌, 7-데아자-8-아자아데닌, 5-MeC, 5-MeU, 5-하이드록시메틸시토신, 5-하이드록시메틸유라실, 5,6-데하이드로유라실, 5-프로피닐시토신, 5-프로피닐유라실, 5-에티닐시토신, 5-에티닐유라실, 5-알릴U, 5-알릴C, 5-아미노알릴유라실, 5-아미노알릴-시토신, 비염기성 뉴클레오타이드, Z, P, UNA, 아이소C, 아이소G, 5-메틸-피리미딘, x(A,G,C,T), y(A,G,C,T), 포스포로티오에이트 뉴클레오타이드간 결합, 포스포노아세테이트 뉴클레오타이드간 결합, 포스포노아세테이트 에스터 뉴클레오타이드간 결합, 티오포스포노아세테이트 뉴클레오타이드간 결합, 티오포스포노아세테이트 에스터 뉴클레오타이드간 결합, 메틸포스포노아세테이트 뉴클레오타이드간 결합, 보라노포스포네이트 뉴클레오타이드간 결합, 포스포로다이티오에이트 뉴클레오타이드간 결합, 또는 이들의 조합을 포함한다.
몇몇 실시태양에서, W는 동일한 뉴클레오타이드상에 2'-O-메틸 및 3'-포스포로티오에이트기를 포함한다. 몇몇 실시태양에서, W는 동일한 뉴클레오타이드상에 2'-O-메틸 및 3'-포스포노아세테이트기를 포함한다. 몇몇 실시태양에서, W는 동일한 뉴클레오타이드상에 2'-O-메틸 및 3'-티오포스포노아세테이트기를 포함한다. 몇몇 실시태양에서, W는 동일한 뉴클레오타이드상에 2'-F 및 3'-포스포로티오에이트기를 포함한다. 몇몇 실시태양에서, W는 동일한 뉴클레오타이드상에 2'-F 및 3'-포스포노아세테이트기를 포함한다. 몇몇 실시태양에서, W는 동일한 뉴클레오타이드상에 2'-F 및 3'-티오포스포노아세테이트기를 포함한다.
몇몇 실시태양에서, W는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 변형된 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 각각의 변형된 뉴클레오타이드는 동일한 변형을 포함한다. 몇몇 실시태양에서, W는 다양하게 변형된 뉴클레오타이드들의 조합을 포함한다. 몇몇 실시태양에서, W는 2개 이상의 변형된 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, W는 3개 이상의 변형된 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는, 하나 이상의 변형되지 않은 뉴클레오타이드들은 개입할 수 있기 때문에, 상기 서열 중에 연속적으로 배열되지 않거나, 적어도 전적으로 배열되지는 않는다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는 연속적으로 배열된다. 몇몇 실시태양에서, W는 변형된 뉴클레오타이드의 적어도 하나의 연속적인 신장부를 포함한다. 몇몇 실시태양에서, W는 적어도 3개의 변형된 뉴클레오타이드의 연속적인 신장부를 포함한다. 몇몇 실시태양에서, W는 적어도 4개의 변형된 뉴클레오타이드의 연속적인 신장부를 포함한다. 몇몇 실시태양에서, W는 적어도 5개의 변형된 뉴클레오타이드의 연속적인 신장부를 포함한다.
몇몇 실시태양에서, 상기 가이드 RNA는 하기 화학식 II에 의해 나타내는 올리고뉴클레오타이드를 포함한다:
[화학식 II]
MmNn
상기 식에서,
각각의 N은 독립적으로 변형되지 않은 리보뉴클레오타이드를 나타내고;
각각의 M은 변형된 뉴클레오타이드를 나타내며 2'-O-메틸 리보뉴클레오타이드, 3'-P(S) 리보뉴클레오타이드, 3'-PACE 리보뉴클레오타이드, 3'-티오PACE 리보뉴클레오타이드, 2'-O-메틸-3'-P(S)-리보뉴클레오타이드, 2'-O-메틸-3'-PACE 리보뉴클레오타이드, 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드, Z 뉴클레오타이드 및 2'-데옥시뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택되고;
각각의 M은 상기 가이드 RNA의 서열의 임의의 위치에 있고;
임의의 주어진 M은 임의의 다른 M과 동일하거나 상이하고, 임의의 주어진 N은 임의의 다른 N과 동일하거나 상이하며;
각각의 m 및 n은 0 내지 219의 정수로부터 독립적으로 선택되나, 단 50<m+n≤220이고, m은 0이 아니다.
일부 실시태양에서, m+n<150이다.
몇몇 실시태양에서, 각각의 M은 2'-F, 2-티오유라실, 4-티오유라실, 2-아미노아데닌, 하이포잔틴, 5-메틸시토신, 5-메틸유라실, 5-알릴아미노유라실, 스쿠아레이트 결합, 트라이아졸로 결합, 및 2-(4-부틸아미도플루오레세인)프로판-1,3-다이올 비스(포스포다이에스터) 결합으로 이루어진 군 중에서 독립적으로 선택되는 하나 이상의 부분으로 변형된다. 일부 실시태양에서, M은 링커를 통해 부착된 염료를 포함한다.
몇몇 실시태양에서, 각각의 M은 2'-O-메틸 리보뉴클레오타이드, 2'-O-메틸-3'-P(S)-리보뉴클레오타이드, 2'-O-메틸-3'-PACE 리보뉴클레오타이드, 및 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택된다. 몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-PACE 리보뉴클레오타이드 및 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택된다.
몇몇 실시태양에서, m>1일 때, 임의의 주어진 M은 임의의 다른 M과 동일하거나 상이하다. 몇몇 실시태양에서, m>1일 때, 각각의 M은 동일한 변형을 갖는다.
몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-PACE 리보뉴클레오타이드이고, m은 1 내지 10의 정수 중에서 선택되고, 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고, n은 1 내지 149의 정수 중에서 선택되나, 단 50<m+n≤150이다. 몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-PACE 리보뉴클레오타이드이고, m은 1 내지 5의 정수 중에서 선택되고, 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고, n은 1 내지 149의 정수 중에서 선택되나, 단 50<m+n≤150이다. 몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-PACE 리보뉴클레오타이드이고, m은 2 내지 5의 정수 중에서 선택되고, 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고, n은 1 내지 148의 정수 중에서 선택되나, 단 50<m+n≤150이다. 몇몇 실시태양에서, m은 1이다. 몇몇 실시태양에서, m은 2이다. 몇몇 실시태양에서, m은 3이다. 몇몇 실시태양에서, m은 4이다. 몇몇 실시태양에서, m은 5이다.
몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드이고, m은 1 내지 10의 정수 중에서 선택되고, 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고, n은 1 내지 149의 정수 중에서 선택되나, 단 50<m+n≤150이다. 몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드이고, m은 1 내지 5의 정수 중에서 선택되고, 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고, n은 1 내지 149의 정수 중에서 선택되나, 단 50<m+n≤150이다. 몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드이고, m은 2 내지 5의 정수 중에서 선택되고, 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고, n은 1 내지 148의 정수 중에서 선택되나, 단 50<m+n≤150이다. 몇몇 실시태양에서, m은 1이다. 몇몇 실시태양에서, m은 2이다. 몇몇 실시태양에서, m은 3이다. 몇몇 실시태양에서, m은 4이다. 몇몇 실시태양에서, m은 5이다.
몇몇 실시태양에서, 각각의 M은 2'-O-메틸 리보뉴클레오타이드이고, m은 1 내지 40의 정수 중에서 선택되고, 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고, n은 1 내지 149의 정수 중에서 선택되나, 단 50<m+n≤150이다. 몇몇 실시태양에서, 각각의 M은 2'-O-메틸 리보뉴클레오타이드이고, m은 1 내지 25의 정수 중에서 선택되고, 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고, n은 1 내지 149의 정수 중에서 선택되나, 단 50<m+n≤150이다. 몇몇 실시태양에서, 각각의 M은 2'-O-메틸 리보뉴클레오타이드이고, m은 1 내지 20의 정수 중에서 선택되고, 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고, n은 1 내지 149의 정수 중에서 선택되나, 단 50<m+n≤150이다. 몇몇 실시태양에서, m은 1이다. 몇몇 실시태양에서, m은 2이다. 몇몇 실시태양에서, m은 3이다. 몇몇 실시태양에서, m은 4이다. 몇몇 실시태양에서, m은 5이다. 몇몇 실시태양에서, m은 10이다. 몇몇 실시태양에서, m은 15이다. 몇몇 실시태양에서, m은 20이다. 몇몇 실시태양에서, m은 30이다. 몇몇 실시태양에서, m은 40이다.
몇몇 실시태양에서, 각각의 M은 2'-데옥시뉴클레오타이드이고, m은 1 내지 3의 정수 중에서 선택되고, 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고, n은 1 내지 149의 정수 중에서 선택되나, 단 50<m+n≤150이다. 몇몇 실시태양에서, 각각의 M은 2'-데옥시뉴클레오타이드이고, m은 1 내지 20의 정수 중에서 선택되고, 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고, n은 1 내지 149의 정수 중에서 선택되나, 단 50<m+n≤150이다. 몇몇 실시태양에서, m은 5이다. 몇몇 실시태양에서, m은 10이다. 몇몇 실시태양에서, m은 15이다. 몇몇 실시태양에서, m은 20이다. 몇몇 실시태양에서, m은 30이다.
몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-P(S) 리보뉴클레오타이드이고, m은 1 내지 10의 정수 중에서 선택되고, 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고, n은 1 내지 149의 정수 중에서 선택되나, 단 50<m+n≤150이다. 몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-P(S) 리보뉴클레오타이드이고, m은 1 내지 5의 정수 중에서 선택되고, 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고, n은 1 내지 149의 정수 중에서 선택되나, 단 50<m+n≤150이다. 몇몇 실시태양에서, m은 1이다. 몇몇 실시태양에서, m은 2이다. 몇몇 실시태양에서, m은 3이다. 몇몇 실시태양에서, m은 4이다. 몇몇 실시태양에서, m은 5이다.
몇몇 실시태양에서, 각각의 M은 Z 뉴클레오타이드이고, m은 1 내지 10의 정수 중에서 선택되고, 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고, n은 1 내지 149의 정수 중에서 선택되나, 단 50<m+n≤150이다. 몇몇 실시태양에서, 각각의 M은 Z 뉴클레오타이드이고, m은 1 내지 5의 정수 중에서 선택되고, 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고, n은 1 내지 149의 정수 중에서 선택되나, 단 50<m+n≤150이다. 몇몇 실시태양에서, m은 1이다. 몇몇 실시태양에서, m은 2이다. 몇몇 실시태양에서, m은 3이다. 몇몇 실시태양에서, m은 4이다. 몇몇 실시태양에서, m은 5이다.
몇몇 실시태양에서, 상기 변형은 안정성-변경 변형이다. 몇몇 실시태양에서, 상기 변형은 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 뉴클레아제 내성을 증가시키며, 따라서 상기 가이드 RNA 안정성을 증대시킨다. 몇몇 실시태양에서, 상기 안정성-변경 변형은 안정성-증대 변형이다. 예를 들어, 몇몇 실시태양에서, 상기 안정성-증대 변형은 2'-O-메틸 또는 2'-O-C1- 4알킬 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 2'-할로 뉴클레오타이드, 예를 들어 2'-F, 2'-Br, 2'-Cl 또는 2'-I를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 2'MOE 또는 2'-O-C1- 3알킬-O-C1- 3알킬을 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 2'-NH2 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 2'-H(또는 2'-데옥시) 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 2'-아라비노 또는 2'-F-아라비노를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 4'-티오리보실 당 부분을 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 3'-포스포로티오에이트기를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 3'-포스포노아세테이트기를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 3'-티오포스포노아세테이트기를 함유하는 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 3'-메틸포스포네이트기를 함유하는 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 3'-보라노포스페이트기를 함유하는 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 3'-포스포로다이티오에이트기를 함유하는 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 잠금 핵산("LNA") 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 열림 핵산("ULNA") 뉴클레오타이드를 포함한다.
몇몇 실시태양에서, 상기 안정성-증대 변형은 동일한 뉴클레오타이드상에 2'-O-메틸 및 3'-포스포로티오에이트기를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 동일한 뉴클레오타이드상에 2'-O-메틸 및 3'-포스포노아세테이트기를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 동일한 뉴클레오타이드상에 2'-O-메틸 및 3'-티오포스포노아세테이트기를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 동일한 뉴클레오타이드상에 2'-플루오로 및 3'-포스포로티오에이트기를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 동일한 뉴클레오타이드상에 2'-플루오로 및 3'-포스포노아세테이트기를 포함한다. 몇몇 실시태양에서, 상기 안정성-증대 변형은 동일한 뉴클레오타이드상에 2'-플루오로 및 3'-티오포스포노아세테이트기를 포함한다.
몇몇 실시태양에서, 상기 변형은 특이성-변경 변형이다. 일부 실시태양에서, 특이성 증대는 표적-상 결합 및/또는 절단을 증대시키거나 표적-외 결합 및/또는 절단을 감소시키거나, 이 둘 모두의 병행에 의해 성취될 수 있다. 일부 다른 실시태양에서, 특이성 감소는, 예를 들어 표적-상 결합 및/또는 절단을 감소시키거나 표적-외 결합 및/또는 절단을 증가시키거나, 이 둘 모두의 병행에 의해 성취될 수 있다.
몇몇 실시태양에서, 상기 특이성-변경 변형은 2'-O-메틸을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 2'-할로, 예를 들어 2'-플루오로를 포함한다.
몇몇 실시태양에서, 상기 특이성-변경 변형은 2-티오유라실 염기(2-티오U)를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 2-티오C를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 4-티오U를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 6-티오G를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 2-아미노A를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 2-아미노퓨린을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 슈도유라실을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 하이포잔틴을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 7-데아자구아닌을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 7-데아자-8-아자구아닌을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 7-데아자아데닌을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 7-데아자-8-아자아데닌을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 5-메틸C를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 5-메틸U를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 5-하이드록시메틸시토신을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 5-하이드록시메틸유라실을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 5,6-데하이드로유라실을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 5-프로피닐시토신을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 5-프로피닐유라실을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 5-에티닐시토신을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 5-에티닐유라실을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 5-알릴U를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 5-알릴C를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 5-아미노알릴U를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 5-아미노알릴C를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 비염기성 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 Z 염기를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 P 염기를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 UNA 염기를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 아이소C를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 아이소G를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 5-메틸-피리미딘을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 x(A,G,C,T)를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 y(A,G,C,T)를 포함한다.
몇몇 실시태양에서, 상기 특이성-변경 변형은 포스포로티오에이트 뉴클레오타이드간 결합을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 포스포노아세테이트 뉴클레오타이드간 결합을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 티오포스포노아세테이트 뉴클레오타이드간 결합을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 메틸포스포네이트 뉴클레오타이드간 결합을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 보라노포스페이트 뉴클레오타이드간 결합을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 포스포로다이티오에이트 뉴클레오타이드간 결합을 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 ULNA를 포함한다. 몇몇 실시태양에서, 상기 특이성-변경 변형은 LNA를 포함한다.
몇몇 실시태양에서, 상기 변형은 RNA 염기 짝짓기를, 예를 들어 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 융점(Tm)을 변경시킴으로써 변경시킨다. 몇몇 실시태양에서, 상기 변형은 상기 가이드 RNA의 Tm을, 상기 변형이 없는 가이드 RNA에 비해 낮춘다. 몇몇 실시태양에서, 상기 변형은 상기 가이드 RNA의 Tm을, 상기 변형이 없는 가이드 RNA에 비해 상승시킨다.
몇몇 실시태양에서, 상기 특이성-변경 변형은 염기 짝짓기 상호작용의 Tm을 낮춘다. 몇몇 실시태양에서, 상기 염기 짝짓기 상호작용의 Tm을 낮추는 변형은, DNA/DNA 염기쌍이 RNA/DNA 듀플렉스 중의 각각의 대응물보다 더 낮은 Tm을 가짐이 당해 분야에 주지되어 있는 바와 같이, 2'-데옥시이다. 몇몇 실시태양에서, 상기 염기 짝짓기 상호작용의 Tm을 낮추는 변형은 2-티오유라실이며, 상기는 G-U 동요 쌍의 Tm을 약간 낮춘다. 몇몇 실시태양에서, 상기 염기 짝짓기 상호작용의 Tm을 낮추는 변형은, 포스포로티오에이트 뉴클레오타이드간 결합 또는 포스포로다이티오에이트 뉴클레오타이드간 결합이며, 상기는 상기 Tm을 변형당 약 0.5 ℃까지 낮춘다. 몇몇 실시태양에서, 상기 염기 짝짓기 상호작용의 Tm을 낮추는 변형은, 보라노포스포네이트 뉴클레오타이드간 결합이며, 상기는 상기 Tm을 변형당 약 0.5 내지 0.8 ℃까지 낮춘다. 몇몇 실시태양에서, 상기 염기 짝짓기 상호작용의 Tm을 낮추는 변형은, 포스포노아세테이트 뉴클레오타이드간 결합이며, 상기는 상기 Tm을 변형당 약 1.3 ℃까지 낮춘다. 몇몇 실시태양에서, 상기 염기 짝짓기 상호작용의 Tm을 낮추는 변형은, 열림 핵산("ULNA")이며, 상기는 상기 Tm을 변형당 약 5 내지 8 ℃까지 낮춘다. 몇몇 실시태양에서, 상기 염기 짝짓기 상호작용을 낮추는 변형은 2'-O-메틸-3'-메틸포스포네이트이다.
몇몇 실시태양에서, 상기 특이성-변경 변형은 염기 짝짓기 상호작용의 Tm을 상승시킨다. 몇몇 실시태양에서, 상기 염기 짝짓기 상호작용의 Tm을 상승시키는 변형은 2'-O-메틸이며, 상기는 Tm을 변형당 약 0.5 내지 0.7 ℃까지 상승시킨다. 몇몇 실시태양에서, 상기 염기 짝짓기 상호작용의 Tm을 상승시키는 변형은 2'-F이며, 상기는 Tm을 변형당 약 1 ℃까지 상승시킨다. 몇몇 실시태양에서, 상기 염기 짝짓기 상호작용의 Tm을 상승시키는 변형은 2-티오유라실이며, 상기는 A-U 쌍의 Tm을 상승시킨다(그리고, 상기에 나타낸 바와 같이, G-U 동요 쌍의 Tm을 약간 낮춘다). 몇몇 실시태양에서, 상기 염기 짝짓기 상호작용의 Tm을 상승시키는 변형은 4-티오유라실이며, 상기는 G-U 동요 쌍의 Tm을 상승시키고 A-U 쌍의 Tm을 약간 상승시킨다. 몇몇 실시태양에서, 상기 염기 짝짓기 상호작용의 Tm을 상승시키는 변형은 2-아미노-아데닌이며, 상기는 U와의 염기 짝짓기의 Tm을 변형당 약 1 ℃까지 상승시킨다. 몇몇 실시태양에서, 상기 염기 짝짓기 상호작용의 Tm을 상승시키는 변형은 5-메틸-유라실(5-메틸U)이다(예를 들어, 문헌[Wang & Kool (1995) Biochemistry, 34, 4125-32]을 참조하시오). 몇몇 실시태양에서, 상기 염기 짝짓기 상호작용의 Tm을 상승시키는 변형은 5-메틸-시토신(5-메틸C)이다. 몇몇 실시태양에서, 상기 염기 짝짓기 상호작용의 Tm을 상승시키는 변형은 잠금 핵산("LNA")이며, 상기는 Tm을 변형당 2 내지 10 ℃까지 상승시킨다.
몇몇 실시태양에서, 상기 변형은 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 형질감염 효율을 변경시킨다. 몇몇 실시태양에서, 상기 변형은 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 형질감염 효율을 증가시킨다. 몇몇 실시태양에서, 상기 변형은 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 형질감염 효율을 감소시킨다. 몇몇 실시태양에서, 상기 변형은 세포내로의 수동 확산을 허용하도록 포스페이트상의 음이온성 전하를 중화시킨다. 몇몇 실시태양에서, 상기 전하-중화 변형은 포스포노아세테이트 알킬 에스터 뉴클레오타이드간 결합, 예를 들어 포스포노아세테이트 메틸 에스터 뉴클레오타이드간 결합을 포함한다.
몇몇 실시태양에서, 상기 변형은 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 면역자극 효과를 변경시킨다. 처음에, 메틸화되지 않은 세균성 DNA 및 그의 합성 유사체는 TLR9에 대한 리간드인 것으로 밝혀졌다(문헌[Hemmi et al. (2000) Nature, 408, 740-5]을 참조하시오). 상기 TLR9의 자극을 예를 들어 C 및 G 잔기를 변형시킴으로써 다이뉴클레오타이드 동기에서 경감시킬 수 있다. 5-메틸시토신, 2-아미노시토신, 2-티오시토신, 5-메틸아이소시토신, P 핵염기(6-(β-D-2'-데옥시리보퓨라노실)-3,4-다이하이드로-8H-피리미도[4,5-c][1,2]옥사진-7-온), 및 2'-O-메틸시토신의 사용은 모두 TLR9 자극의 상실 또는 감소를 생성시킨다. 몇몇 실시태양에서, 6-티오구아닌, 2,6-다이아미노퓨린, 2-아미노퓨린, 잔토신, 이노신, 7-데아자잔토신, 아이소구아닌, 8-옥소구아닌, 네뷸라린, 8-브로모구아닌, K-핵염기(2-아미노-N-메톡시아데노신), 및/또는 2'-O-메틸구아닌의 사용은 TLR9 자극의 상실 또는 감소를 생성시킬 수 있다. 일부 실시태양에서, 포스포다이에스터 변형의 사용은 상기 TLR9 응답을 낮추거나 제거할 수 있다. 전형적으로, 합성적으로 통합된 포스포로티오에이트는, 합성 RNA에서 각 포스포로티오에이트의 2개의 입체이성질체의 존재로부터 생성되는 것으로 생각되는 바와 같이, 상기 TLR9 응답을 제한된 정도로 감소시킬 수 있다. 그러나, CpG 동기가 없는 포스포로티오에이트-변형된 DNA는 TLR9를 다소 적은 정도로 자극하는 것으로 나타났다. 상기 인상의 음전하는 TLR9에 의한 인식에 중요한 요소이며 따라서 알킬포스포네이트를 사용하는 음전하의 제거는 TLR9 자극의 상실 또는 감소를 생성시킬 수 있다. 5' 및 3' 말단 서열 중의 데옥시뉴클레오사이드간의 포스포노아세테이트(PACE) 뉴클레오타이드간 결합의 사용은 상기 TLR9 응답을 현저하게 증가시킬 수 있으나; 5' 및 3' 말단 서열 중의 데옥시뉴클레오사이드간의 티오포스포노아세테이트(티오PACE) 뉴클레오타이드간 결합의 사용은 TLR9 자극의 상실 또는 감소를 생성시킬 수 있다. 몇몇 실시태양에서, C3'-엔도 형태에 유리한 당 변형, 예를 들어 2'-O-메틸 변형의 사용은 5' 및 3' 말단에 통합되어 상기 TLR9 응답을 감소시킬 수 있다. TLR7 및 TLR8을, 7-데아자구아닌을 함유하는 분자에 의해서 및 단일-가닥 RNA에 의해서 자극할 수 있다(예를 들어, 문헌[Heil et al. (2004) Science, 303, 1526-9]을 참조하시오). TLR3은 바이러스-유래된 이중-가닥 RNA에 대한 세포 면역응답에 관련되었다. 몇몇 실시태양에서, 상기 TLR 응답을, 예를 들어 2'-O-메틸 변형, 황을 함유하는 변형된 포스포다이에스터 결합, 또는 뉴클레오타이드간 음전하를 감소시키는 변형, 예를 들어 메틸포스포네이트 및/또는 포스포노아세테이트 뉴클레오타이드간 결합을 사용함으로써 경감시킬 수 있다.
몇몇 실시태양에서, 상기 변형은 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 안정성 및 특이성을 증대시킨다. 몇몇 실시태양에서, 상기 변형은 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 안정성 및 형질감염 효율을 증대시킨다. 몇몇 실시태양에서, 상기 변형은 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 특이성 및 형질감염 효율을 증대시킨다. 몇몇 실시태양에서, 상기 변형은 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 전체적인 효능을 증대시킨다.
C. 변형들의 조합을 갖는 가이드 RNA
하나의 태양에서, 본 발명의 기술은 2개 이상의 변형의 조합을 갖는 가이드 RNA를 제공한다.
몇몇 실시태양에서, 상기 2개의 변형은 동일한 뉴클레오타이드상에 있다(예를 들어, 하나의 뉴클레오타이드는 2'-O-메틸 및 3'-티오포스포노아세테이트 부분을 포함한다). 다른 실시태양에서, 상기 2개의 변형은 2개의 상이한 뉴클레오타이드상에 있다(예를 들어, 하나의 뉴클레오타이드는 2-티오U 염기를 갖고 또 다른 뉴클레오타이드는 2'-O-메틸기를 갖는다).
몇몇 실시태양에서, 상기 가이드 RNA 중의 각각의 변형은 동일하다. 몇몇 실시태양에서, 상기 가이드 RNA 중의 적어도 하나의 변형은 상기 가이드 RNA 중의 적어도 하나의 다른 변형과 상이하다. 몇몇 실시태양에서, 상기 가이드 RNA내의 단일 뉴클레오타이드는 2개 이상의 변형을 갖는다.
몇몇 실시태양에서, 상기 가이드 RNA는 상이한 유형의 변형들의 조합을 포함하며, 상기 조합 중 적어도 하나의 유형은 상기 가이드 RNA 중의 다수의 장소에 존재한다. 몇몇 실시태양에서, 상기 조합 중 적어도 하나의 유형은 상기 가이드 RNA에서 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20회 존재한다.
몇몇 실시태양에서, 상기 조합 중 변형들의 적어도 하나의 유형이 2개 이상의 변형된 뉴클레오타이드 중에 존재한다. 몇몇 실시태양에서, 상기 조합 중 변형들의 적어도 하나의 유형이 3개 이상의 변형된 뉴클레오타이드 중에 존재한다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는, 하나 이상의 변형되지 않은 뉴클레오타이드들이 개입할 수 있기 때문에, 상기 서열 중에 연속적으로 배열되지 않거나, 적어도 전적으로 배열되지는 않는다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는 연속적으로 배열된다. 몇몇 실시태양에서, 상기 가이드 RNA는 동일한 유형의 연속적인 변형된 뉴클레오타이드의 신장부를 포함한다. 몇몇 실시태양에서, 상기 신장부는 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 1 1, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40개의 변형된 뉴클레오타이드를 갖는다.
몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은 상기 가이드 RNA의 5' 부분내에 있다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은 상기 가이드 RNA의 5' 부분의 처음 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은 상기 가이드 RNA의 5' 부분의 처음 3개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은 상기 가이드 RNA의 3' 부분내에 있다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은 상기 가이드 RNA의 3' 부분의 처음 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은 상기 가이드 RNA의 3' 부분의 처음 3개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은 상기 가이드 RNA의 내부 영역내에(즉 5' 단부와 3' 단부 사이에) 있다.
몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은, 예를 들어 뉴클레아제에 의한 분해로부터 상기 RNA를 보호하기 위해서 또는 다른 목적을 위해서 상기 가이드 RNA의 5' 부분 또는 3' 부분에, 특히 상기 5' 부분의 처음 5 또는 10개 뉴클레오타이드내에 또는 상기 3' 부분의 마지막 5 또는 10개 뉴클레오타이드내에 통합된다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은 상기 5' 부분에 있고 상기 조합 중 변형의 적어도 하나의 유형은, 예를 들어 뉴클레아제에 의한 분해로부터 상기 RNA를 보호하기 위해서 또는 다른 목적을 위해서 상기 가이드 RNA의 3' 부분에, 특히 상기 5' 부분의 처음 5 또는 10개 뉴클레오타이드내에 및 상기 3' 부분의 마지막 5 또는 10개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 가이드 RNA는 상기 가이드 RNA의 5' 부분 중의 20개 이하, 한편으로 15개 이하, 한편으로 15개 이하, 한편으로 10개 이하, 한편으로 5개 이하, 한편으로 3개 이하의 데옥시리보뉴클레오타이드 잔기를 포함한다.
몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은 상기 가이드 RNA의 crRNA 분절내에 있다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은 상기 crRNA의 가이드 서열내에 있다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은 상기 crRNA 분절의 처음 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은 상기 crRNA 분절의 처음 3개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은 상기 가이드 RNA의 tracrRNA 분절내에 있다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은 상기 가이드 RNA의 tracrRNA 분절의 마지막 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나의 유형은 상기 가이드 RNA의 tracrRNA의 마지막 3개 뉴클레오타이드내에 있다.
몇몇 실시태양에서, 상기 조합 중 변형의 제1 유형은 상기 가이드 RNA의 5' 부분내에 있고 상기 조합 중 변형의 제2 유형은 상기 가이드 RNA의 내부 영역내에(즉 5' 단부와 3' 단부 사이에) 있다. 몇몇 실시태양에서, 상기 변형의 제1 유형은 상기 가이드 RNA의 5' 부분의 처음 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형의 제1 유형은 상기 가이드 RNA의 5' 부분의 처음 3개 뉴클레오타이드내에 있다.
몇몇 실시태양에서, 상기 조합 중 변형의 제1 유형은 상기 가이드 RNA의 내부 영역내에(즉 5' 단부와 3' 단부 사이에) 있고 상기 조합 중 변형의 제2 유형은 상기 가이드 RNA의 3' 부분내에 있다. 몇몇 실시태양에서, 상기 변형의 제2 유형은 상기 가이드 RNA의 3' 부분의 마지막 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형의 제2 유형은 상기 가이드 RNA의 3' 부분의 마지막 3개 뉴클레오타이드내에 있다.
몇몇 실시태양에서, 상기 조합 중 변형의 제1 유형은 상기 가이드 RNA의 5' 부분내에 있고 상기 조합 중 변형의 제2 유형은 상기 가이드 RNA의 3' 부분내에 있다. 몇몇 실시태양에서, 상기 변형의 제1 유형은 상기 가이드 RNA의 5' 부분의 처음 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형의 제1 유형은 상기 가이드 RNA의 5' 부분의 처음 3개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형의 제2 유형은 상기 가이드 RNA의 3' 부분의 마지막 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형의 제2 유형은 상기 가이드 RNA의 3' 부분의 마지막 3개 뉴클레오타이드내에 있다.
몇몇 실시태양에서, 상기 조합 중 변형의 제1 유형은 상기 가이드 RNA의 5' 부분내에 있고, 상기 조합 중 변형의 제2 유형은 상기 가이드 RNA의 내부 영역내에(즉 5' 단부와 3' 단부 사이에) 있고, 상기 조합 중 변형의 제3 유형은 상기 가이드 RNA의 3' 부분내에 있다. 몇몇 실시태양에서, 상기 변형의 제1 유형은 상기 가이드 RNA의 5' 부분의 처음 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형의 제1 유형은 상기 가이드 RNA의 5' 부분의 처음 3개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형의 제3 유형은 상기 가이드 RNA의 3' 부분의 마지막 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형의 제3 유형은 상기 가이드 RNA의 3' 부분의 마지막 3개 뉴클레오타이드내에 있다.
몇몇 실시태양에서, 상기 조합 중 변형의 제1 유형은 상기 가이드 RNA의 crRNA 분절내에 있고 상기 조합 중 변형의 제2 유형은 상기 tracr 분절내에 있다. 몇몇 실시태양에서, 상기 변형의 제1 유형은 상기 crRNA의 가이드 서열내에 있다. 몇몇 실시태양에서, 상기 변형의 제1 유형은 상기 crRNA 분절의 처음 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형의 제1 유형은 상기 crRNA 분절의 처음 3개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형의 제2 유형은 상기 가이드 RNA의 tracrRNA 분절의 마지막 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형의 제2 유형은 상기 가이드 RNA의 tracrRNA 분절의 마지막 3개 뉴클레오타이드내에 있다.
몇몇 실시태양에서, 상기 조합 중 변형의 제1 유형 및 제2 유형은 상기 가이드 RNA의 crRNA 분절내에 있다. 몇몇 실시태양에서, 상기 변형의 제1 유형은 상기 crRNA의 가이드 서열내에 있다. 몇몇 실시태양에서, 상기 변형의 제1 유형은 상기 crRNA 분절의 처음 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형의 제1 유형은 상기 crRNA 분절의 처음 3개 뉴클레오타이드내에 있다.
몇몇 실시태양에서, 상기 조합 중 변형의 제1 유형 및 제2 유형은 상기 가이드 RNA의 crRNA 분절내에 있고 상기 조합 중 변형의 제3 유형은 상기 tracr 분절내에 있다. 몇몇 실시태양에서, 상기 변형의 제1 유형은 상기 crRNA의 가이드 서열내에 있다. 몇몇 실시태양에서, 상기 변형의 제1 유형은 상기 crRNA 분절의 처음 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형의 제1 유형은 상기 crRNA 분절의 처음 3개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, 상기 변형의 제3 유형은 상기 가이드 RNA의 tracrRNA 분절의 마지막 5개 뉴클레오타이드 내에 있다. 몇몇 실시태양에서, 상기 변형의 제3 유형은 상기 가이드 RNA의 tracrRNA 분절의 마지막 3개 뉴클레오타이드내에 있다.
몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 단부 변형, 예를 들어 상술한 바와 같은 5' 단부 변형 또는 3' 단부 변형을 포함한다. 몇몇 실시태양에서, 상기 단부 변형은 다이메톡시트리틸을 포함한다.
몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 변형된 염기를 포함한다. 몇몇 실시태양에서, 상기 변형된 gRNA는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 또는 40개의 변형된 염기를 포함한다. 다른 실시태양에서, 상기 변형된 gRNA는 적어도 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130 또는 140개의 변형된 염기를 포함한다. 몇몇 실시태양에서, gRNA 중의 모든 염기가 변형된다.
몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 변형된 당을 포함한다. 몇몇 실시태양에서, 상기 변형된 gRNA는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 또는 40개의 변형된 당을 포함한다. 다른 실시태양에서, 상기 변형된 gRNA는 적어도 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130 또는 140개의 변형된 당을 포함한다. 몇몇 실시태양에서, gRNA 중의 모든 당이 변형된다.
몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 변형된 주쇄(즉 천연 포스포다이에스터 이외의 뉴클레오타이드간 결합)를 포함한다. 몇몇 실시태양에서, 상기 변형된 gRNA는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 또는 40개의 변형된 뉴클레오타이드간 결합을 포함한다. 다른 실시태양에서, 상기 변형된 gRNA는 적어도 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130 또는 140개의 변형된 뉴클레오타이드간 결합을 포함한다. 몇몇 실시태양에서, gRNA 중의 모든 뉴클레오타이드간 결합이 변형된다.
몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 2'-O-메틸, 2'-플루오로, 2'-아미노, 2'-데옥시, 2'-아라비노, 2'-F-아라비노, 2-티오유라실, 2-아미노아데닌, 5-메틸시토신, 5-아미노알릴유라실, Z 염기, 3'-포스포로티오에이트, 3'-포스포노아세테이트, 3'-포스포노아세테이트 에스터, 3'-티오포스포노아세테이트, 3'-티오포스포노아세테이트 에스터, 3'-메틸포스포네이트, 3'-보라노포스포네이트, 3'-포스포로다이티오에이트, 또는 이들의 조합을 포함한다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 2'-O-메틸, 2'-데옥시, Z 염기, 포스포로티오에이트 뉴클레오타이드간 결합, 포스포노아세테이트 뉴클레오타이드간 결합, 티오포스포노아세테이트 뉴클레오타이드간 결합, 또는 이들의 조합을 포함한다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 2'-F, 2-티오U, 4-티오U, 2-아미노A, 5-메틸C, 5-메틸U, 5-아미노알릴U, 또는 이들의 조합을 포함한다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 "단부" 변형, 예를 들어 말단 포스페이트, PEG, 말단 아민, 말단 링커, 예를 들어 탄화수소 링커, 치환된 탄화수소 링커, 스쿠아레이트 링커, 트라이아졸로 링커, 내부 링커, 예를 들어 2-(4-부틸아미도플루오레세인)프로판-1,3-다이올 비스(포스포다이에스터) 링커, 염료에 접합된 링커, 비-형광 표지에 접합된 링커, 태그에 접합된 링커 또는 고체 지지체, 예를 들어 비드 또는 미세배열에 접합된 링커이다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 2개는 2'-O-메틸 뉴클레오타이드 및 포스포로티오에이트 뉴클레오타이드간 결합, 2'-O-메틸 뉴클레오타이드 및 포스포노아세테이트 뉴클레오타이드간 결합, 또는 2'-O-메틸 뉴클레오타이드 및 티오포스포노아세테이트 뉴클레오타이드간 결합을 포함한다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 2개는 2'-O-메틸 뉴클레오타이드 및 포스포노카복실레이트 뉴클레오타이드간 결합, 2'-O-메틸 뉴클레오타이드 및 포스포노카복실레이트 에스터 뉴클레오타이드간 결합, 2'-O-메틸 뉴클레오타이드 및 티오포스포노카복실레이트 뉴클레오타이드간 결합, 2'-O-메틸 뉴클레오타이드 및 티오포스포노카복실레이트 에스터 뉴클레오타이드간 결합, 또는 이들의 조합을 포함한다. 다른 실시태양에서, 상기 조합 중 변형은 2-티오유라실, 2-티오시토신, 4-티오유라실, 6-티오구아닌, 2-아미노아데닌, 2-아미노퓨린, 슈도유라실, 이노신, 7-데아자구아닌, 7-데아자-8-아자구아닌, 7-데아자아데닌, 7-데아자-8-아자아데닌, 5-메틸시토신, 5-메틸유라실, 5-하이드록시메틸시토신, 5-하이드록시메틸유라실, 5,6-데하이드로유라실, 5-프로피닐시토신, 5-프로피닐유라실, 5-에티닐시토신, 5-에티닐유라실, 5-알릴유라실, 5-알릴시토신, 5-아미노알릴-유라실, 5-아미노알릴-시토신, 또는 비염기성 뉴클레오타이드를 추가로 포함한다.
몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 2'-O-메틸-3'-포스포로티오에이트를 포함한다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 2'-O-메틸-3'-포스포노아세테이트를 포함한다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 2'-O-메틸-3'-티오포스포노아세테이트를 포함한다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 2'-할로-3'-포스포로티오에이트를 포함한다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 2'-할로-3'-포스포노아세테이트를 포함한다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 2'-할로-3'-티오포스포노아세테이트를 포함한다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 2'-플루오로-3'-포스포로티오에이트를 포함한다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 2'-플루오로-3'-포스포노아세테이트를 포함한다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 2'-플루오로-3'-티오포스포노아세테이트를 포함한다. 적어도 2개 또는 3개의 변형의 가능한 조합들을 각각 도 6 및 도 7에 나타내며, 이들은 본 명세서에 참고로 인용된다.
몇몇 실시태양에서, 상기 가이드 RNA는 하기 화학식 III 또는 화학식 IV에 의해 나타내는 올리고뉴클레오타이드를 포함한다:
[화학식 III]
W-Y-Q
[화학식 IV]
Y-W-X-Q
상기 식에서,
Q 및 W는 각각 독립적으로 적어도 하나의 변형을 포함하는 올리고뉴클레오타이드의 뉴클레오타이드 또는 뉴클레오타이드들의 신장부를 나타내고;
Y 및 X는 각각 독립적으로 상기 올리고뉴클레오타이드의 변형되지 않은 부분을 나타낸다.
몇몇 실시태양에서, W는 상기 가이드 RNA의 5' 부분내에 있다. 몇몇 실시태양에서, W는 적어도 부분적으로 상기 가이드 RNA의 5' 부분의 처음 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, W는 적어도 부분적으로 상기 가이드 RNA의 5' 부분의 처음 3개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, W는 상기 가이드 RNA의 내부 영역내에(즉 5' 단부와 3' 단부 사이에) 있다.
몇몇 실시태양에서, Q는 상기 가이드 RNA의 3' 부분내에 있다. 몇몇 실시태양에서, Q는 적어도 부분적으로 상기 가이드 RNA의 3' 부분의 마지막 5개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, Q는 적어도 부분적으로 상기 가이드 RNA의 3' 부분의 마지막 3개 뉴클레오타이드내에 있다. 몇몇 실시태양에서, Q는 상기 가이드 RNA의 내부 영역내에(즉 5' 단부와 3' 단부 사이에) 있다.
몇몇 실시태양에서, W는 상술한 바와 같은 단부 변형, 예를 들어 5' 단부 또는 3' 단부 변형을 포함한다. 몇몇 실시태양에서, 상기 단부 변형은 다이메톡시트리틸을 포함한다.
몇몇 실시태양에서, W 및 Q 중 적어도 하나는 상술한 바와 같은 변형된 염기를 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50개의 변형된 염기를 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 하나 초과의 변형된 염기, 예를 들어 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 변형된 염기를 포함한다.
몇몇 실시태양에서, W 및 Q 중 적어도 하나는 상술한 바와 같은 변형된 당을 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50개의 변형된 당을 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 하나 초과, 예를 들어 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 변형된 당을 포함한다.
몇몇 실시태양에서, W 및 Q 중 적어도 하나는 상술한 바와 같은 변형된 주쇄(즉 포스포다이에스터 외에 뉴클레오타이드간 결합)을 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49 또는 50개의 변형된 뉴클레오타이드간 결합을 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 하나 초과, 예를 들어 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 변형된 뉴클레오타이드간 결합을 포함한다.
몇몇 실시태양에서, W 및 Q 중 적어도 하나는 2'-O-메틸 뉴클레오타이드, 2'-F 뉴클레오타이드, 2'-아미노 뉴클레오타이드, 2'-데옥시 뉴클레오타이드, 2-티오유리딘 뉴클레오타이드, 2-아미노아데노신 뉴클레오타이드, 6-티오구아노신 뉴클레오타이드, 5-메틸시티딘 뉴클레오타이드, 5-아미노알릴유리딘 뉴클레오타이드, Z 뉴클레오타이드, 3'-포스포로티오에이트 뉴클레오타이드간 결합, 3'-포스포로티오에이트 뉴클레오타이드간 결합, 3'-포스포노아세테이트 뉴클레오타이드간 결합, 5'-포스포노아세테이트 에스터 뉴클레오타이드간 결합, 3'-티오포스포노아세테이트 뉴클레오타이드간 결합, 3'-티오포스포노아세테이트 에스터 뉴클레오타이드간 결합, 3'-메틸포스포네이트 뉴클레오타이드간 결합, 3'-보라노포스포네이트 뉴클레오타이드간 결합, 3'-포스포로다이티오에이트 뉴클레오타이드간 결합, 또는 이들의 조합을 포함한다.
몇몇 실시태양에서, W 및 Q 중 적어도 하나는 동일한 뉴클레오타이드상에 2'-O-메틸 및 3'-포스포로티오에이트기를 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 동일한 뉴클레오타이드상에 2'-O-메틸 및 3'-포스포노아세테이트기 결합을 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 동일한 뉴클레오타이드상에 2'-O-메틸 및 3'-티오포스포노아세테이트기를 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 동일한 뉴클레오타이드상에 2'-F 및 3'-포스포로티오에이트기를 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 동일한 뉴클레오타이드상에 2'-F 및 3'-포스포노아세테이트기 결합 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 동일한 뉴클레오타이드상에 2'-F 및 3'-티오포스포노아세테이트기를 포함한다.
몇몇 실시태양에서, W 및 Q 중 적어도 하나는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개의 변형된 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나내의 각각의 변형된 뉴클레오타이드는 동일한 변형 또는 변형들을 포함한다. 몇몇 실시태양에서, W는 Q 중의 변형된 뉴클레오타이드와 상이한 변형된 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 2개 이상의 변형된 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 3개 이상의 변형된 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는, 하나 이상의 변형되지 않은 뉴클레오타이드들이 개입할 수 있기 때문에, 상기 서열 중에 연속적으로 배열되지 않거나, 적어도 전적으로 배열되지는 않는다. 몇몇 실시태양에서, 상기 변형된 뉴클레오타이드는 연속적으로 배열된다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 변형된 뉴클레오타이드의 적어도 하나의 연속적인 신장부를 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 적어도 3개의 변형된 뉴클레오타이드의 연속적인 신장부를 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 적어도 4개의 변형된 뉴클레오타이드의 연속적인 신장부를 포함한다. 몇몇 실시태양에서, W 및 Q 중 적어도 하나는 적어도 5개의 변형된 뉴클레오타이드의 연속적인 신장부를 포함한다.
몇몇 실시태양에서, 상기 가이드 RNA는 하기 화학식 V 또는 화학식 VI의 뉴클레오타이드 서열을 포함한다:
[화학식 V]
MmNnM'm'N'n '
[화학식 VI]
MmNnM'm'N'n'M"m "
상기 식에서,
각각의 M은 독립적으로 변형된 리보뉴클레오타이드를 나타내고;
각각의 N은 독립적으로 변형되지 않은 리보뉴클레오타이드를 나타내고;
각각의 M'은 독립적으로 변형된 리보뉴클레오타이드를 나타내고;
각각의 N'은 독립적으로 변형되지 않은 리보뉴클레오타이드를 나타내고;
각각의 M"은 독립적으로 변형된 리보뉴클레오타이드를 나타내고;
m은 0 내지 40의 정수이고, n은 0 내지 130의 정수이고, m'은 0 내지 10의 정수이고, n'은 0 내지 130의 정수이고, m"은 0 내지 10의 정수이나, 단 m+m'+m"는 1 이상이고 50<m+n+m'+n'+m"≤150이다.
몇몇 실시태양에서, 각각의 M은 2'-O-메틸 리보뉴클레오타이드, 2'-O-메틸-3'-P(S) 리보뉴클레오타이드, 2'-O-메틸-3'-PACE 리보뉴클레오타이드, 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드, 및 2'-데옥시뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택된다. 몇몇 실시태양에서, 각각의 M은 2'-O-메틸 리보뉴클레오타이드, 2'-O-메틸-3'-P(S) 리보뉴클레오타이드, 2'-O-메틸-3'-PACE 리보뉴클레오타이드, 및 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택된다. 몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-PACE 리보뉴클레오타이드 및 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택된다. 몇몇 실시태양에서, m>1일 때, 임의의 주어진 M은 임의의 다른 M과 동일하거나 상이하다. 몇몇 실시태양에서, m>1일 때, 각각의 M은 동일한 변형 또는 변형들을 포함한다.
몇몇 실시태양에서, 각각의 M'은 2'-O-메틸 리보뉴클레오타이드, 2'-O-메틸-3'-P(S) 리보뉴클레오타이드, 2'-O-메틸-3'-PACE 리보뉴클레오타이드, 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드, 및 2'-데옥시뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택된다. 몇몇 실시태양에서, 각각의 M'은 2'-O-메틸 리보뉴클레오타이드, 2'-O-메틸-3'-P(S) 리보뉴클레오타이드, 2'-O-메틸-3'-PACE 리보뉴클레오타이드, 및 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택된다. 몇몇 실시태양에서, 각각의 M'은 2'-O-메틸-3'-PACE 리보뉴클레오타이드 및 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택된다. 몇몇 실시태양에서, m'>1일 때, 임의의 주어진 M'은 임의의 다른 M'과 동일하거나 상이하다. 몇몇 실시태양에서, m'>1일 때, 각각의 M'은 동일한 변형 또는 변형들을 포함한다.
몇몇 실시태양에서, 각각의 M"은 2'-O-메틸 리보뉴클레오타이드, 2'-O-메틸-3'-P(S) 리보뉴클레오타이드, 2'-O-메틸-3'-PACE 리보뉴클레오타이드, 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드, 및 2'-데옥시뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택된다. 몇몇 실시태양에서, 각각의 M"은 2'-O-메틸 리보뉴클레오타이드, 2'-O-메틸-3'-P(S) 리보뉴클레오타이드, 2'-O-메틸-3'-PACE 리보뉴클레오타이드, 및 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택된다. 몇몇 실시태양에서, 각각의 M"은 2'-O-메틸-3'-PACE 리보뉴클레오타이드 및 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택된다. 몇몇 실시태양에서, m">1일 때, 임의의 주어진 M"은 임의의 다른 M"과 동일하거나 상이하다. 몇몇 실시태양에서, m'>1일 때, 각각의 M"은 동일한 변형 또는 변형들을 포함한다.
몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-PACE 리보뉴클레오타이드이고; m은 1 내지 10의 정수 중에서 선택되고; 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고; n은 10 내지 130의 정수 중에서 선택되고; 각각의 M'은 2'-O-메틸 리보뉴클레오타이드, 2'-O-메틸-3'-P(S) 리보뉴클레오타이드, 2'-O-메틸-3'-PACE 리보뉴클레오타이드, 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드, 2'-데옥시뉴클레오타이드 및 Z 뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택되고; m'은 1 내지 10의 정수 중에서 선택되고; 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고; n'은 0 내지 130의 정수 중에서 선택된다. 몇몇 실시태양에서, 각각의 M'은 2'-O-메틸-3'-PACE 리보뉴클레오타이드이다. 몇몇 실시태양에서, 각각의 M'은 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드이다. 몇몇 실시태양에서, 각각의 M'은 2'-O-메틸 리보뉴클레오타이드이다. 몇몇 실시태양에서, 각각의 M'은 2'-O-메틸-3'-P(S) 리보뉴클레오타이드이다. 몇몇 실시태양에서, 각각의 M'은 Z 뉴클레오타이드이다.
몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드이고; m은 1 내지 10의 정수 중에서 선택되고; 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고; n은 10 내지 130의 정수 중에서 선택되고; 각각의 M'은 2'-O-메틸 리보뉴클레오타이드, 2'-O-메틸-3'-P(S) 리보뉴클레오타이드, 2'-O-메틸-3'-PACE 리보뉴클레오타이드, 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드, 2'-데옥시뉴클레오타이드 및 Z 뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택되고; m'은 1 내지 10의 정수 중에서 선택되고; 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고; n'은 0 내지 130의 정수 중에서 선택된다. 몇몇 실시태양에서, 각각의 M'은 2'-O-메틸-3'-PACE 리보뉴클레오타이드이다. 몇몇 실시태양에서, 각각의 M'은 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드이다. 몇몇 실시태양에서, 각각의 M'은 2'-O-메틸 리보뉴클레오타이드이다. 몇몇 실시태양에서, 각각의 M'은 2'-O-메틸-3'-P(S) 리보뉴클레오타이드이다. 몇몇 실시태양에서, 각각의 M'은 Z 뉴클레오타이드이다.
몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-P(S) 리보뉴클레오타이드이고; m은 1 내지 10의 정수 중에서 선택되고; 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고; n은 10 내지 130의 정수 중에서 선택되고; 각각의 M'은 2'-O-메틸 리보뉴클레오타이드, 2'-O-메틸-3'-P(S) 리보뉴클레오타이드, 2'-O-메틸-3'-PACE 리보뉴클레오타이드, 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드, 2'-데옥시뉴클레오타이드 및 Z 뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택되고; m'은 1 내지 10의 정수 중에서 선택되고; 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고; n'은 0 내지 130의 정수 중에서 선택된다. 몇몇 실시태양에서, 각각의 M'은 2'-O-메틸-3'-PACE 리보뉴클레오타이드이다. 몇몇 실시태양에서, 각각의 M'은 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드이다. 몇몇 실시태양에서, 각각의 M'은 2'-O-메틸 리보뉴클레오타이드이다. 몇몇 실시태양에서, 각각의 M'은 2'-O-메틸-3'-P(S) 리보뉴클레오타이드이다. 몇몇 실시태양에서, 각각의 M'은 Z 뉴클레오타이드이다.
몇몇 실시태양에서, 각각의 M은 2'-O-메틸 리보뉴클레오타이드, 2'-O-메틸-3'-P(S) 리보뉴클레오타이드, 2'-O-메틸-3'-PACE 리보뉴클레오타이드, 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드, 2'-데옥시뉴클레오타이드 및 Z 뉴클레오타이드로 이루어진 군 중에서 독립적으로 선택되고; m은 0 내지 10의 정수 중에서 선택되고; 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고; n은 10 내지 15의 정수 중에서 선택되고; 각각의 M'은 2'-O-메틸 리보뉴클레오타이드이고; m'은 1 내지 5의 정수 중에서 선택되고; 각각의 N은 A, U, C 및 G로 이루어진 군 중에서 독립적으로 선택되고; n'은 0 내지 130의 정수 중에서 선택된다. 몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-PACE 리보뉴클레오타이드이다. 몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드이다. 몇몇 실시태양에서, 각각의 M은 2'-O-메틸 리보뉴클레오타이드이다. 몇몇 실시태양에서, 각각의 M은 2'-O-메틸-3'-P(S) 리보뉴클레오타이드이다. 몇몇 실시태양에서, m은 0이고; n은 10 내지 15의 정수 중에서 선택되고, m'은 1 내지 5의 정수 중에서 선택되고; n'은 0 내지 130 중에서 선택된다.
몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 안정성-변경 변형이다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 뉴클레아제 내성을 증가시키며, 따라서 상기 가이드 RNA의 안정성을 증대시킨다.
몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 상술한 바와 같은 안정성-증대 변형이다.
몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 상술한 바와 같은 특이성-변경 변형이다.
몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 RNA 염기 짝짓기를 변경시킨다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 상술한 바와 같은 염기 짝짓기 상호작용의 Tm을 낮춘다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 상술한 바와 같은 염기 짝짓기 상호작용의 Tm을 상승시킨다.
몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 형질감염 효율을 변경시킨다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 형질감염 효율을 증가시킨다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 형질감염 효율을 감소시킨다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 포스포노아세테이트 알킬 에스터 뉴클레오타이드간 결합, 예를 들어 포스포노아세테이트 메틸 에스터 뉴클레오타이드간 결합을 포함한다.
몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 안정성 및 특이성을 증대시킨다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 안정성 및 형질감염 효율을 증대시킨다. 몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 상기 변형이 없는 가이드 RNA에 비해 상기 가이드 RNA의 특이성 및 형질감염 효율을 증대시킨다.
몇몇 실시태양에서, 상기 조합 중 변형의 적어도 하나는 상기 가이드 RNA의 2차 구조를 변경시킨다. 상기 변형은 상기 가이드 RNA 중의 RNA/RNA 내부 듀플렉스 중 어느 하나의 염기-짝짓기를 변경시킨다. 이들 변경 중 일부는 상기 RNA/RNA 구조의 염기 짝짓기를 증가시키거나 한편으로 상기 RNA/RNA 듀플렉스의 Tm을 증가시키는 반면, 다른 변형들은 상기 RNA/RNA 듀플렉스 또는 듀플렉스들의 염기 짝짓기(또는 Tm)를 감소시킨다. 상기와 같은 변형은 염기 변형된 뉴클레오타이드, 특히 UNA 뉴클레오타이드, 예를 들어 2-티오유리딘 및 2-아미노아데노신 쌍, Z/P 뉴클레오타이드 쌍, 아이소C/아이소G 쌍, 6-티오G/5-메틸피리미딘 쌍, 및 이전에 논의된 바와 같은 당 또는 뉴클레오타이드간 결합상에 변형을 갖는 뉴클레오타이드를 포함한다.
몇몇 실시태양에서, 상기 조합은 적어도 하나의 변형에 의해 뉴클레아제 내성(즉 안정성)을 증가시키는 적어도 하나의 변형 또는 변형들의 세트 또는 특이성을 증가시키는(즉 표적-외 효과를 감소시키는) 변형들의 세트를 포함한다. 몇몇 실시태양에서, 상기 조합은 적어도 하나의 변형에 의해 뉴클레아제 내성(즉 안정성)을 증가시키는 적어도 하나의 변형 또는 변형들의 세트 또는 상기 가이드 RNA 중의 일부 염기 짝짓기의 Tm을 상승시키는 변형들의 세트를 포함한다. 몇몇 실시태양에서, 상기 조합은 적어도 하나의 변형에 의해 뉴클레아제 내성(즉 안정성)을 증가시키는 적어도 하나의 변형 또는 변형들의 세트 또는 상기 가이드 RNA의 일부 염기 짝짓기의 Tm을 낮추는 변형들의 세트를 포함한다. 몇몇 실시태양에서, 상기 조합은 적어도 하나의 변형에 의해 뉴클레아제 내성(즉 안정성)을 증가시키는 적어도 하나의 변형 또는 변형들의 세트, 상기 가이드 RNA 중의 일부 염기 짝짓기의 Tm을 증가시키는 적어도 하나의 변형 또는 변형들의 세트, 및 상기 가이드 RNA 중의 어딘가의 일부 염기 짝짓기의 Tm을 감소시키는 적어도 하나의 변형 또는 변형들의 세트를 포함한다. 몇몇 실시태양에서, 상기 조합은 뉴클레아제 내성(즉 안정성)을 증가시키는 적어도 하나의 변형 또는 변형들의 세트 및 Cas 단백질에 대한 상기 가이드 RNA의 결합을 증가시키는 적어도 하나의 변형 또는 변형들의 세트를 포함한다. 몇몇 실시태양에서, 상기 조합은 뉴클레아제 내성(즉 안정성)을 증가시키는 적어도 하나의 변형 또는 변형들의 세트, 및 Cas 단백질에 대한 상기 가이드 RNA의 결합을 감소시키는 적어도 하나의 변형 또는 변형들의 세트를 포함한다. 몇몇 실시태양에서, 상기 가이드 RNA는 상이한 유형의 변형들의 조합을 포함한다.
D. 가이드 RNA 구조
몇몇 실시태양에서, 상기 가이드 RNA는 크리스퍼-결합된 단백질과 복합체를 형성할 수 있다. 몇몇 실시태양에서, 상기 크리스퍼-결합된 단백질은 RNA-가이드 폴리뉴클레오타이드 결합 및/또는 뉴클레아제 활성을 갖는 크리스퍼-Cas II유형 시스템에 의해 제공되거나 상기로부터 유래된다. 몇몇 실시태양에서, 상기 크리스퍼-결합된 단백질은 Cas9, Cas9 돌연변이체, 또는 Cas9 변체이다. 몇몇 실시태양에서, 상기 크리스퍼-결합된 단백질은 스트렙토코커스 피오게네스로부터의 Cas9 뉴클레아제이다. 몇몇 실시태양에서, 상기 크리스퍼-결합된 단백질은 스트렙토코커스 써모필루스(Streptococcus thermophilus)로부터의 Cas9 뉴클레아제이다. 몇몇 실시태양에서, 상기 크리스퍼-결합된 단백질은 스타필로코커스 아우레우스(Staphylococcus aureus)로부터의 Cas9 뉴클레아제이다. 몇몇 실시태양에서, 상기 합성 가이드 RNA 또는 합성 가이드 RNA:크리스퍼-결합된 단백질 복합체는 천연 가이드 RNA 또는 변형된 뉴클레오타이드를 갖지 않는 복합체의 기능성을 유지한다. 몇몇 실시태양에서, 상기 기능성은 표적 폴리뉴클레오타이드에의 결합을 포함한다. 몇몇 실시태양에서, 상기 기능성은 표적 폴리뉴클레오타이드의 틈 형성을 포함한다. 몇몇 실시태양에서, 상기 기능성은 표적 폴리뉴클레오타이드의 절단을 포함한다. 몇몇 실시태양에서, 상기 표적 폴리뉴클레오타이드는 시험관내에서 핵산내에 있다. 몇몇 실시태양에서, 상기 표적 폴리뉴클레오타이드는 생체내 또는 시험관내(예를 들어, 배양된 세포 또는 유기체로부터 단리된 세포내)에서 세포의 게놈내에 있다. 몇몇 실시태양에서, 상기 표적 폴리뉴클레오타이드는 DNA 중의 프로토스페이서이다.
몇몇 실시태양에서, 상기 crRNA는 25 내지 80개 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 crRNA 분절은 표적 서열에 하이브리드화할 수 있는 가이드 서열을 포함한다. 몇몇 실시태양에서, 상기 가이드 서열은 표적 서열 또는 그의 일부에 상보성이다. 몇몇 실시태양에서, 상기 가이드 서열은 15 내지 30개 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 crRNA는 줄기 서열을 포함한다. 몇몇 실시태양에서, 상기 줄기 서열은 10 내지 50개 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 crRNA 분절은 5'-오버행 서열을 포함한다. 몇몇 실시태양에서, 상기 5'-오버행 서열은 1 내지 10개 뉴클레오타이드, 한편으로 1 내지 5개 뉴클레오타이드, 한편으로 1, 2 또는 3개 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 crRNA는 (i) 표적 서열에 하이브리드화할 수 있는 가이드 서열 및 (ii) 줄기 서열 모두를 포함한다. 몇몇 실시태양에서, 상기 crRNA는 (i) 5'-오버행 서열, (ii) 표적 서열에 하이브리드화할 수 있는 가이드 서열 및 (iii) 줄기 서열을 포함한다. 상기 crRNA 분절이 줄기 서열을 포함하는 몇몇 실시태양에서, 상기 tracrRNA 분절은 상기 crRNA 분절의 줄기 서열에 부분적으로 또는 전적으로 상보성인 뉴클레오타이드 서열을 포함한다. 몇몇 실시태양에서, 상기 tracrRNA 분절은 적어도 하나 이상의 듀플렉스 구조를 포함한다.
몇몇 실시태양에서, 상기 가이드 RNA는 단일의 가이드 RNA이다. 몇몇 실시태양에서, 상기 가이드 RNA는 단일의 가이드 RNA이며, 여기에서 crRNA 분절 및 tracrRNA 분절이 고리 L을 통해 연결된다. 몇몇 실시태양에서, 상기 고리 L은 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 뉴클레오타이드를 포함한다. 몇몇 실시태양에서, 상기 고리 L은 GNRA의 뉴클레오타이드 서열을 포함하며, 여기에서 N은 A, C, G 또는 U를 나타내고 R은 A 또는 G를 나타낸다. 몇몇 실시태양에서, 상기 고리 L은 GAAA의 뉴클레오타이드 서열을 포함한다. 몇몇 실시태양에서, 상기 가이드 RNA는 하나 초과의 고리를 포함한다.
상기 가이드 RNA는 5' 부분(즉 5' 절반) 및 3' 부분(즉 3' 절반)을 포함한다. 몇몇 실시태양에서, 상기 crRNA 분절은 상기 tracrRNA 분절의 5'(즉 상류)이다. 몇몇 실시태양에서, 상기 tracrRNA 분절은 상기 crRNA 분절에 대해 5'이다.
몇몇 실시태양에서, 상기 가이드 RNA는 2개 이상의 별도의 RNA 가닥, 예를 들어 crRNA 가닥 및 별도의 tracrRNA 가닥을 포함한다. 예를 들어, 도 5a를 참조하시오. 몇몇 실시태양에서, 상기 가닥들은 각각 하나 이상의 변형을 포함하는 합성 가닥이다. 몇몇 실시태양에서, 상기 가닥들 중 적어도 하나는 하나 이상의 변형을 포함하는 합성 가닥이다. 몇몇 실시태양에서, 상기 가닥들은 함께 Cas 단백질, 예를 들어 Cas9에 의한 표적 폴리뉴클레오타이드의 결합, 틈 형성 또는 절단을 가이드하는 기능을 한다. 몇몇 실시태양에서, 상기 crRNA 서열 및 tracrRNA 서열은 별도의 가닥상에 있으며 2개의 상보성 서열을 통해 서로 하이브리드화하여 줄기 또는 듀플렉스를 형성한다.
몇몇 실시태양에서, 상기 가이드 RNA는 crRNA 서열 및 tracrRNA 서열을 포함하는 단일의 가이드 RNA이다. 예를 들어, 도 5b를 참조하시오. 몇몇 실시태양에서, 상기 crRNA 서열 및 tracrRNA 서열은 고리 서열 또는 "고리"에 의해 연결된다. 몇몇 실시태양에서, 단일의 가이드 RNA는 5' 부분 및 3' 부분을 포함하며, 여기에서 상기 crRNA 서열은 상기 tracrRNA 서열의 상류이다.
몇몇 실시태양에서, 상기 2개의 RNA 조각의 총 길이는 약 50 내지 220(예를 들어, 약 55 내지 200, 60 내지 190, 60 내지 180, 60 내지 170, 60 내지 160, 60 내지 150, 60 내지 140, 60 내지 130, 및 60 내지 120)개 뉴클레오타이드 길이, 예를 들어 약 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 또는 220개 뉴클레오타이드 길이일 수 있다. 유사하게, 단일의 가이드 RNA(예를 들어, 도 5b)는 약 50 내지 220(예를 들어, 약 55 내지 200, 60 내지 190, 60 내지 180, 60 내지 170, 60 내지 160, 60 내지 150, 60 내지 140, 60 내지 130, 및 60 내지 120)개 뉴클레오타이드 길이, 예를 들어 약 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 또는 220개 뉴클레오타이드 길이일 수 있다.
도 5a 및 5b에 도시된 바와 같이, 합성 가이드 RNA는 (i) (a) 핵산 중 표적 서열에 하이브리드화할 수 있는 가이드 서열(예를 들어, 분절 G1-Gn, 이때 각각의 G는 상기 가이드 서열 중의 뉴클레오타이드를 나타낸다), (b) 제2 줄기 서열에 부분적으로 또는 전적으로 하이브리드화할 수 있는 제1 줄기 서열(예를 들어, 분절 X1-Xn, 이때 각각의 X는 상기 제1 줄기 서열 중의 뉴클레오타이드를 나타낸다), 및 임의로 (c) 5'-오버행 서열(예를 들어, 분절 O1-On, 이때 각각의 O는 상기 오버행 서열 중의 뉴클레오타이드를 나타낸다)를 포함하는 crRNA 서열, 및 (ii) 제2 줄기 서열(예를 들어, 분절 Y1-Yn, 이때 각각의 Y는 상기 제2 줄기 서열 중의 뉴클레오타이드를 나타낸다)을 포함하는 tracrRNA 서열을 포함한다. 상기 tracrRNA 서열은 분절 T1-Tn(이때 각각의 T는 상기 tracrRNA 서열 중의 뉴클레오타이드를 나타낸다)을 추가로 포함한다. 도 5a에 도시된 합성 가이드 RNA는 하나 이상의 변형을 포함한다. 마찬가지로, 도 5b에 도시된 합성 가이드 RNA는 하나 이상의 변형을 포함한다. 몇몇 실시태양에서, 상기 변형은 상기 crRNA, tracrRNA, 또는 crRNA 분절, tracrRNA 분절 및 임의로 고리를 포함하는 단일 가이드 RNA의 길이를 따라 임의의 지점에 위치한다. 몇몇 실시태양에서, 도 5a 및 5b에 도시된 합성 가이드 RNA 중의 O, G, X, Y 또는 T에 의해 나타내는 임의의 뉴클레오타이드는 변형된 뉴클레오타이드일 수 있다. 도 5b에 도시된 가이드 RNA는 단일 가이드 RNA(sgRNA)를 나타내며, 이때 crRNA 분절 및 tracrRNA 분절은 서열 GNRA를 갖는 고리에 의해 연결되고, 여기에서 N은 A, C, G, 또는 U를 나타내고, R은 A 또는 G를 나타낸다.
몇몇 실시태양에서, 상기 가이드 RNA의 crRNA 분절은 25 내지 70(예를 들어, 30 내지 60, 35 내지 50 또는 40 내지 45)개 뉴클레오타이드 길이이다. 몇몇 실시태양에서, 상기 가이드 서열은 12 내지 30(예를 들어, 16 내지 25, 17 내지 20 또는 15 내지 18)개 뉴클레오타이드 길이이다. 일부 실시태양에서, 상기 crRNA의 5' 부분은 표적 서열과 하이브리드화하지 않거나 단지 부분적으로 하이브리드화한다. 예를 들어, 상기 crRNA 분절상에 5'-오버행이 존재할 수 있다.
몇몇 실시태양에서, 상기 단일 가이드 RNA는 상기 crRNA 분절의 줄기 서열, 상기 tracrRNA 분절의 줄기 서열, 및 임의로 상기 crRNA 분절을 상기 tracrRNA 분절에 공유적으로 연결시키는 고리를 포함하는 중심 부분을 포함한다. 몇몇 실시태양에서, 상기 단일 가이드 RNA의 중심 분절은 8 내지 60(예를 들어, 10 내지 55, 10 내지 50, 또는 20 내지 40)개 뉴클레오타이드 길이이다.
몇몇 실시태양에서, 상기 가이드 RNA의 tracrRNA 분절은 10 내지 130(예를 들어, 10 내지 125, 10 내지 100, 10 내지 75, 10 내지 50 또는 10 내지 25)개 뉴클레오타이드 길이이다. 몇몇 실시태양에서, 상기 tracrRNA 분절은 상기 중심 분절 중의 임의의 헤어핀 또는 듀플렉스 구조 외에 하나 이상의 헤어핀 또는 듀플렉스 구조를 포함한다.
몇몇 실시태양에서, 상기 tracrRNA는 참조 tracrRNA, 예를 들어 자연에 존재하는 성숙한 tracrRNA에 비해 절두된다. 일련의 길이가 별도의 유형(도 5a) 및 키메릭 sgRNA 유형(도 5b) 모두에서 기능하는 것으로 나타났다. 예를 들어, 몇몇 실시태양에서, tracrRNA는 그의 3' 단부로부터 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35 또는 40 nt까지 절두될 수 있다. 몇몇 실시태양에서, 상기 tracrRNA 분자는 그의 5' 단부로부터 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75 또는 80 nt까지 절두될 수 있다. 몇몇 실시태양에서, 상기 tracrRNA 분자는 5' 및 3' 단부 모두로부터, 예를 들어 상기 5' 단부로부터 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15 또는 20 nt까지, 및 상기 3' 단부로부터 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35 또는 40 nt까지 절두될 수 있다. 예를 들어, 문헌[Jinek et al. (2012) Science, 337, 816-21]; 문헌[Mali et al. (2013) Science, 33P:6121, 823-6]; 문헌[Cong et al. (2013) Science, 539:6121, 819-23]; 및 문헌[Hwang et al. (2013) Nat. Biotechnol. 31:3, 227-9]; 문헌[Jinek et al. (2013) eLife, 2, e00471]을 참조하시오. 몇몇 실시태양에서, 상기 tracrRNA는 절두되지 않는다.
몇몇 실시태양에서, 상기 개시된 변형은 상기 crRNA 분절 또는 tracrRNA 분절 또는 둘 다 중에 있다. 몇몇 실시태양에서, 상기 개시된 변형은 상기 crRNA 분절의 가이드 서열 중에 있다. 몇몇 실시태양에서, 상기 개시된 변형은 상기 crRNA 분절의 줄기 서열 중에 있다. 몇몇 실시태양에서, 상기 개시된 변형은 상기 crRNA 분절의 5'-오버행 서열 중에 있다. 몇몇 실시태양에서, 상기 개시된 변형은 상기 tracrRNA 분절의 줄기 서열 중에 있다. 몇몇 실시태양에서, 상기 개시된 변형은 상기 가이드 RNA의 고리 서열 중에 있다. 몇몇 실시태양에서, 상기 개시된 변형은 상기 가이드 RNA의 5' 부분 중에 있다. 몇몇 실시태양에서, 상기 개시된 변형은 상기 가이드 RNA의 3' 부분 중에 있다. 몇몇 실시태양에서, 상기 개시된 변형은 상기 가이드 RNA의 5' 부분 및 상기 가이드 RNA의 3' 부분 중에 있다.
E. 가이드 RNA의 합성
몇몇 실시태양에서, 단일 가이드 RNA(sgRNA; 도 1 및 5B를 참조하시오)를 포함한 가이드 RNA를 합성 유기 화학의 기술을 사용하여 화학 합성에 의해 생성시킨다. 4개의 우세한 리보뉴클레오타이드, 즉 A, C, G 및 U 이외의 임의의 뉴클레오타이드(천연이든 비천연이든), 예를 들어 슈도유리딘, 이노신 또는 데옥시뉴클레오타이드를 포함하는 가이드 RNA는, RNA 중의 상기 4개의 우세한 뉴클레오타이드 중 어느 하나와 화학적으로/구조적으로 상이한 뉴클레오타이드에 화학적 변형 또는 치환을 갖는다.
본 명세서에 기재된 합성 가이드 RNA를 화학적으로 합성할 수 있다. 예를 들어, 상기 합성 가이드 RNA를 문헌[Dellinger et al. (2011) J. Am. Chem. Soc, 133, 11540], 미국특허 제 8,202,983 호 및 미국특허 출원 제 2010/0076183A1 호(이들의 내용은 전체가 본 명세서에 참고로 인용된다)에 기재된 방법에 의해 TC 화학을 사용하여 합성할 수 있다. "TC 화학"은 티오노카바메이트 보호기에 의해 2' 하이드록실 부분상에서 보호된 RNA 단량체성 뉴클레오타이드 전구체를 사용하여, 변형되지 않은 RNA 또는 하나 이상의 변형된 뉴클레오타이드를 포함하는 변형된 RNA를 합성하는 조성물 및 방법을 지칭한다. TC-RNA 화학을 사용허여 비교적 긴 RNA(200머 이상 정도로 긴)를 화학적으로 합성하는 능력은 우리로 하여금 상기 4개의 우세한 리보뉴클레오타이드(A,C,G 및 U)에 의해 가능한 것들을 능가할 수 있는 특별한 특징들을 갖는 가이드 RNA를 생성할 수 있게 한다. 본 명세서에 기재된 일부 합성 가이드 RNA를 또한, 시험관내 전사 및 세포-기반 발현을 포함하는 당해 분야에 공지된 방법들을 사용하여 제조할 수 있다. 예를 들어, 2'-플루오로 NTP를 세포-기반 발현에 의해 생성된 합성 가이드 RNA에 통합시킬 수 있다.
가이드 RNA의 합성을 또한 효소에 의해 후속적으로 함께 결찰되거나, 화학적 결찰, 예를 들어 비제한적으로 시아노젠 브로마이드 화학, 문헌[R. Kumar et al. (2007) J. Am. Chem. Soc, 129, 6859-64]에 공개된 바와 같은 "클릭" 화학, 또는 "올리고뉴클레오타이드의 접합을 위한 조성물 및 방법"이란 표제하의 케이 힐(K. Hill)의 WO2013176844에 기재된 바와 같은 스쿠아레이트 접합 화학에 의해 화학적으로 결찰되는 RNA 서열의 화학적 또는 효소적 합성에 의해 수행할 수 있다.
하기에 추가로 기재되는 바와 같이, 변형된 뉴클레오타이드 및/또는 변형된 뉴클레오타이드간 결합을 포함하는 가이드 RNA를 포함한, 본 명세서에 개시된 가이드 RNA를 사용하여 다양한 크리스퍼-매개된 기능(비제한적으로 유전자 편집, 유전자 발현의 조절, 표적 서열의 절단, 및 표적 서열에의 결합을 포함한다)을 시험관내 또는 생체내에서, 예를 들어 무세포 분석에서, 완전 세포에서, 또는 전체 기관에서 수행할 수 있다. 시험관내 또는 생체내 적용을 위해서, 상기 RNA를 당해 분야에 공지된 임의의 방식으로 세포 또는 전체 기관내로 전달할 수 있다.
라이브러리 및 배열
하나의 태양에서, 본 발명은 다수의 가이드 RNA의 세트 또는 라이브러리를 제공한다. 몇몇 실시태양에서, 상기 라이브러리는 본 명세서에 개시된 2개 이상의 가이드 RNA를 함유한다. 상기 라이브러리는 약 10 내지 약 107의 개별적인 구성원, 예를 들어 약 10 내지 약 102, 약 102 내지 약 103, 약 103 내지 약 105, 약 105 내지 약 107의 구성원을 함유할 수 있다. 상기 라이브러리의 개별적인 구성원은 적어도 상기 가이드 서열 중의 상기 라이브러리의 다른 구성원, 즉 상기 gRNA의 DNA 표적화 분절과 상이하다. 다른 한편으로, 몇몇 실시태양에서, 라이브러리의 각각의 개별적인 구성원은 상기 라이브러리의 모든 다른 구성원들과 동일하거나 실질적으로 동일한 tracrRNA 분절에 대한 뉴클레오타이드 서열을 함유할 수 있다. 이러한 방식으로, 상기 라이브러리는 상이한 폴리뉴클레오타이드 또는 하나 이상의 폴리뉴클레오타이드 중의 상이한 서열을 표적화하는 구성원들을 포함할 수 있다.
몇몇 실시태양에서, 상기 라이브러리는 적어도 102개의 독특한 가이드 서열을 포함한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 103개의 독특한 가이드 서열을 포함한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 104개의 독특한 가이드 서열을 포함한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 105개의 독특한 가이드 서열을 포함한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 106개의 독특한 가이드 서열을 포함한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 107개의 독특한 가이드 서열을 포함한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 10개의 상이한 폴리뉴클레오타이드를 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 102개의 상이한 폴리뉴클레오타이드를 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 103개의 상이한 폴리뉴클레오타이드를 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 104개의 상이한 폴리뉴클레오타이드를 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 105개의 상이한 폴리뉴클레오타이드를 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 106개의 상이한 폴리뉴클레오타이드를 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 107개의 상이한 폴리뉴클레오타이드를 표적화한다.
몇몇 실시태양에서, 상기 라이브러리는 상기 라이브러리 중의 구성원들의 서열을 가로질러 움직이는 점진적으로 이동하는 창 중에 동일한 서열 및 동일한 변형을 갖는 가이드 RNA의 콜렉션을 포함한다. 몇몇 실시태양에서, 상기 창은 집합적으로 상기 RNA의 전체 길이를 포함한다.
몇몇 실시태양에서, 상기 라이브러리는 대량 처리, 다중-표적 게놈 조작 및 분석의 수행을 허용한다. 몇몇 실시태양에서, 단지 상기 가이드 RNA의 DNA-표적화 분절만이 변하는 반면, Cas 단백질-결합 분절은 동일하다. 몇몇 실시태양에서, 상기 라이브러리의 제1 부분은 특정한 Cas 단백질을 인식하고, 결합하고 지시하는 Cas-결합 분절을 갖는 가이드 RNA를 포함하고, 상기 라이브러리의 제2 부분은 상이한 Cas 단백질(예를 들어, 상이한 종들로부터의 Cas 단백질)을 인식하고, 결합하고 지시하는 상이한 Cas-결합 분절을 포함하며, 이에 의해 상기 라이브러리는 2개 이상의 직교하는 Cas 단백질들과 함께 기능할 수 있다. 몇몇 실시태양에서, 제1 직교 Cas 단백질의 유도 발현은 상기 제1 직교 Cas 단백질과 상호작용하는 라이브러리의 부분을 사용한다. 몇몇 실시태양에서, 제1 및 제2 직교 Cas 단백질의 유도 발현은 각각 상기 제1 및 제2 직교 Cas 단백질과 상호작용하는 라이브러리의 부분들을 사용한다. 몇몇 실시태양에서, 상기 제1 및 제2 직교 Cas 단백질의 유도 발현은 상이한 횟수로 발생한다. 상응하게, 상기 라이브러리에 명시된 다수의 표적을 특이적으로 조작하거나 변형시킴으로써 대규모 유전자 편집 또는 유전자 조절을 수행할 수 있다.
몇몇 실시태양에서, 상기 라이브러리는 "배열된" 라이브러리, 즉 어드레스 가능한 배열의 상이한 특징들 또는 특징들의 풀의 콜렉션이다. 예를 들어, 배열의 특징들을 선택적으로 가르고, 미세적정 플레이트 중의 각 웰이 공지된 특징 또는 공지된 특징들의 풀을 함유하도록 상기 플레이트로 옮길 수 있다. 일부 다른 실시태양에서, 상기 라이브러리를 48-컬럼 또는 96-컬럼 미세적정 플레이트 포맷 또는 384-컬럼 플레이트에서 합성한다.
몇몇 실시태양에서, 본 발명의 가이드 RNA의 합성을, 화학적 존재가 결합될 수 있는 표면을 갖는 고체 지지체상에서 수행할 수 있다. 일부 실시태양에서, 합성되는 가이드 RNA들을 동일한 고체 지지체에 직접적으로 또는 간접적으로 부착시키고 배열의 부분을 형성할 수 있다. "배열"은, 각 서열의 위치를 알도록 각각 공간적으로 한정되고 물리적으로 어드레스 가능한 방식으로 배열된 공지된 단량체성 서열의 별도의 분자들의 콜렉션이다. 본 명세서에서 호환 가능하게 사용되는 "배열" 또는 "미세배열"은 특정한 화학적 부분 또는 부분들(예를 들어, 리간드, 예를 들어 생물중합체, 예를 들어 폴리뉴클레오타이드 또는 올리고뉴클레오타이드 서열(핵산), 폴리펩타이드(예를 들어, 단백질), 탄수화물, 지질 등)이 결합된, 어드레스 가능한 영역들의 임의의 1차원, 2차원 또는 실질적으로 2차원(뿐만 아니라 3차원)의 배열을 포함한다. 배열은 상기 배열상의 특정한 소정의 위치(즉 "어드레스")의 영역(즉 상기 배열의 "특징")이 특정 표적 또는 표적들의 부류를 검출하도록(특징이 상기 특징의 비-표적을 우연히 검출할 수도 있다) 상이한 부분(예를 들어, 상이한 폴리뉴클레오타이드 서열)의 다수의 영역을 가질 때 "어드레스 가능하다". 배열 특징은 전형적으로는 중재 공간에 의해 분리된다(필요한 것은 아니다). 배열상에 함유될 수 있는 특징들의 수는 주로 기재의 표면적, 특징의 크기 및 특징들간의 간격에 의해 결정될 것이다. 배열은 ㎠당 수십만 개 또는 더 많은 특징들의 밀도, 예를 들어 2,500 내지 200,000 특징/㎠를 가질 수 있다. 상기 특징들을 기재에 공유 결합시킬 수도, 공유 결합시키지 않을 수도 있다.
적합한 고체 지지체는 다양한 형태 및 조성을 가질 수 있으며 천연 물질, 합성적으로 변형된 천연 물질, 또는 합성 물질로부터 유래된다. 적합한 지지체 물질의 예는 비제한적으로 실리카, 규소 및 규소 산화물, 테플론, 유리, 폴리사카라이드, 예를 들어 아가로스(예를 들어, 파마시아(Pharmacia)로부터의 세파로스(등록상표)) 및 덱스트란(예를 들어, 파마시아로부터의 세파덱스(등록상표) 및 세파실(등록상표)), 폴리아크릴아미드, 폴리스타이렌, 폴리비닐 알콜, 하이드록시에틸 메트아크릴레이트 및 메틸 메트아크릴레이트의 공중합체 등을 포함한다. 일부 실시태양에서, 상기 고체 지지체는 다수의 비드이다.
상기 기재 표면상에서 합성되는 가이드 RNA의 초기 단량체를 링커에 결합시킬 수 있으며, 차례로 이는 표면 친수성기, 예를 들어 실리카 기재상에 존재하는 표면 하이드록실 부분에 결합된다. 일부 실시태양에서, 보편적인 링커가 사용된다. 일부 다른 실시태양에서, 상기 초기 단량체를 예를 들어 표면 하이드록실 부분과 직접 반응시킨다. 한편으로, 가이드 RNA를 본 발명에 따라 먼저 합성하고, 당해 분야에 공지된 임의의 방법에 의해 합성-후 고체 기재에 부착시킬 수 있다. 따라서, 본 발명을 사용하여 가이드 RNA의 배열을 제조할 수 있으며, 여기에서 상기 올리고뉴클레오타이드는 상기 배열상에서 합성되거나, 합성-후 배열 기재에 부착된다. 후속적으로, 상기 가이드 RNA 또는 가이드 RNA의 풀 또는 다수의 풀을 상기 배열 기재로부터 임의로 및 선택적으로 절단하고 라이브러리 또는 라이브러리들로서 사용할 수 있다.
IV. Cas 단백질
상기에 언급한 바와 같이, 기능성 크리스퍼-Cas 시스템은 또한 목적하는 활성, 예를 들어 표적 결합 또는 표적 틈 형성/절단을 제공하는 단백질 성분(예를 들어, Cas 단백질(상기는 Cas 뉴클레아제일 수도 있다))을 필요로 한다. 몇몇 실시태양에서, 상기 목적하는 활성은 표적 결합이다. 몇몇 실시태양에서, 상기 목적하는 활성은 표적 틈 형성 또는 표적 절단이다. 몇몇 실시태양에서, 상기 목적하는 활성은 또한 본 명세서에 개시된 바와 같은, Cas 단백질에 공유적으로 융합된 폴리펩타이드에 의해 제공되는 기능을 포함한다. 몇몇 실시태양에서, 상기 목적하는 활성은 또한 본 명세서에 개시된 바와 같은, 뉴클레아제-결핍 Cas 단백질에 공유적으로 융합된 폴리펩타이드에 의해 제공되는 기능을 포함한다. 상기와 같은 목적하는 활성의 예는 하기에 기재되는 바와 같은, 전사 조절 활성(활성화 또는 억제), 후성적 변형 활성, 또는 표적 가시화/식별 활성을 포함한다. 상기 Cas 단백질을 정제되거나 정제되지 않은 (i) Cas 단백질 또는 (ii) 상기 Cas 단백질의 발현을 암호화하는 mRNA 또는 (iii) 상기 단백질의 발현을 암호화하는 선형 또는 환상 DNA로서 시험관내 또는 생체내 시스템에 도입시킬 수 있다. 상기 Cas 단백질을 제공하는 상기 3가지 방법 중 어느 하나는 당해 분야에 주지되어 있으며 본 명세서에서 Cas 단백질 또는 Cas 단백질의 용도를 언급할 때 호환 가능하게 의미된다. 몇몇 실시태양에서, 상기 Cas 단백질은 mRNA 또는 DNA로부터 구성적으로 발현된다. 몇몇 실시태양에서, mRNA 또는 DNA로부터 Cas 단백질의 발현은 유도성이거나 유도된다.
몇몇 실시태양에서, 상기 Cas 단백질을 화학적으로 합성하거나(예를 들어, 문헌[Creighton, "Proteins: Structures and Molecular Principles," W.H. Freeman & Co., NY, 1983]을 참조하시오), 또는 본 명세서에 기재된 바와 같은 재조합 DNA 기술에 의해 생성시킨다. 추가적인 지침을 위해서, 숙련가들은 문헌[Frederick M. Ausubel et al, "Current Protocols in Molecular Biology," John Wiley & Sons, 2003]; 및 문헌[Sambrook et al, "Molecular Cloning, A Laboratory Manual," Cold Spring Harbor Press, Cold Spring Harbor, NY, 2001]을 고려할 수 있다.
몇몇 실시태양에서, 상기 Cas 단백질을 정제되거나 단리된 형태로 제공한다. 몇몇 실시태양에서, 상기 Cas 단백질을 약 80%, 약 90%, 약 95% 또는 약 99% 순도로 제공한다. 몇몇 실시태양에서, 상기 Cas 단백질을 조성물의 부분으로서 제공한다. 몇몇 실시태양에서, 상기 Cas 단백질을 RNA-가이드 뉴클레아제 반응을 위한 조성물로서 사용하기에 또는 상기 조성물에 포함시키기에 적합한 수성 조성물 중에 제공한다. 당해 분야의 숙련가들은 상기와 같은 뉴클레아제 반응 조성물 중에 포함될 수 있는 다양한 물질을 잘 알고 있다.
몇몇 실시태양에서, 상기 Cas 단백질을 재조합 폴리펩타이드로서 제공한다. 몇몇 실시태양에서, 상기 재조합 폴리펩타이드를 융합 단백질로서 제조한다. 예를 들어, 몇몇 실시태양에서, 상기 Cas 단백질을 암호화하는 핵산을 융합 짝, 예를 들어 글루타치온-s-트랜스퍼라제(GST), 6x-His 에피토프 태그, 또는 M13 유전자 3 단백질을 암호화하는 또 다른 핵산에 결합시킨다. 적합한 숙주 세포를 사용하여 상기 융합 단백질을 발현시킬 수 있다. 몇몇 실시태양에서, 상기 융합 단백질을 당해 분야에 공지된 방법에 의해 단리한다. 몇몇 실시태양에서, 상기 융합 단백질을, 예를 들어 효소 절단에 의해 추가로 처리하여 상기 융합 짝을 제거하고 Cas 단백질을 수득할 수 있다. 한편으로, Cas 단백질:가이드 RNA 복합체를 숙주 세포 시스템 또는 당해 분야에 공지된 시험관내 번역-전사 시스템을 사용하여 재조합 기술로 제조할 수 있다. 상기와 같은 시스템 및 기술에 대한 상세한 내용을 예를 들어 WO2014144761 WO2014144592, WO2013176772, US20140273226, 및 US20140273233(이들의 내용은 전체가 본 명세서에 참고로 인용된다)에서 찾을 수 있다.
야생형 Cas 단백질
몇몇 실시태양에서, Cas 단백질은 크리스퍼-Cas I형, II형 또는 III형 시스템으로부터 유래된 단백질을 포함하며, 상기 시스템은 RNA-가이드 폴리뉴클레오타이드 결합 및/또는 뉴클레아제 활성을 갖는다. 적합한 Cas 단백질의 비제한적인 예는 Cas3, Cas4, Cas5, Cas5e(또는 CasD), Cas6, Cas6e, Cas6f, Cas7, Cas8al, Cas8a2, Cas8b, Cas8c, Cas9, CaslO, CaslOd, CasF, CasG, CasH, Csyl, Csy2, Csy3, Csel(또는 CasA), Cse2(또는 CasB), Cse3(또는 CasE), Cse4(또는 CasC), Cscl, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csbl, Csb2, Csb3, Csxl7, Csxl4, CsxlO, Csxl6, CsaX, Csx3, Cszl, Csxl5, Csfl, Csf2, Csf3, Csf4, 및 Cul966을 포함한다. 예를 들어, WO2014144761 WO2014144592, WO2013176772, US20140273226, 및 US20140273233(이들의 내용은 전체가 본 명세서에 참고로 인용된다)을 참조하시오.
몇몇 실시태양에서, 상기 Cas 단백질은 II형 크리스퍼-Cas 시스템으로부터 유래된다. 몇몇 실시태양에서, 상기 Cas 단백질은 Cas9 단백질이거나 상기 단백질로부터 유래된다. 몇몇 실시태양에서, 상기 Cas 단백질은 WO2014144761에 나타낸 것들을 포함하여, 세균성 Cas9 단백질이거나 상기 단백질로부터 유래된다. 몇몇 실시태양에서, 상기 Cas 단백질은 스트렙토코커스 스페시즈 또는 스타필로코커스 스페시즈 Cas9 단백질이거나 상기 단백질로부터 유래된다. 몇몇 실시태양에서, 상기 Cas 단백질은 스트렙토코커스 써모필루스 Cas9 단백질이거나 상기 단백질로부터 유래된다. 몇몇 실시태양에서, 상기 Cas 단백질은 스트렙토코커스 피오게네스 Cas9 단백질이거나 상기 단백질로부터 유래된다. 몇몇 실시태양에서, 상기 Cas 단백질은 스타필로코커스 아우레우스 Cas9 단백질이거나 상기 단백질로부터 유래된다. 몇몇 실시태양에서, 상기 Cas 단백질은 스트렙토코커스 써모필루스 Cas9 단백질이거나 상기 단백질로부터 유래된다.
몇몇 실시태양에서, 상기 야생형 Cas 단백질은 Cas9 단백질이다. 몇몇 실시태양에서, 상기 야생형 Cas9 단백질은 스트렙토코커스 피오게네스로부터의 Cas9 단백질(서열번호 1)이다. 몇몇 실시태양에서, 상기 단백질 또는 폴리펩타이드는 서열번호 1의 단편을 포함하거나, 상기 단편으로 이루어지거나, 상기 단편으로 필수적으로 이루어진다.
일반적으로, Cas 단백질은 적어도 하나의 RNA 결합 도메인을 포함하며, 상기 도메인은 가이드 RNA와 상호작용한다. 몇몇 실시태양에서, 상기 Cas 단백질을 변형시켜, 상기 단백질의 핵산 결합 친화성 및/또는 특이성을 증가시키고, 효소 활성을 변경시키고, 및/또는 또 다른 성질을 변화시킨다. 예를 들어, 상기 Cas 단백질의 뉴클레아제(즉, DNase, RNase) 도메인을 변형시키거나, 돌연변이시키거나, 결실시키거나 불활성화시킬 수 있다. 한편으로, 상기 Cas 단백질을 절두시켜, 상기 단백질의 기능에 필수적이지 않은 도메인을 제거할 수 있다. 몇몇 실시태양에서, 상기 Cas 단백질을 절두시키거나 변형시켜 효과기 도메인의 활성을 최적화시킨다. 몇몇 실시태양에서, 상기 Cas 단백질은 핵 국소화 서열(NLS)-태그된 Cas 단백질의 살아있는 세포의 핵내로의 수입을 수행하는 NLS를 포함한다. 몇몇 실시태양에서, 상기 Cas 단백질은 2개 이상의 변형을 포함한다.
돌연변이 Cas 단백질
일부 실시태양에서, 상기 Cas 단백질은 야생형 Cas 단백질(예를 들어, Cas9)의 돌연변이체 또는 그의 단편일 수 있다. 다른 실시태양에서, 상기 Cas 단백질은 돌연변이 Cas 단백질로부터 유래할 수 있다. 예를 들어, 상기 Cas9 단백질의 아미노산 서열을 변형시켜 상기 단백질의 하나 이상의 성질(예를 들어, 뉴클레아제 활성, 결합 친화성, 프로테아제에 대한 안정성 등)을 변경시킬 수 있다. 한편으로, RNA-가이드 절단에 관련되지 않은 Cas9 단백질의 도메인을, 변형된 Cas9 단백질이 야생형 Cas9 단백질보다 작도록 상기 단백질로부터 제거할 수 있다. 예를 들어, 상기 Cas9 암호화 서열의 크기를 감소시키는 것은 상기 서열을 형질감염 벡터, 예를 들어 특히 AAV 벡터내에 적합하도록 할 수 있다(그렇지 않으면 상기 벡터는 야생형 서열을 수용할 수 없다). 일부 실시태양에서, 본 발명의 시스템은 세균에서 암호화되거나 진핵생물 세포에서의 발현에 대해 코돈-최적화된 스트렙토코커스 피오게네스로부터의 Cas9 단백질을 사용한다. 하기에 야생형 스트렙토코커스 피오게네스 Cas9 단백질 서열(서열번호 1, www.uniprot.org/uniprot/Q99ZW2에서 입수할 수 있다)의 아미노산 서열을 나타낸다.
Cas9 단백질은 일반적으로 2개 이상의 뉴클레아제(예를 들어, DNase) 도메인을 갖는다. 예를 들어, Cas9 단백질은 RuvC-형 뉴클레아제 도메인 및 HNH-형 뉴클레아제 도메인을 가질 수 있다. 상기 RuvC 및 HNH 도메인은 함께 표적 부위 중의 2개의 가닥을 모두 절단하여 표적 폴리뉴클레오타이드 중에 이중-가닥 끊김을 생성시킨다(문헌[Jinek et al., Science, 337:816-821). 몇몇 실시태양에서, 돌연변이 Cas9 단백질을 단지 하나의 기능성 뉴클레아제 도메인(RuvC-형 또는 HNH-형 뉴클레아제 도메인)을 함유하도록 변형시킨다. 예를 들어, 몇몇 실시태양에서, 상기 돌연변이 Cas9 단백질을, 상기 뉴클레아제 도메인들 중 하나가 더 이상 기능성이지 않도록(즉 상기 뉴클레아제 활성이 존재하지 않는다) 결실되거나 돌연변이되도록 변형시킨다. 상기 뉴클레아제 도메인들 중 하나가 불활성인 일부 실시태양에서, 상기 돌연변이체는 이중-가닥 폴리뉴클레오타이드에 틈을 도입시킬 수 있지만(상기와 같은 단백질을 "니카제"라 칭한다) 상기 이중-가닥 폴리뉴클레오타이드를 절단할 수는 없다. 예를 들어, RuvC-형 도메인에서 아스파테이트의 알라닌(D10A)으로의 전환은 상기 Cas9-유래된 단백질을 니카제로 전환시킨다. 마찬가지로, HNH 도메인에서 히스티딘의 알라닌(H840A)으로의 전환은 상기 Cas9-유래된 단백질을 니카제로 전환시킨다. 마찬가지로, HNH 도메인에서 아스파라진의 알라닌(N863A)으로의 전환은 상기 Cas9-유래된 단백질을 니카제로 전환시킨다.
몇몇 실시태양에서, 상기 RuvC-형 뉴클레아제 도메인 및 HNH-형 뉴클레아제 도메인을 모두, 돌연변이 Cas9 단백질이 표적 폴리뉴클레오타이드에 틈을 형성시키거나 상기를 절단할 수 없도록 변형시키거나 제거한다. 몇몇 실시태양에서, 상기 Cas9-유래된 단백질의 모든 뉴클레아제 도메인을, 상기 Cas9-유래된 단백질이 모든 뉴클레아제 활성이 없도록 변형시키거나 제거한다. 그럼에도 불구하고, 몇몇 실시태양에서, 야생형 대응물에 비해 일부 또는 모든 뉴클레아제 활성이 없는 Cas9 단백질은 표적 인식 활성을 더 크거나 더 적은 정도로 유지시킨다.
상술한 실시태양들 중 어느 하나에서, 상기 뉴클레아제 도메인 중 일부 또는 전부를 주지된 방법, 예를 들어 부위-지향된 변이도입, PCR-매개된 변이도입, 및 전체 유전자 합성뿐만 아니라 당해 분야에 공지된 다른 방법들을 사용하여 하나 이상의 결실 돌연변이, 삽입 돌연변이 및/또는 치환 돌연변이에 의해 불활성화시킬 수 있다.
몇몇 실시태양에서, 상기 "Cas 돌연변이체" 또는 "Cas 변체"는 서열번호 1과 적어도 50%(예를 들어, 50% 내지 100%(양끝 포함) 사이의 임의의 수, 예를 들어 50%, 60%, 70%, 80%, 90%, 95%, 98%, 및 99%) 일치한다. 몇몇 실시태양에서, 상기 "Cas 돌연변이체" 또는 "Cas 변체"는 RNA 분자(예를 들어, sgRNA)에 결합한다. 몇몇 실시태양에서, 상기 "Cas 돌연변이체" 또는 "Cas 변체"는 상기 RNA 분자를 통해 특정한 폴리뉴클레오타이드 서열에 표적화된다.
융합 단백질
몇몇 실시태양에서, 상기 Cas 단백질을 상기 Cas 단백질과 비상동성인 또 다른 단백질 또는 폴리펩타이드에 융합시켜 융합 단백질을 생성시킨다. 몇몇 실시태양에서, 상기 비상동 서열은 하나 이상의 효과기 도메인, 예를 들어 절단 도메인, 전사·활성화 도메인, 전사 억제 도메인, 또는 후성적 변형 도메인을 포함한다. 상기 효과기 도메인의 추가적인 예는 핵 국소화 신호, 세포-침투 또는 전좌 도메인, 또는 마커 도메인을 포함한다. 몇몇 실시태양에서, 상기 효과기 도메인은 상기 융합 단백질의 N-말단, C-말단 또는 내부 위치에 위치한다. 몇몇 실시태양에서, 상기 융합 단백질의 Cas 단백질은 Cas9 단백질이거나 상기 단백질로부터 유래된다. 몇몇 실시태양에서, 상기 융합 단백질의 Cas 단백질은 모든 뉴클레아제 도메인이 불활성화되거나 결실된 변형된 또는 돌연변이된 Cas9 단백질이거나 상기 단백질로부터 유래된다. 몇몇 실시태양에서, 상기 융합 단백질의 Cas 단백질은 뉴클레아제 활성이 결여된 변형되거나 돌연변이된 Cas9 단백질이거나 상기 단백질로부터 유래된다. 몇몇 실시태양에서, 상기 Cas 단백질의 RuvC 및/또는 HNH 도메인은 이들이 더 이상 뉴클레아제 활성을 갖지 못하도록 변형되거나 돌연변이된다.
절단 도메인
몇몇 실시태양에서, 상기 융합 단백질의 효과기 도메인은 절단 도메인이다. 본 명세서에 사용되는 "절단 도메인"은 DNA를 절단하는 도메인을 지칭한다. 상기 절단 도메인은 임의의 엔도뉴클레아제 또는 엑소뉴클레아제로부터 획득될 수 있다. 절단 도메인을 이끌어낼 수 있는 엔도뉴클레아제의 비제한적인 예는 제한 엔도뉴클레아제 및 귀소 엔도뉴클레아제를 포함한다. 예를 들어, 문헌[New England Biolabs Catalog] 또는 문헌[Belfort et al. (1997) Nucleic Acids Res. 25, 3379-88]을 참조하시오. DNA를 절단하는 추가적인 효소들(예를 들어, 51 뉴클레아제; 녹두 뉴클레아제; 췌장 DNase I; 마이크로코커스 뉴클레아제; 효모 HO 엔도뉴클레아제)이 공지되어 있다. 또한 문헌[Linn et al. (eds.) "Nucleases," Cold Spring Harbor Laboratory Press, 1993]을 참조하시오. 상기 효소들 중 하나 이상(또는 그의 기능성 단편들)을 절단 도메인의 공급원으로서 사용할 수 있다.
몇몇 실시태양에서, 상기 절단 도메인은 II-S형 엔도뉴클레아제로부터 유래될 수 있다. II-S형 엔도뉴클레아제는 특이적으로, 상기 엔도뉴클레아제의 DNA 인식 부위로부터 떨어져 있는 전형적으로 다수의 염기쌍인 부위에서 DNA를 절단하며, 그 자체로서 분리 가능한 인식 및 절단 도메인을 갖는다. 상기 효소는 일반적으로, 일시적으로 결합하여 이량체를 형성하여 엇갈린 위치에서 DNA의 각 가닥을 절단하는 단량체이다. 적합한 II-S형 엔도뉴클레아제의 비제한적인 예는 BfiI, BpmI, BsaI, BsgI, BsmBI, BsmI, BspMI, FokI, MbolI, 및 SapI를 포함한다. 몇몇 실시태양에서, 상기 융합 단백질의 절단 도메인은 FokI 절단 도메인 또는 그의 단편 또는 유도체이다. 문헌[Miller et al. (2007) Nat. Biotechnol. 25, 778-85]; 문헌[Szczpek et al. (2007) Nat. Biotechnol. 25, 786-93]; 문헌[Doyon et al. (2011) Nat. Methods, 8, 74-81]을 참조하시오.
전사 활성화 도메인
몇몇 실시태양에서, 상기 융합 단백질의 효과기 도메인은 전사 활성화 도메인이다. 일반적으로, 전사 활성화 도메인은 전사 조절 요소 및/또는 전사 조절 단백질(즉 전사 인자, RNA 폴리머라제 등)과 상호작용하여 유전자의 전사를 증가시키고/시키거나 전사를 활성화시킨다. 몇몇 실시태양에서, 상기 전사 활성화 도메인은 헤르페스 단순 바이러스 VP16 활성화 도메인, VP64(VP16의 사량체성 유도체이다), NFκB p65 활성화 도메인, p53 활성화 도메인 1 및 2, CREB(cAMP 응답 요소 결합 단백질) 활성화 도메인, E2A 활성화 도메인, 또는 NFAT(활성화된 T-세포의 핵 인자) 활성화 도메인이다. 몇몇 실시태양에서, 상기 전사 활성화 도메인은 Gal4, 'Gcn4, MLL, Rtg3, Gln3, Oafl , Pip2, Pdrl, Pdr3, Pho4, 또는 Leu3이다. 상기 전사 활성화 도메인은 야생형이거나, 원래 전사 활성화 도메인의 변형되거나 절두된 버전일 수 있다.
전사 억제인자 도메인
몇몇 실시태양에서, 상기 융합 단백질의 효과기 도메인은 전사 억제인자 도메인이다. 일반적으로 전사 억제인자 도메인은 전사 통제 요소 및/또는 전사 조절 단백질(즉 전사 인자, RNA 폴리머라제 등)과 상호작용하여 유전자의 전사를 감소시키고/시키거나 방지한다. 몇몇 실시태양에서, 상기 전사 억제인자 도메인은 유도성 cAMP 조기 억제인자(ICER) 도메인, 크루펠-결합된 박스 A(KRAB-A) 억제인자 도메인, YY1 글리신 풍부 억제인자 도메인, Sp1-형 억제인자, E(spI) 억제인자, IκB 억제인자, 또는 MeCP2이다.
후성적 변형 도메인
몇몇 실시태양에서, 상기 융합 단백질의 효과기 도메인은 후성적인 변형 도메인이다. 일반적으로, 후성적인 변형 도메인은 히스톤 구조 및/또는 염색체 구조를 변형시킴으로써 유전자 발현을 변경시킨다. 몇몇 실시태양에서, 상기 후성적인 변형 도메인은 히스톤 아세틸트랜스퍼라제 도메인, 히스톤 데아세틸라제 도메인, 히스톤 메틸트랜스퍼라제 도메인, 히스톤 데메틸라제 도메인, DNA 메틸트랜스퍼라제 도메인, 또는 DNA 데메틸라제 도메인이다.
추가적인 도메인들
몇몇 실시태양에서, 상기 융합 단백질은 적어도 하나의 추가적인 도메인을 추가로 포함한다. 적합한 추가적인 도메인의 비제한적인 예는 핵 국소화 신호(NLS), 세포-침투 또는 전좌 도메인, 및 마커 도메인을 포함한다. NLS는 일반적으로 염기성 아미노산의 신장부를 포함한다. 예를 들어, 문헌[Lange et al. (2007) J. Biol. Chem., 282, 5101-5]을 참조하시오. 예를 들어, 몇몇 실시태양에서, 상기 NLS는 단분입자 서열, 예를 들어 PKKKRKV(서열번호 2) 또는 PKRRV(서열번호 3)이다. 몇몇 실시태양에서, NLS는 이분입자 서열이다. 몇몇 실시태양에서, NLS는 KRPAATKKAGQAKKK(서열번호 4)이다.
몇몇 실시태양에서, 상기 융합 단백질은 적어도 하나의 세포-침투성 도메인을 포함한다. 몇몇 실시태양에서, 상기 세포-침투성 도메인은 HIV-1 TAT 단백질로부터 유래된 세포-침투성 펩타이드 서열이다. 일례로서, 상기 TAT 세포-침투성 서열은 GRKKRRQRRRPPQPKKKRKV(서열번호 5)일 수 있다. 몇몇 실시태양에서, 상기 세포-침투성 도메인은 TLM(PLSSIFSRIGDPPKKKRKV; 서열번호 6), 인간 B형 간염 바이러스로부터 유래된 세포-침투성 펩타이드 서열이다. 몇몇 실시태양에서, 상기 세포-침투성 도메인은 MPG(GALFLGWLGAAGSTMGAPKKRKV; 서열번호 7 또는 GALFLGFLGAAGSTMGAWSQPKKKRV; 서열번호 8)이다. 몇몇 실시태양에서, 상기 세포-침투성 도메인은 Pep-1(KETWWETWWTEWSQPKKKRKV; 서열번호 9), VP22, 헤르페스 단순 바이러스로부터의 세포 침투성 펩타이드, 또는 폴리아르기닌 펩타이드 서열이다.
몇몇 실시태양에서, 상기 융합 단백질은 적어도 하나의 마커 도메인을 포함한다. 마커 도메인의 비제한적인 예는 형광 단백질, 정제 태그, 및 에피토프 태그를 포함한다. 몇몇 실시태양에서, 상기 마커 도메인은 형광 단백질이다. 적합한 형광 단백질의 비제한적인 예는 녹색 형광 단백질(예를 들어, GFP, GFP-2, 태그GFP, 터보GFP, EGFP, 에머랄드, 아자미 그린, 단량체성 아자미 그린, CopGFP, AceGFP, Zs그린l), 황색 형광 단백질(예를 들어, YFP, EYFP, 시트린, 비너스, YPet, PhiYFP, Zs옐로우l,), 청색 형광 단백질(예를 들어, EBFP, EBFP2, 아주라이트, mKalamal, GFPuv, 사파이어, T-사파이어), 시안 형광 단백질(예를 들어, ECFP, 세룰린, CyPet, Am시안l, 미도리이시-시안), 적색 형광 단백질(mKate, mKate2, m플럼, Ds레드 단량체, m체리, mRFPl, Ds레드-익스프레스, Ds레드2, Ds레드-단량체, Hc레드-탠덤, Hc레드l, As레드2, eqFP61 1, m라스베리, m스트로베리, J레드), 오렌지 형광 단백질(m오렌지, mKO, 쿠사비라-오렌지, 단량체성 쿠사비라-오렌지, m탄제린, td토마토) 및 임의의 다른 적합한 형광 단백질들을 포함한다. 몇몇 실시태양에서, 상기 마커 도메인은 정제 태그 및/또는 에피토프 태그이다. 예시적인 태그는 비제한적으로 글루타치온-S-트랜스퍼라제(GST), 키틴 결합 단백질(CBP), 말토스 결합 단백질, 티오레독신(TRX), 폴리(NANP), 탠덤 친화성 정제(TAP) 태그, myc, AcV5, AU1, AU5, E, ECS, E2, FLAG, HA, nus, 소프트태그(Softag) 1, 소프트태그 3, 스트렙(Strep), SBP, Glu-Glu, HSV, KT3, S, SI, T7, V5, VSV-G, 6xHis, 비오틴 카복실 담체 단백질(BCCP), 및 칼모듈린을 포함한다.
V. 용도 및 방법
하나의 태양에서, 본 발명은 Cas 단백질에 의한 표적 폴리뉴클레오타이드의 절단 방법을 제공한다. 상기 방법은 표적 폴리뉴클레오타이드를 (i) 본 명세서에 기재된 가이드 RNA 또는 가이드 RNA 분자들의 세트, 및 (ii) Cas 단백질과 접촉시킴을 포함한다. 몇몇 실시태양에서, 상기 방법은 상기 표적 폴리뉴클레오타이드 중에 이중-가닥 끊김을 생성시킨다. 몇몇 실시태양에서, 상기 Cas 단백질은 단일-가닥 틈 형성 활성을 갖는 Cas 단백질이다. 몇몇 실시태양에서, 상기 방법은 상기 표적 폴리뉴클레오타이드 중에 단일-가닥 끊김을 생성시킨다. 몇몇 실시태양에서, 가이드 RNA 및 단일-가닥 틈 형성 활성을 갖는 Cas 단백질을 포함하는 복합체를 서열-표적화된 단일-가닥 DNA 절단, 즉 틈 형성에 사용한다.
하나의 태양에서, 본 발명은 Cas 단백질에 의한 2개 이상의 표적 폴리뉴클레오타이드의 절단 방법을 제공한다. 상기 방법은 표적 폴리뉴클레오타이드를 (i) 본 명세서에 기재된 가이드 RNA 분자들의 세트, 및 (ii) Cas 단백질과 접촉시킴을 포함한다. 몇몇 실시태양에서, 상기 방법은 상기 표적 폴리뉴클레오타이드 중에 이중-가닥 끊김을 생성시킨다. 몇몇 실시태양에서, 상기 Cas 단백질은 단일-가닥 틈 형성 활성을 갖는 Cas 단백질이다. 몇몇 실시태양에서, 상기 방법은 상기 표적 폴리뉴클레오타이드 중에 단일-가닥 끊김을 생성시킨다. 몇몇 실시태양에서, 가이드 RNA 및 단일-가닥 틈 형성 활성을 갖는 Cas 단백질을 포함하는 복합체를 서열-표적화된 단일-가닥 DNA 절단, 즉 틈 형성에 사용한다.
하나의 태양에서, 본 발명은 Cas 단백질과 표적 폴리뉴클레오타이드의 결합 방법을 제공한다. 상기 방법은 표적 폴리뉴클레오타이드를 (i) 본 명세서에 기재된 가이드 RNA 또는 가이드 RNA 분자들의 세트, 및 (ii) Cas 단백질과 접촉시켜 상기 표적 폴리뉴클레오타이드와 상기 Cas 단백질과의 결합을 생성시킨다. 몇몇 실시태양에서, 상기 Cas 단백질은 Cas 변체이다. 몇몇 실시태양에서, 상기 Cas 변체는 대응하는 야생형 Cas 단백질에 비해 일부 또는 모든 뉴클레아제 활성이 없다.
하나의 태양에서, 본 발명은 Cas 단백질과 2개 이상의 표적 폴리뉴클레오타이드의 결합 방법을 제공한다. 상기 방법은 표적 폴리뉴클레오타이드를 (i) 본 명세서에 기재된 RNA 분자들의 세트, 및 (ii) Cas 단백질과 접촉시켜 상기 표적 폴리뉴클레오타이드와 상기 Cas 단백질과의 결합을 생성시킨다. 몇몇 실시태양에서, 상기 Cas 단백질은 Cas 변체이다. 몇몇 실시태양에서, 상기 Cas 변체는 대응하는 야생형 Cas 단백질에 비해 일부 또는 모든 뉴클레아제 활성이 없다.
하나의 태양에서, 본 발명은 Cas 단백질을 표적 폴리뉴클레오타이드에 표적화하는 방법을 제공한다. 상기 방법은 상기 Cas 단백질을 본 명세서에 기재된 가이드 RNA 또는 가이드 RNA 분자들의 세트와 접촉시킴을 포함한다. 몇몇 실시태양에서, 상기 방법은 가이드 RNA:Cas 단백질 복합체를 형성시킨다. 몇몇 실시태양에서, 상기 Cas 단백질은 야생형 Cas9 단백질이다. 몇몇 실시태양에서, 상기 Cas 단백질은 Cas9 단백질의 돌연변이체 또는 변체이다. 몇몇 실시태양에서, 상기 Cas 단백질은 단일-가닥 틈 형성 활성을 갖는 Cas 단백질이다. 몇몇 실시태양에서, 상기 Cas 단백질은 뉴클레아제 활성이 없는 Cas 단백질(예를 들어, Cas 단백질의 뉴클레아제-결핍 돌연변이체)이다. 몇몇 실시태양에서, 상기 Cas 단백질은 융합 단백질(예를 들어, (i) Cas 단백질 및 (ii) 비상동 폴리펩타이드를 포함하는 융합 단백질)의 부분이다.
하나의 태양에서, 본 발명은 Cas 단백질을 2개 이상의 표적 폴리뉴클레오타이드에 표적화하는 방법을 제공한다. 상기 방법은 상기 Cas 단백질을 본 명세서에 기재된 가이드 RNA 분자들의 세트와 접촉시킴을 포함한다. 몇몇 실시태양에서, 상기 방법은 가이드 RNA:Cas 단백질 복합체를 형성시킨다. 몇몇 실시태양에서, 상기 Cas 단백질은 야생형 Cas9 단백질이다. 몇몇 실시태양에서, 상기 Cas 단백질은 Cas9 단백질의 돌연변이체 또는 변체이다. 몇몇 실시태양에서, 상기 Cas 단백질은 단일-가닥 틈 형성 활성을 갖는 Cas 단백질이다. 몇몇 실시태양에서, 상기 Cas 단백질은 뉴클레아제 활성이 없는 Cas 단백질(예를 들어, Cas 단백질의 뉴클레아제-결핍 돌연변이체)이다. 몇몇 실시태양에서, 상기 Cas 단백질은 융합 단백질(예를 들어, (i) Cas 단백질 및 (ii) 비상동 폴리펩타이드를 포함하는 융합 단백질)의 부분이다.
몇몇 실시태양에서, 상기 가이드 RNA를 형질감염에 의해 세포에 도입시킨다. RNA 형질감염 기법은 당해 분야에 공지되어 있으며 일렉트로포레이션 및 리포펙션을 포함한다. RNA 형질감염에 유효한 기법은 대개 세포 유형에 따라 변한다. 예를 들어, 문헌[Lujambio et al. (Spanish National Cancer Centre) Cancer Res. Feb. 2007](HTC-116 결장암 세포의 형질감염 및 상업적으로 수득된, 변형된 miRNA 또는 전구체 miRNA의 형질감염을 위한 올리고펙타민(인비트로젠)의 용도를 기재한다)을 참조하시오. 또한 문헌[Cho et al. (Seoul National Univ.) Nat. Biotechnol. Mar. 2013](K562 세포의 형질감염 및 전사된 sgRNA(약 60 nt 길이)의 형질감염을 위한 4D 뉴클레오펙션(Nucleofection)(상표)(론자(Lonza)) 일렉트로포레이션의 용도를 기재한다)을 참조하시오. RNA의 형질감염 기법은 또한 당해 분야에 공지되어 있다. 예를 들어, 치료학적 RNA를 인배신(Invasin) 단백질(β-1 인테그린 단백질을 발현하는 세포내로의 흡수를 촉진하기 위해서)로 코팅된 비-병원성 에스케리키아 콜라이 중에서, 에스케리키아 콜라이로부터 세포질내로의 shRNA의 통과를 허용하기 위해 리스테리올리신 O 기공-형성 단백질을 발현하도록 암호화된 에스케리키아 콜라이와 함께 전달하였다. 또한 문헌[Cho et al. (Seoul National Univ.) Nat. Biotechnol. Mar. 2013]을 참조하시오.
몇몇 실시태양에서, 상기 가이드 RNA를 세포내에 도입시키거나 전달한다. 가이드 RNA의 전달에 사용될 수 있는 기술은 생분해성 중합체, 리포솜 또는 나노입자에 의한 캡슐화를 사용하는 것들을 포함한다. 상기와 같은 중합체, 리포솜 및 나노입자를 정맥내로 전달할 수 있다. 몇몇 실시태양에서, 생체내 전달을 위해, 가이드 RNA를 조직 부위에 주사하거나 전신적으로 투여할 수 있다. 생체내 전달을 또한 베타-글루칸 전달 시스템, 예를 들어 미국특허 제 5,032,401 호 및 미국특허 제 5,607,677 호, 및 미국특허 공보 제 2005/0281781 호(이들은 내용 전체가 본 명세서에 참고로 인용된다)에 기재된 것들에 의해 수행할 수 있다. 몇몇 실시태양에서, 가이드 RNA 또는 가이드 RNA를 함유하는 전달 비히클을 특정한 조직 또는 신체 구획에 표적화한다. 예를 들어, 몇몇 실시태양에서, 외인성 RNA를 다른 조직에 표적화하기 위해서, 합성 담체를 세포-특이성 리간드 또는 수용체 흡수용 앱타머, 예를 들어 PEG로 코팅되고 트랜스페린 수용체(종양 세포에서 고도로 발현된다)를 통한 흡수를 위해 인간 트랜스페린 단백질로 기능화된 사이클로덱스트린 나노입자 중에 싸인 RNA로 장식한다. 추가적인 접근법들은 본 명세서에서 하기에 기재되거나 당해 분야에 공지되어 있다.
본 발명을 문헌[Hendel et al., Nat. Biotechnol. (2015) 33:9, 985-9](내용 전체가 본 출원에 인용된다)에 기재된 바와 같이 인간 세포에서 시험하였다. 상기 인용된 연구에서, 변형된 가이드 RNA를 K562 세포, 인간 1차 T 세포, 및 CD34+ 조혈모세포 및 전구세포(HSPC)에 도입시켰다. 상기 변형된 가이드 RNA는 변형되지 않은 가이드 RNA에 비해, 인간 1차 T 세포 및 CD34+ HSPC를 포함한 인간 세포에서 게놈 편집 효율을 현저하게 증대시켰다.
도 11a 및 11b는 인간 세포주에서 유전자 파괴가 인델의 높은 빈도에 의해서 또는 본 명세서에 개시된 합성되고 화학적으로 변형된 sgRNA를 사용하는 절단-자극된 상동성 재조합에 의해 성취될 수 있음을 보이는 실험 결과를 예시한다. 변이도입성 NHEJ에 의한 유전자 파괴를, PCR 앰플리콘의 심층 서열분석(도 12a)에 의해서 또는 합성 sgRNA와 함께 Cas9에 의해 유도된 K562 세포 중 3개의 유전자좌 IL2RG, HBB 및 CCR5에서의 HR에 의한 유전자 편집(도 12b)에 의해 측정하였다. 상기 합성 sgRNA를 100만 세포당 1 ㎍(밝은 음영) 또는 20 ㎍(어두운 음영)으로 전달하였다. Cas9는 플라스미드(2 ㎍)로부터 발현되었으며 HR 실험의 경우 5 ㎍의 GFP-암호화 공여 플라스미드가 포함되었다. 양성 대조군으로서 상기 sgRNA 및 Cas9 단백질을 모두 암호화하는 2 ㎍의 sgRNA 플라스미드가 사용되었다(회색 막대). 막대는 평균값 + s.e.m.을 나타낸다, n=3.
도 12a, 12b, 12c 및 12d는 본 명세서에 기재된 바와 같은 화학적으로 변형된 sgRNA를 사용하여, 자극된 1차 인간 T 세포 및 CD34+ 조혈모세포 및 전구세포(HSPC)에서 유전자 파괴 또는 표적화된 게놈 편집의 높은 빈도를 성취할 수 있음을 나타내는 실험 결과를 예시한다.
도 12a는 10 ㎍의 합성 CCR5 sgRNA 및 15 ㎍의 Cas9 mRNA 또는 1 ㎍의 Cas9-암호화 플라스미드로 뉴클레오펙션된 1차 인간 T 세포로부터의 결과를 예시한다. 상기 sgRNA 및 Cas9 단백질을 모두 암호화하는 1 ㎍의 sgRNA 플라스미드를 비교를 위해 포함시켰다. 막대는, 상기 sgRNA 표적 부위에 걸쳐 있고 대조군 참조로서 모의-처리된 샘플을 사용하는 PCR 앰플리콘의 TIDE(분해에 의한 인델의 추적) 분석에 의해 측정된 바와 같은, 3개의 상이한 공여체들에 대한 평균 인델 빈도 + s.e.m.을 나타내며, n=6이다. 변형되지 않거나 M-변형된 sgRNA와 함께 Cas9 mRNA의 전달 및 상기 sgRNA 및 Cas9 모두를 암호화하는 플라스미드의 뉴클레오펙션은 배경 이상의 대립유전자 변형 빈도를 생성시키지 않았다. Cas9에 대한 DNA 발현 플라스미드와 MSP-변형된 sgRNA의 동시-형질감염은 9.3% 인델 빈도를 생성시켰다. 상기 MS- 또는 MSP-변형된 sgRNA와 Cas9 mRNA는 각각 48.7% 및 47.9% 인델 빈도를 생성시켰다.
도 12b는 자극된 T 세포로부터의 결과를 예시한다. 상기 세포는 상기와 같이, 그러나 2.5 몰 과잉의 상기 지시된 합성 CCR5·sgRNA와 복합체화된 15 ㎍ Cas9 단백질로 뉴클레오펙션되었다. 인델 빈도를 TIDE 분석에 의해 측정하였다. 막대는 3개의 상이한 공여체에 대한 평균 인델 빈도 + s.e.m.을 나타내며, n=6이다. 상기 변형되지 않은 sgRNA에 대한 상기 MS-변형된 sgRNA의 인델 빈도의 2.4-배 개선(30.7% 대 12.8%)이, Cas9 단백질과 복합체화되어 전달시 화학적으로 변형된 sgRNA에 대해 관찰되었다. 이러한 결과는 화학적으로 변형된 sgRNA를 Cas9 단백질과 복합체화되어 전달시 자극된 T 세포의 게놈 편집에 사용할 수 있음을 확립시킨다.
도 12c는 인간 말초 혈액 CD34+ HSPC로부터의 결과를 예시한다. 500,000개의 동원된 세포를 IL2RG 또는 HBB를 표적화하는 10 ㎍의 상기 지시된 합성 sgRNA 및 15 ㎍의 Cas9 mRNA 또는 1 ㎍의 Cas9 플라스미드 1로 뉴클레오펙션시켰다. 상기 sgRNA 및 Cas9 단백질을 모두 암호화하는 1 ㎍의 sgRNA 플라스미드를 비교를 위해 포함시켰다. 막대는 T7 엔도뉴클레아제 절단 분석에 의해 측정된 바와 같은, 평균 인델 빈도 + s.e.m., n=3을 나타내었다. 인델은 Cas9 mRNA와 동시-형질감염시 변형되지 않거나 M-변형된 sgRNA를 사용하여 어느 한 유전자좌에서도 검출되지 않았다. 그러나, 상기 IL2RG MS- 및 MSP-변형된 sgRNA는 각각 17.5% 및 17.7% 인델 빈도를 나타내었고, 상기 HBB MS- 및 MSP-변형된 sgRNA의 경우 각각 23.4% 및 22.0%를 나타내었다.
도 12d는 자극된 T 세포 또는 동원된 인간 말초 혈액 CD34+·HSPC로부터의 결과를 예시한다. 100만개의 세포를 15 ㎍의 Cas9 mRNA 및 10 ㎍의 상기 지시된 합성 CCR5 sgRNA로 뉴클레오펙션시켰다. 최근의 연구는 2개의 sgRNA의 동시 사용이 인간 1차 T 세포 및 CD34+ HSPC에서 유전자 파괴를 개선시킬 수 있음을 나타내었다. 예를 들어, 문헌[Mandal et al. (2014) Cell Stem Cell, 15, 643-52]을 참조하시오. MS- 및 MSP-변형된 CCR5 sgRNA를 만달(Mandal) 연구에서 보고된 서열들('D' 및 'Q'라 칭함)(205 염기쌍을 분리 절단시킨다)로 화학적으로 합성하였다. 각각의 sgRNA의 양은 함께 사용시 5 ㎍이었다. 단일 sgRNA를 갖는 샘플에 대한 인델 빈도를 상기와 같은 TIDE 분석에 의해 측정하였으며 2개의 sgRNA를 갖는 샘플에 대한 대립유전자 파괴 빈도를 클로닝된 PCR 산물의 서열분석에 의해 측정하였다. 막대는 평균 인델 빈도 + s.e.m., n=3을 나타낸다. T 세포에서, 'D' sgRNA는 단독으로 상기 MS- 및 MSP-변형된 sgRNA에 대해 각각 56.0% 및 56.3% 인델을 생성시켰고, 'Q' sgRNA는 각각 62.6% 및 69.6% 인델을 생성시켰다. 함께 사용시 대립유전자 변형의 빈도는, 우리가 상기 MS- 및 MSP-변형된 sgRNA에 대해 각각 73.9% 및 93.1% 인델로 관찰한 바와 같이 증가하였으며, 상기 중 변형 사건의 대부분은 상기 2개의 sgRNA 표적 부위들간의 결실이었다. CD34+ HSPC에서, 전체적인 빈도가 더 낮았지만 관찰은 유사하였다. 'D' sgRNA의 경우, 상기 MS- 및 MSP-변형된 sgRNA에 대해 각각 9.8% 및 11.2%의 대립유전자 변형 빈도, 및 상기 'Q' sgRNA에 대해 17.8% 및 19.2%가 관찰되었다. 함께 사용시 상기 MS- 및 MSP-변형된 sgRNA에 대한 빈도는 각각 37.8% 및 43.0%까지 증가하였다. 이는 상기 2개의 화학적으로 변형된 sgRNA의 사용이 1차 인간 T 세포 및 CD34+ HSPC에서 유전자 파괴를 촉진하는데 매우 유효한 방식임을 나타낸다.
다른 사용 예들은 하기에 기재하는 바와 같은 게놈 편집 및 유전자 발현 조절을 포함한다.
게놈 편집
하나의 태양에서, 본 발명은 생체내 또는 시험관내("생체내"는 비제한적으로 무세포 시스템, 세포 용해물, 세포의 단리된 성분, 및 살아있는 유기체 밖의 세포를 포함한다)에서 DNA 서열을 변형시키기 위한 게놈 편집 방법을 제공한다. 상기 DNA 서열은 염색체 서열, 에피솜 서열, 플라스미드, 미토콘드리아 DNA 서열, 또는 기능성 유전자간 서열, 예를 들어 인헨서 서열 또는 비-암호화 RNA에 대한 DNA 서열을 포함할 수 있다. 상기 방법은 상기 DNA 서열을 (i) 본 명세서에 기재된 가이드 RNA 또는 가이드 RNA 분자들의 세트, 및 (ii) Cas 단백질과 접촉시킴을 포함한다. 몇몇 실시태양에서, 상기 DNA 서열을 세포 밖에서 접촉시킨다. 몇몇 실시태양에서, 상기 DNA 서열을 세포내의 게놈 중에 위치시키고 시험관내 또는 생체내에서 접촉시킨다. 몇몇 실시태양에서, 상기 세포는 유기체 또는 조직내에 있다. 몇몇 실시태양에서, 상기 세포는 인간 세포, 비-인간 포유동물 세포, 줄기 세포, 비-포유동물 척추동물 세포, 무척추동물 세포, 식물 세포, 단세포 유기체 또는 배아이다. 몇몇 실시태양에서, 상기 가이드 RNA는 상기 Cas 단백질을 상기 DNA 서열 중 표적화된 부위에 표적화하는 것을 돕는다. 몇몇 실시태양에서, 상기 Cas 단백질은 상기 표적화된 부위에서 상기 DNA 서열의 적어도 하나의 가닥을 절단한다. 몇몇 실시태양에서, 상기 Cas 단백질은 상기 표적화된 부위에서 상기 DNA 서열의 2개의 가닥을 모두 절단한다.
몇몇 실시태양에서, 상기 방법은 상기 Cas 단백질을 세포 또는 또 다른 시스템에 도입시킴을 추가로 포함한다. 몇몇 실시태양에서, 상기 Cas 단백질은 정제된 또는 정제되지 않은 단백질로서 도입된다. 몇몇 실시태양에서, 상기 Cas 단백질은 상기 Cas 단백질을 암호화하는 mRNA를 통해 도입된다. 몇몇 실시태양에서, 상기 Cas 단백질은 상기 Cas 단백질을 암호화하는 선형 또는 환상 DNA를 통해 도입된다. 몇몇 실시태양에서, 상기 세포 또는 시스템은 Cas 단백질 또는 Cas 단백질을 암호화하는 핵산을 포함한다.
몇몇 실시태양에서, 이중-가닥 끊김을 실수유발, 비-상동성 단부-결합("NHEJ") 수복 과정을 통해 수복할 수 있다. 몇몇 실시태양에서, 이중-가닥 끊김을, 공여 폴리뉴클레오타이드 중의 공여 서열이 표적화된 DNA 서열에 통합되거나 상기와 교환될 수 있도록 상동성-지시된 수복(HDR) 과정에 의해 수복할 수 있다.
몇몇 실시태양에서, 상기 방법은 적어도 하나의 공여 폴리뉴클레오타이드를 상기 세포 또는 시스템내에 도입시킴을 추가로 포함한다. 몇몇 실시태양에서, 상기 공여 폴리뉴클레오타이드는 상기 DNA 서열 중의 표적화된 부위의 어느 한쪽 상의 서열과 실질적인 서열 일치성을 갖는 적어도 하나의 상동 서열을 포함한다. 몇몇 실시태양에서, 상기 공여 폴리뉴클레오타이드는 상동성-지시된 수복, 예를 들어 상동성 재조합을 통해 DNA 서열에 통합되거나 상기 서열과 교환될 수 있는 공여 서열을 포함한다.
몇몇 실시태양에서, 상기 공여 폴리뉴클레오타이드는 상류 상동 서열 및 하류 상동 서열을 포함하며, 이들은 각각 상기 DNA 서열 중의 표적화된 부위의 상류 및 하류에 각각 위치한 서열들에 대해 실질적인 서열 일치성을 갖는다. 이러한 서열 유사성은, 예를 들어, 상기 공여 서열이 상기 표적화된 DNA 서열에 통합될 수 있도록(또는 상기 서열과 교환될 수 있도록) 상기 공여 폴리뉴클레오타이드와 표적화된 DNA 서열간의 상동성 재조합을 허용한다.
몇몇 실시태양에서, 상기 DNA 서열 중의 표적 부위(들)는 질환을 야기하거나 상기 질환과 관련될 수 있는 돌연변이, 예를 들어 점 돌연변이, 전좌 또는 역위에 걸쳐있거나 이에 인접한다. 몇몇 실시태양에서, 상기 방법은 상기 세포 또는 시스템에 (i) 돌연변이의 야생형 대응물 및 (ii) 상기 DNA 서열 중의 표적화된 부위의 한쪽 상의 서열과 실질적인 서열 일치성을 갖는 적어도 하나의 상동성 서열을 포함하는 적어도 하나의 공여 폴리뉴클레오타이드를 도입시킴으로써 상기 돌연변이를 교정함을 포함한다. 몇몇 실시태양에서, 상기 공여 폴리뉴클레오타이드는 상기 DNA 서열 중의 표적화된 부위의 한쪽 상의 서열과 실질적인 서열 일치성을 갖는 상동 서열을 포함한다.
몇몇 실시태양에서, 상기 공여 폴리뉴클레오타이드는 상동성-지시된 수복 과정, 예를 들어 상동성 재조합을 통해 상기 표적화된 DNA 서열에 통합되거나 상기 서열과 교환될 수 있는 외인성 서열을 포함한다. 몇몇 실시태양에서, 상기 외인성 서열은, 임의로 외인성 프로모터 조절 서열과 작동적으로 연결되는 단백질 암호화 유전자를 포함한다. 따라서, 몇몇 실시태양에서, 상기 외인성 서열의 통합시, 세포는 상기 통합된 유전자에 의해 암호화된 단백질을 발현할 수 있다. 몇몇 실시태양에서, 상기 외인성 서열을, 수용 세포 또는 시스템에서의 그의 발현이 상기 외인성 프로모터 조절 서열에 의해 조절되도록 상기 표적화된 DNA 서열에 통합시킨다. 상기 표적화된 DNA 서열내 외인성 유전자의 통합을 "녹인(knock in)"이라 칭한다. 다른 실시태양에서, 상기 외인성 서열은 전사 조절 서열, 또 다른 발현 조절 서열, RNA 암호화 서열 등일 수 있다.
몇몇 실시태양에서, 상기 공여 폴리뉴클레오타이드는, 표적화된 부위 또는 그 부근에서 DNA 서열의 일부와 필수적으로 동일하지만 적어도 하나의 뉴클레오타이드 변화를 포함하는 서열을 포함한다. 예를 들어, 몇몇 실시태양에서, 상기 공여 서열은, 상기 표적화된 부위와 통합 또는 교환시, 상기 표적화된 부위에 생성되는 서열이 적어도 하나의 뉴클레오타이드 변화를 포함하도록 상기 표적화된 부위 또는 그 부근에서 상기 DNA 서열의 변형되거나 돌연변이된 버전을 포함한다. 몇몇 실시태양에서, 상기 적어도 하나의 뉴클레오타이드 변화는 하나 이상의 뉴클레오타이드의 삽입, 하나 이상의 뉴클레오타이드의 결실, 하나 이상의 뉴클레오타이드의 치환, 또는 이들의 조합이다. 상기 변형된 서열의 통합의 결과로서, 상기 세포는 상기 표적화된 DNA 서열로부터 변형된 유전자 산물을 생성시킬 수 있다.
몇몇 실시태양에서, 상기 방법은 다중복합체 적용을 위한 것이다. 몇몇 실시태양에서, 상기 방법은 가이드 RNA의 라이브러리를 세포 또는 시스템에 도입시킴을 포함한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 100개의 독특한 가이드 서열을 포함한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 1,000개의 독특한 가이드 서열을 포함한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 10,000개의 독특한 가이드 서열을 포함한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 100,000개의 독특한 가이드 서열을 포함한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 1,000,000개의 독특한 가이드 서열을 포함한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 10개의 상이한 폴리뉴클레오타이드 또는 하나 이상의 폴리뉴클레오타이드내의 적어도 10개의 상이한 서열을 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 100개의 상이한 폴리뉴클레오타이드 또는 하나 이상의 폴리뉴클레오타이드내의 적어도 100개의 상이한 서열을 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 1000개의 상이한 폴리뉴클레오타이드 또는 하나 이상의 폴리뉴클레오타이드내의 적어도 1000개의 상이한 서열을 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 10,000개의 상이한 폴리뉴클레오타이드 또는 하나 이상의 폴리뉴클레오타이드내의 적어도 10,000개의 상이한 서열을 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 100,000개의 상이한 폴리뉴클레오타이드 또는 하나 이상의 폴리뉴클레오타이드내의 적어도 100,000개의 상이한 서열을 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 1,000,000개의 상이한 폴리뉴클레오타이드 또는 하나 이상의 폴리뉴클레오타이드내의 적어도 1,000,000개의 상이한 서열을 표적화한다.
인간 및 포유동물 세포에서 게놈 편집
본 발명의 실시태양은 포유동물 세포에서 표적 폴리뉴클레오타이드, 예를 들어 DNA 서열을 변형시키기 위한 게놈 편집 방법에 유용하다.
몇몇 실시태양에서, 상기 DNA 서열은 염색체 서열이다. 몇몇 실시태양에서, 상기 DNA 서열은 단백질-암호화 서열이다. 몇몇 실시태양에서, 상기 DNA 서열은 기능성 유전자간 서열, 예를 들어 인헨서 서열 또는 비-암호화 서열이다. 몇몇 실시태양에서, 상기 DNA는 인간 유전자의 부분이다. 일부 상기와 같은 실시태양에서, 상기 인간 유전자는 클라트린 경쇄(CLTA1) 유전자, 인간 인터류킨 2 수용체 감마(IL2RG) 유전자, 인간 세포독성 T-림프구-관련된 단백질 4(CLTA4) 유전자, 인간 프로토카데린 알파 4(PCDHA4) 유전자, 인간 분절발생 호메오박스 1(EN1) 유전자), 인간 헤모글로빈 베타(HBB) 유전자(겸상 적혈구 빈혈 및 지중해 빈혈의 원인 돌연변이를 가질 수 있다), 또는 인간 케모킨(C-C 동기) 수용체 5(CCR5) 유전자(HIV의 공-수용체를 암호화한다)이다.
몇몇 실시태양에서, 상기 포유동물 세포는 인간 세포이다. 일부 상기와 같은 실시태양에서, 상기 인간 세포는 1차 인간 세포이다. 추가의 실시태양에서, 상기 1차 인간 세포는 인간 1차 T 세포이다. 상기 인간 1차 T 세포는 자극되거나 자극되지 않을 수도 있다. 몇몇 실시태양에서, 상기 인간 세포는 줄기/전구세포, 예를 들어 CD34+ 조혈모세포 및 전구세포(HSPC)이다. 몇몇 실시태양에서, 상기 인간 세포는 배양된 세포주, 예를 들어 상업적으로 입수될 수 있는 세포주로부터 유래한다. 예시적인 세포주는 K562 세포, 인간 골수성 백혈병 세포주를 포함한다.
몇몇 실시태양에서, 상기 세포는 살아있는 유기체내에 있다. 몇몇 다른 실시태양에서, 상기 세포는 살아있는 유기체 밖에 있다.
상기 방법은 상기 DNA 서열을 (i) 본 명세서에 기재된 가이드 RNA 또는 가이드 RNA 분자들의 세트, 및 (ii) Cas 단백질과 접촉시킴을 포함한다.
몇몇 실시태양에서, 상기 방법은 상기 가이드 RNA를 상기 세포내로 도입하거나 전달함을 추가로 포함한다. 일부 상기와 같은 실시태양에서, 상기 가이드 RNA를 형질감염에 의해 세포내에 도입시킨다. RNA 형질감염 기법은 당해 분야에 공지되어 있으며 일렉트로포레이션 및 리포펙션을 포함한다. 다른 실시태양에서, 상기 가이드 RNA를 뉴클레오펙션에 의해 세포(및 보다 특히 세포 핵)내로 도입시킨다. 뉴클레오펙션 기법은 당해 분야에 공지되어 있으며 뉴클레오펙션 장치, 예를 들어 론자 뉴클레오펙터 2b 또는 론자 4D-뉴클레오펙터 및 관련 시약들을 사용할 수 있다.
몇몇 실시태양에서, 상기 방법은 상기 Cas 단백질을 상기 세포에 도입시키거나 전달함을 추가로 포함한다. 일부 상기와 같은 실시태양에서, 상기 Cas 단백질을 정제되거나 정제되지 않은 단백질로서 도입시킨다. 다른 실시태양에서, 상기 Cas 단백질을 상기 Cas 단백질을 암호화하는 mRNA를 통해 도입시킨다. 일부 상기와 같은 실시태양에서, 상기 Cas 단백질을 암호화하는 mRNA를 뉴클레오펙션에 의해 세포내로 도입시킨다. 다른 실시태양에서, 상기 Cas 단백질을 암호화하는 mRNA를 뉴클레오펙션에 의해 세포(및 보다 특히 세포 핵)내로 도입시킨다.
몇몇 실시태양에서, 상기 방법은 상기 Cas 단백질이 상기 가이드 RNA와의 복합체 중에서 상기 세포내로 도입되도록 리보뉴클레오단백질(RNP)-기반 전달을 사용한다. 예를 들어, Cas9 단백질을 Cas9:gRNA 복합체 중의 가이드 RNA와 복합체화시킬 수 있으며, 이는 상기 gRNA와 Cas 단백질의 동시-전달을 허용한다. 예를 들어, 상기 Cas:gRNA 복합체를 세포내에 뉴클레오펙션시킬 수 있다.
몇몇 실시태양에서, 상기 방법은 모든-RNA 전달 플랫폼을 사용한다. 예를 들어, 일부 상기와 같은 실시태양에서, 상기 가이드 RNA 및 상기 Cas 단백질을 암호화하는 mRNA를 상기 세포내에 동시에 또는 실질적으로 동시에(예를 들어, 동시-형질감염 또는 동시-뉴클레오펙션에 의해) 도입시킨다. 몇몇 실시태양에서, Cas mRNA 및 변형된 gRNA의 동시-전달은 Cas mRNA 및 변형되지 않은 gRNA의 동시-전달에 비해 더 높은 편집 효율을 생성시킨다. 특히, 5' 및 3' 단부 모두에서 3개의 말단 뉴클레오타이드에 통합된 2'-O-메틸-3'-포스포로티오에이트(MS), 또는 2'-O-메틸-3'-티오PACE(MSP)를 갖는 gRNA는 변형되지 않은 gRNA에 비해 보다 높은 편집 빈도를 제공한다.
몇몇 실시태양에서, 상기 가이드 RNA 및 상기 Cas 단백질을 암호화하는 mRNA를 세포에 연속적으로 도입시킨다; 즉, 상기 가이드 RNA 및 상기 Cas 단백질을 암호화하는 mRNA를 상기 세포에 상이한 시점에서 도입시킨다. 각 작용제 도입 사이의 기간은 수분(이하) 내지 수시간 또는 수일의 범위일 수 있다. 예를 들어, 일부 상기와 같은 실시태양에서, gRNA를 먼저 전달한 다음, Cas mRNA를 4, 8, 12 또는 24시간 후에 전달한다. 다른 상기와 같은 실시태양에서, Cas mRNA를 먼저 전달한 다음, gRNA를 4, 8, 12 또는 24시간 후에 전달한다. 일부 특정한 실시태양에서, 변형된 gRNA를 먼저 전달한 다음 Cas mRNA를 전달하는 것은, 변형되지 않은 gRNA를 전달한 다음 Cas mRNA를 전달하는 것에 비해 더 높은 편집 효율을 생성시킨다.
몇몇 실시태양에서, 상기 gRNA를 상기 Cas 단백질을 암호화하는 DNA 플라스미드와 함께 상기 세포내에 도입시킨다. 일부 상기와 같은 실시태양에서, 상기 gRNA 및 상기 Cas 단백질을 암호화하는 DNA 플라스미드를 뉴클레오펙션에 의해 상기 세포내에 도입시킨다. 일부 특정한 실시태양에서, RNP-기반 전달 플랫폼 또는 모든-RNA 전달 플랫폼은 DNA 플라스미드-기반 전달 시스템보다 1차 세포에서 더 낮은 세포독성을 제공한다.
몇몇 실시태양에서, 상기 방법은 인간 1차 T 세포 및 CD34+HSPC를 포함한 인간 세포에서 현저하게 증대된 게놈 편집 효율을 제공한다.
몇몇 실시태양에서, 변형된 gRNA는 변형되지 않은 gRNA에 비해, 삽입 또는 결실(인델)의 빈도를 증가시킨다(이는 변이도입 NHEJ 및 유전자 파괴를 가리킬 수 있다). 특히, 5' 및 3' 단부 모두에서 3개의 말단 뉴클레오타이드에 통합된 2'-O-메틸-3'-포스포로티오에이트(MS), 또는 2'-O-메틸-3'-티오PACE(MSP)를 갖는 변형된 gRNA는 변형되지 않은 gRNA에 비해 인델의 빈도를 증가시킨다.
몇몇 실시태양에서, 변형된 gRNA 및 Cas mRNA의 인간 1차 T 세포로의 동시-전달은 변형되지 않은 gRNA 및 Cas mRNA의 동시-전달에 비해 상기 인델의 빈도를 증가시킨다. 특히, 5' 및 3' 단부 모두에서 3개의 말단 뉴클레오타이드에 통합된 2'-O-메틸-3'-포스포로티오에이트(MS), 또는 2'-O-메틸-3'-티오PACE(MSP)를 갖는 변형된 gRNA는 변형되지 않은 gRNA에 비해 인간 1차 T 세포에서 인델의 빈도를 증가시킨다.
몇몇 실시태양에서, 변형된 gRNA는 변형되지 않은 gRNA에 비해 gRNA 안정성을 개선시킨다. 일례로서, 5' 및 3' 단부 모두에서 3개의 말단 뉴클레오타이드에 통합된 2'-O-메틸(M)을 갖는 gRNA는 변형되지 않은 gRNA보다 뉴클레아제에 대한 안정성을 적절히 개선시키며 염기 짝짓기 열안정성을 또한 개선시킨다. 또 다른 예로서, 5' 및 3' 단부 모두에서 3개의 말단 뉴클레오타이드에 통합된 2'-O-메틸-3'-포스포로티오에이트(MS), 또는 2'-O-메틸-3'-티오PACE(MSP)를 갖는 gRNA는 변형되지 않은 gRNA에 비해 뉴클레아제에 대한 안정성을 대단히 개선시킨다. gRNA 단부 변형이 엑소뉴클레아제에 대한 세포내 안정성을 증대시키며, 따라서 Cas mRNA 및 gRNA를 인간 세포내로 동시-전달하거나 연속 전달할 때 게놈 편집의 증가된 효능이 가능할 수 있음이 고려된다.
몇몇 실시태양에서, 변형된 gRNA는 유전자 표적화를 자극하며, 이는 차례로 예를 들어 상동성 재조합 또는 NHEJ에 의한 유전자 편집을 허용한다. 특히, 5' 및 3' 단부 모두에서 3개의 말단 뉴클레오타이드에 통합된 2'-O-메틸-3'-포스포로티오에이트(MS), 또는 2'-O-메틸-3'-티오PACE(MSP)를 갖는 gRNA는 변형되지 않은 gRNA보다 더 높은 수준의 상동성 재조합을 자극한다.
몇몇 실시태양에서, 변형된 gRNA는 높은 특이성을 유지한다. 몇몇 실시태양에서, 표적-상 대 표적-외 인델 빈도의 비는 변형되지 않은 gRNA에 비해 변형된 gRNA에 대해 개선된다. 몇몇 실시태양에서, Cas 단백질과의 RNP 복합체 중에서 전달된 변형된 gRNA는 DNA 플라스미드-기반 전달 시스템에 비해 현저하게 더 양호한 표적-상:표적-외 비를 제공한다.
유전자 발현 조절
몇몇 실시태양에서, 본 명세서에 기재된 가이드 RNA를 관심 유전자의 전사 또는 발현의 조절에 사용한다. 예를 들어, 몇몇 실시태양에서, Cas 단백질(예를 들어, 뉴클레아제-결핍 Cas9) 및 전사 활성제 폴리펩타이드를 포함하는 융합 단백질을 사용하여 유전자의 전사를 증가시킨다. 유사하게, 몇몇 실시태양에서, Cas 단백질(예를 들어, 뉴클레아제-결핍 Cas9) 및 억제인자 폴리펩타이드를 포함하는 융합 단백질을 사용하여 상기 유전자의 전사를 간섭함으로써 유전자 발현을 녹다운시킨다.
적어도 하나의 태양에서, 본 발명은 생체내 또는 시험관내에서 관심 유전자의 발현을 조절하는 방법을 제공한다. 상기 방법은 세포 또는 또 다른 시스템내에 (i) 본 명세서에 기재된 합성 가이드 RNA 및 (ii) 융합 단백질을 도입시킴을 포함한다. 몇몇 실시태양에서, 상기 융합 단백질은 Cas 단백질 및 효과기 도메인, 예를 들어 전사 활성화 도메인, 전사 억제인자 도메인, 또는 후성적 변형 도메인을 포함한다. 몇몇 실시태양에서, 상기 융합 단백질은 돌연변이된 Cas 단백질, 예를 들어 삭제 뉴클레아제인 Cas9 단백질을 포함한다. 몇몇 실시태양에서, 상기 Cas 단백질은 하나 이상의 돌연변이, 예를 들어 D10A, H840A 및/또는 N863A를 함유한다.
몇몇 실시태양에서, 상기 융합 단백질을 정제되거나 정제되지 않은 단백질로서 상기 세포 또는 시스템에 도입시킨다. 몇몇 실시태양에서, 상기 융합 단백질을 상기 융합 단백질을 암호화하는 mRNA를 통해 상기 세포 또는 시스템에 도입시킨다. 몇몇 실시태양에서, 상기 융합 단백질을 상기 융합 단백질을 암호화하는 선형 또는 환상 DNA를 통해 상기 세포 또는 시스템에 도입시킨다.
몇몇 실시태양에서, 상기 가이드 RNA는 상기 융합 단백질이, 염색체 서열, 에피솜 서열, 플라스미드, 미토콘드리아 DNA 서열, 또는 기능성 유전자간 서열, 예를 들어 인헨서 또는 비-암호화 RNA에 대한 DNA 서열을 포함하는 특정한 표적 폴리뉴클레오타이드로 향하는 것을 돕는다. 몇몇 실시태양에서, 상기 효과기 도메인은 상기 표적 폴리뉴클레오타이드 중 서열의 발현을 조절한다. 유전자 발현을 조절하기 위한 가이드 RNA를, 기능성 RNA를 암호화하는 임의의 목적하는 내인성 유전자 또는 서열을 표적화하도록 설계할 수 있다. 게놈 표적 서열을 상기 내인성 유전자의 전사 출발 부위의 부근에서, 또는 한편으로 상기 내인성 유전자의 번역 개시 부위의 부근에서 선택할 수 있다. 몇몇 실시태양에서, 상기 표적 서열은 전통적으로 유전자의 "프로모터 근위" 영역이라 지칭되는 DNA의 영역 중에 있다. 몇몇 실시태양에서, 상기 표적 서열은 전사 출발 부위의 상류 약 1,000개 염기쌍 내지 상기 전사 출발 부위의 하류 약 1,000개 염기쌍의 영역 중에 있다. 몇몇 실시태양에서, 상기 표적 서열은 상기 유전자의 전사 출발 부위로부터 멀리 있다(예를 들어, 또 다른 염색체상에).
몇몇 실시태양에서, 상기 방법은 복합체 적용을 위한 것이다. 몇몇 실시태양에서, 상기 방법은 가이드 RNA의 라이브러리를 세포 또는 시스템에 도입시킴을 포함한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 100개, 적어도 1,000개, 적어도 10,000개, 적어도 100,000개 또는 적어도 1,000,000개의 독특한 가이드 서열을 포함한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 10개의 상이한 폴리뉴클레오타이드 또는 하나 이상의 폴리뉴클레오타이드내의 적어도 10개의 상이한 서열을 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 100개의 상이한 폴리뉴클레오타이드 또는 하나 이상의 폴리뉴클레오타이드내의 적어도 100개의 상이한 서열을 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 1000개의 상이한 폴리뉴클레오타이드 또는 하나 이상의 폴리뉴클레오타이드내의 적어도 1000개의 상이한 서열을 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 10,000개의 상이한 폴리뉴클레오타이드 또는 하나 이상의 폴리뉴클레오타이드내의 적어도 10,000개의 상이한 서열을 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 100,000개의 상이한 폴리뉴클레오타이드 또는 하나 이상의 폴리뉴클레오타이드내의 적어도 100,000개의 상이한 서열을 표적화한다. 몇몇 실시태양에서, 상기 라이브러리는 적어도 1,000,000개의 상이한 폴리뉴클레오타이드 또는 하나 이상의 폴리뉴클레오타이드내의 적어도 1,000,000개의 상이한 서열을 표적화한다.
키트
하나의 태양에서, 본 발명은 gRNA:Cas 단백질 복합체를 생성시키고/시키거나 표적 폴리뉴클레오타이드의 결합, 틈 형성 또는 절단을 위한 그의 활성을 지지함을 포함한, 상술한 방법을 수행하기 위한 시약을 함유하는 키트를 제공한다. 몇몇 실시태양에서, 본 명세서에 개시된 방법들을 위한 상기 반응 성분들 중 하나 이상, 예를 들어 하나 이상의 가이드 RNA 및 Cas 단백질을, 사용을 위한 키트의 형태로 공급할 수 있다. 몇몇 실시태양에서, 상기 키트는 Cas 단백질 또는 상기 Cas 단백질을 암호화하는 핵산, 및 본 명세서에 기재된 하나 이상의 가이드 RNA 또는 가이드 RNA들의 세트 또는 라이브러리를 포함한다. 몇몇 실시태양에서, 상기 키트는 하나 이상의 다른 반응 성분을 포함한다. 몇몇 실시태양에서, 적합한 양의 하나 이상의 반응 성분을 하나 이상의 용기에 제공하거나 기재상에서 유지시킨다.
상기 키트의 추가적인 성분의 예는 비제한적으로 하나 이상의 상이한 폴리머라제, 하나 이상의 숙주 세포, 외래 핵산을 숙주 세포에 도입시키기 위한 하나 이상의 시약, 상기 가이드 RNA 및/또는 Cas mRNA 또는 단백질의 발현을 검출하기 위한 또는 표적 핵산의 상태를 확인하기 위한 하나 이상의 시약(예를 들어, 탐침 또는 PCR 프라이머), 및 완충제, 형질감염 시약 또는 반응용 배양 배지(1X 이상 농축된 형태로)를 포함한다. 몇몇 실시태양에서, 상기 키트는 하기의 성분들 중 하나 이상을 포함한다: 생화학적 및 물리적 지지체; 종결, 변형 및/또는 절단 시약; 삼투물질; 및 반응, 형질감염 및/또는 검출용 기구.
상기 사용되는 반응 성분들을 다양한 형태로 제공할 수 있다. 예를 들어, 상기 성분들(예를 들어, 효소, RNA, 탐침 및/또는 프라이머)을 수용액에 현탁시키거나 비드에 결합시키거나 동결 건조된 분말 또는 펠릿으로서 존재할 수 있다. 후자의 경우, 상기 성분들은 재조성 시 배열에 사용하기 위한 성분들의 완전한 혼합물을 형성한다. 본 발명의 키트를 임의의 적합한 온도에서 제공할 수 있다. 예를 들어, 액체 중에 단백질 성분 또는 그의 복합체를 함유하는 키트의 보관을 위해서, 상기를 가능하게는 글리세롤 또는 다른 적합한 부동제를 함유하는 동결-저항 용액 중에서, 0 ℃ 이하, 바람직하게는 약 -20 ℃에서 제공하고 유지시킨다.
키트 또는 시스템은 적어도 하나의 분석에 충분한 양으로, 본 명세서에 기재된 성분들의 임의의 조합을 함유할 수 있다. 일부 용도에서, 하나 이상의 반응 성분을 개별적인, 전형적으로 일회용의 튜브 또는 등가의 용기 중에서 사전-측정된 단일 사용량으로 제공할 수 있다. 상기와 같은 배열의 경우, RNA-가이드 뉴클레아제 반응을, 표적 핵산, 또는 표적 핵산을 함유하는 샘플 또는 셀을 개별적인 튜브에 직접 가함으로써 수행할 수 있다. 상기 키트에 공급되는 성분의 양은 임의의 적합한 양일 수 있으며 상기 생성물이 향하는 시장에 따라 변할 수 있다. 상기 성분들을 공급하는 용기(들)는 상기 공급된 형태를 유지할 수 있는 임의의 통상적인 용기, 예를 들어 미세 원심분리기 튜브, 미세적정 플레이트, 앰풀, 병, 또는 일체형 시험 장치, 예를 들어 유동성 장치, 카트리지, 측면 유동, 또는 다른 유사한 장치일 수 있다.
상기 키트는 또한 상기 용기 또는 용기들의 조합을 유지하기 위한 패키징 물질을 포함할 수 있다. 상기와 같은 키트 및 시스템에 전형적인 패키징 물질은 상기 반응 성분들 또는 검출 탐침들을 임의의 다양한 형태(예를 들어, 바이알, 미세적정 플레이트 웰, 미세배열 등 중에서)로 유지하는 고체 기질(예를 들어, 유리, 플라스틱, 종이, 호일, 미세입자 등)을 포함한다. 상기 키트는 또한 상기 성분들의 용도를 유형의 형태로 기록한 설명서를 포함할 수 있다.
실시예
실시예 1
DNA 표적 서열을 표적화하고 절단하는 화학 합성된 가이드 RNA의 능력을 평가하기 위해서, 시험관내 절단 분석을 개발하였다. 간단히, 도 3에 도시된 바와 같이, 약 4 kb PAM-어드레스 가능한 DNA 표적을, 플라스미드-기재 인간 서열(여기에서 인간 클라트린 경쇄 CLTA 유전자로부터의 서열)의 예비 PCR 증폭에 의해 제조하였다. 20-μL 반응 부피에서, 50 fmole의 선형화된 DNA 표적을 50 nM sgRNA, 39 nM 재조합 정제된 Cas9 단백질(스트렙토코커스 피오게네스; 에이질런트(Agilent)) 및 10 mM MgCl2의 존재하에 pH 7.6에서, 37 ℃에서 30분 동안 배양하였다. 종료 시, 0.5 μL의 RNace It(에이질런트)를 가하고, 37 ℃에서 5분 및 이어서 70 ℃에서 15분 동안 배양을 계속하였다. 후속으로 0.5 ㎕의 프로테이나제 K(Mol. Bio. 등급, NEB)를 가하고 37 ℃에서 15분 동안 배양하였다. 분액을 DNA 7500 랩칩(LabChip)에 로딩하고 바이오어낼라이저(Bioanalyzer) 2200에서 분석하였다. 후처리 단계로 Cas9를 결합으로부터 표적 DNA로 방출시켰으며, 이를 절단에 대해 분석하였다.
도 4에 나열된 바와 같은 일련의 가이드 RNA를 화학적으로 합성하였다. 간단히, 개별적인 RNA 가닥을 합성하고 HPLC 정제하였다. 모든 올리고뉴클레오타이드는, HPLC 분석에 의한 화학적 순도 및 질량 분광분석에 의한 완전길이 가닥 순도를 토대로 품질 조절 승인되었다. 이들 각각의 가이드 RNA를 인간 CLTA 유전자를 표적화하도록 설계하였다.
상기 결과를 도 4에 나타낸다. 도 4의 표 1에 나타낸 바와 같이, 하나를 제외한 모든 화학 합성된 가이드 RNA는 CLTA-암호화된 DNA 표적 서열을 표적화하고 현저한 절단률로 절단하였다. 상기 하나의 예외는 "CLTA_37_데옥시" 가이드 RNA였으며, 이는 그의 5' 단부에 37개 데옥시리보뉴클레오타이드의 연속적인 서열을 가졌다.
본 명세서에 개시된 바와 같이, 다양한 화학 변형들을 가이드 RNA의 서열 중의 특정한 위치에서 시험하였다. 놀랍게도, 상기 가이드 RNA의 가이드 서열(a.k.a. 상기 가이드 RNA 중의 스페이서 서열) 중의 시험 위치들은, 변형이 표적-결합 서열 중에 예시된 경우에조차, 상기 가이드 RNA 중의 단일 뉴클레오타이드내 다수의 변형들의 조합을 포함하여 상기 시험된 변형의 대부분을 허용하였다.
상기 결과는 특정 위치에 변형을 함유하는 가이드 RNA가, 상기 변형이 상기 표적 폴리뉴클레오타이드의 표적-특이적 절단을 방지하지 않았으므로, 활성 Cas 단백질 및 gRNA:Cas 단백질 복합체에 의해 허용됨을 밝혀내었다. 도 4의 표 1에 나열된 모든 가이드 RNA 서열에서, 5' 단부의 처음 20개 뉴클레오타이드는 표적 DNA 중의 표적 서열에 상보성이다. 시험되고 특정 위치에서 허용되는 것으로 밝혀진 변형은 2'-O-메틸리보뉴클레오타이드(=2'OMe), 2'-데옥시리보뉴클레오타이드, 라세미 포스포로티오에이트 뉴클레오타이드간 결합(들)(=P(S)), 3'-포스포노아세테이트(=PACE), 3'-티오포스포노아세테이트(=티오PACE), Z 뉴클레오타이드, 및 이들의 조합을 포함한다.
본 명세서에서 개시되고 시험된 화학 변형들은, 특히 시험된 위치(도 4의 표 1에 나열된 바와 같은)에서, 다양한 가이드 RNA 중의 동등한 위치들에서 허용될 것으로 생각된다. 몇몇 실시태양에서, 본 명세서에 개시되고 시험된 화학 변형들은 가이드 RNA 중의 임의의 위치에서 허용된다.
본 명세서에 개시된 바와 같이, 화학적으로 변형된 뉴클레오타이드를 몇몇 성질들을 개선시키고자 가이드 RNA에 통합시켰다. 상기와 같은 성질들은 상기 가이드 RNA의 개선된 뉴클레아제 내성, gRNA:Cas 단백질 복합체의 감소된 표적-외 효과(또한 개선된 특이성으로서 공지됨), 표적 폴리뉴클레오타이드의 절단, 틈 형성 또는 결합시 gRNA:Cas 단백질 복합체의 개선된 효능, 개선된 형질감염 효율, 및/또는 개선된 세포 소기관 국소화, 예를 들어 핵 국소화를 포함한다.
변형된 RNA의 용도는 공지되어 있지만(예를 들어, 몇몇 용도에서 핵산분해적 분해를 차단하기 위한), RNA 서열 중 모든 위치에서 변형을 간단히 통합시킬 수 없고, 특히 상기 RNA 서열이 단백질 또는 효소와 복합체를 형성하여 몇몇 기능을 발휘하는 것이 필요한 경우, 기능을 예상할 수 없음은 널리 공지되어 있다. 따라서, 상기 가이드 RNA가 크리스퍼-Cas 시스템에서 충분히 또는 개선된 기능을 수행하면서 다양한 뉴클레오타이드 위치들에서 화학 변형들을 허용할 수 있는지의 여부를 예견할 수 없었다. 실제로, 상기 가이드 RNA는, 특히 시험된 다수의 위치들에서, 예시되고 시험된 정도로 특정한 변형을 허용할 수 있음은 예상되지 않았다.
실시예 2
DNA 표적 서열을 표적화하고 절단하는 화학 합성된 가이드 RNA의 능력을 평가하기 위해서, 실시예 1에 기재된 바와 유사한 시험관내 절단 분석을 사용하였다. 표적 DNA 구조물은 상기 표적 DNA와 하나 이상의 뉴클레오타이드만큼 상이한 표적-외 DNA 구조물과 함께, 인간 DNA 표적(클라트린 경쇄(CLTA1) 유전자, 인간 인터류킨 2 수용체 감마(IL2RG) 유전자, 인간 세포독성 T-림프구-관련된 단백질 4(CLTA4) 유전자, 인간 프로토카데린 알파 4(PCDHA4) 유전자, 및 인간 분절발생 호메오박스 1(EN1) 유전자로부터의 서열)에 대한 것이었다.
표 3은 가이드 RNA 구조물의 표적화 및 절단 능력을 평가하는데 사용되는 DNA 구조물과 함께, 상기 가이드 RNA 구조물들 및 그들의 서열을 제시한다. 표 3에 나열된 모든 가이드 RNA 서열에서, 5' 단부의 처음 20개 뉴클레오타이드는 표적 DNA 중의 표적 서열에 상보성이다. 온(ON) 표적 구조물은 20 nt 표적 서열을 포함한다. 오프(OFF) 표적 구조물은 1, 2 또는 3개 뉴클레오타이드 차이와 함께, 상기 표적 DNA와 동일한 20개 뉴클레오타이드의 대부분을 포함한다. 상응하게, 상기 가이드 RNA는 대개, 전부는 아니지만, 상기 오프 표적 구조물의 서열에 상보성이다. 상기 오프 표적 구조물은 인간 게놈 중에 존재하는 것으로 공지된 유전자 서열을 기본으로 한다.
[표 3]
20-μL 반응 부피에서, 50 fmole의 선형화된 DNA 표적을 50 nM sgRNA, 39 nM 재조합 정제된 Cas9 단백질(스트렙토코커스 피오게네스; 에이질런트) 및 10 mM 또는 0.8 mM MgCl2의 존재하에 pH 7.6에서, 37 ℃에서 30분 동안 배양하였다. 종료 시, 0.5 μL의 RNace It(에이질런트)를 가하고, 37 ℃에서 5분 및 이어서 70 ℃에서 15분 동안 배양을 계속하였다. 후속으로 0.5 ㎕의 프로테이나제 K(Mol. Bio. 등급, NEB)를 가하고 37 ℃에서 15분 동안 배양하였다. 분액을 DNA 1000 또는 DNA 7500 랩칩에 로딩하고 바이오어낼라이저 2200에서 분석하거나, 한편으로 제노믹 DNA 스크린테이프(Genomic DNA ScreenTape)에 로딩하고 테이프스테이션(TapeStation)상에서 분석하였다. 후처리 단계로 Cas9를 표적 DNA의 결합으로부터 방출시켰으며, 이를 절단에 대해 분석하였다. 절단 수율을 식 a/(a+b)x100(여기에서 a는 2개의 절단 생성물의 밴드 강도의 합이고 b는 나머지 절단되지 않은 DNA(존재하는 경우)이다)에 의해 계산하였다. 100%의 절단율은 표적 DNA 구조물이 전부 절단되었음을 의미한다.
일련의 가이드 RNA를 화학적으로 합성하였다. 상기 가이드 RNA 올리고머를 문헌[Dellinger et al. (201 1) J. Am. Chem. Soc, 133, 11540-56]에 기재된 과정에 따라 2'-O-티오노카바메이트-보호된 뉴클레오사이드 포스포아미다이트를 사용하여 ABI 394 합성기(라이프 테크놀로지스(Life Technologies), 미국 캘리포니아주 칼스바드 소재)상에서 합성하였다. 2'-O-메틸 포스포아미다이트를 상기 2'-O-티오노카바메이트 보호된 포스포아미다이트와 동일한 조건하에서 RNA 올리고머내에 통합시켰다. 티오포스포노아세테이트(티오PACE)-변형된 RNA의 합성에 사용된 2'-O-메틸-3'-O-(다이아이소프로필아미노)포스피노아세트산-1,1-다이메틸시아노에틸 에스터-5'-O-다이메톡시트리틸 뉴클레오사이드를 필수적으로 공개된 방법에 따라 합성하였다. 문헌[Dellinger et al. (2003) J. Am. Chem. Soc, 125, 940-50]; 및 문헌[Threlfall et al. (2012) Org. Biomol. Chem., 0, 746-54]을 참조하시오. 포스포로티오에이트-함유 올리고머의 경우, 상기 결합 반응 후 요오드 산화 단계를, 피리딘-아세토나이트릴(3:2) 혼합물 중의 3-((N,N-다이메틸아미노메틸리덴)아미노)-3H-1,2,4-다이티아졸-5-티온의 0.05M 용액을 6분 동안 사용하는 황화 단계로 교체하였다.
상기 모든 올리고뉴클레오타이드를 역상 고성능 액체 크로마토그래피(HPLC)를 사용하여 정제하고 에이질런트 6520 Q-TOF(비행시간) 질량 분광계(에이질런트 테크놀로지스, 미국 캘리포니아주 산타 클라라 소재)에 결합된 에이질런트 1290 인피니티 시리즈 LC 시스템을 사용하여 액체 크로마토그래피-질량 분광분석(LC-MS)에 의해 분석하였다. 상기 sgRNA의 합성 및 정제 수율을 LC-MS-유래된 전체 이온 크로마토그램으로부터 획득된 질량 스펙트럼의 디콘볼루션을 사용하여 평가하였다. 상기 100-머 sgRNA의 화학 합성은 전형적으로 공칭 1 마이크로몰 규모 합성으로부터 25 내지 35% 완전길이 생성물을 제공하였다. 이온 짝짓기 완충제 조건을 사용하는 역상 HPLC 정제는 상기 조 생성물로부터 전형적으로 90% 내지 95% 범위의 최종 sgRNA의 추정 순도와 함께 20% 수율을 제공하였다.
상기 결과를 표 4에 나타낸다. "절단된 표적%"는 절단된 표적 DNA 구조물의 비율을 가리킨다. 실험을 몰 과잉의 무표적 경쟁자 DNA(tcDNA)(표적 DNA와 잠재적으로 경쟁하며, 따라서 분석시 상기 첨가된 비특이적인 DNA의 잠재적인 영향을 볼 수 있었다)의 첨가와 함께 또는 상기 첨가 없이 실행하였다.
[표 4]
상기 결과는 특정 위치에 변형을 함유하는 가이드 RNA가, 상기 변형이 표적-상 폴리뉴클레오타이드의 표적-특이적 절단을 방지하지 않으므로, 활성 Cas 단백질 및 gRNA:Cas 단백질 복합체에 의해 허용됨을 밝혀내었다. 상기 시험되고 특정 위치에서 허용되는 것으로 밝혀진 변형은 2'-O-메틸리보뉴클레오타이드(=2'OMe), 2'-데옥시리보뉴클레오타이드, 라세미 포스포로티오에이트 뉴클레오타이드간 결합, 3'-포스포노아세테이트(=PACE), 3'-티오포스포노아세테이트(=티오PACE), Z 뉴클레오타이드, 2-티오유라실, 2-아미노아데닌, 5-메틸유라실, Cy5 형광단에 결합된 5-아미노알릴유라실, 2-(4-부틸아미도플루오레세인)프로판-1,3-다이올 비스(포스포다이에스터) 링커, 및 이들의 조합을 포함한다.
본 명세서에 개시되고 시험된 화학 변형들은, 특히 시험된 위치에서(표 3 및 4에 나열된 바와 같은), 다양한 가이드 RNA 중의 동등한 위치에서 허용될 것으로 생각된다.
본 명세서에 개시된 바와 같이, 화학적으로 변형된 뉴클레오타이드를 몇몇 성질들을 개선시키고자 가이드 RNA에 통합시켰다. 상기와 같은 성질들은 상기 가이드 RNA의 개선된 뉴클레아제 내성(또한 개선된 안정성으로서 공지됨), gRNA:Cas 단백질 복합체의 감소된 표적-외 효과(또한 개선된 특이성으로서 공지됨), 표적 폴리뉴클레오타이드의 절단, 틈 형성 또는 결합시 gRNA:Cas 단백질 복합체의 개선된 효능, 개선된 형질감염 효율, 및/또는 개선된 세포 소기관 국소화를 포함한다.
표 3 및 4의 분석 결과는 (1) 가이드 RNA에서, 다수의 위치가 다양한 화학 변형을 허용할 수 있고; (2) 가이드 RNA의 5' 및 3' 단부가 광범위하게 다양한 단부-보호 변형을 허용할 것이며, 상기와 같은 변형이 외부핵산분해성 RNA 분해를 억제하기에 유용하고; (3) 2-티오U를 사용하여 G-U 동요 짝짓기를 수반하는 표적-외 상호작용을 저지할 수 있고, 이에 의해 표적-외 하이브리드화 상호작용을 억제함으로써 가이드 짝짓기의 특이성을 증가시키고; (4) 5'-연장이 일반적으로 잘-허용되고; (5) 가이드 RNA의 표면 노출된 영역(공개된 결정 구조로부터 추측되는 바와 같은)이 U의 5-메틸U로의 광범위한 변형(이는 잠재적으로 상기 변형된 RNA를 변형되지 않은 RNA에 의해 자극되는 바와 같은 면역 응답을 보다 잘 회피할 수 있게 한다)을 허용하고; (6) RNA 접힘의 경우, G-C 쌍이 A-U 쌍보다 더 강하고 더 안정성임을 가리킨다. 적어도 하나의 가이드 RNA는 일부 G-C 쌍의, 변형되지 않은 A-U 쌍보다 열역학적으로 더 안정한 2'-O-메틸A-2'-O-메틸U 쌍으로의 교체를 허용한다.
보다 특히, 본 실시예는 2'-O-메틸 변형이 이중-가이드 RNA(표 3 및 4에서 엔트리 12에 의해 나타내는 바와 같은) 및 단일-가이드 RNA(엔트리 143-146, 169-170)의 5' 및 3' 단부에서 허용되고, 따라서 gRNA를 엔도뉴클레아제에 대해 안정화시키는 단부-보호를 허용함을 나타낸다. 2'-O-메틸 변형은 대부분(전부는 아니지만)의 위치에서 허용되며, 따라서 엔도뉴클레아제(엔트리 146, 153-168, 174-179)를 포함한 다양한 뉴클레아제들에 대한 안정화를 허용한다. 그러나, 본 실시예는 또한 가이드 RNA 중의 모든 위치가 2'-O-메틸을 허용하는 것은 아님(엔트리 151-152 및 171-173에 의해 나타난 바와 같이)을 입증하며, 이는 상기 5' 단부에 너무 많은 연속적인 2'-O-메틸 변형(예를 들어, 26개 이상의 연속적인 2'-O-메틸-변형된 뉴클레오타이드), 또는 5'-말단 20머 가이드 서열의 하류(3') C 및 U 뉴클레오타이드의 너무 많은 2'-O-메틸 변형은 허용되지 않음(예를 들어, 엔트리 154-156 중의 시험된 위치들에 의해 밝혀진 바와 같이 엔트리 171-173 중의 서열 위치 +56 및 +69번에서 하나 또는 2개의 2'-O-메틸유라실 모두의 억제 효과)을 암시한다.
본 실시예는 상기 20머 가이드 서열 전체를 통한 2'-O-메틸 변형이 10 mM Mg+2를 함유하는 완충제 중에서 시험관내 사용 중 허용되지만(엔트리 146), 상기와 같은 광범위한 변형은 세포 중에 존재하는 바와 같은 생리 조건하에서 잘 허용되지 않음(엔트리 147-150)을 나타낸다. 따라서, 일부 실시태양에서, 상기 20머 가이드 서열 전체를 통해 15개 이상, 한편으로 17개 이상, 한편으로 18개 이상, 한편으로 20개의 2'-O-메틸 변형을 포함하는 gRNA를 본 명세서에 기재된 바와 같은 시험관내 방법, 예를 들어 시험관내에서 DNA 서열을 변형시키기 위한 게놈 편집, 시험관내에서 관심 유전자의 발현 조절, 시험관내에서 DNA 표적 서열의 절단, 및 다른 용도에 사용한다.
본 실시예는 2'-데옥시 변형의 광범위 통합이 충분히 허용되지 않으며 실질적으로 완전히 억제성일 수도 있음(엔트리 180-182)을 나타낸다. 그러나, 2'-데옥시 변형은 일부 위치에서 잘-허용될 수 있으며(엔트리 183), 따라서 상기와 같은 변형은 뉴클레아제 억제에 유용할 수 있다.
본 실시예는 또한 형광단 또는 염료 표지가 크리스퍼-Cas9 가이드 RNA 중의 3개의 공지된 줄기-고리의 모든 고리에서 허용됨을 나타낸다(엔트리 116). 상기와 같은 표지는 또한 상기 가이드 서열상의 5' 오버행에서 허용되고(엔트리 114), sgRNA 중의 추가적인 위치에서 허용되며(엔트리 114), 이중-가이드 용도에 사용되는 tracrRNA 중의 고리에서 허용된다(엔트리 11). 본 실시예에서, 2개의 상이한 유형의 형광단이 시험되었다: 뉴클레오타이드를 필수적으로 대신하는 포스포다이에스터-결합된 형광단(리보스 고리 없음)(엔트리 114 & 116), 및 가이드 RNA 중에 통합된 5-아미노알릴U에 공유 결합된 염료 표지(Cy5)(엔트리 11).
본 실시예는 또한 Z 염기가 합성 가이드 RNA에서, 특히 일부 C가 Z 염기로 교체된 합성 가이드 RNA의 변형으로서 허용됨을 나타낸다(엔트리 290-291). 본 실시예는 또한 다수의 다른 염기들이 표 3 및 4에 나타낸 바와 같이, 다양한 위치들에서 허용됨을 나타낸다.
본 실시예는 또한 가이드 RNA의 5' 및 3' 단부가 광범위하게 다양한 단부-보호 변형을 허용할 수 있음을 나타낸다. 상기와 같은 변형을 사용하여 외부핵산분해성 RNA 분해를 억제할 수 있다. 상기와 같은 변형의 허용을 위한 지지체를 문헌[Hendel et al., Nat. Biotechnol.(2015)33:9, 985-9]에서 찾을 수 있다. 가이드 RNA의 5' 및 3' 단부에서 변형을 위한 추가적인 지지체는 표 3 및 4 중의 엔트리 143-144, 185-223, 241-257, 258-266 및 272-279에 의해 제공된다. 일부 실시태양에서, 상기 가이드 RNA는 5' 단부 또는 3' 단부 또는 각각의 5' 및 3' 단부에서 7개 이하의 변형된 뉴클레오타이드, 한편으로 6개 이하, 한편으로 5개 이하, 한편으로 4개 이하, 한편으로 3개 이하, 한편으로 2개 이하, 한편으로 하나의 변형된 뉴클레오타이드를 포함한다. 이중-가이드 RNA가 유사하게 보호될 수 있다(엔트리 12-15).
본 실시예는 또한 2-티오U를 사용하여 G-U 동요 짝짓기를 수반하는 표적-외 상호작용을 저지할 수 있고, 이에 의해 표적-외 하이브리드화 상호작용을 억제함으로써 가이드 짝짓기의 특이성을 증가시킬 수 있음을 나타낸다(엔트리 16-39). 상기 가이드 RNA와 CLTA1 표적-외 3(또한 "CLTA1 오프3-표적" 또는 "CLTA1 오프3"라 칭한다)간의 하이브리드화에 관련된 염기쌍들 중 하나는 G-U 동요 쌍이다. 상기 가이드 RNA 중의 상응하는 U를 2-티오U로 교체하는 것은 절단을 100%(엔트리 8)에서 59%(엔트리 39)로 감소시킨다. 다른 U를 2-티오U로 교체하는 것(예를 들어, 서열 위치 +3 또는 +9에서, 엔트리 23 및 31)은 같은 효과를 갖지 못하는데, 그 이유는 상기 U가 상기 시험된 각각의 표적-외 부위에 완전히 하이브리드화될 때 G-U 동요 짝짓기를 수반하지 않기 때문이다. 상응하게, 2-티오U는 표적-외 부위가 G-U 동요 짝짓기를 수반할 때 가이드 RNA의 표적 특이성을 증가시킬 수 있다.
본 실시예는 또한 상기 가이드 서열에 부착된 5'-오버행 서열이 일반적으로 잘-허용됨을 나타낸다(엔트리 83-95, 114 및 206-223 참조). 예를 들어, 5' 단부의 벌키한 다이메톡시트리틸(dmt)기는 잘 허용되었다(엔트리 95). dmt의 크로마토그래피 성질을 사용하여 합성 중 일반적으로 생성되는 불완전하게 연장되는 부산물로부터 완전길이 합성 RNA의 정제를 촉진할 수 있다. 따라서, 일부 실시태양에서, 상기 합성 가이드 RNA는, 예를 들어 상기 가이드 서열에 상보성이고 3' 단부에서 상기 가이드 서열의 5' 단부에 중합체성 링커, 예를 들어 폴리뉴클레오타이드 또는 유사한 포스포다이에스터-기재 링커(여기에서 상기 링커는 5개 이상, 한편으로 6 또는 7개의 연속적인 유리딘 뉴클레오타이드일 수 있다)에 의해 공유적으로 결합되는 15개 이하 뉴클레오타이드의 짧은 폴리뉴클레오타이드 서열을 포함하는 5'-오버행 서열을 포함한다.
본 실시예는 또한 상기 가이드 RNA의 표면 노출된 영역(달리 공개된 결정 구조로부터 추측되는 바와 같은)이 유라실 뉴클레오타이드의 5-메틸유라실(5-메틸U)(엔트리 288)로의 광범위한 변형(이는 상기 변형된 RNA가 변형되지 않은 RNA에 의해 자극되는 바와 같은 면역 응답을 보다 잘 회피할 수 있게 한다)을 허용함을 나타낸다. 특히, 합성 가이드 RNA의 5' 및 3' 단부는 잠재적으로 면역자극성이며, 본 실시예는 5' 및 3' 단부가 5-메틸U 변형을 허용함을 나타낸다.
본 실시예는 또한 합성 가이드 RNA가, 일부 G-C 쌍의, 변형되지 않은 A-U 쌍(엔트리 292-293에서 비-말단 -2'-O-메틸U 및 상보적인 -2'-O-메틸A 변형을 참조하시오)보다 열역학적으로 더 안정한 2'-O-메틸A-2'-O-메틸U 쌍으로의 교체를 허용함을 나타낸다. 이는, 접힌 RNA의 경우 G-C 쌍이 A-U 쌍보다 더 강하고 더 안정하기 때문에 유리하다. 합성 가이드 RNA에서 G-C 쌍의 상기와 같은 열안정화된 A-U 쌍으로의 교체는, 통상적으로 사용되는 RNA 접힘 연산에 의해 예측될 수 있는 바와 같이, 의도하지 않는 G-C 쌍(들)을 수반하는 잘못 접힌 구조물을 방지함으로써 활성 구조물의 개선된 접힘을 허용한다.
예시적인 실시태양
본 명세서에 개시된 발명의 요지에 따라 제공된 예시적인 실시태양들은 비제한적으로 특허청구범위 및 하기의 실시태양들을 포함한다:
A1. (i) 표적 서열에 하이브리드화할 수 있는 가이드 서열, (ii) 줄기 서열을 포함하는 crRNA 분절; 및
상기 줄기 서열에 부분적으로 또는 전적으로 상보성인 뉴클레오타이드 서열을 포함하는 tracrRNA 분절
을 포함하는 합성 가이드 RNA로,
하나 이상의 변형된 뉴클레오타이드를 포함하고, gRNA 기능성을 갖는 상기 합성 가이드 RNA.
A2. 실시태양 A1의 합성 가이드 RNA로, 2'-데옥시 부분을 포함하는 합성 가이드 RNA.
A3. 실시태양 A1 또는 A2의 합성 가이드 RNA로, 2'-플루오로, 2'-클로로, 2'-브로모 및 2'-요오도 중에서 선택된 2'-할로 부분을 포함하는 합성 가이드 RNA.
A4. 실시태양 A1 내지 A3 중 어느 하나의 합성 가이드 RNA로, 포스포로티오에이트기를 포함하는 합성 가이드 RNA.
A5. 실시태양 A1 내지 A4 중 어느 하나의 합성 가이드 RNA로, PACE기를 포함하는 합성 가이드 RNA.
A6. 실시태양 A1 내지 A5 중 어느 하나의 합성 가이드 RNA로, 티오PACE기를 포함하는 합성 가이드 RNA.
A7. 실시태양 A2 내지 A6 중 어느 하나의 합성 가이드 RNA로, 2'-O-메틸 부분을 포함하는 합성 가이드 RNA.
A8. 실시태양 A1 내지 A7 중 어느 하나의 합성 가이드 RNA로, 2-티오유라실을 포함하는 합성 가이드 RNA.
A9. 실시태양 A1 내지 A8 중 어느 하나의 합성 가이드 RNA로, 4-티오유라실을 포함하는 합성 가이드 RNA.
A10. 실시태양 A1 내지 A9 중 어느 하나의 합성 가이드 RNA로, 2-아미노아데닌을 포함하는 합성 가이드 RNA.
A11. 실시태양 A1 내지 A10 중 어느 하나의 합성 가이드 RNA로, 하이포잔틴을 포함하는 합성 가이드 RNA.
A12. 실시태양 A1 내지 A11 중 어느 하나의 합성 가이드 RNA로, 5-메틸시토신을 포함하는 합성 가이드 RNA.
A13. 실시태양 A1 내지 A12 중 어느 하나의 합성 가이드 RNA로, 5-메틸유라실을 포함하는 합성 가이드 RNA.
A14. 실시태양 A1 내지 A13 중 어느 하나의 합성 가이드 RNA로, 5-아미노알릴-유라실을 포함하는 합성 가이드 RNA.
A15. 실시태양 A1 내지 A14 중 어느 하나의 합성 가이드 RNA로, Z 리보뉴클레오타이드를 포함하는 합성 가이드 RNA.
A16. 실시태양 A1 내지 A15 중 어느 하나의 합성 가이드 RNA로, Z 데옥시리보뉴클레오타이드를 포함하는 합성 가이드 RNA.
A17. 실시태양 A1 내지 A16 중 어느 하나의 합성 가이드 RNA로, 스쿠아레이트 접합을 포함하는 합성 가이드 RNA.
A18. 실시태양 A1 내지 A17 중 어느 하나의 합성 가이드 RNA로, 염료 링커를 포함하는 합성 가이드 RNA.
A19. 실시태양 A18의 합성 가이드 RNA로, 염료 링커가 2-(4-부틸아미도플루오레세인)프로판-1,3-다이올 비스(포스포다이에스터) 링커인 합성 가이드 RNA.
A20. 실시태양 A1 내지 A19 중 어느 하나의 합성 가이드 RNA로, 2'-O-메틸 및 3'-포스포로티오에이트를 갖는 뉴클레오타이드를 포함하는 합성 가이드 RNA.
A21. 실시태양 A1 내지 A20 중 어느 하나의 합성 가이드 RNA로, 2'O-메틸 및 3"-PACE를 갖는 뉴클레오타이드를 포함하는 합성 가이드 RNA.
A22. 실시태양 A1 내지 A21 중 어느 하나의 합성 가이드 RNA로, 2'-O-메틸 및 3'-티오PACE를 갖는 뉴클레오타이드를 포함하는 합성 가이드 RNA.
A23. 실시태양 A1 내지 A22 중 어느 하나의 합성 가이드 RNA로, 2'-데옥시 및 3'-PACE를 갖는 뉴클레오타이드를 포함하는 합성 가이드 RNA.
A24. 실시태양 A1 내지 A23 중 어느 하나의 합성 가이드 RNA로, 5-메틸시티딘을 포함하는 합성 가이드 RNA.
A25. 실시태양 A1 내지 A24 중 어느 하나의 합성 가이드 RNA로, 메틸포스포네이트를 포함하는 합성 가이드 RNA.
A26. 실시태양 A1 내지 A25 중 어느 하나의 합성 가이드 RNA로, PACE의 에스터를 포함하며, 상기 에스터가 임의로 메틸 에스터인 합성 가이드 RNA.
A27. 실시태양 A1 내지 A26 중 어느 하나의 합성 가이드 RNA로, crRNA 분절 및 tracrRNA 분절을 모두 포함하는 단일 RNA 가닥을 포함하는 합성 가이드 RNA.
A28. 실시태양 A1 내지 A26 중 어느 하나의 합성 가이드 RNA로, 2개의 RNA 가닥을 포함하고, crRNA 분절 및 tracrRNA 분절이 상이한 RNA 가닥 중에 있는 합성 가이드 RNA.
A29. 실시태양 A1 내지 A28 중 어느 하나의 합성 가이드 RNA로, 각각의 RNA 가닥의 5' 단부, 3' 단부, 또는 5' 단부와 3' 단부 모두에 변형된 뉴클레오타이드를 포함하는 합성 가이드 RNA.
A30. 실시태양 A1 내지 A29 중 어느 하나의 합성 가이드 RNA로, 가이드 서열 중에 변형된 뉴클레오타이드를 포함하는 합성 가이드 RNA.
A31. 실시태양 A1 내지 A30 중 어느 하나의 합성 가이드 RNA로, 가이드 서열에 대해 5'에 변형된 뉴클레오타이드를 포함하는 합성 가이드 RNA.
A32. 실시태양 A1 내지 A31 중 어느 하나의 합성 가이드 RNA로, 줄기 서열 중에 변형된 뉴클레오타이드를 포함하는 합성 가이드 RNA.
A33. 실시태양 A1 내지 A32 중 어느 하나의 합성 가이드 RNA로, 스캐폴드 영역 중에 변형된 뉴클레오타이드를 포함하는 합성 가이드 RNA.
A34. 실시태양 A1 내지 A33 중 어느 하나의 합성 가이드 RNA로, 스캐폴드 영역 중에 하나 이상의 비천연, 직교 염기쌍을 포함하고, 상기 염기쌍이 아이소G-아이소C 및 Z 염기-P 염기 중에서 독립적으로 선택되는 합성 가이드 RNA.
A35. 실시태양 A1 내지 A34 중 어느 하나의 합성 가이드 RNA로, 2'-아미노기를 포함하는 합성 가이드 RNA.
A36. 실시태양 A1 내지 A35 중 어느 하나의 합성 가이드 RNA로, 포스포로다이티오에이트 결합기를 포함하는 합성 가이드 RNA.
A37. 실시태양 A1 내지 A36 중 어느 하나의 합성 가이드 RNA로, 보라노포스포네이트 결합기를 포함하는 합성 가이드 RNA.
A38. 실시태양 A1 내지 A37 중 어느 하나의 합성 가이드 RNA로, 열림 핵산 변형(ULNA)을 포함하는 합성 가이드 RNA.
A39. 실시태양 A1 내지 A38 중 어느 하나의 합성 가이드 RNA로, 잠금 핵산 변형(LNA)을 포함하는 합성 가이드 RNA.
A40. 실시태양 A1 내지 A39 중 어느 하나의 합성 가이드 RNA로, 비구조화된 핵산 변형(UNA)을 포함하는 합성 가이드 RNA.
A41. 실시태양 A1 내지 A40 중 어느 하나의 합성 가이드 RNA로, 슈도U를 포함하는 합성 가이드 RNA.
A42. 실시태양 A1 내지 A41 중 어느 하나의 합성 가이드 RNA로, 2'-MOE를 포함하는 합성 가이드 RNA.
A43. 실시태양 A1 내지 A42 중 어느 하나의 합성 가이드 RNA로, 2'-아라비노를 포함하는 합성 가이드 RNA.
A44. 실시태양 A1 내지 A43 중 어느 하나의 합성 가이드 RNA로, 4'-티오리보스를 포함하는 합성 가이드 RNA.
A45. 실시태양 A1 내지 A44 중 어느 하나의 합성 가이드 RNA로, 스쿠아레이트 결합을 포함하는 합성 가이드 RNA.
A46. 실시태양 A1 내지 A45 중 어느 하나의 합성 가이드 RNA로, 트라이아자올로 결합을 포함하는 합성 가이드 RNA.
A47. 표적 폴리뉴클레오타이드의 절단 또는 틈 형성 방법으로, 상기 표적 폴리뉴클레오타이드를 크리스퍼-결합된 단백질 및 실시태양 A1 내지 A46 중 어느 하나의 합성 가이드 RNA와 접촉시키고, 상기 표적 폴리뉴클레오타이드를 절단하거나 틈 형성시킴을 포함하는 방법.
A48. 실시태양 A47의 방법에서, 절단 또는 틈 형성이 시험관내에서 발생하는 방법.
A49. 실시태양 A47의 방법에서, 절단 또는 틈 형성이 세포에서 발생하는 방법.
A50. 실시태양 A47의 방법에서, 절단 또는 틈 형성이 생체내에서 발생하는 방법.
A51. 실시태양 A47 내지 A50 중 어느 하나의 방법에서, 크리스퍼-결합된 단백질이 Cas9인 방법.
A52. 실시태양 A47 내지 A51 중 어느 하나의 방법에서, 절단 또는 틈 형성이 유전자 편집을 생성시키는 방법.
A53. 실시태양 A47 내지 A52 중 어느 하나의 방법에서, 절단 또는 틈 형성이 유전자 발현의 변경을 생성시키는 방법.
A54. 표적 폴리뉴클레오타이드의 결합 방법으로, 상기 표적 폴리뉴클레오타이드를 크리스퍼-결합된 단백질 및 실시태양 A1 내지 A53 중 어느 하나의 합성 가이드 RNA와 접촉시킴을 포함하는 방법.
A55. 실시태양 A54의 방법에서, 크리스퍼-결합된 단백질이, 절단 또는 틈 형성 활성을 갖지 않는 돌연변이체를 포함하는 방법.
A56. 실시태양 A54 또는 A55의 방법에서, 크리스퍼-결합된 단백질이, 크리스퍼 시스템 중에 자연적으로 존재하지 않는 단백질 성분을 포함하는 융합 단백질인 방법.
A57. 실시태양 A54 내지 A56 중 어느 하나의 방법에서, 표적 폴리뉴클레오타이드의 발현의 변화를 생성시키는 방법.
A58. 실시태양 A54 내지 A57 중 어느 하나의 방법에서, 표적 폴리뉴클레오타이드를 태그하기에 유용한 방법.
추가의 예시적인 실시태양
B1. (a) (i) 폴리뉴클레오타이드 중 표적 서열에 하이브리드화할 수 있는 가이드 서열, (ii) 줄기 서열을 포함하는 crRNA 분절; 및
(b) 상기 줄기 서열에 부분적으로 또는 전적으로 상보성인 뉴클레오타이드 서열을 포함하는 tracrRNA 분절
을 포함하는 합성 가이드 RNA로,
하나 이상의 변형을 포함하고, gRNA 기능성을 갖는 상기 합성 가이드 RNA.
B2. 실시태양 1의 합성 가이드 RNA로, 2'-O-메틸 부분, 2'-데옥시 부분, Z 염기, 포스포로티오에이트 뉴클레오타이드간 결합, 포스포노아세테이트 뉴클레오타이드간 결합, 티오포스포노아세테이트 뉴클레오타이드간 결합, 또는 이들의 조합을 포함하는 합성 가이드 RNA.
B3. 실시태양 1 또는 2의 합성 가이드 RNA로, 3'-포스포로티오에이트기를 갖는 2'-O-메틸 뉴클레오타이드, 3'-포스포노카복실레이트기를 갖는 2'-O-메틸 뉴클레오타이드, 3'-포스포노아세테이트기를 갖는 2'-O-메틸 뉴클레오타이드, 3'-티오포스포노카복실레이트기를 갖는 2'-O-메틸 뉴클레오타이드, 3'-티오포스포노아세테이트기를 갖는 2'-O-메틸 뉴클레오타이드, 3'-포스포노아세테이트기를 갖는 2'-데옥시 뉴클레오타이드, 3'-티오포스포노아세테이트기를 갖는 2'-데옥시 뉴클레오타이드, 및 Z 염기로 이루어진 군 중에서 선택된 하나 이상의 변형을 포함하는 합성 가이드 RNA.
B4. 실시태양 1 내지 3 중 어느 하나의 합성 가이드 RNA로, 2'-플루오로리보실, 2-티오유라실 염기, 4-티오유라실 염기, 2-아미노아데닌 염기, 하이포잔틴 염기, 5-메틸시토신 염기, 5-메틸유라실 염기, 메틸포스포네이트 뉴클레오타이드간 결합, 5-아미노알릴유라실 염기, 스쿠아레이트 결합, 트라이아졸로 결합, 뉴클레오타이드에 접합된 염료, 및 이들의 조합으로 이루어진 군 중에서 선택된 하나 이상의 변형을 포함하는 합성 가이드 RNA.
B5. 실시태양 1 내지 4 중 어느 하나의 합성 가이드 RNA로, 2'-MOE, 2'-아미노, 2'-F-아라비노, 2'-LNA, 2'-ULNA, 3'-메틸포스포네이트, 3'-보라노포스포네이트, 3'-포스포로다이티오에이트, 2'-OMe-3'-P(S)2, 2'-OMe-3'-P(CH3), 2'-OMe-3'-P(BH3), 4'-티오리보실, L-당, 2-티오시토신, 6-티오구아닌, 2-아미노퓨린, 슈도유라실, 7-데아자구아닌, 7-데아자-8-아자구아닌, 7-데아자아데닌, 7-데아자-8-아자아데닌, 5-하이드록시메틸시토신, 5-하이드록시메틸유라실, 5,6-데하이드로유라실, 5-프로피닐시토신, 5-프로피닐유라실, 5-에티닐시토신, 5-에티닐유라실, 5-알릴유라실, 5-알릴시토신, 5-알릴아미노시토신, P 핵염기, 아이소시토신(아이소C), 아이소구아닌(아이소G), UNA, x(A,G,C,T), y(A,G,C,T), 비염기성 뉴클레오타이드, PEG, 탄화수소 링커, 할로-치환된 탄화수소 링커, 헤테로원자(O,N,S)-치환된 탄화수소 링커, (케토, 카복시, 아미도, 티오닐, 카바모일, 또는 티오노카바모일)-함유 탄화수소 링커, 스페르민 링커, 및 이들의 조합으로 이루어진 군 중에서 선택된 변형을 포함하는 합성 가이드 RNA.
B6. 실시태양 1 내지 5 중 어느 하나의 합성 가이드 RNA로, 안정성-증대 변형을 포함하는 합성 가이드 RNA.
B7. 실시태양 1 내지 6 중 어느 하나의 합성 가이드 RNA로, 2개 이상의 변형을 포함하고; 제1 변형이 안정성-증대 변형이고 제2 변형이 특이성-변경 변형인 합성 가이드 RNA.
B8. 실시태양 6 또는 7의 합성 가이드 RNA에서, 안정성-증대 변형이 가이드 서열 중에 위치하는 합성 가이드 RNA.
B9. 실시태양 6 또는 7의 합성 가이드 RNA에서, 안정성-증대 변형이 가이드 서열의 상류에 위치하는 합성 가이드 RNA.
B10. 실시태양 6 또는 7의 합성 가이드 RNA에서, 안정성-증대 변형이 crRNA 분절의 처음 5개 및/또는 마지막 5개 뉴클레오타이드내에 위치하는 합성 가이드 RNA.
B11. 실시태양 6 또는 7의 합성 가이드 RNA에서, 안정성-증대 변형이 tracrRAN 분절 중에 위치하는 합성 가이드 RNA.
B12. 실시태양 6 또는 7의 합성 가이드 RNA에서, 안정성-증대 변형이 tracrRNA 분절의 처음 5개 및/또는 마지막 5개 뉴클레오타이드내에 위치하는 합성 가이드 RNA.
B13. 실시태양 6 내지 12 중 어느 하나의 합성 가이드 RNA에서, 안정성-증대 변형이 2'-O-메틸 부분, 2'-플루오로 부분, 또는 2'-데옥시 부분을 포함하는 합성 가이드 RNA.
B14. 실시태양 6 내지 13 중 어느 하나의 합성 가이드 RNA에서, 안정성-증대 변형이 포스포로티오에이트 뉴클레오타이드간 결합, 포스포노아세테이트 뉴클레오타이드간 결합, 티오포스포노아세테이트 뉴클레오타이드간 결합, 메틸포스포네이트 뉴클레오타이드간 결합, 보라노포스포네이트 뉴클레오타이드간 결합, 또는 포스포로다이티오에이트 뉴클레오타이드간 결합을 포함하는 합성 가이드 RNA.
B15. 실시태양 6 내지 14 중 어느 하나의 합성 가이드 RNA에서, 안정성-증대 변형이 3'-포스포노아세테이트 또는 3'-티오포스포노아세테이트를 포함하는 합성 가이드 RNA.
B16. 실시태양 6 내지 15 중 어느 하나의 합성 가이드 RNA에서, 안정성-증대 변형이 2'-O-메틸-3'-포스포로티오에이트 뉴클레오타이드, 2'-O-메틸-3'-포스포노아세테이트 뉴클레오타이드 또는 2'-O-메틸-3'-티오포스포노아세테이트 뉴클레오타이드를 포함하는 합성 가이드 RNA.
B17. 실시태양 6 내지 16 중 어느 하나의 합성 가이드 RNA에서, 안정성-증대 변형이 2'-플루오로-3'-포스포로티오에이트 뉴클레오타이드, 2'-플루오로-3'-포스포노아세테이트 뉴클레오타이드 또는 2'-플루오로-3'-티오포스포노아세테이트 뉴클레오타이드를 포함하는 합성 가이드 RNA.
B18. 실시태양 1 내지 17 중 어느 하나의 합성 가이드 RNA로, 특이성-변경 변형을 포함하는 합성 가이드 RNA.
B19. 실시태양 18의 합성 가이드 RNA에서, 특이성-변경 변형이 가이드 서열 중에 위치하는 합성 가이드 RNA.
B20. 실시태양 18 또는 19의 합성 가이드 RNA에서, 특이성-변경 변형이 2-티오유라실, 4-티오유라실 또는 2-아미노아데닌을 포함하는 합성 가이드 RNA.
B21. 실시태양 18 내지 20 중 어느 하나의 합성 가이드 RNA에서, 특이성-변경 변형이 포스포로티오에이트 뉴클레오타이드간 결합, 포스포노아세테이트 뉴클레오타이드간 결합, 티오포스포노아세테이트 뉴클레오타이드간 결합, 메틸포스포네이트 뉴클레오타이드간 결합, 보라노포스페이트 뉴클레오타이드간 결합, 또는 포스포로다이티오에이트 뉴클레오타이드간 결합을 포함하는 합성 가이드 RNA.
B22. 실시태양 18 내지 21 중 어느 하나의 합성 가이드 RNA에서, 특이성-변경 변형이 3'-포스포노아세테이트 또는 3'-티오포스포노아세테이트를 포함하는 합성 가이드 RNA.
B23. 실시태양 1 내지 22 중 어느 하나의 합성 가이드 RNA에서, 형광 염료 또는 표지를 포함하는 합성 가이드 RNA.
B24. 실시태양 1 내지 23 중 어느 하나의 합성 가이드 RNA로, 하나 이상의 동위원소 표지를 포함하는 합성 가이드 RNA.
B25. 실시태양 1 내지 24 중 어느 하나의 합성 가이드 RNA에서, 가이드 RNA가 올리고뉴클레오타이드, 앱타머, 아미노산, 펩타이드, 단백질, 스테로이드, 지질, 폴산, 비타민, 당 또는 올리고사카라이드에 접합되는 합성 가이드 RNA.
B26. 실시태양 1 내지 25 중 어느 하나의 합성 가이드 RNA에서, 상기 합성 가이드 RNA가 단일 가이드 RNA이며, crRNA 분절 및 tracrRNA 분절이 고리 L을 통해 결합되는 합성 가이드 RNA.
B27. 실시태양 26의 합성 가이드 RNA에서, 고리 L이 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10 뉴클레오타이드를 포함하는 합성 가이드 RNA.
B28. 실시태양 26 또는 27의 합성 가이드 RNA에서, 고리 L이 GNRA의 뉴클레오타이드 서열을 포함하고, 여기에서 N이 A, C, G 또는 U를 나타내고, R이 A 또는 G를 나타내는 합성 가이드 RNA.
B29. 실시태양 26 내지 28 중 어느 하나의 합성 가이드 RNA에서, 고리 L이 GAAA의 뉴클레오타이드 서열을 포함하는 합성 가이드 RNA.
B30. 실시태양 26 내지 29 중 어느 하나의 합성 가이드 RNA에서, 고리 L이 하나 이상의 변형된 뉴클레오타이드를 포함하는 합성 가이드 RNA.
B31. 실시태양 30의 합성 가이드 RNA에서, 고리 L이 형광 염료를 포함하는 합성 가이드 RNA.
B32. 실시태양 31의 합성 가이드 RNA에서, 염료가 2-(4-부틸아미도-염료)프로판-1,3-다이올 비스(포스포다이에스터) 링커에 접합되는 합성 가이드 RNA.
B33. 실시태양 1 내지 32 중 어느 하나의 합성 가이드 RNA에서, crRNA 분절이 가이드 RNA의 5' 단부에 있는 합성 가이드 RNA.
B34. 실시태양 1 내지 33 중 어느 하나의 합성 가이드 RNA에서, tracrRNA 분절이 가이드 RNA의 3' 단부에 있는 합성 가이드 RNA.
B35. 실시태양 1 내지 34 중 어느 하나의 합성 가이드 RNA에서, crRNA 분절이 25 내지 70 뉴클레오타이드를 포함하는 합성 가이드 RNA.
B36. 실시태양 1 내지 35 중 어느 하나의 합성 가이드 RNA에서, 가이드 서열이 15 내지 30 뉴클레오타이드를 포함하는 합성 가이드 RNA.
B37. 실시태양 1 내지 36 중 어느 하나의 합성 가이드 RNA에서, 줄기 서열이 10 내지 50 뉴클레오타이드를 포함하는 합성 가이드 RNA.
B38. 실시태양 1 내지 37 중 어느 하나의 합성 가이드 RNA로, 하나 이상의 트라이아졸로 결합(들)을 포함하는 합성 가이드 RNA.
B39. 실시태양 1 내지 38 중 어느 하나의 합성 가이드 RNA로, 하나 이상의 스쿠아레이트 결합(들)을 포함하는 합성 가이드 RNA.
B40. 실시태양 1 내지 39 중 어느 하나의 합성 가이드 RNA에서, 하기의 뉴클레오타이드 조성을 포함하는 합성 가이드 RNA:
MmNn
상기 식에서,
각각의 N은 독립적으로 변형되지 않은 뉴클레오타이드를 나타내고;
각각의 M은 2'-O-메틸 리보뉴클레오타이드, 2'-O-메틸-3'-P(S)-리보뉴클레오타이드, 2'-O-메틸-3'-PACE 리보뉴클레오타이드, 2'-O-메틸-3'-티오PACE 리보뉴클레오타이드, 및 2'-데옥시뉴클레오타이드 중에서 선택되고;
각각의 M은 상기 가이드 RNA의 서열 중 임의의 위치에 있고;
m은 1 내지 220의 정수이고, n은 0 내지 219의 정수이며, 50<m+n≤220이다.
B41. 실시태양 38의 합성 가이드 RNA에서, m+n<150이고, m 및 n은 각각 0 내지 150의 정수 중에서 독립적으로 선택되나, 단 m은 0이 아니다.
B42. 실시태양 1 내지 41 중 어느 하나의 합성 가이드 RNA에서, 하기의 뉴클레오타이드 조성을 포함하는 합성 가이드 RNA:
MmNnM'm'N'n'M"m "
상기 식에서,
각각의 M, M' 및 M"은 독립적으로 변형된 뉴클레오타이드를 나타내고, 각각의 N 및 N'은 독립적으로 변형되지 않은 리보뉴클레오타이드를 나타내며;
임의의 주어진 M은 임의의 다른 M과 동일하거나 상이하고, 임의의 주어진 N은 임의의 다른 N과 동일하거나 상이하고, 임의의 주어진 M'은 임의의 다른 M'과 동일하거나 상이하고, 임의의 주어진 N'은 임의의 다른 N'과 동일하거나 상이하고, 임의의 주어진 M"은 임의의 다른 M"과 동일하거나 상이하고;
m은 0 내지 40의 정수이고, n은 2 내지 130의 정수이고, m'은 0 내지 10의 정수이고, n'은 0 내지 50의 정수이고, m"는 0 내지 10의 정수이나, 단 m+m'+m"은 1 이상이다.
B43. 실시태양 1 내지 42 중 어느 하나의 합성 가이드 RNA에서, crRNA 분절이 하기의 뉴클레오타이드 서열을 포함하는 합성 가이드 RNA:
MmNnM'm'N'n '
상기 식에서,
M 및 M'은 각각 변형된 뉴클레오타이드를 나타내고, N 및 N'은 각각 변형되지 않은 리보뉴클레오타이드를 나타내며;
임의의 주어진 M은 임의의 다른 M과 동일하거나 상이하고, 임의의 주어진 N은 임의의 다른 N과 동일하거나 상이하고, 임의의 주어진 M'은 임의의 다른 M'과 동일하거나 상이하고, 임의의 주어진 N'은 임의의 다른 N'과 동일하거나 상이하고;
n 및 n'은 각각 독립적으로 0 내지 50의 정수 중에서 선택되고, m 및 m'은 각각 독립적으로 0 내지 25의 정수 중에서 선택되나, 단 m+m'은 1 이상이다.
B44. 실시태양 1 내지 43 중 어느 하나의 합성 가이드 RNA에서, 가이드 서열이 하기의 뉴클레오타이드 서열을 포함하는 합성 가이드 RNA:
MmNnM'm'N'n '
상기 식에서,
M 및 M'은 각각 변형된 뉴클레오타이드를 나타내고, N 및 N'은 각각 변형되지 않은 리보뉴클레오타이드를 나타내며;
임의의 주어진 M은 임의의 다른 M과 동일하거나 상이하고, 임의의 주어진 N은 임의의 다른 N과 동일하거나 상이하고, 임의의 주어진 M'은 임의의 다른 M'과 동일하거나 상이하고, 임의의 주어진 N'은 임의의 다른 N'과 동일하거나 상이하고;
m, n, m' 및 n'은 각각 독립적으로 0 내지 40의 정수 중에서 선택되나, 단 m+m'은 1 이상이다.
B45. 실시태양 1 내지 44 중 어느 하나의 합성 가이드 RNA에서, tracrRNA 분절이 하기의 뉴클레오타이드 서열을 포함하는 합성 가이드 RNA:
NnMmN'n'M'm '
상기 식에서,
M 및 M'은 각각 변형된 뉴클레오타이드를 나타내고, N 및 N'은 각각 변형되지 않은 리보뉴클레오타이드를 나타내며;
임의의 주어진 M은 임의의 다른 M과 동일하거나 상이하고, 임의의 주어진 N은 임의의 다른 N과 동일하거나 상이하고, 임의의 주어진 M'은 임의의 다른 M'과 동일하거나 상이하고, 임의의 주어진 N'은 임의의 다른 N'과 동일하거나 상이하고;
n은 0 내지 130의 정수이고, m은 0 내지 40의 정수이고, n'은 0 내지 130의 정수이고, m'은 0 내지 40의 정수이나, 단 m+m'은 1 이상이다.
B46. 실시태양 40 내지 43 중 어느 하나의 합성 가이드 RNA에서, m, m', m+m' 또는 m+m'+m"이 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20인 합성 가이드 RNA.
B47. 실시태양 40 내지 43 중 어느 하나의 합성 가이드 RNA에서, m, m', m+m' 또는 m+m'+m"이 1, 2, 3, 4, 5 또는 6인 합성 가이드 RNA.
B48. 실시태양 40 내지 45 중 어느 하나의 합성 가이드 RNA에서, n이 16, 17, 18 또는 19인 합성 가이드 RNA.
B49. 실시태양 40 내지 45 중 어느 하나의 합성 가이드 RNA에서, n, n', 또는 n+n'이 75 내지 115의 정수인 합성 가이드 RNA.
B50. 실시태양 40 내지 47 중 어느 하나의 합성 가이드 RNA에서, 각각의 M이 2'-변형된 뉴클레오타이드, 3'-변형된 뉴클레오타이드 및 이들의 조합으로 이루어진 군 중에서 독립적으로 선택되는 합성 가이드 RNA.
B51. 실시태양 48의 합성 가이드 RNA에서, 2'-변형된 뉴클레오타이드가 2'-데옥시 뉴클레오타이드, 2'-O-메틸 뉴클레오타이드, 2'-플루오로 뉴클레오타이드, 및 2'-O-C1- 3알킬-O-C1- 3알킬 뉴클레오타이드로 이루어진 군 중에서 선택되는 합성 가이드 RNA.
B52. 실시태양 48의 합성 가이드 RNA에서, 3'-변형된 뉴클레오타이드가 3'-포스포노아세테이트 뉴클레오타이드 및 3'-티오포스포노아세테이트 뉴클레오타이드로 이루어진 군 중에서 선택되는 합성 가이드 RNA.
B53. 실시태양 48의 합성 가이드 RNA에서, 2'-변형된 뉴클레오타이드 및 3'-변형된 뉴클레오타이드의 조합이 2'-O-메틸-3'-포스포로티오에이트 뉴클레오타이드, 2'-O-메틸-3'-포스포노아세테이트 뉴클레오타이드, 또는 2'-O-메틸-3'-티오포스포노아세테이트 뉴클레오타이드를 포함하는 합성 가이드 RNA.
B54. 표적 폴리뉴클레오타이드의 절단 방법으로, 상기 표적 폴리뉴클레오타이드를 크리스퍼-결합된 단백질 및 실시태양 1 내지 53 중 어느 하나의 합성 가이드 RNA와 접촉시키고 상기 표적 폴리뉴클레오타이드를 절단시킴을 포함하는 방법.
B55. 실시태양 52의 방법으로, 표적 폴리뉴클레오타이드를 외인성 크리스퍼-결합된 단백질과 접촉시킴을 또한 포함하는 방법.
B56. 실시태양 53의 방법에서, 크리스퍼-결합된 단백질이 Cas9인 방법.
B57. 실시태양 52 내지 54 중 어느 하나의 방법에서, 절단이 표적 유전자의 기능성 녹아웃을 생성시키는 방법.
B58. 실시태양 52 내지 55 중 어느 하나의 방법으로, 절단된 표적 폴리뉴클레오타이드를 외인성 또는 내인성 주형 폴리뉴클레오타이드에 의한 상동성-지시된 수복에 의해 수복함을 또한 포함하는 방법.
B59. 실시태양 56의 방법에서, 외인성 또는 내인성 주형 폴리뉴클레오타이드가 절단 부위의 어느 한 쪽상의 서열과 실질적인 서열 일치성을 갖는 하나 이상의 서열을 포함하는 방법.
B60. 실시태양 52 내지 57 중 어느 하나의 방법으로, 절단된 표적 폴리뉴클레오타이드를 비-상동성 단부 결합에 의해 수복함을 또한 포함하는 방법.
B61. 실시태양 56 내지 58 중 어느 하나의 방법에서, 수복 단계가 표적 폴리뉴클레오타이드의 하나 이상의 뉴클레오타이드의 삽입, 결실 또는 치환을 생성시키는 방법.
B62. 실시태양 59의 방법에서, 삽입, 결실 또는 치환이 표적 폴리뉴클레오타이드를 포함하는 유전자로부터 발현된 단백질 중에 하나 이상의 아미노산 변화를 생성시키는 방법.
B63. 실시태양 52 내지 60 중 어느 하나의 방법에서, 표적 폴리뉴클레오타이드를 시험관내에서 크리스퍼-결합된 단백질 및 합성 가이드 RNA와 접촉시키는 방법.
B64. 실시태양 52 내지 61 중 어느 하나의 방법에서, 크리스퍼-결합된 단백질 및 합성 가이드 RNA와 접촉된 표적 폴리뉴클레오타이드가 시험관내 또는 생체내에서 세포의 게놈내에 있는 방법.
B65. 실시태양 62의 방법에서, 세포를, 표적 폴리뉴클레오타이드를 크리스퍼-결합된 단백질 및 합성 가이드 RNA와 접촉시키기 전에 다세포 공급원으로부터 단리시키는 방법.
B66. 실시태양 63의 방법에서, 공급원이 식물, 동물, 다세포 원생생물, 또는 진균인 방법.
B67. 실시태양 62 내지 64 중 어느 하나의 방법에서, 세포 또는 그로부터 유래된 세포를, 표적 폴리뉴클레오타이드를 크리스퍼-결합된 단백질 및 합성 가이드 RNA와 접촉시킨 후에 공급원으로 다시 복귀시키는 방법.
B68. 세포에서 표적 폴리뉴클레오타이드를 변형시키는 방법으로, 상기 세포내에 실시태양 1 내지 51 중 어느 하나의 합성 가이드 RNA를 도입시키고 상기 세포내에 크리스퍼-결합된 단백질 또는 상기 세포에서 크리스퍼-결합된 단백질을 발현하는 핵산을 도입시킴을 포함하는 방법.
B69. 실시태양 66의 방법에서, 크리스퍼-결합된 단백질이 Cas9인 방법.
B70. 세포에서 하나 이상의 유전자 산물의 발현을 변경시키는 방법으로, 상기 세포내에 실시태양 1 내지 51 중 어느 하나의 합성 가이드 RNA를 도입시키고 상기 세포내에 크리스퍼-결합된 단백질 또는 상기 세포에서 크리스퍼-결합된 단백질을 발현하는 핵산을 또한 도입시킴을 포함하며, 여기에서 상기 세포가 표적 서열을 갖고 상기 유전자 산물을 암호화하는 DNA 분자를 함유하고 발현하는 방법.
B71. 실시태양 68의 방법에서, 크리스퍼-결합된 단백질이 Cas9인 방법.
B72. 실시태양 69의 방법에서, 크리스퍼-결합된 단백질이 DNA 분자를 절단하는 방법.
B73. 실시태양 1 내지 51 중 어느 하나의 2개 이상의 합성 가이드 RNA를 포함하는 RNA 분자들의 세트 또는 라이브러리.
B74. 실시태양 1 내지 51 중 어느 하나의 합성 가이드 RNA 또는 실시태양 71의 RNA 분자들의 세트 또는 라이브러리를 포함하는 키트.
B75. 실시태양 72의 키트로, 크리스퍼-결합된 단백질 또는 상기 크리스퍼-결합된 단백질을 암호화하는 핵산을 또한 포함하는 키트.
B76. 실시태양 73의 키트에서, 크리스퍼-결합된-단백질이 Cas9인 키트.
B77. 실시태양 1 내지 76 중 어느 하나의 합성 가이드 RNA, 방법 또는 키트에서, 합성 가이드 RNA가 단부 변형을 포함하는 합성 가이드 RNA, 방법 또는 키트.
B78. 실시태양 1 내지 77 중 어느 하나의 합성 가이드 RNA로, 단일 RNA 가닥 또는 2개의 별도의 상보성 RNA 가닥을 갖고, 각각의 RNA 가닥의 양쪽 단부에서 하나 이상의 안정성-증대 변형을 포함하는 합성 가이드 RNA.
C1. (a) (i) 폴리뉴클레오타이드 중 표적 서열에 하이브리드화할 수 있는 가이드 서열, (ii) 줄기 서열을 포함하는 crRNA 분절; 및
(b) 상기 줄기 서열에 부분적으로 또는 전적으로 상보성인 뉴클레오타이드 서열을 포함하는 tracrRNA 분절
을 포함하는 합성 가이드 RNA로,
하나 이상의 변형을 포함하고, gRNA 기능성을 갖는 상기 합성 가이드 RNA.
C2. 실시태양 C1의 합성 가이드 RNA에서, 변형 중 하나 이상이 안정성-증대 변형을 포함하는 합성 가이드 RNA.
C3. 실시태양 C2의 합성 가이드 RNA에서, 안정성-증대 변형 중 하나 이상이 가이드 서열 중에 위치하는 합성 가이드 RNA.
C4. 실시태양 C2의 합성 가이드 RNA에서, 안정성-증대 변형이 2'-O-메틸 부분, Z 염기, 2'-데옥시 뉴클레오타이드, 포스포로티오에이트 뉴클레오타이드간 결합, 포스포노아세테이트(PACE) 뉴클레오타이드간 결합, 또는 티오포스포노아세테이트(티오PACE) 뉴클레오타이드간 결합, 또는 이들의 조합을 포함하는 합성 가이드 RNA.
C5. 실시태양 C1 내지 C4 중 어느 하나의 합성 가이드 RNA로, 가이드 RNA의 5' 단부에 26개 미만의 연속적인 2'-O-메틸 변형된 뉴클레오타이드를 포함하는 합성 가이드 RNA.
C6. 실시태양 C1 내지 C5 중 어느 하나의 합성 가이드 RNA로, 합성 가이드 RNA 중 시토신을 대체하는 Z 염기를 포함하는 합성 가이드 RNA.
C7. 실시태양 C1 내지 C6 중 어느 하나의 합성 가이드 RNA로, 잠재적인 표적-외 서열과의 U-G 동요 짝짓기에 관여할 수 있는 유리딘에 상응하는 위치에 하나 이상의 2-티오유라실을 포함하는 합성 가이드 RNA.
C8. 실시태양 C1 내지 C7 중 어느 하나의 합성 가이드 RNA로, 3'-포스포로티오에이트기를 갖는 2'-O-메틸 뉴클레오타이드, 3'-포스포노아세테이트기를 갖는 2'-O-메틸 뉴클레오타이드, 3'-티오포스포노아세테이트기를 갖는 2'-O-메틸 뉴클레오타이드, 및 3'-포스포노아세테이트기를 갖는 2'-데옥시 뉴클레오타이드로 이루어진 군 중에서 선택된 하나 이상의 변형을 포함하는 합성 가이드 RNA.
C9. 실시태양 C1 내지 C8 중 어느 하나의 합성 가이드 RNA로, 2개 이상의 변형을 포함하는 합성 가이드 RNA.
C10. 실시태양 C1 내지 C9 중 어느 하나의 합성 가이드 RNA로, 50개 이하의 변형을 포함하는 합성 가이드 RNA.
C11. 실시태양 C1 내지 C10 중 어느 하나의 합성 가이드 RNA로, 단일 RNA 가닥 또는 2개의 별도의 RNA 가닥, 및 각각의 RNA 가닥의 5' 단부, 각각의 RNA 가닥의 3' 단부, 또는 각각의 RNA 가닥의 5' 단부 및 3' 단부 모두에 하나 이상의 변형을 포함하는 합성 가이드 RNA.
C12. 실시태양 C1 내지 C11 중 어느 하나의 합성 가이드 RNA로, 5' 단부, 3' 단부, 또는 5' 및 3' 단부 각각에 7개 이하의 연속적인 변형된 뉴클레오타이드를 포함하는 합성 가이드 RNA.
C13. 실시태양 C1 내지 C12 중 어느 하나의 합성 가이드 RNA로, 5' 단부, 3' 단부, 및 줄기-고리 중 하나 이상에 하나 이상의 5-메틸유리딘 뉴클레오타이드를 포함하는 합성 가이드 RNA.
C14. 실시태양 C1 내지 C13 중 어느 하나의 합성 가이드 RNA에서, 변형 중 하나 이상이 염기-짝짓기 열안정성을 변경시키는 합성 가이드 RNA.
C15. 실시태양 C14의 합성 가이드 RNA에서, 하나 이상의 변형이 염기-짝짓기 열안정성을 증대시키는 합성 가이드 RNA.
C16. 실시태양 C15의 합성 가이드 RNA에서, 하나 이상의 변형이 2-티오유라실(2-티오U), 4-티오유라실(4-티오U), 2-아미노아데닌, 2'-O-메틸, 2'-플루오로, 5-메틸유리딘, 5-메틸시티딘, 및 잠금 핵산 변형(LNA) 중에서 독립적으로 선택되는 합성 가이드 RNA.
C17. 실시태양 C15의 합성 가이드 RNA로, 하나 이상의 변형이 염기-짝짓기 열안정성을 감소시키는 합성 가이드 RNA.
C18. 실시태양 C17의 합성 가이드 RNA로, 하나 이상의 변형이 2-티오유라실, 2'-데옥시, 포스포로티오에이트 결합, 포스포로다이티오에이트 결합, 보라노포스포네이트 결합, 포스포노아세테이트 결합, 티오포스포노아세테이트 결합, 및 열림 핵산 변형(ULNA) 중에서 독립적으로 선택되는 합성 가이드 RNA.
C19. 실시태양 C1 내지 C18 중 어느 하나의 합성 가이드 RNA로, 하나 이상의 2'-O-메틸A-2'-O-메틸U 염기쌍을 포함하는 합성 가이드 RNA.
C20. 실시태양 C1 내지 19 중 어느 하나의 합성 가이드 RNA에서, 변형 중 하나 이상이 특이성-변경 변형인 합성 가이드 RNA.
C21. 실시태양 C20의 합성 가이드 RNA로, 특이성-변경 변형이 가이드 서열 중에 위치하는 합성 가이드 RNA.
C22. 실시태양 C1 내지 C21 중 어느 하나의 합성 가이드 RNA에서, 특이성-변경 변형이 2-티오유라실, 4-티오유라실, 2-아미노아데닌, 2'-O-메틸, 2'-플루오로, LNA, 포스포로티오에이트 결합, 포스포로다이티오에이트 결합, 보라노포스포네이트 결합, 포스포노아세테이트 결합, 티오포스포노아세테이트 결합, ULNA, 2'-데옥시, 5-메틸유리딘, 5-메틸시티딘 또는 이들의 조합을 포함하는 합성 가이드 RNA.
C23. 실시태양 C1 내지 C22 중 어느 하나의 합성 가이드 RNA로, 형광 염료 또는 표지를 포함하는 합성 가이드 RNA.
C24. 실시태양 C23의 합성 가이드 RNA에서, 형광 염료 또는 표지가 합성 가이드 RNA의 줄기-고리에 결합되는 합성 가이드 RNA.
C25. DNA 서열을 변형시키기 위한 게놈 편집, 또는 관심 유전자 발현의 조절, 또는 표적 폴리뉴클레오타이드의 절단 방법으로, 상기 DNA 서열, 상기 관심 유전자, 또는 상기 표적 폴리뉴클레오타이드를 크리스퍼-결합된 단백질 및 실시태양 C1 내지 C24 중 어느 하나의 합성 가이드 RNA와 접촉시키고, 상기 DNA 서열, 상기 관심 유전자 또는 상기 표적 폴리뉴클레오타이드를 편집하거나 조절하거나 절단함을 포함하는 방법.
C26. 실시태양 C25의 방법에서, 합성 가이드 RNA가 가이드 서열 전체를 통해 15개 이상의 2'-O-메틸 변형을 포함하는, 시험관내에서 수행되는 방법.
C27. 실시태양 C1 내지 C26 중 어느 하나의 2개 이상의 합성 가이드 RNA를 포함하는 RNA 분자들의 세트 또는 라이브러리.
C28. 실시태양 C1 내지 C27 중 어느 하나의 합성 가이드 RNA를 포함하는 키트.
C29. 실시태양 C1 내지 C28 중 어느 하나의 2개 이상의 합성 가이드 RNA를 포함하는 RNA 분자들의 배열.
상기 예시적인 또는 바람직한 실시태양들의 기재는 특허청구범위에 의해 한정되는 바와 같은 본 발명을 제한하기보다는 예시하는 것으로서 간주해야 한다. 쉽게 이해되는 바와 같이, 상기에 제시된 특징들의 다수의 변화 및 조합을 특허청구범위에 제시된 바와 같은 본 발명으로부터 벗어남이 없이 사용할 수 있다. 상기와 같은 변화는 본 발명의 범위로부터의 이탈로서 간주되지 않으며, 모든 상기와 같은 변화를 하기 특허청구범위의 범위내에 포함하고자 한다. 본 명세서에 인용된 모든 참고문헌들은 내용 전체가 참고로 인용된다.
SEQUENCE LISTING
<110> Agilent Technologies, Inc.
<120> GUIDE RNA WITH CHEMICAL MODIFICATIONS
<130> 20150013-04
<140> PCT/US2015/000143
<141> 2015-12-03
<150> US 62/087,211
<151> 2014-12-03
<150> US 62/146,189
<151> 2015-04-10
<150> US 62/256,095
<151> 2015-11-16
<160> 127
<170> PatentIn version 3.5
<210> 1
<211> 1368
<212> PRT
<213> Streptococcus pyogenes
<400> 1
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 2
<211> 7
<212> PRT
<213> Simian virus 40
<400> 2
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 3
<211> 7
<212> PRT
<213> Simian virus 40
<400> 3
Pro Lys Lys Lys Arg Arg Val
1 5
<210> 4
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 4
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 5
<211> 20
<212> PRT
<213> Human immunodeficiency virus
<220>
<221> misc_feature
<223> tat protein
<400> 5
Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg Pro Pro Gln Pro Lys Lys
1 5 10 15
Lys Arg Lys Val
20
<210> 6
<211> 19
<212> PRT
<213> Hepatitis B virus
<220>
<221> misc_feature
<223> middle S protein, partial
<400> 6
Pro Leu Ser Ser Ile Phe Ser Arg Ile Gly Asp Pro Pro Lys Lys Lys
1 5 10 15
Arg Lys Val
<210> 7
<211> 24
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 7
Gly Ala Leu Phe Leu Gly Trp Leu Gly Ala Ala Gly Ser Thr Met Gly
1 5 10 15
Ala Pro Lys Lys Lys Arg Lys Val
20
<210> 8
<211> 27
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 8
Gly Ala Leu Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser Thr Met Gly
1 5 10 15
Ala Trp Ser Gln Pro Lys Lys Lys Arg Lys Val
20 25
<210> 9
<211> 21
<212> PRT
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 9
Lys Glu Thr Trp Trp Glu Thr Trp Trp Thr Glu Trp Ser Gln Pro Lys
1 5 10 15
Lys Lys Arg Lys Val
20
<210> 10
<211> 390
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 10
agaatttaac tgtggtcaca tttgctttat cgactggctt catctcacag ctcatcttac 60
gcaagttcga tgagtatgcc agtcactttc aatttggttg aatgttcccg tgacatgcga 120
gttctgtcga ccatgtgccg cggattgaat tcctcaaggg tggtgataga tgctacggtg 180
gtgatgcgca tgcgctcagt cctcatctcc ctcaagcagg ccccgctggt gggtcggagt 240
ccctagtgaa gccaccaata tagtggtcgt gtcaagcaac tgtccacgct ccaccctcga 300
ggtcgtaaca taaacgtact aaggcacgag taaacaagat cgatagcaag aacatggtat 360
agactgacgg agagctcgcc attagtctga 390
<210> 11
<211> 390
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 11
agaatttaac tgtggtcaca tttgctttat cgactggctt catctcacag ctcatcttac 60
gcaagttcga tgagtatgcc agtcactttc aatttggttg aatgttcccg tgacatgcga 120
gttctgtcga ccatgtgccg cggattgaat tcctcaaggg tggtgataga tgctacggtg 180
gtgatgcgta tgcactcagt cctcaactcc ctcaagcagg cgacccctgg gggtcggagt 240
ccctagtgaa gccaccaata tagtggtcgt gtcaagcaac tgtccacgct ccaccctcga 300
ggtcgtaaca taaacgtact aaggcacgag taaacaagat cgatagcaag aacatggtat 360
agactgacgg agagctcgcc attagtctga 390
<210> 12
<211> 390
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 12
agaatttaac tgtggtcaca tttgctttat cgactggctt catctcacag ctcatcttac 60
gcaagttcga tgagtatgcc agtcactttc aatttggttg aatgttcccg tgacatgcga 120
gttctgtcga ccatgtgccg cggattgaat tcctcaaggg tggtgataga tgctacggtg 180
gtgatgcaat aaatttcagc cctcatttcc ctcaagcagg ggttacttta gggtcggagt 240
ccctagtgaa gccaccaata tagtggtcgt gtcaagcaac tgtccacgct ccaccctcga 300
ggtcgtaaca taaacgtact aaggcacgag taaacaagat cgatagcaag aacatggtat 360
agactgacgg agagctcgcc attagtctga 390
<210> 13
<211> 390
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 13
agaatttaac tgtggtcaca tttgctttat cgactggctt catctcacag ctcatcttac 60
gcaagttcga tgagtatgcc agtcactttc aatttggttg aatgttcccg tgacatgcga 120
gttctgtcga ccatgtgccg cggattgaat tcctcaaggg tggtgataga tgctacggtg 180
gtgatgctct ccagcccact cctcatcccc ctcaagccgg tcccaggctg gggtcggagt 240
ccctagtgaa gccaccaata tagtggtcgt gtcaagcaac tgtccacgct ccaccctcga 300
ggtcgtaaca taaacgtact aaggcacgag taaacaagat cgatagcaag aacatggtat 360
agactgacgg agagctcgcc attagtctga 390
<210> 14
<211> 2838
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 14
gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 60
cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 120
gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 180
ttccgcgcac atttccccga aaagtgccac ctaaattgta agcgttaata ttttgttaaa 240
attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa 300
aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc cagtttggaa 360
caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca 420
gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt cgaggtgccg 480
taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc 540
ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc 600
aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca 660
gggcgcgtcc cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc 720
ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt 780
aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgagc gcgcgtaata 840
cgactcacta tagggcgaat tgggtacgat cgatgcggcc tcgcaggcca aagatgtctc 900
ccgcatgcgc tcagtcctca tctccctcaa gcaggccctg ctggtgcact gaagagccac 960
cctgtgcgcg tgatatgcag ctccagcttt tgttcccttt agtgagggtt aattgcgcgc 1020
ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 1080
cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 1140
ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 1200
ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 1260
gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 1320
cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 1380
tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 1440
cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 1500
aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 1560
cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 1620
gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 1680
ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 1740
cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 1800
aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 1860
tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 1920
ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 1980
tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 2040
ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 2100
agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 2160
atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 2220
cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 2280
ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 2340
ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 2400
agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 2460
agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc 2520
gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 2580
cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 2640
gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 2700
tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 2760
tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat 2820
aataccgcgc cacatagc 2838
<210> 15
<211> 2838
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 15
gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 60
cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 120
gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 180
ttccgcgcac atttccccga aaagtgccac ctaaattgta agcgttaata ttttgttaaa 240
attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa 300
aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc cagtttggaa 360
caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca 420
gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt cgaggtgccg 480
taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc 540
ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc 600
aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca 660
gggcgcgtcc cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc 720
ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt 780
aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgagc gcgcgtaata 840
cgactcacta tagggcgaat tgggtacgat cgatgcggcc tcgcagggca aagaggtctc 900
ctgtatgcac tcagtcctca actccctcaa gcaggcgacc cttggtgcac tgacaaaccg 960
ctcctgcgcg tgatatgcag ctccagcttt tgttcccttt agtgagggtt aattgcgcgc 1020
ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 1080
cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 1140
ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 1200
ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 1260
gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 1320
cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 1380
tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 1440
cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 1500
aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 1560
cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 1620
gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 1680
ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 1740
cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 1800
aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 1860
tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 1920
ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 1980
tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 2040
ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 2100
agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 2160
atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 2220
cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 2280
ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 2340
ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 2400
agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 2460
agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc 2520
gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 2580
cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 2640
gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 2700
tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 2760
tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat 2820
aataccgcgc cacatagc 2838
<210> 16
<211> 2838
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 16
gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 60
cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 120
gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 180
ttccgcgcac atttccccga aaagtgccac ctaaattgta agcgttaata ttttgttaaa 240
attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa 300
aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc cagtttggaa 360
caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca 420
gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt cgaggtgccg 480
taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc 540
ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc 600
aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca 660
gggcgcgtcc cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc 720
ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt 780
aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgagc gcgcgtaata 840
cgactcacta tagggcgaat tgggtacgat cgatgcggcc tcaggagagg gagccatgct 900
catctccagc ccactcctca tccccctcaa gccggtccca ggctgagagg ctaaagcttg 960
tctttgcgcg tgatatgcag ctccagcttt tgttcccttt agtgagggtt aattgcgcgc 1020
ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 1080
cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 1140
ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 1200
ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 1260
gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 1320
cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 1380
tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 1440
cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 1500
aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 1560
cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 1620
gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 1680
ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 1740
cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 1800
aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 1860
tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 1920
ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 1980
tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 2040
ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 2100
agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 2160
atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 2220
cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 2280
ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 2340
ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 2400
agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 2460
agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc 2520
gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 2580
cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 2640
gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 2700
tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 2760
tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat 2820
aataccgcgc cacatagc 2838
<210> 17
<211> 2995
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 17
gccgggcaag agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac 60
tcaccagtca cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct 120
gccataacca tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg 180
aaggagctaa ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg 240
gaaccggagc tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgtagca 300
atggcaacaa cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa 360
caattaatag actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt 420
ccggctggct ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc 480
attgcagcac tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg 540
agtcaggcaa ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt 600
aagcattggt aactgtcaga ccaagtttac tcatatatac tttagattga tttaaaactt 660
catttttaat ttaaaaggat ctaggtgaag atcctttttg ataatctcat gaccaaaatc 720
ccttaacgtg agttttcgtt ccactgagcg tcagaccccg tagaaaagat caaaggatct 780
tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa accaccgcta 840
ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc tttttccgaa ggtaactggc 900
ttcagcagag cgcagatacc aaatactgtt cttctagtgt agccgtagtt aggccaccac 960
ttcaagaact ctgtagcacc gccacatacc tcgctctgct aatcctgtta ccagtggctg 1020
cttgccagtg gcgataagtc gtgtcttacc gggttggact caagacgata gttaccggat 1080
aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac agcccagctt ggagcgaacg 1140
acctacaccg aactgagata cctacagcgt gagctatgag aaagcgccac gcttcccgaa 1200
gggagaaagg cggacaggta tccggtaagc ggcagggtcg gaacaggaga gcgcacgagg 1260
gagcttccag ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg ccacctctga 1320
cttgagcgtc gatttttgtg atgctcgtca ggggggcgga gcctatggaa aaacgccagc 1380
aacgcggcct ttttacggtt cctggccttt tgctggcctt ttgctcacat gttctttcct 1440
gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc tgataccgct 1500
cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga agagcgccca 1560
atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt aatgcagctg gcacgacagg 1620
tttcccgact ggaaagcggg cagtgagcgc aacgcaatta atgtgagtta gctcactcat 1680
taggcacccc aggctttaca ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc 1740
ggataacaat ttcacacagg aaacagctat gaccatgatt acgccaagcg cgcaattaac 1800
cctcactaaa gggaacaaaa gctgggtacc gggccccccc tcgacaccag ttgcattcga 1860
ttcctgtttg taattgtcca attcctgcag cccgggggat cggcagatgt agtgtttcca 1920
caggggatcc actagttcta gagcggccgc caccgcggtg gagctccaat tcgccctata 1980
gtgagtcgta ttacgcgcgc tcactggccg tcgttttaca acgtcgtgac tgggaaaacc 2040
ctggcgttac ccaacttaat cgccttgcag cacatccccc tttcgccagc tggcgtaata 2100
gcgaagaggc ccgcaccgat cgcccttccc aacagttgcg cagcctgaat ggcgaatgga 2160
aattgtaagc gttaatattt tgttaaaatt cgcgttaaat ttttgttaaa tcagctcatt 2220
ttttaaccaa taggccgaaa tcggcaaaat cccttataaa tcaaaagaat agaccgagat 2280
agggttgagt gttgttccag tttggaacaa gagtccacta ttaaagaacg tggactccaa 2340
cgtcaaaggg cgaaaaaccg tctatcaggg cgatggccca ctacgtgaac catcacccta 2400
atcaagtttt ttggggtcga ggtgccgtaa agcactaaat cggaacccta aagggagccc 2460
ccgatttaga gcttgacggg gaaagccggc gaacgtggcg agaaaggaag ggaagaaagc 2520
gaaaggagcg ggcgctaggg cgctggcaag tgtagcggtc acgctgcgcg taaccaccac 2580
acccgccgcg cttaatgcgc cgctacaggg cgcgtcaggt ggcacttttc ggggaaatgt 2640
gcgcggaacc cctatttgtt tatttttcta aatacattca aatatgtatc cgctcatgag 2700
acaataaccc tgataaatgc ttcaataata ttgaaaaagg aagagtatga gtattcaaca 2760
tttccgtgtc gcccttattc ccttttttgc ggcattttgc cttcctgttt ttgctcaccc 2820
agaaacgctg gtgaaagtaa aagatgctga agatcagttg ggtgcacgag tgggttacat 2880
cgaactggat ctcaacagcg gtaagatcct tgagagtttt cgccccgaag aacgttttcc 2940
aatgatgagc acttttaaag ttctgctatg tggcgcggta ttatcccgta ttgac 2995
<210> 18
<211> 2838
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 18
gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 60
cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 120
gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 180
ttccgcgcac atttccccga aaagtgccac ctaaattgta agcgttaata ttttgttaaa 240
attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa 300
aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc cagtttggaa 360
caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca 420
gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt cgaggtgccg 480
taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc 540
ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc 600
aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca 660
gggcgcgtcc cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc 720
ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt 780
aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgagc gcgcgtaata 840
cgactcacta tagggcgaat tgggtacgat cgatgcggcc tcaagagctt cactgagtag 900
gattaagata ttgcagatgt agtgtttcca cagggtggct cttcagtgca ccagcggaac 960
ctgctgcgcg tgatatgcag ctccagcttt tgttcccttt agtgagggtt aattgcgcgc 1020
ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 1080
cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 1140
ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 1200
ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 1260
gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 1320
cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 1380
tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 1440
cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 1500
aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 1560
cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 1620
gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 1680
ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 1740
cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 1800
aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 1860
tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 1920
ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 1980
tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 2040
ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 2100
agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 2160
atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 2220
cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 2280
ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 2340
ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 2400
agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 2460
agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc 2520
gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 2580
cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 2640
gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 2700
tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 2760
tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat 2820
aataccgcgc cacatagc 2838
<210> 19
<211> 2838
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 19
gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 60
cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 120
gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 180
ttccgcgcac atttccccga aaagtgccac ctaaattgta agcgttaata ttttgttaaa 240
attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa 300
aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc cagtttggaa 360
caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca 420
gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt cgaggtgccg 480
taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc 540
ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc 600
aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca 660
gggcgcgtcc cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc 720
ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt 780
aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgagc gcgcgtaata 840
cgactcacta tagggcgaat tgggtacgat cgatgcggcc tctctgaata gagttgggaa 900
gagatgcata caacatatgt agtatttcca cagggaatac aatggacaaa tgacctcaag 960
agcaggcgcg tgatatgcag ctccagcttt tgttcccttt agtgagggtt aattgcgcgc 1020
ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 1080
cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 1140
ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 1200
ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 1260
gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 1320
cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 1380
tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 1440
cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 1500
aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 1560
cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 1620
gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 1680
ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 1740
cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 1800
aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 1860
tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 1920
ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 1980
tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 2040
ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 2100
agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 2160
atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 2220
cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 2280
ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 2340
ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 2400
agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 2460
agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc 2520
gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 2580
cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 2640
gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 2700
tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 2760
tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat 2820
aataccgcgc cacatagc 2838
<210> 20
<211> 2838
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 20
gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 60
cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 120
gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 180
ttccgcgcac atttccccga aaagtgccac ctaaattgta agcgttaata ttttgttaaa 240
attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa 300
aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc cagtttggaa 360
caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca 420
gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt cgaggtgccg 480
taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc 540
ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc 600
aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca 660
gggcgcgtcc cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc 720
ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt 780
aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgagc gcgcgtaata 840
cgactcacta tagggcgaat tgggtacgat cgatgcggcc tcgggcagct gcaggaataa 900
gagggatgtg aatggtaatg atggcttcaa catggcgctt gctcttcatt ccctgggtgt 960
agtctgcgcg tgatatgcag ctccagcttt tgttcccttt agtgagggtt aattgcgcgc 1020
ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 1080
cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 1140
ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 1200
ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 1260
gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 1320
cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 1380
tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 1440
cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 1500
aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 1560
cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 1620
gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 1680
ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 1740
cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 1800
aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 1860
tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 1920
ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 1980
tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 2040
ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 2100
agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 2160
atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 2220
cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 2280
ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 2340
ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 2400
agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 2460
agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc 2520
gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 2580
cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 2640
gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 2700
tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 2760
tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat 2820
aataccgcgc cacatagc 2838
<210> 21
<211> 2838
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 21
gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 60
cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 120
gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 180
ttccgcgcac atttccccga aaagtgccac ctaaattgta agcgttaata ttttgttaaa 240
attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa 300
aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc cagtttggaa 360
caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca 420
gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt cgaggtgccg 480
taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc 540
ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc 600
aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca 660
gggcgcgtcc cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc 720
ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt 780
aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgagc gcgcgtaata 840
cgactcacta tagggcgaat tgggtacgat cgatgcggcc tcctccttac tgcagccgaa 900
gtccggcctc aggatgttgt cgatgaaaaa gttggtggtg cggtgcagct gggccgctgg 960
ctgcggcgcg tgatatgcag ctccagcttt tgttcccttt agtgagggtt aattgcgcgc 1020
ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 1080
cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 1140
ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 1200
ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 1260
gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 1320
cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 1380
tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 1440
cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 1500
aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 1560
cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 1620
gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 1680
ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 1740
cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 1800
aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 1860
tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 1920
ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 1980
tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 2040
ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 2100
agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 2160
atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 2220
cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 2280
ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 2340
ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 2400
agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 2460
agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc 2520
gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 2580
cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 2640
gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 2700
tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 2760
tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat 2820
aataccgcgc cacatagc 2838
<210> 22
<211> 2838
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 22
gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 60
cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 120
gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 180
ttccgcgcac atttccccga aaagtgccac ctaaattgta agcgttaata ttttgttaaa 240
attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa 300
aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc cagtttggaa 360
caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca 420
gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt cgaggtgccg 480
taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc 540
ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc 600
aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca 660
gggcgcgtcc cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc 720
ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt 780
aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgagc gcgcgtaata 840
cgactcacta tagggcgaat tgggtacgat cgatgcggcc tcgtcctttc gccggccgaa 900
ctcgggccgc aggatgttgt cgatgaagaa gttggtgatg cggtgcgggt gctggtggtt 960
gccgggcgcg tgatatgcag ctccagcttt tgttcccttt agtgagggtt aattgcgcgc 1020
ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 1080
cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 1140
ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 1200
ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 1260
gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 1320
cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 1380
tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 1440
cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 1500
aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 1560
cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 1620
gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 1680
ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 1740
cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 1800
aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 1860
tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 1920
ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 1980
tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 2040
ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 2100
agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 2160
atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 2220
cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 2280
ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 2340
ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 2400
agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 2460
agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc 2520
gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 2580
cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 2640
gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 2700
tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 2760
tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat 2820
aataccgcgc cacatagc 2838
<210> 23
<211> 2838
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 23
gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 60
cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 120
gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 180
ttccgcgcac atttccccga aaagtgccac ctaaattgta agcgttaata ttttgttaaa 240
attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa 300
aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc cagtttggaa 360
caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca 420
gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt cgaggtgccg 480
taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc 540
ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc 600
aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca 660
gggcgcgtcc cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc 720
ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt 780
aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgagc gcgcgtaata 840
cgactcacta tagggcgaat tgggtacgat cgatgcggcc tcggaacatt ggtaattaaa 900
cttaacgcct cagatttaga cgaaggattg aatggggaca ttgtttattc attctcgaat 960
gatacgcgcg tgatatgcag ctccagcttt tgttcccttt agtgagggtt aattgcgcgc 1020
ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 1080
cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 1140
ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 1200
ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 1260
gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 1320
cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 1380
tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 1440
cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 1500
aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 1560
cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 1620
gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 1680
ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 1740
cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 1800
aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 1860
tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 1920
ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 1980
tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 2040
ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 2100
agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 2160
atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 2220
cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 2280
ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 2340
ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 2400
agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 2460
agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc 2520
gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 2580
cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 2640
gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 2700
tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 2760
tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat 2820
aataccgcgc cacatagc 2838
<210> 24
<211> 2838
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 24
gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga 60
cacggaaatg ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg 120
gttattgtct catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 180
ttccgcgcac atttccccga aaagtgccac ctaaattgta agcgttaata ttttgttaaa 240
attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg aaatcggcaa 300
aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc cagtttggaa 360
caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa ccgtctatca 420
gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt cgaggtgccg 480
taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac ggggaaagcc 540
ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta gggcgctggc 600
aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg cgccgctaca 660
gggcgcgtcc cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc 720
ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt 780
aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgagc gcgcgtaata 840
cgactcacta tagggcgaat tgggtacgat cgatgcggcc tcggaacgct ggtgattcat 900
cccaatgcct cagatttaga cgaaggcttg aatggggata ttatttactc cttctccagt 960
gatgtgcgcg tgatatgcag ctccagcttt tgttcccttt agtgagggtt aattgcgcgc 1020
ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 1080
cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 1140
ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 1200
ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 1260
gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 1320
cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 1380
tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 1440
cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 1500
aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 1560
cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 1620
gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 1680
ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 1740
cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 1800
aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 1860
tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 1920
ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 1980
tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 2040
ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 2100
agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 2160
atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 2220
cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 2280
ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 2340
ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 2400
agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 2460
agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc 2520
gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 2580
cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 2640
gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 2700
tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 2760
tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat 2820
aataccgcgc cacatagc 2838
<210> 25
<211> 56
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 25
aguccucauc ucccucaagc guuuaagagc uaugcuguuu ugaauggucc caaaac 56
<210> 26
<211> 86
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 26
ggaaccauuc aaaacagcau agcaaguuua aauaaggcua guccguuauc aacuuguaaa 60
aguggcaccg agucggugcu uuuuuu 86
<210> 27
<211> 56
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 27
ugguaaugau ggcuucaaca guuuuagagc uaugcuguuu ugaauggucc caaaac 56
<210> 28
<211> 86
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 28
ggaaccauuc aaaacagcau agcaaguuua aauaaggcua guccguuauc aacuuguaaa 60
aguggcaccg agucggugcu uuuuuu 86
<210> 29
<211> 56
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 29
aguccucauc ucccucaagc guuuaagagc uaugcuguuu ugaauggucc caaaac 56
<210> 30
<211> 86
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> misc_feature
<222> (57)..(57)
<223> u is 5-(3-Aminoallyl)-uridine-5'-triphosphate, labeled with Cyanine5
<400> 30
ggaaccauuc aaaacagcau agcaaguuua aauaaggcua guccguuauc aacuuguaaa 60
aguggcaccg agucggugcu uuuuuu 86
<210> 31
<211> 56
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-methyl
<222> (1)..(3)
<220>
<221> 2'-O-methyl
<222> (53)..(55)
<400> 31
ugguaaugau ggcuucaaca guuuuagagc uaugcuguuu ugaauggucc caaaac 56
<210> 32
<211> 86
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl
<222> (1)..(3)
<220>
<221> 2'-O-Methyl
<222> (83)..(85)
<400> 32
ggaaccauuc aaaacagcau agcaaguuua aauaaggcua guccguuauc aacuuguaaa 60
aguggcaccg agucggugcu uuuuuu 86
<210> 33
<211> 56
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl
<222> (1)..(3)
<220>
<221> phosphorothioate internucleotide linkage
<222> (1)..(4)
<220>
<221> 2'-O-Methyl
<222> (53)..(55)
<220>
<221> phosphorothioate internucleotide linkage
<222> (53)..(56)
<400> 33
ugguaaugau ggcuucaaca guuuuagagc uaugcuguuu ugaauggucc caaaac 56
<210> 34
<211> 86
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(3)
<220>
<221> phosphorothioate internucleotide linkage
<222> (1)..(4)
<220>
<221> 2'-O-Methyl nucleotide
<222> (83)..(85)
<220>
<221> phosphorothioate internucleotide linkage
<222> (83)..(86)
<400> 34
ggaaccauuc aaaacagcau agcaaguuua aauaaggcua guccguuauc aacuuguaaa 60
aguggcaccg agucggugcu uuuuuu 86
<210> 35
<211> 56
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(3)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (1)..(4)
<220>
<221> 2'-O-Methyl nucleotide
<222> (53)..(55)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (53)..(56)
<400> 35
ugguaaugau ggcuucaaca guuuuagagc uaugcuguuu ugaauggucc caaaac 56
<210> 36
<211> 86
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(3)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (1)..(4)
<220>
<221> 2'-O-Methyl nucleotide
<222> (83)..(85)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (83)..(86)
<400> 36
ggaaccauuc aaaacagcau agcaaguuua aauaaggcua guccguuauc aacuuguaaa 60
aguggcaccg agucggugcu uuuuuu 86
<210> 37
<211> 56
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(1)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (1)..(2)
<220>
<221> 2'-O-Methyl nucleotide
<222> (55)..(55)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (55)..(56)
<400> 37
ugguaaugau ggcuucaaca guuuuagagc uaugcuguuu ugaauggucc caaaac 56
<210> 38
<211> 86
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(1)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (1)..(2)
<220>
<221> 2'-O-Methyl nucleotide
<222> (85)..(85)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (85)..(86)
<400> 38
ggaaccauuc aaaacagcau agcaaguuua aauaaggcua guccguuauc aacuuguaaa 60
aguggcaccg agucggugcu uuuuuu 86
<210> 39
<211> 56
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2-thiouridine nucleotide
<222> (3)..(3)
<400> 39
aguccucauc ucccucaagc guuuaagagc uaugcuguuu ugaauggucc caaaac 56
<210> 40
<211> 56
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2-thiouridine nucleotide
<222> (9)..(9)
<400> 40
aguccucauc ucccucaagc guuuaagagc uaugcuguuu ugaauggucc caaaac 56
<210> 41
<211> 56
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2-thiouridine nucleotide
<222> (11)..(11)
<400> 41
aguccucauc ucccucaagc guuuaagagc uaugcuguuu ugaauggucc caaaac 56
<210> 42
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 42
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 43
<211> 100
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 43
aguccucauc ucccucaagc guuuuagagc uaguaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 44
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 44
gcagauguag uguuuccaca guuuaagagc uaugcuggaa acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 45
<211> 111
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 45
uccucaucuc ccucaagcgu uuaagagcua ugcugguaac agcauagcaa guuuaaauaa 60
ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg gugcuuuuuu u 111
<210> 46
<211> 110
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 46
ccucaucucc cucaagcguu uaagagcuau gcugguaaca gcauagcaag uuuaaauaag 60
gcuaguccgu uaucaacuug aaaaaguggc accgagucgg ugcuuuuuuu 110
<210> 47
<211> 114
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 47
gaguccucau cucccucaag cguuuaagag cuaugcuggu aacagcauag caaguuuaaa 60
uaaggcuagu ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu uuuu 114
<210> 48
<211> 115
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 48
ggaguccuca ucucccucaa gcguuuaaga gcuaugcugg uaacagcaua gcaaguuuaa 60
auaaggcuag uccguuauca acuugaaaaa guggcaccga gucggugcuu uuuuu 115
<210> 49
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 49
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aauucuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 50
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 50
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaaacuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 51
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 51
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaaacuaguu uguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 52
<211> 111
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 52
ggacuuuuuu uaguccucau cucccucaag cguuuuagag cuagaaauag caaguuaaaa 60
uaaggcuagu ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu u 111
<210> 53
<211> 116
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 53
gaugaggacu uuuuuuaguc cucaucuccc ucaagcguuu uagagcuaga aauagcaagu 60
uaaaauaagg cuaguccguu aucaacuuga aaaaguggca ccgagucggu gcuuuu 116
<210> 54
<211> 111
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 54
gcuuguuuuu uaguccucau cucccucaag cguuuuagag cuagaaauag caaguuaaaa 60
uaaggcuagu ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu u 111
<210> 55
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> a is 5'-dimethoxytrityl-adenosine
<222> (1)..(1)
<400> 55
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 56
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 56
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 57
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> fluorophore
<222> (39)..(39)
<220>
<221> misc_feature
<222> (39)..(39)
<223> n is a, c, g, or u, unknown or other
<400> 57
aguccucauc ucccucaagc guuuaagagc uaugcuggna acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 58
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl
<222> (1)..(3)
<220>
<221> fluorophore
<222> (39)..(39)
<220>
<221> misc_feature
<222> (39)..(39)
<223> n is a, c, g, or u, unknown or other
<220>
<221> 2'-O-Methyl
<222> (110)..(112)
<400> 58
aguccucauc ucccucaagc guuuaagagc uaugcuggna acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 59
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(3)
<220>
<221> phosphorothioate internucleotide linkage
<222> (1)..(4)
<220>
<221> fluorophore
<222> (39)..(39)
<220>
<221> misc_feature
<222> (39)..(39)
<223> n is a, c, g, or u, unknown or other
<220>
<221> 2'-O-Methyl nucleotide
<222> (110)..(112)
<220>
<221> phosphorothioate internucleotide linkage
<222> (110)..(113)
<400> 59
aguccucauc ucccucaagc guuuaagagc uaugcuggna acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 60
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(3)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (1)..(4)
<220>
<221> fluorophore
<222> (39)..(39)
<220>
<221> misc_feature
<222> (39)..(39)
<223> n is a, c, g, or u, unknown or other
<220>
<221> 2'-O-Methyl nucleotide
<222> (109)..(111)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (109)..(112)
<220>
<221> 2'-O-Methyl nucleotide
<222> (110)..(112)
<400> 60
aguccucauc ucccucaagc guuuaagagc uaugcuggna acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 61
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(1)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (1)..(2)
<220>
<221> fluorophore
<222> (2)..(2)
<220>
<221> misc_feature
<222> (2)..(2)
<223> n is a, c, g, or u, unknown or other
<220>
<221> fluorophore
<222> (68)..(68)
<220>
<221> misc_feature
<222> (68)..(68)
<223> n is a, c, g, or u
<220>
<221> fluorophore
<222> (100)..(100)
<220>
<221> misc_feature
<222> (100)..(100)
<223> n is a, c, g, or u
<220>
<221> 2'-O-Methyl nucleotide
<222> (101)..(101)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (101)..(102)
<400> 61
ungcagaugu aguguuucca caguuuaaga gcuaguaaua gcaaguuuaa auaaggcuag 60
uccguuanca acuugaaaaa guggcaccga gucggugcun uu 102
<210> 62
<211> 100
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(1)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (1)..(2)
<220>
<221> fluorophore
<222> (34)..(34)
<220>
<221> misc_feature
<222> (34)..(34)
<223> n is a, c, g, or u, unknown or other
<220>
<221> fluorophore
<222> (74)..(74)
<220>
<221> misc_feature
<222> (74)..(74)
<223> n is a, c, g, or u, unknown or other
<220>
<221> fluorophore
<222> (90)..(90)
<220>
<221> misc_feature
<222> (90)..(90)
<223> n is a, c, g, or u, unknown or other
<220>
<221> 2'-O-Methyl nucleotide
<222> (99)..(99)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (99)..(100)
<400> 62
gcagauguag uguuuccaca guuuaagagc uagnaauagc aaguuuaaau aaggcuaguc 60
cguuaucaac uugnaaaagu ggcaccgagn cggugcuuuu 100
<210> 63
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> phosphorothioate internucleotide linkage
<222> (1)..(3)
<400> 63
aguccucauc ucccucaagc guuuaagagc uaugcuggaa acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 64
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> phosphorothioate internucleotide linkage
<222> (1)..(4)
<400> 64
aguccucauc ucccucaagc guuuaagagc uaugcuggaa acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 65
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> phosphorothioate internucleotide linkage
<222> (1)..(5)
<400> 65
aguccucauc ucccucaagc guuuaagagc uaugcuggaa acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 66
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> phosphorothioate internucleotide linkage
<222> (109)..(113)
<400> 66
aguccucauc ucccucaagc guuuaagagc uaugcuggaa acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 67
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (20)..(20)
<400> 67
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 68
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (19)..(19)
<400> 68
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 69
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (18)..(18)
<400> 69
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 70
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (17)..(17)
<400> 70
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 71
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (17)..(18)
<400> 71
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 72
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(3)
<220>
<221> 2'-O-Methyl nucleotide
<222> (110)..(112)
<400> 72
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 73
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(3)
<220>
<221> 2'-O-Methyl nucleotide
<222> (110)..(112)
<400> 73
gcagauguag uguuuccaca guuuaagagc uaugcuggaa acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 74
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(20)
<400> 74
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 75
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(26)
<400> 75
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 76
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(37)
<400> 76
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 77
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(7)
<220>
<221> 2'-O-Methyl nucleotide
<222> (9)..(11)
<220>
<221> 2'-O-Methyl nucleotide
<222> (13)..(14)
<220>
<221> 2'-O-Methyl nucleotide
<222> (20)..(20)
<220>
<221> 2'-O-Methyl nucleotide
<222> (30)..(31)
<220>
<221> 2'-O-Methyl nucleotide
<222> (33)..(33)
<220>
<221> 2'-O-Methyl nucleotide
<222> (35)..(36)
<220>
<221> 2'-O-Methyl nucleotide
<222> (42)..(42)
<220>
<221> 2'-O-Methyl nucleotide
<222> (45)..(45)
<220>
<221> 2'-O-Methyl nucleotide
<222> (76)..(77)
<220>
<221> 2'-O-Methyl nucleotide
<222> (80)..(82)
<220>
<221> 2'-O-Methyl nucleotide
<222> (90)..(90)
<220>
<221> 2'-O-Methyl nucleotide
<222> (95)..(96)
<220>
<221> 2'-O-Methyl nucleotide
<222> (100)..(101)
<220>
<221> 2'-O-Methyl nucleotide
<222> (104)..(104)
<220>
<221> 2'-O-Methyl nucleotide
<222> (106)..(112)
<400> 77
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 78
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(7)
<220>
<221> 2'-O-Methyl nucleotide
<222> (9)..(11)
<220>
<221> 2'-O-Methyl nucleotide
<222> (17)..(17)
<220>
<221> 2'-O-Methyl nucleotide
<222> (27)..(28)
<220>
<221> 2'-O-Methyl nucleotide
<222> (30)..(30)
<220>
<221> 2'-O-Methyl nucleotide
<222> (32)..(33)
<220>
<221> 2'-O-Methyl nucleotide
<222> (36)..(36)
<220>
<221> 2'-O-Methyl nucleotide
<222> (39)..(39)
<220>
<221> 2'-O-Methyl nucleotide
<222> (42)..(42)
<220>
<221> 2'-O-Methyl nucleotide
<222> (44)..(44)
<220>
<221> 2'-O-Methyl nucleotide
<222> (47)..(47)
<220>
<221> 2'-O-Methyl nucleotide
<222> (57)..(57)
<220>
<221> 2'-O-Methyl nucleotide
<222> (62)..(63)
<220>
<221> 2'-O-Methyl nucleotide
<222> (67)..(68)
<220>
<221> 2'-O-Methyl nucleotide
<222> (73)..(74)
<220>
<221> 2'-O-Methyl nucleotide
<222> (77)..(78)
<220>
<221> 2'-O-Methyl nucleotide
<222> (87)..(87)
<220>
<221> 2'-O-Methyl nucleotide
<222> (90)..(90)
<220>
<221> 2'-O-Methyl nucleotide
<222> (92)..(93)
<220>
<221> 2'-O-Methyl nucleotide
<222> (97)..(98)
<220>
<221> 2'-O-Methyl nucleotide
<222> (101)..(101)
<220>
<221> 2'-O-Methyl nucleotide
<222> (103)..(109)
<400> 78
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 79
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(7)
<220>
<221> 2'-O-Methyl nucleotide
<222> (9)..(11)
<220>
<221> 2'-O-Methyl nucleotide
<222> (17)..(17)
<220>
<221> 2'-O-Methyl nucleotide
<222> (27)..(28)
<220>
<221> 2'-O-Methyl nucleotide
<222> (30)..(30)
<220>
<221> 2'-O-Methyl nucleotide
<222> (32)..(33)
<220>
<221> 2'-O-Methyl nucleotide
<222> (36)..(36)
<220>
<221> 2'-O-Methyl nucleotide
<222> (39)..(39)
<220>
<221> 2'-O-Methyl nucleotide
<222> (42)..(42)
<220>
<221> 2'-O-Methyl nucleotide
<222> (44)..(44)
<220>
<221> 2'-O-Methyl nucleotide
<222> (47)..(47)
<220>
<221> 2'-O-Methyl nucleotide
<222> (57)..(57)
<220>
<221> 2'-O-Methyl nucleotide
<222> (62)..(63)
<220>
<221> 2'-O-Methyl nucleotide
<222> (67)..(68)
<220>
<221> 2'-O-Methyl nucleotide
<222> (73)..(74)
<220>
<221> 2'-O-Methyl nucleotide
<222> (77)..(78)
<220>
<221> 2'-O-Methyl nucleotide
<222> (87)..(87)
<220>
<221> 2'-O-Methyl nucleotide
<222> (90)..(90)
<220>
<221> 2'-O-Methyl nucleotide
<222> (92)..(93)
<220>
<221> 2'-O-Methyl nucleotide
<222> (97)..(98)
<220>
<221> 2'-O-Methyl nucleotide
<222> (101)..(101)
<220>
<221> 2'-O-Methyl nucleotide
<222> (103)..(109)
<400> 79
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 80
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(3)
<220>
<221> 2'-O-Methyl nucleotide
<222> (8)..(8)
<220>
<221> 2'-O-Methyl nucleotide
<222> (17)..(18)
<220>
<221> 2'-O-Methyl nucleotide
<222> (21)..(21)
<220>
<221> 2'-O-Methyl nucleotide
<222> (26)..(26)
<220>
<221> 2'-O-Methyl nucleotide
<222> (28)..(29)
<220>
<221> 2'-O-Methyl nucleotide
<222> (32)..(32)
<220>
<221> 2'-O-Methyl nucleotide
<222> (34)..(34)
<220>
<221> 2'-O-Methyl nucleotide
<222> (37)..(38)
<220>
<221> 2'-O-Methyl nucleotide
<222> (40)..(41)
<220>
<221> 2'-O-Methyl nucleotide
<222> (43)..(44)
<220>
<221> 2'-O-Methyl nucleotide
<222> (46)..(46)
<220>
<221> 2'-O-Methyl nucleotide
<222> (48)..(49)
<220>
<221> 2'-O-Methyl nucleotide
<222> (51)..(52)
<220>
<221> 2'-O-Methyl nucleotide
<222> (58)..(58)
<220>
<221> 2'-O-Methyl nucleotide
<222> (61)..(64)
<220>
<221> 2'-O-Methyl nucleotide
<222> (67)..(67)
<220>
<221> 2'-O-Methyl nucleotide
<222> (78)..(79)
<220>
<221> 2'-O-Methyl nucleotide
<222> (83)..(89)
<220>
<221> 2'-O-Methyl nucleotide
<222> (91)..(92)
<220>
<221> 2'-O-Methyl nucleotide
<222> (94)..(94)
<220>
<221> 2'-O-Methyl nucleotide
<222> (97)..(99)
<220>
<221> 2'-O-Methyl nucleotide
<222> (102)..(103)
<220>
<221> 2'-O-Methyl nucleotide
<222> (105)..(105)
<400> 80
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 81
<211> 100
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(3)
<220>
<221> 2'-O-Methyl nucleotide
<222> (8)..(8)
<220>
<221> 2'-O-Methyl nucleotide
<222> (17)..(18)
<220>
<221> 2'-O-Methyl nucleotide
<222> (21)..(21)
<220>
<221> 2'-O-Methyl nucleotide
<222> (26)..(26)
<220>
<221> 2'-O-Methyl nucleotide
<222> (28)..(29)
<220>
<221> 2'-O-Methyl nucleotide
<222> (32)..(33)
<220>
<221> 2'-O-Methyl nucleotide
<222> (35)..(36)
<220>
<221> 2'-O-Methyl nucleotide
<222> (38)..(39)
<220>
<221> 2'-O-Methyl nucleotide
<222> (41)..(42)
<220>
<221> 2'-O-Methyl nucleotide
<222> (46)..(46)
<220>
<221> 2'-O-Methyl nucleotide
<222> (48)..(48)
<220>
<221> 2'-O-Methyl nucleotide
<222> (51)..(54)
<220>
<221> 2'-O-Methyl nucleotide
<222> (57)..(57)
<220>
<221> 2'-O-Methyl nucleotide
<222> (68)..(69)
<220>
<221> 2'-O-Methyl nucleotide
<222> (73)..(79)
<220>
<221> 2'-O-Methyl nucleotide
<222> (81)..(82)
<220>
<221> 2'-O-Methyl nucleotide
<222> (84)..(84)
<220>
<221> 2'-O-Methyl nucleotide
<222> (87)..(89)
<220>
<221> 2'-O-Methyl nucleotide
<222> (92)..(93)
<220>
<221> 2'-O-Methyl nucleotide
<222> (95)..(95)
<400> 81
aguccucauc ucccucaagc guuuuagagc uaguaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 82
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(3)
<220>
<221> 2'-O-Methyl nucleotide
<222> (110)..(112)
<400> 82
gcagauguag uguuuccaca guuuaagagc uaugcuggaa acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 83
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(3)
<220>
<221> 2'-O-Methyl nucleotide
<222> (6)..(6)
<220>
<221> 2'-O-Methyl nucleotide
<222> (8)..(8)
<220>
<221> 2'-O-Methyl nucleotide
<222> (11)..(11)
<220>
<221> 2'-O-Methyl nucleotide
<222> (13)..(17)
<220>
<221> 2'-O-Methyl nucleotide
<222> (30)..(31)
<220>
<221> 2'-O-Methyl nucleotide
<222> (33)..(33)
<220>
<221> 2'-O-Methyl nucleotide
<222> (35)..(36)
<220>
<221> 2'-O-Methyl nucleotide
<222> (39)..(39)
<220>
<221> 2'-O-Methyl nucleotide
<222> (42)..(42)
<220>
<221> 2'-O-Methyl nucleotide
<222> (45)..(45)
<220>
<221> 2'-O-Methyl nucleotide
<222> (47)..(47)
<220>
<221> 2'-O-Methyl nucleotide
<222> (50)..(50)
<220>
<221> 2'-O-Methyl nucleotide
<222> (56)..(56)
<220>
<221> 2'-O-Methyl nucleotide
<222> (60)..(60)
<220>
<221> 2'-O-Methyl nucleotide
<222> (65)..(66)
<220>
<221> 2'-O-Methyl nucleotide
<222> (69)..(71)
<220>
<221> 2'-O-Methyl nucleotide
<222> (76)..(77)
<220>
<221> 2'-O-Methyl nucleotide
<222> (80)..(82)
<220>
<221> 2'-O-Methyl nucleotide
<222> (90)..(90)
<220>
<221> 2'-O-Methyl nucleotide
<222> (93)..(93)
<220>
<221> 2'-O-Methyl nucleotide
<222> (95)..(96)
<220>
<221> 2'-O-Methyl nucleotide
<222> (100)..(101)
<220>
<221> 2'-O-Methyl nucleotide
<222> (104)..(104)
<220>
<221> 2'-O-Methyl nucleotide
<222> (106)..(112)
<400> 83
gcagauguag uguuuccaca guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 84
<211> 100
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(5)
<220>
<221> 2'-O-Methyl nucleotide
<222> (26)..(29)
<220>
<221> 2'-O-Methyl nucleotide
<222> (32)..(33)
<220>
<221> 2'-O-Methyl nucleotide
<222> (35)..(36)
<220>
<221> 2'-O-Methyl nucleotide
<222> (38)..(39)
<220>
<221> 2'-O-Methyl nucleotide
<222> (41)..(42)
<220>
<221> 2'-O-Methyl nucleotide
<222> (46)..(46)
<220>
<221> 2'-O-Methyl nucleotide
<222> (48)..(49)
<220>
<221> 2'-O-Methyl nucleotide
<222> (52)..(54)
<220>
<221> 2'-O-Methyl nucleotide
<222> (57)..(57)
<220>
<221> 2'-O-Methyl nucleotide
<222> (68)..(69)
<220>
<221> 2'-O-Methyl nucleotide
<222> (73)..(79)
<220>
<221> 2'-O-Methyl nucleotide
<222> (81)..(82)
<220>
<221> 2'-O-Methyl nucleotide
<222> (84)..(84)
<220>
<221> 2'-O-Methyl nucleotide
<222> (87)..(89)
<220>
<221> 2'-O-Methyl nucleotide
<222> (92)..(93)
<220>
<221> 2'-O-Methyl nucleotide
<222> (95)..(95)
<400> 84
gcagauguag uguuuccaca guuuuagagc uaguaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 85
<211> 100
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(3)
<220>
<221> 2'-O-Methyl nucleotide
<222> (6)..(6)
<220>
<221> 2'-O-Methyl nucleotide
<222> (8)..(8)
<220>
<221> 2'-O-Methyl nucleotide
<222> (11)..(11)
<220>
<221> 2'-O-Methyl nucleotide
<222> (13)..(17)
<220>
<221> 2'-O-Methyl nucleotide
<222> (25)..(25)
<220>
<221> 2'-O-Methyl nucleotide
<222> (30)..(31)
<220>
<221> 2'-O-Methyl nucleotide
<222> (34)..(34)
<220>
<221> 2'-O-Methyl nucleotide
<222> (37)..(37)
<220>
<221> 2'-O-Methyl nucleotide
<222> (40)..(40)
<220>
<221> 2'-O-Methyl nucleotide
<222> (50)..(50)
<220>
<221> 2'-O-Methyl nucleotide
<222> (55)..(56)
<220>
<221> 2'-O-Methyl nucleotide
<222> (59)..(61)
<220>
<221> 2'-O-Methyl nucleotide
<222> (66)..(67)
<220>
<221> 2'-O-Methyl nucleotide
<222> (70)..(72)
<220>
<221> 2'-O-Methyl nucleotide
<222> (80)..(80)
<220>
<221> 2'-O-Methyl nucleotide
<222> (83)..(83)
<220>
<221> 2'-O-Methyl nucleotide
<222> (85)..(86)
<220>
<221> 2'-O-Methyl nucleotide
<222> (90)..(91)
<220>
<221> 2'-O-Methyl nucleotide
<222> (94)..(94)
<220>
<221> 2'-O-Methyl nucleotide
<222> (96)..(99)
<400> 85
gcagauguag uguuuccaca guuuuagagc uaguaauagc aaguuaaaau aaggcuaguc 60
cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100
<210> 86
<211> 113
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-deoxy-nucleotide
<222> (1)..(20)
<400> 86
agtcctcatc tccctcaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 87
<211> 113
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-deoxy-nucleotide
<222> (1)..(26)
<400> 87
agtcctcatc tccctcaagc gtttaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 88
<211> 113
<212> DNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-deoxy-nucleotide
<222> (1)..(37)
<400> 88
agtcctcatc tccctcaagc gtttaagagc tatgctggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 89
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-deoxy-nucleotide
<222> (15)..(15)
<220>
<221> phosphonoacetate internucleotide linkage
<222> (15)..(16)
<400> 89
gcagauguag uguuuccaca guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 90
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(1)
<220>
<221> phosphonoacetate internucleotide linkage
<222> (1)..(2)
<400> 90
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 91
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(2)
<220>
<221> phosphonoacetate internucleotide linkage
<222> (1)..(3)
<400> 91
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 92
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(3)
<220>
<221> phosphonoacetate internucleotide linkage
<222> (1)..(4)
<400> 92
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 93
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(4)
<220>
<221> phosphonoacetate internucleotide linkage
<222> (1)..(5)
<400> 93
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 94
<211> 115
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(5)
<220>
<221> phosphonoacetate internucleotide linkage
<222> (1)..(6)
<400> 94
ggaguccuca ucucccucaa gcguuuaaga gcuaugcugg uaacagcaua gcaaguuuaa 60
auaaggcuag uccguuauca acuugaaaaa guggcaccga gucggugcuu uuuuu 115
<210> 95
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (109)..(112)
<220>
<221> phosphonoacetate internucleotide linkage
<222> (109)..(113)
<400> 95
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 96
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (108)..(112)
<220>
<221> phosphonoacetate internucleotide linkage
<222> (108)..(113)
<400> 96
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 97
<211> 114
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 5'-overhang (5' to the 20-nt guide sequence)
<222> (1)..(1)
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(3)
<220>
<221> phosphonoacetate internucleotide linkage
<222> (1)..(4)
<400> 97
caguccucau cucccucaag cguuuaagag cuaugcuggu aacagcauag caaguuuaaa 60
uaaggcuagu ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu uuuu 114
<210> 98
<211> 114
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 5'-overhang (5' to the 20-nt guide sequence)
<222> (1)..(1)
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(3)
<220>
<221> phosphonoacetate internucleotide linkage
<222> (1)..(4)
<400> 98
gaguccucau cucccucaag cguuuaagag cuaugcuggu aacagcauag caaguuuaaa 60
uaaggcuagu ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu uuuu 114
<210> 99
<211> 115
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 5'-overhang (5' to the 20-nt guide sequence)
<222> (1)..(2)
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(5)
<220>
<221> phosphonoacetate internucleotide linkage
<222> (1)..(6)
<400> 99
ucaguccuca ucucccucaa gcguuuaaga gcuaugcugg uaacagcaua gcaaguuuaa 60
auaaggcuag uccguuauca acuugaaaaa guggcaccga gucggugcuu uuuuu 115
<210> 100
<211> 115
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 5'-overhang (5' to the 20-nt guide sequence)
<222> (1)..(2)
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(5)
<220>
<221> phosphonoacetate internucleotide linkage
<222> (1)..(6)
<400> 100
agaguccuca ucucccucaa gcguuuaaga gcuaugcugg uaacagcaua gcaaguuuaa 60
auaaggcuag uccguuauca acuugaaaaa guggcaccga gucggugcuu uuuuu 115
<210> 101
<211> 116
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 5'-overhang (5' to the 20-nt guide sequence)
<222> (1)..(3)
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(7)
<220>
<221> phosphonoacetate internucleotide linkage
<222> (1)..(8)
<220>
<221> 2'-O-Methyl nucleotide
<222> (112)..(115)
<220>
<221> phosphonoacetate internucleotide linkage
<222> (112)..(116)
<400> 101
cucaguccuc aucucccuca agcguuuaag agcuaugcug guaacagcau agcaaguuua 60
aauaaggcua guccguuauc aacuugaaaa aguggcaccg agucggugcu uuuuuu 116
<210> 102
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (20)..(20)
<220>
<221> phosphonoacetate internucleotide linkage
<222> (20)..(21)
<400> 102
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 103
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (19)..(20)
<220>
<221> phosphonoacetate internucleotide linkage
<222> (19)..(20)
<400> 103
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 104
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (18)..(18)
<220>
<221> phosphonoacetate internucleotide linkage
<222> (18)..(19)
<400> 104
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 105
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (17)..(17)
<220>
<221> phosphonoacetate internucleotide linkage
<222> (17)..(18)
<400> 105
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 106
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (17)..(18)
<220>
<221> phosphonoacetate internucleotide linkage
<222> (17)..(19)
<400> 106
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 107
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(3)
<220>
<221> phosphorothioate internucleotide linkage
<222> (1)..(4)
<220>
<221> 2'-O-Methyl nucleotide
<222> (110)..(112)
<220>
<221> phosphorothioate internucleotide linkage
<222> (110)..(113)
<400> 107
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 108
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(3)
<220>
<221> phosphorothioate internucleotide linkage
<222> (1)..(4)
<220>
<221> 2'-O-Methyl nucleotide
<222> (108)..(112)
<220>
<221> phosphorothioate internucleotide linkage
<222> (108)..(113)
<400> 108
gcagauguag uguuuccaca guuuaagagc uaugcuggaa acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 109
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(5)
<220>
<221> phosphorothioate internucleotide linkage
<222> (1)..(6)
<220>
<221> 2'-O-Methyl nucleotide
<222> (108)..(112)
<220>
<221> phosphorothioate internucleotide linkage
<222> (108)..(113)
<400> 109
gcagauguag uguuuccaca guuuaagagc uaugcuggaa acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 110
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(1)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (1)..(2)
<220>
<221> 2'-O-Methyl nucleotide
<222> (110)..(112)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (110)..(113)
<400> 110
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 111
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..1)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (1)..(2)
<220>
<221> 2'-O-Methyl nucleotide
<222> (112)..(112)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (112)..(113)
<400> 111
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 112
<211> 75
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(3)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (1)..(4)
<220>
<221> 2'-O-Methyl nucleotide
<222> (72)..(74)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (72)..(75)
<400> 112
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuu 75
<210> 113
<211> 77
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(1)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (1)..(2)
<220>
<221> 2'-O-Methyl nucleotide
<222> (76)..(76)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (76)..(77)
<400> 113
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuauc 77
<210> 114
<211> 78
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(1)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (1)..(2)
<220>
<221> 2'-O-Methyl nucleotide
<222> (77)..(77)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (77)..(78)
<400> 114
gaguccucau cucccucaag cguuuaagag cuaugcuggu aacagcauag caaguuuaaa 60
uaaggcuagu ccguuauc 78
<210> 115
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(3)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (1)..(4)
<220>
<221> 2'-O-Methyl nucleotide
<222> (110)..(112)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (110)..(113)
<400> 115
gcagauguag uguuuccaca guuuaagagc uaugcuggaa acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 116
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(1)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (1)..(2)
<220>
<221> 2'-O-Methyl nucleotide
<222> (112)..(112)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (112)..(113)
<400> 116
gcagauguag uguuuccaca guuuaagagc uaugcuggaa acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 117
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 117
gauguugucg augaaaaagu guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 118
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2-aminoadenosine
<222> (15)..(15)
<400> 118
gauguugucg augaaaaagu guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 119
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<400> 119
gauuuagacg aaggauugaa guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 120
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2-aminoadenosine
<222> (15)..(15)
<400> 120
gauuuagacg aaggauugaa guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 121
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 5-methylUridine
<222> (6)..(6)
<220>
<221> 5-methylUridine
<222> (8)..(8)
<220>
<221> 5-methylUridine
<222> (11)..(11)
<220>
<221> 5-methylUridine
<222> (13)..(15)
<220>
<221> 5-methylUridine
<222> (31)..(31)
<220>
<221> 5-methylUridine
<222> (33)..(33)
<220>
<221> 5-methylUridine
<222> (36)..(36)
<220>
<221> 5-methylUridine
<222> (39)..(39)
<220>
<221> 5-methylUridine
<222> (47)..(47)
<220>
<221> 5-methylUridine
<222> (81)..(82)
<220>
<221> 5-methylUridine
<222> (90)..(90)
<220>
<221> 5-methylUridine
<222> (104)..(104)
<220>
<221> 5-methylUridine
<222> (107)..(112)
<400> 121
gcagauguag uguuuccaca guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 122
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> Z base
<222> (70)..(71)
<223> Z base
<220>
<221> misc_feature
<222> (70)..(71)
<223> n is a, c, g, or u, or unknown or other
<400> 122
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuagun nguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu uuu 113
<210> 123
<211> 100
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(1)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (1)..(2)
<220>
<221> 2'-O-Methyl-nucleotide
<222> (54)..(54)
<220>
<221> 2'-O-Methyl-nucleotide
<222> (57)..(57)
<220>
<221> 2'-O-Methyl nucleotide
<222> (99)..(99)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (99)..(100)
<400> 123
aguccucauc ucccucaagc guuuaagagc uaguaauagc aaguuuaaau aagguuaauc 60
cguuaucaac aagaaauugu ggcaccgagu cggugcuuuu 100
<210> 124
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(1)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (1)..(2)
<220>
<221> 2'-O-Methyl-nucleotide
<222> (64)..(64)
<220>
<221> 2'-O-Methyl-nucleotide
<222> (67)..(67)
<220>
<221> 2'-O-Methyl nucleotide
<222> (112)..(112)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (112)..(113)
<400> 124
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aagguuaauc cguuaucaac aagaaauugu ggcaccgagu cggugcuuuu uuu 113
<210> 125
<211> 113
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> Z base
<222> (95)..(96)
<223> Z base
<220>
<221> misc_feature
<222> (95)..(96)
<223> n is a, c, g, or u, or unknown or other
<400> 125
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguuaucaac uugaaaaagu ggcanngagu cggugcuuuu uuu 113
<210> 126
<211> 74
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(1)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (1)..(2)
<220>
<221> 2'-O-Methyl nucleotide
<222> (73)..(73)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (73)..(74)
<400> 126
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguu 74
<210> 127
<211> 75
<212> RNA
<213> Artificial Sequence
<220>
<223> synthetic construct
<220>
<221> 2'-O-Methyl nucleotide
<222> (1)..(1)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (1)..(2)
<220>
<221> 2'-O-Methyl nucleotide
<222> (74)..(74)
<220>
<221> thiophosphonoacetate internucleotide linkage
<222> (74)..(75)
<400> 127
aguccucauc ucccucaagc guuuaagagc uaugcuggua acagcauagc aaguuuaaau 60
aaggcuaguc cguua 75
Claims (29)
- (a) (i) 폴리뉴클레오타이드 중 표적 서열에 하이브리드화할 수 있는 가이드 서열, 및 (ii) 줄기 서열을 포함하는 crRNA 분절; 및
(b) 상기 줄기 서열에 부분적으로 또는 전적으로 상보성인 뉴클레오타이드 서열을 포함하는 tracrRNA 분절
을 포함하되,
5' 단부, 3' 단부, 또는 5' 단부 및 3' 단부 둘다로부터 5개 뉴클레오타이드 내에, 2'-O-메틸, Z 염기, 2-티오유라실(2-티오U), 5-메틸유리딘, 2-아미노아데닌, 포스포로티오에이트 뉴클레오타이드간 결합, 포스포노아세테이트(PACE) 뉴클레오타이드간 결합, 티오포스포노아세테이트(티오PACE) 뉴클레오타이드간 결합, 3'-포스포로티오에이트기를 갖는 2'-O-메틸 뉴클레오타이드, 3'-포스포노아세테이트기를 갖는 2'-O-메틸 뉴클레오타이드, 3'-티오포스포노아세테이트기를 갖는 2'-O-메틸 뉴클레오타이드 및 3'-포스포노아세테이트기를 갖는 2'-데옥시 뉴클레오타이드로 이루어진 군 중에서 선택되는 하나 이상의 변형을 포함하고, gRNA 기능성을 갖는 합성 가이드 RNA. - 제 1 항에 있어서,
변형 중 하나 이상이 안정성-증대 변형을 포함하는, 합성 가이드 RNA. - 제 2 항에 있어서,
안정성-증대 변형 중 하나 이상이 가이드 서열 중에 위치하는, 합성 가이드 RNA. - 제 2 항에 있어서,
안정성-증대 변형이 2'-O-메틸, Z 염기, 포스포로티오에이트 뉴클레오타이드간 결합, 포스포노아세테이트(PACE) 뉴클레오타이드간 결합, 또는 티오포스포노아세테이트(티오PACE) 뉴클레오타이드간 결합, 또는 이들의 조합을 포함하는, 합성 가이드 RNA. - 제 1 항에 있어서,
가이드 RNA의 5' 단부에 26개 미만의 연속적인 2'-O-메틸 변형된 뉴클레오타이드를 포함하는 합성 가이드 RNA. - 제 1 항에 있어서,
합성 가이드 RNA 중 시토신을 대체하는 Z 염기를 포함하는 합성 가이드 RNA. - 제 1 항에 있어서,
잠재적인 표적-외 서열과의 U-G 동요(wobble) 짝짓기에 관여할 수 있는 유리딘에 상응하는 위치에 하나 이상의 2-티오유라실을 포함하는 합성 가이드 RNA. - 제 1 항에 있어서,
하나 이상의 변형이 3'-포스포로티오에이트기를 갖는 2'-O-메틸 뉴클레오타이드, 3'-포스포노아세테이트기를 갖는 2'-O-메틸 뉴클레오타이드, 3'-티오포스포노아세테이트기를 갖는 2'-O-메틸 뉴클레오타이드, 및 3'-포스포노아세테이트기를 갖는 2'-데옥시 뉴클레오타이드로 이루어진 군 중에서 선택되는 합성 가이드 RNA. - 제 1 항에 있어서,
2개 이상의 변형을 포함하는 합성 가이드 RNA. - 제 1 항에 있어서,
50개 이하의 변형을 포함하는 합성 가이드 RNA. - 제 1 항에 있어서,
단일 RNA 가닥 또는 2개의 별도의 RNA 가닥을 포함하는 합성 가이드 RNA. - 제 11 항에 있어서,
5' 단부, 3' 단부, 또는 5' 및 3' 단부 각각에 7개 이하의 연속적인 변형된 뉴클레오타이드를 포함하는 합성 가이드 RNA. - 제 12 항에 있어서,
5' 단부, 3' 단부, 및 줄기-고리 중 하나 이상에 하나 이상의 5-메틸유리딘 뉴클레오타이드를 포함하는 합성 가이드 RNA. - 제 1 항에 있어서,
변형 중 하나 이상이 염기-짝짓기 열안정성을 변경시키는 하나 이상의 변형을 포함하는, 합성 가이드 RNA. - 제 14 항에 있어서,
염기-짝짓기 열안정성을 변경시키는 변형 중 하나 이상이 염기-짝짓기 열안정성을 증대시키는, 합성 가이드 RNA. - 제 15 항에 있어서,
염기-짝짓기 열안정성을 증대시키는 변형 중 하나 이상이 2'-O-메틸, 2-티오유라실(2-티오U), 5-메틸유리딘, 및 2-아미노아데닌 중에서 독립적으로 선택되는, 합성 가이드 RNA. - 제 15 항에 있어서,
염기-짝짓기 열안정성을 변경시키는 변형 중 하나 이상이 염기-짝짓기 열안정성을 감소시키는, 합성 가이드 RNA. - 제 17 항에 있어서,
염기-짝짓기 열안정성을 감소시키는 변형 중 하나 이상이 2-티오유라실, 포스포로티오에이트 뉴클레오타이드간 결합, 포스포노아세테이트 뉴클레오타이드간 결합, 및 티오포스포노아세테이트 뉴클레오타이드간 결합 중에서 독립적으로 선택되는, 합성 가이드 RNA. - 제 1 항에 있어서,
하나 이상의 2'-O-메틸-A-2'-O-메틸-U 염기쌍을 포함하는 합성 가이드 RNA. - 제 1 항에 있어서,
변형 중 하나 이상이 특이성-변경 변형을 포함하는, 합성 가이드 RNA. - 제 20 항에 있어서,
특이성-변경 변형이 가이드 서열 중에 위치하는, 합성 가이드 RNA. - 제 21 항에 있어서,
특이성-변경 변형이 2'-O-메틸, 2-티오유라실, 5-메틸유리딘, 2-아미노아데닌, 포스포로티오에이트 뉴클레오타이드간 결합, 포스포노아세테이트 뉴클레오타이드간 결합, 티오포스포노아세테이트 뉴클레오타이드간 결합 또는 이들의 조합을 포함하는, 합성 가이드 RNA. - 제 1 항에 있어서,
형광 염료 또는 표지를 포함하는 합성 가이드 RNA. - 제 23 항에 있어서,
형광 염료 또는 표지가 합성 가이드 RNA의 줄기-고리에 결합된, 합성 가이드 RNA. - DNA 서열, 관심 유전자 또는 표적 폴리뉴클레오타이드를 크리스퍼(CRISPR)-연관된 단백질 및 제 1 항 내지 제 24 항 중 어느 한 항에 따른 합성 가이드 RNA와 접촉시키고, 상기 DNA 서열, 상기 관심 유전자 또는 상기 표적 폴리뉴클레오타이드를 편집하거나 조절하거나 절단함을 포함하는, DNA 서열을 변형시키기 위해 게놈을 편집하거나 관심 유전자 발현을 조절하거나 표적 폴리뉴클레오타이드를 절단하는 시험관내 방법.
- 제 25 항에 있어서,
합성 가이드 RNA가 가이드 서열 전체를 통해 15개 이상의 2'-O-메틸 변형을 포함하는, 시험관내에서 수행되는 방법. - 제 1 항 내지 제 24 항 중 어느 한 항에 따른 2개 이상의 합성 가이드 RNA를 포함하는 RNA 분자의 세트.
- 제 1 항 내지 제 24 항 중 어느 한 항에 따른 합성 가이드 RNA를 포함하는 키트.
- 삭제
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020247002012A KR20240013283A (ko) | 2014-12-03 | 2015-12-03 | 화학적 변형을 갖는 가이드 rna |
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462087211P | 2014-12-03 | 2014-12-03 | |
US62/087,211 | 2014-12-03 | ||
US201562146189P | 2015-04-10 | 2015-04-10 | |
US62/146,189 | 2015-04-10 | ||
US201562256095P | 2015-11-16 | 2015-11-16 | |
US62/256,095 | 2015-11-16 | ||
PCT/US2015/000143 WO2016089433A1 (en) | 2014-12-03 | 2015-12-03 | Guide rna with chemical modifications |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020247002012A Division KR20240013283A (ko) | 2014-12-03 | 2015-12-03 | 화학적 변형을 갖는 가이드 rna |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20170084334A KR20170084334A (ko) | 2017-07-19 |
KR102629128B1 true KR102629128B1 (ko) | 2024-01-25 |
Family
ID=56092183
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020177018311A KR102629128B1 (ko) | 2014-12-03 | 2015-12-03 | 화학적 변형을 갖는 가이드 rna |
KR1020247002012A KR20240013283A (ko) | 2014-12-03 | 2015-12-03 | 화학적 변형을 갖는 가이드 rna |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020247002012A KR20240013283A (ko) | 2014-12-03 | 2015-12-03 | 화학적 변형을 갖는 가이드 rna |
Country Status (8)
Country | Link |
---|---|
US (4) | US10900034B2 (ko) |
EP (1) | EP3227447B1 (ko) |
JP (2) | JP7068821B2 (ko) |
KR (2) | KR102629128B1 (ko) |
CN (1) | CN107250148B (ko) |
AU (1) | AU2015355546B2 (ko) |
CA (1) | CA2969619A1 (ko) |
WO (1) | WO2016089433A1 (ko) |
Families Citing this family (140)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6261500B2 (ja) | 2011-07-22 | 2018-01-17 | プレジデント アンド フェローズ オブ ハーバード カレッジ | ヌクレアーゼ切断特異性の評価および改善 |
US20150044192A1 (en) | 2013-08-09 | 2015-02-12 | President And Fellows Of Harvard College | Methods for identifying a target site of a cas9 nuclease |
US9359599B2 (en) | 2013-08-22 | 2016-06-07 | President And Fellows Of Harvard College | Engineered transcription activator-like effector (TALE) domains and uses thereof |
US9388430B2 (en) | 2013-09-06 | 2016-07-12 | President And Fellows Of Harvard College | Cas9-recombinase fusion proteins and uses thereof |
US9526784B2 (en) | 2013-09-06 | 2016-12-27 | President And Fellows Of Harvard College | Delivery system for functional nucleases |
US9340799B2 (en) | 2013-09-06 | 2016-05-17 | President And Fellows Of Harvard College | MRNA-sensing switchable gRNAs |
US9840699B2 (en) | 2013-12-12 | 2017-12-12 | President And Fellows Of Harvard College | Methods for nucleic acid editing |
CA3075047C (en) | 2014-02-11 | 2022-02-01 | The Regents Of The University Of Colorado, A Body Corporate | Crispr enable method for multiplex genome editing |
WO2016022363A2 (en) | 2014-07-30 | 2016-02-11 | President And Fellows Of Harvard College | Cas9 proteins including ligand-dependent inteins |
WO2016089433A1 (en) | 2014-12-03 | 2016-06-09 | Agilent Technologies, Inc. | Guide rna with chemical modifications |
EP3712269A1 (en) | 2014-12-17 | 2020-09-23 | ProQR Therapeutics II B.V. | Targeted rna editing |
US9840702B2 (en) | 2014-12-18 | 2017-12-12 | Integrated Dna Technologies, Inc. | CRISPR-based compositions and methods of use |
CN107532168A (zh) | 2015-02-23 | 2018-01-02 | 克里斯珀医疗股份公司 | 治疗血红蛋白病的材料和方法 |
EP3280803B1 (en) | 2015-04-06 | 2021-05-26 | The Board of Trustees of the Leland Stanford Junior University | Chemically modified guide rnas for crispr/cas-mediated gene regulation |
US11279928B2 (en) | 2015-06-29 | 2022-03-22 | Massachusetts Institute Of Technology | Compositions comprising nucleic acids and methods of using the same |
WO2017004261A1 (en) * | 2015-06-29 | 2017-01-05 | Ionis Pharmaceuticals, Inc. | Modified crispr rna and modified single crispr rna and uses thereof |
EP3328399B1 (en) | 2015-07-31 | 2023-12-27 | Regents of the University of Minnesota | Modified cells and methods of therapy |
WO2017053729A1 (en) | 2015-09-25 | 2017-03-30 | The Board Of Trustees Of The Leland Stanford Junior University | Nuclease-mediated genome editing of primary cells and enrichment thereof |
EP3159407A1 (en) * | 2015-10-23 | 2017-04-26 | Silence Therapeutics (London) Ltd | Guide rnas, methods and uses |
US20190225955A1 (en) | 2015-10-23 | 2019-07-25 | President And Fellows Of Harvard College | Evolved cas9 proteins for gene editing |
US11845933B2 (en) | 2016-02-03 | 2023-12-19 | Massachusetts Institute Of Technology | Structure-guided chemical modification of guide RNA and its applications |
US10767175B2 (en) | 2016-06-08 | 2020-09-08 | Agilent Technologies, Inc. | High specificity genome editing using chemically modified guide RNAs |
WO2017220751A1 (en) | 2016-06-22 | 2017-12-28 | Proqr Therapeutics Ii B.V. | Single-stranded rna-editing oligonucleotides |
LT3474669T (lt) | 2016-06-24 | 2022-06-10 | The Regents Of The University Of Colorado, A Body Corporate | Barkodu pažymėtų kombinatorinių bibliotekų generavimo būdai |
KR102547316B1 (ko) | 2016-08-03 | 2023-06-23 | 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 | 아데노신 핵염기 편집제 및 그의 용도 |
AU2017308889B2 (en) | 2016-08-09 | 2023-11-09 | President And Fellows Of Harvard College | Programmable Cas9-recombinase fusion proteins and uses thereof |
EP3500671A4 (en) * | 2016-08-17 | 2020-07-29 | The Broad Institute, Inc. | NEW CRISPR ENZYMS AND SYSTEMS |
US11542509B2 (en) | 2016-08-24 | 2023-01-03 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
PL3507366T3 (pl) | 2016-09-01 | 2021-05-04 | Proqr Therapeutics Ii B.V. | Chemicznie modyfikowane jednoniciowe oligonukleotydy edytujące rna |
US11306305B2 (en) | 2016-09-23 | 2022-04-19 | Board Of Trustees Of Southern Illinois University | Tuning CRISPR/Cas9 activity with chemically modified nucleotide substitutions |
WO2018055577A1 (en) * | 2016-09-23 | 2018-03-29 | Synthena Ag | Mixed tricyclo-dna, 2'-modified rna oligonucleotide compositions and uses thereof |
CA3037663A1 (en) | 2016-09-23 | 2018-03-29 | Synthena Ag | Mixed tricyclo-dna, 2'-modified-rna oligonucleotide compositions and uses thereof |
US10669539B2 (en) * | 2016-10-06 | 2020-06-02 | Pioneer Biolabs, Llc | Methods and compositions for generating CRISPR guide RNA libraries |
US11242542B2 (en) | 2016-10-07 | 2022-02-08 | Integrated Dna Technologies, Inc. | S. pyogenes Cas9 mutant genes and polypeptides encoded by same |
CA3039409A1 (en) | 2016-10-07 | 2018-04-12 | Integrated Dna Technologies, Inc. | S. pyogenes cas9 mutant genes and polypeptides encoded by same |
KR20240007715A (ko) | 2016-10-14 | 2024-01-16 | 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 | 핵염기 에디터의 aav 전달 |
WO2018075664A1 (en) | 2016-10-18 | 2018-04-26 | Regents Of The University Of Minnesota | Tumor infiltrating lymphocytes and methods of therapy |
EP3315125A1 (en) | 2016-10-31 | 2018-05-02 | Silence Therapeutics (London) Ltd | Lipid nanoparticle formulation |
US11732258B2 (en) | 2016-11-02 | 2023-08-22 | President And Fellows Of Harvard College | Engineered guide RNA sequences for in situ detection and sequencing |
KR20190089175A (ko) * | 2016-11-18 | 2019-07-30 | 진에딧 인코포레이티드 | 표적 핵산 변형을 위한 조성물 및 방법 |
EP4321617A3 (en) | 2016-11-22 | 2024-04-24 | Integrated DNA Technologies Inc. | Crispr/cpf1 systems and methods |
WO2018107028A1 (en) * | 2016-12-08 | 2018-06-14 | Intellia Therapeutics, Inc. | Modified guide rnas |
WO2018111947A1 (en) | 2016-12-12 | 2018-06-21 | Integrated Dna Technologies, Inc. | Genome editing enhancement |
WO2018118587A1 (en) * | 2016-12-22 | 2018-06-28 | Agenovir Corporation | Modified polynucleotides for antiviral therapy |
AU2017379073B2 (en) * | 2016-12-22 | 2023-12-14 | Intellia Therapeutics, Inc. | Compositions and methods for treating alpha-1 antitrypsin deficiency |
US10745677B2 (en) | 2016-12-23 | 2020-08-18 | President And Fellows Of Harvard College | Editing of CCR5 receptor gene to protect against HIV infection |
CA3047330A1 (en) * | 2016-12-28 | 2018-07-05 | Ionis Pharmaceuticals, Inc. | Modified crispr rna and uses thereof |
EP3571300A1 (en) | 2017-01-19 | 2019-11-27 | ProQR Therapeutics II B.V. | Oligonucleotide complexes for use in rna editing |
US20180258485A1 (en) * | 2017-03-07 | 2018-09-13 | The Regents Of The University Of Colorado, A Body Corporate | Boranephosphonate Detection Probes and Methods For Producing and Using the Same |
US11898179B2 (en) | 2017-03-09 | 2024-02-13 | President And Fellows Of Harvard College | Suppression of pain by gene editing |
EP3592777A1 (en) | 2017-03-10 | 2020-01-15 | President and Fellows of Harvard College | Cytosine to guanine base editor |
EP3596217A1 (en) | 2017-03-14 | 2020-01-22 | Editas Medicine, Inc. | Systems and methods for the treatment of hemoglobinopathies |
US11268082B2 (en) | 2017-03-23 | 2022-03-08 | President And Fellows Of Harvard College | Nucleobase editors comprising nucleic acid programmable DNA binding proteins |
JP2020515258A (ja) | 2017-03-31 | 2020-05-28 | アジェノビア コーポレーション | 抗ウイルス治療剤 |
AU2018367896B2 (en) | 2017-05-12 | 2023-06-01 | Crispr Therapeutics Ag | Materials and methods for engineering cells and uses thereof in immuno-oncology |
US11560566B2 (en) | 2017-05-12 | 2023-01-24 | President And Fellows Of Harvard College | Aptazyme-embedded guide RNAs for use with CRISPR-Cas9 in genome editing and transcriptional activation |
US11166985B2 (en) | 2017-05-12 | 2021-11-09 | Crispr Therapeutics Ag | Materials and methods for engineering cells and uses thereof in immuno-oncology |
CN108977442B (zh) * | 2017-06-05 | 2023-01-06 | 广州市锐博生物科技有限公司 | 用于dna编辑的系统及其应用 |
US9982279B1 (en) | 2017-06-23 | 2018-05-29 | Inscripta, Inc. | Nucleic acid-guided nucleases |
US10011849B1 (en) | 2017-06-23 | 2018-07-03 | Inscripta, Inc. | Nucleic acid-guided nucleases |
WO2019006418A2 (en) | 2017-06-30 | 2019-01-03 | Intima Bioscience, Inc. | ADENO-ASSOCIATED VIRAL VECTORS FOR GENE THERAPY |
WO2019014564A1 (en) | 2017-07-14 | 2019-01-17 | Editas Medicine, Inc. | SYSTEMS AND METHODS OF TARGETED INTEGRATION AND GENOME EDITING AND DETECTION THEREOF WITH INTEGRATED PRIMING SITES |
WO2019023680A1 (en) | 2017-07-28 | 2019-01-31 | President And Fellows Of Harvard College | METHODS AND COMPOSITIONS FOR EVOLUTION OF BASIC EDITORS USING PHAGE-ASSISTED CONTINUOUS EVOLUTION (PACE) |
WO2019139645A2 (en) | 2017-08-30 | 2019-07-18 | President And Fellows Of Harvard College | High efficiency base editors comprising gam |
EP3681637A4 (en) * | 2017-09-11 | 2021-06-02 | Synthego Corporation | SYSTEM AND PROCEDURE FOR BIOPOLYMER SYNTHESIS |
EP3684930B1 (en) | 2017-09-19 | 2022-05-04 | Tropic Biosciences UK Limited | Modifying the specificity of plant non-coding rna molecules for silencing gene expression |
US11795443B2 (en) | 2017-10-16 | 2023-10-24 | The Broad Institute, Inc. | Uses of adenosine base editors |
US20210277392A1 (en) * | 2017-11-02 | 2021-09-09 | The Governors Of The University Of Alberta | Chemically-modified guide rnas to improve crispr-cas protein specificity |
US11268092B2 (en) | 2018-01-12 | 2022-03-08 | GenEdit, Inc. | Structure-engineered guide RNA |
WO2019147743A1 (en) * | 2018-01-26 | 2019-08-01 | Massachusetts Institute Of Technology | Structure-guided chemical modification of guide rna and its applications |
EP3749767A1 (en) | 2018-02-05 | 2020-12-16 | Vertex Pharmaceuticals Incorporated | Materials and methods for treatment of hemoglobinopathies |
MA51788A (fr) | 2018-02-05 | 2020-12-16 | Vertex Pharma | Substances et méthodes pour traiter des hémoglobinopathies |
US20200369710A1 (en) * | 2018-02-09 | 2020-11-26 | Ohio State Innovation Foundation | Rna nanostructures, methods of making, and uses thereof |
CN112020558A (zh) * | 2018-03-14 | 2020-12-01 | 爱迪塔斯医药公司 | 治疗血红蛋白病的系统和方法 |
WO2019183000A1 (en) * | 2018-03-19 | 2019-09-26 | University Of Massachusetts | Modified guide rnas for crispr genome editing |
WO2019183572A1 (en) * | 2018-03-23 | 2019-09-26 | Refuge Biotechnologies, Inc. | Gene regulation via conditional nuclear localization of gene modulating polypeptides |
JP2021522820A (ja) | 2018-05-11 | 2021-09-02 | クリスパー セラピューティクス アクチェンゲゼルシャフト | 癌を治療するための方法及び組成物 |
WO2019213776A1 (en) * | 2018-05-11 | 2019-11-14 | UNIVERSITé LAVAL | Crispr/cas9 system and uses thereof |
JP2021523745A (ja) | 2018-05-16 | 2021-09-09 | シンテゴ コーポレイション | ガイドrna設計および使用のための方法およびシステム |
EP3802826A1 (en) * | 2018-05-24 | 2021-04-14 | CRISPR Therapeutics AG | Methods and compositions for efficient gene deletion |
KR20210029772A (ko) * | 2018-06-08 | 2021-03-16 | 인텔리아 테라퓨틱스, 인크. | 유전자 편집을 위한 변형된 가이드 rna |
EP3810801B1 (en) * | 2018-06-25 | 2022-09-28 | Bionano Genomics, Inc. | Labeling of dna |
US20210269799A1 (en) * | 2018-06-29 | 2021-09-02 | Editas Medicine, Inc. | Synthetic guide molecules, compositions and methods relating thereto |
KR20220036908A (ko) | 2018-08-28 | 2022-03-23 | 보르 바이오파마 인크. | 유전자 조작된 조혈 줄기 세포 및 그의 용도 |
US20210310002A1 (en) * | 2018-08-31 | 2021-10-07 | City Of Hope | Cationic compounds for delivery of nucleic acids |
GB201901873D0 (en) * | 2019-02-11 | 2019-04-03 | Proqr Therapeutics Ii Bv | Antisense oligonucleotides for nucleic acid editing |
GB201903520D0 (en) | 2019-03-14 | 2019-05-01 | Tropic Biosciences Uk Ltd | Modifying the specificity of non-coding rna molecules for silencing genes in eukaryotic cells |
GB201903519D0 (en) | 2019-03-14 | 2019-05-01 | Tropic Biosciences Uk Ltd | Introducing silencing activity to dysfunctional rna molecules and modifying their specificity against a gene of interest |
GB201903521D0 (en) | 2019-03-14 | 2019-05-01 | Tropic Biosciences Uk Ltd | No title |
CA3130488A1 (en) | 2019-03-19 | 2020-09-24 | David R. Liu | Methods and compositions for editing nucleotide sequences |
BR112021021542A2 (pt) | 2019-04-30 | 2022-04-19 | Crispr Therapeutics Ag | Terapia celular alogênica de malignidades de células b com o uso de células t geneticamente modificadas que têm como alvo cd19 |
CA3141732A1 (en) | 2019-05-23 | 2020-11-26 | Vor Biopharma Inc | Compositions and methods for cd33 modification |
JP2021016370A (ja) * | 2019-07-23 | 2021-02-15 | 株式会社東芝 | 核酸導入キャリア、核酸導入キャリアセット、核酸導入組成物及び核酸導入方法 |
EP4022063A1 (en) | 2019-08-28 | 2022-07-06 | Vor Biopharma Inc. | Compositions and methods for cll1 modification |
CN114787352A (zh) | 2019-08-28 | 2022-07-22 | Vor生物制药股份有限公司 | 用于cd123修饰的组合物和方法 |
EP4038190A1 (en) | 2019-10-03 | 2022-08-10 | Artisan Development Labs, Inc. | Crispr systems with engineered dual guide nucleic acids |
JPWO2021070494A1 (ko) | 2019-10-11 | 2021-04-15 | ||
WO2021119006A1 (en) * | 2019-12-09 | 2021-06-17 | Caribou Biosciences, Inc. | Crispr abasic restricted nucleotides and crispr accuracy via analogs |
JP2023506482A (ja) * | 2019-12-11 | 2023-02-16 | インテリア セラピューティクス,インコーポレイテッド | 遺伝子編集のための修飾されたガイドrna |
IL293890A (en) | 2019-12-20 | 2022-08-01 | Curevac Ag | Lipid nanoparticles for delivery of nucleic acids |
EP4097117A1 (en) | 2020-01-29 | 2022-12-07 | Sumitomo Chemical Company, Limited | Process of preparing nucleic acid oligomer |
EP4098655A4 (en) | 2020-01-29 | 2024-02-28 | Sumitomo Chemical Co | PROCESS FOR THE PRODUCTION OF NUCLEIC ACID OLIGOMERS |
CN115335387A (zh) | 2020-03-27 | 2022-11-11 | 住友化学株式会社 | 核酸寡聚物的制造方法 |
GB2614813A (en) | 2020-05-08 | 2023-07-19 | Harvard College | Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence |
JP2023540276A (ja) | 2020-08-28 | 2023-09-22 | ブイオーアール バイオファーマ インコーポレーテッド | Cll1改変のための組成物および方法 |
EP4204564A1 (en) | 2020-08-28 | 2023-07-05 | Vor Biopharma Inc. | Compositions and methods for cd123 modification |
JP2023541458A (ja) | 2020-09-14 | 2023-10-02 | ブイオーアール バイオファーマ インコーポレーテッド | Cd5修飾のための化合物および方法 |
US20230398219A1 (en) | 2020-09-14 | 2023-12-14 | Vor Biopharma Inc. | Compositions and methods for cd38 modification |
US20230323405A1 (en) | 2020-09-18 | 2023-10-12 | Artisan Development Labs, Inc. | Constructs and uses thereof for efficient and specific genome editing |
US20240033290A1 (en) | 2020-09-18 | 2024-02-01 | Vor Biopharma Inc. | Compositions and methods for cd7 modification |
US20240051986A1 (en) | 2020-09-24 | 2024-02-15 | Sumitomo Chemical Company, Limited | Method for producing nucleic acid oligomer |
US20230364233A1 (en) | 2020-09-28 | 2023-11-16 | Vor Biopharma Inc. | Compositions and methods for cd6 modification |
WO2022072643A1 (en) | 2020-09-30 | 2022-04-07 | Vor Biopharma Inc. | Compositions and methods for cd30 gene modification |
KR20230097089A (ko) | 2020-10-27 | 2023-06-30 | 보르 바이오파마 인크. | 조혈 악성종양을 치료하기 위한 조성물 및 방법 |
WO2022094245A1 (en) | 2020-10-30 | 2022-05-05 | Vor Biopharma, Inc. | Compositions and methods for bcma modification |
US20230414755A1 (en) | 2020-11-13 | 2023-12-28 | Vor Biopharma Inc. | Methods and compositions relating to genetically engineered cells expressing chimeric antigen receptors |
CN112266951B (zh) * | 2020-11-23 | 2021-07-20 | 广东省农业科学院植物保护研究所 | 一种生物素标记引物延伸方法及其应用 |
WO2022115878A1 (en) * | 2020-11-30 | 2022-06-02 | The Board Of Trustees Of The Leland Stanford Junior University | Crispr/cas-mediated gene editing of human stem cells |
CA3202219A1 (en) | 2020-12-31 | 2022-07-07 | Vor Biopharma Inc. | Compositions and methods for cd34 gene modification |
WO2022217086A1 (en) | 2021-04-09 | 2022-10-13 | Vor Biopharma Inc. | Photocleavable guide rnas and methods of use thereof |
CN113512767B (zh) * | 2021-04-30 | 2022-09-23 | 天津诺禾致源生物信息科技有限公司 | 用于构建small RNA文库的接头、试剂盒及small RNA文库的构建方法 |
WO2022256448A2 (en) | 2021-06-01 | 2022-12-08 | Artisan Development Labs, Inc. | Compositions and methods for targeting, editing, or modifying genes |
WO2022266538A2 (en) | 2021-06-18 | 2022-12-22 | Artisan Development Labs, Inc. | Compositions and methods for targeting, editing or modifying human genes |
WO2023283585A2 (en) | 2021-07-06 | 2023-01-12 | Vor Biopharma Inc. | Inhibitor oligonucleotides and methods of use thereof |
WO2023283495A1 (en) * | 2021-07-09 | 2023-01-12 | The Brigham And Women's Hospital, Inc. | Crispr-based protein barcoding and surface assembly |
AU2022324093A1 (en) | 2021-08-02 | 2024-02-08 | Vor Biopharma Inc. | Compositions and methods for gene modification |
IL309505A (en) | 2021-09-03 | 2024-02-01 | CureVac SE | Lipid nanoparticles for nucleic acid delivery |
AU2022343300A1 (en) * | 2021-09-10 | 2024-04-18 | Agilent Technologies, Inc. | Guide rnas with chemical modification for prime editing |
AU2022346785A1 (en) * | 2021-09-14 | 2024-04-18 | Agilent Technologies, Inc. | Methods for using guide rnas with chemical modifications |
WO2023049926A2 (en) | 2021-09-27 | 2023-03-30 | Vor Biopharma Inc. | Fusion polypeptides for genetic editing and methods of use thereof |
TW202334419A (zh) * | 2021-11-03 | 2023-09-01 | 美商英特利亞醫療公司 | 用於基因編輯之經修飾引導rna |
WO2023086422A1 (en) | 2021-11-09 | 2023-05-19 | Vor Biopharma Inc. | Compositions and methods for erm2 modification |
WO2023164636A1 (en) | 2022-02-25 | 2023-08-31 | Vor Biopharma Inc. | Compositions and methods for homology-directed repair gene modification |
WO2023167882A1 (en) | 2022-03-01 | 2023-09-07 | Artisan Development Labs, Inc. | Composition and methods for transgene insertion |
WO2023185697A2 (en) | 2022-03-29 | 2023-10-05 | Accuredit Therapeutics (Suzhou) Co., Ltd. | Compositions and methods for treatment of transthyretin amyloidosis |
WO2023196816A1 (en) | 2022-04-04 | 2023-10-12 | Vor Biopharma Inc. | Compositions and methods for mediating epitope engineering |
WO2023225410A2 (en) | 2022-05-20 | 2023-11-23 | Artisan Development Labs, Inc. | Systems and methods for assessing risk of genome editing events |
WO2024015925A2 (en) | 2022-07-13 | 2024-01-18 | Vor Biopharma Inc. | Compositions and methods for artificial protospacer adjacent motif (pam) generation |
WO2024061296A2 (en) | 2022-09-22 | 2024-03-28 | Accuredit Therapeutics (Suzhou) Co., Ltd. | Compositions and methods for treatment of hypercholesterolemia and/or cardiovascular disease |
WO2024073751A1 (en) | 2022-09-29 | 2024-04-04 | Vor Biopharma Inc. | Methods and compositions for gene modification and enrichment |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013142578A1 (en) | 2012-03-20 | 2013-09-26 | Vilnius University | RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX |
WO2014093712A1 (en) | 2012-12-12 | 2014-06-19 | The Broad Institute, Inc. | Engineering of systems, methods and optimized guide compositions for sequence manipulation |
US20140273226A1 (en) | 2013-03-15 | 2014-09-18 | System Biosciences, Llc | Crispr/cas systems for genomic modification and gene modulation |
Family Cites Families (134)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5032401A (en) | 1989-06-15 | 1991-07-16 | Alpha Beta Technology | Glucan drug delivery system and adjuvant |
US7371580B2 (en) | 2001-08-24 | 2008-05-13 | Agilent Technologies, Inc. | Use of unstructured nucleic acids in assaying nucleic acid molecules |
US20070122906A1 (en) | 2003-12-29 | 2007-05-31 | Allan Mishra | Method of culturing cells |
US7740861B2 (en) | 2004-06-16 | 2010-06-22 | University Of Massachusetts | Drug delivery product and methods |
EP2476689B1 (en) | 2007-05-10 | 2015-10-21 | Agilent Technologies, Inc. | Thiocarbon-protecting groups for RNA synthesis |
US20100076183A1 (en) | 2008-09-22 | 2010-03-25 | Dellinger Douglas J | Protected monomer and method of final deprotection for rna synthesis |
US9585920B2 (en) | 2011-02-04 | 2017-03-07 | Katherine Rose Kovarik | Method and system for treating cancer cachexia |
US9528124B2 (en) | 2013-08-27 | 2016-12-27 | Recombinetics, Inc. | Efficient non-meiotic allele introgression |
GB201122458D0 (en) | 2011-12-30 | 2012-02-08 | Univ Wageningen | Modified cascade ribonucleoproteins and uses thereof |
KR101833589B1 (ko) | 2012-02-24 | 2018-03-02 | 프레드 헛친슨 켄서 리서치 센터 | 이상혈색소증 치료를 위한 조성물 및 방법 |
WO2013141680A1 (en) | 2012-03-20 | 2013-09-26 | Vilnius University | RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX |
LT2852602T (lt) | 2012-05-21 | 2020-10-26 | Agilent Technologies, Inc. | Oligonukleotidų konjugavimo būdas |
PE20190844A1 (es) | 2012-05-25 | 2019-06-17 | Emmanuelle Charpentier | Modulacion de transcripcion con arn de direccion a adn generico |
UA119135C2 (uk) | 2012-09-07 | 2019-05-10 | ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі | Спосіб отримання трансгенної рослини |
AR092482A1 (es) | 2012-09-07 | 2015-04-22 | Dow Agrosciences Llc | Enriquecimiento de la clasificacion de las celulas activadas por fluorescencia (facs) para generar plantas |
CN105264067B (zh) | 2012-09-07 | 2020-11-10 | 美国陶氏益农公司 | Fad3性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白 |
UA118090C2 (uk) | 2012-09-07 | 2018-11-26 | ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі | Спосіб інтегрування послідовності нуклеїнової кислоти, що представляє інтерес, у ген fad2 у клітині сої та специфічний для локусу fad2 білок, що зв'язується, здатний індукувати спрямований розрив |
KR101706085B1 (ko) | 2012-10-23 | 2017-02-14 | 주식회사 툴젠 | 표적 DNA에 특이적인 가이드 RNA 및 Cas 단백질을 암호화하는 핵산 또는 Cas 단백질을 포함하는, 표적 DNA를 절단하기 위한 조성물 및 이의 용도 |
CA2890110C (en) | 2012-11-01 | 2023-05-02 | Factor Bioscience Inc. | Methods and products for expressing proteins in cells |
WO2014071235A1 (en) | 2012-11-01 | 2014-05-08 | Massachusetts Institute Of Technology | Genetic device for the controlled destruction of dna |
US9447422B2 (en) | 2012-12-06 | 2016-09-20 | Synthetic Genomics, Inc. | Autonomous replication sequences and episomal DNA molecules |
KR102145760B1 (ko) | 2012-12-06 | 2020-08-19 | 시그마-알드리치 컴퍼니., 엘엘씨 | Crispr-기초된 유전체 변형과 조절 |
CA3144049A1 (en) | 2012-12-06 | 2014-06-12 | Synthetic Genomics, Inc. | Algal mutants having a locked-in high light acclimated phenotype |
EP4299741A3 (en) | 2012-12-12 | 2024-02-28 | The Broad Institute, Inc. | Delivery, engineering and optimization of systems, methods and compositions for sequence manipulation and therapeutic applications |
WO2014093635A1 (en) | 2012-12-12 | 2014-06-19 | The Broad Institute, Inc. | Engineering and optimization of improved systems, methods and enzyme compositions for sequence manipulation |
EP3045537A1 (en) | 2012-12-12 | 2016-07-20 | The Broad Institute, Inc. | Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains |
WO2014093688A1 (en) | 2012-12-12 | 2014-06-19 | 1Massachusetts Institute Of Technology | Compositions and methods for functional nucleic acid delivery |
CN114634950A (zh) | 2012-12-12 | 2022-06-17 | 布罗德研究所有限公司 | 用于序列操纵的crispr-cas组分系统、方法以及组合物 |
WO2014093694A1 (en) | 2012-12-12 | 2014-06-19 | The Broad Institute, Inc. | Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes |
EP2931899A1 (en) | 2012-12-12 | 2015-10-21 | The Broad Institute, Inc. | Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof |
ES2701749T3 (es) | 2012-12-12 | 2019-02-25 | Broad Inst Inc | Métodos, modelos, sistemas y aparatos para identificar secuencias diana para enzimas Cas o sistemas CRISPR-Cas para secuencias diana y transmitir resultados de los mismos |
US8697359B1 (en) | 2012-12-12 | 2014-04-15 | The Broad Institute, Inc. | CRISPR-Cas systems and methods for altering expression of gene products |
EP2931898B1 (en) | 2012-12-12 | 2016-03-09 | The Broad Institute, Inc. | Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains |
KR20150095861A (ko) | 2012-12-17 | 2015-08-21 | 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 | Rna-가이드된 인간 게놈 조작 |
WO2014159719A1 (en) | 2013-03-14 | 2014-10-02 | Scrips Health | Methods of isolating nucleic acids |
US20160138027A1 (en) | 2013-03-14 | 2016-05-19 | The Board Of Trustees Of The Leland Stanford Junior University | Treatment of diseases and conditions associated with dysregulation of mammalian target of rapamycin complex 1 (mtorc1) |
DK3620534T3 (da) | 2013-03-14 | 2021-12-06 | Caribou Biosciences Inc | Crispr-cas sammensætninger af nucleinsyre-targeting nucleinsyrer |
US20140273230A1 (en) | 2013-03-15 | 2014-09-18 | Sigma-Aldrich Co., Llc | Crispr-based genome modification and regulation |
EP3741868A1 (en) * | 2013-03-15 | 2020-11-25 | The General Hospital Corporation | Rna-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci |
EP2970997A1 (en) | 2013-03-15 | 2016-01-20 | Regents of the University of Minnesota | Engineering plant genomes using crispr/cas systems |
US20140349400A1 (en) | 2013-03-15 | 2014-11-27 | Massachusetts Institute Of Technology | Programmable Modification of DNA |
US20140364333A1 (en) | 2013-03-15 | 2014-12-11 | President And Fellows Of Harvard College | Methods for Live Imaging of Cells |
US9957515B2 (en) | 2013-03-15 | 2018-05-01 | Cibus Us Llc | Methods and compositions for targeted gene modification |
EP2971006A4 (en) | 2013-03-15 | 2017-02-08 | Transposagen Biopharmaceuticals, Inc. | Reproducible method for testis-mediated genetic modification (tgm) and sperm-mediated genetic modification (sgm) |
US11332719B2 (en) | 2013-03-15 | 2022-05-17 | The Broad Institute, Inc. | Recombinant virus and preparations thereof |
JP2016522679A (ja) | 2013-04-04 | 2016-08-04 | プレジデント アンド フェローズ オブ ハーバード カレッジ | CRISPR/Cas系を用いたゲノム編集の治療的使用 |
US11274305B2 (en) | 2013-04-04 | 2022-03-15 | Trustees Of Dartmouth College | Compositions and methods for in vivo excision of HIV-1 proviral DNA |
WO2014172470A2 (en) | 2013-04-16 | 2014-10-23 | Whitehead Institute For Biomedical Research | Methods of mutating, modifying or modulating nucleic acid in a cell or nonhuman mammal |
US20160040155A1 (en) | 2013-04-16 | 2016-02-11 | University Of Washington Through Its Center For Commercialization | Activating an alternative pathway for homology-directed repair to stimulate targeted gene correction and genome engineering |
SG11201508028QA (en) | 2013-04-16 | 2015-10-29 | Regeneron Pharma | Targeted modification of rat genome |
JP2016521975A (ja) | 2013-05-15 | 2016-07-28 | サンガモ バイオサイエンシーズ, インコーポレイテッド | 遺伝的状態の処置のための方法および組成物 |
CA2913869C (en) | 2013-05-29 | 2023-01-24 | Cellectis | New compact scaffold of cas9 in the type ii crispr system |
US9873907B2 (en) | 2013-05-29 | 2018-01-23 | Agilent Technologies, Inc. | Method for fragmenting genomic DNA using CAS9 |
DK3004349T3 (en) | 2013-05-29 | 2018-06-06 | Cellectis Sa | A method for producing precise DNA cleavage using CAS9 nickase activity |
AU2014273490B2 (en) | 2013-05-29 | 2019-05-09 | Cellectis | Methods for engineering T cells for immunotherapy by using RNA-guided Cas nuclease system |
KR20230042154A (ko) | 2013-06-04 | 2023-03-27 | 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 | Rna-가이드된 전사 조절 |
WO2014201015A2 (en) | 2013-06-11 | 2014-12-18 | The Regents Of The University Of California | Methods and compositions for target dna modification |
US20150315252A1 (en) | 2013-06-11 | 2015-11-05 | Clontech Laboratories, Inc. | Protein enriched microvesicles and methods of making and using the same |
WO2014204723A1 (en) | 2013-06-17 | 2014-12-24 | The Broad Institute Inc. | Oncogenic models based on delivery and use of the crispr-cas systems, vectors and compositions |
DK3011029T3 (da) | 2013-06-17 | 2020-03-16 | Broad Inst Inc | Administration, modificering og optimering af tandem-guidesystemer, fremgangsmåder og sammensætninger til sekvensmanipulering |
EP4245853A3 (en) | 2013-06-17 | 2023-10-18 | The Broad Institute, Inc. | Optimized crispr-cas double nickase systems, methods and compositions for sequence manipulation |
BR112015031611A2 (pt) | 2013-06-17 | 2017-12-12 | Massachusetts Inst Technology | aplicação, manipulação e otimização de sistemas, métodos e composições para direcionamento e modelação de doenças e distúrbios de células pós-mitóticas |
EP3011031B1 (en) | 2013-06-17 | 2020-09-30 | The Broad Institute Inc. | Delivery and use of the crispr-cas systems, vectors and compositions for hepatic targeting and therapy |
AU2014287393B2 (en) | 2013-07-09 | 2020-10-22 | President And Fellows Of Harvard College | Multiplex RNA-guided genome engineering |
JP2016528890A (ja) | 2013-07-09 | 2016-09-23 | プレジデント アンド フェローズ オブ ハーバード カレッジ | CRISPR/Cas系を用いるゲノム編集の治療用の使用 |
WO2015006437A1 (en) | 2013-07-10 | 2015-01-15 | Majzoub Joseph A | Mrap2 knockouts |
CA2917639C (en) | 2013-07-10 | 2024-01-02 | President And Fellows Of Harvard College | Orthogonal cas9 proteins for rna-guided gene regulation and editing |
US11306328B2 (en) | 2013-07-26 | 2022-04-19 | President And Fellows Of Harvard College | Genome engineering |
WO2015021426A1 (en) | 2013-08-09 | 2015-02-12 | Sage Labs, Inc. | A crispr/cas system-based novel fusion protein and its application in genome editing |
US20150044192A1 (en) | 2013-08-09 | 2015-02-12 | President And Fellows Of Harvard College | Methods for identifying a target site of a cas9 nuclease |
EP3611268A1 (en) | 2013-08-22 | 2020-02-19 | E. I. du Pont de Nemours and Company | Plant genome modification using guide rna/cas endonuclease systems and methods of use |
CA2922823C (en) | 2013-09-04 | 2023-01-17 | Dow Agrosciences Llc | Rapid targeting analysis in crops for determining donor insertion |
US20150064149A1 (en) | 2013-09-04 | 2015-03-05 | Mice With Horns, LLC. | Materials and methods for correcting recessive mutations in animals |
AU2014316676B2 (en) | 2013-09-04 | 2020-07-23 | Csir | Site-specific nuclease single-cell assay targeting gene regulatory elements to silence gene expression |
US9388430B2 (en) | 2013-09-06 | 2016-07-12 | President And Fellows Of Harvard College | Cas9-recombinase fusion proteins and uses thereof |
US9340799B2 (en) | 2013-09-06 | 2016-05-17 | President And Fellows Of Harvard College | MRNA-sensing switchable gRNAs |
US9526784B2 (en) | 2013-09-06 | 2016-12-27 | President And Fellows Of Harvard College | Delivery system for functional nucleases |
US20150071946A1 (en) | 2013-09-06 | 2015-03-12 | The Johns Hopkins University | Tumor-specific retrotransposon insertions |
ES2844174T3 (es) | 2013-09-18 | 2021-07-21 | Kymab Ltd | Métodos, células y organismos |
WO2015040075A1 (en) | 2013-09-18 | 2015-03-26 | Genome Research Limited | Genomic screening methods using rna-guided endonucleases |
US20150098954A1 (en) | 2013-10-08 | 2015-04-09 | Elwha Llc | Compositions and Methods Related to CRISPR Targeting |
DE102013111099B4 (de) | 2013-10-08 | 2023-11-30 | Eberhard Karls Universität Tübingen Medizinische Fakultät | Permanente Genkorrektur mittels nukleotidmodifizierter messenger RNA |
WO2015052231A2 (en) | 2013-10-08 | 2015-04-16 | Technical University Of Denmark | Multiplex editing system |
AU2014331939A1 (en) | 2013-10-08 | 2016-04-28 | Amelia HENRY | Drought-resistant cereal grasses and related materials and methods |
NZ719494A (en) | 2013-11-04 | 2017-09-29 | Dow Agrosciences Llc | Optimal maize loci |
RU2709734C2 (ru) | 2013-11-04 | 2019-12-19 | ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи | Оптимальные локусы маиса |
WO2015066637A1 (en) | 2013-11-04 | 2015-05-07 | Dow Agrosciences Llc | A universal donor system for gene targeting |
AU2014341934B2 (en) | 2013-11-04 | 2017-12-07 | Corteva Agriscience Llc | Optimal soybean loci |
UY35814A (es) | 2013-11-04 | 2015-05-29 | Dow Agrosciences Llc | ?lugares óptimos para la soja?. |
LT3066201T (lt) | 2013-11-07 | 2018-08-10 | Editas Medicine, Inc. | Su crispr susiję būdai ir kompozicijos su valdančiomis grnr |
US11326209B2 (en) | 2013-11-07 | 2022-05-10 | Massachusetts Institute Of Technology | Cell-based genomic recorded accumulative memory |
US9074199B1 (en) | 2013-11-19 | 2015-07-07 | President And Fellows Of Harvard College | Mutant Cas9 proteins |
WO2015075056A1 (en) | 2013-11-19 | 2015-05-28 | Thermo Fisher Scientific Baltics Uab | Programmable enzymes for isolation of specific dna fragments |
US10787684B2 (en) | 2013-11-19 | 2020-09-29 | President And Fellows Of Harvard College | Large gene excision and insertion |
US9840699B2 (en) | 2013-12-12 | 2017-12-12 | President And Fellows Of Harvard College | Methods for nucleic acid editing |
KR20160097327A (ko) | 2013-12-12 | 2016-08-17 | 더 브로드 인스티튜트, 인코퍼레이티드 | 유전자 산물, 구조 정보 및 유도성 모듈형 cas 효소의 발현의 변경을 위한 crispr-cas 시스템 및 방법 |
US9994831B2 (en) | 2013-12-12 | 2018-06-12 | The Regents Of The University Of California | Methods and compositions for modifying a single stranded target nucleic acid |
JP2017501149A (ja) | 2013-12-12 | 2017-01-12 | ザ・ブロード・インスティテュート・インコーポレイテッド | 粒子送達構成成分を用いた障害及び疾患の標的化のためのcrispr−cas系及び組成物の送達、使用及び治療適用 |
JP6793547B2 (ja) | 2013-12-12 | 2020-12-02 | ザ・ブロード・インスティテュート・インコーポレイテッド | 最適化機能CRISPR−Cas系による配列操作のための系、方法および組成物 |
EP4219699A1 (en) | 2013-12-12 | 2023-08-02 | The Broad Institute, Inc. | Engineering of systems, methods and optimized guide compositions with new architectures for sequence manipulation |
JP2017527256A (ja) | 2013-12-12 | 2017-09-21 | ザ・ブロード・インスティテュート・インコーポレイテッド | HBV及びウイルス性疾患及び障害のためのCRISPR−Cas系及び組成物の送達、使用及び治療適用 |
ES2765481T3 (es) | 2013-12-12 | 2020-06-09 | Broad Inst Inc | Administración, uso y aplicaciones terapéuticas de los sistemas crispr-cas y composiciones para la edición genómica |
BR112016013547A2 (pt) | 2013-12-12 | 2017-10-03 | Broad Inst Inc | Composições e métodos de uso de sistemas crispr-cas em distúrbios de repetições de nucleotídeos |
WO2015184268A1 (en) | 2014-05-30 | 2015-12-03 | The Board Of Trustees Of The Leland Stanford Junior University | Compositions and methods of delivering treatments for latent viral infections |
US20150344836A1 (en) | 2014-05-30 | 2015-12-03 | Ohio State Innovation Foundation | Agrobacterium Strains for Plant Transformation and Related Materials and Methods |
ES2888976T3 (es) | 2014-06-23 | 2022-01-10 | Massachusetts Gen Hospital | Identificación no sesgada pangenómica de DSBs evaluada por secuenciación (GUIDE-Seq.) |
PL3155099T3 (pl) | 2014-06-23 | 2018-08-31 | Regeneron Pharmaceuticals, Inc. | Łączenie dna mediowane nukleazą |
US10501741B2 (en) | 2014-06-25 | 2019-12-10 | Cold Spring Harbor Laboratory | Methods and compositions for inhibiting growth and epithelial to mesenchymal transition (EMT) in cancer cells |
WO2015200555A2 (en) | 2014-06-25 | 2015-12-30 | Caribou Biosciences, Inc. | Rna modification to engineer cas9 activity |
US9616090B2 (en) | 2014-07-30 | 2017-04-11 | Sangamo Biosciences, Inc. | Gene correction of SCID-related genes in hematopoietic stem and progenitor cells |
WO2016022363A2 (en) | 2014-07-30 | 2016-02-11 | President And Fellows Of Harvard College | Cas9 proteins including ligand-dependent inteins |
CN113584015A (zh) | 2014-08-27 | 2021-11-02 | 新英格兰生物实验室公司 | 合成子的形成 |
CA2959070C (en) | 2014-08-27 | 2020-11-10 | Caribou Biosciences, Inc. | Methods for increasing cas9-mediated engineering efficiency |
WO2016049163A2 (en) | 2014-09-24 | 2016-03-31 | The Broad Institute Inc. | Use and production of chd8+/- transgenic animals with behavioral phenotypes characteristic of autism spectrum disorder |
WO2016049251A1 (en) | 2014-09-24 | 2016-03-31 | The Broad Institute Inc. | Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling mutations in leukocytes |
WO2016049024A2 (en) | 2014-09-24 | 2016-03-31 | The Broad Institute Inc. | Delivery, use and therapeutic applications of the crispr-cas systems and compositions for modeling competition of multiple cancer mutations in vivo |
US20170349940A1 (en) | 2014-09-26 | 2017-12-07 | Two Pore Guys, Inc. | Targeted Sequence Detection by Nanopore Sensing of Synthetic Probes |
CN113136390A (zh) | 2014-09-26 | 2021-07-20 | 先锋国际良种公司 | 小麦Ms1多核苷酸、多肽以及使用方法 |
WO2016046288A1 (en) | 2014-09-26 | 2016-03-31 | Philip Morris Products S.A | Reducing tobacco specific nitrosamines through alteration of the nitrate assimilation pathway |
US11408007B2 (en) | 2014-09-26 | 2022-08-09 | Yale University | Compositions and methods for biocontainment of microorganisms |
EP3998344A1 (en) | 2014-10-09 | 2022-05-18 | Life Technologies Corporation | Crispr oligonucleotides and gene editing |
CN116731958A (zh) | 2014-10-09 | 2023-09-12 | 细胞结构公司 | 胎盘来源的贴壁细胞外泌体及其用途 |
CA2963940A1 (en) | 2014-10-09 | 2016-04-14 | The Regents Of The University Of California | Targeted disruption of a csf1-dap12 pathway member gene for the treatment of neuropathic pain |
EP3708155A1 (en) | 2014-10-31 | 2020-09-16 | Massachusetts Institute Of Technology | Massively parallel combinatorial genetics for crispr |
KR20230098910A (ko) | 2014-10-31 | 2023-07-04 | 더 트러스티스 오브 더 유니버시티 오브 펜실베니아 | 변형된 t 세포에서 유전자 발현의 변경 및 그의 용도 |
US9816080B2 (en) | 2014-10-31 | 2017-11-14 | President And Fellows Of Harvard College | Delivery of CAS9 via ARRDC1-mediated microvesicles (ARMMs) |
WO2016089433A1 (en) | 2014-12-03 | 2016-06-09 | Agilent Technologies, Inc. | Guide rna with chemical modifications |
EP3280803B1 (en) | 2015-04-06 | 2021-05-26 | The Board of Trustees of the Leland Stanford Junior University | Chemically modified guide rnas for crispr/cas-mediated gene regulation |
MX2018007290A (es) | 2015-12-18 | 2019-01-10 | Danisco Us Inc | Metodos y composiciones para expresion de acido ribonucleico (arn) guia basada en polimerasa ii (pol-ii). |
US20190233814A1 (en) | 2015-12-18 | 2019-08-01 | The Broad Institute, Inc. | Novel crispr enzymes and systems |
WO2017106569A1 (en) | 2015-12-18 | 2017-06-22 | The Regents Of The University Of California | Modified site-directed modifying polypeptides and methods of use thereof |
WO2017106767A1 (en) | 2015-12-18 | 2017-06-22 | The Scripps Research Institute | Production of unnatural nucleotides using a crispr/cas9 system |
WO2017104404A1 (ja) | 2015-12-18 | 2017-06-22 | 国立研究開発法人科学技術振興機構 | 遺伝子改変非ヒト生物、卵細胞、受精卵、及び標的遺伝子の改変方法 |
WO2017105991A1 (en) | 2015-12-18 | 2017-06-22 | Danisco Us Inc. | Methods and compositions for t-rna based guide rna expression |
-
2015
- 2015-12-03 WO PCT/US2015/000143 patent/WO2016089433A1/en active Application Filing
- 2015-12-03 CN CN201580075275.4A patent/CN107250148B/zh active Active
- 2015-12-03 JP JP2017529610A patent/JP7068821B2/ja active Active
- 2015-12-03 US US14/757,204 patent/US10900034B2/en active Active
- 2015-12-03 AU AU2015355546A patent/AU2015355546B2/en active Active
- 2015-12-03 EP EP15866342.7A patent/EP3227447B1/en active Active
- 2015-12-03 KR KR1020177018311A patent/KR102629128B1/ko active IP Right Grant
- 2015-12-03 KR KR1020247002012A patent/KR20240013283A/ko not_active Application Discontinuation
- 2015-12-03 CA CA2969619A patent/CA2969619A1/en active Pending
-
2017
- 2017-05-26 US US15/607,295 patent/US10337001B2/en active Active
-
2020
- 2020-11-24 US US17/103,678 patent/US20210079389A1/en active Pending
-
2022
- 2022-02-14 JP JP2022020615A patent/JP2022078083A/ja active Pending
-
2023
- 2023-06-09 US US18/332,464 patent/US20230416733A1/en active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013142578A1 (en) | 2012-03-20 | 2013-09-26 | Vilnius University | RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX |
WO2014093712A1 (en) | 2012-12-12 | 2014-06-19 | The Broad Institute, Inc. | Engineering of systems, methods and optimized guide compositions for sequence manipulation |
US20140273232A1 (en) | 2012-12-12 | 2014-09-18 | The Broad Institute, Inc. | Engineering of systems, methods and optimized guide compositions for sequence manipulation |
US20140273226A1 (en) | 2013-03-15 | 2014-09-18 | System Biosciences, Llc | Crispr/cas systems for genomic modification and gene modulation |
Also Published As
Publication number | Publication date |
---|---|
US10900034B2 (en) | 2021-01-26 |
JP2022078083A (ja) | 2022-05-24 |
KR20170084334A (ko) | 2017-07-19 |
EP3227447A4 (en) | 2018-07-11 |
KR20240013283A (ko) | 2024-01-30 |
CN107250148A (zh) | 2017-10-13 |
AU2015355546A1 (en) | 2017-07-13 |
US20210079389A1 (en) | 2021-03-18 |
US20230416733A1 (en) | 2023-12-28 |
EP3227447A1 (en) | 2017-10-11 |
WO2016089433A1 (en) | 2016-06-09 |
US10337001B2 (en) | 2019-07-02 |
CN107250148B (zh) | 2021-04-16 |
CA2969619A1 (en) | 2016-06-09 |
JP7068821B2 (ja) | 2022-05-17 |
US20160289675A1 (en) | 2016-10-06 |
JP2017537626A (ja) | 2017-12-21 |
AU2015355546B2 (en) | 2021-10-14 |
EP3227447B1 (en) | 2024-04-24 |
US20180051281A1 (en) | 2018-02-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102629128B1 (ko) | 화학적 변형을 갖는 가이드 rna | |
KR102382772B1 (ko) | 화학적으로 변형된 가이드 rna를 사용하는 고 특이성 게놈 편집 | |
US11667903B2 (en) | Tracking and manipulating cellular RNA via nuclear delivery of CRISPR/CAS9 | |
JP2021118714A (ja) | Crispr系組成物及び使用方法 | |
EP3292219B9 (en) | Methods and kits for fragmenting dna | |
RU2719641C1 (ru) | Новые способы получения олигонуклеотидов | |
WO2017181107A2 (en) | Modified cpf1 mrna, modified guide rna, and uses thereof | |
WO2017184799A1 (en) | Gene editing reagents with reduced toxicity | |
WO2021183807A1 (en) | Novel cas enzymes and methods of profiling specificity and activity | |
WO2020044039A1 (en) | Modified sgrnas | |
WO2019035485A1 (ja) | ゲノム編集酵素の活性を阻害する核酸アプタマー | |
KR20240017367A (ko) | 클래스 ii, v형 crispr 시스템 | |
KR102179405B1 (ko) | 키메라 crRNA | |
WO2017087842A1 (en) | Stabilized reagents for genome modification | |
Kundu | Directed Evolution of a Novel Heterochiral Ribonuclease Ribozyme and Kinetic Characterization of Heterochiral DNA Strand Displacement Reactions | |
Mir et al. | Heavily and Fully Modified RNAs Guide Efficient SpyCas9-Mediated Genome Editing [preprint] | |
WO2021058984A1 (en) | A nucleic acid delivery vector comprising a circular single stranded polynucleotide | |
CN117693585A (zh) | Ii类v型crispr系统 | |
Peach | Analysis and kinase-mediated decay of RNAs with 5'-hydroxyl termini | |
JP2007319147A (ja) | 指標分子量マーカー及びこれを用いた核酸鎖結合産物の分画方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
X091 | Application refused [patent] | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
A107 | Divisional application of patent | ||
GRNT | Written decision to grant |