KR20240021218A - 신규 유형 v rna 프로그래밍가능 엔도뉴클레아제 시스템 - Google Patents
신규 유형 v rna 프로그래밍가능 엔도뉴클레아제 시스템 Download PDFInfo
- Publication number
- KR20240021218A KR20240021218A KR1020247000678A KR20247000678A KR20240021218A KR 20240021218 A KR20240021218 A KR 20240021218A KR 1020247000678 A KR1020247000678 A KR 1020247000678A KR 20247000678 A KR20247000678 A KR 20247000678A KR 20240021218 A KR20240021218 A KR 20240021218A
- Authority
- KR
- South Korea
- Prior art keywords
- gen
- sequence
- polypeptide
- dna
- rna
- Prior art date
Links
- 102000004533 Endonucleases Human genes 0.000 title description 29
- 108010042407 Endonucleases Proteins 0.000 title description 29
- 108020005004 Guide RNA Proteins 0.000 claims abstract description 247
- 238000000034 method Methods 0.000 claims abstract description 125
- 230000008685 targeting Effects 0.000 claims abstract description 51
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 408
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 399
- 229920001184 polypeptide Polymers 0.000 claims description 395
- 150000007523 nucleic acids Chemical class 0.000 claims description 306
- 102000039446 nucleic acids Human genes 0.000 claims description 285
- 108020004707 nucleic acids Proteins 0.000 claims description 285
- 108020004414 DNA Proteins 0.000 claims description 252
- 102000040430 polynucleotide Human genes 0.000 claims description 184
- 108091033319 polynucleotide Proteins 0.000 claims description 184
- 239000002157 polynucleotide Substances 0.000 claims description 182
- 125000003729 nucleotide group Chemical group 0.000 claims description 133
- 239000002773 nucleotide Substances 0.000 claims description 131
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 52
- 238000000338 in vitro Methods 0.000 claims description 51
- 239000000203 mixture Substances 0.000 claims description 32
- 230000000051 modifying effect Effects 0.000 claims description 30
- 238000004519 manufacturing process Methods 0.000 claims description 26
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 25
- 108091028113 Trans-activating crRNA Proteins 0.000 claims description 19
- 238000011065 in-situ storage Methods 0.000 claims description 13
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 6
- 102100035102 E3 ubiquitin-protein ligase MYCBP2 Human genes 0.000 claims description 4
- 108091027544 Subgenomic mRNA Proteins 0.000 claims 3
- 101710163270 Nuclease Proteins 0.000 abstract description 37
- 230000001413 cellular effect Effects 0.000 abstract description 10
- 230000001976 improved effect Effects 0.000 abstract description 8
- 210000004027 cell Anatomy 0.000 description 429
- 108090000623 proteins and genes Proteins 0.000 description 132
- 230000000694 effects Effects 0.000 description 107
- 230000004048 modification Effects 0.000 description 93
- 238000012986 modification Methods 0.000 description 93
- 102000004169 proteins and genes Human genes 0.000 description 91
- 235000018102 proteins Nutrition 0.000 description 87
- 230000014509 gene expression Effects 0.000 description 61
- 230000000295 complement effect Effects 0.000 description 48
- 239000013598 vector Substances 0.000 description 46
- 230000001105 regulatory effect Effects 0.000 description 42
- 230000004927 fusion Effects 0.000 description 39
- 108091034117 Oligonucleotide Proteins 0.000 description 38
- 235000001014 amino acid Nutrition 0.000 description 37
- 230000027455 binding Effects 0.000 description 37
- -1 rRNA Proteins 0.000 description 37
- 229940024606 amino acid Drugs 0.000 description 36
- 150000001413 amino acids Chemical class 0.000 description 35
- 210000000130 stem cell Anatomy 0.000 description 35
- 125000006850 spacer group Chemical group 0.000 description 32
- 230000001965 increasing effect Effects 0.000 description 31
- 230000035897 transcription Effects 0.000 description 31
- 238000013518 transcription Methods 0.000 description 31
- 230000001939 inductive effect Effects 0.000 description 26
- 238000003776 cleavage reaction Methods 0.000 description 25
- 239000013604 expression vector Substances 0.000 description 25
- 230000007017 scission Effects 0.000 description 25
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 24
- 108091079001 CRISPR RNA Proteins 0.000 description 23
- 102000004190 Enzymes Human genes 0.000 description 23
- 108090000790 Enzymes Proteins 0.000 description 23
- 150000001875 compounds Chemical class 0.000 description 23
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 23
- 230000003612 virological effect Effects 0.000 description 22
- 235000003869 genetically modified organism Nutrition 0.000 description 20
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 19
- 241000700605 Viruses Species 0.000 description 19
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 19
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 19
- 239000013612 plasmid Substances 0.000 description 19
- 210000001519 tissue Anatomy 0.000 description 19
- 201000010099 disease Diseases 0.000 description 18
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 18
- 239000003814 drug Substances 0.000 description 18
- 235000000346 sugar Nutrition 0.000 description 18
- 125000003275 alpha amino acid group Chemical group 0.000 description 17
- 230000005782 double-strand break Effects 0.000 description 17
- 238000001727 in vivo Methods 0.000 description 17
- 241000701022 Cytomegalovirus Species 0.000 description 16
- 238000009396 hybridization Methods 0.000 description 16
- 230000006780 non-homologous end joining Effects 0.000 description 16
- 230000008439 repair process Effects 0.000 description 16
- 238000001890 transfection Methods 0.000 description 16
- 241000196324 Embryophyta Species 0.000 description 15
- 108091093037 Peptide nucleic acid Proteins 0.000 description 15
- 229940079593 drug Drugs 0.000 description 15
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 15
- 210000001778 pluripotent stem cell Anatomy 0.000 description 15
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 14
- 210000005260 human cell Anatomy 0.000 description 14
- 238000013519 translation Methods 0.000 description 14
- 108091033409 CRISPR Proteins 0.000 description 13
- 125000000217 alkyl group Chemical group 0.000 description 13
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical group C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 13
- 108091026890 Coding region Proteins 0.000 description 12
- 108020004705 Codon Proteins 0.000 description 12
- 241000699670 Mus sp. Species 0.000 description 12
- 210000001671 embryonic stem cell Anatomy 0.000 description 12
- 210000003527 eukaryotic cell Anatomy 0.000 description 12
- 230000006870 function Effects 0.000 description 12
- 108020001507 fusion proteins Proteins 0.000 description 12
- 102000037865 fusion proteins Human genes 0.000 description 12
- 238000010362 genome editing Methods 0.000 description 12
- 238000003780 insertion Methods 0.000 description 12
- 230000037431 insertion Effects 0.000 description 12
- 230000001404 mediated effect Effects 0.000 description 12
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 12
- 210000002569 neuron Anatomy 0.000 description 12
- 238000004806 packaging method and process Methods 0.000 description 12
- 230000002829 reductive effect Effects 0.000 description 12
- 238000011160 research Methods 0.000 description 12
- 238000006467 substitution reaction Methods 0.000 description 12
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 12
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 description 11
- 229930024421 Adenine Natural products 0.000 description 11
- 102000053602 DNA Human genes 0.000 description 11
- 108020004459 Small interfering RNA Proteins 0.000 description 11
- 229960000643 adenine Drugs 0.000 description 11
- 230000001580 bacterial effect Effects 0.000 description 11
- 239000003623 enhancer Substances 0.000 description 11
- 230000003993 interaction Effects 0.000 description 11
- 150000002632 lipids Chemical group 0.000 description 11
- 210000004962 mammalian cell Anatomy 0.000 description 11
- 238000005457 optimization Methods 0.000 description 11
- 238000003786 synthesis reaction Methods 0.000 description 11
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 10
- 108091023037 Aptamer Proteins 0.000 description 10
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 10
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 10
- 241000124008 Mammalia Species 0.000 description 10
- 230000015572 biosynthetic process Effects 0.000 description 10
- 230000015556 catabolic process Effects 0.000 description 10
- 230000021615 conjugation Effects 0.000 description 10
- 229940104302 cytosine Drugs 0.000 description 10
- 238000006731 degradation reaction Methods 0.000 description 10
- 238000012217 deletion Methods 0.000 description 10
- 102000015694 estrogen receptors Human genes 0.000 description 10
- 108010038795 estrogen receptors Proteins 0.000 description 10
- 238000001415 gene therapy Methods 0.000 description 10
- 239000005090 green fluorescent protein Substances 0.000 description 10
- 125000005647 linker group Chemical group 0.000 description 10
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 10
- 239000002105 nanoparticle Substances 0.000 description 10
- 239000002245 particle Substances 0.000 description 10
- 210000001236 prokaryotic cell Anatomy 0.000 description 10
- 239000004055 small Interfering RNA Substances 0.000 description 10
- 229940035893 uracil Drugs 0.000 description 10
- 241001465754 Metazoa Species 0.000 description 9
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 9
- 150000001408 amides Chemical class 0.000 description 9
- 239000003153 chemical reaction reagent Substances 0.000 description 9
- 230000037430 deletion Effects 0.000 description 9
- 230000002255 enzymatic effect Effects 0.000 description 9
- 210000004602 germ cell Anatomy 0.000 description 9
- 210000004940 nucleus Anatomy 0.000 description 9
- 241000894007 species Species 0.000 description 9
- 238000011282 treatment Methods 0.000 description 9
- 241000701161 unidentified adenovirus Species 0.000 description 9
- 241000283984 Rodentia Species 0.000 description 8
- 241000700584 Simplexvirus Species 0.000 description 8
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 8
- 230000000692 anti-sense effect Effects 0.000 description 8
- 238000013459 approach Methods 0.000 description 8
- 239000012636 effector Substances 0.000 description 8
- 230000006801 homologous recombination Effects 0.000 description 8
- 238000002744 homologous recombination Methods 0.000 description 8
- 230000000670 limiting effect Effects 0.000 description 8
- 239000002777 nucleoside Substances 0.000 description 8
- 230000009261 transgenic effect Effects 0.000 description 8
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 7
- 241000251468 Actinopterygii Species 0.000 description 7
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 7
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 7
- 241000702421 Dependoparvovirus Species 0.000 description 7
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 7
- 108020004422 Riboswitch Proteins 0.000 description 7
- 210000003763 chloroplast Anatomy 0.000 description 7
- 235000012000 cholesterol Nutrition 0.000 description 7
- 229940107161 cholesterol Drugs 0.000 description 7
- 230000003247 decreasing effect Effects 0.000 description 7
- 230000002068 genetic effect Effects 0.000 description 7
- 238000010353 genetic engineering Methods 0.000 description 7
- 125000000623 heterocyclic group Chemical group 0.000 description 7
- 230000015788 innate immune response Effects 0.000 description 7
- 239000002502 liposome Substances 0.000 description 7
- 239000000047 product Substances 0.000 description 7
- 238000003259 recombinant expression Methods 0.000 description 7
- 230000006798 recombination Effects 0.000 description 7
- 238000005215 recombination Methods 0.000 description 7
- 230000002103 transcriptional effect Effects 0.000 description 7
- 230000033616 DNA repair Effects 0.000 description 6
- 108091029865 Exogenous DNA Proteins 0.000 description 6
- 108010033040 Histones Proteins 0.000 description 6
- 108060004795 Methyltransferase Proteins 0.000 description 6
- 241000699666 Mus <mouse, genus> Species 0.000 description 6
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 6
- 241000700159 Rattus Species 0.000 description 6
- 239000002253 acid Substances 0.000 description 6
- 150000007513 acids Chemical class 0.000 description 6
- 125000000539 amino acid group Chemical group 0.000 description 6
- 210000004102 animal cell Anatomy 0.000 description 6
- 239000000872 buffer Substances 0.000 description 6
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical group O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 6
- 238000001917 fluorescence detection Methods 0.000 description 6
- 239000012634 fragment Substances 0.000 description 6
- 239000003102 growth factor Substances 0.000 description 6
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 6
- 208000015181 infectious disease Diseases 0.000 description 6
- 239000003550 marker Substances 0.000 description 6
- 239000002609 medium Substances 0.000 description 6
- 229910052751 metal Inorganic materials 0.000 description 6
- 239000002184 metal Substances 0.000 description 6
- 238000000520 microinjection Methods 0.000 description 6
- 210000003470 mitochondria Anatomy 0.000 description 6
- 230000003285 pharmacodynamic effect Effects 0.000 description 6
- 238000000746 purification Methods 0.000 description 6
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 6
- 230000001177 retroviral effect Effects 0.000 description 6
- 230000035939 shock Effects 0.000 description 6
- 210000001082 somatic cell Anatomy 0.000 description 6
- 150000003431 steroids Chemical class 0.000 description 6
- 108091006107 transcriptional repressors Proteins 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 230000001131 transforming effect Effects 0.000 description 6
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 5
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 5
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 5
- 241000283690 Bos taurus Species 0.000 description 5
- 108700010070 Codon Usage Proteins 0.000 description 5
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 5
- 230000007018 DNA scission Effects 0.000 description 5
- 241000238631 Hexapoda Species 0.000 description 5
- 241000829100 Macaca mulatta polyomavirus 1 Species 0.000 description 5
- 102000016397 Methyltransferase Human genes 0.000 description 5
- 102000007474 Multiprotein Complexes Human genes 0.000 description 5
- 108010085220 Multiprotein Complexes Proteins 0.000 description 5
- 108091000080 Phosphotransferase Proteins 0.000 description 5
- 241000714474 Rous sarcoma virus Species 0.000 description 5
- 239000004098 Tetracycline Substances 0.000 description 5
- 102000040945 Transcription factor Human genes 0.000 description 5
- 108091023040 Transcription factor Proteins 0.000 description 5
- YIJVOACVHQZMKI-JXOAFFINSA-N [[(2r,3s,4r,5r)-5-(4-amino-5-methyl-2-oxopyrimidin-1-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 YIJVOACVHQZMKI-JXOAFFINSA-N 0.000 description 5
- 238000010521 absorption reaction Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 210000004556 brain Anatomy 0.000 description 5
- 210000004413 cardiac myocyte Anatomy 0.000 description 5
- 239000002299 complementary DNA Substances 0.000 description 5
- 230000006378 damage Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 102000034287 fluorescent proteins Human genes 0.000 description 5
- 108091006047 fluorescent proteins Proteins 0.000 description 5
- 150000002243 furanoses Chemical group 0.000 description 5
- 238000012239 gene modification Methods 0.000 description 5
- 230000005017 genetic modification Effects 0.000 description 5
- 235000013617 genetically modified food Nutrition 0.000 description 5
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 5
- 238000002347 injection Methods 0.000 description 5
- 239000007924 injection Substances 0.000 description 5
- 229920002521 macromolecule Polymers 0.000 description 5
- 125000000325 methylidene group Chemical group [H]C([H])=* 0.000 description 5
- 210000003205 muscle Anatomy 0.000 description 5
- 230000035772 mutation Effects 0.000 description 5
- 229910052757 nitrogen Inorganic materials 0.000 description 5
- 150000003833 nucleoside derivatives Chemical class 0.000 description 5
- 150000003904 phospholipids Chemical class 0.000 description 5
- 102000020233 phosphotransferase Human genes 0.000 description 5
- 230000008488 polyadenylation Effects 0.000 description 5
- 229920000768 polyamine Polymers 0.000 description 5
- 229920001223 polyethylene glycol Polymers 0.000 description 5
- 125000001424 substituent group Chemical group 0.000 description 5
- 239000000758 substrate Substances 0.000 description 5
- 230000004083 survival effect Effects 0.000 description 5
- 229960002180 tetracycline Drugs 0.000 description 5
- 229930101283 tetracycline Natural products 0.000 description 5
- 235000019364 tetracycline Nutrition 0.000 description 5
- 150000003522 tetracyclines Chemical class 0.000 description 5
- 230000001225 therapeutic effect Effects 0.000 description 5
- 229940113082 thymine Drugs 0.000 description 5
- 230000005030 transcription termination Effects 0.000 description 5
- 108091006106 transcriptional activators Proteins 0.000 description 5
- 238000010361 transduction Methods 0.000 description 5
- 230000026683 transduction Effects 0.000 description 5
- 241001430294 unidentified retrovirus Species 0.000 description 5
- 239000003981 vehicle Substances 0.000 description 5
- 239000013603 viral vector Substances 0.000 description 5
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 5
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 4
- PEHVGBZKEYRQSX-UHFFFAOYSA-N 7-deaza-adenine Chemical compound NC1=NC=NC2=C1C=CN2 PEHVGBZKEYRQSX-UHFFFAOYSA-N 0.000 description 4
- HCGHYQLFMPXSDU-UHFFFAOYSA-N 7-methyladenine Chemical compound C1=NC(N)=C2N(C)C=NC2=N1 HCGHYQLFMPXSDU-UHFFFAOYSA-N 0.000 description 4
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 4
- 241000252212 Danio rerio Species 0.000 description 4
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 4
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 4
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 4
- 241000255925 Diptera Species 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- 101710154606 Hemagglutinin Proteins 0.000 description 4
- 241000282412 Homo Species 0.000 description 4
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 4
- 241000725303 Human immunodeficiency virus Species 0.000 description 4
- 241000270322 Lepidosauria Species 0.000 description 4
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 4
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 4
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 4
- 241001494479 Pecora Species 0.000 description 4
- 102000012288 Phosphopyruvate Hydratase Human genes 0.000 description 4
- 108010022181 Phosphopyruvate Hydratase Proteins 0.000 description 4
- 239000004952 Polyamide Substances 0.000 description 4
- 229920002873 Polyethylenimine Polymers 0.000 description 4
- 101710176177 Protein A56 Proteins 0.000 description 4
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 4
- 230000004570 RNA-binding Effects 0.000 description 4
- 102000006382 Ribonucleases Human genes 0.000 description 4
- 108010083644 Ribonucleases Proteins 0.000 description 4
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 4
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 241000282887 Suidae Species 0.000 description 4
- 101710137500 T7 RNA polymerase Proteins 0.000 description 4
- 102000005421 acetyltransferase Human genes 0.000 description 4
- 108020002494 acetyltransferase Proteins 0.000 description 4
- DZBUGLKDJFMEHC-UHFFFAOYSA-N acridine Chemical compound C1=CC=CC2=CC3=CC=CC=C3N=C21 DZBUGLKDJFMEHC-UHFFFAOYSA-N 0.000 description 4
- 125000001931 aliphatic group Chemical group 0.000 description 4
- 125000000304 alkynyl group Chemical group 0.000 description 4
- 230000037429 base substitution Effects 0.000 description 4
- 230000031018 biological processes and functions Effects 0.000 description 4
- 239000001506 calcium phosphate Substances 0.000 description 4
- 229910000389 calcium phosphate Inorganic materials 0.000 description 4
- 235000011010 calcium phosphates Nutrition 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 229910052799 carbon Inorganic materials 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000007423 decrease Effects 0.000 description 4
- 239000003599 detergent Substances 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 238000004520 electroporation Methods 0.000 description 4
- 230000013020 embryo development Effects 0.000 description 4
- OVBPIULPVIDEAO-LBPRGKRZSA-N folic acid Chemical compound C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-LBPRGKRZSA-N 0.000 description 4
- 230000009368 gene silencing by RNA Effects 0.000 description 4
- 230000013595 glycosylation Effects 0.000 description 4
- 238000006206 glycosylation reaction Methods 0.000 description 4
- 230000012010 growth Effects 0.000 description 4
- 230000003781 hair follicle cycle Effects 0.000 description 4
- 125000001475 halogen functional group Chemical group 0.000 description 4
- 239000000185 hemagglutinin Substances 0.000 description 4
- 125000005842 heteroatom Chemical group 0.000 description 4
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 4
- 238000005304 joining Methods 0.000 description 4
- 210000001161 mammalian embryo Anatomy 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 239000012528 membrane Substances 0.000 description 4
- 239000000178 monomer Substances 0.000 description 4
- 210000000287 oocyte Anatomy 0.000 description 4
- 230000037361 pathway Effects 0.000 description 4
- 230000035699 permeability Effects 0.000 description 4
- RDOWQLZANAYVLL-UHFFFAOYSA-N phenanthridine Chemical compound C1=CC=C2C3=CC=CC=C3C=NC2=C1 RDOWQLZANAYVLL-UHFFFAOYSA-N 0.000 description 4
- 229920002647 polyamide Polymers 0.000 description 4
- 229920000642 polymer Polymers 0.000 description 4
- 238000003752 polymerase chain reaction Methods 0.000 description 4
- 238000001556 precipitation Methods 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 230000008672 reprogramming Effects 0.000 description 4
- 238000012552 review Methods 0.000 description 4
- 150000003384 small molecules Chemical class 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 4
- 230000004960 subcellular localization Effects 0.000 description 4
- 208000024891 symptom Diseases 0.000 description 4
- 229940124597 therapeutic agent Drugs 0.000 description 4
- 150000003568 thioethers Chemical class 0.000 description 4
- ZEMGGZBWXRYJHK-UHFFFAOYSA-N thiouracil Chemical compound O=C1C=CNC(=S)N1 ZEMGGZBWXRYJHK-UHFFFAOYSA-N 0.000 description 4
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 4
- 230000034512 ubiquitination Effects 0.000 description 4
- 238000010798 ubiquitination Methods 0.000 description 4
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 4
- XUNKPNYCNUKOAU-VXJRNSOOSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-5-(diaminomethylideneamino)pentanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]a Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XUNKPNYCNUKOAU-VXJRNSOOSA-N 0.000 description 3
- BHQCQFFYRZLCQQ-UHFFFAOYSA-N (3alpha,5alpha,7alpha,12alpha)-3,7,12-trihydroxy-cholan-24-oic acid Natural products OC1CC2CC(O)CCC2(C)C2C1C1CCC(C(CCC(O)=O)C)C1(C)C(O)C2 BHQCQFFYRZLCQQ-UHFFFAOYSA-N 0.000 description 3
- QGVQZRDQPDLHHV-DPAQBDIFSA-N (3s,8s,9s,10r,13r,14s,17r)-10,13-dimethyl-17-[(2r)-6-methylheptan-2-yl]-2,3,4,7,8,9,11,12,14,15,16,17-dodecahydro-1h-cyclopenta[a]phenanthrene-3-thiol Chemical compound C1C=C2C[C@@H](S)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 QGVQZRDQPDLHHV-DPAQBDIFSA-N 0.000 description 3
- UVBYMVOUBXYSFV-XUTVFYLZSA-N 1-methylpseudouridine Chemical compound O=C1NC(=O)N(C)C=C1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 UVBYMVOUBXYSFV-XUTVFYLZSA-N 0.000 description 3
- PIINGYXNCHTJTF-UHFFFAOYSA-N 2-(2-azaniumylethylamino)acetate Chemical group NCCNCC(O)=O PIINGYXNCHTJTF-UHFFFAOYSA-N 0.000 description 3
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 3
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 description 3
- DVLFYONBTKHTER-UHFFFAOYSA-N 3-(N-morpholino)propanesulfonic acid Chemical compound OS(=O)(=O)CCCN1CCOCC1 DVLFYONBTKHTER-UHFFFAOYSA-N 0.000 description 3
- ZLAQATDNGLKIEV-UHFFFAOYSA-N 5-methyl-2-sulfanylidene-1h-pyrimidin-4-one Chemical compound CC1=CNC(=S)NC1=O ZLAQATDNGLKIEV-UHFFFAOYSA-N 0.000 description 3
- UJBCLAXPPIDQEE-UHFFFAOYSA-N 5-prop-1-ynyl-1h-pyrimidine-2,4-dione Chemical compound CC#CC1=CNC(=O)NC1=O UJBCLAXPPIDQEE-UHFFFAOYSA-N 0.000 description 3
- LPXQRXLUHJKZIE-UHFFFAOYSA-N 8-azaguanine Chemical compound NC1=NC(O)=C2NN=NC2=N1 LPXQRXLUHJKZIE-UHFFFAOYSA-N 0.000 description 3
- 229960005508 8-azaguanine Drugs 0.000 description 3
- 239000004475 Arginine Substances 0.000 description 3
- 241000271566 Aves Species 0.000 description 3
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 3
- 241000283707 Capra Species 0.000 description 3
- 239000004380 Cholic acid Substances 0.000 description 3
- 241000699800 Cricetinae Species 0.000 description 3
- 230000005778 DNA damage Effects 0.000 description 3
- 231100000277 DNA damage Toxicity 0.000 description 3
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 3
- 101710096438 DNA-binding protein Proteins 0.000 description 3
- 241000233866 Fungi Species 0.000 description 3
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 3
- 102000008157 Histone Demethylases Human genes 0.000 description 3
- 108010074870 Histone Demethylases Proteins 0.000 description 3
- 102000003893 Histone acetyltransferases Human genes 0.000 description 3
- 108090000246 Histone acetyltransferases Proteins 0.000 description 3
- 101000634835 Homo sapiens M1-specific T cell receptor alpha chain Proteins 0.000 description 3
- 101000634836 Homo sapiens T cell receptor alpha chain MC.7.G5 Proteins 0.000 description 3
- 101000669402 Homo sapiens Toll-like receptor 7 Proteins 0.000 description 3
- 101000800483 Homo sapiens Toll-like receptor 8 Proteins 0.000 description 3
- 241000713772 Human immunodeficiency virus 1 Species 0.000 description 3
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 3
- 102100034349 Integrase Human genes 0.000 description 3
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 3
- 241000283953 Lagomorpha Species 0.000 description 3
- 241000713666 Lentivirus Species 0.000 description 3
- 241001529936 Murinae Species 0.000 description 3
- YNLCVAQJIKOXER-UHFFFAOYSA-N N-[tris(hydroxymethyl)methyl]-3-aminopropanesulfonic acid Chemical compound OCC(CO)(CO)NCCCS(O)(=O)=O YNLCVAQJIKOXER-UHFFFAOYSA-N 0.000 description 3
- REYJJPSVUYRZGE-UHFFFAOYSA-N Octadecylamine Chemical compound CCCCCCCCCCCCCCCCCCN REYJJPSVUYRZGE-UHFFFAOYSA-N 0.000 description 3
- 241000283973 Oryctolagus cuniculus Species 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 3
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 3
- 108091036407 Polyadenylation Proteins 0.000 description 3
- 239000002202 Polyethylene glycol Substances 0.000 description 3
- 241000288906 Primates Species 0.000 description 3
- 108091008103 RNA aptamers Proteins 0.000 description 3
- 102000004389 Ribonucleoproteins Human genes 0.000 description 3
- 108010081734 Ribonucleoproteins Proteins 0.000 description 3
- 206010039491 Sarcoma Diseases 0.000 description 3
- 238000012300 Sequence Analysis Methods 0.000 description 3
- 241000193996 Streptococcus pyogenes Species 0.000 description 3
- 102100029452 T cell receptor alpha chain constant Human genes 0.000 description 3
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical group OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 3
- 102000002689 Toll-like receptor Human genes 0.000 description 3
- 108020000411 Toll-like receptor Proteins 0.000 description 3
- 102100039390 Toll-like receptor 7 Human genes 0.000 description 3
- 102100033110 Toll-like receptor 8 Human genes 0.000 description 3
- 108700019146 Transgenes Proteins 0.000 description 3
- 108091023045 Untranslated Region Proteins 0.000 description 3
- XVIYCJDWYLJQBG-UHFFFAOYSA-N acetic acid;adamantane Chemical compound CC(O)=O.C1C(C2)CC3CC1CC2C3 XVIYCJDWYLJQBG-UHFFFAOYSA-N 0.000 description 3
- 210000001789 adipocyte Anatomy 0.000 description 3
- 125000003342 alkenyl group Chemical group 0.000 description 3
- 235000009697 arginine Nutrition 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 210000002459 blastocyst Anatomy 0.000 description 3
- 230000000747 cardiac effect Effects 0.000 description 3
- 230000003197 catalytic effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 230000011088 chloroplast localization Effects 0.000 description 3
- BHQCQFFYRZLCQQ-OELDTZBJSA-N cholic acid Chemical compound C([C@H]1C[C@H]2O)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(O)=O)C)[C@@]2(C)[C@@H](O)C1 BHQCQFFYRZLCQQ-OELDTZBJSA-N 0.000 description 3
- 235000019416 cholic acid Nutrition 0.000 description 3
- 229960002471 cholic acid Drugs 0.000 description 3
- 239000000356 contaminant Substances 0.000 description 3
- 125000000753 cycloalkyl group Chemical group 0.000 description 3
- KXGVEGMKQFWNSR-UHFFFAOYSA-N deoxycholic acid Natural products C1CC2CC(O)CCC2(C)C2C1C1CCC(C(CCC(O)=O)C)C1(C)C(O)C2 KXGVEGMKQFWNSR-UHFFFAOYSA-N 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- GTZOYNFRVVHLDZ-UHFFFAOYSA-N dodecane-1,1-diol Chemical group CCCCCCCCCCCC(O)O GTZOYNFRVVHLDZ-UHFFFAOYSA-N 0.000 description 3
- 239000000975 dye Substances 0.000 description 3
- 210000003981 ectoderm Anatomy 0.000 description 3
- 210000001900 endoderm Anatomy 0.000 description 3
- 230000001973 epigenetic effect Effects 0.000 description 3
- 239000012894 fetal calf serum Substances 0.000 description 3
- 235000019152 folic acid Nutrition 0.000 description 3
- 239000011724 folic acid Substances 0.000 description 3
- 125000003827 glycol group Chemical group 0.000 description 3
- 238000004128 high performance liquid chromatography Methods 0.000 description 3
- 239000001257 hydrogen Substances 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 230000028993 immune response Effects 0.000 description 3
- 238000001638 lipofection Methods 0.000 description 3
- 230000014759 maintenance of location Effects 0.000 description 3
- 210000003716 mesoderm Anatomy 0.000 description 3
- 230000011987 methylation Effects 0.000 description 3
- 238000007069 methylation reaction Methods 0.000 description 3
- 230000025608 mitochondrion localization Effects 0.000 description 3
- 230000011278 mitosis Effects 0.000 description 3
- 238000010369 molecular cloning Methods 0.000 description 3
- 125000003835 nucleoside group Chemical group 0.000 description 3
- 125000000913 palmityl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 3
- 230000000149 penetrating effect Effects 0.000 description 3
- ONTNXMBMXUNDBF-UHFFFAOYSA-N pentatriacontane-17,18,19-triol Chemical compound CCCCCCCCCCCCCCCCC(O)C(O)C(O)CCCCCCCCCCCCCCCC ONTNXMBMXUNDBF-UHFFFAOYSA-N 0.000 description 3
- 239000010452 phosphate Substances 0.000 description 3
- 235000021317 phosphate Nutrition 0.000 description 3
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 3
- 108091008695 photoreceptors Proteins 0.000 description 3
- 108010011110 polyarginine Proteins 0.000 description 3
- 108010054624 red fluorescent protein Proteins 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 150000003839 salts Chemical class 0.000 description 3
- 230000005783 single-strand break Effects 0.000 description 3
- 210000002460 smooth muscle Anatomy 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 229910052717 sulfur Inorganic materials 0.000 description 3
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 3
- ZMANZCXQSJIPKH-UHFFFAOYSA-O triethylammonium ion Chemical compound CC[NH+](CC)CC ZMANZCXQSJIPKH-UHFFFAOYSA-O 0.000 description 3
- 125000002948 undecyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 3
- 210000005253 yeast cell Anatomy 0.000 description 3
- SGKRLCUYIXIAHR-AKNGSSGZSA-N (4s,4ar,5s,5ar,6r,12ar)-4-(dimethylamino)-1,5,10,11,12a-pentahydroxy-6-methyl-3,12-dioxo-4a,5,5a,6-tetrahydro-4h-tetracene-2-carboxamide Chemical compound C1=CC=C2[C@H](C)[C@@H]([C@H](O)[C@@H]3[C@](C(O)=C(C(N)=O)C(=O)[C@H]3N(C)C)(O)C3=O)C3=C(O)C2=C1O SGKRLCUYIXIAHR-AKNGSSGZSA-N 0.000 description 2
- FYADHXFMURLYQI-UHFFFAOYSA-N 1,2,4-triazine Chemical class C1=CN=NC=N1 FYADHXFMURLYQI-UHFFFAOYSA-N 0.000 description 2
- WJFKNYWRSNBZNX-UHFFFAOYSA-N 10H-phenothiazine Chemical compound C1=CC=C2NC3=CC=CC=C3SC2=C1 WJFKNYWRSNBZNX-UHFFFAOYSA-N 0.000 description 2
- VEPOHXYIFQMVHW-XOZOLZJESA-N 2,3-dihydroxybutanedioic acid (2S,3S)-3,4-dimethyl-2-phenylmorpholine Chemical compound OC(C(O)C(O)=O)C(O)=O.C[C@H]1[C@@H](OCCN1C)c1ccccc1 VEPOHXYIFQMVHW-XOZOLZJESA-N 0.000 description 2
- QSHACTSJHMKXTE-UHFFFAOYSA-N 2-(2-aminopropyl)-7h-purin-6-amine Chemical compound CC(N)CC1=NC(N)=C2NC=NC2=N1 QSHACTSJHMKXTE-UHFFFAOYSA-N 0.000 description 2
- KISWVXRQTGLFGD-UHFFFAOYSA-N 2-[[2-[[6-amino-2-[[2-[[2-[[5-amino-2-[[2-[[1-[2-[[6-amino-2-[(2,5-diamino-5-oxopentanoyl)amino]hexanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]pyrrolidine-2-carbonyl]amino]-3-hydroxypropanoyl]amino]-5-oxopentanoyl]amino]-5-(diaminomethylideneamino)p Chemical compound C1CCN(C(=O)C(CCCN=C(N)N)NC(=O)C(CCCCN)NC(=O)C(N)CCC(N)=O)C1C(=O)NC(CO)C(=O)NC(CCC(N)=O)C(=O)NC(CCCN=C(N)N)C(=O)NC(CO)C(=O)NC(CCCCN)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 KISWVXRQTGLFGD-UHFFFAOYSA-N 0.000 description 2
- FZWGECJQACGGTI-UHFFFAOYSA-N 2-amino-7-methyl-1,7-dihydro-6H-purin-6-one Chemical compound NC1=NC(O)=C2N(C)C=NC2=N1 FZWGECJQACGGTI-UHFFFAOYSA-N 0.000 description 2
- ICSNLGPSRYBMBD-UHFFFAOYSA-N 2-aminopyridine Chemical compound NC1=CC=CC=N1 ICSNLGPSRYBMBD-UHFFFAOYSA-N 0.000 description 2
- GOLORTLGFDVFDW-UHFFFAOYSA-N 3-(1h-benzimidazol-2-yl)-7-(diethylamino)chromen-2-one Chemical compound C1=CC=C2NC(C3=CC4=CC=C(C=C4OC3=O)N(CC)CC)=NC2=C1 GOLORTLGFDVFDW-UHFFFAOYSA-N 0.000 description 2
- OVONXEQGWXGFJD-UHFFFAOYSA-N 4-sulfanylidene-1h-pyrimidin-2-one Chemical compound SC=1C=CNC(=O)N=1 OVONXEQGWXGFJD-UHFFFAOYSA-N 0.000 description 2
- 102000040125 5-hydroxytryptamine receptor family Human genes 0.000 description 2
- 108091032151 5-hydroxytryptamine receptor family Proteins 0.000 description 2
- KXBCLNRMQPRVTP-UHFFFAOYSA-N 6-amino-1,5-dihydroimidazo[4,5-c]pyridin-4-one Chemical compound O=C1NC(N)=CC2=C1N=CN2 KXBCLNRMQPRVTP-UHFFFAOYSA-N 0.000 description 2
- DCPSTSVLRXOYGS-UHFFFAOYSA-N 6-amino-1h-pyrimidine-2-thione Chemical compound NC1=CC=NC(S)=N1 DCPSTSVLRXOYGS-UHFFFAOYSA-N 0.000 description 2
- QNNARSZPGNJZIX-UHFFFAOYSA-N 6-amino-5-prop-1-ynyl-1h-pyrimidin-2-one Chemical compound CC#CC1=CNC(=O)N=C1N QNNARSZPGNJZIX-UHFFFAOYSA-N 0.000 description 2
- LOSIULRWFAEMFL-UHFFFAOYSA-N 7-deazaguanine Chemical compound O=C1NC(N)=NC2=C1CC=N2 LOSIULRWFAEMFL-UHFFFAOYSA-N 0.000 description 2
- HRYKDUPGBWLLHO-UHFFFAOYSA-N 8-azaadenine Chemical compound NC1=NC=NC2=NNN=C12 HRYKDUPGBWLLHO-UHFFFAOYSA-N 0.000 description 2
- UJOBWOGCFQCDNV-UHFFFAOYSA-N 9H-carbazole Chemical compound C1=CC=C2C3=CC=CC=C3NC2=C1 UJOBWOGCFQCDNV-UHFFFAOYSA-N 0.000 description 2
- 239000013607 AAV vector Substances 0.000 description 2
- 108010013043 Acetylesterase Proteins 0.000 description 2
- 102000007469 Actins Human genes 0.000 description 2
- 108010085238 Actins Proteins 0.000 description 2
- 102100033647 Activity-regulated cytoskeleton-associated protein Human genes 0.000 description 2
- 101710159293 Acyl-CoA desaturase 1 Proteins 0.000 description 2
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- 102100037435 Antiviral innate immune response receptor RIG-I Human genes 0.000 description 2
- 241000269350 Anura Species 0.000 description 2
- 241000203069 Archaea Species 0.000 description 2
- 102000003823 Aromatic-L-amino-acid decarboxylases Human genes 0.000 description 2
- 108090000121 Aromatic-L-amino-acid decarboxylases Proteins 0.000 description 2
- 102000005427 Asialoglycoprotein Receptor Human genes 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 241000714230 Avian leukemia virus Species 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 206010006187 Breast cancer Diseases 0.000 description 2
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 description 2
- 101100421200 Caenorhabditis elegans sep-1 gene Proteins 0.000 description 2
- 101000909256 Caldicellulosiruptor bescii (strain ATCC BAA-1888 / DSM 6725 / Z-1320) DNA polymerase I Proteins 0.000 description 2
- 241000282472 Canis lupus familiaris Species 0.000 description 2
- 241000252229 Carassius auratus Species 0.000 description 2
- 241000269333 Caudata Species 0.000 description 2
- 241000700198 Cavia Species 0.000 description 2
- 241000243321 Cnidaria Species 0.000 description 2
- 108020004635 Complementary DNA Proteins 0.000 description 2
- 108090000695 Cytokines Proteins 0.000 description 2
- 102000004127 Cytokines Human genes 0.000 description 2
- 102100036279 DNA (cytosine-5)-methyltransferase 1 Human genes 0.000 description 2
- 101710177611 DNA polymerase II large subunit Proteins 0.000 description 2
- 101710184669 DNA polymerase II small subunit Proteins 0.000 description 2
- 230000004568 DNA-binding Effects 0.000 description 2
- 229920002307 Dextran Polymers 0.000 description 2
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 2
- 241000258955 Echinodermata Species 0.000 description 2
- 102100030013 Endoribonuclease Human genes 0.000 description 2
- 108010093099 Endoribonucleases Proteins 0.000 description 2
- 241000991587 Enterovirus C Species 0.000 description 2
- 101710091045 Envelope protein Proteins 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- NMJREATYWWNIKX-UHFFFAOYSA-N GnRH Chemical compound C1CCC(C(=O)NCC(N)=O)N1C(=O)C(CC(C)C)NC(=O)C(CC=1C2=CC=CC=C2NC=1)NC(=O)CNC(=O)C(NC(=O)C(CO)NC(=O)C(CC=1C2=CC=CC=C2NC=1)NC(=O)C(CC=1NC=NC=1)NC(=O)C1NC(=O)CC1)CC1=CC=C(O)C=C1 NMJREATYWWNIKX-UHFFFAOYSA-N 0.000 description 2
- 239000007995 HEPES buffer Substances 0.000 description 2
- 101000952099 Homo sapiens Antiviral innate immune response receptor RIG-I Proteins 0.000 description 2
- 101000931098 Homo sapiens DNA (cytosine-5)-methyltransferase 1 Proteins 0.000 description 2
- 101001062864 Homo sapiens Fatty acid-binding protein, adipocyte Proteins 0.000 description 2
- 101000831496 Homo sapiens Toll-like receptor 3 Proteins 0.000 description 2
- 229930010555 Inosine Natural products 0.000 description 2
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 2
- 102100021244 Integral membrane protein GPR180 Human genes 0.000 description 2
- 229930182816 L-glutamine Natural products 0.000 description 2
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 2
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 2
- URLZCHNOLZSCCA-VABKMULXSA-N Leu-enkephalin Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CNC(=O)CNC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=CC=C1 URLZCHNOLZSCCA-VABKMULXSA-N 0.000 description 2
- 239000007987 MES buffer Substances 0.000 description 2
- 239000007993 MOPS buffer Substances 0.000 description 2
- 241000713333 Mouse mammary tumor virus Species 0.000 description 2
- 241000714177 Murine leukemia virus Species 0.000 description 2
- 241000713883 Myeloproliferative sarcoma virus Species 0.000 description 2
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 2
- 102000008763 Neurofilament Proteins Human genes 0.000 description 2
- 108010088373 Neurofilament Proteins Proteins 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- 229930182555 Penicillin Natural products 0.000 description 2
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 2
- PCNDJXKNXGMECE-UHFFFAOYSA-N Phenazine Natural products C1=CC=CC2=NC3=CC=CC=C3N=C21 PCNDJXKNXGMECE-UHFFFAOYSA-N 0.000 description 2
- ABLZXFCXXLZCGV-UHFFFAOYSA-N Phosphorous acid Chemical class OP(O)=O ABLZXFCXXLZCGV-UHFFFAOYSA-N 0.000 description 2
- 229920001213 Polysorbate 20 Polymers 0.000 description 2
- 102000001253 Protein Kinase Human genes 0.000 description 2
- 101710149951 Protein Tat Proteins 0.000 description 2
- 101710188315 Protein X Proteins 0.000 description 2
- 101000902592 Pyrococcus furiosus (strain ATCC 43587 / DSM 3638 / JCM 8422 / Vc1) DNA polymerase Proteins 0.000 description 2
- 230000007022 RNA scission Effects 0.000 description 2
- 239000012980 RPMI-1640 medium Substances 0.000 description 2
- 102100038247 Retinol-binding protein 3 Human genes 0.000 description 2
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 2
- 108091006300 SLC2A4 Proteins 0.000 description 2
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 101000857870 Squalus acanthias Gonadoliberin Proteins 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 description 2
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 2
- 102000001435 Synapsin Human genes 0.000 description 2
- 108050009621 Synapsin Proteins 0.000 description 2
- 101150052863 THY1 gene Proteins 0.000 description 2
- 108010027179 Tacrolimus Binding Proteins Proteins 0.000 description 2
- 102000018679 Tacrolimus Binding Proteins Human genes 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 102100024324 Toll-like receptor 3 Human genes 0.000 description 2
- 108700009124 Transcription Initiation Site Proteins 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- 108091000117 Tyrosine 3-Monooxygenase Proteins 0.000 description 2
- 102000048218 Tyrosine 3-monooxygenases Human genes 0.000 description 2
- 108020004417 Untranslated RNA Proteins 0.000 description 2
- 102000039634 Untranslated RNA Human genes 0.000 description 2
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 241000700618 Vaccinia virus Species 0.000 description 2
- 208000027418 Wounds and injury Diseases 0.000 description 2
- NMFHJNAPXOMSRX-PUPDPRJKSA-N [(1r)-3-(3,4-dimethoxyphenyl)-1-[3-(2-morpholin-4-ylethoxy)phenyl]propyl] (2s)-1-[(2s)-2-(3,4,5-trimethoxyphenyl)butanoyl]piperidine-2-carboxylate Chemical compound C([C@@H](OC(=O)[C@@H]1CCCCN1C(=O)[C@@H](CC)C=1C=C(OC)C(OC)=C(OC)C=1)C=1C=C(OCCN2CCOCC2)C=CC=1)CC1=CC=C(OC)C(OC)=C1 NMFHJNAPXOMSRX-PUPDPRJKSA-N 0.000 description 2
- FHHZHGZBHYYWTG-INFSMZHSSA-N [(2r,3s,4r,5r)-5-(2-amino-7-methyl-6-oxo-3h-purin-9-ium-9-yl)-3,4-dihydroxyoxolan-2-yl]methyl [[[(2r,3s,4r,5r)-5-(2-amino-6-oxo-3h-purin-9-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-hydroxyphosphoryl] phosphate Chemical compound N1C(N)=NC(=O)C2=C1[N+]([C@H]1[C@@H]([C@H](O)[C@@H](COP([O-])(=O)OP(O)(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](O)[C@@H](O3)N3C4=C(C(N=C(N)N4)=O)N=C3)O)O1)O)=CN2C FHHZHGZBHYYWTG-INFSMZHSSA-N 0.000 description 2
- LCQWKKZWHQFOAH-UHFFFAOYSA-N [[3,4-dihydroxy-5-[6-(methylamino)purin-9-yl]oxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=NC=2C(NC)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O LCQWKKZWHQFOAH-UHFFFAOYSA-N 0.000 description 2
- 230000003213 activating effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 239000012190 activator Substances 0.000 description 2
- 238000001042 affinity chromatography Methods 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- 125000005083 alkoxyalkoxy group Chemical group 0.000 description 2
- 125000002877 alkyl aryl group Chemical group 0.000 description 2
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 125000003277 amino group Chemical group 0.000 description 2
- 125000005122 aminoalkylamino group Chemical group 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- PYKYMHQGRFAEBM-UHFFFAOYSA-N anthraquinone Natural products CCC(=O)c1c(O)c2C(=O)C3C(C=CC=C3O)C(=O)c2cc1CC(=O)OC PYKYMHQGRFAEBM-UHFFFAOYSA-N 0.000 description 2
- 150000004056 anthraquinones Chemical class 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 230000001775 anti-pathogenic effect Effects 0.000 description 2
- 230000000840 anti-viral effect Effects 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 239000002246 antineoplastic agent Substances 0.000 description 2
- 125000000637 arginyl group Chemical class N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 2
- 125000003710 aryl alkyl group Chemical group 0.000 description 2
- 108010006523 asialoglycoprotein receptor Proteins 0.000 description 2
- 108010028263 bacteriophage T3 RNA polymerase Proteins 0.000 description 2
- 230000004071 biological effect Effects 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 229960002685 biotin Drugs 0.000 description 2
- 235000020958 biotin Nutrition 0.000 description 2
- 239000011616 biotin Substances 0.000 description 2
- 210000000234 capsid Anatomy 0.000 description 2
- 125000004432 carbon atom Chemical group C* 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 230000024245 cell differentiation Effects 0.000 description 2
- 230000010261 cell growth Effects 0.000 description 2
- 230000004700 cellular uptake Effects 0.000 description 2
- 239000013611 chromosomal DNA Substances 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 125000001995 cyclobutyl group Chemical group [H]C1([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 2
- 125000000596 cyclohexenyl group Chemical group C1(=CCCCC1)* 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- 230000005860 defense response to virus Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 229960003722 doxycycline Drugs 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 210000002257 embryonic structure Anatomy 0.000 description 2
- 230000004049 epigenetic modification Effects 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 230000029142 excretion Effects 0.000 description 2
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 2
- 229940014144 folate Drugs 0.000 description 2
- 150000003948 formamides Chemical class 0.000 description 2
- 125000000524 functional group Chemical group 0.000 description 2
- 238000003209 gene knockout Methods 0.000 description 2
- 238000010363 gene targeting Methods 0.000 description 2
- 238000007429 general method Methods 0.000 description 2
- 210000001654 germ layer Anatomy 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 125000000592 heterocycloalkyl group Chemical group 0.000 description 2
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 2
- 230000036039 immunity Effects 0.000 description 2
- 230000005847 immunogenicity Effects 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 208000014674 injury Diseases 0.000 description 2
- 229960003786 inosine Drugs 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 108010048996 interstitial retinol-binding protein Proteins 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 238000007913 intrathecal administration Methods 0.000 description 2
- 210000004153 islets of langerhan Anatomy 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 2
- 239000008101 lactose Substances 0.000 description 2
- 238000011031 large-scale manufacturing process Methods 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 230000004060 metabolic process Effects 0.000 description 2
- 239000003607 modifier Substances 0.000 description 2
- 238000009126 molecular therapy Methods 0.000 description 2
- 230000001537 neural effect Effects 0.000 description 2
- 210000005044 neurofilament Anatomy 0.000 description 2
- 108010054543 nonaarginine Proteins 0.000 description 2
- 235000015097 nutrients Nutrition 0.000 description 2
- 210000003463 organelle Anatomy 0.000 description 2
- 125000001181 organosilyl group Chemical group [SiH3]* 0.000 description 2
- 229910052760 oxygen Inorganic materials 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 229940049954 penicillin Drugs 0.000 description 2
- 229950000688 phenothiazine Drugs 0.000 description 2
- 150000008300 phosphoramidites Chemical class 0.000 description 2
- 229910052698 phosphorus Inorganic materials 0.000 description 2
- 229920000724 poly(L-arginine) polymer Polymers 0.000 description 2
- 229920000447 polyanionic polymer Polymers 0.000 description 2
- 229920000570 polyether Polymers 0.000 description 2
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 2
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 2
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- 108020001580 protein domains Proteins 0.000 description 2
- 108060006633 protein kinase Proteins 0.000 description 2
- 230000017854 proteolysis Effects 0.000 description 2
- 210000001938 protoplast Anatomy 0.000 description 2
- WHFQORJQTYYOBK-UHFFFAOYSA-N purine-6,6-diamine Chemical compound NC1(N)N=CN=C2N=CN=C12 WHFQORJQTYYOBK-UHFFFAOYSA-N 0.000 description 2
- 150000003212 purines Chemical class 0.000 description 2
- 150000003230 pyrimidines Chemical class 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000007115 recruitment Effects 0.000 description 2
- 125000006853 reporter group Chemical group 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 230000010473 stable expression Effects 0.000 description 2
- 229960005322 streptomycin Drugs 0.000 description 2
- 150000008163 sugars Chemical class 0.000 description 2
- 239000011593 sulfur Substances 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 150000003573 thiols Chemical class 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000011830 transgenic mouse model Methods 0.000 description 2
- 230000010474 transient expression Effects 0.000 description 2
- 102000027257 transmembrane receptors Human genes 0.000 description 2
- 108091008578 transmembrane receptors Proteins 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- 241001515965 unidentified phage Species 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- 239000011534 wash buffer Substances 0.000 description 2
- 229940075420 xanthine Drugs 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- ALNDFFUAQIVVPG-NGJCXOISSA-N (2r,3r,4r)-3,4,5-trihydroxy-2-methoxypentanal Chemical compound CO[C@@H](C=O)[C@H](O)[C@H](O)CO ALNDFFUAQIVVPG-NGJCXOISSA-N 0.000 description 1
- YIMATHOGWXZHFX-WCTZXXKLSA-N (2r,3r,4r,5r)-5-(hydroxymethyl)-3-(2-methoxyethoxy)oxolane-2,4-diol Chemical compound COCCO[C@H]1[C@H](O)O[C@H](CO)[C@H]1O YIMATHOGWXZHFX-WCTZXXKLSA-N 0.000 description 1
- RAVVEEJGALCVIN-AGVBWZICSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-5-amino-2-[[(2s)-2-[[(2s)-2-[[(2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-2-[[2-[[(2s)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]acetyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]hexanoyl]amino]hexanoyl]amino]-5-(diamino Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RAVVEEJGALCVIN-AGVBWZICSA-N 0.000 description 1
- BEJKOYIMCGMNRB-GRHHLOCNSA-N (2s)-2-amino-3-(4-hydroxyphenyl)propanoic acid;(2s)-2-amino-3-phenylpropanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1.OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 BEJKOYIMCGMNRB-GRHHLOCNSA-N 0.000 description 1
- LAQPKDLYOBZWBT-NYLDSJSYSA-N (2s,4s,5r,6r)-5-acetamido-2-{[(2s,3r,4s,5s,6r)-2-{[(2r,3r,4r,5r)-5-acetamido-1,2-dihydroxy-6-oxo-4-{[(2s,3s,4r,5s,6s)-3,4,5-trihydroxy-6-methyloxan-2-yl]oxy}hexan-3-yl]oxy}-3,5-dihydroxy-6-(hydroxymethyl)oxan-4-yl]oxy}-4-hydroxy-6-[(1r,2r)-1,2,3-trihydrox Chemical compound O[C@H]1[C@H](O)[C@H](O)[C@H](C)O[C@H]1O[C@H]([C@@H](NC(C)=O)C=O)[C@@H]([C@H](O)CO)O[C@H]1[C@H](O)[C@@H](O[C@]2(O[C@H]([C@H](NC(C)=O)[C@@H](O)C2)[C@H](O)[C@H](O)CO)C(O)=O)[C@@H](O)[C@@H](CO)O1 LAQPKDLYOBZWBT-NYLDSJSYSA-N 0.000 description 1
- BRCNMMGLEUILLG-NTSWFWBYSA-N (4s,5r)-4,5,6-trihydroxyhexan-2-one Chemical group CC(=O)C[C@H](O)[C@H](O)CO BRCNMMGLEUILLG-NTSWFWBYSA-N 0.000 description 1
- 125000000008 (C1-C10) alkyl group Chemical group 0.000 description 1
- UFSCXDAOCAIFOG-UHFFFAOYSA-N 1,10-dihydropyrimido[5,4-b][1,4]benzothiazin-2-one Chemical compound S1C2=CC=CC=C2N=C2C1=CNC(=O)N2 UFSCXDAOCAIFOG-UHFFFAOYSA-N 0.000 description 1
- PTFYZDMJTFMPQW-UHFFFAOYSA-N 1,10-dihydropyrimido[5,4-b][1,4]benzoxazin-2-one Chemical compound O1C2=CC=CC=C2N=C2C1=CNC(=O)N2 PTFYZDMJTFMPQW-UHFFFAOYSA-N 0.000 description 1
- NCYCYZXNIZJOKI-IOUUIBBYSA-N 11-cis-retinal Chemical compound O=C/C=C(\C)/C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C NCYCYZXNIZJOKI-IOUUIBBYSA-N 0.000 description 1
- SXGZJKUKBWWHRA-UHFFFAOYSA-N 2-(N-morpholiniumyl)ethanesulfonate Chemical compound [O-]S(=O)(=O)CC[NH+]1CCOCC1 SXGZJKUKBWWHRA-UHFFFAOYSA-N 0.000 description 1
- JRYMOPZHXMVHTA-DAGMQNCNSA-N 2-amino-7-[(2r,3r,4s,5r)-3,4-dihydroxy-5-(hydroxymethyl)oxolan-2-yl]-1h-pyrrolo[2,3-d]pyrimidin-4-one Chemical compound C1=CC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O JRYMOPZHXMVHTA-DAGMQNCNSA-N 0.000 description 1
- WKMPTBDYDNUJLF-UHFFFAOYSA-N 2-fluoroadenine Chemical compound NC1=NC(F)=NC2=C1N=CN2 WKMPTBDYDNUJLF-UHFFFAOYSA-N 0.000 description 1
- JHRPHASLIZOEBJ-UHFFFAOYSA-N 2-methylpyridine-3-carbaldehyde Chemical compound CC1=NC=CC=C1C=O JHRPHASLIZOEBJ-UHFFFAOYSA-N 0.000 description 1
- SADPCIINLASURY-UHFFFAOYSA-N 2-morpholin-4-ylethanesulfonic acid;sodium Chemical class [Na].OS(=O)(=O)CCN1CCOCC1 SADPCIINLASURY-UHFFFAOYSA-N 0.000 description 1
- YNFSUOFXEVCDTC-UHFFFAOYSA-N 2-n-methyl-7h-purine-2,6-diamine Chemical compound CNC1=NC(N)=C2NC=NC2=N1 YNFSUOFXEVCDTC-UHFFFAOYSA-N 0.000 description 1
- LOJNBPNACKZWAI-UHFFFAOYSA-N 3-nitro-1h-pyrrole Chemical compound [O-][N+](=O)C=1C=CNC=1 LOJNBPNACKZWAI-UHFFFAOYSA-N 0.000 description 1
- ZAYHVCMSTBRABG-UHFFFAOYSA-N 5-Methylcytidine Natural products O=C1N=C(N)C(C)=CN1C1C(O)C(O)C(CO)O1 ZAYHVCMSTBRABG-UHFFFAOYSA-N 0.000 description 1
- LQLQRFGHAALLLE-UHFFFAOYSA-N 5-bromouracil Chemical compound BrC1=CNC(=O)NC1=O LQLQRFGHAALLLE-UHFFFAOYSA-N 0.000 description 1
- JDBGXEHEIRGOBU-UHFFFAOYSA-N 5-hydroxymethyluracil Chemical compound OCC1=CNC(=O)NC1=O JDBGXEHEIRGOBU-UHFFFAOYSA-N 0.000 description 1
- ZXIATBNUWJBBGT-JXOAFFINSA-N 5-methoxyuridine Chemical compound O=C1NC(=O)C(OC)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZXIATBNUWJBBGT-JXOAFFINSA-N 0.000 description 1
- ZAYHVCMSTBRABG-JXOAFFINSA-N 5-methylcytidine Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZAYHVCMSTBRABG-JXOAFFINSA-N 0.000 description 1
- OZFPSOBLQZPIAV-UHFFFAOYSA-N 5-nitro-1h-indole Chemical compound [O-][N+](=O)C1=CC=C2NC=CC2=C1 OZFPSOBLQZPIAV-UHFFFAOYSA-N 0.000 description 1
- FVFVNNKYKYZTJU-UHFFFAOYSA-N 6-chloro-1,3,5-triazine-2,4-diamine Chemical compound NC1=NC(N)=NC(Cl)=N1 FVFVNNKYKYZTJU-UHFFFAOYSA-N 0.000 description 1
- CKOMXBHMKXXTNW-UHFFFAOYSA-N 6-methyladenine Chemical compound CNC1=NC=NC2=C1N=CN2 CKOMXBHMKXXTNW-UHFFFAOYSA-N 0.000 description 1
- NJBMMMJOXRZENQ-UHFFFAOYSA-N 6H-pyrrolo[2,3-f]quinoline Chemical compound c1cc2ccc3[nH]cccc3c2n1 NJBMMMJOXRZENQ-UHFFFAOYSA-N 0.000 description 1
- 229940126670 AB-836 Drugs 0.000 description 1
- 101710159080 Aconitate hydratase A Proteins 0.000 description 1
- 101710159078 Aconitate hydratase B Proteins 0.000 description 1
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 1
- 102000011690 Adiponectin Human genes 0.000 description 1
- 108010076365 Adiponectin Proteins 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 108020005098 Anticodon Proteins 0.000 description 1
- 108020000948 Antisense Oligonucleotides Proteins 0.000 description 1
- 101000993093 Arabidopsis thaliana Heat stress transcription factor B-2a Proteins 0.000 description 1
- 235000007652 Arbutus Nutrition 0.000 description 1
- 240000008327 Arbutus unedo Species 0.000 description 1
- 241000945470 Arcturus Species 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- BHELIUBJHYAEDK-OAIUPTLZSA-N Aspoxicillin Chemical compound C1([C@H](C(=O)N[C@@H]2C(N3[C@H](C(C)(C)S[C@@H]32)C(O)=O)=O)NC(=O)[C@H](N)CC(=O)NC)=CC=C(O)C=C1 BHELIUBJHYAEDK-OAIUPTLZSA-N 0.000 description 1
- 229930192334 Auxin Natural products 0.000 description 1
- 241000713826 Avian leukosis virus Species 0.000 description 1
- 108091032955 Bacterial small RNA Proteins 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 241001536303 Botryococcus braunii Species 0.000 description 1
- 240000007124 Brassica oleracea Species 0.000 description 1
- 235000003899 Brassica oleracea var acephala Nutrition 0.000 description 1
- 235000012905 Brassica oleracea var viridis Nutrition 0.000 description 1
- 108010014064 CCCTC-Binding Factor Proteins 0.000 description 1
- 102000049320 CD36 Human genes 0.000 description 1
- 108010045374 CD36 Antigens Proteins 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- 101100180402 Caenorhabditis elegans jun-1 gene Proteins 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 241000589875 Campylobacter jejuni Species 0.000 description 1
- 241000282465 Canis Species 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108700004991 Cas12a Proteins 0.000 description 1
- 241000195597 Chlamydomonas reinhardtii Species 0.000 description 1
- 108091060290 Chromatid Proteins 0.000 description 1
- 108090000059 Complement factor D Proteins 0.000 description 1
- 102000003706 Complement factor D Human genes 0.000 description 1
- 108020004394 Complementary RNA Proteins 0.000 description 1
- 150000008574 D-amino acids Chemical group 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 102100024810 DNA (cytosine-5)-methyltransferase 3B Human genes 0.000 description 1
- 101710123222 DNA (cytosine-5)-methyltransferase 3B Proteins 0.000 description 1
- 230000007067 DNA methylation Effects 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 231100001074 DNA strand break Toxicity 0.000 description 1
- 108010046331 Deoxyribodipyrimidine photo-lyase Proteins 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 102100024746 Dihydrofolate reductase Human genes 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 108700006830 Drosophila Antp Proteins 0.000 description 1
- 241000255601 Drosophila melanogaster Species 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 102100038132 Endogenous retrovirus group K member 6 Pro protein Human genes 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 108091004242 G-Protein-Coupled Receptor Kinase 1 Proteins 0.000 description 1
- 102000004437 G-Protein-Coupled Receptor Kinase 1 Human genes 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 101000834253 Gallus gallus Actin, cytoplasmic 1 Proteins 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 102100035364 Growth/differentiation factor 3 Human genes 0.000 description 1
- 208000031886 HIV Infections Diseases 0.000 description 1
- 208000037357 HIV infectious disease Diseases 0.000 description 1
- 108060003760 HNH nuclease Proteins 0.000 description 1
- 102000029812 HNH nuclease Human genes 0.000 description 1
- 102100032606 Heat shock factor protein 1 Human genes 0.000 description 1
- 101710190344 Heat shock factor protein 1 Proteins 0.000 description 1
- 101150094793 Hes3 gene Proteins 0.000 description 1
- 101150029234 Hes5 gene Proteins 0.000 description 1
- 102000006947 Histones Human genes 0.000 description 1
- 101000922348 Homo sapiens C-X-C chemokine receptor type 4 Proteins 0.000 description 1
- 101000741445 Homo sapiens Calcitonin Proteins 0.000 description 1
- 101001023986 Homo sapiens Growth/differentiation factor 3 Proteins 0.000 description 1
- 101001139134 Homo sapiens Krueppel-like factor 4 Proteins 0.000 description 1
- 101001030211 Homo sapiens Myc proto-oncogene protein Proteins 0.000 description 1
- 101001001272 Homo sapiens Prostatic acid phosphatase Proteins 0.000 description 1
- 101000843556 Homo sapiens Transcription factor HES-1 Proteins 0.000 description 1
- 101000687905 Homo sapiens Transcription factor SOX-2 Proteins 0.000 description 1
- 101000976622 Homo sapiens Zinc finger protein 42 homolog Proteins 0.000 description 1
- 108700020121 Human Immunodeficiency Virus-1 rev Proteins 0.000 description 1
- 108700000788 Human immunodeficiency virus 1 tat peptide (47-57) Proteins 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- 108010061833 Integrases Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 101150105817 Irbp gene Proteins 0.000 description 1
- 102100020677 Krueppel-like factor 4 Human genes 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 108010021099 Lamin Type A Proteins 0.000 description 1
- 102000008201 Lamin Type A Human genes 0.000 description 1
- 108010021101 Lamin Type B Proteins 0.000 description 1
- 102000016267 Leptin Human genes 0.000 description 1
- 108010092277 Leptin Proteins 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 239000000232 Lipid Bilayer Substances 0.000 description 1
- 108090000362 Lymphotoxin-beta Proteins 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241000713869 Moloney murine leukemia virus Species 0.000 description 1
- 241000699660 Mus musculus Species 0.000 description 1
- 101000969137 Mus musculus Metallothionein-1 Proteins 0.000 description 1
- 101000976618 Mus musculus Zinc finger protein 42 Proteins 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 102100026925 Myosin regulatory light chain 2, ventricular/cardiac muscle isoform Human genes 0.000 description 1
- VQAYFKKCNSOZKM-IOSLPCCCSA-N N(6)-methyladenosine Chemical compound C1=NC=2C(NC)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O VQAYFKKCNSOZKM-IOSLPCCCSA-N 0.000 description 1
- OVBPIULPVIDEAO-UHFFFAOYSA-N N-Pteroyl-L-glutaminsaeure Natural products C=1N=C2NC(N)=NC(=O)C2=NC=1CNC1=CC=C(C(=O)NC(CCC(O)=O)C(O)=O)C=C1 OVBPIULPVIDEAO-UHFFFAOYSA-N 0.000 description 1
- VQAYFKKCNSOZKM-UHFFFAOYSA-N NSC 29409 Natural products C1=NC=2C(NC)=NC=NC=2N1C1OC(CO)C(O)C1O VQAYFKKCNSOZKM-UHFFFAOYSA-N 0.000 description 1
- 108091061960 Naked DNA Proteins 0.000 description 1
- 241001250129 Nannochloropsis gaditana Species 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 108700019961 Neoplasm Genes Proteins 0.000 description 1
- 102000048850 Neoplasm Genes Human genes 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- 108091005461 Nucleic proteins Proteins 0.000 description 1
- BZQFBWGGLXLEPQ-UHFFFAOYSA-N O-phosphoryl-L-serine Natural products OC(=O)C(N)COP(O)(O)=O BZQFBWGGLXLEPQ-UHFFFAOYSA-N 0.000 description 1
- 229910004679 ONO2 Inorganic materials 0.000 description 1
- 230000010718 Oxidation Activity Effects 0.000 description 1
- 102100035423 POU domain, class 5, transcription factor 1 Human genes 0.000 description 1
- 101710126211 POU domain, class 5, transcription factor 1 Proteins 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 108010077524 Peptide Elongation Factor 1 Proteins 0.000 description 1
- 102100027913 Peptidyl-prolyl cis-trans isomerase FKBP1A Human genes 0.000 description 1
- 108010043958 Peptoids Proteins 0.000 description 1
- 241000286209 Phasianidae Species 0.000 description 1
- 102100028251 Phosphoglycerate kinase 1 Human genes 0.000 description 1
- 101710139464 Phosphoglycerate kinase 1 Proteins 0.000 description 1
- 108090001050 Phosphoric Diester Hydrolases Proteins 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 241000270285 Pituophis Species 0.000 description 1
- 102100031574 Platelet glycoprotein 4 Human genes 0.000 description 1
- 101710202087 Platelet glycoprotein 4 Proteins 0.000 description 1
- RVGRUAULSDPKGF-UHFFFAOYSA-N Poloxamer Chemical compound C1CO1.CC1CO1 RVGRUAULSDPKGF-UHFFFAOYSA-N 0.000 description 1
- 108010039918 Polylysine Proteins 0.000 description 1
- 102000029797 Prion Human genes 0.000 description 1
- 108091000054 Prion Proteins 0.000 description 1
- 102100035703 Prostatic acid phosphatase Human genes 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 102000055027 Protein Methyltransferases Human genes 0.000 description 1
- 108700040121 Protein Methyltransferases Proteins 0.000 description 1
- 229930185560 Pseudouridine Natural products 0.000 description 1
- PTJWIQPHWPFNBW-UHFFFAOYSA-N Pseudouridine C Natural products OC1C(O)C(CO)OC1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-UHFFFAOYSA-N 0.000 description 1
- 108091093078 Pyrimidine dimer Proteins 0.000 description 1
- 108010078067 RNA Polymerase III Proteins 0.000 description 1
- 102000014450 RNA Polymerase III Human genes 0.000 description 1
- 230000026279 RNA modification Effects 0.000 description 1
- 230000006819 RNA synthesis Effects 0.000 description 1
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 1
- 101710105008 RNA-binding protein Proteins 0.000 description 1
- 101100016889 Rattus norvegicus Hes2 gene Proteins 0.000 description 1
- 101100247004 Rattus norvegicus Qsox1 gene Proteins 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 102000007156 Resistin Human genes 0.000 description 1
- 108010047909 Resistin Proteins 0.000 description 1
- 208000007014 Retinitis pigmentosa Diseases 0.000 description 1
- 102100040756 Rhodopsin Human genes 0.000 description 1
- 108090000820 Rhodopsin Proteins 0.000 description 1
- 108090000799 Rhodopsin kinases Proteins 0.000 description 1
- 102000003661 Ribonuclease III Human genes 0.000 description 1
- 108010057163 Ribonuclease III Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 101150086694 SLC22A3 gene Proteins 0.000 description 1
- 101100069498 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) MGE1 gene Proteins 0.000 description 1
- 241000593524 Sargassum patens Species 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 108091027568 Single-stranded nucleotide Proteins 0.000 description 1
- 102100029937 Smoothelin Human genes 0.000 description 1
- 101710151526 Smoothelin Proteins 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 241000713896 Spleen necrosis virus Species 0.000 description 1
- 206010055047 Splenic necrosis Diseases 0.000 description 1
- 241000191967 Staphylococcus aureus Species 0.000 description 1
- 102100028897 Stearoyl-CoA desaturase Human genes 0.000 description 1
- 101100054666 Streptomyces halstedii sch3 gene Proteins 0.000 description 1
- UCKMPCXJQFINFW-UHFFFAOYSA-N Sulphide Chemical compound [S-2] UCKMPCXJQFINFW-UHFFFAOYSA-N 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 108010076818 TEV protease Proteins 0.000 description 1
- 102000003570 TRPV5 Human genes 0.000 description 1
- 108010006877 Tacrolimus Binding Protein 1A Proteins 0.000 description 1
- 101710192266 Tegument protein VP22 Proteins 0.000 description 1
- 241000255588 Tephritidae Species 0.000 description 1
- 206010043276 Teratoma Diseases 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 102000006601 Thymidine Kinase Human genes 0.000 description 1
- 108020004440 Thymidine kinase Proteins 0.000 description 1
- 102000005497 Thymidylate Synthase Human genes 0.000 description 1
- 230000010632 Transcription Factor Activity Effects 0.000 description 1
- 102100037116 Transcription elongation factor 1 homolog Human genes 0.000 description 1
- 102100030798 Transcription factor HES-1 Human genes 0.000 description 1
- 102100024270 Transcription factor SOX-2 Human genes 0.000 description 1
- 102100027671 Transcriptional repressor CTCF Human genes 0.000 description 1
- 102000008579 Transposases Human genes 0.000 description 1
- 108010020764 Transposases Proteins 0.000 description 1
- 102000013534 Troponin C Human genes 0.000 description 1
- 101150034091 Trpv5 gene Proteins 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 102000006275 Ubiquitin-Protein Ligases Human genes 0.000 description 1
- 108010083111 Ubiquitin-Protein Ligases Proteins 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 108010067390 Viral Proteins Proteins 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 1
- 102100023550 Zinc finger protein 42 homolog Human genes 0.000 description 1
- SIIZPVYVXNXXQG-KGXOGWRBSA-N [(2r,3r,4r,5r)-5-(6-aminopurin-9-yl)-4-[[(3s,4r)-5-(6-aminopurin-9-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-3-hydroxyoxolan-2-yl]methyl [(2r,4r,5r)-2-(6-aminopurin-9-yl)-4-hydroxy-5-(phosphonooxymethyl)oxolan-3-yl] hydrogen phosphate Polymers C1=NC2=C(N)N=CN=C2N1[C@@H]1O[C@H](COP(O)(=O)OC2[C@@H](O[C@H](COP(O)(O)=O)[C@H]2O)N2C3=NC=NC(N)=C3N=C2)[C@@H](O)[C@H]1OP(O)(=O)OCC([C@@H](O)[C@H]1O)OC1N1C(N=CN=C2N)=C2N=C1 SIIZPVYVXNXXQG-KGXOGWRBSA-N 0.000 description 1
- RLXCFCYWFYXTON-JTTSDREOSA-N [(3S,8S,9S,10R,13S,14S,17R)-3-hydroxy-10,13-dimethyl-17-[(2R)-6-methylheptan-2-yl]-2,3,4,7,8,9,11,12,14,15,16,17-dodecahydro-1H-cyclopenta[a]phenanthren-16-yl] N-hexylcarbamate Chemical group C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC(OC(=O)NCCCCCC)[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 RLXCFCYWFYXTON-JTTSDREOSA-N 0.000 description 1
- AITFWTOEOZOQSI-KCRXGDJASA-N [1-[(2s,3s,4r,5r)-5-(4-amino-2-oxopyrimidin-1-yl)-3,4-dihydroxyoxolan-2-yl]ethoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](C(OP(O)(=O)OP(O)(=O)OP(O)(O)=O)C)O[C@H]1N1C(=O)N=C(N)C=C1 AITFWTOEOZOQSI-KCRXGDJASA-N 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000004721 adaptive immunity Effects 0.000 description 1
- 230000006154 adenylylation Effects 0.000 description 1
- 230000001070 adhesive effect Effects 0.000 description 1
- 210000004504 adult stem cell Anatomy 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 1
- 150000001336 alkenes Chemical class 0.000 description 1
- 230000029936 alkylation Effects 0.000 description 1
- 238000005804 alkylation reaction Methods 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 239000000074 antisense oligonucleotide Substances 0.000 description 1
- 238000012230 antisense oligonucleotides Methods 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 238000000149 argon plasma sintering Methods 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 239000002363 auxin Substances 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 238000002869 basic local alignment search tool Methods 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- WGDUUQDYDIIBKT-UHFFFAOYSA-N beta-Pseudouridine Natural products OC1OC(CN2C=CC(=O)NC2=O)C(O)C1O WGDUUQDYDIIBKT-UHFFFAOYSA-N 0.000 description 1
- 125000002619 bicyclic group Chemical group 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 210000000601 blood cell Anatomy 0.000 description 1
- 210000004958 brain cell Anatomy 0.000 description 1
- 239000006172 buffering agent Substances 0.000 description 1
- 244000309464 bull Species 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 238000010804 cDNA synthesis Methods 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000021523 carboxylation Effects 0.000 description 1
- 238000006473 carboxylation reaction Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 239000002458 cell surface marker Substances 0.000 description 1
- 210000004671 cell-free system Anatomy 0.000 description 1
- 230000030570 cellular localization Effects 0.000 description 1
- 230000036755 cellular response Effects 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- BHONFOAYRQZPKZ-LCLOTLQISA-N chembl269478 Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O)C1=CC=CC=C1 BHONFOAYRQZPKZ-LCLOTLQISA-N 0.000 description 1
- 230000007073 chemical hydrolysis Effects 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 235000013330 chicken meat Nutrition 0.000 description 1
- 210000004756 chromatid Anatomy 0.000 description 1
- 238000002983 circular dichroism Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000010959 commercial synthesis reaction Methods 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000010614 crotonylation reaction Methods 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- GVJHHUAWPYXKBD-UHFFFAOYSA-N d-alpha-tocopherol Natural products OC1=C(C)C(C)=C2OC(CCCC(C)CCCC(C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-UHFFFAOYSA-N 0.000 description 1
- 230000009615 deamination Effects 0.000 description 1
- 238000006481 deamination reaction Methods 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000022811 deglycosylation Effects 0.000 description 1
- 230000017858 demethylation Effects 0.000 description 1
- 238000010520 demethylation reaction Methods 0.000 description 1
- 230000006114 demyristoylation Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000027832 depurination Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 230000029180 desumoylation Effects 0.000 description 1
- 230000009504 deubiquitination Effects 0.000 description 1
- 229950006137 dexfosfoserine Drugs 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 239000005546 dideoxynucleotide Substances 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 108020001096 dihydrofolate reductase Proteins 0.000 description 1
- 239000013024 dilution buffer Substances 0.000 description 1
- 229940042399 direct acting antivirals protease inhibitors Drugs 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-N dithiophosphoric acid Chemical class OP(O)(S)=S NAGJZTKCGNOGPW-UHFFFAOYSA-N 0.000 description 1
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 235000013601 eggs Nutrition 0.000 description 1
- 230000002616 endonucleolytic effect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000006353 environmental stress Effects 0.000 description 1
- 230000007071 enzymatic hydrolysis Effects 0.000 description 1
- 238000006047 enzymatic hydrolysis reaction Methods 0.000 description 1
- CHNUOJQWGUIOLD-NFZZJPOKSA-N epalrestat Chemical compound C=1C=CC=CC=1\C=C(/C)\C=C1/SC(=S)N(CC(O)=O)C1=O CHNUOJQWGUIOLD-NFZZJPOKSA-N 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 238000002270 exclusion chromatography Methods 0.000 description 1
- 230000001036 exonucleolytic effect Effects 0.000 description 1
- 210000001808 exosome Anatomy 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 210000001723 extracellular space Anatomy 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 1
- 229960000304 folic acid Drugs 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 239000012737 fresh medium Substances 0.000 description 1
- 238000002825 functional assay Methods 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000003198 gene knock in Methods 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 238000003144 genetic modification method Methods 0.000 description 1
- 244000037671 genetically modified crops Species 0.000 description 1
- 229930195712 glutamate Natural products 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 1
- 101150118163 h gene Proteins 0.000 description 1
- 238000003505 heat denaturation Methods 0.000 description 1
- 230000006195 histone acetylation Effects 0.000 description 1
- 239000000710 homodimer Substances 0.000 description 1
- 208000033519 human immunodeficiency virus infectious disease Diseases 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 239000012216 imaging agent Substances 0.000 description 1
- 230000005934 immune activation Effects 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- SEOVTRFCIGRIMH-UHFFFAOYSA-N indole-3-acetic acid Chemical compound C1=CC=C2C(CC(=O)O)=CNC2=C1 SEOVTRFCIGRIMH-UHFFFAOYSA-N 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 206010022000 influenza Diseases 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 108091005434 innate immune receptors Proteins 0.000 description 1
- 210000005007 innate immune system Anatomy 0.000 description 1
- 150000002484 inorganic compounds Chemical class 0.000 description 1
- 229910010272 inorganic material Inorganic materials 0.000 description 1
- 239000000138 intercalating agent Substances 0.000 description 1
- 230000009878 intermolecular interaction Effects 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 210000003093 intracellular space Anatomy 0.000 description 1
- 238000007917 intracranial administration Methods 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 210000003292 kidney cell Anatomy 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- NRYBAZVQPHGZNS-ZSOCWYAHSA-N leptin Chemical compound O=C([C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(C)C)CCSC)N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CS)C(O)=O NRYBAZVQPHGZNS-ZSOCWYAHSA-N 0.000 description 1
- 229940039781 leptin Drugs 0.000 description 1
- 101150111214 lin-28 gene Proteins 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 210000005265 lung cell Anatomy 0.000 description 1
- 238000007885 magnetic separation Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 241001515942 marmosets Species 0.000 description 1
- 230000021121 meiosis Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 125000000956 methoxy group Chemical group [H]C([H])([H])O* 0.000 description 1
- 229920000609 methyl cellulose Polymers 0.000 description 1
- 239000001923 methylcellulose Substances 0.000 description 1
- YACKEPLHDIMKIO-UHFFFAOYSA-N methylphosphonic acid Chemical compound CP(O)(O)=O YACKEPLHDIMKIO-UHFFFAOYSA-N 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000000693 micelle Substances 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 230000000394 mitotic effect Effects 0.000 description 1
- 108091005601 modified peptides Proteins 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 108010065781 myosin light chain 2 Proteins 0.000 description 1
- 230000007498 myristoylation Effects 0.000 description 1
- GZCNJTFELNTSAB-UHFFFAOYSA-N n'-(7h-purin-6-yl)hexane-1,6-diamine Chemical compound NCCCCCCNC1=NC=NC2=C1NC=N2 GZCNJTFELNTSAB-UHFFFAOYSA-N 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 210000005155 neural progenitor cell Anatomy 0.000 description 1
- 125000001893 nitrooxy group Chemical group [O-][N+](=O)O* 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 102000026415 nucleotide binding proteins Human genes 0.000 description 1
- 108091014756 nucleotide binding proteins Proteins 0.000 description 1
- 230000009437 off-target effect Effects 0.000 description 1
- 238000006384 oligomerization reaction Methods 0.000 description 1
- 230000005868 ontogenesis Effects 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 125000004430 oxygen atom Chemical group O* 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- MCYTYTUNNNZWOK-LCLOTLQISA-N penetratin Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=CC=C1 MCYTYTUNNNZWOK-LCLOTLQISA-N 0.000 description 1
- 108010043655 penetratin Proteins 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 239000000816 peptidomimetic Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 125000001644 phenoxazinyl group Chemical class C1(=CC=CC=2OC3=CC=CC=C3NC12)* 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 150000004713 phosphodiesters Chemical group 0.000 description 1
- UEZVMMHDMIWARA-UHFFFAOYSA-M phosphonate Chemical group [O-]P(=O)=O UEZVMMHDMIWARA-UHFFFAOYSA-M 0.000 description 1
- PTMHPRAIXMAOOB-UHFFFAOYSA-L phosphoramidate Chemical compound NP([O-])([O-])=O PTMHPRAIXMAOOB-UHFFFAOYSA-L 0.000 description 1
- 150000008298 phosphoramidates Chemical class 0.000 description 1
- 125000004437 phosphorous atom Chemical group 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- BZQFBWGGLXLEPQ-REOHCLBHSA-N phosphoserine Chemical compound OC(=O)[C@@H](N)COP(O)(O)=O BZQFBWGGLXLEPQ-REOHCLBHSA-N 0.000 description 1
- USRGIUJOYOXOQJ-GBXIJSLDSA-N phosphothreonine Chemical compound OP(=O)(O)O[C@H](C)[C@H](N)C(O)=O USRGIUJOYOXOQJ-GBXIJSLDSA-N 0.000 description 1
- DCWXELXMIBXGTH-UHFFFAOYSA-N phosphotyrosine Chemical compound OC(=O)C(N)CC1=CC=C(OP(O)(O)=O)C=C1 DCWXELXMIBXGTH-UHFFFAOYSA-N 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 230000001766 physiological effect Effects 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 229960000502 poloxamer Drugs 0.000 description 1
- 229920001983 poloxamer Polymers 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 229920000728 polyester Polymers 0.000 description 1
- 229920000656 polylysine Polymers 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 210000002729 polyribosome Anatomy 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- XJMOSONTPMZWPB-UHFFFAOYSA-M propidium iodide Chemical compound [I-].[I-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CCC[N+](C)(CC)CC)=C1C1=CC=CC=C1 XJMOSONTPMZWPB-UHFFFAOYSA-M 0.000 description 1
- 230000006289 propionylation Effects 0.000 description 1
- 238000010515 propionylation reaction Methods 0.000 description 1
- 235000019419 proteases Nutrition 0.000 description 1
- 230000004952 protein activity Effects 0.000 description 1
- 102000021127 protein binding proteins Human genes 0.000 description 1
- 108091011138 protein binding proteins Proteins 0.000 description 1
- 238000001814 protein method Methods 0.000 description 1
- ZJFJVRPLNAMIKH-UHFFFAOYSA-N pseudo-u Chemical compound O=C1NC(=O)C(C)=CN1C1OC(COP(O)(=S)OC2C(OC(C2)N2C(N=C(N)C=C2)=O)COP(O)(=S)OC2C(OC(C2)N2C(N=C(N)C=C2)=O)COP(O)(=S)OC2C(OC(C2)N2C(N=C(N)C=C2)=O)COP(O)(=S)OC2C(OC(C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=S)OC2C(OC(C2)N2C3=C(C(NC(N)=N3)=O)N=C2)COP(O)(=S)OC2C(OC(C2)N2C3=NC=NC(N)=C3N=C2)COP(O)(=S)OC2C(OC(C2)N2C3=NC=NC(N)=C3N=C2)COP(O)(=S)OC2C(OC(C2)N2C(N=C(N)C=C2)=O)COP(O)(=S)OC2C(OC(C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=S)OC2C(OC(C2)N2C(NC(=O)C(C)=C2)=O)COP(O)(=S)OC2C(OC(C2)N2C3=C(C(NC(N)=N3)=O)N=C2)COP(O)(=S)OC2C(OC(C2)N2C3=C(C(NC(N)=N3)=O)N=C2)COP(O)(=S)OC2C(OC(C2)N2C3=C(C(NC(N)=N3)=O)N=C2)COP(O)(=S)OC2C(OC(C2)N2C3=NC=NC(N)=C3N=C2)CO)C(O)C1 ZJFJVRPLNAMIKH-UHFFFAOYSA-N 0.000 description 1
- PTJWIQPHWPFNBW-GBNDHIKLSA-N pseudouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1C1=CNC(=O)NC1=O PTJWIQPHWPFNBW-GBNDHIKLSA-N 0.000 description 1
- IGFXRKMLLMBKSA-UHFFFAOYSA-N purine Chemical compound N1=C[N]C2=NC=NC2=C1 IGFXRKMLLMBKSA-UHFFFAOYSA-N 0.000 description 1
- UBQKCCHYAOITMY-UHFFFAOYSA-N pyridin-2-ol Chemical compound OC1=CC=CC=N1 UBQKCCHYAOITMY-UHFFFAOYSA-N 0.000 description 1
- 239000013635 pyrimidine dimer Substances 0.000 description 1
- RXTQGIIIYVEHBN-UHFFFAOYSA-N pyrimido[4,5-b]indol-2-one Chemical compound C1=CC=CC2=NC3=NC(=O)N=CC3=C21 RXTQGIIIYVEHBN-UHFFFAOYSA-N 0.000 description 1
- SRBUGYKMBLUTIS-UHFFFAOYSA-N pyrrolo[2,3-d]pyrimidin-2-one Chemical compound O=C1N=CC2=CC=NC2=N1 SRBUGYKMBLUTIS-UHFFFAOYSA-N 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 210000005132 reproductive cell Anatomy 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000007423 screening assay Methods 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 230000001743 silencing effect Effects 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 235000021092 sugar substitutes Nutrition 0.000 description 1
- IIACRCGMVDHOTQ-UHFFFAOYSA-N sulfamic acid Chemical group NS(O)(=O)=O IIACRCGMVDHOTQ-UHFFFAOYSA-N 0.000 description 1
- 150000003456 sulfonamides Chemical group 0.000 description 1
- BDHFUVZGWQCTTF-UHFFFAOYSA-M sulfonate Chemical compound [O-]S(=O)=O BDHFUVZGWQCTTF-UHFFFAOYSA-M 0.000 description 1
- 150000003457 sulfones Chemical group 0.000 description 1
- 150000003462 sulfoxides Chemical class 0.000 description 1
- 230000010741 sumoylation Effects 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 239000003765 sweetening agent Substances 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000010257 thawing Methods 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 229960001295 tocopherol Drugs 0.000 description 1
- 229930003799 tocopherol Natural products 0.000 description 1
- 235000010384 tocopherol Nutrition 0.000 description 1
- 239000011732 tocopherol Substances 0.000 description 1
- 108091008023 transcriptional regulators Proteins 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 125000000876 trifluoromethoxy group Chemical group FC(F)(F)O* 0.000 description 1
- 125000002023 trifluoromethyl group Chemical group FC(F)(F)* 0.000 description 1
- 239000013638 trimer Substances 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 241000701447 unidentified baculovirus Species 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 210000004509 vascular smooth muscle cell Anatomy 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- GVJHHUAWPYXKBD-IEOSBIPESA-N α-tocopherol Chemical compound OC1=C(C)C(C)=C2O[C@@](CCC[C@H](C)CCC[C@H](C)CCCC(C)C)(C)CCC2=C1C GVJHHUAWPYXKBD-IEOSBIPESA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Abstract
본원에는 신규 유형 V B-GEn.1 또는 B-GEn.2 뉴클레아제 및 그의 변이체를 사용하여, 세포 또는 무세포 환경에서 DNA를 표적화, 편집 또는 조작하기 위한 신규 시스템 뿐만 아니라 DNA를 조작하기 위한 방법 및 키트가 기재되어 있다. 신규 및 개선된 단일 가이드 RNA가 추가로 개시된다.
Description
본 개시내용은 일반적으로 분자 생물학 분야, 특히 유전자 편집을 위한 신규 CRISPR Cas RNA 프로그래밍가능 DNA 엔도뉴클레아제에 관한 것이다.
CRISPR-Cas 또는 CRISPR/Cas 시스템으로서 집합적으로 공지된, 클러스터링된 규칙적 간격의 짧은 회문식 반복부 (CRISPR) 및 CRISPR-연관 (Cas) 유전자는 현재 파지 감염에 대항하여 박테리아 및 고세균에 대한 면역을 제공하는 것으로 이해되고 있다. 원핵 적응 면역의 CRISPR-Cas 시스템은 매우 다양한 단백질 이펙터 비-코딩 요소 군 뿐만 아니라 로커스 아키텍처이며, 이들의 일부 예는 중요한 생명공학 물질을 생산하기 위해 조작 및 적응되었다.
숙주 방어에 관여하는 시스템의 구성요소는 DNA 또는 RNA를 변형시킬 수 있는 하나 이상의 이펙터 단백질, 및 이러한 단백질 활성이 파지 DNA 또는 RNA 상의 특이적 서열을 표적화하는 것을 담당하는 RNA 가이드 요소를 포함한다. RNA 가이드는 CRISPR RNA (crRNA)로 구성되며 이펙터 단백질(들)에 의한 표적화된 핵산 조작을 가능하게 하기 위해 부가의 트랜스-작용 RNA (tracrRNA)를 필요로 할 수 있다. crRNA는 crRNA와 이펙터 단백질의 결합을 담당하는 "직접 반복부"라는 세그먼트, 및 원하는 핵산 표적 서열에 상보적인 "스페이서 서열"이라는 세그먼트로 이루어진다. CRISPR 시스템은 crRNA의 스페이서 서열을 변형시킴으로써 대체 DNA 또는 RNA 표적을 표적화하도록 재프로그래밍될 수 있다.
CRISPR-Cas 시스템은 크게 2가지 클래스로 분류될 수 있다: 클래스 1 시스템은 crRNA 주위에 복합체를 함께 형성하는 다수의 이펙터 단백질로 구성되고, 클래스 2 시스템은 DNA 또는 RNA 기질을 표적화하기 위해 crRNA 가이드와 복합체를 이루는 단일 이펙터 단백질로 이루어진다. 클래스 2 시스템의 단일-서브유닛 이펙터 조성물은 조작 및 적용을 위한 간단한 구성요소 세트를 제공하므로 지금까지 프로그래밍가능 이펙터의 중요한 공급원이었다. 따라서, 신규 클래스 2 시스템의 발견, 조작 및 최적화는 게놈 조작 및 그 이상을 위한 광범위하고 강력한 프로그래밍가능 기술로 이어질 수 있다. CRISPR (클러스터링된 규칙적 간격의 짧은 회문식 반복부)-Cas (CRISPR 연관 단백질)의 RNA-가이드된 DNA 표적화 원리를 사용하여 게놈을 편집하는 것이 지난 몇 년 동안 널리 활용되어 왔다. CRISPR-Cas 시스템의 5가지 유형 (유형 I, 유형 II 및 IIb, 유형 III, 유형 V 및 유형 VI)이 보고되었다. 게놈 편집을 위한 CRISPR-Cas의 대부분의 사용은 유형 II 시스템에서 이루어졌다. 박테리아 유형 II CRISPR-Cas 시스템에 의해 제공되는 주요 이점은 프로그래밍가능 DNA 간섭에 대한 최소한의 요구 사항: 맞춤형 이중-RNA 구조에 의해 가이드되는 엔도뉴클레아제 Cas9에 있다. 스트렙토코쿠스 피오게네스(Streptococcus pyogenes)의 원래 유형 II 시스템에서 처음 입증된 바와 같이, 트랜스-활성화 CRISPR RNA (tracrRNA)는 전구체 CRISPR RNA (프리-crRNA)의 불변 반복부와 결합하여, Cas9의 존재 하에 RNase III에 의한 crRNA 공동 성숙과 Cas9에 의한 침입 DNA 절단 둘 다에 필수적인 이중-RNA를 형성한다. 스트렙토코쿠스 피오게네스에서 입증된 바와 같이, 성숙한 활성화 tracrRNA와 표적화 crRNA 간에 형성된 이중나선에 의해 가이드되는 Cas9는, 침입 동족 DNA에 부위-특이적 이중 가닥 DNA (dsDNA) 파손부를 도입한다. Cas9는 HNH 뉴클레아제 도메인을 사용하여 표적 가닥 (crRNA의 스페이서 서열에 상보적인 것으로서 정의됨)을 절단하고 RuvC-유사 도메인을 사용하여 비-표적 가닥을 절단하는 다중 도메인 효소이다.
유형 II CRISPR Cas 9 뉴클레아제 외에도, 수많은 상이한 유형 V CRISPR Cas 뉴클레아제, 예컨대 Cas12a, Cas12b, Cas12e, Cas12f, Cas13a, Cas13b가 보고되었다 (Koonin et al., Curr Opin Microbiol. 2017 Jun; 37: 67-78, 및 Makarova et al., Nat Rev Microbiol. 2020 Feb;18(2):67-83). 이러한 시스템 중 일부는 tracr RNA (Cas 12a, Cas 13a, cas 13b)를 필요로 하지 않는 반면, Cas 12b는 전형적으로 tracr RNA를 필요로 한다 (Koonin et al., Curr Opin Microbiol. 2017 Jun; 37: 67-78).
포유동물 세포에서의 게놈 편집은 부분적으로, 다양한 Cas9 단백질의 크기로 인해 제한되었다. 현재까지 가장 널리 사용되고 있는 효소인 스타필로코쿠스 피오게네스(Staphylococcus pyogenes)로부터의 Cas9 (SpyCas9)는 대략 4.2 kb의 DNA를 포함하며 (W02013/176722), 동족 단일 가이드 RNA (sgRNA)와 직접 조합하면 크기가 더욱 증가한다. 아데노-연관 바이러스는 유전자 요법 적용에서 Cas9 효소의 전달에 사용되는 벡터 중 하나이다. 그러나, AAV 카고 크기는 약 4.5 kb로 제한된다. 이러한 크기 제약으로 인해, sgRNA 및 잠재적인 DNA 복구 템플릿과 함께 Cas9를 전달하는 것은, 이러한 방법을 사용하는데 장애가 될 수 있다. 더 작은 Cas9 분자가 명확히 규명되었지만, 이들 대부분은 SpyCas9에 의해 사용된 것만큼 널리 규정되지 않은 프로토스페이서 인접 모티프 (PAM) 서열로 인해 어려움을 겪고 있다. 예를 들어, 스타필로코쿠스 아우레우스(Staphylococcus aureus) (SauCas9)는 "NNGRR(T)" 서열 (여기서, R = A 또는 G)을 사용하며, 캄필로박터 제주니(Campylobacter jejuni) (CjCas9)는 "NNNACAC"/"NNNRYAC" PAM (여기서 Y = T 또는 G)을 사용한다. PAM 모호성은 PAM에 대해 높거나 완벽한 서열 동일성을 지닌 오프-타겟 서열에서 효소의 바람직하지 않은 활성 가능성을 증가시킨다. 우연히 유사한 부위를 표적화하는 것 ("오프-타겟")이 유해 사건의 가능성을 증가시키기 때문에, 이들 시스템의 특이성은 여전히 우려 사항으로 남아 있다.
기존의 CRISPR-Cas 시스템은 일반적으로 하기와 같은 단점 중 하나 이상을 갖는다:
a) 이들의 크기가 너무 커서 아데노 연관 바이러스 (AAV)와 같이 확립된 치료상 적합한 바이러스 전달 시스템의 게놈 내부로 운반될 수 없음.
b) 이들 중 다수는 비-숙주 환경, 예를 들어 진핵 세포, 특히 포유동물 세포에서는 실질적으로 활성이 없음.
c) 이들의 뉴클레아제는 스페이서와 프로토스페이서 서열 간의 미스매치가 존재할 때 DNA 가닥 절단을 촉매할 수 있으며, 이는 예를 들어 유전자 치료 용도 또는 높은 정밀도를 필요로 하는 기타 적용 분야에 부적합하게 만드는 바람직하지 않은 오프 타겟 효과를 초래할 수 있음.
d) 이들은 포유동물에서의 생체 내 적용에 대한 사용을 제한할 수 있는 면역 반응을 촉발시킬 수 있음.
e) 이들은 DNA 표적화 세그먼트에 대한 표적 선택을 제한하는 복잡하고/거나 긴 PAM을 필요로 함.
f) 이들은 플라스미드 또는 바이러스 벡터로부터의 불량한 발현을 나타냄.
g) 이들은 활성이 되려면 부가의 RNA 서열을 필요로 하거나 또는 가이드 RNA의 일부로서 부가의 RNA 서열을 필요로 함.
본 발명은 B-GEn.1 (서열식별번호(SEQ ID NO): 1), B-Gen1.2 (서열식별번호: 39) 및 B-GEn.2 (서열식별번호: 2), 또는 전체 길이에 걸쳐 서열식별번호: 1, 2 또는 39 중 임의의 것에 따른 서열과 적어도 80%의 동일성, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95%, 특히 바람직하게 적어도 99%, 가장 바람직하게 적어도 99.5%의 아미노산 동일성을 갖는 임의의 단백질, 또는 그를 코딩하는 임의의 핵산을 포함하는, B-GEn으로 명명된 신규 유형 V CRISPR Cas 뉴클레아제에 관한 것이다.
대안적으로, 본 발명은 B-GEn.1 (서열식별번호: 1) 및 B-GEn.2 (서열식별번호: 2), 또는 전체 길이에 걸쳐 서열식별번호: 1, 2 중 임의의 것에 따른 서열과 적어도 80%의 동일성, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95%, 특히 바람직하게 적어도 99%, 가장 바람직하게 적어도 99.5%의 아미노산 동일성을 갖는 임의의 단백질, 또는 그를 코딩하는 임의의 핵산을 포함하는, B-GEn으로 명명된 신규 유형 V CRISPR Cas 뉴클레아제에 관한 것이다.
이는 추가로, B-GEn.1 또는 B-GEn.2, 서열식별번호: 3 및 서열식별번호: 4에 포함된 서열을 포함하는 적합한 가이드 RNA (특히 서열식별번호: 40-44에 따름), 및 표적 DNA를 포함하는 CRISPR Cas 시스템에 관한 것이다.
대안적인 실시양태에서, 임의의 B-Gen1.2 (서열식별번호: 39)는 B-GEn.1 (서열식별번호: 1)에 대한 본원의 임의의 실시양태에 따른 적합하고 기능적으로 동일한 대체물이다.
한 측면에서, 본원에는 세포 내 또는 시험관 내 하나 이상의 위치에서 표적 DNA를 표적화, 편집, 변형 또는 조작하는 방법이 제공되며, 이러한 방법은 (I) 본원에 개시된 이종 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 본원에 개시된 B-GEn.1 또는 B-GEn.2를 코딩하는 핵산을 세포 내로 또는 시험관 내 환경 내로 도입하는 단계; 및 (II) 하나 이상의 이종 단일 가이드 RNA(들) (sgRNA) 또는 이러한 하나 이상의 sgRNA(들)를 코딩하는 DNA(들)를 세포 내로 또는 시험관 내 환경 내로 도입하는 단계로서, 각각의 sgRNA 또는 이러한 sgRNA를 코딩하는 DNA는 (a) RNA를 포함하고 폴리뉴클레오티드 로커스 내의 표적 서열과 혼성화할 수 있는 조작된 DNA 표적화 세그먼트, (b) RNA로 구성된 tracr 메이트 서열, 및 (c) RNA로 구성된 tracr RNA 서열을 포함하며, 여기서 tracr 메이트 서열은 tracr 서열과 혼성화하고, 여기서 (a), (b) 및 (c)는 5'에서 3' 배향으로 배열되는 것인 단계; 및 (III) 표적 DNA에 하나 이상의 닉 또는 커트 또는 염기 편집을 생성하는 단계로서, 여기서 B-GEn.1 또는 B-GEn.2 폴리펩티드는 그의 프로세싱된 또는 비프로세싱된 형태로 sgRNA에 의해 표적 DNA로 지시되는 것인 단계를 포함한다.
한 측면에서, 본원에는 세포 내 또는 시험관 내 하나 이상의 위치에서 표적 DNA를 표적화, 편집, 변형 또는 조작하기 위한, 하기를 포함하는 조성물의 용도가 본원에 제공된다: (I) 본원에 개시된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그를 코딩하는 핵산; 및/또는 (II) 하나 이상의 단일 이종 가이드 RNA(들) (sgRNA) 또는 이러한 하나 이상의 sgRNA의 계내 생성에 적합한 DNA(들), 이들 각각은 (a) RNA로 구성되고 폴리뉴클레오티드 로커스 내의 이러한 표적 서열과 혼성화할 수 있는 조작된 DNA 표적화 세그먼트, (b) RNA로 구성된 tracr 메이트 서열, 및 (c) RNA로 구성된 tracr RNA 서열을 포함하며, 여기서 tracr 메이트 서열은 tracr 서열과 혼성화하고, 여기서 (c), (b) 및 (a)는 각각 5'에서 3' 배향으로 배열됨.
또 다른 측면에서, 본원에는 하기를 포함하는 세포가 제공된다: (I) 본원에 개시된 바와 같은 B-GEn.1 또는 B-GEn.2 폴리펩티드, 또는 본원에 개시된 B-GEn.1 또는 B-GEn.2 폴리펩티드를 코딩하는 핵산; 및 (II) 하나 이상의 단일 이종 가이드 RNA(들) (sgRNA) 또는 이러한 하나 이상의 sgRNA의 계내 생성에 적합한 DNA(들), 이들 각각은 (a) 폴리뉴클레오티드 로커스 내의 표적 서열과 혼성화할 수 있는 조작된 DNA 표적화 세그먼트, (b) tracr 메이트 서열, 및 (c) tracr RNA 서열을 포함하며, 여기서 tracr 메이트 서열은 tracr 서열과 혼성화할 수 있고, 여기서 (c), (b) 및 (a)는 각각 5'에서 3' 배향으로 배열됨.
또 다른 측면에서, 본원에는 하기를 포함하는 키트가 제공된다: (I) 본원에 개시된 바와 같은 B-GEn.1 또는 B-GEn.2 폴리펩티드를 코딩하는 핵산 서열, 여기서 B-GEn.1 또는 B-GEn.2를 코딩하는 핵산 서열은 프로모터에 작동가능하게 연결됨; 및 (II) 하나 이상의 단일 이종 가이드 RNA(들) (sgRNA) 또는 이러한 하나 이상의 sgRNA의 계내 생성에 적합한 DNA(들), 각각의 sgRNA는 (a) 폴리뉴클레오티드 로커스 내의 표적 서열과 혼성화할 수 있는 조작된 DNA 표적화 세그먼트, (b) tracr 메이트 서열, 및 (c) tracr RNA 서열을 포함하며, 여기서 tracr 메이트 서열은 tracr 서열과 혼성화할 수 있고, 여기서 (a), (b), 및 (c)는 5'에서 3' 배향으로 배열됨.
또 다른 측면에서, 5개의 합성적으로 유래되고 최적화된 sgRNA (서열식별번호: 40-44) 서열이 또한 본원에 개시된다. 이들 서열은 서열 특이적 가이드를 제공하는 3' 단부 상의 약 20개 뉴클레오티드의 서열 특이적 연장물을 필요로 한다.
낮은 활성 표적에 대한 B-GEn.1 (서열식별번호: 1) 및 잠재적으로 다른 유형 V CRISPR Cas 뉴클레아제의 활성을 개선시키고 향후 치료 프로그램에 대한 RNA 합성 부담을 감소시키기 위해, 단축되고 돌연변이된 sgRNA가 설계되었다. 서열식별번호: 40-44에 따른 sgRNA는 특히 편집이 어렵고 상당히 감소된 길이 (20개의 뉴클레오티드 가이드 서열로 표시됨)를 갖는 표적에 대해 개선된 활성을 나타낸다:
1. 서열식별번호: 40: B-GEn.1_sgRNA4, 117개 뉴클레오티드
2. 서열식별번호: 41: B-GEn.1_sgRNA4.2, 107개 뉴클레오티드
3. 서열식별번호: 42: B-GEn.1_sgRNA4.3, 107개 뉴클레오티드
4. 서열식별번호: 43: B-GEn.1_sgRNA4.4, 107개 뉴클레오티드
5. 서열식별번호: 44: B-GEn.1_sgRNA4.5, 106개 뉴클레오티드.
또 다른 측면에서 본 발명은 하기의 조합에 관한 것이다:
a) B-GEn.1 (서열식별번호: 1) 또는 B-GEn.1.2 (서열식별번호: 39), 또는 전체 길이에 걸쳐 서열식별번호: 1, 2 중 임의의 것에 따른 서열과 적어도 80%의 동일성, 바람직하게 적어도 85%, 보다 바람직하게 적어도 90%, 보다 더 바람직하게 적어도 95%, 특히 바람직하게 적어도 99%, 가장 바람직하게 적어도 99.5%의 아미노산 동일성을 갖는 임의의 단백질, 또는 그를 코딩하는 임의의 핵산, 및
b) 서열식별번호: 40, 41, 42, 43 및 45로부터 선택된 서열을 포함하는 sgRNA.
전형적으로, 이러한 sgRNA 서열은 그의 3' 단부 상에 표적 특이적 서열을 함유하며, 전형적으로 약 20개의 뉴클레오티드의 길이를 갖는다.
sgRNA는 다른 유형 V CRSIPR Cas 뉴클레아제에도 사용될 수 있다.
본원에 언급된 각각의 특허 문서 및 과학 논문, 및 그에 의해 인용된 특허 문서 및 과학 논문의 전체 개시내용은 모든 목적을 위해 본원에 참조로 명시적으로 포함된다.
본 발명의 부가의 특색 및 이점은 하기에 보다 특정하게 기재된다.
도 1은 CRISPR Cas 엔도뉴클레아제로서 B-GEn 폴리펩티드의 활성을 시험하는데 사용된 검정 뿐만 아니라 스크리닝 검정을 예시한다.
도 2는 실험 3의 결과를 나타낸다.
하기 sgRNA 서열: v1 서열식별번호: 3; v4 서열식별번호: 40; v4.2 서열식별번호: 41; v4.3 서열식별번호: 42; v4.4 서열식별번호: 43; v4.5 서열식별번호: 44이 사용되었고, v4.6, v5, v5.2, v5.3, v5.4, v5.5, v5.6은 보다 적은 활성 또는 비-활성 서열이다.
모든 sgRNA는 그의 3' 단부 상에 실시예 3에 따른 23개의 뉴클레오티드 긴 TCRA 서열 특이적 영역을 포함한다. TCRA 가이드 1의 경우 솔리드 바이고 TCRA 가이드 2의 경우 해치 바이다.
도 2는 실험 3의 결과를 나타낸다.
하기 sgRNA 서열: v1 서열식별번호: 3; v4 서열식별번호: 40; v4.2 서열식별번호: 41; v4.3 서열식별번호: 42; v4.4 서열식별번호: 43; v4.5 서열식별번호: 44이 사용되었고, v4.6, v5, v5.2, v5.3, v5.4, v5.5, v5.6은 보다 적은 활성 또는 비-활성 서열이다.
모든 sgRNA는 그의 3' 단부 상에 실시예 3에 따른 23개의 뉴클레오티드 긴 TCRA 서열 특이적 영역을 포함한다. TCRA 가이드 1의 경우 솔리드 바이고 TCRA 가이드 2의 경우 해치 바이다.
서열
목록에 대한 참조
본원에 개시된 서열은 BHC211037-FC_Sequence_Listing.xml로 명명된 서열 목록에 함유되어 있다. 서열식별번호: 1 (B-GEn.1 단백질) 및 서열식별번호: 2 (B-GEn.2 단백질)의 서열이 또한 인쇄되어 있다.
서열 목록에 나타나는 서열의 요약
발명의 상세한 설명
본 출원은 신규 CRISPR-Cas 뉴클레아제 및 이러한 뉴클레아제에 기반한 유전자 편집 시스템을 제공한다. 신규 뉴클레아제는 본원에서 B-GEn 뉴클레아제 또는 B-GEn.1 또는 B-GEn.2 뉴클레아제로서 지칭된다.
일반적으로, B-GEn 뉴클레아제 군은 표 1에 기재되는 하기 구성원을 포함한다:
본 발명에 따른 한 실시양태는 서열식별번호: 1, 2, 및 39와 비교하여 아미노산 수준에 대해 적어도 80% 동일한 폴리펩티드 또는 그를 코딩하는 핵산이다.
본 발명에 따른 하나의 바람직한 실시양태는 서열식별번호: 1, 2, 및 39와 비교하여 아미노산 수준에 대해 적어도 85% 동일한 폴리펩티드 또는 그를 코딩하는 핵산이다.
본 발명에 따른 하나의 보다 바람직한 실시양태는 서열식별번호: 1, 2, 및 39와 비교하여 아미노산 수준에 대해 적어도 90% 동일한 폴리펩티드 또는 그를 코딩하는 핵산이다.
본 발명에 따른 하나의 보다 더 바람직한 실시양태는 서열식별번호: 1, 2, 및 39와 비교하여 아미노산 수준에 대해 적어도 95% 동일한 폴리펩티드 또는 그를 코딩하는 핵산이다.
본 발명에 따른 하나의 특히 바람직한 실시양태는 서열식별번호: 1, 2, 및 39와 비교하여 아미노산 수준에 대해 적어도 99% 동일한 폴리펩티드 또는 그를 코딩하는 핵산이다.
본 발명에 따른 하나의 매우 특히 바람직한 실시양태는 서열식별번호: 1, 2, 및 39와 비교하여 아미노산 수준에 대해 적어도 99.5% 동일한 폴리펩티드 또는 그를 코딩하는 핵산이다.
본 발명에 따른 또 다른 실시양태는 B-GEn.1 또는 B-GEn.2의 하기 변이체이다:
(I) 전체 길이에 걸쳐 서열식별번호: 1 또는 2 중 임의의 것에 따른 서열과 적어도 80%, 예를 들어, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 적어도 99.5%의 아미노산 동일성에 대한 선호도가 증가하는 순서의 변이체;
(II) 무세포 반응에서 또는 원핵 세포에서 뿐만 아니라 식물 또는 동물과 같은 살아있는 유기체를 포함한 진핵 세포 환경에서도 B-GEn.1 또는 B-GEn.2 CRISPR 시스템의 적절한 활성을 수득하기 위해, 예를 들어 핵 국재화 신호로서 부가의 구성요소를 함유하는 (I)에 따른 변이체;
(III) B-GEn.1 또는 B-GEn.2 및 (I) 및 (II)에 따른 변이체를 코딩하는 상응하는 폴리뉴클레오티드 서열의 코돈 최적화된 변이체.
달리 명시되지 않는 한, 용어 B-GEn 및 B-GEn.1 또는 B-GEn.2는 (I), (II), (III) 하에 명시된 모든 변이체를 포함한다.
본 발명에 따른 또 다른 대안적 실시양태는 하기 아미노산 교환물: L235Q, K673R, D1036E을 갖는 B-GEn.1의 하기 변이체를 단독으로, 2가지의 조합으로, 또는 바람직하게 3가지 모두의 조합으로 사용한 것, 특히 서열식별번호: 39에 따른 B-GEn.1의 변이체이다:
(I) 전체 길이에 걸쳐 서열식별번호: 1 또는 39 중 임의의 것에 따른 서열과 적어도 80%, 예를 들어, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99%, 적어도 99.5%의 아미노산 동일성에 대한 선호도가 증가하는 순서의 변이체;
(II) 무세포 반응에서 또는 원핵 세포에서 뿐만 아니라 식물 또는 동물과 같은 살아있는 유기체를 포함한 진핵 세포 환경에서도 B-GEn.1 또는 B-GEn.1.2 CRISPR 시스템의 적절한 활성을 수득하기 위해, 예를 들어 핵 국재화 신호로서 부가의 구성요소를 함유하는 (I)에 따른 변이체;
(III) B-GEn.1 또는 B-GEn.1.2 및 (I) 및 (II)에 따른 변이체를 코딩하는 상응하는 폴리뉴클레오티드 서열의 코돈 최적화된 변이체.
달리 명시되지 않는 한, 용어 B-GEn 및 B-GEn.1 또는 B-GEn.2는 (I), (II), (III) 하에 명시된 모든 변이체를 포함한다.
B-
GEn
.1 또는 B-
GEn
.2를 기반으로 하는 CRISPR-Cas 시스템
본 발명에 따른 한 실시양태는 하기를 포함하는 조성물을 나타낸다:
(a) B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 이러한 B-GEn.1 또는 B-GEn.2를 코딩하는 폴리뉴클레오티드;
(b) 하기를 포함하는, 단일 이종 가이드 RNA (sgRNA) 또는 이러한 sgRNA의 계내 생성을 허용하는 DNA:
i. RNA로 구성되고 폴리뉴클레오티드 로커스 내의 표적 서열과 혼성화할 수 있는 조작된 DNA 표적화 세그먼트,
ii. RNA로 구성된 tracr 메이트 서열, 및
iii. RNA로 구성된 tracr RNA 서열,
여기서 tracr 메이트 서열은 tracr 서열과 혼성화하고, 여기서 (i), (ii) 및 (iii)은 5'에서 3' 배향으로 배열됨.
sgRNA 내에서 tracr 메이트 서열 및 tracr 서열은 일반적으로, 적합한 루프 서열에 의해 연결되어 스템-루프 구조를 형성한다.
B-
GEn
.1 또는 B-
GEn
.2를 포함하는
CRISPR
-
Cas
시스템의 사용에 적합한 PAM 서열
B-GEn.1 및 B-GEn.2의 기능은 표적 서열 상에 적합한 프로토스페이서 인접 모티프 ("PAM") 서열을 필요로 한다.
적합한 PAM 서열은 표 2에 열거되어 있으며, 여기서 조작된 DNA 표적화 세그먼트는 그의 3' 단부 상에서 표적화된 DNA 세그먼트 상의 PAM 서열에 직접적으로 인접하거나, 또는 이러한 PAM 서열은 5' 부분에서 표적화된 DNA 서열의 일부이다.
표 2: 상응하는 B-
GEn
.1 또는 B-
GEn
.2
엔도뉴클레아제에
적합한 PAM 서열
CRISPR
Cas
시스템에서 B-
GEn
.1 또는 B-
GEn
.2를 사용하는데 적합한
tracr
서열
CRISPR Cas 시스템에서 B-GEn.1 또는 B-GEn.2를 사용하는데 적합한 tracr 서열은 표 3에 열거되어 있다. 대안적으로, 이들 서열의 변이체가 이용될 수 있다. 변이체는 그러한 서열의 일부 또는 말단절단된 버전 및/또는 이들 서열의 하나 이상의 위치에 염기 변형이 있는 서열을 포함할 수 있다. 각각의 DNA 서열은 서열식별번호: 5 및 6에 각각 개시되어 있다.
표 3
일부 실시양태에서, B-GEn.1 또는 B-GEn.2를 코딩하는 폴리뉴클레오티드 및 sgRNA는 세포 내 또는 시험관 내 환경에서의 발현을 위한 적합한 프로모터 및/또는 적합한 핵 국재화 신호를 함유한다.
본 발명에 따른 또 다른 실시양태는 세포 내 또는 시험관 내 하나 이상의 위치에서 표적 DNA를 표적화, 편집, 변형 또는 조작하는 방법을 나타내며, 이러한 방법은 하기 단계를 포함한다:
(a) 이종 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 이러한 단백질을 코딩하는 핵산을 세포 내로 또는 시험관 내 환경 내로 도입하는 단계; 및
(b) 하기를 포함하는, 단일 이종 가이드 RNA (sgRNA) 또는 이러한 sgRNA의 계내 생성에 적합한 DNA를 도입하는 단계로서:
i. RNA로 구성되고 폴리뉴클레오티드 로커스 내의 표적 서열과 혼성화할 수 있는 조작된 DNA 표적화 세그먼트,
ii. RNA로 구성된 tracr 메이트 서열, 및
iii. RNA로 구성된 tracr RNA 서열,
여기서 tracr 메이트 서열은 tracr 서열과 혼성화할 수 있고, 여기서 (i), (ii) 및 (iii)은 5'에서 3' 배향으로 배열되는 것인 단계;
(c) 표적 DNA에 하나 이상의 커트, 닉 또는 편집을 생성하는 단계로서, 여기서 B-GEn.1 또는 B-GEn.2 폴리펩티드는 그의 프로세싱된 또는 비프로세싱된 형태로 gRNA에 의해 표적 DNA로 지시되는 것인 단계.
본 발명에 따른 또 다른 실시양태는 세포 내 또는 시험관 내 하나 이상의 위치에서 표적 DNA를 표적화, 편집, 변형 또는 조작하기 위한, 하기를 포함하는 조성물의 용도이다:
(a) B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 이러한 B-GEn.1 또는 B-GEn.2를 코딩하는 폴리뉴클레오티드;
(b) 하기를 포함하는, 단일 이종 가이드 RNA (sgRNA) 또는 이러한 sgRNA의 계내 생성에 적합한 DNA:
i. RNA로 구성되고 폴리뉴클레오티드 로커스 내의 표적 서열과 혼성화할 수 있는 조작된 DNA 표적화 세그먼트,
ii. RNA로 구성된 tracr 메이트 서열, 및
iii. RNA로 구성된 tracr RNA 서열,
여기서 tracr 메이트 서열은 tracr 서열과 혼성화하고, 여기서 (i), (ii) 및 (iii)은 5'에서 3' 배향으로 배열됨.
본 발명에 따른 또 다른 실시양태는 하기를 포함하는 생체 외 또는 시험관 내 세포:
(a) 이종 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그를 코딩하는 핵산;
(b) 하기를 포함하는, 단일 이종 가이드 RNA (sgRNA) 또는 이러한 sgRNA의 계내 생성에 적합한 DNA:
i. RNA로 구성되고 폴리뉴클레오티드 로커스 내의 표적 서열과 혼성화할 수 있는 조작된 DNA 표적화 세그먼트,
ii. RNA로 구성된 tracr 메이트 서열, 및
iii. RNA로 구성된 tracr RNA 서열,
여기서 tracr 메이트 서열은 tracr 서열과 혼성화하고, 여기서 (i), (ii) 및 (iii)은 5'에서 3' 배향으로 배열됨;
또는 상기 (a) 및 (b)를 사용하여 게놈이 표적화, 편집, 변형 또는 조작된 상기 세포이다.
본 발명에 따른 부가의 실시양태는 하기를 포함하는 키트이다:
(a) B-GEn.1 또는 B-GEn.2를 코딩하는 핵산 서열, 여기서 프로모터 또는 B-GEn.1 또는 B-GEn.2를 코딩하는 핵산 서열은 리보솜 결합 부위에 작동가능하게 연결됨;
(b) 하기를 포함하는, 단일 이종 가이드 RNA (sgRNA) 또는 이러한 sgRNA의 계내 생성에 적합한 DNA:
i. RNA로 구성되고 폴리뉴클레오티드 로커스 내의 표적 서열과 혼성화할 수 있는 조작된 DNA 표적화 세그먼트,
ii. RNA로 구성된 tracr 메이트 서열, 및
iii. RNA로 구성된 tracr RNA 서열,
여기서 tracr 메이트 서열은 tracr 서열과 혼성화하고, 여기서 (i), (ii) 및 (iii)은 5'에서 3' 배향으로 배열됨, 또는
(a) B-GEn.1 또는 B-GEn.2 단백질;
(b) 하나 이상의 단일 이종 가이드 RNA (sgRNA), 이들 각각은 하기를 포함하며:
iv. RNA로 구성되고 폴리뉴클레오티드 로커스 내의 표적 서열과 혼성화할 수 있는 조작된 DNA 표적화 세그먼트,
v. RNA로 구성된 tracr 메이트 서열, 및
vi. RNA로 구성된 tracr RNA 서열,
여기서 tracr 메이트 서열은 tracr 서열과 혼성화하고, 여기서 (i), (ii) 및 (iii)은 5'에서 3' 배향으로 배열됨.
본 발명에 따른 또 다른 실시양태는 하기를 포함하는, 세포 내 또는 시험관 내 하나 이상의 위치에서 하나 이상의 표적 DNA(들)를 표적화, 편집, 변형 또는 조작하기 위한 조성물 및 방법을 포함한다:
(a) B-GEn.1 또는 B-GEn.2;
(b) 하기를 포함하는, 가이드 RNA (gRNA) 또는 이러한 gRNA의 계내 생성에 적합한 DNA:
i. RNA로 구성되고 폴리뉴클레오티드 로커스 내의 표적 서열과 혼성화할 수 있는 조작된 DNA 표적화 세그먼트,
ii. RNA로 구성된 tracr RNA 서열,
여기서 (i) 및 (ii)는 하나의 단일 RNA 분자이고 (iii)은 별도의 RNA 분자 상에 있음.
다중화
또 다른 측면에서, 본원에는 세포 내 다수 위치에서 DNA를 편집하거나 변형시키는 방법이 제공되며, 이러한 방법은 본질적으로 i) B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 B-GEn.1 또는 B-GEn.2 폴리펩티드를 코딩하는 핵산을 세포 내로 도입하는 단계; 및 ii) RNA로서 또는 DNA로서 코딩되고 하나의 프로모터의 제어 하에 있는 2개 이상의 프리-CRISPR RNA (프리-crRNA)를 포함하는 단일 이종 핵산을 세포 내로 도입하는 단계로서, 각각의 프리-crRNA는 반복부-스페이서 어레이 또는 반복부-스페이서를 포함하며, 여기서 스페이서는 DNA 내의 표적 서열에 상보적인 핵산 서열을 포함하고 반복부는 스템-루프 구조를 포함하며, 여기서 B-GEn.1 또는 B-GEn.2 폴리펩티드는 스템-루프 구조의 상류에 있는 2개 이상의 프리-crRNA를 절단하여 2개 이상의 중간 crRNA를 생성하며, 여기서 2개 이상의 중간 crRNA는 2개 이상의 성숙한 crRNA로 프로세싱되고, 각각의 2개 이상의 성숙한 crRNA는 B-GEn.1 또는 B-GEn.2 폴리펩티드를 가이드하여 2개 이상의 이중 가닥 파손부 (DSB)를 DNA에 발생시키는 단계로 이루어진다. 예를 들어, B-GEn.1 또는 B-GEn.2의 하나의 이점은 여러 개의 반복부-스페이서 단위를 포함하는 단지 하나의 프리-crRNA를 도입하는 것이 가능하다는 것이며, 이는 도입 시 B-GEn.1 또는 B-GEn.2에 의해 DNA 상의 여러 상이한 서열을 표적화하는 활성 반복부-스페이서 단위로 프로세싱된다.
또 다른 측면에서, 본원에는 본질적으로 하기 단계로 이루어진, 세포 내 다수 위치에서 DNA를 편집하거나 변형시키는 방법이 제공된다: i) 감소된 엔도리보뉴클레아제 활성을 갖는 B-GEn.1 또는 B-GEn.2 형태를, 폴리펩티드로서 또는 B-GEn.1 또는 B-GEn.2 폴리펩티드를 코딩하는 핵산으로서 세포 내로 도입하는 단계; 및 ii) RNA로서 또는 DNA로서 코딩되고 하나 이상의 프로모터의 제어 하에 있는 2개 이상의 프리-CRISPR RNA (프리-crRNA), 중간 crRNA 또는 성숙한 crRNA를 포함하는 단일 이종 핵산을 도입하는 단계로서, 각각의 crRNA는 반복부-스페이서 어레이를 포함하며, 여기서 스페이서는 DNA 내의 표적 서열에 상보적인 핵산 서열을 포함하고 반복부는 스템-루프 구조를 포함하며, 여기서 B-GEn.1 또는 B-GEn.2 폴리펩티드는 단일 이종 핵산 내의 하나 이상의 스페이서 서열에 의해 지시된 바와 같이 엔도리보뉴클레아제 활성이 감소되거나 부재하고 무손상 엔도뉴클레아제 활성을 갖는 단일 이종 RNA의 하나 이상의 영역과 결합하는 것인 단계.
일부 실시양태에서 단일 이종 핵산 내의 프리-crRNA 서열은 상이한 crRNA 서열에 의해 명시된 각각의 부위에서 B-GEn.1 또는 B-GEn.2의 엔도뉴클레아제 활성을 지시하거나 차별적으로 조정하기 위해 특이적 위치, 배향, 서열 또는 특이적 화학적 연결로 함께 연결된다.
또 다른 측면에서, 본원에는 본질적으로 하기 단계로 이루어진, 세포 내 다수 위치에서 DNA의 구조 또는 기능을 편집하거나 변형시키기 위한 일반적인 방법의 예가 제공된다: i) RNA-가이드된 엔도뉴클레아제, 예컨대 B-GEn.1 또는 B-GEn.2를, 폴리펩티드로서 또는 RNA-가이드된 엔도뉴클레아제를 코딩하는 핵산으로서 세포 내로 도입하는 단계; 및 ii) RNA로서 또는 DNA로서 코딩되고 하나 이상의 프로모터의 제어 하에 있는 2개 이상의 가이드 RNA를 포함하거나 그를 코딩하는 단일 이종 핵산을 도입하는 단계로서, 여기서 RNA-가이드된 엔도뉴클레아제의 활성 또는 기능은 단일 이종 핵산 내의 가이드 RNA 서열에 의해 지시되는 것인 단계.
정의
본원에서 상호교환가능하게 사용되는 용어 "폴리뉴클레오티드", "핵산" 및 "핵산"은 리보뉴클레오티드 또는 데옥시리보뉴클레오티드 중 임의의 길이의 뉴클레오티드의 중합체성 형태를 지칭한다. 따라서, 이러한 용어는 단일 가닥, 이중 가닥 또는 다중 가닥 DNA 또는 RNA, 게놈 DNA, cDNA, DNA-RNA 하이브리드/삼중 나선, 또는 퓨린 및 피리미딘 염기 또는 기타 자연, 화학적으로 또는 생화학적으로 변형된, 비-자연 또는 유도체화된 뉴클레오티드 염기를 포함한 중합체를 포함하나 이에 제한되지는 않는다.
"올리고뉴클레오티드"는 일반적으로, 단일 가닥 또는 이중 가닥 DNA의 약 5개 내지 약 100개 뉴클레오티드의 폴리뉴클레오티드를 지칭한다. 그러나, 본 개시내용의 목적상, 올리고뉴클레오티드의 길이에 대한 상한은 없다. 올리고뉴클레오티드는 "올리고머" 또는 "올리고"로서 공지되기도 하며, 유전자로부터 단리되거나, 또는 관련 기술분야에 공지된 방법에 의해 화학적으로 합성될 수 있다. 용어 "폴리뉴클레오티드" 및 "핵산"은 기재된 실시양태에 적용가능한 경우, 단일 가닥 (예컨대 센스 또는 안티센스) 및 이중 가닥 폴리뉴클레오티드를 포함하는 것으로 이해되어야 한다.
"게놈 DNA"는 박테리움, 진균, 고세균, 원생생물, 바이러스, 식물 또는 동물의 게놈 DNA를 포함하나 이에 제한되지는 않는 유기체의 게놈 DNA를 지칭한다.
용어 DNA를 "조작하는 것"은 DNA의 결합, 한 가닥의 닉킹, 또는 절단, 예를 들어 DNA의 두 가닥 모두의 커팅을 포괄하거나; DNA 또는 이러한 DNA와 연관된 폴리펩티드를 변형 또는 편집하는 것을 포괄한다. DNA를 조작하면 RNA 또는 DNA에 의해 코딩된 폴리펩티드의 발현이 침묵, 활성화 또는 조정 (증가 또는 감소)되거나, 또는 DNA에 대한 폴리펩티드의 결합이 방지되거나 향상될 수 있다.
"스템-루프 구조"는 주로 단일 가닥 뉴클레오티드 (루프 부분) 영역에 의해 한쪽이 연결되는 이중 가닥 (줄기 부분)을 형성하는 것으로 공지되어 있거나 예측되는 뉴클레오티드 영역을 포함하는 2차 구조를 갖는 핵산을 지칭한다. 용어 "헤어핀" 및 "폴드-백" 구조는 또한 스템-루프 구조를 지칭하기 위해 본원에서 사용된다. 이러한 구조는 관련 기술분야에 널리 공지되어 있으며 이러한 용어는 관련 기술분야에서 공지된 의미와 일치하게 사용된다. 관련 기술분야에 공지된 바와 같이, 스템-루프 구조는 정확한 염기쌍 형성을 필요로 하지 않는다. 따라서, 스템은 하나 이상의 염기 미스매치를 포함할 수 있다. 대안적으로, 염기쌍 형성은 정확할 수 있으며, 예를 들어 어떠한 미스매치도 포함하지 않을 수 있다.
"혼성화가능한" 또는 "상보적인" 또는 "실질적으로 상보적인"이란 핵산 (예를 들어, RNA 또는 DNA)이 비-공유적으로 결합할 수 있게 하는, 예를 들어 왓슨-크릭(Watson-Crick) 염기쌍 및/또는 G/U 염기쌍을 형성할 수 있게 하거나, 온도 및 용액 이온 강도의 적절한 시험관 내 및/또는 생체 내 조건 하에서 서열-특이적, 역평행 방식 (예를 들어, 핵산이 상보적인 핵산과 특이적으로 결합함)으로 또 다른 핵산에 "어닐링" 또는 "혼성화"할 수 있게 하는 뉴클레오티드 서열을 포함하는 것을 의미한다. 관련 기술분야에 공지된 바와 같이, 표준 왓슨-크릭 염기쌍 형성은 아데닌 (A)과 티미딘 (T)의 쌍 형성, 아데닌 (A)과 우라실 (U)의 쌍 형성, 및 구아닌 (G)과 시토신 (C)의 쌍 형성을 포함한다 [DNA, RNA]. 또한, 2개의 RNA 분자 (예를 들어, dsRNA) 간의 혼성화를 위해, 구아닌 (G)이 우라실 (U)과 염기 쌍을 형성하는 것이 또한 관련 기술분야에 공지되어 있다. 예를 들어, G/U 염기쌍 형성은 mRNA 내의 코돈과 tRNA 안티코돈 염기쌍 형성의 맥락에서 유전적 코드의 축퇴 (예를 들어, 중복성)에 부분적으로 책임이 있다. 본 개시내용의 맥락에서, 가이드 RNA 분자의 단백질-결합 세그먼트 (dsRNA 이중나선)의 구아닌 (G)은 우라실 (U)에 상보적인 것으로 간주되며, 그 반대도 마찬가지이다. 따라서, G/U 염기쌍이 가이드 RNA 분자의 단백질-결합 세그먼트 (dsRNA 이중나선)의 주어진 뉴클레오티드 위치에서 만들어질 수 있는 경우, 그 위치는 비-상보적인 것으로 간주되지 않고, 대신 상보적인 것으로 간주된다.
혼성화 및 세척 조건은 널리 공지되어 있고 문헌 [Sambrook, J., Fritsch, E. F. and Maniatis, T. Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor (1989), particularly Chapter 11 and Table 11.1 therein; 및 Sambrook, J. and Russell, W., Molecular Cloning: A Laboratory Manual, Third Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor (2001)]에 예시되어 있다. 온도와 이온 강도의 조건이 혼성화의 "엄격도"를 결정한다.
혼성화는 두 핵산이 상보적인 서열을 함유하는 것으로 필요로 하지만, 염기 간의 미스매치도 가능하다. 두 핵산 간의 혼성화에 적절한 조건은 관련 기술분야에 널리 공지된 변수인 핵산의 길이와 상보성 정도에 따라 달라진다. 2개의 뉴클레오티드 서열 간의 상보성 정도가 더 클수록, 이들 서열을 갖는 핵산의 하이브리드에 대한 용융 온도 (Tm)의 값은 더 커진다. 짧은 상보성 연장물 (예를 들어, 35개 이하, 30개 이하, 25개 이하, 22개 이하, 20개 이하 또는 18개 이하의 뉴클레오티드에 대한 상보성)을 갖는 핵산 간의 혼성화의 경우에는, 미스매치 위치가 중요해진다 (상기 문헌 [Sambrook et al., 11.7-11.8] 참조). 일반적으로, 혼성화가능한 핵산에 대한 길이는 적어도 10개의 뉴클레오티드이다. 혼성화가능한 핵산에 대한 예시적인 최소 길이는 적어도 15개의 뉴클레오티드; 적어도 20개의 뉴클레오티드; 적어도 22개의 뉴클레오티드; 적어도 25개의 뉴클레오티드; 및 적어도 30개의 뉴클레오티드이다. 더욱이, 통상의 기술자는 온도 및 세척 용액 염 농도가 상보성 영역의 길이 및 상보성 정도와 같은 요인에 따라 필요에 따라 조정될 수 있음을 인식할 것이다.
폴리뉴클레오티드의 서열은 특이적으로 혼성화되기 위해 그의 표적 핵산의 서열과 100% 상보적일 필요는 없는 것으로 관련 기술분야에서 이해된다. 더욱이, 폴리뉴클레오티드는 개재 또는 인접 세그먼트가 혼성화 사건에 관여하지 않도록 하나 이상의 세그먼트에 걸쳐 혼성화할 수 있다 (예를 들어, 루프 구조 또는 헤어핀 구조). 폴리뉴클레오티드는 그들이 표적화하는 표적 핵산 서열 내의 표적 영역과 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 99%, 또는 100%의 서열 상보성을 포함할 수 있다. 예를 들어, 안티센스 화합물의 20개 뉴클레오티드 중 18개가 표적 영역에 상보적이므로, 특이적으로 혼성화하는 안티센스 핵산은 90 퍼센트 상보성을 나타낼 것이다. 이러한 예에서, 나머지 비-상보적 뉴클레오티드는 상보적 뉴클레오티드와 클러스터링되거나 산재될 수 있으며 서로 또는 상보적 뉴클레오티드에 인접할 필요는 없다. 핵산 내의 특정한 핵산 서열 연장물 간의 상보성 퍼센트는 문헌 [Smith and Waterman (Adv. Appl. Math. 1981(2) 482-489)]의 알고리즘을 사용하는 디폴트 설정을 사용하여, 관련 기술분야에 공지된 BLAST 프로그램 (기본 국소 정렬 검색 도구) 및 PowerBLAST 프로그램 (문헌 [Altschul et al., J. Mol. Biol. 1990,215, 403-410; Zhang and Madden, Genome Res., 1997,7, 649-656]) 또는 Gap 프로그램 (Wisconsin Sequence Analysis Package, Version 8 for Unix, Genetics Computer Group, University Research Park, Madison Wis.)을 사용하여 일상적으로 결정될 수 있다.
용어 "펩티드", "폴리펩티드" 및 "단백질"은 본원에서 상호교환가능하게 사용되며, 코딩된 아미노산 및 비-코딩된 아미노산, 화학적으로 또는 생화학적으로 변형된 또는 유도체화된 아미노산, 및 변형된 펩티드 백본을 갖는 폴리펩티드를 포함할 수 있는 임의의 길이의 아미노산의 중합체 형태를 지칭한다.
본원에 사용된 바와 같은 "결합" (예를 들어, 폴리펩티드의 RNA-결합 도메인과 관련하여)은 거대분자 간 (예를 들어, 단백질과 핵산 간)의 비-공유 상호작용을 지칭한다. 비-공유 상호작용 상태에 있는 동안, 거대분자는 "회합된" 또는 "상호작용하는" 또는 "결합하는" 것이라고 한다 (예를 들어, 분자 X가 분자 Y와 상호작용한다고 하는 경우, 이는 분자 X가 비-공유 방식으로 분자 Y와 결합한다는 것을 의미함). 결합 상호작용의 모든 구성요소가 서열-특이적일 필요는 없지만 (예를 들어, DNA 백본 내의 포스페이트 잔기와의 접촉), 결합 상호작용의 일부 부분은 서열-특이적일 수 있다. 결합 상호작용은 일반적으로 10-6 M 미만, 10-7 M 미만, 10-8 M 미만, 10-9 M 미만, 10-10 M 미만, 10-11 M 미만, 10-12 M 미만, 10-13 M 미만, 10-14 M 미만 또는 10-15 M 미만의 해리 상수 (Kd)를 특징으로 한다. "친화도"는 결합 강도를 지칭하며, 증가된 결합 친화도는 더 낮은 Kd와 상관관계가 있다.
"결합 도메인"은 또 다른 분자와 비-공유적으로 결합할 수 있는 단백질 도메인을 의미한다. 결합 도메인은, 예를 들어 DNA 분자 (DNA-결합 단백질), RNA 분자 (RNA-결합 단백질) 및/또는 단백질 분자 (단백질-결합 단백질)와 결합할 수 있다. 단백질 도메인-결합 단백질의 경우, 이는 그 자체와 결합할 수 있고/거나 (동종-이량체, 동종-삼량체 등을 형성) 상이한 단백질 또는 단백질들의 하나 이상의 분자와 결합할 수 있다.
용어 "보존적 아미노산 치환"은 유사한 측쇄를 갖는 아미노산 잔기의 단백질 내 상호교환가능성을 지칭한다. 예를 들어, 지방족 측쇄를 갖는 아미노산 군은 글리신, 알라닌, 발린, 류신 및 이소류신으로 이루어지고; 지방족-히드록실 측쇄를 갖는 아미노산 군은 세린 및 트레오닌으로 이루어지고; 아미드 함유 측쇄를 갖는 아미노산 군은 아스파라긴 및 글루타민으로 이루어지고; 방향족 측쇄를 갖는 아미노산 군은 페닐알라닌, 티로신 및 트립토판으로 이루어지고; 염기성 측쇄를 갖는 아미노산 군은 리신, 아르기닌 및 히스티딘으로 이루어지고; 산성 측쇄를 갖는 아미노산 군은 글루타메이트 및 아스파르테이트로 이루어지고; 황 함유 측쇄를 갖는 아미노산 군은 시스테인 및 메티오닌으로 이루어진다. 예시적인 보존적 아미노산 치환 군은 발린-류신-이소류신, 페닐알라닌-티로신, 리신-아르기닌, 알라닌-발린 및 아스파라긴-글루타민이다.
폴리뉴클레오티드 또는 폴리펩티드는 또 다른 폴리뉴클레오티드 또는 폴리펩티드과 특정 퍼센트의 "서열 동일성"을 가지며, 이는 정렬된 경우, 두 서열을 비교할 때 염기 또는 아미노산의 백분율이 동일하고 동일한 상대 위치에 있음을 의미한다. 서열 동일성은 수많은 상이한 방식으로 결정될 수 있다. 서열 동일성을 결정하기 위해, ncbi.nlm.nili.gov/BLAST, ebi.ac.uk/Tools/msa/tcoffee, ebi.Ac.Uk/Tools/msa/muscle, mafft.cbrc/alignment/software를 포함한 월드와이드 웹 사이트에서 이용가능한 다양한 방법 및 컴퓨터 프로그램 (예를 들어, BLAST, T-COFFEE, MUSCLE, MAFFT 등)을 사용하여 서열을 정렬할 수 있다. 예를 들어, 문헌 [Altschul et al. (1990), J. Mol. Biol. 215:403-10]을 참조한다. 본 개시내용의 일부 실시양태에서, 관련 기술분야에서의 서열 정렬 표준은 또 다른 Cas9 엔도뉴클레아제 내의 아미노산 잔기에 "상응하는" B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 내의 아미노산 잔기를 결정하기 위해 본 개시내용에 따라 사용된다. 다른 Cas9 엔도뉴클레아제의 아미노산 잔기에 상응하는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체의 아미노산 잔기는 서열 정렬에서 동일한 위치에 나타난다.
특정한 RNA를 "코딩하는" DNA 서열은 RNA로 전사되는 DNA 핵산 서열이다. 폴리데옥시리보뉴클레오티드는 단백질로 번역되는 RNA (mRNA)를 코딩할 수 있거나, 폴리데옥시리보뉴클레오티드는 단백질로 번역되지 않는 RNA (예를 들어, tRNA, rRNA 또는 가이드 RNA; "비-코딩" RNA 또는 "ncRNA"라고도 함)를 코딩할 수 있다. "단백질 코딩 서열" 또는 특정한 단백질 또는 폴리펩티드를 코딩하는 서열은 적절한 조절 서열의 제어 하에 위치할 때 시험관 내 또는 생체 내에서 mRNA로 전사되고 (DNA의 경우) 폴리펩티드로 번역되는 (mRNA의 경우) 핵산 서열이다. 코딩 서열의 경계는 5' 말단 (N-말단)에서의 시작 코돈과 3' 말단 (C-말단)에서의 번역 정지 넌센스 코돈에 의해 결정된다. 코딩 서열은 원핵 또는 진핵 mRNA로부터의 cDNA, 원핵 또는 진핵 DNA로부터의 게놈 DNA 서열, 및 합성 핵산을 포함할 수 있으나 이에 제한되지는 않는다. 전사 종결 서열은 일반적으로 코딩 서열의 3'에 위치할 것이다.
본원에 사용된 바와 같은, "프로모터 서열" 또는 "프로모터"는 RNA 폴리머라제와 결합하고 하류 (3' 방향) 코딩 또는 비-코딩 서열의 전사를 개시할 수 있는 DNA 조절 영역이다. 본원에 사용된 바와 같은, 프로모터 서열은 전사 개시 부위에 의해 3' 말단에서 경계를 이루고 배경보다 검출가능한 수준에서 전사를 개시하는데 필요한 최소 수의 염기 또는 요소를 포함하도록 상류 (5' 방향)로 연장된다. 프로모터 서열 내에는 전사 개시 부위 뿐만 아니라 RNA 폴리머라제의 결합을 담당하는 단백질 결합 도메인도 발견된다. 진핵 프로모터는 항상 그런 것은 아니지만 종종, "TATA" 박스 및 "CAAT" 박스를 함유한다. 유도성 프로모터를 포함한 다양한 프로모터를 사용하여 본 개시내용의 다양한 벡터를 구동할 수 있다. 프로모터는 구성적으로 활성인 프로모터 (예를 들어, 구성적으로 활성 "온" 상태인 프로모터)일 수 있고, 유도성 프로모터 (예를 들어, 활성/"온" 또는 불활성/"오프" 상태가 외부 자극, 예를 들어 특정한 온도, 화합물 또는 단백질의 존재에 의해 제어되는 프로모터)일 수 있으며, 공간적으로 제한된 프로모터 (예를 들어, 전사 제어 요소, 인핸서 등) (예를 들어, 조직 특이적 프로모터, 세포 유형 특이적 프로모터 등)일 수 있고, 시간적으로 제한된 프로모터 (예를 들어, 프로모터는 배아 발생의 특이적 단계 동안 또는 생물학적 프로세스의 특이적 단계, 예를 들어 마우스의 모낭 주기 동안 "온" 상태 또는 "오프" 상태에 있음)일 수 있다. 적합한 프로모터는 바이러스로부터 유래될 수 있으므로 바이러스 프로모터로서 지칭될 수 있거나, 원핵 또는 진핵 유기체를 포함한 임의의 유기체로부터 유래될 수 있다. 적합한 프로모터를 사용하여 임의의 RNA 폴리머라제 (예를 들어, pol I, pol II, pol III)에 의한 발현을 구동할 수 있다. 예시적인 프로모터는 SV40 초기 프로모터, 마우스 유방 종양 바이러스 긴 말단 반복부 (LTR) 프로모터; 아데노바이러스 주요 후기 프로모터 (Ad MLP); 단순 포진 바이러스 (HSV) 프로모터, 시토메갈로바이러스 (CMV) 프로모터, 예컨대 CMV 즉시 초기 프로모터 영역 (CMVIE), 라우스 육종 바이러스 (RSV) 프로모터, 인간 U6 소형 핵 프로모터 (U6) (문헌 [Miyagishi et al., Nature Biotechnology 20, 497-500 (2002)]), 향상된 U6 프로모터 (예를 들어, 문헌 [Xia et al., Nucleic Acids Res. 2003 Sep 1;31(17)]), 인간 H1 프로모터 (H1) 등을 포함하나 이에 제한되지는 않는다. 유도성 프로모터의 예는 T7 RNA 폴리머라제 프로모터, T3 RNA 폴리머라제 프로모터, 이소프로필-베타-D-티오갈락토피라노시드 (IPTG)-조절된 프로모터, 락토스 유도된 프로모터, 열 충격 프로모터, 테트라시클린-조절된 프로모터, 스테로이드-조절된 프로모터, 금속-조절된 프로모터, 에스트로겐 수용체-조절된 프로모터 등을 포함하나 이에 제한되지는 않는다. 따라서 유도성 프로모터는 독시시클린; RNA 폴리머라제, 예를 들어 T7 RNA 폴리머라제; 에스트로겐 수용체; 에스트로겐 수용체 융합 등을 포함하나 이에 제한되지는 않는 분자에 의해 조절될 수 있다.
일부 실시양태에서, 프로모터는 다세포 유기체에서 프로모터가 특이적 세포의 서브세트에서 활성 (예를 들어, "온")이 되도록 공간적으로 제한된 프로모터 (예를 들어, 세포 유형 특이적 프로모터, 조직 특이적 프로모터 등)이다. 공간적으로 제한된 프로모터는 인핸서, 전사 제어 요소, 제어 서열 등으로서 지칭될 수도 있다. 임의의 적합한 공간적으로 제한된 프로모터가 사용될 수 있으며 적합한 프로모터 (예를 들어, 뇌 특이적 프로모터, 뉴런의 서브세트에서의 발현을 구동시키는 프로모터, 생식계열에서의 발현을 구동시키는 프로모터, 폐에서의 발현을 구동시키는 프로모터, 근육에서의 발현을 구동시키는 프로모터, 췌장의 섬 세포에서의 발현을 구동시키는 프로모터 등)의 선택은 유기체에 따라 달라질 것이다. 예를 들어, 식물, 파리, 벌레, 포유동물, 마우스 등에 대한 다양한 공간적으로 제한된 프로모터가 공지되어 있다. 따라서, 공간적으로 제한된 프로모터를 사용하여 유기체에 따라 매우 다양한 상이한 조직 및 세포 유형에서 부위-특이적 변형 효소를 코딩하는 핵산의 발현을 조절할 수 있다. 일부 공간적으로 제한된 프로모터는 배아 발생의 특이적 단계 동안 또는 생물학적 프로세스의 특이적 단계 (예를 들어, 마우스의 모낭 주기) 동안 프로모터가 "온" 상태 또는 "오프" 상태에 있도록 시간적으로 제한된다. 예시 목적으로, 공간적으로 제한된 프로모터의 예는 뉴런-특이적 프로모터, 지방세포-특이적 프로모터, 심근세포-특이적 프로모터, 평활근-특이적 프로모터, 광수용체-특이적 프로모터 등을 포함하나 이에 제한되지는 않는다. 뉴런-특이적 공간적으로 제한된 프로모터는 뉴런-특이적 엔올라제 (NSE) 프로모터 (예를 들어, EMBL HSEN02, X51956 참조); 방향족 아미노산 데카르복실라제 (AADC) 프로모터; 신경필라멘트 프로모터 (예를 들어, 진뱅크(GenBank) HUMNFL, L04147 참조); 시냅신 프로모터 (예를 들어, 진뱅크 HUMSYNIB, M55301 참조); thy-1 프로모터 (예를 들어, 문헌 [Chen et al. (1987) Cell 51:7-19; 및 Llewellyn, et al. (2010) Nat. Med. 16(10):1161-1166] 참조); 세로토닌 수용체 프로모터 (예를 들어, 진뱅크 S62283 참조); 티로신 히드록실라제 프로모터 (TH) (예를 들어, 문헌 [Oh et al. (2009) Gene Ther. 16:437; Sasaoka et al. (1992) Mol. Brain Res. 16:274; Boundy et al.(1998) J. Neurosci. 18:9989; 및 Kaneda et al. (1991) Neuron 6:583-594] 참조); GnRH 프로모터 (예를 들어, 문헌 [Radovick et al. (1991) Proc. Natl. Acad. Sci. USA 88:3402-3406] 참조); L7 프로모터 (예를 들어, 문헌 [Oberdick et al.(1990) Science 248:223-226] 참조); DNMT 프로모터 (예를 들어, 문헌 [Bartge et al. (1988) Proc. Natl. Acad. Sci. USA 85:3648-3652] 참조); 엔케팔린 프로모터 (예를 들어, 문헌 [Comb et al. (1988) EMBO J. 17:3793-3805] 참조); 미엘린 염기성 단백질 (MBP) 프로모터; Ca2+-칼모듈린-의존성 단백질 키나제 11-알파 (CamKIIa) 프로모터 (예를 들어, 문헌 [Mayford et al. (1996) Proc. Natl. Acad. Sci. USA 93:13250; 및 Casanova et al. (2001) Genesis 31:37] 참조); CMV 인핸서/혈소판 유래 성장 인자-p 프로모터 (예를 들어, 문헌 [Liu et al. (2004) Gene Therapy 11:52-60] 참조) 등을 포함하나 이에 제한되지는 않는다.
본원에서 상호교환가능하게 사용되는 용어 "DNA 조절 서열", "제어 요소" 및 "조절 요소"는, 비-코딩 서열 (예를 들어, 가이드 RNA) 또는 코딩 서열 (예를 들어, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체)의 전사를 제공 및/또는 조절하고/거나 코딩된 폴리펩티드의 번역을 조절하는 전사 및 번역 제어 서열, 예컨대 프로모터, 인핸서, 폴리아데닐화 신호, 종결인자, 단백질 분해 신호 등을 지칭한다.
핵산, 폴리펩티드, 세포 또는 유기체에 적용되는 것으로서 본원에 사용된 바와 같은 용어 "자연적으로 발생하는" 또는 "비변형된"은 자연에서 발견되는 핵산, 폴리펩티드, 세포 또는 유기체를 지칭한다. 예를 들어, 자연의 공급원으로부터 단리될 수 있고 실험실에서 인간에 의해 의도적으로 변형되지 않은 유기체 (바이러스 포함)에 존재하는 폴리펩티드 또는 폴리뉴클레오티드 서열은 자연적으로 발생한 것이다.
핵산 또는 폴리펩티드에 적용되는 바와 같은 본원에 사용된 바와 같은 용어 "키메라"는 상이한 공급원으로부터 유래된 구조로 구성되는 하나의 실체를 지칭한다. 예를 들어, "키메라"가 키메라 폴리펩티드 (예를 들어, 키메라 B-GEn.1 또는 B-GEn.2 단백질)와 관련하여 사용되는 경우, 키메라 폴리펩티드는 상이한 폴리펩티드로부터 유래되는 아미노산 서열을 포함한다. 키메라 폴리펩티드는 변형된 또는 자연적으로 발생하는 폴리펩티드 서열 (예를 들어, 변형된 또는 비변형된 B-GEn.1 또는 B-GEn.2 단백질로부터의 제1 아미노산 서열; 및 B-GEn.1 또는 B-GEn.2 단백질 이외의 제2 아미노산 서열)을 포함할 수 있다. 유사하게, 키메라 폴리펩티드를 코딩하는 폴리뉴클레오티드와 관련하여 "키메라"는 상이한 코딩 영역으로부터 유래된 뉴클레오티드 서열 (예를 들어, 변형된 또는 비변형된 B-GEn.1 또는 B-GEn.2 단백질을 코딩하는 제1 뉴클레오티드 서열; 및 B-GEn.1 또는 B-GEn.2 단백질 이외의 폴리펩티드를 코딩하는 제2 뉴클레오티드 서열)을 포함한다.
용어 "키메라 폴리펩티드"는 자연적으로 발생하지 않는, 예를 들어 인간 개입을 통해 달리 분리된 2개 이상의 아미노산 서열 세그먼트의 인공적인 조합 (예를 들어, "융합")에 의해 만들어진 폴리펩티드를 지칭한다. 키메라 아미노산 서열을 포함하는 폴리펩티드는 키메라 폴리펩티드이다. 일부 키메라 폴리펩티드는 "융합 변이체"로서 지칭될 수 있다.
본원에 사용된 바와 같은 "이종"은 각각 천연 핵산 또는 단백질에서 발견되지 않는 뉴클레오티드 또는 펩티드를 의미한다. 본원에 기재된 B-GEn.1 또는 B-GEn.2 융합 단백질은 이종 폴리펩티드 서열 (예를 들어, B-GEn.1 또는 B-GEn.2 이외의 단백질로부터의 폴리펩티드 서열)과 융합된 B-GEn.1 또는 B-GEn.2 폴리펩티드 (또는 그의 변이체)의 RNA-결합 도메인을 포함할 수 있다. 이종 폴리펩티드는 B-GEn.1 또는 B-GEn.2 융합 단백질에 의해 나타날 활성 (예를 들어, 효소 활성) (예를 들어, 메틸트랜스퍼라제 활성, 아세틸트랜스퍼라제 활성, 키나제 활성, 유비퀴틴화 활성 등)을 나타낼 수 있다. 이종 핵산은 자연적으로 발생하는 핵산 (또는 그의 변이체)에 연결되어 (예를 들어, 유전 공학에 의함) 융합 폴리펩티드를 코딩하는 융합 폴리뉴클레오티드를 생성할 수 있다. 또 다른 예로서, 융합 변이체 B-GEn.1 또는 B-GEn.2 폴리펩티드에서, 변이체 B-GEn.1 또는 B-GEn.2 폴리펩티드는 이종 폴리펩티드 (예를 들어, B-GEn.1 또는 B-GEn.2 이외의 폴리펩티드)와 융합될 수 있으며, 이는 융합 변이체 B-GEn.1 또는 B-GEn.2 폴리펩티드에 의해서도 나타날 활성을 나타낸다. 이종 핵산은 변이체 B-GEn.1 또는 B-GEn.2 폴리펩티드에 연결되어 (예를 들어, 유전 공학에 의함) 융합 변이체 B-GEn.1 또는 B-GEn.2 폴리펩티드를 코딩하는 폴리뉴클레오티드를 생성할 수 있다. 본원에 사용된 바와 같은 "이종"은 부가적으로, 천연 세포가 아닌 세포 내의 뉴클레오티드 또는 폴리펩티드를 의미한다.
용어 "동족"은 자연에서 정상적으로 상호작용하거나 공존하는 2개의 생체분자를 지칭한다.
본원에 사용된 바와 같은 "재조합"은, 특정한 핵산 (DNA 또는 RNA) 또는 벡터가 클로닝, 제한, 폴리머라제 연쇄 반응 (PCR) 및/또는 라이게이션 단계의 다양한 조합의 산물이며 자연계에서 발견되는 내인성 핵산과 구별될 수 있는 구조적 코딩 또는 비-코딩 서열을 갖는 구축물을 생성하는 것을 의미한다. 폴리펩티드를 코딩하는 DNA 서열은 cDNA 단편 또는 일련의 합성 올리고뉴클레오티드로부터 어셈블리되어, 세포 또는 무세포 전사 및 번역 시스템에 함유된 재조합 전사 단위로부터 발현될 수 있는 합성 핵산을 제공할 수 있다. 관련 서열을 포함하는 게놈 DNA는 또한 재조합 유전자 또는 전사 단위의 형성에 사용될 수 있다. 비-번역된 DNA 서열은 오픈 리딩 프레임으로부터 5' 또는 3'에 존재할 수 있으며, 이러한 서열은 코딩 영역의 조작 또는 발현을 방해하지 않으며 실제로 다양한 메커니즘에 의해 원하는 산물의 생산을 조정하는 작용을 할 수 있다 (하기 "DNA 조절 서열" 참조). 추가적으로 또는 대안적으로, 번역되지 않은 RNA (예를 들어, 가이드 RNA)를 코딩하는 DNA 서열이 또한 재조합으로 간주될 수 있다. 따라서, 예를 들어 용어 "재조합" 핵산은 자연적으로 발생하지 않는 것, 예를 들어 인간 개입을 통해 달리 분리된 2개의 서열 세그먼트를 인공적으로 조합함으로써 만들어진 것을 지칭한다. 이러한 인공적인 조합은 종종 화학적 합성 수단에 의해, 또는 단리된 핵산 세그먼트의 인공적인 조작에 의해, 예를 들어, 유전 공학 기술에 의해 달성된다. 이는 일반적으로, 특정 코돈을 동일한 아미노산, 보존적 아미노산 또는 비-보존적 아미노산을 코딩하는 코돈으로 대체하기 위해 수행된다. 추가적으로 또는 대안적으로, 이는 원하는 기능의 조합을 생성하기 위해 원하는 기능의 핵산 세그먼트를 함께 연결하기 위해 수행된다. 이러한 인공적인 조합은 종종 화학적 합성 수단에 의해, 또는 단리된 핵산 세그먼트의 인공적인 조작에 의해, 예를 들어, 유전 공학 기술에 의해 달성된다. 재조합 폴리뉴클레오티드가 폴리펩티드를 코딩하는 경우, 코딩된 폴리펩티드의 서열은 자연적으로 발생하는 ("야생형")일 수 있거나 자연적으로 발생하는 서열의 변이체 (예를 들어, 돌연변이체)일 수 있다. 따라서, 용어 "재조합" 폴리펩티드는 반드시 서열이 자연적으로 발생하지 않는 폴리펩티드를 지칭하는 것은 아니다. 대신, "재조합" 폴리펩티드는 재조합 DNA 서열에 의해 코딩되지만, 폴리펩티드의 서열은 자연적으로 발생하거나 ("야생형") 비-자연적으로 발생할 수 있다 (예를 들어, 변이체, 돌연변이체 등). 따라서, "재조합" 폴리펩티드는 인간 개입의 결과이지만, 자연적으로 발생하는 아미노산 서열일 수도 있다. 용어 "비-자연적으로 발생하는"은 화학적으로 변형된 또는 돌연변이된 분자를 포함하여, 자연적으로 발생하는 대응물과 현저히 상이한 분자를 포함한다.
"벡터" 또는 "발현 벡터"는 또 다른 DNA 세그먼트, 예를 들어 "삽입물"이 부착되어 세포에서 부착된 세그먼트의 복제를 가져올 수 있는 레플리콘, 예컨대 플라스미드, 파지, 바이러스 또는 코스미드이다.
"발현 카세트"는 프로모터에 작동가능하게 연결된 DNA 코딩 서열을 포함한다. "작동가능하게 연결된"은 그렇게 기재된 구성요소가 의도한 방식으로 기능하도록 허용하는 관계에 있는 병치를 지칭한다. 예를 들어, 프로모터가 그의 전사 또는 발현에 영향을 미치는 경우, 프로모터는 코딩 서열에 작동가능하게 연결된다. 용어 "재조합 발현 벡터" 또는 "DNA 구축물"은 벡터 및 적어도 하나의 삽입물을 포함하는 DNA 분자를 지칭하기 위해 본원에서 상호교환가능하게 사용된다. 재조합 발현 벡터는 일반적으로, 삽입물(들)을 발현 및/또는 증식시키기 위한 목적으로, 또는 다른 재조합 뉴클레오티드 서열을 구축하기 위해 생성된다. 핵산(들)은 프로모터 서열에 작동가능하게 연결되거나 연결되지 않을 수 있고, DNA 조절 서열에 작동가능하게 연결되거나 연결되지 않을 수 있다.
본원에 사용된 바와 같은 용어 "작동가능하게 연결된"은 2개 이상의 요소, 예를 들어 폴리펩티드 서열 또는 폴리뉴클레오티드 서열 간의 물리적 또는 기능적 연결을 의미하며, 이는 의도된 방식으로 작동하도록 허용한다. 예를 들어, 관심 폴리뉴클레오티드와 조절 서열 (예를 들어, 프로모터) 간의 작동가능한 연결은 관심 폴리뉴클레오티드의 발현을 허용하는 기능적 연결이다. 이러한 의미에서, 용어 "작동가능하게 연결된"은 조절 영역이 관심 코딩 서열의 전사 또는 번역을 조절하는데 유효하도록 조절 영역 및 전사될 코딩 서열의 위치를 지정하는 것을 지칭한다. 본원에 개시된 일부 실시양태에서, 용어 "작동가능하게 연결된"은 조절 서열이 폴리펩티드 또는 기능적 RNA를 코딩하는 서열에 대해 적절한 위치에 배치되어, 제어 서열이 폴리펩티드를 코딩하는 mRNA, 폴리펩티드 및/또는 기능적 RNA의 발현 또는 세포 국재화를 지시하거나 조절하도록 하는 구성을 나타낸다. 따라서, 프로모터가 핵산 서열의 전사를 매개할 수 있는 경우, 이러한 프로모터는 핵산 서열과 작동가능하게 연결되어 있다. 작동가능하게 연결된 요소는 연속적이거나 비-연속적일 수 있다.
외인성 DNA가 세포 내부에 도입되었을 때, 그러한 세포는 외인성 DNA, 예를 들어 재조합 발현 벡터에 의해 "유전적으로 변형" 또는 "형질전환" 또는 "형질감염"되었다. 외인성 DNA의 존재는 영구적이거나 일시적인 유전적 변화를 초래한다. 형질전환 DNA는 세포의 게놈에 통합 (공유적으로 연결)될 수도 있고 그렇지 않을 수도 있다.
예를 들어, 원핵생물, 효모 및 포유동물 세포에서, 형질전환 DNA는 에피솜 요소, 예컨대 플라스미드 상에서 유지될 수 있다. 진핵 세포와 관련하여, 안정적으로 형질전환된 세포는 형질전환 DNA가 염색체에 통합되어 염색체 복제를 통해 딸 세포에 유전되는 세포이다. 이러한 안정성은 형질전환 DNA를 함유하는 딸 세포 집단을 포함하는 세포주 또는 클론을 확립할 수 있는 진핵 세포의 능력에 의해 입증된다. "클론"은 유사분열에 의해 단일 세포 또는 공통 조상으로부터 유래된 세포 집단이다. "세포주"는 여러 세대에 걸쳐 시험관 내에서 안정적으로 성장할 수 있는 1차 세포의 클론이다.
유전적 변형 ("형질전환"으로서 지칭되기도 함)의 적합한 방법은, 예를 들어, 바이러스 또는 박테리오파지 감염, 형질감염, 접합, 원형질체 융합, 리포펙션, 전기천공, 인산칼슘 침전, 폴리에틸렌이민 (PEI)-매개 형질감염, DEAE-덱스트란 매개 형질감염, 리포솜-매개 형질감염, 입자 총 기술, 인산칼슘 침전, 직접 마이크로 주사, 나노입자-매개 핵산 전달 등을 포함하나 이에 제한되지는 않는다 (예를 들어, 문헌 [Panyam et al., Adv Drug Deliv Rev. 2012 Sep 13. pp: S0169-409X(12)00283-9. doi:10.1016/j.addr.2012.09.023] 참조).
본원에 사용된 바와 같은 "숙주 세포"는 생체 내 또는 시험관 내 진핵 세포, 원핵 세포 (예를 들어, 박테리아 또는 고세균 세포), 또는 단세포 실체로서 배양된 다세포 유기체 (예를 들어, 세포주)로부터의 세포를 의미하며, 진핵 또는 원핵 세포는 핵산에 대한 수용체로서 사용될 수 있거나, 또는 사용되어 왔으며, 핵산에 의해 형질전환된 원래 세포의 자손을 포함한다. 단일 세포의 자손은 자연적, 우발적 또는 고의적 돌연변이로 인해 원래의 부모와 형태 또는 게놈 또는 전체 DNA 보체에서 반드시 완전히 동일하지 않을 수도 있는 것으로 이해된다. "재조합 숙주 세포" ("유전적으로 변형된 숙주 세포"로서 지칭되기도 함)는 이종 핵산, 예를 들어 발현 벡터가 도입된 숙주 세포이다. 예를 들어, 박테리아 숙주 세포는 외인성 핵산 (예를 들어, 플라스미드 또는 재조합 발현 벡터)을 적합한 박테리아 숙주 세포 내로 도입함으로써 유전적으로 변형된 박테리아 숙주 세포이며, 진핵 숙주 세포는 외인성 핵산을 적합한 진핵 숙주 세포 내로 도입함으로써 유전적으로 변형된 진핵 숙주 세포 (예를 들어, 포유동물 생식 세포)이다.
본원에 사용된 바와 같은 "표적 DNA"는 "표적 부위" 또는 "표적 서열"을 포함하는 폴리데옥시리보뉴클레오티드이다. 용어 "표적 부위", "표적 서열", "표적 프로토스페이서 DNA" 또는 "프로토스페이서-유사 서열"은 결합을 위한 충분한 조건이 존재한다면, 가이드 RNA의 DNA-표적화 세그먼트 ("스페이서"로서 지칭되기도 함)가 결합할 표적 DNA에 존재하는 핵산 서열을 지칭하기 위해 본원에서 상호교환가능하게 사용된다. 예를 들어, 표적 DNA 내의 표적 부위 (또는 표적 서열) 5'-GAGCATATC-3'는 RNA 서열 5'-GAUAUGCUC-3'에 의해 표적화된다 (또는 이에 의해 결합되거나, 이와 혼성화되거나, 또는 이에 상보적임). 적합한 DNA/RNA 결합 조건은 세포에 정상적으로 존재하는 생리학적 조건을 포함한다. 다른 적합한 DNA/RNA 결합 조건 (예를 들어, 무세포 시스템에서의 조건)은 관련 기술분야에 공지되어 있으며; 예를 들어, 상기 문헌 [Sambrook]을 참조한다. 가이드 RNA에 상보적이며 이와 혼성화하는 표적 DNA의 가닥은 "상보적 가닥"으로서 지칭되며, "상보적 가닥"에 상보적인 (따라서 가이드 RNA에 상보적이지 않은) 표적 DNA의 가닥은 "비-상보적 가닥" 또는 "비-상보적 가닥"으로서 지칭된다.
"부위-특이적 변형 효소" 또는 "RNA-결합 부위-특이적 변형 효소"는 RNA와 결합하고 특이적 DNA 서열, 예컨대 B-GEn.1 또는 B-GEn.2 폴리펩티드를 표적화하는 폴리펩티드를 의미한다. 본원에 기재된 바와 같은 부위-특이적 변형 효소는 그것과 결합된 RNA 분자에 의해 특이적 DNA 서열을 표적화한다. RNA 분자는 표적 DNA 내의 표적 서열과 결합하거나, 이와 혼성화하거나 이에 상보적인 서열을 포함하므로, 결합된 폴리펩티드가 표적 DNA 내의 특이적 위치 (표적 서열)를 표적화한다. "절단"은 DNA 분자의 공유 백본이 파손되는 것을 의미한다. 절단은 포스포디에스테르 결합의 효소적 또는 화학적 가수분해를 포함하나 이에 제한되지는 않는 다양한 방법에 의해 개시될 수 있다. 단일 가닥 절단과 이중 가닥 절단 둘 다가 가능하며, 2가지 별개의 단일 가닥 절단 사건의 결과로서 이중 가닥 절단이 발생할 수 있다. DNA 절단으로 인해 평활 단부 또는 엇갈린 단부가 생산될 수 있다. 특정 실시양태에서, 가이드 RNA와 부위-특이적 변형 효소를 포함하는 복합체는 표적화된 이중 가닥 DNA 절단을 위해 사용된다.
"뉴클레아제" 및 "엔도뉴클레아제"는 폴리뉴클레오티드 절단을 위한 엔도뉴클레오분해성 촉매 활성을 보유하는 효소를 의미하기 위해 본원에서 상호교환가능하게 사용된다.
뉴클레아제의 "절단 도메인" 또는 "활성 도메인" 또는 "뉴클레아제 도메인"은 DNA 절단에 대한 촉매 활성을 보유하는 뉴클레아제 내의 폴리펩티드 서열 또는 도메인을 의미한다. 절단 도메인은 단일 폴리펩티드 쇄에 함유될 수 있거나 절단 활성은 2개 (또는 그 초과의) 폴리펩티드의 회합으로 인해 발생할 수 있다. 단일 뉴클레아제 도메인은 주어진 폴리펩티드 내에서 하나 초과의 단리된 아미노산 연장물로 이루어질 수 있다.
"가이드 서열" 또는 "DNA-표적화 세그먼트" 또는 "DNA-표적화 서열" 또는 "스페이서"는 본원에서 "프로토스페이서-유사" 서열로 지정된 표적 DNA 내의 특이적 서열에 상보적인 뉴클레오티드 서열 (표적 DNA의 상보적 가닥)을 포함한다. 단백질-결합 세그먼트 (또는 "단백질-결합 서열")는 부위-특이적 변형 효소와 상호작용한다. 부위-특이적 변형 효소가 B-GEn.1 또는 B-GEn.2 또는 B-GEn.1 또는 B-GEn.2 관련 폴리펩티드인 경우 (하기에 더 자세히 기재됨), 표적 DNA의 부위-특이적 절단은 (i) 가이드 RNA와 표적 DNA 간의 염기쌍 형성 상보성; 및 (ii) 표적 DNA 내의 짧은 모티프 (프로토스페이서 인접 모티프 (PAM)로서 지칭됨) 둘 다에 의해 결정된 위치에서 발생한다. 가이드 RNA의 단백질-결합 세그먼트는 부분적으로, 서로 혼성화하여 이중 가닥 RNA 이중나선 (dsRNA 이중나선)를 형성하는 2개의 상보적인 뉴클레오티드 연장물을 포함한다. 일부 실시양태에서, 핵산 (예를 들어, 가이드 RNA, 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 핵산; 부위-특이적 변형 효소를 코딩하는 핵산 등)은 부가의 바람직한 특색 (예를 들어, 변형 또는 조절된 안정성; 세포하 표적화; 추적, 예를 들어, 형광 표지; 단백질 또는 단백질 복합체에 대한 결합 부위 등)을 제공하는 변형 또는 서열을 포함한다. 비제한적인 예는 5' 캡 (예를 들어, 7-메틸구아닐레이트 캡 (m7G)); 3' 폴리아데닐화 꼬리 (예를 들어, 3' 폴리(A) 꼬리); 리보스위치 서열 (예를 들어, 단백질 및/또는 단백질 복합체에 의한 조절된 안정성 및/또는 조절된 접근성을 허용하기 위함); 안정성 제어 서열; dsRNA 이중나선 (예를 들어, 헤어핀)을 형성하는 서열; RNA를 세포하 위치 (예를 들어, 핵, 미토콘드리아, 엽록체 등)로 표적화하는 변형 또는 서열; 추적을 제공하는 변형 또는 서열 (예를 들어, 형광 분자에 대한 직접적인 접합, 형광 검출을 용이하게 하는 모이어티에 대한 접합, 형광 검출을 허용하는 서열 등); 단백질 (예를 들어, 전사 활성인자, 전사 억제인자, DNA 메틸트랜스퍼라제, DNA 데메틸라제, 히스톤 아세틸트랜스퍼라제, 히스톤 데아세틸라제 등을 포함한, DNA에 작용하는 단백질)에 대한 결합 부위를 제공하는 변형 또는 서열; 및 그의 조합을 포함한다.
일부 실시양태에서, 가이드 RNA는 상기 기재된 특색 중 임의의 것을 제공하는 5' 또는 3' 단부에 부가의 세그먼트를 포함한다. 예를 들어, 적합한 제3 세그먼트는 5' 캡 (예를 들어, 7-메틸구아닐레이트 캡 (m7G)); 3' 폴리아데닐화 꼬리 (예를 들어, 3' 폴리(A) 꼬리); 리보스위치 서열 (예를 들어, 단백질 및 단백질 복합체에 의한 조절된 안정성 및/또는 조절된 접근성을 허용하기 위함); 안정성 제어 서열; dsRNA 이중나선 (예를 들어, 헤어핀)을 형성하는 서열; RNA를 세포하 위치 (예를 들어, 핵, 미토콘드리아, 엽록체 등)로 표적화하는 서열; 추적을 제공하는 변형 또는 서열 (예를 들어, 형광 분자에 대한 직접적인 접합, 형광 검출을 용이하게 하는 모이어티에 대한 접합, 형광 검출을 허용하는 서열 등); 단백질 (예를 들어, 전사 활성인자, 전사 억제인자, DNA 메틸트랜스퍼라제, DNA 데메틸라제, 히스톤 아세틸트랜스퍼라제, 히스톤 데아세틸라제 등을 포함한, DNA에 작용하는 단백질)에 대한 결합 부위를 제공하는 변형 또는 서열; 및 그의 조합을 포함할 수 있다.
가이드 RNA 및 부위-특이적 변형 효소, 에컨대 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 리보핵단백질 복합체를 형성할 수 있다 (예를 들어, 비-공유 상호작용을 통해 결합함). 가이드 RNA는 표적 DNA의 서열에 상보적인 뉴클레오티드 서열을 포함함으로써 복합체에 표적 특이성을 제공한다. 복합체의 부위-특이적 변형 효소는 엔도뉴클레아제 활성을 제공한다. 다시 말해서, 부위-특이적 변형 효소는 가이드 RNA의 단백질-결합 세그먼트와의 회합을 통해 표적 DNA 서열 (예를 들어, 염색체 핵산 내의 표적 서열; 염색체외 핵산, 예를 들어 에피솜 핵산, 미니서클 등 내의 표적 서열; 미토콘드리아 핵산 내의 표적 서열; 엽록체 핵산 내의 표적 서열; 플라스미드 내의 표적 서열 등)로 가이드된다. RNA 압타머는 관련 기술분야에 공지되어 있으며 일반적으로 리보스위치의 합성 버전이다. 용어 "RNA 압타머" 및 "리보스위치"는 이들을 포함하는 RNA 분자의 구조의 유도성 조절 (따라서 특이적 서열의 이용가능성)을 제공하는 합성 및 자연 핵산 서열 둘 다를 포괄하기 위해 본원에서 상호교환가능하게 사용된다. RNA 압타머는 일반적으로 특정한 약물 (예를 들어, 소분자)과 특이적으로 결합하는 특정한 구조 (예를 들어, 헤어핀)로 폴딩되는 서열을 포함한다. 약물의 결합은 RNA의 폴딩에 있어서 구조적 변화를 유발시키며, 이는 압타머를 포함하는 핵산의 특색을 변화시킨다. 비제한적인 예로서: (i) 압타머가 있는 활성인자-RNA는, 압타머가 적절한 약물에 의해 결합되지 않는 한 동족 표적 RNA과 결합하지 못할 수 있으며; (ii) 압타머가 있는 표적-RNA는, 압타머가 적절한 약물에 의해 결합되지 않는 한 동족 활성인자-RNA와 결합하지 못할 수 있으며; (iii) 상이한 약물과 결합하는 상이한 압타머를 각각 포함하는 표적인자-RNA 및 활성인자-RNA는 두 약물이 모두 존재하지 않는 한 서로 결합하지 못할 수 있다. 이들 예에 의해 예시된 바와 같이, 2-분자 가이드 RNA는 유도가능하도록 설계될 수 있다.
압타머 및 리보스위치의 예는, 예를 들어 문헌 [Nakamura et al., Genes Cells. 2012 May;17(5):344-64; Vavalle et al., Future Cardiol. 2012 May;8(3):371-82; Citartan et al., Biosens Bioelectron. 2012 Apr 15;34(1):1-11; 및 Liberman et al., Wiley lnterdiscip Rev RNA. 2012 May-Jun;3(3):369-84]에서 찾을 수 있으며; 이들 모두는 그 전체 내용이 본원에 참조로 포함된다.
유전적 변형 방법의 선택은 일반적으로, 형질전환되는 세포의 유형과 형질전환이 일어나는 상황 (예를 들어, 시험관 내, 생체 외 또는 생체 내)에 따라 달라진다. 이러한 방법에 대한 일반적인 논의는 문헌 [Ausubel, et al., Short Protocols in Molecular Biology, 3rd ed., Wiley & Sons, 1995]에서 찾을 수 있다.
압타머 및 리보스위치의 예는, 예를 들어, 문헌 [Nakamura et al., Genes Cells. 2012 May;17(5):344-64; Vavalle et al., Future Cardiol. 2012 May;8(3):371-82; Citartan et al., Biosens Bioelectron. 2012 Apr 15;34(1):1-11; 및 Liberman et al., Wiley lnterdiscip Rev RNA. 2012 May-Jun;3(3):369-84]에서 찾을 수 있으며; 이들 모두는 그 전체 내용이 본원에 참조로 포함된다.
용어 "줄기 세포"는 자기 재생할 수 있는 능력과 분화된 세포 유형을 생성할 수 있는 능력 둘 다를 갖는 세포 (예를 들어, 식물 줄기 세포, 척추동물 줄기 세포)를 지칭하기 위해 본원에 사용된다 (문헌 [Morrison et al. (1997) Cell 88:287-298] 참조). 세포 개체발생의 맥락에서, "분화된" 또는 "분화하는"이라는 형용사는 상대적인 용어이다. "분화된 세포"는 이와 비교되는 세포보다 발달 경로를 더 아래로 진행한 세포이다. 따라서, 만능성 줄기 세포 (하기 기재됨)는 계통-제한된 전구 세포 (예를 들어, 중배엽 줄기 세포)로 분화할 수 있으며, 이는 결국 추가 제한되는 세포 (예를 들어, 뉴런 전구세포)로 분화할 수 있으며, 이는 말기 세포 (예를 들어, 말기 분화된 세포, 예를 들어 뉴런, 심근세포 등)로 분화할 수 있으며, 이는 특정의 조직 유형에서 특징적인 역할을 하며 향후 증식할 수 있는 능력을 보유할 수도 있고 보유하지 않을 수도 있다. 줄기 세포는 특이적 마커 (예를 들어, 단백질, RNA 등)의 존재와 특이적 마커의 부재 둘 다를 특징으로 할 수 있다. 줄기 세포는 또한 시험관 내 및 생체 내 둘 다에서의 기능적 검정, 특히 다수의 분화된 자손을 생성할 수 있는 줄기 세포의 능력과 관련된 검정에 의해 확인될 수 있다.
관심 줄기 세포는 만능성 줄기 세포 (PSC)를 포함한다. 용어 "만능성 줄기 세포" 또는 "PSC"는 유기체의 모든 세포 유형을 생산할 수 있는 줄기 세포를 의미하기 위해 본원에 사용된다. 따라서, PSC는 유기체의 모든 배엽층(예를 들어, 척추동물의 내배엽, 중배엽 및 외배엽)의 세포를 생성할 수 있다. 만능성 세포는 기형종을 형성할 수 있고 살아있는 유기체 내의 외배엽, 중배엽 또는 내배엽 조직에 기여할 수 있다. 식물의 만능성 줄기 세포는 식물의 모든 세포 유형 (예를 들어, 뿌리, 줄기, 잎 등의 세포)을 생성할 수 있다.
동물의 PSC는 수많은 상이한 방법으로 유래될 수 있다. 예를 들어, 배아 줄기 세포 (ESC)는 배아의 내부 세포 덩어리로부터 유래되는 반면 (문헌 [Thomson et al., Science. 1998 Nov 6;282(5391):1145-7]), 유도 만능성 줄기 세포 (iPSC)는 체세포로부터 유래된다 (Takahashi et al., Cell. 2007 Nov 30;131(5):861-72; Takahashi et al., Nat Protoc. 2007;2(12):3081-9; Yu et al., Science. 2007 Dec 21;318(5858):1917-20. Epub 2007 Nov 20).
용어 PSC는 유래에 관계없이 만능성 줄기 세포를 지칭하기 때문에, 용어 PSC는 용어 ESC 및 iPSC 뿐만 아니라 PSC의 또 다른 예인 용어 배아 생식 줄기 세포 (EGSC)를 포괄한다. PSC는 확립된 세포주의 형태일 수 있거나, 1차 배아 조직으로부터 직접적으로 수득될 수 있거나, 또는 체세포로부터 유래될 수 있다. PSC는 본원에 기재된 방법의 표적 세포일 수 있다.
"배아 줄기 세포" (ESC)는 배아, 일반적으로 배반포의 내부 세포 덩어리로부터 단리된 PSC를 의미한다. ESC 계통은 NIH 인간 배아 줄기 세포 레지스트리에 나열되어 있으며, 예를 들어, hESBGN-01, hESBGN-02, hESBGN-03, hESBGN-04 [브레사젠, 인크.(BresaGen, Inc.)]; HES-1, HES-2, HES-3, HES-4, HES-5, HES-6 [ES 셀 인터내셔날(ES Cell International)]; Miz-hES1 [미즈메디 병원-서울대학교(MizMedi Hospital-Seoul National University)]; HSF-1, HSF-6 (샌프란시스코 캘리포니아 대학교); 및 H1, H7, H9, H13, H14 (위스콘신 동문 연구 재단 (와이셀 연구소))이다. 관심 줄기 세포는 또한 다른 영장류로부터의 배아 줄기 세포, 예컨대 레수스(Rhesus) 줄기 세포 및 마모셋 줄기 세포를 포함한다. 줄기 세포는 임의의 포유동물 종, 예를 들어 인간, 말, 소, 돼지, 개, 고양이, 설치류, 예를 들어 마우스, 래트, 햄스터, 영장류 등으로부터 수득될 수 있다 (Thomson et al. (1998) Science 282:1145; Thomson et al. (1995) Proc. Natl. Acad. Sci. USA 92:7844; Thomson et al. (1996) Biol. Reprod. 55:254; Shamblott et al., Proc. Natl. Acad. Sci. USA 95:13726, 1998). 배양물에서, ESC는 일반적으로 큰 핵-세포질 비율을 갖고, 경계가 뚜렷하며 눈에 띄는 핵소체가 있는 편평한 콜로니로서 성장한다. 또한, ESC는 SSEA-3, SSEA-4, TRA-1-60, TRA-1-81 및 알칼리성 포스파타제를 발현하지만 SSEA-1은 발현하지 않는다. ESC를 생성하고 명확히 규명하는 방법의 예는, 예를 들어, 미국 특허 번호 7,029,913, 미국 특허 번호 5,843,780, 및 미국 특허 번호 6,200,806에서 찾을 수 있으며, 그의 개시내용은 본원에 참조로 포함된다. 미분화된 형태의 hESC를 증식시키는 방법은 WO 99/20741, WO 01/51616, 및 WO 03/020920에 기재되어 있다. "배아 생식 줄기 세포" (EGSC) 또는 "배아 생식 세포" 또는 "EG 세포"는 생식 세포 및/또는 생식 세포 전구세포, 예를 들어 원시 생식 세포, 예를 들어 정자와 난자가 될 세포로부터 유래되는 PSC를 의미한다. 배아 생식 세포 (EG 세포)는 상기 기재된 바와 같은 배아 줄기 세포와 유사한 특성을 갖는 것으로 생각된다. EG 세포를 생성하고 명확히 규명하는 방법의 예는, 예를 들어 미국 특허 번호 7,153,684; 문헌 [Matsui, Y., et al., (1992) Cell 70:841; Shamblott, M., et al. (2001) Proc. Natl. Acad. Sci. USA 98: 113; Shamblott, M., et al. (1998) Proc. Natl. Acad. Sci. USA, 95:13726; 및 Koshimizu, U., et al. (1996) Development, 122:1235]에서 찾을 수 있으며, 그의 개시내용은 본원에 참조로 포함된다.
"유도 만능성 줄기 세포" 또는 "iPSC"는 PSC가 아닌 세포 (예를 들어, PSC에 비해 분화되는 세포)로부터 유래된 PSC를 의미한다. iPSC는 말단 분화된 세포를 포함하여, 다수의 상이한 세포 유형으로부터 유래될 수 있다. iPSC는 ES 세포-유사 형태를 갖고 있으며, 큰 핵-세포질 비율을 갖고, 경계가 뚜렷하며 눈에 띄는 핵이 있는 편평한 콜로니로서 성장한다. 또한, iPSC는 알칼리성 포스파타제, SSEA3, SSEA4, Sox2, Oct3/4, Nanog, TRA160, TRA181, TDGF 1, Dnmt3b, Fox03, GDF3, Cyp26al, TERT, 및 zfp42를 포함하나 이에 제한되지는 않는, 관련 기술분야의 통상의 기술자에게 공지된 하나 이상의 주요 만능성 마커를 발현한다.
iPSC를 생성하고 명확히 규명하는 방법의 예는, 예를 들어, 미국 특허 공개 번호 US20090047263, US20090068742, US20090191159, US20090227032, US20090246875, 및 US20090304646에서 찾을 수 있으며, 그의 개시내용은 본원에 참조로 포함된다. 일반적으로, iPSC를 생성하기 위해, 체세포를 재프로그래밍하여 만능성 줄기 세포가 되도록 관련 기술분야에 공지된 재프로그래밍 인자 (예를 들어, Oct4, SOX2, KLF4, MYC, Nanog, Lin28 등)가 체세포에 제공된다.
"체세포"는 실험적 조작이 없을 경우 통상적으로 유기체 내의 모든 유형의 세포를 생성하지 않는 유기체 내의 임의의 세포를 의미한다. 다시 말해서, 체세포는 신체의 3가지 배엽 층, 예를 들어, 외배엽, 중배엽 및 내배엽 모두의 세포를 자연적으로 생성하지 않을 정도로 충분히 분화된 세포이다. 예를 들어, 체세포는 뉴런과 신경 전구세포 둘 다를 포함하며, 후자는 중추 신경계의 모든 또는 일부 세포 유형을 자연적으로 생성할 수 있지만 중배엽 또는 내배엽 계통의 세포를 생성할 수는 없다.
"유사분열 세포"는 유사분열을 겪는 세포를 의미한다.
"유사분열 후 세포"는 유사분열로부터 빠져나온 세포, 예를 들어 "정지" 상태, 예를 들어 더 이상 분열을 거치지 않는 세포를 의미한다. 이러한 정지 상태는 일시적, 예를 들어 가역적일 수 있거나, 또는 영구적일 수 있다.
"감수분열 세포"는 감수분열을 겪고 있는 세포를 의미한다.
"재조합"은 두 폴리뉴클레오티드 간의 유전적 정보 교환 프로세스를 의미한다. 본원에 사용된 바와 같은 "상동성-지시된 복구 (HDR)"는, 예를 들어, 세포 내의 이중 가닥 파손부를 복구하는 동안 발생하는 특수 형태의 DNA 복구를 지칭한다. 이러한 프로세스는 뉴클레오티드 서열 상동성을 필요로 하고, "공여자" 분자를 사용하여 "표적" 분자의 템플릿 복구 (예를 들어, 이중 가닥 파손을 경험한 분자)를 수행하며, 공여자에서 표적으로의 유전 정보의 전달을 초래한다. 공여자 폴리뉴클레오티드가 표적 분자와 상이하고 공여자 폴리뉴클레오티드 서열의 일부 또는 전부가 표적 DNA에 혼입되는 경우, 상동성-지시된 복구는 표적 분자의 서열 변경 (예를 들어, 삽입, 결실, 돌연변이)을 초래할 수 있다. 일부 실시양태에서, 공여자 폴리뉴클레오티드, 공여자 폴리뉴클레오티드의 일부분, 공여자 폴리뉴클레오티드의 카피, 또는 공여자 폴리뉴클레오티드의 카피의 일부분이 표적 DNA에 통합된다.
"비-상동 말단 연결 (NHEJ)"은 상동 템플릿에 대한 필요성 없이 파손 말단을 서로 직접 라이게이션함으로써 DNA 내의 이중 가닥 파손부를 복구하는 것을 의미한다 (복구를 가이드하기 위해 상동 서열을 필요로 하는 상동성-지시된 복구와는 대조적임). NHEJ는 종종 이중 가닥 파손 부위 근처의 뉴클레오티드 서열의 손실 (결실)을 초래한다.
용어 "치료", "치료하는" 등은 일반적으로 원하는 약리학적 및/또는 생리학적 효과를 수득하는 것을 의미하기 위해 본원에 사용된다. 효과는 질환 또는 그의 증상을 완전히 또는 부분적으로 예방하는 관점에서 예방적일 수 있고/거나 질환 및/또는 질환으로 인한 부작용에 대한 부분적 또는 완전한 치유의 관점에서 치료적일 수 있다. 본원에 사용된 바와 같은 "치료"는 포유동물에서 질환 또는 증상의 임의의 치료를 포함하며, (a) 질환 또는 증상을 획득할 경향이 있지만 아직 질환 또는 증상이 있는 것으로 진단되지 않은 대상체에게 질환 또는 증상이 발생하는 것을 예방하는 것; (b) 질환이나 증상을 억제하는 것, 예를 들어 그의 발생을 저지하는 것; 또는 (c) 질환을 완화시키는 것, 예를 들어 질환의 퇴행을 유발시키는 것을 포함한다. 치료제는 질환 또는 손상의 발병 전, 발병 동안 또는 발병 후에 투여될 수 있다. 치료가 대상체의 바람직하지 않은 임상 증상을 안정화시키거나 감소시키는, 진행 중인 질환의 치료가 특히 중요하다. 이러한 치료는 바람직하게, 병에 걸린 조직에서의 기능이 완전히 상실되기 전에 수행된다. 요법은 바람직하게, 질환의 증상 단계 동안, 및 일부 경우에는 질환의 증상 단계 후에 투여될 것이다.
용어 "개체", "대상체", "숙주" 및 "환자"는 본원에서 상호교환가능하게 사용되며 진단, 치료 또는 요법이 요망되는 임의의 포유동물 대상체, 특히 인간을 지칭한다.
분자 및 세포 생화학에서의 일반적인 방법은 문헌 [Molecular Cloning: A Laboratory Manual, 3rd Ed. (Sambrook et al., Harbor Laboratory Press 2001); Short Protocols in Molecular Biology, 4th Ed. (Ausubel et al. eds., John Wiley & Sons 1999); Protein Methods (Bollag et al., John Wiley & Sons 1996); Nonviral Vectors for Gene Therapy (Wagner et al. eds., Academic Press 1999); Viral Vectors (Kaplift & Loewy eds., Academic Press 1995); Immunology Methods Manual (1. Lefkovits ed., Academic Press 1997); 및 Cell and Tissue Culture: Laboratory Procedures in Biotechnology (Doyle & Griffiths, John Wiley & Sons 1998)]과 같은 표준 교과서에서 찾을 수 있으며, 그의 개시내용은 본원에 참조로 포함된다.
특정 범위의 값이 제공되는 경우, 문맥상 명백하게 달리 명시하지 않는 한 하한 단위의 10분의 1까지의 각각의 중간 값, 그러한 범위의 상한과 하한 사이 값, 및 임의의 다른 언급된 또는 그러한 언급된 범위 내의 중간 값이 본 개시내용 내에 포괄되는 것으로 이해된다. 이들 더 작은 범위의 상한 및 하한은 독립적으로 더 작은 범위에 포함될 수 있고, 또한 언급된 범위에서 임의의 구체적으로 배제된 한계에 따라 본 개시내용 내에 포괄된다. 언급된 범위가 한계치 중 하나 또는 둘 다를 포함하는 경우, 포함된 한계치 중 하나 또는 둘 다를 제외하는 범위가 또한 본 개시내용에 포함된다.
문구 "로 본질적으로 이루어지는"은 본원에서 시스템의 명시된 활성 구성요소 또는 구성요소들이 아닌 것, 또는 분자의 명시된 활성 부분 또는 부분들이 아닌 임의의 것을 배제하는 것을 의미한다.
특정 범위는 본원에 수치 값으로 제시되며, 용어 "약"이 그 수치 앞에 표시된다. 용어 "약"은 그 뒤에 있는 정확한 숫자 뿐만 아니라 그 용어 뒤에 있는 숫자에 가깝거나 대략적인 숫자에 대한 문자 그대로의 지원을 제공하기 위해 본원에 사용된다. 숫자가 구체적으로 언급된 숫자에 가깝거나 대략적인지 여부를 결정할 때, 인용되지 않은 숫자에 가깝거나 대략적인 숫자는 제시된 맥락에서 구체적으로 언급된 숫자와 실질적으로 동등한 것을 제공하는 숫자일 수 있다.
명확성을 위해 별도의 실시양태의 맥락에서 기재되는 본 개시내용의 특정의 특색은 또한, 단일 실시양태에서 조합하여 제공될 수 있는 것으로 인지된다. 반대로, 간략화를 위해 단일 실시양태의 맥락에서 기재되는 본 개시내용의 다양한 특색은 또한, 별도로 또는 임의의 적절한 하위 조합으로 제공될 수 있다. 본 개시내용에 속하는 실시양태의 모든 조합은 본 개시내용에 의해 구체적으로 포함되며, 마치 각각의 모든 조합이 개별적이고 명시적으로 개시된 것처럼 본원에 개시된다. 또한, 다양한 실시양태의 모든 하위 조합 및 그의 요소가 또한, 본 개시내용에 의해 구체적으로 포함되며, 마치 각각의 모든 하위 조합이 본원에 개별적이고 명시적으로 개시된 것처럼 본원에 개시된다.
B-
GEn
.1 또는 B-
GEn
.2 융합 폴리펩티드
B-GEn.1 또는 B-GEn.2는 B-GEn.1 또는 B-GEn.2 뉴클레아제와 비교하여 부가의 도메인 및 활성을 갖는 융합 단백질을 형성하는데 사용될 수 있다. 비제한적인 예시로서, Fokl 도메인은 촉매적으로 활성인 엔도뉴클레아제 도메인을 함유할 수 있는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체와 융합될 수 있거나, 또는 Fokl 도메인은 B-GEn.1 또는 B-GEn.2 엔도뉴클레아제 도메인을 불활성화하도록 변형된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체와 융합될 수 있다. B-GEn.1 또는 B-GEn.2와 융합 단백질을 만들기 위해 융합될 수 있는 다른 도메인은 전사 조정인자, 후생유전학적 변형인자, 태그 및 기타 표지 또는 영상화제, 히스톤, 및/또는 유전자 서열의 구조 또는 활성을 조정하거나 변형시키는 관련 기술분야에 공지된 다른 양식을 포함한다.
일부 실시양태에서, 본원에 기재된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 전사 활성인자 또는 억제인자, 또는 후생유전학적 변형인자, 예컨대 메틸라제, 데메틸라제, 아세틸라제 또는 데아세틸라제와 융합된다.
일부 실시양태에서, 본원에 기재된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 검출, 분자간 상호작용, 번역 활성화, 변형, 또는 관련 기술분야에 공지된 임의의 다른 조작을 위한 기능적 단백질 구성요소와 융합된다.
예시적인 B-
GEn
.1 또는 B-GEn.2
변이체
폴리펩티드
일부 실시양태에서, 본원에 기재된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 a) 표적화된 부위와 결합할 수 있는 능력을 유지하고, 임의로 b) 그의 활성을 유지한다. 일부 실시양태에서, 유지되는 활성은 엔도뉴클레아제 활성이다. 특정 실시양태에서, 엔도뉴클레아제 활성은 tracrRNA를 필요로 하지 않는다.
일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체의 활성 부분이 변형된다. 일부 실시양태에서, 변형은 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체의 뉴클레아제 활성을 감소 또는 증가시키는 아미노산 변화 (예를 들어, 결실, 삽입 또는 치환)를 포함한다. 예를 들어, 일부 실시양태에서, 변형된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 상응하는 비변형된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체의 뉴클레아제 활성의 50% 미만, 40% 미만, 30% 미만, 20% 미만, 10% 미만, 5% 미만, 또는 1% 미만을 갖는다. 일부 실시양태에서, 변형된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 실질적인 뉴클레아제 활성을 갖지 않는다. 일부 실시양태에서, 이는 50%, 2배, 4배 또는 최대 10배 초과하는 뉴클레아제 활성을 가질 수 있다.
일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체의 활성 부분은 DNA 변형 활성 및/또는 전사 인자 활성 및/또는 DNA-연관 폴리펩티드 변형 활성을 갖는 이종 폴리펩티드를 포함한다. 일부 실시양태에서, 이종 폴리펩티드는 뉴클레아제 활성을 제공하는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체의 일부분을 대체한다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 정상적으로 뉴클레아제 활성을 제공하는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체의 일부분 (그리고 그러한 일부분은 완전히 활성이거나 대신 상응하는 비변형된 활성의 100% 미만을 갖도록 변형될 수 있음)과 이종 폴리펩티드 둘 다를 포함한다. 다시 말해서, 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 정상적으로 뉴클레아제 활성을 제공하는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체의 일부분과 이종 폴리펩티드 둘 다를 포함하는 융합 폴리펩티드일 수 있다.
예를 들어, B-GEn.1 또는 B-GEn.2 융합 단백질에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 이종 폴리펩티드 서열 (예를 들어, B-GEn.1 또는 B-GEn.2 이외의 단백질로부터의 폴리펩티드 서열)과 융합될 수 있다. 이종 폴리펩티드 서열은 B-GEn.1 또는 B-GEn.2 융합 단백질에 의해 나타날 활성 (예를 들어, 효소 활성) (예를 들어, 메틸트랜스퍼라제 활성, 아세틸트랜스퍼라제 활성, 키나제 활성, 유비퀴틴화 활성 등)을 나타낼 수 있다. 이종 핵산 서열은 또 다른 핵산 서열에 연결되어 (예를 들어, 유전 공학에 의함) 융합 폴리펩티드를 코딩하는 융합 뉴클레오티드 서열을 생성할 수 있다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 융합 폴리펩티드는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 세포하 국재화를 제공하는 이종 서열 (예를 들어, 핵을 표적화하기 위한 핵 국재화 신호 (NLS); 미토콘드리아를 표적화하기 위한 미토콘드리아 국재화 신호; 엽록체를 표적화하기 위한 엽록체 국재화 신호: ER 체류 신호 등)과 융합함으로써 생성된다. 일부 실시양태에서, 이종 서열은 추적 또는 정제의 용이성을 위한 태그 (예를 들어, 형광 단백질, 예를 들어 녹색 형광 단백질 (GFP), YFP, RFP, CFP, mCherry, tdTomato 등; HIS 태그, 예를 들어 6XHis 태그; 헤마글루티닌 (HA) 태그; FLAG 태그; Myc 태그 등)를 제공할 수 있다. 일부 실시양태에서, 이종 서열은 증가되거나 감소된 안정성을 제공할 수 있다. 일부 실시양태에서, 이종 서열은 관심 뉴클레오티드 (예를 들어, 뉴클레오티드 결합 단백질의 압타머 또는 표적 부위)에 대한 결합 도메인 (예를 들어, B-GEn.1 또는 B-GEn.2 융합 폴리펩티드가 또 다른 관심 단백질, 예를 들어 DNA 또는 히스톤 변형 단백질, 전사 인자 또는 전사 억제인자, 동원 단백질 등과 결합할 수 있는 능력을 제공하기 위함)을 제공할 수 있다.
일부 실시양태에서, 본원에 기재된 B-GEn.1 또는 B-GEn.2 폴리펩티드 변이체 중 임의의 것에 따르면, B-GEn.1 또는 B-GEn.2 폴리펩티드 변이체는 감소된 엔도데옥시리보뉴클레아제 활성을 갖는다. 예를 들어, 본 개시내용의 전사 조정 방법에 사용하기 적합한 B-GEn.1 또는 B-GEn.2 폴리펩티드 변이체는 비변형된 B-GEn.1 또는 B-GEn.2 폴리펩티드의 엔도데옥시리보뉴클레아제 활성의 약 20% 미만, 약 15% 미만, 약 10% 미만, 약 5% 미만, 약 1% 미만, 또는 약 0.1% 미만을 나타낸다.
일부 실시양태에서, 변이체 B-GEn.1 또는 B-GEn.2 폴리펩티드는 검출가능한 엔도데옥시리보뉴클레아제 활성을 실질적으로 갖지 않는다 (dB-GEn.1 또는 B-GEn.2). 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 변이체가 감소된 촉매 활성을 가질 때, 이러한 폴리펩티드는 가이드 RNA와 상호작용할 수 있는 능력을 유지하는 한 여전히 부위-특이적 방식으로 표적 DNA와 결합할 수 있다 (이는 가이드 RNA에 의해 표적 DNA 서열로 여전히 가이드되기 때문임). 일부 실시양태에서, 변이체 B-GEn.1 또는 B-GEn.2 폴리펩티드는 표적 DNA의 상보적 가닥을 절단할 수 있지만 표적 DNA의 비-상보적 가닥을 절단할 수 있는 능력이 감소된 닉카제이다.
일부 실시양태에서, 닉카제 내의 변이체 B-GEn.1 또는 B-GEn.2 폴리펩티드는 표적 DNA의 비-상보적 가닥을 절단할 수 있지만 표적 DNA의 상보적 가닥을 절단할 수 있는 능력이 감소된다.
일부 실시양태에서, 변이체 B-GEn.1 또는 B-GEn.2 폴리펩티드는 표적 DNA의 상보적 가닥과 비-상보적 가닥 둘 다를 절단할 수 있는 능력이 감소된다. 예를 들어, 알라닌 치환이 고려된다.
일부 실시양태에서, 변이체 B-GEn.1 또는 B-GEn.2 폴리펩티드는 융합 폴리펩티드 ("변이체 B-GEn.1 또는 B-GEn.2 융합 폴리펩티드"), 예를 들어 i) 변이체 B-GEn.1 또는 B-GEn.2 폴리펩티드; 및 ii) 공유적으로 연결된 이종 폴리펩티드 ("융합 파트너"로서 지칭되기도 함)를 포함하는 융합 폴리펩티드이다.
이종 폴리펩티드는 변이체 B-GEn.1 또는 B-GEn.2 융합 폴리펩티드에 의해 나타날 활성 (예를 들어, 효소 활성) (예를 들어, 메틸트랜스퍼라제 활성, 아세틸트랜스퍼라제 활성, 키나제 활성, 유비퀴틴화 활성 등)을 나타낼 수 있다. 이종 핵산 서열은 또 다른 핵산 서열에 연결되어 (예를 들어, 유전 공학에 의함) 융합 폴리펩티드를 코딩하는 융합 뉴클레오티드 서열을 생성할 수 있다. 일부 실시양태에서, 변이체 B-GEn.1 또는 B-GEn.2 융합 폴리펩티드는 변이체 B-GEn.1 또는 B-GEn.2 폴리펩티드를 세포하 국재화를 제공하는 이종 서열과 융합함으로써 생성된다 (예를 들어, 이종 서열은 세포하 국재화 서열, 예를 들어 핵을 표적화하기 위한 핵 국재화 신호 (NLS); 미토콘드리아를 표적화하기 위한 미토콘드리아 국재화 신호; 엽록체를 표적화하기 위한 엽록체 국재화 신호; ER 체류 신호 등임). 일부 실시양태에서, 이종 서열은 추적 및/또는 정제의 용이성을 위한 태그 (예를 들어, 이종 서열은 검출가능한 표지임) (예를 들어, 형광 단백질, 예를 들어 녹색 형광 단백질 (GFP), YFP, RFP, CFP, mCherry, tdTomato 등; 히스티딘 태그, 예를 들어 6XHis 태그; 헤마글루티닌 (HA) 태그; FLAG 태그; Myc 태그 등)를 제공할 수 있다. 일부 실시양태에서, 이종 서열은 증가되거나 감소된 안정성을 제공할 수 있다 [예를 들어, 이종 서열은 안정성 제어 펩티드, 예를 들어 데그론이며, 이는 일부 경우에 제어가능하다 (예를 들어, 온도 감수성 또는 약물 제어가능한 데그론 서열, 하기 참조)]. 일부 실시양태에서, 이종 서열은 표적 DNA로부터의 증가되거나 감소된 전사를 제공할 수 있다 (예를 들어, 이종 서열은 전사 조정 서열, 예를 들어 전사 인자/활성인자 또는 그의 단편, 전사 인자/활성인자를 동원하는 단백질 또는 그의 단편, 전사 억제인자 또는 그의 단편, 전사 억제인자를 동원하는 단백질 또는 그의 단편, 소분자/약물 반응성 전사 조절인자 등임). 일부 실시양태에서, 이종 서열은 결합 도메인을 제공할 수 있다 (예를 들어, 이종 서열은, 예를 들어, 융합 dB-GEn.1 또는 B-GEn.2 폴리펩티드가 또 다른 관심 단백질, 예를 들어 DNA 또는 히스톤 변형 단백질, 전사 인자 또는 전사 억제인자, 동원 단백질 등과 결합할 수 있는 능력을 제공하기 위한 단백질 결합 서열임).
증가되거나 감소된 안정성을 제공하는 적합한 융합 파트너는 데그론 서열을 포함하나 이에 제한되지는 않는다. 데그론은 그를 포함하는 단백질의 안정성을 제어하는 아미노산 서열인 것으로 관련 기술분야의 통상의 기술자에 의해 쉽게 이해된다. 예를 들어, 데그론 서열을 포함하는 단백질의 안정성은 데그론 서열에 의해 적어도 부분적으로 제어된다. 일부 실시양태에서, 적합한 데그론은, 이러한 데그론이 실험 제어와 무관하게 단백질 안정성에 영향을 미치도록 구성적이다 (예를 들어, 데그론은 약물 유도성, 온도 유도성 등이 아님). 일부 실시양태에서, 데그론은 원하는 조건에 따라 변이체 B-GEn.1 또는 B-GEn.2 폴리펩티드를 "온" (예를 들어, 안정) 또는 "오프" (예를 들어, 불안정, 성능 저하) 상태로 설정할 수 있도록 변이체 B-GEn.1 또는 B-GEn.2 폴리펩티드에 제어가능한 안정성을 제공한다. 예를 들어, 데그론이 온도 감수성 데그론인 경우, 변이체 B-GEn.1 또는 B-GEn.2 폴리펩티드는 임계 온도 (예를 들어, 42℃, 41℃, 40℃, 39℃, 38℃, 37℃, 36℃, 35℃, 34℃, 33℃, 32℃, 31℃, 30℃ 등) 아래에서는 기능적일 수 있지만 (예를 들어, "온", 안정) 임계 온도 위에서는 비-기능적일 수 있다 (예를 들어, "오프", 성능 저하). 또 다른 예로서, 데그론이 약물 유도성 데그론인 경우, 약물의 존재 또는 부재는 단백질을 "오프" (예를 들어, 불안정) 상태에서 "온" (예를 들어, 안정) 상태로 또는 그 반대로 전환시킬 수 있다. 예시적인 약물 유도성 데그론은 FKBP12 단백질로부터 유래된다. 데그론의 안정성은 데그론과 결합하는 소분자의 존재 또는 부재에 의해 제어된다.
적합한 데그론의 예는 쉴드(Shield)-1, DHFR, 옥신 및/또는 온도에 의해 제어되는 데그론을 포함하나 이에 제한되지는 않는다. 적합한 데그론의 비제한적인 예는 관련 기술분야에 공지되어 있다 (예를 들어, 문헌 [Dohmen et al., Science, 1994. 263(5151): p. 1273-1276: Heat-inducible degron: a method for constructing temperature-sensitive mutants; Schoeber et al., Am J Physiol Renal Physiol. 2009 Jan;296(1):F204-11: Conditional fast expression and function of multimeric TRPV5 channels using Shield-1; Chu et al., Bioorg Med Chem Lett. 2008 Nov 15;18(22):5941-4: Recent progress with FKBP-derived destabilizing domains; Kanemaki, Pflugers Arch. 2012 Dec 28: Frontiers of protein expression control with conditional degrons; Yang et al., Mol Cell. 2012 Nov 30;48(4):487-8: Titivated for destruction: the methyl degron; Barbour et al., Biosci Rep. 2013 Jan 18;33(1).: Characterization of the bipartite degron that regulates ubiquitin-independent degradation of thymidylate synthase; 및 Greussing et al., J Vis Exp. 2012 Nov 10;(69): Monitoring of ubiquitin-proteasome activity in living cells using a Degron (dgn)-destabilized green fluorescent protein (GFP)-based reporter protein]; 이들 모두는 전체 내용이 본원에 참조로 포함됨).
예시적인 데그론 서열은 세포와 동물 둘 다에서 널리 특징규명되었고 시험되었다. 따라서, B-GEn.1 또는 B-GEn.2를 데그론 서열과 융합시키면 "조정가능"하고 "유도성"인 B-GEn.1 또는 B-GEn.2 폴리펩티드가 생산된다. 본원에 기재된 융합 파트너 중 임의의 것은 임의의 바람직한 조합으로 사용될 수 있다. 이러한 점을 예시하기 위한 하나의 비제한적인 예로서, B-GEn.1 또는 B-GEn.2 융합 단백질은 검출을 위한 YFP 서열, 안정성을 위한 데그론 서열, 및 표적 DNA로부터의 전사를 증가시키기 위한 전사 활성인자 서열을 포함할 수 있다. 더욱이, B-GEn.1 또는 B-GEn.2 융합 단백질에 사용될 수 있는 융합 파트너의 수는 무제한이다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 융합 단백질은 1개 이상 (예를 들어, 2개 이상, 3개 이상, 4개 이상, 또는 5개 이상)의 이종 서열을 포함한다.
적합한 융합 파트너는 메틸트랜스퍼라제 활성, 데메틸라제 활성, 아세틸트랜스퍼라제 활성, 데아세틸라제 활성, 키나제 활성, 포스파타제 활성, 유비퀴틴 라이가제 활성, 탈유비퀴틴화 활성, 아데닐화 활성, 탈아데닐화 활성, SUMO일화 활성, 탈SUMO일화 활성, 리보실화 활성, 탈리보실화 활성, 크로토닐화 활성, 탈크로토닐화 활성, 프로피오닐화 활성, 탈프로피오닐화 활성, 미리스토일화 활성, 또는 탈미리스토일화 활성을 제공하는 폴리펩티드를 포함하나 이에 제한되지는 않으며, 이들 중 임의의 것은 DNA를 직접적으로 변형시키거나 (예를 들어, DNA의 메틸화) DNA-연관 폴리펩티드 (예를 들어, 히스톤 또는 DNA 결합 단백질)를 변형시키는 것을 지시될 수 있다. 추가의 적합한 융합 파트너는 경계 요소 (예를 들어, CTCF), 주변 동원을 제공하는 단백질 및 그의 단편 (예를 들어, 라민 A, 라민 B 등), 및 단백질 도킹 요소 (예를 들어, FKBP/FRB, Pil 1/Aby 1 등)를 포함하나 이에 제한되지는 않는다.
B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 또한 통상적인 재조합 합성 방법에 따라 단리 및 정제될 수 있다. 발현 숙주의 용해물을 제조할 수 있으며, 용해물은 HPLC, 배제 크로마토그래피, 겔 전기영동, 친화성 크로마토그래피, 또는 기타 정제 기술을 사용하여 정제될 수 있다. 대부분의 경우, 사용되는 조성물은 산물의 제조 방법 및 그의 정제와 관련된 오염 물질과 관련하여, 원하는 산물의 적어도 20 중량%, 적어도 약 75 중량%, 적어도 약 95 중량%를 포함할 것이며, 치료 목적의 경우에는, 전형적으로 적어도 99.5 중량%를 포함할 것이다. 일반적으로 백분율은 총 단백질을 기준으로 한다. DNA 절단 및 재조합을 유도하거나 표적 DNA에 대한 임의의 원하는 변형 또는 표적 DNA와 연관된 폴리펩티드에 대한 임의의 원하는 변형을 유도하기 위해, 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 공여자 폴리뉴클레오티드는, 그들이 핵산 또는 폴리펩티드로서 도입되는지의 여부에 관계없이, 약 30분 내지 약 24시간, 예를 들어 1시간, 1시간 30분, 2시간, 2시간 30분, 3시간, 3시간 30분, 4시간, 5시간, 6시간, 7시간, 8시간, 12시간, 16시간, 18시간, 20시간, 또는 약 30분 내지 약 24시간의 임의의 다른 기간 동안 세포에 제공되며, 이는 약 매일 내지 약 4일마다, 예를 들어 1.5일마다, 2일마다, 3일마다의 빈도, 또는 약 매일 내지 약 4일마다의 임의의 다른 빈도로 반복될 수 있다. 작용제(들)는 세포에 1회 이상, 예를 들어 1회, 2회, 3회, 또는 3회 초과로 제공될 수 있으며, 세포는 각각의 접촉 사건 후 일정 시간, 예를 들어, 16-24시간 동안 작용제(들)와 함께 인큐베이션되고, 그 후 배지는 신선한 배지로 교체되고 세포는 추가로 배양된다. 2개 이상의 상이한 표적화 복합체가 세포에 제공되는 경우 (예를 들어, 동일하거나 상이한 표적 DNA 내의 상이한 서열에 상보적인 2개의 상이한 가이드 RNA), 복합체는 동시에 제공되거나 (예를 들어, 2개의 폴리펩티드 및/또는 핵산으로서) 또는 동시에 전달될 수 있다. 대안적으로, 이들은 연속적으로 제공될 수 있으며, 예를 들어 표적화 복합체가 먼저 제공되고, 이어서 제2 표적화 복합체가 제공되거나 그 반대일 수도 있다.
핵산
가이드
RNA
/
sgRNA
일부 실시양태에서 본원에 기재된 시스템, 조성물 및 방법은 연관된 폴리펩티드 (예를 들어, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체)의 활성을 표적 핵산 내의 특이적 표적 서열로 지시할 수 있는 게놈-표적화 핵산을 이용한다. 일부 실시양태에서, 게놈-표적화 핵산은 RNA이다. 게놈-표적화 RNA는 본원에서 "가이드 RNA" 또는 "gRNA"로서 지칭된다. 가이드 RNA는 관심 표적 핵산 서열 및 CRISPR 반복 서열 (이러한 CRISPR 반복 서열은 "tracr 메이트 서열"로서 지칭되기도 함)과 혼성화할 수 있는 적어도 스페이서 서열을 갖는다. 유형 II 시스템에서, gRNA는 tracrRNA 서열이라는 제2 RNA를 갖는다. 유형 II 가이드 RNA (gRNA)에서는, CRISPR 반복 서열과 tracrRNA 서열이 서로 혼성화되어 이중나선을 형성한다. 유형 V 가이드 RNA (gRNA)에서는, crRNA가 이중나선을 형성한다. 두 시스템 모두에서, 이중나선은 가이드 RNA와 부위-지시된 폴리펩티드가 복합체를 형성하도록 부위-특이적 폴리펩티드와 결합한다. 게놈-표적화 핵산은 부위-특이적 폴리펩티드와의 회합을 통해 복합체에 표적 특이성을 제공한다. 따라서 게놈-표적화 핵산은 부위-특이적 폴리펩티드의 활성을 지시한다.
일부 실시양태에서, 게놈-표적화 핵산은 이중 분자 가이드 RNA이다. 일부 실시양태에서, 게놈-표적화 핵산은 단일 분자 가이드 RNA 또는 단일 가이드 RNA (sgRNA)이다. 이중 분자 가이드 RNA는 2개 가닥의 RNA를 갖는다. 제1 가닥은 5'에서 3' 방향으로, 임의적 스페이서 연장 서열, 스페이서 서열 및 최소 CRISPR 반복 서열을 갖는다. 제2 가닥은 최소 tracrRNA 서열 (최소 CRISPR 반복 서열에 상보적임), 3' tracrRNA 서열 및 임의적 tracrRNA 연장 서열을 갖는다. 유형 II 시스템에서의 단일 분자 가이드 RNA (sgRNA)는 5'에서 3' 방향으로, 임의적 스페이서 연장 서열, 스페이서 서열, 최소 CRISPR 반복 서열, 단일 분자 가이드 링커, 최소 tracrRNA 서열, 3' tracrRNA 서열 및 임의적 tracrRNA 연장 서열을 갖는다. 임의적 tracrRNA 연장부는 가이드 RNA에 부가의 기능성 (예를 들어, 안정성)을 제공하는 요소를 가질 수 있다. 단일 분자 가이드 링커는 최소 CRISPR 반복부와 최소 tracrRNA 서열을 연결하여 헤어핀 구조를 형성한다. 임의적 tracrRNA 연장부는 하나 이상의 헤어핀을 갖는다.
유형 V 시스템에서의 단일 분자 가이드 RNA (sgRNA)는 5'에서 3' 방향으로, 최소 CRISPR 반복 서열과 스페이서 서열을 갖는다. 또는 대안적으로, 유형 V 시스템에서의 단일 분자 가이드 RNA (sgRNA)는 5'에서 3' 방향으로, 임의적 tracr 연장 서열, tracr RNA 서열, 단일 분자 가이드 링커, 최소 CRISPR 반복 서열, 스페이서 서열, 및 임의적 스페이서 연장 서열을 갖는다.
대안적으로, 유형 V 시스템에서의 단일 분자 가이드 RNA (sgRNA)는 5'에서 3' 방향으로, 임의적 연장 서열, 최소 CRISPR 반복 서열, 스페이서 서열, 및 임의적 스페이서 연장 서열을 갖는다.
또 다른 대안에서, 유형 V 시스템에서의 단일 분자 가이드 RNA (sgRNA)는 5'에서 3' 방향으로, 임의적 연장 서열, 인공 뉴클레아제 결합 RNA 서열 및 스페이서 서열, 및 임의적 스페이서 연장 서열을 포함한다.
본 발명에 따른 CRISPR Cas 뉴클레아제 및 잠재적으로 다른 유형 V CRISPR Cas 뉴클레아제에 특히 유용한 sgRNA는 서열식별번호: 40-44에 개시된 서열이다.
이들은 3' 단부 상에의 적합한 표적 특이적 서열의 부가를 허용한다.
예시적인 게놈-표적화 핵산은, 예를 들어, WO2018002719에 기재되어 있다. 일반적으로, CRISPR 반복 서열은 (1) 상응하는 tracr 서열을 함유하는 세포에서 CRISPR 반복 서열에 의해 플랭킹된 DNA 표적화 세그먼트를 절제하는 것; 및 (2) tracr 서열과 혼성화된 CRISPR 반복 서열을 포함하는 CRISPR 복합체를 표적 서열에서 형성하는 것 중 하나 이상을 촉진시키기 위해 tracr 서열과 충분한 상보성을 갖는 임의의 서열을 포함한다. 일반적으로, 상보성의 정도는 CRISPR 반복 서열과 tracr 서열 중 더 짧은 것의 길이를 따라, 이들 CRISPR 반복 서열과 tracr 서열의 최적의 정렬을 참조한 것이다. 최적의 정렬은 임의의 적합한 정렬 알고리즘에 의해 결정될 수 있으며 2차 구조, 예컨대 tracr 서열 또는 CRISPR 반복 서열 내의 자기 상보성을 추가로 설명할 수 있다. 일부 실시양태에서, 최적으로 정렬되었을 때 tracr 서열과 CRISPR 반복 서열 중 더 짧은 것의 30개 뉴클레오티드 길이를 따라 이들 tracr 서열과 CRISPR 반복 서열 간의 상보성 정도는 약 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97.5%, 99% 또는 그 초과이다. 일부 실시양태에서, tracr 서열은 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50개 또는 그 초과의 뉴클레오티드 길이이다. 일부 실시양태에서, tracr 서열과 CRISPR 반복 서열은 단일 전사체 내에 함유되어, 이들 두 서열 간의 혼성화가 2차 구조, 에컨대 헤어핀을 갖는 전사체를 생산한다. 일부 실시양태에서, 전사체 또는 전사된 폴리뉴클레오티드 서열은 적어도 2개 이상의 헤어핀을 갖는다.
가이드 RNA의 스페이서는 표적 DNA 내의 서열에 상보적인 뉴클레오티드 서열을 포함한다. 다시 말해서, 가이드 RNA의 스페이서는 혼성화 (예를 들어, 염기쌍 형성)를 통해 서열-특이적 방식으로 표적 DNA와 상호작용한다. 따라서, 스페이서의 뉴클레오티드 서열은 다양할 수 있으며 가이드 RNA와 표적 DNA가 상호작용할 표적 DNA 내의 위치를 결정할 수 있다. 가이드 RNA의 DNA-표적화 세그먼트는 표적 DNA 내의 임의의 원하는 서열과 혼성화되도록 변형될 수 있다 (예를 들어, 유전 공학에 의함).
일부 실시양태에서, 스페이서는 10개 뉴클레오티드 내지 30개 뉴클레오티드의 길이를 갖는다. 일부 실시양태에서, 스페이서는 13개 뉴클레오티드 내지 25개 뉴클레오티드의 길이를 갖는다. 일부 실시양태에서, 스페이서는 15개 뉴클레오티드 내지 23개 뉴클레오티드의 길이를 갖는다. 일부 실시양태에서, 스페이서는 18개 뉴클레오티드 내지 22개 뉴클레오티드, 예를 들어 20개 내지 22개 뉴클레오티드의 길이를 갖는다.
일부 실시양태에서, 스페이서의 DNA-표적화 서열과 표적 DNA의 프로토스페이서 간의 상보성 퍼센트는 20-22개 뉴클레오티드에 걸쳐 적어도 60% (예를 들어, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100%)이다.
일부 실시양태에서, 프로토스페이서는 그의 3' 단부 상에서 적합한 PAM 서열에 직접적으로 인접하거나 또는 이러한 PAM 서열은 3' 부분에서 DNA 표적화 서열의 일부이다.
가이드 RNA의 변형은 가이드 RNA 및 Cas 엔도뉴클레아제, 예컨대 B-GEn.1 또는 B-GEn.2를 포함하는 CRISPR-Cas 게놈 편집 복합체의 형성 또는 안정성을 향상시키는데 사용될 수 있다. 가이드 RNA의 변형은 또한 또는 대안적으로, 게놈 편집 복합체와 게놈 내 표적 서열 간의 상호작용의 개시, 안정성 또는 동역학을 향상시키는데 사용될 수 있으며, 이는 예를 들어 온-타겟 활성을 향상시키는데 사용될 수 있다. 가이드 RNA의 변형은 또한 또는 대안적으로, 특이성, 예를 들어 다른 (오프-타겟) 부위에서의 효과와 비교 시 온-타겟 부위에서의 게놈 편집의 상대적 비율을 향상시키기 위해 사용될 수 있다.
변형은 또한 또는 대안적으로, 예를 들어 세포에 존재하는 리보뉴클레아제 (RNase)에 의한 분해에 대한 저항성을 증가시켜 세포 내 반감기를 증가시킴으로써, 가이드 RNA의 안정성을 증가시키기 위해 사용될 수 있다. 가이드 RNA 반감기를 향상시키는 변형은 Cas 엔도뉴클레아제, 예컨대 B-GEn.1 또는 B-GEn.2가 B-GEn.1 또는 B-GEn.2 엔도뉴클레아제를 생성하기 위해 번역되어야 하는 RNA를 통해 편집될 세포 내로 도입되는 실시양태에서 특히 유용할 수 있는데, 이는 엔도뉴클레아제를 코딩하는 RNA와 동시에 도입된 가이드 RNA의 반감기를 증가시키는 것이 가이드 RNA와 코딩된 Cas 엔도뉴클레아제가 세포에 공존하는 시간을 증가시키는데 사용될 수 있기 때문이다.
공여자 DNA 또는 공여자 템플릿
부위-특이적 폴리펩티드, 예컨대 DNA 엔도뉴클레아제는 핵산, 예를 들어 게놈 DNA에 이중 가닥 파손부 또는 단일 가닥 파손부를 도입할 수 있다. 이중 가닥 파손부는 세포의 내인성 DNA-복구 경로 (예를 들어, 상동성 의존적 복구 (HDR) 또는 비-상동 말단 연결 또는 대체 비-상동 말단 연결 (A-NHEJ) 또는 마이크로상동성-매개 말단 연결 (MMEJ))를 자극할 수 있다. NHEJ는 상동 템플릿에 대한 필요성 없이도 절단된 표적 핵산을 복구할 수 있다. 이로 인해 때때로 절단 부위의 표적 핵산에 작은 결실이나 삽입 (삽입-결실)이 발생하여 유전자 발현이 중단되거나 변경될 수 있다. 상동 재조합 (HR)으로서 공지되기도 한 HDR은 상동 복구 템플릿 또는 공여자가 이용가능한 경우에 발생할 수 있다.
상동 공여자 템플릿은 표적 핵산 절단 부위를 플랭킹하는 서열과 상동인 서열을 갖는다. 자매 염색분체는 일반적으로 복구 템플릿으로서 세포에 의해 사용된다. 그러나, 게놈 편집을 목적으로, 복구 템플릿은 종종 외인성 핵산, 예컨대 플라스미드, 이중나선 올리고뉴클레오티드, 단일 가닥 올리고뉴클레오티드, 이중 가닥 올리고뉴클레오티드, 또는 바이러스 핵산으로서 공급된다. 외인성 공여자 템플릿의 경우, 부가의 또는 변경된 핵산 서열이 또한 표적 로커스에 혼입되도록 상동성의 플랭킹 영역 사이에 부가의 핵산 서열 (예컨대 트랜스진) 또는 변형 (예컨대 단일 또는 다중 염기 변화 또는 결실)을 도입하는 것이 통상적이다. MMEJ는 절단 부위에서 작은 결실 및 삽입이 발생할 수 있다는 점에서 NHEJ와 유사한 유전적 결과를 초래한다. MMEJ는 절단 부위를 플랭킹하는 몇 개의 염기쌍의 상동 서열을 사용하여, 선호되는 말단-연결 DNA 복구 결과를 구동시킨다. 일부 실시양태에서, 뉴클레아제 표적 영역에서의 잠재적인 마이크로상동성의 분석에 기반하여 가능한 복구 결과를 예측하는 것이 가능할 수 있다.
따라서 일부 경우에, 외인성 폴리뉴클레오티드 서열을 표적 핵산 절단 부위에 삽입하기 위해 상동 재조합이 사용된다. 외인성 폴리뉴클레오티드 서열은 본원에서 공여자 폴리뉴클레오티드 (또는 공여자 또는 공여자 서열 또는 폴리뉴클레오티드 공여자 템플릿)로 지칭된다. 일부 실시양태에서, 공여자 폴리뉴클레오티드, 공여자 폴리뉴클레오티드의 일부분, 공여자 폴리뉴클레오티드의 카피, 또는 공여자 폴리뉴클레오티드의 카피의 일부분이 표적 핵산 절단 부위에 삽입된다. 일부 실시양태에서, 공여자 폴리뉴클레오티드는 외인성 폴리뉴클레오티드 서열, 즉 표적 핵산 절단 부위에서 자연적으로 발생하지 않는 서열이다.
이중 가닥 파손이 발생하는 세포의 핵 내부에 외인성 DNA 분자가 충분한 농도로 공급되는 경우, NHEJ 복구 프로세스 동안 외인성 DNA가 이중 가닥 파손부에 삽입될 수 있으므로 게놈에 영구적으로 부가될 수 있다. 이러한 외인성 DNA 분자는 일부 실시양태에서 공여자 템플릿으로서 지칭된다. 공여자 템플릿이 임의로 관련 조절 서열, 예컨대 프로모터, 인핸서, 폴리A 서열 및/또는 스플라이스 수용체 서열과 함께 본원에 기재된 하나 이상의 시스템 구성요소에 대한 코딩 서열을 함유하는 경우, 하나 이상의 시스템 구성요소는 게놈에 통합된 핵산으로부터 발현되어 세포의 수명 동안 영구적인 발현을 초래할 수 있다. 더욱이, 공여자 DNA 템플릿의 통합된 핵산은 세포가 분열할 때 딸 세포로 전달될 수 있다.
이중 가닥 파손부의 어느 한쪽 (상동성 아암으로서 지칭됨)에 DNA 서열과 상동성을 갖는 플랭킹 DNA 서열을 함유하는 충분한 농도의 공여자 DNA 템플릿이 있는 경우, 이러한 공여자 DNA 템플릿은 HDR 경로를 통해 통합될 수 있다. 상동성 아암은 공여자 템플릿과 이중 가닥 파손부의 어느 한쪽 서열 간의 상동 재조합을 위한 기질로서 작용한다. 이로 인해 이중 가닥 파손부의 어느 한쪽 서열이 비변형된 게놈 내의 것으로부터 변경되지 않는 공여자 템플릿의 오류 없는 삽입이 발생할 수 있다.
HDR에 의한 편집을 위해 공급되는 공여자는 매우 다양하지만 일반적으로 게놈 DNA에 어닐링을 허용하는 작거나 큰 플랭킹 상동성 아암이 있는 의도된 서열을 함유한다. 도입된 유전적 변화를 플랭킹하는 상동성 영역은 30 bp 이하이거나, 또는 프로모터, cDNA 등을 함유할 수 있는 멀티 킬로염기 카세트만큼 클 수 있다. 단일 가닥 및 이중 가닥 올리고뉴클레오티드 공여자 둘 다를 사용할 수 있다. 이러한 올리고뉴클레오티드의 크기는 100 nt 미만 내지 수 kb 초과의 범위이지만, 더 긴 ssDNA가 생성되어 사용될 수도 있다. PCR 앰플리콘, 플라스미드, 및 미니서클을 포함한 이중 가닥 공여자가 종종 사용된다. 일반적으로, 개별 공여자에 대한 패키징 제한이 <5 kb이긴 하지만, AAV 벡터는 공여자 템플릿을 전달하는 매우 효과적인 수단이라는 것이 밝혀졌다. 공여자의 활성 전사는 HDR을 3배 증가시켰는데, 이는 프로모터의 봉입이 전환을 증가시킬 수 있다는 것을 나타낸다. 반대로, 공여자의 CpG 메틸화는 유전자 발현과 HDR을 감소시킬 수 있다.
일부 실시양태에서, 공여자 DNA는 뉴클레아제와 함께 또는 독립적으로 다양한 상이한 방법, 예를 들어 형질감염, 나노입자, 마이크로-주사, 또는 바이러스 형질도입에 의해 공급될 수 있다. 일부 실시양태에서 HDR에 대한 공여자의 가용성을 증가시키기 위해 다양한 테더링 옵션이 사용될 수 있다. 그 예는 공여자를 뉴클레아제에 부착하는 것, 근처와 결합하는 DNA 결합 단백질에 부착하는 것, 또는 DNA 말단 결합 또는 복구에 관여하는 단백질에 부착하는 것을 포함한다.
NHEJ 또는 HDR에 의한 게놈 편집 외에도, NHEJ 경로와 HR 둘 다를 사용하는 부위-특이적 유전자 삽입을 시행할 수 있다. 가능하게는 인트론/엑손 경계를 포함한, 조합 접근 방식을 특정 설정에 적용할 수 있다. NHEJ는 인트론의 라이게이션에 유효한 것으로 입증될 수 있는 반면, 오류 없는 HDR은 코딩 영역에 더 적합할 수 있다.
벡터
또 다른 측면에서, 본원에는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체, gRNA, 및/또는 본 개시내용의 실시양태를 수행하는데 필요한 임의의 핵산 또는 단백질성 분자를 코딩하는 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 핵산이 제공된다. 일부 실시양태에서, 이러한 핵산은 벡터 (예를 들어, 재조합 발현 벡터)이다.
고려되는 발현 벡터는 백시니아 바이러스, 폴리오바이러스, 아데노바이러스, 아데노-연관 바이러스, SV40, 단순 포진 바이러스, 인간 면역결핍 바이러스, 레트로바이러스를 기반으로 하는 바이러스 벡터 (예를 들어, 뮤린 백혈병 바이러스, 비장 괴사 바이러스, 및 레트로바이러스, 에컨대 라우스 육종 바이러스, 하비 육종 바이러스, 조류 백혈병 바이러스, 렌티바이러스, 인간 면역결핍 바이러스, 골수증식성 육종 바이러스, 및 유방 종양 바이러스로부터 유래된 벡터) 및 기타 재조합 벡터를 포함하나 이에 제한되지는 않는다. 진핵 표적 세포에 대해 고려되는 다른 벡터는 벡터 pXT1, pSG5, pSVK3, pBPV, pMSG 및 pSVLSV40 [파마시아(Pharmacia)]을 포함하나 이에 제한되지는 않는다. 진핵 표적 세포에 대해 고려되는 부가의 벡터는 벡터 pCTx-1, pCTx-2 및 pCTx-3을 포함하나 이에 제한되지는 않는다. 숙주 세포와 양립가능한 한 다른 벡터가 또한 사용할 수 있다.
일부 실시양태에서, 벡터는 하나 이상의 전사 및/또는 번역 제어 요소를 갖는다. 활용되는 숙주/벡터 시스템에 따라, 구성적 및 유도성 프로모터, 전사 인핸서 요소, 전사 종결인자 등을 포함한 다수의 적합한 전사 및 번역 제어 요소 중 임의의 것이 발현 벡터에 사용될 수 있다. 일부 실시양태에서, 벡터는 바이러스 서열 또는 CRISPR 기구의 구성요소 또는 기타 요소를 불활성화시키는 자기 불활성화 벡터이다.
적합한 진핵 프로모터 (즉, 진핵 세포에서 기능적인 프로모터)의 비제한적인 예는 시토메갈로바이러스 (CMV) 즉시 초기, 단순 포진 바이러스 (HSV) 티미딘 키나제, 초기 및 후기 SV40으로부터의 프로모터, 레트로바이러스로부터의 긴 말단 반복부 (LTR), 인간 신장 인자-1 프로모터 (EF1), 닭 베타-액틴 프로모터 (CAG)와 융합된 시토메갈로바이러스 (CMV) 인핸서를 갖는 하이브리드 구축물, 뮤린 줄기 세포 바이러스 프로모터 (MSCV), 포스포글리세레이트 키나제-1 로커스 프로모터 (PGK), 및 마우스 메탈로티오네인-I를 포함한다.
Cas 엔도뉴클레아제와 연계해서 사용되는 가이드 RNA를 포함한 작은 RNA를 발현하기 위해, 예를 들어 U6 및 H1을 포함한 다양한 프로모터, 예컨대 RNA 폴리머라제 III 프로모터가 유리할 수 있다. 이러한 프로모터의 사용을 향상시키기 위한 설명 및 파라미터는 관련 기술분야에 공지되어 있으며, 부가의 정보 및 접근 방식이 정기적으로 보고되고 있으며; 예를 들어, 문헌 [Ma, H. et al., Molecular Therapy - Nucleic Acids 3, e161 (2014) doi:10.1038/mtna.2014.12]을 참조한다.
발현 벡터는 또한 번역 개시를 위한 리보솜 결합 부위 및 전사 종결인자를 함유할 수 있다. 발현 벡터는 또한 발현 증폭을 위한 적절한 서열을 포함할 수 있다. 발현 벡터는 또한 부위-특이적 폴리펩티드와 융합되어 융합 단백질을 생성하는 비-천연 태그 (예를 들어, 히스티딘 태그, 헤마글루티닌 태그, 녹색 형광 단백질 등)를 코딩하는 뉴클레오티드 서열을 포함할 수 있다.
일부 실시양태에서, 프로모터는 유도성 프로모터 (예를 들어, 열 충격 프로모터, 테트라시클린-조절된 프로모터, 스테로이드-조절된 프로모터, 금속-조절된 프로모터, 에스트로겐 수용체-조절된 프로모터 등)이다. 일부 실시양태에서, 프로모터는 구성적 프로모터 (예를 들어, CMV 프로모터, UBC 프로모터)이다. 일부 실시양태에서, 프로모터는 공간적으로 제한된 및/또는 시간적으로 제한된 프로모터 (예를 들어, 조직 특이적 프로모터, 세포 유형 특이적 프로모터 등)이다. 일부 실시양태에서, 유전자가 게놈에 삽입된 후 게놈에 존재하는 내인성 프로모터 하에서 발현될 예정이라면, 벡터는 숙주 세포에서 발현될 적어도 하나의 유전자에 대한 프로모터를 갖지 않는다.
핵산 및 폴리펩티드의 변형
일부 실시양태에서, 본원에 기재된 폴리뉴클레오티드는, 예를 들어, 활성, 안정성 또는 특이성을 향상시키거나, 전달을 변경시키거나, 숙주 세포에서의 선천성 면역 반응을 감소시키거나, 단백질 크기를 추가로 감소시키거나, 또는 본원에 추가로 기재되고 관련 기술분야에 공지된 바와 같은 기타 향상을 위해 사용될 수 있는 하나 이상의 변형을 포함한다. 일부 실시양태에서, 이러한 변형은 서열식별번호: 2의 서열과 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 99% 또는 100%의 아미노산 서열 동일성을 갖는 아미노산 서열을 포함하는 B-GEn.1 또는 B-GEn.2 폴리펩티드를 초래할 것이다.
코돈-최적화
특정 실시양태에서, 변형된 폴리뉴클레오티드는 본원에 기재된 CRISPR-B-GEn.1 또는 B-GEn.2 시스템에서 사용되며, 여기서 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 폴리뉴클레오티드 서열을 포함하는 DNA 또는 RNA는 하기에 기재되고 예시된 바와 같이 변형될 수 있다. 이러한 변형된 폴리뉴클레오티드는 임의의 하나 이상의 게놈 로커스를 편집하기 위해 CRISPR-B-GEn.1 또는 B-GEn.2 시스템에서 사용될 수 있다. 일부 실시양태에서, 본 개시내용의 폴리뉴클레오티드에서의 이러한 변형은 코돈-최적화를 통해 달성되며, 예를 들어 코딩된 폴리펩티드가 발현되는 특이적 숙주 세포를 기반으로 하여 코돈-최적화된다. 통상의 기술자는 본 개시내용의 임의의 뉴클레오티드 서열 및/또는 재조합 핵산이 임의의 관심 종에서의 발현을 위해 코돈 최적화될 수 있음을 인지할 것이다. 코돈 최적화는 관련 기술분야에 널리 공지되어 있으며 종 특이적 코돈 사용빈도 표를 사용하여 코돈 사용빈도 편향에 대한 뉴클레오티드 서열의 변형을 수반한다. 코돈 사용빈도 표는 관심 종에 대해 가장 많이 발현되는 유전자의 서열 분석을 기반으로 하여 생성된다. 비제한적인 예에서, 뉴클레오티드 서열이 핵에서 발현되어야 하는 경우, 관심 종에 대한 고도로 발현된 핵 유전자의 서열 분석을 기반으로 하여 코돈 사용빈도 표가 생성된다. 뉴클레오티드 서열의 변형은 종 특이적 코돈 사용빈도 표를 천연 폴리뉴클레오티드 서열에 존재하는 코돈과 비교함으로써 결정된다.
일부 실시양태에서, 본원에 기재된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 코돈-최적화된 폴리뉴클레오티드 서열로부터 발현된다. 예를 들어, 의도된 표적 세포가 인간 세포인 경우, B-GEn.1 또는 B-GEn.2 (또는 B-GEn.1 또는 B-GEn.2 변이체, 예를 들어, 효소적으로 불활성인 변이체)를 코딩하는 인간 코돈-최적화된 폴리뉴클레오티드 서열이 적합할 것이다. 또 다른 비제한적인 예로서, 의도된 숙주 세포가 마우스 세포인 경우, B-GEn.1 또는 B-GEn.2 (또는 B-GEn.1 또는 B-GEn.2 변이체, 예를 들어, 효소적으로 불활성인 변이체)를 코딩하는 마우스 코돈-최적화된 폴리뉴클레오티드 서열이 적합할 것이다.
코돈 최적화를 위한 전략 및 방법론은 관련 기술분야에 공지되어 있으며 효모 (문헌 [Outchkourov et al., Protein Expr Purif, 24(1):18-24 (2002)]) 및 이. 콜라이(E. coli) (문헌 [Feng et al., Biochemistry, 39(50):15399-15409 (2000)])을 포함하나 이에 제한되지는 않는 다양한 시스템에 대해 기재되었다. 일부 실시양태에서, 코돈 최적화는 GeneGPS® 발현 최적화 기술 (ATUM)을 사용하고 제조업체가 권장하는 발현 최적화 알고리즘을 사용하여 수행되었다. 일부 실시양태에서, 본 개시내용의 폴리뉴클레오티드는 인간 세포에서의 발현 증가를 위해 코돈-최적화된다. 일부 실시양태에서, 본 개시내용의 폴리뉴클레오티드는 이. 콜라이 세포에서의 발현 증가를 위해 코돈-최적화된다. 일부 실시양태에서, 본 개시내용의 폴리뉴클레오티드는 곤충 세포에서의 발현 증가를 위해 코돈-최적화된다. 일부 실시양태에서, 본 개시내용의 폴리뉴클레오티드는 Sf9 곤충 세포에서의 발현 증가를 위해 코돈-최적화된다. 일부 실시양태에서, 코돈 최적화 절차에 사용되는 발현 최적화 알고리즘은 추정 폴리-A 신호 (예를 들어, AATAAA 및 ATTAAA) 뿐만 아니라 폴리머라제 미끄러짐을 초래할 수 있는 A의 긴 (4개 초과) 연장물을 피하도록 규정된다.
관련 기술분야에서 널리 이해되는 바와 같이, 뉴클레오티드 서열의 코돈 최적화를 통해 천연 뉴클레오티드 서열과 100% 미만 (예를 들어, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 미만)의 동일성을 갖지만 여전히 원래의 천연 뉴클레오티드 서열에 의해 코딩된 것과 동일한 기능을 갖는 폴리펩티드를 코딩하는 뉴클레오티드 서열을 생성할 수 있다. 따라서, 본 개시내용의 대표적인 실시양태에서, 본 개시내용의 뉴클레오티드 서열 및/또는 재조합 핵산은 특정한 관심 종에서의 발현을 위해 코돈 최적화될 수 있다.
일부 실시양태에서, 코돈-최적화된 폴리뉴클레오티드 서열은 서열식별번호: 1과 적어도 90%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.2%, 99.5%, 99.8%, 99.9%, 또는 100%의 서열 동일성을 갖는다. 일부 실시양태에서, 본 개시내용의 폴리뉴클레오티드는 표적 세포에서의 코딩된 B-GEn.1 또는 B-GEn.2 폴리펩티드의 발현 증가를 위해 코돈-최적화된다. 일부 실시양태에서, 본 개시내용의 폴리뉴클레오티드는 인간 세포에서의 발현 증가를 위해 코돈-최적화된다. 일반적으로, 본 개시내용의 폴리뉴클레오티드는 임의의 인간 세포에서의 발현 증가를 위해 코돈-최적화된다. 일부 실시양태에서, 본 개시내용의 폴리뉴클레오티드는 이. 콜라이 세포에서의 발현 증가를 위해 코돈-최적화된다. 일부 실시양태에서, 본 개시내용의 폴리뉴클레오티드는 곤충 세포에서의 발현 증가를 위해 코돈-최적화된다. 일반적으로, 본 개시내용의 폴리뉴클레오티드는 임의의 곤충 세포에서의 발현 증가를 위해 코돈-최적화된다. 일부 실시양태에서, 본 개시내용의 폴리뉴클레오티드는 Sf9 곤충 세포 발현 시스템에서의 발현 증가를 위해 코돈-최적화된다.
의도된 숙주에서의 발현을 최적화하기 위해 폴리아데닐화 신호를 선택할 수도 있다.
기타 변형
변형은 또한 또는 대안적으로, 세포 내로 도입된 RNA가 선천성 면역 반응을 유도하는 가능성 또는 정도를 감소시키기 위해 사용될 수 있다. 하기 및 관련 기술분야에 기재된 바와 같이 소형 간섭 RNA (siRNA)를 포함한 RNA 간섭 (RNAi)의 맥락에서 널리 특징규명되어 있는 이러한 반응은, RNA의 반감기 감소 및/또는 시토카인 또는 면역 반응과 연관된 기타 요인의 유도와 연관되는 경향이 있다.
RNA의 안정성을 향상시키는 변형 (예컨대, 세포에 존재하는 RNase에 의한 분해를 감소시킴으로써), 그 결과로 생성된 산물 (예를 들어, 엔도뉴클레아제)의 번역을 향상시키는 변형, 및/또는 세포 내로 도입된 RNA가 선천성 면역 반응을 유도하는 가능성 또는 정도를 감소시키는 변형을 포함하나 이에 제한되지 않는 하나 이상의 유형의 변형이 또한, 세포 내로 도입되는 엔도뉴클레아제, 예컨대 B-GEn.1 또는 B-GEn.2를 코딩하는 RNA에 대해 이루어질 수 있다. 전술한 것과 다른 것의 변형의 조합이 마찬가지로 사용될 수 있다. 예를 들어 CRISPR-B-GEn.1 또는 B-GEn.2의 경우, 하나 이상의 유형의 변형이 가이드 RNA에 대해 이루어질 수 있고/거나 (상기 예시된 것 포함) 하나 이상의 유형의 변형이 B-GEn.1 또는 B-GEn.2 엔도뉴클레아제를 코딩하는 RNA에 대해 이루어질 수 있다 (상기 예시된 것 포함).
예시를 통해, CRISPR-B-GEn.1 또는 B-GEn.2 시스템에 사용되는 가이드 RNA 또는 기타 더 작은 RNA는 하기 예시되고 관련 기술분야에 기재된 바와 같이, 화학적 수단에 의해 쉽게 합성될 수 있으므로 수많은 변형이 쉽게 혼입될 수 있게 한다. 화학적 합성 절차가 지속적으로 확장되고 있긴 하지만, 고성능 액체 크로마토그래피 (PAGE와 같은 겔의 사용을 피하는 HPLC)와 같은 절차를 통해 이러한 RNA를 정제하는 것은, 폴리뉴클레오티드 길이가 100개 정도의 뉴클레오티드를 훨씬 초과하여 증가함에 따라 더욱 어려워지는 경향이 있다. 더 긴 길이의 화학적으로 변형된 RNA를 생성하는데 사용되는 한가지 접근 방식은, 함께 라이게이션되는 2개 이상의 분자를 생산하는 것이다. 훨씬 더 긴 RNA, 예컨대 B-GEn.1 또는 B-GEn.2 엔도뉴클레아제를 코딩하는 것은 효소적으로 더 쉽게 생성된다. 일반적으로 효소에 의해 생산된 RNA에 사용하기 위해 이용될 수 있는 변형 유형은 더 적지만, 예를 들어 안정성을 향상시키고/거나, 선천성 면역 반응의 가능성 또는 정도를 감소시키고/거나, 하기 및 관련 기술분야에 추가로 기재되는 바와 같은 다른 속성을 향상시키는데 사용될 수 있는 변형이 여전히 존재하며; 새로운 유형의 변형이 정기적으로 개발되고 있다. 다양한 유형의 변형, 특히 더 작은 화학적으로 합성된 RNA와 함께 자주 사용되는 변형의 예시로써, 변형은 당의 2' 위치에서 변형된 하나 이상의 뉴클레오티드, 일부 실시양태에서는 2'-O-알킬, 2'-O-알킬-O-알킬 또는 2'-플루오로-변형된 뉴클레오티드를 포함할 수 있다. 일부 실시양태에서, RNA 변형은 RNA의 3' 단부에 피리미딘의 리보스, 염기성 잔기 또는 역 염기 상의 2'-플루오로, 2'-아미노 및 2' O-메틸 변형을 포함한다. 이러한 변형은 일상적으로 올리고뉴클레오티드에 혼입되며, 이들 올리고뉴클레오티드는 주어진 표적에 대항한 2'-데옥시 올리고뉴클레오티드보다 더 높은 Tm (예를 들어, 더 높은 표적 결합 친화도)을 갖는 것으로 나타났다.
다수의 뉴클레오티드 및 뉴클레오시드 변형은 이들이 혼입되는 올리고뉴클레오티드가 천연 올리고뉴클레오티드보다 뉴클레아제 소화에 대해 더 저항성이 되도록 하는 것으로 나타났으며; 이러한 변형된 올리고뉴클레오티드는 비변형된 올리고뉴클레오티드보다 더 오랫동안 무손상으로 생존한다. 변형된 올리고뉴클레오티드의 구체적 예는 변형된 백본, 예를 들어 포스포로티오에이트, 포스포트리에스테르, 메틸 포스포네이트, 단쇄 알킬 또는 시클로알킬 당간 연결 또는 단쇄 헤테로원자 또는 헤테로시클릭 당간 연결을 포함하는 것을 포함한다. 일부 올리고뉴클레오티드는 포스포로티오에이트 백본을 갖는 올리고뉴클레오티드 및 헤테로원자 백본, 특히 CH2-NH-O-CH2, CH, -N(CH3)-O-CH2 (메틸렌(메틸이미노) 또는 MMI 백본으로서 공지됨), CH2-O-N(CH3)-CH2, CH2-N(CH3)-N(CH3)-CH2 및 O-N(CH3)-CH2-CH2 백본; 아미드 백본 (문헌 [De Mesmaeker et al., Ace. Chem. Res., 28:366-374 (1995)] 참조); 모르폴리노 백본 구조 (미국 특허 번호 5,034,506 (Summerton and Weller) 참조); 펩티드 핵산 (PNA) 백본 (여기서 올리고뉴클레오티드의 포스포디에스테르 백본은 폴리아미드 백본으로 대체되고, 뉴클레오티드는 폴리아미드 백본의 아자 질소 원자와 직접적으로 또는 간접적으로 결합됨; 문헌 [Nielsen et al., Science 1991, 254, 1497] 참조)을 갖는 올리고뉴클레오티드이다. 인-함유 연결은 포스포로티오에이트, 키랄 포스포로티오에이트, 포스포로디티오에이트, 포스포트리에스테르, 아미노알킬포스포트리에스테르, 3' 알킬렌 포스포네이트 및 키랄 포스포네이트를 포함한 메틸 및 기타 알킬 포스포네이트, 포스피네이트, 3'-아미노 포스포르아미데이트 및 아미노알킬포스포르아미데이트를 포함한 포스포르아미데이트, 티오노포스포르아미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트리에스테르, 및 정상적인 3'-5' 연결을 갖는 보라노포스페이트, 이들의 2'-5' 연결된 유사체, 및 뉴클레오시드 단위의 인접한 쌍이 3'-5'에서 5'-3'로 연결되거나 또는 2'-5'에서 5'-2'로 연결되는 반전된 극성을 갖는 것을 포함하나 이에 제한되지는 않으며; 미국 특허 번호 3,687,808; 4,469,863; 4,476,301; 5,023,243; 5,177,196; 5,188,897; 5,264,423; 5,276,019; 5,278,302; 5,286,717; 5,321,131; 5,399,676; 5,405,939; 5,453,496; 5,455,233; 5,466,677; 5,476,925; 5,519,126; 5,536,821; 5,541,306; 5,550,111; 5,563,253; 5,571,799; 5,587,361; 및 5,625,050을 참조한다.
모르폴리노-기반 올리고머 화합물은 문헌 [Braasch and Corey, Biochemistry, 41(14): 4503-4510 (2002); Genesis, Volume 30, Issue 3, (2001); Heasman, Dev. Biol., 243:209-214 (2002); Nasevicius et al., Nat. Genet., 26:216-220 (2000); Lacenra etc., Proc. Natl. Acad. Sci., 97: 9591-9596 (2000)]; 및 1991년 7월 23일에 허여된 미국 특허 번호 5,034,506에 기재되어 있다. 시클로헥세닐 핵산 올리고뉴클레오티드 모방체는 문헌 [Wang et al., J. Am. Chem. Soc., 122: 8595-8602 (2000)]에 기재되어 있다.
그 안에 인 원자를 포함하지 않는 변형된 올리고뉴클레오티드 백본은 단쇄 알킬 또는 시클로알킬 뉴클레오시드간 연결, 혼합 헤테로원자 및 알킬 또는 시클로알킬 뉴클레오시드간 연결, 또는 하나 이상의 단쇄 헤테로원자 또는 헤테로시클릭 뉴클레오시드간 연결에 의해 형성되는 백본을 갖는다. 이들은 모르폴리노 연결 (부분적으로 뉴클레오시드의 당 부분으로부터 형성됨); 실록산 백본; 술피드, 술폭시드 및 술폰 백본; 포름아세틸 및 티오포름아세틸 백본; 메틸렌 포름아세틸 및 티오포름아세틸 백본; 알켄 함유 백본; 술파메이트 백본; 메틸렌이미노 및 메틸렌히드라지노 백본; 술포네이트 및 술폰아미드 백본; 아미드 백본; 및 혼합된 N, O, S 및 CH2 구성요소 일부를 갖는 기타를 갖는 것을 포함하며; 미국 특허 번호 5,034,506; 5,166,315; 5,185,444; 5,214,134; 5,216,141; 5,235,033; 5,264,562; 5,264,564; 5,405,938; 5,434,257; 5,466,677; 5,470,967; 5,489,677; 5,541,307; 5,561,225; 5,596,086; 5,602,240; 5,610,289; 5,602,240; 5,608,046; 5,610,289; 5,618,704; 5,623,070; 5,663,312; 5,633,360; 5,677,437; 및 5,677,439 (이들 각각은 본원에 참조로 포함됨)를 참조한다.
하나 이상의 치환된 당 모이어티가 또한 포함될 수 있으며, 예를 들어 2' 위치에 하기 중 하나를 포함한다: OH, SH, SCH3, F, OCN, OCH3, OCH3 O(CH2)n CH3, O(CH2)n NH2 또는 O(CH2)n CH3 (여기서 n은 1 내지 10임); C1 내지 C10 저급 알킬, 알콕시알콕시, 치환된 저급 알킬, 알카릴 또는 아르알킬; Cl; Br; CN; CF3; OCF3; O-, S-, 또는 N-알킬; O-, S- 또는 N-알케닐: SOCH3; SO2CH3; ONO2; NO2; N3; NH2; 헤테로시클로알킬; 헤테로시클로알카릴; 아미노알킬아미노; 폴리알킬아미노; 치환된 실릴; RNA 절단 기; 리포터 기; 인터칼레이터; 올리고뉴클레오티드의 약동학적 특성을 개선시키기 위한 기; 또는 올리고뉴클레오티드 및 유사한 특성을 갖는 다른 치환기의 약력학적 특성을 개선시키기 위한 군. 일부 실시양태에서, 변형은 2'-메톡시에톡시 (2'-O-(2-메톡시에틸)로서 공지되기도 한 2'-O-CH2CH2OCH3)를 포함한다 (Martin et al., Helv. Chim. Acta, 1995, 78, 486). 다른 변형은 2'-메톡시 (2'-O-CH3), 2'-프로폭시 (2'-OCH2CH2CH3) 및 2'-플루오로 (2'-F)를 포함한다. 유사한 변형이 또한 올리고뉴클레오티드 상의 다른 위치, 특히 3' 말단 뉴클레오티드 상의 당의 3' 위치 및 5' 말단 뉴클레오티드의 5' 위치에서 이루어질 수 있다. 올리고뉴클레오티드는 또한 펜토푸라노실 기 대신에 시클로부틸과 같은 당 모방체를 가질 수 있다. 일부 실시양태에서, 뉴클레오티드 단위의 당 및 뉴클레오시드간 연결, 예를 들어 백본은 모두 신규 기로 대체된다. 염기 단위는 적절한 핵산 표적 화합물과의 혼성화를 위해 유지된다. 우수한 혼성화 특성을 갖는 것으로 밝혀진 올리고뉴클레오티드 모방체인 이러한 올리고머 화합물 중 하나가 펩티드 핵산 (PNA)으로서 지칭된다. PNA 화합물에서, 올리고뉴클레오티드의 당-백본은 아미드 함유 백본, 예를 들어 아미노에틸글리신 백본으로 대체된다. 핵염기는 유지되며 백본의 아미드 부분의 아자 질소 원자와 직접적으로 또는 간접적으로 결합한다. PNA 화합물의 제조를 교시하는 대표적인 미국 특허는 미국 특허 번호 5,539,082; 5,714,331; 및 5,719,262를 포함하나 이에 제한되지는 않는다. PNA 화합물에 대한 추가의 교시는 문헌 [Nielsen et al., Science, 254: 1497-1500 (1991)]에서 찾을 수 있다.
가이드 RNA는 또한 부가적으로 또는 대안적으로, 핵염기 (종종 관련 기술분야에서 간단히 "염기"로서 지칭됨) 변형 또는 치환을 포함할 수 있다. 본원에 사용된 바와 같은 "비변형된" 또는 "자연" 핵염기는 아데닌 (A), 구아닌 (G), 티민 (T), 시토신 (C) 및 우라실 (U)을 포함한다. 변형된 핵염기는 자연 핵산, 예를 들어, 히포크산틴, 6-메틸아데닌, 5-Me 피리미딘, 특히 5-메틸시토신 (5-메틸-2' 데옥시시토신으로서 지칭되기도 하며, 종종 관련 기술분야에서 5-Me-C로서 지칭됨), 5-히드록시메틸시토신 (HMC), 글리코실 HMC 및 젠토비오실 HMC 뿐만 아니라 합성 핵염기, 예를 들어 2-아미노아데닌, 2-(메틸아미노)아데닌, 2-(이미다졸릴알킬)아데닌, 2-(아미노알킬아미노)아데닌 또는 기타 헤테로치환된 알킬아데닌, 2-티오우라실, 2-티오티민, 5-브로모우라실, 5-히드록시메틸우라실, 8-아자구아닌, 7-데아자구아닌, N6 (6-아미노헥실)아데닌 및 2,6-디아미노퓨린에서 단지 드물게 또는 일시적으로 발견되는 핵염기를 포함한다 (Kornberg, A, DNA Replication, W. H. Freeman & Co., San Francisco, pp75-77 (1980); Gebeyehu et al., Nucl. Acids Res. 15:4513 (1997)). 관련 기술분야에 공지된 "범용" 염기, 예를 들어 이노신이 또한 포함될 수 있다. 5-Me-C 치환은 핵산 이중나선 안정성을 0.6-1.2℃만큼 증가시키는 것으로 나타났으며 (문헌 [Sanghvi, Y. S., in Crooke, S. T. and Lebleu, B., eds., Antisense Research and Applications, CRC Press, Boca Raton, 1993, pp. 276-278]), 이는 염기 치환의 실시양태이다.
변형된 핵염기는 기타 합성 및 자연 핵염기, 예컨대 5-메틸시토신 (5-me-C), 5-히드록시메틸 시토신, 크산틴, 히포크산틴, 2-아미노아데닌, 아데닌 및 구아닌의 6-메틸 및 기타 알킬 유도체, 아데닌 및 구아닌의 2-프로필 및 기타 알킬 유도체, 2-티오우라실, 2-티오티민 및 2-티오시토신, 5-할로우라실 및 시토신, 5-프로피닐 우라실 및 시토신, 6-아조 우라실, 시토신 및 티민, 5-우라실 (슈도-우라실), 4-티오우라실, 8-할로, 8-아미노, 8-티올, 8-티오알킬, 8-히드록실 및 기타 a-치환된 아데닌 및 구아닌, 5-할로, 특히 5-브로모, 5-트리플루오로메틸 및 기타 5-치환된 우라실 및 시토신, 7-메틸쿠아닌 및 7-메틸아데닌, 8-아자구아닌 및 8-아자아데닌, 7-데아자구아닌 및 7-데아자아데닌 및 3-데아자구아닌 및 3-데아자아데닌을 포함한다.
다른 유용한 핵염기는 미국 특허 번호 3,687,808에 개시된 것, 문헌 ["The Concise Encyclopedia of Polymer Science And Engineering", pages 858-859, Kroschwitz, J.l., ed. John Wiley & Sons, 1990]에 개시된 것, 문헌 [Englisch et al., Angewandte Chemie, International Edition, 1991, 30, page 613]에 개시된 것, 및 문헌 [Sanghvi, Y. S., Chapter 15, Antisense Research and Applications, pages 289-302, Crooke, S.T. and Lebleu, B. ea., CRC Press, 1993]에 개시된 것을 포함한다. 이들 핵염기 중 특정한 것은 본 개시내용의 올리고머 화합물의 결합 친화도를 증가시키는데 특히 유용하다. 이들은 5-치환된 피리미딘, 6-아자피리미딘; 및 2-아미노프로필아데닌, 5-프로피닐우라실 및 5-프로피닐시토신을 포함한 N-2, N-6 및 -O-6 치환된 퓨린을 포함한다. 5-메틸시토신 치환은 핵산 이중나선 안정성을 0.6-1.2℃만큼 증가시키는 것으로 나타났으며 (문헌 [Sanghvi, Y.S., Crooke, S.T. and Lebleu, B., eds, "Antisense Research and Applications", CRC Press, Boca Raton, 1993, pp. 276-278]), 이는 더욱 특히 2'-O-메톡시에틸 당 변형과 조합될 때 염기 치환의 실시양태이다. 변형된 핵염기는 미국 특허 번호 3,687,808 뿐만 아니라 4,845,205; 5,130,302; 5,134,066; 5,175,273; 5,367,066; 5,432,272; 5,457,187; 5,459,255; 5,484,908; 5,502,177; 5,525,711; 5,552,540; 5,587,469; 5,596,091; 5,614,617; 5,681,941; 5,750,692; 5,763,588; 5,830,653; 6,005,096; 및 미국 특허 출원 공보 20030158403에 기재되어 있다.
주어진 올리고뉴클레오티드 내의 모든 위치가 균일하게 변형될 필요는 없으며, 실제로 전술한 변형 중 하나 초과가 단일 올리고뉴클레오티드에 또는 심지어 올리고뉴클레오티드 내의 단일 뉴클레오시드 내에 혼입될 수 있다.
일부 실시양태에서, 가이드 RNA 및/또는 본 개시내용의 엔도뉴클레아제, 예컨대 B-GEn.1 또는 B-GEn.2를 코딩하는 mRNA는 현재 캡핑 방법, 예컨대 mCAP, ARCA 또는 효소적 캡핑 방법 중 어느 하나를 사용하여 캡핑되어 생물학적 활성을 유지하고 자기/비-자기 세포내 반응을 피하는 생육가능한 mRNA 구축물을 생성한다. 일부 실시양태에서, 가이드 RNA 및/또는 본 개시내용의 엔도뉴클레아제, 예컨대 B-GEn.1 또는 B-GEn.2를 코딩하는 mRNA는 클린캡(CleanCap™) [트리링크(TriLink)] 공동 전사 캡핑 방법을 사용함으로써 캡핑된다.
일부 실시양태에서, 가이드 RNA 및/또는 본 개시내용의 엔도뉴클레아제를 코딩하는 mRNA는 슈도우리딘, N1-메틸슈도우리딘 및 5-메톡시우리딘으로 이루어진 군으로부터 선택된 하나 이상의 변형을 포함한다. 일부 실시양태에서, 하나 이상의 N1-메틸슈도우리딘은 동물 세포, 예컨대 포유동물 세포 (예를 들어, 인간 및 마우스)에서 향상된 RNA 안정성 및/또는 단백질 발현 및 감소된 면역원성을 제공하기 위해 가이드 RNA 및/또는 본 개시내용의 엔도뉴클레아제를 코딩하는 mRNA에 혼입된다. 일부 실시양태에서, N1-메틸슈도우리딘 변형은 하나 이상의 5-메틸시티딘과 조합하여 혼입된다.
일부 실시양태에서, 가이드 RNA 및/또는 엔도뉴클레아제, 예컨대 B-GEn.1 또는 B-GEn.2를 코딩하는 mRNA (또는 DNA)는 올리고뉴클레오티드의 활성, 세포 분포, 또는 세포 흡수를 향상시키는 하나 이상의 모이어티 또는 접합체에 화학적으로 연결된다. 이러한 모이어티는 지질 모이어티, 예컨대 콜레스테롤 모이어티 [문헌 (Letsinger et al., Proc. Natl. Acad. Sci. USA, 86: 6553-6556 (1989))]; 콜산 [문헌 (Manoharan et al., Bioorg. Med. Chem. Let., 4: 1053-1060 (1994))]; 티오에테르, 예를 들어 헥실-S-트리틸티올 [문헌 (Manoharan et al., Ann. N. Y Acad. Sci., 660: 306-309 (1992) 및 Manoharan et al., Bioorg. Med. Chem. Let., 3: 2765-2770 (1993))]; 티오콜레스테롤 [문헌 (Oberhauser et al., Nucl. Acids Res., 20: 533-538 (1992))]; 지방족 쇄, 예를 들어 도데칸디올 또는 운데실 잔기 [문헌 (Kabanov et al., FEBS Lett., 259: 327-330 (1990) 및 Svinarchuk et al., Biochimie, 75: 49-54 (1993))]; 인지질, 예를 들어 디-헥사데실-rac-글리세롤 또는 트리에틸암모늄 1,2-디-O-헥사데실-rac-글리세로-3-H-포스포네이트 [문헌 (Manoharan et al., Tetrahedron Lett., 36:3651-3654 (1995) 및 Shea et al., Nucl. Acids Res., 18: 3777-3783 (1990))]; 폴리아민 또는 폴리에틸렌 글리콜 쇄 [문헌 (Mancharan et al., Nucleosides & Nucleotides, 14: 969-973 (1995))]; 아다만탄 아세트산 [문헌 (Manoharan et al., Tetrahedron Lett., 36: 3651-3654 (1995))]; 팔미틸 모이어티 [문헌 (Mishra et al., Biochim. Biophys. Acta, 1264: 229-237 (1995))]; 또는 옥타데실아민 또는 헥실아미노-카르보닐-t 옥시콜레스테롤 모이어티 [문헌 (Crooke et al., J. Pharmacol. Exp. Ther., 277: 923-937 (1996))]를 포함하나 이에 제한되지는 않는다. 또한 미국 특허 번호 4,828,979; 4,948,882; 5,218,105; 5,525,465; 5,541,313; 5,545,730; 5,552,538; 5,578,717, 5,580,731; 5,580,731; 5,591,584; 5,109,124; 5,118,802; 5,138,045; 5,414,077; 5,486,603; 5,512,439; 5,578,718; 5,608,046; 4,587,044; 4,605,735; 4,667,025; 4,762,779; 4,789,737; 4,824,941; 4,835,263; 4,876,335; 4,904,582; 4,958,013; 5,082,830; 5,112,963; 5,214,136; 5,082,830; 5,112,963; 5,214,136; 5,245,022; 5,254,469; 5,258,506; 5,262,536; 5,272,250; 5,292,873; 5,317,098; 5,371,241, 5,391,723; 5,416,203, 5,451,463; 5,510,475; 5,512,667; 5,514,785; 5,565,552; 5,567,810; 5,574,142; 5,585,481; 5,587,371; 5,595,726; 5,597,696; 5,599,923; 5,599,928 및 5,688,941을 참조한다.
당 및 기타 모이어티는 뉴클레오티드를 포함한 단백질 및 복합체, 예컨대 양이온성 폴리솜 및 리포솜을 특정한 부위로 표적화하는데 사용될 수 있다. 예를 들어, 간세포 지시된 전달은 아시알로당단백질 수용체 (ASGPR)를 통해 매개될 수 있으며; 예를 들어, 문헌 [Hu, et al., Protein Pept Lett. 21(1 0):1025-30 (2014)]을 참조한다. 관련 기술분야에 공지되어 있고 정기적으로 개발되는 다른 시스템을 사용하여 본 경우에 사용되는 생체분자 및/또는 그의 복합체를 특정한 관심 표적 세포에 표적화할 수 있다.
이들 표적화 모이어티 또는 접합체는 작용기, 예컨대 1차 또는 2차 히드록실기와 공유 결합된 접합기를 포함할 수 있다. 적합한 접합기는 인터칼레이터, 리포터 분자, 폴리아민, 폴리아미드, 폴리에틸렌 글리콜, 폴리에테르, 올리고머의 약력학적 특성을 향상시키는 기, 및 올리고머의 약동학적 특성을 향상시키는 기를 포함한다. 전형적인 접합기는 콜레스테롤, 지질, 인지질, 비오틴, 페나진, 폴레이트, 페난트리딘, 안트라퀴논, 아크리딘, 플루오레세인, 로다민, 쿠마린 및 염료를 포함한다. 약력학적 특성을 향상시킬 수 있는 기는 흡수를 개선시키고/거나, 분해에 대한 저항성을 향상시키고/거나 표적 핵산과의 서열-특이적 혼성화를 강화시키는 기를 포함한다. 약동학적 특성을 향상시킬 수 있는 기는 본 개시내용의 화합물의 흡수, 분포, 대사 또는 배설을 개선시키는 기를 포함한다. 대표적인 접합기는 국제 특허 출원 번호 PCT/US92/09196 (1992년 10월 23일에 출원됨), 및 미국 특허 번호 6,287,860에 개시되어 있으며, 이들은 본원에 참조로 포함된다. 접합 모이어티는 지질 모이어티, 예컨대 콜레스테롤 모이어티, 콜산, 티오에테르, 예를 들어 헥실-5-트리틸티올, 티오콜레스테롤, 지방족 쇄, 예를 들어 도데칸디올 또는 운데실 잔기, 인지질, 예를 들어 디-헥사데실-rac-글리세롤 또는 트리에틸암모늄 1,2-디-O-헥사데실-rac-글리세로-3-H 포스포네이트, 폴리아민 또는 폴리에틸렌 글리콜 쇄, 또는 아다만탄 아세트산, 팔미틸 모이어티, 또는 옥타데실아민 또는 헥실아미노-카르보닐-옥시 콜레스테롤 모이어티를 포함하나 이에 제한되지는 않는다. 예를 들어, 미국 특허 번호 4,828,979; 4,948,882; 5,218,105; 5,525,465; 5,541,313; 5,545,730; 5,552,538; 5,578,717, 5,580,731; 5,580,731; 5,591,584; 5,109,124; 5,118,802; 5,138,045; 5,414,077; 5,486,603; 5,512,439; 5,578,718; 5,608,046; 4,587,044; 4,605,735; 4,667,025; 4,762,779; 4,789,737; 4,824,941; 4,835,263; 4,876,335; 4,904,582; 4,958,013; 5,082,830; 5,112,963; 5,214,136; 5,082,830; 5,112,963; 5,214,136; 5,245,022; 5,254,469; 5,258,506; 5,262,536; 5,272,250; 5,292,873; 5,317,098; 5,371,241, 5,391,723; 5,416,203, 5,451,463; 5,510,475; 5,512,667; 5,514,785; 5,565,552; 5,567,810; 5,574,142; 5,585,481; 5,587,371; 5,595,726; 5,597,696; 5,599,923; 5,599,928 및 5,688,941을 참조한다.
화학적 합성이 덜 용이하고 일반적으로 효소적 합성에 의해 생산되는 더 긴 폴리뉴클레오티드가 또한 다양한 수단에 의해 변형될 수 있다. 이러한 변형은, 예를 들어, 특정 뉴클레오티드 유사체의 도입, 분자의 5' 또는 3' 단부에 특정한 서열 또는 기타 모이어티의 혼입, 및 기타 변형을 포함할 수 있다. 예시로써, B-GEn.1 또는 B-GEn.2를 코딩하는 mRNA는 대략 4 kb 길이이고 시험관 내 전사에 의해 합성될 수 있다. mRNA에 대한 변형은, 예를 들어, 번역 또는 안정성을 증가시키거나 (예컨대, 세포를 사용한 분해에 대한 저항성을 증가시킴으로써), 또는 외인성 RNA, 특히 더 긴 RNA, 예컨대 B-GEn.1 또는 B-GEn.2를 코딩하는 것의 도입 후 세포에서 종종 관찰되는 선천성 면역 반응을 유도하는 RNA의 경향을 감소시키기 위해 적용될 수 있다.
이러한 수많은 변형, 예컨대 폴리A 꼬리, 5' 캡 유사체 (예를 들어, 안티 리버스 캡 아날로그 (ARCA) 또는 m7G(5')ppp(5')G(mCAP)), 변형된 5' 또는 3' 비번역된 영역 (UTR), 변형된 염기 (예컨대 슈도-UTP, 2-티오-UTP, 5-메틸시티딘-5'-트리포스페이트 (5-메틸-CTP) 또는 N6-메틸-ATP)의 사용, 또는 5' 말단 포스페이트를 제거하기 위한 포스파타제로의 처리가 관련 기술분야에 기재되어 있다. 이들 및 기타 변형은 관련 기술분야에 공지되어 있으며, RNA의 새로운 변형이 정기적으로 개발되고 있다.
예를 들어, 트리링크 바이오테크, 액솔랩스(Axolabs), 바이오-신테시스 인크.(Bio-Synthesis Inc.), 다마콘(Dharmacon) 등을 포함한, 변형된 RNA의 수많은 상업적 공급업체가 있다. 트리링크에 의해 기재된 바와 같이, 예를 들어 5-메틸-CTP는 바람직한 특징, 예컨대 뉴클레아제 안정성 증가, 번역 증가 또는 선천성 면역 수용체와 시험관 내 전사된 RNA의 상호작용 감소를 부여하는데 사용될 수 있다. 5'-메틸시티딘-5'-트리포스페이트 (5-메틸-CTP), N6-메틸-ATP 뿐만 아니라 슈도-UTP 및 2-티오-UTP는 또한, 하기 언급된 콘만(Konmann) 등 및 워렌(Warren) 등에 의한 간행물에 예시된 바와 같이 번역을 향상시키면서 배양 및 생체 내에서 선천성 면역 자극을 감소시키는 것으로 나타났다.
생체 내에서 전달된 화학적으로 변형된 mRNA를 사용하여 개선된 치료 효과를 달성할 수 있는 것으로 나타났으며; 예를 들어, 문헌 [Kormann et al., Nature Biotechnology 29, 154-157 (2011)]을 참조한다. 이러한 변형은, 예를 들어, RNA 분자의 안정성을 증가시키고/거나 그의 면역원성을 감소시키기 위해 사용될 수 있다. 화학적 변형, 에컨대 슈도-U, N6-메틸-A, 2-티오-U 및 5-메틸-C를 사용하여, 우리딘과 시티딘 잔기의 4분의 1만 각각 2-티오-U와 5-메틸-C로 치환하면, 마우스에서 mRNA의 톨-유사 수용체 (TLR) 매개된 인식이 크게 감소하는 것으로 밝혀졌다. 따라서 선천성 면역 체계의 활성화를 감소시킴으로써, 이러한 변형을 사용하여 생체 내에서 mRNA의 안정성과 수명을 효과적으로 증가시킬 수 있으며; 예를 들어, 상기 문헌 [Konmann et al.]을 참조한다.
또한 선천성 항바이러스 반응을 우회하도록 설계된 변형이 혼입된 합성 메신저 RNA를 반복적으로 투여하면 분화된 인간 세포를 만능성으로 재프로그램밍할 수 있는 것으로 나타났다. 예를 들어, 문헌 [Warren, et al., Cell Stem Cell, 7(5):618-30 (2010)]을 참조한다. 1차 재프로그래밍 단백질로서 작용하는 이러한 변형된 mRNA는 다수의 인간 세포 유형을 재프로그래밍하는 효율적인 수단이 될 수 있다. 이러한 세포는 유도 만능성 줄기 세포 (iPSC)로서 지칭되며, 5-메틸-CTP, 슈도-UTP 및 안티 리버스 캡 아날로그 (ARCA)를 혼입하는 효소적으로 합성된 RNA를 사용하여 세포의 항바이러스 반응을 효과적으로 회피할 수 있는 것으로 밝혀졌으며, 예를 들어, 상기 문헌 [Warren et al.]을 참조한다. 관련 기술분야에 기재된 폴리뉴클레오티드의 다른 변형은, 예를 들어 폴리A 꼬리의 사용, 5' 캡 유사체 (예컨대 m7G(5')ppp(5')G(mCAP))의 부가, 5' 또는 3' 비번역된 영역 (UTR)의 변형, 또는 5' 말단 포스페이트를 제거하기 위한 포스파타제로의 처리를 포함하며, 또한 새로운 접근 방식이 정기적으로 개발되고 있다.
본원에 사용하기 위한 변형된 RNA의 생성에 적용할 수 있는 다수의 조성물 및 기술이, 소형 간섭 RNA (siRNA)를 비롯한 RNA 간섭 (RNAi)의 변형과 연계해서 개발되었다. siRNA는 mRNA 간섭을 통한 유전자 침묵에 대한 효과가 일반적으로 일시적이어서 반복 투여를 필요로 할 수 있기 때문에 생체 내에서 특정한 문제를 제시한다. 또한, siRNA는 이중 가닥 RNA (dsRNA)이며 포유동물 세포는 종종 바이러스 감염의 부산물인 dsRNA를 검출하고 중화하도록 진화된 면역 반응을 갖는다. 따라서 dsRNA에 대한 세포성 반응을 매개할 수 있는 포유동물 효소, 예컨대 PKR (dsRNA 반응성 키나제) 및 잠재적으로 레티노산-유도성 유전자 I (RIG-I) 뿐만 아니라 그러한 분자에 반응하여 시토카인의 유도를 촉발시킬 수 있는 톨-유사 수용체 (예컨대 TLR3, TLR7 및 TLR8)가 있으며; 예를 들어, 문헌 [Angart et al., Pharmaceuticals (Basel) 6(4): 440-468 (2013); Kanasty et al., Molecular Therapy 20(3): 513-524 (2012); Burnett et al., Biotechnol J. 6(9):1130-46 (2011); Judge and Maclachlan, Hum Gene Ther 19(2):111-24 (2008); 및 이들 문헌에 인용된 참고문헌]에 의한 고찰을 참조한다.
RNA 안정성을 향상시키고/거나, 선천성 면역 반응을 감소시키고/거나, 본원에 기재된 바와 같이 인간 세포 내로 폴리뉴클레오티드를 도입하는 것과 연계해서 유용할 수 있는 다른 혜택을 달성하기 위해 매우 다양한 변형이 개발 및 적용되었으며; 예를 들어, 문헌 [Whitehead KA et al., Annual Review of Chemical and Biomolecular Engineering, 2:77-96 (2011); Gaglione and Messere, Mini Rev Med Chem, 10(7):578-95 (2010); Chernolovskaya et al., Curr Opin Mol Ther., 12(2):158-67 (2010); Deleavey et al., Curr Protoc Nucleic Acid Chem Chapter 16:Unit 16.3 (2009); Behlke, Oligonucleotides 18(4):305-19 (2008): Fucini et al., Nucleic Acid Ther 22(3): 205-210 (2012); Bremsen et al., Front Genet 3:154 (2012)]에 의한 고찰을 참조한다.
상기 언급된 바와 같이, 변형된 RNA의 수많은 상업적 공급업체가 있으며, 그 중 다수는 siRNA의 유효성을 개선시키기 위해 설계된 변형을 전문으로 하고 있다. 문헌에 보고된 다양한 결과를 기반으로 하여 다양한 접근 방식이 제공된다. 예를 들어, 다마콘은 문헌 [Kale, Nature Reviews Drug Discovery 11:125-140 (2012)]에서 보고된 바와 같이, 비-브릿징 산소를 황 (포스포로티오에이트, PS)으로 대체하는 것이 siRNA의 뉴클레아제 저항성을 개선시키는데 광범위하게 사용되었다고 지적한다. 리보스의 2'-위치의 변형은 뉴클레오티드간 포스페이트 결합의 뉴클레아제 저항성을 개선시키는 것과 동시에 이중나선 안정성 (Tm)을 증가시키는 것으로 보고되었으며, 이는 또한 면역 활성화로부터 보호하는 것으로 나타났다. 문헌 [Soutschek et al. Nature 432:173-178 (2004)]에서 보고된 바와 같이, 중간 정도의 PS 백본 변형과 작고 내약성이 우수한 2'-치환 (2'-O-, 2'-플루오로, 2'-히드로)의 조합은 생체 내 적용을 위한 고도로 안정적인 siRNA와 연관이 있었으며; 2'-O-메틸 변형은 문헌 [Volkov, Oligonucleotides 19:191-202 (2009)]에서 보고된 바와 같이 안정성 개선에 효과적인 것으로 보고되었다. 선천성 면역 반응의 유도를 감소시키는 것과 관련하여, 2'-O-메틸, 2'-플루오로, 2'-히드로로 특이적 서열을 변형시키면, 일반적으로 침묵 활성을 유지하면서 TLR7/TLR8 상호작용이 감소하는 것으로 보고되었으며; 예를 들어, 문헌 [Judge et al., Mol. Ther. 13:494-505 (2006); 및 Cekaite et al., J. Mol. Biol. 365:90-108 (2007)]을 참조한다. 부가의 변형, 예컨대 2-티오우라실, 슈도우라실, 5-메틸시토신, 5-메틸우라실, 및 N6-메틸아데노신이 또한 TLR3, TLR7 및 TLR8에 의해 매개되는 면역 효과를 최소화하는 것으로 나타났으며; 예를 들어, 문헌 [Kariko et al., Immunity 23:165-175 (2005)]을 참조한다.
또한 관련 기술분야에 공지되어 있고 상업적으로 입수가능한 바와 같이, 예를 들어 콜레스테롤, 토코페롤 및 엽산, 지질, 펩티드, 중합체, 링커 및 압타머를 포함하여, 세포에 의한 전달 및/또는 흡수를 향상시킬 수 있는 다수의 접합체를 본원에서 사용하기 위해 폴리뉴클레오티드, 예컨대 RNA에 적용할 수 있으며; 예를 들어, 문헌 [Winkler, Ther. Deliv. 4:791-809 (2013)] 및 이러한 문헌에 인용된 참고문헌에 의한 고찰을 참조한다.
부가의 서열
일부 실시양태에서, 가이드 RNA는 5' 또는 3' 단부에 적어도 하나의 부가의 세그먼트를 포함한다. 예를 들어, 적합한 부가의 세그먼트는 5' 캡 (예를 들어, 7-메틸구아닐레이트 캡 (m7G)); 3' 폴리아데닐화된 꼬리 (예를 들어, 3' 폴리(A) 꼬리); 리보스위치 서열 (예를 들어, 단백질 및 단백질 복합체에 의한 조절된 안정성 및/또는 조절된 접근성을 허용하기 위함); dsRNA 이중나선 (예를 들어, 헤어핀)을 형성하는 서열; RNA를 세포하 위치 (예를 들어, 핵, 미토콘드리아, 엽록체 등)로 표적화하는 서열; 추적을 제공하는 변형 또는 서열 (예를 들어, 형광 분자에 대한 직접 접합, 형광 검출을 용이하게 하는 모이어티에 대한 접합, 형광 검출을 허용하는 서열 등); 단백질 (예를 들어, 전사 활성인자, 전사 억제인자, DNA 메틸트랜스퍼라제, DNA 데메틸라제, 히스톤 아세틸트랜스퍼라제, 히스톤 데아세틸라제 등을 포함한, DNA에 작용하는 단백질)에 대한 결합 부위를 제공하는 변형 또는 서열; 증가, 감소 및/또는 제어가능한 안정성을 제공하는 변형 또는 서열; 및 그의 조합을 포함할 수 있다.
안정성 제어 서열
안정성 제어 서열은 RNA (예를 들어, 가이드 RNA)의 안정성에 영향을 미친다. 적합한 안정성 제어 서열의 비제한적인 예는 전사 종결인자 세그먼트 (예를 들어, 전사 종결 서열)이다. 가이드 RNA의 전사 종결인자 세그먼트는 10개 뉴클레오티드 내지 100개 뉴클레오티드, 예를 들어 10개 뉴클레오티드 (nt) 내지 20 nt, 20 nt 내지 30 nt, 30 nt 내지 40 nt, 40 nt 내지 50 nt, 50 nt 내지 60 nt, 60 nt 내지 70 nt, 70 nt 내지 80 nt, 80 nt 내지 90 nt, 또는 90 nt 내지 100 nt의 총 길이를 가질 수 있다. 예를 들어, 전사 종결인자 세그먼트는 15개 뉴클레오티드 (nt) 내지 80 nt, 15 nt 내지 50 nt, 15 nt 내지 40 nt, 15 nt 내지 30 nt 또는 15 nt 내지 25 nt의 길이를 가질 수 있다.
일부 실시양태에서, 전사 종결 서열은 진핵 세포에서 기능적인 서열이다. 일부 실시양태에서, 전사 종결 서열은 원핵 세포에서 기능적인 서열이다.
안정성 제어 서열 (예를 들어, 전사 종결 세그먼트, 또는 증가된 안정성을 제공하기 위한 가이드 RNA의 임의의 세그먼트)에 포함될 수 있는 뉴클레오티드 서열은, 예를 들어 Rho-독립적 trp 종결 부위를 포함한다.
모방체
일부 실시양태에서, 핵산은 핵산 모방체일 수 있다. 폴리뉴클레오티드에 적용되는 바와 같은 용어 "모방체"는 푸라노스 고리 단독 또는 푸라노스 고리와 뉴클레오티드간 연결 둘 다를 비-푸라노스 기로 대체한 폴리뉴클레오티드를 포함하도록 의도되며, 푸라노스 고리 단독의 대체가 또한 관련 기술분야에서 당 대체물로서 지칭된다. 헤테로시클릭 염기 모이어티 또는 변형된 헤테로시클릭 염기 모이어티는 적절한 표적 핵산과의 혼성화를 위해 유지된다. 우수한 혼성화 특성을 갖는 것으로 밝혀진 폴리뉴클레오티드 모방체인 이러한 핵산 중 하나가 펩티드 핵산 (PNA)으로서 지칭된다. PNA에서, 폴리뉴클레오티드의 당-백본은 아미드 함유 백본, 특히 아미노에틸글리신 백본으로 대체된다. 뉴클레오티드는 유지되며 백본의 아미드 부분의 아자 질소 원자와 직접적으로 또는 간접적으로 결합된다.
우수한 혼성화 특성을 갖는 것으로 보고된 폴리뉴클레오티드 모방체 중 하나는 펩티드 핵산 (PNA)이다. PNA 화합물 내의 백본은 2개 이상의 연결된 아미노에틸글리신 단위이며, 이는 PNA에 아미드 함유 백본을 제공한다. 헤테로시클릭 염기 모이어티는 백본의 아미드 부분의 아자 질소 원자와 직접적으로 또는 간접적으로 결합된다. PNA 화합물의 제조를 기재하는 대표적인 미국 특허는 미국 특허 번호 5,539,082; 5,714,331; 및 5,719,262를 포함하나 이에 제한되지는 않는다.
연구된 폴리뉴클레오티드 모방체의 또 다른 클래스는 모르폴리노 고리에 부착된 헤테로시클릭 염기를 갖는 연결된 모르폴리노 단위 (모르폴리노 핵산)를 기반으로 한다. 모르폴리노 핵산 내의 모르폴리노 단량체 단위를 연결하는 다수의 연결 기가 보고되었다. 비-이온성 올리고머 화합물을 제공하기 위해 하나의 클래스의 연결 기가 선택되었다. 비-이온성 모르폴리노-기반 올리고머 화합물은 세포성 단백질과 원하지 않는 상호작용을 할 가능성이 적다. 모르폴리노-기반 폴리뉴클레오티드는 올리고뉴클레오티드의 비이온성 모방체이며, 이는 세포성 단백질과 원하지 않는 상호작용을 형성할 가능성이 적다 (Dwaine A. Braasch and David R. Corey, Biochemistry, 2002, 41(14), 45034510). 모르폴리노-기반 폴리뉴클레오티드는 미국 특허 번호 5,034,506에 개시되어 있다. 모르폴리노 클래스의 폴리뉴클레오티드 내의 다양한 화합물이 제조되었으며, 이는 단량체 서브유닛을 연결하는 다양한 상이한 연결 기를 갖는다.
폴리뉴클레오티드 모방체의 추가 클래스는 시클로헥세닐 핵산 (GeNA)으로서 지칭된다. DNA/RNA 분자에 정상적으로 존재하는 푸라노스 고리는 시클로헥세닐 고리로 대체된다. GeNA DMT 보호된 포스포르아미다이트 단량체는 고전적인 포스포르아미다이트 화학에 따라 올리고머 화합물 합성을 위해 제조 및 사용되었다. 완전히 변형된 GeNA 올리고머 화합물과 GeNA로 변형된 특이적 위치를 갖는 올리고뉴클레오티드가 제조되고 연구되었다 (문헌 [Wang et al., J. Am. Chem. Soc., 2000, 122, 85958602] 참조). 일반적으로 GeNA 단량체를 DNA 쇄에 혼입하면 DNA/RNA 하이브리드의 안정성이 증가된다. GeNA 올리고아데닐레이트는 천연 복합체와 유사한 안정성을 갖는 RNA 및 DNA 보체와 복합체를 형성하였다. GeNA 구조를 자연 핵산 구조에 혼입하는 연구는 NMR 및 원형 이색성 분석을 통해 입체형태적 적응이 쉽게 진행되는 것으로 나타났다.
추가의 변형은 2'-히드록실 기가 당 고리의 4' 탄소 원자에 연결되어 2'-C,4'-C-옥시메틸렌 연결을 형성하여 바이시클릭 당 모이어티를 형성하는 잠금 핵산 (LNA)을 포함한다. 상기 연결은 2' 산소 원자와 4' 탄소 원자를 브릿징하는 기인 메틸렌 (-CH2-)일 수 있으며, 여기서 n은 1 또는 2이다 (Singh et al., Chem. Commun., 1998, 4, 455-456). LNA 및 LNA 유사체는 상보적인 DNA 및 RNA와 함께 매우 높은 이중나선 열 안정성 (Tm = +3 내지 +10℃), 3'-엑소뉴클레오리틱 분해에 대한 안정성 및 우수한 용해도 특성을 나타낸다. LNA를 함유한 강력하고 독성이 없는 안티센스 올리고뉴클레오티드가 보고되었다 (Wahlestedt et al., Proc. Natl. Acad. Sci. U.S.A, 2000, 97, 5633-5638).
LNA 단량체인 아데닌, 시토신, 구아닌, 5-메틸-시토신, 티민 및 우라실의 합성 및 제조와 이들의 올리고머화 및 핵산 인식 특성이 보고되었다 (Koshkin et al., Tetrahedron, 1998, 54, 3607-3630). LNA 및 그의 제조는 또한 WO 98/39352 및 WO 99/14226에 기재되어 있다.
변형된 당 모이어티
핵산은 또한 하나 이상의 치환된 당 모이어티를 포함할 수 있다. 적합한 폴리뉴클레오티드는 OH; F; O-, S- 또는 N-알킬; O-, S- 또는 N-알케닐; O-, S- 또는 N-알키닐; 또는 O-알킬-O-알킬로부터 선택된 당 치환기를 포함하며, 여기서, 알킬, 알케닐 및 알키닐은 치환되거나 또는 비치환된 C1 내지 C10 알킬 또는 C2 내지 C10 알케닐 및 알키닐일 수 있다. 특히 적합한 것은 O((CH2)nO)mCH3, O(CH2)nOCH3, O(CH2)nNH2, O(CH2)CH3, O(CH2)nONH2, 및 O(CH2)nON((CH2)nCH3)2이고, 여기서 n 및 m은 1 내지 약 10이다. 다른 적합한 폴리뉴클레오티드는 하기로부터 선택된 당 치환기를 포함한다: C1 내지 C10 저급 알킬, 치환된 저급 알킬, 알케닐, 알키닐, 알카릴, 아르알킬, O-알카릴 또는 O-아르알킬, SH, SCH3, OCN, Cl, Br, CN, CF3, OCF3, SOCH3, SO2CH3, ONO2, NO2, N3, NH2, 헤테로시클로알킬, 헤테로시클로알카릴, 아미노알킬아미노, 폴리알킬아미노, 치환된 실릴, RNA 절단 기, 리포터 기, 인터칼레이터, 올리고뉴클레오티드의 약동학적 특성을 개선시키기 위한 기, 또는 올리고뉴클레오티드의 약력학적 특성을 개선시키기 위한 기, 및 유사한 특성을 갖는 기타 치환기. 적합한 변형은 -2'-O-(2-메톡시에틸) 또는 2'-MOE로서 공지되기도 한 (문헌 [Martin et al., Hely. Chim. Acta, 1995, 78, 486-504]) 2'-메톡시에톡시 2'-O-CH2-CH2OCH3, 예를 들어, 알콕시알콕시 기를 포함한다. 추가의 적합한 변형은 하기 본원의 실시예에 기재된 바와 같은, 2'-디메틸아미노옥시에톡시, 예를 들어 O(CH2)2ON(CH3)2 기 (2'-DMAOE), 및 2'-디메틸아미노에톡시에톡시 (관련 기술분야에서 2'-O-디메틸-아미노-에톡시-에틸 또는 2'-DMAEOE로서 공지되기도 함), 예를 들어 2'-O-CH2-O-CH2-N(CH3)2를 포함한다.
다른 적합한 당 치환기는 메톡시 (-O-CH3), 아미노프로폭시 (-O-CH2CH2CH2NH2), 알릴 (-CH2-CH=CH2), -O-알릴 (-O-CH2-CH=CH2) 및 플루오로 (F)를 포함한다. 2'-당 치환기는 아라비노 (위) 위치 또는 리보 (아래) 위치에 있을 수 있다. 적합한 2'-아라비노 변형은 2'-F이다. 유사한 변형이 또한 올리고머 화합물 상의 다른 위치, 특히 3' 말단 뉴클레오시드 상의 또는 2'-5' 연결된 올리고뉴클레오티드 내의 당의 3' 위치 및 5' 말단 뉴클레오티드의 5' 위치에서 이루어질 수 있다. 올리고머 화합물은 또한 당 모방체, 예컨대 펜토푸라노실 당 대신에 시클로부틸 모이어티를 가질 수 있다.
염기 변형 및 치환
핵산은 또한 핵염기 (종종 관련 기술분야에서 간단히 "염기"로서 지칭됨) 변형 또는 치환을 포함할 수 있다. 본원에 사용된 바와 같은, "비변형된" 또는 "자연" 핵염기는 퓨린 염기인 아데닌 (A) 및 구아닌 (G), 및 피리미딘 염기인 티민 (T), 시토신 (C) 및 우라실 (U)을 포함한다. 변형된 핵염기는 기타 합성 및 자연 핵염기, 예컨대 5-메틸시토신 (5-me-C), 5-히드록시메틸 시토신, 크산틴, 히포크산틴, 2-아미노아데닌, 아데닌 및 구아닌의 6-메틸 및 기타 알킬 유도체, 아데닌 및 구아닌의 2-프로필 및 기타 알킬 유도체, 2-티오우라실, 2-티오티민 및 2-티오시토신, 5-할로우라실 및 시토신, 5-프로피닐 (-C=C-CH3) 우라실 및 시토신 및 피리미딘 염기의 기타 알키닐 유도체, 6-아조 우라실, 시토신 및 티민, 5 -우라실 (슈도우라실), 4-티오우라실, 8-할로, 8-아미노, 8-티올, 8-티오알킬, 8-히드록실 및 기타 8-치환된 아데닌 및 구아닌, 5-할로, 특히 5-브로모, 5-트리플루오로메틸 및 기타 5-치환된 우라실 및 시토신, 7-메틸구아닌 및 7-메틸아데닌, 2-F-아데닌, 2-아미노-아데닌, 8-아자구아닌 및 8-아자아데닌, 7-데아자구아닌 및 7-데아자아데닌 및 3-데아자구아닌 및 3-데아자아데닌을 포함한다. 추가의 변형된 핵염기는 트리시클릭 피리미딘, 예컨대 페녹사진 시티딘 (1H-피리미도(5,4-b)(1,4)벤족사진-2(3H)-온), 페노티아진 시티딘 (1H-피리미도(5,4-b)(1,4)벤조티아진-2(3H)-온), G-클램프, 예컨대 치환된 페녹사진 시티딘 (예를 들어, 9-(2-아미노에톡시)-H-피리미도(5,4-(b)(1,4)벤족사진-2(3H)-온), 카르바졸 시티딘 (2H-피리미도(4,5-b)인돌-2-온), 피리도인돌 시티딘 (H-피리도(3',2':4,5)피롤로(2,3-d)피리미딘-2-온)을 포함한다.
헤테로시클릭 염기 모이어티는 또한 퓨린 또는 피리미딘 염기가 다른 헤테로사이클로 대체된 것, 예를 들어 7-데아자-아데닌, 7-데아자구아노신, 2-아미노피리딘 및 2-피리돈을 포함할 수 있다. 추가 핵염기는 미국 특허 제3,687,808호에 개시된 것, 문헌 [The Concise Encyclopedia Of Polymer Science And Engineering, pages 858-859, Kroschwitz, J. 1., ed. John Wiley & Sons, 1990]에 개시된 것, 문헌 [Englisch et al., Angewandte Chemie, International Edition, 1991, 30, 613]에 개시된 것, 및 문헌 [Sanghvi, Y. S., Chapter 15, Antisense Research and Applications, pages 289-302, Crooke, S. T. and Lebleu, B., ed., CRC Press, 1993]에 개시된 것을 포함한다. 이들 핵염기 중 특정의 것은 올리고머 화합물의 결합 친화도를 증가시키는데 유용하다. 이들은 5-치환된 피리미딘, 6-아자피리미딘 및 N-2, N-6 및 O-6 치환된 퓨린 (2-아미노프로필아데닌, 5-프로피닐우라실 및 5-프로피닐시토신 포함)을 포함한다. 5-메틸시토신 치환은 핵산 이중나선 안정성을 0.6-1.2℃만큼 증가시키는 것으로 나타났으며 (문헌 [Sanghvi et al., eds., Antisense Research and Applications, CRC Press, Boca Raton, 1993, pp. 276-278]), 이는, 예를 들어, 2'-O-메톡시에틸 당 변형과 조합될 때 적합한 염기 치환이다.
"상보적"은 자연적으로 또는 비-자연적으로 발생하는 (예를 들어, 상기 기재된 바와 같이 변형된) 염기 (뉴클레오시드) 또는 그의 유사체를 포함하는 두 서열 간의 염기 스태킹 및 특이적 수소 결합을 통해 쌍을 이룰 수 있는 능력을 지칭한다. 예를 들어, 핵산의 한 위치에 있는 염기가 표적의 상응하는 위치에 있는 염기와 수소 결합을 할 수 있다면, 그 염기들은 그러한 위치에서 서로 상보적인 것으로 간주된다. 핵산은 수소 결합에 긍정적 또는 부정적 기여를 제공하지 않는 범용 염기 또는 불활성 무염기 스페이서를 포함할 수 있다. 염기쌍 형성은 표준 왓슨-크릭 염기쌍 형성과 비-왓슨-크릭 염기쌍 형성 (예를 들어, 워블 염기쌍 형성 및 후그스틴 염기쌍 형성) 둘 다를 포함할 수 있다.
상보적인 염기쌍 형성의 경우, 아데노신-유형 염기 (A)는 티미딘-유형 염기 (T) 또는 우라실-유형 염기 (U)에 상보적이고, 시토신-유형 염기 (C)는 구아노신-유형 염기 (G)에 상보적인 것으로 이해되며, 범용 염기,예컨대 3-니트로피롤 또는 5-니트로인돌은 임의의 A, C, U 또는 T와 혼성화할 수 있고 이에 상보적인 것으로 간주된다 (Nichols et al., Nature, 1994;369:492-493 및 Loakes et al., Nucleic Acids Res., 1994;22:4039-4043). 이노신 (I)은 또한 관련 기술분야에서 범용 염기인 것으로 간주되어 왔으며 임의의 A, C, U 또는 T에 상보적인 것으로 간주된다. 문헌 [Watkins and Santalucia, Nucl. Acids Research, 2005; 33 (19): 6258-6267]을 참조한다.
접합체
핵산의 또 다른 가능한 변형은 올리고뉴클레오티드의 활성, 세포 분포 또는 세포 흡수를 향상시키는 하나 이상의 모이어티 또는 접합체를 폴리뉴클레오티드에 화학적으로 연결하는 것을 수반한다. 이들 모이어티 또는 접합체는 작용기, 예컨대 1차 또는 2차 히드록실기와 공유 결합된 접합기를 포함할 수 있다. 접합기는 인터칼레이터, 리포터 분자, 폴리아민, 폴리아미드, 폴리에틸렌 글리콜, 폴리에테르, 올리고머의 약력학적 특성을 향상시키는 기, 및 올리고머의 약동학적 특성을 향상시키는 기를 포함하나 이에 제한되지는 않는다. 적합한 접합기는 콜레스테롤, 지질, 인지질, 비오틴, 페나진, 폴레이트, 페난트리딘, 안트라퀴논, 아크리딘, 플루오레세인, 로다민, 쿠마린 및 염료를 포함하나 이에 제한되지는 않는다. 약력학적 특성을 향상시키는 기는 흡수를 개선시키고/거나, 분해에 대한 저항성을 향상시키고/거나 표적 핵산과의 서열-특이적 혼성화를 강화시키는 기를 포함한다. 약동학적 특성을 향상시키는 기는 핵산의 흡수, 분포, 대사 또는 배설을 개선시키는 기를 포함한다.
접합 모이어티는 지질 모이어티, 예컨대 콜레스테롤 모이어티 (문헌 [Letsinger et al., Proc. Natl. Acad. Sci. USA, 1989, 86, 6553-6556]), 콜산 (문헌 [Manoharan et al., Bioorg. Med. Chem. Let., 1994,4, 1053-1060]), 티오에테르, 예를 들어 헥실-S-트리틸티올 (문헌 [Manoharan et al., Ann. N.Y. Acad. Sci., 1992, 660, 306-309; Manoharan et al., Bioorg. Med. Chem. Let., 1993, 3, 2765-2770]), 티오콜레스테롤 (문헌 [Oberhauser et al., Nucl. Acids Res., 1992, 20, 533-538]), 지방족 쇄, 예를 들어 도데칸디올 또는 운데실 잔기 (문헌 [Saison-Behmoaras et al., EMBO J., 1991, 10, 1111-1118; Kabanov et al., FEBS Lett., 1990, 259, 327-330; Svinarchuk et al., Biochimie, 1993, 75, 49-54]), 인지질, 예를 들어 디-헥사데실-rac-글리세롤 또는 트리에틸암모늄 1,2-디-O-헥사데실-rac-글리세로-3-H-포스포네이트 (문헌 [Manoharan et al., Tetrahedron Lett., 1995, 36, 3651-3654; Shea et al., Nucl. Acids Res., 1990, 18, 3777-3783]), 폴리아민 또는 폴리에틸렌 글리콜 쇄 (문헌 [Manoharan et al., Nucleosides & Nucleotides, 1995, 14, 969-973]), 또는 아다만탄 아세트산 (문헌 [Manoharan et al. , Tetrahedron Lett., 1995, 36, 36513654]), 팔미틸 모이어티 (문헌 [Mishra et al., Biochim. Biophys. Acta, 1995, 1264, 229-237]), 또는 옥타데실아민 또는 헥실아미노-카르보닐-옥시콜레스테롤 모이어티 (문헌 [Crooke et al., J. Pharmacal. Exp. Ther., 1996,277, 923-937])를 포함하나 이에 제한되지는 않는다.
접합체는 "단백질 형질도입 도메인" 또는 PTD (CPP-세포 침투 펩티드로서 공지되기도 함)를 포함할 수 있으며, 이는 지질 이중층, 미셀, 세포막, 소기관 막, 또는 소포막 통과를 용이하게 하는 폴리펩티드, 폴리뉴클레오티드, 탄수화물, 또는 유기 또는 무기 화합물을 지칭할 수 있다. 작은 극성 분자부터 큰 거대분자 및/또는 나노입자까지 다양할 수 있는 또 다른 분자에 부착된 PTD는 분자가 막을 횡단하는 것, 예를 들어 세포외 공간에서 세포내 공간으로 또는 세포질에서 소기관 내로 이동하는 것을 용이하게 한다. 일부 실시양태에서, PTD는 외인성 폴리펩티드 (예를 들어, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체)의 아미노 말단에 공유적으로 연결된다. 일부 실시양태에서, PTD는 외인성 폴리펩티드 (예를 들어, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체)의 C-말단 또는 N-말단에 공유적으로 연결된다. 일부 실시양태에서, PTD는 핵산 (예를 들어, 가이드 RNA, 가이드 RNA를 코딩하는 폴리뉴클레오티드, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 폴리뉴클레오티드 등)에 공유적으로 연결된다. 예시적인 PTD는 YGRKKRRQRRR을 포함하는 HIV-1 TAT의 잔기 47-57에 상응하는 최소 운데카펩티드 단백질 형질도입 도메인; 세포 내로 직접 진입하기에 충분한 수의 아르기닌 (예를 들어, 3, 4, 5, 6, 7, 8, 9, 10 또는 10-50개의 아르기닌)을 포함하는 폴리아르기닌 서열; VP22 도메인 (문헌 [Zender et al. (2002) Cancer Gene Ther. 9(6):489-96]); 드로소필라 안테나페디아(Drosophila Antennapedia) 단백질 형질도입 도메인 (문헌 [Noguchi et al. (2003) Diabetes 52(7):1732-1737]); 말단절단된 인간 칼시토닌 펩티드 (문헌 [Trehin et al. (2004) Pharm. Research 21:1248-1256]); 폴리리신 (문헌 [Wender et al. (2000) Proc. Natl. Acad. Sci. USA 97:13003-13008])을 포함하나 이에 제한되지는 않는다. 일부 실시양태에서, PTD는 활성화가능한 CPP (ACPP)이다 (Aguilera et al. (2009) lntegr Biol (Camb) June; 1(5-6): 371-381). ACPP는 절단가능한 링커를 통해 매칭 다가음이온 (예를 들어, Glu9 또는 "E9")에 연결된 다가양이온성 CPP (예를 들어, Arg9 또는 "R9")를 포함하며, 이는 순 전하를 거의 0으로 감소시킴으로써 세포 내로의 부착 및 흡수를 억제한다. 링커가 절단되면, 다가음이온이 방출되어 폴리아르기닌과 그 고유의 접착성을 국부적으로 벗겨내므로 ACPP를 "활성화"하여 막을 통과시킨다. 일부 실시양태에서, PTD는 PTD의 생체이용률을 증가시키기 위해 화학적으로 변형된다. 예시적인 변형은 문헌 [Expert Opin Drug Deliv. 2009 Nov;6(11):1195-205]에 개시된다.
폴리펩티드 변형
코돈-최적화된 폴리뉴클레오티드 서열로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 시험관 내에서 또는 진핵 세포에 의해, 원핵 세포에 의해, 또는 시험관 내 전사 및 번역 (IVTT)에 의해 생산될 수 있으며, 이는 관련 기술분야에 공지된 방법을 사용하여 언폴딩, 예를 들어 열 변성, OTT 감소 등에 의해 추가로 프로세싱될 수 있고 추가로 다시 폴딩될 수 있다.
1차 서열을 변경하지 않는 관심 변형은 폴리펩티드의 화학적 유도체화, 예를 들어 아실화, 아세틸화, 카르복실화, 아미드화 등을 포함한다. 또한 글리코실화의 변형, 예를 들어, 합성 및 프로세싱 동안 또는 추가의 프로세싱 단계에서 폴리펩티드의 글리코실화 패턴을 변형시킴으로써 만들어진 것; 예를 들어, 글리코실화에 영향을 미치는 효소, 예컨대 포유동물 글리코실화 또는 탈글리코실화 효소에 폴리펩티드를 노출시킴으로써 만들어진 것이 포함된다. 또한 인산화된 아미노산 잔기를 갖는 서열, 예를 들어 포스포티로신, 포스포세린 또는 포스포트레오닌이 포함된다.
일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 단백질분해적 분해에 대한 저항성을 개선시키거나, 표적 서열 특이성을 변경하거나, 용해도 특성을 최적화하거나, 단백질 활성 (예를 들어, 전사 조정 활성, 효소 활성 등)을 변경하거나 또는 치료제로서 더 적합하게 만들기 위해 통상적인 분자 생물학적 기술 및 합성 화학을 사용하여 변형되었다. 이러한 폴리펩티드의 유사체는 자연적으로 발생하는 L-아미노산 이외의 잔기, 예를 들어 O-아미노산 또는 비자연의 합성 아미노산을 함유하는 것을 포함한다. 아미노산 잔기의 일부 또는 전부가 D-아미노산으로 치환할 수 있다. B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 관련 기술분야에 공지된 바와 같은 통상적인 방법을 사용하여 시험관 내 합성에 의해 제조될 수 있다. 다양한 상업적 합성 장치가 입수가능하며, 예를 들어 어플라이드 바이오시스템즈, 인크.(Applied Biosystems, Inc.), 베크만(Beckman) 등에 의한 자동화 합성기가 있다. 합성기를 사용함으로써, 자연 아미노산을 비자연 아미노산으로 치환할 수 있다. 특정한 제조 순서 및 방식은 편의성, 경제성, 요구되는 순도 등에 따라 결정될 수 있다.
원하는 경우, 합성 동안 또는 발현 동안 다양한 기가 펩티드 내로 도입되어, 다른 분자 또는 표면에 연결될 수 있다. 따라서, 예를 들어 시스테인은 티오에테르를 만드는데 사용될 수 있고, 히스티딘은 금속 이온 착물에 연결하는데 사용되며, 카르복실기는 아미드 또는 에스테르를 형성하는데 사용되고, 아미노기는 아미드를 형성하는데 사용될 수 있다.
재조합 세포
일부 실시양태에서, 본원에 기재된 코돈-최적화된 B-GEn.1 또는 B-GEn.2 시스템은 진핵 세포, 예컨대 포유동물 세포, 예를 들어 인간 세포에서 사용될 수 있다. 임의의 인간 세포는 본원에 개시된 코돈-최적화된 B-GEn.1 또는 B-GEn.2 시스템과 함께 사용하기에 적합하다.
일부 실시양태에서, 생체 외 또는 시험관 내 세포는 하기를 포함한다: (a) 본원에 기재된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 변이체를 코딩하는 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및 (b) gRNA 또는 이러한 gRNA를 코딩하는 핵산, 여기서 gRNA는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 표적 폴리뉴클레오티드 서열로 가이드할 수 있다. 일부 실시양태에서, 세포는 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 핵산을 포함한다. 일부 실시양태에서, 세포는 gRNA를 포함한다. 일부 실시양태에서, 세포는 gRNA를 코딩하는 핵산을 포함한다. 일부 실시양태에서, gRNA는 단일 가이드 RNA (sgRNA)이다. 일부 실시양태에서, 세포는 하나 이상의 부가의 gRNA 또는 하나 이상의 부가의 gRNA를 코딩하는 핵산을 포함한다. 일부 실시양태에서, 세포는 공여자 템플릿을 추가로 포함한다.
한 측면에서, 본원에 개시된 일부 실시양태는 본원에 제공된 바와 같은 핵산을 숙주 세포, 예컨대 동물 세포 내로 도입하는 단계, 및 형질전환된 세포를 선택하거나 스크리닝하는 단계를 포함하는, 세포를 형질전환시키는 방법에 관한 것이다. 용어 "숙주 세포" 및 "재조합 숙주 세포"는 본원에서 상호교환가능하게 사용된다. 이러한 용어는 특정한 대상체 세포 뿐만 아니라 그러한 세포의 자손 또는 잠재적 자손을 지칭하는 것으로 이해된다. 특정 변형은 돌연변이 또는 환경 영향으로 인해 다음 세대에서 발생할 수 있으므로, 그러한 자손은 실제로 모 세포와 동일하지 않을 수 있지만 여전히 본원에 사용된 바와 같은 상기 용어의 범위 내에 포함된다. 다양한 상기 언급된 숙주 세포 및 종을 형질전환시키는 기술은 관련 기술분야에 공지되어 있고 기술적 및 과학적 문헌에 기재되어 있다. 따라서, 본원에 개시된 바와 같은 적어도 하나의 재조합 세포를 포함하는 세포 배양물이 또한 본 출원의 범위 내에 있다. 세포 배양물을 생성하고 유지하는데 적합한 방법 및 시스템은 관련 기술분야에 공지되어 있다.
관련 측면에서, 일부 실시양태는 재조합 숙주 세포, 예를 들어 본원에 기재된 핵산을 포함하는 재조합 동물 세포에 관한 것이다. 핵산은 숙주 게놈에 안정하게 통합될 수 있거나, 에피솜적으로 복제될 수 있거나, 안정하거나 일시적인 발현을 위한 미니서클 발현 벡터로서 재조합 숙주 세포에 존재할 수 있다. 따라서, 본원에 개시된 일부 실시양태에서, 핵산은 재조합 숙주 세포에서 에피솜 단위로서 유지되고 복제된다. 일부 실시양태에서, 핵산은 재조합 세포의 게놈 내로 안정적으로 통합된다. 일부 실시양태에서, 핵산은 안정하거나 일시적인 발현을 위한 미니서클 발현 벡터로서 재조합 숙주 세포에 존재한다.
일부 실시양태에서, 숙주 세포는, 예를 들어, 숙주 세포의 게놈의 일부분과 상동인 핵산 서열을 포함하는 상동 재조합을 위한 벡터, 또는 관심 유전자 중 임의의 것 또는 그의 조합의 발현을 위한 발현 벡터일 수 있는 본 출원의 벡터 구축물을 사용하여 유전적으로 조작 (예를 들어, 형질도입 또는 형질전환 또는 형질감염)될 수 있다. 벡터는, 예를 들어, 플라스미드, 바이러스 입자, 파지 등의 형태일 수 있다. 일부 실시양태에서, 관심 폴리펩티드의 발현을 위한 벡터는 또한 예를 들어, 상동 재조합에 의해 숙주로의 통합을 위해 설계될 수 있다.
일부 실시양태에서, 본 개시내용은 유전적으로 변형된 숙주 세포, 예를 들어 단리된 유전적으로 변형된 숙주 세포를 제공하며, 여기서 유전적으로 변형된 숙주 세포는 1) 외인성 가이드 RNA; 2) 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 외인성 핵산; 3) B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 외인성 핵산; 4) 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 핵산으로부터 발현된 외인성 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 또는 5) 상기의 임의의 조합을 포함한다. 일부 실시양태에서, 유전적으로 변형된 세포는 숙주 세포를, 예를 들어 하기를 사용하여 유전적으로 변형시킴으로써 생성된다: 1) 외인성 가이드 RNA; 2) 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 외인성 핵산; 3) B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 외인성 핵산; 4) 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 핵산으로부터 발현된 외인성 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 또는 5) 상기의 임의의 조합.
상기 논의된 바와 같은 표적 세포가 되기에 적합한 모든 세포는 또한 유전적으로 변형된 숙주 세포가 되기에 적합하다. 예를 들어, 유전적으로 변형된 관심 숙주 세포는 임의의 유기체로부터의 세포, 예를 들어, 박테리아 세포, 고세균 세포, 단일 세포 진핵 유기체의 세포, 식물 세포, 조류 세포 (예를 들어, 보트리오코쿠스 브라우니이(Botryococcus braunii), 클라미도모나스 레인하르트티이(Chlamydomonas reinhardtii), 나노클로롭시스 가디타나(Nannochloropsis gaditana), 클로렐라 피레노이도사(Chlorela pyrenoidosa), 사르가숨 파텐스(Sargassum patens) (씨. 아가르드(C. Agardh)) 등), 진균 세포 (예를 들어, 효모 세포), 동물 세포, 무척추동물 (예를 들어, 초파리, 자포동물, 극피동물, 선충류 등)로부터의 세포, 척추동물 (예를 들어, 어류, 양서류, 파충류, 조류, 포유동물)로부터의 세포, 포유동물 (예를 들어, 돼지, 소, 염소, 양, 설치류, 래트, 마우스, 비-인간 영장류, 인간 등)로부터의 세포일 수 있다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 인간으로부터의 임의의 세포일 수 있다.
일부 실시양태에서, 본 개시내용의 유전적으로 변형된 숙주 세포는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 뉴클레오티드 서열을 포함하는 외인성 핵산으로 유전적으로 변형되었다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 본원에 기재된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 변이체를 코딩하는 뉴클레오티드 서열을 포함하는 외인성 핵산으로 유전적으로 변형되었다. 유전적으로 변형된 숙주 세포의 DNA는 가이드 RNA (또는 변형될 게놈 위치/서열을 결정하는 가이드 RNA를 코딩하는 DNA) 및 임의로 공여자 핵산을 세포 내로 도입함으로써 변형을 위해 표적화될 수 있다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 뉴클레오티드 서열은 유도성 프로모터 (예를 들어, 열 충격 프로모터, 테트라시클린-조절된 프로모터, 스테로이드-조절된 프로모터, 금속-조절된 프로모터, 에스트로겐 수용체-조절된 프로모터 등)에 작동가능하게 연결된다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열은 공간적으로 제한된 및/또는 시간적으로 제한된 프로모터 (예를 들어, 조직 특이적 프로모터, 세포 유형 특이적 프로모터, 세포 주기 특이적 프로모터)에 작동가능하게 연결된다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열은 구성적 프로모터에 작동가능하게 연결된다.
일부 실시양태에서, 유전적으로 변형된 숙주 세포는 시험관 내에 있다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 생체 내에 있다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 원핵 세포이거나 원핵 세포로부터 유래된다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 박테리아 세포이거나 박테리아 세포로부터 유래된다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 고세균 세포이거나 고세균 세포로부터 유래된다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 진핵 세포이거나 진핵 세포로부터 유래된다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 식물 세포이거나 식물 세포로부터 유래된다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 동물 세포이거나 동물 세포로부터 유래된다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 무척추동물 세포이거나 무척추동물 세포로부터 유래된다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 척추동물 세포이거나 척추동물 세포로부터 유래된다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 포유동물 세포이거나 포유동물 세포로부터 유래된다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 설치류 세포이거나 설치류 세포로부터 유래된다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 인간 세포이거나 인간 세포로부터 유래된다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 인간 세포이거나 인간 세포로부터 유래된다.
본 개시내용은 유전적으로 변형된 세포의 자손을 추가로 제공하며, 여기서 자손은 그것이 유래된 유전적으로 변형된 세포와 동일한 외인성 핵산 또는 폴리펩티드를 포함할 수 있다. 본 개시내용은 일부 실시양태에서, 유전적으로 변형된 숙주 세포를 포함하는 조성물을 추가로 제공한다.
일부 실시양태에서, 유전적으로 변형된 숙주 세포는 유전적으로 변형된 줄기 세포 또는 전구 세포이다. 적합한 숙주 세포는, 예를 들어, 줄기 세포 (성체 줄기 세포, 배아 줄기 세포, iPS 세포 등) 및 전구 세포 (예를 들어, 심장 전구 세포, 신경 전구 세포 등)를 포함한다. 다른 적합한 숙주 세포는 포유동물 줄기 세포 및 전구 세포, 예컨대 예를 들어, 설치류 줄기 세포, 설치류 전구 세포, 인간 줄기 세포, 인간 전구 세포 등을 포함한다. 다른 적합한 숙주 세포는 시험관 내 숙주 세포, 예를 들어 단리된 숙주 세포를 포함한다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 외인성 가이드 RNA 핵산을 포함한다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 외인성 핵산을 포함한다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 코돈-최적화된 뉴클레오티드 서열로부터 발현된 외인성 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 포함한다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열을 포함하는 외인성 핵산을 포함한다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 1) 가이드 RNA를 코딩하는 뉴클레오티드 서열 및 2) B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열을 포함하는 외인성 핵산을 포함한다.
비-인간 유전적으로 변형된 유기체
일부 실시양태에서, 유전적으로 변형된 숙주 세포는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열을 포함하는 외인성 핵산으로 유전적으로 변형되었다. 그러한 세포가 진핵 단일 세포 유기체라면, 변형된 세포는 유전적으로 변형된 유기체로 간주될 수 있다. 일부 실시양태에서, 비-인간 유전적으로 변형된 유기체는 B-GEn.1 또는 B-GEn.2 트랜스제닉 다세포 유기체이다.
일부 실시양태에서, 유전적으로 변형된 비-인간 숙주 세포 (예를 들어, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열을 포함하는 외인성 핵산으로 유전적으로 변형된 세포)는 유전적으로 변형된 비인간 유기체 (예를 들어, 마우스, 어류, 개구리, 파리, 벌레 등)를 생성할 수 있다. 예를 들어, 유전적으로 변형된 숙주 세포가 만능성 줄기 세포 (예를 들어, PSC) 또는 생식 세포 (예를 들어, 정자, 난모세포 등)인 경우, 유전적으로 변형된 유기체 전체가 유전적으로 변형된 숙주 세포로부터 유래될 수 있다. 일부 실시양태에서, 유전적으로 변형된 숙주 세포는 유전적으로 변형된 유기체를 생성할 수 있는 생체 내 또는 시험관 내에서 만능성 줄기 세포 (예를 들어, ESC, iPSC, 만능성 식물 줄기 세포 등) 또는 생식 세포 (예를 들어, 정자 세포, 난모세포 등)이다. 일부 실시양태에서 유전적으로 변형된 숙주 세포는 척추동물 PSC (예를 들어, ESC, iPSC 등)이고, 유전적으로 변형된 유기체를 생성하는데 사용된다 (예를 들어, PSC를 배반포에 주입하여 키메라/모자이크 동물을 생산한 후, 교배하여 비-키메라/비-모자이크 유전적으로 변형된 유기체를 생성할 수 있음; 식물의 경우 접목 등에 의함). 본원에 기재된 방법을 포함한, 유전적으로 변형된 유기체를 생산하기 위한 임의의 적합한 방법/프로토콜은 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열을 포함하는 외인성 핵산을 포함하는 유전적으로 변형된 숙주 세포를 생산하는데 적합하다. 유전적으로 변형된 유기체를 생산하는 방법은 관련 기술분야에 공지되어 있다. 예를 들어, 문헌 [Cho et al., Curr Protoc Cell Biol. 2009 Mar; Chapter 19:Unit 19.11: Generation of transgenic mice; Gama et al., Brain Struct Funct. 2010 Mar; 214(2-3):91-109. Epub 2009 Nov 25: Animal transgenesis: an overview; Husaini et al., GM Crops. 2011 Jun-Dec;2(3):150-62. Epub 2011 Jun 1: Approaches for gene targeting and targeted gene expression in plants]을 참조한다.
일부 실시양태에서, 유전적으로 변형된 유기체는 본 개시내용의 방법을 위한 표적 세포를 포함하고, 따라서 표적 세포에 대한 공급원으로 간주될 수 있다. 예를 들어, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열을 포함하는 외인성 핵산을 포함하는 유전적으로 변형된 세포를 사용하여 유전적으로 변형된 유기체를 생성하는 경우, 유전적으로 변형된 유기체의 세포는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열을 포함하는 외인성 핵산을 포함한다. 이러한 일부 실시양태에서, 유전적으로 변형된 유기체의 세포 또는 세포들의 DNA는 가이드 RNA (또는 가이드 RNA를 코딩하는 DNA) 및 임의로 공여자 핵산을 세포 또는 세포들 내로 도입함으로써 변형을 위해 표적화될 수 있다. 예를 들어, 유전적으로 변형된 유기체의 세포 서브세트 (예를 들어, 뇌세포, 장 세포, 신장 세포, 폐 세포, 혈액 세포 등) 내로 가이드 RNA (또는 가이드 RNA를 코딩하는 DNA)를 도입하면, 변형을 위해 그러한 세포의 DNA를 표적화할 수 있으며, 그의 게놈 위치는 도입된 가이드 RNA의 DNA-표적화 서열에 따라 달라질 것이다.
일부 실시양태에서, 유전적으로 변형된 유기체는 본 개시내용의 방법을 위한 표적 세포의 공급원이다. 예를 들어, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열을 포함하는 외인성 핵산으로 유전적으로 변형된 세포를 포함하는 유전적으로 변형된 유기체는 유전적으로 변형된 세포, 예를 들어 PSC (예를 들어, ESC, iPSC, 정자, 난모세포 등), 뉴런, 전구 세포, 심근세포 등의 공급원을 제공할 수 있다.
일부 실시양태에서, 유전적으로 변형된 세포는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열을 포함하는 외인성 핵산을 포함하는 PSC이다. 따라서, PSC는 가이드 RNA (또는 가이드 RNA를 코딩하는 DNA) 및 임의로 공여자 핵산을 PSC 내로 도입함으로써 PSC의 DNA가 변형을 위해 표적화될 수 있도록 표적 세포일 수 있고, 변형의 게놈 위치는 도입된 가이드 RNA의 DNA-표적화 서열에 따라 달라질 것이다. 따라서, 일부 실시양태에서, 본원에 기재된 방법은 유전적으로 변형된 유기체로부터 유래된 PSC의 DNA를 변형 (예를 들어, 임의의 원하는 게놈 위치를 결실 및/또는 대체)시키는데 사용될 수 있다. 그런 다음 이러한 변형된 PSC를 사용하여 (i) B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열을 포함하는 외인성 핵산 및 (ii) PSC 내로 도입된 DNA 변형 둘 다를 갖는 유기체를 생성할 수 있다.
일부 실시양태에서, 외인성 핵산은 공지되지 않은 프로모터의 제어 하에 있을 수 있거나 (예를 들어, 작동가능하게 연결됨) (예를 들어, 핵산이 숙주 세포 게놈에 무작위로 통합되는 경우) 또는 공지된 프로모터의 제어 하에 있을 수 있다 (예를 들어, 작동가능하게 연결됨). 적합한 공지된 프로모터는 임의의 공지된 프로모터일 수 있으며 구성적으로 활성인 프로모터 (예를 들어, CMV 프로모터), 유도성 프로모터 (예를 들어, 열 충격 프로모터, 테트라시클린-조절된 프로모터, 스테로이드-조절된 프로모터, 금속-조절된 프로모터, 에스트로겐 수용체-조절된 프로모터 등), 공간적으로 제한된 및/또는 시간적으로 제한된 프로모터 (예를 들어, 조직 특이적 프로모터, 세포 유형 특이적 프로모터 등) 등을 포함한다.
유전적으로 변형된 유기체 (예를 들어, 세포가 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열을 포함하는 유기체)는, 예를 들어, 식물; 조류; 무척추동물 (예를 들어, 자포동물, 극피동물, 벌레, 파리 등); 척추동물 (예를 들어, 어류 (예를 들어, 제브라피쉬, 복어, 금붕어 등), 양서류 (예를 들어, 도롱뇽, 개구리 등), 파충류, 조류, 포유동물 등); 유제류 (예를 들어, 염소, 돼지, 양, 소 등); 설치류 (예를 들어, 마우스, 래트, 햄스터, 기니피그); 토끼목 (예를 들어, 토끼) 등을 포함한 임의의 유기체일 수 있다.
일부 실시양태에서, 활성 부분은 RNase 도메인이다. 일부 실시양태에서, 활성 부분은 DNase 도메인이다.
트랜스제닉 비-인간 동물
상기 기재된 바와 같이, 일부 실시양태에서, 핵산 (예를 들어, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열) 또는 재조합 발현 벡터는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 생산하는 트랜스제닉 동물을 생성하기 위한 트랜스진으로서 사용된다. 따라서, 본 개시내용은 트랜스제닉 비-인간 동물을 추가로 제공하며, 이러한 동물은 상기 기재된 바와 같이 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열을 포함하는 핵산을 포함하는 트랜스진을 포함한다. 일부 실시양태에서, 트랜스제닉 비-인간 동물의 게놈은 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 트랜스제닉 비-인간 동물은 유전적 변형에 대해 동형접합성이다. 일부 실시양태에서, 트랜스제닉 비-인간 동물은 유전적 변형에 대해 이형접합성이다. 일부 실시양태에서, 트랜스제닉 비-인간 동물은 척추동물, 예를 들어 어류 (예를 들어, 제브라 피쉬, 금붕어, 복어, 동굴 물고기 등), 양서류 (개구리, 도롱뇽 등), 조류 (예를 들어, 닭, 칠면조 등), 파충류 (예를 들어, 뱀, 도마뱀 등), 포유동물 (예를 들어, 유제류, 예를 들어 돼지, 소, 염소, 양 등; 토끼목 (예를 들어, 토끼); 설치류 (예를 들어, 래트, 마우스); 비인간 영장류 등) 등이다.
일부 실시양태에서, 핵산은 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열을 포함하는 외인성 핵산이다. 일부 실시양태에서, 외인성 핵산은 공지되지 않은 프로모터의 제어 하에 있을 수 있거나 (예를 들어, 작동가능하게 연결됨) (예를 들어, 핵산이 숙주 세포 게놈에 무작위로 통합되는 경우) 또는 공지된 프로모터의 제어 하에 있을 수 있다 (예를 들어, 작동가능하게 연결됨). 적합한 공지된 프로모터는 임의의 공지된 프로모터일 수 있으며 구성적으로 활성인 프로모터 (예를 들어, CMV 프로모터), 유도성 프로모터 (예를 들어, 열 충격 프로모터, 테트라시클린-조절된 프로모터, 스테로이드-조절된 프로모터, 금속-조절된 프로모터, 에스트로겐 수용체-조절된 프로모터 등), 공간적으로 제한된 및/또는 시간적으로 제한된 프로모터 (예를 들어, 조직 특이적 프로모터, 세포 유형 특이적 프로모터 등) 등을 포함한다.
숙주 세포 내로의 핵산 도입
일부 실시양태에서, 본 개시내용의 방법은 가이드 RNA를 코딩하는 뉴클레오티드 서열 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화 뉴클레오티드 서열을 포함하는 하나 이상의 핵산을 숙주 세포 (또는 숙주 세포 집단) 내로 도입하는 것을 수반한다. 일부 실시양태에서, 표적 DNA를 포함하는 세포는 시험관 내에 있다. 일부 실시양태에서, 표적 DNA를 포함하는 세포는 생체 내에 있다. 일부 실시양태에서, 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 뉴클레오티드 서열은 유도성 프로모터에 작동가능하게 연결된다. 일부 실시양태에서, 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 뉴클레오티드 서열은 구성적 프로모터에 작동가능하게 연결된다.
가이드 RNA, 또는 그를 코딩하는 뉴클레오티드 서열을 포함하는 핵산은 널리 공지된 다양한 방법 중 임의의 것에 의해 숙주 세포 내로 도입될 수 있다. 유사하게, 방법이 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 뉴클레오티드 서열을 포함하는 핵산을 숙주 세포 내로 도입하는 것을 수반하는 경우, 이러한 핵산은 널리 공지된 다양한 방법 중 임의의 것에 의해 숙주 세포 내로 도입될 수 있다. 가이드 폴리뉴클레오티드 (RNA 또는 DNA) 및/또는 B-GEn.1 또는 B-GEn.2 폴리뉴클레오티드 (RNA 또는 DNA)는 관련 기술분야에 공지된 바이러스 또는 비-바이러스 전달 비히클에 의해 전달될 수 있다.
숙주 세포 내로 핵산을 도입하는 방법은 관련 기술분야에 공지되어 있으며, 임의의 공지된 방법을 사용하여 핵산 (예를 들어, 발현 구축물)을 줄기 세포 또는 전구 세포 내로 도입할 수 있다. 적합한 방법은 엑소좀 전달을 포함하나 이에 제한되지는 않는, 예를 들어 바이러스 또는 박테리오파지 감염, 형질감염, 접합, 원형질체 융합, 리포펙션, 전기천공, 인산칼슘 침전, 폴리에틸렌이민 (PEI)-매개 형질감염, DEAE-덱스트란 매개 형질감염, 리포솜-매개 형질감염, 입자총 기술, 인산칼슘 침전, 직접 마이크로 주사, 나노입자-매개 핵산 전달 (예를 들어, 문헌 [Panyam et al., Adv Drug Deliv Rev. 2012 Sep 13. pii: 50169-409X(12)00283-9. doi: 10.1016/j.addr.2012.09.023] 참조) 등을 포함한다.
폴리뉴클레오티드는 나노입자, 리포솜, 리보핵단백질, 양전하를 띤 펩티드, 소분자 RNA-접합체, 압타머-RNA 키메라, 및 RNA-융합 단백질 복합체를 포함하나 이에 제한되지는 않는 비-바이러스 전달 비히클에 의해 전달될 수 있다. 일부 예시적인 비-바이러스 전달 비히클은 문헌 [Peer and Lieberman, Gene Therapy, 18: 1127-1133 (2011)] (다른 폴리뉴클레오티드의 전달에도 유용한 siRNA를 위한 비-바이러스 전달 비히클에 중점을 두고 있음)에 기재되어 있다.
유전자 편집을 위해 본 개시내용의 핵산 (예를 들어, mRNA 및 sgRNA)을 전달하기 위한 적합한 시스템 및 기술은 지질 나노입자 (LNP)를 포함한다. 본원에 사용된 바와 같은 용어 "지질 나노입자"는 그의 층상도, 모양 또는 구조와 관계없이 리포솜 및 핵산 및/또는 폴리펩티드를 세포 내로 도입하기 위해 기재된 바와 같은 리포플렉스를 포함한다. 이들 지질 나노입자는 생물학적으로 활성인 화합물 (예를 들어, 핵산 및/또는 폴리펩티드)과 복합체를 형성할 수 있으며 생체 내 전달 비히클로서 유용하다. 일반적으로, 관련 기술분야에 공지된 임의의 방법을 적용하여 본 개시내용의 하나 이상의 핵산을 포함하는 지질 나노입자를 제조하고 생물학적으로 활성인 화합물과 상기 지질 나노입자의 복합체를 제조할 수 있다. 그러한 방법의 예는, 예를 들어, 문헌 [Biochim Biophys Acta 1979, 557:9; Biochim et Biophys Acta 1980, 601:559; Liposomes: A practical approach (Oxford University Press, 1990); Pharmaceutica Acta Helvetiae 1995, 70:95; Current Science 1995, 68:715; Pakistan Journal of Pharmaceutical Sciences 1996, 19:65; Methods in Enzymology 2009, 464:343]에 널리 개시되어 있다. 본 개시내용의 하나 이상의 핵산 및/또는 폴리펩티드를 포함하는 LNP 제형을 제조하는데 특히 적합한 시스템 및 기술은 인텔리아(Intellia) (예를 들어, WO2017173054A1 참조), 알닐람(Alnylam) (예를 들어, WO2014008334A1 참조), 모더나TX(Modernatx) (예를 들어, WO2017070622A1 및 WO2017099823A1 참조), 트랜스레이트바이오(TranslateBio), 아쿠이타스(Acuitas) (예를 들어, WO2018081480A1 참조), 제네반트 사이언스(Genevant Sciences), 아르부투스 바이오파르마(Arbutus Biopharma), 테크미라 (Tekmira), 아크투루스(Arcturus), 머크(Merck) (예를 들어, WO2015130584A2 참조), 노바티스(Novartis) (예를 들어, WO2015095340A1 참조), 및 디세르나(Dicerna) (이들 모두는 그 전체 내용이 본원에 참조로 포함됨)에 의해 개발된 것을 포함하나 이에 제한되지는 않는다.
가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 뉴클레오티드 서열을 포함하는 적합한 핵산은 발현 벡터를 포함하며, 여기서 발현 벡터는 가이드를 코딩하는 뉴클레오티드 서열을 포함한다. 일부 실시양태에서, 발현 벡터는 바이러스 구축물, 예를 들어 재조합 아데노-연관 바이러스 구축물 (예를 들어, 미국 특허 번호 7,078,387 참조), 재조합 아데노바이러스 구축물, 재조합 렌티바이러스 구축물, 재조합 레트로바이러스 구축물 등이다. 적합한 발현 벡터는 바이러스 벡터 (예를 들어, 백시니아 바이러스; 폴리오바이러스; 아데노바이러스 (예를 들어, 문헌 [Li et al., Invest Opthalmol Vis Sci 35:2543 2549, 1994; Borras et al., Gene Ther 6:515 524, 1999; Li and Davidson, PNAS 92:7700 7704, 1995; Sakamoto et al., H Gene Ther 5:10881097, 1999]; WO 94/12649, WO 93/03769; WO 93/19191; WO 94/28938; WO 95/11984 및 WO 95/00655 참조); 아데노-연관 바이러스 (예를 들어, 문헌 [Ali et al., Hum Gene Ther 9:81 86,1998, Flannery et al., PNAS 94:6916 6921, 1997; Bennett et al., Invest Opthalmol Vis Sci 38:2857 2863, 1997; Jomary et al., Gene Ther 4:683-690, 1997, Rolling et al., Hum Gene Ther 10:641 648, 1999; Ali et al., Hum Mol Genet 5:591 594, 1996; Srivastava in WO 93/09239, Samulski et al., J. Vir. (1989) 63:3822-3828; Mendelson et al., Viral. (1988) 166:154-165; 및 Flotte et al., PNAS (1993) 90:10613-10617] 참조); SV40; 단순 포진 바이러스; 인간 면역결핍 바이러스 (예를 들어, 문헌 [Miyoshi et al., PNAS 94:10319 23, 1997; Takahashi et al., J Virol 73:7812 7816, 1999] 참조)에 기반한 바이러스 벡터; 레트로바이러스 벡터 (예를 들어, 뮤린 백혈병 바이러스, 비장 괴사 바이러스, 및 레트로바이러스, 예컨대 라우스 육종 바이러스, 하비 육종 바이러스, 조류 백혈병 바이러스, 렌티바이러스, 인간 면역결핍 바이러스, 골수증식성 육종 바이러스, 및 유방 종양 바이러스로부터 유래된 벡터) 등)을 포함하나 이에 제한되지는 않는다.
아데노 연관 바이러스 (
AAV
)
재조합 아데노-연관 바이러스 (AAV) 벡터를 전달에 사용할 수 있다. 관련 기술분야에서 rAAV 입자를 생산하는 것으로 공지된 기술은 2개의 AAV 역위 말단 반복부 (ITR) 사이에 전달될 폴리뉴클레오티드, AAV rep 및 cap 유전자 및 헬퍼 바이러스 기능을 세포에 제공하는 것이다. rAAV를 생산하려면 하기 구성요소가 단일 세포 (본원에서는 패키징 세포로서 표시됨) 내에 존재하는 것을 필요로 한다: 2개의 ITR 사이의 관심 폴리뉴클레오티드, AAV 게놈으로부터 분리된 (즉, AAV 게놈 내에 있지 않은) AAV rep 및 cap 유전자, 및 헬퍼 바이러스 기능. AAV rep 및 cap 유전자는 재조합 바이러스가 유래될 수 있는 임의의 AAV 혈청형으로부터 유래될 수 있고, AAV 혈청형 AAV-1, AAV-2, AAV-3, AAV-4, AAV-5, AAV-6, AAV-7, AAV-8, AAV-9, AAV-10, AAV-11, AAV-12, AAV-13 및 AAV rh.74를 포함하나 이에 제한되지는 않는, 패키징된 폴리뉴클레오티드 상의 ITR의 것과는 상이한 AAV 혈청형으로부터 유래될 수 있다. 위형화된 rAAV의 생산은, 예를 들어, WO 01/83692에 개시되어 있다.
패키징 세포를 생성하는 방법은 AAV 입자 생산에 필요한 모든 구성요소를 안정적으로 발현하는 세포주를 생성하는 것이다. 예를 들어, AAV ITR 사이의 관심 폴리뉴클레오티드, AAV 게놈으로부터 분리된 AAV rep 및 cap 유전자, 및 선택가능한 마커, 예컨대 네오마이신 내성 유전자를 포함하는 플라스미드 (또는 다중 플라스미드)가 세포의 게놈에 통합된다. AAV 게놈은 GC 테일링 (문헌 [Samulski et al., 1982, Proc. Natl. Acad. Sci. USA, 79:2077-2081]), 제한 엔도뉴클레아제 절단 부위를 함유하는 합성 링커의 부가 (문헌 [Laughlin et al., 1983, Gene, 23:65-73]) 또는 직접적인 평활 말단 라이게이션 (문헌 [Senapathy & Carter, 1984, J. Bioi. Chem., 259:4661-4666])과 같은 절차에 의해 박테리아 플라스미드 내로 도입되었다. 그런 다음 패키징 세포주를 헬퍼 바이러스, 예컨대 아데노바이러스에 감염시킨다. 이러한 방법의 이점은 세포를 선택할 수 있고 rAAV의 대규모 생산에 적합하다는 것이다. 적합한 방법의 다른 예는 rAAV 게놈 및/또는 rep 및 cap 유전자를 패키징 세포 내로 도입하기 위해 플라스미드보다는 아데노바이러스 또는 배큘로바이러스를 이용한다.
rAAV 생산의 일반 원칙은, 예를 들어, 문헌 [Carter, 1992, Current Opinions in Biotechnology, 1533-539; 및 Muzyczka, 1992, Curr. Topics in Microbial. and lmmunol., 158:97-129]에서 검토된다. 다양한 접근 방식은 문헌 [Ratschin et al., Mol. Cell. Biol. 4:2072 (1984); Hermonat et al., Proc. Natl. Acad. Sci. USA, 81:6466 (1984); Tratschin et al., Mol. Cell. Biol. 5:3251 (1985); Mclaughlin et al., J. Virol., 62:1963 (1988); 및 Lebkowski et al., 1988 Mol. Cell. Biol., 7:349 (1988). Samulski et al. (1989, J. Virol., 63:3822-3828); 미국 특허 번호 5,173,414; WO 95/13365 및 상응하는 미국 특허 번호 5,658.776; WO 95/13392; WO 96/17947; PCT/US98/18600; WO97/09441 (PCT/US96/14423); WO 97/08298 (PCT/US96/13872); WO 97/21825 (PCT/US96/20777); WO 97/06243 (PCT/FR96/01064); WO 99/11764; Perrin et al. (1995) Vaccine 13:1244-1250; Paul et al. (1993) Human Gene Therapy 4:609-615; Clark et al. (1996) Gene Therapy 3:1124-1132; 미국 특허 번호 5,786,211; 미국 특허 번호 5,871,982; 및 미국 특허 번호 6,258,595]에 기재되어 있다.
형질도입에 사용되는 AAV 벡터 혈청형은 표적 세포 유형에 따라 다르다. 예를 들어, 하기 예시적인 세포 유형은 특히, 표시된 AAV 혈청형에 의해 형질도입되는 것으로 공지되어 있다.
다수의 적합한 발현 벡터가 관련 기술분야의 통상의 기술자에게 공지되어 있으며, 다수가 상업적으로 이용가능하다. 하기 벡터가 예시로써 제공된다: 진핵 숙주 세포의 경우: pXT1, pSG5 [스트라타진(Stratagene)], pSVK3, pBPV, pMSG 및 pSVLSV40 (파마시아). 그러나, 숙주 세포와 양립가능한 한 임의의 다른 벡터도 사용될 수 있다.
활용되는 숙주/벡터 시스템에 따라, 구성적 및 유도성 프로모터, 전사 인핸서 요소, 전사 종결인자 등을 포함한, 다수의 적합한 전사 및 번역 제어 요소 중 임의의 것이 발현 벡터에 사용될 수 있다 (예를 들어, 문헌 [Bitter et al. (1987) Methods in Enzymology, 153:516-544] 참조).
일부 실시양태에서, 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 RNA로서 제공될 수 있다. 이러한 경우, 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 RNA는 직접적인 화학적 합성에 의해 생산될 수 있거나 가이드 RNA를 코딩하는 DNA로부터 시험관 내에서 전사될 수 있다. DNA 템플릿으로부터 RNA를 합성하는 방법은 관련 기술분야에 널리 공지되어 있다. 일부 실시양태에서, 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 RNA는 RNA 폴리머라제 효소 (예를 들어, T7 폴리머라제, T3 폴리머라제, SP6 폴리머라제 등)를 사용하여 시험관 내에서 합성될 것이다. 일단 합성되면, RNA는 표적 DNA와 직접적으로 접촉할 수 있거나 핵산을 세포 내로 도입하기 위한 널리 공지된 기술 (예를 들어, 마이크로주사, 전기천공, 형질감염 등) 중 임의의 것에 의해 세포 내로 도입될 수 있다.
가이드 RNA를 코딩하는 뉴클레오티드 (DNA 또는 RNA로서 도입됨) 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 뉴클레오티드 (DNA 또는 RNA로서 도입됨) 및/또는 공여자 폴리뉴클레오티드는 잘 개발된 형질감염 기술을 사용하여 세포에 제공될 수 있으며; 예를 들어, 문헌 [Angel and Yanik (2010) PLoS ONE 5(7): e 11756], 및 퀴아젠(Qiagen)으로부터의 상업적으로 입수가능한 트랜스메신저(TransMessenger®) 시약, 스템젠트(Stemgent)로부터의 스템펙트(Stemfect™) RNA 형질감염 키트, 및 밈스 바이오(Mims Bio)로부터의 트랜시트(TransiT®)-mRNA 형질감염 키트를 참조한다. 또한, 문헌 [Beumer et al. (2008) Efficient gene targeting in Drosophila by direct embryo injection with zinc-finger nucleases. PNAS 105(50):19821-19826]을 참조한다. 추가적으로 또는 대안적으로, 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 B-GEn.1 또는 B-GEn.2 융합 폴리펩티드 또는 그의 변이체를 코딩하는 핵산 및/또는 공여자 폴리뉴클레오티드가 DNA 벡터 상에 제공될 수 있다. 핵산을 표적 세포로 전달하는데 유용한 많은 벡터, 예를 들어, 플라스미드, 코스미드, 미니서클, 파지, 바이러스 등이 이용가능하다. 핵산(들)을 포함하는 벡터는 에피솜적으로, 예를 들어 플라스미드, 미니서클 DNA, 바이러스, 예컨대 시토메갈로바이러스, 아데노바이러스 등으로서 유지될 수 있거나, 또는 상동 재조합 또는 무작위 통합을 통해 표적 세포 게놈에 통합될 수 있다 (예를 들어, 레트로바이러스 유래 벡터, 예컨대 MMLV, HIV-1, ALV 등).
벡터는 세포에 직접적으로 제공될 수 있다. 다시 말해서, 세포는 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 B-GEn.1 또는 B-GEn.2 융합 폴리펩티드 또는 그의 변이체를 코딩하는 핵산 및/또는 공여자 폴리뉴클레오티드를 포함하는 벡터와 접촉되어, 벡터가 세포에 의해 흡수되도록 한다. 전기천공, 염화칼슘 형질감염, 마이크로주사 및 리포펙션을 포함한, 플라스미드인 핵산 벡터와 세포를 접촉시키는 방법은 관련 기술분야에 널리 공지되어 있다. 바이러스 벡터 전달을 위해, 세포는 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 B-GEn.1 또는 B-GEn.2 융합 폴리펩티드 또는 그의 변이체를 코딩하는 핵산 및/또는 공여자 폴리뉴클레오티드를 포함하는 바이러스 입자와 접촉된다. 레트로바이러스, 예를 들어 렌티바이러스가 본 개시내용의 방법에 특히 적합하다. 통상적으로 사용되는 레트로바이러스 벡터는 "결함"이 있으며, 예를 들어 생산적 감염에 필요로 하는 바이러스 단백질을 생산할 수 없다. 오히려, 벡터의 복제는 패키징 세포주에서의 성장을 필요로 한다. 관심 핵산을 포함하는 바이러스 입자를 생성하기 위해, 이러한 핵산을 포함하는 레트로바이러스 핵산은 패키징 세포주에 의해 바이러스 캡시드로 패키징된다. 상이한 패키징 세포주는 캡시드에 혼입될 상이한 외피 단백질 (에코트로픽, 양쪽성 또는 이종성)을 제공하며, 이러한 외피 단백질은 세포에 대한 바이러스 입자의 특이성을 결정한다 (뮤린 및 래트의 경우 에코트로픽; 인간, 개 및 마우스를 포함한 대부분의 포유동물 세포 유형의 경우 양쪽성; 및 뮤린 세포를 제외한 대부분의 포유동물 세포 유형의 경우 이종성). 적절한 패키징 세포주를 사용하여, 세포가 패키징된 바이러스 입자에 의해 표적화되도록 할 수 있다. 재프로그래밍 인자를 코딩하는 핵산을 포함하는 레트로바이러스 벡터를 패키징 세포주 내로 도입하고 패키징 세포주에 의해 생성되는 바이러스 입자를 수집하는 방법은 관련 기술분야에 널리 공지되어 있다. 핵산은 또한 직접 마이크로-주사 (예를 들어, 제브라피쉬 배아 내로의 RNA의 주사)을 통해 도입될 수 있다.
가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 B-GEn.1 또는 B-GEn.2 융합 폴리펩티드 또는 그의 변이체를 코딩하는 핵산 및/또는 공여자 폴리뉴클레오티드를 세포에 제공하는데 사용되는 벡터는 일반적으로 관심 핵산의 발현, 즉 전사 활성화를 구동시키는데 적합한 프로모터를 포함할 것이다. 다시 말해서, 관심 핵산은 프로모터에 작동가능하게 연결될 것이다. 이는 유비쿼터스 활성 프로모터, 예를 들어, CMV-13-액틴 프로모터, 또는 유도성 프로모터, 예컨대 특정한 세포 집단에서 활성이거나 약물, 예컨대 테트라시클린의 존재에 반응하는 프로모터를 포함할 수 있다. 전사 활성화에 의해, 전사가 적어도 10배, 적어도 100배, 보다 전형적으로 적어도 1000배만큼 표적 세포에서 기본 수준 이상으로 증가될 것으로 의도된다. 또한, 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 B-GEn.1 또는 B-GEn.2 융합 폴리펩티드 또는 그의 변이체 및/또는 공여자 폴리뉴클레오티드를 세포에 제공하기 위해 사용되는 벡터는 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 B-GEn.1 또는 B-GEn.2 융합 폴리펩티드 또는 그의 변이체 및/또는 공여자 폴리뉴클레오티드를 흡수한 세포를 확인하기 위해 표적 세포에서 선택가능한 마커를 코딩하는 핵산 서열을 포함할 수 있다.
가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 B-GEn.1 또는 B-GEn.2 융합 폴리펩티드 또는 그의 변이체는 대신, DNA와 접촉하는데 사용되거나 RNA로서 세포 내로 도입될 수 있다. RNA를 세포 내로 도입하는 방법은 관련 기술분야에 공지되어 있으며, 예를 들어 직접 주사, 형질감염, 또는 DNA 도입에 사용되는 임의의 다른 방법을 포함할 수 있다. B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 대신, 폴리펩티드로서 세포에 제공될 수 있다. 이러한 폴리펩티드는 임의로 산물의 용해도를 증가시키는 폴리펩티드 도메인과 융합될 수 있다. 도메인은 규정된 프로테아제 절단 부위, 예를 들어 TEV 프로테아제에 의해 절단되는 TEV 서열을 통해 폴리펩티드에 연결될 수 있다. 링커는 또한 하나 이상의 가요성 서열, 예를 들어 1 내지 10개의 글리신 잔기를 포함할 수 있다. 일부 실시양태에서, 융합 단백질의 절단은 산물의 용해도를 유지하는 완충액에서, 예를 들어 0.5 내지 2 M 우레아의 존재 하에, 용해도를 증가시키는 폴리펩티드 및/또는 폴리뉴클레오티드 등의 존재 하에 수행된다. 관심 도메인은 엔도솜분해 도메인, 예를 들어 인플루엔자 HA 도메인; 및 생산을 돕는 다른 폴리펩티드, 예를 들어 IF2 도메인, GST 도메인, GRPE 도메인 등을 포함한다. 폴리펩티드는 개선된 안정성을 위해 제형화될 수 있다. 예를 들어, 펩티드는 PEG화될 수 있으며, 여기서 폴리에틸렌옥시 기는 혈류 내 향상된 수명을 제공한다.
부가적으로 또는 대안적으로, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 폴리펩티드 침투성 도메인과 융합되어 세포에 의한 흡수를 촉진할 수 있다. 다수의 침투성 도메인이 관련 기술분야에 공지되어 있고, 펩티드, 펩티드 모방체 및 비-펩티드 운반체를 비롯한 본 개시내용의 비-통합 폴리펩티드에 사용될 수 있다. 예를 들어, 침투성 펩티드는 아미노산 서열 RQIKIWFQNRRMKWKK (이러한 서열은 본 특허 출원 하의 개시내용이 아님)을 포함하는, 페네트라틴으로서 지칭되는 드로소필라 멜라노가스테르(Drosophila melanogaster) 전사 인자 안테나피디아(Antennapaedia)의 세 번째 알파 나선으로부터 유래될 수 있다. 또 다른 예로서, 침투성 펩티드는 HIV-1 tat 염기성 영역 아미노산 서열을 포함하며, 이는 예를 들어 자연적으로 발생하는 tat 단백질의 아미노산 49-57을 포함할 수 있다.
다른 침투성 도메인은 폴리-아르기닌 모티프, 예를 들어 HIV-1 rev 단백질의 아미노산 34-56의 영역, 노나-아르기닌, 액타-아르기닌 등을 포함한다 (예를 들어, 문헌 [Futaki et al. (2003) Curr Protein Pept Sci. 2003 Apr; 4(2): 87-9 and 446; 및 Wender et al. (2000) Proc. Natl. Acad. Sci. U.S.A. 2000 Nov. 21; 97(24):13003-8]; 공개된 미국 특허 출원 공개 번호 20030220334; 20030083256; 20030032593; 및 20030022831 참조; 이들 문헌은 전위 펩티드 및 펩토이드의 교시를 위해 본원에 참조로 구체적으로 포함됨). 노나-아르기닌 (R9) 서열은 특징규명된 보다 효율적인 PTD 중 하나이다 (Wender et al. 2000; Uemura et al. 2002). 융합이 이루어지는 부위는 폴리펩티드의 생물학적 활성, 분비 또는 결합 특징을 최적화하기 위해 선택될 수 있다. 최적의 위치는 일상적인 실험을 통해 결정될 수 있다. 일부 실시양태에서, 폴리펩티드 침투성 도메인은 PTD의 생체이용률을 증가시키기 위해 화학적으로 변형된다. 예시적인 변형은 문헌 [Expert Opin Drug Deliv. 2009 Nov;6(11):1195-205]에 개시된다.
일반적으로, 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 공여자 폴리뉴클레오티드의 유효량이 표적 DNA 또는 세포에 제공되어 표적화된 변형을 유도한다. 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 공여자 폴리뉴클레오티드의 유효량은 음성 대조군, 예를 들어 빈 벡터 또는 관련 없는 폴리펩티드와 접촉된 세포에 비해 gRNA로 관찰된 표적화된 변형의 양에 있어서 2배 이상의 증가를 유도하는 양이다. 즉, 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 공여자 폴리뉴클레오티드의 유효량 또는 용량은 표적 DNA 영역에서 관찰되는 표적 변형의 양에 있어서의 2배 증가, 3배 증가, 4배 증가 또는 그 초과의 증가를 유도할 것이며, 일부 실시양태에서는 관찰된 재조합 양에 있어서의 5배 증가, 6배 증가 또는 그 초과의 증가, 때때로 7배 또는 8배 또는 그 초과의 증가, 예를 들어 10배, 50배 또는 100배 또는 그 초과의 증가, 일부 실시양태에서는 관찰된 재조합 양에 있어서의 200배, 500배, 700배 또는 1000배 또는 그 초과의 증가, 예를 들어 5000배 또는 10,000배의 증가를 유도할 것이다. 표적 변형의 양은 임의의 적합한 방법에 의해 측정될 수 있다. 예를 들어, 재조합될 때 활성 리포터를 코딩하는 핵산을 재구성하게 되는, 상동 서열에 의해 플랭킹된 가이드 RNA의 스페이서에 대한 상보적 서열을 포함하는 분할 리포터 구축물은 세포 내로 공동 형질감염될 수 있으며, 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 공여자 폴리뉴클레오티드와 접촉한 후, 예를 들어 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 공여자 폴리뉴클레오티드와 접촉한 지 2시간, 4시간, 8시간, 12시간, 24시간, 36시간, 48시간, 72시간 또는 그 초과 후에 리포터 단백질의 양을 평가한다. 또 다른 보다 감수성 검정으로서, 예를 들어, 표적 DNA 서열을 포함하는 관심 게놈 DNA 영역에서의 재조합 정도는 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 공여자 폴리뉴클레오티드와 접촉한 후, 예를 들어 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 공여자 폴리뉴클레오티드와 접촉한 지 2시간, 4시간, 8시간, 12시간, 24시간, 36시간, 48시간, 72시간 또는 그 초과 후에 상기 영역의 PCR 또는 서던 혼성화에 의해 평가될 수 있다.
세포를 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 공여자 폴리뉴클레오티드와 접촉시키는 것은 세포의 생존을 촉진시키는 임의의 배양 배지 및 임의의 배양 조건 하에서 발생할 수 있다. 예를 들어, 세포는 적합한 임의의 적절한 영양 배지, 예컨대 송아지 태아 혈청 또는 열 불활성화 소 태아 혈청 (약 5-10%), L-글루타민, 티올, 특히 2-메르캅토에탄올, 및 항생제, 예를 들어 페니실린 및 스트렙토마이신이 보충된 이스코브의 변형된 DMEM 또는 RPMI1640에 현탁될 수 있다. 배양물은 세포가 반응하는 성장 인자를 함유할 수 있다. 본원에 정의된 바와 같은 성장 인자는 막횡단 수용체에 대한 특이적 효과를 통해, 배양물 또는 무손상 조직에서 세포의 생존, 성장 및/또는 분화를 촉진시킬 수 있는 분자이다. 성장 인자는 폴리펩티드및 비-폴리펩티드 인자를 포함한다. 세포의 생존을 촉진시키는 조건은 일반적으로 비상동 말단 연결 및 상동성-지시된 복구를 허용한다. 폴리뉴클레오티드 서열을 표적 DNA 서열에 삽입하는 것이 바람직한 적용에서는, 삽입될 공여자 서열을 포함하는 폴리뉴클레오티드가 또한 세포에 제공된다. "공여자 서열" 또는 "공여자 폴리뉴클레오티드"는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체에 의해 유도된 절단 부위에 삽입되는 핵산 서열을 의미한다. 공여자 폴리뉴클레오티드는 절단 부위의 플랭킹 게놈 영역과 충분한 서열 상동성을 함유할 것이며, 예를 들어 절단 부위를 플랭킹하는, 예를 들어 절단 부위의 약 50개 이하의 염기 이내, 예를 들어 약 30개 염기 이내, 약 15개 염기 이내, 약 10개 염기 이내, 약 5개 염기 이내, 또는 절단 부위를 바로 플랭킹하는 뉴클레오티드 서열과 70%, 80%, 85%, 90%, 95% 또는 100% 서열 동일성을 함유하여, 그와 상동성을 보유하는 게놈 서열 간의 상동성-지시된 복구를 지원한다. 공여자와 게놈 서열 간의 상동 서열의 대략 25, 50, 100 또는 200개 뉴클레오티드, 또는 200개 초과의 뉴클레오티드 (또는 10개 내지 200개, 또는 그 초과의 뉴클레오티드 사이의 임의의 정수 값)가 상동성-지시된 복구를 지원할 것이다. 공여자 서열은 임의의 길이, 예를 들어 10개 이상의 뉴클레오티드, 50개 이상의 뉴클레오티드, 100개 이상의 뉴클레오티드, 250개 이상의 뉴클레오티드, 500개 이상의 뉴클레오티드, 1000개 이상의 뉴클레오티드, 5000개 이상의 뉴클레오티드 등일 수 있다.
공여자 서열은 일반적으로, 대체되는 게놈 서열과 동일하지 않다. 오히려, 상동성-지시된 복구를 지원하기에 충분한 서열 동일성이 존재하는 한, 공여자 서열은 게놈 서열과 관련하여 적어도 하나 이상의 단일 염기 치환, 삽입, 결실, 역전 또는 재배열을 함유할 수 있다. 일부 실시양태에서, 공여자 서열은 표적 DNA 영역과 상동인 2개의 영역에 의해 플랭킹된 비-상동 서열 (상동성 아암으로서 지칭되기도 함)을 포함하여, 표적 DNA 영역과 2개의 플랭킹 상동성 아암 간의 상동성-지시된 복구로 인해 표적 영역에 비-상동 서열이 삽입된다. 공여자 서열은 또한 관심 DNA 영역과 상동이 아니고 관심 DNA 영역에 삽입되도록 의도되지 않은 서열을 함유하는 벡터 백본을 포함할 수 있다. 일반적으로, 공여자 서열의 상동 영역(들)은 재조합이 요망되는 게놈 서열과 적어도 50%의 서열 동일성을 가질 것이다. 특정 실시양태에서, 60%, 70%, 80%, 90%, 95%, 98%, 99% 또는 99.9%의 서열 동일성이 존재한다. 공여자 폴리뉴클레오티드의 길이에 따라, 1% 내지 100%의 서열 동일성 사이의 임의의 값이 존재할 수 있다. 공여자 서열은 게놈 서열과 비교 시 특정 서열 차이, 예를 들어 제한 부위, 뉴클레오티드 다형성, 선택가능한 마커 (예를 들어, 약물 내성 유전자, 형광 단백질, 효소 등) 등을 포함할 수 있으며, 이는 절단 부위에서 공여자 서열의 성공적인 삽입을 평가하는데 사용될 수 있거나 일부 경우에는 다른 목적으로 사용될 수 있다 (예를 들어, 표적화된 게놈 로커스에서의 발현을 나타내기 위함). 일부 실시양태에서, 코딩 영역에 위치하는 경우, 이러한 뉴클레오티드 서열 차이는 아미노산 서열을 변화시키지 않거나 단백질의 구조 또는 기능에 실질적으로 영향을 미치지 않는 아미노산 변화를 만들 것이다. 대안적으로, 이들 서열 차이는 마커 서열의 제거를 위해 나중에 활성화될 수 있는 플랭킹 재조합 서열, 예컨대 FLP, loxP 서열 등을 포함할 수 있다.
공여자 서열은 단일 가닥 DNA, 단일 가닥 RNA, 이중 가닥 DNA 또는 이중 가닥 RNA로서 세포에 제공될 수 있다. 선형 또는 원형 형태로 세포 내로 도입될 수 있다. 선형 형태로 도입되는 경우, 공여자 서열의 말단은 관련 기술분야의 통상의 기술자에게 공지된 방법에 의해 (예를 들어, 엑소뉴클레오리틱 분해로부터) 보호될 수 있다. 예를 들어, 하나 이상의 디데옥시뉴클레오티드 잔기가 선형 분자의 3' 말단에 부가되고/거나 자기 상보적 올리고뉴클레오티드가 한쪽 또는 양쪽 끝에 라이게이션된다. 예를 들어, 문헌 [Chang et al. (1987) Proc. Natl. Acad. Sci. USA 84:4959-4963; Nehls et al. (1996) Science 272:886-889]을 참조한다. 외인성 폴리뉴클레오티드를 분해로부터 보호하기 위한 부가의 방법은 말단 아미노기(들)의 부가 및 변형된 뉴클레오티드간 연결, 예컨대 예를 들어 포스포로티오에이트, 포스포르아미데이트 및 O-메틸 리보스 또는 데옥시리보스 잔기의 사용을 포함하나 이에 제한되지는 않는다. 선형 공여자 서열의 말단을 보호하는 것에 대한 대안으로서, 재조합에 영향을 주지 않고 분해될 수 있는 상동성 아암 외부에 부가 길이의 서열이 포함될 수 있다. 공여자 서열은 부가의 서열, 예컨대 예를 들어 복제 기점, 프로모터 및 항생제 내성을 코딩하는 유전자를 갖는 벡터 분자의 일부로서 세포 내로 도입될 수 있다. 더욱이, 공여자 서열은 네이키드 (예를 들어, 비변형된) 핵산으로서 도입될 수 있거나, 리포솜 또는 폴록사머와 같은 작용제와 복합체를 형성한 핵산으로서 도입될 수 있거나, 또는 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 핵산 및/또는 공여자 폴리뉴클레오티드에 대해 상기 기재된 바와 같이, 바이러스 (예를 들어, 아데노바이러스, AAV)에 의해 전달될 수 있다.
상기 기재된 방법에 따라, 관심 DNA 영역을 생체 외에서 절단 및 변형, 예를 들어 "유전적으로 변형"시킬 수 있다. 일부 실시양태에서, 선택가능한 마커가 관심 DNA 영역에 삽입된 경우와 같이, 유전적으로 변형된 세포를 나머지 집단으로부터 분리함으로써 세포 집단에 유전적 변형을 포함하는 세포가 강화될 수 있다. 강화시키기 전에, "유전적으로 변형된" 세포는 세포 집단의 약 1% 이상 (예를 들어, 2% 이상, 3% 이상, 4% 이상, 5% 이상, 6% 이상, 7% 이상, 8% 이상, 9% 이상, 10% 이상, 15% 이상, 또는 20% 이상)만을 구성할 수 있다. "유전적으로 변형된" 세포의 분리는 사용된 선택가능한 마커에 적절한 임의의 적합한 분리 기술에 의해 달성될 수 있다. 예를 들어, 형광 마커가 삽입된 경우, 세포는 형광 활성화 세포 분류를 통해 분리될 수 있는 반면, 세포 표면 마커가 삽입된 경우, 세포는 친화성 분리 기술, 예를 들어 자성 분리, 친화성 크로마토그래피, 고체 매트릭스에 부착된 친화성 시약을 사용한 "패닝", 또는 기타 적합한 기술에 의해 이종 집단으로부터 분리될 수 있다. 정확한 분리를 제공하는 기술은 다양한 수준의 정교함을 가질 수 있는 형광 활성화 세포 분류기, 예컨대 다중 색상 채널, 낮은 각도 및 둔한 광 산란 검출 채널, 임피던스 채널 등을 포함한다. 죽은 세포와 연관된 염료 (예를 들어, 아이오딘화프로피듐)를 이용하여 죽은 세포에 대항하여 세포를 선택할 수 있다. 유전적으로 변형된 세포의 생육력에 지나치게 해를 끼치지 않는 임의의 기술이 이용될 수 있다. 변형된 DNA를 포함하는 세포가 고도로 강화된 세포 조성물은 이러한 방식으로 달성된다. "고도로 강화된"이란 유전적으로 변형된 세포가 세포 조성물의 70% 이상, 75% 이상, 80% 이상, 85% 이상, 90% 이상, 예를 들어 세포 조성물의 약 95% 이상 또는 98% 이상일 것임을 의미한다. 다시 말해서, 조성물은 유전적으로 변형된 세포의 실질적으로 순수한 조성물일 수 있다.
본원에 기재된 방법에 의해 생산된 유전적으로 변형된 세포는 즉시 사용될 수 있다. 추가적으로 또는 대안적으로, 세포는 액체 질소 온도에서 동결되어 장기간 동안 저장되고, 해동되어 재사용될 수 있다. 그러한 경우, 세포는 일반적으로 10% 디메틸술폭시드 (DMSO), 50% 혈청, 40% 완충 배지, 또는 그러한 동결 온도에서 세포를 보존하기 위해 관련 기술분야에서 흔히 사용되는 바와 같은 일부 다른 용액에서 동결될 것이며, 동결된 배양 세포를 해동하기 위해 관련 기술분야에서 통상적으로 공지된 바와 같은 방식으로 해동된다.
유전적으로 변형된 세포는 다양한 배양 조건 하에 시험관 내에서 배양될 수 있다. 세포는 배양을 통해 확장될 수 있으며, 예를 들어 증식을 촉진시키는 조건 하에서 성장할 수 있다. 배양 배지는, 예를 들어, 한천, 메틸셀룰로스 등을 함유하는 액체 또는 반고체일 수 있다. 세포 집단은 정상적으로 송아지 태아 혈청 (약 5-10%), L-글루타민, 티올, 특히 2-메르캅토에탄올, 및 항생제, 예를 들어 페니실린과 스트렙토마이신이 보충된 적절한 영양 배지, 예컨대 이스코브의 변형된 DMEM 또는 RPMI 1640에 현탁될 수 있다. 배양물은 각각의 세포가 반응하는 성장 인자를 함유할 수 있다. 본원에 정의된 바와 같은 성장 인자는 막횡단 수용체에 대한 특이적 효과를 통해, 배양물 또는 무손상 조직에서 세포의 생존, 성장 및/또는 분화를 촉진시킬 수 있는 분자이다. 성장 인자는 폴리펩티드 및 비-폴리펩티드 인자를 포함한다. 이러한 방식으로 유전적으로 변형된 세포는, 예를 들어 질환을 치료하기 위한 유전자 요법 등의 목적을 위해, 또는 항바이러스제, 항병원성제 또는 항암 치료제로서, 농업에서 유전적으로 변형된 유기체의 생산을 위해, 또는 생물학적 연구를 위해 대상체에게 이식될 수 있다. 대상체는 신생아, 청소년 또는 성인일 수 있다. 특히 흥미로운 것은 포유동물 대상체이다. 본 방법으로 치료될 수 있는 포유동물 종은 개 및 고양이; 말; 소; 양 등과 영장류, 특히 인간을 포함한다. 동물 모델, 특히 작은 포유동물 (예를 들어, 마우스, 래트, 기니피그, 햄스터, 토끼목 (예를 들어, 토끼) 등)을 실험 조사에 사용할 수 있다.
세포는, 예를 들어, 이식되는 조직에서의 성장 및/또는 조직을 지원하기 위해 단독으로 또는 적합한 기질 또는 매트릭스와 함께 대상체에게 제공될 수 있다. 일반적으로, 적어도 1x103개 세포, 예를 들어 5x103개 세포, 1x104개 세포, 5x104개 세포, 1x105개 세포, 1x106개 세포 또는 그 초과의 세포가 투여될 것이다. 세포는 하기 경로: 비경구, 피하, 정맥내, 두개내, 척수내, 안구내 또는 척수액내 중 임의의 경로를 통해 대상체에게 도입될 수 있다. 세포는 주사, 카테터 등에 의해 도입될 수 있다. 국소 전달, 즉 손상 부위로의 전달 방법의 예는, 예를 들어 옴마야(Ommaya) 저장소를 통해, 예를 들어 척수강내 전달 (예를 들어, 본원에 참조로 포함된 미국 특허 번호 5,222,982 및 5,385,582 참조); 예를 들어 주사기에 의해, 예를 들어 관절 내로의 볼루스 주사에 의해; 연속 주입에 의해, 예를 들어 대류를 이용한 캐뉼라 삽입에 의해 (예를 들어, 본원에 참조로 포함된 미국 출원 번호 20070254842 참조); 또는 세포가 가역적으로 부착된 장치를 체내 이식하는 것 (예를 들어, 본원에 참조로 포함된 미국 출원 번호 20080081064 및 20090196903 참조)을 포함한다. 트랜스제닉 동물 (예를 들어, 트랜스제닉 마우스)을 생성할 목적으로 세포를 배아 (예를 들어, 배반포) 내로 도입할 수도 있다.
일부 실시양태에서, 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 뉴클레오티드 서열은 제어 요소, 예를 들어 전사 제어 요소, 예컨대 프로모터에 작동가능하게 연결된다. 전사 제어 요소는 일반적으로 진핵 세포, 예컨대 포유동물 세포 (예를 들어, 인간 세포); 또는 원핵 세포 (예를 들어, 박테리아 또는 고세균 세포)에서 기능적이다. 일부 실시양태에서, 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 뉴클레오티드 서열은 원핵 세포 및 진핵 세포 둘 다에서 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 뉴클레오티드 서열의 발현을 허용하는 다중 제어 요소에 작동가능하게 연결된다.
프로모터는 구성적으로 활성인 프로모터 (예를 들어, 구성적으로 활성 "온" 상태인 프로모터)일 수 있고, 이는 유도성 프로모터 (예를 들어, 활성/"온" 또는 불활성/"오프" 상태가 외부 자극, 예를 들어 특정한 온도, 화합물 또는 단백질의 존재에 의해 제어되는 프로모터)일 수 있으며, 이는 공간적으로 제한된 프로모터 (예를 들어, 전사 제어 요소, 인핸서 등) (예를 들어, 조직 특이적 프로모터, 세포 유형 특이적 프로모터 등)일 수 있고, 이는 시간적으로 제한된 프로모터 (예를 들어, 프로모터는 배아 발생의 특이적 단계 동안 또는 생물학적 프로세스의 특이적 단계, 예를 들어 마우스의 모낭 주기 동안 "온" 상태 또는 "오프" 상태에 있음)일 수 있다.
적합한 프로모터는 바이러스로부터 유래될 수 있으므로 바이러스 프로모터로서 지칭될 수 있거나, 원핵 또는 진핵 유기체를 포함한 임의의 유기체로부터 유래될 수 있다. 적합한 프로모터를 사용하여 임의의 RNA 폴리머라제 (예를 들어, pol I, pol II, pol III)에 의한 발현을 구동할 수 있다. 예시적인 프로모터는 SV40 초기 프로모터, 마우스 유방 종양 바이러스 긴 말단 반복부 (LTR) 프로모터; 아데노바이러스 주요 후기 프로모터 (Ad MLP); 단순 포진 바이러스 (HSV) 프로모터, 시토메갈로바이러스 (CMV) 프로모터, 예컨대 CMV 즉시 초기 프로모터 영역 (CMVIE), 라우스 육종 바이러스 (RSV) 프로모터, 인간 U6 소형 핵 프로모터 (U6) (문헌 [Miyagishi et al., Nature Biotechnology 20, 497-500 (2002)]), 향상된 U6 프로모터 (예를 들어, 문헌 [Xia et al., Nucleic Acids Res. 2003 Sep 1;31(17)]), 인간 H1 프로모터 (H1) 등을 포함하나 이에 제한되지는 않는다.
유도성 프로모터의 예는 T7 RNA 폴리머라제 프로모터, T3 RNA 폴리머라제 프로모터, 이소프로필-베타-D-티오갈락토피라노시드 (IPTG)-조절된 프로모터, 락토스 유도된 프로모터, 열 충격 프로모터, 테트라시클린-조절된 프로모터 (예를 들어, Tet-ON, Tet-OFF 등), 스테로이드-조절된 프로모터, 금속-조절된 프로모터, 에스트로겐 수용체-조절된 프로모터 등을 포함하나 이에 제한되지는 않는다. 따라서 유도성 프로모터는 독시시클린; RNA 폴리머라제, 예를 들어 T7 RNA 폴리머라제; 에스트로겐 수용체; 에스트로겐 수용체 융합 등을 포함하나 이에 제한되지는 않는 분자에 의해 조절될 수 있다.
일부 실시양태에서, 프로모터는 다세포 유기체에서 프로모터가 특이적 세포의 서브세트에서 활성 (예를 들어, "온")이 되도록 공간적으로 제한된 프로모터 (예를 들어, 세포 유형 특이적 프로모터, 조직 특이적 프로모터 등)이다. 공간적으로 제한된 프로모터는 인핸서, 전사 제어 요소, 제어 서열 등으로서 지칭될 수도 있다. 임의의 적합한 공간적으로 제한된 프로모터가 사용될 수 있으며 적합한 프로모터 (예를 들어, 뇌 특이적 프로모터, 뉴런의 서브세트에서의 발현을 구동시키는 프로모터, 생식계열에서의 발현을 구동시키는 프로모터, 폐에서의 발현을 구동시키는 프로모터, 근육에서의 발현을 구동시키는 프로모터, 췌장의 섬 세포에서의 발현을 구동시키는 프로모터 등)의 선택은 유기체에 따라 달라질 것이다. 예를 들어, 식물, 파리, 벌레, 포유동물, 마우스 등에 대한 다양한 공간적으로 제한된 프로모터가 공지되어 있다. 따라서, 공간적으로 제한된 프로모터를 사용하여 유기체에 따라 매우 다양한 상이한 조직 및 세포 유형에서 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 핵산의 발현을 조절할 수 있다. 일부 공간적으로 제한된 프로모터는 배아 발생의 특이적 단계 동안 또는 생물학적 프로세스의 특이적 단계 (예를 들어, 마우스의 모낭 주기) 동안 프로모터가 "온" 상태 또는 "오프" 상태에 있도록 시간적으로 제한된다.
예시 목적으로, 공간적으로 제한된 프로모터의 예는 뉴런-특이적 프로모터, 지방세포-특이적 프로모터, 심근세포-특이적 프로모터, 평활근-특이적 프로모터, 광수용체-특이적 프로모터 등을 포함하나 이에 제한되지는 않는다. 뉴런-특이적 공간적으로 제한된 프로모터는 뉴런-특이적 엔올라제 (NSE) 프로모터 (예를 들어, EMBL HSEN02, X51956 참조); 방향족 아미노산 데카르복실라제 (AADC) 프로모터; 신경필라멘트 프로모터 (예를 들어, 진뱅크 HUMNFL, L04147 참조); 시냅신 프로모터 (예를 들어, 진뱅크 HUMSYNIB, M55301 참조); thy-1 프로모터 (예를 들어, 문헌 [Chen et al. (1987) Cell 51:7-19; 및 Llewellyn, et al. (2010) Nat. Med. 16(10):1161-1166] 참조); 세로토닌 수용체 프로모터 (예를 들어, 진뱅크 S62283 참조); 티로신 히드록실라제 프로모터 (TH) (예를 들어, 문헌 [Oh et al. (2009) Gene Ther 16:437; Sasaoka et al. (1992) Mol. Brain Res. 16:274; Boundy et al. (1998) J. Neurosci. 18:9989; 및 Kaneda et al. (1991) Neuron 6:583-594] 참조); GnRH 프로모터 (예를 들어, 문헌 [Radovick et al. (1991) Proc. Natl. Acad. Sci. USA 88:3402-3406] 참조); L7 프로모터 (예를 들어, 문헌 [Oberdick et al.(1990) Science 248:223-226] 참조); DNMT 프로모터 (예를 들어, 문헌 [Bartge et al. (1988) Proc. Natl. Acad. Sci. USA 85:3648-3652] 참조); 엔케팔린 프로모터 (예를 들어, 문헌 [Comb et al. (1988) EMBO J. 17:3793-3805] 참조); 미엘린 염기성 단백질 (MBP) 프로모터; Ca2+-칼모듈린-의존성 단백질 키나제 11-알파 (CamKIIa) 프로모터 (예를 들어, 문헌 [Mayford et al. (1996) Proc. Natl. Acad. Sci. USA 93:13250; 및 Casanova et al. (2001) Genesis 31:37] 참조); CMV 인핸서/혈소판 유래 성장 인자-p 프로모터 (예를 들어, 문헌 [Liu et al. (2004) Gene Therapy 11:52-60] 참조) 등을 포함하나 이에 제한되지는 않는다.
지방세포-특이적 공간적으로 제한된 프로모터는 aP2 유전자 프로모터/인핸서, 예를 들어 인간 aP2 유전자의 -5.4 kb 내지 +21 bp의 영역 (예를 들어, 문헌 [Tozzo et al. (1997) Endocrinol. 138:1604; Ross et al. (1990) Proc. Natl. Acad. Sci. USA 87:9590; 및 Pavjani et al. (2005) Nat. Med. 11:797] 참조); 글루코스 수송체-4 (GLUT4) 프로모터 (예를 들어, 문헌 [Knight et al. (2003) Proc. Natl. Acad. Sci. USA 100:14725] 참조); 지방산 트랜스로카제 (FAT/CD36) 프로모터 (예를 들어, 문헌 [Kuriki et al. (2002) Biol. Pharm. Bull. 25:1476; 및 Sato et al. (2002) J. Biol. Chem. 277:15703] 참조); 스테아로일-CoA 불포화효소-1 (SCD1) 프로모터 (문헌 [Taboret al. (1999) J. Biol. Chem. 274:20603]); 렙틴 프로모터 (예를 들어, 문헌 [Mason et al. (1998) Endocrinol. 139:1013; 및 Chen et al. (1999) Biochem. Biophys. Res. Comm. 262:187] 참조); 아디포넥틴 프로모터 (예를 들어, 문헌 [Kita et al. (2005) Biochem. Biophys. Res. Comm. 331:484; 및 Chakrabarti (2010) Endocrinol. 151:2408] 참조); 아디프신 프로모터 (예를 들어, 문헌 [Platt et al. (1989) Proc. Natl. Acad. Sci. USA 86:7490] 참조); 레지스틴 프로모터 (예를 들어, 문헌 [Seo et al. (2003) Malec. Endocrinol. 17:1522] 참조) 등을 포함하나 이에 제한되지는 않는다.
심근세포-특이적 공간적으로 제한된 프로모터는 하기 유전자로부터 유래된 제어 서열을 포함하나 그에 제한되지는 않는다: 미오신 경쇄-2, a-미오신 중쇄, AE3, 심장 트로포닌 C, 심장 액틴 등 (문헌 [Franz et al. (1997) Cardiovasc. Res. 35:560-566; Robbins et al. (1995) Ann. N.Y. Acad. Sci. 752:492-505; Linn et al. (1995) Circ. Res. 76:584591; Parmacek et al. (1994) Mol. Cell. Biol. 14:1870-1885; Hunter et al. (1993) Hypertension 22:608-617; 및 Sartorelli et al. (1992) Proc. Natl. Acad. Sci. USA 89:4047-4051]).
평활근-특이적 공간적으로 제한된 프로모터는 SM22a 프로모터 (예를 들어, 문헌 [Akyilrek et al. (2000) Mol. Med. 6:983]; 및 미국 특허 번호 7,169,874 참조); 스무델린 프로모터 (예를 들어, WO 2001/018048 참조); α-평활근 액틴 프로모터 등을 포함하나 이에 제한되지는 않는다. 예를 들어, 그 내부에 2개의 CArG 요소가 있는 SM22a 프로모터의 0.4 kb 영역은 혈관 평활근 세포-특이적 발현을 매개하는 것으로 나타났다 (예를 들어, 문헌 [Kim, et al. (1997) Mol. Cell. Biol. 17, 2266-2278; Li, et al., (1996) J. Cell Biol. 132, 849-859; 및 Moessler, et al. (1996) Development 122, 2415-2425] 참조).
광수용체-특이적 공간적으로 제한된 프로모터는 로돕신 프로모터; 로돕신 키나제 프로모터 (문헌 [Young et al. (2003) Ophthalmol. Vis. Sci. 44:4076]); 베타 포스포디에스테라제 유전자 프로모터 (문헌 [Nicoud et al. (2007) J. Gene Med. 9:1015]); 색소성 망막염 유전자 프로모터 (상기 문헌 [Nicoud et al. (2007)] 참조); 광수용체간 레티노이드-결합 단백질 (IRBP) 유전자 인핸서 (상기 문헌 [Nicoud et al. (2007)] 참조); IRBP 유전자 프로모터 (문헌 [Yokoyama et al. (1992) Exp Eye Res. 55:225]) 등을 포함하나 이에 제한되지는 않는다.
가이드 RNA를 포함하는 조성물
일부 실시양태에서, 본원에는 가이드 RNA를 포함하는 조성물이 제공된다. 조성물은 가이드 RNA 외에, 하기 중 하나 이상을 포함할 수 있다: 염, 예를 들어 NaCl, MgCl2, KCl, MgSO4 등; 완충제, 예를 들어 트리스 완충액, N-(2-히드록시에틸)피페라진-N'-(2-에탄술폰산) (HEPES), 2-(N-모르폴리노)에탄술폰산 (MES), MES 나트륨 염, 3-(N-모르폴리노)프로판술폰산 (MOPS), N-트리스[히드록시메틸]메틸-3-아미노프로판술폰산 (TAPS) 등; 가용화제; 세제, 예를 들어 비-이온성 세제, 예컨대 Tween-20 등; 뉴클레아제 억제제 등. 예를 들어, 일부 실시양태에서, 조성물은 가이드 RNA 및 핵산을 안정화시키기 위한 완충제를 포함한다.
일부 실시양태에서, 조성물에 존재하는 가이드 RNA는 순수하며, 예를 들어 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 99% 초과하여 순수하며, 여기서 "% 순도"는 가이드 RNA가 가이드 RNA의 생산 동안 존재할 수 있는 다른 거대분자 또는 오염물질이 없는 나열된 퍼센트라는 것을 의미한다.
B-
GEn
.1 또는 B-
GEn
.2 폴리펩티드를 포함하는 조성물
일부 실시양태에서, 본원에는 코돈-최적화된 폴리뉴클레오티드 서열로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 포함하는 조성물이 제공된다. 조성물은 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 외에, 하기 중 하나 이상을 포함할 수 있다: 염, 예를 들어, NaCl, MgCl2, KCl, MgSO4 등; 완충제, 예를 들어 트리스 완충액, HEPES, MES, MES 나트륨 염, MOPS, TAPS 등; 가용화제; 세제, 예를 들어, 비-이온성 세제, 예컨대 Tween-20 등; 프로테아제 억제제; 환원제 (예를 들어, 디티오트레이톨) 등.
일부 실시양태에서, 조성물에 존재하는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 순수하며, 예를 들어 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 99% 초과하여 순수하며, 여기서 "% 순도"는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체가 이러한 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체의 생산 동안 존재할 수 있는 다른 단백질, 다른 거대분자 또는 오염물질이 없는 나열된 퍼센트라는 것을 의미한다.
가이드 RNA 및 부위-지시된 변형 폴리펩티드를 포함하는 조성물
일부 실시양태에서, 본원에는 하기를 포함하는 조성물이 제공된다: (i) 가이드 RNA 또는 이러한 가이드 RNA를 코딩하는 폴리뉴클레오티드; 및 ii) B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 표적 DNA를 변형시키는 효소 활성을 나타낸다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 표적 DNA에 의해 코딩된 폴리펩티드를 변형시키는 효소 활성을 나타낸다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 표적 DNA로부터의 전사를 조정한다.
일부 실시양태에서, 조성물의 구성요소는 개별적으로 순수하며, 예를 들어, 각각의 구성요소는 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 98%, 적어도 99%, 또는 적어도 99% 순수하다. 일부 실시양태에서, 조성물의 개별 구성요소는 조성물에 부가되기 전에 순수하다.
키트
일부 실시양태에서, 본원에 기재된 방법을 수행하기 위한 키트가 제공된다. 키트는 하기 중 하나 이상을 포함할 수 있다: 예를 들어, 코돈-최적화된 폴리뉴클레오티드 서열로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 가이드 RNA; 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 핵산. 키트는 하기 중 2개 이상을 포함하는 복합체를 포함할 수 있다: B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 뉴클레오티드를 포함하는 핵산; 가이드 RNA; 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 핵산. 일부 실시양태에서, 키트는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체, 또는 그를 코딩하는 폴리뉴클레오티드를 포함한다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체의 활성 부분은 감소되거나 불활성화된 뉴클레아제 활성을 나타낸다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 B-GEn.1 또는 B-GEn.2 융합 단백질이다.
일부 실시양태에서, 키트는 (a) B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및 (b) gRNA 또는 이러한 gRNA를 코딩하는 핵산을 포함하며, 여기서 gRNA는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 표적 폴리뉴클레오티드 서열로 가이드할 수 있다. 일부 실시양태에서, 키트는 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 핵산을 포함한다. 코돈-최적화된 폴리뉴클레오티드 서열로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체, 또는 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 핵산을 포함하는 키트는 하나 이상의 부가의 시약을 추가로 포함할 수 있으며, 여기서 이러한 부가의 시약은 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 세포 내로 도입하기 위한 완충액; 세척 완충액; 대조군 시약; 대조군 발현 벡터 또는 폴리리보뉴클레오티드; DNA로부터 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 시험관 내 생산하기 위한 시약 등으로부터 선택될 수 있다.
본원에 기재된 키트 중 임의의 것의 일부 실시양태에서, 키트는 sgRNA를 포함한다. 일부 실시양태에서, 키트는 2개 이상의 sgRNA를 포함한다.
본원에 기재된 키트 중 임의의 것의 일부 실시양태에서, gRNA (예를 들어, 2개 이상의 가이드 RNA 포함)가 어레이 (예를 들어, RNA 분자의 어레이, 가이드 RNA(들)를 코딩하는 DNA 분자의 어레이 등)로서 제공될 수 있다. 이러한 키트는, 예를 들어, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 포함하는 상기 기재된 유전적으로 변형된 숙주 세포와 연계해서 사용하는데 유용할 수 있다.
본원에 기재된 키트 중 임의의 것의 일부 실시양태에서, 키트는 원하는 유전적 변형을 수행하기 위한 공여자 폴리뉴클레오티드를 추가로 포함한다.
키트의 구성요소는 별도의 용기 내에 있을 수 있거나; 또는 단일 용기에서 조합될 수 있다.
본원에 기재된 키트 중 임의의 것은 하나 이상의 부가의 시약을 추가로 포함할 수 있으며, 여기서 이러한 부가의 시약은 희석 완충액; 재구성 용액; 세척 완충액; 대조군 시약; 대조군 발현 벡터 또는 폴리리보뉴클레오티드; DNA로부터 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 시험관 내 생산하기 위한 시약 등으로부터 선택될 수 있다.
상기 언급된 구성요소에 더하여, 키트는 상기 방법을 실행하기 위해 키트의 구성요소를 사용하기 위한 지침을 추가로 포함할 수 있다. 상기 방법을 실행하기 위한 지침은 일반적으로 적합한 기록 매체에 기록된다. 예를 들어, 지침은 기판, 예컨대 종이 또는 플라스틱 등에 인쇄될 수 있다. 따라서, 지침은 키트에 패키지 삽입물로서, 키트 또는 그의 구성요소의 용기의 라벨링 (예를 들어, 패키징 또는 서브패키징과 연관됨) 등에 존재될 수 있다. 일부 실시양태에서, 지침은 적합한 컴퓨터 판독가능 저장 매체, 예를 들어 CD-ROM, 디스켓, 플래시 드라이브 등에 존재하는 전자 저장 데이터 파일로서 존재한다. 또 다른 실시양태에서, 실제 지침은 키트에 존재하지 않지만, 예를 들어 인터넷을 통해 원격 소스로부터 지침을 수득하기 위한 수단이 제공된다. 이러한 실시양태의 예는 지침을 볼 수 있고/거나 그로부터 지침을 다운로드할 수 있는 웹 주소를 포함하는 키트이다. 지침과 마찬가지로, 지침을 수득하기 위한 이러한 수단은 적합한 기판에 기록된다.
본 개시내용의 방법
표적 DNA 및/또는 표적 DNA에 의해 코딩된 폴리펩티드를 변형시키는 방법
일부 실시양태에서, 본원에는 표적 DNA 및/또는 표적 DNA에 의해 코딩된 폴리펩티드를 변형시키는 방법이 제공된다. 일부 실시양태에서, 상기 방법은 (i) 서열식별번호: 1 또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 서열식별번호: 1과 적어도 90%의 서열 동일성을 갖는 그의 변이체를 코딩하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및 (ii) gRNA 또는 이러한 gRNA를 코딩하는 핵산을 제공하는 것을 수반하며, 여기서 gRNA는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 표적 폴리뉴클레오티드 서열로 가이드하여, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체와 gRNA를 포함하는 복합체 ("표적화 복합체")가 형성되고 표적 폴리뉴클레오티드 서열을 포함하는 표적 DNA와 접촉하도록 할 수 있다.
일부 실시양태에서, 상기 방법은 (i) 서열식별번호: 2 또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 서열식별번호: 2와 적어도 90%의 서열 동일성을 갖는 그의 변이체를 코딩하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및 (ii) gRNA 또는 이러한 gRNA를 코딩하는 핵산을 제공하는 것을 수반하며, 여기서 gRNA는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 표적 폴리뉴클레오티드 서열로 가이드하여, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체와 gRNA를 포함하는 복합체 ("표적화 복합체")가 형성되고 표적 폴리뉴클레오티드 서열을 포함하는 표적 DNA와 접촉하도록 할 수 있다.
일부 실시양태에서, 상기 방법은 (i) 서열식별번호: 3 또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 서열식별번호: 3과 적어도 90%의 서열 동일성을 갖는 그의 변이체를 코딩하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및 (ii) gRNA 또는 이러한 gRNA를 코딩하는 핵산을 제공하는 것을 수반하며, 여기서 gRNA는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 표적 폴리뉴클레오티드 서열로 가이드하여, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체와 gRNA를 포함하는 복합체 ("표적화 복합체")가 형성되고 표적 폴리뉴클레오티드 서열을 포함하는 표적 DNA와 접촉하도록 할 수 있다.
일부 실시양태에서, 상기 방법은 (i) 서열식별번호: 4 또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 서열식별번호: 4와 적어도 90%의 서열 동일성을 갖는 그의 변이체를 코딩하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및 (ii) gRNA 또는 이러한 gRNA를 코딩하는 핵산을 제공하는 것을 수반하며, 여기서 gRNA는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 표적 폴리뉴클레오티드 서열로 가이드하여, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체와 gRNA를 포함하는 복합체 ("표적화 복합체")가 형성되고 표적 폴리뉴클레오티드 서열을 포함하는 표적 DNA와 접촉하도록 할 수 있다.
일부 실시양태에서, 상기 방법은 (i) 서열식별번호: 5 또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 서열식별번호: 5와 적어도 90%의 서열 동일성을 갖는 그의 변이체를 코딩하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및 (ii) gRNA 또는 이러한 gRNA를 코딩하는 핵산을 제공하는 것을 수반하며, 여기서 gRNA는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 표적 폴리뉴클레오티드 서열로 가이드하여, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체와 gRNA를 포함하는 복합체 ("표적화 복합체")가 형성되고 표적 폴리뉴클레오티드 서열을 포함하는 표적 DNA와 접촉하도록 할 수 있다.
일부 실시양태에서, 상기 방법은 (i) 서열식별번호: 6 또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 서열식별번호: 6과 적어도 90%의 서열 동일성을 갖는 그의 변이체를 코딩하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및 (ii) gRNA 또는 이러한 gRNA를 코딩하는 핵산을 제공하는 것을 수반하며, 여기서 gRNA는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 표적 폴리뉴클레오티드 서열로 가이드하여, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체와 gRNA를 포함하는 복합체 ("표적화 복합체")가 형성되고 표적 폴리뉴클레오티드 서열을 포함하는 표적 DNA와 접촉하도록 할 수 있다.
일부 실시양태에서, 상기 방법은 (i) 서열식별번호: 7 또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 서열식별번호: 7과 적어도 90%의 서열 동일성을 갖는 그의 변이체를 코딩하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및 (ii) gRNA 또는 이러한 gRNA를 코딩하는 핵산을 제공하는 것을 수반하며, 여기서 gRNA는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 표적 폴리뉴클레오티드 서열로 가이드하여, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체와 gRNA를 포함하는 복합체 ("표적화 복합체")가 형성되고 표적 폴리뉴클레오티드 서열을 포함하는 표적 DNA와 접촉하도록 할 수 있다.
일부 실시양태에서, 상기 방법은 (i) 서열식별번호: 8 또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 서열식별번호: 8과 적어도 90%의 서열 동일성을 갖는 그의 변이체를 코딩하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및 (ii) gRNA 또는 이러한 gRNA를 코딩하는 핵산을 제공하는 것을 수반하며, 여기서 gRNA는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 표적 폴리뉴클레오티드 서열로 가이드하여, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체와 gRNA를 포함하는 복합체 ("표적화 복합체")가 형성되고 표적 폴리뉴클레오티드 서열을 포함하는 표적 DNA와 접촉하도록 할 수 있다.
일부 실시양태에서, 상기 방법은 (i) 서열식별번호: 9 또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 서열식별번호: 9와 적어도 90%의 서열 동일성을 갖는 그의 변이체를 코딩하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및 (ii) gRNA 또는 이러한 gRNA를 코딩하는 핵산을 제공하는 것을 수반하며, 여기서 gRNA는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 표적 폴리뉴클레오티드 서열로 가이드하여, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체와 gRNA를 포함하는 복합체 ("표적화 복합체")가 형성되고 표적 폴리뉴클레오티드 서열을 포함하는 표적 DNA와 접촉하도록 할 수 있다.
일부 실시양태에서, 상기 방법은 (i) 서열식별번호: 133 또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 서열식별번호: 133과 적어도 90%의 서열 동일성을 갖는 그의 변이체를 코딩하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및 (ii) gRNA 또는 이러한 gRNA를 코딩하는 핵산을 제공하는 것을 수반하며, 여기서 gRNA는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 표적 폴리뉴클레오티드 서열로 가이드하여, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체와 gRNA를 포함하는 복합체 ("표적화 복합체")가 형성되고 표적 폴리뉴클레오티드 서열을 포함하는 표적 DNA와 접촉하도록 할 수 있다.
일부 실시양태에서, 본원에는 (a) 예를 들어 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및 (b) gRNA 또는 이러한 gRNA를 코딩하는 핵산을 세포 또는 시험관 내 환경 내로 도입하는 단계를 포함하는, 세포 또는 시험관 내 환경에서의 하나 이상의 위치에서 표적 DNA를 표적화, 편집, 변형 또는 조작하는 방법이 제공되며, 여기서 상기 gRNA는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 표적 DNA 내의 표적 폴리뉴클레오티드 서열로 가이드할 수 있다. 일부 실시양태에서, 상기 방법은 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 핵산을 세포 또는 시험관 내 환경 내로 도입하는 것을 포함한다. 일부 실시양태에서, 상기 방법은 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 세포 또는 시험관 내 환경 내로 도입하는 것을 포함한다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드는 서열식별번호: 1 내지 9, 또는 133의 아미노산 서열을 포함하거나 이로 이루어진다. 일부 실시양태에서, 상기 방법은 gRNA를 세포 또는 시험관 내 환경 내로 도입하는 것을 포함한다. 일부 실시양태에서, 상기 방법은 gRNA를 코딩하는 핵산을 세포 또는 시험관 내 환경 내로 도입하는 것을 포함한다. 일부 실시양태에서, gRNA는 단일 가이드 RNA (sgRNA)이다. 일부 실시양태에서, 상기 방법은 하나 이상의 부가의 gRNA 또는 표적 DNA를 표적화하는 하나 이상의 부가의 gRNA를 코딩하는 핵산을 세포 또는 시험관 내 환경 내로 도입하는 것을 포함한다. 일부 실시양태에서, 상기 방법은 공여자 템플릿을 세포 또는 시험관 내 환경 내로 도입하는 것을 추가로 포함한다.
일부 실시양태에서, 본원에는 (a) B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및 (b) gRNA 또는 이러한 gRNA를 코딩하는 핵산을 세포 또는 시험관 내 환경 내로 도입하는 단계를 포함하는, 세포 또는 시험관 내 환경에서의 하나 이상의 위치에서 표적 DNA를 표적화, 편집, 변형 또는 조작하는 방법이 제공되며, 여기서 상기 gRNA는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 표적 DNA 내의 표적 폴리뉴클레오티드 서열로 가이드할 수 있다. 일부 실시양태에서, 상기 방법은 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 세포 또는 시험관 내 환경 내로 도입하는 것을 포함한다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 서열식별번호: 1 내지 9, 또는 133의 아미노산 서열 또는 이들 아미노산 서열과 적어도 95%의 서열 동일성을 갖는 그의 변이체를 포함한다. 일부 실시양태에서, 상기 방법은 gRNA를 세포 또는 시험관 내 환경 내로 도입하는 것을 포함한다. 일부 실시양태에서, 상기 방법은 gRNA를 코딩하는 핵산을 세포 또는 시험관 내 환경 내로 도입하는 것을 포함한다. 일부 실시양태에서, gRNA는 단일 가이드 RNA (sgRNA)이다. 일부 실시양태에서, 상기 방법은 하나 이상의 부가의 gRNA 또는 표적 DNA를 표적화하는 하나 이상의 부가의 gRNA를 코딩하는 핵산을 세포 또는 시험관 내 환경 내로 도입하는 것을 포함한다. 일부 실시양태에서, 상기 방법은 공여자 템플릿을 세포 또는 시험관 내 환경 내로 도입하는 것을 추가로 포함한다.
상기 논의된 바와 같이, gRNA 또는 sgRNA 및 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 리보핵단백질 복합체를 형성할 수 있다. 가이드 RNA는 표적 DNA의 서열에 상보적인 뉴클레오티드 서열을 포함함으로써 복합체에 표적 특이성을 제공한다. 복합체의 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 엔도뉴클레아제 활성을 제공한다. 일부 실시양태에서, 복합체는 표적 DNA를 변형시켜, 예를 들어 DNA 절단, DNA 메틸화, DNA 손상, DNA 복구 등을 초래한다. 일부 실시양태에서, 복합체는 표적 DNA와 연관된 표적 폴리펩티드 (예를 들어, 히스톤, DNA-결합 단백질 등)를 변형시켜, 예를 들어 히스톤 메틸화, 히스톤 아세틸화, 히스톤 유비퀴틴화 등을 초래한다. 표적 DNA는, 예를 들어, 시험관 내에서 네이키드 (예를 들어, DNA 연관 단백질에 의해 결합되지 않은) DNA, 시험관 내에서 세포 내의 염색체 DNA, 생체 내에서 세포 내의 염색체 DNA 등일 수 있다.
본원에 기재된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체의 뉴클레아제 활성은 표적 DNA를 절단하여 이중 가닥 파손부를 생산할 수 있다. 그런 다음 이러한 파손부는 비-상동 말단 연결 및 상동성-지시된 복구의 2가지 방식 중 한가지에서 세포에 의해 복구된다. 비-상동 말단 연결 (NHEJ)에서, 이중 가닥 파손부는 파손부 끝을 서로 직접 라이게이션함으로써 복구된다. 이러한 프로세스에서, 몇 개의 염기쌍이 절단 부위에 삽입되거나 결실될 수 있다. 상동성-지시된 복구에서는, 절단된 표적 DNA 서열과 상동성을 갖는 공여자 폴리뉴클레오티드가, 절단된 표적 DNA 서열의 복구를 위한 템플릿으로서 사용되어 유전 정보가 공여자 폴리뉴클레오티드에서 표적 DNA로 전달된다. 따라서, 새로운 핵산 물질이 그러한 부위에 삽입/카피될 수 있다. 일부 실시양태에서, 표적 DNA는 공여자 폴리뉴클레오티드와 접촉된다. 일부 실시양태에서, 공여자 폴리뉴클레오티드가 세포 내로 도입된다. NHEJ 및/또는 상동성-지시된 복구로 인한 표적 DNA의 변형은, 예를 들어, 유전자 교정, 유전자 대체, 유전자 태깅, 트랜스진 삽입, 뉴클레오티드 결실, 뉴클레오티드 삽입, 유전자 파괴, 유전자 돌연변이, 서열 대체 등을 초래한다. 따라서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체에 의한 DNA의 절단은 표적 DNA 서열을 절단하고 세포가 외인성으로 제공된 공여자 폴리뉴클레오티드의 부재 하에 서열을 복구할 수 있게 함으로써 표적 DNA 서열로부터 핵산 물질을 결실시키기 위해 (예를 들어, 세포를 감염에 취약하게 만드는 유전자, 예를 들어, T 세포를 HIV 감염에 취약하게 만드는 CCRS 또는 CXCR4 유전자를 파괴하기 위해, 뉴런에서 질환을 유발하는 트리뉴클레오티드 반복 서열을 제거하기 위해, 연구에서 질환 모델로서 유전자 녹아웃 및 돌연변이 생성하기 위해 등) 사용될 수 있다 . 따라서, 상기 방법을 사용하여 유전자를 녹아웃시키거나 (전사/번역이 완전히 결여되거나 전사/번역이 변경됨) 또는 유전 물질을 표적 DNA 내의 선택된 로커스로 녹아웃시키기 위해 사용될 수 있다.
추가적으로 또는 대안적으로, 가이드 RNA 및 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체가, 표적 DNA 서열과 상동성을 갖는 적어도 세그먼트를 포함하는 공여자 폴리뉴클레오티드 서열과 함께 세포에 공동 투여되는 경우, 대상 방법은, 예를 들어, 표적 DNA 서열에 핵산 물질을 부가, 예를 들어 삽입 또는 교체하기 위해 (예를 들어, 단백질, siRNA, miRNA 등을 코딩하는 핵산을 "녹인"하기 위해), 태그 (예를 들어, 6xHis, 형광 단백질 (예를 들어, 녹색 형광 단백질; 황색 형광 단백질 등), 헤마글루티닌 (HA), FLAG 등)를 부가하기 위해, 유전자에 조절 서열 (예를 들어, 프로모터, 폴리아데닐화 신호, 내부 리보솜 진입 서열 (IRES), 2A 펩티드, 시작 코돈, 정지 코돈, 스플라이스 신호, 국재화 신호 등)을 부가하기 위해, 핵산 서열을 변형 (예를 들어, 돌연변이를 도입)시키기 위해 사용될 수 있다. 따라서, 가이드 RNA 및 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 포함하는 복합체는, 예를 들어, 질환을 치료하기 위한 유전자 요법에서, 또는 항바이러스제, 항병원성제 또는 항암 치료제로서, 농업에서 유전적으로 변형된 유기체의 생산을 위해, 치료, 진단 또는 연구 목적을 위해 세포에 의한 단백질의 대규모 생산을 위해, iPS 세포의 유도, 생물학적 연구, 결실 또는 대체를 위한 병원체 유전자의 표적화 등을 위해 사용된 바와 같이, 부위-특이적, 예를 들어 "표적화" 방식으로 DNA를 변형시키는 것이 바람직한 임의의 시험관 내 또는 생체 내 적용, 예를 들어 유전자 녹아웃, 유전자 녹인, 유전자 편집, 유전자 태깅, 서열 교체 등에 유용하다.
일부 실시양태에서, 본원에 기재된 방법은 이종 서열을 포함한 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 (예를 들어, B-GEn.1 또는 B-GEn.2 융합 폴리펩티드)를 이용한다. 일부 실시양태에서, 이종 서열은 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체의 세포하 국재화를 제공할 수 있다 (예를 들어, 핵을 표적화하기 위한 핵 국재화 신호 (NLS); 미토콘드리아를 표적화하기 위한 미토콘드리아 국재화 신호; 엽록체를 표적화하기 위한 엽록체 국재화 신호; ER 체류 신호 등). 일부 실시양태에서, 이종 서열은 추적 또는 정제의 용이성을 위한 태그를 제공할 수 있다 (예를 들어, 형광 단백질, 예를 들어 녹색 형광 단백질 (GFP), YFP, RFP, CFP, mCherry, tdTomato 등; 히스티딘 태그, 예를 들어 6XHis 태그; 헤마글루티닌 (HA) 태그; FLAG 태그; Myc 태그 등). 일부 실시양태에서, 이종 서열은 증가되거나 감소된 안정성을 제공할 수 있다.
일부 실시양태에서, 본원에 기재된 방법은 표적 세포에서 유전자 발현을 차단하기 위한 유도성 시스템으로서 사용되는 가이드 RNA 및 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 이용한다. 일부 실시양태에서, 적절한 가이드 RNA 및/또는 적절한 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 핵산이 표적 세포의 염색체에 혼입되고 유도성 프로모터의 제어 하에 있다. 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체가 유도되는 경우, 가이드 RNA와 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 둘 다가 존재하여 복합체를 형성할 때 관심 위치에서 표적 DNA (예를 들어, 별도의 플라스미드 상의 표적 유전자)가 절단 (또는 달리 변형)된다. 따라서, 일부 실시양태에서, 표적 세포는 게놈 내의 적절한 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 플라스미드 상의 (예를 들어, 유도성 프로모터의 제어 하의) 적절한 가이드 RNA를 코딩하는 핵산 서열을 포함하도록 조작되어, 가이드 RNA 및 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체의 발현을 유도함으로써 임의의 표적화된 유전자의 발현 (균주 내로 도입된 별도의 플라스미드로부터 발현됨)을 제어할 수 있는 실험이 가능해졌다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 이중 가닥 파손부를 도입하는 것 이외의 방식으로 표적 DNA를 변형시키는 효소 활성을 갖는다. 표적 DNA를 변형시키는데 (예를 들어, 효소 활성을 갖는 이종 폴리펩티드를 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체와 융합시킴으로써, B-GEn.1 또는 B-GEn.2 융합 폴리펩티드 또는 그의 변이체를 생성하는 것에 의함) 사용될 수 있는 관심 효소 활성은 메틸트랜스퍼라제 활성, 데메틸라제 활성, DNA 복구 활성, DNA 손상 활성, 탈아미노화 활성, 디스뮤타제 활성, 알킬화 활성, 탈퓨린화 활성, 산화 활성, 피리미딘 이량체 형성 활성, 인테그라제 활성, 트랜스포사제 활성, 재조합효소 활성, 폴리머라제 활성, 라이가제 활성, 헬리카제 활성, 포토리아제 활성 또는 글리코실라제 활성을 포함하나 이에 제한되지는 않는다. 메틸화 및 탈메틸화는 후성유전학적 유전자 조절의 중요한 방식으로서 관련 기술분야에서 인식되는 반면, DNA 손상의 복구는 세포 생존 및 환경적 스트레스에 반응하는 적당한 게놈 유지에 필수적이다. 따라서, 본원의 방법은 표적 DNA의 후성유전학적 변형에 사용되고, 원하는 서열을 가이드 RNA의 스페이서 영역 내로 도입함으로써 표적 DNA 내의 임의의 위치에서 표적 DNA의 후성유전학적 변형을 제어하는데 이용될 수 있다. 본원의 방법은 또한 표적 DNA 내의 임의의 원하는 위치에서 DNA의 의도적이고 제어된 손상에 사용된다. 본원의 방법은 또한 표적 DNA 내의 임의의 원하는 위치에서 DNA의 서열 특이적이고 제어된 복구에 사용된다. DNA-변형 효소 활동을 표적 DNA 내의 특이적 위치로 표적화하는 방법은 연구 및 임상 적용 둘 다에 사용된다.
일부 실시양태에서, 다중 가이드 RNA는 동일한 표적 DNA 상의 또는 상이한 표적 DNA 상의 상이한 위치를 동시에 변형시키는데 사용된다. 일부 실시양태에서, 2개 이상의 가이드 RNA는 동일한 유전자 또는 전사체 또는 로커스를 표적화한다. 일부 실시양태에서, 2개 이상의 가이드 RNA는 상이한 관련되지 않은 로커스를 표적화한다. 일부 실시양태에서, 2개 이상의 가이드 RNA는 상이하지만 관련된 로커스를 표적화한다.
일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 단백질로서 직접적으로 제공된다. 하나의 비제한적인 예로서, 진균 (예를 들어, 효모)는 스페로플라스트 형질전환을 사용하여 외인성 단백질 및/또는 핵산으로 형질전환될 수 있다 (문헌 [Kawai et al., Bioeng Bugs. 2010 Nov-Dec;1(6):395-403: "Transformation of Saccharomyces cerevisiae and other fungi: methods and possible underlying mechanism"; 및 Tanka et al., Nature. 2004 Mar 18;428(6980):323-8: "Conformational variations in an infectious protein determine prion strain differences"] 참조; 이들 둘 다 그 전체 내용이 본원에 참조로 포함됨). 따라서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 스페로플라스트에 혼입될 수 있고 (가이드 RNA를 코딩하는 핵산이 있거나 없고, 공여자 폴리뉴클레오티드가 있거나 없음), 스페로플라스트는 내용물을 효모 세포 내로 도입하는데 사용될 수 있다. B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 임의의 적합한 방법에 의해 세포 내로 도입 (세포에 제공)될 수 있으며; 이러한 방법은 관련 기술분야의 통상의 기술자에게 공지되어 있다. 또 다른 비제한적인 예로서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 세포, 예를 들어 제브라피쉬 배아의 세포, 수정된 마우스 난모세포의 전핵 등에 직접적으로 주입될 수 있다 (예를 들어, 가이드 RNA를 코딩하는 핵산이 있거나 없고, 공여자 폴리뉴클레오티드가 있거나 없음).
전사를 조정하는 방법
일부 실시양태에서, 본원에는 숙주 세포에서 표적 핵산의 전사를 조정하는 방법이 제공된다. 상기 방법은 일반적으로 표적 핵산을 효소적으로 불활성인 B-GEn.1 또는 B-GEn.2 폴리펩티드 및 가이드 RNA와 접촉시키는 것을 수반한다. 상기 방법은, 또한 제공되는 다양한 적용에 유용하다.
본 개시내용의 전사 조정 방법은 RNAi를 수반하는 방법의 단점 중 일부를 극복한다. 본 개시내용의 전사 조정 방법은 연구 적용, 약물 발견 (예를 들어, 높은 처리량 스크리닝), 표적 검증, 산업적 적용 (예를 들어, 작물 공학; 미생물 공학 등), 진단 적용, 치료 적용, 및 영상화 기술을 포함한 매우 다양한 적용에 사용된다.
일부 실시양태에서, 본원에는 숙주 세포, 예를 들어 인간 세포에서 표적 DNA의 전사를 선택적으로 조정하는 방법이 제공된다. 상기 방법은 일반적으로 a) 숙주 세포 내로 i) 가이드 RNA, 또는 이러한 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 핵산; 및 ii) B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체, 또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 도입하는 것을 수반하며, 여기서 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 감소된 엔도데옥시리보뉴클레아제 활성을 나타낸다. 가이드 RNA 및 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 숙주 세포에서 복합체를 형성하고; 복합체는 숙주 세포에서 표적 DNA의 전사를 선택적으로 조정한다.
일부 실시양태에서, 본원에 기재된 방법은 B-GEn.1 또는 B-GEn.2 단백질의 변형된 형태를 이용한다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 단백질의 변형된 형태는 B-GEn.1 또는 B-GEn.2 단백질의 뉴클레아제 활성을 감소시키는 아미노산 변화 (예를 들어, 결실, 삽입 또는 치환)를 포함한다. 예를 들어, 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 단백질의 변형된 형태는 상응하는 비변형된 B-GEn.1 또는 B-GEn.2 폴리펩티드의 뉴클레아제 활성의 50% 미만, 40% 미만, 30% 미만, 20% 미만, 10% 미만, 5% 미만 또는 1% 미만을 갖는다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드의 변형된 형태는 실질적인 뉴클레아제 활성을 갖지 않는다. B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체가 실질적인 뉴클레아제 활성을 갖지 않는 B-GEn.1 또는 B-GEn.2 폴리펩티드의 변형된 형태인 경우, 이는 "dB-GEn.1 또는 B-GEn.2"로서 지칭될 수 있다.
일부 실시양태에서, 본원에 기재된 전사 조정 방법은 숙주 세포에서 표적 핵산의 선택적 조정 (예를 들어, 감소 또는 증가)을 허용한다. 예를 들어, 표적 핵산의 전사의 "선택적" 감소는 가이드 RNA/B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 복합체의 부재 하의 표적 핵산의 전사 수준과 비교하여 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 또는 90% 초과만큼 표적 핵산의 전사를 감소시킨다. 표적 핵산의 전사를 선택적으로 감소시키는 것은 표적 핵산의 전사를 감소시키지만, 비-표적 핵산의 전사를 실질적으로 감소시키지는 못하며, 예를 들어 비-표적 핵산의 전사는 가이드 RNA/B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 복합체의 부재 하의 비-표적 핵산의 전사 수준과 비교하여 10% 미만 만큼만 감소된다.
일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 표적 DNA의 전사를 조정하는 활성을 갖는다 (예를 들어, B-GEn.1 또는 B-GEn.2 융합 폴리펩티드 또는 그의 변이체의 경우 등). 일부 실시양태에서, 전사를 증가시키거나 감소시킬 수 있는 능력을 나타내는 이종 폴리펩티드 (예를 들어, 전사 활성인자 또는 전사 억제인자 폴리펩티드)를 포함하는 B-GEn.1 또는 B-GEn.2 융합 폴리펩티드 또는 그의 변이체는 표적 DNA 내의 특이적 위치에서 표적 DNA의 전사를 증가시키거나 감소시키는데 사용되며, 이는 가이드 RNA의 스페이서에 의해 가이드된다. 전사 조정 활성을 갖는 B-GEn.1 또는 B-GEn.2 융합 폴리펩티드 또는 그의 변이체를 제공하기 위한 공급원 폴리펩티드의 예는 광-유도성 전사 조절인자, 소분자/약물 반응성 전사 조절인자, 전사 인자, 전사 억제인자 등을 포함하나 이에 제한되지는 않는다. 일부 실시양태에서, 상기 방법은 표적화된 유전자 코딩 RNA (단백질 코딩 mRNA) 및/또는 표적화된 비-코딩 RNA (예를 들어, tRNA, rRNA, snoRNA, siRNA, miRNA, 긴 ncRNA 등)의 전사를 제어하는데 사용된다. 일부 실시양태에서, B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 DNA와 연관된 폴리펩티드 (예를 들어, 히스톤)를 변형시키는 효소 활성을 갖는다. 일부 실시양태에서, 효소 활성은 메틸트랜스퍼라제 활성, 데메틸라제 활성, 아세틸트랜스퍼라제 활성, 데아세틸라제 활성, 키나제 활성, 포스파타제 활성, 유비퀴틴 라이가제 활성 (예를 들어, 유비퀴틴화 활성), 탈유비퀴틴화 활성, 아데닐화 활성, 탈아데닐화 활성, SUMO일화 활성, 탈SUMO일화 활성, 리보실화 활성, 탈리보실화 활성, 미리스토일화 활성, 탈미리스토일화 활성, 글리코실화 활성 (예를 들어, GlcNAc 트랜스퍼라제로부터) 또는 탈글리코실화 활성이다. 본원에 열거된 효소 활성은 단백질에 대한 공유 변형을 촉매한다. 이러한 변형은 표적 단백질의 안정성 또는 활성을 변경시키는 것으로 관련 기술분야에 공지되어 있다 (예를 들어, 키나제 활성으로 인한 인산화는 표적 단백질에 따라 단백질 활성을 자극하거나 침묵시킬 수 있음). 단백질 표적으로서 특히 관심을 끄는 것은 히스톤이다. 히스톤 단백질은 DNA와 결합하여 뉴클레오솜으로서 공지된 복합체를 형성하는 것으로 관련 기술분야에 공지되어 있다. 히스톤은 주변 DNA에서의 구조적 변화를 유도하기 위해 변형될 수 있으며 (예를 들어, 메틸화, 아세틸화, 유비퀴틴화, 인산화에 의함), 이에 따라 잠재적으로 큰 부분의 DNA가 상호작용 인자, 예컨대 전사 인자, 폴리머라제 등에 대한 접근성을 제어할 수 있다. 단일 히스톤은 많은 상이한 방법과 많은 상이한 조합으로 변형될 수 있다 (예를 들어, 히스톤 3의 리신 27인 H3K27의 트리메틸화는 억제된 전사의 DNA 영역과 연관되어 있는 반면, 히스톤 3의 리신 4인 H3K4의 트리메틸화는 활성 전사의 DNA 영역과 연관되어 있음). 따라서, 히스톤 변형 활성을 갖는 B-GEn.1 또는 B-GEn.2 융합 폴리펩티드 또는 그의 변이체는 염색체 구조의 부위 특이적 제어에 사용되며 표적 DNA의 선택된 영역에서 히스톤 변형 패턴을 변경하는데 사용될 수 있다. 이러한 방법은 연구 및 임상 적용 둘 다에서 사용된다.
증가된 전사
표적 DNA의 "선택적" 증가된 전사는 가이드 RNA/B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 복합체의 부재 하의 표적 DNA로부터의 전사 수준과 비교하여 적어도 1.1배 (예를 들어, 적어도 1.2배, 적어도 1.3배, 적어도 1.4배, 적어도 1.5배, 적어도 1.6배, 적어도 1.7배, 적어도 1.8배, 적어도 1.9배, 적어도 2배, 적어도 2.5배, 적어도 3배, 적어도 3.5배, 적어도 4배, 적어도 4.5배, 적어도 5배, 적어도 6배, 적어도 7배, 적어도 8배, 적어도 9배, 적어도 10배, 적어도 12배, 적어도 15배, 또는 적어도 20배) 만큼 표적 DNA로부터의 전사를 증가시킬 수 있다. 표적 DNA의 전사의 선택적 증가는 표적 DNA로부터의 전사를 증가시키지만, 비-표적 DNA의 전사를 실질적으로 증가시키지는 않으며, 예를 들어, 비-표적 DNA의 전사는 가이드 RNA/B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 복합체의 부재 하의 비-표적화된 DNA의 전사 수준과 비교하여 약 5배 미만 (예를 들어, 약 4배 미만, 약 3배 미만, 약 2배 미만, 약 1.8배 미만, 약 1.6배 미만, 약 1.4배 미만, 약 1.2배 미만, 또는 약 1.1배 미만) 만큼만 증가된다.
비제한적인 예로서, 증가된 전사는 dB-GEn.1 또는 B-GEn.2를 이종 서열과 융합시킴으로써 달성될 수 있다. 적합한 융합 파트너는 표적 DNA에 또는 이러한 표적 DNA와 연관된 폴리펩티드 (예를 들어, 히스톤 또는 기타 DNA-결합 단백질)에 직접적으로 작용함으로써 전사를 간접적으로 증가시키는 활성을 제공하는 폴리펩티드를 포함하나 이에 제한되지는 않는다. 적합한 융합 파트너는 메틸트랜스퍼라제 활성, 데메틸라제 활성, 아세틸트랜스퍼라제 활성, 데아세틸라제 활성, 키나제 활성, 포스파타제 활성, 유비퀴틴 라이가제 활성, 탈유비퀴틴화 활성, 아데닐화 활성, 탈아데닐화 활성, SUMO일화 활성, 탈SUMO일화 활성, 리보실화 활성, 탈리보실화 활성, 크로토닐화, 탈크로토닐화, 프로피오닐화, 탈프로피오닐화, 미리스토일화 활성, 또는 탈미리스토일화 활성을 제공하는 폴리펩티드를 포함하나 이에 제한되지는 않는다.
부가의 적합한 융합 파트너는 표적 핵산의 증가된 전사를 직접적으로 제공하는 폴리펩티드 (예를 들어, 전사 활성인자 또는 그의 단편, 전사 활성인자를 동원하는 단백질 또는 그의 단편, 소분자/약물 반응성 전사 조절인자 등)를 포함하나 이에 제한되지는 않는다.
원핵생물에서 전사를 증가시키기 위해 dB-GEn.1 또는 B-GEn.2 융합 단백질을 사용하는 방법의 비제한적인 예는 박테리아 1-하이브리드 (B1H) 또는 2-하이브리드 (B2H) 시스템의 변형을 포함한다. B1H 시스템에서, DNA 결합 도메인 (BD)은 박테리아 전사 활성화 도메인 (AD, 예를 들어 에스케리키아 콜라이(Escherichia coli) RNA 폴리머라제의 알파 서브유닛 (RNAPa))과 융합된다. 따라서, dB-GEn.1 또는 B-GEn.2는 AD를 포함하는 이종 서열과 융합될 수 있다. dB-GEn.1 또는 B-GEn.2 융합 단백질이 프로모터의 상류 영역 (가이드 RNA에 의해 그곳을 표적화함)에 도착하면, dB-GEn.1 또는 B-GEn.2 융합 단백질의 AD (예를 들어, RNAPa)가 RNAP 홀로엔자임을 동원하여 전사 활성화를 유도한다. B2H 시스템에서는, BD가 AD와 직접적으로 융합되지 않으며; 대신, 이들의 상호작용은 단백질-단백질 상호작용 (예를 들어, GAL11P-GAL4 상호작용)에 의해 매개된다. 상기 방법에 사용하기 위해 이러한 시스템을 변형시키기 위해서는, dB-GEn.1 또는 B-GEn.2가 단백질-단백질 상호작용을 제공하는 제1 단백질 서열 (예를 들어, 효모 GAL11P 및/또는 GAL4 단백질)과 융합될 수 있고, RNAa는 단백질-단백질 상호작용을 완료하는 제2 단백질 서열과 융합될 수 있다 (예를 들어, GAL11P가 dB-GEn.1 또는 B-GEn.2와 융합된 경우에는 GAL4이고, GAL4가 dB-GEn.1 또는 B-GEn.2와 융합된 경우에는 GAL11P임). GAL11P와 GAL4 간의 결합 친화도는 결합 효율과 전사 발사 속도를 증가시킨다.
진핵생물에서 전사를 증가시키기 위해 dB-GEn.1 또는 B-GEn.2 융합 단백질을 사용하는 방법의 비제한적인 예는 dB-GEn.1 또는 B-GEn.2를 활성화 도메인 (AD) (예를 들어, GAL4, 헤르페스바이러스 활성화 단백질 VP16 또는 VP64, 인간 핵 인자 NF-KB p65 서브유닛 등)과 융합시키는 것을 포함한다. 시스템을 유도성으로 만들기 위해, dB-GEn.1 또는 B-GEn.2 융합 단백질의 발현은 유도성 프로모터 (예를 들어, Tet-ON, Tet-OFF 등)에 의해 제어될 수 있다. 가이드 RNA는 공지된 전사 반응 요소 (예를 들어, 프로모터, 인핸서 등), 공지된 상류 활성화 서열 (UAS), 표적 DNA의 발현을 제어할 수 있는 것으로 의심되는 공지되지 않았거나 공지된 기능의 서열 등을 표적화하도록 설계될 수 있다.
부가의 융합 파트너
전사 증가 또는 감소를 달성하기 위한 융합 파트너의 비제한적인 예는 전사 활성인자 및 전사 억제인자 도메인 (예를 들어, 크뤼펠 연관 박스 (KRAB 또는 SKD); Mad mSIN3 상호작용 도메인 (SID); ERF 억제인자 도메인 (ERD) 등)을 포함하나 이에 제한되지는 않는다. 일부 이러한 경우, dB-GEn.1 또는 B-GEn.2 융합 단백질은 가이드 RNA에 의해 표적 DNA 내의 특이적 위치 (예를 들어, 서열)로 표적화되고, 로커스-특이적 조절을 발휘하며, 예컨대 프로모터와 결합하는 RNA 폴리머라제를 차단하고/거나 (전사 활성인자 기능을 선택적으로 억제함) 국소 염색질 상태를 변형시킨다 (예를 들어, 표적 DNA를 변형시키거나 표적 DNA와 연관된 폴리펩티드를 변형시키는 융합 서열이 사용되는 경우). 일부 실시양태에서, 변화는 일시적이다 (예를 들어, 전사 억제 또는 활성화). 일부 실시양태에서, 변화는 유전적이다 (예를 들어, 표적 DNA 또는 이러한 표적 DNA와 연관된 단백질, 예를 들어 뉴클레오솜 히스톤에 대한 후성유전학적 변형이 이루어진 경우). 일부 실시양태에서, 이종 서열은 dB-GEn.1 또는 B-GEn.2 폴리펩티드의 C-말단과 융합될 수 있다. 일부 실시양태에서, 이종 서열은 dB-GEn.1 또는 B-GEn.2 폴리펩티드의 N-말단과 융합될 수 있다. 일부 실시양태에서, 이종 서열은 dB-GEn.1 또는 B-GEn.2 폴리펩티드의 내부 부분 (예를 들어, N- 또는 C-말단 이외의 부분)과 융합될 수 있다. dB-GEn.1 또는 B-GEn.2 융합 단백질을 사용하는 방법의 생물학적 효과는 임의의 적합한 방법 (예를 들어, 유전자 발현 검정; 염색질-기반 검정, 예를 들어 염색질 면역침전 (ChIP), 염색질 생체 내 검정 (CiA) 등)에 의해 검출될 수 있다.
일부 실시양태에서, 방법은 2개 이상의 상이한 가이드 RNA의 사용을 수반한다. 예를 들어, 2개의 상이한 가이드 RNA가 단일 숙주 세포에서 사용될 수 있으며, 여기서 2개의 상이한 가이드 RNA는 동일한 표적 핵산 내의 2개의 상이한 표적 서열을 표적화한다. 일부 실시양태에서, 동일한 표적 핵산 내의 2개의 상이한 표적화 서열을 표적화하는 2개의 상이한 가이드 RNA의 사용은 표적 핵산의 전사에서 증가된 조정 (예를 들어, 감소 또는 증가)을 제공한다.
또 다른 예로서, 2개의 상이한 가이드 RNA가 단일 숙주 세포에서 사용될 수 있으며, 여기서 2개의 상이한 가이드 RNA는 2개의 상이한 표적 핵산을 표적화한다. 따라서, 예를 들어, 전사 조정 방법은 제2 가이드 RNA, 또는 이러한 제2 가이드 RNA를 코딩하는 뉴클레오티드 서열을 포함하는 핵산을 숙주 세포 내로 도입하는 것을 추가로 포함할 수 있다.
일부 실시양태에서, 핵산 (예를 들어, 가이드 RNA, 예를 들어 단일 분자 가이드 RNA; 공여자 폴리뉴클레오티드; B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 핵산 등)은 부가의 바람직한 특색을 제공하는 변형 또는 서열을 포함한다 (예를 들어, 변형된 또는 조절된 안정성; 세포하 표적화; 추적, 예를 들어, 형광 표지; 단백질 또는 단백질 복합체에 대한 결합 부위 등). 비제한적인 예는 5' 캡 (예를 들어, 7-메틸구아닐레이트 캡 (m 7G)); 3' 폴리아데닐화된 꼬리 (예를 들어, 3' 폴리(A) 꼬리); 리보스위치 서열 또는 압타머 서열 (예를 들어, 단백질 및/또는 단백질 복합체에 의한 조절된 안정성 및/또는 조절된 접근성을 허용하기 위함); 종결인자 서열; dsRNA 이중나선 (예를 들어, 헤어핀)을 형성하는 서열; RNA를 세포하 위치 (예를 들어, 핵, 미토콘드리아, 엽록체 등)로 표적화하는 변형 또는 서열; 추적을 제공하는 변형 또는 서열 (예를 들어, 형광 분자에 대한 직접 접합, 형광 검출을 용이하게 하는 모이어티에 대한 접합, 형광 검출을 허용하는 서열 등); 단백질 (예를 들어, 전사 활성인자, 전사 억제인자, DNA 메틸트랜스퍼라제, DNA 데메틸라제, 히스톤 아세틸트랜스퍼라제, 히스톤 데아세틸라제 등을 포함하여 DNA에 작용하는 단백질)에 대한 결합 부위를 제공하는 변형 또는 서열; RNA의 구조를 변경시키는 RNA의 변형, 결과적으로 B-GEn.1 또는 B-GEn.2 리보핵단백질; 및 그의 조합을 포함한다.
다중 동시 가이드 RNA
일부 실시양태에서, 다중 가이드 RNA는 동일한 표적 DNA 상의 또는 상이한 표적 DNA 상의 상이한 위치에서 전사를 동시에 조정하기 위해 동일한 세포에서 동시에 사용된다. 일부 실시양태에서, 2개 이상의 가이드 RNA는 동일한 유전자 또는 전사체 또는 로커스를 표적화한다. 일부 실시양태에서, 2개 이상의 가이드 RNA는 상이한 관련되지 않은 로커스를 표적화한다. 일부 실시양태에서, 2개 이상의 가이드 RNA는 상이하지만 관련된 로커스를 표적화한다.
가이드 RNA는 작고 견고하기 때문에 동일한 발현 벡터에 동시에 존재할 수 있으며 원할 경우 동일한 전사 제어를 받을 수도 있다. 일부 실시양태에서, 2개 이상 (예를 들어, 3개 이상, 4개 이상, 5개 이상, 10개 이상, 15개 이상, 20개 이상, 25개 이상, 30개 이상, 35개 이상, 40개 이상, 45개 이상, 또는 50개 이상)의 가이드 RNA가 표적 세포에서 동시에 발현된다 (동일하거나 상이한 벡터로부터/동일하거나 다른 프로모터로부터). 일부 실시양태에서, 다중 가이드 RNA는 표적인자 RNA의 자연적으로 발생하는 CRISPR 어레이를 모방하는 어레이에서 코딩될 수 있다. 표적화 세그먼트는 대략 30개 뉴클레오티드 길이의 서열 (약 16 내지 약 100 nt일 수 있음)로서 코딩되며 CRISPR 반복 서열에 의해 분리된다. 어레이는 RNA를 코딩하는 DNA에 의해 또는 RNA로서 세포 내로 도입될 수 있다.
다중 가이드 RNA를 발현하기 위해, Csy4 엔도리보뉴클레아제에 의해 매개되는 인공 RNA 프로세싱 시스템을 사용할 수 있다. 예를 들어, 다중 가이드 RNA는 전구체 전사체 (예를 들어, U6 프로모터로부터 발현됨) 상에서 직렬 어레이로 연결되고, Csy4-특이적 RNA 서열에 의해 분리될 수 있다. 공동 발현된 Csy4 단백질은 전구체 전사체를 다중 가이드 RNA로 절단한다. RNA 프로세싱 시스템을 사용하는 것의 이점은 첫째, 여러 프로모터를 사용할 필요가 없고; 둘째, 모든 가이드 RNA는 전구체 전사체로부터 프로세싱되기 때문에 이들의 농도는 유사한 dB-GEn.1 또는 B-GEn.2 결합에 대해 정규화된다는 것을 포함한다.
Csy4는 박테리아 슈도모나스 아에루기노사(Pseudomonas aeruginosa)로부터 유래된 작은 엔도리보뉴클레아제 (RNase) 단백질이다. Csy4는 최소 17-bp RNA 헤어핀을 특이적으로 인식하고, 신속하고 (<1분) 고도로 효율적인 (>99.9%) RNA 절단을 나타낸다. 대부분의 RNase와는 달리, 절단된 RNA 단편은 안정적이고 기능적으로 활성 상태를 유지한다. Csy4-기반 RNA 절단은 인공 RNA 프로세싱 시스템으로 용도가 변경될 수 있다. 이러한 시스템에서, 17-bp RNA 헤어핀은 단일 프로모터로부터의 전구체 전사체로서 전사되는 다중 RNA 단편 사이에 삽입된다. Csy4의 공동 발현은 개별 RNA 단편을 생성하는데 유효하다.
숙주 세포
일부 실시양태에서, 본 개시내용의 방법은 생체 내 및/또는 생체 외 및/또는 시험관 내 유사분열 또는 유사분열 후 세포에서 전사 조정을 유도하기 위해 이용될 수 있다. 일부 실시양태에서, 본 개시내용의 방법은 생체 내 및/또는 생체 외 및/또는 시험관 내 유사분열 또는 유사분열 후 세포에서 DNA 절단, DNA 변형 및/또는 전사 조정을 유도하는데 이용될 수 있다 (예를 들어, 개체에게 재도입될 수 있는 유전적으로 변형된 세포를 생산하기 위함).
가이드 RNA가 표적 DNA과 혼성화함으로써 특이성을 제공하기 때문에, 유사분열 및/또는 유사분열 후 세포는 다양한 숙주 세포 중 임의의 것일 수 있으며, 여기서 적합한 숙주 세포는 박테리아 세포; 고세균 세포; 단일 세포 진핵 유기체; 식물 세포; 조류 세포, 예를 들어 보트리오코쿠스 브라우니이, 클라미도모나스 레인하르트티이, 나노클로롭시스 가디타나, 클로렐라 피레노이도사(Chlorella pyrenoidosa), 사르가숨 파텐스, 씨. 아가르드 등; 진균 세포; 동물 세포; 무척추 동물 (예를 들어, 곤충, 자포동물, 극피동물, 선충류 등)로부터의 세포; 진핵 기생동물 (예를 들어, 말라리아 기생동물, 예를 들어 플라스모디움 파키파룸(Plasmodium fakiparum); 기생충 등); 척추 동물 (예를 들어, 어류, 양서류, 파충류, 조류, 포유동물)로부터의 세포; 포유동물 세포, 예를 들어 설치류 세포, 인간 세포, 비-인간 영장류 세포 등을 포함하나 이에 제한되지는 않는다. 일부 실시양태에서, 숙주 세포는 임의의 인간 세포일 수 있다. 적합한 숙주 세포는 자연적으로 발생하는 세포; 유전적으로 변형된 세포 (예를 들어, 실험실에서 예를 들어 "사람의 손"에 의해 유전적으로 변형된 세포); 및 임의의 방식으로 시험관 내에서 조작된 세포를 포함한다. 일부 실시양태에서, 숙주 세포는 단리된다.
임의의 유형의 세포가 관심 대상이 될 수 있다 (예를 들어, 줄기 세포, 예를 들어 배아 줄기 (ES) 세포, 유도 만능성 줄기 (iPS) 세포, 생식 세포; 체세포, 예를 들어 섬유모세포, 조혈 세포, 뉴런, 근육 세포, 뼈 세포, 간세포, 췌장 세포; 임의의 단계의 배아의 시험관 내 또는 생체 내 배아 세포, 예를 들어, 1-세포, 2-세포, 4-세포, 8-세포 등; 단계 제브라피쉬 배아 등). 세포는 확립된 세포주로부터 유래될 수 있거나 1차 세포일 수 있으며, 여기서 "1차 세포", "1차 세포주" 및 "1차 배양물"은 대상체로부터 유래되고 배양물의 제한된 수의 계대, 예를 들어 분할 동안 시험관 내에서 성장하도록 허용된 세포 및 세포 배양물을 지칭하기 위해 본원에서 상호교환가능하게 사용된다. 예를 들어, 1차 배양물은 0회, 1회, 2회, 4회, 5회, 10회 또는 15회 계대되었지만 위기 단계를 통과하는 횟수가 충분하지 않은 배양물을 포함한다. 1차 세포주는 시험관 내에서 10회 미만의 계대 동안 유지될 수 있다. 일부 실시양태에서 표적 세포는 단세포 유기체이거나 배양물에서 성장된다.
세포가 1차 세포인 경우, 그러한 세포는 임의의 적합한 방법에 의해 개체로부터 채취될 수 있다. 예를 들어, 백혈구는 성분채집술, 백혈구성분채집술, 밀도 구배 분리 등에 의해 적합하게 채취될 수 있는 반면, 피부, 근육, 골수, 비장, 간, 췌장, 폐, 장, 위 등의 조직으로부터는 생검으로 세포를 채취하는 것이 가장 적합하다. 채취된 세포의 분산 또는 현탁을 위해 적절한 용액을 사용할 수 있다. 이러한 용액은 일반적으로 낮은 농도, 예를 들어 5-25 mM의 허용되는 완충액과 연계해서, 송아지 태아 혈청 또는 기타 자연적으로 발생하는 인자가 적합하게 보충된 균형 잡힌 염 용액, 예를 들어, 정상 식염수, 포스페이트-완충 식염수 (PBS), 행크 균형 염 용액 등일 것이다. 적합한 완충액은 HEPES, 포스페이트 완충액, 락테이트 완충액 등을 포함한다. 세포는 즉시 사용될 수 있거나, 또는 장기간 동안 저장, 동결된 다음, 해동하여 재사용할 수 있다. 그러한 경우, 세포는 일반적으로 10% 디메틸 술폭시드 (DMSO), 50% 혈청, 40% 완충 배지, 또는 그러한 동결 온도에서 세포를 보존하기 위해 관련 기술분야에서 통상적으로 사용된 바와 같은 일부 다른 용액에서 동결되며, 동결된 배양 세포를 해동하기 위해 관련 기술분야에 통상적으로 공지된 바와 같은 방식으로 해동된다.
용도
본 개시내용에 따른 전사를 조정하는 방법은, 또한 제공되는 다양한 적용에 사용된다. 적용은 연구 적용; 진단 적용; 산업 적용; 및 치료적 적용을 포함한다.
연구 적용은, 예를 들어, 하류 유전자의 발생, 대사, 발현 등에 대한 표적 핵산의 전사를 감소 또는 증가시키는 효과를 결정하는 것 등을 포함한다. 높은 처리량의 게놈 분석은 가이드 RNA의 스페이서만을 변경하면 되는 전사 조정 방법을 사용하여 수행될 수 있지만, 단백질-결합 세그먼트와 전사 종결 세그먼트는 (일부 경우에) 일정하게 유지될 수 있다. 게놈 분석에 사용되는 복수 개의 핵산을 포함하는 라이브러리는 가이드 RNA 코딩 뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 포함하며, 여기서 각각의 핵산은 공통 단백질-결합 세그먼트, 상이한 스페이서 및 공통 전사 종결 세그먼트를 포함한다. 칩은 5 x 104개 초과의 고유한 가이드 RNA를 함유할 수 있다. 적용은 대규모 표현형 분석, 유전자-대-기능 매핑, 및 메타-게놈 분석을 포함한다.
본원에 개시된 방법은 대사 공학 분야에 사용된다. 본원에 개시된 바와 같이, 전사 수준은 적절한 가이드 RNA를 설계함으로써 효율적이고 예측가능하게 제어될 수 있기 때문에, 대사 경로 (예를 들어, 생합성 경로)의 활성은 관심 대사 경로 내의 특이적 효소의 수준을 제어함으로써 (예를 들어, 전사 증가 또는 감소를 통해) 정밀하게 제어되고 조정될 수 있다. 관심 대사 경로는 화학 물질 (정밀 화학 물질, 연료, 항생제, 독소, 효능제, 길항제 등) 및/또는 약물 생산에 사용되는 경로를 포함한다.
관심 생합성 경로는 (1) 메발로네이트 경로 (예를 들어, HMG-CoA 리덕타제 경로) (아세틸-GoA를 디메틸알릴 피로포스페이트 (DMAPP) 및 이소펜테닐 피로포스페이트 (IPP)로 전환시키며, 이는 테르페노이드/이소프레노이드를 비롯한 매우 다양한 생체분자의 생합성에 사용됨), (2) 비-메발로네이트 경로 (예를 들어, "2-C-메틸-D-에리트리톨 4-포스페이트/1-데옥시-D-크실룰로스 5-포스페이트 경로" 또는 "MEP/DOXP 경로" 또는 "DXP 경로") (메발로네이트 경로에 대한 대체 경로를 통해 피루베이트와 글리세르알데히드 3-포스페이트를 DMAPP와 IPP로 전환시킴으로써 대신 DMAPP와 IPP를 생산함), (3) 폴리케티드 합성 경로 (다양한 폴리케티드 신타제 효소를 통해 다양한 폴리케티드를 생산한다. 폴리케티드는 화학요법에 사용되는 자연적으로 발생하는 소분자 (예를 들어, 테트라시클린 및 매크롤리드)를 포함하며 산업적으로 중요한 폴리케티드는 라파마이신 (면역억제제), 에리트로마이신 (항생제), 로바스타틴 (항콜레스테롤 약물), 및 에포틸론 B (항암 약물)를 포함함), (4) 지방산 합성 경로, (5) DAHP (3-데옥시-D-아라비노-헵툴로소네이트 7-포스페이트) 합성 경로, (6) 잠재적인 바이오연료 (예컨대 단쇄 알콜 및 알칸, 지방산 메틸 에스테르 및 지방 알콜, 이소프레노이드 등)를 생산하는 경로 등을 포함하나 이에 제한되지는 않는다.
네트워크 및 캐스케이드
본원에 개시된 방법은 제어의 통합 네트워크 (예를 들어, 캐스케이드 또는 캐스케이드들)를 설계하는데 사용될 수 있다. 예를 들어, 가이드 RNA 및 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 사용하여 또 다른 DNA-표적화 RNA 또는 또 다른 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체의 발현을 제어 (예를 들어, 조정, 예를 들어 증가, 감소)할 수 있다. 예를 들어, 제1 가이드 RNA는 제1 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체와 상이한 기능 (예를 들어, 메틸트랜스퍼라제 활성, 데메틸라제 활성, 아세틸트랜스퍼라제 활성, 데아세틸라제 활성 등)을 갖는 제2 융합 dB-GEn.1 또는 B-GEn.2 폴리펩티드의 전사 조정을 표적화하도록 설계될 수 있다. 일부 실시양태에서, 제2 융합 dB-GEn.1 또는 B-GEn.2 폴리펩티드는 제1 가이드 RNA와 상호작용하지 않도록 선택될 수 있다. 일부 실시양태에서, 제2 융합 dB-GEn.1 또는 B-GEn.2 폴리펩티드는 제1 가이드 RNA와 상호작용하도록 선택될 수 있다. 일부 이러한 경우에, 2개 (또는 그 초과)의 dB-GEn.1 또는 B-GEn.2 단백질의 활성이 경쟁하거나 (예를 들어, 폴리펩티드가 반대 활성을 갖는 경우) 또는 시너지 효과를 발휘할 수 있다 (예를 들어, 폴리펩티드가 유사하거나 상승작용적 활성을 갖는 경우). 마찬가지로, 상기 언급된 바와 같이, 네트워크 내의 복합체 중 임의의 것 (예를 들어, 가이드 RNA/dB-GEn.1 또는 B-GEn.2 폴리펩티드)은 다른 가이드 RNA 또는 dB-GEn.1 또는 B-GEn.2 폴리펩티드를 제어하도록 설계될 수 있다. 가이드 RNA 및 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체는 임의의 원하는 DNA 서열에 표적화될 수 있기 때문에, 본원에 기재된 방법은 임의의 원하는 표적의 발현을 제어하고 조절하는데 사용될 수 있다. 설계될 수 있는 통합 네트워크 (예를 들어, 상호작용의 캐스케이드)는 매우 단순한 것부터 매우 복잡한 것까지 다양하며 제한이 없다.
2개 이상의 구성요소 (예를 들어, 가이드 RNA 및 dB-GEn.1 또는 B-GEn.2 폴리펩티드)가 각각 또 다른 가이드 RNA/dB-GEn.1 또는 B-GEn.2 폴리펩티드 복합체의 조절 제어 하에 있는 네트워크에서, 네트워크의 한 구성요소의 발현 수준은 네트워크의 또 다른 구성요소의 발현 수준에 영향을 미칠 수 있다 (예를 들어, 발현을 증가시키거나 감소시킬 수 있음). 이러한 메커니즘을 통해, 하나의 구성요소의 발현은 동일한 네트워크 내의 상이한 구성요소의 발현에 영향을 미칠 수 있으며, 네트워크는 다른 구성요소의 발현을 증가시키는 구성요소 뿐만 아니라 다른 구성요소의 발현을 감소시키는 구성요소의 혼합물을 포함할 수 있다. 관련 기술분야의 통상의 기술자가 쉽게 이해할 수 있는 바와 같이, 하나의 구성요소의 발현 수준이 하나 이상의 상이한 구성요소(들)의 발현 수준에 영향을 미칠 수 있는 상기 예는 예시 목적을 위한 것이며 제한적이지 않다. 하나 이상의 구성요소가 조작가능하도록 (예를 들어, 실험적 제어, 예를 들어 온도 제어; 약물 제어, 예를 들어 약물 유도성 제어; 빛 제어 등 하에) 변형 (상기 기재된 바와 같음)된 경우 부가의 복잡성 층이 임의로 네트워크 내로 도입될 수 있다.
하나의 비제한적인 예로서, 제1 가이드 RNA는 표적 치료/대사 유전자의 발현을 제어하는 제2 가이드 RNA의 프로모터와 결합할 수 있다. 그러한 경우, 제1 가이드 RNA의 조건부 발현은 치료/대사 유전자를 간접적으로 활성화시킨다. 이러한 유형의 RNA 캐스케이드는, 예를 들어 억제인자를 활성인자로 쉽게 전환시키는데 유용하며, 표적 유전자의 발현의 로직 또는 역학을 제어하는데 사용될 수 있다.
전사 조정 방법은 약물 발견 및 표적 검증에도 사용될 수 있다.
질환 또는 병태를 치료하는 방법
본 개시내용의 일부 측면에서, 가이드 RNA 및/또는 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체 및/또는 공여자 폴리뉴클레오티드는, 예를 들어, 질환을 치료하기 위한 유전자 요법 등의 목적을 위해, 항바이러스제, 항병원성제 또는 항암 치료제로서, 농업에서 유전적으로 변형된 유기체의 생산을 위해, 또는 생물학적 연구를 위해 생체 내에서 세포성 DNA를 변형시키기 위해 이용된다. 이러한 생체 내 실시양태에서, (i) 가이드 RNA 또는 이러한 gRNA를 코딩하는 핵산; (ii) B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및/또는 (iii) 공여자 폴리뉴클레오티드를 포함한 CRISPR/B-GEn.1 또는 B-GEn.2 시스템의 구성요소가 개체에게 투여된다. 투여는 대상체에게 펩티드, 소분자 및 핵산을 투여하기 위한 관련 기술분야에 널리 공지된 임의의 방법에 의해 이루어질 수 있다. CRISPR/B-GEn.1 또는 B-GEn.2 시스템 구성요소는 다양한 제형에 혼입될 수 있다. 보다 특히, 본 개시내용의 CRISPR/B-GEn.1 또는 B-GEn.2 시스템 구성요소는 적절한 제약상 허용되는 담체 또는 희석제와 조합하여 제약 조성물로 제형화될 수 있다.
일부 실시양태에서, 본원에는 제약상 허용되는 비히클에 존재하는 (i) 가이드 RNA 또는 이러한 gRNA를 코딩하는 핵산; (ii) B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및/또는 (iii) 공여자 폴리뉴클레오티드를 포함한 CRISPR/B-GEn.1 또는 B-GEn.2 시스템의 구성요소를 포함하는 제약 제제 또는 조성물이 제공된다. "제약상 허용되는 비히클"은 연방 또는 주 정부의 규제 기관에 의해 승인되거나 또는 미국 약전 또는 포유동물, 예컨대 인간에 사용하기 위해 일반적으로 인정되는 기타 약전에 열거된 비히클일 수 있다. 용어 "비히클"은 본 개시내용의 화합물이 포유동물에게 투여하기 위해 함께 제형화되는 희석제, 아주반트, 부형제 또는 담체를 지칭한다. 이러한 제약 비히클은 지질, 예를 들어 리포솜, 예를 들어 리포솜 덴드리머; 액상물, 예컨대 물 및 페크로리움, 동물, 식물성 또는 합성 기원의 것을 포함한 오일, 예컨대 땅콩 오일, 대두 오일, 미네랄 오일, 참깨 오일 등, 식염수; 아카시아검, 젤라틴, 전분 페이스트, 활석, 케라틴, 콜로이드 실리카, 요소 등일 수 있다. 또한, 보조제, 안정제, 증점제, 윤활제 및 착색제가 사용될 수 있다. 제약 조성물은 고체, 반고체, 액체 또는 기체 형태의 제제, 예컨대 정제, 캡슐, 분말, 과립, 연고, 용액, 좌제, 주사제, 흡입제, 겔, 마이크로구체 및 에어로졸로 제형화될 수 있다. 따라서, CRISPR/B-GEn.1 또는 B-GEn.2 시스템 구성요소의 투여는 경구, 협측, 직장, 비경구, 복강내, 피내, 경피, 기관내, 안구내 등의 투여를 포함한 다양한 방식으로 달성될 수 있다. 활성제는 투여 후 전신적일 수 있거나 국소 투여, 벽내 투여의 사용 또는 체내 이식 부위에서 활성 용량을 유지하는 역할을 하는 체내 이식제의 사용에 의해 국소적일 수 있다. 활성제는 즉각적인 활성을 위해 제형화될 수 있거나 지속 방출을 위해 제형화될 수 있다.
일부 병태, 특히 중추 신경계 병태의 경우, 혈액 뇌 장벽 (BBB)을 통과하는 작용제를 제형화하는 것이 필요할 수 있다. BBB를 통한 약물 전달을 위한 하나의 전략은 삼투압 수단, 예컨대 만니톨 또는 류코트리엔에 의해, 또는 혈관 활성 물질, 예컨대 브라디키닌의 사용에 의해 생화학적으로 BBB를 파괴하는 것을 수반한다. 뇌종양에 대한 특이적 작용제를 표적화하기 위해 BBB 개방을 사용할 가능성도 한 옵션이다. BBB 파괴제는 조성물이 혈관내 주사에 의해 투여되는 경우 본 개시내용의 치료 조성물과 함께 공동 투여될 수 있다. BBB를 통과하기 위한 다른 전략은 카베올린-1 매개 트랜스시토시스, 담체-매개 수송체, 예컨대 글루코스 및 아미노산 담체, 인슐린 또는 트랜스페린에 대한 수용체-매개 트랜스시토시스, 및 활성 유출 수송체, 예컨대 p-당단백질을 포함한, 내인성 수송 시스템의 사용을 수반할 수 있다. 활성 수송 모이어티는 또한 혈관의 내피 벽을 가로지르는 수송을 용이하게 하기 위해 본 개시내용에 사용하기 위한 치료 화합물과 접합될 수 있다. 추가적으로 또는 대안적으로, BBB 뒤에 치료제의 약물 전달은 국소 전달에 의해, 예를 들어 척수강내 전달에 의해, 예를 들어 옴마야 저장소를 통해 (예를 들어, 본원에 참조로 포함된 미국 특허 번호 5,222,982 및 5385582 참조); 볼루스 주사에 의해, 예를 들어 주사기에 의해, 예를 들어 유리체강내 또는 두개내로; 연속 주입에 의해, 예를 들어 대류를 이용한 캐뉼라 삽입에 의해 (예를 들어, 본원에 참조로 포함된 미국 출원 번호 20070254842 참조); 또는 작용제가 가역적으로 부착된 장치를 체내 이식함으로써 (예를 들어, 본원에 참조로 포함된 미국 출원 번호 20080081064 및 20090196903 참조) 이루어질 수 있다.
일반적으로, (i) 가이드 RNA 또는 이러한 gRNA를 코딩하는 핵산; (ii) B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및/또는 (iii) 공여자 폴리뉴클레오티드를 포함한 CRISPR/B-GEn.1 또는 B-GEn.2 시스템의 구성요소의 유효량이 제공된다. 생체 외 방법과 관련하여 상기 논의된 바와 같이, 생체 내 CRISPR/B-GEn.1 또는 B-GEn.2 시스템 구성요소의 유효량 또는 유효 용량은 음성 대조군, 예를 들어 빈 벡터 또는 관련 없는 폴리펩티드와 접촉된 세포에 비해 2개의 상동 서열 간에 관찰되는 재조합의 양에 있어서 2배 이상의 증가를 유도하는 양이다. 재조합의 양은 임의의 적합한 방법, 예를 들어 상기 기재된 바와 같고 관련 기술분야에 공지된 방법에 의해 측정될 수 있다. 투여될 CRISPR/B-GEn.1 또는 B-GEn.2 시스템 구성요소의 유효량 또는 유효 용량의 계산은 관련 기술분야의 통상의 기술자의 기술 내에 있으며, 관련 기술분야의 통상의 기술자에게 일상적일 것이다. 투여될 최종 양은 투여 경로 및 치료될 장애 또는 병태의 성질에 따라 달라질 것이다.
특정한 대상체에게 제공되는 유효량은 다양한 요인에 따라 달라지며, 그 중 몇몇은 대상체마다 상이하다. 유능한 임상의는 필요에 따라 질환 병태의 진행을 중단시키거나 역전시키기 위해 대상체에게 투여할 치료제의 유효량을 결정할 수 있을 것이다. 임상의는 LD50 동물 데이터와 약물에 대해 이용가능한 기타 정보를 활용하여, 투여 경로에 따라 개체의 최대 안전 용량을 결정할 수 있다. 예를 들어, 정맥내로 투여된 용량은, 치료 조성물이 투여되는 유체의 양이 더 많을 경우 척수강내로 투여되는 용량보다 더 많을 수 있다. 유사하게, 신체로부터 빠르게 제거되는 조성물은 치료 농도를 유지하기 위해 더 높은 용량으로 또는 반복 용량으로 투여될 수 있다. 유능한 임상의는 통상적인 기술을 활용하여, 일상적인 임상 시험 과정에서 특정한 치료제의 투여량을 최적화할 수 있다.
의약에 봉입시키기 위해, CRISPR/B-GEn.1 또는 B-GEn.2 시스템 구성요소는 적합한 상업적 공급원으로부터 수득될 수 있다. 일반적인 제안으로서, 용량당 비경구로 투여되는 CRISPR/B-GEn.1 또는 B-GEn.2 시스템 구성요소의 제약상 유효한 총량은 용량 반응 곡선에 의해 측정될 수 있는 범위 내일 것이다.
치료적 투여를 위해 사용될 CRISPR/B-GEn.1 또는 B-GEn.2 시스템 구성요소, 예를 들어 (i) 가이드 RNA 또는 이러한 gRNA를 코딩하는 핵산; (ii) B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체를 코딩하는 코돈-최적화된 폴리뉴클레오티드 서열을 포함하는 핵산, 또는 이러한 핵산으로부터 발현된 B-GEn.1 또는 B-GEn.2 폴리펩티드 또는 그의 변이체; 및/또는 (iii) 공여자 폴리뉴클레오티드의 제제에 기반한 요법은 멸균되어야만 한다. 멸균은 멸균 여과막 (예를 들어, 0.2 마이크로미터 막)을 통한 여과를 통해 쉽게 달성된다. 치료 조성물은 일반적으로 멸균 접근 포트를 갖는 용기, 예를 들어 피하 주사 바늘로 관통할 수 있는 마개를 갖는 정맥내 용액 봉지 또는 바이알에 넣는다. CRISPR/B-GEn.1 또는 B-GEn.2 시스템 구성요소를 기반으로 하는 요법은 단위 또는 다중 용량 용기, 예를 들어 밀봉된 앰풀 또는 바이알에 수용액 또는 재구성을 위한 동결건조된 제형으로서 저장될 수 있다. 동결건조된 제형의 한 예로서, 10-ml 바이알에 멸균 여과된 1% (w/v) 화합물 수용액 5 ml를 채우고, 그 결과로 생성된 혼합물을 동결건조시킨다. 주입 용액은 정균 주사용수를 사용하여 동결건조된 화합물을 재구성함으로써 제조된다.
제약 조성물은 원하는 제형에 따라 제약상 허용되는 희석제의 비-독성 담체를 포함할 수 있으며, 이는 동물 또는 인간 투여용 제약 조성물을 제형화하는데 통상적으로 사용되는 비히클로서 정의된다. 희석제는 조합물의 생물학적 활성에 영향을 미치지 않도록 선택된다. 이러한 희석제의 예는 증류수, 완충수, 생리 식염수, PBS, 링거 용액, 덱스트로스 용액, 및 행크 용액이다. 또한, 제약 조성물 또는 제형은 다른 담체, 아주반트, 또는 비-독성, 비치료적, 비면역원성 안정제, 부형제 등을 포함할 수 있다. 조성물은 또한 생리학적 조건을 근사화하기 위한 부가의 물질, 예컨대 pH 조정제 및 완충제, 독성 조정제, 습윤제 및 세제를 포함할 수 있다.
조성물은 또한 다양한 안정제 중 임의의 것, 예컨대 항산화제를 포함할 수 있다. 제약 조성물이 폴리펩티드를 포함하는 경우, 폴리펩티드는 이러한 폴리펩티드의 생체 내 안정성을 향상시키거나 그의 약리학적 특성을 달리 향상시키는 (예를 들어, 폴리펩티드의 반감기를 증가시키거나, 그의 독성을 감소시키거나, 용해도 또는 흡수를 향상시키는) 널리 공지된 다양한 화합물과 복합체를 형성할 수 있다. 이러한 변형 또는 복합체 형성제의 예는 술페이트, 글루코네이트, 시트레이트 및 포스페이트를 포함한다. 조성물의 핵산 또는 폴리펩티드는 또한 그들의 생체 내 속성을 향상시키는 분자와 복합체를 형성할 수 있다. 이러한 분자는, 예를 들어, 탄수화물, 폴리아민, 아미노산, 기타 펩티드, 이온 (예를 들어, 나트륨, 칼륨, 칼슘, 마그네슘, 망가니즈) 및 지질을 포함한다.
다양한 유형의 투여에 적합한 제형에 관한 추가 안내는 문헌 [Remington's Pharmaceutical Sciences, Mace Publishing Company, Philadelphia, Pa., 20th ed. (2003) 및 The United States Pharmacopeia: The National Formulary (USP 24 NF19) published in 1999]에서 찾을 수 있다. 약물 전달 방법에 대한 간략한 검토를 위해서는, 문헌 [Langer, Science 249:1527-1533 (1990)]을 참조한다.
제약 조성물은 예방적 및/또는 치료적 치료를 위해 투여될 수 있다. 활성 성분의 독성 및 치료 효능은, 예를 들어, LD50 (집단의 50%에 치사적인 용량) 및 ED50 (집단의 50%에 치료상 유효한 용량)을 결정하는 것을 포함한, 세포 배양 및/또는 실험 동물의 표준 제학 절차에 따라 결정될 수 있다. 독성 효과와 치료 효과 간의 용량 비율이 치료 지수이며 LD50/ED50 비율로서 표현될 수 있다. 큰 치료 지수를 나타내는 요법이 일반적으로 선호된다.
세포 배양 및/또는 동물 연구로부터 수득된 데이터는 인간을 위한 일정 범위의 투여량을 공식화하는데 사용될 수 있다. 활성 성분의 투여량은 일반적으로 독성이 낮은 ED50을 포함하는 순환 농도 범위 내에 있다. 투여량은 이용된 투여 형태 및 활용된 투여 경로에 따라 이러한 범위 내에서 달라질 수 있다. 제약 조성물을 제형화하는데 사용되는 구성요소는 일반적으로 순도가 높고 잠재적으로 유해한 오염물질이 실질적으로 없다 (예를 들어, 적어도 내셔널 푸드 (NF) 등급, 일반적으로 적어도 분석 등급, 보다 전형적으로 적어도 제약 등급). 더욱이, 생체 내 사용을 위해 의도된 조성물은 일반적으로 멸균된다. 주어진 화합물을 사용하기 전에 합성해야만 하는 경우, 그 결과로 생성된 산물은 일반적으로, 임의의 잠재적으로 독성이 있는 물질, 특히 합성 또는 정제 프로세스 동안 존재할 수 있는 임의의 내독소가 실질적으로 없다. 비경구 투여용 조성물은 또한 멸균성이고 실질적으로 등장성이며 GMP 조건 하에서 제조된다.
특정한 대상체에게 제공될 치료 조성물의 유효량은 다양한 요인에 따라 달라질 것이며, 그 중 몇몇은 대상체마다 상이할 것이다. 유능한 임상의는 필요에 따라 질환 병태의 진행을 중단시키거나 역전시키기 위해 대상체에게 투여할 치료제의 유효량을 결정할 수 있을 것이다. 임상의는 LD50 동물 데이터와 약물에 대해 이용가능한 기타 정보를 활용하여, 투여 경로에 따라 개체의 최대 안전 용량을 결정할 수 있다. 예를 들어, 정맥내로 투여된 용량은, 치료 조성물이 투여되는 유체의 양이 더 많을 경우 척수강내로 투여되는 용량보다 더 많을 수 있다. 유사하게, 신체로부터 빠르게 제거되는 조성물은 치료 농도를 유지하기 위해 더 높은 용량으로 또는 반복 용량으로 투여될 수 있다. 유능한 임상의는 통상적인 기술을 활용하여, 일상적인 임상 시험 과정에서 특정한 치료제의 투여량을 최적화할 수 있다.
대상체에 대한 치료 투여 횟수는 다양할 수 있다. 유전적으로 변형된 세포를 대상체 내로 도입하는 것은 일회성 이벤트일 수 있지만; 특정 상황에서는 그러한 치료가 제한된 기간 동안 개선을 유도할 수 있으며 지속적인 반복 치료를 필요로 할 수 있다. 특정 상황에서는, 효과가 관찰되기 전에 유전적으로 변형된 세포의 다수회 투여를 필요로 할 수도 있다. 정확한 프로토콜은 질환 또는 병태, 질환의 단계 및 치료 중인 개별 대상체의 파라미터에 따라 달라진다.
등가물
모든 기술적 특색은 이러한 특색의 가능한 모든 조합으로 개별적으로 조합될 수 있다.
본 발명은 본 발명의 요지 또는 본질적인 특징을 벗어나지 않고서도 다른 특이적 형태로 구체화될 수 있다. 따라서 전술한 실시양태는 모든 면에서 본원에 기재된 발명을 제한하기보다는 예시하는 것으로 간주되어야 한다.
실시예
하기 비제한적인 실시예는 본원에 기재된 본 발명의 실시양태를 추가로 예시한다.
실시예 1:
신규 유형 V 뉴클레아제의 실험적 특징규명
잠재적인 이펙터 서열은 사내 미생물 데이터베이스의 게놈 분석을 통해 확인되었다. B-GEn.1 및 B-GEn.2에 대한 DNA 서열을 합성하고 [트위스트(Twist)], NdeI 및 XhoI를 사용하여 pET29-기반 맞춤형 발현 벡터 (pBLR107)에 클로닝하였다 (서열식별번호: 7은 이러한 벡터 내의 B-GEn.1에 대한 완전한 플라스미드 서열을 나타내고, 그 결과로 생성된 플라스미드는 B-GEn.1_전체_플라스미드_pBLR373으로 명명되며; 서열식별번호: 8은 상기 벡터 내의 B-GEn.2에 대한 완전한 플라스미드 서열을 나타내고, 그 결과로 생성된 플라스미드는 B-GEn.2 플라스미드에 대해 B-GEn.2_전체_플라스미드_pBLR373으로 명명됨). tracr-함유 DNA를 수득하기 위해, 이펙터 ORF를 둘러싸는 유전자내 영역을 연결하고 RNA 분자의 발현을 위해 맞춤형 ColE1-함유 벡터 (임의로 정방향 및 역방향 T7을 수반하며, 각각 pBLR150 및 pBLR151로 일컬어짐)에 클로닝하였다. 플라스미드-기반 스크리닝을 위해, 2개의 합성 스페이서 서열 (PAM 라이브러리 플라스미드와 매칭됨)을 CRISPR 반복 영역에 의해 플랭킹하고 ssDNA 올리고머로서 주문한 후, T7 프로모터의 제어 하에 pBLR107에 클로닝하였다. 이러한 시스템은 또한 도 1에 예시되어 있다.
활성을 스크리닝하기 위해, RTS™ 100 이. 콜라이 HY 키트 [바이오래빗(Biorabbit)]를 사용하여 무세포 발현 시스템에서 플라스미드를 발현시켰다. 간단히 언급하면, 제조업체의 지침에 따라 각각의 플라스미드 250 ng을 열 순환기에서 30℃에서 6시간 동안 20 μl의 총 샘플 용적에서 발현시켰다. 플라스미드 DNA의 PAM 의존성 절단은 2 μl의 발현 샘플과 10 mM Tris pH 7.5, 100 mM NaCl 및 50 mM MgCl2로 완충된 50 nM PAM-라이브러리 플라스미드를 사용하여 총 용적 10 μl에서 37℃에서 4시간 동안 수행되었다. 이어서, SPRI 비드 [스피드비드(SpeedBeads™) 자성 카르복실레이트 변형된 입자; 시그마(Sigma)]를 사용하여 샘플로부터 플라스미드 DNA를 정제하고 EB (퀴아젠)를 사용하여 10 μl로 용출시켰다. 엇갈리게 커팅된 선형화된 플라스미드의 말단 복구를 위해, 제조업체의 지침에 따라 5 μl의 용출액을 NEB 넥스트 울트르 II 말단 복구/dA-테일링 모듈 [뉴 잉글랜드 바이오랩스(New England Biolabs)]을 사용하여 20℃에서 30분 동안 인큐베이션하였다. 이어서, SPRI 비드 (스피드비드™ 자성 카르복실레이트 변형된 입자; 시그마)를 사용하여 DNA를 다시 정제하고 EB (퀴아젠)를 사용하여 10 μl로 용출시켰다. 마지막으로, 문헌 [Karvelis and colleagues (DOI 10.1186/s13059-015-0818-7)]에 기재된 바와 같이 총 용적 12 μl 1x 블런트 TA 라이가제 마스터맥스 (NEB) 중의 1 μM 이중 어댑터를 사용하여 어댑터 라이게이션을 수행하였다. 절단된 플라스미드 서열을 수득하기 위해, 3 μl의 어댑터 라이게이션 샘플을 1.25 μl의 10 uM 바코드부착된 정방향 및 역방향 프라이머 뿐만 아니라 12.5 ul의 Q5 고 충실도 2x 마스터믹스 (NEB) 및 7.5 ul의 물과 혼합하였다. 증폭을 위해, 하기 설정을 사용하였다: 초기 변성 (98℃에서 30초), 증폭을 위한 30x 주기 (98℃에서 10초, 66℃에서 30초 및 72℃에서 30초) 및 최종 연장 (72℃에서 2분). 5' 단부에 5개의 부가의 뉴클레오티드를 부가함으로써 프라이머에 바코드를 부착하였다. 이어서, 모든 PCR 반응물을 풀링하고 제조업체 지침에 따라 SPRI 비드를 1:1 비율로 사용하여 정제하였다. 차세대 시퀀싱을 위해, 2 ug의 바코드부착되고 정제된 앰플리콘을 라이브러리 프렙을 위한 입력으로서 사용하였다. 앰플리콘 풀을 말단 복구시키고 dA 테일링한 다음 (NEB넥스트 울트라 II 복구/dA-테일링 모듈, NEB), 일루미나(Illumina) 바코드 라이게이션하였다 (블런트/TA 라이가제 마스터 믹스, NEB). 정확한 앰플리콘 크기는 겔 전기영동 [E-겔 EX 2%, 써모피셔(ThermoFisher)]으로 확인되었다. dsDNA HS 키트 (써모피셔)를 사용하여 큐비트(Qubit) (써모피셔) 상에서 라이브러리의 농도를 측정하였다. 5% PhiX 스파이크인이 포함된 10 pM 라이브러리는 MiSeq 300PE v2 화학 (일루미나)을 사용하는 차세대 시퀀싱을 위한 입력으로서 사용되었다.
생물정보학적 분석
PAM 서열을 결정하기 위해, 어댑터 서열로부터의 모티프와 표적 부위 상류의 플라스미드 서열로부터의 모티프 둘 다를 함유하는 모든 NGS 판독값을 분석하였다. 첫째, 두 모티프를 모두 함유하는 모든 판독값에 대해, 두 모티프 사이의 개재 서열의 길이가 결정되었다. 그런 다음, 가장 자주 발생하는 개재 서열 길이를 갖는 판독값의 서브세트를 별도로 분석하였다. 이러한 판독값 서브세트의 경우, 8N-PAM 라이브러리 세그먼트 상에서 관찰된 모든 고유 서열이 판독값 계수와 함께 결정되었다. 가장 자주 발생하는 100개의 서열을 사용하여 서열 모티프를 생성하였다. 그 결과를 사용하여 표 2를 생성하였다.
실시예 2:
포유동물 세포에서 뉴클레아제 활성을 검출하는 스크리닝 방법
세포 배양
HEK 293T 세포 (ATCC® CRL-3216™)를 10% FBS 및 1% Pen/Strep을 함유하는 DMEM에서 배양하였다. 세포를 T75 플라스크에서 배양하고 2일 내지 3일마다 분할하였다.
형질감염
형질감염 하루 전에, 세포를 폴리-D-리신 코팅된 96웰 플레이트 [폴리-D-리신 CELLCOAT®; 그라이너(Greiner)]에 웰당 12,000개 세포의 밀도로 시딩하였다. 그 다음날, 배지를 교체하고 제조업체 지침에 따라 LipoD293™ 인 비트로 DNA 형질감염 시약 [시그나젠(SignaGen)]을 사용하여 세포를 140 ng 뉴클레아제 플라스미드 및 60 ng sgRNA 플라스미드로 형질감염시켰다. 그 다음날 형질감염 혼합물을 교체하고 표준 배양 배지로 교환하였다. 형질감염 3일 후, 세포를 하류 DNA 추출을 위해 채취하였다.
조잡한 DNA 추출 및 증폭
상기 채취된 세포를 100 ul PBS에 재현탁시키고 60 ul를 새로운 96 웰 플레이트에 옮겨 펠렛화하였다. 이어서, 상청액을 제거하고, 25 μg/ml 프로테이나제 K [써모 사이언티픽(Thermo Scientific)]가 보충된 0.05% SDS를 함유한 10 mM Tris, pH 7.0 60 μl를 각각의 웰에 부가하고 철저히 혼합하였다. 조잡한 DNA 샘플을 37℃에서 1시간 동안 인큐베이션한 다음, 80℃에서 30분 동안 가열하였다. 3.5 μl의 조잡한 DNA를 1.25 μl의 10 uM 바코드부착된 정방향 및 역방향 프라이머 뿐만 아니라 12.5 ul의 Q5 고 충실도 2x 마스터 믹스 (NEB) 및 6.5 ul의 물과 혼합하였다. 증폭을 위해, 모든 앰플리콘에 대해 하기 설정이 사용되었다: 초기 변성 (98℃에서 30초), 증폭을 위한 30x 주기 (98℃에서 10초, 66℃에서 30초 및 72℃에서 30초) 및 최종 연장 (72℃에서 2분). 5' 단부에 5개의 부가의 뉴클레오티드를 부가함으로써 프라이머에 바코드를 부착하였다. 이어서, 모든 PCR 반응물을 풀링하고 제조업체 지침에 따라 SPRI 비드를 1:1 비율로 사용하여 정제하였다.
라이브러리 프렙 및 차세대 시퀀싱
2 ug의 바코드부착되고 정제된 앰플리콘을 라이브러리 프렙을 위한 입력으로서 사용하였다. 앰플리콘 풀을 말단 복구시키고 dA 테일링한 다음 (NEB넥스트 울트라 II 복구/dA-테일링 모듈, NEB), 일루미나 바코드 라이게이션하였다 (블런트/TA 라이가제 마스터 믹스, NEB). 정확한 앰플리콘 크기는 겔 전기영동 (E-겔 EX 2%, 써모피셔)으로 확인되었다. dsDNA HS 키트 (써모피셔)를 사용하여 큐비트 (써모피셔) 상에서 라이브러리의 농도를 측정하였다. 5% PhiX 스파이크인이 포함된 10 pM 라이브러리는 MiSeq 300PE v2 화학 (일루미나)을 사용하는 차세대 시퀀싱을 위한 입력으로서 사용되었다.
NGS
분석
원시 fastq 판독값은 최소 품질 점수 Q30으로 cutadapt 버전 1.18 (http://dx.doi.org/10.14806/ej.17.1.200)을 사용하여 품질 트리밍되었다. 필터링된 판독값은 fastq-join 버전 1.3.1 (doi:10.2174/1875036201307010001)을 사용하여 연결되었으며 문헌 [Nat Commun. 2021 Jul 9;12(1):4219. doi: 10.1038/s41467-021-24454-5, Supplementary Material, Section entitled: "Amplicon sequencing (AmpSeq) for on- and off-target analysis and NGS analysis"]에 기재된 바와 같은 사용자 정의 역다중화 스크립트를 사용하여 역다중화되었다. 역다중화된 fastq 파일은 이후 CRISPResso v 1.0.13 (doi: 10.1038/nbt.3583)을 사용하여 분석되었다. 이러한 분석의 결과가 표 4에 제시되어 있다 (반면, 평균 활성은 3개의 개별 실험, 및 B-GEn.1이 포함된 pBLR709 및 B-GEn.2가 포함된 pBLR710으로부터 유래되었음).
표 4
실시예 3:
새로운
sgRNA
설계를 사용하여 포유동물 세포에서 뉴클레아제 활성을 검출하는 스크리닝 방법
서열식별번호: 40-44 및 7에 따른 신규 sgRNA 설계의 활성을 시험하기 위해, 부가의 보다 적은 활성 또는 비-활성 설계 (실시예 2에 따른 실험은 이들 sgRNA 서열을 사용하여 수행되었음). 2개의 상이한 표적 로커스가 이용되었다:
TCRA_가이드1: NCBI 참조 서열: NC_000014.9 REGION: 21724060..21724082 (역 보체는 표적 특이적 가이드 서열을 나타냄).
TCRA_가이드4: NCBI 참조 서열: NC_000014.9 REGION: 21724157..21724179 (역 보체는 표적 특이적 가이드 서열을 나타냄).
둘 다 2022년 6월 8일에 https://www.ncbi.nlm.nih.gov/nuccore/568815584로부터 평가되었다.
결과는 도 2에 나타내어져 있다.
SEQUENCE LISTING
<110> Bayer AG
<120> BNovel Type V RNA programmable endonuclease systems
<130> BHC211037-FC
<160> 44
<170> BiSSAP 1.3.6
<210> 1
<211> 1103
<212> PRT
<213> other sequences
<220>
<223> RNA programmable DNA endonuclease B-Gen.1
<400> 1
Met Thr Ile Arg Ser Met Lys Leu Lys Leu Lys Ile Tyr Ser Gly Arg
1 5 10 15
Ser Ala Pro Gln Leu Arg Gln Gly Leu Trp Arg Leu His Arg Leu Leu
20 25 30
Asn Glu Gly Thr Ala Tyr Tyr Met Asp Trp Leu Val His Met Arg Gln
35 40 45
Glu Ala Leu Pro Gly Lys Ser Lys Glu Glu Ile Arg Ala Glu Leu Glu
50 55 60
Arg Arg Val Arg Gln Gln Gln Glu Lys Asn Gly Val Gln Asn Asp Gln
65 70 75 80
Val Pro Met Asp Glu Val Leu Ser Ala Leu Arg Gln Leu Tyr Glu Leu
85 90 95
Leu Val Pro Ser Ala Val Asn Asn Ser Gly Asp Ala Gln Thr Leu Ser
100 105 110
Arg Lys Phe Leu Ser Pro Leu Val Asp Pro Asn Ser Glu Gly Gly Lys
115 120 125
Gly Thr Ser Asn Ala Gly Ala Lys Pro Gly Trp Arg Lys Lys Gln Glu
130 135 140
Ala Gly Asp Pro Ser Trp Glu Lys Asp Tyr Glu Arg Trp Leu Lys Arg
145 150 155 160
Lys Gln Ala Asp Pro Thr Ala Glu Ile Leu Gly Lys Leu Glu Thr Ala
165 170 175
Gly Leu Lys Pro Leu Phe Pro Leu Tyr Thr Asn Glu Val Lys Asp Ile
180 185 190
Arg Trp Met Pro Leu Thr Ser Lys Gln Tyr Val Arg Asn Trp Asp Arg
195 200 205
Asp Met Phe Gln Gln Ala Ile Glu His Leu Leu Ser Trp Glu Thr Trp
210 215 220
Asn Arg Lys Val Asn Glu Glu Arg Ala Lys Leu Lys Glu Thr Val Arg
225 230 235 240
Arg Phe Glu Glu Gln His Leu Ala Asn Gly Lys Asp Trp Leu Ser Pro
245 250 255
Leu Gln Ala Tyr Glu Ala Asn Arg Glu Gln Ala Leu Arg Asp Met Ala
260 265 270
Ile Ser Pro Ser Asp Arg Phe Arg Ile Thr Arg Arg Gln Ile Lys Gly
275 280 285
Trp Ser Glu Leu Tyr Glu Arg Trp Asn Lys Leu Ala Pro Thr Ala Ser
290 295 300
Val Glu Ala Tyr Met Gln Glu Val Arg His Val Gln Lys Lys Leu Gly
305 310 315 320
Gly Thr Phe Gly Asp Ala Asp Leu Tyr Arg Phe Leu Ala Lys Pro Glu
325 330 335
Asn Val His Ile Trp Arg Asp His Gln Glu Arg Leu His Tyr Tyr Ala
340 345 350
Ala Tyr Asn Asp Leu His Lys Arg Leu Met Ser Ala Lys Glu Gln Ala
355 360 365
Ala Phe Thr Leu Pro Asp Pro Val Ala His Pro Leu Trp Val Arg Phe
370 375 380
Asp Ala Arg Asp Gly Asn Leu Phe Thr Tyr Ile Leu Gln Ala Asp Ser
385 390 395 400
Ser Lys Gln Arg Ser Arg Arg Tyr Val Asn Phe Ser Arg Phe Leu Trp
405 410 415
Pro Val Glu Asp Gly Tyr Phe Glu Glu Thr Glu Asn Val Lys Val Glu
420 425 430
Leu Ala Leu Ser Lys Gln Phe Tyr Arg Gln Val Ile Val His Asp Asn
435 440 445
Pro Thr Gly Lys Gln Lys Ile Thr Phe Gln Asp Tyr Ser Ser Lys Glu
450 455 460
Ile Leu Glu Gly His Leu Gly Gly Ala Lys Leu Gln Leu Asp Arg Asn
465 470 475 480
Phe Leu Arg Lys Ser Gly Arg Asp Phe Glu Thr Gly Asp Phe Gly Pro
485 490 495
Ala Phe Leu Asn Val Val Leu Asp Leu Lys Pro Lys Gln Glu Val Lys
500 505 510
Asn Gly Arg Leu Gln Ser Pro Leu Gly Gln Ala Leu Leu Val Lys Ser
515 520 525
Arg Pro Asn Asp Ile Pro Lys Val Tyr Gly Tyr Lys Pro Asp Ala Leu
530 535 540
Ala Ala Trp Leu Glu Gln Ala Ser Gly Glu Glu Ser Leu Gly Ser Glu
545 550 555 560
Ser Leu Arg Gln Gly Phe Arg Val Met Ser Ile Asp Leu Gly Val Arg
565 570 575
Ser Ala Ala Ala Ile Ser Val Phe Ser Val Lys Gly Glu Lys Thr Arg
580 585 590
Glu Gly Asp Lys Val Cys Tyr Pro Val Gly Glu Thr Gly Leu Phe Ala
595 600 605
Val His Asp Arg Ser Phe Leu Leu Arg Leu Pro Gly Glu Ser Ser Glu
610 615 620
Lys Arg Val Asn Val Glu Arg Asp Lys Arg Lys Thr Glu Arg Met Gln
625 630 635 640
Ile Arg Tyr His Ile Arg Thr Leu Ala Arg Val Leu Arg Leu Ala Asn
645 650 655
Lys Ala Thr Pro Met Asp Arg Ile Lys Ala Val Gln Asp Val Leu Asn
660 665 670
Asp Ile Glu Ser Thr Arg Phe Met Asn Asp His Asp His His Val Tyr
675 680 685
Asn His Ala Leu Glu Thr Leu Arg Thr Tyr Ala Pro Asp His Gln Gly
690 695 700
Ile Trp Glu Glu Gln Val Ile Ala Ala His Arg Gln Leu Glu His His
705 710 715 720
Val Gly Val Ile Val Gly Glu Trp Arg Lys Asn Trp Gly Lys Asp Arg
725 730 735
Arg Gly Thr Val Gly Leu Ser Met Asp Asn Ile Glu Glu Leu Asp Glu
740 745 750
Met Arg Arg Leu Leu Ile Ser Trp Ser Arg Arg Ala Arg Tyr Pro Arg
755 760 765
Glu Ala Lys Pro Phe Gln Val Asn Glu Ser Asn Pro Val His Leu Leu
770 775 780
Arg His Leu Gln Asn Leu Lys Glu Asp Arg Leu Lys Gln Leu Ala Asn
785 790 795 800
Leu Ile Val Met Thr Ala Leu Gly Tyr Val Tyr Asp Ser Lys Glu Lys
805 810 815
Lys Trp Lys Ala Ala Tyr Pro Ala Cys Gln Leu Ile Leu Phe Glu Asp
820 825 830
Leu Gln Arg Tyr Arg Phe His Leu Asp Arg Ser Ala Arg Glu Asn Ser
835 840 845
Gln Leu Met Lys Trp Ala His Arg Ser Ile Pro Lys Tyr Val Trp Met
850 855 860
Gln Gly Glu Pro Tyr Gly Leu Gln Ile Gly Asp Val Trp Ala Gly Phe
865 870 875 880
Thr Ser Arg Tyr His Ala Lys Thr Gly Ala Pro Gly Ile Arg Cys Lys
885 890 895
Ala Leu Thr Glu Lys Asp Phe Gln Gln Gly Arg Leu Leu Glu Ser Leu
900 905 910
Val Ala Glu Gly Met Phe Thr Leu Gln Glu Val Gly Thr Leu Lys Pro
915 920 925
Gly Asp Ile Val Pro Ala Glu Gly Gly Glu Leu Phe Val Thr Leu Ala
930 935 940
Asp Asp Ser Gly Asp Arg Ile Val Ile Thr His Ala Asp Ile Asn Ala
945 950 955 960
Ala Gln Asn Val Gln Lys Arg Phe Trp Leu Ala Asn Ser Glu Arg Phe
965 970 975
Arg Val Ala Cys Arg Ser Val Gln Ile Ala Ser Gln Glu Cys Phe Ile
980 985 990
Pro Ser Ser Glu Ser Val Ala Lys Lys Met Gly Lys Gly Val Phe Val
995 1000 1005
Arg Asp Phe Ser Phe His Lys Asp Met Glu Val Tyr His Trp Asn Asn
1010 1015 1020
Gln Val Lys Leu Thr Ala Lys Asn Val Pro Thr Asp His Ser Asp Asp
1025 1030 1035 1040
Leu Gln Asp Leu Gln Asp Tyr Gln Ala Ile Leu Glu Glu Ala Arg Glu
1045 1050 1055
Ser Ser Ser Ser Tyr Lys Thr Leu Phe Arg Asp Pro Ser Gly Phe Phe
1060 1065 1070
Phe Pro Asp Asp Val Trp Val Pro Gln Asn Ile Tyr Trp Arg Glu Val
1075 1080 1085
Lys Lys Thr Ile Thr Ala Leu Leu Arg Lys Arg Ile Met Ser Thr
1090 1095 1100
<210> 2
<211> 1091
<212> PRT
<213> other sequences
<220>
<223> RNA programmable DNA endonuclease B-Gen.2
<400> 2
Met Pro Ile Arg Ser Phe Lys Leu Lys Leu Val Thr His Asn Gly Asp
1 5 10 15
Ser Thr Tyr Met Asp Lys Leu Arg Arg Gly Leu Trp Lys Thr His Val
20 25 30
Ile Ile Asn Arg Gly Ile Ala Tyr Tyr Met Asn Thr Leu Ala Leu Met
35 40 45
Arg Gln Glu Pro Tyr Gly Ser Lys Ser Arg Glu Glu Val Arg Leu Asp
50 55 60
Leu Leu Ser Thr Leu Arg Glu Gln Gln Arg Arg Asn Asn Trp Ser Glu
65 70 75 80
Gln Thr Gly Thr Asp Asp Glu Leu Leu Ser Leu Ser Arg Arg Val Tyr
85 90 95
Glu Leu Leu Val Pro Ser Ala Ile Gly Glu Lys Gly Asp Ala Gln Met
100 105 110
Leu Ser Arg Lys Phe Leu Ser Pro Leu Val Asp Pro Asn Ser Glu Gly
115 120 125
Gly Arg Gly Thr Ala Lys Ser Gly Arg Lys Pro Arg Trp Lys Lys Met
130 135 140
Met Glu Glu Gly His Pro Asp Trp Glu Lys Glu Lys Glu Lys Asp Ala
145 150 155 160
Ala Lys Lys Ala Glu Asp Pro Thr Ala Ser Ile Leu Ala Asp Leu Glu
165 170 175
Ala Val Gly Leu Leu Pro Leu Phe Pro Leu Phe Ser Asp Glu Gln Lys
180 185 190
Glu Ile Arg Trp Leu Pro Lys Lys Lys Arg Gln Phe Val Arg Thr Trp
195 200 205
Asp Arg Asp Met Phe Gln Gln Ala Leu Glu Arg Met Leu Ser Trp Glu
210 215 220
Ser Trp Asn Arg Arg Val Ala Glu Glu Tyr Leu Lys Leu Gln Ala Gln
225 230 235 240
Arg Asp Glu Val Tyr Ala Lys Tyr Leu Glu Asp Ala Gly Ser Trp Leu
245 250 255
Asn Asp Leu Gln Thr Phe Glu Lys Gln Arg Glu Glu Glu Leu Ala Glu
260 265 270
Val Ser Phe Glu Pro Asn Ser Glu Tyr Leu Ile Thr Arg Arg Gln Ile
275 280 285
Arg Gly Trp Lys Glu Val Tyr Glu Lys Trp Ser Lys Thr Ser Glu Asn
290 295 300
Ala Ser Gln Glu Gln Leu Trp Arg Met Val Ala Asp Val Gln Thr Ala
305 310 315 320
Met Ala Gly Ala Phe Gly Asp Pro Lys Val Tyr Gln Phe Leu Ser Gln
325 330 335
Pro Lys His His His Ile Trp Arg Glu His Pro Asn Arg Leu Phe Tyr
340 345 350
Tyr Ser Lys Tyr Asn Glu Val Arg Glu Lys Leu Asn Arg Ala Lys Lys
355 360 365
Gln Ala Ala Phe Thr Leu Pro Asp Pro Val Glu His Pro Leu Trp Thr
370 375 380
Arg Phe Asp Ala Arg Gly Gly Asn Ile His Asp Tyr Glu Ile Ser Lys
385 390 395 400
Val Gly Lys Gln Tyr His Val Thr Phe Ser Ser Leu Ile Leu Pro Glu
405 410 415
Ala Gln Ser Trp Val Glu Ile Glu Asn Val Thr Val Gly Ile Gly Asn
420 425 430
Ser Leu Gln Leu Lys Arg Gln Ile Arg Leu Asp Gly Tyr Ala Asp Lys
435 440 445
Lys Gln Lys Val Lys Tyr Tyr Asp Tyr Ser Ser Arg Phe Glu Leu Thr
450 455 460
Gly Val Leu Gly Gly Ala Lys Ile Gln Phe Asp Arg Lys His Leu Lys
465 470 475 480
Lys Ala Ala His Arg Leu Ala Glu Gly Glu Thr Gly Pro Ile Phe Leu
485 490 495
Asn Val Val Val Asp Val Glu Pro Phe Leu Glu Val Lys Asn Gly Arg
500 505 510
Leu Arg Thr Pro Leu Gly Gln Val Leu Gln Val Asn Thr Arg Asp Trp
515 520 525
Pro Lys Val Val Asp Tyr Lys Ala Lys Glu Leu Ser Val Leu Met Glu
530 535 540
Asn Thr Gln Ile Gly Asn Glu Asn Gly Val Ser Thr Ile Glu Ala Gly
545 550 555 560
Met Arg Ile Met Ser Ile Asp Leu Gly Gln Arg Thr Ala Ala Ala Val
565 570 575
Ser Ile Phe Glu Val Ile Ser Lys Lys Pro Asp Glu Lys Glu Thr Lys
580 585 590
Leu Phe Tyr Pro Ile Ala Asp Thr Asp Leu Tyr Ala Val His Arg Arg
595 600 605
Ser Leu Leu Leu Arg Leu Pro Gly Glu Glu Ile Ser Ser Lys Lys Met
610 615 620
Ile Glu Lys Arg Lys Glu Arg Ala Arg Ile Arg Ser Leu Val Arg Tyr
625 630 635 640
Gln Ile Arg Leu Leu Ser Glu Val Leu Arg Leu His Thr Gln Gly Thr
645 650 655
Ala Glu Gln Arg Arg Phe Lys Leu Asp Glu Leu Leu Val Ser Ile Gln
660 665 670
Lys Lys Leu Glu Leu Asp Gln Ser Glu Trp Ile Ser Glu Leu Glu Lys
675 680 685
Leu Phe Asp Tyr Ile Asp Glu Ser Ala Glu Lys Trp Lys Glu Ala Leu
690 695 700
Val Val Ala His Arg Thr Leu Glu Pro Ile Val Val Glu Ala Val Arg
705 710 715 720
Asn Trp Lys Lys Ser Leu Ser Lys Glu Asn Lys Asp Arg Arg Arg Ile
725 730 735
Ala Gly Ile Ser Ile Trp Ser Ile Glu Glu Leu Glu Glu Thr Arg Lys
740 745 750
Leu Leu Ile Ala Trp Ser Lys His Ser Arg Glu Pro Gly Ile Pro Lys
755 760 765
Arg Leu Glu Lys Glu Glu Thr Phe Ala Pro Glu His Leu Gln His Ile
770 775 780
Gln Asn Val Lys Asp Asp Arg Leu Lys Gln Met Ala Asn Leu Phe Val
785 790 795 800
Met Thr Ala Leu Gly Tyr Lys Tyr Asp Glu Gly Asn Lys Arg Trp Val
805 810 815
Glu Ala Tyr Pro Ala Cys Gln Val Ile Leu Phe Glu Asp Leu Ser Arg
820 825 830
Tyr Arg Phe Ala Leu Asp Arg Pro Arg Arg Glu Asn Asn Arg Leu Met
835 840 845
Lys Trp Ala His Arg Ser Ile Pro Arg Leu Thr Tyr Met Gln Ala Glu
850 855 860
Leu Phe Gly Ile Gln Val Gly Asp Val Tyr Ser Ala Tyr Thr Ser Arg
865 870 875 880
Phe His Ala Lys Thr Gly Ala Pro Gly Ile Arg Cys His Ala Leu Thr
885 890 895
Glu Ala Asp Leu Gln Ser Asn Ser Tyr Val Val Asn Gln Leu Ile Lys
900 905 910
Asp Lys Phe Ile Gln Asp Asn Gln Thr Glu Ile Leu Lys Ala Gly Gln
915 920 925
Ile Val Pro Trp Gln Gly Gly Glu Leu Phe Val Thr Phe Ala Asp Arg
930 935 940
Ser Gly Ala Ser Leu Ala Val Ile His Ala Asp Ile Asn Ala Ala Gln
945 950 955 960
Asn Leu Gln Lys Arg Phe Trp Gln His Asn Ser Glu Val Phe Arg Val
965 970 975
Pro Cys Lys Val Val Lys Gly Gly Leu Val Pro Val Tyr Glu Lys Met
980 985 990
Arg Lys Leu Phe Gly Lys Gly Leu Phe Val Asn Ile Asp Asp Pro Glu
995 1000 1005
Ser Lys Glu Val Tyr Arg Trp Glu His Ser Thr Lys Met Lys Ser Lys
1010 1015 1020
Thr Thr Pro Val Asp Leu Glu Ser Glu Asp Ile Asp His Glu Glu Leu
1025 1030 1035 1040
Ser Asp Glu Trp Glu Asp Met Gln Glu Gly Tyr Lys Thr Leu Leu Arg
1045 1050 1055
Asp Pro Ser Gly Phe Phe Trp Ser Ser Asp Ser Trp Ile Pro Gln Lys
1060 1065 1070
Asp Phe Trp Ile Arg Val Lys Ser Arg Ile Gly Lys Ser Leu Arg Glu
1075 1080 1085
Gln Ile Arg
1090
<210> 3
<211> 106
<212> RNA
<213> other sequences
<220>
<223> RNA tracr for B-Gen.1
<400> 3
uaauaaauaa uaugaguuac aggcucaugu cauuccgugc gugugcugcg aggcucuuac 60
aacgucucaa ccacgggauc acguuauuuc cacuaaguga uuggac 106
<210> 4
<211> 109
<212> RNA
<213> other sequences
<220>
<223> RNA tracr for B-Gen.2
<400> 4
cuggauauaa uaaagauguu uagcuauagg cuaauaagau aguuguguca agugcuucgg 60
agaccuaaca cgucauccag ucacaacggc uaucuauauu uccacuaac 109
<210> 5
<211> 106
<212> DNA
<213> other sequences
<220>
<223> DNA encoding the RNA tracr for B-Gen.1
<400> 5
taataaataa tatgagttac aggctcatgt cattccgtgc gtgtgctgcg aggctcttac 60
aacgtctcaa ccacgggatc acgttatttc cactaagtga ttggac 106
<210> 6
<211> 109
<212> DNA
<213> other sequences
<220>
<223> DNA encoding the RNA tracr for B-Gen.2
<400> 6
ctggatataa taaagatgtt tagctatagg ctaataagat agttgtgtca agtgcttcgg 60
agacctaaca cgtcatccag tcacaacggc tatctatatt tccactaac 109
<210> 7
<211> 8715
<212> DNA
<213> other sequences
<220>
<223> Plasmid pBLR373 including the insert for B-GEn.1
<400> 7
gctcagtcct aggtataatg ctagctaata cgactcacta taggagagac catggccacc 60
ggtctctgct aaagatatga ggagctcaaa ctggagctgc taacaaagcc cgaaaggaag 120
ctgagttggc tgctgccacc gctgagcaat aactagcata accccttggg gcctctaaac 180
gggtcttgag gggttttttg ctgaaaggag gaactatatc cggattggcg aatgggacgc 240
gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac 300
acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt 360
cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc gatttagtgc 420
tttacggcac ctcgacccca aaaaacttga ttagggtgat ggttcacgta gtgggccatc 480
gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact 540
cttgttccaa actggaacaa cactcaaccc tatctcggtc tattcttttg atttataagg 600
gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc 660
gaattttaac aaaatattaa cgtttacaat ttcaggtggc acttttcggg gaaatgtgcg 720
cggaacccct atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgaatta 780
attcttagaa aaactcatcg agcatcaaat gaaactgcaa tttattcata tcaggattat 840
caataccata tttttgaaaa agccgtttct gtaatgaagg agaaaactca ccgaggcagt 900
tccataggat ggcaagatcc tggtatcggt ctgcgattcc gactcgtcca acatcaatac 960
aacctattaa tttcccctcg tcaaaaataa ggttatcaag tgagaaatca ccatgagtga 1020
cgactgaatc cggtgagaat ggcaaaagtt tatgcatttc tttccagact tgttcaacag 1080
gccagccatt acgctcgtca tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg 1140
attgcgcctg agcgagacga aatacgcgat cgctgttaaa aggacaatta caaacaggaa 1200
tcgaatgcaa ccggcgcagg aacactgcca gcgcatcaac aatattttca cctgaatcag 1260
gatattcttc taatacctgg aatgctgttt tcccggggat cgcagtggtg agtaaccatg 1320
catcatcagg agtacggata aaatgcttga tggtcggaag aggcataaat tccgtcagcc 1380
agtttagtct gaccatctca tctgtaacat cattggcaac gctacctttg ccatgtttca 1440
gaaacaactc tggcgcatcg ggcttcccat acaatcgata gattgtcgca cctgattgcc 1500
cgacattatc gcgagcccat ttatacccat ataaatcagc atccatgttg gaatttaatc 1560
gcggcctaga gcaagacgtt tcccgttgaa tatggctcat aacacccctt gtattactgt 1620
ttatgtaagc agacagtttt attgttcatg accaaaatcc cttaacgtga gttttcgttc 1680
cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg 1740
cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg 1800
gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca 1860
aatactgtcc ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg 1920
cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg 1980
tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 2040
acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 2100
ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 2160
ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 2220
tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 2280
tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc 2340
ctggcctttt gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg 2400
gataaccgta ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag 2460
cgcagcgagt cagtgagcga ggaagcggaa gagcgcctga tgcggtattt tctccttacg 2520
catctgtgcg gtatttcaca ccgcatatat ggtgcactct cagtacaatc tgctctgatg 2580
ccgcatagtt aagccagtat acactccgct atcgctacgt gactgggtca tggctgcgcc 2640
ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc 2700
ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt caccgtcatc 2760
accgaaacgc gcgaggcagc tgcggtaaag ctcatcagcg tggtcgtgaa gcgattcaca 2820
gatgtctgcc tgttcatccg cgtccagctc gttgagtttc tccagaagcg ttaatgtctg 2880
gcttctgata aagcgggcca tgttaagggc ggttttttcc tgtttggtca ctgatgcctc 2940
cgtgtaaggg ggatttctgt tcatgggggt aatgataccg atgaaacgag agaggatgct 3000
cacgatacgg gttactgatg atgaacatgc ccggttactg gaacgttgtg agggtaaaca 3060
actggcggta tggatgcggc gggaccagag aaaaatcact cagggtcaat gccagcgctt 3120
cgttaataca gatgtaggtg ttccacaggg tagccagcag catcctgcga tgcagatccg 3180
gaacataatg gtgcagggcg ctgacttccg cgtttccaga ctttacgaaa cacggaaacc 3240
gaataccatt catgttgttg ctcaggtcgc agacgttttg cagcagcagt cgcttcacgt 3300
tcgctcgcgt atcggtgatt cattctgcta accagtaagg caaccccgcc agcctagccg 3360
ggtcctcaac gacaggagca cgatcatgcg cacccgtggg gccgccatgc cggcgataat 3420
ggcctgcttc tcgccgaaac gtttggtggc gggaccagtg acgaaggctt gagcgagggc 3480
gtgcaagatt ccgaataccg caagcgacag gccgatcatc gtcgcgctcc agcgaaagcg 3540
gtcctcgccg aaaatgaccc agagcgctgc cggcacctgt cctacgagtt gcatgataaa 3600
gaatacagtc ataagtgcgg cgacgatagt catgccccgc gcccaccgga aggagctgac 3660
tgggttgaag gctctcaagg gcatcggtcg agatcccggt gcctaatgag tgagctaact 3720
tacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct 3780
gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc gccagggtgg 3840
tttttctttt caccagtgag acgggcaaca gctgattgcc cttcaccgcc tggccctgag 3900
agagttgcag caagcggtcc acgctggttt gccccagcag gcgaaaatcc tgtttgatgg 3960
tggttaacgg cgggatataa catgagctgt attcggtatc gtcgtatccc actaccgaga 4020
tatccgcacc aacgcgcagc ccggactcgg taatggcgcg cattgcgccc agcgccatct 4080
gatcgttggc aaccagcatc gcagtgggaa cgatgccctc attcagcatt tgcatggttt 4140
gttgaaaacc ggacatggca ctccagtcgc cttcccgttc cgctatcggc tgaatttgat 4200
tgcgagtgag atatttatgc cagccagcca gacgcagacg cgccgagaca gaacttaatg 4260
ggcccgctaa cagcgcgatt tgctggtgac ccaatgcgac cagatgctcc acgcccagtc 4320
gcgtaccgta ttcatgggag aaaataatac tgttgatggg tgtctggtca gagacatcaa 4380
gaaataacgc cggaacatta gtgcaggcag cttccacagc aatggcatcc tggtcatcca 4440
gcggatagtt aatgatcagc ccactgacgc gttgcgcgag aagattgtgc accgccgctt 4500
tacaggcttc gacgccgctt cgttctacca tcgacaccac cacgctggca cccagttgat 4560
cggcgcgaga tttaatcgcc gcgacaattt gcgacggcgc gtgcagggcc agactggagg 4620
tggcaacgcc aatcagcaac gactgtttgc ccgccagttg ttgtgccacg cggttgggaa 4680
tgtaattcag ctccgccatc gccgcttcca ctttttcccg cgttttcgca gaaacgtggc 4740
tggcctggtt caccacgcgg gaaacggtct gataagagac accggcatac tctgcgacat 4800
cgtataacgt tactggtttc acattcacca ccctgaattg actctcttcc gggcgctatc 4860
atgccatacc gcgaaaggtt ttgcgccatt cgatggtgtc cgggatctcg acgctctccc 4920
ttatgcgact cctgcattag gaagcagccc agtagtaggt tgaggccgtt gagcaccgcc 4980
gccgcaagga atggtgcatg caaggagatg gcgcccaaca gtcccccggc cacggggcct 5040
gccaccatac ccacgccgaa acaagcgctc atgagcccga agtggcgagc ccgatcttcc 5100
ccatcggtga tgtcggcgat ataggcgcca gcaaccgcac ctgtggcgcc ggtgatgccg 5160
gccacgatgc gtccggcgta gaggatcgag atctcgatcc cgcgaaatta atacgactca 5220
ctatagggga attgtgagcg gataacaatt cccctctaga tttacacttt atgcttccgg 5280
ctcgtatgtt tctagagaat tcaaataatt ttgtttaact ttaagaagga gatttaaata 5340
tgaaaatcga agaaggtaaa ggtcaccacc atcatcacca tatgaccatt cgctcgatga 5400
aattaaaact caagatttac tcaggccgct ctgcgccgca attacgccag ggtctgtggc 5460
gtttacaccg tctgctcaat gaaggcaccg cttattatat ggactggtta gtacacatgc 5520
gtcaagaagc cttaccgggc aaatcgaaag aggagattcg tgcggagctg gaacgccgtg 5580
ttcgccagca gcaagagaag aacggcgttc aaaacgatca agttcccatg gatgaggttc 5640
tgagtgcgct gcgtcagctg tacgaattac tggtgcccag tgcggttaac aacagcggcg 5700
acgcacagac cctcagccgc aagtttctga gcccgctggt cgacccgaac tcggaaggtg 5760
gcaaaggaac cagcaacgcc ggtgcaaaac cgggctggcg caagaagcaa gaagcgggcg 5820
atcctagctg ggaaaaggat tacgaacgtt ggttaaaacg caagcaggcg gatccgacgg 5880
ctgaaatttt aggcaaactg gaaacggcgg gtctgaagcc actgttccct ctgtacacaa 5940
acgaagtgaa agatatccgt tggatgccgt taacctcgaa acagtatgtg cgtaactggg 6000
atcgcgacat gtttcagcag gcgattgaac atctgttaag ctgggaaacc tggaaccgca 6060
aggtgaatga agaacgcgcc aaacttaaag aaacagtacg tcgcttcgaa gaacagcatt 6120
tagcgaatgg taaggattgg ctgagcccac tgcaggcata tgaagcaaac cgcgaacagg 6180
cgctgcgtga tatggcaatt tcgcctagcg accgttttcg catcacccgc cgtcagatta 6240
aaggctggtc ggaactttat gaacgttgga acaagctggc gcccacagcg tcagttgagg 6300
catacatgca agaggtacgt cacgtgcaga agaagctggg cgggacgttt ggtgatgcgg 6360
acttatatcg tttcctggca aagccggaga atgtgcacat ctggcgcgat catcaggaac 6420
gtctgcatta ttacgcagcg tacaacgacc ttcacaaacg ccttatgtcg gccaaagagc 6480
aagcggcctt taccctgccg gatccggtgg cgcatccgct gtgggtccgc ttcgatgcac 6540
gtgatggcaa ccttttcacc tacattctgc aagcggattc atcaaaacag cgctcccgcc 6600
gctatgttaa tttctcccgc tttctttggc cggtcgaaga tggttacttt gaagaaaccg 6660
aaaacgtgaa agtagaattg gcattgtcga agcagtttta tcgccaggtt atcgttcatg 6720
ataaccctac aggcaaacag aaaattacct ttcaagatta ttcgagcaag gaaattctgg 6780
aaggtcattt gggcggagcg aaactgcaac tggatcgcaa tttcctgcgt aagtccggac 6840
gtgattttga aacaggtgat ttcggaccgg cattcttgaa cgttgtatta gacctcaaac 6900
cgaaacaaga ggttaagaac ggacgcctgc aatctcctct gggccaggcg ttactggtga 6960
aaagtcgccc aaacgatatc ccgaaagttt acggctataa gcctgatgcc ctggcggcct 7020
ggttggaaca ggcctcgggt gaggaaagtt tgggcagtga aagcctgcgc cagggcttcc 7080
gtgtgatgag tatcgattta ggcgttcgca gtgccgccgc gattagcgtt ttctctgtga 7140
aaggcgagaa aacccgcgaa ggcgataaag tttgttaccc ggtgggcgaa acgggtctgt 7200
ttgcggtgca cgaccgtagc ttcttattgc gccttccggg agaatcatca gagaaacgtg 7260
tgaacgttga gcgtgataaa cgtaaaaccg aacgcatgca gattcgctat catattcgta 7320
ccctggcacg cgtactgcgt ctggccaata aagcgactcc tatggatcgc atcaaagcgg 7380
tgcaggatgt gctgaacgat attgaaagta cacgttttat gaatgaccac gaccaccatg 7440
tgtacaacca tgcactggaa acgctgcgca cttatgcgcc ggatcatcag ggcatctggg 7500
aagaacaggt cattgcggcc caccgtcaac tggagcatca tgtgggcgtg attgtgggcg 7560
aatggcgtaa gaactggggc aaagatcgtc gtggaaccgt cggcctgtcc atggacaaca 7620
ttgaggaatt agacgaaatg cgccgtctgc tcatctcatg gtcacgtcgc gcgcgttacc 7680
cgcgcgaagc taaaccattt caagtcaacg aaagtaaccc ggtccacctc ttacgtcatt 7740
tgcagaatct caaagaggat cgcttgaaac aattagctaa cttaattgtg atgaccgcgc 7800
ttggctacgt gtatgacagc aaagagaaga aatggaaagc ggcgtatccg gcatgccagc 7860
tgattctgtt tgaggatctg caacgctatc gctttcatct ggatcgtagc gcccgtgaga 7920
acagccaact gatgaaatgg gcgcatcgca gcattccaaa atatgtgtgg atgcaaggcg 7980
aaccgtatgg tctgcagatt ggagatgttt gggccggttt tacctcgcgc taccacgcga 8040
aaaccggtgc ccccggcatt cgttgcaaag cgttgaccga aaaggacttt caacagggtc 8100
gtctgctgga gtcgttggtc gccgaaggta tgttcacgct gcaggaagta ggtactctga 8160
aacctgggga tattgtgccg gcggaaggtg gagaactgtt tgtgaccttg gcggatgaca 8220
gtggggatcg tattgtgatc acccatgcgg atattaacgc agcgcagaat gtacagaaac 8280
gcttttggct cgcgaactcg gagcgctttc gcgtggcctg ccgctcggtg cagattgcca 8340
gccaggagtg cttcattcct agcagtgagt cggttgccaa gaaaatgggg aaaggcgtat 8400
ttgtgcgcga cttctcgttt cataaggata tggaagtgta tcattggaac aatcaagtca 8460
agctgaccgc aaagaatgta ccgaccgatc attctgacga tctgcaggat ctccaggatt 8520
atcaggcgat tcttgaagag gctcgcgaaa gttcatcaag ctacaaaacg ctgtttcgcg 8580
atcctagcgg gttcttcttt ccggatgatg tctgggtgcc ccaaaatatc tattggcgtg 8640
aagtcaagaa aaccattacc gcgttactgc gtaaacgtat tatgagcact taactcgagt 8700
aatgattgac agcta 8715
<210> 8
<211> 8679
<212> DNA
<213> other sequences
<220>
<223> Plasmid pBLR373 including the insert for B-GEn.2
<400> 8
gctcagtcct aggtataatg ctagctaata cgactcacta taggagagac catggccacc 60
ggtctctgct aaagatatga ggagctcaaa ctggagctgc taacaaagcc cgaaaggaag 120
ctgagttggc tgctgccacc gctgagcaat aactagcata accccttggg gcctctaaac 180
gggtcttgag gggttttttg ctgaaaggag gaactatatc cggattggcg aatgggacgc 240
gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac 300
acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt 360
cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc gatttagtgc 420
tttacggcac ctcgacccca aaaaacttga ttagggtgat ggttcacgta gtgggccatc 480
gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact 540
cttgttccaa actggaacaa cactcaaccc tatctcggtc tattcttttg atttataagg 600
gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc 660
gaattttaac aaaatattaa cgtttacaat ttcaggtggc acttttcggg gaaatgtgcg 720
cggaacccct atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgaatta 780
attcttagaa aaactcatcg agcatcaaat gaaactgcaa tttattcata tcaggattat 840
caataccata tttttgaaaa agccgtttct gtaatgaagg agaaaactca ccgaggcagt 900
tccataggat ggcaagatcc tggtatcggt ctgcgattcc gactcgtcca acatcaatac 960
aacctattaa tttcccctcg tcaaaaataa ggttatcaag tgagaaatca ccatgagtga 1020
cgactgaatc cggtgagaat ggcaaaagtt tatgcatttc tttccagact tgttcaacag 1080
gccagccatt acgctcgtca tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg 1140
attgcgcctg agcgagacga aatacgcgat cgctgttaaa aggacaatta caaacaggaa 1200
tcgaatgcaa ccggcgcagg aacactgcca gcgcatcaac aatattttca cctgaatcag 1260
gatattcttc taatacctgg aatgctgttt tcccggggat cgcagtggtg agtaaccatg 1320
catcatcagg agtacggata aaatgcttga tggtcggaag aggcataaat tccgtcagcc 1380
agtttagtct gaccatctca tctgtaacat cattggcaac gctacctttg ccatgtttca 1440
gaaacaactc tggcgcatcg ggcttcccat acaatcgata gattgtcgca cctgattgcc 1500
cgacattatc gcgagcccat ttatacccat ataaatcagc atccatgttg gaatttaatc 1560
gcggcctaga gcaagacgtt tcccgttgaa tatggctcat aacacccctt gtattactgt 1620
ttatgtaagc agacagtttt attgttcatg accaaaatcc cttaacgtga gttttcgttc 1680
cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg 1740
cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg 1800
gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca 1860
aatactgtcc ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg 1920
cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg 1980
tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 2040
acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 2100
ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 2160
ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 2220
tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 2280
tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc 2340
ctggcctttt gctggccttt tgctcacatg ttctttcctg cgttatcccc tgattctgtg 2400
gataaccgta ttaccgcctt tgagtgagct gataccgctc gccgcagccg aacgaccgag 2460
cgcagcgagt cagtgagcga ggaagcggaa gagcgcctga tgcggtattt tctccttacg 2520
catctgtgcg gtatttcaca ccgcatatat ggtgcactct cagtacaatc tgctctgatg 2580
ccgcatagtt aagccagtat acactccgct atcgctacgt gactgggtca tggctgcgcc 2640
ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc cggcatccgc 2700
ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt caccgtcatc 2760
accgaaacgc gcgaggcagc tgcggtaaag ctcatcagcg tggtcgtgaa gcgattcaca 2820
gatgtctgcc tgttcatccg cgtccagctc gttgagtttc tccagaagcg ttaatgtctg 2880
gcttctgata aagcgggcca tgttaagggc ggttttttcc tgtttggtca ctgatgcctc 2940
cgtgtaaggg ggatttctgt tcatgggggt aatgataccg atgaaacgag agaggatgct 3000
cacgatacgg gttactgatg atgaacatgc ccggttactg gaacgttgtg agggtaaaca 3060
actggcggta tggatgcggc gggaccagag aaaaatcact cagggtcaat gccagcgctt 3120
cgttaataca gatgtaggtg ttccacaggg tagccagcag catcctgcga tgcagatccg 3180
gaacataatg gtgcagggcg ctgacttccg cgtttccaga ctttacgaaa cacggaaacc 3240
gaataccatt catgttgttg ctcaggtcgc agacgttttg cagcagcagt cgcttcacgt 3300
tcgctcgcgt atcggtgatt cattctgcta accagtaagg caaccccgcc agcctagccg 3360
ggtcctcaac gacaggagca cgatcatgcg cacccgtggg gccgccatgc cggcgataat 3420
ggcctgcttc tcgccgaaac gtttggtggc gggaccagtg acgaaggctt gagcgagggc 3480
gtgcaagatt ccgaataccg caagcgacag gccgatcatc gtcgcgctcc agcgaaagcg 3540
gtcctcgccg aaaatgaccc agagcgctgc cggcacctgt cctacgagtt gcatgataaa 3600
gaatacagtc ataagtgcgg cgacgatagt catgccccgc gcccaccgga aggagctgac 3660
tgggttgaag gctctcaagg gcatcggtcg agatcccggt gcctaatgag tgagctaact 3720
tacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct 3780
gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc gccagggtgg 3840
tttttctttt caccagtgag acgggcaaca gctgattgcc cttcaccgcc tggccctgag 3900
agagttgcag caagcggtcc acgctggttt gccccagcag gcgaaaatcc tgtttgatgg 3960
tggttaacgg cgggatataa catgagctgt attcggtatc gtcgtatccc actaccgaga 4020
tatccgcacc aacgcgcagc ccggactcgg taatggcgcg cattgcgccc agcgccatct 4080
gatcgttggc aaccagcatc gcagtgggaa cgatgccctc attcagcatt tgcatggttt 4140
gttgaaaacc ggacatggca ctccagtcgc cttcccgttc cgctatcggc tgaatttgat 4200
tgcgagtgag atatttatgc cagccagcca gacgcagacg cgccgagaca gaacttaatg 4260
ggcccgctaa cagcgcgatt tgctggtgac ccaatgcgac cagatgctcc acgcccagtc 4320
gcgtaccgta ttcatgggag aaaataatac tgttgatggg tgtctggtca gagacatcaa 4380
gaaataacgc cggaacatta gtgcaggcag cttccacagc aatggcatcc tggtcatcca 4440
gcggatagtt aatgatcagc ccactgacgc gttgcgcgag aagattgtgc accgccgctt 4500
tacaggcttc gacgccgctt cgttctacca tcgacaccac cacgctggca cccagttgat 4560
cggcgcgaga tttaatcgcc gcgacaattt gcgacggcgc gtgcagggcc agactggagg 4620
tggcaacgcc aatcagcaac gactgtttgc ccgccagttg ttgtgccacg cggttgggaa 4680
tgtaattcag ctccgccatc gccgcttcca ctttttcccg cgttttcgca gaaacgtggc 4740
tggcctggtt caccacgcgg gaaacggtct gataagagac accggcatac tctgcgacat 4800
cgtataacgt tactggtttc acattcacca ccctgaattg actctcttcc gggcgctatc 4860
atgccatacc gcgaaaggtt ttgcgccatt cgatggtgtc cgggatctcg acgctctccc 4920
ttatgcgact cctgcattag gaagcagccc agtagtaggt tgaggccgtt gagcaccgcc 4980
gccgcaagga atggtgcatg caaggagatg gcgcccaaca gtcccccggc cacggggcct 5040
gccaccatac ccacgccgaa acaagcgctc atgagcccga agtggcgagc ccgatcttcc 5100
ccatcggtga tgtcggcgat ataggcgcca gcaaccgcac ctgtggcgcc ggtgatgccg 5160
gccacgatgc gtccggcgta gaggatcgag atctcgatcc cgcgaaatta atacgactca 5220
ctatagggga attgtgagcg gataacaatt cccctctaga tttacacttt atgcttccgg 5280
ctcgtatgtt tctagagaat tcaaataatt ttgtttaact ttaagaagga gatttaaata 5340
tgaaaatcga agaaggtaaa ggtcaccacc atcatcacca tatgcctatt cgctccttta 5400
aactgaaact ggtgacacat aacggcgata gcacatatat ggataaactt cgtcgcggtc 5460
tgtggaaaac gcacgttatc atcaatcgcg gtatcgccta ttatatgaac accctcgcgc 5520
tgatgcgcca ggaaccgtac ggctcgaaat ctcgtgaaga agtgcgcctg gatttgctct 5580
cgacgttacg tgaacagcaa cgtcgcaata actggtccga gcaaacaggt actgacgatg 5640
agctcctttc gctgagtcgc cgcgtctacg aactcttggt gccctcggca atcggcgaaa 5700
agggcgacgc gcagatgctg agtcgtaaat tcctgagccc gttggttgac ccgaatagcg 5760
aaggcggccg cggaaccgcg aaaagcggtc gcaaaccgcg ttggaagaag atgatggaag 5820
aagggcatcc ggattgggaa aaggagaaag agaaagatgc cgcgaagaag gccgaagatc 5880
cgacagccag tattctcgcg gatctcgaag ccgtaggcct tctgccgctc tttcctttgt 5940
tcagcgacga acagaaagag atccgctggc tccccaagaa gaaacgccag tttgtacgta 6000
cgtgggatcg cgatatgttt cagcaggccc tggaacgtat gctgtcttgg gagagttgga 6060
accgccgtgt tgcggaagag tacctgaaac tgcaggcgca gcgcgatgag gtgtacgcga 6120
agtatctcga agatgccggc tcctggttga acgatttaca gacctttgag aaacagcgtg 6180
aagaggagct cgcagaggtg agttttgaac cgaactccga gtacctcatc actcgtcgcc 6240
agatccgcgg ttggaaagaa gtctatgaga aatggtcgaa aaccagcgaa aatgcctcac 6300
aggaacagct gtggcgtatg gtggcggacg tgcagaccgc gatggcagga gcatttggag 6360
atccaaaagt gtaccagttc ttgagccagc ctaaacacca ccacatctgg cgcgaacacc 6420
cgaaccgtct gttttactat tcgaaataca atgaagtccg tgagaaattg aaccgcgcaa 6480
agaagcaagc cgcatttacg ctcccggacc cggttgaaca tccactttgg acccgctttg 6540
atgcgcgcgg cggtaacatc catgactatg aaatcagcaa agtagggaaa cagtatcatg 6600
ttaccttttc gtcactgatt cttccggaag cacagagctg ggtggaaatc gaaaatgtga 6660
cggtcggcat tggcaattca ctgcaattaa aacgccaaat tcgtttagat ggttacgctg 6720
acaagaaaca gaaagtgaag tattacgact atagcagccg cttcgaactt accggcgtgc 6780
tgggtggtgc gaagattcag tttgatcgta aacatctgaa gaaggcggcg caccgcttag 6840
ctgaaggtga gactggcccg attttcctca acgtggtagt ggacgtggag ccctttcttg 6900
aagtaaagaa cggacgcttg cgtacccctc tgggtcaggt gttacaagtg aatacccgtg 6960
attggccgaa ggttgtcgac tacaaagcga aagaactctc ggtgctgatg gaaaataccc 7020
agatcggtaa cgagaatggc gtatccacaa ttgaagctgg aatgcgtatt atgagcattg 7080
atctgggcca gcgcaccgcg gctgccgtgt ccattttcga agtaatcagc aagaagccgg 7140
acgaaaagga aaccaaatta ttctatccga tcgctgatac cgacctgtac gccgtgcacc 7200
gccgcagttt actgctgcgt ctgccgggag aggaaattag cagtaagaag atgattgaaa 7260
agcgcaaaga acgtgcgcgc atccgtagct tagtgcgcta tcagattcgc ctgctgagtg 7320
aggttctgcg tctgcacacc cagggaacgg cggagcaacg tcgttttaag ctggatgagt 7380
tgctggtcag cattcagaag aagttagaat tggatcaaag tgagtggatt agtgaattag 7440
aaaagttatt cgattatatc gacgaaagcg cggagaagtg gaaggaagca ctggtagtgg 7500
cgcaccgcac cttggaaccg attgtggtag aagccgtgcg taattggaag aagtcacttt 7560
ctaaggaaaa taaagaccgc cgccgtatcg ccggcatttc aatctggagt attgaagaac 7620
ttgaagaaac gcgtaagtta ctgattgctt ggtccaaaca ttcccgtgaa ccaggaatcc 7680
ctaagcgcct ggagaaagag gaaaccttcg cgcctgaaca tctgcaacac atccaaaatg 7740
ttaaggatga tcgtctgaaa cagatggcaa acctgtttgt tatgacagcg ttgggctata 7800
aatatgatga aggcaataag cgctgggttg aggcataccc ggcatgccag gtgattctgt 7860
ttgaggatct cagccgttac cgttttgccc tggaccgtcc gcgccgcgag aataaccgct 7920
taatgaaatg ggcccaccgc agtattccgc gtctgaccta catgcaggcc gagctgtttg 7980
gcattcaagt aggcgatgtt tactcagcct acactagccg cttccatgca aagaccgggg 8040
cgccgggcat ccgctgccac gccctgacag aggcggacct gcaatccaat agctatgtgg 8100
taaaccagtt gattaaggat aaattcatcc aagacaatca gaccgaaatc ctgaaagcgg 8160
gccagatcgt cccgtggcag ggcggcgaac tcttcgtgac gttcgcggat cgcagtggcg 8220
ccagcttggc agtcattcat gccgacatta atgccgcgca gaatcttcag aaacgctttt 8280
ggcaacacaa ctcggaagtg tttcgcgtcc cgtgcaaagt ggtgaaaggt ggcctcgttc 8340
cggtgtacga gaaaatgcgc aaactgttcg ggaaaggatt atttgtcaac atcgacgatc 8400
ccgaaagcaa ggaagtgtac cgttgggaac atagcacgaa aatgaaatca aagacgaccc 8460
ctgtcgattt ggagtcagaa gatatcgatc acgaggaatt aagcgatgag tgggaagata 8520
tgcaggaagg ctacaagacg ctgcttcgcg acccttcggg tttcttttgg tcgagtgact 8580
cttggattcc tcagaaagat ttctggattc gcgtgaaaag ccgcatcggc aaatcgcttc 8640
gcgagcagat tcgttaactc gagtaatgat tgacagcta 8679
<210> 9
<211> 8018
<212> DNA
<213> other sequences
<220>
<223> expression construct containing B-Gen.1 with N-terminal linker, a
C-terminal linker, T2A-GFP
<400> 9
aaagtagagg aacttcactt cattttgcta gaccggtacc gcgttacata acttacggta 60
aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat agtaacgcca 120
atagggactt tccattgacg tcaatgggtg gagtatttac ggtaaactgc ccacttggca 180
gtacatcaag tgtatcatat gccaagtacg ccccctattg acgtcaatga cggtaaatgg 240
cccgcctggc attgtgccca gtacatgacc ttatgggact ttcctacttg gcagtacatc 300
tacgtattag tcatcgctat taccatggtc gaggtgagcc ccacgttctg cttcactctc 360
cccatctccc ccccctcccc acccccaatt ttgtatttat ttatttttta attattttgt 420
gcagcgatgg gggcgggggg gggggggcgc gcgccaggtg gggcggggcg gggcgagggg 480
cggggcgggg cgaggcggag aggtgcggcg gcagccaatc agagcggcgc gctccgaaag 540
tttcctttta tggcgaggcg gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg 600
gcgggagtcg ctgcgcgctg ccttcgcccc gtgccccgct ccgccgccgc ctcgcgccgc 660
ccgccccggc tctgactgac cgcgttactc ccacaggtga gcgggcggga cggcccttct 720
cctccgggct gtaattagct gagcaagagg taagggttta agggatggtt ggttggtggg 780
gtattaatgt ttaattacct ggagcacctg cctgaaatca ctttttttca ggttggcaac 840
cgcggacacc caagcggccg ccaatgaaga ggcctgccgc cacaaagaag gccggccagg 900
ccaagaagaa gaagggtggc ggtggtagtg gtggcggtgg ttcaggcggt ggcggctcag 960
gctccatgcc tattcgctct tttaagctga aacttgtaac ccataacggc gatagtacgt 1020
acatggataa actgcgccgc ggcctgtgga aaactcatgt gataataaac cgcggcatcg 1080
cgtactacat gaacaccttg gccctcatga ggcaagaacc ctacgggtcc aagagccggg 1140
aagaagtacg gttggatctg ctttccactc tgagagagca gcaacgccgg aacaattggt 1200
cagaacaaac cgggactgat gatgaattgc tttccctgag ccgtcgagtt tacgagcttc 1260
ttgtaccatc cgctataggt gaaaagggcg atgcgcaaat gctgagccgc aaatttctct 1320
cccctctcgt ggacccaaac agtgagggcg ggcgcgggac cgccaaaagt gggagaaagc 1380
cacggtggaa gaagatgatg gaagaaggac accccgactg ggaaaaggag aaggaaaagg 1440
atgcggctaa gaaggcagag gatccaacag catctatatt ggcggatctc gaggcagtgg 1500
gactgttgcc acttttcccg ctgttttctg acgaacagaa agaaatccgc tggctcccca 1560
agaagaagcg tcagtttgtg aggacatggg accgggatat gttccaacag gcccttgaac 1620
gaatgctgag ctgggaaagc tggaatcgca gagttgccga ggaatacttg aagctccagg 1680
cccagcggga cgaggtgtat gccaaatacc ttgaggatgc tggctcctgg cttaatgatc 1740
tgcagacttt cgaaaagcag cgcgaagagg aactggcgga agtaagcttc gaacccaact 1800
ctgagtacct gattactcgc cggcagattc gcgggtggaa ggaagtgtat gaaaagtggt 1860
caaagaccag cgaaaatgcg agccaggagc agttgtggcg gatggtggct gacgtgcaga 1920
ctgccatggc cggcgcgttc ggagatccca aagtgtacca gtttctttct cagcctaagc 1980
accaccatat ttggagagag catccaaata gactgttcta ctacagcaag tacaacgagg 2040
tccgggagaa gctcaacagg gccaagaagc aggcggcctt taccctgcca gatcccgtgg 2100
agcacccact gtggacacgt tttgatgcgc gcggcggcaa tatccatgac tacgagatat 2160
ccaaggtggg caagcaatac cacgtgacgt tcagctctct tatcctgcca gaggcccaga 2220
gttgggtgga gattgagaat gttacagtgg gtatcgggaa cagcctgcag ctgaaacgcc 2280
agattcgctt ggacggttac gcagacaaga agcagaaagt caaatattat gattattcca 2340
gcaggttcga gctcacagga gtactcggcg gagcaaagat ccaattcgat aggaagcatc 2400
ttaagaaggc tgctcacaga ctggctgagg gcgaaacagg gccgatcttc ttgaatgttg 2460
tggtggatgt agaaccattc ttggaagtga agaatggacg tttgcggact ccactcggtc 2520
aagtcctgca ggtgaacact agagattggc ccaaggtcgt cgactacaaa gcaaaggagc 2580
tgtcagtctt gatggaaaac acgcaaattg gcaacgagaa tggggtgtct acaatcgagg 2640
ccggaatgag gattatgtct attgacctgg gacagaggac cgctgctgcc gtgtctattt 2700
tcgaggtcat ttctaagaaa cctgacgaaa aggaaacgaa gctgttttat cccatcgcag 2760
acacagatct gtatgccgtt cacaggcgaa gtctcctgct gagattgccc ggcgaggaga 2820
tctctagtaa gaaaatgatt gagaagcgga aagagcgcgc acgtatccgc tccctggtga 2880
ggtatcagat caggctcctc tcagaagtcc tgcggcttca cacacagggc accgctgaac 2940
agcgtcggtt taagctggac gagctgctcg tgagcatcca gaagaagttg gagcttgacc 3000
agagcgagtg gatttcagaa ctcgagaaac tcttcgacta tatcgatgag tcagctgaga 3060
aatggaaaga ggctctggtc gtggctcaca gaactctgga gcctatcgtg gttgaagccg 3120
tcagaaactg gaagaagtct ctgtccaaag aaaacaagga tagacgcagg attgccggaa 3180
tctccatctg gtctatagag gagctcgagg aaacccgcaa gctgcttatt gcatggtcta 3240
aacactccag agaacctggc attccgaaaa gacttgagaa agaggaaaca tttgctccag 3300
aacacctgca gcacatacag aacgtgaaag acgatcgcct taaacagatg gctaacttgt 3360
ttgtgatgac cgccttgggc tataagtatg atgaaggcaa taagcggtgg gtggaagcgt 3420
atccagcatg ccaggtaatc ctgtttgagg atttgtctag atatcggttc gccctggaca 3480
gacctaggcg ggagaacaat cgattgatga agtgggccca ccgcagtatc ccaaggctca 3540
cctacatgca ggctgaactg tttggaatcc aggtgggcga tgtctattca gcgtacacct 3600
ctagattcca cgccaaaaca ggggcccccg ggatccgctg tcatgcactg acagaagccg 3660
atcttcaatc taatagttac gttgtgaacc agctgataaa ggataaattt attcaagaca 3720
accagactga aatcctcaag gccggccaga tagttccttg gcagggcggt gagttgtttg 3780
ttacctttgc agatagatcc ggcgccagct tggctgttat ccacgccgat attaatgcag 3840
cgcagaacct tcagaaaagg ttttggcagc acaactcaga ggtgttccga gtgccttgta 3900
aggtggtgaa gggcgggttg gtccctgttt atgaaaagat gcgaaagctt ttcggaaaag 3960
gcctctttgt aaatatagac gacccagaat ccaaggaagt ctaccgctgg gaacattcca 4020
ctaagatgaa atccaagact acaccagttg accttgaaag cgaagatatt gatcacgagg 4080
aactcagcga cgagtgggaa gatatgcagg aaggatacaa aacactgctg cgtgaccctt 4140
caggcttctt ctggtcctca gacagttgga tccctcagaa ggatttctgg atcagagtca 4200
agagcagaat cggcaagtct ctgcgggagc agattcgcgg tggaagcgga ggcagcgggg 4260
gatcaggtcc ccctaagaaa aagcggaagg tgggcggtgg cggcggttca catcatcatc 4320
accatcatgg cggtgaagga cgcggctccc ttctgacctg tggtgacgtg gaagagaacc 4380
ccggccctga attcatgtct ggcggcgagg aactgtttgc cggaatcgtg cctgtgctga 4440
tcgagctgga tggggatgtg cacggccaca agtttagcgt cagaggcgaa ggcgaagggg 4500
acgccgatta cggcaagctg gaaatcaagt tcatctgcac caccggaaag ctgcccgtgc 4560
cttggcctac actggtcacc acactgtgct acggcatcca gtgcttcgcc agatatcccg 4620
agcatatgaa gatgaacgac ttcttcaaga gcgccatgcc tgagggctac atccaagagc 4680
ggacaatcca gttccaggac gacggcaagt acaagaccag gggcgaagtg aagttcgagg 4740
gcgacaccct ggtcaacaga atcgagctga agggcaaaga cttcaaagag gacggcaaca 4800
tcctgggcca caagcttgag tacagcttca acagccacaa cgtgtacatc agacccgaca 4860
aggccaacaa cggcctggaa gccaacttca agacccggca caacatcgaa ggtggcggag 4920
tgcagctggc cgatcactac cagacaaatg tgcccctcgg agatggcccc gtgctgatcc 4980
ctatcaacca ctacctgagc acccagacca agatcagcaa ggacagaaac gaggcccggg 5040
accacatggt gctgctggaa agctttagcg cctgctgtca cacccacggc atggacgagc 5100
tgtacagata atgactcgag atcagcctcg actgtgcctt ctagttgcca gccatctgtt 5160
gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg ccactcccac tgtcctttcc 5220
taataaaatg aggaaattgc atccccactt cagaagttcc tatactttct aatgagtgag 5280
ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg 5340
ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta ttgggcgctc 5400
ttgcgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc gagcggtatc 5460
agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa 5520
catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt 5580
tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg 5640
gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg 5700
ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag 5760
cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc 5820
caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa 5880
ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg 5940
taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc 6000
taactacggc tacactagaa gaacagtatt tggtatctgc gctctgctga agccagttac 6060
cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg 6120
tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt 6180
gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt 6240
catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat gaagttttaa 6300
atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct taatcagtga 6360
ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac tccccgtcgt 6420
gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa tgataccgcg 6480
tgacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg gaagggccga 6540
gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt gttgccggga 6600
agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca ttgctacagg 6660
catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt cccaacgatc 6720
aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct tcggtcctcc 6780
gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg cagcactgca 6840
taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg agtactcaac 6900
caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg cgtcaatacg 6960
ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa aacgttcttc 7020
ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt aacccactcg 7080
tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt gagcaaaaac 7140
aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt gaatactcat 7200
actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata 7260
catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcatat ttccccgaaa 7320
agtgccacct gacgtcgacg gatcgggaga tctcccgatc ccctatggtg cactctcagt 7380
acaatctgct ctgatgccgc atagttaagc cagtatctgc tccctgcttg tgtgttggag 7440
gtcgctgagt agtgcgcgag caaaatttaa gctacaacaa ggcaaggctt gaccgaacaa 7500
actctttctg tgttgtaaaa cgacggccag tcttaagctc gggccccctg ggcggttctg 7560
ataacgagta atcgttaatc cgcaaataac gtaaaaaccc gcttcggcgg gtttttttat 7620
ggggggagtt tagggaaaga gcatttgtca gaatatttaa gggcgcctgt cactttgctt 7680
gatatatgag aattatttaa ccttataaat gagaaaaaag caacgcactt taaataagat 7740
acgttgcttt ttcgattgat gaacacctat aattaaacta ttcatctatt atttatgatt 7800
ttttgtatat acaatatttc tagtttgtta aagagaatta agaaaataaa tctcgaaaat 7860
aataaaggga aaatcagttt ttgatatcaa aattatacat gtcaacgata atacaaaata 7920
taatacaaac tataagatgt tatcagtatt tattatgcat ttagaataaa ttttgtgtcg 7980
cccttattcg actcactata gaagttccta ttctctag 8018
<210> 10
<211> 8054
<212> DNA
<213> other sequences
<220>
<223> expression construct containing B-Gen.2 with N-terminal linker, a
C-terminal linker, T2A-GFP
<400> 10
ctctagaaag tagaggaact tcacttcatt ttgctagacc ggtaccgcgt tacataactt 60
acggtaaatg gcccgcctgg ctgaccgccc aacgaccccc gcccattgac gtcaatagta 120
acgccaatag ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac 180
ttggcagtac atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt 240
aaatggcccg cctggcattg tgcccagtac atgaccttat gggactttcc tacttggcag 300
tacatctacg tattagtcat cgctattacc atggtcgagg tgagccccac gttctgcttc 360
actctcccca tctccccccc ctccccaccc ccaattttgt atttatttat tttttaatta 420
ttttgtgcag cgatgggggc gggggggggg gggcgcgcgc caggtggggc ggggcggggc 480
gaggggcggg gcggggcgag gcggagaggt gcggcggcag ccaatcagag cggcgcgctc 540
cgaaagtttc cttttatggc gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg 600
cggcgggcgg gagtcgctgc gcgctgcctt cgccccgtgc cccgctccgc cgccgcctcg 660
cgccgcccgc cccggctctg actgaccgcg ttactcccac aggtgagcgg gcgggacggc 720
ccttctcctc cgggctgtaa ttagctgagc aagaggtaag ggtttaaggg atggttggtt 780
ggtggggtat taatgtttaa ttacctggag cacctgcctg aaatcacttt ttttcaggtt 840
ggcaaccgcg gacacccaag cggccgccaa tgaagaggcc tgccgccaca aagaaggccg 900
gccaggccaa gaagaagaag ggtggcggtg gtagtggtgg cggtggttca ggcggtggcg 960
gctcaggctc catgaccatc agaagtatga agctgaagct taaaatctat agcggcaggt 1020
ccgcgcccca actcaggcag ggtctgtggc gtttgcatcg gctgttgaac gagggaacgg 1080
cctattacat ggattggctt gtacatatga gacaagaggc tctcccaggc aaaagcaaag 1140
aagagattag agctgaattg gagagaagag tgagacagca gcaggaaaag aatggtgtgc 1200
aaaatgacca ggtcccgatg gacgaagtcc tcagcgcact taggcaactg tatgagcttc 1260
tggtcccgtc tgccgtaaat aattccggcg acgcacagac gctgtctagg aagttcttgt 1320
ctccattggt ggacccaaac tccgagggtg gaaagggcac gtcaaacgcc ggagccaagc 1380
ctggctggcg gaagaaacaa gaggcagggg acccaagctg ggagaaagac tatgagagat 1440
ggctcaaacg caagcaggct gaccctaccg ctgagatttt gggtaagctg gaaaccgccg 1500
gcctcaaacc cctcttcccc ctgtacacaa atgaagtcaa ggatataagg tggatgccac 1560
tgacgtctaa acaatatgtc cgaaactggg atcgcgatat gttccaacaa gctatcgagc 1620
atctgctcag ttgggaaact tggaatagaa aggtgaatga ggaaagggcg aaactgaagg 1680
aaacagtcag gcgctttgaa gaacagcacc tggccaatgg aaaggattgg ctctccccac 1740
ttcaggccta tgaagccaat cgagaacagg cacttagaga catggccata tctcctagcg 1800
atcgcttcag gatcactagg cgccaaataa agggatggtc tgagctttat gaaaggtgga 1860
acaagctcgc acctaccgct agcgtagagg cgtacatgca ggaagttcgc catgtacaga 1920
agaaactcgg cggtaccttt ggagatgccg acctctaccg gtttctggcc aaacccgaga 1980
acgtgcacat atggcgcgac caccaggagc ggctgcacta ctatgccgca tacaatgatt 2040
tgcataagcg actcatgagc gccaaagagc aggctgcttt tacactcccc gaccctgtgg 2100
cccatccact gtgggtgcgc tttgacgcca gagatggcaa tctgtttact tacatactgc 2160
aggccgactc ttcaaagcag aggtcacgta gatacgtcaa tttctctcgt tttctgtggc 2220
ctgttgaaga tgggtacttt gaggaaacgg agaacgtcaa agttgagctg gctctgtcca 2280
agcaatttta tagacaggtg attgtccacg acaacccaac gggaaagcag aagataacgt 2340
tccaggatta ctccagtaaa gaaatcctcg aagggcatct tggcggggcc aaactgcagc 2400
tcgaccggaa tttccttcgg aaatcagggc gggactttga gacaggcgat tttgggccgg 2460
cttttctgaa cgtggtgttg gacctgaagc caaaacagga agtgaagaat gggcgcttgc 2520
agtcccctct tggccaggcg ttgctcgtta aaagcagacc caacgatatc ccgaaggtgt 2580
acggatacaa accagatgca ttggcagctt ggctggagca agccagtggt gaagagtccc 2640
tggggagcga gtcattgcgt caggggttta gagtaatgtc aattgatctc ggcgtcaggt 2700
ctgccgctgc tatatccgtc tttagtgtga aaggagagaa aacccgtgag ggcgataagg 2760
tgtgctatcc agttggggag acaggcctct tcgccgtcca cgataggtct tttctgctca 2820
gactcccggg tgaatcaagc gagaagcggg tgaatgtgga gcgtgataaa cgtaagacag 2880
agagaatgca gatccgttat cacatcagga ccctggcgcg cgtgttgaga ctcgcaaaca 2940
aggcaacccc aatggaccgg atcaaggccg tgcaggatgt gctgaacgat atcgagtcta 3000
ctaggttcat gaatgaccat gaccaccacg tttacaacca tgctctcgaa accctcagaa 3060
cctacgctcc tgatcaccag gggatctggg aagaacaagt aatcgccgcc catcgccagc 3120
tcgaacacca cgtcggcgtt atcgtagggg agtggcggaa gaactggggt aaagatcgtc 3180
gagggacagt cgggctgagc atggacaaca ttgaagaact cgatgagatg aggagattgc 3240
tgatctcttg gagccgccgg gctcgttacc ctcgcgaggc gaagcctttc caagtgaacg 3300
agtcaaaccc tgtgcacctg ttgcggcatc tgcagaattt gaaagaggac agactgaagc 3360
agcttgccaa cctgattgtg atgaccgccc tgggctatgt gtacgactcc aaggaaaaga 3420
agtggaaagc tgcataccct gcatgccagc tgatcctttt cgaggacctg cagaggtaca 3480
ggttccacct cgaccgtagt gccagggaaa actcacagct gatgaaatgg gcacataggt 3540
caatcccaaa gtatgtgtgg atgcagggtg agccctacgg acttcaaatc ggcgatgtgt 3600
gggcaggctt cacttcccgg taccacgcga aaaccggggc tcccggaatt cggtgtaaag 3660
cactgaccga aaaggatttt cagcagggcc gacttctgga gtcactcgtc gcggaaggca 3720
tgtttaccct gcaggaagtg ggcacgttga aaccagggga catcgttccc gcggaaggcg 3780
gcgaactttt cgtgactctg gccgatgact ctggagacag gatcgtcatc acccacgcag 3840
atattaacgc agctcagaat gtccagaagc gattttggct cgcaaatagc gagaggttcc 3900
gcgttgcatg tcgcagcgtg caaatcgcat cccaggagtg ttttattcct tccagcgagt 3960
ctgtcgccaa gaagatgggc aagggagtct ttgtgcggga cttctccttt cacaaagaca 4020
tggaagtgta ccactggaat aaccaggtca agctcacagc aaagaacgta ccgaccgacc 4080
acagcgatga tctccaggac ctgcaggact accaggctat cctcgaagaa gccagggagt 4140
ctagtagcag ctacaagacg ctgtttaggg atccttctgg gttcttcttc ccagacgatg 4200
tgtgggtccc tcagaatatt tactggcgag aggttaagaa aacaatcacc gctctgctgc 4260
gtaagcgcat catgtccacc ggtggaagcg gaggcagcgg gggatcaggt ccccctaaga 4320
aaaagcggaa ggtgggcggt ggcggcggtt cacatcatca tcaccatcat ggcggtgaag 4380
gacgcggctc ccttctgacc tgtggtgacg tggaagagaa ccccggccct gaattcatgt 4440
ctggcggcga ggaactgttt gccggaatcg tgcctgtgct gatcgagctg gatggggatg 4500
tgcacggcca caagtttagc gtcagaggcg aaggcgaagg ggacgccgat tacggcaagc 4560
tggaaatcaa gttcatctgc accaccggaa agctgcccgt gccttggcct acactggtca 4620
ccacactgtg ctacggcatc cagtgcttcg ccagatatcc cgagcatatg aagatgaacg 4680
acttcttcaa gagcgccatg cctgagggct acatccaaga gcggacaatc cagttccagg 4740
acgacggcaa gtacaagacc aggggcgaag tgaagttcga gggcgacacc ctggtcaaca 4800
gaatcgagct gaagggcaaa gacttcaaag aggacggcaa catcctgggc cacaagcttg 4860
agtacagctt caacagccac aacgtgtaca tcagacccga caaggccaac aacggcctgg 4920
aagccaactt caagacccgg cacaacatcg aaggtggcgg agtgcagctg gccgatcact 4980
accagacaaa tgtgcccctc ggagatggcc ccgtgctgat ccctatcaac cactacctga 5040
gcacccagac caagatcagc aaggacagaa acgaggcccg ggaccacatg gtgctgctgg 5100
aaagctttag cgcctgctgt cacacccacg gcatggacga gctgtacaga taatgactcg 5160
agatcagcct cgactgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg 5220
ccttccttga ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt 5280
gcatccccac ttcagaagtt cctatacttt ctaatgagtg agctaactca cattaattgc 5340
gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat 5400
cggccaacgc gcggggagag gcggtttgcg tattgggcgc tcttgcgctt cctcgctcac 5460
tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt 5520
aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca 5580
gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 5640
ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 5700
ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 5760
gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 5820
ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 5880
cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 5940
cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 6000
gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 6060
aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 6120
tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 6180
gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 6240
tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag 6300
gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 6360
tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 6420
ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 6480
ggagggctta ccatctggcc ccagtgctgc aatgataccg cgtgacccac gctcaccggc 6540
tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 6600
aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 6660
gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc 6720
gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 6780
ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 6840
gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 6900
gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 6960
gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 7020
tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 7080
gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 7140
agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 7200
aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata 7260
ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 7320
gaaaaataaa caaatagggg ttccgcgcat atttccccga aaagtgccac ctgacgtcga 7380
cggatcggga gatctcccga tcccctatgg tgcactctca gtacaatctg ctctgatgcc 7440
gcatagttaa gccagtatct gctccctgct tgtgtgttgg aggtcgctga gtagtgcgcg 7500
agcaaaattt aagctacaac aaggcaaggc ttgaccgaac aaactctttc tgtgttgtaa 7560
aacgacggcc agtcttaagc tcgggccccc tgggcggttc tgataacgag taatcgttaa 7620
tccgcaaata acgtaaaaac ccgcttcggc gggttttttt atggggggag tttagggaaa 7680
gagcatttgt cagaatattt aagggcgcct gtcactttgc ttgatatatg agaattattt 7740
aaccttataa atgagaaaaa agcaacgcac tttaaataag atacgttgct ttttcgattg 7800
atgaacacct ataattaaac tattcatcta ttatttatga ttttttgtat atacaatatt 7860
tctagtttgt taaagagaat taagaaaata aatctcgaaa ataataaagg gaaaatcagt 7920
ttttgatatc aaaattatac atgtcaacga taatacaaaa tataatacaa actataagat 7980
gttatcagta tttattatgc atttagaata aattttgtgt cgcccttatt cgactcacta 8040
tagaagttcc tatt 8054
<210> 11
<211> 164
<212> DNA
<213> other sequences
<220>
<223> ATTA PAM containing guide sequence
<400> 11
gctggatata ataaagatgt ttagctatag gctaataaga tagttgtgtc aagtgcttcg 60
gagacctaac acgtcatcca gtcacaacgg ctatctatat ttccactaac aaaagttagt 120
ggaaatgtag atggttagca ctggacaagt agcaagaaat taat 164
<210> 12
<211> 164
<212> DNA
<213> other sequences
<220>
<223> ATTT PAM containing guide sequence
<400> 12
gctggatata ataaagatgt ttagctatag gctaataaga tagttgtgtc aagtgcttcg 60
gagacctaac acgtcatcca gtcacaacgg ctatctatat ttccactaac aaaagttagt 120
ggaaatgtag atggttagca cgttttcttt agttattaat ttct 164
<210> 13
<211> 164
<212> DNA
<213> other sequences
<220>
<223> ATTC PAM containing guide sequence
<400> 13
gctggatata ataaagatgt ttagctatag gctaataaga tagttgtgtc aagtgcttcg 60
gagacctaac acgtcatcca gtcacaacgg ctatctatat ttccactaac aaaagttagt 120
ggaaatgtag atggttagca ccattaacta gcattataat gcac 164
<210> 14
<211> 164
<212> DNA
<213> other sequences
<220>
<223> ATTG PAM containing guide sequence
<400> 14
gctggatata ataaagatgt ttagctatag gctaataaga tagttgtgtc aagtgcttcg 60
gagacctaac acgtcatcca gtcacaacgg ctatctatat ttccactaac aaaagttagt 120
ggaaatgtag atggttagca ctttagtgac tgtaattttc tttt 164
<210> 15
<211> 164
<212> DNA
<213> other sequences
<220>
<223> ATTT PAM containing guide sequence
<400> 15
gctggatata ataaagatgt ttagctatag gctaataaga tagttgtgtc aagtgcttcg 60
gagacctaac acgtcatcca gtcacaacgg ctatctatat ttccactaac aaaagttagt 120
ggaaatgtag atggttagca cgtgaagtct tacaaggtta tctt 164
<210> 16
<211> 164
<212> DNA
<213> other sequences
<220>
<223> ATTG PAM containing guide sequence
<400> 16
gctggatata ataaagatgt ttagctatag gctaataaga tagttgtgtc aagtgcttcg 60
gagacctaac acgtcatcca gtcacaacgg ctatctatat ttccactaac aaaagttagt 120
ggaaatgtag atggttagca ctttagtgac tgtaattttc tttt 164
<210> 17
<211> 164
<212> DNA
<213> other sequences
<220>
<223> ATTC PAM containing guide sequence
<400> 17
gctggatata ataaagatgt ttagctatag gctaataaga tagttgtgtc aagtgcttcg 60
gagacctaac acgtcatcca gtcacaacgg ctatctatat ttccactaac aaaagttagt 120
ggaaatgtag atggttagca caatcttcaa ccctattctg tgaa 164
<210> 18
<211> 164
<212> DNA
<213> other sequences
<220>
<223> ATTA PAM containing guide sequence
<400> 18
gctggatata ataaagatgt ttagctatag gctaataaga tagttgtgtc aagtgcttcg 60
gagacctaac acgtcatcca gtcacaacgg ctatctatat ttccactaac aaaagttagt 120
ggaaatgtag atggttagca cataactaaa gaaaacaaat ctta 164
<210> 19
<211> 164
<212> DNA
<213> other sequences
<220>
<223> GTTA PAM containing guide sequence
<400> 19
gctggatata ataaagatgt ttagctatag gctaataaga tagttgtgtc aagtgcttcg 60
gagacctaac acgtcatcca gtcacaacgg ctatctatat ttccactaac aaaagttagt 120
ggaaatgtag atggttagca cgtacagttt tgctgaaagg ttat 164
<210> 20
<211> 164
<212> DNA
<213> other sequences
<220>
<223> GTTC PAM containing guide sequence
<400> 20
gctggatata ataaagatgt ttagctatag gctaataaga tagttgtgtc aagtgcttcg 60
gagacctaac acgtcatcca gtcacaacgg ctatctatat ttccactaac aaaagttagt 120
ggaaatgtag atggttagca ctgcttatta tggacaagta gcaa 164
<210> 21
<211> 164
<212> DNA
<213> other sequences
<220>
<223> GTTT PAM containing guide sequence
<400> 21
gctggatata ataaagatgt ttagctatag gctaataaga tagttgtgtc aagtgcttcg 60
gagacctaac acgtcatcca gtcacaacgg ctatctatat ttccactaac aaaagttagt 120
ggaaatgtag atggttagca ctattccatt aactagcatt ataa 164
<210> 22
<211> 164
<212> DNA
<213> other sequences
<220>
<223> GTTT PAM containing guide sequence
<400> 22
gctggatata ataaagatgt ttagctatag gctaataaga tagttgtgtc aagtgcttcg 60
gagacctaac acgtcatcca gtcacaacgg ctatctatat ttccactaac aaaagttagt 120
ggaaatgtag atggttagca ccagtgcgac gccgcgagcc ccga 164
<210> 23
<211> 164
<212> DNA
<213> other sequences
<220>
<223> GTTG PAM containing guide sequence
<400> 23
gctggatata ataaagatgt ttagctatag gctaataaga tagttgtgtc aagtgcttcg 60
gagacctaac acgtcatcca gtcacaacgg ctatctatat ttccactaac aaaagttagt 120
ggaaatgtag atggttagca cgacgaaaag tttcagtgcg acgc 164
<210> 24
<211> 164
<212> DNA
<213> other sequences
<220>
<223> GTTC PAM containing guide sequence
<400> 24
gctggatata ataaagatgt ttagctatag gctaataaga tagttgtgtc aagtgcttcg 60
gagacctaac acgtcatcca gtcacaacgg ctatctatat ttccactaac aaaagttagt 120
ggaaatgtag atggttagca ctcgcttcgg aggagccgtg gtcc 164
<210> 25
<211> 170
<212> DNA
<213> other sequences
<220>
<223> ATTA PAM containing guide sequence
<400> 25
gtaataaata atatgagtta caggctcatg tcattccgtg cgtgtgctgc gaggctctta 60
caacgtctca accacgggat cacgttattt ccactaagtg attggacaaa agtcagatta 120
tttagtggaa agtaacgtga ttagcactgg acaagtagca agaaattaat 170
<210> 26
<211> 170
<212> DNA
<213> other sequences
<220>
<223> ATTT PAM containing guide sequence
<400> 26
gtaataaata atatgagtta caggctcatg tcattccgtg cgtgtgctgc gaggctctta 60
caacgtctca accacgggat cacgttattt ccactaagtg attggacaaa agtcagatta 120
tttagtggaa agtaacgtga ttagcacgtt ttctttagtt attaatttct 170
<210> 27
<211> 170
<212> DNA
<213> other sequences
<220>
<223> ATTC PAM containing guide sequence
<400> 27
gtaataaata atatgagtta caggctcatg tcattccgtg cgtgtgctgc gaggctctta 60
caacgtctca accacgggat cacgttattt ccactaagtg attggacaaa agtcagatta 120
tttagtggaa agtaacgtga ttagcaccat taactagcat tataatgcac 170
<210> 28
<211> 170
<212> DNA
<213> other sequences
<220>
<223> ATTG PAM containing guide sequence
<400> 28
gtaataaata atatgagtta caggctcatg tcattccgtg cgtgtgctgc gaggctctta 60
caacgtctca accacgggat cacgttattt ccactaagtg attggacaaa agtcagatta 120
tttagtggaa agtaacgtga ttagcacttt agtgactgta attttctttt 170
<210> 29
<211> 170
<212> DNA
<213> other sequences
<220>
<223> ATTT PAM containing guide sequence
<400> 29
gtaataaata atatgagtta caggctcatg tcattccgtg cgtgtgctgc gaggctctta 60
caacgtctca accacgggat cacgttattt ccactaagtg attggacaaa agtcagatta 120
tttagtggaa agtaacgtga ttagcacgtg aagtcttaca aggttatctt 170
<210> 30
<211> 170
<212> DNA
<213> other sequences
<220>
<223> ATTG PAM containing guide sequence
<400> 30
gtaataaata atatgagtta caggctcatg tcattccgtg cgtgtgctgc gaggctctta 60
caacgtctca accacgggat cacgttattt ccactaagtg attggacaaa agtcagatta 120
tttagtggaa agtaacgtga ttagcacttt agtgactgta attttctttt 170
<210> 31
<211> 170
<212> DNA
<213> other sequences
<220>
<223> ATTC PAM containing guide sequence
<400> 31
gtaataaata atatgagtta caggctcatg tcattccgtg cgtgtgctgc gaggctctta 60
caacgtctca accacgggat cacgttattt ccactaagtg attggacaaa agtcagatta 120
tttagtggaa agtaacgtga ttagcacaat cttcaaccct attctgtgaa 170
<210> 32
<211> 170
<212> DNA
<213> other sequences
<220>
<223> ATTA PAM containing guide sequence
<400> 32
gtaataaata atatgagtta caggctcatg tcattccgtg cgtgtgctgc gaggctctta 60
caacgtctca accacgggat cacgttattt ccactaagtg attggacaaa agtcagatta 120
tttagtggaa agtaacgtga ttagcacata actaaagaaa acaaatctta 170
<210> 33
<211> 170
<212> DNA
<213> other sequences
<220>
<223> GTTA PAM containing guide sequence
<400> 33
gtaataaata atatgagtta caggctcatg tcattccgtg cgtgtgctgc gaggctctta 60
caacgtctca accacgggat cacgttattt ccactaagtg attggacaaa agtcagatta 120
tttagtggaa agtaacgtga ttagcacgta cagttttgct gaaaggttat 170
<210> 34
<211> 170
<212> DNA
<213> other sequences
<220>
<223> GTTC PAM containing guide sequence
<400> 34
gtaataaata atatgagtta caggctcatg tcattccgtg cgtgtgctgc gaggctctta 60
caacgtctca accacgggat cacgttattt ccactaagtg attggacaaa agtcagatta 120
tttagtggaa agtaacgtga ttagcactgc ttattatgga caagtagcaa 170
<210> 35
<211> 170
<212> DNA
<213> other sequences
<220>
<223> GTTT PAM containing guide sequence
<400> 35
gtaataaata atatgagtta caggctcatg tcattccgtg cgtgtgctgc gaggctctta 60
caacgtctca accacgggat cacgttattt ccactaagtg attggacaaa agtcagatta 120
tttagtggaa agtaacgtga ttagcactat tccattaact agcattataa 170
<210> 36
<211> 170
<212> DNA
<213> other sequences
<220>
<223> GTTT PAM containing guide sequence
<400> 36
gtaataaata atatgagtta caggctcatg tcattccgtg cgtgtgctgc gaggctctta 60
caacgtctca accacgggat cacgttattt ccactaagtg attggacaaa agtcagatta 120
tttagtggaa agtaacgtga ttagcaccag tgcgacgccg cgagccccga 170
<210> 37
<211> 170
<212> DNA
<213> other sequences
<220>
<223> GTTG PAM containing guide sequence
<400> 37
gtaataaata atatgagtta caggctcatg tcattccgtg cgtgtgctgc gaggctctta 60
caacgtctca accacgggat cacgttattt ccactaagtg attggacaaa agtcagatta 120
tttagtggaa agtaacgtga ttagcacgac gaaaagtttc agtgcgacgc 170
<210> 38
<211> 170
<212> DNA
<213> other sequences
<220>
<223> GTTC PAM containing guide sequence
<400> 38
gtaataaata atatgagtta caggctcatg tcattccgtg cgtgtgctgc gaggctctta 60
caacgtctca accacgggat cacgttattt ccactaagtg attggacaaa agtcagatta 120
tttagtggaa agtaacgtga ttagcactcg cttcggagga gccgtggtcc 170
<210> 39
<211> 1091
<212> PRT
<213> other sequences
<220>
<223> independently identified variant of B-Gen.1 with three amino acid
exchanges
<400> 39
Met Pro Ile Arg Ser Phe Lys Leu Lys Leu Val Thr His Asn Gly Asp
1 5 10 15
Ser Thr Tyr Met Asp Lys Leu Arg Arg Gly Leu Trp Lys Thr His Val
20 25 30
Ile Ile Asn Arg Gly Ile Ala Tyr Tyr Met Asn Thr Leu Ala Leu Met
35 40 45
Arg Gln Glu Pro Tyr Gly Ser Lys Ser Arg Glu Glu Val Arg Leu Asp
50 55 60
Leu Leu Ser Thr Leu Arg Glu Gln Gln Arg Arg Asn Asn Trp Ser Glu
65 70 75 80
Gln Thr Gly Thr Asp Asp Glu Leu Leu Ser Leu Ser Arg Arg Val Tyr
85 90 95
Glu Leu Leu Val Pro Ser Ala Ile Gly Glu Lys Gly Asp Ala Gln Met
100 105 110
Leu Ser Arg Lys Phe Leu Ser Pro Leu Val Asp Pro Asn Ser Glu Gly
115 120 125
Gly Arg Gly Thr Ala Lys Ser Gly Arg Lys Pro Arg Trp Lys Lys Met
130 135 140
Met Glu Glu Gly His Pro Asp Trp Glu Lys Glu Lys Glu Lys Asp Ala
145 150 155 160
Ala Lys Lys Ala Glu Asp Pro Thr Ala Ser Ile Leu Ala Asp Leu Glu
165 170 175
Ala Val Gly Leu Leu Pro Leu Phe Pro Leu Phe Ser Asp Glu Gln Lys
180 185 190
Glu Ile Arg Trp Leu Pro Lys Lys Lys Arg Gln Phe Val Arg Thr Trp
195 200 205
Asp Arg Asp Met Phe Gln Gln Ala Leu Glu Arg Met Leu Ser Trp Glu
210 215 220
Ser Trp Asn Arg Arg Val Ala Glu Glu Tyr Gln Lys Leu Gln Ala Gln
225 230 235 240
Arg Asp Glu Val Tyr Ala Lys Tyr Leu Glu Asp Ala Gly Ser Trp Leu
245 250 255
Asn Asp Leu Gln Thr Phe Glu Lys Gln Arg Glu Glu Glu Leu Ala Glu
260 265 270
Val Ser Phe Glu Pro Asn Ser Glu Tyr Leu Ile Thr Arg Arg Gln Ile
275 280 285
Arg Gly Trp Lys Glu Val Tyr Glu Lys Trp Ser Lys Thr Ser Glu Asn
290 295 300
Ala Ser Gln Glu Gln Leu Trp Arg Met Val Ala Asp Val Gln Thr Ala
305 310 315 320
Met Ala Gly Ala Phe Gly Asp Pro Lys Val Tyr Gln Phe Leu Ser Gln
325 330 335
Pro Lys His His His Ile Trp Arg Glu His Pro Asn Arg Leu Phe Tyr
340 345 350
Tyr Ser Lys Tyr Asn Glu Val Arg Glu Lys Leu Asn Arg Ala Lys Lys
355 360 365
Gln Ala Ala Phe Thr Leu Pro Asp Pro Val Glu His Pro Leu Trp Thr
370 375 380
Arg Phe Asp Ala Arg Gly Gly Asn Ile His Asp Tyr Glu Ile Ser Lys
385 390 395 400
Val Gly Lys Gln Tyr His Val Thr Phe Ser Ser Leu Ile Leu Pro Glu
405 410 415
Ala Gln Ser Trp Val Glu Ile Glu Asn Val Thr Val Gly Ile Gly Asn
420 425 430
Ser Leu Gln Leu Lys Arg Gln Ile Arg Leu Asp Gly Tyr Ala Asp Lys
435 440 445
Lys Gln Lys Val Lys Tyr Tyr Asp Tyr Ser Ser Arg Phe Glu Leu Thr
450 455 460
Gly Val Leu Gly Gly Ala Lys Ile Gln Phe Asp Arg Lys His Leu Lys
465 470 475 480
Lys Ala Ala His Arg Leu Ala Glu Gly Glu Thr Gly Pro Ile Phe Leu
485 490 495
Asn Val Val Val Asp Val Glu Pro Phe Leu Glu Val Lys Asn Gly Arg
500 505 510
Leu Arg Thr Pro Leu Gly Gln Val Leu Gln Val Asn Thr Arg Asp Trp
515 520 525
Pro Lys Val Val Asp Tyr Lys Ala Lys Glu Leu Ser Val Leu Met Glu
530 535 540
Asn Thr Gln Ile Gly Asn Glu Asn Gly Val Ser Thr Ile Glu Ala Gly
545 550 555 560
Met Arg Ile Met Ser Ile Asp Leu Gly Gln Arg Thr Ala Ala Ala Val
565 570 575
Ser Ile Phe Glu Val Ile Ser Lys Lys Pro Asp Glu Lys Glu Thr Lys
580 585 590
Leu Phe Tyr Pro Ile Ala Asp Thr Asp Leu Tyr Ala Val His Arg Arg
595 600 605
Ser Leu Leu Leu Arg Leu Pro Gly Glu Glu Ile Ser Ser Lys Lys Met
610 615 620
Ile Glu Lys Arg Lys Glu Arg Ala Arg Ile Arg Ser Leu Val Arg Tyr
625 630 635 640
Gln Ile Arg Leu Leu Ser Glu Val Leu Arg Leu His Thr Gln Gly Thr
645 650 655
Ala Glu Gln Arg Arg Phe Lys Leu Asp Glu Leu Leu Val Ser Ile Gln
660 665 670
Arg Lys Leu Glu Leu Asp Gln Ser Glu Trp Ile Ser Glu Leu Glu Lys
675 680 685
Leu Phe Asp Tyr Ile Asp Glu Ser Ala Glu Lys Trp Lys Glu Ala Leu
690 695 700
Val Val Ala His Arg Thr Leu Glu Pro Ile Val Val Glu Ala Val Arg
705 710 715 720
Asn Trp Lys Lys Ser Leu Ser Lys Glu Asn Lys Asp Arg Arg Arg Ile
725 730 735
Ala Gly Ile Ser Ile Trp Ser Ile Glu Glu Leu Glu Glu Thr Arg Lys
740 745 750
Leu Leu Ile Ala Trp Ser Lys His Ser Arg Glu Pro Gly Ile Pro Lys
755 760 765
Arg Leu Glu Lys Glu Glu Thr Phe Ala Pro Glu His Leu Gln His Ile
770 775 780
Gln Asn Val Lys Asp Asp Arg Leu Lys Gln Met Ala Asn Leu Phe Val
785 790 795 800
Met Thr Ala Leu Gly Tyr Lys Tyr Asp Glu Gly Asn Lys Arg Trp Val
805 810 815
Glu Ala Tyr Pro Ala Cys Gln Val Ile Leu Phe Glu Asp Leu Ser Arg
820 825 830
Tyr Arg Phe Ala Leu Asp Arg Pro Arg Arg Glu Asn Asn Arg Leu Met
835 840 845
Lys Trp Ala His Arg Ser Ile Pro Arg Leu Thr Tyr Met Gln Ala Glu
850 855 860
Leu Phe Gly Ile Gln Val Gly Asp Val Tyr Ser Ala Tyr Thr Ser Arg
865 870 875 880
Phe His Ala Lys Thr Gly Ala Pro Gly Ile Arg Cys His Ala Leu Thr
885 890 895
Glu Ala Asp Leu Gln Ser Asn Ser Tyr Val Val Asn Gln Leu Ile Lys
900 905 910
Asp Lys Phe Ile Gln Asp Asn Gln Thr Glu Ile Leu Lys Ala Gly Gln
915 920 925
Ile Val Pro Trp Gln Gly Gly Glu Leu Phe Val Thr Phe Ala Asp Arg
930 935 940
Ser Gly Ala Ser Leu Ala Val Ile His Ala Asp Ile Asn Ala Ala Gln
945 950 955 960
Asn Leu Gln Lys Arg Phe Trp Gln His Asn Ser Glu Val Phe Arg Val
965 970 975
Pro Cys Lys Val Val Lys Gly Gly Leu Val Pro Val Tyr Glu Lys Met
980 985 990
Arg Lys Leu Phe Gly Lys Gly Leu Phe Val Asn Ile Asp Asp Pro Glu
995 1000 1005
Ser Lys Glu Val Tyr Arg Trp Glu His Ser Thr Lys Met Lys Ser Lys
1010 1015 1020
Thr Thr Pro Val Asp Leu Glu Ser Glu Asp Ile Glu His Glu Glu Leu
1025 1030 1035 1040
Ser Asp Glu Trp Glu Asp Met Gln Glu Gly Tyr Lys Thr Leu Leu Arg
1045 1050 1055
Asp Pro Ser Gly Phe Phe Trp Ser Ser Asp Ser Trp Ile Pro Gln Lys
1060 1065 1070
Asp Phe Trp Ile Arg Val Lys Ser Arg Ile Gly Lys Ser Leu Arg Glu
1075 1080 1085
Gln Ile Arg
1090
<210> 40
<211> 97
<212> RNA
<213> other sequences
<220>
<223> single guide scaffold with N(23) place holder for a target
specific sequence B-GEn.1-sgRNA_v4
<400> 40
guuuagcuau aggcuaauaa gauaguugug ucaagugcuu cggagaccua acacgucauc 60
cagucacaac ggcuaucuaa aaauagaugg uuagcac 97
<210> 41
<211> 87
<212> RNA
<213> other sequences
<220>
<223> single guide scaffold with N(23) place holder for a target
specific sequence B-GEn.1-sgRNA_v4.2
<400> 41
uuagcuauag gcuaauaaga uaguuguguc aagugcuucg gagaccuaac acgucaucca 60
gucacaacgg cuaaaaaugg uuagcac 87
<210> 42
<211> 87
<212> RNA
<213> other sequences
<220>
<223> single guide scaffold with N(23) place holder for a target
specific sequence B-GEn.1-sgRNA_v4.3
<400> 42
uuagcuauag gcuaauaaga uaguuguguc aagugcuucg gagaccuaac acgucaucca 60
gucacaacgg cuaaaaauag ccagcac 87
<210> 43
<211> 86
<212> RNA
<213> other sequences
<220>
<223> single guide scaffold with N(23) place holder for a target
specific sequence B-GEn.1-sgRNA_v4.4
<400> 43
uuagcuauag gcuaauaaga uaguuguguc aagugcuucg gagaccuaac acgucuccag 60
ucacaacggc uaaaaauagc cagcac 86
<210> 44
<211> 86
<212> RNA
<213> other sequences
<220>
<223> single guide scaffold with N(23) place holder for a target
specific sequence B-GEn.1-sgRNA_v4.5
<400> 44
uuagcuauag gcuaauaaga uaguugugac aagugcuucg gagaccuaac acgucuccag 60
ucacaacggc uaaaaauagc cagcac 86
Claims (9)
- 서열식별번호: 1 또는 서열식별번호: 39에 따른 B-GEn.1, 및 서열식별번호: 2에 따른 B-GEn.2의 군으로부터 선택된 폴리펩티드, 상기 중 임의의 것과 적어도 80% 동일한 임의의 폴리펩티드 서열, 또는 그를 코딩하는 임의의 핵산.
- 제1항에 따른 폴리펩티드 및 서열식별번호: 40, 41, 42, 43, 및 45로부터 선택된 서열을 포함하는 sgRNA를 포함하는 조성물.
- 하기를 포함하는 조성물:
(i) 제1항에 따른 폴리펩티드, 및
(ii) 하나 이상의 단일 이종 가이드 RNA(들) (sgRNA) 또는 이러한 하나 이상의 sgRNA(들)의 계내 생성을 허용하는 DNA(들), 각각의 sgRNA 또는 이러한 sgRNA를 코딩하는 DNA는 하기를 포함하며:
a. 폴리뉴클레오티드 로커스 내의 표적 서열과 혼성화할 수 있는 조작된 DNA 표적화 세그먼트,
b. tracr 메이트 서열, 및
c. tracr RNA 서열,
여기서 tracr 메이트 서열은 tracr 서열과 혼성화할 수 있고, 여기서 (a), (b) 및 (c)는 5'에서 3' 배향으로 배열됨. - 제2항 또는 제3항에 있어서, 조작된 DNA 표적화 세그먼트가 그의 3' 단부 상에서 표적화된 DNA 세그먼트 상의 PAM 서열에 직접적으로 인접하거나, 또는 이러한 PAM 서열이 5' 부분에서 표적화된 DNA 서열의 일부이며, 여기서 PAM 서열이 서열 모티프 "DTTN"을 포함하고, 이때 "D"가 "A" 또는 "T" 또는 "G"를 나타내고 "N"이 임의의 뉴클레오티드를 나타내는 것인 조성물.
- 하기 단계를 포함하는, 세포 내 또는 시험관 내 하나 이상의 위치에서 표적 DNA를 표적화, 편집, 변형 또는 조작하는 방법:
(i) 제1항에 따른 폴리펩티드 또는 그를 코딩하는 핵산을 세포 내로 또는 시험관 내 환경 내로 도입하는 단계; 및
(ii) 하나 이상의 단일 이종 가이드 RNA(들) (sgRNA) 또는 이러한 하나 이상의 sgRNA(들)를 코딩하는 DNA(들)를 세포 내로 또는 시험관 내 환경 내로 도입하는 단계로서, 각각의 sgRNA 또는 이러한 sgRNA를 코딩하는 DNA는 하기를 포함하며:
a. RNA를 포함하고 폴리뉴클레오티드 로커스 내의 표적 서열과 혼성화할 수 있는 조작된 DNA 표적화 세그먼트,
b. RNA로 구성된 tracr 메이트 서열, 및
c. RNA로 구성된 tracr RNA 서열,
여기서 tracr 메이트 서열은 tracr 서열과 혼성화하고, 여기서 (a), (b) 및 (c)는 5'에서 3' 배향으로 배열되는 것인 단계; 및
(iii) 표적 DNA에 하나 이상의 닉 또는 커트 또는 염기 편집을 생성하는 단계로서, 여기서 B-GEn 폴리펩티드는 그의 프로세싱된 또는 비프로세싱된 형태로 sgRNA에 의해 표적 DNA로 지시되는 것인 단계. - 세포 내 또는 시험관 내 하나 이상의 위치에서 표적 DNA를 표적화, 편집, 변형 또는 조작하기 위한, 하기를 포함하는 조성물의 용도:
i. 제1항에 따른 폴리펩티드 또는 그를 코딩하는 핵산; 및/또는
ii. 하나 이상의 단일 이종 가이드 RNA(들) (sgRNA) 또는 이러한 하나 이상의 sgRNA의 계내 생성에 적합한 DNA(들), 이들 각각은 하기를 포함하며:
a. RNA로 구성되고 폴리뉴클레오티드 로커스 내의 표적 서열과 혼성화할 수 있는 조작된 DNA 표적화 세그먼트,
b. RNA로 구성된 tracr 메이트 서열, 및
c. RNA로 구성된 tracr RNA 서열,
여기서 tracr 메이트 서열은 tracr 서열과 혼성화하고, 여기서 (a), (b) 및 (c)는 5'에서 3' 배향으로 배열됨. - 하기를 포함하는 세포:
i. 제1항에 따른 폴리펩티드 또는 그를 코딩하는 핵산; 및
ii. 하나 이상의 단일 이종 가이드 RNA(들) (sgRNA) 또는 이러한 하나 이상의 sgRNA의 계내 생성에 적합한 DNA(들), 이들 각각은 하기를 포함하며:
a. 폴리뉴클레오티드 로커스 내의 표적 서열과 혼성화할 수 있는 조작된 DNA 표적화 세그먼트,
b. tracr 메이트 서열, 및
c. tracr RNA 서열,
여기서 tracr 메이트 서열은 tracr 서열과 혼성화할 수 있고, 여기서 (a), (b) 및 (c)는 5'에서 3' 배향으로 배열됨. - 하기를 포함하는 키트:
I. 제1항에 따른 B-GEn 폴리펩티드를 코딩하는 핵산, 여기서 B-GEn을 코딩하는 핵산은 프로모터에 작동가능하게 연결됨; 및
II. 하나 이상의 단일 이종 가이드 RNA(들) (sgRNA) 또는 이러한 하나 이상의 sgRNA의 계내 생성에 적합한 DNA(들), 각각의 sgRNA는 하기를 포함하며:
a. 폴리뉴클레오티드 로커스 내의 표적 서열과 혼성화할 수 있는 조작된 DNA 표적화 세그먼트,
b. tracr 메이트 서열, 및
c. tracr RNA 서열,
여기서 tracr 메이트 서열은 tracr 서열과 혼성화할 수 있고, 여기서 (a), (b) 및 (c)는 5'에서 3' 배향으로 배열됨. - 서열식별번호: 40-44로부터 선택된 핵산을 포함하는 핵산 또는 임의의 핵산.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP21179011.8A EP4101928A1 (en) | 2021-06-11 | 2021-06-11 | Type v rna programmable endonuclease systems |
EP21179011.8 | 2021-06-11 | ||
EP21196182 | 2021-09-10 | ||
EP21196182.6 | 2021-09-10 | ||
PCT/EP2022/065691 WO2022258753A1 (en) | 2021-06-11 | 2022-06-09 | Type v rna programmable endonuclease systems |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20240021218A true KR20240021218A (ko) | 2024-02-16 |
Family
ID=82196321
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020247000678A KR20240021218A (ko) | 2021-06-11 | 2022-06-09 | 신규 유형 v rna 프로그래밍가능 엔도뉴클레아제 시스템 |
Country Status (7)
Country | Link |
---|---|
EP (1) | EP4352214A1 (ko) |
KR (1) | KR20240021218A (ko) |
AU (1) | AU2022290382A1 (ko) |
BR (1) | BR112023023768A2 (ko) |
CA (1) | CA3222950A1 (ko) |
IL (1) | IL308896A (ko) |
WO (1) | WO2022258753A1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW202400252A (zh) | 2022-04-28 | 2024-01-01 | 美商藍岩醫療公司 | 用於安全基因組整合之新位點及其使用方法 |
Family Cites Families (176)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5264A (en) | 1847-08-28 | Apparatus for operating carriage-brakes | ||
US5563A (en) | 1848-05-09 | John drummond | ||
US233A (en) | 1837-06-14 | Improvement in plows | ||
US196A (en) | 1837-05-15 | Machine for mowing and heaping grain | ||
US5177A (en) | 1847-06-26 | Wade haworth | ||
US253A (en) | 1837-07-05 | Improvement in machines for thinning cotton-plants | ||
US5455A (en) | 1848-02-22 | Spinning-machine | ||
US562A (en) | 1838-01-09 | Scale beam and weight | ||
US3687808A (en) | 1969-08-14 | 1972-08-29 | Univ Leland Stanford Junior | Synthetic polynucleotides |
US4469863A (en) | 1980-11-12 | 1984-09-04 | Ts O Paul O P | Nonionic nucleic acid alkyl and aryl phosphonates and processes for manufacture and use thereof |
US5023243A (en) | 1981-10-23 | 1991-06-11 | Molecular Biosystems, Inc. | Oligonucleotide therapeutic agent and method of making same |
US4476301A (en) | 1982-04-29 | 1984-10-09 | Centre National De La Recherche Scientifique | Oligonucleotides, a process for preparing the same and their application as mediators of the action of interferon |
JPS5927900A (ja) | 1982-08-09 | 1984-02-14 | Wakunaga Seiyaku Kk | 固定化オリゴヌクレオチド |
FR2540122B1 (fr) | 1983-01-27 | 1985-11-29 | Centre Nat Rech Scient | Nouveaux composes comportant une sequence d'oligonucleotide liee a un agent d'intercalation, leur procede de synthese et leur application |
US4605735A (en) | 1983-02-14 | 1986-08-12 | Wakunaga Seiyaku Kabushiki Kaisha | Oligonucleotide derivatives |
US4948882A (en) | 1983-02-22 | 1990-08-14 | Syngene, Inc. | Single-stranded labelled oligonucleotides, reactive monomers and methods of synthesis |
US4824941A (en) | 1983-03-10 | 1989-04-25 | Julian Gordon | Specific antibody to the native form of 2'5'-oligonucleotides, the method of preparation and the use as reagents in immunoassays or for binding 2'5'-oligonucleotides in biological systems |
US4587044A (en) | 1983-09-01 | 1986-05-06 | The Johns Hopkins University | Linkage of proteins to nucleic acids |
US5118802A (en) | 1983-12-20 | 1992-06-02 | California Institute Of Technology | DNA-reporter conjugates linked via the 2' or 5'-primary amino group of the 5'-terminal nucleoside |
US5550111A (en) | 1984-07-11 | 1996-08-27 | Temple University-Of The Commonwealth System Of Higher Education | Dual action 2',5'-oligoadenylate antiviral derivatives and uses thereof |
US5367066A (en) | 1984-10-16 | 1994-11-22 | Chiron Corporation | Oligonucleotides with selectably cleavable and/or abasic sites |
US5258506A (en) | 1984-10-16 | 1993-11-02 | Chiron Corporation | Photolabile reagents for incorporation into oligonucleotide chains |
US5430136A (en) | 1984-10-16 | 1995-07-04 | Chiron Corporation | Oligonucleotides having selectably cleavable and/or abasic sites |
US4828979A (en) | 1984-11-08 | 1989-05-09 | Life Technologies, Inc. | Nucleotide analogs for nucleic acid labeling and detection |
FR2575751B1 (fr) | 1985-01-08 | 1987-04-03 | Pasteur Institut | Nouveaux nucleosides de derives de l'adenosine, leur preparation et leurs applications biologiques |
US5166315A (en) | 1989-12-20 | 1992-11-24 | Anti-Gene Development Group | Sequence-specific binding polymers for duplex nucleic acids |
US5034506A (en) | 1985-03-15 | 1991-07-23 | Anti-Gene Development Group | Uncharged morpholino-based polymers having achiral intersubunit linkages |
US5185444A (en) | 1985-03-15 | 1993-02-09 | Anti-Gene Deveopment Group | Uncharged morpolino-based polymers having phosphorous containing chiral intersubunit linkages |
US5235033A (en) | 1985-03-15 | 1993-08-10 | Anti-Gene Development Group | Alpha-morpholino ribonucleoside derivatives and polymers thereof |
US5405938A (en) | 1989-12-20 | 1995-04-11 | Anti-Gene Development Group | Sequence-specific binding polymers for duplex nucleic acids |
US4762779A (en) | 1985-06-13 | 1988-08-09 | Amgen Inc. | Compositions and methods for functionalizing nucleic acids |
US5317098A (en) | 1986-03-17 | 1994-05-31 | Hiroaki Shizuya | Non-radioisotope tagging of fragments |
JPS638396A (ja) | 1986-06-30 | 1988-01-14 | Wakunaga Pharmaceut Co Ltd | ポリ標識化オリゴヌクレオチド誘導体 |
US5276019A (en) | 1987-03-25 | 1994-01-04 | The United States Of America As Represented By The Department Of Health And Human Services | Inhibitors for replication of retroviruses and for the expression of oncogene products |
US5264423A (en) | 1987-03-25 | 1993-11-23 | The United States Of America As Represented By The Department Of Health And Human Services | Inhibitors for replication of retroviruses and for the expression of oncogene products |
US4904582A (en) | 1987-06-11 | 1990-02-27 | Synthetic Genetics | Novel amphiphilic nucleic acid conjugates |
AU598946B2 (en) | 1987-06-24 | 1990-07-05 | Howard Florey Institute Of Experimental Physiology And Medicine | Nucleoside derivatives |
US5585481A (en) | 1987-09-21 | 1996-12-17 | Gen-Probe Incorporated | Linking reagents for nucleotide probes |
US5188897A (en) | 1987-10-22 | 1993-02-23 | Temple University Of The Commonwealth System Of Higher Education | Encapsulated 2',5'-phosphorothioate oligoadenylates |
US4924624A (en) | 1987-10-22 | 1990-05-15 | Temple University-Of The Commonwealth System Of Higher Education | 2,',5'-phosphorothioate oligoadenylates and plant antiviral uses thereof |
US5525465A (en) | 1987-10-28 | 1996-06-11 | Howard Florey Institute Of Experimental Physiology And Medicine | Oligonucleotide-polyamide conjugates and methods of production and applications of the same |
DE3738460A1 (de) | 1987-11-12 | 1989-05-24 | Max Planck Gesellschaft | Modifizierte oligonukleotide |
US5082830A (en) | 1988-02-26 | 1992-01-21 | Enzo Biochem, Inc. | End labeled nucleotide probe |
EP0406309A4 (en) | 1988-03-25 | 1992-08-19 | The University Of Virginia Alumni Patents Foundation | Oligonucleotide n-alkylphosphoramidates |
US5278302A (en) | 1988-05-26 | 1994-01-11 | University Patents, Inc. | Polynucleotide phosphorodithioates |
US5109124A (en) | 1988-06-01 | 1992-04-28 | Biogen, Inc. | Nucleic acid probe linked to a label having a terminal cysteine |
US5216141A (en) | 1988-06-06 | 1993-06-01 | Benner Steven A | Oligonucleotide analogs containing sulfur linkages |
US5175273A (en) | 1988-07-01 | 1992-12-29 | Genentech, Inc. | Nucleic acid intercalating agents |
US5262536A (en) | 1988-09-15 | 1993-11-16 | E. I. Du Pont De Nemours And Company | Reagents for the preparation of 5'-tagged oligonucleotides |
US5512439A (en) | 1988-11-21 | 1996-04-30 | Dynal As | Oligonucleotide-linked magnetic particles and uses thereof |
US5599923A (en) | 1989-03-06 | 1997-02-04 | Board Of Regents, University Of Tx | Texaphyrin metal complexes having improved functionalization |
US5457183A (en) | 1989-03-06 | 1995-10-10 | Board Of Regents, The University Of Texas System | Hydroxylated texaphyrins |
US5391723A (en) | 1989-05-31 | 1995-02-21 | Neorx Corporation | Oligonucleotide conjugates |
US4958013A (en) | 1989-06-06 | 1990-09-18 | Northwestern University | Cholesteryl modified oligonucleotides |
US5585362A (en) | 1989-08-22 | 1996-12-17 | The Regents Of The University Of Michigan | Adenovirus vectors for gene therapy |
US5451463A (en) | 1989-08-28 | 1995-09-19 | Clontech Laboratories, Inc. | Non-nucleoside 1,3-diol reagents for labeling synthetic oligonucleotides |
US5134066A (en) | 1989-08-29 | 1992-07-28 | Monsanto Company | Improved probes using nucleosides containing 3-dezauracil analogs |
US5254469A (en) | 1989-09-12 | 1993-10-19 | Eastman Kodak Company | Oligonucleotide-enzyme conjugate that can be used as a probe in hybridization assays and polymerase chain reaction procedures |
US5399676A (en) | 1989-10-23 | 1995-03-21 | Gilead Sciences | Oligonucleotides with inverted polarity |
US5264564A (en) | 1989-10-24 | 1993-11-23 | Gilead Sciences | Oligonucleotide analogs with novel linkages |
US5292873A (en) | 1989-11-29 | 1994-03-08 | The Research Foundation Of State University Of New York | Nucleic acids labeled with naphthoquinone probe |
US5130302A (en) | 1989-12-20 | 1992-07-14 | Boron Bilogicals, Inc. | Boronated nucleoside, nucleotide and oligonucleotide compounds, compositions and methods for using same |
US5486603A (en) | 1990-01-08 | 1996-01-23 | Gilead Sciences, Inc. | Oligonucleotide having enhanced binding affinity |
US5578718A (en) | 1990-01-11 | 1996-11-26 | Isis Pharmaceuticals, Inc. | Thiol-derivatized nucleosides |
US5459255A (en) | 1990-01-11 | 1995-10-17 | Isis Pharmaceuticals, Inc. | N-2 substituted purines |
US5681941A (en) | 1990-01-11 | 1997-10-28 | Isis Pharmaceuticals, Inc. | Substituted purines and oligonucleotide cross-linking |
US5587470A (en) | 1990-01-11 | 1996-12-24 | Isis Pharmaceuticals, Inc. | 3-deazapurines |
US5587361A (en) | 1991-10-15 | 1996-12-24 | Isis Pharmaceuticals, Inc. | Oligonucleotides having phosphorothioate linkages of high chiral purity |
US5214136A (en) | 1990-02-20 | 1993-05-25 | Gilead Sciences, Inc. | Anthraquinone-derivatives oligonucleotides |
AU7579991A (en) | 1990-02-20 | 1991-09-18 | Gilead Sciences, Inc. | Pseudonucleosides and pseudonucleotides and their polymers |
US5321131A (en) | 1990-03-08 | 1994-06-14 | Hybridon, Inc. | Site-specific functionalization of oligodeoxynucleotides for non-radioactive labelling |
US5470967A (en) | 1990-04-10 | 1995-11-28 | The Dupont Merck Pharmaceutical Company | Oligonucleotide analogs with sulfamate linkages |
DE69032425T2 (de) | 1990-05-11 | 1998-11-26 | Microprobe Corp | Teststreifen zum Eintauchen für Nukleinsäure-Hybridisierungsassays und Verfahren zur kovalenten Immobilisierung von Oligonucleotiden |
US5218105A (en) | 1990-07-27 | 1993-06-08 | Isis Pharmaceuticals | Polyamine conjugated oligonucleotides |
US5138045A (en) | 1990-07-27 | 1992-08-11 | Isis Pharmaceuticals | Polyamine conjugated oligonucleotides |
US5489677A (en) | 1990-07-27 | 1996-02-06 | Isis Pharmaceuticals, Inc. | Oligonucleoside linkages containing adjacent oxygen and nitrogen atoms |
US5618704A (en) | 1990-07-27 | 1997-04-08 | Isis Pharmacueticals, Inc. | Backbone-modified oligonucleotide analogs and preparation thereof through radical coupling |
US5541307A (en) | 1990-07-27 | 1996-07-30 | Isis Pharmaceuticals, Inc. | Backbone modified oligonucleotide analogs and solid phase synthesis thereof |
US5677437A (en) | 1990-07-27 | 1997-10-14 | Isis Pharmaceuticals, Inc. | Heteroatomic oligonucleoside linkages |
US5602240A (en) | 1990-07-27 | 1997-02-11 | Ciba Geigy Ag. | Backbone modified oligonucleotide analogs |
US5623070A (en) | 1990-07-27 | 1997-04-22 | Isis Pharmaceuticals, Inc. | Heteroatomic oligonucleoside linkages |
US5610289A (en) | 1990-07-27 | 1997-03-11 | Isis Pharmaceuticals, Inc. | Backbone modified oligonucleotide analogues |
US5688941A (en) | 1990-07-27 | 1997-11-18 | Isis Pharmaceuticals, Inc. | Methods of making conjugated 4' desmethyl nucleoside analog compounds |
WO1992002258A1 (en) | 1990-07-27 | 1992-02-20 | Isis Pharmaceuticals, Inc. | Nuclease resistant, pyrimidine modified oligonucleotides that detect and modulate gene expression |
US5608046A (en) | 1990-07-27 | 1997-03-04 | Isis Pharmaceuticals, Inc. | Conjugated 4'-desmethyl nucleoside analog compounds |
US5245022A (en) | 1990-08-03 | 1993-09-14 | Sterling Drug, Inc. | Exonuclease resistant terminally substituted oligonucleotides |
DK0541722T3 (da) | 1990-08-03 | 1996-04-22 | Sterling Winthrop Inc | Forbindelser og fremgangsmåder til inhibering af genekspression |
US5512667A (en) | 1990-08-28 | 1996-04-30 | Reed; Michael W. | Trifunctional intermediates for preparing 3'-tailed oligonucleotides |
US5214134A (en) | 1990-09-12 | 1993-05-25 | Sterling Winthrop Inc. | Process of linking nucleosides with a siloxane bridge |
US5561225A (en) | 1990-09-19 | 1996-10-01 | Southern Research Institute | Polynucleotide analogs containing sulfonate and sulfonamide internucleoside linkages |
CA2092002A1 (en) | 1990-09-20 | 1992-03-21 | Mark Matteucci | Modified internucleoside linkages |
US5432272A (en) | 1990-10-09 | 1995-07-11 | Benner; Steven A. | Method for incorporating into a DNA or RNA oligonucleotide using nucleotides bearing heterocyclic bases |
US5173414A (en) | 1990-10-30 | 1992-12-22 | Applied Immune Sciences, Inc. | Production of recombinant adeno-associated virus vectors |
WO1992008728A1 (en) | 1990-11-08 | 1992-05-29 | Hybridon, Inc. | Incorporation of multiple reporter groups on synthetic oligonucleotides |
CA2103705C (en) | 1991-02-11 | 1996-01-30 | Ayub K. Ommaya | Spinal fluid driven artificial organ |
US5222982A (en) | 1991-02-11 | 1993-06-29 | Ommaya Ayub K | Spinal fluid driven artificial organ |
US5719262A (en) | 1993-11-22 | 1998-02-17 | Buchardt, Deceased; Ole | Peptide nucleic acids having amino acid side chains |
US5539082A (en) | 1993-04-26 | 1996-07-23 | Nielsen; Peter E. | Peptide nucleic acids |
US5714331A (en) | 1991-05-24 | 1998-02-03 | Buchardt, Deceased; Ole | Peptide nucleic acids having enhanced binding affinity, sequence specificity and solubility |
US5371241A (en) | 1991-07-19 | 1994-12-06 | Pharmacia P-L Biochemicals Inc. | Fluorescein labelled phosphoramidites |
US5571799A (en) | 1991-08-12 | 1996-11-05 | Basco, Ltd. | (2'-5') oligoadenylate analogues useful as inhibitors of host-v5.-graft response |
JP3534749B2 (ja) | 1991-08-20 | 2004-06-07 | アメリカ合衆国 | アデノウイルスが介在する胃腸管への遺伝子の輸送 |
US5252479A (en) | 1991-11-08 | 1993-10-12 | Research Corporation Technologies, Inc. | Safe vector for gene therapy |
TW393513B (en) | 1991-11-26 | 2000-06-11 | Isis Pharmaceuticals Inc | Enhanced triple-helix and double-helix formation with oligomers containing modified pyrimidines |
US5484908A (en) | 1991-11-26 | 1996-01-16 | Gilead Sciences, Inc. | Oligonucleotides containing 5-propynyl pyrimidines |
US5565552A (en) | 1992-01-21 | 1996-10-15 | Pharmacyclics, Inc. | Method of expanded porphyrin-oligonucleotide conjugate synthesis |
US5595726A (en) | 1992-01-21 | 1997-01-21 | Pharmacyclics, Inc. | Chromophore probe for detection of nucleic acid |
FR2688514A1 (fr) | 1992-03-16 | 1993-09-17 | Centre Nat Rech Scient | Adenovirus recombinants defectifs exprimant des cytokines et medicaments antitumoraux les contenant. |
US5633360A (en) | 1992-04-14 | 1997-05-27 | Gilead Sciences, Inc. | Oligonucleotide analogs capable of passive cell membrane permeation |
US5434257A (en) | 1992-06-01 | 1995-07-18 | Gilead Sciences, Inc. | Binding compentent oligomers containing unsaturated 3',5' and 2',5' linkages |
US5272250A (en) | 1992-07-10 | 1993-12-21 | Spielvogel Bernard F | Boronated phosphoramidate compounds |
US7153684B1 (en) | 1992-10-08 | 2006-12-26 | Vanderbilt University | Pluripotential embryonic stem cells and methods of making same |
JPH08503855A (ja) | 1992-12-03 | 1996-04-30 | ジェンザイム・コーポレイション | 嚢胞性線維症に対する遺伝子治療 |
US5574142A (en) | 1992-12-15 | 1996-11-12 | Microprobe Corporation | Peptide linkers for improved oligonucleotide delivery |
US5476925A (en) | 1993-02-01 | 1995-12-19 | Northwestern University | Oligodeoxyribonucleotides including 3'-aminonucleoside-phosphoramidate linkages and terminal 3'-amino groups |
GB9304618D0 (en) | 1993-03-06 | 1993-04-21 | Ciba Geigy Ag | Chemical compounds |
CA2159629A1 (en) | 1993-03-31 | 1994-10-13 | Sanofi | Oligonucleotides with amide linkages replacing phosphodiester linkages |
JP3532566B2 (ja) | 1993-06-24 | 2004-05-31 | エル. グラハム,フランク | 遺伝子治療のためのアデノウイルスベクター |
US5502177A (en) | 1993-09-17 | 1996-03-26 | Gilead Sciences, Inc. | Pyrimidine derivatives for labeled binding partners |
RU2162342C2 (ru) | 1993-10-25 | 2001-01-27 | Кэнджи Инк. | Рекомбинантный аденовирусный вектор и способы его применения |
ES2216005T3 (es) | 1993-11-09 | 2004-10-16 | Targeted Genetics Corporation | Produccion de titulos elevados de vectores de aav recombinantes. |
ES2220923T3 (es) | 1993-11-09 | 2004-12-16 | Medical College Of Ohio | Lineas celulares estables capaces de expresar el gen de replicacion del virus adeno-asociado. |
US5457187A (en) | 1993-12-08 | 1995-10-10 | Board Of Regents University Of Nebraska | Oligonucleotides containing 5-fluorouracil |
US5596091A (en) | 1994-03-18 | 1997-01-21 | The Regents Of The University Of California | Antisense oligonucleotides comprising 5-aminoalkyl pyrimidine nucleotides |
US5625050A (en) | 1994-03-31 | 1997-04-29 | Amgen Inc. | Modified oligonucleotides and intermediates useful in nucleic acid therapeutics |
US5525711A (en) | 1994-05-18 | 1996-06-11 | The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services | Pteridine nucleotide analogs as fluorescent DNA probes |
US5658785A (en) | 1994-06-06 | 1997-08-19 | Children's Hospital, Inc. | Adeno-associated virus materials and methods |
US5597696A (en) | 1994-07-18 | 1997-01-28 | Becton Dickinson And Company | Covalent cyanine dye oligonucleotide conjugates |
US5580731A (en) | 1994-08-25 | 1996-12-03 | Chiron Corporation | N-4 modified pyrimidine deoxynucleotides and oligonucleotide probes synthesized therewith |
US5856152A (en) | 1994-10-28 | 1999-01-05 | The Trustees Of The University Of Pennsylvania | Hybrid adenovirus-AAV vector and methods of use therefor |
CA2207927A1 (en) | 1994-12-06 | 1996-06-13 | Targeted Genetics Corporation | Packaging cell lines for generation of high titers of recombinant aav vectors |
US5843780A (en) | 1995-01-20 | 1998-12-01 | Wisconsin Alumni Research Foundation | Primate embryonic stem cells |
FR2737730B1 (fr) | 1995-08-10 | 1997-09-05 | Pasteur Merieux Serums Vacc | Procede de purification de virus par chromatographie |
US6143548A (en) | 1995-08-30 | 2000-11-07 | Genzyme Corporation | Chromatographic purification of adeno-associated virus (AAV) |
ES2317646T3 (es) | 1995-09-08 | 2009-04-16 | Genzyme Corporation | Vectores aav mejorados para terapia genica. |
US5910434A (en) | 1995-12-15 | 1999-06-08 | Systemix, Inc. | Method for obtaining retroviral packaging cell lines producing high transducing efficiency retroviral supernatant |
JP3756313B2 (ja) | 1997-03-07 | 2006-03-15 | 武 今西 | 新規ビシクロヌクレオシド及びオリゴヌクレオチド類縁体 |
PT1009808E (pt) | 1997-09-05 | 2013-01-29 | Genzyme Corp | Métodos para a produção de preparações de elevado título de vectores de aav recombinante isentas de auxiliar |
EP2341057A3 (en) | 1997-09-12 | 2011-11-23 | Exiqon A/S | Oligonucleotide Analogues |
US6800480B1 (en) | 1997-10-23 | 2004-10-05 | Geron Corporation | Methods and materials for the growth of primate-derived primordial stem cells in feeder-free culture |
US6667176B1 (en) | 2000-01-11 | 2003-12-23 | Geron Corporation | cDNA libraries reflecting gene expression during growth and differentiation of human pluripotent stem cells |
US7410798B2 (en) | 2001-01-10 | 2008-08-12 | Geron Corporation | Culture system for rapid expansion of human embryonic stem cells |
US7078387B1 (en) | 1998-12-28 | 2006-07-18 | Arch Development Corp. | Efficient and stable in vivo gene transfer to cardiomyocytes using recombinant adeno-associated virus vectors |
US6258595B1 (en) | 1999-03-18 | 2001-07-10 | The Trustees Of The University Of Pennsylvania | Compositions and methods for helper-free production of recombinant adeno-associated viruses |
JP2003507438A (ja) | 1999-08-24 | 2003-02-25 | セルゲイト, インコーポレイテッド | オリゴアルギニン部分を使用する上皮組織を横切るおよび上皮組織内への薬物送達の増強 |
US7229961B2 (en) | 1999-08-24 | 2007-06-12 | Cellgate, Inc. | Compositions and methods for enhancing drug delivery across and into ocular tissues |
EP1083231A1 (en) | 1999-09-09 | 2001-03-14 | Introgene B.V. | Smooth muscle cell promoter and uses thereof |
US7256286B2 (en) | 1999-11-30 | 2007-08-14 | The Board Of Trustees Of The Leland Stanford Junior University | Bryostatin analogues, synthetic methods and uses |
US6287860B1 (en) | 2000-01-20 | 2001-09-11 | Isis Pharmaceuticals, Inc. | Antisense inhibition of MEKK2 expression |
CA2406743A1 (en) | 2000-04-28 | 2001-11-08 | The Trustees Of The University Of Pennsylvania | Recombinant aav vectors with aav5 capsids and aav5 vectors pseudotyped in heterologous capsids |
EP1401473B1 (en) | 2001-02-16 | 2009-07-29 | Cellgate Inc. | Transporters comprising spaced arginine moieties |
US20030158403A1 (en) | 2001-07-03 | 2003-08-21 | Isis Pharmaceuticals, Inc. | Nuclease resistant chimeric oligonucleotides |
US7169874B2 (en) | 2001-11-02 | 2007-01-30 | Bausch & Lomb Incorporated | High refractive index polymeric siloxysilane compositions |
EP4223769A3 (en) | 2005-12-13 | 2023-11-01 | Kyoto University | Nuclear reprogramming factor |
US20090227032A1 (en) | 2005-12-13 | 2009-09-10 | Kyoto University | Nuclear reprogramming factor and induced pluripotent stem cells |
US8278104B2 (en) | 2005-12-13 | 2012-10-02 | Kyoto University | Induced pluripotent stem cells produced with Oct3/4, Klf4 and Sox2 |
SI2019683T2 (sl) | 2006-04-25 | 2022-10-28 | The Regents Of The University Of California | Dajanje rastnih faktorjev za zdravljenje motenj CŽS |
US20080081064A1 (en) | 2006-09-28 | 2008-04-03 | Surmodics, Inc. | Implantable Medical Device with Apertures for Delivery of Bioactive Agents |
JP2008307007A (ja) | 2007-06-15 | 2008-12-25 | Bayer Schering Pharma Ag | 出生後のヒト組織由来未分化幹細胞から誘導したヒト多能性幹細胞 |
US9683232B2 (en) | 2007-12-10 | 2017-06-20 | Kyoto University | Efficient method for nuclear reprogramming |
EP2257250A2 (en) | 2008-01-29 | 2010-12-08 | Gilbert H. Kliman | Drug delivery devices, kits and methods therefor |
US9209196B2 (en) | 2011-11-30 | 2015-12-08 | Sharp Kabushiki Kaisha | Memory circuit, method of driving the same, nonvolatile storage device using the same, and liquid crystal display device |
US9802715B2 (en) | 2012-03-29 | 2017-10-31 | The Boeing Company | Fastener systems that provide EME protection |
DE102012007232B4 (de) | 2012-04-07 | 2014-03-13 | Susanne Weller | Verfahren zur Herstellung von rotierenden elektrischen Maschinen |
US9415109B2 (en) | 2012-07-06 | 2016-08-16 | Alnylam Pharmaceuticals, Inc. | Stable non-aggregating nucleic acid lipid particle formulations |
JP2015092462A (ja) | 2013-09-30 | 2015-05-14 | Tdk株式会社 | 正極及びそれを用いたリチウムイオン二次電池 |
PL3083556T3 (pl) | 2013-12-19 | 2020-06-29 | Novartis Ag | Lipidy i kompozycje lipidowe dla dostarczania środków czynnych |
WO2015130584A2 (en) | 2014-02-25 | 2015-09-03 | Merck Sharp & Dohme Corp. | Lipid nanoparticle vaccine adjuvants and antigen delivery systems |
WO2015141521A1 (ja) | 2014-03-21 | 2015-09-24 | 株式会社日立国際電気 | 基板処理装置、半導体装置の製造方法及び記録媒体 |
JP6197169B2 (ja) | 2014-09-29 | 2017-09-20 | 東芝メモリ株式会社 | 半導体装置の製造方法 |
KR20180096592A (ko) | 2015-10-22 | 2018-08-29 | 모더나티엑스, 인크. | 호흡기 세포융합 바이러스 백신 |
WO2018081480A1 (en) | 2016-10-26 | 2018-05-03 | Acuitas Therapeutics, Inc. | Lipid nanoparticle formulations |
AU2016366978B2 (en) | 2015-12-10 | 2022-07-28 | Modernatx, Inc. | Compositions and methods for delivery of therapeutic agents |
EP3436077A1 (en) | 2016-03-30 | 2019-02-06 | Intellia Therapeutics, Inc. | Lipid nanoparticle formulations for crispr/cas components |
CA3029121A1 (en) | 2016-06-29 | 2018-01-04 | Crispr Therapeutics Ag | Compositions and methods for gene editing |
US20220145296A1 (en) * | 2018-12-27 | 2022-05-12 | LifeEDIT Therapeutics, Inc. | Polypeptides useful for gene editing and methods of use |
-
2022
- 2022-06-09 EP EP22733368.9A patent/EP4352214A1/en active Pending
- 2022-06-09 CA CA3222950A patent/CA3222950A1/en active Pending
- 2022-06-09 BR BR112023023768A patent/BR112023023768A2/pt unknown
- 2022-06-09 AU AU2022290382A patent/AU2022290382A1/en active Pending
- 2022-06-09 IL IL308896A patent/IL308896A/en unknown
- 2022-06-09 WO PCT/EP2022/065691 patent/WO2022258753A1/en active Application Filing
- 2022-06-09 KR KR1020247000678A patent/KR20240021218A/ko unknown
Also Published As
Publication number | Publication date |
---|---|
IL308896A (en) | 2024-01-01 |
EP4352214A1 (en) | 2024-04-17 |
BR112023023768A2 (pt) | 2024-02-27 |
AU2022290382A9 (en) | 2023-11-30 |
CA3222950A1 (en) | 2022-12-15 |
WO2022258753A1 (en) | 2022-12-15 |
AU2022290382A1 (en) | 2023-11-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20230227859A1 (en) | Methods and compositions for rna-directed target dna modification and for rna-directed modulation of transcription | |
US10494620B2 (en) | Methods and compositions for modifying a single stranded target nucleic acid | |
EP3250689B1 (en) | Methods and compositions for labeling a single-stranded target nucleic acid | |
JP2021506251A (ja) | 新規rnaプログラム可能エンドヌクレアーゼ系、ならびにゲノム編集および他の適用におけるその使用 | |
JP2018532402A (ja) | Rnaプログラム可能エンドヌクレアーゼの新規のファミリーならびにゲノム編集および他の適用におけるそれらの使用 | |
US20210054353A1 (en) | Novel rna-programmable endonuclease systems and uses thereof | |
US20220145274A1 (en) | Novel high fidelity rna-programmable endonuclease systems and uses thereof | |
KR20240021218A (ko) | 신규 유형 v rna 프로그래밍가능 엔도뉴클레아제 시스템 | |
EP4101928A1 (en) | Type v rna programmable endonuclease systems | |
WO2023118068A1 (en) | Novel small type v rna programmable endonuclease systems | |
EP4144841A1 (en) | Novel small rna programmable endonuclease systems with impoved pam specificity and uses thereof | |
WO2023237587A1 (en) | Novel small type v rna programmable endonuclease systems | |
CN117940560A (en) | Novel small RNA programmable endonuclease system with improved PAM specificity and uses thereof |