KR20230070065A - Crispr-기초된 유전체 변형과 조절 - Google Patents
Crispr-기초된 유전체 변형과 조절 Download PDFInfo
- Publication number
- KR20230070065A KR20230070065A KR1020237015558A KR20237015558A KR20230070065A KR 20230070065 A KR20230070065 A KR 20230070065A KR 1020237015558 A KR1020237015558 A KR 1020237015558A KR 20237015558 A KR20237015558 A KR 20237015558A KR 20230070065 A KR20230070065 A KR 20230070065A
- Authority
- KR
- South Korea
- Prior art keywords
- sequence
- rna
- protein
- domain
- lys
- Prior art date
Links
- 108091033409 CRISPR Proteins 0.000 title abstract description 97
- 230000004048 modification Effects 0.000 title description 16
- 238000012986 modification Methods 0.000 title description 16
- 230000033228 biological regulation Effects 0.000 title description 4
- 238000000034 method Methods 0.000 claims abstract description 72
- 238000011282 treatment Methods 0.000 claims description 5
- 239000003431 cross linking reagent Substances 0.000 claims 1
- 239000003814 drug Substances 0.000 claims 1
- 239000003937 drug carrier Substances 0.000 claims 1
- 230000004515 progressive myopia Effects 0.000 claims 1
- 229940124597 therapeutic agent Drugs 0.000 claims 1
- 230000002759 chromosomal effect Effects 0.000 abstract description 170
- 108020001507 fusion proteins Proteins 0.000 abstract description 158
- 102000037865 fusion proteins Human genes 0.000 abstract description 158
- 108010042407 Endonucleases Proteins 0.000 abstract description 135
- 102000004533 Endonucleases Human genes 0.000 abstract description 135
- 238000003776 cleavage reaction Methods 0.000 abstract description 99
- 230000007017 scission Effects 0.000 abstract description 99
- 239000012636 effector Substances 0.000 abstract description 42
- 102100021579 Enhancer of filamentation 1 Human genes 0.000 abstract description 41
- 101000898310 Homo sapiens Enhancer of filamentation 1 Proteins 0.000 abstract description 41
- 210000002257 embryonic structure Anatomy 0.000 abstract description 40
- 230000014509 gene expression Effects 0.000 abstract description 37
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 abstract description 18
- 230000004049 epigenetic modification Effects 0.000 abstract description 17
- 210000003527 eukaryotic cell Anatomy 0.000 abstract description 16
- 239000012634 fragment Substances 0.000 abstract description 16
- 102100025169 Max-binding protein MNT Human genes 0.000 abstract description 13
- 108091006107 transcriptional repressors Proteins 0.000 abstract description 13
- 238000010362 genome editing Methods 0.000 abstract description 7
- 108091032973 (ribonucleotides)n+m Proteins 0.000 abstract 2
- 238000010354 CRISPR gene editing Methods 0.000 abstract 1
- 210000004027 cell Anatomy 0.000 description 177
- 108090000623 proteins and genes Proteins 0.000 description 142
- 108020005004 Guide RNA Proteins 0.000 description 131
- 108020004414 DNA Proteins 0.000 description 108
- 102000004169 proteins and genes Human genes 0.000 description 108
- 235000018102 proteins Nutrition 0.000 description 105
- 125000003729 nucleotide group Chemical group 0.000 description 99
- 239000002773 nucleotide Substances 0.000 description 96
- 210000001161 mammalian embryo Anatomy 0.000 description 88
- 241001465754 Metazoa Species 0.000 description 65
- 102000040430 polynucleotide Human genes 0.000 description 65
- 108091033319 polynucleotide Proteins 0.000 description 65
- 239000002157 polynucleotide Substances 0.000 description 65
- 150000007523 nucleic acids Chemical class 0.000 description 63
- 101710163270 Nuclease Proteins 0.000 description 55
- 102000039446 nucleic acids Human genes 0.000 description 53
- 108020004707 nucleic acids Proteins 0.000 description 53
- 241000282414 Homo sapiens Species 0.000 description 37
- 230000005782 double-strand break Effects 0.000 description 36
- 241000699666 Mus <mouse, genus> Species 0.000 description 35
- 230000008439 repair process Effects 0.000 description 35
- 238000011144 upstream manufacturing Methods 0.000 description 35
- 230000000694 effects Effects 0.000 description 32
- 239000013612 plasmid Substances 0.000 description 26
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 24
- 108020004999 messenger RNA Proteins 0.000 description 23
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 22
- 239000013598 vector Substances 0.000 description 19
- 238000012217 deletion Methods 0.000 description 18
- 230000037430 deletion Effects 0.000 description 18
- 230000010354 integration Effects 0.000 description 18
- 230000035772 mutation Effects 0.000 description 18
- 108091028043 Nucleic acid sequence Proteins 0.000 description 17
- 238000003780 insertion Methods 0.000 description 17
- 230000037431 insertion Effects 0.000 description 17
- 230000006780 non-homologous end joining Effects 0.000 description 17
- 238000001890 transfection Methods 0.000 description 17
- 108091026890 Coding region Proteins 0.000 description 15
- 230000004568 DNA-binding Effects 0.000 description 14
- 210000004962 mammalian cell Anatomy 0.000 description 14
- 238000006467 substitution reaction Methods 0.000 description 14
- 239000000539 dimer Substances 0.000 description 13
- 239000003550 marker Substances 0.000 description 13
- 239000000047 product Substances 0.000 description 13
- 238000000338 in vitro Methods 0.000 description 12
- 230000001404 mediated effect Effects 0.000 description 12
- 230000008569 process Effects 0.000 description 12
- 241001529936 Murinae Species 0.000 description 11
- 230000000295 complement effect Effects 0.000 description 11
- 239000013600 plasmid vector Substances 0.000 description 11
- 238000010453 CRISPR/Cas method Methods 0.000 description 10
- 108091092236 Chimeric RNA Proteins 0.000 description 10
- 108091028113 Trans-activating crRNA Proteins 0.000 description 10
- 125000003275 alpha amino acid group Chemical group 0.000 description 10
- 239000000833 heterodimer Substances 0.000 description 10
- 210000001519 tissue Anatomy 0.000 description 10
- 241000700159 Rattus Species 0.000 description 9
- 235000001014 amino acid Nutrition 0.000 description 9
- 210000000349 chromosome Anatomy 0.000 description 9
- -1 for example Proteins 0.000 description 9
- 230000001105 regulatory effect Effects 0.000 description 9
- 238000013518 transcription Methods 0.000 description 9
- 230000035897 transcription Effects 0.000 description 9
- 108020004705 Codon Proteins 0.000 description 8
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 8
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 8
- 102000004190 Enzymes Human genes 0.000 description 8
- 108090000790 Enzymes Proteins 0.000 description 8
- 229940024606 amino acid Drugs 0.000 description 8
- 108010092854 aspartyllysine Proteins 0.000 description 8
- 102000053602 DNA Human genes 0.000 description 7
- 101001000998 Homo sapiens Protein phosphatase 1 regulatory subunit 12C Proteins 0.000 description 7
- 102100035620 Protein phosphatase 1 regulatory subunit 12C Human genes 0.000 description 7
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 7
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 7
- 230000008859 change Effects 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 7
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 7
- 230000002068 genetic effect Effects 0.000 description 7
- 210000005260 human cell Anatomy 0.000 description 7
- 210000000130 stem cell Anatomy 0.000 description 7
- 229910052725 zinc Inorganic materials 0.000 description 7
- 239000011701 zinc Substances 0.000 description 7
- 241000699800 Cricetinae Species 0.000 description 6
- 208000035752 Live birth Diseases 0.000 description 6
- 208000009869 Neu-Laxova syndrome Diseases 0.000 description 6
- 230000004913 activation Effects 0.000 description 6
- 150000001413 amino acids Chemical class 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 6
- 241000894007 species Species 0.000 description 6
- 241000701022 Cytomegalovirus Species 0.000 description 5
- 241000238631 Hexapoda Species 0.000 description 5
- 108090000246 Histone acetyltransferases Proteins 0.000 description 5
- 102000003893 Histone acetyltransferases Human genes 0.000 description 5
- 241000699670 Mus sp. Species 0.000 description 5
- 125000000539 amino acid group Chemical group 0.000 description 5
- 108010062796 arginyllysine Proteins 0.000 description 5
- 108010038633 aspartylglutamate Proteins 0.000 description 5
- 230000001580 bacterial effect Effects 0.000 description 5
- 238000012258 culturing Methods 0.000 description 5
- 108010026638 endodeoxyribonuclease FokI Proteins 0.000 description 5
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 5
- 108091006047 fluorescent proteins Proteins 0.000 description 5
- 102000034287 fluorescent proteins Human genes 0.000 description 5
- 108010050848 glycylleucine Proteins 0.000 description 5
- 238000002744 homologous recombination Methods 0.000 description 5
- 230000006801 homologous recombination Effects 0.000 description 5
- 230000001939 inductive effect Effects 0.000 description 5
- 210000003734 kidney Anatomy 0.000 description 5
- 108010057821 leucylproline Proteins 0.000 description 5
- 108090000765 processed proteins & peptides Proteins 0.000 description 5
- 238000010561 standard procedure Methods 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 241000283690 Bos taurus Species 0.000 description 4
- 241000282472 Canis lupus familiaris Species 0.000 description 4
- 108010051219 Cre recombinase Proteins 0.000 description 4
- 230000033616 DNA repair Effects 0.000 description 4
- 238000001712 DNA sequencing Methods 0.000 description 4
- 241000196324 Embryophyta Species 0.000 description 4
- 241000282326 Felis catus Species 0.000 description 4
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 4
- 108090000144 Human Proteins Proteins 0.000 description 4
- 102000003839 Human Proteins Human genes 0.000 description 4
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 4
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 4
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 4
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 4
- 241000288906 Primates Species 0.000 description 4
- 241000283984 Rodentia Species 0.000 description 4
- 241000193996 Streptococcus pyogenes Species 0.000 description 4
- 241000187191 Streptomyces viridochromogenes Species 0.000 description 4
- 241000203587 Streptosporangium roseum Species 0.000 description 4
- 102000040945 Transcription factor Human genes 0.000 description 4
- 108091023040 Transcription factor Proteins 0.000 description 4
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 4
- 230000001464 adherent effect Effects 0.000 description 4
- 235000004279 alanine Nutrition 0.000 description 4
- 108010008355 arginyl-glutamine Proteins 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 230000000593 degrading effect Effects 0.000 description 4
- 208000035475 disorder Diseases 0.000 description 4
- 238000003205 genotyping method Methods 0.000 description 4
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 4
- 108010064235 lysylglycine Proteins 0.000 description 4
- 108010054155 lysyllysine Proteins 0.000 description 4
- 108010005942 methionylglycine Proteins 0.000 description 4
- 230000011987 methylation Effects 0.000 description 4
- 238000007069 methylation reaction Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 230000006798 recombination Effects 0.000 description 4
- 238000005215 recombination Methods 0.000 description 4
- 108010054624 red fluorescent protein Proteins 0.000 description 4
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 4
- 230000008685 targeting Effects 0.000 description 4
- 238000013519 translation Methods 0.000 description 4
- 230000014616 translation Effects 0.000 description 4
- 239000013603 viral vector Substances 0.000 description 4
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 3
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 3
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 3
- 108010068250 Herpes Simplex Virus Protein Vmw65 Proteins 0.000 description 3
- 102100022846 Histone acetyltransferase KAT2B Human genes 0.000 description 3
- 102100022893 Histone acetyltransferase KAT5 Human genes 0.000 description 3
- 102100038885 Histone acetyltransferase p300 Human genes 0.000 description 3
- 101000882390 Homo sapiens Histone acetyltransferase p300 Proteins 0.000 description 3
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 3
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 3
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 3
- 241000880493 Leptailurus serval Species 0.000 description 3
- 206010025323 Lymphomas Diseases 0.000 description 3
- 241000283973 Oryctolagus cuniculus Species 0.000 description 3
- 241001494479 Pecora Species 0.000 description 3
- 206010035226 Plasma cell myeloma Diseases 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- 101710137500 T7 RNA polymerase Proteins 0.000 description 3
- 238000010459 TALEN Methods 0.000 description 3
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 3
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 3
- 108010005233 alanylglutamic acid Proteins 0.000 description 3
- 108010013835 arginine glutamate Proteins 0.000 description 3
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 3
- 230000027455 binding Effects 0.000 description 3
- 229910002091 carbon monoxide Inorganic materials 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 210000002950 fibroblast Anatomy 0.000 description 3
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 3
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 3
- 108010025306 histidylleucine Proteins 0.000 description 3
- 239000000710 homodimer Substances 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 108010034529 leucyl-lysine Proteins 0.000 description 3
- 108010003700 lysyl aspartic acid Proteins 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 201000000050 myeloid neoplasm Diseases 0.000 description 3
- 108010051242 phenylalanylserine Proteins 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 230000001124 posttranscriptional effect Effects 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 235000000346 sugar Nutrition 0.000 description 3
- 230000005030 transcription termination Effects 0.000 description 3
- 230000005945 translocation Effects 0.000 description 3
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 2
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 2
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 2
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 2
- 241000147155 Ammonifex degensii Species 0.000 description 2
- 241000272517 Anseriformes Species 0.000 description 2
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 2
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 2
- 241000620196 Arthrospira maxima Species 0.000 description 2
- 240000002900 Arthrospira platensis Species 0.000 description 2
- 235000016425 Arthrospira platensis Nutrition 0.000 description 2
- BDMIFVIWCNLDCT-CIUDSAMLSA-N Asn-Arg-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O BDMIFVIWCNLDCT-CIUDSAMLSA-N 0.000 description 2
- DDPXDCKYWDGZAL-BQBZGAKWSA-N Asn-Gly-Arg Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N DDPXDCKYWDGZAL-BQBZGAKWSA-N 0.000 description 2
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 2
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 2
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 2
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 2
- 241000271566 Aves Species 0.000 description 2
- 102100021975 CREB-binding protein Human genes 0.000 description 2
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 2
- 241001429558 Caldicellulosiruptor bescii Species 0.000 description 2
- 241001496650 Candidatus Desulforudis Species 0.000 description 2
- 241000282465 Canis Species 0.000 description 2
- 241000282693 Cercopithecidae Species 0.000 description 2
- 101000709520 Chlamydia trachomatis serovar L2 (strain 434/Bu / ATCC VR-902B) Atypical response regulator protein ChxR Proteins 0.000 description 2
- 241000193163 Clostridioides difficile Species 0.000 description 2
- 241000193155 Clostridium botulinum Species 0.000 description 2
- 108700010070 Codon Usage Proteins 0.000 description 2
- 108091035707 Consensus sequence Proteins 0.000 description 2
- 102000005636 Cyclic AMP Response Element-Binding Protein Human genes 0.000 description 2
- 108010045171 Cyclic AMP Response Element-Binding Protein Proteins 0.000 description 2
- 238000007400 DNA extraction Methods 0.000 description 2
- 102220518659 Enhancer of filamentation 1_D10A_mutation Human genes 0.000 description 2
- 241000283073 Equus caballus Species 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 2
- MFORDNZDKAVNSR-SRVKXCTJSA-N Gln-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCC(N)=O MFORDNZDKAVNSR-SRVKXCTJSA-N 0.000 description 2
- AFODTOLGSZQDSL-PEFMBERDSA-N Glu-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N AFODTOLGSZQDSL-PEFMBERDSA-N 0.000 description 2
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 2
- 108010070675 Glutathione transferase Proteins 0.000 description 2
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 2
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 2
- STVHDEHTKFXBJQ-LAEOZQHASA-N Gly-Glu-Ile Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STVHDEHTKFXBJQ-LAEOZQHASA-N 0.000 description 2
- NSVOVKWEKGEOQB-LURJTMIESA-N Gly-Pro-Gly Chemical compound NCC(=O)N1CCC[C@H]1C(=O)NCC(O)=O NSVOVKWEKGEOQB-LURJTMIESA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 2
- 102100029100 Hematopoietic prostaglandin D synthase Human genes 0.000 description 2
- 102100039869 Histone H2B type F-S Human genes 0.000 description 2
- 108010033040 Histones Proteins 0.000 description 2
- 101001035372 Homo sapiens Histone H2B type F-S Proteins 0.000 description 2
- 101001046967 Homo sapiens Histone acetyltransferase KAT2A Proteins 0.000 description 2
- 101001047006 Homo sapiens Histone acetyltransferase KAT2B Proteins 0.000 description 2
- 101001046996 Homo sapiens Histone acetyltransferase KAT5 Proteins 0.000 description 2
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 2
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 2
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 2
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 2
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 2
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 2
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 2
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 2
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 2
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 2
- MTBLFIQZECOEBY-IHRRRGAJSA-N Lys-Met-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O MTBLFIQZECOEBY-IHRRRGAJSA-N 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 2
- 241000204637 Methanohalobium evestigatum Species 0.000 description 2
- 108060004795 Methyltransferase Proteins 0.000 description 2
- 108010079364 N-glycylalanine Proteins 0.000 description 2
- 108010047562 NGR peptide Proteins 0.000 description 2
- 241001223105 Nodularia spumigena Species 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 2
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 2
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 2
- 241000590028 Pseudoalteromonas haloplanktis Species 0.000 description 2
- 102000014450 RNA Polymerase III Human genes 0.000 description 2
- 108010078067 RNA Polymerase III Proteins 0.000 description 2
- 230000004570 RNA-binding Effects 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 241000714474 Rous sarcoma virus Species 0.000 description 2
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 2
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 2
- UYLKOSODXYSWMQ-XGEHTFHBSA-N Ser-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CO)N)O UYLKOSODXYSWMQ-XGEHTFHBSA-N 0.000 description 2
- 241000700584 Simplexvirus Species 0.000 description 2
- 241000194017 Streptococcus Species 0.000 description 2
- 241000194020 Streptococcus thermophilus Species 0.000 description 2
- 241000282887 Suidae Species 0.000 description 2
- 241000282898 Sus scrofa Species 0.000 description 2
- 210000001744 T-lymphocyte Anatomy 0.000 description 2
- 102000002933 Thioredoxin Human genes 0.000 description 2
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 2
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 2
- 241000078013 Trichormus variabilis Species 0.000 description 2
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 2
- 230000021736 acetylation Effects 0.000 description 2
- 238000006640 acetylation reaction Methods 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 108010044940 alanylglutamine Proteins 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 210000004102 animal cell Anatomy 0.000 description 2
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 2
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 2
- 229940011019 arthrospira platensis Drugs 0.000 description 2
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 2
- 210000001106 artificial yeast chromosome Anatomy 0.000 description 2
- 229940009098 aspartate Drugs 0.000 description 2
- 108010068265 aspartyltyrosine Proteins 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 108010006025 bovine growth hormone Proteins 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 102000021178 chitin binding proteins Human genes 0.000 description 2
- 108091011157 chitin binding proteins Proteins 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 238000006471 dimerization reaction Methods 0.000 description 2
- 210000001671 embryonic stem cell Anatomy 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 238000011066 ex-situ storage Methods 0.000 description 2
- 210000003754 fetus Anatomy 0.000 description 2
- 108010021843 fluorescent protein 583 Proteins 0.000 description 2
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- 230000037442 genomic alteration Effects 0.000 description 2
- 108010049041 glutamylalanine Proteins 0.000 description 2
- 108010079547 glutamylmethionine Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 210000003292 kidney cell Anatomy 0.000 description 2
- 238000001638 lipofection Methods 0.000 description 2
- 201000007270 liver cancer Diseases 0.000 description 2
- 208000014018 liver neoplasm Diseases 0.000 description 2
- 244000144972 livestock Species 0.000 description 2
- 230000033001 locomotion Effects 0.000 description 2
- 108010017391 lysylvaline Proteins 0.000 description 2
- 210000002540 macrophage Anatomy 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 201000001441 melanoma Diseases 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 210000003098 myoblast Anatomy 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 201000008968 osteosarcoma Diseases 0.000 description 2
- 210000001778 pluripotent stem cell Anatomy 0.000 description 2
- 229920002401 polyacrylamide Polymers 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 108010031719 prolyl-serine Proteins 0.000 description 2
- 108010070643 prolylglutamic acid Proteins 0.000 description 2
- 239000013636 protein dimer Substances 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 229910052594 sapphire Inorganic materials 0.000 description 2
- 239000010980 sapphire Substances 0.000 description 2
- 230000035939 shock Effects 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 108700029760 synthetic LTSP Proteins 0.000 description 2
- 238000010381 tandem affinity purification Methods 0.000 description 2
- 108060008226 thioredoxin Proteins 0.000 description 2
- 229940094937 thioredoxin Drugs 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 238000003151 transfection method Methods 0.000 description 2
- 239000012096 transfection reagent Substances 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 108700026220 vif Genes Proteins 0.000 description 2
- 230000003612 virological effect Effects 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- RRBGTUQJDFBWNN-MUGJNUQGSA-N (2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-6-amino-2-[[(2s)-2,6-diaminohexanoyl]amino]hexanoyl]amino]hexanoyl]amino]hexanoic acid Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O RRBGTUQJDFBWNN-MUGJNUQGSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- YMHOBZXQZVXHBM-UHFFFAOYSA-N 2,5-dimethoxy-4-bromophenethylamine Chemical compound COC1=CC(CCN)=C(OC)C=C1Br YMHOBZXQZVXHBM-UHFFFAOYSA-N 0.000 description 1
- GXPCCSYVSYFRDU-LJWNLINESA-N 2-[[(2s)-2-[[(2s)-2-[[2-[[(2s)-2-[[(2s)-2-amino-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]acetyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]acetic acid Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O)C1=CC=CC=C1 GXPCCSYVSYFRDU-LJWNLINESA-N 0.000 description 1
- FXYZDFSNBBOHTA-UHFFFAOYSA-N 2-[amino(morpholin-4-ium-4-ylidene)methyl]guanidine;chloride Chemical compound Cl.NC(N)=NC(=N)N1CCOCC1 FXYZDFSNBBOHTA-UHFFFAOYSA-N 0.000 description 1
- 241000007910 Acaryochloris marina Species 0.000 description 1
- 241001135192 Acetohalobium arabaticum Species 0.000 description 1
- 241000605222 Acidithiobacillus ferrooxidans Species 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 1
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 1
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 1
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 1
- NHCPCLJZRSIDHS-ZLUOBGJFSA-N Ala-Asp-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O NHCPCLJZRSIDHS-ZLUOBGJFSA-N 0.000 description 1
- YSMPVONNIWLJML-FXQIFTODSA-N Ala-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O YSMPVONNIWLJML-FXQIFTODSA-N 0.000 description 1
- DECCMEWNXSNSDO-ZLUOBGJFSA-N Ala-Cys-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O DECCMEWNXSNSDO-ZLUOBGJFSA-N 0.000 description 1
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 1
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 1
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 1
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 1
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 1
- QHASENCZLDHBGX-ONGXEEELSA-N Ala-Gly-Phe Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QHASENCZLDHBGX-ONGXEEELSA-N 0.000 description 1
- FDAZDMAFZYTHGS-XVYDVKMFSA-N Ala-His-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O FDAZDMAFZYTHGS-XVYDVKMFSA-N 0.000 description 1
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 1
- SUHLZMHFRALVSY-YUMQZZPRSA-N Ala-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)NCC(O)=O SUHLZMHFRALVSY-YUMQZZPRSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- KQESEZXHYOUIIM-CQDKDKBSSA-N Ala-Lys-Tyr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KQESEZXHYOUIIM-CQDKDKBSSA-N 0.000 description 1
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 1
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 1
- TVUFMYKTYXTRPY-HERUPUMHSA-N Ala-Trp-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O TVUFMYKTYXTRPY-HERUPUMHSA-N 0.000 description 1
- VYMJAWXRWHJIMS-LKTVYLICSA-N Ala-Tyr-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N VYMJAWXRWHJIMS-LKTVYLICSA-N 0.000 description 1
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 1
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 1
- 241000640374 Alicyclobacillus acidocaldarius Species 0.000 description 1
- 241000190857 Allochromatium vinosum Species 0.000 description 1
- 102100021954 Alpha-tubulin N-acetyltransferase 1 Human genes 0.000 description 1
- 235000002198 Annona diversifolia Nutrition 0.000 description 1
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 1
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 1
- HJVGMOYJDDXLMI-AVGNSLFASA-N Arg-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H](N)CCCNC(N)=N HJVGMOYJDDXLMI-AVGNSLFASA-N 0.000 description 1
- NONSEUUPKITYQT-BQBZGAKWSA-N Arg-Asn-Gly Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N)CN=C(N)N NONSEUUPKITYQT-BQBZGAKWSA-N 0.000 description 1
- SQKPKIJVWHAWNF-DCAQKATOSA-N Arg-Asp-Lys Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(O)=O SQKPKIJVWHAWNF-DCAQKATOSA-N 0.000 description 1
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 1
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 1
- NOZYDJOPOGKUSR-AVGNSLFASA-N Arg-Leu-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O NOZYDJOPOGKUSR-AVGNSLFASA-N 0.000 description 1
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 1
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 1
- MTYLORHAQXVQOW-AVGNSLFASA-N Arg-Lys-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O MTYLORHAQXVQOW-AVGNSLFASA-N 0.000 description 1
- GRRXPUAICOGISM-RWMBFGLXSA-N Arg-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GRRXPUAICOGISM-RWMBFGLXSA-N 0.000 description 1
- KSUALAGYYLQSHJ-RCWTZXSCSA-N Arg-Met-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSUALAGYYLQSHJ-RCWTZXSCSA-N 0.000 description 1
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 1
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 1
- YCYXHLZRUSJITQ-SRVKXCTJSA-N Arg-Pro-Pro Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 YCYXHLZRUSJITQ-SRVKXCTJSA-N 0.000 description 1
- ADPACBMPYWJJCE-FXQIFTODSA-N Arg-Ser-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O ADPACBMPYWJJCE-FXQIFTODSA-N 0.000 description 1
- MOGMYRUNTKYZFB-UNQGMJICSA-N Arg-Thr-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MOGMYRUNTKYZFB-UNQGMJICSA-N 0.000 description 1
- AOJYORNRFWWEIV-IHRRRGAJSA-N Arg-Tyr-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 AOJYORNRFWWEIV-IHRRRGAJSA-N 0.000 description 1
- PJOPLXOCKACMLK-KKUMJFAQSA-N Arg-Tyr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O PJOPLXOCKACMLK-KKUMJFAQSA-N 0.000 description 1
- IZSMEUDYADKZTJ-KJEVXHAQSA-N Arg-Tyr-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IZSMEUDYADKZTJ-KJEVXHAQSA-N 0.000 description 1
- QTAIIXQCOPUNBQ-QXEWZRGKSA-N Arg-Val-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QTAIIXQCOPUNBQ-QXEWZRGKSA-N 0.000 description 1
- 241001495180 Arthrospira Species 0.000 description 1
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 1
- QEYJFBMTSMLPKZ-ZKWXMUAHSA-N Asn-Ala-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O QEYJFBMTSMLPKZ-ZKWXMUAHSA-N 0.000 description 1
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 1
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 1
- QISZHYWZHJRDAO-CIUDSAMLSA-N Asn-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N QISZHYWZHJRDAO-CIUDSAMLSA-N 0.000 description 1
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 1
- OKZOABJQOMAYEC-NUMRIWBASA-N Asn-Gln-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OKZOABJQOMAYEC-NUMRIWBASA-N 0.000 description 1
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 1
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 1
- OLGCWMNDJTWQAG-GUBZILKMSA-N Asn-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(N)=O OLGCWMNDJTWQAG-GUBZILKMSA-N 0.000 description 1
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 1
- OOWSBIOUKIUWLO-RCOVLWMOSA-N Asn-Gly-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O OOWSBIOUKIUWLO-RCOVLWMOSA-N 0.000 description 1
- BXUHCIXDSWRSBS-CIUDSAMLSA-N Asn-Leu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BXUHCIXDSWRSBS-CIUDSAMLSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- RZNAMKZJPBQWDJ-SRVKXCTJSA-N Asn-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N RZNAMKZJPBQWDJ-SRVKXCTJSA-N 0.000 description 1
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 1
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 1
- YUUIAUXBNOHFRJ-IHRRRGAJSA-N Asn-Phe-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O YUUIAUXBNOHFRJ-IHRRRGAJSA-N 0.000 description 1
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 1
- SZNGQSBRHFMZLT-IHRRRGAJSA-N Asn-Pro-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SZNGQSBRHFMZLT-IHRRRGAJSA-N 0.000 description 1
- OOXUBGLNDRGOKT-FXQIFTODSA-N Asn-Ser-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OOXUBGLNDRGOKT-FXQIFTODSA-N 0.000 description 1
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 1
- JXMREEPBRANWBY-VEVYYDQMSA-N Asn-Thr-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JXMREEPBRANWBY-VEVYYDQMSA-N 0.000 description 1
- ZUFPUBYQYWCMDB-NUMRIWBASA-N Asn-Thr-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZUFPUBYQYWCMDB-NUMRIWBASA-N 0.000 description 1
- GHWWTICYPDKPTE-NGZCFLSTSA-N Asn-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N GHWWTICYPDKPTE-NGZCFLSTSA-N 0.000 description 1
- WSWYMRLTJVKRCE-ZLUOBGJFSA-N Asp-Ala-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O WSWYMRLTJVKRCE-ZLUOBGJFSA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- AXXCUABIFZPKPM-BQBZGAKWSA-N Asp-Arg-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O AXXCUABIFZPKPM-BQBZGAKWSA-N 0.000 description 1
- MFMJRYHVLLEMQM-DCAQKATOSA-N Asp-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N MFMJRYHVLLEMQM-DCAQKATOSA-N 0.000 description 1
- JDHOJQJMWBKHDB-CIUDSAMLSA-N Asp-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)O)N JDHOJQJMWBKHDB-CIUDSAMLSA-N 0.000 description 1
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- VZNOVQKGJQJOCS-SRVKXCTJSA-N Asp-Asp-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VZNOVQKGJQJOCS-SRVKXCTJSA-N 0.000 description 1
- DXQOQMCLWWADMU-ACZMJKKPSA-N Asp-Gln-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DXQOQMCLWWADMU-ACZMJKKPSA-N 0.000 description 1
- CKAJHWFHHFSCDT-WHFBIAKZSA-N Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O CKAJHWFHHFSCDT-WHFBIAKZSA-N 0.000 description 1
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 1
- PSLSTUMPZILTAH-BYULHYEWSA-N Asp-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PSLSTUMPZILTAH-BYULHYEWSA-N 0.000 description 1
- ICZWAZVKLACMKR-CIUDSAMLSA-N Asp-His-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CN=CN1 ICZWAZVKLACMKR-CIUDSAMLSA-N 0.000 description 1
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 1
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 1
- RQHLMGCXCZUOGT-ZPFDUUQYSA-N Asp-Leu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RQHLMGCXCZUOGT-ZPFDUUQYSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 1
- HJCGDIGVVWETRO-ZPFDUUQYSA-N Asp-Lys-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O)C(O)=O HJCGDIGVVWETRO-ZPFDUUQYSA-N 0.000 description 1
- WQSXAPPYLGNMQL-IHRRRGAJSA-N Asp-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N WQSXAPPYLGNMQL-IHRRRGAJSA-N 0.000 description 1
- GYWQGGUCMDCUJE-DLOVCJGASA-N Asp-Phe-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(O)=O GYWQGGUCMDCUJE-DLOVCJGASA-N 0.000 description 1
- LIJXJYGRSRWLCJ-IHRRRGAJSA-N Asp-Phe-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LIJXJYGRSRWLCJ-IHRRRGAJSA-N 0.000 description 1
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 1
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 1
- ZBYLEBZCVKLPCY-FXQIFTODSA-N Asp-Ser-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZBYLEBZCVKLPCY-FXQIFTODSA-N 0.000 description 1
- NBKLEMWHDLAUEM-CIUDSAMLSA-N Asp-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N NBKLEMWHDLAUEM-CIUDSAMLSA-N 0.000 description 1
- DRCOAZZDQRCGGP-GHCJXIJMSA-N Asp-Ser-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DRCOAZZDQRCGGP-GHCJXIJMSA-N 0.000 description 1
- RSMZEHCMIOKNMW-GSSVUCPTSA-N Asp-Thr-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RSMZEHCMIOKNMW-GSSVUCPTSA-N 0.000 description 1
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 1
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 1
- 241000282672 Ateles sp. Species 0.000 description 1
- 108091005950 Azurite Proteins 0.000 description 1
- 241000906059 Bacillus pseudomycoides Species 0.000 description 1
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 1
- 241000823281 Burkholderiales bacterium Species 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 108010040163 CREB-Binding Protein Proteins 0.000 description 1
- 101150018129 CSF2 gene Proteins 0.000 description 1
- 101150069031 CSN2 gene Proteins 0.000 description 1
- 101100381481 Caenorhabditis elegans baz-2 gene Proteins 0.000 description 1
- 102000000584 Calmodulin Human genes 0.000 description 1
- 108010041952 Calmodulin Proteins 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 241001515796 Cebinae Species 0.000 description 1
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 description 1
- 108091005944 Cerulean Proteins 0.000 description 1
- 241000862448 Chlorocebus Species 0.000 description 1
- 241000282552 Chlorocebus aethiops Species 0.000 description 1
- 241000579895 Chlorostilbon Species 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 102100031668 Chromodomain Y-like protein Human genes 0.000 description 1
- 102100035371 Chymotrypsin-like elastase family member 1 Human genes 0.000 description 1
- 101710138848 Chymotrypsin-like elastase family member 1 Proteins 0.000 description 1
- 108091005960 Citrine Proteins 0.000 description 1
- 108091033380 Coding strand Proteins 0.000 description 1
- 241000907165 Coleofasciculus chthonoplastes Species 0.000 description 1
- 241000699802 Cricetulus griseus Species 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- 241000065716 Crocosphaera watsonii Species 0.000 description 1
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 1
- 101150074775 Csf1 gene Proteins 0.000 description 1
- 108091005943 CyPet Proteins 0.000 description 1
- 241000159506 Cyanothece Species 0.000 description 1
- LHLSSZYQFUNWRZ-NAKRPEOUSA-N Cys-Arg-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LHLSSZYQFUNWRZ-NAKRPEOUSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 1
- 230000007018 DNA scission Effects 0.000 description 1
- 102100036912 Desmin Human genes 0.000 description 1
- 108010044052 Desmin Proteins 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 241000255925 Diptera Species 0.000 description 1
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 1
- 241000255601 Drosophila melanogaster Species 0.000 description 1
- 108091005941 EBFP Proteins 0.000 description 1
- 108091005947 EBFP2 Proteins 0.000 description 1
- 108091005942 ECFP Proteins 0.000 description 1
- 101710099240 Elastase-1 Proteins 0.000 description 1
- 102100035074 Elongator complex protein 3 Human genes 0.000 description 1
- 102100037241 Endoglin Human genes 0.000 description 1
- 108010036395 Endoglin Proteins 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000289659 Erinaceidae Species 0.000 description 1
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 241000326311 Exiguobacterium sibiricum Species 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 102000016359 Fibronectins Human genes 0.000 description 1
- 108010067306 Fibronectins Proteins 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 108010001515 Galectin 4 Proteins 0.000 description 1
- 102100039556 Galectin-4 Human genes 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 241000699694 Gerbillinae Species 0.000 description 1
- 102100039289 Glial fibrillary acidic protein Human genes 0.000 description 1
- 101710193519 Glial fibrillary acidic protein Proteins 0.000 description 1
- JFOKLAPFYCTNHW-SRVKXCTJSA-N Gln-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N JFOKLAPFYCTNHW-SRVKXCTJSA-N 0.000 description 1
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 1
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 1
- IKFZXRLDMYWNBU-YUMQZZPRSA-N Gln-Gly-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N IKFZXRLDMYWNBU-YUMQZZPRSA-N 0.000 description 1
- GIVHPCWYVWUUSG-HVTMNAMFSA-N Gln-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GIVHPCWYVWUUSG-HVTMNAMFSA-N 0.000 description 1
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 1
- ZNTDJIMJKNNSLR-RWRJDSDZSA-N Gln-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZNTDJIMJKNNSLR-RWRJDSDZSA-N 0.000 description 1
- LGIKBBLQVSWUGK-DCAQKATOSA-N Gln-Leu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LGIKBBLQVSWUGK-DCAQKATOSA-N 0.000 description 1
- CAXXTYYGFYTBPV-IUCAKERBSA-N Gln-Leu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CAXXTYYGFYTBPV-IUCAKERBSA-N 0.000 description 1
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 1
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 1
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 1
- SHAUZYVSXAMYAZ-JYJNAYRXSA-N Gln-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SHAUZYVSXAMYAZ-JYJNAYRXSA-N 0.000 description 1
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 1
- IOFDDSNZJDIGPB-GVXVVHGQSA-N Gln-Leu-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IOFDDSNZJDIGPB-GVXVVHGQSA-N 0.000 description 1
- ZVQZXPADLZIQFF-FHWLQOOXSA-N Gln-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CCC(N)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 ZVQZXPADLZIQFF-FHWLQOOXSA-N 0.000 description 1
- WTJIWXMJESRHMM-XDTLVQLUSA-N Gln-Tyr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O WTJIWXMJESRHMM-XDTLVQLUSA-N 0.000 description 1
- ICRKQMRFXYDYMK-LAEOZQHASA-N Gln-Val-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ICRKQMRFXYDYMK-LAEOZQHASA-N 0.000 description 1
- WOMUDRVDJMHTCV-DCAQKATOSA-N Glu-Arg-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOMUDRVDJMHTCV-DCAQKATOSA-N 0.000 description 1
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 1
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 1
- KEBACWCLVOXFNC-DCAQKATOSA-N Glu-Arg-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O KEBACWCLVOXFNC-DCAQKATOSA-N 0.000 description 1
- VAZZOGXDUQSVQF-NUMRIWBASA-N Glu-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)O VAZZOGXDUQSVQF-NUMRIWBASA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- NTBDVNJIWCKURJ-ACZMJKKPSA-N Glu-Asp-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NTBDVNJIWCKURJ-ACZMJKKPSA-N 0.000 description 1
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 1
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 1
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 1
- JRCUFCXYZLPSDZ-ACZMJKKPSA-N Glu-Asp-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O JRCUFCXYZLPSDZ-ACZMJKKPSA-N 0.000 description 1
- ZXQPJYWZSFGWJB-AVGNSLFASA-N Glu-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N ZXQPJYWZSFGWJB-AVGNSLFASA-N 0.000 description 1
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 1
- UMIRPYLZFKOEOH-YVNDNENWSA-N Glu-Gln-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UMIRPYLZFKOEOH-YVNDNENWSA-N 0.000 description 1
- LVCHEMOPBORRLB-DCAQKATOSA-N Glu-Gln-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O LVCHEMOPBORRLB-DCAQKATOSA-N 0.000 description 1
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 1
- CUXJIASLBRJOFV-LAEOZQHASA-N Glu-Gly-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O CUXJIASLBRJOFV-LAEOZQHASA-N 0.000 description 1
- VOORMNJKNBGYGK-YUMQZZPRSA-N Glu-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N VOORMNJKNBGYGK-YUMQZZPRSA-N 0.000 description 1
- XOIATPHFYVWFEU-DCAQKATOSA-N Glu-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOIATPHFYVWFEU-DCAQKATOSA-N 0.000 description 1
- VGOFRWOTSXVPAU-SDDRHHMPSA-N Glu-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VGOFRWOTSXVPAU-SDDRHHMPSA-N 0.000 description 1
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 1
- ITBHUUMCJJQUSC-LAEOZQHASA-N Glu-Ile-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O ITBHUUMCJJQUSC-LAEOZQHASA-N 0.000 description 1
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 1
- WTMZXOPHTIVFCP-QEWYBTABSA-N Glu-Ile-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WTMZXOPHTIVFCP-QEWYBTABSA-N 0.000 description 1
- IRXNJYPKBVERCW-DCAQKATOSA-N Glu-Leu-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IRXNJYPKBVERCW-DCAQKATOSA-N 0.000 description 1
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 1
- SWRVAQHFBRZVNX-GUBZILKMSA-N Glu-Lys-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SWRVAQHFBRZVNX-GUBZILKMSA-N 0.000 description 1
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 1
- JDUKCSSHWNIQQZ-IHRRRGAJSA-N Glu-Phe-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JDUKCSSHWNIQQZ-IHRRRGAJSA-N 0.000 description 1
- CQAHWYDHKUWYIX-YUMQZZPRSA-N Glu-Pro-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O CQAHWYDHKUWYIX-YUMQZZPRSA-N 0.000 description 1
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 1
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 1
- JVYNYWXHZWVJEF-NUMRIWBASA-N Glu-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O JVYNYWXHZWVJEF-NUMRIWBASA-N 0.000 description 1
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 1
- QGAJQIGFFIQJJK-IHRRRGAJSA-N Glu-Tyr-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O QGAJQIGFFIQJJK-IHRRRGAJSA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 1
- NZAFOTBEULLEQB-WDSKDSINSA-N Gly-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN NZAFOTBEULLEQB-WDSKDSINSA-N 0.000 description 1
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 1
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 1
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 1
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 1
- AQLHORCVPGXDJW-IUCAKERBSA-N Gly-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN AQLHORCVPGXDJW-IUCAKERBSA-N 0.000 description 1
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 1
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 1
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 1
- MBOAPAXLTUSMQI-JHEQGTHGSA-N Gly-Glu-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MBOAPAXLTUSMQI-JHEQGTHGSA-N 0.000 description 1
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 1
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 1
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 1
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 1
- LPCKHUXOGVNZRS-YUMQZZPRSA-N Gly-His-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O LPCKHUXOGVNZRS-YUMQZZPRSA-N 0.000 description 1
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 1
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 1
- IEGFSKKANYKBDU-QWHCGFSZSA-N Gly-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)CN)C(=O)O IEGFSKKANYKBDU-QWHCGFSZSA-N 0.000 description 1
- QAMMIGULQSIRCD-IRXDYDNUSA-N Gly-Phe-Tyr Chemical compound C([C@H](NC(=O)C[NH3+])C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C([O-])=O)C1=CC=CC=C1 QAMMIGULQSIRCD-IRXDYDNUSA-N 0.000 description 1
- CSMYMGFCEJWALV-WDSKDSINSA-N Gly-Ser-Gln Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O CSMYMGFCEJWALV-WDSKDSINSA-N 0.000 description 1
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 1
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 1
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 1
- MYXNLWDWWOTERK-BHNWBGBOSA-N Gly-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN)O MYXNLWDWWOTERK-BHNWBGBOSA-N 0.000 description 1
- RCHFYMASWAZQQZ-ZANVPECISA-N Gly-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)CN)=CNC2=C1 RCHFYMASWAZQQZ-ZANVPECISA-N 0.000 description 1
- UVTSZKIATYSKIR-RYUDHWBXSA-N Gly-Tyr-Glu Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O UVTSZKIATYSKIR-RYUDHWBXSA-N 0.000 description 1
- GBYYQVBXFVDJPJ-WLTAIBSBSA-N Gly-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)CN)O GBYYQVBXFVDJPJ-WLTAIBSBSA-N 0.000 description 1
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- 241000700721 Hepatitis B virus Species 0.000 description 1
- XINDHUAGVGCNSF-QSFUFRPTSA-N His-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XINDHUAGVGCNSF-QSFUFRPTSA-N 0.000 description 1
- FLUVGKKRRMLNPU-CQDKDKBSSA-N His-Ala-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FLUVGKKRRMLNPU-CQDKDKBSSA-N 0.000 description 1
- MVADCDSCFTXCBT-CIUDSAMLSA-N His-Asp-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MVADCDSCFTXCBT-CIUDSAMLSA-N 0.000 description 1
- UPGJWSUYENXOPV-HGNGGELXSA-N His-Gln-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N UPGJWSUYENXOPV-HGNGGELXSA-N 0.000 description 1
- DVHGLDYMGWTYKW-GUBZILKMSA-N His-Gln-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DVHGLDYMGWTYKW-GUBZILKMSA-N 0.000 description 1
- IMCHNUANCIGUKS-SRVKXCTJSA-N His-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IMCHNUANCIGUKS-SRVKXCTJSA-N 0.000 description 1
- BQFGKVYHKCNEMF-DCAQKATOSA-N His-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 BQFGKVYHKCNEMF-DCAQKATOSA-N 0.000 description 1
- JCOSMKPAOYDKRO-AVGNSLFASA-N His-Glu-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N JCOSMKPAOYDKRO-AVGNSLFASA-N 0.000 description 1
- IWXMHXYOACDSIA-PYJNHQTQSA-N His-Ile-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O IWXMHXYOACDSIA-PYJNHQTQSA-N 0.000 description 1
- ZSKJIISDJXJQPV-BZSNNMDCSA-N His-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 ZSKJIISDJXJQPV-BZSNNMDCSA-N 0.000 description 1
- DEOQGJUXUQGUJN-KKUMJFAQSA-N His-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N DEOQGJUXUQGUJN-KKUMJFAQSA-N 0.000 description 1
- TTYKEFZRLKQTHH-MELADBBJSA-N His-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O TTYKEFZRLKQTHH-MELADBBJSA-N 0.000 description 1
- SVVULKPWDBIPCO-BZSNNMDCSA-N His-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SVVULKPWDBIPCO-BZSNNMDCSA-N 0.000 description 1
- ZFDKSLBEWYCOCS-BZSNNMDCSA-N His-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CC=CC=C1 ZFDKSLBEWYCOCS-BZSNNMDCSA-N 0.000 description 1
- WCHONUZTYDQMBY-PYJNHQTQSA-N His-Pro-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WCHONUZTYDQMBY-PYJNHQTQSA-N 0.000 description 1
- ABCCKUZDWMERKT-AVGNSLFASA-N His-Pro-Met Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O ABCCKUZDWMERKT-AVGNSLFASA-N 0.000 description 1
- YEKYGQZUBCRNGH-DCAQKATOSA-N His-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CO)C(=O)O YEKYGQZUBCRNGH-DCAQKATOSA-N 0.000 description 1
- ZHMZWSFQRUGLEC-JYJNAYRXSA-N His-Tyr-Glu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZHMZWSFQRUGLEC-JYJNAYRXSA-N 0.000 description 1
- KFQDSSNYWKZFOO-LSJOCFKGSA-N His-Val-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KFQDSSNYWKZFOO-LSJOCFKGSA-N 0.000 description 1
- XGBVLRJLHUVCNK-DCAQKATOSA-N His-Val-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O XGBVLRJLHUVCNK-DCAQKATOSA-N 0.000 description 1
- 102000008157 Histone Demethylases Human genes 0.000 description 1
- 108010074870 Histone Demethylases Proteins 0.000 description 1
- 102000011787 Histone Methyltransferases Human genes 0.000 description 1
- 108010036115 Histone Methyltransferases Proteins 0.000 description 1
- 102100022901 Histone acetyltransferase KAT2A Human genes 0.000 description 1
- 101710083341 Histone acetyltransferase KAT2B Proteins 0.000 description 1
- 101710116149 Histone acetyltransferase KAT5 Proteins 0.000 description 1
- 102100033071 Histone acetyltransferase KAT6A Human genes 0.000 description 1
- 102100033070 Histone acetyltransferase KAT6B Human genes 0.000 description 1
- 102100033068 Histone acetyltransferase KAT7 Human genes 0.000 description 1
- 102100033069 Histone acetyltransferase KAT8 Human genes 0.000 description 1
- 102100021467 Histone acetyltransferase type B catalytic subunit Human genes 0.000 description 1
- 108700038236 Histone deacetylase domains Proteins 0.000 description 1
- 102000043851 Histone deacetylase domains Human genes 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000896987 Homo sapiens CREB-binding protein Proteins 0.000 description 1
- 101000721661 Homo sapiens Cellular tumor antigen p53 Proteins 0.000 description 1
- 101000777795 Homo sapiens Chromodomain Y-like protein Proteins 0.000 description 1
- 101000877382 Homo sapiens Elongator complex protein 3 Proteins 0.000 description 1
- 101000828609 Homo sapiens Flotillin-2 Proteins 0.000 description 1
- 101000944179 Homo sapiens Histone acetyltransferase KAT6A Proteins 0.000 description 1
- 101000944174 Homo sapiens Histone acetyltransferase KAT6B Proteins 0.000 description 1
- 101000944166 Homo sapiens Histone acetyltransferase KAT7 Proteins 0.000 description 1
- 101000944170 Homo sapiens Histone acetyltransferase KAT8 Proteins 0.000 description 1
- 101000898976 Homo sapiens Histone acetyltransferase type B catalytic subunit Proteins 0.000 description 1
- 101000608935 Homo sapiens Leukosialin Proteins 0.000 description 1
- 101000934372 Homo sapiens Macrosialin Proteins 0.000 description 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 101000946889 Homo sapiens Monocyte differentiation antigen CD14 Proteins 0.000 description 1
- 101000602926 Homo sapiens Nuclear receptor coactivator 1 Proteins 0.000 description 1
- 101000602930 Homo sapiens Nuclear receptor coactivator 2 Proteins 0.000 description 1
- 101000974356 Homo sapiens Nuclear receptor coactivator 3 Proteins 0.000 description 1
- 101000585728 Homo sapiens Protein O-GlcNAcase Proteins 0.000 description 1
- 101000738771 Homo sapiens Receptor-type tyrosine-protein phosphatase C Proteins 0.000 description 1
- 101000821100 Homo sapiens Synapsin-1 Proteins 0.000 description 1
- 101000777789 Homo sapiens Testis-specific chromodomain protein Y 1 Proteins 0.000 description 1
- 101000777786 Homo sapiens Testis-specific chromodomain protein Y 2 Proteins 0.000 description 1
- 101000666382 Homo sapiens Transcription factor E2-alpha Proteins 0.000 description 1
- 101000801209 Homo sapiens Transducin-like enhancer protein 4 Proteins 0.000 description 1
- 241000725303 Human immunodeficiency virus Species 0.000 description 1
- 108700003968 Human immunodeficiency virus 1 tat peptide (49-57) Proteins 0.000 description 1
- 108010091358 Hypoxanthine Phosphoribosyltransferase Proteins 0.000 description 1
- 102100029098 Hypoxanthine-guanine phosphoribosyltransferase Human genes 0.000 description 1
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 1
- RWIKBYVJQAJYDP-BJDJZHNGSA-N Ile-Ala-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RWIKBYVJQAJYDP-BJDJZHNGSA-N 0.000 description 1
- YKRIXHPEIZUDDY-GMOBBJLQSA-N Ile-Asn-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKRIXHPEIZUDDY-GMOBBJLQSA-N 0.000 description 1
- QYZYJFXHXYUZMZ-UGYAYLCHSA-N Ile-Asn-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N QYZYJFXHXYUZMZ-UGYAYLCHSA-N 0.000 description 1
- UMYZBHKAVTXWIW-GMOBBJLQSA-N Ile-Asp-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UMYZBHKAVTXWIW-GMOBBJLQSA-N 0.000 description 1
- NKRJALPCDNXULF-BYULHYEWSA-N Ile-Asp-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O NKRJALPCDNXULF-BYULHYEWSA-N 0.000 description 1
- KUHFPGIVBOCRMV-MNXVOIDGSA-N Ile-Gln-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N KUHFPGIVBOCRMV-MNXVOIDGSA-N 0.000 description 1
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 1
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 1
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 1
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 1
- CMNMPCTVCWWYHY-MXAVVETBSA-N Ile-His-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC(C)C)C(=O)O)N CMNMPCTVCWWYHY-MXAVVETBSA-N 0.000 description 1
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 1
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 1
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 1
- TVYWVSJGSHQWMT-AJNGGQMLSA-N Ile-Leu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N TVYWVSJGSHQWMT-AJNGGQMLSA-N 0.000 description 1
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 1
- YSGBJIQXTIVBHZ-AJNGGQMLSA-N Ile-Lys-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O YSGBJIQXTIVBHZ-AJNGGQMLSA-N 0.000 description 1
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 1
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 1
- CIDLJWVDMNDKPT-FIRPJDEBSA-N Ile-Phe-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N CIDLJWVDMNDKPT-FIRPJDEBSA-N 0.000 description 1
- VEPIBPGLTLPBDW-URLPEUOOSA-N Ile-Phe-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N VEPIBPGLTLPBDW-URLPEUOOSA-N 0.000 description 1
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 1
- HJDZMPFEXINXLO-QPHKQPEJSA-N Ile-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N HJDZMPFEXINXLO-QPHKQPEJSA-N 0.000 description 1
- JSLIXOUMAOUGBN-JUKXBJQTSA-N Ile-Tyr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JSLIXOUMAOUGBN-JUKXBJQTSA-N 0.000 description 1
- NJGXXYLPDMMFJB-XUXIUFHCSA-N Ile-Val-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N NJGXXYLPDMMFJB-XUXIUFHCSA-N 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 102100025306 Integrin alpha-IIb Human genes 0.000 description 1
- 101710149643 Integrin alpha-IIb Proteins 0.000 description 1
- 102100037872 Intercellular adhesion molecule 2 Human genes 0.000 description 1
- 101710148794 Intercellular adhesion molecule 2 Proteins 0.000 description 1
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 1
- 239000007760 Iscove's Modified Dulbecco's Medium Substances 0.000 description 1
- 241001430080 Ktedonobacter racemifer Species 0.000 description 1
- 229930182816 L-glutamine Natural products 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- 241000186673 Lactobacillus delbrueckii Species 0.000 description 1
- 241000186869 Lactobacillus salivarius Species 0.000 description 1
- 241000282838 Lama Species 0.000 description 1
- 241000288903 Lemuridae Species 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 1
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 1
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 1
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 1
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 1
- PBGDOSARRIJMEV-DLOVCJGASA-N Leu-His-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O PBGDOSARRIJMEV-DLOVCJGASA-N 0.000 description 1
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 1
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 1
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 1
- AIRUUHAOKGVJAD-JYJNAYRXSA-N Leu-Phe-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIRUUHAOKGVJAD-JYJNAYRXSA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 1
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 1
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 1
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 1
- 102100039564 Leukosialin Human genes 0.000 description 1
- 241001134698 Lyngbya Species 0.000 description 1
- MPGHETGWWWUHPY-CIUDSAMLSA-N Lys-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN MPGHETGWWWUHPY-CIUDSAMLSA-N 0.000 description 1
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 1
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 1
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 1
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 1
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 1
- SJNZALDHDUYDBU-IHRRRGAJSA-N Lys-Arg-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(O)=O SJNZALDHDUYDBU-IHRRRGAJSA-N 0.000 description 1
- CKSXSQUVEYCDIW-AVGNSLFASA-N Lys-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N CKSXSQUVEYCDIW-AVGNSLFASA-N 0.000 description 1
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- GGAPIOORBXHMNY-ULQDDVLXSA-N Lys-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)O GGAPIOORBXHMNY-ULQDDVLXSA-N 0.000 description 1
- DNEJSAIMVANNPA-DCAQKATOSA-N Lys-Asn-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DNEJSAIMVANNPA-DCAQKATOSA-N 0.000 description 1
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 1
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 1
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 1
- QIJVAFLRMVBHMU-KKUMJFAQSA-N Lys-Asp-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QIJVAFLRMVBHMU-KKUMJFAQSA-N 0.000 description 1
- PHHYNOUOUWYQRO-XIRDDKMYSA-N Lys-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N PHHYNOUOUWYQRO-XIRDDKMYSA-N 0.000 description 1
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 1
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 1
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- WGLAORUKDGRINI-WDCWCFNPSA-N Lys-Glu-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGLAORUKDGRINI-WDCWCFNPSA-N 0.000 description 1
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 1
- GQZMPWBZQALKJO-UWVGGRQHSA-N Lys-Gly-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O GQZMPWBZQALKJO-UWVGGRQHSA-N 0.000 description 1
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 1
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 1
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 1
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 1
- WQDKIVRHTQYJSN-DCAQKATOSA-N Lys-Ser-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WQDKIVRHTQYJSN-DCAQKATOSA-N 0.000 description 1
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 1
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 1
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 1
- QVTDVTONTRSQMF-WDCWCFNPSA-N Lys-Thr-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CCCCN QVTDVTONTRSQMF-WDCWCFNPSA-N 0.000 description 1
- BDFHWFUAQLIMJO-KXNHARMFSA-N Lys-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N)O BDFHWFUAQLIMJO-KXNHARMFSA-N 0.000 description 1
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 1
- RMKJOQSYLQQRFN-KKUMJFAQSA-N Lys-Tyr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O RMKJOQSYLQQRFN-KKUMJFAQSA-N 0.000 description 1
- RQILLQOQXLZTCK-KBPBESRZSA-N Lys-Tyr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O RQILLQOQXLZTCK-KBPBESRZSA-N 0.000 description 1
- LMMBAXJRYSXCOQ-ACRUOGEOSA-N Lys-Tyr-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O LMMBAXJRYSXCOQ-ACRUOGEOSA-N 0.000 description 1
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 1
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 1
- OHXUUQDOBQKSNB-AVGNSLFASA-N Lys-Val-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OHXUUQDOBQKSNB-AVGNSLFASA-N 0.000 description 1
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 1
- VWJFOUBDZIUXGA-AVGNSLFASA-N Lys-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCCN)N VWJFOUBDZIUXGA-AVGNSLFASA-N 0.000 description 1
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 1
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 1
- 241000282553 Macaca Species 0.000 description 1
- 102100025136 Macrosialin Human genes 0.000 description 1
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 1
- 241000206589 Marinobacter Species 0.000 description 1
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 1
- UAPZLLPGGOOCRO-IHRRRGAJSA-N Met-Asn-Phe Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N UAPZLLPGGOOCRO-IHRRRGAJSA-N 0.000 description 1
- HDNOQCZWJGGHSS-VEVYYDQMSA-N Met-Asn-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HDNOQCZWJGGHSS-VEVYYDQMSA-N 0.000 description 1
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 1
- KQBJYJXPZBNEIK-DCAQKATOSA-N Met-Glu-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQBJYJXPZBNEIK-DCAQKATOSA-N 0.000 description 1
- SXWQMBGNFXAGAT-FJXKBIBVSA-N Met-Gly-Thr Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SXWQMBGNFXAGAT-FJXKBIBVSA-N 0.000 description 1
- BCRQJDMZQUHQSV-STQMWFEESA-N Met-Gly-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BCRQJDMZQUHQSV-STQMWFEESA-N 0.000 description 1
- QGRJTULYDZUBAY-ZPFDUUQYSA-N Met-Ile-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGRJTULYDZUBAY-ZPFDUUQYSA-N 0.000 description 1
- MIAZEQZXAFTCCG-UBHSHLNASA-N Met-Phe-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 MIAZEQZXAFTCCG-UBHSHLNASA-N 0.000 description 1
- LXCSZPUQKMTXNW-BQBZGAKWSA-N Met-Ser-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O LXCSZPUQKMTXNW-BQBZGAKWSA-N 0.000 description 1
- KSIPKXNIQOWMIC-RCWTZXSCSA-N Met-Thr-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KSIPKXNIQOWMIC-RCWTZXSCSA-N 0.000 description 1
- RIIFMEBFDDXGCV-VEVYYDQMSA-N Met-Thr-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O RIIFMEBFDDXGCV-VEVYYDQMSA-N 0.000 description 1
- 102000006890 Methyl-CpG-Binding Protein 2 Human genes 0.000 description 1
- 108010072388 Methyl-CpG-Binding Protein 2 Proteins 0.000 description 1
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 1
- 102000016397 Methyltransferase Human genes 0.000 description 1
- 108010059724 Micrococcal Nuclease Proteins 0.000 description 1
- 241000179980 Microcoleus Species 0.000 description 1
- 241000192710 Microcystis aeruginosa Species 0.000 description 1
- 241000190928 Microscilla marina Species 0.000 description 1
- 102100035877 Monocyte differentiation antigen CD14 Human genes 0.000 description 1
- 241000713333 Mouse mammary tumor virus Species 0.000 description 1
- 241000699660 Mus musculus Species 0.000 description 1
- 101000981253 Mus musculus GPI-linked NAD(P)(+)-arginine ADP-ribosyltransferase 1 Proteins 0.000 description 1
- 241000282339 Mustela Species 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 206010029260 Neuroblastoma Diseases 0.000 description 1
- 101100385413 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) csm-3 gene Proteins 0.000 description 1
- 101100083259 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) pho-4 gene Proteins 0.000 description 1
- 241000919925 Nitrosococcus halophilus Species 0.000 description 1
- 241001515112 Nitrosococcus watsonii Species 0.000 description 1
- 241000203622 Nocardiopsis Species 0.000 description 1
- 241000203619 Nocardiopsis dassonvillei Species 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- 241000192656 Nostoc Species 0.000 description 1
- 102100037223 Nuclear receptor coactivator 1 Human genes 0.000 description 1
- 102100037226 Nuclear receptor coactivator 2 Human genes 0.000 description 1
- 102100022883 Nuclear receptor coactivator 3 Human genes 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 241000192497 Oscillatoria Species 0.000 description 1
- 238000010222 PCR analysis Methods 0.000 description 1
- 241000282579 Pan Species 0.000 description 1
- 108010088535 Pep-1 peptide Proteins 0.000 description 1
- 102000002508 Peptide Elongation Factors Human genes 0.000 description 1
- 108010068204 Peptide Elongation Factors Proteins 0.000 description 1
- 241000983938 Petrotoga mobilis Species 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 241000286209 Phasianidae Species 0.000 description 1
- LZDIENNKWVXJMX-JYJNAYRXSA-N Phe-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CC=CC=C1 LZDIENNKWVXJMX-JYJNAYRXSA-N 0.000 description 1
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 1
- HOYQLNNGMHXZDW-KKUMJFAQSA-N Phe-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HOYQLNNGMHXZDW-KKUMJFAQSA-N 0.000 description 1
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- QPVFUAUFEBPIPT-CDMKHQONSA-N Phe-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QPVFUAUFEBPIPT-CDMKHQONSA-N 0.000 description 1
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 1
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 1
- KDYPMIZMXDECSU-JYJNAYRXSA-N Phe-Leu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 KDYPMIZMXDECSU-JYJNAYRXSA-N 0.000 description 1
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 1
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 1
- KNYPNEYICHHLQL-ACRUOGEOSA-N Phe-Leu-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 KNYPNEYICHHLQL-ACRUOGEOSA-N 0.000 description 1
- XZQYIJALMGEUJD-OEAJRASXSA-N Phe-Lys-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZQYIJALMGEUJD-OEAJRASXSA-N 0.000 description 1
- GPSMLZQVIIYLDK-ULQDDVLXSA-N Phe-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O GPSMLZQVIIYLDK-ULQDDVLXSA-N 0.000 description 1
- TXJJXEXCZBHDNA-ACRUOGEOSA-N Phe-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N TXJJXEXCZBHDNA-ACRUOGEOSA-N 0.000 description 1
- DSXPMZMSJHOKKK-HJOGWXRNSA-N Phe-Phe-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DSXPMZMSJHOKKK-HJOGWXRNSA-N 0.000 description 1
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 1
- XNMYNGDKJNOKHH-BZSNNMDCSA-N Phe-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XNMYNGDKJNOKHH-BZSNNMDCSA-N 0.000 description 1
- KLYYKKGCPOGDPE-OEAJRASXSA-N Phe-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O KLYYKKGCPOGDPE-OEAJRASXSA-N 0.000 description 1
- DBNGDEAQXGFGRA-ACRUOGEOSA-N Phe-Tyr-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DBNGDEAQXGFGRA-ACRUOGEOSA-N 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 241000235648 Pichia Species 0.000 description 1
- 241000512220 Polaromonas Species 0.000 description 1
- 241001599925 Polaromonas naphthalenivorans Species 0.000 description 1
- RVGRUAULSDPKGF-UHFFFAOYSA-N Poloxamer Chemical compound C1CO1.CC1CO1 RVGRUAULSDPKGF-UHFFFAOYSA-N 0.000 description 1
- 229920002873 Polyethylenimine Polymers 0.000 description 1
- DRVIASBABBMZTF-GUBZILKMSA-N Pro-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@@H]1CCCN1 DRVIASBABBMZTF-GUBZILKMSA-N 0.000 description 1
- OBVCYFIHIIYIQF-CIUDSAMLSA-N Pro-Asn-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OBVCYFIHIIYIQF-CIUDSAMLSA-N 0.000 description 1
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 1
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 1
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 1
- VYWNORHENYEQDW-YUMQZZPRSA-N Pro-Gly-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 VYWNORHENYEQDW-YUMQZZPRSA-N 0.000 description 1
- SOACYAXADBWDDT-CYDGBPFRSA-N Pro-Ile-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SOACYAXADBWDDT-CYDGBPFRSA-N 0.000 description 1
- AQGUSRZKDZYGGV-GMOBBJLQSA-N Pro-Ile-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O AQGUSRZKDZYGGV-GMOBBJLQSA-N 0.000 description 1
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 1
- BRJGUPWVFXKBQI-XUXIUFHCSA-N Pro-Leu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BRJGUPWVFXKBQI-XUXIUFHCSA-N 0.000 description 1
- FKYKZHOKDOPHSA-DCAQKATOSA-N Pro-Leu-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FKYKZHOKDOPHSA-DCAQKATOSA-N 0.000 description 1
- JUJCUYWRJMFJJF-AVGNSLFASA-N Pro-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 JUJCUYWRJMFJJF-AVGNSLFASA-N 0.000 description 1
- CDGABSWLRMECHC-IHRRRGAJSA-N Pro-Lys-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CDGABSWLRMECHC-IHRRRGAJSA-N 0.000 description 1
- WCNVGGZRTNHOOS-ULQDDVLXSA-N Pro-Lys-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O WCNVGGZRTNHOOS-ULQDDVLXSA-N 0.000 description 1
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 1
- QDDJNKWPTJHROJ-UFYCRDLUSA-N Pro-Tyr-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 QDDJNKWPTJHROJ-UFYCRDLUSA-N 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102100030122 Protein O-GlcNAcase Human genes 0.000 description 1
- 101710149951 Protein Tat Proteins 0.000 description 1
- 241001340896 Pyralis Species 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 108010003201 RGH 0205 Proteins 0.000 description 1
- 241000700157 Rattus norvegicus Species 0.000 description 1
- 101100372762 Rattus norvegicus Flt1 gene Proteins 0.000 description 1
- 101100047461 Rattus norvegicus Trpm8 gene Proteins 0.000 description 1
- 241000700161 Rattus rattus Species 0.000 description 1
- 102100037422 Receptor-type tyrosine-protein phosphatase C Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 101001025539 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Homothallic switching endonuclease Proteins 0.000 description 1
- 241000288961 Saguinus imperator Species 0.000 description 1
- 241000282695 Saimiri Species 0.000 description 1
- 241000235346 Schizosaccharomyces Species 0.000 description 1
- WTWGOQRNRFHFQD-JBDRJPRFSA-N Ser-Ala-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WTWGOQRNRFHFQD-JBDRJPRFSA-N 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- PZZJMBYSYAKYPK-UWJYBYFXSA-N Ser-Ala-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O PZZJMBYSYAKYPK-UWJYBYFXSA-N 0.000 description 1
- KYKKKSWGEPFUMR-NAKRPEOUSA-N Ser-Arg-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KYKKKSWGEPFUMR-NAKRPEOUSA-N 0.000 description 1
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 1
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 1
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 1
- FTVRVZNYIYWJGB-ACZMJKKPSA-N Ser-Asp-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FTVRVZNYIYWJGB-ACZMJKKPSA-N 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- HEQPKICPPDOSIN-SRVKXCTJSA-N Ser-Asp-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HEQPKICPPDOSIN-SRVKXCTJSA-N 0.000 description 1
- BQWCDDAISCPDQV-XHNCKOQMSA-N Ser-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N)C(=O)O BQWCDDAISCPDQV-XHNCKOQMSA-N 0.000 description 1
- YQQKYAZABFEYAF-FXQIFTODSA-N Ser-Glu-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQQKYAZABFEYAF-FXQIFTODSA-N 0.000 description 1
- UOLGINIHBRIECN-FXQIFTODSA-N Ser-Glu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UOLGINIHBRIECN-FXQIFTODSA-N 0.000 description 1
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- ZUDXUJSYCCNZQJ-DCAQKATOSA-N Ser-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N ZUDXUJSYCCNZQJ-DCAQKATOSA-N 0.000 description 1
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 1
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 1
- LWMQRHDTXHQQOV-MXAVVETBSA-N Ser-Ile-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LWMQRHDTXHQQOV-MXAVVETBSA-N 0.000 description 1
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 1
- VZQRNAYURWAEFE-KKUMJFAQSA-N Ser-Leu-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 VZQRNAYURWAEFE-KKUMJFAQSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 1
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 1
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 1
- QJKPECIAWNNKIT-KKUMJFAQSA-N Ser-Lys-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QJKPECIAWNNKIT-KKUMJFAQSA-N 0.000 description 1
- ZSLFCBHEINFXRS-LPEHRKFASA-N Ser-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ZSLFCBHEINFXRS-LPEHRKFASA-N 0.000 description 1
- FBLNYDYPCLFTSP-IXOXFDKPSA-N Ser-Phe-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FBLNYDYPCLFTSP-IXOXFDKPSA-N 0.000 description 1
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 1
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 1
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 1
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 1
- PCJLFYBAQZQOFE-KATARQTJSA-N Ser-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N)O PCJLFYBAQZQOFE-KATARQTJSA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 1
- 108091061750 Signal recognition particle RNA Proteins 0.000 description 1
- 241000256251 Spodoptera frugiperda Species 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 241001518258 Streptomyces pristinaespiralis Species 0.000 description 1
- 102100021905 Synapsin-1 Human genes 0.000 description 1
- 241000192707 Synechococcus Species 0.000 description 1
- 101710192266 Tegument protein VP22 Proteins 0.000 description 1
- 102100031664 Testis-specific chromodomain protein Y 1 Human genes 0.000 description 1
- 102100031666 Testis-specific chromodomain protein Y 2 Human genes 0.000 description 1
- 241000206213 Thermosipho africanus Species 0.000 description 1
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 1
- MQBTXMPQNCGSSZ-OSUNSFLBSA-N Thr-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N MQBTXMPQNCGSSZ-OSUNSFLBSA-N 0.000 description 1
- SWIKDOUVROTZCW-GCJQMDKQSA-N Thr-Asn-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O SWIKDOUVROTZCW-GCJQMDKQSA-N 0.000 description 1
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 1
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 1
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 1
- LAFLAXHTDVNVEL-WDCWCFNPSA-N Thr-Gln-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O LAFLAXHTDVNVEL-WDCWCFNPSA-N 0.000 description 1
- VULNJDORNLBPNG-SWRJLBSHSA-N Thr-Glu-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O VULNJDORNLBPNG-SWRJLBSHSA-N 0.000 description 1
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 1
- YSXYEJWDHBCTDJ-DVJZZOLTSA-N Thr-Gly-Trp Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O YSXYEJWDHBCTDJ-DVJZZOLTSA-N 0.000 description 1
- FLPZMPOZGYPBEN-PPCPHDFISA-N Thr-Leu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLPZMPOZGYPBEN-PPCPHDFISA-N 0.000 description 1
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 1
- YJVJPJPHHFOVMG-VEVYYDQMSA-N Thr-Met-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O YJVJPJPHHFOVMG-VEVYYDQMSA-N 0.000 description 1
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 1
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 1
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 1
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 1
- BGHVVGPELPHRCI-HZTRNQAASA-N Thr-Trp-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)O)N)O BGHVVGPELPHRCI-HZTRNQAASA-N 0.000 description 1
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 1
- 102000005747 Transcription Factor RelA Human genes 0.000 description 1
- 108010031154 Transcription Factor RelA Proteins 0.000 description 1
- 102100038313 Transcription factor E2-alpha Human genes 0.000 description 1
- 108050004072 Transcription initiation factor TFIID subunit 1 Proteins 0.000 description 1
- 102100035222 Transcription initiation factor TFIID subunit 1 Human genes 0.000 description 1
- 102100033763 Transducin-like enhancer protein 4 Human genes 0.000 description 1
- FEZASNVQLJQBHW-CABZTGNLSA-N Trp-Gly-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O)=CNC2=C1 FEZASNVQLJQBHW-CABZTGNLSA-N 0.000 description 1
- UJRIVCPPPMYCNA-HOCLYGCPSA-N Trp-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N UJRIVCPPPMYCNA-HOCLYGCPSA-N 0.000 description 1
- IYHRKILQAQWODS-VJBMBRPKSA-N Trp-Trp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CNC4=CC=CC=C43)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IYHRKILQAQWODS-VJBMBRPKSA-N 0.000 description 1
- 108090000704 Tubulin Proteins 0.000 description 1
- 102000004243 Tubulin Human genes 0.000 description 1
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 1
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 1
- HKYTWJOWZTWBQB-AVGNSLFASA-N Tyr-Glu-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HKYTWJOWZTWBQB-AVGNSLFASA-N 0.000 description 1
- AKLNEFNQWLHIGY-QWRGUYRKSA-N Tyr-Gly-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N)O AKLNEFNQWLHIGY-QWRGUYRKSA-N 0.000 description 1
- LFCQXIXJQXWZJI-BZSNNMDCSA-N Tyr-His-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N)O LFCQXIXJQXWZJI-BZSNNMDCSA-N 0.000 description 1
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 1
- BSCBBPKDVOZICB-KKUMJFAQSA-N Tyr-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O BSCBBPKDVOZICB-KKUMJFAQSA-N 0.000 description 1
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 1
- KHCSOLAHNLOXJR-BZSNNMDCSA-N Tyr-Leu-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHCSOLAHNLOXJR-BZSNNMDCSA-N 0.000 description 1
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 1
- VBFVQTPETKJCQW-RPTUDFQQSA-N Tyr-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VBFVQTPETKJCQW-RPTUDFQQSA-N 0.000 description 1
- RCMWNNJFKNDKQR-UFYCRDLUSA-N Tyr-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 RCMWNNJFKNDKQR-UFYCRDLUSA-N 0.000 description 1
- YYLHVUCSTXXKBS-IHRRRGAJSA-N Tyr-Pro-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YYLHVUCSTXXKBS-IHRRRGAJSA-N 0.000 description 1
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 1
- AKRHKDCELJLTMD-BVSLBCMMSA-N Tyr-Trp-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N AKRHKDCELJLTMD-BVSLBCMMSA-N 0.000 description 1
- HZDQUVQEVVYDDA-ACRUOGEOSA-N Tyr-Tyr-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HZDQUVQEVVYDDA-ACRUOGEOSA-N 0.000 description 1
- AGDDLOQMXUQPDY-BZSNNMDCSA-N Tyr-Tyr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O AGDDLOQMXUQPDY-BZSNNMDCSA-N 0.000 description 1
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 1
- JLFKWDAZBRYCGX-ZKWXMUAHSA-N Val-Asn-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N JLFKWDAZBRYCGX-ZKWXMUAHSA-N 0.000 description 1
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 1
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 1
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 1
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 1
- CPTQYHDSVGVGDZ-UKJIMTQDSA-N Val-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N CPTQYHDSVGVGDZ-UKJIMTQDSA-N 0.000 description 1
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- VLDMQVZZWDOKQF-AUTRQRHGSA-N Val-Glu-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VLDMQVZZWDOKQF-AUTRQRHGSA-N 0.000 description 1
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 1
- YDPFWRVQHFWBKI-GVXVVHGQSA-N Val-Glu-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N YDPFWRVQHFWBKI-GVXVVHGQSA-N 0.000 description 1
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 1
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 1
- VXDSPJJQUQDCKH-UKJIMTQDSA-N Val-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N VXDSPJJQUQDCKH-UKJIMTQDSA-N 0.000 description 1
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 1
- IJGPOONOTBNTFS-GVXVVHGQSA-N Val-Lys-Glu Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O IJGPOONOTBNTFS-GVXVVHGQSA-N 0.000 description 1
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 1
- YMTOEGGOCHVGEH-IHRRRGAJSA-N Val-Lys-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O YMTOEGGOCHVGEH-IHRRRGAJSA-N 0.000 description 1
- UEPLNXPLHJUYPT-AVGNSLFASA-N Val-Met-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O UEPLNXPLHJUYPT-AVGNSLFASA-N 0.000 description 1
- SUGRIIAOLCDLBD-ZOBUZTSGSA-N Val-Trp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SUGRIIAOLCDLBD-ZOBUZTSGSA-N 0.000 description 1
- MIAZWUMFUURQNP-YDHLFZDLSA-N Val-Tyr-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N MIAZWUMFUURQNP-YDHLFZDLSA-N 0.000 description 1
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 1
- 241000545067 Venus Species 0.000 description 1
- 241001416177 Vicugna pacos Species 0.000 description 1
- 235000006085 Vigna mungo var mungo Nutrition 0.000 description 1
- 240000005616 Vigna mungo var. mungo Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 241001673106 [Bacillus] selenitireducens Species 0.000 description 1
- 108010081404 acein-2 Proteins 0.000 description 1
- 125000002777 acetyl group Chemical group [H]C([H])([H])C(*)=O 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 239000011543 agarose gel Substances 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N biotin Natural products N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 108091005948 blue fluorescent proteins Proteins 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 125000002057 carboxymethyl group Chemical group [H]OC(=O)C([H])([H])[*] 0.000 description 1
- 101150038500 cas9 gene Proteins 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 229920006317 cationic polymer Polymers 0.000 description 1
- 230000033077 cellular process Effects 0.000 description 1
- 230000004700 cellular uptake Effects 0.000 description 1
- 208000019065 cervical carcinoma Diseases 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 235000013330 chicken meat Nutrition 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 239000011035 citrine Substances 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 101150055601 cops2 gene Proteins 0.000 description 1
- 108010082025 cyan fluorescent protein Proteins 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical group NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 239000000412 dendrimer Substances 0.000 description 1
- 229920000736 dendritic polymer Polymers 0.000 description 1
- 210000005045 desmin Anatomy 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000005546 dideoxynucleotide Substances 0.000 description 1
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 239000010976 emerald Substances 0.000 description 1
- 229910052876 emerald Inorganic materials 0.000 description 1
- 210000001163 endosome Anatomy 0.000 description 1
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 210000000604 fetal stem cell Anatomy 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 101150110946 gatC gene Proteins 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 210000005046 glial fibrillary acidic protein Anatomy 0.000 description 1
- 208000005017 glioblastoma Diseases 0.000 description 1
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 1
- AWUCVROLDVIAJX-UHFFFAOYSA-N glycerol 1-phosphate Chemical compound OCC(O)COP(O)(O)=O AWUCVROLDVIAJX-UHFFFAOYSA-N 0.000 description 1
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 1
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 1
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 1
- 108010010096 glycyl-glycyl-tyrosine Proteins 0.000 description 1
- 108010028188 glycyl-histidyl-serine Proteins 0.000 description 1
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 229940029575 guanosine Drugs 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 238000000530 impalefection Methods 0.000 description 1
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 239000012212 insulator Substances 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 108010078274 isoleucylvaline Proteins 0.000 description 1
- 230000000366 juvenile effect Effects 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 210000005229 liver cell Anatomy 0.000 description 1
- 210000005265 lung cell Anatomy 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 108091005949 mKalama1 Proteins 0.000 description 1
- 241001515942 marmosets Species 0.000 description 1
- 239000002609 medium Substances 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 108010056582 methionylglutamic acid Proteins 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 239000003147 molecular marker Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000001616 monocyte Anatomy 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 125000004573 morpholin-4-yl group Chemical group N1(CCOCC1)* 0.000 description 1
- 230000004899 motility Effects 0.000 description 1
- 230000002107 myocardial effect Effects 0.000 description 1
- 125000004433 nitrogen atom Chemical group N* 0.000 description 1
- 230000037434 nonsense mutation Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000030648 nucleus localization Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000001672 ovary Anatomy 0.000 description 1
- 108010082795 phenylalanyl-arginyl-arginine Proteins 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 108010025488 pinealon Proteins 0.000 description 1
- 229960000502 poloxamer Drugs 0.000 description 1
- 229920001983 poloxamer Polymers 0.000 description 1
- 108010011110 polyarginine Proteins 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 108010014614 prolyl-glycyl-proline Proteins 0.000 description 1
- 108010093296 prolyl-prolyl-alanine Proteins 0.000 description 1
- 108010079317 prolyl-tyrosine Proteins 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 230000004850 protein–protein interaction Effects 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 230000014493 regulation of gene expression Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 1
- 235000015170 shellfish Nutrition 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 238000012453 sprague-dawley rat model Methods 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 125000003396 thiol group Chemical group [H]S* 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical group [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 229940104230 thymidine Drugs 0.000 description 1
- 230000037426 transcriptional repression Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- GWBUNZLLLLDXMD-UHFFFAOYSA-H tricopper;dicarbonate;dihydroxide Chemical compound [OH-].[OH-].[Cu+2].[Cu+2].[Cu+2].[O-]C([O-])=O.[O-]C([O-])=O GWBUNZLLLLDXMD-UHFFFAOYSA-H 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 108010012567 tyrosyl-glycyl-glycyl-phenylalanyl Proteins 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 210000002444 unipotent stem cell Anatomy 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 210000004291 uterus Anatomy 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 210000002845 virion Anatomy 0.000 description 1
- 239000000277 virosome Substances 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K9/00—Medicinal preparations characterised by special physical form
- A61K9/0012—Galenical forms characterised by the site of application
- A61K9/0048—Eye, e.g. artificial tears
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P27/00—Drugs for disorders of the senses
- A61P27/02—Ophthalmic agents
- A61P27/10—Ophthalmic agents for accommodation disorders, e.g. myopia
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/463—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from amphibians
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K7/00—Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
- C07K7/04—Linear peptides containing only normal peptide links
- C07K7/06—Linear peptides containing only normal peptide links having 5 to 11 amino acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/96—Stabilising an enzyme by forming an adduct or a composition; Forming enzyme conjugates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/21—Endodeoxyribonucleases producing 5'-phosphomonoesters (3.1.21)
- C12Y301/21004—Type II site-specific deoxyribonuclease (3.1.21.4)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/10—Fusion polypeptide containing a localisation/targetting motif containing a tag for extracellular membrane crossing, e.g. TAT or VP22
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/80—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
- C07K2319/81—Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor containing a Zn-finger domain for DNA binding
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/30—Chemical structure
- C12N2310/35—Nature of the modification
- C12N2310/351—Conjugate
- C12N2310/3513—Protein; Peptide
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/22—Vectors comprising a coding region that has been codon optimised for expression in a respective host
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Virology (AREA)
- Immunology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Veterinary Medicine (AREA)
- Pharmacology & Pharmacy (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Mycology (AREA)
- Cell Biology (AREA)
- Epidemiology (AREA)
- Gastroenterology & Hepatology (AREA)
- Toxicology (AREA)
- Ophthalmology & Optometry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Enzymes And Modification Thereof (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
요약
본 발명은 RNA-유도된 엔도뉴클레아제를 제공하고, 이것은 진핵 세포 또는 배아에서 발현을 위해 가공되고, 그리고 진핵 세포 또는 배아에서 표적화된 유전체 변형을 위해 RNA-유도된 엔도뉴클레아제를 이용하는 방법을 제공한다. 융합 단백질 역시 제공되고, 여기서 각 융합 단백질은 CRISPR/Cas-유사 단백질 또는 이의 단편 및 작동체 도메인을 포함한다. 작동체 도메인은 개열 도메인, 후성 변형 도메인, 전사 활성화 도메인, 또는 전사 억제인자 도메인일 수 있다. 융합 단백질을 이용하여 염색체 서열을 변경하거나 또는 염색체 서열의 발현을 조절하기 위한 방법 역시 제공된다.
본 발명은 RNA-유도된 엔도뉴클레아제를 제공하고, 이것은 진핵 세포 또는 배아에서 발현을 위해 가공되고, 그리고 진핵 세포 또는 배아에서 표적화된 유전체 변형을 위해 RNA-유도된 엔도뉴클레아제를 이용하는 방법을 제공한다. 융합 단백질 역시 제공되고, 여기서 각 융합 단백질은 CRISPR/Cas-유사 단백질 또는 이의 단편 및 작동체 도메인을 포함한다. 작동체 도메인은 개열 도메인, 후성 변형 도메인, 전사 활성화 도메인, 또는 전사 억제인자 도메인일 수 있다. 융합 단백질을 이용하여 염색체 서열을 변경하거나 또는 염색체 서열의 발현을 조절하기 위한 방법 역시 제공된다.
Description
발명의 분야
본 발명은 표적화된 유전체 변형에 관계한다. 특히, 본 발명은 CRISPR/Cas-유사 단백질을 포함하는 RNA-유도된 엔도뉴클레아제 또는 융합 단백질 및 표적화된 염색체 서열을 변경하거나 또는 조절하기 위해 상기 단백질을 이용하는 방법에 관계한다.
발명의 배경
표적화된 유전체 변형은 진핵 세포, 배아, 그리고 동물의 유전자 조작을 위한 강력한 도구이다. 가령, 외인성 서열이 표적화된 유전체학 위치에서 통합될 수 있고 및/또는 특정한 내인성 염색체 서열이 결실되거나, 불활성화되거나, 또는 변형될 수 있다. 현재 방법은 가공된 뉴클레아제 효소, 예를 들면, 예로서, 아연 핑거 뉴클레아제 (ZFNs) 또는 전사 활성제-유사 작동체 뉴클레아제 (TALENs)의 이용에 의존한다. 이들 키메라 뉴클레아제는 비특이적 DNA 개열 도메인에 연결된 프로그램가능, 서열-특정한 DNA-결합 모듈을 내포한다. 각 새로운 유전체학 표적은 하지만, 신규한 서열-특이적 DNA-결합 모듈을 포함하는 새로운 ZFN 또는 TALEN의 설계를 필요로 한다. 따라서, 이들 맞춤 설계된 뉴클레아제는 준비하는데 값비싸고 시간 소모적인 경향이 있다. 게다가, ZFNs와 TALENS의 특이성은 그들이 부정확한 개열을 매개할 수 있는 정도이다.
따라서, 각 새로운 표적화된 유전체학 위치에 대한 새로운 뉴클레아제의 설계를 필요로 하지 않는 표적화된 유전체 변형 기술이 필요하다. 부가적으로, 부정확한 효과가 거의 또는 전혀 없는 증가된 특이성을 갖는 기술이 필요하다.
발명의 요약
본 발명의 다양한 양상에는 단리된 RNA-유도된 엔도뉴클레아제의 제공이 포함되고, 여기서 엔도뉴클레아제는 최소한 하나의 핵 국지화 신호, 최소한 하나의 뉴클레아제 도메인, 그리고 엔도뉴클레아제를 개열을 위한 특정한 뉴클레오티드 서열로 표적화하기 위한 유도 RNA와 상호작용하는 최소한 하나의 도메인을 포함한다. 한 구체예에서, 엔도뉴클레아제는 Cas9 단백질로부터 유래될 수 있다. 다른 구체예에서, 엔도뉴클레아제는 최소한 하나의 기능적 뉴클레아제 도메인을 결여하도록 변형될 수 있다. 다른 구체예에서, 엔도뉴클레아제는 세포-투과성 도메인, 마커 도메인, 또는 둘 모두를 더욱 포함할 수 있다. 추가의 구체예에서, 엔도뉴클레아제는 유도 RNA를 포함하는 단백질-RNA 복합체의 부분일 수 있다. 일부 경우에, 유도 RNA는 표적 부위에 상보적인 5' 영역을 포함하는 단일 분자일 수 있다. 본원에서 개시된 RNA-유도된 엔도뉴클레아제 중에서 한 가지를 인코딩하는 단리된 핵산 역시 제공된다. 일부 구체예에서, 핵산은 포유류 세포, 예를 들면, 예로서, 인간 세포에서 번역을 위해 코돈 최적화될 수 있다. 다른 구체예에서, RNA-유도된 엔도뉴클레아제를 인코딩하는 핵산 서열은 프로모터 제어 서열에 작동가능하게 연결될 수 있고, 그리고 임의선택적으로, 벡터의 부분일 수 있다. 다른 구체예에서, 프로모터 제어 서열에 작동가능하게 연결될 수 있는, RNA-유도된 엔도뉴클레아제를 인코딩하는 서열을 포함하는 벡터는 프로모터 제어 서열에 작동가능하게 연결될 수 있는, 유도 RNA를 인코딩하는 서열을 또한 포함할 수 있다.
본 발명의 다른 양상은 진핵 세포 또는 배아에서 염색체 서열을 변경하기 위한 방법을 포괄한다. 상기 방법은 (i) 최소한 하나의 핵 국지화 신호를 포함하는 최소한 하나의 RNA-유도된 엔도뉴클레아제 또는 본원에서 규정된 바와 같은 최소한 하나의 RNA-유도된 엔도뉴클레아제를 인코딩하는 핵산, (ii) 최소한 하나의 유도 RNA 또는 최소한 하나의 유도 RNA를 인코딩하는 DNA, 그리고, 임의선택적으로, (iii) 공여자 서열을 포함하는 최소한 하나의 공여자 폴리뉴클레오티드를 진핵 세포 또는 배아 내로 도입하는 것을 포함한다. 상기 방법은 각 유도 RNA가 염색체 서열 내에 표적화된 부위에 RNA-유도된 엔도뉴클레아제를 향하게 하도록 상기 세포 또는 배아를 배양하는 것을 더욱 포함하고, 여기서 상기 RNA-유도된 엔도뉴클레아제는 표적화된 부위 내에 이중 가닥 절단을 도입하고, 그리고 상기 이중 가닥 절단은 염색체 서열이 변형되도록 DNA 복구 과정에 의해 복구된다. 한 구체예에서, RNA-유도된 엔도뉴클레아제는 Cas9 단백질로부터 유래될 수 있다. 다른 구체예에서, 세포 또는 배아 내로 도입된 RNA-유도된 엔도뉴클레아제를 인코딩하는 핵산은 mRNA일 수 있다. 추가의 구체예에서, 세포 또는 배아 내로 도입된 RNA-유도된 엔도뉴클레아제를 인코딩하는 핵산은 DNA일 수 있다. 추가의 구체예에서, RNA-유도된 엔도뉴클레아제를 인코딩하는 DNA는 유도 RNA를 인코딩하는 서열을 더욱 포함하는 벡터의 부분일 수 있다. 일정한 구체예에서, 진핵 세포는 인간 세포, 비-인간 포유류 세포, 줄기 세포, 비포유류 척추동물 세포, 무척추동물 세포, 식물 세포, 또는 단일 세포 진핵 생물체일 수 있다. 일정한 다른 구체예에서, 배아는 비-인간 단세포 동물 배아일 수 있다.
본 발명의 추가 양상은 CRISPR/Cas-유사 단백질 또는 이의 단편 및 작동체 도메인을 포함하는 융합 단백질을 제공한다. 일반적으로, 융합 단백질은 최소한 하나의 핵 국지화 신호를 포함한다. 융합 단백질의 작동체 도메인은 개열 도메인, 후성 변형 도메인, 전사 활성화 도메인, 또는 전사 억제물질 도메인일 수 있다. 한 구체예에서, 융합 단백질의 CRISPR/Cas-유사 단백질은 Cas9 단백질로부터 유래될 수 있다. 한 가지 반복에서, Cas9 단백질은 최소한 하나의 기능적 뉴클레아제 도메인을 결여하도록 변형될 수 있다. 교체 반복에서, Cas9 단백질은 모든 뉴클레아제 활성을 결여하도록 변형될 수 있다. 한 구체예에서, 작동체 도메인은 개열 도메인, 예를 들면, 예로서, FokI 엔도뉴클레아제 도메인 또는 변형된 FokI 엔도뉴클레아제 도메인일 수 있다. 다른 구체예에서, 한 융합 단백질은 다른 융합 단백질과 이합체를 형성할 수 있다. 이합체는 동종이합체 또는 이형이합체일 수 있다. 다른 구체예에서, 융합 단백질은 아연 핑거 뉴클레아제와 이형이합체를 형성할 수 있고, 여기서 융합 단백질과 아연 핑거 뉴클레아제 둘 모두의 개열 도메인은 FokI 엔도뉴클레아제 도메인 또는 변형된 FokI 엔도뉴클레아제 도메인이다. 또 다른 구체예에서, 융합 단백질은 모든 뉴클레아제 활성을 결여하도록 변형된 Cas9 단백질로부터 유래된 CRISPR/Cas-유사 단백질을 포함하고, 그리고 작동체 도메인은 FokI 엔도뉴클레아제 도메인 또는 변형된 FokI 엔도뉴클레아제 도메인이다. 또 다른 구체예에서, 융합 단백질은 모든 뉴클레아제 활성을 결여하도록 변형된 Cas9 단백질로부터 유래된 CRISPR/Cas-유사 단백질을 포함하고, 그리고 작동체 도메인은 후성 변형 도메인, 전사 활성화 도메인, 또는 전사 억제물질 도메인일 수 있다. 추가의 구체예에서, 본원에서 개시된 융합 단백질 중에서 한 가지는 핵 국지화 신호, 세포-투과성 도메인, 그리고 마커 도메인에서 선택된 최소한 하나의 추가 도메인을 포함할 수 있다. 본원에서 제공된 융합 단백질 중에서 한 가지를 인코딩하는 단리된 핵산 역시 제공된다.
본 발명의 또 다른 양상은 세포 또는 배아에서 염색체 서열을 변경하거나 또는 염색체 서열의 발현을 조절하기 위한 방법을 포괄한다. 상기 방법은 다음을 세포 또는 배아 내로 도입하는 것을 포함한다: (a) 최소한 하나의 융합 단백질 또는 최소한 하나의 융합 단백질을 인코딩하는 핵산, 여기서 상기 융합 단백질은 CRISPR/Cas-유사 단백질 또는 이의 단편 및 작동체 도메인을 포함하고, 그리고 (b) 최소한 하나의 유도 RNA 또는 최소한 하나의 유도 RNA를 인코딩하는 DNA, 여기서 유도 RNA는 융합 단백질의 CRISPR/Cas-유사 단백질을 염색체 서열 내에 표적화된 부위로 유도하고, 그리고 융합 단백질의 작동체 도메인은 염색체 서열을 변경하거나 또는 염색체 서열의 발현을 조절한다. 한 구체예에서, 융합 단백질의 CRISPR/Cas-유사 단백질은 Cas9 단백질로부터 유래될 수 있다. 다른 구체예에서, 융합 단백질의 CRISPR/Cas-유사 단백질은 최소한 하나의 기능적 뉴클레아제 도메인을 결여하도록 변형될 수 있다. 또 다른 구체예에서, 융합 단백질의 CRISPR/Cas-유사 단백질은 모든 뉴클레아제 활성을 결여하도록 변형될 수 있다. 융합 단백질이 모든 뉴클레아제 활성을 결여하도록 변형된 Cas9 단백질 및 FokI 개열 도메인 또는 변형된 FokI 개열 도메인을 포함하는 한 구체예에서, 상기 방법은 1개의 융합 단백질 또는 1개의 융합 단백질을 인코딩하는 핵산 및 2개의 유도 RNA 또는 2개의 유도 RNA를 인코딩하는 DNA를 세포 또는 배아 내로 도입하는 것을 포함할 수 있고, 그리고 여기서 1개의 이중 가닥 절단이 염색체 서열 내에 도입된다. 융합 단백질이 모든 뉴클레아제 활성을 결여하도록 변형된 Cas9 단백질 및 FokI 개열 도메인 또는 변형된 FokI 개열 도메인을 포함하는 다른 구체예에서, 상기 방법은 2개의 융합 단백질 또는 2개의 융합 단백질을 인코딩하는 핵산 및 2개의 유도 RNA 또는 2개의 유도 RNA를 인코딩하는 DNA를 세포 또는 배아 내로 도입하는 것을 포함할 수 있고, 그리고 여기서 2개의 이중 가닥 절단이 염색체 서열 내에 도입된다. 융합 단백질이 모든 뉴클레아제 활성을 결여하도록 변형된 Cas9 단백질 및 FokI 개열 도메인 또는 변형된 FokI 개열 도메인을 포함하는 또 다른 구체예에서, 상기 방법은 1개의 융합 단백질 또는 1개의 융합 단백질을 인코딩하는 핵산, 1개의 유도 RNA 또는 1개의 유도 RNA를 인코딩하는 핵산, 그리고 1개의 아연 핑거 뉴클레아제 또는 1개의 아연 핑거 뉴클레아제를 인코딩하는 핵산을 세포 또는 배아 내로 도입하는 것을 포함할 수 있고, 여기서 상기 아연 핑거 뉴클레아제는 FokI 개열 도메인 또는 변형된 FokI 개열 도메인을 포함하고, 그리고 여기서 1개의 이중 가닥 절단이 염색체 서열 내로 도입된다. 융합 단백질이 개열 도메인을 포함하는 일정한 구체예에서, 상기 방법은 최소한 하나의 공여자 폴리뉴클레오티드를 세포 또는 배아 내로 도입하는 것을 더욱 포함할 수 있다. 융합 단백질이 후성 변형 도메인, 전사 활성화 도메인, 또는 전사 억제물질 도메인에서 선택되는 작동체 도메인을 포함하는 구체예에서, 상기 융합 단백질은 모든 뉴클레아제 활성을 결여하도록 변형된 Cas9 단백질을 포함할 수 있고, 그리고 상기 방법은 1개의 융합 단백질 또는 1개의 융합 단백질을 인코딩하는 핵산, 그리고 1개의 유도 RNA 또는 1개의 유도 RNA를 인코딩하는 핵산을 세포 또는 배아 내로 도입하는 것을 포함할 수 있고, 그리고 여기서 표적화된 염색체 서열의 구조 또는 발현이 변형된다. 일정한 구체예에서, 진핵 세포는 인간 세포, 비-인간 포유류 세포, 줄기 세포, 비포유류 척추동물 세포, 무척추동물 세포, 식물 세포, 또는 단일 세포 진핵 생물체일 수 있다. 일정한 다른 구체예에서, 배아는 비-인간 단세포 동물 배아이다.
본 발명의 다른 양상과 반복이 아래에서 상술된다.
도면의 간단한 설명
도면 1은 단백질 이합체를 이용한 유전체 변형을 도해한다. (A)는 DNA 결합을 위한 Cas-유사 단백질 및 FokI 개열 도메인을 각각 포함하는 2개의 융합 단백질로 구성된 이합체에 의해 창출된 이중 가닥 절단을 묘사한다. (B)는 Cas-유사 단백질과 FokI 개열 도메인을 포함하는 융합 단백질 및 아연 핑거 (ZF) DNA-결합 도메인과 FokI 개열 도메인을 포함하는 아연 핑거 뉴클레아제로 구성된 이합체에 의해 창출된 이중 가닥 절단을 묘사한다.
도면 2는 유전자 조절 도메인을 포함하는 RNA-유도된 융합 단백질을 이용한 유전자 발현의 조절을 예증한다. (A)는 DNA 결합에 이용된 Cas-유사 단백질 및 유전자 발현을 활성화시키거나 또는 억제하는 "A/R" 도메인을 포함하는 융합 단백질을 묘사한다. (B)는 DNA 결합을 위한 Cas-유사 단백질 및 근위 DNA 또는 단백질의 공유 변형에 의해 후성 상태에 영향을 주는 후성 변형 도메인 ("Epi-mod')을 포함하는 융합 단백질을 도해한다.
도면 3은 2개 RNA-유도된 엔도뉴클레아제를 이용한 유전체 변형을 도해한다. (A)는 틈내기효소로 전환된 2개의 RNA-유도된 엔도뉴클레아제에 의해 창출된 이중 가닥 절단을 묘사한다. (B)는 엔도뉴클레아제 활성을 갖는 2개의 RNA-유도된 엔도뉴클레아제에 의해 창출된 2개의 이중 가닥 절단을 묘사한다.
도면 4는 Cas9 핵산, Cas9 가이드용 RNA, 그리고 AAVS1-GFP DNA 공여자로 형질감염된 인간 K562 세포의 형광-활성화된 세포 분류 (FACS)를 제시한다. y축은 적색 통로에서 자동 형광 강도를 나타내고, 그리고 x축은 녹색 형광 강도를 나타낸다. (A) 안티 리버스 Cap 유사체, 0.3 nmol의 미리 어닐링된 crRNA-tracrRNA 이중나선, 그리고 10 μg의 AAVS1-GFP 플라스미드 DNA와 함께 전사된 10 μg의 Cas9 mRNA로 형질감염된 K562 세포; (B) 안티 리버스 Cap 유사체, 0.3 nmol의 키메라 RNA, 그리고 10 μg의 AAVS1-GFP 플라스미드 DNA와 함께 전사된 10 μg의 Cas9 mRNA로 형질감염된 K562 세포; (C) 전사후 캡핑 반응에 의해 캡핑된 10 μg의 Cas9 mRNA, 0.3 nmol의 키메라 RNA, 그리고 10 μg의 AAVS1-GFP 플라스미드 DNA로 형질감염된 K562 세포; (D) 10 μg의 Cas9 플라스미드 DNA, 5 μg의 U6-키메라 RNA 플라스미드 DNA, 그리고 10 μg의 AAVS1-GFP 플라스미드 DNA로 형질감염된 K562 세포; (E) 10 μg의 AAVS1-GFP 플라스미드 DNA로 형질감염된 K562 세포; (F) 형질감염 시약 단독으로 형질감염된 K562 세포.
도면 5는 인간 세포 내에 AAVS1 좌위 내로 GFP의 표적화된 통합을 문서화하는 접합부 PCR 분석을 제시한다. 레인 M: 1 kb DNA 분자 마커; 레인 A: 안티 리버스 Cap 유사체, 0.3 nmol의 미리 어닐링된 crRNA-tracrRNA 이중나선, 그리고 10 μg의 AAVS1-GFP 플라스미드 DNA와 함께 전사된 10 μg의 Cas9 mRNA로 형질감염된 K562 세포; 레인 B: 안티 리버스 Cap 유사체, 0.3 nmol의 키메라 RNA, 그리고 10 μg의 AAVS1-GFP 플라스미드 DNA와 함께 전사된 10 μg의 Cas9 mRNA로 형질감염된 K562 세포; 레인 C: 전사후 캡핑 반응에 의해 캡핑된 10 μg의 Cas9 mRNA, 0.3 nmol의 키메라 RNA, 그리고 10 μg의 AAVS1-GFP 플라스미드 DNA로 형질감염된 K562 세포; 레인 D: 10 μg의 Cas9 플라스미드 DNA, 5 μg의 U6-키메라 RNA 플라스미드 DNA, 그리고 10 μg의 AAVS1-GFP 플라스미드 DNA로 형질감염된 K562 세포; 레인 E: 10 μg의 AAVS1-GFP 플라스미드 DNA로 형질감염된 K562 세포; 레인 F: 형질감염 시약 단독으로 형질감염된 K562 세포.
도면 1은 단백질 이합체를 이용한 유전체 변형을 도해한다. (A)는 DNA 결합을 위한 Cas-유사 단백질 및 FokI 개열 도메인을 각각 포함하는 2개의 융합 단백질로 구성된 이합체에 의해 창출된 이중 가닥 절단을 묘사한다. (B)는 Cas-유사 단백질과 FokI 개열 도메인을 포함하는 융합 단백질 및 아연 핑거 (ZF) DNA-결합 도메인과 FokI 개열 도메인을 포함하는 아연 핑거 뉴클레아제로 구성된 이합체에 의해 창출된 이중 가닥 절단을 묘사한다.
도면 2는 유전자 조절 도메인을 포함하는 RNA-유도된 융합 단백질을 이용한 유전자 발현의 조절을 예증한다. (A)는 DNA 결합에 이용된 Cas-유사 단백질 및 유전자 발현을 활성화시키거나 또는 억제하는 "A/R" 도메인을 포함하는 융합 단백질을 묘사한다. (B)는 DNA 결합을 위한 Cas-유사 단백질 및 근위 DNA 또는 단백질의 공유 변형에 의해 후성 상태에 영향을 주는 후성 변형 도메인 ("Epi-mod')을 포함하는 융합 단백질을 도해한다.
도면 3은 2개 RNA-유도된 엔도뉴클레아제를 이용한 유전체 변형을 도해한다. (A)는 틈내기효소로 전환된 2개의 RNA-유도된 엔도뉴클레아제에 의해 창출된 이중 가닥 절단을 묘사한다. (B)는 엔도뉴클레아제 활성을 갖는 2개의 RNA-유도된 엔도뉴클레아제에 의해 창출된 2개의 이중 가닥 절단을 묘사한다.
도면 4는 Cas9 핵산, Cas9 가이드용 RNA, 그리고 AAVS1-GFP DNA 공여자로 형질감염된 인간 K562 세포의 형광-활성화된 세포 분류 (FACS)를 제시한다. y축은 적색 통로에서 자동 형광 강도를 나타내고, 그리고 x축은 녹색 형광 강도를 나타낸다. (A) 안티 리버스 Cap 유사체, 0.3 nmol의 미리 어닐링된 crRNA-tracrRNA 이중나선, 그리고 10 μg의 AAVS1-GFP 플라스미드 DNA와 함께 전사된 10 μg의 Cas9 mRNA로 형질감염된 K562 세포; (B) 안티 리버스 Cap 유사체, 0.3 nmol의 키메라 RNA, 그리고 10 μg의 AAVS1-GFP 플라스미드 DNA와 함께 전사된 10 μg의 Cas9 mRNA로 형질감염된 K562 세포; (C) 전사후 캡핑 반응에 의해 캡핑된 10 μg의 Cas9 mRNA, 0.3 nmol의 키메라 RNA, 그리고 10 μg의 AAVS1-GFP 플라스미드 DNA로 형질감염된 K562 세포; (D) 10 μg의 Cas9 플라스미드 DNA, 5 μg의 U6-키메라 RNA 플라스미드 DNA, 그리고 10 μg의 AAVS1-GFP 플라스미드 DNA로 형질감염된 K562 세포; (E) 10 μg의 AAVS1-GFP 플라스미드 DNA로 형질감염된 K562 세포; (F) 형질감염 시약 단독으로 형질감염된 K562 세포.
도면 5는 인간 세포 내에 AAVS1 좌위 내로 GFP의 표적화된 통합을 문서화하는 접합부 PCR 분석을 제시한다. 레인 M: 1 kb DNA 분자 마커; 레인 A: 안티 리버스 Cap 유사체, 0.3 nmol의 미리 어닐링된 crRNA-tracrRNA 이중나선, 그리고 10 μg의 AAVS1-GFP 플라스미드 DNA와 함께 전사된 10 μg의 Cas9 mRNA로 형질감염된 K562 세포; 레인 B: 안티 리버스 Cap 유사체, 0.3 nmol의 키메라 RNA, 그리고 10 μg의 AAVS1-GFP 플라스미드 DNA와 함께 전사된 10 μg의 Cas9 mRNA로 형질감염된 K562 세포; 레인 C: 전사후 캡핑 반응에 의해 캡핑된 10 μg의 Cas9 mRNA, 0.3 nmol의 키메라 RNA, 그리고 10 μg의 AAVS1-GFP 플라스미드 DNA로 형질감염된 K562 세포; 레인 D: 10 μg의 Cas9 플라스미드 DNA, 5 μg의 U6-키메라 RNA 플라스미드 DNA, 그리고 10 μg의 AAVS1-GFP 플라스미드 DNA로 형질감염된 K562 세포; 레인 E: 10 μg의 AAVS1-GFP 플라스미드 DNA로 형질감염된 K562 세포; 레인 F: 형질감염 시약 단독으로 형질감염된 K562 세포.
발명의 상세한 설명
RNA-유도된 엔도뉴클레아제가 본원에서 제공되는데, 이것은 최소한 하나의 핵 국지화 신호, 최소한 하나의 뉴클레아제 도메인, 그리고 엔도뉴클레아제를 개열을 위한 특정한 뉴클레오티드 서열로 표적화하는 유도 RNA와 상호작용하는 최소한 하나의 도메인을 포함한다. RNA-유도된 엔도뉴클레아제를 인코딩하는 핵산뿐만 아니라 RNA-유도된 엔도뉴클레아제를 이용하여 진핵 세포 또는 배아의 염색체 서열을 변경하는 방법 역시 제공된다. RNA-유도된 엔도뉴클레아제는 특정한 유도 RNA와 상호작용하고, 이들은 각각 상기 엔도뉴클레아제를 특정한 표적화된 부위로 향하게 하고, 상기 부위에서 RNA-유도된 엔도뉴클레아제는 염색체 서열이 변형되도록, DNA 복구 과정에 의해 복구될 수 있는 이중 가닥 절단을 도입한다. 특이성이 유도 RNA에 의해 제공되기 때문에, RNA-기초된 엔도뉴클레아제가 보편적이고 상이한 유전체학 서열을 표적으로 하는 상이한 유도 RNA에서 이용될 수 있다. 본원에서 개시된 방법은 특정한 염색체 서열을 표적으로 하고 변경하고 및/또는 세포 또는 배아의 유전체 내에 표적화된 위치에서 외인성 서열을 도입하는데 이용될 수 있다. 게다가, 표적화는 특정하고 부정확한 효과가 제한된다.
본 발명은 융합 단백질을 제공하는데, 여기서 융합 단백질은 CRISPR/Cas-유사 단백질 또는 이의 단편 및 작동체 도메인을 포함한다. 적합한 작동체 도메인은 제한 없이, 개열 도메인, 후성 변형 도메인, 전사 활성화 도메인, 그리고 전사 억제인자 도메인을 포함한다. 각 융합 단백질은 특정한 유도 RNA에 의해 특정한 염색체 서열로 유도되고, 여기서 작동체 도메인은 표적화된 유전체 변형 또는 유전자 조절을 매개한다. 한 양상에서, 융합 단백질은 이합체로서 기능하고, 따라서 표적 부위의 길이를 증가시키고 유전체 내에 이의 독특성의 가능성을 증가시킬 수 있다 (따라서, 부정확한 효과를 감소시킬 수 있다). 가령, 내인성 CRISPR 시스템은 대략 13-20 bp의 DNA 결합 단어 길이에 기초하여 유전체학 위치를 변경한다 (Cong et al., Science, 339:819-823). 이러한 단어 크기에서, 표적 부위의 단지 5-7%만 유전체 내에서 독특하다 (Iseli et al, PLos One 2(6):e579). 대조적으로, 아연 핑거 뉴클레아제에 대한 DNA 결합 단어 크기는 전형적으로, 30-36 bp 범위에서 변하고, 인간 유전체 내에서 대략 85-87% 독특한 표적 부위를 유발한다. CRISPR-기초된 시스템에 의해 활용되는 더욱 작은 크기산정된 DNA 결합 부위는 원하는 위치, 예를 들면, 질환 SNP, 작은 엑손, 출발 코돈, 그리고 종결 코돈뿐만 아니라 복잡한 유전체 내에 다른 위치 인근에서 표적화된 CRISP-기초된 뉴클레아제의 설계를 제한하고 복잡하게 만든다. 본 발명은 CRISPR DNA 결합 단어 길이를 확장하기 위한 수단 (즉, 부정확한 활성을 제한하기 위해)을 제공할 뿐만 아니라, 변형된 기능성을 갖는 CRISPR 융합 단백질을 더욱 제공한다. 따라서, 개시된 CRISPR 융합 단백질은 증가된 표적 특이성과 독특한 기능성(들)을 갖는다. 표적화된 염색체 서열의 발현을 변경하거나 또는 조절하기 위해 융합 단백질을 이용하는 방법 역시 본원에서 제공된다.
(I) RNA-유도된 엔도뉴클레아제
본 발명의 한 가지 양상은 진핵 세포와 배아, 예를 들면, 예로서, 비-인간 단세포 배아의 핵 내로 엔도뉴클레아제의 진입을 허용하는, 최소한 하나의 핵 국지화 신호를 포함하는 RNA-유도된 엔도뉴클레아제를 제공한다. RNA-유도된 엔도뉴클레아제는 또한, 최소한 하나의 뉴클레아제 도메인 및 유도 RNA와 상호작용하는 최소한 하나의 도메인을 포함한다. RNA-유도된 엔도뉴클레아제는 유도 RNA에 의해 특정한 핵산 서열 (또는 표적 부위)에 지향된다. 유도 RNA는 RNA-유도된 엔도뉴클레아제뿐만 아니라 표적 부위와 상호작용하고, 따라서 일단 표적 부위에 지향되면, RNA-유도된 엔도뉴클레아제는 이중 가닥 절단을 표적 부위 핵산 서열 내로 도입할 수 있다. 유도 RNA가 표적화된 개열에 대한 특이성을 제공하기 때문에, RNA-유도된 엔도뉴클레아제의 엔도뉴클레아제가 보편적이고 상이한 표적 핵산 서열을 개열하는 상이한 유도 RNA에서 이용될 수 있다. 단리된 RNA-유도된 엔도뉴클레아제, RNA-유도된 엔도뉴클레아제를 인코딩하는 단리된 핵산 (즉, RNA 또는 DNA), RNA-유도된 엔도뉴클레아제를 인코딩하는 핵산을 포함하는 벡터, 그리고 RNA-유도된 엔도뉴클레아제 + 유도 RNA를 포함하는 단백질-RNA 복합체가 본원에서 제공된다.
RNA-유도된 엔도뉴클레아제는 군집된 규칙적으로 산재된 짧은 회귀성 반복부 (CRISPR)/CRISPR-연관된 (Cas) 시스템으로부터 유래될 수 있다. CRISPR/Cas 시스템은 타입 I, 타입 II, 또는 타입 III 시스템일 수 있다. 적합한 CRISPR/Cas 단백질의 무제한적 실례는 Cas3, Cas4, Cas5, Cas5e (또는 CasD), Cas6, Cas6e, Cas6f, Cas7, Cas8a1, Cas8a2, Cas8b, Cas8c, Cas9, Cas10, Cas10d, CasF, CasG, CasH, Csy1, Csy2, Csy3, Cse1 (또는 CasA), Cse2 (또는 CasB), Cse3 (또는 CasE), Cse4 (또는 CasC), Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csz1, Csx15, Csf1, Csf2, Csf3, Csf4, 그리고 Cu1966을 포함한다.
한 구체예에서, RNA-유도된 엔도뉴클레아제는 유형 II CRISPR/Cas 시스템으로부터 유래된다. 특정한 구체예에서, RNA-유도된 엔도뉴클레아제는 Cas9 단백질로부터 유래된다. Cas9 단백질은 스트렙토콕쿠스 피오게네스 (스트렙토콕쿠스 피오게네스), 스트렙토콕쿠스 써모필루스 (스트렙토콕쿠스 thermophilus), 스트렙토콕쿠스 (스트렙토콕쿠스) 종, 노카르디오프시스 라스손빌레이 (Nocardiopsis dassonvillei), 스트렙토미세스 프리스티네스피랄리스 (Streptomyces pristinaespiralis), 스트렙토미세스 비리도크로모게네스 (Streptomyces viridochromogenes), 스트렙토미세스 비리도크로모게네스 (Streptomyces viridochromogenes), 스트렙토스포랑기움 로세움 (Streptosporangium roseum), 스트렙토스포랑기움 로세움 (Streptosporangium roseum), 알리사이클로바실루스 아시도칼다리우스 (Alicyclobacillus acidocaldarius), 바실루스 슈도마이코이데스 (Bacillus pseudomycoides), 바실루스 셀레니티레두센스 (Bacillus selenitireducens), 엑시구오박테리움 시비리쿰 (Exiguobacterium sibiricum), 락토바실루스 델브루키 (Lactobacillus delbrueckii), 락토바실루스 살리바리우스 (Lactobacillus salivarius), 미크로스킬라 마리나 (Microscilla marina), 버크홀데리알레스 박테리움 (Burkholderiales bacterium), 폴라로모나스 나프탈레니보란스 (Polaromonas naphthalenivorans), 폴라로모나스 (Polaromonas) 종, 크로코스파에라 왓소니 (Crocosphaera watsonii), 시아노테세 (Cyanothece) 종, 마이크로시스티스 아에루기노사 (Microcystis aeruginosa), 시네코콕쿠스 (Synechococcus) 종, 아세토할로비움 아라바티쿰 (Acetohalobium arabaticum), 암모니펙스 데겐씨 (Ammonifex degensii), 칼디셀룰로시럽토 베시 (Caldicellulosiruptor bescii), 칸디다투스 데술포루디스 (Candidatus Desulforudis), 클로스트리듐 보툴리눔 (Clostridium botulinum), 클로스트리듐 디피실레 (Clostridium difficile), 피네골디아 마그나 (Finegoldia magna), 나트라나이로비우스 써모필루스 (Natranaerobius thermophilus), 펠로토마쿨룸 써모프로피오니쿰 (Pelotomaculum thermopropionicum), 아시치오바실루스 칼두스 (Acidithiobacillus caldus), 아시치오바실루스 페록시단스 (Acidithiobacillus ferrooxidans), 알로크로마티움 비노숨 (Allochromatium vinosum), 마리노박터 (Marinobacter) 종, 니트로소콕쿠스 할로필루스 (Nitrosococcus halophilus), 니트로소콕쿠스 왓소니 (Nitrosococcus watsoni), 슈도알테로모나스 할로플랭크티스 (Pseudoalteromonas haloplanktis), 크테도노박터 라세미페르 (Ktedonobacter racemifer), 메타노할로비움 에베스티가툼 (Methanohalobium evestigatum), 아나베나 바리아빌리스 (Anabaena variabilis), 노둘라리아 스푸미게나 (Nodularia spumigena), 노스톡 (Nostoc) 종, 아르트로스피라 맥시마 (Arthrospira maxima), 아르트로스피라 플라텐시스 (Arthrospira platensis), 아트로스피라 (Arthrospira) 종, 링비아 (Lyngbya) 종, 미크로콜레우스 크토노플라스테스 (Microcoleus chthonoplastes), 오실라토리아 (Oscillatoria) 종, 페트로토가 모빌리스 (Petrotoga mobilis), 써모시포 아프리카누스 (Thermosipho africanus), 또는 아카리오클로리스 마리나 (Acaryochloris marina)로부터 유래될 수 있다.
일반적으로, CRISPR/Cas 단백질은 최소한 하나의 RNA 인식 및/또는 RNA 결합 도메인을 포함한다. RNA 인식 및/또는 RNA 결합 도메인은 유도 RNA와 상호작용한다. CRISPR/Cas 단백질은 또한, 뉴클레아제 도메인 (즉, DNA분해효소 또는 RNA분해효소 도메인), DNA 결합 도메인, 헬리카아제 도메인, RNA분해효소 도메인, 단백질-단백질 상호작용 도메인, 이합체화 도메인뿐만 아니라 다른 도메인을 포함할 수 있다.
CRISPR/Cas-유사 단백질은 야생형 CRISPR/Cas 단백질, 변형된 CRISPR/Cas 단백질, 또는 야생형 또는 변형된 CRISPR/Cas 단백질의 단편일 수 있다. CRISPR/Cas-유사 단백질은 핵산 결합 친화성 및/또는 특이성을 증가시키고, 효소적 활성을 변경하고, 및/또는 단백질의 다른 성질을 변화시키기 위해 변형될 수 있다. 가령, CRISPR/Cas-유사 단백질의 뉴클레아제 (즉, DNA분해효소, RNA분해효소) 도메인은 변형되거나, 결실되거나, 또는 불활성화될 수 있다. 대안으로, CRISPR/Cas-유사 단백질은 융합 단백질의 기능에 필수적이지 않은 도메인을 제거하기 위해 절두될 수 있다. CRISPR/Cas-유사 단백질은 또한, 융합 단백질의 작동체 도메인의 활성을 최적화하기 위해 절두되거나 또는 변형될 수 있다.
일부 구체예에서, CRISPR/Cas-유사 단백질은 야생형 Cas9 단백질 또는 이의 단편으로부터 유래될 수 있다. 다른 구체예에서, CRISPR/Cas-유사 단백질은 변형된 Cas9 단백질로부터 유래될 수 있다. 가령, Cas9 단백질의 아미노산 서열은 단백질의 하나 또는 그 이상의 성질 (가령, 뉴클레아제 활성, 친화성, 안정성 등)을 변경하기 위해 변형될 수 있다. 대안으로, RNA-유도된 개열에 관련되지 않는 Cas9 단백질의 도메인이 단백질로부터 제거될 수 있고, 따라서 변형된 Cas9 단백질은 야생형 Cas9 단백질보다 작다.
일반적으로, Cas9 단백질은 최소한 2개의 뉴클레아제 (즉, DNA분해효소) 도메인을 포함한다. 가령, Cas9 단백질은 RuvC-유사 뉴클레아제 도메인 및 HNH-유사 뉴클레아제 도메인을 포함할 수 있다. RuvC와 HNH 도메인은 단일 가닥을 절단하여 DNA에서 이중 가닥 절단을 만들기 위해 함께 작동한다 (Jinek et al., Science, 337: 816-821). 일부 구체예에서, Cas9-유래된 단백질은 단지 한 가지 기능적 뉴클레아제 도메인 (RuvC-유사 또는 HNH-유사 뉴클레아제 도메인 중에서 어느 한쪽)만을 내포하도록 변형될 수 있다. 가령, Cas9-유래된 단백질은 뉴클레아제 도메인 중에서 한 가지가 결실되거나 또는 돌연변이되고, 따라서 이것이 더 이상 기능하지 않도록 (즉, 뉴클레아제 활성이 부재하도록) 변형될 수 있다. 뉴클레아제 도메인 중에서 한 가지가 비활성인 일부 구체예에서, Cas9-유래된 단백질은 이중 가닥 핵산 내로 틈을 도입할 수 있지만 (이런 단백질은 "틈내기효소"로 명명된다), 이중 가닥 DNA를 개열하지 않는다. 가령, RuvC-유사 도메인에서 아스파르트산염에서 알라닌 (D10A) 전환은 Cas9-유래된 단백질을 틈내기효소로 전환한다. 유사하게, HNH 도메인에서 히스티딘에서 알라닌 (H840A 또는 H839A) 전환은 Cas9-유래된 단백질을 틈내기효소로 전환한다. 각 뉴클레아제 도메인은 널리 공지된 방법, 예를 들면, 부위-지향된 돌연변이유발, PCR-매개된 돌연변이유발, 그리고 전체 유전자 합성뿐만 아니라 당분야에서 공지된 다른 방법을 이용하여 변형될 수 있다.
본원에서 개시된 RNA-유도된 엔도뉴클레아제는 최소한 하나의 핵 국지화 신호를 포함한다. 일반적으로, NLS은 염기성 아미노산의 스트레치를 포함한다. 핵 국지화 신호는 당분야에서 공지된다 (가령, Lange et al., J. Biol. Chem., 2007, 282:5101-5105를 참조한다). 가령, 한 구체예에서, NLS는 단립형 서열, 예를 들면, PKKKRKV (서열 번호:1) 또는 PKKKRRV (서열 번호:2)일 수 있다. 다른 구체예에서, NLS는 이분 서열일 수 있다. 또 다른 구체예에서, NLS는 KRPAATKKAGQAKKKK (서열 번호:3)일 수 있다. NLS는 RNA-유도된 엔도뉴클레아제의 N 말단, C 말단, 또는 내부 위치에서 위치될 수 있다.
일부 구체예에서, RNA-유도된 엔도뉴클레아제는 최소한 하나의 세포-투과성 도메인을 더욱 포함할 수 있다. 한 구체예에서, 세포-투과성 도메인은 제1형 사람 면역결핍바이러스 TAT 단백질로부터 유래된 세포-투과성 펩티드 서열일 수 있다. 실례로서, TAT 세포-투과성 서열은 GRKKRRQRRRPPQPKKKRKV (서열 번호:4)일 수 있다. 다른 구체예에서, 세포-투과성 도메인은 인간 B형 간염 바이러스로부터 유래된 세포-투과성 펩티드 서열인 TLM (PLSSIFSRIGDPPKKKRKV; 서열 번호:5)일 수 있다. 또 다른 구체예에서, 세포-투과성 도메인은 MPG (GALFLGWLGAAGSTMGAPKKKRKV; 서열 번호:6 또는 GALFLGFLGAAGSTMGAWSQPKKKRKV; 서열 번호:7)일 수 있다. 추가의 구체예에서, 세포-투과성 도메인은 Pep-1 (KETWWETWWTEWSQPKKKRKV; 서열 번호:8), VP22, 단순 헤르페스 바이러스로부터 세포 투과성 펩티드, 또는 폴리아르기닌 펩티드 서열일 수 있다. 세포-투과성 도메인은 상기 단백질의 N 말단, C 말단, 또는 내부 위치에서 위치될 수 있다.
또 다른 구체예에서, RNA-유도된 엔도뉴클레아제는 또한, 최소한 하나의 마커 도메인을 포함할 수 있다. 마커 도메인의 무제한적 실례는 형광 단백질, 정제 태그, 그리고 에피토프 태그를 포함한다. 일부 구체예에서, 마커 도메인은 형광 단백질일 수 있다. 적합한 형광 단백질의 무제한적인 실례는 녹색 형광 단백질 (가령, GFP, GFP-2, tagGFP, turboGFP, EGFP, Emerald, Azami Green, Monomeric Azami Green, CopGFP, AceGFP, ZsGreen1), 황색 형광 단백질 (가령, YFP, EYFP, Citrine, Venus, YPet, PhiYFP, ZsYellow1), 청색 형광 단백질 (가령, EBFP, EBFP2, Azurite, mKalama1, GFPuv, Sapphire, T-sapphire,), 시안색 형광 단백질 (가령, ECFP, Cerulean, CyPet, AmCyan1, Midoriishi-Cyan), 적색 형광 단백질 (mKate, mKate2, mPlum, DsRed 단위체, mCherry, mRFP1, DsRed-Express, DsRed2, DsRed-단위체, HcRed-탠덤, HcRed1, AsRed2, eqFP611, mRasberry, mStrawberry, Jred), 그리고 오렌지색 형광 단백질 (mOrange, mKO, Kusabira-Orange, Monomeric Kusabira-Orange, mTangerine, tdTomato) 또는 임의의 다른 적합한 형광 단백질을 포함한다. 다른 구체예에서, 마커 도메인은 정제 태그 및/또는 에피토프 태그일 수 있다. 예시적인 태그에는 글루타티온-S-전달효소 (GST), 키틴 결합 단백질 (CBP), 말토오스 결합 단백질, 티오레독신 (TRX), 폴리(NANP), 탠덤 친화성 정제 (TAP) 태그, myc, AcV5, AU1, AU5, E, ECS, E2, FLAG, HA, nus, Softag 1, Softag 3, Strep, SBP, Glu-Glu, HSV, KT3, S, S1, T7, V5, VSV-G, 6xHis, 비오틴 카르복실 운반 단백질 (BCCP), 그리고 칼모듈린이 포함되지만 이들에 한정되지 않는다.
일정한 구체예에서, RNA-유도된 엔도뉴클레아제는 유도 RNA를 포함하는 단백질-RNA 복합체의 부분일 수 있다. 유도 RNA는 RNA-유도된 엔도뉴클레아제와 상호작용하여 엔도뉴클레아제를 특정한 표적 부위로 향하게 하고, 여기서 유도 RNA의 5' 단부는 특정한 프로토스페이서 서열과 염기쌍을 이룬다.
(II) 융합 단백질
본 발명의 다른 양상은 CRISPR/Cas-유사 단백질 또는 이의 단편 및 작동체 도메인을 포함하는 융합 단백질을 제공한다. CRISPR/Cas-유사 단백질은 유도 RNA에 의해 표적 부위에 지향되고, 상기 부위에서 작동체 도메인은 표적화된 핵산 서열을 변경하거나 또는 산출할 수 있다. 작동체 도메인은 개열 도메인, 후성 변형 도메인, 전사 활성화 도메인, 또는 전사 억제인자 도메인일 수 있다. 융합 단백질은 핵 국지화 신호, 세포-투과성 도메인, 또는 마커 도메인에서 선택된 최소한 하나의 추가 도메인을 더욱 포함할 수 있다.
(a) CRISPR/Cas-유사 단백질
융합 단백질은 CRISPR/Cas-유사 단백질 또는 이의 단편을 포함한다. CRISPR/Cas-유사 단백질은 상기 섹션 (I)에서 상술된다. CRISPR/Cas-유사 단백질은 융합 단백질의 N 말단, C 말단, 또는 내부 위치에서 위치될 수 있다.
일부 구체예에서, 융합 단백질의 CRISPR/Cas-유사 단백질은 Cas9 단백질로부터 유래될 수 있다. Cas9-유래된 단백질은 야생형, 변형된, 또는 이의 단편일 수 있다. 일부 구체예에서, Cas9-유래된 단백질은 단지 한 가지 기능적 뉴클레아제 도메인 (RuvC-유사 또는 HNH-유사 뉴클레아제 도메인 중에서 어느 한쪽)을 내포하도록 변형될 수 있다. 가령, Cas9-유래된 단백질은 뉴클레아제 도메인 중에서 한 가지가 결실되거나 또는 돌연변이되고, 따라서 이것이 더 이상 기능하지 않도록 (즉, 뉴클레아제 활성이 부재하도록) 변형될 수 있다. 뉴클레아제 도메인 중에서 한 가지가 비활성인 일부 구체예에서, Cas9-유래된 단백질은 이중 가닥 핵산 내로 틈을 도입할 수 있지만 (이런 단백질은 "틈내기효소"로 명명된다), 이중 가닥 DNA를 개열하지 않는다. 가령, RuvC-유사 도메인에서 아스파르트산염에서 알라닌 (D10A) 전환은 Cas9-유래된 단백질을 틈내기효소로 전환한다. 유사하게, HNH 도메인에서 히스티딘에서 알라닌 (H840A 또는 H839A) 전환은 Cas9-유래된 단백질을 틈내기효소로 전환한다. 다른 구체예에서, RuvC-유사 뉴클레아제 도메인과 HNH-유사 뉴클레아제 도메인 둘 모두 Cas9-유래된 단백질이 이중 가닥 핵산을 틈내기하거나 또는 개열할 수 없도록 변형되거나 또는 제거될 수 있다. 또 다른 구체예에서, Cas9-유래된 단백질의 모든 뉴클레아제 도메인은 Cas9-유래된 단백질이 모든 뉴클레아제 활성을 결여하도록 변형되거나 또는 제거될 수 있다.
상기-설명된 구체예 중에서 한 가지에서, 임의의 또는 모든 뉴클레아제 도메인은 널리 공지된 방법, 예를 들면, 부위-지향된 돌연변이유발, PCR-매개된 돌연변이유발, 그리고 전체 유전자 합성뿐만 아니라 당분야에서 공지된 다른 방법을 이용하여 하나 또는 그 이상의 결실 돌연변이, 삽입 돌연변이, 및/또는 치환 돌연변이에 의해 비활성화될 수 있다. 예시적인 구체예에서, 융합 단백질의 CRISPR/Cas-유사 단백질은 모든 뉴클레아제 도메인이 비활성화되거나 또는 결실된 Cas9 단백질로부터 유래된다.
(b) 작동체 도메인
융합 단백질은 또한, 작동체 도메인을 포함한다. 작동체 도메인은 개열 도메인, 후성 변형 도메인, 전사 활성화 도메인, 또는 전사 억제인자 도메인일 수 있다. 작동체 도메인은 융합 단백질의 N 말단, C 말단, 또는 내부 위치에서 위치될 수 있다.
(i) 개열 도메인
일부 구체예에서, 작동체 도메인은 개열 도메인이다. 본원에서 이용된 바와 같이, "개열 도메인"은 DNA를 개열하는 도메인을 지칭한다. 개열 도메인은 임의의 엔도뉴클레아제 또는 엑소뉴클레아제로부터 획득될 수 있다. 개열 도메인이 유래될 수 있는 엔도뉴클레아제의 무제한적 실례에는 제한 엔도뉴클레아제 및 귀소 엔도뉴클레아제가 포함되지만 이들에 한정되지 않는다. 가령, New England Biolabs Catalog 또는 Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388을 참조한다. DNA를 개열하는 추가 효소가 알려져 있다 (가령, S1 뉴클레아제; 녹두 뉴클레아제; 췌장 DNA분해효소 I; 미구균 뉴클레아제; 효모 HO 엔도뉴클레아제). Linn et al. (eds.) Nucleases, Cold Spring Harbor Laboratory Press, 1993을 또한 참조한다. 이들 효소 중에서 하나 또는 그 이상 (또는 이의 기능적 단편)이 개열 도메인의 공급원으로서 이용될 수 있다.
일부 구체예에서, 개열 도메인은 유형 II-S 엔도뉴클레아제로부터 유래될 수 있다. 유형 II-S 엔도뉴클레아제는 전형적으로, 인식 부위로부터 여러 염기쌍 떨어진 부위에서 DNA를 개열하고, 그리고 따라서, 분리가능한 인식과 개열 도메인을 갖는다. 이들 효소는 일반적으로, 엇갈린 위치에서 DNA의 각 가닥을 개열하기 위해, 일시적으로 결합하여 이합체를 형성하는 단위체이다. 적합한 유형 II-S 엔도뉴클레아제의 무제한적 실례는 BfiI, BpmI, BsaI, BsgI, BsmBI, BsmI, BspMI, FokI, MboII, 그리고 SapI을 포함한다. 예시적인 구체예에서, 융합 단백질의 개열 도메인은 FokI 개열 도메인 또는 이의 유도체이다.
일정한 구체예에서, 유형 II-S 개열은 2개의 상이한 개열 도메인 (이들은 각각, CRISPR/Cas-유사 단백질 또는 이의 단편에 부착된다)의 이합체화를 조장하도록 변형될 수 있다. 가령, FokI의 개열 도메인은 일정한 아미노산 잔기를 돌연변이시킴으로써 변형될 수 있다. 무제한적 실례에 의하여, FokI 개열 도메인의 위치 446, 447, 479, 483, 484, 486, 487, 490, 491, 496, 498, 499, 500, 531, 534, 537, 그리고 538에서 아미노산 잔기가 변형에 대한 표적이다. 가령, 절대 이형이합체를 형성하는 FokI의 변형된 개열 도메인은 첫 번째 변형된 개열 도메인이 아미노산 위치 490과 538에서 돌연변이를 포함하고, 그리고 두 번째 변형된 개열 도메인이 아미노산 위치 486과 499에서 돌연변이를 포함하는 쌍을 포함한다 (Miller et al., 2007, Nat. Biotechnol, 25:778-785; Szczpek et al., 2007, Nat. Biotechnol, 25:786-793). 가령, 한 도메인에서 위치 490에서 Glu (E)가 Lys (K)로 변화될 수 있고 위치 538에서 Ile (I)가 K로 변화될 수 있고 (E490K, I538K), 그리고 다른 개열 도메인에서 위치 486에서 Gln (Q)이 E로 변화될 수 있고 위치 499에서 I가 Leu (L)로 변화될 수 있다 (Q486E, I499L). 다른 구체예에서, 변형된 FokI 개열 도메인은 3가지 아미노산 변화를 포함할 수 있다 (Doyon et al. 2011, Nat. Methods, 8:74-81). 가령, 한 변형된 FokI 도메인 (ELD로 명명된다)은 Q486E, I499L, N496D 돌연변이를 포함할 수 있고, 그리고 다른 변형된 FokI 도메인 (KKR로 명명된다)은 E490K, I538K, H537R 돌연변이를 포함할 수 있다.
예시적인 구체예에서, 융합 단백질의 작동체 도메인은 FokI 개열 도메인 또는 변형된 FokI 개열 도메인이다.
작동체 도메인이 개열 도메인이고 CRISPR/Cas-유사 단백질이 Cas9 단백질로부터 유래되는 구체예에서, Cas9-유래된 단백질은 엔도뉴클레아제 활성이 제거되도록 본원에서 논의된 바와 같이 변형될 수 있다. 가령, Cas9-유래된 단백질은 이들이 뉴클레아제 활성을 더 이상 소유하지 않도록, RuvC와 HNH 도메인을 돌연변이시킴으로써 변형될 수 있다.
(ii) 후성 변형 도메인
다른 구체예에서, 융합 단백질의 작동체 도메인은 후성 변형 도메인일 수 있다. 일반적으로, 후성 변형 도메인은 DNA 서열을 변화시키지 않으면서 히스톤 구조 및/또는 염색체 구조를 변경한다. 히스톤 및/또는 염색질 구조에서 변화는 유전자 발현에서 변화를 야기할 수 있다. 후성 변형의 실례는 제한 없이, 히스톤 단백질에서 리신 잔기의 아세틸화 또는 메틸화, 그리고 DNA에서 시토신 잔기의 메틸화를 포함한다. 적합한 후성 변형 도메인의 무제한적 실례는 히스톤 아세틸전달효소 도메인, 히스톤 탈아세틸화효소 도메인, 히스톤 메틸전달효소 도메인, 히스톤 탈메틸효소 도메인, DNA 메틸전달효소 도메인, 그리고 DNA 탈메틸효소 도메인을 포함한다.
작동체 도메인이 히스톤 아세틸전달효소 (HAT) 도메인인 구체예에서, HAT 도메인은 EP300 (즉, E1A 결합 단백질 p300), CREBBP (즉, CREB-결합 단백질), CDY1, CDY2, CDYL1, CLOCK, ELP3, ESA1, GCN5 (KAT2A), HAT1, KAT2B, KAT5, MYST1, MYST2, MYST3, MYST4, NCOA1, NCOA2, NCOA3, NCOAT, P/CAF, Tip60, TAFII250, 또는 TF3C4로부터 유래될 수 있다. 이와 같은 한 가지 구체예에서, HAT 도메인은 p300이다.
작동체 도메인이 후성 변형 도메인이고 CRISPR/Cas-유사 단백질이 Cas9 단백질로부터 유래되는 구체예에서, Cas9-유래된 단백질은 엔도뉴클레아제 활성이 제거되도록, 본원에서 논의된 바와 같이 변형될 수 있다. 가령, Cas9-유래된 단백질은 그들이 뉴클레아제 활성을 더 이상 소유하지 않도록, RuvC와 HNH 도메인을 돌연변이시킴으로써 변형될 수 있다.
(iii) 전사 활성화 도메인
다른 구체예에서, 융합 단백질의 작동체 도메인은 전사 활성화 도메인일 수 있다. 일반적으로, 전사 활성화 도메인은 유전자의 전사를 증가 및/또는 활성화시키기 위해 전사 제어 원소 및/또는 전사 조절 단백질 (즉, 전사 인자, RNA 중합효소 등)과 상호작용한다. 일부 구체예에서, 전사 활성화 도메인은 제한 없이, 단순 헤르페스 바이러스 VP16 활성화 도메인, VP64 (이것은 VP16의 사합체성 유도체이다), NFκB p65 활성화 도메인, p53 활성화 도메인 1과 2, CREB (cAMP 반응 원소 결합 단백질) 활성화 도메인, E2A 활성화 도메인, 그리고 NFAT (활성화된 T-세포의 핵 인자) 활성화 도메인일 수 있다. 다른 구체예에서, 전사 활성화 도메인은 Gal4, Gcn4, MLL, Rtg3, Gln3, Oaf1, Pip2, Pdr1, Pdr3, Pho4, 그리고 Leu3일 수 있다. 전사 활성화 도메인은 야생형이거나, 또는 본래 전사 활성화 도메인의 변형된 이형일 수 있다. 일부 구체예에서, 융합 단백질의 작동체 도메인은 VP16 또는 VP64 전사 활성화 도메인이다.
작동체 도메인이 전사 활성화 도메인이고 CRISPR/Cas-유사 단백질이 Cas9 단백질로부터 유래되는 구체예에서, Cas9-유래된 단백질은 엔도뉴클레아제 활성이 제거되도록, 본원에서 논의된 바와 같이 변형될 수 있다. 가령, Cas9-유래된 단백질은 그들이 뉴클레아제 활성을 더 이상 소유하지 않도록, RuvC와 HNH 도메인을 돌연변이시킴으로써 변형될 수 있다.
(iv) 전사 억제인자 도메인
또 다른 구체예에서, 융합 단백질의 작동체 도메인은 전사 억제인자 도메인일 수 있다. 일반적으로, 전사 억제인자 도메인은 유전자의 전사를 감소시키고 및/또는 종결하기 위해 전사 제어 원소 및/또는 전사 조절 단백질 (즉, 전사 인자, RNA 중합효소 등)과 상호작용한다. 적합한 전사 억제인자 도메인의 무제한적 실례는 유도성 cAMP 초기 억제인자 (ICER) 도메인, Kruppel-연관된 상자 A (KRAB-A) 억제인자 도메인, YY1 글리신 풍부한 억제인자 도메인, Sp1-유사 억제인자, E(spl) 억제인자, IκB 억제인자, 그리고 MeCP2를 포함한다.
작동체 도메인이 전사 억제인자 도메인이고 CRISPR/Cas-유사 단백질이 Cas9 단백질로부터 유래되는 구체예에서, Cas9-유래된 단백질은 엔도뉴클레아제 활성이 제거되도록, 본원에서 논의된 바와 같이 변형될 수 있다. 가령, cas9는 그들이 뉴클레아제 활성을 더 이상 소유하지 않도록, RuvC와 HNH 도메인을 돌연변이시킴으로써 변형될 수 있다.
(c) 추가 도메인
일부 구체예에서, 융합 단백질은 최소한 하나의 추가 도메인을 더욱 포함한다. 적합한 추가 도메인의 무제한적 실례는 핵 국지화 신호, 세포-투과성 또는 전위 도메인, 그리고 마커 도메인을 포함한다. 적합한 핵 국지화 신호, 세포-투과성 도메인, 그리고 마커 도메인의 무제한적 실례는 상기 섹션 (I)에서 제공된다.
(d) 융합 단백질 이합체
융합 단백질의 작동체 도메인이 개열 도메인인 구체예에서, 최소한 하나의 융합 단백질을 포함하는 이합체가 형성될 수 있다. 이합체는 동종이합체 또는 이형이합체일 수 있다. 일부 구체예에서, 이형이합체는 2개의 상이한 융합 단백질을 포함한다. 다른 구체예에서, 이형이합체는 1개의 융합 단백질 및 추가 단백질을 포함한다.
일부 구체예에서, 이합체는 2개의 융합 단백질 단위체가 일차성 아미노산 서열에 대하여 동일한 동종이합체이다. 이합체가 동종이합체인 한 구체예에서, Cas9-유래된 단백질은 그들의 엔도뉴클레아제 활성이 제거되도록, 다시 말하면, 그들이 기능적 뉴클레아제 도메인을 갖지 않도록 변형된다. Cas9-유래된 단백질이 그들의 엔도뉴클레아제 활성이 제거되도록 변형되는 일정한 구체예에서, 각 융합 단백질 단위체는 동일한 Cas9 유사 단백질 및 동일한 개열 도메인을 포함한다. 개열 도메인은 임의의 개열 도메인, 예를 들면, 본원에서 제공된 예시적인 개열 도메인 중에서 한 가지일 수 있다. 특정한 구체예에서, 개열 도메인은 FokI 개열 도메인 또는 변형된 FokI 개열 도메인이다. 이런 구체예에서, 특정한 유도 RNA는 융합 단백질 단위체를 상이하지만 가깝게 인접한 부위로 향하게 할 것이고, 따라서 이합체 형성 시에, 이들 두 단위체의 뉴클레아제 도메인은 표적 DNA 내에 이중 가닥 절단을 창출할 것이다.
다른 구체예에서, 이합체는 2개의 상이한 융합 단백질의 이형이합체이다. 가령, 각 융합 단백질의 CRISPR/Cas-유사 단백질은 상이한 CRISPR/Cas 단백질로부터 또는 상이한 세균 종의 이종상동성 CRISPR/Cas 단백질로부터 유래될 수 있다. 가령, 각 융합 단백질은 Cas9-유사 단백질을 포함할 수 있고, 상기 Cas9-유사 단백질은 상이한 세균 종으로부터 유래된다. 이들 구체예에서, 각 융합 단백질은 상이한 표적 부위 (즉, 프로토스페이서 및/또는 PAM 서열에 의해 특정됨)를 인식할 것이다. 가령, 유도 RNA는 이형이합체를 상이하지만 가깝게 인접한 부위에 위치시킬 수 있고, 따라서 그들의 뉴클레아제 도메인은 표적 DNA 내에 효과적인 이중 가닥 절단을 유발한다. 이형이합체는 또한, 틈내는 위치가 상이하도록, 틈내기 활성을 갖는 변형된 Cas9 단백질을 가질 수 있다.
대안으로, 이형이합체의 두 융합 단백질은 상이한 작동체 도메인을 가질 수 있다. 작동체 도메인이 개열 도메인인 구체예에서, 각 융합 단백질은 상이한 변형된 개열 도메인을 내포할 수 있다. 가령, 각 융합 단백질은 상기 섹션 (II)(b)(i)에서 상술된 바와 같이, 상이한 변형된 FokI 개열 도메인을 내포할 수 있다. 이들 구체예에서, Cas-9 단백질은 그들의 엔도뉴클레아제 활성이 제거되도록 변형될 수 있다.
당업자에 의해 인지되는 바와 같이, 이형이합체를 형성하는 이들 두 융합 단백질은 CRISPR/Cas-유사 단백질 도메인 및 작동체 도메인 둘 모두에서 상이할 수 있다.
상기-설명된 구체예 중에서 한 가지에서, 동종이합체 또는 이형이합체는 상기 상술된 바와 같이, 핵 국지화 신호 (NLSs), 세포-투과성, 전위 도메인 및 마커 도메인에서 선택되는 최소한 하나의 추가 도메인을 포함할 수 있다.
상기-설명된 구체예 중에서 한 가지에서, Cas9-유래된 단백질 중에서 한쪽 또는 양쪽이 엔도뉴클레아제 활성이 제거되거나 또는 변형되도록 변형될 수 있다.
다른 대안적 구체예에서, 이형이합체는 1개의 융합 단백질 및 추가 단백질을 포함한다. 가령, 추가 단백질은 뉴클레아제일 수 있다. 한 구체예에서, 뉴클레아제는 아연 핑거 뉴클레아제이다. 아연 핑거 뉴클레아제는 아연 핑거 DNA 결합 도메인 및 개열 도메인을 포함한다. 아연 핑거는 3개의 뉴클레오티드를 인식하고 이들에 결합한다. 아연 핑거 DNA 결합 도메인은 약 3개 아연 핑거 내지 약 7개 아연 핑거를 포함할 수 있다. 아연 핑거 DNA 결합 도메인은 자연적으로 발생하는 단백질로부터 유래되거나 또는 가공될 수 있다. 가령, Beerli et al. (2002) Nat. Biotechnol. 20:135-141; Pabo et al. (2001) Ann. Rev. Biochem. 70:313-340; Isalan et al. (2001) Nat. Biotechnol. 19:656-660; Segal et al. (2001) Curr. Opin. Biotechnol. 12:632-637; Choo et al. (2000) Curr. Opin. Struct. Biol. 10:411-416; Zhang et al. (2000) J. Biol. Chem. 275(43):33850-33860; Doyon et al. (2008) Nat. Biotechnol. 26:702-708; 그리고 Santiago et al. (2008) Proc. Natl. Acad. Sci. USA 105:5809-5814를 참조한다. 아연 핑거 뉴클레아제의 개열 도메인은 상기 섹션 (II)(b)(i)에서 상술된 임의의 개열 도메인일 수 있다. 예시적인 구체예에서, 아연 핑거 뉴클레아제의 개열 도메인은 FokI 개열 도메인 또는 변형된 FokI 개열 도메인이다. 이런 아연 핑거 뉴클레아제는 FokI 개열 도메인 또는 변형된 FokI 개열 도메인을 포함하는 융합 단백질과 이합체화할 것이다.
일부 구체예에서, 아연 핑거 뉴클레아제는 핵 국지화 신호, 세포-투과성 또는 전위 도메인에서 선택되는 최소한 하나의 추가 도메인을 포함할 수 있고, 이들은 상기 상술된다.
일정한 구체예에서, 상기 상술된 융합 단백질 중에서 한 가지 또는 최소한 하나의 융합 단백질을 포함하는 이합체는 최소한 하나의 유도 RNA를 포함하는 단백질-RNA 복합체의 부분일 수 있다. 유도 RNA는 융합 단백질의 CRISPR-Cas0 유사 단백질과 상호작용하여 상기 융합 단백질을 특정한 표적 부위로 향하게 하고, 여기서 유도 RNA의 5' 단부는 특정한 프로토스페이서 서열과 염기쌍을 이룬다.
(III) RNA-유도된 엔도뉴클레아제 또는 융합 단백질을 인코딩하는 핵산
본 발명의 다른 양상은 각각, 상기 섹션 (I)과 (II)에서 설명된 RNA-유도된 엔도뉴클레아제 또는 융합 단백질 중에서 한 가지를 인코딩하는 핵산을 제공한다. 핵산은 RNA 또는 DNA일 수 있다. 한 구체예에서, RNA-유도된 엔도뉴클레아제 또는 융합 단백질을 인코딩하는 핵산은 mRNA이다. mRNA는 5' 캡핑되고 및/또는 3' 폴리아데닐화될 수 있다. 다른 구체예에서, RNA-유도된 엔도뉴클레아제 또는 융합 단백질을 인코딩하는 핵산은 DNA이다. DNA는 벡터 내에 존재할 수 있다 (아래 참조).
RNA-유도된 엔도뉴클레아제 또는 융합 단백질을 인코딩하는 핵산은 관심되는 진핵 세포 또는 동물에서 단백질로의 효율적인 번역을 위해 코돈 최적화될 수 있다. 가령, 인간, 생쥐, 쥐, 햄스터, 소, 돼지, 고양이, 개, 어류, 양서류, 식물, 효모, 곤충, 기타 등등에서 발현을 위해 코돈 최적화될 수 있다 (참조: www.kazusa.or.jp/codon/에서 Codon Usage Database). 코돈 최적화를 위한 프로그램은 프리웨어로서 가용하다 (가령, genomes.urv.es/OPTIMIZER에서 OPTIMIZER; www.genscript.com/codon_opt.html에서 GenScript로부터 OptimumGene™). 상업적인 코돈 최적화 프로그램 역시 가용하다.
일부 구체예에서, RNA-유도된 엔도뉴클레아제 또는 융합 단백질을 인코딩하는 DNA는 최소한 하나의 프로모터 제어 서열에 작동가능하게 연결될 수 있다. 일부 반복에서, DNA 코딩 서열은 관심되는 진핵 세포 또는 동물에서 발현을 위해 프로모터 제어 서열에 작동가능하게 연결될 수 있다. 프로모터 제어 서열은 구조성, 조절된, 또는 조직 특이적일 수 있다. 적합한 구조성 프로모터 제어 서열에는 시토메갈로바이러스 극초기 프로모터 (CMV), 유인원 바이러스(SV40) 프로모터, 아데노바이러스 주요 후기 프로모터, 라우스 육종 바이러스 (RSV) 프로모터, 생쥐 유방 종양 바이러스 (MMTV) 프로모터, 포스포글리세린산 키나아제 (PGK) 프로모터, 연장 인자 (ED1)-알파 프로모터, 유비퀴틴 프로모터, 액틴 프로모터, 튜불린 프로모터, 면역글로불린 프로모터, 이들의 단편, 또는 전술한 것들의 임의의 조합이 포함되지만 이들에 한정되지 않는다. 적합한 조절된 프로모터 제어 서열의 실례는 제한 없이, 열 쇼크, 금속, 스테로이드, 항생제, 또는 알코올에 의해 조절된 것들을 포함한다. 조직 특이적 프로모터의 무제한적 실례는 B29 프로모터, CD14 프로모터, CD43 프로모터, CD45 프로모터, CD68 프로모터, 데스민 프로모터, 엘라스타아제-1 프로모터, 엔도글린 프로모터, 섬유결합소 프로모터, Flt-1 프로모터, GFAP 프로모터, GPIIb 프로모터, ICAM-2 프로모터, INF-β 프로모터, Mb 프로모터, NphsI 프로모터, OG-2 프로모터, SP-B 프로모터, SYN1 프로모터, 그리고 WASP 프로모터를 포함한다. 프로모터 서열은 야생형이거나 또는 더욱 효율적인 또는 유효한 발현을 위해 변형될 수 있다. 한 예시적인 구체예에서, 인코딩 DNA는 포유류 세포에서 구조성 발현을 위해 CMV 프로모터에 작동가능하게 연결될 수 있다.
일정한 구체예에서, RNA-유도된 엔도뉴클레아제 또는 융합 단백질을 인코딩하는 서열은 시험관내 mRNA 합성을 위한 파지 RNA 중합효소에 의해 인식되는 프로모터 서열에 작동가능하게 연결될 수 있다. 이런 구체예에서, 시험관내-전사된 RNA는 아래 섹션 (IV)와 (V)에서 상술된 방법에서 이용을 위해 정제될 수 있다. 가령, 프로모터 서열은 T7, T3, 또는 SP6 프로모터 서열 또는 T7, T3, 또는 SP6 프로모터 서열의 변이일 수 있다. 예시적인 구체예에서, 융합 단백질을 인코딩하는 DNA는 T7 RNA 중합효소를 이용한 시험관내 mRNA 합성을 위해 T7 프로모터에 작동가능하게 연결된다.
대안적 구체예에서, RNA-유도된 엔도뉴클레아제 또는 융합 단백질을 인코딩하는 서열은 세균 또는 진핵 세포에서 RNA-유도된 엔도뉴클레아제 또는 융합 단백질의 시험관내 발현을 위해 프로모터 서열에 작동가능하게 연결될 수 있다. 이런 구체예에서, 발현된 단백질은 아래 섹션 (IV)와 (V)에서 상술된 방법에서 이용을 위해 정제될 수 있다. 적합한 세균 프로모터는 제한 없이, T7 프로모터, lac 오페론 프로모터, trp 프로모터, 이들의 변이, 그리고 이들의 조합을 포함한다. 예시적인 세균 프로모터는 trp와 lac 프로모터의 하이브리드인 tac이다. 적합한 진핵 프로모터의 무제한적 실례는 상기에서 열거된다.
추가의 양상에서, RNA-유도된 엔도뉴클레아제 또는 융합 단백질을 인코딩하는 DNA는 또한, 폴리아데닐화 신호 (가령, SV40 polyA 신호, 소 성장 호르몬 (BGH) polyA 신호 등) 및/또는 최소한 하나의 전사 종결 서열에 연결될 수 있다. 부가적으로, RNA-유도된 엔도뉴클레아제 또는 융합 단백질을 인코딩하는 서열은 또한, 최소한 하나의 핵 국지화 신호, 최소한 하나의 세포-투과성 도메인, 및/또는 최소한 하나의 마커 도메인을 인코딩하는 서열에 연결될 수 있고, 이들은 상기 섹션 (I)에서 상술된다.
다양한 구체예에서, RNA-유도된 엔도뉴클레아제 또는 융합 단백질을 인코딩하는 DNA는 벡터 내에 존재할 수 있다. 적합한 벡터는 플라스미드 벡터, 파지미드, 코스미드, 인공/꼬마염색체, 트랜스포손, 그리고 바이러스 벡터 (가령, 렌티바이러스 벡터, 아데노 연관된 바이러스 벡터 등)를 포함한다. 한 구체예에서, RNA-유도된 엔도뉴클레아제 또는 융합 단백질을 인코딩하는 DNA는 플라스미드 벡터 내에 존재한다. 적합한 플라스미드 벡터의 무제한적 실례는 pUC, pBR322, pET, pBluescript, 그리고 이들의 변이체를 포함한다. 상기 벡터는 추가 발현 제어 서열 (가령, 인핸서 서열, Kozak 서열, 폴리아데닐화 서열, 전사 종결 서열 등), 선별가능 마커 서열 (가령, 항생제 내성 유전자), 복제 기점, 기타 등등을 포함할 수 있다. 추가 정보는 "Current Protocols in Molecular Biology" Ausubel et al., John Wiley & Sons, New York, 2003 또는 "Molecular Cloning: A Laboratory Manual" Sambrook & Russell, Cold Spring Harbor Press, Cold Spring Harbor, NY, 3rd edition, 2001에서 발견될 수 있다.
일부 구체예에서, RNA-유도된 엔도뉴클레아제 또는 융합 단백질을 인코딩하는 서열을 포함하는 발현 벡터는 유도 RNA를 인코딩하는 서열을 더욱 포함할 수 있다. 유도 RNA를 인코딩하는 서열은 일반적으로, 관심되는 세포 또는 배아에서 유도 RNA의 발현을 위해 최소한 하나의 전사 제어 서열에 작동가능하게 연결된다. 가령, 유도 RNA를 인코딩하는 DNA는 RNA 중합효소 III (Pol III)에 의해 인식되는 프로모터 서열에 작동가능하게 연결될 수 있다. 적합한 Pol III 프로모터의 실례에는 포유류 U6, U3, H1, 그리고 7SL RNA 프로모터가 포함되지만 이들에 한정되지 않는다.
(IV) RNA-유도된 엔도뉴클레아제를 이용하여 염색체 서열을 변경하기 위한 방 법
본 발명의 다른 양상은 진핵 세포 또는 배아에서 염색체 서열을 변경하기 위한 방법을 포괄한다. 상기 방법은 (i) 최소한 하나의 핵 국지화 신호를 포함하는 최소한 하나의 RNA-유도된 엔도뉴클레아제 또는 최소한 하나의 핵 국지화 신호를 포함하는 최소한 하나의 RNA-유도된 엔도뉴클레아제를 인코딩하는 핵산, (ii) 최소한 하나의 유도 RNA 또는 최소한 하나의 유도 RNA를 인코딩하는 DNA, 그리고, 임의선택적으로, (iii) 공여자 서열을 포함하는 최소한 하나의 공여자 폴리뉴클레오티드를 진핵 세포 또는 배아 내로 도입하는 것을 포함한다. 상기 방법은 각 유도 RNA가 염색체 서열 내에 표적화된 부위에 RNA-유도된 엔도뉴클레아제를 향하게 하도록 상기 세포 또는 배아를 배양하는 것을 더욱 포함하고, 여기서 상기 RNA-유도된 엔도뉴클레아제는 표적화된 부위 내에 이중 가닥 절단을 도입하고, 그리고 상기 이중 가닥 절단은 염색체 서열이 변형되도록 DNA 복구 과정에 의해 복구된다.
일부 구체예에서, 상기 방법은 1개의 RNA-유도된 엔도뉴클레아제 (또는 인코딩 핵산) 및 1개의 유도 RNA (또는 인코딩 DNA)를 세포 또는 배아 내로 도입하는 것을 포함할 수 있고, 여기서 RNA-유도된 엔도뉴클레아제는 표적화된 염색체 서열 내에 1개의 이중 가닥 절단을 도입한다. 임의선택적 공여자 폴리뉴클레오티드가 존재하지 않는 구체예에서, 염색체 서열 내에 이중 가닥 절단은 비상동성 말단 연결 (NHEJ) 복구 과정에 의해 복구될 수 있다. NHEJ가 오류 가능하기 때문에, 최소한 하나의 뉴클레오티드의 결실, 최소한 하나의 뉴클레오티드의 삽입, 최소한 하나의 뉴클레오티드의 치환, 또는 이들의 조합이 상기 절단의 복구 동안 일어날 수 있다. 따라서, 표적화된 염색체 서열은 변형되거나 또는 비활성화될 수 있다. 가령, 단일 뉴클레오티드 변화 (SNP)가 변경된 단백질 산물을 발생시킬 수 있거나, 또는 코딩 서열의 해독틀에서 이동이 단백질 산물이 만들어지지 않도록 상기 서열을 비활성화시키거나 또는 "녹아웃"시킬 수 있다. 임의선택적 공여자 폴리뉴클레오티드가 존재하는 구체예에서, 공여자 폴리뉴클레오티드 내에 공여자 서열은 이중 가닥 절단의 복구 동안 표적화된 부위에서 염색체 서열과 교환되거나 또는 이것 내로 통합될 수 있다. 가령, 공여자 서열이 각각, 염색체 서열의 표적화된 부위의 상류와 하류 서열과 실제적인 서열 동일성을 갖는 상류와 하류 서열과 측면에서 접하는 구체예에서, 공여자 서열은 상동 재조합 과정에 의해 매개된 복구 동안 표적화된 부위에서 염색체 서열과 교환되거나 또는 이것 내로 통합될 수 있다. 대안으로, 공여자 서열이 양립성 오버행과 측면에서 접하는 (또는 양립성 오버행이 RNA-유도된 엔도뉴클레아제에 의해 원지에서 산출되는) 구체예에서, 공여자 서열은 이중 가닥 절단의 복구 동안 비상동성 복구 과정에 의해 개열된 염색체 서열과 직접적으로 결찰될 수 있다. 염색체 서열 내로 공여자 서열의 교환 또는 통합은 표적화된 염색체 서열을 변경하거나 또는 외인성 서열을 세포 또는 배아의 염색체 서열 내로 도입한다.
다른 구체예에서, 상기 방법은 2개의 RNA-유도된 엔도뉴클레아제 (또는 인코딩 핵산) 및 2개의 유도 RNA (또는 인코딩 DNA)를 세포 또는 배아 내로 도입하는 것을 포함할 수 있고, 여기서 RNA-유도된 엔도뉴클레아제는 염색체 서열 내에 2개의 이중 가닥 절단을 도입한다. 도면 3B를 참조한다. 이들 두 절단은 여러 염기쌍 내에 있거나, 수십 개의 염기쌍 내에 있거나, 또는 수천 여 개의 염기쌍에 의해 분리될 수 있다. 임의선택적 공여자 폴리뉴클레오티드가 존재하지 않는 구체예에서, 결과의 이중 가닥 절단은 두 개열 부위 사이에 서열이 상실되고 및/또는 최소한 하나의 뉴클레오티드의 결실, 최소한 하나의 뉴클레오티드의 삽입, 최소한 하나의 뉴클레오티드의 치환, 또는 이들의 조합이 상기 절단(들)의 복구 동안 일어날 수 있도록 비상동성 복구 과정에 의해 복구될 수 있다. 임의선택적 공여자 폴리뉴클레오티드가 존재하는 구체예에서, 공여자 폴리뉴클레오티드 내에 공여자 서열은 상동성-기초된 복구 과정에 의해 (가령, 공여자 서열이 각각, 염색체 서열 내에 표적화된 부위의 상류와 하류 서열과 실제적인 서열 동일성을 갖는 상류와 하류 서열과 측면에서 접하는 구체예에서) 또는 비상동성 복구 과정에 의해 (가령, 공여자 서열이 양립성 오버행과 측면에서 접하는 구체예에서), 이중 가닥 절단의 복구 동안 염색체 서열과 교환되거나 또는 이것 내로 통합될 수 있다.
또 다른 구체예에서, 상기 방법은 이중 가닥 서열 (또는 인코딩 핵산)의 한쪽 가닥을 개열하기 위해 변형된 1개의 RNA-유도된 엔도뉴클레아제 및 2개의 유도 RNA (또는 인코딩 DNA)를 세포 또는 배아 내로 도입하는 것을 포함할 수 있고, 여기서 각 유도 RNA는 RNA-유도된 엔도뉴클레아제를 특정한 표적 부위로 향하게 하고, 상기 부위에서 변형된 엔도뉴클레아제는 이중 가닥 염색체 서열의 한쪽 가닥을 개열하고 (즉, 틈내기하고), 그리고 여기서 2개의 틈은 마주보는 가닥 내에 있고 이중 가닥 절단을 구성할 만큼 충분히 근접하게 위치한다. 도면 3A를 참조한다. 임의선택적 공여자 폴리뉴클레오티드가 존재하지 않는 구체예에서, 결과의 이중 가닥 절단은 최소한 하나의 뉴클레오티드의 결실, 최소한 하나의 뉴클레오티드의 삽입, 최소한 하나의 뉴클레오티드의 치환, 또는 이들의 조합이 상기 절단의 복구 동안 일어날 수 있도록 비상동성 복구 과정에 의해 복구될 수 있다. 임의선택적 공여자 폴리뉴클레오티드가 존재하는 구체예에서, 공여자 폴리뉴클레오티드 내에 공여자 서열은 상동성-기초된 복구 과정에 의해 (가령, 공여자 서열이 각각, 염색체 서열 내에 표적화된 부위의 상류와 하류 서열과 실제적인 서열 동일성을 갖는 상류와 하류 서열과 측면에서 접하는 구체예에서) 또는 비상동성 복구 과정에 의해 (가령, 공여자 서열이 양립성 오버행과 측면에서 접하는 구체예에서), 이중 가닥 절단의 복구 동안 염색체 서열과 교환되거나 또는 이것 내로 통합될 수 있다.
(a) RNA-유도된 엔도뉴클레아제
상기 방법은 최소한 하나의 핵 국지화 신호를 포함하는 최소한 하나의 RNA-유도된 엔도뉴클레아제 또는 최소한 하나의 핵 국지화 신호를 포함하는 최소한 하나의 RNA-유도된 엔도뉴클레아제를 인코딩하는 핵산을 세포 또는 배아 내로 도입하는 것을 포함한다. 이런 RNA-유도된 엔도뉴클레아제 및 RNA-유도된 엔도뉴클레아제를 인코딩하는 핵산은 각각, 상기 섹션 (I)과 (III)에서 설명된다.
일부 구체예에서, RNA-유도된 엔도뉴클레아제는 단리된 단백질로서 세포 또는 배아 내로 도입될 수 있다. 이런 구체예에서, RNA-유도된 엔도뉴클레아제는 단백질의 세포 흡수를 용이하게 하는 최소한 하나의 세포-투과성 도메인을 더욱 포함할 수 있다. 다른 구체예에서, RNA-유도된 엔도뉴클레아제는 mRNA 분자로서 세포 또는 배아 내로 도입될 수 있다. 또 다른 구체예에서, RNA-유도된 엔도뉴클레아제는 DNA 분자로서 세포 또는 배아 내로 도입될 수 있다. 일반적으로, 융합 단백질을 인코딩하는 DNA 서열은 관심되는 세포 또는 배아에서 기능하는 프로모터 서열에 작동가능하게 연결된다. DNA 서열은 선형일 수 있거나, 또는 DNA 서열은 벡터의 부분일 수 있다. 또 다른 구체예에서, 융합 단백질은 상기 융합 단백질 및 유도 RNA를 포함하는 RNA-단백질 복합체로서 세포 또는 배아 내로 도입될 수 있다.
대안적 구체예에서, RNA-유도된 엔도뉴클레아제를 인코딩하는 DNA는 유도 RNA를 인코딩하는 서열을 더욱 포함할 수 있다. 일반적으로, RNA-유도된 엔도뉴클레아제 및 유도 RNA를 인코딩하는 각 서열은 각각, 세포 또는 배아에서 RNA-유도된 엔도뉴클레아제 및 유도 RNA의 발현을 허용하는 적절한 프로모터 제어 서열에 작동가능하게 연결된다. RNA-유도된 엔도뉴클레아제 및 유도 RNA를 인코딩하는 DNA 서열은 추가 발현 제어, 조절, 및/또는 처리 서열(들)을 더욱 포함할 수 있다. RNA-유도된 엔도뉴클레아제 및 유도 RNA를 인코딩하는 DNA 서열은 선형이거나 또는 벡터의 부분일 수 있다
(b) 유도 RNA
상기 방법은 또한, 최소한 하나의 유도 RNA 또는 최소한 하나의 유도 RNA를 인코딩하는 DNA를 세포 또는 배아 내로 도입하는 것을 포함한다. 유도 RNA는 RNA-유도된 엔도뉴클레아제와 상호작용하여 엔도뉴클레아제를 특정한 표적 부위로 향하게 하고, 상기 부위에서 유도 RNA의 5' 단부는 염색체 서열 내에 특정한 프로토스페이서 서열과 염기쌍을 이룬다.
각 유도 RNA는 3가지 영역을 포함한다: 염색체 서열 내에 표적 부위에 상보적인 5' 단부에서 첫 번째 영역, 줄기 루프 구조를 형성하는 두 번째 내부 영역, 그리고 본질적으로 단일 가닥으로 남아있는 세 번째 3' 영역. 각 유도 RNA의 첫 번째 영역은 각 유도 RNA가 융합 단백질을 특정한 표적 부위로 유도하도록 상이하다. 각 유도 RNA의 두 번째와 세 번째 영역은 모든 유도 RNA에서 동일할 수 있다.
유도 RNA의 첫 번째 영역은 유도 RNA의 첫 번째 영역이 표적 부위와 염기쌍을 이룰 수 있도록, 염색체 서열 내에 표적 부위에서 서열 (즉, 프로토스페이서 서열)에 상보적이다. 다양한 구체예에서, 유도 RNA의 첫 번째 영역은 약 10개 뉴클레오티드 내지 약 25개 보다 많은 뉴클레오티드를 포함할 수 있다. 가령, 유도 RNA의 첫 번째 영역 및 염색체 서열 내에 표적 부위 사이에 염기 대합의 영역은 길이에서 약 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 22, 23, 24, 25개, 또는 25개 보다 많은 뉴클레오티드 일 수 있다. 예시적인 구체예에서, 유도 RNA의 첫 번째 영역은 길이에서 약 19, 20, 또는 21개 뉴클레오티드이다.
유도 RNA는 또한, 이차 구조를 형성하는 두 번째 영역을 포함한다. 일부 구체예에서, 이차 구조는 줄기 (또는 헤어핀) 및 루프를 포함한다. 루프와 줄기의 길이는 변할 수 있다. 가령, 루프는 길이에서 약 3 내지 약 10개 뉴클레오티드 범위에서 변할 수 있고, 그리고 줄기는 길이에서 약 6 내지 약 20개 염기쌍 범위에서 변할 수 있다. 줄기는 1 내지 약 10개 뉴클레오티드의 하나 또는 그 이상의 돌출을 포함할 수 있다. 따라서, 두 번째 영역의 전반적인 길이는 길이에서 약 16 내지 약 60개 뉴클레오티드 범위에서 변할 수 있다. 예시적인 구체예에서, 루프는 길이에서 약 4개 뉴클레오티드이고, 그리고 줄기는 약 12개 염기쌍을 포함한다.
유도 RNA는 또한, 본질적으로 단일 가닥으로 남아있는 3' 단부에서 세 번째 영역을 포함한다. 따라서, 세 번째 영역은 관심되는 세포 내에 임의의 염색체 서열에 대한 상보성을 갖지 않고, 그리고 유도 RNA의 나머지 부분에 상보성을 갖지 않는다. 세 번째 영역의 길이는 변할 수 있다. 일반적으로, 세 번째 영역은 길이에서 약 4개 보다 많은 뉴클레오티드이다. 가령, 세 번째 영역의 길이는 길이에서 약 5 내지 약 60개 뉴클레오티드 범위에서 변할 수 있다.
유도 RNA의 두 번째와 세 번째 영역 (또한, 보편적인 또는 골격 영역으로 불린다)의 합동된 길이는 길이에서 약 30 내지 약 120개 뉴클레오티드 범위에서 변할 수 있다. 한 양상에서, 유도 RNA의 두 번째와 세 번째 영역의 합동된 길이는 길이에서 약 70 내지 약 100개 뉴클레오티드 범위에서 변한다.
일부 구체예에서, 유도 RNA는 3가지 영역 모두를 포함하는 단일 분자를 포함한다. 다른 구체예에서, 유도 RNA는 2개의 별개의 분자를 포함할 수 있다. 첫 번째 RNA 분자는 유도 RNA의 첫 번째 영역 및 유도 RNA의 두 번째 영역의 "줄기"의 한쪽 절반을 포함할 수 있다. 두 번째 RNA 분자는 유도 RNA의 두 번째 영역의 "줄기"의 다른 절반 및 유도 RNA의 세 번째 영역을 포함할 수 있다. 따라서, 이러한 구체예에서, 첫 번째와 두 번째 RNA 분자는 각각, 서로에 상보적인 뉴클레오티드의 서열을 내포한다. 가령, 한 구체예에서, 첫 번째와 두 번째 RNA 분자는 각각, 다른 서열에 염기쌍을 이루고 기능적 유도 RNA를 형성하는 서열 (약 6 내지 약 20개 뉴클레오티드의)을 포함한다.
일부 구체예에서, 유도 RNA는 RNA 분자로서 세포 또는 배아 내로 도입될 수 있다. RNA 분자는 시험관내에서 전사될 수 있다. 대안으로, RNA 분자는 화학적으로 합성될 수 있다.
다른 구체예에서, 유도 RNA는 DNA 분자로서 세포 또는 배아 내로 도입될 수 있다. 이런 사례에서, 유도 RNA를 인코딩하는 DNA는 관심되는 세포 또는 배아에서 유도 RNA의 발현을 위한 프로모터 제어 서열에 작동가능하게 연결될 수 있다. 가령, RNA 코딩 서열은 RNA 중합효소 III (Pol III)에 의해 인식되는 프로모터 서열에 작동가능하게 연결될 수 있다. 적합한 Pol III 프로모터의 실례에는 포유류 U6 또는 H1 프로모터가 포함되지만 이들에 한정되지 않는다. 예시적인 구체예에서, RNA 코딩 서열은 생쥐 또는 인간 U6 프로모터에 연결된다. 다른 예시적인 구체예에서, RNA 코딩 서열은 생쥐 또는 인간 H1 프로모터에 연결된다.
유도 RNA를 인코딩하는 DNA 분자는 선형 또는 환상일 수 있다. 일부 구체예에서, 유도 RNA를 인코딩하는 DNA 서열은 벡터의 부분일 수 있다. 적합한 벡터는 플라스미드 벡터, 파지미드, 코스미드, 인공/꼬마염색체, 트랜스포손, 그리고 바이러스 벡터를 포함한다. 예시적인 구체예에서, RNA-유도된 엔도뉴클레아제를 인코딩하는 DNA는 플라스미드 벡터 내에 존재한다. 적합한 플라스미드 벡터의 무제한적 실례는 pUC, pBR322, pET, pBluescript, 그리고 이들의 변이체를 포함한다. 벡터는 추가 발현 제어 서열 (가령, 인핸서 서열, Kozak 서열, 폴리아데닐화 서열, 전사 종결 서열 등), 선별가능 마커 서열 (가령, 항생제 내성 유전자), 복제 기점, 기타 등등을 포함할 수 있다.
RNA-유도된 엔도뉴클레아제와 유도 RNA 둘 모두 DNA 분자로서 세포 내로 도입되는 구체예에서, 각각은 별개의 분자의 부분 (가령, 융합 단백질 코딩 서열을 내포하는 하나의 벡터 및 유도 RNA 코딩 서열을 내포하는 두 번째 벡터)일 수 있거나 또는 둘 모두 동일한 분자의 부분 (가령, 융합 단백질과 유도 RNA 둘 모두에 대한 코딩 (및 조절) 서열을 내포하는 하나의 벡터)일 수 있다.
표적 부위
유도 RNA와 함께 RNA-유도된 엔도뉴클레아제는 염색체 서열 내에서 표적 부위에 지향되고, 여기서 RNA-유도된 엔도뉴클레아제는 염색체 서열 내에 이중 가닥 절단을 도입한다. 표적 부위는 상기 서열 바로 뒤에 (하류) 공통 서열이 뒤따른다는 점을 제외하고, 서열 제한을 갖지 않는다. 이러한 공통 서열은 또한, 프로토스페이서 인접한 모티프 (PAM)로서 알려져 있다. PAM의 실례에는 NGG, NGGNG, 그리고 NNAGAAW (여기서 N은 임의의 뉴클레오티드로서 규정되고, 그리고 W는 A 또는 T로서 규정된다)가 포함되지만 이들에 한정되지 않는다. 상기 섹션 (IV)(b)에서 상술된 바와 같이, 유도 RNA의 첫 번째 영역 (5' 단부에서)은 표적 서열의 프로토스페이서에 상보적이다. 전형적으로, 유도 RNA의 첫 번째 영역은 길이에서 약 19 내지 21개 뉴클레오티드이다. 따라서, 일정한 양상에서, 염색체 서열 내에 표적 부위의 서열은 5'-N19-21-NGG-3'이다. PAM은 이탤릭체로 표시된다.
표적 부위는 유전자의 코딩 영역, 유전자의 인트론, 유전자의 제어 영역, 유전자 사이에 비코딩 영역 등에 있을 수 있다. 유전자는 단백질 코딩 유전자 또는 RNA 코딩 유전자일 수 있다. 유전자는 관심되는 임의의 유전자일 수 있다.
임의선택적 공여자 폴리뉴클레오티드
일부 구체예에서, 상기 방법은 최소한 하나의 공여자 폴리뉴클레오티드를 배아 내로 도입하는 것을 더욱 포함한다. 공여자 폴리뉴클레오티드는 최소한 하나의 공여자 서열을 포함한다. 일부 양상에서, 공여자 폴리뉴클레오티드의 공여자 서열은 내인성 또는 선천적 염색체 서열에 상응한다. 가령, 공여자 서열은 표적화된 부위에서 또는 이와 가까운 염색체 서열의 부분과 본질적으로 동일할 수 있지만, 최소한 하나의 뉴클레오티드 변화를 포함한다. 따라서, 공여자 서열은 선천적 서열과의 통합 또는 교환 시에, 표적화된 염색체 위치에서 서열이 최소한 하나의 뉴클레오티드 변화를 포함하도록, 표적화된 부위에서 야생형 서열의 변형된 이형을 포함할 수 있다. 가령, 변화는 하나 또는 그 이상의 뉴클레오티드의 삽입, 하나 또는 그 이상의 뉴클레오티드의 결실, 하나 또는 그 이상의 뉴클레오티드의 치환, 또는 이들의 조합일 수 있다. 변형된 서열의 통합의 결과로서, 세포 또는 배아/동물은 표적화된 염색체 서열로부터 변형된 유전자 산물을 생산할 수 있다.
다른 양상에서, 공여자 폴리뉴클레오티드의 공여자 서열은 외인성 서열에 상응한다. 본원에서 이용된 바와 같이, "외인성" 서열은 세포 또는 배아에 선천적이지 않은 서열, 또는 세포 또는 배아의 유전체에서 선천적 위치가 상이한 위치에 있는 서열을 지칭한다. 가령, 외인성 서열은 유전체 내로 통합 시에, 세포 또는 배아/동물이 통합된 서열에 의해 코딩된 단백질을 발현할 수 있도록, 외인성 프로모터 제어 서열에 작동가능하게 연결될 수 있는 단백질 코딩 서열을 포함할 수 있다. 대안으로, 외인성 서열은 이의 발현이 내인성 프로모터 제어 서열에 의해 조절되도록 염색체 서열 내로 통합될 수 있다. 다른 반복에서, 외인성 서열은 전사 제어 서열, 다른 발현 제어 서열, RNA 코딩 서열, 기타 등등일 수 있다. 염색체 서열 내로 외인성 서열의 통합은 "녹인"으로 명명된다.
당업자에 의해 인지될 수 있는 바와 같이, 공여자 서열의 길이는 변할 수 있고 변할 것이다. 가령, 공여자 서열은 길이에서 여러 뉴클레오티드에서부터 수백 개의 뉴클레오티드 내지 수십만 개의 뉴클레오티드까지 변할 수 있다.
상류와 하류 서열을 포함하는 공여자 폴리뉴클레오티드. 일부 구체예에서, 공여자 폴리뉴클레오티드 내에 공여자 서열은 각각, 염색체 서열 내에 표적화된 부위의 상류와 하류에 위치된 서열에 실제적인 서열 동일성을 갖는 상류 서열 및 하류 서열과 측면에서 접한다. 이들 서열 유사성 때문에, 공여자 폴리뉴클레오티드의 상류와 하류 서열은 공여자 서열이 염색체 서열 내로 통합 (또는 이것과 교환)될 수 있도록, 공여자 폴리뉴클레오티드와 표적화된 염색체 서열 사이에 상동성 재조합을 허용한다.
상류 서열은 본원에서 이용된 바와 같이, 표적화된 부위의 상류에 염색체 서열과 실제적인 서열 동일성을 공유하는 핵산 서열을 지칭한다. 유사하게, 하류 서열은 표적화된 부위의 하류에 염색체 서열과 실제적인 서열 동일성을 공유하는 핵산 서열을 지칭한다. 본원에서 이용된 바와 같이, 관용구 "실제적인 서열 동일성"은 최소한 약 75% 서열 동일성을 갖는 서열을 지칭한다. 따라서, 공여자 폴리뉴클레오티드에서 상류와 하류 서열은 표적화된 부위의 상류 또는 하류에 서열과 약 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성을 가질 수 있다. 예시적인 구체예에서, 공여자 폴리뉴클레오티드에서 상류와 하류 서열은 표적화된 부위의 상류 또는 하류에 염색체 서열과 약 95% 또는 100% 서열 동일성을 가질 수 있다. 한 구체예에서, 상류 서열은 표적화된 부위의 즉시 상류에 위치된 (즉, 표적화된 부위에 인접한) 염색체 서열과 실제적인 서열 동일성을 공유한다. 다른 구체예에서, 상류 서열은 표적화된 부위로부터 상류에 약 100개 뉴클레오티드 내에 위치되는 염색체 서열과 실제적인 서열 동일성을 공유한다. 따라서, 예로서, 상류 서열은 표적화된 부위로부터 상류에 약 1 내지 약 20, 약 21 내지 약 40, 약 41 내지 약 60, 약 61 내지 약 80, 또는 약 81 내지 약 100개 뉴클레오티드 내에 위치되는 염색체 서열과 실제적인 서열 동일성을 공유할 수 있다. 한 구체예에서, 하류 서열은 표적화된 부위의 즉시 하류에 위치된 (즉, 표적화된 부위에 인접한) 염색체 서열과 실제적인 서열 동일성을 공유한다. 다른 구체예에서, 하류 서열은 표적화된 부위로부터 하류에 약 100개 뉴클레오티드 내에 위치되는 염색체 서열과 실제적인 서열 동일성을 공유한다. 따라서, 예로서, 하류 서열은 표적화된 부위로부터 하류에 약 1 내지 약 20, 약 21 내지 약 40, 약 41 내지 약 60, 약 61 내지 약 80, 또는 약 81 내지 약 100개 뉴클레오티드 내에 위치되는 염색체 서열과 실제적인 서열 동일성을 공유할 수 있다.
각 상류 또는 하류 서열은 길이에서 약 20개 뉴클레오티드 내지 약 5000개 뉴클레오티드 범위에서 변할 수 있다. 일부 구체예에서, 상류와 하류 서열은 약 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400, 2500, 2600, 2800, 3000, 3200, 3400, 3600, 3800, 4000, 4200, 4400, 4600, 4800, 또는 5000개 뉴클레오티드를 포함할 수 있다. 예시적인 구체예에서, 상류와 하류 서열은 길이에서 약 50 내지 약 1500개 뉴클레오티드 범위에서 변할 수 있다.
표적화된 염색체 서열에 서열 유사성을 갖는 상류와 하류 서열을 포함하는 공여자 폴리뉴클레오티드는 선형 또는 환상일 수 있다. 공여자 폴리뉴클레오티드가 환상인 구체예에서, 이것은 벡터의 부분일 수 있다. 가령, 벡터는 플라스미드 벡터일 수 있다.
표적화된 개열 부위(들)을 포함하는 공여자 폴리뉴클레오티드. 다른 구체예에서, 공여자 폴리뉴클레오티드는 RNA-유도된 엔도뉴클레아제에 의해 인식되는 최소한 하나의 표적화된 개열 부위를 부가적으로 포함할 수 있다. 공여자 폴리뉴클레오티드에 부가된 표적화된 개열 부위는 공여자 서열의 상류 또는 하류 또는 상류와 하류 둘 모두에 배치될 수 있다. 가령, 공여자 서열은 RNA-유도된 엔도뉴클레아제에 의한 개열 시에, 공여자 서열이 RNA-유도된 엔도뉴클레아제에 의한 개열 시에 산출된 염색체 서열 내에 것들과 양립하는 오버행과 측면에서 접하도록, 표적화된 개열 부위와 측면에서 접할 수 있다. 따라서, 공여자 서열은 비상동성 복구 과정에 의한 이중 가닥 절단의 복구 동안 개열된 염색체 서열과 결찰될 수 있다. 일반적으로, 표적화된 개열 부위(들)를 포함하는 공여자 폴리뉴클레오티드는 환상일 것이다 (가령, 플라스미드 벡터의 부분일 수 있다).
임의선택적 오버행을 갖는 짧은 공여자 서열을 포함하는 공여자 폴리뉴클레오티드. 다른 대안적 구체예에서, 공여자 폴리뉴클레오티드는 RNA-유도된 엔도뉴클레아제에 의해 산출된 오버행과 양립하는 임의선택적 짧은 오버행을 갖는 짧은 공여자 서열을 포함하는 선형 분자일 수 있다. 이런 구체예에서, 공여자 서열은 이중 가닥 절단의 복구 동안 개열된 염색체 서열과 직접적으로 결찰될 수 있다. 일부 경우에, 공여자 서열은 약 1,000개보다 적거나, 약 500개보다 적거나, 약 250개보다 적거나, 또는 약 100개 보다 적은 뉴클레오티드일 수 있다. 일정한 경우에, 공여자 폴리뉴클레오티드는 평활 말단을 갖는 짧은 공여자 서열을 포함하는 선형 분자일 수 있다. 다른 반복에서, 공여자 폴리뉴클레오티드는 5' 및/또는 3' 오버행을 갖는 짧은 공여자 서열을 포함하는 선형 분자일 수 있다. 오버행은 1, 2, 3, 4, 또는 5개 뉴클레오티드를 포함할 수 있다.
전형적으로, 공여자 폴리뉴클레오티드는 DNA일 것이다. DNA는 단일 가닥 또는 이중 가닥 및/또는 선형 또는 환상일 수 있다. 공여자 폴리뉴클레오티드는 DNA 플라스미드, 세균 인공 염색체 (BAC), 효모 인공 염색체 (YAC), 바이러스 벡터, DNA의 선형 조각, PCR 단편, 나신 핵산, 또는 전달 운반제, 예를 들면, 리포솜 또는 폴록사머로 복합화된 핵산일 수 있다. 일정한 구체예에서, 공여자 서열을 포함하는 공여자 폴리뉴클레오티드는 플라스미드 벡터의 부분일 수 있다. 이들 환경 중에서 한 가지에서, 공여자 서열을 포함하는 공여자 폴리뉴클레오티드는 최소한 하나의 추가 서열을 더욱 포함할 수 있다.
(e) 세포 또는 배아 내로 도입
RNA-표적화된 엔도뉴클레아제(들) (또는 인코딩 핵산), 유도 RNA(들) (또는 인코딩 DNA), 그리고 임의선택적 공여자 폴리뉴클레오티드(들)는 다양한 수단에 의해 세포 또는 배아 내로 도입될 수 있다. 일부 구체예에서, 세포 또는 배아는 형질감염된다. 적합한 형질감염 방법은 인산칼슘-매개된 형질감염, 뉴클레오펙션 (또는 전기천공), 양이온성 중합체 형질감염 (가령, DEAE-덱스트란 또는 폴리에틸렌이민), 바이러스 형질도입, 비로솜 형질감염, 비리온 형질감염, 리포솜 형질감염, 양이온성 리포솜 형질감염, 면역리포솜 형질감염, 비리포솜 지질 형질감염, 덴드리머 형질감염, 열 쇼크 형질감염, 마그네토펙션, 리포펙션, 유전자 총 전달, 임팔레펙션, 소노포레이션, 광학적 형질감염, 그리고 핵산의 소유 작용제-증강된 흡수를 포함한다. 형질감염 방법은 당분야에서 널리 공지된다 (가령, "Current Protocols in Molecular Biology" Ausubel et al., John Wiley & Sons, New York, 2003 또는 "Molecular Cloning: A Laboratory Manual" Sambrook & Russell, Cold Spring Harbor Press, Cold Spring Harbor, NY, 3rd edition, 2001을 참조한다). 다른 구체예에서, 이들 분자는 현미주입에 의해 세포 또는 배아 내로 도입된다. 전형적으로, 배아는 관심되는 종의 수태된 단세포 단계 배아이다. 가령, 이들 분자는 단세포 배아의 전핵 내로 주입될 수 있다.
RNA-표적화된 엔도뉴클레아제 (들) (또는 인코딩 핵산), 유도 RNA(들) (또는 유도 RNA를 인코딩하는 DNA), 그리고 임의선택적 공여자 폴리뉴클레오티드(들)는 동시에 또는 순차적으로 세포 또는 배아 내로 도입될 수 있다. RNA-표적화된 엔도뉴클레아제 (들) (또는 인코딩 핵산) 내지 유도 RNA(들) (또는 인코딩 DNA)의 비율은 일반적으로, 이들이 RNA-단백질 복합체를 형성할 수 있도록 대략 화학양론적일 것이다. 한 구체예에서, RNA-표적화된 엔도뉴클레아제를 인코딩하는 DNA 및 유도 RNA를 인코딩하는 DNA는 플라스미드 벡터 내에서 함께 전달된다.
(f) 세포 또는 배아 배양
상기 방법은 유도 RNA(들)가 RNA-유도된 엔도뉴클레아제(들)를 염색체 서열 내에 표적화된 부위(들)로 향하게 하고, 그리고 RNA-유도된 엔도뉴클레아제(들)가 염색체 서열 내에 최소한 하나의 이중 가닥 절단을 도입하도록, 세포 또는 배아를 적절한 조건 하에 유지하는 것을 더욱 포함한다. 이중 가닥 절단은 염색체 서열이 최소한 하나의 뉴클레오티드의 결실, 최소한 하나의 뉴클레오티드의 삽입, 최소한 하나의 뉴클레오티드의 치환, 또는 이들의 조합에 의해 변형되도록 DNA 복구 과정에 의해 복구될 수 있다.
공여자 폴리뉴클레오티드가 세포 또는 배아 내로 도입되는 구체예에서, 이중 가닥 절단은 비상동성 말단 연결 (NHEJ) 복구 과정에 의해 복구될 수 있다. NHEJ가 오류 가능하기 때문에, 최소한 하나의 뉴클레오티드의 결실, 최소한 하나의 뉴클레오티드의 삽입, 최소한 하나의 뉴클레오티드의 치환, 또는 이들의 조합이 상기 절단의 복구 동안 일어날 수 있다. 따라서, 염색체 서열에서 서열이 코딩 영역의 해독틀이 이동될 수 있고, 그리고 염색체 서열이 비활성화되거나 또는 "적중"되도록 변형될 수 있다. 비활성화된 단백질-코딩 염색체 서열은 야생형 염색체 서열에 의해 코딩된 단백질을 발생시키지 못한다.
상류와 하류 서열을 포함하는 공여자 폴리뉴클레오티드가 세포 또는 배아 내로 도입되는 구체예에서, 이중 가닥 절단은 공여자 서열이 염색체 서열 내로 통합되도록 상동 재조합 (HDR) 과정에 의해 복구될 수 있다. 따라서, 외인성 서열이 세포 또는 배아의 유전체 내로 통합될 수 있거나, 또는 표적화된 염색체 서열이 야생형 염색체 서열에 대한 변형된 서열의 교환에 의해 변형될 수 있다.
표적화된 개열 부위를 포함하는 공여자 폴리뉴클레오티드가 세포 또는 배아 내로 도입되는 구체예에서, RNA-유도된 엔도뉴클레아제는 표적화된 염색체 서열과 공여자 폴리뉴클레오티드 둘 모두를 개열할 수 있다. 선형 공여자 폴리뉴클레오티드는 NHEJ 과정을 통해, 공여자 폴리뉴클레오티드 및 개열된 염색체 서열 사이에 결찰에 의해 이중 가닥 절단의 부위에서 염색체 서열 내로 통합될 수 있다.
짧은 공여자 서열을 포함하는 선형 공여자 폴리뉴클레오티드가 세포 또는 배아 내로 도입되는 구체예에서, 짧은 공여자 서열은 NHEJ 과정을 통해, 이중 가닥 절단의 부위에서 염색체 서열 내로 통합될 수 있다. 통합은 짧은 공여자 서열 및 이중 가닥 절단의 부위에서 염색체 서열 사이에 평활 말단의 결찰을 통해 진행할 수 있다. 대안으로, 통합은 개열된 염색체 서열에서 RNA-표적화 엔도뉴클레아제에 의해 산출된 것들과 양립하는 오버행과 측면에서 접하는 짧은 공여자 서열 사이에 점착 말단 (즉, 5' 또는 3' 오버행을 갖는)의 결찰을 통해 진행할 수 있다.
일반적으로, 세포는 세포 성장 및/또는 유지에 적절한 조건 하에 유지된다. 적합한 세포 배양 조건은 당분야에서 널리 공지되고 예로서, Santiago et al. (2008) PNAS 105:5809-5814; Moehle et al. (2007) PNAS 104:3055-3060; Urnov et al. (2005) Nature 435:646-651; 그리고 Lombardo et al (2007) Nat. Biotechnology 25:1298-1306에서 설명된다. 당업자는 세포를 배양하기 위한 방법이 당분야에서 공지되고 세포 유형에 따라 변할 수 있고 변할 것이라는 것을 인지한다. 모든 사례에서, 특정 세포 유형에 대한 최선의 기술을 결정하기 위해 일과적인 최적화가 이용될 수 있다.
배아는 시험관내에서 배양될 수 있다 (가령, 세포 배양에서). 전형적으로, 배아는 적절한 온도에서, 그리고 필요하면, RNA 엔도뉴클레아제 및 유도 RNA의 발현을 허용하는데 필요한 O2/CO2 비율을 갖는 적절한 배지에서 배양된다. 배지의 적합한 무제한적 실례는 M2, M16, KSOM, BMOC, 그리고 HTF 배지를 포함한다. 당업자는 배양 조건이 배아의 종류에 따라 변할 수 있고 변할 것이라는 것을 인지할 것이다. 모든 사례에서, 특정 종류의 배아에 대한 최선의 배양 조건을 결정하기 위해 일과적인 최적화가 이용될 수 있다. 일부 경우에, 세포주는 시험관내-배양된 배아 (가령, 배아 줄기 세포주)로부터 유래될 수 있다.
대안으로, 배아는 배아를 암컷 숙주의 자궁 내로 이전함으로써 생체내에서 배양될 수 있다. 대체로 말하면, 암컷 숙주는 배아와 동일한 또는 유사한 종으로부터 유래된다. 바람직하게는, 암컷 숙주는 상상 임신이다. 상상 임신 암컷 숙주를 준비하는 방법은 당분야에서 공지된다. 부가적으로, 배아를 암컷 숙주 내로 이전하는 방법은 알려져 있다. 배아를 생체내에서 배양하는 것은 배아가 발달하도록 허용하고, 그리고 배아로부터 유래된 동물의 생존 출생을 유발할 수 있다. 이런 동물은 신체의 모든 세포에서 변형된 염색체 서열을 포함할 것이다.
(g) 세포와 배아 유형
다양한 진핵 세포와 배아가 상기 방법에서 이용하기에 적합하다. 가령, 세포는 인간 세포, 비-인간 포유류 세포, 비포유류 척추동물 세포, 무척추동물 세포, 곤충 세포, 식물 세포, 효모 세포, 또는 단일 세포 진핵 생물체일 수 있다. 일반적으로, 배아는 비-인간 포유류 배아이다. 특정한 구체예에서, 배아는 단세포 비-인간 포유류 배아이다. 단세포 배아를 비롯한 예시적인 포유류 배아는 제한 없이, 생쥐, 쥐, 햄스터, 설치류, 토끼, 고양이, 개, 양, 돼지, 소, 말, 그리고 영장류 배아를 포함한다. 또 다른 구체예에서, 세포는 줄기 세포일 수 있다. 적합한 줄기 세포는 제한 없이, 배아 줄기 세포, ES-유사 줄기 세포, 태아 줄기 세포, 성체 줄기 세포, 만능성 줄기 세포, 유도된 만능성 줄기 세포, 다능성 줄기 세포, 소기능성 줄기 세포, 단분화능 줄기 세포 등을 포함한다. 예시적인 구체예에서, 세포는 포유류 세포이다.
적합한 포유류 세포의 무제한적 실례는 중국 햄스터 난소 (CHO) 세포, 아기 햄스터 신장 (BHK) 세포; 생쥐 골수종 NS0 세포, 생쥐 배아 섬유모세포 3T3 세포 (NIH3T3), 생쥐 B 림프종 A20 세포; 생쥐 흑색종 B16 세포; 생쥐 근모세포 C2C12 세포; 생쥐 골수종 SP2/0 세포; 생쥐 배아 중간엽 C3H-10T1/2 세포; 생쥐 암종 CT26 세포, 생쥐 전립선 DuCuP 세포; 생쥐 유방 EMT6 세포; 생쥐 간암 Hepa1c1c7 세포; 생쥐 골수종 J5582 세포; 생쥐 상피 MTD-1A 세포; 생쥐 심근 MyEnd 세포; 생쥐 신장 RenCa 세포; 생쥐 췌장 RIN-5F 세포; 생쥐 흑색종 X64 세포; 생쥐 림프종 YAC-1 세포; 쥐 교모세포종 9L 세포; 쥐 B 림프종 RBL 세포; 쥐 신경모세포종 B35 세포; 쥐 간암 세포 (HTC); 버팔로 쥐 간 BRL 3A 세포; 개 신장 세포 (MDCK); 개 유방 (CMT) 세포; 쥐 골육종 D17 세포; 쥐 단핵구/대식세포 DH82 세포; 원숭이 신장 SV-40 형질전환된 섬유모세포 (COS7) 세포; 원숭이 신장 CVI-76 세포; 아프리카 녹색 원숭이 신장 (VERO-76) 세포; 인간 배아 신장 세포 (HEK293, HEK293T); 인간 경부 암종 세포 (HELA); 인간 폐 세포 (W138); 인간 간 세포 (Hep G2); 인간 U2-OS 골육종 세포, 인간 A549 세포, 인간 A-431 세포, 그리고 인간 K562 세포를 포함한다. 포유류 세포주의 광범위한 목록은 American 유형 Culture Collection 카탈로그 (ATCC, Mamassas, VA)에서 발견될 수 있다.
(V) 융합 단백질을 이용하여 염색체 서열을 변경하거나 또는 염색체 서열의 발현을 조절하기 위한 방법
본 발명의 다른 양상은 세포 또는 배아에서 염색체 서열을 변경하거나 또는 염색체 서열의 발현을 조절하기 위한 방법을 포괄한다. 상기 방법은 다음을 세포 또는 배아 내로 도입하는 것을 포함한다: (a) 최소한 하나의 융합 단백질 또는 최소한 하나의 융합 단백질을 인코딩하는 핵산, 여기서 상기 융합 단백질은 CRISPR/Cas-유사 단백질 또는 이의 단편 및 작동체 도메인을 포함하고, 그리고 (b) 최소한 하나의 유도 RNA 또는 상기 유도 RNA를 인코딩하는 DNA, 여기서 유도 RNA는 융합 단백질의 CRISPR/Cas-유사 단백질을 염색체 서열 내에 표적화된 부위로 유도하고, 그리고 융합 단백질의 작동체 도메인은 염색체 서열을 변경하거나 또는 염색체 서열의 발현을 조절한다.
CRISPR/Cas-유사 단백질 또는 이의 단편 및 작동체 도메인을 포함하는 융합 단백질은 상기 섹션 (II)에서 상술된다. 일반적으로, 본원에서 개시된 융합 단백질은 최소한 하나의 핵 국지화 신호를 더욱 포함한다. 융합 단백질을 인코딩하는 핵산은 상기 섹션 (III)에서 설명된다. 일부 구체예에서, 융합 단백질은 단리된 단백질로서 세포 또는 배아 내로 도입될 수 있다 (이것은 세포-투과성 도메인을 더욱 포함할 수 있다). 게다가, 단리된 융합 단백질은 유도 RNA를 포함하는 단백질-RNA 복합체의 부분일 수 있다. 다른 구체예에서, 융합 단백질은 RNA 분자로서 세포 또는 배아 내로 도입될 수 있다 (이것은 캡핑되고 및/또는 폴리아데닐화될 수 있다). 또 다른 구체예에서, 융합 단백질은 DNA 분자로서 세포 또는 배아 내로 도입될 수 있다. 가령, 융합 단백질 및 유도 RNA는 구별된 DNA 분자로서 또는 동일한 DNA 분자의 일부로서 세포 또는 배아 내로 도입될 수 있다. 이런 DNA 분자는 플라스미드 벡터일 수 있다.
일부 구체예에서, 상기 방법은 최소한 하나의 아연 핑거 뉴클레아제를 세포 또는 배아 내로 도입하는 것을 더욱 포함한다. 아연 핑거 뉴클레아제는 섹션 (II)(d)에서 전술된다. 또 다른 구체예에서, 상기 방법은 최소한 하나의 공여자 폴리뉴클레오티드를 세포 또는 배아 내로 도입하는 것을 더욱 포함한다. 공여자 폴리뉴클레오티드는 상기 섹션 (IV)(d)에서 상술된다. 분자를 세포 또는 배아 내로 도입하기 위한 수단뿐만 아니라 세포 또는 배아를 배양하기 위한 수단은 각각, 섹션 (IV)(e)와 (IV)(f)에서 전술된다. 적합한 세포와 배아는 섹션 (IV)(g)에서 전술된다.
융합 단백질의 작동체 도메인이 개열 도메인 (가령, FokI 개열 도메인 또는 변형된 FokI 개열 도메인)인 일정한 구체예에서, 상기 방법은 1개의 융합 단백질 (또는 1개의 융합 단백질을 인코딩하는 핵산) 및 2개의 유도 RNA (또는 2개의 유도 RNA를 인코딩하는 DNA)를 세포 또는 배아 내로 도입하는 것을 포함할 수 있다. 이들 2개의 유도 RNA는 융합 단백질을 염색체 서열 내에 2개의 상이한 표적 부위로 향하게 하고, 여기서 상기 융합 단백질은 2개의 개열 도메인이 이중 가닥 절단을 염색체 서열 내에 도입할 수 있도록 이합체화한다 (가령, 동종이합체를 형성한다). 도면 1A를 참조한다. 임의선택적 공여자 폴리뉴클레오티드가 존재하지 않는 구체예에서, 염색체 서열 내에 이중 가닥 절단은 비상동성 말단 연결 (NHEJ) 복구 과정에 의해 복구될 수 있다. NHEJ가 오류 가능하기 때문에, 최소한 하나의 뉴클레오티드의 결실, 최소한 하나의 뉴클레오티드의 삽입, 최소한 하나의 뉴클레오티드의 치환, 또는 이들의 조합이 상기 절단의 복구 동안 일어날 수 있다. 따라서, 표적화된 염색체 서열은 변형되거나 또는 비활성화될 수 있다. 가령, 단일 뉴클레오티드 변화 (SNP)가 변경된 단백질 산물을 발생시킬 수 있거나, 또는 코딩 서열의 해독틀에서 이동이 단백질 산물이 만들어지지 않도록 상기 서열을 비활성화시키거나 또는 "녹아웃"시킬 수 있다. 임의선택적 공여자 폴리뉴클레오티드가 존재하는 구체예에서, 공여자 폴리뉴클레오티드 내에 공여자 서열은 이중 가닥 절단의 복구 동안 표적화된 부위에서 염색체 서열과 교환되거나 또는 이것 내로 통합될 수 있다. 가령, 공여자 서열이 각각, 염색체 서열의 표적화된 부위의 상류와 하류 서열과 실제적인 서열 동일성을 갖는 상류와 하류 서열과 측면에서 접하는 구체예에서, 공여자 서열은 상동 재조합 과정에 의해 매개된 복구 동안 표적화된 부위에서 염색체 서열과 교환되거나 또는 이것 내로 통합될 수 있다. 대안으로, 공여자 서열이 양립성 오버행과 측면에서 접하는 (또는 양립성 오버행이 RNA-유도된 엔도뉴클레아제에 의해 원지에서 산출되는) 구체예에서, 공여자 서열은 이중 가닥 절단의 복구 동안 비상동성 복구 과정에 의해 개열된 염색체 서열과 직접적으로 결찰될 수 있다. 염색체 서열 내로 공여자 서열의 교환 또는 통합은 표적화된 염색체 서열을 변경하거나 또는 외인성 서열을 세포 또는 배아의 염색체 서열 내로 도입한다.
융합 단백질의 작동체 도메인이 개열 도메인 (가령, FokI 개열 도메인 또는 변형된 FokI 개열 도메인)인 다른 구체예에서, 상기 방법은 2개의 상이한 융합 단백질 (또는 2개의 상이한 융합 단백질을 인코딩하는 핵산) 및 2개의 유도 RNA (또는 2개의 유도 RNA를 인코딩하는 DNA)를 세포 또는 배아 내로 도입하는 것을 포함할 수 있다. 이들 융합 단백질은 상기 섹션 (II)에서 상술된 바와 같이 상이할 수 있다. 각 유도 RNA는 융합 단백질을 염색체 서열 내에 특정한 표적 부위로 향하게 하고, 여기서 이들 융합 단백질은 2개의 개열 도메인이 이중 가닥 절단을 염색체 서열 내로 도입할 수 있도록 이합체화한다 (가령, 이형이합체를 형성한다). 임의선택적 공여자 폴리뉴클레오티드가 존재하지 않는 구체예에서, 결과의 이중 가닥 절단은 최소한 하나의 뉴클레오티드의 결실, 최소한 하나의 뉴클레오티드의 삽입, 최소한 하나의 뉴클레오티드의 치환, 또는 이들의 조합이 상기 절단의 복구 동안 일어날 수 있도록, 비상동성 복구 과정에 의해 복구될 수 있다. 임의선택적 공여자 폴리뉴클레오티드가 존재하는 구체예에서, 공여자 폴리뉴클레오티드 내에 공여자 서열은 상동성-기초된 복구 과정에 의해 (가령, 공여자 서열이 각각, 염색체 서열 내에 표적화된 부위의 상류와 하류 서열과 실제적인 서열 동일성을 갖는 상류와 하류 서열과 측면에서 접하는 구체예에서) 또는 비상동성 복구 과정에 의해 (가령, 공여자 서열이 양립성 오버행과 측면에서 접하는 구체예에서), 이중 가닥 절단의 복구 동안 염색체 서열과 교환되거나 또는 이것 내로 통합될 수 있다.
융합 단백질의 작동체 도메인이 개열 도메인 (가령, FokI 개열 도메인 또는 변형된 FokI 개열 도메인)인 또 다른 구체예에서, 상기 방법은 1개의 융합 단백질 (또는 1개의 융합 단백질을 인코딩하는 핵산), 1개의 유도 RNA (또는 1개의 유도 RNA를 인코딩하는 DNA), 그리고 1개의 아연 핑거 뉴클레아제 (또는 아연 핑거 뉴클레아제를 인코딩하는 핵산)를 세포 또는 배아 내로 도입하는 것을 포함할 수 있고, 여기서 아연 핑거 뉴클레아제는 FokI 개열 도메인 또는 변형된 FokI 개열 도메인을 포함한다. 유도 RNA는 융합 단백질을 특정한 염색체 서열로 향하게 하고, 그리고 아연 핑거 뉴클레아제는 다른 염색체 서열에 지향되고, 여기서 융합 단백질 및 아연 핑거 뉴클레아제는 융합 단백질의 개열 도메인 및 아연 핑거 뉴클레아제의 개열 도메인이 이중 가닥 절단을 염색체 서열 내로 도입할 수 있도록 이합체화한다. 도면 1B를 참조한다. 임의선택적 공여자 폴리뉴클레오티드가 존재하지 않는 구체예에서, 결과의 이중 가닥 절단은 최소한 하나의 뉴클레오티드의 결실, 최소한 하나의 뉴클레오티드의 삽입, 최소한 하나의 뉴클레오티드의 치환, 또는 이들의 조합이 상기 절단의 복구 동안 일어날 수 있도록, 비상동성 복구 과정에 의해 복구될 수 있다. 임의선택적 공여자 폴리뉴클레오티드가 존재하는 구체예에서, 공여자 폴리뉴클레오티드 내에 공여자 서열은 상동성-기초된 복구 과정에 의해 (가령, 공여자 서열이 각각, 염색체 서열 내에 표적화된 부위의 상류와 하류 서열과 실제적인 서열 동일성을 갖는 상류와 하류 서열과 측면에서 접하는 구체예에서) 또는 비상동성 복구 과정에 의해 (가령, 공여자 서열이 양립성 오버행과 측면에서 접하는 구체예에서), 이중 가닥 절단의 복구 동안 염색체 서열과 교환되거나 또는 이것 내로 통합될 수 있다.
융합 단백질의 작동체 도메인이 전사 활성화 도메인 또는 전사 억제인자 도메인인 또 다른 구체예에서, 상기 방법은 1개의 융합 단백질 (또는 1개의 융합 단백질을 인코딩하는 핵산) 및 1개의 유도 RNA (또는 1개의 유도 RNA를 인코딩하는 DNA)를 세포 또는 배아 내로 도입하는 것을 포함할 수 있다. 유도 RNA는 융합 단백질을 특정한 염색체 서열로 향하게 하고, 여기서 전사 활성화 도메인 또는 전사 억제인자 도메인은 각각, 표적화된 염색체 서열의 발현을 활성화시키거나 또는 억제한다. 도면 2A를 참조한다.
융합 단백질의 작동체 도메인이 후성 변형 도메인인 대안적 구체예에서, 상기 방법은 1개의 융합 단백질 (또는 1개의 융합 단백질을 인코딩하는 핵산) 및 1개의 유도 RNA (또는 1개의 유도 RNA를 인코딩하는 DNA)를 세포 또는 배아 내로 도입하는 것을 포함할 수 있다. 유도 RNA는 융합 단백질을 특정한 염색체 서열로 향하게 하고, 여기서 후성 변형 도메인은 표적화된 염색체 서열의 구조를 변경한다. 도면 2A를 참조한다. 후성 변형은 아세틸화, 히스톤 단백질의 메틸화 및/또는 뉴클레오티드 메틸화를 포함한다. 일부 경우에, 염색체 서열의 구조적 변형은 염색체 서열의 발현에서 변화를 야기한다.
(VI) 유전적으로 변형된 세포와 동물
본 발명은 예로서, 본원에서 설명된 방법을 이용하여, RNA-유도된 엔도뉴클레아제-매개된 또는 융합 단백질-매개된 과정을 이용하여 변형된 최소한 하나의 염색체 서열을 포함하는 유전적으로 변형된 세포, 비-인간 배아, 그리고 비-인간 동물을 포괄한다. 본 발명은 관심되는 염색체 서열에 표적화된 RNA-유도된 엔도뉴클레아제 또는 융합 단백질을 인코딩하는 최소한 하나의 DNA 또는 RNA 분자 또는 융합 단백질, 최소한 하나의 유도 RNA, 그리고 임의선택적으로 하나 또는 그 이상의 공여자 폴리뉴클레오티드(들)를 포함하는 세포를 제공한다. 본 발명은 또한, 관심되는 염색체 서열에 표적화된 RNA-유도된 엔도뉴클레아제 또는 융합 단백질을 인코딩하는 최소한 하나의 DNA 또는 RNA 분자, 최소한 하나의 유도 RNA, 그리고 임의선택적으로 하나 또는 그 이상의 공여자 폴리뉴클레오티드(들)를 포함하는 비-인간 배아를 제공한다.
본 발명은 최소한 하나의 변형된 염색체 서열을 포함하는 유전적으로 변형된 비-인간 동물, 비-인간 배아, 또는 동물 세포를 제공한다. 변형된 염색체 서열은 (1) 비활성화되고, (2) 변경된 발현을 갖거나 또는 변경된 단백질 산물을 생산하고, 또는 (3) 통합된 서열을 포함하도록 변형될 수 있다. 염색체 서열은 본원에서 설명된 방법을 이용하여, RNA 유도된 엔도뉴클레아제-매개된 또는 융합 단백질-매개된 과정으로 변형된다.
논의된 바와 같이, 본 발명의 한 가지 양상은 최소한 하나의 염색체 서열이 변형된 유전적으로 변형된 동물을 제공한다. 한 구체예에서, 유전적으로 변형된 동물은 최소한 하나의 비활성화된 염색체 서열을 포함한다. 변형된 염색체 서열은 상기 서열이 전사되지 않고 및/또는 기능적 단백질 산물이 생산되지 않도록 비활성화될 수 있다. 따라서, 비활성화된 염색체 서열을 포함하는 유전적으로 변형된 동물은 "녹아웃" 또는 "조건적 녹아웃"으로 명명될 수 있다. 비활성화된 염색체 서열은 결실 돌연변이 (즉, 하나 또는 그 이상의 뉴클레오티드의 결실), 삽입 돌연변이 (즉, 하나 또는 그 이상의 뉴클레오티드의 삽입), 또는 넌센스 돌연변이 (즉, 종결 코돈이 도입되도록 다른 뉴클레오티드에 대한 단일 뉴클레오티드의 치환)를 포함할 수 있다. 돌연변이의 결과로서, 표적화된 염색체 서열이 비활성화되고 기능적 단백질이 생산되지 않는다. 비활성화된 염색체 서열은 외인성으로 도입된 서열을 포함하지 않는다. 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 또는 그 이상의 염색체 서열이 비활성화되는 유전적으로 변형된 동물 역시 본원에서 포함된다.
다른 구체예에서, 변형된 염색체 서열은 변이체 단백질 산물을 코딩하도록 변경될 수 있다. 가령, 변형된 염색체 서열을 포함하는 유전적으로 변형된 동물은 변경된 단백질 산물이 생산되도록, 표적화된 점 돌연변이(들) 또는 다른 변형을 포함할 수 있다. 한 구체예에서, 염색체 서열은 최소한 하나의 뉴클레오티드가 변화되고, 그리고 발현된 단백질이 하나의 변화된 아미노산 잔기를 포함하도록 변형될 수 있다 (미스센스 돌연변이). 다른 구체예에서, 염색체 서열은 하나 이상의 아미노산이 변화되도록, 하나 이상의 미스센스 돌연변이를 포함하도록 변형될 수 있다. 부가적으로, 염색체 서열은 발현된 단백질이 단일 아미노산 결실 또는 삽입을 포함하도록, 3개의 뉴클레오티드 결실 또는 삽입을 갖도록 변형될 수 있다. 변경된 또는 변이체 단백질은 야생형 단백질과 비교하여 변경된 성질 또는 활성, 예를 들면, 변경된 기질 특이성, 변경된 효소 활성, 변경된 운동성 비율 등을 가질 수 있다.
다른 구체예에서, 유전적으로 변형된 동물은 최소한 하나의 염색체로 통합된 서열을 포함할 수 있다. 통합된 서열을 포함하는 유전적으로 변형된 동물은 "녹인" 또는 "조건적 녹인"으로 명명될 수 있다. 염색체로 통합된 서열은 예로서, 이종상동성 단백질, 내인성 단백질, 또는 둘 모두의 조합을 인코딩할 수 있다. 한 구체예에서, 이종상동성 단백질 또는 내인성 단백질을 인코딩하는 서열은 염색체 서열이 비활성화되지만 외인성 서열이 발현되도록, 단백질을 인코딩하는 염색체 서열 내로 통합될 수 있다. 이런 경우에, 이종상동성 단백질 또는 내인성 단백질을 인코딩하는 서열은 프로모터 제어 서열에 작동가능하게 연결될 수 있다. 대안으로, 이종상동성 단백질 또는 내인성 단백질을 인코딩하는 서열은 염색체 서열의 발현에 영향을 주지 않으면서 염색체 서열 내로 통합될 수 있다. 가령, 단백질을 인코딩하는 서열은 "안전한 항구" 좌위, 예를 들면, Rosa26 좌위, HPRT 좌위, 또는 AAV 좌위 내로 통합될 수 있다. 본 발명은 또한, 단백질(들)을 인코딩하는 서열을 비롯하여, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 또는 그 이상 서열이 유전체 내로 통합되는 유전적으로 변형된 동물을 포괄한다.
단백질을 인코딩하는 염색체로 통합된 서열은 관심되는 단백질의 야생형 형태를 인코딩할 수 있거나 또는 단백질의 변경된 이형이 생산되도록 최소한 하나의 변형을 포함하는 단백질을 인코딩할 수 있다. 가령, 질환 또는 장애에 관련된 단백질을 인코딩하는 염색체로 통합된 서열은 생산된 단백질의 변경된 이형이 연관된 장애를 유발하거나 또는 강력하게 하도록 최소한 하나의 변형을 포함할 수 있다. 대안으로, 질환 또는 장애에 관련된 단백질을 인코딩하는 염색체로 통합된 서열은 단백질의 변경된 이형이 연관된 장애의 발달에 대항하여 보호하도록 최소한 하나의 변형을 포함할 수 있다.
추가의 구체예에서, 유전적으로 변형된 동물은 기능적 인간 단백질을 인코딩하는 최소한 하나의 염색체로 통합된 서열을 포함하는 "인간화" 동물일 수 있다. 기능적 인간 단백질은 유전적으로 변형된 동물에서 상응하는 오르소로그 없음을 가질 수 있다. 대안으로, 유전적으로 변형된 동물이 유래되는 야생형 동물은 기능적 인간 단백질에 상응하는 오르소로그를 포함할 수 있다. 이러한 경우에, "인간화" 동물 내에 이종상동성 서열은 기능적 단백질이 만들어지지 않도록 비활성화되고, 그리고 "인간화" 동물은 인간 단백질을 인코딩하는 최소한 하나의 염색체로 통합된 서열을 포함한다.
또 다른 구체예에서, 유전적으로 변형된 동물은 단백질의 발현 패턴이 변경되도록, 단백질을 인코딩하는 최소한 하나의 변형된 염색체 서열을 포함할 수 있다. 가령, 단백질의 발현을 제어하는 조절 영역, 예를 들면, 프로모터 또는 전사 인자 결합 부위는 단백질이 과다생산되거나, 또는 단백질의 조직 특이적 또는 일시적 발현이 변경되거나, 또는 이들의 조합이 되도록 변경될 수 있다. 대안으로, 단백질의 발현 패턴은 조건적 녹아웃 시스템을 이용하여 변경될 수 있다. 조건적 녹아웃 시스템의 무제한적 실례는 Cre-lox 재조합 시스템을 포함한다. Cre-lox 재조합 시스템은 핵산 분자 내에 특정한 부위 (lox 부위) 사이에 핵산 서열의 재조합을 촉매작용할 수 있는 부위 특이적 DNA 재조합효소인 Cre 재조합효소 효소를 포함한다. 일시적인 조직 특이적 발현을 산출하기 위해 이러한 시스템을 이용하는 방법은 당분야에서 공지된다. 일반적으로, 유전적으로 변형된 동물은 염색체 서열에 접하는 lox 부위에서 산출된다. lox-접하는 염색체 서열을 포함하는 유전적으로 변형된 동물은 이후, Cre 재조합효소를 발현하는 다른 유전적으로 변형된 동물과 교차될 수 있다. lox-접하는 염색체 서열을 포함하는 자손 동물 및 Cre 재조합효소가 이후 생산되고, 그리고 lox-접하는 염색체 서열이 재조합되어, 단백질을 인코딩하는 염색체 서열의 결실 또는 역전을 야기한다. Cre 재조합효소의 발현은 염색체 서열의 일시적으로 및 조건적으로 조절된 재조합을 산출하기 위해 일시적으로 및 조건적으로 조절될 수 있다.
이들 구체예 중에서 한 가지에서, 본원에서 개시된 유전적으로 변형된 동물은 변형된 염색체 서열에 대해 이형접합성일 수 있다. 대안으로, 유전적으로 변형된 동물은 변형된 염색체 서열에 대해 동형접합성일 수 있다.
본원에서 개시된 유전적으로 변형된 동물은 하나 이상의 변형된 염색체 서열을 포함하는 동물을 창출하기 위해 또는 하나 또는 그 이상의 변형된 염색체 서열에 대해 동형접합성인 동물을 창출하기 위해 교배될 수 있다. 가령, 동일한 변형된 염색체 서열을 포함하는 2마리 동물이 교배되어 변형된 염색체 서열에 대해 동형접합성 동물을 창출할 수 있다. 대안으로, 상이한 변형된 염색체 서열을 갖는 동물이 교배되어 양쪽 변형된 염색체 서열을 포함하는 동물을 창출할 수 있다.
가령, 비활성화된 염색체 서열 유전자 "x"를 포함하는 첫 번째 동물은 인간 유전자 "X" 단백질을 인코딩하는 염색체로 통합된 서열을 포함하는 두 번째 동물과 교차되어, 비활성화된 유전자 "x" 염색체 서열 및 염색체로 통합된 인간 유전자 "X" 서열 둘 모두를 포함하는 "인간화" 유전자 "X" 자손을 발생시킬 수 있다. 또한, 인간화 유전자 "X" 동물은 인간화 유전자 "Y" 동물과 교차되어 인간화 유전자 X/유전자 Y 자손을 창출할 수 있다. 당업자는 많은 조합이 가능하다는 것을 인지할 것이다.
다른 구체예에서, 변형된 염색체 서열을 포함하는 동물은 변형된 염색체 서열을 다른 유전자 배경과 합동하기 위해 교배될 수 있다. 무제한적 실례에 의하여, 다른 유전자 배경은 야생형 유전자 배경, 결실 돌연변이를 갖는 유전자 배경, 다른 표적화된 통합을 갖는 유전자 배경, 그리고 비표적화된 통합을 갖는 유전자 배경을 포함할 수 있다.
용어 "동물"은 본원에서 이용된 바와 같이, 비-인간 동물을 지칭한다. 동물은 배아, 소아, 또는 성체일 수 있다. 적합한 동물은 척추동물, 예를 들면, 포유동물, 조류, 파충류, 양서류, 조개류, 그리고 어류를 포함한다. 적합한 포유동물의 실례는 제한 없이, 설치류, 반려 동물, 가축, 그리고 영장류를 포함한다. 설치류의 무제한적 실례는 생쥐, 쥐, 햄스터, 게르빌루스쥐, 그리고 기니 피그를 포함한다. 적합한 반려 동물에는 고양이, 개, 토끼, 헤지호그, 그리고 흰담비가 포함되지만 이들에 한정되지 않는다. 가축의 무제한적 실례는 말, 염소, 양, 돼지, 소, 라마, 그리고 알파카를 포함한다. 적합한 영장류에는 카푸친 원숭이, 침팬지, 여우원숭이, 마카크, 마모셋, 타마린, 거미 원숭이, 다람쥐 원숭이, 그리고 버빗 원숭이가 포함되지만 이들에 한정되지 않는다. 조류의 무제한적 실례는 닭, 칠면조, 오리, 그리고 거위를 포함한다. 대안으로, 동물은 무척추동물, 예를 들면, 곤충, 선충, 기타 등등일 수 있다. 곤충의 무제한적 실례는 초파리 (Drosophila) 및 모기를 포함한다. 예시적인 동물은 쥐이다. 적합한 쥐 혈통의 무제한적 실례는 Dahl Salt-Sensitive, Fischer 344, Lewis, Long Evans Hooded, Sprague-Dawley, 그리고 Wistar를 포함한다. 한 구체예에서, 동물은 유전적으로 변형된 생쥐가 아니다. 본 발명을 위한 적합한 동물의 각 전술한 반복에서, 동물은 외인성으로 도입된, 무작위로 통합된 트랜스포손 서열을 포함하지 않는다.
본 발명의 추가 양상은 최소한 하나의 변형된 염색체 서열을 포함하는 유전적으로 변형된 세포 또는 세포주를 제공한다. 유전적으로 변형된 세포 또는 세포주는 본원에서 개시된 유전적으로 변형된 동물 중에서 한 가지로부터 유래될 수 있다. 대안으로, 염색체 서열은 본원에서 설명된 방법을 이용하여, 상기 본원에서 (동물에서 염색체 서열 변형을 설명하는 단락에서) 설명된 바와 같이 세포에서 변형될 수 있다. 본 발명은 또한, 상기 세포 또는 세포주의 용해물을 포괄한다.
일반적으로, 이들 세포는 진핵 세포이다. 적합한 숙주 세포는 곰팡이류 또는 효모, 예를 들면, 피치아 (Pichia), 사카로미세스 (Saccharomyces), 또는 쉬조사카로미세스 (Schizosaccharomyces); 곤충 세포, 예를 들면, 스포도프테라 프루기페르다 (Spodoptera frugiperda)로부터 SF9 세포 또는 노랑초파리 (Drosophila melanogaster)로부터 S2 세포; 그리고 동물 세포, 예를 들면, 생쥐, 쥐, 햄스터, 비-인간 영장류, 또는 인간 세포를 포함한다. 예시적인 세포는 포유류이다. 포유류 세포는 일차 세포일 수 있다. 일반적으로, 이중 가닥 절단에 민감한 임의의 일차 세포가 이용될 수 있다. 이들 세포는 다양한 세포 유형, 예를 들면, 섬유모세포, 근모세포, T 또는 B 세포, 대식세포, 상피 세포, 기타 등등일 수 있다.
포유류 세포주가 이용될 때, 상기 세포주는 아직 설명되지 않은 임의의 확립 세포주 또는 일차 세포주일 수 있다. 세포주는 유착성 또는 비유착성이거나, 또는 세포주는 당업자에게 공지된 표준 기술을 이용하여, 유착성, 비유착성 또는 기관형적 성장을 고무하는 조건 하에 성장될 수 있다. 적합한 포유류 세포와 세포주의 무제한적 실례는 본원에서 섹션 (IV)(g)에서 제공된다. 또 다른 구체예에서, 세포는 줄기 세포일 수 있다. 적합한 줄기 세포의 무제한적 실례는 섹션 (IV)(g)에서 제공된다.
본 발명은 최소한 하나의 변형된 염색체 서열을 포함하는 유전적으로 변형된 비-인간 배아 역시 제공한다. 염색체 서열은 본원에서 설명된 방법을 이용하여, 상기 본원에서 (동물에서 염색체 서열 변형을 설명하는 단락에서) 설명된 바와 같이 배아에서 변형될 수 있다. 한 구체예에서, 배아는 관심되는 동물 종의 비-인간 수태된 단세포 단계 배아이다. 단세포 배아를 비롯하여, 예시적인 포유류 배아는 제한 없이, 생쥐, 쥐, 햄스터, 설치류, 토끼, 고양이, 개, 양, 돼지, 소, 말, 그리고 영장류 배아를 포함한다.
정의
달리 정의되지 않으면, 본원에서 이용된 모든 기술 용어와 과학 용어는 본 발명이 속하는 당해 분야의 평균적 기술자에 의해 통상적으로 이해되는 바와 동일한 의미를 갖는다. 다음 참고문헌은 본 발명에서 이용된 많은 용어의 일반적 정의를 당업자에게 제공한다: Singleton et al., Dictionary of Microbiology and Molecular Biology (2nd ed. 1994); The Cambridge Dictionary of Science and Technology (Walker ed., 1988); The Glossary of Genetics, 5th Ed., R. Rieger et al. (eds.), Springer Verlag (1991); 그리고 Hale & Marham, The Harper Collins Dictionary of Biology (1991). 본원에서 이용된 바와 같이, 다음 용어는 달리 특정되지 않으면, 그들에 생득된 의미를 갖는다.
본 발명의 원소 또는 이의 바람직한 구체예(들)를 소개할 때, 관사 "a", "an", "the" 및 "상기"는 이들 원소 중에서 하나 또는 그 이상이 있다는 것을 의미하는 것으로 의도된다. 용어 "포함하는", "포함하는" 및 "갖는"은 포괄적인 것으로 의도되고, 그리고 열거된 원소 이외에 추가 원소가 있을 수 있다는 것을 의미한다.
본원에서 이용된 바와 같이, 용어 "내인성 서열"은 세포에 선천적인 염색체 서열을 지칭한다.
용어 "외인성"은 본원에서 이용된 바와 같이, 세포에 선천적이지 않은 서열, 또는 세포의 유전체 내에 선천적 위치가 상이한 염색체 위치에 있는 염색체 서열을 지칭한다.
"유전자"는 본원에서 이용된 바와 같이, 유전자 산물을 인코딩하는 DNA 영역 (엑손과 인트론 포함)뿐만 아니라 이런 조절 서열이 코딩 서열 및/또는 전사된 서열에 인접하는 지에 상관없이 유전자 산물의 생산을 조절하는 모든 DNA 영역을 지칭한다. 따라서, 유전자는 프로모터 서열, 종결인자, 번역 조절 서열, 예를 들면, 리보솜 결합 부위 및 내부 리보솜 유입 부위, 인핸서, 사일런서, 인슐레이터, 경계 원소, 복제 기원, 매트릭스 부착 부위, 그리고 좌위 제어 영역을 포함하지만, 이들에 반드시 한정되지는 않는다.
용어 "이종유래"는 관심되는 세포에 내인성이거나 또는 선천적이지 않은 실체를 지칭한다. 가령, 이종단백질은 외인성 공급원, 예를 들면, 외인성으로 도입된 핵산 서열로부터 유래되거나 또는 이것으로부터 최초 유래되었던 단백질을 지칭한다. 일부 경우에, 이종 단백질은 관심되는 세포에 의해 정상적으로 생산되지 않는다.
용어 "핵산"과 "폴리뉴클레오티드"는 선형 또는 환상 입체형태에서, 그리고 단일- 또는 이중 가닥 형태에서 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 중합체를 지칭한다. 본 발명의 목적으로, 이들 용어는 중합체의 길이에 대하여 한정하는 것으로 해석되지 않는다. 이들 용어는 자연 뉴클레오티드의 공지된 유사체뿐만 아니라 염기, 당 및/또는 인산염 모이어티 (가령, 포스포로티오에이트 중추)에서 변형되는 뉴클레오티드를 포괄할 수 있다. 일반적으로, 특정 뉴클레오티드의 유사체는 동일한 염기-짝짓기 특이성을 갖는다; 즉, A의 유사체는 T와 염기쌍을 이룰 것이다.
용어 "뉴클레오티드"는 데옥시리보뉴클레오티드 또는 리보뉴클레오티드를 지칭한다. 뉴클레오티드는 표준 뉴클레오티드 (즉, 아데노신, 구아노신, 시티딘, 티미딘, 그리고 우리딘) 또는 뉴클레오티드 유사체일 수 있다. 뉴클레오티드 유사체는 변형된 퓨린 또는 피리미딘 염기 또는 변형된 리보오스 모이어티를 갖는 뉴클레오티드를 지칭한다. 뉴클레오티드 유사체는 자연적으로 발생하는 뉴클레오티드 (가령, 이노신) 또는 비자연적으로 발생하는 뉴클레오티드일 수 있다. 뉴클레오티드의 당 또는 염기 모이어티 상에서 변형의 무제한적 실례는 아세틸 기, 아미노 기, 카르복실 기, 카르복시메틸 기, 히드록실 기, 메틸 기, 포스포릴 기, 그리고 티올 기의 부가 (또는 제거)뿐만 아니라 염기의 탄소와 질소 원자의 다른 원자 (가령, 7-데아자 퓨린)로 치환을 포함한다. 뉴클레오티드 유사체는 또한, 디데옥시 뉴클레오티드, 2'-O-메틸 뉴클레오티드, 잠금된 핵산 (LNA), 펩티드 핵산 (PNA), 그리고 모르폴리노를 포함한다.
용어 "폴리펩티드"와 "단백질"은 아미노산 잔기의 중합체를 지칭하기 위해 교체가능하게 이용된다.
핵산과 아미노산 서열 동일성을 결정하기 위한 기술은 당분야에서 공지된다. 전형적으로, 이런 기술은 유전자의 경우에 mRNA의 뉴클레오티드 서열을 결정하고 및/또는 이에 따른 인코딩된 아미노산 서열을 결정하고, 그리고 이들 서열을 두 번째 뉴클레오티드 또는 아미노산 서열과 비교하는 것을 포함한다. 유전체학 서열 역시 이러한 방식으로 결정되고 비교될 수 있다. 일반적으로, 동일성은 각각, 2개의 폴리뉴클레오티드 또는 폴리펩티드 서열의 정확한 뉴클레오티드-대-뉴클레오티드 또는 아미노산-대-아미노산 상응을 지칭한다. 2개 또는 그 이상의 서열 (폴리뉴클레오티드 또는 아미노산)은 그들의 퍼센트 동일성을 결정함으로써 비교될 수 있다. 핵산 또는 아미노산 서열인지에 상관없이, 두 서열의 퍼센트 동일성은 더욱 짧은 서열의 길이에 의해 나눗셈되고 100에 의해 곱셈된, 두 정렬된 서열 사이에 정확한 매치의 숫자이다. 핵산 서열에 대한 근사 정렬은 Smith and Waterman, Advances in Applied Mathematics 2:482-489 (1981)의 국부 상동성 알고리즘에 의해 제공된다. 이러한 알고리즘은 Dayhoff, Atlas of 단백질 서열s and Structure, M. O. Dayhoff ed., 5 suppl. 3:353-358, National Biomedical Research Foundation, Washington, D.C., USA에 의해 개발되고, 그리고 Gribskov, Nucl. Acids Res. 14(6):6745-6763 (1986)에 의해 정규화된 채점 매트릭스를 이용함으로써 아미노산 서열에 적용될 수 있다. 서열의 퍼센트 동일성을 결정하기 위한 이러한 알고리즘의 예시적인 실행은 Genetics Computer Group (Madison, Wis.)에 의해 "BestFit" 유용성 애플리케이션에서 제공된다. 서열 사이에 퍼센트 동일성 또는 유사성을 계산하기 위한 다른 적합한 프로그램은 당분야에서 전반적으로 공지되어 있다, 예로서, 다른 정렬 프로그램은 디폴트 파라미터에서 이용된 BLAST이다. 가령, BLASTN과 BLASTP는 다음 디폴트 파라미터를 이용하여 이용될 수 있다: 유전자 코드 = 표준; 필터 = 없음; 가닥 = 둘 모두; 컷오프 = 60; 예상 = 10; 매트릭스 = BLOSUM62; 설명 = 50개 서열; 분류 = 높은 점수; 데이터베이스 = 비다중, GenBank+EMBL+DDBJ+PDB+GenBank CDS translations+Swiss 단백질+Spupdate+PIR. 이들 프로그램의 상세는 GenBank 웹사이트 상에서 발견될 수 있다.
다양한 변화가 발명의 범위를 벗어나지 않으면서 상기 설명된 세포와 방법에서 만들어질 수 있었기 때문에, 상기 설명에서 및 아래 제공된 실시예에서 내포된 모든 물질은 예시적인 것으로 해석되고 제한하는 의미로 해석되지 않는 것으로 의도된다.
실시예
다음 실시예는 본 발명의 일정한 양상을 예증한다.
실시예 1: 포유류 발현을 위한
Cas9
유전자의 변형
스트렙토콕쿠스 피오게네스 (스트렙토콕쿠스 피오게네스) 균주 MGAS15252 (수탁 번호 YP_005388840.1)로부터 Cas9 유전자는 포유류 세포에서 이의 번역을 증강하기 위해 호모사피엔스 코돈 선호로 최적화되었다. Cas9 유전자는 또한, 상기 단백질을 포유류 세포의 핵 내로 표적화하기 위해 C 말단에서 핵 국지화 신호 PKKKRKV (서열 번호:1)를 부가함으로써 변형되었다. 표 1은 변형된 Cas9 아미노산 서열을 제공하는데, 핵 국지화 서열은 밑줄 그어진다. 표 2는 코돈 최적화된, 변형된 Cas9 DNA 서열을 제공한다.
QEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDPKKKRKV (서열 번호:9) |
CCCCAAGAAAAAGCGCAAAGTG (서열 번호:10) |
변형된 Cas9 DNA 서열은 포유류 세포에서 구성적 발현을 위해 시토메갈로바이러스 (CMV) 프로모터의 제어 하에 배치되었다. 변형된 Cas9 DNA 서열은 또한, T7 RNA 중합효소로 시험관내 mRNA 합성을 위해 T7 프로모터의 제어 하에 배치되었다. 시험관내 RNA 전사는 MessageMAX T7 ARCA-캡핑된 Message 전사 키트 및 T7 mScript 표준 mRNA 생산 시스템 (Cellscript)을 이용함으로써 수행되었다. 실시예 2: Cas9 표적화 아데노 연관된 바이러스 통합 부위 1 (AAVS1) 좌위가 Cas9-매개된 인간 유전체 변형을 위한 표적으로서 이용되었다. 인간 AAVS1 좌위는 단백질 포스파타아제 1, 조절 아단위 12C (PPP1R12C)의 인트론 1 (4427 bp)에서 위치된다. 표 3은 PPP1R12C의 첫 번째 엑손 (음영된 회색) 및 첫 번째 인트론을 제공한다. 인트론 내에 밑줄 그어진 서열은 표적화된 변형 부위 (즉, AAVS1 좌위)이다.
Cas9 유도 RNA는 인간 AAVS1 좌위를 표적으로 하도록 설계되었다. 표적 인식 서열 (즉, 표적 서열의 비코딩 가닥에 상보적인 서열) 및 프로토스페이서 서열을 포함하는 42개 뉴클레오티드 RNA (본원에서 "crRNA" 서열로 지칭됨) (5'에서 3'); crRNA의 3' 서열에 상보성을 갖는 5' 서열 및 추가 헤어핀 서열을 포함하는 85개 뉴클레오티드 RNA (본원에서 "tracrRNA" 서열로 지칭됨); 그리고 crRNA의 뉴클레오티드 1-32, GAAA 루프 및 tracrRNA의 뉴클레오티드 19-45를 포함하는 키메라 RNA가 제조되었다. crRNA는 Sigma-Aldrich에 의해 화학적으로 합성되었다. tracrRNA 및 키메라 RNA는 T7-Scribe 표준 RNA IVT 키트 (Cellscript)를 이용하여, T7 RNA 중합효소로 시험관내 전사에 의해 합성되었다. 키메라 RNA 코딩 서열 역시 인간 세포에서 생체내 전사를 위해 인간 U6 프로모터의 제어 하에 배치되었다. 표 4는 유도 RNA의 서열을 제공한다.
RNA | 5'-3' 서열 | 서열 번호: |
AAVS1-crRNA | ACCCCACAGUGGGGCCACUAGUUUUAGAGCUAUGCUGUUUUG | 12 |
tracrRNA | GGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU | 13 |
키메라 RNA | ACCCCACAGUGGGGCCACUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCG | 14 |
실시예 3: 유전체 변형을 모니터링하기 위한 공여자 폴리뉴클레오티드의 제조 PPP1R12C의 N 말단 내로 GFP 단백질의 표적화된 통합이 Cas9-매개된 유전체 변형을 모니터링하는데 이용되었다. 상동성 재조합에 의한 통합을 매개하기 위해, 공여자 폴리뉴클레오티드가 제조되었다. AAVS1-GFP DNA 공여자는 5' (1185 bp) AAVS1 좌위 상동성 팔, RNA 스플라이싱 수용체, 터보 GFP 코딩 서열, 3' 전사 종결인자, 그리고 3' (1217 bp) AAVS1 좌위 상동성 팔을 내포하였다. 표 5는 RNA 스플라이싱 수용체 및 GFP 코딩 서열, 그 이후에 3' 전사 종결인자의 서열을 제공한다. 플라스미드 DNA는 GenElute 내독소-없는 플라스미드 Maxiprep 키트 (Sigma)를 이용함으로써 제조되었다.
5'-3' 서열 | 서열 번호: | |
RNA 스플라이싱 수용체 | CTGACCTCTTCTCTTCCTCCCACAG | 15 |
GFP 코딩 서열과 전사 종결인자 | GCCACCATGGACTACAAAGACGATGACGACAAGGTCGACTCTAGAGCTGCAGAGAGCGACGAGAGCGGCCTGCCCGCCATGGAGATCGAGTGCCGCATCACCGGCACCCTGAACGGCGTGGAGTTCGAGCTGGTGGGCGGCGGAGAGGGCACCCCCGAGCAGGGCCGCATGACCAACAAGATGAAGAGCACCAAAGGCGCCCTGACCTTCAGCCCCTACCTGCTGAGCCACGTGATGGGCTACGGCTTCTACCACTTCGGCACCTACCCCAGCGGCTACGAGAACCCCTTCCTGCACGCCATCAACAACGGCGGCTACACCAACACCCGCATCGAGAAGTACGAGGACGGCGGCGTGCTGCACGTGAGCTTCAGCTACCGCTACGAGGCCGGCCGCGTGATCGGCGACTTCAAGGTGATGGGCACCGGCTTCCCCGAGGACAGCGTGATCTTCACCGACAAGATCGTCCGCAGCAACGCCACCGTGGAGCACCTGCACCCCATGGGCGATAACGATCTGGATGGCAGCTTCACCCGCACCTTCAGCCTGCGCGACGGCGGCTACTACAGCTCCGTGGTGGACAGCCACATGCACTTCAAGAGCGCCATCCACCCCAGCATCCTGCAGAACGGGGGCCCCATGTTCGCCTTCCGCCGCGTGGAGGAGGATCACAGCAACACCGAGCTGGGCATCGTGGAGTACCAGCACGCCTTCAAGACCCCGGATGCAGATGCCGGTGAAGAATGAAGATCTCTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGACTCGAGGTTTAAACGTCGACGCGGCCGCGT | 16 |
표적화된 유전자 통합은 PPP1R12C의 첫 107개 아미노산 및 터보 GFP 사이에 융합 단백질을 유발할 것이다. 예상된 융합 단백질은 PPP1R12C의 첫 번째 엑손 및 가공된 스플라이스 수용체 사이에 RNA 스플라이싱으로부터 PPP1R12C의 첫 107개 아미노산 잔기 (회색으로 강조됨)를 내포한다 (표 6 참조).
MSGEDGPAAGPGAAAAAARERRREQLRQWGARAGAEPGPGERRARTVRFERAAEFLAACAGGDLDEARLMLRAADPGPGAELDPAAPPPARAVLDSTNADGISALHQATMDYKDDDDKVDSRAAESDESGLPAMEIECRITGTLNGVEFELVGGGEGTPEQGRMTNKMKSTKGALTFSPYLLSHVMGYGFYHFGTYPSGYENPFLHAINNGGYTNTRIEKYEDGGVLHVSFSYRYEAGRVIGDFKVMGTGFPEDSVIFTDKIVRSNATVEHLHPMGDNDLDGSFTRTFSLRDGGYYSSVVDSHMHFKSAIHPSILQNGGPMFAFRRVEEDHSNTELGIVEYQHAFKTPDADAGEE (서열 번호:17) |
실시예 4: Cas9-매개된 표적화된 통합
형질감염이 인간 K562 세포에서 수행되었다. K562 세포주는 American 유형 Culture Collection (ATCC)으로부터 획득되고, 그리고 10% FBS와 2 mM L-글루타민으로 보충된 Iscove의 변형된 Dulbecco의 배지에서 성장되었다. 모든 배지와 보충물은 Sigma-Aldrich로부터 획득되었다. 배양액은 형질감염 하루 전에 분할되었다 (형질감염 이전 mL당 대략 0.5 백만 세포에서). 세포는 T-016 프로그램에 따라 뉴클레오펙터 (Lonza) 상에서 뉴클레오펙터 용액 V (Lonza)로 형질감염되었다. 각 뉴클레오펙션은 대략 0.6 백만 세포를 내포하였다. 형질감염 처리는 표 7에서 상술된다. 세포는 뉴클레오펙션 직후에 37 ℃ 및 5% CO2에서 성장되었다.
처리 | 변형된 Cas9 | 유도 RNA | 공여자 서열 |
A | 안티 리버스 Cap 유사체와 함께 전사된 Cas9 mRNA (10 μg) |
미리 어닐링된 crRNA-tracrRNA 이중나선 (0.3 nmol) | AAVS1-GFP 플라스미드 DNA (10 μg) |
B | 안티 리버스 Cap 유사체와 함께 전사된 Cas9 mRNA (10 μg) |
키메라 RNA (0.3 nmol) | AAVS1-GFP 플라스미드 DNA (10 μg) |
C | 전사후 캡핑 반응을 통해 캡핑된 Cas9 mRNA (10 μg) |
키메라 RNA (0.3 nmol) | AAVS1-GFP 플라스미드 DNA (10 μg) |
D | Cas9 플라스미드 DNA (10 μg) | U6-키메라 RNA 플라스미드 DNA (5 μg) | AAVS1-GFP 플라스미드 DNA (10 μg) |
E | 없음 | 없음 | AAVS1-GFP 플라스미드 DNA (10 μg) |
F | 없음 | 없음 | 없음 |
형광-활성화된 세포 분류 (FACS)가 형질감염 후 4 일에 수행되었다. FACS 데이터는 도면 4에서 제공된다. 4가지 실험적 처리 (A-D) 각각에서 검출된 퍼센트 GFP는 대조 처리 (E, F)에서보다 보다 컸는데, 이것은 공여자 서열의 통합 및 융합 단백질의 발현을 확증한다.
실시예 5: 표적화된 통합의 PCR 확증
유전체학 DNA는 형질감염 후 12 일에 GenElute 포유류 유전체학 DNA Miniprep 키트 (Sigma)로, 형질감염된 세포로부터 추출되었다. 유전체학 DNA는 이후, AAVS1-GFP 플라스미드 공여자의 5' 상동성 팔 외측에 위치된 전방 프라이머 및 GFP의 5' 영역에서 위치된 후방 프라이머로 PCR 증폭되었다. 전방 프라이머는 5'- CCACTCTGTGCTGACCACTCT-3' (서열 번호:18)이고, 그리고 후방 프라이머는 5'- GCGGCACTCGATCTCCA-3' (서열 번호:19)이었다. 접합부 PCR로부터 예상된 단편 크기는 1388 bp이었다. 증폭은 다음 순환 조건을 이용하여, JumpStart Taq ReadyMix (Sigma)로 수행되었다: 초기 변성을 위한 98℃에서 2 분; 98℃에서 15 초, 62℃에서 30 초, 그리고 72℃에서 1분 30 초의 35회 주기; 그리고 72℃에서 5 분 동안 최종 신장. PCR 산물은 1% 아가로오스 겔 상에서 분해되었다.
안티 리버스 Cap 유사체와 함께 전사된Cas9 mRNA 10 μg, 0.3 nmol의 미리 어닐링된 crRNA-tracrRNA 이중나선, 그리고 10 μg의 AAVS1-GFP 플라스미드 DNA로 형질감염된 세포는 예상된 크기의 PCR 산물을 전시하였다 (참조: 레인 A, 도면 5).
실시예 6: 생쥐 배아에서 Cas9-기초된 유전체 편집
생쥐 Rosa26 좌위가 유전체 변형을 위해 표적화될 수 있다. 표 8은 잠재적 표적 부위가 굵은 글씨체로 표시되는 생쥐 Rosa26 서열의 부분을 제공한다. 각 표적 부위는 프로토스페이서를 포함한다.
GAGCGGCTGCGGGGCGGGTGCAAGCACGTTTCCGACTTGAGTTGCCTCAAGAGGGGCGTGCTGAGCCAGACCTCCATCGCGCACTCCGGGGAGTGGAGGGAAGGAGCGAGGGCTCAGTTGGGCTGTTTTGGAGGCAGGAAGCACTTGCTCTCCCAAAGTCGCTCTGAGTTGTTATCAGTAAGGGAGCTGCAGTGGAGTAGGCGGGGAGAAGGCCGCACCCTTCTCCGGAGGGGGGAGGGGAGTGTTGCAATACCTTTCTGGGAGTTCTCTGCTGCCTCCTGGCTTCTGAGGACCGCCCTGGGCCTGGGAGAATCCCTTCCCCCTCTTCCCTCGTGATCTGCAACTCCAGTCTTTCTAGAAGATGGGCGGGAGTCTTCTGGGCAGGCTTAAAGGCTAACCTGGTGTGTGGGCGTTGTCCTGCAGGGGAATTGAACAGGTGTAAAATTGGAGGGACAAGACTTCCCACAGATTTTCGGTTTTGTCGGGAAGTTTTTTAATAGGGGCAAATAAGGAAAATGGGAGGATAGGTAGTCATCTGGGGTTTTATGCAGCAAAACTACAGGTTATTATTGCTTGTGATCCGCCTCGGAGTATTTTCCATCGAGGTAGATTAAAGACATGCTCACCCGAGTTTTATACTCTCCTGCTTGAGATCCTTACTACAGTATGAAATTACAGTGTCGCGAGTTAGACTATGTAAGCAGAATTTTA (서열 번호:20) |
유도 RNA는 생쥐 Rosa26 좌위에서 각 표적 부위를 표적으로 하도록 설계되었다. 서열은 표 9에서 도시되는데, 각각 길이에서 42개 뉴클레오티드이고, 그리고 5' 영역이 표 8에서 제공되지 않은 가닥 (즉, 표 8에서 도시된 가닥에 상보적인 가닥)에 상보적이다.
RNA | 5'-3' 서열 | 서열 번호: |
mRosa26-crRNA-1 | CUCCAGUCUUUCUAGAAGAUGUUUUAGAGCUAUGCUGUUUUG | 21 |
mRosa26-crRNA-2 | UGAACAGGUGUAAAAUUGGAGUUUUAGAGCUAUGCUGUUUUG | 22 |
mRosa26-crRNA-3 | UGUCGGGAAGUUUUUUAAUAGUUUUAGAGCUAUGCUGUUUUG | 23 |
crRNA가 화학적으로 합성되고 tracrRNA에 미리 어닐링되었다 (서열 번호:13; 실시예 2 참조). 미리 어닐링된 crRNA / tracrRNA 및 변형된 Cas9 단백질을 인코딩하는 시험관내 전사된 mRNA (서열 번호. 9; 실시예 1 참조)는 수태된 생쥐 배아의 전핵 내로 미량주사될 수 있다. crRNA에 의한 표적 세트로 유도 시에, Cas9 단백질은 표적 부위를 개열하고, 그리고 결과의 이중 가닥 절단이 비상동성 말단 연결 (NHEJ) 복구 과정을 통해 복구될 수 있다. 주사된 배아는 37℃, 5% CO2에서 하룻밤 동안 또는 최대 4 일 동안 배양되고, 그 이후에 유전형자분석될 수 있거나, 또는 주사된 배아는 생존 출산 동물이 유전자형분석될 수 있도록 수용자 암컷 생쥐 내로 이식될 수 있다. 생존 출산 동물로부터 시험관내-배양된 배아 또는 조직은 표준 방법을 이용하여, Rosa 좌위에서 Cas9-유발 돌연변이의 존재에 대해 스크리닝될 수 있다. 가령, 태아 또는 생존 출산 동물로부터 배아 또는 조직은 DNA 추출과 분석을 위해 수확될 수 있다. DNA는 표준 절차를 이용하여 단리될 수 있다. Rosa26 좌위의 표적화된 영역은 적절한 프라이머를 이용하여 PCR 증폭될 수 있다. NHEJ가 오류 가능하기 때문에, 최소한 하나의 뉴클레오티드의 결실, 최소한 하나의 뉴클레오티드의 삽입, 최소한 하나의 뉴클레오티드의 치환, 또는 이들의 조합이 상기 절단의 복구 동안 일어날 수 있다. 돌연변이는 PCR-기초된 유전자형분석 방법, 예를 들면, Cel-I 불일치 검정 및 DNA 염기서열결정을 이용하여 검출될 수 있다.
실시예 7: 생쥐 배아에서 Cas9-기초된 유전체 변형
Rosa26 좌위는 상기 실시예 6에서 설명된 바와 같은 미리 어닐링된 crRNA / tracrRNA 및 변형된 Cas9를 인코딩하는 mRNA와 함께, 상기 섹션 (IV)(d)에서 상술된 바와 같이, 공여자 폴리뉴클레오티드를 공동 주사함으로써 생쥐 배아에서 변형될 수 있다. 생존 출산 동물로부터 시험관내-배양된 배아 또는 조직 (실시예 6에서 설명된 바와 같이)은 PCR-기초된 유전자형분석 방법, 예를 들면, RFLP 검정, 접합부 PCR, 그리고 DNA 염기서열결정을 이용하여, 변형된 Rosa26 좌위에 대해 스크리닝될 수 있다.
실시예 8: 쥐 배아에서 Cas9-기초된 유전체 편집
쥐 Rosa26 좌위가 유전체 변형을 위해 표적화될 수 있다. 표 10은 잠재적 표적 부위가 굵은 글씨체로 표시되는 쥐 서열의 부분을 제공한다. 각 표적 부위는 프로토스페이서를 포함한다.
GGGATTCCTCCTTGAGTTGTGGCACTGAGGAACGTGCTGAACAAGACCTACATTGCACTCCAGGGAGTGGATGAAGGAGTTGGGGCTCAGTCGGGTTGTATTGGAGACAAGAAGCACTTGCTCTCCAAAAGTCGGTTTGAGTTATCATTAAGGGAGCTGCAGTGGAGTAGGCGGAGAAAAGGCCGCACCCTTCTCAGGACGGGGGAGGGGAGTGTTGCAATACCTTTCTGGGAGTTCTCTGCTGCCTCCTGTCTTCTGAGGACCGCCCTGGGCCTGGAAGATTCCCTTCCCCCTTCTTCCCTCGTGATCTGCAACTGGAGTCTTTCTGGAAGATAGGCGGGAGTCTTCTGGGCAGGCTTAAAGGCTAACCTGGTGCGTGGGGCGTTGTCCTGCAGAGGAATTGAACAGGTGTAAAATTGGAGGGGCAAGACTTCCCACAGATTTTCGATTGTGTTGTTAAGTATTGTAATAGGGGCAAATAAGGGAAATAGACTAGGCACTCACCTGGGGTTTTATGCAGCAAAACTACAGGTTATTATTGCTTGTGATCCGCCCTGGAGAATTTTTCACCGAGGTAGATTGAAGACATGCCCACCCAAATTTTAATATTCTTCCACTTGCGATCCTTGCTACAGTATGAAA (서열 번호:24) |
유도 RNA는 쥐 Rosa26 좌위에서 각 표적 부위를 표적으로 하도록 설계되었다. 서열은 표 11에서 도시되는데, 각각 길이에서 42개 뉴클레오티드이고, 그리고 5' 영역이 표 10에서 제공되지 않은 가닥 (즉, 표 10에서 도시된 가닥에 상보적인 가닥)에 상보적이다.
RNA | 5'-3' 서열 | 서열 번호: |
rRosa26-crRNA-1 | AGGGGGAAGGGAAUCUUCCAGUUUUAGAGCUAUGCUGUUUUG | 25 |
rRosa26-crRNA-2 | UCUGCAACUGGAGUCUUUCUGUUUUAGAGCUAUGCUGUUUUG | 26 |
rRosa26-crRNA-3 | AGGCGGGAGUCUUCUGGGCAGUUUUAGAGCUAUGCUGUUUUG | 27 |
crRNA가 화학적으로 합성되고 tracrRNA에 미리 어닐링되었다 (서열 번호:13; 실시예 2 참조). 미리 어닐링된 crRNA / tracrRNA 및 변형된 Cas9 단백질을 인코딩하는 시험관내 전사된 mRNA (서열 번호. 9; 실시예 1 참조)는 수태된 쥐 배아의 전핵 내로 미량주사될 수 있다. crRNA에 의한 표적 세트로 유도 시에, Cas9 단백질은 표적 부위를 개열하고, 그리고 결과의 이중 가닥 절단이 비상동성 말단 연결 (NHEJ) 복구 과정을 통해 복구될 수 있다. 주사된 배아는 37℃, 5% CO2에서 하룻밤 동안 또는 최대 4 일 동안 배양되고, 그 이후에 유전형자분석될 수 있거나, 또는 주사된 배아는 생존 출산 동물이 유전자형분석될 수 있도록 수용자 암컷 생쥐 내로 이식될 수 있다. 생존 출산 동물로부터 시험관내-배양된 배아 또는 조직은 표준 방법을 이용하여, Rosa 좌위에서 Cas9-유발 돌연변이의 존재에 대해 스크리닝될 수 있다. 가령, 태아 또는 생존 출산 동물로부터 배아 또는 조직은 DNA 추출과 분석을 위해 수확될 수 있다. DNA는 표준 절차를 이용하여 단리될 수 있다. Rosa26 좌위의 표적화된 영역은 적절한 프라이머를 이용하여 PCR 증폭될 수 있다. NHEJ가 오류 가능하기 때문에, 최소한 하나의 뉴클레오티드의 결실, 최소한 하나의 뉴클레오티드의 삽입, 최소한 하나의 뉴클레오티드의 치환, 또는 이들의 조합이 상기 절단의 복구 동안 일어날 수 있다. 돌연변이는 PCR-기초된 유전자형분석 방법, 예를 들면, Cel-I 불일치 검정 및 DNA 염기서열결정을 이용하여 검출될 수 있다.
실시예 9: 쥐 배아에서 Cas9-기초된 유전체 변형
Rosa26 좌위는 상기 실시예 8에서 설명된 바와 같은 미리 어닐링된 crRNA / tracrRNA 및 변형된 Cas9를 인코딩하는 mRNA와 함께, 상기 섹션 (IV)(d)에서 상술된 바와 같이, 공여자 폴리뉴클레오티드를 공동 주사함으로써 쥐 배아에서 변형될 수 있다. 생존 출산 쥐로부터 시험관내-배양된 배아 또는 조직 (실시예 8에서 설명된 바와 같이)은 PCR-기초된 유전자형분석 방법, 예를 들면, RFLP 검정, 접합부 PCR, 그리고 DNA 염기서열결정을 이용하여, 변형된 Rosa26 좌위에 대해 스크리닝될 수 있다.
SEQUENCE LISTING
<110> SIGMA-ALDRICH CO. LLC
CHEN, Fuqiang
DAVIS, Gregory D.
KANG, Qiaohua
KNIGHT, Scott W.
<120> CRISPR-BASED GENOME MODIFICATION AND REGULATION
<130> 047497-465606
<150> US 61/734,256
<151> 2012-12-06
<150> US 61/758,624
<151> 2013-01-30
<150> US 61/761,046
<151> 2013-02-05
<150> US 61/794,422
<151> 2013-03-15
<160> 27
<170> PatentIn version 3.5
<210> 1
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> SYNTHESIZED
<400> 1
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 2
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> SYNTHESIZED
<400> 2
Pro Lys Lys Lys Arg Arg Val
1 5
<210> 3
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> SYNTHESIZED
<400> 3
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 4
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> SYNTHESIZED
<400> 4
Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg Pro Pro Gln Pro Lys Lys
1 5 10 15
Lys Arg Lys Val
20
<210> 5
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> SYNTHESIZED
<400> 5
Pro Leu Ser Ser Ile Phe Ser Arg Ile Gly Asp Pro Pro Lys Lys Lys
1 5 10 15
Arg Lys Val
<210> 6
<211> 24
<212> PRT
<213> Artificial Sequence
<220>
<223> SYNTHESIZED
<400> 6
Gly Ala Leu Phe Leu Gly Trp Leu Gly Ala Ala Gly Ser Thr Met Gly
1 5 10 15
Ala Pro Lys Lys Lys Arg Lys Val
20
<210> 7
<211> 27
<212> PRT
<213> Artificial Sequence
<220>
<223> SYNTHESIZED
<400> 7
Gly Ala Leu Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser Thr Met Gly
1 5 10 15
Ala Trp Ser Gln Pro Lys Lys Lys Arg Lys Val
20 25
<210> 8
<211> 21
<212> PRT
<213> Artificial Sequence
<220>
<223> SYNTHESIZED
<400> 8
Lys Glu Thr Trp Trp Glu Thr Trp Trp Thr Glu Trp Ser Gln Pro Lys
1 5 10 15
Lys Lys Arg Lys Val
20
<210> 9
<211> 1374
<212> PRT
<213> Artificial Sequence
<220>
<223> SYNTHESIZED
<400> 9
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Asp Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Gly Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Ala Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Ile Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Arg Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Arg Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Ser Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Ala Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Gly Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly His Ser Leu
705 710 715 720
His Glu Gln Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Ile Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr
755 760 765
Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu
770 775 780
Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val
785 790 795 800
Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln
805 810 815
Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu
820 825 830
Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Ile Lys Asp
835 840 845
Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
850 855 860
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn
865 870 875 880
Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe
885 890 895
Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys
900 905 910
Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys
915 920 925
His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
930 935 940
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys
945 950 955 960
Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
965 970 975
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val
980 985 990
Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val
995 1000 1005
Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys
1010 1015 1020
Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr
1025 1030 1035
Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn
1040 1045 1050
Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr
1055 1060 1065
Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg
1070 1075 1080
Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu
1085 1090 1095
Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg
1100 1105 1110
Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys
1115 1120 1125
Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu
1130 1135 1140
Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser
1145 1150 1155
Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe
1160 1165 1170
Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu
1175 1180 1185
Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe
1190 1195 1200
Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu
1205 1210 1215
Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn
1220 1225 1230
Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro
1235 1240 1245
Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His
1250 1255 1260
Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg
1265 1270 1275
Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr
1280 1285 1290
Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile
1295 1300 1305
Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe
1310 1315 1320
Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr
1325 1330 1335
Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly
1340 1345 1350
Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Pro
1355 1360 1365
Lys Lys Lys Arg Lys Val
1370
<210> 10
<211> 4122
<212> DNA
<213> Artificial Sequence
<220>
<223> SYNTHESIZED
<400> 10
atggacaaga agtacagcat cggcctggac atcggcacca actctgtggg ctgggccgtg 60
atcaccgacg actacaaggt gcccagcaag aaattcaagg tgctgggcaa caccgaccgg 120
cacagcatca agaagaacct gatcggcgcc ctgctgttcg gctctggcga aacagccgag 180
gccacccggc tgaagagaac cgccagaaga agatacacca gacggaagaa ccggatctgc 240
tatctgcaag agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacaga 300
ctggaagagt ccttcctggt ggaagaggat aagaagcacg agcggcaccc catcttcggc 360
aacatcgtgg acgaggtggc ctaccacgag aagtacccca ccatctacca cctgagaaag 420
aagctggccg acagcaccga caaggccgac ctgagactga tctacctggc cctggcccac 480
atgatcaagt tccggggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac 540
gtggacaagc tgttcatcca gctggtgcag atctacaatc agctgttcga ggaaaacccc 600
atcaacgcca gcagagtgga cgccaaggcc atcctgagcg ccagactgag caagagcaga 660
cggctggaaa atctgatcgc ccagctgccc ggcgagaagc ggaatggcct gttcggcaac 720
ctgattgccc tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag 780
gatgccaaac tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 840
cagatcggcg accagtacgc cgacctgttt ctggccgcca agaacctgtc cgacgccatc 900
ctgctgagcg acatcctgag agtgaacagc gagatcacca aggcccccct gtccgcctct 960
atgatcaaga gatacgacga gcaccaccag gacctgaccc tgctgaaagc tctcgtgcgg 1020
cagcagctgc ctgagaagta caaagagatt ttcttcgacc agagcaagaa cggctacgcc 1080
ggctacatcg atggcggagc cagccaggaa gagttctaca agttcatcaa gcccatcctg 1140
gaaaagatgg acggcaccga ggaactgctc gtgaagctga acagagagga cctgctgcgg 1200
aagcagcgga ccttcgacaa cggcagcatc ccccaccaga tccacctggg agagctgcac 1260
gccattctgc ggcggcagga agatttttac ccattcctga aggacaaccg ggaaaagatc 1320
gagaagatcc tgaccttcag aatcccctac tacgtgggcc ctctggccag gggaaacagc 1380
agattcgcct ggatgaccag aaagagcgag gaaaccatca ccccctggaa cttcgaggaa 1440
gtggtggaca agggcgccag cgcccagagc ttcatcgagc ggatgaccaa cttcgataag 1500
aacctgccca acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg 1560
tacaacgagc tgaccaaagt gaaatacgtg accgagggaa tgcggaagcc cgcctttctg 1620
agcggcgagc agaaaaaggc catcgtggac ctgctgttca agaccaaccg gaaagtgacc 1680
gtgaagcagc tgaaagagga ctacttcaag aaaatcgagt gcttcgacag cgtggaaatc 1740
agcggcgtgg aagatcggtt caacgcctcc ctgggcgcct atcacgatct gctgaaaatt 1800
atcaaggaca aggacttcct ggacaatgag gaaaacgagg acattctgga agatatcgtg 1860
ctgaccctga cactgtttga ggaccggggc atgatcgagg aacggctgaa aacctatgcc 1920
cacctgttcg acgacaaagt gatgaagcag ctgaagcggc ggagatacac cggctggggc 1980
aggctgagcc ggaagctgat caacggcatc cgggacaagc agtccggcaa gacaatcctg 2040
gatttcctga agtccgacgg cttcgccaac agaaacttca tgcagctgat ccacgacgac 2100
agcctgacct ttaaagagga catccagaaa gcccaggtgt ccggccaggg acactctctg 2160
cacgagcaga tcgccaatct ggccggatcc cccgccatta agaagggcat cctgcagaca 2220
gtgaagattg tggacgagct cgtgaaagtg atgggccaca agcccgagaa catcgtgatc 2280
gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg 2340
aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg 2400
gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat 2460
atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccacatt 2520
gtgccccagt ccttcatcaa ggacgactcc atcgataaca aagtgctgac tcggagcgac 2580
aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac 2640
tactggcgcc agctgctgaa tgccaagctg attacccaga ggaagttcga caatctgacc 2700
aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcattaa gcggcagctg 2760
gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact 2820
aagtacgacg agaacgacaa actgatccgg gaagtgaaag tgatcaccct gaagtccaag 2880
ctggtgtccg acttcagaaa ggatttccag ttttacaaag tgcgcgagat caacaactac 2940
caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac 3000
cctaagctgg aaagcgagtt cgtgtacggc gattacaagg tgtacgacgt gcggaagatg 3060
atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac 3120
atcatgaact ttttcaagac cgagatcaca ctggccaacg gcgagatcag aaagcggcct 3180
ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc 3240
acagtgcgga aagtgctgtc catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag 3300
accggcggct tcagcaaaga gtctatcctg cccaagagga actccgacaa gctgatcgcc 3360
agaaagaagg attgggaccc taagaagtac ggcggctttg acagccccac cgtggcctac 3420
tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa 3480
gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt 3540
ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac 3600
tccctgttcg agctggaaaa cggccggaag cggatgctgg cttctgccgg cgaactgcag 3660
aagggaaacg agctggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac 3720
tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag 3780
cacaagcact acctggacga gatcatcgag cagattagcg agttctccaa gcgcgtgatc 3840
ctggccgatg ccaacctgga caaggtgctg agcgcctaca acaagcaccg ggataagccc 3900
atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaacct gggagcccct 3960
gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag 4020
gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac 4080
ctgtctcagc tgggaggcga ccccaagaaa aagcgcaaag tg 4122
<210> 11
<211> 4764
<212> DNA
<213> Homo sapiens
<400> 11
gcgggcgggc ggtgcgatgt ccggagagga tggcccggcg gctggcccgg gggcggcggc 60
ggcggctgcc cgggagcggc gacgggagca gctgcggcag tggggggcgc gggcgggcgc 120
cgagcctggc cccggagagc gccgcgcccg caccgtccgc ttcgagcgcg ccgccgagtt 180
cctggcggcc tgtgcgggcg gcgacctgga cgaggcgcgt ctgatgctgc gcgccgccga 240
ccctggcccc ggcgccgagc tcgaccccgc cgcgccgccg cccgcccgcg ccgtgctgga 300
ctccaccaac gccgacggta tcagcgccct gcaccaggtc agcgcccccc gcccggcgtc 360
tcccggggcc aggtccaccc tctgctgcgc cacctggggc atcctccttc cccgttgcca 420
gtctcgatcc gccccgtcgt tcctggccct gggctttgcc accctatgct gacaccccgt 480
cccagtcccc cttaccattc cccttcgacc accccacttc cgaattggag ccgcttcaac 540
tggccctggg cttagccact ctgtgctgac cactctgccc caggcctcct taccattccc 600
cttcgaccta ctctcttccg cattggagtc gctttaactg gccctggctt tggcagcctg 660
tgctgaccca tgcagtcctc cttaccatcc ctccctcgac ttcccctctt ccgatgttga 720
gcccctccag ccggtcctgg actttgtctc cttccctgcc ctgccctctc ctgaacctga 780
gccagctccc atagctcagt ctggtctatc tgcctggccc tggccattgt cactttgcgc 840
tgccctcctc tcgcccccga gtgcccttgc tgtgccgccg gaactctgcc ctctaacgct 900
gccgtctctc tcctgagtcc ggaccacttt gagctctact ggcttctgcg ccgcctctgg 960
cccactgttt ccccttccca ggcaggtcct gctttctctg acctgcattc tctcccctgg 1020
gcctgtgccg ctttctgtct gcagcttgtg gcctgggtca cctctacggc tggcccagat 1080
ccttccctgc cgcctccttc aggttccgtc ttcctccact ccctcttccc cttgctctct 1140
gctgtgttgc tgcccaagga tgctctttcc ggagcacttc cttctcggcg ctgcaccacg 1200
tgatgtcctc tgagcggatc ctccccgtgt ctgggtcctc tccgggcatc tctcctccct 1260
cacccaaccc catgccgtct tcactcgctg ggttcccttt tccttctcct tctggggcct 1320
gtgccatctc tcgtttctta ggatggcctt ctccgacgga tgtctccctt gcgtcccgcc 1380
tccccttctt gtaggcctgc atcatcaccg tttttctgga caaccccaaa gtaccccgtc 1440
tccctggctt tagccacctc tccatcctct tgctttcttt gcctggacac cccgttctcc 1500
tgtggattcg ggtcacctct cactcctttc atttgggcag ctcccctacc ccccttacct 1560
ctctagtctg tgctagctct tccagccccc tgtcatggca tcttccaggg gtccgagagc 1620
tcagctagtc ttcttcctcc aacccgggcc cctatgtcca cttcaggaca gcatgtttgc 1680
tgcctccagg gatcctgtgt ccccgagctg ggaccacctt atattcccag ggccggttaa 1740
tgtggctctg gttctgggta cttttatctg tcccctccac cccacagtgg ggccactagg 1800
gacaggattg gtgacagaaa agccccatcc ttaggcctcc tccttcctag tctcctgata 1860
ttgggtctaa cccccacctc ctgttaggca gattccttat ctggtgacac acccccattt 1920
cctggagcca tctctctcct tgccagaacc tctaaggttt gcttacgatg gagccagaga 1980
ggatcctggg agggagagct tggcaggggg tgggagggaa gggggggatg cgtgacctgc 2040
ccggttctca gtggccaccc tgcgctaccc tctcccagaa cctgagctgc tctgacgcgg 2100
ccgtctggtg cgtttcactg atcctggtgc tgcagcttcc ttacacttcc caagaggaga 2160
agcagtttgg aaaaacaaaa tcagaataag ttggtcctga gttctaactt tggctcttca 2220
cctttctagt ccccaattta tattgttcct ccgtgcgtca gttttacctg tgagataagg 2280
ccagtagcca gccccgtcct ggcagggctg tggtgaggag gggggtgtcc gtgtggaaaa 2340
ctccctttgt gagaatggtg cgtcctaggt gttcaccagg tcgtggccgc ctctactccc 2400
tttctctttc tccatccttc tttccttaaa gagtccccag tgctatctgg gacatattcc 2460
tccgcccaga gcagggtccc gcttccctaa ggccctgctc tgggcttctg ggtttgagtc 2520
cttggcaagc ccaggagagg cgctcaggct tccctgtccc ccttcctcgt ccaccatctc 2580
atgcccctgg ctctcctgcc ccttccctac aggggttcct ggctctgctc ttcagactga 2640
gccccgttcc cctgcatccc cgttcccctg catccccctt cccctgcatc ccccagaggc 2700
cccaggccac ctacttggcc tggaccccac gagaggccac cccagccctg tctaccaggc 2760
tgccttttgg gtggattctc ctccaactgt ggggtgactg cttggcaaac tcactcttcg 2820
gggtatccca ggaggcctgg agcattgggg tgggctgggg ttcagagagg agggattccc 2880
ttctcaggtt acgtggccaa gaagcagggg agctgggttt gggtcaggtc tgggtgtggg 2940
gtgaccagct tatgctgttt gcccaggaca gcctagtttt agcactgaaa ccctcagtcc 3000
taggaaaaca gggatggttg gtcactgtct ctgggtgact cttgattccc ggccagtttc 3060
tccacctggg gctgtgtttc tcgtcctgca tccttctcca ggcaggtccc caagcatcgc 3120
ccccctgctg tggctgttcc caagttctta gggtacccca cgtgggttta tcaaccactt 3180
ggtgaggctg gtaccctgcc cccattcctg caccccaatt gccttagtgg ctagggggtt 3240
gggggctaga gtaggagggg ctggagccag gattcttagg gctgaacaga gaagagctgg 3300
gggcctgggc tcctgggttt gagagaggag gggctggggc ctggactcct gggtccgagg 3360
gaggaggggc tggggcctgg actcctgggt ctgagggtgg agggactggg ggcctggact 3420
cctgggtccg agggaggagg ggctggggcc tggactcgtg ggtctgaggg aggaggggct 3480
gggggcctgg acttctgggt cttagggagg cggggctggg cctggacccc tgggtctgaa 3540
tggggagagg ctgggggcct ggactccttc atctgagggc ggaagggctg gggcctggcc 3600
tcctgggttg aatggggagg ggttgggcct ggactctgga gtccctggtg cccaggcctc 3660
aggcatcttt cacagggatg cctgtactgg gcaggtcctt gaaagggaaa ggcccattgc 3720
tctccttgcc cccctcccct atcgccatga caactgggtg gaaataaacg agccgagttc 3780
atcccgttcc cagggcacgt gcggcccctt cacagcccga gtttccatga cctcatgctc 3840
ttggccctcg tagctccctc ccgcctcctc cagatgggca gctttggaga ggtgagggac 3900
ttggggggta atttatcccg tggatctagg agtttagctt cactccttcc tcagctccag 3960
ttcaggtccc ggagcccacc cagtgtccac aaggcctggg gcaagtccct cctccgaccc 4020
cctggacttc ggcttttgtc cccccaagtt ttggacccct aagggaagaa tgagaaacgg 4080
tggcccgtgt cagcccctgg ctgcagggcc ccgtgcagag ggggcctcag tgaactggag 4140
tgtgacagcc tggggcccag gcacacaggt gtgcagctgt ctcacccctc tgggagtccc 4200
gcccaggccc ctgagtctgt cccagcacag ggtggccttc ctccaccctg catagccctg 4260
ggcccacggc ttcgttcctg cagagtatct gctggggtgg tttccgagct tgacccttgg 4320
aaggacctgg ctgggtttaa ggcaggaggg gctgggggcc aggactcctg gctctgaagg 4380
aggaggggct ggaacctctt ccctagtctg agcactggaa gcgccacctg tgggtggtga 4440
cgggggtttt gccgtgtcta acaggtacca tgtggggttc ccgcacccag atgagaagcc 4500
ccctcccttc cccgttcact tcctgtttgc agatagccag gagtcctttc gtggtttcca 4560
ctgagcactg aaggcctggc cggcctgacc actgggcaac caggcgtatc ttaaacagcc 4620
agtggccaga ggctgttggg tcattttccc cactgtccta gcaccgtgtc cctggatctg 4680
ttttcgtggc tccctctgga gtcccgactt gctgggacac cgtggctggg gtaggtgcgg 4740
ctgacggctg tttcccaccc ccag 4764
<210> 12
<211> 42
<212> RNA
<213> Artificial Sequence
<220>
<223> SYNTHESIZED
<400> 12
accccacagu ggggccacua guuuuagagc uaugcuguuu ug 42
<210> 13
<211> 86
<212> RNA
<213> Artificial Sequence
<220>
<223> SYNTHESIZED
<400> 13
ggaaccauuc aaaacagcau agcaaguuaa aauaaggcua guccguuauc aacuugaaaa 60
aguggcaccg agucggugcu uuuuuu 86
<210> 14
<211> 62
<212> RNA
<213> Artificial Sequence
<220>
<223> SYNTHESIZED
<400> 14
accccacagu ggggccacua guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60
cg 62
<210> 15
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> SYNTHESIZED
<400> 15
ctgacctctt ctcttcctcc cacag 25
<210> 16
<211> 1009
<212> DNA
<213> Artificial Sequence
<220>
<223> SYNTHESIZED
<400> 16
gccaccatgg actacaaaga cgatgacgac aaggtcgact ctagagctgc agagagcgac 60
gagagcggcc tgcccgccat ggagatcgag tgccgcatca ccggcaccct gaacggcgtg 120
gagttcgagc tggtgggcgg cggagagggc acccccgagc agggccgcat gaccaacaag 180
atgaagagca ccaaaggcgc cctgaccttc agcccctacc tgctgagcca cgtgatgggc 240
tacggcttct accacttcgg cacctacccc agcggctacg agaacccctt cctgcacgcc 300
atcaacaacg gcggctacac caacacccgc atcgagaagt acgaggacgg cggcgtgctg 360
cacgtgagct tcagctaccg ctacgaggcc ggccgcgtga tcggcgactt caaggtgatg 420
ggcaccggct tccccgagga cagcgtgatc ttcaccgaca agatcgtccg cagcaacgcc 480
accgtggagc acctgcaccc catgggcgat aacgatctgg atggcagctt cacccgcacc 540
ttcagcctgc gcgacggcgg ctactacagc tccgtggtgg acagccacat gcacttcaag 600
agcgccatcc accccagcat cctgcagaac gggggcccca tgttcgcctt ccgccgcgtg 660
gaggaggatc acagcaacac cgagctgggc atcgtggagt accagcacgc cttcaagacc 720
ccggatgcag atgccggtga agaatgaaga tctctgtgcc ttctagttgc cagccatctg 780
ttgtttgccc ctcccccgtg ccttccttga ccctggaagg tgccactccc actgtccttt 840
cctaataaaa tgaggaaatt gcatcgcatt gtctgagtag gtgtcattct attctggggg 900
gtggggtggg gcaggacagc aagggggagg attgggaaga caatagcagg catgctgggg 960
atgcggtggg ctctatggac tcgaggttta aacgtcgacg cggccgcgt 1009
<210> 17
<211> 355
<212> PRT
<213> Artificial Sequence
<220>
<223> SYNTHESIZED
<400> 17
Met Ser Gly Glu Asp Gly Pro Ala Ala Gly Pro Gly Ala Ala Ala Ala
1 5 10 15
Ala Ala Arg Glu Arg Arg Arg Glu Gln Leu Arg Gln Trp Gly Ala Arg
20 25 30
Ala Gly Ala Glu Pro Gly Pro Gly Glu Arg Arg Ala Arg Thr Val Arg
35 40 45
Phe Glu Arg Ala Ala Glu Phe Leu Ala Ala Cys Ala Gly Gly Asp Leu
50 55 60
Asp Glu Ala Arg Leu Met Leu Arg Ala Ala Asp Pro Gly Pro Gly Ala
65 70 75 80
Glu Leu Asp Pro Ala Ala Pro Pro Pro Ala Arg Ala Val Leu Asp Ser
85 90 95
Thr Asn Ala Asp Gly Ile Ser Ala Leu His Gln Ala Thr Met Asp Tyr
100 105 110
Lys Asp Asp Asp Asp Lys Val Asp Ser Arg Ala Ala Glu Ser Asp Glu
115 120 125
Ser Gly Leu Pro Ala Met Glu Ile Glu Cys Arg Ile Thr Gly Thr Leu
130 135 140
Asn Gly Val Glu Phe Glu Leu Val Gly Gly Gly Glu Gly Thr Pro Glu
145 150 155 160
Gln Gly Arg Met Thr Asn Lys Met Lys Ser Thr Lys Gly Ala Leu Thr
165 170 175
Phe Ser Pro Tyr Leu Leu Ser His Val Met Gly Tyr Gly Phe Tyr His
180 185 190
Phe Gly Thr Tyr Pro Ser Gly Tyr Glu Asn Pro Phe Leu His Ala Ile
195 200 205
Asn Asn Gly Gly Tyr Thr Asn Thr Arg Ile Glu Lys Tyr Glu Asp Gly
210 215 220
Gly Val Leu His Val Ser Phe Ser Tyr Arg Tyr Glu Ala Gly Arg Val
225 230 235 240
Ile Gly Asp Phe Lys Val Met Gly Thr Gly Phe Pro Glu Asp Ser Val
245 250 255
Ile Phe Thr Asp Lys Ile Val Arg Ser Asn Ala Thr Val Glu His Leu
260 265 270
His Pro Met Gly Asp Asn Asp Leu Asp Gly Ser Phe Thr Arg Thr Phe
275 280 285
Ser Leu Arg Asp Gly Gly Tyr Tyr Ser Ser Val Val Asp Ser His Met
290 295 300
His Phe Lys Ser Ala Ile His Pro Ser Ile Leu Gln Asn Gly Gly Pro
305 310 315 320
Met Phe Ala Phe Arg Arg Val Glu Glu Asp His Ser Asn Thr Glu Leu
325 330 335
Gly Ile Val Glu Tyr Gln His Ala Phe Lys Thr Pro Asp Ala Asp Ala
340 345 350
Gly Glu Glu
355
<210> 18
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> SYNTHESIZED
<400> 18
ccactctgtg ctgaccactc t 21
<210> 19
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> SYNTHESIZED
<400> 19
gcggcactcg atctcca 17
<210> 20
<211> 711
<212> DNA
<213> Mus musculus
<400> 20
gagcggctgc ggggcgggtg caagcacgtt tccgacttga gttgcctcaa gaggggcgtg 60
ctgagccaga cctccatcgc gcactccggg gagtggaggg aaggagcgag ggctcagttg 120
ggctgttttg gaggcaggaa gcacttgctc tcccaaagtc gctctgagtt gttatcagta 180
agggagctgc agtggagtag gcggggagaa ggccgcaccc ttctccggag gggggagggg 240
agtgttgcaa tacctttctg ggagttctct gctgcctcct ggcttctgag gaccgccctg 300
ggcctgggag aatcccttcc ccctcttccc tcgtgatctg caactccagt ctttctagaa 360
gatgggcggg agtcttctgg gcaggcttaa aggctaacct ggtgtgtggg cgttgtcctg 420
caggggaatt gaacaggtgt aaaattggag ggacaagact tcccacagat tttcggtttt 480
gtcgggaagt tttttaatag gggcaaataa ggaaaatggg aggataggta gtcatctggg 540
gttttatgca gcaaaactac aggttattat tgcttgtgat ccgcctcgga gtattttcca 600
tcgaggtaga ttaaagacat gctcacccga gttttatact ctcctgcttg agatccttac 660
tacagtatga aattacagtg tcgcgagtta gactatgtaa gcagaatttt a 711
<210> 21
<211> 42
<212> RNA
<213> Artificial Sequence
<220>
<223> SYNTHESIZED
<400> 21
cuccagucuu ucuagaagau guuuuagagc uaugcuguuu ug 42
<210> 22
<211> 42
<212> RNA
<213> Artificial Sequence
<220>
<223> SYNTHESIZED
<400> 22
ugaacaggug uaaaauugga guuuuagagc uaugcuguuu ug 42
<210> 23
<211> 42
<212> RNA
<213> Artificial Sequence
<220>
<223> SYNTHESIZED
<400> 23
ugucgggaag uuuuuuaaua guuuuagagc uaugcuguuu ug 42
<210> 24
<211> 642
<212> DNA
<213> Rattus rattus
<400> 24
gggattcctc cttgagttgt ggcactgagg aacgtgctga acaagaccta cattgcactc 60
cagggagtgg atgaaggagt tggggctcag tcgggttgta ttggagacaa gaagcacttg 120
ctctccaaaa gtcggtttga gttatcatta agggagctgc agtggagtag gcggagaaaa 180
ggccgcaccc ttctcaggac gggggagggg agtgttgcaa tacctttctg ggagttctct 240
gctgcctcct gtcttctgag gaccgccctg ggcctggaag attcccttcc cccttcttcc 300
ctcgtgatct gcaactggag tctttctgga agataggcgg gagtcttctg ggcaggctta 360
aaggctaacc tggtgcgtgg ggcgttgtcc tgcagaggaa ttgaacaggt gtaaaattgg 420
aggggcaaga cttcccacag attttcgatt gtgttgttaa gtattgtaat aggggcaaat 480
aagggaaata gactaggcac tcacctgggg ttttatgcag caaaactaca ggttattatt 540
gcttgtgatc cgccctggag aatttttcac cgaggtagat tgaagacatg cccacccaaa 600
ttttaatatt cttccacttg cgatccttgc tacagtatga aa 642
<210> 25
<211> 42
<212> RNA
<213> Artificial Sequence
<220>
<223> SYNTHESIZED
<400> 25
agggggaagg gaaucuucca guuuuagagc uaugcuguuu ug 42
<210> 26
<211> 42
<212> RNA
<213> Artificial Sequence
<220>
<223> SYNTHESIZED
<400> 26
ucugcaacug gagucuuucu guuuuagagc uaugcuguuu ug 42
<210> 27
<211> 42
<212> RNA
<213> Artificial Sequence
<220>
<223> SYNTHESIZED
<400> 27
aggcgggagu cuucugggca guuuuagagc uaugcuguuu ug 42
Claims (1)
- 다음 단계를 포함하는, 근시의 치료 또는 이의 진행 예방 방법:
치료 기간 동안 대상의 눈에 치료 유효량의 안과용 조성물을 투여하는 단계, 이때 상기 안과용 조성물은 다음을 포함함:
근시 진행을 치료하기에 충분한 양으로 존재하는 각막 가교제 및 2차 치료제; 및
약학적으로 허용되는 담체.
Applications Claiming Priority (10)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261734256P | 2012-12-06 | 2012-12-06 | |
US61/734,256 | 2012-12-06 | ||
US201361758624P | 2013-01-30 | 2013-01-30 | |
US61/758,624 | 2013-01-30 | ||
US201361761046P | 2013-02-05 | 2013-02-05 | |
US61/761,046 | 2013-02-05 | ||
US201361794422P | 2013-03-15 | 2013-03-15 | |
US61/794,422 | 2013-03-15 | ||
KR1020227043854A KR102531576B1 (ko) | 2012-12-06 | 2013-12-05 | Crispr-기초된 유전체 변형과 조절 |
PCT/US2013/073307 WO2014089290A1 (en) | 2012-12-06 | 2013-12-05 | Crispr-based genome modification and regulation |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227043854A Division KR102531576B1 (ko) | 2012-12-06 | 2013-12-05 | Crispr-기초된 유전체 변형과 조절 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230070065A true KR20230070065A (ko) | 2023-05-19 |
Family
ID=50883989
Family Applications (7)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020237015558A KR20230070065A (ko) | 2012-12-06 | 2013-12-05 | Crispr-기초된 유전체 변형과 조절 |
KR1020197022305A KR102145760B1 (ko) | 2012-12-06 | 2013-12-05 | Crispr-기초된 유전체 변형과 조절 |
KR1020207023229A KR102243092B1 (ko) | 2012-12-06 | 2013-12-05 | Crispr-기초된 유전체 변형과 조절 |
KR1020217011309A KR102479178B1 (ko) | 2012-12-06 | 2013-12-05 | Crispr-기초된 유전체 변형과 조절 |
KR1020187001934A KR102006880B1 (ko) | 2012-12-06 | 2013-12-05 | Crispr-기초된 유전체 변형과 조절 |
KR1020157013843A KR101844123B1 (ko) | 2012-12-06 | 2013-12-05 | Crispr-기초된 유전체 변형과 조절 |
KR1020227043854A KR102531576B1 (ko) | 2012-12-06 | 2013-12-05 | Crispr-기초된 유전체 변형과 조절 |
Family Applications After (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020197022305A KR102145760B1 (ko) | 2012-12-06 | 2013-12-05 | Crispr-기초된 유전체 변형과 조절 |
KR1020207023229A KR102243092B1 (ko) | 2012-12-06 | 2013-12-05 | Crispr-기초된 유전체 변형과 조절 |
KR1020217011309A KR102479178B1 (ko) | 2012-12-06 | 2013-12-05 | Crispr-기초된 유전체 변형과 조절 |
KR1020187001934A KR102006880B1 (ko) | 2012-12-06 | 2013-12-05 | Crispr-기초된 유전체 변형과 조절 |
KR1020157013843A KR101844123B1 (ko) | 2012-12-06 | 2013-12-05 | Crispr-기초된 유전체 변형과 조절 |
KR1020227043854A KR102531576B1 (ko) | 2012-12-06 | 2013-12-05 | Crispr-기초된 유전체 변형과 조절 |
Country Status (17)
Country | Link |
---|---|
US (15) | US20160017366A1 (ko) |
EP (11) | EP3138910B1 (ko) |
JP (6) | JP6620018B2 (ko) |
KR (7) | KR20230070065A (ko) |
CN (3) | CN105142669B (ko) |
AU (9) | AU2013355214B2 (ko) |
BR (1) | BR112015012375A2 (ko) |
CA (3) | CA2977152C (ko) |
DK (6) | DK3138911T3 (ko) |
ES (6) | ES2769310T3 (ko) |
HK (1) | HK1218389A1 (ko) |
IL (5) | IL300199A (ko) |
LT (4) | LT3138911T (ko) |
PL (6) | PL3138910T3 (ko) |
PT (6) | PT3138912T (ko) |
SG (4) | SG10201910987SA (ko) |
WO (1) | WO2014089290A1 (ko) |
Families Citing this family (364)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008027558A2 (en) | 2006-08-31 | 2008-03-06 | Codon Devices, Inc. | Iterative nucleic acid assembly using activation of vector-encoded traits |
CN103502448B (zh) | 2010-11-12 | 2017-03-29 | Gen9股份有限公司 | 核酸合成的方法和设备 |
WO2012064975A1 (en) | 2010-11-12 | 2012-05-18 | Gen9, Inc. | Protein arrays and methods of using and making the same |
EP2734621B1 (en) | 2011-07-22 | 2019-09-04 | President and Fellows of Harvard College | Evaluation and improvement of nuclease cleavage specificity |
WO2013032850A2 (en) | 2011-08-26 | 2013-03-07 | Gen9, Inc. | Compositions and methods for high fidelity assembly of nucleic acids |
US11021737B2 (en) | 2011-12-22 | 2021-06-01 | President And Fellows Of Harvard College | Compositions and methods for analyte detection |
GB201122458D0 (en) | 2011-12-30 | 2012-02-08 | Univ Wageningen | Modified cascade ribonucleoproteins and uses thereof |
US9637739B2 (en) | 2012-03-20 | 2017-05-02 | Vilnius University | RNA-directed DNA cleavage by the Cas9-crRNA complex |
US9150853B2 (en) | 2012-03-21 | 2015-10-06 | Gen9, Inc. | Methods for screening proteins using DNA encoded chemical libraries as templates for enzyme catalysis |
EP4001427A1 (en) | 2012-04-24 | 2022-05-25 | Gen9, Inc. | Methods for sorting nucleic acids and multiplexed preparative in vitro cloning |
PL2847335T3 (pl) | 2012-04-25 | 2019-01-31 | Regeneron Pharmaceuticals, Inc. | Celowanie dużymi wektorami do celowania wspomagane nukleazą |
WO2013163628A2 (en) | 2012-04-27 | 2013-10-31 | Duke University | Genetic correction of mutated genes |
DE202013012242U1 (de) | 2012-05-25 | 2016-02-02 | Emmanuelle Charpentier | Zusammensetzungen für die durch RNA gesteuerte Modifikation einer Ziel-DNA und für die durch RNA gesteuerte Modulation der Transkription |
CA2877290A1 (en) | 2012-06-19 | 2013-12-27 | Daniel F. Voytas | Gene targeting in plants using dna viruses |
CN113512577A (zh) | 2012-06-25 | 2021-10-19 | Gen9股份有限公司 | 用于核酸组装和高通量测序的方法 |
CN105188767A (zh) * | 2012-07-25 | 2015-12-23 | 布罗德研究所有限公司 | 可诱导的dna结合蛋白和基因组干扰工具及其应用 |
DE202013012597U1 (de) | 2012-10-23 | 2017-11-21 | Toolgen, Inc. | Zusammensetzung zum Spalten einer Ziel-DNA, umfassend eine für die Ziel-DNA spezifische guide-RNA und eine Cas-Protein-codierende Nukleinsäure oder ein Cas-Protein, sowie deren Verwendung |
WO2014078819A2 (en) | 2012-11-16 | 2014-05-22 | Transposagen Biopharmaceuticals, Inc. | Site-specific enzymes and methods of use |
PL3138910T3 (pl) | 2012-12-06 | 2018-01-31 | Sigma Aldrich Co Llc | Oparta na CRISPR modyfikacja i regulacja genomu |
MX2015007549A (es) * | 2012-12-12 | 2017-01-20 | Broad Inst Inc | Modificaciones de sistemas, métodos y composiciones guía optimizadas para la manipulación de secuencias. |
JP6552965B2 (ja) * | 2012-12-12 | 2019-07-31 | ザ・ブロード・インスティテュート・インコーポレイテッド | 配列操作のための改善された系、方法および酵素組成物のエンジニアリングおよび最適化 |
US8697359B1 (en) * | 2012-12-12 | 2014-04-15 | The Broad Institute, Inc. | CRISPR-Cas systems and methods for altering expression of gene products |
PL2931898T3 (pl) | 2012-12-12 | 2016-09-30 | Le Cong | Projektowanie i optymalizacja systemów, sposoby i kompozycje do manipulacji sekwencją z domenami funkcjonalnymi |
EP3434776A1 (en) | 2012-12-12 | 2019-01-30 | The Broad Institute, Inc. | Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof |
SG10201707569YA (en) | 2012-12-12 | 2017-10-30 | Broad Inst Inc | Delivery, Engineering and Optimization of Systems, Methods and Compositions for Sequence Manipulation and Therapeutic Applications |
US20140186843A1 (en) | 2012-12-12 | 2014-07-03 | Massachusetts Institute Of Technology | Methods, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof |
WO2014093694A1 (en) | 2012-12-12 | 2014-06-19 | The Broad Institute, Inc. | Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes |
US20140189896A1 (en) | 2012-12-12 | 2014-07-03 | Feng Zhang | Crispr-cas component systems, methods and compositions for sequence manipulation |
WO2014099744A1 (en) * | 2012-12-17 | 2014-06-26 | President And Fellows Of Harvard College | Rna-guided human genome engineering |
JP2016507244A (ja) * | 2013-02-27 | 2016-03-10 | ヘルムホルツ・ツェントルム・ミュンヒェン・ドイチェス・フォルシュンクスツェントルム・フューア・ゲズントハイト・ウント・ウムベルト(ゲーエムベーハー)Helmholtz Zentrum MuenchenDeutsches Forschungszentrum fuer Gesundheit und Umwelt (GmbH) | Cas9ヌクレアーゼによる卵母細胞における遺伝子編集 |
US10138509B2 (en) | 2013-03-12 | 2018-11-27 | President And Fellows Of Harvard College | Method for generating a three-dimensional nucleic acid containing matrix |
WO2014150624A1 (en) | 2013-03-14 | 2014-09-25 | Caribou Biosciences, Inc. | Compositions and methods of nucleic acid-targeting nucleic acids |
MX2015011985A (es) * | 2013-03-15 | 2016-04-07 | Univ Minnesota | Ingenieria genomica de plantas utilizando sistemas crispr/cas. |
WO2014204578A1 (en) | 2013-06-21 | 2014-12-24 | The General Hospital Corporation | Using rna-guided foki nucleases (rfns) to increase specificity for rna-guided genome editing |
KR102210319B1 (ko) * | 2013-03-15 | 2021-02-01 | 더 제너럴 하스피탈 코포레이션 | 특정 게놈 좌위에 대한 유전적 및 후성적 조절 단백질의 rna-안내 표적화 |
US10760064B2 (en) | 2013-03-15 | 2020-09-01 | The General Hospital Corporation | RNA-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci |
US20160186208A1 (en) * | 2013-04-16 | 2016-06-30 | Whitehead Institute For Biomedical Research | Methods of Mutating, Modifying or Modulating Nucleic Acid in a Cell or Nonhuman Mammal |
HUE040575T2 (hu) | 2013-04-16 | 2019-03-28 | Regeneron Pharma | A patkány genom célzott módosítása |
CN105683376A (zh) * | 2013-05-15 | 2016-06-15 | 桑格摩生物科学股份有限公司 | 用于治疗遗传病状的方法和组合物 |
JP7065564B2 (ja) * | 2013-05-29 | 2022-05-12 | セレクティス | Cas9ニッカーゼ活性を用いて正確なdna切断をもたらすための方法 |
US20140356956A1 (en) | 2013-06-04 | 2014-12-04 | President And Fellows Of Harvard College | RNA-Guided Transcriptional Regulation |
WO2014197568A2 (en) | 2013-06-04 | 2014-12-11 | President And Fellows Of Harvard College | Rna-guideded transcriptional regulation |
EP3539573B1 (en) * | 2013-06-05 | 2024-02-14 | Duke University | Rna-guided gene editing and gene regulation |
JP2016521561A (ja) | 2013-06-14 | 2016-07-25 | セレクティス | 植物における非トランスジェニックのゲノム編集のための方法 |
WO2014204727A1 (en) | 2013-06-17 | 2014-12-24 | The Broad Institute Inc. | Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof |
EP3011032B1 (en) * | 2013-06-17 | 2019-10-16 | The Broad Institute, Inc. | Delivery, engineering and optimization of systems, methods and compositions for targeting and modeling diseases and disorders of post mitotic cells |
KR20160034901A (ko) * | 2013-06-17 | 2016-03-30 | 더 브로드 인스티튜트, 인코퍼레이티드 | 서열 조작에 최적화된 crispr-cas 이중 닉카아제 시스템, 방법 및 조성물 |
BR112015031608A2 (pt) * | 2013-06-17 | 2017-08-22 | Massachusetts Inst Technology | Aplicação e uso dos sistemas crispr-cas, vetores e composições para direcionamento e terapia hepáticos |
RU2716421C2 (ru) * | 2013-06-17 | 2020-03-11 | Те Брод Инститьют Инк. | Доставка, применение и применения в терапии систем crispr-cas и композиций для целенаправленного воздействия на нарушения и заболевания с использованием вирусных компонентов |
AU2014281026B2 (en) | 2013-06-17 | 2020-05-28 | Massachusetts Institute Of Technology | Delivery, engineering and optimization of tandem guide systems, methods and compositions for sequence manipulation |
US11306328B2 (en) | 2013-07-26 | 2022-04-19 | President And Fellows Of Harvard College | Genome engineering |
US9163284B2 (en) | 2013-08-09 | 2015-10-20 | President And Fellows Of Harvard College | Methods for identifying a target site of a Cas9 nuclease |
US9359599B2 (en) | 2013-08-22 | 2016-06-07 | President And Fellows Of Harvard College | Engineered transcription activator-like effector (TALE) domains and uses thereof |
EP3611268A1 (en) | 2013-08-22 | 2020-02-19 | E. I. du Pont de Nemours and Company | Plant genome modification using guide rna/cas endonuclease systems and methods of use |
US9526784B2 (en) | 2013-09-06 | 2016-12-27 | President And Fellows Of Harvard College | Delivery system for functional nucleases |
US9340799B2 (en) | 2013-09-06 | 2016-05-17 | President And Fellows Of Harvard College | MRNA-sensing switchable gRNAs |
US9388430B2 (en) | 2013-09-06 | 2016-07-12 | President And Fellows Of Harvard College | Cas9-recombinase fusion proteins and uses thereof |
DE202014010413U1 (de) | 2013-09-18 | 2015-12-08 | Kymab Limited | Zellen und Organismen |
WO2015065964A1 (en) | 2013-10-28 | 2015-05-07 | The Broad Institute Inc. | Functional genomics using crispr-cas systems, compositions, methods, screens and applications thereof |
WO2015066119A1 (en) | 2013-10-30 | 2015-05-07 | North Carolina State University | Compositions and methods related to a type-ii crispr-cas system in lactobacillus buchneri |
DK3066201T3 (en) | 2013-11-07 | 2018-06-06 | Editas Medicine Inc | CRISPR-RELATED PROCEDURES AND COMPOSITIONS WITH LEADING GRADES |
EP4349980A2 (en) | 2013-12-11 | 2024-04-10 | Regeneron Pharmaceuticals, Inc. | Methods and compositions for the targeted modification of a genome |
MX2016007654A (es) | 2013-12-11 | 2017-08-15 | Regeneron Pharma | Metodos y composiciones para la modificacion dirigida de un genoma. |
SG10201804974RA (en) | 2013-12-12 | 2018-07-30 | Broad Inst Inc | Compositions and Methods of Use of Crispr-Cas Systems in Nucleotide Repeat Disorders |
KR20160097327A (ko) | 2013-12-12 | 2016-08-17 | 더 브로드 인스티튜트, 인코퍼레이티드 | 유전자 산물, 구조 정보 및 유도성 모듈형 cas 효소의 발현의 변경을 위한 crispr-cas 시스템 및 방법 |
BR112016013201B1 (pt) | 2013-12-12 | 2023-01-31 | The Broad Institute, Inc. | Uso de uma composição compreendendo um sistema crispr-cas no tratamento de uma doença genética ocular |
US11053481B2 (en) | 2013-12-12 | 2021-07-06 | President And Fellows Of Harvard College | Fusions of Cas9 domains and nucleic acid-editing domains |
EP3080271B1 (en) | 2013-12-12 | 2020-02-12 | The Broad Institute, Inc. | Systems, methods and compositions for sequence manipulation with optimized functional crispr-cas systems |
WO2015089364A1 (en) | 2013-12-12 | 2015-06-18 | The Broad Institute Inc. | Crystal structure of a crispr-cas system, and uses thereof |
US10787654B2 (en) * | 2014-01-24 | 2020-09-29 | North Carolina State University | Methods and compositions for sequence guiding Cas9 targeting |
PL3105328T3 (pl) | 2014-02-11 | 2020-10-19 | The Regents Of The University Of Colorado, A Body Corporate | Umożliwiana przez CRISPR multipleksowa modyfikacja genomu |
JP2017506893A (ja) | 2014-02-18 | 2017-03-16 | デューク ユニバーシティ | ウイルス複製不活化組成物並びにその製造方法及び使用 |
WO2015134812A1 (en) | 2014-03-05 | 2015-09-11 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for treating usher syndrome and retinitis pigmentosa |
US11339437B2 (en) | 2014-03-10 | 2022-05-24 | Editas Medicine, Inc. | Compositions and methods for treating CEP290-associated disease |
US9938521B2 (en) | 2014-03-10 | 2018-04-10 | Editas Medicine, Inc. | CRISPR/CAS-related methods and compositions for treating leber's congenital amaurosis 10 (LCA10) |
US11141493B2 (en) | 2014-03-10 | 2021-10-12 | Editas Medicine, Inc. | Compositions and methods for treating CEP290-associated disease |
WO2015148670A1 (en) * | 2014-03-25 | 2015-10-01 | Editas Medicine Inc. | Crispr/cas-related methods and compositions for treating hiv infection and aids |
US11242525B2 (en) | 2014-03-26 | 2022-02-08 | Editas Medicine, Inc. | CRISPR/CAS-related methods and compositions for treating sickle cell disease |
JP2017512481A (ja) | 2014-04-08 | 2017-05-25 | ノースカロライナ ステート ユニバーシティーNorth Carolina State University | Crispr関連遺伝子を用いた、rna依存性の転写抑制のための方法および組成物 |
WO2015188056A1 (en) * | 2014-06-05 | 2015-12-10 | Sangamo Biosciences, Inc. | Methods and compositions for nuclease design |
LT3152312T (lt) | 2014-06-06 | 2020-04-27 | Regeneron Pharmaceuticals, Inc. | Tikslinio lokuso modifikavimo būdai ir kompozicijos |
CN106852157B (zh) * | 2014-06-16 | 2022-04-12 | 约翰斯·霍普金斯大学 | 用于使用h1启动子表达crispr向导rna的组合物和方法 |
EP3157328B1 (en) * | 2014-06-17 | 2021-08-04 | Poseida Therapeutics, Inc. | A method for directing proteins to specific loci in the genome and uses thereof |
HUE049405T2 (hu) * | 2014-06-23 | 2020-09-28 | Regeneron Pharma | Nukleáz-közvetített DNS-összeállítás |
HUE041584T2 (hu) | 2014-06-26 | 2019-05-28 | Regeneron Pharma | Célzott genetikai módosítások és alkalmazási módszerek és készítmények |
US20170198268A1 (en) * | 2014-07-09 | 2017-07-13 | Gen9, Inc. | Compositions and Methods for Site-Directed DNA Nicking and Cleaving |
EP3169776A4 (en) * | 2014-07-14 | 2018-07-04 | The Regents of The University of California | Crispr/cas transcriptional modulation |
US10077453B2 (en) | 2014-07-30 | 2018-09-18 | President And Fellows Of Harvard College | CAS9 proteins including ligand-dependent inteins |
CN106922154B (zh) | 2014-08-06 | 2022-01-07 | 基因工具股份有限公司 | 使用空肠弯曲杆菌crispr/cas系统衍生的rna引导的工程化核酸酶的基因编辑 |
WO2016033298A1 (en) | 2014-08-28 | 2016-03-03 | North Carolina State University | Novel cas9 proteins and guiding features for dna targeting and genome editing |
US10570418B2 (en) | 2014-09-02 | 2020-02-25 | The Regents Of The University Of California | Methods and compositions for RNA-directed target DNA modification |
RU2017112324A (ru) | 2014-09-12 | 2018-10-15 | Пайонир Хай-Бред Интернэшнл, Инк. | Создание сайтов сайт-специфической интеграции для сложных локусов признаков в кукурузе и сое, а также способы применения |
US9879283B2 (en) * | 2014-10-09 | 2018-01-30 | Life Technologies Corporation | CRISPR oligonucleotides and gene editing |
CA2963840A1 (en) | 2014-10-09 | 2016-04-14 | Seattle Children's Hospital (dba Seattle Children's Research Institute) | Long poly(a) plasmids and methods for introduction of long poly(a) sequences into the plasmid |
PL3207124T3 (pl) | 2014-10-15 | 2019-11-29 | Regeneron Pharma | Sposoby i kompozycje do wytwarzania lub utrzymywania komórek pluripotencjalnych |
US20170306306A1 (en) * | 2014-10-24 | 2017-10-26 | Life Technologies Corporation | Compositions and Methods for Enhancing Homologous Recombination |
WO2016070037A2 (en) * | 2014-10-31 | 2016-05-06 | Massachusetts Institute Of Technology | Massively parallel combinatorial genetics for crispr |
CN107406838A (zh) | 2014-11-06 | 2017-11-28 | 纳幕尔杜邦公司 | Rna引导的内切核酸酶向细胞中的肽介导的递送 |
EP3215617B1 (en) | 2014-11-07 | 2024-05-08 | Editas Medicine, Inc. | Systems for improving crispr/cas-mediated genome-editing |
US20170369848A1 (en) * | 2014-11-11 | 2017-12-28 | Q Therapeutics, Inc. | Engineering mesenchymal stem cells using homologous recombination |
CN107109422B (zh) * | 2014-11-19 | 2021-08-13 | 基础科学研究院 | 使用由两个载体表达的拆分的Cas9的基因组编辑 |
LT3221457T (lt) | 2014-11-21 | 2019-06-10 | Regeneron Pharmaceuticals, Inc. | Nukreipiančios genetinės modifikacijos būdai ir kompozicijos, naudojant suporuotas kreipiančiąsias rnr sekas |
GB201421096D0 (en) | 2014-11-27 | 2015-01-14 | Imp Innovations Ltd | Genome editing methods |
JP7068821B2 (ja) | 2014-12-03 | 2022-05-17 | アジレント・テクノロジーズ・インク | 化学修飾を有するガイドrna |
WO2016094679A1 (en) | 2014-12-10 | 2016-06-16 | Regents Of The University Of Minnesota | Genetically modified cells, tissues, and organs for treating disease |
EP3985115A1 (en) | 2014-12-12 | 2022-04-20 | The Broad Institute, Inc. | Protected guide rnas (pgrnas) |
RU2707137C2 (ru) | 2014-12-19 | 2019-11-22 | Регенерон Фармасьютикалз, Инк. | Способы и композиции для нацеленной генетической модификации посредством одноэтапного множественного нацеливания |
WO2016100857A1 (en) | 2014-12-19 | 2016-06-23 | Regeneron Pharmaceuticals, Inc. | Stem cells for modeling type 2 diabetes |
EP3798302A1 (fr) | 2015-01-29 | 2021-03-31 | Meiogenix | Procede pour induire des recombinaisons meiotiques ciblees |
CN107787367B (zh) | 2015-04-06 | 2021-10-26 | 里兰斯坦福初级大学理事会 | 用于crispr/cas介导的基因调控的化学修饰的引导rna |
JP2018522249A (ja) | 2015-04-24 | 2018-08-09 | エディタス・メディシン、インコーポレイテッド | Cas9分子/ガイドrna分子複合体の評価 |
WO2016176617A2 (en) | 2015-04-29 | 2016-11-03 | New York University | Method for treating high-grade gliomas |
CN108026566A (zh) | 2015-05-04 | 2018-05-11 | 特拉维夫大学拉莫特有限公司 | 用于使dna片段化的方法和试剂盒 |
WO2016182959A1 (en) | 2015-05-11 | 2016-11-17 | Editas Medicine, Inc. | Optimized crispr/cas9 systems and methods for gene editing in stem cells |
EA201792663A1 (ru) | 2015-05-29 | 2018-04-30 | Норт Каролина Стейт Юниверсити | Способы скрининга бактерий, архей, водорослей и дрожжей с использованием нуклеиновых кислот crispr |
EP3303585A4 (en) | 2015-06-03 | 2018-10-31 | Board of Regents of the University of Nebraska | Dna editing using single-stranded dna |
EP3307887A1 (en) | 2015-06-09 | 2018-04-18 | Editas Medicine, Inc. | Crispr/cas-related methods and compositions for improving transplantation |
EP3307872B1 (en) | 2015-06-15 | 2023-09-27 | North Carolina State University | Methods and compositions for efficient delivery of nucleic acids and rna-based antimicrobials |
CA2989827A1 (en) * | 2015-06-17 | 2016-12-22 | Poseida Therapeutics, Inc. | Compositions and methods for directing proteins to specific loci in the genome |
WO2016205759A1 (en) | 2015-06-18 | 2016-12-22 | The Broad Institute Inc. | Engineering and optimization of systems, methods, enzymes and guide scaffolds of cas9 orthologs and variants for sequence manipulation |
CA2989830A1 (en) | 2015-06-18 | 2016-12-22 | The Broad Institute, Inc. | Crispr enzyme mutations reducing off-target effects |
CN107949400A (zh) * | 2015-06-24 | 2018-04-20 | 西格马-奥尔德里奇有限责任公司 | 细胞周期依赖性基因组调控和修饰 |
CA2993431A1 (en) | 2015-07-31 | 2017-02-09 | Regents Of The University Of Minnesota | Nuclease based knockouts of immunological checkpoint genes in immune cells |
AU2016309948B2 (en) | 2015-08-14 | 2021-05-20 | The University Of Sydney | Connexin 45 inhibition for therapy |
MX2018002339A (es) | 2015-08-25 | 2018-12-19 | Univ Duke | Composiciones y metodos de mejora de la especificidad en ingenieria genomica usando endonucleasas guiadas por arn. |
WO2017040348A1 (en) | 2015-08-28 | 2017-03-09 | The General Hospital Corporation | Engineered crispr-cas9 nucleases |
US9512446B1 (en) | 2015-08-28 | 2016-12-06 | The General Hospital Corporation | Engineered CRISPR-Cas9 nucleases |
US9926546B2 (en) | 2015-08-28 | 2018-03-27 | The General Hospital Corporation | Engineered CRISPR-Cas9 nucleases |
WO2017053879A1 (en) | 2015-09-24 | 2017-03-30 | Editas Medicine, Inc. | Use of exonucleases to improve crispr/cas-mediated genome editing |
KR101745863B1 (ko) | 2015-09-25 | 2017-06-12 | 전남대학교산학협력단 | Crispr/cas9 시스템을 이용한 프로히비틴2 유전자 제거용 시발체 |
KR101795999B1 (ko) | 2015-09-25 | 2017-11-09 | 전남대학교산학협력단 | Crispr/cas9 시스템을 이용한 베타2-마이크로글로불린 유전자 제거용 시발체 |
WO2017058751A1 (en) | 2015-09-28 | 2017-04-06 | North Carolina State University | Methods and compositions for sequence specific antimicrobials |
EP4089175A1 (en) | 2015-10-13 | 2022-11-16 | Duke University | Genome engineering with type i crispr systems in eukaryotic cells |
ES2875602T3 (es) | 2015-10-22 | 2021-11-10 | Ericsson Telefon Ab L M | Métodos y aparato relacionados con la mejora selectiva de señales de radio |
IL310721A (en) * | 2015-10-23 | 2024-04-01 | Harvard College | Nucleobase editors and their uses |
WO2017075335A1 (en) | 2015-10-28 | 2017-05-04 | Voyager Therapeutics, Inc. | Regulatable expression using adeno-associated virus (aav) |
CN108474022A (zh) | 2015-11-03 | 2018-08-31 | 哈佛学院董事及会员团体 | 用于包含三维核酸的基质容积成像的设备和方法 |
CN106893739A (zh) | 2015-11-17 | 2017-06-27 | 香港中文大学 | 用于靶向基因操作的新方法和系统 |
US10240145B2 (en) * | 2015-11-25 | 2019-03-26 | The Board Of Trustees Of The Leland Stanford Junior University | CRISPR/Cas-mediated genome editing to treat EGFR-mutant lung cancer |
US11542466B2 (en) | 2015-12-22 | 2023-01-03 | North Carolina State University | Methods and compositions for delivery of CRISPR based antimicrobials |
IL304088A (en) | 2016-01-11 | 2023-08-01 | Univ Leland Stanford Junior | Systems containing chimeric proteins and their uses for controlling gene expression |
JP7012645B2 (ja) | 2016-01-11 | 2022-01-28 | ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー | キメラタンパク質および免疫治療の方法 |
EP3219799A1 (en) | 2016-03-17 | 2017-09-20 | IMBA-Institut für Molekulare Biotechnologie GmbH | Conditional crispr sgrna expression |
EP3433364A1 (en) | 2016-03-25 | 2019-01-30 | Editas Medicine, Inc. | Systems and methods for treating alpha 1-antitrypsin (a1at) deficiency |
EP3433363A1 (en) | 2016-03-25 | 2019-01-30 | Editas Medicine, Inc. | Genome editing systems comprising repair-modulating enzyme molecules and methods of their use |
WO2017180694A1 (en) | 2016-04-13 | 2017-10-19 | Editas Medicine, Inc. | Cas9 fusion molecules gene editing systems, and methods of use thereof |
AU2017250683A1 (en) * | 2016-04-14 | 2018-11-01 | Boco Silicon Valley, Inc. | Genome editing of human neural stem cells using nucleases |
CN109715803B (zh) * | 2016-04-25 | 2023-07-07 | 巴塞尔大学 | 等位基因编辑及其应用 |
CA3022290A1 (en) | 2016-04-25 | 2017-11-02 | President And Fellows Of Harvard College | Hybridization chain reaction methods for in situ molecular detection |
RU2745563C2 (ru) | 2016-05-20 | 2021-03-29 | Регенерон Фармасьютикалс, Инк. | Способы преодоления иммунологической толерантности с использованием множества направляющих рнк |
CA3209273A1 (en) * | 2016-06-02 | 2017-12-07 | Sigma-Aldrich Co. Llc | Using programmable dna binding proteins to enhance targeted genome modification |
JP2019517503A (ja) * | 2016-06-03 | 2019-06-24 | テンプル ユニバーシティー オブ ザ コモンウェルス システム オブ ハイヤー エデュケーション | 遺伝子編集戦略によるhiv−1のネガティブフィードバック調節 |
BR112018074930A2 (pt) * | 2016-06-03 | 2019-03-12 | Inserm (Institut National De La Sante Et De La Recherche Medicale) | ácido nucleico, vetor de ácido nucleico, partícula de entrega, composição farmacêutica, célula hospedeira, método para edição do genoma e método e kit para prevenção e/ou tratamento de uma doença |
US10767175B2 (en) | 2016-06-08 | 2020-09-08 | Agilent Technologies, Inc. | High specificity genome editing using chemically modified guide RNAs |
US10337051B2 (en) | 2016-06-16 | 2019-07-02 | The Regents Of The University Of California | Methods and compositions for detecting a target RNA |
US11293021B1 (en) | 2016-06-23 | 2022-04-05 | Inscripta, Inc. | Automated cell processing methods, modules, instruments, and systems |
LT3474669T (lt) | 2016-06-24 | 2022-06-10 | The Regents Of The University Of Colorado, A Body Corporate | Barkodu pažymėtų kombinatorinių bibliotekų generavimo būdai |
WO2018013720A1 (en) * | 2016-07-12 | 2018-01-18 | Washington University | Incorporation of internal polya-encoded poly-lysine sequence tags and their variations for the tunable control of protein synthesis in bacterial and eukaryotic cells |
DK3491014T3 (da) | 2016-07-28 | 2023-05-30 | Regeneron Pharma | Allel-specifik primer eller sonde, som er hybridiseret til et nucleinsyremolekyle, som koder for en GPR156 variant |
KR20190041476A (ko) | 2016-07-29 | 2019-04-22 | 리제너론 파마슈티칼스 인코포레이티드 | C-절단된 피브릴린-1의 발현을 유도하는 돌연변이를 포함하는 마우스 |
EP3494220A1 (en) | 2016-08-02 | 2019-06-12 | Editas Medicine, Inc. | Compositions and methods for treating cep290 associated disease |
CA3032699A1 (en) | 2016-08-03 | 2018-02-08 | President And Fellows Of Harvard College | Adenosine nucleobase editors and uses thereof |
US11078481B1 (en) | 2016-08-03 | 2021-08-03 | KSQ Therapeutics, Inc. | Methods for screening for cancer targets |
AU2017308889B2 (en) | 2016-08-09 | 2023-11-09 | President And Fellows Of Harvard College | Programmable Cas9-recombinase fusion proteins and uses thereof |
CN109963945A (zh) * | 2016-08-20 | 2019-07-02 | 阿维利诺美国实验室股份有限公司 | 单一向导rna、crispr/cas9系统及其使用方法 |
WO2018039438A1 (en) | 2016-08-24 | 2018-03-01 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
US11078483B1 (en) | 2016-09-02 | 2021-08-03 | KSQ Therapeutics, Inc. | Methods for measuring and improving CRISPR reagent function |
WO2018048827A1 (en) * | 2016-09-07 | 2018-03-15 | Massachusetts Institute Of Technology | Rna-guided endonuclease-based dna assembly |
CN106636197B (zh) * | 2016-09-22 | 2019-09-03 | 南京市妇幼保健院 | 一种定向敲降斑马鱼基因组中多拷贝基因的方法 |
US20190225974A1 (en) | 2016-09-23 | 2019-07-25 | BASF Agricultural Solutions Seed US LLC | Targeted genome optimization in plants |
EP3523426A4 (en) | 2016-09-30 | 2020-01-22 | The Regents of The University of California | RNA GUIDED NUCLEIC ACID MODIFYING ENZYMES AND METHOD FOR USE THEREOF |
US20190233820A1 (en) * | 2016-10-11 | 2019-08-01 | Stemgenics, Inc. | Nanoparticles functionalized with gene editing tools and related methods |
CA3040481A1 (en) | 2016-10-14 | 2018-04-19 | The General Hospital Corporation | Epigenetically regulated site-specific nucleases |
CN110214180A (zh) | 2016-10-14 | 2019-09-06 | 哈佛大学的校长及成员们 | 核碱基编辑器的aav递送 |
GB201617559D0 (en) | 2016-10-17 | 2016-11-30 | University Court Of The University Of Edinburgh The | Swine comprising modified cd163 and associated methods |
EP3529359B1 (en) | 2016-10-18 | 2023-12-13 | Regents of the University of Minnesota | Tumor infiltrating lymphocytes for use in therapy |
KR20190072639A (ko) * | 2016-11-02 | 2019-06-25 | 유니버시타트 바셀 | 세포 치료에 사용하기 위한 면역학적으로 식별 가능한 세포 표면 변이체 |
WO2018119359A1 (en) | 2016-12-23 | 2018-06-28 | President And Fellows Of Harvard College | Editing of ccr5 receptor gene to protect against hiv infection |
KR102151065B1 (ko) * | 2016-12-23 | 2020-09-02 | 기초과학연구원 | 동물 배아의 염기 교정용 조성물 및 염기 교정 방법 |
US11859219B1 (en) | 2016-12-30 | 2024-01-02 | Flagship Pioneering Innovations V, Inc. | Methods of altering a target nucleotide sequence with an RNA-guided nuclease and a single guide RNA |
CA3049980A1 (en) | 2017-01-23 | 2018-07-26 | Regeneron Pharmaceuticals, Inc. | Hydroxysteroid 17-beta dehydrogenase 13 (hsd17b13) variants and uses thereof |
TW201839136A (zh) | 2017-02-06 | 2018-11-01 | 瑞士商諾華公司 | 治療血色素異常症之組合物及方法 |
CN106978438B (zh) * | 2017-02-27 | 2020-08-28 | 北京大北农生物技术有限公司 | 提高同源重组效率的方法 |
EP3592853A1 (en) | 2017-03-09 | 2020-01-15 | President and Fellows of Harvard College | Suppression of pain by gene editing |
US11542496B2 (en) | 2017-03-10 | 2023-01-03 | President And Fellows Of Harvard College | Cytosine to guanine base editor |
EP3596217A1 (en) | 2017-03-14 | 2020-01-22 | Editas Medicine, Inc. | Systems and methods for the treatment of hemoglobinopathies |
CN110914426A (zh) | 2017-03-23 | 2020-03-24 | 哈佛大学的校长及成员们 | 包含核酸可编程dna结合蛋白的核碱基编辑器 |
WO2018195129A1 (en) | 2017-04-17 | 2018-10-25 | University Of Maryland, College Park | Embryonic cell cultures and methods of using the same |
US11834670B2 (en) | 2017-04-19 | 2023-12-05 | Global Life Sciences Solutions Usa Llc | Site-specific DNA modification using a donor DNA repair template having tandem repeat sequences |
CA3059956A1 (en) | 2017-04-21 | 2018-10-25 | The General Hospital Corporation | Variants of cpf1 (cas12a) with altered pam specificity |
US11499151B2 (en) | 2017-04-28 | 2022-11-15 | Editas Medicine, Inc. | Methods and systems for analyzing guide RNA molecules |
WO2018209158A2 (en) | 2017-05-10 | 2018-11-15 | Editas Medicine, Inc. | Crispr/rna-guided nuclease systems and methods |
WO2018209320A1 (en) | 2017-05-12 | 2018-11-15 | President And Fellows Of Harvard College | Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation |
WO2018218166A1 (en) | 2017-05-25 | 2018-11-29 | The General Hospital Corporation | Using split deaminases to limit unwanted off-target base editor deamination |
SG11201911597YA (en) | 2017-06-05 | 2020-01-30 | Regeneron Pharma | B4galt1 variants and uses thereof |
WO2018227114A1 (en) | 2017-06-09 | 2018-12-13 | Editas Medicine, Inc. | Engineered cas9 nucleases |
CA3067382A1 (en) | 2017-06-15 | 2018-12-20 | The Regents Of The University Of California | Targeted non-viral dna insertions |
US9982279B1 (en) | 2017-06-23 | 2018-05-29 | Inscripta, Inc. | Nucleic acid-guided nucleases |
US10011849B1 (en) | 2017-06-23 | 2018-07-03 | Inscripta, Inc. | Nucleic acid-guided nucleases |
EP3644722A1 (en) | 2017-06-27 | 2020-05-06 | Regeneron Pharmaceuticals, Inc. | Non-human animals comprising a humanized asgr1 locus |
HRP20220615T1 (hr) | 2017-06-30 | 2022-06-24 | Inscripta, Inc. | Postupci, moduli, instrumenti i sustavi za automatiziranu obradu stanica |
EP3645021A4 (en) | 2017-06-30 | 2021-04-21 | Intima Bioscience, Inc. | ADENO-ASSOCIATED VIRAL VECTORS FOR GENE THERAPY |
US11866726B2 (en) | 2017-07-14 | 2024-01-09 | Editas Medicine, Inc. | Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites |
CN111801345A (zh) | 2017-07-28 | 2020-10-20 | 哈佛大学的校长及成员们 | 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物 |
AU2018311695A1 (en) * | 2017-07-31 | 2020-01-16 | Sigma-Aldrich Co. Llc | Synthetic guide RNA for CRISPR/Cas activator systems |
AU2018309716A1 (en) | 2017-07-31 | 2020-01-16 | Regeneron Pharmaceuticals, Inc. | Cas-transgenic mouse embryonic stem cells and mice and uses thereof |
CN111182790A (zh) | 2017-07-31 | 2020-05-19 | 瑞泽恩制药公司 | Crispr报告体非人类动物及其用途 |
AU2018309714A1 (en) | 2017-07-31 | 2020-01-30 | Regeneron Pharmaceuticals, Inc. | Assessment of CRISPR/Cas-induced recombination with an exogenous donor nucleic acid in vivo |
IL310452A (en) * | 2017-08-09 | 2024-03-01 | Ricetec Inc | Preparations and methods for genome modification |
US10738327B2 (en) | 2017-08-28 | 2020-08-11 | Inscripta, Inc. | Electroporation cuvettes for automation |
US11319532B2 (en) | 2017-08-30 | 2022-05-03 | President And Fellows Of Harvard College | High efficiency base editors comprising Gam |
US20200216860A1 (en) * | 2017-09-05 | 2020-07-09 | Regeneron Pharmaceuticals, Inc. | Delivery of a gene-editing system with a single retroviral particle and methods of generation and use |
SG11202001754RA (en) | 2017-09-06 | 2020-03-30 | Regeneron Pharma | Single immunoglobulin interleukin-1 receptor related (sigirr) variants and uses thereof |
SG11202001792UA (en) | 2017-09-07 | 2020-03-30 | Regeneron Pharma | Solute carrier family 14 member 1 (slc14a1) variants and uses thereof |
EP4276185A3 (en) | 2017-09-29 | 2024-02-21 | Regeneron Pharmaceuticals, Inc. | Rodents comprising a humanized ttr locus and methods of use |
US10443074B2 (en) | 2017-09-30 | 2019-10-15 | Inscripta, Inc. | Modification of cells by introduction of exogenous material |
AU2018352592A1 (en) | 2017-10-16 | 2020-06-04 | Beam Therapeutics, Inc. | Uses of adenosine base editors |
WO2019079195A1 (en) * | 2017-10-16 | 2019-04-25 | University Of Pittsburgh - Of The Commonwealth System Of Higher Education | GENETICALLY MODIFIED MESENCHYMAL STEM CELLS FOR USE IN CARDIOVASCULAR PROSTHESES |
JP2021501601A (ja) | 2017-10-16 | 2021-01-21 | リジェネロン・ファーマシューティカルズ・インコーポレイテッドRegeneron Pharmaceuticals, Inc. | コルヌリン(crnn)バリアント及びその使用 |
BR112020008201A2 (pt) | 2017-10-27 | 2020-10-06 | The Regents Of The University Of California | substituição-alvo de receptores de células t endógenos |
US11970719B2 (en) | 2017-11-01 | 2024-04-30 | The Regents Of The University Of California | Class 2 CRISPR/Cas compositions and methods of use |
CN111565566B (zh) | 2017-11-10 | 2022-10-21 | 瑞泽恩制药公司 | 包含slc30a8突变的非人动物及使用方法 |
US20210180059A1 (en) * | 2017-11-16 | 2021-06-17 | Astrazeneca Ab | Compositions and methods for improving the efficacy of cas9-based knock-in strategies |
CN116064611A (zh) | 2017-11-30 | 2023-05-05 | 瑞泽恩制药公司 | 包含人源化trkb基因座的非人动物 |
WO2019126578A1 (en) * | 2017-12-20 | 2019-06-27 | Poseida Therapeutics, Inc. | Compositions and methods for directing proteins to specific loci in the genome |
US11293019B2 (en) | 2017-12-22 | 2022-04-05 | Gflas Life Sciences, Inc. | Chimeric genome engineering molecules and methods |
CA3086620A1 (en) | 2018-01-12 | 2019-07-18 | Basf Se | Gene underlying the number of spikelets per spike qtl in wheat on chromosome 7a |
WO2019147302A1 (en) * | 2018-01-26 | 2019-08-01 | Bauer Daniel E | Targeting bcl11a distal regulatory elements with a cas9-cas9 fusion for fetal hemoglobin reinduction |
BR112020010479A2 (pt) | 2018-02-15 | 2020-11-24 | Sigma-Aldrich Co. Llc | sistemas cas9 geneticamente modificados para modificação de genoma eucariótico |
CA3089331A1 (en) | 2018-03-19 | 2019-09-26 | Regeneron Pharmaceuticals, Inc. | Transcription modulation in animals using crispr/cas systems |
EP3775159A4 (en) | 2018-03-29 | 2022-01-19 | Inscripta, Inc. | AUTOMATED REGULATION OF CELL GROWTH RATES FOR INDUCTION AND TRANSFORMATION |
WO2019200004A1 (en) | 2018-04-13 | 2019-10-17 | Inscripta, Inc. | Automated cell processing instruments comprising reagent cartridges |
GB2587970B (en) | 2018-04-19 | 2023-02-08 | Univ California | Compositions and methods for gene editing |
WO2019209926A1 (en) | 2018-04-24 | 2019-10-31 | Inscripta, Inc. | Automated instrumentation for production of peptide libraries |
US10526598B2 (en) | 2018-04-24 | 2020-01-07 | Inscripta, Inc. | Methods for identifying T-cell receptor antigens |
US10858761B2 (en) | 2018-04-24 | 2020-12-08 | Inscripta, Inc. | Nucleic acid-guided editing of exogenous polynucleotides in heterologous cells |
CA3098489A1 (en) * | 2018-04-27 | 2019-10-31 | Seattle Children's Hospital (dba Seattle Children's Research Institute) | Therapeutic genome editing in x-linked hyper igm syndrome |
SG11202010837XA (en) | 2018-05-10 | 2020-11-27 | Auxolytic Ltd | Gene therapy methods and compositions using auxotrophic regulatable cells |
WO2019213910A1 (en) * | 2018-05-10 | 2019-11-14 | Syngenta Participations Ag | Methods and compositions for targeted editing of polynucleotides |
KR20210045360A (ko) | 2018-05-16 | 2021-04-26 | 신테고 코포레이션 | 가이드 rna 설계 및 사용을 위한 방법 및 시스템 |
CN108624622A (zh) * | 2018-05-16 | 2018-10-09 | 湖南艾佳生物科技股份有限公司 | 一种基于CRISPR-Cas9系统构建的能分泌小鼠白细胞介素-6的基因工程细胞株 |
EP3575402A1 (en) * | 2018-06-01 | 2019-12-04 | Algentech SAS | Gene targeting |
CN112384063A (zh) | 2018-06-07 | 2021-02-19 | 以色列国家农业部、农村发展农业研究组织·沃尔卡尼中心 | 再生及转殖大麻的方法 |
WO2019234754A1 (en) | 2018-06-07 | 2019-12-12 | The State Of Israel, Ministry Of Agriculture & Rural Development, Agricultural Research Organization (Aro) (Volcani Center) | Nucleic acid constructs and methods of using same |
WO2020005846A1 (en) * | 2018-06-25 | 2020-01-02 | Bionano Genomics, Inc. | Labeling of dna |
US20210277379A1 (en) * | 2018-08-03 | 2021-09-09 | Beam Therapeutics Inc. | Multi-effector nucleobase editors and methods of using same to modify a nucleic acid target sequence |
GB201813011D0 (en) | 2018-08-10 | 2018-09-26 | Vib Vzw | Means and methods for drought tolerance in crops |
IL292273B2 (en) | 2018-08-14 | 2023-10-01 | Inscripta Inc | Devices, modules and methods for improved detection of edited sequences in living cells |
US10752874B2 (en) | 2018-08-14 | 2020-08-25 | Inscripta, Inc. | Instruments, modules, and methods for improved detection of edited sequences in live cells |
US11142740B2 (en) | 2018-08-14 | 2021-10-12 | Inscripta, Inc. | Detection of nuclease edited sequences in automated modules and instruments |
US10532324B1 (en) | 2018-08-14 | 2020-01-14 | Inscripta, Inc. | Instruments, modules, and methods for improved detection of edited sequences in live cells |
KR102103104B1 (ko) | 2018-08-16 | 2020-04-22 | (주)라트바이오 | 유전자 편집된 형질전환 동물 및 형질전환 배아 |
KR20210046001A (ko) * | 2018-08-21 | 2021-04-27 | 시그마-알드리치 컴퍼니., 엘엘씨 | 시토졸 dna 센서 경로의 하향-조절 |
CA3108892A1 (en) | 2018-08-30 | 2020-04-23 | Inscripta, Inc. | Improved detection of nuclease edited sequences in automated modules and instruments |
CN109055379B (zh) * | 2018-09-10 | 2022-04-15 | 石铭 | 一种转基因鸡输卵管生物反应器的制备方法 |
KR102121817B1 (ko) * | 2018-09-12 | 2020-06-26 | 한국화학연구원 | Crispr 편집 기술을 이용한 재조합 항원을 발현시키는 벡터 및 이를 동시에 다중 삽입시키는 방법 |
EP3849304B1 (en) | 2018-09-13 | 2024-01-10 | Regeneron Pharmaceuticals, Inc. | Complement factor h gene knockout rat as a model of c3 glomerulopathy |
EP3861120A4 (en) | 2018-10-01 | 2023-08-16 | North Carolina State University | RECOMBINANT TYPE I CRISPR-CAS SYSTEM |
CN113166754A (zh) | 2018-10-16 | 2021-07-23 | 蓝色等位基因有限责任公司 | 用于将dna靶向插入基因中的方法 |
US11214781B2 (en) | 2018-10-22 | 2022-01-04 | Inscripta, Inc. | Engineered enzyme |
WO2020086475A1 (en) | 2018-10-22 | 2020-04-30 | Inscripta, Inc. | Engineered enzymes |
WO2020086908A1 (en) * | 2018-10-24 | 2020-04-30 | The Broad Institute, Inc. | Constructs for improved hdr-dependent genomic editing |
KR20200071198A (ko) | 2018-12-10 | 2020-06-19 | 네오이뮨텍, 인코퍼레이티드 | Nrf2 발현 조절 기반 T 세포 항암면역치료법 |
KR20210104068A (ko) | 2018-12-14 | 2021-08-24 | 파이어니어 하이 부렛드 인터내쇼날 인코포레이팃드 | 게놈 편집을 위한 신규한 crispr-cas 시스템 |
AU2019400930A1 (en) | 2018-12-19 | 2021-07-01 | King's College London | Immunotherapeutic methods and compositions |
IL301193A (en) | 2018-12-20 | 2023-05-01 | Regeneron Pharma | Nuclease-mediated repeat expansion |
MX2021008153A (es) * | 2019-01-04 | 2021-08-11 | Univ Chicago | Sistemas y metodos para modular arn. |
WO2020146899A1 (en) * | 2019-01-11 | 2020-07-16 | Chan Zuckerberg Biohub, Inc. | Targeted in vivo genome modification |
WO2020163396A1 (en) | 2019-02-04 | 2020-08-13 | The General Hospital Corporation | Adenine dna base editor variants with reduced off-target rna editing |
CN113728097A (zh) * | 2019-02-14 | 2021-11-30 | 宏基因组学知识产权技术有限责任公司 | 具有ruvc结构域的酶 |
WO2020168102A1 (en) * | 2019-02-15 | 2020-08-20 | Sigma-Aldrich Co. Llc | Crispr/cas fusion proteins and systems |
GB201902277D0 (en) | 2019-02-19 | 2019-04-03 | King S College London | Therapeutic agents |
DE212020000516U1 (de) * | 2019-03-07 | 2022-01-17 | The Regents of the University of California | CRISPR-CAS-Effektorpolypeptide |
JP7461368B2 (ja) | 2019-03-18 | 2024-04-03 | リジェネロン・ファーマシューティカルズ・インコーポレイテッド | タウの播種または凝集の遺伝的修飾因子を同定するためのcrispr/casスクリーニングプラットフォーム |
JP7389135B2 (ja) | 2019-03-18 | 2023-11-29 | リジェネロン・ファーマシューティカルズ・インコーポレイテッド | タウ凝集に関連する遺伝的脆弱性を明らかにするためのcrispr/casドロップアウトスクリーニングプラットフォーム |
AU2020242032A1 (en) | 2019-03-19 | 2021-10-07 | Massachusetts Institute Of Technology | Methods and compositions for editing nucleotide sequences |
US11001831B2 (en) | 2019-03-25 | 2021-05-11 | Inscripta, Inc. | Simultaneous multiplex genome editing in yeast |
EP3947691A4 (en) | 2019-03-25 | 2022-12-14 | Inscripta, Inc. | SIMULTANEOUS MULTIPLEX GENOME EDITING IN A YEAST |
AU2020256225A1 (en) | 2019-04-03 | 2021-09-02 | Regeneron Pharmaceuticals, Inc. | Methods and compositions for insertion of antibody coding sequences into a safe harbor locus |
IL286905B1 (en) | 2019-04-04 | 2024-02-01 | Regeneron Pharma | Non-human animals containing the human coagulation factor 12 locus |
IL286917B (en) | 2019-04-04 | 2022-09-01 | Regeneron Pharma | Methods for scar-free insertion of targeted modifications into targeted vectors |
GB201905360D0 (en) | 2019-04-16 | 2019-05-29 | Univ Nottingham | Fungal strains, production and uses thereof |
US20220220495A1 (en) | 2019-05-10 | 2022-07-14 | Basf Se | Regulatory nucleic acid molecules for enhancing gene expression in plants |
EP3801011A1 (en) | 2019-06-04 | 2021-04-14 | Regeneron Pharmaceuticals, Inc. | Non-human animals comprising a humanized ttr locus with a beta-slip mutation and methods of use |
AU2020288623A1 (en) | 2019-06-06 | 2022-01-06 | Inscripta, Inc. | Curing for recursive nucleic acid-guided cell editing |
KR20220017939A (ko) | 2019-06-07 | 2022-02-14 | 리제너론 파마슈티칼스 인코포레이티드 | 인간화 알부민 좌위를 포함하는 비-인간 동물 |
AU2020290509A1 (en) | 2019-06-14 | 2021-11-11 | Regeneron Pharmaceuticals, Inc. | Models of tauopathy |
US10907125B2 (en) | 2019-06-20 | 2021-02-02 | Inscripta, Inc. | Flow through electroporation modules and instrumentation |
CN114008070A (zh) | 2019-06-21 | 2022-02-01 | 因思科瑞普特公司 | 导致大肠杆菌赖氨酸产量增加的全基因组合理设计的突变 |
US10927385B2 (en) | 2019-06-25 | 2021-02-23 | Inscripta, Inc. | Increased nucleic-acid guided cell editing in yeast |
WO2021050398A1 (en) * | 2019-09-10 | 2021-03-18 | The Regents Of The University Of California | Synthetic lethality screening platform for cells undergoing alt |
CA3150334A1 (en) | 2019-09-12 | 2021-03-18 | Frank Meulewaeter | REGULATORY NUCLEIC ACID MOLECULES TO ENHANCE GENE EXPRESSION IN PLANTS |
JP2022548031A (ja) | 2019-09-13 | 2022-11-16 | リジェネロン・ファーマシューティカルズ・インコーポレイテッド | 脂質ナノ粒子によって送達されるcrispr/casシステムを使用する動物における転写調節 |
WO2021069387A1 (en) | 2019-10-07 | 2021-04-15 | Basf Se | Regulatory nucleic acid molecules for enhancing gene expression in plants |
CN110628825A (zh) * | 2019-10-14 | 2019-12-31 | 上海捷易生物科技有限公司 | 一种依赖nhej的报告基因敲入组合物及其使用方法 |
KR20220097414A (ko) | 2019-11-08 | 2022-07-07 | 리제너론 파마슈티칼스 인코포레이티드 | X-연관 연소 망막층간분리 치료법을 위한 crispr 및 aav 전략 |
US11203762B2 (en) | 2019-11-19 | 2021-12-21 | Inscripta, Inc. | Methods for increasing observed editing in bacteria |
WO2021108363A1 (en) | 2019-11-25 | 2021-06-03 | Regeneron Pharmaceuticals, Inc. | Crispr/cas-mediated upregulation of humanized ttr allele |
AU2020396138A1 (en) | 2019-12-03 | 2022-06-16 | Basf Se | Regulatory nucleic acid molecules for enhancing gene expression in plants |
AU2020402526A1 (en) | 2019-12-10 | 2022-06-09 | Inscripta, Inc. | Novel mad nucleases |
US10704033B1 (en) | 2019-12-13 | 2020-07-07 | Inscripta, Inc. | Nucleic acid-guided nucleases |
WO2021122080A1 (en) | 2019-12-16 | 2021-06-24 | BASF Agricultural Solutions Seed US LLC | Improved genome editing using paired nickases |
US11008557B1 (en) | 2019-12-18 | 2021-05-18 | Inscripta, Inc. | Cascade/dCas3 complementation assays for in vivo detection of nucleic acid-guided nuclease edited cells |
EP4087600A4 (en) * | 2020-01-09 | 2024-01-24 | Pioneer Hi Bred Int | TWO-STEP GENE EXCHANGE |
US10689669B1 (en) | 2020-01-11 | 2020-06-23 | Inscripta, Inc. | Automated multi-module cell processing methods, instruments, and systems |
WO2021154706A1 (en) | 2020-01-27 | 2021-08-05 | Inscripta, Inc. | Electroporation modules and instrumentation |
CN115175559A (zh) | 2020-01-28 | 2022-10-11 | 瑞泽恩制药公司 | 包含人源化pnpla3基因座的非人动物及其使用方法 |
EP4099821A1 (en) | 2020-02-07 | 2022-12-14 | Regeneron Pharmaceuticals, Inc. | <smallcaps/>? ? ?klkb1? ? ? ? ?non-human animals comprising a humanizedlocus and methods of use |
EP4114946A1 (en) | 2020-03-04 | 2023-01-11 | Regeneron Pharmaceuticals, Inc. | Methods and compositions for sensitization of tumor cells to immune therapy |
US20230102342A1 (en) | 2020-03-23 | 2023-03-30 | Regeneron Pharmaceuticals, Inc. | Non-human animals comprising a humanized ttr locus comprising a v30m mutation and methods of use |
KR20220161383A (ko) | 2020-03-31 | 2022-12-06 | 메타지노미, 인크. | 클래스 ii, 유형 ii crispr 시스템 |
US20210319851A1 (en) | 2020-04-03 | 2021-10-14 | Creyon Bio, Inc. | Oligonucleotide-based machine learning |
US20210332388A1 (en) | 2020-04-24 | 2021-10-28 | Inscripta, Inc. | Compositions, methods, modules and instruments for automated nucleic acid-guided nuclease editing in mammalian cells |
CA3177481A1 (en) | 2020-05-08 | 2021-11-11 | David R. Liu | Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence |
US11787841B2 (en) | 2020-05-19 | 2023-10-17 | Inscripta, Inc. | Rationally-designed mutations to the thrA gene for enhanced lysine production in E. coli |
US20230232796A1 (en) | 2020-06-26 | 2023-07-27 | Regeneron Pharmaceuticals, Inc. | Non-human animals comprising a humanized ace2 locus |
CN111849986A (zh) * | 2020-07-24 | 2020-10-30 | 江苏集萃药康生物科技有限公司 | 一种减少CRISPR-Cas9基因编辑中双链DNA片段串联的方法及其应用 |
US11299731B1 (en) | 2020-09-15 | 2022-04-12 | Inscripta, Inc. | CRISPR editing to embed nucleic acid landing pads into genomes of live cells |
US11512297B2 (en) | 2020-11-09 | 2022-11-29 | Inscripta, Inc. | Affinity tag for recombination protein recruitment |
WO2022120022A1 (en) | 2020-12-02 | 2022-06-09 | Regeneron Pharmaceuticals, Inc. | Crispr sam biosensor cell lines and methods of use thereof |
US20240058390A1 (en) * | 2020-12-16 | 2024-02-22 | The Administrators Of The Tulane Educational Fund | Wnt+ adipocytes, exosomes from wnt+ adipocytes, and methods of making and using them |
AU2021415461A1 (en) | 2021-01-04 | 2023-08-17 | Inscripta, Inc. | Mad nucleases |
EP4274890A1 (en) | 2021-01-07 | 2023-11-15 | Inscripta, Inc. | Mad nucleases |
US11884924B2 (en) | 2021-02-16 | 2024-01-30 | Inscripta, Inc. | Dual strand nucleic acid-guided nickase editing |
GB202103131D0 (en) | 2021-03-05 | 2021-04-21 | Biosystems Tech Limited | Method for preparation of research organisms |
EP4337769A1 (en) | 2021-05-10 | 2024-03-20 | SQZ Biotechnologies Company | Methods for delivering genome editing molecules to the nucleus or cytosol of a cell and uses thereof |
WO2022251644A1 (en) | 2021-05-28 | 2022-12-01 | Lyell Immunopharma, Inc. | Nr4a3-deficient immune cells and uses thereof |
KR20240027676A (ko) | 2021-06-02 | 2024-03-04 | 라이엘 이뮤노파마, 인크. | Nr4a3-결핍 면역 세포 및 이의 용도 |
WO2023039586A1 (en) | 2021-09-10 | 2023-03-16 | Agilent Technologies, Inc. | Guide rnas with chemical modification for prime editing |
WO2023064924A1 (en) | 2021-10-14 | 2023-04-20 | Codiak Biosciences, Inc. | Modified producer cells for extracellular vesicle production |
WO2023077053A2 (en) | 2021-10-28 | 2023-05-04 | Regeneron Pharmaceuticals, Inc. | Crispr/cas-related methods and compositions for knocking out c5 |
WO2023077148A1 (en) | 2021-11-01 | 2023-05-04 | Tome Biosciences, Inc. | Single construct platform for simultaneous delivery of gene editing machinery and nucleic acid cargo |
AU2022381205A1 (en) | 2021-11-04 | 2024-03-28 | Regeneron Pharmaceuticals, Inc. | Non-human animals comprising a modified cacng1 locus |
CA3238939A1 (en) | 2021-12-08 | 2023-06-15 | Gaurang Patel | Mutant myocilin disease model and uses thereof |
GB202118058D0 (en) | 2021-12-14 | 2022-01-26 | Univ Warwick | Methods to increase yields in crops |
US20230279442A1 (en) | 2021-12-15 | 2023-09-07 | Versitech Limited | Engineered cas9-nucleases and method of use thereof |
WO2023122506A1 (en) | 2021-12-20 | 2023-06-29 | Regeneron Pharmaceuticals, Inc. | Non-human animals comprising humanized ace2 and tmprss loci |
WO2023122764A1 (en) | 2021-12-22 | 2023-06-29 | Tome Biosciences, Inc. | Co-delivery of a gene editor construct and a donor template |
WO2023129974A1 (en) | 2021-12-29 | 2023-07-06 | Bristol-Myers Squibb Company | Generation of landing pad cell lines |
WO2023150181A1 (en) | 2022-02-01 | 2023-08-10 | President And Fellows Of Harvard College | Methods and compositions for treating cancer |
TW202332767A (zh) | 2022-02-02 | 2023-08-16 | 美商雷傑納榮製藥公司 | 用於治療龐貝氏症之抗TfR:GAA及抗CD63:GAA插入 |
WO2023150798A1 (en) | 2022-02-07 | 2023-08-10 | Regeneron Pharmaceuticals, Inc. | Compositions and methods for defining optimal treatment timeframes in lysosomal disease |
WO2023205744A1 (en) | 2022-04-20 | 2023-10-26 | Tome Biosciences, Inc. | Programmable gene insertion compositions |
WO2023212677A2 (en) | 2022-04-29 | 2023-11-02 | Regeneron Pharmaceuticals, Inc. | Identification of tissue-specific extragenic safe harbors for gene therapy approaches |
WO2023215831A1 (en) | 2022-05-04 | 2023-11-09 | Tome Biosciences, Inc. | Guide rna compositions for programmable gene insertion |
WO2023220603A1 (en) | 2022-05-09 | 2023-11-16 | Regeneron Pharmaceuticals, Inc. | Vectors and methods for in vivo antibody production |
WO2023225665A1 (en) | 2022-05-19 | 2023-11-23 | Lyell Immunopharma, Inc. | Polynucleotides targeting nr4a3 and uses thereof |
WO2023225670A2 (en) | 2022-05-20 | 2023-11-23 | Tome Biosciences, Inc. | Ex vivo programmable gene insertion |
WO2023235725A2 (en) | 2022-05-31 | 2023-12-07 | Regeneron Pharmaceuticals, Inc. | Crispr-based therapeutics for c9orf72 repeat expansion disease |
WO2023235726A2 (en) | 2022-05-31 | 2023-12-07 | Regeneron Pharmaceuticals, Inc. | Crispr interference therapeutics for c9orf72 repeat expansion disease |
WO2023250384A2 (en) * | 2022-06-22 | 2023-12-28 | The Regents Of The University Of California | Crispr-cas effector polypeptides and methods of use thereof |
GB2621813A (en) | 2022-06-30 | 2024-02-28 | Univ Newcastle | Preventing disease recurrence in Mitochondrial replacement therapy |
WO2024020587A2 (en) | 2022-07-22 | 2024-01-25 | Tome Biosciences, Inc. | Pleiopluripotent stem cell programmable gene insertion |
WO2024026488A2 (en) | 2022-07-29 | 2024-02-01 | Regeneron Pharmaceuticals, Inc. | Non-human animals comprising a modified transferrin receptor locus |
WO2024026474A1 (en) | 2022-07-29 | 2024-02-01 | Regeneron Pharmaceuticals, Inc. | Compositions and methods for transferrin receptor (tfr)-mediated delivery to the brain and muscle |
WO2024031053A1 (en) | 2022-08-05 | 2024-02-08 | Regeneron Pharmaceuticals, Inc. | Aggregation-resistant variants of tdp-43 |
WO2024064958A1 (en) | 2022-09-23 | 2024-03-28 | Lyell Immunopharma, Inc. | Methods for culturing nr4a-deficient cells |
WO2024064952A1 (en) | 2022-09-23 | 2024-03-28 | Lyell Immunopharma, Inc. | Methods for culturing nr4a-deficient cells overexpressing c-jun |
WO2024073606A1 (en) | 2022-09-28 | 2024-04-04 | Regeneron Pharmaceuticals, Inc. | Antibody resistant modified receptors to enhance cell-based therapies |
WO2024077174A1 (en) | 2022-10-05 | 2024-04-11 | Lyell Immunopharma, Inc. | Methods for culturing nr4a-deficient cells |
WO2024083579A1 (en) | 2022-10-20 | 2024-04-25 | Basf Se | Regulatory nucleic acid molecules for enhancing gene expression in plants |
WO2024098002A1 (en) | 2022-11-04 | 2024-05-10 | Regeneron Pharmaceuticals, Inc. | Calcium voltage-gated channel auxiliary subunit gamma 1 (cacng1) binding proteins and cacng1-mediated delivery to skeletal muscle |
WO2024107765A2 (en) | 2022-11-14 | 2024-05-23 | Regeneron Pharmaceuticals, Inc. | Compositions and methods for fibroblast growth factor receptor 3-mediated delivery to astrocytes |
WO2024107670A1 (en) | 2022-11-16 | 2024-05-23 | Regeneron Pharmaceuticals, Inc. | Chimeric proteins comprising membrane bound il-12 with protease cleavable linkers |
Family Cites Families (168)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4952496A (en) | 1984-03-30 | 1990-08-28 | Associated Universities, Inc. | Cloning and expression of the gene for bacteriophage T7 RNA polymerase |
WO1988008450A1 (en) | 1987-05-01 | 1988-11-03 | Birdwell Finlayson | Gene therapy for metabolite disorders |
US5350689A (en) | 1987-05-20 | 1994-09-27 | Ciba-Geigy Corporation | Zea mays plants and transgenic Zea mays plants regenerated from protoplasts or protoplast-derived cells |
US5767367A (en) | 1990-06-23 | 1998-06-16 | Hoechst Aktiengesellschaft | Zea mays (L.) with capability of long term, highly efficient plant regeneration including fertile transgenic maize plants having a heterologous gene, and their preparation |
US7150982B2 (en) | 1991-09-09 | 2006-12-19 | Third Wave Technologies, Inc. | RNA detection assays |
FR2763797B1 (fr) * | 1997-05-30 | 1999-07-16 | Tabacs & Allumettes Ind | Cigarette a tres faible taux de goudron presentant un gout de tabac comparable a celui d'une cigarette classique a plus fort taux de goudron |
US20040186071A1 (en) | 1998-04-13 | 2004-09-23 | Bennett C. Frank | Antisense modulation of CD40 expression |
US20020182673A1 (en) | 1998-05-15 | 2002-12-05 | Genentech, Inc. | IL-17 homologous polypedies and therapeutic uses thereof |
EP1147209A2 (en) | 1999-02-03 | 2001-10-24 | The Children's Medical Center Corporation | Gene repair involving the induction of double-stranded dna cleavage at a chromosomal target site |
US8183339B1 (en) * | 1999-10-12 | 2012-05-22 | Xigen S.A. | Cell-permeable peptide inhibitors of the JNK signal transduction pathway |
WO2002026967A2 (en) | 2000-09-25 | 2002-04-04 | Thomas Jefferson University | Targeted gene correction by single-stranded oligodeoxynucleotides |
CA2881568C (en) | 2000-10-27 | 2019-09-24 | Novartis Vaccines And Diagnostics, Inc. | Nucleic acids and proteins from streptococcus groups a & b |
JP3454818B1 (ja) * | 2001-03-16 | 2003-10-06 | 直哉 小林 | 肝臓細胞の増殖方法、該方法により得られる肝臓細胞、およびその用途 |
KR20040022449A (ko) | 2001-07-12 | 2004-03-12 | 유니버시티 오브 매사추세츠 | 유전자 불활성화를 매개하는 소형 간섭 rna의 생체내제조 |
US20060253913A1 (en) | 2001-12-21 | 2006-11-09 | Yue-Jin Huang | Production of hSA-linked butyrylcholinesterases in transgenic mammals |
WO2003087341A2 (en) * | 2002-01-23 | 2003-10-23 | The University Of Utah Research Foundation | Targeted chromosomal mutagenesis using zinc finger nucleases |
US20030232410A1 (en) | 2002-03-21 | 2003-12-18 | Monika Liljedahl | Methods and compositions for using zinc finger endonucleases to enhance homologous recombination |
AU2003224897A1 (en) | 2002-04-09 | 2003-10-27 | Kenneth L. Beattie | Oligonucleotide probes for genosensor chips |
AU2003233719A1 (en) * | 2002-06-06 | 2003-12-22 | Her Majesty The Queen In Right Of Canada As Represented By The Minister Of Agriculture And Agri-Food | Modifying the dna recombination potential in eukaryotes |
EP2806025B1 (en) | 2002-09-05 | 2019-04-03 | California Institute of Technology | Use of zinc finger nucleases to stimulate gene targeting |
DE10260805A1 (de) * | 2002-12-23 | 2004-07-22 | Geneart Gmbh | Verfahren und Vorrichtung zum Optimieren einer Nucleotidsequenz zur Expression eines Proteins |
WO2005014791A2 (en) * | 2003-08-08 | 2005-02-17 | Sangamo Biosciences, Inc. | Methods and compositions for targeted cleavage and recombination |
US8053232B2 (en) | 2004-01-23 | 2011-11-08 | Virxsys Corporation | Correction of alpha-1-antitrypsin genetic defects using spliceosome mediated RNA trans splicing |
US7972854B2 (en) | 2004-02-05 | 2011-07-05 | Sangamo Biosciences, Inc. | Methods and compositions for targeted cleavage and recombination |
US20050220796A1 (en) | 2004-03-31 | 2005-10-06 | Dynan William S | Compositions and methods for modulating DNA repair |
US7919277B2 (en) | 2004-04-28 | 2011-04-05 | Danisco A/S | Detection and typing of bacterial strains |
EP2316942B1 (en) * | 2004-12-22 | 2021-04-21 | Alnylam Pharmaceuticals, Inc. | Conserved hbv and hcv sequences useful for gene silencing |
US7892224B2 (en) | 2005-06-01 | 2011-02-22 | Brainlab Ag | Inverse catheter planning |
US7534819B2 (en) | 2005-06-10 | 2009-05-19 | University Of Washington | Compositions and methods for intracellular delivery of biotinylated cargo |
US20060282289A1 (en) | 2005-06-14 | 2006-12-14 | Healthmatch Solutions, Llc | System and method for health care financing |
WO2007014181A2 (en) * | 2005-07-25 | 2007-02-01 | Johns Hopkins University | Site-specific modification of the human genome using custom-designed zinc finger nucleases |
CN101273141B (zh) * | 2005-07-26 | 2013-03-27 | 桑格摩生物科学股份有限公司 | 外源核酸序列的靶向整合和表达 |
US10022457B2 (en) | 2005-08-05 | 2018-07-17 | Gholam A. Peyman | Methods to regulate polarization and enhance function of cells |
ES2398918T3 (es) | 2005-08-26 | 2013-03-22 | Dupont Nutrition Biosciences Aps | Un método y una ordenación para soportar verticalmente elementos de resistencia eléctrica pendientes |
KR100877824B1 (ko) * | 2005-11-11 | 2009-01-12 | 한국생명공학연구원 | E2epf ucp-vhl 상호작용 및 그 용도 |
EP2522749A1 (en) * | 2006-03-02 | 2012-11-14 | The Ohio State University | MicroRNA expression profile associated with pancreatic cancer |
WO2007106690A2 (en) | 2006-03-15 | 2007-09-20 | Siemens Healthcare Diagnostics Inc. | Degenerate nucleobase analogs |
JP2009531444A (ja) * | 2006-03-28 | 2009-09-03 | ノバルティス アーゲー | HIVTATタンパク質およびEnvタンパク質の共有結合的に連結された複合体 |
WO2007128338A1 (en) | 2006-05-10 | 2007-11-15 | Deinove | Process for chromosomal engineering using a novel dna repair system |
DK2426220T3 (en) | 2006-05-19 | 2016-09-26 | Dupont Nutrition Biosci Aps | Labeled microorganisms, and methods for labeling |
EP2019839B1 (en) | 2006-05-25 | 2011-12-07 | Sangamo BioSciences, Inc. | Methods and compositions for gene inactivation |
DK2034848T3 (en) | 2006-06-16 | 2017-02-06 | Dupont Nutrition Biosci Aps | STREPTOCOCCUS THERMOPHILUS BACTERIA |
US8481272B2 (en) * | 2006-08-04 | 2013-07-09 | Georgia State University Research Foundation, Inc. | Enzyme sensors, methods for preparing and using such sensors, and methods of detecting protease activity |
ES2719789T3 (es) | 2007-03-02 | 2019-07-16 | Dupont Nutrition Biosci Aps | Cultivos con resistencia mejorada a fagos |
GB0806086D0 (en) | 2008-04-04 | 2008-05-14 | Ulive Entpr Ltd | Dendrimer polymer hybrids |
WO2010011961A2 (en) | 2008-07-25 | 2010-01-28 | University Of Georgia Research Foundation, Inc. | Prokaryotic rnai-like system and methods of use |
KR101759586B1 (ko) | 2008-08-22 | 2017-07-19 | 상가모 테라퓨틱스, 인코포레이티드 | 표적화된 단일가닥 분할 및 표적화된 통합을 위한 방법 및 조성물 |
ES2738980T3 (es) | 2008-09-15 | 2020-01-28 | Childrens Medical Ct Corp | Modulación de BCL11A para el tratamiento de hemoglobinopatías |
US20100076057A1 (en) * | 2008-09-23 | 2010-03-25 | Northwestern University | TARGET DNA INTERFERENCE WITH crRNA |
US9404098B2 (en) | 2008-11-06 | 2016-08-02 | University Of Georgia Research Foundation, Inc. | Method for cleaving a target RNA using a Cas6 polypeptide |
US10662227B2 (en) | 2008-11-07 | 2020-05-26 | Dupont Nutrition Biosciences Aps | Bifidobacteria CRISPR sequences |
CN102264895B (zh) | 2008-12-12 | 2015-01-28 | 杜邦营养生物科学有限公司 | 用于乳品发酵的具有独特流变性质的嗜热链球菌菌株的遗传簇 |
WO2010075424A2 (en) | 2008-12-22 | 2010-07-01 | The Regents Of University Of California | Compositions and methods for downregulating prokaryotic genes |
GB0823658D0 (en) | 2008-12-30 | 2009-02-04 | Angiomed Ag | Stent delivery device |
US8392349B2 (en) | 2009-02-23 | 2013-03-05 | Shalini Vajjhala | Global adaptation atlas and method of creating same |
WO2010117464A1 (en) | 2009-04-09 | 2010-10-14 | Sangamo Biosciences, Inc. | Targeted integration into stem cells |
EA023938B1 (ru) | 2009-04-30 | 2016-07-29 | Оспедале Сан Рафаэлле С.Р.Л. | Вектор гена |
US20120192298A1 (en) * | 2009-07-24 | 2012-07-26 | Sigma Aldrich Co. Llc | Method for genome editing |
JP2013500018A (ja) | 2009-07-24 | 2013-01-07 | シグマ−アルドリッチ・カンパニー・リミテッド・ライアビリティ・カンパニー | ゲノム編集のための方法 |
EP2461819A4 (en) | 2009-07-28 | 2013-07-31 | Sangamo Biosciences Inc | METHODS AND COMPOSITIONS FOR TREATING TRI-NUCLEOTIDE REPEAT DISORDERS |
KR101418355B1 (ko) | 2009-10-23 | 2014-07-11 | (주)바이오니아 | 고밀도 유전자 합성기 |
DE102009052674B4 (de) | 2009-11-12 | 2012-10-18 | Karl Weinhold | Verfahren und Vorrichtung zum Verbinden von Doppelmantelrohren |
US20110294114A1 (en) | 2009-12-04 | 2011-12-01 | Cincinnati Children's Hospital Medical Center | Optimization of determinants for successful genetic correction of diseases, mediated by hematopoietic stem cells |
AU2010327998B2 (en) | 2009-12-10 | 2015-11-12 | Iowa State University Research Foundation, Inc. | TAL effector-mediated DNA modification |
WO2011100058A1 (en) | 2010-02-09 | 2011-08-18 | Sangamo Biosciences, Inc. | Targeted genomic modification with partially single-stranded donor molecules |
US10087431B2 (en) | 2010-03-10 | 2018-10-02 | The Regents Of The University Of California | Methods of generating nucleic acid fragments |
MX2012013037A (es) | 2010-05-10 | 2013-07-29 | Univ California | Composiciones de endorribonucleasa y metodos de uso de las mismas. |
WO2011146121A1 (en) | 2010-05-17 | 2011-11-24 | Sangamo Biosciences, Inc. | Novel dna-binding proteins and uses thereof |
EP2392208B1 (en) * | 2010-06-07 | 2016-05-04 | Helmholtz Zentrum München Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) | Fusion proteins comprising a DNA-binding domain of a Tal effector protein and a non-specific cleavage domain of a restriction nuclease and their use |
WO2011156430A2 (en) | 2010-06-07 | 2011-12-15 | Fred Hutchinson Cancer Research Center | Generation and expression of engineered i-onui endonuclease and its homologues and uses thereof |
EP2580331A4 (en) | 2010-06-14 | 2013-11-27 | Univ Iowa State Res Found Inc | NUCLEASE ACTIVITY OF THE TAL EFFECTOR AND FUSION PROTEIN FOKI |
CN103168101A (zh) * | 2010-07-23 | 2013-06-19 | 西格马-奥尔德里奇有限责任公司 | 使用靶向核酸内切酶和单链核酸的基因组编辑 |
US9081737B2 (en) | 2010-08-02 | 2015-07-14 | Integrated Dna Technologies, Inc. | Methods for predicting stability and melting temperatures of nucleic acid duplexes |
EA201390586A1 (ru) | 2010-10-20 | 2014-11-28 | ДюПон НЬЮТРИШН БАЙОСАЙЕНСИЗ АпС | Последовательности crispr-cas lactococcus |
US9403880B2 (en) * | 2010-11-26 | 2016-08-02 | Institut Pasteur | Identification of a human gyrovirus and applications |
WO2012087756A1 (en) | 2010-12-22 | 2012-06-28 | Sangamo Biosciences, Inc. | Zinc finger nuclease modification of leucine rich repeat kinase 2 (lrrk2) mutant fibroblasts and ipscs |
KR20120096395A (ko) | 2011-02-22 | 2012-08-30 | 주식회사 툴젠 | 뉴클레아제에 의해 유전자 변형된 세포를 농축시키는 방법 |
WO2012164565A1 (en) | 2011-06-01 | 2012-12-06 | Yeda Research And Development Co. Ltd. | Compositions and methods for downregulating prokaryotic genes |
AU2012312260B2 (en) | 2011-09-21 | 2017-08-31 | Sangamo Therapeutics, Inc. | Methods and compositions for regulation of transgene expression |
JP6144691B2 (ja) | 2011-11-16 | 2017-06-07 | サンガモ セラピューティクス, インコーポレイテッド | 修飾されたdna結合タンパク質およびその使用 |
US8450107B1 (en) | 2011-11-30 | 2013-05-28 | The Broad Institute Inc. | Nucleotide-specific recognition sequences for designer TAL effectors |
GB201122458D0 (en) | 2011-12-30 | 2012-02-08 | Univ Wageningen | Modified cascade ribonucleoproteins and uses thereof |
KR101833589B1 (ko) | 2012-02-24 | 2018-03-02 | 프레드 헛친슨 켄서 리서치 센터 | 이상혈색소증 치료를 위한 조성물 및 방법 |
BR112014021104B1 (pt) | 2012-02-29 | 2023-03-28 | Sangamo Biosciences, Inc | Proteína de fusão de ocorrência não natural compreendendo um domínio de ligação de dna de dedo de zinco manipulado que se liga a um gene htt, seu uso, método in vitro de modificação da expressão de um gene htt em uma célula, e método de geração de um sistema modelo para o estudo da doença de huntington |
WO2013141680A1 (en) | 2012-03-20 | 2013-09-26 | Vilnius University | RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX |
US9637739B2 (en) | 2012-03-20 | 2017-05-02 | Vilnius University | RNA-directed DNA cleavage by the Cas9-crRNA complex |
AU2013204327B2 (en) | 2012-04-20 | 2016-09-01 | Aviagen | Cell transfection method |
CN104245940A (zh) | 2012-04-23 | 2014-12-24 | 拜尔作物科学公司 | 植物中的靶向基因组工程 |
PL2847335T3 (pl) | 2012-04-25 | 2019-01-31 | Regeneron Pharmaceuticals, Inc. | Celowanie dużymi wektorami do celowania wspomagane nukleazą |
NZ701060A (en) | 2012-05-02 | 2016-10-28 | Sangamo Biosciences Inc | Targeted modification of malate dehydrogenase |
RU2650819C2 (ru) | 2012-05-07 | 2018-04-17 | Сангамо Терапьютикс, Инк. | Способы и композиции для опосредованной нуклеазой направленной интеграции трансгенов |
WO2013169398A2 (en) | 2012-05-09 | 2013-11-14 | Georgia Tech Research Corporation | Systems and methods for improving nuclease specificity and activity |
DE202013012242U1 (de) * | 2012-05-25 | 2016-02-02 | Emmanuelle Charpentier | Zusammensetzungen für die durch RNA gesteuerte Modifikation einer Ziel-DNA und für die durch RNA gesteuerte Modulation der Transkription |
US20150376645A1 (en) | 2012-05-30 | 2015-12-31 | Baylor College Of Medicine | Supercoiled minivectors as a tool for dna repair, alteration and replacement |
US9102936B2 (en) | 2012-06-11 | 2015-08-11 | Agilent Technologies, Inc. | Method of adaptor-dimer subtraction using a CRISPR CAS6 protein |
RU2014153918A (ru) | 2012-06-12 | 2016-07-27 | Дженентек, Инк. | Способы и композиции для получения условно нокаутных аллелей |
EP2674501A1 (en) | 2012-06-14 | 2013-12-18 | Agence nationale de sécurité sanitaire de l'alimentation,de l'environnement et du travail | Method for detecting and identifying enterohemorrhagic Escherichia coli |
WO2013188638A2 (en) | 2012-06-15 | 2013-12-19 | The Regents Of The University Of California | Endoribonucleases and methods of use thereof |
CA2877290A1 (en) | 2012-06-19 | 2013-12-27 | Daniel F. Voytas | Gene targeting in plants using dna viruses |
JP6329537B2 (ja) | 2012-07-11 | 2018-05-23 | サンガモ セラピューティクス, インコーポレイテッド | 生物学的薬剤の送達のための方法および組成物 |
WO2014011237A1 (en) | 2012-07-11 | 2014-01-16 | Sangamo Biosciences, Inc. | Methods and compositions for the treatment of lysosomal storage diseases |
CN105188767A (zh) | 2012-07-25 | 2015-12-23 | 布罗德研究所有限公司 | 可诱导的dna结合蛋白和基因组干扰工具及其应用 |
EP2880171B1 (en) | 2012-08-03 | 2018-10-03 | The Regents of The University of California | Methods and compositions for controlling gene expression by rna processing |
KR102218562B1 (ko) | 2012-08-29 | 2021-02-19 | 상가모 테라퓨틱스, 인코포레이티드 | 유전적 병태를 치료하기 위한 방법 및 조성물 |
UA118090C2 (uk) | 2012-09-07 | 2018-11-26 | ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі | Спосіб інтегрування послідовності нуклеїнової кислоти, що представляє інтерес, у ген fad2 у клітині сої та специфічний для локусу fad2 білок, що зв'язується, здатний індукувати спрямований розрив |
CN105264067B (zh) | 2012-09-07 | 2020-11-10 | 美国陶氏益农公司 | Fad3性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白 |
UA119135C2 (uk) | 2012-09-07 | 2019-05-10 | ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі | Спосіб отримання трансгенної рослини |
EP2906602B1 (en) | 2012-10-12 | 2019-01-16 | The General Hospital Corporation | Transcription activator-like effector (tale) - lysine-specific demethylase 1 (lsd1) fusion proteins |
DE202013012597U1 (de) | 2012-10-23 | 2017-11-21 | Toolgen, Inc. | Zusammensetzung zum Spalten einer Ziel-DNA, umfassend eine für die Ziel-DNA spezifische guide-RNA und eine Cas-Protein-codierende Nukleinsäure oder ein Cas-Protein, sowie deren Verwendung |
AU2013337951B2 (en) | 2012-10-30 | 2019-10-03 | Recombinetics, Inc. | Control of sexual maturation in animals |
BR112015009812A2 (pt) | 2012-10-31 | 2017-08-22 | Cellectis | Método para a inserção genética específica em um genoma de planta, célula de planta transformada e seu uso, planta resistente a herbicidas, kit, vetor, e célula hospedeira |
US20140127752A1 (en) | 2012-11-07 | 2014-05-08 | Zhaohui Zhou | Method, composition, and reagent kit for targeted genomic enrichment |
PL3138910T3 (pl) | 2012-12-06 | 2018-01-31 | Sigma Aldrich Co Llc | Oparta na CRISPR modyfikacja i regulacja genomu |
WO2014093479A1 (en) | 2012-12-11 | 2014-06-19 | Montana State University | Crispr (clustered regularly interspaced short palindromic repeats) rna-guided control of gene regulation |
MX2015007549A (es) | 2012-12-12 | 2017-01-20 | Broad Inst Inc | Modificaciones de sistemas, métodos y composiciones guía optimizadas para la manipulación de secuencias. |
WO2014093694A1 (en) | 2012-12-12 | 2014-06-19 | The Broad Institute, Inc. | Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes |
EP3434776A1 (en) | 2012-12-12 | 2019-01-30 | The Broad Institute, Inc. | Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof |
US20140186843A1 (en) | 2012-12-12 | 2014-07-03 | Massachusetts Institute Of Technology | Methods, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof |
SG10201707569YA (en) | 2012-12-12 | 2017-10-30 | Broad Inst Inc | Delivery, Engineering and Optimization of Systems, Methods and Compositions for Sequence Manipulation and Therapeutic Applications |
WO2014093701A1 (en) | 2012-12-12 | 2014-06-19 | The Broad Institute, Inc. | Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof |
US20140189896A1 (en) | 2012-12-12 | 2014-07-03 | Feng Zhang | Crispr-cas component systems, methods and compositions for sequence manipulation |
US8697359B1 (en) | 2012-12-12 | 2014-04-15 | The Broad Institute, Inc. | CRISPR-Cas systems and methods for altering expression of gene products |
JP6552965B2 (ja) | 2012-12-12 | 2019-07-31 | ザ・ブロード・インスティテュート・インコーポレイテッド | 配列操作のための改善された系、方法および酵素組成物のエンジニアリングおよび最適化 |
PL2931898T3 (pl) * | 2012-12-12 | 2016-09-30 | Le Cong | Projektowanie i optymalizacja systemów, sposoby i kompozycje do manipulacji sekwencją z domenami funkcjonalnymi |
RU2678001C2 (ru) | 2012-12-13 | 2019-01-22 | ДАУ АГРОСАЙЕНСИЗ ЭлЭлСи | Способы обнаружения днк для сайт-специфической нуклеазной активности |
WO2014099744A1 (en) | 2012-12-17 | 2014-06-26 | President And Fellows Of Harvard College | Rna-guided human genome engineering |
EP2938184B1 (en) | 2012-12-27 | 2018-10-31 | Keygene N.V. | Method for removing genetic linkage in a plant |
EP3919505B1 (en) | 2013-01-16 | 2023-08-30 | Emory University | Uses of cas9-nucleic acid complexes |
CN103233028B (zh) | 2013-01-25 | 2015-05-13 | 南京徇齐生物技术有限公司 | 一种无物种限制无生物安全性问题的真核生物基因打靶方法及螺旋结构dna序列 |
WO2014127287A1 (en) | 2013-02-14 | 2014-08-21 | Massachusetts Institute Of Technology | Method for in vivo tergated mutagenesis |
EP2958990B1 (en) | 2013-02-20 | 2019-10-16 | Regeneron Pharmaceuticals, Inc. | Genetic modification of rats |
EP2958996B1 (en) | 2013-02-25 | 2019-10-16 | Sangamo Therapeutics, Inc. | Methods and compositions for enhancing nuclease-mediated gene disruption |
WO2014150624A1 (en) | 2013-03-14 | 2014-09-25 | Caribou Biosciences, Inc. | Compositions and methods of nucleic acid-targeting nucleic acids |
MX2015011985A (es) | 2013-03-15 | 2016-04-07 | Univ Minnesota | Ingenieria genomica de plantas utilizando sistemas crispr/cas. |
KR102210319B1 (ko) | 2013-03-15 | 2021-02-01 | 더 제너럴 하스피탈 코포레이션 | 특정 게놈 좌위에 대한 유전적 및 후성적 조절 단백질의 rna-안내 표적화 |
US20140273230A1 (en) | 2013-03-15 | 2014-09-18 | Sigma-Aldrich Co., Llc | Crispr-based genome modification and regulation |
US9234213B2 (en) | 2013-03-15 | 2016-01-12 | System Biosciences, Llc | Compositions and methods directed to CRISPR/Cas genomic engineering systems |
US10760064B2 (en) | 2013-03-15 | 2020-09-01 | The General Hospital Corporation | RNA-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci |
US20140364333A1 (en) | 2013-03-15 | 2014-12-11 | President And Fellows Of Harvard College | Methods for Live Imaging of Cells |
US11332719B2 (en) | 2013-03-15 | 2022-05-17 | The Broad Institute, Inc. | Recombinant virus and preparations thereof |
WO2014165825A2 (en) | 2013-04-04 | 2014-10-09 | President And Fellows Of Harvard College | Therapeutic uses of genome editing with crispr/cas systems |
CN105263312A (zh) | 2013-04-05 | 2016-01-20 | 美国陶氏益农公司 | 用于在植物基因组内整合外源序列的方法和组合物 |
HUE040575T2 (hu) | 2013-04-16 | 2019-03-28 | Regeneron Pharma | A patkány genom célzott módosítása |
CN103224947B (zh) | 2013-04-28 | 2015-06-10 | 陕西师范大学 | 一种基因打靶系统 |
US10604771B2 (en) | 2013-05-10 | 2020-03-31 | Sangamo Therapeutics, Inc. | Delivery methods and compositions for nuclease-mediated genome engineering |
EP3778899A1 (en) | 2013-05-22 | 2021-02-17 | Northwestern University | Rna-directed dna cleavage and gene editing by cas9 enzyme from neisseria meningitidis |
US9873907B2 (en) | 2013-05-29 | 2018-01-23 | Agilent Technologies, Inc. | Method for fragmenting genomic DNA using CAS9 |
US20140356956A1 (en) | 2013-06-04 | 2014-12-04 | President And Fellows Of Harvard College | RNA-Guided Transcriptional Regulation |
KR20160034901A (ko) | 2013-06-17 | 2016-03-30 | 더 브로드 인스티튜트, 인코퍼레이티드 | 서열 조작에 최적화된 crispr-cas 이중 닉카아제 시스템, 방법 및 조성물 |
BR112015031608A2 (pt) | 2013-06-17 | 2017-08-22 | Massachusetts Inst Technology | Aplicação e uso dos sistemas crispr-cas, vetores e composições para direcionamento e terapia hepáticos |
RU2716421C2 (ru) | 2013-06-17 | 2020-03-11 | Те Брод Инститьют Инк. | Доставка, применение и применения в терапии систем crispr-cas и композиций для целенаправленного воздействия на нарушения и заболевания с использованием вирусных компонентов |
WO2014204727A1 (en) | 2013-06-17 | 2014-12-24 | The Broad Institute Inc. | Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof |
EP3011032B1 (en) | 2013-06-17 | 2019-10-16 | The Broad Institute, Inc. | Delivery, engineering and optimization of systems, methods and compositions for targeting and modeling diseases and disorders of post mitotic cells |
CN103343120B (zh) | 2013-07-04 | 2015-03-04 | 中国科学院遗传与发育生物学研究所 | 一种小麦基因组定点改造方法 |
CN103382468B (zh) * | 2013-07-04 | 2015-04-29 | 中国科学院遗传与发育生物学研究所 | 一种水稻基因组定点改造方法 |
SG10201913015XA (en) | 2013-07-10 | 2020-02-27 | Harvard College | Orthogonal cas9 proteins for rna-guided gene regulation and editing |
CN103388006B (zh) | 2013-07-26 | 2015-10-28 | 华东师范大学 | 一种基因定点突变的构建方法 |
US10421957B2 (en) | 2013-07-29 | 2019-09-24 | Agilent Technologies, Inc. | DNA assembly using an RNA-programmable nickase |
US10233465B2 (en) | 2013-11-04 | 2019-03-19 | Dow Agrosciences Llc | Optimal soybean loci |
BR102014027438B1 (pt) | 2013-11-04 | 2022-09-27 | Dow Agrosciences Llc | Molécula de ácido nucleico recombinante e método de produção de uma célula vegetal transgênica |
US9909131B2 (en) | 2013-11-04 | 2018-03-06 | Dow Agrosciences Llc | Optimal soybean loci |
DK3066201T3 (en) | 2013-11-07 | 2018-06-06 | Editas Medicine Inc | CRISPR-RELATED PROCEDURES AND COMPOSITIONS WITH LEADING GRADES |
MX2016007654A (es) | 2013-12-11 | 2017-08-15 | Regeneron Pharma | Metodos y composiciones para la modificacion dirigida de un genoma. |
US9850525B2 (en) | 2014-01-29 | 2017-12-26 | Agilent Technologies, Inc. | CAS9-based isothermal method of detection of specific DNA sequence |
WO2015117041A1 (en) | 2014-01-30 | 2015-08-06 | Nair Ramesh B | Gene modification-mediated methods and compositions for generating dominant traits in eukaryotic systems |
US20150225801A1 (en) | 2014-02-11 | 2015-08-13 | California Institute Of Technology | Recording and mapping lineage information and molecular events in individual cells |
US10370680B2 (en) | 2014-02-24 | 2019-08-06 | Sangamo Therapeutics, Inc. | Method of treating factor IX deficiency using nuclease-mediated targeted integration |
AU2015231353B2 (en) | 2014-03-18 | 2020-11-05 | Sangamo Therapeutics, Inc. | Methods and compositions for regulation of zinc finger protein expression |
-
2013
- 2013-12-05 PL PL16183723T patent/PL3138910T3/pl unknown
- 2013-12-05 PL PL16183724T patent/PL3138911T3/pl unknown
- 2013-12-05 JP JP2015545838A patent/JP6620018B2/ja active Active
- 2013-12-05 PT PT16183725T patent/PT3138912T/pt unknown
- 2013-12-05 DK DK16183724.0T patent/DK3138911T3/en active
- 2013-12-05 EP EP16183723.2A patent/EP3138910B1/en not_active Revoked
- 2013-12-05 EP EP18160519.7A patent/EP3363902B1/en active Active
- 2013-12-05 ES ES18160519T patent/ES2769310T3/es active Active
- 2013-12-05 ES ES13859964T patent/ES2757325T3/es active Active
- 2013-12-05 CA CA2977152A patent/CA2977152C/en active Active
- 2013-12-05 DK DK13859964T patent/DK2928496T3/da active
- 2013-12-05 PT PT181567348T patent/PT3360964T/pt unknown
- 2013-12-05 PL PL13859964T patent/PL2928496T3/pl unknown
- 2013-12-05 ES ES16183723.2T patent/ES2653212T3/es active Active
- 2013-12-05 CN CN201380072477.4A patent/CN105142669B/zh active Active
- 2013-12-05 KR KR1020237015558A patent/KR20230070065A/ko active IP Right Grant
- 2013-12-05 DK DK18160519.7T patent/DK3363902T3/da active
- 2013-12-05 PT PT16183724T patent/PT3138911T/pt unknown
- 2013-12-05 EP EP16183724.0A patent/EP3138911B1/en active Active
- 2013-12-05 LT LTEP16183724.0T patent/LT3138911T/lt unknown
- 2013-12-05 KR KR1020197022305A patent/KR102145760B1/ko active IP Right Grant
- 2013-12-05 EP EP16183725.7A patent/EP3138912B1/en not_active Revoked
- 2013-12-05 KR KR1020207023229A patent/KR102243092B1/ko active IP Right Grant
- 2013-12-05 KR KR1020217011309A patent/KR102479178B1/ko active IP Right Grant
- 2013-12-05 ES ES16183725T patent/ES2713243T3/es active Active
- 2013-12-05 EP EP19189913.7A patent/EP3617309A3/en active Pending
- 2013-12-05 LT LTEP16183725.7T patent/LT3138912T/lt unknown
- 2013-12-05 DK DK18156734T patent/DK3360964T3/da active
- 2013-12-05 EP EP16183720.8A patent/EP3141604A1/en not_active Withdrawn
- 2013-12-05 PT PT138599642T patent/PT2928496T/pt unknown
- 2013-12-05 LT LTEP16183723.2T patent/LT3138910T/lt unknown
- 2013-12-05 ES ES18156734T patent/ES2757808T3/es active Active
- 2013-12-05 EP EP16183719.0A patent/EP3135765A1/en not_active Withdrawn
- 2013-12-05 PL PL16183725T patent/PL3138912T3/pl unknown
- 2013-12-05 SG SG10201910987SA patent/SG10201910987SA/en unknown
- 2013-12-05 CN CN201810540449.5A patent/CN108715602A/zh active Pending
- 2013-12-05 SG SG11201503824SA patent/SG11201503824SA/en unknown
- 2013-12-05 KR KR1020187001934A patent/KR102006880B1/ko active IP Right Grant
- 2013-12-05 WO PCT/US2013/073307 patent/WO2014089290A1/en active Application Filing
- 2013-12-05 CA CA2891347A patent/CA2891347C/en active Active
- 2013-12-05 AU AU2013355214A patent/AU2013355214B2/en active Active
- 2013-12-05 US US14/649,777 patent/US20160017366A1/en not_active Abandoned
- 2013-12-05 EP EP13859964.2A patent/EP2928496B1/en not_active Revoked
- 2013-12-05 CA CA3034794A patent/CA3034794A1/en active Pending
- 2013-12-05 BR BR112015012375A patent/BR112015012375A2/pt active Search and Examination
- 2013-12-05 PT PT161837232T patent/PT3138910T/pt unknown
- 2013-12-05 KR KR1020157013843A patent/KR101844123B1/ko active IP Right Review Request
- 2013-12-05 EP EP18156734.8A patent/EP3360964B1/en active Active
- 2013-12-05 DK DK16183725.7T patent/DK3138912T3/en active
- 2013-12-05 SG SG10201800585VA patent/SG10201800585VA/en unknown
- 2013-12-05 DK DK16183723.2T patent/DK3138910T3/en active
- 2013-12-05 LT LTEP18160519.7T patent/LT3363902T/lt unknown
- 2013-12-05 EP EP19201769.7A patent/EP3611263A1/en active Pending
- 2013-12-05 EP EP16183717.4A patent/EP3138909A1/en not_active Withdrawn
- 2013-12-05 SG SG10202107423UA patent/SG10202107423UA/en unknown
- 2013-12-05 PL PL18156734T patent/PL3360964T3/pl unknown
- 2013-12-05 IL IL300199A patent/IL300199A/en unknown
- 2013-12-05 ES ES16183724T patent/ES2714154T3/es active Active
- 2013-12-05 KR KR1020227043854A patent/KR102531576B1/ko active IP Right Grant
- 2013-12-05 PL PL18160519T patent/PL3363902T3/pl unknown
- 2013-12-05 PT PT181605197T patent/PT3363902T/pt unknown
- 2013-12-05 CN CN201810574719.4A patent/CN108913676B/zh active Active
-
2015
- 2015-05-17 IL IL238856A patent/IL238856B/en active IP Right Grant
-
2016
- 2016-06-06 HK HK16106396.9A patent/HK1218389A1/zh unknown
- 2016-06-21 US US15/188,931 patent/US20160298137A1/en not_active Abandoned
- 2016-06-21 US US15/188,933 patent/US20160298138A1/en not_active Abandoned
- 2016-06-21 US US15/188,909 patent/US20160298133A1/en not_active Abandoned
- 2016-06-21 US US15/188,902 patent/US20160298132A1/en not_active Abandoned
- 2016-06-21 US US15/188,899 patent/US20160298125A1/en not_active Abandoned
- 2016-06-21 US US15/188,911 patent/US10731181B2/en active Active
- 2016-06-21 US US15/188,924 patent/US10745716B2/en active Active
- 2016-06-21 US US15/188,927 patent/US20160298136A1/en not_active Abandoned
- 2016-11-03 US US15/342,976 patent/US20170073705A1/en not_active Abandoned
-
2017
- 2017-03-10 US US15/456,204 patent/US20170191082A1/en active Pending
- 2017-06-13 JP JP2017115672A patent/JP2017192392A/ja active Pending
- 2017-06-15 AU AU2017204031A patent/AU2017204031B2/en active Active
-
2018
- 2018-01-28 IL IL257178A patent/IL257178B/en active IP Right Grant
- 2018-09-13 AU AU2018229489A patent/AU2018229489B2/en active Active
- 2018-09-28 JP JP2018183815A patent/JP2019037231A/ja active Pending
-
2019
- 2019-02-26 AU AU2019201344A patent/AU2019201344C1/en active Active
- 2019-06-24 IL IL267598A patent/IL267598B/en unknown
- 2019-10-16 US US16/654,613 patent/US20200140897A1/en not_active Abandoned
-
2020
- 2020-04-17 JP JP2020074283A patent/JP2020120674A/ja active Pending
- 2020-07-30 US US16/943,792 patent/US20210079427A1/en not_active Abandoned
- 2020-07-30 US US16/943,767 patent/US20210207173A1/en active Pending
- 2020-09-08 AU AU2020230246A patent/AU2020230246B2/en active Active
- 2020-09-08 AU AU2020230243A patent/AU2020230243B2/en active Active
- 2020-11-19 AU AU2020273316A patent/AU2020273316B2/en active Active
-
2021
- 2021-03-03 JP JP2021033258A patent/JP2021101706A/ja active Pending
- 2021-08-10 US US17/398,648 patent/US20210388396A1/en active Pending
-
2022
- 2022-01-19 AU AU2022200330A patent/AU2022200330B2/en active Active
- 2022-03-06 IL IL291129A patent/IL291129B2/en unknown
- 2022-05-06 JP JP2022076698A patent/JP7478772B2/ja active Active
-
2023
- 2023-08-17 AU AU2023216829A patent/AU2023216829A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2022200330B2 (en) | Crispr-based genome modification and regulation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right |