KR102431079B1 - 헌팅턴병을 치료하기 위한 방법 및 조성물 - Google Patents
헌팅턴병을 치료하기 위한 방법 및 조성물 Download PDFInfo
- Publication number
- KR102431079B1 KR102431079B1 KR1020167015301A KR20167015301A KR102431079B1 KR 102431079 B1 KR102431079 B1 KR 102431079B1 KR 1020167015301 A KR1020167015301 A KR 1020167015301A KR 20167015301 A KR20167015301 A KR 20167015301A KR 102431079 B1 KR102431079 B1 KR 102431079B1
- Authority
- KR
- South Korea
- Prior art keywords
- htt
- zfp
- artificial sequence
- dna
- gene
- Prior art date
Links
- 208000023105 Huntington disease Diseases 0.000 title claims abstract description 115
- 238000000034 method Methods 0.000 title claims abstract description 93
- 239000000203 mixture Substances 0.000 title abstract description 53
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 247
- 101710185494 Zinc finger protein Proteins 0.000 claims abstract description 224
- 102100023597 Zinc finger protein 816 Human genes 0.000 claims abstract description 224
- 108700028369 Alleles Proteins 0.000 claims abstract description 165
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 104
- 230000004568 DNA-binding Effects 0.000 claims abstract description 87
- 150000007523 nucleic acids Chemical class 0.000 claims description 80
- 239000013598 vector Substances 0.000 claims description 80
- 241000282414 Homo sapiens Species 0.000 claims description 78
- 108020004707 nucleic acids Proteins 0.000 claims description 76
- 102000039446 nucleic acids Human genes 0.000 claims description 76
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 claims description 63
- 239000011701 zinc Substances 0.000 claims description 63
- 229910052725 zinc Inorganic materials 0.000 claims description 63
- 230000001965 increasing effect Effects 0.000 claims description 59
- 210000002569 neuron Anatomy 0.000 claims description 20
- 210000001577 neostriatum Anatomy 0.000 claims description 19
- 230000003612 virological effect Effects 0.000 claims description 19
- 239000008194 pharmaceutical composition Substances 0.000 claims description 18
- 239000013603 viral vector Substances 0.000 claims description 18
- 101150043003 Htt gene Proteins 0.000 claims description 17
- 102000012749 Dopamine and cAMP-Regulated Phosphoprotein 32 Human genes 0.000 claims description 13
- 108010090047 Dopamine and cAMP-Regulated Phosphoprotein 32 Proteins 0.000 claims description 13
- 239000013607 AAV vector Substances 0.000 claims description 12
- 102100020802 D(1A) dopamine receptor Human genes 0.000 claims description 10
- 102100020756 D(2) dopamine receptor Human genes 0.000 claims description 10
- 101000931925 Homo sapiens D(1A) dopamine receptor Proteins 0.000 claims description 10
- 101000931901 Homo sapiens D(2) dopamine receptor Proteins 0.000 claims description 10
- 150000003384 small molecules Chemical group 0.000 claims description 8
- 230000037426 transcriptional repression Effects 0.000 claims description 7
- 241000972680 Adeno-associated virus - 6 Species 0.000 claims description 5
- 108050004784 Huntingtin Proteins 0.000 claims description 3
- 102000016252 Huntingtin Human genes 0.000 claims description 3
- 108091005461 Nucleic proteins Proteins 0.000 claims description 3
- 230000006735 deficit Effects 0.000 claims description 3
- 230000007659 motor function Effects 0.000 claims description 2
- 210000003169 central nervous system Anatomy 0.000 claims 4
- 206010061296 Motor dysfunction Diseases 0.000 claims 1
- 230000014509 gene expression Effects 0.000 abstract description 119
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 abstract description 106
- 238000010171 animal model Methods 0.000 abstract description 9
- 108091033409 CRISPR Proteins 0.000 abstract description 6
- 238000010354 CRISPR gene editing Methods 0.000 abstract 1
- 210000004027 cell Anatomy 0.000 description 213
- 108090000765 processed proteins & peptides Proteins 0.000 description 189
- 108020004414 DNA Proteins 0.000 description 169
- 238000003776 cleavage reaction Methods 0.000 description 106
- 230000007017 scission Effects 0.000 description 106
- 235000018102 proteins Nutrition 0.000 description 99
- 230000027455 binding Effects 0.000 description 66
- 101710163270 Nuclease Proteins 0.000 description 64
- 102000004196 processed proteins & peptides Human genes 0.000 description 64
- 229920001184 polypeptide Polymers 0.000 description 62
- 241000699666 Mus <mouse, genus> Species 0.000 description 59
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 58
- 108020004999 messenger RNA Proteins 0.000 description 50
- 239000002773 nucleotide Substances 0.000 description 46
- 125000003729 nucleotide group Chemical group 0.000 description 46
- 102000040430 polynucleotide Human genes 0.000 description 44
- 108091033319 polynucleotide Proteins 0.000 description 44
- 239000002157 polynucleotide Substances 0.000 description 44
- 241000699670 Mus sp. Species 0.000 description 41
- 108020001507 fusion proteins Proteins 0.000 description 40
- 102000037865 fusion proteins Human genes 0.000 description 40
- 230000004927 fusion Effects 0.000 description 37
- 230000000694 effects Effects 0.000 description 36
- 210000002950 fibroblast Anatomy 0.000 description 31
- 239000000523 sample Substances 0.000 description 31
- 238000001890 transfection Methods 0.000 description 30
- 238000010453 CRISPR/Cas method Methods 0.000 description 29
- ADPACBMPYWJJCE-FXQIFTODSA-N Arg-Ser-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O ADPACBMPYWJJCE-FXQIFTODSA-N 0.000 description 28
- 210000000130 stem cell Anatomy 0.000 description 26
- 230000001105 regulatory effect Effects 0.000 description 25
- 108010077544 Chromatin Proteins 0.000 description 24
- 241001465754 Metazoa Species 0.000 description 24
- 210000003483 chromatin Anatomy 0.000 description 24
- 238000013461 design Methods 0.000 description 23
- 150000001413 amino acids Chemical class 0.000 description 22
- 238000006471 dimerization reaction Methods 0.000 description 22
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 22
- 108091030071 RNAI Proteins 0.000 description 21
- 108010044940 alanylglutamine Proteins 0.000 description 21
- 230000009368 gene silencing by RNA Effects 0.000 description 21
- 230000010354 integration Effects 0.000 description 21
- 230000035772 mutation Effects 0.000 description 20
- HQUXQAMSWFIRET-AVGNSLFASA-N Leu-Glu-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HQUXQAMSWFIRET-AVGNSLFASA-N 0.000 description 19
- 101001030698 Mus musculus Huntingtin Proteins 0.000 description 19
- 230000002829 reductive effect Effects 0.000 description 19
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 17
- 108700019146 Transgenes Proteins 0.000 description 17
- 239000012634 fragment Substances 0.000 description 17
- 238000001415 gene therapy Methods 0.000 description 17
- 239000005090 green fluorescent protein Substances 0.000 description 17
- 108010003700 lysyl aspartic acid Proteins 0.000 description 17
- 239000013612 plasmid Substances 0.000 description 17
- 101001072037 Homo sapiens cAMP and cAMP-inhibited cGMP 3',5'-cyclic phosphodiesterase 10A Proteins 0.000 description 16
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 16
- 230000004913 activation Effects 0.000 description 16
- 102100036377 cAMP and cAMP-inhibited cGMP 3',5'-cyclic phosphodiesterase 10A Human genes 0.000 description 16
- 201000010099 disease Diseases 0.000 description 16
- 238000012360 testing method Methods 0.000 description 16
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 15
- DENRBIYENOKSEX-PEXQALLHSA-N Gly-Ile-His Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DENRBIYENOKSEX-PEXQALLHSA-N 0.000 description 15
- ULNXMMYXQKGNPG-LPEHRKFASA-N Met-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N ULNXMMYXQKGNPG-LPEHRKFASA-N 0.000 description 15
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 15
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 15
- 108010036413 histidylglycine Proteins 0.000 description 15
- 238000001727 in vivo Methods 0.000 description 15
- 238000003753 real-time PCR Methods 0.000 description 15
- 230000002103 transcriptional effect Effects 0.000 description 15
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 14
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 14
- 230000001413 cellular effect Effects 0.000 description 14
- 238000002347 injection Methods 0.000 description 14
- 239000007924 injection Substances 0.000 description 14
- 239000002609 medium Substances 0.000 description 14
- 108091026890 Coding region Proteins 0.000 description 13
- 101150049660 DRD2 gene Proteins 0.000 description 13
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 13
- 102000040945 Transcription factor Human genes 0.000 description 13
- 108091023040 Transcription factor Proteins 0.000 description 13
- 241000700605 Viruses Species 0.000 description 13
- 235000001014 amino acid Nutrition 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 13
- 230000003993 interaction Effects 0.000 description 13
- 108010060857 isoleucyl-valyl-tyrosine Proteins 0.000 description 13
- 108010054155 lysyllysine Proteins 0.000 description 13
- 238000011282 treatment Methods 0.000 description 13
- 108010042407 Endonucleases Proteins 0.000 description 12
- 102000004533 Endonucleases Human genes 0.000 description 12
- 102000004190 Enzymes Human genes 0.000 description 12
- 108090000790 Enzymes Proteins 0.000 description 12
- 108060001084 Luciferase Proteins 0.000 description 12
- 108091034117 Oligonucleotide Proteins 0.000 description 12
- 230000006870 function Effects 0.000 description 12
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 12
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 11
- 101150110160 DRD1 gene Proteins 0.000 description 11
- 241000196324 Embryophyta Species 0.000 description 11
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 11
- LVXFNTIIGOQBMD-SRVKXCTJSA-N His-Leu-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O LVXFNTIIGOQBMD-SRVKXCTJSA-N 0.000 description 11
- CLVUXCBGKUECIT-HJGDQZAQSA-N Leu-Asp-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CLVUXCBGKUECIT-HJGDQZAQSA-N 0.000 description 11
- 239000005089 Luciferase Substances 0.000 description 11
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 11
- 238000004458 analytical method Methods 0.000 description 11
- 241000701161 unidentified adenovirus Species 0.000 description 11
- RXTBLQVXNIECFP-FXQIFTODSA-N Ala-Gln-Gln Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RXTBLQVXNIECFP-FXQIFTODSA-N 0.000 description 10
- KXOPYFNQLVUOAQ-FXQIFTODSA-N Arg-Ser-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KXOPYFNQLVUOAQ-FXQIFTODSA-N 0.000 description 10
- FAEIQWHBRBWUBN-FXQIFTODSA-N Asp-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N FAEIQWHBRBWUBN-FXQIFTODSA-N 0.000 description 10
- 102100021277 Beta-secretase 2 Human genes 0.000 description 10
- MLSKFHLRFVGNLL-WDCWCFNPSA-N Gln-Leu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MLSKFHLRFVGNLL-WDCWCFNPSA-N 0.000 description 10
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 10
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 10
- 108091028043 Nucleic acid sequence Proteins 0.000 description 10
- UKBSDLHIKIXJKH-HJGDQZAQSA-N Thr-Arg-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UKBSDLHIKIXJKH-HJGDQZAQSA-N 0.000 description 10
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 10
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 10
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 10
- 210000001671 embryonic stem cell Anatomy 0.000 description 10
- 238000002474 experimental method Methods 0.000 description 10
- 230000008439 repair process Effects 0.000 description 10
- 230000008685 targeting Effects 0.000 description 10
- 210000001519 tissue Anatomy 0.000 description 10
- TVUFMYKTYXTRPY-HERUPUMHSA-N Ala-Trp-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O TVUFMYKTYXTRPY-HERUPUMHSA-N 0.000 description 9
- VPPXTHJNTYDNFJ-CIUDSAMLSA-N Asp-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N VPPXTHJNTYDNFJ-CIUDSAMLSA-N 0.000 description 9
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 9
- SFJUYBCDQBAYAJ-YDHLFZDLSA-N Asp-Val-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SFJUYBCDQBAYAJ-YDHLFZDLSA-N 0.000 description 9
- 101710150190 Beta-secretase 2 Proteins 0.000 description 9
- 108091079001 CRISPR RNA Proteins 0.000 description 9
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 9
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 9
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 9
- YOTHMZZSJKKEHZ-SZMVWBNQSA-N Glu-Trp-Lys Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CCC(O)=O)=CNC2=C1 YOTHMZZSJKKEHZ-SZMVWBNQSA-N 0.000 description 9
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 9
- YIPFBJGBRCJJJD-FHWLQOOXSA-N Pro-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@@H]3CCCN3 YIPFBJGBRCJJJD-FHWLQOOXSA-N 0.000 description 9
- 238000010459 TALEN Methods 0.000 description 9
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 9
- 108700009124 Transcription Initiation Site Proteins 0.000 description 9
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 9
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 9
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 9
- 238000000338 in vitro Methods 0.000 description 9
- 239000003446 ligand Substances 0.000 description 9
- 108010064235 lysylglycine Proteins 0.000 description 9
- 238000010172 mouse model Methods 0.000 description 9
- 230000001537 neural effect Effects 0.000 description 9
- 238000004806 packaging method and process Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 230000001177 retroviral effect Effects 0.000 description 9
- 208000002267 Anti-neutrophil cytoplasmic antibody-associated vasculitis Diseases 0.000 description 8
- ITVINTQUZMQWJR-QXEWZRGKSA-N Arg-Asn-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O ITVINTQUZMQWJR-QXEWZRGKSA-N 0.000 description 8
- MFAMTAVAFBPXDC-LPEHRKFASA-N Arg-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O MFAMTAVAFBPXDC-LPEHRKFASA-N 0.000 description 8
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 8
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 8
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 8
- OSCLNNWLKKIQJM-WDSKDSINSA-N Gln-Ser-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O OSCLNNWLKKIQJM-WDSKDSINSA-N 0.000 description 8
- DDXZHOHEABQXSE-NKIYYHGXSA-N Glu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O DDXZHOHEABQXSE-NKIYYHGXSA-N 0.000 description 8
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 8
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 8
- QSXSHZIRKTUXNG-STECZYCISA-N Ile-Val-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QSXSHZIRKTUXNG-STECZYCISA-N 0.000 description 8
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 8
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 8
- 241000880493 Leptailurus serval Species 0.000 description 8
- FEHQLKKBVJHSEC-SZMVWBNQSA-N Leu-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(C)C)C(O)=O)=CNC2=C1 FEHQLKKBVJHSEC-SZMVWBNQSA-N 0.000 description 8
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 8
- CJAHQEZWDZNSJO-KKUMJFAQSA-N Phe-Lys-Cys Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CS)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CJAHQEZWDZNSJO-KKUMJFAQSA-N 0.000 description 8
- UAJAYRMZGNQILN-BQBZGAKWSA-N Ser-Gly-Met Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O UAJAYRMZGNQILN-BQBZGAKWSA-N 0.000 description 8
- VGYVVSQFSSKZRJ-OEAJRASXSA-N Thr-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CC=CC=C1 VGYVVSQFSSKZRJ-OEAJRASXSA-N 0.000 description 8
- HHSILIQTHXABKM-YDHLFZDLSA-N Val-Asp-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](Cc1ccccc1)C(O)=O HHSILIQTHXABKM-YDHLFZDLSA-N 0.000 description 8
- 108010013835 arginine glutamate Proteins 0.000 description 8
- 210000004556 brain Anatomy 0.000 description 8
- 230000007423 decrease Effects 0.000 description 8
- 238000012217 deletion Methods 0.000 description 8
- 108010085325 histidylproline Proteins 0.000 description 8
- 108010000761 leucylarginine Proteins 0.000 description 8
- 108010012581 phenylalanylglutamate Proteins 0.000 description 8
- 108091008146 restriction endonucleases Proteins 0.000 description 8
- 230000002441 reversible effect Effects 0.000 description 8
- 230000001629 suppression Effects 0.000 description 8
- 238000001262 western blot Methods 0.000 description 8
- 241000702423 Adeno-associated virus - 2 Species 0.000 description 7
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 7
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 7
- VENMDXUVHSKEIN-GUBZILKMSA-N Arg-Ser-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VENMDXUVHSKEIN-GUBZILKMSA-N 0.000 description 7
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 7
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 7
- HRBYTAIBKPNZKQ-AVGNSLFASA-N Glu-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O HRBYTAIBKPNZKQ-AVGNSLFASA-N 0.000 description 7
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 7
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 7
- RAVLQPXCMRCLKT-KBPBESRZSA-N His-Gly-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RAVLQPXCMRCLKT-KBPBESRZSA-N 0.000 description 7
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 7
- FIICHHJDINDXKG-IHPCNDPISA-N Leu-Lys-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O FIICHHJDINDXKG-IHPCNDPISA-N 0.000 description 7
- YKIRNDPUWONXQN-GUBZILKMSA-N Lys-Asn-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKIRNDPUWONXQN-GUBZILKMSA-N 0.000 description 7
- WGILOYIKJVQUPT-DCAQKATOSA-N Lys-Pro-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O WGILOYIKJVQUPT-DCAQKATOSA-N 0.000 description 7
- STLBOMUOQNIALW-BQBZGAKWSA-N Met-Gly-Cys Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O STLBOMUOQNIALW-BQBZGAKWSA-N 0.000 description 7
- UEADQPLTYBWWTG-AVGNSLFASA-N Phe-Glu-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UEADQPLTYBWWTG-AVGNSLFASA-N 0.000 description 7
- ZCXQTRXYZOSGJR-FXQIFTODSA-N Pro-Asp-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZCXQTRXYZOSGJR-FXQIFTODSA-N 0.000 description 7
- JRAUIKJSEAKTGD-TUBUOCAGSA-N Thr-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N JRAUIKJSEAKTGD-TUBUOCAGSA-N 0.000 description 7
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 7
- NWQCKAPDGQMZQN-IHPCNDPISA-N Trp-Lys-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O NWQCKAPDGQMZQN-IHPCNDPISA-N 0.000 description 7
- GITNQBVCEQBDQC-KKUMJFAQSA-N Tyr-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O GITNQBVCEQBDQC-KKUMJFAQSA-N 0.000 description 7
- HSBZWINKRYZCSQ-KKUMJFAQSA-N Tyr-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O HSBZWINKRYZCSQ-KKUMJFAQSA-N 0.000 description 7
- 108091007916 Zinc finger transcription factors Proteins 0.000 description 7
- 102000038627 Zinc finger transcription factors Human genes 0.000 description 7
- 230000004075 alteration Effects 0.000 description 7
- 239000000090 biomarker Substances 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 7
- 239000002299 complementary DNA Substances 0.000 description 7
- 230000037430 deletion Effects 0.000 description 7
- 238000001476 gene delivery Methods 0.000 description 7
- 108010050848 glycylleucine Proteins 0.000 description 7
- 238000002744 homologous recombination Methods 0.000 description 7
- 230000006801 homologous recombination Effects 0.000 description 7
- 108010009298 lysylglutamic acid Proteins 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 230000032965 negative regulation of cell volume Effects 0.000 description 7
- 230000037361 pathway Effects 0.000 description 7
- 108010018625 phenylalanylarginine Proteins 0.000 description 7
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 description 7
- 239000000243 solution Substances 0.000 description 7
- 239000000126 substance Substances 0.000 description 7
- 238000013518 transcription Methods 0.000 description 7
- 238000012546 transfer Methods 0.000 description 7
- 108010080629 tryptophan-leucine Proteins 0.000 description 7
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 6
- DPNZTBKGAUAZQU-DLOVCJGASA-N Ala-Leu-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DPNZTBKGAUAZQU-DLOVCJGASA-N 0.000 description 6
- AWZKCUCQJNTBAD-SRVKXCTJSA-N Ala-Leu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN AWZKCUCQJNTBAD-SRVKXCTJSA-N 0.000 description 6
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 6
- RYQSYXFGFOTJDJ-RHYQMDGZSA-N Arg-Thr-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RYQSYXFGFOTJDJ-RHYQMDGZSA-N 0.000 description 6
- POTCZYQVVNXUIG-BQBZGAKWSA-N Asp-Gly-Pro Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O POTCZYQVVNXUIG-BQBZGAKWSA-N 0.000 description 6
- ORRJQLIATJDMQM-HJGDQZAQSA-N Asp-Leu-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O ORRJQLIATJDMQM-HJGDQZAQSA-N 0.000 description 6
- 102000004219 Brain-derived neurotrophic factor Human genes 0.000 description 6
- 108090000715 Brain-derived neurotrophic factor Proteins 0.000 description 6
- COSBSYQVPSODFX-GUBZILKMSA-N Glu-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N COSBSYQVPSODFX-GUBZILKMSA-N 0.000 description 6
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 6
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 6
- OHWJUIXZHVIXJJ-GUBZILKMSA-N Glu-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N OHWJUIXZHVIXJJ-GUBZILKMSA-N 0.000 description 6
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 6
- 108020005004 Guide RNA Proteins 0.000 description 6
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 6
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 6
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 6
- AVTWKENDGGUWDC-BQBZGAKWSA-N Met-Cys-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O AVTWKENDGGUWDC-BQBZGAKWSA-N 0.000 description 6
- 108010025020 Nerve Growth Factor Proteins 0.000 description 6
- 102000007072 Nerve Growth Factors Human genes 0.000 description 6
- YKUGPVXSDOOANW-KKUMJFAQSA-N Phe-Leu-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKUGPVXSDOOANW-KKUMJFAQSA-N 0.000 description 6
- 238000011529 RT qPCR Methods 0.000 description 6
- NVNPWELENFJOHH-CIUDSAMLSA-N Ser-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)N NVNPWELENFJOHH-CIUDSAMLSA-N 0.000 description 6
- VGQVAVQWKJLIRM-FXQIFTODSA-N Ser-Ser-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O VGQVAVQWKJLIRM-FXQIFTODSA-N 0.000 description 6
- 102100035100 Transcription factor p65 Human genes 0.000 description 6
- BRPKEERLGYNCNC-NHCYSSNCSA-N Val-Glu-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N BRPKEERLGYNCNC-NHCYSSNCSA-N 0.000 description 6
- URIRWLJVWHYLET-ONGXEEELSA-N Val-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)C(C)C URIRWLJVWHYLET-ONGXEEELSA-N 0.000 description 6
- 241000589634 Xanthomonas Species 0.000 description 6
- 239000012190 activator Substances 0.000 description 6
- 108010070944 alanylhistidine Proteins 0.000 description 6
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 6
- 229940077737 brain-derived neurotrophic factor Drugs 0.000 description 6
- 210000000349 chromosome Anatomy 0.000 description 6
- 230000000447 dimerizing effect Effects 0.000 description 6
- 208000035475 disorder Diseases 0.000 description 6
- VYFYYTLLBUKUHU-UHFFFAOYSA-N dopamine Chemical compound NCCC1=CC=C(O)C(O)=C1 VYFYYTLLBUKUHU-UHFFFAOYSA-N 0.000 description 6
- 230000005782 double-strand break Effects 0.000 description 6
- 238000009472 formulation Methods 0.000 description 6
- 230000002068 genetic effect Effects 0.000 description 6
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 6
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 6
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 6
- 108010034529 leucyl-lysine Proteins 0.000 description 6
- 239000002502 liposome Substances 0.000 description 6
- 108010053725 prolylvaline Proteins 0.000 description 6
- 102000005962 receptors Human genes 0.000 description 6
- 108020003175 receptors Proteins 0.000 description 6
- 230000035897 transcription Effects 0.000 description 6
- OBFTYSPXDRROQO-SRVKXCTJSA-N Arg-Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCN=C(N)N OBFTYSPXDRROQO-SRVKXCTJSA-N 0.000 description 5
- FVKHEKVYFTZWDX-GHCJXIJMSA-N Asn-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N FVKHEKVYFTZWDX-GHCJXIJMSA-N 0.000 description 5
- NLRJGXZWTKXRHP-DCAQKATOSA-N Asn-Leu-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLRJGXZWTKXRHP-DCAQKATOSA-N 0.000 description 5
- ZYPWIUFLYMQZBS-SRVKXCTJSA-N Asn-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZYPWIUFLYMQZBS-SRVKXCTJSA-N 0.000 description 5
- SYZWMVSXBZCOBZ-QXEWZRGKSA-N Asn-Val-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N SYZWMVSXBZCOBZ-QXEWZRGKSA-N 0.000 description 5
- KRXIWXCXOARFNT-ZLUOBGJFSA-N Asp-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O KRXIWXCXOARFNT-ZLUOBGJFSA-N 0.000 description 5
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 5
- 102000011727 Caspases Human genes 0.000 description 5
- 108010076667 Caspases Proteins 0.000 description 5
- 230000007018 DNA scission Effects 0.000 description 5
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 5
- CGYDXNKRIMJMLV-GUBZILKMSA-N Glu-Arg-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CGYDXNKRIMJMLV-GUBZILKMSA-N 0.000 description 5
- FMBWLLMUPXTXFC-SDDRHHMPSA-N Glu-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N)C(=O)O FMBWLLMUPXTXFC-SDDRHHMPSA-N 0.000 description 5
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 5
- 101000818735 Homo sapiens Zinc finger protein 10 Proteins 0.000 description 5
- PFTFEWHJSAXGED-ZKWXMUAHSA-N Ile-Cys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N PFTFEWHJSAXGED-ZKWXMUAHSA-N 0.000 description 5
- HYLIOBDWPQNLKI-HVTMNAMFSA-N Ile-His-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HYLIOBDWPQNLKI-HVTMNAMFSA-N 0.000 description 5
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 5
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 5
- HGAJNEWOUHDUMZ-SRVKXCTJSA-N Met-Leu-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O HGAJNEWOUHDUMZ-SRVKXCTJSA-N 0.000 description 5
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 5
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 5
- 102100021872 NADPH oxidase 4 Human genes 0.000 description 5
- 101100068676 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) gln-1 gene Proteins 0.000 description 5
- MGECUMGTSHYHEJ-QEWYBTABSA-N Phe-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 MGECUMGTSHYHEJ-QEWYBTABSA-N 0.000 description 5
- XUSDDSLCRPUKLP-QXEWZRGKSA-N Pro-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 XUSDDSLCRPUKLP-QXEWZRGKSA-N 0.000 description 5
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 5
- KEGBFULVYKYJRD-LFSVMHDDSA-N Thr-Ala-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KEGBFULVYKYJRD-LFSVMHDDSA-N 0.000 description 5
- ADMHZNPMMVKGJW-BPUTZDHNSA-N Trp-Ser-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N ADMHZNPMMVKGJW-BPUTZDHNSA-N 0.000 description 5
- JHORGUYURUBVOM-KKUMJFAQSA-N Tyr-His-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O JHORGUYURUBVOM-KKUMJFAQSA-N 0.000 description 5
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 5
- JXCOEPXCBVCTRD-JYJNAYRXSA-N Val-Tyr-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JXCOEPXCBVCTRD-JYJNAYRXSA-N 0.000 description 5
- 125000000539 amino acid group Chemical group 0.000 description 5
- 108010068265 aspartyltyrosine Proteins 0.000 description 5
- -1 cationic lipids Chemical class 0.000 description 5
- 239000003795 chemical substances by application Substances 0.000 description 5
- 230000002759 chromosomal effect Effects 0.000 description 5
- 150000001875 compounds Chemical class 0.000 description 5
- 238000010276 construction Methods 0.000 description 5
- 238000010362 genome editing Methods 0.000 description 5
- 108010087823 glycyltyrosine Proteins 0.000 description 5
- 108010025306 histidylleucine Proteins 0.000 description 5
- 150000002632 lipids Chemical class 0.000 description 5
- 239000003900 neurotrophic factor Substances 0.000 description 5
- 230000010076 replication Effects 0.000 description 5
- 108010048818 seryl-histidine Proteins 0.000 description 5
- 230000001225 therapeutic effect Effects 0.000 description 5
- 238000010361 transduction Methods 0.000 description 5
- 230000026683 transduction Effects 0.000 description 5
- 108010060175 trypsinogen activation peptide Proteins 0.000 description 5
- 108010085238 Actins Proteins 0.000 description 4
- XQGIRPGAVLFKBJ-CIUDSAMLSA-N Ala-Asn-Lys Chemical compound N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)O XQGIRPGAVLFKBJ-CIUDSAMLSA-N 0.000 description 4
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 4
- OKEWAFFWMHBGPT-XPUUQOCRSA-N Ala-His-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 OKEWAFFWMHBGPT-XPUUQOCRSA-N 0.000 description 4
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 4
- BEXGZLUHRXTZCC-CIUDSAMLSA-N Arg-Gln-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N BEXGZLUHRXTZCC-CIUDSAMLSA-N 0.000 description 4
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 4
- OHYQKYUTLIPFOX-ZPFDUUQYSA-N Arg-Glu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OHYQKYUTLIPFOX-ZPFDUUQYSA-N 0.000 description 4
- OOIMKQRCPJBGPD-XUXIUFHCSA-N Arg-Ile-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O OOIMKQRCPJBGPD-XUXIUFHCSA-N 0.000 description 4
- FAEFJTCTNZTPHX-ACZMJKKPSA-N Asn-Gln-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FAEFJTCTNZTPHX-ACZMJKKPSA-N 0.000 description 4
- QNNBHTFDFFFHGC-KKUMJFAQSA-N Asn-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QNNBHTFDFFFHGC-KKUMJFAQSA-N 0.000 description 4
- SDHFVYLZFBDSQT-DCAQKATOSA-N Asp-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N SDHFVYLZFBDSQT-DCAQKATOSA-N 0.000 description 4
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 4
- 102000014914 Carrier Proteins Human genes 0.000 description 4
- SBDVXRYCOIEYNV-YUMQZZPRSA-N Cys-His-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N SBDVXRYCOIEYNV-YUMQZZPRSA-N 0.000 description 4
- 102000053602 DNA Human genes 0.000 description 4
- XZWYTXMRWQJBGX-VXBMVYAYSA-N FLAG peptide Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(O)=O)CC1=CC=C(O)C=C1 XZWYTXMRWQJBGX-VXBMVYAYSA-N 0.000 description 4
- 102000034615 Glial cell line-derived neurotrophic factor Human genes 0.000 description 4
- 108091010837 Glial cell line-derived neurotrophic factor Proteins 0.000 description 4
- BTSPOOHJBYJRKO-CIUDSAMLSA-N Gln-Asp-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BTSPOOHJBYJRKO-CIUDSAMLSA-N 0.000 description 4
- AJDMYLOISOCHHC-YVNDNENWSA-N Gln-Gln-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AJDMYLOISOCHHC-YVNDNENWSA-N 0.000 description 4
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 4
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 4
- DVLZZEPUNFEUBW-AVGNSLFASA-N Glu-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N DVLZZEPUNFEUBW-AVGNSLFASA-N 0.000 description 4
- BKRQSECBKKCCKW-HVTMNAMFSA-N Glu-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N BKRQSECBKKCCKW-HVTMNAMFSA-N 0.000 description 4
- JPUNZXVHHRZMNL-XIRDDKMYSA-N Glu-Pro-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JPUNZXVHHRZMNL-XIRDDKMYSA-N 0.000 description 4
- NWOSHVVPKDQKKT-RYUDHWBXSA-N Gly-Tyr-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O NWOSHVVPKDQKKT-RYUDHWBXSA-N 0.000 description 4
- KBBFOULZCHWGJX-KBPBESRZSA-N Gly-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)CN)O KBBFOULZCHWGJX-KBPBESRZSA-N 0.000 description 4
- LVWIJITYHRZHBO-IXOXFDKPSA-N His-Leu-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LVWIJITYHRZHBO-IXOXFDKPSA-N 0.000 description 4
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 4
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 4
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 4
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 4
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 4
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 4
- DIBZLYZXTSVGLN-CIUDSAMLSA-N Lys-Ser-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O DIBZLYZXTSVGLN-CIUDSAMLSA-N 0.000 description 4
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 4
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 4
- VHWOBXIWBDWZHK-IHRRRGAJSA-N Phe-Arg-Asp Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 VHWOBXIWBDWZHK-IHRRRGAJSA-N 0.000 description 4
- FXEKNHAJIMHRFJ-ULQDDVLXSA-N Phe-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N FXEKNHAJIMHRFJ-ULQDDVLXSA-N 0.000 description 4
- 108700008625 Reporter Genes Proteins 0.000 description 4
- UGHCUDLCCVVIJR-VGDYDELISA-N Ser-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CO)N UGHCUDLCCVVIJR-VGDYDELISA-N 0.000 description 4
- YUOCMLNTUZAGNF-KLHWPWHYSA-N Thr-His-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N)O YUOCMLNTUZAGNF-KLHWPWHYSA-N 0.000 description 4
- HPQHHRLWSAMMKG-KATARQTJSA-N Thr-Lys-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N)O HPQHHRLWSAMMKG-KATARQTJSA-N 0.000 description 4
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 4
- HDSKHCBAVVWPCQ-FHWLQOOXSA-N Tyr-Glu-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HDSKHCBAVVWPCQ-FHWLQOOXSA-N 0.000 description 4
- FTKXYXACXYOHND-XUXIUFHCSA-N Val-Ile-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O FTKXYXACXYOHND-XUXIUFHCSA-N 0.000 description 4
- ILMVQSHENUZYIZ-JYJNAYRXSA-N Val-Met-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N ILMVQSHENUZYIZ-JYJNAYRXSA-N 0.000 description 4
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 4
- PDDJTOSAVNRJRH-UNQGMJICSA-N Val-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](C(C)C)N)O PDDJTOSAVNRJRH-UNQGMJICSA-N 0.000 description 4
- 230000001594 aberrant effect Effects 0.000 description 4
- 230000003213 activating effect Effects 0.000 description 4
- 108010041407 alanylaspartic acid Proteins 0.000 description 4
- 108010087924 alanylproline Proteins 0.000 description 4
- 230000000692 anti-sense effect Effects 0.000 description 4
- 230000006907 apoptotic process Effects 0.000 description 4
- 108010008355 arginyl-glutamine Proteins 0.000 description 4
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 4
- 108010092854 aspartyllysine Proteins 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 108091008324 binding proteins Proteins 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 108010016616 cysteinylglycine Proteins 0.000 description 4
- 230000002950 deficient Effects 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000011559 double-strand break repair via nonhomologous end joining Effects 0.000 description 4
- 239000003814 drug Substances 0.000 description 4
- 239000003937 drug carrier Substances 0.000 description 4
- 238000009510 drug design Methods 0.000 description 4
- 230000002538 fungal effect Effects 0.000 description 4
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 4
- 108010078144 glutaminyl-glycine Proteins 0.000 description 4
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 4
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 4
- 108010037850 glycylvaline Proteins 0.000 description 4
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 4
- 108010018006 histidylserine Proteins 0.000 description 4
- 230000002779 inactivation Effects 0.000 description 4
- 230000006698 induction Effects 0.000 description 4
- 239000003112 inhibitor Substances 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 4
- 210000004962 mammalian cell Anatomy 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 238000010208 microarray analysis Methods 0.000 description 4
- 239000003607 modifier Substances 0.000 description 4
- 239000000178 monomer Substances 0.000 description 4
- 210000001178 neural stem cell Anatomy 0.000 description 4
- 230000004770 neurodegeneration Effects 0.000 description 4
- 230000030648 nucleus localization Effects 0.000 description 4
- 108010051242 phenylalanylserine Proteins 0.000 description 4
- 229920000642 polymer Polymers 0.000 description 4
- 230000003389 potentiating effect Effects 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 230000014616 translation Effects 0.000 description 4
- 108010073969 valyllysine Proteins 0.000 description 4
- 101150020662 ATP5F1B gene Proteins 0.000 description 3
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 3
- LBYMZCVBOKYZNS-CIUDSAMLSA-N Ala-Leu-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O LBYMZCVBOKYZNS-CIUDSAMLSA-N 0.000 description 3
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 3
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 3
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 3
- AETQNIIFKCMVHP-UVBJJODRSA-N Ala-Trp-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AETQNIIFKCMVHP-UVBJJODRSA-N 0.000 description 3
- CLOMBHBBUKAUBP-LSJOCFKGSA-N Ala-Val-His Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N CLOMBHBBUKAUBP-LSJOCFKGSA-N 0.000 description 3
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 3
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 3
- GNYUVVJYGJFKHN-RVMXOQNASA-N Arg-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GNYUVVJYGJFKHN-RVMXOQNASA-N 0.000 description 3
- SYFHFLGAROUHNT-VEVYYDQMSA-N Arg-Thr-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SYFHFLGAROUHNT-VEVYYDQMSA-N 0.000 description 3
- PJOPLXOCKACMLK-KKUMJFAQSA-N Arg-Tyr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O PJOPLXOCKACMLK-KKUMJFAQSA-N 0.000 description 3
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 3
- HUAOKVVEVHACHR-CIUDSAMLSA-N Asn-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N HUAOKVVEVHACHR-CIUDSAMLSA-N 0.000 description 3
- GQRDIVQPSMPQME-ZPFDUUQYSA-N Asn-Ile-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O GQRDIVQPSMPQME-ZPFDUUQYSA-N 0.000 description 3
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 3
- NCFJQJRLQJEECD-NHCYSSNCSA-N Asn-Leu-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O NCFJQJRLQJEECD-NHCYSSNCSA-N 0.000 description 3
- ILJQISGMGXRZQQ-IHRRRGAJSA-N Asp-Arg-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ILJQISGMGXRZQQ-IHRRRGAJSA-N 0.000 description 3
- WBDWQKRLTVCDSY-WHFBIAKZSA-N Asp-Gly-Asp Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O WBDWQKRLTVCDSY-WHFBIAKZSA-N 0.000 description 3
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 3
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 3
- UXRVDHVARNBOIO-QSFUFRPTSA-N Asp-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC(=O)O)N UXRVDHVARNBOIO-QSFUFRPTSA-N 0.000 description 3
- 241000894006 Bacteria Species 0.000 description 3
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 3
- 101100315624 Caenorhabditis elegans tyr-1 gene Proteins 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- IZUNQDRIAOLWCN-YUMQZZPRSA-N Cys-Leu-Gly Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N IZUNQDRIAOLWCN-YUMQZZPRSA-N 0.000 description 3
- 101710096438 DNA-binding protein Proteins 0.000 description 3
- 241000702421 Dependoparvovirus Species 0.000 description 3
- 101150085975 EIF4A2 gene Proteins 0.000 description 3
- 108090000331 Firefly luciferases Proteins 0.000 description 3
- WUAYFMZULZDSLB-ACZMJKKPSA-N Gln-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O WUAYFMZULZDSLB-ACZMJKKPSA-N 0.000 description 3
- PKVWNYGXMNWJSI-CIUDSAMLSA-N Gln-Gln-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O PKVWNYGXMNWJSI-CIUDSAMLSA-N 0.000 description 3
- MAGNEQBFSBREJL-DCAQKATOSA-N Gln-Glu-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N MAGNEQBFSBREJL-DCAQKATOSA-N 0.000 description 3
- DRDSQGHKTLSNEA-GLLZPBPUSA-N Gln-Glu-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DRDSQGHKTLSNEA-GLLZPBPUSA-N 0.000 description 3
- JEFZIKRIDLHOIF-BYPYZUCNSA-N Gln-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(O)=O JEFZIKRIDLHOIF-BYPYZUCNSA-N 0.000 description 3
- GFLNKSQHOBOMNM-AVGNSLFASA-N Gln-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GFLNKSQHOBOMNM-AVGNSLFASA-N 0.000 description 3
- SBHVGKBYOQKAEA-SDDRHHMPSA-N Gln-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)N)N)C(=O)O SBHVGKBYOQKAEA-SDDRHHMPSA-N 0.000 description 3
- QBLMTCRYYTVUQY-GUBZILKMSA-N Gln-Leu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O QBLMTCRYYTVUQY-GUBZILKMSA-N 0.000 description 3
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 3
- FYBSCGZLICNOBA-XQXXSGGOSA-N Glu-Ala-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FYBSCGZLICNOBA-XQXXSGGOSA-N 0.000 description 3
- ZJICFHQSPWFBKP-AVGNSLFASA-N Glu-Asn-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZJICFHQSPWFBKP-AVGNSLFASA-N 0.000 description 3
- KLJMRPIBBLTDGE-ACZMJKKPSA-N Glu-Cys-Asn Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O KLJMRPIBBLTDGE-ACZMJKKPSA-N 0.000 description 3
- FGSGPLRPQCZBSQ-AVGNSLFASA-N Glu-Phe-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O FGSGPLRPQCZBSQ-AVGNSLFASA-N 0.000 description 3
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 3
- NTNUEBVGKMVANB-NHCYSSNCSA-N Glu-Val-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O NTNUEBVGKMVANB-NHCYSSNCSA-N 0.000 description 3
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 3
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 3
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 3
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 3
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 3
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 3
- FHQRLHFYVZAQHU-IUCAKERBSA-N Gly-Lys-Gln Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O FHQRLHFYVZAQHU-IUCAKERBSA-N 0.000 description 3
- OJNZVYSGVYLQIN-BQBZGAKWSA-N Gly-Met-Asp Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O OJNZVYSGVYLQIN-BQBZGAKWSA-N 0.000 description 3
- WNZOCXUOGVYYBJ-CDMKHQONSA-N Gly-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)CN)O WNZOCXUOGVYYBJ-CDMKHQONSA-N 0.000 description 3
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 3
- 241000238631 Hexapoda Species 0.000 description 3
- IPIVXQQRZXEUGW-UWJYBYFXSA-N His-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IPIVXQQRZXEUGW-UWJYBYFXSA-N 0.000 description 3
- HTZKFIYQMHJWSQ-INTQDDNPSA-N His-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N HTZKFIYQMHJWSQ-INTQDDNPSA-N 0.000 description 3
- ZJSMFRTVYSLKQU-DJFWLOJKSA-N His-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ZJSMFRTVYSLKQU-DJFWLOJKSA-N 0.000 description 3
- SWSVTNGMKBDTBM-DCAQKATOSA-N His-Gln-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SWSVTNGMKBDTBM-DCAQKATOSA-N 0.000 description 3
- HIAHVKLTHNOENC-HGNGGELXSA-N His-Glu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HIAHVKLTHNOENC-HGNGGELXSA-N 0.000 description 3
- BZAQOPHNBFOOJS-DCAQKATOSA-N His-Pro-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O BZAQOPHNBFOOJS-DCAQKATOSA-N 0.000 description 3
- MCGOGXFMKHPMSQ-AVGNSLFASA-N His-Val-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 MCGOGXFMKHPMSQ-AVGNSLFASA-N 0.000 description 3
- 108010033040 Histones Proteins 0.000 description 3
- 102000006947 Histones Human genes 0.000 description 3
- 101001030705 Homo sapiens Huntingtin Proteins 0.000 description 3
- 101000687346 Homo sapiens PR domain zinc finger protein 2 Proteins 0.000 description 3
- RWIKBYVJQAJYDP-BJDJZHNGSA-N Ile-Ala-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RWIKBYVJQAJYDP-BJDJZHNGSA-N 0.000 description 3
- GLYJPWIRLBAIJH-FQUUOJAGSA-N Ile-Lys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N GLYJPWIRLBAIJH-FQUUOJAGSA-N 0.000 description 3
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 3
- AKOYRLRUFBZOSP-BJDJZHNGSA-N Ile-Lys-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)O)N AKOYRLRUFBZOSP-BJDJZHNGSA-N 0.000 description 3
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 3
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 3
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 3
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 3
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 3
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 3
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 3
- 108091036060 Linker DNA Proteins 0.000 description 3
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 3
- QUYCUALODHJQLK-CIUDSAMLSA-N Lys-Asp-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUYCUALODHJQLK-CIUDSAMLSA-N 0.000 description 3
- IBQMEXQYZMVIFU-SRVKXCTJSA-N Lys-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N IBQMEXQYZMVIFU-SRVKXCTJSA-N 0.000 description 3
- GKFNXYMAMKJSKD-NHCYSSNCSA-N Lys-Asp-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GKFNXYMAMKJSKD-NHCYSSNCSA-N 0.000 description 3
- XTONYTDATVADQH-CIUDSAMLSA-N Lys-Cys-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O XTONYTDATVADQH-CIUDSAMLSA-N 0.000 description 3
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 3
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 3
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 3
- XGZDDOKIHSYHTO-SZMVWBNQSA-N Lys-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 XGZDDOKIHSYHTO-SZMVWBNQSA-N 0.000 description 3
- OHXUUQDOBQKSNB-AVGNSLFASA-N Lys-Val-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OHXUUQDOBQKSNB-AVGNSLFASA-N 0.000 description 3
- PNDCUTDWYVKBHX-IHRRRGAJSA-N Met-Asp-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PNDCUTDWYVKBHX-IHRRRGAJSA-N 0.000 description 3
- FZUNSVYYPYJYAP-NAKRPEOUSA-N Met-Ile-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O FZUNSVYYPYJYAP-NAKRPEOUSA-N 0.000 description 3
- WRXOPYNEKGZWAZ-FXQIFTODSA-N Met-Ser-Cys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O WRXOPYNEKGZWAZ-FXQIFTODSA-N 0.000 description 3
- OVTOTTGZBWXLFU-QXEWZRGKSA-N Met-Val-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O OVTOTTGZBWXLFU-QXEWZRGKSA-N 0.000 description 3
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 3
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 3
- 108010079364 N-glycylalanine Proteins 0.000 description 3
- 102000011931 Nucleoproteins Human genes 0.000 description 3
- 108010061100 Nucleoproteins Proteins 0.000 description 3
- 108010047956 Nucleosomes Proteins 0.000 description 3
- 102100024885 PR domain zinc finger protein 2 Human genes 0.000 description 3
- JSGWNFKWZNPDAV-YDHLFZDLSA-N Phe-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JSGWNFKWZNPDAV-YDHLFZDLSA-N 0.000 description 3
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 3
- RUDOLGWDSKQQFF-DCAQKATOSA-N Pro-Leu-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O RUDOLGWDSKQQFF-DCAQKATOSA-N 0.000 description 3
- CGSOWZUPLOKYOR-AVGNSLFASA-N Pro-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 CGSOWZUPLOKYOR-AVGNSLFASA-N 0.000 description 3
- 102100038931 Proenkephalin-A Human genes 0.000 description 3
- 102000001253 Protein Kinase Human genes 0.000 description 3
- 108010052090 Renilla Luciferases Proteins 0.000 description 3
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 3
- ULVMNZOKDBHKKI-ACZMJKKPSA-N Ser-Gln-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ULVMNZOKDBHKKI-ACZMJKKPSA-N 0.000 description 3
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 3
- BDMWLJLPPUCLNV-XGEHTFHBSA-N Ser-Thr-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BDMWLJLPPUCLNV-XGEHTFHBSA-N 0.000 description 3
- 108091027967 Small hairpin RNA Proteins 0.000 description 3
- 241000256248 Spodoptera Species 0.000 description 3
- 210000001744 T-lymphocyte Anatomy 0.000 description 3
- SLUWOCTZVGMURC-BFHQHQDPSA-N Thr-Gly-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O SLUWOCTZVGMURC-BFHQHQDPSA-N 0.000 description 3
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 3
- BCYUHPXBHCUYBA-CUJWVEQBSA-N Thr-Ser-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O BCYUHPXBHCUYBA-CUJWVEQBSA-N 0.000 description 3
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 3
- 108091028113 Trans-activating crRNA Proteins 0.000 description 3
- UJGDFQRPYGJBEH-AAEUAGOBSA-N Trp-Ser-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N UJGDFQRPYGJBEH-AAEUAGOBSA-N 0.000 description 3
- NGALWFGCOMHUSN-AVGNSLFASA-N Tyr-Gln-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NGALWFGCOMHUSN-AVGNSLFASA-N 0.000 description 3
- 101150109071 UBC gene Proteins 0.000 description 3
- IZFVRRYRMQFVGX-NRPADANISA-N Val-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N IZFVRRYRMQFVGX-NRPADANISA-N 0.000 description 3
- COSLEEOIYRPTHD-YDHLFZDLSA-N Val-Asp-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 COSLEEOIYRPTHD-YDHLFZDLSA-N 0.000 description 3
- GMOLURHJBLOBFW-ONGXEEELSA-N Val-Gly-His Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N GMOLURHJBLOBFW-ONGXEEELSA-N 0.000 description 3
- MANXHLOVEUHVFD-DCAQKATOSA-N Val-His-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CS)C(=O)O)N MANXHLOVEUHVFD-DCAQKATOSA-N 0.000 description 3
- HLBHFAWNMAQGNO-AVGNSLFASA-N Val-His-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCSC)C(=O)O)N HLBHFAWNMAQGNO-AVGNSLFASA-N 0.000 description 3
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 3
- MJOUSKQHAIARKI-JYJNAYRXSA-N Val-Phe-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 MJOUSKQHAIARKI-JYJNAYRXSA-N 0.000 description 3
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 3
- 102100021112 Zinc finger protein 10 Human genes 0.000 description 3
- HMNZFMSWFCAGGW-XPWSMXQVSA-N [3-[hydroxy(2-hydroxyethoxy)phosphoryl]oxy-2-[(e)-octadec-9-enoyl]oxypropyl] (e)-octadec-9-enoate Chemical compound CCCCCCCC\C=C\CCCCCCCC(=O)OCC(COP(O)(=O)OCCO)OC(=O)CCCCCCC\C=C\CCCCCCCC HMNZFMSWFCAGGW-XPWSMXQVSA-N 0.000 description 3
- 210000004102 animal cell Anatomy 0.000 description 3
- 238000000137 annealing Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 3
- 108010060035 arginylproline Proteins 0.000 description 3
- 108010093581 aspartyl-proline Proteins 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 239000011230 binding agent Substances 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 230000007850 degeneration Effects 0.000 description 3
- PXBRQCKWGAHEHS-UHFFFAOYSA-N dichlorodifluoromethane Chemical compound FC(F)(Cl)Cl PXBRQCKWGAHEHS-UHFFFAOYSA-N 0.000 description 3
- 230000004069 differentiation Effects 0.000 description 3
- 239000000539 dimer Substances 0.000 description 3
- 229960003638 dopamine Drugs 0.000 description 3
- 238000004520 electroporation Methods 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 238000010195 expression analysis Methods 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 238000012239 gene modification Methods 0.000 description 3
- 230000005017 genetic modification Effects 0.000 description 3
- 235000013617 genetically modified food Nutrition 0.000 description 3
- 108010049041 glutamylalanine Proteins 0.000 description 3
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 3
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 3
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 3
- 108010033719 glycyl-histidyl-glycine Proteins 0.000 description 3
- 108010020688 glycylhistidine Proteins 0.000 description 3
- 108010040030 histidinoalanine Proteins 0.000 description 3
- 102000054185 human HTT Human genes 0.000 description 3
- 210000005260 human cell Anatomy 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- 238000001990 intravenous administration Methods 0.000 description 3
- 150000002500 ions Chemical class 0.000 description 3
- 108010078274 isoleucylvaline Proteins 0.000 description 3
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 3
- 108010057821 leucylproline Proteins 0.000 description 3
- 238000011068 loading method Methods 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 210000002901 mesenchymal stem cell Anatomy 0.000 description 3
- 108010068488 methionylphenylalanine Proteins 0.000 description 3
- 210000001623 nucleosome Anatomy 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 238000002823 phage display Methods 0.000 description 3
- 108010040003 polyglutamine Proteins 0.000 description 3
- 230000002265 prevention Effects 0.000 description 3
- 108010041071 proenkephalin Proteins 0.000 description 3
- 108010070643 prolylglutamic acid Proteins 0.000 description 3
- 230000006916 protein interaction Effects 0.000 description 3
- 108060006633 protein kinase Proteins 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000003757 reverse transcription PCR Methods 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 108010026333 seryl-proline Proteins 0.000 description 3
- 230000011664 signaling Effects 0.000 description 3
- 239000004055 small Interfering RNA Substances 0.000 description 3
- 238000011895 specific detection Methods 0.000 description 3
- 208000024891 symptom Diseases 0.000 description 3
- 231100000419 toxicity Toxicity 0.000 description 3
- 230000001988 toxicity Effects 0.000 description 3
- 230000002463 transducing effect Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 108010051110 tyrosyl-lysine Proteins 0.000 description 3
- 241001430294 unidentified retrovirus Species 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 239000003981 vehicle Substances 0.000 description 3
- OGNSCSPNOLGXSM-UHFFFAOYSA-N (+/-)-DABA Natural products NCCC(N)C(O)=O OGNSCSPNOLGXSM-UHFFFAOYSA-N 0.000 description 2
- QDZOEBFLNHCSSF-PFFBOGFISA-N (2S)-2-[[(2R)-2-[[(2S)-1-[(2S)-6-amino-2-[[(2S)-1-[(2R)-2-amino-5-carbamimidamidopentanoyl]pyrrolidine-2-carbonyl]amino]hexanoyl]pyrrolidine-2-carbonyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-N-[(2R)-1-[[(2S)-1-[[(2R)-1-[[(2S)-1-[[(2S)-1-amino-4-methyl-1-oxopentan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]amino]-3-(1H-indol-3-yl)-1-oxopropan-2-yl]amino]-1-oxo-3-phenylpropan-2-yl]amino]-3-(1H-indol-3-yl)-1-oxopropan-2-yl]pentanediamide Chemical compound C([C@@H](C(=O)N[C@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(N)=O)NC(=O)[C@@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](N)CCCNC(N)=N)C1=CC=CC=C1 QDZOEBFLNHCSSF-PFFBOGFISA-N 0.000 description 2
- 102100022900 Actin, cytoplasmic 1 Human genes 0.000 description 2
- 102000007469 Actins Human genes 0.000 description 2
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 2
- LZRNYBIJOSKKRJ-XVYDVKMFSA-N Ala-Asp-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LZRNYBIJOSKKRJ-XVYDVKMFSA-N 0.000 description 2
- IFTVANMRTIHKML-WDSKDSINSA-N Ala-Gln-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O IFTVANMRTIHKML-WDSKDSINSA-N 0.000 description 2
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 2
- CBCCCLMNOBLBSC-XVYDVKMFSA-N Ala-His-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CBCCCLMNOBLBSC-XVYDVKMFSA-N 0.000 description 2
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 2
- XRUJOVRWNMBAAA-NHCYSSNCSA-N Ala-Phe-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 XRUJOVRWNMBAAA-NHCYSSNCSA-N 0.000 description 2
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 2
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 2
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- 101001030716 Arabidopsis thaliana Histone deacetylase HDT1 Proteins 0.000 description 2
- 241000203069 Archaea Species 0.000 description 2
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 2
- JTKLCCFLSLCCST-SZMVWBNQSA-N Arg-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(O)=O)=CNC2=C1 JTKLCCFLSLCCST-SZMVWBNQSA-N 0.000 description 2
- WESHVRNMNFMVBE-FXQIFTODSA-N Arg-Asn-Asp Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)CN=C(N)N WESHVRNMNFMVBE-FXQIFTODSA-N 0.000 description 2
- MSILNNHVVMMTHZ-UWVGGRQHSA-N Arg-His-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CN=CN1 MSILNNHVVMMTHZ-UWVGGRQHSA-N 0.000 description 2
- INOIAEUXVVNJKA-XGEHTFHBSA-N Arg-Thr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O INOIAEUXVVNJKA-XGEHTFHBSA-N 0.000 description 2
- 102000008682 Argonaute Proteins Human genes 0.000 description 2
- 108010088141 Argonaute Proteins Proteins 0.000 description 2
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 2
- OERMIMJQPQUIPK-FXQIFTODSA-N Asp-Arg-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O OERMIMJQPQUIPK-FXQIFTODSA-N 0.000 description 2
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 2
- NAPNAGZWHQHZLG-ZLUOBGJFSA-N Asp-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)O)N NAPNAGZWHQHZLG-ZLUOBGJFSA-N 0.000 description 2
- PXLNPFOJZQMXAT-BYULHYEWSA-N Asp-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O PXLNPFOJZQMXAT-BYULHYEWSA-N 0.000 description 2
- RSMIHCFQDCVVBR-CIUDSAMLSA-N Asp-Gln-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N RSMIHCFQDCVVBR-CIUDSAMLSA-N 0.000 description 2
- WQSXAPPYLGNMQL-IHRRRGAJSA-N Asp-Met-Tyr Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N WQSXAPPYLGNMQL-IHRRRGAJSA-N 0.000 description 2
- XUVTWGPERWIERB-IHRRRGAJSA-N Asp-Pro-Phe Chemical compound N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O XUVTWGPERWIERB-IHRRRGAJSA-N 0.000 description 2
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 2
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 2
- 102000007370 Ataxin2 Human genes 0.000 description 2
- 108010032951 Ataxin2 Proteins 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 102100024318 Calcium/calmodulin-dependent 3',5'-cyclic nucleotide phosphodiesterase 1B Human genes 0.000 description 2
- 102000004018 Caspase 6 Human genes 0.000 description 2
- 108090000425 Caspase 6 Proteins 0.000 description 2
- 102000008169 Co-Repressor Proteins Human genes 0.000 description 2
- 108010060434 Co-Repressor Proteins Proteins 0.000 description 2
- 102000008130 Cyclic AMP-Dependent Protein Kinases Human genes 0.000 description 2
- UPURLDIGQGTUPJ-ZKWXMUAHSA-N Cys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N UPURLDIGQGTUPJ-ZKWXMUAHSA-N 0.000 description 2
- WAJDEKCJRKGRPG-CIUDSAMLSA-N Cys-His-Ser Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N WAJDEKCJRKGRPG-CIUDSAMLSA-N 0.000 description 2
- UOEYKPDDHSFMLI-DCAQKATOSA-N Cys-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CS)N UOEYKPDDHSFMLI-DCAQKATOSA-N 0.000 description 2
- 102100036279 DNA (cytosine-5)-methyltransferase 1 Human genes 0.000 description 2
- 238000007399 DNA isolation Methods 0.000 description 2
- 102000015554 Dopamine receptor Human genes 0.000 description 2
- 108050004812 Dopamine receptor Proteins 0.000 description 2
- 241000255581 Drosophila <fruit fly, genus> Species 0.000 description 2
- 102100038132 Endogenous retrovirus group K member 6 Pro protein Human genes 0.000 description 2
- 108010092674 Enkephalins Proteins 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- 102100036763 Extended synaptotagmin-1 Human genes 0.000 description 2
- NUMFTVCBONFQIQ-DRZSPHRISA-N Gln-Ala-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NUMFTVCBONFQIQ-DRZSPHRISA-N 0.000 description 2
- YNNXQZDEOCYJJL-CIUDSAMLSA-N Gln-Arg-Asp Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)CN=C(N)N YNNXQZDEOCYJJL-CIUDSAMLSA-N 0.000 description 2
- INFBPLSHYFALDE-ACZMJKKPSA-N Gln-Asn-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O INFBPLSHYFALDE-ACZMJKKPSA-N 0.000 description 2
- RBWKVOSARCFSQQ-FXQIFTODSA-N Gln-Gln-Ser Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O RBWKVOSARCFSQQ-FXQIFTODSA-N 0.000 description 2
- SMLDOQHTOAAFJQ-WDSKDSINSA-N Gln-Gly-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SMLDOQHTOAAFJQ-WDSKDSINSA-N 0.000 description 2
- ORYMMTRPKVTGSJ-XVKPBYJWSA-N Gln-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O ORYMMTRPKVTGSJ-XVKPBYJWSA-N 0.000 description 2
- JNEITCMDYWKPIW-GUBZILKMSA-N Gln-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JNEITCMDYWKPIW-GUBZILKMSA-N 0.000 description 2
- TWIAMTNJOMRDAK-GUBZILKMSA-N Gln-Lys-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O TWIAMTNJOMRDAK-GUBZILKMSA-N 0.000 description 2
- FHPXTPQBODWBIY-CIUDSAMLSA-N Glu-Ala-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHPXTPQBODWBIY-CIUDSAMLSA-N 0.000 description 2
- DIXKFOPPGWKZLY-CIUDSAMLSA-N Glu-Arg-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O DIXKFOPPGWKZLY-CIUDSAMLSA-N 0.000 description 2
- KUTPGXNAAOQSPD-LPEHRKFASA-N Glu-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O KUTPGXNAAOQSPD-LPEHRKFASA-N 0.000 description 2
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 2
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 2
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 2
- OMOZPGCHVWOXHN-BQBZGAKWSA-N Gly-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)CN OMOZPGCHVWOXHN-BQBZGAKWSA-N 0.000 description 2
- FXLVSYVJDPCIHH-STQMWFEESA-N Gly-Phe-Arg Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FXLVSYVJDPCIHH-STQMWFEESA-N 0.000 description 2
- IRJWAYCXIYUHQE-WHFBIAKZSA-N Gly-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)CN IRJWAYCXIYUHQE-WHFBIAKZSA-N 0.000 description 2
- XHVONGZZVUUORG-WEDXCCLWSA-N Gly-Thr-Lys Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCCN XHVONGZZVUUORG-WEDXCCLWSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 102100031573 Hematopoietic progenitor cell antigen CD34 Human genes 0.000 description 2
- MWAJSVTZZOUOBU-IHRRRGAJSA-N His-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CN=CN1 MWAJSVTZZOUOBU-IHRRRGAJSA-N 0.000 description 2
- AKEDPWJFQULLPE-IUCAKERBSA-N His-Glu-Gly Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O AKEDPWJFQULLPE-IUCAKERBSA-N 0.000 description 2
- UVDDTHLDZBMBAV-SRVKXCTJSA-N His-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CS)C(=O)O)N UVDDTHLDZBMBAV-SRVKXCTJSA-N 0.000 description 2
- YXASFUBDSDAXQD-UWVGGRQHSA-N His-Met-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O YXASFUBDSDAXQD-UWVGGRQHSA-N 0.000 description 2
- FJCGVRRVBKYYOU-DCAQKATOSA-N His-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N FJCGVRRVBKYYOU-DCAQKATOSA-N 0.000 description 2
- ZVKDCQVQTGYBQT-LSJOCFKGSA-N His-Pro-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O ZVKDCQVQTGYBQT-LSJOCFKGSA-N 0.000 description 2
- WKEABZIITNXXQZ-CIUDSAMLSA-N His-Ser-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N WKEABZIITNXXQZ-CIUDSAMLSA-N 0.000 description 2
- 101000851525 Homo sapiens Extended synaptotagmin-1 Proteins 0.000 description 2
- 101000777663 Homo sapiens Hematopoietic progenitor cell antigen CD34 Proteins 0.000 description 2
- 241000725303 Human immunodeficiency virus Species 0.000 description 2
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 2
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 2
- WIYDLTIBHZSPKY-HJWJTTGWSA-N Ile-Val-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WIYDLTIBHZSPKY-HJWJTTGWSA-N 0.000 description 2
- 108010065920 Insulin Lispro Proteins 0.000 description 2
- 102000004554 Interleukin-17 Receptors Human genes 0.000 description 2
- 108010017525 Interleukin-17 Receptors Proteins 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- 241000254158 Lampyridae Species 0.000 description 2
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 2
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 2
- JNDYEOUZBLOVOF-AVGNSLFASA-N Leu-Leu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JNDYEOUZBLOVOF-AVGNSLFASA-N 0.000 description 2
- GCXGCIYIHXSKAY-ULQDDVLXSA-N Leu-Phe-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GCXGCIYIHXSKAY-ULQDDVLXSA-N 0.000 description 2
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 2
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 2
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 2
- URLZCHNOLZSCCA-VABKMULXSA-N Leu-enkephalin Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CNC(=O)CNC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=CC=C1 URLZCHNOLZSCCA-VABKMULXSA-N 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- FUKDBQGFSJUXGX-RWMBFGLXSA-N Lys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)C(=O)O FUKDBQGFSJUXGX-RWMBFGLXSA-N 0.000 description 2
- HKCCVDWHHTVVPN-CIUDSAMLSA-N Lys-Asp-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O HKCCVDWHHTVVPN-CIUDSAMLSA-N 0.000 description 2
- NNKLKUUGESXCBS-KBPBESRZSA-N Lys-Gly-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NNKLKUUGESXCBS-KBPBESRZSA-N 0.000 description 2
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 2
- YTJFXEDRUOQGSP-DCAQKATOSA-N Lys-Pro-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O YTJFXEDRUOQGSP-DCAQKATOSA-N 0.000 description 2
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 2
- UZVWDRPUTHXQAM-FXQIFTODSA-N Met-Asp-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O UZVWDRPUTHXQAM-FXQIFTODSA-N 0.000 description 2
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 2
- 108700011259 MicroRNAs Proteins 0.000 description 2
- 101100338539 Mus musculus Htt gene Proteins 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- 108091061960 Naked DNA Proteins 0.000 description 2
- 108700019961 Neoplasm Genes Proteins 0.000 description 2
- 102000048850 Neoplasm Genes Human genes 0.000 description 2
- 241000283973 Oryctolagus cuniculus Species 0.000 description 2
- LSXGADJXBDFXQU-DLOVCJGASA-N Phe-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 LSXGADJXBDFXQU-DLOVCJGASA-N 0.000 description 2
- LWPMGKSZPKFKJD-DZKIICNBSA-N Phe-Glu-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O LWPMGKSZPKFKJD-DZKIICNBSA-N 0.000 description 2
- OQTDZEJJWWAGJT-KKUMJFAQSA-N Phe-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O OQTDZEJJWWAGJT-KKUMJFAQSA-N 0.000 description 2
- ROOQMPCUFLDOSB-FHWLQOOXSA-N Phe-Phe-Gln Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C1=CC=CC=C1 ROOQMPCUFLDOSB-FHWLQOOXSA-N 0.000 description 2
- CVAUVSOFHJKCHN-BZSNNMDCSA-N Phe-Tyr-Cys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CS)C(O)=O)C1=CC=CC=C1 CVAUVSOFHJKCHN-BZSNNMDCSA-N 0.000 description 2
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 2
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 2
- 241000288906 Primates Species 0.000 description 2
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 2
- RMJZWERKFFNNNS-XGEHTFHBSA-N Pro-Thr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O RMJZWERKFFNNNS-XGEHTFHBSA-N 0.000 description 2
- ATUOYWHBWRKTHZ-UHFFFAOYSA-N Propane Chemical compound CCC ATUOYWHBWRKTHZ-UHFFFAOYSA-N 0.000 description 2
- 108010079005 RDV peptide Proteins 0.000 description 2
- 108010003201 RGH 0205 Proteins 0.000 description 2
- 241000589771 Ralstonia solanacearum Species 0.000 description 2
- 101100087805 Ralstonia solanacearum rip19 gene Proteins 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- 241000242739 Renilla Species 0.000 description 2
- 108010034634 Repressor Proteins Proteins 0.000 description 2
- 241000283984 Rodentia Species 0.000 description 2
- 241000235070 Saccharomyces Species 0.000 description 2
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 2
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 2
- OYEDZGNMSBZCIM-XGEHTFHBSA-N Ser-Arg-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OYEDZGNMSBZCIM-XGEHTFHBSA-N 0.000 description 2
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 2
- RNMRYWZYFHHOEV-CIUDSAMLSA-N Ser-Gln-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RNMRYWZYFHHOEV-CIUDSAMLSA-N 0.000 description 2
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 2
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 2
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 2
- WMZVVNLPHFSUPA-BPUTZDHNSA-N Ser-Trp-Arg Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 WMZVVNLPHFSUPA-BPUTZDHNSA-N 0.000 description 2
- UKKROEYWYIHWBD-ZKWXMUAHSA-N Ser-Val-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UKKROEYWYIHWBD-ZKWXMUAHSA-N 0.000 description 2
- 241000713311 Simian immunodeficiency virus Species 0.000 description 2
- 102400000096 Substance P Human genes 0.000 description 2
- 101800003906 Substance P Proteins 0.000 description 2
- XXNLGZRRSKPSGF-HTUGSXCWSA-N Thr-Gln-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O XXNLGZRRSKPSGF-HTUGSXCWSA-N 0.000 description 2
- KGKWKSSSQGGYAU-SUSMZKCASA-N Thr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KGKWKSSSQGGYAU-SUSMZKCASA-N 0.000 description 2
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 2
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 2
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 2
- 101710183280 Topoisomerase Proteins 0.000 description 2
- 229920004890 Triton X-100 Polymers 0.000 description 2
- 239000013504 Triton X-100 Substances 0.000 description 2
- IBBBOLAPFHRDHW-BPUTZDHNSA-N Trp-Asn-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N IBBBOLAPFHRDHW-BPUTZDHNSA-N 0.000 description 2
- GKUROEIXVURAAO-BPUTZDHNSA-N Trp-Asp-Arg Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GKUROEIXVURAAO-BPUTZDHNSA-N 0.000 description 2
- YXONONCLMLHWJX-SZMVWBNQSA-N Trp-Glu-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 YXONONCLMLHWJX-SZMVWBNQSA-N 0.000 description 2
- WMBFONUKQXGLMU-WDSOQIARSA-N Trp-Leu-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N WMBFONUKQXGLMU-WDSOQIARSA-N 0.000 description 2
- TVOGEPLDNYTAHD-CQDKDKBSSA-N Tyr-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TVOGEPLDNYTAHD-CQDKDKBSSA-N 0.000 description 2
- AKFLVKKWVZMFOT-IHRRRGAJSA-N Tyr-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AKFLVKKWVZMFOT-IHRRRGAJSA-N 0.000 description 2
- YLHFIMLKNPJRGY-BVSLBCMMSA-N Tyr-Arg-Trp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O YLHFIMLKNPJRGY-BVSLBCMMSA-N 0.000 description 2
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 2
- UBTBGUDNDFZLGP-SRVKXCTJSA-N Val-Arg-Val Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C(C)C)C(=O)O)N UBTBGUDNDFZLGP-SRVKXCTJSA-N 0.000 description 2
- RQOMPQGUGBILAG-AVGNSLFASA-N Val-Met-Leu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O RQOMPQGUGBILAG-AVGNSLFASA-N 0.000 description 2
- RSGHLMMKXJGCMK-JYJNAYRXSA-N Val-Met-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N RSGHLMMKXJGCMK-JYJNAYRXSA-N 0.000 description 2
- HJSLDXZAZGFPDK-ULQDDVLXSA-N Val-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N HJSLDXZAZGFPDK-ULQDDVLXSA-N 0.000 description 2
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 108010076089 accutase Proteins 0.000 description 2
- 239000012345 acetylating agent Substances 0.000 description 2
- 239000000443 aerosol Substances 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 2
- 108010062796 arginyllysine Proteins 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 230000002715 bioenergetic effect Effects 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 2
- 210000001638 cerebellum Anatomy 0.000 description 2
- 239000003153 chemical reaction reagent Substances 0.000 description 2
- 210000003763 chloroplast Anatomy 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 235000017471 coenzyme Q10 Nutrition 0.000 description 2
- ACTIUHUUMQJHFO-UPTCCGCDSA-N coenzyme Q10 Chemical compound COC1=C(OC)C(=O)C(C\C=C(/C)CC\C=C(/C)CC\C=C(/C)CC\C=C(/C)CC\C=C(/C)CC\C=C(/C)CC\C=C(/C)CC\C=C(/C)CC\C=C(/C)CCC=C(C)C)=C(C)C1=O ACTIUHUUMQJHFO-UPTCCGCDSA-N 0.000 description 2
- 230000002860 competitive effect Effects 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000000850 deacetylating effect Effects 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 239000003085 diluting agent Substances 0.000 description 2
- 230000008482 dysregulation Effects 0.000 description 2
- 239000012636 effector Substances 0.000 description 2
- 238000012407 engineering method Methods 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 230000007071 enzymatic hydrolysis Effects 0.000 description 2
- 238000006047 enzymatic hydrolysis reaction Methods 0.000 description 2
- 239000006277 exogenous ligand Substances 0.000 description 2
- 239000013613 expression plasmid Substances 0.000 description 2
- 239000012091 fetal bovine serum Substances 0.000 description 2
- 108091006047 fluorescent proteins Proteins 0.000 description 2
- 102000034287 fluorescent proteins Human genes 0.000 description 2
- 230000037433 frameshift Effects 0.000 description 2
- 229960003692 gamma aminobutyric acid Drugs 0.000 description 2
- 210000001905 globus pallidus Anatomy 0.000 description 2
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 2
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 2
- 108010082286 glycyl-seryl-alanine Proteins 0.000 description 2
- 239000000833 heterodimer Substances 0.000 description 2
- 108010050343 histidyl-alanyl-glutamine Proteins 0.000 description 2
- 210000002865 immune cell Anatomy 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 230000002458 infectious effect Effects 0.000 description 2
- 238000001802 infusion Methods 0.000 description 2
- 239000012212 insulator Substances 0.000 description 2
- 238000007918 intramuscular administration Methods 0.000 description 2
- 208000032839 leukemia Diseases 0.000 description 2
- 238000001638 lipofection Methods 0.000 description 2
- 229920002521 macromolecule Polymers 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000011987 methylation Effects 0.000 description 2
- 238000007069 methylation reaction Methods 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 230000002438 mitochondrial effect Effects 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 230000003955 neuronal function Effects 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000007918 pathogenicity Effects 0.000 description 2
- WEXRUCMBJFQVBZ-UHFFFAOYSA-N pentobarbital Chemical compound CCCC(C)C1(CC)C(=O)NC(=O)NC1=O WEXRUCMBJFQVBZ-UHFFFAOYSA-N 0.000 description 2
- 108010082795 phenylalanyl-arginyl-arginine Proteins 0.000 description 2
- 108010073101 phenylalanylleucine Proteins 0.000 description 2
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 108010000222 polyserine Proteins 0.000 description 2
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 2
- 210000001236 prokaryotic cell Anatomy 0.000 description 2
- 230000002035 prolonged effect Effects 0.000 description 2
- 230000004845 protein aggregation Effects 0.000 description 2
- 102000021127 protein binding proteins Human genes 0.000 description 2
- 108091011138 protein binding proteins Proteins 0.000 description 2
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 2
- 230000000754 repressing effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000010187 selection method Methods 0.000 description 2
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 2
- 230000035939 shock Effects 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 230000009870 specific binding Effects 0.000 description 2
- 238000010186 staining Methods 0.000 description 2
- 238000007920 subcutaneous administration Methods 0.000 description 2
- 210000003523 substantia nigra Anatomy 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 229940124597 therapeutic agent Drugs 0.000 description 2
- 230000000699 topical effect Effects 0.000 description 2
- 231100000331 toxic Toxicity 0.000 description 2
- 230000002588 toxic effect Effects 0.000 description 2
- 230000009261 transgenic effect Effects 0.000 description 2
- 238000011830 transgenic mouse model Methods 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- 238000010396 two-hybrid screening Methods 0.000 description 2
- 210000001364 upper extremity Anatomy 0.000 description 2
- OPCHFPHZPIURNA-MFERNQICSA-N (2s)-2,5-bis(3-aminopropylamino)-n-[2-(dioctadecylamino)acetyl]pentanamide Chemical compound CCCCCCCCCCCCCCCCCCN(CC(=O)NC(=O)[C@H](CCCNCCCN)NCCCN)CCCCCCCCCCCCCCCCCC OPCHFPHZPIURNA-MFERNQICSA-N 0.000 description 1
- MZOFCQQQCNRIBI-VMXHOPILSA-N (3s)-4-[[(2s)-1-[[(2s)-1-[[(1s)-1-carboxy-2-hydroxyethyl]amino]-4-methyl-1-oxopentan-2-yl]amino]-5-(diaminomethylideneamino)-1-oxopentan-2-yl]amino]-3-[[2-[[(2s)-2,6-diaminohexanoyl]amino]acetyl]amino]-4-oxobutanoic acid Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN MZOFCQQQCNRIBI-VMXHOPILSA-N 0.000 description 1
- KIAPWMKFHIKQOZ-UHFFFAOYSA-N 2-[[(4-fluorophenyl)-oxomethyl]amino]benzoic acid methyl ester Chemical group COC(=O)C1=CC=CC=C1NC(=O)C1=CC=C(F)C=C1 KIAPWMKFHIKQOZ-UHFFFAOYSA-N 0.000 description 1
- OZRFYUJEXYKQDV-UHFFFAOYSA-N 2-[[2-[[2-[(2-amino-3-carboxypropanoyl)amino]-3-carboxypropanoyl]amino]-3-carboxypropanoyl]amino]butanedioic acid Chemical compound OC(=O)CC(N)C(=O)NC(CC(O)=O)C(=O)NC(CC(O)=O)C(=O)NC(CC(O)=O)C(O)=O OZRFYUJEXYKQDV-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- YSGASDXSLKIKOD-UHFFFAOYSA-N 2-amino-N-(1,2-diphenylpropan-2-yl)acetamide Chemical compound C=1C=CC=CC=1C(C)(NC(=O)CN)CC1=CC=CC=C1 YSGASDXSLKIKOD-UHFFFAOYSA-N 0.000 description 1
- FWBHETKCLVMNFS-UHFFFAOYSA-N 4',6-Diamino-2-phenylindol Chemical compound C1=CC(C(=N)N)=CC=C1C1=CC2=CC=C(C(N)=N)C=C2N1 FWBHETKCLVMNFS-UHFFFAOYSA-N 0.000 description 1
- XAEJIFARBQJLML-UHFFFAOYSA-N 4-[2-(2-cyclopentylidenehydrazinyl)-1,3-thiazol-4-yl]benzonitrile Chemical compound C1=CC(C#N)=CC=C1C1=CSC(NN=C2CCCC2)=N1 XAEJIFARBQJLML-UHFFFAOYSA-N 0.000 description 1
- 102100033051 40S ribosomal protein S19 Human genes 0.000 description 1
- WBSCNDJQPKSPII-UHFFFAOYSA-N 6-amino-2-[[6-amino-2-(2,6-diaminohexanoylamino)hexanoyl]amino]hexanoic acid Chemical compound NCCCCC(N)C(=O)NC(CCCCN)C(=O)NC(CCCCN)C(O)=O WBSCNDJQPKSPII-UHFFFAOYSA-N 0.000 description 1
- 230000005730 ADP ribosylation Effects 0.000 description 1
- 101710159080 Aconitate hydratase A Proteins 0.000 description 1
- 101710159078 Aconitate hydratase B Proteins 0.000 description 1
- 241001655883 Adeno-associated virus - 1 Species 0.000 description 1
- 241000202702 Adeno-associated virus - 3 Species 0.000 description 1
- 241000580270 Adeno-associated virus - 4 Species 0.000 description 1
- 241001634120 Adeno-associated virus - 5 Species 0.000 description 1
- YHOPXCAOTRUGLV-XAMCCFCMSA-N Ala-Ala-Asp-Asp Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O YHOPXCAOTRUGLV-XAMCCFCMSA-N 0.000 description 1
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 1
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 1
- GSCLWXDNIMNIJE-ZLUOBGJFSA-N Ala-Asp-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O GSCLWXDNIMNIJE-ZLUOBGJFSA-N 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- CNQAFFMNJIQYGX-DRZSPHRISA-N Ala-Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 CNQAFFMNJIQYGX-DRZSPHRISA-N 0.000 description 1
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 1
- YXXPVUOMPSZURS-ZLIFDBKOSA-N Ala-Trp-Leu Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@H](C)N)=CNC2=C1 YXXPVUOMPSZURS-ZLIFDBKOSA-N 0.000 description 1
- IGAZHQIYONOHQN-UHFFFAOYSA-N Alexa Fluor 555 Chemical compound C=12C=CC(=N)C(S(O)(=O)=O)=C2OC2=C(S(O)(=O)=O)C(N)=CC=C2C=1C1=CC=C(C(O)=O)C=C1C(O)=O IGAZHQIYONOHQN-UHFFFAOYSA-N 0.000 description 1
- 244000099147 Ananas comosus Species 0.000 description 1
- 235000007119 Ananas comosus Nutrition 0.000 description 1
- 108020004491 Antisense DNA Proteins 0.000 description 1
- 108020005544 Antisense RNA Proteins 0.000 description 1
- QEKBCDODJBBWHV-GUBZILKMSA-N Arg-Arg-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O QEKBCDODJBBWHV-GUBZILKMSA-N 0.000 description 1
- KJGNDQCYBNBXDA-GUBZILKMSA-N Arg-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N)CN=C(N)N KJGNDQCYBNBXDA-GUBZILKMSA-N 0.000 description 1
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 1
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 1
- DCGLNNVKIZXQOJ-FXQIFTODSA-N Arg-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DCGLNNVKIZXQOJ-FXQIFTODSA-N 0.000 description 1
- YSUVMPICYVWRBX-VEVYYDQMSA-N Arg-Asp-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YSUVMPICYVWRBX-VEVYYDQMSA-N 0.000 description 1
- ASQYTJJWAMDISW-BPUTZDHNSA-N Arg-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N ASQYTJJWAMDISW-BPUTZDHNSA-N 0.000 description 1
- VXXHDZKEQNGXNU-QXEWZRGKSA-N Arg-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N VXXHDZKEQNGXNU-QXEWZRGKSA-N 0.000 description 1
- BQBPFMNVOWDLHO-XIRDDKMYSA-N Arg-Gln-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N BQBPFMNVOWDLHO-XIRDDKMYSA-N 0.000 description 1
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 1
- YBIAYFFIVAZXPK-AVGNSLFASA-N Arg-His-Arg Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YBIAYFFIVAZXPK-AVGNSLFASA-N 0.000 description 1
- LVMUGODRNHFGRA-AVGNSLFASA-N Arg-Leu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O LVMUGODRNHFGRA-AVGNSLFASA-N 0.000 description 1
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 1
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 1
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 1
- BWMMKQPATDUYKB-IHRRRGAJSA-N Arg-Tyr-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=C(O)C=C1 BWMMKQPATDUYKB-IHRRRGAJSA-N 0.000 description 1
- HOIFSHOLNKQCSA-FXQIFTODSA-N Asn-Arg-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O HOIFSHOLNKQCSA-FXQIFTODSA-N 0.000 description 1
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 1
- DQTIWTULBGLJBL-DCAQKATOSA-N Asn-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N DQTIWTULBGLJBL-DCAQKATOSA-N 0.000 description 1
- GOVUDFOGXOONFT-VEVYYDQMSA-N Asn-Arg-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GOVUDFOGXOONFT-VEVYYDQMSA-N 0.000 description 1
- JEPNYDRDYNSFIU-QXEWZRGKSA-N Asn-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(N)=O)C(O)=O JEPNYDRDYNSFIU-QXEWZRGKSA-N 0.000 description 1
- HGGIYWURFPGLIU-FXQIFTODSA-N Asn-Met-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CC(N)=O HGGIYWURFPGLIU-FXQIFTODSA-N 0.000 description 1
- SOYOSFXLXYZNRG-CIUDSAMLSA-N Asp-Arg-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O SOYOSFXLXYZNRG-CIUDSAMLSA-N 0.000 description 1
- NYLBGYLHBDFRHL-VEVYYDQMSA-N Asp-Arg-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NYLBGYLHBDFRHL-VEVYYDQMSA-N 0.000 description 1
- XYBJLTKSGFBLCS-QXEWZRGKSA-N Asp-Arg-Val Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](C(C)C)C(O)=O)NC(=O)[C@@H](N)CC(O)=O XYBJLTKSGFBLCS-QXEWZRGKSA-N 0.000 description 1
- VPSHHQXIWLGVDD-ZLUOBGJFSA-N Asp-Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VPSHHQXIWLGVDD-ZLUOBGJFSA-N 0.000 description 1
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 1
- DXQOQMCLWWADMU-ACZMJKKPSA-N Asp-Gln-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DXQOQMCLWWADMU-ACZMJKKPSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 1
- OAMLVOVXNKILLQ-BQBZGAKWSA-N Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O OAMLVOVXNKILLQ-BQBZGAKWSA-N 0.000 description 1
- HICVMZCGVFKTPM-BQBZGAKWSA-N Asp-Pro-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HICVMZCGVFKTPM-BQBZGAKWSA-N 0.000 description 1
- FAUPLTGRUBTXNU-FXQIFTODSA-N Asp-Pro-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O FAUPLTGRUBTXNU-FXQIFTODSA-N 0.000 description 1
- RVMXMLSYBTXCAV-VEVYYDQMSA-N Asp-Pro-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMXMLSYBTXCAV-VEVYYDQMSA-N 0.000 description 1
- BHELIUBJHYAEDK-OAIUPTLZSA-N Aspoxicillin Chemical compound C1([C@H](C(=O)N[C@@H]2C(N3[C@H](C(C)(C)S[C@@H]32)C(O)=O)=O)NC(=O)[C@H](N)CC(=O)NC)=CC=C(O)C=C1 BHELIUBJHYAEDK-OAIUPTLZSA-N 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 101150038588 CHRNB1 gene Proteins 0.000 description 1
- 101710178482 Calcium/calmodulin-dependent 3',5'-cyclic nucleotide phosphodiesterase 1B Proteins 0.000 description 1
- 240000001432 Calendula officinalis Species 0.000 description 1
- 235000005881 Calendula officinalis Nutrition 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 108090000565 Capsid Proteins Proteins 0.000 description 1
- 102100028892 Cardiotrophin-1 Human genes 0.000 description 1
- 102100035904 Caspase-1 Human genes 0.000 description 1
- 108090000426 Caspase-1 Proteins 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 102000000844 Cell Surface Receptors Human genes 0.000 description 1
- 108010001857 Cell Surface Receptors Proteins 0.000 description 1
- 108050001186 Chaperonin Cpn60 Proteins 0.000 description 1
- 102000052603 Chaperonins Human genes 0.000 description 1
- ACTIUHUUMQJHFO-UHFFFAOYSA-N Coenzym Q10 Natural products COC1=C(OC)C(=O)C(CC=C(C)CCC=C(C)CCC=C(C)CCC=C(C)CCC=C(C)CCC=C(C)CCC=C(C)CCC=C(C)CCC=C(C)CCC=C(C)C)=C(C)C1=O ACTIUHUUMQJHFO-UHFFFAOYSA-N 0.000 description 1
- 240000002627 Cordeauxia edulis Species 0.000 description 1
- 241000699800 Cricetinae Species 0.000 description 1
- 108010049894 Cyclic AMP-Dependent Protein Kinases Proteins 0.000 description 1
- LHLSSZYQFUNWRZ-NAKRPEOUSA-N Cys-Arg-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LHLSSZYQFUNWRZ-NAKRPEOUSA-N 0.000 description 1
- GEEXORWTBTUOHC-FXQIFTODSA-N Cys-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N GEEXORWTBTUOHC-FXQIFTODSA-N 0.000 description 1
- XXDLUZLKHOVPNW-IHRRRGAJSA-N Cys-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N)O XXDLUZLKHOVPNW-IHRRRGAJSA-N 0.000 description 1
- UPJGYXRAPJWIHD-CIUDSAMLSA-N Cys-Asn-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UPJGYXRAPJWIHD-CIUDSAMLSA-N 0.000 description 1
- VZKXOWRNJDEGLZ-WHFBIAKZSA-N Cys-Asp-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O VZKXOWRNJDEGLZ-WHFBIAKZSA-N 0.000 description 1
- QYKJOVAXAKTKBR-FXQIFTODSA-N Cys-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N QYKJOVAXAKTKBR-FXQIFTODSA-N 0.000 description 1
- MWZSCEAYQCMROW-GUBZILKMSA-N Cys-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CS)N MWZSCEAYQCMROW-GUBZILKMSA-N 0.000 description 1
- UUOYKFNULIOCGJ-GUBZILKMSA-N Cys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N UUOYKFNULIOCGJ-GUBZILKMSA-N 0.000 description 1
- 206010011732 Cyst Diseases 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 101710155335 DELLA protein SLR1 Proteins 0.000 description 1
- 108010009540 DNA (Cytosine-5-)-Methyltransferase 1 Proteins 0.000 description 1
- 102100024812 DNA (cytosine-5)-methyltransferase 3A Human genes 0.000 description 1
- 102100024810 DNA (cytosine-5)-methyltransferase 3B Human genes 0.000 description 1
- 101710123222 DNA (cytosine-5)-methyltransferase 3B Proteins 0.000 description 1
- 108010024491 DNA Methyltransferase 3A Proteins 0.000 description 1
- 102000011724 DNA Repair Enzymes Human genes 0.000 description 1
- 108010076525 DNA Repair Enzymes Proteins 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 241000450599 DNA viruses Species 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 239000004338 Dichlorodifluoromethane Substances 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 1
- 102000043859 Dynamin Human genes 0.000 description 1
- 108700021058 Dynamin Proteins 0.000 description 1
- 102100021236 Dynamin-1 Human genes 0.000 description 1
- 102100032049 E3 ubiquitin-protein ligase LRSAM1 Human genes 0.000 description 1
- 101100049549 Enterobacteria phage P4 sid gene Proteins 0.000 description 1
- 101800001467 Envelope glycoprotein E2 Proteins 0.000 description 1
- 101710091045 Envelope protein Proteins 0.000 description 1
- 241000283074 Equus asinus Species 0.000 description 1
- 108060002716 Exonuclease Proteins 0.000 description 1
- 102000018700 F-Box Proteins Human genes 0.000 description 1
- 108010066805 F-Box Proteins Proteins 0.000 description 1
- 102100038578 F-box only protein 11 Human genes 0.000 description 1
- 102100024785 Fibroblast growth factor 2 Human genes 0.000 description 1
- 108090000379 Fibroblast growth factor 2 Proteins 0.000 description 1
- 241000724791 Filamentous phage Species 0.000 description 1
- 108091006027 G proteins Proteins 0.000 description 1
- 102000030782 GTP binding Human genes 0.000 description 1
- 108091000058 GTP-Binding Proteins 0.000 description 1
- 102000048120 Galactokinases Human genes 0.000 description 1
- 108700023157 Galactokinases Proteins 0.000 description 1
- JRZJKWGQFNTSRN-UHFFFAOYSA-N Geldanamycin Natural products C1C(C)CC(OC)C(O)C(C)C=C(C)C(OC(N)=O)C(OC)CCC=C(C)C(=O)NC2=CC(=O)C(OC)=C1C2=O JRZJKWGQFNTSRN-UHFFFAOYSA-N 0.000 description 1
- 241000713813 Gibbon ape leukemia virus Species 0.000 description 1
- SHERTACNJPYHAR-ACZMJKKPSA-N Gln-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O SHERTACNJPYHAR-ACZMJKKPSA-N 0.000 description 1
- XOKGKOQWADCLFQ-GARJFASQSA-N Gln-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N)C(=O)O XOKGKOQWADCLFQ-GARJFASQSA-N 0.000 description 1
- DTMLKCYOQKZXKZ-HJGDQZAQSA-N Gln-Arg-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DTMLKCYOQKZXKZ-HJGDQZAQSA-N 0.000 description 1
- FFVXLVGUJBCKRX-UKJIMTQDSA-N Gln-Ile-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CCC(=O)N)N FFVXLVGUJBCKRX-UKJIMTQDSA-N 0.000 description 1
- XZLLTYBONVKGLO-SDDRHHMPSA-N Gln-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N)C(=O)O XZLLTYBONVKGLO-SDDRHHMPSA-N 0.000 description 1
- QKWBEMCLYTYBNI-GVXVVHGQSA-N Gln-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O QKWBEMCLYTYBNI-GVXVVHGQSA-N 0.000 description 1
- KUBFPYIMAGXGBT-ACZMJKKPSA-N Gln-Ser-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KUBFPYIMAGXGBT-ACZMJKKPSA-N 0.000 description 1
- CVRUVYDNRPSKBM-QEJZJMRPSA-N Gln-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)N)N CVRUVYDNRPSKBM-QEJZJMRPSA-N 0.000 description 1
- WOMUDRVDJMHTCV-DCAQKATOSA-N Glu-Arg-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOMUDRVDJMHTCV-DCAQKATOSA-N 0.000 description 1
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 1
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 1
- MLCPTRRNICEKIS-FXQIFTODSA-N Glu-Asn-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLCPTRRNICEKIS-FXQIFTODSA-N 0.000 description 1
- LXAUHIRMWXQRKI-XHNCKOQMSA-N Glu-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O LXAUHIRMWXQRKI-XHNCKOQMSA-N 0.000 description 1
- VAZZOGXDUQSVQF-NUMRIWBASA-N Glu-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)O VAZZOGXDUQSVQF-NUMRIWBASA-N 0.000 description 1
- CKOFNWCLWRYUHK-XHNCKOQMSA-N Glu-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N)C(=O)O CKOFNWCLWRYUHK-XHNCKOQMSA-N 0.000 description 1
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 1
- QYPKJXSMLMREKF-BPUTZDHNSA-N Glu-Glu-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N QYPKJXSMLMREKF-BPUTZDHNSA-N 0.000 description 1
- WVTIBGWZUMJBFY-GUBZILKMSA-N Glu-His-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O WVTIBGWZUMJBFY-GUBZILKMSA-N 0.000 description 1
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 1
- SJJHXJDSNQJMMW-SRVKXCTJSA-N Glu-Lys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O SJJHXJDSNQJMMW-SRVKXCTJSA-N 0.000 description 1
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 1
- BPCLDCNZBUYGOD-BPUTZDHNSA-N Glu-Trp-Glu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 BPCLDCNZBUYGOD-BPUTZDHNSA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- GZUKEVBTYNNUQF-WDSKDSINSA-N Gly-Ala-Gln Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GZUKEVBTYNNUQF-WDSKDSINSA-N 0.000 description 1
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 1
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 1
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 1
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 1
- QPTNELDXWKRIFX-YFKPBYRVSA-N Gly-Gly-Gln Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O QPTNELDXWKRIFX-YFKPBYRVSA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- CQIIXEHDSZUSAG-QWRGUYRKSA-N Gly-His-His Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 CQIIXEHDSZUSAG-QWRGUYRKSA-N 0.000 description 1
- YLEIWGJJBFBFHC-KBPBESRZSA-N Gly-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 YLEIWGJJBFBFHC-KBPBESRZSA-N 0.000 description 1
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- 108090000288 Glycoproteins Proteins 0.000 description 1
- 102000003886 Glycoproteins Human genes 0.000 description 1
- 102000004457 Granulocyte-Macrophage Colony-Stimulating Factor Human genes 0.000 description 1
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- 101100028493 Haloferax volcanii (strain ATCC 29605 / DSM 3757 / JCM 8879 / NBRC 14742 / NCIMB 2012 / VKM B-1768 / DS2) pan2 gene Proteins 0.000 description 1
- 101710154606 Hemagglutinin Proteins 0.000 description 1
- 108010049606 Hepatocyte Nuclear Factors Proteins 0.000 description 1
- 102000008088 Hepatocyte Nuclear Factors Human genes 0.000 description 1
- 108010068250 Herpes Simplex Virus Protein Vmw65 Proteins 0.000 description 1
- 108091027305 Heteroduplex Proteins 0.000 description 1
- PDSUIXMZYNURGI-AVGNSLFASA-N His-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CN=CN1 PDSUIXMZYNURGI-AVGNSLFASA-N 0.000 description 1
- SVHKVHBPTOMLTO-DCAQKATOSA-N His-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SVHKVHBPTOMLTO-DCAQKATOSA-N 0.000 description 1
- JBJNKUOMNZGQIM-PYJNHQTQSA-N His-Arg-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JBJNKUOMNZGQIM-PYJNHQTQSA-N 0.000 description 1
- ZPVJJPAIUZLSNE-DCAQKATOSA-N His-Arg-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O ZPVJJPAIUZLSNE-DCAQKATOSA-N 0.000 description 1
- SOFSRBYHDINIRG-QTKMDUPCSA-N His-Arg-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CN=CN1)N)O SOFSRBYHDINIRG-QTKMDUPCSA-N 0.000 description 1
- LDTJBEOANMQRJE-CIUDSAMLSA-N His-Cys-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N LDTJBEOANMQRJE-CIUDSAMLSA-N 0.000 description 1
- IDQKGZWUPVOGPZ-GUBZILKMSA-N His-Cys-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N IDQKGZWUPVOGPZ-GUBZILKMSA-N 0.000 description 1
- OHOXVDFVRDGFND-YUMQZZPRSA-N His-Cys-Gly Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CS)C(=O)NCC(O)=O OHOXVDFVRDGFND-YUMQZZPRSA-N 0.000 description 1
- FZKFYOXDVWDELO-KBPBESRZSA-N His-Gly-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O FZKFYOXDVWDELO-KBPBESRZSA-N 0.000 description 1
- BZKDJRSZWLPJNI-SRVKXCTJSA-N His-His-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O BZKDJRSZWLPJNI-SRVKXCTJSA-N 0.000 description 1
- VYUXYMRNGALHEA-DLOVCJGASA-N His-Leu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O VYUXYMRNGALHEA-DLOVCJGASA-N 0.000 description 1
- UROVZOUMHNXPLZ-AVGNSLFASA-N His-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 UROVZOUMHNXPLZ-AVGNSLFASA-N 0.000 description 1
- GUXQAPACZVVOKX-AVGNSLFASA-N His-Lys-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GUXQAPACZVVOKX-AVGNSLFASA-N 0.000 description 1
- PLCAEMGSYOYIPP-GUBZILKMSA-N His-Ser-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 PLCAEMGSYOYIPP-GUBZILKMSA-N 0.000 description 1
- ZHHLTWUOWXHVQJ-YUMQZZPRSA-N His-Ser-Gly Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZHHLTWUOWXHVQJ-YUMQZZPRSA-N 0.000 description 1
- 102100022846 Histone acetyltransferase KAT2B Human genes 0.000 description 1
- 101000733040 Homo sapiens 40S ribosomal protein S19 Proteins 0.000 description 1
- 101001117099 Homo sapiens Calcium/calmodulin-dependent 3',5'-cyclic nucleotide phosphodiesterase 1B Proteins 0.000 description 1
- 101000710899 Homo sapiens Cannabinoid receptor 1 Proteins 0.000 description 1
- 101000916283 Homo sapiens Cardiotrophin-1 Proteins 0.000 description 1
- 101000931098 Homo sapiens DNA (cytosine-5)-methyltransferase 1 Proteins 0.000 description 1
- 101000817604 Homo sapiens Dynamin-1 Proteins 0.000 description 1
- 101000851181 Homo sapiens Epidermal growth factor receptor Proteins 0.000 description 1
- 101001030683 Homo sapiens F-box only protein 11 Proteins 0.000 description 1
- 101001047006 Homo sapiens Histone acetyltransferase KAT2B Proteins 0.000 description 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 101000615495 Homo sapiens Methyl-CpG-binding domain protein 3 Proteins 0.000 description 1
- 101001094700 Homo sapiens POU domain, class 5, transcription factor 1 Proteins 0.000 description 1
- 101001109800 Homo sapiens Pro-neuregulin-1, membrane-bound isoform Proteins 0.000 description 1
- 101000702560 Homo sapiens Probable global transcription activator SNF2L1 Proteins 0.000 description 1
- 101001116937 Homo sapiens Protocadherin alpha-4 Proteins 0.000 description 1
- 101000738771 Homo sapiens Receptor-type tyrosine-protein phosphatase C Proteins 0.000 description 1
- 101000702544 Homo sapiens SWI/SNF-related matrix-associated actin-dependent regulator of chromatin subfamily A member 5 Proteins 0.000 description 1
- 101000713275 Homo sapiens Solute carrier family 22 member 3 Proteins 0.000 description 1
- 101000890292 Homo sapiens THAP domain-containing protein 2 Proteins 0.000 description 1
- 101000802101 Homo sapiens mRNA decay activator protein ZFP36L2 Proteins 0.000 description 1
- 102000044753 ISWI Human genes 0.000 description 1
- PWUMCBLVWPCKNO-MGHWNKPDSA-N Ile-Leu-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PWUMCBLVWPCKNO-MGHWNKPDSA-N 0.000 description 1
- WXLYNEHOGRYNFU-URLPEUOOSA-N Ile-Thr-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N WXLYNEHOGRYNFU-URLPEUOOSA-N 0.000 description 1
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 1
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 1
- 102100037850 Interferon gamma Human genes 0.000 description 1
- 108010074328 Interferon-gamma Proteins 0.000 description 1
- 108020004684 Internal Ribosome Entry Sites Proteins 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 1
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 1
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 1
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 1
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 1
- ZGUMORRUBUCXEH-AVGNSLFASA-N Leu-Lys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZGUMORRUBUCXEH-AVGNSLFASA-N 0.000 description 1
- REPBGZHJKYWFMJ-KKUMJFAQSA-N Leu-Lys-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N REPBGZHJKYWFMJ-KKUMJFAQSA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 1
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 1
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 1
- YQFZRHYZLARWDY-IHRRRGAJSA-N Leu-Val-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN YQFZRHYZLARWDY-IHRRRGAJSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 108090001030 Lipoproteins Proteins 0.000 description 1
- 102000004895 Lipoproteins Human genes 0.000 description 1
- 102000006830 Luminescent Proteins Human genes 0.000 description 1
- 108010047357 Luminescent Proteins Proteins 0.000 description 1
- ZTPWXNOOKAXPPE-DCAQKATOSA-N Lys-Arg-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N ZTPWXNOOKAXPPE-DCAQKATOSA-N 0.000 description 1
- PINHPJWGVBKQII-SRVKXCTJSA-N Lys-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N PINHPJWGVBKQII-SRVKXCTJSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- QRHWTCJBCLGYRB-FXQIFTODSA-N Met-Ala-Cys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O QRHWTCJBCLGYRB-FXQIFTODSA-N 0.000 description 1
- ONGCSGVHCSAATF-CIUDSAMLSA-N Met-Ala-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O ONGCSGVHCSAATF-CIUDSAMLSA-N 0.000 description 1
- SJDQOYTYNGZZJX-SRVKXCTJSA-N Met-Glu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SJDQOYTYNGZZJX-SRVKXCTJSA-N 0.000 description 1
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 1
- ATBJCCFCJXCNGZ-UFYCRDLUSA-N Met-Tyr-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 ATBJCCFCJXCNGZ-UFYCRDLUSA-N 0.000 description 1
- 102000006890 Methyl-CpG-Binding Protein 2 Human genes 0.000 description 1
- 108010072388 Methyl-CpG-Binding Protein 2 Proteins 0.000 description 1
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 1
- 102100021291 Methyl-CpG-binding domain protein 3 Human genes 0.000 description 1
- 108060004795 Methyltransferase Proteins 0.000 description 1
- 108010059724 Micrococcal Nuclease Proteins 0.000 description 1
- 208000016285 Movement disease Diseases 0.000 description 1
- 108010086093 Mung Bean Nuclease Proteins 0.000 description 1
- 241000699660 Mus musculus Species 0.000 description 1
- 101100215374 Mus musculus Actb gene Proteins 0.000 description 1
- 101000686995 Mus musculus Protein phosphatase 1 regulatory subunit 1B Proteins 0.000 description 1
- 101000909851 Mycobacterium tuberculosis (strain ATCC 25618 / H37Rv) cAMP/cGMP dual specificity phosphodiesterase Rv0805 Proteins 0.000 description 1
- 108010057466 NF-kappa B Proteins 0.000 description 1
- 102000003945 NF-kappa B Human genes 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 108090000913 Nitrate Reductases Proteins 0.000 description 1
- 108010008964 Non-Histone Chromosomal Proteins Proteins 0.000 description 1
- 102000006570 Non-Histone Chromosomal Proteins Human genes 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 108020005497 Nuclear hormone receptor Proteins 0.000 description 1
- 102000007399 Nuclear hormone receptor Human genes 0.000 description 1
- 108091007494 Nucleic acid- binding domains Proteins 0.000 description 1
- XDMCWZFLLGVIID-SXPRBRBTSA-N O-(3-O-D-galactosyl-N-acetyl-beta-D-galactosaminyl)-L-serine Chemical compound CC(=O)N[C@H]1[C@H](OC[C@H]([NH3+])C([O-])=O)O[C@H](CO)[C@H](O)[C@@H]1OC1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 XDMCWZFLLGVIID-SXPRBRBTSA-N 0.000 description 1
- 102000043276 Oncogene Human genes 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 102000016304 Origin Recognition Complex Human genes 0.000 description 1
- 108010067244 Origin Recognition Complex Proteins 0.000 description 1
- 102100030030 Origin recognition complex subunit 4 Human genes 0.000 description 1
- 101710201850 Origin recognition complex subunit 4 Proteins 0.000 description 1
- 101100046877 Oryza sativa subsp. japonica TRAB1 gene Proteins 0.000 description 1
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 1
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 102100035593 POU domain, class 2, transcription factor 1 Human genes 0.000 description 1
- 101710084414 POU domain, class 2, transcription factor 1 Proteins 0.000 description 1
- 102100035423 POU domain, class 5, transcription factor 1 Human genes 0.000 description 1
- 229930040373 Paraformaldehyde Natural products 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 101100440941 Petroselinum crispum CPRF1 gene Proteins 0.000 description 1
- 206010057249 Phagocytosis Diseases 0.000 description 1
- FPTXMUIBLMGTQH-ONGXEEELSA-N Phe-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 FPTXMUIBLMGTQH-ONGXEEELSA-N 0.000 description 1
- KIAWKQJTSGRCSA-AVGNSLFASA-N Phe-Asn-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KIAWKQJTSGRCSA-AVGNSLFASA-N 0.000 description 1
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 1
- LTAWNJXSRUCFAN-UNQGMJICSA-N Phe-Thr-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LTAWNJXSRUCFAN-UNQGMJICSA-N 0.000 description 1
- FGWUALWGCZJQDJ-URLPEUOOSA-N Phe-Thr-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FGWUALWGCZJQDJ-URLPEUOOSA-N 0.000 description 1
- 241000235648 Pichia Species 0.000 description 1
- OCSACVPBMIYNJE-GUBZILKMSA-N Pro-Arg-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O OCSACVPBMIYNJE-GUBZILKMSA-N 0.000 description 1
- WPQKSRHDTMRSJM-CIUDSAMLSA-N Pro-Asp-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 WPQKSRHDTMRSJM-CIUDSAMLSA-N 0.000 description 1
- MLKVIVZCFYRTIR-KKUMJFAQSA-N Pro-Phe-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLKVIVZCFYRTIR-KKUMJFAQSA-N 0.000 description 1
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 1
- FUOGXAQMNJMBFG-WPRPVWTQSA-N Pro-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FUOGXAQMNJMBFG-WPRPVWTQSA-N 0.000 description 1
- 102100033237 Pro-epidermal growth factor Human genes 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 101710176177 Protein A56 Proteins 0.000 description 1
- 108700040121 Protein Methyltransferases Proteins 0.000 description 1
- 102000055027 Protein Methyltransferases Human genes 0.000 description 1
- 102000005569 Protein Phosphatase 1 Human genes 0.000 description 1
- 108010059000 Protein Phosphatase 1 Proteins 0.000 description 1
- 101710188315 Protein X Proteins 0.000 description 1
- 102100024261 Protocadherin alpha-4 Human genes 0.000 description 1
- 241000125945 Protoparvovirus Species 0.000 description 1
- 102000044126 RNA-Binding Proteins Human genes 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 101710105008 RNA-binding protein Proteins 0.000 description 1
- 101150065817 ROM2 gene Proteins 0.000 description 1
- MUPFEKGTMRGPLJ-RMMQSMQOSA-N Raffinose Natural products O(C[C@H]1[C@@H](O)[C@H](O)[C@@H](O)[C@@H](O[C@@]2(CO)[C@H](O)[C@@H](O)[C@@H](CO)O2)O1)[C@@H]1[C@H](O)[C@@H](O)[C@@H](O)[C@@H](CO)O1 MUPFEKGTMRGPLJ-RMMQSMQOSA-N 0.000 description 1
- 241000232299 Ralstonia Species 0.000 description 1
- 101100272715 Ralstonia solanacearum (strain GMI1000) brg11 gene Proteins 0.000 description 1
- 102100037422 Receptor-type tyrosine-protein phosphatase C Human genes 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 102000009661 Repressor Proteins Human genes 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 101001025539 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Homothallic switching endonuclease Proteins 0.000 description 1
- 241000235346 Schizosaccharomyces Species 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- HZWAHWQZPSXNCB-BPUTZDHNSA-N Ser-Arg-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O HZWAHWQZPSXNCB-BPUTZDHNSA-N 0.000 description 1
- OHKLFYXEOGGGCK-ZLUOBGJFSA-N Ser-Asp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OHKLFYXEOGGGCK-ZLUOBGJFSA-N 0.000 description 1
- COLJZWUVZIXSSS-CIUDSAMLSA-N Ser-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N COLJZWUVZIXSSS-CIUDSAMLSA-N 0.000 description 1
- GZBKRJVCRMZAST-XKBZYTNZSA-N Ser-Glu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZBKRJVCRMZAST-XKBZYTNZSA-N 0.000 description 1
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 1
- IUXGJEIKJBYKOO-SRVKXCTJSA-N Ser-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N IUXGJEIKJBYKOO-SRVKXCTJSA-N 0.000 description 1
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 1
- FKYWFUYPVKLJLP-DCAQKATOSA-N Ser-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FKYWFUYPVKLJLP-DCAQKATOSA-N 0.000 description 1
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 1
- ILVGMCVCQBJPSH-WDSKDSINSA-N Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CO ILVGMCVCQBJPSH-WDSKDSINSA-N 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 1
- 108010085012 Steroid Receptors Proteins 0.000 description 1
- 102000007451 Steroid Receptors Human genes 0.000 description 1
- 238000000692 Student's t-test Methods 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 101800001271 Surface protein Proteins 0.000 description 1
- 102000006467 TATA-Box Binding Protein Human genes 0.000 description 1
- 108010044281 TATA-Box Binding Protein Proteins 0.000 description 1
- 102100040044 THAP domain-containing protein 2 Human genes 0.000 description 1
- 101150006914 TRP1 gene Proteins 0.000 description 1
- 241000011102 Thera Species 0.000 description 1
- 241000589596 Thermus Species 0.000 description 1
- 241000589499 Thermus thermophilus Species 0.000 description 1
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 1
- DDPVJPIGACCMEH-XQXXSGGOSA-N Thr-Ala-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DDPVJPIGACCMEH-XQXXSGGOSA-N 0.000 description 1
- NFMPFBCXABPALN-OWLDWWDNSA-N Thr-Ala-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O NFMPFBCXABPALN-OWLDWWDNSA-N 0.000 description 1
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 1
- JMZKMSTYXHFYAK-VEVYYDQMSA-N Thr-Arg-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O JMZKMSTYXHFYAK-VEVYYDQMSA-N 0.000 description 1
- LHUBVKCLOVALIA-HJGDQZAQSA-N Thr-Arg-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O LHUBVKCLOVALIA-HJGDQZAQSA-N 0.000 description 1
- MQBTXMPQNCGSSZ-OSUNSFLBSA-N Thr-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N MQBTXMPQNCGSSZ-OSUNSFLBSA-N 0.000 description 1
- NAXBBCLCEOTAIG-RHYQMDGZSA-N Thr-Arg-Lys Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O NAXBBCLCEOTAIG-RHYQMDGZSA-N 0.000 description 1
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 1
- VYEHBMMAJFVTOI-JHEQGTHGSA-N Thr-Gly-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VYEHBMMAJFVTOI-JHEQGTHGSA-N 0.000 description 1
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 1
- WFAUDCSNCWJJAA-KXNHARMFSA-N Thr-Lys-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(O)=O WFAUDCSNCWJJAA-KXNHARMFSA-N 0.000 description 1
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 1
- SBYQHZCMVSPQCS-RCWTZXSCSA-N Thr-Val-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O SBYQHZCMVSPQCS-RCWTZXSCSA-N 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- SCQBNMKLZVCXNX-ZFWWWQNUSA-N Trp-Arg-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)O)N SCQBNMKLZVCXNX-ZFWWWQNUSA-N 0.000 description 1
- TWJDQTTXXZDJKV-BPUTZDHNSA-N Trp-Arg-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O TWJDQTTXXZDJKV-BPUTZDHNSA-N 0.000 description 1
- LVTKHGUGBGNBPL-UHFFFAOYSA-N Trp-P-1 Chemical compound N1C2=CC=CC=C2C2=C1C(C)=C(N)N=C2C LVTKHGUGBGNBPL-UHFFFAOYSA-N 0.000 description 1
- GSCPHMSPGQSZJT-JYBASQMISA-N Trp-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O GSCPHMSPGQSZJT-JYBASQMISA-N 0.000 description 1
- HTGJDTPQYFMKNC-VFAJRCTISA-N Trp-Thr-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)[C@@H](C)O)=CNC2=C1 HTGJDTPQYFMKNC-VFAJRCTISA-N 0.000 description 1
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 1
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 1
- TWAVEIJGFCBWCG-JYJNAYRXSA-N Tyr-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N TWAVEIJGFCBWCG-JYJNAYRXSA-N 0.000 description 1
- LOOCQRRBKZTPKO-AVGNSLFASA-N Tyr-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LOOCQRRBKZTPKO-AVGNSLFASA-N 0.000 description 1
- WTTRJMAZPDHPGS-KKXDTOCCSA-N Tyr-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(O)=O WTTRJMAZPDHPGS-KKXDTOCCSA-N 0.000 description 1
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 1
- NZBSVMQZQMEUHI-WZLNRYEVSA-N Tyr-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NZBSVMQZQMEUHI-WZLNRYEVSA-N 0.000 description 1
- MUPFEKGTMRGPLJ-UHFFFAOYSA-N UNPD196149 Natural products OC1C(O)C(CO)OC1(CO)OC1C(O)C(O)C(O)C(COC2C(C(O)C(O)C(CO)O2)O)O1 MUPFEKGTMRGPLJ-UHFFFAOYSA-N 0.000 description 1
- 241000700618 Vaccinia virus Species 0.000 description 1
- 206010046865 Vaccinia virus infection Diseases 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 1
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 1
- GIAZPLMMQOERPN-YUMQZZPRSA-N Val-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GIAZPLMMQOERPN-YUMQZZPRSA-N 0.000 description 1
- ODUHAIXFXFACDY-SRVKXCTJSA-N Val-Val-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)C(C)C ODUHAIXFXFACDY-SRVKXCTJSA-N 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 108700005077 Viral Genes Proteins 0.000 description 1
- 101100082034 Xenopus laevis pou3f2-a gene Proteins 0.000 description 1
- PTFCDOFLOPIGGS-UHFFFAOYSA-N Zinc dication Chemical group [Zn+2] PTFCDOFLOPIGGS-UHFFFAOYSA-N 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000033289 adaptive immune response Effects 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- VREFGVBLTWBCJP-UHFFFAOYSA-N alprazolam Chemical compound C12=CC(Cl)=CC=C2N2C(C)=NN=C2CN=C1C1=CC=CC=C1 VREFGVBLTWBCJP-UHFFFAOYSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 230000002072 anti-mutant effect Effects 0.000 description 1
- 230000000259 anti-tumor effect Effects 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 210000000612 antigen-presenting cell Anatomy 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 235000006708 antioxidants Nutrition 0.000 description 1
- 239000003816 antisense DNA Substances 0.000 description 1
- 210000000709 aorta Anatomy 0.000 description 1
- 230000005775 apoptotic pathway Effects 0.000 description 1
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 1
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 230000008335 axon cargo transport Effects 0.000 description 1
- 244000000005 bacterial plant pathogen Species 0.000 description 1
- 239000000022 bacteriostatic agent Substances 0.000 description 1
- 210000004227 basal ganglia Anatomy 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 238000009583 bone marrow aspiration Methods 0.000 description 1
- 210000002798 bone marrow cell Anatomy 0.000 description 1
- 210000005013 brain tissue Anatomy 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 101150103552 cagE gene Proteins 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 229930003827 cannabinoid Natural products 0.000 description 1
- 239000003557 cannabinoid Substances 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 125000002091 cationic group Chemical group 0.000 description 1
- 150000001768 cations Chemical class 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 230000007910 cell fusion Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 108091092356 cellular DNA Proteins 0.000 description 1
- 230000005754 cellular signaling Effects 0.000 description 1
- 210000003850 cellular structure Anatomy 0.000 description 1
- 230000007073 chemical hydrolysis Effects 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 238000000546 chi-square test Methods 0.000 description 1
- 238000000749 co-immunoprecipitation Methods 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 229940110767 coenzyme Q10 Drugs 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 230000000536 complexating effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 239000013068 control sample Substances 0.000 description 1
- 230000009146 cooperative binding Effects 0.000 description 1
- 244000038559 crop plants Species 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 208000031513 cyst Diseases 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 108010004073 cysteinylcysteine Proteins 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 239000012649 demethylating agent Substances 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000010432 diamond Substances 0.000 description 1
- 235000019404 dichlorodifluoromethane Nutrition 0.000 description 1
- 230000009699 differential effect Effects 0.000 description 1
- 108010009297 diglycyl-histidine Proteins 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 241001493065 dsRNA viruses Species 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000013020 embryo development Effects 0.000 description 1
- 108010048367 enhanced green fluorescent protein Proteins 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 230000002964 excitative effect Effects 0.000 description 1
- 230000003492 excitotoxic effect Effects 0.000 description 1
- 231100000063 excitotoxicity Toxicity 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 102000013165 exonuclease Human genes 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 210000003414 extremity Anatomy 0.000 description 1
- 238000000799 fluorescence microscopy Methods 0.000 description 1
- 238000007306 functionalization reaction Methods 0.000 description 1
- 229930182830 galactose Natural products 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- QTQAWLPCGQOSGP-GBTDJJJQSA-N geldanamycin Chemical compound N1C(=O)\C(C)=C/C=C\[C@@H](OC)[C@H](OC(N)=O)\C(C)=C/[C@@H](C)[C@@H](O)[C@H](OC)C[C@@H](C)CC2=C(OC)C(=O)C=C1C2=O QTQAWLPCGQOSGP-GBTDJJJQSA-N 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 238000012226 gene silencing method Methods 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 108010013768 glutamyl-aspartyl-proline Proteins 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 210000003714 granulocyte Anatomy 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 210000002443 helper t lymphocyte Anatomy 0.000 description 1
- 239000000185 hemagglutinin Substances 0.000 description 1
- 238000010842 high-capacity cDNA reverse transcription kit Methods 0.000 description 1
- 210000001320 hippocampus Anatomy 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 230000006195 histone acetylation Effects 0.000 description 1
- 102000055650 human NRG1 Human genes 0.000 description 1
- 102000044778 human ZNF10 Human genes 0.000 description 1
- 238000006460 hydrolysis reaction Methods 0.000 description 1
- 210000003016 hypothalamus Anatomy 0.000 description 1
- 238000002649 immunization Methods 0.000 description 1
- 230000003053 immunization Effects 0.000 description 1
- 238000003364 immunohistochemistry Methods 0.000 description 1
- 238000001114 immunoprecipitation Methods 0.000 description 1
- 238000010874 in vitro model Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 238000007917 intracranial administration Methods 0.000 description 1
- 238000010255 intramuscular injection Methods 0.000 description 1
- 239000007927 intramuscular injection Substances 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- YWXYYJSYQOXTPL-SLPGGIOYSA-N isosorbide mononitrate Chemical compound [O-][N+](=O)O[C@@H]1CO[C@@H]2[C@@H](O)CO[C@@H]21 YWXYYJSYQOXTPL-SLPGGIOYSA-N 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 1
- 108010091871 leucylmethionine Proteins 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 210000003141 lower extremity Anatomy 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 102100034703 mRNA decay activator protein ZFP36L2 Human genes 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 108010082117 matrigel Proteins 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 230000001035 methylating effect Effects 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 229960004023 minocycline Drugs 0.000 description 1
- DYKFCLLONBREIL-KVUCHLLUSA-N minocycline Chemical compound C([C@H]1C2)C3=C(N(C)C)C=CC(O)=C3C(=O)C1=C(O)[C@@]1(O)[C@@H]2[C@H](N(C)C)C(O)=C(C(N)=O)C1=O DYKFCLLONBREIL-KVUCHLLUSA-N 0.000 description 1
- 238000007479 molecular analysis Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000009126 molecular therapy Methods 0.000 description 1
- 210000000663 muscle cell Anatomy 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 210000000066 myeloid cell Anatomy 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 210000000478 neocortex Anatomy 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 230000004766 neurogenesis Effects 0.000 description 1
- 230000000926 neurological effect Effects 0.000 description 1
- 230000004031 neuronal differentiation Effects 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 101150081585 panB gene Proteins 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 229920002866 paraformaldehyde Polymers 0.000 description 1
- 238000007911 parenteral administration Methods 0.000 description 1
- 210000001152 parietal lobe Anatomy 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000007310 pathophysiology Effects 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 229960001412 pentobarbital Drugs 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000008782 phagocytosis Effects 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 239000008363 phosphate buffer Substances 0.000 description 1
- 230000037039 plant physiology Effects 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 238000007747 plating Methods 0.000 description 1
- 229920001983 poloxamer Polymers 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 208000037821 progressive disease Diseases 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 239000001294 propane Substances 0.000 description 1
- 239000003380 propellant Substances 0.000 description 1
- 238000011321 prophylaxis Methods 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 229950010131 puromycin Drugs 0.000 description 1
- 239000000700 radioactive tracer Substances 0.000 description 1
- MUPFEKGTMRGPLJ-ZQSKZDJDSA-N raffinose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO[C@@H]2[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O2)O)O1 MUPFEKGTMRGPLJ-ZQSKZDJDSA-N 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 108010054624 red fluorescent protein Proteins 0.000 description 1
- 102000037983 regulatory factors Human genes 0.000 description 1
- 108091008025 regulatory factors Proteins 0.000 description 1
- 229950000659 remacemide Drugs 0.000 description 1
- 238000007634 remodeling Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 230000001718 repressive effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 230000009919 sequestration Effects 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 230000021595 spermatogenesis Effects 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 230000007100 striatal neurodegeneration Effects 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 239000000375 suspending agent Substances 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000007910 systemic administration Methods 0.000 description 1
- 239000003826 tablet Substances 0.000 description 1
- 210000001103 thalamus Anatomy 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 230000004797 therapeutic response Effects 0.000 description 1
- 239000002562 thickening agent Substances 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical group [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 108091006106 transcriptional activators Proteins 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- PIEPQKCYPFFYMG-UHFFFAOYSA-N tris acetate Chemical compound CC(O)=O.OCC(N)(CO)CO PIEPQKCYPFFYMG-UHFFFAOYSA-N 0.000 description 1
- 230000010415 tropism Effects 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 238000003160 two-hybrid assay Methods 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 208000007089 vaccinia Diseases 0.000 description 1
- 230000028973 vesicle-mediated transport Effects 0.000 description 1
- 210000002845 virion Anatomy 0.000 description 1
- 239000000277 virosome Substances 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6811—Selection methods for production or design of target specific oligonucleotides or binding molecules
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/43—Enzymes; Proenzymes; Derivatives thereof
- A61K38/46—Hydrolases (3)
- A61K38/465—Hydrolases (3) acting on ester bonds (3.1), e.g. lipases, ribonucleases
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K31/00—Medicinal preparations containing organic active ingredients
- A61K31/70—Carbohydrates; Sugars; Derivatives thereof
- A61K31/7088—Compounds having three or more nucleosides or nucleotides
- A61K31/713—Double-stranded nucleic acids or oligonucleotides
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/04—Peptides having up to 20 amino acids in a fully defined sequence; Derivatives thereof
- A61K38/10—Peptides having 12 to 20 amino acids
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/164—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K9/00—Medicinal preparations characterised by special physical form
- A61K9/0012—Galenical forms characterised by the site of application
- A61K9/0085—Brain, e.g. brain implants; Spinal cord
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/28—Drugs for disorders of the nervous system for treating neurodegenerative disorders of the central nervous system, e.g. nootropic agents, cognition enhancers, drugs for treating Alzheimer's disease or other forms of dementia
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
- C12N15/864—Parvoviral vectors, e.g. parvovirus, densovirus
- C12N15/8645—Adeno-associated virus
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N7/00—Viruses; Bacteriophages; Compositions thereof; Preparation or purification thereof
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/30—Special therapeutic applications
- C12N2320/34—Allele or polymorphism specific uses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2750/00—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
- C12N2750/00011—Details
- C12N2750/14011—Parvoviridae
- C12N2750/14111—Dependovirus, e.g. adenoassociated viruses
- C12N2750/14141—Use of virus, viral particle or viral elements as a vector
- C12N2750/14143—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Medicinal Chemistry (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Veterinary Medicine (AREA)
- Pharmacology & Pharmacy (AREA)
- Epidemiology (AREA)
- Molecular Biology (AREA)
- Immunology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biochemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Neurology (AREA)
- Neurosurgery (AREA)
- Virology (AREA)
- Orthopedic Medicine & Surgery (AREA)
- Psychology (AREA)
- Psychiatry (AREA)
- Hospice & Palliative Care (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Analytical Chemistry (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
Abstract
본원에 헌팅턴병을 치료하기 위한 조성물 및 방법이 개시된다. 특히, 본원에 헌팅턴병을 치료하기 위하여 HD Htt 대립유전자를 변형시키는 (예컨대 발현을 조절하는) 방법 및 조성물이 제공된다. 또한 헌팅턴병의 동물 모델을 제조하기 위한 방법 및 조성물이 제공된다. 그러므로, 한 측면으로, HD 대립유전자 (예컨대 Htt)의 발현을 조절하는 엔지니어링된 (비-자연적 발생의) DNA 결합 도메인 (예컨대 징크 핑거 단백질, TAL 이펙터 (TALE) 단백질 또는 CRISPR/dCas-TF)이 제공된다.
Description
관련
출원에 대한 교차
-참조
본 출원은 2013년 11원 11일에 출원된 미국 임시 출원 번호 61/902,704호의 유익을 주장하며, 상기 출원의 개시내용은 그것의 전체 내용이 본원에 참조로 포함된다.
기술분야
본 발명은 유전자 발현 및 게놈 편집 분야에 있다.
헌팅턴 무도병으로도 알려져 있는 헌팅턴병 (Huntington's Disease (HD))은 운동, 인지 및 정신과적 동요의 점진적 장애이다. 이 질병이 개시되는 평균 연령은 35 내지 44세이지만, 사례의 약 10%에서 병의 시작은 21세 전에 발생하고, 질병의 진단 후 평균 수명은 15 내지 18년이다. 유병률은 서유럽 혈통의 100,000명 중 약 3 내지 7명이다.
헌팅턴병은 1990년대 초기에 트라이뉴클레오티드 반복 확장 (repeat expansion) 장애가 처음으로 특성화되었던 사례이다 (Di Prospero and Fischbeck (2005) Nature Reviews Genetics 6:756-765 참조). 이들 장애는 반복이 연장되거나, 독성 기능이 획득되거나 또는 둘 다인 불안정한 반복의 국소화된 확장을 포함한다. 트라이뉴클레오티드 반복은 비-코딩 및 코딩 유전자 영역을 포함하여, 유전자의 어느 부분에서든 위치할 수 있다. 코딩 영역 내에 위치한 반복은 전형적으로 반복된 글루타민 코드화 트리플렛 (CAG) 또는 알라닌 코드화 트리플렛 (CGA)을 포함한다. 비-코딩 영역 내에서 확장된 반복 영역은 유전자의 일탈적인 발현을 유도할 수 있는 한편, 코딩 영역 내에서 확장된 반복 (또한 코돈 반복 장애로도 알려져 있음)은 잘못된-접힘 및 단백질 응집을 유발할 수 있다. 일탈 단백질과 관련된 병리생리학의 정확한 원인은 그리 알려져 있지 않다. 전형적으로, 트라이뉴클레오티드가 확장된 야생형 유전자에서, 이들 영역은 정상적인 집단에서는 가변적인 수의 반복 서열을 함유하지만, 병에 걸린 집단에서는, 반복의 수는 반복의 수의 2배수로부터 로그 차순 증가까지 증가할 수 있다. HD에서, 반복은 큰 시토졸 단백질 헌팅틴 (Htt)의 N 말단 코딩 영역 내에 삽입된다. 정상적인 Htt 대립유전자는 15 내지 20개의 CAG 반복을 함유하는 한편, 35개 이상의 반복을 함유하는 대립유전자는 잠재적으로 HD 유발 대립유전자로 간주될 수 있고 질병의 발생 위험을 부여한다. 36 내지 39개의 반복을 함유하는 대립유전자는 불완전하게 침투하는 것으로 여겨지고, 이들 대립유전자를 은닉하고 있는 개인들은 질병을 발생시킬 수도 있고 그렇지 않을 수도 있는 (또는 생의 후기에 증상들을 나타낼 수 있음) 한편, 40개 이상의 반복을 함유하는 대립유전자는 완전하게 침투성인 것으로 간주된다. 실제로, 이런 많은 반복을 가지는 HD 대립유전자를 함유하고 있는 무증상 개인은 없는 것으로 보고되었다. 청소년기에 (<21세) HD가 시작되는 개인은 자주 60개 이상의 CAG 반복을 가지는 것으로 발견된다. CAG 반복의 증가에 더불어, HD는 반복 서열 내에 +1 및 +2 프레임쉬프트를 포함할 수 있어서 영역은 폴리-글루타민보다는 폴리-세린 폴리펩티드 (+1 프레임쉬프트의 경우에 AGC 반복에 의해 코드화됨)를 코드화할 것으로 또한 밝혀졌다 (Davies and Rubinsztein (2006) Journal of Medical Genetics 43: 893-896).
HD에서, 돌연변이 Htt 대립유전자는 통상 한쪽 부모로부터 우성 형질로서 유전된다. HD 환자로부터 태어나는 어떠한 어린이든지 만약 다른쪽 부모가 그 장애에 걸리지 않았다면 그 질병을 발병할 가능성이 50%이다. 어떤 경우에, 부모는 중간 HD 대립유전자를 가지며 무증상일 수 있는 한편, 반복 확장으로 인해, 어린이는 질병을 나타낸다. 또한, HD 대립유전자는 또한 증가하는 심각성 또는 발병의 연령 강하가 정자 형성중에 반복 영역의 불안정한 성질로 인해 여러 세대에 걸쳐 관찰되는 예측으로서 알려져있는 현상을 나타낼 수 있다.
나아가, Htt에서의 트라이뉴클레오티드 확장은 선조체에서 중간 가시 (medium spiny) 감마-아미노부티르산 (GABA) 돌출 뉴런의 뉴런 손실을 유발하고, 이때 뉴런 손실은 또한 신피질에서도 발생한다. 엔케팔린을 함유하고 외부의 담창구로 돌출되는 (소위 "간접 경로"로) 중간 가시 뉴런 (MSN)은 물질 P를 함유하고 내부 담창구로 돌출되는 ("직접" 경로로) 뉴런들보다 많이 포함되지만, 두 유형의 MSN 모두 영향을 받는다. HD의 MSN은 다른 비정상적인 변경 (htt의 비정상적인 응집 및 포함, 생체 에너지 결함, 뉴로트로핀 결핍, 축삭 수송 및 흥분 독성)과 함께 전사적 조절장애를 나타낸다. 전사체학적 효과에 대한 메커니즘은 가용성 DNA-결합 전사 인자의 활성의 변화, 크로마틴 생화학 및 조직화의 비정상 및 응집체-유도된 핵 전사 인자 격리에 관련될 수 있다 (Runne et al (2008) J Neurosci 28(39):9723-9731 참조).
헌팅턴병에 걸린 사람에게서 크게 영향을 받는 다른 뇌 구역은 흑색질, 피층 3, 5 및 6, 해마의 CA1 영역, 두정엽의 각회 (angular gyrus), 소뇌의 푸르키니에 세포, 시상하부의 측 융기핵 및 시상의 중심정중핵 다발옆핵 복합체를 포함한다 (Walker (2007) Lancet 369:218-228).
정상적인 Htt 단백질의 역할은 잘 알려지지 않았지만, 신경 발생, 아폽토시스성 세포 사멸 및 소포 왕래 (vesicle trafficking)에 포함될 수 있다. 또한 야생형 Htt가 선조체 뉴런에 대한 생존-전 인자인 뇌-유도된 신경 영양 인자 (BDNF)의 생성을 자극한다는 증거가 있다. HD의 진행은 HD의 마우스 모델에서 BDNF의 감소와 관련이 있고 (Zuccato et al (2005) Pharmacological Research 52(2):133-139), 아데노-관련 바이러스 (AAV) 벡터-중재된 유전자 전달을 통한 BDNF 또는 교질 셀라인-유도된 신경 영양 인자 (GDNF) 중 어느 하나의 전달이 HD의 마우스 모델에서 선조체 뉴런을 보호할 수 있는 것으로 밝혀졌다 (Kells et al, (2004) Molecular Therapy 9(5):682-688).
HD에 대한 치료 옵션은 현재 매우 한정되어 있다. 샤페로닌의 과잉발현 또는 화합물 겔다나마이신을 사용한 열 충격 반응의 유도와 같은 연장된 폴리-글루타민 트랙트 (tract)를 통해 발생하는 단백질 응집과 관련된 독성을 방지하기 위해 디자인된 일부 잠재적 방법론은 시험관 내 모델에서 이들 독성의 감소를 나타냈다. 다른 치료는 질병의 임상적 징후에서 아폽토시스의 역할을 표적으로 한다. 예를 들어 질병 증상의 둔화는 한 쪽 부모가 HD 대립유전자를 함유하였고 다른 쪽 부모는 카스파제 1에 대한 우성 음성 대립유전자를 가지고 있는 경우에 마우스들의 짝짓기의 새끼에서의 동물 모델에서 카스파제 활성의 차단을 통해 나타났다. 추가로, 카스파제에 의한 돌연변이 Htt의 절단은 질병의 병원성 (pathogenicity)에서 역할을 할 수 있다. 카스파제-6 내성 돌연변이 Htt를 은닉하고 있는 유전자도입 마우스는 정상적인 뉴런 기능을 유지하는 것으로 나타났고 비-카스파제 내성 돌연변이 Htt 대립유전자를 받은 마우스들에 비교하여 선조체 신경변성을 나타내지 않았다 (Graham et al (2006) Cell 125: 1179-1191 참조). 아폽토시스 경로의 구성원들을 표적으로 하는 분자들 또한 증상학에 대해 둔화 효과를 나타내는 것으로 밝혀졌다. 예를 들어, 화합물 zVAD-fmk 및 미노사이클린은 둘 다 카스파제 활성을 억제하는데, 마우스에서 질병 징후를 둔화시키는 것으로 밝혀졌다. 약물 레마세미드 또한 작은 HD 인간 실험에 사용되었는데, 그 화합물이 신경 세포에 대한 독성 효과의 발휘를 방지하기 위해 NDMA 수용체에의 돌연변이 Htt의 결합을 방지하는 것으로 여겨졌기 때문이다. 그러나, 이들 실험에서 뉴런 기능에서 통계학적으로 유의미한 개선은 관찰되지 않았다. 또한, 헌팅턴 스터디 그룹 (Huntington Study Group)은 코엔자임 Q를 사용하여 무작위 이중-맹검 연구를 수행하였다. 비록 동향은 코엔자임 Q10으로 치료된 환자들 중에서 더 느린 질병 진전을 향하고는 있지만, 총 기능성 용량의 감소 속도에서 유의할만한 변화는 없었다 (Di Prospero and Fischbeck, 상기 동일). 미국 특허 공보 2011/0082093 및 20130253040은 Htt에 표적화된 뉴클레아제를 개시한다.
게놈 DNA의 표적화된 절단을 위한 다양한 방법 및 조성물이 기술되어 있다. 그런 표적화된 절단 사건들은 예를 들면 표적화된 돌연변이생성을 유도하고, 세포 DNA 서열의 표적화된 결실을 유도하며, 예정된 염색체 유전자좌에서의 표적화된 재조합을 용이하게 하기 위해 사용될 수 있다. 예컨대 미국 특허 번호 8,623,618; 8,034,598; 8,586,526; 6,534,261; 6,599,692; 6,503,717; 6,689,558; 7,067,317; 7,262,054; 7,888,121; 7,972,854; 7,914,796; 7,951,925; 8,110,379; 8,409,861; 미국 특허 공보 번호 20030232410; 20050208489; 20050026157; 20060063231; 20080159996; 201000218264; 20120017290; 20110265198; 20130137104; 20130122591; 20130177983 및 20130177960 및 미국 출원 번호 14/278,903 참조 ( 이것들의 개시내용은 모든 목적에 대해 그것들의 실재에 참조에 의해 포함된다). 이들 방법은 자주 이중 가닥 파괴 (DSB) 또는 표적 DNA 서열에 닉 (nick)을 유도하여서 비-상동성 단부 연합 (NHEJ)과 같은 오류 파생 과정에 의한 파괴의 수복 또는 수복 주형을 사용한 수복 (상동성 지시된 수복 또는 HDR)이 유전자의 녹아웃 또는 관심의 서열의 삽입 (표적화된 통합)이 유발될 수 있도록 하기 위해 엔지니어링된 절단 시스템의 사용을 포함한다. 이 기법은 또한 게놈 영역의 특이적 결실 또는 점 돌연변이 또는 국소화된 변경 (유전자 교정으로서도 알려져 있음)의 도입을 포함하여, 공여 올리고뉴클레오티드의 사용을 통해 부위 특이적 변화를 게놈 서열에 도입하기 위해 사용될 수 있다. 절단은 엔지니어링된 징크 핑거 (zinc finger) 뉴클레아제 (ZFN), 전사-활성화제 유사 이펙터 뉴클레아제 (TALEN)와 같은 특이적인 뉴클레아제의 사용을 통해 또는 엔지니어링된 crRNA/트레이서 RNA ('단일 가이드 RNA')를 가지는 CRISPR/Cas 시스템을 사용하여 일어날 수 있다. 나아가, 표적화된 뉴클레아제가, 게놈 편집 및 유전자 치료법에 사용하기 위한 가능성을 가질 수 있는 Argonaute 시스템 (예컨대 T. thermophilus로부터 유래함, 'TtAgo'로도 알려져 있음, Swarts et al (2014) Nature 507(7491):258-261 참조)을 기초로 개발되고 있다.
엔지니어링된 융합 단백질들이 또한 표적화된 유전자의 발현을 조절하기 위해 개발되었다. 그런 단백질들은 예를 들면 원하는 유전자의 발현을 증강시키거나 억압 (repression)하기 위해 사용될 수 있다 (예컨대 미국 특허 번호 6,534,261; 6,607,882; 6,824,978; 6,933,113; 7,013,219; 7,220,719; 8,268,618; 7,985,778; 8,586,526; 미국 특허 출원 20120294838 참조, 상기의 개시는 모든 목적에 대해 전체 내용이 참조로 포함됨).
그러므로, 헌팅턴병의 치료 및 예방을 위해 이들 전도유망한 기법으로부터 유발될 수 있는 조성물 및 방법에 대한 요구가 존재한다.
발명의 요약
본원에는 헌팅턴병을 치료하기 위한 방법 및 조성물이 개시된다. 특히, 본원에는 헌팅턴병을 치료하기 위하여 HD Htt 대립유전자를 변형 (예컨대 그것의 발현의 조절)시키기 위한 방법 및 조성물이 제공된다. 또한 헌팅턴병의 동물 모델을 제조하기 위한 방법 및 조성물이 제공된다.
그러므로, 한 측면으로, HD 대립유전자 (예컨대 Htt)의 발현을 조절하는 엔지니어링된 DNA 결합 도메인 (예컨대 징크 핑거 단백질, TAL 이펙터 (TALE) 단백질 또는 CRISPR/dCas-TF)이 제공된다. 엔지니어링된 징크 핑거 단백질 또는 TALE는 비-자연적 발생 징크 핑거 또는 그것의 DNA 결합 도메인 (예컨대 인식 나선 또는 RVD)이 사전-선택된 표적 부위에 결합하기 위해 변경되어 있는 (예컨대 선택 및/또는 이론적 디자인에 의해) TALE 단백질이다. 본원에 기술된 징크 핑거 단백질들 중 어느 것이든 1, 2, 3, 4, 5, 6 또는 그 이상의 징크 핑거를 포함할 수 있고, 이때 각각의 징크 핑거는 선택된 서열 (예컨대 유전자(들))에 표적 하위부위에 결합하는 인식 나선을 가지고 있다. 유사하게, 본원에 기술된 TALE 단백질들 중 어느 것이든 어떠한 수의 TALE RVD를 포함할 수 있다. 일부 구체예에서, 적어도 하나의 RVD는 비-특이적 DNA 결합을 가진다. 일부 구체예에서, 적어도 하나의 인식 나선 (또는 RVD)는 비-자연적으로 발생한다. 특정 구체예에서, 징크 핑거 단백질들은 표 1A 및 1B에 나타낸 인식 나선들을 가진다. 다른 구체예에서, 징크 핑거 단백질들은 표 2A 및 2B에 나타낸 표적 서열들에 결합한다. 일부 구체예에서, 징크 핑거 단백질들은 표 2C의 인식 나선들을 포함한다. 특정 구체예에서, 징크 핑거 단백질들은 예를 들면 대상으로의 투여를 위해 약학 조성물로 제형된다.
HD 대립유전자 (예컨대 Htt)의 발현을 조절하는 엔지니어링된 (비-자연적으로 발생하는) CRISPR/Cas 시스템이 또한 제공된다. Cas9 뉴클레아제 도메인은 DNA 절단 활성 ("dCAS")을 잃어버리도록 특이적으로 엔지니어링될 수 있고, 유전자 발현을 조절할 수 있는 기능성 도메인에 융합되어 (Perez-Pimera (2013) Nat Method 10(10):973-976 참조) dCas-TF를 형성한다. dCas-TF에 Htt-특이적 가이드 RNA가 첨가될 때 시스템은 Htt 유전자 발현을 조절한다.
한 측면으로, 전체적으로 또는 부분적으로 Htt의 CAG 반복 영역 밖에 있는 서열들에 결합하는 억제제들 (ZFP-TF, CRISPR/dCas-TF 또는 TALE-TF)이 제공된다. 다른 측면으로, Htt의 CAG 반복 영역 내에 있는 서열들에 결합하는 ZFP, Cas 또는 TALE 억제제들 (ZFP-TF, CRISPR/dCas-TF 또는 TALE-TF)이 제공된다. 일부 구체예에서, 이들 ZFP-TF, CRISPR/dCas 또는 TALE-TF는 우선적으로 야생형 길이의 반복 트랙트에 대해 확장된 트라이뉴클레오티드 트랙트에 결합하고, 그로써 확장된 대립유전자의 바람직한 억압을 이룬다. 일부 구체예에서, 이들 ZFP-TF, CRISPR/dCas-TF 또는 TALE-TF는 DNA에 결합될 때 다량체화를 허용하는 단백질 상호작용 도메인 (또는 "이량체화 도메인")을 포함한다. 일부 구체예에서, 이들 ZFP-TF, CRISPR/dCas-Ts 또는 TALE TF는 반복 서열에 대해 협조적인 DNA 결합을 이룸으로써 확장된 대립유전자가 야생형 대립유전자보다 더 많은 수의 ZFP, dCas 또는 TALE 단백질들에 의해 효율적으로 결합되어 돌연변이 대립유전자의 바람직한 억압이 가능해진다. 이들 협조적인 결합 ZFP-TF, CRISPR/dCas-TFs 또는 TALE TF는 DNA에 결합될 때 다량체화를 허용하는 단백질 상호작용 도메인을 추가로 함유하거나 함유하지 않을 수 있다. 일부 구체예에서, ZFP TF, CRISPR/dCas-TF 또는 TALE TF는 주어진 크기의 다량체들의 안정한 복합체를 형성하고, 그러므로 특정 최소 크기 이상의 야생형 CAG 트랙트와 바람직하게 상호작용할 수 있으며, 이때 그 최소 크기는 야생형 CAG 트랙트의 길이보다 크다.
특정 구체예에서, 본원에 기술된 ZFP, CRISPR/dCas-TF 또는 TALE 단백질들 (예컨대 양손의, 다량체화하는 등)은 우선적으로 돌연변이 Htt 대립유전자의 발현을 변형시킨다. 일부 구체예에서, ZFP, CRISPR/dCas-TF 또는 TALE는 확장된 트랙트가 폴리-글루타민을 코드화하는 돌연변이 Htt 대립유전자에 특이적으로 결합하는 한편, 다른 구체예에서, ZFP, CRISPR/dCas-TF 또는 TALE는 확장된 트랙트가 폴리-세린을 코드화하는 돌연변이 Htt 대립유전자에 특이적으로 결합한다. 그러므로 일부 구체예에서, ZFP-TF, CRISPR/dCas-TF 또는 TALE-TF는 Htt 대립유전자의 야생형 및 돌연변이 형태 둘 다를 조절한다. 특정 구체예에서, ZFP, CRISPR/dCas-TF 또는TALE는 야생형 Htt 대립유전자만을 조절한다. 다른 구체예에서, ZFP, CRISPR/dCas-TF 또는 TALE는 Htt의 돌연변이 형태만을 조절한다.
다른 구체예에서, 확장된 HD Htt 대립유전자와 관련된 공지의 SNP에 우선적으로 결합하는 억압 ZFP-TF, CRISPR/dCas-TF 또는 TALE-TF가 제공된다. 이 방법에서, ZFP-TF, CRISPR/dCas-TF 또는 TALE-TF는 SNP를 함유하는 돌연변이 Htt 대립유전자에 대해 특이적이어서 돌연변이 Htt 대립유전자의 특이적인 억압을 허용한다. 다른 측면으로, 야생형 대립유전자와 관련된 SNP와 상호작용함으로써 야생형 Htt 대립유전자를 특이적으로 활성화시키는 ZFP-TF, CRISPR/dCas-TF 또는 TALE-TF가 제공된다. 이 방법에서는 야생형 Htt 대립유전자만이 활성화된다.
특정 구체예에서, 본원에 기술된 징크 핑거 단백질 (ZFP), dCas 또는 TALE 단백질들은 융합 단백질의 일부로서 조절 도메인 (또는 기능성 도메인)과 작동가능한 연쇄에 위치할 수 있다. 기능성 도메인은 예를 들면, 전사 활성화 도메인, 전사 억압 도메인 및/또는 뉴클레아제 (절단) 도메인일 수 있다. ZFP, dCas 또는 TALE와의 융합을 위한 활성화 도메인 또는 억압 도메인 중 어느 하나를 선택함으로써, 그런 융합 단백질은 유전자 발현을 활성화시키거나 억압하기 위해 사용될 수 있다. 일부 구체예에서, 돌연변이 Htt 발현을 하향-조절하기 위해 사용될 수 있는 전사 억압 도메인에 융합된, 본원에서 기술된 돌연변이 Htt에 대해 표적화된 ZFP, dCas 또는 TALE를 포함하는 융합 단백질이 제공된다. 일부 구체예에서, 야생형 Htt 대립유전자를 상향-조절할 수 있는 전사 활성화 도메인에 융합된 야생형 Htt 대립유전자에 대해 표적화된 ZFP, dCas 또는 TALE를 포함하는 융합 단백질이 제공된다. 특정 구체예에서, 조절 도메인의 활성은 내인성 작은 분자 또는 리간드에 의해 조절되어서 세포의 전사 기구 (machinery)와의 상호작용은 외인성 리간드의 부재시에는 일어나지 않을 것이다. 그런 외부 리간드는 ZFP-TF, CRISPR/dCas-TF 또는 TALE-TF의 전사 기구와의 상호작용 정도를 제어한다. 조절 도메인(들)은 하나 또는 그 이상의 ZFP, dCas 또는 TALE 및 그것들의 어떠한 조합의 외부에서, 하나 또는 그 이상의 ZFP, dCas 또는 TALE 사이를 포함하여, ZFP, dCas 또는 TALE 중 하나 또는 그 이상의 어떠한 부분(들)에 작용가능하게 연결될 수 있다. 본원에 기술된 융합 단백질 중 어느 것이든지 약학 조성물로 제형될 수 있다.
일부 구체예에서, 본원에 기술된 엔지니어링된 DNA 결합 도메인들은 융합 단백질의 일부로서 뉴클레아제 (절단) 도메인과의 작동할 수 있는 연쇄에 위치할 수 있다. 일부 구체예에서, 뉴클레아제는 Ttago 뉴클레아제를 포함한다. 다른 구체예에서, CRISPR/Cas 시스템과 같은 뉴클레아제 시스템은 DNA에서 표적 위치에 뉴클레아제를 표적화하기 위해 특이적인 단일 가이드 RNA와 함께 활용될 수 있다. 특정 구체예에서, 그런 뉴클레아제 및 뉴클레아제 융합은 유도된 다능 줄기 세포 (iPSC), 인간 배아 줄기 세포 (hESC), 간엽성 줄기 세포 (MSC) 또는 뉴런성 줄기 세포와 같은 줄기 세포들에 돌연변이 Htt 대립유전자를 표적화하기 위해 활용될 수 있고, 이때 뉴클레아제 융합의 활성은 야생형 수의 CAG 반복을 함유하고 있는 Htt 대립유전자를 초래할 것이다. 특정 구체예에서, 변형된 줄기 세포를 포함하는 약학 조성물이 제공된다.
또 다른 측면으로, 본원에 기술된 DNA 결합 단백질들 중 어느 것을 코드화하는 폴리뉴클레오티드가 제공된다. 또 다른 측면으로, CRIPSR/Cas 뉴클레아제 및 단일 가이드 RNA를 코드화하는 폴리뉴클레오티드들이 제공된다. 그런 폴리뉴클레오티드들은 헌팅턴병을 치료하는 것이 바람직한 대상에게 투여될 수 있다.
또 다른 측면으로, 발명은 헌팅턴병의 연구를 위한 특이적인 모델 시스템의 생성을 위한 방법 및 조성물을 제공한다. 특정 구체예에서, 본원에는 특이한 길이 (예를 들면 50, 80, 109 및 180 CAG 반복)의 트라이뉴클레오티드 확장 트랙트가 징크 핑거 뉴클레아제 (ZFN), TALE-뉴클레아제 (TALEN), Ttago 또는 CRISPR/Cas 뉴클레아제 구동된(drived) 표적화된 통합을 사용하여 야생형 Htt 대립유전자에 삽입되어 있는 세포 및 동물 라인을 생성하기 위해 돌연변이 Htt 대립유전자가 배아 줄기 세포를 사용하여 생성되는 모델이 제공된다. 특정 구체예에서, 모델 시스템은 시험관 내 셀라인을 포함하는 한편, 다른 구체예에서 모델 시스템은 유전자 도입 동물들을 포함한다. 본원에 기술된 어떠한 동물 모델에서, 동물은 예를 들면 설치류 (예컨대 래트, 마우스), 영장류 (예컨대 비-인간 영장류) 또는 토끼일 수 있다. 그러므로, 발명은 또한 HD에 관련된 내인성 유전자가 예를 들면 세포의 유전자의 야생형 서열에 비교하여 변형되어 있는 세포 또는 셀라인을 포함한다. 그 세포 또는 셀라인은 변형에 대해 이형접합성이거나 동형접합성일 수 있다. 변형은 삽입, 결실 및/또는 그것의 조합을 포함할 수 있다. 특정 구체예에서, 유전자 (예컨대 Htt)는 뉴클레아제 (예컨대 ZFN, TALEN, CRISPR/Cas 시스템, Ttago 시스템 등)에 의해 변형된다. 특정 구체예에서, 변형은 예를 들면 절단 부위(들)의 상류 또는 하류로 1 내지 300 염기쌍 내에서 뉴클레아제(들) 결합 및/또는 절단 부위(들)에서 또는 가까이에서, 보다 바람직하게 결합 및/또는 절단 부위(들)의 어느 한쪽의 1 내지 100 염기쌍 (또는 그 사이의 어떠한 값) 내에서, 보다 더 바람직하게 결합 및/또는 절단 부위(들)의 어느 한쪽의 1 내지 50 염기쌍 (또는 그 사이의 어떠한 값) 내에서 일어난다.
다른 측면으로, 발명은 공여자 핵산의 표적 세포로의 전달을 포함한다. 공여자는 핵산이 뉴클레아제(들)을 코드화하기 전에, 후에 또는 뉴클레아제(들)을 코드화하는 핵산과 함께 전달될 수 있다. 공여자 핵산은 세포의 게놈 안으로 통합될 외인성 서열 (이식유전자), 예를 들면 외인성 유전자좌를 포함할 수 있다. 일부 구체예에서, 공여자는 표적화된 절단 부위와의 상동성 영역이 양옆에 있는 전 길이 유전자 또는 그것의 단편을 포함할 수 있다. 일부 구체예에서, 공여자는 상동성 영역이 없고 상동성과 무관한 메커니즘 (즉 NHEJ)을 통해 표적 유전자좌 안으로 통합된다. 공여자는 어떠한 핵산 서열, 예를 들면 뉴클레아제-유도된 이중-가닥 파괴의 상동성-지시된 수복에 대한 기질로서 사용될 때 내인성 염색체 유전자좌에서 공여자-특이적인 결실이 생성되도록 유도하거나, 다르게는 (또는 또한) 내인성 유전자좌의 신규한 대립유전자 형태 (예컨대 전사 인자 결합 부위를 제거하는 점 돌연변이)가 생성되도록 유도하는 핵산을 포함할 수 있다. 일부 구체예에서, 공여자 핵산은 통합이 유전자 교정 사건 또는 표적화된 결실을 유도하는 올리고뉴클레오티드이다.
일부 구체예에서, DNA 결합 단백질을 코드화하는 폴리뉴클레오티드는 mRNA이다. 일부 측면으로, mRNA는 화학적으로 변형될 수 있다 (예컨대 Kormann et al, (2011) Nature Biotechnology 29(2):154-157 참조). 다른 측면으로, mRNA는 ARCA cap을 포함할 수 있다 (미국 특허 번호 7,074,596 및 8,153,773 참조). 추가의 구체예에서, mRNA는 미변형 뉴클레오티드와 변형된 뉴클레오티드의 혼합물을 포함할 수 있다 (미국 특허 공보 2012-0195936).
또 다른 측면으로, 본원에 기술된 폴리뉴크레오티드들 중 어느 것이든 포함하는 유전자 전달 벡터가 제공된다. 특정 구체예에서, 벡터는 아데노바이러스 벡터 (예컨대 Ad5/F35 벡터), 통합 경합 또는 통합-결함 렌티바이러스 벡터를 포함하는 렌티바이러스 벡터 (LV) 또는 아데노바이러스 관련 바이러스 벡터 (AAV)이다. 특정 구체예에서, AAV 벡터는 AAV6 벡터이다. 그러므로, 또한 본원에는 적어도 하나의 뉴클레아제 (ZFN 또는 TALEN) 및/또는 표적 유전자 안으로의 표적화된 통합에 대한 공여자 서열을 코드화하는 서열을 포함하는 아데노바이러스 (Ad) 벡터, LV 또는 아데노바이러스 관련 바이러스 벡터 (AAV)가 제공된다. 특정 구체예에서, Ad 벡터는 키메라 Ad 벡터, 예를 들면 Ad5/F35 벡터이다. 특정 구체예에서, 렌티바이러스 벡터는 통합-결함 렌티바이러스 벡터 (IDLV) 또는 통합 경합 렌티바이러스 벡터이다. 특정 구체예에서 벡터는 VSV-G 외피 또는 다른 외피로 위(pseudo)-유형화된다.
일부 구체예에서, 표적 대립유전자 (예컨대 돌연변이 Htt)가 발현 마커로 태그되어 있는 헌팅턴병에 대한 모델 시스템이 제공된다. 특정 구체예에서, 돌연변이 대립유전자 (예컨대 돌연변이 Htt)가 태그된다. 일부 구체예에서, 야생형 대립유전자 (예컨대 야생형 Htt)가 태그되고, 추가의 구체예에서, 야생형과 돌연변이 대립유전자 둘 다 별도의 발현 마커로 태그된다. 특정 구체예에서, 모델 시스템은 시험관 내 셀라인을 포함하는 한편 다른 구체예에서, 모델 시스템은 유전자도입 동물을 포함한다.
추가로, 핵산 및/또는 단백질 (예컨대 ZFP, Cas 또는 TALE 또는 ZFP, Cas 또는 TALE를 포함하는 융합 단백질)을 포함하는 약학 조성물이 또한 제공된다. 예를 들어, 특정 조성물은 약학적으로 허용되는 담체 또는 희석제와 조합된, 조절 서열에 작용가능하게 연결되어 있는, 본원에 기술된 ZFP, Cas 또는 TALE 중 하나를 코드화하는 서열을 포함하는 핵산을 포함하고, 이때 조절 서열은 세포에서 핵산의 발현을 허용한다. 특정 구체예에서, 코드화된 ZFP, CRISPR/Cas 또는 TALE는 HD Htt 대립유전자에 대해 특이적이다. 일부 구체예에서, 약학 조성물은 HD Htt 대립유전자를 조절하는 ZFP, CRISPR/Cas 또는 TALE 및 신경 영양 인자를 조절하는 ZFP, CRISPR/Cas 또는 TALE를 포함한다. 단백질 기초 조성물은 본원에 기술된 하나 또는 그 이상의 ZFP, CRISPR/Cas 또는 TALE 및 약학적으로 허용되는 담체 또는 희석제를 포함한다.
또 다른 측면으로 또한 본원에 기술된 단백질, 폴리뉴클레오티드 및/또는 조성물 중 어느 것을 포함하는 분리된 세포가 제공된다.
다른 측면으로, 본원에는 본원에 기술된 방법 및 조성물을 사용하여 헌팅턴병을 치료하거나 및/또는 예방하기 위한 방법이 제공된다. 일부 구체예에서, 폴리뉴클레오티드 및/또는 단백질이 바이러스 벡터, 비-바이러스 벡터 (예컨대 플라스미드) 및/또는 그것들의 조합을 사용하여 전달될 수 있는 조성물을 포함한다. 일부 구체예에서, 방법은 ZFP 또는 TALE을 포함하는, 또는 발명의 ZFN, TALEN, Ttago 또는 CRISPR/Cas 뉴클레아제 시스템으로 변경된 줄기 세포 집단을 포함하는 조성물을 포함한다.
일부 구체예에서, 발명의 방법 및 조성물은 중간 가시 뉴런에서 특정 유전자들의 발현을 정상화하거나 및/또는 변형시키기 위하여 사용된다. 예를 들어, 일부 구체예에서, 방법은 헌팅턴병에 걸린 대상의 치료 또는 예방을 위해 그것들에 한정되는 것은 아니지만 DARPP-32A, PDE10a, Drd1 및/또는 Drd2를 포함하여 HD에 관련된 하나 또는 그 이상의 생체마커의 발현을 변경시키는 유전자 리프레서의 사용을 포함하거나 및/또는 조성물은 그런 유전자 리프레서이다. 일부 구체예에서, 유전자 리프레서는 헌팅틴 단백질의 발현을 억제하는 작은 분자, 핵산 또는 단백질이다. 일부 구체예에서, 유전자 리프레서는 게놈 DNA 또는 예컨대 mRNA와 같은 전사물 형태의 헌팅틴 유전자에 특이적으로 결합한다. 일부 구체예에서, 유전자 리프레서는 외인성이고 및/또는 자연적으로 발생하지 않는 화학적 변형 및/또는 서열 변형을 포함한다. 특정 구체예에서, 유전자 리프레서는 게놈의 다른 유전자들에의 결합에 비해 헌팅틴 유전자의 코딩 및/또는 비-코팅 부분에 특이적으로 결합하는 ZFP, TALE 또는 Cas DNA 결합 도메인이다. 다른 특정 구체예에서, 유전자 리프레서는 전사물 형태, 예컨대 mRNA 형태의 헌팅틴 유전자의 코딩 및/또는 비-코팅 부분에 상응하는 서열에 대해 100%, 또는 적어도 90%, 또는 적어도 80%, 또는 적어도 70%, 또는 적어도 60% 동일한 서열을 포함하는 안티센스 핵산이다. 유전자 리프레서에 특이적으로 결합하는 헌팅틴 유전자의 부분은 적어도 8, 적어도 10, 적어도 12, 적어도 15, 적어도 18, 적어도 20, 적어도 22, 적어도 25, 적어도 30, 적어도 35 및/또는 적어도 40 뉴클레오티드 또는 그 이상의 길이일 수 있다.
본원에 기술된 일부 구체예에서, 예컨대 대상의 치료를 위한 또는 유전자 리프레서의 시험을 위한 유전자 리프레서의 사용은 미처리 대조표준에 비해 DARPP-32A, PDE10a, Drd1 및/또는 Drd2 중 하나 또는 그 이상의 증가된 발현을 초래한다. 미처리 대조표준은 유전자 리프레서를 수용하지 않는데, 예를 들면 미처리 대상 또는 미처리 대조 세포, 예컨대 MSN이다. 일부 측면으로, DARPP-32의 발현은 미처리 대조표준 (예컨대 미처리 대상 또는 미처리 MSN 세포)에 비해 MSN에서 증가된다 (예를 들면 10% 이상 증가되거나, 20% 이상 증가되거나, 30% 이상 증가되거나, 40% 이상 증가되거나, 50% 이상 증가되거나, 60% 이상 증가되거나, 70% 이상 증가되거나, 80% 이상 증가되거나, 90% 이상 증가되거나, 100% 이상 증가되거나, 125% 이상 증가되거나, 150% 이상 증가되거나, 175% 이상 증가되거나 및/또는 200% 이상 증가되거나, 또는 그 사이에 있는 어떠한 값만큼 증가됨). 다른 측면으로, PDE10a의 수준은 미처리 대조표준 (예컨대 미처리 대상 또는 미처리 MSN 세포)에 비하여 MSN에서 증가된다 (예를 들면 10% 이상 증가되거나, 20% 이상 증가되거나, 30% 이상 증가되거나, 40% 이상 증가되거나, 50% 이상 증가되거나, 60% 이상 증가되거나, 70% 이상 증가되거나, 80% 이상 증가되거나, 90% 이상 증가되거나, 100% 이상 증가되거나, 125% 이상 증가되거나, 150% 이상 증가되거나, 175% 이상 증가되거나 및/또는 200% 이상 증가되거나, 또는 그 사이에 있는 어떠한 값만큼 증가됨). 또 추가의 측면으로, 도파민 수용체 Drd1 및/또는 Drd2의 수준은 미처리 대조표준 (예컨대 미처리 대상 또는 미처리 MSN 세포)에 비하여 MSN에서 증가된다 (예를 들면 10% 이상 증가되거나, 20% 이상 증가되거나, 30% 이상 증가되거나, 40% 이상 증가되거나, 50% 이상 증가되거나, 60% 이상 증가되거나, 70% 이상 증가되거나, 80% 이상 증가되거나, 90% 이상 증가되거나, 100% 이상 증가되거나, 125% 이상 증가되거나, 150% 이상 증가되거나, 175% 이상 증가되거나 및/또는 200% 이상 증가되거나, 또는 그 사이에 있는 어떠한 값만큼 증가됨). 일부 측면으로, DARPP-32A, PDE10a, Drd1 및 Drd2의 어떠한 조합, 예를 들면 둘 또는 그 이상의 조합의 수준은 두 가지가 DARP32A 및 PDE10a, 또는 DARP32A 및 Drd1인 경우에 또는 어떠한 그런 조합인 경우에 증가된다. 다른 측면으로, DARPP-32A, PDE10a, Drd1 및 Drd2 중 어떠한 3가지의 수준은 증가되는 한편, 다른 측면으로, DARPP-32A, PDE10a, Drd1 및 Drd2의 수준은 모두 미처리 대조표준 (예컨대 미처리 대상 또는 미처리 MSN 세포)에 비하여 증가된다.
일부 구체예에서, 발명의 방법 및 조성물은 HD에 걸린 대상 (예컨대 동물 모델)에서 움켜쥐기 행동을 정상화하기 위해 사용된다. 예를 들어, 일부 측면으로, 예컨대 대상의 치료를 위한 또는 유전자 리프레서의 시험을 위한 유전자 리프레서의 사용은 미처리 대상에 비해 처리된 대상 또는 동물 모델에서 감소된 움켜쥐기를 초래할 수 있다. 일부 측면에서, 모델은 HD R6/2 마우스 모델이다. 일부 측면으로, 움켜쥐는 행동은 10% 이상 감소되거나, 20% 이상 감소되거나, 30% 이상 감소되거나, 40% 이상 감소되거나, 50% 이상 감소되거나, 60% 이상 감소되거나, 70% 이상 감소되거나, 80% 이상 감소되거나, 90% 이상 감소되거나 또는 100% 이상 감소되거나, 또는 그 사이에 있는 어떠한 값만큼 감소된다. 일부 측면으로, 움켜쥐기 감소는 동물 출생 후 7주 이내, 8주 이내, 9주 이내, 10주 이내, 11주 이내 또는 12주 이내에 있거나 및/또는 유전자 리프레서로 처리하고 2주 이내, 3주 이내, 4주 이내, 5주 이내, 6주 이내 또는 7주 이내에 있는 동물을 시험하고 30초 이내에 관찰될 수 있다.
이들 및 다른 측면들은 전체적인 개시 내용에서 숙련자에게 쉽게 드러날 것이다.
도 1a 내지 1e는 야생형 및 돌연변이 (헌팅턴병, HD) 헌팅틴 (Htt) 대립유전자 및 그런 대립유전자에 대한 다양한 ZFP-TF 결합을 나타내는 개략도이다. 도 1a는 CAG 반복 밖에서 결합하고, 그러므로 야생형 및 돌연변이 (HD) 대립유전자에 동등하게 결합하는 것으로 예측되는 ZFP 디자인을 도시한다. "KRAB"은 KOX1 유전자로부터의 KRAB 억압 도메인을 나타내고 "ZFP"는 징크 핑거 DNA 결합 단백질을 나타낸다. "표준 ZFP TF"는 징크 핑거 DNA 결합 도메인들이 KRAB 억압 도메인에 연결되어 있는 ZFP 전사 인자 융합 단백질이다. 도 1b는 CAG 영역 내에서 결합하도록 디자인된 ZFP-TF를 도시한다. 도 1c는 징크 핑거 도메인의 두 개의 클러스터가 견고한 단백질 서열에 의해 분리되는 ZFP 전사 인자인 "양손 ZFP TF"를 도시한다. 기능성 (억압) 도메인은 이 도면에서 하나의 ZFP 외부에 있는 것으로 도시되지만, 기능성 도메인은 단백질의 어느 한 쪽에 있는 ZFP들 사이에 또는 ZFP 외부에 있을 수 있다. 도 1d는 다량체화 도메인 (작은 반점들이 있는 박스로 표시됨)을 통해 다량체화할 수 있는 "다량체화 ZFP TF"를 도시한다. 도 1e는 2개의 징크 핑거 DNA 결합 도메인이 가요성 링커에 의해 연결되고 또한 KRAB 도메인에 융합된 ZFP-ZFP-KRAB 형태를 도시한다. 모든 융합 단백질에서, 기능성 도메인은 DNA 결합 도메인의 어느 한 단부상에 있을 수 있다는 것과, DNA 결합 도메인은 광범위한 수의 징크 핑거를 포함할 수 있다는 것이 숙련된 기술자들에게 명백할 것이다. 또한 도 1에는 검은색 다이아몬드가 있는 박스로서 기능성 도메인 (예컨대 활성화, 억압, 절단 도메인)이 되된다. 숙련된 기술자들에게 도면에 제시된 예시적인 모델은 또한 TALE TF에도 적용될 수 있다는 것이 명백할 것이다.
도 2a 내지 2e는 CAG 반복 서열에 결합하지 않는 ZFP TF를 사용하여 도 1a에 기술된 것과 같은 ZFP에 의해 Htt의 둘 다의 대립유전자를 억압하는 것을 도시한다. 도 1a 및 1b에 도시된 것과 같은 ZFP 확인 번호는 막대 아래에 표시된다. 도 2a는 인간 유전자의 5개의 유전자좌에 대해 표적화된 ZFP를 사용하여 HEK293 세포에서의 인간 Htt 대립유전자의 억압을 도시한다. 인간 Htt 유전자의 다이아그램이 도시되고 ZFP 결합 부위들의 위치가 도시된다. 각각의 ZFP 그룹에 대해, 각각의 막대는 독립적인 트랜스펙션 (transfection)을 나타낸다. 도 2b는 GFP 대조표준 또는 18856 ZFP TF 리프레서 (KOX1의 KRAB 억압 도메인을 포함함)로 트랜스펙션된 HEK293 세포의 Htt 단백질 수준을 보여주는 웨스턴 블롯을 도시하고, 도면에서 NFB p65 수준 ("p65")이 동등한 단백질 로딩을 확인하기 위해 사용되었다. 웨스턴 블롯은 ZFP-TF에 의한 Htt 발현의 억압을 확인한다. 도 2c는 Neuro2A 세포에서 마우스 Htt 특이적 ZFP에 대한 도 2a와 유사한 세트의 데이터를 도시한다. 도 2a에서와 같이, 마우스 Htt 유전자의 다이아그램이 도시되고 ZFP 결합 부위의 위치가 표시된다. 도 2d 및 2e는 불멸화된 선조 세포에서의 마우스 Htt 유전자 발현 (RNA)의 억압을 증명하는데, 이때 상이한 용량의 ZFP-TF mRNA가 트랜스펙션에 사용되었다. 도 2b를 제외한 모든 경우에, Htt mRNA 수준은 실시간 RT-PCR에 의해 측정되었고 액틴 mRNA의 수준에 대해 표준화되었다.
도 3a 내지 3g는 도 1b에 예시된 것과 같은, CAG 반복 영역 내의 ZFP 결합을 사용함에 의한 돌연변이 Htt의 선택적 억압을 도시한다. 이 모델은 돌연변이 대립유전자의 더 긴 CAG 반복 영역이 CAG-표적화된 ZFP 리프레서 분자의 증가된 결합을 허용하는 것을 예시한다. 도 3a는 HEK293 세포에서 CAG-표적화된 ZFP에 의한 내인성 Htt 유전자 (정상적인 CAG 반복 길이를 가짐)에 대한 상이한 리프레서 활성을 도시한다. 도 3b는 10 내지 47 CAG 반복의 범위인, 달라지는 길이의 CAG 반복을 함유하는 Htt 프로모터/엑손1 단편들에 의해 조절된 루시페라제 리포터의 억압을 도시한다. CAG10 (2개의 표시된 조건의 각각에 대해 좌측-바깥쪽 막대)은 10개의 CAG 반복으로 얻어진 결과를 나타내고; CAG17 (2개의 표시된 조건의 각각에 대해 좌측으로부터 두 번째 막대)은 17개의 CAG 반복으로 얻어진 결과를 나타내며; CAG23 (2개의 표시된 조건의 각각에 대해 우측으로부터 두 번째 막대)은 23개의 CAG 반복으로 얻어진 결과를 나타내고; CAG47 (2개의 표시된 조건의 각각에 대해 우측-바깥쪽 막대)은 47개의 CAG 반복으로 얻어진 결과를 나타낸다. 그래프 위의 개략도는 이 시스템에 사용된 Htt 프로모터, 엑손 1, CAG 반복 및 리포터 루시퍼라제 유전자의 배열을 나타낸다. 데이터는 CAG의 수의 증가가 CAG-표적화된 ZFP에 의한 Htt 프로모터로부터의 발현의 감소를 유도하는 것을 증명한다. 나아가, 도 3c는 상대적으로 약한 CAG-표적화된 ZFP가 강력한 CAG 리프레서뿐 아니라 정상적인 길이의 CAG 반복을 함유하는 루시페라제 리포터를 억압하지 않는 한편으로, 시험된 모든 용량에서 강력한 CAG-표적화된 ZFP로서 확장된 CAG 반복을 함유하는 루시페라제 리포터의 유사한 억압을 유도하는 것을 증명한다. "pRL-Htt-CAG23-인트론 1" (각 쌍의 좌측 막대)은 야생형 대립유전자로부터의 발현에 상응하는 한편, "pRL-HttCAG47-인트론 1" (각 쌍의 우측 막대)은 돌연변이 확장 Htt 대립유전자 (47개의 CAG 반복을 함유함)로부터의 발현과 상관된다. 도 3d는 HdH(Q111/Q7) 녹-인 마우스로부터 유도된 불멸화된 마우스 선조 세포에서 CAG-표적화된 ZFP에 의한 돌연변이 Htt (111개의 CAG)의 억압을 도시하는 그래프이다. 야생형 발현은 각 쌍의 좌측 막대에 도시되고 녹-인 발현은 각 쌍의 우측 막대에 도시된다. KRAB 억압 도메인에 융합된 명시된 ZFP를 포함하고 있는 ZFP-TF는 트랜스펙션에서 ZFP mRNA의 상이한 3가지의 농도를 사용하여 시험되었다. 도 3e는 HD 환자 유도된 섬유하세포 라인 (CAG15/70)에서 CAG-표적화된 ZFP에 의한 돌연변이 Htt 억압을 도시한다. 이 섬유아세포 라인에서, 야생형 Htt 대립유전자는 15개의 CAG 반복 ("099T(CAG15)", 각각의 표시된 조건의 중간 막대)을 포함하고, 돌연변이 확장 Htt 대립유전자는 70개의 CAG 반복 ("099C(CAG70)", 각각의 표시된 조건의 우측 막대)을 포함한다. 도 3f는 4개의 상이한 HD 환자 유도된 섬유아세포 셀라인에서의 돌연변이 Htt 발현의 선택적 억압을 도시한다. 각 그룹 위의 숫자는 야생형 Htt 대립유전자 (예컨대 15 또는 18) 및 돌연변이 대립유전자 (예컨대 70, 67, 45 및 44)에 대한 CAG 반복의 수를 나타내고; 이때 2가지 상이한 용량의 ZFP mRNA가 시험되었다. 각 쌍의 좌측 막대는 야생형 Htt 발현을 나타내고 각 쌍의 우측 막대는 돌연변이 Htt의 발현을 나타낸다. 도 3g는 ZFP-TFs 30640, 32528 및 30657의 존재 하에 웨스턴 블롯 분석에 의해 분석된 HD 유도된 환자 섬유아세포에서의 Htt 발현을 도시한다. 더 느리게 이동하는 단백질 밴드는 확장된 돌연변이 Htt 대립유전자에 의해 생성된 것들이다. 32528은 Htt의 전사 출발 부위 (TSS)에 결합하고 그로써 둘 다의 대립유전자로부터의 발현을 억제하는 한편, 30640 및 30657은 CAG 반복에 결합한다 (CAG).
도 4a 및 4b는 CAG 반복에 대해 표적화된 ZFP의 패널에 의한 HD 환자 유도된 섬유아세포 라인에서의 돌연변이 Htt의 억압을 도시한다. RNA 농도 범위는 0.1 ng 내지 3 μg의 범위로 사용되었다. 도 4a 및 4b에서, 각각의 표시된 조건의 좌측 막대는 총 Htt 발현을 나타내고, 중간 막대는 섬유아세포에서의 Htt의 억압을 나타내며 이때 Htt 대립유전자는 18개의 CAG 반복을 포함하고 ("099T(CAG18)") 돌연변이 확장 Htt 대립유전자는 45개의 CAG 반복을 포함한다(099T (CAG45)).
도 5는 HD 환자-유도된 섬유아세포에서 Htt 및 다른 CAG-함유 유전자의 발현에 미치는 CAG-표적화된 ZFP 리프레서의 효과를 도시한다. 각각의 표시된 조건 아래의 좌측 막대는 30640으로 얻어진 결과를 나타내고; 각각의 표시된 조건 아래의 중간 막대는 30675로 얻어진 결과를 나타내며; 우측 막대는 mock 트랜스펙션을 나타낸다.
도 6a 및 6b는 3개의 CAG-표적화된 ZFP의 게놈-광범위 특이성을 조사하는 실험을 도시한다. 도 6a는 30640, 30645 또는 33074를 사용하여 HD 섬유아세포 (CAG18 (중간 막대)/ CAG45 (우측 막대))의 6개의 생물학적 복제물 (6개의 별도의 트랜스펙션)에 대해 수행된 Htt 억압의 qPCR 분석을 도시한다. 그런 다음 qPCR에 의해 4개의 가장 유사한 복제물이 마이크로어레이 분석을 위해 선택되었고, 데이터는 도 6b에 제공된다.
도 7은 CAG17/69 뉴런 줄기 세포 (NSC)에서의 Htt 억압을 도시한다. 세포들은 표시된 용량의 ZFP mRNA로 트랜스펙션되었다. 각각의 표시된 용량 아래의 좌측 막대는 CAG17 세포에서의 결과를 나타내고, 중간 막대는 야생형 세포에서의 결과를 나타내며, 우측 막대는 CAG69 세포에서의 결과를 나타낸다.
도 8은 ZFP TF로 처리된 HD 배아 줄기 세포 (ESC) (CAG 17/48)로부터 분화된 뉴런에서의 Htt 억압을 도시한다. 세포들은 표시된 용량의 ZFP mRNA로 트랜스펙션되었다.
도 9는 ZFP TF 30640으로의 처리 후에 R6/2 마우스에서의 돌연변이 Htt 이식유전자 발현의 억압을 도시한다.
도 10a 내지 10d는 도 1d에 도시된 것과 같은, 확장된 CAG 반복을 특이적으로 표적화하는 다량체화 도메인을 가지는 ZFP를 도시한다. 도 10a는 4개의 성분: (i) KOX 리프레서 도메인 ("리프레서"로 표시된 타원형); (ii) (CAG)N 또는 이 서열의 과돌연변이에 결합하는 2 내지 6 핑거의 어레이 (2개가 도시됨, "Z"로 표시된 작은 타원형); 및 (iii) 역평행 형태로 상호작용하는 2개의 이량체화 도메인 ("d1" 및 "d2"로 표시된 사각형)을 가지는 단일 ZFP를 도시한다. 이들 도메인은 CAG 트랙트의 주요 홈 내에서 ZFP가 중합되는 것을 허용한다. 도 10b는 3개의 ZFP의 다량체로 결합 사건이 일어나는 것을 개략적으로 도시한다. 어떠한 수의 다량체이든 사용될 수 있고 기능성 도메인은 하나 또는 그 이상의 개별적인 ZFP상의 어느 곳에든지 위치할 수 있으며 이들 다이아그램은 TALE-TF에도 적용될 수 있다는 것이 명백할 것이다. 도 10c는 이량체화 징크 핑거 (DZ)들 사이의 상호작용을 통해 다량체화하도록 디자인된 4개의 ZFP 단량체 스캐폴드의 단백질 서열을 도시한다. 스캐폴드는 DZ1 (SEQ ID NO:180), DZ2 (SEQ ID NO:181), DZ3 (SEQ ID NO:182) 및 DZ4 (SEQ ID NO:183)로 명명된다. 이량체화 징크 핑거 도메인은 밑줄이 그어져 있는 한편, 억압 도메인 및 핵 정위 서열은 (각각) 굵은 밑줄 및 이탤릭체로 표시된다. 도 10d는 코일형-코일 (CC) 사이의 상호작용을 통해 다량체화하도록 디자인된 7개의 ZFP 단량체 스캐폴드의 단백질 서열을 도시한다. 스캐폴드는 CC1 (SEQ ID NO:184), CC2 (SEQ ID NO:185), CC3 (SEQ ID NO:186), CC4 (SEQ ID NO:187), CC5 (SEQ ID NO:188), CC6 (SEQ ID NO:189) 및 CC7 (SEQ ID NO:190)로 명명된다. 코일형-코일 서열은 밑줄이 그어져 있는 한편, 억압 도메인 및 핵 정위 서열은 (각각) 굵은 밑줄 및 이탤릭체로 표시된다. 디자인마다 다를 수 있을, 각각의 스캐폴드의 ZFP 영역의 위치는 "[ZFP]"로 표시된다. 디자인마다 다를 수 있을, 각각의 스캐폴드의 (DNA-결합) ZFP 영역의 위치는 "[ZFP]"로 표시된다.
도 11a 및 11b는 이량체화 도메인을 가지는 ZFP-TF의 활성을 도시한다. 도 11a에서, "코일형 코일" (CC) 도메인을 가지는 ZFP-TF는 루시페라제 리포터로 시험되었다. pRL-Htt CAG17 (각 쌍의 좌측 막대)은 17개의 CAG를 가지는 인간 Htt 프로모터/엑소1 단편에 의해 제어된 레닐라 루시페라제 리포터를 나타내고; pGL3-Htt-CAG47 (각 쌍의 우측 막대)은 47개의 CAG 반복을 가지는 인간 Htt 프로모터/엑손1 단편에 의해 제어된 반딧불이 루시페라제 리포터를 나타낸다. 다양한 이량체화 도메인의 설명에 대해서는 실시예 10을 참조한다. 도 11b에서, 이량체화 징크 핑거 "DZ" 도메인을 가지는 ZFP는 동일한 루시페라제 리포터로 시험되었고, 일부 ZFP-TF 이량체화 도메인으로 억압이 증가되는 것이 증명된다. 각 이중체 (doublet)에서 좌측 막대는 17CAG 반복 Htt 대립유전자로부터의 발현을 나타내는 한편 우측 막대는 47CAG 반복 Htt 대립유전자로부터의 발현을 나타낸다.
도 12a 및 12b는 ZFP-ZFP-KOX 단백질에 의한 Htt의 억압을 도시한다. 도 12a는 단일 33088 및 33084 ZFP-TF에 의한 Htt 억압 및 야생형 (좌측 막대), CAG18 (중간 막대) 및 CAG45 (우측 막대) (도 12a) HD 섬유아세포에서 33088-33088 및 33088-33084 ZFP-ZFP-KOX 단백질에 의한 억압을 도시하고; 도 12b는 야생형 (좌측 막대), CAG20 (중간 막대) 및 CAG41 (우측 막대) HD 섬유아세포에서 33088-33088 및 33088-33084 ZFP-ZFP-KOX에 의한 Htt 억압을 도시한다.
도 13a 내지 13e는 마우스 Htt의 활성화를 도시한다. 도 13a는 p65 활성화 도메인에 융합된 ZFP를 사용하여 Neuro2A 세포의 RNA 수준에서 마우스 Htt 유전자들의 ZFP-TF-구동된 상향 조절을 증명한다. 이중 막대는 이중 트랜스펙션을 가리킨다. 도 13b는 ZFP에 의해 구동된 증가된 Htt 단백질 생성을 증명하는 웨스턴 블롯을 도시하다. 도 13c는 야생형 마우스 Htt 대립유전자와 "녹 인" Htt 대립유전자를 도시하는데, 이때 마우스 서열 (엑손1의 대부분 및 인트론 1의 일부, 야생형 대립유전자 개략도 위의 선)은 CAG 확장을 가지는 상응하는 인간 서열 (녹-인 대립유전자 개략도 위의 선)로 대체되었다. 도 13d는 상응하는 인간 서열 (SEQ ID NO:192)로 대체됨으로써 녹-인 대립유전자가 ZFP (a 및 b에 나타냄)가 마우스 서열에 특이적으로 결합하도록 디자인되는 것을 허용하기에 충분한 서열 다양성을 가지게 된 마우스 서열 (SEQ ID NO:191)과 인간 서열 사이의 배열을 도시한다. 도 13d는 HdhQ111/Q7 녹-인 마우스로부터 유도된 불멸화된 선조 세포에서의 야생형 마우스 Htt 대립유전자의 특이적인 활성화를 도시한다. 좌측 막대는 야생형 세포의 결과를 나타내고 우측 막대는 녹-인 돌연변이 대립유전자 세포의 결과를 나타낸다.
도 14a 및 14b는 Htt 특이적 ZFN 쌍으로의 K562 세포의 처리 후에 Cel-I 미스매치 분석 (SurveyorTM, Transgenomics)의 결과를 도시한다. 활성 ZFN에 대한 퍼센트 NHEJ 활성 (삽입-결실)은 상응하는 레인의 하부에 나타낸다. "GFP"는 GFP 코드화 플라스미드로 트랜스펙션된 세포를 나타낸다. 도 14a는 초기 Htt 엑손을 절단하는 ZFN으로부터의 결과를 도시하는 한편 도 14b는 중지 코돈 가까이에서 절단하는 ZFN으로부터의 결과를 도시한다. 비활성 ZFN 쌍이 또한 관찰되었다 (레인들은 삽입-결실 백분율로 주석을 달지 않음).
도 15는 여러 후보 TALE-TF 단백질에 대한 Htt 억압 결과의 그래프를 도시한다. TALE-TF는 HD 환자 유도된 섬유아세포 (CAG 20/41)에서 시험되었다. 결과들은 TALE TF의 일부가 전체적인 Htt 발현을 억압하는 데 있어 활성이었던 한편, 다른 것들은 돌연변이 Htt-우선적 억압을 나타냈음을 증명한다.
도 16은 움켜쥐기 행동을 나타내는 두 개의 사진을 도시한다 (Mangiarini et al (1996) Cell 87:493-605). 시험은 시험 마우스를 꼬리로 들어올리는 것을 포함하는데, 이때 동물이 표면으로부터 약 12인치 정도 위에서 흔들릴 때까지 관찰자가 매끄럽게 움직이면서 앞뒤로 부드럽게 마우스를 잡아당긴다. 그런 다음 동물을 30초 동안 점수를 매긴다. HD 마우스는 우측의 사진에서 나타난 것과 같이 '움켜쥐기' 행동을 하는 반면, 정상적인 대조 마우스는 좌측에서 나타난 것과 같이 보다 개방적인 행동을 나타낸다.
도 17은 HD의 마우스 모델 (R6/2)에서 움켜쥐기 행동을 보여주는 그래프이다. 마우스들은 30초 동안 흔들렸고 시간 경과에 따라 움켜쥐기 행동의 유형과 길이에 대해 점수가 매겨진다. 관찰될 수 있는 것과 같이, ZFP 처리된 마우스들은 12주 기간에 걸쳐 모든 시점에서 움켜쥐기 행동의 감소를 나타냈다.
도 18은 ZFP로 처리된 R6/2 마우스의 뇌로부터 유도된 중간 가시 뉴런에 대한 4가지 생체마커의 발현의 변화를 나타낸 그래프이다. 분석된 4가지 생체마커, DARPP-32, PDE10a, DRD1 및 DRD2는 모두 GFP 발현 벡터로 처리되었던 R6/2 마우스의 뇌로부터의 신호에 비례하는 발현의 증가를 나타냈다.
도 2a 내지 2e는 CAG 반복 서열에 결합하지 않는 ZFP TF를 사용하여 도 1a에 기술된 것과 같은 ZFP에 의해 Htt의 둘 다의 대립유전자를 억압하는 것을 도시한다. 도 1a 및 1b에 도시된 것과 같은 ZFP 확인 번호는 막대 아래에 표시된다. 도 2a는 인간 유전자의 5개의 유전자좌에 대해 표적화된 ZFP를 사용하여 HEK293 세포에서의 인간 Htt 대립유전자의 억압을 도시한다. 인간 Htt 유전자의 다이아그램이 도시되고 ZFP 결합 부위들의 위치가 도시된다. 각각의 ZFP 그룹에 대해, 각각의 막대는 독립적인 트랜스펙션 (transfection)을 나타낸다. 도 2b는 GFP 대조표준 또는 18856 ZFP TF 리프레서 (KOX1의 KRAB 억압 도메인을 포함함)로 트랜스펙션된 HEK293 세포의 Htt 단백질 수준을 보여주는 웨스턴 블롯을 도시하고, 도면에서 NFB p65 수준 ("p65")이 동등한 단백질 로딩을 확인하기 위해 사용되었다. 웨스턴 블롯은 ZFP-TF에 의한 Htt 발현의 억압을 확인한다. 도 2c는 Neuro2A 세포에서 마우스 Htt 특이적 ZFP에 대한 도 2a와 유사한 세트의 데이터를 도시한다. 도 2a에서와 같이, 마우스 Htt 유전자의 다이아그램이 도시되고 ZFP 결합 부위의 위치가 표시된다. 도 2d 및 2e는 불멸화된 선조 세포에서의 마우스 Htt 유전자 발현 (RNA)의 억압을 증명하는데, 이때 상이한 용량의 ZFP-TF mRNA가 트랜스펙션에 사용되었다. 도 2b를 제외한 모든 경우에, Htt mRNA 수준은 실시간 RT-PCR에 의해 측정되었고 액틴 mRNA의 수준에 대해 표준화되었다.
도 3a 내지 3g는 도 1b에 예시된 것과 같은, CAG 반복 영역 내의 ZFP 결합을 사용함에 의한 돌연변이 Htt의 선택적 억압을 도시한다. 이 모델은 돌연변이 대립유전자의 더 긴 CAG 반복 영역이 CAG-표적화된 ZFP 리프레서 분자의 증가된 결합을 허용하는 것을 예시한다. 도 3a는 HEK293 세포에서 CAG-표적화된 ZFP에 의한 내인성 Htt 유전자 (정상적인 CAG 반복 길이를 가짐)에 대한 상이한 리프레서 활성을 도시한다. 도 3b는 10 내지 47 CAG 반복의 범위인, 달라지는 길이의 CAG 반복을 함유하는 Htt 프로모터/엑손1 단편들에 의해 조절된 루시페라제 리포터의 억압을 도시한다. CAG10 (2개의 표시된 조건의 각각에 대해 좌측-바깥쪽 막대)은 10개의 CAG 반복으로 얻어진 결과를 나타내고; CAG17 (2개의 표시된 조건의 각각에 대해 좌측으로부터 두 번째 막대)은 17개의 CAG 반복으로 얻어진 결과를 나타내며; CAG23 (2개의 표시된 조건의 각각에 대해 우측으로부터 두 번째 막대)은 23개의 CAG 반복으로 얻어진 결과를 나타내고; CAG47 (2개의 표시된 조건의 각각에 대해 우측-바깥쪽 막대)은 47개의 CAG 반복으로 얻어진 결과를 나타낸다. 그래프 위의 개략도는 이 시스템에 사용된 Htt 프로모터, 엑손 1, CAG 반복 및 리포터 루시퍼라제 유전자의 배열을 나타낸다. 데이터는 CAG의 수의 증가가 CAG-표적화된 ZFP에 의한 Htt 프로모터로부터의 발현의 감소를 유도하는 것을 증명한다. 나아가, 도 3c는 상대적으로 약한 CAG-표적화된 ZFP가 강력한 CAG 리프레서뿐 아니라 정상적인 길이의 CAG 반복을 함유하는 루시페라제 리포터를 억압하지 않는 한편으로, 시험된 모든 용량에서 강력한 CAG-표적화된 ZFP로서 확장된 CAG 반복을 함유하는 루시페라제 리포터의 유사한 억압을 유도하는 것을 증명한다. "pRL-Htt-CAG23-인트론 1" (각 쌍의 좌측 막대)은 야생형 대립유전자로부터의 발현에 상응하는 한편, "pRL-HttCAG47-인트론 1" (각 쌍의 우측 막대)은 돌연변이 확장 Htt 대립유전자 (47개의 CAG 반복을 함유함)로부터의 발현과 상관된다. 도 3d는 HdH(Q111/Q7) 녹-인 마우스로부터 유도된 불멸화된 마우스 선조 세포에서 CAG-표적화된 ZFP에 의한 돌연변이 Htt (111개의 CAG)의 억압을 도시하는 그래프이다. 야생형 발현은 각 쌍의 좌측 막대에 도시되고 녹-인 발현은 각 쌍의 우측 막대에 도시된다. KRAB 억압 도메인에 융합된 명시된 ZFP를 포함하고 있는 ZFP-TF는 트랜스펙션에서 ZFP mRNA의 상이한 3가지의 농도를 사용하여 시험되었다. 도 3e는 HD 환자 유도된 섬유하세포 라인 (CAG15/70)에서 CAG-표적화된 ZFP에 의한 돌연변이 Htt 억압을 도시한다. 이 섬유아세포 라인에서, 야생형 Htt 대립유전자는 15개의 CAG 반복 ("099T(CAG15)", 각각의 표시된 조건의 중간 막대)을 포함하고, 돌연변이 확장 Htt 대립유전자는 70개의 CAG 반복 ("099C(CAG70)", 각각의 표시된 조건의 우측 막대)을 포함한다. 도 3f는 4개의 상이한 HD 환자 유도된 섬유아세포 셀라인에서의 돌연변이 Htt 발현의 선택적 억압을 도시한다. 각 그룹 위의 숫자는 야생형 Htt 대립유전자 (예컨대 15 또는 18) 및 돌연변이 대립유전자 (예컨대 70, 67, 45 및 44)에 대한 CAG 반복의 수를 나타내고; 이때 2가지 상이한 용량의 ZFP mRNA가 시험되었다. 각 쌍의 좌측 막대는 야생형 Htt 발현을 나타내고 각 쌍의 우측 막대는 돌연변이 Htt의 발현을 나타낸다. 도 3g는 ZFP-TFs 30640, 32528 및 30657의 존재 하에 웨스턴 블롯 분석에 의해 분석된 HD 유도된 환자 섬유아세포에서의 Htt 발현을 도시한다. 더 느리게 이동하는 단백질 밴드는 확장된 돌연변이 Htt 대립유전자에 의해 생성된 것들이다. 32528은 Htt의 전사 출발 부위 (TSS)에 결합하고 그로써 둘 다의 대립유전자로부터의 발현을 억제하는 한편, 30640 및 30657은 CAG 반복에 결합한다 (CAG).
도 4a 및 4b는 CAG 반복에 대해 표적화된 ZFP의 패널에 의한 HD 환자 유도된 섬유아세포 라인에서의 돌연변이 Htt의 억압을 도시한다. RNA 농도 범위는 0.1 ng 내지 3 μg의 범위로 사용되었다. 도 4a 및 4b에서, 각각의 표시된 조건의 좌측 막대는 총 Htt 발현을 나타내고, 중간 막대는 섬유아세포에서의 Htt의 억압을 나타내며 이때 Htt 대립유전자는 18개의 CAG 반복을 포함하고 ("099T(CAG18)") 돌연변이 확장 Htt 대립유전자는 45개의 CAG 반복을 포함한다(099T (CAG45)).
도 5는 HD 환자-유도된 섬유아세포에서 Htt 및 다른 CAG-함유 유전자의 발현에 미치는 CAG-표적화된 ZFP 리프레서의 효과를 도시한다. 각각의 표시된 조건 아래의 좌측 막대는 30640으로 얻어진 결과를 나타내고; 각각의 표시된 조건 아래의 중간 막대는 30675로 얻어진 결과를 나타내며; 우측 막대는 mock 트랜스펙션을 나타낸다.
도 6a 및 6b는 3개의 CAG-표적화된 ZFP의 게놈-광범위 특이성을 조사하는 실험을 도시한다. 도 6a는 30640, 30645 또는 33074를 사용하여 HD 섬유아세포 (CAG18 (중간 막대)/ CAG45 (우측 막대))의 6개의 생물학적 복제물 (6개의 별도의 트랜스펙션)에 대해 수행된 Htt 억압의 qPCR 분석을 도시한다. 그런 다음 qPCR에 의해 4개의 가장 유사한 복제물이 마이크로어레이 분석을 위해 선택되었고, 데이터는 도 6b에 제공된다.
도 7은 CAG17/69 뉴런 줄기 세포 (NSC)에서의 Htt 억압을 도시한다. 세포들은 표시된 용량의 ZFP mRNA로 트랜스펙션되었다. 각각의 표시된 용량 아래의 좌측 막대는 CAG17 세포에서의 결과를 나타내고, 중간 막대는 야생형 세포에서의 결과를 나타내며, 우측 막대는 CAG69 세포에서의 결과를 나타낸다.
도 8은 ZFP TF로 처리된 HD 배아 줄기 세포 (ESC) (CAG 17/48)로부터 분화된 뉴런에서의 Htt 억압을 도시한다. 세포들은 표시된 용량의 ZFP mRNA로 트랜스펙션되었다.
도 9는 ZFP TF 30640으로의 처리 후에 R6/2 마우스에서의 돌연변이 Htt 이식유전자 발현의 억압을 도시한다.
도 10a 내지 10d는 도 1d에 도시된 것과 같은, 확장된 CAG 반복을 특이적으로 표적화하는 다량체화 도메인을 가지는 ZFP를 도시한다. 도 10a는 4개의 성분: (i) KOX 리프레서 도메인 ("리프레서"로 표시된 타원형); (ii) (CAG)N 또는 이 서열의 과돌연변이에 결합하는 2 내지 6 핑거의 어레이 (2개가 도시됨, "Z"로 표시된 작은 타원형); 및 (iii) 역평행 형태로 상호작용하는 2개의 이량체화 도메인 ("d1" 및 "d2"로 표시된 사각형)을 가지는 단일 ZFP를 도시한다. 이들 도메인은 CAG 트랙트의 주요 홈 내에서 ZFP가 중합되는 것을 허용한다. 도 10b는 3개의 ZFP의 다량체로 결합 사건이 일어나는 것을 개략적으로 도시한다. 어떠한 수의 다량체이든 사용될 수 있고 기능성 도메인은 하나 또는 그 이상의 개별적인 ZFP상의 어느 곳에든지 위치할 수 있으며 이들 다이아그램은 TALE-TF에도 적용될 수 있다는 것이 명백할 것이다. 도 10c는 이량체화 징크 핑거 (DZ)들 사이의 상호작용을 통해 다량체화하도록 디자인된 4개의 ZFP 단량체 스캐폴드의 단백질 서열을 도시한다. 스캐폴드는 DZ1 (SEQ ID NO:180), DZ2 (SEQ ID NO:181), DZ3 (SEQ ID NO:182) 및 DZ4 (SEQ ID NO:183)로 명명된다. 이량체화 징크 핑거 도메인은 밑줄이 그어져 있는 한편, 억압 도메인 및 핵 정위 서열은 (각각) 굵은 밑줄 및 이탤릭체로 표시된다. 도 10d는 코일형-코일 (CC) 사이의 상호작용을 통해 다량체화하도록 디자인된 7개의 ZFP 단량체 스캐폴드의 단백질 서열을 도시한다. 스캐폴드는 CC1 (SEQ ID NO:184), CC2 (SEQ ID NO:185), CC3 (SEQ ID NO:186), CC4 (SEQ ID NO:187), CC5 (SEQ ID NO:188), CC6 (SEQ ID NO:189) 및 CC7 (SEQ ID NO:190)로 명명된다. 코일형-코일 서열은 밑줄이 그어져 있는 한편, 억압 도메인 및 핵 정위 서열은 (각각) 굵은 밑줄 및 이탤릭체로 표시된다. 디자인마다 다를 수 있을, 각각의 스캐폴드의 ZFP 영역의 위치는 "[ZFP]"로 표시된다. 디자인마다 다를 수 있을, 각각의 스캐폴드의 (DNA-결합) ZFP 영역의 위치는 "[ZFP]"로 표시된다.
도 11a 및 11b는 이량체화 도메인을 가지는 ZFP-TF의 활성을 도시한다. 도 11a에서, "코일형 코일" (CC) 도메인을 가지는 ZFP-TF는 루시페라제 리포터로 시험되었다. pRL-Htt CAG17 (각 쌍의 좌측 막대)은 17개의 CAG를 가지는 인간 Htt 프로모터/엑소1 단편에 의해 제어된 레닐라 루시페라제 리포터를 나타내고; pGL3-Htt-CAG47 (각 쌍의 우측 막대)은 47개의 CAG 반복을 가지는 인간 Htt 프로모터/엑손1 단편에 의해 제어된 반딧불이 루시페라제 리포터를 나타낸다. 다양한 이량체화 도메인의 설명에 대해서는 실시예 10을 참조한다. 도 11b에서, 이량체화 징크 핑거 "DZ" 도메인을 가지는 ZFP는 동일한 루시페라제 리포터로 시험되었고, 일부 ZFP-TF 이량체화 도메인으로 억압이 증가되는 것이 증명된다. 각 이중체 (doublet)에서 좌측 막대는 17CAG 반복 Htt 대립유전자로부터의 발현을 나타내는 한편 우측 막대는 47CAG 반복 Htt 대립유전자로부터의 발현을 나타낸다.
도 12a 및 12b는 ZFP-ZFP-KOX 단백질에 의한 Htt의 억압을 도시한다. 도 12a는 단일 33088 및 33084 ZFP-TF에 의한 Htt 억압 및 야생형 (좌측 막대), CAG18 (중간 막대) 및 CAG45 (우측 막대) (도 12a) HD 섬유아세포에서 33088-33088 및 33088-33084 ZFP-ZFP-KOX 단백질에 의한 억압을 도시하고; 도 12b는 야생형 (좌측 막대), CAG20 (중간 막대) 및 CAG41 (우측 막대) HD 섬유아세포에서 33088-33088 및 33088-33084 ZFP-ZFP-KOX에 의한 Htt 억압을 도시한다.
도 13a 내지 13e는 마우스 Htt의 활성화를 도시한다. 도 13a는 p65 활성화 도메인에 융합된 ZFP를 사용하여 Neuro2A 세포의 RNA 수준에서 마우스 Htt 유전자들의 ZFP-TF-구동된 상향 조절을 증명한다. 이중 막대는 이중 트랜스펙션을 가리킨다. 도 13b는 ZFP에 의해 구동된 증가된 Htt 단백질 생성을 증명하는 웨스턴 블롯을 도시하다. 도 13c는 야생형 마우스 Htt 대립유전자와 "녹 인" Htt 대립유전자를 도시하는데, 이때 마우스 서열 (엑손1의 대부분 및 인트론 1의 일부, 야생형 대립유전자 개략도 위의 선)은 CAG 확장을 가지는 상응하는 인간 서열 (녹-인 대립유전자 개략도 위의 선)로 대체되었다. 도 13d는 상응하는 인간 서열 (SEQ ID NO:192)로 대체됨으로써 녹-인 대립유전자가 ZFP (a 및 b에 나타냄)가 마우스 서열에 특이적으로 결합하도록 디자인되는 것을 허용하기에 충분한 서열 다양성을 가지게 된 마우스 서열 (SEQ ID NO:191)과 인간 서열 사이의 배열을 도시한다. 도 13d는 HdhQ111/Q7 녹-인 마우스로부터 유도된 불멸화된 선조 세포에서의 야생형 마우스 Htt 대립유전자의 특이적인 활성화를 도시한다. 좌측 막대는 야생형 세포의 결과를 나타내고 우측 막대는 녹-인 돌연변이 대립유전자 세포의 결과를 나타낸다.
도 14a 및 14b는 Htt 특이적 ZFN 쌍으로의 K562 세포의 처리 후에 Cel-I 미스매치 분석 (SurveyorTM, Transgenomics)의 결과를 도시한다. 활성 ZFN에 대한 퍼센트 NHEJ 활성 (삽입-결실)은 상응하는 레인의 하부에 나타낸다. "GFP"는 GFP 코드화 플라스미드로 트랜스펙션된 세포를 나타낸다. 도 14a는 초기 Htt 엑손을 절단하는 ZFN으로부터의 결과를 도시하는 한편 도 14b는 중지 코돈 가까이에서 절단하는 ZFN으로부터의 결과를 도시한다. 비활성 ZFN 쌍이 또한 관찰되었다 (레인들은 삽입-결실 백분율로 주석을 달지 않음).
도 15는 여러 후보 TALE-TF 단백질에 대한 Htt 억압 결과의 그래프를 도시한다. TALE-TF는 HD 환자 유도된 섬유아세포 (CAG 20/41)에서 시험되었다. 결과들은 TALE TF의 일부가 전체적인 Htt 발현을 억압하는 데 있어 활성이었던 한편, 다른 것들은 돌연변이 Htt-우선적 억압을 나타냈음을 증명한다.
도 16은 움켜쥐기 행동을 나타내는 두 개의 사진을 도시한다 (Mangiarini et al (1996) Cell 87:493-605). 시험은 시험 마우스를 꼬리로 들어올리는 것을 포함하는데, 이때 동물이 표면으로부터 약 12인치 정도 위에서 흔들릴 때까지 관찰자가 매끄럽게 움직이면서 앞뒤로 부드럽게 마우스를 잡아당긴다. 그런 다음 동물을 30초 동안 점수를 매긴다. HD 마우스는 우측의 사진에서 나타난 것과 같이 '움켜쥐기' 행동을 하는 반면, 정상적인 대조 마우스는 좌측에서 나타난 것과 같이 보다 개방적인 행동을 나타낸다.
도 17은 HD의 마우스 모델 (R6/2)에서 움켜쥐기 행동을 보여주는 그래프이다. 마우스들은 30초 동안 흔들렸고 시간 경과에 따라 움켜쥐기 행동의 유형과 길이에 대해 점수가 매겨진다. 관찰될 수 있는 것과 같이, ZFP 처리된 마우스들은 12주 기간에 걸쳐 모든 시점에서 움켜쥐기 행동의 감소를 나타냈다.
도 18은 ZFP로 처리된 R6/2 마우스의 뇌로부터 유도된 중간 가시 뉴런에 대한 4가지 생체마커의 발현의 변화를 나타낸 그래프이다. 분석된 4가지 생체마커, DARPP-32, PDE10a, DRD1 및 DRD2는 모두 GFP 발현 벡터로 처리되었던 R6/2 마우스의 뇌로부터의 신호에 비례하는 발현의 증가를 나타냈다.
본원에는 헌팅턴병 (HD)을 치료하기 위한 조성물 및 방법이 개시된다. 특히, 징크 핑거 단백질 (ZFP TF) 또는 TALE (TALE-TF)을 포함하는 Htt-조절 전사 인자들 및 그런 단백질을 활용하는 방법들이 헌팅턴병을 치료하거나 예방하는데 사용하기 위해 제공된다. 예를 들어, 돌연변이 Htt 대립유전자의 발현을 억압하거나 야생형 Htt 대립유전자의 발현을 활성화하는 ZFP-TF 또는 TALE-TF가 제공된다. 또한, HD와 관련된 유전자들의 게놈 구조를 변형시키는 징크 핑거 뉴클레아제 (ZFN), TALE 뉴틀레아제 (TALEN), Ttago 시스템 또는 CRISPR/Cas 뉴클레아제 시스템이 제공된다. 예를 들어, Htt의 돌연변이 형태의 일부를 특이적으로 변경시킬 수 있는 ZFN, TALEN 또는 CRISPR/Cas 뉴클레아제 시스템이 제공된다. 이것들은 엔지니어링된 징크 핑거 단백질 또는 엔지니어링된 TALE 단백질, 즉 예정된 핵산 표적 서열에 결합하는 비-자연 발생 단백질을 사용하는 조성물 및 방법을 포함한다.
그러므로, 본원에 기술된 방법 및 조성물은 헌팅턴병의 치료 및 예방을 위한 방법을 제공하고, 이들 방법 및 조성물은 Htt를 변형 또는 편집할 수 있는 엔지니어링된 징크 핑거 및 TALE 뉴클레아제, Ttago 및 CRISPR/Cas 뉴클레아제 시스템뿐 아니라 표적 유전자를 조절할 수 있는 징크 핑거 전사 인자들 또는 TALE 전사 인자들을 포함할 수 있다.
일반적
방법의 실시, 뿐만 아니라 본원에 개시된 조성물의 제조 및 사용은 다른 언급이 없는 한, 분자 생물학, 생화학, 크로마틴 구조 및 분석, 컴퓨터 화학, 세포 구조, 재조합 DNA 및 관련 분야에서의 종래 기법들을 기술분야의 숙련도 내에서 사용한다. 이들 기법은 문헌에 전체적으로 설명되어 있다. 예를 들면 Sambrook et al. MOLECULAR CLONING: A LABORATORY MANUAL, Second edition, Cold Spring Harbor Laboratory Press, 1989 and Third edition, 2001; Ausubel et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, John Wiley & Sons, New York, 1987 and periodic updates; the series METHODS IN ENZYMOLOGY, Academic Press, San Diego; Wolffe, CHROMATIN STRUCTURE AND FUNCTION, Third edition, Academic Press, San Diego, 1998; METHODS IN ENZYMOLOGY, Vol. 304, "Chromatin" (P.M. Wassarman and A. P. Wolffe, eds.), Academic Press, San Diego, 1999; and METHODS IN MOLECULAR BIOLOGY, Vol. 119, "Chromatin Protocols" (P.B. Becker, ed.) Humana Press, Totowa, 1999 참조.
정의
용어 "핵산", "폴리뉴클레오티드" 및 "올리고뉴클레오티드"는 상호교환적으로 사용되며 선형 또는 원형 형태의, 및 단일- 또는 이중-가닥 형태 중 어느 하나의 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 중합체를 말한다. 본 개시의 목적에 대해 이들 용어는 중합체의 길에 관한 제한으로서 해석되어서는 안된다. 용어는 천연 뉴클레오티드의 공지된 유사체뿐 아니라 염기, 당 및/또는 포스페이트 부분 (예컨대 포스포로티오에이트 골격)에서 변형된 뉴클레오티드들을 포함할 수 있다. 일반적으로 특정 뉴클레오티드의 유사체는 동일한 염기쌍 특이성을 가진다; 즉 A의 유사체는 T와 염기쌍일 것이다.
용어 "폴리펩티드", "펩티드" 및 "단백질"은 아미노산 잔기의 중합체를 나타내기 위해 상호교환적으로 사용된다. 그 용어는 또한 하나 또는 그 이상의 아미노산이 상응하는 자연-발생 아미노산의 화학적 유사체 또는 변형된 유도체인 아미노산 중합체에도 적용된다.
"결합"은 마크로분자들 사이의 (예컨대 단백질과 핵산 사이의) 서열-특이적인 비-공유 상호작용을 말한다. 결합 상호작용의 모든 성분들은 상호작용이 전체로서 서열-특이적인 한 서열-특이적일 (예컨대 DNA 골격의 포스페이트 잔기와 접촉할) 필요는 없다. 그런 상호작용은 일반적으로 10-6 M-1 또는 그 이하의 해리 상수 (Kd)를 특징으로 한다. "친화성"은 결합의 길이를 나타낸다: 증가된 결합 친화성은 더 낮은 Kd와 상관된다.
"결합 단백질"은 다른 분자에 비-공유적으로 결합할 수 있는 단백질이다. 결합 단백질은 예를 들면 DNA 분자 (DNA-결합 단백질), RNA 분자 (RNA-결합 단백질) 및/또는 단백질 분자 (단백질-결합 단백질)에 결합할 수 있다. 단백질-결합 단백질의 경우에, 그것은 자체에 결합할 수 있고 (단일이량체, 이종이량체 등을 형성함) 및/또는 상이한 단백질 또는 단백질들의 하나 또는 그 이상의 분자에 결합할 수 있다. 결합 단백질은 한 가지 이상의 유형의 결합 활성을 가질 수 있다. 예를 들어, 징크 핑거 단백질은 DNA-결합, RNA-결합 및 단백질-결합 활성을 가진다.
"징크 핑거 DNA 결합 단백질" (또는 결합 도메인)은 하나 또는 그 이상의 징크 핑거를 통해서 서열-특이적 방식으로 DNA에 결합하는 단백질 또는 더 큰 단백질 내의 도메인이고, 그것은 구조가 아연 이온의 배위를 통해 안정화된 결합 도메인 내의 아미노산 서열의 영역이다. 징크 핑거 DNA 결합 단백질이란 용어는 자주 ZFP의 징크 핑거 단백질로서 약칭된다.
"TALE DNA 결합 도메인" 또는 "TALE"은 하나 또는 그 이상의 TALE 반복 도메인/유닛을 포함하는 폴리펩티드이다. 반복 도메인은 그것의 동족 표적 DNA 서열에 대한 TALE의 결합에 포함된다. 단일 "반복 유닛" (또한 "반복"으로도 언급됨)은 전형적으로 33 내지 35 아미노산 길이이며 자연 발생 TALE 단백질 내의 다른 TALE 반복 서열과 적어도 일부의 서열 상동성을 나타낸다. 예컨대 미국 특허 번호 8,586,526 참조.
징크 핑거 결합 도메인 또는 TALE DNA 결합 도메인은 예를 들면 자연 발생 징크 핑거 단백질의 인식 나선 영역의 엔지니어링 (하나 또는 그 이상의 아미노산의 변경)을 통해 또는 TALE 단백질의 RVD의 엔지니어링에 의해, 예정된 뉴클레오티드 서열에 결합하기 위해 "엔지니어링"될 수 있다. 그러므로, 엔지니어링된 징크 핑거 단백질 또는 TALE은 비-자연 발생적인 단백질이다. 징크 핑거 단백질 또는 TALE을 엔지니어링하기 위한 방법들의 비-제한적 실례는 디자인 및 선택이다. 디자인된 징크 핑거 단백질 또는 TALE은 디자인/조성물이 원칙적으로는 합리적인 기준으로부터 유래하는 자연적으로 발생하지 않는 단백질이다. 디자인에 대한 합리적인 기준은 기존의 ZFP 디자인 및 결합 데이터의 정보를 저장하는 데이터베이스에서 정보를 처리하기 위한 치환 규칙 및 컴퓨터화된 알고리즘의 적용을 포함한다. 예를 들면 미국 특허 번호 8,586,526; 6,140,081; 6,453,242; 및 6,534,261; 또한 WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536 및 WO 03/016496 참조.
"선택된" 징크 핑거 단백질 또는 TALE는 그것의 생성이 파지 디스플레이, 상호작용 트랩 또는 하이브리드 선택과 같은 실험 과정으로부터 주로 유발되는, 자연계에서 발견되지 않는 단백질이다. 예컨대 8,586,526; 5,789,538; US 5,925,523; US 6,007,988; US 6,013,453; US 6,200,759; WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970 WO 01/88197, WO 02/099084 참조.
"TtAgo"는 유전자 침묵에 포함되는 것으로 여겨진 원핵세포 아르고노트 (Argonaute) 단백질이다. TtAgo는 박테리아 Thermus thermophilus로부터 유도된다. 예컨대 Swarts et al, ibid, G. Sheng et al., (2013) Proc . Natl . Acad . Sci . U.S.A. 111, 652) 참조. "TtAgo 시스템"은 예를 들면 TtAgo 시스템에 의한 절단에 대한 가이드 DNA를 포함하여 요구되는 모든 성분이다.
"재조합"은 두 개의 폴리뉴클레오티드 사이의 유전자 정보의 교환 과정을 말한다. 본 개시의 목적에 대해, "상동 재조합 (HR)"은 예를 들면 세포에서 상동성-지시된 수복 메커니즘을 통해 이중-가닥 파괴의 수복 중에 일어나는 그런 교환의 특수한 형태를 말한다. 이 과정은 뉴클레오티드 서열 상동성을 필요로 하고, "표적" 분자 (즉 이중-가닥 파괴를 경험하게 되는 분자)의 수복을 형판으로 하기 위해 "공여자" 분자를 사용하며, 그것이 유전자 정보가 공여자로부터 표적으로 전달되는 것을 유도하기 때문에 "비-교차 유전자 전환" 또는 "짧은 트랙트 유전자 전환"으로서 다양하게 알려져 있다. 어떠한 특정 이론에 결합되는 것을 바라지 않지만, 그런 전달은 깨진 표적과 공여자 사이에서 형성되는 이종이중나선 DNA의 미스매치 교정, 및/또는 공여자가 표적의 일부가 될 유전자 정보를 재합성하기 위해 사용되는 "합성-의존성 가닥 아닐링" 및/또는 관련된 과정을 포함할 수 있다. 그런 특수화된 HR은 자주 표적 분자의 서열의 변경을 초래하여서 공여자 폴리뉴클레오티드의 서열의 부분 또는 전부가 표적 폴리뉴클레오티드 안으로 통합된다.
개시된 방법에서, 본원에 기술된 하나 또는 그 이상의 표적화된 뉴클레아제는 예정된 부위에서 표적 서열 (예컨대 세포성 크로마틴)의 이중-가닥의 파괴를 생성하고, 파괴 영역의 뉴클레오티드 서열에 대한 상동성을 가지는 "공여자" 폴리뉴클레오티드가 세포 안으로 도입될 수 있다. 이중-가닥 파괴의 존재는 공여자 서열의 통합을 용이하게 하는 것으로 밝혀졌다. 공여자 서열은 물리적으로 통합될 수 있거나, 다르게는, 공여자 폴리뉴클레오티드는 상동 재조합을 통해 파괴의 수복을 위한 주형으로서 사용되어 세포성 크로마틴 안으로의 공여자에서처럼 뉴클레오티드 서열의 전부 또는 일부의 도입을 초래한다. 그러므로, 세포성 크로마틴의 제 1 서열은 변경될 수 있고, 특정 구체예에서, 공여자 폴리뉴클레오티드에 존재하는 서열로 전환될 수 있다. 그러므로, 용어 "대체한다" 또는 "대체"의 사용은 한 뉴클레오티드 서열의 다른 것에 의한 대체 (즉 정보적인 의미에서 서열의 대체)를 나타내는 것으로 인지될 수 있고, 한 폴리뉴클레오티드의 다른 것에 의한 물리적 또는 화학적 대체를 반드시 필요로 하지 않는다.
본원에 기술된 방법들 중 어느 것에서, 징크-핑거 또는 TALE 단백질의 추가의 쌍들이 세포 내에서 추가의 표적 부위의 추가의 이중-가닥 절단을 위해 사용될 수 있다.
세포성 크로마틴에서 관심의 영역의 서열의 표적화된 재조합 및/또는 대체 및/또는 변경에 대한 방법들의 특정 구체예에서, 염색체 서열은 외인성 "공여자" 뉴클레오티드 서열을 사용하는 상동 재조합에 의해 변경된다. 그런 상동 재조합은, 만약 파괴 영역에 상동하는 서열들이 존재한다면, 세포성 크로마틴에서 이중-가닥 파괴의 존재에 의해 자극된다.
본원에 기술된 방법들 중 어느 것에서, 제 1 뉴클레오티드 서열 ("공여자 서열")은 관심의 영역에서 게놈 서열에 대해 동일하지는 않지만 상동하는 서열을 함유할 수 있고, 그로써 관심의 영역에서 비-동일한 서열을 삽입하기 위해 상동 재조합을 자극한다. 그러므로 특정 구체예에서, 관심의 영역의 서열들에 상동하는 공여자 서열의 부분들은 대체되는 게놈 서열에 대해 약 80 내지 99% (또는 그 사이의 어떠한 정수)의 서열 동일성을 나타낸다. 다른 구체예에서, 공여자와 게놈 서열 사이의 상동성은 99%보다 높은데, 예를 들면 공여자와 100개 이상의 연속적인 염기쌍의 게놈 서열 사이에서와 같이 단지 하나의 뉴클레오티드가 상이하다. 특정 경우에, 공여자 서열의 비-상동성 부분은 관심의 영역에 존재하지 않는 서열을 함유할 수 있어서, 새로운 서열들은 관심의 영역들에 도입된다. 이들 경우에, 비-상동성 서열은 일반적으로 관심의 영역의 서열에 대해 상동성이거나 동일한 50 내지 1,000 염기쌍 (또는 그 사이의 어떠한 적분 값) 또는 1,000보다 더 큰 어떠한 수의 염기쌍의 서열이 양옆에 있다. 다른 구체예에서, 공여자 서열은 제 1 서열에 대해 비-상동성이고, 비-상동 재조합 메커니즘에 의해 게놈 안에 삽입된다.
본원에 기술된 방법들 중 어느 것이든지 관심의 유전자(들)의 발현을 파괴하는 공여자 서열의 표적화된 통합에 의해 세포에서의 하나 또는 그 이상의 표적 서열의 부분적 또는 완전한 비활성화에 대해 사용될 수 있다. 부분적으로 또는 완전하게 비활성화된 유전자들을 가지는 셀라인들이 또한 제공된다.
나아가, 본원에 기술된 것과 같은 표적화된 통합 방법들은 또한 하나 또는 그 이상의 외인성 서열을 통합하기 위해 사용될 수 있다. 외인성 핵산 서열은 예를 들면 하나 또는 그 이상의 유전자 또는 cDNA 분자, 또는 어떠한 유형의 코딩 또는 비코딩 서열뿐 아니라, 하나 또는 그 이상의 대조 요소들 (예컨대 프로모터)을 포함할 수 있다. 또한, 외인성 핵산 서열은 하나 또는 그 이상의 RNA 분자들 (예컨대 작은 헤어핀 RNA (shRNA), 억제 RNA (RNAi), 마이크로RNA (miRNA) 등)을 생성할 수 있다.
"절단"은 DNA 분자의 공유 골격의 파괴를 말한다. 절단은 그것들에 한정되는 것은 아니지만, 포스포다이에스테르 결합의 효소적 또는 화학적 가수분해를 포함하는 다양한 방법에 의해 개시될 수 있다. 단일-가닥의 절단 및 이중-가닥의 절단은 둘 다 가능하고, 이중-가닥의 절단은 2개의 구별되는 단일-가닥의 절단 사건의 결과로서 발생할 수 있다. DNA 절단은 블런트 단부 또는 엇갈리는 (staggered) 단부 중 어느 하나의 생성을 초래할 수 있다. 특정 구체예에서, 융합 폴리펩티드는 표적화된 이중-가닥의 DNA 절단에 대해 사용된다.
"절단 하프-도메인"은 제 2 폴리펩티드 (동일하거나 상이한)와 함께 절단 활성 (바람직하게 이중-가닥 절단 활성)을 가지는 복합체를 형성하는 폴리펩티드 서열이다. 용어 "제 1 및 제 2 절단 하프-도메인", "+ 및 - 절단 하프-도메인" 및 "우측 및 좌측 절단 하프-도메인"은 이량체화하는 절단 하프-도메인의 쌍들을 나타내기 위해 상호교환적으로 사용된다.
"엔지니어링된 절단 하프-도메인"은 다른 절단 하프-도메인과의 필수 이종이량체를 형성하기 위해 변형된 절단 하프-도메인이다 (예컨대 다른 엔지니어링된 절단 하프-도메인). 또한 미국 특허 공보 번호 2005/0064474, 20070218528, 2008/0131962 및 2011/0201055 (전체 내용이 참조로 본원에 포함됨) 참조.
용어 "서열"은 DNA 또는 RNA일 수 있는 어떠한 길이의 뉴클레오티드 서열을 말하고; 선형, 원형 또는 분지형일 수 있으며 단일-가닥 또는 이중-가닥 중 어느 하나일 수 있다. 용어 "공여자 서열"은 게놈에 삽입되는 뉴클레오티드 서열을 말한다. 공여자 서열은 어떠한 길이의 것일 수 있으며, 예를 들면 2 내지 10,000 뉴클레오티드 길이 (또는 그 사이의 또는 그 이상의 어떠한 정수 값), 바람직하게 약 100 내지 1,000 뉴클레오티드 길이 (또는 그 사이의 어떠한 정수), 보다 바람직하게 약 200 내지 500 뉴클레오티드 길이일 수 있다.
"크로마틴"은 세포의 게놈을 포함하는 핵단백질 구조이다. 세포성 크로마틴은 히스톤 및 비-히스톤 염색체 단백질을 포함하여 핵산, 주로 DNA 및 단백질을 포함한다. 진핵세포 크로마틴의 대부분은 뉴클레오좀의 형태로 존재하며, 이때 뉴클레오좀 코어는 각각 히스톤 H2A, H2B, H3 및 H4의 2개; 및 뉴클레오좀 코어 사이에 뻗어 있는 링커 DNA (유기체에 따라 길이가 가변적임)를 포함하는 8량체와 관련된 대략 150 염기쌍의 DNA를 포함한다. 히스톤 H1의 분자는 일반적으로 링커 DNA와 관련된다. 본 개시의 목적에 대해, 용어 "크로마틴"은 원핵세포 및 진핵세포 둘 다의, 세포 핵단백질의 모든 형태를 포함하는 것을 의미한다. 세포성 크로마틴은 염색체 및 에피솜성 크로마틴 둘 다를 포함한다.
"염색체"는 세포의 게놈의 전부 또는 일부를 포함하는 크로마틴 복합체이다. 세포의 게놈은 자주, 세포의 게놈을 포함하는 모든 염색체의 집합인, 그것의 핵형을 특징으로 한다. 세포의 게놈은 하나 또는 그 이상의 염색체를 포함할 수 있다.
"에피솜"은 복제하는 핵산, 핵단백질 복합체 또는 세포의 염색체 핵형의 일부가 아닌 핵산을 포함하는 다른 구조이다. 에피솜의 실례는 플라스미드와 특정 바이러스 게놈을 포함한다.
"표적 부위" 또는 "표적 서열"은 결합에 대한 충분한 조건이 존재한다면, 결합 분자가 결합할 핵산의 부분을 규정하는 핵산 서열이다.
"외인성" 분자는 정상적으로 세포에 존재하지 않지만, 하나 또는 그 이상의 유전적, 생화학적 또는 다른 방법에 의해 세포 안에 도입될 수 있는 분자이다. "세포에서의 정상적인 존재"는 세포의 특정 발달 단계 및 환경 조건에 관련하여 측정된다. 그러므로, 예를 들어 근육의 배아 발생 중에만 존재하는 분자는 성인 근육 세포에 대해 외인성 분자이다. 유사하게, 열 충격에 의해 유도된 분자는 비-열-충격 세포에 대해서 외인성 분자이다. 외인성 분자는, 예를 들면 기능부전 외인성 분자의 기능화 버전 또는 정상적으로 기능하는 내인성 분자의 기능부전 버전을 포함할 수 있다.
외인성 분자는 다른 것들 중에서도, 예컨대 조합된 화학 방법에 의해 생성된 작은 분자, 마크로분자, 예컨대 단백질, 핵산, 탄수화물, 지질, 당단백질, 리포단백질, 다당, 상기 분자들의 어떠한 변형된 유도체 또는 상기 분자들 중 하나 또는 그 이상을 포함하는 어떠한 복합체일 수 있다. 핵산은 DNA 및 RNA를 포함하고, 단일- 또는 이중-가닥일 수 있으며; 선형, 분지된 또는 원형일 수 있고; 어떠한 길이의 것일 수 있다. 핵산은 이중나선을 형성할 수 있는 것들뿐 아니라 삼중나선-형성 핵산을 포함한다. 예를 들면 미국 특허 번호 5,176,996 및 5,422,251 참조. 단백질은 그것들에 한정되는 것은 아니지만, DNA-결합 단백질, 전사 인자, 크로마틴 리모델링 인자, 메틸화된 DNA 결합 단백질, 중합효소, 메틸화제, 탈메틸화제, 아세틸화제, 탈아세틸화제, 키나아제, 포스파타제, 통합효소, 재조합효소, 리가아제, 토포아이소메라제, 기라아제 및 헬라카아제를 포함한다.
외인성 분자는 내인성 분자와 동일한 유형의 분자, 예컨대 외인성 단백질 또는 핵산일 수 있다. 예를 들어, 외인성 핵산은 세포 안에 도입된 감염성 바이러스 게놈, 플라스미드 또는 에피솜 또는 세포에 자연적으로 존재하지 않는 염색체를 포함할 수 있다. 외인성 분자를 세포 안에 도입시키기 위한 방법들은 기술분야의 숙련자들에게 공지되어 있고, 그것들에 한정되는 것은 아니지만, 지질-중재된 전달 (즉 중성 및 양이온성 지질을 포함하여 리포솜), 일렉트로포레이션, 직접 주입, 세포 융합, 입자 폭발, 칼슘 포스페이트 공-침전, DEAE-덱스트란-중재된 전달 및 바이러스 벡터-중재된 전달을 포함한다. 외인성 분자는 또한 외인성 분자와 동일한 유형의 분자일 수 있지만 세포가 유도되는 것과 상이한 종으로부터 유도될 수 있다. 예를 들어, 인간 핵산 서열은 원래 마우스 또는 햄스터로부터 유도된 셀라인으로 도입될 수 있다.
대조적으로, "외인성" 분자는 특정 환경 조건하에서 특정 발달 단계에 있는 특정 세포에 정상적으로 존재하는 것이다. 예를 들어 외인성 핵산은 염색체, 미토콘드리아의 게놈, 엽록체 또는 다른 기관, 또는 자연-발생적인 에피솜성 핵산을 포함할 수 있다. 추가의 외인성 분자는 단백질, 예를 들면 전사 인자 및 효소들을 포함할 수 있다.
용어 "유전자 리프레서"는 하나 또는 그 이상의 유전자의 발현을 어떤 정도로 감소시키는 어떠한 분자를 말한다. 억제될 수 있는 유전자들의 비-제한적인 실례는 HD에 관련된 생체마커들을 포함한다 (예컨대 DARPP-32A, PDE10a, Drd1 및/또는 Drd2). 그런 유전자 억압은 대상의 헌팅턴병의 치료 및/또는 예방을 초래할 수 있다. 유전자 리프레서는 어떠한 분자, 이를테면 그것들에 한정되는 것은 아니지만, 유전자 (예컨대 헌팅틴 유전자)의 발현을 억제하는 작은 분자, 핵산 및/또는 단백질 (예컨대 징크 핑거 단백질, CRISRP/Cas 또는 TALE 도메인과 같은 비-자연 발생적인 DNA-결합 도메인을 포함하는 단백질)일 수 있다. 유전자 리프레서 단백질은 융합 분자, 예를 들면 DNA-결합 도메인과 전사 조절 도메인을 포함하는 융합 단백질 전사 인자들 (예컨대 ZFP-TF, CRISPR/dCas-TF 또는 TALE-TF) 또는 DNA-결합 도메인 및 뉴클레아제 도메인을 포함하는 뉴클레아제들 (예컨대 ZFN, TALEN, CRISPR/Cas 및/또는 Ttago 뉴클레아제 시스템)을 포함할 수 있다. 일부 구체예에서, 유전자 리프레서는 그것의 게놈 DNA 또는 전사물 형태, 예컨대 mRNA의 헌팅틴 유전자에 특이적으로 결합한다.
"융합" 분자는 둘 또는 그 이상의 하위유닛 분자들이, 바람직하게 공유적으로 연결되어 있는 분자이다. 하위유닛 분자들은 동일한 화학적 유형의 분자이거나, 상이한 화학적 유형의 분자들일 수 있다. 제 1 유형의 융합 분자의 실례는, 그것들에 한정되는 것은 아니지만, 융합 단백질 (예를 들면 ZFP 또는 TALE DNA-결합 도메인과 하나 또는 그 이상의 활성화 도메인 사이의 융합) 및 융합 핵산 (예를 들면 상기에서 기술된 융합 단백질을 코드화하는 핵산)을 포함한다. 제 2 유형의 융합 분자의 실례는, 그것들에 한정되는 것은 아니지만, 삼중나선-형성 핵산과 폴리펩티드 사이의 융합, 및 소수의 홈 결합제와 핵산 사이의 융합을 포함한다.
세포에서 융합 단백질의 발현은 융합 단백질의 세포에의 전달로부터 또는 융합 단백질을 코드화하는 폴리뉴클레오티드의 세포에의 전달에 의해 유발될 수 있ㄴ는데, 이때 폴리뉴클레오티드는 전사되고, 그 전사물은 번역되어 융합 단백질이 생성된다. 트랜스-스플라이싱, 폴리펩티드 절단 및 폴리펩티드 결찰이 또한 세포에서 단백질의 발현에 포함될 수 있다. 폴리뉴클레오티드 및 폴리펩티드를 세포에 전달하기 위한 방법들은 본 개시의 다른 곳에서 제공된다.
"다량체화 도메인" (또한 "이량체화 도메인" 또는 "단백질 상호작용 도메인"으로서 언급됨)은 ZFP TF 또는 TALE TF의 아미노, 카르복시 또는 아미노 및 카르복시 말단 영역에서 통합되는 도메인이다. 이들 도메인은 다수의 ZFP TF 또는 TALE TF의 다량체화를 허용함으로써 트라이뉴클레오티드 반복 도메인의 더 큰 트랙트들이 야생형 길이 수를 가지는 더 짧은 트랙트에 비하여 다량체화된 ZFP TF 또는 TALE TF에 의해 우선적으로 결합된다. 다량체화 도메인의 실례는 로이신 지퍼를 포함한다. 다량체화 도메인은 또한 작은 분자들에 의해서도 조절될 수 있는데, 이때 다량체화 도메인은 적절한 형태를 가정하여 작은 분자 또는 외부 리간드의 존재하에서만 다른 다량체화 도메인과의 상호작용이 허용된다. 이런 방식으로, 외인성 리간드는 이들 도메인의 활성을 조절하기 위해 사용될 수 있다.
본 개시의 목적에 대해 "유전자"는 유전자 생성물을 코드화하는 DNA 영역 (하기 참조)뿐 아니라, 조절 서열이 코딩 및/또는 전사된 서열에 인접한지의 여부와 관계없이, 유전자 생성물의 생성을 조절하는 모든 DNA 영역을 포함한다. 따라서, 유전자는 그것에 반드시 한정되는 것은 아니지만, 프로모터 서열, 터미네이터, 전사 조절 서열, 예컨대 리보솜 결합 부위 및 내부 리보솜 유입 부위, 인핸서, 침묵자, 인슐레이터, 경계선 요소, 복제 기원, 매트릭스 부착 부위 및 유전자좌 제어 영역을 포함한다.
"유전자 발현"은 유전자에 함유된 정보의, 유전자 생성물로의 전환을 말한다. 유전자 생성물은 유전자의 직접적인 전사 생성물 (예컨대 mRNA, tRNA, rRNA, 안티센스 RNA, 리보자임, 구조적 RNA 또는 어떠한 다른 유형의 RNA) 또는 mRNA의 번역에 의해 생성된 단백질일 수 있다. 유전자 생성물은 또한 캡핑, 폴리아데닐화, 메틸화 및 편집과 같은 과정들에 의해 변형된 RNA, 및 예를 들면 메틸화, 아세틸화, 포스포릴화, 유비퀴틴화, ADP-리보실화, 미리스틸화 및 글리코실화에 의해 변형된 단백질들을 포함한다.
유전자 발현의 "변조"는 유전자의 활성의 변화를 말한다. 발현의 변조는 그것들에 한정되는 것은 아니지만, 유전화 활성화 및 유전자 억압을 포함할 수 있다. 게놈 편집 (예컨대 절단, 변경, 비활성화, 무작위 돌연변이)은 발현을 변조시키기 위해 사용될 수 있다. 유전자 비활성화는 본원에 기술된 ZFP 또는 TALE 단백질을 포함하지 않는 세포에 비교하여 유전자 발현에 어떠한 감소를 말한다. 그러므로 유전자 비활성화는 부분적이거나 완전할 수 있다.
"관심의 영역"은 세포성 크로마틴의 어떠한 영역, 예컨대 예를 들면 유전자 내의 또는 유전자에 인접한 유전자 또는 비-코딩 서열이고, 이때 외인성 분자에 결합하는 것이 바람직하다. 결합은 표적화된 DNA 절단 및/또는 표적화된 재조합의 목적에 대한 것일 수 있다. 관심의 영역은 염색체, 에피솜, 소기관 게놈 (예컨대 미토콘드리아성, 엽록체성), 또는 예를 들면 감염성 바이러스 게놈에 존재할 수 있다. 관심의 영역은 유전자의 코딩 영역 내에, 예를 들면 리더 서열, 트레일러 서열 또는 인트론과 같은 전사딘 비-코딩 영역 내에, 또는 코딩 영역의 상류나 하류에 있는 비-전사 영역 내에 있을 수 있다. 관심의 영역은 단일 뉴클레오티드 쌍처럼 작거나 길이가 최대 2,000 뉴클레오티드 쌍이거나, 또는 뉴클레오티드 쌍의 어떠한 적분 값일 수 있다.
"진핵" 세포는 그것에 한정되는 것은 아니지만, 진균 세포 (예컨대 효모), 식물 세포, 동물 세포, 포유류 세포 및 인간 세포 (예컨대 T-세포)를 포함한다.
용어 "작동성 연쇄" 및 "작용가능하게 연결된" (또는 "작동가능하게 연결된")은 둘 또는 그 이상의 성분들 (예컨대 서열 요소들)의 병렬과 관련하여 상호교환적으로 사용되며, 이때 성분들은 두 가지 성분이 정상적으로 기능하고 성분들 중 적어도 하나가 다른 성분들 중 적어도 하나에 대해 발휘되는 기능을 중재할 수 있는 가능성을 허용하도록 배열되어 있다. 예를 들면, 전사 조절 서열, 예컨대 프로모터는 만약 전사 조절 서열이 하나 또는 그 이상의 전사 조절 인자의 존재 또는 부재에 대한 반응으로 코딩 서열의 전사 수준을 제어한다면 코딩 서열에 작용가능하게 연결된 것이다. 전사 조절 서열은 일반적으로 코딩 서열과 인 시스로 (in cis) 작용가능하게 연결되지만, 직접 그것에 인접할 필요는 없다. 예를 들어, 인핸서는 연속적이지는 않지만, 코딩 서열에 작용가능하게 연결되어있는 전사 조절 서열이다.
융합 폴리펩티드와 관련하여, 용어 "작용가능하게 연결된"은 각각의 성분이 다른 성분과 연합하여 그것이 마치 그렇게 연결되지 않았을 때와 동일한 기능을 수행하는 사실을 나타낼 수 있다. 예를 들어 ZFP 또는 TALE DNA-결합 도메인이 활성화 도메인에 융합되어 있는 융합 폴리펩티드에 관련하여, ZFP 또는 TALE DNA-결합 도메인 및 활성화 도메인은 만약 융합 폴리펩티드에서, ZFP 또는 TALE DNA-결합 도메인 부분이 그것의 표적 부위 및/또는 그것의 결합 부위에 결합할 수 있는 한편, 활성화 도메인이 유전자 발현을 상향조절할 수 있다면 작용가능하게 연쇄된 것이다. 유전자 발현을 조절할 수 있는 도메인들에 융합된 ZFP는 포괄적으로 "ZFP-TF" 또는 "징크 핑거 전사 인자"로서 언급되는 한편, 유전자 발현을 조절할 수 있는 도메인들에 융합된 TALE는 "TALE-TF" 또는 "TALE 전사 인자"로서 포괄적으로 언급된다. ZFP DNA-결합 도메인이 절단 도메인 ("ZFN" 또는 "징크 핑거 뉴클레아제"), ZFP DNA-결합 도메인 및 절단 도메인에 융합되어 있는 융합 폴리펩티드가 만약 융합 폴리펩티드에서 작용가능한 연쇄에 있을 때, ZFP DNA-결합 도메인 부분은 그것의 표적 부위 및/또는 그것의 결합 부위에 결합할 수 있는 한편, 절단 도메인은 표적 부위에 근접한 곳에서 DNA를 절단할 수 있다. TALE DNA-결합 도메인이 절단 도메인 ("TALEN" 또는 "TALE 뉴클레아제"), TALE DNA-결합 도메인 및 절단 도메인에 융합되어 있는 융합 폴리펩티드가 만약 융합 폴리펩티드에서 작용가능한 연쇄에 있을 때, TALE DNA-결합 도메인 부분은 그것의 표적 부위 및/또는 그것의 결합 부위에 결합할 수 있는 한편, 절단 도메인은 표적 부위에 근접한 곳에서 DNA를 절단할 수 있다.
단백질, 폴리펩티드 또는 핵산의 "기능성 단편"은 그것의 서열이 전-길이 단백질, 폴리펩티드 또는 핵산에 동일하지 않지만, 아직은 전-길이 단백질, 폴리펩티드 또는 핵산과 동일한 기능을 보유하는 단백질, 폴리펩티드 또는 핵산이다. 기능성 단편은 상응하는 천연 분자보다 많거나, 더 적거나 또는 동일한 수의 잔기를 가질 수 있고, 및/또는 하나 또는 그 이상의 아미노산 또는 뉴클레오티드 치환을 함유할 수 있다. 핵산의 기능 (예컨대 코딩 기능, 다른 핵산에 혼성화하는 능력)을 측정하기 위한 방법들은 기술분야에 잘 알려져 있다. 유사하게, 단백질 기능을 측정하기 위한 방법들은 잘 알려져 있다. 예를 들어 폴리펩티드의 DNA-결합 기능은 필터-결합, 전기영동적 이동성-변동 또는 면역침전 분석에 의해 측정될 수 있다. DNA 절단은 겔 전기영동에 의해 분석될 수 있다. Ausubel et al., 상기 동일 참조. 다른 단백질과 상호작용하는 한 단백질의 능력은 예를 들면 공-면역침전, 둘 다 유전적이고 생화학적인 2-하이브리드 분석 또는 보상에 의해 측정될 수 있다. 예를 들면 Fields et al. (1989) Nature 340:245-246; 미국 특허 번호 5,585,245 및 PCT WO 98/44350 참조.
"벡터"는 표적 세포에 유전자 서열을 전달할 수 있다. 전형적으로 "벡터 구성물", "발현 벡터" 및 "유전자 전달 벡터"는 관심의 유전자의 발현을 지시할 수 있고 유전자 서열을 표적 세포에 전달할 수 있는 어떠한 핵산 구성물을 의미한다. 그러므로 용어는 클로닝, 및 발현 비히클뿐 아니라 통합 벡터를 포함한다.
"리포터 유전자" 또는 "리포터 서열"은 쉽게 측정되는, 바람직하게는 비록 본질적으로 기본적인 분석으로가 아니어도 측정되는 단백질 생성물을 생성하는 어떠한 서열을 말한다. 적합한 리포터 유전자는, 그것들에 한정되는 것은 아니지만, 항생물질 내성 (예컨대 암피실린 내성, 네오마이신 내성, G418 내성, 퓨로마이신 내성)을 중재하는 단백질을 코드화하는 서열, 착색된 또는 형광 또는 발광 단백질 (예컨대 녹색 형광 단백질, 증강된 녹색 형광 단백질, 적색 형광 단백질, 루시페라제)을 코드화하는 서열 및 증강된 세포 성장 및/또는 유전자 증폭을 중재하는 단백질 (예컨대 다이하이드로폴레이트 환원효소)을 포함한다. 에피토프 태그는 예를 들면 FLAG, His, myc, Tap, HA 또는 어떠한 검출가능한 아미노산 서열의 하나 또는 그 이상의 복사물을 포함한다. "발현 태그"는 관심의 유전자의 발현을 모니터링하기 위하여 원하는 유전자 서열에 작동가능하게 연결될 수 있는 리포터를 코드화하는 서열을 포함한다.
헌팅턴병의
생체마커
중간 가시 뉴런들은 HD에 고도로 민감하다. 엔케팔린을 함유하고 외부 담창구로 돌출된 (소위 "간접 경로"로) MSN은 물질 P를 함유하고 내부 담창구로 돌출된 ("직접" 경로로) 뉴런보다 많이 포함되지만, 두 유형의 MSN 둘 다 영향을 받는다. HD의 MSN은 비정상적인 응집 및 htt, 생체에너지학적 결함, 뉴로토핀 결핍, 전사 조절장애, 엑손 수송의 장애 및 흥분성 독성의 포함을 나타낸다.
예를 들어 DARPP-32 (도파민- 및 -cAMP-조절된 인단백질, Mr 32 kDa)는 선조체에서 도파민 및 단백질 키나아제 A에 대한 주요 표적이고, DARP-32가 Thr34에서 인산화될 때 단백질 포스파타제 1 (PP-1)의 억제제로서 작용할 수 있고, Thr75에서 인산화될 때 PKA의 억제제로서 작용할 수 있다는 점에서 인산화의 상태 및 위치에 따라 이중-기능 단백질로서 작용한다 (Svenningsson et al, (2004) Annu Rev Pharmacol Toxicol 44:269-96). 그것은 MSN의 97%에서, 여러 피층에서 및 소뇌의 푸르킨p 세포에서 발현된다. 그러나 HD의 마우스 모델에서, 그것의 mRNA 발현은 MSN에서 피질에서의 그것보다 큰 정도로 하향 조절된다 (Ehrlich (2012) Neurotherapeutics 9(2):270-284 참조).
선조체-특이적 고리형 뉴클레오티드 포스포다이에스테라제 PDE10A는 효소적 가수분해를 통해 고리형 뉴클레오티드 신호화를 제한하기 위해 선조체에서 작용한다. 그것은 간접 및 직접 MSN 둘 다에서 고수준으로 발현되고 (Kleiman et al, 2011 J of Pharma and Exp Thera 336(1):64-78 참조) HD에서 하향 조절되는 이중 기질 PDE이다.
선조체의 도파민 신호화는 부분적으로 도파민 수용체에 의해 조절되고 간접 MSN은 D1 및 D2 도파민 수용체를 발현한다 (각각 Drd1 및 Drd2). 흑질 부분에 돌출되는 직접 경로의 D1 발현 세포들은 망상을 이루는 한편, 중간 담창구로 돌출되는 간접 경로의 D2 수용체 발현 MSN, 및 기초적인 강글리아 기능화의 고전적 모델은 이동의 제어시 도파민의 차등 작용을 선택하는 선조체의 능력은 D1 및 D2 수용체의 MSN의 두 그룹으로의 분리에 기인하는 것을 시사한다 (Gerfen et al (1990) Science 250:1429-1432 참조). 그러므로, 두 Drd1 및 Drd2 유전자의 발현은 MSN의 본질적인 기능이고 발현의 불균형 또는 결함은 HD에서 관찰된 운동 기능의 파괴를 유도할 수 있다.
인간 HD 꼬리 (caudate)에서 관찰된 것들을 개괄하는 것으로 나타난 HD에서의 MSN 기능의 다른 생체마커들은 PENK (프로엔케팔린), RGS4 (G-단백질 신호화 4의 조절자), 전사 인자 NGFi-A, 칼슘/칼모듈린-의존성 3',5'-고리형 뉴클레오티드 포스포다이에스테라제 1B PDE1B 및 CNR1 (칸나비노이드 CB1 수용체)의 감소를 포함한다 (Runne et al, 상기 동일). 추가로, 돌연변이 htt 유전자의 발현 또한 직접적으로 분석될 수 있다.
마우스 모델에서 움켜쥐기 행동은 질병을 나타낸다. 상대적으로 공격적인 R6/2 마우스 모델에서, 인간 Htt 프로모터 및 확장된 CAG 반복을 함유하는 엑손 1 단편은 이소성으로 (ectopically) 발현된다 (Mangiarini et al. 상기 동일). 이들 마우스는 선조체의 중간 가시 뉴런 (MSN)의 손실뿐 아니라 HD의 특징인 HD-유사 행동의 변화를 나타낸다. 사망시 연령은 일반적으로 10주 내지 13주 사이이고 (그것보다 빠르게 또는 나중에 사망할 수도 있음), 마우스는 점진적인 신경학적 표현형을 나타낸다. 첫 번째 증상들 중 허나는 꼬리를 잡혔을 때 사지의 운동장애이다. 이것은 마우스가 그들의 발을 꼬리를 잡힌 직후에 함께 움켜쥐었다가 더 이상 자세를 바꿀 수 없을 때까지 번갈아 발을 함께 움켜쥐고 놓아버리는 것으로 진행된다. 그러므로 움켜쥐기 행동은 HD 표현형 행동의 정도의 척도로서 점수가 매겨질 수 있다.
HD에서 표현형 개선은 처리된 동물과 미처리 동물을 비교함으로써 측정될 수 있다. 모델은 움켜쥐기 행동 및 희생 후 생체마커의 변화를 측정함으로써 평가될 수 있다. 예를 들어 Rodriguez-Lebron 등은 (Rodriguez-Lebron et al (2005, Mol Ther 12(4):618-633) 움켜쥐기 행동과 DARPP-32 및 PENK 발현의 변화의 분석을 사용하여 htt에 대한 shRNA의 효능을 측정하였다.
DBA-결합 도메인
본원에는 그것에 한정되는 것은 아니지만 Htt를 포함하여 트라이뉴클레오티드 반복을 포함하고 있는 어떠한 유전자에서 표적 서열에 특이적으로 결합하는 DNA-결합 도메인을 포함하고 있는 조성물이 기술된다. 어떠한 DNA-결합 도메인이든지 본원에 개시된 조성물 및 방법에 사용될 수 있다.
특정 구체예에서, DNA 결합 도메인은 징크 핑거 단백질을 포함한다. 바람직하게, 징크 핑거 단백질은 그것이 선택된 표적 부위에 결합하기 위해 엔지니어링되는 점에서 비-자연적으로 발생한다. 예를 들면 Beerli et al. (2002) Nature Biotechnol. 20:135-141; Pabo et al. (2001) Ann. Rev. Biochem . 70:313-340; Isalan et al. (2001) Nature Biotechnol . 19:656-660; Segal et al. (2001) Curr . Opin . Biotechnol . 12:632-637; Choo et al. (2000) Curr . Opin . Struct . Biol . 10:411-416; 미국 특허 번호 6,453,242; 6,534,261; 6,599,692; 6,503,717; 6,689,558; 7,03 0,215; 6,794,136; 7,067,317; 7,262,054; 7,070,934; 7,361,635; 7,253,273; 및 미국 특허 공보 번호 2005/0064474; 2007/0218528; 2005/0267061 참조, 모두 본원에 전체 내용이 참조로 포함됨.
엔지니어링된 징크 핑거 결합 도메인은 자연-발생 징크 핑거 단백질에 비교하여 신규한 결합 특이성을 가질 수 있다. 엔지니어링 방법은, 그것들에 한정되는 것은 아니지만 합리적인 디자인 및 다양한 유형의 선택을 포함한다. 합리적인 디자인은, 예를 들면 트리플렛 (또는 콰드러플렛) 뉴클레오티드 서열 및 개별적인 징크 핑거 아미노산 서열을 포함하는 데이터베이스를 사용하는 것을 포함하는데, 이때 각각의 트리플렛 또는 콰드러플렛 뉴클레오티드 서열은 특정 트리플렛 또는 콰드러플렛 서열이 결합하는 징크 핑거의 하나 또는 그 이상의 아미노산 서열과 관련된다. 예를 들면 공동 소유의 미국 특허 번호 6,453,242 및 6,534,261 참조 (본원에 전체 내용이 참조로 포함됨).
파지 디스플레이 및 2-하이브리드 시스템을 포함하여, 예시적인 선택 방법은 미국 특허 5,789,538; 5,925,523; 6,007,988; 6,013,453; 6,410,248; 6,140,466; 6,200,759; 및 6,242,568; 뿐만 아니라 WO 98/37186; WO 98/53057; WO 00/27878; WO 01/88197 및 GB 2,338,237에 개시된다.
또한, 이들 및 다른 참고문헌에 개시된 것과 같이, 징크 핑거 도메인 및/또는 다중-핑거의 징크 핑거 단백질들은 예를 들면 길이가 5 또는 그 이상의 아미노산인 링커를 포함하여 어떠한 적합한 링커 서열을 사용하여 함께 연결될 수 있다. 또한 길이가 6 또는 그 이상의 아미노산인 예시적인 링커에 대해서는 미국 특허 번호 6,479,626; 6,903,185; 및 7,153,949를 참조한다. 본원에 기술된 단백질들은 단백질의 개별적인 징크 핑거들 사이의 적합한 링커의 어떠한 조합을 포함할 수 있다. 또한, 징크 핑거 결합 도메인들에 대한 결합 특이성의 증강은 예를 들면 공동 소유의 WO 02/077227에서 기술되었다.
표적 부위의 선택; 융합 단백질 (및 그것을 코드화하는 폴리뉴클레오티드)의 디자인 및 구성을 위한 ZFP 및 방법들은 기술분야의 숙련자들에게 알려져 있고 미국 특허 번호 6,140,081; 5,789,538; 6,453,242; 6,534,261; 5,925,523; 6,007,988; 6,013,453; 6,200,759; WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970; WO 01/88197; WO 02/099084; WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536 및 WO 03/016496에 상세하게 기술되어 있다.
또한, 이들 및 다른 참고문헌에 개시된 것과 같이, 징크 핑거 도메인 및/또는 다중-핑거의 징크 핑거 단백질들은 예를 들면 길이가 5 또는 그 이상의 아미노산인 링커를 포함하여 어떠한 적합한 링커 서열을 사용하여 함께 연결될 수 있다. 또한 길이가 6 또는 그 이상의 아미노산인 예시적인 링커에 대해서는 미국 특허 번호 6,479,626; 6,903,185; 및 7,153,949를 참조한다. 본원에 기술된 단백질들은 단백질의 개별적인 징크 핑거들 사이의 적합한 링커의 어떠한 조합을 포함할 수 있다.
특정 구체예에서, DNA 결합 도메인은 Htt에서 표적 부위에 결합하고 (서열-특이적 방식으로) Htt의 발현을 변조하는 엔지니어링된 징크 핑거 단백질이다. ZFP는 돌연변이 Htt 대립유전자 또는 야생형 Htt 서열 중 어느 하나에 선택적으로 결합할 수 있다. Htt 표적 부위는 전형적으로 적어도 하나의 징크 핑거를 포함하지만 다수의 징크 핑거 (예컨대 2, 3, 4, 5, 6 또는 그 이상의 핑거)를 포함할 수 있다. 통상적으로 ZFP는 적어도 3개의 핑거를 포함한다. 어떤 ZFP는 4, 5 또는 6개의 핑거를 포함하는 한편, 일부 ZFP는 8, 9, 10, 11 또는 12개의 핑거를 포함한다. 3개의 핑거를 포함하는 ZFP는 전형적으로 9 또는 10개의 뉴클레오티드를 포함하는 표적 부위를 인식하고; 4개의 핑거를 포함하는 ZFP는 전형적으로 12 내지 14개의 뉴클레오티드를 포함하는 표적 부위를 인식하는 한편; 6개의 핑거를 가지는 ZFP는 18 내지 21개의 뉴클레오티드를 포함하는 표적 부위를 인식한다. ZFP는 또한 하나 또는 그 이상의 조절 도메인을 포함하는 융합 단백질일 수 있고, 그 도메인은 전사 활성화 또는 억압 도메인일 수 있다. 일부 구체예에서, 융합 단백질은 함께 연결되어 있는 2개의 ZFP DNA 결합 도메인을 포함한다. 그러므로 이들 징크 핑거 단백질은 8, 9, 10, 11, 12 또는 그 이상의 핑거를 포함할 수 있다. 일부 구체예에서, 2개의 DNA 결합 도메인은 확장가능한 가용성 링커를 통해 연결되어서 하나의 DNA 결합 도메인은 4, 5 또는 6개의 징크 핑거를 포함하고 제 2 DNA 결합 도메인은 추가의 4, 5 또는 6개의 징크 핑거를 포함한다. 일부 구체예에서, 링커는 표준 핑거-내 링커여서 핑거 어레이는 8, 9, 10, 11 또는 12 또는 그 이상의 핑거를 VHG마하는 하나의 DNA 결합 도메인을 포함한다. 다른 구체예에서, 링커는 가요성 링커와 같은 비정형 링커이다. DNA 결합 도메인은 적어도 하나의 조절 도메인에 융합되고 'ZFP-ZFP-TF' 구조인 것으로 여겨질 수 있다. 이들 구체예의 구체적인 실례는 가요성 링커로 연결되고 KOX 리프레서에 융합되어 있는 2개의 DNA 결합 도메인을 포함하는 "ZFP-ZFP-KOX" 로서, 및 2개의 ZFP-KOX 융합 단백질이 링커를 통해 함께 융합되는 "ZFP-KOX-ZFP-KOX"로서 언급될 수 있다.
다르게는, DNA-결합 도메인은 뉴클레아제로부터 유도될 수 있다. 예를 들어, 귀소성 (homing) 엔도뉴클레아제 및 메가뉴클레아제의 인식 서열들, 예컨대 I-SceI, I-CeuI, PI-PspI, PI-Sce, I-SceIV, I-CsmI, I-PanI, I-SceII, I-PpoI, I-SceIII, I-CreI, I-TevI, I-TevII 및 I-TevIII은 알려져 있다. 또한 미국 특허 번호 5,420,032; 미국 특허 번호 6,833,252; Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388; Dujon et al. (1989) Gene 82:115-118; Perler et al. (1994) Nucleic Acids Res. 22, 1125-1127; Jasin (1996) Trends Genet. 12:224-228; Gimble et al. (1996) J. Mol . Biol . 263:163-180; Argast et al. (1998) J. Mol . Biol. 280:345-353 및 New England Biolabs 카탈로그 참조. 또한, 귀소성 엔도뉴클레아제 및 메가뉴클레아제의 DNA-결합 특이성은 비-천연 표적 부위에 결합하기 위해 엔지니어링될 수 있다. 예를 들어 Chevalier et al. (2002) Molec . Cell 10:895-905; Epinat et al. (2003) Nucleic Acids Res. 31:2952-2962; Ashworth et al. (2006) Nature 441:656-659; Paques et al. (2007) Current Gene Therapy 7:49-66; 미국 특허 공보 20070117128 참조.
"양손" 징크 핑거 단백질은 징크 핑거 DNA 결합 도메인의 두 개의 클러스터가 개재된 아미노산에 의해 분리되어서 2개의 징크 핑거 도메인이 2개의 불연속 표적 부위에 결합되는 그런 단백질이다. 징크 핑거 결합 단백질의 양손 유형의 실례는 SIPI이고, 이때 4개의 징크 핑거의 클러스터는 단백질의 아미노 말단에 위치하고 3개의 핑거의 클러스터는 카르복실 말단에 위치한다 (Remacle et al, (1999) EMBO Journal 18 (18): 5073-5084 참조). 이들 단백질의 징크 핑거의 각각의 클러스터는 독특한 표적 서열에 결합할 수 있고 두 개의 표적 서열 사이의 스페이싱은 많은 뉴클레오티드를 포함할 수 있다. 양손 ZFP는 예를 들면 ZFP의 하나 또는 둘 다에 융합된 기능성 도메인을 포함할 수 있다. 그러므로, 기능성 도메인은 하나 또는 둘 다의 ZFP의 외부에 부착될 수 있거나 (도 1c 참조), ZFP 사이에 위치할 수 있다 (둘 다의 ZFP에 부착됨) (도 4 참조).
Htt-표적화된 ZFP의 특이적인 실례는 표 1A 및 1B에 개시된다. 이 표에서 첫 번째 칼럼은 ZFP에 대한 내부 참조 명칭 (번호)이고 표 2A 및 2B의 칼럼 1의 동일한 명칭에 상응한다. "F"는 핑거를 나타내고 "F"에 이어지는 번호는 징크 핑거를 나타낸다 (예컨대 "F1"은 핑거 1을 나타낸다).
이들 단백질의 표적 부위에 대한 서열 및 위치는 표 2A 및 2B에 개시된다. 표 2A 및 2B는 표시된 징크 핑거 단백질에 대한 표적 서열을 나타낸다. ZFP 인식 나선에 의해 접촉된 표적 부위의 뉴클레오티드는 대문자로 표시되고; 비-접촉 뉴클레오티드는 소문자로 표시된다.
특정 구체예에서, DNA-결합 도메인은 자연 발생적인 또는 엔지니어링된 (비-자연적으로 발생하는) TAL 이펙터 (TALE) DNA 결합 도메인을 포함한다. 예컨대 미국 특허 번호 8,586,526 참조, 본원에 전체 내용이 참조로 포함됨. 크산토모나스 속의 식물 병원성 박테리아는 중요한 작물 식물에서 많은 질병을 유발하는 것으로 알려져 있다. 크산토모나스의 병원성은 식물 세포 안으로 25개 이상의 상이한 이펙터 단백질을 주입하는 보존된 유형 III 분비 (T3S) 시스템에 좌우된다. 이들 주입된 단백질 중에는 식물 전사 활성화제를 모방하고 식물 전사체를 조작하는 전사 활성화제-유사 이펙터 (TALE)가 있다 (Kay et al (2007) Science 318:648-651 참조). 이들 단백질은 DNA 결합 도메인 및 전사 활성화 도메인을 함유한다. 가장 잘 특성화된 TALE 중 하나는 Xanthomonas campestgris pv. Vesicatoria로부터의 AvrBs3이다 (Bonas et al (1989) Mol Gen Genet 218:127-136 및 WO2010079430 참조). TALE은 탠덤 반복의 중심화된 도메인을 함유하고, 각각의 반복은 대략 34 아미노산을 함유하고, 그것은 이들 단백질의 DNA 결합 특이성에 대한 핵심이다. 또한, 그것은 핵 정위 서열 및 산성 전사 활성화 도메인을 함유한다 (개관을 위해 Schornack S, et al (2006) J Plant Physiol 163(3):256-272 참조). 또한, 병원성 박테리아 Ralstonia solanacearum에서 brg11 및 hpx17로 표시된 2개의 유전자는 R. solanacearum biovar 1 균주 GMI1000에서 및 biovar 4 균주 RS1000에서의 크산토모나스의 AvrBs3 패밀리에 상동하는 것으로 밝혀졌다 (Heuer et al (2007) Appl and Envir Micro 73(13):4379-4384 참조). 이들 유전자는 서로에 대해 뉴클레오티드 서열에서 98.9% 동일하지만 hpx17의 반복 도메인에서 1,575 염기쌍의 결실이 다르다. 그러나, 두 가지 유전자 생성물은 크산토모나스의 AvrBs3 패밀리와 40% 미만의 서열 동일성을 가진다.
이들 TALE의 특이성은 탠덤 반복에서 발견되는 서열에 좌우된다. 반복된 서열은 대략 102 염기쌍을 포함하고 반복은 전형적으로 서로와 91 내지 100% 상동한다 (Bonas et al, ibid). 반복의 다형태는 통상 위치 12 및 13에 위치하고 위치 12 및 13에서의 초가변성 2개의 잔기의 동일성과 TALE의 표적 서열의 연속적인 뉴클레오티드의 동일성 사이는 1-대-1로 상응하는 것으로 나타난다 (Moscou and Bogdanove, (2009) Science 326:1501 및 Boch et al (2009) Science 326:1509-1512 참조). 실험적으로, 이들 TALE의 DNA 인식에 대한 코드는 위치 12 및 13에서의 HD 서열이 시토신 (C)에 대한 결합을 유도하고, NG는 T에 결합하며, NI는 A, C, G 또는 T에 결합하고, NN은 A 또는 G에 결합하며, IG는 T에 결합하도록 결정될 수 있다. 이들 DNA 결합 반복은 반복의 새로운 조합 및 수를 가지는 단백질로 조립되어 새로운 서열과 상호작용하고 식물 세포에서 비-내인성 리포터 유전자의 발현을 활성화할 수 있는 인공 전사 인자들이 만들어졌다 (Boch et al, 상기 동일). 엔지니어링된 TAL 단백질은 FokI 절단 하프 도메인에 연결되어 효모 리포터 분석 (플라스미드 기초 표적)에서 활성을 나타내는 TAL 이펙터 도메인 뉴클레아제 융합 (TALEN)이 유발된다. Christian et al ((2010)< Genetics epub 10.1534/genetics.110.120717). 또한 미국 특허 번호 8,586,526 참조 (전체 내용이 참조로 포함됨).
ZFP 또는 TALE 단백질들로 사용될 디자인된 이량체화 도메인의 특이한 실례는 표 3에 열거된다. 2 유형의 도메인, 코일형-코일 (CC) 및 이량체화 징크 핑거 (DZ)의 아미노산 서열들이 열거된다.
디자인 명칭 | 아미노산 서열 |
DZ1 |
TKCVHCGIVFLDEVMYALHMSCHGFRDPFECNICGYHSQDRYEFSSHIVRGEH ( SEQ ID NO:122 ) |
TKCVHCGIVFLDEVMYALHMSCHGFRDPFECNICGYHSQDRYEFSSHIVRGEH( SEQ ID NO:122 ) | |
DZ2 |
FKCEHCRILFLDHVMFTIHMGCHGFRDPFKCNMCGEKCDGPVGLFVHMARNAH( SEQ ID NO:123 ) |
TKCVHCGIVFLDEVMYALHMSCHGFRDPFECNICGYHSQDRYEFSSHIVRGEH( SEQ ID NO:122 ) | |
DZ3 |
FKCEHCRILFLDHVMFTIHMGCHGFRDPFKCNMCGEKCDGPVGLFVHMARNAH( SEQ ID NO:123 ) |
HHCQHCDMYFADNILYTIHMGCHGYENPFECNICGYHSQDRYEFSSHIVRGEH( SEQ ID NO:124 ) | |
DZ4 |
HHCQHCDMYFADNILYTIHMGCHSCDDVFKCNMCGEKCDGPVGLFVHMARNAHGEKPTKCVHCGIVFLDEVMYALHMSCHGFRDPFECNICGYHSQDRYEFSSHIVRGEH(SEQ ID NO:125 ) |
FKCEHCRILFLDHVMFTIHMGCHGFRDPFKCNMCGEKCDGPVGLFVHMARNAHGEKPFYCEHCEITFRDVVMYSLHKGYHGFRDPFECNICGYHSQDRYEFSSHIVRGEH(SEQ ID NO:126 ) | |
CC1 |
AQLEKELQALEKKLAQLEWENQALEKELAQ( SEQ ID NO:127 ) |
AQLKKKLQANKKELAQLKWKLQALKKKLAQ( SEQ ID NO:128 ) | |
CC2 |
EQLEKKLQALEKKLAQLEWKNQALEKKLAQ( SEQ ID NO:129 ) |
ALKKELQANKKELAQLKWELQALKKELAQ( SEQ ID NO:130 ) | |
CC3 |
EQLEKKLQALEKKLAQLEWKNQALEK ( SEQ ID NO:131 ) |
ELQANKKELAQLKWELQALKKELAQ ( SEQ ID NO:132 ) | |
CC4 |
EQLEKKLQALEKKLAQLEWKNQA ( SEQ ID NO:133 ) |
QANKKELAQLKWELQALKKELAQ ( SEQ ID NO:134 ) | |
CC5 | EQLEKKLQALEKKLAQLEWKNQALEKKLAQ( SEQ ID NO:129 ) |
ALKKELQANKKELAQLKWELQALKKELAQ( SEQ ID NO:130 ) | |
CC6 | EQLEKKLQALEKKLAQLEWKNQALEKKLAQ( SEQ ID NO:129 ) |
ALKKELQANKKELAQLKWELQALKKELAQ( SEQ ID NO:130 ) | |
CC7 | EQLEKKLQALEKKLAQLEWKNQALEKKLAQ( SEQ ID NO:129 ) |
ALKKELQANKKELAQLKWELQALKKELAQ( SEQ ID NO:130 ) |
융합 단백질
본원에 기술된 DNA-결합 단백질 (예컨대 ZFP 또는 TALE) 및 이종성 조절 (기능성) 도메인 (또는 그것의 기능성 단편)을 포함하는 융합 단백질이 또한 제공된다. 공통 도메인은 예컨대 전사 인자 도메인 (활성화제, 리프레서, 공-활성화제, 공-억제제), 침묵자 (scilencer), 발암 유전자 (예컨대 myc, jun, fos, myb, max, mad, rel, ets, bcl, myb, mos 패밀리 구성원 등); DNA 수복 효소 및 그것들의 관련된 인자 및 변형제; DNA 재배열 효소 및 그것들의 관련된 인자 및 변형제; 크로마틴 관련 단백질 및 그것들의 변형제 (예컨대 키나아제, 아세틸화제 및 탈아세틸화제); 및 DNA 변형 효소 (예컨대 메틸트란스페라제, 토포아이소메라제, 헬리카아제, 결찰효소, 키나아제, 포스파타제, 중합효소, 엔도뉴클레아제) 및 그것들의 관련 인자 및 변형제들을 포함한다. DNA-결합 도메인과 뉴클레아제 절단 도메인의 융합과 관련된 상세한 설명에 대해서는 미국 특허 번호 7,888,121 및 8,409,861을 참조한다 (전체 내용이 본원에 참조로 포함됨).
활성화를 이루기에 적합한 도메인들은 HSV VP16 활성화 도메인 (예컨대 Hagmann et al., J. Virol. 71, 5952-5962 (1997) 참조), 핵 호르몬 수용체 (예컨대 Torchia et al., Curr . Opin . Cell. Biol. 10:373-383 (1998) 참조); 핵 인자 카파 B의 p65 하위유닛 (Bitko & Barik, J. Virol. 72:5610-5618 (1998) and Doyle & Hunt, Neuroreport 8:2937-2942 (1997)); Liu et al., Cancer Gene Ther. 5:3-28 (1998)), 또는 인공 키메라 기능성 단백질, 예컨대 VP64 (Beerli et al., (1998) Proc. Natl . Acad . Sci . USA 95:14623-33) 및 데그론 (degron)(Molinari et al., (1999) EMBO J. 18, 6439-6447)을 포함한다. 추가의 예시적인 활성화 도메인은 Oct 1, Oct-2A, Sp1, AP-2 및 CTF1 (Seipel et al., EMBO J. 11, 4961-4968 (1992))과, 뿐만 아니라 p300, CBP, PCAF, SRC1 PvALF, AtHD2A 및 ERF-2를 포함한다. 예를 들면 Robyr et al. (2000) Mol . Endocrinol . 14:329-347; Collingwood et al. (1999) J. Mol . Endocrinol. 23:255-275; Leo et al. (2000) Gene 245:1-11; Manteuffel-Cymborowska (1999) Acta Biochim . Pol. 46:77-89; McKenna et al. (1999) J. Steroid Biochem . Mol . Biol. 69:3-12; Malik et al. (2000) Trends Biochem . Sci . 25:277-283; and Lemon et al. (1999) Curr . Opin . Genet. Dev. 9:499-504 참조. 추가의 예시적인 활성화 도메인은 그것들에 한정되는 것은 아니지만, OsGAI, HALF-1, C1, AP1, ARF-5,-6,-7 및 -8, CPRF1, CPRF4, MYC-RP/GP, 및 TRAB1을 포함한다. 예를 들면 Ogawa et al. (2000) Gene 245:21-29; Okanami et al. (1996) Genes Cells 1:87-99; Goff et al. (1991) Genes Dev. 5:298-309; Cho et al. (1999) Plant Mol. Biol . 40:419-429; Ulmason et al. (1999) Proc . Natl . Acad . Sci . USA 96:5844-5849; Sprenger-Haussels et al. (2000) Plant J. 22:1-8; Gong et al. (1999) Plant Mol . Biol . 41:33-44; and Hobo et al. (1999) Proc . Natl . Acad . Sci. USA 96:15,348-15,353 참조.
기술분야의 숙련자들에게는, DNA-결합 도메인과 기능성 도메인 사이의 융합 단백질 (또는 그것을 코드화하는 핵산)의 형성에서, 활성화 도메인 또는 활성화 도메인과 상호작용하는 분자 중 어느 하나는 기능성 도메인으로서 적합하다. 본질적으로 표적 유전자에 대한 활성화 복합체 및/또는 활성화 활성 (예컨대, 예를 들면 히스톤 아세틸화)을 충원할 수 있는 어떠한 분자든지 융합 단백질의 활성화 도메인으로서 유용하다. 단절제 (insulator) 도메인, 정위 도메인 및 크로마틴 리모델린 단백질, 예컨대 ISWI-함유 도메인 및/또는 융합 분자에서 기능성 도메인으로서 사용하기에 적합한 메틸 결합 도메인 단백질은 예를 들면 미국 특허 번호 6,919,204 및 7,053,264에 기술된다.
예시적인 억압 도메인은 그것들에 한정되는 것은 아니지만, KRAB A/B, KOX, TGF-베타-유도성 초기 유전자 (TIEG), v-erbA, SID, MBD2, MBD3, DNMT 패밀리의 구성원들 (예컨대 DNMT1, DNMT3A, DNMT3B), Rb 및 MeCP2를 포함한다. 예를 들면 Bird et al. (1999) Cell 99:451-454; Tyler et al. (1999) Cell 99:443-446; Knoepfler et al. (1999) Cell 99:447-450; 및 Robertson et al. (2000) Nature Genet. 25:338-342 참조. 추가의 예시적인 억압 도메인은, 그것들에 한정되는 것은 아니지만 ROM2 및 AtHD2A를 포함한다. 예를 들면 Chem et al. (1996) Plant Cell 8:305-321; and Wu et al. (2000) Plant J. 22:19-27 참조.
융합 분자들은 기술분야의 숙련자들에게 잘 알려져 있는 클로닝 및 생화학적 포합의 방법에 의해 구성된다. 융합 분자들은 DNA-결합 도메인 및 기능성 도메인 (예컨대 전사 활성화 또는 억압 도메인)을 포함한다. 융합 분자들은 또한 임의로 핵 정위 신호 (예컨대, 예를 들면 SV40 중간 T-항원으로부터 유래됨) 및 에피토프 태그 (예컨대, 예를 들면 FLAG 및 헤마글루티닌)을 포함한다. 융합 단백질들 (및 그것들을 코드화하는 핵산)은 전사 리딩 프레임이 융합 성분들 중에서 보존되도록 디자인된다.
한편으로 기능성 도메인 (또는 그것의 기능성 단편)의 폴리펩티드 성분과, 다른 한편으로 비-단백질 DNA-결합 도메인 (예컨대 항생물질, 삽입제, 작은 홈 결합제, 핵산) 사이의 융합은 기술분야의 숙련자들에게 공지되어 있는 생화학적 포합 방법에 의해 구성된다. 예를 들어 Pierce Chemical Company (Rockford, IL) Catalogue 참조. 작은 홈 결합제와 폴리펩티드 사이의 융합을 제조하기 위한 방법 및 조성물은 기술되어 있다 (Mapp et al. (2000) Proc . Natl . Acad . Sci . USA 97:3930-3935).
특정 구체예에서, DNA 결합 도메인에 의해 결합된 표적 부위는 세포성 크로마틴의 접근가능한 영역에 존재한다. 접근가능한 영역들은 예를 들면 공동-소유의 국제 공보 WO 01/83732에 기술된 것과 같이 측정될 수 있다. 만약 표적 부위가 세포성 크로마틴의 접근가능 형역에 존재하지 않는다면, 하나 또는 그 이상의 접근가능한 영역들은 공동-소유의 WO 01/83793에 기술된 것과 같이 생성될 수 있다. 추가의 구체예에서, 융합 분자의 DNA-결합 도메인은 그것의 표적 부위가 접근가능한 영역에 있는지 또는 없는지의 여부와 관계없이 세포성 크로마틴에 결합할 수 있다. 예를 들어, 그런 DNA-결합 도메인은 링커 DNA 및/또는 뉴클레오좀 DNA에 결합할 수 있다. 이런 유형의 "선구자" DNA 결합 도메인의 실례는 특정 스테로이드 수용체 및 간세포 핵 인자 3 (HNF3)에서 발견된다. Cordingley et al. (1987) Cell 48:261-270; Pina et al. (1990) Cell 60:719-731; 및 Cirillo et al. (1998) EMBO J. 17:244-254.
융합 분자는 기술분야의 숙련자들에게 알려져 있는 것과 같이, 약학적으로 허용되는 담체로 제형될 수 있다. 예를 들면 Remington's Pharmaceutical Sciences, 17th ed., 1985; 및 공동-소유의 WO 00/42219 참조.
융합 분자의 기능성 성분/도메인은 일단 융합 분자가 그것의 DNA 결합 도메인을 통해 표적 서열에 결합하게 되면 유전자의 전사에 영향을 미칠 수 있는 다양한 상이한 성분들 중 어느 것으로부터 선택될 수 있다. 그러므로, 기능성 성분은 그것에 한정되는 것은 아니지만, 다양한 전사 인자 도메인, 예컨대 활성화제, 리프레서, 공동-활성화제, 공동-억제제 및 침묵자를 포함할 수 있다.
추가의 예시적인 기능성 도메인들은 예를 들면 공동-소유의 미국 특허 번호 6,534,261 및 6,933,113에 개시된다.
외인성 작은 분자들 또는 리간드들에 의해 조절되는 기능성 도메인들이 또한 선택될 수 있다. 예를 들어, 기능성 도메인만이 외부 RheoChemTM 리간드의 존재하에 그것의 활성 형태를 추정하게 되는 RheoSwitch® 기술이 사용될 수 있다 (예를 들어 US 20090136465 참조). 그러므로, ZFP 또는 TALE는 조절가능한 기능성 도메인에 작동가능하게 연결될 수 있고, ZFP-TF 또는 TALE-TF의 결과적인 활성은 외부 리간드에 의해 제어된다.
뉴클레아제
또한 본원에는 뉴클레아제(들)에 의한 표적의 절단 후에 만들어진 삽입 및/또는 결실을 포함하여, 유전자 변형에 대해 생체 내에서 유용한, 예컨대 ZFN, TALEN, 귀소성 엔도뉴클레아제, CRISPR/Cas 및/또는 Ttago RNA-가이드된 시스템과 같은 뉴클레아제가 기술된다. 특정 구체예에서, 융합 단백질은 DNA-결합 도메인 및 절단 (뉴클레아제) 도메인을 포함한다. 그 자체로서, 유전자 변형은 뉴클레아제, 예를 들면 엔지니어링된 뉴클레아제를 사용하여 이루어질 수 있다. 엔지니어링된 뉴클레아제 기술은 자연적으로 발생하는 DNA-결합 단백질들의 엔지니어링을 기초로 한다. 예를 들면, 꼬리달린 DNA-결합 특이성을 사용한 귀소성 엔도뉴클레아제의 엔지니어링은 기술되어 있다 (Chames et al. (2005) Nucleic Acids Res 33(20):e178; Arnould et al. (2006) J. Mol . Biol . 355:443-458 참조). 또하느 ZFP의 엔지니어링 또한 기술되었다. 예컨대 미국 특허 번호 8,586,526; 6,534,261; 6,607,882; 6,824,978; 6,979,539; 6,933,113; 7,163,824; 및 7,013,219 참조.
또한, ZFP 및 TALE은 뉴클레아제 도메인에 융합되어 그것들의 엔지니어링된 (ZFP 또는 TLAE) DNA 결합 도메인을 통해 그것들의 의도된 핵산을 인식할 수 있고 DNA가 ZFP 또는 TALE DNA 결합 부위 가까이에서 뉴클레아제 활성을 통해 절단되는 것을 유발하는 기능성 부분인 ZFN 및 TALEN이 생성되었다. 예컨대 Kim et al. (1996) Proc Natl Acad Sci USA 93(3):1156-1160 참조. 뉴클레아제 (예컨대 ZFN, TALEN, CRISPR/Cas 및/또는 Ttago 시스템)는 다양한 유기체에서 게놈 변형에 대해 사용되었다. 미국 특허 번호 7,888,121; 7,972,854; 7,914,796; 7,951,925; 8,110,379; 8,409,861; 8,586,526; 미국 특허 공보 20030232410; 20050208489; 20050026157; 20060063231; 20080159996; 201000218264; 20120017290; 20110265198; 20130137104; 20130122591; 20130177983 및 20130177960 및 ㅁ미믹미국 출원 번호 14/278,903.
그러므로, 본원에 기술된 방법 및 조성물은 광범위하게 적용될 수 있고 관심의 어떠한 뉴클레아제든지 포함할 수 있다. 뉴클레아제의 비-제한적 실례는 CRISPR/Cas 및/또는 Ttago 시스템, 메가뉴클레아제, TALEN 및 징크 핑거 뉴클레아제를 포함한다. 뉴클레아제는 이종성 DNA-결합 및 절단 도메인들 (예컨대 징크 핑거 뉴클레아제; TALEN; 이종성 절단 도메인을 가지는 메가뉴클레아제 DNA-결합 도메인)을 포함할 수 있거나, 또는 다르게는, 자연-발생적인 뉴클레아제의 DNA-결합 도메인은 선택된 표적 부위에 결합하기 위해 변경될 수 있다 (예컨대 동족 결합 부위와 상이한 부위에 결합하도록 엔지니어링된 메가뉴클레아제).
특저 구체예에서, 뉴클레아제는 메가뉴클레아제 (귀소성 엔도뉴클레아제)이다. 자연-발생적인 메가뉴클레아제는 15 내지 40 염기쌍 절단 부위를 인식하고 통상적으로 4개의 패밀리로 그룹화된다: LAGLIDADG 패밀리, IY-YIG 패밀리, His-Cyst 박스 패밀리 및 HNH 패밀리. 예시적인 귀소성 엔도뉴클레아제는 I-SceI, I-CeuI, PI-PspI, PI-Sce, I-SceIV, I-CsmI, I-PanI, I-SceII, I-PpoI, I-SceIII, I-CreI, I-TevI, I-TevII 및 I-TevIII을 포함한다. 그것들의 인식 서열은 알려져 있다. 또한 미국 특허 번호 5,420,032; 미국 특허 번호 6,833,252; Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388; Dujon et al. (1989) Gene 82:115-118; Perler et al. (1994) Nucleic Acids Res. 22, 1125-1127; Jasin (1996) Trends Genet. 12:224-228; Gimble et al. (1996) J. Mol . Biol . 263:163-180; Argast et al. (1998) J. Mol . Biol . 280:345-353 및 New England Biolabs 카탈로그 참조.
주로 LAGLIDADG 패밀리로부터 유래하는, 자연-발생적인 메가뉴클레아제로부터의 DNA-결합 도메인은 식물, 효모, 드로조필라, 포유류 세포 및 마우스에서의 부위-특이적 게놈 변형을 촉진하기 위해 사용되었지만, 이 접근법은 메가뉴클레아제 인식 서열을 보존하는 어느 하나의 상동성 유전자의 변형에 (Monet et al. (1999), Biochem. Biophysics. Res. Common. 255:88-93) 또는 인식 부위가 도입되어 있는 사전-엔지니어링된 게놈에 국한되어 왔다 (Route et al. (1994), Mol . Cell. Biol. 14:8096-106; Chilton et al. (2003) Plant Physiology 133:956-65; Puchta et al. (1996), Proc . Natl . Acad . Sci . USA 93: 5055-60; Rong et al. (2002), Genes Dev. 16: 1568-81; Gouble et al. (2006), J. Gene Med . 8(5):616-622). 따라서, 메가뉴클레아제가 의학적으로 또는 생물공학적으로 관련된 부위에서 신규한 결합 특이성을 나타내도록 엔지니어링하기 위한 시도들이 이루어졌다 (Porteus et al. (2005), Nat. Biotechnol. 23:967-73; Sussman et al. (2004), J. Mol . Biol . 342:31-41; Epinat et al. (2003), Nucleic Acids Res. 31:2952-62; Chevalier et al. (2002) Molec . Cell 10:895-905; Epinat et al. (2003) Nucleic Acids Res. 31:2952-2962; Ashworth et al. (2006) Nature 441:656-659; Paques et al. (2007) Current Gene Therapy 7:49-66; 미국 특허 공보 번호 20070117128; 20060206949; 20060153826; 20060078552; 및 20040002092). 또한, 메가뉴클레아제로부터의 자연-발생적인 또는 엔지니어링된 DNA-결합 도메인들은 또한 이종성 뉴클레아제 (예컨대 FokI)로부터의 절단 도메인과 작동가능하게 연결되었다.
다른 구체예에서, 뉴클레아제는 징크 핑거 뉴클레아제 (ZFN)이다. ZFN은 선택된 유전자의 표적 부위에 결합하고 도메인 또는 절단 하프-도메인을 절단하도록 엔지니어링되어 있는 징크 핑거 단백지를 포함한다.
상기에서 상세하게 기술된 것과 같이, 징크 핑거 결합 도메인들은 선택된 서열에 결합하도록 엔지니어링될 수 있다. 예를 들면 Beerli et al. (2002) Nature Biotechnol. 20:135-141; Pabo et al. (2001) Ann. Rev. Biochem . 70:313-340; Isalan et al. (2001) Nature Biotechnol . 19:656-660; Segal et al. (2001) Curr . Opin. Biotechnol . 12:632-637; Choo et al. (2000) Curr . Opin . Struct . Biol . 10:411-416. 엔지니어링된 징크 핑거 결합 도메인은 자연-발생적인 징크 핑거 단백질에 비교하여, 신규한 결합 특이성을 가질 수 있다. 엔지니어링 방법은, 그것들에 한정되는 것은 아니지만, 합리적인 디자인 및 다양한 유형의 선택을 포함한다. 합리적인 디자인은, 예를 들면 트리플렛 (또는 콰드러플렛) 뉴클레오티드 서열 및 개별적인 징크 핑거 아미노산 서열을 포함하는 데이터베이스를 사용하는 것을 포함하는데, 이때 각각의 트리플렛 또는 콰드러플렛 뉴클레오티드 서열은 특정 트리플렛 또는 콰드러플렛 서열이 결합하는 징크 핑거의 하나 또는 그 이상의 아미노산 서열과 관련된다. 예를 들면 공동 소유의 미국 특허 번호 6,453,242 및 6,534,261 참조 (본원에 전체 내용이 참조로 포함됨).
파지 디스플레이 및 2-하이브리드 시스템을 포함하여, 예시적인 선택 방법은 미국 특허 5,789,538; 5,925,523; 6,007,988; 6,013,453; 6,410,248; 6,140,466; 6,200,759; 및 6,242,568; 뿐만 아니라 WO 98/37186; WO 98/53057; WO 00/27878; WO 01/88197 및 GB 2,338,237에 개시된다. 또한, 징크 핑거 결합 도메인들에 대한 결합 특이성의 증강은 예를 들면 공동-소유의 WO 02/077227에 기술되었다.
또한, 이들 및 다른 참고문헌에 개시된 것과 같이, 징크 핑거 도메인 및/또는 다중-핑거의 징크 핑거 단백질들은 예를 들면 길이가 5 또는 그 이상의 아미노산인 링커 (예컨대 TGEKP (SEQ ID NO:135), TGGQRP (SEQ ID NO:136), TGQKP (SEQ ID NO:137), 및/또는 TGSQKP (SEQ ID NO:138))를 포함하여 어떠한 적합한 링커 서열을 사용하여 함께 연결될 수 있다. 길이가 6 또는 그 이상의 아미노산인 예시적인 링커 서열에 대해 예컨대 미국 특허 번호 6,479,626; 6,903,185; 및 7,153,949 참조. 본원에 기술된 단백질들은 단백질의 개별적인 징크 핑거들 사이의 적합한 링커들의 어떠한 조합을 포함할 수 있다. 또한 미국 임시 특허 공보 번호 20110287512 참조.
CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats, 클러스터를 형성한 규칙적인 내부공간의 짧은 재발성 반복)/Cas (CRISPR Associated) 뉴클레아제 시스템은 게놈 엔지니어링에 대해 사용될 수 있는 박테리아 시스템을 기초로 한 최근에 엔지니어링된 뉴클레아제 시스템이다. 그것은 많은 박테리아와 고세균의 적응성 면역 반응의 일부를 기초로 한다. 바이러스 또는 플라스미드가 박테리아를 침입할 때, 침입자의 DNA의 절편은 '면역' 반응에 의해 CRISPR RNA (crRNA)로 전환된다. 이 crRNA는 그런 다음 부분적인 상보성 영역을 통해 tracrRNA로 불리는 다른 유형의 RNA와 결합하여 Cas9 뉴클레아제를 "프로토스페이서 (protospacer)"로 불리는 표적 DNA의 crRNA에 상동하는 영역으로 안내한다. Cas9는 DNA를 절단하여 crRNA 전사물 내에 함유된 20-뉴클레오티드 가이드 서열에 의해 명시된 부위들에서 DSB에 있는 블런트 단부들이 생성된다. Cas9는 부위 특이적 DNA 인식 및 절단을 위해 crRNA와 tracrRNA 둘 다를 필요로 한다. 이 시스템은 현재 엔지니어링되어 crRNA와 tracrRNA는 한 분자 안으로 조합될 수 있고 ("단일 가이드 RNA"), 단일 가이드 RNA의 crRNA 동등한 부분은 Cas9 뉴클레아제가 어떠한 바람직한 서열을 표적화하도록 안내하기 위해 엔지니어링될 수 있다 (Jinek et al (2012) Science 337, p. 816-821, Jinek et al, (2013), eLife 2:e00471, and David Segal, (2013) eLife 2:e00563 참조). 그러므로, CRISPR/Cas 시스템은 게놈의 원하는 표적에서 DSB를 생성하기 위해 엔지니어링될 수 있고, DSB의 수복은 오류 유발 수복의 증가를 유발하기 위하여 수복 억제제의 사용에 의해 영향을 받을 수 있다.
상기에서 주지된 것과 같이, 뉴클레아제의 절단 (뉴클레아제) 도메인은 DNA-결합 도메인, 예를 들면 징크 핑거 DNA-결합 도메인 및 뉴클레아제 또는 메가뉴클레아제 DNA-결합 도메인으로부터의 절단 도메인 및 상이한 뉴클레아제로부터의 절단 도메인에 대해 이종성일 수 있다. 이종성 절단 도메인은 어떠한 엔도뉴클레아제 또는 엑소뉴클레아제로부터도 얻어질 수 있다. 절단 도메인이 유도될 수 있는 예시적인 엔도뉴클레아제는 그것들에 한정되는 것은 아니지만, 제한 엔도뉴클레아제 및 귀소성 엔도뉴클레아제를 포함한다. 예를 들면 2002-2003 Catalogue, New England Biolabs, Beverly, MA; and Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388 참조. DNA를 절단하는 추가의 효소들이 알려져 있다 (예컨대 S1 뉴클레아제; 녹두 뉴클레아제; 췌장의 DNase I; 마이크로구균의 뉴클레아제; 효모 HO 엔도뉴클레아제; 또한 Linn et al. (eds.) Nucleases, Cold Spring Harbor Laboratory Press,1993 참조). 이들 효소 중 하나 또는 그 이상 (또는 그것의 기능성 단편들)은 절단 도메인 및 절단 하프-도메인의 공급원으로서 사용될 수 있다.
유사하게, 절단 하프-도메인은 상기에서 설명한 것과 같이, 절단 활성에 대해 이량체화를 필요로 하는 어떠한 뉴클레아제 또는 그것의 일부로부터 유도될 수 있다. 일반적으로, 만약 융합 단백질이 절단 하프-도메인을 포함한다면 2개의 융합 단백질이 필요하다. 다르게는, 2개의 절단 하프-도메인을 포함하고 있는 단일 단백질이 사용될 수 있다. 2개의 절단 하프-도메인은 동일한 엔도뉴클레아제 (또는 그것의 기능성 단편들)로부터 유도될 수 있거나, 또는 각각의 절단 하프-도메인은 상이한 엔도뉴클레아제 (또는 그것들의 기능성 단편들)로부터 유도될 수 있다. 또한, 2개의 융합 단백질에 대한 표적 부위는 바람직하게는 서로에 대해 배치되어서, 2개의 융합 단백질의 그것들의 각각의 표적 부위에 대한 결합은 서로에 대해 공간적 방향으로 절단 하프-도메인을 배치시킴으로써 예컨대 이량체화에 의해 절단 하프-도메인이 기능성 절단 도메인을 형성하는 것을 허용한다. 그러므로, 특정 환경에서, 표적 부위들의 모서리 근처는 5 내지 8개의 뉴클레오티드 또는 15 내지 18개의 뉴클레오티드에 의해 분리된다. 그러나, 어떠한 정수의 뉴클레오티드 또는 뉴클레오티드 쌍이든지 (예컨대 2 내지 50 뉴클레오티드 쌍 또는 그 이상) 2개의 표적 부위 사이에 개재될 수 있다. 일반적으로 절단 부위는 표적 부위들 사이에 놓인다.
제한 엔도뉴클레아제 (제한 효소)는 많은 종에 존재하고 DNA에 서열-특이적으로 결합할 수 있고 (인식 부위에서), 결합 부위에서 또는 근처에서 DNA를 절단할 수 있다. 특정 제한 효소 (예컨대 타입 IIS)는 인식 부위로부터 제거된 부위들에서 DNA를 절단하고 분리가능한 결합 및 절단 도메인들을 가진다. 예를 들어 타입 IIS 효소 Fok I는 DNA의 이중-가닥 절단을 한 가닥에서는 그것의 인식 부위로부터 9 뉴클레오티드 떨어진 곳에서, 다른 가닥에서는 그것의 인식 부위로부터 13개 뉴클레오티드 떨어진 곳에서 촉매한다. 예를 들어 미국 특허 5,356,802; 5,436,150 및 5,487,994; 뿐만 아니라 Li et al. (1992) Proc . Natl . Acad . Sci . USA 89:4275-4279; Li et al. (1993) Proc . Natl . Acad . Sci . USA 90:2764-2768; Kim et al. (1994a) Proc . Natl . Acad . Sci . USA 91:883-887; Kim et al. (1994b) J. Biol . Chem . 269:31,978-31,982 참조. 그러므로 한 구체예에서, 융합 단백질은 적어도 하나의 타입 IIS 제한 효소로부터의 절단 도메인 (또는 절단 하프-도메인) 및 하나 또는 그 이상의 징크 핑거 결합 도메인을 포함하며, 그것들은 엔지니어링될 수도 있고 그렇지 않을 수도 있다.
그것의 절단 도메인이 결합 도메인과 분리될 수 있는, 예시적인 타입 IIS 제한 효소는 Fok I이다. 이 특별한 효소는 이량체로서 활성이다 (Bitinaite et al. (1998) Proc . Natl . Acad . Sci . USA 95: 10,570-10,575). 따라서, 본 개시의 목적에 대해, 개시된 융합 단백질에 사용된 Fok I 효소의 부분은 절단 하프-도메인으로 여겨진다. 그러므로, 징크 핑거- 또는 TALE-Fok I 융합을 사용한 세포 서열의 표적화된 이중-가닥 절단 및/또는 표적화된 대체에 대해, 각각 Fok I 절단 하프-도메인을 포함하고 있는 2개의 융합 단백질이 촉매적으로 활성인 절단 도메인을 재구성하기 위해 사용될 수 있다. 다르게는, 징크 핑거 결합 도메인 및 2개의 Fok I 절단 하프-도메인을 함유하고 있는 단일 폴리펩티드 또한 사용될 수 있다. 징크 핑거- 또는 TALE-Fok I 융합을 사용한 표적화된 절단 및 표적화된 서열 변경에 대한 매개변수들은 본 개시의 다른 곳에서 제공된다.
절단 도메인 또는 절단 하프-도메인은 절단 활성을 보유하거나, 또는 기능성 절단 도메인을 형성하기 위하여 다량체화 (예컨대 이량체화)할 수 있는 능력을 보유한 단백질의 어떠한 부분일 수 있다.
예시적인 타입 IIS 제한 효소들은 본원에 전체 내용이 포함된 국제 공보 WO 07/014275에 기술된다. 추가의 제한 효소들은 또한 분리가능한 결합 및 절단 도메인들을 함유하고, 이것들은 본 개시에 의해 고려된다. 예를 들면 Roberts et al. (2003) Nucleic Acids Res. 31:418-420 참조.
특정 구체예에서, 절단 도메인은 예를 들면 미국 특허 번호 8,772,453; 8,623,618; 8,409,861; 8,034,598; 7,914,796; 및 7,888,121 (모든 특허의 개시는 본원에 전체 내용이 참조로 포함됨)에 기술된 것과 같이, 단일이량체화를 최소화하거나 방지학는 하나 또는 그 이상의 엔지니어링된 절단 하프-도메인 (또한 이량체화 도메인 돌연변이로서 언급됨)을 포함한다. Fok I의 위치 446, 447, 479, 483, 484, 486, 487, 490, 491, 496, 498, 499, 500, 531, 534, 537 및 538에 있는 아미노산 잔기들은 모두 Fok I 절단 하프-도메인의 이량체화에 영향을 주기 위한 표적이다. 불가피한 이종이량체를 형성하는 Fok I의 엔지니어링된 절단 하프-도메인의 예를 들면 제 1 절단 하프-도메인이 Fok I의 위치 490 및 538에서 아미노산 잔기의 돌연변이를 포함하고 제 2 절단 하프-도메인이 아미노산 잔기 486 및 499에서의 돌연변이를 포함하고 있는 쌍을 포함한다.
그러므로, 한 구체예에서, 490에서의 돌연변이는 Glu (E)를 Lys (K)로 대체하고; 538에서의 돌연변이는 Iso (I)를 Lys (K)로 대체하며; 486에서의 돌연변이는 Gln (Q)를 Glu (E)로 대체하고; 499에서의 돌연변이는 Iso (I)를 Lys (K)로 대체한다. 구체적으로, 본원에 기술된 엔지니어링된 절단 하프-도메인은 한 절단 하프-도메인에서 위치 490 (E→K) 및 539 (I→K)을 돌연변이시켜서 "E490K:I538K"로 표시된 엔지니어링된 절단 하프-도메인을 생성하고 다른 절단 하프-도메인에서 위치 486 (Q→E) 및 499 (I→L)를 돌연변이시켜서 "Q486E:I499L"로 표시된 엔지니어링된 절단 하프-도메인을 생성함으로써 만들었다. 본원에 기술된 엔지니어링된 절단 하프-도메인은 일탈적인 절단이 최소화되거나 제거되는 불가피한 이종이량체 돌연변이이다. 예를 들면 미국 특허 번호 7,914,796 및 8,034,598 참조 (이것들의 개시는 모든 목적에 대해 전체 내용이 참조로 포함된다). 특정 구체예에서, 엔지니어링된 절단 하프-도메인은 위치 486, 499 및 496 (야생형 FokI에 대해 넘버링됨)에서의 돌연변이, 예를 들면 위치 486에 있는 야생형 Gln (Q) 잔기를 Glu (E) 잔기로 대체시키고, 위치 499에 있는 야생형 Iso (I) 잔기를 Leu (L) 잔기로 대체시키며 위치 496에 있는 야생형 Asn (N) 잔기를 Asp (D) 또는 Glu (E) 잔기로 대체시키는 (또한 각각 "ELD" 및 "ELE" 도메인으로도 언급됨) 돌연변이를 포함한다. 다른 구체예에서, 엔지니어링된 절단 하프-도메인은 위치 490, 538 및 537 (야생형 FokI에 대해 넘버링됨)에서의 돌연변이, 예를 들면 위치 490에 있는 야생형 Glu (E) 잔기를 Lys (K) 잔기로 대체시키고, 위치 538에 있는 야생형 Iso (I) 잔기를 Lys (K) 잔기로 대체시키며 위치 537에 있는 야생형 His (H) 잔기를 Lys (K) 또는 Arg (R) 잔기로 대체시키는 (또한 각각 "KKK" 및 "KKR" 도메인으로도 언급됨) 돌연변이를 포함한다. 또 다른 구체예에서, 엔지니어링된 절단 하프-도메인은 위치 490 및 537 (야생형 FokI에 대해 넘버링됨)에서의 돌연변이, 예를 들면 위치 490에 있는 야생형 Glu (E) 잔기를 Lys (K) 잔기로 대체시키고 위치 537에 있는 야생형 His (H) 잔기를 Lys (K) 또는 Arg (R) 잔기로 대체시키는 (또한 각각 "KIK" 및 "KIR" 도메인으로도 언급됨) 돌연변이를 포함한다. 미국 특허 번호 8,772,453.
본원에 기술된 엔지니어링된 절단 하프-도메인은 어떠한 적합한 방법을 사용하여, 예를 들면 미국 특허 번호 8,772,453; 8,623,618; 8,409,861; 8,034,598; 7,914,796; 및 7,888,121에 기술된 야생형 절단 하프-도메인 (Fok I)의 부위-특정 돌연변이생성에 의해 제조될 수 있다.
다르게는, 뉴클레아제는 소위 "분열-효소" 기술 (예컨대 미국 특허 공보 번호 20090068164 참조)을 사용하여 핵산 표적 부위에서 생체 내에서 조립될 수 있다. 그런 분열 효소들의 성분들은 별도의 발현 구성물 상에서 발현되거나 또는 개별적인 성분들이 예를 들면 자체-절단 2A 펩티드 또는 IRES 서열에 의해 분리되는 하나의 오픈 리딩 프레임에서 연결될 수 있다. 성분들은 개별적인 징크 핑거 결합 도메인이거나 메가뉴클레아제 핵산 결합 도메인의 도메인들일 수 있다.
일부 구체예에서, DNA 결합 도메인은 식물 병원성 크산토모나스 (Boch et al, (2009) Science 326: 1509-1512 and Moscou and Bogdanove, (2009) Science326: 1501 참조) 및 랄스토니아 (Heuer et al (2007) Applied and Environmental Microbiology 73(13):4379-4384 참조)로부터 유도된 것들과 유사한 TAL 이펙터로부터 엔지니어링된 도메인이다. 또한 PCT 공보 WO2010/079430 참조.
뉴클레아제 (예컨대 ZFN 또는 TALEN 등)는 예를 들면 8,563,314에 기술된 효모-기초 염색체 시스템에서 사용 전에, 활성에 대해 스크리닝될 수 있다. 뉴클레아제의 발현은 구성성 프로모터 또는 유도성 프로모터, 예를 들면 라피노오스 및/또는 갈락토오스의 존재시에 활성화되고 (탈-억압) 글루코오스의 존재시에 억압되는 갈락토키나아제 프로모터의 제어하에 있을 수 있다.
전달
본원에 기술된 단백질 (예컨대 ZFP, TALE, CRISPR/Cas, Ttago), 그것들을 코드화하는 폴리뉴클레오티드 및 단백질 및/또는 폴리뉴클레오티드를 포함하는 조성물은 어떠한 적합한 수단, 예를 들면 ZFP-TF, TALE-TF 단백질의 주사에 의해 또는 ZFN 또는 TALEN 코드화 mRNA의 사용에 의해 표적 세포에 전달될 수 있다. 적합한 세포는 그것에 한정되는 것은 아니지만 진핵 및 원핵 세포 및/또는 셀라인을 포함한다. 그런 세포 또는 그런 세포로부터 생성된 셀라인의 비-제한적인 실례는 COS, CHO (예컨대 CHO-S, CHO-K1, CHO-DG44, CHO-DUXB11, CHO-DUKX, CHOK1SV), VERO, MDCK, WI38, V79, B14AF28-G3, BHK, HaK, NS0, SP2/0-Ag14, HeLa, HEK293 (예컨대 HEK293-F, HEK293-H, HEK293-T) 및 perC6 세포, 뿐만 아니라 곤충 세포, 예컨대 스포도프테라 푸기페르다 (Spodoptera fugiperda) (Sf) 또는 진균 세포, 예컨대 사카로마이세스 (Saccharomyces), 피치아 (Pichia) 및 스키조사카로마이세스 (Schizosaccharomyces)를 포함한다. 특정 구체예에서, 셀라인은 CHO-K1, MDCK 또는 HEK293 셀라인이다. 적합한 세포는 또한 예를 들면 배아 줄기 세포, 유도된 다능 줄기 세포, 조혈 줄기 세포, 뉴런 줄기 세포 및 간엽 줄기 세포와 같은 줄기 세포를 포함한다.
본원에 기술된 징크 핑거 단백질을 포함하는 단백질을 전달하는 방법은 예를 들면 미국 특허 번호 6,453,242; 6,503,717; 6,534,261; 6,599,692; 6,607,882; 6,689,558; 6,824,978; 6,933,113; 6,979,539; 7,013,219; 및 7,163,824에 기술되어 있고, 그것들의 개시는 본원에 전체 내용이 참조로 포함된다.
본원에 기술된 징크 핑거, TALE 또는 CRISPR/Cas 단백질은 또한 하나 또는 그 이상의 징크 핑거, TALE 또는 CRISPR/Cas 단백질(들)을 코드화하는 서열을 함유하고 있는 벡터를 사용하여 전달될 수 있다. 어떠한 벡터 시스템이든지, 예를 들면 그것들에 한정되는 것은 아니지만, 플라스미드 벡터, 레트로바이러스 벡터, 렌티바이러스 벡터, 아데노바이러스 벡터, 폭스바이러스 벡터; 헤르페스바이러스 벡터 및 아데노-관련 바이러스 벡터 등이 사용될 수 있다. 또한 미국 특허 번호 6,534,261; 6,607,882; 6,824,978; 6,933,113; 6,979,539; 7,013,219; 및 7,163,824 참조 (이것들 모두 전체 내용이 본원에 참조로 포함됨). 나아가, 이들 벡터 중 어느 것이든지 하나 또는 그 이상의 징크 핑거 또는 TALE 단백질-코드화 서열을 포함할 수 있다. 그러므로, 하나 또는 그 이상의 ZFP, TALE 또는 CRISPR/Cas 단백질이 세포 안에 도입될 때, ZFP, TALE 또는 CRISPR/Cas 단백질을 코드화하는 서열들은 동일한 벡터 상에서 또는 상이한 벡터 상에서 수행될 수 있다. 다중 벡터가 사용될 때, 각각의 벡터는 하나 또는 다수의 ZFP, TALE 또는 CRISPR/Cas 시스템을 코드화하는 서열을 포함할 수 있다.
종래의 바이러스 및 비-바이러스 기초 유전자 전달 방법이 엔지니어링된 ZFP, TALE 또는 CRISPR/Cas 시스템을 코드화하는 핵산을 세포 (예컨대 포유류 세포) 및 표적 조직에 도입시키기 위해 사용될 수 있다. 그런 방법은 또한 ZFP, TALE 또는 CRISPR/Cas 시스템을 코드화하는 핵산을 세포에 시험관 내에서 투여하기 위해 사용될 수 있다. 특정 구체예에서, ZFP, TALE 또는 CRISPR/Cas 시스템을 코드화하는 핵산은 생체 내 또는 생체 외 유전자 치료법 용도에 대해 투여된다. 비-바이러스 벡터 전달 시스템은 DNA 플라스미드, 네이키드 핵산 및 리포솜 또는 폴록사머와 같은 전달 비히클과 복합체를 형성한 핵산을 포함한다. 바이러스 벡터 전달 시스템은 DNA 및 RNA 바이러스를 포함하는데, 그것들은 세포에 전달된 후에 에피솜성 또는 통합된 게놈 중 어느 하나를 가진다. 유전자 치료법 과정을 개관하기 위해서는 Anderson, Science 256:808-813 (1992); Nabel & Felgner, TIBTECH 11:211-217 (1993); Mitani & Caskey, TIBTECH 11:162-166 (1993); Dillon, TIBTECH 11:167-175 (1993); Miller, Nature 357:455-460 (1992); Van Brunt, Biotechnology 6(10):1149-1154 (1988); Vigne, Restorative Neurology and Neuroscience 8:35-36 (1995); Kremer & Perricaudet, British Medical Bulletin 51(1):31-44 (1995); Haddada et al., in Current Topics in Microbiology and Immunology Doerfler and B?hm (eds.) (1995); and Yu et al., Gene Therapy 1:13-26 (1994) 참조함.
핵산의 비-바이러스 전달 방법은 일렉트로포레이션, 리포펙션, 마이크로주사, 유전자총 (bioblastic), 비로좀, 리포솜, 면역리포솜, 다가 양이온 또는 지질:핵산 포합체, 네이키드 DNA, 네이키드 RNA, 인공 비리온 및 DNA의 제제-증강된 흡수를 포함한다. 예컨대 Sonitron 2000 시스템 (Rich-Mar)을 사용한 소노포레이션이 또한 핵산 전달을 위해 사용될 수 있다. 바람직한 구체예에서, 하나 또는 그 이상의 핵산이 mRNA로서 전달된다. 또한 바람직한 것은 번역 효율 및/또는 mRNA 안정성을 증가시키기 위하여 캡핑된 mRNA를 사용하는 것이다. 특히 바람직한 것은 ARCA (안티-반전 캡 유사체) 캡 또는 그것의 변이체이다. 미국 특허 US7074596 및 US8153773 참조 (본원에 참조로 포함됨).
추가의 예시적인 핵산 전달 시스템은 Amaxa Biosystems (Cologne, Germany), Maxcyte, Inc. (Rockville, Maryland), BTX 분자 전달 시스템 (Holliston, MA) 및 Copernicus Therapeutics Inc., (see for example US6008336)에 의해 제공되는 것들을 포함한다. 리포펙틴은 예컨대 미국 특허 번호 5,049,386; 4,946,787; 및4,897,355에 기술되어 있고 리포펙틴 시약은 상업적으로 시판된다 (예컨대 TransfectamTM 및 LipofectinTM 및 LipofectamineTM RNAiMAX). 폴리뉴클레오티드의 효과적인 수용체-인식 리포펙션에 적합한 양이온성 및 중성 지질은 Felgner, WO 91/17424, WO 91/16024의 것을 포함한다. 전달은 세포에 (생체 외 투여) 또는 표적 조직에 (생체 내 투여) 이루어질 수 있다.
면역지질 복합체와 같은 표적화된 리포솜을 포함하는 지질:핵산 복합체의 제조는 기술분야의 숙련자에게 잘 알려져 있다 (예컨대 Crystal, Science 270:404-410 (1995); Blaese et al., Cancer Gene Ther . 2:291-297 (1995); Behr et al., Bioconjugate Chem. 5:382-389 (1994); Remy et al., Bioconjugate Chem . 5:647-654 (1994); Gao et al., Gene Therapy 2:710-722 (1995); Ahmad et al., Cancer Res. 52:4817-4820 (1992); U.S. Pat. Nos. 4,186,183, 4,217,344, 4,235,871, 4,261,975, 4,485,054, 4,501,728, 4,774,085, 4,837,028, and 4,946,787).
추가의 전달 방법은 EnGeneIC 전달 비히클 (EDV)로 전달될 핵산을 패키징하는 것의 사용을 포함한다. 이들 EDV는 항체의 한 쪽 아암은 표적 조직에 대한 특이성을 가지고 다른 아암은 EDV에 대한 특이성을 가지고 있는 이중특이성 항체를 사용하여 표적 조직에 특이적으로 전달된다. 항체는 EDV를 표적 세포 표면으로 가져가고 그런 다음 EDV는 식세포작용에 의해 세포 안으로 들어가게 된다. 일단 세포 안에 들어가면, 내용물이 방출된다 (acDiarmid et al (2009) Nature Biotechnology 27(7):643 참조).
엔지니어링된 ZFP, TALE 또는 CRISPR/Cas 시스템을 코드화하는 핵산의 전달을 위한 RNA 또는 DNA 바이러스 기초 시스템의 사용은 신체의 특이적인 세포에 대해 바이러스를 표적화하고 핵에 대해 탑재된 바이러스를 왕래시키기 위한 고도로 진화된 과정의 장점을 가진다. 바이러스 벡터는 환자에게 직접 투여될 수 있거나 (생체 내) 또는 시험관 내에서 세포를 치료하기 위해 사용되거나 변형된 세포들이 환자에게 투여되기도 한다 (생체 외). ZFP, TALE 또는 CRISPR/Cas 시스템을 전달하기 위한 종래의 바이러스 기저 시스템은 그것들에 한정되는 것은 아니지만, 유전자 전달을 위한 레트로바이러스, 렌티바이러스, 아데노바이러스, 아데노-관련, 백시니아 및 헤르페스 심플렉스 바이러스 벡터를 포함한다. 숙주 게놈에서의 통합은 레트로바이러스, 렌티바이러스 및 아데노-관련 바이러스 유전자 전달 방법을 사용하여 가능하며, 자주 삽입된 이식유전자의 장기간 발현을 초래한다. 추가로, 높은 유전자도입 효율이 많은 상이한 세포 유형 및 표적 조직에서 관찰되었다.
레트로바이러스의 향성은 외래 외피 단백질을 통합하고, 표적 세포의 잠재적인 표적 집단을 확장시킴으로써 변경될 수 있다. 렌티바이러스 벡터는 비-분할 세포를 형질도입하거나 감염시킬 수 있는 레트로바이러스 벡터이고 전형적으로 고바이러스 역가를 유발한다. 레트로바이러스 유전자 전달 시스템의 선택은 표적 조직에 좌우된다. 레트로바이러스 벡터는 6 내지 10 kb까지의 외래 서열에 대한 패키징 능력을 가지는 cis-작용 긴 말단 반복으로 구성된다. 최소 cis-작용 LTR은 벡터의 복제 및 패키징에 충분하며, 그런 다음 그것들은 영구적인 이식유전자 발현을 제공하기 위해 표적 세포 안에 치료 유전자를 통합시키는 데 사용된다. 광범위하게 사용되는 레트로바이러스 벡터로는 마우스 백혈병 바이러스 (MuLV), 긴팔 원숭이 백혈병 바이러스 (GaLV), 유인원 면역결핍 바이러스 (SIV), 인간 면역결핍 바이러스 (HIV) 및 그것들의 조합을 기초로 한 레트로바이러스 벡터들이다 (예컨대 Buchscher et al., J. Virol. 66:2731-2739 (1992); Johann et al., J. Virol . 66:1635-1640 (1992); Sommerfelt et al., Virol . 176:58-59 (1990); Wilson et al., J. Virol . 63:2374-2378 (1989); Miller et al., J. Virol . 65:2220-2224 (1991); PCT/US94/05700 참조).
일시적인 발현이 바람직한 용도에서, 아데노바이러스 기초 시스템이 사용될 수 있다. 아데노바이러스 기초 벡터는 많은 세포 유형에서 매우 높은 형질도입 효율을 가질 수 있고 세포 분할을 필요로 하지 않는다. 그런 벡터를 사용하여 고역가 및 고수준의 발현이 얻어질 수 있다. 이 벡터는 상대적으로 단순한 시스템에서 다량으로 생성될 수 있다. 아데노-관련 바이러스 ("AAV") 벡터는 또한 예컨대 핵산 및 펩티드의 시험관 내 제조에서, 및 생체 내 및 생체 외 유전자 요법 과정에서 표적 핵산을 사용하여 세포를 형질전환시키기 위해 사용된다 (예컨대 West et al., Virology 160:38-47 (1987); U.S. Patent No. 4,797,368; WO 93/24641; Kotin, Human Gene Therapy 5:793-801 (1994); Muzyczka, J. Clin . Invest. 94:1351 (1994 참조). 재조합 AAV 벡터의 구성은 많은 공보물에서, 이를테면 미국 특허 번호 5,173,414; Tratschin et al., Mol . Cell. Biol . 5:3251-3260 (1985); Tratschin, et al., Mol . Cell. Biol . 4:2072-2081 (1984); Hermonat & Muzyczka, PNAS 81:6466-6470 (1984); and Samulski et al., J. Virol . 63:03822-3828 (1989)에서 기술되어 있다.
적어도 6가지의 바이러스 벡터 접근법이 현재 임상 실험에서 유전자 전달에 활용될 수 있는데, 그것들은 형질도입 제제를 생성하기 위해 헬퍼 셀라인에 삽입된 유전자들에 의해 결함 벡터의 보충을 포함하는 접근법들을 활용한다.
pLASN 및 MFG-S가 임상 실험에 사용되어 온 레트로바이러스 벡터의 실례들이다 (Dunbar et al., Blood 85:3048-305 (1995); Kohn et al., Nat. Med. 1:1017-102 (1995); Malech et al., PNAS 94:22 12133-12138 (1997)). PA317/pLASN은 유전자요법 실험에 첫번 째로 사용된 치료용 벡터였다 (Blaese et al., Science 270:475-480 (1995)). MFG-S 패키징된 벡터에 대해 50% 이상의 형질도입 효율이 관찰되었다 (Ellem et al., Immunol Immunother. 44(1):10-20 (1997); Dranoff et al., Hum. Gene Ther. 1:111-2 (1997)).
재조합 아데노-관련 바이러스 벡터 (rAAV)는 결함 및 비병원성 파르보바이러스 아데노-관련 유형 2 바이러스를 기초로 한 전도유망한 대체 유전자 전달 시스템이다. 모든 벡터는 이식유전자 발현 카세트 양옆의 AAV 145 염기쌍 반전된 말단 반복만을 보유하는 플라스미드로부터 유도된다. 형질도입된 세포의 게놈 안으로의 통합으로 인한 효과적인 유전자 전달 및 안정한 이식유전자 전달은 이 벡터 시스템에 대한 핵심적인 특징이다 (Wagner et al., Lancet 351:9117 1702-3 (1998), Kearns et al., Gene Ther . 9:748-55 (1996)). 다른 AAV 혈청형, 이를테면 AAV1, AAV3, AAV4, AAV5, AAV6, AAV8AAV 8.2, AAV9 및 AAV rh10 및 위형 AAV, 예컨대 AAV2/8, AAV2/5 및 AAV2/6 또한 본 발명에 따라 사용될 수 있다.
복제-결핍 재조합 아데노바이러스 벡터 (Ad)는 고역가로 생성될 수 있고 많은 상이한 세포 유형을 쉽게 감염시킬 수 있다. 대부분의 아데노바이러스 벡터는 이식유전자가 Ad E1a, E1b 및/또는 E3 유전자를 대체하고; 계속해서 복제 결핍 벡터가 결실된 유전자 기능을 트란스로 공급하는 인간 293 세포에서 증식되도록 엔지니어링된다. Ad 벡터는 생체 내에서 간, 신장 및 근육에서 발견되는 것과 같은 비분할, 분화된 세포를 포함하여 다중 유형의 조직을 형질도입시킬 수 있다. 종래의 Ad 벡터는 커다란 운반 능력을 가진다. Ad 벡터의 임상 실험에서의 사용의 한 실례는 근육내 주사로 항종양 면역화를 하기 위한 폴리뉴클레오티드 치료법을 포함하였다 (Sterman et al., Hum. Gene Ther . 7:1083-9 (1998)). 임상 실험에서 유전자 전달을 위한 아데노바이러스 벡터의 사용의 추가의 실례는 다음을 포함한다: Rosenecker et al., Infection 24:1 5-10 (1996); Sterman et al., Hum. Gene Ther. 9:7 1083-1089 (1998); Welsh et al., Hum. Gene Ther . 2:205-18 (1995); Alvarez et al., Hum. Gene Ther. 5:597-613 (1997); Topf et al., Gene Ther. 5:507-513 (1998); Sterman et al., Hum. Gene Ther . 7:1083-1089 (1998).
세포 패키징은 숙주 세포를 감염시킬 수 있는 바이러스 입자들을 형성하기 위해 사용된다. 그런 세포들은 아데노바이러스를 패키징하는 293 세포 및 레트로바이러스를 패키징하는 Ψ2 세포 또는 PA317 세포를 포함한다. 유전자 요법에 사용된 바이러스 벡터는 보통 바이러스 입자 안으로 핵산 벡터를 패키지하는 생산자 셀라인에 의해 생성된다. 벡터는 전형적으로 숙주 안으로의 패키징 및 후속적인 통합 (적용할 수 있는 경우)에 필요한 최소 바이러스 서열을 함유하고, 다른 바이러스 서열은 발현될 단백질을 코드화하는 발현 카세트에 의해 대체된다. 생략된 바이러스 기능은 패키징 셀라인에 의해 트란스로 공급된다. 예를 들어, 유전자 요법에 사용된 AAV 벡터는 전형적으로 숙주 게놈 안으로의 패키징 및 통합에 필요한 AAV 게놈으로부터의 반전된 말단 반복 (ITR) 서열만을 가진다. 바이러스 DNA는 셀라인에 패키지되고, 그것은 다른 AAV 유전자, 즉 rep 및 cap을 코드화하지만 ITR 서열이 결핍된 헬퍼 플라스미드를 함유한다. 헬퍼 바이러스는 AAV 벡터의 복제 및 헬퍼 플라스미드로부터 AAV 유전자의 발현을 촉진한다. 헬퍼 플라스미드는 ITR 서열의 결핍으로 인해 상당한 양으로 패키지되지 않는다. 아데노바이러스로의 오염은 예컨대 아데노바이러스가 AAV보다 민감하게 되는 열처리에 의해 감소될 수 있다.
많은 유전자 요법 적용에서, 유전자 요법 벡터가 특정 조직 유형에 대해 고도의 특이성으로 전달되는 것이 바람직하다. 따라서, 바이러스 벡터는 바이러스의 외면 상에서 바이러스 코트 단백질과의 융합 단백질로서 리간드를 발현함으로써 주어진 세포 유형에 대한 특이성을 가지도록 변형될 수 있다. 리간드는 관심의 세포 유형 상에 존재하는 것으로 알려져 있는 수용체에 대한 친화성을 가지도록 선택된다. 예를 들어 Han 등은 몰로니 마우스 백혈병 바이러스가 gp70에 융합된 인간 헤레굴린을 발현하도록 변형될 수 있고, 재조합 바이러스는 인간 상피 성장 인자 수용체를 발현하는 특정 인간 유방암 세포를 감염시킨다고 보고하였다 (Han et al., Proc. Natl . Acad . Sci . USA 92:9747-9751 (1995)). 이 원칙은 다른 바이러스-표적 세포쌍으로 연장될 수 있는데, 그때 표적 세포는 수용체를 발현하고 바이러스는 세포-표면 수용체에 대한 리간드를 포함하는 융합 단백질을 발현한다. 예를 들어, 필라멘트형 파지는 실제로 어떠한 선택된 세포 수용체에 대한 특이적인 결합 친화성을 가지는 항체 단편들 (예컨대 FAB 또는 Fv)을 나타내도록 엔지니어링될 수 있다. 비록 상기 설명이 주로 바이러스 벡터에 적용되긴 하지만, 동일한 원칙이 비바이러스 벡터에도 적용될 수 있다. 그런 벡터는 특이적인 표적 세포에 의한 흡수를 선호하는 특이적인 흡수 서열을 함유하도록 디자인될 수 있다.
유전자 요법 벡터는 개별적인 환자에게 투여됨으로써, 전형적으로 전신성 투여에 의해 (예컨대 정맥 내, 복강 내, 근육 내, 피하 또는 두개 내 주입) 또는 아래에서 기술되는 것과 같이 국소 적용에 의해 생체 내로 전달될 수 있다. 다르게는, 벡터는 생체 외에서 세포, 예컨대 개별적인 환자로부터 이식된 세포 (예컨대 림프구, 골수 흡입, 조직 생검) 또는 보편적인 공여 조혈 줄기 세포에 전달되고, 이어서 통상적으로 그 벡터가 통합될 세포에 대한 선택 후에 그 세포들이 환자에게 재이식될 수 있다.
진단, 연구를 위한 또는 유전자 요법을 위한 생체 외 세포 트랜스펙션 (예컨대 숙주 유기체 안으로의 트랜스펙션된 세포의 재-주입을 통한)은 기술분야의 숙련자들에게 잘 알려져 있다. 바람직한 구체예에서, 세포는 대상 유기체로부터 분리되고, ZFP, TALE 또는 CRISPR/Cas 시스템 핵산 (유전자, cDNA 또는 mRNA)으로 트랜스펙션되며, 대상 유기체 (예컨대 환자) 안으로 다시 재주입된다. 바람직한 구체예에서, 하나 또는 그 이상의 핵산은 mRNA로서 전달된다. 또한 바람직한 것은 번역 효율 및/또는 mRNA 안정성을 증가시키기 위하여 캡핑된 mRNA를 사용하는 것이다. 특히 바람직한 것은 ARCA (안티-반전 캡 유사체) 캡 eh는 그것의 변이체이다. 미국 특허 번호 7,074,596 및 8,153,773 참조 (전체 내용이 본원에 참조로 포함됨). 생체 외 트랜스펙션에 적합한 다양한 세포 유형들은 기술분야의 숙련자들에게 (예컨대 Freshney et al., Culture of Animal Cells, A Manual of Basic Technique (3rd ed. 1994) 참조) 및 환자로부터 세포를 분리하고 배양하는 방법의 논의에 대해 본원에 인용된 참고문헌들에 잘 알려져 있다.
한 구체예에서, 줄기 세포는 세포 트랜스펙션 및 유전자 요법에 대해 생체 외 과정에 사용된다. 줄기 세포를 사용하는 것에 대한 장점은 그것이 시험관 내에서 다른 세포 유형으로 분화될 수 있거나 또는 그것이 골수에 이식될 수 있을 포유류 (예컨대 세포의 공여자)안으로 도입될 수 있다는 것이다. CD34+ 세포를 시험관 내에서 GM-CSF, IFN-γ 및 TNF-α와 같은 사이토킨을 사용하여 임상적으로 중요한 면역 세포 유형으로 분화시키는 방법은 알려져 있다 (Inaba et al., J. Exp . Med . 176:1693-1702 (1992) 참조).
줄기 세포는 공지된 방법들을 사용하여 형질도입 및 분화를 위해 분리된다. 예를 들어, 줄기 세포는 골수 세포를 원하지 않는 세포, 예컨대 CD4+ 및 CD8+ (T 세포), CD45+ (panB 세포), GR-1 (과립구) 및 Iad (분화된 항원 제공 세포)에 결합하는 항체들로 패닝함으로써 골수 세포로부터 분리된다 (Inaba et al., J. Exp . Med. 176:1693-1702 (1992) 참조).
변형된 줄기 세포는 또한 일부 구체예에서 사용될 수 있다. 예를 들어, 아폽토시스에 대해 내성으로 만들어진 뉴런 줄기 세포는 줄기 세포가 또한 발명의 ZFP TF를 함뉴하는 치료 조성물로서 사용될 수 있다. 아폽토시스에 대한 내성은 예를 들면 줄기 세포에서 BAX- 또는 BAK-특이적 TALEN 또는 ZFN (미국 특허 공보 번호 20100003756 참조), 또는 카스파제가 파괴된 것들을 사용하고, 다시 예를 들면 카스파제-6 특이적 ZFN을 사용하여 BAX 및/또는 BAK를 녹아웃시킴으로써 발생할 수 있다. 이들 세포는 돌연변이 또는 야생형 Htt를 조절하는 것으로 알려져 있는 ZFP TF 또는 TALE TF로 트랜스펙션될 수 있다.
치료적 ZFP 핵산을 함유하고 있는 벡터들 (예컨대 레트로바이러스, 아데노바이러스, 리포솜 등)은 또한 생체 내에서 세포들의 형질도입을 위해 유기체에 직접 투여될 수 있다. 다르게는, 네이키드 DNA가 투여될 수 있다. 투여는 보통 분자를 궁극적으로 혈액 또는 조직 세포와 접촉하도록 도입하기 위해 사용된 경로들, 이를테면 그것들에 한정되는 것은 아니지만 주사, 주입, 국소 적용 및 일렉트로포레이션 중 어느 것에 의해서 이루어진다. 그런 핵산을 투여하는 적합한 방법들이 활용가능하며 기술분야의 숙련자들에게 잘 알려져 있고, 비록 한 가지 이상의 경로가 특정 조성물을 투여하기 위해 사용될 수 있지만, 특정 경로가 자주 다른 경로보다 더 즉각적이고 더 효과적인 반응을 제공할 수 있다.
DNA의 조혈 줄기 세포 안으로의 도입을 위한 방법들은 예를 들면 미국 특허 번호 5,928,638에 개시된다. 이식유전자의 조혈 줄기 세포, 예컨대 CD34+ 세포 안으로의 도입에 유용한 벡터는 아데노바이러스 타입 35을 포함한다.
이식유전자의 면역 세포 (예컨대 T-세포) 안으로의 도입에 적합한 벡터는 비-통합 렌티바이러스 벡터를 포함한다. 예를 들면 Ory et al. (1996) Proc . Natl . Acad. Sci . USA 93:11382-11388; Dull et al. (1998) J. Virol . 72:8463-8471; Zuffery et al. (1998) J. Virol . 72:9873-9880; Follenzi et al. (2000) Nature Genetics 25:217-222 참조.
약학적으로 허용되는 담체들이 투여되는 특정 조성물에 의해 부분적으로, 뿐만 아니라 그 조성물을 투여하기 위해 사용된 특정 방법에 의해 측정된다. 따라서, 하기에서 기술되는 것과 같이, 활용될 수 있는 약학 조성물의 적합한 제형은 광범위하다 (예컨대 Remington's Pharmaceutical Sciences, 17th ed., 1989 참조).
상기 주지된 것과 같이, 개시된 방법 및 조성물은 그것들에 한정되는 것은 아니지만 원핵 세포, 진균 세포, 고세균 세포, 식물 세포, 곤충 세포, 동물 세포, 척추동물 세포, 포유류 세포 및 인간 세포를 포함하여 어떠한 유형의 세포에든 사용될 수 있다. 단백질 발현에 적합한 셀라인은 기술분야의 숙련자들에게 알려져 있고, 그것들에 한정되는 것은 아니지만 COS, CHO (예컨대 CHO-S, CHO-K1, CHO-DG44, CHO-DUXB11), VERO, MDCK, WI38, V79, B14AF28-G3, BHK, HaK, NS0, SP2/0-Ag14, HeLa, HEK293 (예컨대 HEK293-F, HEK293-H, HEK293-T), perC6, 스포도프테라 푸기페르다 (Sf)와 같은곤충 세포 및 사카로마이세스, 피스키아 및 스키조사카로마이세스와 같은 진균 세포를 포함한다. 이들 셀라인의 자손, 변이체 및 유도체들 또한 사용될 수 있다.
적용
개시된 조성물 및 방법들은 그것들에 한정되는 것은 아니지만 치료 및 연구 용도를 포함하여 Htt 대립유전자를 변조하는 것이 바람직한 어떠한 용도에든지 사용될 수 있다.
Htt를 억압하는 ZFP TF 또는 TALE TF가 치료제로서 사용될 수 있는 질병 및 상태는 그것에 한정되는 것은 아니지만 헌팅턴병을 포함한다. 추가로, Htt의 돌연변이 대립유전자에 대해 특이적인 ZFN 또는 TALEN을 포함하는 방법 및 조성물은 헌팅턴병의 치료를 위한 치료제로서 사용될 수 있다.
HD Htt 대립유전자를 억압하는 ZFP-TF 또는 TALE TF는 또한 그것에 한정되는 것은 아니지만 GDNF 및 BDNF를 포함하여 신경영양 인자를 활성화하는 ZFP-TF 또는 TALE TF와 함께 사용될 수 있다. 이들 ZFP 또는 TALE (또는 이들 ZFP 또는 TALE을 코드화하는 폴리뉴클레오티드)은 동시에 투여되거나 (예컨대 동일한 약학 조성물로) 또는 어떠한 순서로든 차례로 투여될 수 있다.
헌팅턴병을 치료하기 위한 방법 및 조성물은 또한 줄기 세포 내의 Htt 대립유전자의 돌연변이 복사물이 Htt-특이적 ZFN 또는 TALEN을 사용하여 야생형 Htt 대립유전자로 변형되어 있는 줄기 세포 조성물을 포함한다.
발명의 방법 및 조성물은 또한 시험관 내 및 생체 내 모델, 예를 들면 트라이뉴클레오티드 반복 장애의, 이들 장애의 연구를 허용하는 동물 모델의 디자인 및 이식에 유용하다. 적합한 시험관 내 모델의 비-제한적 실례는 섬유아세포를 포함하여, 어떠한 유기체로부터의 세포 또는 셀라인을 포함한다. 동물 모델로서 사용하기에 적합한 동물들의 비-제한적인 실례는 무척추동물 (C. 엘레간스, 드로조필라), 설치류 (예컨대 래트 또는 마우스), 영장류 (예컨대 비-인간 영장류)를 포함한다.
본원에 기술된 조성물 (예컨대 단백질 및/또는 폴리뉴클레오티드)은 단독으로 또는 다른 적합한 성분들 (예컨대 리포솜, 나노입자 또는 기술분야에 공지되어 있는 다른 성분들)과 함께, 흡입을 통해 투여될 에어로솔 제형으로 만들어질 수 있다 (즉 그것들은 "분무"될 수 있다). 에어로솔 제형은 가압된 허용된 추진제, 예컨대 다이클로로다이플루오로메탄, 프로판, 질소 등의 안에 배치될 수 있다. 비경구 투여, 예컨대 예를 들면 정맥 내, 근육 내, 피부 내 및 피하 경로에 의한 투여에 적합한 제형은 항산화제, 완충제, 세균 발육 저지제 및 의도된 수용체의 혈액과 등장성인 제형을 만드는 용질을 함유할 수 있는 수성 및 비-수성, 등장성 멸균 주사 용액, 및 현탁제, 가용화제, 농축제, 안정화제 및 보존제를 포함할 수 있는 수성 및 비-수성 멸균 현탁액을 포함한다. 조성물은 예를 들면 정맥 내 주입에 의해, 경구로, 국소적으로, 복강 내로, 방관 내로 또는 척추강 내로 투여될 수 있다. 화합물의 제형은 단위-용량 또는 다중-용량 밀봉된 용기, 예컨대 앰플 및 바이알로 제공될 수 있다. 주사 용액 및 현탁액은 앞서 기술된 종류의 멸균 분말, 과립 및 정제로부터 제조될 수 있다.
환자에게 투여되는 용량은 시간의 경과에 따라 환자에서 유익한 치료적 반응을 이루기에 충분해야 한다. 용량은 사용된 특정 Htt-결합 분자의 효능 및 Kd, 및 환자의 상태, 뿐만 아리나 치료될 환자의 체중 또는 표면적에 의해 결정된다. 용량의 크기는 또한 특정 환자에서 특정 화합물 또는 벡터의 투여에 수반하는 어떠한 해로운 부작용의 존재, 성질 및 정도에 의해서도 결정된다.
실시예
실시예
1:
Htt
-
표적화된
징크
핑거
단백질 전사 인자 (
ZFP
-
TF
) 및
ZFN의
디자인 및 구성
Htt에 대해 표적화된 징크 핑거 단백질을 본질적으로 미국 특허 번호 6,534,261에서 기술한 대로 엔지니어링하였다. 표 1A 및 1B는 예시적인 Htt-표적화된 ZFP의 DNA 결합 도메인의 인식 나선을 나타낸 한편, 표 2A 및 2B는 이들 ZFP의 표적 서열을 나타낸다.
CAG 반복 영역 내의 부위들을 완전히 표적화하기 위하여 하나의 연속적인 징크 핑거 어레이를 가지는 ZFP를 디자인하였다 (도 1b). 그런 ZFP는 더 높은 친화성 및/또는 더 높은 순 점유율 (net occupancy)을 가지는 더 긴 돌연변이 트랙트에 결합할 수 있어서, 돌연변이 대립유전자의 선택적 억압을 이룰 수 있다. 또한 부분적으로 또는 전체적으로 CAG 영역 외부에 배치되고 (도 1a), 따라서 야생형 및 돌연변이 대립유전자에 동등하게 결합하고 둘 다의 대립유전자로부터의 발현을 유사한 효율로 조절할 부위들을 표적화하는 ZFN을 디자인하였다. CAG 영역을 인식하는 징크 핑거 단백질을 디자인할 때, 하나- 및 두-핑거 모듈의 세트를 '믹스 앤드 매치' 조합에 사용할 수 있다. 그런 모듈을 아래의 표 2C에 나타낸다.
다량체화 ZFP TF를 또한 상기에서 기술한 것과 같이 구성하되, 단 벡터는 또한 ZFP TF를 코드화하는 서열에 작동가능하게 연결된 트라이뉴클레오티드 반복의 트랙트를 따라 발현된 단백질의 다량체화를 가능하게 하는 하나 또는 그 이상의 단백질 상호작용 도메인 (또한 이량체화 또는 단백질 상호작용 도메인으로도 불림)을 코드화하는 서열들을 함유한다. 도 1d 및 도 10 참조. 표 3은 CAG 반복 영역에 대해 표적화된 ZFP와 함께 사용되는 이량체와 도메인 디자인을 나타낸다. 도 10c는 이량체화 징크 핑거 (DZ), DZ1 내지 DZ4 사이의 상호작용을 통해 다량체화하도록 디자인된 4개의 ZFP 단량체 스캐폴드의 단백질 서열을 나타낸다. 디자인은 Mol . Syst. Biol. (2006) 2:2006.2011에 기술된 작업을 기초로 한다. 도 10d는 코일형-코일 (CC), CC1 내지 CC7 사이의 상호작용을 통해 다량체화하도록 디자인된 7개의 ZFP 단량체 스캐폴드의 단백질 서열을 도시한다. CC#1의 디자인은 J. Am. Chem . Soc. (2001), 123:3151-3152에 기술된 작업을 기초로 하는 한편, CC#2, CC#3 및 CC#4는 J. Am. Chem . Soc. (2000), 122:5658-5659를 기초로 한다. CC 및 DZ 도메인은 CAG 트랙트의 주요 홈 내에서 ZFP가 중합되는 것을 허용한다 (도 10b에 도시됨). 핑거 어레이 및 적절한 결합 특성을 가지는 이량체화 도메인을 선택함으로써, 효율적인 결합은 질병 대립유전자의 확장된 CAG 트랙트에 대해서만 일어날 것이다.
핵 정위 서열, Htt 대립유전자에 대해 표적화된 엔지니어링된 징크 핑거 DNA-결합 도메인 (표 1A 및 1B), 및 인간 KOX1 단백질로부터의 KRAB 억압 도메인을 포함하고 있는 융합 단백질로서 ZFP-TF를 구성하였다. 도 1a, 1b 및 1d 참조. 디자인된 DNA-결합 도메인들은 9 내지 18 염기쌍 서열을 인식하는, 3 내지 6개의 핑거 모듈을 함유한다 (표 2A 및 2B). ZFP 인식 나선들에 의해 접촉되는 표적 부위의 뉴클레오티드들은 대문자로 표시되고; 비-접촉 뉴클레오티드들은 소문자로 표시된다. 두 개의 ZFP DNA 결합 도메인이 가요성 링커와 융합되고 KRAB 억압 도메인과 융합되어 있는 ZFP-ZFP-TF 분자들을 또한 구성하였다 (도 1e). DNA 결합 도메인들을 표 2A 및 2B로부터 선택하였다.
실시예
2: 인간 및 마우스 세포에서
Htt의
두 대립유전자의 억압
Htt의 두 대립유전자 (비-대립유전자-특이적)를 억압하기 위하여, ZFP를 Htt 프로모터 및 엑손 1 영역에 결합하도록 디자인하였는데, 그때 표적 부위는 완전하게 CAG 반복 내에 있지 않았다. 도 1a 참조. ZFP TF를 억압하는 Htt의 활성을 시험하기 위하여, ZFP TF를 인간 세포 안에 트랜스펙션하였고, Htt의 발현을 실시간 RT-PCR을 사용하여 모니터링하였다.
인간 HEK293 세포 (Graham et al (1977) J Gen Virol 36:59-74)를 10% FBS가 첨가된 DMEM에서 배양하고 1e5 세포를 표시된 ZFP-KOX 융합을 코드화하는 플라스미드 DNA 1 μg을 사용하여 제조자의 지시를 따라 Amaxa Nucleofector®에 의해 트랜스펙션하였다.
트랜스펙션된 세포를 2일 동안 인큐베이션하고, 내인성 인간 헌팅틴 (Htt) 및 표준화 대조 베타-액틴 (ACTB)을 실시간 PCR에 의해 각각 Hs00918176_m1 및 4352935E 프라이머 및 프로브 (Applied Biosystems)를 사용하여 표준 프로토콜을 따라 분석하였다. Htt 수준을 mock-트랜스펙션된 샘플의 그것 (1로서 세팅함)에 대해 표준화된 Htt/ACTB 비율로서 표시하였다.
도 2a에서 알 수 있는 것과 같이, Htt-표적화된 ZFP는 Htt 발현을 억압하였다. 웨스턴 블롯 분석을 표준 프로토콜을 사용하여 수행하여 Htt 단백질 수준의 감소를 확인하였다 (도 2b); p65 단백질을 로딩 대조표준으로서 사용하였다.
마우스 Htt-특이적 ZFP TF 리프레서를 Neuro2A 세포 (Klebe & Ruddle (1969) J. Cell Biol. 43: 69A) 안으로 Lipofectamine® 2000 키트 (Invitrogen)를 사용하여 제조자의 지시를 따라 일시적으로 트랜스펙션하였다. mHtt 및 ACTB mRNA 수준을 트랜스펙션 후 48시간 후에 ABI Taqman® 프라이머/프로브 세트 Mm01213820 m1 및 4352933E를 각각 사용하여 측정하였다. ZFP 트랜스펙션된 샘플에 대한 mHtt/ACTB 비율을 GFP 대조표준의 그것 (1로서 세팅함)에 대해 표준화하였다.
도 2c에서 알 수 있는 것과 같이, ZFP는 마우스 Htt 발현을 억압하였다. 또한, 마우스 Htt-특이적 ZFP-TF 리프레서는 Htt 녹-인 마우스로부터 유도된 불멸화된 선조 세포, STHdh(Q111/Q7)에서 마우스 Htt를 억압할 수 있다 (Trettel et al. (2000) Hum. Mol . Genet 9 : 2799 -2809). 도 2d 및 2e 참조. 표시된 ZFP에 대한 mRNA를 mMessage mMachine 키트 (Ambion)를 사용하여 생성하고, 이들 mRNA의 0.1, 0.5 또는 2 μg을 상기 기술한 것과 같이 Amaxa 뉴클레오펙터를 사용하여 트랜스펙션하였다. 세포를 트랜스펙션 후 48시간 후에 상기 기술한 것과 같이 mHtt 및 ACTB 발현 분석을 위해 수확하였다. Neuro2A 세포에서의 그것과 비교하여 선조 세포에서 더 많은 유의미한 억압을 관찰하였고, 그것은 선조 세포에서의 mRNA 트랜스펙션을 통해 이루어진 증강된 트랜스펙션 효율의 결과일 수 있다.
실시예
3: 인간 및 마우스 세포에서 돌연변이
Htt의
선택적 억압
돌연변이 Htt 대립유전자의 선택적 억압을 이루기 위하여, ZFP를 CAG 반복 내에서 결합하도록 디자인하였다. 도 1b는 그런 ZFP의 한 유형을 도시하는데, 억압 도메인 (예컨대 KOX1로부터의 KRAB 도메인)에 연속적인 징크 핑거 어레이가 연결되어 있고; 이들 ZFP는 적절한 친화성으로 디자인될 수 있어서 전사 억압으로부터 요구되는 임계값 점유율이 확장된 CAG 반복에 대해 쉽게 수립될 수 있다. 도 1c, 1d 및 1e는 확장된 CAG 반복에 대해 특이적인 결합을 허용할 수 있는 ZFP 디자인의 3가지의 다른 실례를 도시한다.
도 1b에 예시된 것과 같이 디자인된 ZFP를 HEK293 세포에 도입시키고 Htt 발현을 평가하였다. ZFP-코드화 구성물을 HEK293 세포에 FugeneHD를 사용하여 표준 프로토콜을 사용하여 트랜스펙션하였다. 트랜스펙션 후 72시간 후에 총 RNA를 분리하고 내부 대조 베타-액틴 (ACTB)에 대한 내인성 인간 헌팅틴 (Htt)의 수준을 실시간 PCR에 의해 Hs00918176_m1 및 4352935E 프라이머 및 프로브 (Applied Biosystems)를 각각 사용하여 분석하였다. ZFP 트랜스펙션된 샘플에 대한 Htt/ACTB 비율을 GFP 대조표준의 그것 (1로서 설정함)에 대해 표준화하였다.
도 3a에서 알 수 있는 것과 같이, HEK293 세포에서 상부 또는 하부 가닥 중 어느 하나에 대해 CAG 반복을 결합시키기 위해 디자인된 (도 1b) ZFP 리프레서 (KRAB 억압 도메인과 융합됨)는 Htt 발현을 효과적으로 억압하였다. 도 3a는 발현이 이중 트랜스펙션에서 측정되고 (도면에서 별도의 막대) 다중 실시간 PCR 분석이 완료되는 (오차 막대) 전사의 리프레서를 도시한다. 개별적인 ZFP에 의한 상이한 수준의 억압은 그것들이 CAG 반복 영역에 대해 상이한 친화성을 가지는 것을 시사한다. HEK293 세포에서 Htt 대립유전자가 16 및 17 CAG를 가지기 때문에, 이 결과는 또한 "더 약한" ZFP, 예컨대 30640이 야생형 (예상밖의) CAG 반복 길이를 가지는 Htt 대립유전자를 효과적으로 억압하지 못하는 것을 시사한다.
30640과 같은 ZFP가 확장된 CAG 반복을 가지는 Htt 대립유전자의 전사를 억압할 수 있는지의 여부를 시험하기 위하여, 상이한 CAG 반복 길이를 함유하는 Htt 프로모터/엑손 1 단편에 의해 제어된 루시페라제 리포터를 구성하였다. 먼저, 인간 Htt 프로모터/엑손1 단편을 HEK293 게놈 DNA로부터 다음의 전방 프라이머:
5' GAAGATCTCACTTGGGGTCCTCAGGTCGTGCCGAC (SEQ ID NO:139)
및 다음의 역 프라이머:
5' GTATCCAAGCTTCAGCTTTTCCAGGGTCGCCTAGGCGGTCT (SEQ ID NO:140)를 사용하여 증폭시켰다.
전방 프라이머는 BglII 부위를 도입시키고, 역 프라이머는 Htt의 첫 번째 ATG를 TAG로 변화시켜서 AvrII 부위를 생성하고, 또한 HindIII 부위를 포함한다. PCR 생성물을 BglII 및 HindIII로 소화시키고 동일한 효소로 소화된 pRL-TK 벡터 (Promega)로 결찰시켜서 구성물 pRL-Htt를 제조하였다. 그런 다음 인간 Htt 엑손1 단편 (코딩 서열에서 첫 번째 ATG를 뺌)을 HEK293 게놈 DNA 또는 확장된 CAG 반복을 가지는 HD 환자로부터의 게놈 DNA로부터 다음의 전방 프라이머:
5' GCCTAGGCGACCCTGGAAAAGCTGATGAAGGCC (SEQ ID NO:141)
및 다음의 역 프라이머:
5' GTATCCAAGCTTGAGCTGCAGCGGGCCCAAACTCACG (SEQ ID NO:142)를 사용하여 증폭시켰다.
전방 프라이머는 AvrII 부위를 도입시키고, 역 프라이머는 HindIII 부위를 도입시킨다. PCR 생성물을 AvrII 및 HindIII로 소화시키고 동일한 효소들로 소화시켜 놓은 pRL-Htt 벡터에 결찰시켰다. 10, 17, 23 또는 47 CAG 반복을 가지는 클론 (pRL-Htt-CAG(x))을 서열화에 의해 확인하였다.
pRL-Htt-CAG(x) 리포터 (300 ng) 및 pGL3-프로모터 리포터 (100ng, 표준화 대조표준으로서 사용함, Progema)를 100 ng의 ZFP 30640 발현 벡터를 사용하거나 사용하지 않고 HEK293 세포안으로 트랜스펙션하였다. 반딧불이 (pGL 리포터) 및 레닐라 (pRL 리포터) 루시페라제 활성을 트랜스펙션 후 24시간 후에 측정하였다. 레닐라 루시페라제 수준을 동일한 트랜스펙션 샘플로부터의 반딧불이 루시페라제 수준에 대해 표준화하고, 추가로 "리포터 단독" 샘플의 레닐라/반딧불이 비율에 대해 표준화하였다.
도 3b에서 알 수 있는 것과 같이, ZFP-TF 30640에 의한 루시페라제 리포터의 억압은 CAG 반복의 길이에 따라 증가하고, 그것은 30640의 DNA 결합 친화성에 유사한 DNA 결합 친화성을 가지는 ZFP가 확장된 CAG 반복을 통해 Htt 프로모터 활성을 억압할 수 있고, 억압의 수준은 CAG 반복 길이에 좌우된다는 것을 시사한다.
도 3c는 도 3b에서와 유사한 실험을 보여주는데, 단 "강력한" ZFP-TF 30657을 또한 시험하였고, 30640 및 30657 둘 다 표시된 다중 용량에서 시험하였다. 모든 용량 수준에서 30640은 pRL-Htt-CAG23 리포터보다 pRL-Htt-CAG47 리포터의 더 많은 억압을 제공한 (CAG 반복 길이-의존성 억압) 한편, 30657은 두 리포터를 유사한 수준으로 억압하였다. pRL-Htt-CAG23 리포터에 대해, 30640은 모든 용량 수준에서 30657보다 적은 억압을 제공하였는데, 그것은 정상적인 CAG 반복 길이를 가지는 내인성 Htt 대립유전자에 대한 그것들의 활성의 차이를 개략적으로 나타냈고 (HEK293 세포, 도 3a); 그러나 pRL-Htt-CAG47 리포터에 대해서는, 30640과 30657이 모든 용량 수준에서 유사한 억압을 나타냈는데, 그것은 30640과 같은 "더 약한" ZFP가 확장된 CAG 반복을 통해 Htt 프로모터를 효과적으로 억압할 수 있음을 시사하며, 주로 확장된 CAG 표적만이 그런 ZFP에 의해 수립될 수 있는 억압에 필요한 임계값 점유를 어용할 수 있기 때문으로 보인다.
도 3d는 ZFP-TFs 30640 및 30657 (KOX1의 KRAB 억압 도메인에 융합됨)이 Hdh(Q111/Q7) 녹-인 마우스로부터 유도된 불멸화된 선조 세포에서 녹-인 Htt 대립유전자 (CAG111)을 억압할 수 있음을 나타내고, 그것은 루시페라제 리포터의 CAG 반복 길이-의존성 억압을 구동하는 30640과 같은 ZFP가 또한 확장된 CAG 반복을 가지는 내인성 Htt 대립유전자로부터의 발현을 억압할 수 있음을 증명한다. 표시된 ZFP에 대한 mRNA를 mMessage mMachine 키트 (Ambion)를 사용하여 제조하고, Amaxa 뉴클레오펙터를 사용하여 표시된 용량에서 Hdh(Q111/Q7) 세포에 트랜스펙션하였다. 야생형 마우스 Htt 대립유전자로부터의 발현을 검출하기 위하여, 전방 프라이머 CAGGTCCGGCAGAGGAACC (SEQ ID NO:193) 및 역 프라이머 TTCACACGGTCTTTCTTGGTGG (SEQ ID NO:194)를 실싱간 RT-PCR에 사용하였고; 녹인 Htt 대립유전자로부터의 발현을 검출하기 위하여 전방 프라이머 GCCCGGCTGTGGCTGA (SEQ ID NO:195) 및 역 프라이머 TTCACACGGTCTTTCTTGGTGG (SEQ ID NO:196)를 사용하였다.
도 3e는 정상 및 돌연변이 Htt 대립유전자 상에 각각 15 및 70 CAG를 가지는 HD 환자-유도된 섬유아세포 라인 (GM21756, Coriell)에서 ZFP-TF 30640 및 30657을 시험한 결과를 도시한다. SNP-기초 대립유전자-특이적 실시간 PCR 분석을 야생형 또는 돌연변이 Htt 대립유전자로부터의 특이적 검출을 허용하기 위해 먼저 수립하였다. SNP (rs363099 T/C)의 단계화를 문헌에 기술된 것과 같이 (Carroll et al. (Mol Ther. (2011) 19:2178-85) 측정하였다; "T"는 정상 대립유전자 상에 있고 "C"는 돌연변이 유전자 상에 있다. 돌연변이 대립유전자 (099C)로부터의 Htt 발현을 검출하기 위하여, 섬유아세포로부터의 cDNA를 실시간 PCR (SsoFast EvaGreen Supermix, Bio-Rad)에 의하여 전방 프라이머 099C.F (5'AGTTTGGAGGGTTTCTC, SEQ ID NO:143) 및 역 프라이머 099.R5 (5' TCGACTAAAGCAGGATTTCAGG, SEQ ID NO:144)를 사용하여 증폭시켰다; 아닐링/확장 온도는 55.6℃였다. 야생형 대립유전자 (099T)로부터의 Htt 발현을 검출하기 위하여, 섬유아세포 cDNA의 실시간 PCR을 전방 프라이머 099T.F (5'AGTTTGGAGGGTTTCTT, SEQ ID NO:145), 역 프라이머 099.R5 및 3' 포스포릴화된 차단제 올리고 099T.BL (5'AGGGTTTCTCCGCTCAGC-3'phos, SEQ ID NO:146)을 사용하여 수행하였다; 아닐링/확장 온도는 58.3℃였다. 총 인간 헌팅틴 (hHtt, 야생형 및 돌연변이 대립유전자 둘 다) 수준 및 표준화 대조 베타-액틴 (ACTB) 수준을 실시간 PCR에 의하여 프라이머/프로브 Hs00918176_m1 및 4352935E (Applied Biosystems)를 각각 사용하여 분석하였다. 도 3e에 도시된 실험에 대해, 표시된 ZFP에 대한 mRNA를 mMessage mMachine 키트 (Ambion)를 사용하여 제조하였고, 1 μg의 mRNA를 상기와 같이 Amaxa 뉴클레오펙터를 사용하여 트랜스펙션하였다. 세포를 트랜스펙션 후 48시간 후에 수확하였다; 정상 (CAG15, 099T), 돌연변이 (CAG70, 099C) Htt 대립유전자 및 총 Htt (hHtt)로부터의 mRNA 수준을 상기에서 기술한 것과 같이 정량하고 ACRB의 수준에 대해 표준화하였다; 각 샘플에 대한 Htt/ACTB 비율을 추가로 mock-트랜스펙션된 샘플의 그것에 대해 표준화하였다. "강력한" CAG-표적화된 ZFP 30657은 예상했던 것과 같이, 두 가지 대립유전자를 다 억압하였다 HEK293 세포에서의 활성을 기초로 함, 도 3a). 리포터의 CAG 반복 길이-의존성 억압을 보인 ZFP 30640은 야생형 대립유전자의 <10% 억압을 제공한 한편, 돌연변이 대립유전자를 >90% 억압하였다. 각 샘플에서 총 Htt의 수준은 동일한 샘플에서 야생형 (wt) 및 돌연변이 Htt 수준의 그것과 일치하였다.
ZFP-30640을 또한 정상적인 섬유아세포 라인에서뿐 아니라 Htt 유전자에 상이한 CAG 반복 길이를 함유한 다른 HD 섬유아세포 라인에서도 시험하였다 (도 3f 참조). 각 대립유전자로부터의 Htt 발현을 상기에서 기술한 것과 같이 검출하였다. 정상 섬유아세포 라인 ()에서는 Htt 억압을 관찰하지 못하였다. 대조적으로, 우수한 대립유전자 감소가 CAG 15/67 및 CAG15/70 라인에서 높거나 낮은 두 가지 용량의 트랜스펙션된 30640 mRNA에서 관찰되었다; 유사한 결과를 돌연변이 대립유전자 (CAG 18/44 및 CAG 18/45) 상의 중간 CAG 반복 길이를 가지는 두 개의 HD 섬유아세포 라인에 대해 얻었다 - 이때 확장된 대립유전자는 높거나 낮은 두 가지 용량의 30640에서 ~80% 억압되고, CAG18 대립유전자는 아직 영향을 받지 않은채로 남아 있다. 이들 데이터를 함께 고려하면, 30640과 같은 대립유전자-특이적 리프레서가 CAG418/44 및 CAG18/45와 같은 더 우세한 질병 유전형의 맥락에서 강력한 CAG 대립유전자 길이 선택성을 유지할 수 있음을 나타낸다.
웨스턴 블롯 분석을 사용하여 30640과 같은 ZFP가 2명의 환자-유도된 섬유아세포 라인에서 돌연변이 Htt 단백질을 선택적으로 하향-조절하였음을 나타냈고, 그것으로 qPCR 분석에 의해 나타난 대립유전자-특이적 조절이 확인되었다 (도 3g 참조). ZFP를 mRNA 트랜스펙션 (Amaxa 뉴클레오펙션)에 의해 300 ng의 용량으로 1.5e5 세포의 4개의 복제물 안에 전달하였고, 12-웰 플레이트에 플레이팅하기 전에 모았다. 48시간째에, 세포를 세척하고 단백질 추출물 제조를 위해 수확하였다. 대략 2.5 μg의 추출물을 5% 트리스-아세테이트 겔 상에 로딩하고 MAB2166 (Millipore)에 의해 검출하였다. 추가로, 동일한 샘플을 4 내지 15% 트리스-HCl 겔 (Bio-Rad) 상에 로딩하고 로딩 대조표준으로서 항 B-액틴 (1:20,000, Sigma)에 의한 검출을 위해 표준 방법을 사용하여 전달하였다. Htt mRNA를 측정하는 qPCR 연구를 기초로, 30640은 CAG 반복을 표적화하는 대립유전자-특이적 리프레서이고; 32528은 전사 출발 부위 (TSS)를 표적화하는 이중대립유전자 리프레서이며, 30657은 사용된 용량에서 두 가지 Htt 대립유전자를 둘 다 억압하는 CAG-표적화된 리프레서이다. 웨스턴 블롯은 30640이 HD 환자-유도된 두 가지 셀라인에서 모두 돌연변이 Htt의 수준을 특이적으로 감소시킨 (상부 밴드) 한편, 32528 및 30658은 두 대립유전자를 유사하게 억압한 것을 나타냈다.
실시예
4:
Htt의
대립유전자 특이적 억압을 구동하는 추가의
CAG
-
표적화된
ZFP 디자인
도 4a는 CAG18/45 HD 섬유아세포 라인에서 ZFP-TFs 30640, 30643, 30645 및 33074를 시험한 결과를 도시한다 (모두 CAG 반복을 표적화하고 KRAB 억압 도메인을 사용한다). 상이한 양의 ZFP mRNA를 표시된 것과 같이 Amaxa 뉴클레오펙터를 사용하여 트랜스펙션하고, 돌연변이 Htt (우측 막대), 야생형 Htt (중간 막대) 및 총 Htt (둘 다의 대립유전자, 좌측 막대)의 발현을 상기 기술한 것과 같이 트랜스펙션 후 24시간째에 측정하였다. ZFP 30640, 30645 및 33074는 3 μg 내지 10 ng의 ZFP mRNA 용량 범위 전체에 걸쳐 대립유전자-특이적 억압을 구동한 한편; 30643은 30 ng 또는 그 이상의 용량에서 두 대립유전자를 상당히 억압한 것으로 나타나고 10 ng 용량에서는 대립유전자 선택성을 나타내기 시작한다.
도 4b는 CAG15/70 HD 섬유아세포 라인에서 ZFP 30643, 30648, 30657 및 30658을 시험한 결과를 도시한다 (모두 CAG 반복을 표적화하고 KRAB 억압 도메인을 사용한다). 상이한 양의 ZFP mRNA를 표시된 것과 같이 Amaxa 뉴클레오펙터를 사용하여 트랜스펙션하고, 돌연변이 Htt (우측 막대), 야생형 Htt (중간 막대) 및 총 Htt (둘 다의 대립유전자, 좌측 막대)의 발현을 상기 기술한 것과 같이 트랜스펙션 후 24시간째에 측정하였다. 이전 도면에서 시험한 ZFP들 (30640, 30645 및 33074)에 비교하여, 이들 ZFP는 더 낮은 용량에서 돌연변이 Htt-특이적 억압을 구동한다. 이들 결과는 생체 내에서 (예컨대 HD 환자의 뇌에서) 이루어질 수 있는 ZFP 발현 수준에 따라 돌연변이 Htt의 대립유전자-특이적 억압이 적절한 ZFP 디자인을 사용하여 이루어질 수 있음을 시사한다.
실시예
5: 대안
CAG
-함유 유전자의 억압
실시예 3에서 분리한 RNA (도 3e)를 사용하여, 다른 CAG 반복 함유 유전자의 억압을 분석하였고, 그 결과를 도 5에 도시한다. 다음의 유전자들의 발현 수준을 실시간 PCR을 사용하여 조사하고 액틴의 발현 수준에 대해 표준화하였다: 아탁신 (Ataxin) 2 ("ATXN2"); 다이나민 (Dynamin) ("DNM1"); F-박스 유일 단백질 11 ("FBXO11"), 니트레이트 환원효소 ("NAP"); 기원 인식 복합체 하위유닛 4 ("ORC4"); 포스포키나아제 ("PHK"); OCT3/4 단백질 ("POU3"); THAP 도메인 함유, 아폽토시스 관련 단백질 2 ("THAPII"); TATA 결합 단백질 ("TBP"); 및 스타니오칼신 1("STC1"). 또한, 전사 출발 부위 (TSS)에 관련하여 CAG 반복 서열의 위치를 기록하였고, 도 3f에 "TSS@"로서 표시하는데, 이때 "+"는 TSS의 하류에 있는 CAG 반복의 염기 위치이고, "-"는 TSS의 상류에 있는 CAG 반복의 염기 위치이다. 또한 CAG 반복의 수 ("#CAG")는 각 유전자에 대해 표시한다.
데이터는 30640에 의한 돌연변이 확장된 Htt 대립유전자의 억압이 매우 특이적이며, 그것위 CAG 반복이 상대적으로 그것의 각각의 전사 출발 부위에 가까이 있는 CAG 반복-함유 유전자들의 하위세트가 30640과 같은 ZFP의 억압 표적이 될 수 있음을 증명한다.
실시예
6:
Htt의
대립유전자-특이적
ZFP
억압의 전 범위-게놈 특이성
HD 섬유아세포 (CAG18/45)를 트랜스펙션하여 마이크로어레이 분석에 의해 CAG-표적화된 ZFP의 전 범위-게놈 특이성을 연구하였다 (도 6). ZFP를 표시된 용량에서 mRNA 트랜스펙션 (Amaxa 뉴클레오펙션)에 의해 전달하였다 - ZFP 30640, 30645 및 33074를 각각 75 ng, 15 ng 및 15 ng 용량에서 6개 한 조로 트랜스펙션하였다: GFP-Kox mRNA (150 ng)를 대조표준으로서 트랜스펙션하였고, 모든 샘플에서 150 ng의 트랜스펙션된 mRNA의 전체 양을 도입하기 위한 담체로서 사용하였다. CAG18 (099T, 중간 막대) 및 CAG45 (099C, 우측 막대) 대립유전자의 발현을 상기에서 기술한 것과 같이 트랜스펙션 후 24시간째에 대립유전자-특이적 qPCR 시약에 의해 측정하였고, 이때 샘플 (1 내지 6)의 각각은 생물학적 복제물이다 (별도의 트랜스펙션). Htt 수준을 GAPDH의 수준에 대해 표준화하였다. Htt의 돌연변이 대립유전자-특이적 억압을 모든 3개의 ZFP에 대해 관찰하였다. 그런 다음 4개의 가장 유사한 복제물을 마이크로어레이 분석 (Affymetrix HGU133plus2.0)을 위해 다음과 같이 선택하였다: GFP 복제물 1, 3, 4 및 6; 30640 복제물 2, 3, 5 및 6; 30645 복제물 2, 3, 5 및 6; 및 33074 복제물 1, 3, 4 및 5를 마이크로어레이 분석에 사용하였다. 왕성한 멀티-어레이 평균 (RMA)을 사용하여 각 프로브 세트로부터의 원래 신호를 표준화하였다; ZFP-트랜스펙션된 샘플을 GFP-트랜스펙션된 샘플에 T-시험을 사용하여 비교하였다; "변화" 요청을 대조 샘플에 비해 2배보다 큰 차이를 가지고 T-시험 P-값<0.05인 유전자들 (프로브 세트)에 대해 만들었다. 그 기준을 기초로, 30640은 단지 2개의 유전자, 스타니오칼신 1 (STC1) 및 연장된 시냅토타그민-유사 단백질 1 (ESYT1)만을 억압하였고; 30645 및 33074는 각각 하나의 유전자, STC1 및 인터류킨 17 수용체 A (ILR17RA)만을 억압하였다. Htt는 억압된 (>2-배 억압) 유전자로서 검출되지 않았는데, 왜냐하면 어레이 상의 Htt 프로브 세트가 wt 및 돌연변이 Htt mRNA를 둘 다 검출하기 때문이다. 이 실험은 돌연변이 Htt-특이적 ZFP가, Htt의 효과적인 대립유전자-특이적 억업을 구동하는 수준에서 발현될 때, 매우 높은 특이성 전 범위-게놈으로 작동할 수 있음을 증명한다.
실시예
7: HD 신경
줄기 세포
(NSC)에서 대립유전자 특이적 억압
HD iPSC/ESC를 아큐타제 (accutase)로 계대시키고 E8 배지 (Life Technologies)중의 마트리겔 코팅된 플레이트 상에서 배양하였다. 신경 줄기 세포를 StemPro 신경 유도 배지 (Life Technologies)를 사용하여 유도하였다. 간단하게 설명하면, iPSC/ESC를 겔트렉스 코팅되 6 웰 디쉬에 200,000 세포/웰로 시딩하고 10 내지 20%의 집밀도가 되었을 때 배지를 StemPro 신경 유도 배지로 교환하엿다. 배지를 2일마다 교환하고 NSC를 7일에 수확하고 확장시켰다. StemPro NSC SFM 배지 (Life Technologies)를 사용하여 NSC를 배양하였다. HD NSC (CAG17/69, Coriell GM23225 iPSC로부터 유도됨)를 1.5 또는 0.5 μg의 ZFP mRNA로 뉴클레오펙션을 사용하여 트랜스펙션하였다. 트랜스펙션 후 48시간째에 세포를 수확하고 발현을 RT-PCR에 의하여 정량하였다. Htt 발현의 대립유전자-특이적 검출을 SNP (rs1143646)-기저 유전형분석 분석 #4351376 (Applied Biosystems)을 사용하여 수행하였다. 시험한 ZFP 용량에서, 30640은 돌연변이 Htt의 대립유전자-특이적 억압을 제공하였고, 30643은 wt Htt의 ~50% 억압 및 돌연변이 Htt의 ~90% 억압을 제공하였으며, 30648은 두 대립유전자를 모두 억압하였다 (도 7); 이들 ZFP의 행동은 HD 섬유아세포에서의 그것과 일치한다 (도 4). 각 샘플에 대한 총 Htt 수준 (중간 막대)은 돌연변이의 수준 및 wt Htt 수준과 일치한다.
실시예
8: 분화된 HD 뉴런에서의
Htt
억압
HD NSC를 겔트렉스 코팅된 플레이트 상에서 아큐타제를 사용하여 계대시켰다. 배지를 bFGF 및 EGF 없이 StemPRO NSC SFM 배지를 함유하고 있는 신경 분화 배지로 교환함으로써 뉴런 분화를 유도하였다. 배지를 3 내지 4일마다 최대 21일까지 교환하였다. 뉴런을 NSC (CAG17/48, HD ESC로부터 유도됨)로부터 신경 분화 배지에서의 배양에 의해 유도하였다. 신경 유도 후 15일째에 세포를 1.0 또는 0.5 μg의 ZFP mRNA로 뉴클레오펙션을 사용하여 트랜스펙션하였다. 트랜스펙션 후 48시간째에 세포를 수확하고 발현을 RT-PCR에 의하여 정량하였다. 이 환자 라인이 wt 및 돌연변이 Htt의 qPCR-기저 대립유전자-특이적 검출을 허용하는 SNP를 함유하지 않기 때문에, 단지 총 Htt 수준만을 측정할 수 있다. 본 발명자는 306405과 33074가 HD 섬유아세포 및 NSC에서 CAG18 또는 CAG17 대립유전자를 억압하지 않는 것을 보았기 때문에, 30640- 및 33074-처리된 샘플에서 관찰된 총 Htt의 수준은 돌연변이 대립유전자 (CAG48)의 대립유전자-특이적 억압과 일치한다. 시험한 ZFP 용량에서 30643 및 0648에 의한 더욱 강력한 억압은 또한 HD 섬유아세포에서 이들 ZFP의 행동과 일치한다 (도 8).
실시예
9:
CAG
표적화된
리프레서는
R6/2 마우스에서 돌연변이
Htt
이식유전자를 억압한다
R6/2 마우스 (~120 CAG 반복을 가지는 돌연변이 인간 Htt 엑손 1의 이식유전자를 운반함, Mangiarini et al, (1996) Cell 15:197 참조)에 CMV 프로모터에 의해 구동된 ZFP 30640-KOX 또는 GFP 중 어느 하나를 코드화하는 재조합 AAV2/6의 3e10 벡터 게놈을 입체공간적, 양방향 선조체 주사로 주었다. 마우스들을 생후 5주째에 주사하였고 8주째에 분자 분석을 위해 희생시켰다. 좌측 및 우측 선조체를 각각의 반구로부터 절개하고 즉시 냉동시켰다. 돌연변이 Htt 이식유전자의 억압을 평가하기 위하여, 총 RNA를 각 선조체로부터 TRIzol Plus (Life Technologies)로 추출하고 이어서 고용량 RT (Life Technologies)를 사용하여 cDNA를 합성하였다. 계속해서, R6/2 이식유전자 발현을 qPCR에 의해 측정하고 앞서 기술된 것과 같이 3개의 참조 유전자 (Atp5b, Eif4a2, UbC)의 기하학적 평균에 대해 표준화하였다 (Benn et al. ((2008) Molecular Neurodegeneration: 3, 17). 본 발명자는 4개의 GFP-처리된 대조 선조체에 비하여 4개의 ZFP-처리된 선조체에서 돌연변이 Htt 이식유전자의 통계학적으로 유의미한 억압 (P <0.001)을 관찰하였다 (도 9). 평균 R6/2 억압은 GFP-처리된 대조표준의 64.9%였다. 선조체의 완전한 범위가 단일한 입체공간적 주사를 사용하여 이루어지지 않았고 AAV2/6이 우선적으로 뉴런 세포를 형질도입하였기 때문에, 관찰된 억압의 배수 (~35%)는 AAV 벡터로 형질도입된 세포에서의 실제 억압보다 적게 추산된 것으로 보인다.
실시예
10:
이량체화
/
다량체화
도메인을 가지는
ZFP를
사용한 돌연변이
Htt
의 선택적 억압
짧은 CAG와 긴 CAG 반복 사이를 더 잘 구별하기 위한 징크 핑거 전사 인자들을 엔지니어링하기 위하여, 본 발명자는 개별적인 징크 핑거 전사 인자들의 DNA-결합 친화성을 감소시키고 또한 CAG 반복 내에서 인접한 하위부위들에 결합된 융합 단백질의 상이한 복사물들 사이의 상호작용 강도를 증가시키고자 하였다. 개별적인 징크 핑거 전사 인자들의 DNA-결합 친화성을 감소시키기 위하여, 본 발명자는 더 적은 징크 핑거를 가지거나 및/또는 최적 친화성보다 적은 친화성으로 DNA에 결합할 것으로 예상되는 아미노산 서열을 가지는 징크 핑거 도메인을 제조하였다. CAG 반복 내에서 인접한 하위부위들에 결합된 융합 단백질의 상이한 복사물들 사이의 상호작용 강도를 증가시키기 위하여, 본 발명자는 다양한 이량체화 도메인을 본 발명의 징크 핑거 전사 인자들에 융합시켰다. 이량체화 도메인은 "병렬" 양식으로 상호작용할 수 있고 그것들을 함유하는 융합 단백질들의 "머리-대-머리" 또는 "꼬리-대-꼬리" 이량체를 생성하였다. 한 가지 잠재적인 이량체화 전략은 "머리-대-꼬리" 방향으로 결합하는 동일한 ZFP-전사 인자 융합의 배열을 필요로 하고 따라서 이 전략은 "반-병렬" 양식으로 상호작용하는 이량체화 도메인 (예컨대 McClain et al. (2001) J. Am. Chem . Soc. 123:3151-3152 참조) 및 이량체화 징크 핑거 펩티드 (Giesecke et al. (2006), Molecular Systems Biology 2:2006.2011)를 필요로 한다.
이량체화 구성물 CC1 및 CC2는 반병렬 코일형 코일들의 쌍을 기저로 하였다 (McClain et al , ibid, Ghosh et al. (2000) J Am Chem Soc 122:5658-5659). 이량체화 구성물 CC3 및 CC4는 각각 CC2의 4개의 잔기 또는 7개의 잔기가 결핍된 절단된 버전이었다. 이량체화 구성물 DZ1, DZ2, DZ3 및 DZ4는 이량체화 징크 핑거 도메인 (Giesecke et al, 상기 동일)의 쌍들을 기저로 하였다. 각각의 경우에, 쌍의 한 구성원을 징크 핑거 DNA 결합 도메인의 N-말단에 융합시켰고 쌍의 다른 구성원을 징크 핑거 DNA 결합 도메인의 C-말단에 융합시켰다. 글리신과 세린 잔기가 풍부한 짧은 링커를 사용하여 이량체화 도메인을 징크 핑거 결합 도메인에 융합시켰다. 발명의 추가의 구체예는 또 다른 길이 및/또는 아미노산 조성을 가지는 링커들을 활용한다. 하나 또는 그 이상의 잔기가 제거되었거나 하나 또는 그 이상의 글리신 또는 세린 잔기가 다른 아미노산 잔기로 교환된 링커들이 이들 링커의 가요성을 감소시킬 것이고 긴 CAG 반복과 짧은 CAG 반복 사이의 향상된 구별을 초래할 수 있다.
돌연변이 Htt 대립유전자의 선택적 억압을 이루기 위하여, ZFP를 도 1d 및 도 10a 및 4b에 예시한 것과 같이 디자인하였다. 도 10c 및 10d는 다량체화 도메인의 서열을 도시한다. 도 11a 및 11b는 각각 CC와 DZ 도메인을 포함하고 있는 ZFP-TF의 그것들의 표적을 억압하는 능력을 측정하기 위해 디자인된 실험 결과를 도시한다. 이들 실험을 위해, 표시된 ZFP 구성물 (50 ng)을 pRL-Htt-CAG17 (200 ng), pGL3-Htt-CAG47 (200 ng) 및 pVax-SEAP (분비된 알칼리성 포스파타제, 10 ng, 표준화 대조표준으로서 사용함)를 사용하여 HEK293 세포에 공동-트랜스펙션하였다. 루시페라제 활성 및 분비된 알칼리성 포스파타제 활성을 트랜스펙션 후 24시간 후에 측정하였다. 각 샘플에 대한 레닐라 루시페라제 (CAG17)/SEAP 및 반딧불이 루시페라제 (CAG47)/SEAP 비율을 리포터-단독 샘플의 비율에 대해 표준화하였다. pGL3-Htt-CAG47 리포터를 pRL-Htt-CAG47 리포터와 동일한 방식으로 (실시예3 참조) 구성하되, 단 pRL-TK 구성물 대신 pGL-프로모터 구성물 (Promega)을 사용하였다.
도 11a에서 알 수 있는 것과 같이, 3개의 ZFP는 하나 또는 그 이상의 CC 도메인-함유 구성물로서 시험될 때, CC 도메인은 없지만 동일한 ZFP를 가지고 있는 구성물과 비교하여 하나 또는 둘 다의 리포터의 억압을 증강시켰다. 도 11b는 DZ1 및 DZ3 도메인이 둘 다의 리포터에 대한 32220의 억압을 증강시켰음을 보여준다.
이들 결과는 CC 및 DZ 도메인이 일반적으로 다량체화돈 ZFP의 친화성을 증가시킬 수 있고 DNA 결합 도메인 및 이량체화 도메인의 디자인이 최적의 CAG-반복 길이 구별을 유발할 수 있음을 시사한다.
실시예
11:
ZFP
-
ZFP
-
Kox
디자인을 사용한 돌연변이
Htt의
선택적 억압
ZFP-ZFP-KOX 디자인의 것인 ZFP TF를 HD 섬유아세포에서 시험하였다. 이들 실험에서, 두 개의 ZFP DNA 결합 도메인을 가요성 링커 (LRQKDAARGSAAMAERPFQ, SEQ ID NO:179)와 함께 연결시키고 KOX 억압 도메인에 융합시켰다. 링커를 보존된 히스티딘과 시스테인 사이에 배치하였다. 단백질을 상기에서 기술한 것과 같이 표시된 용량의 ZFP mRNA를 사용하여 시험하였다. CAG18/45 (도 12a) 및 CAG20/41 (도 12b) HD 섬유아세포 라인에서의 이들 결과는 이런 양식으로 덜 활성인 ZFP DNA 결합 도메인들을 연결시키는 것이 대립유전자-특이적 억압을 구동시키는 합성 ZFP를 초래할 수 있음을 증명하였다.
실시예
12: 마우스 세포에서
Htt의
활성화
본원에 기술된 ZFP를 또한 그것들의 Htt 발현을 활성화시키는 능력에 대해 평가하였다. 마우스 Htt의 +200 내지 +467 염기쌍 영역 (전사 출발 부위에 비해)을 표적화하는 ZFP를 NFB p65 하위유닛의 전사 활성화 도메인에 융합시켰다. 이 단편이 HD의 다양한 녹-인 마우스 모델에서 인간 Htt로부터의 상응하는 서열 (엑손 1의 대부분과 인트론 1 서열의 일부)에 의해 대체되었고 (Menalled et al. (2003) J. Comp. Neurol 4651:11-26; Wheeler et al. (2000) Hum Mol Genet 8:115-122), 이 표적화 영역을 선택하였고, 따라서 이 영역에 대해 표적화된 ZFP는 그런 동물에서 녹-인 대립유전자가 아닌 야생형 대립유전자를 선택적으로 활성화할 수 있기 때문에, 이 표적화 영역을 선택하였다.
ZFP를 Neuro2A 세포 (이들 세포에서는 Htt 대립유전자들이 둘 다 야생형이다)에 트랜스펙션하고, 마우스 Htt 및 ACTB mRNA 수준을 실시예 2에서 기술한 것과 같이 측정하였다 (중복 트렌스펙션 및 다중 분석).
도 13에서 알 수 있는 것과 같이, mock 트랜스펙션에 비교하여 Htt mRNA 수준의 증가를 두 개의 ZFP-TF를 사용하여 검출하였다. 도 13a 참조. 증가된 Htt 단백질 수준을 웨스턴 블롯에 의해 확인하였다. 도 13b 참조.
녹-인 Htt 대립유전자의 생성을 도 13c에 예시한다; 서열 배열 (도 13d)은 대체된 마우스 서열과 상응하는 인간 서열 사이의 다양성을 보여준다. 도 13e는 그런 ZFP 활성화제가 HdhQ111/Q7 녹-인 마우스로부터 유도된 불멸화된 선조 세포에 트랜스펙션되었을 때 오직 야생형 Htt만이 선택적으로 활성화되었음을 보여준다.
실시예
13: 생체 내
Htt
발현의 조절
Htt-특이적 ZFP TF의 생체 내에서의 효능을 시험하기 위하여, ZFP를 코드화하는 AAV2 벡터를 제조하였다. 그런 다음 이들 AAV2 기저 구성물을 마우스의 뇌에 전달하였다. 인간 Htt-특이적 ZFP TF에 대해, AAV 벡터를 R6/2 마우스 또는 BAC HD 마우스 (C57Bl/6 또는 FVB/N 계통)에 전달하여 인간 이식유전자의 억압과, 뿐만 아리나 HD-유사 표현형의 변화를 평가하였다. 마우스 Htt-특이적 ZFP (활성화제 또는 리프레서)에 대해, AAV 벡터를 야생형 마우스 (C57Bl/6 또는 FVB/N) 또는 인간 Htt 녹-인 마우스 (HdhQ111/Q7, HdhQ140/Q7 또는 HdhQ175/Q7)에 전달하여 내인성 마우스 Htt 발현의 활성화 또는 억압을 평가하였다. CAG-확장된 대립유전자를 우선적으로 표적화하는 ZFP에 대해, AAV 벡터를 R6/2 마우스 또는 인간 Htt 녹-인 마우스 (HdhQ111/Q7, HdhQ140/Q7 또는 HdhQ175/Q7)에 전달하여 wt 대 확장된 Htt 대립유전자의 선택적 억압을 조사하였다. 희생시킨 후에 뇌 조직을 Htt 발현에 대해 Taqman 실시간 RT-PCR에 의해 분석하였고, 그 결과는 Htt 유전자가 ZFP-TF에 의해 변조되는 것을 증명한다.
유전자도입 마우스 라인 R6/2는 확장된 CAG 반복을 함유하는 인간 Htt 프로모터 및 엑손 1 단편이 이소적으로 발현되는 HD의 특성화가 잘 되어 있는 동물 모델이다 (Mangiarini et al. (1996) Cell 87, 493-506). 이들 마우스는 HD의 특징인 선조체 중간 가시 뉴런 (MSN)뿐 아니라 HD-유사 표현형 행동 변화를 나타낸다. MSN 변성과 일관되게, MSN 마커인 DARPP-32 (Bibb et al. 2000, Proc . Natl . Acad . Sci. 97(12):6809-6814), 포스포다이에스테라제 10a (PDE10a) (Hebb et al. 2004 Neuroscience, 123(4):967-81), 도파민 수용체 D1 (DRD1) 및 도파민 수용체 D2 (DRD2) (Cha et al. 1998 Proc . Natl . Acad . Sci. 95(11):6480-6485)의 감소된 발현이 R6/2 마우스에서 보고되었다.
유전자 리프레서인, HD 환자-유도된 섬유아세포 및 뉴런에서 돌연변이 Htt 대립유전자를 특이적으로 억압하는 ZFP-33074의 생체 내 효능을 시험하기 위하여, AAV6-33074 (즉 유전자 리프레서를 포함하고 있는 AAV6)를 생후 5주의 R6/2 마우스의 선조체에 입체공간적 주사를 사용하여 양방향으로 전달하였다. 각각의 선조체에 2 부위에서의 AAV 주사를 주었는데, 전방 및 후방 주입에 대한 좌표는 각각 A/P +1.4, M/L +/-1.7, D/V -3.5 및 A/P +0.2, M/L +/-2.3, D/V -3.2이었다. 전방 부위에는 5 μl의 AAV 벡터를 주었고 후방 부위에는 4 μl의 AAV 벡터를 주었다. AAV6-33074 벡터의 역가는 1x1013 벡터 게놈/ml이었다. 대조 동물에게는 동일한 용량의 AAV6-GFP (즉 녹색 형광 단백질을 포함하고 있는 AAV6)를 선조체의 동일 위치에 주었다.
AAV6-33074 또는 AAV6-GFP를 주사한 R6/2 마우스를 주마다, 이들 동물에 의해 나타나는 잘-수립된 운동 결함인 움켜쥐기 행동에 대해 시험하였다 (Mangiarini et al. 1996 Cell 87, 493-506). 간단히 설명하면, 각각의 마우스를 그것의 집우리로부터 꺼내어 우리의 뚜겅 위에 놓았다. 그런 다음 동물을 관찰자가 매끄럽게 움직이면서 동물이 표면 위로 약 12인치 정도에서 흔들릴 때까지 부드럽게 앞뒤로 잡아당겼다. 그런 다음 동물을 30초 동안 점수를 매긴다. 만약 앞발만의 움켜쥐기가 관찰되면, 동물에게 1의 점수를 매겼다. 만약 뒷발만의 움켜쥐기가 관찰되면 동물에게 2의 점수를 매겼다. 만약 뒷발과 앞발이 움켜쥐기가 관찰되지만, 동시가 아니라면 동물에게 3의 점수를 매겼다. 뒷발과 앞발이 동시에 중심을 단단하게 밀면서 움켜쥠으로써 완전한 움켜쥐기가 관찰되면 동물에게 4의 점수를 매겼다 (도 16). 30-초 흔들기 후에 동물을 집우리에 되돌려 넣었다. 각각의 처리 그룹, 뿐만 아니라 연령-매치된 야생형 한배새끼에 대해, 완전한 움켜쥐기 (4의 점수)를 나타낸 동물의 비율을 관찰한 각각의 주마다 측정하였다. AAV6-GFP-처리된 동물에 비교하여, VVA6-33074-처리된 R6/2 마우스는 생후 7주 및 12주 사이에 (동물을 발현 분석에 대해 희생시킨 때) 감소된 빈도의 움켜쥐기를 나타냈고; 감소는 생후 9주 내지 12주 사이에 통계학적으로 유의미하였다 (카이 제곱 분석, p<0.05)(도 17). 이 결과는 돌연변이 Htt의 유전자 리프레서, ZFP-33074가 R6/2마우스에서 잘 특성화된 운동 결핍인 움켜쥐기 행동을 개선시켰음을 증명한다.
돌연변이 Htt 및 MAN 마커 DARPP-32의 R6/2 마우스의 선조체에서의 발현 수준을 면역조직화학에 의해 측정하였다. AAV-33074 주사 후 7주째에, R6/2 마우스를 펜토바르비탈로 강하게 마취시키고 상행 대동맥을 통해 등장성 식염수와 이어서 250 mL의 0.1 M 포스페이트 완충액, pH 7.4 중의 빙-냉 4% 파라포름알데하이드로 관류하였다. 뇌를 제거하고 밤새 동일한 용액에서 후고정한 후 25% 슈크로오스에 전달하였다가 냉동-단계 마이크로톰 상에서 40 μm로 절단하였다. 슬라이스들을 PBS에 세척하고 4시간 동안 실온에서 0.3% 트리톤 X-100 20% 정상 GoatSerum/PBS (차단 용액)로 차단하였다. 토끼 항-DARPP-32 항체 (세포 신호화) 및 마우스 항-돌연변이 Htt 항체 (Millipore)를 24시간 동안 4℃에서 차단 용액중에서 인큐베이션하였다. 그런 다음 슬라이스들을 PBS로 세척하고, 2시간 동안 Alexa555 당나귀 항 토끼 (Life technologies) 및 Alexa488 염소 항 마우스 (Life technologies)가 첨가된 0.3% 트리톤 X-100/PBS에서 인큐베이션하였다. 마지막으로 슬라이스들을 PBS로 세척하고, 10분 동안 DAPI (Invitrogen)와 함께 인큐베이션하고 형광 현미경 분석을 위해 유리 커버슬립을 덮었다. 감소된 돌연변이 Htt 염색을 AAV-33074-주사된 선조체 영역에서 관찰하였다; 중요한 것은 증가된 DARRP-32 염색이 동일한 영역에서 관찰된 것이고, 그것은 돌연변이 Htt의 유전자 리프레서인 ZFP-33074가 MSN 변성을 하향 조절하여 감소시켰음을 시사한다.
돌연변이 Htt 및 MSN 마커들의 발현 수준을 또한 실시간 PCR (Taqman) 분석을 사용하여 측정하였다. AAV 벡터 (AAV-ZFP 또는 AAV-GFP) 주입 후 7일째에 R6/2 마우스 선조체를 분리하고 전방, 중간 및 후방 구획으로 절개하고 즉시 개별적으로 냉동하였다. 총 RNA를 각각의 선조체 구획으로부터 TRIzolPlus RNA 정제 키트 (Life Technologies)를 사용하여 분리하고, 500 ng의 RNA를 사용하여 고용량 cDNA 역전사 키트 (Life Technologies)를 사용하여 20-ul 반응으로 cDNA를 생성하였다. 그런 다음 100번째의 cDNA를 실시간 PCR에 사용하여 관심의 유전자 (야생형 마우스 Htt, 돌연변이 Htt 이식유전자, DARPP-32, PDE10a, DRD1 및 DRD2)의 수준 및 표준화 유전자 (Atp5b, Eif4a2, UbC)의 수준을 측정하였다; 표준화 유전자는 문헌 (Benn et al (2008) Molecular Neurodegeneration 3:17)을 기초로 선택하였다. 마우스 DARPP-32, PDE10a, Dopamine Receptor D1, Dopamine Receptor D2, Atp5b, Eif4a2 및 UbC에 대한 프라이머/프로브 세트를 IDT로부터 구매하였고; 마우스 Htt에 대한 프라이머/프로브를 Life Technologies로부터 구매하였으며, 돌연변이 Htt 이식유전자에 대한 프라이머/프로브는 Benn 등에 의해 기술된 것과 같았다. 프라이머/프로브 세트의 서열을 표 3에 열거한다. 실시간 PCR 분석을 384-웰 플레이트 방식으로 CFX-384 실시간 PCR 기기 (Bio-Rad) 상에서 제조자의 지시대로 SsoFast Probes Supermix (Bio-Rad)를 사용하여 수행하였다. 발현 분석은 CFX 매니저 소프트웨어 (v3.0)을 사용하여 행하였다. 간단히 설명하면, 관심의 유전자와 표준화 유전자 각각의 발현 수준을 삼중 반응으로 분석하고 125-배 농축 범위 (5-배 희석 시리즈)에 걸쳐 표준 곡선을 사용하여 정량하였다. 관심의 각각의 유전자의 발현 수준을 동일한 샘플로부터의 3가지 표준화 유전자의 평균 수준에 대해 표준화하였고 (관심의 유전자/표준화 유전자 비율); 그런 다음 각 샘플에 대한 이 비율을 모든 AAV-GFP-처리된 샘플의 평균 (1로서 설정함)의 비율로 규모화하고 도표화하였다. 통계학적 유의미성을 2-방향 학생 T-시험을 사용하여 평가하였다. DARRP-32에 대해, 발현은 GFP 대조표준을 받은 마우스에서의 발현의 178 퍼센트였던 반면, PDE10a, Drd1 및 Drd2는 GFP 대조표준에서의 발현의 각각 184%, 189% 및 162%였다. AAV-ZFP-33074-처리된 선조체는 AAV-GFP-처리된 선조체 (P<0.001)에 비하여 돌연변이 Htt의 ~60%의 발현을 보인 한편, 야생형 마우스 Htt의 발현은 변하지 않았다. ZFP-처리된 선조체는 또한 조사한 모든 중간 가시 뉴런 (MSN) 마커 (DARPP-32, PDE10A, DRD1 및 DRD2)에서 통계학적으로 유의미한 증가를 나타냈고, 그것은 돌연변이 Htt의 유전자 리프레서인 ZFP-33074가 R6/2 마우스에서 선조체 MSN 변성을 감소시켰음을 시사한다 (도 17).
실시예
14:
신경영양
인자 및 HD
Htt
대립유전자-특이적
ZFP
TF의
공동-
트랜스펙션
상기 확인된 Htt-특이적 ZFP TF를 뇌 신경영양 인자에 특이적인 ZFP-TF와 함께 공동-트랜스펙션한다. 사용된 뇌 신경영양 인자에 특이적인 ZFP-TF는 GDNF 또는 BDNF 중 어느 하나에 대해 특이적이다.
실시예
15:
Htt
-
표적화된
징크
핑거
뉴클레아제 (
ZFN
)의 디자인 및 구성
인간 Htt 및 마우스 Htt를 표적화하는 ZFN을 CAG 반복 양옆의 서열, 제 1 코딩 ATG에 가까운 서열, 중지 코돈뿐 아니라 초기 엑손에서도 표적화하도록 디자인하였다. ZFN을 디자인하고 본질적으로 문헌에 기술되어 있는 것과 같이 플라스미드 또는 아데노바이러스 벡터에 통합시켰다 (Urnov et al. (2005) Nature 435(7042):646-651, Perez et al (2008) Nature Biotechnology 26(7):808-816, 및 미국 특허 공보 2008/0131962).
실시예
16:
Htt
-특이적
ZFN의
절단 활성
절단 활성을 시험하기 위하여, 상기 기술된 인간 Htt-특이적 ZFN의 쌍을 코드화하는 플라스미드를 K562 세포 안에 트랜스펙션하였다. K562 세포를 아메리칸 타입 컬춰 콜렉션으로부터 얻었고 권장받은 대로 10%의 정성된 우태아 혈청 (FCS, Cyclone)이 첨가되어 있는 F-12 배지 (Invitrogen)에서 성장시켰다. 세포를 플라스틱 용기로부터 TrypLE SelectTM 프로테아제 (Invitrogen)를 사용하여 분리하였다. 트랜스펙션을 위해 1백만개의 K562 세포를 2 g의 징크-핑거 뉴클레아제 플라스미드 및 100 μL의 Amaxa 용액 T와 혼합하였다. 세포를 Amaxa Nucleofector IITM에 프로그램 U-23을 사용하여 트랜스펙션하고 1.4 mL 가온 F-12 배지 + 10% FCS에 회수하였다.
게놈 DNA를 수확하고 의도된 절단 부위를 포함하고 있는 Htt 유전자좌 부분을 PCR 증폭시켰다. InVitrogen으로부터의 Accuprime HiFi 중합효소를 사용한 PCR은 다음과 같이 수행하였다: 처음 3분 동안 94℃에서 변성시킨 후, 30초 동안 94℃에서 변성시킨 후 30초 동안 58℃에서 아닐링하는 단계 후 30초 동안 68℃에서 연장시키는 단계의 PCR을 30회기 수행함. 30회기를 완료한 후에 반응을 68℃에서 7분 동안 인큐베이션한 후 10℃에서 무기한 인큐베이션하였다.
K562 Htt-특이적 ZFN 처리된 세포로부터의 게놈 DNA를 예를 들면 미국 특허 공보 번호 20080015164; 20080131962 및 20080159996에 기술되어 있는 것과 같이, SurveyorTM 뉴클레아제 (Transgenomic)에 의해 조사하였다.
마우스 Htt-특이적 ZFN의 쌍을 코드화하는 플라스미드를 유사한 방식으로 Neuro-2a 세포에서 시험하였다.
도 14a 및 14b는 ZFN이 Htt 유전자를 앞서 관찰된 삽입결실의 양에 의해 기술된 것과 같이 분석된 바, 8 내지 40%의 유전자 변형 효율로 표적화할 수 있음을 나타낸다.
실시예
17: 다양한 길이의
트라이뉴클레오티드
반복의
표적화된
통합
상기에서 기술된 것과 같이 CAG 반복 양옆에 있는 서열에 대해 가장 큰 절단 활성을 가지는 Htt-특이적 ZFN을 Htt의 야생형 복사물 안으로 다양한 길이의 CAG 반복을 도입시키기 위한 표적화된 통합 전략에 사용한다. 50, 80, 109 및 180 반복 CAG 유닛을 함유하는 공여자들을 구성한다. 그런 다음 이들 공여자를 상기에서 기술한 것과 같이 Htt-특이적 ZFN을 코드화하는 플라스미드를 사용하여 K562 세포안에 트랜스펙션한다. 공여자 통합의 확인은 게놈 DNA 분리, PCR 증폭 (상기에서 기술된 것과 같음) 및 이어서 관심의 영역의 서열화에 의해 이루어진다.
공여자 대립유전자의 Htt 대립유전자 안으로의 표적화된 통합을 초래하는 ㅏ562 세포에서 확인된 ZFN을 사용하여 가변 길이의 공여자 핵산을 인간 배아 줄기 세포 (hESC) 안에 삽입시킨다. 성공적인 공여자 통합을 상기 기술한 것과 같이 게놈 DNA 분리, PCR 및 서열화에 의해 확인한다.
실시예
18: 야생형 및/또는 돌연변이
Htt의
파괴/녹-아웃
초기 엑손에서 절단하는 ZFN은 비-상동성 단부 연합 (NHEJ)의 결과로서 작은 삽입 또는 결실 (삽입-결실)을 초래할 수 있고, 이 과정은 파괴된 Htt의 하나 또는 둘 다의 대립유전자를 가지는 세포 모델을 생성할 수 있다.
표시된 ZFN 쌍을 상기 기술한 대로 제조하고 실시예 8에서 기술한 것과 같이 Cel I 미스매치를 사용하여 절단 활성에 대해 시험하였다. 이들 ZFN 쌍은 인간 Htt의 초기 엑손을 표적으로 하고, 따라서 야생형 또는 돌연변이 Htt 대립유전자 중 어느 하나를 녹-아웃시키기 위해 사용될 수 있다.
도 14a에서 알 수 있는 것과 같이, ZFP 쌍 29627/29628, 29631/29632 (엑손 12) 및 29637/29638 (엑손 18)은 Htt 유전자를 절단하였고 따라서 녹-아웃 셀라인을 생성하기 위하여 활용할 수 있다.
실시예
19: 야생형 및 HD
Htt
대립유전자의 발현 태깅
처음 또는 마지막 코딩 엑손에 대한 가장 큰 절단 활성을 가지는 ZFN을 사용하여 야생형 및 돌연변이 Htt 대립유전자를 상이한 리포터 단백질로 태깅한다. 각각의 리포터 (A 및 B)에 대한 공여자 DNA를 리드 ZFN 쌍(들)의 절단 부위를 기초로 하여 디자인함으로써 리포터 유전자의 표적화된 통합이 Htt에 대한 프레임-내 융합을 생성하도록 하였다. 공여자 DNA를 리드 ZFN 쌍(들)과 함께 K562 세포에 공동-트랜스펙션하여 가장 높은 빈도의 통합을 제공하는 공여자 DNA 구성물을 선택하였다.
ZFN 쌍을 상기 기술한 것과 같이 제조하고 실시예 8에 기술한 대로 Cel I 미스매치를 사용하여 절단 활성에 대해 시험하였다. 사용한 ZFN 쌍은 Htt 코딩 서열의 3' 단부를 표적화하고, 따라서 야생형 또는 돌연변이 Htt 대립유전자 중 어느 하나를 표적화하기 위해 사용한다. 도 14b에서 알 수 있는 것과 같이, ZFP 쌍 25917/25916, 25920/25921 및 25923/25922는 Htt 유전자를 절단할 수 있고 따라서 리포터 태그의 도입을 위해 활용할 수 있다.
리포터 A에 대해 선택한 공여자 DNA 구성물을 상응하는 ZFN과 함께 돌연변이 Htt 유전자를 가지고 있는 대상으로부터 유도된 세포 (예컨대 섬유아세포, 유도된 다능 세포)에 전달한다. 클론들을 유도하고 리포터 A의 표적 통합에 대해 스크리닝한다. 이형접합성 사건이 바람직하고 표적화된 대립유전자들은 PCR에 의해 확인한다. 단일 리포터-태깅된 Htt 대립유전자 및 다른 대립유전자상에 미변형 ZFN 표적 서열을 함유하고 있는 클론들을 선택하고; 리포터 B에 대한 공여자 구성물 및 상응하는 ZFN을 트랜스펙션하여 리포터 B를 가지는 제 2 대립유전자를 태깅한다.
그 결과의 마우스 배아 줄기 세포 클론은 각각의 대립유전자로부터의 발현의 추적을 허용하는 두 개의 상이한 마커들로 태깅된 야생형 Htt 대립유전자 및 돌연변이 대립유전자를 함유한다; 이들 세포는 표준 프로토콜을 사용하여 트라이뉴클레오티드 반복의 마우스 모델을 제조하기 위하여 사용한다.
실시예
20:
Htt에
대한 활성 TALE-
TF
단백질의 구성
TALE DNA 결합 도메인들을 Kox1 단백질 (TALE TF)로부터의 KRAB 억압 도메인에 연결하고 HD 환자 (CAG 20/41)-유도된 섬유아세포에서 Htt 유전자의 억압을 시험하기 위하여 사용한다. TALE 단백질의 구성을 앞서 기술된 것과 같이 수행하였고 (미국 특허 번호 8,586,526 및 미국 특허 공보 번호 20130196373 참조, 둘 다 본원에 참조로 포함됨), 미국 특허 번호 8,586,526에 기술되어 있는 것과 같이, 세 가지 상이한 C- 말단 구조: +63, +231 및 +278로 구성하였다. TALE TF 발현 플라스미드를 구성하기 위하여, 앞서 기술된 TALEN 발현 플라스미드 (미국 특허 번호 8,586,526 참조)를 사용하되, 단 TALEN에 사용된 FokI 도메인을 KRAB 발현 도메인으로 대체하였다. TALE 단백질의 C-말단과 KRAB 도메인의 연쇄를 아래에 나타내는데, KRAB 도메인 서열에 밑줄이 그어져 있다. 굵은 이탤릭체 문자는 트리플 플래그 태그를 나타내며, 굵은 문자는 핵 정위 서열을 나타내고, "[repeat]"는 TALE 반복 유닛 어레이 (전체 반복 플러스 C-말단 하프 반복) 위치를 나타내며, 물결모양의 밑줄 부분은 KRAB 도메인의 서열을 나타낸다:
염기 인식은 원형의 RVD-염기 상응성 ("TALE 코드": A에 대해서 NI, C에 대해 HD, G에 대해 NN (하프 반복에서 NK), T에 대해 NG)을 사용하여 이루어졌다. 일부의 TALE TF에서, 단백질은 DNA의 센스 (5'-3') 가닥에 결합하도록 디자인되는 한편, 다른 것에서는 TALE TF는 안티-센스 (3'-5') 가닥에 결합하도록 디자인된다. 이런 TALE TF 세트를 Htt 유전자의 CAG 반복을 표적화하도록 디자인하였다. TALE DNA 결합 단백질은 자주 표적의 5' 단부에 있는 'T' 뉴클레오티드 염기와 우선적으로 상호작용하고, 표적이 CAG 반복 영역이기 때문에, 안티-센스 DNA 가닥에 결합하는 단백질, 및 따라서 표적의 5'쪽 3번째에 있는 염기 'T'를 가지는 CTG 반복 서열은 더 좋은 결합 친화성 및 특이성을 가질 것이고 따라서 리프레서 활성을 가질 것이다.
시험된 TALE TF에 대한 표적 및 숫자 식별자를 아래의 표 4에 나타낸다. 숫자 식별자는 "SBS#"로 표시하고, 센스 (Sense) 또는 안티센스 (Antisense) 가닥에 대한 특이성이 표시되며 ("S/A"), 또한 표적, 반복 유닛의 수 또는 RVD 및 C-말단 유형이 표시된다.
SBS# | S/A | 표적 (5'-3') | SEQ ID NO | RVD | C 말단 |
102449 | S | gcAGCAGCAGCAGCAGCAGca | 200 | 17 | +63 |
102450 | S | gcAGCAGCAGCAGCAGca | 201 | 14 | +63 |
102451 | S | gcAGCAGCAGCAGca | 202 | 11 | +63 |
102452 | S | gcAGCAGCAGca | 203 | 8 | +63 |
102453 | A | ctGCTGCTGCTGCTGCTGCtg | 204 | 17 | +63 |
102454 | A | ctGCTGCTGCTGCTGCtg | 205 | 14 | +63 |
102455 | A | ctGCTGCTGCTGCtg | 206 | 11 | +63 |
102456 | A | ctGCTGCTGCtg | 207 | 8 | +63 |
102457 | S | gcAGCAGCAGCAGCAGCAGca | 200 | 17 | +231 |
102458 | S | gcAGCAGCAGCAGCAGca | 201 | 14 | +231 |
102459 | S | gcAGCAGCAGCAGca | 202 | 11 | +231 |
102460 | S | gcAGCAGCAGca | 203 | 8 | +231 |
102462 | A | ctGCTGCTGCTGCTGCtg | 205 | 14 | +231 |
102463 | A | ctGCTGCTGCTGCtg | 206 | 11 | +231 |
102464 | A | ctGCTGCTGCtg | 207 | 8 | +231 |
102466 | S | gcAGCAGCAGCAGCAGca | 201 | 14 | +278 |
102467 | S | gcAGCAGCAGCAGca | 202 | 11 | +278 |
102468 | S | gcAGCAGCAGca | 203 | 8 | +278 |
102469 | A | ctGCTGCTGCTGCTGCTGCtg | 204 | 17 | +278 |
102470 | A | ctGCTGCTGCTGCTGCtg | 205 | 14 | +278 |
102471 | A | ctGCTGCTGCTGCtg | 206 | 11 | +278 |
102472 | A | ctGCTGCTGCtg | 207 | 8 | +278 |
그런 다음 표의 TALE TF를 HD 환자 (CAG 20/41) 유도된 섬유아세포에서 Htt 억압에 대해 시험하였고, 그 결과를 도 15에 나타낸다. 이 실험에서, 세포를 100, 100 또는 10 ng의 TALE-TF 코드화 mRNA로 트랜스펙션하였다. 분석한 TALE TF 각각에 대한 결과를 3개의 그룹으로 나타내는데, 3가지의 트랜스펙션된 mRNA 양을 나타낸다. 각각의 그룹에는 또한 3가지의 샘플이 있다: 좌측 막대는 총 Htt 발현을 나타내고, 중간 막대는 CAG20 Htt 대립유전자로부터의 발현을 나타내며, 우측 막대는 CAG41 Htt 대립유전자로부터의 발현을 나타낸다. 데이터는 둘 다의 Htt 대립유전자를 억압할 수 있는 일부 TALE TF가 있고 (예를 들면 102454 참조), 한편 다른 TALE TF는 연장된 CAG 반복을 가지는 돌연변이 Htt를 선택적으로 억제할 수 있었음 (예를 들면 102451 및 102472 참조)을 증명한다.
본원에 언급된 모든 특허, 특허 출원 및 공보는 그것들의 전체 내용이 참조로 본원에 포함된다.
비록 개시내용은 이해를 명확하게 할 목적으로 예시 및 실례에 의해 일부 상세하게 제공되었지만, 기술분야의 숙련자들에게는 다양한 변화 및 수정이 개시내용의 사상 또는 범주로부터 벗어나지 않으면서 실시될 수 있다는 것이 드러날 것이다. 따라서, 전술한 설명 및 실례는 한정하는 것으로 해석되어서는 안된다.
SEQUENCE LISTING
<110> SANGAMO BIOSCIENCES, INC.
<120> METHODS AND COMPOSITIONS FOR TREATING HUNTINGTON'S DISEASE
<130> 8325-0095.60
<140> PCT/US2014/064987
<141> 2014-11-11
<150> 61/902,704
<151> 2013-11-11
<160> 286
<170> PatentIn version 3.5
<210> 1
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 1
Arg Ser Asp Asp Leu Ser Arg
1 5
<210> 2
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 2
Arg Asn Asp Asn Arg Thr Lys
1 5
<210> 3
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 3
Arg Ser Asp Asp Leu Thr Arg
1 5
<210> 4
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 4
Arg Ser Asp Asp Arg Lys Thr
1 5
<210> 5
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 5
Arg Ser Ala Asp Leu Thr Arg
1 5
<210> 6
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 6
Gln Ser Ser Asp Leu Arg Arg
1 5
<210> 7
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 7
Arg Ser Asp Asn Leu Ala Arg
1 5
<210> 8
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 8
Trp Arg Gly Asp Arg Val Lys
1 5
<210> 9
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 9
Asp Arg Ser Asn Leu Ser Arg
1 5
<210> 10
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 10
Thr Ser Gly Ser Leu Thr Arg
1 5
<210> 11
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 11
Glu Arg Gly Thr Leu Ala Arg
1 5
<210> 12
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 12
Arg Ser Asp Ala Leu Ser Arg
1 5
<210> 13
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 13
Asp Arg Ser His Leu Ala Arg
1 5
<210> 14
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 14
Arg Ser Asp His Leu Ser Arg
1 5
<210> 15
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 15
Gln Ser Ser Asp Leu Thr Arg
1 5
<210> 16
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 16
Thr Ser Gly Asn Leu Thr Arg
1 5
<210> 17
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 17
Gln Ser Gly His Leu Gln Arg
1 5
<210> 18
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 18
Gln Ser Gly Asp Leu Thr Arg
1 5
<210> 19
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 19
Arg Ser Asp Val Leu Ser Thr
1 5
<210> 20
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 20
Val Arg Ser Arg Leu Arg Arg
1 5
<210> 21
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 21
Asp Arg Ser Thr Leu Arg Gln
1 5
<210> 22
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 22
Asp Arg Ser Asp Leu Ser Arg
1 5
<210> 23
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 23
Gln Ser Ser Thr Arg Ala Arg
1 5
<210> 24
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 24
Arg Ser Asp Thr Leu Ser Glu
1 5
<210> 25
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 25
His Arg Arg Ser Arg Trp Gly
1 5
<210> 26
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 26
Arg Arg Asp Thr Leu Arg Ser
1 5
<210> 27
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 27
Arg Ser Asp His Leu Ser Thr
1 5
<210> 28
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 28
Gln Ser Ala His Arg Ile Thr
1 5
<210> 29
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 29
Arg Ser Asp His Leu Ser Glu
1 5
<210> 30
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 30
Gln Asn Ala His Arg Lys Thr
1 5
<210> 31
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 31
Gln Ser Ser Asp Leu Ser Arg
1 5
<210> 32
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 32
His Arg Ser Thr Arg Asn Arg
1 5
<210> 33
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 33
Leu Arg Gln Asp Leu Lys Arg
1 5
<210> 34
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 34
Asp Arg Ser His Leu Thr Arg
1 5
<210> 35
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 35
Asp Arg Ser Asn Leu Thr Arg
1 5
<210> 36
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 36
Leu Lys Gln Met Leu Ala Val
1 5
<210> 37
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 37
Arg Ser Asp Ser Leu Ser Ala
1 5
<210> 38
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 38
Arg Ser Asp Ala Leu Ser Thr
1 5
<210> 39
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 39
Asp Arg Ser Thr Arg Thr Lys
1 5
<210> 40
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 40
Asp Arg Ser Ala Leu Ala Arg
1 5
<210> 41
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 41
Gln Ser Gly His Leu Ser Arg
1 5
<210> 42
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 42
Arg Ser Asp Val Leu Ser Glu
1 5
<210> 43
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 43
Thr Ser Gly His Leu Ser Arg
1 5
<210> 44
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 44
Lys Leu Cys Asn Arg Lys Cys
1 5
<210> 45
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 45
His Arg Thr Ser Leu Thr Asp
1 5
<210> 46
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 46
Arg Ser Ala His Leu Ser Arg
1 5
<210> 47
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 47
Gln Ser Gly Asn Leu Ala Arg
1 5
<210> 48
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 48
Leu Lys His His Leu Thr Asp
1 5
<210> 49
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 49
Tyr Arg Trp Leu Arg Asn Asn
1 5
<210> 50
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 50
Arg Ser Asp His Leu Ser Gln
1 5
<210> 51
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 51
Arg Ser Ala Val Arg Lys Asn
1 5
<210> 52
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 52
Trp Ser Thr Ser Leu Arg Ala
1 5
<210> 53
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 53
Gln Arg Thr His Leu Thr Gln
1 5
<210> 54
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 54
Arg Ser Ser His Leu Ser Arg
1 5
<210> 55
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 55
Thr Ser Gly Ser Leu Ser Arg
1 5
<210> 56
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 56
Thr Arg Gln Asn Arg Asp Thr
1 5
<210> 57
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 57
Asp Gln Ser Thr Leu Arg Asn
1 5
<210> 58
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 58
Arg Ser Ala Ala Leu Ser Arg
1 5
<210> 59
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 59
Arg Ser Asp Ala Leu Ala Arg
1 5
<210> 60
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 60
Arg Ser Asp Asn Leu Ser Glu
1 5
<210> 61
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 61
Lys Arg Cys Asn Leu Arg Cys
1 5
<210> 62
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 62
Trp Arg Ser Cys Arg Ser Ala
1 5
<210> 63
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 63
Gln Trp Ser Thr Arg Lys Arg
1 5
<210> 64
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 64
Arg Arg Trp Thr Leu Val Gly
1 5
<210> 65
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 65
Arg Ser Asp Asn Leu Arg Glu
1 5
<210> 66
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 66
Tyr Arg Trp Leu Leu Arg Ser
1 5
<210> 67
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 67
Arg Lys Asp Ala Leu Val Ala
1 5
<210> 68
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 68
Arg Arg Ala Asp Leu Ser Arg
1 5
<210> 69
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 69
Leu Ala Gln Pro Arg Asn Lys
1 5
<210> 70
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 70
Arg Ser Asp His Leu Ser Ala
1 5
<210> 71
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 71
Arg Ser Ala Asp Arg Thr Arg
1 5
<210> 72
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 72
Thr Ser Ser Asp Arg Lys Lys
1 5
<210> 73
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 73
Arg Ser Ala Asn Leu Ala Arg
1 5
<210> 74
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 74
His His Ser Ala Arg Arg Cys
1 5
<210> 75
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 75
Asp Asn Ser Ser Arg Thr Arg
1 5
<210> 76
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 76
His Lys Gln His Arg Asp Ala
1 5
<210> 77
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 77
Arg Arg Thr Asp Leu Arg Arg
1 5
<210> 78
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 78
Asp Pro Ser Asn Arg Val Gly
1 5
<210> 79
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 79
Arg Ser Ala Asp Leu Ser Arg
1 5
<210> 80
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 80
Arg Asn Asp Asp Arg Lys Lys
1 5
<210> 81
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 81
Gln Lys Val Thr Leu Ala Ala
1 5
<210> 82
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 82
Arg Arg Ser Thr Leu Arg Ser
1 5
<210> 83
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 83
Asp Arg Ser Ala Leu Ser Arg
1 5
<210> 84
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 84
Gln Ser Gly Ser Leu Thr Arg
1 5
<210> 85
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 85
Leu Lys Trp Asn Leu Arg Thr
1 5
<210> 86
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 86
Leu Lys Trp Asp Arg Gln Thr
1 5
<210> 87
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 87
Asp Arg Ser His Leu Ser Arg
1 5
<210> 88
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 88
acgctgcgcc ggcggaggcg gggccgcg 28
<210> 89
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 89
agccggccgt ggactctgag ccgaggtg 28
<210> 90
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 90
gtggcgatgc ggggggcgtg gtgaggta 28
<210> 91
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 91
ccgggacggg tccaagatgg acggccgc 28
<210> 92
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 92
ccgtcccggc agcccccacg gcgccttg 28
<210> 93
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 93
cgggtccaag atggacggcc gctcaggt 28
<210> 94
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 94
ctgctgctgc tgctggaagg acttgagg 28
<210> 95
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 95
tcagatggga cggcgctgac ctggctgg 28
<210> 96
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 96
ctgccatgga cctgaatgat gggaccca 28
<210> 97
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 97
gtggtctggg agctgtcgct gatgggcg 28
<210> 98
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 98
ccgaagggcc tgattcagct gttacccc 28
<210> 99
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 99
aacttgcaag taacagaaga ctcatcct 28
<210> 100
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 100
cttgtacagc tgtgagggtg agcataat 28
<210> 101
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 101
gccatggtgg gagagactgt gaggcggc 28
<210> 102
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 102
ctcagcaggt ggtgaccttg tggacatt 28
<210> 103
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 103
gcgctcagca ggtggtgacc ttgtggac 28
<210> 104
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 104
atggtgggag agactgtgag gcggcagc 28
<210> 105
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 105
tgggagagac tgtgaggcgg cagctggg 28
<210> 106
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 106
atggcgctca gcaggtggtg accttgtg 28
<210> 107
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 107
cagcagcagc agcagcagca gcagcagc 28
<210> 108
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 108
ctgctgctgc tgctgctgct ggaaggac 28
<210> 109
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 109
tgctgctgct gctgctgctg ctggaagg 28
<210> 110
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 110
agcagcagca gcagcagcag cagcagca 28
<210> 111
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 111
tgctgctgct gctgctgctg ctggaagg 28
<210> 112
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 112
ggctggcttt tgcgggaagg ggcggggc 28
<210> 113
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 113
gaattgacag gcggatgcgt cgtcctct 28
<210> 114
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 114
attctgcggg tctggcgtgg cctcgtct 28
<210> 115
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 115
gtgacgtcat gccggcggag acgaggcc 28
<210> 116
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 116
gtgcgtcccg tgacgtcatg ccggcgga 28
<210> 117
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 117
gccgcgaggg ttgccgggac gggcccaa 28
<210> 118
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 118
ccgcgagggt tgccgggacg ggcccaag 28
<210> 119
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 119
catcgggcag gaagccgtca tggcaacc 28
<210> 120
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 120
tcctgcccga tgggacagac cctgaaga 28
<210> 121
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 121
gtactgagca atgctgtagt cagcaatc 28
<210> 122
<211> 53
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 122
Thr Lys Cys Val His Cys Gly Ile Val Phe Leu Asp Glu Val Met Tyr
1 5 10 15
Ala Leu His Met Ser Cys His Gly Phe Arg Asp Pro Phe Glu Cys Asn
20 25 30
Ile Cys Gly Tyr His Ser Gln Asp Arg Tyr Glu Phe Ser Ser His Ile
35 40 45
Val Arg Gly Glu His
50
<210> 123
<211> 53
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 123
Phe Lys Cys Glu His Cys Arg Ile Leu Phe Leu Asp His Val Met Phe
1 5 10 15
Thr Ile His Met Gly Cys His Gly Phe Arg Asp Pro Phe Lys Cys Asn
20 25 30
Met Cys Gly Glu Lys Cys Asp Gly Pro Val Gly Leu Phe Val His Met
35 40 45
Ala Arg Asn Ala His
50
<210> 124
<211> 53
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 124
His His Cys Gln His Cys Asp Met Tyr Phe Ala Asp Asn Ile Leu Tyr
1 5 10 15
Thr Ile His Met Gly Cys His Gly Tyr Glu Asn Pro Phe Glu Cys Asn
20 25 30
Ile Cys Gly Tyr His Ser Gln Asp Arg Tyr Glu Phe Ser Ser His Ile
35 40 45
Val Arg Gly Glu His
50
<210> 125
<211> 110
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 125
His His Cys Gln His Cys Asp Met Tyr Phe Ala Asp Asn Ile Leu Tyr
1 5 10 15
Thr Ile His Met Gly Cys His Ser Cys Asp Asp Val Phe Lys Cys Asn
20 25 30
Met Cys Gly Glu Lys Cys Asp Gly Pro Val Gly Leu Phe Val His Met
35 40 45
Ala Arg Asn Ala His Gly Glu Lys Pro Thr Lys Cys Val His Cys Gly
50 55 60
Ile Val Phe Leu Asp Glu Val Met Tyr Ala Leu His Met Ser Cys His
65 70 75 80
Gly Phe Arg Asp Pro Phe Glu Cys Asn Ile Cys Gly Tyr His Ser Gln
85 90 95
Asp Arg Tyr Glu Phe Ser Ser His Ile Val Arg Gly Glu His
100 105 110
<210> 126
<211> 110
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 126
Phe Lys Cys Glu His Cys Arg Ile Leu Phe Leu Asp His Val Met Phe
1 5 10 15
Thr Ile His Met Gly Cys His Gly Phe Arg Asp Pro Phe Lys Cys Asn
20 25 30
Met Cys Gly Glu Lys Cys Asp Gly Pro Val Gly Leu Phe Val His Met
35 40 45
Ala Arg Asn Ala His Gly Glu Lys Pro Phe Tyr Cys Glu His Cys Glu
50 55 60
Ile Thr Phe Arg Asp Val Val Met Tyr Ser Leu His Lys Gly Tyr His
65 70 75 80
Gly Phe Arg Asp Pro Phe Glu Cys Asn Ile Cys Gly Tyr His Ser Gln
85 90 95
Asp Arg Tyr Glu Phe Ser Ser His Ile Val Arg Gly Glu His
100 105 110
<210> 127
<211> 30
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 127
Ala Gln Leu Glu Lys Glu Leu Gln Ala Leu Glu Lys Lys Leu Ala Gln
1 5 10 15
Leu Glu Trp Glu Asn Gln Ala Leu Glu Lys Glu Leu Ala Gln
20 25 30
<210> 128
<211> 30
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 128
Ala Gln Leu Lys Lys Lys Leu Gln Ala Asn Lys Lys Glu Leu Ala Gln
1 5 10 15
Leu Lys Trp Lys Leu Gln Ala Leu Lys Lys Lys Leu Ala Gln
20 25 30
<210> 129
<211> 30
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 129
Glu Gln Leu Glu Lys Lys Leu Gln Ala Leu Glu Lys Lys Leu Ala Gln
1 5 10 15
Leu Glu Trp Lys Asn Gln Ala Leu Glu Lys Lys Leu Ala Gln
20 25 30
<210> 130
<211> 29
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 130
Ala Leu Lys Lys Glu Leu Gln Ala Asn Lys Lys Glu Leu Ala Gln Leu
1 5 10 15
Lys Trp Glu Leu Gln Ala Leu Lys Lys Glu Leu Ala Gln
20 25
<210> 131
<211> 26
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 131
Glu Gln Leu Glu Lys Lys Leu Gln Ala Leu Glu Lys Lys Leu Ala Gln
1 5 10 15
Leu Glu Trp Lys Asn Gln Ala Leu Glu Lys
20 25
<210> 132
<211> 25
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 132
Glu Leu Gln Ala Asn Lys Lys Glu Leu Ala Gln Leu Lys Trp Glu Leu
1 5 10 15
Gln Ala Leu Lys Lys Glu Leu Ala Gln
20 25
<210> 133
<211> 23
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 133
Glu Gln Leu Glu Lys Lys Leu Gln Ala Leu Glu Lys Lys Leu Ala Gln
1 5 10 15
Leu Glu Trp Lys Asn Gln Ala
20
<210> 134
<211> 23
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 134
Gln Ala Asn Lys Lys Glu Leu Ala Gln Leu Lys Trp Glu Leu Gln Ala
1 5 10 15
Leu Lys Lys Glu Leu Ala Gln
20
<210> 135
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 135
Thr Gly Glu Lys Pro
1 5
<210> 136
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 136
Thr Gly Gly Gln Arg Pro
1 5
<210> 137
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 137
Thr Gly Gln Lys Pro
1 5
<210> 138
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 138
Thr Gly Ser Gln Lys Pro
1 5
<210> 139
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 139
gaagatctca cttggggtcc tcaggtcgtg ccgac 35
<210> 140
<211> 41
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 140
gtatccaagc ttcagctttt ccagggtcgc ctaggcggtc t 41
<210> 141
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 141
gcctaggcga ccctggaaaa gctgatgaag gcc 33
<210> 142
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 142
gtatccaagc ttgagctgca gcgggcccaa actcacg 37
<210> 143
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 143
agtttggagg gtttctc 17
<210> 144
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 144
tcgactaaag caggatttca gg 22
<210> 145
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 145
agtttggagg gtttctt 17
<210> 146
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 146
agggtttctc cgctcagc 18
<210> 147
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 147
Gln Ser Gly Ala Leu Ala Arg
1 5
<210> 148
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 148
Arg Ser Ala Val Leu Ser Glu
1 5
<210> 149
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 149
Arg Ser Asp Asp Leu Ser Lys
1 5
<210> 150
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 150
Asp Asn Ser Asn Arg Ile Lys
1 5
<210> 151
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 151
Asp Asp Ser His Arg Lys Asp
1 5
<210> 152
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 152
Arg Ser Asp His Leu Thr Gln
1 5
<210> 153
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 153
Arg Ser Asp Ser Leu Leu Arg
1 5
<210> 154
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 154
Arg Arg Asp Trp Leu Pro Gln
1 5
<210> 155
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 155
cgcactcgcc gcgagggttg ccgggacg 28
<210> 156
<400> 156
000
<210> 157
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 157
agcagcagca gcagcagcag cagcagca 28
<210> 158
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 158
ctgctgctgc tgctgctgct gctggaag 28
<210> 159
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 159
cctgtccaga gggtcgcggt acctccct 28
<210> 160
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 160
tgccggacct ggcagcggcg gtggtggc 28
<210> 161
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 161
Arg Ser Asp Asn Leu Ser Glu Lys Arg Cys Asn Leu Arg Cys
1 5 10
<210> 162
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 162
Arg Ser Asp Asn Leu Ser Glu Lys Pro Tyr Asn Leu Arg Thr
1 5 10
<210> 163
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 163
Arg Ser Asp Asn Leu Ser Glu Arg Leu Trp Asn Arg Lys Gln
1 5 10
<210> 164
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 164
Arg Ser Asp Asn Leu Ser Val Arg Arg Trp Asn Leu Arg Ala
1 5 10
<210> 165
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 165
Arg Ser Asp Asn Leu Ser Val Arg Lys Trp Asn Arg Asp Ser
1 5 10
<210> 166
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 166
Arg Ser Asp Asn Leu Ser Glu Asn Thr Ser Pro Leu Met Leu
1 5 10
<210> 167
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 167
Arg Ser Asp Asn Leu Ser Glu Arg Arg Tyr Asn Leu Val Lys
1 5 10
<210> 168
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 168
Arg Ser Asp Thr Leu Ser Glu Arg Arg Trp Thr Leu Val Gly
1 5 10
<210> 169
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 169
Gln Ser Ser Asp Leu Ser Arg Gln Trp Ser Thr Arg Lys Arg
1 5 10
<210> 170
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 170
Arg Ser Ala His Leu Ser Arg Gln Ser Gly Asp Leu Thr Arg
1 5 10
<210> 171
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 171
Gln Ser Gly Asp Leu Thr Arg Gln Ser Gly Asp Leu Thr Arg
1 5 10
<210> 172
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 172
Gln Ser Gly Asp Leu Thr Arg Gln Ser Ser Asp Leu Arg Arg
1 5 10
<210> 173
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 173
Gln Ser Ser Asp Leu Ser Arg Gln Ser Ser Asp Leu Arg Arg
1 5 10
<210> 174
<211> 14
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 174
Gln Ser Ser Asp Leu Ser Arg His Arg Ser Thr Arg Asn Arg
1 5 10
<210> 175
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 175
Met Ala Cys Cys Arg Tyr Ala
1 5
<210> 176
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 176
Arg Ser Ala Asn Leu Arg Glu
1 5
<210> 177
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 177
Arg Asn Ala Asp Arg Lys Lys
1 5
<210> 178
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 178
Gln Asn Ala Thr Arg Ile Lys
1 5
<210> 179
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 179
Leu Arg Gln Lys Asp Ala Ala Arg Gly Ser Ala Ala Met Ala Glu Arg
1 5 10 15
Pro Phe Gln
<210> 180
<211> 76
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 180
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Leu Arg
1 5 10 15
Gly Ala Ala Thr Lys Cys Val His Cys Gly Ile Val Phe Leu Asp Glu
20 25 30
Val Met Tyr Ala Leu His Met Ser Cys His Gly Phe Arg Asp Pro Phe
35 40 45
Glu Cys Asn Ile Cys Gly Tyr His Ser Gln Asp Arg Tyr Glu Phe Ser
50 55 60
Ser His Ile Val Arg Gly Glu His Ser Gly Val Pro
65 70 75
<210> 181
<211> 76
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 181
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Leu Arg
1 5 10 15
Gly Ala Ala Phe Lys Cys Glu His Cys Arg Ile Leu Phe Leu Asp His
20 25 30
Val Met Phe Thr Ile His Met Gly Cys His Gly Phe Arg Asp Pro Phe
35 40 45
Lys Cys Asn Met Cys Gly Glu Lys Cys Asp Gly Pro Val Gly Leu Phe
50 55 60
Val His Met Ala Arg Asn Ala His Ser Gly Val Pro
65 70 75
<210> 182
<211> 76
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 182
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Leu Arg
1 5 10 15
Gly Ala Ala Phe Lys Cys Glu His Cys Arg Ile Leu Phe Leu Asp His
20 25 30
Val Met Phe Thr Ile His Met Gly Cys His Gly Phe Arg Asp Pro Phe
35 40 45
Lys Cys Asn Met Cys Gly Glu Lys Cys Asp Gly Pro Val Gly Leu Phe
50 55 60
Val His Met Ala Arg Asn Ala His Ser Gly Val Pro
65 70 75
<210> 183
<211> 133
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 183
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Leu Arg
1 5 10 15
Gly Ala Ala His His Cys Gln His Cys Asp Met Tyr Phe Ala Asp Asn
20 25 30
Ile Leu Tyr Thr Ile His Met Gly Cys His Ser Cys Asp Asp Val Phe
35 40 45
Lys Cys Asn Met Cys Gly Glu Lys Cys Asp Gly Pro Val Gly Leu Phe
50 55 60
Val His Met Ala Arg Asn Ala His Gly Glu Lys Pro Thr Lys Cys Val
65 70 75 80
His Cys Gly Ile Val Phe Leu Asp Glu Val Met Tyr Ala Leu His Met
85 90 95
Ser Cys His Gly Phe Arg Asp Pro Phe Glu Cys Asn Ile Cys Gly Tyr
100 105 110
His Ser Gln Asp Arg Tyr Glu Phe Ser Ser His Ile Val Arg Gly Glu
115 120 125
His Ser Gly Val Pro
130
<210> 184
<211> 57
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 184
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Leu Arg
1 5 10 15
Gly Ala Ala Gly Gly Ala Gln Leu Glu Lys Glu Leu Gln Ala Leu Glu
20 25 30
Lys Lys Leu Ala Gln Leu Glu Trp Glu Asn Gln Ala Leu Glu Lys Glu
35 40 45
Leu Ala Gln Gly Gly Ser Gly Val Pro
50 55
<210> 185
<211> 57
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 185
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Leu Arg
1 5 10 15
Gly Ala Ala Gly Gly Glu Gln Leu Glu Lys Lys Leu Gln Ala Leu Glu
20 25 30
Lys Lys Leu Ala Gln Leu Glu Trp Lys Asn Gln Ala Leu Glu Lys Lys
35 40 45
Leu Ala Gln Gly Gly Ser Gly Val Pro
50 55
<210> 186
<211> 53
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 186
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Leu Arg
1 5 10 15
Gly Ala Ala Gly Gly Glu Gln Leu Glu Lys Lys Leu Gln Ala Leu Glu
20 25 30
Lys Lys Leu Ala Gln Leu Glu Trp Lys Asn Gln Ala Leu Glu Lys Gly
35 40 45
Gly Ser Gly Val Pro
50
<210> 187
<211> 50
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 187
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Leu Arg
1 5 10 15
Gly Ala Ala Gly Gly Glu Gln Leu Glu Lys Lys Leu Gln Ala Leu Glu
20 25 30
Lys Lys Leu Ala Gln Leu Glu Trp Lys Asn Gln Ala Gly Gly Ser Gly
35 40 45
Val Pro
50
<210> 188
<211> 52
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 188
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Leu Ala
1 5 10 15
Ala Gly Gly Glu Gln Leu Glu Lys Lys Leu Gln Ala Leu Glu Lys Lys
20 25 30
Leu Ala Gln Leu Glu Trp Lys Asn Gln Ala Leu Glu Lys Lys Leu Ala
35 40 45
Gln Gly Val Pro
50
<210> 189
<211> 55
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 189
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Leu Ala
1 5 10 15
Ala Gly Gly Glu Gln Leu Glu Lys Lys Leu Gln Ala Leu Glu Lys Lys
20 25 30
Leu Ala Gln Leu Glu Trp Lys Asn Gln Ala Leu Glu Lys Lys Leu Ala
35 40 45
Gln Gly Gly Ser Gly Val Pro
50 55
<210> 190
<211> 52
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 190
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Leu Ala
1 5 10 15
Ala Gly Gly Glu Gln Leu Glu Lys Lys Leu Gln Ala Leu Glu Lys Lys
20 25 30
Leu Ala Gln Leu Glu Trp Lys Asn Gln Ala Leu Glu Lys Lys Leu Ala
35 40 45
Gln Gly Val Pro
50
<210> 191
<211> 240
<212> DNA
<213> Mus sp.
<400> 191
tctgtcccat cgggcaggaa gccgtcatgg caaccctgga aaagctgatg aaggctttcg 60
agtcgctcaa gtcgtttcag cagcaacagc agcagcagcc accgccgcag gcgccgccgc 120
caccgccgcc gccgcctccg cctcaacccc ctcagccgcc gcctcagggg cagccgccgc 180
cgccaccacc gccgctgcca ggtccggcag aggaaccgct gcaccgaccg tgagtccggg 240
<210> 192
<211> 300
<212> DNA
<213> Homo sapiens
<400> 192
actgccgtgc cgggcgggag accgccatgg cgaccctgga aaagctgatg aaggccttcg 60
agtccctcaa gtccttccag cagcagcagc agcagcagca gcagcagcag cagcagcagc 120
agcagcagca gcagcaacag ccgccaccgc cgccgccgcc gccgccgcct cctcagcttc 180
ctcagccgcc gccgcaggca cagccgctgc tgcctcagcc gcagccgccc ccgccgccgc 240
ccccgccgcc acccggcccg gctgtggctg aggagccgct gcaccgaccg tgagtttggg 300
<210> 193
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 193
caggtccggc agaggaacc 19
<210> 194
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 194
ttcacacggt ctttcttggt gg 22
<210> 195
<211> 16
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 195
gcccggctgt ggctga 16
<210> 196
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 196
ttcacacggt ctttcttggt gg 22
<210> 197
<211> 175
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 197
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr Ser
35 40 45
Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala
50 55 60
Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile
65 70 75 80
Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Lys
85 90 95
Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala Ile
100 105 110
Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu
115 120 125
Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr
130 135 140
Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val Glu
145 150 155 160
Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
<210> 198
<211> 175
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 198
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr Ser
35 40 45
Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala
50 55 60
Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile
65 70 75 80
Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Lys
85 90 95
Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala Ile
100 105 110
Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu
115 120 125
Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr
130 135 140
Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val Glu
145 150 155 160
Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
<210> 199
<211> 175
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 199
Met Asp Tyr Lys Asp His Asp Gly Asp Tyr Lys Asp His Asp Ile Asp
1 5 10 15
Tyr Lys Asp Asp Asp Asp Lys Met Ala Pro Lys Lys Lys Arg Lys Val
20 25 30
Gly Ile His Gly Val Pro Met Val Asp Leu Arg Thr Leu Gly Tyr Ser
35 40 45
Gln Gln Gln Gln Glu Lys Ile Lys Pro Lys Val Arg Ser Thr Val Ala
50 55 60
Gln His His Glu Ala Leu Val Gly His Gly Phe Thr His Ala His Ile
65 70 75 80
Val Ala Leu Ser Gln His Pro Ala Ala Leu Gly Thr Val Ala Val Lys
85 90 95
Tyr Gln Asp Met Ile Ala Ala Leu Pro Glu Ala Thr His Glu Ala Ile
100 105 110
Val Gly Val Gly Lys Gln Trp Ser Gly Ala Arg Ala Leu Glu Ala Leu
115 120 125
Leu Thr Val Ala Gly Glu Leu Arg Gly Pro Pro Leu Gln Leu Asp Thr
130 135 140
Gly Gln Leu Leu Lys Ile Ala Lys Arg Gly Gly Val Thr Ala Val Glu
145 150 155 160
Ala Val His Ala Trp Arg Asn Ala Leu Thr Gly Ala Pro Leu Asn
165 170 175
<210> 200
<211> 21
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Target sequence
<400> 200
gcagcagcag cagcagcagc a 21
<210> 201
<211> 18
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Target sequence
<400> 201
gcagcagcag cagcagca 18
<210> 202
<211> 15
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Target sequence
<400> 202
gcagcagcag cagca 15
<210> 203
<211> 12
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Target sequence
<400> 203
gcagcagcag ca 12
<210> 204
<211> 21
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Target sequence
<400> 204
ctgctgctgc tgctgctgct g 21
<210> 205
<211> 18
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Target sequence
<400> 205
ctgctgctgc tgctgctg 18
<210> 206
<211> 15
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Target sequence
<400> 206
ctgctgctgc tgctg 15
<210> 207
<211> 12
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Target sequence
<400> 207
ctgctgctgc tg 12
<210> 208
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
probe
<400> 208
tgccttcgga gtcatcttcc tctca 25
<210> 209
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 209
ccatccttaa cctctgtgtg a 21
<210> 210
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 210
aagtccatgc tacgctaatc ag 22
<210> 211
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
probe
<400> 211
agcatccatt ctccgcctgt tca 23
<210> 212
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 212
tgacagcatc tccatttcca g 21
<210> 213
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 213
tctgcaccgt tatcatgaag t 21
<210> 214
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
probe
<400> 214
ttcccctcct tctcctcccc a 21
<210> 215
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 215
ctgttcttgc cacttgacca 20
<210> 216
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 216
gctgtactcg gacctgtttg 20
<210> 217
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
probe
<400> 217
aggttcctct ccaggctcac ttagt 25
<210> 218
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 218
ggaaactctg aggaccaagt g 21
<210> 219
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 219
ctgggagata cagggctct 19
<210> 220
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
probe
<400> 220
aatgttgagc gagaggagtg gaagc 25
<210> 221
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 221
ctggtgaaga aggaagaatt gac 23
<210> 222
<211> 25
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 222
tcaaagtctc atacaagtca caaag 25
<210> 223
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
probe
<400> 223
tcggtgcagg ctatctatgt gcc 23
<210> 224
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 224
agggtcagtc aggtcatca 19
<210> 225
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 225
cacaatgcag gaaaggatca c 21
<210> 226
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
probe
<400> 226
ctctgaggcg aaggaccagg tg 22
<210> 227
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 227
cattctctat ggtgtcactg gg 22
<210> 228
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 228
aacatccaga aagagtccac c 21
<210> 229
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
probe
<400> 229
cagctccctg tcccggcgg 19
<210> 230
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 230
gctgcaccga ccgtgagt 18
<210> 231
<211> 18
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
primer
<400> 231
cgcaggctgc agggttac 18
<210> 232
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> misc_feature
<222> (1)..(60)
<223> This sequence may encompass 15-20 CAG repeats
<400> 232
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60
<210> 233
<211> 180
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 233
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 180
<210> 234
<211> 141
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> misc_feature
<222> (1)..(141)
<223> This sequence may encompass 10-47 CAG repeats
<400> 234
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120
cagcagcagc agcagcagca g 141
<210> 235
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 235
cagcagcagc agcagcagca gcagcagcag 30
<210> 236
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 236
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca g 51
<210> 237
<211> 69
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 237
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60
cagcagcag 69
<210> 238
<211> 141
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 238
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120
cagcagcagc agcagcagca g 141
<210> 239
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 239
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcag 45
<210> 240
<211> 210
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 240
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 180
cagcagcagc agcagcagca gcagcagcag 210
<210> 241
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 241
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcag 54
<210> 242
<211> 135
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 242
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120
cagcagcagc agcag 135
<210> 243
<211> 207
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 243
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 180
cagcagcagc agcagcagca gcagcag 207
<210> 244
<211> 144
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 244
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120
cagcagcagc agcagcagca gcag 144
<210> 245
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 245
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60
<210> 246
<211> 123
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 246
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120
cag 123
<210> 247
<211> 29
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 247
ctgctgctgc tgctgctgct gctggaagg 29
<210> 248
<211> 28
<212> DNA
<213> Unknown
<220>
<223> Description of Unknown: Human or mouse
target sequence
<400> 248
gcggcgagtg cgtcccgtga cgtcatgc 28
<210> 249
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
peptide
<400> 249
Leu Ala Gly Leu Ile Asp Ala Asp Gly
1 5
<210> 250
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 250
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcag 48
<210> 251
<211> 333
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 251
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 180
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 240
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 300
cagcagcagc agcagcagca gcagcagcag cag 333
<210> 252
<211> 201
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 252
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 180
cagcagcagc agcagcagca g 201
<210> 253
<211> 132
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 253
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120
cagcagcagc ag 132
<210> 254
<211> 360
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 254
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 180
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 240
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 300
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 360
<210> 255
<211> 150
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 255
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120
cagcagcagc agcagcagca gcagcagcag 150
<210> 256
<211> 240
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 256
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 180
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 240
<210> 257
<211> 327
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 257
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 180
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 240
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 300
cagcagcagc agcagcagca gcagcag 327
<210> 258
<211> 540
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 258
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 180
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 240
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 300
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 360
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 420
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 480
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 540
<210> 259
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 259
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60
cagcagcagc agcag 75
<210> 260
<211> 108
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 260
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcag 108
<210> 261
<211> 117
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 261
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcag 117
<210> 262
<211> 72
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 262
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60
cagcagcagc ag 72
<210> 263
<211> 126
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 263
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120
cagcag 126
<210> 264
<211> 87
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 264
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60
cagcagcagc agcagcagca gcagcag 87
<210> 265
<211> 120
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 265
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120
<210> 266
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 266
gcagcagcag cagcagcagc 20
<210> 267
<211> 174
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 267
Gly Ser Gly Gly Thr Lys Cys Val His Cys Gly Ile Val Phe Leu Asp
1 5 10 15
Glu Val Met Tyr Ala Leu His Met Ser Cys His Gly Phe Arg Asp Pro
20 25 30
Phe Glu Cys Asn Ile Cys Gly Tyr His Ser Gln Asp Arg Tyr Glu Phe
35 40 45
Ser Ser His Ile Val Arg Gly Glu His Leu Arg Gln Lys Asp Ala Ala
50 55 60
Arg Ser Arg Ser Gly Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg
65 70 75 80
Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu
85 90 95
Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Val Tyr Arg Asn Val Met
100 105 110
Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys
115 120 125
Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val
130 135 140
Glu Arg Glu Ile His Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe
145 150 155 160
Glu Ile Lys Ser Ser Val Asp Tyr Lys Asp Asp Asp Asp Lys
165 170
<210> 268
<211> 174
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 268
Gly Ser Gly Gly Thr Lys Cys Val His Cys Gly Ile Val Phe Leu Asp
1 5 10 15
Glu Val Met Tyr Ala Leu His Met Ser Cys His Gly Phe Arg Asp Pro
20 25 30
Phe Glu Cys Asn Ile Cys Gly Tyr His Ser Gln Asp Arg Tyr Glu Phe
35 40 45
Ser Ser His Ile Val Arg Gly Glu His Leu Arg Gln Lys Asp Ala Ala
50 55 60
Arg Ser Arg Ser Gly Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg
65 70 75 80
Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu
85 90 95
Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Val Tyr Arg Asn Val Met
100 105 110
Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys
115 120 125
Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val
130 135 140
Glu Arg Glu Ile His Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe
145 150 155 160
Glu Ile Lys Ser Ser Val Asp Tyr Lys Asp Asp Asp Asp Lys
165 170
<210> 269
<211> 174
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 269
Gly Ser Gly Gly His His Cys Gln His Cys Asp Met Tyr Phe Ala Asp
1 5 10 15
Asn Ile Leu Tyr Thr Ile His Met Gly Cys His Gly Tyr Glu Asn Pro
20 25 30
Phe Glu Cys Asn Ile Cys Gly Tyr His Ser Gln Asp Arg Tyr Glu Phe
35 40 45
Ser Ser His Ile Val Arg Gly Glu His Leu Arg Gln Lys Asp Ala Ala
50 55 60
Arg Ser Arg Ser Gly Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg
65 70 75 80
Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu
85 90 95
Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Val Tyr Arg Asn Val Met
100 105 110
Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys
115 120 125
Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val
130 135 140
Glu Arg Glu Ile His Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe
145 150 155 160
Glu Ile Lys Ser Ser Val Asp Tyr Lys Asp Asp Asp Asp Lys
165 170
<210> 270
<211> 231
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 270
Gly Ser Gly Gly Phe Lys Cys Glu His Cys Arg Ile Leu Phe Leu Asp
1 5 10 15
His Val Met Phe Thr Ile His Met Gly Cys His Gly Phe Arg Asp Pro
20 25 30
Phe Lys Cys Asn Met Cys Gly Glu Lys Cys Asp Gly Pro Val Gly Leu
35 40 45
Phe Val His Met Ala Arg Asn Ala His Gly Glu Lys Pro Phe Tyr Cys
50 55 60
Glu His Cys Glu Ile Thr Phe Arg Asp Val Val Met Tyr Ser Leu His
65 70 75 80
Lys Gly Tyr His Gly Phe Arg Asp Pro Phe Glu Cys Asn Ile Cys Gly
85 90 95
Tyr His Ser Gln Asp Arg Tyr Glu Phe Ser Ser His Ile Val Arg Gly
100 105 110
Glu His Leu Arg Gln Lys Asp Ala Ala Arg Ser Arg Ser Gly Met Asp
115 120 125
Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp
130 135 140
Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala
145 150 155 160
Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu
165 170 175
Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu
180 185 190
Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu
195 200 205
Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Asp
210 215 220
Tyr Lys Asp Asp Asp Asp Lys
225 230
<210> 271
<211> 153
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 271
Gly Ser Gly Gly Ala Gln Leu Lys Lys Lys Leu Gln Ala Asn Lys Lys
1 5 10 15
Glu Leu Ala Gln Leu Lys Trp Lys Leu Gln Ala Leu Lys Lys Lys Leu
20 25 30
Ala Gln Gly Gly Leu Arg Gln Lys Asp Ala Ala Arg Ser Arg Ser Gly
35 40 45
Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe
50 55 60
Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp
65 70 75 80
Thr Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys
85 90 95
Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu
100 105 110
Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His
115 120 125
Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser
130 135 140
Val Asp Tyr Lys Asp Asp Asp Asp Lys
145 150
<210> 272
<211> 152
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 272
Gly Ser Gly Gly Ala Leu Lys Lys Glu Leu Gln Ala Asn Lys Lys Glu
1 5 10 15
Leu Ala Gln Leu Lys Trp Glu Leu Gln Ala Leu Lys Lys Glu Leu Ala
20 25 30
Gln Gly Gly Leu Arg Gln Lys Asp Ala Ala Arg Ser Arg Ser Gly Met
35 40 45
Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys
50 55 60
Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr
65 70 75 80
Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn
85 90 95
Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg
100 105 110
Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln
115 120 125
Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val
130 135 140
Asp Tyr Lys Asp Asp Asp Asp Lys
145 150
<210> 273
<211> 148
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 273
Gly Ser Gly Gly Glu Leu Gln Ala Asn Lys Lys Glu Leu Ala Gln Leu
1 5 10 15
Lys Trp Glu Leu Gln Ala Leu Lys Lys Glu Leu Ala Gln Gly Gly Leu
20 25 30
Arg Gln Lys Asp Ala Ala Arg Ser Arg Ser Gly Met Asp Ala Lys Ser
35 40 45
Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp Val Phe Val
50 55 60
Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile
65 70 75 80
Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu
85 90 95
Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly
100 105 110
Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu Thr His Pro
115 120 125
Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Asp Tyr Lys Asp
130 135 140
Asp Asp Asp Lys
145
<210> 274
<211> 146
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 274
Gly Ser Gly Gly Gln Ala Asn Lys Lys Glu Leu Ala Gln Leu Lys Trp
1 5 10 15
Glu Leu Gln Ala Leu Lys Lys Glu Leu Ala Gln Gly Gly Leu Arg Gln
20 25 30
Lys Asp Ala Ala Arg Ser Arg Ser Gly Met Asp Ala Lys Ser Leu Thr
35 40 45
Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe
50 55 60
Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Val Tyr
65 70 75 80
Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr
85 90 95
Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu
100 105 110
Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu Thr His Pro Asp Ser
115 120 125
Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Asp Tyr Lys Asp Asp Asp
130 135 140
Asp Lys
145
<210> 275
<211> 55
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 275
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Leu Ala
1 5 10 15
Ala Gly Gly Glu Gln Leu Glu Lys Lys Leu Gln Ala Leu Glu Lys Lys
20 25 30
Leu Ala Gln Leu Glu Trp Lys Asn Gln Ala Leu Glu Lys Lys Leu Ala
35 40 45
Gln Gly Gly Ser Gly Val Pro
50 55
<210> 276
<211> 141
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 276
Gly Ser Gly Gly Ala Leu Lys Lys Glu Leu Gln Ala Asn Lys Lys Glu
1 5 10 15
Leu Ala Gln Leu Lys Trp Glu Leu Gln Ala Leu Lys Lys Glu Leu Ala
20 25 30
Gln Gly Ser Gly Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr
35 40 45
Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp
50 55 60
Lys Leu Leu Asp Thr Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu
65 70 75 80
Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro
85 90 95
Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu
100 105 110
Arg Glu Ile His Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu
115 120 125
Ile Lys Ser Ser Val Asp Tyr Lys Asp Asp Asp Asp Lys
130 135 140
<210> 277
<211> 141
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 277
Gly Ser Gly Gly Ala Leu Lys Lys Glu Leu Gln Ala Asn Lys Lys Glu
1 5 10 15
Leu Ala Gln Leu Lys Trp Glu Leu Gln Ala Leu Lys Lys Glu Leu Ala
20 25 30
Gln Gly Ser Gly Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr
35 40 45
Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp
50 55 60
Lys Leu Leu Asp Thr Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu
65 70 75 80
Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro
85 90 95
Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu
100 105 110
Arg Glu Ile His Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu
115 120 125
Ile Lys Ser Ser Val Asp Tyr Lys Asp Asp Asp Asp Lys
130 135 140
<210> 278
<211> 139
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 278
Gly Ser Ala Leu Lys Lys Glu Leu Gln Ala Asn Lys Lys Glu Leu Ala
1 5 10 15
Gln Leu Lys Trp Glu Leu Gln Ala Leu Lys Lys Glu Leu Ala Gln Gly
20 25 30
Ser Gly Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val
35 40 45
Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu
50 55 60
Leu Asp Thr Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn
65 70 75 80
Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val
85 90 95
Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu
100 105 110
Ile His Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys
115 120 125
Ser Ser Val Asp Tyr Lys Asp Asp Asp Asp Lys
130 135
<210> 279
<211> 139
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 279
Gly Ser Ala Leu Lys Lys Glu Leu Gln Ala Asn Lys Lys Glu Leu Ala
1 5 10 15
Gln Leu Lys Trp Glu Leu Gln Ala Leu Lys Lys Glu Leu Ala Gln Gly
20 25 30
Ser Gly Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val
35 40 45
Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu
50 55 60
Leu Asp Thr Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn
65 70 75 80
Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val
85 90 95
Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu
100 105 110
Ile His Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys
115 120 125
Ser Ser Val Asp Tyr Lys Asp Asp Asp Asp Lys
130 135
<210> 280
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 280
cagcagcagc agcagcagca g 21
<210> 281
<211> 300
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 281
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 180
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 240
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 300
<210> 282
<211> 170
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 282
Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro
1 5 10 15
Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala
20 25 30
Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro
35 40 45
His Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg
50 55 60
Thr Ser His Arg Val Ala Gly Ser Gly Met Asp Ala Lys Ser Leu Thr
65 70 75 80
Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe
85 90 95
Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Val Tyr
100 105 110
Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr
115 120 125
Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu
130 135 140
Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu Thr His Pro Asp Ser
145 150 155 160
Glu Thr Ala Phe Glu Ile Lys Ser Ser Val
165 170
<210> 283
<211> 338
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 283
Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro
1 5 10 15
Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala
20 25 30
Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro
35 40 45
His Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg
50 55 60
Thr Ser His Arg Val Ala Asp His Ala Gln Val Val Arg Val Leu Gly
65 70 75 80
Phe Phe Gln Cys His Ser His Pro Ala Gln Ala Phe Asp Asp Ala Met
85 90 95
Thr Gln Phe Gly Met Ser Arg His Gly Leu Leu Gln Leu Phe Arg Arg
100 105 110
Val Gly Val Thr Glu Leu Glu Ala Arg Ser Gly Thr Leu Pro Pro Ala
115 120 125
Ser Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser Gly Met Lys Arg Ala
130 135 140
Lys Pro Ser Pro Thr Ser Thr Gln Thr Pro Asp Gln Ala Ser Leu His
145 150 155 160
Ala Phe Ala Asp Ser Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro Thr
165 170 175
His Glu Gly Asp Gln Arg Arg Ala Ser Ser Arg Lys Arg Ser Arg Ser
180 185 190
Asp Arg Ala Val Thr Gly Pro Ser Ala Gln Gln Ser Phe Glu Val Arg
195 200 205
Ala Pro Glu Gln Arg Asp Ala Leu His Leu Pro Leu Ser Trp Arg Val
210 215 220
Lys Arg Pro Arg Thr Ser Ile Gly Gly Gly Leu Pro Asp Pro Gly Ser
225 230 235 240
Gly Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr
245 250 255
Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu
260 265 270
Asp Thr Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr
275 280 285
Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile
290 295 300
Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile
305 310 315 320
His Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser
325 330 335
Ser Val
<210> 284
<211> 384
<212> PRT
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polypeptide
<400> 284
Gly Gly Arg Pro Ala Leu Glu Ser Ile Val Ala Gln Leu Ser Arg Pro
1 5 10 15
Asp Pro Ala Leu Ala Ala Leu Thr Asn Asp His Leu Val Ala Leu Ala
20 25 30
Cys Leu Gly Gly Arg Pro Ala Leu Asp Ala Val Lys Lys Gly Leu Pro
35 40 45
His Ala Pro Ala Leu Ile Lys Arg Thr Asn Arg Arg Ile Pro Glu Arg
50 55 60
Thr Ser His Arg Val Ala Asp His Ala Gln Val Val Arg Val Leu Gly
65 70 75 80
Phe Phe Gln Cys His Ser His Pro Ala Gln Ala Phe Asp Asp Ala Met
85 90 95
Thr Gln Phe Gly Met Ser Arg His Gly Leu Leu Gln Leu Phe Arg Arg
100 105 110
Val Gly Val Thr Glu Leu Glu Ala Arg Ser Gly Thr Leu Pro Pro Ala
115 120 125
Ser Gln Arg Trp Asp Arg Ile Leu Gln Ala Ser Gly Met Lys Arg Ala
130 135 140
Lys Pro Ser Pro Thr Ser Thr Gln Thr Pro Asp Gln Ala Ser Leu His
145 150 155 160
Ala Phe Ala Asp Ser Leu Glu Arg Asp Leu Asp Ala Pro Ser Pro Thr
165 170 175
His Glu Gly Asp Gln Arg Arg Ala Ser Ser Arg Lys Arg Ser Arg Ser
180 185 190
Asp Arg Ala Val Thr Gly Pro Ser Ala Gln Gln Ser Phe Glu Val Arg
195 200 205
Ala Pro Glu Gln Arg Asp Ala Leu His Leu Pro Leu Ser Trp Arg Val
210 215 220
Lys Arg Pro Arg Thr Ser Ile Gly Gly Gly Leu Pro Asp Pro Thr Pro
225 230 235 240
Thr Ala Ala Asp Leu Ala Ala Ser Ser Thr Val Met Arg Glu Gln Asp
245 250 255
Glu Asp Pro Phe Ala Gly Ala Ala Asp Asp Phe Pro Ala Phe Asn Glu
260 265 270
Glu Glu Leu Ala Trp Leu Met Glu Leu Leu Pro Gln Gly Ser Gly Met
275 280 285
Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys
290 295 300
Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr
305 310 315 320
Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn
325 330 335
Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg
340 345 350
Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln
355 360 365
Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val
370 375 380
<210> 285
<211> 105
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 285
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcag 105
<210> 286
<211> 117
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<400> 286
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcag 117
Claims (18)
- 제 1항에 있어서, PDE 10a, DARPP-32, DRD1 및 DRD2 수준에서 선택된 어느 하나 이상의 수준은 대조표준에 비하여 적어도 40% 또는 50% 또는 그 이상 증가되는 것을 특징으로 하는 방법.
- 제 1항에 있어서, 유전자 리프레서는 헌팅틴 단백질을 코딩하는 핵산을 억제하는 작은 분자, 핵산 또는 단백질인 것을 특징으로 하는 방법.
- 제 1항에 있어서, 유전자 리프레서는 헌팅틴 단백질을 코딩하는 핵산에 특이적으로 결합하는 것을 특징으로 하는 방법.
- 제 1항에 있어서, 유전자 리프레서는 엔지니어링된 DNA-결합 도메인을 포함하는 것을 특징으로 하는 방법.
- 제 1항에 있어서, 유전자 리프레서는 대상의 중추 신경계 (CNS)에 투여되는 것을 특징으로 하는 방법.
- 제 6항에 있어서, 유전자 리프레서는 선조체에 투여되는 것을 특징으로 하는 방법.
- 제 1항에 있어서, 유전자 리프레서는 바이러스 또는 비-바이러스 벡터를 사용하여 투여되는 것을 특징으로 하는 방법.
- 제 8항에 있어서, 바이러스 또는 비-바이러스 벡터는 아데노-관련 바이러스 (AAV) 벡터인 것을 특징으로 하는 방법.
- 중간 가시 뉴런 (MSN)에서 PDE 10a, DARPP-32, DRD1 및 DRD2 수준을 대조표준에 비하여 적어도 30% 증가시킴으로써 헌팅턴병(HD)에서 운동 기능 결함을 치료하기 위한 약학적 조성물로서,
상기 약학적 조성물은 전사 억압 도메인에 융합된 Htt 유전자에 결합하는 징크 핑거 단백질(ZFP) DNA 결합 도메인을 포함하는 유전자 리프레서를 포함하고,
상기 ZFP는 F1 내지 F6의 순서로 6개의 징크 핑거 도메인을 포함하고,
징크 핑거 도메인은 하기 표에 나타난 바와 같은 인식 나선 영역을 포함하는, 약학적 조성물:
. - 제 10항에 있어서, PDE 10a, DARPP-32, DRD1 및 DRD2 수준은 대조표준에 비하여 적어도 100% 또는 그 이상 증가되는 것을 특징으로 하는 약학적 조성물.
- 제 10항 또는 제 11항에 있어서, 유전자 리프레서는 대상의 중추 신경계 (CNS)에 투여되는 것을 특징으로 하는 약학적 조성물.
- 제 12항에 있어서, 유전자 리프레서는 선조체에 투여되는 것을 특징으로 하는 약학적 조성물.
- 제 12항에 있어서, 유전자 리프레서는 바이러스 또는 비-바이러스 벡터를 사용하여 투여되는 것을 특징으로 하는 약학적 조성물.
- 제 14항에 있어서, 바이러스 또는 비-바이러스 벡터는 아데노-관련 바이러스 (AAV) 벡터인 것을 특징으로 하는 약학적 조성물.
- 제 15항에 있어서, AAV 벡터는 AAV6 벡터인 것을 특징으로 하는 약학적 조성물.
- 제 10항에 있어서, 대상에서 HD의 운동 기능 결함이 치료되는 것을 특징으로 하는 약학적 조성물.
- 제 10항에 있어서, DNA 결합 도메인이 돌연변이 Htt 대립유전자에 결합하는 것을 특징으로 하는 약학적 조성물.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361902704P | 2013-11-11 | 2013-11-11 | |
US61/902,704 | 2013-11-11 | ||
PCT/US2014/064987 WO2015070212A1 (en) | 2013-11-11 | 2014-11-11 | Methods and compositions for treating huntington's disease |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20160077208A KR20160077208A (ko) | 2016-07-01 |
KR102431079B1 true KR102431079B1 (ko) | 2022-08-11 |
Family
ID=53042231
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020167015301A KR102431079B1 (ko) | 2013-11-11 | 2014-11-11 | 헌팅턴병을 치료하기 위한 방법 및 조성물 |
Country Status (12)
Country | Link |
---|---|
US (1) | US10369201B2 (ko) |
EP (1) | EP3068905A4 (ko) |
JP (2) | JP2016537341A (ko) |
KR (1) | KR102431079B1 (ko) |
CN (1) | CN105934524A (ko) |
AU (1) | AU2014346424B2 (ko) |
BR (1) | BR112016010175A2 (ko) |
CA (1) | CA2929179A1 (ko) |
MX (1) | MX2016006106A (ko) |
NZ (1) | NZ719477A (ko) |
RU (1) | RU2693891C1 (ko) |
WO (1) | WO2015070212A1 (ko) |
Families Citing this family (56)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2744987C (en) | 2008-12-02 | 2018-01-16 | Chiralgen, Ltd. | Method for the synthesis of phosphorus atom modified nucleic acids |
AU2010270714B2 (en) | 2009-07-06 | 2015-08-13 | Wave Life Sciences Ltd. | Novel nucleic acid prodrugs and methods use thereof |
EP2620428B1 (en) | 2010-09-24 | 2019-05-22 | Wave Life Sciences Ltd. | Asymmetric auxiliary group |
SG10201700554VA (en) | 2011-07-19 | 2017-03-30 | Wave Life Sciences Pte Ltd | Methods for the synthesis of functionalized nucleic acids |
CA2853829C (en) | 2011-07-22 | 2023-09-26 | President And Fellows Of Harvard College | Evaluation and improvement of nuclease cleavage specificity |
SG11201500239VA (en) | 2012-07-13 | 2015-03-30 | Wave Life Sciences Japan | Asymmetric auxiliary group |
WO2014012081A2 (en) | 2012-07-13 | 2014-01-16 | Ontorii, Inc. | Chiral control |
BR112015000723A2 (pt) | 2012-07-13 | 2017-06-27 | Shin Nippon Biomedical Laboratories Ltd | adjuvante de ácido nucléico quiral |
US20150044192A1 (en) | 2013-08-09 | 2015-02-12 | President And Fellows Of Harvard College | Methods for identifying a target site of a cas9 nuclease |
US9359599B2 (en) | 2013-08-22 | 2016-06-07 | President And Fellows Of Harvard College | Engineered transcription activator-like effector (TALE) domains and uses thereof |
US9737604B2 (en) | 2013-09-06 | 2017-08-22 | President And Fellows Of Harvard College | Use of cationic lipids to deliver CAS9 |
US9228207B2 (en) | 2013-09-06 | 2016-01-05 | President And Fellows Of Harvard College | Switchable gRNAs comprising aptamers |
US9388430B2 (en) | 2013-09-06 | 2016-07-12 | President And Fellows Of Harvard College | Cas9-recombinase fusion proteins and uses thereof |
CA2930015A1 (en) | 2013-11-07 | 2015-05-14 | Editas Medicine, Inc. | Crispr-related methods and compositions with governing grnas |
US11053481B2 (en) | 2013-12-12 | 2021-07-06 | President And Fellows Of Harvard College | Fusions of Cas9 domains and nucleic acid-editing domains |
JPWO2015108046A1 (ja) | 2014-01-15 | 2017-03-23 | 株式会社新日本科学 | 抗アレルギー作用を有するキラル核酸アジュバンド及び抗アレルギー剤 |
EP3095461A4 (en) | 2014-01-15 | 2017-08-23 | Shin Nippon Biomedical Laboratories, Ltd. | Chiral nucleic acid adjuvant having immunity induction activity, and immunity induction activator |
US10149905B2 (en) | 2014-01-15 | 2018-12-11 | Shin Nippon Biomedical Laboratories, Ltd. | Chiral nucleic acid adjuvant having antitumor effect and antitumor agent |
MX2016009290A (es) | 2014-01-16 | 2017-02-28 | Wave Life Sciences Ltd | Diseño quiral. |
US10077453B2 (en) | 2014-07-30 | 2018-09-18 | President And Fellows Of Harvard College | CAS9 proteins including ligand-dependent inteins |
RU2749882C2 (ru) | 2014-11-14 | 2021-06-18 | Вояджер Терапьютикс, Инк. | Модулирующие полинуклеотиды |
US20160362667A1 (en) * | 2015-06-10 | 2016-12-15 | Caribou Biosciences, Inc. | CRISPR-Cas Compositions and Methods |
MA43072A (fr) | 2015-07-22 | 2018-05-30 | Wave Life Sciences Ltd | Compositions d'oligonucléotides et procédés associés |
IL294014B2 (en) | 2015-10-23 | 2024-07-01 | Harvard College | Nucleobase editors and their uses |
EP3219799A1 (en) | 2016-03-17 | 2017-09-20 | IMBA-Institut für Molekulare Biotechnologie GmbH | Conditional crispr sgrna expression |
MA45270A (fr) | 2016-05-04 | 2017-11-09 | Wave Life Sciences Ltd | Compositions d'oligonucléotides et procédés associés |
JP7220080B2 (ja) | 2016-05-18 | 2023-02-09 | ボイジャー セラピューティクス インコーポレイテッド | ハンチントン病治療組成物及び方法 |
RU2758488C2 (ru) | 2016-05-18 | 2021-10-28 | Вояджер Терапьютикс, Инк. | Модулирующие полинуклеотиды |
IL308426A (en) | 2016-08-03 | 2024-01-01 | Harvard College | Adenosine nuclear base editors and their uses |
US11661590B2 (en) | 2016-08-09 | 2023-05-30 | President And Fellows Of Harvard College | Programmable CAS9-recombinase fusion proteins and uses thereof |
US11542509B2 (en) | 2016-08-24 | 2023-01-03 | President And Fellows Of Harvard College | Incorporation of unnatural amino acids into proteins using base editing |
US10457940B2 (en) * | 2016-09-22 | 2019-10-29 | University Of Massachusetts | AAV treatment of Huntington's disease |
SG11201903089RA (en) | 2016-10-14 | 2019-05-30 | Harvard College | Aav delivery of nucleobase editors |
US20210285010A1 (en) * | 2016-10-31 | 2021-09-16 | University Of Florida Research Foundation, Inc. | Compositions and methods for impeding transcription of expanded microsatellite repeats |
CN106636388A (zh) * | 2016-12-15 | 2017-05-10 | 湖南中能荆卫生物科技有限公司 | 用于亨廷顿病诊断的基因及其应用以及由其编码的蛋白和蛋白的应用 |
WO2018119359A1 (en) | 2016-12-23 | 2018-06-28 | President And Fellows Of Harvard College | Editing of ccr5 receptor gene to protect against hiv infection |
US11898179B2 (en) | 2017-03-09 | 2024-02-13 | President And Fellows Of Harvard College | Suppression of pain by gene editing |
EP3592777A1 (en) | 2017-03-10 | 2020-01-15 | President and Fellows of Harvard College | Cytosine to guanine base editor |
JP7191388B2 (ja) | 2017-03-23 | 2022-12-19 | プレジデント アンド フェローズ オブ ハーバード カレッジ | 核酸によってプログラム可能なdna結合蛋白質を含む核酸塩基編集因子 |
WO2018204803A1 (en) | 2017-05-05 | 2018-11-08 | Voyager Therapeutics, Inc. | Compositions and methods of treating huntington's disease |
CN111801345A (zh) | 2017-07-28 | 2020-10-20 | 哈佛大学的校长及成员们 | 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物 |
US11319532B2 (en) | 2017-08-30 | 2022-05-03 | President And Fellows Of Harvard College | High efficiency base editors comprising Gam |
AR113134A1 (es) * | 2017-09-22 | 2020-01-29 | Genzyme Corp | Arni variante |
CN111757937A (zh) | 2017-10-16 | 2020-10-09 | 布罗德研究所股份有限公司 | 腺苷碱基编辑器的用途 |
US20190167815A1 (en) * | 2017-10-24 | 2019-06-06 | Sangamo Therapeutics, Inc. | Methods and compositions for the treatment of rare diseases |
KR20240033089A (ko) * | 2018-06-06 | 2024-03-12 | 더 리젠츠 오브 더 유니버시티 오브 캘리포니아 | 신경 줄기 세포 조성물 및 신경변성 장애를 치료하는 방법 |
CN109112162B (zh) * | 2018-08-30 | 2021-10-15 | 西南大学 | 利用CRISPR/Cas9技术构建的亨廷顿病原位敲入小鼠模型及构建方法 |
JP7542912B2 (ja) * | 2019-01-15 | 2024-09-02 | サンガモ セラピューティクス, インコーポレイテッド | Httリプレッサーおよびその使用 |
WO2020191243A1 (en) | 2019-03-19 | 2020-09-24 | The Broad Institute, Inc. | Methods and compositions for editing nucleotide sequences |
TW202132567A (zh) * | 2019-11-01 | 2021-09-01 | 美商阿尼拉製藥公司 | 亨汀頓蛋白(HTT)iRNA劑組成物及其使用方法 |
WO2021087358A1 (en) | 2019-11-01 | 2021-05-06 | Sangamo Therapeutics, Inc. | Gin recombinase variants |
CN110747208B (zh) * | 2019-11-28 | 2022-04-22 | 海南大学 | 一种木薯硝酸还原酶基因及其过量表达载体的构建和抗病应用 |
US20230340470A1 (en) * | 2019-12-20 | 2023-10-26 | Asklepios Biopharmaceutical, Inc. | Methods for treating huntington's disease |
DE112021002672T5 (de) | 2020-05-08 | 2023-04-13 | President And Fellows Of Harvard College | Vefahren und zusammensetzungen zum gleichzeitigen editieren beider stränge einer doppelsträngigen nukleotid-zielsequenz |
WO2024148179A2 (en) * | 2023-01-05 | 2024-07-11 | Emugen Therapeutics Llc | Retro-aav and use in treating neurodegenerative diseases |
WO2024148189A2 (en) * | 2023-01-05 | 2024-07-11 | Emugen Therapeutics Llc | Neuronal promoters and uses thereof |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100299768A1 (en) * | 2007-06-18 | 2010-11-25 | Commissariat A L'energie Atomique | Reversible siRNA-Based Silencing of Mutant and Endogenous Wild-Type Huntingtin Gene and its Application for the Treatment of Huntington's Disease |
WO2013130824A1 (en) * | 2012-02-29 | 2013-09-06 | Sangamo Biosciences, Inc. | Methods and compositions for treating huntington's disease |
Family Cites Families (102)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4217344A (en) | 1976-06-23 | 1980-08-12 | L'oreal | Compositions containing aqueous dispersions of lipid spheres |
US4235871A (en) | 1978-02-24 | 1980-11-25 | Papahadjopoulos Demetrios P | Method of encapsulating biologically active materials in lipid vesicles |
US4186183A (en) | 1978-03-29 | 1980-01-29 | The United States Of America As Represented By The Secretary Of The Army | Liposome carriers in chemotherapy of leishmaniasis |
US4261975A (en) | 1979-09-19 | 1981-04-14 | Merck & Co., Inc. | Viral liposome particle |
US4485054A (en) | 1982-10-04 | 1984-11-27 | Lipoderm Pharmaceuticals Limited | Method of encapsulating biologically active materials in multilamellar lipid vesicles (MLV) |
US4501728A (en) | 1983-01-06 | 1985-02-26 | Technology Unlimited, Inc. | Masking of liposomes from RES recognition |
US5049386A (en) | 1985-01-07 | 1991-09-17 | Syntex (U.S.A.) Inc. | N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
US4897355A (en) | 1985-01-07 | 1990-01-30 | Syntex (U.S.A.) Inc. | N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
US4946787A (en) | 1985-01-07 | 1990-08-07 | Syntex (U.S.A.) Inc. | N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
US4797368A (en) | 1985-03-15 | 1989-01-10 | The United States Of America As Represented By The Department Of Health And Human Services | Adeno-associated virus as eukaryotic expression vector |
US4774085A (en) | 1985-07-09 | 1988-09-27 | 501 Board of Regents, Univ. of Texas | Pharmaceutical administration systems containing a mixture of immunomodulators |
US5422251A (en) | 1986-11-26 | 1995-06-06 | Princeton University | Triple-stranded nucleic acids |
US4837028A (en) | 1986-12-24 | 1989-06-06 | Liposome Technology, Inc. | Liposomes with enhanced circulation time |
US5176996A (en) | 1988-12-20 | 1993-01-05 | Baylor College Of Medicine | Method for making synthetic oligonucleotides which bind specifically to target sites on duplex DNA molecules, by forming a colinear triplex, the synthetic oligonucleotides and methods of use |
US5264618A (en) | 1990-04-19 | 1993-11-23 | Vical, Inc. | Cationic lipids for intracellular delivery of biologically active molecules |
WO1991017424A1 (en) | 1990-05-03 | 1991-11-14 | Vical, Inc. | Intracellular delivery of biologically active substances by means of self-assembling lipid complexes |
US5173414A (en) | 1990-10-30 | 1992-12-22 | Applied Immune Sciences, Inc. | Production of recombinant adeno-associated virus vectors |
US5420032A (en) | 1991-12-23 | 1995-05-30 | Universitge Laval | Homing endonuclease which originates from chlamydomonas eugametos and recognizes and cleaves a 15, 17 or 19 degenerate double stranded nucleotide sequence |
US5487994A (en) | 1992-04-03 | 1996-01-30 | The Johns Hopkins University | Insertion and deletion mutants of FokI restriction endonuclease |
US5356802A (en) | 1992-04-03 | 1994-10-18 | The Johns Hopkins University | Functional domains in flavobacterium okeanokoites (FokI) restriction endonuclease |
US5436150A (en) | 1992-04-03 | 1995-07-25 | The Johns Hopkins University | Functional domains in flavobacterium okeanokoities (foki) restriction endonuclease |
US5792632A (en) | 1992-05-05 | 1998-08-11 | Institut Pasteur | Nucleotide sequence encoding the enzyme I-SceI and the uses thereof |
US5587308A (en) | 1992-06-02 | 1996-12-24 | The United States Of America As Represented By The Department Of Health & Human Services | Modified adeno-associated virus vector capable of expression from a novel promoter |
DE69534629D1 (de) | 1994-01-18 | 2005-12-29 | Scripps Research Inst | Derivate von zinkfingerproteinen und methoden |
US6242568B1 (en) | 1994-01-18 | 2001-06-05 | The Scripps Research Institute | Zinc finger protein derivatives and methods therefor |
US6140466A (en) | 1994-01-18 | 2000-10-31 | The Scripps Research Institute | Zinc finger protein derivatives and methods therefor |
ATE410518T1 (de) | 1994-03-23 | 2008-10-15 | Univ Ohio | Kompaktnukleinsäure und ihre verabreichung in zellen |
US5585245A (en) | 1994-04-22 | 1996-12-17 | California Institute Of Technology | Ubiquitin-based split protein sensor |
GB9824544D0 (en) | 1998-11-09 | 1999-01-06 | Medical Res Council | Screening system |
USRE39229E1 (en) | 1994-08-20 | 2006-08-08 | Gendaq Limited | Binding proteins for recognition of DNA |
US5789538A (en) | 1995-02-03 | 1998-08-04 | Massachusetts Institute Of Technology | Zinc finger proteins with high affinity new DNA binding specificities |
US5928638A (en) | 1996-06-17 | 1999-07-27 | Systemix, Inc. | Methods for gene transfer |
US5925523A (en) | 1996-08-23 | 1999-07-20 | President & Fellows Of Harvard College | Intraction trap assay, reagents and uses thereof |
GB9703369D0 (en) | 1997-02-18 | 1997-04-09 | Lindqvist Bjorn H | Process |
GB2338237B (en) | 1997-02-18 | 2001-02-28 | Actinova Ltd | In vitro peptide or protein expression library |
US6342345B1 (en) | 1997-04-02 | 2002-01-29 | The Board Of Trustees Of The Leland Stanford Junior University | Detection of molecular interactions by reporter subunit complementation |
GB9710809D0 (en) | 1997-05-23 | 1997-07-23 | Medical Res Council | Nucleic acid binding proteins |
GB9710807D0 (en) | 1997-05-23 | 1997-07-23 | Medical Res Council | Nucleic acid binding proteins |
US6410248B1 (en) | 1998-01-30 | 2002-06-25 | Massachusetts Institute Of Technology | General strategy for selecting high-affinity zinc finger proteins for diverse DNA target sites |
WO1999045132A1 (en) | 1998-03-02 | 1999-09-10 | Massachusetts Institute Of Technology | Poly zinc finger proteins with improved linkers |
US6140081A (en) | 1998-10-16 | 2000-10-31 | The Scripps Research Institute | Zinc finger binding domains for GNN |
US7070934B2 (en) | 1999-01-12 | 2006-07-04 | Sangamo Biosciences, Inc. | Ligand-controlled regulation of endogenous gene expression |
US6534261B1 (en) | 1999-01-12 | 2003-03-18 | Sangamo Biosciences, Inc. | Regulation of endogenous gene expression in cells using zinc finger proteins |
US6503717B2 (en) | 1999-12-06 | 2003-01-07 | Sangamo Biosciences, Inc. | Methods of using randomized libraries of zinc finger proteins for the identification of gene function |
US6599692B1 (en) | 1999-09-14 | 2003-07-29 | Sangamo Bioscience, Inc. | Functional genomics using zinc finger proteins |
US6453242B1 (en) | 1999-01-12 | 2002-09-17 | Sangamo Biosciences, Inc. | Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites |
US7013219B2 (en) | 1999-01-12 | 2006-03-14 | Sangamo Biosciences, Inc. | Regulation of endogenous gene expression in cells using zinc finger proteins |
US7030215B2 (en) | 1999-03-24 | 2006-04-18 | Sangamo Biosciences, Inc. | Position dependent recognition of GNN nucleotide triplets by zinc fingers |
US6794136B1 (en) | 2000-11-20 | 2004-09-21 | Sangamo Biosciences, Inc. | Iterative optimization in the design of binding proteins |
US20070060606A1 (en) * | 1999-10-07 | 2007-03-15 | Robertson Harold A | Compounds and methods for modulating phosphodiesterase 10A |
WO2001059450A2 (en) | 2000-02-08 | 2001-08-16 | Sangamo Biosciences, Inc. | Cells expressing zinc finger protein for drug discovery |
US20020061512A1 (en) | 2000-02-18 | 2002-05-23 | Kim Jin-Soo | Zinc finger domains and methods of identifying same |
AU2001253914B2 (en) | 2000-04-28 | 2006-06-08 | Sangamo Therapeutics, Inc. | Targeted modification of chromatin structure |
US7217509B2 (en) | 2000-04-28 | 2007-05-15 | Sangamo Biosciences, Inc. | Databases of regulatory sequences; methods of making and using same |
WO2001088197A2 (en) | 2000-05-16 | 2001-11-22 | Massachusetts Institute Of Technology | Methods and compositions for interaction trap assays |
IL154059A0 (en) | 2000-07-21 | 2003-07-31 | Syngenta Participations Ag | Zinc finger domain recognition code and uses thereof |
JP2002060786A (ja) | 2000-08-23 | 2002-02-26 | Kao Corp | 硬質表面用殺菌防汚剤 |
DE60128122D1 (de) | 2000-09-28 | 2007-06-06 | Sangamo Biosciences Inc | Kernumprogrammierung bei iswi und ähnlichen chromatinremodellierenden atpasen |
US6919204B2 (en) | 2000-09-29 | 2005-07-19 | Sangamo Biosciences, Inc. | Modulation of gene expression using localization domains |
RU2192884C2 (ru) * | 2000-11-09 | 2002-11-20 | Государственное учреждение Научно-исследовательский институт клинической иммунологии СО РАМН | Вакцина для стимуляции противоопухолевого иммунитета |
US7067317B2 (en) | 2000-12-07 | 2006-06-27 | Sangamo Biosciences, Inc. | Regulation of angiogenesis with zinc finger proteins |
GB0108491D0 (en) | 2001-04-04 | 2001-05-23 | Gendaq Ltd | Engineering zinc fingers |
JP2005500061A (ja) | 2001-08-20 | 2005-01-06 | ザ スクリップス リサーチ インスティテュート | Cnnについての亜鉛フィンガー結合ドメイン |
US7262054B2 (en) | 2002-01-22 | 2007-08-28 | Sangamo Biosciences, Inc. | Zinc finger proteins for DNA binding and gene regulation in plants |
AU2003251286B2 (en) | 2002-01-23 | 2007-08-16 | The University Of Utah Research Foundation | Targeted chromosomal mutagenesis using zinc finger nucleases |
ES2292994T3 (es) | 2002-03-15 | 2008-03-16 | Cellectis | Meganucleasas hibridas y de cadena sencilla y su utilizacion. |
EP2368982A3 (en) | 2002-03-21 | 2011-10-12 | Sangamo BioSciences, Inc. | Methods and compositions for using zinc finger endonucleases to enhance homologous recombination |
US7074596B2 (en) | 2002-03-25 | 2006-07-11 | Board Of Supervisors Of Louisiana State University And Agricultural And Mechanical College | Synthesis and use of anti-reverse mRNA cap analogues |
US7361635B2 (en) | 2002-08-29 | 2008-04-22 | Sangamo Biosciences, Inc. | Simultaneous modulation of multiple genes |
WO2004037977A2 (en) | 2002-09-05 | 2004-05-06 | California Institute Of Thechnology | Use of chimeric nucleases to stimulate gene targeting |
EP2522723B1 (en) | 2003-01-28 | 2014-12-03 | Cellectis | Custom-made meganuclease and use thereof |
US20070134796A1 (en) | 2005-07-26 | 2007-06-14 | Sangamo Biosciences, Inc. | Targeted integration and expression of exogenous nucleic acid sequences |
US8409861B2 (en) | 2003-08-08 | 2013-04-02 | Sangamo Biosciences, Inc. | Targeted deletion of cellular DNA sequences |
US7888121B2 (en) | 2003-08-08 | 2011-02-15 | Sangamo Biosciences, Inc. | Methods and compositions for targeted cleavage and recombination |
US7972854B2 (en) | 2004-02-05 | 2011-07-05 | Sangamo Biosciences, Inc. | Methods and compositions for targeted cleavage and recombination |
CA2562193A1 (en) | 2004-04-08 | 2005-10-27 | Sangamo Biosciences, Inc. | Treatment of neuropathic pain with zinc finger proteins |
ATE418346T1 (de) | 2004-04-08 | 2009-01-15 | Sangamo Biosciences Inc | Zusammensetzungen zur behandlung von neuropathischen und neurodegenerativen erkrankungen |
US20080131962A1 (en) | 2006-05-25 | 2008-06-05 | Sangamo Biosciences, Inc. | Engineered cleavage half-domains |
US20060063231A1 (en) | 2004-09-16 | 2006-03-23 | Sangamo Biosciences, Inc. | Compositions and methods for protein production |
MX2007013757A (es) | 2005-05-05 | 2008-01-24 | Univ Arizona | Reagrupacion permitida de secuencia (seer)-met odo de novedad para visualizar secuencias de adn especificas. |
US8021867B2 (en) | 2005-10-18 | 2011-09-20 | Duke University | Rationally-designed meganucleases with altered sequence specificity and DNA-binding affinity |
EP2022818B1 (en) | 2006-03-07 | 2013-01-02 | Koichi Nakamura | Process for the decomposition and reclamation of synthetic resins having ester-linkage structures |
CA2650414A1 (en) | 2006-05-19 | 2007-11-29 | Sangamo Biosciences, Inc. | Methods and compositions for inactivation of dihydrofolate reductase |
WO2007139982A2 (en) | 2006-05-25 | 2007-12-06 | Sangamo Biosciences, Inc. | Methods and compositions for gene inactivation |
CN101679977B (zh) | 2007-04-26 | 2013-05-01 | 桑格摩生物科学股份有限公司 | 向ppp1r12c基因座的靶向整合 |
CA2692906C (en) | 2007-06-19 | 2016-01-19 | Board Of Supervisors Of Louisiana State University And Agricultural And Mechanical College | Synthesis and use of anti-reverse phosphorothioate analogs of the messenger rna cap |
CA2700231C (en) | 2007-09-27 | 2018-09-18 | Sangamo Biosciences, Inc. | Rapid in vivo identification of biologically active nucleases |
CA2715080C (en) | 2007-09-28 | 2021-09-28 | Intrexon Corporation | Therapeutic gene-switch constructs and bioreactors for the expression of biotherapeutic molecules, and uses thereof |
US8597912B2 (en) | 2008-06-10 | 2013-12-03 | Sangamo Biosciences, Inc. | Methods and compositions for generation of Bax-and Bak-deficient cell lines |
CN102625655B (zh) | 2008-12-04 | 2016-07-06 | 桑格摩生物科学股份有限公司 | 使用锌指核酸酶在大鼠中进行基因组编辑 |
EP2206723A1 (en) | 2009-01-12 | 2010-07-14 | Bonas, Ulla | Modular DNA-binding domains |
AU2010281705B2 (en) | 2009-07-28 | 2015-02-05 | Sangamo Therapeutics, Inc. | Methods and compositions for treating trinucleotide repeat disorders |
JP5785168B2 (ja) | 2009-07-31 | 2015-09-24 | エスリス ゲーエムベーハーethris GmbH | タンパク質発現用未修飾および修飾ヌクレオチドの組み合わせを有するrna |
JP6137596B2 (ja) | 2010-02-08 | 2017-05-31 | サンガモ セラピューティクス, インコーポレイテッド | 遺伝子操作された切断ハーフドメイン |
US8771985B2 (en) | 2010-04-26 | 2014-07-08 | Sangamo Biosciences, Inc. | Genome editing of a Rosa locus using zinc-finger nucleases |
HUE048072T2 (hu) | 2010-05-03 | 2020-05-28 | Sangamo Therapeutics Inc | Készítmények cinkujj-modulok összekapcsolására |
EP3156062A1 (en) | 2010-05-17 | 2017-04-19 | Sangamo BioSciences, Inc. | Novel dna-binding proteins and uses thereof |
EP2441774B1 (en) | 2010-10-15 | 2018-12-12 | Fundació Centre de Regulació Genòmica | Peptides having zinc finger domains and uses thereof |
US9405700B2 (en) | 2010-11-04 | 2016-08-02 | Sonics, Inc. | Methods and apparatus for virtualization in an integrated circuit |
CN103917644A (zh) | 2011-09-21 | 2014-07-09 | 桑格摩生物科学股份有限公司 | 调控转基因表达的方法和组合物 |
JP6188703B2 (ja) | 2011-10-27 | 2017-08-30 | サンガモ セラピューティクス, インコーポレイテッド | Hprt遺伝子座を修飾するための方法および組成物 |
EP2780460B1 (en) | 2011-11-16 | 2018-07-11 | Sangamo Therapeutics, Inc. | Modified dna-binding proteins and uses thereof |
-
2014
- 2014-11-11 CN CN201480072869.5A patent/CN105934524A/zh active Pending
- 2014-11-11 MX MX2016006106A patent/MX2016006106A/es unknown
- 2014-11-11 AU AU2014346424A patent/AU2014346424B2/en active Active
- 2014-11-11 CA CA2929179A patent/CA2929179A1/en not_active Abandoned
- 2014-11-11 BR BR112016010175A patent/BR112016010175A2/pt active Search and Examination
- 2014-11-11 EP EP14860665.0A patent/EP3068905A4/en not_active Withdrawn
- 2014-11-11 JP JP2016528904A patent/JP2016537341A/ja active Pending
- 2014-11-11 KR KR1020167015301A patent/KR102431079B1/ko active IP Right Grant
- 2014-11-11 US US15/036,020 patent/US10369201B2/en active Active
- 2014-11-11 NZ NZ719477A patent/NZ719477A/en unknown
- 2014-11-11 RU RU2016123086A patent/RU2693891C1/ru active
- 2014-11-11 WO PCT/US2014/064987 patent/WO2015070212A1/en active Application Filing
-
2019
- 2019-03-29 JP JP2019067000A patent/JP2019116502A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100299768A1 (en) * | 2007-06-18 | 2010-11-25 | Commissariat A L'energie Atomique | Reversible siRNA-Based Silencing of Mutant and Endogenous Wild-Type Huntingtin Gene and its Application for the Treatment of Huntington's Disease |
WO2013130824A1 (en) * | 2012-02-29 | 2013-09-06 | Sangamo Biosciences, Inc. | Methods and compositions for treating huntington's disease |
Non-Patent Citations (2)
Title |
---|
A.L.O. HEBB et al., Neuroscience, vol. 123, pp. 967-981 (2004년 공개)* |
Jang-Ho J. Cha et al., PNAS, vol. 95, pp. 6480-6485 (1998년 공개)* |
Also Published As
Publication number | Publication date |
---|---|
CA2929179A1 (en) | 2015-05-14 |
AU2014346424A1 (en) | 2016-05-19 |
US10369201B2 (en) | 2019-08-06 |
BR112016010175A2 (pt) | 2017-10-03 |
RU2693891C1 (ru) | 2019-07-05 |
WO2015070212A1 (en) | 2015-05-14 |
RU2016123086A (ru) | 2017-12-19 |
EP3068905A4 (en) | 2017-07-05 |
US20160296605A1 (en) | 2016-10-13 |
KR20160077208A (ko) | 2016-07-01 |
NZ719477A (en) | 2022-05-27 |
JP2016537341A (ja) | 2016-12-01 |
AU2014346424B2 (en) | 2020-09-17 |
MX2016006106A (es) | 2016-12-09 |
CN105934524A (zh) | 2016-09-07 |
EP3068905A1 (en) | 2016-09-21 |
JP2019116502A (ja) | 2019-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102431079B1 (ko) | 헌팅턴병을 치료하기 위한 방법 및 조성물 | |
US11723952B2 (en) | Methods and compositions for treating Huntington's Disease | |
US9943565B2 (en) | Methods and compositions for treating trinucleotide repeat disorders |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right |