CN1723284A - 调节性锌指蛋白 - Google Patents
调节性锌指蛋白 Download PDFInfo
- Publication number
- CN1723284A CN1723284A CNA2003801054757A CN200380105475A CN1723284A CN 1723284 A CN1723284 A CN 1723284A CN A2003801054757 A CNA2003801054757 A CN A2003801054757A CN 200380105475 A CN200380105475 A CN 200380105475A CN 1723284 A CN1723284 A CN 1723284A
- Authority
- CN
- China
- Prior art keywords
- zinc finger
- finger domain
- contact residues
- arg
- dna contact
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 101710185494 Zinc finger protein Proteins 0.000 title claims abstract description 235
- 102100023597 Zinc finger protein 816 Human genes 0.000 title claims abstract description 235
- 230000001105 regulatory effect Effects 0.000 title claims description 54
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 255
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 151
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 150
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 150
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 132
- 108010073929 Vascular Endothelial Growth Factor A Proteins 0.000 claims abstract description 123
- 230000014509 gene expression Effects 0.000 claims abstract description 61
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 claims description 280
- 229910052725 zinc Inorganic materials 0.000 claims description 280
- 239000011701 zinc Substances 0.000 claims description 280
- 210000004027 cell Anatomy 0.000 claims description 271
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 188
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 164
- 229920001184 polypeptide Polymers 0.000 claims description 163
- 108020004414 DNA Proteins 0.000 claims description 152
- 238000000034 method Methods 0.000 claims description 102
- 239000000203 mixture Substances 0.000 claims description 55
- 206010028980 Neoplasm Diseases 0.000 claims description 53
- 201000011510 cancer Diseases 0.000 claims description 45
- 230000004568 DNA-binding Effects 0.000 claims description 44
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 39
- 201000010099 disease Diseases 0.000 claims description 38
- 108010019530 Vascular Endothelial Growth Factors Proteins 0.000 claims description 29
- 210000004204 blood vessel Anatomy 0.000 claims description 25
- 230000004913 activation Effects 0.000 claims description 19
- 210000004962 mammalian cell Anatomy 0.000 claims description 17
- 206010061218 Inflammation Diseases 0.000 claims description 13
- 230000004054 inflammatory process Effects 0.000 claims description 13
- 239000008194 pharmaceutical composition Substances 0.000 claims description 13
- -1 rhIGF-1 Proteins 0.000 claims description 13
- 230000035897 transcription Effects 0.000 claims description 13
- 238000013518 transcription Methods 0.000 claims description 13
- 238000010361 transduction Methods 0.000 claims description 10
- 230000026683 transduction Effects 0.000 claims description 10
- 230000029279 positive regulation of transcription, DNA-dependent Effects 0.000 claims description 9
- 238000005538 encapsulation Methods 0.000 claims description 8
- 102100033299 Glia-derived nexin Human genes 0.000 claims description 7
- 108010068250 Herpes Simplex Virus Protein Vmw65 Proteins 0.000 claims description 7
- 101000997803 Homo sapiens Glia-derived nexin Proteins 0.000 claims description 7
- 239000000560 biocompatible material Substances 0.000 claims description 6
- 230000002068 genetic effect Effects 0.000 claims description 6
- 230000004048 modification Effects 0.000 claims description 6
- 238000012986 modification Methods 0.000 claims description 6
- 101710192266 Tegument protein VP22 Proteins 0.000 claims description 5
- 108010048671 Homeodomain Proteins Proteins 0.000 claims description 4
- 102000009331 Homeodomain Proteins Human genes 0.000 claims description 4
- 102000004877 Insulin Human genes 0.000 claims description 4
- 108090001061 Insulin Proteins 0.000 claims description 4
- 108010063738 Interleukins Proteins 0.000 claims description 4
- 102000015696 Interleukins Human genes 0.000 claims description 4
- 241000283973 Oryctolagus cuniculus Species 0.000 claims description 4
- 230000008521 reorganization Effects 0.000 claims description 4
- 102000018233 Fibroblast Growth Factor Human genes 0.000 claims description 3
- 108050007372 Fibroblast Growth Factor Proteins 0.000 claims description 3
- 102000014150 Interferons Human genes 0.000 claims description 3
- 108010050904 Interferons Proteins 0.000 claims description 3
- 229940126864 fibroblast growth factor Drugs 0.000 claims description 3
- 229910052739 hydrogen Inorganic materials 0.000 claims description 3
- 229940079322 interferon Drugs 0.000 claims description 3
- 101000898034 Homo sapiens Hepatocyte growth factor Proteins 0.000 claims description 2
- 102000005789 Vascular Endothelial Growth Factors Human genes 0.000 claims 5
- 102100021866 Hepatocyte growth factor Human genes 0.000 claims 1
- 101001076408 Homo sapiens Interleukin-6 Proteins 0.000 claims 1
- 101000868152 Homo sapiens Son of sevenless homolog 1 Proteins 0.000 claims 1
- 102000009524 Vascular Endothelial Growth Factor A Human genes 0.000 abstract description 120
- 230000033115 angiogenesis Effects 0.000 abstract 1
- 235000018102 proteins Nutrition 0.000 description 128
- 241000282414 Homo sapiens Species 0.000 description 64
- 108010016616 cysteinylglycine Proteins 0.000 description 63
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 61
- MDOBWSFNSNPENN-PMVVWTBXSA-N His-Thr-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O MDOBWSFNSNPENN-PMVVWTBXSA-N 0.000 description 55
- 239000013612 plasmid Substances 0.000 description 51
- 238000004458 analytical method Methods 0.000 description 48
- FMBWLLMUPXTXFC-SDDRHHMPSA-N Glu-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N)C(=O)O FMBWLLMUPXTXFC-SDDRHHMPSA-N 0.000 description 43
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 43
- GZUIDWDVMWZSMI-KKUMJFAQSA-N Tyr-Lys-Cys Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CS)C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GZUIDWDVMWZSMI-KKUMJFAQSA-N 0.000 description 43
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 41
- PKXHGEXFMIZSER-QTKMDUPCSA-N Thr-Arg-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O PKXHGEXFMIZSER-QTKMDUPCSA-N 0.000 description 41
- 230000027455 binding Effects 0.000 description 41
- 239000002585 base Substances 0.000 description 37
- 235000001014 amino acid Nutrition 0.000 description 35
- 108010065920 Insulin Lispro Proteins 0.000 description 34
- 238000011282 treatment Methods 0.000 description 33
- 229940024606 amino acid Drugs 0.000 description 32
- MIROMRNASYKZNL-ULQDDVLXSA-N Lys-Pro-Tyr Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 MIROMRNASYKZNL-ULQDDVLXSA-N 0.000 description 31
- 238000012360 testing method Methods 0.000 description 31
- FLYANDHDFRGGTM-PYJNHQTQSA-N Arg-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FLYANDHDFRGGTM-PYJNHQTQSA-N 0.000 description 30
- 150000001413 amino acids Chemical group 0.000 description 30
- 230000000694 effects Effects 0.000 description 30
- KSHJMDSNSKDJPU-QTKMDUPCSA-N Arg-Thr-His Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 KSHJMDSNSKDJPU-QTKMDUPCSA-N 0.000 description 29
- ZZIFPJZQHRJERU-WDSKDSINSA-N Glu-Cys-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O ZZIFPJZQHRJERU-WDSKDSINSA-N 0.000 description 28
- 239000002773 nucleotide Substances 0.000 description 27
- 125000003729 nucleotide group Chemical group 0.000 description 27
- 108010061238 threonyl-glycine Proteins 0.000 description 27
- 108091023040 Transcription factor Proteins 0.000 description 26
- 102000040945 Transcription factor Human genes 0.000 description 26
- 238000001890 transfection Methods 0.000 description 26
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 23
- 239000003814 drug Substances 0.000 description 23
- 239000000523 sample Substances 0.000 description 23
- 150000001875 compounds Chemical class 0.000 description 22
- 108020004999 messenger RNA Proteins 0.000 description 22
- DZSICRGTVPDCRN-YUMQZZPRSA-N Cys-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N DZSICRGTVPDCRN-YUMQZZPRSA-N 0.000 description 20
- YIBOAHAOAWACDK-QEJZJMRPSA-N Lys-Ala-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YIBOAHAOAWACDK-QEJZJMRPSA-N 0.000 description 20
- 108091028043 Nucleic acid sequence Proteins 0.000 description 20
- 108060001084 Luciferase Proteins 0.000 description 19
- SXAGUVRFGJSFKC-ZEILLAHLSA-N Thr-His-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SXAGUVRFGJSFKC-ZEILLAHLSA-N 0.000 description 19
- 108010048818 seryl-histidine Proteins 0.000 description 19
- 210000001519 tissue Anatomy 0.000 description 19
- CJQAEJMHBAOQHA-DLOVCJGASA-N Ala-Phe-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CJQAEJMHBAOQHA-DLOVCJGASA-N 0.000 description 18
- 239000005089 Luciferase Substances 0.000 description 18
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 18
- 108010051110 tyrosyl-lysine Proteins 0.000 description 18
- 239000013598 vector Substances 0.000 description 18
- LFAUVOXPCGJKTB-DCAQKATOSA-N Arg-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N LFAUVOXPCGJKTB-DCAQKATOSA-N 0.000 description 17
- JGDGLDNAQJJGJI-AVGNSLFASA-N Arg-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N JGDGLDNAQJJGJI-AVGNSLFASA-N 0.000 description 16
- OCDJOVKIUJVUMO-SRVKXCTJSA-N Arg-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N OCDJOVKIUJVUMO-SRVKXCTJSA-N 0.000 description 16
- 238000013461 design Methods 0.000 description 16
- LVWIJITYHRZHBO-IXOXFDKPSA-N His-Leu-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LVWIJITYHRZHBO-IXOXFDKPSA-N 0.000 description 15
- UTCFSBBXPWKLTG-XKBZYTNZSA-N Thr-Cys-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O UTCFSBBXPWKLTG-XKBZYTNZSA-N 0.000 description 15
- 125000003275 alpha amino acid group Chemical group 0.000 description 15
- 239000011159 matrix material Substances 0.000 description 15
- MWLYSLMKFXWZPW-ZPFDUUQYSA-N Gln-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCC(N)=O MWLYSLMKFXWZPW-ZPFDUUQYSA-N 0.000 description 14
- URWXDJAEEGBADB-TUBUOCAGSA-N Ile-His-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N URWXDJAEEGBADB-TUBUOCAGSA-N 0.000 description 14
- 108091034117 Oligonucleotide Proteins 0.000 description 14
- CICQXRWZNVXFCU-SRVKXCTJSA-N Ser-His-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O CICQXRWZNVXFCU-SRVKXCTJSA-N 0.000 description 14
- IWRMTNJCCMEBEX-AVGNSLFASA-N Tyr-Glu-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)O IWRMTNJCCMEBEX-AVGNSLFASA-N 0.000 description 14
- 239000003795 chemical substances by application Substances 0.000 description 14
- 238000003752 polymerase chain reaction Methods 0.000 description 14
- LVQDUPQUJZWKSU-PYJNHQTQSA-N Ile-Arg-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N LVQDUPQUJZWKSU-PYJNHQTQSA-N 0.000 description 13
- LUAJJLPHUXPQLH-KKUMJFAQSA-N Lys-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N LUAJJLPHUXPQLH-KKUMJFAQSA-N 0.000 description 13
- 230000008859 change Effects 0.000 description 13
- 230000001939 inductive effect Effects 0.000 description 13
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 12
- FHVDTGUDJYJELY-UHFFFAOYSA-N 6-{[2-carboxy-4,5-dihydroxy-6-(phosphanyloxy)oxan-3-yl]oxy}-4,5-dihydroxy-3-phosphanyloxane-2-carboxylic acid Chemical compound O1C(C(O)=O)C(P)C(O)C(O)C1OC1C(C(O)=O)OC(OP)C(O)C1O FHVDTGUDJYJELY-UHFFFAOYSA-N 0.000 description 12
- NUSWUSKZRCGFEX-FXQIFTODSA-N Glu-Glu-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O NUSWUSKZRCGFEX-FXQIFTODSA-N 0.000 description 12
- IEVXCWPVBYCJRZ-IXOXFDKPSA-N Lys-Thr-His Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IEVXCWPVBYCJRZ-IXOXFDKPSA-N 0.000 description 12
- UKUMISIRZAVYOG-CIUDSAMLSA-N Met-Glu-Cys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CS)C(O)=O UKUMISIRZAVYOG-CIUDSAMLSA-N 0.000 description 12
- ZFVWWUILVLLVFA-AVGNSLFASA-N Phe-Gln-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N ZFVWWUILVLLVFA-AVGNSLFASA-N 0.000 description 12
- 241000700605 Viruses Species 0.000 description 12
- 238000006471 dimerization reaction Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 12
- 108010051242 phenylalanylserine Proteins 0.000 description 12
- 230000001225 therapeutic effect Effects 0.000 description 12
- LIEIYPBMQJLASB-SRVKXCTJSA-N His-Gln-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CN=CN1 LIEIYPBMQJLASB-SRVKXCTJSA-N 0.000 description 11
- ZDJQVSIPFLMNOX-RHYQMDGZSA-N Leu-Thr-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZDJQVSIPFLMNOX-RHYQMDGZSA-N 0.000 description 11
- HXSUFWQYLPKEHF-IHRRRGAJSA-N Phe-Asn-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HXSUFWQYLPKEHF-IHRRRGAJSA-N 0.000 description 11
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 11
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 11
- NVNPWELENFJOHH-CIUDSAMLSA-N Ser-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CO)N NVNPWELENFJOHH-CIUDSAMLSA-N 0.000 description 11
- VGNLMPBYWWNQFS-ZEILLAHLSA-N Thr-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O VGNLMPBYWWNQFS-ZEILLAHLSA-N 0.000 description 11
- 108700009124 Transcription Initiation Site Proteins 0.000 description 11
- 229940072056 alginate Drugs 0.000 description 11
- 235000010443 alginic acid Nutrition 0.000 description 11
- 229920000615 alginic acid Polymers 0.000 description 11
- 108010068380 arginylarginine Proteins 0.000 description 11
- 108010062796 arginyllysine Proteins 0.000 description 11
- 238000010494 dissociation reaction Methods 0.000 description 11
- 230000005593 dissociations Effects 0.000 description 11
- 150000003839 salts Chemical class 0.000 description 11
- 230000002103 transcriptional effect Effects 0.000 description 11
- PEIBBAXIKUAYGN-UBHSHLNASA-N Ala-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 PEIBBAXIKUAYGN-UBHSHLNASA-N 0.000 description 10
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 10
- ADPACBMPYWJJCE-FXQIFTODSA-N Arg-Ser-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O ADPACBMPYWJJCE-FXQIFTODSA-N 0.000 description 10
- WSXDIZFNQYTUJB-SRVKXCTJSA-N Asp-His-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O WSXDIZFNQYTUJB-SRVKXCTJSA-N 0.000 description 10
- 102000004190 Enzymes Human genes 0.000 description 10
- 108090000790 Enzymes Proteins 0.000 description 10
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 10
- NDSNUWJPZKTFAR-DCAQKATOSA-N Lys-Cys-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCCCN NDSNUWJPZKTFAR-DCAQKATOSA-N 0.000 description 10
- UIUWGMRJTWHIJZ-ULQDDVLXSA-N Pro-Tyr-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O UIUWGMRJTWHIJZ-ULQDDVLXSA-N 0.000 description 10
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 10
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 10
- SEFNTZYRPGBDCY-IHRRRGAJSA-N Tyr-Arg-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N)O SEFNTZYRPGBDCY-IHRRRGAJSA-N 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 10
- 229940088598 enzyme Drugs 0.000 description 10
- 108010025306 histidylleucine Proteins 0.000 description 10
- 238000001727 in vivo Methods 0.000 description 10
- 239000003550 marker Substances 0.000 description 10
- 239000000047 product Substances 0.000 description 10
- 238000012216 screening Methods 0.000 description 10
- TTXMOJWKNRJWQJ-FXQIFTODSA-N Ala-Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N TTXMOJWKNRJWQJ-FXQIFTODSA-N 0.000 description 9
- RKQRHMKFNBYOTN-IHRRRGAJSA-N Arg-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N RKQRHMKFNBYOTN-IHRRRGAJSA-N 0.000 description 9
- 101000808011 Homo sapiens Vascular endothelial growth factor A Proteins 0.000 description 9
- LECIJRIRMVOFMH-ULQDDVLXSA-N Lys-Pro-Phe Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 LECIJRIRMVOFMH-ULQDDVLXSA-N 0.000 description 9
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 9
- SFZKGGOGCNQPJY-CIUDSAMLSA-N Ser-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N SFZKGGOGCNQPJY-CIUDSAMLSA-N 0.000 description 9
- 230000033228 biological regulation Effects 0.000 description 9
- 238000002474 experimental method Methods 0.000 description 9
- 238000001415 gene therapy Methods 0.000 description 9
- 102000058223 human VEGFA Human genes 0.000 description 9
- 238000009396 hybridization Methods 0.000 description 9
- 210000003734 kidney Anatomy 0.000 description 9
- 108010056582 methionylglutamic acid Proteins 0.000 description 9
- 230000005012 migration Effects 0.000 description 9
- 238000013508 migration Methods 0.000 description 9
- 108010018625 phenylalanylarginine Proteins 0.000 description 9
- 230000002265 prevention Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 241000894007 species Species 0.000 description 9
- XZKIHKMTEMTJQX-UHFFFAOYSA-N 4-Nitrophenyl Phosphate Chemical compound OP(O)(=O)OC1=CC=C([N+]([O-])=O)C=C1 XZKIHKMTEMTJQX-UHFFFAOYSA-N 0.000 description 8
- HAVKMRGWNXMCDR-STQMWFEESA-N Arg-Gly-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HAVKMRGWNXMCDR-STQMWFEESA-N 0.000 description 8
- XUGATJVGQUGQKY-ULQDDVLXSA-N Arg-Lys-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XUGATJVGQUGQKY-ULQDDVLXSA-N 0.000 description 8
- HQZGVYJBRSISDT-BQBZGAKWSA-N Cys-Gly-Arg Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQZGVYJBRSISDT-BQBZGAKWSA-N 0.000 description 8
- 238000002965 ELISA Methods 0.000 description 8
- ALUBSZXSNSPDQV-WDSKDSINSA-N Gln-Cys-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O ALUBSZXSNSPDQV-WDSKDSINSA-N 0.000 description 8
- VNCLJDOTEPPBBD-GUBZILKMSA-N Gln-Cys-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)N)N VNCLJDOTEPPBBD-GUBZILKMSA-N 0.000 description 8
- GGAPHLIUUTVYMX-QWRGUYRKSA-N Gly-Phe-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)C[NH3+])CC1=CC=CC=C1 GGAPHLIUUTVYMX-QWRGUYRKSA-N 0.000 description 8
- RNMNYMDTESKEAJ-KKUMJFAQSA-N His-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 RNMNYMDTESKEAJ-KKUMJFAQSA-N 0.000 description 8
- 206010021143 Hypoxia Diseases 0.000 description 8
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 8
- XWBJLKDCHJVKAK-KKUMJFAQSA-N Phe-Arg-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N XWBJLKDCHJVKAK-KKUMJFAQSA-N 0.000 description 8
- MVIJMIZJPHQGEN-IHRRRGAJSA-N Phe-Ser-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@H](CO)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 MVIJMIZJPHQGEN-IHRRRGAJSA-N 0.000 description 8
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 8
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 8
- JJNXZIPLIXIGBX-HJPIBITLSA-N Tyr-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N JJNXZIPLIXIGBX-HJPIBITLSA-N 0.000 description 8
- 230000004663 cell proliferation Effects 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 8
- 239000002299 complementary DNA Substances 0.000 description 8
- 239000012634 fragment Substances 0.000 description 8
- 238000013467 fragmentation Methods 0.000 description 8
- 238000006062 fragmentation reaction Methods 0.000 description 8
- 230000004927 fusion Effects 0.000 description 8
- 230000012010 growth Effects 0.000 description 8
- 238000002347 injection Methods 0.000 description 8
- 239000007924 injection Substances 0.000 description 8
- 239000002502 liposome Substances 0.000 description 8
- 230000009467 reduction Effects 0.000 description 8
- GMRGSBAMMMVDGG-GUBZILKMSA-N Asn-Arg-Arg Chemical compound C(C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N GMRGSBAMMMVDGG-GUBZILKMSA-N 0.000 description 7
- LXTGAOAXPSJWOU-DCAQKATOSA-N Asn-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N LXTGAOAXPSJWOU-DCAQKATOSA-N 0.000 description 7
- 241000894006 Bacteria Species 0.000 description 7
- POSRGGKLRWCUBE-CIUDSAMLSA-N Cys-Met-Glu Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N POSRGGKLRWCUBE-CIUDSAMLSA-N 0.000 description 7
- LURQDGKYBFWWJA-MNXVOIDGSA-N Gln-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N LURQDGKYBFWWJA-MNXVOIDGSA-N 0.000 description 7
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 7
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 7
- RLZDUFRBMQNYIJ-YUMQZZPRSA-N Lys-Cys-Gly Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N RLZDUFRBMQNYIJ-YUMQZZPRSA-N 0.000 description 7
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 7
- 229960003722 doxycycline Drugs 0.000 description 7
- XQTWDDCIUJNLTR-CVHRZJFOSA-N doxycycline monohydrate Chemical compound O.O=C1C2=C(O)C=CC=C2[C@H](C)[C@@H]2C1=C(O)[C@]1(O)C(=O)C(C(N)=O)=C(O)[C@@H](N(C)C)[C@@H]1[C@H]2O XQTWDDCIUJNLTR-CVHRZJFOSA-N 0.000 description 7
- 210000002889 endothelial cell Anatomy 0.000 description 7
- 210000003725 endotheliocyte Anatomy 0.000 description 7
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 7
- 108010036413 histidylglycine Proteins 0.000 description 7
- 239000005556 hormone Substances 0.000 description 7
- 229940088597 hormone Drugs 0.000 description 7
- 239000000463 material Substances 0.000 description 7
- 238000002360 preparation method Methods 0.000 description 7
- 239000000243 solution Substances 0.000 description 7
- 238000002054 transplantation Methods 0.000 description 7
- 206010002660 Anoxia Diseases 0.000 description 6
- 241000976983 Anoxia Species 0.000 description 6
- PYDIIVKGTBRIEL-SZMVWBNQSA-N Arg-Trp-Pro Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(O)=O PYDIIVKGTBRIEL-SZMVWBNQSA-N 0.000 description 6
- DTMLKCYOQKZXKZ-HJGDQZAQSA-N Gln-Arg-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DTMLKCYOQKZXKZ-HJGDQZAQSA-N 0.000 description 6
- 102000005720 Glutathione transferase Human genes 0.000 description 6
- 108010070675 Glutathione transferase Proteins 0.000 description 6
- DTPOVRRYXPJJAZ-FJXKBIBVSA-N Gly-Arg-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N DTPOVRRYXPJJAZ-FJXKBIBVSA-N 0.000 description 6
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 6
- 102100031181 Glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 6
- 108090000723 Insulin-Like Growth Factor I Proteins 0.000 description 6
- GUYHHBZCBQZLFW-GUBZILKMSA-N Lys-Gln-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N GUYHHBZCBQZLFW-GUBZILKMSA-N 0.000 description 6
- 241000124008 Mammalia Species 0.000 description 6
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 6
- MLKVIVZCFYRTIR-KKUMJFAQSA-N Pro-Phe-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLKVIVZCFYRTIR-KKUMJFAQSA-N 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- 102000013275 Somatomedins Human genes 0.000 description 6
- QFHRUCJIRVILCK-YJRXYDGGSA-N Tyr-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O QFHRUCJIRVILCK-YJRXYDGGSA-N 0.000 description 6
- BQASAMYRHNCKQE-IHRRRGAJSA-N Tyr-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N BQASAMYRHNCKQE-IHRRRGAJSA-N 0.000 description 6
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 6
- 230000007953 anoxia Effects 0.000 description 6
- 230000001580 bacterial effect Effects 0.000 description 6
- 230000035584 blastogenesis Effects 0.000 description 6
- 239000003153 chemical reaction reagent Substances 0.000 description 6
- 108010060199 cysteinylproline Proteins 0.000 description 6
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 6
- 230000012447 hatching Effects 0.000 description 6
- 238000001802 infusion Methods 0.000 description 6
- 230000005764 inhibitory process Effects 0.000 description 6
- 230000003834 intracellular effect Effects 0.000 description 6
- 239000007788 liquid Substances 0.000 description 6
- 210000004072 lung Anatomy 0.000 description 6
- 210000001161 mammalian embryo Anatomy 0.000 description 6
- 230000002829 reductive effect Effects 0.000 description 6
- 210000000130 stem cell Anatomy 0.000 description 6
- 238000003860 storage Methods 0.000 description 6
- 229940121393 vascular endothelial growth factor (vegf) promotor Drugs 0.000 description 6
- NPAVRDPEFVKELR-DCAQKATOSA-N Arg-Lys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NPAVRDPEFVKELR-DCAQKATOSA-N 0.000 description 5
- 239000004475 Arginine Substances 0.000 description 5
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 5
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 5
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 5
- 208000005623 Carcinogenesis Diseases 0.000 description 5
- ZVNFONSZVUBRAV-CIUDSAMLSA-N Cys-Gln-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CS)N)CN=C(N)N ZVNFONSZVUBRAV-CIUDSAMLSA-N 0.000 description 5
- GDNWBSFSHJVXKL-GUBZILKMSA-N Cys-Lys-Gln Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O GDNWBSFSHJVXKL-GUBZILKMSA-N 0.000 description 5
- MXZYQNJCBVJHSR-KATARQTJSA-N Cys-Lys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N)O MXZYQNJCBVJHSR-KATARQTJSA-N 0.000 description 5
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 5
- JILRMFFFCHUUTJ-ACZMJKKPSA-N Gln-Ser-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O JILRMFFFCHUUTJ-ACZMJKKPSA-N 0.000 description 5
- CAQXJMUDOLSBPF-SUSMZKCASA-N Glu-Thr-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAQXJMUDOLSBPF-SUSMZKCASA-N 0.000 description 5
- VUUOMYFPWDYETE-WDSKDSINSA-N Gly-Gln-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN VUUOMYFPWDYETE-WDSKDSINSA-N 0.000 description 5
- MHZXESQPPXOING-KBPBESRZSA-N Gly-Lys-Phe Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MHZXESQPPXOING-KBPBESRZSA-N 0.000 description 5
- 101710154606 Hemagglutinin Proteins 0.000 description 5
- FCPSGEVYIVXPPO-QTKMDUPCSA-N His-Thr-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FCPSGEVYIVXPPO-QTKMDUPCSA-N 0.000 description 5
- SJIGTGZVQGLMGG-NAKRPEOUSA-N Ile-Cys-Arg Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)O SJIGTGZVQGLMGG-NAKRPEOUSA-N 0.000 description 5
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 5
- OVZLLFONXILPDZ-VOAKCMCISA-N Leu-Lys-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OVZLLFONXILPDZ-VOAKCMCISA-N 0.000 description 5
- BRSGXFITDXFMFF-IHRRRGAJSA-N Lys-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N BRSGXFITDXFMFF-IHRRRGAJSA-N 0.000 description 5
- YWJQHDDBFAXNIR-MXAVVETBSA-N Lys-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCCN)N YWJQHDDBFAXNIR-MXAVVETBSA-N 0.000 description 5
- YDDDRTIPNTWGIG-SRVKXCTJSA-N Lys-Lys-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O YDDDRTIPNTWGIG-SRVKXCTJSA-N 0.000 description 5
- TVOOGUNBIWAURO-KATARQTJSA-N Lys-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N)O TVOOGUNBIWAURO-KATARQTJSA-N 0.000 description 5
- 206010027476 Metastases Diseases 0.000 description 5
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 5
- XDMMOISUAHXXFD-SRVKXCTJSA-N Phe-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O XDMMOISUAHXXFD-SRVKXCTJSA-N 0.000 description 5
- QKWYXRPICJEQAJ-KJEVXHAQSA-N Pro-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@@H]2CCCN2)O QKWYXRPICJEQAJ-KJEVXHAQSA-N 0.000 description 5
- 101710176177 Protein A56 Proteins 0.000 description 5
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 5
- IEWKKXZRJLTIOV-AVGNSLFASA-N Tyr-Ser-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O IEWKKXZRJLTIOV-AVGNSLFASA-N 0.000 description 5
- KRAHMIJVUPUOTQ-DCAQKATOSA-N Val-Ser-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KRAHMIJVUPUOTQ-DCAQKATOSA-N 0.000 description 5
- 230000003321 amplification Effects 0.000 description 5
- 238000003556 assay Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 229940098773 bovine serum albumin Drugs 0.000 description 5
- 230000036952 cancer formation Effects 0.000 description 5
- 231100000504 carcinogenesis Toxicity 0.000 description 5
- 238000005336 cracking Methods 0.000 description 5
- 239000012228 culture supernatant Substances 0.000 description 5
- 210000004748 cultured cell Anatomy 0.000 description 5
- 238000012258 culturing Methods 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 230000029087 digestion Effects 0.000 description 5
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 5
- 229940079593 drug Drugs 0.000 description 5
- 239000013613 expression plasmid Substances 0.000 description 5
- 239000013604 expression vector Substances 0.000 description 5
- 239000000185 hemagglutinin Substances 0.000 description 5
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 5
- 239000007943 implant Substances 0.000 description 5
- 230000008676 import Effects 0.000 description 5
- 238000000338 in vitro Methods 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 210000000936 intestine Anatomy 0.000 description 5
- 108010027338 isoleucylcysteine Proteins 0.000 description 5
- 230000000670 limiting effect Effects 0.000 description 5
- 108010054155 lysyllysine Proteins 0.000 description 5
- 108010038320 lysylphenylalanine Proteins 0.000 description 5
- 230000009401 metastasis Effects 0.000 description 5
- 208000011645 metastatic carcinoma Diseases 0.000 description 5
- 206010061289 metastatic neoplasm Diseases 0.000 description 5
- 238000002493 microarray Methods 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- 210000002307 prostate Anatomy 0.000 description 5
- 238000010839 reverse transcription Methods 0.000 description 5
- 238000010008 shearing Methods 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 239000000758 substrate Substances 0.000 description 5
- 210000005239 tubule Anatomy 0.000 description 5
- CNKBMTKICGGSCQ-ACRUOGEOSA-N (2S)-2-[[(2S)-2-[[(2S)-2,6-diamino-1-oxohexyl]amino]-1-oxo-3-phenylpropyl]amino]-3-(4-hydroxyphenyl)propanoic acid Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 CNKBMTKICGGSCQ-ACRUOGEOSA-N 0.000 description 4
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 4
- GDVDRMUYICMNFJ-CIUDSAMLSA-N Arg-Cys-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O GDVDRMUYICMNFJ-CIUDSAMLSA-N 0.000 description 4
- DQBFZVFOKCEJMC-SRVKXCTJSA-N Arg-Lys-Cys-Gly Chemical compound OC(=O)CNC(=O)[C@H](CS)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N DQBFZVFOKCEJMC-SRVKXCTJSA-N 0.000 description 4
- XZFONYMRYTVLPL-NHCYSSNCSA-N Asn-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N XZFONYMRYTVLPL-NHCYSSNCSA-N 0.000 description 4
- PDECQIHABNQRHN-GUBZILKMSA-N Asp-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(O)=O PDECQIHABNQRHN-GUBZILKMSA-N 0.000 description 4
- CMCIMCAQIULNDJ-CIUDSAMLSA-N Asp-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N CMCIMCAQIULNDJ-CIUDSAMLSA-N 0.000 description 4
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 4
- 206010009900 Colitis ulcerative Diseases 0.000 description 4
- UDPSLLFHOLGXBY-FXQIFTODSA-N Cys-Glu-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDPSLLFHOLGXBY-FXQIFTODSA-N 0.000 description 4
- 102000016911 Deoxyribonucleases Human genes 0.000 description 4
- 108010053770 Deoxyribonucleases Proteins 0.000 description 4
- 108010001515 Galectin 4 Proteins 0.000 description 4
- 102100039556 Galectin-4 Human genes 0.000 description 4
- JFOKLAPFYCTNHW-SRVKXCTJSA-N Gln-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N JFOKLAPFYCTNHW-SRVKXCTJSA-N 0.000 description 4
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 4
- OHWJUIXZHVIXJJ-GUBZILKMSA-N Glu-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N OHWJUIXZHVIXJJ-GUBZILKMSA-N 0.000 description 4
- VNBNZUAPOYGRDB-ZDLURKLDSA-N Gly-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)CN)O VNBNZUAPOYGRDB-ZDLURKLDSA-N 0.000 description 4
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- HUWYGQOISIJNMK-SIGLWIIPSA-N Ile-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HUWYGQOISIJNMK-SIGLWIIPSA-N 0.000 description 4
- 208000022559 Inflammatory bowel disease Diseases 0.000 description 4
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 4
- 241000880493 Leptailurus serval Species 0.000 description 4
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 4
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 4
- 238000012408 PCR amplification Methods 0.000 description 4
- MRNRMSDVVSKPGM-AVGNSLFASA-N Phe-Asn-Gln Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MRNRMSDVVSKPGM-AVGNSLFASA-N 0.000 description 4
- MMYUOSCXBJFUNV-QWRGUYRKSA-N Phe-Gly-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N MMYUOSCXBJFUNV-QWRGUYRKSA-N 0.000 description 4
- WEDZFLRYSIDIRX-IHRRRGAJSA-N Phe-Ser-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 WEDZFLRYSIDIRX-IHRRRGAJSA-N 0.000 description 4
- HBXAOEBRGLCLIW-AVGNSLFASA-N Phe-Ser-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HBXAOEBRGLCLIW-AVGNSLFASA-N 0.000 description 4
- ZYJMLBCDFPIGNL-JYJNAYRXSA-N Pro-Tyr-Arg Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)[C@@H]1CCCN1)C(O)=O ZYJMLBCDFPIGNL-JYJNAYRXSA-N 0.000 description 4
- FIDNSJUXESUDOV-JYJNAYRXSA-N Pro-Tyr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O FIDNSJUXESUDOV-JYJNAYRXSA-N 0.000 description 4
- 108010003201 RGH 0205 Proteins 0.000 description 4
- 108010052090 Renilla Luciferases Proteins 0.000 description 4
- 206010039491 Sarcoma Diseases 0.000 description 4
- 108091058545 Secretory proteins Proteins 0.000 description 4
- 102000040739 Secretory proteins Human genes 0.000 description 4
- HVKMTOIAYDOJPL-NRPADANISA-N Ser-Gln-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVKMTOIAYDOJPL-NRPADANISA-N 0.000 description 4
- 108091081024 Start codon Proteins 0.000 description 4
- MYNYCUXMIIWUNW-IEGACIPQSA-N Thr-Trp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MYNYCUXMIIWUNW-IEGACIPQSA-N 0.000 description 4
- GRSCONMARGNYHA-PMVMPFDFSA-N Trp-Lys-Phe Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GRSCONMARGNYHA-PMVMPFDFSA-N 0.000 description 4
- OJKVFAWXPGCJMF-BPUTZDHNSA-N Trp-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CNC3=CC=CC=C32)N)C(=O)N[C@@H](CO)C(=O)O OJKVFAWXPGCJMF-BPUTZDHNSA-N 0.000 description 4
- 201000006704 Ulcerative Colitis Diseases 0.000 description 4
- 125000000539 amino acid group Chemical group 0.000 description 4
- 238000013459 approach Methods 0.000 description 4
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 4
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 4
- 229960005261 aspartic acid Drugs 0.000 description 4
- 235000003704 aspartic acid Nutrition 0.000 description 4
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 239000002775 capsule Substances 0.000 description 4
- 239000003054 catalyst Substances 0.000 description 4
- 238000004113 cell culture Methods 0.000 description 4
- 239000011248 coating agent Substances 0.000 description 4
- 238000000576 coating method Methods 0.000 description 4
- 210000001072 colon Anatomy 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 210000004087 cornea Anatomy 0.000 description 4
- 239000006185 dispersion Substances 0.000 description 4
- 210000003527 eukaryotic cell Anatomy 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 4
- 210000004907 gland Anatomy 0.000 description 4
- 206010020718 hyperplasia Diseases 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 210000005075 mammary gland Anatomy 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 210000001672 ovary Anatomy 0.000 description 4
- 230000007170 pathology Effects 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 150000003384 small molecules Chemical class 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000003153 stable transfection Methods 0.000 description 4
- 208000024891 symptom Diseases 0.000 description 4
- 210000004881 tumor cell Anatomy 0.000 description 4
- 230000003612 virological effect Effects 0.000 description 4
- 238000005406 washing Methods 0.000 description 4
- MZOFCQQQCNRIBI-VMXHOPILSA-N (3s)-4-[[(2s)-1-[[(2s)-1-[[(1s)-1-carboxy-2-hydroxyethyl]amino]-4-methyl-1-oxopentan-2-yl]amino]-5-(diaminomethylideneamino)-1-oxopentan-2-yl]amino]-3-[[2-[[(2s)-2,6-diaminohexanoyl]amino]acetyl]amino]-4-oxobutanoic acid Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN MZOFCQQQCNRIBI-VMXHOPILSA-N 0.000 description 3
- NWXMGUDVXFXRIG-WESIUVDSSA-N (4s,4as,5as,6s,12ar)-4-(dimethylamino)-1,6,10,11,12a-pentahydroxy-6-methyl-3,12-dioxo-4,4a,5,5a-tetrahydrotetracene-2-carboxamide Chemical compound C1=CC=C2[C@](O)(C)[C@H]3C[C@H]4[C@H](N(C)C)C(=O)C(C(N)=O)=C(O)[C@@]4(O)C(=O)C3=C(O)C2=C1O NWXMGUDVXFXRIG-WESIUVDSSA-N 0.000 description 3
- OPIFSICVWOWJMJ-AEOCFKNESA-N 5-bromo-4-chloro-3-indolyl beta-D-galactoside Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1OC1=CNC2=CC=C(Br)C(Cl)=C12 OPIFSICVWOWJMJ-AEOCFKNESA-N 0.000 description 3
- DHBKYZYFEXXUAK-ONGXEEELSA-N Ala-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 DHBKYZYFEXXUAK-ONGXEEELSA-N 0.000 description 3
- BEXGZLUHRXTZCC-CIUDSAMLSA-N Arg-Gln-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)CN=C(N)N BEXGZLUHRXTZCC-CIUDSAMLSA-N 0.000 description 3
- YNQMEIJEWSHOEO-SRVKXCTJSA-N Asn-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O YNQMEIJEWSHOEO-SRVKXCTJSA-N 0.000 description 3
- FAEIQWHBRBWUBN-FXQIFTODSA-N Asp-Arg-Ser Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N FAEIQWHBRBWUBN-FXQIFTODSA-N 0.000 description 3
- QQXOYLWJQUPXJU-WHFBIAKZSA-N Asp-Cys-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O QQXOYLWJQUPXJU-WHFBIAKZSA-N 0.000 description 3
- 208000024172 Cardiovascular disease Diseases 0.000 description 3
- 108010035532 Collagen Proteins 0.000 description 3
- 102000008186 Collagen Human genes 0.000 description 3
- NLCZGISONIGRQP-DCAQKATOSA-N Cys-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N NLCZGISONIGRQP-DCAQKATOSA-N 0.000 description 3
- WXKWQSDHEXKKNC-ZKWXMUAHSA-N Cys-Asp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N WXKWQSDHEXKKNC-ZKWXMUAHSA-N 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- 238000000018 DNA microarray Methods 0.000 description 3
- 102000010834 Extracellular Matrix Proteins Human genes 0.000 description 3
- 108010037362 Extracellular Matrix Proteins Proteins 0.000 description 3
- RGRMOYQUIJVQQD-SRVKXCTJSA-N Gln-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)N)N RGRMOYQUIJVQQD-SRVKXCTJSA-N 0.000 description 3
- LYCDZGLXQBPNQU-WDSKDSINSA-N Glu-Gly-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O LYCDZGLXQBPNQU-WDSKDSINSA-N 0.000 description 3
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 3
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 3
- 108090000100 Hepatocyte Growth Factor Proteins 0.000 description 3
- 102000003745 Hepatocyte Growth Factor Human genes 0.000 description 3
- OHOXVDFVRDGFND-YUMQZZPRSA-N His-Cys-Gly Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CS)C(=O)NCC(O)=O OHOXVDFVRDGFND-YUMQZZPRSA-N 0.000 description 3
- 241000725303 Human immunodeficiency virus Species 0.000 description 3
- 206010020751 Hypersensitivity Diseases 0.000 description 3
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 3
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 3
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 3
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 3
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 3
- CTJUSALVKAWFFU-CIUDSAMLSA-N Lys-Ser-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N CTJUSALVKAWFFU-CIUDSAMLSA-N 0.000 description 3
- HONVOXINDBETTI-KKUMJFAQSA-N Lys-Tyr-Cys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CS)C(O)=O)CC1=CC=C(O)C=C1 HONVOXINDBETTI-KKUMJFAQSA-N 0.000 description 3
- 108091007494 Nucleic acid- binding domains Proteins 0.000 description 3
- 241001494479 Pecora Species 0.000 description 3
- 208000005764 Peripheral Arterial Disease Diseases 0.000 description 3
- 208000030831 Peripheral arterial occlusive disease Diseases 0.000 description 3
- YQNBKXUTWBRQCS-BVSLBCMMSA-N Phe-Arg-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 YQNBKXUTWBRQCS-BVSLBCMMSA-N 0.000 description 3
- TXKWKTWYTIAZSV-KKUMJFAQSA-N Phe-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N TXKWKTWYTIAZSV-KKUMJFAQSA-N 0.000 description 3
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 3
- BXHRXLMCYSZSIY-STECZYCISA-N Pro-Tyr-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](Cc1ccc(O)cc1)NC(=O)[C@@H]1CCCN1)C(O)=O BXHRXLMCYSZSIY-STECZYCISA-N 0.000 description 3
- 108700008625 Reporter Genes Proteins 0.000 description 3
- MQUZANJDFOQOBX-SRVKXCTJSA-N Ser-Phe-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O MQUZANJDFOQOBX-SRVKXCTJSA-N 0.000 description 3
- HHJFMHQYEAAOBM-ZLUOBGJFSA-N Ser-Ser-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O HHJFMHQYEAAOBM-ZLUOBGJFSA-N 0.000 description 3
- PYTKULIABVRXSC-BWBBJGPYSA-N Ser-Ser-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PYTKULIABVRXSC-BWBBJGPYSA-N 0.000 description 3
- JGUWRQWULDWNCM-FXQIFTODSA-N Ser-Val-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O JGUWRQWULDWNCM-FXQIFTODSA-N 0.000 description 3
- 108010090804 Streptavidin Proteins 0.000 description 3
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 3
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 3
- KWKJGBHDYJOVCR-SRVKXCTJSA-N Tyr-Ser-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)O KWKJGBHDYJOVCR-SRVKXCTJSA-N 0.000 description 3
- UUYCNAXCCDNULB-QXEWZRGKSA-N Val-Arg-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O UUYCNAXCCDNULB-QXEWZRGKSA-N 0.000 description 3
- 206010052428 Wound Diseases 0.000 description 3
- 208000027418 Wounds and injury Diseases 0.000 description 3
- 108091007916 Zinc finger transcription factors Proteins 0.000 description 3
- 102000038627 Zinc finger transcription factors Human genes 0.000 description 3
- 238000010521 absorption reaction Methods 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 239000000654 additive Substances 0.000 description 3
- 230000000996 additive effect Effects 0.000 description 3
- 238000010171 animal model Methods 0.000 description 3
- 239000000427 antigen Substances 0.000 description 3
- 108091007433 antigens Proteins 0.000 description 3
- 102000036639 antigens Human genes 0.000 description 3
- 238000003491 array Methods 0.000 description 3
- 125000003118 aryl group Chemical group 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 230000004071 biological effect Effects 0.000 description 3
- 229910052791 calcium Inorganic materials 0.000 description 3
- 239000011575 calcium Substances 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000010261 cell growth Effects 0.000 description 3
- 230000012292 cell migration Effects 0.000 description 3
- 230000001684 chronic effect Effects 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 208000029078 coronary artery disease Diseases 0.000 description 3
- 230000009849 deactivation Effects 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 210000002744 extracellular matrix Anatomy 0.000 description 3
- 239000012530 fluid Substances 0.000 description 3
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 3
- 229960002989 glutamic acid Drugs 0.000 description 3
- 208000024908 graft versus host disease Diseases 0.000 description 3
- 238000003384 imaging method Methods 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 230000002757 inflammatory effect Effects 0.000 description 3
- 239000003112 inhibitor Substances 0.000 description 3
- 230000000977 initiatory effect Effects 0.000 description 3
- 238000007918 intramuscular administration Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- 229930182817 methionine Natural products 0.000 description 3
- 231100000350 mutagenesis Toxicity 0.000 description 3
- 230000035772 mutation Effects 0.000 description 3
- 208000031225 myocardial ischemia Diseases 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 239000001103 potassium chloride Substances 0.000 description 3
- 235000011164 potassium chloride Nutrition 0.000 description 3
- 239000011347 resin Substances 0.000 description 3
- 229920005989 resin Polymers 0.000 description 3
- 238000003118 sandwich ELISA Methods 0.000 description 3
- 239000011780 sodium chloride Substances 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 239000003270 steroid hormone Substances 0.000 description 3
- 150000003431 steroids Chemical class 0.000 description 3
- 238000007920 subcutaneous administration Methods 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 239000003826 tablet Substances 0.000 description 3
- 108010084932 tryptophyl-proline Proteins 0.000 description 3
- 241000701161 unidentified adenovirus Species 0.000 description 3
- 241001430294 unidentified retrovirus Species 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- OGNSCSPNOLGXSM-UHFFFAOYSA-N (+/-)-DABA Natural products NCCC(N)C(O)=O OGNSCSPNOLGXSM-UHFFFAOYSA-N 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 2
- KILNVBDSWZSGLL-KXQOOQHDSA-N 1,2-dihexadecanoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCCCCCCCCCCCCCC KILNVBDSWZSGLL-KXQOOQHDSA-N 0.000 description 2
- 102100033639 Acetylcholinesterase Human genes 0.000 description 2
- 102000057234 Acyl transferases Human genes 0.000 description 2
- 108700016155 Acyl transferases Proteins 0.000 description 2
- 102000002260 Alkaline Phosphatase Human genes 0.000 description 2
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 2
- KLSJWNVTNUYHDU-UHFFFAOYSA-N Amitrole Chemical compound NC1=NC=NN1 KLSJWNVTNUYHDU-UHFFFAOYSA-N 0.000 description 2
- 108700031308 Antennapedia Homeodomain Proteins 0.000 description 2
- SQKPKIJVWHAWNF-DCAQKATOSA-N Arg-Asp-Lys Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(O)=O SQKPKIJVWHAWNF-DCAQKATOSA-N 0.000 description 2
- ZMUQQMGITUJQTI-CIUDSAMLSA-N Asn-Leu-Asn Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZMUQQMGITUJQTI-CIUDSAMLSA-N 0.000 description 2
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 2
- 108010041952 Calmodulin Proteins 0.000 description 2
- 201000009030 Carcinoma Diseases 0.000 description 2
- 108010031896 Cell Cycle Proteins Proteins 0.000 description 2
- 102000005483 Cell Cycle Proteins Human genes 0.000 description 2
- 108010001857 Cell Surface Receptors Proteins 0.000 description 2
- 102000000844 Cell Surface Receptors Human genes 0.000 description 2
- 108010077544 Chromatin Proteins 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 2
- 108091035707 Consensus sequence Proteins 0.000 description 2
- OXFOKRAFNYSREH-BJDJZHNGSA-N Cys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CS)N OXFOKRAFNYSREH-BJDJZHNGSA-N 0.000 description 2
- RJPKQCFHEPPTGL-ZLUOBGJFSA-N Cys-Ser-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RJPKQCFHEPPTGL-ZLUOBGJFSA-N 0.000 description 2
- 102000004127 Cytokines Human genes 0.000 description 2
- 108090000695 Cytokines Proteins 0.000 description 2
- 230000004544 DNA amplification Effects 0.000 description 2
- 230000033616 DNA repair Effects 0.000 description 2
- 101100372758 Danio rerio vegfaa gene Proteins 0.000 description 2
- 241000702421 Dependoparvovirus Species 0.000 description 2
- 102100021720 Early growth response protein 4 Human genes 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 108050006773 Fasciculation and elongation protein zeta 1 Proteins 0.000 description 2
- 102100037682 Fasciculation and elongation protein zeta-1 Human genes 0.000 description 2
- 108090000379 Fibroblast growth factor 2 Proteins 0.000 description 2
- 241000287828 Gallus gallus Species 0.000 description 2
- ZFADFBPRMSBPOT-KKUMJFAQSA-N Gln-Arg-Phe Chemical compound N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O ZFADFBPRMSBPOT-KKUMJFAQSA-N 0.000 description 2
- YLABFXCRQQMMHS-AVGNSLFASA-N Gln-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O YLABFXCRQQMMHS-AVGNSLFASA-N 0.000 description 2
- FITIQFSXXBKFFM-NRPADANISA-N Gln-Val-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FITIQFSXXBKFFM-NRPADANISA-N 0.000 description 2
- OBIHEDRRSMRKLU-ACZMJKKPSA-N Glu-Cys-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OBIHEDRRSMRKLU-ACZMJKKPSA-N 0.000 description 2
- LUJVWKKYHSLULQ-ZKWXMUAHSA-N Gly-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN LUJVWKKYHSLULQ-ZKWXMUAHSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- WZUVPPKBWHMQCE-UHFFFAOYSA-N Haematoxylin Chemical compound C12=CC(O)=C(O)C=C2CC2(O)C1C1=CC=C(O)C(O)=C1OC2 WZUVPPKBWHMQCE-UHFFFAOYSA-N 0.000 description 2
- PDSUIXMZYNURGI-AVGNSLFASA-N His-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CN=CN1 PDSUIXMZYNURGI-AVGNSLFASA-N 0.000 description 2
- NWGXCPUKPVISSJ-AVGNSLFASA-N His-Gln-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N NWGXCPUKPVISSJ-AVGNSLFASA-N 0.000 description 2
- GJMHMDKCJPQJOI-IHRRRGAJSA-N His-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 GJMHMDKCJPQJOI-IHRRRGAJSA-N 0.000 description 2
- LDFWDDVELNOGII-MXAVVETBSA-N His-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CN=CN1)N LDFWDDVELNOGII-MXAVVETBSA-N 0.000 description 2
- 108010033040 Histones Proteins 0.000 description 2
- 101000801359 Homo sapiens Acetylcholinesterase Proteins 0.000 description 2
- 101000896533 Homo sapiens Early growth response protein 4 Proteins 0.000 description 2
- 101000807541 Homo sapiens Ubiquitin carboxyl-terminal hydrolase 24 Proteins 0.000 description 2
- 101000723920 Homo sapiens Zinc finger protein 40 Proteins 0.000 description 2
- 108010070875 Human Immunodeficiency Virus tat Gene Products Proteins 0.000 description 2
- 108010003272 Hyaluronate lyase Proteins 0.000 description 2
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 2
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 2
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 2
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 2
- ZAENPHCEQXALHO-GUBZILKMSA-N Lys-Cys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZAENPHCEQXALHO-GUBZILKMSA-N 0.000 description 2
- LKDXINHHSWFFJC-SRVKXCTJSA-N Lys-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N LKDXINHHSWFFJC-SRVKXCTJSA-N 0.000 description 2
- 102000018697 Membrane Proteins Human genes 0.000 description 2
- 108010052285 Membrane Proteins Proteins 0.000 description 2
- HAQLBBVZAGMESV-IHRRRGAJSA-N Met-Lys-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O HAQLBBVZAGMESV-IHRRRGAJSA-N 0.000 description 2
- 241000713869 Moloney murine leukemia virus Species 0.000 description 2
- 101100444898 Mus musculus Egr1 gene Proteins 0.000 description 2
- XUYPXLNMDZIRQH-LURJTMIESA-N N-acetyl-L-methionine Chemical compound CSCC[C@@H](C(O)=O)NC(C)=O XUYPXLNMDZIRQH-LURJTMIESA-N 0.000 description 2
- 108700026244 Open Reading Frames Proteins 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- 102000035195 Peptidases Human genes 0.000 description 2
- VHWOBXIWBDWZHK-IHRRRGAJSA-N Phe-Arg-Asp Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 VHWOBXIWBDWZHK-IHRRRGAJSA-N 0.000 description 2
- APMXLWHMIVWLLR-BZSNNMDCSA-N Phe-Tyr-Ser Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(O)=O)C1=CC=CC=C1 APMXLWHMIVWLLR-BZSNNMDCSA-N 0.000 description 2
- 229920000954 Polyglycolide Polymers 0.000 description 2
- NGNNPLJHUFCOMZ-FXQIFTODSA-N Pro-Asp-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 NGNNPLJHUFCOMZ-FXQIFTODSA-N 0.000 description 2
- 101710149951 Protein Tat Proteins 0.000 description 2
- 108700005075 Regulator Genes Proteins 0.000 description 2
- 208000006265 Renal cell carcinoma Diseases 0.000 description 2
- 206010039361 Sacroiliitis Diseases 0.000 description 2
- DSSOYPJWSWFOLK-CIUDSAMLSA-N Ser-Cys-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O DSSOYPJWSWFOLK-CIUDSAMLSA-N 0.000 description 2
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 2
- JLPMFVAIQHCBDC-CIUDSAMLSA-N Ser-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N JLPMFVAIQHCBDC-CIUDSAMLSA-N 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 206010054184 Small intestine carcinoma Diseases 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-N Sulfuric acid Chemical compound OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 description 2
- 108700005078 Synthetic Genes Proteins 0.000 description 2
- FKIGTIXHSRNKJU-IXOXFDKPSA-N Thr-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CN=CN1 FKIGTIXHSRNKJU-IXOXFDKPSA-N 0.000 description 2
- CURFABYITJVKEW-QTKMDUPCSA-N Thr-Val-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O CURFABYITJVKEW-QTKMDUPCSA-N 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- 108010009583 Transforming Growth Factors Proteins 0.000 description 2
- 102000009618 Transforming Growth Factors Human genes 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- 239000006035 Tryptophane Substances 0.000 description 2
- SMLCYZYQFRTLCO-UWJYBYFXSA-N Tyr-Cys-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O SMLCYZYQFRTLCO-UWJYBYFXSA-N 0.000 description 2
- 101150094652 UME6 gene Proteins 0.000 description 2
- 102100037176 Ubiquitin carboxyl-terminal hydrolase 24 Human genes 0.000 description 2
- OPGWZDIYEYJVRX-AVGNSLFASA-N Val-His-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N OPGWZDIYEYJVRX-AVGNSLFASA-N 0.000 description 2
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 2
- 101150030763 Vegfa gene Proteins 0.000 description 2
- 102100028440 Zinc finger protein 40 Human genes 0.000 description 2
- 230000001154 acute effect Effects 0.000 description 2
- 230000001464 adherent effect Effects 0.000 description 2
- 210000001789 adipocyte Anatomy 0.000 description 2
- 238000001042 affinity chromatography Methods 0.000 description 2
- 108010044940 alanylglutamine Proteins 0.000 description 2
- 125000001931 aliphatic group Chemical group 0.000 description 2
- 239000003513 alkali Substances 0.000 description 2
- SHGAZHPCJJPHSC-YCNIQYBTSA-N all-trans-retinoic acid Chemical compound OC(=O)\C=C(/C)\C=C\C=C(/C)\C=C\C1=C(C)CCCC1(C)C SHGAZHPCJJPHSC-YCNIQYBTSA-N 0.000 description 2
- 239000002870 angiogenesis inducing agent Substances 0.000 description 2
- 108010092854 aspartyllysine Proteins 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 239000012148 binding buffer Substances 0.000 description 2
- 238000012742 biochemical analysis Methods 0.000 description 2
- 229920000249 biocompatible polymer Polymers 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 230000037396 body weight Effects 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 2
- 229910002091 carbon monoxide Inorganic materials 0.000 description 2
- 230000021164 cell adhesion Effects 0.000 description 2
- 210000003483 chromatin Anatomy 0.000 description 2
- 208000037976 chronic inflammation Diseases 0.000 description 2
- 230000006020 chronic inflammation Effects 0.000 description 2
- 239000000512 collagen gel Substances 0.000 description 2
- 230000002860 competitive effect Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 238000013016 damping Methods 0.000 description 2
- 230000002950 deficient Effects 0.000 description 2
- 239000003085 diluting agent Substances 0.000 description 2
- 239000002612 dispersion medium Substances 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 239000002552 dosage form Substances 0.000 description 2
- 239000000975 dye Substances 0.000 description 2
- 210000004696 endometrium Anatomy 0.000 description 2
- 230000010595 endothelial cell migration Effects 0.000 description 2
- 210000002615 epidermis Anatomy 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000008175 fetal development Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 239000007850 fluorescent dye Substances 0.000 description 2
- 108020001507 fusion proteins Proteins 0.000 description 2
- 102000037865 fusion proteins Human genes 0.000 description 2
- 229960003692 gamma aminobutyric acid Drugs 0.000 description 2
- 235000011187 glycerol Nutrition 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 2
- 239000000833 heterodimer Substances 0.000 description 2
- 230000007954 hypoxia Effects 0.000 description 2
- 230000036039 immunity Effects 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 230000008595 infiltration Effects 0.000 description 2
- 238000001764 infiltration Methods 0.000 description 2
- 239000003978 infusion fluid Substances 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000007912 intraperitoneal administration Methods 0.000 description 2
- 238000010253 intravenous injection Methods 0.000 description 2
- 150000002500 ions Chemical class 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- 229940043355 kinase inhibitor Drugs 0.000 description 2
- 210000000265 leukocyte Anatomy 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 210000005229 liver cell Anatomy 0.000 description 2
- 239000007937 lozenge Substances 0.000 description 2
- 210000002751 lymph Anatomy 0.000 description 2
- 108010082117 matrigel Proteins 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 229920000609 methyl cellulose Polymers 0.000 description 2
- 239000001923 methylcellulose Substances 0.000 description 2
- 230000000813 microbial effect Effects 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 230000002969 morbid Effects 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 210000003739 neck Anatomy 0.000 description 2
- 230000009826 neoplastic cell growth Effects 0.000 description 2
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 2
- 231100000956 nontoxicity Toxicity 0.000 description 2
- 238000007899 nucleic acid hybridization Methods 0.000 description 2
- 210000000496 pancreas Anatomy 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 230000000505 pernicious effect Effects 0.000 description 2
- 238000002823 phage display Methods 0.000 description 2
- 210000003800 pharynx Anatomy 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 239000003757 phosphotransferase inhibitor Substances 0.000 description 2
- 239000004633 polyglycolic acid Substances 0.000 description 2
- 230000035935 pregnancy Effects 0.000 description 2
- 230000003449 preventive effect Effects 0.000 description 2
- 230000002062 proliferating effect Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 239000011541 reaction mixture Substances 0.000 description 2
- 102000005962 receptors Human genes 0.000 description 2
- 108020003175 receptors Proteins 0.000 description 2
- 229930002330 retinoic acid Natural products 0.000 description 2
- 206010039073 rheumatoid arthritis Diseases 0.000 description 2
- 238000007789 sealing Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000013207 serial dilution Methods 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 210000002363 skeletal muscle cell Anatomy 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- ATHGHQPFGPMSJY-UHFFFAOYSA-N spermidine Chemical compound NCCCCNCCCN ATHGHQPFGPMSJY-UHFFFAOYSA-N 0.000 description 2
- PFNFFQXMRSDOHW-UHFFFAOYSA-N spermine Chemical compound NCCCNCCCCNCCCN PFNFFQXMRSDOHW-UHFFFAOYSA-N 0.000 description 2
- 238000005728 strengthening Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 210000001550 testis Anatomy 0.000 description 2
- CWERGRDVMFNCDR-UHFFFAOYSA-N thioglycolic acid Chemical class OC(=O)CS CWERGRDVMFNCDR-UHFFFAOYSA-N 0.000 description 2
- 230000000699 topical effect Effects 0.000 description 2
- 239000012096 transfection reagent Substances 0.000 description 2
- 230000009261 transgenic effect Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 229960004799 tryptophan Drugs 0.000 description 2
- 230000004614 tumor growth Effects 0.000 description 2
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 210000003606 umbilical vein Anatomy 0.000 description 2
- 230000003156 vasculitic effect Effects 0.000 description 2
- 239000003981 vehicle Substances 0.000 description 2
- 210000003462 vein Anatomy 0.000 description 2
- 230000029663 wound healing Effects 0.000 description 2
- 238000002424 x-ray crystallography Methods 0.000 description 2
- BQPPJGMMIYJVBR-UHFFFAOYSA-N (10S)-3c-Acetoxy-4.4.10r.13c.14t-pentamethyl-17c-((R)-1.5-dimethyl-hexen-(4)-yl)-(5tH)-Delta8-tetradecahydro-1H-cyclopenta[a]phenanthren Natural products CC12CCC(OC(C)=O)C(C)(C)C1CCC1=C2CCC2(C)C(C(CCC=C(C)C)C)CCC21C BQPPJGMMIYJVBR-UHFFFAOYSA-N 0.000 description 1
- QGVLYPPODPLXMB-UBTYZVCOSA-N (1aR,1bS,4aR,7aS,7bS,8R,9R,9aS)-4a,7b,9,9a-tetrahydroxy-3-(hydroxymethyl)-1,1,6,8-tetramethyl-1,1a,1b,4,4a,7a,7b,8,9,9a-decahydro-5H-cyclopropa[3,4]benzo[1,2-e]azulen-5-one Chemical compound C1=C(CO)C[C@]2(O)C(=O)C(C)=C[C@H]2[C@@]2(O)[C@H](C)[C@@H](O)[C@@]3(O)C(C)(C)[C@H]3[C@@H]21 QGVLYPPODPLXMB-UBTYZVCOSA-N 0.000 description 1
- WNBBONCQSHHDII-BHFSHLQUSA-N (2s)-2,4-diamino-4-oxobutanoic acid;(2s)-2,5-diamino-5-oxopentanoic acid Chemical compound OC(=O)[C@@H](N)CC(N)=O.OC(=O)[C@@H](N)CCC(N)=O WNBBONCQSHHDII-BHFSHLQUSA-N 0.000 description 1
- BEJKOYIMCGMNRB-GRHHLOCNSA-N (2s)-2-amino-3-(4-hydroxyphenyl)propanoic acid;(2s)-2-amino-3-phenylpropanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1.OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 BEJKOYIMCGMNRB-GRHHLOCNSA-N 0.000 description 1
- CHGIKSSZNBCNDW-UHFFFAOYSA-N (3beta,5alpha)-4,4-Dimethylcholesta-8,24-dien-3-ol Natural products CC12CCC(O)C(C)(C)C1CCC1=C2CCC2(C)C(C(CCC=C(C)C)C)CCC21 CHGIKSSZNBCNDW-UHFFFAOYSA-N 0.000 description 1
- XYTLYKGXLMKYMV-UHFFFAOYSA-N 14alpha-methylzymosterol Natural products CC12CCC(O)CC1CCC1=C2CCC2(C)C(C(CCC=C(C)C)C)CCC21C XYTLYKGXLMKYMV-UHFFFAOYSA-N 0.000 description 1
- QWENRTYMTSOGBR-UHFFFAOYSA-N 1H-1,2,3-Triazole Chemical compound C=1C=NNN=1 QWENRTYMTSOGBR-UHFFFAOYSA-N 0.000 description 1
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- FXYZDFSNBBOHTA-UHFFFAOYSA-N 2-[amino(morpholin-4-ium-4-ylidene)methyl]guanidine;chloride Chemical group Cl.NC(N)=NC(=N)N1CCOCC1 FXYZDFSNBBOHTA-UHFFFAOYSA-N 0.000 description 1
- FPTJELQXIUUCEY-UHFFFAOYSA-N 3beta-Hydroxy-lanostan Natural products C1CC2C(C)(C)C(O)CCC2(C)C2C1C1(C)CCC(C(C)CCCC(C)C)C1(C)CC2 FPTJELQXIUUCEY-UHFFFAOYSA-N 0.000 description 1
- 208000004998 Abdominal Pain Diseases 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 102000005606 Activins Human genes 0.000 description 1
- 108010059616 Activins Proteins 0.000 description 1
- 102000010651 Adaptor Protein Complex 1 Human genes 0.000 description 1
- 108010077847 Adaptor Protein Complex 1 Proteins 0.000 description 1
- 241000321096 Adenoides Species 0.000 description 1
- 101710105077 Agglutinin-1 Proteins 0.000 description 1
- CXQODNIBUNQWAS-CIUDSAMLSA-N Ala-Gln-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CXQODNIBUNQWAS-CIUDSAMLSA-N 0.000 description 1
- CYBJZLQSUJEMAS-LFSVMHDDSA-N Ala-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C)N)O CYBJZLQSUJEMAS-LFSVMHDDSA-N 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 108700028369 Alleles Proteins 0.000 description 1
- 101000587984 Arabidopsis thaliana Protein SPOROCYTELESS Proteins 0.000 description 1
- NABSCJGZKWSNHX-RCWTZXSCSA-N Arg-Arg-Thr Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NABSCJGZKWSNHX-RCWTZXSCSA-N 0.000 description 1
- MSILNNHVVMMTHZ-UWVGGRQHSA-N Arg-His-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CN=CN1 MSILNNHVVMMTHZ-UWVGGRQHSA-N 0.000 description 1
- ZJEDSBGPBXVBMP-PYJNHQTQSA-N Arg-His-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZJEDSBGPBXVBMP-PYJNHQTQSA-N 0.000 description 1
- GFMWTFHOZGLTLC-AVGNSLFASA-N Arg-His-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCSC)C(O)=O GFMWTFHOZGLTLC-AVGNSLFASA-N 0.000 description 1
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 1
- GSUFZRURORXYTM-STQMWFEESA-N Arg-Phe-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 GSUFZRURORXYTM-STQMWFEESA-N 0.000 description 1
- AOHKLEBWKMKITA-IHRRRGAJSA-N Arg-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AOHKLEBWKMKITA-IHRRRGAJSA-N 0.000 description 1
- 206010003210 Arteriosclerosis Diseases 0.000 description 1
- 206010003253 Arthritis enteropathic Diseases 0.000 description 1
- 206010003267 Arthritis reactive Diseases 0.000 description 1
- KUYKVGODHGHFDI-ACZMJKKPSA-N Asn-Gln-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O KUYKVGODHGHFDI-ACZMJKKPSA-N 0.000 description 1
- NLRJGXZWTKXRHP-DCAQKATOSA-N Asn-Leu-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLRJGXZWTKXRHP-DCAQKATOSA-N 0.000 description 1
- YXVAESUIQFDBHN-SRVKXCTJSA-N Asn-Phe-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O YXVAESUIQFDBHN-SRVKXCTJSA-N 0.000 description 1
- IJHUZMGJRGNXIW-CIUDSAMLSA-N Asp-Glu-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IJHUZMGJRGNXIW-CIUDSAMLSA-N 0.000 description 1
- LBFYTUPYYZENIR-GHCJXIJMSA-N Asp-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N LBFYTUPYYZENIR-GHCJXIJMSA-N 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 102100021631 B-cell lymphoma 6 protein Human genes 0.000 description 1
- 102100021264 Band 3 anion transport protein Human genes 0.000 description 1
- 102100029648 Beta-arrestin-2 Human genes 0.000 description 1
- 102100023995 Beta-nerve growth factor Human genes 0.000 description 1
- 102000013585 Bombesin Human genes 0.000 description 1
- 108010051479 Bombesin Proteins 0.000 description 1
- 208000010392 Bone Fractures Diseases 0.000 description 1
- BTBUEUYNUDRHOZ-UHFFFAOYSA-N Borate Chemical compound [O-]B([O-])[O-] BTBUEUYNUDRHOZ-UHFFFAOYSA-N 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 241001609030 Brosme brosme Species 0.000 description 1
- 102100031478 C-type natriuretic peptide Human genes 0.000 description 1
- 108010009575 CD55 Antigens Proteins 0.000 description 1
- 102000000905 Cadherin Human genes 0.000 description 1
- 108050007957 Cadherin Proteins 0.000 description 1
- 101100297347 Caenorhabditis elegans pgl-3 gene Proteins 0.000 description 1
- 102000055006 Calcitonin Human genes 0.000 description 1
- 108060001064 Calcitonin Proteins 0.000 description 1
- 108090000312 Calcium Channels Proteins 0.000 description 1
- 102000003922 Calcium Channels Human genes 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 102000000584 Calmodulin Human genes 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 102100033029 Carbonic anhydrase-related protein 11 Human genes 0.000 description 1
- 102000016289 Cell Adhesion Molecules Human genes 0.000 description 1
- 108010067225 Cell Adhesion Molecules Proteins 0.000 description 1
- 241001529572 Chaceon affinis Species 0.000 description 1
- 108010012236 Chemokines Proteins 0.000 description 1
- 102000019034 Chemokines Human genes 0.000 description 1
- 229920001661 Chitosan Polymers 0.000 description 1
- 102000002745 Choline Kinase Human genes 0.000 description 1
- 108010018888 Choline kinase Proteins 0.000 description 1
- 241000251730 Chondrichthyes Species 0.000 description 1
- 206010008909 Chronic Hepatitis Diseases 0.000 description 1
- 108090000317 Chymotrypsin Proteins 0.000 description 1
- 102100022641 Coagulation factor IX Human genes 0.000 description 1
- 208000002881 Colic Diseases 0.000 description 1
- 102000002734 Collagen Type VI Human genes 0.000 description 1
- 108010043741 Collagen Type VI Proteins 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 101710095468 Cyclase Proteins 0.000 description 1
- LHLSSZYQFUNWRZ-NAKRPEOUSA-N Cys-Arg-Ile Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LHLSSZYQFUNWRZ-NAKRPEOUSA-N 0.000 description 1
- MUZAUPFGPMMZSS-GUBZILKMSA-N Cys-Glu-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N MUZAUPFGPMMZSS-GUBZILKMSA-N 0.000 description 1
- VCIIDXDOPGHMDQ-WDSKDSINSA-N Cys-Gly-Gln Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VCIIDXDOPGHMDQ-WDSKDSINSA-N 0.000 description 1
- UPURLDIGQGTUPJ-ZKWXMUAHSA-N Cys-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N UPURLDIGQGTUPJ-ZKWXMUAHSA-N 0.000 description 1
- XSQAWJCVYDEWPT-GUBZILKMSA-N Cys-Met-Arg Chemical compound SC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XSQAWJCVYDEWPT-GUBZILKMSA-N 0.000 description 1
- KJJASVYBTKRYSN-FXQIFTODSA-N Cys-Pro-Asp Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CS)N)C(=O)N[C@@H](CC(=O)O)C(=O)O KJJASVYBTKRYSN-FXQIFTODSA-N 0.000 description 1
- SWJYSDXMTPMBHO-FXQIFTODSA-N Cys-Pro-Ser Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SWJYSDXMTPMBHO-FXQIFTODSA-N 0.000 description 1
- WZJLBUPPZRZNTO-CIUDSAMLSA-N Cys-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N WZJLBUPPZRZNTO-CIUDSAMLSA-N 0.000 description 1
- 108010015742 Cytochrome P-450 Enzyme System Proteins 0.000 description 1
- 102000003849 Cytochrome P450 Human genes 0.000 description 1
- XUIIKFGFIJCVMT-GFCCVEGCSA-N D-thyroxine Chemical compound IC1=CC(C[C@@H](N)C(O)=O)=CC(I)=C1OC1=CC(I)=C(O)C(I)=C1 XUIIKFGFIJCVMT-GFCCVEGCSA-N 0.000 description 1
- 102000004594 DNA Polymerase I Human genes 0.000 description 1
- 108010017826 DNA Polymerase I Proteins 0.000 description 1
- 230000007067 DNA methylation Effects 0.000 description 1
- 230000008836 DNA modification Effects 0.000 description 1
- 108010060616 DNA-3-methyladenine glycosidase II Proteins 0.000 description 1
- 102100039128 DNA-3-methyladenine glycosylase Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 206010012735 Diarrhoea Diseases 0.000 description 1
- 102100036238 Dihydropyrimidinase Human genes 0.000 description 1
- 102100023227 E3 SUMO-protein ligase EGR2 Human genes 0.000 description 1
- 108010051748 Early Growth Response Protein 2 Proteins 0.000 description 1
- 102100021717 Early growth response protein 3 Human genes 0.000 description 1
- 102000002322 Egg Proteins Human genes 0.000 description 1
- 108010000912 Egg Proteins Proteins 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 208000004232 Enteritis Diseases 0.000 description 1
- 108010055196 EphA2 Receptor Proteins 0.000 description 1
- 102100030340 Ephrin type-A receptor 2 Human genes 0.000 description 1
- 102100031983 Ephrin type-B receptor 4 Human genes 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 208000031637 Erythroblastic Acute Leukemia Diseases 0.000 description 1
- 208000036566 Erythroleukaemia Diseases 0.000 description 1
- 102000003951 Erythropoietin Human genes 0.000 description 1
- 108090000394 Erythropoietin Proteins 0.000 description 1
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 1
- 101150021185 FGF gene Proteins 0.000 description 1
- 108010076282 Factor IX Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 108090000386 Fibroblast Growth Factor 1 Proteins 0.000 description 1
- 102100031706 Fibroblast growth factor 1 Human genes 0.000 description 1
- 102000003974 Fibroblast growth factor 2 Human genes 0.000 description 1
- 102100024785 Fibroblast growth factor 2 Human genes 0.000 description 1
- 102100028072 Fibroblast growth factor 4 Human genes 0.000 description 1
- 102100027842 Fibroblast growth factor receptor 3 Human genes 0.000 description 1
- 101710182396 Fibroblast growth factor receptor 3 Proteins 0.000 description 1
- 102100037362 Fibronectin Human genes 0.000 description 1
- 108010067306 Fibronectins Proteins 0.000 description 1
- 206010017076 Fracture Diseases 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 108010001498 Galectin 1 Proteins 0.000 description 1
- 102000000795 Galectin 1 Human genes 0.000 description 1
- 101100058944 Gallus gallus CALM gene Proteins 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- TWIAMTNJOMRDAK-GUBZILKMSA-N Gln-Lys-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O TWIAMTNJOMRDAK-GUBZILKMSA-N 0.000 description 1
- VPKBCVUDBNINAH-GARJFASQSA-N Glu-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VPKBCVUDBNINAH-GARJFASQSA-N 0.000 description 1
- PKYAVRMYTBBRLS-FXQIFTODSA-N Glu-Cys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O PKYAVRMYTBBRLS-FXQIFTODSA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- BKLIAINBCQPSOV-UHFFFAOYSA-N Gluanol Natural products CC(C)CC=CC(C)C1CCC2(C)C3=C(CCC12C)C4(C)CCC(O)C(C)(C)C4CC3 BKLIAINBCQPSOV-UHFFFAOYSA-N 0.000 description 1
- 102000051325 Glucagon Human genes 0.000 description 1
- 108060003199 Glucagon Proteins 0.000 description 1
- UEGIPZAXNBYCCP-NKWVEPMBSA-N Gly-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)CN)C(=O)O UEGIPZAXNBYCCP-NKWVEPMBSA-N 0.000 description 1
- 102000010956 Glypican Human genes 0.000 description 1
- 108050001154 Glypican Proteins 0.000 description 1
- 108050007238 Glypican-1 Proteins 0.000 description 1
- 208000009329 Graft vs Host Disease Diseases 0.000 description 1
- 108010017080 Granulocyte Colony-Stimulating Factor Proteins 0.000 description 1
- 102000004269 Granulocyte Colony-Stimulating Factor Human genes 0.000 description 1
- 108010017213 Granulocyte-Macrophage Colony-Stimulating Factor Proteins 0.000 description 1
- 102100039620 Granulocyte-macrophage colony-stimulating factor Human genes 0.000 description 1
- 206010018691 Granuloma Diseases 0.000 description 1
- 108010009202 Growth Factor Receptors Proteins 0.000 description 1
- 102000009465 Growth Factor Receptors Human genes 0.000 description 1
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 1
- 101150009006 HIS3 gene Proteins 0.000 description 1
- 229940121710 HMGCoA reductase inhibitor Drugs 0.000 description 1
- 201000004331 Henoch-Schoenlein purpura Diseases 0.000 description 1
- 206010019617 Henoch-Schonlein purpura Diseases 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- 206010019755 Hepatitis chronic active Diseases 0.000 description 1
- BQYZXYCEKYJKAM-VGDYDELISA-N His-Cys-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BQYZXYCEKYJKAM-VGDYDELISA-N 0.000 description 1
- JJHWJUYYTWYXPL-PYJNHQTQSA-N His-Ile-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CN=CN1 JJHWJUYYTWYXPL-PYJNHQTQSA-N 0.000 description 1
- SKYULSWNBYAQMG-IHRRRGAJSA-N His-Leu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SKYULSWNBYAQMG-IHRRRGAJSA-N 0.000 description 1
- UMBKDWGQESDCTO-KKUMJFAQSA-N His-Lys-Lys Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O UMBKDWGQESDCTO-KKUMJFAQSA-N 0.000 description 1
- 101000971234 Homo sapiens B-cell lymphoma 6 protein Proteins 0.000 description 1
- 101000894913 Homo sapiens Band 3 anion transport protein Proteins 0.000 description 1
- 101000796277 Homo sapiens C-type natriuretic peptide Proteins 0.000 description 1
- 101000867841 Homo sapiens Carbonic anhydrase-related protein 11 Proteins 0.000 description 1
- 101001049692 Homo sapiens E3 SUMO-protein ligase EGR2 Proteins 0.000 description 1
- 101000896450 Homo sapiens Early growth response protein 3 Proteins 0.000 description 1
- 101001060274 Homo sapiens Fibroblast growth factor 4 Proteins 0.000 description 1
- 101000599951 Homo sapiens Insulin-like growth factor I Proteins 0.000 description 1
- 101000891579 Homo sapiens Microtubule-associated protein tau Proteins 0.000 description 1
- 101000928278 Homo sapiens Natriuretic peptides B Proteins 0.000 description 1
- 101000735539 Homo sapiens Pituitary adenylate cyclase-activating polypeptide Proteins 0.000 description 1
- 101500025027 Homo sapiens Platelet factor 4, short form Proteins 0.000 description 1
- 101000971468 Homo sapiens Protein kinase C zeta type Proteins 0.000 description 1
- 101000801481 Homo sapiens Tissue-type plasminogen activator Proteins 0.000 description 1
- 101000723923 Homo sapiens Transcription factor HIVEP2 Proteins 0.000 description 1
- 101001074042 Homo sapiens Transcriptional activator GLI3 Proteins 0.000 description 1
- 101000760180 Homo sapiens Zinc finger protein 43 Proteins 0.000 description 1
- 101000964736 Homo sapiens Zinc finger protein 7 Proteins 0.000 description 1
- 101000935569 Homo sapiens Zinc finger protein basonuclin-1 Proteins 0.000 description 1
- 102000002265 Human Growth Hormone Human genes 0.000 description 1
- 108010000521 Human Growth Hormone Proteins 0.000 description 1
- 239000000854 Human Growth Hormone Substances 0.000 description 1
- 108091006905 Human Serum Albumin Proteins 0.000 description 1
- 102000008100 Human Serum Albumin Human genes 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 1
- 206010062767 Hypophysitis Diseases 0.000 description 1
- 208000031814 IgA Vasculitis Diseases 0.000 description 1
- PFTFEWHJSAXGED-ZKWXMUAHSA-N Ile-Cys-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N PFTFEWHJSAXGED-ZKWXMUAHSA-N 0.000 description 1
- DBXXASNNDTXOLU-MXAVVETBSA-N Ile-Leu-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DBXXASNNDTXOLU-MXAVVETBSA-N 0.000 description 1
- 108060003951 Immunoglobulin Proteins 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 108090001117 Insulin-Like Growth Factor II Proteins 0.000 description 1
- 102100037852 Insulin-like growth factor I Human genes 0.000 description 1
- 102100025947 Insulin-like growth factor II Human genes 0.000 description 1
- 108010002352 Interleukin-1 Proteins 0.000 description 1
- 108010002350 Interleukin-2 Proteins 0.000 description 1
- 108010002386 Interleukin-3 Proteins 0.000 description 1
- 108090000978 Interleukin-4 Proteins 0.000 description 1
- 108090000769 Isomerases Proteins 0.000 description 1
- 102000004195 Isomerases Human genes 0.000 description 1
- 208000011200 Kawasaki disease Diseases 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 238000011050 LAL assay Methods 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- LOPKHWOTGJIQLC-UHFFFAOYSA-N Lanosterol Natural products CC(CCC=C(C)C)C1CCC2(C)C3=C(CCC12C)C4(C)CCC(C)(O)C(C)(C)C4CC3 LOPKHWOTGJIQLC-UHFFFAOYSA-N 0.000 description 1
- 108010059597 Lanosterol synthase Proteins 0.000 description 1
- 102100032011 Lanosterol synthase Human genes 0.000 description 1
- 108090001090 Lectins Proteins 0.000 description 1
- 102000004856 Lectins Human genes 0.000 description 1
- 241000270322 Lepidosauria Species 0.000 description 1
- QKIBIXAQKAFZGL-GUBZILKMSA-N Leu-Cys-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O QKIBIXAQKAFZGL-GUBZILKMSA-N 0.000 description 1
- OHZIZVWQXJPBJS-IXOXFDKPSA-N Leu-His-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OHZIZVWQXJPBJS-IXOXFDKPSA-N 0.000 description 1
- AIQWYVFNBNNOLU-RHYQMDGZSA-N Leu-Thr-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O AIQWYVFNBNNOLU-RHYQMDGZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 102000004083 Lymphotoxin-alpha Human genes 0.000 description 1
- 108090000542 Lymphotoxin-alpha Proteins 0.000 description 1
- CLBGMWIYPYAZPR-AVGNSLFASA-N Lys-Arg-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O CLBGMWIYPYAZPR-AVGNSLFASA-N 0.000 description 1
- IBQMEXQYZMVIFU-SRVKXCTJSA-N Lys-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N IBQMEXQYZMVIFU-SRVKXCTJSA-N 0.000 description 1
- MWVUEPNEPWMFBD-SRVKXCTJSA-N Lys-Cys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCCN MWVUEPNEPWMFBD-SRVKXCTJSA-N 0.000 description 1
- KSFQPRLZAUXXPT-GARJFASQSA-N Lys-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CCCCN)N)C(=O)O KSFQPRLZAUXXPT-GARJFASQSA-N 0.000 description 1
- SQXZLVXQXWILKW-KKUMJFAQSA-N Lys-Ser-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQXZLVXQXWILKW-KKUMJFAQSA-N 0.000 description 1
- YCJCEMKOZOYBEF-OEAJRASXSA-N Lys-Thr-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YCJCEMKOZOYBEF-OEAJRASXSA-N 0.000 description 1
- 102000001291 MAP Kinase Kinase Kinase Human genes 0.000 description 1
- 101710147301 MOG interacting and ectopic P-granules protein 1 Proteins 0.000 description 1
- 108010046938 Macrophage Colony-Stimulating Factor Proteins 0.000 description 1
- 102000007651 Macrophage Colony-Stimulating Factor Human genes 0.000 description 1
- 108060003100 Magainin Proteins 0.000 description 1
- 102000005741 Metalloproteases Human genes 0.000 description 1
- 108010006035 Metalloproteases Proteins 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 108030005453 Mitogen-activated protein kinase kinase kinases Proteins 0.000 description 1
- 108010085220 Multiprotein Complexes Proteins 0.000 description 1
- 102000007474 Multiprotein Complexes Human genes 0.000 description 1
- 101000795756 Mus musculus mRNA decay activator protein ZFP36 Proteins 0.000 description 1
- 241000238367 Mya arenaria Species 0.000 description 1
- 229910002651 NO3 Inorganic materials 0.000 description 1
- 102100036836 Natriuretic peptides B Human genes 0.000 description 1
- 102000003729 Neprilysin Human genes 0.000 description 1
- 108090000028 Neprilysin Proteins 0.000 description 1
- CAHGCLMLTWQZNJ-UHFFFAOYSA-N Nerifoliol Natural products CC12CCC(O)C(C)(C)C1CCC1=C2CCC2(C)C(C(CCC=C(C)C)C)CCC21C CAHGCLMLTWQZNJ-UHFFFAOYSA-N 0.000 description 1
- 108010025020 Nerve Growth Factor Proteins 0.000 description 1
- 208000012902 Nervous system disease Diseases 0.000 description 1
- NHNBFGGVMKEFGY-UHFFFAOYSA-N Nitrate Chemical compound [O-][N+]([O-])=O NHNBFGGVMKEFGY-UHFFFAOYSA-N 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 229930040373 Paraformaldehyde Natural products 0.000 description 1
- 102000003982 Parathyroid hormone Human genes 0.000 description 1
- 108090000445 Parathyroid hormone Proteins 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 102100027184 Periplakin Human genes 0.000 description 1
- 101710202907 Periplakin Proteins 0.000 description 1
- 241000009328 Perro Species 0.000 description 1
- RFEXGCASCQGGHZ-STQMWFEESA-N Phe-Gly-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O RFEXGCASCQGGHZ-STQMWFEESA-N 0.000 description 1
- BSTPNLNKHKBONJ-HTUGSXCWSA-N Phe-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O BSTPNLNKHKBONJ-HTUGSXCWSA-N 0.000 description 1
- 102000045595 Phosphoprotein Phosphatases Human genes 0.000 description 1
- 108700019535 Phosphoprotein Phosphatases Proteins 0.000 description 1
- 102000012288 Phosphopyruvate Hydratase Human genes 0.000 description 1
- 108010022181 Phosphopyruvate Hydratase Proteins 0.000 description 1
- 235000014676 Phragmites communis Nutrition 0.000 description 1
- 102100035733 Pituitary adenylate cyclase-activating polypeptide Human genes 0.000 description 1
- 102100024078 Plasma serine protease inhibitor Human genes 0.000 description 1
- 108010001014 Plasminogen Activators Proteins 0.000 description 1
- 102000001938 Plasminogen Activators Human genes 0.000 description 1
- 108010077971 Plasminogen Inactivators Proteins 0.000 description 1
- 102000010752 Plasminogen Inactivators Human genes 0.000 description 1
- 241000224016 Plasmodium Species 0.000 description 1
- 102400000423 Platelet factor 4, short form Human genes 0.000 description 1
- 102100030477 Plectin Human genes 0.000 description 1
- 108010054050 Plectin Proteins 0.000 description 1
- 229920002732 Polyanhydride Polymers 0.000 description 1
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 1
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 1
- 229920001710 Polyorthoester Polymers 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- ZUZINZIJHJFJRN-UBHSHLNASA-N Pro-Phe-Ala Chemical compound C([C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 ZUZINZIJHJFJRN-UBHSHLNASA-N 0.000 description 1
- FZXSYIPVAFVYBH-KKUMJFAQSA-N Pro-Tyr-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O FZXSYIPVAFVYBH-KKUMJFAQSA-N 0.000 description 1
- VEUACYMXJKXALX-IHRRRGAJSA-N Pro-Tyr-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VEUACYMXJKXALX-IHRRRGAJSA-N 0.000 description 1
- IMNVAOPEMFDAQD-NHCYSSNCSA-N Pro-Val-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IMNVAOPEMFDAQD-NHCYSSNCSA-N 0.000 description 1
- HCBIBCJNVBAKAB-UHFFFAOYSA-N Procaine hydrochloride Chemical compound Cl.CCN(CC)CCOC(=O)C1=CC=C(N)C=C1 HCBIBCJNVBAKAB-UHFFFAOYSA-N 0.000 description 1
- 108010076181 Proinsulin Proteins 0.000 description 1
- 206010060862 Prostate cancer Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 108010001953 Protein C Inhibitor Proteins 0.000 description 1
- 229940122929 Protein C inhibitor Drugs 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 102000055027 Protein Methyltransferases Human genes 0.000 description 1
- 108700040121 Protein Methyltransferases Proteins 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 102000002727 Protein Tyrosine Phosphatase Human genes 0.000 description 1
- 102100021538 Protein kinase C zeta type Human genes 0.000 description 1
- 108700020978 Proto-Oncogene Proteins 0.000 description 1
- 102000052575 Proto-Oncogene Human genes 0.000 description 1
- 201000001263 Psoriatic Arthritis Diseases 0.000 description 1
- 208000036824 Psoriatic arthropathy Diseases 0.000 description 1
- 108010032060 RNA polymerase alpha subunit Proteins 0.000 description 1
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 1
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 1
- 208000015634 Rectal Neoplasms Diseases 0.000 description 1
- 241000220010 Rhode Species 0.000 description 1
- 206010039710 Scleroderma Diseases 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 1
- CTRHXXXHUJTTRZ-ZLUOBGJFSA-N Ser-Asp-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O CTRHXXXHUJTTRZ-ZLUOBGJFSA-N 0.000 description 1
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 1
- KNCJWSPMTFFJII-ZLUOBGJFSA-N Ser-Cys-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O KNCJWSPMTFFJII-ZLUOBGJFSA-N 0.000 description 1
- JEHPKECJCALLRW-CUJWVEQBSA-N Ser-His-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEHPKECJCALLRW-CUJWVEQBSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 1
- 208000021386 Sjogren Syndrome Diseases 0.000 description 1
- 206010068771 Soft tissue neoplasm Diseases 0.000 description 1
- 108010030819 Sp2 Transcription Factor Proteins 0.000 description 1
- 108010023876 Sp3 Transcription Factor Proteins 0.000 description 1
- 108010012451 Sp4 Transcription Factor Proteins 0.000 description 1
- 108090000787 Subtilisin Proteins 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 108700026226 TATA Box Proteins 0.000 description 1
- 102000018679 Tacrolimus Binding Proteins Human genes 0.000 description 1
- 108010027179 Tacrolimus Binding Proteins Proteins 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- NSOXQYCFHDMMGV-UHFFFAOYSA-N Tetrakis(2-hydroxypropyl)ethylenediamine Chemical compound CC(O)CN(CC(C)O)CCN(CC(C)O)CC(C)O NSOXQYCFHDMMGV-UHFFFAOYSA-N 0.000 description 1
- 206010049808 Thanatophoric dwarfism Diseases 0.000 description 1
- LIXBDERDAGNVAV-XKBZYTNZSA-N Thr-Gln-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O LIXBDERDAGNVAV-XKBZYTNZSA-N 0.000 description 1
- VYEHBMMAJFVTOI-JHEQGTHGSA-N Thr-Gly-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VYEHBMMAJFVTOI-JHEQGTHGSA-N 0.000 description 1
- UUSQVWOVUYMLJA-PPCPHDFISA-N Thr-Lys-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UUSQVWOVUYMLJA-PPCPHDFISA-N 0.000 description 1
- 108010000499 Thromboplastin Proteins 0.000 description 1
- 102000036693 Thrombopoietin Human genes 0.000 description 1
- 108010041111 Thrombopoietin Proteins 0.000 description 1
- 108010046722 Thrombospondin 1 Proteins 0.000 description 1
- 102100036034 Thrombospondin-1 Human genes 0.000 description 1
- 102100030859 Tissue factor Human genes 0.000 description 1
- 102100028438 Transcription factor HIVEP2 Human genes 0.000 description 1
- 102100035559 Transcriptional activator GLI3 Human genes 0.000 description 1
- 102000004887 Transforming Growth Factor beta Human genes 0.000 description 1
- 108090001012 Transforming Growth Factor beta Proteins 0.000 description 1
- 102400001320 Transforming growth factor alpha Human genes 0.000 description 1
- 101800004564 Transforming growth factor alpha Proteins 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- 102000018594 Tumour necrosis factor Human genes 0.000 description 1
- 108050007852 Tumour necrosis factor Proteins 0.000 description 1
- QJBWZNTWJSZUOY-UWJYBYFXSA-N Tyr-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N QJBWZNTWJSZUOY-UWJYBYFXSA-N 0.000 description 1
- FQNUWOHNGJWNLM-QWRGUYRKSA-N Tyr-Cys-Gly Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)NCC(O)=O FQNUWOHNGJWNLM-QWRGUYRKSA-N 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 208000025865 Ulcer Diseases 0.000 description 1
- 108090000435 Urokinase-type plasminogen activator Proteins 0.000 description 1
- 102000003990 Urokinase-type plasminogen activator Human genes 0.000 description 1
- 206010046851 Uveitis Diseases 0.000 description 1
- BWVHQINTNLVWGZ-ZKWXMUAHSA-N Val-Cys-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N BWVHQINTNLVWGZ-ZKWXMUAHSA-N 0.000 description 1
- VVZDBPBZHLQPPB-XVKPBYJWSA-N Val-Glu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VVZDBPBZHLQPPB-XVKPBYJWSA-N 0.000 description 1
- 206010047115 Vasculitis Diseases 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 108010066342 Virus Receptors Proteins 0.000 description 1
- 102000018265 Virus Receptors Human genes 0.000 description 1
- 101001057161 Xenopus laevis MDS1 and EVI1 complex locus protein EVI1-A Proteins 0.000 description 1
- 108010016200 Zinc Finger Protein GLI1 Proteins 0.000 description 1
- 108010088665 Zinc Finger Protein Gli2 Proteins 0.000 description 1
- PTFCDOFLOPIGGS-UHFFFAOYSA-N Zinc dication Chemical compound [Zn+2] PTFCDOFLOPIGGS-UHFFFAOYSA-N 0.000 description 1
- 102100021112 Zinc finger protein 10 Human genes 0.000 description 1
- 101710160401 Zinc finger protein 10 Proteins 0.000 description 1
- 102100024666 Zinc finger protein 43 Human genes 0.000 description 1
- 102100040726 Zinc finger protein 7 Human genes 0.000 description 1
- 102100035535 Zinc finger protein GLI1 Human genes 0.000 description 1
- 102100035558 Zinc finger protein GLI2 Human genes 0.000 description 1
- 102100027904 Zinc finger protein basonuclin-1 Human genes 0.000 description 1
- 210000000683 abdominal cavity Anatomy 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 239000000488 activin Substances 0.000 description 1
- 208000021841 acute erythroid leukemia Diseases 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 210000002534 adenoid Anatomy 0.000 description 1
- 239000000853 adhesive Substances 0.000 description 1
- 230000001070 adhesive effect Effects 0.000 description 1
- 210000000577 adipose tissue Anatomy 0.000 description 1
- 108700023471 alginate-polylysine-alginate Proteins 0.000 description 1
- 150000001335 aliphatic alkanes Chemical group 0.000 description 1
- 229910052784 alkaline earth metal Inorganic materials 0.000 description 1
- 150000001342 alkaline earth metals Chemical class 0.000 description 1
- 150000001336 alkenes Chemical class 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- 230000007815 allergy Effects 0.000 description 1
- 238000011316 allogeneic transplantation Methods 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 230000002491 angiogenic effect Effects 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 230000000843 anti-fungal effect Effects 0.000 description 1
- 229940121375 antifungal agent Drugs 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 208000011775 arteriosclerosis disease Diseases 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 208000006673 asthma Diseases 0.000 description 1
- JXLHNMVSKXFWAO-UHFFFAOYSA-N azane;7-fluoro-2,1,3-benzoxadiazole-4-sulfonic acid Chemical compound N.OS(=O)(=O)C1=CC=C(F)C2=NON=C12 JXLHNMVSKXFWAO-UHFFFAOYSA-N 0.000 description 1
- 229910052788 barium Inorganic materials 0.000 description 1
- DSAJWYNOEDNPEQ-UHFFFAOYSA-N barium atom Chemical compound [Ba] DSAJWYNOEDNPEQ-UHFFFAOYSA-N 0.000 description 1
- WDIHJSXYQDMJHN-UHFFFAOYSA-L barium chloride Chemical compound [Cl-].[Cl-].[Ba+2] WDIHJSXYQDMJHN-UHFFFAOYSA-L 0.000 description 1
- 229910001626 barium chloride Inorganic materials 0.000 description 1
- 229940045511 barium chloride Drugs 0.000 description 1
- 210000000721 basilar membrane Anatomy 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 108010032967 beta-Arrestin 2 Proteins 0.000 description 1
- 229920001222 biopolymer Polymers 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 238000004820 blood count Methods 0.000 description 1
- 210000001218 blood-brain barrier Anatomy 0.000 description 1
- DNDCVAGJPBKION-DOPDSADYSA-N bombesin Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(N)=O)NC(=O)CNC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CC=1NC2=CC=CC=C2C=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H]1NC(=O)CC1)C(C)C)C1=CN=CN1 DNDCVAGJPBKION-DOPDSADYSA-N 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 238000010322 bone marrow transplantation Methods 0.000 description 1
- 210000004958 brain cell Anatomy 0.000 description 1
- 230000015916 branching morphogenesis of a tube Effects 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 244000309464 bull Species 0.000 description 1
- BQRGNLJZBFXNCZ-UHFFFAOYSA-N calcein am Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC(CN(CC(=O)OCOC(C)=O)CC(=O)OCOC(C)=O)=C(OC(C)=O)C=C1OC1=C2C=C(CN(CC(=O)OCOC(C)=O)CC(=O)OCOC(=O)C)C(OC(C)=O)=C1 BQRGNLJZBFXNCZ-UHFFFAOYSA-N 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 159000000007 calcium salts Chemical class 0.000 description 1
- 244000309466 calf Species 0.000 description 1
- 230000005907 cancer growth Effects 0.000 description 1
- 208000035269 cancer or benign tumor Diseases 0.000 description 1
- 210000001043 capillary endothelial cell Anatomy 0.000 description 1
- NSQLIUXCMFBZME-MPVJKSABSA-N carperitide Chemical compound C([C@H]1C(=O)NCC(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CSSC[C@@H](C(=O)N1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)=O)[C@@H](C)CC)C1=CC=CC=C1 NSQLIUXCMFBZME-MPVJKSABSA-N 0.000 description 1
- 229920006317 cationic polymer Polymers 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 238000001516 cell proliferation assay Methods 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 230000017455 cell-cell adhesion Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- VDANGULDQQJODZ-UHFFFAOYSA-N chloroprocaine Chemical compound CCN(CC)CCOC(=O)C1=CC=C(N)C=C1Cl VDANGULDQQJODZ-UHFFFAOYSA-N 0.000 description 1
- 229960002023 chloroprocaine Drugs 0.000 description 1
- OEYIOHPDSNJKLS-UHFFFAOYSA-N choline Chemical compound C[N+](C)(C)CCO OEYIOHPDSNJKLS-UHFFFAOYSA-N 0.000 description 1
- 229960001231 choline Drugs 0.000 description 1
- 229960002376 chymotrypsin Drugs 0.000 description 1
- 238000005253 cladding Methods 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 239000004927 clay Substances 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 230000015271 coagulation Effects 0.000 description 1
- 238000005345 coagulation Methods 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 238000011284 combination treatment Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 229940125782 compound 2 Drugs 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 239000013068 control sample Substances 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 210000004351 coronary vessel Anatomy 0.000 description 1
- 210000003618 cortical neuron Anatomy 0.000 description 1
- 238000009402 cross-breeding Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000001086 cytosolic effect Effects 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 239000003405 delayed action preparation Substances 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 206010012601 diabetes mellitus Diseases 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000037213 diet Effects 0.000 description 1
- ZBCBWPMODOFKDW-UHFFFAOYSA-N diethanolamine Chemical compound OCCNCCO ZBCBWPMODOFKDW-UHFFFAOYSA-N 0.000 description 1
- 229940043237 diethanolamine Drugs 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 208000024558 digestive system cancer Diseases 0.000 description 1
- QBSJHOGDIUQWTH-UHFFFAOYSA-N dihydrolanosterol Natural products CC(C)CCCC(C)C1CCC2(C)C3=C(CCC12C)C4(C)CCC(C)(O)C(C)(C)C4CC3 QBSJHOGDIUQWTH-UHFFFAOYSA-N 0.000 description 1
- 108091022884 dihydropyrimidinase Proteins 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 239000000539 dimer Substances 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 231100000673 dose–response relationship Toxicity 0.000 description 1
- 238000001647 drug administration Methods 0.000 description 1
- 239000003937 drug carrier Substances 0.000 description 1
- 238000012377 drug delivery Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000004043 dyeing Methods 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 210000002969 egg yolk Anatomy 0.000 description 1
- 238000007610 electrostatic coating method Methods 0.000 description 1
- 210000001671 embryonic stem cell Anatomy 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 230000002124 endocrine Effects 0.000 description 1
- 210000000750 endocrine system Anatomy 0.000 description 1
- 239000002158 endotoxin Substances 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 208000037902 enteropathy Diseases 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 238000001976 enzyme digestion Methods 0.000 description 1
- 108060002566 ephrin Proteins 0.000 description 1
- 102000012803 ephrin Human genes 0.000 description 1
- 210000000981 epithelium Anatomy 0.000 description 1
- 229940105423 erythropoietin Drugs 0.000 description 1
- 201000004101 esophageal cancer Diseases 0.000 description 1
- 230000001076 estrogenic effect Effects 0.000 description 1
- HDERJYVLTPVNRI-UHFFFAOYSA-N ethene;ethenyl acetate Chemical compound C=C.CC(=O)OC=C HDERJYVLTPVNRI-UHFFFAOYSA-N 0.000 description 1
- 230000005496 eutectics Effects 0.000 description 1
- 230000029142 excretion Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 229960004222 factor ix Drugs 0.000 description 1
- 230000001605 fetal effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 238000002875 fluorescence polarization Methods 0.000 description 1
- 230000003325 follicular Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 229930182830 galactose Natural products 0.000 description 1
- 150000008195 galaktosides Chemical class 0.000 description 1
- 201000010231 gastrointestinal system cancer Diseases 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000001879 gelation Methods 0.000 description 1
- 108091008053 gene clusters Proteins 0.000 description 1
- 238000003167 genetic complementation Methods 0.000 description 1
- 230000000762 glandular Effects 0.000 description 1
- MASNOZXLGMXCHN-ZLPAWPGGSA-N glucagon Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O)C(C)C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC=1NC=NC=1)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 MASNOZXLGMXCHN-ZLPAWPGGSA-N 0.000 description 1
- 229960004666 glucagon Drugs 0.000 description 1
- 239000003862 glucocorticoid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010085059 glutamyl-arginyl-proline Proteins 0.000 description 1
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 1
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 239000003102 growth factor Substances 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 208000035861 hematochezia Diseases 0.000 description 1
- 229960002897 heparin Drugs 0.000 description 1
- 229920000669 heparin Polymers 0.000 description 1
- 125000000487 histidyl group Chemical group [H]N([H])C(C(=O)O*)C([H])([H])C1=C([H])N([H])C([H])=N1 0.000 description 1
- 239000000710 homodimer Substances 0.000 description 1
- 108091008039 hormone receptors Proteins 0.000 description 1
- 230000005745 host immune response Effects 0.000 description 1
- 102000057308 human HGF Human genes 0.000 description 1
- 102000057063 human MAPT Human genes 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 235000003642 hunger Nutrition 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 150000002433 hydrophilic molecules Chemical class 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 125000001165 hydrophobic group Chemical group 0.000 description 1
- 230000003463 hyperproliferative effect Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 102000018358 immunoglobulin Human genes 0.000 description 1
- 208000015446 immunoglobulin a vasculitis Diseases 0.000 description 1
- 238000002513 implantation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 239000003701 inert diluent Substances 0.000 description 1
- 230000036512 infertility Effects 0.000 description 1
- 229940102223 injectable solution Drugs 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 229910052816 inorganic phosphate Inorganic materials 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 102000028416 insulin-like growth factor binding Human genes 0.000 description 1
- 108091022911 insulin-like growth factor binding Proteins 0.000 description 1
- 102000006495 integrins Human genes 0.000 description 1
- 108010044426 integrins Proteins 0.000 description 1
- 208000028774 intestinal disease Diseases 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 238000001361 intraarterial administration Methods 0.000 description 1
- ICIWUVCWSCSTAQ-UHFFFAOYSA-M iodate Chemical compound [O-]I(=O)=O ICIWUVCWSCSTAQ-UHFFFAOYSA-M 0.000 description 1
- 230000007794 irritation Effects 0.000 description 1
- 208000028867 ischemia Diseases 0.000 description 1
- 230000000302 ischemic effect Effects 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 239000007951 isotonicity adjuster Substances 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 229940058690 lanosterol Drugs 0.000 description 1
- CAHGCLMLTWQZNJ-RGEKOYMOSA-N lanosterol Chemical compound C([C@]12C)C[C@@H](O)C(C)(C)[C@H]1CCC1=C2CC[C@]2(C)[C@H]([C@H](CCC=C(C)C)C)CC[C@@]21C CAHGCLMLTWQZNJ-RGEKOYMOSA-N 0.000 description 1
- 238000002357 laparoscopic surgery Methods 0.000 description 1
- 239000002523 lectin Substances 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000007791 liquid phase Substances 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 210000003141 lower extremity Anatomy 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 159000000003 magnesium salts Chemical class 0.000 description 1
- 229940127554 medical product Drugs 0.000 description 1
- 229960003194 meglumine Drugs 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 210000004379 membrane Anatomy 0.000 description 1
- 230000006510 metastatic growth Effects 0.000 description 1
- 239000004530 micro-emulsion Substances 0.000 description 1
- 238000010208 microarray analysis Methods 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 210000004925 microvascular endothelial cell Anatomy 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 150000007522 mineralic acids Chemical class 0.000 description 1
- 238000000329 molecular dynamics simulation Methods 0.000 description 1
- 239000003068 molecular probe Substances 0.000 description 1
- 238000012900 molecular simulation Methods 0.000 description 1
- 208000001725 mucocutaneous lymph node syndrome Diseases 0.000 description 1
- 230000021332 multicellular organism growth Effects 0.000 description 1
- ACTNHJDHMQSOGL-UHFFFAOYSA-N n',n'-dibenzylethane-1,2-diamine Chemical compound C=1C=CC=CC=1CN(CCN)CC1=CC=CC=C1 ACTNHJDHMQSOGL-UHFFFAOYSA-N 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 230000035407 negative regulation of cell proliferation Effects 0.000 description 1
- 208000025189 neoplasm of testis Diseases 0.000 description 1
- 229940053128 nerve growth factor Drugs 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 239000002858 neurotransmitter agent Substances 0.000 description 1
- 210000004493 neutrocyte Anatomy 0.000 description 1
- 230000001254 nonsecretory effect Effects 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 238000010397 one-hybrid screening Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 229920000620 organic polymer Polymers 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 210000004681 ovum Anatomy 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 206010033675 panniculitis Diseases 0.000 description 1
- 229920002866 paraformaldehyde Polymers 0.000 description 1
- 239000000199 parathyroid hormone Substances 0.000 description 1
- 229960001319 parathyroid hormone Drugs 0.000 description 1
- 239000003182 parenteral nutrition solution Substances 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- MCYTYTUNNNZWOK-LCLOTLQISA-N penetratin Chemical compound C([C@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=CC=C1 MCYTYTUNNNZWOK-LCLOTLQISA-N 0.000 description 1
- 108010043655 penetratin Proteins 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 239000000813 peptide hormone Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- 210000004332 phalangeal cell Anatomy 0.000 description 1
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 description 1
- QGVLYPPODPLXMB-QXYKVGAMSA-N phorbol Natural products C[C@@H]1[C@@H](O)[C@]2(O)[C@H]([C@H]3C=C(CO)C[C@@]4(O)[C@H](C=C(C)C4=O)[C@@]13O)C2(C)C QGVLYPPODPLXMB-QXYKVGAMSA-N 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 150000003016 phosphoric acids Chemical class 0.000 description 1
- OJMIONKXNSYLSR-UHFFFAOYSA-N phosphorous acid Chemical compound OP(O)O OJMIONKXNSYLSR-UHFFFAOYSA-N 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 238000000206 photolithography Methods 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 239000006187 pill Substances 0.000 description 1
- 229940127126 plasminogen activator Drugs 0.000 description 1
- 239000002797 plasminogen activator inhibitor Substances 0.000 description 1
- 230000036178 pleiotropy Effects 0.000 description 1
- 229920000724 poly(L-arginine) polymer Polymers 0.000 description 1
- 229920000729 poly(L-lysine) polymer Polymers 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 108010011110 polyarginine Proteins 0.000 description 1
- 201000006292 polyarteritis nodosa Diseases 0.000 description 1
- 229920000515 polycarbonate Polymers 0.000 description 1
- 239000004417 polycarbonate Substances 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 210000004896 polypeptide structure Anatomy 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- OXCMYAYHXIHQOA-UHFFFAOYSA-N potassium;[2-butyl-5-chloro-3-[[4-[2-(1,2,4-triaza-3-azanidacyclopenta-1,4-dien-5-yl)phenyl]phenyl]methyl]imidazol-4-yl]methanol Chemical compound [K+].CCCCC1=NC(Cl)=C(CO)N1CC1=CC=C(C=2C(=CC=CC=2)C2=N[N-]N=N2)C=C1 OXCMYAYHXIHQOA-UHFFFAOYSA-N 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000069 prophylactic effect Effects 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 108020000494 protein-tyrosine phosphatase Proteins 0.000 description 1
- 230000001185 psoriatic effect Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 238000001959 radiotherapy Methods 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 208000002574 reactive arthritis Diseases 0.000 description 1
- 230000009257 reactivity Effects 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 238000010223 real-time analysis Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 206010038038 rectal cancer Diseases 0.000 description 1
- 210000000664 rectum Anatomy 0.000 description 1
- 201000001275 rectum cancer Diseases 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000009711 regulatory function Effects 0.000 description 1
- 238000009256 replacement therapy Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 201000007048 respiratory system cancer Diseases 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 208000007442 rickets Diseases 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 201000000306 sarcoidosis Diseases 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 239000012679 serum free medium Substances 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 210000002027 skeletal muscle Anatomy 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 210000004927 skin cell Anatomy 0.000 description 1
- 210000000813 small intestine Anatomy 0.000 description 1
- 239000000344 soap Substances 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 159000000000 sodium salts Chemical class 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 229940063673 spermidine Drugs 0.000 description 1
- 229940063675 spermine Drugs 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 206010041823 squamous cell carcinoma Diseases 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 230000037351 starvation Effects 0.000 description 1
- 238000011146 sterile filtration Methods 0.000 description 1
- 210000001562 sternum Anatomy 0.000 description 1
- 108020003113 steroid hormone receptors Proteins 0.000 description 1
- 102000005969 steroid hormone receptors Human genes 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Natural products CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 1
- 210000002330 subarachnoid space Anatomy 0.000 description 1
- 238000010254 subcutaneous injection Methods 0.000 description 1
- 239000007929 subcutaneous injection Substances 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
- 239000000829 suppository Substances 0.000 description 1
- 238000002198 surface plasmon resonance spectroscopy Methods 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 238000013268 sustained release Methods 0.000 description 1
- 239000012730 sustained-release form Substances 0.000 description 1
- 230000008961 swelling Effects 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 239000006188 syrup Substances 0.000 description 1
- 235000020357 syrup Nutrition 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- ZRKFYGHZFMAOKI-QMGMOQQFSA-N tgfbeta Chemical compound C([C@H](NC(=O)[C@H](C(C)C)NC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC(C)C)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCSC)C(C)C)[C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O)C1=CC=C(O)C=C1 ZRKFYGHZFMAOKI-QMGMOQQFSA-N 0.000 description 1
- 201000003896 thanatophoric dysplasia Diseases 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 230000004797 therapeutic response Effects 0.000 description 1
- CWERGRDVMFNCDR-UHFFFAOYSA-M thioglycolate(1-) Chemical compound [O-]C(=O)CS CWERGRDVMFNCDR-UHFFFAOYSA-M 0.000 description 1
- 210000001541 thymus gland Anatomy 0.000 description 1
- 230000001646 thyrotropic effect Effects 0.000 description 1
- 229940034208 thyroxine Drugs 0.000 description 1
- XUIIKFGFIJCVMT-UHFFFAOYSA-N thyroxine-binding globulin Natural products IC1=CC(CC([NH3+])C([O-])=O)=CC(I)=C1OC1=CC(I)=C(O)C(I)=C1 XUIIKFGFIJCVMT-UHFFFAOYSA-N 0.000 description 1
- 239000012745 toughening agent Substances 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 238000011820 transgenic animal model Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000003146 transient transfection Methods 0.000 description 1
- 108091008578 transmembrane receptors Proteins 0.000 description 1
- 102000027257 transmembrane receptors Human genes 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 230000010415 tropism Effects 0.000 description 1
- 108010079202 tyrosyl-alanyl-cysteine Proteins 0.000 description 1
- 231100000397 ulcer Toxicity 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- VBEQCZHXXJYVRD-GACYYNSASA-N uroanthelone Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(C)C)[C@@H](C)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C1=CC=C(O)C=C1 VBEQCZHXXJYVRD-GACYYNSASA-N 0.000 description 1
- 210000002229 urogenital system Anatomy 0.000 description 1
- 229960005356 urokinase Drugs 0.000 description 1
- 210000003741 urothelium Anatomy 0.000 description 1
- 238000001291 vacuum drying Methods 0.000 description 1
- 230000002792 vascular Effects 0.000 description 1
- 210000003556 vascular endothelial cell Anatomy 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 210000002845 virion Anatomy 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 150000003722 vitamin derivatives Chemical class 0.000 description 1
- 208000016261 weight loss Diseases 0.000 description 1
- 230000004580 weight loss Effects 0.000 description 1
- 238000009736 wetting Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/475—Growth factors; Growth regulators
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P1/00—Drugs for disorders of the alimentary tract or the digestive system
- A61P1/04—Drugs for disorders of the alimentary tract or the digestive system for ulcers, gastritis or reflux esophagitis, e.g. antacids, inhibitors of acid secretion, mucosal protectants
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P1/00—Drugs for disorders of the alimentary tract or the digestive system
- A61P1/16—Drugs for disorders of the alimentary tract or the digestive system for liver or gallbladder disorders, e.g. hepatoprotective agents, cholagogues, litholytics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P11/00—Drugs for disorders of the respiratory system
- A61P11/06—Antiasthmatics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P17/00—Drugs for dermatological disorders
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P17/00—Drugs for dermatological disorders
- A61P17/06—Antipsoriatics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P19/00—Drugs for skeletal disorders
- A61P19/02—Drugs for skeletal disorders for joint disorders, e.g. arthritis, arthrosis
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P27/00—Drugs for disorders of the senses
- A61P27/02—Ophthalmic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P29/00—Non-central analgesic, antipyretic or antiinflammatory agents, e.g. antirheumatic agents; Non-steroidal antiinflammatory drugs [NSAID]
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
- A61P35/04—Antineoplastic agents specific for metastasis
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/02—Immunomodulators
- A61P37/06—Immunosuppressants, e.g. drugs for graft rejection
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P37/00—Drugs for immunological or allergic disorders
- A61P37/08—Antiallergic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P43/00—Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P7/00—Drugs for disorders of the blood or the extracellular fluid
- A61P7/04—Antihaemorrhagics; Procoagulants; Haemostatic agents; Antifibrinolytic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P9/00—Drugs for disorders of the cardiovascular system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P9/00—Drugs for disorders of the cardiovascular system
- A61P9/10—Drugs for disorders of the cardiovascular system for treating ischaemic or atherosclerotic diseases, e.g. antianginal drugs, coronary vasodilators, drugs for myocardial infarction, retinopathy, cerebrovascula insufficiency, renal arteriosclerosis
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4702—Regulators; Modulating activity
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K19/00—Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
Abstract
本发明公开了一种能够调节内源性基因的嵌合型锌指蛋白。此类蛋白的实例包括能够调节VEGF-A表达的蛋白。所述蛋白及其编码核酸可用于调节血管发生。
Description
关申请的交叉引用
本申请要求申请日为2002年12月9日、申请号为No.60/431,892的美国专利申请的优先权,该申请的内容并入本文作为参考。
技术领域
本发明涉及DNA结合蛋白,例如转录因子。
背景技术
大多数基因在转录水平受到多肽转录因子的调节,转录因子特异性结合这些基因内部的DNA位点,典型地是启动子或增强子区域内的DNA位点。这些蛋白在启动子处激活或阻抑RNA聚合酶的转录起始作用,由此调节靶基因的表达。许多转录因子,无论是激活子还是阻抑子,都具有模块化结构。这些模块可折叠成具有不同结构的结构域,并具有特异性功能,例如DNA结合、二聚化或与转录结构相互作用。当效应结构域例如激活结构域或阻抑结构域被转移至异源性转录因子的DNA结合结构域时可保留其功能。Brent和Ptashne(1985)Cell 43:729-36;Dawson等(1995)Mol.Cell Biol.15:6923-31。已经通过NMR和X射线结晶学研究确定了许多DNA结合结构域的三维结构,包括锌指结构域、同源结构域和螺旋-转角-螺旋结构域。
锌指结构域是具有模块功能的一类结构域。锌指蛋白(ZFP)可用于调节转录。例如,Kim和Pabo证实,当Zif268蛋白结合于靶基因的转录起始位点附近时,Zif268蛋白有效地抑制了VP16激活的靶基因转录。Kim和Pabo(1997)J Biol Chem 272:29795-29800。Liu等描述了使用通过位点特异性诱变而构建的遗传工程化的锌指蛋白上调VEGF-A。Liu等(2001).J.Biol.Chem.276,11323-11334。
发明内容
在一方面,本发明公开了一种多肽,其包括DNA结合结构域并能在细胞中调节基因的表达,例如在真核细胞中。在一个实施方案中,所述多肽结合基因中的靶DNA位点。所述DNA结合结构域典型地包括至少三个锌指结构域。
在一个实施方案中,所述锌指结构域中的至少一个、两个或三个是天然存在的锌指结构域。例如,这些结构域可与各种天然存在的蛋白质中的锌指结构域相同,或与来自天然存在的蛋白质的非邻近锌指结构域相同。所有这些锌指结构域均可以是天然存在的。
在另一个实施方案中,所述锌指结构域中的至少一个、两个或三个是天然存在的锌指结构域的变体,例如具有一到四个氨基酸残基或二到五个氨基酸残基的差异的结构域。多肽可包括天然存在的锌指结构域与变体结构域的组合。
多肽可调节任何基因。调节可以是直接的,例如多肽与靶基因的靶位点相互作用。例如,惊异可以是细胞的内源性基因(例如存在于天然基因组中的基因)、异源性基因(例如转基因)或病毒基因。在一个实施方案中,所述内源性基因编码一种分泌多肽或编码一种参与或调节一种分泌因子(例如一种分泌多肽)的产生的多肽。在一个实施方案中,所述内源性基因调节细胞增殖、细胞迁移或组织形态发生(例如血管发生)。
在一个实施方案中,所述内源性基因编码一种多肽,其调节激素合成、一种激素或生长因子。典型的生长因子包括VEGF家族的生长因子。
VEGF-A是该家族的一个成员。在一个实施方案中,所述多肽识别VEGF-A基因的调节区域中的靶位点,例如位于VEGF-A基因的-950和+450之间的一个位点。例如,所述多肽可识别的位点位于人VEGF-A启动子的大约第-680、-677、-671、-668、-665、-633R、-632R、-631、-630、-606、-603、-554、-536、-495、-475、-468、-465、-462、-455、-395R、-394R、-393R、-392、-391R、-385R、-382R、-358R、-314R、-282、-206、-206、-203、-184、-181、-137、-124、-90R、-85、-30、77、244R、283R、342、357、366、434、435或474R位,或位于这些位点的60、50、20、10、5或3个核苷酸范围内。这些核苷酸位置代表启动子上链中从转录起始位点起最5′的核苷酸位点,但当出现字母R时,则那些位置的编号(以R标明)代表下(反向)链中最5′的核苷酸。例如,F435(-90R)靶序列是反向链的5′:-90至3′:-98(上链中从转录起始位点起5′:-98至3′:-90位置)。在一个实施方案中,所述多肽与具有在此描述的序列的多肽竞争结合VEGF-A基因的靶位点。
在一个实施方案中,所述靶位点是内源性基因的调节区域,其与DNase高敏位点重叠,或与内源性转录因子的结合位点重叠。在另一个实施方案中,所述靶位点位于该位点或区域的700、500、300、200、50、20、10、5或3个碱基对范围内。在一个实施方案中,所述多肽结合靶位点的解离常数不超过20、7、5、3、2、1、0.5或0.05nM。
在一个实施方案中,当所述多肽在细胞内时,其能够使内源性基因的转录改变(例如抑制或激活)至少1.25、1.5、1.7、1.9、2.0、2.5、5、10、20、50或100倍。所述多肽在生物体的细胞内可具有相似的效应。
在一个实施方案中,所述DNA结合结构域包括在表1、表2、表3、表4或表5的单排中列出的至少两个锌指结构域,或包括至少两个具有与表1、表2、表3、表4或表5的单排中列出的两个锌指结构域相同的DNA接触残基的锌指结构域。
所述多肽可进一步包括转录激活或阻抑结构域。所述多肽可进一步包括细胞转导结构域,例如HIV tat转导结构域。
在一个实施方案中,所述多肽在哺乳动物细胞中抑制由缺氧诱导的VEGF-A的产生。这种抑制可以例如使得VEGF-A水平降低至在不含该多肽但其他方面均相同的细胞中由缺氧诱导的该蛋白的水平的80%、70%、60%、50%、40%、30%、20%、10%、5%、3%、2%、1%或0.1%以下。
本发明还提供了一种核酸,其包括编码在此描述的多肽的序列,以及一种包括所述核酸的细胞(例如原核或真核细胞,例如哺乳动物细胞)。所述细胞可表达该核酸并产生所述多肽。在一个实施方案中,所述细胞在体外进行培养。所述细胞可以是免疫隔离的或包囊化的。本发明还提供了一种生物体,所述生物体包括一或多种这样的细胞,即所述细胞中产生所述多肽且内源性基因受到所述多肽的调节。
在另一方面,本发明公开了一种调节内源性基因的方法,该方法包括:提供一种细胞,其包括编码一种包括至少三个锌指结构域的人工多肽的编码核酸,其中所述多肽结合内源性基因中的靶DNA位点;并在所述人工多肽可产生、结合靶DNA位点并调节所述内源性基因的条件下,在所述细胞中表达该编码核酸。在一个实施方案中,所述锌指结构域的至少两个是天然存在的锌指结构域。例如,这两个锌指结构域可以与各种天然存在的蛋白质的锌指结构域相同,或者可以是来自同一天然存在的蛋白质的非邻近锌指结构域。在一个实施方案中,所述人工多肽包括转录激活或阻抑结构域。所述内源性基因可以被抑制或激活。在一个实施方案中,可通过将细胞与核酸输送工具相接触而提供所述细胞,所述核酸输送工具例如是脂质体、病毒或病毒颗粒。在一个实施方案中,所述细胞是生物体内的一种细胞,例如哺乳动物生物体的一种细胞。所述方法可进一步包括,在进行表达之前,将细胞导入对象生物体,或将细胞进行包囊化并将包囊化的细胞导入对象生物体。
典型的多肽可包括至少两个或更多的锌指结构域,例如下表中特定一排的两个、三个或四个锌指结构域:
表1:典型的VEGF-A结合蛋白(A)
名称 基序(第2栏) 特异结构域(第3栏)
F475 mQSHR-mRDHT-mRSNR QSHR2-RDHT-RSNR
F121 mQSHT-mRSHR-mRDHT QSHT-RSHR-RDHT
F435 mQSHR-mRDHT-mRSHR QSHR2-RDHT-RSHR
F547 mRSHR-mRDHT-mVSNV RSHR-RDHT-VSNV
F2825 mQSHV-mRDHR-mRDHT QSHV-RDHR1-RDHT
表2:典型的VEGF-A结合蛋白(B)
名称 基序(第2栏) 特异结构域(第3栏)
F480 mRSHR-mRDHT-mRSHR RSHR-RDHT-RSHR
F2828 mCSNR-mWSNR-mRDHR CSNR1-WSNR-RDHR1
F625 mCSNR-mWSNR-mRSHR CSNR1-WSNR-RSHR
F2830 mDSNR-mWSNR-mRDHR DSNRa-WSNR-RDHR1
F2838 mDSNR-mWSNR-mRSHR DSNRa-WSNR-RSHR
表3:典型的VEGF-A结合蛋白(C)
名称 基序(第2栏) 特异结构域(第3栏)
F109 mRDER-mQSSR-mQSHT-mRSNR RDER1-QSSR1-QSHT-RSNR
F2604 mDSAR-mRSNR-mRDHT-mVSSR DSAR2-RSNR-RDHT-VSSR
F2605 mQSHT-mDSAR-mRSNR-mRDHT QSHT-DSAR2-RSNR-RDHT
F2607 mRDHT-mVSNV-mQSHT-mDSAR RDHT-VSNV-QSHT-DSAR2
F2615 mRSHR-mDSCR-mQSHT-mDSCR RSHR-DSCR-QSHT-DSCR
F2633 mQSNR-mQSHR-mRDHT-mRSNR QSNR3-QSHR2-RDHT-RSNR
F2634 mCSNR-mRDHT-mRSNR-mRSHR CSNR1-RDHT-RSNR-RSHR
F2636 mRSHR-mQSHT-mRSHR-mRDER RSHR-QSHT-RSHR-RDER1
F2644 mQSNR-mRSHR-mQSSR-mRSHR QSNR3-RSHR-QSSR1-RSHR
F2646 mQSHT-mDSCR-mRDHT-mCSNR QSHT-DSCR-RDHT-CSNR1
F2650 mQSHT-mWSNR-mRSHR-mWSNR QSHT-WSNR-RSHR-WSNR
F2679 mVSNV-mRSHR-mRDER-mQSNV VSNV-RSHR-RDER1-QSNV2
表4:典型的VEGF-A结合蛋白(D)
名称 基序(第2栏) 特异结构域(第3栏)
F2610 mRSNR-mRSHR-mRDHT-mRSHR RSNR-RSHR-RDHT-RSHR
F2612 mRSHR-mRDHT-mRSHR-mRDHT RSHR-RDHT-RSHR-RDHT
F2638 mRSNR-mQSHR-mRDHT-mRSHR RSNR-QSHR2-RDHT-RSHR
表5:典型的VEGF-A结合蛋白(E)
名称 基序(第2栏) 特异结构域(第3栏)
F2608 mRSHR-mRDHT-mVSNV-mQSHT RSHR-RDHT-VSNV-QSHT
F2611 mRSHR-mRSHR-mWSNR-mRSHR RSHR-RSHR-WSNR-RSHR
F2617 mRDER-mRSHR-mDSCR-mQSHT RDER1-RSHR-DSCR-QSHT
F2619 mRSHR-mVSTR-mQSNR-mRDHT RSHR-VSTR-QSNR3-RDHT
F2623 mQSHT-mRSNR-mWSNR-mRDER QSHT-RSNR-WSNR-RDER1
F2625 mQSHT-mWSNR-mRDHT-mRDER QSHT-WSNR-RDHT-RDER1
F2628 mVSSR-mWSNR-mRSNR-mVSSR VSSR-WSNR-RSNR-VSSR
F2629 mQSHR-mVSSR-mWSNR-mRSNR QSHR2-VSSR-WSNR-RSNR
F2630 mRDER-mQSHR-mVSSR-mWSNR RDER1-QSHR2-VSSR-WSNR
F2635 mQSHR-mRSNR-mQSHR-mRDHT QSHR2-RSNR-QSHR2-RDHT
F2637 mRDHT-mRSNR-mRSHR-mWSNR RDHT-RSNR-RSHR-WSNR
F2642 mRDHT-mRSHR-mCSNR-mRDHT RDHT-RSHR-CSNR1-RDHT
F2643 mRSHR-mCSNR-mRDHT-mCSNR RSHR-CSNR1-RDHT-CSNR1
F2648 mQSSR-mQSHR-mRSNR-mRSNR QSSR1-QSHR2-RSNR-RSNR
F2651 mVSTR-mQSHT-mWSNR-mRSHR VSTR-QSHT-WSNR-RSHR
F2653 mVSTR-mQSNR-mRSHR-mQSNR VSTR-QSNR3-RSHR-QSNR3
F2654 mQSNR-mRSHR-mQSNR-mVSNV QSNR3-RSHR-QSNR3-VSNV
F2662 mDSCR-mRDHT-mVSTR-mRDER DSCR-RDHT-VSTR-RDER1
F2667 mRSHR-mDSCR-mRDHT-mRSHR RSHR-DSCR-RDHT-RSHR
F2668 mRSHR-mRSHR-mQSNV-mQSNV RSHR-RSHR-QSNV2-QSNV2
F2673 mRDHT-mVSSR-mRDER-mQSSR RDHT-VSSR-RDER1-QSSR1
F2682 mRSNR-mQSSR-mQSNR-mRSHR RSNR-QSSR1-QSNR3-RSHR
F2689 mRSNR-mDSAR-mQSNR-mQSHT RSNR-DSAR2-QSNR3-QSHT
F2697 mRSHR-mCSNR-mQSHT-mRSNR RSHR-CSNR1-QSHT-RSNR
F2699 mRSNR-mQSHT-mDSAR-mRSHR RSNR-QSHT-DSAR2-RSHR
F2703 mQSHR-mRSHR-mRDER-mRSHR QSHR2-RSHR-RDER1-RSHR
F2702 mRSHR-mQSHR-mRSHR-mQSNV RSHR-QSHR2-RSHR-QSNV2
在一方面,本发明公开了一种包括DNA结合结构域的多肽。所述DNA结合结构域具有多个锌指结构域。所述多肽可改变细胞中VEGF-A的表达或产生。例如,所述多肽可改变细胞对可能升高或降低VEGF-A的产生或表达的信号的正常应答。在一个实施方案中,所述多肽在那些诱导VEGF-A产生或表达的条件下可抑制细胞内诱导产生或表达VEGF-A。例如,这种抑制的幅度可以使得VEGF-A蛋白或mRNA水平降低至在不含该多肽但其他方面均相同的细胞中由那些条件所诱导的水平的80%、70%、60%、50%、40%、30%、20%、10%、5%、3%、2%、1%或0.5%以下。在一个实施方案中,所述条件包括缺氧。
可在人胚肾293F细胞中对这些条件进行精确测定,例如随后在实施例中所述。
所述多肽可具有广泛的用途,例如用于培养的人类细胞或生物体中,例如人或非人哺乳动物生物体。
在一个实施方案中,所述多肽结合人VEGF-A基因中的位点。在另一个实施方案中,所述多肽间接起作用,例如其结合另一个基因的位点。
在一个实施方案中,所述多肽包括阻抑结构域。所述多肽可包括在此所述的其他特征。本发明还公开了一种组合物,例如包括所述多肽或编码所述多肽的核酸的药物组合物。
所述组合物可施用于对象,例如以降低所述对象的血管发生的有效量施用,例如施用于所述对象的病变部位(例如肿瘤(neoplasm))的附近或施用于对象全身。在一个实施方案中,所述对象是患有或疑似患有转移癌的人。
就所公开的任何多肽来说,所述多肽可进一步包括一种异源性序列,例如核定位信号、小分子结合结构域(例如类固醇结合结构域)、表位标签或纯化标签、催化结构域(例如核酸修饰结构域、核酸裂解结构域、DNA修复催化结构域)、转录功能结构域(例如激活结构域、阻抑结构域等等)、蛋白转导结构域(例如来自HIV tat)、和/或调节位点(例如磷酸化位点、泛素化位点或蛋白酶裂解位点)。
所述多肽可例如与一或多种额外成分配制成药物组合物。所述组合物或多肽可纳入一种试剂盒,该试剂盒还可包括另一种药物或使用说明,例如治疗用途说明。
所述多肽可(共价或非共价)连接于一种固相支持物,例如珠、基质或平面阵列。所述多肽也可连接于一种标记物,如放射性化合物、荧光化合物、另一种可检测物、或检测系统的成分(例如化学发光剂)。
本发明还包括一种分离的核酸,所述核酸包括编码一种上述多肽的序列。所述核酸可进一步包括一种可操纵连接的调节序列,例如启动子、转录增强子、5′非翻译区、3′非翻译区、病毒包装序列、和/或选择标记。可将所述核酸包装入病毒中,例如可感染哺乳动物细胞的病毒,例如慢病毒、逆转录病毒、痘病毒、或腺病毒。
本发明进一步提供了一种细胞,其含有所述多肽或包括编码所述多肽的序列的核酸。所述细胞可存在于对象生物体的组织中或培养物中。所述细胞可以是动物(例如哺乳动物细胞,例如人或非人细胞)细胞、植物细胞或微生物(例如真菌或细菌)细胞。可通过将所述多肽导入细胞或亲代细胞或通过将所述核酸导入细胞或亲代细胞而制备所述细胞。所述核酸可用于在细胞中产生所述多肽。
本发明还包括非人转基因哺乳动物,例如小鼠、大鼠、猪、兔、牛、山羊或绵羊。转基因哺乳动物的遗传互补体(genetic complement)包括编码上述以及本文中其他部分所述的嵌合型锌指多肽的核酸序列。本发明还包括产生所述多肽的方法,例如通过表达所述核酸,或包括使用所述多肽的方法,例如用于调节细胞内的内源性基因或病毒基因。
对于本发明的调节VEGF-A的任一种多肽,所述多肽可用于一种调节细胞内VEGF-A表达的方法中。所述方法包括将所述多肽或一种包括编码所述多肽的序列的核酸导入细胞。例如,可使用脂质体或通过与蛋白转导结构域进行融合而导入所述多肽。可例如通过转染或病毒输送而导入核酸。
本发明还公开了一种组合物,所述药物组合物例如包括一种例如在此所述的调节VEGF-A的多肽,或包括编码所述多肽的核酸。在一个实施方案中,所述多肽可抑制VEGF-A的表达,且所述组合物可施用于对象,例如以降低所述对象的血管发生的有效量施用,例如施用于所述对象的病变部位(例如肿瘤)的附近或施用于对象全身。在一个实施方案中,所述对象是患有或疑似患有转移癌的人。
在另一个实施方案中,所述多肽增强VEGF-A的表达,且所述组合物可以增强对象的血管发生的有效量施用于对象。例如,需要增强血管发生的情况例如为血管形成、胚胎发育、肌体生长、神经系统分化、妊娠、伤口愈合等等。血管内皮细胞生长因子(VEGF-A)是一种内皮细胞特异性生长因子,其是调节内皮细胞生长和分化的关键因子。
VEGF或其VEGF164和VEGF188异构体的水平不足导致出生后血管发生和缺血性心脏病。VEGF-A的激活可用于治疗或预防外周动脉疾病和冠状动脉疾病。例如,对象可以是患有或疑似患有创伤(内部或外部)、妊娠、神经系统疾病、胚胎发育问题、心血管疾病(例如缺血性心脏病、外周动脉疾病或冠状动脉疾病)。
不同的剪切变体产生了至少5种VEGF-A蛋白的异构体。这些异构体对血管发生具有不同的影响。通过锌指蛋白,例如在此所述的一种蛋白,激活VEGF-A可在一些实践中上调对产生所需临床结果来说具有重要意义的所有或个别的剪切变体。例如,锌指蛋白可调节所有剪切变体的表达,或者可调节剪切变体的一个亚组的表达,例如至少一种剪切变体。
在另一方面,本发明公开了一种包囊化的组合物,其包括由生物相容性材料组成的包囊层以及重组的哺乳动物细胞,其中所述细胞含有一种核酸,其包含编码调节一种因子的产生的嵌合型锌指蛋白的序列,所述因子例如为分泌因子或非分泌蛋白,例如细胞质蛋白质。在一个实施方案中,所述生物相容性材料至少可透过分子量为10、20、30或40kDa的蛋白质。所述生物相容性材料可保留大于例如50、100、120或200kDa的蛋白质。
本发明还提供了一种快速和规模化的用于鉴别和构建嵌合型蛋白质例如转录因子的基于细胞的方法。此类转录因子可用于生物医药和生物工程用途例如改变内源性基因的表达。可通过体内测试和在培养的细胞中测试转录因子,例如在培养物中的完好的活细胞中进行。
在另一方面,本发明公开了一种用于表征嵌合型锌指蛋白例如在此所述的锌指蛋白的方法。所述方法包括:将编码该蛋白的核酸导入细胞;表达该核酸;并评估靶基因的表达。例如,评估可包括确定细胞的内源性基因的表达谱。该表达谱包括多个数值,其中每个数值相应于一种不同基因、剪切变体或基因的等位基因变体的表达水平(即mRNA水平)或翻译产物的丰度(即蛋白水平)。所述数值可以是所述基因的表达水平或所述基因的翻译产物水平的定性或定量评估值,即1)对转录自该基因的mRNA或2)对由该基因编码的所述多肽的丰度的评估值。
在另一方面,本发明公开了一种用于鉴别可结合于特定靶位点的嵌合型锌指蛋白的方法。该方法包括:提供数据记录值,每一个记录值与一种天然存在的锌指结构域(例如一种人的锌指结构域)的标识(identifier)和由该标识指代的锌指结构域所识别的至少一个3或4个碱基对的亚位点相关;将靶位点解析为至少两个3或4个碱基对的亚位点;对于每个亚位点,自数据记录值中重新获得一组标识,所述的组包含识别亚位点的锌指结构域的标识;并设计一种包含针对各个亚位点的锌指结构域的多肽,所述锌指结构域由来自所述组的对应于相应亚位点的标识指代。
数据记录值可包括鉴别感兴趣的锌指结构域的记录值,所述方法可进一步包括在体外合成编码所述多肽的核酸和/或合成所述多肽的步骤。所述方法还可包括评估所述多肽与靶位点的结合的步骤,例如采用体外结合测定或体内测定法,例如测定靶基因的表达。合成的多肽可进一步包括一个激活或阻抑结构域。
在一个实施方案中,所述方法进一步包括评估所述多肽改变一或多个内源性基因的表达的能力。评估可包括分析多种内源性基因的表达谱,例如采用核酸微阵列,或分析一种或有限数量的基因的表达谱。所述方法还可进一步包括将所述多肽与包括靶位点的DNA相接触,例如在体外进行。
在另一个实施方案中,所述方法进一步包括自寻定的(addressed)核酸文库重新获得编码所述多肽的核酸,该文库中的每种核酸包括一种编码第一和第二锌指结构域的序列。
在另一方面,本发明公开了特定的多肽和分离核酸。本发明的多肽可包括例如1、2、3或4个锌指结构域并可与在此提供的具有一种特定氨基酸序列的参照多肽相关。例如,所述多肽在1、2、3、4或更多个锌指结构域中可具有与所述参照多肽的相应锌指结构域相同的DNA接触残基。在另一个实例中,在所述多肽的3个锌指结构域中,至少9、10或11个DNA接触残基(3x4)与所述参照多肽的相应锌指结构域的DNA接触残基相同。在另一个实例中,在所述多肽的4个锌指结构域中,至少12、13、14或15个DNA接触残基(4x4)与所述参照多肽的相应锌指结构域的DNA接触残基相同。所述多肽能够与所述参照多肽结合同一个位点,并调节同一种内源性基因,例如以所述参照多肽的活性的0.1至10倍或0.5至1.5倍。
在一个实施方案中,一或多种(例如所有)锌指结构域的氨基酸序列是天然存在的序列。在一个实施方案中,所述多肽能够调节靶基因,例如细胞的内源性基因,例如与所述参照多肽的基因相同的基因,例如VEGF-A。
此外,本发明的纯化的多肽的氨基酸序列可与在此所述的锌指结构域具有至少50%、60%、70%、80%、90%、93%、95%、96%、98%、99%、或100%的相同性。在相应于多肽的DNA接触残基的氨基酸位置上,所述多肽可与在此所述的锌指结构域相同。或者,所述多肽在相应于多肽的DNA接触残基的残基中至少有一个与在此所述的锌指结构域不同。例如,所述多肽的一或多个锌指结构域包括在一个DNA接触残基处具有保守取代。
所述多肽还可具有至少1、2或3个残基的差异,例如为那些DNA接触残基以外的残基。例如,在一个给定的锌指结构域内部,所述多肽可与以上参照的氨基酸序列具有单个氨基酸的差异,或与以上参照的序列具有2、3或4个氨基酸的差异。这种差异的原因可以是在此所述的保守取代。在一个实施方案中,与以上参照的序列的氨基酸差异位于第二锌配位半胱氨酸与-1DNA接触位置之间(参照如下描述的DNA接触位置的编号系统)。
可采用数学算法进行序列比较并确定两个序列之间的百分比相同性。具体而言,采用Needleman和Wunsch((1970)J.Mol.Biol.48:444-453)算法确定两个氨基酸序列之间的百分比相同性,该算法已经并入GCG软件包的GAP程序,采用了Blossum 62评分矩阵,空位罚分为12,空位扩展罚分为4,且移码空位罚分为5。
纯化的多肽还可包括如下各项中的一或多种:异源性DNA结合结构域、核定位信号、小分子结合结构域(例如类固醇结合结构域)、表位标签或纯化标签、催化结构域(例如核酸修饰结构域、核酸裂解结构域或DNA修复催化结构域)和/或转录功能结构域(例如激活结构域、阻抑结构域等等)。在一个实施方案中,所述多肽进一步包括一个第二锌指结构域,例如一个具有在此所述的序列的结构域。例如,所述多肽可包括一列锌指,包括两个或多个锌指结构域。在一个实施方案中,一或多个结构域(例如每个结构域)可具有与在此所述的基序相一致的序列,例如mCSNR、mDSAR、mDSCR、mISNR、mQFNR、mQSHV、mQSNI、mQSNK、mQSNR、mQSNV、mQSSR、mQTHQ、mQTHR、mRDER、mRDHT、mRDKR、mRSHR、mRSNR、mVSNV、mVSSR、mVSTR、mWSNR、mDGNV、mDSNR和mRDNQ。此外,每个结构域均可具有在此提供的序列。如下所述,小写字母m前缀表示列出的4个氨基酸代表DNA接触残基的基序。
本发明的核酸包括编码上述多肽的核酸。本发明的核酸可以被一种异源性核酸序列可操纵地调节,例如被诱导型启动子(例如类固醇激素调节的启动子、小分子调节的启动子或遗传工程化诱导型系统,如四环素Tet-On和Tet-Off系统)调节。在一个实施方案中,启动子在哺乳动物细胞中可诱导。
如在此所述,所述多肽可在细胞中产生并可通过结合一种靶位点而调节细胞内的基因,例如一种内源性基因,靶位点例如是一种包括被相应的锌指结构域所识别的亚位点的位点。细胞可以是哺乳动物细胞。
本发明还包括一种表达融合于一种异源性核酸结合结构域的在此所述的多肽的方法,所述方法包括将编码上述融合蛋白的核酸导入细胞。
在另一方面,本发明公开了一种包囊化的组合物。所述组合物包括由生物相容性材料组成的包囊层以及重组的哺乳动物细胞。所述细胞含有一种核酸,所述核酸包括编码一种嵌合型锌指蛋白的序列,所述嵌合型锌指蛋白调节细胞内的另一种核酸的产生,另一种核酸例如是异源性核酸或内源性核酸。例如,所述细胞可调节一种基因,该基因编码一种分泌多肽或调节或参与一种分泌因子的产生,例如分泌多肽。在一个实施方案中,分泌多肽是胰岛素、胰岛素样生长因子、VEGF-A、HGF、干扰素、白介素或成纤维细胞生长因子。
包囊层典型地至少可透过分子量为10kDa的蛋白质,例如分子量大约为10、20、30、40、50或70kDa的蛋白质。包囊层可以是非通透性的,例如大于上述分子量的蛋白质,例如大约100kDa的蛋白质。可存在额外的包囊层。嵌合型锌指蛋白可包括在此所述的一或多种特征。
术语“锌指蛋白”指的是任何包括锌指结构域的蛋白质。蛋白质可包括一或多个多肽链。典型的锌指蛋白包括2、3、4、5、6或更多个锌指结构域。典型地,所述蛋白质是单链。不过,在一些实施方式中,蛋白质可包括多个多肽链,例如,蛋白质可以是一种异源二聚体或同源二聚体蛋白质。
术语“碱基接触位置”、“DNA接触位置”或“核酸接触位置”指的是锌指结构域中在结构上相应于ZIF268的精氨酸73、天冬氨酸75、谷氨酸76和精氨酸79的氨基酸位置的4个氨基酸位置。
Glu Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser
1 5 10 15
Arg Ser Asp Glu Leu Thr Arg His Ile Arg Ile His Thr Gly Gln Lys
20 25 30
Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp His
35 40 45
Leu Thr Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys
50 55 60
Asp Ile Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Arg Lys Arg His
65 70 75 80
Thr Lys Ile His Leu Arg Gln Lys Asp(SEQ ID NO:129)
85
这些位置也分别被称为第-1位、第2位、第3位和第6位。为了鉴别一种查询序列中相应于所述碱基接触位置的位置,可将查询序列与感兴趣的锌指结构域进行比对,以使得该查询序列的半胱氨酸和组氨酸残基Zif268的指3的那些残基对齐。European Bioinformatics Institute的ClustalW WWW Service(Thompson等(1994)Nucleic Acids Res.22:4673-4680)提供了一种简便的序列比对方法。
保守性氨基酸取代指的是具有相似侧链的残基之间的可交换性。例如,一组具有脂肪族侧链的氨基酸是甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸;一组具有脂肪族羟基侧链的氨基酸是丝氨酸和苏氨酸;一组具有含酰胺侧链的氨基酸是天冬酰胺和谷氨酰胺;一组具有芳基侧链的氨基酸是苯丙氨酸、酪氨酸和色氨酸;一组具有碱性侧链的氨基酸是赖氨酸、精氨酸和组氨酸;一组具有酸性侧链的氨基酸是天冬氨酸和谷氨酸;以及一组具有含硫侧链的氨基酸是半胱氨酸和甲硫氨酸。根据情况,同一组内的氨基酸可以相互交换。一些其他的保守性氨基酸取代组是:缬氨酸-亮氨酸-异亮氨酸;苯丙氨酸-酪氨酸;赖氨酸-精氨酸;丙氨酸-缬氨酸;天冬氨酸-谷氨酸;以及天冬酰胺-谷氨酰胺。
术语“异源性多肽”指的是具有非天然存在的序列的多肽(例如杂合多肽)或者是具有与天然存在的多肽相同的序列的多肽,但其所处的环境不是其天然存在的环境。例如,在自然界不融合在一起的两种天然存在的多肽发生融合产生了异源性多肽,其中一种多肽对于另一种来说是异源性的。
术语“杂合体”指的是一种非天然存在的多肽,其包含一种氨基酸序列,所述序列衍生自(i)至少两种不同的天然存在的序列;(ii)至少一种人工序列(即一种非天然存在的序列)和至少一种天然存在的序列;或(iii)至少两种人工序列(相同的或不同的)。人工序列的实例包括天然存在的序列的突变体和重新设计的序列。
在此,术语“严格条件下杂交”指的是杂交的条件是:6X氯化钠/柠檬酸钠(SSC),45℃,随后在0.2X SSC,0.1%SDS洗涤2次,65℃。本发明还公开了在严格条件下与在此所述的核酸杂交或与编码在此所述的多肽的核酸杂交的核酸。
术语“结合偏向性(binding preference)”指的是一种多肽在选择一个核酸结合位点时相对于另一个位点的区别特性。例如,在本文中所述的体内或体外测试中,如果所述多肽的量对于两种不同的核酸结合位点来说是有限的,那么相对于另一位点来说,更多的所述多肽会与优选位点结合。
在本文中,“解离常数”指的是一种蛋白质(例如锌指蛋白)结合一种感兴趣的靶位点的平衡解离常数。对于识别位于9和18个碱基对之间的靶位点的锌指蛋白,通过一种28个碱基对的双链DNA对结合进行评估。通过凝胶迁移分析测定解离常数,使用的是纯化蛋白,该蛋白结合于20mM Tris pH7.7,120mM NaCl,5mM MgCl2,20μM ZnSO4,10%甘油,0.1%Nonidet P-40,5mM DTT,和0.10mg/mL BSA(牛血清白蛋白),室温。实施例1以及Rebar和Pabo((1994)Science 263:671-673)提供了其他的细节。解离常数可低于10-6、10-7、10-8或10-9M。
可将一种多肽(“竞争性多肽”)称为与另一种多肽(感兴趣的多肽)“竞争”一个结合位点,条件是,在使用具有所述靶位点的探针分子的体外测试中,所述竞争性多肽的浓度不超过所述感兴趣的多肽的浓度的10倍以上,由所述感兴趣的多肽所结合的探针分子的数量降低至少25%。以大约50倍于所述感兴趣的多肽对该探针分子的Kd值进行这些实验。
可将一种给定的锌指结构域称为“特异性结合”一种给定的3个碱基对的DNA位点,条件是,一种包括Zif268的指1和指2以及该给定的锌指结构域的嵌合型蛋白质对一种靶位点的亲和力至少为5nM,所述靶位点既包括该给定的3个碱基对DNA位点又包括由Zif268的指1和指2所识别的5-bp序列5′-GGGCG-3′。术语“识别”和“特异性结合”可互换使用,指的是在上述Zif268融合测试中,锌指结构域对结合位点的区别力。
在此,“简并寡核苷酸”既指(a)一组不同的寡核苷酸,其各自编码一种特定的氨基酸序列,也指(b)单一一种寡核苷酸,其可与一种以上的序列退火,例如一种具有非天然核苷酸如次黄嘌呤核苷的寡核苷酸。
“分离的组分”指的是一种组分,其与可获得该分离的组合物的细胞样品或反应混合物中的至少一种成分的至少90%分离。人工产生或天然产生的组分可以是至少一定程度纯化的组分,条件是感兴趣的物质或物质群以重量-重量计算其纯度至少是5%、10%、25%、50%、75%、80%、90%、92%、95%、98或99%。在此所述的任何蛋白或核酸组分均可以分离的形式而提供。
使用锌指结构域是特别有利的。首先,锌指结构结构能够识别极其多样的DNA序列,但任一特定的锌指对一种特定的序列可具有高度的特异性。其次,天然存在的锌指蛋白的结构是模块化的。例如,锌指蛋白Zif268,也称为“Egr-1”,由串联排列的3个锌指结构域组成。Pavletich和Pabo描述了锌指蛋白Zif268的一种片段的X射线结晶学结构。Pavletich和Pabo(1991)Science 252:809-817。在这种结构模型中,3个Zif268指与DNA形成复合体。每个指独立地与DNA识别位点的3-4个碱基对接触。通过在同一个多肽链中具有多个锌指模块的共同作用而达到高亲和性结合。
本发明可利用人类基因组或任何其他基因组中的所有锌指结构域。对通过锌指结构域在结构上的折叠而占据的序列空间进行这种多样化取样可具有经世世代代自然选择所固有的额外优势。此外,通过使用来自宿主物种的结构域,由在此所述的方法经遗传工程化产生的用于基因治疗的锌指蛋白降低了其被宿主免疫应答视为外来物的可能性。也可使用非天然存在的锌指结构域,例如人类或哺乳动物锌指结构域的变体或全部人工化的锌指结构域。
由于能够选择识别特定序列的DNA结合结构域,因此得以设计出特异性调节靶基因如内源性细胞基因的新的蛋白质。在许多实施方式中,这些蛋白质具有治疗性用途或工业用途。也可有其他用途。
本申请也公开了多个实施例,其运用特定的实施方案,证实了锌指蛋白可广泛用作一种治疗癌症的治疗剂。这些实施例说明,锌指蛋白可作为VEGF-A表达的强效抑制剂。由于VEGF-A促成肿瘤组织内的血管发生,因此调节(例如抑制)VEGF-A的锌指蛋白可用于例如降低肿瘤内部或周围的血管发生。
在此引用的全部专利、专利申请和参考文献均以其全部内容并入本文作为参考。以下专利申请:WO01/60970(Kim等);美国专利申请公开文本2002-0061512、2003-165997和2003-194727以及美国申请10/669,861、60/431,892和60/477,459,特别以其全部内容并入作为参考用于所有目的。下面结合附图和以下说明来阐述本发明的一或多种实施方案。根据说明书、附图和权利要求书,本发明的其他特征、目的和优势将是显而易见的。
附图说明
图1A、1B和1C列出了人VEGF-A基因的一个典型区域的核酸序列(SEQ ID NO:120)。该区域包括启动子。该序列来自GENBANK登记号AF095785.1。转录起始位点大约为2363位核苷酸。起始密码子大约为3401位核苷酸。
图2A、2B、2C、2D、2E和2F列出了人转化蛋白(FGF4)基因的一个典型区域的核酸序列(SEQ ID NO:121)。该区域包括启动子。该序列来自GENBANK登记号J02986.1和AP006345.2(智人基因组DNA,染色体11克隆:RP11-186D19,完整序列)。转录起始位点大约为3731位核苷酸。起始密码子大约为3959位核苷酸。
图3A、3B、3C、3D和3E列出了人肝细胞生长因子(HGF)基因的一个典型区域的核酸序列(SEQ ID NO:122)。该区域包括启动子。该序列来自GENBANK登记号AC004960.1,来自7q11.23-q21的智人PAC克隆RP5-1098B1。转录起始位点大约为4389位核苷酸。起始密码子大约为4454位核苷酸。
图4是VEGF-A启动子的示意图。
图5A提供了用于表达具有KRAB结构域的锌指蛋白的典型的核酸构建体的示意图。
图5B提供了典型的含有VEGF-A启动子的萤光素酶报道分子构建体的示意图。
具体实施方式
包括至少一个锌指结构域的嵌合型锌指蛋白可用于调节细胞内基因的表达。锌指蛋白可包括两个或更多个天然存在的锌指结构域。在一组实例中,嵌合型锌指蛋白被用于调节哺乳动物细胞中的VEGF-A基因。
可通过多种方法获得嵌合型锌指蛋白。
在一个实施方案中,这些蛋白被设计为用于识别靶DNA位点。有用的靶位点包括靶基因调节区域内的位点或在距靶基因调节区域1kb或500bp范围内的位点。例如,靶位点可以在距基因的TATA盒或转录起始位点1kb或500bp范围内。用于设计锌指蛋白的一种方法包括,将靶位点解析为可被一种单独的锌指结构域识别的3或4个碱基对的序列。然后构建包括编码编码一种蛋白质的核酸,所述蛋白质具有相应于所述被解析的元件的连续的锌指结构域。构建编码候选蛋白质的多种不同的核酸并在宿主细胞中进行表达。评估靶基因的表达以鉴别能够调节所述靶基因的表达的一或多种候选蛋白。
在另一个实施方案中,根据其在细胞内的表型效应自锌指结构域文库选择嵌合型锌指蛋白。例如,将编码锌指结构域的随机嵌合体的核酸文库转化入哺乳动物培养细胞中。在细胞内表达文库的核酸。评价细胞的感兴趣的表型,分离那些相对于对照而言表型发生改变的细胞。回收此类细胞中的文库核酸,然后可进一步对由此类回收的核酸编码的锌指蛋白进行表征、运用和修饰。
锌指结构域
锌指结构域是大约30个氨基酸残基的小多肽结构域,其中有4个具有适当间隔的残基,这4个残基是半胱氨酸或组氨酸,它们可与锌离子进行配位(综述见例如Klug和Rhodes,(1987)Trends Biochem.Sci.12:464-469(1987);Evans和Hollenberg,(1988)Cell 52:1-3;Payre和Vincent,(1988)FEBS Lett.234:245-250;Miller等(1985)EMBO J.4:1609-1614;Berg,(1988)Proc.Natl.Acad.Sci.U.S.A.85:99-102;Rosenfeld和Margalit,(1993)J.Biomol.Struct.Dyn.11:557-570)。因此,可根据与锌离子进行配位的残基的特性对锌指结构域进行分类,例如Cys2-His2型、Cys2-Cys2型、Cys2-CysHis型、等等。Cys2-His2锌指的锌配位残基的典型的间隔如下所示:
C-X2-5-C-X3-Xa-X5-ψ-X2-H-X3-5-H,(SEQ ID NO:123)
其中ψ(psi)是一种疏水性残基(Wolfe等(1999)Avenu.Rev.Biophys.Biomol.Struct.3:183-212),“X”代表任何氨基酸,下标的数字代表氨基酸的数目,下标的以连字符连接的两个数字代表掺入氨基酸的通常的范围。在许多锌指结构域中,最初的半胱氨酸前面的是苯丙氨酸或酪氨酸,然后是一个非半胱氨酸氨基酸。通常,插入的氨基酸折叠形成对着一α-螺旋堆积的一反向平行β-片层,不过,所述反向平行β-片层可以是短的、不理想的、或非现存的。这种折叠将锌配位侧链定位,使得它们形成一个适合与锌离子配位的四面体构象。碱基接触残基位于一对金属螯合残基之间的环区域内。
为简便起见,根据以下实例,将锌指结构域的主要DNA接触残基编号为:-1、2、3和6:
-1 1 2 3 4 5 6
C-X2-5-C-X3-Xa-X-R-X-D-E-Xb-X-R-H-X3-5-H(SEQ ID NO:124),
如上例所示,DNA接触残基是Arg(R)、Asp(D)、Glu(E)和Arg(R)。以上基序可缩写为RDER。在此,该缩写是一种简略表达方式,指的是自位于第一位半胱氨酸(上面SEQ ID NO:124的起始残基)之前的第二个残基至最末的金属螯合组氨酸(SEQ ID NO:124的最末的残基)的一个特定多肽序列。在上述基序以及其他的基序中,Xa常为芳香族氨基酸,而Xb常为疏水性氨基酸。在两种不同的序列具有同一种基序的情况中,可使用数字表示各个序列(例如RDER1或RDER2)。
在明确说明的某些情况中,4字母缩写指的是一般而言的基序。换句话说,该基序具体指出了第-1、2、3和6位的氨基酸,而其他位置可以是任何氨基酸,典型地但不一定是,一种非半胱氨酸氨基酸。可用基序前面的小写字母“m”来明确表示该缩写指的是一种基序。例如,mRDER指的是一种基序,其中R出现在位置-1,D在位置2,E在位置3,而R在位置6。
锌指DNA结合蛋白可由串联排列的3个或更多个锌指结构域组成。
锌指结构域(或“ZFD”)是一种最常见真核生物DNA结合基序,存在于自酵母到高等植物以及到人类的物种中。根据一种估计,单在人类基因组中就有至少数千种锌指结构域,可能至少4,500种。可自锌指蛋白中鉴定或分离锌指结构域。锌指蛋白的非限制性实例包括CF2-II;Kruppel;WT1;Basonuclin BCL-6/LAZ-3;红系Kruppel样转录因子;转录因子Sp1、Sp2、Sp3、和Sp4;转录阻抑子YY1;EGRI/Krox24;EGR2/Krox20;EGR3/Pilot;EGR4/AT133;Evi-1;GLI1;GLI2;GLI3;HIV-EP1/ZNF40;HIV-EP2;KR1;ZfX;ZfY;和ZNF7。
人工转录因子可包括现有锌指结构域的嵌合体。在一个实施方案中,锌指结构域的一或多种是天然存在的。US 2002-0061512、US 2003-165997和U.S.S.N.60/431,892公开了许多典型的人类锌指结构域。请同时参见下面的表6。各种结构域的结合特异性可用于设计具有特定特异性的转录因子。
表6:典型的锌指结构域
ZFD 氨基酸序列 SEQ ID NO:
CSNR1 YKCKQCGKAFGCPSNLRRHGRTH 1
DSAR2 YSCGICGKSFSDSSAKRRHCILH 2
DSCR YTCSDCGKAFRDKSCLNRHRRTH 3
QSHR2 YKCGQCGKFYSQVSHLTRHQKIH 4
QSHT YKCEECGKAFRQSSHLTTHKIIH 5
QSNR3 YECEKCGKAFNQSSNLTRHKKSH 6
QSNV2 YVCSKCGKAFTQSSNLTVHQKIH 7
QSSR1 YKCPDCGKSFSQSSSLIRHQRTH 8
RDER1 YVCDVEGCTWKFARSDELNRHKKRH 9
RDHT FQCKTCQRKFSRSDHLKTHTRTH 10
RSHR YKCMECGKAFNRRSHLTRHQRIH 11
RSNR YICRKCGRGFSRKSNLIRHQRTH 12
VSNV YECDHCGKAFSVSSNLNVHRRIH 13
VSSR YTCKQCGKAFSVSSSLRRHETTH 14
VSTR YECNYCGKTFSVSSTLIRHQRIH 15
WSNR YRCEECGKAFRWPSNLTRHKRIH 16
QSHV YECDHCGKSFSQSSHLNVHKRTH 17
RDHR1 FLCQYCAQRFGRKDHLTRHMKKS 18
DSNRa# YRCKYCDRSFSDSSNLQRHVRNIH 19
#表示该结构域不是天然存在的人结构域。
其他典型的锌指结构域包括具有如下基序的结构域:mCSNR、mDSAR、mDSCR、mISNR、mQFNR、mQSHV、mQSNI、mQSNK、mQSNR、mQSNV、mQSSR、mQTHQ、mQTHR、mRDER、mRDHT、mRDKR、mRSHR、mRSNR、mVSNV、mVSSR、mVSTR、mWSNR、mDGNV、mDSNR、和mRDNQ。
也可使用其他类型的DNA结合结构域,例如至少一种不同于锌指结构域的结构域。本发明使用具有不同结合特异性的核酸结合结构域的集合。已知多种蛋白结构可以高亲和力和特异性与核酸相互作用。有关识别双链DNA的结构基序的综述可参见,例如Pabo和Sauer(1992)Annu.Rev.Biochem.61:1053-95;Patikoglou和Burley(1997)Annu.Rev.Biophys.Biomol.Struct.26:289-325;Nelson(1995)Curr Opis Genet Dev.5:180-9。锌指结构域以外的核酸结合结构域的少数非限制性实例包括:同源结构域、螺旋-转角-螺旋结构域、翼状螺旋结构域和螺旋-环-螺旋结构域。
转录因子特征
除DNA结合结构域以外,转录因子还可任选地包括调节结构域、核定位信号、或其他在此所述的特征。
激活结构域。可用于本发明的转录激活结构域包括但不限于来自酵母的Gal4激活结构域和来自单纯疱疹病毒的VP16结构域。可通过将一种结构域融合于一种已知的DNA结合结构域,然后再确定与由所述已知的DNA结合结构域所识别的位点可操纵地连接的报道分子是否被所述融合蛋白激活,可由此验证该结构域激活转录的能力。
一种典型的激活结构域是来自p65的如下结构域:YLPDTDDRHRIEEKRKRTYETFKSIMKKSPFSGPTDPRPPPRRIAVPSRSSASVPKPAPQPYPFTSSLSTINYDEFPTMVFPSGQISQASALAPAPPQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQAVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLGNSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEPMLMEYPEAITRLVTAQRPPDPAPAPLGAPGLPNGLLSGDEDFSSIADMDFSALLSQ(SEQ ID NO:73)
一种典型的Gal4激活结构域的序列如下:NFNQSGNIADSSLSFTFTNSSNGPNLITTQTNSQALSQPIASSNVHDNFMNNEITASKIDDGNNSKPLSPGWTDQTAYNAFGITTGMFNTTTMDDVYNYLFDDEDTPPNPKKEISMAYPYDVPDYAS(SEQ ID NO:74)
在细菌中,采用加入野生型RNA聚合酶α亚基C端结构域或α亚基C端结构域的变体的一种结构域,例如融合于一种蛋白相互作用结构域的C端结构域,可模拟激活结构域功能。
阻抑结构域。如果需要,可将阻抑结构域而不是激活结构域融合于DNA结合结构域。真核生物的阻抑结构域的实例包括来自Kid、UME6、ORANGE、Groucho和WRPW的阻抑结构域(见例如Dawson等(1995)Mol.Cell Biol.15:6923-31)。可通过将一种结构域融合于一种已知的DNA结合结构域,然后再确定与由所述已知的DNA结合结构域所识别的位点可操纵地连接的报道分子是否被所述融合蛋白阻抑,可由此验证该结构域阻抑转录的能力。
第一种典型的阻抑结构域是来自Kid蛋白的“KRAB”结构域(Witzgall R.等(1994)Proc.Natl.Acad.Sci.U.S.A.,91(10):4514-8):VSVTFEDVAVLFTRDEWKKLDLSQRSLYREVMLENYSNLASMAGFLFTKPKVISLLQQG EDPW(SEQ ID NO:75)
第二种典型的阻抑结构域是KOX阻抑结构域。该结构域包括来自人类Kox1蛋白的“KRAB”结构域(锌指蛋白10;NCBI蛋白质数据库AAH24182;GI:18848329),即Kox1的2-97位氨基酸:
DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVI LRLEKGEEPWLVEREIHQETHPDSETAFEIKSSV(SEQ IDNO:72)
第三种典型的阻抑结构域是来自UME6蛋白的以下结构域:NSASSSTKLDDDLGTAAAVLSNMRSSPYRTHDKPISNVNDMNNTNALGVPASRPHSSSFPSK GVLRPILLRIHNSEQQPIFESNNSTACI(SEQ ID NO:119)
WRPW结构域是阻抑结构域的另一种实例。
其他的嵌合型转录因子包括激活结构域或阻抑结构域。当然,此类转录因子可通过替代一种结合的内源性转录因子(例如激活子或阻抑子)或者与之竞争而改变转录。
其他功能性结构域。其他功能性结构域的实例包括组蛋白修饰酶(例如组蛋白乙酰化酶或去乙酰化酶、DNA修饰酶(例如甲基化酶),等等。
可将蛋白转导结构域融合于锌指蛋白。蛋白转导结构域使得转导结构域和所连接的多肽被摄取到细胞内。“蛋白转导结构域”或“PTD”是一种氨基酸序列,其能够穿过生物膜,特别是细胞膜。当连接了一种异源性多肽时,PTD能够增强该异源性多肽的跨生物膜转运。PTD通常共价(例如通过肽键)连接于该异源性DNA结合结构域。例如,PTD和异源性DNA结合结构域可由同一种单独的核酸分子编码,例如在同一个可读框内或在同一个基因的一或多个外显子内。典型的PTD可包括10-30个氨基酸并可形成一种两性螺旋。许多PTD是碱性的,例如包括至少4、5、6或8个碱性残基(例如精氨酸或赖氨酸)。PTD能够增强多肽转运进入缺乏细胞壁的细胞或来自特定物种的细胞,例如真核细胞,例如脊椎动物细胞,例如哺乳动物细胞,例如人类、猿、鼠、牛、马、猫或羊的细胞。
通常,通过将一种锌指蛋白的DNA结合结构域与PTD作为一个单一的多肽链而产生,由此将PTD连接于所述锌指蛋白,但也可采用其他方法与PTD发生物理学上的结合。例如,可通过非共价相互作用与PTD结合(例如使用生物素-抗生物素蛋白、螺旋-卷曲,等等)。更加典型地,可将PTD例如采用柔性接头连接于锌指蛋白。柔性接头可包括一或多个甘氨酸残基以便自由旋转。例如,可通过至少10、20或50个氨基酸将PTD与转录因子的DNA结合结构域分隔开。PTD可位于DNA结合结构域的N端或C端。
锌指蛋白也可包括多个PTD,例如多个不同的PTD或一种PTD的至少2个拷贝。
典型的PTD包括来自触角足(antennapedia)蛋白、单纯疱疹病毒VP22蛋白和HIV TAT蛋白的以下片段。
Tat。当外源性加入时,来自人免疫缺陷病毒I型(HIV-1)的Tat蛋白具有显著的进入细胞的能力(Frankel A.D.和Pabo C.O.(1988)Cell 55:1189-1193,Mann D.A和Frankel A.D.(1991)EMBOJ.10:1733-1739,Fawell等(1994)Proc.Natl.Acad.Sci.USA 91:664-668)。最小的Tat PTD包括人免疫缺陷病毒Tat蛋白的第47-57位残基。在此将这种肽序列称为“TAT”。
触角足(antennapedia)。触角足同源结构域也包括一种是PTD的肽。Derossi等(1994)J.Bio.Chem.269:10444-10450。该肽也被称为“Penetratin”。
VP22。HSV VP22蛋白也包括一种PTD。该PTD位于VP22的C端的34个氨基酸残基处。见例如Elliott和O′Hare(1997)Cell 88:223-234和U.S.6,184,038。
另一种典型的PTD是聚精氨酸序列,例如一种包括至少4、5、6或8个精氨酸残基的序列,例如5到10个精氨酸残基。
细胞特异性PTD。一些PTD对特定细胞类型或状态具有特异性。一种典型的细胞特异性PTD是美国专利申请公开文本2002-0102265描述的Hn1合成肽。Hn1被人类头颈部鳞癌细胞进行内在化,并可用于将一种人工转录因子或密切相关的序列导向癌症,例如头颈部癌症。美国专利申请公开文本2002-0102265还描述了一种通用方法,其可用于进行噬菌体展示以鉴别可作为细胞特异性PTD的其他的肽和蛋白质。有关PTD的其他信息还可参见U.S.2003-0082561;U.S.2002-0102265;U.S.2003-0040038;Schwarze等(1999)Science 285:1569-1572;Derossi等(1996)J.Biol.Chem.271:18188;Hancock等(1991)EMBOJ 10:4033-4039;Buss等(1988)Mol.Cell.Biol.8:3960-3963;Derossi等(1998)Trends in Cell Biology 8:84-87;Lindgren等(2000)Trends inPharmacological Sciences 21:99-103;Kilic等(2003)Stroke 34:1304-10;Asoh等(2002)Proc Natl Aead Sci USA 99(26):17107-12;和Tanaka等(2003)Immunol.170(3):1291-8。
设计新的DNA结合蛋白
在一个实施方案中,通过混合并匹配(mixing and matching)表征的锌指结构域合理地设计出锌指蛋白,以使得每一个结构域识别靶位点的一个片段。可采用例如US 2002-0061512和2003-165997所述的方法分离并表征锌指结构域。锌指结构域的模块结构有利于对其进行重排以构建新的DNA结合蛋白。天然存在的Zif268蛋白中的锌指结构域处于延DNA双链串联的位置。每个结构域独立地识别一个不同的3-4个碱基对的DNA片段。
锌指结构域数据库。可使用上述的单杂交选择系统(one-hybridselection system)为每一种可能的3或4个碱基对的结合位点或一个有代表性数量的此类位点鉴别出一或多种锌指结构域。可将这种方法得到的结果累积起来作为锌指结构域与其一或多种3或4个碱基对的结合位点之间的一系列相关性。US 2002-0061512和2003-165997提供了此类相关性的实例。
可将结果以数据库的形式储存于电脑中,例如关系数据库、电子数据表或文本文件。这样的数据库的每一个记录值与一个代表性锌指结构域相关而一个串列(string)表示所述结构域的一或多个优选的结合位点的序列。数据库记录值可包括结合各个位点的锌指结构域的相对亲和力的指标。在一些实施方案中,数据库记录值还可包括表示编码特定锌指结构域的核酸的物理位置的信息。这样的物理位置可以是,例如,存放于冰箱中的微滴定板的一个具体的孔。
数据可设置为能够被查询或筛选,例如使用SQL操作环境、脚本语言(例如PERL或MICROSOFT EXCELS宏)或一种程序语言。这样的数据库能够使得使用者鉴别出一或多个识别特定的3或4个碱基对结合位点的锌指结构域。数据库和其他信息例如可被储存于数据库服务器中,也可被设置为使用可被装置编译的指令和其他信号进行相互通信。该系统的基于计算机的方面可以数字电路运行,或以计算机硬件、软硬件结合、软件或其组合而运行。本发明的设备,例如数据库服务器,可以计算机程序产品运行,该产品可具体存入计算机可读形式存储设备中,该设备可通过可编程的处理器运行;可通过一种执行指令程序的可编程的处理器进行方法操作,以通过对输入数据进行处理并产生输出数据而进行本发明的功能。一种执行环境的非限制性实例包括运行WINDOWSXP或WINDOWS NT 4.0(Microsoft,Redmond WA)、LINUXTM或其他操作系统的计算机。
也可在多种不同的融合蛋白中测试锌指结构域以验证其特异性。此外,仅存在少数结构域的特定结合位点可成为额外筛选的靶位。可通过对结合一种类似而又不同的位点的锌指结构域进行诱变而制备用于此类筛选的文库。用于各种可能结合位点的全部锌指结构域的矩阵是不必要的,因为结构域相对于靶结合位点可以是交错排列的,以便最佳利用现有的结构域。既可通过将结合位点解析为最有用的3或4个碱基对结合位点,也可通过改变锌指结构域之间的接头的长度,来实现这种交错排列。为了使得设计的多肽具有选择性和高亲和力,可在对所需位点具有高特异性的锌指结构域两侧放置具有高亲和力但特异性较低的其他结构域。可用US 2002-0061512和2003-165997所述的体内筛选方法测试人工装配的锌指蛋白及其衍生物在体内的功能、亲和力和特异性。类似地,这些方法可用于优化这些装配的蛋白,例如通过创建各种各样的接头组合、各种各样的锌指结构域模块、各种各样的锌指结构域组合等等的文库。
分析靶位点。将9-bp或更长的靶DNA序列解析为3-或4-bp片段。鉴别识别各种被解析为3-或4-bp片段的锌指结构域(例如自上述数据库中)。更长的靶序列,例如20bp至500bp的序列,也是适合的靶位,因为可在这些序列中鉴别9bp、12bp和15bp的亚序列。具体而言,可被解析为数据库中具有良好代表性的位点的亚序列可用作初始设计靶位。
可使用一种平分体系来估计一种特定的嵌合型锌指蛋白识别细胞内的靶位点的概率。得分可以是各个组成指对其优选亚位点的亲和力、其特异性及其在以前设计的蛋白质中获得的成功的函数。
计算机程序。可使用计算机系统和软件来访问上述计算机可读形式数据库、解析靶位点以及输出一或多种嵌合型锌指蛋白的设计。
这种技术可通过运行于可编程计算机例如移动电脑或固定电脑中的程序而实现,也可通过其他类似的具有处理器、处理器可读性存储介质以及一或多种输出装置的装置而实现。可用高水平程序性或目标定向性程序语言运行各种程序以便与计算机系统通信。一些例证性的计算机语言的实例包括C、C++、JAVA、Fortran和VISUAL BASIC。
可将各个此类程序存储于一种存储介质或设备中,例如只读存储器光(CD-ROM)、硬盘、磁盘或类似介质或设备,其是普通的或用于特殊目的的可编程计算机可读的,以便当计算机读取该存储介质或设备以进行本文中所述的程序时对计算机进行设置和运行。所述系统也可作为以一种程序进行设置的、计算机可读存储介质而运行,其中所述存储介质被设置为引起计算机以特殊的重新定义的方式运行。
计算机系统可连接于内部或外部网络。例如,计算机系统可接收来自远程客户系统的请求,例如使用HTTP、HTTPS或XML规程。请求可以是一种已知的靶基因的标识或一种代表靶核酸的序列的串列。对于前一种情况,计算机系统可访问序列数据库例如GENBANK以重新获得靶基因的调节区域的核酸序列。然后将该调节区域的序列或直接收到的靶核酸序列解析为亚位点,例如如上所述设计嵌合型锌指蛋白。
系统可将结果传给远程客户。或者,系统可控制机器人以物理性重新获得编码嵌合型锌指蛋白的核酸。在这种实施方案中,构建并存储编码嵌合型锌指蛋白的核酸文库,其形式例如为冷冻的纯化DNA或冷冻的携带所述核酸的菌株。机器人通过访问指明的文库的地址而应答来自计算机系统的信号。然后可对重新获得的核酸进行处理、包装并输送给客户。或者,可将重新获得的核酸导入细胞并分析。然后计算机系统可将分析结果通过网络传给客户。
自选定的模块构建蛋白质。一旦设计出含有多个锌指结构域的嵌合型多肽序列,即可合成编码所设计的多肽序列的核酸序列。构建合成基因的方法是本领域的常规技术。此类方法包括来自定制合成的寡核苷酸、PCR介导的克隆以及Mega-primer PCR的基因构建。在一个实例中,连续连接编码选定的锌指结构域的核酸以形成一种编码嵌合型多肽的核酸。可将其他的序列连接于编码所设计的多肽序列的序列。所述其他序列自身可提供调节功能或能够编码一种具有所需功能的氨基酸序列。
分析嵌合型锌指蛋白的调节特性
可表征嵌合型锌指蛋白以确定其调节细胞内例如哺乳动物细胞内的一或多种内源性基因的能力。首先将编码嵌合型锌指蛋白的核酸融合于一种阻抑或激活结构域,然后将其导入感兴趣的细胞中。适当孵育并诱导所述编码核酸表达后,自细胞收集mRNA,并以核酸微阵列进行分析。
可通过多种方法核酸微阵列,例如光刻法(见例如美国专利No.5,510,270)、机械方法(例如美国专利No.5,384,261所述的方法)和基于针的方法(例如美国专利No.5,288,514所述)。通过在各个位置使用独特的捕获探针而合成阵列,各个捕获探针适合用于检测特定表达基因的核酸。
可通过常规方法分离mRNA,例如包括DNase处理以去除基因组DNA以及与偶联于固相基质的寡dT杂交(例如见Current Protocols inMolecular Biology,John Wiley & Sons,N.Y)。洗涤基质并洗脱mRNA。任何对分离的mRNA进行逆转录并任选地进行扩增,例如通过rtPCR,例如见美国专利No.4,683,202所述。可在扩增或逆转录过程中对核酸进行标记,例如通过掺入标记的核苷酸。优选的标记物的实例包括荧光标记物,例如红色荧光染料Cy5(Amersham)或绿色荧光染料Cy3(Amersham)。或者,可用生物素标记核酸,并在杂交后用标记的链霉抗生物素蛋白检测,例如链霉抗生物素蛋白-藻红蛋白(Molecular Probes)。
然后将标记的核酸与阵列接触。此外,可将对照核酸或参比核酸与同一阵列接触。可用不同于样品核酸的标记物对所述对照核酸或参比核酸进行标记,例如一种最大发射值不同的标记物。将标记的核酸与阵列在杂交条件下接触。洗涤阵列,然后成像以检测阵列的各个位置的荧光。
用于产生并评估模式(profiles)的通用方案包括检测阵列的各个位置的杂交。在某个位置的杂交程度以数值代表并储存于,例如向量、一维矩阵或一维阵列。向量x对阵列的各个位置具有一个值。例如,将代表特定位置的杂交程度的数值储存为变量Xa。可对数值进行调整,例如根据局部的背景水平、样品量和其他变量。自对照样品制备核酸并与同一或不同的阵列进行杂交。向量y的构建方法与向量x相同。可将样品表达模式与对照模式进行比较,例如使用作为这两个向量的函数的数学方程式。可将比较评估为一种分级数值,例如一种代表两个模式之间的相似性的评分。可通过矩阵对两种向量之一或两者进行转化,以便给由阵列检测的不同基因加权。
表达数据可存储于数据库中,例如一种关联数据库如SQL(例如Oracle或Sybase数据库环境)。数据库可具有多个表格。例如,原始表达数据可存储于一个表格中,其中各列对应于一种被分析的基因,例如位置或阵列,而各行对应于样品。独立的表格可存储标识和样品信息,例如所使用的阵列的批号、日期以及其他质控信息。
可通过对表达数据聚类来鉴别以相似方式受到调节的基因,以鉴别受到共调节的基因。这种聚类可代表被嵌合型锌指蛋白协调调节的一组基因。对基因聚类的方法可使用登记聚类(见例如Sokal和Michener(1958)Univ.Kans.Sci.Bull.38:1409)、Bayesian聚类、k-平均值聚类以及自组织图谱(self-organizing maps)(见Tamayo等(1999)Proc.Natl.Acad.Sci.USA 96:2907)。
可确定样品表达模式与对照表达模式(例如一种对照细胞)之间的相似性,例如通过将样品表达水平的对数值与预测值或对照表达值的对数值进行比较,并通过对模式中所有基因的预测值的因子进行加权而对比较进行调整。
设计出的转录因子的其他特征
肽接头。DNA结合结构域可通过各种接头进行连接。接头的使用和设计是本领域已知的。一种特别有用的接头是由核酸编码的肽接头。因此可以构建一种合成基因,其编码一种第一DNA结合结构域、肽接头以及一种第二DNA结合结构域。可重复进行这种设计以便构建大的、合成的、多结构域的DNA结合蛋白。PCT WO 99/45132和Kim和Pabo((1998)Proc.Natl.Acad.Sci.USA 95:2812-7)描述了如何设计适合用于连接锌指结构域的肽接头。
还有形成随机卷曲、α-螺旋或β-折叠三级结构的肽接头。本领域已知形成合适的柔性接头的多肽(见例如Robinson和Sauer(1998)Proc NatlAcad Sci USA.95:5929-34)。柔性接头典型地包括甘氨酸,因为这种氨基酸缺乏侧链,具有自由旋转的特性。可在接头中添加丝氨酸或苏氨酸以增加亲水性。此外,可使用能够与DNA的磷酸主链相互作用的氨基酸以增加亲和力。合理使用此类氨基酸能够使得在增加亲和力与降低向量特异性之间达到平衡。如果需要接头具有刚性伸展性,可使用α-螺旋接头,如螺旋接头,见Pantoliano等(1991)Biochem.30:10117-10125。也可通过计算机建模而设计接头(见例如美国专利No.4,946,778)。用于分子建模的软件是商品化的(例如来自Molecular Simulations,Inc.,San Diego,CA)。接头任选地是优化的,以便例如降低抗原性和/或增加稳定性,这可采用蛋白质工程领域常规使用的标准诱变技术和适当的生物物理学测试以及本申请提及的能够分析。
在使用锌指结构域的实施方式中,可使用天然存在于锌指之间的肽作为接头将指连接在一起。一个典型的这种天然存在的接头是:Thr-Gly-(Glu或Gln)-(Lys或Arg)-Pro-(Tyr或Phe)(SEQ ID NO:125)。
二聚化结构域。另一种连接DNA结合结构域的方法是使用二聚化结构域,特别是异二聚化结构域(见例如Pomerantz等(1998)Biochemistry37:965-970)。在这种实施方案中,DNA结合结构域存在于不同的多肽链中。例如,一种第一多肽编码DNA结合结构域A、接头和结构域B,而一种第二多肽编码结构域C、接头和结构域D。本领域人员能够自多种充分表征的二聚化结构域中选择二聚化结构域。如果不需要同源二聚体,可使用趋向于异二聚化的结构域。一种特别具有适应能力的二聚化结构域是卷曲螺旋基序,例如二聚体平行或反向平行卷曲螺旋。也存在优先形成异二聚体的卷曲螺旋序列(Lumb和Kim,(1995)Biochemistry 34:8642-8648)。另一种是其中二聚化可被小分子或被信号事件触发的二聚化结构域。例如,二聚体形式的FK506可用于使两个FK506结合蛋白(FKBP)结构域发生二聚化。此类二聚化结构域可用于提供额外的调节水平。
功能分析和用途
可使用无细胞分析和细胞内分析来评估锌指蛋白。无细胞分析的实例包括那些评估至少部分纯化的蛋白质的生物化学特性的分析,例如在体外评估DNA结合。体外分析的有用的实例包括电泳迁移率改变分析(EMSA)、DNA足迹分析、DNA甲基化保护分析、表面等离子体共振(surface plasmon resonance)、荧光偏振和荧光共振能量转移(FRET)。可使用细胞内分析或在体内(例如在生物体内)分析结合以及其他功能特性。
例如,可选择结构域以结合靶位点,例如一种调节细胞增殖的基因的启动子位点。通过模块装配,设计出的蛋白质可包括(1)选择分别结合跨越靶启动子位点的亚位点的结构域,和(2)转录调节结构域,例如激活结构域或阻抑结构域。在一个实例中,所述蛋白质调节一种调节细胞增殖的基因,且所述蛋白质预期对抗细胞增殖,在该实例中,可根据以下情况选择适当的转录调节结构域,即该基因是增强细胞增殖(例如选择阻抑结构域)还是降低细胞增殖(例如选择激活结构域)。在另一个实例中,筛选编码随机组合的锌指结构域的文库以鉴别改变一种表型的嵌合型锌指蛋白。
可将编码嵌合型锌指蛋白的核酸序列克隆入一种表达载体中,例如诱导型表达载体,见Kang和Kim,(2000)J Biol Chem 275:8742。诱导型表达载体可包括诱导型启动子或调节序列。诱导型启动子的非限制性实例包括类固醇激素应答启动子(例如蜕皮激素应答启动子、雌激素应答启动子和糖皮质激素应答启动子)、四环素“Tet-On”和“Tet-Off”系统和金属应答启动子。可将构建体转染入组织培养细胞或胚胎干细胞中产生转基因生物体作为模型对象。可通过在组织培养细胞诱导表达所述蛋白质并分析细胞增殖情况或在转基因动物模型中分析发育改变和/或肿瘤的生长而确定所述嵌合型锌指蛋白的功效。此外,可通过常规方法检测mRNA而分析靶基因的表达水平,例如RT-PCR或Northern印迹。更加完整的诊断包括自表达和不表达所述嵌合型锌指蛋白的细胞中纯化mRNA,将这两个mRNA库用于含有针对大量基因集合的探针的微阵列进行探查,所述基因集合例如是与感兴趣的情况(例如癌症)有关的基因的集合或者是在所述生物体基因组中鉴别出的基因的集合。该分析对于确定所述嵌合型锌指蛋白的特异性特别有价值。如果蛋白质具有高亲和力但特异性极低,其可能会通过影响除预期基因以外的其他基因的表达而引起多效性效应和非所欲的效应。可通过对转录产物进行全面分析而发现此类效应。
此外,可在对象细胞内或对象生物体内产生所述嵌合型锌指蛋白以便调节内源性基因。如上所述,嵌合型锌指蛋白被构建为可结合内源性基因的一个区域并提供转录激活或阻抑功能。如Kang和Kim(见上)所述,编码所述嵌合型锌指蛋白的核酸的表达可以可操纵地连接于一种可调节启动子(例如诱导型或抑制型启动子)。通过调节一种能够调节所述启动子的药剂的浓度,例如所述启动子的一种诱导物,可以浓度依赖性方式调节该内源性基因的表达。
可通过生化分析来验证锌指蛋白对结合位点的偏向性,例如通过EMSA、DNase足迹分析、表面等离子体共振、SELEX或柱结合。用于结合的底物可以是,例如涵盖靶位点或限制性片段的合成的寡核苷酸。该分析还可包括将非特异性DNA作为竞争剂或将特异性DNA序列作为竞争剂。特异性竞争剂DNA可包括用于结合DNA的具有1个、2个或3个核苷酸突变的识别位点。因此,生化分析不仅可用于测量一种结构域与一个特定位点的亲和力,也可用于测量相对于其他位点而言其与该位点的亲和力。Rebar和Pabo,(1994)Science 263:671-673描述了一种用于自EMSA获得锌指结构域的表观Kd常数的方法。典型的锌指蛋白对一个特定的识别位点所具有的偏向性,相对于具有1个、2个或3个核苷酸突变的有关位点来说,至少达到2、5、10、50、100或500倍。
也可在例如体外或体内评估在此所述的蛋白质或核酸的生物学活性,例如调节内皮细胞或调节血管发生的能力。
内皮细胞增殖。可使用生物学活性分析来测试蛋白质或核酸的内皮细胞增殖抑制活性,例如使用牛毛细血管内皮细胞增殖分析、鸡CAM分析、小鼠角膜分析,也可评估所测试的蛋白质或核酸对移植的肿瘤的作用。鸡CAM分析见例如O′Reilly等在“Angiogenic Regulation of MetastaticGrowth”Cell,vol.79(2),Oct.21,1994,pp.315-328中所述。简言之,自卵中分离具有完整卵黄的3天大的鸡胚并置于培养皿中。孵育3天后,将含有待测蛋白质的甲基纤维素盘加于各个胚胎的CAM。孵育48小时后,观察胚胎和CAM以确定内皮细胞生长是否被抑制。小鼠角膜分析涉及在小鼠角膜植入含生长因子的小球以及另一种含有疑似内皮细胞生长抑制剂的小球,并观察角膜上的复杂毛细血管的模式。
血管发生。可例如使用各种人类内皮细胞系统分析血管发生,例如使用脐静脉、冠状动脉或真皮细胞。合适的分析包括基于Alamar Blue的分析(来自Biosource International)来测定增殖;使用荧光分子的迁移分析,例如使用Becton Dickinson Falcon HTS FluoroBlock细胞培养物插入物以测量在存在或不存在血管发生增强剂或抑制剂的情况下细胞的跨膜迁移;以及基于内皮细胞在MatrigelTM(Becton Dickinson)上形成管状结构的小管形成分析。
细胞粘附。细胞粘附分析测量的是在存在或不存在待测蛋白质或核酸的情况下,细胞与纯化的粘附蛋白之间的粘附或细胞彼此之间的粘附。细胞-蛋白质粘附分析测量的是药剂调节细胞与纯化蛋白质的粘附的能力。例如,产生重组蛋白质,在PBS中稀释至2.5g/mL,并用于包被微滴定板的孔。用于阴性对照的孔没有包被。然后洗涤包被的孔,以1%BSA封闭,再次洗涤。将化合物稀释至终末测试浓度的2倍,并加至封闭的并洗涤过的孔中。然后将细胞加至这些孔中,并洗去未结合的细胞。通过加入膜透过性荧光染料在培养皿上对剩下的细胞进行标记,例如Calcein-AM,并使用荧光微滴定板阅读器进行定量。
细胞-细胞粘附分析可用于测量待测蛋白质或核酸的调节细胞彼此结合的能力。这些分析可使用天然表达或重组表达所选的粘附蛋白的细胞。在一个典型的分析中,将表达细胞粘附蛋白的细胞连同其他细胞(更低的同一种细胞类型或所述细胞与之粘附所另一种细胞类型)接种于多孔板中。以膜透过性荧光染料例如BCECF标记能够粘附的细胞,并在存在待测蛋白质或核酸的情况下使得细胞能够与单层发生粘附。洗去未结合的细胞,并使用荧光板阅读器来检测结合的细胞。高通量细胞粘附分析也已经被公开,例如见Falsey JR等Bioconjug Chem.May-June 2001;12(3):346-53。
小管形成(Tubulogenesis)。小管形成分析可用于监测培养细胞,通常是内皮细胞,在一般性模拟细胞外基质环境的基质底物上形成管状结构的能力。典型的基质底物包括MatrigelTM(Becton Dickinson),其是基底膜蛋白的一种提取物,含有层粘连蛋白、IV型胶原和肝素硫酸蛋白多糖,在4℃时为液体,在37℃时形成固态凝胶。其他合适的基质包括细胞外成分例如胶原蛋白、粘连蛋白和/或纤维蛋白。以促血管发生刺激物刺激细胞,并通过成像测定其形成小管的能力。通常在与刺激物孵育过夜后可检测到小管,但也可使用更长或更短的时间。管形成分析的方法时本领域已知的(例如Jones MK等,1999,Nature Medicine 5:1418-1423)。这些分析常规涉及以血清或以生长因子FGF或VEGF进行刺激。在一个实施方案中,以培养于无血清培养基中的细胞进行分析。在一个实施方案中,在存在一或多种促血管发生药剂的情况下进行分析,例如存在炎性血管发生因子如TNF-α或FGF、VEGF、乙酸肉豆蔻佛波醇(PMA)、TNF-α、ephrin、等等。
细胞迁移。内皮细胞迁移的典型分析是人微血管内皮细胞(HMVEC)迁移分析。见例如Tolsma等(1993)J.Cell Biol 122,497-511。迁移分析方法是本领域已知的(例如Paik JH等2001,J Biol Chem 276:11830-11837)。在一个实例中,将培养的内皮细胞接种于基质包被的多孔薄层上,其孔径通常小于一般细胞的大小。薄层通常是一种膜,例如Transwell聚碳酸酯膜(Corning Costar Corporation,Cambridge,Mass.),并且通常是上层小室的一部分,上层小室与含有促血管发生刺激物的下层小室之间通过液体相接触。通常在与刺激物孵育过夜后对迁移进行分析,但也可以使用更长或更短的时间。可以穿过薄层的细胞的数量来评估迁移,可通过以苏木精溶液(VWR Scientific.)染色细胞或通过任何测定细胞数的其他方法而检测。在另一个典型的方法中,将细胞进行荧光标记并通过荧光读数测定迁移,例如使用Falcon HTS FluoroBlok(BectonDickinson)。尽管在缺乏刺激物时可观察到一定程度的迁移,但促血管发生因子显著增强迁移。这种分析方法可用于测试待测蛋白质或核酸对内皮细胞迁移的影响。
芽生分析(Sprouting assay)。典型的芽生分析是一种三维体外血管发生分析,其使用了包埋于基于胶原蛋白凝胶的基质中的细胞数限定的球状聚集的内皮细胞(“球状体(spheroid)”)。球状体可作为一种起始点,毛细血管样结构通过侵入细胞外基质而芽生(称为“细胞芽生”),随后形成复杂的网状吻合(Korff和Augustin,1999,J Cell Sci 112:3249-58)。在一个典型的实验模型中,通过将400个人类脐静脉内皮细胞移入非粘附性96孔板的各个孔中,使之过夜形成球状聚集而制备球状体(Korff和Augustin:J Cell Biol 143:1341-52,1998)。收集球状体并接种于900μl的甲基纤维素-胶原蛋白溶液中,并移入24孔板的各个孔中以发生胶原蛋白凝胶聚合作用。30分钟后加入测试药剂,具体为将100μl的10倍浓度的测试物质的工作液加至凝胶上。将培养板在37℃孵育24小室。在实验孵育阶段的最后加入多聚甲醛以固定培养板。可通过自动化影像分析系统定量内皮细胞的芽生密度以确定每个球状体的累积芽生长度。
其他典型的的分析包括:Ferrara和Henzel(1989)Nature 380:439-443;Gospodarowicz等(1989)Proc.Natl.Acad.Sci.USA,86:7311-7315;和Claffey等(1995)Biochim.Biophys.Acta.1246:1-9.;Leung等(1989)Science 246:1306-1309;Rastinejad等(1989)Cell 56:345-355;和US 5,840,693。可例如采用大鼠后肢缺血模型(见例如Takeshita,S.等Circulation(1998)98:1261-63来评估一种组合物调节缺血的能力。
基因调节的靶位
靶基因可以是任何基因。例如染色体基因或异源性基因(例如转基因)。靶基因可以是选定的,例如如果调节(例如增强或减弱)靶基因的活性是有益的。例如,可阻抑病原体所需的基因,可阻抑癌细胞生长所需的基因,可激活或过表达那些弱表达的基因或编码不稳定蛋白的基因,可激活赋予应激抗性的基因,等等。
特异性靶基因的实例包括编码如下产物的基因:细胞表面蛋白(例如糖基化的表面蛋白)、癌相关性蛋白、细胞因子、趋化因子、肽类激素、神经递质、细胞表面受体(例如细胞表面受体激酶、七重跨膜受体、病毒受体和共受体、细胞外基质结合蛋白、细胞结合蛋白、病原体抗原(例如细菌抗原、疟原虫抗原,等等)。其他的蛋白靶位包括酶,例如烯醇酶、细胞色素P450、酰基转移酶、甲基化酶、TIM桶酶(TIM barrel enzymes)、异构酶、酰基转移酶、等等。
更多的实例包括:整联蛋白、细胞粘附分子或“CAM”(如钙粘附蛋白(cadherins)、选择素、N-CAM、E-CAM、U-CAM、I-CAM等等);蛋白酶(例如枯草杆菌蛋白酶、胰蛋白酶、糜蛋白酶;纤溶酶原激活物如尿激酶或人类组织型纤溶酶原激活物);蛙皮素(bombesin);因子IX、凝血酶;CD-4;血小板衍生的生长因子;胰岛素样生长因子-I和-II;神经生长因子;成纤维细胞生长因子(如aFGF和bFGF);表皮生长因子(EGF);VEGF(例如VEGF-A);转化生长因子(TGF例如TGF-α和TGF-β);胰岛素样生长因子结合蛋白;促红素;血小板生成素;粘液素;人血清白蛋白;生长激素(例如人生长激素);胰岛素原、胰岛素A链、胰岛素B链;甲状旁腺素;促甲状腺激素;甲状腺素;卵泡刺激素;降钙素;心钠肽A、B或C;促黄体生成激素;胰高血糖素;因子VIII;造血生长因子;肿瘤坏死因子(如TNF-α和TNF-β);脑啡肽酶;Mullerian抑制物;促性腺激素相关肽;组织因子蛋白;抑制素;Activin;血管内皮细胞生长因子;激素或生长因子受体;类风湿因子;骨诱导因子;干扰素如干扰素-α、β、γ;集落刺激因子(CSF),例如M-CSF、GM-CSF和G-CSF;白介素(IL),例如IL-1,IL-2,IL-3,IL-4,等等;衰变加速因子;和免疫球蛋白。在一些实施方案中,靶基因编码一种与疾病有关的蛋白或其他因子(例如RNA),所述疾病例如为癌症、感染性疾病、炎症或心血管疾病。
在一个实施方案中,建议是人类疾病基因。例如,基因包括编码缺陷型或弱化的酶的突变,或者基因在调节序列(例如转录、翻译或剪切调节序列)中可具有缺陷。可获得增强所述基因表达的锌指蛋白。
例如,锌指蛋白可设计为与FGF基因相互作用,例如与图2A-F所示序列中的结合位点相互作用,或与肝细胞生长因子(HGF)基因相互作用,例如与图3A-E所示序列中的结合位点相互作用。例如,所述蛋白可与这些基因的启动子区域相互作用。
调节任何基因的嵌合型锌指蛋白均可设计为与一或多个靶位点相互作用。例如,靶位点可位于基因的编码或非编码区域。在一个实施方案中,靶位点位于调节区域,例如转录调节区域,例如启动子。在一个实施方案中,靶位点位于转录起始位点、DNase高敏位点或转录因子结合位点的700、500、300、200、50、20、10、5或3个碱基对的范围内。在靶基因是VEGF-A的实施方案中,结合位点可不同于WO 02/46412表2或3中的位点(例如不与之重叠)。在另一个实施方案中,结合位点不与该位点重叠。
基于基因和细胞的治疗
可将编码嵌合型锌指蛋白的DNA插入用于基因治疗的各种DNA构建体和载体中。在此,“载体”是一种能够转运与之共价连接的另一种核酸分子的核酸分子。载体包括质粒、粘粒、人工染色体、病毒元件和RNA载体(例如基于RNA病毒基因组)。载体能够在宿主细胞中复制或整合入宿主DNA。病毒载体包括,例如复制缺陷型逆转录病毒、腺病毒和腺伴随病毒。
基因治疗载体是一种设计用于施用于对象的载体,例如哺乳动物,如此使得该对象的细胞能够表达该载体所含的治疗性基因。基因治疗载体可含有调节元件,例如5′调节元件、增强子、启动子、5′非翻译区、信号序列、3′非翻译区、聚腺苷酸化位点和3′调节区域。例如,5′调节元件、增强子或启动子可调节编码治疗性多肽的DNA的转录。调节可以是组织特异性的。例如,调节可将所需基因的转录限制于脑细胞,例如皮质神经元或神经胶质细胞;造血细胞;或内皮细胞。或者,可引入应答于外来药物的调节元件,所述药物例如为类固醇、四环素等等。因此,可控制治疗性锌指蛋白(例如调节VEGF的多肽)的表达水平和时序。
用于输送的基因治疗载体可被制备为裸核酸、病毒成分或灭活的病毒或脂质体成分或其他输送运载工具的形式。见例如US 2003-0143266和2002-0150626。在一个实施方案中,核酸被制成脂质-蛋白质-糖的基质以形成微颗粒,例如其直径在50nm至10微米之间。可使用任何已知的脂质(例如二棕榈酰卵磷脂,DPPC)、蛋白质(例如白蛋白)或糖(例如乳糖)来制备所述颗粒。
可通过病毒相同输送基因治疗载体。典型的病毒载体包括来自逆转录病毒的载体,例如Moloney逆转录病毒、腺病毒、腺伴随病毒和慢病毒,例如单纯疱疹病毒(HSV)。例如HSV可潜在用于感染神经系统细胞。见例如US2003-0147854,2002-0090716,2003-0039636,2002-0068362,和2003-0104626。可自产生建议输送系统的重组细胞制备基因输送剂例如病毒载体。
基因治疗载体可施用于对象,例如,通过静脉注射、局部施用(见美国专利5,328,470)或立体定向注射(stereotactic injection)(见例如Chen等(1994)Proc.Natl.Acad.Sci.USA 91:3054-3057)。基因治疗剂可进一步配制为,例如,通过缓释基质的方式用于减慢或延迟药剂的释放。提供重组锌指蛋白的一种方法是通过将基因治疗载体导入收集自对象的骨髓细胞中。例如以逆转录基因治疗载体感染这些细胞并培养于培养基中。同时,对对象进行照射以清除对象的骨髓细胞。然后给对象的骨髓补充感染的培养细胞。监测对象的恢复情况以及治疗性多肽的产生。
基于细胞的治疗方法包括将编码可操纵地连接于一种启动子的所述嵌合型锌指蛋白的核酸导入培养的细胞中。可选择嵌合型锌指蛋白以调节培养细胞的内源性基因或在培养细胞中产生所需的表型。进一步地,还可采用核酸重组技术修饰细胞,例如干细胞,例如插入转基因,例如编码调节内源性基因的嵌合型锌指蛋白的转基因。可将修饰的干细胞施用于对象。体外培养干细胞的方法见例如美国专利申请2002-0081724。在一些实例中,可诱导对象的干细胞进行分化并表达所述转基因。例如,干细胞可分化为肝细胞、脂肪细胞或骨骼肌细胞。干细胞可衍生自产生所需组织类型的细胞系列,例如肝细胞、脂肪细胞或骨骼肌细胞。
在另一个实施方案中,表达或能够表达例如在此所述的嵌合型锌指蛋白的重组细胞可用于在对象中进行替代治疗。例如,将编码可操纵地连接于启动子(例如诱导型启动子,例如类固醇激素受体调节启动子)的嵌合型锌指蛋白的核酸导入人的或非人类的,例如非人类哺乳动物例如猪的重组细胞。培养该细胞并将其包囊化于生物相容性材料中,例如聚赖氨酸藻酸盐,随后植入对象。见例如Lanza(1996)Nat.Biotechnol.14:1107;Joki等(2001)Nat.Biotechnol.19:35;和U.S.5,876,742。用于包囊化细胞的其他的生物相容性聚合物的实例包括,藻酸钠、藻酸钡或纤维素硫酸钠。有益的聚合物能够使得蛋白质(例如小于70、20或10kDa的蛋白质)扩散通过。超纯材料可提高包囊化的细胞的活力并减少免疫反应。包囊化的细胞,例如包括人工转录因子并能产生扩散因子的细胞,可用于对对象进行治疗以便为对象提供所述扩散因子。
一种用于包囊化细胞和组织的典型的方法涉及采用由非纤维形成型藻酸盐形成的涂覆层,该物质是一种来自某些海藻的凝胶状物质。例如,将细胞悬浮于粘稠的液态藻酸盐中,然后将其以任何方式自动制成小滴,其大小适合对细胞进行包囊化。一旦小滴与凝胶化溶液如氯化钙或氯化钡接触,即可在细胞周围形成单层的藻酸盐涂覆层。
采用静电涂覆法产生单层藻酸盐涂覆层的方法的实例见US4,789,550、US 4,956,128、US 5,429,821、US 5,639,467、US 5,656,468和US 5,693,514。采用气刀法产生单层藻酸盐涂覆层的实例见US 5,521,079。小滴加压涂覆法见US 5,260,002和US 5,462,866。采用纺锤盘设备产生单层藻酸盐涂覆层的实例见US 5,643,594和US 6,001,387。采用压电喷嘴产生单层藻酸盐涂覆层的实例见US 5,286,496、US 5,648,099和US6,033,888。US 5,470,731和US 5,531,997描述了组织双层涂覆层,其包括由可凝胶化有机聚合物和阳离子聚合物组成的第一层以及化学结合于该第一层的水溶性、半透层的第二层。US 6,020,200描述了一种双层涂覆层,其具有由交联的聚合物基质形成的稳定的外层。US 5,227,298(Weber等)描述了双层的藻酸盐涂覆层。
可通过手术(例如腹腔镜手术或常规手术方法)或注射植入包囊化的细胞。可将细胞导入任何适当的肌体部位,包括肝脏、脾脏、胸腺、睾丸、脑、胰腺、肺、肾脏、腹腔、皮下组织、脂肪垫和其他部位。见例如J.Rozga等Intraabdominal Organ Transplantation 2000;R.G.LandesCo.,USA,1994:129。
对于调节编码分泌蛋白的内源性基因的嵌合型锌指蛋白,可通过给对象施用一种药剂(例如类固醇激素)来调节分泌多肽的产生。在另一个实施方案中,锌指蛋白的产生可置于内源性信号的控制下,例如代表分泌蛋白水平低下的信号。因此,可使用人工反馈环。例如,信号可受到分泌蛋白本身的水平调节的转录因子介导。
包囊化细胞的其他方法见例如:U.S.4,391,909;US 2002-0022016;Lohr等(2002)Cancer Chemother Pharmacol,49:S21-S24;Hobbs等(2001)Journal of Investigative Medicine,vol.49,no.6,49(6):572-5;Zimmermann等(2001)Ann NY Acad Sci.2001;Moashebi等;Tissue Engineering,2001,vol.7,5,525-534);Orive等(2002)Trends in Biotechnology,vol.20,382-7;Lim和Sun(1980)Science 210:908-910;Reed等2001.Nature Biotech.19:29-34;Dornish等(2001)″Standards and guidelines for Biopolymers inTissue-Engineered Medical Products:ASTM Alginate and Chitosan StandardGuides.″AnnN YAcad Sci.2001;944:388-97。
在另一个实施方案中,在体外培养表达或能够表达嵌合型锌指蛋白的重组细胞。可自细胞或自细胞周围的培养基中收集由重组细胞产生的蛋白(例如纯化的蛋白)。在另一个实施方案中,重组细胞用作饲养细胞。
药物组合物
在另一方面,本发明提供了组合物,例如药物学可接受的组合物,其包括锌指蛋白或其编码核酸,例如在此所述的分子,并与药物学可接受的载体配制在一起。
在此,“药物学可接受的载体”包括任何和所有的生理学可接受的溶剂、分散介质、涂覆层、抗细菌和抗真菌药剂、等张剂和延迟吸收剂,等等。优选地,所述载体适合静脉、肌肉内、皮下、肠外、鞘内或表皮施用(例如通过注射或输注)。根据施用途径,活性化合物可包被于一种材料中以保护该化合物免于受到酸和其他可灭活该化合物的天然条件的灭活。
“药物学可接受的盐”指的是保持了母体化合物的生物学活性且没有增加任何非所欲的毒性作用的盐(见例如Berge,S.M.,等(1977)J.Pharm.Sci.66:1-19)。此类盐的实例包括酸加成的盐和碱加成的盐。酸加成的盐包括那些衍生自非毒性无机酸的盐,例如盐酸盐、硝酸盐、磷酸盐、硫酸盐、硼酸盐、碘酸盐、亚磷酸盐等等,以及衍生自那些非毒性有机酸的盐,例如单羧基和二羧基脂肪酸盐、苯基取代的烷链酸盐、羟基烷链酸盐、芳香族酸盐、脂肪族和芳香族磺酸盐,等等。碱加成的盐包括那些衍生自碱土金属的盐,例如钠盐、钾盐、镁盐、钙盐,等等,以及那些衍生自非毒性有机胺的盐,例如衍生自N,N′-联苄基乙二胺(N,N′-dibenzylethylenediamine)、N-葡甲胺、氯普鲁卡因、胆碱、二乙醇胺、乙二胺和普鲁卡因的盐,等等。
本发明的组合物可以是各种形式。这包括,例如,液体、半固体和固体剂型,例如液体溶液(例如注射和输注溶液)、分散体或混悬液、片剂、丸剂、粉剂、脂质体和栓剂。优选的形式取决于拟采用的施用形式和治疗用途。典型的组合物的形式为可注射或可输注溶液。一种施用形式是肠外(例如静脉、皮下、腹腔内、肌肉内)。在一个实施方案中,通过静脉输注或注射施用包括锌指蛋白或其编码核酸的组合物。在另一个实施方案中,通过肌肉或皮下注射施用包括锌指蛋白或其编码核酸的组合物。
“肠外施用”和“以肠外途径施用”在此是指除胃肠和局部施用以外的其他施用方式,通常是通过注射,且包括但不限于,静脉内、肌肉内、动脉内、鞘内、囊内、框内、心内、真皮内、腹腔内、气管内、皮下、表皮下、关节内、囊下、蛛网膜下腔、软膜内、硬膜外和胸骨内注射和输注。
药物组合物通常必须是无菌的,且在生产和存储条件下是稳定的。可采用鲎阿米巴样细胞裂解试验(Limulus amebocyte lysate assay)(试剂盒例如使用Bio Whittaker lot#7L3790,敏感性0.125EU/mL),根据USP24/NF 19的方法,测试制剂中的内毒素水平。可使用巯基醋酸盐培养基(thioglycollate medium),根据USP24/NF 19方法,测定药物组合物的无菌性。例如,将制剂接种于巯基醋酸盐培养基并在35℃孵育14或更多天。定期观察培养基以检测微生物的生长情况。
组合物可配制为溶液、微乳剂、分散体、脂质体或其他适合高药物浓度的有序结构。可通过将所需量的活性化合物(即所述锌指蛋白或其编码核酸)根据需要掺入到具有上述成分之一或其组合的适当的溶剂中,随后过滤除菌,由此制备无菌注射液。通常,通过将活性化合物掺入含有基本分散介质和其他上述成分的无菌载体中制备分散体。对于用于制备无菌注射溶液的无菌粉剂,优选的制备方法是真空干燥和冷冻干燥,这可得到活性成分的粉剂,再加上来自之前已经无菌过滤的溶液中的其他任何所需成分。可通过例如使用涂覆层,例如卵磷脂,通过维持分散体的所需颗粒大小,并通过使用表面活性剂,来保持溶液的适当的流动性。可通过在组合物中加入延迟吸收的药剂,例如,单硬脂酸盐和凝胶,以延长注射的组合物的吸收。
可通过本领域已知的各种方法施用包括锌指蛋白或其编码核酸的组合物。对多数用途来说,施用途径/方式是静脉注射或输注。例如,对于治疗用途,可通过静脉输注施用包括锌指蛋白或其编码核酸的组合物,输注速度为低于30、20、10、5或1mg/分钟,以使得剂量达到大约1至100mg/m2或7至25mg/m2。施用途径和/或方式依所需的结果而不同。在某些实施方案中,活性化合物可与一种保护该化合物免于快速释放的载体一同制备,例如作为控释制剂,包括植入体和微包囊化的输送系统。可使用生物可降解的、生物相容性聚合物,乙烯-醋酸乙烯脂、聚酐、聚羟基乙酸、胶原蛋白、聚原酸酯(polyorthoesters)和聚乙醇酸。多种制备此类制剂的方法是已经授予专利权的或熟知的。见例如Sustained andControlled Release Drug Delivery Systems,J.R.Robinson,ed.,MarcelDekker,Inc.,New York,1978。
在某些实施方案中,组合物可口服施用,例如与惰性稀释剂或可吸收的食用载体一同施用。也可将化合物(和其他成分,如果需要)纳入硬壳或软壳凝胶胶囊、压制成片剂或直接掺入对象的饮食中。对于口服治疗施用,可将化合物掺入赋形剂,并以可食用的片剂、含片、锭剂、胶囊、酏剂、混悬液、糖浆、干胶片等等形式使用。为了通过其他胃肠外途径施用在此所述的化合物,需要以防止其失活的材料包被该化合物或与之共同施用。
可采用本领域已知的医疗装置施用药物组合物。例如,在优选的实施方案中,所述药物组合物可以一种无针头皮下注射器进行施用,所述装置例如见美国专利No.5,399,163、5,383,851、5,312,335、5,064,413、4,941,880、4,790,824,或4,596,556。可用于本发明的熟知的植入体和模块的实例包括:美国专利No.4,487,603,公开了一种植入式微输液泵,可以受控的速度给药;美国专利No.4,486,194,公开了一种治疗装置,可经皮给药;美国专利No.4,447,233,公开了一种药物输液泵,用于以精确的输液速度给药;美国专利No.4,447,224,公开了一种可变流速植入式输液装置,用于连续输送药物;美国专利No.4,439,196,公开了一种渗透式药物输送系统,具有多腔隔室;和美国专利No.4,475,196,公开了一种渗透式药物输送系统。当然,许多其他此类植入体、输送系统和模块也是已知的。
在某些实施方案中,所述化合物的配制可保证其在体内的适当分布。例如,许多高度亲水性化合物无法透过血脑屏障(BBB)。为保证治疗剂可透过BBB(如果需要),可将其例如配制在脂质体中。生产脂质体的方法见例如U.S.4,522,811;5,374,548;和5,399,331。脂质体可包括一或多种基团,其可选择性转运入特定的细胞或器官内,由此增强靶向性药物输送(见例如V.V.Ranade(1989)J.Clin.Pharnlacol.29:685)。
调整剂量方案以产生最佳的所需反应(例如治疗反应)。例如,可施用单剂、随时间施用若干个分开的剂量、或随着治疗情况的需要将剂量成比例降低或增加。特别优选的是将胃肠外组合物配制成单位剂量的形式,以便于施用和统一剂量。单位剂量形式在此指的是物理学分开的单位,其适合作为给予治疗对象的单位剂量;每个单位含有一个预先确定量的、计算为用于产生所需治疗效应的活性化合物,以及所需的药物学载体。对单位剂量形式的说明可听从于并直接取决于(a)所述活性化合物的独特特性和要达到的具体治疗效应,以及(b)该活性化合物的复合在个体中的治疗敏感性方面的固有局限性。
所述组合物的治疗或预防有效量的典型的、非限制性范围是0.1-20mg/kg,更优选地为1-10mg/kg。可通过静脉输注施用所述组合物,速度低于30、20、10、5或1mg/分钟,以使得剂量达到大约1至100mg/m2或大约5至30mg/m2。也应该注意,剂量可随待治疗的情况的类型和严重程度而改变。还要理解,对于任何具体的对象,可根据个体的需要以及施用组合物或监测组合物的施用情况的人员的专业判断,随时调整具体的剂量方案,且在此所给出的剂量范围仅仅是典型的而不是限制性的。
药物组合物可包括“治疗有效量”或“预防有效量”的锌指蛋白或其编码核酸,例如在此所述的蛋白质或核酸。“治疗有效量”指的是,以必要的剂量和经过必要时间,有效达到所需治疗结果的量。组合物的治疗有效量可根据多种因素而不同,例如疾病状态、个体的年龄、性别和体重、以及该蛋白质在该个体中引发所需应答的能力。治疗有效量还是这样的一个量,即组合物的治疗有益作用胜于组合物的毒性或有害作用。“治疗有效剂量”是指,与未治疗的对象相比,其对一种可测量的参数(例如炎症或肿瘤生长速度)的抑制优选地达到至少大约20%,更优选地达到至少大约40%,甚至更优选地达到至少大约60%,还更加优选地达到至少大约80%。可在能够用于推测在人类肿瘤中的功效的动物模型系统中评估化合物抑制可测量参数例如癌症的能力。或者,可采用本领域人员已知的体外分析方法,通过测定所述化合物的抑制能力,来评估组合物在这方面的特性。
“预防有效量”指的是,以必要的剂量和经过必要时间,有效达到所需预防结果的量。典型地,由于预防剂量是在疾病之前或疾病早期用于对象,因此预防有效量应该低于治疗有效量。
本发明还包括试剂盒,其包括所述锌指蛋白或其编码核酸以及使用说明,例如治疗用、预防用或诊断用。在所述锌指蛋白调节VEGF-A基因的实施方案中,对治疗用途的说明包括在患有癌症或瘤形成(neoplasia)疾病或血管发生相关性疾病(例如某些炎症性疾病)的患者中的推荐剂量和/或施用方式。试剂盒还可含有至少一种额外的试剂,例如诊断剂或治疗剂,例如在此所述的诊断剂或治疗剂,和/或在一或多种分开的药物组合物中的、适当配制的一或多种额外的锌指蛋白或核酸。
治疗
可调节内源性基因的锌指蛋白,特别是可调节VEGF-A基因的蛋白,具有治疗和预防用途。例如,可将这些蛋白质或其编码核酸施用于培养的细胞,例如在体外或离体(ex vivo),或施用于对象,例如在体内,以治疗、预防和/或诊断各种疾病,例如癌症,特别是转移癌;炎症性疾病;以及其他与血管发生增强有关的疾病。
在此,术语“治疗”被定义为,将一种能够使得锌指蛋白进入细胞并调节基因表达的药剂应用于或施用于对象,例如患者,或将该药剂应用于或施用于来自对象的分离的组织或细胞,例如细胞系,所述对象例如为患者,其患有一种疾病(例如在此所述的疾病)、一种疾病的症状或一种疾病的易患倾向,目的为治愈、医治、减轻、缓解、改变、纠正、改善、使好转或影响该疾病、该疾病的症状或该疾病的易患倾向。
在一个实施方案中,“治疗细胞”或“治疗组织”指的是降低细胞的至少一种活性,例如VEGF-A产生、血管发生刺激、增殖或细胞的其他活性,所述细胞例如为高度增殖性细胞或组织如肿瘤内部或附近的细胞。此类降低可包括细胞或组织(例如转移癌)的活性或细胞的数量或组织的大小、组织血供的量或程度的降低,例如具有统计学显著意义的降低。活性降低的实例是细胞迁移(例如迁移通过细胞外基质)的降低、血管形成的减少、或细胞分化的降低。另一个实例是直接或间接降低炎症或炎症标志物的活性。
在此,有效治疗疾病的锌指蛋白或其编码核酸的量或“治疗有效量”指的是,经单剂或多剂施用于对象,可有效地治疗细胞的所述蛋白质或核酸的量。
在此,有效预防疾病的锌指蛋白或其编码核酸的量或所述蛋白质或核酸的“预防有效量”指的是所述锌指蛋白或其编码核酸的量,经单剂或多剂施用于对象,其可有效地预防或延迟疾病的出现或复发,所述疾病例如为癌症、基于血管发生的疾病、或炎症性疾病。
在此,术语“对象”意欲包括人类和非人类动物。典型的对象包括患有以细胞增殖或细胞分化异常为特征的疾病的人。术语“非人类动物”包括所有非人类脊椎动物,例如非哺乳动物(例如鸡、两栖类、爬行类动物)和哺乳动物,例如非人类灵长类、绵羊、狗、牛、猪,等等。
在一个实施方案中,所述对象是人类对象。在一个实施方案中,可将锌指蛋白或其编码核酸的组合物施用于非人类哺乳动物(例如灵长类动物、猪或小鼠),用于兽医学目的或作为人类疾病的动物模型。对于后者,此类动物模型可用于评估组合物的治疗功效(例如测试剂量和施用的时间过程)。
在一个实施方案中,本发明提供了治疗瘤形成疾病的方法。该方法的步骤可包括,将对象的细胞与如下量的例如在此所述的锌指蛋白或其编码核酸相接触,例如调节VEGF-A的锌指蛋白或其编码核酸,所述的量足以治疗或预防该瘤形成疾病。例如,该疾病可由癌细胞、肿瘤细胞或转移癌细胞引起。本方法可用于培养的细胞,例如在体外或离体。例如,癌细胞或转移癌细胞(例如肾脏、泌尿道上皮、结肠、直肠、肺、乳腺、子宫内膜、卵巢、前列腺或干燥的癌细胞或转移癌细胞)可体外培养于培养基中,并可通过向该培养基中添加所述锌指蛋白或其编码核酸而实现该接触步骤。该方法可在对象(例如人类对象)的细胞上进行(例如癌细胞或转移癌细胞),作为体内(例如治疗性或预防性)方案的一部分。对于体内实施方案,可在对象内实现接触步骤,并包括将所述锌指蛋白或其编码核酸在有效允许其对所述对象的细胞中的VEGF-A基因发生调节的情况下施用于对象。
该方法可用于治疗癌症。在此,术语“癌症”、“过度增殖性”、“恶性”和“肿瘤性”可相互替代使用,指的是那些细胞的一种异常状态或状况,其特征为快速增殖或肿瘤。上述术语包括所有类型的癌性生长或致瘤过程、转移癌组织或恶性转化的细胞、组织或器官,无论其组织病理学类型或进展阶段。“病理性过度增殖”细胞出现于特征为恶性肿瘤生长的疾病状态。
术语“瘤形成(neoplasia)”的通用医学含意指的是“新细胞生长”,其引起失去对正常生长调控的反应性,例如引起肿瘤性细胞生长。“过度增生”指的是细胞经历异常快速的生长。不过,在此,术语瘤形成和过度增生可相互替代使用,如其上下文所示,其一般性地指细胞有异常的细胞生长速度。瘤形成和过度增生包括“肿瘤”,其可以是良性的、恶性前期的或恶性的。
癌性疾病的实例包括,但不限于,实体瘤、软组织肿瘤和转移性病变。实体瘤的实例包括恶性肿瘤,例如各种器官系统的肉瘤、腺癌和癌,例如累及肺、乳腺、淋巴、胃肠道(例如结肠)、以及泌尿生殖道(例如肾、膀胱上皮细胞)、咽喉、前列腺、卵巢,以及腺癌,其包括恶性肿瘤,例如大多数结肠癌、直肠癌、肾细胞癌、肝癌、非小细胞肺癌、小肠癌等等。上述癌症的转移性病变也可使用所述的方法或组合物治疗或预防。
本方法可用于治疗各种器官系统的恶性肿瘤,例如累及肺、乳腺、淋巴、胃肠道(例如结肠)、以及泌尿生殖道、前列腺、卵巢、咽喉,以及腺癌,其包括恶性肿瘤,例如大多数结肠癌、肾细胞癌、前列腺和/或睾丸肿瘤、非小细胞肺癌、小肠癌和食道癌。术语“癌症”是本领域人员所公知的,其指的是上皮或内分泌组织的恶性肿瘤,包括呼吸系统癌症、胃肠道系统癌症、泌尿生殖系统癌症、睾丸癌、乳腺癌、前列腺癌、内分泌系统癌症以及黑色素瘤。典型的癌症包括绒癌和那些自宫颈、肺、前列腺、乳腺、子宫内膜、头颈部、结肠和卵巢等组织形成的癌。该术语也包括肉瘤,例如由癌性和肉瘤样组织组成的恶性肿瘤。“腺癌”指的是来源于腺组织的癌症或其中肿瘤细胞形成可辨认的腺样结构的癌症。术语“肉瘤”是本领域人员所公知的,其指的是间叶细胞来源的恶性肿瘤。
本方法叶可用于抑制表达VEGF-A的造血细胞来源的增生性/肿瘤性细胞的增殖。
施用锌指蛋白或核酸的方法见“药物组合物”部分所述。施用的分子的合适剂量取决于对象的年龄和体重以及所用的具体药物。
锌指蛋白或其编码核酸可偶联于标记物,例如用于在输送至对象后进行成像。合适的标记物包括MRI可检测的标记物或放射性标记物。
在此所述的锌指蛋白或其编码核酸可单独施用或与一或多种现有的治疗癌症的方案组合施用,包括但不限于:手术、放疗和化疗。
锌指蛋白或其编码核酸,特别是能够调节VEGF-A基因(例如降低其表达)的锌指蛋白或其编码核酸,可单独施用或与一或多种现有的治疗炎症性疾病或病症的方案组合施用。典型的炎症性疾病或病症包括:急、慢性免疫和自身免疫病理,例如但不限于,类风湿性关节炎(RA)、青少年慢性关节炎(JCA)、银屑病、移植物抗宿主病(GVHD)、硬皮病、糖尿病、过敏;哮喘、同种异基因移植相关性急性或慢性免疫病理,例如但不限于,肾移植、心脏移植、骨髓移植、肝移植、胰腺移植、小肠移植、肺移植和皮肤移植;慢性炎症性病理,例如但不限于,结节病、慢性炎症性肠病、溃疡性结肠炎和克隆氏病;血管炎性病理,例如但不限于,播散性血管内凝血、动脉硬化、川崎病和血管炎综合征,例如但不限于,结节性多动脉炎、Wegener肉芽肿、Henoch-Schonlein紫癜、巨细胞关节炎和肾脏的显微镜下血管炎;慢性活动性肝炎;干燥综合征;牛皮癣关节炎;肠病性关节炎;反应性关节炎以及炎性肠病相关性关节炎;和葡萄膜炎。
炎性肠病(IBD)大体上包括慢性、复发性肠炎。IBD指的是两种不同的疾病克隆氏病和溃疡性结肠炎(UC)。IBD的临床症状包括间歇性便血、痉挛性腹痛、体重下降和腹泻。临床指标也可用于监测IBD,例如Clinical Activity Index for Ulcerative Colitis。参见例如Walmsley等Gut.1998 Jul;43(1):29-32和Jowett等(2003)Scand J Gastroenterol.38(2):164-71。
锌指蛋白或其编码核酸也可用于治疗或预防前述疾病或病症中的一种。例如,可(局部或全身)施用其量可有效减轻相应疾病或病症的至少一种症状的蛋白质。所述蛋白质可减轻炎症,例如一种炎症表现,例如局部温度、肿胀(例如根据测量)、发红、局部或全身白细胞计数、存在或不存在中性粒细胞、细胞因子水平,等等。可在例如施用所述蛋白质之前、过程中或之后,评估患者的一或多种炎症表现,例如上述表现。
锌指蛋白或其编码核酸,特别是能够调节VEGF-A基因(例如增强其表达)的锌指蛋白或其编码核酸,可单独施用或与一或多种现有的治疗创伤的方案组合施用,例如用于促进伤口愈合。例如,通常,VEGF-A的激活可使得新血管和毛细血管的形成增加。所述蛋白质或核酸还可用于减轻手术、烧伤、外伤、溃疡、骨折以及其他需要增强血管发生的疾病。
锌指蛋白或其编码核酸,特别是能够调节VEGF-A基因(例如增强其表达)的锌指蛋白或其编码核酸,可单独施用或与一或多种现有的治疗心血管疾病的方案组合施用,例如缺血性心脏病、外周动脉疾病或冠状动脉疾病。
下面将通过以下实施例对本发明作出更加具体的描述。不过,应该理解的是,这些实施例并非意在限制本发明的范围。
实施例1:凝胶迁移分析
本实施例提供了一种用于体外评估锌指蛋白的DNA结合特性的方法。在大肠杆菌中表达锌指蛋白,纯化后用于凝胶迁移分析。将编码锌指蛋白的DNA片段插入pGEX-4T2(Pharmacia Biotech)。在大肠杆菌菌株BL21中表达这些菌株以产生融合蛋白,其包括连接于GST(谷胱甘肽-S-转移酶)的锌指蛋白。使用谷胱甘肽亲和层析(Pharmacia Biotech,Piscataway,NJ)纯化融合蛋白,然后以凝血酶消化。凝血酶在GST部分和锌指蛋白之间裂解接头序列。
将不同量的锌指蛋白与放射性标记的探针DNA在室温下在20mMTris pH 7.7,120mM NaCl,5mM MgCl2,20μM ZnSO4,10%甘油,0.1%Nonidet P-40,5mM DTT,和0.10mg/mL BSA(牛血清白蛋白)中孵育1小时,然后将反应混合物进行凝胶电泳。通过PHOSPHORIMAGETM分析(Molecular Dynamics)对探针在凝胶中的分布进行定量。测定解离常数(Kd)(参见Rebar和Pabo(1994)Science 263:671-673)。
我们先前已经发现,在体内酵母分析中起作用的锌指蛋白也具有生化活性。一般来说,当锌指蛋白,例如具有3个锌指结构域的锌指蛋白,以低于1nM的解离常数结合于DNA序列时,其使得细胞能够在如US2002-0061512所述的酵母单杂交分析中生长,而当锌指蛋白以高于1nM的解离常数结合于DNA序列时,其不能使得细胞在该分析中生长。也可使用以高于1nM但低于50nM的解离常数结合的锌指蛋白。例如,可将其他的指添加到这些锌指中以产生更加紧密的或更加特异性的结合蛋白。
也可采用体外分析来评估一种单独的锌指结构域与一种特定的3或4个碱基对位点的结合。在一种实施方式中,在Zif268的指1和指2以及一种靶位点的情况中评估单独的锌指结构域,该靶位点包括(i)被指1和指2识别的碱基对和(ii)所述的特定的3个或4个碱基对位点。
实施例2:构建单独的3指蛋白
本实施例提供了一种用于构建编码嵌合型3指蛋白的核酸的方法。使用载体P3(Toolgen,Inc.)在哺乳动物细胞中表达嵌合型锌指蛋白。通过对pcDNA3载体(Invitrogen,San Diego CA)进行修饰而构建P3。将具有相容性突出端的合成的寡核苷酸双链体连接至经过HindIII和XhoI消化的pcDNA3载体中。该双链体含有编码血凝素(HA)标记的核酸和核定位信号。该双链体还包括BamHI、EcoRI和NotI以及BglII限制性位点和终止密码子。此外,通过使用XmaI进行消化破坏所得载体的SV40来源的XmaI位点,补平消化的限制性位点的突出末端,然后连接末端。
以下是一种典型的用于构建编码具有多个锌指结构域的嵌合型锌指蛋白的质粒的方法。首先,将编码一个单一锌指结构域的插入体插入一种携带编码一种单一锌指结构域的序列的载体(P3载体)。通过这种克隆得到编码具有两个锌指结构域的锌指蛋白的质粒。通过上述方法制备由两个锌指结构域组成的锌指结构域插入体,并将其克隆入具有1个或2个锌指结构域的AgeI/NotI线性化载体P3,以便得到含有由3个或4个锌指结构域组成的锌指蛋白基因的质粒。
然后将编码嵌合型锌指蛋白的基因克隆入预先处理的编码功能性结构域的质粒,例如p65转录激活结构域、Kid转录阻抑结构域、或KOX转录阻抑结构域。以EcoRI/NotI消化包括编码嵌合型锌指蛋白的基因的质粒,并将其连接至经同样的酶线性化的质粒。受体质粒(pLFD-p65、pLFD-KRAB、pLFD-KOX)中的克隆位点将编码锌指结构域的序列置于这样一种位置,使得由此产生的DNA结合区域位于功能性结构域的N端。所得的构建体编码一种蛋白质,其自N端至C端包括:HA-标记、核定位信号、锌指蛋白和功能性结构域。
实施例3:具有人类锌指结构域的3指蛋白的体外分析
采用一种体内表达分析来确定新的3指蛋白在体内是否具有功能。见例如,Kim和Pabo((1997)J Biol Chem 212:29795-29800)。该分析使用了一种萤光素酶报道分子构建体,其中靶位点位于与Kim和Pabo(见上)的构建体的Zif268位点的位置相当的位置处。
萤光素酶报道质粒构建自pΔS-modi,后者是一种改良型pGL3-TATA/Inr(Kim和Pabo,见上)。这些报道分子以萤火虫萤光素酶作为报道蛋白。自pΔS-modi中造成TATA盒上游的Sad位点的缺失。在转录起始位点之后插入新的Sad位点。为每一种不同的锌指蛋白制备不同的报道质粒。为了构建各种质粒,将含有推定为与特定的锌指蛋白相互作用的给定的9个碱基对结合位点的寡聚物插入质粒。以Sad和HindIII消化质粒pΔS-modi,并插入寡聚物。这一操作在自转录起始位点下游12个碱基对的位置替换了14个碱基对。将得到的报道质粒命名为p1G-ZFPID,其中ID是相应的锌指蛋白的名称。
对于一种特定的3指蛋白的体内活性分析是如下进行的。以如下4种质粒转染HEK 293细胞:14ng的表达所述特定的3指蛋白的质粒;14ng的上述报道质粒;70ng的表达GAL4-VP16的质粒;和1.4ng的表达Renilla萤光素酶的质粒。在不存在特定的3指蛋白的阻抑情况下,GAL4-VP16激活报道质粒中最小合成启动子的转录。将各种锌指蛋白的能力与其他3指蛋白进行比较。以表达Renilla萤光素酶的质粒作为转染效率的对照。
使用LIPOFECTAMINETM(Gibco-BRL)进行转染。当细胞在96孔板的孔中达到30-50%汇合时对细胞进行转染。将细胞孵育2天,然后收集用于进行萤光素酶分析。然后使用DUAL-萤光素酶报道分子分析系统(Promega)测定萤光素酶活性。采用观察到的Renilla萤光素酶的水平对观察到的萤火虫萤光素酶活性进行标准化。通过将在不存在锌指蛋白情况下的标准化的报道分子表达的值除以在存在锌指蛋白的情况下的标准化的报道分子表达的值来计算阻抑的程度或“阻抑倍数”。
如果在转染分析中锌指蛋白对转录造成至少2倍的阻抑,则此类锌指蛋白被分类为满足高严格性截断值,或者,如果在转染分析中锌指蛋白对转录造成1.5到2倍之间的阻抑,则此类锌指蛋白被分类为满足低严格性截断值。
实施例4:ZFP与其特异性报道分子的结合分析结果
运用凝胶迁移分析在体内分析中观察到的活性与结合亲和力之间建立关联。运用凝胶迁移分析和实施例3所述的转染分析来评估Zif268与各种靶序列的结合。在由凝胶迁移分析测定的解离常数与上述转染分析中的转录阻抑水平之间观察到了良好的关联。一般来说,以凝胶迁移分析测定,那些在转染分析中达到2倍以上的阻抑(即50%的阻抑)的锌指蛋白的解离常数低于1nM。
实施例5:表征3指蛋白
构建两种类型的“3指”嵌合型锌指蛋白。一类包括那些仅由野生型人类锌指结构域组成的嵌合型蛋白质,即与天然存在的人类锌指结构域相同的结构域。另一类包括那些包括与天然存在的锌指结构域不同的锌指结构域的嵌合型蛋白质。后一类锌指结构域通常通过对天然存在的锌指结构域进行体外诱变随后进行噬菌体展示筛选而鉴定。此类突变的结构域避免了自然进化的检验。
总共使用了36种锌指结构域、18种人类锌指结构域和18种突变的锌指结构域,组装了一组测试3指蛋白。关于突变的锌指结构域的报导见Choo和Klug(1994)Proc.Natl.Acad.Sci.USA 91:11168-11172;Desjarlais和Berg(1994)Proc.Natl.Acad.Sci.USA.91:11099-11103;Dreier等(2001)J Biol Chem.276:29466-29478;Dreier等(2000)J MolBiol.303:489-502;Fairall等(1993)Nature 366:483-487;Greisman和Pabo(1997)Science.275:657-661;Kim和Pabo(1997)J.Biol.Client.272:29795-29800;和Segal等(1999)Proc.Natl.Acad.Sci.USA 96:2758-2763。也见于US 2003-165997的表9。将编码36种结构域的核酸分别亚克隆入以EcoRI和NotI消化的P3载体,然后将得到的质粒用作构建嵌合型锌指蛋白的起始材料。
以两种不同的方法制备编码嵌合型3指蛋白的核酸。在第一种方法中,将编码所有锌指结构域的核酸随机混合,并随机选取3指构建体做进一步分析。对各个构建体进行测序以确定其编码的所述多肽的锌指结构域组成。随后,为各个随机分配的3指蛋白合成靶DNA序列。靶DNA序列基于推定的优选靶位点。将所述靶位克隆入上述萤光素酶报道分子载体。这一方法称为“锌指蛋白优先”法。
在第二种方法中,基于给定的靶DNA序列组装编码嵌合型3指蛋白的核酸。使用一种计算机运算法在锌指结构域的识别位点与靶DNA序列进行匹配。将已知基因的启动子序列用作输入靶DNA序列。筛选启动子序列以鉴别那些长度为9个核苷酸并且是可接受的靶位点的片段,以便由具有锌指结构域的集合的嵌合型3指蛋白进行识别。一旦识别,即可构建编码所述嵌合型3指蛋白的核酸。这一方法称为“靶位点优先”法。
在分析那些在碱基接触残基的第2位为天冬氨酸残基的锌指结构域时要特别考虑。此类锌指结构域包括RDER1、RDHT、RDNR、RDKR、RDTN、TDKR和NDTR。结合于DNA的Zif268的X射线共晶体结构显示,第2位的天冬氨酸可与锌指所识别的3-碱基对亚位点以外的一个碱基形成氢键。其结果是,在第2位含有天冬氨酸残基的RDER指更偏好4-碱基对位点:5′-GCG(G/T)-3′。计算机运算法解释了这一额外的特异性。随机组装的在第2位含有天冬氨酸且违反了这一4-bp位点原则的3指蛋白被排除在在此所述的其他分析以外。
总共以“锌指蛋白优先”和“靶位点优先”法构建了153种3指蛋白。采用实施例3所述的瞬时共转染分析对这些蛋白质进行测试。
153种嵌合型锌指蛋白中的31种表现出高于2倍的阻抑,高严格性标准(RF≥2;RF=阻抑倍数)。在完全由天然存在的人类锌指结构域构建的蛋白质中,28.1%(27/96)超过了高严格性标准,而59.4%超过了低严格性标准(RF≥1.5)。在由两种天然存在的锌指结构域和一种突变的结构域构建的蛋白质中,33.3%超过了高严格性标准,而仅有20%超过了低严格性标准。
相反,在由一种人类结构域和两种突变的结构域构建的17种蛋白质中,仅有一种蛋白质(5.9%)超过了高严格性标准,且仅有两种蛋白质(11.8%)超过了低严格性标准。引人注意的是,专门由突变结构域组成的锌指蛋白无一满足阻抑分析中的高严格性标准。仅有一种此类蛋白质(4%)满足低严格性标准。这些结果说明,与突变的结构域相比,天然存在的人类锌指结构域通常是构建新的DNA结合蛋白的更好的模块。
实施例6:设计出的结合VEGF-A基因的嵌合型锌指蛋白
在本实施例中,我们设计了结合人类血管内皮细胞生长因子A(VEGF-A)基因中的DNA元件的嵌合型锌指蛋白。扫描了VEGF-A启动子的-950至+450区域以鉴别那些适合于被3指构型的锌指结构域的现有组合所识别的具有9个核苷酸的位点。
我们构建了数个编码包括被设计为用于识别此类9个核苷酸位点的结构域的锌指蛋白的DNA构建体。在大肠杆菌中表达这些蛋白质并纯化。我们采用SELEX(Systematic Evolution of Ligands by EXponentialenrichment)实验评估了其DNA结合特异性。多种被设计用于导向VEGF-A启动子的锌指蛋白表现出具有预期的DNA结合特异性。几乎所有自SELEX分析得到的共有序列均与VEGF-A基因中的预期靶序列相同。一种典型的锌指蛋白,称为F121,其具有的共有序列与预期的靶序列在相应的锌指显示出碱基识别的简并性的位置具有一个碱基的差异。
通过将编码3种锌指结构域的核酸与编码p65或VP16激活结构域的核酸进行融合,产生包括具有这些人工锌指的DNA结合结构域的转录因子。将所得核酸插入表达质粒。
图4显示了VEGF-A启动子中由这些嵌合型锌指蛋白所识别的DNA结合位点的位置。人VEGF-A启动子含有至少两个DNase I高敏区域。遗传工程化的锌指蛋白转录因子与这些位点结合可激活VEGF-A基因的表达。F480被设计为识别位于大约-633R的位点(R代表反向链)。F475被设计为识别位于大约-455的位点。F435被设计为识别位于大约-391R的位点和位于大约-90R的位点。F83被设计为识别位于大约+359的位点。F121被设计为识别位于大约+434的位点。
我们发现,无论这些结合位点的位置如何,我们所测试的4种锌指蛋白(F480、F475、F121和F435)不仅激活了置于VEGF-A启动子控制下的萤光素酶报道分子基,同时也激活了内源性VEGF-A基因本身。对得自瞬时转染的细胞的培养基进行ELISA发现,这些嵌合型锌指蛋白还将VEGF-A蛋白的产生上调了13到21倍。
当将嵌合型锌指蛋白,F435和F121,分别融合于KRAB阻抑结构域时,它们分别积极地阻抑了HEK 293细胞中VEGF-A的表达。以亲代表达载体(其不含有锌指蛋白编码序列)转染的对照细胞的VEGF-A的mRNA或蛋白水平没有出现任何增强或减弱。
在这些实验中,蛋白质F83对VEGF-A mRNA或蛋白的水平没有显示出任何影响。这可能是由于其他蛋白质与靶位点或与局部染色质结构发生结合,这可能导致锌指蛋白难以到达靶DNA。在这些锌指蛋白引起的VEGF-A表达水平与其DNA结合亲和力或其在细胞中的表达水平之间没有绝对的相关性。
为了研究锌指蛋白在整个基因组范围的特异性,我们以293细胞系进行DNA微阵列实验,所述293细胞系已经稳定转染了编码以下3种锌指转录因子之一的DNA构建体:F121-p65、F435-p65和F475-VP16。在7458种基因中,51种基因受到所有3种锌指转录激活子蛋白的调节。49种的上调超过2倍,2种的下调超过2倍。所有这些受到共调节的基因看来均与VEGF-A功能密切相关。其中许多受VEGF-A调节,与血管发生或组织缺氧有关,或表达于血管内皮细胞。因此,这些基因很可能是VEGF-A表达的下游靶基因。此外,众多其他基因受到所述锌指蛋白激活子中的一或两种的调节,但并非受到所有3种测试蛋白质的调节。由于这些锌指蛋白识别9个碱基对位点,因此,这些锌指蛋白可能直接调节VEGF-A以外的基因,例如通过结合于其他基因中的相同的或相关的靶位点。构建4、5或6指蛋白质可提高特异性。总之,这些数据说明,通过对天然存在的锌指结构域进行重新组合而组装的所述锌指蛋白在细胞中可起到特定内源性基因的转录调节子的作用。
例如,在此所述的蛋白质可调节以下基因中的一或多种:jun B原癌基因(N94468)、EphA2(H84481)、EphB4(AI261660)、成纤维细胞生长因子受体3(软骨发育不全,致死性侏儒症)(AA419620)、FK506结合蛋白8(38kD)(N95418)、蛋白激酶C,zeta(AA458993)、v-erb-b2鸟类红白血病病毒癌基因同源物3(AA664212)、凝集素、半乳糖苷结合,可溶性,1(半乳糖凝集素1(galectin 1))(AI927284)、蛋白磷酸酶2、调节亚单位B(B56)、α异构体(R59165)、胰岛素样生长因子2(生长调节素A)(N54596)、网蛋白1、中等纤维结合蛋白,500kD(AA448400)、Periplakin(AI703487)、胆碱激酶(H09959)、胶原蛋白,VI型,α1(H99676)、连接相关性蛋白复合体1(adaptor-related protein complex 1)、σ1亚基(W44558)、抑制蛋白,β2(AW009594)、GATA-结合蛋白2(H00625)、细胞周期蛋白依赖性激酶抑制剂1A(p21,Cip1)(AI952615)、有丝分裂原激活的蛋白激酶激酶激酶11(R80779)、乙酰胆碱酯酶(YT血型)(AI360141)、脑特异性Na依赖性无机磷酸共转运蛋白(AA702627)、细胞维甲酸结合蛋白1(AA454702)、胞维甲酸结合蛋白2(AA598508)、钙粘附蛋白13、H-钙粘附蛋白(心脏)(R41787)、钙通道,电压依赖型,β3亚基(R36947)、碳酸酐酶XI(N52089)、肌钙蛋白T1,骨骼肌,慢(AA868929)、γ氨基丁酸(GABA)B受体,1(N70841)、腺苷酸环化酶激活多肽1(垂体)受体I型(H09078)、溶质转运家族4,阴离子交换,成员2(红细胞膜蛋白带3样1)(W45518)、磷脂酰肌醇蛋白聚糖1(AA455896)、蛋白C抑制剂(纤溶酶原激活剂抑制剂III)(W86431)、细胞周期蛋白依赖性激酶抑制剂1C(p57,Kip2)(AI828088)、锌指蛋白43(HTF6)(AA773894)、与小鼠Zfp-36同源锌指蛋白(R38383)、Meis(小鼠)同源物3(AA703449)、SWI/SNF相关性,基质相关性,肌动蛋白依赖性染色质调节子,亚家族d,成员3(AA053810)、()、未知(R11526)、未知(AA045731)、未知(T51849)、未知(T50498)、推定的基因产物(H09111)、B/K蛋白(H23265)、损害特异性DNA结合蛋白2(48kD)(AA410404)、二氢嘧啶酶样4(AA757754)、N-甲基嘌呤-DNA糖基化酶(N26769)、蛋白酪氨酸磷酸酶,受体类型,N(R45941)、成束和延长蛋白ζ1(fasciculation and elongationprotein zeta 1)(zygin I)(H20759)、羊毛甾醇合酶(2,3-氧化鲨烯羊毛甾醇环化酶)(AA437389)、()、()、亚精胺/精胺N1-乙酰转移酶(AA011215)、和具有血小板反应蛋白1型基序的解离素样和金属蛋白酶(Reprolysintype),1(T41173)。这些蛋白或其编码基因的表达可被调节至少0.5、1.0、2、5、10或50倍,例如,2倍和80倍之间。
VEGF启动子中的典型位点和识别这些位点的蛋白质包括:
表7:VEGF-A启动子位点(A)
蛋白质 位点 序列
F475 -455 GAG CGG GGA
F121 +434 TGG GGG TGA
F435 -90R GGG CGG GGA
F547 -665 AAT AGG GGG
F2825 +434 TGG GGG TGA
表8:VEGF-A启动子位点(B)
蛋白质 位点 序列
F480 -633R GGG TGG GGG
F435 -391R GGG TGG GGA
F2828 +435 GGG GGT GAC
F625 +435 GGG GGT GAC
F2830 +435 GGG GGT GAC
F2838 +435 GGG GGT GAC
表9:VEGF-A启动子位点(C)
蛋白质 位点 序列 SEQ ID NO:
F2604 -680 GTT TGG GAG GTC 76
F2605 -677 TGG GAG GTC AGA 77
F2607 -671 GTC AGA AAT AGG 78
F2615 -606 GCC AGA GCC GGG 79
F2633 -455 GAG CGG GGA GAA 80
F2634 -395R GGG GAG AGG GAC 81
F2636 -393R GTG GGG AGA GGG 82
F2644 -358R GGG GCA GGG GAA 83
F2646 -314R GAC AGG GCC TGA 84
F2650 -206 GGT GGG GGT CGA 85
F2679 +244R CAA GTG GGGAAT 86
表10:VEGF-A启动子位点(D)
蛋白质 位点 序列 SEQ ID NO:
F2610 -633R GGG TGG GGG GAG 87
F2612 -630R AGG GGG TGG GGG 88
F2638 -391R GGG TGG GGA GAG 89
表11:VEGF-A启动子位点(E)
蛋白质 位点 序列 SEQ ID NO:
F109 536B GAG CGA GCA GCG 90
F2608 -668 AGA AAT AGG GGG 91
F2611 -631R GGG GGT GGG GGG 92
F2617 -603 AGA GCC GGG GTG 93
F2619 -554 AGG GAA GCT GGG 94
F2623 -495 GTG GGT GAG TGA 95
F2625 -475 GTG TGG GGT TGA 96
F2628 -468 GTT GAG GGT GTT 97
F2629 -465 GAG GGT GTT GGA 98
F2630 -462 GGT GTT GGA GCG 99
F2634 -395R GGG GAG AGG GAC 100
F2635 -394R TGG GGA GAG GGA 101
F2637 -392R GGT GGG GAG AGG 102
F2642 -385R AGG GAC GGG TGG 103
F2643 -382R GAC AGG GAC GGG 104
F2648 -282R GAG GAG GGA GCA 105
F2651 -203 GGG GGT CGA GCT 106
F2653 -184R GAA GGG GAA GCT 107
F2654 -181R AAT GAA GGG GAA 108
F2662 -124R GCG GCT CGG GCC 109
F2667 -85 GGG CGG GCC GGG 110
F2668 -30R AAA AAA GGG GGG 111
F2673 +77 GCA GCG GTT AGG 112
F2682 +283R GGG GAA GTA GAG 113
F2689 +342 AGA GAA GTC GAG 114
F2697 +357 GAG AGA GAC GGG 115
F2699 +366 GGG GTC AGA GAG 116
F2703 -632R GGG GTG GGG GGA 117
F2702 +474R CAA GGG GGA GGG 118
构建锌指文库的酵母表达质粒
我们通过修饰pPC86(Chevray和Nathans(1992)Proc.Natl.Acad.Sci.USA 89:5789-5793)构建了编码锌指转录因子的表达质粒。将编码Zif268锌指蛋白的基因插入pPC86的SalI和EcoRI位点之间,以产生pPCFM-Zif,其中Gal4激活结构域融合于Zif268结构域。将pPCFM-Zif用作构建锌指文库的载体。为构建人的锌指文库,自人类基因组DNA扩增编码锌指的DNA片段,采用了聚合酶链反应(PCR)(Promega,Madison,WI)和具有His-Thr-Gly-Glu/Gln-Lys/Arg-Pro-Tyr/Phe序列的简并PCR引物混合物,该序列常见于天然存在的锌指蛋白的锌指连接部。SacII和AvaI消化编码锌指的100-bp PCR产物,并插入pPCFM-Zif,其编码杂合转录因子,该杂合转录因子由Zif268的指1和指2和来自人类基因组的锌指结构域组成(共同形成3指蛋白)。自总共1.2×106个大肠杆菌转化体制备质粒文库。
通过将64对含有3个拷贝的9-bp靶序列的互补的寡核苷酸之一插入pRS315(His)和pLacZi(Clontech,Palo Alto,CA)而制备了报道质粒。
缺口修复克隆选自人类基因组的人类锌指结构域
按照文献所述进行编码单个锌指结构域的DNA序列的缺口修复克隆(Hudson等(1997)Genome Res.7:1169-1173)。为克隆编码锌指的DNA片段,合成了两种重叠的寡核苷酸。每种寡核苷酸在其3′端包括一种用于第二轮PCR的21-bp的通用尾部,并包括一种可与编码所述单个锌指结构域的核酸序列退火的特异性序列。以等摩尔混合物的两种相应的寡核苷酸,自人类基因组DNA扩增编码锌指的DNA序列。
将第一轮PCR的扩增产物在第二轮PCR中用作模板。第二轮PCR的引物具有两个区域,其一与pPCFM-Zif的片段相同,而另一个与所述21-bp通用尾部相同。将第二轮PCR产物与经过MscI和EcoRI消化的线性化的pPCFM-Zif的混合物转化入yW1(MATαΔgal4 Δgal80 lys2801his3-Δ200 trp1-Δ63 leu2 ade2-101CYH2)酵母菌株。以这种方法克隆了总共823个人类锌指。其中许多均被用于在此所述的我们的体内筛选系统中。
锌指结构域的体内筛选
使用酵母杂交以便鉴别结合各个3碱基对靶位点的锌指。将锌指文库导入yW1(MATα)菌株,产生大约1.47×106个独立的转化酵母菌落。将测定用量的这些转化细胞与单倍体酵母菌株yW1a(MATa)在30℃杂交5小时,其在两组的每一组中均含有64种报道质粒(每种报道基因一种菌株)。报道质粒含有与LacZ或HIS3基因的编码区域邻近的3个拷贝的靶DNA序列。将得到的二倍体接种于选择培养基中,所述选择培养基含有X-gal(40μg/ml)和3-氨基三唑(3-AT)(1mM),但不含有组氨酸。对分离自蓝色(阳性)菌落的质粒进行再次转化以确认结果,并测序以鉴别其编码锌指结构域。在酵母中使用EMSA确定融合于Zif268的指1和指2的各个锌指的结合亲和力和特异性。方法如下所述。
将选定的锌指用作模块元件构建3指蛋白
使用修饰的pcDNA3(Invitrogen,Carlsbad,CA)载体(P3)作为用于在哺乳动物细胞中表达锌指蛋白的亲代载体。P3含有HA标记和核定位信号,两种均插入到起始密码子的3′。将编码各种锌指结构域的DNA片段亚克隆入P3载体的EcoRI和NotI位点之间,所得到的质粒用作构建嵌合型锌指蛋白的原料。通过两种不同的方法制备3指蛋白。在第一种方法中,混合所有的锌指并随机选择组装的3指构建体做进一步的分析。在第二种方法中,新的3指蛋白被设计为导向特异性DNA序列。为此,我们使用了一种简单的计算机运算法,其可发现锌指识别位点和靶DNA序列之间的匹配。我们使用已知基因的启动子序列作为输入DNA序列,并鉴别了3指蛋白,其应该结合于输入序列内部的9碱基对DNA元件。
以这种方法构建导向VEGF-A基因的锌指蛋白。测试构建的锌指蛋白在哺乳动物细胞中的DNA结合能力和亲和力,方法如文献所述。Kim和Pabo(1997)J.Biol.Chem.272,29795-29800;Kim和Pabo(1998)Proc.Natl.Acad.Sci.USA 95,2812-2817;和Kang和Kim(2000)J.Biol.Chem.275:8742-8748。使用携带萤火虫萤光素酶基因作为报道基因的pGL3-TATA/Inr构建用于分析的报道质粒。
为了将功能性结构域连接于锌指蛋白,使用特异性寡聚物对,通过PCR扩增p65(氨基酸288-548)和VP16(氨基酸413-490)的转录激活结构域,且将p65和VP16的PCR产物分别克隆入P3,以分别产生pLFD-p65和pLFD-VP16。将编码导向VEGF-A启动子的锌指蛋白的核酸插入pLFD-p65或VP16以表达锌指蛋白激活结构域(AD)融合蛋白(ZFP-AD)。进行实时PCR、ELISA和微阵列分析以确定这些ZFP-AD是否激活VEGF-A基因。此外,进行SELEX以测试这些蛋白是否识别适当的靶DNA序列。如下述。
人类锌指结构域的结合亲和力和特异性
自蓝色酵母菌落分离的质粒(见标题为“锌指结构域的体内筛选”一节)单独转化入yW1细胞。对于各个分离的质粒,将再次转化的yW1细胞与yW1a细胞杂交,yW1a细胞含有64种LacZ报道质粒中的每一种。然后将得到的细胞接种于含有X-gal和组氨酸但缺乏色氨酸和尿嘧啶的最基本培养基中。我们使用GEL-DOCTM系统(Bio-Rad,Hercules,CA)测量了各个菌落的蓝色的强度,以确定融合于Zif268的指1和指2的各种锌指结构域的DNA结合亲和力和特异性。以Zif268蛋白进行的对照实验表明,锌指结构域与LacZ报道基因的启动子的靶结合位点之间的阳性相互作用产生深蓝色至浅蓝色的菌落(兰色的强度与结合亲和力成正比),而阴性相互作用产生白色菌落。
电泳迁移率改变分析(EMSA)
通过以SalI和NotI进行消化而分离编码锌指蛋白的DNA片段,并插入pGEX-4T2(Amersham Pharmacia,Uppsala,Sweden)。将锌指蛋白作为连接于谷胱甘肽-S-转移酶(GST)的融合蛋白在大肠杆菌菌株BL21(DE3)中进行表达。以谷胱甘肽亲和层析(Amersham Pharmacia)纯化融合蛋白,然后以凝血酶消化。这一裂解切断GST部分和锌指蛋白之间的连接。在这种情况下,纯化的锌指蛋白含有融合于位置3上的选定的锌指的C端的Zif268的指1和指2。合成探针DNA,退火,使用T4多核苷酸激酶以32p标记,如文献所述进行EMSA。Kim和Pabo(1997)J.BiolChem.272,29795-29800和Kim和Pabo(1998)Proc.Natl.Acad.Sci.USA95,2812-2817。可使用相同的过程测试其他锌指蛋白。
内源性VEGF的转录调节
人胚肾293细胞培养于Dulbecco′s modified Eagle medium(DMEM),培养基添加了100单位/ml青霉素,100μg/ml链霉素,和10%胎牛血清(FBS)。对于萤光素酶分析,将细胞以104细胞/孔在96孔板中进行预培养。使用LIPOFECTAMINETM转染试剂盒(Lif Technologies,Rockville,MD),以25ng的报道质粒和25ng的编码锌指蛋白的质粒转染293细胞,在所述报道质粒中,天然的VEGF-A启动子融合于pGL3-basic(Promega)中的萤光素酶基因。孵育48小时后,以DUAL LUCIFERASETM试剂盒(Promega),使用TD-20/20光度计(Turner Designs Inc.,Sunnyvale,CA)测量萤光素酶活性。
为进行逆转录酶-PCR(RT-PCR)分析和ELISA,在12孔板中,将细胞以105细胞/孔在1ml的培养基(添加了10%FBS但不含抗生素)中、在含有5%CO2的湿润空气中、在37℃预培养24小时。然后使用LIPOFECTAMINETM转染试剂盒(Lif Technologies)以DNA转染细胞。简言之,在总体积50μl的DMEM中,将1μg编码锌指蛋白的质粒添加到5μl Plus试剂,然后将该溶液与50μl的另一种含有2μlLIPOFECTAMINETM试剂的DMEM混合。孵育15分钟后,将全部100μl的混合物添加到培养板中的细胞内,然后将细胞再培养48小时。收集细胞和培养物上清液用于RT-PCR分析和ELISA。
定量RT-PCR
根据生产商(Life Technologies)的说明,自TRIZOLTM裂解液提取细胞总RNA。以4μg总RNA进行逆转录反应,以寡dT作为针对mRNA的第一链合成引物,并使用了SUPERSCRIPTTM第一链合成系统(LifeTechnologies)提供的MMLV逆转录酶。为定量mRNA,以VEGF-A-特异性引物扩增1μl自RT反应产生的第一链cDNA。通过使用甘油醛-3-磷酸脱氢酶(glyceraldehydes-3-phosphatedehydrogenase(GAPDH))特异性引物的特异性扩增而计算出的GAPDH mRNA浓度对RNA的最初量进行标准化。以QUANTITECT SYBRTM试剂盒(QIAGEN,Valencia,CA)和ROTORGENETM 2000实时循环仪(Corbett,Sydney,Australia)对VEGF-A和GAPDH特异性cDNA的扩增进行实时监测并分析,并使用反应中所包括的标准系列稀释物随其进行定量。
ELISA
将肾293细胞培养物上清液简单离心5分钟以去除细胞和细胞碎片。使用三明治ELISA(酶联免疫吸附试验)来分析培养基(各100μl)中积聚的VEGF蛋白和重组人VEGF-A蛋白标准的稀释液,其中与所述培养物上清液发生反应的是抗人VEGF抗体(R&D systems;AF-293-NA)、生物素酰化的抗人VEGF抗体(R&D systems;BAF293)、链霉抗生物素蛋白碱性磷酸酶。抗原抗体复合物与溶解于pNPP缓冲液(Chemicon;ES011)中的pNPP(对硝基苯磷酸酯)反应。通过以POWERWAVETMX340(Bio-TEK Instrument Inc.,Winooski VT)所测量的405mn处的吸光度确定样品中的VEGF-A浓度。
对稳定表达锌指蛋白的FIpTRex-293细胞系DNA微阵列分析
将编码被设计为导向VEGF-A启动子的ZFP的质粒稳定转染入FlpTRex-293细胞系(Invitrogen),基本上按照生产商的方案。简言之,来自pLFD-p65载体或pLFD-VP16载体的含有编码锌指蛋白的DNA片段的HindIII-XhoI片段被克隆入pCDNA5/FRT/TO(Invitrogen)。将所得质粒与pOG44(Invitrogen)共转染入FlpTRex-293细胞,并筛选稳定整合体。得到的细胞系经强力霉素诱导后表达ZFP-p65或ZFP-VP16。
含有7458种人表达序列标记(EST)克隆的DNA微阵列由GenomicTree,Inc.(Taejon,Korea)提供。稳定表达ZFP-p65或ZFP-VP16的FlpTRex-293细胞在含有(+Dox)或不含有(-Dox)1μg/ml强力霉素的情况下孵育48小时。自各个样品制备总RNA。将来自一种-Dox样品的RNA用作参照(Cy3)。按照生产商的方案进行微阵列实验。
装配的锌指蛋白的SELEX分析
设计一种模板寡核苷酸,其含有一种随机的20个核苷酸区域,该区域的两侧为固定序列。此外,设计两种与所述模板寡核苷酸的固定区域互补的引物,用于PCR扩增。通过Klenow片段自引物之一进行延伸,将所述模板寡核苷酸转变为双链DNA。为了富集由锌指蛋白结合的靶序列,将100μg GST-融合蛋白与10pmol双链模板DNA在100μl的结合缓冲液(25mM Hepes pH7.9,40mM KCl,3mM MgCl2,1mM DTT)中在室温混合1小时。然后将GST-树脂(10μl)添加到混合物中。室温孵育30分钟后,以含有2.5%脱脂乳的结合缓冲液洗涤该树脂3次。
通过将树脂与100μl的1M KCl在室温孵育10分钟而使得结合的双链模板寡聚物发生解离。对收集的双链模板寡聚物进行PCR扩增后,重复进行新一轮的SELEX。这一过程被重复8次。以XhaI和BamHI消化终PCR产物,并插入至经过同样的酶消化的pBLUESCRIPTTMKS中。确定每种锌指蛋白的至少8种单独的插入体的DNA序列。
实施例7:典型的蛋白质的序列
以下是可调节VEGF-A的典型蛋白质的DNA结合区域的氨基酸序列:
表12:典型蛋白质的DNA结合结构域的氨基酸序列
名称 氨基酸序列 SEQ ID
NO:
F475 YKCGQCGKFY SQVSHLTRHQ KIHTGEKPFQ CKTCQRKFSR 20
SDHLKTHTRT HTGEKPYICR KCGRGFSRKS NLIRHQRTHT GEK
F121 YKCEECGKAF RQSSHLTTHK IIHTGEKPYK CMECGKAFNR 21
RSHLTRHQRI HTGEKPFQCK TCQRKFSRSD HLKTHTRTHT GEK
F435 YKCGQCGKFY SQVSHLTRHQ KIHTGEKPFQ CKTCQRKFSR 22
SDHLKTHTRT HTGEKPYKCM ECGKAFNRRS HLTRHQRIHT GEK
F547 YKCMECGKAF NRRSHLTRHQ RIHTGEKPFQ CKTCQRKFSR 23
SDHLKTHTRT HTGEKPYECD HCGKAFSVSS NLNVHRRIHT GEK
F2825 YECDHCGKSF SQSSHLNVHK RTHTGEKPFL CQYCAQRFGR 24
KDHLTRHMKK SHTGEKPFQC KTCQRKFSRS DHLKTHTRTH TGEK
F480 YKCMECGKAF NRRSHLTRHQ RIHTGEKPFQ CKTCQRKFSR 25
SDHLKTHTRT HTGEKPYKCM ECGKAFNRRS HLTRHQRIHT GEK
F2828 YKCKQCGKAF GCPSNLRRHG RTHTGEKPYR CEECGKAFRW 26
PSNLTRHKRI HTGEKPFLCQ YCAQRFGRKD HLTRHMKKSH TGEK
F625 YKCKQCGKAF GCPSNLRRHG RTHTGEKPYR CEECGKAFRW 27
PSNLTRHKRI HTGEKPYKCM ECGKAFNRRS HLTRHQRIHT GEK
F2830 YRCKYCDRSF SDSSNLQRHV RNIHTGEKPY RCEECGKAFR 28
WPSNLTRHKR IHTGEKPFLC QYCAQRFGRK DHLTRHMKKS
HTGEK
F2838 YRCKYCDRSF SDSSNLQRHV RNIHTGEKPY RCEECGKAFR 29
WPSNLTRHKR IHTGEKPYKC MECGKAFNRR SHLTRHQRIH TGEK
F2604 YSCGICGKSF SDSSAKRRHC ILHTGEKPYI CRKCGRGFSR 30
KSNLIRHQRT HTGEKPFQCK TCQRKFSRSD HLKTHTRTHT
GEKPYTCKQC GKAFSVSSSL RRHETTHTGE K
F2605 YKCEECGKAF RQSSHLTTHK IIHTGEKPYS CGICGKSFSD 31
SSAKRRHCIL HTGEKPYICR KCGRGFSRKS NLIRHQRTHT
GEKPFQCKTC QRKFSRSDHL KTHTRTHTGE K
F2607 FQCKTCQRKF SRSDHLKTHT RTHTGEKPYE CDHCGKAFSV 32
SSNLNVHRRI HTGEKPYKCE ECGKAFRQSS HLTTHKIIHT
GEKPYSCGIC GKSFSDSSAK RRHCILHTGE K
F2615 YKCMECGKAF NRRSHLTRHQ RIHTGEKPYT CSDCGKAFRD 33
KSCLNRHRRT HTGEKPYKCE ECGKAFRQSS HLTTHKIIHT
GEKPYTCSDC GKAFRDKSCL NRHRRTHTGE K
F2633 YECEKCGKAF NQSSNLTRHK KSHTGEKPYK CGQCGKFYSQ 34
VSHLTRHQKI HTGEKPFQCK TCQRKFSRSD HLKTHTRTHT
GEKPYICRKC GRGFSRKSNL IRHQRTHTGE K
F2634 YKCKQCGKAF GCPSNLRRHG RTHTGEKPFQ CKTCQRKFSR 35
SDHLKTHTRT HTGEKPYICR KCGRGFSRKS NLIRHQRTHT
GEKPYKCMEC GKAFNRRSHL TRHQRIHTGE K
F2636 YKCMECGKAF NRRSHLTRHQ RIHTGEKPYK CEECGKAFRQ 36
SSHLTTHKII HTGEKPYKCM ECGKAFNRRS HLTRHQRIHT
GEKPYVCDVE GCTWKFARSD ELNRHKKRHT GEK
F2644 YECEKCGKAF NQSSNLTRHK KSHTGEKPYK CMECGKAFNR 37
RSHLTRHQRI HTGEKPYKCP DCGKSFSQSS SLIRHQRTHT
GEKPYKCMEC GKAFNRRSHL TRHQRIHTGE K
F2646 YKCEECGKAF RQSSHLTTHK IIHTGEKPYT CSDCGKAFRD 38
KSCLNRHRRT HTGEKPFQCK TCQRKFSRSD HLKTHTRTHT
GEKPYKCKQC GKAFGCPSNL RRHGRTHTGE K
F2650 YKCEECGKAF RQSSHLTTHK IIHTGEKPYR CEECGKAFRW 39
PSNLTRHKRI HTGEKPYKCM ECGKAFNRRS HLTRHQRIHT
GEKPYRCEEC GKAFRWPSNL TRHKRIHTGE K
F2679 YECDHCGKAF SVSSNLNVHR RIHTGEKPYK CMECGKAFNR 40
RSHLTRHQRI HTGEKPYVCD VEGCTWKFAR SDELNRHKKR
HTGEKPYVCS KCGKAFTQSS NLTVHQKIHT GEK
F2610 YICRKCGRGF SRKSNLIRHQ RTHTGEKPYK CMECGKAFNR 41
RSHLTRHQRI HTGEKPFQCK TCQRKFSRSD HLKTHTRTHT
GEKPYKCMEC GKAFNRRSHL TRHQRIHTGE K
F2612 YKCMECGKAF NRRSHLTRHQ RIHTGEKPFQ CKTCQRKFSR 42
SDHLKTHTRT HTGEKPYKCM ECGKAFNRRS HLTRHQRIHT
GEKPFQCKTC QRKFSRSDHL KTHTRTHTGE K
F2638 YICRKCGRGF SRKSNLIRHQ RTHTGEKPYK CGQCGKFYSQ 43
VSHLTRHQKI HTGEKPFQCK TCQRKFSRSD HLKTHTRTHT
GEKPYKCMEC GKAFNRRSHL TRHQRIHTGE K
F109 YVCDVEGCTW KFARSDELNR HKKRHTGEKP YKCPDCGKSF 44
SQSSSLIRHQ RTHTGEKPYK CEECGKAFRQ SSHLTTHKII
HTGEKPYICR KCGRGFSRKS NLIRHQRTHT GEK
F2608 YKCMECGKAF NRRSHLTRHQ RIHTGEKPFQ CKTCQRKFSR 45
SDHLKTHTRT HTGEKPYECD HCGKAFSVSS NLNVHRRIHT
GEKPYKCEEC GKAFRQSSHL TTHKI IHTGE K
F2611 YKCMECGKAF NRRSHLTRHQ RIHTGEKPYK CMECGKAFNR 46
RSHLTRHQRI HTGEKPYRCE ECGKAFRWPS NLTRHKRIHT
GEKPYKCMEC GKAFNRRSHL TRHQRIHTGE K
F2617 YVCDVEGCTW KFARSDELNR HKKRHTGEKP YKCMECGKAF 47
NRRSHLTRHQ RIHTGEKPYT CSDCGKAFRD KSCLNRHRRT
HTGEKPYKCE ECGKAFRQSS HLTTHKIIHT GEK
F2619 YKCMECGKAF NRRSHLTRHQ RIHTGEKPYE CNYCGKT FSV 48
SSTLIRHQRI HTGEKPYECE KCGKAFNQSS NLTRHKKSHT
GEKPFQCKTC QRKFSRSDHL KTHTRTHTGE K
F2623 YKCEECGKAF RQSSHLTTHK IIHTGEKPYI CRKCGRGFSR 49
KSNLIRHQRT HTGEKPYRCE ECGKAFRWPS NLTRHKRIHT
GEKPYVCDVE GCTWKFARSD ELNRHKKRHT GEK
F2625 YKCEECGKAF RQSSHLTTHK IIHTGEKPYR CEECGKAFRW 50
PSNLTRHKRI HTGEKPFQCK TCQRKFSRSD HLKTHTRTHT
GEKPYVCDVE GCTWKFARSD ELNRHKKRHT GEK
F2628 YTCKQCGKAF SVSSSLRRHE TTHTGEKPYR CEECGKAFRW 51
PSNLTRHKRI HTGEKPYICR KCGRGFSRKS NLIRHQRTHT
GEKPYTCKQC GKAFSVSSSL RRHETTHTGE K
F2629 YKCGQCGKFY SQVSHLTRHQ KIHTGEKPYT CKQCGKAFSV 52
SSSLRRHETT HTGEKPYRCE ECGKAFRWPS NLTRHKRIHT
GEKPYICRKC GRGFSRKSNL IRHQRTHTGE K
F2630 YVCDVEGCTW KFARSDELNR HKKRHTGEKP YKCGQCGKFY 53
SQVSHLTRHQ KIHTGEKPYT CKQCGKAFSV SSSLRRHETT
HTGEKPYRCE ECGKAFRWPS NLTRHKRIHT GEK
F2635 YKCGQCGKFY SQVSHLTRHQ KIHTGEKPYI CRKCGRGFSR 55
KSNLIRHQRT HTGEKPYKCG QCGKFYSQVS HLTRHQKIHT
GEKPFQCKTC QRKFSRSDHL KTHTRTHTGE K
F2637 FQCKTCQRKF SRSDHLKTHT RTHTGEKPYI CRKCGRGFSR 56
KSNLIRHQRT HTGEKPYKCM ECGKAFNRRS HLTRHQRIHT
GEKPYRCEEC GKAFRWPSNL TRHKRIHTGE K
F2642 FQCKTCQRKF SRSDHLKTHT RTHTGEKPYK CMECGKAFNR 57
RSHLTRHQRI HTGEKPYKCK QCGKAFGCPS NLRRHGRTHT
GEKPFQCKTC QRKFSRSDHL KTHTRTHTGE K
F2643 YKCMECGKAF NRRSHLTRHQ RIHTGEKPYK CKQCGKAFGC 58
PSNLRRHGRT HTGEKPFQCK TCQRKFSRSD HLKTHTRTHT
GEKPYKCKQC GKAFGCPSNL RRHGRTHTGE K
F2648 YKCPDCGKSF SQSSSLIRHQ RTHTGEKPYK CGQCGKFYSQ 59
VSHLTRHQKI HTGEKPYICR KCGRGFSRKS NLIRHQRTHT
GEKPYICRKC GRGFSRKSNL IRHQRTHTGE K
F2651 YECNYCGKTF SVSSTLIRHQ RIHTGEKPYK CEECGKAFRQ 60
SSHLTTHKII HTGEKPYRCE ECGKAFRWPS NLTRHKRIHT
GEKPYKCMEC GKAFNRRSHL TRHQRIHTGE K
F2653 YECNYCGKTF SVSSTLIRHQ RIHTGEKPYE CEKCGKAFNQ 61
SSNLTRHKKS HTGEKPYKCM ECGKAFNRRS HLTRHQRIHT
GEKPYECEKC GKAFNQSSNL TRHKKSHTGE K
F2654 YECEKCGKAF NQSSNLTRHK KSHTGEKPYK CMECGKAFNR 62
RSHLTRHQRI HTGEKPYECE KCGKAFNQSS NLTRHKKSHT
GEKPYECDHC GKAFSVSSNL NVHRRIHTGE K
F2662 YTCSDCGKAF RDKSCLNRHR RTHTGEKPFQ CKTCQRKFSR 63
SDHLKTHTRT HTGEKPYECN YCGKTFSVSS TLIRHQRIHT
GEKPYVCDVE GCTWKFARSD ELNRHKKRHT GEK
F2667 YKCMECGKAF NRRSHLTRHQ RIHTGEKPYT CSDCGKAFRD 64
KSCLNRHRRT HTGEKPFQCK TCQRKFSRSD HLKTHTRTHT
GEKPYKCMEC GKAFNRRSHL TRHQRIHTGE K
F2668 YKCMECGKAF NRRSHLTRHQ RIHTGEKPYK CMECGKAFNR 65
RSHLTRHQRI HTGEKPYVCS KCGKAFTQSS NLTVHQKIHT
GEKPYVCSKC GKAFTQSSNL TVHQKIHTGE K
F2673 FQCKTCQRKF SRSDHLKTHT RTHTGEKPYT CKQCGKAFSV 66
SSSLRRHETT HTGEKPYVCD VEGCTWKFAR SDELNRHKKR
HTGEKPYKCP DCGKSFSQSS SLIRHQRTHT GEK
F2682 YICRKCGRGF SRKSNLIRHQ RTHTGEKPYK CPDCGKSFSQ 67
SSSLIRHQRT HTGEKPYECE KCGKAFNQSS NLTRHKKSHT
GEKPYKCMEC GKAFNRRSHL TRHQRIHTGE K
F2689 YICRKCGRGF SRKSNLIRHQ RTHTGEKPYS CGICGKSFSD 68
SSAKRRHCIL HTGEKPYECE KCGKAFNQSS NLTRHKKSHT
GEKPYKCEEC GKAFRQSSHL TTHKIIHTGE K
F2697 YKCMECGKAF NRRSHLTRHQ RIHTGEKPYK CKQCGKAFGC 69
PSNLRRHGRT HTGEKPYKCE ECGKAFRQSS HLTTHKIIHT
GEKPYICRKC GRGFSRKSNL IRHQRTHTGE K
F2699 YICRKCGRGF SRKSNLIRHQ RTHTGEKPYK CEECGKAFRQ 70
SSHLTTHKII HTGEKPYSCG ICGKSFSDSS AKRRHCILHT
GEKPYKCMEC GKAFNRRSHL TRHQRIHTGE K
F2703 YKCGQCGKFY SQVSHLTRHQ KIHTGEKPYK CMECGKAFNR 71
RSHLTRHQRI HTGEKPYVCD VEGCTWKFAR SDELNRHKKR
HTGEKPYKCM ECGKAFNRRS HLTRHQRIHT GEK
F2702 YKCMECGKAF NRRSHLTRHQ RIHTGEKPYK CGQCGKFYSQ 54
VSHLTRHQKI HTGEKPYKCM ECGKAFNRRS HLTRHQRIHT
GEKPYVCSKC GKAFTQSSNL TVHQKIHTGE K
多肽,例如包括上述序列的多肽,也包括标记(例如所述HA标记)、NLS、接头和调节结构域(例如激活或阻抑结构域)。这些元件可自N端至C端以任何顺序排列。在一个实例中,所述多肽被排列为:HA标记-NLS-PGEKP-DNA结合结构域(例如一种上述序列)-AAA-p65。或更具体为:
MVYPYDVPDYAELPPKKKRKVGIRIPGEKP-DNA_BINDING_DOMAIN-AAA-p65;(其中位于DNA结合结构域N端的前导区是SEQ ID NO:126)
·YPYDVPDYA(SEQ ID NO:126的3-12)是一种典型的标记(在此为HA-标记)
·PPKKKRKV(SEQ ID NO:126的15-21)是一种典型的NLS(核定位信号)
·“ZFP”是锌指结构域的一种排列
在另一个实例中,所述多肽包括DNA结合结构域和阻抑结构域,例如KRAB或KOX结构域。
可选择使用任何密码子来产生编码本实施例所述的多肽的核酸,例如可(例如优化)用于原核细胞表达的密码子,例如可(例如优化)用于真核细胞表达的密码子,或编码相应的天然存在的结构域的密码子。
结果说明,许多锌指可激活VEGF-A的产生。
表13:VEGF-A激活
ZFP ID | 激活倍数 | ZFP ID | 激活倍数 | ZFP ID | 激活倍数 |
F109F121F435F475F480F625F2604F2605F2607F2608F2610F2612F2615F2617F2619F2623无关ZFP | 3.54.412.511.19.29.04.910.95.42.17.46.38.12.32.32.31.1 | F2625F2628F2629F2630F2633F2634F2635F2636F2638F2642F2643F2644F2646F2648F2650F2651亲代载体P3 | 2.11.83.82.011.96.52.813.35.73.63.610.710.22.312.64.91.0 | F2653F2654F2668F2673F2679F2682F2689F2697F2699F2702F2703F2825F2828F2830F2838 | 2.62.32.13.14.53.42.11.91.93.14.52.88.86.85.8 |
实施例8:通过包囊化的细胞产生VEGF-A
将编码可操纵地连接于强力霉素诱导型启动子的F435-p65锌指蛋白的编码区域的核酸构建体稳定转染入Flp-T-Rex293细胞。
如下产生稳定表达ZFP-TF的人胚肾(HEK)细胞系:将编码ZFP-TF的质粒稳定转染入FlpTRex-293细胞系(Invitrogen),基本上按照生产商的方案。简言之,将来自pLFD-p65载体的HindIII ShoI片段,其含有编码ZFP-TF的DNA片段,亚克隆入pcDNA5/FRT/TO(Invitrogen)。将得到的质粒与pOG44(Invitrogen)共转染入Flp-InTMTRexTM-293细胞,以诱导位点特异性整合事件。然后筛选稳定的整合体。得到的细胞当在培养基中加入强力霉素(1μg/ml)时有条件地表达锌指蛋白。为固定稳定表达F435-p65的细胞,将藻酸钠(Sigma)溶解于PBS达到终浓度为1%(wt/v),并与细胞轻柔地混合,使最终密度达到106(细胞/ml)。将细胞的混悬液逐滴加至CaCl2(100mM),其中将细胞胶囊凝固15分钟,然后在PBS中洗涤。将包囊化的细胞加至培养基中。以1μg/ml的强力霉素诱导表达并测量由包囊化的细胞产生的VEGF-A的量。在以F435-p65进行一个实验中,在存在强力霉素的情况下,培养2天的细胞(细胞系#151)产生至少600pg/mL的VEGF-A,培养3天产生至少4000pg/mL,在第4天为大约5000pg/mL,且在第5天为至少5300pg/mL。与不包括F435-p65锌指蛋白的对照或与未在存在强力霉素的情况下进行培养的细胞相比,VEGF-A的产生升高了至少5、10、50或100倍。
实施例9:基于细胞分析人的VEGF-A表达
以100ng各种pLFD-4F-p65质粒在以聚-L-赖氨酸(Biocoat)预先包被的96孔培养板中转染3×104 HEK293T细胞。在转染后48小时收集培养物上清液并立即储存于-80℃直至使用。在以100ng的1acZ转染的各个板的一个孔中,通过X-gal染色估计转染效率。在各个实验中,计算出的转染效率在70-80%范围内。
通过三明治ELISA测定分泌的VEGF-A蛋白对VEGF-A的产生进行分析。捕获抗体(AF-293-NA,来自R & D Systems)和生物素酰化的检测抗体(BAF293,来自R & D Systems)均购自R & D systems,链霉抗生物素蛋白-AP(SA110)和底物缓冲液(ES011)来自Chemicon,底物pNPP(N-9389)来自Sigma Aldrich。ELISA的过程在自动化工作站上进行(GENESIS RSP 150TM,TECAN)。测定(POWERWAVETM X340,BioTekInstrument Inc.)405nm的光密度(OD),并根据系列稀释的重组人类VEGF-A蛋白(R & D systems)的OD值获得的标准曲线计算出VEGF-A的量。通过将那些自以pLFD-4F-p65单独转染的培养物所获得的VEGF-A浓度与以亲代载体p3转染的培养物所获得的VEGF-A浓度进行标准化而计算出相对VEGF-A产生。
实施例10:基于细胞分析人类VEGF-A表达
锌指蛋白F121由3个人类锌指结构域组成,所述锌指结构域被设计为在相对于人VEGF-A基因的转录起始位点为大约+434位核苷酸处结合人VEGF启动子的9bp序列;F109由4个人类锌指结构域组成,所述锌指结构域被设计为在相对于人VEGF-A基因的转录起始位点为大约-536位核苷酸处结合人VEGF启动子的12bp序列;而F435由3个人类锌指结构域组成,所述锌指结构域被设计为在人VEGF-A基因的-90R和-391R(其中R代表反向链)位核苷酸处结合9bp序列。
构建含有人类VEGF启动子的萤光素酶报道质粒
使用序列特异性引物自人类基因组DNA通过PCR扩增天然的人类VEGF启动子DNA(位置-950至+450,相对于图1A、B、C所示的转录起始序列的编号),并克隆入质粒pGL3(Promega,E1751)的KpnI/XhoI限制性位点,得到的质粒被命名为pGL3-VEGFprom(图5B)。
锌指蛋白阻抑含有天然的人类VEGF启动子的萤光素酶报道分子
以含有天然的人类VEGF启动子(自转录起始位点起-950至+450)的萤光素酶报道质粒pGL3-VEGFprom和30ng的pLFD-F121-KRAB或pLFD-F109-KRAB转染293细胞。如上所述测定萤光素酶活性。通过将萤火虫萤光素酶活性与Renilla萤光素酶活性进行标准化而计算出阻抑倍数值,并将结果与对照组进行比较,对照组中的293细胞转染了对照载体pLFD和报道质粒。
编码F121-KRAB(30ng)和F109-KRAB(30ng)的质粒分别将报道分子活性降低了8.7倍和6.1倍。
ZFP-KRAB阻抑内源性VEGF-A mRNA的表达
将ZFP表达质粒转染入人胚肾293F细胞(Gibco Life Technologies)。293F细胞允许进行高转染效力。
将293F细胞以105细胞/孔在24孔培养板的孔中在含有5%CO2的湿润环境中在37℃预培养24小时,每孔1ml的DMEM,添加了10%FBS。使用LIPOFECTAMINE PLUSTM(Life Technologies),以0、200或400ng的编码感兴趣的嵌合型锌指蛋白的质粒转染细胞。如果使用的锌指蛋白表达载体低于400ng,则通过添加作为对照的亲代载体将DNA的总量调整为400ng。将细胞进一步孵育48小时。以TRIAZOL试剂(GibcoLife Technologies)自细胞提取总RNA。
通过以下实时RT-PCR进行VEGF mRNA的定量
使用4μg的总RNA,以寡dT作为针对mRNA的第一链合成引物、dNTP和第一链合成体系(Gibco Life Technologies)提供的MMLV逆转录酶,进行逆转录反应,得到第一链cDNA。为定量mRNA,将得到的1μl第一链cDNA通过实时PCR进行扩增,使用的是VEGF-A cDNA特异性引物(正向引物5′-CGGGGTACCCCCTCCCAGTCACTGACTAAC-3′;SEQ IDNO:127和反向引物5′-CCGCTCGAGTCCGGCGGTCACCCCCAAAAG-3′:SEQID NO:128)。由于该方法对最初的RNA量敏感,因此通过使用GAPDH特异性引物进行特异性扩增计算出的GAPDH mRNA量对最初的RNA量进行标准化。使用QUANTITECT SYBRTM试剂盒(QIAGEN,Valencia,CA)和ROTORGENETM 2000实时循环仪(Corbett,Sydney,Australia)对VEGF特异性cDNA和GAPDH特异性cDNA的扩增进行实时监测和分析,并通过反应中的系列稀释的标准定量cDNA。
锌指蛋白对VEGF-AmRNA合成的阻抑
相对于未处理的对照细胞,内源性VEGF-A mRNA的表达降低了2.2倍(54.5%阻抑,200ng pLFD-F435-KRAB)和4.1倍(75.6%阻抑,400ngpLFD-F435-KRAB)。这些结果显示出剂量依赖效应。
ZFP(F435-KRAB)对VEGF-A蛋白产生的阻抑
为了确定对VEGF-A mRNA表达的阻抑是否导致VEGF-A蛋白分泌的降低,以0到200ng的ZFP表达质粒(pLFD-F435-KRAB)转染293F细胞(104/96孔板),并培养72小时。使用三明治ELISA对积聚在培养基(各100μl)中的VEGF蛋白和重组人VEGF-A蛋白标准的稀释液进行分析,其中所述培养物上清液与抗人VEGF抗体(R & D systems;AF-293-NA)、生物素酰化的抗人VEGF抗体(R & D systems;BAF293)、链霉抗生物素蛋白碱性磷酸酶反应。抗原抗体复合物与溶解于pNPP缓冲液(Chemicon;ES011)中的pNPP(对硝基苯磷酸酯)反应。根据405nm处的吸光度确定样品中的VEGF-A浓度,以POWERWAVETM X340(Bio-TEK Instrument Inc.,Winooski VT)测量吸光度。
F435-KRAB以剂量依赖性方式降低了VEGF-A的产生。与转染了200ng对照质粒pLFD-F435-KRAB的对照细胞相比,当使用200ng的所述质粒时,VEGF-A蛋白的浓度被阻抑了3.9倍(138pg/ml)。见表14。
表14:F435-KRAB的滴度
F435-KRAB质粒浓度(ng) | 25 | 50 | 100 | 200 | 对照(200ng) |
VEGF-A(pg/ml) | 420±98 | 345±50 | 172±13 | 138±14 | 536±14 |
阻抑倍数 | 1.3 | 1.6 | 3.1 | 3.9 | 1.0 |
阻抑缺氧条件对VEGF-A基因的诱导
已知VEGF-A基因是诱导血管发生的关键因子。VEGF-A活性对于多种肿瘤的产生和生长是至关重要的。已经发现癌症组织中的缺氧条件会刺激VEGF-A活性。在肿瘤细胞中通常观察到VEGF-A高水平表达。
当以100至800μM的CoCl2处理用于培养293F细胞的培养基大约7小时,可诱导缺氧条件,且细胞中VEGF的产生快速升高。进行以下实验以便测定锌指蛋白是否能够抑制缺氧条件下的VEFG表达。
以50ng pLFD-F435-KRAB转染293F细胞(104细胞/孔,96孔板),并孵育48小时。为了诱导缺氧,在培养的最后7小时阶段,在培养基中加入800μM CoCl2。通过ELISA测定培养基中的分泌型VEGF-A的量。
自缺氧性CoCl2处理的假转染细胞培养物产生的VEGF升高至大约1,039pg/ml,而未处理的对照细胞为大约273pg/ml。这一结果证实缺氧强烈诱导VEGF-A产生。但转染了pLFD-F435-KRAB的细胞在缺氧条件下没有诱导VEGF-A产生。这些细胞仅产生大约272pg/ml的VEGF-A,该浓度与非缺氧对照组的浓度相似。这一结果证实,F435-KRAB的表达抑制了缺氧条件下的VEGF-A的产生。由于转染率仅为大约85-90%,因此有可能残余水平的VEGF-A是由培养物中的未转染细胞产生。我们的结论是,F435-KRAB和相似的功能性嵌合型锌指蛋白是VEGF-A表达的有效阻抑子。
所选定的锌指蛋白或那些包括具有相同基序的结构域的有关蛋白质可用作例如治疗剂。此类药剂能够例如阻抑VEGF-A表达,并由此减慢肿瘤细胞的生长。
在此已经描述了本发明的许多实施方式。不过,应该理解,可在不脱离本发明的精神和范围的情况下对本发明进行各种修改。因此,其他的实施方式也属于所附权利要求书的范围之内。
序列表
<110>图尔金株式会社
<120>调节性锌指蛋白
<130>PCA31172/TGI
<150>US60/431,892
<151>2002-12-09
<160>129
<170>PatentIn version 3.2
<210>1
<211>23
<212>PRT
<213>Homo sapiens
<400>1
Tyr Lys Cys Lys Gln Cys Gly Lys Ala Phe Gly Cys Pro Ser Asn Leu
1 5 10 15
Arg Arg His Gly Arg Thr His
20
<210>2
<211>23
<212>PRT
<213>Homo sapiens
<400>2
Tyr Ser Cys Gly Ile Cys Gly Lys Ser Phe Ser Asp Ser Ser Ala Lys
1 5 10 15
Arg Arg His Cys Ile Leu His
20
<210>3
<211>23
<212>PRT
<213>Homo sapiens
<400>3
Tyr Thr Cys Ser Asp Cys Gly Lys Ala Phe Arg Asp Lys Ser Cys Leu
1 5 10 15
Asn Arg His Arg Arg Thr His
20
<210>4
<211>23
<212>PRT
<213>Homo sapiens
<400>4
Tyr Lys Cys Gly Gln Cys Gly Lys Phe Tyr Ser Gln Val Ser His Leu
1 5 10 15
Thr Arg His Gln Lys Ile His
20
<210>5
<211>23
<212>PRT
<213>Homo sapiens
<400>5
Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Arg Gln Ser Ser His Leu
1 5 10 15
Thr Thr His Lys Ile Ile His
20
<210>6
<211>23
<212>PRT
<213>Homo sapiens
<400>6
Tyr Glu Cys Glu Lys Cys Gly Lys Ala Phe Asn Gln Ser Ser Asn Leu
1 5 10 15
Thr Arg His Lys Lys Ser His
20
<210>7
<211>23
<212>PRT
<213>Homo sapiens
<400>7
Tyr Val Cys Ser Lys Cys Gly Lys Ala Phe Thr Gln Ser Ser Asn Leu
1 5 10 15
Thr Val His Gln Lys Ile His
20
<210>8
<211>23
<212>PRT
<213>Homo sapiens
<400>8
Tyr Lys Cys Pro Asp Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser Leu
1 5 10 15
Ile Arg His Gln Arg Thr His
20
<210>9
<211>25
<212>PRT
<213>Homo sapiens
<400>9
Tyr Val Cys Asp Val Glu Gly Cys Thr Trp Lys Phe Ala Arg Ser Asp
1 5 10 15
Glu Leu Asn Arg His Lys Lys Arg His
20 25
<210>10
<211>23
<212>PRT
<213>Homo sapiens
<400>10
Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu
1 5 10 15
Lys Thr His Thr Arg Thr His
20
<210>11
<211>23
<212>PRT
<213>Homo sapiens
<400>11
Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu
1 5 10 15
Thr Arg His Gln Arg Ile His
20
<210>12
<211>23
<212>PRT
<213>Homo sapiens
<400>12
Tyr Ile Cys Arg Lys Cys Gly Arg Gly Phe Ser Arg Lys Ser Asn Leu
1 5 10 15
Ile Arg His Gln Arg Thr His
20
<210>13
<211>23
<212>PRT
<213>Homo sapiens
<400>13
Tyr Glu Cys Asp His Cys Gly Lys Ala Phe Ser Val Ser Ser Asn Leu
1 5 10 15
Asn Val His Arg Arg Ile His
20
<210>14
<211>23
<212>PRT
<213>Homo sapiens
<400>14
Tyr Thr Cys Lys Gln Cys Gly Lys Ala Phe Ser Val Ser Ser Ser Leu
1 5 10 15
Arg Arg His Glu Thr Thr His
20
<210>15
<211>23
<212>PRT
<213>Homo sapiens
<400>15
Tyr Glu Cys Asn Tyr Cys Gly Lys Thr Phe Ser Val Ser Ser Thr Leu
1 5 10 15
Ile Arg His Gln Arg Ile His
20
<210>16
<211>23
<212>PRT
<213>Homo sapiens
<400>16
Tyr Arg Cys Glu Glu Cys Gly Lys Ala Phe Arg Trp Pro Ser Asn Leu
1 5 10 15
Thr Arg His Lys Arg Ile His
20
<210>17
<211>23
<212>PRT
<213>Homo sapiens
<400>17
Tyr Glu Cys Asp His Cys Gly Lys Ser Phe Ser Gln Ser Ser His Leu
1 5 10 15
Asn Val His Lys Arg Thr His
20
<210>18
<211>23
<212>PRT
<213>Homo sapiens
<400>18
Phe Leu Cys Gln Tyr Cys Ala Gln Arg Phe Gly Arg Lys Asp His Leu
1 5 10 15
Thr Arg His Met Lys Lys Ser
20
<210>19
<211>24
<212>PRT
<213>Artificial
<220>
<223>Artificial zinc finger domain
<400>19
Tyr Arg Cys Lys Tyr Cys Asp Arg Ser Phe Ser Asp Ser Ser Asn Leu
1 5 10 15
Gln Arg His Val Arg Asn Ile His
20
<210>20
<211>83
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>20
Tyr Lys Cys Gly Gln Cys Gly Lys Phe Tyr Ser Gln Val Ser His Leu
1 5 10 15
Thr Arg His Gln Lys Ile His Thr Gly Glu Lys Pro Phe Gln Cys Lys
20 25 30
Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr
35 40 45
Arg Thr His Thr Gly Glu Lys Pro Tyr Ile Cys Arg Lys Cys Gly Arg
50 55 60
Gly Phe Ser Arg Lys Ser Asn Leu Ile Arg His Gln Arg Thr His Thr
65 70 75 80
Gly Glu Lys
<210>21
<211>83
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>21
Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Arg Gln Ser Ser His Leu
1 5 10 15
Thr Thr His Lys Ile Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Met
20 25 30
Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln
35 40 45
Arg Ile His Thr Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln Arg
50 55 60
Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr Arg Thr His Thr
65 70 75 80
Gly Glu Lys
<210>22
<211>83
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>22
Tyr Lys Cys Gly Gln Cys Gly Lys Phe Tyr Ser Gln Val Ser His Leu
1 5 10 15
Thr Arg His Gln Lys Ile His Thr Gly Glu Lys Pro Phe Gln Cys Lys
20 25 30
Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr
35 40 45
Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys
50 55 60
Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr
65 70 75 80
Gly Glu Lys
<210>23
<211>83
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>23
Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu
1 5 10 15
Thr Arg His Gln Arg Ile His Thr Gly Glu Lys Pro Phe Gln Cys Lys
20 25 30
Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr
35 40 45
Arg Thr His Thr Gly Glu Lys Pro Tyr Glu Cys Asp His Cys Gly Lys
50 55 60
Ala Phe Ser Val Ser Ser Asn Leu Asn Val His Arg Arg Ile His Thr
65 70 75 80
Gly Glu Lys
<210>24
<211>84
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>24
Tyr Glu Cys Asp His Cys Gly Lys Ser Phe Ser Gln Ser Ser His Leu
1 5 10 15
Asn Val His Lys Arg Thr His Thr Gly Glu Lys Pro Phe Leu Cys Gln
20 25 30
Tyr Cys Ala Gln Arg Phe Gly Arg Lys Asp His Leu Thr Arg His Met
35 40 45
Lys Lys Ser His Thr Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln
50 55 60
Arg Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr Arg Thr His
65 70 75 80
Thr Gly Glu Lys
<210>25
<211>83
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>25
Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu
1 5 10 15
Thr Arg His Gln Arg Ile His Thr Gly Glu Lys Pro Phe Gln Cys Lys
20 25 30
Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr
35 40 45
Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys
50 55 60
Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr
65 70 75 80
Gly Glu Lys
<210>26
<211>84
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>26
Tyr Lys Cys Lys Gln Cys Gly Lys Ala Phe Gly Cys Pro Ser Asn Leu
1 5 10 15
Arg Arg His Gly Arg Thr His Thr Gly Glu Lys Pro Tyr Arg Cys Glu
20 25 30
Glu Cys Gly Lys Ala Phe Arg Trp Pro Ser Asn Leu Thr Arg His Lys
35 40 45
Arg Ile His Thr Gly Glu Lys Pro Phe Leu Cys Gln Tyr Cys Ala Gln
50 55 60
Arg Phe Gly Arg Lys Asp His Leu Thr Arg His Met Lys Lys Ser His
65 70 75 80
Thr Gly Glu Lys
<210>27
<211>83
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>27
Tyr Lys Cys Lys Gln Cys Gly Lys Ala Phe Gly Cys Pro Ser Asn Leu
1 5 10 15
Arg Arg His Gly Arg Thr His Thr Gly Glu Lys Pro Tyr Arg Cys Glu
20 25 30
Glu Cys Gly Lys Ala Phe Arg Trp Pro Ser Asn Leu Thr Arg His Lys
35 40 45
Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys
50 55 60
Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr
65 70 75 80
Gly Glu Lys
<210>28
<211>85
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>28
Tyr Arg Cys Lys Tyr Cys Asp Arg Ser Phe Ser Asp Ser Ser Asn Leu
1 5 10 15
Gln Arg His Val Arg Asn Ile His Thr Gly Glu Lys Pro Tyr Arg Cys
20 25 30
Glu Glu Cys Gly Lys Ala Phe Arg Trp Pro Ser Asn Leu Thr Arg His
35 40 45
Lys Arg Ile His Thr Gly Glu Lys Pro Phe Leu Cys Gln Tyr Cys Ala
50 55 60
Gln Arg Phe Gly Arg Lys Asp His Leu Thr Arg His Met Lys Lys Ser
65 70 75 80
His Thr Gly Glu Lys
85
<210>29
<211>84
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>29
Tyr Arg Cys Lys Tyr Cys Asp Arg Ser Phe Ser Asp Ser Ser Asn Leu
1 5 10 15
Gln Arg His Val Arg Asn Ile His Thr Gly Glu Lys Pro Tyr Arg Cys
20 25 30
Glu Glu Cys Gly Lys Ala Phe Arg Trp Pro Ser Asn Leu Thr Arg His
35 40 45
Lys Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly
50 55 60
Lys Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln Arg Ile His
65 70 75 80
Thr Gly Glu Lys
<210>30
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>30
Tyr Ser Cys Gly Ile Cys Gly Lys Ser Phe Ser Asp Ser Ser Ala Lys
1 5 10 15
Arg Arg His Cys Ile Leu His Thr Gly Glu Lys Pro Tyr Ile Cys Arg
20 25 30
Lys Cys Gly Arg Gly Phe Ser Arg Lys Ser Asn Leu Ile Arg His Gln
35 40 45
Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln Arg
50 55 60
Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr Arg Thr His Thr
65 70 75 80
Gly Glu Lys Pro Tyr Thr Cys Lys Gln Cys Gly Lys Ala Phe Ser Val
85 90 95
Ser Ser Ser Leu Arg Arg His Glu Thr Thr His Thr Gly Glu Lys
100 105 110
<210>31
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>31
Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Arg Gln Ser Ser His Leu
1 5 10 15
Thr Thr His Lys Ile Ile His Thr Gly Glu Lys Pro Tyr Ser Cys Gly
20 25 30
Ile Cys Gly Lys Ser Phe Ser Asp Ser Ser Ala Lys Arg Arg His Cys
35 40 45
Ile Leu His Thr Gly Glu Lys Pro Tyr Ile Cys Arg Lys Cys Gly Arg
50 55 60
Gly Phe Ser Arg Lys Ser Asn Leu Ile Arg His Gln Arg Thr His Thr
65 70 75 80
Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg
85 90 95
Ser Asp His Leu Lys Thr His Thr Arg Thr His Thr Gly Glu Lys
100 105 110
<210>32
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>32
Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu
1 5 10 15
Lys Thr His Thr Arg Thr His Thr Gly Glu Lys Pro Tyr Glu Cys Asp
20 25 30
His Cys Gly Lys Ala Phe Ser Val Ser Ser Asn Leu Asn Val His Arg
35 40 45
Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Glu Glu Cys Gly Lys
50 55 60
Ala Phe Arg Gln Ser Ser His Leu Thr Thr His Lys Ile Ile His Thr
65 70 75 80
Gly Glu Lys Pro Tyr Ser Cys Gly Ile Cys Gly Lys Ser Phe Ser Asp
85 90 95
Ser Ser Ala Lys Arg Arg His Cys Ile Leu His Thr Gly Glu Lys
100 105 110
<210>33
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>33
Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu
1 5 10 15
Thr Arg His Gln Arg Ile His Thr Gly Glu Lys Pro Tyr Thr Cys Ser
20 25 30
Asp Cys Gly Lys Ala Phe Arg Asp Lys Ser Cys Leu Asn Arg His Arg
35 40 45
Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Glu Glu Cys Gly Lys
50 55 60
Ala Phe Arg Gln Ser Ser His Leu Thr Thr His Lys Ile Ile His Thr
65 70 75 80
Gly Glu Lys Pro Tyr Thr Cys Ser Asp Cys Gly Lys Ala Phe Arg Asp
85 90 95
Lys Ser Cys Leu Asn Arg His Arg Arg Thr His Thr Gly Glu Lys
100 105 110
<210>34
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>34
Tyr Glu Cys Glu Lys Cys Gly Lys Ala Phe Asn Gln Ser Ser Asn Leu
1 5 10 15
Thr Arg His Lys Lys Ser His Thr Gly Glu Lys Pro Tyr Lys Cys Gly
20 25 30
Gln Cys Gly Lys Phe Tyr Ser Gln Val Ser His Leu Thr Arg His Gln
35 40 45
Lys Ile His Thr Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln Arg
50 55 60
Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr Arg Thr His Thr
65 70 75 80
Gly Glu Lys Pro Tyr Ile Cys Arg Lys Cys Gly Arg Gly Phe Ser Arg
85 90 95
Lys Ser Asn Leu Ile Arg His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
<210>35
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>35
Tyr Lys Cys Lys Gln Cys Gly Lys Ala Phe Gly Cys Pro Ser Asn Leu
1 5 10 15
Arg Arg His Gly Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Lys
20 25 30
Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr
35 40 45
Arg Thr His Thr Gly Glu Lys Pro Tyr Ile Cys Arg Lys Cys Gly Arg
50 55 60
Gly Phe Ser Arg Lys Ser Asn Leu Ile Arg His Gln Arg Thr His Thr
65 70 75 80
Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg
85 90 95
Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr Gly Glu Lys
100 105 110
<210>36
<211>113
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>36
Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu
1 5 10 15
Thr Arg His Gln Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Glu
20 25 30
Glu Cys Gly Lys Ala Phe Arg Gln Ser Ser His Leu Thr Thr His Lys
35 40 45
Ile Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys
50 55 60
Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr
65 70 75 80
Gly Glu Lys Pro Tyr Val Cys Asp Val Glu Gly Cys Thr Trp Lys Phe
85 90 95
Ala Arg Ser Asp Glu Leu Asn Arg His Lys Lys Arg His Thr Gly Glu
100 105 110
Lys
<210>37
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>37
Tyr Glu Cys Glu Lys Cys Gly Lys Ala Phe Asn Gln Ser Ser Asn Leu
1 5 10 15
Thr Arg His Lys Lys Ser His Thr Gly Glu Lys Pro Tyr Lys Cys Met
20 25 30
Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln
35 40 45
Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Asp Cys Gly Lys
50 55 60
Ser Phe Ser Gln Ser Ser Ser Leu Ile Arg His Gln Arg Thr His Thr
65 70 75 80
Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg
85 90 95
Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr Gly Glu Lys
100 105 110
<210>38
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>38
Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Arg Gln Ser Ser His Leu
1 5 10 15
Thr Thr His Lys Ile Ile His Thr Gly Glu Lys Pro Tyr Thr Cys Ser
20 25 30
Asp Cys Gly Lys Ala Phe Arg Asp Lys Ser Cys Leu Asn Arg His Arg
35 40 45
Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln Arg
50 55 60
Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr Arg Thr His Thr
65 70 75 80
Gly Glu Lys Pro Tyr Lys Cys Lys Gln Cys Gly Lys Ala Phe Gly Cys
85 90 95
Pro Ser Asn Leu Arg Arg His Gly Arg Thr His Thr Gly Glu Lys
100 105 110
<210>39
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>39
Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Arg Gln Ser Ser His Leu
1 5 10 15
Thr Thr His Lys Ile Ile His Thr Gly Glu Lys Pro Tyr Arg Cys Glu
20 25 30
Glu Cys Gly Lys Ala Phe Arg Trp Pro Ser Asn Leu Thr Arg His Lys
35 40 45
Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys
50 55 60
Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr
65 70 75 80
Gly Glu Lys Pro Tyr Arg Cys Glu Glu Cys Gly Lys Ala Phe Arg Trp
85 90 95
Pro Ser Asn Leu Thr Arg His Lys Arg Ile His Thr Gly Glu Lys
100 105 110
<210>40
<211>113
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>40
Tyr Glu Cys Asp His Cys Gly Lys Ala Phe Ser Val Ser Ser Asn Leu
1 5 10 15
Asn Val His Arg Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Met
20 25 30
Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln
35 40 45
Arg Ile His Thr Gly Glu Lys Pro Tyr Val Cys Asp Val Glu Gly Cys
50 55 60
Thr Trp Lys Phe Ala Arg Ser Asp Glu Leu Asn Arg His Lys Lys Arg
65 70 75 80
His Thr Gly Glu Lys Pro Tyr Val Cys Ser Lys Cys Gly Lys Ala Phe
85 90 95
Thr Gln Ser Ser Asn Leu Thr Val His Gln Lys Ile His Thr Gly Glu
100 105 110
Lys
<210>41
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>41
Tyr Ile Cys Arg Lys Cys Gly Arg Gly Phe Ser Arg Lys Ser Asn Leu
1 5 10 15
Ile Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Met
20 25 30
Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln
35 40 45
Arg Ile His Thr Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln Arg
50 55 60
Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr Arg Thr His Thr
65 70 75 80
Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg
85 90 95
Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr Gly Glu Lys
100 105 110
<210>42
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>42
Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu
1 5 10 15
Thr Arg His Gln Arg Ile His Thr Gly Glu Lys Pro Phe Gln Cys Lys
20 25 30
Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr
35 40 45
Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys
50 55 60
Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr
65 70 75 80
Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg
85 90 95
Ser Asp His Leu Lys Thr His Thr Arg Thr His Thr Gly Glu Lys
100 105 110
<210>43
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>43
Tyr Ile Cys Arg Lys Cys Gly Arg Gly Phe Ser Arg Lys Ser Asn Leu
1 5 10 15
Ile Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Gly
20 25 30
Gln Cys Gly Lys Phe Tyr Ser Gln Val Ser His Leu Thr Arg His Gln
35 40 45
Lys Ile His Thr Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln Arg
50 55 60
Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr Arg Thr His Thr
65 70 75 80
Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg
85 90 95
Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr Gly Glu Lys
100 105 110
<210>44
<211>113
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>44
Tyr Val Cys Asp Val Glu Gly Cys Thr Trp Lys Phe Ala Arg Ser Asp
1 5 10 15
Glu Leu Asn Arg His Lys Lys Arg His Thr Gly Glu Lys Pro Tyr Lys
20 25 30
Cys Pro Asp Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser Leu Ile Arg
35 40 45
His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Glu Glu Cys
50 55 60
Gly Lys Ala Phe Arg Gln Ser Ser His Leu Thr Thr His Lys Ile Ile
65 70 75 80
His Thr Gly Glu Lys Pro Tyr Ile Cys Arg Lys Cys Gly Arg Gly Phe
85 90 95
Ser Arg Lys Ser Asn Leu Ile Arg His Gln Arg Thr His Thr Gly Glu
100 105 110
Lys
<210>45
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>45
Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu
1 5 10 15
Thr Arg His Gln Arg Ile His Thr Gly Glu Lys Pro Phe Gln Cys Lys
20 25 30
Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr
35 40 45
Arg Thr His Thr Gly Glu Lys Pro Tyr Glu Cys Asp His Cys Gly Lys
50 55 60
Ala Phe Ser Val Ser Ser Asn Leu Asn Val His Arg Arg Ile His Thr
65 70 75 80
Gly Glu Lys Pro Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Arg Gln
85 90 95
Ser Ser His Leu Thr Thr His Lys Ile Ile His Thr Gly Glu Lys
100 105 110
<210>46
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>46
Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu
1 5 10 15
Thr Arg His Gln Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Met
20 25 30
Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln
35 40 45
Arg Ile His Thr Gly Glu Lys Pro Tyr Arg Cys Glu Glu Cys Gly Lys
50 55 60
Ala Phe Arg Trp Pro Ser Asn Leu Thr Arg His Lys Arg Ile His Thr
65 70 75 80
Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg
85 90 95
Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr Gly Glu Lys
100 105 110
<210>47
<211>113
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>47
Tyr Val Cys Asp Val Glu Gly Cys Thr Trp Lys Phe Ala Arg Ser Asp
1 5 10 15
Glu Leu Asn Arg His Lys Lys Arg His Thr Gly Glu Lys Pro Tyr Lys
20 25 30
Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu Thr Arg
35 40 45
His Gln Arg Ile His Thr Gly Glu Lys Pro Tyr Thr Cys Ser Asp Cys
50 55 60
Gly Lys Ala Phe Arg Asp Lys Ser Cys Leu Asn Arg His Arg Arg Thr
65 70 75 80
His Thr Gly Glu Lys Pro Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe
85 90 95
Arg Gln Ser Ser His Leu Thr Thr His Lys Ile Ile His Thr Gly Glu
100 105 110
Lys
<210>48
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>48
Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu
1 5 10 15
Thr Arg His Gln Arg Ile His Thr Gly Glu Lys Pro Tyr Glu Cys Asn
20 25 30
Tyr Cys Gly Lys Thr Phe Ser Val Ser Ser Thr Leu Ile Arg His Gln
35 40 45
Arg Ile His Thr Gly Glu Lys Pro Tyr Glu Cys Glu Lys Cys Gly Lys
50 55 60
Ala Phe Asn Gln Ser Ser Asn Leu Thr Arg His Lys Lys Ser His Thr
65 70 75 80
Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg
85 90 95
Ser Asp His Leu Lys Thr His Thr Arg Thr His Thr Gly Glu Lys
100 105 110
<210>49
<211>113
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>49
Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Arg Gln Ser Ser His Leu
1 5 10 15
Thr Thr His Lys Ile Ile His Thr Gly Glu Lys Pro Tyr Ile Cys Arg
20 25 30
Lys Cys Gly Arg Gly Phe Ser Arg Lys Ser Asn Leu Ile Arg His Gln
35 40 45
Arg Thr His Thr Gly Glu Lys Pro Tyr Arg Cys Glu Glu Cys Gly Lys
50 55 60
Ala Phe Arg Trp Pro Ser Asn Leu Thr Arg His Lys Arg Ile His Thr
65 70 75 80
Gly Glu Lys Pro Tyr Val Cys Asp Val Glu Gly Cys Thr Trp Lys Phe
85 90 95
Ala Arg Ser Asp Glu Leu Asn Arg His Lys Lys Arg His Thr Gly Glu
100 105 110
Lys
<210>50
<211>113
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>50
Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Arg Gln Ser Ser His Leu
1 5 10 15
Thr Thr His Lys Ile Ile His Thr Gly Glu Lys Pro Tyr Arg Cys Glu
20 25 30
Glu Cys Gly Lys Ala Phe Arg Trp Pro Ser Asn Leu Thr Arg His Lys
35 40 45
Arg Ile His Thr Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln Arg
50 55 60
Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr Arg Thr His Thr
65 70 75 80
Gly Glu Lys Pro Tyr Val Cys Asp Val Glu Gly Cys Thr Trp Lys Phe
85 90 95
Ala Arg Ser Asp Glu Leu Asn Arg His Lys Lys Arg His Thr Gly Glu
100 105 110
Lys
<210>51
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>51
Tyr Thr Cys Lys Gln Cys Gly Lys Ala Phe Ser Val Ser Ser Ser Leu
1 5 10 15
Arg Arg His Glu Thr Thr His Thr Gly Glu Lys Pro Tyr Arg Cys Glu
20 25 30
Glu Cys Gly Lys Ala Phe Arg Trp Pro Ser Asn Leu Thr Arg His Lys
35 40 45
Arg Ile His Thr Gly Glu Lys Pro Tyr Ile Cys Arg Lys Cys Gly Arg
50 55 60
Gly Phe Ser Arg Lys Ser Asn Leu Ile Arg His Gln Arg Thr His Thr
65 70 75 80
Gly Glu Lys Pro Tyr Thr Cys Lys Gln Cys Gly Lys Ala Phe Ser Val
85 90 95
Ser Ser Ser Leu Arg Arg His Glu Thr Thr His Thr Gly Glu Lys
100 105 110
<210>52
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>52
Tyr Lys Cys Gly Gln Cys Gly Lys Phe Tyr Ser Gln Val Ser His Leu
1 5 10 15
Thr Arg His Gln Lys Ile His Thr Gly Glu Lys Pro Tyr Thr Cys Lys
20 25 30
Gln Cys Gly Lys Ala Phe Ser Val Ser Ser Ser Leu Arg Arg His Glu
35 40 45
Thr Thr His Thr Gly Glu Lys Pro Tyr Arg Cys Glu Glu Cys Gly Lys
50 55 60
Ala Phe Arg Trp Pro Ser Asn Leu Thr Arg His Lys Arg Ile His Thr
65 70 75 80
Gly Glu Lys Pro Tyr Ile Cys Arg Lys Cys Gly Arg Gly Phe Ser Arg
85 90 95
Lys Ser Asn Leu Ile Arg His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
<210>53
<211>113
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>53
Tyr Val Cys Asp Val Glu Gly Cys Thr Trp Lys Phe Ala Arg Ser Asp
1 5 10 15
Glu Leu Asn Arg His Lys Lys Arg His Thr Gly Glu Lys Pro Tyr Lys
20 25 30
Cys Gly Gln Cys Gly Lys Phe Tyr Ser Gln Val Ser His Leu Thr Arg
35 40 45
His Gln Lys Ile His Thr Gly Glu Lys Pro Tyr Thr Cys Lys Gln Cys
50 55 60
Gly Lys Ala Phe Ser Val Ser Ser Ser Leu Arg Arg His Glu Thr Thr
65 70 75 80
His Thr Gly Glu Lys Pro Tyr Arg Cys Glu Glu Cys Gly Lys Ala Phe
85 90 95
Arg Trp Pro Ser Asn Leu Thr Arg His Lys Arg Ile His Thr Gly Glu
100 105 110
Lys
<210>54
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>54
Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu
1 5 10 15
Thr Arg His Gln Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Gly
20 25 30
Gln Cys Gly Lys Phe Tyr Ser Gln Val Ser His Leu Thr Arg His Gln
35 40 45
Lys Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys
50 55 60
Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr
65 70 75 80
Gly Glu Lys Pro Tyr Val Cys Ser Lys Cys Gly Lys Ala Phe Thr Gln
85 90 95
Ser Ser Asn Leu Thr Val His Gln Lys Ile His Thr Gly Glu Lys
100 105 110
<210>55
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>55
Tyr Lys Cys Gly Gln Cys Gly Lys Phe Tyr Ser Gln Val Ser His Leu
1 5 10 15
Thr Arg His Gln Lys Ile His Thr Gly Glu Lys Pro Tyr Ile Cys Arg
20 25 30
Lys Cys Gly Arg Gly Phe Ser Arg Lys Ser Asn Leu Ile Arg His Gln
35 40 45
Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Gly Gln Cys Gly Lys
50 55 60
Phe Tyr Ser Gln Val Ser His Leu Thr Arg His Gln Lys Ile His Thr
65 70 75 80
Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg
85 90 95
Ser Asp His Leu Lys Thr His Thr Arg Thr His Thr Gly Glu Lys
100 105 110
<210>56
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>56
Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu
1 5 10 15
Lys Thr His Thr Arg Thr His Thr Gly Glu Lys Pro Tyr Ile Cys Arg
20 25 30
Lys Cys Gly Arg Gly Phe Ser Arg Lys Ser Asn Leu Ile Arg His Gln
35 40 45
Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys
50 55 60
Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr
65 70 75 80
Gly Glu Lys Pro Tyr Arg Cys Glu Glu Cys Gly Lys Ala Phe Arg Trp
85 90 95
Pro Ser Asn Leu Thr Arg His Lys Arg Ile His Thr Gly Glu Lys
100 105 110
<210>57
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>57
Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu
1 5 10 15
Lys Thr His Thr Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Met
20 25 30
Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln
35 40 45
Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Lys Gln Cys Gly Lys
50 55 60
Ala Phe Gly Cys Pro Ser Asn Leu Arg Arg His Gly Arg Thr His Thr
65 70 75 80
Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg
85 90 95
Ser Asp His Leu Lys Thr His Thr Arg Thr His Thr Gly Glu Lys
100 105 110
<210>58
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>58
Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu
1 5 10 15
Thr Arg His Gln Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Lys
20 25 30
Gln Cys Gly Lys Ala Phe Gly Cys Pro Ser Asn Leu Arg Arg His Gly
35 40 45
Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln Arg
50 55 60
Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr Arg Thr His Thr
65 70 75 80
Gly Glu Lys Pro Tyr Lys Cys Lys Gln Cys Gly Lys Ala Phe Gly Cys
85 90 95
Pro Ser Asn Leu Arg Arg His Gly Arg Thr His Thr Gly Glu Lys
100 105 110
<210>59
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>59
Tyr Lys Cys Pro Asp Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser Leu
1 5 10 15
Ile Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Gly
20 25 30
Gln Cys Gly Lys Phe Tyr Ser Gln Val Ser His Leu Thr Arg His Gln
35 40 45
Lys Ile His Thr Gly Glu Lys Pro Tyr Ile Cys Arg Lys Cys Gly Arg
50 55 60
Gly Phe Ser Arg Lys Ser Asn Leu Ile Arg His Gln Arg Thr His Thr
65 70 75 80
Gly Glu Lys Pro Tyr Ile Cys Arg Lys Cys Gly Arg Gly Phe Ser Arg
85 90 95
Lys Ser Asn Leu Ile Arg His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
<210>60
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>60
Tyr Glu Cys Asn Tyr Cys Gly Lys Thr Phe Ser Val Ser Ser Thr Leu
1 5 10 15
Ile Arg His Gln Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Glu
20 25 30
Glu Cys Gly Lys Ala Phe Arg Gln Ser Ser His Leu Thr Thr His Lys
35 40 45
Ile Ile His Thr Gly Glu Lys Pro Tyr Arg Cys Glu Glu Cys Gly Lys
50 55 60
Ala Phe Arg Trp Pro Ser Asn Leu Thr Arg His Lys Arg Ile His Thr
65 70 75 80
Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg
85 90 95
Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr Gly Glu Lys
100 105 110
<210>61
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>61
Tyr Glu Cys Asn Tyr Cys Gly Lys Thr Phe Ser Val Ser Ser Thr Leu
1 5 10 15
Ile Arg His Gln Arg Ile His Thr Gly Glu Lys Pro Tyr Glu Cys Glu
20 25 30
Lys Cys Gly Lys Ala Phe Asn Gln Ser Ser Asn Leu Thr Arg His Lys
35 40 45
Lys Ser His Thr Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys
50 55 60
Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr
65 70 75 80
Gly Glu Lys Pro Tyr Glu Cys Glu Lys Cys Gly Lys Ala Phe Asn Gln
85 90 95
Ser Ser Asn Leu Thr Arg His Lys Lys Ser His Thr Gly Glu Lys
100 105 110
<210>62
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>62
Tyr Glu Cys Glu Lys Cys Gly Lys Ala Phe Asn Gln Ser Ser Asn Leu
1 5 10 15
Thr Arg His Lys Lys Ser His Thr Gly Glu Lys Pro Tyr Lys Cys Met
20 25 30
Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln
35 40 45
Arg Ile His Thr Gly Glu Lys Pro Tyr Glu Cys Glu Lys Cys Gly Lys
50 55 60
Ala Phe Asn Gln Ser Ser Asn Leu Thr Arg His Lys Lys Ser His Thr
65 70 75 80
Gly Glu Lys Pro Tyr Glu Cys Asp His Cys Gly Lys Ala Phe Ser Val
85 90 95
Ser Ser Asn Leu Asn Val His Arg Arg Ile His Thr Gly Glu Lys
100 105 110
<210>63
<211>113
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>63
Tyr Thr Cys Ser Asp Cys Gly Lys Ala Phe Arg Asp Lys Ser Cys Leu
1 5 10 15
Asn Arg His Arg Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Lys
20 25 30
Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr
35 40 45
Arg Thr His Thr Gly Glu Lys Pro Tyr Glu Cys Asn Tyr Cys Gly Lys
50 55 60
Thr Phe Ser Val Ser Ser Thr Leu Ile Arg His Gln Arg Ile His Thr
65 70 75 80
Gly Glu Lys Pro Tyr Val Cys Asp Val Glu Gly Cys Thr Trp Lys Phe
85 90 95
Ala Arg Ser Asp Glu Leu Asn Arg His Lys Lys Arg His Thr Gly Glu
100 105 110
Lys
<210>64
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>64
Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu
1 5 10 15
Thr Arg His Gln Arg Ile His Thr Gly Glu Lys Pro Tyr Thr Cys Ser
20 25 30
Asp Cys Gly Lys Ala Phe Arg Asp Lys Ser Cys Leu Asn Arg His Arg
35 40 45
Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Lys Thr Cys Gln Arg
50 55 60
Lys Phe Ser Arg Ser Asp His Leu Lys Thr His Thr Arg Thr His Thr
65 70 75 80
Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg
85 90 95
Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr Gly Glu Lys
100 105 110
<210>65
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>65
Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu
1 5 10 15
Thr Arg His Gln Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Met
20 25 30
Glu Cys Gly Lys Ala phe Asn Arg Arg Ser His Leu Thr Arg His Gln
35 40 45
Arg Ile His Thr Gly Glu Lys Pro Tyr Val Cys Ser Lys Cys Gly Lys
50 55 60
Ala Phe Thr Gln Ser Ser Asn Leu Thr Val His Gln Lys Ile His Thr
65 70 75 80
Gly Glu Lys Pro Tyr Val Cys Ser Lys Cys Gly Lys Ala Phe Thr Gln
85 90 95
Ser Ser Asn Leu Thr Val His Gln Lys Ile His Thr Gly Glu Lys
100 105 110
<210>66
<211>113
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>66
Phe Gln Cys Lys Thr Cys Gln Arg Lys Phe Ser Arg Ser Asp His Leu
1 5 10 15
Lys Thr His Thr Arg Thr His Thr Gly Glu Lys Pro Tyr Thr Cys Lys
20 25 30
Gln Cys Gly Lys Ala Phe Ser Val Ser Ser Ser Leu Arg Arg His Glu
35 40 45
Thr Thr His Thr Gly Glu Lys Pro Tyr Val Cys Asp Val Glu Gly Cys
50 55 60
Thr Trp Lys Phe Ala Arg Ser Asp Glu Leu Asn Arg His Lys Lys Arg
65 70 75 80
His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Asp Cys Gly Lys Ser Phe
85 90 95
Ser Gln Ser Ser Ser Leu Ile Arg His Gln Arg Thr His Thr Gly Glu
100 105 110
Lys
<210>67
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>67
Tyr Ile Cys Arg Lys Cys Gly Arg Gly Phe Ser Arg Lys Ser Asn Leu
1 5 10 15
Ile Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro
20 25 30
Asp Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser Leu Ile Arg His Gln
35 40 45
Arg Thr His Thr Gly Glu Lys Pro Tyr Glu Cys Glu Lys Cys Gly Lys
50 55 60
Ala Phe Asn Gln Ser Ser Asn Leu Thr Arg His Lys Lys Ser His Thr
65 70 75 80
Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg
85 90 95
Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr Gly Glu Lys
100 105 110
<210>68
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>68
Tyr Ile Cys Arg Lys Cys Gly Arg Gly Phe Ser Arg Lys Ser Asn Leu
1 5 10 15
Ile Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Ser Cys Gly
20 25 30
Ile Cys Gly Lys Ser Phe Ser Asp Ser Ser Ala Lys Arg Arg His Cys
35 40 45
Ile Leu His Thr Gly Glu Lys Pro Tyr Glu Cys Glu Lys Cys Gly Lys
50 55 60
Ala Phe Asn Gln Ser Ser Asn Leu Thr Arg His Lys Lys Ser His Thr
65 70 75 80
Gly Glu Lys Pro Tyr Lys Cys Glu Glu Cys Gly Lys Ala Phe Arg Gln
85 90 95
Ser Ser His Leu Thr Thr His Lys Ile Ile His Thr Gly Glu Lys
100 105 110
<210>69
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>69
Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu
1 5 10 15
Thr Arg His Gln Arg Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Lys
20 25 30
Gln Cys Gly Lys Ala Phe Gly Cys Pro Ser Asn Leu Arg Arg His Gly
35 40 45
Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Glu Glu Cys Gly Lys
50 55 60
Ala Phe Arg Gln Ser Ser His Leu Thr Thr His Lys Ile Ile His Thr
65 70 75 80
Gly Glu Lys Pro Tyr Ile Cys Arg Lys Cys Gly Arg Gly Phe Ser Arg
85 90 95
Lys Ser Asn Leu Ile Arg His Gln Arg Thr His Thr Gly Glu Lys
100 105 110
<210>70
<211>111
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>70
Tyr Ile Cys Arg Lys Cys Gly Arg Gly Phe Ser Arg Lys Ser Asn Leu
1 5 10 15
Ile Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Glu
20 25 30
Glu Cys Gly Lys Ala Phe Arg Gln Ser Ser His Leu Thr Thr His Lys
35 40 45
Ile Ile His Thr Gly Glu Lys Pro Tyr Ser Cys Gly Ile Cys Gly Lys
50 55 60
Ser Phe Ser Asp Ser Ser Ala Lys Arg Arg His Cys Ile Leu His Thr
65 70 75 80
Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe Asn Arg
85 90 95
Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr Gly Glu Lys
100 105 110
<210>71
<211>113
<212>PRT
<213>Artificial
<220>
<223>artificial zinc finger protein
<400>71
Tyr Lys Cys Gly Gln Cys Gly Lys Phe Tyr Ser Gln Val Ser His Leu
1 5 10 15
Thr Arg His Gln Lys Ile His Thr Gly Glu Lys Pro Tyr Lys Cys Met
20 25 30
Glu Cys Gly Lys Ala Phe Asn Arg Arg Ser His Leu Thr Arg His Gln
35 40 45
Arg Ile His Thr Gly Glu Lys Pro Tyr Val Cys Asp Val Glu Gly Cys
50 55 60
Thr Trp Lys Phe Ala Arg Ser Asp Glu Leu Asn Arg His Lys Lys Arg
65 70 75 80
His Thr Gly Glu Lys Pro Tyr Lys Cys Met Glu Cys Gly Lys Ala Phe
85 90 95
Asn Arg Arg Ser His Leu Thr Arg His Gln Arg Ile His Thr Gly Glu
100 105 110
Lys
<210>72
<211>96
<212>PRT
<213>Homo sapiens
<400>72
Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys
1 5 10 15
Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr
20 25 30
Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn
35 40 45
Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg
50 55 60
Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln
65 70 75 80
Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val
85 90 95
<210>73
<211>260
<212>PRT
<213>Homo sapiens
<400>73
Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu Glu Lys Arg Lys
1 5 10 15
Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys Ser Pro Phe Ser
20 25 30
Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile Ala Val Pro Ser
35 40 45
Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr Pro Phe
50 55 60
Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe Pro Thr Met Val
65 70 75 80
Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro
85 90 95
Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met
100 105 110
Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro
115 120 125
Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala
130 135 140
Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp
145 150 155 160
Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe
165 170 175
Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn
180 185 190
Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu
195 200 205
Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Ala Gln Arg Pro Pro Asp
210 215 220
Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu
225 230 235 240
Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala
245 250 255
Leu Leu Ser Gln
260
<210>74
<211>127
<212>PRT
<213>Sacharromyces cerevisiae
<400>74
Asn Phe Asn Gln Ser Gly Asn Ile Ala Asp Ser Ser Leu Ser Phe Thr
1 5 10 15
Phe Thr Asn Ser Ser Asn Gly Pro Asn Leu Ile Thr Thr Gln Thr Asn
20 25 30
Ser Gln Ala Leu Ser Gln Pro Ile Ala Ser Ser Asn Val His Asp Asn
35 40 45
Phe Met Asn Asn Glu Ile Thr Ala Ser Lys Ile Asp Asp Gly Asn Asn
50 55 60
Ser Lys Pro Leu Ser Pro Gly Trp Thr Asp Gln Thr Ala Tyr Asn Ala
65 70 75 80
Phe Gly Ile Thr Thr Gly Met Phe Asn Thr Thr Thr Met Asp Asp Val
85 90 95
Tyr Asn Tyr Leu Phe Asp Asp Glu Asp Thr Pro Pro Asn Pro Lys Lys
100 105 110
Glu Ile Ser Met Ala Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser
115 120 125
<210>75
<211>63
<212>PRT
<213>Homo sapiens
<400>75
Val Ser Val Thr Phe Glu Asp Val Ala Val Leu Phe Thr Arg Asp Glu
1 5 10 15
Trp Lys Lys Leu Asp Leu Ser Gln Arg Ser Leu Tyr Arg Glu Val Met
20 25 30
Leu Glu Asn Tyr Ser Asn Leu Ala Ser Met Ala Gly Phe Leu Phe Thr
35 40 45
Lys Pro Lys Val Ile Ser Leu Leu Gln Gln Gly Glu Asp Pro Trp
50 55 60
<210>76
<211>12
<212>DNA
<213>Homo sapiens
<400>76
gtttgggagg tc 12
<210>77
<211>12
<212>DNA
<213>Homo sapiens
<400>77
tgggaggtca ga 12
<210>78
<211>12
<212>DNA
<213>Homo sapiens
<400>78
gtcagaaata gg 12
<210>79
<211>12
<212>DNA
<213>Homo sapiens
<400>79
gccagagccg gg 12
<210>80
<211>12
<212>DNA
<213>Homo sapiens
<400>80
gagcggggag aa 12
<210>81
<211>12
<212>DNA
<213>Homo sapiens
<400>81
ggggagaggg ac 12
<210>82
<211>12
<212>DNA
<213>Homo sapiens
<400>82
gtggggagag gg 12
<210>83
<211>12
<212>DNA
<213>Homo sapiens
<400>83
ggggcagggg aa 12
<210>84
<211>12
<212>DNA
<213>Homo sapiens
<400>84
gacagggcct ga 12
<210>85
<211>12
<212>DNA
<213>Homo sapiens
<400>85
ggtgggggtc ga 12
<210>86
<211>12
<212>DNA
<213>Homo sapiens
<400>86
caagtgggga at 12
<210>87
<211>12
<212>DNA
<213>Homo sapiens
<400>87
gggtgggggg ag 12
<210>88
<211>12
<212>DNA
<213>Homo sapiens
<400>88
agggggtggg gg 12
<210>89
<211>12
<212>DNA
<213>Homo sapiens
<400>89
gggtggggag ag 12
<210>90
<211>12
<212>DNA
<213>Homo sapiens
<400>90
gagcgagcag cg 12
<210>91
<211>12
<212>DNA
<213>Homo sapiens
<400>91
agaaataggg gg 12
<210>92
<211>12
<212>DNA
<213>Homo sapiens
<400>92
gggggtgggg gg 12
<210>93
<211>12
<212>DNA
<213>Homo sapiens
<400>93
agagccgggg tg 12
<210>94
<211>12
<212>DNA
<213>Homo sapiens
<400>94
agggaagctg gg 12
<210>95
<211>12
<212>DNA
<213>Homo sapiens
<400>95
gtgggtgagt ga 12
<210>96
<211>12
<212>DNA
<213>Homo sapiens
<400>96
gtgtggggtt ga 12
<210>97
<211>12
<212>DNA
<213>Homo sapiens
<400>97
gttgagggtg tt 12
<210>98
<211>12
<212>DNA
<213>Homo sapiens
<400>98
gagggtgttg ga 12
<210>99
<211>12
<212>DNA
<213>Homo sapiens
<400>99
ggtgttggag cg 12
<210>100
<211>12
<212>DNA
<213>Homo sapiens
<400>100
ggggagaggg ac 12
<210>101
<211>12
<212>DNA
<213>Homo sapiens
<400>101
tggggagagg ga 12
<210>102
<211>12
<212>DNA
<213>Homo sapiens
<400>102
ggtggggaga gg 12
<210>103
<211>12
<212>DNA
<213>Homo sapiens
<400>103
agggacgggt gg 12
<210>104
<211>12
<212>DNA
<213>Homo sapiens
<400>104
gacagggacg gg 12
<210>105
<211>12
<212>DNA
<213>Homo sapiens
<400>105
gaggagggag ca 12
<210>106
<211>12
<212>DNA
<213>Homo sapiens
<400>106
gggggtcgag ct 12
<210>107
<211>12
<212>DNA
<213>Homo sapiens
<400>107
gaaggggaag ct 12
<210>108
<211>12
<212>DNA
<213>Homo sapiens
<400>108
aatgaagggg aa 12
<210>109
<211>12
<212>DNA
<213>Homo sapiens
<400>109
gcggctcggg cc 12
<210>110
<211>12
<212>DNA
<213>Homo sapiens
<400>110
gggcgggccg gg 12
<210>111
<211>12
<212>DNA
<213>Homo sapiens
<400>111
aaaaaagggg gg 12
<210>112
<211>12
<212>DNA
<213>Homo sapiens
<400>112
gcagcggtta gg 12
<210>113
<211>12
<212>DNA
<213>Homo sapiens
<400>113
ggggaagtag ag 12
<210>114
<211>12
<212>DNA
<213>Homo sapiens
<400>114
agagaagtcg ag 12
<210>115
<211>12
<212>DNA
<213>Homo sapiens
<400>115
gagagagacg gg 12
<210>116
<211>12
<212>DNA
<213>Homo sapiens
<400>116
ggggtcagag ag 12
<210>117
<211>12
<212>DNA
<213>Homo sapiens
<400>117
ggggtggggg ga 12
<210>118
<211>12
<212>DNA
<213>Homo sapiens
<400>118
caagggggag gg 12
<210>119
<211>90
<212>PRT
<213>Saccharomyces cerevisiae
<400>119
Asn Ser Ala Ser Ser Ser Thr Lys Leu Asp Asp Asp Leu Gly Thr Ala
1 5 10 15
Ala Ala Val Leu Ser Asn Met Arg Ser Ser Pro Tyr Arg Thr His Asp
20 25 30
Lys Pro Ile Ser Asn Val Asn Asp Met Asn Asn Thr Asn Ala Leu Gly
35 40 45
Val Pro Ala Ser Arg Pro His Ser Ser Ser Phe Pro Ser Lys Gly Val
50 55 60
Leu Arg Pro Ile Leu Leu Arg Ile His Asn Ser Glu Gln Gln Pro Ile
65 70 75 80
Phe Glu Ser Asn Asn Ser Thr Ala Cys Ile
85 90
<210>120
<211>3480
<212>DNA
<213>Homo sapiens
<220>
<221>misc_RNA
<222>(2363)..(2363)
<223>mRNA start site
<220>
<221>misc_signal
<222>(3401)..(3403)
<223>translation start site
<400>120
gaattctgtg ccctcactcc cctggatccc tgggcaaagc cccagaggga aacacaaaca 60
ggttgttgta acacaccttg ctgggtacca ccatggagga cagttggctt atgggggtgg 120
ggggtgcctg gggccacgga gtgactggtg atggctatcc ctccttggaa cccctccagc 180
ctcctcttag cttcagattt gtttatttgt tttttactaa gacctgctct ttcaggtctg 240
ttggctcttt taggggctga agaaggccga gttgagaagg gatgcaaggg agggggccag 300
aatgagccct tagggctcag agcctccatc ctgccccaag atgtctacag cttgtgctcc 360
tggggtgcta gaggcgcaca aggaggaaag ttagtggctt cccttccata tcccgttcat 420
cagcctagag catggagccc aggtgaggag gcctgcctgg gagggggccc tgagccagga 480
aataaacatt tactaactgt acaaagacct tgtccctgct gctggggagc ctgccaagtg 540
gtggagacag gactagtgca cgaatgatgg aaagggaggg ttggggtggg tgggagccag 600
cccttttcct cataagggcc ttaggacacc ataccgatgg aactgggggt actggggagg 660
taacctagca cctccaccaa accacagcaa catgtgctga ggatggggct gactaggtaa 720
gctccctgga gcgttttggt taaattgagg gaaattgctg cattcccatt ctcagtccat 780
gcctccacag aggctatgcc agctgtaggc cagaccctgg caagatctgg gtggataatc 840
agactgactg gcctcagagc cccaactttg ttccctgggg cagcctggaa atagccaggt 900
cagaaaccag ccaggaattt ttccaagctg cttcctatat gcaagaatgg gatgggggcc 960
tttgggagca cttagggaag atgtggagag ttggaggaaa agggggcttg gaggtaaggg 1020
aggggactgg gggaaggata ggggagaagc tgtgagcctg gagaagtagc caagggatcc 1080
tgagggaatg ggggagctga gacgaaaccc ccatttctat tcagaagatg agctatgagt 1140
ctgggcttgg gctgatagaa gccttggccc ctggcctggt gggagctctg ggcagctggc 1200
ctacagacgt tccttagtgc tggcgggtag gtttgaatca tcacgcaggc cctggcctcc 1260
acccgccccc accagccccc tggcctcagt tccctggcaa catctggggt tgggggggca 1320
gcaggaacaa gggcctctgt ctgcccagct gcctccccct ttgggttttg ccagactcca 1380
cagtgcatac gtgggctcca acaggtcctc ttccctccca gtcactgact aaccccggaa 1440
ccacacagct tcccgttctc agctccacaa acttggtgcc aaattcttct cccctgggaa 1500
gcatccctgg acacttccca aaggacccca gtcactccag cctgttggct gccgctcact 1560
ttgatgtctg caggccagat gagggctcca gatggcacat tgtcagaggg acacactgtg 1620
gcccctgtgc ccagccctgg gctctctgta catgaagcaa ctccagtccc aaatatgtag 1680
ctgtttggga ggtcagaaat agggggtcca ggagcaaact ccccccaccc cctttccaaa 1740
gcccattccc tctttagcca gagccggggt gtgcagacgg cagtcactag ggggcgctcg 1800
gccaccacag ggaagctggg tgaatggagc gagcagcgtc ttcgagagtg aggacgtgtg 1860
tgtctgtgtg ggtgagtgag tgtgtgcgtg tggggttgag ggtgttggag cggggagaag 1920
gccaggggtc actccaggat tccaacagat ctgtgtgtcc ctctccccac ccgtccctgt 1980
ccggctctcc gccttcccct gcccccttca atattcctag caaagaggga acggctctca 2040
ggccctgtcc gcacgtaacc tcactttcct gctccctcct cgccaatgcc ccgcgggcgc 2100
gtgtctctgg acagagtttc cgggggcgga tgggtaattt tcaggctgtg aaccttggtg 2160
ggggtcgagc ttccccttca ttgcggcggg ctgcgggcca ggcttcactg ggcgtccgca 2220
gagcccgggc ccgagccgcg tgtggagggg ctgaggctcg cctgtccccg ccccccgggg 2280
cgggccgggg gcggggtccc ggcggggcgg agccatgcgc cccccccttt tttttttaaa 2340
agtcggctgg tagcggggag gatcgcggag gcttggggca gccgggtagc tcggaggtcg 2400
tggcgctggg ggctagcacc agcgctctgt cgggaggcgc agcggttagg tggaccggtc 2460
agcggactca ccggccaggg cgctcggtgc tggaatttga tattcattga tccgggtttt 2520
atccctcttc ttttttctta aacatttttt tttaaaactg tattgtttct cgttttaatt 2580
tatttttgct tgccattccc cacttgaatc gggccgacgg cttggggaga ttgctctact 2640
tccccaaatc actgtggatt ttggaaacca gcagaaagag gaaagaggta gcaagagctc 2700
cagagagaag tcgaggaaga gagagacggg gtcagagaga gcgcgcgggc gtgcgagcag 2760
cgaaagcgac aggggcaaag tgagtgacct gcttttgggg gtgaccgccg gagcgcggcg 2820
tgagccctcc cccttgggat cccgcagctg accagtcgcg ctgacggaca gacagacaga 2880
caccgccccc agccccagct accacctcct ccccggccgg cggcggacag tggacgcggc 2940
ggcgagccgc gggcaggggc cggagcccgc gcccggaggc ggggtggagg gggtcggggc 3000
tcgcggcgtc gcactgaaac ttttcgtcca acttctgggc tgttctcgct tcggaggagc 3060
cgtggtccgc gcgggggaag ccgagccgag cggagccgcg agaagtgcta gctcgggccg 3120
ggaggagccg cagccggagg agggggagga ggaagaagag aaggaagagg agagggggcc 3180
gcagtggcga ctcggcgctc ggaagccggg ctcatggacg ggtgaggcgg cggtgtgcgc 3240
agacagtgct ccagccgcgc gcgctcccca ggccctggcc cgggcctcgg gccggggagg 3300
aagagtagct cgccgaggcg ccgaggagag cgggccgccc cacagcccga gccggagagg 3360
gagcgcgagc cgcgccggcc ccggtcgggc ctccgaaacc atgaactttc tgctgtcttg 3420
ggtgcattgg agccttgcct tgctgctcta cctccaccat gccaaggtaa gcggtcgtgc 3480
<210>121
<211>8024
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<222>(3731)..(3731)
<223>mRNA start site
<220>
<221>misc_feature
<222>(3959)..(3961)
<223>ATG
<400>121
ccgggctgag ctcagtcatt ttgccctgag gactataagt ggactattat gcagcacttt 60
cttttttatt attattacta ttaagccaag taagttctta acagctaaca cctgagctgg 120
tggctctgag aagcctcttc actccttcac gggagacggg accattcaca tgaagatcct 180
acattgttgt tttttttttt ttggaggtcg aaaaaggtca ctgttaggag gctttctggg 240
cctttgctcc tctccctcaa tttattaccc ctccagtggc tgatgacgta cagggagact 300
tccacccgat aatgacatgg ctttgtttat ttcacaaatt cccagcattt actgttaatc 360
agacccagtt tgaaccaccc ccaaggggct tgcagtctaa acagctcact ttgctcagcc 420
tcttcctgag gtcaggcact gtcttgctaa ggccgacatc agctcatgcc cattttacag 480
atggggaaac tgagaatgct aagaagtgaa atagcgtaag gttatacaac taacagggag 540
acagcctaaa cttgaaccca accggaagcc caacatggcc ccaagccttc ctcgaacccc 600
aggacttggc aaagcgggcg tcctggggta aagcatggca gaagggcttt gggtccaagc 660
taagtgaggg tcctgtttct agatcacctg gccaggtgca gtggctcatg cctgtaatcc 720
cagcactttg ggaggctgag gcgggaggat tgcttgagct caaaagtttg agtccagccc 780
gggcaataca gcgagacctc gtctctacta aaaaagaaaa caaaaaatta gctgagtgtg 840
tagtcccagc tactcaggag actgaggctg gaggattgct taagcctgga agtttgaggc 900
tgtagagcta tgatagagcc actgcacttt agcctgggca atggagcaag atactatctc 960
aaaaaaaaaa aaatatatat ataggtcccc ttgtccctct gctgagaagt aaccagatct 1020
ggaaaagatt tagtcacctt ggtccaacta tttctttcac ataaagaaaa aaaaaggcaa 1080
tgcagacctt cccatggggg cagctctgcc tgaggccttt gcaggtacct ctgtttgtct 1140
gccccggggc acagtggcag attgggcagg gcagcttgca gtgaggattg ctgatggatg 1200
agctcctagt gtacctagcc agccatttac tcacaaacag ctattgagca cctactatgt 1260
gcccagcact ggaggtacaa ctggcaacaa cacaaatccg ggcttgctcc atggaggtga 1320
caatctaaat gcggtggagg gtcagctaac aagtgcagaa ggttctctta agagctcaaa 1380
gaagctccaa ccagaaggac tgggcagggg atccagaagg catccccgag tggctactcc 1440
aatggagtgg cttctccatt caggcaaacc tgaatgggat aagtcattgg caggaagatc 1500
tggggccggg ggtcatccag tgggaagggg agagatgacg cggtcagcat ggcgggaaca 1560
caggagcaga aaggaagcag gtgggaagcc aggtcaaggg ccaggggcac ggaaaggggt 1620
cagatgcaga taagtgagtg cttcctggtg catccttcat ccgcaattca tccttacctg 1680
tgcttttgtt gcctccattg cacagctgag gaggccaggg cctgcggagg ttgagagtgt 1740
gctcagggag cccccggagc aaagtggaag ccagattcca gatcagttct gctgggaatt 1800
cccagctccc aaaagccctg ctggctgtca gtccccagtc accacaagca cctatcctgt 1860
gtgggtgggc ctgcagttct gggagatata tcagctgcct gcagcgtcct ttgctgaact 1920
cacagcaaat aggagagaca gggaggggtc cttgggaagc cctaaattga gcttgctgtg 1980
ggagtcctgg gaagaaagga gcctcatcct atcaaaagcc ggggggaaga catcagagtc 2040
cctctgctca ggtcagctgg cacaggtggg tctccaggcc tgggtctcac ttccccagag 2100
ggtgtgttcg ggtggcccca ggctgaggga ggaaagccca cctcccatgt cattttgcaa 2160
atggggagtc agggacctag agatggaaag acaacacagc aagtgaggga tgggttctag 2220
gtcccctgca ccctgcaccc tgcaccctgg ccaacgatgt ctatttggca ccagatctgc 2280
aggctcatct gggggacccc aggacccaga ggcagccggg ttgcatctcg aagctgtgag 2340
ctgcagccca ggaaggtcca ggtctgggtg gcgctgccca agcaggctgc aggcccaagg 2400
aggaacaaag atcctctcaa ggggtgcgga gctgaggttc cggtcctgcc aaagccactt 2460
gatgaccccc aagtgccccc ctttctgcac ctcagagaag agccctcaag cctcccaggt 2520
cccctccagg ggcacgaata agccccagca gggttctgaa ggggtcccag gaatctccct 2580
gtggggatgc ggtggaggtg gaggaggctg cggtggcctg gggacatctc tggtcacagg 2640
tgctggtggt atgagagatg gggtaggcac caagccccct gcagctgtgg ctaggcgggc 2700
ctgcaggaag ggccaggcag gctcctcagg gaccacaaag aacaggggtt ttcacaccta 2760
ggtgggcctg catctagcta ggccagtccc catcaggcca taatgggcac agtgggaggt 2820
agaaccatga gtgagagagg ggaggcttcc agaggcctgg cctgggtccc tgctagattg 2880
agggctctgg ctatggtaca tggatatttc tgctgtggaa tcaaaggagc aggggatgct 2940
gaatatcccc tctggcccta tgccctgcta cctgtccttt cacggaaggg tgtgtgtgta 3000
gggggtgcag gaccaggcct ccctgggtgc atctctgcca ccttgccctt tggctcaggt 3060
ggacctccac caggtattca gaactccagc ccagaaacgc gccaagcctg tggggccaag 3120
acctaggggg tgggggtggc ctccctcccg cctgtagcca aagggtcctc ccttgcccag 3180
ccaggccccg gtgtcgctta ctgctcttat ccacccctcc ttcccaggcc ggtcctcaag 3240
gccccagcaa aggaaccaag ttcccgtgag cctccgaaag gcgaagggca ggcagcagcc 3300
gctggcttct gcgcccacta ggagcttcgg atgcccgagt tagggctgcg ccaaggcggc 3360
cggagcagag agggagacgg ggacggggac aggcagggac aaagtgcaag aggcaaaact 3420
ggctgaaaag cagaagtgta ggagccgcca aggggcggga cgaacaggtc cgtgggccgg 3480
gcggagccaa gggtgggggc cggggtccct ccaggtggca ctcgcggcgc tagtccccag 3540
cctcctccct tcccccggcc ctgattggca ggcggcctgc gaccagccgc gaacgccaca 3600
gcgccccggg cgcccaggag aacgcgaacg gccccccgcg ggagcgggcg agtaggaggg 3660
ggcgccgggc tatatatata gcggctcggc ctcgggcggg cctggcgctc agggaggcgc 3720
gcactgctcc tcagagtccc agctccagcc gcgcgctttc cgcccggctc gccgctccat 3780
gcagccgggg tagagcccgg cgcccggggg ccccgtcgct tgcctcccgc acctcctcgg 3840
ttgcgcactc ccgcccgagg tcggccgtgc gctcccgcgg gccgccacag gcgcagctct 3900
gccccccagc ttcccgggcg cactgaccgc ctgaccgacg cacggccctc gggccgggat 3960
gtcggggccc gggacggccg cggtagcgct gctcccggcg gtcctgctgg ccttgctggc 4020
gccctgggcg ggccgagggg gcgccgccgc acccactgca cccaacggca cgctggaggc 4080
cgagctggag cgccgctggg agagcctggt ggcgctctcg ttggcgcgcc tgccggtggc 4140
agcgcagccc aaggaggcgg ccgtccagag cggcgccggc gactacctgc tgggcatcaa 4200
gcggctgcgg cggctctact gcaacgtggg catcggcttc cacctccagg cgctccccga 4260
cggccgcatc ggcggcgcgc acgcggacac ccgcgacagt gagtggcgcg gccaggcgcg 4320
aaggggcggg ggcggggggc aacggccgcc gggccaaccc gctcagtcac actctgagac 4380
cctcggcggg cacctgctcg ggggccccgg gaaccggggc ggactcgggc tccggtccct 4440
tctgacgcgg ggctggggac gcagacactc ttggctccgg cagcccagcg caacccctga 4500
ggtcgggcgc cgcctcccgc cttcagaaac tcgggctccg agcgccgaat tccagcgcct 4560
tcgcccgtgg gcacagggcg cgcggtgcag ccacaggggg cccgagacac gcgccccggc 4620
ctggcccagg ctggggaacc gctggggtcg ggctcgcgtc tgaaggtccg ggactgggtg 4680
cggccgccgg gggtccccta cacaggcaag ctaatctgag ctagcgcagg cttgggctcc 4740
ggaggcccta gagggcagct tgggctctgg aggcccttgg gggcggctgc gccgggaacc 4800
ctggcccttt atccccaacc ccaccccaga aatagggtcc ccggaggcga acaagccgag 4860
gggcggagtg ggccagggat cacctgcccc gcaatgacct gcgccccgcc cccaggcctg 4920
ctggagctct cgcccgtgga gcggggcgtg gtgagcatct tcggcgtggc cagccggttc 4980
ttcgtggcca tgagcagcaa gggcaagctc tatggctcgg tgagtaccgc aggggtctgg 5040
ctaggcacct agttgggaac agcggacatg gctagcaggc tcgtggcttc tccagcccca 5100
cctgtgcctg ggtcttggag gggtggcagg gtcaccaggt cacgggaccg gcaggcctcc 5160
ccagacaaag gaagcagccc caaggcagga acaatgaggt tcctgccatc cctgagtggg 5220
cccctcccag accgaggaaa gggcgctatt gagagccctt cccttctcta gtccagaggg 5280
gtaggtctca gtgttggaac tgcgggcttg aggctggaca cgcagggaat gaattctctg 5340
gctgctaggt gcagggcagg tggtgagagc accagctgtt gtgggctggc catgtcccct 5400
tctcaccctg tgtgggtctt gacaccttaa ctgctcagca gagacatctc agcccagggt 5460
ggggggtggg acagaagggg gttctgaccc ctggcttcag gctgggtacc ttgcccaaga 5520
ggtgccccag ccctgacact gccctgcttt gctgcagccc ttcttcaccg atgagtgcac 5580
gttcaaggag attctccttc ccaacaacta caacgcctac gagtcctaca agtaccccgg 5640
catgttcatc gccctgagca agaatgggaa gaccaagaag gggaaccgag tgtcgcccac 5700
catgaaggtc acccacttcc tccccaggct gtgaccctcc agaggaccct tgcctcagcc 5760
tcgggaagcc cctgggaggg cagtgccgag ggtcaccttg gtgcactttc ttcggatgaa 5820
gagtttaatg caagagtagg tgtaagatat ttaaattaat tatttaaatg tgtatatatt 5880
gccaccaaat tatttatagt tctgcgggtg tgttttttaa ttttctgggg ggaaaaaaag 5940
acaaaacaaa aaaccaactc tgacttttct ggtgcaacag tggagaatct taccattgga 6000
tttctttaac ttgtcaaaag ttgtcacgag tgtgctgcta ttctgtgttt taaaaaaagg 6060
tgacattgga ttccgatgtc atcccctgta gtatggcgtg gagcatctct gtctggaaag 6120
gcccgcctga ggcttgggca gccagttcag ggagctccca ggcttggctc tcggctagca 6180
tcctcagagg cccactccct ttgtgccctg ttgctattaa tcgggacata tcggtttact 6240
tcgggtacag aaagtgcggt gttgaagtcc tcgctgccac tctgttttta gatctgccaa 6300
gactgacctt tgaactttcc tgtagtcaat cttcctcgat ctaccagatg ggagagaccc 6360
ttggacaact ttataaactc ctgtttgcct tttttggatc agcgacagcc cccatcgctg 6420
tgactattgg ggaaaagacg aagctctttc ataaattcca tggagaggaa tcaatatccc 6480
actggaaggc tagaaatgga caagatagtg tatttgcaat cacaaacaaa accctagtga 6540
tgaaaaataa tttgtgatgg cagatgcttc tgatggtgtg atagaatatg tttttgaaaa 6600
caaaccatcg aaccccccgc cccaccccca aaacgggctt ccctgtgttt agggagcttt 6660
gggctagaac tagctacgat ttttaggtga aatgtccttg taattgtaca aagcacttgg 6720
tgcagtgttt gcgtggagca gcctgctgct ttctgatgca ttccctgttt aagtgcgttt 6780
aacatctacc tcacaagccc tgaaacccca ggcaaaaccc acagaaagct catacccggt 6840
gcaggagttt gccatcccaa gtggcttttt ttccatatgt agccaaaaag gattgcagat 6900
agcgtcggtg cgtcccattc gaaccttgtc acgtttgagc tatctttacc ctgtgattta 6960
cttttagtaa gggtgatcat ggtgaaaata tttgcagaca gctgttacag tacactatat 7020
ggtcaccaag taaccttata tttttcttta tatattttac aaatgtaacc cctgtcattg 7080
aagcaaccgt ggaagaggca gggtcggtga tgtttaaaaa aagttccgag gtgatggcaa 7140
acatttaatt ttaatgaatg actttttaga gtttatacaa aatgacctta gcttgctacc 7200
agaaatgctc cgaatgtttc gtcaagactt taatactctc ctaggatgtt tctgaactgt 7260
ctcccgaatt aactttatgg gagtctacag acagcaagac tggaaaatct gattggagtt 7320
tttgtctttc acattccttt tgaaaactct ttgttcgaat gcaaatcatc gacttaaaat 7380
actattctta accaaggcct ggaagaaaga agacacttgc aaagccgcta agacaggacc 7440
acacatctta aactgctgtt cctaccatgc actaaactgt ttttaagttt taaaccacac 7500
cctaggctcc aggagtgttc aggaaagatg gtgtttgtag gtctccatgc tgtttggcgt 7560
tggggggtgt ggagggatca tccgtcgact ttctgaattt taatgtattc acttagtaac 7620
aaaccatgat tgtcttaaat gccttaaatt attatgagat ttcttgtctc agagcccaat 7680
cagattgtca ggaattaaca tgtgttaggt ttgatcaccc ttgaccactt cttatagata 7740
tttcttcaac aaatcatgtg tgatgcctgt aggaacacaa ctgtaccttt aaaatattgt 7800
tttcatattg ctgtgatggg gattcgaggt tcctgtatgt gccactgttt tcagaatctg 7860
tagttttata caggtgccga ccctcgttgt gatgtatgtg ctgtgcacat tgacatgctg 7920
accgacaatg ataagcgttt atcgtgtata aaaagacacc actggactgg atgtacacaa 7980
ctgggaaagg aattaaaagc tattaaaatt gtgccttgaa atgc 8024
<210>122
<211>7000
<212>DNA
<213>Homo sapiens
<220>
<221>misc_feature
<222>(4389)..(4389)
<223>mRNA start site
<220>
<221>misc_feature
<222>(4454)..(4456)
<223>ATG
<400>122
aatggtatta tagggtaatg agtatccatc tagtatttaa gtatttacat aaattgcagt 60
acttaaagta atctctttac aagttatttt atcaaaaact tttcagacac aattttttgg 120
ggatttattc aaactgttta acacttaaga agtactggct taccttggag atactgctcg 180
tttggtttca gaccactgtg atcaagcaaa aatcgcaata aagcaagtta catgaatttt 240
tttttcgttt cccagtgcat ataaaagtta cacagcagac tattaagtgt gcaacagcat 300
tatgtttaaa aatgtccata ccttaactta aaaatacttt attgttaaaa aatgctaacg 360
atcatataag ccttcagcga gtgataatct ttttgctgat ggagggtctt gcttgatgtt 420
cagagccttg ctgtggcttt ggcttaaggc ttaagggaat attgcagctg gtttgatctt 480
ctatctagac tgctcaaatt ttctgcatat cagcaataag gctgctctgc tctcttatca 540
tttgtgtgtt cactggagta gcacttctaa cttgcttcaa gaacttttct tttgcatttg 600
caactcggat aactggtgca agaggactgg cttttgacct aactcatctt tgggcatgcc 660
tttccccaaa agcttaattt atttctagct tttgatttca aggaagagac gcgcaactct 720
tcctttcact tgagtactta gaggtcattg cagggctatc aattggccta atttcaataa 780
tgttgtgttt taggaaatag agaagcctga ggggagggag agagacgggt gaacagctcg 840
tcagtggagt agtcagaata cacacatgaa tggattaagt ttgggttgtg gtttgtggtg 900
cccaaaacaa ttatggcagt aacatcaaag atcactgatc acagatcatc atgtaaaata 960
ataaggaaat atttgaaata ttgcaagaat taccaaaatg tgacacggag acacaaagtg 1020
agcacatgct gtgggaaaaa cggcaccaac agacttgctc aattcgagga caccacaaaa 1080
cttaatttgt aaaaacacat tatctgtgaa gtacaataaa gtgaagggca ataaaatgat 1140
gtatgcctat gtaaggcaat cagtagatga tgggaaaaaa acattgcatg atttagaaaa 1200
aacaaagaga atatgttatc aaaatgacta aactaatagc ataattagaa tttcatttga 1260
gtatttcttt atagttttga gagatttaaa attatgtatt attttataaa ttattatgga 1320
ggatctccta tatacccagt ctcagactta ttttggtgat tatactctgg aacatgtgat 1380
tcttctcctc gtggggttaa aaaaatttat accatcctat ggggtatgac taatctgaat 1440
ctcacacttg aatattactt tgggatctta ggcaagttat ttaagaataa aaataactta 1500
ctatgtttcc tcaactataa aatgagaatt ttaataatct taaacttact gtaaggatga 1560
aataattttc aatagtatgt aatatgatgc ttagcataca ttaagatctc agtgtatatt 1620
agcaacaatt tcagtaaaga aagaccaaat aatttttgtc aagaaatatg aatatataaa 1680
ttatataggt tttaagttgt atttaccata tttaatgtga cagtaaaaaa agtcacgaaa 1740
atgtgtgacc taataagttt attcagtttt ctaatgtcct gaacccctta tctcagatgg 1800
attttgctcc aaacttataa caataattta caaccctgac tctagttttt ttttctgaga 1860
gaaaaaaata aatagaaaca ctgttctttt tctttcctta cctacaggaa tttacttaca 1920
gaaaaatcta acttctttta aaaacagcct taatcccttg ttgggccaag ggaaaacttt 1980
tccattgttc tctgaaggtt tgctaaaaaa aaaattactg tcaagaggca gatcaataga 2040
agaaaaggca tacacattta tttgatcata attttacaca acccgagagc ctttagaaca 2100
aagacccaaa gttacaaaag aaattgtcca tttttatgct taggttcaac aaagtgtggg 2160
caggtgtgga gaaatacaac tggacaaaag gaatatgatc tcatgctaac agactgagtg 2220
gggacgcctg gcaaggtgag attcttcctg gtatctctgt gcagtactca ttccttctgg 2280
gtatggggca ggaccttctt tggaatgggg tcttatgagc tacgatcaaa caaggtaggt 2340
cagataatgt ctttatggcc agatttcaca cagaaagttg aggtgttaga gtgatatgct 2400
taggttttat ggctggtttg ggaaaaaggg ttctggtttc taggagccac cttgggaaag 2460
agggattcta gtttctatgc ctcgccttgg gggagaatga agggccggag actggagagc 2520
aggagaaggt cagagagagc tgattctgag gtcttcattt ggggtatcat ttttctgagc 2580
ccctacaccc taataaagca caagagatgc agtggagcaa ttcagggtca cggtcaggct 2640
atgcattgaa ctgagatttc ccaaaaagtc tactgaacag taaaaagaaa gtaaaatgga 2700
tcctggggac accagacaga ggctgacaaa tgatttttaa gtaaggagaa aatgataaaa 2760
gagaaggatt agcaatagaa acgggtcata taaaatagat ccctcaaaag gaattctctt 2820
aatccctagc ttctctagat atcccacaac ctcagggact tatcaggcag gttgtttttc 2880
cctgaaagtg ggggtaaggg agctggagga caaatgaagg tggtatgtgg agggaaggct 2940
gttctgtgga tgagtttaat tcagccccac aatcacttct gtacagctac ccaccgctct 3000
agtcattccc acatttggcc tgctttcttt tcctctgtgg acaggggcac tgttctctac 3060
taatatccat ctcagagaga tacaggggca agtatccctc agcatccatt agaaataaag 3120
caggctcttg cttaaagtta ccagagcatc cacctctggg tgcaaagaca aattctctga 3180
atcaagtgag gggtctgggc aatgatctca caaggatttg atacctagga gtccccccat 3240
gcccatacaa gctcctcatc tttccactta cactttggga agctggctgt cgtgtacagg 3300
cagatgaagc tggaaaagag aggcatattc agtactcacg aattcaaaca gcttgaggga 3360
tttccggtga aagtcagtcc taaccagtgt atacgtacat acacaccaac atgtgtgaat 3420
gtgttgtgtg cacgtgtgtg cctgtacaag tccacatggc atatttacct gtcagggaca 3480
ggctatggac aatgactgtt tcttggactt tctcttaaaa agtcagatca gacaagttta 3540
ttttgtatac tttgggtaaa tgtgtggtat ttcgtgagtt tggcagtttg tgaaaaaaaa 3600
aaaaaaaaaa aaaaaaaaaa aaagctgcct gctctgagcc catggggcag gggcaatttt 3660
ttcatctgac aatctgcgtg cttttgtttt gcttgcttat tttggcccca caataccaca 3720
cccttttctt aactaacctc tttctacctg ggctggacgt gcctgggctc tcctccctgg 3780
ccccgctccc acctctccca ggtctctaaa cccctagaga acctgtgtca gtgttttgaa 3840
tccctcagtt gctctagcag gaaaactaga cagattagga gctggggcac atttggctga 3900
aagacagctc ttcgctttct tcttatgctg cttccccttc ctcttttccc aaatagatat 3960
ataaacacat gtattttcct gtttaaattg agcgaattgg tcccctgcct gtgccttgat 4020
ttagccattg ggctcagcct tgctcctccc ttccttactc ggataggagc cactgggatc 4080
tggagctcca gcttccaaat tgaagctggc ctcaggccag gtgacctttt ctttgtaagt 4140
ttctttccta agcgtggggt tggggggagg cggggaatgg ggggggttgc agggatctgt 4200
ttggtgctgt tgaagggggg gcgagtgagg aaaggagggg gctggaagag agtaaagggc 4260
tgttgttaaa cagtttctta ccgtaagagg gagttcagac ctagatcttt ccagttaatc 4320
acacaacaaa cttagctcat cgcaataaaa agcagctcag agccgactgg ctcttttagg 4380
cactgactcc gaacaggatt ctttcaccca ggcatctcct ccagagggat ccgccagccc 4440
gtccagcagc accatgtggg tgaccaaact cctgccagcc ctgctgctgc agcatgtcct 4500
cctgcatctc ctcctgctcc ccatcgccat cccctatgca ggttagttcc cttcttcttc 4560
ttcattatta gtattagtat ttaactctcc tgctaacctt ccctattcct tttaacaccc 4620
tctttttacc ctattcccag catcctttct gaactcagta tgtagtatag gtttctaaaa 4680
gctctcatta tgcttttttt gacattcttt tttgttgttg tttgaatagc atttaaaatg 4740
ataattaact ttccctcaac tcccctccac ctccaaccca agccccgtcc cacttagcct 4800
aatagttgtg gattatgaga tagggaggaa gtgctaatac tggctgaact tggctgcttt 4860
ggacaagttt aaagctaaag agagggtctg gtctgaagag gcaagagtga tggtcagtcc 4920
ggcaggaagt catccttttc cagagaacaa tttttcatga taatgcacta ctccacatca 4980
cctagtcaac atttggagcc aaattacgac tttgtacagg ttttcatttt gaggaggcag 5040
aataaactct gagtatttgc atatcataaa aatgaaagag aaagcctctt tttaaagatc 5100
ttattctttc tgggtacgga tgcctgccct ttgaaactgc agtgcacgga gactttgatt 5160
aaagctgcag aactgcccat ctctgtctcc cactttctcc cttggatttg ccgtttgggg 5220
aggagttgct tgaaagttca tattgcttgg agatttagag arctcgtttg ctgctctggg 5280
aagtttctct tgttatcagg gcaagaggaa acatctgtat tttgttgtat cattgtagag 5340
gctgaggtgc caacgggaga aggcagtgaa tatcaagggt aggcgcaggg gaataaaaga 5400
gtgggaacaa atgcccagat ggagacatgg cctttttaca atataaaaaa gagaactggc 5460
tgtatctttt gagatggtaa atatgacatt tatcagacct ttgatctagt ttttgatatg 5520
gtacaagggt taaaaaactc aagaattttc taaatgcaaa ggaaaatcat tcaacccacc 5580
tggttttctt ttattttgtg aagtggcccg tttggaaaat gacactgttt ggaaagggtc 5640
actctgaaag catttaggta agatttctga agaagtgaaa aagcagtgag ttcaaatcaa 5700
gcaggttatc atgcttgaca tgtgtcatgt taaaatcgct tcacagggtc gggtgcggtg 5760
gctcacgcct gtaatcccag cactttggga ggccgaggcg ggcagatcac gaggtcagga 5820
gattgagacc atcctagcta acaaggtgaa accctgtctc tactaaaaat acaaaaaatt 5880
agccaggcgt ggtggcaggc acctgtagtc ccacctactt gggaggctga ggcaggagac 5940
tctcttgaac ctgggaggtg ggggttgcag tgagccgaga ttgtgtcacc gcacttcagc 6000
ctggggaacg gagcaagact ccatctcaag aagaagaaga aaaaaatgct tcacagatga 6060
ctgctggttt aggggatttt gagcttaaat tgaaataatg gctaatattt tgagggtttt 6120
catttttaaa gattaaaatg tcactgttct taagtagaat ctggttacct gaattcatct 6180
gtgctaacgc aaggggaacg cagtgtggaa aacccaaaca gtagatcaac cgtaggcagt 6240
gtctatttgt tttcggcatg cattatgaac ttttggcagg agacatacat ttgtaattat 6300
atttcacttt gcctaatgta gaaatgactg tgtttcctga gtacaggcag aatgcagccc 6360
aagagtgctg gcaggcaagg agagtccagt tgggaattac aaatatgctg tgaataattc 6420
ctgaagtgga taattctaaa attgtcatca aaggagggtg cgcctttgtt tagatggcca 6480
gtttgatagt tttttttaat aacctttaaa ataaaaaata tgggtagcct cttagaacac 6540
acaaagtttg ttctttttta aatgacattt aatattgact atttagaggt ttcttttgtt 6600
gttactagct ttgattataa ttatttattc tatgaattta tatttgtatg tattgtaaaa 6660
taacacattg ttaggaaaga agtatatact gtaagttgac aaccagttat caacagaata 6720
cactatggag atactttttt aaaagcttaa gaaatattca atataatggg cccccgccat 6780
ctttgtagga gttagcctat atagaattac cctctattca ctcccaccta catgggaaac 6840
aaatatccaa tcctctgtaa taaaagaagc attaaatgag cacctaatat tcaagagtat 6900
gtgggggatg taaagatgaa caaataagaa aggaacttaa atttgttgag caactgatat 6960
gaaccaagta gtaaagtaca tctcacttaa ttctaataag 7000
<210>123
<211>21
<212>PRT
<213>Artificial
<220>
<223>zinc finger consensus
<220>
<221>MISC_FEATURE
<222>(2)..(2)
<223>any amino acid
<220>
<221>MISC_FEATURE
<222>(3)..(3)
<223>between 1 and 4 amino acids of any amino acid
<220>
<221>MISC_FEATURE
<222>(5)..(5)
<223>any amino acid
<220>
<221>MISC_FEATURE
<222>(6)..(6)
<223>any amino acid
<220>
<221>MISC_FEATURE
<222>(7)..(7)
<223>any amino acid
<220>
<221>MISC_FEATURE
<222>(8)..(8)
<223>any amino acid,often aromatic
<220>
<221>MISC_FEATURE
<222>(9)..(9)
<223>any amino acid
<220>
<221>MISC_FEATURE
<222>(10)..(10)
<223>any amino acid
<220>
<221>MISC_FEATURE
<222>(11)..(11)
<223>any amino acid
<220>
<221>MISC_FEATURE
<222>(12)..(12)
<223>any amino acid
<220>
<221>MISC_FEATURE
<222>(13)..(13)
<223>any amino acid
<220>
<221>MISC_FEATURE
<222>(14)..(14)
<223>any amino acid,often hydrophobic
<220>
<221>MISC_FEATURE
<222>(15)..(15)
<223>any amino acid
<220>
<221>MISC_FEATURE
<222>(16)..(16)
<223>any amino acid
<220>
<221>MISC_FEATURE
<222>(18)..(18)
<223>any amino acid
<220>
<221>MISC_FEATURE
<222>(19)..(19)
<223>any amino acid
<220>
<221>MISC_FEATURE
<222>(20)..(20)
<223>between one and three residues of any amino acid
<400>123
Cys Xaa Xaa Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
His Xaa Xaa Xaa His
20
<210>124
<211>21
<212>PRT
<213>Artificial
<220>
<223>RDER Motif for a zinc finger domain
<220>
<221>misc_feature
<222>(2)..(2)
<223>any amino acid
<220>
<221>misc_feature
<222>(3)..(3)
<223>between 1 to 4 residues of any amino acid
<220>
<221>misc_feature
<222>(5)..(7)
<223>any amino acid
<220>
<221>misc_feature
<222>(8)..(8)
<223>any amino acid,frequently aromatic
<220>
<221>misc_feature
<222>(9)..(9)
<223>any amino acid
<220>
<221>misc_feature
<222>(11)..(11)
<223>any amino acid
<220>
<221>misc_feature
<222>(14)..(14)
<223>any amino acid,typically hydrophobic
<220>
<221>misc_feature
<222>(15)..(15)
<223>any amino acid
<220>
<221>misc_feature
<222>(18)..(18)
<223>any amino acid
<220>
<221>misc_feature
<222>(19)..(19)
<223>any amino acid
<220>
<221>misc_feature
<222>(20)..(20)
<223>between 1 and 3 residues of any amino acid
<400>124
Cys Xaa Xaa Cys Xaa Xaa Xaa Xaa Xaa Arg Xaa Asp Glu Xaa Xaa Arg
1 5 10 15
His Xaa Xaa Xaa His
20
<210>125
<211>6
<212>PRT
<213>Artificial
<220>
<223>exemplary linker consensus
<220>
<221>misc_feature
<222>(3)..(3)
<223>Glu or Gln
<220>
<221>misc_feature
<222>(4)..(4)
<223>Arg or Lys
<220>
<221>misc_feature
<222>(6)..(6)
<223>Tyr or Phe
<400>125
Thr Gly Xaa Xaa Pro Xaa
1 5
<210>126
<211>30
<212>PRT
<213>Artificial
<220>
<223>Exemplary N-terminal sequences
<400>126
Met Val Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Glu Leu Pro Pro Lys
1 5 10 15
Lys Lys Arg Lys Val Gly Ile Arg Ile Pro Gly Glu Lys Pro
20 25 30
<210>127
<211>30
<212>DNA
<213>Artificial
<220>
<223>primer sequence
<400>127
cggggtaccc cctcccagtc actgactaac 30
<210>128
<211>30
<212>DNA
<213>Artificial
<220>
<223>primer sequence
<400>128
ccgctcgagt ccggcggtca cccccaaaag 30
<210>129
<211>89
<212>PRT
<213>Homo sapiens
<400>129
Glu Arg Pro Tyr Ala Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser
1 5 10 15
Arg Ser Asp Glu Leu Thr Arg His Ile Arg Ile His Thr Gly Gln Lys
20 25 30
Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp His
35 40 45
Leu Thr Thr His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys
50 55 60
Asp Ile Cys Gly Arg Lys Phe Ala Arg Ser Asp Glu Arg Lys Arg His
65 70 75 80
Thr Lys Ile His Leu Arg Gln Lys Asp
85
Claims (29)
1、一种包含DNA结合结构域的多肽,所述DNA结合结构域包括多个锌指结构域,其中
所述DNA结合结构域可结合VEGF基因中的位点,且
所述锌指结构域中的至少两个各自包括表1、表2、表3、表4或表5的第2栏中列出的相应的锌指结构域基序。
2、权利要求1的多肽,其中所述锌指结构域各自包括表1或表3的第2栏中列出的相应的锌指结构域基序。
3、权利要求2的多肽,其中所述锌指结构域选自表1或表3的第3栏中列出的锌指结构域。
4、权利要求3的多肽,其中所述DNA结合结构域包括,按照从N端到C端的顺序,第一、第二和第三锌指结构域,其中
(1)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是QSHR、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是RDHT、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是RSX1R,其中X1是H或N;
(2)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是QSHX2、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是RX3HR、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是RDHT,其中X2是T或V,且X3是S或D;
(3)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是RSHR、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是RDHT、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是VSNV;
(4)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是RDER、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是QSSR、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是QSHT;
(5)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是QSSR、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是QSHT、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是RSNR;
(6)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是QSNR、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是QSHR、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是RDHT;
(7)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是QSHR、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是RDHT、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是RSNR;
(8)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是RSHR、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是QSHT、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是RSHR;
(9)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是QSHT、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是RSHR、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是RDER;
(10)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是QSNR、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是RSHR、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是QSSR;
(11)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是RSHR、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是QSSR、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是RSHR;
(12)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是QSHT、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是WSNR、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是RSHR;或
(13)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是WSNR、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是RSHR、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是WSNR。
5、权利要求2的多肽,其中所述锌指结构域选自表2、表4或表5的第3栏中列出的锌指结构域。
6、权利要求1的多肽,其中所述VEGF基因是人VEGF-A基因。
7、权利要求1的多肽,其调节VEGF基因表达。
8、权利要求1的多肽,其中所述多肽进一步包含转录激活结构域、转录阻抑结构域或蛋白转导结构域。
9、权利要求8的多肽,其中所述转录激活结构域包含p65或VP16激活结构域。
10、权利要求8的多肽,其中所述转录阻抑结构域包含Kid或KOX阻抑结构域。
11、权利要求8的多肽,其中所述蛋白转导结构域是TAT蛋白、VP22蛋白或触角足同源结构域的一部分。
12、一种核酸,其包含编码权利要求1的多肽的序列。
13、权利要求12的核酸,其包含编码权利要求8的多肽的序列。
14、一种修饰的哺乳动物细胞,其含有权利要求1的多肽。
15、权利要求14的细胞,其中所述多肽由所述细胞中的权利要求14的核酸产生。
16、一种用于预防或治疗瘤形成疾病、炎症性疾病或基于血管发生的疾病的药物组合物,其包含权利要求1的多肽、权利要求12的核酸或权利要求14的修饰的哺乳动物细胞以及药物学可接受的载体。
17、权利要求16的药物组合物,其中所述瘤形成疾病是癌症。
18、权利要求16的药物组合物,其中所述多肽中包括的锌指结构域选自表1或表3的第3栏中列出的锌指结构域。
19、权利要求18的药物组合物,其中所述多肽包含DNA结合结构域,所述DNA结合结构域包括,按照从N端到C端的顺序,第一、第二和第三锌指结构域,其中
(1)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是QSHR、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是RDHT、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是RSX1R,其中X1是H或N;
(2)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是QSHX2、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是RX3HR、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是RDHT,其中X2是T或V,且X3是S或D;
(3)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是RSHR、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是RDHT、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是VSNV;
(4)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是RDER、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是QSSR、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是QSHT;
(5)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是QSSR、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是QSHT、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是RSNR;
(6)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是QSNR、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是QSHR、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是RDHT;
(7)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是QSHR、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是RDHT、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是RSNR;
(8)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是RSHR、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是QSHT、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是RSHR;
(9)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是QSHT、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是RSHR、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是RDER;
(10)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是QSNR、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是RSHR、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是QSSR;
(11)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是RSHR、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是QSSR、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是RSHR;
(12)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是QSHT、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是WSNR、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是RSHR;或
(13)所述第一锌指结构域的第-1、2、3和6位DNA接触残基是WSNR、所述第二锌指结构域的第-1、2、3和6位DNA接触残基是RSHR、且所述第三锌指结构域的第-1、2、3和6位DNA接触残基是WSNR。
20、一种包囊化的组合物,其包含
由生物相容性材料组成的包囊层,其能透过分子量为至少10kDa的蛋白质,和
重组的哺乳动物细胞,其中所述细胞含有一种核酸,所述核酸包含编码一种调节分泌因子产生的嵌合型锌指蛋白的序列。
21、权利要求20的包囊化的组合物,其中所述分泌因子是胰岛素、胰岛素样生长因子、VEGF、HGF、干扰素、白介素或成纤维细胞生长因子。
22、一种调节VEGF基因表达的方法,其包含
将权利要求1的多肽或权利要求12的核酸导入细胞。
23、权利要求22的方法,其中所述多肽包含转录激活结构域,且VEGF基因表达在所述细胞中是增强的。
24、权利要求22的方法,其中所述多肽包含转录阻抑结构域,且VEGF基因表达在所述细胞中是降低的。
25、权利要求22的方法,其中所述VEGF基因是人VEGF-A基因。
26、权利要求22的方法,其中所述细胞是哺乳动物细胞。
27、权利要求26的方法,其中所述细胞是人的细胞。
28、一种在对象中调节血管发生的方法,其包含
给所述对象施用权利要求16的组合物,所述组合物的量有效降低所述对象的血管发生。
29、权利要求28的方法,其中所述对象是患有癌症或疑似患有癌症的人。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US43189202P | 2002-12-09 | 2002-12-09 | |
US60/431,892 | 2002-12-09 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1723284A true CN1723284A (zh) | 2006-01-18 |
CN100398652C CN100398652C (zh) | 2008-07-02 |
Family
ID=32507817
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2003801054757A Expired - Fee Related CN100398652C (zh) | 2002-12-09 | 2003-12-09 | 调节性锌指蛋白 |
Country Status (8)
Country | Link |
---|---|
US (2) | US20050032186A1 (zh) |
EP (1) | EP1570058A1 (zh) |
JP (1) | JP2006508675A (zh) |
KR (1) | KR100766952B1 (zh) |
CN (1) | CN100398652C (zh) |
AU (1) | AU2003302752A1 (zh) |
CA (1) | CA2508631A1 (zh) |
WO (1) | WO2004053130A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106232827A (zh) * | 2014-02-21 | 2016-12-14 | 哈佛学院董事及会员团体 | 变构蛋白的从头设计 |
CN114250238A (zh) * | 2021-11-26 | 2022-03-29 | 北京航空航天大学 | 基因编码的神经元发育调控多肽及其应用 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060182736A1 (en) * | 2003-06-10 | 2006-08-17 | Kim Jin-Soo | Transducible dna-binding proteins |
KR20060123382A (ko) * | 2003-12-23 | 2006-12-01 | 주식회사 툴젠 | 징크 핑거 단백질을 이용한 원핵세포의 유전자 발현 조절 |
CA2561714A1 (en) * | 2004-04-08 | 2005-10-27 | Sangamo Biosciences, Inc. | Methods and compositions for treating neuropathic and neurodegenerative conditions |
KR100756055B1 (ko) * | 2006-01-27 | 2007-09-07 | 연세대학교 산학협력단 | 신생혈관 생성을 조절하는 재조합 아데노바이러스 |
CA2638915A1 (en) * | 2006-02-10 | 2007-08-23 | The Regents Of The University Of California | Transducible delivery of sirna by dsrna binding domain fusions to ptd/cpps |
KR20100080068A (ko) * | 2008-12-31 | 2010-07-08 | 주식회사 툴젠 | 신규한 징크 핑거 뉴클레아제 및 이의 용도 |
AU2013222935B2 (en) | 2012-02-24 | 2016-03-10 | Alteogen Inc. | Modified antibody in which motif comprising cysteine residue is bound, modified antibody-drug conjugate comprising the modified antibody, and production method for same |
JP2015529073A (ja) | 2012-08-20 | 2015-10-05 | ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア | 生物可逆性基を有するポリヌクレオチド |
US11306328B2 (en) * | 2013-07-26 | 2022-04-19 | President And Fellows Of Harvard College | Genome engineering |
KR101676690B1 (ko) | 2015-08-04 | 2016-11-16 | (주) 에빅스젠 | Vegf 유도-혈관신생 억제효과를 갖는 테트라펩티드 및 이의 용도 |
US20210107955A1 (en) * | 2019-09-19 | 2021-04-15 | Helix Nanotechnologies, Inc. | Mutant myc fusion polypeptides and uses thereof |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5763209A (en) * | 1988-09-26 | 1998-06-09 | Arch Development Corporation | Methods and materials relating to the functional domains of DNA binding proteins |
US6107059A (en) * | 1992-04-29 | 2000-08-22 | Affymax Technologies N.V. | Peptide library and screening method |
US6242568B1 (en) * | 1994-01-18 | 2001-06-05 | The Scripps Research Institute | Zinc finger protein derivatives and methods therefor |
US6140466A (en) * | 1994-01-18 | 2000-10-31 | The Scripps Research Institute | Zinc finger protein derivatives and methods therefor |
US5882941A (en) * | 1994-05-04 | 1999-03-16 | Massachusette Institute Of Technology | Programmable genotoxic agents and uses therefor |
USRE45795E1 (en) * | 1994-08-20 | 2015-11-10 | Gendaq, Ltd. | Binding proteins for recognition of DNA |
GB9824544D0 (en) * | 1998-11-09 | 1999-01-06 | Medical Res Council | Screening system |
US6326166B1 (en) * | 1995-12-29 | 2001-12-04 | Massachusetts Institute Of Technology | Chimeric DNA-binding proteins |
US5789538A (en) * | 1995-02-03 | 1998-08-04 | Massachusetts Institute Of Technology | Zinc finger proteins with high affinity new DNA binding specificities |
US6013780A (en) * | 1996-09-06 | 2000-01-11 | Technion Research & Development Co. Ltd. | VEGF145 expression vectors |
US6235538B1 (en) * | 1997-03-05 | 2001-05-22 | The Board Of Regents Of The University Of Oklahoma | Test for detecting substances which alter the conformational structure of zinc fingers |
US20030073169A1 (en) * | 1997-09-18 | 2003-04-17 | Genentech, Inc. | Secreted and transmembrane polypeptides and nucleic acids encoding the same |
AU746454B2 (en) * | 1998-03-02 | 2002-05-02 | Massachusetts Institute Of Technology | Poly zinc finger proteins with improved linkers |
US6599692B1 (en) * | 1999-09-14 | 2003-07-29 | Sangamo Bioscience, Inc. | Functional genomics using zinc finger proteins |
US6534261B1 (en) * | 1999-01-12 | 2003-03-18 | Sangamo Biosciences, Inc. | Regulation of endogenous gene expression in cells using zinc finger proteins |
US6453242B1 (en) * | 1999-01-12 | 2002-09-17 | Sangamo Biosciences, Inc. | Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites |
ATE309536T1 (de) * | 1999-12-06 | 2005-11-15 | Sangamo Biosciences Inc | Methoden zur verwendung von randomisierten zinkfingerprotein-bibliotheken zur identifizierung von genfunktionen |
WO2001059450A2 (en) * | 2000-02-08 | 2001-08-16 | Sangamo Biosciences, Inc. | Cells expressing zinc finger protein for drug discovery |
US20020061512A1 (en) * | 2000-02-18 | 2002-05-23 | Kim Jin-Soo | Zinc finger domains and methods of identifying same |
US20020064802A1 (en) * | 2000-04-28 | 2002-05-30 | Eva Raschke | Methods for binding an exogenous molecule to cellular chromatin |
WO2001083819A2 (en) * | 2000-04-28 | 2001-11-08 | Sangamo Biosciences, Inc. | Methods for designing exogenous regulatory molecules |
US20030044787A1 (en) * | 2000-05-16 | 2003-03-06 | Joung J. Keith | Methods and compositions for interaction trap assays |
US6492117B1 (en) * | 2000-07-12 | 2002-12-10 | Gendaq Limited | Zinc finger polypeptides capable of binding DNA quadruplexes |
US7067317B2 (en) * | 2000-12-07 | 2006-06-27 | Sangamo Biosciences, Inc. | Regulation of angiogenesis with zinc finger proteins |
US7026462B2 (en) * | 2000-12-07 | 2006-04-11 | Sangamo Biosciences, Inc. | Regulation of angiogenesis with zinc finger proteins |
US7067617B2 (en) * | 2001-02-21 | 2006-06-27 | The Scripps Research Institute | Zinc finger binding domains for nucleotide sequence ANN |
CA2457095A1 (en) * | 2001-08-17 | 2003-02-27 | Toolgen, Inc. | Zinc finger domain libraries |
WO2003048345A1 (en) * | 2001-12-07 | 2003-06-12 | Toolgen, Inc. | Phenotypic screen of chimeric proteins |
-
2003
- 2003-12-09 CN CNB2003801054757A patent/CN100398652C/zh not_active Expired - Fee Related
- 2003-12-09 US US10/732,620 patent/US20050032186A1/en not_active Abandoned
- 2003-12-09 AU AU2003302752A patent/AU2003302752A1/en not_active Abandoned
- 2003-12-09 KR KR1020057010388A patent/KR100766952B1/ko not_active IP Right Cessation
- 2003-12-09 CA CA002508631A patent/CA2508631A1/en not_active Abandoned
- 2003-12-09 US US10/538,041 patent/US20060251643A1/en not_active Abandoned
- 2003-12-09 EP EP03812718A patent/EP1570058A1/en not_active Withdrawn
- 2003-12-09 WO PCT/KR2003/002693 patent/WO2004053130A1/en not_active Application Discontinuation
- 2003-12-09 JP JP2004558531A patent/JP2006508675A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106232827A (zh) * | 2014-02-21 | 2016-12-14 | 哈佛学院董事及会员团体 | 变构蛋白的从头设计 |
US10920217B2 (en) | 2014-02-21 | 2021-02-16 | President And Fellows Of Harvard College | De novo design of allosteric proteins |
CN114250238A (zh) * | 2021-11-26 | 2022-03-29 | 北京航空航天大学 | 基因编码的神经元发育调控多肽及其应用 |
CN114250238B (zh) * | 2021-11-26 | 2023-08-25 | 北京航空航天大学 | 基因编码的神经元发育调控多肽及其应用 |
Also Published As
Publication number | Publication date |
---|---|
CN100398652C (zh) | 2008-07-02 |
KR100766952B1 (ko) | 2007-10-17 |
CA2508631A1 (en) | 2004-06-24 |
EP1570058A1 (en) | 2005-09-07 |
US20050032186A1 (en) | 2005-02-10 |
WO2004053130A1 (en) | 2004-06-24 |
JP2006508675A (ja) | 2006-03-16 |
AU2003302752A1 (en) | 2004-06-30 |
US20060251643A1 (en) | 2006-11-09 |
KR20050085448A (ko) | 2005-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1836048A (zh) | 可转导的dna结合蛋白 | |
CN1269958C (zh) | 用于gnn的锌指结合结构域 | |
CN1310942C (zh) | 校正基因 | |
CN1561394A (zh) | 人嗜中性粒细胞明胶酶相关脂卡林及有关蛋白的突变蛋白 | |
CN1197966C (zh) | 肿瘤坏死因子受体相关因子的调节剂、及其制备和用途 | |
CN1416467A (zh) | 锌指结构域及其鉴定方法 | |
CN1871256A (zh) | 泪脂质运载蛋白的突变蛋白 | |
CN1723284A (zh) | 调节性锌指蛋白 | |
CN1852980A (zh) | 用于神经营养蛋白受体介导的基因送递及作为神经营养蛋白激动剂的重组多肽 | |
CN1649895A (zh) | 有效治疗肿瘤和其它需要除去或破坏细胞的疾病的肽 | |
CN1117876C (zh) | 刺激促生长素抑制素和胰岛素产生的化合物的筛选方法 | |
CN1993463A (zh) | 促滤泡素抑制素突变多肽 | |
CN1253565A (zh) | 能调节对细胞因子的细胞反应性的治疗和诊断制剂 | |
CN1141059A (zh) | P53-结合多肽和编码该多肽的多核苷酸 | |
CN1289522C (zh) | 锌指结构域文库 | |
CN1886148A (zh) | 被设计用于破坏NEMO寡聚化的肽对NF-κB活化的选择性抑制 | |
CN1720442A (zh) | 复制蛋白ciz1 | |
CN1468306A (zh) | 与精神分裂症相关的基因及蛋白质 | |
CN1733806A (zh) | 一种多肽随机文库及其构建方法和从该文库中筛选细胞穿透多肽的方法 | |
CN1166777C (zh) | 人sel-10多肽及编码其的多核苷酸 | |
CN1745094A (zh) | 肽,其抗体,以及它们在中枢神经系统损伤的治疗中的用途 | |
CN1761472A (zh) | 细胞表面蛋白质的调节 | |
CN1295614A (zh) | Tnf/ngf受体家族和其它蛋白质的受体的功能的调节剂 | |
CN1384878A (zh) | Iren蛋白,其制备和应用 | |
CN1932016A (zh) | 影响sre活性的多核苷酸及其编码多肽和用途 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20080702 Termination date: 20100111 |