JPS60501737A - 上皮成長因子のハイブリドdna合成 - Google Patents
上皮成長因子のハイブリドdna合成Info
- Publication number
- JPS60501737A JPS60501737A JP84502699A JP50269984A JPS60501737A JP S60501737 A JPS60501737 A JP S60501737A JP 84502699 A JP84502699 A JP 84502699A JP 50269984 A JP50269984 A JP 50269984A JP S60501737 A JPS60501737 A JP S60501737A
- Authority
- JP
- Japan
- Prior art keywords
- ser
- leu
- gly
- pro
- asp
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- VBEQCZHXXJYVRD-GACYYNSASA-N uroanthelone Chemical compound C([C@@H](C(=O)N[C@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C(C)C)[C@@H](C)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)CNC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CO)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)CNC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C1=CC=C(O)C=C1 VBEQCZHXXJYVRD-GACYYNSASA-N 0.000 title description 38
- 101800003838 Epidermal growth factor Proteins 0.000 title description 37
- 229940116977 epidermal growth factor Drugs 0.000 title description 36
- 230000006820 DNA synthesis Effects 0.000 title description 4
- 102000009024 Epidermal Growth Factor Human genes 0.000 title 1
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 30
- 239000002773 nucleotide Substances 0.000 claims description 19
- 239000012634 fragment Substances 0.000 claims description 18
- 125000003729 nucleotide group Chemical group 0.000 claims description 18
- 108020004414 DNA Proteins 0.000 claims description 15
- 108090000623 proteins and genes Proteins 0.000 claims description 12
- 230000010076 replication Effects 0.000 claims description 11
- 241000124008 Mammalia Species 0.000 claims description 3
- 230000002093 peripheral effect Effects 0.000 claims description 2
- 125000003275 alpha amino acid group Chemical group 0.000 claims 1
- 108091033319 polynucleotide Proteins 0.000 claims 1
- 239000002157 polynucleotide Substances 0.000 claims 1
- 102000040430 polynucleotide Human genes 0.000 claims 1
- 102400001368 Epidermal growth factor Human genes 0.000 description 36
- 102000004196 processed proteins & peptides Human genes 0.000 description 29
- 108090000765 processed proteins & peptides Proteins 0.000 description 29
- 150000001413 amino acids Chemical class 0.000 description 25
- 229920001184 polypeptide Polymers 0.000 description 21
- 235000001014 amino acid Nutrition 0.000 description 17
- 239000002299 complementary DNA Substances 0.000 description 15
- 239000002243 precursor Substances 0.000 description 11
- 101000851196 Mus musculus Pro-epidermal growth factor Proteins 0.000 description 9
- 235000018102 proteins Nutrition 0.000 description 9
- 102000004169 proteins and genes Human genes 0.000 description 9
- 238000013519 translation Methods 0.000 description 9
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 8
- 210000001913 submandibular gland Anatomy 0.000 description 6
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 5
- 108020004999 messenger RNA Proteins 0.000 description 5
- 238000000034 method Methods 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 101100118545 Holotrichia diomphalia EGF-like gene Proteins 0.000 description 4
- 101000851176 Homo sapiens Pro-epidermal growth factor Proteins 0.000 description 4
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 4
- 241000699666 Mus <mouse, genus> Species 0.000 description 4
- 241000699670 Mus sp. Species 0.000 description 4
- 108010060199 cysteinylproline Proteins 0.000 description 4
- 239000003102 growth factor Substances 0.000 description 4
- 229940088597 hormone Drugs 0.000 description 4
- 239000005556 hormone Substances 0.000 description 4
- GVUGOAYIVIDWIO-UFWWTJHBSA-N nepidermin Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)NC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H](CS)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CS)NC(=O)[C@H](C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)NC(=O)[C@@H](NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CS)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O)C(C)C)[C@@H](C)CC)C(C)C)C(C)C)C1=CC=C(O)C=C1 GVUGOAYIVIDWIO-UFWWTJHBSA-N 0.000 description 4
- 239000000523 sample Substances 0.000 description 4
- 241000894006 Bacteria Species 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 3
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 3
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 3
- 108700026244 Open Reading Frames Proteins 0.000 description 3
- XQJCEKXQUJQNNK-ZLUOBGJFSA-N Ser-Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O XQJCEKXQUJQNNK-ZLUOBGJFSA-N 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 108010093581 aspartyl-proline Proteins 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 3
- 108010057821 leucylproline Proteins 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000013612 plasmid Substances 0.000 description 3
- CCUAQNUWXLYFRA-IMJSIDKUSA-N Ala-Asn Chemical compound C[C@H]([NH3+])C(=O)N[C@H](C([O-])=O)CC(N)=O CCUAQNUWXLYFRA-IMJSIDKUSA-N 0.000 description 2
- XEPSCVXTCUUHDT-AVGNSLFASA-N Arg-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCN=C(N)N XEPSCVXTCUUHDT-AVGNSLFASA-N 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 2
- 102000005593 Endopeptidases Human genes 0.000 description 2
- 108010059378 Endopeptidases Proteins 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- MYGQXVYRZMKRDB-SRVKXCTJSA-N Leu-Asp-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN MYGQXVYRZMKRDB-SRVKXCTJSA-N 0.000 description 2
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 2
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 2
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- MKGIILKDUGDRRO-FXQIFTODSA-N Pro-Ser-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 MKGIILKDUGDRRO-FXQIFTODSA-N 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 101000757182 Saccharomyces cerevisiae Glucoamylase S2 Proteins 0.000 description 2
- 102000009618 Transforming Growth Factors Human genes 0.000 description 2
- 108010009583 Transforming Growth Factors Proteins 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 210000004748 cultured cell Anatomy 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 229940066758 endopeptidases Drugs 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- 108010050848 glycylleucine Proteins 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- 108010077515 glycylproline Proteins 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 239000003226 mitogen Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 210000004498 neuroglial cell Anatomy 0.000 description 2
- -1 phosphoryl residues Chemical group 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 108010048818 seryl-histidine Proteins 0.000 description 2
- 235000011178 triphosphate Nutrition 0.000 description 2
- 239000001226 triphosphate Substances 0.000 description 2
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 2
- VKIGAWAEXPTIOL-UHFFFAOYSA-N 2-hydroxyhexanenitrile Chemical compound CCCCC(O)C#N VKIGAWAEXPTIOL-UHFFFAOYSA-N 0.000 description 1
- IMIZPWSVYADSCN-UHFFFAOYSA-N 4-methyl-2-[[4-methyl-2-[[4-methyl-2-(pyrrolidine-2-carbonylamino)pentanoyl]amino]pentanoyl]amino]pentanoic acid Chemical compound CC(C)CC(C(O)=O)NC(=O)C(CC(C)C)NC(=O)C(CC(C)C)NC(=O)C1CCCN1 IMIZPWSVYADSCN-UHFFFAOYSA-N 0.000 description 1
- 101150039109 AAC3 gene Proteins 0.000 description 1
- 102100026397 ADP/ATP translocase 3 Human genes 0.000 description 1
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- UQJUGHFKNKGHFQ-VZFHVOOUSA-N Ala-Cys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UQJUGHFKNKGHFQ-VZFHVOOUSA-N 0.000 description 1
- BTBUEVAGZCKULD-XPUUQOCRSA-N Ala-Gly-His Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CN=CN1 BTBUEVAGZCKULD-XPUUQOCRSA-N 0.000 description 1
- LMFXXZPPZDCPTA-ZKWXMUAHSA-N Ala-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N LMFXXZPPZDCPTA-ZKWXMUAHSA-N 0.000 description 1
- SDZRIBWEVVRDQI-CIUDSAMLSA-N Ala-Lys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O SDZRIBWEVVRDQI-CIUDSAMLSA-N 0.000 description 1
- CHFFHQUVXHEGBY-GARJFASQSA-N Ala-Lys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CHFFHQUVXHEGBY-GARJFASQSA-N 0.000 description 1
- XWFWAXPOLRTDFZ-FXQIFTODSA-N Ala-Pro-Ser Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O XWFWAXPOLRTDFZ-FXQIFTODSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- OAIGZYFGCNNVIE-ZPFDUUQYSA-N Ala-Val-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O OAIGZYFGCNNVIE-ZPFDUUQYSA-N 0.000 description 1
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 1
- YFWTXMRJJDNTLM-LSJOCFKGSA-N Arg-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YFWTXMRJJDNTLM-LSJOCFKGSA-N 0.000 description 1
- DBKNLHKEVPZVQC-LPEHRKFASA-N Arg-Ala-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O DBKNLHKEVPZVQC-LPEHRKFASA-N 0.000 description 1
- BHSYMWWMVRPCPA-CYDGBPFRSA-N Arg-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCN=C(N)N BHSYMWWMVRPCPA-CYDGBPFRSA-N 0.000 description 1
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 1
- MFAMTAVAFBPXDC-LPEHRKFASA-N Arg-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O MFAMTAVAFBPXDC-LPEHRKFASA-N 0.000 description 1
- OSASDIVHOSJVII-WDSKDSINSA-N Arg-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCNC(N)=N OSASDIVHOSJVII-WDSKDSINSA-N 0.000 description 1
- IGULQRCJLQQPSM-DCAQKATOSA-N Arg-Cys-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O IGULQRCJLQQPSM-DCAQKATOSA-N 0.000 description 1
- XLWSGICNBZGYTA-CIUDSAMLSA-N Arg-Glu-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XLWSGICNBZGYTA-CIUDSAMLSA-N 0.000 description 1
- XUUXCWCKKCZEAW-YFKPBYRVSA-N Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N XUUXCWCKKCZEAW-YFKPBYRVSA-N 0.000 description 1
- AQPVUEJJARLJHB-BQBZGAKWSA-N Arg-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N AQPVUEJJARLJHB-BQBZGAKWSA-N 0.000 description 1
- YKBHOXLMMPZPHQ-GMOBBJLQSA-N Arg-Ile-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O YKBHOXLMMPZPHQ-GMOBBJLQSA-N 0.000 description 1
- AGVNTAUPLWIQEN-ZPFDUUQYSA-N Arg-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AGVNTAUPLWIQEN-ZPFDUUQYSA-N 0.000 description 1
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 1
- GMFAGHNRXPSSJS-SRVKXCTJSA-N Arg-Leu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O GMFAGHNRXPSSJS-SRVKXCTJSA-N 0.000 description 1
- RIIVUOJDDQXHRV-SRVKXCTJSA-N Arg-Lys-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O RIIVUOJDDQXHRV-SRVKXCTJSA-N 0.000 description 1
- GSUFZRURORXYTM-STQMWFEESA-N Arg-Phe-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 GSUFZRURORXYTM-STQMWFEESA-N 0.000 description 1
- WKPXXXUSUHAXDE-SRVKXCTJSA-N Arg-Pro-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O WKPXXXUSUHAXDE-SRVKXCTJSA-N 0.000 description 1
- ATABBWFGOHKROJ-GUBZILKMSA-N Arg-Pro-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O ATABBWFGOHKROJ-GUBZILKMSA-N 0.000 description 1
- AUIJUTGLPVHIRT-FXQIFTODSA-N Arg-Ser-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)CN=C(N)N AUIJUTGLPVHIRT-FXQIFTODSA-N 0.000 description 1
- TWVTVZUGEDBAJF-ACZMJKKPSA-N Asn-Cys-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N TWVTVZUGEDBAJF-ACZMJKKPSA-N 0.000 description 1
- QRHYAUYXBVVDSB-LKXGYXEUSA-N Asn-Cys-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QRHYAUYXBVVDSB-LKXGYXEUSA-N 0.000 description 1
- MECFLTFREHAZLH-ACZMJKKPSA-N Asn-Glu-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N MECFLTFREHAZLH-ACZMJKKPSA-N 0.000 description 1
- KLKHFFMNGWULBN-VKHMYHEASA-N Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)NCC(O)=O KLKHFFMNGWULBN-VKHMYHEASA-N 0.000 description 1
- MYCSPQIARXTUTP-SRVKXCTJSA-N Asn-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N MYCSPQIARXTUTP-SRVKXCTJSA-N 0.000 description 1
- ALHMNHZJBYBYHS-DCAQKATOSA-N Asn-Lys-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ALHMNHZJBYBYHS-DCAQKATOSA-N 0.000 description 1
- MYTHOBCLNIOFBL-SRVKXCTJSA-N Asn-Ser-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYTHOBCLNIOFBL-SRVKXCTJSA-N 0.000 description 1
- ZUFPUBYQYWCMDB-NUMRIWBASA-N Asn-Thr-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZUFPUBYQYWCMDB-NUMRIWBASA-N 0.000 description 1
- PQKSVQSMTHPRIB-ZKWXMUAHSA-N Asn-Val-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O PQKSVQSMTHPRIB-ZKWXMUAHSA-N 0.000 description 1
- ICAYWNTWHRRAQP-FXQIFTODSA-N Asp-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N)CN=C(N)N ICAYWNTWHRRAQP-FXQIFTODSA-N 0.000 description 1
- HMQDRBKQMLRCCG-GMOBBJLQSA-N Asp-Arg-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HMQDRBKQMLRCCG-GMOBBJLQSA-N 0.000 description 1
- SDHFVYLZFBDSQT-DCAQKATOSA-N Asp-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N SDHFVYLZFBDSQT-DCAQKATOSA-N 0.000 description 1
- WCFCYFDBMNFSPA-ACZMJKKPSA-N Asp-Asp-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(O)=O WCFCYFDBMNFSPA-ACZMJKKPSA-N 0.000 description 1
- KVPHTGVUMJGMCX-BIIVOSGPSA-N Asp-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N)C(=O)O KVPHTGVUMJGMCX-BIIVOSGPSA-N 0.000 description 1
- LJRPYAZQQWHEEV-FXQIFTODSA-N Asp-Gln-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O LJRPYAZQQWHEEV-FXQIFTODSA-N 0.000 description 1
- RATOMFTUDRYMKX-ACZMJKKPSA-N Asp-Glu-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N RATOMFTUDRYMKX-ACZMJKKPSA-N 0.000 description 1
- VIRHEUMYXXLCBF-WDSKDSINSA-N Asp-Gly-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O VIRHEUMYXXLCBF-WDSKDSINSA-N 0.000 description 1
- PSLSTUMPZILTAH-BYULHYEWSA-N Asp-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PSLSTUMPZILTAH-BYULHYEWSA-N 0.000 description 1
- PZXPWHFYZXTFBI-YUMQZZPRSA-N Asp-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PZXPWHFYZXTFBI-YUMQZZPRSA-N 0.000 description 1
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 1
- WYOSXGYAKZQPGF-SRVKXCTJSA-N Asp-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)O)N WYOSXGYAKZQPGF-SRVKXCTJSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 1
- UAXIKORUDGGIGA-DCAQKATOSA-N Asp-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CCCCN)C(=O)O UAXIKORUDGGIGA-DCAQKATOSA-N 0.000 description 1
- ZARXTZFGQZBYFO-JQWIXIFHSA-N Asp-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(O)=O)N)C(O)=O)=CNC2=C1 ZARXTZFGQZBYFO-JQWIXIFHSA-N 0.000 description 1
- KACWACLNYLSVCA-VHWLVUOQSA-N Asp-Trp-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KACWACLNYLSVCA-VHWLVUOQSA-N 0.000 description 1
- VHUKCUHLFMRHOD-MELADBBJSA-N Asp-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O VHUKCUHLFMRHOD-MELADBBJSA-N 0.000 description 1
- 101150054111 Aspg gene Proteins 0.000 description 1
- 101000798396 Bacillus licheniformis Phenylalanine racemase [ATP hydrolyzing] Proteins 0.000 description 1
- 235000017166 Bambusa arundinacea Nutrition 0.000 description 1
- 235000017491 Bambusa tulda Nutrition 0.000 description 1
- 101000644385 Brevibacillus parabrevis ATP-dependent leucine adenylase Proteins 0.000 description 1
- 101000644386 Brevibacillus parabrevis Phenylalanine racemase [ATP-hydrolyzing] Proteins 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- 241001227713 Chiron Species 0.000 description 1
- 101000906861 Chondromyces crocatus ATP-dependent tyrosine adenylase Proteins 0.000 description 1
- TVYMKYUSZSVOAG-ZLUOBGJFSA-N Cys-Ala-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O TVYMKYUSZSVOAG-ZLUOBGJFSA-N 0.000 description 1
- OCEHKDFAWQIBHH-FXQIFTODSA-N Cys-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N OCEHKDFAWQIBHH-FXQIFTODSA-N 0.000 description 1
- CLDCTNHPILWQCW-CIUDSAMLSA-N Cys-Arg-Glu Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N CLDCTNHPILWQCW-CIUDSAMLSA-N 0.000 description 1
- AYKQJQVWUYEZNU-IMJSIDKUSA-N Cys-Asn Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O AYKQJQVWUYEZNU-IMJSIDKUSA-N 0.000 description 1
- ASHTVGGFIMESRD-LKXGYXEUSA-N Cys-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N)O ASHTVGGFIMESRD-LKXGYXEUSA-N 0.000 description 1
- YRKJQKATZOTUEN-ACZMJKKPSA-N Cys-Gln-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N YRKJQKATZOTUEN-ACZMJKKPSA-N 0.000 description 1
- SKSJPIBFNFPTJB-NKWVEPMBSA-N Cys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CS)N)C(=O)O SKSJPIBFNFPTJB-NKWVEPMBSA-N 0.000 description 1
- LKUCSUGWHYVYLP-GHCJXIJMSA-N Cys-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CS)N LKUCSUGWHYVYLP-GHCJXIJMSA-N 0.000 description 1
- CYHMMWIOEUVHHZ-IHRRRGAJSA-N Cys-Met-Tyr Chemical compound SC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CYHMMWIOEUVHHZ-IHRRRGAJSA-N 0.000 description 1
- RJPKQCFHEPPTGL-ZLUOBGJFSA-N Cys-Ser-Asp Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RJPKQCFHEPPTGL-ZLUOBGJFSA-N 0.000 description 1
- ZGERHCJBLPQPGV-ACZMJKKPSA-N Cys-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N ZGERHCJBLPQPGV-ACZMJKKPSA-N 0.000 description 1
- FTTZLFIEUQHLHH-BWBBJGPYSA-N Cys-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N)O FTTZLFIEUQHLHH-BWBBJGPYSA-N 0.000 description 1
- KZZYVYWSXMFYEC-DCAQKATOSA-N Cys-Val-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KZZYVYWSXMFYEC-DCAQKATOSA-N 0.000 description 1
- LPBUBIHAVKXUOT-FXQIFTODSA-N Cys-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N LPBUBIHAVKXUOT-FXQIFTODSA-N 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- DXJZITDUDUPINW-WHFBIAKZSA-N Gln-Asn Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O DXJZITDUDUPINW-WHFBIAKZSA-N 0.000 description 1
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 1
- 101000888786 Gloeobacter violaceus (strain ATCC 29082 / PCC 7421) Proton-gated ion channel Proteins 0.000 description 1
- OJGLIOXAKGFFDW-SRVKXCTJSA-N Glu-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N OJGLIOXAKGFFDW-SRVKXCTJSA-N 0.000 description 1
- AKJRHDMTEJXTPV-ACZMJKKPSA-N Glu-Asn-Ala Chemical compound C[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O AKJRHDMTEJXTPV-ACZMJKKPSA-N 0.000 description 1
- DSPQRJXOIXHOHK-WDSKDSINSA-N Glu-Asp-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O DSPQRJXOIXHOHK-WDSKDSINSA-N 0.000 description 1
- OWVURWCRZZMAOZ-XHNCKOQMSA-N Glu-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N)C(=O)O OWVURWCRZZMAOZ-XHNCKOQMSA-N 0.000 description 1
- UHVIQGKBMXEVGN-WDSKDSINSA-N Glu-Gly-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UHVIQGKBMXEVGN-WDSKDSINSA-N 0.000 description 1
- GRHXUHCFENOCOS-ZPFDUUQYSA-N Glu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)O)N GRHXUHCFENOCOS-ZPFDUUQYSA-N 0.000 description 1
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 1
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 1
- XXGQRGQPGFYECI-WDSKDSINSA-N Gly-Cys-Glu Chemical compound NCC(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCC(O)=O XXGQRGQPGFYECI-WDSKDSINSA-N 0.000 description 1
- VNBNZUAPOYGRDB-ZDLURKLDSA-N Gly-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)CN)O VNBNZUAPOYGRDB-ZDLURKLDSA-N 0.000 description 1
- HDNXXTBKOJKWNN-WDSKDSINSA-N Gly-Glu-Asn Chemical compound NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O HDNXXTBKOJKWNN-WDSKDSINSA-N 0.000 description 1
- IDOGEHIWMJMAHT-BYPYZUCNSA-N Gly-Gly-Cys Chemical compound NCC(=O)NCC(=O)N[C@@H](CS)C(O)=O IDOGEHIWMJMAHT-BYPYZUCNSA-N 0.000 description 1
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 1
- INLIXXRWNUKVCF-JTQLQIEISA-N Gly-Gly-Tyr Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 INLIXXRWNUKVCF-JTQLQIEISA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- VDCRBJACQKOSMS-JSGCOSHPSA-N Gly-Phe-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O VDCRBJACQKOSMS-JSGCOSHPSA-N 0.000 description 1
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 1
- MKIAPEZXQDILRR-YUMQZZPRSA-N Gly-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN MKIAPEZXQDILRR-YUMQZZPRSA-N 0.000 description 1
- ZLCLYFGMKFCDCN-XPUUQOCRSA-N Gly-Ser-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CO)NC(=O)CN)C(O)=O ZLCLYFGMKFCDCN-XPUUQOCRSA-N 0.000 description 1
- DNAZKGFYFRGZIH-QWRGUYRKSA-N Gly-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 DNAZKGFYFRGZIH-QWRGUYRKSA-N 0.000 description 1
- GBYYQVBXFVDJPJ-WLTAIBSBSA-N Gly-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)CN)O GBYYQVBXFVDJPJ-WLTAIBSBSA-N 0.000 description 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 102100040870 Glycine amidinotransferase, mitochondrial Human genes 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- WJUYPBBCSSLVJE-CIUDSAMLSA-N His-Asn-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N WJUYPBBCSSLVJE-CIUDSAMLSA-N 0.000 description 1
- CZXKZMQKXQZDEX-YUMQZZPRSA-N His-Gly-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N CZXKZMQKXQZDEX-YUMQZZPRSA-N 0.000 description 1
- PMWSGVRIMIFXQH-KKUMJFAQSA-N His-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CN=CN1 PMWSGVRIMIFXQH-KKUMJFAQSA-N 0.000 description 1
- BRZQWIIFIKTJDH-VGDYDELISA-N His-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N BRZQWIIFIKTJDH-VGDYDELISA-N 0.000 description 1
- LBQAHBIVXQSBIR-HVTMNAMFSA-N His-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N LBQAHBIVXQSBIR-HVTMNAMFSA-N 0.000 description 1
- CMMBEMZGNGYJRJ-IHRRRGAJSA-N His-Met-His Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N CMMBEMZGNGYJRJ-IHRRRGAJSA-N 0.000 description 1
- SOYCWSKCUVDLMC-AVGNSLFASA-N His-Pro-Arg Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N2CCC[C@H]2C(=O)N[C@@H](CCCNC(=N)N)C(=O)O SOYCWSKCUVDLMC-AVGNSLFASA-N 0.000 description 1
- VCBWXASUBZIFLQ-IHRRRGAJSA-N His-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O VCBWXASUBZIFLQ-IHRRRGAJSA-N 0.000 description 1
- YEKYGQZUBCRNGH-DCAQKATOSA-N His-Pro-Ser Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CN=CN2)N)C(=O)N[C@@H](CO)C(=O)O YEKYGQZUBCRNGH-DCAQKATOSA-N 0.000 description 1
- RNVUQLOKVIPNEM-BZSNNMDCSA-N His-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O RNVUQLOKVIPNEM-BZSNNMDCSA-N 0.000 description 1
- HIJIJPFILYPTFR-ACRUOGEOSA-N His-Tyr-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HIJIJPFILYPTFR-ACRUOGEOSA-N 0.000 description 1
- 101000893303 Homo sapiens Glycine amidinotransferase, mitochondrial Proteins 0.000 description 1
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 1
- PPSQSIDMOVPKPI-BJDJZHNGSA-N Ile-Cys-Leu Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(=O)O PPSQSIDMOVPKPI-BJDJZHNGSA-N 0.000 description 1
- WEWCEPOYKANMGZ-MMWGEVLESA-N Ile-Cys-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N WEWCEPOYKANMGZ-MMWGEVLESA-N 0.000 description 1
- CNPNWGHRMBQHBZ-ZKWXMUAHSA-N Ile-Gln Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O CNPNWGHRMBQHBZ-ZKWXMUAHSA-N 0.000 description 1
- BSWLQVGEVFYGIM-ZPFDUUQYSA-N Ile-Gln-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N BSWLQVGEVFYGIM-ZPFDUUQYSA-N 0.000 description 1
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- AGGIYSLVUKVOPT-HTFCKZLJSA-N Ile-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N AGGIYSLVUKVOPT-HTFCKZLJSA-N 0.000 description 1
- HXIDVIFHRYRXLZ-NAKRPEOUSA-N Ile-Ser-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)O)N HXIDVIFHRYRXLZ-NAKRPEOUSA-N 0.000 description 1
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- 241000880493 Leptailurus serval Species 0.000 description 1
- QPRQGENIBFLVEB-BJDJZHNGSA-N Leu-Ala-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QPRQGENIBFLVEB-BJDJZHNGSA-N 0.000 description 1
- XIRYQRLFHWWWTC-QEJZJMRPSA-N Leu-Ala-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XIRYQRLFHWWWTC-QEJZJMRPSA-N 0.000 description 1
- OIARJGNVARWKFP-YUMQZZPRSA-N Leu-Asn-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O OIARJGNVARWKFP-YUMQZZPRSA-N 0.000 description 1
- QLQHWWCSCLZUMA-KKUMJFAQSA-N Leu-Asp-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 QLQHWWCSCLZUMA-KKUMJFAQSA-N 0.000 description 1
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 1
- KWURTLAFFDOTEQ-GUBZILKMSA-N Leu-Cys-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KWURTLAFFDOTEQ-GUBZILKMSA-N 0.000 description 1
- NFNVDJGXRFEYTK-YUMQZZPRSA-N Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O NFNVDJGXRFEYTK-YUMQZZPRSA-N 0.000 description 1
- RVVBWTWPNFDYBE-SRVKXCTJSA-N Leu-Glu-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RVVBWTWPNFDYBE-SRVKXCTJSA-N 0.000 description 1
- ZFNLIDNJUWNIJL-WDCWCFNPSA-N Leu-Glu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZFNLIDNJUWNIJL-WDCWCFNPSA-N 0.000 description 1
- LESXFEZIFXFIQR-LURJTMIESA-N Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(O)=O LESXFEZIFXFIQR-LURJTMIESA-N 0.000 description 1
- QJUWBDPGGYVRHY-YUMQZZPRSA-N Leu-Gly-Cys Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N QJUWBDPGGYVRHY-YUMQZZPRSA-N 0.000 description 1
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 1
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 1
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 1
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 1
- FIICHHJDINDXKG-IHPCNDPISA-N Leu-Lys-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O FIICHHJDINDXKG-IHPCNDPISA-N 0.000 description 1
- MJTOYIHCKVQICL-ULQDDVLXSA-N Leu-Met-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MJTOYIHCKVQICL-ULQDDVLXSA-N 0.000 description 1
- MAXILRZVORNXBE-PMVMPFDFSA-N Leu-Phe-Trp Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CC=CC=C1 MAXILRZVORNXBE-PMVMPFDFSA-N 0.000 description 1
- VTJUNIYRYIAIHF-IUCAKERBSA-N Leu-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O VTJUNIYRYIAIHF-IUCAKERBSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 1
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 1
- ADJWHHZETYAAAX-SRVKXCTJSA-N Leu-Ser-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ADJWHHZETYAAAX-SRVKXCTJSA-N 0.000 description 1
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 1
- SVBJIZVVYJYGLA-DCAQKATOSA-N Leu-Ser-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O SVBJIZVVYJYGLA-DCAQKATOSA-N 0.000 description 1
- HOMFINRJHIIZNJ-HOCLYGCPSA-N Leu-Trp-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(O)=O HOMFINRJHIIZNJ-HOCLYGCPSA-N 0.000 description 1
- UCRJTSIIAYHOHE-ULQDDVLXSA-N Leu-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UCRJTSIIAYHOHE-ULQDDVLXSA-N 0.000 description 1
- SEOXPEFQEOYURL-PMVMPFDFSA-N Leu-Tyr-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O SEOXPEFQEOYURL-PMVMPFDFSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 101001090725 Leuconostoc gelidum Bacteriocin leucocin-A Proteins 0.000 description 1
- NQCJGQHHYZNUDK-DCAQKATOSA-N Lys-Arg-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CCCN=C(N)N NQCJGQHHYZNUDK-DCAQKATOSA-N 0.000 description 1
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 1
- BYEBKXRNDLTGFW-CIUDSAMLSA-N Lys-Cys-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O BYEBKXRNDLTGFW-CIUDSAMLSA-N 0.000 description 1
- DRCILAJNUJKAHC-SRVKXCTJSA-N Lys-Glu-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O DRCILAJNUJKAHC-SRVKXCTJSA-N 0.000 description 1
- ULUQBUKAPDUKOC-GVXVVHGQSA-N Lys-Glu-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O ULUQBUKAPDUKOC-GVXVVHGQSA-N 0.000 description 1
- PRCHKVGXZVTALR-KKUMJFAQSA-N Lys-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCCN)N PRCHKVGXZVTALR-KKUMJFAQSA-N 0.000 description 1
- LKDXINHHSWFFJC-SRVKXCTJSA-N Lys-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N LKDXINHHSWFFJC-SRVKXCTJSA-N 0.000 description 1
- MEQLGHAMAUPOSJ-DCAQKATOSA-N Lys-Ser-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O MEQLGHAMAUPOSJ-DCAQKATOSA-N 0.000 description 1
- TVOOGUNBIWAURO-KATARQTJSA-N Lys-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N)O TVOOGUNBIWAURO-KATARQTJSA-N 0.000 description 1
- RPWTZTBIFGENIA-VOAKCMCISA-N Lys-Thr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O RPWTZTBIFGENIA-VOAKCMCISA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- HKRYNJSKVLZIFP-IHRRRGAJSA-N Met-Asn-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HKRYNJSKVLZIFP-IHRRRGAJSA-N 0.000 description 1
- XMMWDTUFTZMQFD-GMOBBJLQSA-N Met-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCSC XMMWDTUFTZMQFD-GMOBBJLQSA-N 0.000 description 1
- PTYVBBNIAQWUFV-DCAQKATOSA-N Met-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCSC)N PTYVBBNIAQWUFV-DCAQKATOSA-N 0.000 description 1
- UZVKFARGHHMQGX-IUCAKERBSA-N Met-Gly-Met Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCSC UZVKFARGHHMQGX-IUCAKERBSA-N 0.000 description 1
- PHURAEXVWLDIGT-LPEHRKFASA-N Met-Ser-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N PHURAEXVWLDIGT-LPEHRKFASA-N 0.000 description 1
- CIIJWIAORKTXAH-FJXKBIBVSA-N Met-Thr-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O CIIJWIAORKTXAH-FJXKBIBVSA-N 0.000 description 1
- KLGIQJRMFHIGCQ-ZFWWWQNUSA-N Met-Trp-Gly Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)CCSC)C(=O)NCC(O)=O)=CNC2=C1 KLGIQJRMFHIGCQ-ZFWWWQNUSA-N 0.000 description 1
- IQJMEDDVOGMTKT-SRVKXCTJSA-N Met-Val-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IQJMEDDVOGMTKT-SRVKXCTJSA-N 0.000 description 1
- 101100170937 Mus musculus Dnmt1 gene Proteins 0.000 description 1
- 101100492388 Mus musculus Nat3 gene Proteins 0.000 description 1
- 101000649938 Mus musculus Vacuolar protein sorting-associated protein 28 homolog Proteins 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- WYBVBIHNJWOLCJ-UHFFFAOYSA-N N-L-arginyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCCN=C(N)N WYBVBIHNJWOLCJ-UHFFFAOYSA-N 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 101100378124 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) acu-8 gene Proteins 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 241000238633 Odonata Species 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- WSXKXSBOJXEZDV-DLOVCJGASA-N Phe-Ala-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@H](C)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 WSXKXSBOJXEZDV-DLOVCJGASA-N 0.000 description 1
- CSYVXYQDIVCQNU-QWRGUYRKSA-N Phe-Asp-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O CSYVXYQDIVCQNU-QWRGUYRKSA-N 0.000 description 1
- JXWLMUIXUXLIJR-QWRGUYRKSA-N Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JXWLMUIXUXLIJR-QWRGUYRKSA-N 0.000 description 1
- IWZRODDWOSIXPZ-IRXDYDNUSA-N Phe-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=CC=C1 IWZRODDWOSIXPZ-IRXDYDNUSA-N 0.000 description 1
- MMJJFXWMCMJMQA-STQMWFEESA-N Phe-Pro-Gly Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)NCC(O)=O)C1=CC=CC=C1 MMJJFXWMCMJMQA-STQMWFEESA-N 0.000 description 1
- APMXLWHMIVWLLR-BZSNNMDCSA-N Phe-Tyr-Ser Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(O)=O)C1=CC=CC=C1 APMXLWHMIVWLLR-BZSNNMDCSA-N 0.000 description 1
- JTKGCYOOJLUETJ-ULQDDVLXSA-N Phe-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JTKGCYOOJLUETJ-ULQDDVLXSA-N 0.000 description 1
- 244000082204 Phyllostachys viridis Species 0.000 description 1
- 235000015334 Phyllostachys viridis Nutrition 0.000 description 1
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 1
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 1
- 208000037062 Polyps Diseases 0.000 description 1
- OLHDPZMYUSBGDE-GUBZILKMSA-N Pro-Arg-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O OLHDPZMYUSBGDE-GUBZILKMSA-N 0.000 description 1
- HPXVFFIIGOAQRV-DCAQKATOSA-N Pro-Arg-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O HPXVFFIIGOAQRV-DCAQKATOSA-N 0.000 description 1
- QXNSKJLSLYCTMT-FXQIFTODSA-N Pro-Cys-Asp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O QXNSKJLSLYCTMT-FXQIFTODSA-N 0.000 description 1
- QNZLIVROMORQFH-BQBZGAKWSA-N Pro-Gly-Cys Chemical compound C1C[C@H](NC1)C(=O)NCC(=O)N[C@@H](CS)C(=O)O QNZLIVROMORQFH-BQBZGAKWSA-N 0.000 description 1
- STASJMBVVHNWCG-IHRRRGAJSA-N Pro-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 STASJMBVVHNWCG-IHRRRGAJSA-N 0.000 description 1
- YXHYJEPDKSYPSQ-AVGNSLFASA-N Pro-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 YXHYJEPDKSYPSQ-AVGNSLFASA-N 0.000 description 1
- SXMSEHDMNIUTSP-DCAQKATOSA-N Pro-Lys-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SXMSEHDMNIUTSP-DCAQKATOSA-N 0.000 description 1
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 1
- GFHXZNVJIKMAGO-IHRRRGAJSA-N Pro-Phe-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GFHXZNVJIKMAGO-IHRRRGAJSA-N 0.000 description 1
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 1
- QKDIHFHGHBYTKB-IHRRRGAJSA-N Pro-Ser-Phe Chemical compound N([C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 QKDIHFHGHBYTKB-IHRRRGAJSA-N 0.000 description 1
- UGDMQJSXSSZUKL-IHRRRGAJSA-N Pro-Ser-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O UGDMQJSXSSZUKL-IHRRRGAJSA-N 0.000 description 1
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 1
- UEKYKRQIAQHOOZ-KBPBESRZSA-N Pro-Trp Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)[O-])C(=O)[C@@H]1CCC[NH2+]1 UEKYKRQIAQHOOZ-KBPBESRZSA-N 0.000 description 1
- LEBTWGWVUVJNTA-FKBYEOEOSA-N Pro-Trp-Phe Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CC4=CC=CC=C4)C(=O)O LEBTWGWVUVJNTA-FKBYEOEOSA-N 0.000 description 1
- 241000208474 Protea Species 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 101150102498 SLC25A6 gene Proteins 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 1
- DKKGAAJTDKHWOD-BIIVOSGPSA-N Ser-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)C(=O)O DKKGAAJTDKHWOD-BIIVOSGPSA-N 0.000 description 1
- CNIIKZQXBBQHCX-FXQIFTODSA-N Ser-Asp-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O CNIIKZQXBBQHCX-FXQIFTODSA-N 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 1
- KNCJWSPMTFFJII-ZLUOBGJFSA-N Ser-Cys-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O KNCJWSPMTFFJII-ZLUOBGJFSA-N 0.000 description 1
- XSYJDGIDKRNWFX-SRVKXCTJSA-N Ser-Cys-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XSYJDGIDKRNWFX-SRVKXCTJSA-N 0.000 description 1
- ULVMNZOKDBHKKI-ACZMJKKPSA-N Ser-Gln-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ULVMNZOKDBHKKI-ACZMJKKPSA-N 0.000 description 1
- PVDTYLHUWAEYGY-CIUDSAMLSA-N Ser-Glu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PVDTYLHUWAEYGY-CIUDSAMLSA-N 0.000 description 1
- YRBGKVIWMNEVCZ-WDSKDSINSA-N Ser-Glu-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O YRBGKVIWMNEVCZ-WDSKDSINSA-N 0.000 description 1
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 1
- FYUIFUJFNCLUIX-XVYDVKMFSA-N Ser-His-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O FYUIFUJFNCLUIX-XVYDVKMFSA-N 0.000 description 1
- NFDYGNFETJVMSE-BQBZGAKWSA-N Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CO NFDYGNFETJVMSE-BQBZGAKWSA-N 0.000 description 1
- NLOAIFSWUUFQFR-CIUDSAMLSA-N Ser-Leu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O NLOAIFSWUUFQFR-CIUDSAMLSA-N 0.000 description 1
- XNCUYZKGQOCOQH-YUMQZZPRSA-N Ser-Leu-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O XNCUYZKGQOCOQH-YUMQZZPRSA-N 0.000 description 1
- IUXGJEIKJBYKOO-SRVKXCTJSA-N Ser-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N IUXGJEIKJBYKOO-SRVKXCTJSA-N 0.000 description 1
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 1
- SBMNPABNWKXNBJ-BQBZGAKWSA-N Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CO SBMNPABNWKXNBJ-BQBZGAKWSA-N 0.000 description 1
- NNFMANHDYSVNIO-DCAQKATOSA-N Ser-Lys-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NNFMANHDYSVNIO-DCAQKATOSA-N 0.000 description 1
- PBUXMVYWOSKHMF-WDSKDSINSA-N Ser-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CO PBUXMVYWOSKHMF-WDSKDSINSA-N 0.000 description 1
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 1
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 1
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 1
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 1
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 1
- SDFUZKIAHWRUCS-QEJZJMRPSA-N Ser-Trp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N SDFUZKIAHWRUCS-QEJZJMRPSA-N 0.000 description 1
- HXPNJVLVHKABMJ-KKUMJFAQSA-N Ser-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CO)N)O HXPNJVLVHKABMJ-KKUMJFAQSA-N 0.000 description 1
- OQSQCUWQOIHECT-YJRXYDGGSA-N Ser-Tyr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OQSQCUWQOIHECT-YJRXYDGGSA-N 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 241000623377 Terminalia elliptica Species 0.000 description 1
- NFMPFBCXABPALN-OWLDWWDNSA-N Thr-Ala-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O NFMPFBCXABPALN-OWLDWWDNSA-N 0.000 description 1
- UQTNIFUCMBFWEJ-IWGUZYHVSA-N Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O UQTNIFUCMBFWEJ-IWGUZYHVSA-N 0.000 description 1
- DCLBXIWHLVEPMQ-JRQIVUDYSA-N Thr-Asp-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DCLBXIWHLVEPMQ-JRQIVUDYSA-N 0.000 description 1
- CUTPSEKWUPZFLV-WISUUJSJSA-N Thr-Cys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CS)C(O)=O CUTPSEKWUPZFLV-WISUUJSJSA-N 0.000 description 1
- LGNBRHZANHMZHK-NUMRIWBASA-N Thr-Glu-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O LGNBRHZANHMZHK-NUMRIWBASA-N 0.000 description 1
- WYKJENSCCRJLRC-ZDLURKLDSA-N Thr-Gly-Cys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N)O WYKJENSCCRJLRC-ZDLURKLDSA-N 0.000 description 1
- MXDOAJQRJBMGMO-FJXKBIBVSA-N Thr-Pro-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O MXDOAJQRJBMGMO-FJXKBIBVSA-N 0.000 description 1
- NLWDSYKZUPRMBJ-IEGACIPQSA-N Thr-Trp-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O NLWDSYKZUPRMBJ-IEGACIPQSA-N 0.000 description 1
- DDHFMBDACJYSKW-AQZXSJQPSA-N Trp-Thr-Asp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O DDHFMBDACJYSKW-AQZXSJQPSA-N 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- JWHOIHCOHMZSAR-QWRGUYRKSA-N Tyr-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JWHOIHCOHMZSAR-QWRGUYRKSA-N 0.000 description 1
- RCLOWEZASFJFEX-KKUMJFAQSA-N Tyr-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RCLOWEZASFJFEX-KKUMJFAQSA-N 0.000 description 1
- WJKJJGXZRHDNTN-UWVGGRQHSA-N Tyr-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 WJKJJGXZRHDNTN-UWVGGRQHSA-N 0.000 description 1
- DZKFGCNKEVMXFA-JUKXBJQTSA-N Tyr-Ile-His Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O DZKFGCNKEVMXFA-JUKXBJQTSA-N 0.000 description 1
- WTTRJMAZPDHPGS-KKXDTOCCSA-N Tyr-Phe-Ala Chemical compound C[C@H](NC(=O)[C@H](Cc1ccccc1)NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(O)=O WTTRJMAZPDHPGS-KKXDTOCCSA-N 0.000 description 1
- MQUYPYFPHIPVHJ-MNSWYVGCSA-N Tyr-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)O MQUYPYFPHIPVHJ-MNSWYVGCSA-N 0.000 description 1
- RMRFSFXLFWWAJZ-HJOGWXRNSA-N Tyr-Tyr-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 RMRFSFXLFWWAJZ-HJOGWXRNSA-N 0.000 description 1
- WBUOKGBHGDPYMH-GUBZILKMSA-N Val-Cys-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)C(C)C WBUOKGBHGDPYMH-GUBZILKMSA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- LJSZPMSUYKKKCP-UBHSHLNASA-N Val-Phe-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 LJSZPMSUYKKKCP-UBHSHLNASA-N 0.000 description 1
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 1
- UGFMVXRXULGLNO-XPUUQOCRSA-N Val-Ser-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O UGFMVXRXULGLNO-XPUUQOCRSA-N 0.000 description 1
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 1
- DVLWZWNAQUBZBC-ZNSHCXBVSA-N Val-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N)O DVLWZWNAQUBZBC-ZNSHCXBVSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- FKNHDDTXBWMZIR-GEMLJDPKSA-N acetic acid;(2s)-1-[(2r)-2-amino-3-sulfanylpropanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(O)=O.SC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O FKNHDDTXBWMZIR-GEMLJDPKSA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 108010047495 alanylglycine Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 108010080488 arginyl-arginyl-leucine Proteins 0.000 description 1
- 108010038850 arginyl-isoleucyl-tyrosine Proteins 0.000 description 1
- 108010068380 arginylarginine Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 238000011888 autopsy Methods 0.000 description 1
- 239000011425 bamboo Substances 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- UUQMNUMQCIQDMZ-UHFFFAOYSA-N betahistine Chemical compound CNCCC1=CC=CC=N1 UUQMNUMQCIQDMZ-UHFFFAOYSA-N 0.000 description 1
- 102000023732 binding proteins Human genes 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 238000004166 bioassay Methods 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000003139 biocide Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- MWEQTWJABOLLOS-UHFFFAOYSA-L disodium;[[[5-(6-aminopurin-9-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-oxidophosphoryl] hydrogen phosphate;trihydrate Chemical compound O.O.O.[Na+].[Na+].C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP([O-])(=O)OP(O)([O-])=O)C(O)C1O MWEQTWJABOLLOS-UHFFFAOYSA-L 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 229940088598 enzyme Drugs 0.000 description 1
- 210000001339 epidermal cell Anatomy 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 1
- 230000027119 gastric acid secretion Effects 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 1
- 108010040856 glutamyl-cysteinyl-alanine Proteins 0.000 description 1
- KZNQNBZMBZJQJO-YFKPBYRVSA-N glyclproline Chemical compound NCC(=O)N1CCC[C@H]1C(O)=O KZNQNBZMBZJQJO-YFKPBYRVSA-N 0.000 description 1
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 1
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 210000002149 gonad Anatomy 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 238000001114 immunoprecipitation Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 230000001689 kallikreinlike Effects 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 235000005772 leucine Nutrition 0.000 description 1
- 108010076756 leucyl-alanyl-phenylalanine Proteins 0.000 description 1
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- UPRXAOPZPSAYHF-UHFFFAOYSA-N lithium;cyclohexyl(propan-2-yl)azanide Chemical compound CC(C)N([Li])C1CCCCC1 UPRXAOPZPSAYHF-UHFFFAOYSA-N 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 239000003068 molecular probe Substances 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010084525 phenylalanyl-phenylalanyl-glycine Proteins 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 229920001308 poly(aminoacid) Polymers 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 230000003389 potentiating effect Effects 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 1
- 108010007513 prolyl-glycyl-prolyl-leucine Proteins 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 108010029020 prolylglycine Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000009711 regulatory function Effects 0.000 description 1
- 230000003014 reinforcing effect Effects 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 108010007375 seryl-seryl-seryl-arginine Proteins 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 108700012359 toxins Proteins 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 108010045269 tryptophyltryptophan Proteins 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 239000003643 water by type Substances 0.000 description 1
- 108010027345 wheylin-1 peptide Proteins 0.000 description 1
- 210000004885 white matter Anatomy 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/475—Growth factors; Growth regulators
- C07K14/485—Epidermal growth factor [EGF], i.e. urogastrone
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Gastroenterology & Hepatology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Zoology (AREA)
- Genetics & Genomics (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Toxicology (AREA)
- Peptides Or Proteins (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。
Description
【発明の詳細な説明】
上皮成長因子のバイブリドDNA合成
上皮成長因子(EGF )は53個のアミノ酸のポリペプチドであって、マウス
及びヒトにおいて特徴付けられている。このものは、種々の培養された細胞及び
インーピボにおける細胞、例えば線紐芽細胞、グリア細胞、上皮細胞、内皮細胞
及び表皮細胞のための強力なマイトジェンである。EGFはまた、胃酸分泌の強
力な阻害剤でもある。EGFは、それが説明できない程高レベルに存在する雄性
マウスの顎下腺から初めて単離された。
線ホモジネート中でEGFは2分子のEGF (Mr604.5)及び2分子の
結合蛋白質(Mr29,300)カリクレイン様アルギニンエンテロペプチダー
ゼの74,000タルトンの複合体として見出される。マウス顎下腺EGFのア
ミノ酸配列は決定されておシ、そしてカルボキン端延長部を有する大9000ダ
ルトン前1駆体が培養された顎下腺中に証明されている。
ヒトEGFは、ウロがストロンと同一ではないとしても類似しており、そしてド
デシル硫酸ナトリウム−ポリアクリルアミ1゛ケ゛ル電気泳動において解離しな
い28,000ダルトン及び30,000グルトンの大形2
として尿中にも見出される。
EGF及び特に推定上のEGF前駆体蛋白質をコードするDNA又はRNAのい
ずれを分離することも多くの理由により非常に困難である。ペプチドが豊富にあ
る場合にもメンセンジャーRNAの量は非常に少ない。
イン−ビトロ翻訳生成物の免疫沈澱法は、強い変性条件下においてさえ前駆体蛋
白質を検出しない。これはおそらく、前駆体のサイズが大きくそして/又は抗体
がそれに対して作られる天然蛋白質上の抗原決定基がマスクされているだめであ
ろう。EGFの生理学的重要性の故に、EGF及びEGFポリペプチド前駆体を
コードするDNA配列を得ることの可能性に実質的な興味が向けられている。さ
らに、多数のホルモンは蛋白質分解的プロセシングにより大曲1駆体から生成す
ることが知られているから、EGF前駆体のcDNA及び誘導されるアミノ酸配
列は隠れた今まで知られていないポリペゾヂドホルモン及び/又は成長因子を明
らかにするかもしれない。
従来技術の記載
パリテリオファーンλ中のヒトヶ9ツムcDNAライブラリーがTJawn等、
−hyb(Cell )(1978)二。
]、 ]157−1174に記載されている。Savage等、b−ナル・オブ
・ビオロジカル・ケミストリー(J。
Biol Chem、(1972)247:7612−7621は、マ3 待表
明GO−501737(2)
ウスEGFのアミノ酸配列を報告している。5porn等、サイエンス(5ci
ence ) (1983) 219°1329−258ニア]55−7160
はトランスフォーミング成長因子(TGF )を記載している。特にGray等
、ネイチ呻乳動物EGF 、そのポリペプチドゝ前駆体、及びEGFをコードす
るセグメントを含むDNA配列によってもコードされる多くの他のポリペプチド
をコーl″′するDNA及びRNAが提供される。このDNA配列I′i哺乳動
物EGF X哺乳動物EGFの前駆体、及び結合している関連ポリペプチドの製
造のだめに使用することができる。放射性ラベルされた・・イブリダイゼーンヨ
ンプローブを用いて、マウスEGF前1駆体をコードするメソセンジャーRNA
が検出され、庁離され、そしてc DNAの製造に使用される。このcDNAは
配列決定され、そして断片が、不適性(mismatched )非相同バイブ
リドが検出され得る条件下でのヒl−−DNAとのハイブリダゼーションのため
に使用される。こうしてヒトEGF又はウロケ゛ストロン及び多数の関連ポリペ
プチドを含む大前駆体ペプチドをコードするDNA配列が検出され、そして単離
される。
具体的態様の記載
この発明に従えば、特にマウス及びヒトのEGFをコードするセグメントを含む
DNA及びRNA配列、並びにプロポリペプチド及びペプチド、特にEGFの1
もしくは複数の生理的機能を有するペプチド、又は]もしくは複数の他のホルモ
ンもしくは成長因子制御機能を有するペプチドを包含する、前記配列の発視生成
物が提供される。
注目のDNA配列は約60塩基又は塩基対(bp )がら約5000塩基対(5
kbp)−iでの範囲にわたる単鎖又は二重鎖であって、生理的に活性なポリペ
プチドをコードする配列は一般に約60 bpから約]、000bpの範囲であ
り、これはエクソンを含むであろう。
一般に、このDNA配列は、約20アミノ酸〜約1000アミノ酸のポリペプチ
ドをコードするオープンリープインクフレーム(1又は複数のエクソンを含む)
を有し、この配列はEGFをコードするセグメントの外側に2 bp以上、通常
5 bp以上、より一般的には1゜bp以上を含有するであろう。特に興味ある
ポリペプチドは一般に約20〜250アミノ酸、さらに一般には約20〜]75
アミノ酸、特に30〜6oアミノ酸から成るであろう。
注目のポリペプチド又は成熟ポリペプチドをコードするDNAセグメントは、こ
の発明において記載されるDNA配列中の任意の領域に位置することができる。
塩基性アミノ酸、す々わちアルギニン及びリシンに縁どられている配列が特に注
目さ、?1、さらに詳しくは第2の塩基性アミノ酸、又はアラニン、ロイシン、
アスパラギン酸もしくはグルタミン酸、もしくはこれらのアミドに結合している
場合が特に注目される。これらの配列の内、EGFと相同のアミノ酸配列を有す
る今まで知られてい々いEGF様ポリペプチドが注目される。
この発明に従って得られるDNA配列は、次の実験割面によって得られた。
EGF中に存在するアミノ酸配列をコードする配列を検出するだめの多数の放射
性標識ハイゾ1ノダイ士゛−ジョンプローブを用いて哺乳動物c DNA又はケ
8ツムDNAライブラリーをスクリーニングする。オリゴペプチドをコードする
種々の可能性ある冗長コドンに備えて多数のプローブを使用する。この方法にお
いてはマウス顎下腺細胞からのcDNAライブラリーを探査した。プローブに強
く結合するプラスミ1゛を単離し、そして幾つかのオーパラツノするcDNA挿
入部を配列決定する。マウスEGFをコードするc DNAは約4、800塩基
を有する。マウスEGFはヌクレオアト328 ]、 −34,40±5により
コードされ、オープンリ−6
ディングフレームが1271±5アミノ酸残基及び約130〜1・10キロダル
トン(kd ) 、特に約133kdの蛋白質をコードする。
次(で、マウスcDNAを用いてヒトcDNA又はゲノムDNAバンクを探査す
る。便利には、約500〜1.5001〕pの制限断片を用いる。特に、約12
13±5 bpのと上El−見ヲー■断片を用いること7バできる。不適性非相
同バイブリドの検出を促進する条件下でハイマウスEGF (53アミノ酸)並
びにEGF部分より前の286アミノ酸及び後の66アミノ酸をコードする。グ
ローブとハイブリダイズするクローンを単離し、そしてヒトDNA挿入部を特徴
付ける。
一旦DNA配列を単離した後、これを種々の方法で使用することができる。すな
わち、全体的又は部分的な合成りNA配列の調製のため、複製のため、あるいは
メンセンジャーRNAの調製のだめ、又はEGFを含む前駆体蛋白質、この蛋白
質もしくはEGFの断片、又は天然EGFのアミノ酸配列から1個又は複数個の
アミノ酸、通常5個以下のアミノ酸が異なるEGFの類似体の発現のために使用
することができる。
cDNA配列から得ることができる鍾々のDNA配列がポリペプチドのコードに
おいて特に注目される。これらのI)NA配列を、ヒトEGFの配列と共に、実
験の7 竹表明GO−501737(3)
部に記載する検討のだめの地図中に示す。注目のポリペプチド配列には、限定的
−〇はないが、それらのアミノ酸配列のEGFとの相同性、特に幾つかのシステ
ィン残基の位置関係に基いて同定された7種の今まで記載されていないEGF様
ポリペプチドが包含される。(実験の部中のダイヤグラムを参照のこと。)これ
らの配列はしばしば塩基性アミノ酸に接している。
注目の蛋白質又はペゾチド、例えばEGF又はその相同物をコードする所望のD
NA配列を単離した後、これを複製又は発現のために他のDNA配列と連結する
ことができる。
注目のポリ(アミノ酸)をフードするDNA配列がそこで複製されそして/又は
発現され得る単細胞微生物、特に細菌及び菌類のだめの広範囲の種類のベクター
を使用することができる。
まれる。便利なベクターはR6−5、Co l E I 1酵母からの2μmプ
ラスミド、RKプラスミド又はこれらに類似するものに由来する複製系が含まれ
る。これら以外の複製系をウィルス又はファージ、例えばラムダ、5V50等か
ら誘導することができる。ある場合には、異る宿主において異る機能を発揮する
ことができる2個の異る複製系を有することが望ましいであろう。/ヤトルベク
ターと称されるこれらのベクターは、E、コリのだめの複製系及び一層高等な生
物、例えば酵母のだめの複製系を用い、これによって遺伝子の増幅又はクローニ
ングを細菌中で達成するととができ、他方発現を高等生物中で適当なプロセシン
グ、例えばグリコジル化を伴って達成することができる。
便利には、複製系と共に、対象DNA配列を含有する1)NA構成物を宿主中に
維持するための述択又は選択圧をもたらす少々くとも1つのマーカーが含1れる
。便利なマーカーには殺生物耐4〈1、例えは抗性物質、重金属及び毒素に対す
る耐性;栄養要求性宿主における補完;免疫性等が含まれる。上皮成長因子の生
理的性質を有するポリペプチドをコードする断ハを含有するDNA配列又は該配
列の断ハを、細菌及び酵母のごとき単細胞微生物中で複製するととができるりf
コーニングベクター中で複製することができる。DNAはまた、注目のけポリペ
プチドの発現のだめに発現ベクター中でも使用することができ、このポリペタ0
チドは哺乳動物特にマウス又はヒトのEGF、配列中に存在する他の生理的に活
性なポリペプチド、例えば他のホルモン又は成長因子、それらの断片又は1〜5
個のアミノ酸を異にする類似体であってよい。
DNA配列のオープンリーディングフレームは大ポリヘプチドの産生を許容する
。この大ポリペフ0チドを種々の方法で処理することができる。種々のプロテア
ーゼを単独で又は組み合わせて使用して大ポリペゾチドを部分的に消化すること
ができる。代表的なエンドペプチダーゼにはトリプシン、ベゾシン、メンプラン
ジペゾチダーゼ、エンドペプチダーゼ又はこれらに類似するものが含まれる。次
に、常用手段、例えばE過、沈澱、クロマトグラフィー、電気泳動等を用いて荷
電及び/又は分子量により、得られた断片を分離し、そして次に生理的活化につ
いて試験することができる。マイトジェン又は分化調節剤として機能する成長因
子に特に関心が持たれる。
バイオアッセイによシ観察された活性に基いて種々の両分をさらに精製し、純粋
な因子を得ることができる。
この発明のDNA配列は種々の方法で使用することができる。断片は、宿主のケ
゛ツムDNA中の変異及び′又は欠失を検出するだめにケ゛ツムDNA中又はメ
ツセンジー、−DNA中の相補配列を検出するだめのプロ=−プとして使用する
ことができる。配列はその配列によりコードされたポリペプチドを発現するだめ
に使10
用することができる。
次の例は限定的ではなく例示的に記載される。
cDNAライブラリーを造成するだめに、60日齢の雄性5w1ss −Web
sterマウスの顎下腺から、ポリAを含肩するRNAを分離した。dGdCテ
ィリング技法〔Ch i rgwi n等、バイオケミストリー(Bioche
mystry)を用いて’、cDNAを調製I〜、そしてpBR322誘導体の
たテI・ラザイクリン証j性形質転換体をミクロタイターディノシ、、 +−1
1−7Q℃にて貯蔵した[ Gergen 等、及びBurke 、前掲、(1
981)9:2989−2998:]。
次に、係属中の出願第457.4.1.2号に記載されているようにして固相ホ
スホラミデート法により第1ノコ゛ヌクl/オチドを合成し、そしてBeanc
age及びCamthcrs 、デ1ゝラヘドロンルター(Tetrahedr
onLett、)(198]、)22:1859−1862に記載されている方
法の変法である20%アクリルアミドケゞル法により単離した。マウスEGFの
cDNAのアミノ酸17−23をコートジする鎖に相補的なドデカマー(最後の
57−ヌクレオチドが欠落している)を調製した。
フラクションは次の配列を有した。す々わち、11番目のヌクレオチドを付加し
た後2つのプールを用意し、一方はAで終シそして他方はGで終るようにし、そ
して177番目ヌクレオチド゛を付加した後、これら2つのプールをさらに分け
て188番目ヌクレオチドを付加し、今度はプールの内2つはGて終るようにし
、そして他の2つのプールはAで終るようにした。こうして合計4つの70−ル
を得だ。ここで、各プールは、3,6、及び9位において組成を異にする多数の
エイコツマーを有した。
アミノ酸の遺伝イコードの冗長性のだめに特異のコドンの使用が不確定であるた
め、異る配列が要求される。ポリヌクレオチドキナーゼ反応によシ、アデノシン
5′−(γ−52p)トリホスフェ−1−(ICN、粗標品、7000Ci/m
mol 、 ICi =3.7 X 1010Bq )を用いて合成オリゴヌ
クレオチドをラベルした2
C−1−8Sep −Pak (商標)カラム(ウォーターズ・アソシエーツ社
)」二でのクロマトグラフィーにより、ラベルされたオリゴヌクレオチドを非導
入(γ32p)トリホスフェートから次のようにして分離した。粗ラベル混合物
をSep −Pakカートリツゾに適用しくディスポーサブルシリンジによる
)、次にカートリツジを20m1の水で洗浄して非導入アデノシン5′−(γ−
52p)トリホスフェートを溶出した。次に、放射性標識されたオリゴヌクレオ
チドをメタノール01Mトリエチルアンモニウムアセテ−t・(PH7,3)(
] : ] 、V/′V)により溶出し、そして溶出液を蒸発乾固した。プロー
ブの比活性は108〜]、、 09cp111/μgのオーダーであった0
形質転換体をワットマン541F紙上で増殖せしめ、クロラムフェニコールと共
にその場で70ラスミドを増幅し、そしてDNAを沖紙上に固定した(Gerg
en等、前掲)。32p末端ラベルグローブを用いてライブラリーを検索した。
同じE紙を反復使用して、ニックトランスレーションクローン化(!DNA K
ヨjl) 迫力0のスクリーニングを行った。
Maxam及びG11bertの方法によりcDNA挿入部の自己列を決定した
。
3
雄性及び雌性マウスの顎下腺からのグリオキ/ル化された全RNAを2係アガロ
−スケ゛ル上で分離し、ニトロセルロースに移し、そしてEGFのc DNA挿
入部ノ二ノクトランスレーンヨン52p−ラベルPst 1−Pst l断片と
ハイブリダイズさせた。洗浄した後、強化スクリーンを用いて一70℃にてRN
Aをオートラジオグラフ処理した。グリオキシル化Hindnlλ断片及びφX
1.74 RF Hae ■消化DNA断片をサイズマーカーとして使用した
。
5000個の形質転換体をまずスクリーニングし、この場合、12位及び18位
にそれぞれヌクレオチドG及びAを有するプールであるゾール4のフ0ロープを
用いて、11個のクローンか強いシグナルをもたらした。それぞれヌクレオチド
G及びGを有するプール3を用いて、弱いがしかし明白に陽性のシグナルが得ら
れた。プール1及び2は陽性シグナルをもたらさなかった。最大のクローンは]
、800bpてあった。このクローンの末端制限断片及び他の断片を用いて、も
との5000個のコロニー及び7500個の追加のコロニー(合泪]、 2.5
00個)をスクリーニングし、そしてEGF配列を含有しない追加のオーバ14
一うップcl)NA:1−70ニーを得た。次に、これらのオーパーラ7ノプク
ローンがmRNAの5′一端領域を欠いていることがDNA配列分析(後記参照
のこと)により決定されためで、ヌクレオチド+1032−105](後期の検
討のだめの地図を参照のこと)に相補的な次の配列:
3′−CCGCTTCCTTCGGTGCGAAT−5’を有するオリゴヌクレ
オチドゾシイマーを用いて他のcDNAライブラリーを合成し、そしてこのライ
ブラリーを上記のようにしてスクリーニングした。最初のライブラリー中のCD
NAクローンが相対的に豊富であることは、との組織からのf ’) AFm
RNAの約02%がEGFのlTlRNAであることを示唆する。
mRNA配列
マウスEGF m RNAのサイズは、成雄性及び雌性腺からのm RNAのナ
サン(Northern )分析により28゜リボゾームRNAのサイズと同じ
て約4800塩基であると決定された。雄性線中のmRNAは、雌性線中に比べ
て少なくとも10倍豊富であった。オーツぐ−ラノプf ルc DNAクローン
のヌクレオチド配列は、次の4750 bpの配列を与えた。
AAAAAAGGAGAA[;GGACACCIIAIICUGIJAIJAI
IAGGGAAGGAALICCUAUCIJGCAUAIJUIJcC:Ll
lIGLIUAGC八C[AUCCCUCへIJCCCG[’;LICGGCU
IJGCAACIJLIIJCCALI[:へへULICIJULICCUGI
JCLI 119ccuuucucuuut’:AuccuuuccCUCGU
UGUGCCLIGUCUCAGG[’;AGAAALICAGUC八CCUG
CADGCC1JへJGCAG[;GCLICIJUAGGCIJCUGGGA
AALIIJIIGLICALIACGGGUGUCAGGUACLILllJ
、1LIA 238UUGCUGLICCAAp3GGGAAAAAAAAAG
IJGAGACAAACAACLICU[TCGGAG[:CIJIJLICC
GCCUGCACUCAGAGGCUCUC[;AGA[;[’alGCAGC
;AGGACCUGGAAAG(’;CACCLIAAAIJAAAAG AU
G 3560
Pro Trp Guy Arg Arg Pro Thr Trp Leu
Leu Leu Ala Phe Leu Leaυal Phe LeuCu
e ucc ccc CGA AGG CCA ACCucc uuc uuc
cuc ccc uuc CUG CIJG GIG uuu UUALys
Ile Ser Ile Leu Ser Val Thr Ala Trp
G]、n ThrAM; AUU AGCALIA CUCAGCGUCAC
A GCA LIGG CAG ACC4460
[;ly Asn Cys Gln Pro Gly Pro Leu Glu
Arg Ser Glu Arg Ser G]、y Thr Cys Al
a[1;GG AACUGLI CAG CCA GGU CCU CIJCI
I;A[; AGA AGCGAG AGA AGCGC[’; ACLI U
GU GCC060
Gly Pro Aha Pro Phe Leu Val Phe Ser
Gin Gly 1−ySccu ccu Gcc ccc UUCCUA [
;UU UUCIJcA CAA GGA AAG 536Ser Ile S
er Arg Ile Asp Pro Asp G]y Thr Asn H
js C1n Gin Leuυal Val、 AspAGCAUCUCU
CG[; ALIU GACCCA CAU GGA ACA AAIJ CA
CCAG CAA UUG f:、UG [1;UG GAU090
Ala Gly Ile Ser Ala Asp Met Asp Ile
His Tyr LysGCU GGCAUCUCA GCA [;ACAUG
GAIJ All CAU UAU AAA 62600
Lys Glu Arg Leu Tyr Trpυal Aspυal C1
u Arg Gin Val Leu Leu Argυal PheAAA
GAG AGA CUCUAU UGG GUG GAU [;UA GAA
AGA CAA GUU UIJII; CUA AGA GUU UUCll
o 120
Leu Asn Gly Thr G]、y Leu Glu Lysυal
Cys Asn VaICIJU AACGにG ACA GGA CUA G
AII; AAA [1;UG UGCAAU GUA 71630
Glu Arg Lys Val Ser C1y Leu Ala Ile
Asp Trp Ile Asp Asp Glu Val Leu TrpC
AG AGG AAG GIG UCU GGG CUG GCCAUA [;
ACUGG AUA GAU GAU GAA GUU CUCUGG140
150
υal Asp Gln Gln Asn G]、y Val Ile Thr
υal Thr AspGUA GACCAA CAG AACGGA GLI
CAUCACCGUA ACA GAU 、80660
Met Thr Gly Lys Asn Ser Arg Val Leu
Leu Ser Ser Leu Lys His Pro Ser AsnA
LIG ACA [;GG へハA AAU UCC、CGA GUU CUU
CLIA AGU IJcc UUA AAA CAIJ CCG UCA
AAU170 Asn 180
11e Ala Val Asp Pro Ile Gln Arg Leu
Met Phe TrpAUA GCA GIG GALI CCA AUA
GAG AGG DUG AUG IJUU UGG 89g90
Ser Ser Glu Val Thr Gly Ser Leu His
Arg Ala His Leu Lys Gly Val Asp ValU
CIJ UCA GAG GUCACCGGCAGCCu1l CACAGA
GCA CACCUG AAA GGU GuU GAU GLIA200 2
10
Lys Thr Leu Leu Glu Thr Gly C;ly Ile
Ser Val LeuAAA ACA CLIG Cue GACACA
CCG [;GA AUA UCG GUG CUG 986Thr Leu
Asp Val Leu Asp Lys Arg Leu Phe Trp
Val Gun Asp Ser Gly Glu Gly八Cへ COG G
AU GLICCUG GACAAA CG[; 、、CUCULICUG[l
; GULI CA[; GACAGLI G[;CGAA GGA230 2
40
Ser His Ala Tyr Ile His Ser Cys Asp
Tyr Glu GlyAGCCACGCLJ uAc Auu CALI U
CCucu [;AU UAIJ GAG ccu 1+17650
Phe Phe Gly Asp Arg Ile Phe Tyr Ser
Val Leu Lysuuu uuu ccu cへu ccc AUCuu
c NAG UCA GLIG LIUG AAA 116680
Asn Leu His Pro Ser Phe Val Thr Pro
Gly Lys LeuAAG CUCCAU CCA UCCUUU GIG
ACA CCLI [;GA AAA CUG 125610
Met Val Val His Pro Arg Ala 01口 Pro
八rg Thr Glu Asp 八la Ala Lys Asp Pr。
MIG CIIA GUA CACCCLI CGLI [1;CA CAG
CCCAGG ACA GAG [;ACGCU GCU AA[; CALI
CCU320 330
Asp Pro Glu Leu Leu Lys Gin Arg Gly
Arg Pro CysGACCCCGAA CUU CUCAAA CAG
AGG GGA A[l;A CCA UにC134640
Arg Phe Gly Leu Cys Glu Arg Asp Pro
Lys Ser His Ser Ser Aha Cys Aha GluC
GCUUCGGU CLICUGU GAG CGA GACCCCAACUC
CCACUCG AGCGCA UGG GCU GAG350 360
Gly Tyr Thr Leu Ser Arg Asp Arg Lys
Tyr Cys GluGGCuAc ACG UUA AGCCGA CAC
CGG AA[; UACUGCC;AA 143670
Asp 1lal Asn Glu Cys Ala Thr C1n Asn
Hjs Gly Cys Thr Leu Gly Cys Glu Asn
GAU GUCAAU GAA U[l;U GCCACU CAG AAIJ
CACGGCUGU ACU CUU GGG UGIJ GAA AAC3
80390
Thr Pro Gly Ser Tyr His Cys Thr Cys
Pro Thr GlyACCCCU GGA LICCUAU CACUGC
ACA UGCCCCACA [;GA 152600
Phe Val Leu Leu Pro Asp G]、y Lys G]、
n Cys Hjs Glu Leu Val Ser Cys Pro Gl
yUUU GUU CLIG CIILI CCU GALI G[;G AA
A CAA U[;U CACGAA CLILI [;LIU UCCLIG
CCCA GGG410 420
Asn Val Ser Lys Cys Ser His Gly Cys
Val Leu ThrAACGUA UCA AA[; UGCAGII C
AU GGCU[;U GUCCOG ACA 161630
Ser Asp Gly Pro Arg Cys Ile Cys Pro
Ala Gly Serυa]、 Leu G]、y Arg Asp G]、
yUCA [;AU ccu ccc ccc LIGCALICucu CC
U [;CA ccu IIcA cuc cuu ccc AGA GAU
ccc440 450
Lys Thr Cys Thr Gly Cys Ser Ser Pro
Asp Asn GlyAAG ACU UGCACU GGU ucu UC
A 劃ICG CCU [;ACAAU GGU 170660
G]、y Cys Ser Gln Ile Cys Leu Pro Leu
Arg Pro G]、y Ser Trp Glu Cys A3p C1
,l5GGA UGCA[’、CCAG AIJCUGU CUU CCU C
UCA[’;に CCA GGA LICCUG[; CAA1JrlU GA
LI UGC澁凹=ニー=−ニーー==L:::====::−う嗣叶抽1利媚
抑d芦」叩1棋!山扛−貴充朋五囮≠h=−A部4u月招し剖廿1叫−tltl
14jeA川℃式す有関→精す0田−−ゴ萱を百ト
670 480
Phe Pro Gly Tyr Asp Leu Gin Ser Asp
Arg Lys Ser111CCU[1;GGLIAUGACCIJACAG
UCAGACCGAAAGAGC1796490
Cys Ala Ala Ser Gly Pro G].n Pro Leu
Leu Leu Phe Ala Asn Ser Gln Asp Ile
OG11C;CAGCUucAGGACCACAGCCACUUULIACul
l;LILILIGCAAAUUCCCAGGACAUC500 510
Arg His Met His Phe Asp Gly Thr Asp
Tyr LysυalCGA CAC AIJG CAU UUIJ GAII
GGA ACA GAC IJAc AAA GUU 1BB6520
Leu Leu Ser Arg Gun Met Gly Met Val
Phe Ala Leu Asp Tyr Asp Pro Va].GluC
OG CUC A[;C CGG CAG ALIG GGA AIJG GI
JU 11110 GCC UUG GAU IJAU GAC CCIJ G
IG [’;AA530 540
Ser Lys I].e Tyr Phe Ala Gln Thr Ala
Leu Lys TrpAGC AAG AIIA IJAU lull [
;CA CAG ACA GCC COG AAG UGG 1976550
11eGluArgAlaAsnMet:AspGlySerGinArgGl
uArgLeuIleThrGluCly八UA GAG AGG GCLI
AAU AU[’; GAU GGG UCC CAG CGA GAA AG
A COG AUC ACA GAA GGA560 570
υalAspThrLeuGluGlyLeuAlaLeu八SpTrpI].
eGLIAGAUACGCullGAAGGLICUUGCCCOGGACLI
CGAll2066580
Cly Arg Arg Ile Tyr Trp Thr Asp Ser
Gly Lys Ser Val υal Gly Gly Ser Asp[
;GC CGG AGA AUC Ll八C LIGG A[:A [;AC
AGU GGG AAG UCU GULI GUU GGA GGG AΩC
[;AU590 600
Leu Ser Gly Lys His His Arg Ile I].e
Ile Gln GluCUG AGC GGG AA[’; CAIJ C
AU CGA 八1八 ALIC AUC CAB; GAG 2156610
Arg Ile Ser Arg Pro Arg Gly Ile A]a
Va] His Pro Arg Ala Arg Arg Leu PheA
GA AUC IJcG AGG CCG CGA GGA ALIA GTh
U GIG CAU CC八 AGG GCC AGG AGA CLIG U
IIC620 630
Trp Thr Asp Val [;ly Met Ser Pro Arg
Ile Glu SerLIGG ACG [;AC GLIA GGG A
UC UCU CCA CGG AUIJ GAA AGC 2246640
Ala Ser Leu [’;in Gly Ser 八sp Arg υa
l Leu Ile Ala Ser Ser Asn l−eu Leu G
luGCLj UCC CUU [:AA GGIJ LJCC GAC C[
;G GIG CLIG ALIA GCC ACC UCC A八U CUA
CLIG [;AA650 660
ProSerGlyIleThrI].eAsp丁yrLeu丁hrAspTh
rCCC AGLI GGA AUC ACG ALIU GAC LIAC
IJLIA ACA GAC ACU 2336670
Leu Tyr Trp Cys Asp Thr Lys Arg Ser
VIa]. Ile Giu M[!t Ala Asn L[!IJ Asp
GlyUUGIIAcLIGGUGUGACACCAAGAGGUCIIGU
GAULIGAAAIJGGCCAAUCIJGGAUG[iC680 690
Ser Lys Arg Arg Arg Leu Ile Gun Asn
Aspυal GlyUCC AAA CGC CGA AGA CUU AU
C CAG AAC GAC GIJA GGLI 2426700
Hjs Pro Phe Ser Leu Alaυal Phe Glu A
sp l」is Leu Trpυa.l Sar Asp Trp A].a
CAC CCC UUC IJcIJ CUA GCC DUG l叫U GA
G GALI [:八C [:UG Llf;G GLIC UCG GALI
IJGG GCU710 720
Tie Pro Ser Val Ile Arg υal Asn Lys
Arg 丁hr G].yAIJC CCA IJcG GUA AU八 八G
G GIJG AAC AAG AGG ACLI GGC 2516730
Gln Asn Argυal Arg Leu Gln [;].y Ser
Met l−eu Lyz Pro Ser Ser Leu tlal V
alCAA AAC AGr; GUA CGU Cllll CAA GG[
: AGC AIJG CしIG AAG CCC UCG UCA CIJG
l’;Ill GIG740 750
υal His Pro Leu Ala Lys Pro Gly Ala
Asp Pro CysGLIC CAU CCA UUG GCA AAA
CCA GGIJ CCA [;AU CCC UGC 2606760
Leu Tyr Arg 八sn G].y Gly Cys Glu His
Ile Cys G].n G].u Ser Leu Gly Thr A
laUIJA UAC AGG AAIJ GGA GCC LIGLI GA
A [:AC All1’.l LIGC CA八 GAG AGC COG
GGC ACA CCLI770 780
Arg Cys Leu Cys Arg Glu Gly Phe Val
Lys Ala TrpCGGIJGIJIJUGUGUCGUGAAGGUU
LIIJGLIGAAGGCCLIGG2696790
Asp Gly Lys Met Cys Leu Pro Gin Asp
Tyr Pro Ile Leu Ser Gly Glu Asn A].a
GALI GGG AAA AUG UGU CUC CCU ThAG GA
II UAU CCA ALIC CLIG UCA GGLI GAA AA
LI GCU800 13].O
Asp Leu Ser Lys Glu Val Thr Ser Lr!u
釦r A(3n SerGAIJCIJUAGUAAA(;AGGIJGAC
AUCACIJGAGCAACLICC27B6820
ThrGin八la[;luValProAspAspAspGuyThrG]
.uSerSerThrLeuυalAlaACU CAG GCU GAA
GUA CCA GAC GAIJ [;AU Gl’;G ACA GAA
UCU UCC ACA CUA GIG CCU830 840
Glu Ile Met Val Ser Gly Met Asn Tyr
Clu Asp AspGAA AUC 八しIG GIG UCA GGC
AIJG AAC UAU [’;AA GAIJ GAC 287g850
Cys Gly Pro Gly Gly Cys Gly Ser His
Ala Arg Cys Val Ser Asp Gly Glu Thru
cu ccu ccc ccc ccc ucu GGA AGC CAU c
cu CGA UGC GLIU UCA GAC GGA GAG ACU8
60 870
Ala G].u Cys Gln Cys Leu Lys Gly Phe
Als Arg AspGCU GAG UGU CAG UGLI CUG
A八A GGG UUU GCC AGE; [;AU 2966880
Gly Asn Leu Cys Ser Asp Ile Asp Glu
Cys Val Leu A].a Arg Sar Asp Cys Pro
GGA AAC COG UGU LICU GAU AUA GAU GAG
UGU CtjG CLIG GCU AGA UCG GAC U[l;C
CCC890 900
Ser Thr Ser Ser Arg Cys Ile Asn Thr
G].u Guy GlyAGC ACC UCG IJcc AGG IJc
c AUC AAC ACU GAA GGU GGC 3056910
Tyrυa]. Cys Arg Cys Ser Glu Gly Tyr
Glu G1y Asp Gly Ile Ser Cys Phe Aspu
Ac cuc UGC AGA UGC IJcA GAA ccc IJAc
GAA GGA GAC ccc AUC UCC ucu uuc GAI
I920 930
I1e Asp Glu Cys Gin Arg Gly Ala His
Asn Cys AlaAIIU GAC GAG LIGC CAG CGG
GGG GCG CAC AAC IJGc GCU 3146940
Glu Asn Ala Ala Cys Thr Asn Thr Glu
Gly Gly Tyr Asn Cys Thr 口ys Ala G1yG
A[; AAU GCC GCC UGC ACC 八AC ACG GAG
GGA [;GC IIAc AAC LIG[: ACC UGC GCA
GGG950 9fliO
Arg Pro Ser Ser Pro G].y Arg Ser CYS
Pro Asp SerC[;C CCA UCC UCG CCC [;GA
CG[; AGIJ UGC CCU GAC LICU 3236970
丁hr Ala Pro Ser Leu Leu Gly Glu Asp
Gly His His Leu Asp :: : Arg八CC GCA
CCC IJcLI CUC CULI GGG GAA GAII GGC
CAC CAU IJUG GAC j : i CGAACT CCA CC
C CCG CAC CTC AGG GAA GAT [’;AC CAC
CAC TAT TCC GTA AGAThr Pro Pro Pro H
is Leu Arg Glu Asp Asp His His Tyr S
er Va].Arg上戻扱七圀,’ 990
Asn Ser Tyr Pro Gly Cys Pro Ser Ser
Tyr Asp Gly Tyr Cys LeuAAU AGU UAu C
CA GGA UGC CCA UCC UCA UAU GALI GGA
IJAc U[;C Cu0 3326AAT AGT GAC TC;T G
AA TGT CCC CT[’; TCC CAC [’;AT GCG T
八C TGC CTCAsn Ser Asp Ser Glu Cys Pr
o Leu Ser His Asp [;ly Tyr CyS Leu10
00
Asn Gly Gly Val Cys Met His Ile Glu
Ser Leu Asp Ser Tyr Thr Cys 八Sn 口y’i
AALI GGU GGC GLIG Ll6C AUG CALI A目LI
GAA’ UCA CLIG GAC AGC LIAC ACA UGC
AAC LIGLICAT GAT GGT (;TG TGC ATG TA
T ATT GAA lfA TTG GA[ミ AAG TAT GC八 T
GC AA[: TGTHis Asp G]y υal Cys Met T
yr Ile Glu Ala Leu Asp Lys Tyr Aha T
hys Asn CY!31010 ].020
υal Tie Gly Tyr Ser Gly Asp Arg Cys
Gin Thr Argcuu AUU ccc UAU UCU ccc G
AU cct’t ucu c^[; ACLI CGA 3416GTT G
TT GrC TAC ATC GGG GAG CGA TGT CAG T
AC 口GAυa1 υal G].y Tyr lie G].y G].u
Arg Cys Gin Tyr Arq1030
Aspl−euArgTrpTrpGlul−euArgHisA].aG].
y丁yrGlyGinl.ysllisAspIleGAC CUA CCA
U[;G UGG GAG CIJG CGU CAU GCLI CGC I
IAc GGC CAG ハAf; C八U [;AC 八UCGAC CTG
AAG TGG TG[; GAA CTG CCC CAC GCT [’
;GC CAC GGG r:A[; CAG CAG A八G CTCAsp
Leu Lys Trp Trp G].lJ Leu Arg Hj−s
Ala Gly His Guy G].n Gln G].n Lysυal
1040 1050
MetValυalAコaValCysMet:υalA].al−euVal
LeuAUGGIJ[;[;UCGCLIGUCUGCALIGCIIGGCA
COGGU[:CLI[i3506ATC[’;TGGTGGCTt’;TCT
[l;CGTGGTG(;TG[:TTGTCATCI1e Val υa1
八]a υal Cys υal Val υal Leu Val Met1
060
Leu Leu Leu l..eu [;ly Met Trp Gly T
hr Tyr 丁yr Tyr Ar+] 丁hr Arg Lys Gln
LeuCUGCLICCIJCIJIIGCGGAUGLIGGGG(;ACI
JUACUACLIAC八ccAr:Ll[:GGA△1、CAGCLI八CT
G CTC CTC CTG AGC C’ff: TGG CGG [;CC
CAC TAC TAC AGGLeu Leu Leu Leu Ser
Leu Trp Gly 八la His Tyr Tyr Arg1070
].OBO
Ser Asn Pro Pro Lys Asn Pro Cys Asp
Glu Pro Sc■LICA AAC CCC CCA AAG AAC
CCIJ UGLI GALI GAG CCA AGC 35961090
Gly Ser Val Ser Ser Ser Gly Pro 八sp
Ser Ser Ser Gly Ala A]a Val 八].a Se+
GCA AGU [’;UG AGC A[;C AGG G[;G C[:C
GAC A[;C 八GC AGr: GGG G[:A GCIJ GUG
GflLI LICU1100 1110
Cys Pro Gin Pro Trp Phe Valυal Leu G
lu Lys HisGin Asp Pro Lys Asn [;ly S
er Leu Pro 八la Asp Gly Thr Asn Gly A
la Val υalAsp A]、a Gly Leu Ser Pro S
er Leu Gun Leu Gly SerValHisLeuThrSe
rTrpArgGinLysProHisIleAspGlylうetGlyT
hrGlyGlnSerCysTrpI]、eProProSerSerAsp
ArgGly1’ro Gin Glu Tle Glu Gly Asn S
er His 1−eu Pro Ser Tyr Arg Pro υal
Gly Pr。
Glu Lys Leu Hjs Ser Leu Gin Scr Ala
Asn Guy 5erCys Hj、s C1u Arg Ala Pro
Asp 1−eu Pro Arg Gln Thr [;lu Pro υa
]、L−ys 八日CLIUUUGCCIICAGAAGGAGUGGGUUA
AAGCAGGIJGACCCCAUGCUCIJGUCAACCCCLIGA
AUAAAU[;AUGUGAIJcCUUUUGCLIAUGAUAUACL
IGCC八^GUGLIGGCCCAUGCUCALIAALIUGUGCCへ
IUCUGAAIJU[;tlGAUAAAIJUA[;U[;AUUAUAC
IJ八U八AAAAUへUへIIにAAUGAAAAUAUUUAACUUUA
AAAACALIUACCUUAAtJCAUUGUCUULIUCLIUCU
UcAAcucuuucccAcucAAAAcccucA八LIUCIIGC
UGULIUCCAUAGAAU 4661uuuuAAuuuAuuuuAA
cAc八ucAcAuucuAAAcAAAuuccuucAuuuAuuuu
AuccUAAUUAUUUAAAUAAAAUCACCCUAAAGCAUC
A 4750これは、マウスEGFの正確な53アミノ酸残基(ヌクレオチド3
281−344OL翻訳開始コドンAUG (ヌクレオチド354−356)、
及び終止コドンTA、G (ヌクレオチド4005−4.007 )を含む。1
217アミノ酸残基及び約133 kdの蛋白質をコードする配列にわたるオー
プンリーディングフレーム。さらに、EGF”に対するこれらのアミノ酸配列の
相同性、特に次に示ずこれらのンステイン残基の位置関係に基いて、7個の追加
のEGF様ポリペプチドが同定される。
4
uhc:+の一仁一コフフωσ〉、−〉、)−頓0Ljxω< 、) J 」J
J ((jφCロー1>C>kCCツー0〕ψコ>0
く〉0く口のく」 ←< eL LI J (j (j l−1+1−一の+@
+ + f +@ω小−−二ω(cL+1.J(j CjLl トH<」l5
eth−4、−10の−の〉、−色一一一田ωf
(j鎖の工く ヒ エく■([j ) < 1−1誹U 演習だξ÷5区明
1ベフ>ωCツー〉、−一1−+>>pのa++@−Hの の−■f f−n−
■> 」cs < [j の ωCωヒヒ■0φ?ヨムけ !口54咋1足
月間!」 ■ ・・・・−m=・
OUOフメコフフ
エωニー〇〇〇」
[1暑 タ[、ff3.i[l15
女工 カ 0
l−(j [j L (」」口の<<〇−〕〕+@0c−10−
ω 木 −−・・−・−m=
−1−(j)乙(6) )−1ヒH
汗 情 茨 4圓2コ」
堀 5 Ra囲す属丁
!
国日コ屁IΣ
26
特に、7つの追加のEGF様、l IJペプチドが同定される。組換DNA技法
を用い、そしてポリペプヂド配列を、機能するエピゾーム要素中の適切なプロモ
ーターから下流に挿入することにより、大ボリベゾチド及びその断片の製造のた
めにDNA配列を使用することができる。次に、ニゲシーツ、要素を適当な宿主
に挿入して複製及び所望の71) 波ブチドの発現を行うことができる。
理解を明確にするため説明又は例により前記の発明を幾分詳細に説明したが、添
付された請求の範囲の範囲内において幾つかの変化、変法を実施し得ることが明
らかであろう。
補正岩−の翻訳文提出書
(特許法第184条の7第1項)
昭和60年3月58
特許庁長官 志 賀 学 殿
1 特許出願の表示
PCT/US8410]、050
2 発明の名称
上皮成長因子のバイブリドDNA合成
3特許出願人
住所 アメリカ合衆国、カリフォルニア94608.エミリーヒヮレ。
住所 東京都港区虎ノ門−丁目8番10号静光虎ノ門ビル)小゛1請求の範囲
l、、EGFをコードする部分を有し、そしてそれと読み相が整合する周縁コー
ド領域の少なくとも部分を含むヒトDNA配列。
2 請求の範囲第1項のDNA配列の部分であシ、そしてEGF以外をコードす
る配列を含む60ヌクレオチド以上のDNA断片。
3、複製系及び請求の範囲第1項のDNA配列又は60ヌクレオチド以上のその
断片を含んで成る機能的エピゾーム要素。
4.5000より少なく159より多くの塩基対を有し、そしてヒ) EGFの
アミノ酸配列を含有する7リペプチドをコードする遺伝子のヌクレオチドの50
%以上を含んで成るDNA配列。
5、 オープンリーディングフレーム内に約1000ヌクレオチド以上を有する
請求の範囲第4項記載のDNA配列。
6 前記オープンリーディングフレームがEGFをコードする前記配列の部分を
特徴とする請求の範囲第5項記載のDNA配列。
手続補正書(方式)
%式%
1 事件の表示
PCT/US84ン01050
2 発明の名称
上皮成長因子のバイブリドDNA合成
3 補正をする者
事件との関係 特許出願人
名称 チロン コーポレイション
4代理人
住所 〒105東京都港区虎ノ門−丁目8番10号5 補正命令の日付
昭和60年7月23日(発送日)
6 補正の対象
+1)特許法第184条の5第1項の規定による書面の「特許出願人の代表者」
の欄
(2)願書の翻訳文
(3)委任状
(4)明細書及び請求の範囲の翻訳文
7 補正の内容
(1) 別紙の通り
(2)別紙の通り
(3) 別紙の通り
(4)明細書及び請求の範囲の翻訳文の浄書(内容に変更なし)
8 添付書類の目録
(1)特許法第184条の5第1
項の規定による書面 1通
(2)願書の翻訳文 1通
(3)委任状及びその翻訳文 各1通
(4)明細書及び請求の範囲
の翻訳文 各1通
国際調査報告
Claims (1)
- 【特許請求の範囲】 ]、、EGFをコードする部分を有し、そしてそれと読み相が整合する周縁コー ド領域の少なくとも部分を含む哺乳動物DNA配列。 2 前記哺乳動物がマウスである請求の範囲第1項記載のDNA配列。 3 前記哺乳動物がヒトである請求の範囲第1項記載のDNA配列。 4 請求の範囲第1項記載のDNA配列の部分であり、そしてEGF以外をコー ドする配列を含む少なくとも約60ヌクレオチドのDNA断片。 5 複製系及び請求の範囲第1項のDNA配列又は少すくとも60ヌクレオチド のその断片を含んで成る機能的エピゾーム要素。 6.5000より少なくそして159より多くの塩基対を有し、そしでヒ) E GFのアミノ酸配列を含むポリ綬グチドをコードする遺伝子のヌクレオチドの少 なくとも50係を含んで成るDNA配列。 7 オーツ0ンリーデイングフレーム中に少なくとも1000ヌクレオチドを有 する請求の範囲第6項記載のDNA配列。 8 前記オーシンリーディングフレームがEGF iコードする前記配列の部分 を含む請求の範囲第7項記載のDNA配列。 浄書(内容に変更なLつ 1
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US51137283A | 1983-07-05 | 1983-07-05 | |
US511372 | 1983-07-05 | ||
PCT/US1984/001050 WO1985000369A1 (en) | 1983-07-05 | 1984-07-02 | Hybrid dna synthesis of epidermal growth factor |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS60501737A true JPS60501737A (ja) | 1985-10-17 |
Family
ID=24034614
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP84502699A Pending JPS60501737A (ja) | 1983-07-05 | 1984-07-02 | 上皮成長因子のハイブリドdna合成 |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP0148922A4 (ja) |
JP (1) | JPS60501737A (ja) |
WO (1) | WO1985000369A1 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4743679A (en) * | 1986-02-24 | 1988-05-10 | Creative Biomolecules, Inc. | Process for producing human epidermal growth factor and analogs thereof |
IN165717B (ja) * | 1986-08-07 | 1989-12-23 | Battelle Memorial Institute | |
US4717717A (en) * | 1986-11-05 | 1988-01-05 | Ethicon, Inc. | Stabilized compositions containing epidermal growth factor |
WO1989001489A1 (en) * | 1987-08-10 | 1989-02-23 | Commonwealth Scientific And Industrial Research Or | Control of angiogenesis and compositions and methods therefor |
US5472702A (en) * | 1987-08-26 | 1995-12-05 | United States Surgical Corporation | Sterilization of growth factors |
US5366081A (en) * | 1987-08-26 | 1994-11-22 | United States Surgical Corporation | Packaged synthetic absorbable surgical elements |
US5208144A (en) * | 1988-08-23 | 1993-05-04 | The General Hospital Corporation | Method for detection of human dna containing the gene encoding low density lipoprotein receptor |
US5102789A (en) * | 1989-03-15 | 1992-04-07 | The Salk Institute Biotechnology/Industrial Associates, Inc. | Production of epideramal growth factor in pichia pastoris yeast cells |
JPH05184352A (ja) * | 1990-01-16 | 1993-07-27 | Centro De Ing Genetica Y Biotecnol | ピヒア パストリス(Pichia pastoris)酵母中での異種遺伝子の発現方法、発現ベクターおよび形質転換微生物 |
US5904716A (en) * | 1995-04-26 | 1999-05-18 | Gendler; El | Method for reconstituting cartilage tissue using demineralized bone and product thereof |
AU5549296A (en) * | 1996-04-10 | 1997-10-29 | Human Genome Sciences, Inc. | Extracellular/epidermal growth factor-like protein |
US6852506B1 (en) | 1996-04-10 | 2005-02-08 | Human Genome Sciences, Inc. | Extracellular/epidermal growth factor-like protein |
AU1410801A (en) * | 1999-11-17 | 2001-05-30 | Compugen Ltd. | Variants of alternative splicing |
US20090192554A1 (en) | 2008-01-29 | 2009-07-30 | Confluent Surgical, Inc. | Bioabsorbable block copolymer |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DK339781A (da) * | 1980-08-05 | 1982-02-06 | Searle & Co | Syntetisk gen |
US4394443A (en) * | 1980-12-18 | 1983-07-19 | Yale University | Method for cloning genes |
-
1984
- 1984-07-02 JP JP84502699A patent/JPS60501737A/ja active Pending
- 1984-07-02 EP EP19840902750 patent/EP0148922A4/en not_active Withdrawn
- 1984-07-02 WO PCT/US1984/001050 patent/WO1985000369A1/en not_active Application Discontinuation
Also Published As
Publication number | Publication date |
---|---|
EP0148922A1 (en) | 1985-07-24 |
EP0148922A4 (en) | 1987-06-15 |
WO1985000369A1 (en) | 1985-01-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112266411B (zh) | 一种新型冠状病毒疫苗及其应用 | |
TWI779287B (zh) | 抗發炎胜肽及包含其之成分 | |
Rott et al. | The genome of budgerigar fledgling disease virus, an avian polyomavirus | |
JPS60501737A (ja) | 上皮成長因子のハイブリドdna合成 | |
JPH09294590A (ja) | 組換えヒト内皮細胞成長因子 | |
FI108943B (fi) | Menetelmiä seriiniproteaasi-inhibiittorien valmistamiseksi ja menetelmässä käytettävä synteettinen tai eristetty DNA-sekvenssi, yhdistelmävektori sekä bakteeri- tai hiivaisäntäsolu | |
KR20060054196A (ko) | 전달가능한 dna-결합 단백질 | |
KR20000019788A (ko) | 대장균 엔테로톡신ⅱ 신호펩티드의 변형체와 인체성장호르몬의융합단백질을 발현하는 재조합 미생물 및 그를 이용한 인체성장호르몬의 제조방법 | |
JP2004518444A (ja) | 重要なタンパク質の細菌培養上清中への分泌のための融合タンパク質 | |
JPS60252500A (ja) | 修飾インタ−フエロン | |
US5650488A (en) | Polypeptide inhibitor of the replication of HSV | |
JPH111498A (ja) | Myc結合性亜鉛フィンガータンパク質、その製造方法及びその使用 | |
KR960011918B1 (ko) | 히루딘의 변이체와 그 용도 및 제조방법 | |
JP2001199997A (ja) | 細胞透過性キャリアペプチド | |
JPH04502557A (ja) | 小細胞癌の検出方法およびアシル―ペプチド加水分解酵素およびそれをコードしている配列 | |
JPH0570497A (ja) | アルフア−ヘリツクス3領域、アルフア−ヘリツクス2領域の変化、およびそれらの組み合わせ、並びに他の変異との組み合わせを有する成長ホルモン | |
KR0142675B1 (ko) | 유전자 발현 조절인자 | |
JPS63289A (ja) | バクテリアにおける新規リボゾ−ム結合部位を用いたタンパク生産の増強 | |
KR940000199B1 (ko) | 인간 reg 단백질 | |
EP0095351A2 (en) | A precursor of a C-terminal amidated peptide and production thereof | |
JPH03502880A (ja) | 多数のペプチドアナログの産生方法及び新規ペプチドアナログ | |
JPH05105634A (ja) | アルフア−ヘリツクス1領域内の変化並びに他の変異との組み合わせを有する成長ホルモン | |
JPH10500311A (ja) | 核タンパク質と相互作用する因子 | |
US5188943A (en) | Method of producing high molecular weight human fibroblast growth factors | |
JPH05502376A (ja) | セリンプロテアーゼ阻害活性を有するポリペプチドおよびこれをコードするdna |