KR100560279B1 - 이황화결합으로 연결된 당단백질 호르몬 유사체, 이의제조방법 및 이의 용도 - Google Patents
이황화결합으로 연결된 당단백질 호르몬 유사체, 이의제조방법 및 이의 용도 Download PDFInfo
- Publication number
- KR100560279B1 KR100560279B1 KR1019997011858A KR19997011858A KR100560279B1 KR 100560279 B1 KR100560279 B1 KR 100560279B1 KR 1019997011858 A KR1019997011858 A KR 1019997011858A KR 19997011858 A KR19997011858 A KR 19997011858A KR 100560279 B1 KR100560279 B1 KR 100560279B1
- Authority
- KR
- South Korea
- Prior art keywords
- subunit
- cys
- pro
- thr
- leu
- Prior art date
Links
- 102000003886 Glycoproteins Human genes 0.000 title claims abstract description 133
- 108090000288 Glycoproteins Proteins 0.000 title claims abstract description 133
- 239000003668 hormone analog Substances 0.000 title claims abstract description 39
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 title abstract description 33
- 238000002360 preparation method Methods 0.000 title description 16
- 238000000034 method Methods 0.000 claims abstract description 46
- 239000008194 pharmaceutical composition Substances 0.000 claims abstract description 18
- 108010062540 Chorionic Gonadotropin Proteins 0.000 claims description 356
- 102000011022 Chorionic Gonadotropin Human genes 0.000 claims description 355
- 229940084986 human chorionic gonadotropin Drugs 0.000 claims description 347
- 229940088597 hormone Drugs 0.000 claims description 189
- 239000005556 hormone Substances 0.000 claims description 189
- 235000018417 cysteine Nutrition 0.000 claims description 161
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 claims description 133
- 102000003864 Human Follicle Stimulating Hormone Human genes 0.000 claims description 113
- 108010082302 Human Follicle Stimulating Hormone Proteins 0.000 claims description 113
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 67
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 claims description 61
- RJKFOVLPORLFTN-LEKSSAKUSA-N Progesterone Chemical compound C1CC2=CC(=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H](C(=O)C)[C@@]1(C)CC2 RJKFOVLPORLFTN-LEKSSAKUSA-N 0.000 claims description 12
- 230000035558 fertility Effects 0.000 claims description 11
- 102000011923 Thyrotropin Human genes 0.000 claims description 7
- 108010061174 Thyrotropin Proteins 0.000 claims description 7
- 230000001976 improved effect Effects 0.000 claims description 7
- 102000017357 Glycoprotein hormone receptor Human genes 0.000 claims description 6
- 108050005395 Glycoprotein hormone receptor Proteins 0.000 claims description 6
- 210000004899 c-terminal region Anatomy 0.000 claims description 6
- 239000000186 progesterone Substances 0.000 claims description 6
- 229960003387 progesterone Drugs 0.000 claims description 6
- 239000000546 pharmaceutical excipient Substances 0.000 claims description 5
- 208000000509 infertility Diseases 0.000 claims description 4
- 230000036512 infertility Effects 0.000 claims description 4
- 231100000535 infertility Toxicity 0.000 claims description 4
- 239000007788 liquid Substances 0.000 claims description 4
- 230000000670 limiting effect Effects 0.000 claims description 3
- 150000001945 cysteines Chemical class 0.000 claims 1
- 108091028043 Nucleic acid sequence Proteins 0.000 abstract description 11
- 235000001014 amino acid Nutrition 0.000 description 179
- 229940024606 amino acid Drugs 0.000 description 177
- 150000001413 amino acids Chemical class 0.000 description 174
- 108090000623 proteins and genes Proteins 0.000 description 141
- 230000000694 effects Effects 0.000 description 127
- 102000004169 proteins and genes Human genes 0.000 description 127
- 235000018102 proteins Nutrition 0.000 description 125
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 120
- 102000005962 receptors Human genes 0.000 description 88
- 108020003175 receptors Proteins 0.000 description 88
- 102000023108 LH Receptors Human genes 0.000 description 81
- 108010011942 LH Receptors Proteins 0.000 description 81
- 230000027455 binding Effects 0.000 description 75
- 238000009739 binding Methods 0.000 description 68
- 108090000765 processed proteins & peptides Proteins 0.000 description 64
- 210000004027 cell Anatomy 0.000 description 62
- 239000002299 complementary DNA Substances 0.000 description 52
- 230000035772 mutation Effects 0.000 description 50
- 239000013598 vector Substances 0.000 description 43
- 230000003054 hormonal effect Effects 0.000 description 39
- 230000019491 signal transduction Effects 0.000 description 37
- 150000007523 nucleic acids Chemical group 0.000 description 36
- 108020004707 nucleic acids Proteins 0.000 description 35
- 102000039446 nucleic acids Human genes 0.000 description 35
- 238000012360 testing method Methods 0.000 description 34
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 32
- 108010004073 cysteinylcysteine Proteins 0.000 description 32
- 108020004705 Codon Proteins 0.000 description 30
- 102220503447 Superoxide dismutase [Cu-Zn]_C7S_mutation Human genes 0.000 description 29
- 238000006467 substitution reaction Methods 0.000 description 29
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 27
- 102000008175 FSH Receptors Human genes 0.000 description 26
- 108010060374 FSH Receptors Proteins 0.000 description 26
- 108010060199 cysteinylproline Proteins 0.000 description 25
- 239000012634 fragment Substances 0.000 description 25
- 102200094333 rs74315396 Human genes 0.000 description 24
- 108010057821 leucylproline Proteins 0.000 description 23
- 230000008859 change Effects 0.000 description 22
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 22
- 108010051242 phenylalanylserine Proteins 0.000 description 22
- 239000000833 heterodimer Substances 0.000 description 21
- 238000003018 immunoassay Methods 0.000 description 21
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 20
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 20
- 108010087924 alanylproline Proteins 0.000 description 20
- 230000004071 biological effect Effects 0.000 description 20
- 239000013078 crystal Substances 0.000 description 20
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 18
- MRVSLWQRNWEROS-SVSWQMSJSA-N Cys-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CS)N MRVSLWQRNWEROS-SVSWQMSJSA-N 0.000 description 18
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 18
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 17
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 17
- SOACHCFYJMCMHC-BWBBJGPYSA-N Ser-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)O SOACHCFYJMCMHC-BWBBJGPYSA-N 0.000 description 17
- WVGKPKDWYQXWLU-BZSNNMDCSA-N Tyr-His-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CCCCN)C(=O)O)N)O WVGKPKDWYQXWLU-BZSNNMDCSA-N 0.000 description 17
- 108010016616 cysteinylglycine Proteins 0.000 description 17
- 230000006870 function Effects 0.000 description 17
- 108010009298 lysylglutamic acid Proteins 0.000 description 17
- XELISBQUZZAPQK-CIUDSAMLSA-N Cys-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N XELISBQUZZAPQK-CIUDSAMLSA-N 0.000 description 16
- XBELMDARIGXDKY-GUBZILKMSA-N Cys-Pro-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CS)N XBELMDARIGXDKY-GUBZILKMSA-N 0.000 description 16
- UEGIPZAXNBYCCP-NKWVEPMBSA-N Gly-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)CN)C(=O)O UEGIPZAXNBYCCP-NKWVEPMBSA-N 0.000 description 16
- WRFOZIJRODPLIA-QWRGUYRKSA-N Gly-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN)O WRFOZIJRODPLIA-QWRGUYRKSA-N 0.000 description 16
- 108010047495 alanylglycine Proteins 0.000 description 16
- 239000004202 carbamide Substances 0.000 description 16
- 230000004048 modification Effects 0.000 description 16
- 238000012986 modification Methods 0.000 description 16
- ZXKNLCPUNZPFGY-LEWSCRJBSA-N Ala-Tyr-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N ZXKNLCPUNZPFGY-LEWSCRJBSA-N 0.000 description 15
- YJHKTAMKPGFJCT-NRPADANISA-N Ala-Val-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O YJHKTAMKPGFJCT-NRPADANISA-N 0.000 description 15
- 230000001593 cAMP accumulation Effects 0.000 description 15
- 238000001514 detection method Methods 0.000 description 15
- 239000013604 expression vector Substances 0.000 description 15
- 108010049041 glutamylalanine Proteins 0.000 description 15
- 108010077515 glycylproline Proteins 0.000 description 15
- 239000000047 product Substances 0.000 description 15
- GFYOIYJJMSHLSN-QXEWZRGKSA-N Asp-Val-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GFYOIYJJMSHLSN-QXEWZRGKSA-N 0.000 description 14
- CHRCKSPMGYDLIA-SRVKXCTJSA-N Cys-Phe-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O CHRCKSPMGYDLIA-SRVKXCTJSA-N 0.000 description 14
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 14
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 14
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 14
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 14
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 14
- 230000008569 process Effects 0.000 description 14
- JOTRDIXZHNQYGP-DCAQKATOSA-N Arg-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCN=C(N)N)N JOTRDIXZHNQYGP-DCAQKATOSA-N 0.000 description 13
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 13
- DEFGUIIUYAUEDU-ZPFDUUQYSA-N Lys-Asn-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DEFGUIIUYAUEDU-ZPFDUUQYSA-N 0.000 description 13
- WAAZECNCPVGPIV-RHYQMDGZSA-N Lys-Thr-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O WAAZECNCPVGPIV-RHYQMDGZSA-N 0.000 description 13
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 13
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 description 13
- 108010050848 glycylleucine Proteins 0.000 description 13
- 108010026333 seryl-proline Proteins 0.000 description 13
- YMIYZAOBQDRCPP-UHFFFAOYSA-N Ala-Thr-Cys-Cys Chemical compound CC(N)C(=O)NC(C(O)C)C(=O)NC(CS)C(=O)NC(CS)C(O)=O YMIYZAOBQDRCPP-UHFFFAOYSA-N 0.000 description 12
- TXGDWPBLUFQODU-XGEHTFHBSA-N Cys-Pro-Thr Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O TXGDWPBLUFQODU-XGEHTFHBSA-N 0.000 description 12
- DDDLIMCZFKOERC-SVSWQMSJSA-N Thr-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N DDDLIMCZFKOERC-SVSWQMSJSA-N 0.000 description 12
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 12
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 12
- -1 alanine Chemical class 0.000 description 12
- 108010069495 cysteinyltyrosine Proteins 0.000 description 12
- 230000014509 gene expression Effects 0.000 description 12
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 11
- ISXJHXGYMJKXOI-GUBZILKMSA-N Glu-Cys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCC(O)=O ISXJHXGYMJKXOI-GUBZILKMSA-N 0.000 description 11
- SYWCGQOIIARSIX-SRVKXCTJSA-N Glu-Pro-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O SYWCGQOIIARSIX-SRVKXCTJSA-N 0.000 description 11
- LOXMWQOKYBGCHF-JBDRJPRFSA-N Ile-Cys-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O LOXMWQOKYBGCHF-JBDRJPRFSA-N 0.000 description 11
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 11
- DPWGZWUMUUJQDT-IUCAKERBSA-N Leu-Gln-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O DPWGZWUMUUJQDT-IUCAKERBSA-N 0.000 description 11
- 108091034117 Oligonucleotide Proteins 0.000 description 11
- VEWZSFGRQDUAJM-YJRXYDGGSA-N Thr-Cys-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N)O VEWZSFGRQDUAJM-YJRXYDGGSA-N 0.000 description 11
- ZHQWPWQNVRCXAX-XQQFMLRXSA-N Val-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZHQWPWQNVRCXAX-XQQFMLRXSA-N 0.000 description 11
- 230000015572 biosynthetic process Effects 0.000 description 11
- 230000003993 interaction Effects 0.000 description 11
- 239000013612 plasmid Substances 0.000 description 11
- UKVGHFORADMBEN-GUBZILKMSA-N Cys-Arg-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UKVGHFORADMBEN-GUBZILKMSA-N 0.000 description 10
- 108020004414 DNA Proteins 0.000 description 10
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 10
- SVZIKUHLRKVZIF-GUBZILKMSA-N Glu-Asn-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N SVZIKUHLRKVZIF-GUBZILKMSA-N 0.000 description 10
- UENPHLAAKDPZQY-XKBZYTNZSA-N Glu-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N)O UENPHLAAKDPZQY-XKBZYTNZSA-N 0.000 description 10
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 10
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 10
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 10
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 10
- YRNRVKTYDSLKMD-KKUMJFAQSA-N Lys-Ser-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YRNRVKTYDSLKMD-KKUMJFAQSA-N 0.000 description 10
- RAAVFTFEAUAVIY-DCAQKATOSA-N Met-Glu-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N RAAVFTFEAUAVIY-DCAQKATOSA-N 0.000 description 10
- KSIPKXNIQOWMIC-RCWTZXSCSA-N Met-Thr-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KSIPKXNIQOWMIC-RCWTZXSCSA-N 0.000 description 10
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 10
- JWQWPTLEOFNCGX-AVGNSLFASA-N Phe-Glu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JWQWPTLEOFNCGX-AVGNSLFASA-N 0.000 description 10
- BNBBNGZZKQUWCD-IUCAKERBSA-N Pro-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 BNBBNGZZKQUWCD-IUCAKERBSA-N 0.000 description 10
- QNZLIVROMORQFH-BQBZGAKWSA-N Pro-Gly-Cys Chemical compound C1C[C@H](NC1)C(=O)NCC(=O)N[C@@H](CS)C(=O)O QNZLIVROMORQFH-BQBZGAKWSA-N 0.000 description 10
- GLQFKOVWXPPFTP-VEVYYDQMSA-N Thr-Arg-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GLQFKOVWXPPFTP-VEVYYDQMSA-N 0.000 description 10
- 108010047857 aspartylglycine Proteins 0.000 description 10
- 238000004132 cross linking Methods 0.000 description 10
- 108010037850 glycylvaline Proteins 0.000 description 10
- 239000001963 growth medium Substances 0.000 description 10
- 108010005942 methionylglycine Proteins 0.000 description 10
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 10
- 108010053725 prolylvaline Proteins 0.000 description 10
- 102220196890 rs1057519097 Human genes 0.000 description 10
- 108010071207 serylmethionine Proteins 0.000 description 10
- LGQPPBQRUBVTIF-JBDRJPRFSA-N Ala-Ala-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LGQPPBQRUBVTIF-JBDRJPRFSA-N 0.000 description 9
- NIZKGBJVCMRDKO-KWQFWETISA-N Ala-Gly-Tyr Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NIZKGBJVCMRDKO-KWQFWETISA-N 0.000 description 9
- VHQSGALUSWIYOD-QXEWZRGKSA-N Asn-Pro-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O VHQSGALUSWIYOD-QXEWZRGKSA-N 0.000 description 9
- UXHYOWXTJLBEPG-GSSVUCPTSA-N Asn-Thr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UXHYOWXTJLBEPG-GSSVUCPTSA-N 0.000 description 9
- YRKJQKATZOTUEN-ACZMJKKPSA-N Cys-Gln-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N YRKJQKATZOTUEN-ACZMJKKPSA-N 0.000 description 9
- QXPRJQPCFXMCIY-NKWVEPMBSA-N Gly-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN QXPRJQPCFXMCIY-NKWVEPMBSA-N 0.000 description 9
- LBCAQRFTWMMWRR-CIUDSAMLSA-N His-Cys-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O LBCAQRFTWMMWRR-CIUDSAMLSA-N 0.000 description 9
- KAXZXLSXFWSNNZ-XVYDVKMFSA-N His-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KAXZXLSXFWSNNZ-XVYDVKMFSA-N 0.000 description 9
- FFYYUUWROYYKFY-IHRRRGAJSA-N His-Val-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O FFYYUUWROYYKFY-IHRRRGAJSA-N 0.000 description 9
- XLXPYSDGMXTTNQ-UHFFFAOYSA-N Ile-Phe-Leu Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 XLXPYSDGMXTTNQ-UHFFFAOYSA-N 0.000 description 9
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 9
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 9
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 9
- PNDCUTDWYVKBHX-IHRRRGAJSA-N Met-Asp-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PNDCUTDWYVKBHX-IHRRRGAJSA-N 0.000 description 9
- STLBOMUOQNIALW-BQBZGAKWSA-N Met-Gly-Cys Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O STLBOMUOQNIALW-BQBZGAKWSA-N 0.000 description 9
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 9
- XUSDDSLCRPUKLP-QXEWZRGKSA-N Pro-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 XUSDDSLCRPUKLP-QXEWZRGKSA-N 0.000 description 9
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 9
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 9
- 108010076504 Protein Sorting Signals Proteins 0.000 description 9
- KZUJCMPVNXOBAF-LKXGYXEUSA-N Thr-Cys-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O KZUJCMPVNXOBAF-LKXGYXEUSA-N 0.000 description 9
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 9
- GFZQWWDXJVGEMW-ULQDDVLXSA-N Tyr-Arg-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GFZQWWDXJVGEMW-ULQDDVLXSA-N 0.000 description 9
- HJSLDXZAZGFPDK-ULQDDVLXSA-N Val-Phe-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N HJSLDXZAZGFPDK-ULQDDVLXSA-N 0.000 description 9
- 239000005557 antagonist Substances 0.000 description 9
- 229940015047 chorionic gonadotropin Drugs 0.000 description 9
- 108010017391 lysylvaline Proteins 0.000 description 9
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 9
- 230000001225 therapeutic effect Effects 0.000 description 9
- OYJCVIGKMXUVKB-GARJFASQSA-N Ala-Leu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N OYJCVIGKMXUVKB-GARJFASQSA-N 0.000 description 8
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 8
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 8
- JEPNYDRDYNSFIU-QXEWZRGKSA-N Asn-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(N)=O)C(O)=O JEPNYDRDYNSFIU-QXEWZRGKSA-N 0.000 description 8
- SZNGQSBRHFMZLT-IHRRRGAJSA-N Asn-Pro-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SZNGQSBRHFMZLT-IHRRRGAJSA-N 0.000 description 8
- QLCPDGRAEJSYQM-LPEHRKFASA-N Cys-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N)C(=O)O QLCPDGRAEJSYQM-LPEHRKFASA-N 0.000 description 8
- UUERSUCTHOZPMG-SRVKXCTJSA-N Cys-Asn-Tyr Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UUERSUCTHOZPMG-SRVKXCTJSA-N 0.000 description 8
- KVGPYKUIHZJWGA-BQBZGAKWSA-N Cys-Met-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O KVGPYKUIHZJWGA-BQBZGAKWSA-N 0.000 description 8
- FCXJJTRGVAZDER-FXQIFTODSA-N Cys-Val-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O FCXJJTRGVAZDER-FXQIFTODSA-N 0.000 description 8
- YLEIWGJJBFBFHC-KBPBESRZSA-N Gly-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 YLEIWGJJBFBFHC-KBPBESRZSA-N 0.000 description 8
- WSWWTQYHFCBKBT-DVJZZOLTSA-N Gly-Thr-Trp Chemical compound C[C@@H](O)[C@H](NC(=O)CN)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O WSWWTQYHFCBKBT-DVJZZOLTSA-N 0.000 description 8
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 8
- BRQKGRLDDDQWQJ-MBLNEYKQSA-N His-Thr-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O BRQKGRLDDDQWQJ-MBLNEYKQSA-N 0.000 description 8
- HJDZMPFEXINXLO-QPHKQPEJSA-N Ile-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N HJDZMPFEXINXLO-QPHKQPEJSA-N 0.000 description 8
- GNXGAVNTVNOCLL-SIUGBPQLSA-N Ile-Tyr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GNXGAVNTVNOCLL-SIUGBPQLSA-N 0.000 description 8
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 8
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 8
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 8
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 8
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 8
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 8
- USBFEVBHEQBWDD-AVGNSLFASA-N Met-Leu-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O USBFEVBHEQBWDD-AVGNSLFASA-N 0.000 description 8
- 238000005481 NMR spectroscopy Methods 0.000 description 8
- SXJGROGVINAYSH-AVGNSLFASA-N Phe-Gln-Asp Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N SXJGROGVINAYSH-AVGNSLFASA-N 0.000 description 8
- LLGTYVHITPVGKR-RYUDHWBXSA-N Phe-Gln-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O LLGTYVHITPVGKR-RYUDHWBXSA-N 0.000 description 8
- HBXAOEBRGLCLIW-AVGNSLFASA-N Phe-Ser-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HBXAOEBRGLCLIW-AVGNSLFASA-N 0.000 description 8
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 8
- FDMKYQQYJKYCLV-GUBZILKMSA-N Pro-Pro-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 FDMKYQQYJKYCLV-GUBZILKMSA-N 0.000 description 8
- GOMUXSCOIWIJFP-GUBZILKMSA-N Pro-Ser-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GOMUXSCOIWIJFP-GUBZILKMSA-N 0.000 description 8
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 8
- GXXTUIUYTWGPMV-FXQIFTODSA-N Ser-Arg-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O GXXTUIUYTWGPMV-FXQIFTODSA-N 0.000 description 8
- JURQXQBJKUHGJS-UHFFFAOYSA-N Ser-Ser-Ser-Ser Chemical compound OCC(N)C(=O)NC(CO)C(=O)NC(CO)C(=O)NC(CO)C(O)=O JURQXQBJKUHGJS-UHFFFAOYSA-N 0.000 description 8
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 8
- SBYQHZCMVSPQCS-RCWTZXSCSA-N Thr-Val-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCSC)C(O)=O SBYQHZCMVSPQCS-RCWTZXSCSA-N 0.000 description 8
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 8
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 8
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 8
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 8
- 230000007423 decrease Effects 0.000 description 8
- 238000010494 dissociation reaction Methods 0.000 description 8
- 230000005593 dissociations Effects 0.000 description 8
- 238000005755 formation reaction Methods 0.000 description 8
- 108010078144 glutaminyl-glycine Proteins 0.000 description 8
- 108010037389 glutamyl-cysteinyl-lysine Proteins 0.000 description 8
- 230000002401 inhibitory effect Effects 0.000 description 8
- 210000004962 mammalian cell Anatomy 0.000 description 8
- 108010068488 methionylphenylalanine Proteins 0.000 description 8
- 239000000203 mixture Substances 0.000 description 8
- 230000016087 ovulation Effects 0.000 description 8
- 108091008146 restriction endonucleases Proteins 0.000 description 8
- 108010020532 tyrosyl-proline Proteins 0.000 description 8
- 108010076441 Ala-His-His Proteins 0.000 description 7
- WKPXXXUSUHAXDE-SRVKXCTJSA-N Arg-Pro-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O WKPXXXUSUHAXDE-SRVKXCTJSA-N 0.000 description 7
- UBPMOJLRVMGTOQ-GARJFASQSA-N Asp-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC(=O)O)N)C(=O)O UBPMOJLRVMGTOQ-GARJFASQSA-N 0.000 description 7
- 108091026890 Coding region Proteins 0.000 description 7
- QJUDRFBUWAGUSG-SRVKXCTJSA-N Cys-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)N QJUDRFBUWAGUSG-SRVKXCTJSA-N 0.000 description 7
- DZSICRGTVPDCRN-YUMQZZPRSA-N Cys-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N DZSICRGTVPDCRN-YUMQZZPRSA-N 0.000 description 7
- DRXOWZZHCSBUOI-YJRXYDGGSA-N Cys-Thr-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CS)N)O DRXOWZZHCSBUOI-YJRXYDGGSA-N 0.000 description 7
- GAAHQHNCMIAYEX-UWVGGRQHSA-N Gly-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GAAHQHNCMIAYEX-UWVGGRQHSA-N 0.000 description 7
- 102000006771 Gonadotropins Human genes 0.000 description 7
- 108010086677 Gonadotropins Proteins 0.000 description 7
- YGDWPQCLFJNMOL-MNXVOIDGSA-N Ile-Leu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YGDWPQCLFJNMOL-MNXVOIDGSA-N 0.000 description 7
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 7
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 7
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 7
- LMMBAXJRYSXCOQ-ACRUOGEOSA-N Lys-Tyr-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O LMMBAXJRYSXCOQ-ACRUOGEOSA-N 0.000 description 7
- CPTJPDZTFNKFOU-MXAVVETBSA-N Phe-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=CC=C1)N CPTJPDZTFNKFOU-MXAVVETBSA-N 0.000 description 7
- YXHYJEPDKSYPSQ-AVGNSLFASA-N Pro-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 YXHYJEPDKSYPSQ-AVGNSLFASA-N 0.000 description 7
- 108020004511 Recombinant DNA Proteins 0.000 description 7
- PTWIYDNFWPXQSD-GARJFASQSA-N Ser-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N)C(=O)O PTWIYDNFWPXQSD-GARJFASQSA-N 0.000 description 7
- WUXCHQZLUHBSDJ-LKXGYXEUSA-N Ser-Thr-Asp Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WUXCHQZLUHBSDJ-LKXGYXEUSA-N 0.000 description 7
- VOHWDZNIESHTFW-XKBZYTNZSA-N Thr-Glu-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)O VOHWDZNIESHTFW-XKBZYTNZSA-N 0.000 description 7
- WTMPKZWHRCMMMT-KZVJFYERSA-N Thr-Pro-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WTMPKZWHRCMMMT-KZVJFYERSA-N 0.000 description 7
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 7
- 102000003911 Thyrotropin Receptors Human genes 0.000 description 7
- 108090000253 Thyrotropin Receptors Proteins 0.000 description 7
- TVOGEPLDNYTAHD-CQDKDKBSSA-N Tyr-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 TVOGEPLDNYTAHD-CQDKDKBSSA-N 0.000 description 7
- ZAGPDPNPWYPEIR-SRVKXCTJSA-N Tyr-Cys-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O ZAGPDPNPWYPEIR-SRVKXCTJSA-N 0.000 description 7
- JVGHIFMSFBZDHH-WPRPVWTQSA-N Val-Met-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N JVGHIFMSFBZDHH-WPRPVWTQSA-N 0.000 description 7
- 235000004279 alanine Nutrition 0.000 description 7
- 125000000539 amino acid group Chemical group 0.000 description 7
- 108010013835 arginine glutamate Proteins 0.000 description 7
- 239000000539 dimer Substances 0.000 description 7
- 239000002622 gonadotropin Substances 0.000 description 7
- 238000002347 injection Methods 0.000 description 7
- 239000007924 injection Substances 0.000 description 7
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 7
- 108010003700 lysyl aspartic acid Proteins 0.000 description 7
- 238000004519 manufacturing process Methods 0.000 description 7
- 239000002609 medium Substances 0.000 description 7
- 150000002482 oligosaccharides Chemical class 0.000 description 7
- MTCFGRXMJLQNBG-UHFFFAOYSA-N serine Chemical compound OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 7
- 108010071097 threonyl-lysyl-proline Proteins 0.000 description 7
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 6
- CYBJZLQSUJEMAS-LFSVMHDDSA-N Ala-Phe-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C)N)O CYBJZLQSUJEMAS-LFSVMHDDSA-N 0.000 description 6
- DZQKLNLLWFQONU-LKXGYXEUSA-N Asp-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N)O DZQKLNLLWFQONU-LKXGYXEUSA-N 0.000 description 6
- ZKAOJVJQGVUIIU-GUBZILKMSA-N Asp-Pro-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ZKAOJVJQGVUIIU-GUBZILKMSA-N 0.000 description 6
- 101100468640 Danio rerio rhcgl2 gene Proteins 0.000 description 6
- JNENSVNAUWONEZ-GUBZILKMSA-N Gln-Lys-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O JNENSVNAUWONEZ-GUBZILKMSA-N 0.000 description 6
- LHRXAHLCRMQBGJ-RYUDHWBXSA-N Gly-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)CN LHRXAHLCRMQBGJ-RYUDHWBXSA-N 0.000 description 6
- VLIJYPMATZSOLL-YUMQZZPRSA-N Gly-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN VLIJYPMATZSOLL-YUMQZZPRSA-N 0.000 description 6
- QSQXZZCGPXQBPP-BQBZGAKWSA-N Gly-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)CN)C(=O)N[C@@H](CS)C(=O)O QSQXZZCGPXQBPP-BQBZGAKWSA-N 0.000 description 6
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 6
- KNKHAVVBVXKOGX-JXUBOQSCSA-N Lys-Ala-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KNKHAVVBVXKOGX-JXUBOQSCSA-N 0.000 description 6
- 241001529936 Murinae Species 0.000 description 6
- AAERWTUHZKLDLC-IHRRRGAJSA-N Phe-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O AAERWTUHZKLDLC-IHRRRGAJSA-N 0.000 description 6
- RWDVVSKYZBNDCO-MELADBBJSA-N Ser-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CO)N)C(=O)O RWDVVSKYZBNDCO-MELADBBJSA-N 0.000 description 6
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 6
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 6
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 6
- 125000004432 carbon atom Chemical group C* 0.000 description 6
- 229910052739 hydrogen Inorganic materials 0.000 description 6
- 239000001257 hydrogen Substances 0.000 description 6
- 230000001900 immune effect Effects 0.000 description 6
- 238000002703 mutagenesis Methods 0.000 description 6
- 231100000350 mutagenesis Toxicity 0.000 description 6
- 229920001542 oligosaccharide Polymers 0.000 description 6
- 101150053759 rhcg gene Proteins 0.000 description 6
- 239000002904 solvent Substances 0.000 description 6
- 230000004936 stimulating effect Effects 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- 239000000725 suspension Substances 0.000 description 6
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 6
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 5
- LJFNNUBZSZCZFN-WHFBIAKZSA-N Ala-Gly-Cys Chemical compound N[C@@H](C)C(=O)NCC(=O)N[C@@H](CS)C(=O)O LJFNNUBZSZCZFN-WHFBIAKZSA-N 0.000 description 5
- KLKARCOHVHLAJP-UWJYBYFXSA-N Ala-Tyr-Cys Chemical compound C[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CS)C(O)=O KLKARCOHVHLAJP-UWJYBYFXSA-N 0.000 description 5
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 5
- QQXOYLWJQUPXJU-WHFBIAKZSA-N Asp-Cys-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O QQXOYLWJQUPXJU-WHFBIAKZSA-N 0.000 description 5
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 5
- CUQDCPXNZPDYFQ-ZLUOBGJFSA-N Asp-Ser-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O CUQDCPXNZPDYFQ-ZLUOBGJFSA-N 0.000 description 5
- 241000283690 Bos taurus Species 0.000 description 5
- DZLQXIFVQFTFJY-BYPYZUCNSA-N Cys-Gly-Gly Chemical compound SC[C@H](N)C(=O)NCC(=O)NCC(O)=O DZLQXIFVQFTFJY-BYPYZUCNSA-N 0.000 description 5
- HJXSYJVCMUOUNY-SRVKXCTJSA-N Cys-Ser-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N HJXSYJVCMUOUNY-SRVKXCTJSA-N 0.000 description 5
- KYFSMWLWHYZRNW-ACZMJKKPSA-N Gln-Asp-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N KYFSMWLWHYZRNW-ACZMJKKPSA-N 0.000 description 5
- IXFVOPOHSRKJNG-LAEOZQHASA-N Gln-Asp-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IXFVOPOHSRKJNG-LAEOZQHASA-N 0.000 description 5
- CCBIBMKQNXHNIN-ZETCQYMHSA-N Gly-Leu-Gly Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O CCBIBMKQNXHNIN-ZETCQYMHSA-N 0.000 description 5
- NCSIQAFSIPHVAN-IUKAMOBKSA-N Ile-Asn-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NCSIQAFSIPHVAN-IUKAMOBKSA-N 0.000 description 5
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 5
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 5
- DPURXCQCHSQPAN-AVGNSLFASA-N Leu-Pro-Pro Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 DPURXCQCHSQPAN-AVGNSLFASA-N 0.000 description 5
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 5
- LJBVRCDPWOJOEK-PPCPHDFISA-N Leu-Thr-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LJBVRCDPWOJOEK-PPCPHDFISA-N 0.000 description 5
- 102000009151 Luteinizing Hormone Human genes 0.000 description 5
- 108010073521 Luteinizing Hormone Proteins 0.000 description 5
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 5
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 5
- 101100491597 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) arg-6 gene Proteins 0.000 description 5
- 101100109397 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) arg-8 gene Proteins 0.000 description 5
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 5
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 5
- NFLNBHLMLYALOO-DCAQKATOSA-N Pro-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@@H]1CCCN1 NFLNBHLMLYALOO-DCAQKATOSA-N 0.000 description 5
- BJCXXMGGPHRSHV-GUBZILKMSA-N Pro-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BJCXXMGGPHRSHV-GUBZILKMSA-N 0.000 description 5
- UGDMQJSXSSZUKL-IHRRRGAJSA-N Pro-Ser-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O UGDMQJSXSSZUKL-IHRRRGAJSA-N 0.000 description 5
- IURWWZYKYPEANQ-HJGDQZAQSA-N Pro-Thr-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IURWWZYKYPEANQ-HJGDQZAQSA-N 0.000 description 5
- 108010079005 RDV peptide Proteins 0.000 description 5
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 5
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 5
- BEZTUFWTPVOROW-KJEVXHAQSA-N Thr-Tyr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O BEZTUFWTPVOROW-KJEVXHAQSA-N 0.000 description 5
- DIHPMRTXPYMDJZ-KAOXEZKKSA-N Thr-Tyr-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N)O DIHPMRTXPYMDJZ-KAOXEZKKSA-N 0.000 description 5
- KPMIQCXJDVKWKO-IFFSRLJSSA-N Thr-Val-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KPMIQCXJDVKWKO-IFFSRLJSSA-N 0.000 description 5
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 5
- PFMSJVIPEZMKSC-DZKIICNBSA-N Val-Tyr-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N PFMSJVIPEZMKSC-DZKIICNBSA-N 0.000 description 5
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 5
- QTBSBXVTEAMEQO-UHFFFAOYSA-N acetic acid Substances CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 5
- 238000000137 annealing Methods 0.000 description 5
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 5
- 238000004925 denaturation Methods 0.000 description 5
- 230000036425 denaturation Effects 0.000 description 5
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 239000002773 nucleotide Substances 0.000 description 5
- 125000003729 nucleotide group Chemical group 0.000 description 5
- 210000001672 ovary Anatomy 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 238000012163 sequencing technique Methods 0.000 description 5
- 230000000087 stabilizing effect Effects 0.000 description 5
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 4
- LGGHQRZIJSYRHA-GUBZILKMSA-N Asp-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)O)N LGGHQRZIJSYRHA-GUBZILKMSA-N 0.000 description 4
- 101100533230 Caenorhabditis elegans ser-2 gene Proteins 0.000 description 4
- XEEIQMGZRFFSRD-XVYDVKMFSA-N Cys-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CS)N XEEIQMGZRFFSRD-XVYDVKMFSA-N 0.000 description 4
- OCEHKDFAWQIBHH-FXQIFTODSA-N Cys-Arg-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N OCEHKDFAWQIBHH-FXQIFTODSA-N 0.000 description 4
- NQSUTVRXXBGVDQ-LKXGYXEUSA-N Cys-Asn-Thr Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NQSUTVRXXBGVDQ-LKXGYXEUSA-N 0.000 description 4
- OLIYIKRCOZBFCW-ZLUOBGJFSA-N Cys-Asp-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N)C(=O)O OLIYIKRCOZBFCW-ZLUOBGJFSA-N 0.000 description 4
- KFYPRIGJTICABD-XGEHTFHBSA-N Cys-Thr-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N)O KFYPRIGJTICABD-XGEHTFHBSA-N 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- QFTRCUPCARNIPZ-XHNCKOQMSA-N Gln-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)N)N)C(=O)O QFTRCUPCARNIPZ-XHNCKOQMSA-N 0.000 description 4
- OREPWMPAUWIIAM-ZPFDUUQYSA-N Gln-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N OREPWMPAUWIIAM-ZPFDUUQYSA-N 0.000 description 4
- XXGQRGQPGFYECI-WDSKDSINSA-N Gly-Cys-Glu Chemical compound NCC(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCC(O)=O XXGQRGQPGFYECI-WDSKDSINSA-N 0.000 description 4
- 241000238631 Hexapoda Species 0.000 description 4
- KZTLOHBDLMIFSH-XVYDVKMFSA-N His-Ala-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O KZTLOHBDLMIFSH-XVYDVKMFSA-N 0.000 description 4
- CKRJBQJIGOEKMC-SRVKXCTJSA-N His-Lys-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O CKRJBQJIGOEKMC-SRVKXCTJSA-N 0.000 description 4
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 4
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 4
- YFBBUHJJUXXZOF-UWVGGRQHSA-N Leu-Gly-Pro Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O YFBBUHJJUXXZOF-UWVGGRQHSA-N 0.000 description 4
- ZLGQEBCCANLYRA-RYUDHWBXSA-N Phe-Gly-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O ZLGQEBCCANLYRA-RYUDHWBXSA-N 0.000 description 4
- YFXXRYFWJFQAFW-JHYOHUSXSA-N Phe-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O YFXXRYFWJFQAFW-JHYOHUSXSA-N 0.000 description 4
- WTPKKLMBNBCCNL-ACZMJKKPSA-N Ser-Cys-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N WTPKKLMBNBCCNL-ACZMJKKPSA-N 0.000 description 4
- KMWFXJCGRXBQAC-CIUDSAMLSA-N Ser-Cys-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CO)N KMWFXJCGRXBQAC-CIUDSAMLSA-N 0.000 description 4
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 4
- UZJDBCHMIQXLOQ-HEIBUPTGSA-N Thr-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O UZJDBCHMIQXLOQ-HEIBUPTGSA-N 0.000 description 4
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 4
- XGFYGMKZKFRGAI-RCWTZXSCSA-N Thr-Val-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XGFYGMKZKFRGAI-RCWTZXSCSA-N 0.000 description 4
- JISIQDCOHJOOPU-WFBYXXMGSA-N Trp-Cys-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O JISIQDCOHJOOPU-WFBYXXMGSA-N 0.000 description 4
- UMXSDHPSMROQRB-YJRXYDGGSA-N Tyr-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O UMXSDHPSMROQRB-YJRXYDGGSA-N 0.000 description 4
- KOVXHANYYYMBRF-IRIUXVKKSA-N Tyr-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O KOVXHANYYYMBRF-IRIUXVKKSA-N 0.000 description 4
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 4
- SJRUJQFQVLMZFW-WPRPVWTQSA-N Val-Pro-Gly Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O SJRUJQFQVLMZFW-WPRPVWTQSA-N 0.000 description 4
- RLVTVHSDKHBFQP-ULQDDVLXSA-N Val-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 RLVTVHSDKHBFQP-ULQDDVLXSA-N 0.000 description 4
- 108010045023 alanyl-prolyl-tyrosine Proteins 0.000 description 4
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 4
- 125000004429 atom Chemical group 0.000 description 4
- 229910052799 carbon Inorganic materials 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 229940088598 enzyme Drugs 0.000 description 4
- 210000003527 eukaryotic cell Anatomy 0.000 description 4
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 4
- 108010015792 glycyllysine Proteins 0.000 description 4
- 238000010438 heat treatment Methods 0.000 description 4
- 108091008039 hormone receptors Proteins 0.000 description 4
- 230000002209 hydrophobic effect Effects 0.000 description 4
- 238000001727 in vivo Methods 0.000 description 4
- 230000001965 increasing effect Effects 0.000 description 4
- 239000000543 intermediate Substances 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 4
- 230000035935 pregnancy Effects 0.000 description 4
- 108010029020 prolylglycine Proteins 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 230000001105 regulatory effect Effects 0.000 description 4
- 210000002966 serum Anatomy 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 230000002103 transcriptional effect Effects 0.000 description 4
- 210000002700 urine Anatomy 0.000 description 4
- FJQZXCPWAGYPSD-UHFFFAOYSA-N 1,3,4,6-tetrachloro-3a,6a-diphenylimidazo[4,5-d]imidazole-2,5-dione Chemical compound ClN1C(=O)N(Cl)C2(C=3C=CC=CC=3)N(Cl)C(=O)N(Cl)C12C1=CC=CC=C1 FJQZXCPWAGYPSD-UHFFFAOYSA-N 0.000 description 3
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 3
- DAEFQZCYZKRTLR-ZLUOBGJFSA-N Ala-Cys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(O)=O DAEFQZCYZKRTLR-ZLUOBGJFSA-N 0.000 description 3
- DYXOFPBJBAHWFY-JBDRJPRFSA-N Ala-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N DYXOFPBJBAHWFY-JBDRJPRFSA-N 0.000 description 3
- UISQLSIBJKEJSS-GUBZILKMSA-N Arg-Arg-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(O)=O UISQLSIBJKEJSS-GUBZILKMSA-N 0.000 description 3
- OQCWXQJLCDPRHV-UWVGGRQHSA-N Arg-Gly-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O OQCWXQJLCDPRHV-UWVGGRQHSA-N 0.000 description 3
- HNJNAMGZQZPSRE-GUBZILKMSA-N Arg-Pro-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O HNJNAMGZQZPSRE-GUBZILKMSA-N 0.000 description 3
- UULLJGQFCDXVTQ-CYDGBPFRSA-N Arg-Pro-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UULLJGQFCDXVTQ-CYDGBPFRSA-N 0.000 description 3
- PFOYSEIHFVKHNF-FXQIFTODSA-N Asn-Ala-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PFOYSEIHFVKHNF-FXQIFTODSA-N 0.000 description 3
- CMLGVVWQQHUXOZ-GHCJXIJMSA-N Asn-Ala-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CMLGVVWQQHUXOZ-GHCJXIJMSA-N 0.000 description 3
- SUEIIIFUBHDCCS-PBCZWWQYSA-N Asn-His-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SUEIIIFUBHDCCS-PBCZWWQYSA-N 0.000 description 3
- IBLAOXSULLECQZ-IUKAMOBKSA-N Asn-Ile-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC(N)=O IBLAOXSULLECQZ-IUKAMOBKSA-N 0.000 description 3
- KYQJHBWHRASMKG-ZLUOBGJFSA-N Asn-Ser-Cys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O KYQJHBWHRASMKG-ZLUOBGJFSA-N 0.000 description 3
- HPASIOLTWSNMFB-OLHMAJIHSA-N Asn-Thr-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O HPASIOLTWSNMFB-OLHMAJIHSA-N 0.000 description 3
- XLDMSQYOYXINSZ-QXEWZRGKSA-N Asn-Val-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N XLDMSQYOYXINSZ-QXEWZRGKSA-N 0.000 description 3
- WJHYGGVCWREQMO-GHCJXIJMSA-N Asp-Cys-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WJHYGGVCWREQMO-GHCJXIJMSA-N 0.000 description 3
- KVPHTGVUMJGMCX-BIIVOSGPSA-N Asp-Cys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N)C(=O)O KVPHTGVUMJGMCX-BIIVOSGPSA-N 0.000 description 3
- SDDAYZYYUJILPB-UHFFFAOYSA-N Asp-Leu-Val-Tyr Chemical compound OC(=O)CC(N)C(=O)NC(CC(C)C)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 SDDAYZYYUJILPB-UHFFFAOYSA-N 0.000 description 3
- DINOVZWPTMGSRF-QXEWZRGKSA-N Asp-Pro-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O DINOVZWPTMGSRF-QXEWZRGKSA-N 0.000 description 3
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 3
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 3
- CZIVKMOEXPILDK-SRVKXCTJSA-N Asp-Tyr-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O CZIVKMOEXPILDK-SRVKXCTJSA-N 0.000 description 3
- DQGIAOGALAQBGK-BWBBJGPYSA-N Cys-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N)O DQGIAOGALAQBGK-BWBBJGPYSA-N 0.000 description 3
- ZKAUCGZIIXXWJQ-BZSNNMDCSA-N Cys-Tyr-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)NC(=O)[C@H](CS)N)O ZKAUCGZIIXXWJQ-BZSNNMDCSA-N 0.000 description 3
- WLODHVXYKYHLJD-ACZMJKKPSA-N Gln-Asp-Ser Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CO)C(=O)O)N WLODHVXYKYHLJD-ACZMJKKPSA-N 0.000 description 3
- ZEEPYMXTJWIMSN-GUBZILKMSA-N Gln-Lys-Ser Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CO)C(O)=O)NC(=O)[C@@H](N)CCC(N)=O ZEEPYMXTJWIMSN-GUBZILKMSA-N 0.000 description 3
- XQDGOJPVMSWZSO-SRVKXCTJSA-N Gln-Pro-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCC(=O)N)N XQDGOJPVMSWZSO-SRVKXCTJSA-N 0.000 description 3
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 3
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 3
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 3
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 3
- NNQDRRUXFJYCCJ-NHCYSSNCSA-N Glu-Pro-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O NNQDRRUXFJYCCJ-NHCYSSNCSA-N 0.000 description 3
- GVVKYKCOFMMTKZ-WHFBIAKZSA-N Gly-Cys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CS)NC(=O)CN GVVKYKCOFMMTKZ-WHFBIAKZSA-N 0.000 description 3
- NTOWAXLMQFKJPT-YUMQZZPRSA-N Gly-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)CN NTOWAXLMQFKJPT-YUMQZZPRSA-N 0.000 description 3
- QVDGHDFFYHKJPN-QWRGUYRKSA-N Gly-Phe-Cys Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CS)C(O)=O QVDGHDFFYHKJPN-QWRGUYRKSA-N 0.000 description 3
- HAOUOFNNJJLVNS-BQBZGAKWSA-N Gly-Pro-Ser Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O HAOUOFNNJJLVNS-BQBZGAKWSA-N 0.000 description 3
- KWBISLAEQZUYIC-UWJYBYFXSA-N His-His-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC2=CN=CN2)N KWBISLAEQZUYIC-UWJYBYFXSA-N 0.000 description 3
- ORZGPQXISSXQGW-IHRRRGAJSA-N His-His-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O ORZGPQXISSXQGW-IHRRRGAJSA-N 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 3
- BATWGBRIZANGPN-ZPFDUUQYSA-N Ile-Pro-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(=O)N)C(=O)O)N BATWGBRIZANGPN-ZPFDUUQYSA-N 0.000 description 3
- AGGIYSLVUKVOPT-HTFCKZLJSA-N Ile-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N AGGIYSLVUKVOPT-HTFCKZLJSA-N 0.000 description 3
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 3
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 3
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 3
- KIZIOFNVSOSKJI-CIUDSAMLSA-N Leu-Ser-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N KIZIOFNVSOSKJI-CIUDSAMLSA-N 0.000 description 3
- YEIYAQQKADPIBJ-GARJFASQSA-N Lys-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N)C(=O)O YEIYAQQKADPIBJ-GARJFASQSA-N 0.000 description 3
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 3
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 3
- SVSQSPICRKBMSZ-SRVKXCTJSA-N Lys-Pro-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O SVSQSPICRKBMSZ-SRVKXCTJSA-N 0.000 description 3
- CUHGAUZONORRIC-HJGDQZAQSA-N Lys-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N)O CUHGAUZONORRIC-HJGDQZAQSA-N 0.000 description 3
- TVOOGUNBIWAURO-KATARQTJSA-N Lys-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N)O TVOOGUNBIWAURO-KATARQTJSA-N 0.000 description 3
- WPTHAGXMYDRPFD-SRVKXCTJSA-N Met-Lys-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O WPTHAGXMYDRPFD-SRVKXCTJSA-N 0.000 description 3
- 241000699670 Mus sp. Species 0.000 description 3
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 3
- XNMYNGDKJNOKHH-BZSNNMDCSA-N Phe-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XNMYNGDKJNOKHH-BZSNNMDCSA-N 0.000 description 3
- STGVYUTZKGPRCI-GUBZILKMSA-N Pro-Val-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 STGVYUTZKGPRCI-GUBZILKMSA-N 0.000 description 3
- 230000010799 Receptor Interactions Effects 0.000 description 3
- CTRHXXXHUJTTRZ-ZLUOBGJFSA-N Ser-Asp-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O CTRHXXXHUJTTRZ-ZLUOBGJFSA-N 0.000 description 3
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 3
- WYKJENSCCRJLRC-ZDLURKLDSA-N Thr-Gly-Cys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N)O WYKJENSCCRJLRC-ZDLURKLDSA-N 0.000 description 3
- PUEWAXRPXOEQOW-HJGDQZAQSA-N Thr-Met-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(O)=O PUEWAXRPXOEQOW-HJGDQZAQSA-N 0.000 description 3
- VGYVVSQFSSKZRJ-OEAJRASXSA-N Thr-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@H](O)C)CC1=CC=CC=C1 VGYVVSQFSSKZRJ-OEAJRASXSA-N 0.000 description 3
- YGZWVPBHYABGLT-KJEVXHAQSA-N Thr-Pro-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 YGZWVPBHYABGLT-KJEVXHAQSA-N 0.000 description 3
- DKNYWNPPSZCWCJ-GBALPHGKSA-N Thr-Trp-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CS)C(=O)O)N)O DKNYWNPPSZCWCJ-GBALPHGKSA-N 0.000 description 3
- ABCLYRRGTZNIFU-BWAGICSOSA-N Thr-Tyr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O ABCLYRRGTZNIFU-BWAGICSOSA-N 0.000 description 3
- HNERGSKJJZQGEA-JYJNAYRXSA-N Tyr-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N HNERGSKJJZQGEA-JYJNAYRXSA-N 0.000 description 3
- PYJKETPLFITNKS-IHRRRGAJSA-N Tyr-Pro-Asn Chemical compound N[C@@H](Cc1ccc(O)cc1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O PYJKETPLFITNKS-IHRRRGAJSA-N 0.000 description 3
- RGYCVIZZTUBSSG-JYJNAYRXSA-N Tyr-Pro-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O RGYCVIZZTUBSSG-JYJNAYRXSA-N 0.000 description 3
- ITDWWLTTWRRLCC-KJEVXHAQSA-N Tyr-Thr-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ITDWWLTTWRRLCC-KJEVXHAQSA-N 0.000 description 3
- GAKBTSMAPGLQFA-JNPHEJMOSA-N Tyr-Thr-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 GAKBTSMAPGLQFA-JNPHEJMOSA-N 0.000 description 3
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 3
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 3
- IRLYZKKNBFPQBW-XGEHTFHBSA-N Val-Cys-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N)O IRLYZKKNBFPQBW-XGEHTFHBSA-N 0.000 description 3
- VCAWFLIWYNMHQP-UKJIMTQDSA-N Val-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N VCAWFLIWYNMHQP-UKJIMTQDSA-N 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 239000007864 aqueous solution Substances 0.000 description 3
- 238000003556 assay Methods 0.000 description 3
- 230000001588 bifunctional effect Effects 0.000 description 3
- 238000006664 bond formation reaction Methods 0.000 description 3
- 238000004113 cell culture Methods 0.000 description 3
- 239000003153 chemical reaction reagent Substances 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 150000001875 compounds Chemical class 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 239000003937 drug carrier Substances 0.000 description 3
- 230000002124 endocrine Effects 0.000 description 3
- 230000004720 fertilization Effects 0.000 description 3
- 230000003325 follicular Effects 0.000 description 3
- 108020001507 fusion proteins Proteins 0.000 description 3
- 102000037865 fusion proteins Human genes 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 238000006206 glycosylation reaction Methods 0.000 description 3
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 3
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 3
- 108010025801 glycyl-prolyl-arginine Proteins 0.000 description 3
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 3
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 3
- 230000006698 induction Effects 0.000 description 3
- 229920001184 polypeptide Polymers 0.000 description 3
- 238000001556 precipitation Methods 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 108010015796 prolylisoleucine Proteins 0.000 description 3
- 230000001737 promoting effect Effects 0.000 description 3
- 239000002287 radioligand Substances 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 238000004659 sterilization and disinfection Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 238000001890 transfection Methods 0.000 description 3
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 3
- 108010051110 tyrosyl-lysine Proteins 0.000 description 3
- 239000004474 valine Substances 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 238000001262 western blot Methods 0.000 description 3
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 2
- ZCYVEMRRCGMTRW-UHFFFAOYSA-N 7553-56-2 Chemical compound [I] ZCYVEMRRCGMTRW-UHFFFAOYSA-N 0.000 description 2
- JBGSZRYCXBPWGX-BQBZGAKWSA-N Ala-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CCCN=C(N)N JBGSZRYCXBPWGX-BQBZGAKWSA-N 0.000 description 2
- HWPXGQCMZITGFN-XVYDVKMFSA-N Ala-Cys-His Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HWPXGQCMZITGFN-XVYDVKMFSA-N 0.000 description 2
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 2
- VJVQKGYHIZPSNS-FXQIFTODSA-N Ala-Ser-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N VJVQKGYHIZPSNS-FXQIFTODSA-N 0.000 description 2
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 2
- HCBKAOZYACJUEF-XQXXSGGOSA-N Ala-Thr-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(N)=O)C(=O)O HCBKAOZYACJUEF-XQXXSGGOSA-N 0.000 description 2
- RRGPUNYIPJXJBU-GUBZILKMSA-N Arg-Asp-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O RRGPUNYIPJXJBU-GUBZILKMSA-N 0.000 description 2
- YUGFLWBWAJFGKY-BQBZGAKWSA-N Arg-Cys-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O YUGFLWBWAJFGKY-BQBZGAKWSA-N 0.000 description 2
- NKNILFJYKKHBKE-WPRPVWTQSA-N Arg-Gly-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O NKNILFJYKKHBKE-WPRPVWTQSA-N 0.000 description 2
- CVXXSWQORBZAAA-SRVKXCTJSA-N Arg-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N CVXXSWQORBZAAA-SRVKXCTJSA-N 0.000 description 2
- FOQFHANLUJDQEE-GUBZILKMSA-N Arg-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCCN=C(N)N)N)C(=O)N[C@@H](CS)C(=O)O FOQFHANLUJDQEE-GUBZILKMSA-N 0.000 description 2
- FVBZXNSRIDVYJS-AVGNSLFASA-N Arg-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N FVBZXNSRIDVYJS-AVGNSLFASA-N 0.000 description 2
- FTMRPIVPSDVGCC-GUBZILKMSA-N Arg-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FTMRPIVPSDVGCC-GUBZILKMSA-N 0.000 description 2
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 2
- NVGWESORMHFISY-SRVKXCTJSA-N Asn-Asn-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NVGWESORMHFISY-SRVKXCTJSA-N 0.000 description 2
- OKZOABJQOMAYEC-NUMRIWBASA-N Asn-Gln-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OKZOABJQOMAYEC-NUMRIWBASA-N 0.000 description 2
- ULRPXVNMIIYDDJ-ACZMJKKPSA-N Asn-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N ULRPXVNMIIYDDJ-ACZMJKKPSA-N 0.000 description 2
- PHJPKNUWWHRAOC-PEFMBERDSA-N Asn-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PHJPKNUWWHRAOC-PEFMBERDSA-N 0.000 description 2
- XLZCLJRGGMBKLR-PCBIJLKTSA-N Asn-Ile-Phe Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XLZCLJRGGMBKLR-PCBIJLKTSA-N 0.000 description 2
- MDDXKBHIMYYJLW-FXQIFTODSA-N Asn-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N MDDXKBHIMYYJLW-FXQIFTODSA-N 0.000 description 2
- XPGVTUBABLRGHY-BIIVOSGPSA-N Asp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N XPGVTUBABLRGHY-BIIVOSGPSA-N 0.000 description 2
- IAMNNSSEBXDJMN-CIUDSAMLSA-N Asp-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N IAMNNSSEBXDJMN-CIUDSAMLSA-N 0.000 description 2
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 2
- 108010072454 CTGCAG-specific type II deoxyribonucleases Proteins 0.000 description 2
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 2
- 241000699802 Cricetulus griseus Species 0.000 description 2
- KKZHXOOZHFABQQ-UWJYBYFXSA-N Cys-Ala-Tyr Chemical compound SC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKZHXOOZHFABQQ-UWJYBYFXSA-N 0.000 description 2
- YZFCGHIBLBDZDA-ZLUOBGJFSA-N Cys-Asp-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YZFCGHIBLBDZDA-ZLUOBGJFSA-N 0.000 description 2
- DVKQPQKQDHHFTE-ZLUOBGJFSA-N Cys-Cys-Asn Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CS)N)C(=O)N DVKQPQKQDHHFTE-ZLUOBGJFSA-N 0.000 description 2
- ZJBWJHQDOIMVLM-WHFBIAKZSA-N Cys-Cys-Gly Chemical compound SC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O ZJBWJHQDOIMVLM-WHFBIAKZSA-N 0.000 description 2
- WTNLLMQAFPOCTJ-GARJFASQSA-N Cys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CS)N)C(=O)O WTNLLMQAFPOCTJ-GARJFASQSA-N 0.000 description 2
- VFGADOJXRLWTBU-JBDRJPRFSA-N Cys-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CS)N VFGADOJXRLWTBU-JBDRJPRFSA-N 0.000 description 2
- XZKJEOMFLDVXJG-KATARQTJSA-N Cys-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)N)O XZKJEOMFLDVXJG-KATARQTJSA-N 0.000 description 2
- OHLLDUNVMPPUMD-DCAQKATOSA-N Cys-Leu-Val Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)O)NC(=O)[C@H](CS)N OHLLDUNVMPPUMD-DCAQKATOSA-N 0.000 description 2
- VDUPGIDTWNQAJD-CIUDSAMLSA-N Cys-Lys-Cys Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CS)C(=O)N[C@@H](CS)C(O)=O VDUPGIDTWNQAJD-CIUDSAMLSA-N 0.000 description 2
- DQUWSUWXPWGTQT-DCAQKATOSA-N Cys-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CS DQUWSUWXPWGTQT-DCAQKATOSA-N 0.000 description 2
- JAHCWGSVNZXHRR-SVSWQMSJSA-N Cys-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CS)N JAHCWGSVNZXHRR-SVSWQMSJSA-N 0.000 description 2
- IRKLTAKLAFUTLA-KATARQTJSA-N Cys-Thr-Lys Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H](N)CS)C(=O)N[C@@H](CCCCN)C(O)=O IRKLTAKLAFUTLA-KATARQTJSA-N 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 108010005054 Deoxyribonuclease BamHI Proteins 0.000 description 2
- 108010042407 Endonucleases Proteins 0.000 description 2
- 102000004533 Endonucleases Human genes 0.000 description 2
- 241000283086 Equidae Species 0.000 description 2
- 102000012673 Follicle Stimulating Hormone Human genes 0.000 description 2
- 108010079345 Follicle Stimulating Hormone Proteins 0.000 description 2
- IGNGBUVODQLMRJ-CIUDSAMLSA-N Gln-Ala-Met Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O IGNGBUVODQLMRJ-CIUDSAMLSA-N 0.000 description 2
- OIIIRRTWYLCQNW-ACZMJKKPSA-N Gln-Cys-Asn Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O OIIIRRTWYLCQNW-ACZMJKKPSA-N 0.000 description 2
- LWDGZZGWDMHBOF-FXQIFTODSA-N Gln-Glu-Asn Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O LWDGZZGWDMHBOF-FXQIFTODSA-N 0.000 description 2
- DOQUICBEISTQHE-CIUDSAMLSA-N Gln-Pro-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O DOQUICBEISTQHE-CIUDSAMLSA-N 0.000 description 2
- WBYHRQBKJGEBQJ-CIUDSAMLSA-N Gln-Pro-Cys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)N)N)C(=O)N[C@@H](CS)C(=O)O WBYHRQBKJGEBQJ-CIUDSAMLSA-N 0.000 description 2
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 2
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 2
- FLQAKQOBSPFGKG-CIUDSAMLSA-N Glu-Cys-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FLQAKQOBSPFGKG-CIUDSAMLSA-N 0.000 description 2
- LYCDZGLXQBPNQU-WDSKDSINSA-N Glu-Gly-Cys Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O LYCDZGLXQBPNQU-WDSKDSINSA-N 0.000 description 2
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 2
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 2
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 2
- QEJKKJNDDDPSMU-KKUMJFAQSA-N Glu-Tyr-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(O)=O QEJKKJNDDDPSMU-KKUMJFAQSA-N 0.000 description 2
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 2
- LERGJIVJIIODPZ-ZANVPECISA-N Gly-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)CN)C)C(O)=O)=CNC2=C1 LERGJIVJIIODPZ-ZANVPECISA-N 0.000 description 2
- ZRZILYKEJBMFHY-BQBZGAKWSA-N Gly-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN ZRZILYKEJBMFHY-BQBZGAKWSA-N 0.000 description 2
- GZBZACMXFIPIDX-WHFBIAKZSA-N Gly-Cys-Asp Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)CN)C(=O)O GZBZACMXFIPIDX-WHFBIAKZSA-N 0.000 description 2
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 2
- IVSWQHKONQIOHA-YUMQZZPRSA-N Gly-His-Cys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN IVSWQHKONQIOHA-YUMQZZPRSA-N 0.000 description 2
- MHXKHKWHPNETGG-QWRGUYRKSA-N Gly-Lys-Leu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O MHXKHKWHPNETGG-QWRGUYRKSA-N 0.000 description 2
- 102000001895 Gonadotropin Receptors Human genes 0.000 description 2
- 108010040490 Gonadotropin Receptors Proteins 0.000 description 2
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 2
- XJFITURPHAKKAI-SRVKXCTJSA-N His-Pro-Gln Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(N)=O)C(O)=O)C1=CN=CN1 XJFITURPHAKKAI-SRVKXCTJSA-N 0.000 description 2
- VCBWXASUBZIFLQ-IHRRRGAJSA-N His-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O VCBWXASUBZIFLQ-IHRRRGAJSA-N 0.000 description 2
- KFQDSSNYWKZFOO-LSJOCFKGSA-N His-Val-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KFQDSSNYWKZFOO-LSJOCFKGSA-N 0.000 description 2
- WSAILOWUJZEAGC-DCAQKATOSA-N His-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N WSAILOWUJZEAGC-DCAQKATOSA-N 0.000 description 2
- SYPULFZAGBBIOM-GVXVVHGQSA-N His-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N SYPULFZAGBBIOM-GVXVVHGQSA-N 0.000 description 2
- 230000010740 Hormone Receptor Interactions Effects 0.000 description 2
- OAKJQQAXSVQMHS-UHFFFAOYSA-N Hydrazine Chemical compound NN OAKJQQAXSVQMHS-UHFFFAOYSA-N 0.000 description 2
- YKLOMBNBQUTJDT-HVTMNAMFSA-N Ile-His-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YKLOMBNBQUTJDT-HVTMNAMFSA-N 0.000 description 2
- RIVKTKFVWXRNSJ-GRLWGSQLSA-N Ile-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RIVKTKFVWXRNSJ-GRLWGSQLSA-N 0.000 description 2
- YSGBJIQXTIVBHZ-AJNGGQMLSA-N Ile-Lys-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O YSGBJIQXTIVBHZ-AJNGGQMLSA-N 0.000 description 2
- VOCZPDONPURUHV-QEWYBTABSA-N Ile-Phe-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VOCZPDONPURUHV-QEWYBTABSA-N 0.000 description 2
- KTNGVMMGIQWIDV-OSUNSFLBSA-N Ile-Pro-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O KTNGVMMGIQWIDV-OSUNSFLBSA-N 0.000 description 2
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- KVRKAGGMEWNURO-CIUDSAMLSA-N Leu-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N KVRKAGGMEWNURO-CIUDSAMLSA-N 0.000 description 2
- GLBNEGIOFRVRHO-JYJNAYRXSA-N Leu-Gln-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLBNEGIOFRVRHO-JYJNAYRXSA-N 0.000 description 2
- CQGSYZCULZMEDE-UHFFFAOYSA-N Leu-Gln-Pro Natural products CC(C)CC(N)C(=O)NC(CCC(N)=O)C(=O)N1CCCC1C(O)=O CQGSYZCULZMEDE-UHFFFAOYSA-N 0.000 description 2
- UBZGNBKMIJHOHL-BZSNNMDCSA-N Leu-Leu-Phe Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 UBZGNBKMIJHOHL-BZSNNMDCSA-N 0.000 description 2
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 2
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 2
- WMIOEVKKYIMVKI-DCAQKATOSA-N Leu-Pro-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O WMIOEVKKYIMVKI-DCAQKATOSA-N 0.000 description 2
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 2
- XWEVVRRSIOBJOO-SRVKXCTJSA-N Leu-Pro-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O XWEVVRRSIOBJOO-SRVKXCTJSA-N 0.000 description 2
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 2
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 2
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- NTSPQIONFJUMJV-AVGNSLFASA-N Lys-Arg-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O NTSPQIONFJUMJV-AVGNSLFASA-N 0.000 description 2
- AAORVPFVUIHEAB-YUMQZZPRSA-N Lys-Asp-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O AAORVPFVUIHEAB-YUMQZZPRSA-N 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- LCPUWQLULVXROY-RHYQMDGZSA-N Met-Lys-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LCPUWQLULVXROY-RHYQMDGZSA-N 0.000 description 2
- OXIWIYOJVNOKOV-SRVKXCTJSA-N Met-Met-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CCCNC(N)=N OXIWIYOJVNOKOV-SRVKXCTJSA-N 0.000 description 2
- QEDGNYFHLXXIDC-DCAQKATOSA-N Met-Pro-Gln Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O QEDGNYFHLXXIDC-DCAQKATOSA-N 0.000 description 2
- FDGAMQVRGORBDV-GUBZILKMSA-N Met-Ser-Met Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCSC FDGAMQVRGORBDV-GUBZILKMSA-N 0.000 description 2
- GMMLGMFBYCFCCX-KZVJFYERSA-N Met-Thr-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMMLGMFBYCFCCX-KZVJFYERSA-N 0.000 description 2
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 2
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 2
- 101000892448 Neisseria gonorrhoeae Type II restriction enzyme NgoMIV Proteins 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 239000000020 Nitrocellulose Substances 0.000 description 2
- JQLQUPIYYJXZLJ-ZEWNOJEFSA-N Phe-Ile-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 JQLQUPIYYJXZLJ-ZEWNOJEFSA-N 0.000 description 2
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 2
- OSBADCBXAMSPQD-YESZJQIVSA-N Phe-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N OSBADCBXAMSPQD-YESZJQIVSA-N 0.000 description 2
- SCKXGHWQPPURGT-KKUMJFAQSA-N Phe-Lys-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O SCKXGHWQPPURGT-KKUMJFAQSA-N 0.000 description 2
- AXIOGMQCDYVTNY-ACRUOGEOSA-N Phe-Phe-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 AXIOGMQCDYVTNY-ACRUOGEOSA-N 0.000 description 2
- 241000288906 Primates Species 0.000 description 2
- NHDVNAKDACFHPX-GUBZILKMSA-N Pro-Arg-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O NHDVNAKDACFHPX-GUBZILKMSA-N 0.000 description 2
- GDXZRWYXJSGWIV-GMOBBJLQSA-N Pro-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 GDXZRWYXJSGWIV-GMOBBJLQSA-N 0.000 description 2
- TYMBHHITTMGGPI-NAKRPEOUSA-N Pro-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@@H]1CCCN1 TYMBHHITTMGGPI-NAKRPEOUSA-N 0.000 description 2
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 2
- ZLXKLMHAMDENIO-DCAQKATOSA-N Pro-Lys-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLXKLMHAMDENIO-DCAQKATOSA-N 0.000 description 2
- GFHXZNVJIKMAGO-IHRRRGAJSA-N Pro-Phe-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GFHXZNVJIKMAGO-IHRRRGAJSA-N 0.000 description 2
- CGSOWZUPLOKYOR-AVGNSLFASA-N Pro-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 CGSOWZUPLOKYOR-AVGNSLFASA-N 0.000 description 2
- GXWRTSIVLSQACD-RCWTZXSCSA-N Pro-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@@H]1CCCN1)O GXWRTSIVLSQACD-RCWTZXSCSA-N 0.000 description 2
- DYJTXTCEXMCPBF-UFYCRDLUSA-N Pro-Tyr-Phe Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O DYJTXTCEXMCPBF-UFYCRDLUSA-N 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- 241000700159 Rattus Species 0.000 description 2
- 235000011449 Rosa Nutrition 0.000 description 2
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 2
- ULVMNZOKDBHKKI-ACZMJKKPSA-N Ser-Gln-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ULVMNZOKDBHKKI-ACZMJKKPSA-N 0.000 description 2
- IAORETPTUDBBGV-CIUDSAMLSA-N Ser-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N IAORETPTUDBBGV-CIUDSAMLSA-N 0.000 description 2
- XXNYYSXNXCJYKX-DCAQKATOSA-N Ser-Leu-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O XXNYYSXNXCJYKX-DCAQKATOSA-N 0.000 description 2
- HJAXVYLCKDPPDF-SRVKXCTJSA-N Ser-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N HJAXVYLCKDPPDF-SRVKXCTJSA-N 0.000 description 2
- OZPDGESCTGGNAD-CIUDSAMLSA-N Ser-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CO OZPDGESCTGGNAD-CIUDSAMLSA-N 0.000 description 2
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 2
- JVTHIXKSVYEWNI-JRQIVUDYSA-N Thr-Asn-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JVTHIXKSVYEWNI-JRQIVUDYSA-N 0.000 description 2
- NLJKZUGAIIRWJN-LKXGYXEUSA-N Thr-Asp-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)O NLJKZUGAIIRWJN-LKXGYXEUSA-N 0.000 description 2
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 2
- WBCCCPZIJIJTSD-TUBUOCAGSA-N Thr-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H]([C@@H](C)O)N WBCCCPZIJIJTSD-TUBUOCAGSA-N 0.000 description 2
- YRJOLUDFVAUXLI-GSSVUCPTSA-N Thr-Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O YRJOLUDFVAUXLI-GSSVUCPTSA-N 0.000 description 2
- PWONLXBUSVIZPH-RHYQMDGZSA-N Thr-Val-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O PWONLXBUSVIZPH-RHYQMDGZSA-N 0.000 description 2
- YZCKVEUIGOORGS-NJFSPNSNSA-N Tritium Chemical compound [3H] YZCKVEUIGOORGS-NJFSPNSNSA-N 0.000 description 2
- NLLARHRWSFNEMH-NUTKFTJISA-N Trp-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NLLARHRWSFNEMH-NUTKFTJISA-N 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- MICSYKFECRFCTJ-IHRRRGAJSA-N Tyr-Arg-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O MICSYKFECRFCTJ-IHRRRGAJSA-N 0.000 description 2
- SGFIXFAHVWJKTD-KJEVXHAQSA-N Tyr-Arg-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SGFIXFAHVWJKTD-KJEVXHAQSA-N 0.000 description 2
- SINRIKQYQJRGDQ-MEYUZBJRSA-N Tyr-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SINRIKQYQJRGDQ-MEYUZBJRSA-N 0.000 description 2
- AUZADXNWQMBZOO-JYJNAYRXSA-N Tyr-Pro-Arg Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=C(O)C=C1 AUZADXNWQMBZOO-JYJNAYRXSA-N 0.000 description 2
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 2
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 2
- AUMNPAUHKUNHHN-BYULHYEWSA-N Val-Asn-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N AUMNPAUHKUNHHN-BYULHYEWSA-N 0.000 description 2
- OXGVAUFVTOPFFA-XPUUQOCRSA-N Val-Gly-Cys Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CS)C(=O)O)N OXGVAUFVTOPFFA-XPUUQOCRSA-N 0.000 description 2
- VPGCVZRRBYOGCD-AVGNSLFASA-N Val-Lys-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O VPGCVZRRBYOGCD-AVGNSLFASA-N 0.000 description 2
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 2
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 2
- QZKVWWIUSQGWMY-IHRRRGAJSA-N Val-Ser-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QZKVWWIUSQGWMY-IHRRRGAJSA-N 0.000 description 2
- GVNLOVJNNDZUHS-RHYQMDGZSA-N Val-Thr-Lys Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O GVNLOVJNNDZUHS-RHYQMDGZSA-N 0.000 description 2
- YLBNZCJFSVJDRJ-KJEVXHAQSA-N Val-Thr-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O YLBNZCJFSVJDRJ-KJEVXHAQSA-N 0.000 description 2
- HTONZBWRYUKUKC-RCWTZXSCSA-N Val-Thr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HTONZBWRYUKUKC-RCWTZXSCSA-N 0.000 description 2
- DOBHJKVVACOQTN-DZKIICNBSA-N Val-Tyr-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=C(O)C=C1 DOBHJKVVACOQTN-DZKIICNBSA-N 0.000 description 2
- ZHWZDZFWBXWPDW-GUBZILKMSA-N Val-Val-Cys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O ZHWZDZFWBXWPDW-GUBZILKMSA-N 0.000 description 2
- 238000002441 X-ray diffraction Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 229910052791 calcium Inorganic materials 0.000 description 2
- 239000011575 calcium Substances 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 230000021615 conjugation Effects 0.000 description 2
- 239000003433 contraceptive agent Substances 0.000 description 2
- 230000002254 contraceptive effect Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 210000004748 cultured cell Anatomy 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000005714 functional activity Effects 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 108010040856 glutamyl-cysteinyl-alanine Proteins 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 108010084264 glycyl-glycyl-cysteine Proteins 0.000 description 2
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 230000003834 intracellular effect Effects 0.000 description 2
- 238000001990 intravenous administration Methods 0.000 description 2
- 229910052740 iodine Inorganic materials 0.000 description 2
- 239000011630 iodine Substances 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 108010090114 methionyl-tyrosyl-lysine Proteins 0.000 description 2
- 108010034507 methionyltryptophan Proteins 0.000 description 2
- 102000035118 modified proteins Human genes 0.000 description 2
- 108091005573 modified proteins Proteins 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 229920001220 nitrocellulos Polymers 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 230000002611 ovarian Effects 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 108010065135 phenylalanyl-phenylalanyl-phenylalanine Proteins 0.000 description 2
- 108010077112 prolyl-proline Proteins 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 230000002285 radioactive effect Effects 0.000 description 2
- 238000003127 radioimmunoassay Methods 0.000 description 2
- 230000009257 reactivity Effects 0.000 description 2
- 102220238255 rs1556856142 Human genes 0.000 description 2
- 238000003567 signal transduction assay Methods 0.000 description 2
- 239000012064 sodium phosphate buffer Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 108010005652 splenotritin Proteins 0.000 description 2
- 230000002381 testicular Effects 0.000 description 2
- 210000001550 testis Anatomy 0.000 description 2
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 2
- 210000001541 thymus gland Anatomy 0.000 description 2
- 229960000874 thyrotropin Drugs 0.000 description 2
- 230000001748 thyrotropin Effects 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000014616 translation Effects 0.000 description 2
- 229910052722 tritium Inorganic materials 0.000 description 2
- 108010071635 tyrosyl-prolyl-arginine Proteins 0.000 description 2
- 241000701447 unidentified baculovirus Species 0.000 description 2
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 1
- BRPMXFSTKXXNHF-IUCAKERBSA-N (2s)-1-[2-[[(2s)-pyrrolidine-2-carbonyl]amino]acetyl]pyrrolidine-2-carboxylic acid Chemical compound OC(=O)[C@@H]1CCCN1C(=O)CNC(=O)[C@H]1NCCC1 BRPMXFSTKXXNHF-IUCAKERBSA-N 0.000 description 1
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 1
- VOXZDWNPVJITMN-ZBRFXRBCSA-N 17β-estradiol Chemical compound OC1=CC=C2[C@H]3CC[C@](C)([C@H](CC4)O)[C@@H]4[C@@H]3CCC2=C1 VOXZDWNPVJITMN-ZBRFXRBCSA-N 0.000 description 1
- YHJLBMOOKLEFMP-UHFFFAOYSA-N 2,3,6-trinitrobenzenesulfonic acid Chemical compound OS(=O)(=O)C1=C([N+]([O-])=O)C=CC([N+]([O-])=O)=C1[N+]([O-])=O YHJLBMOOKLEFMP-UHFFFAOYSA-N 0.000 description 1
- XWTNPSHCJMZAHQ-QMMMGPOBSA-N 2-[[2-[[2-[[(2s)-2-amino-4-methylpentanoyl]amino]acetyl]amino]acetyl]amino]acetic acid Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(=O)NCC(O)=O XWTNPSHCJMZAHQ-QMMMGPOBSA-N 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- ODPOAESBSUKMHD-UHFFFAOYSA-L 6,7-dihydrodipyrido[1,2-b:1',2'-e]pyrazine-5,8-diium;dibromide Chemical compound [Br-].[Br-].C1=CC=[N+]2CC[N+]3=CC=CC=C3C2=C1 ODPOAESBSUKMHD-UHFFFAOYSA-L 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- WRDANSJTFOHBPI-FXQIFTODSA-N Ala-Arg-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O)N WRDANSJTFOHBPI-FXQIFTODSA-N 0.000 description 1
- DECCMEWNXSNSDO-ZLUOBGJFSA-N Ala-Cys-Ala Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O DECCMEWNXSNSDO-ZLUOBGJFSA-N 0.000 description 1
- KRHRBKYBJXMYBB-WHFBIAKZSA-N Ala-Cys-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O KRHRBKYBJXMYBB-WHFBIAKZSA-N 0.000 description 1
- IYCZBJXFSZSHPN-DLOVCJGASA-N Ala-Cys-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IYCZBJXFSZSHPN-DLOVCJGASA-N 0.000 description 1
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 1
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 1
- NOGFDULFCFXBHB-CIUDSAMLSA-N Ala-Leu-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N NOGFDULFCFXBHB-CIUDSAMLSA-N 0.000 description 1
- UWIQWPWWZUHBAO-ZLIFDBKOSA-N Ala-Leu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)CC(C)C)C(O)=O)=CNC2=C1 UWIQWPWWZUHBAO-ZLIFDBKOSA-N 0.000 description 1
- NINQYGGNRIBFSC-CIUDSAMLSA-N Ala-Lys-Ser Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CO)C(O)=O NINQYGGNRIBFSC-CIUDSAMLSA-N 0.000 description 1
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 1
- PVQLRJRPUTXFFX-CIUDSAMLSA-N Ala-Met-Gln Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O PVQLRJRPUTXFFX-CIUDSAMLSA-N 0.000 description 1
- RUXQNKVQSKOOBS-JURCDPSOSA-N Ala-Phe-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RUXQNKVQSKOOBS-JURCDPSOSA-N 0.000 description 1
- FQNILRVJOJBFFC-FXQIFTODSA-N Ala-Pro-Asp Chemical compound C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N FQNILRVJOJBFFC-FXQIFTODSA-N 0.000 description 1
- WQLDNOCHHRISMS-NAKRPEOUSA-N Ala-Pro-Ile Chemical compound [H]N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WQLDNOCHHRISMS-NAKRPEOUSA-N 0.000 description 1
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 1
- CQJHFKKGZXKZBC-BPNCWPANSA-N Ala-Pro-Tyr Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 CQJHFKKGZXKZBC-BPNCWPANSA-N 0.000 description 1
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 1
- 208000019901 Anxiety disease Diseases 0.000 description 1
- JSHVMZANPXCDTL-GMOBBJLQSA-N Arg-Asp-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JSHVMZANPXCDTL-GMOBBJLQSA-N 0.000 description 1
- TTXYKSADPSNOIF-IHRRRGAJSA-N Arg-Asp-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O TTXYKSADPSNOIF-IHRRRGAJSA-N 0.000 description 1
- YSUVMPICYVWRBX-VEVYYDQMSA-N Arg-Asp-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YSUVMPICYVWRBX-VEVYYDQMSA-N 0.000 description 1
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 1
- OHYQKYUTLIPFOX-ZPFDUUQYSA-N Arg-Glu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OHYQKYUTLIPFOX-ZPFDUUQYSA-N 0.000 description 1
- DGFXIWKPTDKBLF-AVGNSLFASA-N Arg-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N DGFXIWKPTDKBLF-AVGNSLFASA-N 0.000 description 1
- GNYUVVJYGJFKHN-RVMXOQNASA-N Arg-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GNYUVVJYGJFKHN-RVMXOQNASA-N 0.000 description 1
- BSGSDLYGGHGMND-IHRRRGAJSA-N Arg-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N BSGSDLYGGHGMND-IHRRRGAJSA-N 0.000 description 1
- MNBHKGYCLBUIBC-UFYCRDLUSA-N Arg-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MNBHKGYCLBUIBC-UFYCRDLUSA-N 0.000 description 1
- QHVRVUNEAIFTEK-SZMVWBNQSA-N Arg-Pro-Trp Chemical compound N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O QHVRVUNEAIFTEK-SZMVWBNQSA-N 0.000 description 1
- VUGWHBXPMAHEGZ-SRVKXCTJSA-N Arg-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCN=C(N)N VUGWHBXPMAHEGZ-SRVKXCTJSA-N 0.000 description 1
- VENMDXUVHSKEIN-GUBZILKMSA-N Arg-Ser-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VENMDXUVHSKEIN-GUBZILKMSA-N 0.000 description 1
- VRTWYUYCJGNFES-CIUDSAMLSA-N Arg-Ser-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O VRTWYUYCJGNFES-CIUDSAMLSA-N 0.000 description 1
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 1
- SYFHFLGAROUHNT-VEVYYDQMSA-N Arg-Thr-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SYFHFLGAROUHNT-VEVYYDQMSA-N 0.000 description 1
- SUMJNGAMIQSNGX-TUAOUCFPSA-N Arg-Val-Pro Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N1CCC[C@@H]1C(O)=O SUMJNGAMIQSNGX-TUAOUCFPSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- SLKLLQWZQHXYSV-CIUDSAMLSA-N Asn-Ala-Lys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O SLKLLQWZQHXYSV-CIUDSAMLSA-N 0.000 description 1
- BGINHSZTXRJIPP-FXQIFTODSA-N Asn-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BGINHSZTXRJIPP-FXQIFTODSA-N 0.000 description 1
- MSBDSTRUMZFSEU-PEFMBERDSA-N Asn-Glu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MSBDSTRUMZFSEU-PEFMBERDSA-N 0.000 description 1
- ASCGFDYEKSRNPL-CIUDSAMLSA-N Asn-Glu-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O ASCGFDYEKSRNPL-CIUDSAMLSA-N 0.000 description 1
- ACKNRKFVYUVWAC-ZPFDUUQYSA-N Asn-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ACKNRKFVYUVWAC-ZPFDUUQYSA-N 0.000 description 1
- QGABLMITFKUQDF-DCAQKATOSA-N Asn-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N QGABLMITFKUQDF-DCAQKATOSA-N 0.000 description 1
- RVHGJNGNKGDCPX-KKUMJFAQSA-N Asn-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N RVHGJNGNKGDCPX-KKUMJFAQSA-N 0.000 description 1
- BYLSYQASFJJBCL-DCAQKATOSA-N Asn-Pro-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BYLSYQASFJJBCL-DCAQKATOSA-N 0.000 description 1
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 1
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 1
- QIRJQYQOIKBPBZ-IHRRRGAJSA-N Asn-Tyr-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QIRJQYQOIKBPBZ-IHRRRGAJSA-N 0.000 description 1
- YNQMEIJEWSHOEO-SRVKXCTJSA-N Asn-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O YNQMEIJEWSHOEO-SRVKXCTJSA-N 0.000 description 1
- NJPLPRFQLBZAMH-IHRRRGAJSA-N Asn-Tyr-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCSC)C(O)=O NJPLPRFQLBZAMH-IHRRRGAJSA-N 0.000 description 1
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 1
- HMQDRBKQMLRCCG-GMOBBJLQSA-N Asp-Arg-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HMQDRBKQMLRCCG-GMOBBJLQSA-N 0.000 description 1
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 1
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 1
- QTIZKMMLNUMHHU-DCAQKATOSA-N Asp-Pro-His Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QTIZKMMLNUMHHU-DCAQKATOSA-N 0.000 description 1
- BKOIIURTQAJHAT-GUBZILKMSA-N Asp-Pro-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 BKOIIURTQAJHAT-GUBZILKMSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 108010055991 BglII endonuclease Proteins 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 108010089921 CTCGAG-specific type II deoxyribonucleases Proteins 0.000 description 1
- 101100129088 Caenorhabditis elegans lys-2 gene Proteins 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 108090000317 Chymotrypsin Proteins 0.000 description 1
- 101100007328 Cocos nucifera COS-1 gene Proteins 0.000 description 1
- 241000252095 Congridae Species 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- AMRLSQGGERHDHJ-FXQIFTODSA-N Cys-Ala-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMRLSQGGERHDHJ-FXQIFTODSA-N 0.000 description 1
- JTNKVWLMDHIUOG-IHRRRGAJSA-N Cys-Arg-Phe Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JTNKVWLMDHIUOG-IHRRRGAJSA-N 0.000 description 1
- XXDLUZLKHOVPNW-IHRRRGAJSA-N Cys-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CS)N)O XXDLUZLKHOVPNW-IHRRRGAJSA-N 0.000 description 1
- SFUUYRSAJPWTGO-SRVKXCTJSA-N Cys-Asn-Phe Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SFUUYRSAJPWTGO-SRVKXCTJSA-N 0.000 description 1
- CPTUXCUWQIBZIF-ZLUOBGJFSA-N Cys-Asn-Ser Chemical compound SC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CPTUXCUWQIBZIF-ZLUOBGJFSA-N 0.000 description 1
- XABFFGOGKOORCG-CIUDSAMLSA-N Cys-Asp-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XABFFGOGKOORCG-CIUDSAMLSA-N 0.000 description 1
- ASHTVGGFIMESRD-LKXGYXEUSA-N Cys-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CS)N)O ASHTVGGFIMESRD-LKXGYXEUSA-N 0.000 description 1
- ISWAQPWFWKGCAL-ACZMJKKPSA-N Cys-Cys-Glu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISWAQPWFWKGCAL-ACZMJKKPSA-N 0.000 description 1
- KOHBWQDSVCARMI-BWBBJGPYSA-N Cys-Cys-Thr Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KOHBWQDSVCARMI-BWBBJGPYSA-N 0.000 description 1
- GHUVBPIYQYXXEF-SRVKXCTJSA-N Cys-Cys-Tyr Chemical compound SC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 GHUVBPIYQYXXEF-SRVKXCTJSA-N 0.000 description 1
- PQHYZJPCYRDYNE-QWRGUYRKSA-N Cys-Gly-Phe Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PQHYZJPCYRDYNE-QWRGUYRKSA-N 0.000 description 1
- SKSJPIBFNFPTJB-NKWVEPMBSA-N Cys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CS)N)C(=O)O SKSJPIBFNFPTJB-NKWVEPMBSA-N 0.000 description 1
- UXIYYUMGFNSGBK-XPUUQOCRSA-N Cys-Gly-Val Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O UXIYYUMGFNSGBK-XPUUQOCRSA-N 0.000 description 1
- PDRMRVHPAQKTLT-NAKRPEOUSA-N Cys-Ile-Val Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O PDRMRVHPAQKTLT-NAKRPEOUSA-N 0.000 description 1
- AFYGNOJUTMXQIG-FXQIFTODSA-N Cys-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CS)N AFYGNOJUTMXQIG-FXQIFTODSA-N 0.000 description 1
- TXCCRYAZQBUCOV-CIUDSAMLSA-N Cys-Pro-Gln Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O TXCCRYAZQBUCOV-CIUDSAMLSA-N 0.000 description 1
- MBRWOKXNHTUJMB-CIUDSAMLSA-N Cys-Pro-Glu Chemical compound [H]N[C@@H](CS)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O MBRWOKXNHTUJMB-CIUDSAMLSA-N 0.000 description 1
- XCDDSPYIMNXECQ-NAKRPEOUSA-N Cys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CS XCDDSPYIMNXECQ-NAKRPEOUSA-N 0.000 description 1
- SAEVTQWAYDPXMU-KATARQTJSA-N Cys-Thr-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O SAEVTQWAYDPXMU-KATARQTJSA-N 0.000 description 1
- HRMMVZISPQOKMU-KKUMJFAQSA-N Cys-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CS)N)O HRMMVZISPQOKMU-KKUMJFAQSA-N 0.000 description 1
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 1
- FBPFZTCFMRRESA-JGWLITMVSA-N D-glucitol Chemical compound OC[C@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-JGWLITMVSA-N 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 239000004375 Dextrin Substances 0.000 description 1
- 229920001353 Dextrin Polymers 0.000 description 1
- 239000005630 Diquat Substances 0.000 description 1
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 1
- 102100038796 E3 ubiquitin-protein ligase TRIM13 Human genes 0.000 description 1
- LVGKNOAMLMIIKO-UHFFFAOYSA-N Elaidinsaeure-aethylester Natural products CCCCCCCCC=CCCCCCCCC(=O)OCC LVGKNOAMLMIIKO-UHFFFAOYSA-N 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 102100027186 Extracellular superoxide dismutase [Cu-Zn] Human genes 0.000 description 1
- 108700001268 Extracellular superoxide dismutase [Cu-Zn] Proteins 0.000 description 1
- SHERTACNJPYHAR-ACZMJKKPSA-N Gln-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O SHERTACNJPYHAR-ACZMJKKPSA-N 0.000 description 1
- CYTSBCIIEHUPDU-ACZMJKKPSA-N Gln-Asp-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O CYTSBCIIEHUPDU-ACZMJKKPSA-N 0.000 description 1
- ZRXBYKAOFHLTDN-GUBZILKMSA-N Gln-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)N)N ZRXBYKAOFHLTDN-GUBZILKMSA-N 0.000 description 1
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 1
- MTCXQQINVAFZKW-MNXVOIDGSA-N Gln-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MTCXQQINVAFZKW-MNXVOIDGSA-N 0.000 description 1
- FQCILXROGNOZON-YUMQZZPRSA-N Gln-Pro-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O FQCILXROGNOZON-YUMQZZPRSA-N 0.000 description 1
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 1
- KPNWAJMEMRCLAL-GUBZILKMSA-N Gln-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N KPNWAJMEMRCLAL-GUBZILKMSA-N 0.000 description 1
- XFHMVFKCQSHLKW-HJGDQZAQSA-N Gln-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O XFHMVFKCQSHLKW-HJGDQZAQSA-N 0.000 description 1
- VEYGCDYMOXHJLS-GVXVVHGQSA-N Gln-Val-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VEYGCDYMOXHJLS-GVXVVHGQSA-N 0.000 description 1
- SYDJILXOZNEEDK-XIRDDKMYSA-N Glu-Arg-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O SYDJILXOZNEEDK-XIRDDKMYSA-N 0.000 description 1
- NADWTMLCUDMDQI-ACZMJKKPSA-N Glu-Asp-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N NADWTMLCUDMDQI-ACZMJKKPSA-N 0.000 description 1
- PNAOVYHADQRJQU-GUBZILKMSA-N Glu-Cys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N PNAOVYHADQRJQU-GUBZILKMSA-N 0.000 description 1
- VSMQDIVEBXPKRT-QEJZJMRPSA-N Glu-Cys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N VSMQDIVEBXPKRT-QEJZJMRPSA-N 0.000 description 1
- NWOUBJNMZDDGDT-AVGNSLFASA-N Glu-Leu-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NWOUBJNMZDDGDT-AVGNSLFASA-N 0.000 description 1
- ZIYGTCDTJJCDDP-JYJNAYRXSA-N Glu-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZIYGTCDTJJCDDP-JYJNAYRXSA-N 0.000 description 1
- PAZQYODKOZHXGA-SRVKXCTJSA-N Glu-Pro-His Chemical compound N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O PAZQYODKOZHXGA-SRVKXCTJSA-N 0.000 description 1
- LPHGXOWFAXFCPX-KKUMJFAQSA-N Glu-Pro-Phe Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CCC(=O)O)N)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O LPHGXOWFAXFCPX-KKUMJFAQSA-N 0.000 description 1
- CAQXJMUDOLSBPF-SUSMZKCASA-N Glu-Thr-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAQXJMUDOLSBPF-SUSMZKCASA-N 0.000 description 1
- DXMOIVCNJIJQSC-QEJZJMRPSA-N Glu-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N DXMOIVCNJIJQSC-QEJZJMRPSA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- VXKCPBPQEKKERH-IUCAKERBSA-N Gly-Arg-Pro Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N1CCC[C@H]1C(O)=O VXKCPBPQEKKERH-IUCAKERBSA-N 0.000 description 1
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 1
- DTPOVRRYXPJJAZ-FJXKBIBVSA-N Gly-Arg-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N DTPOVRRYXPJJAZ-FJXKBIBVSA-N 0.000 description 1
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 1
- RPLLQZBOVIVGMX-QWRGUYRKSA-N Gly-Asp-Phe Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RPLLQZBOVIVGMX-QWRGUYRKSA-N 0.000 description 1
- YZACQYVWLCQWBT-BQBZGAKWSA-N Gly-Cys-Arg Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YZACQYVWLCQWBT-BQBZGAKWSA-N 0.000 description 1
- NMROINAYXCACKF-WHFBIAKZSA-N Gly-Cys-Cys Chemical compound NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O NMROINAYXCACKF-WHFBIAKZSA-N 0.000 description 1
- QCTLGOYODITHPQ-WHFBIAKZSA-N Gly-Cys-Ser Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O QCTLGOYODITHPQ-WHFBIAKZSA-N 0.000 description 1
- YIFUFYZELCMPJP-YUMQZZPRSA-N Gly-Leu-Cys Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O YIFUFYZELCMPJP-YUMQZZPRSA-N 0.000 description 1
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 1
- ZKJZBRHRWKLVSJ-ZDLURKLDSA-N Gly-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)CN)O ZKJZBRHRWKLVSJ-ZDLURKLDSA-N 0.000 description 1
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 1
- DKJWUIYLMLUBDX-XPUUQOCRSA-N Gly-Val-Cys Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O DKJWUIYLMLUBDX-XPUUQOCRSA-N 0.000 description 1
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 230000010556 Heparin Binding Activity Effects 0.000 description 1
- HIAHVKLTHNOENC-HGNGGELXSA-N His-Glu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HIAHVKLTHNOENC-HGNGGELXSA-N 0.000 description 1
- FYTCLUIYTYFGPT-YUMQZZPRSA-N His-Gly-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FYTCLUIYTYFGPT-YUMQZZPRSA-N 0.000 description 1
- AKAPKBNIVNPIPO-KKUMJFAQSA-N His-His-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CN=CN1 AKAPKBNIVNPIPO-KKUMJFAQSA-N 0.000 description 1
- LBQAHBIVXQSBIR-HVTMNAMFSA-N His-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N LBQAHBIVXQSBIR-HVTMNAMFSA-N 0.000 description 1
- WCHONUZTYDQMBY-PYJNHQTQSA-N His-Pro-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WCHONUZTYDQMBY-PYJNHQTQSA-N 0.000 description 1
- STGQSBKUYSPPIG-CIUDSAMLSA-N His-Ser-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 STGQSBKUYSPPIG-CIUDSAMLSA-N 0.000 description 1
- 101000664589 Homo sapiens E3 ubiquitin-protein ligase TRIM13 Proteins 0.000 description 1
- 101000869690 Homo sapiens Protein S100-A8 Proteins 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 206010062767 Hypophysitis Diseases 0.000 description 1
- QICVAHODWHIWIS-HTFCKZLJSA-N Ile-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N QICVAHODWHIWIS-HTFCKZLJSA-N 0.000 description 1
- MKWSZEHGHSLNPF-NAKRPEOUSA-N Ile-Ala-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)O)N MKWSZEHGHSLNPF-NAKRPEOUSA-N 0.000 description 1
- TZCGZYWNIDZZMR-NAKRPEOUSA-N Ile-Arg-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C)C(=O)O)N TZCGZYWNIDZZMR-NAKRPEOUSA-N 0.000 description 1
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 1
- JRYQSFOFUFXPTB-RWRJDSDZSA-N Ile-Gln-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N JRYQSFOFUFXPTB-RWRJDSDZSA-N 0.000 description 1
- LBRCLQMZAHRTLV-ZKWXMUAHSA-N Ile-Gly-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LBRCLQMZAHRTLV-ZKWXMUAHSA-N 0.000 description 1
- NUKXXNFEUZGPRO-BJDJZHNGSA-N Ile-Leu-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)O)N NUKXXNFEUZGPRO-BJDJZHNGSA-N 0.000 description 1
- RFMDODRWJZHZCR-BJDJZHNGSA-N Ile-Lys-Cys Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(O)=O RFMDODRWJZHZCR-BJDJZHNGSA-N 0.000 description 1
- CKRFDMPBSWYOBT-PPCPHDFISA-N Ile-Lys-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N CKRFDMPBSWYOBT-PPCPHDFISA-N 0.000 description 1
- IMRKCLXPYOIHIF-ZPFDUUQYSA-N Ile-Met-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N IMRKCLXPYOIHIF-ZPFDUUQYSA-N 0.000 description 1
- QHUREMVLLMNUAX-OSUNSFLBSA-N Ile-Thr-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)O)N QHUREMVLLMNUAX-OSUNSFLBSA-N 0.000 description 1
- HQLSBZFLOUHQJK-STECZYCISA-N Ile-Tyr-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HQLSBZFLOUHQJK-STECZYCISA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 125000002842 L-seryl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])O[H] 0.000 description 1
- VKOAHIRLIUESLU-ULQDDVLXSA-N Leu-Arg-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VKOAHIRLIUESLU-ULQDDVLXSA-N 0.000 description 1
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 1
- ZURHXHNAEJJRNU-CIUDSAMLSA-N Leu-Asp-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZURHXHNAEJJRNU-CIUDSAMLSA-N 0.000 description 1
- DXYBNWJZJVSZAE-GUBZILKMSA-N Leu-Gln-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N DXYBNWJZJVSZAE-GUBZILKMSA-N 0.000 description 1
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- KXCMQWMNYQOAKA-SRVKXCTJSA-N Leu-Met-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KXCMQWMNYQOAKA-SRVKXCTJSA-N 0.000 description 1
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 1
- 108010006444 Leucine-Rich Repeat Proteins Proteins 0.000 description 1
- WQWZXKWOEVSGQM-DCAQKATOSA-N Lys-Ala-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN WQWZXKWOEVSGQM-DCAQKATOSA-N 0.000 description 1
- KPJJOZUXFOLGMQ-CIUDSAMLSA-N Lys-Asp-Asn Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N KPJJOZUXFOLGMQ-CIUDSAMLSA-N 0.000 description 1
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 1
- XTONYTDATVADQH-CIUDSAMLSA-N Lys-Cys-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O XTONYTDATVADQH-CIUDSAMLSA-N 0.000 description 1
- RLZDUFRBMQNYIJ-YUMQZZPRSA-N Lys-Cys-Gly Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)NCC(=O)O)N RLZDUFRBMQNYIJ-YUMQZZPRSA-N 0.000 description 1
- DKTNGXVSCZULPO-YUMQZZPRSA-N Lys-Gly-Cys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CS)C(O)=O DKTNGXVSCZULPO-YUMQZZPRSA-N 0.000 description 1
- OJDFAABAHBPVTH-MNXVOIDGSA-N Lys-Ile-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O OJDFAABAHBPVTH-MNXVOIDGSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- KEPWSUPUFAPBRF-DKIMLUQUSA-N Lys-Ile-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KEPWSUPUFAPBRF-DKIMLUQUSA-N 0.000 description 1
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 1
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 1
- IPTUBUUIFRZMJK-ACRUOGEOSA-N Lys-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 IPTUBUUIFRZMJK-ACRUOGEOSA-N 0.000 description 1
- OBZHNHBAAVEWKI-DCAQKATOSA-N Lys-Pro-Asn Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O OBZHNHBAAVEWKI-DCAQKATOSA-N 0.000 description 1
- CNGOEHJCLVCJHN-SRVKXCTJSA-N Lys-Pro-Glu Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O CNGOEHJCLVCJHN-SRVKXCTJSA-N 0.000 description 1
- GIKFNMZSGYAPEJ-HJGDQZAQSA-N Lys-Thr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O GIKFNMZSGYAPEJ-HJGDQZAQSA-N 0.000 description 1
- TXTZMVNJIRZABH-ULQDDVLXSA-N Lys-Val-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TXTZMVNJIRZABH-ULQDDVLXSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- MDXAULHWGWETHF-SRVKXCTJSA-N Met-Arg-Val Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CCCNC(N)=N MDXAULHWGWETHF-SRVKXCTJSA-N 0.000 description 1
- HSJIGJRZYUADSS-IHRRRGAJSA-N Met-Lys-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HSJIGJRZYUADSS-IHRRRGAJSA-N 0.000 description 1
- WXJLBSXNUHIGSS-OSUNSFLBSA-N Met-Thr-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WXJLBSXNUHIGSS-OSUNSFLBSA-N 0.000 description 1
- MKYBYDHXWVHEJW-UHFFFAOYSA-N N-[1-oxo-1-(2,4,6,7-tetrahydrotriazolo[4,5-c]pyridin-5-yl)propan-2-yl]-2-[[3-(trifluoromethoxy)phenyl]methylamino]pyrimidine-5-carboxamide Chemical compound O=C(C(C)NC(=O)C=1C=NC(=NC=1)NCC1=CC(=CC=C1)OC(F)(F)F)N1CC2=C(CC1)NN=N2 MKYBYDHXWVHEJW-UHFFFAOYSA-N 0.000 description 1
- 230000004988 N-glycosylation Effects 0.000 description 1
- 125000000729 N-terminal amino-acid group Chemical group 0.000 description 1
- 240000007817 Olea europaea Species 0.000 description 1
- 108090000526 Papain Proteins 0.000 description 1
- 108090000284 Pepsin A Proteins 0.000 description 1
- 102000057297 Pepsin A Human genes 0.000 description 1
- VHWOBXIWBDWZHK-IHRRRGAJSA-N Phe-Arg-Asp Chemical compound NC(N)=NCCC[C@@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 VHWOBXIWBDWZHK-IHRRRGAJSA-N 0.000 description 1
- CSYVXYQDIVCQNU-QWRGUYRKSA-N Phe-Asp-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O CSYVXYQDIVCQNU-QWRGUYRKSA-N 0.000 description 1
- ALHULIGNEXGFRM-QWRGUYRKSA-N Phe-Cys-Gly Chemical compound OC(=O)CNC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=CC=C1 ALHULIGNEXGFRM-QWRGUYRKSA-N 0.000 description 1
- JEBWZLWTRPZQRX-QWRGUYRKSA-N Phe-Gly-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O JEBWZLWTRPZQRX-QWRGUYRKSA-N 0.000 description 1
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 1
- ONORAGIFHNAADN-LLLHUVSDSA-N Phe-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N ONORAGIFHNAADN-LLLHUVSDSA-N 0.000 description 1
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 1
- GPSMLZQVIIYLDK-ULQDDVLXSA-N Phe-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O GPSMLZQVIIYLDK-ULQDDVLXSA-N 0.000 description 1
- GPLWGAYGROGDEN-BZSNNMDCSA-N Phe-Phe-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O GPLWGAYGROGDEN-BZSNNMDCSA-N 0.000 description 1
- ZLAKUZDMKVKFAI-JYJNAYRXSA-N Phe-Pro-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O ZLAKUZDMKVKFAI-JYJNAYRXSA-N 0.000 description 1
- WEDZFLRYSIDIRX-IHRRRGAJSA-N Phe-Ser-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 WEDZFLRYSIDIRX-IHRRRGAJSA-N 0.000 description 1
- BONHGTUEEPIMPM-AVGNSLFASA-N Phe-Ser-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O BONHGTUEEPIMPM-AVGNSLFASA-N 0.000 description 1
- GLJZDMZJHFXJQG-BZSNNMDCSA-N Phe-Ser-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLJZDMZJHFXJQG-BZSNNMDCSA-N 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- OLHDPZMYUSBGDE-GUBZILKMSA-N Pro-Arg-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CS)C(=O)O OLHDPZMYUSBGDE-GUBZILKMSA-N 0.000 description 1
- KDIIENQUNVNWHR-JYJNAYRXSA-N Pro-Arg-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KDIIENQUNVNWHR-JYJNAYRXSA-N 0.000 description 1
- ZSKJPKFTPQCPIH-RCWTZXSCSA-N Pro-Arg-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSKJPKFTPQCPIH-RCWTZXSCSA-N 0.000 description 1
- TXPUNZXZDVJUJQ-LPEHRKFASA-N Pro-Asn-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N2CCC[C@@H]2C(=O)O TXPUNZXZDVJUJQ-LPEHRKFASA-N 0.000 description 1
- AIZVVCMAFRREQS-GUBZILKMSA-N Pro-Cys-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AIZVVCMAFRREQS-GUBZILKMSA-N 0.000 description 1
- SNIPWBQKOPCJRG-CIUDSAMLSA-N Pro-Gln-Cys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O SNIPWBQKOPCJRG-CIUDSAMLSA-N 0.000 description 1
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 1
- LGSANCBHSMDFDY-GARJFASQSA-N Pro-Glu-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O LGSANCBHSMDFDY-GARJFASQSA-N 0.000 description 1
- VPEVBAUSTBWQHN-NHCYSSNCSA-N Pro-Glu-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O VPEVBAUSTBWQHN-NHCYSSNCSA-N 0.000 description 1
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 1
- FKLSMYYLJHYPHH-UWVGGRQHSA-N Pro-Gly-Leu Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O FKLSMYYLJHYPHH-UWVGGRQHSA-N 0.000 description 1
- STASJMBVVHNWCG-IHRRRGAJSA-N Pro-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 STASJMBVVHNWCG-IHRRRGAJSA-N 0.000 description 1
- BBFRBZYKHIKFBX-GMOBBJLQSA-N Pro-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@@H]1CCCN1 BBFRBZYKHIKFBX-GMOBBJLQSA-N 0.000 description 1
- LXLFEIHKWGHJJB-XUXIUFHCSA-N Pro-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 LXLFEIHKWGHJJB-XUXIUFHCSA-N 0.000 description 1
- FYPGHGXAOZTOBO-IHRRRGAJSA-N Pro-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 FYPGHGXAOZTOBO-IHRRRGAJSA-N 0.000 description 1
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 1
- HBBBLSVBQGZKOZ-GUBZILKMSA-N Pro-Met-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O HBBBLSVBQGZKOZ-GUBZILKMSA-N 0.000 description 1
- FYKUEXMZYFIZKA-DCAQKATOSA-N Pro-Pro-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FYKUEXMZYFIZKA-DCAQKATOSA-N 0.000 description 1
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 1
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 1
- AIOWVDNPESPXRB-YTWAJWBKSA-N Pro-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2)O AIOWVDNPESPXRB-YTWAJWBKSA-N 0.000 description 1
- JRBWMRUPXWPEID-JYJNAYRXSA-N Pro-Trp-Cys Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CS)C(=O)O)C(=O)[C@@H]1CCCN1 JRBWMRUPXWPEID-JYJNAYRXSA-N 0.000 description 1
- VPBQDHMASPJHGY-JYJNAYRXSA-N Pro-Trp-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CO)C(=O)O VPBQDHMASPJHGY-JYJNAYRXSA-N 0.000 description 1
- HOJUNFDJDAPVBI-BZSNNMDCSA-N Pro-Trp-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@@H]3CCCN3 HOJUNFDJDAPVBI-BZSNNMDCSA-N 0.000 description 1
- OFOBLEOULBTSOW-UHFFFAOYSA-N Propanedioic acid Natural products OC(=O)CC(O)=O OFOBLEOULBTSOW-UHFFFAOYSA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 102100032442 Protein S100-A8 Human genes 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- BKOKTRCZXRIQPX-ZLUOBGJFSA-N Ser-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N BKOKTRCZXRIQPX-ZLUOBGJFSA-N 0.000 description 1
- YUSRGTQIPCJNHQ-CIUDSAMLSA-N Ser-Arg-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O YUSRGTQIPCJNHQ-CIUDSAMLSA-N 0.000 description 1
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 1
- DKKGAAJTDKHWOD-BIIVOSGPSA-N Ser-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)C(=O)O DKKGAAJTDKHWOD-BIIVOSGPSA-N 0.000 description 1
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 1
- BYIROAKULFFTEK-CIUDSAMLSA-N Ser-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO BYIROAKULFFTEK-CIUDSAMLSA-N 0.000 description 1
- DBIDZNUXSLXVRG-FXQIFTODSA-N Ser-Asp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N DBIDZNUXSLXVRG-FXQIFTODSA-N 0.000 description 1
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 1
- SNNSYBWPPVAXQW-ZLUOBGJFSA-N Ser-Cys-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N)O SNNSYBWPPVAXQW-ZLUOBGJFSA-N 0.000 description 1
- BQWCDDAISCPDQV-XHNCKOQMSA-N Ser-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N)C(=O)O BQWCDDAISCPDQV-XHNCKOQMSA-N 0.000 description 1
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 1
- MLSQXWSRHURDMF-GARJFASQSA-N Ser-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CO)N)C(=O)O MLSQXWSRHURDMF-GARJFASQSA-N 0.000 description 1
- JLPMFVAIQHCBDC-CIUDSAMLSA-N Ser-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N JLPMFVAIQHCBDC-CIUDSAMLSA-N 0.000 description 1
- GVMUJUPXFQFBBZ-GUBZILKMSA-N Ser-Lys-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GVMUJUPXFQFBBZ-GUBZILKMSA-N 0.000 description 1
- UGGWCAFQPKANMW-FXQIFTODSA-N Ser-Met-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O UGGWCAFQPKANMW-FXQIFTODSA-N 0.000 description 1
- FBLNYDYPCLFTSP-IXOXFDKPSA-N Ser-Phe-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FBLNYDYPCLFTSP-IXOXFDKPSA-N 0.000 description 1
- ZKBKUWQVDWWSRI-BZSNNMDCSA-N Ser-Phe-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZKBKUWQVDWWSRI-BZSNNMDCSA-N 0.000 description 1
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 1
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- 241001522306 Serinus serinus Species 0.000 description 1
- KDYFGRWQOYBRFD-UHFFFAOYSA-N Succinic acid Natural products OC(=O)CCC(O)=O KDYFGRWQOYBRFD-UHFFFAOYSA-N 0.000 description 1
- 230000005867 T cell response Effects 0.000 description 1
- 108010078152 TCCGGA-specific type II deoxyribonucleases Proteins 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- JNQZPAWOPBZGIX-RCWTZXSCSA-N Thr-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N JNQZPAWOPBZGIX-RCWTZXSCSA-N 0.000 description 1
- PAOYNIKMYOGBMR-PBCZWWQYSA-N Thr-Asn-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O PAOYNIKMYOGBMR-PBCZWWQYSA-N 0.000 description 1
- QNJZOAHSYPXTAB-VEVYYDQMSA-N Thr-Asn-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O QNJZOAHSYPXTAB-VEVYYDQMSA-N 0.000 description 1
- PZVGOVRNGKEFCB-KKHAAJSZSA-N Thr-Asn-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N)O PZVGOVRNGKEFCB-KKHAAJSZSA-N 0.000 description 1
- DCLBXIWHLVEPMQ-JRQIVUDYSA-N Thr-Asp-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DCLBXIWHLVEPMQ-JRQIVUDYSA-N 0.000 description 1
- DGOJNGCGEYOBKN-BWBBJGPYSA-N Thr-Cys-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N)O DGOJNGCGEYOBKN-BWBBJGPYSA-N 0.000 description 1
- RJBFAHKSFNNHAI-XKBZYTNZSA-N Thr-Gln-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N)O RJBFAHKSFNNHAI-XKBZYTNZSA-N 0.000 description 1
- LAFLAXHTDVNVEL-WDCWCFNPSA-N Thr-Gln-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O LAFLAXHTDVNVEL-WDCWCFNPSA-N 0.000 description 1
- WPAKPLPGQNUXGN-OSUNSFLBSA-N Thr-Ile-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WPAKPLPGQNUXGN-OSUNSFLBSA-N 0.000 description 1
- UYTYTDMCDBPDSC-URLPEUOOSA-N Thr-Ile-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N UYTYTDMCDBPDSC-URLPEUOOSA-N 0.000 description 1
- HPQHHRLWSAMMKG-KATARQTJSA-N Thr-Lys-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N)O HPQHHRLWSAMMKG-KATARQTJSA-N 0.000 description 1
- WFAUDCSNCWJJAA-KXNHARMFSA-N Thr-Lys-Pro Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(O)=O WFAUDCSNCWJJAA-KXNHARMFSA-N 0.000 description 1
- MEBDIIKMUUNBSB-RPTUDFQQSA-N Thr-Phe-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MEBDIIKMUUNBSB-RPTUDFQQSA-N 0.000 description 1
- BDENGIGFTNYZSJ-RCWTZXSCSA-N Thr-Pro-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O BDENGIGFTNYZSJ-RCWTZXSCSA-N 0.000 description 1
- KERCOYANYUPLHJ-XGEHTFHBSA-N Thr-Pro-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O KERCOYANYUPLHJ-XGEHTFHBSA-N 0.000 description 1
- RVMNUBQWPVOUKH-HEIBUPTGSA-N Thr-Ser-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RVMNUBQWPVOUKH-HEIBUPTGSA-N 0.000 description 1
- TZQWJCGVCIJDMU-HEIBUPTGSA-N Thr-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)O)N)O TZQWJCGVCIJDMU-HEIBUPTGSA-N 0.000 description 1
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 1
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 1
- NLWDSYKZUPRMBJ-IEGACIPQSA-N Thr-Trp-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O NLWDSYKZUPRMBJ-IEGACIPQSA-N 0.000 description 1
- PELIQFPESHBTMA-WLTAIBSBSA-N Thr-Tyr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 PELIQFPESHBTMA-WLTAIBSBSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- WEAPHMIKOICYAU-QEJZJMRPSA-N Trp-Cys-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O WEAPHMIKOICYAU-QEJZJMRPSA-N 0.000 description 1
- 108090000631 Trypsin Proteins 0.000 description 1
- 102000004142 Trypsin Human genes 0.000 description 1
- IIJWXEUNETVJPV-IHRRRGAJSA-N Tyr-Arg-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N)O IIJWXEUNETVJPV-IHRRRGAJSA-N 0.000 description 1
- CKKFTIQYURNSEI-IHRRRGAJSA-N Tyr-Asn-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CKKFTIQYURNSEI-IHRRRGAJSA-N 0.000 description 1
- BODHJXJNRVRKFA-BZSNNMDCSA-N Tyr-Cys-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BODHJXJNRVRKFA-BZSNNMDCSA-N 0.000 description 1
- CRHFOYCJGVJPLE-AVGNSLFASA-N Tyr-Gln-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CRHFOYCJGVJPLE-AVGNSLFASA-N 0.000 description 1
- SLCSPPCQWUHPPO-JYJNAYRXSA-N Tyr-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SLCSPPCQWUHPPO-JYJNAYRXSA-N 0.000 description 1
- FMOSEWZYZPMJAL-KKUMJFAQSA-N Tyr-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N FMOSEWZYZPMJAL-KKUMJFAQSA-N 0.000 description 1
- ZRPLVTZTKPPSBT-AVGNSLFASA-N Tyr-Glu-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZRPLVTZTKPPSBT-AVGNSLFASA-N 0.000 description 1
- OSXNCKRGMSHWSQ-ACRUOGEOSA-N Tyr-His-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OSXNCKRGMSHWSQ-ACRUOGEOSA-N 0.000 description 1
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 1
- AVFGBGGRZOKSFS-KJEVXHAQSA-N Tyr-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O AVFGBGGRZOKSFS-KJEVXHAQSA-N 0.000 description 1
- NVZVJIUDICCMHZ-BZSNNMDCSA-N Tyr-Phe-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O NVZVJIUDICCMHZ-BZSNNMDCSA-N 0.000 description 1
- XFEMMSGONWQACR-KJEVXHAQSA-N Tyr-Thr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O XFEMMSGONWQACR-KJEVXHAQSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 1
- UDNYEPLJTRDMEJ-RCOVLWMOSA-N Val-Asn-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N UDNYEPLJTRDMEJ-RCOVLWMOSA-N 0.000 description 1
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 1
- CWSIBTLMMQLPPZ-FXQIFTODSA-N Val-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N CWSIBTLMMQLPPZ-FXQIFTODSA-N 0.000 description 1
- YCMXFKWYJFZFKS-LAEOZQHASA-N Val-Gln-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCMXFKWYJFZFKS-LAEOZQHASA-N 0.000 description 1
- ZEVNVXYRZRIRCH-GVXVVHGQSA-N Val-Gln-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N ZEVNVXYRZRIRCH-GVXVVHGQSA-N 0.000 description 1
- BRPKEERLGYNCNC-NHCYSSNCSA-N Val-Glu-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N BRPKEERLGYNCNC-NHCYSSNCSA-N 0.000 description 1
- MDYSKHBSPXUOPV-JSGCOSHPSA-N Val-Gly-Phe Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N MDYSKHBSPXUOPV-JSGCOSHPSA-N 0.000 description 1
- WNZSAUMKZQXHNC-UKJIMTQDSA-N Val-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N WNZSAUMKZQXHNC-UKJIMTQDSA-N 0.000 description 1
- HGJRMXOWUWVUOA-GVXVVHGQSA-N Val-Leu-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N HGJRMXOWUWVUOA-GVXVVHGQSA-N 0.000 description 1
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 1
- WSUWDIVCPOJFCX-TUAOUCFPSA-N Val-Met-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N WSUWDIVCPOJFCX-TUAOUCFPSA-N 0.000 description 1
- UQMPYVLTQCGRSK-IFFSRLJSSA-N Val-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N)O UQMPYVLTQCGRSK-IFFSRLJSSA-N 0.000 description 1
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 1
- JXCOEPXCBVCTRD-JYJNAYRXSA-N Val-Tyr-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N JXCOEPXCBVCTRD-JYJNAYRXSA-N 0.000 description 1
- DPXJVFZANSGRMM-UHFFFAOYSA-N acetic acid;2,3,4,5,6-pentahydroxyhexanal;sodium Chemical compound [Na].CC(O)=O.OCC(O)C(O)C(O)C(O)C=O DPXJVFZANSGRMM-UHFFFAOYSA-N 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 239000007801 affinity label Substances 0.000 description 1
- 150000001294 alanine derivatives Chemical class 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 150000008064 anhydrides Chemical class 0.000 description 1
- 230000003042 antagnostic effect Effects 0.000 description 1
- 230000000259 anti-tumor effect Effects 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 230000036506 anxiety Effects 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010029539 arginyl-prolyl-proline Proteins 0.000 description 1
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 1
- 108010060035 arginylproline Proteins 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- SQVRNKJHWKZAKO-UHFFFAOYSA-N beta-N-Acetyl-D-neuraminic acid Natural products CC(=O)NC1C(O)CC(O)(C(O)=O)OC1C(O)C(O)CO SQVRNKJHWKZAKO-UHFFFAOYSA-N 0.000 description 1
- 102000023732 binding proteins Human genes 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 230000008512 biological response Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 229940098773 bovine serum albumin Drugs 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- KDYFGRWQOYBRFD-NUQCWPJISA-N butanedioic acid Chemical compound O[14C](=O)CC[14C](O)=O KDYFGRWQOYBRFD-NUQCWPJISA-N 0.000 description 1
- 229910052792 caesium Inorganic materials 0.000 description 1
- TVFDJXOCXUVLDH-UHFFFAOYSA-N caesium atom Chemical compound [Cs] TVFDJXOCXUVLDH-UHFFFAOYSA-N 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 150000001721 carbon Chemical group 0.000 description 1
- 229920003123 carboxymethyl cellulose sodium Polymers 0.000 description 1
- 229940063834 carboxymethylcellulose sodium Drugs 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000012219 cassette mutagenesis Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000036755 cellular response Effects 0.000 description 1
- 238000010382 chemical cross-linking Methods 0.000 description 1
- 229960002376 chymotrypsin Drugs 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 230000004186 co-expression Effects 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 229940124462 contraceptive vaccine Drugs 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- ATDGTVJJHBUTRL-UHFFFAOYSA-N cyanogen bromide Chemical compound BrC#N ATDGTVJJHBUTRL-UHFFFAOYSA-N 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- OILAIQUEIWYQPH-UHFFFAOYSA-N cyclohexane-1,2-dione Chemical compound O=C1CCCCC1=O OILAIQUEIWYQPH-UHFFFAOYSA-N 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 230000007850 degeneration Effects 0.000 description 1
- 230000022811 deglycosylation Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000003398 denaturant Substances 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001784 detoxification Methods 0.000 description 1
- 235000019425 dextrin Nutrition 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 235000014113 dietary fatty acids Nutrition 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 125000002228 disulfide group Chemical group 0.000 description 1
- 150000002019 disulfides Chemical class 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 108010049940 endodeoxyribonuclease BsmI Proteins 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 150000002118 epoxides Chemical class 0.000 description 1
- 229930182833 estradiol Natural products 0.000 description 1
- 229960005309 estradiol Drugs 0.000 description 1
- LVGKNOAMLMIIKO-QXMHVHEDSA-N ethyl oleate Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC LVGKNOAMLMIIKO-QXMHVHEDSA-N 0.000 description 1
- 229940093471 ethyl oleate Drugs 0.000 description 1
- 229930195729 fatty acid Natural products 0.000 description 1
- 239000000194 fatty acid Substances 0.000 description 1
- 239000010685 fatty oil Substances 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 229940028334 follicle stimulating hormone Drugs 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 230000034659 glycolysis Effects 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 210000002149 gonad Anatomy 0.000 description 1
- 229940094892 gonadotropins Drugs 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 229910001385 heavy metal Inorganic materials 0.000 description 1
- 238000002017 high-resolution X-ray diffraction Methods 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 108010092114 histidylphenylalanine Proteins 0.000 description 1
- 231100000508 hormonal effect Toxicity 0.000 description 1
- 239000003667 hormone antagonist Substances 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- XMBWDFGMSWQBCA-UHFFFAOYSA-N hydrogen iodide Chemical compound I XMBWDFGMSWQBCA-UHFFFAOYSA-N 0.000 description 1
- 230000028993 immune response Effects 0.000 description 1
- 230000002163 immunogen Effects 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 208000021267 infertility disease Diseases 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000013067 intermediate product Substances 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 108091005979 iodinated proteins Proteins 0.000 description 1
- XMBWDFGMSWQBCA-RNFDNDRNSA-M iodine-131(1-) Chemical compound [131I-] XMBWDFGMSWQBCA-RNFDNDRNSA-M 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 150000002605 large molecules Chemical class 0.000 description 1
- 210000004901 leucine-rich repeat Anatomy 0.000 description 1
- 108010073093 leucyl-glycyl-glycyl-glycine Proteins 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 229940040129 luteinizing hormone Drugs 0.000 description 1
- 239000008176 lyophilized powder Substances 0.000 description 1
- 108010076718 lysyl-glutamyl-tryptophan Proteins 0.000 description 1
- 108010054155 lysyllysine Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- VZCYOOQTPOCHFL-UPHRSURJSA-N maleic acid Chemical compound OC(=O)\C=C/C(O)=O VZCYOOQTPOCHFL-UPHRSURJSA-N 0.000 description 1
- 239000011976 maleic acid Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- HZVOZRGWRWCICA-UHFFFAOYSA-N methanediyl Chemical compound [CH2] HZVOZRGWRWCICA-UHFFFAOYSA-N 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 108010085203 methionylmethionine Proteins 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000000302 molecular modelling Methods 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 239000012457 nonaqueous media Substances 0.000 description 1
- 230000011599 ovarian follicle development Effects 0.000 description 1
- 230000027758 ovulation cycle Effects 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 229940055729 papain Drugs 0.000 description 1
- 235000019834 papain Nutrition 0.000 description 1
- 230000006320 pegylation Effects 0.000 description 1
- 229940111202 pepsin Drugs 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 108010073101 phenylalanylleucine Proteins 0.000 description 1
- 239000007856 photoaffinity label Substances 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 239000006187 pill Substances 0.000 description 1
- 210000003635 pituitary gland Anatomy 0.000 description 1
- 210000002826 placenta Anatomy 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 239000002798 polar solvent Substances 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 201000010065 polycystic ovary syndrome Diseases 0.000 description 1
- 238000003752 polymerase chain reaction Methods 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 1
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 125000006239 protecting group Chemical group 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 230000009145 protein modification Effects 0.000 description 1
- 108020001775 protein parts Proteins 0.000 description 1
- 230000020978 protein processing Effects 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 230000017854 proteolysis Effects 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 239000000700 radioactive tracer Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 108010039506 restriction endonuclease PmlI Proteins 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 239000003161 ribonuclease inhibitor Substances 0.000 description 1
- 102220042837 rs12944167 Human genes 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 150000003354 serine derivatives Chemical class 0.000 description 1
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 1
- 239000008159 sesame oil Substances 0.000 description 1
- 235000011803 sesame oil Nutrition 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- SQVRNKJHWKZAKO-OQPLDHBCSA-N sialic acid Chemical compound CC(=O)N[C@@H]1[C@@H](O)C[C@@](O)(C(O)=O)OC1[C@H](O)[C@H](O)CO SQVRNKJHWKZAKO-OQPLDHBCSA-N 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- 239000000600 sorbitol Substances 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000000547 structure data Methods 0.000 description 1
- 238000007920 subcutaneous administration Methods 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- 210000001685 thyroid gland Anatomy 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 108700012359 toxins Proteins 0.000 description 1
- VZCYOOQTPOCHFL-UHFFFAOYSA-N trans-butenedioic acid Natural products OC(=O)C=CC(O)=O VZCYOOQTPOCHFL-UHFFFAOYSA-N 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 150000003626 triacylglycerols Chemical class 0.000 description 1
- 230000010415 tropism Effects 0.000 description 1
- 239000012588 trypsin Substances 0.000 description 1
- 229960001322 trypsin Drugs 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 238000000539 two dimensional gel electrophoresis Methods 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/575—Hormones
- C07K14/59—Follicle-stimulating hormone [FSH]; Chorionic gonadotropins, e.g.hCG [human chorionic gonadotropin]; Luteinising hormone [LH]; Thyroid-stimulating hormone [TSH]
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/17—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- A61K38/22—Hormones
- A61K38/27—Growth hormone [GH], i.e. somatotropin
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P15/00—Drugs for genital or sexual disorders; Contraceptives
- A61P15/08—Drugs for genital or sexual disorders; Contraceptives for gonadal disorders or for enhancing fertility, e.g. inducers of ovulation or of spermatogenesis
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P15/00—Drugs for genital or sexual disorders; Contraceptives
- A61P15/18—Feminine contraceptives
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P5/00—Drugs for disorders of the endocrine system
- A61P5/06—Drugs for disorders of the endocrine system of the anterior pituitary hormones, e.g. TSH, ACTH, FSH, LH, PRL, GH
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Endocrinology (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Genetics & Genomics (AREA)
- Reproductive Health (AREA)
- Zoology (AREA)
- Pharmacology & Pharmacy (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Molecular Biology (AREA)
- Animal Behavior & Ethology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biophysics (AREA)
- Biochemistry (AREA)
- Biomedical Technology (AREA)
- Gastroenterology & Hepatology (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- General Chemical & Material Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Toxicology (AREA)
- Gynecology & Obstetrics (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Pregnancy & Childbirth (AREA)
- Physics & Mathematics (AREA)
- Diabetes (AREA)
- Immunology (AREA)
- Epidemiology (AREA)
- Peptides Or Proteins (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 발명은 소단위간 이황화결합된 당단백질 호르몬 유사체 및 이를 제조하는 방법 및 이의 용도에 관계한다. 이에 상응하는 DNA 서열, 숙주 세포 및 제약학적 조성물에 대해 설명한다.
Description
본 발명은 당단백질 호르몬 유사체, 이를 만드는 방법 및 이의 용도에 관계한다. 좀더 구체적으로는 본 발명은 이황화결합으로 연결된 당단백질 호르몬, 이의 제조 방법 및 이의 용도에 관계한다.
당단백질 호르몬에는 융모막고나도트로핀(choriogonadoropin)으로 알려진 융모성 고나도트로핀(CG), 루트로핀(lutropin)으로 알려진 황체화 호르몬(LH), 폴리오트로핀(follitropin)으로 알려진 난포자극호르몬(FSH), 티로트로핀(thyrotropin)으로 알려진 갑상선 자극 호르몬(TSH)이 포함된다. 사람에서 취한 것은 사람의 융모성 고나도트로핀(hCG), 사람의 황체화 호르몬(hLH), 사람의 난포자극호르몬(hFSH), 사람의 갑상선 자극 호르몬(hTSH)이 된다. 이와 같은 호르몬은 생식선 및 흉선 기능에 중요한 역할을 한다(Pierce et al, 1981, Moyle et al, 1995). CG 및 LH는 LH 수용체에 결합하여 이를 자극하고, FSH는 FSH 수용체에 결합하여 이를 자극하고, TSH는 TSH 수용체에 결합하여 이를 자극한다. CG는 영장류를 포함하는 포유류의 태반에서 주로 다량으로 생산되는 호르몬이다. 영장류의 CG의 -소단위 아미노산 서열은 LH의 아미노산 서열과는 통상 상이하다. 그러나, 말은 말의 LH의 아미노산 서열과 동일한 CG를 생산한다(Murphy et al, 1991).
Pierce et al(1981)에 따르면, 당단백질 호르몬은 -와 -소단위로 구성된 이형이량체이다. 이형이량체는 서로 공류결합에 의해 연결되어 있지 않고, 이들의 소단위는 산 또는 요소로 처리하면 분리될 수 있다(Pierce et al, 1981). 가장 고등한 척추동물에는 -소단위만을 인코드하는 유전자만을 포함하는데(Fiddes et al, 1984); 동일한 -소단위는 CG가 존재하는 경우에 LH, FSH, TSH의 -소단위와 정상적으로 복합된다. 그럼에도불구하고, 해독후 단백질 처리과정 주로, 글리코실화반응(Baenziger et al, 1988)으로 CG, LH, FSH, TSH의 -소단위의 조성에서 차이가 생기게 된다. 이와 같은 호르몬간에 아미노산 서열의 대부분 차이는 호르몬-특이적인 -소단위에 있다(Pierce et al, 1981). 이들은 별도의 유전자에 의해 만들어진다(Fiddes et al, 1984, Bo et al, 1992).
소수의 예외적인 것은 있지만(Blithe et al, 1991), --이형이량체는 각 소단위보다는 호르몬 활성이 휠씬 크다(Pierce et al, 1981). 자연적으로 발생하는 - 및 -소단위는 이들이 ,-동종이량체 또는 ,-동종이량체보다는 ,-이형이량체를 휠씬 더 잘만든다. 또한, hCG의 - 및 -소단위가 포유류 세포에서 발현되면, --이종이량체, -소단위 단랸체, -소단위 단량체를 형성시킨다. ,- 또는 --동종이량체는 있기는 하나 그 양이 극히 적다.
두 실험실에서 사람의 융모성 고나도트로핀(hCG)의 고해상도 X-선 결정 구조를 보고한 바 있다(Lapthorn et al, 1994; Wu et al, 1994). 이들 구조는 원래 제시된 이황화결합 패턴이 잘못된 것이고(Mise et al, 1980 and 1981), 호르몬은 단백질의 시스테인 노트의 일원이라는 것이다(Sun et al, 1995). 모든 당단백질 호르몬 호르몬에서 시스테인의 상대적인 위치가 유사하기 때문에, hCG에서 발견되는 시스테인 군 구조를 가지는 것으로 보인다.
척추동물의 당단백질 호르몬의 -소단위에 있는 시스테인의 위치는 유사하다(도 1A 및 1B). 모델로 hCG -소단위를 이용하면, 시스테인 노트은 제2, 제3, 제5, 제7, 제8, 제9번째 -소단위 시스테인에 의해 형성된다. 이로써 세 개의 큰 -소단위 루프가 만들어진다(도 1A 및 1B). 루프 1은 제2와 제3 시스테인사이에 아미노산 서열이고; 루프 2는 제5와 제7의 -소단위 시스테인사이에 있는 아미노산 서열이고; 루프 3은 제7과 제8 시스테인사이에 있는 아미노산 서열이다. 척추동물 당단백질 호르몬의 -소단위에 있는 시스테인의 위치는 유사하다(Pierce et al, 1981). 모델로 hCG -소단위를 이용하면, 시스테인 노트는 제1, 제4, 제5, 제6, 제8, 제8, 제9번째 -소단위 시스테인에 의해 형성된다. 이로써 세 개의 큰 -소단위 루프가 만들어진다(도 2A 및 2B). 루프 1은 제1과 제4 시스테인사이에 아미노산 서열이고; 루프 2는 제5와 제6의 시스테인사이에 있는 아미노산 서열이고; 루프 3은 제6과 제8 시스테인사이에 있는 아미노산 서열이다. 또 -소단위 부분을 또 다른 -소단위로된 유사한 부분으로 대체하거나 -소단위를 또다른 -소단위의 유사한 부분으로 대체함으로써, 기능상으로 각 당단백질 호르몬 소단위의 키메라를 만드는 것도 가능하다(Campbell et al, 1991; Moyle et al, 1990; Moyle et al, 1994; Cosowsky et al, 1995; Moyle et al, 1995; Cosowsky et al, 1997). 당단백질 호르몬 소단위에서 일반적인 구조적 단위 원소는 도 1C에 제시하고 있고, 이에 상응하는 사람의 당단백질 호르몬 소단위로 아미노산 잔기로 다음의 표에 나타내었다.
시스테인 노트에 추가하여, β-소단위는 시트-벨트로 명명된 서열을 포함하는데(Lapthorn et al, 1994), 이는 제2 α-소단위 루프 주변을 에워싼다. 시트-벨트는 9번째 시스테인에서 시작하고, β-소단위 시스테인 노트의 마지막 잔기에는 제10, 제11, 제12 시스테인이 포함된다. 시스테인 12(시트-벨트의 카르복시 말단에서) 및 시스테인 3(처음 β-소단위 루프에서)사이에서 형성된 이황화결합에 의해 제 1 -소단위 루프에 포함된다.
시트-벨트는 hCG가 LH 및 FSH 수용체를 구별하는 능력에 상당히 영향을 주는 hCG -소단위의 일부분이다(Campbell et al, 1991; Moyle et al, 1994). hFSH에서 발견되는 시트-벨트 서열을 hCG의 시트-벨트 아미노산 서열 대신에 대체하면, 생성되는 호르몬 유사체의 수용체 결합 특이성이 변경된다. 정상적으로는 hCG는 FSH 또는 TSH 수용체보다 1000배이상 특이성으로 LH 수용체에 결합한다. 그러나, hCG 시트-벨트 잔기 101-109(가령, Gly-Gly-Pro-Lys-Asp-His-Pro-Leu-Thr)이 이들의 hFSH 상응부분(가령, Thr-Val-Arg-Gly-Leu-Gly-Pro-Ser-Tyr)으로 치환된 CF94-117 및 CF101-109와 같은 hCG 유사체는 hCG보다는 FSH 수용체에 더 잘 결합하는 것으로 나타났다(Moyle et al, 1994). 또한, 시트-벨트의 조성물을 조절하여, 다양한 정도의 LH 및 FSH 활성을 가지는 hCG 유사체를 만드는 것이 가능하다(Moyle et al, 1994; Han et al, 1996). 이들은 암수에서 수정률을 강화시키는 중요한 치료요법적 용도를 가진다.
당단백질 호르몬의 모든 소단위내에 이황화결합은 아니지만, 대부분의 이황화결합은 이들의 생물학적 활성에 필수적인 것이다. 각 시스테인이 또 다른 아미노산 예를 들면, 알라닌으로 대체시켜 실시한 연구에 따르면, 시스테인 노트의 모든 이황화결합 및 시트-벨트의 이황화결합은 이종이량체의 이황화결합에 필수적이라는 것이다(Suganuma et al, 1989; Bedows et al, 1993; Furuhashi et al, 1994). 사람의 -소단위 시스테인 7-31 및 59-87와 hCG -소단위 시스테인 23-72사이에 이황화결합은 이종이량체 형성 또는 호르몬 활성에 필수적인 것은 아니다.
현재까지, 임의 당단백질 호르몬과 이의 수용체간에 상호작용을 설명하는 고 해상 결정 구조는 없다. 호르몬 수용체 복합체의 구조를 설명하기 위한 노력의 일환으로 몇 가지 모델이 만들어졌다. 이들 대부분은 당단백질의 세포외 도메인의 구조와 매우 유사한 hCG, 리보뉴클레아제 저해물질, 단백질의 결정 구조에 기초한다. 수용체와 접촉하는 호르몬 잔기를 확인하는 대부분의 시도는 수용체 결합에 감소를 유도하는 화학적, 효소적 또는 유전적인 돌연변이의 영향에 기초한 것이다. 불행하게도, 현재 이와 같은 감소는 특이적인 접촉의 파괴 또는 호르몬 모양의 변화로 인한 것이기 때문에(Cosowsky et al, 1997), 이와 같은 변화의 영향은 매우 이해하기가 어렵다. 이는 이 분야에 상당한 불일치를 유도하였고(Remy et al, 1996; Berger et al, 1996), 일부 연구자들은 수용체 복합체에서 호르몬의 방향을 결정하는 것이 불가능하다는 결론을 내렸다(Blowmick et al, 1996).
수용체 복합체에서 호르몬의 방형을 결정짓는 다른 방법은 수용체와 접촉하지 않는 호르몬 부분을 확인하는 것에 달려있다. 호르몬이 수용체에 결합된 후에 이들은 노출된채로 남아있거나 호르몬-수용체 상호작용을 파괴하지 않고 변경될 수 있다. 이들은 hCG의 결정 구조에 대해 매핑할 경우(Lapthorn et al, 1994; Wu et al, 1994), hCG와 LH 수용체가 상호작용할 수 있는 이론 적인 모델을 개발할 수도 있다(Moyle et al, 1995). 이와 같은 방법은 제2 -소단위 로프와 제1, 제3 -소단위 루프에 의해 만들어지는 호르몬 홈이 주요 수용체 접촉에 관여하는 것으로 보여지기 때문이다(Cosowsky et al, 1995). 이는 이들 두 개 소단위가 최대의 호르몬-수용체 결합에 필요한 이유를 설명한다(Pierce et al., 1981). 이와 같은 결론을 뒷받침하는 데이터는 다음 몇 개 단락에서 논의될 것이다. 그러나, 이분야의 모든 연구자들은 아니지만, 대부분은 모델에서 매우 다른 방향을 하고 있다는 것으로(Remy et al, 1996; Berger et al, 1996), 일부 연구자들은 상기에서 설명하는 모델을 의식한다(가령, 이들은 주요 수용체 결합 부위는 호르몬 홈에 의해 형성된다는 모델을 의식한다).
수용체와 접촉하지 않는 것으로 보이는 hCG -소단위의 많은 부분은 LH 수용체와 결합을 파괴하지 않고 대체할 수 있다. 이들 부분의 일부는 hCG가 LH 수용체에 결합되는 동안에 단클론 항체에 의해 인지될 수 있기 때문에 호르몬-수용체 복합체에 명백하게 노출된다(Moyle et al, 1990; Cosowsky et al, 1995; Moyle et al, 1995). 예를 들면, 사람 및 소의 -소단위는 매우 다른 아미노산 서열을 가지기는 하지만, 소 -소단위 및 hCG -소단위를 포함하는 이종이량체는 쥐 및 사람의 LH 수용체에 잘 결합된다(Cosowsky et al, 1997). 이와 같은 이종이량체는 hCG의 -소단위의 루프 1과 3에 있는 에피토프를 인지하는 많은 단클론 항체에 의해 바로 구별된다(Moyle et al, 1995). 이와 같은 관찰에서 사람 및 소의 -소단위 루프 1과 3의 표면은 상이하여, 호르몬에서 이 부분은 중요한 필수적인 수용체 접촉부를 형성하지 않는 것으로 보여진다.
-소단위의 일부를 사람 또는 소 단백질에서 유도한 hCG의 유사체를 인지하는 단클론 항체의 능력을 비교함으로써, 항체 결합에 참여하는 주요 - 소단위 잔기를 확인할 수 있다(Moyle et al, 1995). hCG -소단위에 있는 에피토프를 인지하는 일부 단클론항체는 또한, 트립신 처리하여, 제 2 -소단위 루프의 대부분이 결손된 -소단위의 단편에도 결합된다(Lapthorn et al, 1994; Wu et al, 1994; Birken et al, 1986). 이와 같은 관찰을 이용하여, 이들 항체의 결합 부위를 확인하거나 결정할 수 있다(Moyle et al, 1995). -소단위 에피토프를 인지하는 두 개 단클론항체 즉, A105 및 A407로 명명한 단클론항체(Moyle et al, 1995)는 호르몬이 LH 수용체에 복합된 경우에 hCG에 결합된다. 따라서, 이들 항체에의해 인지되는 -소단위 잔기는 LH 수용체와 접촉하지 않는 것으로 보인다(Moyle et al, 1995). -소단위의 나머지 부분에는 제2 -소단위 루프 및 단백질의 C-말단이 포함된다. -소단위에 이와 같은 매우 보존성이 높은 부분에 있는 잔기의 일부는 이들 수용체 접촉에 참여할 수도 있다.
LH 수용체에 접촉하지 않는 것으로 보이는 hCG -소단위의 많은 부분은 LH 수용체 결합을 파괴하지 않는 범위의 돌연변이 발생에 의해 치환될 수 있다. 여기에는 hCG -소단위 루프 2를 포함한다. hCG -소단위 루프 2가 hFSH에서 정상적으로 발견되는 -소단위 루프 2 즉, CF39-58라고 불리는 것(Campbell et al, 1991)에 의해 치환된 유사체는 FSH를 인지하나 -소단위 루프 2에 있는 hCG 잔기를 인지하지 않는 단클론 항체에 의해 바로 구별할 수 있다. 이는 제 2 소단위 로프의 구조가 이 유사체와 hCG에서 상이하다는 것을 보여주는 것이다. 그럼에도 불구하고, 이와 같은 -소단위 유사체는 -소단위 유사체와 복합되어, ,-이종이량체를 만들어, hCG와 유사하게 LH 수용체와 상호작용한다(Campbell et al, 1991). 따라서, hCG의 제 2 -소단위 루프에 있는 잔기(극소수)가 직접적으로 LH 수용체 접촉부를 만드는 것 같지는 않다. 유사하게, hFSH의 제 2 -소단위 루프는 FSH 수용체와 접촉하지는 않는 것으로 보인다. hCG -소단위 유사체는 10번째 -소단위 시스테인과 C-말단에 있는 잔기 또는 잔기 94-114가 hFSH에 상응하는 것으로 치환되었다는 보고가 있다. 이들 유사체는 각 CF94-117(Campbell et al, 1991) 및 CFC94-114(Wang et al, 1994)로 명명하였다. 이들은 제 2 -소단위 루프에 있는 전체 hCG 서열을 포함하지만 LH 수용체보다 FSH에 흴씬 더 잘 결합한다. hCG의 제 2 -소단위 루프는 호르몬이 LH 또는 FSH 수용체에 결합하는 능력에 최소한 영향을 주는 것으로 보이고, 이는 이들이 LH 또는 FSH 수용체와 기본적으로 높은 친화력으로 접촉한다는 것과는 다른 것이다. 또한, hCG의 제 2 -소단위는 수용체와 접촉하지 않는 것으로 보이는 -소단위의 일부분인 제 1 및 제 3 -소단위 루프에 근접하여 위치한다. 따라서, 제1 및 제3 -소단위 루프 및 제2 -소단위 루프를 포함하는 전체 hCG 부분은 수용체와 접촉하지 않는 것으로 보인다. 나중에 논의하겠지만, 호르몬의 이 부분은 수용체의 말굽모양의 세포외 도메인에 의해 만들어지는 구멍으로 들어가는 것으로 간주한다(Moyle et al, 1995).
매우 친화력이 큰 수용체 접촉에 참여하지 않는 hCG -소단위의 잔기는 호르몬이 LH 수용체에 결합된 후에 단클론항체에 의해 인지될 수 있을 것이다(Campbell et al, 1991; Moyle et al, 1990; Moyle et al, 1994; Cosowsky et al, 1995). 여기에는 B105, B108, B111, B112와 같은 항체에 의해 인지되는 -소단위 표면에서 가장 먼 루프 1과 3에서 발견되는 hCG -소단위의 일부분을 포함 한다. 이와 같은 항체는 LH와 복합되는 경우에 hCG에 결합하는데(Moyle et al, 1990; Cosowsky et al, 1995), 이는 -소단위 루프 1과 3의 일부분이 기본적으로 수용체 접촉부를 만들지는 않는다는 것을 설명한다. 다른 연구에 따르면, 호르몬이 LH에 결합하는 능력에 영향을 주지 않으면서 N-말단 및 처음 시스테인사이에 있는 잔기 및 12번째 시스테인과 hCG -소단위의 C-말단사이에 있는 진기를 제거할 수 있다는 것이다(Huang et al, 1993). -소단위의 나머지 부분에는 시트-벨트가 포함된다. 이들 잔기중에 LH 또는 FSH 수용체에 높은 친화력을 가지고 결합하는데 필요한 기본적인 접촉부를 만드는 것은 거의 없다. 예를 들면, 11번째 및 12번째 시스테인사이에 시트-벨트에 있는 잔기를 변경시켜도 LH 수용체에 결합하는데 최소한의 영향밖에 줄 수 없다는 것을 알았다(Moyle et al, 1994). 10번째 및 11번째 시스테인사이에 잔기를 변경시키면 FSH 수용체 결합에 5배정도 적은 효과를 가진다(Moyle et al, 1994). 또한, 말 LH(eLH) 및 말 CG(eCG)의 시트-벨트 사이에 잔기는 FSH와는 다르고(Pierce et al, 1981; Murphy et al, 1991), 이들 호르몬은 쥐 FSH 수용체에 잘 결합한다. 또한, 정제된 eLH는 시험관에서 쥐 FSH 수용체에 hFSH가 결합하는 것의 적어도 30%정도 결합한다(Moyle et al, 1994). 설명이 안된 남아있는 hCG -소단위의 일부분에는 -소단위 사이면에 가장 근접한 루프 1과 3의 표면이 포함된다. 따라서, 이들은 수용체와 접촉하는 호르몬 부위가 된다. -소단위의 일부는 hCG가 LH 수용체와 복합된 경우에 단클론 항체에 의해 인지될 수 있다. 여기에는 항체 A105 및 A407에 의해 인지되는 잔기가 포함된다(Moyle et al, 1995).
수용체와 상호작용하는 당단백질 호르몬 부분을 확인하는 다른 방법에는 한 개 이상의 수용체를 인지하는 호르몬 유사체를 이용하는 것이다(Campbell et al, 1991; Moyle et al, 1994; Han et al, 1996; Campbell et al, 1997). 따라서, hCG의 -소단위 시트-벨트를 hFSH에서 발견되는 것으로 바꾸면 간단하게 FSH 및 TSH 수용체에 결합하는 hCG 유사체를 만들 수 있다(Campbell et al., 1997). 이와 같은 유사체에는 TSH-특이적인 잔기를 포함하지는 않지만, TSH와 같은 동일한 최대 수준으로 TSH 반응을 자극할 수 있다. 이와 같은 몇 가지 다기능 유사체 활성을 비교함으로써, 대부분 시트-벨트 및 제 2 -소단위 루프의 거의 모든 것이 주요 필수적인 고친화성 수용체 접촉부를 형성하게 된다.
임의 LH, FSH, TSH 수용체의 결정 구조에 대한 보고는 없었다. 그러나, 몇 가지 당단백질 호르몬의 아미노산 서열에 대해서는 공지되었다(Moyle et al, 1994; McFarland et al, 1989; Loosfelt et al, 1989; Segaloff et al, 1990; Sprengel et al, 1990; Braun et al, 1991; Nagayama et al, 1991; Nagayama et al, 1989; Jia et al, 1991). 이들 단백질은 세포외, 막통과, 세포내 도메인을 가지는 것으로 보인다. 막통과 또는 세포내 도메인 없이 발혀노딘 경우에(Braun et al, 1991; Ji et al, 1991; Xie et al, 1990; Moyle et al, 1991) 또는 다른 막통과 도메인과 연합된 경우에(Moyle et al, 1991), 세포외 도메인은 이의 리간드에 대한 수용체의 친화력의 대부분에 기여하는 것으로 보인다. 이들 단백질의 세포외 도메인은 루이 신이 풍부한 반복 단백질의 일원이고, 막통과 도메인은 혈장 막으로 연장되는 7개 소수성 나선을 가지는 것으로 보인다(McFarland et al, 1989). 한 개 루이신이 많은 반복 단백질의 모델 구조인 리보뉴클레아제 단백질의 결정 구조가 결정되었고, 이는 말굽 모양을 가지는 것으로 나타났다(Kobe et al, 1993 and 1995). 이와 같은 발견으로 LH, FSH, TSH의 세포외 도메인은 말굽모양을 한다는 것이다(Moyle et al, 1995). hCG 및 hFSH 결합 특이성을 조절하는 LH 및 FSH 수용체의 세포외 도메인은 LH/FSH 수용체 키메라를 이용하여 확인되었다(Moyle et al, 1994). LH 수용체와 가장 잘 접촉하는 부분 및 리간드-결합 특이성을 담당하는 LH 수용체의 일부분을 고려할여, 이 호르몬이 LH 수용체와 상호작용하는 능력 및 시그날 변환을 유도하는 능력을 설명할 수 있는 모델이 개발되었다(Moyle et al, 1995). 이 모델에서, 제 2 -소단위 루프 및 제1과 제3 -소단위 루프사이에 있는 홈이 말굽의 중앙 부근에 있는 수용체 세포외 도메인의 가장자리에 접촉한다(Moyle et al., 1995). gh의 나머지 부분은 말굽 대부분사이의 공간으로 돌출된다. 호르몬이 수용체에 결합하여 이공간으로 돌출되는 경우에, 시그날 변환에 필요한 세포외 도메인 모양을 안정화시키게 되는 것이다. 이는 세포 표면에 있는 적절한 수용체의 발현을 위해 요구되는 세포외 도메인 및 막통과 도메인사이에 특이적인 접촉에 의해 막통과 도메인에서 실행된다(Moyle et al, 1991). 이 모델은 올리고사카라아드가 시그날 변환에 영향을 주는 능력을 설명한다(Moyle et al, 1975; Matzuk et al, 1989). 그러나, 이 모델이 이와 같은 데이터를 설명할 수 있지만, hCG의 다른 부분이 수용체와 상호작용하는 다른 모델이 제안되었다(Jiang et al, 1995). 따라서, 이들 수 용체와 당단백질 호르몬이 어떻게 상호작용하는지에 대해서는 아직 분명하지 않다.
이와 같은 호르몬 수용체 상호작용의 관점은 주요 수용체 접촉부에 관여하지는 않지만 hCG의 부분을 인지하는 일부 단클론 항체에 의해 hCG 결합을 방해받는 것을 설명할 수 있다. 초기에 언급한 바와 같이, 여기에는 -소단위 루프 1과 3, -소단위 루프 2에 의해 이루어지는 호르몬 표면이 포함된다. 이 모델에서, 이 부분은 수용체 세포외 도메인의 N- 및 C- 말단 대에 있는 공간으로 돌출된다. 이 부위에 항체가 결합함으로써 이 공간으로 호르몬이 들어가는 것을 막는다.
대부분의 척추동물에서 얻은 당단백질 호르몬에 있는 시스테인의 위치가 유사한 것으로 이들이 hCG와 같이 폴딩된다는 것을 알 수 있다(Pierce et al, 1981). 당단백질 호르몬에 대한 수용체 구조는 세포외 도메인에 있는 루이신이 풍부한 반복부와 막통과 모메인에 있는 보존된 다수의 잔기로 때문에 상당히 필적하다는 것이다(Moyle et al, 1994; Braun et al, 1991; Nagayama et al, 1991). 따라서, hCG와 LH 수용체와의 상호작용을 성공적으로 설명할 수 있는 임의 모델로 다른 당단백질 호르몬이 이들의 수용체와 상호작용하는 가능성을 예측할 수 있다. 시트-벨트가 리간드-수용체 상호작용의 특이성에 영향을 주는 한 가지 방법은 호르몬 소단위의 상대적인 위치를 변경한다는 것이다(Cosowsky et al, 1997). 이는 제 2 -소단위 루프와 제 1 및 제 3 -소단위 로프에 있는 홈의 모양을 변경시킬 수 있다. 이와 같은 제의는 호르몬 및 수용체에 있는 저해성 원소가 부적절한 리간드-수용체 상호작용을 예방하는 역할을 한다는 것에서 따른 것이다(Moyle et al, 1994). 따라서, 시트-벨트의 효과는 호르몬 모양을 변경시켜 말굽의 중앙 부분으로 들어가는 능력을 줄이는 것이다.
당단백질 호르몬은 몇 가지 치료요법적 용도를 가진다. FSH는 여성에서 배란유도를 위한 조제물에서 난포의 배란 발생을 유도하는데 이용된다(Galway et al, 1990; Shoham et al, 1991; Gast, 1995; Olive, 1995). LH 및 hCG는 또한 발생이 시작된 난포 배란을 유도하는데에도 이용된다. FSH, LH, hCG는 남성에서 고환의 기능을 유도하는데 이용된다. 기존의 호르몬은 남성 및 여성의 성 기능, 갑상선의 기능을 자극하는데 이용된 반면에, 실제 이 호르몬을 이용하는데에는 이들이 이종이량체라야 한다는 것이다. 뇌하수체(가령, LH 및 FSH), 혈청(말 융모성 고나도트로핀) 또는 임산부의 뇨(hCG) 또는 폐경기 여성(hLH 및 hFSH 혼합물)에서 분리할 수 있다. 활성이 있는 이종이량체는 - 및 -소단위를 모두 발현시킬 수 있는 세포 배양물에서도 분리할 수 있는데, 일부는 종양에서 분리할 수 있고(Cole et al, 1981), - 및 -소단위를 인코드하는 cDNA 또는 게놈 DNA에 트랜스펙션된 세포에서도 분리할 수 있다(Reddy et al, 1985). 또한, 후자의 경우에는 치료요법적으로 유용한 상당히 중요한 당단백질 호르몬 소스가 된다. 당단백질 호르몬의 올리고사카라이드는 시그날 변환을 유도하는 이들의 능력에 영향을 주는 것으로 보이기 때문에(Moyle et al, 1975; Matzuk et al, 1989), 활성 이종이량체의 준비 및 합성은 진핵세포에서 가장 잘 이루어진다. 이와 같은 세포는 올리고사카라이드에 만노즈 사카라이드를 첨가할 수 있고, 이들을 처리하여, 천연 호르몬에서 볼 수 있는 복합 체 올리고사카라이드를 제공할 수도 있다(Baenziger et al, 1988). 그럼에도 불구하고, 진핵세포는 상이하게 당단백질을 처리하기 때문에, 당단백질 호르몬의 합성은 Chinese hamster ovary(CHO)와 같은 것에서 유도된 포유류 세포주에서 종종 실시된다. 호르몬은 포유류가 아닌 진핵세포에서 만들어질 수도 있기 때문에, 올리고사카라이드 사슬의 항원성으로 인하여 이들을 임상적으로 이용하는데 한계가 있다.
이종이량체 호르몬은 또한 수정률을 제한하는데 이용되는 항혈청을 유도하는 이뮤노겐으로도 이용될 수 있다(Singh et al, 1989; Pal et al, 1990; Talwar et al, 1986; Talwar et al, 1992; Moudgal et al, 1971 and 1972; Moudgal, 1976; Ravindranath et al, 1990; Moudgal et al, 1978). 사람의 임신을 유지하는데 있어서, hCG의 필수적인 역할로 인하여, hCG에 대한 면역 반응을 발생시키는 것이 유익한 피임 수단이 되고, hCG-기초한 피임 백신을 발명하려는 시도가 있어왔다. 그러나, 호르몬에 대한 항체 또한 수정률을 촉진시키는데 이용될 수 있다. 예를 들면, 다낭성 질환을 가지는 일부 여성에서 LH 수준이 과도한 것으로 나타났다. 따라서, 순환하는 LH 활성을 완전히 제거하는 것이 아닌 줄이는 방법이 수정률을 복원시키는데 유익할 것이다.
당단백질 호르몬 대사과정에 대해서 이해된 바가 극히 미미하다. 호의 반감기는 올리고사카라이드의 함량 특히, 이들의 말단 당 잔기에 의해 영향을 받는 것으로 알려져 있다(Baenziger et al., 1988). 가장 안정한 호르몬은 이 위치에 최다 시알산을 가지는 것이 된다(Murphy et al, 1991; Baenziger et al, 1992; Fiete et al, 1991; Smith et al, 1993; Rosa et al,1984). 그럼에도 불구하고, 올리고사카라이드는 완전하게 호르몬의 안정성을 책임지는 것은 아닌데, 그 이유는 자유 호르몬 소단위는 이들이 이종이량체와 동일한 올리고사카라이드를 가지더라도 순환하는 반감기가 상당히 짧은 것으로 알려져 있기 때문이다(Wehmann et al, 1984; Kardana et al, 1991). 또한, 호르몬은 소단위 분해를 유도하는 단백질분해과정에 의해 비활성화된다(Kardana et al, 1991; Birken et al, 1991; Cole et al, 1991; Cole et al, 1991; Cole et al, 1993). 니크된 hCG는 hCG 보다 휠씬 신속하게 이의 비활성 소단위로 해리된다(Cole et al, 1993). 따라서, 이는 소단위 해리를 예방하는 또는 줄이는 과정으로 호르몬 효과를 강화시키는 것으로 예상할 수 있다.
당단백질 호르몬 소단위는 열처리, 매우 낮은 또는 높은 pH, 요소등을 포함하는 변성 조건에서 신속하게 해리된다(Pierce et al, 1981; Cole et al, 1993). 이와 같은 이유로 인하여, 대부분의 당단백질 호르몬 호르몬 준비물은 냉동건조된 분말로 저장된다. 이종이량체의 안정성을 강화시키는 과정으로 수용액에 저장되고 분포시킬 수 있는 호르몬 조제물을 만들 수 있다. 이는 별도의 호르몬 희석액을 운반해야하는 필요 및 사용자가 호르몬을 재구성시키는 추가 단계의 필요성을 없애준다.
이들 소단위를 "교차결합"시켜 호르몬을 안정화시키는 몇 가지 시도가 있었다. 화학적으로 교차결합시키는 방법을 이용하였으나(Weare et al, 1979 and 1979), 이는 활성을 줄이게 한다. 또한, 유전공학적으로 - 및 -소단위를 융합시켜 단개의 사슬로 된 호르몬을 만드는 것도 가능하다. 이와 같은 분자는 이종이량 체보다는 더욱 안정되고, 생물학적 활성도 크다(Sugahara et al, 1995). 그러나, 고유 분자와는 상당히 다르다.
단백질을 교차결합시키는 또 다른 방법은 이황화결합으로 이들을 묶어두는 것이다. 이와 같은 전략은 시스테인 노트 슈퍼패밀리의 다른 단백질을 안정화시키는 것이고(Sun et al, 1995)이는 시트-벨트에 대체된다. 또한, 단백질에 이황화결합을 추가하면 이들의 안정성을 강화시키는데, 단 이황화결합을 추가하여 단백질내에 내부 장력이 증가되어서는 안된다(Matthews, 1987; Matsumura et al, 1989). 이황화결합에 의해 당단백질 호르몬을 안정화시키려는 시도는 캐나다 특허 2188508에서도 설명하고 있다. 또한, 이와 같은 소단위간에 이황화결합에 대해 Han et al (1996)가 언급한 바가 있으나, 이 문헌에서는 이와 같은 이황화결합의 도입으로 호르몬의 활성이 감소된다고 보고한 바 있다. 이는 이들 이종이량체가 몇 개의 이황화결합을 가지는 복합 단백질이기 때문에 그렇다. 단백질에 시스테인을 추가하면, 폴딩을 파괴할 가능성이 있고, 그럴 경우에는 단백질은 기능을 상실하게 된다. 또한, 다른 시스테인 노트 단백질에 있는 소단위의 방향은 당단백질 호르몬에 있는 것과는 실재 다르기 때문에 당단백질 호르몬을 안정화시킬 수 있는 이황화결합의 위치를 예측하기 위해 다른 시스테인 노트 단백질을 이용할 수 있을 것 같지는 않다(Sun et al, 1995).
여기에서 언급하는 임의 문헌은 이들 문헌이 선행기술이나 또는 본 출원의 청구항의 특허성으로 연계되는 것으로 개제된 것은 아니다. 임의 문헌에 있는 내용 또는 데이터는 출원 당시의 출원인이 이용할 수 있었던 정보에 기초한 것이다.
발명의 요약
따라서, 본 발명의 목적은 상기에서 설명하는 당분야의 결점을 극복하는 것이다. 본 발명의 당단백질 호르몬 유사체는 당단백질 호르몬의 생활성의 일부분을 유지하면서 안정성이 개선된 것이다. 적절하게는 본 발명의 유사체는 고유 수용체에 대한 친화력의 적어도 25%을 보유한다. 본 발명의 이와 같은 당단백질 호르몬 유사체는 선행기술의 당단백질 호르몬 유사체보다 개선된 것으로 그 이유는 - 또는 -소단위 둘다 또는 한 개에 있는 잔기를 변형시켜 만든 소간의 이황화결합을 적절한 위치에 정치시킴으로써 호르몬 구조에서 소단위간 이황화결합의 충격을 최소화하였기 때문이다.
본 발명자는 또한 이와 같은 개선된 당단백질 호르몬 유사체의 소단위간 교차결합이 고유 이황화결합이 관련된 기존의 두 개 시스테인 잔기에 위치하고, 이에 상응하는 고유 소단위의 최외측 시스테인 밖에는 위치하지 않아야 한다는 규칙을 준수한다는 것을 발견하였다. 선행기술에 따른 소단위간 이황화결합을 가지는 당단백질 호르몬 유사체중 이와 같은 규정을 준수하는 것은 없었다.
본 발명의 또 다른 측면은 -소단위의 시스테인 노트와 -소단위의 시스테인 노트사이에 소단위간의 이황화결합을 가지는 당단백질 호르몬 유사체를 제공하는 것이다. 이는 당단백질 호르몬의 불안을 최소화하고, 안정성을 개선시키면서 고유 호르몬이 가지는 고나도트로핀 수용체를 자극하는 활성을 실제 보유하도록 한 것이다. 이와 같은 특징은 선행기술에서는 제안된 바가 없는 것이다.
본 발명의 다른 측면은 -소단위의 루프 3내에 위치한 시스테인 잔기와 -소단위의 루프 2내에 위치한 시스테인 잔기사이에 소단위간 이황화결합 또는 -소단위 루프 1과 -소단위 루프 2사이에 소단위간 이황화결합을 가지는 당단백질 호르몬 유사체를 제공하는 것이다. 이는 당단백질 호르몬의 불안정을 제한할 수 있고, 안정성은 개선되면서 고유 호르몬이 가지는 고나도트로핀 수용체를 자극하는 활성을 일부 보유한다는 것이다. 이와 같은 특징은 선행기술에서는 언급된 바가 없다.
제약학적 조성물을 준비할 경우에, 본 발명의 유사체를 이용하여 필요로 하는 환자에 불임을 치료하거나 수정률을 제한하는데 이용된다. 본 발명의 이종이량체 유사체는 액체 제약학적 조성물로써 운반 및 저장에 대해 안정하다.
도 1A-1C는 hCG의 -소단위의 구조를 나타내는 것이고, 이의 아미노산을 한만자 코드로 나타낸 것이 도 1B이고, 당단백질 호르몬 소단위의 구조 요소를 나타낸 것이 도 1C이다. 도 1A에서 볼 수 있는 것과 같이 시스테인 노트는 크게 세 개 루프로 나뉜다. 루프 1과 3은 상단에서 볼 수 있다. 검은 선은 아미노산 기본구 조의 C 원자를 말하는 것이고, 회색선은 이황화결합을 나타내는 것이다. 도 1B의 선은 이황화결합을 설명하는 것이다. 표 1A에서 나열한 것과 같이 고나도트로핀 호르몬 소단위의 구조적 요소는 도 1C에 나타내었다.
도 2A 및 2B는 hCG의 -소단위 구조를 나타낸 것이고(도 2A), 이의 아미노산 서열을 한문자 코드로 나타낸 것이 도 2B이다. 도 2A에서 볼 수 있는 것과 같이 시스테인 노트는 세 개 큰 루프로 나뉠 수 있다. 루프 2는 상단에서 볼 수 있다. 도면의 우측에 있는 작은 루프는 시트-벨트에서 발견되는 것이다. 이 부분에 양전하 잔기 및 음전하를 띈 잔기가 각각 LH 및 TSH 활성에 중요하다. 나머지 -소단위의 아래 작은 시트-벨트 루프에서 시작되는 -소단위 루프 1에 이 소단위 루프가 연결된 것은 FSH 및 TSH 수용체 결합에 주요한 영향을 주는 것으로 보인다. 검은 선은 아미노산 기본구조의 C 원자를 말하는 것이고, 회색선은 이황화결합을 나타내는 것이다. 도 2B의 선은 이황화결합을 설명하는 것이다.
도 3A 및 3B는 플라스미드 pSVL-, pCI-, pSVL-C7S, pC7-C7S에 의해 인코드되는 (도 3A) 및 C7S(도 3B)의 해독된 아미노산 서열을 나타내는 것이다. 각 해독된 단백질은 동일한 리더 서열을 가지고 있기 때문에, 이들은 모두 동일한 방법으로 처리되어 92개 아미노산을 가지고, APD로 시작하는 N-말단 아미노산 서열을 가지는 단백질을 만든다. 도면에서 이용된 한 문자 코드는 다음과 같다; A, 알라닌(Ala); C, 시스테인(Cys); D, 아스파르트산(Asp); E, 글루타민산(Glu); F, 페닐알라닌(Phe); G, 글리신(Gly); H, 히스티딘(His); I, 이소루이신(Ile); K, 리신(Lys); L, 루이신(Leu); M, 메티오닌(Met); N, 아스파라진(Asn); P, 프롤린(Pro); Q, 글루타민(Gln); R, 아르기닌(Arg); S, 세린(Ser); T, 트레오닌(Thr); V, 발린(Val); W, 트립토판(Trp); Y, 티로신(Tyr). 대문자는 세린이 Cys7로 치환된 위치를 나타낸다; C7S.
도 4A 및 4B는 플라스미드 pSVL-hCG' 및 pSVL-hCG'C7S에 의해 인코드되는 hCG'(도 4A) 및 hCG'Y37C(도 4B)의 해독된 아미노산 서열을 나타낸다. 각 해독된 단백질은 동일한 리더 서열을 가지고 있기 때문에, 이들은 모두 동일한 방법으로 처리되어 145개 아미노산을 가지고, SKE로 시작하는 N-말단 아미노산 서열을 가지는 단백질을 만든다. 대문자는 Tyr37 위치에 시스테인 돌연변이가 있다는 것을 말한다.
도 5는 -소단위 단클론항체 A113 및 A407에 결합시에 소단위에서 C7S 돌연변이의 영향을 나타내는 것이다. 세포 구조(rhCG)에서 준비된 hCG, 한쌍의 막대로 표시하고, 이의 구조는 실시예에서 설명하는 유사체는 포집 항체로 B112를 이용한 샌드위치 면역검사를 하거나 감지 항체로 A113 또는 A407을 방사능요도드화시킨다. 소단위에 있는 잔기를 포함하는 에피토프를 B112가 인지하고; A113은 소단위 루프 1에 있는 잔기가 연관된 에피토프를 인지하고; A407은 소단위의 N-말단에 있는 잔기 및 소단위 루프 1의 다른 부분이 관련된 에피토프를 인지한다. A407 및 A113에 대한 에피토프는 이들이 모두 동시에 hCG에 결합하기 때문에 겹쳐지지 않는다. 각 쌍의 우측에 있는 막대는 B112/A407 검사를 말한다. 죄측에 있 는 막대는 B112/A113 검사를 말한다. 여기에서 볼 수 있는 것과 같이, C7S 돌연변이는 A113에 결합하는 것보다는 A407에 결합하는 것에 더 많은 영향을 가진다.
도 6에서는 hCG(31-37)의 LH 수용체 결합을 나타낸다. 이 도면에서는 세포 배양물에서 준비된 rhCG(△), 뇨(□)에서 준비된 hCG 또는 LH 수용체를 발현하는 200,000 CHO 세포에 125I-hCG 결합을 저해하는 세포 배양물에서 준비된 hCG(31-37)(∇)의 능력을 설명한다. 죄표에 있는 값은 배양 종료시에 세포에 결합되는 방사능라벨된 hCG의 양을 말한다. 이 검사에서는 hCG와 유사하게, hCG(31-37)가 LH 수용체에 결합한다는 것을 보여준다.
도 7은 hCG(31-37)의 LH 수용체 시그날 변환 활성을 나타내는 것으로, 이는 rhCG 및 hCG(31-37)가 LH 수용체를 발현하는 200,000 CHO세포에서 cAMP 축적을 촉진시킨다는 것을 설명한다. 호르몬 자극에 대한 반응으로 cAMP의 생산은 넓게 인지된 시그날 변환 변수이다. 이 검사에서는 hCG(31-37)는 hCG와 유사하게 cAMP 축적을 자극한다는 것을 보여준다.
도 8에서는 소단위간의 이황화결합을 포함하는 hCG 및 hCG 유사체의 열적 안정성을 보여준다. 유사한 양의 hCG 및 유사체를 85℃에서 배양하였다. 샘플을 냉각시키고, 항-hCG -소단위 항체 A113(포집) 및 방사능요오드화된 항-hCG -소단위 항체 B112(감지)를 이용한 샌드위치 면역검사를 실시하여, 남아있는 이종이량체의 양을 결정한다. 횡좌표에 나타낸 값은 가열하기 전에 시작 hCG 양에 비교하여 이 검사에서 남아있는 활성 양을 말하는 것이다. 이 검사에서는 hCG가 85℃에서 신속하게 파괴되고, 반면에 교차결합된 유사체는 적어도 20분간 이들의 활성을 유지한다는 것을 말한다.
도 9에서는 요소 해리에 대한 hCG 및 교차연결된 유사체의 안정성을 보여준다. 각 라인의 상단에서 확인된 rhCG 및 교차결합된 hCG 유사체에 8M 요소의 영향을 설명하는 것이다. 8M 요소로 hCG를 처리하면, 이의 소단위 해리를 촉진시키는 것으로 알려져 있는데, 이는 여기에서 확인된 것이다. 여기에서 볼 수 있는 것과 같이, 8M 요소로 교차결합된 유사체를 처리하여도 소단위 해리를 촉진시키지는 않았는데, 이는 이종이량체에 결합이 상실되었기 때문이다. 이종이량체의 위치 및 자유 소단위의 위치는 도면의 좌측에 표시하였다. 처리안된 샘플 및 요소 처리된 샘플의 전기영동 후에, 겔에 있는 단백질은 니트로셀룰로오즈로 전기 블랏팅하고, 니트로셀룰로오즈의 표면에 있는 나머지 비-특이적인 단백질 부위를 차단시키고, 방사능요오드화된 B105를 이용하여 이량체 및 자유 소단위를 감지한다.
도 10A 및 10B에서는 플라스미드 pSVL-CFC101-114 및 pSVLCFC101-114Y37C에 의해 인코드된 CFC101-114'(도 10A) 및 CFC101-114'Y37C(도 10B)의 해독된 아미노산 서열을 한문자 코드로 나타낸 것이다. 각 해독된 단백질은 동일한 리더 서열을 가지고 있기 때문에, 이들은 모두 동일한 방법으로 처리되어 145개 아미노산을 가지고, SKE로 시작하는 N-말단 아미노산 서열을 가지는 단백질을 만든다. 대문자는 Tyr37 위치에 시스테인 돌연변이가 있다는 것을 말한다. 아래 밑줄이 있는 서열은 hFSH -소단위에서 유도된 것이다. 잔기 Arg95-Ser96에 대한 코드는 BglII 부위를 이루고, Val102-Arg103-Gly104에 대한 코드는 SstII 부위를 이룬다.
도 11은 이기능성 hCG/hFSH 키메라 유사체에 대해 소단위 단클론 항체 A113 및 A407이 결합하는데 있어서, 31-37 및 51-99 이황화결합의 영향을 설명하는 것이다. 하기 지적한 각 막대 쌍 및 이의 구조는 실시예에서 설명하는 것과 같은 hCG 및 CFC101-114 유사체는 포집 항체로 B112를 이용하는 샌드위치 면역검사를 하고, 감지 항체와 같은 방사능요오드화된 A113 또는 A407을 한다. B112는 소단위에 있는 잔기를 포함하는 에피토프를 인지하고; A113은 소단위 루프 1에 있는 잔기가 연관된 에피토프를 인지하고; A407은 소단위의 N-말단에 있는 잔기 및 소단위 루프 1의 다른 부분이 관련된 에피토프를 인지한다. A407 및 A113에 대한 에피토프는 이들이 모두 동시에 hCG에 결합하기 때문에 겹쳐지지 않는다. 각 쌍의 우측에 있는 막대는 B112/A407 검사를 말한다. 죄측에 있는 막대는 B112/A113 검사를 말한다. 여기에서 볼 수 있는 것과 같이, 31-37 또는 51-99 이황화결합이 CFC101-114에 A407의 결합 활성을 복원시키지는 않는다.
도 12는 소단위간의 이황화결합을 포함하는 hCG 및 CFC101-114, CFC101-114 유사체의 열적 안정성을 보여준다. hCG 및 CFC101-114, CFC101-114 유사체를 85℃에서 횡좌표에서 언급한 간격으로 배양하였다. 샘플을 냉각시키고, 항-hCG -소단위 항체 A113(포집) 및 방사능요오드화된 항-hCG -소단위 항체 B112(감지)를 이용한 샌드위치 면역검사를 실시하여, 남아있는 이종이량체의 양을 결정한다. 횡좌표에 나타낸 값은 가열하기 전에 시작 hCG 양에 비교하여 이 검사에서 남아있는 활성 양을 말하는 것이다. 이 검사에서는 hCG 및 CFC101-114가 85℃에서 신속하게 파괴되고, 반면에 교차결합된 유사체는 적어도 20분간 이들의 활성을 유지한다는 것을 말한다.
도 13에서는 hCG, CFC101-114, CFC101-114가 LH 수용체를 발현시키는 세포에 cAMP 축적을 촉진하는 능력에 대해 설명한다. 이 도면에서는 LH 수용체 시그날 변환을 자극시키는 능력을 비교하도록 고안된 검사에서 CFC101-114 (31-37)(△)이 CFC101-114의 것과 비슷다하는 것을 설명한다. CFC101-114(51-99)는 또한 시그날 변환을 자극하고, 이 능력은 CFC101-114 또는 CFC101-114(51-99)의 것보다 낮다. 따라서, 51-99 이황화결합을 준비하는데 요구되는 돌연변이와는 대조적으로, 31-37 이황화결합을 준비하는데 필요한 돌연변이는 시그날 변환에 영향을 줄 수가 없다. 시트-벨트는 수용체 결합 특이성에 영향을 주는 것으로 알려져 있다. 따라서, 이 도면에 있는 데이터는 수용체 접촉 또는 결합 특이성에 참여하지 않으면서 호르몬 부분으로 이황화결합을 도입시키면 수용체 결합 또는 시그날 변환에 최소한으로 영향을 줄 것이라는 생각을 지원한다. 따라서, 수용체와 접촉하지 않거나 수용체 결합 특이성에 기여하지 않는 호르몬 부분이 이황화결합 교차된 이종이량체를 준비하는데 가장 적절한 위치가 된다.
도 14는 FSH를 발현시키는 세포에서 cAMP 축적을 자극하는 hFSH, CFC101-114, CFC101-114(31-37)의 능력에 대해 설명한다. 이 도면에서는 LH 수용체 시그날 변환을 자극시키는 능력을 비교하도록 고안된 검사에서 CFC101-114 (31-37) 에 대한 최대치의 절반이 CFC101-114의 것과 비슷다하는 것을 설명한다. CFC101-114(51-99)는 또한 시그날 변환을 자극하고, 이 능력은 CFC101-114 또는 CFC101-114(51-99)의 것보다 낮다. 따라서, 51-99 이황화결합을 준비하는데 요구되는 돌연변이와는 대조적으로, 31-37 이황화결합을 준비하는데 필요한 돌연변이는 시그날 변환에 영향을 줄 수가 없다. 시트-벨트는 수용체 결합 특이성에 영향을 주는 것으로 알려져 있다. 따라서, 이 도면에 있는 데이터는 수용체 접촉 또는 결합 특이성에 참여하지 않으면서 호르몬 부분으로 이황화결합을 도입시키면 수용체 결합 또는 시그날 변환에 최소한으로 영향을 줄 것이라는 생각을 지원한다. 따라서, 수용체와 접촉하지 않거나 수용체 결합 특이성에 기여하지 않는 호르몬 부분이 이황화결합 교차된 이종이량체를 준비하는데 가장 적절한 위치가 된다.
도 15A 및 15B는 플라스미드 pSVL-K51C 및 pSVL-hcG'D99C에 의해 인코드되는 KSIC(도 15A) 및 hCGD99C(도 15B)의 해독된 아미노산 서열을 나타낸다. 각 hCG -소단위계 단백질 및 각 hCG-소단위계 단백질은 hCG의 -,-소단위와 같이 동일한 리더 서열을 가지고 있기 때문에, 이들은 모두 동일한 방법으로 처리될 것으로 보인다. 따라서, K51C는 N-말단 APD를 포함하는 92개 아미노산 잔기를 포함하고, hCGD99C는 SKE로 시작하는 N-말단 아미노산 서열을 가지는 145개 아미노산 잔기를 가지는 것으로 예측된다. 여기에서 이용되는 한문자코드는 도 3A 및 3B에서 정의한 것과 동일하다. 대문자는 소단위간 이황화결합을 만들기 위한 돌연변이 위치를 말하는 것이다.
도 16에서 △이 있는 점선은 hCG(51-99)의 능력을 말하는 것으로, LH 수용체를 발현하는 CHO 세포에 방사능라벨된 hCG의 결합을 저해하는 hCG(원이 포함된 직선) 및 hCG(51-99)(△이 있는 점선)의 능력을 설명한다.
도 17에서는 LH 수용체를 발현시키는 CHO 세포에 방사능라벨된 hCG가 결합되는 것을 저해하는 상대적인 능력을 나타내는데; hCG(-□-); hCG(-D99)(- -▽- -); hCG(51-99)(- -△- -); hCG(K51c-)(- -◇- -).
도 19는 상대적인 LH 수용체 시그날 변환 활성을 나타내는데; hCG(-○-); hCG(51-99)(- -○- -); hCG(-D99C)(- -△- -); hCG(K51C-)(- -○- -).
도 21은 플라스미드 pSVL-CFC101-114'D99C에 의해 인코드되는 해독된 아미노산 서열을 나타낸다. 이와 같은 해독된 단백질은 hCG -소단위와 동일한 시그날 서열을 가지기 때문에, 동일한 방식으로 처리되고, N-말단 아미노산 서열 SKE을 가지는 145개 아미노산으로 된 분비된 단백질이 될 것으로 예상된다. 대문자는 이황화결합을 유도하기 위해 만들어진 돌연변이의 위치를 나타낸다.
도 22는 상대적인 LH 수용체 결합 활성을 나타내는데; hCG(--); CFC101-114(- -△- -); CFC101-114(51-99)(- -▽- -); CFC101-114(-D99C)(- -◇- -); CFC101-114(K51C-)(- -◇- -).
도 24는 상대적인 LH 수용체 시그날 변환 활성을 나타내는데; hCG(-●-); CFC101-114(- -○- -); CFC101-114(-D99C)(- -◇- -); CFC101-114(K51C-D99C)(한개의 점으로 표시); CRC101-114(K51C-)(좌표에 근접하게 표시한 라인).
도 26은 hFSH 수용체를 발현시키는 CHO 세포에 125I-hFSH 결합을 저해시키는 상대적인 능력을 설명하는데; hFSH(-○-); CFC101-114(- -□- -); CFC101-114 (-D99C)(- -△- -); CFC101-114(K51C-D99C)(- -∇- -); CFC101-114(K51C-)(- -○- -).
도 27은 hFSH 수용체를 가지는 CHO 세포에서 시그날 변환을 자극시키는 상대적인 능력을 설명하는 것인데, hFSH(-○-); CFC101-114(- -□- -). CFC101(51-99), CFC101-114(-D99C), CFC101-114(K51C-)의 시그날 변환 활성은 너무 낮아서, 이용된 유사체의 농도에서는 감지할 수 없다.
도 28은 hFSH 수용체를 발현시키는 CHO 세포에서 시그날 변환을 자극시키는 상대적인 능력에 대해 설명하는데, hFSH(-●-); CFC101-114(- -○- -); CFC101-114(K51A-)(- -△- -).
도 31A 및 31B는 C7S, K51C(도 31A) 및 hCG'Y37C,D99C(도 31B)의 아미노산 서열을 나타내는데, 아래 경우는 한문자 아미노산 코드를 나타낸다. 도 31A에서 세린은 Cys7로 대체되고, 도 31B에서 시스테인은 Tyr37 및 Asp99로 대체되는데, 이는 대문자로 나타낸다.
도 32A 및 32B에서는 C7A의 아미노산 서열(도 32A) 및 - 및-소단위와 hFSHY31C사이에 소단위간 시스테인 노트에 의해 안정화된 hCG, hLH, hFSH, hTSH 유사체를 준비하기 위해 이용되는 -소단위의 아미노산 서열, - 및-소단위 사이에 소단위간 시스테인 노트에 의해 안정화된 hFSH 유사체를 준비하기 위해 이용되는 -소단위 유사체. 도면에서는 -소단위 유사체와 hFSH-소단위 유사체의 아미노산 서열을 나타내는데, 이는 한문자 아미노산 코드로 아래에 표시되어 있다. C7A 아미노산 서열에서 대분자로 표시된 소단위에 있는 알라닌이 Cys7로 치환되면 실시예 1과 2에서 설명되는 세린을 Cys7로 대체한 경우와 동일한 효과를 가질 것으로 보인다. hFSHY31C 서열에 있는 31번 위치에 시스테인 잔기가 있다는 것도 대문자로 설명된다. C7S와 같이 확인된 이와 같은 FSH-소단위 유사체 및 C7A 또는 -소단위 유사체를 발현시키는 세포는 FSH 활성을 가지는 이황화결합된 이종이량체 단백질을 분비하는 것으로 기대된다. 이와 같은 hFSHY31C의 시그날 서열은 hFSH -소단위와 유사하게 처리될 것으로 기대된다. 따라서, 이의 N-말단 서열은 NSC가 될 것이다.
도 33에서는 당단백질 호르몬 유사체를 준비하는데 이용되는 유전자 코드를 나타낸다.
도 34A 및 34B에서는 V5C의 아미노산 서열(도 34A), - 및-소단위와 hCGR8C사이에 소단위간 시스테인 노트에 의해 안정화된 hCG, hLH, hFSH, hTSH 유사체를 준비하기 위해 이용되는 -소단위 유사체의 아미노산 서열(도 34B), - 및-소단위 사이에 N-말단사이에 소단위간 시스테인 노트에 의해 안정화된 hCG 유사체를 준비하기 위해 이용되는 -소단위 유사체. 도면에서는 -소단위 유사체와 hCG-소단위 유사체의 코딩 서열을 설명하는데, 공동 발현되었을 때, LH 활성을 가지는 이황화결합연결된 호르몬 유사체를 형성할 것으로 예상된다. 단백질 및 이의 시그날 서열의 아미노산 서열은 단문자 코드로 설명하였다. 대문자는 소단위간 이황화결합을 형성하는데 필요한 돌연변이의 위치를 설명한다.
도 35는 - 및-소단위의 N-말단 부분 kt이에 소단위간 이황화결합에 의해 안정화된 hFSH52C의 아미노산 서열을 나타내는데, 이때 Ser2은 시스테인으로 전환된다. Q5C(초기에 설명) 및 hFSHS2C를 공동 발현시키는 세포는 실제 FSH 활성을 가지는 이황화결합된 이종이량체를 만드는 것으로 기대된다.
도 36은 - 및-소단위 사이에 시스테인간에 노트 이황화결합에 의해 안정화된 hLH 유사체를 준비하는데 유용할 것으로 기대되는 -소단위 유사체, hLHY37C의 아미노산 서열을 나타내는데, 대문자는 단일 아미노산 문자 코드를 나타낸다. 37번 위치에 시스테인 잔기가 존재한다는 것은 대문자로 설명하였다. C7S 및 C7A로 확인된 LH -소단위 유사체 및 - 소단위 유사체를 발현시키는 세포는 LH 활성을 가지는 이황화결합된 이종이량체 단백질을 분비하는 것으로 기대된다. hLHY31C의 시그날 서열은 hLH -소단위의 것과 동일하고 따라서, 이는 hLH -소단위와 유사하게 처리될 것으로 예상된다. 따라서, 이의 N-말단 서열은 SRE이다.
도 37에서는 - 및-소단위의 N-말단 부분사이에 있는 소단위간 이황화결합에 의해 안정화된 hLH 유사체를 준비하는데 유용한 것으로 예상되는 hLHW8C, -소단위 유사체의 아미노산 서열을 나타내는데, Trp8이 시스테인으로 변환되었다. Q5C(상기에서 설명함) 및 hLHW8C를 공동으로 발현시키는 세포는 실제 LH 활성을 가지는 이황화결합된 이종이량체를 생산하는 것으로 예상된다.
도 38에서는 - 및-소단위사이에 시스테인간 노트 이황화결합에 의해 안정화된 hTSH 유사체를 준비하는데 유용한 것으로 예상되는 hTSHY30C, -소단위 유사 체의 아미노산 서열을 나타내는데, 아래 문자는 단일 문자 아미노산 코드를 나타낸다. 30번 위치에서 시스테인 잔기가 존재한다는 것은 대문자로 나타내었다. C7S 및 C7A로 확인된 TSH -소단위 유사체 및 - 소단위 유사체를 발현시키는 세포는 TSH 활성을 가지는 이황화결합된 이종이량체 단백질을 분비하는 것으로 기대된다. hTSHY31C의 시그날 서열은 hTSH -소단위의 것과 동일하고 따라서, 이는 hTSH -소단위와 유사하게 처리될 것으로 예상된다. 따라서, 이의 N-말단 서열은 FCI이다.
도 39에서는
- 및-소단위의 N-말단 부분사이에 있는 소단위간 이황화결합에 의해 안정화된 hTSH 유사체를 준비하는데 유용한 것으로 예상되는 hTSHFIC, -소단위 유사체의 아미노산 서열을 나타내는데, Phe1이 시스테인으로 변환되었다. Q5C(상기에서 설명함) 및 hTSHFIC를 공동으로 발현시키는 세포는 실제 TSH 활성을 가지는 이황화결합된 이종이량체를 생산하는 것으로 예상된다.
도 40은 αC7S코돈의 구조를 설명한 것이다.
도 41은 pSVL-CFC101-114β'의 구조를 설명한 것이다.
도 42는 pSVL-CVC94-114β'의 구조를 설명한 것이다.
도 43은 pSVL-CFC101-106β'의 구조를 설명한 것이다.
도 44는 pSVL-αK51C의 구조를 설명한 것이다.
도 45는 사람 FSH 수용체를 발현시키는 CHO 세포에서 cAMP 축적을 촉진시키 는 hFSH 및 유사체 αV76C + hFSHβV38C의 능력을 보여주는 것이다.
도 46은 LH 수용체를 발현시키는 CHO 세포에서 cAMP 축적을 촉진시키는 hCG 및 유사체 α + hCGβR6C,Y37C의 능력을 보여주는 것이다.
본 발명에 따른 당단백질 호르몬 유사체는 CA 2188508 및 Han et al(1996)의 전반적인 가르침보다 개선된 것이다. 소단위간 이황화결합은 당단백질 호르몬 이종이량체의 α-,β-소단위를 안정화시킨다. 개선된 유사체는 호르몬의 3차원 구조의 불안정성을 감소시키도록 고안된 것으로, 이량체가 in vivo에서 형성되고, 형성된 이량체는 고유 수용체에 친화력을 가지고, 작용 활성을 가지도록 만든다.
여기에서 사용된 용어인 유사체("analog")는 사람의 융모성 고나도트로핀(hCG), 사람의 황체화 호르몬(hLH), 사람의 난포자극호르몬(hFSH), 사람의 갑상선 자극 호르몬(hTSH) 및 이의 기능상의 뮤테인에서 선택된 당단백질 호르몬을 말하는데, 이때 이들의 α-,β-소단위의 서열을 변형시켜, 각 소단위내에 자유 시스테인이 있도록 만들고, 따라서, 이들은 소단위산 이황화결합을 이루고, 이종이량체를 안정화시킨다.
또한, 여기에서 이용된 것과 같이, "뮤테인"("mutein")은 변형된 당단백질 호르몬 hCG, hLH, hFSH, hTSH를 말하는 것으로 이들은 소단위간 이황화결합을 만들도록 변형되었으나, 실제 이들의 생물학적 활성 예를 들면, 수용체 친화력, 호르몬 능력, 항체 인식 또는 상이한 당단백질 호르몬에 대한 특이성 또는 친화력의 증가(키메라 당단백질 호르몬의 경우에 발생)을 보유한다(적어도 80%). 이들 뮤테인이 기능이 있는지에 대해서는 표현하지 않는다.
당단백질 호르몬의 뮤테인을 만들기 위해서, 단백질은 공지의 수단을 이용하여 변형시킬 수 있다. 편리하기로는, "뮤테인"이라는 변형된 단백질을 인코드하는 변형된 유전자를 가지는 적절한 숙주 세포에서 발현시키는 과정 및 "유도화"과정으로 불리는 것으로 나뉠 수 있다.
보통의 유도체는 선두 분자를 우선 합성시키고, 그 다음 이를 유도하여 준비되는데, 유도물질을 직접적으로 만들 수도 있다. 그러나, 유도체의 암시적인 의미는 이들이 비록 바람직한 생산 방법에 의해 만들어지지는 않았다하더라도 선두 분자를 변형시켜 유도체를 얻는 것도 기술적으로는 가능하다는 것이다.
단백질 변형은 다음과 같은 분류할 수 있다;
선호적인 변형--이와 같은 변형으로 특정 용도에 단백질의 유용성을 강화시킨다.
변화가 없는 변형--이와 같은 변형으로 특정 용도에 단백질의 유용성을 강화시키거나 축소되지 않는다.
불리한 변형--이와 같은 변형으로 인하여 특정 용도에 단백질의 유용성을 근본적으로 제거하지는 않지만 감소시킨다.
무용화 변형--이와 같은 변형으로 특정 용도에 단백질의 유용성을 제거한다.
허용성 변형--이와 같은 변형은 우호적인 변형, 변화가 없는 변형, 불리한 변형이 되나, 무용화 변형은 아니다.
단백질은 한 가지 이상의 용도를 가지기 때문에, 이와 같은 변형은 한 가지 용도에서는 선호적이고, 제 2 용도에서는 불리한 변형이 되며, 제 3 용도에서는 변형이 없는 변형이 되고, 제 4 용도에 대해서는 무용화 변형을 시키는 것이 가능하다.
일반적으로, 단백질의 적합성에 대한 이와 같은 변형은 단백질의 아미노산 조성, 분자량 또는 총제적인 물리적인 성질에만 의존하는 것이 아니라 단백질의 특이적인 구조에 어느 정도 특이성을 가지는 용도에 대해 논의된다.
다음의 목적중 하나이상을 포함하는 다양한 이유로 단백질이 변형된다;
-분자를 더 잘 감지될 수 있도록 하는데, 방사능라벨된 것, 효소 라벨된 것, 형광 라벨된 유도체;
-특정 물리, 화학, 생물학적 물질에 대해 좀더 안정적인 분자를 만드는데, 예를 들면 열, 빛, 산화물질, 환원 물질 및 효소등.
-원하는 용매에 좀더 용해가 잘 되도록 분자를 만드는데, 예를 들면, 침전을 실행시키거나 또는 또 다른 분자를 포집하는데 이용한다.
-아미노산 사슬에 보호기를 위치시키는 등의 분자가 참여하는 반응 특징을 제한하거나 또는 역으로, 가능한 반응을 연장시키는데 이용하는데, 예를 들면, 연속적인 결합 반응을 실행하기 위해 분자에 반응기를 위치시키는 것이다.
-분자의 면역원성을 증감시키는데 이용한다.
- 개체에 투여하였을 때 분자가 특정 기관 또는 조직에 잔류하는 시간을 증가시키거나 특정 기관 또는 조직에 도착하는 것을 가속시키거나 지연시키는데 이용한다.
-생물학적 또는 면역학적 활성을 강화 또는 감소시키는데 예를 들면, 수용체에 대한 특이성을 증가 또는 감소시키거나 또는 이의 특이성을 변형시키는데 이용한다.
-기존 활성에 상보적인 새로운 활성(가령, 항종양 항체에 독소를 부착하는 등)을 부여하는데 이용한다.
-분자의 원하지 않는 부작용을 저해시키기 위해 이용한다.
단백질의 대부분 잔기는 어느 정도의 돌연변이에 내성을 가진다. 돌연변이는 단일 또는 다중 치환, 삽입 또는 결손으로 이루어질 수 있다. 적절하게는 삽입 또는 결손은 분자의 말단 또는 표면 루프 또는 도메인간의 경계에 만든다.
"추가" 또는 "융합"되기 쉬운 말단에서 삽입에 대해 적절한 최대치는 없다. 한 단백질을 다른 단백질에 융합시켜 발현시키거나 또는 이 성분의 복합된 생물학적 활성을 가지는 융합 단백질을 제공한다. 융합 단백질은 전구물질로 유용한데 이는 절단되어 활성 단백질이 되는데 이 경우에 비록 융합 단백질이 고유의 활성이 부족하더라도 가능하다.
"절두"되기가 용이한 말단에서 결손에 대해 변형의 목적이 중요한 것이다. 분자의 면역학적 성질만 관심이 Dlt는 경우에는 단백질을 상당히 절두시키는 것이 일상적이다. 단백질로부터 5개 아미노산 정도의 작은 에피토프를 추출할 수 있고, 이 자체를 이용하여 T 세포 반응을 유도시키거나 자체 복사체 또는 면역학적 운반체에 공액시켜, B 세포 반응을 유도할 수 있다. 생물학적 활성이 보존되어야 하는 경우에 절두를 제한하는 것이 좀더 설득력이 있다.
적절하게는 치환 및 임의 내부 결손 및 삽입을 고려한 후에, 돌연변이체는 고유 단백질 서열의 적어도 50%, 바람직하게는 80% 동일하다.
단백질은 다음의 돌연변이에 내성을 가질 수 있다
a) 삽입 또는 결손보다는 치환 돌연변이;
b) 루프 또는 도메인간 링커와 같은 내부에 삽입 또는 결손된 돌연변이;
c) 내부 잔기보다는 표면 잔기에 영향을 주는 돌연변이;
d) 결합 부위 말단부분에 있는 분자의 일부에 영향을 주는 돌연변이;
e) 한 개 아미노산을 유사한 크기, 전하 또는 소수성을 가지는 또 다른 아미노산으로 치환하는 돌연변이;
f) 원하는 단백질이 속하는 상동성 단백질족 가운데 실제 다양한 부분에 돌연변이.
이와 같은 것을 이용하여 기능을 가지는 돌연변이체를 만들 수 있다.
적절하게는 구조상 잔기의 경우에, 적절하게는 전체 사슬에 대해, 변형된 단백질의 예상 또는 실험상으로 결정된 3D 구조는 주요 사슬(C-탄소) 모양을 가지는데, 이는 고유 단백질의 실험상으로 결정된 또는 예상된 3D 구조로부터 자승 평균 평방근은 5Å, 적절하게는 3Å이하, 더욱 바람직하게는 2Å, 가장 적합하게는 1Å가 된다.
단백질의 3-D 구조 결정은 유용한 목적으로 단백질을 변형시키거나 또는 비활성 변형을 적어도 피하는 방법을 찾는 당업자에게 상당한 안내를 제공한다. 전체 3-D 구조를 아는 경우에, 실행자는 어느 잔기가 표면에 있고, 어느 잔기가 내부 에 있으며, 어느 잔기가 외부로 향하는 측쇄를 가지는지, 어느 잔기가 서로 근접하게 포개져 있는지, 어느 잔기가 그렇지 않는지, 사슬이 유연성이 있는지, 억압되어 있는지, 어느 잔기가 2차 구조에 있는 지, 어느 잔기가 사슬 폴딩의 결과로 인하여 근접하게 되는지, 어느 잔기가 H-결합 및 염 다리를 형성하는데 상호작용을 하는지에 대해 알 수 있다.
표면 잔기에서 돌연변이는 내부 잔기보다는 더 내성을 가진다. 내부 잔기에 돌연변이가 있는 경우에는 단백질을 불안정하게 할 가능성이 있고, 따라서, 단백질을 변성하면 이 모든 결합 활성에 영향을 준다. 표면 잔기에 있는 돌연변이는 결합 활성에는 전혀 영향을 주지 않고, 이는 일부 활성에는 영향을 줄 수는 있다. 어떤 경우이건간에, 이들은 단백질을 변형시키지는 않는다.
단백질의 완전한 3-D 구조를 결정하는 원칙적인 방법은 X-ray 결정 및 NMR 스펙트로스코피이고, 고해상 X-ray 회절 데이터를 얻는 주요 장애물은 결정화 단계이다. hCG의 고해상 결정 구조는 두 실험실(Lapthorn et al, 1994; Wu et al, 1994)에서 얻을 수 있고, 이는 hLH, hFSH, hTSH의 모델로 이용된다.
더 작은 단백질의 경우에, 바람직하게는 20kDa보다 적은 크기의 단백질인 경우에, 핵 자기 공명(NMR) 스펙트로스코피로 3D-구조를 밝힐 수 있다. NMR 구조 결정하는데 이용하기 위해서는 McIntosh et al,(1987)를 참고로 한다. NMR은 더 큰 단백질의 구조에 대해 부분적인 정보를 제공한다. 특히 관심이 있는 더 큰 단백질의 부분은 재조합 DNA 기술 또는 단백질가수분해에 의해 별도로 생산하고, NMR로 연구한다.
다양한 스펙트럼 변화는 특정 아미노산의 전하 환경을 변경시킨다. 아미노산 트립토판, 티로신, 페닐알라니 및 히스티딘이 다소 극성이 적은 환경으로 변화되는 경우에, max 및 가 증가된다. 따라서, 이들이 극성 용매에서 이들 아미노산중 하나보다는 높고, 동일한 용매에서 자유 아미노산보다 높은 경우에, 잔기는 비-극성 아미노산에 의해 둘러싸여 묻히게 된다. 또한, 단백질의 스펙트럼이 용매 극성에서 변화에 감응성이 있는 경우에, 문제의 아미노산는 표면에 있어야 한다. 또 다른 예를 제공하기 위해, 아미노산의 경우에, 적정가능한 기(가령, 티로신의 OH, 히스티딘의 이미다졸, 시스테인의 SH)가 전하를 띈 경우에, max 및 가 증가된다. 여기에서, pH 변화와 특정 변화와의 상관관계를 조사하면, 당업자는 적정가능한 기가 표면에 있는지 묻혀있는지를 알 수 있다. 깊은 골짜기에 있는 잔기는 표면에 있는 것 또는 완전하게 묻힌 것과 바로 구별할 수 있는데, 이는 용매와의 결과를 비교하면 되는데, 이들 분자가 다른 평균 직경을 가지기 때문이다.
특정 잔기의 위치를 결정하는데 이용되는 것 이외에, 이들 스펙트로스코피 기술은 X-ray 및 NMR 분석에서 모호한 것을 해결하는데 도움이 된다.
아미노산 친화성 라벨
Asp, Glu 디아조 화합물(이온화안된 AA기를 가짐)
또는 에폭시드(이온화된 AA기를 가짐)
Lys 2,3,6-트리니트로벤젠 설폰산,
아세트산, 숙신산, 말레인산,
시트라코닌 무수물
Arg 사이클로헥산디온, 하이드라진
라벨된 단백질 및 라벨안된 단백질은 시아노겐 브로마이드, 펩신, 파파인, 키모트립신, 트립신 또는 요오드벤조익산과 같은 단편화 물질로 별도 처리를 한다. 라벨된 단백질을 절단한 경우에 펩티드와 고유 단백질에서 유도된 것을 2차원 전기영동으로 비교한다. 이동성이 변경된 단백질을 서열화하여, 변형된 아미노산을 결정한다.
Adachi et al.,(1989)은 Arg- 및 Lys-특이적인 시약을 이용하여, EC-SOD의 촉매 및 헤파린-결합 활성에서 이들 잔기의 역할을 연구하였다. 이들은 이들 잔기의 변형으로 이들 활성이 감소된다는 것을 발견하였으나, 이들은 어느 잔기가 변형되었는지를 구별하는 시도는 하지 않았다.
표면 잔기는 광친화력에 의해 확인할 수 있는제, 빛에 노출시킬경우에, 매우 반응성이 큰 중간 생성물 가령, 니트렌 및 카르벤을 형성한다. 이들 종은 C-H 결합으로 삽입될 수 있어, 임의 접근 가능한 아미노산과 반응을 한다. 이와 같은 이유로, 광친화성 라벨을 이용하여 막 지형을 연구할 수 있다. 일부 단백질은 막의 주변에 있고, 다른 단백질은 막에 일체형으로 되어 있다.
비-특이적인 라벨링 시약의 또 다른 예를 들면 티리티움이 된다. 폴드된 단백질은 삼중수소수로 수소를 교환하여 삼중수소화시키거나, 변성시키거나, 단편화시키고, 단편은 서열화시키고, 트리티움(방사능 활성)이 존재하는 지에 대해 테스트한다.
이와 같은 라벨링 방법은 표면에 있는 것 이외에 잔기는 결합 부위의 일부분인 지를 결정하는데 이용된다. 자유 단백질을 라벨하였을 때 수득된 라벨의 분포는 복합된 단백질을 라벨한 경우에 수득된 것과 비교한다. 복합체에서, 결합 짝이 결합 단백질의 결합 부위 잔기를 차단하기 때문에, 자유 단백질에서는 결합 부위 잔기를 라벨하여야 하고, 복합 단백질의 경우에는 라벨하지 않아도 된다.
일반적으로, 유사한 서열 및 기능의 단백질 족내에, 표면 잔기는 내부 잔기보다는 더 다양하다. 이는 단백질의 전체적인 모양을 유지하는데 필수적인 다른 잔기와 상호작용하는데 표면 잔기는 잘 관여하지 않기 때문인 것으로 보인다.
단백질의 표면 잔기를 확인하는 가장 신뢰성 있는 방법은 X-레이 회절에 의해 단백질의 3-D 구조를 결정하는 것이다. 돌연변이체를 고안하는데에는 불완전한 3D 구조도 도움이 된다. 평균 결정학 열 인자보다 큰 것으로 확인되는 높은 이동성을 가진 잔기는 불안정하게 하는 돌연변이에 대해 가장 감응성이 적은 것이다(Alber et al (1987)).
부작용없이 표면 위치에서 많은 아미노산 치환을 만들 수 있지만, 내부 위치에 치환이 있는 경웅에는 상당히 불안정화된다. 상동성 단백질 족내에, 기능을 가지는 아미노산과는 관계없이 가장 보존된 잔기는 묻혀있는 것이다.
단백질 폴딩의 자유 에너지 및 단백질 안정성에 대해 주로 기여하는 것은 내부에 있는 묻혀있는 소수성 측쇄에서 나오고, 이는 용매로부터 차단된다. 패킹 밀도가 일반적으로 높다. 일반적으로, 코어 잔기의 용적을 변화시키는 돌연변이fp 내성을 가지는 단백질의 능력은 총 코어 잔기에서 전체 전하 및 개별 단지 용적 변 화 크기에만 의존한다. 환언하면, 한 개 코어 위치의 용적이 증가되면 또 다른 코어 위치의 용적이 감소되는 것을 보상할 수 있다. 적절하게는 총 코어 잔기 용적의 전체 변화는 10%미만, 적절하게는 5% 미만이 되어야 한다(See Lim et al (1989); Lim et al (1992)).
이에 반대되는 증거가 없기 때문에, 내부 잔기로 확인된 모든 잔기는 단일 코어의 일부가 되는 것으로 간주된다. 그러나, 단백질이 몇 개의 다른 코어를 형성하도록 폴드되는 경우에, 상기에서 언급한 용적 보존 법칙은 각 코어에 별도로 적용되어야 한다.
단백질의 묻혀있는 코어를 만드는 것은 각 아미노산의 성질 뿐만 아니라 묻혀있는 것이 있는 경우에는 단백질에 있는 아미노산의 전반적인 발생 빈도에도 영향을 받는다. 가장 흔히 묻혀있는 잔기는 차례로 Val, Gly, Leu, Ala, Ile, Ser가 된다.
Lim et al.,(1992)은 단백질 코어에 한 개의 소수성 아미노산(Leu, Val)을 친수성 아미노산(Asn, Gln)으로 치환하는 경우에, 단백질의 완전한 폴딩이 방해를 받고, 생물학적 활성이 파괴된다.
묻혀있는 Cys, (-S-S-형), Asp, Gly, His, Pro, Trp이 상동성 단백질에서 70%이상 변화되지 않아야 한다. 따라서, 이들 잔기가 원하는 단백질에서 묻혀있는 위치에 있는 경우에는, 이들을 변화시키지 않는 것이 바람직하다. 이와 같은 보존은 다음과 같이 설명할 수 있다; Cys(이황화결합), Asp(전하를 띄고 견고한 측쇄), Gly(유연성이 있는 측쇄), His(생리학적 pH에서는 전하를 띈 상태와 전하를 띄지 않은 상태를 모두 이용할 수 있다), Pro(독특한 사슬 모양), Trp(가장 큰 측쇄).
Met을 제외한 다른 잔기는 묻혀있는 경우에 대개 40-60%가 변화되지 않는다(Met는 26%만이 변화되지 않고 남아 있고, 25%는 Leu으로 치환된다).
다음의 묻혀있는 잔디 치환 가능성은 10%를 넘는다;
Ala →Val, Glu →Gln, Phe →Leu, Ile →Leu, Ile →Val,
Lys →Arg, Leu →Ile, Leu →Val, Met →Leu, Met →Val,
Asn →Asp, Asn →Ser, Arg →Lys, Arg →Gln, Ser →Ala,
Thr →Ser, Val →Ile, Val →Leu, Tyr →Phe, Cys(-SH) →Ala.
이들 추가 치환 가능성 범위는 5-10%가 된다;
Ala →Ser, Asp →Asn, Glu →Arg, Glu →Val, Phe →Ile,
Phe →Val, Phe →Tyr, His →Val, Leu →Phe, Met →Ala,
Met →Ile, Gln →Glu, Gln →His, Gln →Met, Ser →Gly,
Ser →Thr, Thr →Val, Val →Ala, Trp →Phe, Tyr →Leu, Cys(-SH) →Ser.
(Overington et al (1992), Table 5.을 참고).
가장 일관성있는 교환 집단은 (Arg, Lys), (Leu, Ile, Met, Val, Phe), (Ser, Thr, Ala)으로 나타났다. 그러나, Ala 및 Val은 매우 일관성이 없는 것으로 보인다.
일반적으로 묻혀있는 잔기를 변화시키는 것은 피하는 것이 바람직하다. 그러나, 이러한 것들이 돌연변이된 경우에는, 코어의 용적의 전반적인 변화를 제한해야 하고, 가장 바람직하게는 한 개 잔기를 또 다른 것으로 치환하는 돌연변이을 제 한해야 하는데, 일반적으로 치환 가능성은 0%를 초과하고, 좀더 적절하게는 적어도 5%, 가장 적절하게는 10%가 된다. 다른 증거에 의해 정당화된다는 증거가 없기 때문에, 묻혀있는 Cys(-S-S), Asp, Gly, His, Pro, Trp의 돌연변이는 피한다. 가장 안정한 코어 돌연변이는 한 개의 소수성 아미노산을 또 다른 아미노산으로 교환하는데, Arg을 Lys으로 대체하는 것이 된다(그역도 가능).
그럼에도 불구하고, 내부 잔기에 유익한 돌연변이를 실시하여 단백질의 안정성을 개선시킬 수 있다. 이와 같은 돌연변이는 고유 구조와 필적할만한 추가 안정화 상호작용(수소결합, 이온쌍)을 도입시킬 수 있거나 작은 아미노산을 큰 아미노산으로 또는 선형 측쇄를 분지쇄 또는 방향족으로 치환하여 상호작용 기의 이동성을 감소시킨다(Alber et al.,(1987)).
더욱 중요한 것은, 상기에서 언급한 것과 같은 당단백질 호르몬에 있는 잔기변형에 대한 일반적인 것에 추가하여, 당단백질 호르몬 수용체에 결합할 때 노출되는 또는 노출되지 않는 당단백질 호르몬(특히 hCG) 부분 및 수용체 친화력 및 호르몬 기능등의 호르몬-수용체 상호작용을 파괴하지 않는 부분에 대해 상당량의 이용할 수 있는 정보가 있다. 안전하게 변형될 수 있는 잔기 및 부분에 대한 이와 같은 이용할 수 있는 정보는 관련 기술 부분 및 본 명세서 곳곳에서 제공한다. 따라서, 여기에서 제공하는 풍부한 구조 및 기능에 관한 데이터 및 과학 문헌에서 이용할 수 있는 데이터로부터, 당업자는 당단백질 호르몬의 아미노산 서열에 기능을 파괴하지 않는 변형을 만들 수 있을 것이다.
또한, 당단백질 호르몬의 기능적인 뮤테인은 키메라 당단백질 호르몬을 포함 하는데, 이때 당단백질 호르몬의 한 가지 이상 잔기 또는 부분 예를 들면, 소단위 시트-벨트등은 또 다른 당단백질 호르몬의 이에 상응하는 부분으로 대체되어 수용체 결합 특이성을 변경시킨다. 수용체 결합 특이성에 영향을 주는 잔기 및 부분의 일부 예는 본 발명의 명세서에 제공한다.
이황화결합을 형성하는 능력을 가지는 잔기를 확인하는데 이용되는 과정은 아래에서 설명한다. 다음의 실시예에서 설명하겠지만, 모든 이황화결합으로 안정화된 이종이량체 hCG 및 이의 유사체가 완전한 생물학적 능력을 가지는 것은 아니다. 그러나, 시스테인 노트사이에 소단위간에 이황화결합을 도입시키면 호르몬 능력을 파괴시키지 않고 단백질의 안정성을 증가시킨다.
본 발명에 따른 이황화결합 연결된 당단백질 호르몬은 한 개 이상의 소단위간 이황화결합을 형성하기 위해 교차결합되는 소단위 각각에 자유 시스테인을 만들어서 준비할 수 있다. 한 개 이상의 아미노산을 시스테인으로 대체하거나 또는 기존의 이황화결합에 있는 시스테인 잔기에 대한 코돈을 임의 다른 아미노산에 대한 코드호 치환하면 된다. 그러나, 이와 같은 모든 치환으로 소단위간 이황화결합을 만드는 것은 아니다. 여기에서 설명하는 유사체를 만드는데 고려되어야 할 두 가지가 있다.
1) 가장 유용한 이황화결합 연결된 당단백질 호르몬 유사체는 hCG, hLH, hFSH, hTSH와 유사한 구조를 가지는 것이다. 따라서, 이황화결합은 전반적인 단백질 모양을 변형시키지 않아야 한다. 단백질 모양에서 최소한의 파괴 효과를 가지는 것으로 예상되는 이황화결합의 위치는 표 1B의 데이터로 유추할 수 있는데, 표 1B에서는 hCG의 -소단위에 있는 선택된 아미노산 잔기의 C 및 C 탄소원자(컬럼의 각 쌍의 좌측 컬럼)와 hCG -소단위의 한 개이상의 잔기(칼럼 각쌍의 우측컬럼)에 대략적인 거리를 설명한다. 이 값은 몇 가지 널리 알려진 이용 가능한 분자 모델링 패키지(Sybyl, Insight, Rasmol, Kinemage)에 의해 hCG의 결정 구조로부터 계산할 수 있다. 표 1B에 나타낸 것을 제외하고, hCG의 -소단위와 hCG -소단위의 한 개 이상의 잔기간에 거리는 공지된 hCG 결정 구조 데이터로부터 계산할 수 있다(Lapthorn et al, 1994; Wu et al, 1994).
각 -소단위와 연관된 괄호에 있는 각 쌍의 좌측 값은 -소단위 잔기의 C 탄소 원자와 좌측 컬럼에서 이에 상응하는 -소단위 잔기사이에 거리를 나타낸다. 괄호에 있는 각 쌍의 우측 값은 이들 잔기의 C 탄소 원자간에 상응하는 거리를 나타낸다. 원칙적으로, 이들 잔기 쌍을 시스테인으로 치환하면, 소단위간에 이황화결합이 형성되는데, 이때 각 소단위에는 다른 방해하는 시스테인이 없어야 한다. 모든 시스테인 쌍이 소단위간 이황화결합을 형성하는 동일한 가능성을 가지는 것은 아니다. 이종이량체 모양에 최소한의 영향을 주는 것으로 예상되는 소단위간 이황화결합 형성은 이들 성분 시스테인의 측쇄 원자의 방향에 영향을 받는다. 이황화결합이 만들어지는데 선호적인 적절한 위치에는 C 탄소원자산에 거리가 C 탄소원자간의 거리보다 더 적은 아미노산 쌍이 포함된다. 소단위간 이황화결합이 만들어지는데 가장 선호되는 적절한 위치에는 C 및 C 탄소간의 거리가 자연 발생되는 이황화결합의 거리 즉, 각각 약 5.0-6.5Å 및 약 3.5-4.2Å이 되는 것이다.
따라서, 4-8Å로 떨어진 C 탄소원자 및 1-2Å로 떨어진 C 탄소원자를 가지는 소단위간 시스테인 쌍을 만들기위한 치환으로 전체적인 단백질 모양에 최소한의 영향을 주는 이황화결합을 만들고, 두 개 이상의 분자의 분자간 교차결합을 촉진시키는데 최상을 기회를 가진다. 또한, 실시예에서 볼 수 있는 것과 같이, 본 발명의 이와 같은 규칙은 많은 면역학적 호르몬적 성질을 상당히 보유한 몇 가지 이황화결합된 hCG 유사체를 만드는데 성공적으로 이용된다.
2) 가장 활성이 있는 이황화결합된 당단백질 호르몬 유사체는 수용체 결합 또는 시그날 변환에 필요하지 않는 부위 또는 호르몬의 활성 모양을 안정화시키는 데 필요하지 않는 부위에 교차결합을 포함하는 것으로 예상된다. 이들의 생물학적 활성에 필요한 것으로 알려지지 않은 당단백질 호르몬에는 많은 수의 잔기가 있다. 여기에는 시스테인 노트의 대부분 N-말단 잔기(고유 -소단위의 제 2 시스테인 및 고유 -소단위의 제 1 시스테인)이 포함된다. 예를 들면, 매우 가능성이 있는 hFSH 유사체를 만들 수 있는데, 이와 같은 FSH -소단위 잔기(Asn1, Ser2)는 이들의 hCG 해당 부분(Ser1, Lys2, Glu3, Pro4, Leu5, Arg6, Pro7, Arg8)으로 대체되었다. 따라서, hCG -소단위 Gln5 및 -소단위 Arg8을 시스테인으로 치환하여 만들어진 분자의 이 부분에 이황화결합은 이황화결합된 이종이량체의 LH 활성을 제거할 것으로 보이지는 않는다. 유사하게, hFSH -소단위 Gln5 및 -소단위 Ser2을 시스테인으로 치환하여 만든 이황화결합으로 이황화결합된 이종이량체의 FSH 활성을 제거할 것으로는 기대되지 않는다. 소단위 Cys31를 Ala 또는 Ser으로 치환하거나 또는 hCG -소단위 Arg6를 Cys로 치환하거나 또는 FSH -소단위 N-말단에 Cys를 추가하여, hCG 또는 hFSH의 - 및 -소단위의 N-말단 부분에 이황화결합을 만든다. 이와 같은 이황화결합으로 호르몬 유사체의 활성이 파괴되는 것으로는 보지 않는다.
각 소단위에 나타나는 hCG의 결정 구조는 시스테인 노트로 구성된다. EK라서, 각 소단위에는 1, 2, 3 및 1, 2, 3로 명명한 세 개 로프를 포함한다. 또한, -소단위에는 2를 에워싸는 시트-벨트로 알려진 20개 추가 아미노산을 가지고 있어, 이종이량체를 보존하고, 독특한 수용체에 결합할 수 있는 모양으로 안 정화시킨다. 루트로핀, 폴리트로핀, 티로트로핀에서 시스테인의 위치는 이들 세 개 분자가 전반적으로 유사한 폴딩 패턴을 가지고, hCG의 결정 구조는 소단위간 이황화결합을 도입시키는 가이드가 될 것이라는 것이다. 그러나, FSH 및 TSH의 구조는 결정하지 않았고, hCG의 구조로부터 유추한 것이다. 각 소단위의 시스테인 노트의 결정 구조에서 서로 매우 유사한 것을 알 수 있다. 이것은 이들이 세 개 성분의 이황화결합에 의해 매우 억압되어있기 때문이다. 따라서, 시스테인 노트에 인접한 또는 그 내부에 잔기는 각 호르몬에서 유사한 모양을 가지는 것으로 예상할 수 있다. 또한, 세가지 종류의 호르몬 모두에서 유사한 위치에 1 및 3 루프에 시스테인이 있다. 이들은 hCG에서 이황화결합을 형성하고, 이는 모든 당단백질 호르몬에서 이황화결합을 형성하는 것으로 예상된다. 이와 같은 이황화결합 및 hCG 루프에서 기본 원자내에 또는 사이에 상당수의 수소결합은 1 및 3의 모양이 이들 세 개 호르몬에서 매우 유사하다는 것을 제시하는 것이다. 루프 1 및 3 또한 몇 개의 수소결합을 포함하는데, 이는 분자의 이 부분이 이들 세 개 호르몬에서 유사하다는 것을 제시하는 것이다. 이와 같은 관점은 자유 소단위의 NMR 구조에서 1 및 3는 이종이량체에 있지 않을 경우에도 유사한 모양을 가진다는 것을 보여준다(DeBeer, et al, 1996). 이들 세 종류의 호르몬의 나머지 부분은 hCG의 것과 상당히 유사하나, 상기에서 논의한 바와 같은 분자 일부분으로 hCG의 구조와 밀접하게 관련이 있는 것 같지는 않다. 예를 들면, 2에는 상대적으로 적은 수의 내부 수소결합을 가지고, 1 및 3와 접촉한다. hCG에서 매우 억압된 것으로 보이지 않 기 때문에, 이 구조가 다른 호르몬에서의 구조와 완전하게 동일할 것이라고 믿을만한 이유는 없다. 또한, TSH에서 루프 2는 hCG 또는 hFSH의 것보다 2개 아미노산 잔기가 더 많다. 강한 수소결합 접촉에 2의 N- 및 C-말단이 관여하고, 2의 C-말단 단부는 1과 접촉한다. 따라서, 2의 이들 부분은 대부분 호르몬에서 유사하다. 그러나, 2의 중앙 부분은 이들 세 종류 호르몬에서 잘 보존되지 않은 단백질 부분인 시트-벨트에만 접촉한다. 2의 NMR 구조는 2가 매우 보존된 것으로 나타났고, 이와 같은 관찰은 hCG 호르몬의 이부분이 이종이량체에서 잘 정리된 구조를 가진다는 것을 제시하는데 그 이유는 1, 3 및 시트-벨트사이에 끼워져 있기 때문이다. 시트-벨트에서 차이로 인하여, 2, 특히 시스테인 노트에 근접하여 위치하지 않는 단백질의 모양을 바꿀 것으로 기대된다.
루트로핀 및 폴리프로핀 수용체에 결합하는 능력을 가지는 hCG 유사체를 연구하기 위해 면역학적 프로브를 이용하여 본 발명자는 호르몬 구조에 시트-벨트의 영향에 대해 통찰하였다. 이들 데이터에서는 시트-벨트의 조성물이 호르몬의 모양을 바꿀 것이라는 것이다. 유사한 데이터로부터 호르몬의 모양이 수용체에 의해 영향을 받을 것으로 제시될 수 있다. 예를 들면, 결합 부위가 부분적으로 결정된 단클론 항체(Moyle, et al, 1990; Moyle, et al, 1995)를 이용하여 이중 기능을 가지는 hCG 유사체(CF101-109)의 모양을 연구하였는데, 이는 자유 상태 및 LH 및 FSH 수용체에 결합된 상태에서 실시하였다. CF101-109는 hCG 시트-벨트 잔기 101-109를 hFSH 시트-벨트 잔기 95-103(Moyle, et al, 1994)로 대체하여 준비하였다. 단 클론 항체에 의해 인지되는 CF101-109 능력은 시트-벨트에 있는 FSH 잔기가 존재함으로써 두 소단위간의 상호작용을 변경시킨다는 것을 보여준다. 따라서, hCG(hFSH는 아님)에 -소단위의 N-말단에 있는 잔기를 포함하는 에피토프에 대한 항체 A407는 이 에피토프가 돌연변이 부위에서 떨어져 있어도, CF101-109에 대한 친화력이 상당히 감소된다는 것이다(도 1C). 호르몬 구조에서 수용체 영향은 항체가 LH 수용체에 결합하나, FSH 수용체에 결합되지 않았을 때, A407이 CF101-109만을 인지하는 것으로 알 수 있다(표 1D). 1 및 2 또는 1 및 3내에 전반적으로 위치한 에피토프를 인지하는 다른 항체는 이들이 수용체에 복합된 경우에도 CF101-109를 인지한다.
이와 함께, 이와 같은 관찰로 호르몬내에 소단위 위치는 동일하지 않고, 이들 수용체와의 상호작용에 영향을 받을 것이라는 것이다. 따라서, 본 발명자들은 hCG의 결정 구조로부터 수득된 시스테인 치환 방향 및 상대적인 위치를 고려하고, 추가로 hCG 결정 구조가 폴리트로핀 및 티로트로핀의 구조 또는 호르몬-수용체 복합체에서 호르몬의 모양을 나타낼 것이다는 가능성을 고려하고 있다. hCG의 것과 동일하고, 수용체와 상호작용 동안에 변경될 것이라고 보이는 호르몬 부분에는 시스테인 노트에 또는 그 부근에 있는 것을 포함한다.
시스테인 노트사이에 부분은 이황화결합을 만드는데 가장 적합한 부위중에 하나이고, 소단위간 이황화결합을 위한 가장 바람직한 부위가 된다. 각 소단위의 시스테인 노트는 세 개 이황화결합에 의해 안정화되고, 이는 분자의 가장 견고한 부분을 만드는 것이다. 본 발명자의 실험실 결과에서는 hCG -소단위 잔기를 Tyr37를 변화시키면 호르몬 활성에 상대적으로 거의 영향이 없다는 것을 나타낸다. 따라서, 이 부위에 시스테인이 존재한다는 것은 본 발명자가 호르몬 활성을 변경시키는 것으로는 예상되지 않는다. 캐나다 특허 CA 2188508에서는 - 및 -소단위의 시스테인 노트사이에 소단위간 이황화결합이 고나도트로핀 이종이량체를 안정화시키고, 호르몬 활성을 유지시킨다는 것에 대해서는 설명을 하지 않았다. 본 실시예에서 볼 수 있는 것과 같이, 이를 실행하는 한 가지 방법은 -소단위 잔기 Cys7를 Ala 또는 Ser으로 치환하여, Cys7-Cys31 소단위간 이황화결합을 파괴하고, hCG -소단위 Tyr37를 Cys으로 치환하는 것이다. 만들어진 교차연결된 hCG 유사체는 LH 활성을 상당히 보유한다. 유사하게, 또 다른 실시에에서, 교차결합된 CFC101-114 유사체, hCG/hFSH 키메라를 만드는 것도 가능한데, 이때 hCG -소단위 아미노산 잔기 101-114는 이들의 hFSH의 해당부분으로 대체된다(예를 들면, -소단위 95-108) CFC101-114는 LH 및 FSH 수용체에 결합하여 이를 활성화시킨다. 이황화결합된 유사체는 또한 LH 및 FSH 수용체에 결합하여 이를 활성화시킬 수 있는 능력을 가진다. 후자 관찰로 이와 같은 이황화결합은 FSH 수용체 활성을 방지하지 못하고, 이는 hFSH에 있는 유사한 이황화결합이 이들의 호르몬 활성을 파괴하지 않는다는 것이다. 이황화결합된 hFSH를 준비하는 것은 -소단위 cDNA 및 hFSH -소단위 cDNA를 공동 발현시켜 가능한데, 이때 Cys7은 Ala으로 변환되고, Tyr31는 Cys로 변환된다. 시스테인 노트사이에 이황화결합은 또 다른 소단위간 이황화결합으로도 발생되는데, 예를 들면, 루프 2와 -시트-벨트 사이에 또는 -N-말단 및 -N-말단에서 발생될 수도 있다. 또한, - 및 -소단위의 Cys 노트사이에 형성된 이황화결합은 N-말단 부근에 있는 잔기를 자유롭게하는데, 예를 들면, Cys7Ser은 PEGylation에 유익하게 이용될 수 있다.
-소단위 및 -소단위의 시스테인 노트사이에 위치한 소단위간 이황화결합은 고유 이황화결합에 관여하는 기존의 시스테인(고유 시스테인)의 두 개 잔기내에 교차연결 위치를 둠으로써 호르몬 구조에서 소단위간 교차결합의 있을 수 있는 충격을 최소화시키는 일반적인 규칙에 따르는데, 예를 들면, 구조의 불안정성을 최소화시키기 위한 수단으로 대부분의 N-말단 또는 C-말단 고유 시스테인의 N-말단 또는 C-말단(고유 소단위의 최외층 시스테인 단위)이 된다. CA 2188508 특허에서는 이와 같은 규정에 맞는 소단위간 이황화결합에 대해서는 설명된 바가 없다.
상기에서 설명하는 일반적인 규정을 따르지 않는 -소단위 루프 1 또는 3과 -소단위 루프 2사이가 연결된 호르몬 유사체 또한 호르몬 활성을 보유할 것으로 기대된다. 이들 부분은 아미노산 치환을 잘 따를 것이다. 따라서, hCG 및 hFSH에서 사람의 -소단위를 소의 -소단위로 치환하여도 이 부분에서 소와 사람의 -소단위가 상당히 상이하다하더라도 호르몬 활성을 제거하지는 않는다. 유사하게, -소단위 루프 2에서 hFSH 잔기를 hCG 잔기로 모두 대체하여도(그 역도 마찬가지) 어느 쪽 호르몬의 활성을 제거하지는 않는다. 따라서, 이 부분의 이황화결합은 루트로핀 또는 폴리트로핀의 생물학적 활성을 파괴하는 것으로 보이지는 않는다. 이와 같은 이황화결합에는 -소단위 Gln27 및 hCG 또는 hLH -소단위 Val44 또는 hFSH -소단위 Val38를 Cys으로 바꾸어서 만들어지는 것을 포함한다. 또한, 여기에는 -소단위 Val76 및 hCG -소단위 Val44 또는 hFSH -소단위 Val38를 Cys으로 바꾸어 만들어진 이황화결합을 포함한다. 실제 활성을 가지는 것으로 예측되는 소단위 간 이황화결합으로 연결된 유사체는 -소단위 잔기 Lys75, hCG 또는 hLH -소단위 잔기 Gln46 또는 hFSH -소단위 잔기 Lys40가 Cys로 바뀐 것을 가지는 것이다. 그러나, 후자 유사체는 hCG 또는 hFSH보다는 양전하를 덜 띄는 것이어야 하고, 따라서 이의 전체적인 LH 또는 FSH 활성은 낮을 것이다. 또한, 루트로핀 및 폴리트로핀의 다른 부분으로 소단위산 이황화결합을 삽입하는 것도 가능하다. 이들 이황화결합의 일부는 -소단위 시트-벨트(가령, hCG -소단위 Asp99를 Cys으로 치환하여 만들어짐) 및 -소단위 루프 2(-소단위 Lys51를 Cys로 치환하여 만들어짐)에 있는 잔기가 관여한다. 이와 같은 이황화결합은 이중 기능을 가진 CFC101-114의 LH, FSH 활성 및 hCG의 LH 활성을 실제 감소시킨다. 이황화결합을 만들 것으로 예상하면서 시스테인으로 돌연변이된 LH, hCG, LH에서 잔기 위치는 표 2-4에서 설명하는 것과 같이 이들 단백질에 있는 및 소단위 잔기의 "등가" 위치로부터 결정한다.
표 2의 정보를 이용하여 각 사람 호르몬 -소단위에 있는 "등가" 위치를 점령하는 잔기를 계산할 수 있다. 결정 구조는 hCG의 것만 이용할 수 있다. 그러 나, 모든 당단백질 호르몬의 아미노산 서열이 매우 유사하고, 특히 이들의 소단위간 이황화결합이 유사하기 때문에, 모든 호르몬은 유사한 모양을 가질 것으로 예상된다. 모든 이종이량체의 전체적인 모양이 hCG의 것과 유사할 것이라는 결론은 키메라를 유도하는데 이용된 기존 분자 부분에서 발견되는 에피토프를 보유하는 hCG/hFSH, hCG/hLH, hCG.hTSH 키메라를 준비하는 것이 가능하다. 따라서, 표에서 정의한 것과 같이 등가 잔기의 치환으로 이미 만들어 특징을 조사한 것과 유사한 성질을 가지는 소단위간 이황화결합을 유도한다. "등가"위치는 수직 축에 정의되어 있다. 따라서, hFSH -소단위에서, 시스테인 3은 hCG -소단위의 시스테인 9와 "등가"이다.
표 3의 정보를 이용하여 각 사람 호르몬 -소단위에 있는 "등가" 위치를 점령하는 잔기를 계산할 수 있다. 결정 구조는 hCG의 것만 이용할 수 있다. 그러나, 모든 당단백질 호르몬의 아미노산 서열이 매우 유사하고, 특히 이들의 소단위 간 이황화결합이 유사하기 때문에, 모든 호르몬은 유사한 모양을 가질 것으로 예상된다. 이와 같은 생각은 키메라에서 발견되는 이들의 원조 부분에 있는 에피토프를 보유하는 사람/소 -소단위 키메라를 준비하는 것이 가능하다는 관찰에 의해 지원을 받았다. 따라서, 표에서 정의한 것과 같이 등가 잔기의 치환으로 이미 만들어 특징을 조사한 것과 유사한 성질을 가지는 소단위간 이황화결합을 유도한다.
본 발명의 실시예에서는 어떻게 이황화결합이 LH, FSH, TSH 수용체에 결합할 수 있는 당단백질 호르몬으로 도입되는지를 설명한다. 소단위간 이황화결합이 존재함으로써 상당한 FSH 및 TSH 활성을 가지는 hCG 및 hCG 유사체의 안정성을 개선시킨다. 따라서, 소단위간 이황화결합을 추가시키면, 이 호르몬 족의 다른 구성요소 및 관련 유사체를 안정화시킬 수 있을 것으로 기대된다. 수용체 결합 또는 수용체 결합 특이성에 관여하지 않는 호르몬 부위에 위치하는 경우에는 이황화결합은 호르몬 기능을 방해하지 않는다. 또한, 일부 소단위간 이황화결합은 호르몬 유사체의 기능을 강화시킬 수 있다. 한 가지 예외를 제외하고는(Blithe et al, 1991), 호르몬 소단위는 거의 엔도크린 활성을 가지지 않는다. 따라서, 호르몬을 안정화시키는 과정은 이들 호르몬의 생물학적 활성을 연장시키고, 이들의 치료요법적 활성을 강화시키는 것으로 기대된다.
본 발명에 따른 이종이량체 당단백질 호르몬의 안정성을 개선시키는 방법은 치환될 잔기를 확인하는 것이고, 따라서 각 소단위에 자유 시스테인을 만들어, 이와 같은 자유 시스테인은 소단위간 이황화결합을 형성할 수 있는 높은 가능성을 가지고, 따라서, 호르몬 단백질의 전반적인 모양을 변형시키지 않으면서 이종이량체의 안정성을 개선시킨다. 각 소단위에서 자유 시스테인을 만들기 위해 잔기를 치환시키는 것은 및 소단위의 뉴클레오티드 서열에 있는 상응하는 코돈을 치환시켜 유전자 수준에서 이루어진다. 프로모터 서열에 작동가능하게 연결된 및 소단위를 인코드하고, 변형된 당단백질 호르몬을 발현시키는 재조합 DNA 분자로 형질 변형된 숙주 세포를 배양하고, 본 발명에 따라 유사체로 명명된 변형된 당단백질 호르몬이 발현된다. 발현된 당단백질 호르몬을 회수하고, 당단백질 호르몬 정제분야에 공지된 기술을 이용하여 정제한다.
유전자 수준에서, 본 발명에 따른 당단백질 호르몬 유사체는 당분야에 공지된 적절한 부위-직접적인 돌연변이발생 기술을 이용하여 만드는데, 예를 들면, Ausubel et al, Current Protocols in Molecular Biology, Greene Publications and Wiley Interscience (New York, 1987-1997), Chapter 8 on mutagenesis of cloned DNA를 참고로 한다. 이와 같은 Current Protocols in Molecular Biology publication는 재조합 DNA 기술의 일반적인 원리를 제공하는 것이다.
재조합 DNA 분자를 포함하는 것과 같은 당단백질 호르몬 유사체의 및 -소단위를 인코드하는 뉴클레오티드 서열을 숙주 세포에서 유사체를 발현시킬 수 있는 적절한 발현 벡터에 삽입한다. 당단백질 호르몬 유사체를 발현시키도록 하기 위해, 발현 벡터에는 소단위의 DNA 코딩부분에 연결된 전사 및 해독 조절 정보를 포함하는 특이적인 뉴클레오티드 서열을 가지고 있어, 당단백질 호르몬 유사체의 유전자 발혀 및 생산을 허용한다. 우선, 유전자를 전사시키기 위해서, RNA 폴리메라제에 의해 인지되는 프로모터가 앞에 있어야 하고, 프로모터에 RNA 폴리메라제가 결합하여, 전사과정을 개시한다.
DNA는 전사 및 해독 조절 정보를 가지는 뉴클레오티드 서열을 포함하는 경우에 폴리펩티드를 발현시킬 수 있어야 하는데, 이와 같은 서열은 폴리펩티드를 인코드하는 뉴클레오티드 서열에 "작용"할 수 있도록 연결된다. 작용가능한 연결이란 발현될 것으로 보이는 조절 DNA 서열 및 DNA 서열은 유전자 발현을 허용하는 방식으로 연결된다는 것이다. 일반적으로 유전자 발현에 필요한 조절 부분에는 프로모터 부분 및 DNA 서열을 포함하는데, 이는 RNA로 전사되는 경우에, 단백질 합성을 개시하는 시그날을 제공한다. 이와 같은 부분에는 보통 전사 및 해독을 개시하는데 관계하는 5'-넌코딩 서열을 포함한다. 포유류 및 곤충 세포 시스테인스템에서 단백질을 다량 발현하는데 통상적으로 이용되는 다양한 프로모터가 있다.
본 발명의 및 소단위 유사체를 코딩하는 뉴클레오티드 서열을 포함하는 재조합 DNA 분자 및 작용가능하게 연결된 전사 및 해독 조절 부분 시그날은 숙주 세포에서 일시적으로 소단위를 발현시킬 수 있는 또는 숙주 세포 염색체에 원하는 유전자 서열을 끼워넣을 수 있는 능력이 있는 벡터에 삽입한다. 도입된 DNA가 이들의 염색체에 안정하게 끼워진 숙주 세포를 선택하기 위해, 발현 벡터를 포함하는 숙주 세포를 선택할 수 있도록 하는 한 가지 이상의 표식을 이용한다. 표식은 기본영양 요구 종을 영양요구성 숙주 세포로 만들거나, 항생제 저항성, 중금속(구리) 저항성 증을 제공한다. 선택성 표식 유전자는 발현될 DNA 서열에 바로 연결시키거나 공동트랜스펙션에 의해 동일한 세포에 도입시킬 수 있다. mRNA의 최적 합성을 위해 추가로 요구되는 요소도 있다. 이들 요소에는 접합 시그날, 전사 프로모터, 인헨서, 종료 시그날등이 포함된다. 이와 같은 요소를 결합시키는 cDNA 발현 벡터에는 Okayama(1983)에서 설명하는 것이 포함된다.
진핵 수용체에 트랜스펙션되었을 경우에 원하는 단백질을 다량으로 일시적으로 발현시킬 수 있는 발현 벡터는 당분야에 공지되어 있고, 일반적으로 분자 생물 학 공급업자로부터 상업적으로 이용할 수 있는 것이다(예를 들면, 플라스미드 pcDM8는 Invitrogen, San Diego, CA에서 구할 수 있고; pSVL는 Pharmacia, Piscataway, NJ에서 구할 수 있고; pCI는 Promega, Madison, WI에서 구할 수 있다). 일반 구조를 포함하는 벡터 또는 DNA 서열이 발현을 위해 만들어진 경우에, 발현 벡터는 다양한 수단 가령, 형질변환, 트랜스펙션, 리포펙션, 접합, 원형질 융합, 전기천공, 칼슘 침전, 직접 주입등의 수단을 이용하여 적절한 숙주 세포에 도입시킬 수 있다.
진핵 숙주 세포가 포유류 세포인 경우, 예를 들면, 사람 세포, 원숭이(COS 세포), 생쥐, Chinese hamster ovary(CHO) 세포등이 되는데 그 이유는 이들은 정확한 폴딩, 정확한 이황화결합 형성 및 정확한 부위에서 글리코실화등을 포함하는 단백질 분자로 되기 위한 해독루 변형과정을 제공하기 때문이다. 그러나, 베큘로바이러스와 같은 곤충 세포도 폴리펩티드를 과다 생산하여, 글리코실화반으을 포함하는 해독후-단백질 변형과정을 실시할 수 있다. COS, CHO, 곤충세포와 같은 정규정소이외의 단백질 발현은 당 분야에 공지된 것으로, Ausubel et al, (1987-1997) 16.9-16.14에서 설명하고 있다. 베큘로바이러스를 이용하여 곤충세포 및 포유류 세포에서 단백질 발현시키는 것이 적절하게 이용된다. 당단백질 호르몬 유사체의 및 소단위를 발현시키는 형질변환된 숙주 세포를 배양시켜, 유전자를 생산한다.
당단백질 호르몬 유사체의 및 -소단위를 발현시키는 형질변환된 숙주 세포를 배양하여, 당단백질 호르몬 유사체를 만들고, 이를 회수한 후에, 당단백질 호르몬에 대한 정제를 위한 공지의 과정에 따라 정제할 수 있다. 생산된 당단백질 호르몬의 양은 실시예 1에서 설명하는 샌드위치 면역검사 방법과 같은 방법으로 정량화한다. 또한, 본 발명의 당단백질 호르몬 유사체의 친화력 및 생물학적 활성을 결정하는 검사 예를 들면, 실시예 1에서 설명하는 것과 같은 방사능 리간드 수용체 및 시그날 변환 검사(예를 들면, cAMP 축적을 유도하기 위해 수용체에 결합되는 능력을 측정)등이 포함된다.
본 발명에 따른 당단백질 호르몬 유사체는 몇 가지 치료요법적 용도를 가진다. hFSH 유사체를 이용하여 암컷에서 배란을 유도하는 조제물에서 난포 배란을 유도한다. hLH 및 hCG 유사체를 이용하여 발생이 개시된 난포 배란을 유도한다. 이들 유사체를 이용하여 수컷에서 고환 기능을 유도한다. 또한, 본 발명에 따른 당단백질 호르몬 유사체를 이뮤노겐으로 이용하여, 수정률을 제한하는 항혈청을 유도하는데 예를 들면, 피임 백신이 된다. 역으로, 당단백질 호르몬 유사체에 대한 길항 유사체 또는 항체를 이용하여 수정율을 증가시키는데 이용되는데, 다낭성 난소 질환을 가지는 일부 여성에서 hLH 수준이 과도한 것으로 나타났다.
안정성이 개선되고, 또한, 본 발명의 유사체와 같이 당단백질 호르몬 수용체 및 호르몬 활성에 대한 친화력과 같은 생물학적 활성 및 기능을 보유하는 당단백질 호르몬 호르몬 유사체가 상당히 유용하다. 본 발명의 유사체는 특이적인 치료요법적 목적에 유용할 뿐만 아니라 이와 같은 유전자는 용액에 기능상의 우수한 안정성을 제공하고, 높은 온도, 요소와 같은 단백질 변성제에 의한 변성에 저항성을 제공 한다. 이와 같은 안정성으로 인하여, 본 발명의 유사체는 in vivo에서 개선된 반감기를 가진다.
본 발명의 당단백질 호르몬 유사체는 원하는 목적을 얻기 위한 임의 수단을 이용하여 이를 필요로 하는 환자에 투여하는 것이다. 예를 들면, 피하, 정맥, 경피, 근육내, 복막내, 비강내, 구강, 경피 또는 볼 경로등을 포함하는 여러 가지 다른 장관외 경로를 통하여 투여할 수 있다. 장관외 투여는 볼을 통한 주사 또는 시간을 두고 점진적으로 주입하는 것이 될 수 있다.
아밀로드 또는 아밀로드와 유사한 침착물과 연관된 질환을 치료, 예방 또는 억제하는 일반적인 섭생으로는 수개월 내지 수년간을 두고 단일 또는 다중 약량으로 된 효과량을 투여하는 것으로 구성된다.
투여되는 약량은 환자의 나이, 성별, 건강, 체중 및 현재 치료중인 질병의 종류 및 치료 빈도, 원하는 효과등에 따라 달라질 것이라고 인지할 수 있을 것이다. 각 치료에 필요한 총 약량을 다중 약량 또는 단일 약량으로 투여할 수 있다. "효과량"이란, 원하는 목적을 이룰 수 있는 당단백질 호르몬 유사체의 농도를 말한다. 이와 같은 농도는 당업자가 결정할 수 있을 것이다.
장관외 투여를 위한 조제물에는 멸균 수용성 또는 비-수용성 용액, 현탁액, 에멸젼등을 포함하는데, 여기에는 당분야에 공지된 보조 물질 또는 부형제등을 포함한다.
본 발명의 당단백질 호르몬 유사체로 구성된 제약학적 조성물에는 모든 조성물이 포함되는데, 원하는 목적을 이루는데 효과적인 양으로 포함된 유사체가 포함 된다. EH한, 제약학적 조성물에는 제약학적으로 이용되는 조제물에 활성 화합물을 처리하는 부형제 및 보조제등으로 구성된 임의 적절한 제약학적으로 수용 가능한 담체를 포함한다. 적절한 제약학적으로 수용 가능한 운반체는 당분야에 공지된 것으로 이는 Alfonso Gennaro, Ed., Remington's Pharmaceutical Sciences, 18th Edition, Mack Publishing Co.(Easton, PA, 1990)에서 설명하는 것이다. 제약학적으로 수용 가능한 운반체는 투여 방법, 당단백질 호르몬 유사체의 용해도, 안정성등에 따라 선택할 수 있다. 예를 들면, 정맥 투여를 위한 조제물에는 완충액, 희석제, 임의 다른 첨가제를 포함하는 멸균 수용액을 포함한다.
장관외 투여를 위한 임의 적절한 조제물에는 물에 용해되는 염과 같은 물에 용해되는 형으로 활성 화합물의 수용액을 포함한다. 또한, 적절한 오일성 주사용 현탁액과 같은 활성 화합물 현탁액을 투여할 수 있다. 적절한 친지성 용매 또는 운반체에는 참깨 오일과 같은 지방 오일 또는 에틸 올레이트 또는 트리글리세리드와 같은 합성 지방산 에스테르가 포함된다. 현탁액의 점성도를 증가시키는 물질을 포함하는 수용성 주사 현탁액에는 카르복시메틸 셀룰로오즈 나트륨, 솔비톨, 덱스트린등이 포함된다. 선택적으로는 현탁액에는 안정화제가 포함된다.
다음의 실시예는 일반적인 설명을 하면서, 동시에 본 발명을 이에 한정시키는 것이 아니라는 것을 인지할 것이다.
이황화결합에 의한 소단위간 교차결합에 대한 기준에 따르면, 표 1B에 제공하는 데이터에서는 자유 시스테인이 -소단위 잔기 위치에서 만들어지고, -소단위 Tyr37이 시스테인에 의해 치환되는 경우에 시스테인 노트사이에 소단위간 이황화결합에 의해 안정화된 hCG 유사체를 준비하는 것이 가능하다는 것이다. 이는 hCG -소단위의 유사체(Tyr37는 시스테인으로 치환됨) 및 사람의 -소단위 유사체(Cys7이 Ser으로 치환됨)를 만들면 된다. 이와 같은 후자의 경우에는 아미노산 Cys7 및 Cys31사이에 -소단위에서 정상적으로 발견되는 이황화결합이 파괴되고, 37위치에서 도입되는 -소단위 시스테인과 이황화결합을 형성하는데 이용할 수 있는 자유 -소단위 시스테인이 남아있다. 이와 같은 소단위 구조 각각을 배양된 포유류 세포에서 발현되는 경우에, 잔기 31에서 -소단위의 시스테인 및 잔기 37에 있는 -소단위의 시스테인은 소단위간 이황화결합을 형성한다.
이황화결합을 형성하면 이종이량체의 안정성이 급격하게 증가된다. hCG와는 달리, 교차결합된 이종이량체는 요소 또는 낮은 pH에서도 해리되지 않는다. 그러나, 대부분의 항체에 의해 인지되는 hCG(31-37)의 LH 수용체에 결합하는 능력 및 시그날 변환을 유도하는 능력은 hCG의 것과 유사하다. 이는 이황화결합이 있어도 호르몬 기능을 파괴하지 않는다는 것을 보여주는 것이다.
-소단위에 있는 Cys7를 세린에 대한 코돈으로 변화시키는 것은 발현 벡터(pKBM-hCG)를 이용하여 실행하는데(Campbell et al (1991)), 이 벡터에는 hCG -소단위 cDNA을 포함한다. pKBM 벡터는 pUC 유도 벡터(Yanisch-Perron et al, 1985)로써, 폴리링커가 XhoI 부위로 치환된 것으로 pKBM 및 발현 벡터 pSVL(Pharmacia, Piscataway, NJ)사이에 cDNA 삽입체를 전달하는 능력이 있다. 한 개의 -소단위 유전자만이 존재하기 때문에, hCG, hLH, hFSH, hTSH의 -소단위에 대한 cDNA는 동일한 코돈을 가지고, 이와 같은 발현 벡터는 pKBM-로 부른다. 도 40에서 볼 수 있는 것과 같이, pKBM-에는 -소단위 코딩 서열의 5' XhoI 엔도뉴클레아제 제한 부위 및 아미노산 9-11에 대한 코돈 부근에 있는 유일한 BsmI 엔도뉴클레아제 부위를 포함한다. 폴리메라제 사슬 연장(PCR) 프라이머(Oligo425 and Oligo847, 표 5)는 이 부분을 묶어 두고, Cys7에 대한 코돈을 Ser으로 바꾸고, 돌연변이 구조를 확인할 수 있는데 이용되는 새로운 엔도뉴클레아제 제한 부위(BspEI)를 만들 수 있도록 고안되었다. 이와 같은 프라이머와 주형으로 pSVL-hCG(Campbell et al, 1991)을 이용한 PCR 생성물은 XhoI 및 BsmI으로 절단하고, 당분야에 공지된 기술을 이용하여, pKBM-의 유일한 XhoI-BsmI 부위에 서브클론닝한다(Maniatis et al, 1989).
BspEI 엔도뉴클레아제 제한 부위를 포함하는 재조합 플라스미드 서열은 PCR을 이용한 돌연변이 발생에 의해 변화된 부분에서 디데옥시 방법(Maniatis et al, 1989)으로 결정한다. 이 벡터(pKBM-C7S)는 도 3에 나타낸 아미노산 서열을 가지는 단백질을 인코드한다. 변형된 -소단위 cDNA를 pKBM 벡터로부터 XhoI 및 BamHI 절단에 의해 제거하고, pSVL의 XhoI-BamHI 부위에 서브클론하여, pSVL-C7S를 만드는데, 이 과정으로 C7S가 COS-7 세포에서 발현되도록 한다. 코딩 서열은 Promega(Madison, WI)에서 수득한 또 다른 발현 벡터(pCI)의 XhoI-BamHI 부위에 삽입하는데, 이때 상기 벡터는 이 구조 및 관련 구조의 서브클로닝을 위해 변형시킨 것이다. pCI 변형은 이의 BamHI 부위를 제거하고, 이 폴리링커(가령, 제한효소 NheI-NotI)를 다음의 엔도뉴클레아제 제한 부위를 가지는 새로운 폴리링커(NheI-XhoI-EcoRI-MluI-KpnI-XbaI-SalI-BamHI)로 대체한다. 이로써 pKBM 및 pSVL 계 벡터에서 만든 구조를 pCI계 벡터에 서브클로닝하는데, 그 방법은 pKBM 또는 pSVL에서 원하는 코딩 부분을 포함하는 XhoI-BamHI 단편을 제거하고, 이를 XhoI 및 BamHI으로 절단한 pCI에 결찰시켜 만든다. 또한, pCI계 벡터에 대한 언급은 바로 위에서 설명한 변형된 pCI 벡터를 말하는 것이다. pSVL의 -소단위 코딩 부분을 pCI에 옮겨, 각각 pCI- 및 pCI-C7S를 만들고, 이는 배양된 세포에서 발현을 시켜 이루어진다.
Cys7 및 Cys31사이에 이황화결합을 형성하는 능력이 부족한 -소단위 유사체를 준비하기 위해 세린을 시스테인으로 치환시키는 것을 이용할 필요는 없다. 알라닌을 이용하여, 이 결합을 파괴시키고(Furuhashi et al, 1994), 이는 임의 다른 아미노산을 이용하여 Cys7를 치환시키면, Cys7-Cys31 이황화결합을 파괴시킬 수 있다.
Tyr37에 대한 코돈을 Cys에 대한 코드로 대체시켜 hCG -소단위 코딩 서열을 변형시키는 것은 pUC-계 벡터인 pKBM-hCG'(Campbell et al, 1991)에 결합된 hCG -cDNA에 카세트 돌연변이 형성에 의해 이루어진다. 이와 같은 구조에는 아미노산 35-36 및 45-46에 대한 코돈에서 유일한 NgoMI 및 PstI 제한 효소부위를 포함한다. NgoMI 및 PstI 부위에 작은 DNA 조작을 Oligo845 및 Oligo874를 어닐링하여 만들어진 카세트로 대체하여 돌연변이 코돈을 도입시킨다(표 5). 이로써 돌연변이를 포함하는 플라스미드를 확인하는데 이용되는 PmlI 엔도뉴클레아제 제한효소 부위를 도입시키게 된다.
이와 같은 카세트를 pKBM-hCG'(Campbell et al, 1991)로 서브클로닝하는 것은 당분야에 공지된 표준 방법(Maniatis et al, 1989)으로 이행하고, 돌연변이된 부분의 워하는 서열은 디데옥시 서열화 방법으로 확인한다. pKBM가 발현 벡터가 아니기 때문에, 이는 pSVL에 서브클론시켜, 포유류 세포에서 이와 같은 -소단위 구조체가 발현될 수 있도록 한다. 이는 pKBM-hCG'를 XhoI 및 BamHI로 절단하고, 이는 pSVL를 XhoI 및 BamHI로 절단한 후에 남아있는 큰 단편에 결찰시켜, 발현 벡터, pSVL-hCG'Y37C를 만들어서 이루어진다. pSVL-hCG' 및 pSVL-hCG'Y37C에 의해 인코드되는 아미노산 서열은 도 4에 나타내었다. XhoI 및 BamHI 부위에서 변형된 pCI 벡터에 서브클론시킨다.
이와 같은 코딩 서열을 준비하는 것은 통상적인 도구를 이용하여 표준 DNA 합성 과정에 의해 이루어질 수 있다. 이와 같은 과정을 이용하여 설명된 것과 같이 긴 올리고뉴클레오티드를 만든다(Campbell et al, 1992). DNA 코딩 서열을 합성 올리고뉴클레오티드 구조 및합성 cDNA 유전자를 만드는데 전문 업체로부터 구입할 수 있다. 이와 같은 업체로는 Midland Certified Reagent Company, Midland, Texas, Genosys Biotechnologies, Inc., The Woodlands, Texas등이 포함된다. 이들 소단위의 발현은 배양된 포유류 세포(가령, COS-7 세포)에서 몇 가지 시판되는 벡터 가령, pSVL(Pharmacia, Piscataway, NJ), pCI(Promega, Madison, WI)를 이용하여 공지의 방법(Campbell et al, 1991)에 따라 이루어진다.
COS 세포에서 공지된 방법에 따라, pSVL- 및 pSVL-hCG', pSVL-C7S 및 pSVL-hCG'Y37C, pCI- 및 pCI-hCG', pCI-C7S 및 pCI-hCG'Y37C를 공동발현시킨다(Campbell et al, 1991). COS-7 세포로 트랜스펙션시키는 것은 설명된 것과 같이 표준 칼슘 침전 방법(Kriegler, 1990)으로 실시한다. COS-7 세포는 ATCC, Rockville, MD에서 구하였다. 트랜스펙션후, 세포 배양 배지를 제거하고, 배지는 무혈청 DMEM 배지로 교환한다. 세포는 추가 3일간 배양하여, 분비된 생성물이 배양 배지에 축적되도록 한다. 배지는 원심분리하여, 세포 찌꺼기 및 다른 침전물을 제거하고, 상청액은 투석 주머니에 넣고, 흡습성 분말 상에 주머니를 위치시켜, 고분자향 성분을 농축시킨다(Aquacide, Calbiochem, La Jolla, CA).
배양 배지로 분비되는 hCG 및 교차결합된 hCG는 샌드위치 면역검사(Moyle et al, 1982)를 이용하여 정량화하는데, 포집 및 감지를 위해 각 항체 A113 및 125I- B105를 이용하고, 뇨에서 정제된 hCG는 기준으로 삼는다. 이 검사에서 항-hCG -소단위 항체 A113(1㎍ in 0.05㎖)는 한 시간동안 37℃에서 미량적정 플레이트 표면에 흡수시킨다. 비-흡착된 항체를 제거하고, 각 웰은 0.9% NaCl, 1㎎ 소 혈청 알부민/㎖을 포함하는 용액에 배양하여, 남아있는 단백질 흡수 부위를 차단한다. 3일간 트랜스펙션된 세포의 배양 배지 몇 방울(0.05㎖)을 웰에 첨가하고, hCG 또는 교차결합된 hCG 유사체는 1시간동안 37℃에서 흡착된 항체에 결합하도록 한다. 결합안된 호르몬 또는 호르몬 유사체를 제거하고, 웰은 0.9% NaCl 용액으로 제거하고, 포집된 분석물은 방사능요도드화된 항-hCG -소단위 항체 125I-B105(아래에서 설명하는 것과 같은)과 반응하도록 한다. hCG 또는 교차결합된 hCG 유사체에 결합되지 않는 125I-B105는 흡출시키고, 미량적정 웰에 결합된 방사능라벨된 것은 -카운터를 이용하여 결정한다. 이 검사로 바로 0.1ng hCG가 감지되었다. 이 검사에 대해 특정 항체를 이용할 필요가 없고, 잘 쓰는 시판되는 항체가 몇 종류 있다. 대부분 항-hCG -소단위 항체 및 임의 항-hCG - 소단위 항체는 hCG 및 자유 hCG -소단위에 대한 친화력이 108 M-1 이상되는 것이면 충분하다. 후자의 경우에는 ZMCG13, ZMCG7(Pierce, 3747 North Meridian Road, Rockford, IL)가 있다.
hCG 및 hFSH 항체의 방사능요오드화반응은 Iodo-Gen(Pierce Chemical Co, Rockford, IL)으로 실시한다. 이 과정에서, 1.5㎍ Iodo-Gen/50㎕ 아세톤을 0.75㎖ 유체를 포함할 수 있는 작은 유리 관에 넣고, 아세톤은 기화되도록 한다. 이를 방 치하면, Iodo-Gen 잔기가 튜브의 바닥을 피복하게 된다. 후에, 10㎍ B105를 첨가하고, 튜브는 플라스틱 뚜껑으로 막고, 250-500Ci Na125I/0.2 M 인산나트륨 완충액(pH7.2)을 포함하는 5㎕를 뚜껑을 통하여 마이크로주사기로 용액을 주사하여 첨가한다. 24시간 후에, 0.1㎖ 0.9% NaCl 용액/0.02M 인산나트륨 완충액(pH 7.2)을 첨가하고, 혼합물은 기화시키고, 2㎖ BioGel P6DG 컬럼(BioRad, Richmond, CA)에 적하시킨다. 자유 요오드 및 요오드화된 단백질은 겔 여과에 의해 분리한다. 요오드화반응에 이용되는 Na125I의 양은 방사능요오드화반응후에 이들의 기능을 보유하는 단백질의 능력에 따라 달라진다. 항체 및 hCG는 특이 활성이 50CI/㎍이 되도록 방사능요오드화시키고, 반면에 hFSH는 특이활성이 10-25Ci/㎍이 되도록 한다.
표 6에서는 교차결합된 hCG 유사체 형성을 파괴시키지 않는 돌연변이에 eoog 설명한다. 코딩 서열을 포함하는 pSVL 또는 코딩 서열을 포함하는 pCI로 트랜스펙션된 세포는 상당량의 교차결합된 유사체 및 hCG를 생산한다.
hCG 및 hCG(31-37)의 양은 hCG 표준에 대해 샌드위치 면역검사로 측정하는데, 이때 포집용으로는 -소단위(A113)에 대한 항체를 그리고 감지용으로는 -소단위(B105)에 대한 방사능요오드화된 항체를 이용하였다.
항체 A113 및 B105를 샌드위치 면역검사에 이용하여, 교차결합된 hCG 유사체 생산을 결정하는데, 이 이유는 이들이 돌연변이부위에서 떨어진 것으로 보이는 호르몬의 부위를 인지하기 때문이다(Cosowsky et al, 1995; Moyle et al, 1995). hCG(31-37) 유사체는 hCG와 같이 A407(도 5)(이 항체는 C7S 돌연변이의 부위, -소단위의 N-말단의 일부를 포함하는 것으로 보이는 에피토프를 인지)에 결합하지 않는다(Moyle et al, 1995). 항체 A407는 Dr. Robert E. Canfield, Columbia University, New York, NY에서 구하였다. 그러나, A407는 hCG-수용체 복합체를 인지하는 것으로 보이기 때문에(Moyle et al, 1995), 호르몬 모양에서 이와 같은 작은 변화로 교차결합된 hCG 유사체의 생물학적 활성을 간섭할 것으로는 보이지 않는다.
hCG(31-37) 및 다른 교차결합된 유사체의 생물학적 활성은 방사능리간드 수용체 및 시그날 변환 검사에서 모니터한다. 이와 같이 LH 수용체 cDNA를 코딩하는 유전자에 의해 트랜스펙션되고, 이들의 표면에 기능을 하는 LH 수용체를 발현시키는 CHO 세포를 이용한다. CHO 세포는 ATCC, Rockville, MD에서 구하였다. 쥐 LH 수용체 cDNA는 Bernard et al, 1990에서 설명하는 것과 같이 폴리메라제 사슬 반응을 이용한 쥐 난소 라이브러리에서 구하였다. 이와 같은 LH 수용체 발현 세 포를 편리함을 위해 이용하고, 방사능리간드 수용체 검사는 LH 수용체를 발현시키는 다른 조직으로 실행한다. 여기에는 어른 쥐 고환의 균질물 또는 임신한 암컷 혈청 고나도트로핀 및 hCG를 주사한 성적으로 미숙한 쥐에서 얻은 난소 균질물이 포함된다(이들은 모두 Sigma, St. Louis, MO에서 얻을 수 있다). 높은 친화력을 가지는 hCG에 결합하는 난소 조제물을 생산하기 위해, 21일 된 암컷 쥐에 피하 주사로 50i.u. 임신한 암컷 혈청 고나도트로핀을 제공한다. 약 65시간 뒤애, 피하로 25 i.u. hCG를 제공한다. 몇 일 뒤에, 이들을 죽이고, 이들의 난소를 균질화시켜, 난소의 1/12에 상응하는 균질물 양을 각 검사 튜브에 넣는다. 쥐 LH 수용체를 발현시키는 세포는 New England Nuclear, Boston, MA에서 구입한 또는 초기에 설명한 것과 같이 준비된 추적물질인 방사능요오드화된 hCG에 결합한다. 이들은 또한 Sigma Co., St. Louis, MO에서 구입한 라벨안된 hCG 호르몬에 결합한다. LH 수용체를 발현시키는 CHO 세포는 10-30분간 37℃에서 hCG 처리에 반응하여, cAMP를 합성한다. 생산된 cAMP는 cAMP에 특이적인 방사능면역검사(RIA)에 의해 측정한다(Brooker et al, 1979).
hCG의 -소단위 및 -소단위 시스테인 노트에 있는 잔기사에에 소단위간 이황화결합을 추가하여도 교차결합된 이종이량쳉가 LH 수용체에 결합하는 능력 또는 cAMP 축적 반응을 유도하는 능력을 파괴시키지는 않는다. 따라서, hCG 및 hCG3(31-37)는 LH 수용체를 발현시키는 CHO 세포에 125I-hCG가 결합하는 것을 차단할 수 있다(도 6). hCG 및 hCG(31-37)는 이들 동일한 세포에서 cAMP 축적을 유도할 수 있다(도 7). 이로써, 이와 같은 소단위간 이황화결합이 존재하더라도 hCG의 전반적인 기능 활성을 파괴시키지 않는다는 것을 알 수 있다.
소단위간 이황화결합이 존재함으로써 hCG(31-37에 hCG를 파괴시키는 산, 요소 및 열로 처리하는 경우에 저항성을 제공한다. 이는 도 8 및 9에 있는 데이터로 볼 수 있다. 도 8에서는 포집용을 위한 A113 항체 및 감지를 위해 125I-B112를 이용하는 샌드위치 면역검사에서 모니터된 이종이량체의 안정성에서 높은 온도에서의 영향을 설명한다. B105 및 B112는 제 3 -소단위 루프의 턴(trun) 주변에 있는 잔기가 관여하는 겹쳐지는 에피토프에 결합하는데(Moyle et al, 1990; Cosowsky et al, 1995), 이때 루프의 위치는 hCG(31-37)의 - 또는 -소단위에 있는 돌연변이 위치로부터 떨어져 있다. 이 검사에서, hCG 및 hCG(31-37)는 최고 20분까지 다양한 간격으로 85℃의 온도에 노출시킨다. hCG의 활성은 실제 7-8분경에 파괴되지만, 20분 배양후에도 교차결합된 유사체 활성의 적어도 75%가 남아있다(도 8). 이와 같은 샌드위치 면역검사는 이량체-특이적이기 때문에, hCG 활성의 손상은 소의 해리로 인한 것으로 보여지는데, 이 과정은 소단위산 이황화결합이 존재함으로써 방지할 수 있다.
고농도의 요소에 고나도트로핀을 배양하면 소단위 해리가 촉진된다는 것은 공지된 바이다(Pierce et al, 1981). 따라서, hCG를 8M 요소 존재하에 배양시켰을 경우에, 이는 소단위로 해리되고, 이와 같은 현상은 웨스턴 블랏팅으로 즉각 감지된다(도 9). hCG -소단위 및 -소단위를 인코드하는 자유 -소단위를 배양 배지 로 분지한다. 이는 -소단위 특이적인 그리고 -소단위 특이적인 항체를 이용하는 샌드위치 면역검사에 의해 바로 구별할 수 있다. 웨스턴 블랏에서
-이종이량체 및 자유 -소단위는 크기로 구별할 수 있다. 따라서, 폴리아크릴아미드 겔 전기영동을 이용하여 분리하고, 웨스턴 블랏에서 이들을 감지하여 배양 배지에서 상대적인 hCG 및 자유 -소단위의 양을 모니터하는 것이 가능하다. 도 9에서 볼 수 있는 것과 같이 hCG 및 자유 hCG -소단위에 결합하는 방사능요오드화된 단클론 항체를 이용하여 실행한다. hCG의 -소단위 및 -소단위를 발현시키는 세포의 배양 배지를 분석하면, 이종이량체(상측밴드) 및 자유-소단위(아래 밴드)가 존재한다는 것을 알 수 있다. 8M 요소로 배양 배지를 처리하면, 이종이량체는 이의 소단위로 해리된다. 결과적으로 상측 밴드가 사라진다. 요소는 소단위에서 이황화결합으로 인하여 소단위간 교차결합된 이종이량체인 hCG(31-37)의 해리를 촉진시키지 않고, 이종이량체에 상응하는 밴드는 그대로 남아있다(도 9).
시트-벨트는 hCG의 수용체 결합 활성에 영향을 주는 것으로 알려져 있다 (Campbell et al, 1991; Moyle et al, 1994; Han et al, 1996). hCG -소단위 아미노산 잔기 101-109를 이들의 hFSH 해당부분(가령, hFSH -소단위 잔기 95-103)으로 치환하는 경우에 이의 LH 활성에는 손상을 주지 않고 유사체의 FSH 활성만 급격 하게 증가된다(Moyle et al, 1994; Han et al, 1996). 또한, 이와 같은 치환으로 hCG의 TSH 활성이 강화되나, 이들은 hTSH에서 특이적으로 발견되는 임의 잔기를 도입하지않는 경우에도 해당된다(Campbell et al, 1997). 관련된 다중 기능의 유사체의 활성에 소단위간 이황화결합의 영향을 연구한 것에 따르면, 어떻게 특이적인 이황화결합이 루트로핀, 폴리트로핀, 티로트로핀의 활성에 영향을 주는지를 보여준다. 이와 같은 실시예는 시스테인 노트간에 있는 소단위간 이황화결합이 hCG 유사체(CFC101-114)의 LH 및 FSH 활성에 영향을 주는 지를 설명하는데, 이때 hCG -소단위 잔기 101-114는 이들의 hFSH 짝(가령, hFSH -소단위 잔기 95-108)로 대체된다.
CFC101-114(31-37)를 발현시킬며면 C7S 및 CFC'101-114Y37C를 인코드하는 벡터로 세포를 트랜스펙션시켜야 한다. 실시예 1에서는 -소단위의 변형에 대해 설명하였다. CFC101-114 -소단위 전구물질의 DNA 서열을 이용하여, CFC101-114'Y37C를 만드는데, 이는 hCG -소단위 잔기 1-100, hFSH -소단위 잔기 95-108 및 hCG -소단위 잔기 115-145가 차례로 연결된 것을 인코드한다. 이들의 통상 SstII 부위에 두 개의 hCG/hFSH -소단위 키메라의 코딩 서열을 복합시키면, 이를 만들 수 있다(도 41-43). 시그날 서열 및 pSVL-CFC101-114'의 잔기 1-103에 대한 코돈을 포함하는 pSVL-CFC101-106'의 XhoI-SstII 단편을 pSVL-CFC94-114'의 XhoI-BamHI의 부위로 서브클로닝한다. 이는 pSVL-CFC101-114'에서 발견되는 hFSH -소단위 잔기 88-94에 대한 코돈은 이들의 -소단위 동사체(가령, 잔기 94-100)로 대체되고, 이들은 BglII 부위로 도입된다. 각 이와 같은 코딩 벡터는 다음에 설명하는 분자의 3'절반에 있는 코딩을 변형시켜 hCG -소단위 cDNA에서 유도하였다.
pSVL-CFC94-114'는 pSVL-CFC94-106'의 PCR 변형에 의해 만들 수 있는데, 이는 hCG -소단위 잔기 1-93, hFSH -소단위 잔기 88-100, hCG -소단위 잔기 107-145가 차례로 코딩된 벡터이다. pSVL-CFC94-114'를 만드는 처음 단계는 SOEing PCR 돌연변이 발생에 의해 pSVL-CFC' 94-106를 만드는 것이다(Ho et al, 1989). 프라이머로 Oligo508 및 Oligo368(표 5)와 주형으로 pSVL-hCG'(Campbell et al, 1991)을 이용한 PCR 반응으로 CFC94-106- 소단위 코돈 101-145, hCG -소단위 종료 코돈, 3-해독안된 부분, BamHI 엔도뉴클레아제 제한효소 부위, pSVL 벡터의 일부분, BamHI 부위의 3'서열을 포함한다. Oligoo510 및 Oligo365(표 5)을 이용한 제 2 PCR 반응으로 XhoI 부위의 5' pSVL 서열, pSVL-hCG(Campbell et al, 1991)의 5'해독안된 부분, hCG -소단위 시그날 서열에 대한 20 코돈, CFC94-106-소단위 코돈 1-107을 포함하는 생성물을 제공한다. CFC94-106-소단위 코돈 101-107을 포함하는 이와 같은 PCR 생성물의 일부분은 "SOEing PCR"동안에 오버랩 연장하는데 상보적이고, 필수적인 것이다. 이와 같은 두 개 PCR 생성물은 Oligo363 및 Oligo364(표 5)와 혼합하고, 제 3 PCR 반응에서 증폭시켜, 각각 3' 및 5' 말단 부 근에 XhoI 및 BamHI 제한효소 부위를 가지는 CFC94-106 - 소단위의 전체 길이 서열을 인코드하는 PCR 생성물을 제공한다. 잔기 102-104에 대한 코돈에서 SstII 부위를 포함하는 이와 같은 PCR 생성물은 pSVL의 XhoI 및 BamHI 부위에 클론시켜, pSVL--CFC94-106'를 만든다. 코딩 부분의 서열은 디데옥시 서열화 방법으로 확인하였다.
pSVL-CFC94-114'-소단위를 만드는 최종 단계는 Oligo596 및 Oligo368 (표 5) 프라이머 및 pSVL-hCG' 주형을 이용하여 PCR을 함으로써, 각각 5' 및 3'말단 부근에 SstII 및 BamHI 위치가 있는 생성물을 만드는 것이다. 이들 효소로 처리하였을 경우에, hFSH -소단위 잔기 97-108의 코돈 및 hCG -소단위 잔기 115-145 코돈을 차례로 포함하는 DNA 단편을 만들 수 있다. 이는 pSVL-CFC94-106'의 유일한 SstII - BamHI 부위에 서브클론하여, pSVL-CFC94-114'를 만들고, PCR 동안에 증폭된 서열은 디데옥시 서열화 방법으로 확인한다.
pSVL-CFC101-106'를 준비하는 것은 잔기 114에 절두된 hCG -소단위 유사체를 인코드하고, 발린 코드에 Gly102이 대체된 벡터 pMB135를 이용하여 시작한다. pMB135는 Oligo435 및 Oligo436(표 5)를 어닐링하고, 3' 말단을 효소적으로 채워 PvuII 및 SstI 부위를 포함하는 이중 가닥 카세트를 만들어서 준비한다. 후자는 3' 종료 코돈이 된다. 이 카세트에는 hCG -소단위 잔기 87-101, 발린, hCG -소단위 잔기 103-114가 차례로 인코드되어 있고, 코돈 94-95에는 BglII의 제한효소 부위가 포함되어 있다. 이는 pSVL-hCG'의 PvuII-SstI 부위로 서브클론하고, PvuII 및 SstI 부위에 서열은 디데옥시 서열화 방법에 의해 확인한다. pMB135는 PCR 반응에 주형으로 이용하고, 프라이머는 Oligo562 및 Oligo365(표 5)를 이용하여, XhoI 및 SstII로 절단하였을 경우에, PCR 생성물은 hCG -소단위 cDNA 해독안된 부분 및 시그날 서열, hCG -소단위 코돈 1-100, hFSH -소단위 코돈 95-98을 차례로 포함한다. 이와 같은 PCR 생성물은 pSVL-CFC94-106'의 XhoI-SstII 부위에 클론하여, pSVL-CFC101-106'를 만들고, 이 서열은 디데옥시 서열화 방법을 이용하여 결정한다.
pSVL-CFC101-114'를 만드는데 이와 같은 방법을 취하는 것이 반드시 필수적인 것은 아니다. 이와 같은 단계는 사실적인 이유로 이용되었다. 다른 실험동안에 다양한 중간 생성 벡터를 만들 수 있고, 이는 CFC101-114'를 인코드하는 벡터를 준비하는데 이용된다.
플라스미드 pSVL-CFC101-114'Y37C는 Y37C 돌연변이을 인코드하는 pSVL-hCG'Y37C의 5' 절반부분과 hFSH -소단위 아미노산 95-108을 인코드하는 pSVL-CFC101-114'의 3'절반부분을 복합하여 만든다. pSVL-hCG'Y37C를 XhoI 및 Bsu36I으로 절단하여 얻은 작은 단편을 동일한 효소로 pSVL-CFC101-114'를 절단하여 만든 큰 단편에 결찰시켜 얻을 수 있다. 이는 시그날 서열에 대한 코드 및 CFC101-114'의 아미노산 1-54에 대한 코든이 hCG'Y37C의 것으로 대체되어, 이와 같은 변화로 Tyr37를 시스테인으로 치환되게 된다. XhoI-BamHI 단편을 변형된 pCI 구조 의 XhoI-BamHI 부위로 서브클로닝하면, pCI-CFC101-114'Y37C로 명명한 구조를 유도한다. 도 10에는 CFC101-114' 및 CFC101-114'Y37C의 아미노산 서열을 설명한다.
실시예 1에서 설명하는 방법을 이용하여, COS-7 세포에서 pSVL- 및 pSVL-CFC101-114; pSVL-C7S 및 pSVL-CFC101-114Y37C; pCI- 및 pCI-CFC101-114; pCI-C7S 및 pCI-CFC101-114Y37C을 공동 발현시켜, CFC101-114 및 CFC101-114(31-37)가 생산된다. 농축된 배양 배지에 CFC101-114 및 교차결합된 CFC101-114(31-37)는 샌드위치 면역검사(Moyle et al, 1982)를 이용하여, 정량화하는데, 이때 포집을 위해서는 항체 A113를 치용하여 hCG 감지를 위해서는 125I-B105 또는 125I-B112를 이용하는데, 이때 hCG는 표준으로 요소에서 정제한 것이다. 전의 것과 같이, 이 검사에 대해 특정 항체를 이용하는 것은 불필요하고, 시판되는 항체도 만족스러운 작업을 할 수 있다. FSH에 대한 높은 친화력을 가지는 대부분 항-hCG -소단위 항체 가령, A113 또는 항-hFSH 또는 hCG에 대해 높은 활성이 있는 항체를 이 검사에 이용할 수 있다. 그러나, 이와 같은 유사체에는 FSH 활성에 영향을 주는 시트-벨트 부분의 일부(가령, 11번째 및 12번째 -소단위 시스테인사이에 아미노산 잔기)에 hFSH 잔기를 포함하는데(Moyle et al, 1994), CFC101-114 유사체는 모든 항-hCG -소단위 항체에 의해 인지되지 않는다. 이는 hCG에는 결합하나 hFSH에는 결합하지 않는 항체인 A407(도 11)에서 볼 수 있다. 따라서, A407이 hCG 에 결합하는 반면에, CFC101-114 및 교차결합된 CFC101-114 유사체에 결합하는 능력이 적다. A407는 CFC101-114(31-37)에 결합하는 능력이 낮다.
CFC101-114는 hCG 및 자유 hCG -소단위에 대한 친화력이 108M-1 이상인 항-hCG -소단위에 의해 감지되는데, 단 FSH 잔기에 의해 점령되는 부분 부근에 -소단위에 있는 잔기를 인지하는 부분은 제외된다. 따라서, CFC101-114 및 유사체는 B111(hCG 잔기 108-114에 영향을 많이 받는 것으로 보이는 항체)(Cosowsky et al, 1995)에 의해 인지되지 않는다. 그럼에도불구하고, B105와 같은 hCG, hLH, 자유 hCG -소단위 및 자유 hLH -소단위를 인지하는 대부분 항체가 이 검사에 이용된다. 또한, B112와 같은 hCG 및 hCG -소단위를 인지하는 많은 항체를 이 검사에 이용할 수 있다. B105/B112 에피토프 부분은 쥐에 hCG의 대부분 항원성 부분중에 하나이고, 이 부분에 대한 항체는 실시예 1에서 명기한 것과 같은 상업적으로 이용할 수 있는 부분이다.
CFC101-114(31-37)에 있는 이황화결합이 존재하면, CFC101-114 것보다는 열적으로 안정성이 증가된다(도 12). 샌드위치 면역검사에서는 hCG 및 CFC101-114 활성이 85℃에서 7.5분 및 15분 동안 가열하면 거의 파괴된다. 그러나, 동일한 온도에서 20분후에도 실제 CFC101-114(31-37) 남아있다. 이는 이황화결합이 존재하면, 이 유사체의 안정성을 강화시킨다는 것을 보여준다. 11번째 및 12번째 -소단위 사이에 FSH 잔기를 가지는 이와 같은 유사체 및 다른 유사체가 TSH 활성을 가지기 때문에(Campbell et al, 1997), 이와 같은 이황화 결합은 FSH 및 TSH의 안정 성을 증가시키는 것으로 기대된다.
CFC101-114는 LH 수용체에서 시그날 변환을 자극시킬 수 있다. CFC101-114의 시스테인 노트간에 31-37 소단위간 이황화결합을 추가하여도 이 검사에서 이들의 활성이 감소되지 않는다(도 13). 따라서, CFC101-114 및 CFC101-114(31-37)는 LH 수용체를 발현할 수 있도록 조작한 CHO 세포를 이용한 검사에서 cAMP를 축적시키는 것을 자극하는데 있어서 동일한 높은 활성을 가진다. 따라서, 이와 같은 이황화결합의 존재는 루트로핀 활성을 가진 분자의 활성에는 영향을 주지 않는 것으로 보인다. 이들 분자를 안정화시키는 능력은 루트로핀에 유용한 치료요법적 활성을 제공하는 것으로 기대된다.
CFC101-114의 아미노산 서열이 hFSH 보다는 hCG의 것과 더 근접하기 때문에, CFC101-114(α31-β37)는 이 검사에서 활성이 거의 없는 것으로 알려진 hCG 보다는 FSH 활성을 더 많이 가진다. CFC101-114의 시스테인 노트간에 있는 31-37 소단위간 이황화결합을 추가하여도 FSH 수용체를 발현하는 CHO 세포에서 cAMP 축적을 자극시키는 능력에는 영향을 많이 주지 않는다(도 14). 따라서, 이와 같은 이황화결합이 존재하여도 폴리트로핀 활성을 가지는 분자의 능력에 음성적인 영향을 주는 것으로는 보이지 않고, 이들 분자를 안정화시키는 이 결합은 폴리트로핀에 유용한 치료요법적 성질을 부여하는 능력이 있는 것으로 기대된다.
hCG의 - 및 -소단위에 있는 잔기의 C 및 C 탄소원자 사이에 거리(표 1B)는 많은 다른 추가 이량체를 만드는 것이 가능하다는 것을 말해주는데, 이때 소단위는 한가지 이상의 이황화결합에 의해 묶여있다. -소단위 잔기 31과 -소단위 잔기 37 사이에 hCG 및 CFC101-114를 교차 연결시키면, 생성되는 유사체의 안정성을 강화시키고, 이들의 생물학적 활성에 최소한의 영향을 준다. 수용체 결합에 영향을 주는 것으로 이미 공지된 분자의 일부분에 이황화결합을 도입하는 경우에, 분자의 안정성 및 활성을 변화시키는 지를 알아보기 위해, hCG 및 CFC101-114의 -소단위 루프 2와 시트-벨트 사이에 이황화결합을 도입시켰다. 수용체와 상호작용하고, 시그날 변환을 유도하는 이들의 능력에 영향을 주는 이황화결합을 만드는데에는 치환이 필요하다. 이로써, 수용체 상호작용 또는 수용체 특이성에 관여하지 않는 호르몬의 일부분으로 이황화결합을 도입시키는 것이 엔도크린 활성을 높게 유지시키는데 더욱 바람직하다. 이들 두 가지 타입의 교차결합된 유사체가 이들의 면역학적 활성을 유지하고 있기 때문에, 이황화결합의 위치는 이뮤노겐을 고안하는데 그리 중요하지는 않다. 이와 같이 시그날 변환에 이황화결합의 영향으로 호르몬 길항제 또는 이뮤노겐을 고안하는데 유용하다.
-소단위 루프 2와 시트-벨트사이에 소단위간 이황화결합에 의해 안정화된 hCG 유사체를 준비하기 위해, -소단위 루프 2의 Lys51과 -소단위 시트-벨트의 Asp99를 시스테인으로 대체한다. -소단위간에 변환는 기존에 설명하지 않은 기존 벡터의 카세트 돌연변이에 관계한다. 따라서, 이와 같은 중간생성물 벡터의 구 조를 여기에서 설명한다(도 44).
pIBI31의 폴리링커(International Biotechnologies, Inc. (New Haven, CT)에서 구입한 클로닝 벡터)를 EcoRI-XhoI-NcoI-PacI-BamHI-EcoRI와 같은 제한 효소 부위를 가지는 폴리링커로 치환하여, pRM102라는 벡터를 만든다. pKBM-는 NcoI 및 BamHI로 절단하고, 이를 pRM102의 NcoI-BamHI 부위로 클론시켜, pRM116를 만들고, 따라서 pKBM-의 클로닝 동안에 도입되는 이의 5' 해독안된 리더 서열 및 원하지 않는 5' XbaI 부위를 제거한다. 따라서, pRM116에 있는 XbaI 부위만이 -소단위 아미노산 34-35에 대한 코돈에 상응한다. pRM116의 XbaI-BamHI 단편은 Oligo758 및 Oligo760(Table 5)로 -소단위 cDNA를 PCR하여 생성된 벡터의 XbaI-BamHI 단편으로 대체시켜, pRM117을 만든다. 이는 이 부분에서 원하지 않는 PstI 제한효소 부분이 제거되는 공정으로 -소단위 cDNA의 부분에서 발견되는 3'해독안된 부분을 제거한다. pRM17에 남아있는 유일한 PstI 부분은 잔기 83-85에 해당되는 코돈에 위치한다. Oligo730 및 Oligo839(Table 5)로 -소단위 cDNA를 PCR하여 생성된 생성물을 pRM117의 XbaI-PstI 부위로 클로닝하여, pMB507을 만든다. 이는 -소단위 코딩 서열 42-43 및 54-55로 BglII 및 SpeI를 도입시킨다. pMB507의 XhoI-BamHI 단편을 pSVL의 XhoI-BamHI 부위로 서브클로닝하여 pMB512를 만든다. BglII 및 SpeI 부위사이에 있는 pMB512 단편은 Oligo877 및 Oligo878(표 5)으로 대치하여, pMB561를 만든다. 최종적으로, pMB512의 BglII-SpeI 단편은 Oligo921 및 Oligo922 (표 5)를 어닐링하여 만든 카세트로 대체하여, pSVL-K51C(도 15)를 만든다. 이와 같은 전략에는 pSVL-K51C를 요구하지 않고, 이는 다른 실험동안에 만들어진 다양한 벡터 중간생성물을 이용하기 때문에 실제적인 이유로만 이용된다.
-소단위 유사체 hCG'D99C는 pSVL-hCG'를 주형으로 하고, Oligo368 및 Oligo925(표 5)를 프라이머로 하여 PCR 돌연변이 형성에 의해 만든다. Oligo368은 pSVL의 3' BamHI 엔도뉴클레아제 제한효소 부위에 상보적인 역 프라이머이다. Oligo925에는 원하는 돌연변이를 포함하고, BglII 부위를 만든다. PCR 생성물은 BglII 및 BamHI으로 절단하고, pSVL-CFC101-114'의 BglII - BamHI 부위로 서브클로닝한다. 이는 pSVL-CFC101-114'의 hFSH 코돈을 제거하고, Asp99를 시스테인으로 바뀐 것이다(도15).
플라스미드 pSVL-K51C 및 pSVL-hCG'D99C은 실시예 1에서 설명하는 것과 같은 COS-7 세포에서 공동 발현된다. hCG 및 hCG(51-99)는 포집용으로 -소단위(A113) 및 감지용으로 -소단위(B105)에 대한 방사능요오드화된 항체를 이용하여 hCG 표준에 대한 샌드위치 면역검사에서 측정한다. 이때, 이와 같은 특정 항체가 반드시 필요한 것은 아니다. 이종이량체에서 hCG -소단위를 인지하는 임의 항체 및 hCG 및 이의 자유 -소단위를 인지하는(108M-1 이상의 높은 친화력으로 인지) 임의 -소단위 항체를 이 검사에서 이용할 수 있다. 트랜스펙션된 COS-7세포에 의해 hCG 및 hCG(51-99)를 생산하면, 배양 세포 배지에 축적된 교차결합된 단백질 유사체를 축적하게 되는데, 이는 A113/125IB105 또는 A113/125IB112 샌드위치 면역검 사에 의해 바로 감지되고(표 7), 이로써 이황화결합을 도입하는데 필요한 돌연변이는 소단위 복합을 방해하지 않는다는 것을 보여준다.
실시예 1에서 제시한 방법을 이용하여 LH 수용체 결합 및 시그날 변환에 대해 hCG(51-99)의 생물학적 활성을 측정하였다. hCG(51-99)는 LH 수용체를 발현시키는 CHO 세포에서 125I-hCG가 결합하는 것을 저해하는 능력이 있으나, hCG의 능력의 5-10% 정도에 불과하다(도 16). 이황화결합에 의한 LH 수용체에 대한 친화력의 감소는 1) -소단위 잔기 Lys51이 시스테인으로 치환(예를 들면, 전하를 띈 아미노산이 중성 아미노산으로 치환); 2) -소단위 잔기 Asp99가 시스테인으로 치환(가령, 음전하를 띈 잔기가 중성 아미노산으로 치환); 3) 소단위간에 공유 결합이 존재하여 추가된 압박으로 인한 것이다. Asp99의 변형으로 hCG의 LH 활성이 감소되거나 제거된다는 것을 보여준다(Chen et al, 1991). 변형안된 -소단위(이때 Lys51은 시스테인으로 변형된 것(hCG(K51C-)이고) 및 -소단위(이 유사체는 Asp99가 hCG 및 (hCG(-99)와 함께 시스테인으로 치환된 것(hCG(-D99C))를 포함하는 hCG 유사체의 LH 수용체 결합 활성을 비교함으로써, 이황화결합에 의한 영 향과 시스테인 친환으로의 영향을 구별할 수 있다. 이와 같은 유사체로 -소단위 Lys51을 시스테인으로 치환하면, 이 유사체가 LH 수용체에 125I-hCG가 결합하는 것을 저해하는 능력에 실제 저해성 영향을 가진다는 것을 보여준다. hCG(51-99) 및 (hCG(-99))의 활성이 유사한데, 이는 -소단위 Asp99를 시스테인으로 치호나하는 것이 (hCG(51-99))의 대부분의 LH 수용체 결합 활성이 감소시킨다는 것을 설명한다. Lys51를 Ala으로 변화시키면, hCG의 활성이 또한 감소된다(도 18).
이와 같은 hCG 유사체가 시그날 변환(cAMP의 축적)을 자극시키는 능력도한 테스트하였다. -소단위 잔기 Lys51를 시스테인 또는 알라닌으로 치환하면, 호르몬이 cAMP를 축적시키는 능력을 거의 대부분 상실하게되는 원인이 된다(도 19 및 20). 이들 두 가지 소단위에 시스테인을 추가하여, hCG(51-99)를 만들면, -소단위 Lys51에 대해 한 개의 시스테인 치환만을 가지는 유사체와 비교하였을 때 상대적으로 상당량의 활성이 복원된다는 것이다(도 19). Asp99에서 -소단위 잔기를 시스테인으로 치환하는 경우에, LH 수용체의 시그날 변환에는 매우 작은 영향을 준다. 이로써 이황화결합은 hCG 유사체의 상대적인 효과를 감소시키고 이는 길항제를 만드는데 유익한 성질이 된다.
시트-벨트 및 -소단위 루프 2사이에 소단위간 이황화결합이 존재함으로써 hCG의 열적 안정성을 증가시킨다(도 8). 또한, 8M 요소존재하에 소단위가 해리되는 것을 예방한다(도 9). 이와 같은 관찰로 당단백질 호르몬의 안정성에 소단위간 이황화결합이 유익한 영향을 준다는 것을 확인하였다.
세 가지 주요 당단백질 호르몬 수용체와 모두 상호작용을 할 수 있는 능력을 가지는 당단백질 호르몬 호르몬 유사체인 CFC101-114의 시트-벨트와 -소단위 루프 2사이에 이황화결합을 만든다. 이는 LH 및 FSH 수용체와의 상호작용에서 단백질의 이 부분에 상대적으로 특징적인 영향을 준다.
CFC101-114'(51-99)(pSVL-CFC101-114'D99C) 생산에 필요한 -소단위 발현 벡터는 pSVL-CFC101-114' 카세트 돌연변이 생성에 의해 준비할 수 있다. 이 벡터에는 아미노산 95-96에 대한 코돈에 BglII 엔도뉴클레아제 제한 효소 부위 및 아미노산 102-104에 대한 코돈에 SstII 부위를 포함한다. pSVL-CFC101-114'D99C는 pSVL-CFC101-114'를 BglII 및 SstII으로 절단하고, 작은 단편은 Oligo924 및 Oligo923의 어닐링에 의해 수득된 합성 올리고뉴클레오티드 카세트로 대체하여 만든다(표 5). 이는 재조합 클론을 선택하는데 이용되는 BsrGI 부위에 도입된다. 생성 벡터 pSVL-CFC101-114'D99C에서 변화된 염기 서열은 디데옥시 서열 방법으로 확인하였다. 이 벡터에 의해 인코드되는 CFC101-114'(51-99)의 아미노산 서열은 도 21에 설명하고 있다.
COS 세포에서 pSVL-K51C 및 pSVL-CFC101-114'D99C의 공동 발현은 실시예 1에서 설명하는 것과 같이 실시한다. 이량체는 포집용으로는 A113를 이용하고, 감 지용으로는 방사능요오드화된 B112를 이용하고, 표준으로는 정제된 요소 hCG를 이용한 샌드위치 면역검사에서 측정한다. 다른 유사체의 경우와 같이, 배양 배지에서 CFC101-114(51-99)를 감지하는 이와 같은 특이적인 항체가 반드시 필수적인 것은 아니다. 이들 hCG 및 hFSH에 결합할 수 있는 대부분의 -소단위 항체는 포집용으로 이용된다. FSH로 변화되는 서열에 관련되는 잔기를 인지하는 항체를 제외하고는 hCG 및 자유 -소단위에 결합할 수 있는 대부분 항체를 감지용으로 이용하였다. 이용되지 못하는 항체를 예를 들면 B111(Cosowsky et al, 1995)이 된다.
hCG의 -소단위의 N-말단에 있는 결정부위를 인지하는 -소단위 단클론 항체인 A407(Moyle et al, 1995)는 거의 CFC101-114를 인지하지 못하고, hCG에 결합한다(도 5). 이는 수용체 결합 특이성을 조절하는데 관계하는 당단백질 호르몬 -소단위 및 -소단위의 전체적인 상호작용에서 시트-벨트의 영향때문인 것으로 보인다. -소단위 잔기 51과-소단위 잔기 99 사이에 이황화결합을 추가하여도 생성된 유사체가 A407에 의해 인지되게 할 수는 없다(도 11).
다른 이황화결합 교차결합된 유사체와 같이, CFC101-114(51-99)는 열 변성 검사에서 이들의 모 전구체(가령, CFC101-114 및 hCG)보다 더 안정한 것으로 나타났다. 또한, -소단위 잔기 51과 -소단위 잔기 99 사이에 이황화결합이 존재하면, -소단위 잔기 31과-소단위 잔기 37 사이에 있는 이황화결합 보다도 단백질의 안정성을 증가시키는 것으로 나타났다.
시트-벨트 및 CFC101-114(51-99)의 -소단위 루프 2 사이에 이황화결합이 존재하면, LH 수용체에 결합하는 능력을 감소시킨다(도 22). 따라서, CFC101-114는 방사능라벨된 hCG가 LH 수용체에 결합을 저해하는데 있어서 재조합 hCG와 같은 효과를 가지는 반면에, CFC101-114(51-99)는 활성이 약 100배 적다. CFC101-114, CFC101-114(51-99), CFC101-114(K51C-), CFC101-114(K51A-), CFC101-114(-D99C)의 활성을 비교하여, 개별 소단위 돌연변이와 이황화결합의 상대적인 중요성을 비교할 수 있다. 이와 같이 비교한 결과로, -소단위 Lys51을 시스테인 또는 알라닌으로 치환하는 경우에 실제 수용체 결합에 저해성 영향을 준다는 것을 볼 수 있다(도 22 및 23). 따라서, CFC101-114(K51C-)의 활성은 CFC101-114(51-99)의 것에 비례한다. hCG의 LH 활성에 이의 영향과는 달리, CFC101-114 -소단위 Asp99를 시스테인으로 치환하더러도 이는 CFC101-114(51-99)가 LH 수용체에 결합하는 능력이 감소되는 것의 일부분만에 해당된다. 그럼에도 불구하고, CFC101-114(51-99)는 CFC101-114(K51C-)보다 실제 더 활성이 큰데 이는 -소단위에 있는 Lys51 대신에 시스테인 존재함으로써 설명되지 않는 효과이다.
CFC101-114의 시그날 변환 활성에서 시트-벨트--소단위 이황화결합의 영향을 결정하기 위한 연구를 실행하였다(도 24 및 25). CFC101-114는 hCG보다 LH 수용체에서 시그날 변환을 자극하는데 있어서, 다소 그 능력이 적은 것으로 보인다(도 24). 그러나, CFC101-114(51-99) 이황화결합 연결된 유사체는 테스트된 고농 도에서만 활성을 가진다. 초기 논의된 바와 같은 연구를 확인하는 것으로, 이는 -소단위 Lys51가 시스테인으로 변화된 유사체 때문인데, 이때 -소단위 Asp99만이 시스테인으로 전환되어, 실제 활성은 보유한다(CFC101-114(51-99)). 결합 검사의 경우와 같이, 이황화결합은 -소단위 Lys51을 시스테인 또는 알라닌으로 대체한 경우에 활성이 일부 상실되는 것을 상쇄시킬 수 있는데, 소단위간 이황화결합은 일부 시그날 변환을 복귀시킨다(도 24).
CFC101-114는 FSH 검사에서 실제 활성을 가진다. 그러나, 시트-벨트--소단위 루프 2 이황화결합 교차결합을 만들기 위해 필요한 시스테인 치환으로 이의 LH 활성보다는 CFC101-114의 FSH 활성에 더 큰 효과를 가지고(도 26, 27, 28), 이는 이황화결합의 영향을 구별하는데 이용할 수는 없다. 따라서, -소단위 Lys51 또는 -소단위 Asp99만이 변화된 유사체는 이들의 대부분 FSH 활성을 상실한다. -소단위 Asp99에 돌연변이는 LH 활성보다는 FSH 활성에 더 큰 영향을 준다는 것은 이와 같은 발견은 LH 및 FSH 활성에서 시트-벨트의 역할에 대한 기존 관찰을 뒷받침한다(Han et al, 1996; Baird et al, 1993). 이와 같은 보고서는 LH 수용체에 영향을 주는 시트-벨트의 부분이 아미노산 94-96 부근에 있고 반면에 FSH 수용체 결합에 영향을 주는 부분은 아미노산 101-109 부근에 있다는 것을 제시한다.
실시예 5; 실시예 1 및 3의 이황화결합에 의해 안정화된 hCG
당단백질 호르몬에 여러개의 이황화결합을 도입시키면, 이들의 생물학적 활 성에 어떻게 영향을 주는 지를 연구하기 위해, 실시예 1과 3에서 보여주는 것과 같은 이황화결합을 포함하는 hCG 유사체를 만들었다. 이와 같은 유사체는 실시예 1과 3에서 설명하는 것과 같은 발현 벡터의 일부분을 교환하여 준비한다. pCI- (C7S,K51C)는 pSVL-C7S 및 pSVL-K51C를 BsmI으로 절단하여, 각 절단시에 만들어진 작은 단편과 큰 단편은 겔 전기영동에 의해 준비하고, pSVL-C7S의 큰 단편은 pSVL-K51C의 작은 단편과 결찰시켜 준비한다. 생성된 구조물은 XhoI 및 BamHI으로 절단하고, 실시예 1에서 설명한 것과 같은 변형된 폴리링커를 가지는 pCI에 결찰한다. pCI-hCG'(Y31C,D99C)는 pSVL-hCG'D99C 및 pCI-hCG'Y37C를 AocI(Bsu36I의 isochizamer) 및 BamHI으로 절단하고, 아가로즈 전기영동에 의해 작은 단편과 큰 단편을 분리하고, pSVL-hCG'D99C의 작은 단편은 pCI-hCG'Y37C의 큰 단편과 결찰시켜 준비한다. 이들 벡터에 의해 인코드되는 아미노산 서열은 도 31에서 설명한다.
실시예 1에서 설명하는 것과 같은 COS-1 세포에서는 pCI-(C7S,K51C) 및 pCI-hCG'(Y31C,D99C)이 공동발현된다. 배양 배지로 분비되는 단백질을 실시예 1에서 설명하는 것과 같이 농축시키고, 샌드위치 면역검사에 의해 모니터하는데, 단 방사능요오드화된 B112를 B105 대신에 이용한다. 여러개의 이황화결합이 존재하더라도 배양 배지에 유사체가 존재할 때 볼 수 있는 것과 같은 세포로부터 분비되는 것이나 폴딩을 방해하지는 않는다(표 8). 샌드위치 면역검사에서 -소단위(A113)에 대한 항체 및 감지용으로 -소단위(B112)에 대한 방사능요오드화된 항체를 이용 하여 hCG 표준에 대해 hCG(31-37,51-99)의 상대적인 양을 측정하였다. -소단위의 N-말단부근에 돌연변이 결과로 항체 A407에 의해 유사체가 잘 인지되지 않는다. 단백질의 이 부분은 호르몬 활성에 필요한 것은 아니기 때문에, 이와 같은 에피토프가 부족하더라도 거의 영향이 없는 것으로 보인다. 도 31의 대문자는 이황화결합을 만들기 위해 도입되는 돌연변이의 위치를 말한다.
hCG(31-37,51-99)에 두 개의 이황화결합이 존재하는 경우에 열 변성 검사에서 hCG에 대해 이들의 안정성을 증가시킨다(도 8). 또한, hCG(31-37,51-99)는 뇨 변성에서 hCG보다 더 안정하다(도 9). 이로써 한 개 이상의 이황화결합이 존재하여도 이 분자를 불안정하게 하지는 않는다.
hCG(31-37,51-99)는 LH 수용체에 결합할 수 있고, cAMP 축적을 자극시킬 수 있다(도 29, 30). 이와 같은 검사에서 이들의 활성은 hCG(51-99)의 것과 유사하여, -소단위 잔기 31 및 -소단위 잔기 37 사이에 소단위간 이황화결합은 수용체 결합 또는 시그날 변환에 결정적인 영향을 가지지는 않는다. 따라서, 31-37 소단위간 노트 부위는 엔도크린 활서을 보유하는 것이 바람직한 경우에 당단백 질 호르몬을 안정화시키기 위해 이황화결합을 조작하는데 적합하다는 것이다.
hCG 및 CFC101-114는 이들의 LH 및 FSH 활성을 파괴시키지 않으면서 이들의 시스테인 노트사이에 소단위간 이황화결합에 의해 안정화된다는 발견은 이 부분이 호르몬 활성에 필요한 부분이 아니라는 것을 강력하게 제시하는 것이다. 따라서, FSH로 유사한 이황화결합을 만들면 안정성은 증가되고, FSH 활성은 보유하는 hFSH 유사체가 된다는 것을 알 수 있을 것이다. 이와 같은 유사체는 A113와 같이 hCG 및 hFSH -소단위를 인지하는 항체에 결합할 것으로 예상할 수 있다. 또한, B602와 같은 돌연변이의 부분으로부터 떨어져 있는 hFSH -소단위 루프 1 또는 3의 부분을 인지하는 항체에도 결합할 수 있을 것으로 예상하고 있다.
-소단위 잔기 31 및 -소단위 잔기 31 사이에 교차결합된 hFSH 유사체를 준비하는데 필수적인 한 개의 -소단위 유사체의 서열은 도 3에서 설명하고 있다. 이와 같은 유사체(C7A)를 준비하는데 유용한 극성이 적은 -소단위의 아미노산 서열은 도 32에서 설명하고 있다. C7A 또는 C7S에 이황화결합이 있는 소단위간 노트를 형성하는 것으로 기대되는 hFSH Y31C는 도 32에서 설명하고 있다. 이들 단백질을 인코드하는 벡터를 준비하는데 필요한 핵산 서열은 도 33에서 설명하는 유전자 코드를 이용하여 당업자가 사람 -소단위 및 hFSH -소단위 cDNA로부터 준비한다. 이들 서열은 실시예 1에서 언급한 공급업자로부터 구입할 수도 있다.
C7S 및 hFSHY31C 또는 C7A 및 hFSHY31C를 일시적으로 또는 안정하게 발현될 수 있도록 하는 벡터를 실시예 1에서 언급한 문헌과 같은 당분야에 공지된 임의 수단으로 COS-7 또는 다른 진핵 세포로 도입시킬 수 있다. 생산된 단백질은 표준으로 hFSH를 이용한 샌드위치 면역검사를 이용하여 측정하는데, 이때 이용되는 포집 항체는 -소단위 N-말단에서 떨어져있는 hFSH의 에피토프를 인지하고, 감지 항체는 -소단위 루프 1과 3에 hFSH의 에피토프를 인지한다.
교차결합된 hFSH 유사체는 실시예 1에서 교차결합된 hCG 유사체에서 실행한 열 또는 요소 변성 검사에서 hFSH보다는 더 안정할 것으로 기대된다. 교차결합된 FSH 유사체는 사람의 FSH 수용체로 트랜스펙션된 CHO 세초에 결합하는데 있어서, 방사능요오드화된 hFSH와 경쟁을 하는 것으로 기대된다. 이와 같은 세포에서 cAMP 축적을 자극시킬 수 있을 것으로 보인다. In vitro 검사에서 in vivo 완전하게 글리코실화된 당단백질 호르몬의 생물학적 활성을 성공적으로 기대할 수 있다. 당단백질 호르몬 유사체를 교차결합하기 위해 도입되는 돌연변이는 재조합 당단백질 호르몬에 비교하여 전체적인 글리코실화 패턴을 변경시키지 않는 것으로 보이기 때문에, 교차결합된 FSH 유사체는 in vivo에서 활성이 있는 것으로 예측된다.
실시예 1-4에서는 당단백질 호르몬 및 이들의 유사체 소단위간에 한 개의 소단위간 이황화결합으로 이들의 안정성을 강화시킬 수 있다는 것을 보여준다. 이와 같은 실시예에서는 분자의 수용체 결합 및 시그날 변환 활성에서 이황화결합의 효과가 작다는 것을 보여주는데, 단 이황화결합이 수용체 결합, 수용체 결합 특이성에 중요한 잔기가 관계하지 않고, 단백질을 부적절한 모양으로 변형시키지 않는 조건하에서 성립되는 것이다. -소단위 및 -소단위의 N-말단 부분은 호르몬 호라성을 파괴시키지 않고 실제 변화되는데, 이는 단백질의 이부분이 주요 수용체 접촉부에 관여하지 않는다는 것을 의미한다. 따라서, 표 1B에서 선호적인 것으로 나타나는 이황화결합을 당단백질 호르몬의 N-말단에 도입하면 이들의 생물학적 활성을 실제 변화시키지 않으면서 이들을 안정화시킬 수 있다는 것이다.
표 1B에서는 -소단위 Gln5 및 hCG -소단위 Arg8가 시스테인으로 치환되는데 적합한 위치가 되어, 이황화결합된 유사체를 형성할 수 있다는 것을 보여준다. 이와 같은 유사체는 hCG에 비해 안정성이 강화되었고, LH 수용체에 결합하고, 이를 자극하는 능력을 보유하고 있다는 것이다.
이와 같은 유사체를 발현하는데 유용한 벡터를 준비하는데 필요한 아미노산 서열은 도 34A 및 34B에서 설명한다.
초기에서 언급한 바와 같이 실시예 1-4에서는 당단백질 호르몬 소단위 및 이들의 유사체에 소단위간 이황화결합이 이들의 안정성을 강화시킨다는 것을 보여주었다. 이와 같은 실시예에서는 이황화결합이 수용체 결합 또는 수용체 결합 특이 성에 중요한 잔기가 관여하지 않는 경우에 수용체 결합 및 시그날 변환에서의 이황화결합의 효과를 보여준다. 따라서, 본 발명에 따르면, hFSH의 N-말단에 이황화결합을 도입시키면 치료요법적으로 유용한 성질을 가지는 유전자를 유도할 수 있을 것이고, 이를 안정화시킬 수 있을 것이다.
-소단위 Gln5 및 hCG -소단위 Arg8의 선호적인 위치를 보여주는 표 1B의 데이터 및 hCG 및 hFSH에서 "등가" 잔기를 보여주는 표 2의 데이터를 기초로하여, -소단위 Gln5 및 hFSH -소단위 Ser2을 시스테인으로 치환으로 이황화결합 교차결합된 hFSH 유사체를 만들 수 있을 것으로 예측할 수 있을 것이다. 이와 같은 유사체는 hFSH에 비교하여 안정성이 강화되고, FSH 수용체에 결합 및 이를 자극하는 능력을 보유하고 있다는 것을 알 수 있다. 이와 같은 유사체를 발현시키는데 유용한 벡터를 준비하는데 필수적인 아미노산 서열은 도 35에서 설명하고 있다.
사람 루트로핀과 가장 밀접하게 관련된 것은 hCG 및 hLH이다. 따라서, 활성을 가지는 이황화결합 교차결합된 hLH를 준비하는데 필수적인 돌연변이는 활성을 가지는 교차결합된 hLH 유사체를 준비하는데 유용할 것으로 기대된다. hLH는 가장 불안정한 고나도트로핀이고, 이는 소단위간 이황화결합이 hLH의 안정성을 상당히 증가시킬 것으로 예상할 수 있을 것이다. N-말단 부근에서 교차결합된 hLH 및 시 스테인노트 이황화결합에 의해 연결된 hLH을 준비하는데 필요한 -소단위의 아미노산 서열은 각각 도 36 및 37에 설명하고 있다.
실시예 10; hTSH
Y30C,
-소단위 및
-소단위 N-말단 부분사이에 소단위위 또는
- 및
-소단위 사이에 시스테인간에 노트 이황화결합에 의해 안정화된 hTSH을 만드는데 유용한 것으로 기대되는
-소단위 유사체.
초기에서 언급한 것과 같이, 실시예 14-는 당단백질 호르몬 및 이들의 유사체의 소단위간에 소단위간 이황화결합이 이들의 안정성을 강화시킨다는 것을 말해준다. 이와 같은 실시예에서는 또한 이들이 수용체 결합 또는 수용체 결합 특이성에 중요한 잔기가 관계하지 않는한 수용체 결합 및 시그날 변환에 이황화결합의 효과를 보여준다. 따라서, hTSH -소단위 및 -소단위 또는 hTSH의 -소단위 또는 -소단위의 N-말단에 이황화결합을 도입시키면, 이종이량체를 안정화시켜, 방사능 요오드 제거 치료법을 하기 전에 흉선을 자극하는 등의 유용한 치료요법적 성질을 가지는 유사체를 유도할 수 있다.
-소단위 Cys31 및 hCG -소단위 Tyr37의 선호적인 위치를 보여주는 표 1B 및 hCG 및 hTSH에서 "등가" 잔기를 보여주는 표 2의 데이터를 기초하여, Tyr30이 시스테인 잔기로 대체된 C7S 또는 C7A 및 hTSH -소단위를 발현시키는 세포는 이황화결합 교차결합된 hTSH 유사체를 만드는 것으로 기대된다. 유사하게, -소단위 Gln5 및 hCG -소단위 Arg8의 선호적인 위치를 보여주는 표 1B 및 hCG 및 hTSH에서 "등가" 잔기를 보여주는 표 2의 데이터를 기초하여, -소단위 Gln5 및 hCG -소단위 Phe1을 시스테인으로 치환하면 이는 hTSH에 비교하여 안정성을 강화시키면서, TSH 수용체에 결합하고, 이를 자극하는 능력은 보유할 것으로 기대된다.
이와 같은 유사체를 발현하는데 유용한 벡터를 준비하는데 필요한 아미노산 서열은 도 38 및 39에서 설명한다.
실시예 11: 이황화결합 교차연결된 호르몬 길항제의 준비
당단백질 호르몬의 데글리코실화반응으로 이들의 생물학적 시그날을 유도하는 능력을 감소시킨다는 것은 공지된 바 있다(Moyle et al, 1975; Matzuk et al, 1989). 그러나, 이들의 불안정성으로 인하여, 데글리코실화된 호르몬은 치료요법적으로 유용하지 않다. 이황화결합 교차결합을 유전적으로 데글리코실화된 호르몬으로 도입시킨면, 호르몬 길항물질로써 이들의 유용성을 증가시킬 것이다. LH 또는 hCG의 길항제는 수정률을 촉진시키는데 그리고 수정률을 억제시키는 용도에 모두 이용될 수 있다. 따라서, LH 수준이 부적합하게 높아 불임의 되는 여성에게 투여하였을 경우에, LH 길항제는 수정률을 강화시킬 것이다. 임신 초기 단계에 있는 여성에게 투여하는 경우에, hCG 길항물질은 임신을 중단시킨다. CFC101-114 또는 CFC101-109(Moyle et al, 1994)와 같은 이중 기능을 가지는 LH/FSH 분자의 길항물질이 유용할 것이다. 이와 같은 길항물질을 일시적으로 이용하여, 부적절한 배란 기능을 중단시키고, 생리 주기를 다시 설정하게 된다. 이는 수정률을 강화시킬 수 있다. 임신 초기 동안에 길하물질을 이용하여, 프로게스테론 및 에스트라디옥의 생산을 억제하고, 임신을 중단시킨다.
소단위간 이황화결합 교차결합을 도입하는 것 이외에, 교차결합된 길항물질 을 준비하면, 표 1B에서 언급하는 것과 같이 설명된 또는 만들어진 -소단위에서 또는 유사체의 -소단위 및 -소단위에서 N-연결된 글리코실화 시그날 변화에 관계할 것이다. 이는 당단백질 호르몬의 - 및 -소단위에서 발견되는 Asn-X-Ser/Thr 서열에 변화와 관계하는데, 이로써, Asn이 또다른 아미노산으로 치환되거나, Ser 또는 Thr이 또 다른 아미노산으로 치환되거나 또는 Asn 또는 Ser/Thr 사이에 있는 아미노산(이는 X로 표시함)을 프롤린으로 치환하는 것이다.
실시예 12
표 9-15에서는 모체 호르몬보다는 더 안정할 것으로 기대되는 다른 이황화결합 교차결합된 고나도트로핀을 나타낸다. 이는 실시예 1-5에서 설명하는 것과 같이 -소단위 및 -소단위 구조를 발현시키는 벡터를 세포에 공동 트랜스펙션시켜 만든다.
이와 같은 이황화결합을 만드는 잔기는 높은 친화력을 가지는 수용체 접촉부에 참여하지 않는 hCG 부분에 있다는 것이다(Moyle et al, 1995). hCG의 제 2 -소단위 루프 또는 제 3 -소단위 루프는 루트로핀 활성에 필요하지 않고 hCG의 활 성 유사체는 이들이 모두 결손된 것으로 만든다(Moyle et al, 1998). 또한, 완전한 활성을 가지는 hCG 유사체는 -소단위 루프 2가 hFSH의 해당부분으로 대체된 것으로 준비된다(Campbell et al, 1991). 따라서, 단백질의 이들 부분 사이에 소단위간 이황화결합을 추가하여도 이의 생물학적 활성을 파괴하지 않을 것으로 본다. 이와 같은 유사체는 hCG의 - 및 -소단위를 인코드하는 벡터를 변형시키고, 이를 포유류 세포에서 공동 발현시켜 준비한다. V76C라고 명명된 아미노산 서열을 가지는 단백질을 인코드하는 -소단위 구조는 표 9에 나타내었다. 이와 같은 구조는 프라이머로 올리고뉴클레오티드 1131 및 1132를 이용하고, 주형으로 pMB589을 이용한 PCR 돌연변이 발생으로 준비할 수 있다. 플라스미드 pMB589는 사람의 -소단위의 유사체(Asn52의 코돈은 아스파르트산으로 변화되고, Arg42 및 Ser43에 대한 코돈은 변형되어 침묵 BglII 위치를 만듬)을 인코드하는 pCI' 구조이다.
pMB589은 pMB532의 XhoI-BamHI 삽입부분은 pCI 벡터의 XhoI-BamHI 부위에 서브클로닝하고, pMB532는 올리고뉴클레오티드 850 및 851(프라이머; 표 5) 및 주형으로는 pMB507을 이용한 PCR에 의해 pMB507로부터 만든다. PCR 생성물은 BglII 및 SpeI로 절단하고, pMB507의 BglII 및 SpeI 부위로 서브클론시키고, 서열화시켜 pMB532를 제공한다.
PCR 생성물은 BglII 및 PstI로 절단하고, 삽입체는 pMB507의 BglII 및 PstI 부위로 클론시켜, pMB910을 만든다. 구조체에 도입된 여분의 DraI 부위가 존재하는지를 확인하여 양성 클론을 확인하다. pMB910의 DNA 서열은 디데옥시 방법으로 확인한 후에, 전체 -소단위 유사체를 인코드하는 DNA 단편을 pMB910에서 XhoI 및 BamHI 절단으로 제거하고, pCI 벡터의 XhoI 및 BamHI 부위에 서브클론시켜, pMB926를 만든다. pMB926는 V76C를 인코드한다.
V76C용 hCG -소단위 짝을 만들기 위해, hCG'V44C를 인코드하는 벡터를 준비하였다. 이는 pMB926과 같은 동일한 세포에서 발현되었을 때, V76C와 이황화결합 교차연결된 이종이량체를 만드는 것으로 기대되는 hCG -소단위 유사체이다. 올리고뉴클레오티드 1133 및 1134(표 5)를 합성하고, pKMB-'의 NgoMI-PstI 부위에 결찰시켜, pMB909을 만든다. pMB909의 XhoI-BamHI 단편을 pCI'에 옮겨 pMB941을 만든다. pMB941에 의해 인코드된 hCGV44C 아미노산 서열을 표 11에 제공하였다.
hCG 및 hFSH -소단위의 아미노산 서열의 유사성, 특히 시스테인(표 4)을 기초로 하여, 이들 두 단백질은 유사한 구조를 가지는 것으로 예상된다. hCG의 β-소단위 루프 2에 있는 Val44와 -소단위 루프 3에 있는 Val76의 상대적인 위치로, 이들 잔기를 시스테인으로 치환하였을 경우에, -소단위 루프 2와 -소단위 루프 3사이에 소단위간 이황화결합을 만들 것으로 기대된다. Val38은 hCG -소단위에서 Val44와 같이 hFSH -소단위에서 유사한 위치를 차지하고 있다. 따라서, hFSH-Val38을 시스테인으로 변경시키고, 생성된 구조를 V76C와 발현시키면 이황 화결합 교차결합된 이종이량체가 될 것으로 기대된다. hFSH -소단위에 있는 Val38을 시스테인으로 치환시키기 위해, 본 발명자들은 pCI' 벡터의 XhoI 및 BamHI 제한 효소 부위에 있는 해독안된 3' 및 5' 말단을 뺀 hFSH cDNA를 포함하는 구조인 pMB603으로 시작하였다. pBM306의 BstXI 및 PpuMI 사이에 작은 DNA 단편은 올리고뉴클레오티드 1154 및 1155(표 5)의 어닐링에 의해 만들어진 올리고뉴클레오티드 카세트로 대체한다.
pMB920라고 명명된 생성 구조체는 BstXI 부위의 부족 및 PpuMI 부위가 존재하는 것으로 스크리닝된다. DNA 서열화로 원하는 변화가 존재하는 지를 확인하고, pBM920은 COS-7세포에 pMB926(V76C 발현을 유도하는 벡터)와 함께 공동-트랜스펙션시킨다. 세포는 배지로 이종이량체를 분비하고, 이는 포집용으로는 항--소단위 단클론 항체 A113를 이용하고, 감지용으로는 방사능요오드라벨된 항-hFSH-소단위 단클론 항체 B602을 이용하여 샌드위치 면역검사에서 감지된다. pMB920에 의해 인코드되는 hFSH38C 아미노산 서열은 표 10에 나타내었다. V76C 및 hFSHV38C으로 구성된 이종이량체는 사람 FSH 수용체를 발현시키는 CHO 세포에서 cAMP 축적을 자극한다(도 45).
실시예 15; 각 소단위의 N-말단 사이에 그리고 시스테인 노트사이에 이황화결합을 포함하는 hCG 유사체
각 소단위를 변형시켜, 소단위간 이황화결합에 관여하는 자유 티올을 만들어서 먼저 이황화결합 교차연결된 이종이량체를 준비한다. 여기에서, hCG의 -소단 위만을 변형시켜 이황화결합 교차연결된 hCG 유사체를 만드는 것이 가능하다는 것을 보여준다. hCG의 결정 구조에서는 -소단위 Cys31가 -소단위 Tyr37에 위치하고, 이들 두 개 소단위의 측쇄는 서로를 향해 있다. 이와 같은 관찰을 이용하여, hCG -소단위 잔기 31과 -소단위 잔기 37 사이에 소단위간 이황화결합을 삽입하였다. hCG의 결정 구조에서는 -소단위 잔기 Cys7가 hCG -소단위 잔기 Arg6 부근에 위치한다는 것을 보여준다. 사실, -소단위 잔기 Cys7 및 Cys31는 -소단위 잔기 Arg6 및 Tyr37에 위치하여, Arg6 및 Tyr37를 변화시키면 Cys7-Cys31 및 Cys6-Cys37 소단위간 이황화결합을 포함하는 이종이량체; Cys7-Cys6 및 Cys31-Cys37 소단위간 이황화결합을 포함하는 이종이량체; Cys7-Cys37 및 Cys31-Cys6 소단위간 이황화결합을 포함하는 이종이량체 형성을 촉진시킨다. 컴퓨터 시뮬레이션을 보면, 각 이황화결합은 단백질에 어떠한 억압없이 형성될 수 있다는 것이다. 다중 이황화결합이 형성되는 경우에, 다른 반감기를 가지는 이소머 또는 이소폼을 만드는데 유용하다. 이와 같은 것은 생물학적 반응을 "바로-시작"해야할 필요가 있을 때, 신규한 치료요법적 용도를 가진다. 이를 이용하는 경우에, 당업자는 큰 알약으로 된 유사체를 투여하여 호르몬 반응을 개시한다. 교차결합안된 이종이량체 분취물은 교차결합된 이종이량체보다는 더 빨리 제거되는 것으로 기대된다. 결과적으로, 초기에 대량으로 주사하면 반응을 개시할 수 있으나, 이와 활성은 더 낮은 수준으로 감소되고, 더 오랜 시간동안 유지되어 반응을 유지시킨다. 이와 같은 유사체는 PEGylated 유사체를 준비하기 위한 중간생성물로 작용한다. 시스테인 잔기는 독특한 반응성을 가지기 때문에, 종종 자유 시스테인을 단백질 표면에 추가하는 것이 바람직하다. 그러나, 시스테인의 반응성으로 인하여, 이와 같은 타입의 단백질을 만드는 것이 어렵다. -소단위 Cys7-Cys31 이황화결합은 자유 시스테인을 만드는 상태를 감소시키는 것으로 알려져있다. -소단위의 잔기 6과 37에 시스테인을 도입시키면 유사한 형태의 이황화결합을 만들 수 있을 것으로 기대된다. 이와 같은 이황화결합에 있는 시스테인은 단백질에 있는 다른 것보다 활성이 더 클 것으로 기대되는데, 그 이유는 이것이 이황화결합을 교환할 수 있는 위치이기 때문이다. 따라서, 본 발명자들은 잔기 Cys7에 있는 기존의 -소단위 시스테인, -소단위 잔기 Cys6에 첨가된 시스테인을 단백질을 변형시킬 수 있는 물질과 반응시키는 것이 가능하다는 것을 예측하였다. 여기에는 단백질을 PEGylating시키고, 이의 생물학적 반감기를 안정화시키는 것이 포함된다. 이와 같은 과정에서 자유롭게 된 시스테인은 소단위간 이황화결합을 만들 수 있고, 따라서 단백질이 안정화된다. 이와 같은 유사체를 준비하는 경우에는 hCG'Y37C로 공지된 유사체에 제 2 시스테인을 추가해야 한다.
hCG ' 유사체를 인코드하는 pMB940는 프라이머로 올리고뉴클레오티드 1161 및 1163(표 5)와 주형으로는 pCI'-hCG'을 이용한 PCR 돌연변이형성에 의해 준비한다. pCI' 벡터에 위치한 올리고뉴클레오티드 1161 프라이머 오프 서열 및 올리고뉴클레오티드 1163은 돌연변이를 인코드한다. PCR 생성물은 XhoI 및 BanI으로 절단하고, pSVL-hCG'Y37C에서 얻은 BanI-BamHI 단편과 함께 pCI'의 큰 XhoI-BamHI 단편에 결착시켜, pMB941을 만든다. pMB941의 코딩 서열의 DNA 서열은 디데옥시 방법으로 확인한다. pMB941은 다음의 아미노산 서열을 인코드한다;
pMB940 및 pSV2Neo를 CHO 세포로 공동-트랜스펙션시켜, 독성 약물인 G418에 저항성이 있는 지를 확인하여 안정한 세포주를 선택한다. 배지에서 수득된 단백질은 포집용으로 항--소단위 항체 A113 및 방사능요오드화된 항--소단위 항체 B112를 감지용으로 하여 샌드위치 면역검사를 하여 정량화시킨다. 이와 같은 검사로 배양 배지에 이종이량체가 존재하는 지를 확인하였다. 이종이량체의 생물학적 활성은 쥐 LH 수용체를 발현시키는 CHO 세포를 이용하여 cAMP 축적 검사에서 측정한다. 이와 같은 검사 결과는 도 46에서 설명한다.
실시예 16: 각 소단위 N-말단 사이 및 시스테인 노트사이에 이황화결합을 포함하는 hFSH 유사체
초기에서 언급한 바와 같이, 다중 이황화결합 형성으로 상이한 반감기를 가지는 단백질 동소체 집단을 만드는데 유용할 수 있을 것이다. 유사한 유사체는 난포 발생을 자극하는 개선된 방법을 제공한다. 소단위간 이황화결합이 없는 또는 교차결합안된 분취물은 소단위간 교차연결된 이종이량체 분취물보다 더 빨리 제거된다. 결과적으로, 초기에 많은 양을 주사하면 초기 난포 발생을 충분히 자극시킨다. 이는 난포상동안에 볼 수 있는 FSH 자극과 매우 유사한 타입이 되고, 과다 자 극 기회를 줄일 수 있다. hFSH의 -소단위의 N-말단에 시스테인을 추가하거나 hCG의 -소단위 아미노산 말단을 hFSH -소단위의 N-말단에 첨가하면 이종이량체가 형성되고, 소단위간 교차결합이 생성된다는 것을 예측할 수 있다. 실시예 15의 유사체와 유사한 이종이량체를 형성하는 것으로 기대되는 hFSH -소단위 유사체를 다음의 아미노산 서열을 가진다;
실시예 17: 실시예 15에 있는 유사체와 유사한 이황화결합 배열을 가지는 강력한 hFSH 활성을 가지는 hCG 유사체
-소단위 아미노산 94-110가 이의 hFSH 해당부분으로 대체된 hCG 유사체는 매우 높은 FSH 활성을 가진다. hFSH -소단위 잔기 95-103이 hCG -소단위 잔기 101-109 대신에 위치하고, -잔기 6, 37에 시스테인을 포함하는 hCG 및 hFSH의 키메라는 실시예 15에서 볼 수 있는 것과 같은 유사한 이황화결합을 형성할 것으로 기대된다. 이와 같은 유사체중 한가지의 -소단위 아미노산 서열은 다음과 같다;
본 발명은 충분히 설명하였는데, 당업다는 본 발명의 범위를 벗어나지 않고 등가의 변수, 농도, 조건에서 실행할 수 있을 것이다.
본 발명은 특이적인 구체예로 설명하고 있으나, 추가 변형이 가능하다는 것 을 인지할 것이다. 이와 같은 방법은 본 발명의 원리에 따라 본 발명의 임의 변화, 용도등을 포함하고, 본 발명이 포함되는 분야에서 공디된 방법으로 본 발명의 범위를 포함하고, 이는 다음의 첨부된 청구범위에 따라 필수적인 특징에 이용된다.
논문, 요약서, 미국 및 외국 특허 출원등을 포함하는 여기에서 언급하는 모든 문헌은 모든 데이터, 표, 도면, 텍스트등을 포함하여 모두 첨부한다. 또한, 참고문헌의 전체 내용을 참고문헌으로 첨부한다.
공지된 방법, 단계, 통상적인 방법 단계, 공지 방법 또는 통상적인 방법에 대한 언급은 본 발명의 구체예 또는 임의 측면, 설명이된 또는 지시된 또는 제안된 것을 임의로 허여하는 의도는 아니다.
전술한 특정 구체예의 설명은 본 발명의 일반적인 특징을 충분히 설명한 것으로 당분야에 공지된 지식을 응용하여, 과도한 실험없이, 본 발명의 일반적인 개념에 벗어나지 않고 이와 같은 특정 구체예에 다양한 응용 부분에 바로 적용 변화시킬 수 있을 것이다. 따라서, 이와 같은 적용 및 변형은 여기에서 제시한 가르침에 기초하여 설명된 구체예의 등가 범위내에 있다. 여기에서 사용된 단어 및 어구는 본 발명을 설명하기 위한 것으로 이에 한정하고자 함은 아니고, 본 명세서에 있는 용어 및 어구는 당업자가 공지된 지식 및 여기에서 제시한 가르침을 기초로 하여 해석할 수 있을 것이다.
REFERENCES
Adachi et al, J. Biol. Chem. 264:8537-41 (1989)
Alber et al, Biochemistry 26:3751-3758 (1987)
Ausubel et al, Current Protocols in Molecular Biology, Greene Publications and Wiley Interscience (New York, 1987-1997)
Baenziger et al, Biochim. Biophys. Acta. 947:287-306 (1988)
Baenziger et al, Proc. Natl. Acad. Sci., USA 89:334-338 (1992)
Baird et al, Oxf. Rev. Reprod. Biol. 15:191-232 (1993)
Bedows et al, J. Biol. Chem. 268:11655-11662 (1993)
Berger et al, Molecular and Cellular Endocrinology 125:33-43 (1996)
Bernard et al, Mol. Cell. Endocrinol. 71:R19-R23 (1990)
Birken et al, J. Biol. Chem. 261:10719-10727 (1986)
Birken et al, Endocrinology 129:1551-1558 (1991)
Blithe et al, Endocrinology 129:2257-2259 (1991)
Blowmick et al, Mol. Endocrinol. 10:1147-1159 (1996)
Bo et al, J. Biol. Chem. 267:3179-3184 (1992)
Braun et al, EMBO. J. 10:1885-1890 (1991)
Braustein et al, Endocrinology 91:1030-1036 (1972)
Brooker et al, Adv. Cyclic Nucl. Res. 10:1-33 (1979)
Campbell et al, Proc. Natl. Acad. Sci., USA 88:760-764 (1991)
Campbell et al, Mol Cell. Endocrinol. 83:195-200 (1992)
Campbell et al, Nature Biotech. 15:439-443 (1997)
Chen et al, J. Biol. Chem. 266:19357-19361 (1991)
Cole et al, Cancer. Res. 41:1615-1619 (1981)
Cole et al, Endocrinology 129:1559-1567 (1991)
Cole et al, J. Biol. Med. 64:627-637 (1991)
Cole et al, J. Clin. Endocrinol. Metab. 76:704-710 (1993)
Cosowsky et al, J. Biol. Chem. 270:20011-20019 (1995)
Cosowsky et al, J. Biol. Chem. 272:3309-3314 (1997)
DeBeer et al, Eur. J. Biochem. 241:229-242 (1996)
Fiddes et al, in Recent Progress in Hormone Research, Vol 40; R. O. Greep, ed., Academic Press, New York (1984), pp. 43-78.
Fiete et al, Cell 67:1103-1110 (1991)
Forastieri et al, J. Biol. Chem. 257:7976-7981 (1982)
Furuhashi et al, J. Biol. Chem. 269:25543-25548 (1994)
Galway et al, Endocrinology 127:3023-3028 (1990)
Gast, M. J., Am. J. Obstet. Gynecol. 172:753-759 (1995)
Gennaro, A., Ed., Remington's Pharmaceutical Sciences, 18th Ed., Mack Publishing Co. (Easton, PA, 1990)
Han et al, Mol. Cell. Endocrinol. 124:151-161 (1996)
Ho et al, Gene 77:51-59 (1989)
Huang et al, J. Biol. Chem. 268:9311-9315 (1993)
Imai et al, Bioconjug. Chem. 1:144-148 (1990)
Ji et al, Endocrinology 128:2648-2650 (1991)
Jia et al, Mol. Endocrinol. 5:759-768 (1991)
Jiang et al, Structure 3:1341-1353 (1995)
Kardana et al, Endocrinology 129:1541-1550 (1991)
Kobe et al, Nature 366:751-756 (1993)
Kobe et al, Nature 374:183-186 (1995)
Kriegler, M., Gene Transfer and Expression: A Laboratory Manual, Stockton Press, New York (1990)
Lapthorn et al, Nature 369:455-461 (1994)
Lim et al, Nature 339:31-36 (1989)
Lim et al, Biochemistry 31:4324-4333 (1992)
Loosfelt et al, Science 245:525-528 (1989)
Maniatis et al, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1989)
Matsumura et al, Nature 342:291-293 (1989)
Matthews, B. W., Biochemistry 26:6885-6888 (1987)
Matzuk et al, J. Biol. Chem. 264:2409-2414 (1989)
McFarland et al, Science 245:494-499 (1989)
McIntosh et al, J. Biomolecular Structure and Dynamics 5:21-33 (1987)
Mise et al, J. Biol. Chem. 255:8516-8522 (1980)
Mise et al, J. Biol. Chem. 256:6587-6592 (1981)
Moudgal et al, J. Clin. Endocrinol. Metab. 32:579-581 (1971)
Moudgal et al, J. Clin. Endocrinol. Metab. 35:113-116 (1972)
Moudgal, N. R., in Immunization with Hormones in Reproduction Research, E. Nieschlag, ed., North-Holland, Amsterdam (1976), p. 233
Moudgal et al, Fertility & Sterility 30:223-229 (1978)
Moyle et al, J. Biol. Chem. 250:9163-9169 (1975)
Moyle et al, Proc. Natl. Acad. Sci., USA 79:2245-2249 (1982)
Moyle et al, J. Biol. Chem. 265:8511-8518 (1990)
Moyle et al, J. Biol. Chem. 266:10807-10812 (1991)
Moyle et al, Nature 368:251-255 (1994)
Moyle et al, Endocrinology, L. J. DeGroot, ed., Saunders, Philadelphia (1995), pp. 230-241.
Moyle et al, J. Biol. Chem. 270:20020-20031 (1995)
Moyle et al, Chemistry & Biology 5:241-254 (1998)
Murphy et al, Endocr. Rev. 12:27-44 (1991)
Nagayama et al, Biochem. Biophys. Res. Commun. 165:1184-1190 (1989)
Nagayama et al, Proc. Natl. Acad. Sci., USA 88:902-905 (1991)
Pal et al, Am. J. Reprod. Immunol. 22:124-126 (1990)
Okayama, Mol. Cel. Biol. 3:280 (1983)
Olive, D. L., Am. J. Obstet. Gynegol. 172:759-765 (1995)
Overington et al, Protein Science 1:216-226 (1992)
Pierce et al, Ann. Rev. Biochem. 50:465-495 (1981)
Ravindranath et al, J. Reprod. Fertil. 88:25-30 (1990)
Reddy et al, Proc. Natl. Acad. Sci., USA 82:3644-3648 (1985)
Remy et al, Molecular and Cellular Endocrinology 125:79-91 (1996)
Rosa et al, J. Clin. Endocrinol. Metab. 59:1215-1219 (1984)
Segaloff et al, Recent. Prog. Horm. Res. 46:261-301, disc. (1990)
Shoham et al, Fertil. Steril. 56:1048-1053 (1991)
Singh et al, Fertil. Steril. 52:739-744 (1989)
Smith et al, J. Biol. Chem. 268:795-802 (1993)
Sprengel et al, Mol. Endocrinol. 4:525-530.
Sugahara et al, Proc. Natl. Acad. Sci., USA 92:2041-2045 (1995)
Suganuma et al, J. Biol. Chem. 264:19302-19307 (1989)
Sun et al, Annu. Rev. Biophys. Biomol. Struct. 24:269-291 (1995)
Talwar et al, Fertil. Steril. 46:120-126 (1986)
Talwar et al, Indian. Journal. of Experimental. Biology. 30:947-950 (1992)
van Dijk et al, Endocrinology 132:534-538 (1993)
Wang et al, in Ovulation Induction: Basic Science and Clinical Advances, M. Filicori and C. Flamigni, editors, Excerpta. Medica. Int'l. Congr. Series 1046, Elsevier Science B.V. Amsterdam (1994), pp. 191-196
Weare et al, J. Biol. Chem. 254:6964-6971 (1979)
Weare et al, J. Biol. Chem. 254:6972-6979 (1979)
Wehmann et al, Ann. Endocrinol. (Paris) 45:291-295 (1984)
Wu et al, Structure 2:545-558 (1994)
Xie et al, J. Biol. Chem. 265:21411-21414 (1990)
Yanisch-Perron et al, Gene 33:103-119 (1985)
SEQUENCE LISTING
(1) GENERAL INFORMATION:
(i) APPLICANT: MOYLE, William R.
(ii) TITLE OF INVENTION: DISULFIDE CROSSLINKING GLYCOPROTEIN
HORMONE ANALOGS, AND THEIR PREPARATION AND USE
(iii) NUMBER OF SEQUENCES: 138
(iv) CORRESPONDENCE ADDRESS:
(A) ADDRESSEE: BROWDY AND NEIMARK, P.L.L.C.
(B) STREET: 419 Seventh Street, N.W., Suite 300
(C) CITY: Washington
(D) STATE: D.C.
(E) COUNTRY: USA
(F) ZIP: 20004
(v) COMPUTER READABLE FORM:
(A) MEDIUM TYPE: Floppy disk
(B) COMPUTER: IBM PC compatible
(C) OPERATING SYSTEM: PC-DOS/MS-DOS
(D) SOFTWARE: PatentIn Release #1.0, Version #1.30
(vi) CURRENT APPLICATION DATA:
(A) APPLICATION NUMBER: US 09/104,400
(B) FILING DATE: 25-JUN-1998
(C) CLASSIFICATION:
(vii) PRIOR APPLICATION DATA:
(A) APPLICATION NUMBER: US 60/050,784
(B) FILING DATE: 25-JUN-1997
(viii) ATTORNEY/AGENT INFORMATION:
(A) NAME: YUN, Allen C.
(B) REGISTRATION NUMBER: 37,971
(C) REFERENCE/DOCKET NUMBER: MOYLE=1A
(ix) TELECOMMUNICATION INFORMATION:
(A) TELEPHONE: 202-628-5197
(B) TELEFAX: 202-737-3528
(2) INFORMATION FOR SEQ ID NO:1:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 92 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:1:
Ala Pro Asp Val Gln Asp Cys Pro Glu Cys Thr Leu Gln Glu Asn Pro
1 5 10 15
Phe Phe Ser Gln Pro Gly Ala Pro Ile Leu Gln Cys Met Gly Cys Cys
20 25 30
Phe Ser Arg Ala Tyr Pro Thr Pro Leu Arg Ser Lys Lys Thr Met Leu
35 40 45
Val Gln Lys Asn Val Thr Ser Glu Ser Thr Cys Cys Val Ala Lys Ser
50 55 60
Tyr Asn Arg Val Thr Val Met Gly Gly Phe Lys Val Glu Asn His Thr
65 70 75 80
Ala Cys His Cys Ser Thr Cys Tyr Tyr His Lys Ser
85 90
(2) INFORMATION FOR SEQ ID NO:2:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 145 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:2:
Ser Lys Glu Pro Leu Arg Pro Arg Cys Arg Pro Ile Asn Ala Thr Leu
1 5 10 15
Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr Val Asn Thr Thr
20 25 30
Ile Cys Ala Gly Tyr Cys Pro Thr Met Thr Arg Val Leu Gln Gly Val
35 40 45
Leu Pro Ala Leu Pro Gln Val Val Cys Asn Tyr Arg Asp Val Arg Phe
50 55 60
Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val Asn Pro Val Val
65 70 75 80
Ser Tyr Ala Val Ala Leu Ser Cys Gln Cys Ala Leu Cys Arg Arg Ser
85 90 95
Thr Thr Asp Cys Gly Gly Pro Lys Asp His Pro Leu Thr Cys Asp Asp
100 105 110
Pro Arg Phe Gln Asp Ser Ser Ser Ser Lys Ala Pro Pro Pro Ser Leu
115 120 125
Pro Ser Pro Ser Arg Leu Pro Gly Pro Ser Asp Thr Pro Ile Leu Pro
130 135 140
Gln
145
(2) INFORMATION FOR SEQ ID NO:3:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 116 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:3:
Met Asp Tyr Tyr Arg Lys Tyr Ala Ala Ile Phe Leu Val Thr Leu Ser
1 5 10 15
Val Phe Leu His Val Leu His Ser Ala Pro Asp Val Gln Asp Cys Pro
20 25 30
Glu Cys Thr Leu Gln Glu Asn Pro Phe Phe Ser Gln Pro Gly Ala Pro
35 40 45
Ile Leu Gln Cys Met Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro
50 55 60
Leu Arg Ser Lys Lys Thr Met Leu Val Gln Lys Asn Val Thr Ser Glu
65 70 75 80
Ser Thr Cys Cys Val Ala Lys Ser Tyr Asn Arg Val Thr Val Met Gly
85 90 95
Gly Phe Lys Val Glu Asn His Thr Ala Cys His Cys Ser Thr Cys Tyr
100 105 110
Tyr His Lys Ser
115
(2) INFORMATION FOR SEQ ID NO:4:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 116 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:4:
Met Asp Tyr Tyr Arg Lys Tyr Ala Ala Ile Phe Leu Val Thr Leu Ser
1 5 10 15
Val Phe Leu His Val Leu His Ser Ala Pro Asp Val Gln Asp Ser Pro
20 25 30
Glu Cys Thr Leu Gln Glu Asn Pro Phe Phe Ser Gln Pro Gly Ala Pro
35 40 45
Ile Leu Gln Cys Met Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro
50 55 60
Leu Arg Ser Lys Lys Thr Met Leu Val Gln Lys Asn Val Thr Ser Glu
65 70 75 80
Ser Thr Cys Cys Val Ala Lys Ser Tyr Asn Arg Val Thr Val Met Gly
85 90 95
Gly Phe Lys Val Glu Asn His Thr Ala Cys His Cys Ser Thr Cys Tyr
100 105 110
Tyr His Lys Ser
115
(2) INFORMATION FOR SEQ ID NO:5:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 165 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:5:
Met Glu Met Phe Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Thr Trp Ala Ser Lys Glu Pro Leu Arg Pro Arg Cys Arg Pro Ile
20 25 30
Asn Ala Thr Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Ile Cys Ala Gly Tyr Cys Pro Thr Met Thr Arg Val
50 55 60
Leu Gln Gly Val Leu Pro Ala Leu Pro Gln Val Val Cys Asn Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asn Pro Val Val Ser Tyr Ala Val Ala Leu Ser Cys Gln Cys Ala Leu
100 105 110
Cys Arg Arg Ser Thr Thr Asp Cys Gly Gly Pro Lys Asp His Pro Leu
115 120 125
Thr Cys Asp Asp Pro Arg Phe Gln Asp Ser Ser Ser Ser Lys Ala Pro
130 135 140
Pro Pro Ser Leu Pro Ser Pro Ser Arg Leu Pro Gly Pro Ser Asp Thr
145 150 155 160
Pro Ile Leu Pro Gln
165
(2) INFORMATION FOR SEQ ID NO:6:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 165 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:6:
Met Glu Met Phe Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Thr Trp Ala Ser Lys Glu Pro Leu Arg Pro Arg Cys Arg Pro Ile
20 25 30
Asn Ala Thr Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Ile Cys Ala Gly Cys Cys Pro Thr Met Thr Arg Val
50 55 60
Leu Gln Gly Val Leu Pro Ala Leu Pro Gln Val Val Cys Asn Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asn Pro Val Val Ser Tyr Ala Val Ala Leu Ser Cys Gln Cys Ala Leu
100 105 110
Cys Arg Arg Ser Thr Thr Asp Cys Gly Gly Pro Lys Asp His Pro Leu
115 120 125
Thr Cys Asp Asp Pro Arg Phe Gln Asp Ser Ser Ser Ser Lys Ala Pro
130 135 140
Pro Pro Ser Leu Pro Ser Pro Ser Arg Leu Pro Gly Pro Ser Asp Thr
145 150 155 160
Pro Ile Leu Pro Gln
165
(2) INFORMATION FOR SEQ ID NO:7:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 165 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:7:
Met Glu Met Phe Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Thr Trp Ala Ser Lys Glu Pro Leu Arg Pro Arg Cys Arg Pro Ile
20 25 30
Asn Ala Thr Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Ile Cys Ala Gly Tyr Cys Pro Thr Met Thr Arg Val
50 55 60
Leu Gln Gly Val Leu Pro Ala Leu Pro Gln Val Val Cys Asn Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asn Pro Val Val Ser Tyr Ala Val Ala Leu Ser Cys Gln Cys Ala Leu
100 105 110
Cys Arg Arg Ser Thr Thr Asp Cys Thr Val Arg Gly Leu Gly Pro Ser
115 120 125
Tyr Cys Ser Phe Gly Glu Phe Gln Asp Ser Ser Ser Ser Lys Ala Pro
130 135 140
Pro Pro Ser Leu Pro Ser Pro Ser Arg Leu Pro Gly Pro Ser Asp Thr
145 150 155 160
Pro Ile Leu Pro Gln
165
(2) INFORMATION FOR SEQ ID NO:8:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 165 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:8:
Met Glu Met Phe Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Thr Trp Ala Ser Lys Glu Pro Leu Arg Pro Arg Cys Arg Pro Ile
20 25 30
Asn Ala Thr Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Ile Cys Ala Gly Cys Cys Pro Thr Met Thr Arg Val
50 55 60
Leu Gln Gly Val Leu Pro Ala Leu Pro Gln Val Val Cys Asn Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asn Pro Val Val Ser Tyr Ala Val Ala Leu Ser Cys Gln Cys Ala Leu
100 105 110
Cys Arg Arg Ser Thr Thr Asp Cys Thr Val Arg Gly Leu Gly Pro Ser
115 120 125
Tyr Cys Ser Phe Gly Glu Phe Gln Asp Ser Ser Ser Ser Lys Ala Pro
130 135 140
Pro Pro Ser Leu Pro Ser Pro Ser Arg Leu Pro Gly Pro Ser Asp Thr
145 150 155 160
Pro Ile Leu Pro Gln
165
(2) INFORMATION FOR SEQ ID NO:9:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 116 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:9:
Met Asp Tyr Tyr Arg Lys Tyr Ala Ala Ile Phe Leu Val Thr Leu Ser
1 5 10 15
Val Phe Leu His Val Leu His Ser Ala Pro Asp Val Gln Asp Cys Pro
20 25 30
Glu Cys Thr Leu Gln Glu Asn Pro Phe Phe Ser Gln Pro Gly Ala Pro
35 40 45
Ile Leu Gln Cys Met Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro
50 55 60
Leu Arg Ser Lys Lys Thr Met Leu Val Gln Cys Asn Val Thr Ser Glu
65 70 75 80
Ser Thr Cys Cys Val Ala Lys Ser Tyr Asn Arg Val Thr Val Met Gly
85 90 95
Gly Phe Lys Val Glu Asn His Thr Ala Cys His Cys Ser Thr Cys Tyr
100 105 110
Tyr His Lys Ser
115
(2) INFORMATION FOR SEQ ID NO:10:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 165 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:10:
Met Glu Met Phe Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Thr Trp Ala Ser Lys Glu Pro Leu Arg Pro Arg Cys Arg Pro Ile
20 25 30
Asn Ala Thr Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Ile Cys Ala Gly Tyr Cys Pro Thr Met Thr Arg Val
50 55 60
Leu Gln Gly Val Leu Pro Ala Leu Pro Gln Val Val Cys Asn Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asn Pro Val Val Ser Tyr Ala Val Ala Leu Ser Cys Gln Cys Ala Leu
100 105 110
Cys Arg Arg Ser Thr Thr Cys Cys Gly Gly Pro Lys Asp His Pro Leu
115 120 125
Thr Cys Asp Asp Pro Arg Phe Gln Asp Ser Ser Ser Ser Lys Ala Pro
130 135 140
Pro Pro Ser Leu Pro Ser Pro Ser Arg Leu Pro Gly Pro Ser Asp Thr
145 150 155 160
Pro Ile Leu Pro Gln
165
(2) INFORMATION FOR SEQ ID NO:11:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 165 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:11:
Met Glu Met Phe Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Thr Trp Ala Ser Lys Glu Pro Leu Arg Pro Arg Cys Arg Pro Ile
20 25 30
Asn Ala Thr Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Ile Cys Ala Gly Tyr Cys Pro Thr Met Thr Arg Val
50 55 60
Leu Gln Gly Val Leu Pro Ala Leu Pro Gln Val Val Cys Asn Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asn Pro Val Val Ser Tyr Ala Val Ala Leu Ser Cys Gln Cys Ala Leu
100 105 110
Cys Arg Arg Ser Thr Thr Cys Cys Thr Val Arg Gly Leu Gly Pro Ser
115 120 125
Tyr Cys Ser Phe Gly Glu Phe Gln Asp Ser Ser Ser Ser Lys Ala Pro
130 135 140
Pro Pro Ser Leu Pro Ser Pro Ser Arg Leu Pro Gly Pro Ser Asp Thr
145 150 155 160
Pro Ile Leu Pro Gln
165
(2) INFORMATION FOR SEQ ID NO:12:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 116 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:12:
Met Asp Tyr Tyr Arg Lys Tyr Ala Ala Ile Phe Leu Val Thr Leu Ser
1 5 10 15
Val Phe Leu His Val Leu His Ser Ala Pro Asp Val Gln Asp Ser Pro
20 25 30
Glu Cys Thr Leu Gln Glu Asn Pro Phe Phe Ser Gln Pro Gly Ala Pro
35 40 45
Ile Leu Gln Cys Met Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro
50 55 60
Leu Arg Ser Lys Lys Thr Met Leu Val Gln Cys Asn Val Thr Ser Glu
65 70 75 80
Ser Thr Cys Cys Val Ala Lys Ser Tyr Asn Arg Val Thr Val Met Gly
85 90 95
Gly Phe Lys Val Glu Asn His Thr Ala Cys His Cys Ser Thr Cys Tyr
100 105 110
Tyr His Lys Ser
115
(2) INFORMATION FOR SEQ ID NO:13:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 165 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:13:
Met Glu Met Phe Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Thr Trp Ala Ser Lys Glu Pro Leu Arg Pro Arg Cys Arg Pro Ile
20 25 30
Asn Ala Thr Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Ile Cys Ala Gly Cys Cys Pro Thr Met Thr Arg Val
50 55 60
Leu Gln Gly Val Leu Pro Ala Leu Pro Gln Val Val Cys Asn Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asn Pro Val Val Ser Tyr Ala Val Ala Leu Ser Cys Gln Cys Ala Leu
100 105 110
Cys Arg Arg Ser Thr Thr Cys Cys Gly Gly Pro Lys Asp His Pro Leu
115 120 125
Thr Cys Asp Asp Pro Arg Phe Gln Asp Ser Ser Ser Ser Lys Ala Pro
130 135 140
Pro Pro Ser Leu Pro Ser Pro Ser Arg Leu Pro Gly Pro Ser Asp Thr
145 150 155 160
Pro Ile Leu Pro Gln
165
(2) INFORMATION FOR SEQ ID NO:14:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 116 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:14:
Met Asp Tyr Tyr Arg Lys Tyr Ala Ala Ile Phe Leu Val Thr Leu Ser
1 5 10 15
Val Phe Leu His Val Leu His Ser Ala Pro Asp Val Gln Asp Ala Pro
20 25 30
Glu Cys Thr Leu Gln Glu Asn Pro Phe Phe Ser Gln Pro Gly Ala Pro
35 40 45
Ile Leu Gln Cys Met Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro
50 55 60
Leu Arg Ser Lys Lys Thr Met Leu Val Gln Lys Asn Val Thr Ser Glu
65 70 75 80
Ser Thr Cys Cys Val Ala Lys Ser Tyr Asn Arg Val Thr Val Met Gly
85 90 95
Gly Phe Lys Val Glu Asn His Thr Ala Cys His Cys Ser Thr Cys Tyr
100 105 110
Tyr His Lys Ser
115
(2) INFORMATION FOR SEQ ID NO:15:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 129 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:15:
Met Lys Thr Leu Gln Phe Phe Phe Leu Phe Leu Leu Trp Lys Ala Ile
1 5 10 15
Cys Cys Asn Ser Cys Glu Leu Thr Asn Ile Thr Ile Ala Val Glu Lys
20 25 30
Glu Gly Cys Gly Phe Cys Ile Thr Ile Asn Thr Thr Trp Cys Ala Gly
35 40 45
Cys Cys Tyr Thr Arg Asp Leu Val Tyr Lys Asp Pro Ala Arg Pro Lys
50 55 60
Ile Gln Lys Thr Cys Thr Phe Lys Glu Leu Val Tyr Glu Thr Val Arg
65 70 75 80
Val Pro Gly Cys Ala His His Ala Asp Ser Leu Tyr Thr Tyr Pro Val
85 90 95
Ala Thr Gln Cys His Cys Gly Lys Cys Asp Ser Asp Ser Thr Asp Cys
100 105 110
Thr Val Arg Gly Leu Gly Pro Ser Tyr Cys Ser Phe Gly Glu Met Lys
115 120 125
Glu
(2) INFORMATION FOR SEQ ID NO:16:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 116 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:16:
Met Asp Tyr Tyr Arg Lys Tyr Ala Ala Ile Phe Leu Val Thr Leu Ser
1 5 10 15
Val Phe Leu His Val Leu His Ser Ala Pro Asp Val Cys Asp Cys Pro
20 25 30
Glu Cys Thr Leu Gln Glu Asn Pro Phe Phe Ser Gln Pro Gly Ala Pro
35 40 45
Ile Leu Gln Cys Met Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro
50 55 60
Leu Arg Ser Lys Lys Thr Met Leu Val Gln Lys Asn Val Thr Ser Glu
65 70 75 80
Ser Thr Cys Cys Val Ala Lys Ser Tyr Asn Arg Val Thr Val Met Gly
85 90 95
Gly Phe Lys Val Glu Asn His Thr Ala Cys His Cys Ser Thr Cys Tyr
100 105 110
Tyr His Lys Ser
115
(2) INFORMATION FOR SEQ ID NO:17:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 165 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:17:
Met Glu Met Phe Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Thr Trp Ala Ser Lys Glu Pro Leu Arg Pro Cys Cys Arg Pro Ile
20 25 30
Asn Ala Thr Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Ile Cys Ala Gly Tyr Cys Pro Thr Met Thr Arg Val
50 55 60
Leu Gln Gly Val Leu Pro Ala Leu Pro Gln Val Val Cys Asn Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asn Pro Val Val Ser Tyr Ala Val Ala Leu Ser Cys Gln Cys Ala Leu
100 105 110
Cys Arg Arg Ser Thr Thr Asp Cys Gly Gly Pro Lys Asp His Pro Leu
115 120 125
Thr Cys Asp Asp Pro Arg Phe Gln Asp Ser Ser Ser Ser Lys Ala Pro
130 135 140
Pro Pro Ser Leu Pro Ser Pro Ser Arg Leu Pro Gly Pro Ser Asp Thr
145 150 155 160
Pro Ile Leu Pro Gln
165
(2) INFORMATION FOR SEQ ID NO:18:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 129 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:18:
Met Lys Thr Leu Gln Phe Phe Phe Leu Phe Leu Leu Trp Lys Ala Ile
1 5 10 15
Cys Cys Asn Cys Cys Glu Leu Thr Asn Ile Thr Ile Ala Val Glu Lys
20 25 30
Glu Gly Cys Gly Phe Cys Ile Thr Ile Asn Thr Thr Trp Cys Ala Gly
35 40 45
Tyr Cys Tyr Thr Arg Asp Leu Val Tyr Lys Asp Pro Ala Arg Pro Lys
50 55 60
Ile Gln Lys Thr Cys Thr Phe Lys Glu Leu Val Tyr Glu Thr Val Arg
65 70 75 80
Val Pro Gly Cys Ala His His Ala Asp Ser Leu Tyr Thr Tyr Pro Val
85 90 95
Ala Thr Gln Cys His Cys Gly Lys Cys Asp Ser Asp Ser Thr Asp Cys
100 105 110
Thr Val Arg Gly Leu Gly Pro Ser Tyr Cys Ser Phe Gly Glu Met Lys
115 120 125
Glu
(2) INFORMATION FOR SEQ ID NO:19:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 141 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:19:
Met Glu Met Leu Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Ala Trp Ala Ser Arg Glu Pro Leu Arg Pro Trp Cys His Pro Ile
20 25 30
Asn Ala Ile Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Ile Cys Ala Gly Cys Cys Pro Thr Met Met Arg Val
50 55 60
Leu Gln Ala Val Leu Pro Pro Leu Pro Gln Val Val Cys Thr Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asp Pro Val Val Ser Phe Pro Val Ala Leu Ser Cys Arg Cys Gly Pro
100 105 110
Cys Arg Arg Ser Thr Ser Asp Cys Gly Gly Pro Lys Asp His Pro Leu
115 120 125
Thr Cys Asp His Pro Gln Leu Ser Gly Leu Leu Phe Leu
130 135 140
(2) INFORMATION FOR SEQ ID NO:20:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 141 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:20:
Met Glu Met Leu Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Ala Trp Ala Ser Arg Glu Pro Leu Arg Pro Cys Cys His Pro Ile
20 25 30
Asn Ala Ile Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Ile Cys Ala Gly Tyr Cys Pro Thr Met Met Arg Val
50 55 60
Leu Gln Ala Val Leu Pro Pro Leu Pro Gln Val Val Cys Thr Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asp Pro Val Val Ser Phe Pro Val Ala Leu Ser Cys Arg Cys Gly Pro
100 105 110
Cys Arg Arg Ser Thr Ser Asp Cys Gly Gly Pro Lys Asp His Pro Leu
115 120 125
Thr Cys Asp His Pro Gln Leu Ser Gly Leu Leu Phe Leu
130 135 140
(2) INFORMATION FOR SEQ ID NO:21:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 132 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:21:
Met Thr Ala Leu Phe Leu Met Ser Met Leu Phe Gly Leu Ala Cys Gly
1 5 10 15
Gln Ala Met Ser Phe Cys Ile Pro Thr Glu Tyr Met Thr His Ile Glu
20 25 30
Arg Arg Glu Cys Ala Tyr Cys Leu Thr Ile Asn Thr Thr Ile Cys Ala
35 40 45
Gly Cys Cys Met Thr Arg Asp Ile Asn Gly Lys Leu Phe Leu Pro Lys
50 55 60
Tyr Ala Leu Ser Gln Asp Val Cys Thr Tyr Arg Asp Phe Ile Tyr Arg
65 70 75 80
Thr Val Glu Ile Pro Gln Cys Pro Leu His Val Ala Pro Tyr Phe Ser
85 90 95
Tyr Pro Val Ala Leu Ser Cys Lys Cys Gly Lys Cys Asn Thr Asp Tyr
100 105 110
Ser Asp Cys Ile His Glu Ala Ile Lys Thr Asn Tyr Cys Thr Lys Pro
115 120 125
Gln Lys Ser Tyr
130
(2) INFORMATION FOR SEQ ID NO:22:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 132 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:22:
Met Thr Ala Leu Phe Leu Met Ser Met Leu Phe Gly Leu Ala Cys Gly
1 5 10 15
Gln Ala Met Ser Cys Cys Ile Pro Thr Glu Tyr Met Thr His Ile Glu
20 25 30
Arg Arg Glu Cys Ala Tyr Cys Leu Thr Ile Asn Thr Thr Ile Cys Ala
35 40 45
Gly Tyr Cys Met Thr Arg Asp Ile Asn Gly Lys Leu Phe Leu Pro Lys
50 55 60
Tyr Ala Leu Ser Gln Asp Val Cys Thr Tyr Arg Asp Phe Ile Tyr Arg
65 70 75 80
Thr Val Glu Ile Pro Gln Cys Pro Leu His Val Ala Pro Tyr Phe Ser
85 90 95
Tyr Pro Val Ala Leu Ser Cys Lys Cys Gly Lys Cys Asn Thr Asp Tyr
100 105 110
Ser Asp Cys Ile His Glu Ala Ile Lys Thr Asn Tyr Cys Thr Lys Pro
115 120 125
Gln Lys Ser Tyr
130
(2) INFORMATION FOR SEQ ID NO:23:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 121 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:23:
Ser Arg Glu Pro Leu Arg Pro Trp Cys His Pro Ile Asn Ala Ile Leu
1 5 10 15
Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr Val Asn Thr Thr
20 25 30
Ile Cys Ala Gly Tyr Cys Pro Thr Met Met Arg Val Leu Gln Ala Val
35 40 45
Leu Pro Pro Leu Pro Gln Val Val Cys Thr Tyr Arg Asp Val Arg Phe
50 55 60
Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val Asp Pro Val Val
65 70 75 80
Ser Phe Pro Val Ala Leu Ser Cys Arg Cys Gly Pro Cys Arg Arg Ser
85 90 95
Thr Ser Asp Cys Gly Gly Pro Lys Asp His Pro Leu Thr Cys Asp His
100 105 110
Pro Gln Leu Ser Gly Leu Leu Phe Leu
115 120
(2) INFORMATION FOR SEQ ID NO:24:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 111 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:24:
Asn Ser Cys Glu Leu Thr Asn Ile Thr Ile Ala Val Glu Lys Glu Gly
1 5 10 15
Cys Gly Phe Cys Ile Thr Ile Asn Thr Thr Trp Cys Ala Gly Tyr Cys
20 25 30
Tyr Thr Arg Asp Leu Val Tyr Lys Asp Pro Ala Arg Pro Lys Ile Gln
35 40 45
Lys Thr Cys Thr Phe Lys Glu Leu Val Tyr Glu Thr Val Arg Val Pro
50 55 60
Gly Cys Ala His His Ala Asp Ser Leu Tyr Thr Tyr Pro Val Ala Thr
65 70 75 80
Gln Cys His Cys Gly Lys Cys Asp Ser Asp Ser Thr Asp Cys Thr Val
85 90 95
Arg Gly Leu Gly Pro Ser Tyr Cys Ser Phe Gly Glu Met Lys Glu
100 105 110
(2) INFORMATION FOR SEQ ID NO:25:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 112 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:25:
Phe Cys Ile Pro Thr Glu Tyr Met Thr His Ile Glu Arg Arg Glu Cys
1 5 10 15
Ala Tyr Cys Leu Thr Ile Asn Thr Thr Ile Cys Ala Gly Tyr Cys Met
20 25 30
Thr Arg Asp Ile Asn Gly Lys Leu Phe Leu Pro Lys Tyr Ala Leu Ser
35 40 45
Gln Asp Val Cys Thr Tyr Arg Asp Phe Ile Tyr Arg Thr Val Glu Ile
50 55 60
Pro Gln Cys Pro Leu His Val Ala Pro Tyr Phe Ser Tyr Pro Val Ala
65 70 75 80
Leu Ser Cys Lys Cys Gly Lys Cys Asn Thr Asp Tyr Ser Asp Cys Ile
85 90 95
His Glu Ala Ile Lys Thr Asn Tyr Cys Thr Lys Pro Gln Lys Ser Tyr
100 105 110
(2) INFORMATION FOR SEQ ID NO:26:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 96 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:26:
Phe Pro Asp Gly Glu Phe Thr Met Gln Gly Cys Pro Glu Cys Lys Leu
1 5 10 15
Lys Glu Asn Lys Tyr Phe Ser Lys Pro Asp Ala Pro Ile Tyr Gln Cys
20 25 30
Met Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro Ala Arg Ser Lys
35 40 45
Lys Thr Met Leu Val Pro Lys Asn Ile Thr Ser Glu Ala Thr Cys Cys
50 55 60
Val Ala Lys Ala Phe Thr Lys Ala Thr Val Met Gly Asn Val Arg Val
65 70 75 80
Glu Asn His Thr Glu Cys His Cys Ser Thr Cys Tyr Tyr His Lys Ser
85 90 95
(2) INFORMATION FOR SEQ ID NO:27:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 96 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:27:
Phe Pro Asp Gly Glu Phe Thr Met Gln Gly Cys Pro Glu Cys Lys Leu
1 5 10 15
Lys Glu Asn Lys Tyr Phe Ser Lys Leu Gly Ala Pro Ile Tyr Gln Cys
20 25 30
Met Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro Ala Arg Ser Lys
35 40 45
Lys Thr Met Leu Val Pro Lys Asn Ile Thr Ser Glu Ala Thr Cys Cys
50 55 60
Val Ala Lys Ala Phe Thr Lys Ala Thr Val Met Gly Asn Ala Arg Val
65 70 75 80
Glu Asn His Thr Glu Cys His Cys Ser Thr Cys Tyr Tyr His Lys Ser
85 90 95
(2) INFORMATION FOR SEQ ID NO:28:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 96 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:28:
Phe Pro Asp Gly Glu Phe Thr Met Gln Gly Cys Pro Glu Cys Lys Leu
1 5 10 15
Lys Glu Asn Lys Tyr Phe Ser Lys Pro Asp Ala Pro Ile Tyr Gln Cys
20 25 30
Met Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro Ala Arg Ser Lys
35 40 45
Lys Thr Met Leu Val Pro Lys Asn Ile Thr Ser Glu Ala Thr Cys Cys
50 55 60
Val Ala Lys Ala Phe Thr Lys Ala Thr Val Met Gly Asn Val Arg Val
65 70 75 80
Glu Asn His Thr Glu Cys His Cys Ser Thr Cys Tyr Tyr His Lys Ser
85 90 95
(2) INFORMATION FOR SEQ ID NO:29:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 96 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:29:
Phe Pro Asp Gly Glu Phe Thr Thr Gln Asp Cys Pro Glu Cys Lys Leu
1 5 10 15
Arg Glu Asn Lys Tyr Phe Phe Lys Leu Gly Val Pro Ile Tyr Gln Cys
20 25 30
Lys Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro Ala Arg Ser Arg
35 40 45
Lys Thr Met Leu Val Pro Lys Asn Ile Thr Ser Glu Ser Thr Cys Cys
50 55 60
Val Ala Lys Ala Phe Ile Arg Val Thr Val Met Gly Asn Ile Lys Leu
65 70 75 80
Glu Asn His Thr Gln Cys Tyr Cys Ser Thr Cys Tyr His His Lys Ile
85 90 95
(2) INFORMATION FOR SEQ ID NO:30:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 96 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:30:
Leu Pro Asp Gly Asp Leu Ile Ile Gln Gly Cys Pro Glu Cys Lys Leu
1 5 10 15
Lys Glu Asn Lys Tyr Phe Ser Lys Leu Gly Ala Pro Ile Tyr Gln Cys
20 25 30
Met Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro Ala Arg Ser Lys
35 40 45
Lys Thr Met Leu Val Pro Lys Asn Ile Thr Ser Glu Ala Thr Cys Cys
50 55 60
Val Ala Lys Ser Phe Thr Lys Ala Thr Val Met Gly Asn Ala Arg Val
65 70 75 80
Glu Asn His Thr Lys Cys His Cys Ser Thr Cys Tyr Tyr His Lys Ser
85 90 95
(2) INFORMATION FOR SEQ ID NO:31:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 96 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:31:
Leu Pro Asp Gly Asp Phe Ile Ile Gln Gly Cys Pro Glu Cys Lys Leu
1 5 10 15
Lys Glu Asn Lys Tyr Phe Ser Lys Leu Gly Ala Pro Ile Tyr Gln Cys
20 25 30
Met Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro Ala Arg Ser Lys
35 40 45
Lys Thr Met Leu Val Pro Lys Asn Ile Thr Ser Glu Ala Thr Cys Cys
50 55 60
Val Ala Lys Ala Phe Thr Lys Ala Thr Val Met Gly Asn Ala Arg Val
65 70 75 80
Glu Asn His Thr Glu Cys His Cys Ser Thr Cys Tyr Tyr His Lys Ser
85 90 95
(2) INFORMATION FOR SEQ ID NO:32:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 96 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:32:
Phe Pro Asp Gly Glu Phe Ala Met Gln Gly Cys Pro Glu Cys Lys Leu
1 5 10 15
Lys Glu Asn Lys Tyr Phe Ser Lys Leu Gly Ala Pro Ile Tyr Gln Cys
20 25 30
Met Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro Ala Arg Ser Lys
35 40 45
Lys Thr Met Leu Val Pro Lys Asn Ile Thr Ser Glu Ala Gly Cys Cys
50 55 60
Val Ala Lys Ala Phe Thr Lys Ala Thr Val Met Gly Asn Ala Lys Val
65 70 75 80
Glu Asn His Thr Glu Cys His Cys Ser Thr Cys Tyr Tyr His Lys Ser
85 90 95
(2) INFORMATION FOR SEQ ID NO:33:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 96 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:33:
Phe Pro Asp Gly Glu Phe Leu Met Gln Gly Cys Pro Glu Cys Lys Leu
1 5 10 15
Lys Glu Asn Arg Phe Phe Ser Lys Pro Gly Ala Pro Ile Tyr Gln Cys
20 25 30
Thr Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro Met Arg Ser Lys
35 40 45
Lys Thr Met Leu Val Pro Lys Asn Ile Thr Ser Glu Ala Thr Cys Cys
50 55 60
Val Ala Lys Ala Phe Thr Lys Ile Thr Leu Lys Asp Asn Val Arg Ile
65 70 75 80
Glu Asn His Thr Glu Cys His Cys Ser Thr Cys Tyr Tyr His Tyr Ser
85 90 95
(2) INFORMATION FOR SEQ ID NO:34:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 95 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:34:
Tyr Pro Arg Asn Asp Met Asn Asn Phe Gly Cys Glu Glu Cys Lys Leu
1 5 10 15
Lys Glu Asn Asn Ile Phe Ser Lys Pro Gly Ala Pro Val Tyr Gln Cys
20 25 30
Met Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro Leu Arg Ser Lys
35 40 45
Lys Thr Met Leu Val Pro Lys Asn Ile Thr Ser Glu Ala Thr Cys Cys
50 55 60
Val Ala Lys Glu Val Lys Lys Ile Leu Val Asn Asp Val Lys Leu Val
65 70 75 80
Asn His Thr Asp Cys His Cys Ser Thr Cys Tyr Tyr His Lys Ser
85 90 95
(2) INFORMATION FOR SEQ ID NO:35:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 95 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:35:
Tyr Pro Arg Asn Tyr Met Asn Asn Phe Gly Cys Glu Glu Cys Thr Leu
1 5 10 15
Lys Glu Asn Asn Ile Phe Ser Lys Pro Gly Ala Pro Val Tyr Gln Cys
20 25 30
Met Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro Leu Arg Ser Lys
35 40 45
Lys Thr Met Leu Val Pro Lys Asn Ile Thr Ser Glu Ala Thr Cys Cys
50 55 60
Val Ala Lys Glu Phe Lys Gln Val Leu Val Asn Asp Ile Lys Leu Val
65 70 75 80
Asn His Thr Asp Cys His Cys Ser Thr Cys Tyr Tyr His Lys Ser
85 90 95
(2) INFORMATION FOR SEQ ID NO:36:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 93 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:36:
Tyr Pro Asn Asn Glu Met Ala Arg Gly Gly Cys Asp Glu Cys Arg Leu
1 5 10 15
Gln Glu Asn Lys Ile Phe Ser Lys Pro Ser Ala Pro Ile Phe Gln Cys
20 25 30
Val Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro Leu Arg Ser Lys
35 40 45
Lys Thr Met Leu Val Pro Lys Asn Ile Thr Ser Glu Ala Thr Cys Cys
50 55 60
Val Ala Arg Glu Val Thr Arg Leu Asp Asn Met Lys Leu Glu Asn His
65 70 75 80
Thr Asp Cys Gly Cys Ser Thr Cys Tyr Tyr His Lys Phe
85 90
(2) INFORMATION FOR SEQ ID NO:37:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 93 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:37:
Tyr Pro Asn Asn Glu Ile Ser Arg Gly Gly Cys Asp Glu Cys Arg Leu
1 5 10 15
Lys Asp Asn Lys Phe Phe Ser Lys Pro Ser Ala Pro Ile Phe Gln Cys
20 25 30
Val Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro Leu Arg Ser Lys
35 40 45
Lys Thr Met Leu Val Pro Lys Asp Ile Thr Ser Glu Ala Thr Cys Cys
50 55 60
Val Ala Arg Glu Val Thr Lys Leu Asp Asn Met Lys Leu Glu Asn His
65 70 75 80
Thr Asp Cys His Cys Ser Thr Cys Tyr Tyr His Lys Ser
85 90
(2) INFORMATION FOR SEQ ID NO:38:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 95 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:38:
Tyr Gln Asn Ser Asp Met Thr Asn Val Gly Cys Glu Glu Cys Lys Leu
1 5 10 15
Lys Glu Asn Lys Val Phe Ser Asn Pro Gly Ala Pro Val Leu Gln Cys
20 25 30
Thr Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro Leu Gln Ser Lys
35 40 45
Lys Ala Met Leu Val Pro Lys Asn Ile Thr Ser Glu Ala Thr Cys Cys
50 55 60
Val Ala Lys Glu Gly Glu Arg Val Val Val Asp Asn Ile Lys Leu Thr
65 70 75 80
Asn His Thr Glu Cys Trp Cys Asn Thr Cys Tyr His His Lys Ser
85 90 95
(2) INFORMATION FOR SEQ ID NO:39:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 96 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:39:
Tyr Pro Asn Ser Asp Lys Thr Asn Met Gly Cys Glu Glu Cys Lys Leu
1 5 10 15
Lys Pro Asn Thr Ile Phe Pro Asn Pro Gly Ala Pro Ile Met Gln Cys
20 25 30
Thr Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro Leu Arg Ser Lys
35 40 45
Gln Thr Met Leu Val Pro Lys Asn Ile Thr Ser Glu Ala Thr Cys Cys
50 55 60
Val Ala Lys Glu Gly Glu Arg Val Thr Thr Lys Asp Gly Phe Pro Val
65 70 75 80
Thr Asn His Thr Glu Cys His Cys Ser Thr Cys Tyr Tyr His Lys Ser
85 90 95
(2) INFORMATION FOR SEQ ID NO:40:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 149 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:40:
Ser Arg Gly Pro Leu Arg Pro Leu Cys Arg Pro Ile Asn Ala Thr Leu
1 5 10 15
Ala Ala Glu Lys Glu Ala Cys Pro Ile Cys Ile Thr Phe Thr Thr Ser
20 25 30
Ile Cys Ala Gly Tyr Cys Pro Ser Met Val Arg Val Met Pro Ala Ala
35 40 45
Leu Pro Ala Ile Pro Gln Pro Val Cys Thr Tyr Arg Glu Leu Arg Phe
50 55 60
Ala Ser Ile Arg Leu Pro Gly Cys Pro Pro Gly Val Asp Pro Met Val
65 70 75 80
Ser Phe Pro Val Ala Leu Ser Cys His Cys Gly Pro Cys Gln Ile Lys
85 90 95
Thr Thr Asp Cys Gly Val Phe Arg Asp Gln Pro Leu Ala Cys Ala Pro
100 105 110
Gln Ala Ser Ser Ser Ser Lys Asp Pro Pro Ser Gln Pro Leu Thr Ser
115 120 125
Thr Ser Thr Pro Thr Pro Gly Ala Ser Arg Arg Ser Ser His Pro Leu
130 135 140
Pro Ile Lys Thr Ser
145
(2) INFORMATION FOR SEQ ID NO:41:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 121 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:41:
Ser Arg Gly Pro Leu Arg Pro Leu Cys Arg Pro Ile Asn Ala Thr Leu
1 5 10 15
Ala Ala Glu Asn Glu Ala Cys Pro Val Cys Ile Thr Phe Thr Thr Thr
20 25 30
Ile Cys Ala Gly Tyr Cys Pro Ser Met Val Arg Val Leu Pro Ala Ala
35 40 45
Leu Pro Pro Val Pro Gln Pro Val Cys Thr Tyr His Glu Leu His Phe
50 55 60
Ala Ser Ile Arg Leu Pro Gly Cys Pro Pro Gly Val Asp Pro Met Val
65 70 75 80
Ser Phe Pro Val Ala Leu Ser Cys Arg Cys Gly Pro Cys Arg Leu Ser
85 90 95
Asn Ser Asp Cys Gly Gly Pro Arg Ala Gln Ser Leu Ala Cys Asp Arg
100 105 110
Pro Leu Leu Pro Gly Leu Leu Phe Leu
115 120
(2) INFORMATION FOR SEQ ID NO:42:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 119 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:42:
Leu Gly Gly Gly Gly Arg Pro Pro Cys Arg Pro Ile Asn Val Thr Val
1 5 10 15
Ala Val Glu Lys Asp Gly Cys Pro Gln Cys Met Ala Val Thr Thr Thr
20 25 30
Ala Cys Gly Gly Thr Cys Arg Thr Arg Glu Pro Val Tyr Arg Ser Pro
35 40 45
Leu Gly Pro Pro Pro Gln Ser Ala Cys Thr Tyr Gly Ala Leu Arg Tyr
50 55 60
Glu Arg Trp Ala Leu Trp Gly Cys Pro Ile Gly Ser Asp Pro Arg Val
65 70 75 80
Leu Leu Pro Val Ala Leu Ser Cys Arg Cys Ala Arg Cys Pro Met Ala
85 90 95
Thr Ser Asp Cys Thr Val Gln Gly Leu Gly Pro Ala Phe Cys Gly Ala
100 105 110
Pro Gly Gly Phe Gly Gly Glu
115
(2) INFORMATION FOR SEQ ID NO:43:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 121 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:43:
Ser Arg Gly Pro Leu Arg Pro Leu Cys Gln Pro Ile Asn Ala Thr Leu
1 5 10 15
Ala Ala Glu Lys Glu Ala Cys Pro Val Cys Ile Thr Phe Thr Thr Ser
20 25 30
Ile Cys Ala Gly Tyr Cys Pro Ser Met Lys Arg Val Leu Pro Val Ile
35 40 45
Leu Pro Pro Met Pro Gln Arg Val Cys Thr Tyr His Glu Leu Arg Phe
50 55 60
Ala Ser Val Arg Ile Pro Gly Cys Pro Pro Gly Val Asp Pro Met Val
65 70 75 80
Ser Phe Pro Val Ala Leu Ser Cys His Cys Gly Pro Cys Arg Leu Ser
85 90 95
Ser Thr Asp Cys Gly Gly Pro Arg Thr Gln Pro Leu Ala Cys Asp His
100 105 110
Pro Pro Leu Pro Asp Ile Leu Phe Leu
115 120
(2) INFORMATION FOR SEQ ID NO:44:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 119 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:44:
Ser Arg Gly Pro Leu Arg Pro Leu Cys Gln Pro Ile Asn Ala Thr Leu
1 5 10 15
Ala Ala Glu Lys Glu Ala Cys Pro Val Cys Ile Thr Phe Thr Thr Ser
20 25 30
Ile Cys Ala Gly Tyr Cys Pro Ser Met Lys Arg Val Leu Pro Val Ile
35 40 45
Leu Pro Pro Met Pro Gln Arg Val Cys Thr Tyr His Glu Leu Arg Phe
50 55 60
Ala Ser Val Arg Leu Pro Gly Cys Pro Pro Gly Val Asp Pro Met Val
65 70 75 80
Ser Phe Pro Val Ala Leu Ser Cys His Cys Gly Pro Cys Arg Leu Ser
85 90 95
Ser Thr Asp Cys Gly Pro Gly Arg Thr Gln Pro Leu Ala Cys Asp His
100 105 110
Pro Pro Leu Pro Asp Ile Leu
115
(2) INFORMATION FOR SEQ ID NO:45:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 120 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:45:
Pro Glu Pro Ala Arg Gly Pro Leu Arg Pro Leu Cys Arg Pro Val Asn
1 5 10 15
Ala Thr Leu Ala Ala Glu Asn Glu Ala Cys Pro Val Cys Ile Thr Phe
20 25 30
Thr Thr Ser Ile Cys Ala Gly Tyr Cys Pro Ser Met Val Arg Val Leu
35 40 45
Pro Ala Ala Leu Pro Pro Val Pro Gln Pro Val Cys Thr Tyr Arg Glu
50 55 60
Leu Arg Phe Ala Ser Ile Arg Leu Pro Gly Cys Pro Pro Gly Val Asp
65 70 75 80
Pro Glu Val Ser Phe Pro Val Ala Leu Ser Cys Arg Cys Gly Pro Cys
85 90 95
Arg Leu Ser Ser Ser Asp Cys Gly Gly Pro Arg Ala Glu Pro Leu Ala
100 105 110
Cys Asp Leu Pro His Leu Pro Gly
115 120
(2) INFORMATION FOR SEQ ID NO:46:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 119 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:46:
Ser Leu Met Gln Pro Cys Gln Pro Ile Asn Gln Thr Val Ser Leu Glu
1 5 10 15
Lys Glu Gly Cys Pro Thr Cys Leu Val Ile Arg Ala Pro Ile Cys Ser
20 25 30
Gly His Cys Val Thr Lys Glu Pro Val Phe Lys Ser Pro Phe Ser Thr
35 40 45
Val Thr Gln His Val Cys Thr Tyr Arg Asp Val Arg Tyr Glu Met Ile
50 55 60
Arg Leu Pro Asp Cys Pro Pro Trp Ser Glu Pro His Val Thr Tyr Pro
65 70 75 80
Val Ala Leu Ser Cys Asp Cys Ser Leu Cys Asn Met Asp Thr Ser Asp
85 90 95
Cys Thr Ile Glu Ser Leu Gln Pro Asp Phe Cys Ile Thr Gln Arg Val
100 105 110
Leu Thr Asp Gly Asp Met Trp
115
(2) INFORMATION FOR SEQ ID NO:47:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 113 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:47:
Gly Thr Glu Cys Arg Tyr Gly Cys Arg Leu Asn Asn Met Thr Ile Ile
1 5 10 15
Val Glu Arg Glu Asp Cys His Gly Ser Ile Thr Ile Thr Thr Cys Ala
20 25 30
Gly Leu Cys Glu Thr Thr Asp Leu Asn Tyr Glu Ser Thr Trp Leu Pro
35 40 45
Arg Ser Gln Gly Val Cys Asn Phe Lys Glu Trp Ser Tyr Glu Lys Val
50 55 60
Tyr Leu Glu Gly Cys Pro Ser Gly Val Glu Pro Phe Phe Ile Pro Val
65 70 75 80
Ala Lys Ser Cys Asp Cys Ile Lys Cys Lys Thr Asp Asn Thr Asp Cys
85 90 95
Asp Arg Ile Ser Met Ala Thr Pro Ser Cys Ile Val Asn Pro Leu Glu
100 105 110
Met
(2) INFORMATION FOR SEQ ID NO:48:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 119 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:48:
Ser Leu Met Gln Pro Cys Gln Pro Ile Asn Gln Thr Val Ser Leu Glu
1 5 10 15
Lys Glu Gly Cys Pro Thr Cys Leu Val Ile Gln Thr Pro Ile Cys Ser
20 25 30
Gly His Cys Val Thr Lys Glu Pro Val Phe Lys Ser Pro Phe Ser Thr
35 40 45
Val Ile Gln His Val Cys Thr Tyr Arg Asp Val Arg Tyr Glu Thr Ile
50 55 60
Arg Leu Pro Asp Cys Pro Pro Trp Val Asp Pro His Val Thr Tyr Pro
65 70 75 80
Val Ala Leu Ser Cys Asp Cys Ser Leu Cys Asn Met Asp Thr Ser Asp
85 90 95
Cys Thr Ile Glu Ser Leu Gln Pro Asp Phe Cys Ile Thr Gln Arg Val
100 105 110
Leu Thr Asp Gly Asp Met Trp
115
(2) INFORMATION FOR SEQ ID NO:49:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 111 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:49:
Asn Ser Cys Glu Leu Thr Asn Ile Thr Ile Ala Ile Glu Lys Glu Glu
1 5 10 15
Cys Arg Phe Cys Ile Ser Ile Asn Thr Thr Trp Cys Ala Gly Tyr Cys
20 25 30
Tyr Thr Arg Asp Leu Val Tyr Lys Asp Pro Ala Arg Pro Asn Ile Gln
35 40 45
Lys Thr Cys Thr Phe Lys Glu Leu Val Tyr Glu Thr Val Lys Val Pro
50 55 60
Gly Cys Ala His His Ala Asp Ser Leu Tyr Thr Tyr Pro Val Ala Thr
65 70 75 80
Ala Cys His Cys Gly Lys Cys Asn Ser Asp Ser Thr Asp Cys Thr Val
85 90 95
Arg Gly Leu Gly Pro Ser Tyr Cys Ser Phe Gly Asp Met Lys Glu
100 105 110
(2) INFORMATION FOR SEQ ID NO:50:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 110 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:50:
Ser Cys Glu Leu Thr Asn Ile Thr Ile Thr Val Glu Lys Glu Glu Cys
1 5 10 15
Ser Phe Cys Ile Ser Ile Asn Thr Thr Trp Cys Ala Gly Tyr Cys Tyr
20 25 30
Thr Arg Asp Leu Val Tyr Lys Asp Pro Ala Arg Pro Asn Ile Gln Lys
35 40 45
Thr Cys Thr Phe Lys Glu Leu Val Tyr Glu Thr Val Lys Val Pro Gly
50 55 60
Cys Ala His His Ala Asp Ser Leu Tyr Thr Tyr Pro Val Ala Thr Glu
65 70 75 80
Cys His Cys Gly Lys Cys Asp Ser Asp Ser Thr Asp Cys Thr Val Arg
85 90 95
Gly Leu Gly Pro Ser Tyr Cys Ser Phe Ser Asp Ile Glu Arg
100 105 110
(2) INFORMATION FOR SEQ ID NO:51:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 110 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:51:
Ser Cys Glu Leu Thr Asn Ile Thr Ile Thr Val Glu Lys Glu Glu Cys
1 5 10 15
Gly Phe Cys Ile Ser Ile Asn Thr Thr Trp Cys Ala Gly Tyr Cys Tyr
20 25 30
Thr Arg Asp Leu Val Tyr Arg Asp Pro Ala Arg Pro Asn Ile Gln Lys
35 40 45
Thr Cys Thr Phe Lys Glu Leu Val Tyr Glu Thr Val Lys Val Pro Gly
50 55 60
Cys Ala His His Ala Asp Ser Leu Tyr Thr Tyr Pro Val Ala Thr Glu
65 70 75 80
Cys His Cys Ser Lys Cys Asp Ser Asp Ser Thr Asp Cys Thr Val Arg
85 90 95
Gly Leu Gly Pro Ser Tyr Cys Ser Phe Arg Glu Ile Lys Glu
100 105 110
(2) INFORMATION FOR SEQ ID NO:52:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 111 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:52:
Asn Ser Cys Glu Leu Thr Asn Ile Thr Ile Thr Val Glu Lys Glu Glu
1 5 10 15
Cys Asn Phe Cys Ile Ser Ile Asn Thr Thr Trp Cys Ala Gly Tyr Cys
20 25 30
Tyr Thr Arg Asp Leu Val Tyr Lys Asp Pro Ala Arg Pro Asn Ile Gln
35 40 45
Lys Thr Cys Thr Phe Lys Glu Leu Val Tyr Glu Thr Val Lys Val Pro
50 55 60
Gly Cys Ala His His Ala Asp Ser Leu Tyr Thr Tyr Pro Val Ala Thr
65 70 75 80
Glu Cys His Cys Gly Lys Cys Asp Ser Asp Ser Thr Asp Cys Thr Val
85 90 95
Arg Gly Leu Gly Pro Ser Tyr Cys Ser Phe Ser Glu Met Lys Glu
100 105 110
(2) INFORMATION FOR SEQ ID NO:53:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 110 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:53:
Ser Cys Glu Leu Thr Asn Ile Thr Ile Ser Val Glu Lys Glu Glu Cys
1 5 10 15
Arg Phe Cys Ile Ser Ile Asn Thr Thr Trp Cys Glu Gly Tyr Cys Tyr
20 25 30
Thr Arg Asp Leu Val Tyr Lys Asp Pro Ala Arg Pro Asn Thr Gln Lys
35 40 45
Val Cys Thr Phe Lys Glu Leu Val Tyr Glu Thr Ile Arg Leu Pro Gly
50 55 60
Cys Ala Arg His Ser Asp Ser Leu Tyr Thr Tyr Pro Val Ala Thr Glu
65 70 75 80
Cys His Cys Gly Lys Cys Asp Ser Asp Ser Thr Asp Cys Thr Val Arg
85 90 95
Gly Leu Gly Pro Ser Tyr Cys Ser Phe Gly Glu Met Lys Glu
100 105 110
(2) INFORMATION FOR SEQ ID NO:54:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 117 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:54:
Phe Cys Ile Pro Thr Glu Tyr Met Met His Val Glu Arg Lys Glu Cys
1 5 10 15
Ala Tyr Cys Leu Thr Ile Asn Thr Thr Val Cys Ala Gly Tyr Cys Met
20 25 30
Thr Arg Asp Val Asn Gly Lys Leu Phe Leu Pro Lys Tyr Ala Leu Ser
35 40 45
Gln Asp Val Cys Thr Tyr Arg Asp Met Tyr Lys Thr Ala Glu Ile Pro
50 55 60
Gln Cys Pro Arg His Val Thr Pro Tyr Phe Ser Tyr Pro Val Ala Ile
65 70 75 80
Ser Cys Lys Cys Gly Lys Cys Asn Thr Asp Tyr Ser Asp Cys Ile His
85 90 95
Glu Ala Ile Lys Thr Asn Tyr Cys Thr Lys Pro Gln Lys Ser Tyr Met
100 105 110
Val Gly Phe Ser Ile
115
(2) INFORMATION FOR SEQ ID NO:55:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 111 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:55:
Phe Cys Ile Pro Thr Glu Tyr Met Met His Val Glu Arg Lys Glu Cys
1 5 10 15
Ala Tyr Cys Leu Thr Ile Asn Ser Thr Ile Cys Ala Gly Tyr Cys Met
20 25 30
Thr Arg Asp Phe Asp Gly Lys Leu Phe Leu Pro Lys Tyr Ala Leu Ser
35 40 45
Gln Asp Val Cys Thr Tyr Arg Asp Met Tyr Lys Thr Val Glu Ile Pro
50 55 60
Gln Cys Pro His His Val Thr Pro Tyr Phe Ser Tyr Pro Val Ala Ile
65 70 75 80
Ser Cys Lys Cys Gly Lys Cys Asp Thr Asp Tyr Ser Asp Cys Ile His
85 90 95
Glu Ala Ile Lys Thr Asn Tyr Cys Thr Lys Pro Glu Lys Ser Tyr
100 105 110
(2) INFORMATION FOR SEQ ID NO:56:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 117 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:56:
Phe Cys Ile Pro Thr Glu Tyr Thr Met Tyr Val Asp Arg Arg Glu Cys
1 5 10 15
Ala Tyr Cys Leu Thr Ile Asn Thr Thr Ile Cys Ala Gly Tyr Cys Met
20 25 30
Thr Arg Asp Ile Asn Gly Lys Leu Phe Leu Pro Lys Tyr Ala Leu Ser
35 40 45
Gln Asp Val Cys Thr Tyr Arg Asp Ile Tyr Arg Thr Val Glu Ile Pro
50 55 60
Gln Cys Pro His His Val Thr Pro Tyr Phe Ser Phe Pro Val Ala Val
65 70 75 80
Ser Cys Lys Cys Gly Lys Cys Asn Thr Asp Asn Ser Asp Cys Ile His
85 90 95
Glu Ala Val Arg Thr Asn Tyr Cys Thr Lys Pro Gln Ser Phe Tyr Leu
100 105 110
Gly Gly Phe Ser Tyr
115
(2) INFORMATION FOR SEQ ID NO:57:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 117 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:57:
Phe Cys Ile Pro Thr Glu Tyr Met Met Tyr Val Asp Arg Arg Glu Cys
1 5 10 15
Ala Tyr Cys Leu Thr Ile Asn Thr Thr Ile Cys Ala Gly Tyr Cys Met
20 25 30
Thr Arg Asp Ile Asn Gly Lys Leu Phe Leu Pro Lys Tyr Ala Leu Ser
35 40 45
Gln Asp Val Cys Thr Tyr Arg Asp Thr Tyr Arg Thr Val Glu Ile Pro
50 55 60
Gln Cys Pro His His Val Ala Pro Tyr Phe Ser Tyr Pro Val Ala Leu
65 70 75 80
Ser Cys Lys Cys Gly Lys Cys Asn Thr Asp Tyr Ser Asp Cys Thr His
85 90 95
Glu Ala Val Lys Thr Asn Tyr Cys Thr Lys Pro Gln Thr Phe Tyr Leu
100 105 110
Gly Gly Phe Ser Gly
115
(2) INFORMATION FOR SEQ ID NO:58:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 23 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:58:
AGCTGTCCTG GAGCTAGGAA TCT 23
(2) INFORMATION FOR SEQ ID NO:59:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 23 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:59:
CTAGCCTAGA AGCTCTGACT GTC 23
(2) INFORMATION FOR SEQ ID NO:60:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 49 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:60:
AGCTGTCCTG GAGCTAGGAA TCTCTGTACG GAAGTGTTAC TTCTGCTCT 49
(2) INFORMATION FOR SEQ ID NO:61:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 49 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:61:
CTAGCCTAGA AGCTCTGACT GTCCTAGTTG TGGTTTGTCC AAACTCATC 49
(2) INFORMATION FOR SEQ ID NO:62:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 34 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:62:
AACCGCCCTG AACACATCCT GCAAAAAGCC CAGA 34
(2) INFORMATION FOR SEQ ID NO:63:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 69 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:63:
GTGGCTCTCA GCTGTCAATG CGCGCTCTGC CGCAGATCTA CCACTGACTG CGGGGTCCCT 60
AAGGACCAC 69
(2) INFORMATION FOR SEQ ID NO:64:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 72 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:64:
CCACACGGAT CCGAGCTCTT AGCGGGGGTC ATCACAGGTC AAGGGGTGGT CCTTAGGGAC 60
CCCGCAGTCA GT 72
(2) INFORMATION FOR SEQ ID NO:65:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 45 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:65:
ACTGTCCGGG GCTTGGGTCC CTTGACCTGT GATGACCCCC GCTTC 45
(2) INFORMATION FOR SEQ ID NO:66:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 48 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:66:
GGGACCCAAG CCGCGGACAG TACAGTCAGT ACTGTCGCTG TCGCAGAG 48
(2) INFORMATION FOR SEQ ID NO:67:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 39 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:67:
CCCAAGACCG CGGACAGTGC AGTCAGTGGT AGATCTGCG 39
(2) INFORMATION FOR SEQ ID NO:68:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 72 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:68:
TGCACTGTCC GCGGTCTTGG CCCAAGCTAT TGCAGCTTCG GCGAATTCCA GGACTCCTCT 60
TCCTCAAAGG CC 72
(2) INFORMATION FOR SEQ ID NO:69:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 35 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:69:
GATCCTTAAG ATTTGTGATA ATAACAAGTA CTGCA 35
(2) INFORMATION FOR SEQ ID NO:70:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 81 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:70:
GGTTCTGGTA CCGATGACGA TGACAAGTCT AAAGAACCGC TGCGGCCGCG TTGCCGCCCC 60
ATCAATGCCA CCCTGGCTGT G 81
(2) INFORMATION FOR SEQ ID NO:71:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 42 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:71:
CCCACCGGAT CCTTAAGATT TGTGATAATA ACAAGTACTG CA 42
(2) INFORMATION FOR SEQ ID NO:72:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 84 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:72:
TGCTTCTCTA GAGCATATCC AACTCCATTG AGATCTAAGA AGACTATGTT GGTCCAAAAG 60
CAAGTCACTA GTGAGTCCAC TTGC 84
(2) INFORMATION FOR SEQ ID NO:73:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 34 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:73:
CCGGCTGTTG TCCTACCATG ACACGTGTGC TGCA 34
(2) INFORMATION FOR SEQ ID NO:74:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 39 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:74:
CTGTAGCGTG CATTCCGGAC TATCCTGCAC ATCAGGAGC 39
(2) INFORMATION FOR SEQ ID NO:75:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 60 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:75:
CCATTGAGAT CTAAGAAGAC TATGTTGGTC CAAAAGGACG TCACTAGTGA GTCCACTTGC 60
(2) INFORMATION FOR SEQ ID NO:76:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 45 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:76:
ACAAGTACTG CAGTGACAAG CAGTGTGTTG CTCCACTTTG AAACC 45
(2) INFORMATION FOR SEQ ID NO:77:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 26 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:77:
GCACACGTGT CATGGTAGGA CAACAG 26
(2) INFORMATION FOR SEQ ID NO:78:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 17 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:78:
GATCTGCTAG CTAAGCA 17
(2) INFORMATION FOR SEQ ID NO:79:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 17 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:79:
CTAGTGCTTA GCTAGCA 17
(2) INFORMATION FOR SEQ ID NO:80:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 36 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:80:
GATCTAAGAA GACTATGCTT GTACAATGTA ACGTTA 36
(2) INFORMATION FOR SEQ ID NO:81:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 36 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:81:
CTAGTAACGT TACATTGTAC AAGCATAGTC TTCTTA 36
(2) INFORMATION FOR SEQ ID NO:82:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 20 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:82:
GGACTGTACA ACAAGTAGTA 20
(2) INFORMATION FOR SEQ ID NO:83:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 26 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:83:
GATCTACTAC TTGTTGTACA GTCCGC 26
(2) INFORMATION FOR SEQ ID NO:84:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 42 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:84:
TGCCGCAGAT CTACTACTTG CTGCGGGGGT CCCAAGGACC AC 42
(2) INFORMATION FOR SEQ ID NO:85:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 54 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:85:
CCATTGAGAT CTAAGAAGAC TATGTTGGTC CAAAAGAACG TCACTAGTGA GTCC 54
(2) INFORMATION FOR SEQ ID NO:86:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 57 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:86:
ACAAGTACTG CAGTGACACG CCGTGTGGTT CTCACATTTA AAACCCCCCA TTACTGT 57
(2) INFORMATION FOR SEQ ID NO:87:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 34 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:87:
CCGGCTATTG TCCTACTATG ACGCGTTGTC TGCA 34
(2) INFORMATION FOR SEQ ID NO:88:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 26 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:88:
GACAACGCGT CATAGTAGGA CAATAG 26
(2) INFORMATION FOR SEQ ID NO:89:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 12 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:89:
CTGTGCTATA AG 12
(2) INFORMATION FOR SEQ ID NO:90:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 19 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:90:
GTCCTTATAG CACAGATCC 19
(2) INFORMATION FOR SEQ ID NO:91:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 32 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:91:
CTTAATACGA CTCACTATAG GCTAGCCTCG AG 32
(2) INFORMATION FOR SEQ ID NO:92:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 45 base pairs
(B) TYPE: nucleic acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: cDNA
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:92:
CATCCCGCGG CACCTAGGAC AAAGCGGCTC CTTGGATGCC CATGT 45
(2) INFORMATION FOR SEQ ID NO:93:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 116 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:93:
Met Asp Tyr Tyr Arg Lys Tyr Ala Ala Ile Phe Leu Val Thr Leu Ser
1 5 10 15
Val Phe Leu His Val Leu His Ser Ala Pro Asp Val Gln Asp Cys Pro
20 25 30
Glu Cys Thr Leu Gln Glu Asn Pro Phe Phe Ser Gln Pro Gly Ala Pro
35 40 45
Ile Leu Gln Cys Met Gly Ala Cys Phe Ser Arg Ala Tyr Pro Thr Pro
50 55 60
Leu Arg Ser Lys Lys Thr Met Leu Val Gln Lys Asn Val Thr Ser Glu
65 70 75 80
Ser Thr Cys Cys Val Ala Lys Ser Tyr Asn Arg Val Thr Val Met Gly
85 90 95
Gly Phe Lys Val Glu Asn His Thr Ala Cys His Cys Ser Thr Cys Tyr
100 105 110
Tyr His Lys Ser
115
(2) INFORMATION FOR SEQ ID NO:94:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 116 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:94:
Met Asp Tyr Tyr Arg Lys Tyr Ala Ala Ile Phe Leu Val Thr Leu Ser
1 5 10 15
Val Phe Leu His Val Leu His Ser Ala Pro Asp Val Gln Asp Cys Pro
20 25 30
Glu Cys Thr Leu Gln Glu Asn Pro Phe Phe Ser Gln Pro Gly Ala Pro
35 40 45
Ile Leu Cys Cys Met Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro
50 55 60
Leu Arg Ser Lys Lys Thr Met Leu Val Gln Lys Asn Val Thr Ser Glu
65 70 75 80
Ser Thr Cys Cys Val Ala Lys Ser Tyr Asn Arg Val Thr Val Met Gly
85 90 95
Gly Phe Lys Val Glu Asn His Thr Ala Cys His Cys Ser Thr Cys Tyr
100 105 110
Tyr His Lys Ser
115
(2) INFORMATION FOR SEQ ID NO:95:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 116 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:95:
Met Asp Tyr Tyr Arg Lys Tyr Ala Ala Ile Phe Leu Val Thr Leu Ser
1 5 10 15
Val Phe Leu His Val Leu His Ser Ala Pro Asp Val Gln Asp Cys Pro
20 25 30
Glu Cys Thr Leu Gln Glu Asn Pro Phe Phe Ser Gln Pro Gly Ala Pro
35 40 45
Ile Leu Gln Cys Cys Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro
50 55 60
Leu Arg Ser Lys Lys Thr Met Leu Val Gln Lys Asn Val Thr Ser Glu
65 70 75 80
Ser Thr Cys Cys Val Ala Lys Ser Tyr Asn Arg Val Thr Val Met Gly
85 90 95
Gly Phe Lys Val Glu Asn His Thr Ala Cys His Cys Ser Thr Cys Tyr
100 105 110
Tyr His Lys Ser
115
(2) INFORMATION FOR SEQ ID NO:96:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 116 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:96:
Met Asp Tyr Tyr Arg Lys Tyr Ala Ala Ile Phe Leu Val Thr Leu Ser
1 5 10 15
Val Phe Leu His Val Leu His Ser Ala Pro Asp Val Gln Asp Cys Pro
20 25 30
Glu Cys Thr Leu Gln Glu Asn Pro Phe Phe Ser Gln Pro Gly Ala Pro
35 40 45
Ile Leu Gln Cys Met Gly Cys Cys Phe Cys Arg Ala Tyr Pro Thr Pro
50 55 60
Leu Arg Ser Lys Lys Thr Met Leu Val Gln Lys Asn Val Thr Ser Glu
65 70 75 80
Ser Thr Cys Cys Val Ala Lys Ser Tyr Asn Arg Val Thr Val Met Gly
85 90 95
Gly Phe Lys Val Glu Asn His Thr Ala Cys His Cys Ser Thr Cys Tyr
100 105 110
Tyr His Lys Ser
115
(2) INFORMATION FOR SEQ ID NO:97:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 116 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:97:
Met Asp Tyr Tyr Arg Lys Tyr Ala Ala Ile Phe Leu Val Thr Leu Ser
1 5 10 15
Val Phe Leu His Val Leu His Ser Ala Pro Asp Val Gln Asp Cys Pro
20 25 30
Glu Cys Thr Leu Gln Glu Asn Pro Phe Phe Ser Gln Pro Gly Ala Pro
35 40 45
Ile Leu Gln Cys Met Gly Cys Cys Phe Ser Cys Ala Tyr Pro Thr Pro
50 55 60
Leu Arg Ser Lys Lys Thr Met Leu Val Gln Lys Asn Val Thr Ser Glu
65 70 75 80
Ser Thr Cys Cys Val Ala Lys Ser Tyr Asn Arg Val Thr Val Met Gly
85 90 95
Gly Phe Lys Val Glu Asn His Thr Ala Cys His Cys Ser Thr Cys Tyr
100 105 110
Tyr His Lys Ser
115
(2) INFORMATION FOR SEQ ID NO:98:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 116 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:98:
Met Asp Tyr Tyr Arg Lys Tyr Ala Ala Ile Phe Leu Val Thr Leu Ser
1 5 10 15
Val Phe Leu His Val Leu His Ser Ala Pro Asp Val Gln Asp Cys Pro
20 25 30
Glu Cys Thr Leu Gln Glu Asn Pro Phe Phe Ser Gln Pro Gly Ala Pro
35 40 45
Ile Leu Gln Cys Met Gly Cys Cys Phe Ser Arg Ala Cys Pro Thr Pro
50 55 60
Leu Arg Ser Lys Lys Thr Met Leu Val Gln Lys Asn Val Thr Ser Glu
65 70 75 80
Ser Thr Cys Cys Val Ala Lys Ser Tyr Asn Arg Val Thr Val Met Gly
85 90 95
Gly Phe Lys Val Glu Asn His Thr Ala Cys His Cys Ser Thr Cys Tyr
100 105 110
Tyr His Lys Ser
115
(2) INFORMATION FOR SEQ ID NO:99:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 116 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:99:
Met Asp Tyr Tyr Arg Lys Tyr Ala Ala Ile Phe Leu Val Thr Leu Ser
1 5 10 15
Val Phe Leu His Val Leu His Ser Ala Pro Asp Val Gln Asp Cys Pro
20 25 30
Glu Cys Thr Leu Gln Glu Asn Pro Phe Phe Ser Gln Pro Gly Ala Pro
35 40 45
Ile Leu Gln Cys Met Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro
50 55 60
Leu Arg Ser Lys Lys Thr Met Leu Val Gln Lys Asn Val Thr Cys Glu
65 70 75 80
Ser Thr Cys Cys Val Ala Lys Ser Tyr Asn Arg Val Thr Val Met Gly
85 90 95
Gly Phe Lys Val Glu Asn His Thr Ala Cys His Cys Ser Thr Cys Tyr
100 105 110
Tyr His Lys Ser
115
(2) INFORMATION FOR SEQ ID NO:100:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 116 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:100:
Met Asp Tyr Tyr Arg Lys Tyr Ala Ala Ile Phe Leu Val Thr Leu Ser
1 5 10 15
Val Phe Leu His Val Leu His Ser Ala Pro Asp Val Gln Asp Cys Pro
20 25 30
Glu Cys Thr Leu Gln Glu Asn Pro Phe Phe Ser Gln Pro Gly Ala Pro
35 40 45
Ile Leu Gln Cys Met Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro
50 55 60
Leu Arg Ser Lys Lys Thr Met Leu Val Gln Lys Asn Val Thr Ser Glu
65 70 75 80
Cys Thr Cys Cys Val Ala Lys Ser Tyr Asn Arg Val Thr Val Met Gly
85 90 95
Gly Phe Lys Val Glu Asn His Thr Ala Cys His Cys Ser Thr Cys Tyr
100 105 110
Tyr His Lys Ser
115
(2) INFORMATION FOR SEQ ID NO:101:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 116 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:101:
Met Asp Tyr Tyr Arg Lys Tyr Ala Ala Ile Phe Leu Val Thr Leu Ser
1 5 10 15
Val Phe Leu His Val Leu His Ser Ala Pro Asp Val Gln Asp Cys Pro
20 25 30
Glu Cys Thr Leu Gln Glu Asn Pro Phe Phe Ser Gln Pro Gly Ala Pro
35 40 45
Ile Leu Gln Cys Met Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro
50 55 60
Leu Arg Ser Lys Lys Thr Met Leu Val Gln Lys Asn Val Thr Ser Glu
65 70 75 80
Ser Thr Cys Cys Val Ala Lys Ser Tyr Asn Arg Val Thr Val Met Gly
85 90 95
Gly Phe Lys Val Glu Asn His Thr Ala Cys His Cys Ser Thr Ala Tyr
100 105 110
Tyr His Lys Ser
115
(2) INFORMATION FOR SEQ ID NO:102:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 116 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:102:
Met Asp Tyr Tyr Arg Lys Tyr Ala Ala Ile Phe Leu Val Thr Leu Ser
1 5 10 15
Val Phe Leu His Val Leu His Ser Ala Pro Asp Val Gln Asp Cys Pro
20 25 30
Glu Cys Thr Leu Gln Glu Asn Pro Phe Phe Ser Gln Pro Gly Ala Pro
35 40 45
Ile Leu Gln Cys Met Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro
50 55 60
Leu Arg Ser Lys Lys Thr Met Leu Val Gln Lys Asn Val Thr Ser Glu
65 70 75 80
Ser Thr Cys Cys Cys Ala Lys Ser Tyr Asn Arg Val Thr Val Met Gly
85 90 95
Gly Phe Lys Val Glu Asn His Thr Ala Cys His Cys Ser Thr Cys Tyr
100 105 110
Tyr His Lys Ser
115
(2) INFORMATION FOR SEQ ID NO:103:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 116 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:103:
Met Asp Tyr Tyr Arg Lys Tyr Ala Ala Ile Phe Leu Val Thr Leu Ser
1 5 10 15
Val Phe Leu His Val Leu His Ser Ala Pro Asp Val Gln Asp Cys Pro
20 25 30
Glu Cys Thr Leu Gln Glu Asn Pro Phe Phe Ser Gln Pro Gly Ala Pro
35 40 45
Ile Leu Gln Cys Met Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro
50 55 60
Leu Arg Ser Lys Lys Thr Met Leu Val Gln Lys Asn Val Thr Ser Glu
65 70 75 80
Ser Thr Cys Cys Val Ala Lys Ser Tyr Asn Arg Val Thr Val Met Gly
85 90 95
Gly Phe Cys Val Glu Asn His Thr Ala Cys His Cys Ser Thr Cys Tyr
100 105 110
Tyr His Lys Ser
115
(2) INFORMATION FOR SEQ ID NO:104:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 116 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:104:
Met Asp Tyr Tyr Arg Lys Tyr Ala Ala Ile Phe Leu Val Thr Leu Ser
1 5 10 15
Val Phe Leu His Val Leu His Ser Ala Pro Asp Val Gln Asp Cys Pro
20 25 30
Glu Cys Thr Leu Gln Glu Asn Pro Phe Phe Ser Gln Pro Gly Ala Pro
35 40 45
Ile Leu Gln Cys Met Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro
50 55 60
Leu Arg Ser Lys Lys Thr Met Leu Val Gln Lys Asn Val Thr Ser Glu
65 70 75 80
Ser Thr Cys Cys Val Ala Lys Ser Tyr Asn Arg Val Thr Val Met Gly
85 90 95
Gly Phe Lys Cys Glu Asn His Thr Ala Cys His Cys Ser Thr Cys Tyr
100 105 110
Tyr His Lys Ser
115
(2) INFORMATION FOR SEQ ID NO:105:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 84 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:105:
Met Asp Tyr Tyr Arg Lys Tyr Ala Ala Ile Phe Leu Val Thr Leu Ser
1 5 10 15
Val Phe Leu His Val Leu His Ser Ala Pro Asp Val Gln Asp Cys Pro
20 25 30
Glu Cys Thr Leu Gln Glu Asn Pro Phe Phe Ser Gln Pro Gly Ala Pro
35 40 45
Ile Leu Gln Cys Met Gly Cys Cys Phe Ser Arg Ala Tyr Pro Thr Pro
50 55 60
Leu Arg Ser Lys Lys Thr Met Leu Val Gln Lys Asn Val Thr Ser Glu
65 70 75 80
Ser Thr Ala Cys
(2) INFORMATION FOR SEQ ID NO:106:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 129 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:106:
Met Lys Thr Leu Gln Phe Phe Phe Leu Phe Cys Cys Trp Lys Ala Ile
1 5 10 15
Cys Cys Asn Ser Cys Glu Leu Thr Asn Ile Thr Ile Ala Val Glu Lys
20 25 30
Glu Gly Cys Gly Phe Cys Ile Thr Ile Asn Thr Thr Trp Cys Ala Gly
35 40 45
Tyr Cys Tyr Thr Cys Asp Leu Val Tyr Lys Asp Pro Ala Arg Pro Lys
50 55 60
Ile Gln Lys Thr Cys Thr Phe Lys Glu Leu Val Tyr Glu Thr Val Arg
65 70 75 80
Val Pro Gly Cys Ala His His Ala Asp Ser Leu Tyr Thr Tyr Pro Val
85 90 95
Ala Thr Gln Cys His Cys Gly Lys Cys Asp Ser Asp Ser Thr Asp Cys
100 105 110
Thr Val Arg Gly Leu Gly Pro Ser Tyr Cys Ser Phe Gly Glu Met Lys
115 120 125
Glu
(2) INFORMATION FOR SEQ ID NO:107:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 129 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:107:
Met Lys Thr Leu Gln Phe Phe Phe Leu Phe Cys Cys Trp Lys Ala Ile
1 5 10 15
Cys Cys Asn Ser Cys Glu Leu Thr Asn Ile Thr Ile Ala Val Glu Lys
20 25 30
Glu Gly Cys Gly Phe Cys Ile Thr Ile Asn Thr Thr Trp Cys Cys Gly
35 40 45
Tyr Cys Tyr Thr Arg Asp Leu Val Tyr Lys Asp Pro Ala Arg Pro Lys
50 55 60
Ile Gln Lys Thr Cys Thr Phe Lys Glu Leu Val Tyr Glu Thr Val Arg
65 70 75 80
Val Pro Gly Cys Ala His His Ala Asp Ser Leu Tyr Thr Tyr Pro Val
85 90 95
Ala Thr Gln Cys His Cys Gly Lys Cys Asp Ser Asp Ser Thr Asp Cys
100 105 110
Thr Val Arg Gly Leu Gly Pro Ser Tyr Cys Ser Phe Gly Glu Met Lys
115 120 125
Glu
(2) INFORMATION FOR SEQ ID NO:108:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 129 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:108:
Met Lys Thr Leu Gln Phe Phe Phe Leu Phe Cys Cys Trp Lys Ala Ile
1 5 10 15
Cys Cys Asn Ser Cys Glu Leu Thr Asn Ile Thr Ile Ala Val Glu Lys
20 25 30
Glu Gly Cys Gly Phe Cys Ile Thr Ile Asn Thr Thr Cys Cys Ala Gly
35 40 45
Tyr Cys Tyr Thr Arg Asp Leu Val Tyr Lys Asp Pro Ala Arg Pro Lys
50 55 60
Ile Gln Lys Thr Cys Thr Phe Lys Glu Leu Val Tyr Glu Thr Val Arg
65 70 75 80
Val Pro Gly Cys Ala His His Ala Asp Ser Leu Tyr Thr Tyr Pro Val
85 90 95
Ala Thr Gln Cys His Cys Gly Lys Cys Asp Ser Asp Ser Thr Asp Cys
100 105 110
Thr Val Arg Gly Leu Gly Pro Ser Tyr Cys Ser Phe Gly Glu Met Lys
115 120 125
Glu
(2) INFORMATION FOR SEQ ID NO:109:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 129 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:109:
Met Lys Thr Leu Gln Phe Phe Phe Leu Phe Cys Cys Trp Lys Ala Ile
1 5 10 15
Cys Cys Asn Ser Cys Glu Leu Thr Asn Ile Thr Ile Ala Val Glu Lys
20 25 30
Glu Gly Cys Gly Phe Cys Ile Thr Ile Asn Thr Thr Trp Cys Ala Gly
35 40 45
Tyr Cys Tyr Thr Arg Asp Leu Val Tyr Lys Asp Pro Ala Arg Pro Lys
50 55 60
Ile Gln Lys Thr Cys Thr Phe Lys Glu Leu Val Tyr Glu Thr Val Arg
65 70 75 80
Val Pro Gly Cys Ala His His Ala Asp Ser Leu Tyr Thr Tyr Pro Val
85 90 95
Ala Thr Gln Cys His Cys Gly Lys Cys Asp Ser Asp Ser Cys Asp Cys
100 105 110
Thr Val Arg Gly Leu Gly Pro Ser Tyr Cys Ser Phe Gly Glu Met Lys
115 120 125
Glu
(2) INFORMATION FOR SEQ ID NO:110:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 129 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:110:
Met Lys Thr Leu Gln Phe Phe Phe Leu Phe Cys Cys Trp Lys Ala Ile
1 5 10 15
Cys Cys Asn Ser Cys Glu Leu Thr Asn Ile Thr Ile Ala Val Glu Lys
20 25 30
Glu Gly Cys Gly Phe Cys Ile Thr Ile Asn Thr Thr Trp Cys Ala Gly
35 40 45
Tyr Cys Tyr Thr Arg Asp Leu Val Tyr Lys Asp Pro Ala Arg Pro Lys
50 55 60
Ile Gln Lys Cys Cys Thr Phe Lys Glu Leu Val Tyr Glu Thr Val Arg
65 70 75 80
Val Pro Gly Cys Ala His His Ala Asp Ser Leu Tyr Thr Tyr Pro Val
85 90 95
Ala Thr Gln Cys His Cys Gly Lys Cys Asp Ser Asp Ser Thr Asp Cys
100 105 110
Thr Val Arg Gly Leu Gly Pro Ser Tyr Cys Ser Phe Gly Glu Met Lys
115 120 125
Glu
(2) INFORMATION FOR SEQ ID NO:111:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 129 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:111:
Met Lys Thr Leu Gln Phe Phe Phe Leu Phe Cys Cys Trp Lys Ala Ile
1 5 10 15
Cys Cys Asn Ser Cys Glu Leu Thr Asn Ile Thr Ile Ala Val Glu Lys
20 25 30
Glu Gly Cys Gly Phe Cys Ile Thr Ile Asn Thr Thr Trp Cys Ala Gly
35 40 45
Tyr Cys Tyr Cys Arg Asp Leu Val Tyr Lys Asp Pro Ala Arg Pro Lys
50 55 60
Ile Gln Lys Thr Cys Thr Phe Lys Glu Leu Val Tyr Glu Thr Val Arg
65 70 75 80
Val Pro Gly Cys Ala His His Ala Asp Ser Leu Tyr Thr Tyr Pro Val
85 90 95
Ala Thr Gln Cys His Cys Gly Lys Cys Asp Ser Asp Ser Thr Asp Cys
100 105 110
Thr Val Arg Gly Leu Gly Pro Ser Tyr Cys Ser Phe Gly Glu Met Lys
115 120 125
Glu
(2) INFORMATION FOR SEQ ID NO:112:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 129 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:112:
Met Lys Thr Leu Gln Phe Phe Phe Leu Phe Cys Cys Trp Lys Ala Ile
1 5 10 15
Cys Cys Asn Ser Cys Glu Leu Thr Asn Ile Thr Ile Ala Val Glu Lys
20 25 30
Glu Gly Cys Gly Phe Cys Ile Thr Ile Asn Thr Thr Trp Cys Ala Gly
35 40 45
Tyr Cys Tyr Thr Arg Cys Leu Val Tyr Lys Asp Pro Ala Arg Pro Lys
50 55 60
Ile Gln Lys Thr Cys Thr Phe Lys Glu Leu Val Tyr Glu Thr Val Arg
65 70 75 80
Val Pro Gly Cys Ala His His Ala Asp Ser Leu Tyr Thr Tyr Pro Val
85 90 95
Ala Thr Gln Cys His Cys Gly Lys Cys Asp Ser Asp Ser Thr Asp Cys
100 105 110
Thr Val Arg Gly Leu Gly Pro Ser Tyr Cys Ser Phe Gly Glu Met Lys
115 120 125
Glu
(2) INFORMATION FOR SEQ ID NO:113:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 129 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:113:
Met Lys Thr Leu Gln Phe Phe Phe Leu Phe Cys Cys Trp Lys Ala Ile
1 5 10 15
Cys Cys Asn Ser Cys Glu Leu Thr Asn Ile Thr Ile Ala Val Glu Lys
20 25 30
Glu Gly Cys Gly Phe Cys Ile Thr Ile Asn Thr Thr Trp Cys Ala Gly
35 40 45
Tyr Cys Tyr Thr Arg Asp Leu Val Tyr Cys Asp Pro Ala Arg Pro Lys
50 55 60
Ile Gln Lys Thr Cys Thr Phe Lys Glu Leu Val Tyr Glu Thr Val Arg
65 70 75 80
Val Pro Gly Cys Ala His His Ala Asp Ser Leu Tyr Thr Tyr Pro Val
85 90 95
Ala Thr Gln Cys His Cys Gly Lys Cys Asp Ser Asp Ser Thr Asp Cys
100 105 110
Thr Val Arg Gly Leu Gly Pro Ser Tyr Cys Ser Phe Gly Glu Met Lys
115 120 125
Glu
(2) INFORMATION FOR SEQ ID NO:114:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 129 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:114:
Met Lys Thr Leu Gln Phe Phe Phe Leu Phe Cys Cys Trp Lys Ala Ile
1 5 10 15
Cys Cys Asn Ser Cys Glu Leu Thr Asn Ile Thr Ile Ala Val Glu Lys
20 25 30
Glu Gly Cys Gly Phe Cys Ile Thr Ile Asn Thr Thr Trp Cys Ala Gly
35 40 45
Tyr Cys Tyr Thr Arg Asp Leu Cys Tyr Lys Asp Pro Ala Arg Pro Lys
50 55 60
Ile Gln Lys Thr Cys Thr Phe Lys Glu Leu Val Tyr Glu Thr Val Arg
65 70 75 80
Val Pro Gly Cys Ala His His Ala Asp Ser Leu Tyr Thr Tyr Pro Val
85 90 95
Ala Thr Gln Cys His Cys Gly Lys Cys Asp Ser Asp Ser Thr Asp Cys
100 105 110
Thr Val Arg Gly Leu Gly Pro Ser Tyr Cys Ser Phe Gly Glu Met Lys
115 120 125
Glu
(2) INFORMATION FOR SEQ ID NO:115:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 165 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:115:
Met Glu Met Phe Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Thr Trp Ala Ser Lys Glu Pro Leu Arg Pro Arg Cys Arg Pro Ile
20 25 30
Asn Ala Thr Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Ile Cys Ala Gly Tyr Cys Pro Thr Cys Thr Arg Val
50 55 60
Leu Gln Gly Val Leu Pro Ala Leu Pro Gln Val Val Cys Asn Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asn Pro Val Val Ser Tyr Ala Val Ala Leu Ser Cys Gln Cys Ala Leu
100 105 110
Cys Arg Arg Ser Thr Thr Asp Cys Gly Gly Pro Lys Asp His Pro Leu
115 120 125
Thr Cys Asp Asp Pro Arg Phe Gln Asp Ser Ser Ser Ser Lys Ala Pro
130 135 140
Pro Pro Ser Leu Pro Ser Pro Ser Arg Leu Pro Gly Pro Ser Asp Thr
145 150 155 160
Pro Ile Leu Pro Gln
165
(2) INFORMATION FOR SEQ ID NO:116:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 165 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:116:
Met Glu Met Phe Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Thr Trp Ala Ser Lys Glu Pro Leu Arg Pro Arg Cys Arg Pro Ile
20 25 30
Asn Ala Thr Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Ile Cys Ala Gly Tyr Cys Pro Thr Cys Thr Arg Val
50 55 60
Leu Gln Gly Val Leu Pro Ala Leu Pro Gln Val Val Cys Asn Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asn Pro Val Val Ser Tyr Ala Val Ala Leu Ser Cys Gln Cys Ala Leu
100 105 110
Cys Arg Arg Ser Thr Thr Asp Cys Gly Gly Pro Lys Asp His Pro Leu
115 120 125
Thr Cys Asp Asp Pro Arg Phe Gln Asp Ser Ser Ser Ser Lys Ala Pro
130 135 140
Pro Pro Ser Leu Pro Ser Pro Ser Arg Leu Pro Gly Pro Ser Asp Thr
145 150 155 160
Pro Ile Leu Pro Gln
165
(2) INFORMATION FOR SEQ ID NO:117:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 165 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:117:
Met Glu Met Phe Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Thr Trp Ala Ser Lys Glu Pro Leu Arg Pro Arg Cys Arg Pro Ile
20 25 30
Asn Ala Thr Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Ile Cys Ala Gly Tyr Cys Pro Thr Met Thr Arg Val
50 55 60
Leu Gln Gly Val Leu Pro Ala Leu Pro Gln Val Cys Cys Asn Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asn Pro Val Val Ser Tyr Ala Val Ala Leu Ser Cys Gln Cys Ala Leu
100 105 110
Cys Arg Arg Ser Thr Thr Asp Cys Gly Gly Pro Lys Asp His Pro Leu
115 120 125
Thr Cys Asp Asp Pro Arg Phe Gln Asp Ser Ser Ser Ser Lys Ala Pro
130 135 140
Pro Pro Ser Leu Pro Ser Pro Ser Arg Leu Pro Gly Pro Ser Asp Thr
145 150 155 160
Pro Ile Leu Pro Gln
165
(2) INFORMATION FOR SEQ ID NO:118:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 165 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:118:
Met Glu Met Phe Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Thr Trp Ala Ser Lys Glu Pro Leu Arg Pro Arg Cys Arg Pro Ile
20 25 30
Asn Ala Thr Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Ile Cys Cys Gly Tyr Cys Pro Thr Met Thr Arg Val
50 55 60
Leu Gln Gly Val Leu Pro Ala Leu Pro Gln Val Val Cys Asn Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asn Pro Val Val Ser Tyr Ala Val Ala Leu Ser Cys Gln Cys Ala Leu
100 105 110
Cys Arg Arg Ser Thr Thr Asp Cys Gly Gly Pro Lys Asp His Pro Leu
115 120 125
Thr Cys Asp Asp Pro Arg Phe Gln Asp Ser Ser Ser Ser Lys Ala Pro
130 135 140
Pro Pro Ser Leu Pro Ser Pro Ser Arg Leu Pro Gly Pro Ser Asp Thr
145 150 155 160
Pro Ile Leu Pro Gln
165
(2) INFORMATION FOR SEQ ID NO:119:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 165 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:119:
Met Glu Met Phe Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Thr Trp Ala Ser Lys Glu Pro Leu Arg Pro Arg Cys Arg Pro Ile
20 25 30
Asn Ala Thr Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Cys Cys Ala Gly Tyr Cys Pro Thr Met Thr Arg Val
50 55 60
Leu Gln Gly Val Leu Pro Ala Leu Pro Gln Val Val Cys Asn Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asn Pro Val Val Ser Tyr Ala Val Ala Leu Ser Cys Gln Cys Ala Leu
100 105 110
Cys Arg Arg Ser Thr Thr Asp Cys Gly Gly Pro Lys Asp His Pro Leu
115 120 125
Thr Cys Asp Asp Pro Arg Phe Gln Asp Ser Ser Ser Ser Lys Ala Pro
130 135 140
Pro Pro Ser Leu Pro Ser Pro Ser Arg Leu Pro Gly Pro Ser Asp Thr
145 150 155 160
Pro Ile Leu Pro Gln
165
(2) INFORMATION FOR SEQ ID NO:120:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 165 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:120:
Met Glu Met Phe Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Thr Trp Ala Ser Lys Glu Pro Leu Arg Pro Arg Cys Arg Pro Ile
20 25 30
Asn Ala Thr Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Ile Cys Ala Gly Tyr Cys Pro Thr Met Thr Arg Val
50 55 60
Leu Gln Gly Val Leu Pro Ala Leu Pro Gln Val Val Cys Asn Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asn Pro Val Val Ser Tyr Ala Val Ala Leu Ser Cys Gln Cys Ala Leu
100 105 110
Cys Arg Arg Ser Thr Cys Asp Cys Gly Gly Pro Lys Asp His Pro Leu
115 120 125
Thr Cys Asp Asp Pro Arg Phe Gln Asp Ser Ser Ser Ser Lys Ala Pro
130 135 140
Pro Pro Ser Leu Pro Ser Pro Ser Arg Leu Pro Gly Pro Ser Asp Thr
145 150 155 160
Pro Ile Leu Pro Gln
165
(2) INFORMATION FOR SEQ ID NO:121:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 165 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:121:
Met Glu Met Phe Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Thr Trp Ala Ser Lys Glu Pro Leu Arg Pro Arg Cys Arg Pro Ile
20 25 30
Asn Ala Thr Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Ile Cys Ala Gly Tyr Cys Pro Cys Met Thr Arg Val
50 55 60
Leu Gln Gly Val Leu Pro Ala Leu Pro Gln Val Val Cys Asn Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asn Pro Val Val Ser Tyr Ala Val Ala Leu Ser Cys Gln Cys Ala Leu
100 105 110
Cys Arg Arg Ser Thr Thr Asp Cys Gly Gly Pro Lys Asp His Pro Leu
115 120 125
Thr Cys Asp Asp Pro Arg Phe Gln Asp Ser Ser Ser Ser Lys Ala Pro
130 135 140
Pro Pro Ser Leu Pro Ser Pro Ser Arg Leu Pro Gly Pro Ser Asp Thr
145 150 155 160
Pro Ile Leu Pro Gln
165
(2) INFORMATION FOR SEQ ID NO:122:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 165 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:122:
Met Glu Met Phe Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Thr Trp Ala Ser Lys Glu Pro Leu Arg Pro Arg Cys Arg Pro Ile
20 25 30
Asn Ala Thr Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Ile Cys Ala Gly Tyr Cys Pro Thr Met Cys Arg Val
50 55 60
Leu Gln Gly Val Leu Pro Ala Leu Pro Gln Val Val Cys Asn Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asn Pro Val Val Ser Tyr Ala Val Ala Leu Ser Cys Gln Cys Ala Leu
100 105 110
Cys Arg Arg Ser Thr Thr Asp Cys Gly Gly Pro Lys Asp His Pro Leu
115 120 125
Thr Cys Asp Asp Pro Arg Phe Gln Asp Ser Ser Ser Ser Lys Ala Pro
130 135 140
Pro Pro Ser Leu Pro Ser Pro Ser Arg Leu Pro Gly Pro Ser Asp Thr
145 150 155 160
Pro Ile Leu Pro Gln
165
(2) INFORMATION FOR SEQ ID NO:123:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 165 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:123:
Met Glu Met Phe Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Thr Trp Ala Ser Lys Glu Pro Leu Arg Pro Arg Cys Arg Pro Ile
20 25 30
Asn Ala Thr Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Ile Cys Ala Gly Tyr Cys Pro Thr Met Thr Arg Val
50 55 60
Leu Cys Gly Val Leu Pro Ala Leu Pro Gln Val Val Cys Asn Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asn Pro Val Val Ser Tyr Ala Val Ala Leu Ser Cys Gln Cys Ala Leu
100 105 110
Cys Arg Arg Ser Thr Thr Asp Cys Gly Gly Pro Lys Asp His Pro Leu
115 120 125
Thr Cys Asp Asp Pro Arg Phe Gln Asp Ser Ser Ser Ser Lys Ala Pro
130 135 140
Pro Pro Ser Leu Pro Ser Pro Ser Arg Leu Pro Gly Pro Ser Asp Thr
145 150 155 160
Pro Ile Leu Pro Gln
165
(2) INFORMATION FOR SEQ ID NO:124:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 165 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:124:
Met Glu Met Phe Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Thr Trp Ala Ser Lys Glu Pro Leu Arg Pro Arg Cys Arg Pro Ile
20 25 30
Asn Ala Thr Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Ile Cys Ala Gly Tyr Cys Pro Thr Met Thr Arg Cys
50 55 60
Leu Gln Gly Val Leu Pro Ala Leu Pro Gln Val Val Cys Asn Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asn Pro Val Val Ser Tyr Ala Val Ala Leu Ser Cys Gln Cys Ala Leu
100 105 110
Cys Arg Arg Ser Thr Thr Asp Cys Gly Gly Pro Lys Asp His Pro Leu
115 120 125
Thr Cys Asp Asp Pro Arg Phe Gln Asp Ser Ser Ser Ser Lys Ala Pro
130 135 140
Pro Pro Ser Leu Pro Ser Pro Ser Arg Leu Pro Gly Pro Ser Asp Thr
145 150 155 160
Pro Ile Leu Pro Gln
165
(2) INFORMATION FOR SEQ ID NO:125:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 165 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:125:
Met Glu Met Phe Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Thr Trp Ala Ser Lys Glu Pro Leu Arg Pro Arg Cys Arg Pro Ile
20 25 30
Asn Ala Thr Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Ile Cys Ala Gly Tyr Cys Pro Thr Met Thr Arg Val
50 55 60
Leu Gln Gly Val Leu Pro Ala Leu Pro Cys Val Val Cys Asn Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asn Pro Val Val Ser Tyr Ala Val Ala Leu Ser Cys Gln Cys Ala Leu
100 105 110
Cys Arg Arg Ser Thr Thr Asp Cys Gly Gly Pro Lys Asp His Pro Leu
115 120 125
Thr Cys Asp Asp Pro Arg Phe Gln Asp Ser Ser Ser Ser Lys Ala Pro
130 135 140
Pro Pro Ser Leu Pro Ser Pro Ser Arg Leu Pro Gly Pro Ser Asp Thr
145 150 155 160
Pro Ile Leu Pro Gln
165
(2) INFORMATION FOR SEQ ID NO:126:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 141 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:126:
Met Glu Met Leu Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Ala Trp Ala Ser Arg Glu Pro Leu Arg Pro Trp Cys His Pro Ile
20 25 30
Asn Ala Ile Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Ile Cys Ala Gly Tyr Cys Pro Thr Met Met Arg Cys
50 55 60
Leu Gln Ala Val Leu Pro Pro Leu Pro Gln Val Val Cys Thr Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asp Pro Val Val Ser Phe Pro Val Ala Leu Ser Cys Arg Cys Gly Pro
100 105 110
Cys Arg Arg Ser Thr Ser Asp Cys Gly Gly Pro Lys Asp His Pro Leu
115 120 125
Thr Cys Asp His Pro Gln Leu Ser Gly Leu Leu Phe Leu
130 135 140
(2) INFORMATION FOR SEQ ID NO:127:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 141 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:127:
Met Glu Met Leu Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Ala Trp Ala Ser Arg Glu Pro Leu Arg Pro Trp Cys His Pro Ile
20 25 30
Asn Ala Ile Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Ile Cys Ala Gly Tyr Cys Pro Thr Cys Met Arg Val
50 55 60
Leu Gln Ala Val Leu Pro Pro Leu Pro Gln Val Val Cys Thr Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asp Pro Val Val Ser Phe Pro Val Ala Leu Ser Cys Arg Cys Gly Pro
100 105 110
Cys Arg Arg Ser Thr Ser Asp Cys Gly Gly Pro Lys Asp His Pro Leu
115 120 125
Thr Cys Asp His Pro Gln Leu Ser Gly Leu Leu Phe Leu
130 135 140
(2) INFORMATION FOR SEQ ID NO:128:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 141 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:128:
Met Glu Met Leu Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Ala Trp Ala Ser Arg Glu Pro Leu Arg Pro Trp Cys His Pro Ile
20 25 30
Asn Ala Ile Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Ile Cys Ala Gly Tyr Cys Pro Thr Met Met Arg Val
50 55 60
Leu Gln Ala Val Leu Pro Pro Leu Pro Gln Val Cys Cys Thr Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asp Pro Val Val Ser Phe Pro Val Ala Leu Ser Cys Arg Cys Gly Pro
100 105 110
Cys Arg Arg Ser Thr Ser Asp Cys Gly Gly Pro Lys Asp His Pro Leu
115 120 125
Thr Cys Asp His Pro Gln Leu Ser Gly Leu Leu Phe Leu
130 135 140
(2) INFORMATION FOR SEQ ID NO:129:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 141 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:129:
Met Glu Met Leu Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Ala Trp Ala Ser Arg Glu Pro Leu Arg Pro Trp Cys His Pro Ile
20 25 30
Asn Ala Ile Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Ile Cys Cys Gly Tyr Cys Pro Thr Met Met Arg Val
50 55 60
Leu Gln Ala Val Leu Pro Pro Leu Pro Gln Val Val Cys Thr Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asp Pro Val Val Ser Phe Pro Val Ala Leu Ser Cys Arg Cys Gly Pro
100 105 110
Cys Arg Arg Ser Thr Ser Asp Cys Gly Gly Pro Lys Asp His Pro Leu
115 120 125
Thr Cys Asp His Pro Gln Leu Ser Gly Leu Leu Phe Leu
130 135 140
(2) INFORMATION FOR SEQ ID NO:130:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 141 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:130:
Met Glu Met Leu Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Ala Trp Ala Ser Arg Glu Pro Leu Arg Pro Trp Cys His Pro Ile
20 25 30
Asn Ala Ile Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Cys Cys Ala Gly Tyr Cys Pro Thr Met Met Arg Val
50 55 60
Leu Gln Ala Val Leu Pro Pro Leu Pro Gln Val Val Cys Thr Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asp Pro Val Val Ser Phe Pro Val Ala Leu Ser Cys Arg Cys Gly Pro
100 105 110
Cys Arg Arg Ser Thr Ser Asp Cys Gly Gly Pro Lys Asp His Pro Leu
115 120 125
Thr Cys Asp His Pro Gln Leu Ser Gly Leu Leu Phe Leu
130 135 140
(2) INFORMATION FOR SEQ ID NO:131:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 141 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:131:
Met Glu Met Leu Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Ala Trp Ala Ser Arg Glu Pro Leu Arg Pro Trp Cys His Pro Ile
20 25 30
Asn Ala Ile Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Ile Cys Ala Gly Tyr Cys Pro Thr Met Met Arg Val
50 55 60
Leu Gln Ala Val Leu Pro Pro Leu Pro Gln Val Val Cys Thr Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asp Pro Val Val Ser Phe Pro Val Ala Leu Ser Cys Arg Cys Gly Pro
100 105 110
Cys Arg Arg Ser Thr Cys Asp Cys Gly Gly Pro Lys Asp His Pro Leu
115 120 125
Thr Cys Asp His Pro Gln Leu Ser Gly Leu Leu Phe Leu
130 135 140
(2) INFORMATION FOR SEQ ID NO:132:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 141 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:132:
Met Glu Met Leu Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Ala Trp Ala Ser Arg Glu Pro Leu Arg Pro Trp Cys His Pro Ile
20 25 30
Asn Ala Ile Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Ile Cys Ala Gly Tyr Cys Pro Cys Met Met Arg Val
50 55 60
Leu Gln Ala Val Leu Pro Pro Leu Pro Gln Val Val Cys Thr Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asp Pro Val Val Ser Phe Pro Val Ala Leu Ser Cys Arg Cys Gly Pro
100 105 110
Cys Arg Arg Ser Thr Ser Asp Cys Gly Gly Pro Lys Asp His Pro Leu
115 120 125
Thr Cys Asp His Pro Gln Leu Ser Gly Leu Leu Phe Leu
130 135 140
(2) INFORMATION FOR SEQ ID NO:133:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 141 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:133:
Met Glu Met Leu Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Ala Trp Ala Ser Arg Glu Pro Leu Arg Pro Trp Cys His Pro Ile
20 25 30
Asn Ala Ile Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Ile Cys Ala Gly Tyr Cys Pro Thr Met Cys Arg Val
50 55 60
Leu Gln Ala Val Leu Pro Pro Leu Pro Gln Val Val Cys Thr Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asp Pro Val Val Ser Phe Pro Val Ala Leu Ser Cys Arg Cys Gly Pro
100 105 110
Cys Arg Arg Ser Thr Ser Asp Cys Gly Gly Pro Lys Asp His Pro Leu
115 120 125
Thr Cys Asp His Pro Gln Leu Ser Gly Leu Leu Phe Leu
130 135 140
(2) INFORMATION FOR SEQ ID NO:134:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 141 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:134:
Met Glu Met Leu Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Ala Trp Ala Ser Arg Glu Pro Leu Arg Pro Trp Cys His Pro Ile
20 25 30
Asn Ala Ile Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Ile Cys Ala Gly Tyr Cys Pro Thr Met Met Arg Val
50 55 60
Leu Cys Ala Val Leu Pro Pro Leu Pro Gln Val Val Cys Thr Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asp Pro Val Val Ser Phe Pro Val Ala Leu Ser Cys Arg Cys Gly Pro
100 105 110
Cys Arg Arg Ser Thr Ser Asp Cys Gly Gly Pro Lys Asp His Pro Leu
115 120 125
Thr Cys Asp His Pro Gln Leu Ser Gly Leu Leu Phe Leu
130 135 140
(2) INFORMATION FOR SEQ ID NO:135:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 141 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:135:
Met Glu Met Leu Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Ala Trp Ala Ser Arg Glu Pro Leu Arg Pro Trp Cys His Pro Ile
20 25 30
Asn Ala Ile Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Ile Cys Ala Gly Tyr Cys Pro Thr Met Met Arg Val
50 55 60
Leu Gln Ala Val Leu Pro Pro Leu Pro Cys Val Val Cys Thr Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asp Pro Val Val Ser Phe Pro Val Ala Leu Ser Cys Arg Cys Gly Pro
100 105 110
Cys Arg Arg Ser Thr Ser Asp Cys Gly Gly Pro Lys Asp His Pro Leu
115 120 125
Thr Cys Asp His Pro Gln Leu Ser Gly Leu Leu Phe Leu
130 135 140
(2) INFORMATION FOR SEQ ID NO:136:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 142 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:136:
Met Glu Met Phe Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Thr Trp Ala Ser Lys Glu Pro Leu Cys Pro Arg Cys Arg Pro Ile
20 25 30
Asn Ala Thr Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Ile Cys Ala Gly Cys Cys Pro Thr Met Thr Arg Val
50 55 60
Leu Gln Gly Val Leu Pro Ala Leu Pro Gln Val Val Cys Asn Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asn Pro Val Val Ser Tyr Ala Val Ala Leu Ser Cys Gln Cys Ala Leu
100 105 110
Cys Arg Arg Ser Thr Thr Asp Cys Gly Gly Pro Lys Asp His Pro Leu
115 120 125
Thr Cys Asp Asp Pro Arg Phe Gln Asp Ser Ser Ser Ser Lys
130 135 140
(2) INFORMATION FOR SEQ ID NO:137:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 137 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:137:
Met Glu Met Phe Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Thr Trp Ala Ser Lys Glu Pro Leu Cys Asn Ser Cys Glu Leu Thr
20 25 30
Asn Ile Thr Ile Ala Val Glu Lys Glu Gly Cys Gly Phe Cys Ile Thr
35 40 45
Ile Asn Thr Thr Trp Cys Ala Gly Cys Cys Tyr Thr Arg Asp Leu Val
50 55 60
Tyr Lys Asp Pro Ala Arg Pro Lys Ile Gln Lys Thr Cys Thr Phe Lys
65 70 75 80
Glu Leu Val Tyr Glu Thr Val Arg Val Pro Gly Cys Ala His His Ala
85 90 95
Asp Ser Leu Tyr Thr Tyr Pro Val Ala Thr Gln Cys His Cys Gly Lys
100 105 110
Cys Asp Ser Asp Ser Thr Asp Cys Thr Val Arg Gly Leu Gly Pro Ser
115 120 125
Tyr Cys Ser Phe Gly Glu Met Lys Glu
130 135
(2) INFORMATION FOR SEQ ID NO:138:
(i) SEQUENCE CHARACTERISTICS:
(A) LENGTH: 165 amino acids
(B) TYPE: amino acid
(C) STRANDEDNESS: single
(D) TOPOLOGY: linear
(ii) MOLECULE TYPE: peptide
(xi) SEQUENCE DESCRIPTION: SEQ ID NO:138:
Met Glu Met Phe Gln Gly Leu Leu Leu Leu Leu Leu Leu Ser Met Gly
1 5 10 15
Gly Thr Trp Ala Ser Lys Glu Pro Leu Cys Pro Arg Cys Arg Pro Ile
20 25 30
Asn Ala Thr Leu Ala Val Glu Lys Glu Gly Cys Pro Val Cys Ile Thr
35 40 45
Val Asn Thr Thr Ile Cys Ala Gly Cys Cys Pro Thr Met Thr Arg Val
50 55 60
Leu Gln Gly Val Leu Pro Ala Leu Pro Gln Val Val Cys Asn Tyr Arg
65 70 75 80
Asp Val Arg Phe Glu Ser Ile Arg Leu Pro Gly Cys Pro Arg Gly Val
85 90 95
Asn Pro Val Val Ser Tyr Ala Val Ala Leu Ser Cys Gln Cys Ala Leu
100 105 110
Cys Asp Ser Asp Ser Thr Asp Cys Thr Val Arg Gly Leu Gly Pro Ser
115 120 125
Tyr Cys Ser Phe Gly Glu Met Lys Glu Ser Ser Ser Ser Lys Ala Pro
130 135 140
Pro Pro Ser Leu Pro Ser Pro Ser Arg Leu Pro Gly Pro Ser Asp Thr
145 150 155 160
Pro Ile Leu Pro Gln
165
Claims (24)
- 사람의 융모성 고나도트로핀(hCG), 사람의 황체화 호르몬(hLH), 사람의 난포자극호르몬(hFSH), 사람의 갑상선 자극 호르몬(hTSH)에서 선택된 당단백질 호르몬 호르몬 유사체에 있어서, 이 유사체는 α-소단위 및 β-소단위를 포함하고, 이때, 당단백질 호르몬 소단위의 아미노산 서열을 변형시켜, α-소단위 시스테인 및 β-소단위 시스테인 사이에 소단위간 이황화결합을 만들고, 이때 시스테인은 당단백질 호르몬의 고유 두 개의 시스테인 잔기 위치 내에 있고 상응하는 고유 소단위의 가장 외측에 있는 시스테인의 밖에 있지 않으며, 이렇게 변형됨으로써, 당단백질 호르몬의 안정성이 개선되고, 유사체는 고유 당단백질 호르몬 수용체에 대한 생활성을 보유하는 것을 특징으로 하는 당단백질 호르몬 유사체.
- 제 1 항에 있어서, 당단백질 호르몬 소단위의 아미노산 서열을 변형시켜, α-소단위 루프 2내에 위치한 시스테인과 β-소단위 루프 2내에 위치한 시스테인사이에 소단위간 이황화결합을 만드는 것을 특징으로 하는 당단백질 호르몬 유사체.
- 제 1 항에 있어서, 당단백질 호르몬 소단위의 아미노산 서열을 변형시켜, α-소단위 C-말단의 8개 잔기내에 위치한 시스테인과 β-소단위 루프 2내에 위치한 시스테인사이에 소단위간 이황화결합을 만드는 것을 특징으로 하는 당단백질 호르몬 유사체.
- 사람의 융모성 고나도트로핀(hCG), 사람의 황체화 호르몬(hLH), 사람의 난포자극호르몬(hFSH), 사람의 갑상선 자극 호르몬(hTSH)에서 선택된 당단백질 호르몬 호르몬 유사체에 있어서, 이 유사체는 α-소단위 및 β-소단위를 포함하고, 이때, 당단백질 호르몬 소단위의 아미노산 서열을 변형시켜, α-소단위 시스테인 노트에 위치한 및 β-소단위 시스테인 노트에 위치한 시스테인 사이에 소단위간 이황화결합을 만들고, 이때 시스테인은 당단백질 호르몬의 고유 두 개의 시스테인 잔기 위치 내에 있고 상응하는 고유 소단위의 가장 외측에 있는 시스테인의 밖에 있지 않으며, 이렇게 변형됨으로써, 당단백질 호르몬의 안정성이 개선되고, 유사체는 고유 당단백질 호르몬 수용체에 대한 생활성을 보유하는 것을 특징으로 하는 당단백질 호르몬 유사체.
- 제 4 항에 있어서, 소단위간 이황화결합은 고유 시스테인 잔기와 시스테인 잔기로 변형된 잔기사이에 있는 것을 특징으로 하는 당단백질 호르몬 유사체.
- 제 5 항에 있어서, 소단위간 이황화결합은 α-소단위 고유 시스테인 잔기와 시스테인 잔기로 변형된 β-소단위 잔기 사이에 위치하는 것을 특징으로 하는 당단백질 호르몬 유사체.
- 제 6 항에 있어서, β-소단위의 아미노산 서열은 잔기 Tyr37을 시스테인으로 변형시켜, α-소단위 고유 시스테인31과 시스테인 잔기로 변형된 β-소단위 잔기 37사이에 소단위간 이황화결합이 형성되도록 변형된 것을 특징으로 하는 당단백질 호르몬 유사체.
- 제 7 항에 있어서, hCG 유사체, hLH 유사체에서 선택되는 것을 특징으로 하는 당단백질 호르몬 유사체.
- 제 6 항에 있어서, hFSH β-소단위의 아미노산 서열은 잔기 Tyr31을 시스테인으로 변형시켜, α-소단위 고유 시스테인31과 시스테인 잔기로 변형된 hFSH β-소단위 잔기 31사이에 소단위간 이황화결합이 형성되도록 변형된 것을 특징으로 하는 당단백질 호르몬 유사체.
- 제 6 항에 있어서, hTSH β-소단위의 아미노산 서열은 잔기 Tyr30을 시스테인으로 변형시켜, α-소단위 고유 시스테인31과 시스테인 잔기로 변형된 hTSH β-소단위 잔기 30사이에 소단위간 이황화결합이 형성되도록 변형된 것을 특징으로 하는 당단백질 호르몬 유사체.
- 사람의 융모성 고나도트로핀(hCG), 사람의 황체화 호르몬(hLH), 사람의 난포자극호르몬(hFSH), 사람의 갑상선 자극 호르몬(hTSH)에서 선택된 당단백질 호르몬 호르몬 유사체에 있어서, 이 유사체는 α-소단위 및 β-소단위를 포함하고, 이때, 당단백질 호르몬 소단위의 아미노산 서열을 변형시켜, α-소단위 루프 3과 β-소단위 루프 2 사이에 소단위간 이황화결합을 만들거나 또는 α-소단위 루프 1과 β-소단위 루프 2 사이에 소단위간 이황화결합을 만들고, 이렇게 변형됨으로써, 당단백질 호르몬의 안정성이 개선되고, 유사체는 고유 당단백질 호르몬 수용체에 대한 생활성을 보유하는 것을 특징으로 하는 당단백질 호르몬 유사체.
- 제 11 항에 있어서, α-소단위의 아미노산 서열은 잔기 Val76을 시스테인으로 변형시키고, hFSH β-소단위의 아미노산 서열은 Val38을 시스테인으로 치환하여, α-소단위 잔기 76과 hFSH β-소단위 잔기 38사이에 소단위간 이황화결합이 형성되도록 변형된 것을 특징으로 하는 당단백질 호르몬 유사체.
- 제 1-3항에 따른 유사체의 효과량 및 제약학적으로 수용 가능한 부형제를 포함하는 것을 특징으로 하는 불임의 치료 또는 수정율 제한을 위한 제약학적 조성물.
- 제 13 항에 있어서, 액체인 것을 특징으로 하는 제약학적 조성물.
- 제 13 항에 있어서, 안정한 것을 특징으로 하는 제약학적 조성물.
- 제 4-10항에 따른 유사체의 효과량 및 제약학적으로 수용 가능한 부형제를 포함하는 것을 특징으로 하는 불임의 치료 또는 수정율 제한을 위한 제약학적 조성물.
- 제 16 항에 있어서, 액체인 것을 특징으로 하는 제약학적 조성물.
- 제 16 항에 있어서, 안정한 것을 특징으로 하는 제약학적 조성물.
- 제 11-12항에 따른 유사체의 효과량 및 제약학적으로 수용 가능한 부형제를 포함하는 것을 특징으로 하는 불임의 치료 또는 수정율 제한을 위한 제약학적 조성물.
- 제 19 항에 있어서, 액체인 것을 특징으로 하는 제약학적 조성물.
- 제 19 항에 있어서, 안정한 것을 특징으로 하는 제약학적 조성물.
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US5078497P | 1997-06-25 | 1997-06-25 | |
US60/050,784 | 1997-06-25 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020047004407A Division KR100706469B1 (ko) | 1997-06-25 | 1998-06-25 | 이황화결합으로 연결된 당단백질 호르몬 유사체, 이의제조방법 및 이의 용도 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20020006720A KR20020006720A (ko) | 2002-01-26 |
KR100560279B1 true KR100560279B1 (ko) | 2006-03-10 |
Family
ID=21967404
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020047004407A KR100706469B1 (ko) | 1997-06-25 | 1998-06-25 | 이황화결합으로 연결된 당단백질 호르몬 유사체, 이의제조방법 및 이의 용도 |
KR1019997011858A KR100560279B1 (ko) | 1997-06-25 | 1998-06-25 | 이황화결합으로 연결된 당단백질 호르몬 유사체, 이의제조방법 및 이의 용도 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020047004407A KR100706469B1 (ko) | 1997-06-25 | 1998-06-25 | 이황화결합으로 연결된 당단백질 호르몬 유사체, 이의제조방법 및 이의 용도 |
Country Status (21)
Country | Link |
---|---|
US (1) | US8530190B1 (ko) |
EP (2) | EP1775346B1 (ko) |
JP (3) | JP3950484B2 (ko) |
KR (2) | KR100706469B1 (ko) |
CN (3) | CN100404551C (ko) |
AR (1) | AR013139A1 (ko) |
AT (2) | ATE335000T1 (ko) |
AU (1) | AU747179B2 (ko) |
BR (1) | BR9810478A (ko) |
CA (1) | CA2293731C (ko) |
CY (2) | CY1105763T1 (ko) |
DE (2) | DE69835433T2 (ko) |
DK (2) | DK1775346T3 (ko) |
ES (2) | ES2268781T3 (ko) |
HK (1) | HK1033149A1 (ko) |
HU (1) | HU227908B1 (ko) |
IL (2) | IL133686A0 (ko) |
PT (2) | PT996629E (ko) |
SI (2) | SI1775346T1 (ko) |
WO (1) | WO1998058957A2 (ko) |
ZA (1) | ZA985545B (ko) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6716428B1 (en) * | 1999-10-06 | 2004-04-06 | The Ohio State University Research Foundation | Antigenic modification of polypeptides |
UA78676C2 (en) * | 2000-02-22 | 2007-04-25 | Applied Research Systems | Purified lh |
AU2000280019A1 (en) * | 2000-10-06 | 2002-04-22 | Regeneron Pharmaceuticals, Inc. | Polypeptides, methods of making, and uses thereof |
JP2005509652A (ja) * | 2001-11-08 | 2005-04-14 | モイル,ウィリアム,アール | 蛋白質の瘤 |
EP1951395B1 (en) | 2005-09-14 | 2012-02-29 | Ares Trading S.A. | Method for the quantitative determination of poloxamers |
RS51792B (en) * | 2006-01-17 | 2011-12-31 | Merck Serono Sa. | NEW FSH WITH GLYCOSILATION OPTION D3N |
CN101250531B (zh) * | 2006-11-27 | 2013-04-24 | 株式会社Lg生命科学 | 一核苷酸序列、包含该序列的表达载体、该载体转化的动物细胞及利用该细胞生产人fsh的方法 |
DE202009009905U1 (de) | 2008-02-08 | 2009-10-29 | Biogenerix Ag | Flüssig-Formulierung von FSH |
CN101347613B (zh) * | 2008-09-17 | 2011-10-26 | 上海天伟生物制药有限公司 | 几乎不含亚基的糖蛋白的组合物及其制备方法 |
AU2010207725B2 (en) * | 2009-01-22 | 2015-06-11 | Novo Nordisk Health Care Ag | Stable growth hormone compounds |
UA106369C2 (ru) | 2009-04-01 | 2014-08-26 | Рациофарм Гмбх | Способ очистки рекомбинантного фсг |
TWI604850B (zh) | 2009-10-05 | 2017-11-11 | 菲瑞茵國際中心股份有限公司 | 藥學製劑 |
EP2325194A1 (en) | 2009-11-24 | 2011-05-25 | Glycotope GmbH | Process for the purification of glycoproteins |
MX338357B (es) | 2010-01-22 | 2016-04-13 | Novo Nordisk Healthcare Ag | Compuestos estables de la hormona de crecimiento. |
CN103002918B (zh) | 2010-01-22 | 2016-05-04 | 诺沃—诺迪斯克保健股份有限公司 | 体内功效延长的生长激素 |
WO2012131306A1 (en) | 2011-03-31 | 2012-10-04 | Ferring B.V. | Pharmaceutical preparation |
RS58881B1 (sr) * | 2012-07-30 | 2019-08-30 | Trophogen Inc | Dugodelujući superagonisti glikoproteinskih hormona |
WO2014166836A1 (en) | 2013-04-05 | 2014-10-16 | Novo Nordisk A/S | Growth hormone compound formulation |
US20230365944A1 (en) * | 2020-09-30 | 2023-11-16 | The University Of North Carolina At Chapel Hill | Engineered stable lactate oxidoreductases, compositions, devices, kits and uses thereof |
WO2022150878A1 (en) * | 2021-01-13 | 2022-07-21 | University Of Newcastle | Compositions and methods of using targeting peptides and nanopharmaceuticals for the sterilization of cats and dogs |
WO2024099445A1 (zh) * | 2022-11-10 | 2024-05-16 | 康立泰生物医药(青岛)有限公司 | 聚乙二醇定点修饰异源聚体蛋白或多肽及其制备方法与应用 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2188508A1 (en) * | 1995-10-24 | 1997-04-25 | Peter Diederik Jan Grootenhuis | Gonadotropins with non-native disulfide bridges |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5079230A (en) * | 1988-09-12 | 1992-01-07 | Pitman-Moore, Inc. | Stable bioactive somatotropins |
US20090209453A1 (en) * | 2005-04-13 | 2009-08-20 | University Of Medicine And Dentistry Of New Jersey | Glycoprotein Hormone Analogs |
-
1998
- 1998-06-25 WO PCT/US1998/013070 patent/WO1998058957A2/en active IP Right Grant
- 1998-06-25 CA CA002293731A patent/CA2293731C/en not_active Expired - Fee Related
- 1998-06-25 CN CNB2003101028468A patent/CN100404551C/zh not_active Expired - Fee Related
- 1998-06-25 JP JP50500099A patent/JP3950484B2/ja not_active Expired - Fee Related
- 1998-06-25 AU AU79861/98A patent/AU747179B2/en not_active Ceased
- 1998-06-25 EP EP06015992A patent/EP1775346B1/en not_active Expired - Lifetime
- 1998-06-25 CN CNB988078112A patent/CN1197968C/zh not_active Expired - Fee Related
- 1998-06-25 DK DK06015992T patent/DK1775346T3/da active
- 1998-06-25 SI SI9830920T patent/SI1775346T1/sl unknown
- 1998-06-25 DK DK98930477T patent/DK0996629T3/da active
- 1998-06-25 PT PT98930477T patent/PT996629E/pt unknown
- 1998-06-25 DE DE69835433T patent/DE69835433T2/de not_active Expired - Lifetime
- 1998-06-25 KR KR1020047004407A patent/KR100706469B1/ko not_active IP Right Cessation
- 1998-06-25 ES ES98930477T patent/ES2268781T3/es not_active Expired - Lifetime
- 1998-06-25 ZA ZA985545A patent/ZA985545B/xx unknown
- 1998-06-25 AT AT98930477T patent/ATE335000T1/de active
- 1998-06-25 PT PT06015992T patent/PT1775346E/pt unknown
- 1998-06-25 IL IL13368698A patent/IL133686A0/xx active IP Right Grant
- 1998-06-25 KR KR1019997011858A patent/KR100560279B1/ko not_active IP Right Cessation
- 1998-06-25 EP EP98930477A patent/EP0996629B1/en not_active Expired - Lifetime
- 1998-06-25 BR BR9810478-0A patent/BR9810478A/pt active Search and Examination
- 1998-06-25 HU HU0100681A patent/HU227908B1/hu not_active IP Right Cessation
- 1998-06-25 AT AT06015992T patent/ATE439439T1/de active
- 1998-06-25 DE DE69841063T patent/DE69841063D1/de not_active Expired - Lifetime
- 1998-06-25 CN CNB2003101028449A patent/CN1302010C/zh not_active Expired - Fee Related
- 1998-06-25 US US09/104,400 patent/US8530190B1/en not_active Expired - Fee Related
- 1998-06-25 SI SI9830857T patent/SI0996629T1/sl unknown
- 1998-06-25 ES ES06015992T patent/ES2332931T3/es not_active Expired - Lifetime
- 1998-06-26 AR ARP980103091A patent/AR013139A1/es active IP Right Grant
-
1999
- 1999-12-23 IL IL133686A patent/IL133686A/en not_active IP Right Cessation
-
2001
- 2001-04-09 HK HK01102479A patent/HK1033149A1/xx not_active IP Right Cessation
-
2004
- 2004-10-27 JP JP2004312947A patent/JP4279768B2/ja not_active Expired - Lifetime
-
2006
- 2006-08-17 JP JP2006222581A patent/JP4278668B2/ja not_active Expired - Lifetime
- 2006-11-01 CY CY20061101598T patent/CY1105763T1/el unknown
-
2009
- 2009-09-24 CY CY20091100994T patent/CY1109439T1/el unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2188508A1 (en) * | 1995-10-24 | 1997-04-25 | Peter Diederik Jan Grootenhuis | Gonadotropins with non-native disulfide bridges |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100560279B1 (ko) | 이황화결합으로 연결된 당단백질 호르몬 유사체, 이의제조방법 및 이의 용도 | |
US6242580B1 (en) | Single-chain forms of the glycoprotein hormone quartet | |
HU227311B1 (en) | Single-chain forms of the glycoprotein hormone quartet | |
US6635256B1 (en) | Glycoprotein hormone compositions comprising two β subunits and methods of use thereof | |
KR100642592B1 (ko) | 갑상선 자극 호르몬의 변이체 및 이에 근거한 방법 | |
CN112409472A (zh) | 糖蛋白激素长效超激动剂 | |
JP3981413B2 (ja) | 糖タンパク質ホルモンスーパーアゴニスト | |
US6693074B1 (en) | Cystine depleted glycoprotein hormones | |
US20060040855A1 (en) | Low efficacy gonadotropin agonists and antagonists | |
JP4086922B2 (ja) | 非天然のジスルフィド架橋を有するゴナドトロピン |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
A107 | Divisional application of patent | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20120221 Year of fee payment: 7 |
|
LAPS | Lapse due to unpaid annual fee |