KR20140036239A - 치료용 융합 단백질 - Google Patents
치료용 융합 단백질 Download PDFInfo
- Publication number
- KR20140036239A KR20140036239A KR1020137033432A KR20137033432A KR20140036239A KR 20140036239 A KR20140036239 A KR 20140036239A KR 1020137033432 A KR1020137033432 A KR 1020137033432A KR 20137033432 A KR20137033432 A KR 20137033432A KR 20140036239 A KR20140036239 A KR 20140036239A
- Authority
- KR
- South Korea
- Prior art keywords
- asn
- leu
- ile
- ser
- lys
- Prior art date
Links
- 108020001507 fusion proteins Proteins 0.000 title claims abstract description 128
- 102000037865 fusion proteins Human genes 0.000 title claims abstract description 128
- 230000001225 therapeutic effect Effects 0.000 title description 22
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 336
- 239000004365 Protease Substances 0.000 claims abstract description 271
- 108091005804 Peptidases Proteins 0.000 claims abstract description 268
- 102000035195 Peptidases Human genes 0.000 claims abstract description 236
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 173
- 230000005945 translocation Effects 0.000 claims abstract description 142
- 231100000065 noncytotoxic Toxicity 0.000 claims abstract description 77
- 230000002020 noncytotoxic effect Effects 0.000 claims abstract description 77
- 230000008685 targeting Effects 0.000 claims abstract description 61
- 238000000034 method Methods 0.000 claims abstract description 58
- 210000004899 c-terminal region Anatomy 0.000 claims abstract description 41
- 230000028327 secretion Effects 0.000 claims abstract description 28
- 230000003213 activating effect Effects 0.000 claims abstract description 5
- 238000003776 cleavage reaction Methods 0.000 claims description 134
- 230000007017 scission Effects 0.000 claims description 130
- 229920001184 polypeptide Polymers 0.000 claims description 115
- 210000004027 cell Anatomy 0.000 claims description 99
- 230000027455 binding Effects 0.000 claims description 84
- 125000000539 amino acid group Chemical group 0.000 claims description 75
- 108090000623 proteins and genes Proteins 0.000 claims description 66
- 102000004169 proteins and genes Human genes 0.000 claims description 64
- 239000012634 fragment Substances 0.000 claims description 62
- XLXSAKCOAKORKW-AQJXLSMYSA-N gonadorelin Chemical compound C([C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1[C@@H](CCC1)C(=O)NCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H]1NC(=O)CC1)C1=CC=C(O)C=C1 XLXSAKCOAKORKW-AQJXLSMYSA-N 0.000 claims description 57
- 239000000579 Gonadotropin-Releasing Hormone Substances 0.000 claims description 55
- 101000857870 Squalus acanthias Gonadoliberin Proteins 0.000 claims description 55
- 229940035638 gonadotropin-releasing hormone Drugs 0.000 claims description 55
- 241000193403 Clostridium Species 0.000 claims description 48
- 108020004414 DNA Proteins 0.000 claims description 41
- 102000005962 receptors Human genes 0.000 claims description 41
- 108020003175 receptors Proteins 0.000 claims description 40
- 230000004927 fusion Effects 0.000 claims description 36
- 239000003446 ligand Substances 0.000 claims description 34
- 239000002581 neurotoxin Substances 0.000 claims description 33
- 231100000618 neurotoxin Toxicity 0.000 claims description 33
- 101800004538 Bradykinin Proteins 0.000 claims description 32
- 101710138657 Neurotoxin Proteins 0.000 claims description 22
- 101800005049 Beta-endorphin Proteins 0.000 claims description 21
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 21
- 108090000622 Nociceptin Proteins 0.000 claims description 20
- 230000003248 secreting effect Effects 0.000 claims description 19
- 108010052343 Gastrins Proteins 0.000 claims description 17
- 230000000694 effects Effects 0.000 claims description 16
- 102400000967 Bradykinin Human genes 0.000 claims description 15
- 102400000921 Gastrin Human genes 0.000 claims description 14
- 108010093625 Opioid Peptides Proteins 0.000 claims description 13
- 102000001490 Opioid Peptides Human genes 0.000 claims description 13
- 108010056088 Somatostatin Proteins 0.000 claims description 13
- AOXOCDRNSPFDPE-UKEONUMOSA-N chembl413654 Chemical compound C([C@H](C(=O)NCC(=O)N[C@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@H](CCSC)C(=O)N[C@H](CC(O)=O)C(=O)N[C@H](CC=1C=CC=CC=1)C(N)=O)NC(=O)[C@@H](C)NC(=O)[C@@H](CCC(O)=O)NC(=O)[C@@H](CCC(O)=O)NC(=O)[C@@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H]1N(CCC1)C(=O)CNC(=O)[C@@H](N)CCC(O)=O)C1=CC=C(O)C=C1 AOXOCDRNSPFDPE-UKEONUMOSA-N 0.000 claims description 13
- 239000012528 membrane Substances 0.000 claims description 13
- 239000003399 opiate peptide Substances 0.000 claims description 13
- 108090001053 Gastrin releasing peptide Proteins 0.000 claims description 12
- 102000005157 Somatostatin Human genes 0.000 claims description 12
- 150000007523 nucleic acids Chemical group 0.000 claims description 12
- 108010092674 Enkephalins Proteins 0.000 claims description 11
- 102000004862 Gastrin releasing peptide Human genes 0.000 claims description 11
- 102400001111 Nociceptin Human genes 0.000 claims description 11
- 210000001163 endosome Anatomy 0.000 claims description 11
- 238000004519 manufacturing process Methods 0.000 claims description 11
- 102400000748 Beta-endorphin Human genes 0.000 claims description 10
- 101800001639 Neuromedin-B Proteins 0.000 claims description 10
- 230000015572 biosynthetic process Effects 0.000 claims description 10
- 210000000805 cytoplasm Anatomy 0.000 claims description 10
- 206010061218 Inflammation Diseases 0.000 claims description 9
- 230000001684 chronic effect Effects 0.000 claims description 9
- 229940088597 hormone Drugs 0.000 claims description 9
- 239000005556 hormone Substances 0.000 claims description 9
- 230000003993 interaction Effects 0.000 claims description 9
- NHXLMOGPVYXJNR-ATOGVRKGSA-N somatostatin Chemical compound C([C@H]1C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CSSC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(=O)N1)[C@@H](C)O)NC(=O)CNC(=O)[C@H](C)N)C(O)=O)=O)[C@H](O)C)C1=CC=CC=C1 NHXLMOGPVYXJNR-ATOGVRKGSA-N 0.000 claims description 9
- 229960000553 somatostatin Drugs 0.000 claims description 9
- 101800000414 Corticotropin Proteins 0.000 claims description 8
- IDLFZVILOHSSID-OVLDLUHVSA-N corticotropin Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)NC(=O)[C@@H](N)CO)C1=CC=C(O)C=C1 IDLFZVILOHSSID-OVLDLUHVSA-N 0.000 claims description 8
- 229960000258 corticotropin Drugs 0.000 claims description 8
- 230000004054 inflammatory process Effects 0.000 claims description 8
- 108090000445 Parathyroid hormone Proteins 0.000 claims description 7
- 102000003982 Parathyroid hormone Human genes 0.000 claims description 7
- YPFNACALNKVZNK-MFNIMNRCSA-N (2s)-2-[(2-aminoacetyl)amino]-n-[(2s)-1-[[(2s)-1-[[(2s)-1-[[(2s,3r)-1-[[2-[[(2s)-1-[[(2s)-1-[[(2s)-1-amino-4-methylsulfanyl-1-oxobutan-2-yl]amino]-1-oxo-3-phenylpropan-2-yl]amino]-3-(1h-imidazol-5-yl)-1-oxopropan-2-yl]amino]-2-oxoethyl]amino]-3-hydroxy-1- Chemical compound C([C@@H](C(=O)N[C@@H](CCSC)C(N)=O)NC(=O)[C@H](CC=1NC=NC=1)NC(=O)CNC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(N)=O)NC(=O)CN)[C@@H](C)O)C1=CC=CC=C1 YPFNACALNKVZNK-MFNIMNRCSA-N 0.000 claims description 6
- 239000000275 Adrenocorticotropic Hormone Substances 0.000 claims description 6
- 108010051479 Bombesin Proteins 0.000 claims description 6
- 102100038819 Neuromedin-B Human genes 0.000 claims description 6
- 239000000199 parathyroid hormone Substances 0.000 claims description 6
- 229960001319 parathyroid hormone Drugs 0.000 claims description 6
- 210000004896 polypeptide structure Anatomy 0.000 claims description 6
- 239000013598 vector Substances 0.000 claims description 6
- 208000002193 Pain Diseases 0.000 claims description 5
- 206010060862 Prostate cancer Diseases 0.000 claims description 5
- 208000000236 Prostatic Neoplasms Diseases 0.000 claims description 5
- 108010061174 Thyrotropin Proteins 0.000 claims description 5
- 102000011923 Thyrotropin Human genes 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 239000003488 releasing hormone Substances 0.000 claims description 5
- 206010020853 Hypertonic bladder Diseases 0.000 claims description 4
- 208000009722 Overactive Urinary Bladder Diseases 0.000 claims description 4
- 102100022831 Somatoliberin Human genes 0.000 claims description 4
- 230000012202 endocytosis Effects 0.000 claims description 4
- 230000028023 exocytosis Effects 0.000 claims description 4
- 208000020629 overactive bladder Diseases 0.000 claims description 4
- 206010009944 Colon cancer Diseases 0.000 claims description 3
- 102100030851 Cortistatin Human genes 0.000 claims description 3
- 229930185483 Cortistatin Natural products 0.000 claims description 3
- 108010051696 Growth Hormone Proteins 0.000 claims description 3
- URLZCHNOLZSCCA-VABKMULXSA-N Leu-enkephalin Chemical class C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)CNC(=O)CNC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=CC=C1 URLZCHNOLZSCCA-VABKMULXSA-N 0.000 claims description 3
- 101800003906 Substance P Proteins 0.000 claims description 3
- 108010005430 cortistatin Proteins 0.000 claims description 3
- DDRPLNQJNRBRNY-WYYADCIBSA-N cortistatin-14 Chemical compound C([C@H]1C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CSSC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N1)NC(=O)[C@H]1NCCC1)C(=O)N[C@@H](CCCCN)C(O)=O)=O)[C@H](O)C)C1=CC=CC=C1 DDRPLNQJNRBRNY-WYYADCIBSA-N 0.000 claims description 3
- 239000000122 growth hormone Substances 0.000 claims description 3
- 230000036407 pain Effects 0.000 claims description 3
- 230000006337 proteolytic cleavage Effects 0.000 claims description 3
- 238000000746 purification Methods 0.000 claims description 3
- 206010006187 Breast cancer Diseases 0.000 claims description 2
- 208000026310 Breast neoplasm Diseases 0.000 claims description 2
- 108090000932 Calcitonin Gene-Related Peptide Proteins 0.000 claims description 2
- 102000004414 Calcitonin Gene-Related Peptide Human genes 0.000 claims description 2
- 208000001333 Colorectal Neoplasms Diseases 0.000 claims description 2
- 108010065372 Dynorphins Proteins 0.000 claims description 2
- 102100028501 Galanin peptides Human genes 0.000 claims description 2
- 101710169265 Galanin peptides Proteins 0.000 claims description 2
- 102400000932 Gonadoliberin-1 Human genes 0.000 claims description 2
- 101500026183 Homo sapiens Gonadoliberin-1 Proteins 0.000 claims description 2
- 108090001061 Insulin Proteins 0.000 claims description 2
- 102000004877 Insulin Human genes 0.000 claims description 2
- 108090000723 Insulin-Like Growth Factor I Proteins 0.000 claims description 2
- 206010058467 Lung neoplasm malignant Diseases 0.000 claims description 2
- 102400000096 Substance P Human genes 0.000 claims description 2
- 102000030621 adenylate cyclase Human genes 0.000 claims description 2
- 108060000200 adenylate cyclase Proteins 0.000 claims description 2
- 229940127089 cytotoxic agent Drugs 0.000 claims description 2
- 239000002254 cytotoxic agent Substances 0.000 claims description 2
- 201000005202 lung cancer Diseases 0.000 claims description 2
- 208000020816 lung neoplasm Diseases 0.000 claims description 2
- 230000001817 pituitary effect Effects 0.000 claims description 2
- 230000002265 prevention Effects 0.000 claims description 2
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 claims 32
- 102400000739 Corticotropin Human genes 0.000 claims 2
- 108010003205 Vasoactive Intestinal Peptide Proteins 0.000 claims 2
- 108060003345 Adrenergic Receptor Proteins 0.000 claims 1
- 102000017910 Adrenergic receptor Human genes 0.000 claims 1
- 108020004635 Complementary DNA Proteins 0.000 claims 1
- 102000053602 DNA Human genes 0.000 claims 1
- 102000018997 Growth Hormone Human genes 0.000 claims 1
- 101710142969 Somatoliberin Proteins 0.000 claims 1
- 102000013275 Somatomedins Human genes 0.000 claims 1
- 102000055135 Vasoactive Intestinal Peptide Human genes 0.000 claims 1
- 238000010804 cDNA synthesis Methods 0.000 claims 1
- 239000002299 complementary DNA Substances 0.000 claims 1
- 239000003112 inhibitor Substances 0.000 abstract description 11
- 238000010276 construction Methods 0.000 abstract description 3
- 239000002243 precursor Substances 0.000 abstract description 3
- 235000019419 proteases Nutrition 0.000 description 199
- 235000001014 amino acid Nutrition 0.000 description 114
- 229940024606 amino acid Drugs 0.000 description 108
- 150000001413 amino acids Chemical class 0.000 description 98
- 235000018102 proteins Nutrition 0.000 description 60
- 108030001720 Bontoxilysin Proteins 0.000 description 59
- 108700010070 Codon Usage Proteins 0.000 description 32
- 241000588724 Escherichia coli Species 0.000 description 29
- 125000006850 spacer group Chemical group 0.000 description 29
- 125000003275 alpha amino acid group Chemical group 0.000 description 28
- ACRYGQFHAQHDSF-ZLUOBGJFSA-N Asn-Asn-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ACRYGQFHAQHDSF-ZLUOBGJFSA-N 0.000 description 24
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 24
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 22
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 21
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 20
- 108010051242 phenylalanylserine Proteins 0.000 description 20
- 230000006870 function Effects 0.000 description 19
- 239000000203 mixture Substances 0.000 description 18
- 102000000583 SNARE Proteins Human genes 0.000 description 16
- 108010041948 SNARE Proteins Proteins 0.000 description 16
- 230000002829 reductive effect Effects 0.000 description 16
- 239000003053 toxin Substances 0.000 description 16
- 231100000765 toxin Toxicity 0.000 description 16
- 108700012359 toxins Proteins 0.000 description 16
- 108010057821 leucylproline Proteins 0.000 description 15
- 239000000126 substance Substances 0.000 description 15
- 238000006467 substitution reaction Methods 0.000 description 15
- MDDUIRLQCYVRDO-NHCYSSNCSA-N Lys-Val-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN MDDUIRLQCYVRDO-NHCYSSNCSA-N 0.000 description 14
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 14
- 235000018417 cysteine Nutrition 0.000 description 14
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 14
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 13
- 241000880493 Leptailurus serval Species 0.000 description 13
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 13
- 108010093581 aspartyl-proline Proteins 0.000 description 13
- 108010017391 lysylvaline Proteins 0.000 description 13
- 239000000758 substrate Substances 0.000 description 13
- 108010038320 lysylphenylalanine Proteins 0.000 description 12
- 108010074860 Factor Xa Proteins 0.000 description 11
- 238000001994 activation Methods 0.000 description 11
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 11
- 230000002068 genetic effect Effects 0.000 description 11
- 239000000047 product Substances 0.000 description 11
- CTWCFPWFIGRAEP-CIUDSAMLSA-N Asp-Lys-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O CTWCFPWFIGRAEP-CIUDSAMLSA-N 0.000 description 10
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 10
- AFODTOLGSZQDSL-PEFMBERDSA-N Glu-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N AFODTOLGSZQDSL-PEFMBERDSA-N 0.000 description 10
- 101001038874 Homo sapiens Glycoprotein hormones alpha chain Proteins 0.000 description 10
- AXNGDPAKKCEKGY-QPHKQPEJSA-N Ile-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N AXNGDPAKKCEKGY-QPHKQPEJSA-N 0.000 description 10
- CAHCWMVNBZJVAW-NAKRPEOUSA-N Ile-Pro-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)O)N CAHCWMVNBZJVAW-NAKRPEOUSA-N 0.000 description 10
- FMMIYCMOVGXZIP-AVGNSLFASA-N Phe-Glu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O FMMIYCMOVGXZIP-AVGNSLFASA-N 0.000 description 10
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 10
- VEVYMLNYMULSMS-AVGNSLFASA-N Ser-Tyr-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEVYMLNYMULSMS-AVGNSLFASA-N 0.000 description 10
- 230000004913 activation Effects 0.000 description 10
- 231100001102 clostridial toxin Toxicity 0.000 description 10
- 108010083708 leucyl-aspartyl-valine Proteins 0.000 description 10
- 210000004379 membrane Anatomy 0.000 description 10
- 230000000926 neurological effect Effects 0.000 description 10
- 108010070643 prolylglutamic acid Proteins 0.000 description 10
- 230000009467 reduction Effects 0.000 description 10
- ADNPLDHMAVUMIW-CUZNLEPHSA-N substance P Chemical compound C([C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(N)=O)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CCCN=C(N)N)C1=CC=CC=C1 ADNPLDHMAVUMIW-CUZNLEPHSA-N 0.000 description 10
- 108010051110 tyrosyl-lysine Proteins 0.000 description 10
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 9
- 101800001982 Cholecystokinin Proteins 0.000 description 9
- 108020004705 Codon Proteins 0.000 description 9
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 9
- 206010043376 Tetanus Diseases 0.000 description 9
- 108010013835 arginine glutamate Proteins 0.000 description 9
- 235000009582 asparagine Nutrition 0.000 description 9
- 229960001230 asparagine Drugs 0.000 description 9
- 108010092854 aspartyllysine Proteins 0.000 description 9
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 9
- PULGYDLMFSFVBL-SMFNREODSA-N nociceptin Chemical compound C([C@@H](C(=O)N[C@H](C(=O)NCC(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O)[C@@H](C)O)NC(=O)CNC(=O)CNC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 PULGYDLMFSFVBL-SMFNREODSA-N 0.000 description 9
- HKZAAJSTFUZYTO-LURJTMIESA-N (2s)-2-[[2-[[2-[[2-[(2-aminoacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]-3-hydroxypropanoic acid Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O HKZAAJSTFUZYTO-LURJTMIESA-N 0.000 description 8
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 8
- 241001112695 Clostridiales Species 0.000 description 8
- YABRDIBSPZONIY-BQBZGAKWSA-N Gly-Ser-Met Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O YABRDIBSPZONIY-BQBZGAKWSA-N 0.000 description 8
- JIUYRPFQJJRSJB-QWRGUYRKSA-N His-His-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)NCC(O)=O)C1=CN=CN1 JIUYRPFQJJRSJB-QWRGUYRKSA-N 0.000 description 8
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 8
- 101000893879 Homo sapiens Galactosylceramide sulfotransferase Proteins 0.000 description 8
- 206010023230 Joint stiffness Diseases 0.000 description 8
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 8
- RXWPLVRJQNWXRQ-IHRRRGAJSA-N Met-His-His Chemical compound C([C@H](NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CNC=N1 RXWPLVRJQNWXRQ-IHRRRGAJSA-N 0.000 description 8
- 101000640778 Mus musculus CMP-sialic acid transporter Proteins 0.000 description 8
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 8
- ZAUHSLVPDLNTRZ-QXEWZRGKSA-N Pro-Val-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O ZAUHSLVPDLNTRZ-QXEWZRGKSA-N 0.000 description 8
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 8
- LHEZGZQRLDBSRR-WDCWCFNPSA-N Thr-Glu-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LHEZGZQRLDBSRR-WDCWCFNPSA-N 0.000 description 8
- 102100026655 Zinc finger protein castor homolog 1 Human genes 0.000 description 8
- 108010047495 alanylglycine Proteins 0.000 description 8
- WOPZMFQRCBYPJU-NTXHZHDSSA-N beta-endorphin Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](NC(=O)[C@H](CCSC)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)CNC(=O)CNC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)[C@@H](C)O)[C@@H](C)O)C(C)C)[C@@H](C)O)C1=CC=CC=C1 WOPZMFQRCBYPJU-NTXHZHDSSA-N 0.000 description 8
- 239000013599 cloning vector Substances 0.000 description 8
- 201000010099 disease Diseases 0.000 description 8
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 8
- 230000002255 enzymatic effect Effects 0.000 description 8
- 108010034529 leucyl-lysine Proteins 0.000 description 8
- 238000002703 mutagenesis Methods 0.000 description 8
- 231100000350 mutagenesis Toxicity 0.000 description 8
- 108010012581 phenylalanylglutamate Proteins 0.000 description 8
- 230000017854 proteolysis Effects 0.000 description 8
- 238000012163 sequencing technique Methods 0.000 description 8
- 230000009466 transformation Effects 0.000 description 8
- 239000003981 vehicle Substances 0.000 description 8
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 7
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 7
- ODKSFYDXXFIFQN-UHFFFAOYSA-N Arginine Chemical compound OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 7
- ANPFQTJEPONRPL-UGYAYLCHSA-N Asn-Ile-Asp Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O ANPFQTJEPONRPL-UGYAYLCHSA-N 0.000 description 7
- RCFGLXMZDYNRSC-CIUDSAMLSA-N Asn-Lys-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O RCFGLXMZDYNRSC-CIUDSAMLSA-N 0.000 description 7
- PSLSTUMPZILTAH-BYULHYEWSA-N Asp-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O PSLSTUMPZILTAH-BYULHYEWSA-N 0.000 description 7
- LTUVYLVIZHJCOQ-KKUMJFAQSA-N Glu-Arg-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LTUVYLVIZHJCOQ-KKUMJFAQSA-N 0.000 description 7
- FJWYJQRCVNGEAQ-ZPFDUUQYSA-N Ile-Asn-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N FJWYJQRCVNGEAQ-ZPFDUUQYSA-N 0.000 description 7
- SVBAHOMTJRFSIC-SXTJYALSSA-N Ile-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVBAHOMTJRFSIC-SXTJYALSSA-N 0.000 description 7
- WCNWGAUZWWSYDG-SVSWQMSJSA-N Ile-Thr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)O)N WCNWGAUZWWSYDG-SVSWQMSJSA-N 0.000 description 7
- QLDHBYRUNQZIJQ-DKIMLUQUSA-N Leu-Ile-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QLDHBYRUNQZIJQ-DKIMLUQUSA-N 0.000 description 7
- WXUOJXIGOPMDJM-SRVKXCTJSA-N Leu-Lys-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O WXUOJXIGOPMDJM-SRVKXCTJSA-N 0.000 description 7
- PPGBXYKMUMHFBF-KATARQTJSA-N Leu-Ser-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PPGBXYKMUMHFBF-KATARQTJSA-N 0.000 description 7
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 7
- 206010028980 Neoplasm Diseases 0.000 description 7
- KBVJZCVLQWCJQN-KKUMJFAQSA-N Phe-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KBVJZCVLQWCJQN-KKUMJFAQSA-N 0.000 description 7
- LDKDSFQSEUOCOO-RPTUDFQQSA-N Tyr-Thr-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LDKDSFQSEUOCOO-RPTUDFQQSA-N 0.000 description 7
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 7
- 230000021615 conjugation Effects 0.000 description 7
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 7
- PUBCCFNQJQKCNC-XKNFJVFFSA-N gastrin-releasingpeptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(N)=O)NC(=O)CNC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC=1N=CNC=1)NC(=O)[C@H](CC(N)=O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@@H](NC(=O)CNC(=O)CNC(=O)CNC(=O)[C@H](C)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CC(C)C)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(C)C)[C@@H](C)O)C(C)C)C1=CNC=N1 PUBCCFNQJQKCNC-XKNFJVFFSA-N 0.000 description 7
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 7
- 108010010147 glycylglutamine Proteins 0.000 description 7
- 210000003097 mucus Anatomy 0.000 description 7
- 230000035772 mutation Effects 0.000 description 7
- 108010079317 prolyl-tyrosine Proteins 0.000 description 7
- 239000011780 sodium chloride Substances 0.000 description 7
- 239000000243 solution Substances 0.000 description 7
- 108010072986 threonyl-seryl-lysine Proteins 0.000 description 7
- 108010073969 valyllysine Proteins 0.000 description 7
- 102100025841 Cholecystokinin Human genes 0.000 description 6
- 239000004471 Glycine Substances 0.000 description 6
- DMHGKBGOUAJRHU-UHFFFAOYSA-N Ile-Arg-Pro Natural products CCC(C)C(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O DMHGKBGOUAJRHU-UHFFFAOYSA-N 0.000 description 6
- 108010006035 Metalloproteases Proteins 0.000 description 6
- 102000005741 Metalloproteases Human genes 0.000 description 6
- 206010030113 Oedema Diseases 0.000 description 6
- QKQDTEYDEIJPNK-GUBZILKMSA-N Ser-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CO QKQDTEYDEIJPNK-GUBZILKMSA-N 0.000 description 6
- 108030001722 Tentoxilysin Proteins 0.000 description 6
- 238000003556 assay Methods 0.000 description 6
- 229940107137 cholecystokinin Drugs 0.000 description 6
- 108010016616 cysteinylglycine Proteins 0.000 description 6
- 108010020688 glycylhistidine Proteins 0.000 description 6
- 238000000338 in vitro Methods 0.000 description 6
- 238000002347 injection Methods 0.000 description 6
- 239000007924 injection Substances 0.000 description 6
- 239000000813 peptide hormone Substances 0.000 description 6
- 102000014187 peptide receptors Human genes 0.000 description 6
- 108010011903 peptide receptors Proteins 0.000 description 6
- IZTQOLKUZKXIRV-YRVFCXMDSA-N sincalide Chemical compound C([C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(N)=O)NC(=O)[C@@H](N)CC(O)=O)C1=CC=C(OS(O)(=O)=O)C=C1 IZTQOLKUZKXIRV-YRVFCXMDSA-N 0.000 description 6
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 5
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 5
- PCIFXPRIFWKWLK-YUMQZZPRSA-N Ala-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N PCIFXPRIFWKWLK-YUMQZZPRSA-N 0.000 description 5
- LDLSENBXQNDTPB-DCAQKATOSA-N Ala-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LDLSENBXQNDTPB-DCAQKATOSA-N 0.000 description 5
- 108010011667 Ala-Phe-Ala Proteins 0.000 description 5
- IORKCNUBHNIMKY-CIUDSAMLSA-N Ala-Pro-Glu Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O IORKCNUBHNIMKY-CIUDSAMLSA-N 0.000 description 5
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 5
- NYZGVTGOMPHSJW-CIUDSAMLSA-N Arg-Glu-Cys Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)CN=C(N)N NYZGVTGOMPHSJW-CIUDSAMLSA-N 0.000 description 5
- CVKOQHYVDVYJSI-QTKMDUPCSA-N Arg-His-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCN=C(N)N)N)O CVKOQHYVDVYJSI-QTKMDUPCSA-N 0.000 description 5
- ITHMWNNUDPJJER-ULQDDVLXSA-N Arg-His-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ITHMWNNUDPJJER-ULQDDVLXSA-N 0.000 description 5
- FRMQITGHXMUNDF-GMOBBJLQSA-N Arg-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FRMQITGHXMUNDF-GMOBBJLQSA-N 0.000 description 5
- GNYUVVJYGJFKHN-RVMXOQNASA-N Arg-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GNYUVVJYGJFKHN-RVMXOQNASA-N 0.000 description 5
- DNBMCNQKNOKOSD-DCAQKATOSA-N Arg-Pro-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O DNBMCNQKNOKOSD-DCAQKATOSA-N 0.000 description 5
- DDBMKOCQWNFDBH-RHYQMDGZSA-N Arg-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O DDBMKOCQWNFDBH-RHYQMDGZSA-N 0.000 description 5
- JBQORRNSZGTLCV-WDSOQIARSA-N Arg-Trp-Lys Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N)=CNC2=C1 JBQORRNSZGTLCV-WDSOQIARSA-N 0.000 description 5
- WOZDCBHUGJVJPL-AVGNSLFASA-N Arg-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WOZDCBHUGJVJPL-AVGNSLFASA-N 0.000 description 5
- MFFOYNGMOYFPBD-DCAQKATOSA-N Asn-Arg-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MFFOYNGMOYFPBD-DCAQKATOSA-N 0.000 description 5
- GOVUDFOGXOONFT-VEVYYDQMSA-N Asn-Arg-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GOVUDFOGXOONFT-VEVYYDQMSA-N 0.000 description 5
- IOTKDTZEEBZNCM-UGYAYLCHSA-N Asn-Asn-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O IOTKDTZEEBZNCM-UGYAYLCHSA-N 0.000 description 5
- KUYKVGODHGHFDI-ACZMJKKPSA-N Asn-Gln-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O KUYKVGODHGHFDI-ACZMJKKPSA-N 0.000 description 5
- NKLRWRRVYGQNIH-GHCJXIJMSA-N Asn-Ile-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O NKLRWRRVYGQNIH-GHCJXIJMSA-N 0.000 description 5
- XVBDDUPJVQXDSI-PEFMBERDSA-N Asn-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVBDDUPJVQXDSI-PEFMBERDSA-N 0.000 description 5
- NVWJMQNYLYWVNQ-BYULHYEWSA-N Asn-Ile-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O NVWJMQNYLYWVNQ-BYULHYEWSA-N 0.000 description 5
- YYSYDIYQTUPNQQ-SXTJYALSSA-N Asn-Ile-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YYSYDIYQTUPNQQ-SXTJYALSSA-N 0.000 description 5
- GOKCTAJWRPSCHP-VHWLVUOQSA-N Asn-Ile-Trp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(=O)N)N GOKCTAJWRPSCHP-VHWLVUOQSA-N 0.000 description 5
- JQBCANGGAVVERB-CFMVVWHZSA-N Asn-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N JQBCANGGAVVERB-CFMVVWHZSA-N 0.000 description 5
- HFPXZWPUVFVNLL-GUBZILKMSA-N Asn-Leu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HFPXZWPUVFVNLL-GUBZILKMSA-N 0.000 description 5
- BZWRLDPIWKOVKB-ZPFDUUQYSA-N Asn-Leu-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BZWRLDPIWKOVKB-ZPFDUUQYSA-N 0.000 description 5
- JWKDQOORUCYUIW-ZPFDUUQYSA-N Asn-Lys-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JWKDQOORUCYUIW-ZPFDUUQYSA-N 0.000 description 5
- WXVGISRWSYGEDK-KKUMJFAQSA-N Asn-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N WXVGISRWSYGEDK-KKUMJFAQSA-N 0.000 description 5
- RTFWCVDISAMGEQ-SRVKXCTJSA-N Asn-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N RTFWCVDISAMGEQ-SRVKXCTJSA-N 0.000 description 5
- UYCPJVYQYARFGB-YDHLFZDLSA-N Asn-Phe-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O UYCPJVYQYARFGB-YDHLFZDLSA-N 0.000 description 5
- YUOXLJYVSZYPBJ-CIUDSAMLSA-N Asn-Pro-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O YUOXLJYVSZYPBJ-CIUDSAMLSA-N 0.000 description 5
- GMUOCGCDOYYWPD-FXQIFTODSA-N Asn-Pro-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O GMUOCGCDOYYWPD-FXQIFTODSA-N 0.000 description 5
- XTMZYFMTYJNABC-ZLUOBGJFSA-N Asn-Ser-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)N)N XTMZYFMTYJNABC-ZLUOBGJFSA-N 0.000 description 5
- HPBNLFLSSQDFQW-WHFBIAKZSA-N Asn-Ser-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O HPBNLFLSSQDFQW-WHFBIAKZSA-N 0.000 description 5
- MKJBPDLENBUHQU-CIUDSAMLSA-N Asn-Ser-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O MKJBPDLENBUHQU-CIUDSAMLSA-N 0.000 description 5
- FMNBYVSGRCXWEK-FOHZUACHSA-N Asn-Thr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O FMNBYVSGRCXWEK-FOHZUACHSA-N 0.000 description 5
- DPWDPEVGACCWTC-SRVKXCTJSA-N Asn-Tyr-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O DPWDPEVGACCWTC-SRVKXCTJSA-N 0.000 description 5
- MJIJBEYEHBKTIM-BYULHYEWSA-N Asn-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N MJIJBEYEHBKTIM-BYULHYEWSA-N 0.000 description 5
- LTDGPJKGJDIBQD-LAEOZQHASA-N Asn-Val-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O LTDGPJKGJDIBQD-LAEOZQHASA-N 0.000 description 5
- LMIWYCWRJVMAIQ-NHCYSSNCSA-N Asn-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N LMIWYCWRJVMAIQ-NHCYSSNCSA-N 0.000 description 5
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 5
- QRULNKJGYQQZMW-ZLUOBGJFSA-N Asp-Asn-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O QRULNKJGYQQZMW-ZLUOBGJFSA-N 0.000 description 5
- HSWYMWGDMPLTTH-FXQIFTODSA-N Asp-Glu-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HSWYMWGDMPLTTH-FXQIFTODSA-N 0.000 description 5
- XDGBFDYXZCMYEX-NUMRIWBASA-N Asp-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)O XDGBFDYXZCMYEX-NUMRIWBASA-N 0.000 description 5
- HAFCJCDJGIOYPW-WDSKDSINSA-N Asp-Gly-Gln Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O HAFCJCDJGIOYPW-WDSKDSINSA-N 0.000 description 5
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 5
- HJCGDIGVVWETRO-ZPFDUUQYSA-N Asp-Lys-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O)C(O)=O HJCGDIGVVWETRO-ZPFDUUQYSA-N 0.000 description 5
- YWLDTBBUHZJQHW-KKUMJFAQSA-N Asp-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N YWLDTBBUHZJQHW-KKUMJFAQSA-N 0.000 description 5
- RXBGWGRSWXOBGK-KKUMJFAQSA-N Asp-Lys-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RXBGWGRSWXOBGK-KKUMJFAQSA-N 0.000 description 5
- IDDMGSKZQDEDGA-SRVKXCTJSA-N Asp-Phe-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 IDDMGSKZQDEDGA-SRVKXCTJSA-N 0.000 description 5
- NBKLEMWHDLAUEM-CIUDSAMLSA-N Asp-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(=O)O)N NBKLEMWHDLAUEM-CIUDSAMLSA-N 0.000 description 5
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 5
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 5
- GXHDGYOXPNQCKM-XVSYOHENSA-N Asp-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GXHDGYOXPNQCKM-XVSYOHENSA-N 0.000 description 5
- BPAUXFVCSYQDQX-JRQIVUDYSA-N Asp-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC(=O)O)N)O BPAUXFVCSYQDQX-JRQIVUDYSA-N 0.000 description 5
- QOJJMJKTMKNFEF-ZKWXMUAHSA-N Asp-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC(O)=O QOJJMJKTMKNFEF-ZKWXMUAHSA-N 0.000 description 5
- 125000001433 C-terminal amino-acid group Chemical group 0.000 description 5
- KCSDYJSCUWLILX-BJDJZHNGSA-N Cys-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CS)N KCSDYJSCUWLILX-BJDJZHNGSA-N 0.000 description 5
- NUMFTVCBONFQIQ-DRZSPHRISA-N Gln-Ala-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NUMFTVCBONFQIQ-DRZSPHRISA-N 0.000 description 5
- WMOMPXKOKASNBK-PEFMBERDSA-N Gln-Asn-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WMOMPXKOKASNBK-PEFMBERDSA-N 0.000 description 5
- ODBLJLZVLAWVMS-GUBZILKMSA-N Gln-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)N)N ODBLJLZVLAWVMS-GUBZILKMSA-N 0.000 description 5
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 5
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 5
- HSHCEAUPUPJPTE-JYJNAYRXSA-N Gln-Leu-Tyr Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N HSHCEAUPUPJPTE-JYJNAYRXSA-N 0.000 description 5
- FKXCBKCOSVIGCT-AVGNSLFASA-N Gln-Lys-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FKXCBKCOSVIGCT-AVGNSLFASA-N 0.000 description 5
- GQTNWYFWSUFFRA-KKUMJFAQSA-N Gln-Met-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GQTNWYFWSUFFRA-KKUMJFAQSA-N 0.000 description 5
- BZULIEARJFRINC-IHRRRGAJSA-N Gln-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N BZULIEARJFRINC-IHRRRGAJSA-N 0.000 description 5
- HUWSBFYAGXCXKC-CIUDSAMLSA-N Glu-Ala-Met Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O HUWSBFYAGXCXKC-CIUDSAMLSA-N 0.000 description 5
- CVPXINNKRTZBMO-CIUDSAMLSA-N Glu-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)CN=C(N)N CVPXINNKRTZBMO-CIUDSAMLSA-N 0.000 description 5
- DIXKFOPPGWKZLY-CIUDSAMLSA-N Glu-Arg-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O DIXKFOPPGWKZLY-CIUDSAMLSA-N 0.000 description 5
- WOSRKEJQESVHGA-CIUDSAMLSA-N Glu-Arg-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O WOSRKEJQESVHGA-CIUDSAMLSA-N 0.000 description 5
- NKSGKPWXSWBRRX-ACZMJKKPSA-N Glu-Asn-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N NKSGKPWXSWBRRX-ACZMJKKPSA-N 0.000 description 5
- VAZZOGXDUQSVQF-NUMRIWBASA-N Glu-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)O VAZZOGXDUQSVQF-NUMRIWBASA-N 0.000 description 5
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 5
- PXXGVUVQWQGGIG-YUMQZZPRSA-N Glu-Gly-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N PXXGVUVQWQGGIG-YUMQZZPRSA-N 0.000 description 5
- ZCOJVESMNGBGLF-GRLWGSQLSA-N Glu-Ile-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZCOJVESMNGBGLF-GRLWGSQLSA-N 0.000 description 5
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 5
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 5
- ITVBKCZZLJUUHI-HTUGSXCWSA-N Glu-Phe-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ITVBKCZZLJUUHI-HTUGSXCWSA-N 0.000 description 5
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 5
- MFYLRRCYBBJYPI-JYJNAYRXSA-N Glu-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O MFYLRRCYBBJYPI-JYJNAYRXSA-N 0.000 description 5
- YPHPEHMXOYTEQG-LAEOZQHASA-N Glu-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O YPHPEHMXOYTEQG-LAEOZQHASA-N 0.000 description 5
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 5
- XLFHCWHXKSFVIB-BQBZGAKWSA-N Gly-Gln-Gln Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XLFHCWHXKSFVIB-BQBZGAKWSA-N 0.000 description 5
- SOEATRRYCIPEHA-BQBZGAKWSA-N Gly-Glu-Glu Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SOEATRRYCIPEHA-BQBZGAKWSA-N 0.000 description 5
- YNIMVVJTPWCUJH-KBPBESRZSA-N Gly-His-Tyr Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YNIMVVJTPWCUJH-KBPBESRZSA-N 0.000 description 5
- DGKBSGNCMCLDSL-BYULHYEWSA-N Gly-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN DGKBSGNCMCLDSL-BYULHYEWSA-N 0.000 description 5
- YTSVAIMKVLZUDU-YUMQZZPRSA-N Gly-Leu-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YTSVAIMKVLZUDU-YUMQZZPRSA-N 0.000 description 5
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 5
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 5
- FEUPVVCGQLNXNP-IRXDYDNUSA-N Gly-Phe-Phe Chemical compound C([C@H](NC(=O)CN)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 FEUPVVCGQLNXNP-IRXDYDNUSA-N 0.000 description 5
- IEGFSKKANYKBDU-QWHCGFSZSA-N Gly-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)CN)C(=O)O IEGFSKKANYKBDU-QWHCGFSZSA-N 0.000 description 5
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 5
- IMRNSEPSPFQNHF-STQMWFEESA-N Gly-Ser-Trp Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=CC=CC=C12)C(=O)O IMRNSEPSPFQNHF-STQMWFEESA-N 0.000 description 5
- NGRPGJGKJMUGDM-XVKPBYJWSA-N Gly-Val-Gln Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O NGRPGJGKJMUGDM-XVKPBYJWSA-N 0.000 description 5
- BNMRSWQOHIQTFL-JSGCOSHPSA-N Gly-Val-Phe Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 BNMRSWQOHIQTFL-JSGCOSHPSA-N 0.000 description 5
- 239000007995 HEPES buffer Substances 0.000 description 5
- LEDRIAHEWDJRMF-CFMVVWHZSA-N Ile-Asn-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LEDRIAHEWDJRMF-CFMVVWHZSA-N 0.000 description 5
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 5
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 5
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 5
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 5
- PWUMCBLVWPCKNO-MGHWNKPDSA-N Ile-Leu-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 PWUMCBLVWPCKNO-MGHWNKPDSA-N 0.000 description 5
- KTTMFLSBTNBAHL-MXAVVETBSA-N Ile-Phe-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CS)C(=O)O)N KTTMFLSBTNBAHL-MXAVVETBSA-N 0.000 description 5
- FGBRXCZYVRFNKQ-MXAVVETBSA-N Ile-Phe-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N FGBRXCZYVRFNKQ-MXAVVETBSA-N 0.000 description 5
- IITVUURPOYGCTD-NAKRPEOUSA-N Ile-Pro-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IITVUURPOYGCTD-NAKRPEOUSA-N 0.000 description 5
- NAFIFZNBSPWYOO-RWRJDSDZSA-N Ile-Thr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N NAFIFZNBSPWYOO-RWRJDSDZSA-N 0.000 description 5
- QGXQHJQPAPMACW-PPCPHDFISA-N Ile-Thr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QGXQHJQPAPMACW-PPCPHDFISA-N 0.000 description 5
- NURNJECQNNCRBK-FLBSBUHZSA-N Ile-Thr-Thr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NURNJECQNNCRBK-FLBSBUHZSA-N 0.000 description 5
- WIYDLTIBHZSPKY-HJWJTTGWSA-N Ile-Val-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WIYDLTIBHZSPKY-HJWJTTGWSA-N 0.000 description 5
- 108010065920 Insulin Lispro Proteins 0.000 description 5
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 5
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 5
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 5
- KSZCCRIGNVSHFH-UWVGGRQHSA-N Leu-Arg-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O KSZCCRIGNVSHFH-UWVGGRQHSA-N 0.000 description 5
- DBVWMYGBVFCRBE-CIUDSAMLSA-N Leu-Asn-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O DBVWMYGBVFCRBE-CIUDSAMLSA-N 0.000 description 5
- POJPZSMTTMLSTG-SRVKXCTJSA-N Leu-Asn-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N POJPZSMTTMLSTG-SRVKXCTJSA-N 0.000 description 5
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 5
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 5
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 5
- QCSFMCFHVGTLFF-NHCYSSNCSA-N Leu-Asp-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O QCSFMCFHVGTLFF-NHCYSSNCSA-N 0.000 description 5
- WMTOVWLLDGQGCV-GUBZILKMSA-N Leu-Glu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N WMTOVWLLDGQGCV-GUBZILKMSA-N 0.000 description 5
- KVMULWOHPPMHHE-DCAQKATOSA-N Leu-Glu-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O KVMULWOHPPMHHE-DCAQKATOSA-N 0.000 description 5
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 5
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 5
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 5
- LIINDKYIGYTDLG-PPCPHDFISA-N Leu-Ile-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LIINDKYIGYTDLG-PPCPHDFISA-N 0.000 description 5
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 5
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 5
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 5
- ZRHDPZAAWLXXIR-SRVKXCTJSA-N Leu-Lys-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O ZRHDPZAAWLXXIR-SRVKXCTJSA-N 0.000 description 5
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 5
- LVTJJOJKDCVZGP-QWRGUYRKSA-N Leu-Lys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LVTJJOJKDCVZGP-QWRGUYRKSA-N 0.000 description 5
- LZHJZLHSRGWBBE-IHRRRGAJSA-N Leu-Lys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LZHJZLHSRGWBBE-IHRRRGAJSA-N 0.000 description 5
- POMXSEDNUXYPGK-IHRRRGAJSA-N Leu-Met-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N POMXSEDNUXYPGK-IHRRRGAJSA-N 0.000 description 5
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 5
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 5
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 5
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 5
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 5
- IDGZVZJLYFTXSL-DCAQKATOSA-N Leu-Ser-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IDGZVZJLYFTXSL-DCAQKATOSA-N 0.000 description 5
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 5
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 5
- FGZVGOAAROXFAB-IXOXFDKPSA-N Leu-Thr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(C)C)N)O FGZVGOAAROXFAB-IXOXFDKPSA-N 0.000 description 5
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 5
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 5
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 5
- HGZHSNBZDOLMLH-DCAQKATOSA-N Lys-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N HGZHSNBZDOLMLH-DCAQKATOSA-N 0.000 description 5
- WGCKDDHUFPQSMZ-ZPFDUUQYSA-N Lys-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCCCN WGCKDDHUFPQSMZ-ZPFDUUQYSA-N 0.000 description 5
- KWUKZRFFKPLUPE-HJGDQZAQSA-N Lys-Asp-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWUKZRFFKPLUPE-HJGDQZAQSA-N 0.000 description 5
- PRSBSVAVOQOAMI-BJDJZHNGSA-N Lys-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN PRSBSVAVOQOAMI-BJDJZHNGSA-N 0.000 description 5
- WRODMZBHNNPRLN-SRVKXCTJSA-N Lys-Leu-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O WRODMZBHNNPRLN-SRVKXCTJSA-N 0.000 description 5
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 5
- ODTZHNZPINULEU-KKUMJFAQSA-N Lys-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N ODTZHNZPINULEU-KKUMJFAQSA-N 0.000 description 5
- DNWBUCHHMRQWCZ-GUBZILKMSA-N Lys-Ser-Gln Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O DNWBUCHHMRQWCZ-GUBZILKMSA-N 0.000 description 5
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 5
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 5
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 5
- QFSYGUMEANRNJE-DCAQKATOSA-N Lys-Val-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N QFSYGUMEANRNJE-DCAQKATOSA-N 0.000 description 5
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 5
- DNDVVILEHVMWIS-LPEHRKFASA-N Met-Asp-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DNDVVILEHVMWIS-LPEHRKFASA-N 0.000 description 5
- OGAZPKJHHZPYFK-GARJFASQSA-N Met-Glu-Pro Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N OGAZPKJHHZPYFK-GARJFASQSA-N 0.000 description 5
- HAQLBBVZAGMESV-IHRRRGAJSA-N Met-Lys-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O HAQLBBVZAGMESV-IHRRRGAJSA-N 0.000 description 5
- MQASRXPTQJJNFM-JYJNAYRXSA-N Met-Pro-Phe Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MQASRXPTQJJNFM-JYJNAYRXSA-N 0.000 description 5
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 5
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 5
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 5
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 5
- WSXKXSBOJXEZDV-DLOVCJGASA-N Phe-Ala-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@H](C)NC(=O)[C@@H]([NH3+])CC1=CC=CC=C1 WSXKXSBOJXEZDV-DLOVCJGASA-N 0.000 description 5
- OXUMFAOVGFODPN-KKUMJFAQSA-N Phe-Asn-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N OXUMFAOVGFODPN-KKUMJFAQSA-N 0.000 description 5
- RIYZXJVARWJLKS-KKUMJFAQSA-N Phe-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 RIYZXJVARWJLKS-KKUMJFAQSA-N 0.000 description 5
- FIRWJEJVFFGXSH-RYUDHWBXSA-N Phe-Glu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 FIRWJEJVFFGXSH-RYUDHWBXSA-N 0.000 description 5
- QPVFUAUFEBPIPT-CDMKHQONSA-N Phe-Gly-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O QPVFUAUFEBPIPT-CDMKHQONSA-N 0.000 description 5
- XDMMOISUAHXXFD-SRVKXCTJSA-N Phe-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O XDMMOISUAHXXFD-SRVKXCTJSA-N 0.000 description 5
- JHSRGEODDALISP-XVSYOHENSA-N Phe-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O JHSRGEODDALISP-XVSYOHENSA-N 0.000 description 5
- ICTZKEXYDDZZFP-SRVKXCTJSA-N Pro-Arg-Pro Chemical compound N([C@@H](CCCN=C(N)N)C(=O)N1[C@@H](CCC1)C(O)=O)C(=O)[C@@H]1CCCN1 ICTZKEXYDDZZFP-SRVKXCTJSA-N 0.000 description 5
- XWYXZPHPYKRYPA-GMOBBJLQSA-N Pro-Asn-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XWYXZPHPYKRYPA-GMOBBJLQSA-N 0.000 description 5
- AHXPYZRZRMQOAU-QXEWZRGKSA-N Pro-Asn-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H]1CCCN1)C(O)=O AHXPYZRZRMQOAU-QXEWZRGKSA-N 0.000 description 5
- WGAQWMRJUFQXMF-ZPFDUUQYSA-N Pro-Gln-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WGAQWMRJUFQXMF-ZPFDUUQYSA-N 0.000 description 5
- DSGSTPRKNYHGCL-JYJNAYRXSA-N Pro-Phe-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O DSGSTPRKNYHGCL-JYJNAYRXSA-N 0.000 description 5
- UGDMQJSXSSZUKL-IHRRRGAJSA-N Pro-Ser-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O UGDMQJSXSSZUKL-IHRRRGAJSA-N 0.000 description 5
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 5
- 108010010469 Qa-SNARE Proteins Proteins 0.000 description 5
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 5
- OOKCGAYXSNJBGQ-ZLUOBGJFSA-N Ser-Asn-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OOKCGAYXSNJBGQ-ZLUOBGJFSA-N 0.000 description 5
- YMEXHZTVKDAKIY-GHCJXIJMSA-N Ser-Asn-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO)C(O)=O YMEXHZTVKDAKIY-GHCJXIJMSA-N 0.000 description 5
- DKKGAAJTDKHWOD-BIIVOSGPSA-N Ser-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)C(=O)O DKKGAAJTDKHWOD-BIIVOSGPSA-N 0.000 description 5
- CTLVSHXLRVEILB-UBHSHLNASA-N Ser-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N CTLVSHXLRVEILB-UBHSHLNASA-N 0.000 description 5
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 5
- BYIROAKULFFTEK-CIUDSAMLSA-N Ser-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO BYIROAKULFFTEK-CIUDSAMLSA-N 0.000 description 5
- ULVMNZOKDBHKKI-ACZMJKKPSA-N Ser-Gln-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ULVMNZOKDBHKKI-ACZMJKKPSA-N 0.000 description 5
- VDVYTKZBMFADQH-AVGNSLFASA-N Ser-Gln-Tyr Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 VDVYTKZBMFADQH-AVGNSLFASA-N 0.000 description 5
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 5
- OHKFXGKHSJKKAL-NRPADANISA-N Ser-Glu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O OHKFXGKHSJKKAL-NRPADANISA-N 0.000 description 5
- RIAKPZVSNBBNRE-BJDJZHNGSA-N Ser-Ile-Leu Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O RIAKPZVSNBBNRE-BJDJZHNGSA-N 0.000 description 5
- UIPXCLNLUUAMJU-JBDRJPRFSA-N Ser-Ile-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UIPXCLNLUUAMJU-JBDRJPRFSA-N 0.000 description 5
- IUXGJEIKJBYKOO-SRVKXCTJSA-N Ser-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N IUXGJEIKJBYKOO-SRVKXCTJSA-N 0.000 description 5
- HEUVHBXOVZONPU-BJDJZHNGSA-N Ser-Leu-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HEUVHBXOVZONPU-BJDJZHNGSA-N 0.000 description 5
- JWOBLHJRDADHLN-KKUMJFAQSA-N Ser-Leu-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JWOBLHJRDADHLN-KKUMJFAQSA-N 0.000 description 5
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 5
- ATEQEHCGZKBEMU-GQGQLFGLSA-N Ser-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N ATEQEHCGZKBEMU-GQGQLFGLSA-N 0.000 description 5
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 5
- 102000050389 Syntaxin Human genes 0.000 description 5
- CTONFVDJYCAMQM-IUKAMOBKSA-N Thr-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H]([C@@H](C)O)N CTONFVDJYCAMQM-IUKAMOBKSA-N 0.000 description 5
- PZVGOVRNGKEFCB-KKHAAJSZSA-N Thr-Asn-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N)O PZVGOVRNGKEFCB-KKHAAJSZSA-N 0.000 description 5
- HOVLHEKTGVIKAP-WDCWCFNPSA-N Thr-Leu-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O HOVLHEKTGVIKAP-WDCWCFNPSA-N 0.000 description 5
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 5
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 5
- MEBDIIKMUUNBSB-RPTUDFQQSA-N Thr-Phe-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MEBDIIKMUUNBSB-RPTUDFQQSA-N 0.000 description 5
- XKWABWFMQXMUMT-HJGDQZAQSA-N Thr-Pro-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XKWABWFMQXMUMT-HJGDQZAQSA-N 0.000 description 5
- IEZVHOULSUULHD-XGEHTFHBSA-N Thr-Ser-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O IEZVHOULSUULHD-XGEHTFHBSA-N 0.000 description 5
- VGNKUXWYFFDWDH-BEMMVCDISA-N Thr-Trp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N3CCC[C@@H]3C(=O)O)N)O VGNKUXWYFFDWDH-BEMMVCDISA-N 0.000 description 5
- BDWDMRSGCXEDMR-WFBYXXMGSA-N Trp-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N BDWDMRSGCXEDMR-WFBYXXMGSA-N 0.000 description 5
- NFVQCNMGJILYMI-SZMVWBNQSA-N Trp-Met-Val Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O NFVQCNMGJILYMI-SZMVWBNQSA-N 0.000 description 5
- XMNDQSYABVWZRK-BZSNNMDCSA-N Tyr-Asn-Phe Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XMNDQSYABVWZRK-BZSNNMDCSA-N 0.000 description 5
- BEIGSKUPTIFYRZ-SRVKXCTJSA-N Tyr-Asp-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O BEIGSKUPTIFYRZ-SRVKXCTJSA-N 0.000 description 5
- HZZKQZDUIKVFDZ-AVGNSLFASA-N Tyr-Gln-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)O HZZKQZDUIKVFDZ-AVGNSLFASA-N 0.000 description 5
- GGXUDPQWAWRINY-XEGUGMAKSA-N Tyr-Ile-Gly Chemical compound OC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 GGXUDPQWAWRINY-XEGUGMAKSA-N 0.000 description 5
- WDGDKHLSDIOXQC-ACRUOGEOSA-N Tyr-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 WDGDKHLSDIOXQC-ACRUOGEOSA-N 0.000 description 5
- CDKZJGMPZHPAJC-ULQDDVLXSA-N Tyr-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 CDKZJGMPZHPAJC-ULQDDVLXSA-N 0.000 description 5
- BGFCXQXETBDEHP-BZSNNMDCSA-N Tyr-Phe-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O BGFCXQXETBDEHP-BZSNNMDCSA-N 0.000 description 5
- NVZVJIUDICCMHZ-BZSNNMDCSA-N Tyr-Phe-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O NVZVJIUDICCMHZ-BZSNNMDCSA-N 0.000 description 5
- GQVZBMROTPEPIF-SRVKXCTJSA-N Tyr-Ser-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GQVZBMROTPEPIF-SRVKXCTJSA-N 0.000 description 5
- BIVIUZRBCAUNPW-JRQIVUDYSA-N Tyr-Thr-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O BIVIUZRBCAUNPW-JRQIVUDYSA-N 0.000 description 5
- OJCISMMNNUNNJA-BZSNNMDCSA-N Tyr-Tyr-Asp Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC(O)=O)C(O)=O)C1=CC=C(O)C=C1 OJCISMMNNUNNJA-BZSNNMDCSA-N 0.000 description 5
- RMRFSFXLFWWAJZ-HJOGWXRNSA-N Tyr-Tyr-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 RMRFSFXLFWWAJZ-HJOGWXRNSA-N 0.000 description 5
- RGJZPXFZIUUQDN-BPNCWPANSA-N Tyr-Val-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O RGJZPXFZIUUQDN-BPNCWPANSA-N 0.000 description 5
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 5
- JFAWZADYPRMRCO-UBHSHLNASA-N Val-Ala-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JFAWZADYPRMRCO-UBHSHLNASA-N 0.000 description 5
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 5
- DDNIHOWRDOXXPF-NGZCFLSTSA-N Val-Asp-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N DDNIHOWRDOXXPF-NGZCFLSTSA-N 0.000 description 5
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 5
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 5
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 5
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 5
- VHRLUTIMTDOVCG-PEDHHIEDSA-N Val-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H](C(C)C)N VHRLUTIMTDOVCG-PEDHHIEDSA-N 0.000 description 5
- JZWZACGUZVCQPS-RNJOBUHISA-N Val-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N JZWZACGUZVCQPS-RNJOBUHISA-N 0.000 description 5
- XXWBHOWRARMUOC-NHCYSSNCSA-N Val-Lys-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N XXWBHOWRARMUOC-NHCYSSNCSA-N 0.000 description 5
- USLVEJAHTBLSIL-CYDGBPFRSA-N Val-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C USLVEJAHTBLSIL-CYDGBPFRSA-N 0.000 description 5
- VIKZGAUAKQZDOF-NRPADANISA-N Val-Ser-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O VIKZGAUAKQZDOF-NRPADANISA-N 0.000 description 5
- OFTXTCGQJXTNQS-XGEHTFHBSA-N Val-Thr-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N)O OFTXTCGQJXTNQS-XGEHTFHBSA-N 0.000 description 5
- IECQJCJNPJVUSB-IHRRRGAJSA-N Val-Tyr-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](CO)C(O)=O IECQJCJNPJVUSB-IHRRRGAJSA-N 0.000 description 5
- ZLNYBMWGPOKSLW-LSJOCFKGSA-N Val-Val-Asp Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLNYBMWGPOKSLW-LSJOCFKGSA-N 0.000 description 5
- 241000700605 Viruses Species 0.000 description 5
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 5
- 108010047857 aspartylglycine Proteins 0.000 description 5
- 108010068265 aspartyltyrosine Proteins 0.000 description 5
- 230000001580 bacterial effect Effects 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 5
- 108010078144 glutaminyl-glycine Proteins 0.000 description 5
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 5
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 5
- 108010050848 glycylleucine Proteins 0.000 description 5
- 108010015792 glycyllysine Proteins 0.000 description 5
- 108010077515 glycylproline Proteins 0.000 description 5
- 108010018006 histidylserine Proteins 0.000 description 5
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 5
- 230000000670 limiting effect Effects 0.000 description 5
- 108010003700 lysyl aspartic acid Proteins 0.000 description 5
- 108010005942 methionylglycine Proteins 0.000 description 5
- 108010009920 neokyotorphin (1-4) Proteins 0.000 description 5
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 5
- 108010090894 prolylleucine Proteins 0.000 description 5
- 108010053725 prolylvaline Proteins 0.000 description 5
- 238000012216 screening Methods 0.000 description 5
- 108010026333 seryl-proline Proteins 0.000 description 5
- 208000024891 symptom Diseases 0.000 description 5
- 210000001519 tissue Anatomy 0.000 description 5
- 238000011200 topical administration Methods 0.000 description 5
- 108700004896 tripeptide FEG Proteins 0.000 description 5
- 108010080629 tryptophan-leucine Proteins 0.000 description 5
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 4
- NYGILGUOUOXGMJ-YUMQZZPRSA-N Asn-Lys-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O NYGILGUOUOXGMJ-YUMQZZPRSA-N 0.000 description 4
- KHGPWGKPYHPOIK-QWRGUYRKSA-N Asp-Gly-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KHGPWGKPYHPOIK-QWRGUYRKSA-N 0.000 description 4
- 102000013585 Bombesin Human genes 0.000 description 4
- 201000009273 Endometriosis Diseases 0.000 description 4
- 102000004190 Enzymes Human genes 0.000 description 4
- 108090000790 Enzymes Proteins 0.000 description 4
- BLOXULLYFRGYKZ-GUBZILKMSA-N Gln-Glu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O BLOXULLYFRGYKZ-GUBZILKMSA-N 0.000 description 4
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 4
- 108010086677 Gonadotropins Proteins 0.000 description 4
- 102000006771 Gonadotropins Human genes 0.000 description 4
- 108010002231 IgA-specific serine endopeptidase Proteins 0.000 description 4
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 4
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 4
- YIBOAHAOAWACDK-QEJZJMRPSA-N Lys-Ala-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YIBOAHAOAWACDK-QEJZJMRPSA-N 0.000 description 4
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 4
- 108010042237 Methionine Enkephalin Proteins 0.000 description 4
- 241000588653 Neisseria Species 0.000 description 4
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 4
- 102000002020 Protease-activated receptors Human genes 0.000 description 4
- 108050009310 Protease-activated receptors Proteins 0.000 description 4
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 4
- 102100030552 Synaptosomal-associated protein 25 Human genes 0.000 description 4
- 108010055044 Tetanus Toxin Proteins 0.000 description 4
- WPAKPLPGQNUXGN-OSUNSFLBSA-N Thr-Ile-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WPAKPLPGQNUXGN-OSUNSFLBSA-N 0.000 description 4
- YGCDFAJJCRVQKU-RCWTZXSCSA-N Thr-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O YGCDFAJJCRVQKU-RCWTZXSCSA-N 0.000 description 4
- 241000711975 Vesicular stomatitis virus Species 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 108010062796 arginyllysine Proteins 0.000 description 4
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 4
- 239000003814 drug Substances 0.000 description 4
- 229940088598 enzyme Drugs 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 238000009472 formulation Methods 0.000 description 4
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 4
- 239000002622 gonadotropin Substances 0.000 description 4
- 238000001727 in vivo Methods 0.000 description 4
- 230000003834 intracellular effect Effects 0.000 description 4
- 238000004949 mass spectrometry Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000001537 neural effect Effects 0.000 description 4
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 4
- 206010039073 rheumatoid arthritis Diseases 0.000 description 4
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 4
- 230000014616 translation Effects 0.000 description 4
- ATCJTYORYKLVIA-SRXJVYAUSA-N vamp regimen Chemical compound O=C1C=C[C@]2(C)[C@H]3[C@@H](O)C[C@](C)([C@@](CC4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1.C=1N=C2N=C(N)N=C(N)C2=NC=1CN(C)C1=CC=C(C(=O)N[C@@H](CCC(O)=O)C(O)=O)C=C1.O([C@H]1C[C@@](O)(CC=2C(O)=C3C(=O)C=4C=CC=C(C=4C(=O)C3=C(O)C=21)OC)C(=O)CO)[C@H]1C[C@H](N)[C@H](O)[C@H](C)O1.C([C@H](C[C@]1(C(=O)OC)C=2C(=CC3=C(C45[C@H]([C@@]([C@H](OC(C)=O)[C@]6(CC)C=CCN([C@H]56)CC4)(O)C(=O)OC)N3C=O)C=2)OC)C[C@@](C2)(O)CC)N2CCC2=C1NC1=CC=CC=C21 ATCJTYORYKLVIA-SRXJVYAUSA-N 0.000 description 4
- YFGBQHOOROIVKG-BHDDXSALSA-N (2R)-2-[[(2R)-2-[[2-[[2-[[(2S)-2-amino-3-(4-hydroxyphenyl)propanoyl]amino]acetyl]amino]acetyl]amino]-3-phenylpropanoyl]amino]-4-methylsulfanylbutanoic acid Chemical compound C([C@H](C(=O)N[C@H](CCSC)C(O)=O)NC(=O)CNC(=O)CNC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=CC=C1 YFGBQHOOROIVKG-BHDDXSALSA-N 0.000 description 3
- AXFMEGAFCUULFV-BLFANLJRSA-N (2s)-2-[[(2s)-1-[(2s,3r)-2-amino-3-methylpentanoyl]pyrrolidine-2-carbonyl]amino]pentanedioic acid Chemical compound CC[C@@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AXFMEGAFCUULFV-BLFANLJRSA-N 0.000 description 3
- SNDPXSYFESPGGJ-UHFFFAOYSA-N 2-aminopentanoic acid Chemical compound CCCC(N)C(O)=O SNDPXSYFESPGGJ-UHFFFAOYSA-N 0.000 description 3
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 3
- WEZNQZHACPSMEF-QEJZJMRPSA-N Ala-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 WEZNQZHACPSMEF-QEJZJMRPSA-N 0.000 description 3
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 3
- 101000879393 Aplysia californica Synaptobrevin Proteins 0.000 description 3
- YSUVMPICYVWRBX-VEVYYDQMSA-N Arg-Asp-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YSUVMPICYVWRBX-VEVYYDQMSA-N 0.000 description 3
- IYMAXBFPHPZYIK-BQBZGAKWSA-N Arg-Gly-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O IYMAXBFPHPZYIK-BQBZGAKWSA-N 0.000 description 3
- PZBSKYJGKNNYNK-ULQDDVLXSA-N Arg-Leu-Tyr Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCN=C(N)N)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O PZBSKYJGKNNYNK-ULQDDVLXSA-N 0.000 description 3
- HZPSDHRYYIORKR-WHFBIAKZSA-N Asn-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O HZPSDHRYYIORKR-WHFBIAKZSA-N 0.000 description 3
- JTXVXGXTRXMOFJ-FXQIFTODSA-N Asn-Pro-Asn Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O JTXVXGXTRXMOFJ-FXQIFTODSA-N 0.000 description 3
- BYLSYQASFJJBCL-DCAQKATOSA-N Asn-Pro-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O BYLSYQASFJJBCL-DCAQKATOSA-N 0.000 description 3
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 3
- KTTCQQNRRLCIBC-GHCJXIJMSA-N Asp-Ile-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O KTTCQQNRRLCIBC-GHCJXIJMSA-N 0.000 description 3
- YIDFBWRHIYOYAA-LKXGYXEUSA-N Asp-Ser-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O YIDFBWRHIYOYAA-LKXGYXEUSA-N 0.000 description 3
- UTLCRGFJFSZWAW-OLHMAJIHSA-N Asp-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O UTLCRGFJFSZWAW-OLHMAJIHSA-N 0.000 description 3
- 102000014914 Carrier Proteins Human genes 0.000 description 3
- 108010013369 Enteropeptidase Proteins 0.000 description 3
- 102100029727 Enteropeptidase Human genes 0.000 description 3
- 108010079345 Follicle Stimulating Hormone Proteins 0.000 description 3
- 102000012673 Follicle Stimulating Hormone Human genes 0.000 description 3
- NMYFPKCIGUJMIK-GUBZILKMSA-N Gln-Met-Gln Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N NMYFPKCIGUJMIK-GUBZILKMSA-N 0.000 description 3
- AQPZYBSRDRZBAG-AVGNSLFASA-N Gln-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N AQPZYBSRDRZBAG-AVGNSLFASA-N 0.000 description 3
- UGEZSPWLJABDAR-KKUMJFAQSA-N Gln-Tyr-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)N)N UGEZSPWLJABDAR-KKUMJFAQSA-N 0.000 description 3
- VYOILACOFPPNQH-UMNHJUIQSA-N Gln-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N VYOILACOFPPNQH-UMNHJUIQSA-N 0.000 description 3
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 3
- VTTSANCGJWLPNC-ZPFDUUQYSA-N Glu-Arg-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VTTSANCGJWLPNC-ZPFDUUQYSA-N 0.000 description 3
- YYOBUPFZLKQUAX-FXQIFTODSA-N Glu-Asn-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YYOBUPFZLKQUAX-FXQIFTODSA-N 0.000 description 3
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 3
- MUSGDMDGNGXULI-DCAQKATOSA-N Glu-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O MUSGDMDGNGXULI-DCAQKATOSA-N 0.000 description 3
- VGBSZQSKQRMLHD-MNXVOIDGSA-N Glu-Leu-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VGBSZQSKQRMLHD-MNXVOIDGSA-N 0.000 description 3
- CUPSDFQZTVVTSK-GUBZILKMSA-N Glu-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(O)=O CUPSDFQZTVVTSK-GUBZILKMSA-N 0.000 description 3
- KXTAGESXNQEZKB-DZKIICNBSA-N Glu-Phe-Val Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 KXTAGESXNQEZKB-DZKIICNBSA-N 0.000 description 3
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 3
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 3
- MHZXESQPPXOING-KBPBESRZSA-N Gly-Lys-Phe Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MHZXESQPPXOING-KBPBESRZSA-N 0.000 description 3
- WZSHYFGOLPXPLL-RYUDHWBXSA-N Gly-Phe-Glu Chemical compound NCC(=O)N[C@@H](Cc1ccccc1)C(=O)N[C@@H](CCC(O)=O)C(O)=O WZSHYFGOLPXPLL-RYUDHWBXSA-N 0.000 description 3
- HQSKKSLNLSTONK-JTQLQIEISA-N Gly-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 HQSKKSLNLSTONK-JTQLQIEISA-N 0.000 description 3
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 3
- AFMOTCMSEBITOE-YEPSODPASA-N Gly-Val-Thr Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O AFMOTCMSEBITOE-YEPSODPASA-N 0.000 description 3
- QXZGBUJJYSLZLT-UHFFFAOYSA-N H-Arg-Pro-Pro-Gly-Phe-Ser-Pro-Phe-Arg-OH Natural products NC(N)=NCCCC(N)C(=O)N1CCCC1C(=O)N1C(C(=O)NCC(=O)NC(CC=2C=CC=CC=2)C(=O)NC(CO)C(=O)N2C(CCC2)C(=O)NC(CC=2C=CC=CC=2)C(=O)NC(CCCN=C(N)N)C(O)=O)CCC1 QXZGBUJJYSLZLT-UHFFFAOYSA-N 0.000 description 3
- DCRODRAURLJOFY-XPUUQOCRSA-N His-Ala-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)NCC(O)=O DCRODRAURLJOFY-XPUUQOCRSA-N 0.000 description 3
- LYSVCKOXIDKEEL-SRVKXCTJSA-N His-Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CN=CN1 LYSVCKOXIDKEEL-SRVKXCTJSA-N 0.000 description 3
- VOEGKUNRHYKYSU-XVYDVKMFSA-N His-Asp-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O VOEGKUNRHYKYSU-XVYDVKMFSA-N 0.000 description 3
- STWGDDDFLUFCCA-GVXVVHGQSA-N His-Glu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O STWGDDDFLUFCCA-GVXVVHGQSA-N 0.000 description 3
- QICVAHODWHIWIS-HTFCKZLJSA-N Ile-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N QICVAHODWHIWIS-HTFCKZLJSA-N 0.000 description 3
- HERITAGIPLEJMT-GVARAGBVSA-N Ile-Ala-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HERITAGIPLEJMT-GVARAGBVSA-N 0.000 description 3
- VZIFYHYNQDIPLI-HJWJTTGWSA-N Ile-Arg-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N VZIFYHYNQDIPLI-HJWJTTGWSA-N 0.000 description 3
- QIHJTGSVGIPHIW-QSFUFRPTSA-N Ile-Asn-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N QIHJTGSVGIPHIW-QSFUFRPTSA-N 0.000 description 3
- OVPYIUNCVSOVNF-KQXIARHKSA-N Ile-Gln-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N OVPYIUNCVSOVNF-KQXIARHKSA-N 0.000 description 3
- OVPYIUNCVSOVNF-ZPFDUUQYSA-N Ile-Gln-Pro Natural products CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O OVPYIUNCVSOVNF-ZPFDUUQYSA-N 0.000 description 3
- GQKSJYINYYWPMR-NGZCFLSTSA-N Ile-Gly-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N GQKSJYINYYWPMR-NGZCFLSTSA-N 0.000 description 3
- RIVKTKFVWXRNSJ-GRLWGSQLSA-N Ile-Ile-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N RIVKTKFVWXRNSJ-GRLWGSQLSA-N 0.000 description 3
- CIJLNXXMDUOFPH-HJWJTTGWSA-N Ile-Pro-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 CIJLNXXMDUOFPH-HJWJTTGWSA-N 0.000 description 3
- MGUTVMBNOMJLKC-VKOGCVSHSA-N Ile-Trp-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](C(C)C)C(=O)O)N MGUTVMBNOMJLKC-VKOGCVSHSA-N 0.000 description 3
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 3
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 3
- PBCHMHROGNUXMK-DLOVCJGASA-N Leu-Ala-His Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 PBCHMHROGNUXMK-DLOVCJGASA-N 0.000 description 3
- STAVRDQLZOTNKJ-RHYQMDGZSA-N Leu-Arg-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O STAVRDQLZOTNKJ-RHYQMDGZSA-N 0.000 description 3
- HVJVUYQWFYMGJS-GVXVVHGQSA-N Leu-Glu-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O HVJVUYQWFYMGJS-GVXVVHGQSA-N 0.000 description 3
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 3
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 3
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 3
- JIHDFWWRYHSAQB-GUBZILKMSA-N Leu-Ser-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JIHDFWWRYHSAQB-GUBZILKMSA-N 0.000 description 3
- WFCKERTZVCQXKH-KBPBESRZSA-N Leu-Tyr-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(O)=O WFCKERTZVCQXKH-KBPBESRZSA-N 0.000 description 3
- FMFNIDICDKEMOE-XUXIUFHCSA-N Leu-Val-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FMFNIDICDKEMOE-XUXIUFHCSA-N 0.000 description 3
- 108010022337 Leucine Enkephalin Proteins 0.000 description 3
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 3
- IZJGPPIGYTVXLB-FQUUOJAGSA-N Lys-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IZJGPPIGYTVXLB-FQUUOJAGSA-N 0.000 description 3
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 3
- LMGNWHDWJDIOPK-DKIMLUQUSA-N Lys-Phe-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LMGNWHDWJDIOPK-DKIMLUQUSA-N 0.000 description 3
- AZOFEHCPMBRNFD-BZSNNMDCSA-N Lys-Phe-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=CC=C1 AZOFEHCPMBRNFD-BZSNNMDCSA-N 0.000 description 3
- LUAJJLPHUXPQLH-KKUMJFAQSA-N Lys-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCCN)N LUAJJLPHUXPQLH-KKUMJFAQSA-N 0.000 description 3
- JOSAKOKSPXROGQ-BJDJZHNGSA-N Lys-Ser-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JOSAKOKSPXROGQ-BJDJZHNGSA-N 0.000 description 3
- MIMXMVDLMDMOJD-BZSNNMDCSA-N Lys-Tyr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O MIMXMVDLMDMOJD-BZSNNMDCSA-N 0.000 description 3
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 3
- 102000018897 Membrane Fusion Proteins Human genes 0.000 description 3
- 108010027796 Membrane Fusion Proteins Proteins 0.000 description 3
- 102000018697 Membrane Proteins Human genes 0.000 description 3
- 108010052285 Membrane Proteins Proteins 0.000 description 3
- SODXFJOPSCXOHE-IHRRRGAJSA-N Met-Leu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O SODXFJOPSCXOHE-IHRRRGAJSA-N 0.000 description 3
- LXCSZPUQKMTXNW-BQBZGAKWSA-N Met-Ser-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O LXCSZPUQKMTXNW-BQBZGAKWSA-N 0.000 description 3
- 102400000988 Met-enkephalin Human genes 0.000 description 3
- 241000588652 Neisseria gonorrhoeae Species 0.000 description 3
- 108090000526 Papain Proteins 0.000 description 3
- UEADQPLTYBWWTG-AVGNSLFASA-N Phe-Glu-Cys Chemical compound SC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UEADQPLTYBWWTG-AVGNSLFASA-N 0.000 description 3
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 3
- WLYPRKLMRIYGPP-JYJNAYRXSA-N Phe-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 WLYPRKLMRIYGPP-JYJNAYRXSA-N 0.000 description 3
- BPIMVBKDLSBKIJ-FCLVOEFKSA-N Phe-Thr-Phe Chemical compound C([C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 BPIMVBKDLSBKIJ-FCLVOEFKSA-N 0.000 description 3
- SBVPYBFMIGDIDX-SRVKXCTJSA-N Pro-Pro-Pro Chemical compound OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H]2NCCC2)CCC1 SBVPYBFMIGDIDX-SRVKXCTJSA-N 0.000 description 3
- 102000014128 RANK Ligand Human genes 0.000 description 3
- 108010025832 RANK Ligand Proteins 0.000 description 3
- 241000710961 Semliki Forest virus Species 0.000 description 3
- LVVBAKCGXXUHFO-ZLUOBGJFSA-N Ser-Ala-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O LVVBAKCGXXUHFO-ZLUOBGJFSA-N 0.000 description 3
- ZIFYDQAFEMIZII-GUBZILKMSA-N Ser-Leu-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZIFYDQAFEMIZII-GUBZILKMSA-N 0.000 description 3
- BUYHXYIUQUBEQP-AVGNSLFASA-N Ser-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N BUYHXYIUQUBEQP-AVGNSLFASA-N 0.000 description 3
- XKFJENWJGHMDLI-QWRGUYRKSA-N Ser-Phe-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O XKFJENWJGHMDLI-QWRGUYRKSA-N 0.000 description 3
- PJIQEIFXZPCWOJ-FXQIFTODSA-N Ser-Pro-Asp Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O PJIQEIFXZPCWOJ-FXQIFTODSA-N 0.000 description 3
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 3
- OSFZCEQJLWCIBG-BZSNNMDCSA-N Ser-Tyr-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OSFZCEQJLWCIBG-BZSNNMDCSA-N 0.000 description 3
- 108010057722 Synaptosomal-Associated Protein 25 Proteins 0.000 description 3
- DWYAUVCQDTZIJI-VZFHVOOUSA-N Thr-Ala-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O DWYAUVCQDTZIJI-VZFHVOOUSA-N 0.000 description 3
- JMZKMSTYXHFYAK-VEVYYDQMSA-N Thr-Arg-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O JMZKMSTYXHFYAK-VEVYYDQMSA-N 0.000 description 3
- SWIKDOUVROTZCW-GCJQMDKQSA-N Thr-Asn-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O SWIKDOUVROTZCW-GCJQMDKQSA-N 0.000 description 3
- MFEBUIFJVPNZLO-OLHMAJIHSA-N Thr-Asp-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O MFEBUIFJVPNZLO-OLHMAJIHSA-N 0.000 description 3
- JXKMXEBNZCKSDY-JIOCBJNQSA-N Thr-Asp-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N)O JXKMXEBNZCKSDY-JIOCBJNQSA-N 0.000 description 3
- RCEHMXVEMNXRIW-IRIUXVKKSA-N Thr-Gln-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N)O RCEHMXVEMNXRIW-IRIUXVKKSA-N 0.000 description 3
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 3
- SGAOHNPSEPVAFP-ZDLURKLDSA-N Thr-Ser-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SGAOHNPSEPVAFP-ZDLURKLDSA-N 0.000 description 3
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 3
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 3
- 108090000190 Thrombin Proteins 0.000 description 3
- 241000723792 Tobacco etch virus Species 0.000 description 3
- IIJWXEUNETVJPV-IHRRRGAJSA-N Tyr-Arg-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N)O IIJWXEUNETVJPV-IHRRRGAJSA-N 0.000 description 3
- PRONOHBTMLNXCZ-BZSNNMDCSA-N Tyr-Leu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PRONOHBTMLNXCZ-BZSNNMDCSA-N 0.000 description 3
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 3
- HSBZWINKRYZCSQ-KKUMJFAQSA-N Tyr-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O HSBZWINKRYZCSQ-KKUMJFAQSA-N 0.000 description 3
- LUMQYLVYUIRHHU-YJRXYDGGSA-N Tyr-Ser-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUMQYLVYUIRHHU-YJRXYDGGSA-N 0.000 description 3
- GZWPQZDVTBZVEP-BZSNNMDCSA-N Tyr-Tyr-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O GZWPQZDVTBZVEP-BZSNNMDCSA-N 0.000 description 3
- JQOMHZMWQHXALX-FHWLQOOXSA-N Tyr-Tyr-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JQOMHZMWQHXALX-FHWLQOOXSA-N 0.000 description 3
- COYSIHFOCOMGCF-WPRPVWTQSA-N Val-Arg-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-WPRPVWTQSA-N 0.000 description 3
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 3
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 3
- OVLIFGQSBSNGHY-KKHAAJSZSA-N Val-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N)O OVLIFGQSBSNGHY-KKHAAJSZSA-N 0.000 description 3
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 3
- MHHAWNPHDLCPLF-ULQDDVLXSA-N Val-Phe-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CC=CC=C1 MHHAWNPHDLCPLF-ULQDDVLXSA-N 0.000 description 3
- 235000004279 alanine Nutrition 0.000 description 3
- 108010070783 alanyltyrosine Proteins 0.000 description 3
- 210000004198 anterior pituitary gland Anatomy 0.000 description 3
- 108010008355 arginyl-glutamine Proteins 0.000 description 3
- 108010038850 arginyl-isoleucyl-tyrosine Proteins 0.000 description 3
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 3
- 206010003246 arthritis Diseases 0.000 description 3
- 108010077245 asparaginyl-proline Proteins 0.000 description 3
- DNDCVAGJPBKION-DOPDSADYSA-N bombesin Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(N)=O)NC(=O)CNC(=O)[C@@H](NC(=O)[C@H](C)NC(=O)[C@H](CC=1NC2=CC=CC=C2C=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H]1NC(=O)CC1)C(C)C)C1=CN=CN1 DNDCVAGJPBKION-DOPDSADYSA-N 0.000 description 3
- QXZGBUJJYSLZLT-FDISYFBBSA-N bradykinin Chemical compound NC(=N)NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(=O)NCC(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CO)C(=O)N2[C@@H](CCC2)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)CCC1 QXZGBUJJYSLZLT-FDISYFBBSA-N 0.000 description 3
- 201000011510 cancer Diseases 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- 102000006834 complement receptors Human genes 0.000 description 3
- 108010047295 complement receptors Proteins 0.000 description 3
- -1 cysteine amino acid Chemical class 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 230000001066 destructive effect Effects 0.000 description 3
- 108010009297 diglycyl-histidine Proteins 0.000 description 3
- PMMYEEVYMWASQN-UHFFFAOYSA-N dl-hydroxyproline Natural products OC1C[NH2+]C(C([O-])=O)C1 PMMYEEVYMWASQN-UHFFFAOYSA-N 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 229940028334 follicle stimulating hormone Drugs 0.000 description 3
- 230000002496 gastric effect Effects 0.000 description 3
- 108010079547 glutamylmethionine Proteins 0.000 description 3
- 108010045126 glycyl-tyrosyl-glycine Proteins 0.000 description 3
- 125000004051 hexyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 3
- 229930186900 holotoxin Natural products 0.000 description 3
- 230000002401 inhibitory effect Effects 0.000 description 3
- 102000006495 integrins Human genes 0.000 description 3
- 108010044426 integrins Proteins 0.000 description 3
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 3
- 210000004072 lung Anatomy 0.000 description 3
- 108010057952 lysyl-phenylalanyl-lysine Proteins 0.000 description 3
- 230000034217 membrane fusion Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 210000002569 neuron Anatomy 0.000 description 3
- 108020004707 nucleic acids Proteins 0.000 description 3
- 102000039446 nucleic acids Human genes 0.000 description 3
- 229940055729 papain Drugs 0.000 description 3
- 235000019834 papain Nutrition 0.000 description 3
- 238000002823 phage display Methods 0.000 description 3
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 3
- 239000011148 porous material Substances 0.000 description 3
- 230000003334 potential effect Effects 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 230000001737 promoting effect Effects 0.000 description 3
- 230000002797 proteolythic effect Effects 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 210000002966 serum Anatomy 0.000 description 3
- 238000002741 site-directed mutagenesis Methods 0.000 description 3
- 230000008961 swelling Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 229940124597 therapeutic agent Drugs 0.000 description 3
- 229960004072 thrombin Drugs 0.000 description 3
- 230000000699 topical effect Effects 0.000 description 3
- 238000013519 translation Methods 0.000 description 3
- 238000002054 transplantation Methods 0.000 description 3
- 238000001262 western blot Methods 0.000 description 3
- PDRJLZDUOULRHE-ZETCQYMHSA-N (2s)-2-amino-3-pyridin-2-ylpropanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=N1 PDRJLZDUOULRHE-ZETCQYMHSA-N 0.000 description 2
- XJODGRWDFZVTKW-LURJTMIESA-N (2s)-4-methyl-2-(methylamino)pentanoic acid Chemical compound CN[C@H](C(O)=O)CC(C)C XJODGRWDFZVTKW-LURJTMIESA-N 0.000 description 2
- PYFASGMPUKCEMS-ZETCQYMHSA-N (2s)-6-[carbamimidoyl-(diaminomethylideneamino)amino]-2-(dimethylamino)hexanoic acid Chemical compound CN(C)[C@H](C(O)=O)CCCCN(C(N)=N)NC(N)=N PYFASGMPUKCEMS-ZETCQYMHSA-N 0.000 description 2
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 2
- WKOBSJOZRJJVRZ-FXQIFTODSA-N Ala-Glu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WKOBSJOZRJJVRZ-FXQIFTODSA-N 0.000 description 2
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 2
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 2
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 2
- 208000035285 Allergic Seasonal Rhinitis Diseases 0.000 description 2
- GXCSUJQOECMKPV-CIUDSAMLSA-N Arg-Ala-Gln Chemical compound C[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GXCSUJQOECMKPV-CIUDSAMLSA-N 0.000 description 2
- CPSHGRGUPZBMOK-CIUDSAMLSA-N Arg-Asn-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CPSHGRGUPZBMOK-CIUDSAMLSA-N 0.000 description 2
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 2
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 2
- HGKHPCFTRQDHCU-IUCAKERBSA-N Arg-Pro-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O HGKHPCFTRQDHCU-IUCAKERBSA-N 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- GXMSVVBIAMWMKO-BQBZGAKWSA-N Asn-Arg-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CCCN=C(N)N GXMSVVBIAMWMKO-BQBZGAKWSA-N 0.000 description 2
- DQTIWTULBGLJBL-DCAQKATOSA-N Asn-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)N)N DQTIWTULBGLJBL-DCAQKATOSA-N 0.000 description 2
- VKCOHFFSTKCXEQ-OLHMAJIHSA-N Asn-Asn-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VKCOHFFSTKCXEQ-OLHMAJIHSA-N 0.000 description 2
- JRVABKHPWDRUJF-UBHSHLNASA-N Asn-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N JRVABKHPWDRUJF-UBHSHLNASA-N 0.000 description 2
- UGXVKHRDGLYFKR-CIUDSAMLSA-N Asn-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(N)=O UGXVKHRDGLYFKR-CIUDSAMLSA-N 0.000 description 2
- ULRPXVNMIIYDDJ-ACZMJKKPSA-N Asn-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N ULRPXVNMIIYDDJ-ACZMJKKPSA-N 0.000 description 2
- SEKBHZJLARBNPB-GHCJXIJMSA-N Asn-Ile-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O SEKBHZJLARBNPB-GHCJXIJMSA-N 0.000 description 2
- NLRJGXZWTKXRHP-DCAQKATOSA-N Asn-Leu-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLRJGXZWTKXRHP-DCAQKATOSA-N 0.000 description 2
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 2
- KNENKKKUYGEZIO-FXQIFTODSA-N Asn-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N KNENKKKUYGEZIO-FXQIFTODSA-N 0.000 description 2
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 2
- NCXTYSVDWLAQGZ-ZKWXMUAHSA-N Asn-Ser-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O NCXTYSVDWLAQGZ-ZKWXMUAHSA-N 0.000 description 2
- QYRMBFWDSFGSFC-OLHMAJIHSA-N Asn-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QYRMBFWDSFGSFC-OLHMAJIHSA-N 0.000 description 2
- IXIWEFWRKIUMQX-DCAQKATOSA-N Asp-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC(O)=O IXIWEFWRKIUMQX-DCAQKATOSA-N 0.000 description 2
- ATYWBXGNXZYZGI-ACZMJKKPSA-N Asp-Asn-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ATYWBXGNXZYZGI-ACZMJKKPSA-N 0.000 description 2
- ZELQAFZSJOBEQS-ACZMJKKPSA-N Asp-Asn-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZELQAFZSJOBEQS-ACZMJKKPSA-N 0.000 description 2
- HOQGTAIGQSDCHR-SRVKXCTJSA-N Asp-Asn-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HOQGTAIGQSDCHR-SRVKXCTJSA-N 0.000 description 2
- SVFOIXMRMLROHO-SRVKXCTJSA-N Asp-Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SVFOIXMRMLROHO-SRVKXCTJSA-N 0.000 description 2
- YDJVIBMKAMQPPP-LAEOZQHASA-N Asp-Glu-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O YDJVIBMKAMQPPP-LAEOZQHASA-N 0.000 description 2
- SPKCGKRUYKMDHP-GUDRVLHUSA-N Asp-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N SPKCGKRUYKMDHP-GUDRVLHUSA-N 0.000 description 2
- HKEZZWQWXWGASX-KKUMJFAQSA-N Asp-Leu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HKEZZWQWXWGASX-KKUMJFAQSA-N 0.000 description 2
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 2
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 2
- MYLZFUMPZCPJCJ-NHCYSSNCSA-N Asp-Lys-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O MYLZFUMPZCPJCJ-NHCYSSNCSA-N 0.000 description 2
- WOPJVEMFXYHZEE-SRVKXCTJSA-N Asp-Phe-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WOPJVEMFXYHZEE-SRVKXCTJSA-N 0.000 description 2
- BYLPQJAWXJWUCJ-YDHLFZDLSA-N Asp-Tyr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O BYLPQJAWXJWUCJ-YDHLFZDLSA-N 0.000 description 2
- 108010059033 BIM 23027 Proteins 0.000 description 2
- 108010077805 Bacterial Proteins Proteins 0.000 description 2
- 231100000699 Bacterial toxin Toxicity 0.000 description 2
- 206010005052 Bladder irritation Diseases 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 101800001415 Bri23 peptide Proteins 0.000 description 2
- 102400000107 C-terminal peptide Human genes 0.000 description 2
- 101800000655 C-terminal peptide Proteins 0.000 description 2
- 108010001857 Cell Surface Receptors Proteins 0.000 description 2
- 241000193155 Clostridium botulinum Species 0.000 description 2
- 239000000055 Corticotropin-Releasing Hormone Substances 0.000 description 2
- DZLQXIFVQFTFJY-BYPYZUCNSA-N Cys-Gly-Gly Chemical compound SC[C@H](N)C(=O)NCC(=O)NCC(O)=O DZLQXIFVQFTFJY-BYPYZUCNSA-N 0.000 description 2
- NDNZRWUDUMTITL-FXQIFTODSA-N Cys-Ser-Val Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NDNZRWUDUMTITL-FXQIFTODSA-N 0.000 description 2
- 102100031817 Delta-type opioid receptor Human genes 0.000 description 2
- 208000006926 Discoid Lupus Erythematosus Diseases 0.000 description 2
- 102100031111 Disintegrin and metalloproteinase domain-containing protein 17 Human genes 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 108010059378 Endopeptidases Proteins 0.000 description 2
- 102000005593 Endopeptidases Human genes 0.000 description 2
- 102100037362 Fibronectin Human genes 0.000 description 2
- 108010067306 Fibronectins Proteins 0.000 description 2
- 102000003688 G-Protein-Coupled Receptors Human genes 0.000 description 2
- 108090000045 G-Protein-Coupled Receptors Proteins 0.000 description 2
- 102400001370 Galanin Human genes 0.000 description 2
- 101800002068 Galanin Proteins 0.000 description 2
- RZSLYUUFFVHFRQ-FXQIFTODSA-N Gln-Ala-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O RZSLYUUFFVHFRQ-FXQIFTODSA-N 0.000 description 2
- GMGKDVVBSVVKCT-NUMRIWBASA-N Gln-Asn-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GMGKDVVBSVVKCT-NUMRIWBASA-N 0.000 description 2
- CRRFJBGUGNNOCS-PEFMBERDSA-N Gln-Asp-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CRRFJBGUGNNOCS-PEFMBERDSA-N 0.000 description 2
- GHAXJVNBAKGWEJ-AVGNSLFASA-N Gln-Ser-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O GHAXJVNBAKGWEJ-AVGNSLFASA-N 0.000 description 2
- 206010018364 Glomerulonephritis Diseases 0.000 description 2
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 2
- PXHABOCPJVTGEK-BQBZGAKWSA-N Glu-Gln-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O PXHABOCPJVTGEK-BQBZGAKWSA-N 0.000 description 2
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 2
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 2
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 2
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 2
- OFIHURVSQXAZIR-SZMVWBNQSA-N Glu-Lys-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OFIHURVSQXAZIR-SZMVWBNQSA-N 0.000 description 2
- JDUKCSSHWNIQQZ-IHRRRGAJSA-N Glu-Phe-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O JDUKCSSHWNIQQZ-IHRRRGAJSA-N 0.000 description 2
- JZJGEKDPWVJOLD-QEWYBTABSA-N Glu-Phe-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JZJGEKDPWVJOLD-QEWYBTABSA-N 0.000 description 2
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- XUDLUKYPXQDCRX-BQBZGAKWSA-N Gly-Arg-Asn Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O XUDLUKYPXQDCRX-BQBZGAKWSA-N 0.000 description 2
- FMVLWTYYODVFRG-BQBZGAKWSA-N Gly-Asn-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN FMVLWTYYODVFRG-BQBZGAKWSA-N 0.000 description 2
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 2
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 2
- YOBGUCWZPXJHTN-BQBZGAKWSA-N Gly-Ser-Arg Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YOBGUCWZPXJHTN-BQBZGAKWSA-N 0.000 description 2
- MREVELMMFOLESM-HOCLYGCPSA-N Gly-Trp-Val Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C(C)C)C(O)=O MREVELMMFOLESM-HOCLYGCPSA-N 0.000 description 2
- NQKRILCJYCASDV-QWRGUYRKSA-N His-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CN=CN1 NQKRILCJYCASDV-QWRGUYRKSA-N 0.000 description 2
- YBDOQKVAGTWZMI-XIRDDKMYSA-N His-Trp-Ser Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC3=CN=CN3)N YBDOQKVAGTWZMI-XIRDDKMYSA-N 0.000 description 2
- 101001098529 Homo sapiens Proteinase-activated receptor 1 Proteins 0.000 description 2
- 101000713169 Homo sapiens Solute carrier family 52, riboflavin transporter, member 2 Proteins 0.000 description 2
- PMMYEEVYMWASQN-DMTCNVIQSA-N Hydroxyproline Chemical compound O[C@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-DMTCNVIQSA-N 0.000 description 2
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 2
- VSZALHITQINTGC-GHCJXIJMSA-N Ile-Ala-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VSZALHITQINTGC-GHCJXIJMSA-N 0.000 description 2
- ZZHGKECPZXPXJF-PCBIJLKTSA-N Ile-Asn-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ZZHGKECPZXPXJF-PCBIJLKTSA-N 0.000 description 2
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 2
- LJKDGRWXYUTRSH-YVNDNENWSA-N Ile-Gln-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LJKDGRWXYUTRSH-YVNDNENWSA-N 0.000 description 2
- WZDCVAWMBUNDDY-KBIXCLLPSA-N Ile-Glu-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](C)C(=O)O)N WZDCVAWMBUNDDY-KBIXCLLPSA-N 0.000 description 2
- IGJWJGIHUFQANP-LAEOZQHASA-N Ile-Gly-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N IGJWJGIHUFQANP-LAEOZQHASA-N 0.000 description 2
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 2
- UDBPXJNOEWDBDF-XUXIUFHCSA-N Ile-Lys-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)O)N UDBPXJNOEWDBDF-XUXIUFHCSA-N 0.000 description 2
- VEPIBPGLTLPBDW-URLPEUOOSA-N Ile-Phe-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N VEPIBPGLTLPBDW-URLPEUOOSA-N 0.000 description 2
- AGGIYSLVUKVOPT-HTFCKZLJSA-N Ile-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N AGGIYSLVUKVOPT-HTFCKZLJSA-N 0.000 description 2
- OMDWJWGZGMCQND-CFMVVWHZSA-N Ile-Tyr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OMDWJWGZGMCQND-CFMVVWHZSA-N 0.000 description 2
- RQZFWBLDTBDEOF-RNJOBUHISA-N Ile-Val-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N RQZFWBLDTBDEOF-RNJOBUHISA-N 0.000 description 2
- 206010023232 Joint swelling Diseases 0.000 description 2
- 206010059176 Juvenile idiopathic arthritis Diseases 0.000 description 2
- SNDPXSYFESPGGJ-BYPYZUCNSA-N L-2-aminopentanoic acid Chemical compound CCC[C@H](N)C(O)=O SNDPXSYFESPGGJ-BYPYZUCNSA-N 0.000 description 2
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 2
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 2
- LRQKBLKVPFOOQJ-YFKPBYRVSA-N L-norleucine Chemical compound CCCC[C@H]([NH3+])C([O-])=O LRQKBLKVPFOOQJ-YFKPBYRVSA-N 0.000 description 2
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 2
- 108010021290 LHRH Receptors Proteins 0.000 description 2
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 2
- OXKYZSRZKBTVEY-ZPFDUUQYSA-N Leu-Asn-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OXKYZSRZKBTVEY-ZPFDUUQYSA-N 0.000 description 2
- DLCOFDAHNMMQPP-SRVKXCTJSA-N Leu-Asp-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DLCOFDAHNMMQPP-SRVKXCTJSA-N 0.000 description 2
- WCTCIIAGNMFYAO-DCAQKATOSA-N Leu-Cys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O WCTCIIAGNMFYAO-DCAQKATOSA-N 0.000 description 2
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 2
- QVFGXCVIXXBFHO-AVGNSLFASA-N Leu-Glu-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O QVFGXCVIXXBFHO-AVGNSLFASA-N 0.000 description 2
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 2
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 2
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 2
- LXKNSJLSGPNHSK-KKUMJFAQSA-N Leu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N LXKNSJLSGPNHSK-KKUMJFAQSA-N 0.000 description 2
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 2
- BTEMNFBEAAOGBR-BZSNNMDCSA-N Leu-Tyr-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BTEMNFBEAAOGBR-BZSNNMDCSA-N 0.000 description 2
- 102400000243 Leu-enkephalin Human genes 0.000 description 2
- 102000019298 Lipocalin Human genes 0.000 description 2
- 108050006654 Lipocalin Proteins 0.000 description 2
- IRNSXVOWSXSULE-DCAQKATOSA-N Lys-Ala-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN IRNSXVOWSXSULE-DCAQKATOSA-N 0.000 description 2
- ALSRJRIWBNENFY-DCAQKATOSA-N Lys-Arg-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O ALSRJRIWBNENFY-DCAQKATOSA-N 0.000 description 2
- ABHIXYDMILIUKV-CIUDSAMLSA-N Lys-Asn-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ABHIXYDMILIUKV-CIUDSAMLSA-N 0.000 description 2
- HKCCVDWHHTVVPN-CIUDSAMLSA-N Lys-Asp-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O HKCCVDWHHTVVPN-CIUDSAMLSA-N 0.000 description 2
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 2
- LCMWVZLBCUVDAZ-IUCAKERBSA-N Lys-Gly-Glu Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CCC([O-])=O LCMWVZLBCUVDAZ-IUCAKERBSA-N 0.000 description 2
- KYNNSEJZFVCDIV-ZPFDUUQYSA-N Lys-Ile-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O KYNNSEJZFVCDIV-ZPFDUUQYSA-N 0.000 description 2
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 2
- KJIXWRWPOCKYLD-IHRRRGAJSA-N Lys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N KJIXWRWPOCKYLD-IHRRRGAJSA-N 0.000 description 2
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 2
- QQPSCXKFDSORFT-IHRRRGAJSA-N Lys-Lys-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN QQPSCXKFDSORFT-IHRRRGAJSA-N 0.000 description 2
- VSTNAUBHKQPVJX-IHRRRGAJSA-N Lys-Met-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O VSTNAUBHKQPVJX-IHRRRGAJSA-N 0.000 description 2
- IMDJSVBFQKDDEQ-MGHWNKPDSA-N Lys-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCCCN)N IMDJSVBFQKDDEQ-MGHWNKPDSA-N 0.000 description 2
- PPNCMJARTHYNEC-MEYUZBJRSA-N Lys-Tyr-Thr Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)CC1=CC=C(O)C=C1 PPNCMJARTHYNEC-MEYUZBJRSA-N 0.000 description 2
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 2
- CAODKDAPYGUMLK-FXQIFTODSA-N Met-Asn-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CAODKDAPYGUMLK-FXQIFTODSA-N 0.000 description 2
- DJBCKVNHEIJLQA-GMOBBJLQSA-N Met-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCSC)N DJBCKVNHEIJLQA-GMOBBJLQSA-N 0.000 description 2
- HZLSUXCMSIBCRV-RVMXOQNASA-N Met-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCSC)N HZLSUXCMSIBCRV-RVMXOQNASA-N 0.000 description 2
- OIFHHODAXVWKJN-ULQDDVLXSA-N Met-Phe-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=CC=C1 OIFHHODAXVWKJN-ULQDDVLXSA-N 0.000 description 2
- MPCKIRSXNKACRF-GUBZILKMSA-N Met-Pro-Asn Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O MPCKIRSXNKACRF-GUBZILKMSA-N 0.000 description 2
- 101100004542 Mus musculus Bdkrb1 gene Proteins 0.000 description 2
- 208000009525 Myocarditis Diseases 0.000 description 2
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 2
- SKGLAZSLOGYCCA-PEFXOJROSA-N Neuromedin N (1-4) Chemical compound CC[C@@H](C)[C@@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(=O)N[C@H]([C@H](C)CC)C(O)=O)CC1=CC=C(O)C=C1 SKGLAZSLOGYCCA-PEFXOJROSA-N 0.000 description 2
- 108020004485 Nonsense Codon Proteins 0.000 description 2
- 208000001132 Osteoporosis Diseases 0.000 description 2
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 2
- 208000031845 Pernicious anaemia Diseases 0.000 description 2
- BBDSZDHUCPSYAC-QEJZJMRPSA-N Phe-Ala-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BBDSZDHUCPSYAC-QEJZJMRPSA-N 0.000 description 2
- HHOOEUSPFGPZFP-QWRGUYRKSA-N Phe-Asn-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HHOOEUSPFGPZFP-QWRGUYRKSA-N 0.000 description 2
- AWAYOWOUGVZXOB-BZSNNMDCSA-N Phe-Asn-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 AWAYOWOUGVZXOB-BZSNNMDCSA-N 0.000 description 2
- KAGCQPSEVAETCA-JYJNAYRXSA-N Phe-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N KAGCQPSEVAETCA-JYJNAYRXSA-N 0.000 description 2
- OYQBFWWQSVIHBN-FHWLQOOXSA-N Phe-Glu-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O OYQBFWWQSVIHBN-FHWLQOOXSA-N 0.000 description 2
- DZVXMMSUWWUIQE-ACRUOGEOSA-N Phe-His-Tyr Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N DZVXMMSUWWUIQE-ACRUOGEOSA-N 0.000 description 2
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 2
- MCIXMYKSPQUMJG-SRVKXCTJSA-N Phe-Ser-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MCIXMYKSPQUMJG-SRVKXCTJSA-N 0.000 description 2
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 2
- PTDAGKJHZBGDKD-OEAJRASXSA-N Phe-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O PTDAGKJHZBGDKD-OEAJRASXSA-N 0.000 description 2
- 208000010067 Pituitary ACTH Hypersecretion Diseases 0.000 description 2
- 208000020627 Pituitary-dependent Cushing syndrome Diseases 0.000 description 2
- XROLYVMNVIKVEM-BQBZGAKWSA-N Pro-Asn-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O XROLYVMNVIKVEM-BQBZGAKWSA-N 0.000 description 2
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 2
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 2
- GOMUXSCOIWIJFP-GUBZILKMSA-N Pro-Ser-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GOMUXSCOIWIJFP-GUBZILKMSA-N 0.000 description 2
- 102100027467 Pro-opiomelanocortin Human genes 0.000 description 2
- RJKFOVLPORLFTN-LEKSSAKUSA-N Progesterone Chemical compound C1CC2=CC(=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H](C(=O)C)[C@@]1(C)CC2 RJKFOVLPORLFTN-LEKSSAKUSA-N 0.000 description 2
- 102100037136 Proteinase-activated receptor 1 Human genes 0.000 description 2
- 241000589516 Pseudomonas Species 0.000 description 2
- 108010005730 R-SNARE Proteins Proteins 0.000 description 2
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 2
- KYKKKSWGEPFUMR-NAKRPEOUSA-N Ser-Arg-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KYKKKSWGEPFUMR-NAKRPEOUSA-N 0.000 description 2
- QPFJSHSJFIYDJZ-GHCJXIJMSA-N Ser-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO QPFJSHSJFIYDJZ-GHCJXIJMSA-N 0.000 description 2
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 2
- HJEBZBMOTCQYDN-ACZMJKKPSA-N Ser-Glu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJEBZBMOTCQYDN-ACZMJKKPSA-N 0.000 description 2
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 2
- DJACUBDEDBZKLQ-KBIXCLLPSA-N Ser-Ile-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O DJACUBDEDBZKLQ-KBIXCLLPSA-N 0.000 description 2
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 2
- PLQWGQUNUPMNOD-KKUMJFAQSA-N Ser-Tyr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PLQWGQUNUPMNOD-KKUMJFAQSA-N 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 108010022999 Serine Proteases Proteins 0.000 description 2
- 102000012479 Serine Proteases Human genes 0.000 description 2
- 102100038803 Somatotropin Human genes 0.000 description 2
- 241000194017 Streptococcus Species 0.000 description 2
- 102000002215 Synaptobrevin Human genes 0.000 description 2
- 102100030545 Synaptosomal-associated protein 23 Human genes 0.000 description 2
- 101710189545 Synaptosomal-associated protein 23 Proteins 0.000 description 2
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 2
- GNHRVXYZKWSJTF-HJGDQZAQSA-N Thr-Asp-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N)O GNHRVXYZKWSJTF-HJGDQZAQSA-N 0.000 description 2
- LYGKYFKSZTUXGZ-ZDLURKLDSA-N Thr-Cys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)NCC(O)=O LYGKYFKSZTUXGZ-ZDLURKLDSA-N 0.000 description 2
- GARULAKWZGFIKC-RWRJDSDZSA-N Thr-Gln-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GARULAKWZGFIKC-RWRJDSDZSA-N 0.000 description 2
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 2
- GMXIJHCBTZDAPD-QPHKQPEJSA-N Thr-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N GMXIJHCBTZDAPD-QPHKQPEJSA-N 0.000 description 2
- FLPZMPOZGYPBEN-PPCPHDFISA-N Thr-Leu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLPZMPOZGYPBEN-PPCPHDFISA-N 0.000 description 2
- KRDSCBLRHORMRK-JXUBOQSCSA-N Thr-Lys-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O KRDSCBLRHORMRK-JXUBOQSCSA-N 0.000 description 2
- XSEPSRUDSPHMPX-KATARQTJSA-N Thr-Lys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O XSEPSRUDSPHMPX-KATARQTJSA-N 0.000 description 2
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 2
- JAWUQFCGNVEDRN-MEYUZBJRSA-N Thr-Tyr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N)O JAWUQFCGNVEDRN-MEYUZBJRSA-N 0.000 description 2
- QGVBFDIREUUSHX-IFFSRLJSSA-N Thr-Val-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O QGVBFDIREUUSHX-IFFSRLJSSA-N 0.000 description 2
- 241000239272 Tityus serrulatus Species 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- CXPJPTFWKXNDKV-NUTKFTJISA-N Trp-Leu-Ala Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O)=CNC2=C1 CXPJPTFWKXNDKV-NUTKFTJISA-N 0.000 description 2
- 206010067584 Type 1 diabetes mellitus Diseases 0.000 description 2
- 108010057266 Type A Botulinum Toxins Proteins 0.000 description 2
- JWHOIHCOHMZSAR-QWRGUYRKSA-N Tyr-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JWHOIHCOHMZSAR-QWRGUYRKSA-N 0.000 description 2
- YLRLHDFMMWDYTK-KKUMJFAQSA-N Tyr-Cys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 YLRLHDFMMWDYTK-KKUMJFAQSA-N 0.000 description 2
- FJKXUIJOMUWCDD-FHWLQOOXSA-N Tyr-Gln-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O)N)O FJKXUIJOMUWCDD-FHWLQOOXSA-N 0.000 description 2
- CTDPLKMBVALCGN-JSGCOSHPSA-N Tyr-Gly-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O CTDPLKMBVALCGN-JSGCOSHPSA-N 0.000 description 2
- DMWNPLOERDAHSY-MEYUZBJRSA-N Tyr-Leu-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DMWNPLOERDAHSY-MEYUZBJRSA-N 0.000 description 2
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 2
- LVFZXRQQQDTBQH-IRIUXVKKSA-N Tyr-Thr-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LVFZXRQQQDTBQH-IRIUXVKKSA-N 0.000 description 2
- NZBSVMQZQMEUHI-WZLNRYEVSA-N Tyr-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NZBSVMQZQMEUHI-WZLNRYEVSA-N 0.000 description 2
- ISERLACIZUGCDX-ZKWXMUAHSA-N Val-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C(C)C)N ISERLACIZUGCDX-ZKWXMUAHSA-N 0.000 description 2
- CELJCNRXKZPTCX-XPUUQOCRSA-N Val-Gly-Ala Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O CELJCNRXKZPTCX-XPUUQOCRSA-N 0.000 description 2
- UMPVMAYCLYMYGA-ONGXEEELSA-N Val-Leu-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O UMPVMAYCLYMYGA-ONGXEEELSA-N 0.000 description 2
- HPANGHISDXDUQY-ULQDDVLXSA-N Val-Lys-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N HPANGHISDXDUQY-ULQDDVLXSA-N 0.000 description 2
- UJMCYJKPDFQLHX-XGEHTFHBSA-N Val-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N)O UJMCYJKPDFQLHX-XGEHTFHBSA-N 0.000 description 2
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 2
- PQSNETRGCRUOGP-KKHAAJSZSA-N Val-Thr-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O PQSNETRGCRUOGP-KKHAAJSZSA-N 0.000 description 2
- VTIAEOKFUJJBTC-YDHLFZDLSA-N Val-Tyr-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N VTIAEOKFUJJBTC-YDHLFZDLSA-N 0.000 description 2
- 206010047115 Vasculitis Diseases 0.000 description 2
- 108010067390 Viral Proteins Proteins 0.000 description 2
- 108010079650 abobotulinumtoxinA Proteins 0.000 description 2
- 239000013543 active substance Substances 0.000 description 2
- 210000001943 adrenal medulla Anatomy 0.000 description 2
- UCTWMZQNUQWSLP-UHFFFAOYSA-N adrenaline Chemical compound CNCC(O)C1=CC=C(O)C(O)=C1 UCTWMZQNUQWSLP-UHFFFAOYSA-N 0.000 description 2
- 239000000443 aerosol Substances 0.000 description 2
- QWCKQJZIFLGMSD-UHFFFAOYSA-N alpha-aminobutyric acid Chemical compound CCC(N)C(O)=O QWCKQJZIFLGMSD-UHFFFAOYSA-N 0.000 description 2
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 2
- 229960000723 ampicillin Drugs 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 208000006673 asthma Diseases 0.000 description 2
- 208000010668 atopic eczema Diseases 0.000 description 2
- 239000000688 bacterial toxin Substances 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 108091008324 binding proteins Proteins 0.000 description 2
- 229940089093 botox Drugs 0.000 description 2
- 231100001103 botulinum neurotoxin Toxicity 0.000 description 2
- 210000000170 cell membrane Anatomy 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000007248 cellular mechanism Effects 0.000 description 2
- 210000003169 central nervous system Anatomy 0.000 description 2
- 238000007385 chemical modification Methods 0.000 description 2
- 239000003638 chemical reducing agent Substances 0.000 description 2
- PMMYEEVYMWASQN-IMJSIDKUSA-N cis-4-Hydroxy-L-proline Chemical compound O[C@@H]1CN[C@H](C(O)=O)C1 PMMYEEVYMWASQN-IMJSIDKUSA-N 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 208000004921 cutaneous lupus erythematosus Diseases 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 229940098753 dysport Drugs 0.000 description 2
- 230000002526 effect on cardiovascular system Effects 0.000 description 2
- 239000003797 essential amino acid Substances 0.000 description 2
- 235000020776 essential amino acid Nutrition 0.000 description 2
- 238000011049 filling Methods 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- 230000000799 fusogenic effect Effects 0.000 description 2
- BTCSSZJGUNDROE-UHFFFAOYSA-N gamma-aminobutyric acid Chemical compound NCCCC(O)=O BTCSSZJGUNDROE-UHFFFAOYSA-N 0.000 description 2
- 210000001035 gastrointestinal tract Anatomy 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 2
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 2
- 108010027668 glycyl-alanyl-valine Proteins 0.000 description 2
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- 239000003102 growth factor Substances 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 230000006698 induction Effects 0.000 description 2
- 230000002757 inflammatory effect Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 2
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 2
- 201000002215 juvenile rheumatoid arthritis Diseases 0.000 description 2
- URLZCHNOLZSCCA-UHFFFAOYSA-N leu-enkephalin Chemical compound C=1C=C(O)C=CC=1CC(N)C(=O)NCC(=O)NCC(=O)NC(C(=O)NC(CC(C)C)C(O)=O)CC1=CC=CC=C1 URLZCHNOLZSCCA-UHFFFAOYSA-N 0.000 description 2
- 108010047926 leucyl-lysyl-tyrosine Proteins 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 210000002540 macrophage Anatomy 0.000 description 2
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 2
- SLZIZIJTGAYEKK-CIJSCKBQSA-N molport-023-220-247 Chemical compound C([C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1N=CNC=1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(N)=O)NC(=O)[C@H]1N(CCC1)C(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)CNC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)NC(=O)CN)[C@@H](C)O)C1=CNC=N1 SLZIZIJTGAYEKK-CIJSCKBQSA-N 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 210000000715 neuromuscular junction Anatomy 0.000 description 2
- 229940021182 non-steroidal anti-inflammatory drug Drugs 0.000 description 2
- 230000037434 nonsense mutation Effects 0.000 description 2
- 210000002997 osteoclast Anatomy 0.000 description 2
- 201000002528 pancreatic cancer Diseases 0.000 description 2
- 208000008443 pancreatic carcinoma Diseases 0.000 description 2
- 230000006320 pegylation Effects 0.000 description 2
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 2
- 230000003389 potentiating effect Effects 0.000 description 2
- 239000000843 powder Substances 0.000 description 2
- 239000000186 progesterone Substances 0.000 description 2
- 229960003387 progesterone Drugs 0.000 description 2
- 108010031719 prolyl-serine Proteins 0.000 description 2
- 210000002307 prostate Anatomy 0.000 description 2
- 238000000159 protein binding assay Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- FSYKKLYZXJSNPZ-UHFFFAOYSA-N sarcosine Chemical compound C[NH2+]CC([O-])=O FSYKKLYZXJSNPZ-UHFFFAOYSA-N 0.000 description 2
- 238000002864 sequence alignment Methods 0.000 description 2
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 2
- 108010071207 serylmethionine Proteins 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 239000000375 suspending agent Substances 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 201000000596 systemic lupus erythematosus Diseases 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 108010078580 tyrosylleucine Proteins 0.000 description 2
- 241000712461 unidentified influenza virus Species 0.000 description 2
- 230000007332 vesicle formation Effects 0.000 description 2
- OGNSCSPNOLGXSM-UHFFFAOYSA-N (+/-)-DABA Natural products NCCC(N)C(O)=O OGNSCSPNOLGXSM-UHFFFAOYSA-N 0.000 description 1
- QDZOEBFLNHCSSF-PFFBOGFISA-N (2S)-2-[[(2R)-2-[[(2S)-1-[(2S)-6-amino-2-[[(2S)-1-[(2R)-2-amino-5-carbamimidamidopentanoyl]pyrrolidine-2-carbonyl]amino]hexanoyl]pyrrolidine-2-carbonyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-N-[(2R)-1-[[(2S)-1-[[(2R)-1-[[(2S)-1-[[(2S)-1-amino-4-methyl-1-oxopentan-2-yl]amino]-4-methyl-1-oxopentan-2-yl]amino]-3-(1H-indol-3-yl)-1-oxopropan-2-yl]amino]-1-oxo-3-phenylpropan-2-yl]amino]-3-(1H-indol-3-yl)-1-oxopropan-2-yl]pentanediamide Chemical compound C([C@@H](C(=O)N[C@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(N)=O)NC(=O)[C@@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCCCN)NC(=O)[C@H]1N(CCC1)C(=O)[C@H](N)CCCNC(N)=N)C1=CC=CC=C1 QDZOEBFLNHCSSF-PFFBOGFISA-N 0.000 description 1
- RZENOPCSYJWNKU-VIFPVBQESA-N (2s)-2-(aminomethylamino)-3-phenylpropanoic acid Chemical group NCN[C@H](C(O)=O)CC1=CC=CC=C1 RZENOPCSYJWNKU-VIFPVBQESA-N 0.000 description 1
- WTKYBFQVZPCGAO-LURJTMIESA-N (2s)-2-(pyridin-3-ylamino)propanoic acid Chemical compound OC(=O)[C@H](C)NC1=CC=CN=C1 WTKYBFQVZPCGAO-LURJTMIESA-N 0.000 description 1
- SAAQPSNNIOGFSQ-LURJTMIESA-N (2s)-2-(pyridin-4-ylamino)propanoic acid Chemical compound OC(=O)[C@H](C)NC1=CC=NC=C1 SAAQPSNNIOGFSQ-LURJTMIESA-N 0.000 description 1
- SUQWGICKJIJKNO-IHRRRGAJSA-N (2s)-2-[[2-[[(2s)-6-amino-2-[[(2s)-2,6-diaminohexanoyl]amino]hexanoyl]amino]acetyl]amino]pentanedioic acid Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O SUQWGICKJIJKNO-IHRRRGAJSA-N 0.000 description 1
- OLMICDUONLWRJA-ZETCQYMHSA-N (2s)-2-[amino(cyclohexyl)amino]propanoic acid Chemical compound OC(=O)[C@H](C)N(N)C1CCCCC1 OLMICDUONLWRJA-ZETCQYMHSA-N 0.000 description 1
- LKENCKKEVBCYAE-VIFPVBQESA-N (2s)-2-[butyl-(diaminomethylideneamino)amino]-6-(diaminomethylideneamino)hexanoic acid Chemical compound CCCCN(NC(N)=N)[C@H](C(O)=O)CCCCNC(N)=N LKENCKKEVBCYAE-VIFPVBQESA-N 0.000 description 1
- KZDNJQUJBMDHJW-VIFPVBQESA-N (2s)-2-amino-3-(5-bromo-1h-indol-3-yl)propanoic acid Chemical compound C1=C(Br)C=C2C(C[C@H](N)C(O)=O)=CNC2=C1 KZDNJQUJBMDHJW-VIFPVBQESA-N 0.000 description 1
- DFZVZEMNPGABKO-ZETCQYMHSA-N (2s)-2-amino-3-pyridin-3-ylpropanoic acid Chemical compound OC(=O)[C@@H](N)CC1=CC=CN=C1 DFZVZEMNPGABKO-ZETCQYMHSA-N 0.000 description 1
- XKDUODGOACYEEU-VIFPVBQESA-N (2s)-2-azaniumyl-3-(5-nitro-1h-indol-3-yl)propanoate Chemical compound C1=C([N+]([O-])=O)C=C2C(C[C@H](N)C(O)=O)=CNC2=C1 XKDUODGOACYEEU-VIFPVBQESA-N 0.000 description 1
- FQFVANSXYKWQOT-ZETCQYMHSA-N (2s)-2-azaniumyl-3-pyridin-4-ylpropanoate Chemical compound OC(=O)[C@@H](N)CC1=CC=NC=C1 FQFVANSXYKWQOT-ZETCQYMHSA-N 0.000 description 1
- FXGZFWDCXQRZKI-VKHMYHEASA-N (2s)-5-amino-2-nitramido-5-oxopentanoic acid Chemical compound NC(=O)CC[C@@H](C(O)=O)N[N+]([O-])=O FXGZFWDCXQRZKI-VKHMYHEASA-N 0.000 description 1
- VPTPBEUWKCLZGU-OOSWLFMASA-N (2s)-6-amino-n-[(2s)-1-[[(2s)-1-[[(2r)-1-amino-3-naphthalen-2-yl-1-oxopropan-2-yl]amino]-1-oxo-3-phenylpropan-2-yl]amino]-3-methyl-1-oxobutan-2-yl]-2-[[(2r)-2-[[(2s)-2-[[(2s)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-3-(4-hydroxyp Chemical compound C([C@@H](C(=O)N[C@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@H](CC=1C=C2C=CC=CC2=CC=1)C(N)=O)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=C(O)C=C1 VPTPBEUWKCLZGU-OOSWLFMASA-N 0.000 description 1
- HMTCBXPQKWFOMG-QWXJMLLVSA-N (2s)-6-amino-n-[(2s,3r)-1-[[(2s)-1-[[(2s,3r)-1-amino-3-hydroxy-1-oxobutan-2-yl]amino]-1-oxo-3-phenylpropan-2-yl]amino]-3-hydroxy-1-oxobutan-2-yl]-2-[[(2r)-2-[[(2s)-2-[[(2s)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-3-phenylpropano Chemical compound C([C@@H](C(=O)N[C@@H]([C@H](O)C)C(N)=O)NC(=O)[C@@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](CC=1C2=CC=CC=C2NC=1)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](CC=1C=CC=CC=1)NC(=O)[C@H](N)CC=1C=CC=CC=1)[C@@H](C)O)C1=CC=CC=C1 HMTCBXPQKWFOMG-QWXJMLLVSA-N 0.000 description 1
- CCAIIPMIAFGKSI-DMTCNVIQSA-N (2s,3r)-3-hydroxy-2-(methylazaniumyl)butanoate Chemical compound CN[C@@H]([C@@H](C)O)C(O)=O CCAIIPMIAFGKSI-DMTCNVIQSA-N 0.000 description 1
- CNPSFBUUYIVHAP-WHFBIAKZSA-N (2s,3s)-3-methylpyrrolidin-1-ium-2-carboxylate Chemical compound C[C@H]1CCN[C@@H]1C(O)=O CNPSFBUUYIVHAP-WHFBIAKZSA-N 0.000 description 1
- JNMPZUZCPFIJGJ-OCZUONHDSA-N (4r,7s,10s,13s,16r,19s,22s,25r)-25-amino-13-(4-aminobutyl)-7,19,22-tribenzyl-10-[(1r)-1-hydroxyethyl]-16-(1h-indol-3-ylmethyl)-6,9,12,15,18,21,24-heptaoxo-1,2-dithia-5,8,11,14,17,20,23-heptazacyclohexacosane-4-carboxamide Chemical compound C([C@H]1C(=O)N[C@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CSSC[C@H](N)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N1)C(N)=O)=O)[C@H](O)C)C1=CC=CC=C1 JNMPZUZCPFIJGJ-OCZUONHDSA-N 0.000 description 1
- FUOOLUPWFVMBKG-UHFFFAOYSA-N 2-Aminoisobutyric acid Chemical compound CC(C)(N)C(O)=O FUOOLUPWFVMBKG-UHFFFAOYSA-N 0.000 description 1
- BKQQPCDQZZTLSE-UHFFFAOYSA-N 2-amino-3-naphthalen-1-ylpropanoic acid;hydrochloride Chemical compound Cl.C1=CC=C2C(CC(N)C(O)=O)=CC=CC2=C1 BKQQPCDQZZTLSE-UHFFFAOYSA-N 0.000 description 1
- CDUUKBXTEOFITR-BYPYZUCNSA-N 2-methyl-L-serine Chemical compound OC[C@@]([NH3+])(C)C([O-])=O CDUUKBXTEOFITR-BYPYZUCNSA-N 0.000 description 1
- XEVFXAFXZZYFSX-UHFFFAOYSA-N 3-azabicyclo[2.1.1]hexane-4-carboxylic acid Chemical compound C1C2CC1(C(=O)O)NC2 XEVFXAFXZZYFSX-UHFFFAOYSA-N 0.000 description 1
- 108010091324 3C proteases Proteins 0.000 description 1
- XWHHYOYVRVGJJY-QMMMGPOBSA-N 4-fluoro-L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(F)C=C1 XWHHYOYVRVGJJY-QMMMGPOBSA-N 0.000 description 1
- 108010068327 4-hydroxyphenylpyruvate dioxygenase Proteins 0.000 description 1
- ZZHVXIPXTCBVBE-UHFFFAOYSA-N 5-(diaminomethylideneamino)-2-[[2-[[1-[3-hydroxy-2-[[3-phenyl-2-[[2-[[1-(pyrrolidine-2-carbonyl)pyrrolidine-2-carbonyl]amino]acetyl]amino]propanoyl]amino]propanoyl]pyrrolidine-2-carbonyl]amino]-3-phenylpropanoyl]amino]pentanoic acid Chemical compound C1CCN(C(=O)C(CO)NC(=O)C(CC=2C=CC=CC=2)NC(=O)CNC(=O)C2N(CCC2)C(=O)C2NCCC2)C1C(=O)NC(C(=O)NC(CCCN=C(N)N)C(O)=O)CC1=CC=CC=C1 ZZHVXIPXTCBVBE-UHFFFAOYSA-N 0.000 description 1
- INPQIVHQSQUEAJ-UHFFFAOYSA-N 5-fluorotryptophan Chemical compound C1=C(F)C=C2C(CC(N)C(O)=O)=CNC2=C1 INPQIVHQSQUEAJ-UHFFFAOYSA-N 0.000 description 1
- 108091007505 ADAM17 Proteins 0.000 description 1
- 206010000599 Acromegaly Diseases 0.000 description 1
- 206010000830 Acute leukaemia Diseases 0.000 description 1
- 108030001653 Adamalysin Proteins 0.000 description 1
- 102000034473 Adamalysin Human genes 0.000 description 1
- 208000026872 Addison Disease Diseases 0.000 description 1
- BLGHHPHXVJWCNK-GUBZILKMSA-N Ala-Gln-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BLGHHPHXVJWCNK-GUBZILKMSA-N 0.000 description 1
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 1
- CFPQUJZTLUQUTJ-HTFCKZLJSA-N Ala-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](C)N CFPQUJZTLUQUTJ-HTFCKZLJSA-N 0.000 description 1
- RNHKOQHGYMTHFR-UBHSHLNASA-N Ala-Phe-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 RNHKOQHGYMTHFR-UBHSHLNASA-N 0.000 description 1
- 241000710929 Alphavirus Species 0.000 description 1
- 206010002556 Ankylosing Spondylitis Diseases 0.000 description 1
- 102000008102 Ankyrins Human genes 0.000 description 1
- 108010049777 Ankyrins Proteins 0.000 description 1
- 208000019901 Anxiety disease Diseases 0.000 description 1
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 1
- OGUPCHKBOKJFMA-SRVKXCTJSA-N Arg-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N OGUPCHKBOKJFMA-SRVKXCTJSA-N 0.000 description 1
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 1
- NVUIWHJLPSZZQC-CYDGBPFRSA-N Arg-Ile-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NVUIWHJLPSZZQC-CYDGBPFRSA-N 0.000 description 1
- 206010003253 Arthritis enteropathic Diseases 0.000 description 1
- 206010003267 Arthritis reactive Diseases 0.000 description 1
- KWQPAXYXVMHJJR-AVGNSLFASA-N Asn-Gln-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KWQPAXYXVMHJJR-AVGNSLFASA-N 0.000 description 1
- 208000004300 Atrophic Gastritis Diseases 0.000 description 1
- 206010003827 Autoimmune hepatitis Diseases 0.000 description 1
- 241000711404 Avian avulavirus 1 Species 0.000 description 1
- 241000035315 Avulavirus Species 0.000 description 1
- 208000010839 B-cell chronic lymphocytic leukemia Diseases 0.000 description 1
- 102100028169 BET1-like protein Human genes 0.000 description 1
- 101710138653 BET1-like protein Proteins 0.000 description 1
- 108700003245 BIM 23052 Proteins 0.000 description 1
- 108010059916 BIM 23056 Proteins 0.000 description 1
- 108700016019 BIM 23268 Proteins 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 208000027496 Behcet disease Diseases 0.000 description 1
- 208000009137 Behcet syndrome Diseases 0.000 description 1
- 208000008439 Biliary Liver Cirrhosis Diseases 0.000 description 1
- 208000033222 Biliary cirrhosis primary Diseases 0.000 description 1
- 206010005003 Bladder cancer Diseases 0.000 description 1
- 206010005949 Bone cancer Diseases 0.000 description 1
- 208000020084 Bone disease Diseases 0.000 description 1
- 208000018084 Bone neoplasm Diseases 0.000 description 1
- 102000010183 Bradykinin receptor Human genes 0.000 description 1
- 108050001736 Bradykinin receptor Proteins 0.000 description 1
- 208000003174 Brain Neoplasms Diseases 0.000 description 1
- 206010006811 Bursitis Diseases 0.000 description 1
- 102100021942 C-C motif chemokine 28 Human genes 0.000 description 1
- 108010001282 CT-322 Proteins 0.000 description 1
- 108010015060 CYN 154806 Proteins 0.000 description 1
- 102400000113 Calcitonin Human genes 0.000 description 1
- 108060001064 Calcitonin Proteins 0.000 description 1
- 241000712083 Canine morbillivirus Species 0.000 description 1
- 101710167800 Capsid assembly scaffolding protein Proteins 0.000 description 1
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 102000003952 Caspase 3 Human genes 0.000 description 1
- 108090000397 Caspase 3 Proteins 0.000 description 1
- 102000000844 Cell Surface Receptors Human genes 0.000 description 1
- 206010008342 Cervix carcinoma Diseases 0.000 description 1
- 229920002101 Chitin Polymers 0.000 description 1
- 108010089448 Cholecystokinin B Receptor Proteins 0.000 description 1
- 208000006545 Chronic Obstructive Pulmonary Disease Diseases 0.000 description 1
- 241001112696 Clostridia Species 0.000 description 1
- 241000186542 Clostridium baratii Species 0.000 description 1
- 241000193171 Clostridium butyricum Species 0.000 description 1
- 241000193464 Clostridium sp. Species 0.000 description 1
- 241000193449 Clostridium tetani Species 0.000 description 1
- 206010009900 Colitis ulcerative Diseases 0.000 description 1
- 108010078015 Complement C3b Proteins 0.000 description 1
- 206010010744 Conjunctivitis allergic Diseases 0.000 description 1
- 241000709687 Coxsackievirus Species 0.000 description 1
- 208000011231 Crohn disease Diseases 0.000 description 1
- 241000238424 Crustacea Species 0.000 description 1
- 108010069514 Cyclic Peptides Proteins 0.000 description 1
- 102000001189 Cyclic Peptides Human genes 0.000 description 1
- ABLJDBFJPUWQQB-DCAQKATOSA-N Cys-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CS)N ABLJDBFJPUWQQB-DCAQKATOSA-N 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 108090000695 Cytokines Proteins 0.000 description 1
- QWCKQJZIFLGMSD-GSVOUGTGSA-N D-alpha-aminobutyric acid Chemical group CC[C@@H](N)C(O)=O QWCKQJZIFLGMSD-GSVOUGTGSA-N 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 201000004624 Dermatitis Diseases 0.000 description 1
- 102000016607 Diphtheria Toxin Human genes 0.000 description 1
- 108010053187 Diphtheria Toxin Proteins 0.000 description 1
- 101150029707 ERBB2 gene Proteins 0.000 description 1
- 208000001976 Endocrine Gland Neoplasms Diseases 0.000 description 1
- 102100038132 Endogenous retrovirus group K member 6 Pro protein Human genes 0.000 description 1
- 108010049140 Endorphins Proteins 0.000 description 1
- 102000009025 Endorphins Human genes 0.000 description 1
- 206010014950 Eosinophilia Diseases 0.000 description 1
- 241000672609 Escherichia coli BL21 Species 0.000 description 1
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 1
- 101710082714 Exotoxin A Proteins 0.000 description 1
- 101710089384 Extracellular protease Proteins 0.000 description 1
- 108010048049 Factor IXa Proteins 0.000 description 1
- 108010054265 Factor VIIa Proteins 0.000 description 1
- 108010071241 Factor XIIa Proteins 0.000 description 1
- 108010080805 Factor XIa Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 108010049003 Fibrinogen Proteins 0.000 description 1
- 102000008946 Fibrinogen Human genes 0.000 description 1
- 208000004262 Food Hypersensitivity Diseases 0.000 description 1
- 206010016946 Food allergy Diseases 0.000 description 1
- 108091006027 G proteins Proteins 0.000 description 1
- 101150110792 GNRHR gene Proteins 0.000 description 1
- 102000030782 GTP binding Human genes 0.000 description 1
- 108091000058 GTP-Binding Proteins 0.000 description 1
- 208000007882 Gastritis Diseases 0.000 description 1
- 208000036495 Gastritis atrophic Diseases 0.000 description 1
- NVEASDQHBRZPSU-BQBZGAKWSA-N Gln-Gln-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O NVEASDQHBRZPSU-BQBZGAKWSA-N 0.000 description 1
- MFJAPSYJQJCQDN-BQBZGAKWSA-N Gln-Gly-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O MFJAPSYJQJCQDN-BQBZGAKWSA-N 0.000 description 1
- XQEAVUJIRZRLQQ-SZMVWBNQSA-N Gln-His-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC3=CN=CN3)NC(=O)[C@H](CCC(=O)N)N XQEAVUJIRZRLQQ-SZMVWBNQSA-N 0.000 description 1
- UQKVUFGUSVYJMQ-IRIUXVKKSA-N Gln-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCC(=O)N)N)O UQKVUFGUSVYJMQ-IRIUXVKKSA-N 0.000 description 1
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 1
- 102000005720 Glutathione transferase Human genes 0.000 description 1
- 108010070675 Glutathione transferase Proteins 0.000 description 1
- RQZGFWKQLPJOEQ-YUMQZZPRSA-N Gly-Arg-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)CN)CN=C(N)N RQZGFWKQLPJOEQ-YUMQZZPRSA-N 0.000 description 1
- XUORRGAFUQIMLC-STQMWFEESA-N Gly-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN)O XUORRGAFUQIMLC-STQMWFEESA-N 0.000 description 1
- KAJAOGBVWCYGHZ-JTQLQIEISA-N Gly-Gly-Phe Chemical compound [NH3+]CC(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=CC=C1 KAJAOGBVWCYGHZ-JTQLQIEISA-N 0.000 description 1
- LBDXVCBAJJNJNN-WHFBIAKZSA-N Gly-Ser-Cys Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O LBDXVCBAJJNJNN-WHFBIAKZSA-N 0.000 description 1
- CSMYMGFCEJWALV-WDSKDSINSA-N Gly-Ser-Gln Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(N)=O CSMYMGFCEJWALV-WDSKDSINSA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- MKIAPEZXQDILRR-YUMQZZPRSA-N Gly-Ser-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN MKIAPEZXQDILRR-YUMQZZPRSA-N 0.000 description 1
- 102100033851 Gonadotropin-releasing hormone receptor Human genes 0.000 description 1
- 201000005569 Gout Diseases 0.000 description 1
- 208000003807 Graves Disease Diseases 0.000 description 1
- 208000015023 Graves' disease Diseases 0.000 description 1
- 101800000736 Growth hormone-releasing factor Proteins 0.000 description 1
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 1
- 208000030836 Hashimoto thyroiditis Diseases 0.000 description 1
- 101710154606 Hemagglutinin Proteins 0.000 description 1
- 241000893570 Hendra henipavirus Species 0.000 description 1
- 241000035314 Henipavirus Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 108700015863 His(5)-Trp(7)-Tyr(8)- LHRH Proteins 0.000 description 1
- 208000017604 Hodgkin disease Diseases 0.000 description 1
- 208000021519 Hodgkin lymphoma Diseases 0.000 description 1
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 1
- 101000897477 Homo sapiens C-C motif chemokine 28 Proteins 0.000 description 1
- 101000992305 Homo sapiens Delta-type opioid receptor Proteins 0.000 description 1
- 101000992298 Homo sapiens Kappa-type opioid receptor Proteins 0.000 description 1
- 101001122476 Homo sapiens Mu-type opioid receptor Proteins 0.000 description 1
- 101100295829 Homo sapiens OPRD1 gene Proteins 0.000 description 1
- 101000904173 Homo sapiens Progonadoliberin-1 Proteins 0.000 description 1
- YZJSUQQZGCHHNQ-UHFFFAOYSA-N Homoglutamine Chemical compound OC(=O)C(N)CCCC(N)=O YZJSUQQZGCHHNQ-UHFFFAOYSA-N 0.000 description 1
- 108090000144 Human Proteins Proteins 0.000 description 1
- 102000003839 Human Proteins Human genes 0.000 description 1
- 241001207270 Human enterovirus Species 0.000 description 1
- 241000701044 Human gammaherpesvirus 4 Species 0.000 description 1
- 241000342334 Human metapneumovirus Species 0.000 description 1
- 241000430519 Human rhinovirus sp. Species 0.000 description 1
- AVXURJPOCDRRFD-UHFFFAOYSA-N Hydroxylamine Chemical compound ON AVXURJPOCDRRFD-UHFFFAOYSA-N 0.000 description 1
- 206010020772 Hypertension Diseases 0.000 description 1
- 206010020850 Hyperthyroidism Diseases 0.000 description 1
- 206010020880 Hypertrophy Diseases 0.000 description 1
- HOLOYAZCIHDQNS-YVNDNENWSA-N Ile-Gln-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HOLOYAZCIHDQNS-YVNDNENWSA-N 0.000 description 1
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 1
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 1
- 108010067060 Immunoglobulin Variable Region Proteins 0.000 description 1
- 102000017727 Immunoglobulin Variable Region Human genes 0.000 description 1
- 208000022559 Inflammatory bowel disease Diseases 0.000 description 1
- 241000712431 Influenza A virus Species 0.000 description 1
- 102000014429 Insulin-like growth factor Human genes 0.000 description 1
- 208000003456 Juvenile Arthritis Diseases 0.000 description 1
- 108060005987 Kallikrein Proteins 0.000 description 1
- 102000001399 Kallikrein Human genes 0.000 description 1
- 208000007766 Kaposi sarcoma Diseases 0.000 description 1
- 102100031819 Kappa-type opioid receptor Human genes 0.000 description 1
- 208000008839 Kidney Neoplasms Diseases 0.000 description 1
- AHLPHDHHMVZTML-BYPYZUCNSA-N L-Ornithine Chemical compound NCCC[C@H](N)C(O)=O AHLPHDHHMVZTML-BYPYZUCNSA-N 0.000 description 1
- SRBFZHDQGSBBOR-HWQSCIPKSA-N L-arabinopyranose Chemical compound O[C@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-HWQSCIPKSA-N 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- DZLNHFMRPBPULJ-VKHMYHEASA-N L-thioproline Chemical compound OC(=O)[C@@H]1CSCN1 DZLNHFMRPBPULJ-VKHMYHEASA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 102000008238 LHRH Receptors Human genes 0.000 description 1
- 108090001090 Lectins Proteins 0.000 description 1
- 102000004856 Lectins Human genes 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 208000031422 Lymphocytic Chronic B-Cell Leukemia Diseases 0.000 description 1
- 206010025323 Lymphomas Diseases 0.000 description 1
- DGAAQRAUOFHBFJ-CIUDSAMLSA-N Lys-Asn-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O DGAAQRAUOFHBFJ-CIUDSAMLSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 1
- 241000351643 Metapneumovirus Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 206010027566 Micturition urgency Diseases 0.000 description 1
- 102220477707 Mitochondrial inner membrane protease subunit 1_E54A_mutation Human genes 0.000 description 1
- 208000037039 Monarthritis Diseases 0.000 description 1
- 102100028647 Mu-type opioid receptor Human genes 0.000 description 1
- PQNASZJZHFPQLE-LURJTMIESA-N N(6)-methyl-L-lysine Chemical compound CNCCCC[C@H](N)C(O)=O PQNASZJZHFPQLE-LURJTMIESA-N 0.000 description 1
- PQNASZJZHFPQLE-UHFFFAOYSA-N N(6)-methyllysine Chemical compound CNCCCCC(N)C(O)=O PQNASZJZHFPQLE-UHFFFAOYSA-N 0.000 description 1
- GHAZCVNUKKZTLG-UHFFFAOYSA-N N-ethyl-succinimide Natural products CCN1C(=O)CCC1=O GHAZCVNUKKZTLG-UHFFFAOYSA-N 0.000 description 1
- HDFGOPSGAURCEO-UHFFFAOYSA-N N-ethylmaleimide Chemical compound CCN1C(=O)C=CC1=O HDFGOPSGAURCEO-UHFFFAOYSA-N 0.000 description 1
- 125000001429 N-terminal alpha-amino-acid group Chemical group 0.000 description 1
- 125000000729 N-terminal amino-acid group Chemical group 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 241001440871 Neisseria sp. Species 0.000 description 1
- 208000012902 Nervous system disease Diseases 0.000 description 1
- 208000007920 Neurogenic Inflammation Diseases 0.000 description 1
- 208000025966 Neurological disease Diseases 0.000 description 1
- 108090000189 Neuropeptides Proteins 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 101150012056 OPRL1 gene Proteins 0.000 description 1
- 108010016076 Octreotide Proteins 0.000 description 1
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 1
- 102000003840 Opioid Receptors Human genes 0.000 description 1
- 108090000137 Opioid Receptors Proteins 0.000 description 1
- 108070000021 Opioid peptides receptors Proteins 0.000 description 1
- AHLPHDHHMVZTML-UHFFFAOYSA-N Orn-delta-NH2 Natural products NCCCC(N)C(O)=O AHLPHDHHMVZTML-UHFFFAOYSA-N 0.000 description 1
- UTJLXEIPEHZYQJ-UHFFFAOYSA-N Ornithine Natural products OC(=O)C(C)CCCN UTJLXEIPEHZYQJ-UHFFFAOYSA-N 0.000 description 1
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 1
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 1
- 206010033645 Pancreatitis Diseases 0.000 description 1
- 102100032256 Parathyroid hormone/parathyroid hormone-related peptide receptor Human genes 0.000 description 1
- 101710180613 Parathyroid hormone/parathyroid hormone-related peptide receptor Proteins 0.000 description 1
- 208000000450 Pelvic Pain Diseases 0.000 description 1
- 208000009565 Pharyngeal Neoplasms Diseases 0.000 description 1
- 206010034811 Pharyngeal cancer Diseases 0.000 description 1
- MECSIDWUTYRHRJ-KKUMJFAQSA-N Phe-Asn-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O MECSIDWUTYRHRJ-KKUMJFAQSA-N 0.000 description 1
- RMKGXGPQIPLTFC-KKUMJFAQSA-N Phe-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RMKGXGPQIPLTFC-KKUMJFAQSA-N 0.000 description 1
- WURZLPSMYZLEGH-UNQGMJICSA-N Phe-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=CC=C1)N)O WURZLPSMYZLEGH-UNQGMJICSA-N 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 206010036030 Polyarthritis Diseases 0.000 description 1
- 208000012654 Primary biliary cholangitis Diseases 0.000 description 1
- 101710130420 Probable capsid assembly scaffolding protein Proteins 0.000 description 1
- 102100024622 Proenkephalin-B Human genes 0.000 description 1
- 102100024028 Progonadoliberin-1 Human genes 0.000 description 1
- 101710176177 Protein A56 Proteins 0.000 description 1
- 101800004937 Protein C Proteins 0.000 description 1
- 208000003251 Pruritus Diseases 0.000 description 1
- 101100244562 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) oprD gene Proteins 0.000 description 1
- 201000004681 Psoriasis Diseases 0.000 description 1
- 201000001263 Psoriatic Arthritis Diseases 0.000 description 1
- 208000036824 Psoriatic arthropathy Diseases 0.000 description 1
- 101710185720 Putative ethidium bromide resistance protein Proteins 0.000 description 1
- 208000032056 Radiation Fibrosis Syndrome Diseases 0.000 description 1
- 206010038389 Renal cancer Diseases 0.000 description 1
- 206010057190 Respiratory tract infections Diseases 0.000 description 1
- 241001113283 Respirovirus Species 0.000 description 1
- 208000025747 Rheumatic disease Diseases 0.000 description 1
- 208000036284 Rhinitis seasonal Diseases 0.000 description 1
- 102400000827 Saposin-D Human genes 0.000 description 1
- 101800001700 Saposin-D Proteins 0.000 description 1
- 108010077895 Sarcosine Proteins 0.000 description 1
- 101710204410 Scaffold protein Proteins 0.000 description 1
- 206010039710 Scleroderma Diseases 0.000 description 1
- QUGRFWPMPVIAPW-IHRRRGAJSA-N Ser-Pro-Phe Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QUGRFWPMPVIAPW-IHRRRGAJSA-N 0.000 description 1
- PZHJLTWGMYERRJ-SRVKXCTJSA-N Ser-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)O PZHJLTWGMYERRJ-SRVKXCTJSA-N 0.000 description 1
- 108090000899 Serralysin Proteins 0.000 description 1
- 241000713656 Simian foamy virus Species 0.000 description 1
- 108010003723 Single-Domain Antibodies Proteins 0.000 description 1
- 208000021386 Sjogren Syndrome Diseases 0.000 description 1
- 208000000453 Skin Neoplasms Diseases 0.000 description 1
- 208000006045 Spondylarthropathies Diseases 0.000 description 1
- 241000713675 Spumavirus Species 0.000 description 1
- 101000677856 Stenotrophomonas maltophilia (strain K279a) Actin-binding protein Smlt3054 Proteins 0.000 description 1
- 208000005718 Stomach Neoplasms Diseases 0.000 description 1
- 108090000787 Subtilisin Proteins 0.000 description 1
- 101000996723 Sus scrofa Gonadotropin-releasing hormone receptor Proteins 0.000 description 1
- 206010042674 Swelling Diseases 0.000 description 1
- 102000004183 Synaptosomal-Associated Protein 25 Human genes 0.000 description 1
- 201000009594 Systemic Scleroderma Diseases 0.000 description 1
- 206010042953 Systemic sclerosis Diseases 0.000 description 1
- 102000007000 Tenascin Human genes 0.000 description 1
- 108010008125 Tenascin Proteins 0.000 description 1
- 208000004760 Tenosynovitis Diseases 0.000 description 1
- 208000024313 Testicular Neoplasms Diseases 0.000 description 1
- 206010057644 Testis cancer Diseases 0.000 description 1
- 208000003217 Tetany Diseases 0.000 description 1
- 102100036407 Thioredoxin Human genes 0.000 description 1
- JTEICXDKGWKRRV-HJGDQZAQSA-N Thr-Asn-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JTEICXDKGWKRRV-HJGDQZAQSA-N 0.000 description 1
- UDQBCBUXAQIZAK-GLLZPBPUSA-N Thr-Glu-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O UDQBCBUXAQIZAK-GLLZPBPUSA-N 0.000 description 1
- DEGCBBCMYWNJNA-RHYQMDGZSA-N Thr-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)[C@@H](C)O DEGCBBCMYWNJNA-RHYQMDGZSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 206010043561 Thrombocytopenic purpura Diseases 0.000 description 1
- 108010046722 Thrombospondin 1 Proteins 0.000 description 1
- 102100036034 Thrombospondin-1 Human genes 0.000 description 1
- 101800004623 Thyrotropin-releasing hormone Proteins 0.000 description 1
- 102400000336 Thyrotropin-releasing hormone Human genes 0.000 description 1
- 241000723790 Tobacco vein mottling virus Species 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- ABRICLFKFRFDKS-IHPCNDPISA-N Trp-Ser-Tyr Chemical compound C([C@H](NC(=O)[C@H](CO)NC(=O)[C@H](CC=1C2=CC=CC=C2NC=1)N)C(O)=O)C1=CC=C(O)C=C1 ABRICLFKFRFDKS-IHPCNDPISA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 208000025865 Ulcer Diseases 0.000 description 1
- 201000006704 Ulcerative Colitis Diseases 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 1
- 208000002495 Uterine Neoplasms Diseases 0.000 description 1
- 206010046851 Uveitis Diseases 0.000 description 1
- 108091008605 VEGF receptors Proteins 0.000 description 1
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 1
- 102000009484 Vascular Endothelial Growth Factor Receptors Human genes 0.000 description 1
- 101710181748 Venom protease Proteins 0.000 description 1
- 241000711970 Vesiculovirus Species 0.000 description 1
- 108010003533 Viral Envelope Proteins Proteins 0.000 description 1
- 108010059722 Viral Fusion Proteins Proteins 0.000 description 1
- 108010031318 Vitronectin Proteins 0.000 description 1
- 102100035140 Vitronectin Human genes 0.000 description 1
- 241000269370 Xenopus <genus> Species 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 230000001594 aberrant effect Effects 0.000 description 1
- 238000002679 ablation Methods 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 125000000218 acetic acid group Chemical group C(C)(=O)* 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 239000002671 adjuvant Substances 0.000 description 1
- 201000005188 adrenal gland cancer Diseases 0.000 description 1
- 208000024447 adrenal gland neoplasm Diseases 0.000 description 1
- 239000000048 adrenergic agonist Substances 0.000 description 1
- 229940126157 adrenergic receptor agonist Drugs 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 239000000556 agonist Substances 0.000 description 1
- 210000001552 airway epithelial cell Anatomy 0.000 description 1
- 238000012867 alanine scanning Methods 0.000 description 1
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 1
- 208000002205 allergic conjunctivitis Diseases 0.000 description 1
- 230000000172 allergic effect Effects 0.000 description 1
- 201000010105 allergic rhinitis Diseases 0.000 description 1
- CDUUKBXTEOFITR-UHFFFAOYSA-N alpha-methylserine Natural products OCC([NH3+])(C)C([O-])=O CDUUKBXTEOFITR-UHFFFAOYSA-N 0.000 description 1
- 230000009435 amidation Effects 0.000 description 1
- 238000007112 amidation reaction Methods 0.000 description 1
- 230000036592 analgesia Effects 0.000 description 1
- 238000009167 androgen deprivation therapy Methods 0.000 description 1
- 239000005557 antagonist Substances 0.000 description 1
- 230000000844 anti-bacterial effect Effects 0.000 description 1
- 230000036506 anxiety Effects 0.000 description 1
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 1
- 230000037007 arousal Effects 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 208000024998 atopic conjunctivitis Diseases 0.000 description 1
- 201000005000 autoimmune gastritis Diseases 0.000 description 1
- 239000003899 bactericide agent Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 239000003012 bilayer membrane Substances 0.000 description 1
- 238000004166 bioassay Methods 0.000 description 1
- 230000009141 biological interaction Effects 0.000 description 1
- 229960000074 biopharmaceutical Drugs 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 230000023555 blood coagulation Effects 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 238000006664 bond formation reaction Methods 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 210000002449 bone cell Anatomy 0.000 description 1
- 229940053031 botulinum toxin Drugs 0.000 description 1
- 108010070055 bradykinin (1-5) Proteins 0.000 description 1
- 210000000621 bronchi Anatomy 0.000 description 1
- 210000000233 bronchiolar non-ciliated Anatomy 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 244000309464 bull Species 0.000 description 1
- BBBFJLBPOGFECG-VJVYQDLKSA-N calcitonin Chemical compound N([C@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CO)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N1[C@@H](CCC1)C(N)=O)C(C)C)C(=O)[C@@H]1CSSC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1 BBBFJLBPOGFECG-VJVYQDLKSA-N 0.000 description 1
- 229960004015 calcitonin Drugs 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 230000004656 cell transport Effects 0.000 description 1
- 210000004671 cell-free system Anatomy 0.000 description 1
- 230000033077 cellular process Effects 0.000 description 1
- 201000010881 cervical cancer Diseases 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 238000004587 chromatography analysis Methods 0.000 description 1
- 208000016644 chronic atrophic gastritis Diseases 0.000 description 1
- 208000032852 chronic lymphocytic leukemia Diseases 0.000 description 1
- 208000025302 chronic primary adrenal insufficiency Diseases 0.000 description 1
- 229940126051 coagulation factor XIa Drugs 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- GMRWGQCZJGVHKL-UHFFFAOYSA-N colestipol Chemical compound ClCC1CO1.NCCNCCNCCNCCN GMRWGQCZJGVHKL-UHFFFAOYSA-N 0.000 description 1
- 206010009887 colitis Diseases 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 229940124558 contraceptive agent Drugs 0.000 description 1
- 239000003433 contraceptive agent Substances 0.000 description 1
- 230000008602 contraction Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000002050 diffraction method Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000006334 disulfide bridging Effects 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 239000003937 drug carrier Substances 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 235000013601 eggs Nutrition 0.000 description 1
- 238000002003 electron diffraction Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 239000003995 emulsifying agent Substances 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 210000003890 endocrine cell Anatomy 0.000 description 1
- 201000011523 endocrine gland cancer Diseases 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 210000003979 eosinophil Anatomy 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 210000000981 epithelium Anatomy 0.000 description 1
- 201000004101 esophageal cancer Diseases 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 210000002907 exocrine cell Anatomy 0.000 description 1
- 239000006277 exogenous ligand Substances 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 229940012952 fibrinogen Drugs 0.000 description 1
- 230000003176 fibrotic effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 235000020932 food allergy Nutrition 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 210000000232 gallbladder Anatomy 0.000 description 1
- 229960003692 gamma aminobutyric acid Drugs 0.000 description 1
- 150000002270 gangliosides Chemical class 0.000 description 1
- 206010017758 gastric cancer Diseases 0.000 description 1
- OKGNKPYIPKMGLR-ZPCKCTIPSA-N gastrins Chemical class C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(N)=O)C(C)C)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1N(CCC1)C(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CC(C)C)NC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@H]1N(CCC1)C(=O)[C@H]1NC(=O)CC1)C1=CN=CN1 OKGNKPYIPKMGLR-ZPCKCTIPSA-N 0.000 description 1
- 239000003629 gastrointestinal hormone Substances 0.000 description 1
- 210000005095 gastrointestinal system Anatomy 0.000 description 1
- 210000004907 gland Anatomy 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 210000002175 goblet cell Anatomy 0.000 description 1
- XLXSAKCOAKORKW-UHFFFAOYSA-N gonadorelin Chemical compound C1CCC(C(=O)NCC(N)=O)N1C(=O)C(CCCN=C(N)N)NC(=O)C(CC(C)C)NC(=O)CNC(=O)C(NC(=O)C(CO)NC(=O)C(CC=1C2=CC=CC=C2NC=1)NC(=O)C(CC=1NC=NC=1)NC(=O)C1NC(=O)CC1)CC1=CC=C(O)C=C1 XLXSAKCOAKORKW-UHFFFAOYSA-N 0.000 description 1
- 229960001442 gonadorelin Drugs 0.000 description 1
- 210000004368 gonadotroph Anatomy 0.000 description 1
- 229940094892 gonadotropins Drugs 0.000 description 1
- 239000000185 hemagglutinin Substances 0.000 description 1
- 208000007475 hemolytic anemia Diseases 0.000 description 1
- 208000014617 hemorrhoid Diseases 0.000 description 1
- 208000006454 hepatitis Diseases 0.000 description 1
- 231100000283 hepatitis Toxicity 0.000 description 1
- 210000003630 histaminocyte Anatomy 0.000 description 1
- MWFRVMDVLYIXJF-BYPYZUCNSA-N hydroxyethylcysteine Chemical compound OC(=O)[C@@H](N)CSCCO MWFRVMDVLYIXJF-BYPYZUCNSA-N 0.000 description 1
- 229960002591 hydroxyproline Drugs 0.000 description 1
- 208000031424 hyperprolactinemia Diseases 0.000 description 1
- 230000002267 hypothalamic effect Effects 0.000 description 1
- 125000002883 imidazolyl group Chemical group 0.000 description 1
- 210000002865 immune cell Anatomy 0.000 description 1
- 238000002513 implantation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 238000000099 in vitro assay Methods 0.000 description 1
- 230000000415 inactivating effect Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000008595 infiltration Effects 0.000 description 1
- 238000001764 infiltration Methods 0.000 description 1
- 210000004969 inflammatory cell Anatomy 0.000 description 1
- 238000001802 infusion Methods 0.000 description 1
- 229940125396 insulin Drugs 0.000 description 1
- 230000017730 intein-mediated protein splicing Effects 0.000 description 1
- 230000010189 intracellular transport Effects 0.000 description 1
- 238000010255 intramuscular injection Methods 0.000 description 1
- 239000007927 intramuscular injection Substances 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- GCHPUFAZSONQIV-UHFFFAOYSA-N isovaline Chemical compound CCC(C)(N)C(O)=O GCHPUFAZSONQIV-UHFFFAOYSA-N 0.000 description 1
- 230000007803 itching Effects 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 201000010982 kidney cancer Diseases 0.000 description 1
- HXEACLLIILLPRG-RXMQYKEDSA-N l-pipecolic acid Natural products OC(=O)[C@H]1CCCCN1 HXEACLLIILLPRG-RXMQYKEDSA-N 0.000 description 1
- 108010021336 lanreotide Proteins 0.000 description 1
- 210000002429 large intestine Anatomy 0.000 description 1
- 239000002523 lectin Substances 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 238000000670 ligand binding assay Methods 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 208000014018 liver neoplasm Diseases 0.000 description 1
- 239000003589 local anesthetic agent Substances 0.000 description 1
- 229960005015 local anesthetics Drugs 0.000 description 1
- 230000001592 luteinising effect Effects 0.000 description 1
- 108010059573 lysyl-lysyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 125000001360 methionine group Chemical group N[C@@H](CCSC)C(=O)* 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 239000003226 mitogen Substances 0.000 description 1
- 230000000394 mitotic effect Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000001616 monocyte Anatomy 0.000 description 1
- 238000010172 mouse model Methods 0.000 description 1
- 238000002887 multiple sequence alignment Methods 0.000 description 1
- 206010028417 myasthenia gravis Diseases 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- 210000004897 n-terminal region Anatomy 0.000 description 1
- 230000001613 neoplastic effect Effects 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 210000001640 nerve ending Anatomy 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 208000015706 neuroendocrine disease Diseases 0.000 description 1
- 230000000701 neuroleptic effect Effects 0.000 description 1
- 201000001119 neuropathy Diseases 0.000 description 1
- 230000007823 neuropathy Effects 0.000 description 1
- 230000003957 neurotransmitter release Effects 0.000 description 1
- 208000004235 neutropenia Diseases 0.000 description 1
- 210000000440 neutrophil Anatomy 0.000 description 1
- 231100001083 no cytotoxicity Toxicity 0.000 description 1
- 230000009871 nonspecific binding Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 229960003104 ornithine Drugs 0.000 description 1
- 201000008482 osteoarthritis Diseases 0.000 description 1
- 210000000963 osteoblast Anatomy 0.000 description 1
- 230000016087 ovulation Effects 0.000 description 1
- 108010081407 pB1 peptide Proteins 0.000 description 1
- 210000002990 parathyroid gland Anatomy 0.000 description 1
- 108700017947 pasireotide Proteins 0.000 description 1
- 229960005415 pasireotide Drugs 0.000 description 1
- NEEFMPSSNFRRNC-HQUONIRXSA-N pasireotide aspartate Chemical compound OC(=O)[C@@H](N)CC(O)=O.OC(=O)[C@@H](N)CC(O)=O.C([C@H]1C(=O)N2C[C@@H](C[C@H]2C(=O)N[C@H](C(=O)N[C@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@H](C(N[C@@H](CC=2C=CC(OCC=3C=CC=CC=3)=CC=2)C(=O)N1)=O)CCCCN)C=1C=CC=CC=1)OC(=O)NCCN)C1=CC=CC=C1 NEEFMPSSNFRRNC-HQUONIRXSA-N 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 230000004963 pathophysiological condition Effects 0.000 description 1
- 210000003899 penis Anatomy 0.000 description 1
- 208000033808 peripheral neuropathy Diseases 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 239000008194 pharmaceutical composition Substances 0.000 description 1
- 239000000546 pharmaceutical excipient Substances 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 150000003904 phospholipids Chemical class 0.000 description 1
- 238000005222 photoaffinity labeling Methods 0.000 description 1
- HXEACLLIILLPRG-UHFFFAOYSA-N pipecolic acid Chemical compound OC(=O)C1CCCCN1 HXEACLLIILLPRG-UHFFFAOYSA-N 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 208000030428 polyarticular arthritis Diseases 0.000 description 1
- 201000010065 polycystic ovary syndrome Diseases 0.000 description 1
- 208000005987 polymyositis Diseases 0.000 description 1
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 1
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 1
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 1
- 239000003755 preservative agent Substances 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 1
- 239000003380 propellant Substances 0.000 description 1
- 229960000856 protein c Drugs 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 230000007026 protein scission Effects 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 231100000654 protein toxin Toxicity 0.000 description 1
- XNSAINXGIQZQOO-SRVKXCTJSA-N protirelin Chemical compound NC(=O)[C@@H]1CCCN1C(=O)[C@@H](NC(=O)[C@H]1NC(=O)CC1)CC1=CN=CN1 XNSAINXGIQZQOO-SRVKXCTJSA-N 0.000 description 1
- 239000002510 pyrogen Substances 0.000 description 1
- 208000002574 reactive arthritis Diseases 0.000 description 1
- 230000010837 receptor-mediated endocytosis Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000004043 responsiveness Effects 0.000 description 1
- 230000000552 rheumatic effect Effects 0.000 description 1
- 201000003068 rheumatic fever Diseases 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 230000036573 scar formation Effects 0.000 description 1
- 239000002795 scorpion venom Substances 0.000 description 1
- 238000007789 sealing Methods 0.000 description 1
- 208000017022 seasonal allergic rhinitis Diseases 0.000 description 1
- 108010052231 seglitide Proteins 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 210000003728 serous cell Anatomy 0.000 description 1
- 210000003491 skin Anatomy 0.000 description 1
- 201000000849 skin cancer Diseases 0.000 description 1
- 230000016160 smooth muscle contraction Effects 0.000 description 1
- 210000000329 smooth muscle myocyte Anatomy 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 210000005070 sphincter Anatomy 0.000 description 1
- 201000005671 spondyloarthropathy Diseases 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 230000004936 stimulating effect Effects 0.000 description 1
- 201000011549 stomach cancer Diseases 0.000 description 1
- 238000010254 subcutaneous injection Methods 0.000 description 1
- 239000007929 subcutaneous injection Substances 0.000 description 1
- 210000004878 submucosal gland Anatomy 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 238000007910 systemic administration Methods 0.000 description 1
- 230000009885 systemic effect Effects 0.000 description 1
- 230000006231 tRNA aminoacylation Effects 0.000 description 1
- NPDBDJFLKKQMCM-UHFFFAOYSA-N tert-butylglycine Chemical compound CC(C)(C)C(N)C(O)=O NPDBDJFLKKQMCM-UHFFFAOYSA-N 0.000 description 1
- 201000003120 testicular cancer Diseases 0.000 description 1
- 210000001550 testis Anatomy 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- 108060008226 thioredoxin Proteins 0.000 description 1
- 229940094937 thioredoxin Drugs 0.000 description 1
- 210000001685 thyroid gland Anatomy 0.000 description 1
- 208000005057 thyrotoxicosis Diseases 0.000 description 1
- 229940034199 thyrotropin-releasing hormone Drugs 0.000 description 1
- OXHYRVSBKWIFES-WWSDOYNLSA-N trap-14 peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCC(O)=O)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)NC(=O)[C@@H](N)CO)C1=CC=CC=C1 OXHYRVSBKWIFES-WWSDOYNLSA-N 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 108010060175 trypsinogen activation peptide Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
- 210000001170 unmyelinated nerve fiber Anatomy 0.000 description 1
- 210000000689 upper leg Anatomy 0.000 description 1
- 210000000626 ureter Anatomy 0.000 description 1
- 210000003708 urethra Anatomy 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 206010046766 uterine cancer Diseases 0.000 description 1
- 108700029852 vapreotide Proteins 0.000 description 1
- 239000005526 vasoconstrictor agent Substances 0.000 description 1
- 208000001319 vasomotor rhinitis Diseases 0.000 description 1
- 230000007377 viral translocation Effects 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
- 108020001612 μ-opioid receptors Proteins 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K19/00—Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/96—Stabilising an enzyme by forming an adduct or a composition; Forming enzyme conjugates
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/43—Enzymes; Proenzymes; Derivatives thereof
- A61K38/46—Hydrolases (3)
- A61K38/48—Hydrolases (3) acting on peptide bonds (3.4)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K47/00—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
- A61K47/50—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P13/00—Drugs for disorders of the urinary system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P23/00—Anaesthetics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/02—Drugs for disorders of the nervous system for peripheral neuropathies
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P25/00—Drugs for disorders of the nervous system
- A61P25/04—Centrally acting analgesics, e.g. opioids
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P29/00—Non-central analgesic, antipyretic or antiinflammatory agents, e.g. antirheumatic agents; Non-steroidal antiinflammatory drugs [NSAID]
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/33—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Clostridium (G)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/575—Hormones
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/575—Hormones
- C07K14/57572—Gastrin releasing peptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/575—Hormones
- C07K14/60—Growth hormone-releasing factor [GH-RF], i.e. somatoliberin
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K7/00—Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
- C07K7/04—Linear peptides containing only normal peptide links
- C07K7/18—Kallidins; Bradykinins; Related peptides
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K7/00—Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
- C07K7/04—Linear peptides containing only normal peptide links
- C07K7/23—Luteinising hormone-releasing hormone [LHRH]; Related peptides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
- C12N9/52—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/06—Fusion polypeptide containing a localisation/targetting motif containing a lysosomal/endosomal localisation signal
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/20—Fusion polypeptide containing a tag with affinity for a non-protein ligand
- C07K2319/21—Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a His-tag
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/50—Fusion polypeptide containing protease site
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/70—Fusion polypeptide containing domain for protein-protein interaction
- C07K2319/74—Fusion polypeptide containing domain for protein-protein interaction containing a fusion for binding to a cell surface receptor
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biochemistry (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Microbiology (AREA)
- Endocrinology (AREA)
- Gastroenterology & Hepatology (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Animal Behavior & Ethology (AREA)
- Pharmacology & Pharmacy (AREA)
- Toxicology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Pain & Pain Management (AREA)
- Neurosurgery (AREA)
- Neurology (AREA)
- Epidemiology (AREA)
- Anesthesiology (AREA)
- Urology & Nephrology (AREA)
- Rheumatology (AREA)
- Immunology (AREA)
- Peptides Or Proteins (AREA)
Abstract
본 발명은 비-세포독성 프로테아제, 전위 펩티드 및 표적화 모이어티 펩티드를 포함하고 상기 표적화 모이어티는 유리 N-말단 도메인 및 유리 C-말단 도메인을 갖는 표적화된 분비 억제제(Targeted Secretion Inhibitor)(TSI)의 새로운 클래스의 구성(construction) 및; 그의 단일-쇄 융합 단백질 전구체, 및 상기 단일-쇄 융합 단백질 전구체를 활성화시키는 방법에 관한 것이다.
Description
본 발명은 표적화된 분비 억제제(Targeted Secretion Inhibitor)(TSI)의 새로운 클래스의 구성(construction), 그의 활성화 방법, 및 활성화된 생성물에 관한 것이다.
비-세포독성 프로테아제(non-cytotoxic protease)는 세포 기능을 무력화하는 것에 의해 표적세포에 작용하는, 프로테아제의 잘 알려진 그룹이다. 중요하게, 비-세포독성 프로테아제는 그들이 작용하는 표적 세포를 죽이지 않는다. 비-세포독성 프로테아제의 가장 잘 알려진 예는 클로스티리디움 신경독소(clostridial neurotoxins)(예를 들면, DysportTM, NeuroblocTM, 및 BotoxTM와 같은 이름으로 판매되는 보툴리눔 신경독소(botulinum neurotoxin)) 및 IgA 프로테아제를 포함한다.
비-세포독성 프로테아제는 SNARE 단백질(예를 들면, SNAP-25, VAMP, 또는 신택신(syntaxin))로 알려진 세포내 수송 단백질(intracellular transport protein)을 단백질 분해-절단(proteolytically-cleaving)하는 것에 의해 작용한다 - Gerald K (2002) "Cell and Molecular Biology" (4th edition) John Wiley & Sons , Inc 참조. 약어 SNARE는 S oluble N SF A ttachment Re ceptor에서 유래하였으며, NSF는 N-에틸말레이미드-민강성 인자( N -ethylmaleimide- S ensitive F actor)를 의미한다. SNARE 단백질은 세포내 소포(vesicle) 형성에 필수적이고, 따라서 세포의 소포 수송을 통한 분자의 분비에 필수적이다. 따라서, 원하는 표적 세포에 전달된 후, 비-세포독성 프로테아제는 표적 세포의 세포 분비를 억제할 수 있다.
비-세포독성 프로테아제는 그들의 원시(native) 형태 또는 실질적인 원시 형태(즉, DysportTM, NeuroblocTM, 및 BotoxTM의 경우에서와 같은 홀로톡신(holotoxin))로 이용될 수 있고, 특정 세포-타입에 대한 프로테아제의 표적화인 경우에는 (i) 프로테아제의 국소적인 투여에 의지하거나 및/또는 (ii) 원시 프로테아제의 내재된 결합 능력에 의존한다. 대안적으로, 비-세포독성 프로테아제는 원시 프로테아제가 표적화 모이어티(Targeting Moiety)(TM)로 알려진 외인성 리간드를 포함하도록 변형된 재-표적화된(re-targeted) 형태로 이용될 수 있다. TM은 원하는 표적 세포에 결합 특이성을 제공하도록 선택되고, 재-표적화 과정의 일부로서, 비-세포독성 프로테아제의 원시 결합 부분이 제거될 수 있다.
본 출원인은 클로스트리디움 신경 독소-기반 재-표적화 기술의 개념 및 개발을 개척하였으며, 결과적으로 수득된 융합 단백질은 표적화된 분비 억제제(Targeted Secretion Inhibitor)(TSI)로 알려져 있다.
TM 치환은 당업자에게 잘 알려진, 종래의 화학적 컨쥬게이션 기법(chemical conjugation technique)에 의해 수행될 수 있다. 이와 관련하여, Hermanson, G.T. (1996), Bioconjugate techniques, Academic Press 및 Wong, S.S. (1991), Chemistry of protein conjugation and cross-linking, CRC Press를 참조한다.
그러나, 화학적 컨쥬게이션은 종종 부정확하다. 예를 들면, 컨쥬게이션 후, TM은 둘 이상의 부착 부위(attachment site)에서 컨쥬게이트(conjugate)의 나머지 부분과 결합(join)될 수 있다. 화학적 컨쥬게이션은 또한 제어하기 어렵다. 예를 들면, TM은 프로테아제 성분(component) 및/또는 전위(translocation) 성분의 부착 부위에서 변형된 독소의 나머지 부분에 결합될 수 있다. 치료 효과를 위해서 상기 구성요소 중 한 부분(바람직하게는 단일 부위)에서의 부착이 요구되는 경우, 문제가 된다. 따라서, 화학적 컨쥬게이션은 변형된 독소 분자의 혼합된 집단을 초래하고, 이는 바람직하지 않다.
화학적 컨쥬게이션에 대한 대안으로, TM 치환은 단일-쇄(single-chain) 폴리펩티드 융합 단백질의 재조합 제조(preparation)에 의해 영향을 받을 수 있다. 이러한 분자의 제조는 WO98/07864에 기술되어 있다. 그러나, 본 발명자는 WO98/07864의 방법이 TM의 모든 타입에 적합한 것은 아니라는 것을 확인하였다.
WO98/07864에 대한 대안적인 시스템은 WO2006/059093에 기술되어 있다. WO2006/059093에 따르면, TM은 단일-쇄 융합 단백질 내에서 비-세포독성 프로테아제 성분과 전위 도메인 성분 사이에, 중앙에 제시된다(centrally-presented)(CP). 이는 하기의 구조를 갖는 단일-쇄 융합 단백질이 된다:
NH2 - [프로테아제 성분] - [TM] - [전위 성분] - COOH
전술된 융합 단백질은 프로테아제 성분의 C-말단에 위치한 부위를 절단하는 프로테아제의 처리에 의해 활성화된다. 이 활성화 과정은 융합 단백질의 전위 성분에 공유결합으로 (이황화 결합을 통해) 부착된 프로테아제 성분을 포함하는 이중-쇄(di-chain) 단백질을 생성한다. WO2006/059093의 경우, 생성된 이중-쇄 분자는 전위 도메인 성분의 N-말단에 그의 C-말단을 통해 펩티드-결합된 TM을 갖는다. 따라서, TM의 N-말단 부분은 그 후 원하는 수용체와의 상호작용 및 결합이 자유롭다. 이 배열(arrangement)은 TM의 수용체에 결합하기 위하여 유리 N-말단 또는 유리 N-말단 부분이 필요한 TM의 클래스에서 중요하다.
예로서, 단백질분해에 의한 활성화 후, WO2006/059093은 하기의 이중-쇄 형태(conformation)를 갖는 폴리펩티드를 제공한다:
NH2-[프로테아제 성분] [TM]-[전위 성분]-COOH
└───────────┘
상기 이중-쇄 형태에서, TM 및 전위 성분은 단일-쇄 융합 단백질의 형태로 나타나고, 상기 TM의 C-말단은 전위 성분의 N-말단에 펩티드-결합된다.
본 발명자는 WO98/07864 및 WO2006/059093에 기술된 시스템이 TM의 모든 타입의 제시(presentation)에 대해 최적인 것은 아니라고, 따라서, 의도된 표적 세포에 대해 원하지 않는/감소된 결합 능력을 갖는 융합 단백질의 생성을 초래할 수 있다는 것을 확인하였다.
따라서 TSI 구성에 대한 대안적인 또는 개선된 시스템에 대한 요구가 존재한다.
본 발명은 하기를 포함하는, 단일-쇄, 폴리펩티드 융합 단백질을 제공하여 앞서 언급된 문제들 중 하나 이상을 해결한다:
(a) 비-세포독성 프로테아제 또는 그의 단편으로서, 상기 프로테아제 또는 프로테아제 단편은 표적 세포의 엑소사이토시스 융합 기구(exocytic fusion apparatus) 단백질을 절단(cleaving)할 수 있는 것인, 비-세포독성 프로테아제 또는 그의 단편;
(b) 표적 세포의 결합 부위에 결합할 수 있는 표적화 모이어티(targeting moiety)로서, 상기 결합 부위는 표적 세포 내 엔도좀(endosome)에 통합되어 엔도사이토시스(endocytosis)를 수행할 수 있는 것인 표적화 모이어티;
(c) 상기 프로테아제 또는 프로테아제 단편을 엔도좀 내로부터 엔도좀 막을 거쳐 표적 세포의 세포질로 전위시킬 수 있는 전위(translocation) 도메인;
(d) 상기 융합 단백질이 제 1 프로테아제에 의해 절단되는, 제 1 프로테아제 절단 부위로서, 상기 제 1 프로테아제 절단 부위(cleavage site)는 상기 비-세포독성 프로테아제와 상기 전위 도메인 사이에 위치하는 것인 제 1 프로테아제 절단 부위;
(e) 상기 융합 단백질이 제 2 프로테아제에 의해 절단되는, 제 2 프로테아제 절단 부위로서, 상기 제 2 프로테아제 절단 부위는 상기 전위 도메인과 상기 표적화 모이어티 사이에 위치하는 것인 제 2 프로테아제 절단 부위; 및
(f) 상기 표적화 모이어티와 상기 전위 도메인 사이의 공유결합으로서, 상기 제 2 프로테아제 절단 부위에서 단백질 분해에 의한 절단 후 상기 표적화 모이어티가 상기 공유 결합에 의해 전위 도메인에 연결된 상태를 유지하는 것인 공유 결합.
WO2006/059093에 기술된 시스템은 표적 세포의 결합 부위와 자유롭게 상호작용하는 N-말단이 있는 TM을 갖는 TSI를 제공한다. 그러나, 본 발명자는 WO2006/059093에 기술된 시스템이 표적 세포의 결합 부위와 상호작용하기 위하여 유리 N-말단 도메인과 유리 C-말단 도메인 모두를 요구하는 TM에 적합하지 않다는 것을 발견하였다.
따라서, WO2006/059093과는 대조적으로, 본 발명은 TM 성분이 유리 N-말단 도메인과 유리 C-말단 도메인 모두를 갖는 것인, TSI를 제공하기 위한 시스템을 제공한다.
일 구체예에서, 본 발명은 P1 및 P2는 제 1 및 제 2 프로테아제 절단 부위를 나타내는 것인 하기의 N-말단에서 C-말단으로의 배향을 갖는 단일-쇄 융합 단백질을 제공한다:
NH2-[프로테아제 성분] - [P1] - [TM] - [P2] -[전위 성분]-COOH
제 1 및 제 2 절단 부위에서 절단 후, 상기 단일-쇄 융합 단백질은 상기 TM 및 상기 전위 성분이 서로 공유결합으로 연결된, 하기의 삼중-쇄(tri-chain) 구조를 취하고, 이 구조에서,
A) 상기 프로테아제 성분은 상기 TM 성분과 공유 결합으로 연결되거나:
┌────┐
NH2-[프로테아제 성분] [TM] [전위 성분]-COOH
└──────────┘
또는 B) 상기 프로테아제 성분은 상기 전위 성분과 공유 결합으로 연결된다:
┌────┐
NH2-[프로테아제 성분] [TM] [전위 성분]-COOH
└────────────────┘
또 다른 구체예에서, 본 발명은 하기의 N-말단에서 C-말단으로 배향을 갖는 단일-쇄 융합 단백질을 제공하고, P1 및 P2는 제 1 및 제 2 프로테아제 절단 부위를 나타낸다:
NH2-[프로테아제 성분] - [P1] - [전위 성분] - [P2] - [TM] -COOH
제 1 및 제 2 절단 부위에서 절단 후, 상기 단일-쇄 융합 단백질은 상기 TM 및 상기 전위 성분이 서로 공유 결합으로 연결된, 하기의 삼중-쇄(tri-chain) 구조를 취하고, 이 구조에서,
A) 상기 프로테아제 성분은 상기 전위 성분과 공유 결합으로 연결되거나:
┌─────┐
NH2-[프로테아제 성분] - [전위 성분] - [TM] -COOH
└─────────┘
또는 B) 상기 프로테아제 성분은 상기 TM 성분과 공유 결합으로 연결된다:
┌──────┐
NH2-[프로테아제 성분] - [전위 성분] - [TM] -COOH
└───────────────┘
또 다른 구체예에서, 본 발명은 하기의 N-말단에서 C-말단으로 배향을 갖는 단일-쇄 융합 단백질을 제공하고, P1 및 P2는 제 1 및 제 2 프로테아제 절단 부위를 나타낸다:
NH2- [TM] - [P2] - [프로테아제 성분] - [P1] - [전위 성분] -COOH
제 1 및 제 2 절단 부위에서 절단 후, 상기 단일-쇄 융합 단백질은 상기 TM 및 상기 전위 성분이 서로 공유 결합으로 연결된, 하기의 삼중-쇄(tri-chain) 구조를 취하고, 이 구조에서,
A) 상기 프로테아제 성분은 상기 전위 성분과 공유 결합으로 연결되거나:
┌──────────────┐
NH2- [TM] - [프로테아제 성분] - [전위 성분] -COOH
└────────┘
또는 B) 상기 프로테아제 성분은 상기 TM 성분과 공유 결합으로 연결된다:
┌──────────────┐
NH2- [TM] - [프로테아제 성분] - [전위 성분] -COOH
└──────┘
이용에서, 본 발명의 폴리펩티드 TSI는 표적 세포에 결합하고, 이 결합은 TM에 의해 촉진된다. 그 후 전위 도메인 성분은 비-세포독성 프로테아제 성분의 표적 세포의 세포질로의 전달을 수행한다. 일단 내부로 전달된 후, 비-세포독성 프로테아제 성분은 표적 세포의 엑소사이토시스 융합(exocytic fusion) 과정을 억제한다. 따라서, 표적 세포의 엑소사이토시스 융합 기구(exocytic fusion apparatus)를 불활성화시키는 것에 의해, 본 발명의 폴리펩티드는 그로부터의 분비를 억제한다. 따라서, 본 발명의 TSI 폴리펩티드는 세포 분비와 관련된 다양한 병태생리학적 상태 또는 증상을 억제하거나 치료하는데 이용될 수 있다.
비-세포독성 프로테아제
본 발명의 TSI 폴리펩티드의 생물학적 활성 성분은 비-세포독성 프로테아제이다. 따라서, 표적 세포의 세포질로 전달된 후에, 비-세포독성 프로테아제 성분은 원하는 표적 세포 내에서 SNARE 절단을 수행한다. SNARE 단백질은 포유류 표적 세포 내에서 분비 과정의 필수적인 구성 성분이기 때문에, 그의 단백질 분해에 의한 불활성화는 상기 표적 세포로부터의 분비를 억제/저지한다.
비-세포독성 프로테아제는 세포를 죽이지 않는 분자의 별개의 클래스이다; 대신에, 이들은 단백질 합성이 아닌 세포 과정(cellular process)을 억제하여 작용한다. 비-세포독성 프로테아제는 다양한 고등 생물(예를 들면, 식물 및 동물)에 의해 생성된다 - 이러한 고등 생물의 예는 브라질 전갈이다. 또한, 비-세포독성 프로테아제는 다양한 미생물, 특히 클로스트리디움 속(Clostridium sp.) 및 네이세리아 속(Neisseria sp.)과 같은 박테리아에 의해 생성된다.
클로스트리디움 신경독소는 비-세포독성 독소 분자의 주된 그룹을 대표하며, 이황화 결합에 의해 서로 결합된 두 개의 폴리펩티드 사슬로 이루어진다. 두 개의 사슬은 약 100 kDa의 분자량을 갖는 중쇄(H-chain), 및 약 50 kDa의 분자량을 갖는 경쇄(L-chain)로 지칭된다. 프로테아제 기능을 보유하고 엑소사이토시스 과정(exocytic process)에 관여하는, 소포 및/또는 세포막 결합(plasma membrane associated) (SNARE) 단백질(예를 들면, 시냅토브레빈(synaptobrevin), 신택신(syntaxin), SNAP 및/또는 VAMP)에 대한 높은 기질 특이성을 나타내는 것은 경쇄이다. 이러한 기질은 세포의 분비 기구의 중요한 구성성분이다.
네이세리아 속, 특히 네이세리아 고노리아(N. gonorrhoeae) 종은 기능적으로 유사한 비-세포독성 독소 분자를 생성한다. 이러한 비-세포독성 프로테아제의 예는 IgA 프로테아제이다(WO99/58571 참조). 유사한 IgA 프로테아제는 폐렴 연쇄구균(Streptococcus pneumoniae)과 같은 연쇄상구균(Streptococci)에 의해 생성된다.
따라서, 일 구체예에서, 본 발명의 비-세포독성 프로테아제는 클로스트리디움 신경독소 프로테아제 또는 IgA 프로테아제일 수 있다(예를 들면, WO 99/032272 참조). 또 다른 비-세포독성 프로테아제의 예는 브라질 전갈 티티우스 세룰라투스(Tityus serrulatus)의 독으로부터의 프로테아제, 또는 프로테아제 안타레아제(antarease)와 같은 전갈 독 프로테아제이다(예를 들면, WO 2011/022357 참조).
표적화
모이어티(
TM
)
본 발명의 TM 성분은 본 발명의 폴리펩티드의 표적 세포의 결합 부위로의 결합을 담당한다. 따라서, TM 성분은 본 발명의 폴리펩티드를 선택된 표적 세포에 결합시키는 리간드이다.
본 발명에서, 표적 세포는 포유동물(바람직하게는 인간) 세포일 수 있다. 따라서, TM은 비-신경 세포(non-neuronal cell) 및/또는 신경 세포에 결합할 수 있다.
본 발명의 폴리펩티드의 TM 성분은 유리 N-말단 부분 및 유리 C-말단 부분 모두를 갖는다. 따라서, 일 구체예에서, TM은 표적화 모이어티의 N-말단 부분과 결합 부위의 도메인 사이의 상호작용을 통해 표적 세포의 결합 부위(예를 들면 수용체(receptor 또는 acceptor))와 상호작용할 수 있다. 또 다른 구체예에서, TM은 표적화 모이어티의 C-말단 부분과 결합 부위의 도메인 사이에서 상호작용할 수 있다. 또 다른 구체예에서, TM은 표적화 모이어티의 N-말단 부분이 결합 부위의 도메인과 상호작용하고 표적화 모이어티의 C-말단 부분이 결합 부위의 도메인과 상호작용하는, 이중 상호작용을 할 수 있다. 후자의 구체예에서, TM의 N- 및 C-말단 부분은 결합 부위의 동일한 도메인 또는 상이한 도메인에 결합할 수 있고, 및/또는 상이한 결합 부위의 도메인에 결합할 수 있다.
본 발명의 폴리펩티드에 이용하기 적절한 TM은 사이토카인, 성장인자, 뉴로펩티드, 렉틴 및 항체를 포함하고 - 용어 항체는 단클론 항체, 단백질 결합 스캐폴드(scaffold), Fab, F(ab)'2, Fv, ScFv와 같은 항체 단편 및 카멜리드(camelid)와 같은 단일-쇄 항체 등을 포함한다.
일 구체예에서, TM 성분은 표적 세포에 존재하는 수용체에 결합하는 펩티드 리간드(예를 들면 펩티드 호르몬)를 포함하거나 또는 그로 구성된다. 일 구체예에서, 펩티드 리간드는 5-200개의 연속적인 아미노산 잔기의 아미노산 서열을 갖는다. 예로서, 상기 펩티드 리간드는 5-150개 또는 5-100개 또는 5-50개 또는 5-40개 또는 5-30개 또는 5-25개 또는 5-20개 또는 7-12개의 연속적인 아미노산 잔기 또는 약 10개의 연속적인 아미노산 잔기로 구성되거나 그를 포함한다.
TM 성분은 N-말단 부분 및 C-말단 부분을 포함한다. 각각의 상기 부분은 일반적으로 5개 이상, 10개 이상, 15개 이상, 20개 이상 또는 25개 이상의 연속적인 아미노산 잔기를 포함한다.
일 구체예에서, TM은 MRGPRX1(예를 들면 소 부신 수질(Bovine Adrenal Medulla, BAM) 펩티드 수용체), 오피오이드 펩티드 수용체(opioid peptide receptor), OPRM1 또는 OPRD1(예를 들면, 베타-엔돌핀(beta-endorphin) 펩티드 수용체), BDKRB1 또는 BDKRB2(예를 들면, 브래디키닌 펩티드 수용체), OPRM1 또는 OPRD1(예를 들면, met-엔케팔린(met-enkephalin) 또는 leu-엔케팔린(leu-enkephalin) 펩티드 수용체), OPRK1(예를 들면, 디놀핀(dynorphin) 펩티드 수용체), GALR1, GALR2 또는 GALR3(예를 들면, 갈라닌(galanin) 펩티드 수용체), OPRL1(예를 들면, 노시셉틴(nociceptin) 펩티드 수용체), 및 TACR1, TACR2, TACR3(예를 들면, P 물질(substance P) 펩티드 수용체)로부터 선택되는 수용체에 결합하는 펩티드 리간드(또는 그의 유사체)를 포함하거나 또는 그로 구성된다.
일 구체예에서, TM은 소 부신 수질(BAM) 펩티드, 오피오이드 펩티드, 베타-엔돌핀 펩티드, 브래디키닌 펩티드, met-엔케팔린 또는 leu-엔케팔린, 디놀핀 펩티드, 갈라닌 펩티드, 노시셉틴 펩티드, 및 P 물질 펩티드로부터 선택되는 펩티드 리간드로 포함하거나 또는 그로 구성된다.
일 구체예에서, TM은 성선자극호르몬-분비 호르몬(gonadotropin-releasing hormone, GnRH) 펩티드를 포함하거나 또는 그로 구성된다. GnRH는 10개의 아미노산으로 이루어진 펩티드 호르몬(10 amino acid peptide hormone)이다. GnRH의 N-말단 아미노산은 수용체 활성화의 역할을 가지나 반면, C-말단 아미노산은 GnRH 수용체로의 고 친화도 결합을 위해 요구된다(Flanagan, Millar & Illing (1997) Reviews of Reproduction, 2, 113-120 참조, 참조에 의해 그 전체가 본 명세서에 완전히 통합된다). 인 비보(in vivo)에서 GnRH의 기능은 뇌하수체 전엽에 위치한 GnRH 수용체에 작용하고 황체 호르몬(luteinising hormone, LH) 및 난포 자극 호르몬(follicle-stimulating hormone, FSH)과 같은 성선자극호르몬의 합성 및 분비를 자극하는 것이다. GnRH 펩티드의 지칭은 모든 그의 기능적 결합 단편, 및 변이체(variant) 및 유사체를 포함한다. 예로서, 용어 GnRH 펩티드는 (글리신(glycine) 및/또는 알라닌(alanine)과 같은 두 개의 아키랄(achiral) 아미노산 잔기에 의해 플랭크된(flanked)) 시스테인(cysteine) 아미노산이 GnRH 펩티드의 6번 아미노산의 치환으로 삽입된 것인 GnRH 펩티드를 포함한다. GnRH는 또한 황체 호르몬 분비 호르몬(LHRH)으로도 알려져 있다. 다른 예는 전장 92개의 아미노산으로 이루어진 GnRH 전구체 폴리펩티드 및 그의 절단물(truncation) 뿐만 아니라, GnRHI 펩티드, GnRHII 펩티드 및 GnRHIII 펩티드를 포함한다.
일 구체예에서, TM은 코르티코트로핀-분비 인자(Corticotrophin-releasing factor, CRF) 펩티드를 포함하거나 또는 그로 구성된다. CRF는 CRF1 및 CRF2 수용체와 상호작용하는 아미노산 41개의 시상하부 펩티드 호르몬이다. 인 비보에서 CRF의 주 기능은 뇌하수체 전엽 내 부신피질자극세포(corticotrope)에서 ACTH의 분비를 자극하는 것이다. CRF 펩티드에 대한 지침은 전장 CRF, 유로코르틴 1(urocortin 1) 및 유로코르틴 2(urocortin 2) 및 그의 모든 기능적 결합 단편, 변이체 및 유사체를 포함한다.
일 구체예에서, TM은 가스트린 분비 펩티드(gastrin releasing peptide, GRP)를 포함하거나 또는 그로 구성된다. GRP는 위장관 호르몬의 분비, 평활근 세포의 수축, 및 상피세포의 증식을 포함한, 위장관 및 중추 신경계의 여러 기능을 조절하고 종양 조직(neoplastic tissue)에 대한 강력한 유사분열물질(mitogen)이다. GRP 펩티드에 대한 지침은 그의 모든 기능적 결합 단편, 변이체 및 유사체를 포함한다.
일 구체예에서, TM은 뉴로메딘 B(neuromedin B)를 포함하거나 또는 그로 구성된다. 뉴로메딘 B는 아미노산 10개로 이루어진 펩티드 호르몬이다. 뉴로메딘 B의 기능은 인 비보에서 BB1 수용체에 작용하고 정상 및 종양인 폐와 위장관 상피 조직에 대한 강력한 유사분열물질이며 성장인자이다. 뉴로메딘 B 펩티드에 대한 지침은 그의 모든 기능적 결합 단편, 변이체 및 유사체를 포함한다. 뉴로메딘 B 펩티드에 대한 지침은 인간 상동 펩티드(homolog peptide), 봄베신(bombesin)을 포함하고, 전장: 봄베신 - 개구리의 피부에서 처음으로 단리된 아미노산 14개의 펩티드- 및 그의 절단물 및 펩티드 유사체를 포함한다.
일 구체예에서, TM은 가스트린 또는 콜레시스토키닌(cholecystokinin, CCK)을 포함하거나 또는 그로 구성된다. 가스트린은 17개의 아미노산으로 이루어진 펩티드 호르몬이고, CCK는 8개의 아미노산으로 이루어진 펩티드 호르몬이다. 가스트린 및 콜레시스토키닌 모두 인 비보에서 위장관계 및 중추신경계 내 CCK1 및 CCK2 수용체에 주로 작용하여 췌장 효소의 분비 및 담낭 및 위의 평활근 수축, 불안, 진통, 각성(arousal) 및 신경이완 활성을 조절한다. 가스트린 및 콜레시스토키닌 펩티드에 대한 지침은 그의 모든 기능적 결합 단편, 변이체 및 유사체를 포함한다.
일 구체예에서, TM은 소마토스타틴(SST) 펩티드를 포함하거나 또는 그로 구성된다. 적절한 SST 펩티드 TM의 예는 BIM 23052, BIM 23056 또는 BIM23268; 옥트레오타이드(octreotide) 펩티드, 란레오타이드(lanreotide) 펩티드, BIM23027, CYN154806, BIM23027, 바프레오타이드(vapreotide) 펩티드, 세글리타이드(seglitide) 펩티드, 및 SOM230와 같은 전장 SST 및 코르티스타틴(cortistatin, CST) 및 그의 절단물 및 펩티드 유사체를 포함한다. 이러한 TM은 sst1, sst2, sst3, sst4 및 sst5 수용체와 같은 sst 수용체에 결합한다. SST 및 CST는 높은 구조적 상동성을 갖고, 모든 공지된 sst 수용체에 결합한다. SST 또는 CST에 대한 지침은 그의 모든 기능적 결합 단편, 변이체 및 유사체를 포함한다.
일 구체예에서, TM은 성장호르몬 분비 호르몬(GHRH) 펩티드를 포함하거나 또는 그로 구성된다. GHRH는 또한 성장-호르몬-분비 인자(GRF 또는 GHRF) 또는 소마토크리닌(somatocrinin)으로 알려져 있다. 적절한 GHRH 펩티드는 전장 GHRH(1-44) 펩티드, 및 GHRH(1-27, 1-28, 1-29), GHRH(1-37), 및 GHRH(1-40, 1-43)-OH와 같은 그의 절단물 및 BIM 28011 또는 NC-9-96과 같은 펩티드 유사체를 포함한다. GHRH 펩티드에 대한 지침은 그의 모든 기능적 결합 단편, 변이체 및 유사체를 포함한다.
일 구체예에서, TM은 프로테이나제 활성화 수용체(proteinase activated receptor, PAR) 펩티드, 예를 들면 PAR1을 포함하거나 또는 그로 구성된다. PAR 펩티드는 고정된(tethered) 활성화 리간드로 작용하는, 새로운 세포외(extracellular) N-말단을 노출시키기 위해 단백질 분해에 의해 변형된다는 점에서 7-막관통 수용체 G-단백질-커플링 수용체(7-transmembrane receptor G-protein-coupled receptor)의 고유의 서브타입을 나타낸다. 그의 동족 수용체(cognate receptor)를 활성화시키는 PAR1 작용제(예를 들면 TFLLR)가 확인되었다. PAR 펩티드에 대한 지침은 그의 모든 기능적 결합 단편, 변이체 및 유사체를 포함한다.
일 구체예에서, TM은 부갑상선 호르몬(PTH)을 포함하거나 또는 그로 구성된다. PTH는 부갑상선에 의해 분비되고 PTH-1 수용체에 결합하는 펩티드이다. 이 수용체는 널리 분포되어 있으나 특히 PTH 표적 조직, 주로 신장과 뼈에 풍부하다. PTH 펩티드에 대한 지침은 그의 모든 기능적 결합 단편, 그의 변이체 및 유사체를 포함한다.
일 구체예예서, TM은 점액-분비 세포, 또는 점액 분비를 조절하거나 지시하는 신경 세포에 결합하는 펩티드를 포함하거나 또는 그로 구성된다. 예를 들면, TM은 (a) 상피 배상 세포(goblet cell) 및 점막하 선(gland) 점액 분비 세포와 같은, 뮤신(mucin)을 분비하는 세포, (b) 세기관지 세포(Clara cell) 및 장액 세포와 같은 점액의 수용성 성분을 분비하는 세포, 및/또는 (c) "원심성-감각" C-신경섬유("sensory-efferent" C-fiber), 또는 NANC 신경계 섬유와 같은 점액 분비를 조절하거나 지시하는 세포에 결합한다. 하기의 펩티드 TM이 구체적으로 언급된다: VIP; 베타2 아드레날린수용체 작용제; 가스트린-분비 펩티드; 및 칼시토닌 유전자 관련 펩티드(calcitionin gene related peptide). 이러한 펩티드 TM에 대한 지침은 그의 모든 기능적 결합 단편, 변이체 및 유사체를 포함한다. 따라서, 본 구체예에 따른 TSI는 점액 과분비, 천식 및/또는 만성 폐쇄성 폐질환 치료에 치료적 적용(therapeutic application)을 갖는다.
또 다른 구체예에서, TM은 내분비 세포에 결합하는 펩티드를 포함하거나 또는 그로 구성된다. GHRH; 갑상선 자극 호르몬(TSH); 인슐린; 인슐린-유사 성장 인자(insulin-like growth factor); TSH 분비 호르몬(프로티렐린)(protirelin); FSH/LH 분비 호르몬(고나도렐린)(gonadorelin); 코르티코트로핀 분비 호르몬(corticotrophin releasing hormone, CRH); 및 ACTH가 구체적으로 본 명세서에서 언급된다. 이러한 TM 펩티드에 대한 지침은 그의 모든 기능적 결합 단편, 그의 변이체 및 유사체를 포함한다. 따라서, 본 구체예에 따른 TSI는 MEN을 포함한 내분비 종양; 갑상선중독증(thyrotoxicosis) 및 갑상선의 과다분비에 따른 기타 질환; 말단비대증, 고프로락틴혈증, 쿠싱병 및 뇌하수체 전엽의 과다분비에 따른 기타 질환; 고안드로겐증, 만성 무배란 및 다낭성 난소 증후군과 관련된 기타 질환 치료에 치료적 적용을 갖는다.
또 다른 구체예에서, TM은 염증 세포에 결합하는 펩티드를 포함하거나 또는그로 구성된다. (i) Fc IgE의 C4 도메인과 같은, 비만 세포(mast cell)에 대한 펩티드 TM; (ii) C3a/C4a-R 보체 수용체에 대한 리간드, CR4 보체 수용체에 대하여 반응하는 항원과 같은, 호산구에 대한 펩티드 TM; (iii) 마크로파지 자극 인자와 같은, 마크로파지 및 단핵구에 대한 펩티드 TM, (iv) iC3b 보체 수용체 또는 IL8과 연관된 항원과 같은, 호중구에 대한 펩티드 TM이 구체적으로 본 명세서에서 언급된다. 이러한 펩티드 TM에 대한 지침은 그의 모든 기능적 결합 단편, 변이체 및 유사체를 포함한다. 따라서, 본 구체예에 따른 TSI는 알레르기(계절성 알레르기 비염(건초열), 알레르기 결막염, 혈관운동성 비염 및 식품 알레르기), 호산구 증가증, 천식, 류마티스 관절염, 전신성 홍반성 루푸스, 원판상 홍반성 루푸스, 궤양성 대장염, 크론병, 치질, 가려움증, 사구체신염, 간염, 췌장염, 위염, 혈관염, 심근염, 건선, 습진, 만성 방사선-유발 섬유증, 폐 흉터 형성 및 기타 섬유성 질환 치료에 치료적 적용을 갖는다.
또 다른 구체예에서, TM은 외분비 세포에 결합하는 펩티드를 포함하거나 또는 그로 구성된다. 뇌하수체 아데닐 사이클라아제 활성화 펩티드(PACAP-38)가 구체적으로 본 명세서에서 언급된다. 이러한 펩티드 TM에 대한 지침은 그의 모든 기능적 결합 단편, 변이체 및 유사체를 포함한다. 따라서, 본 구체예에 따른 TSI는 소화관에 위치한, 구체적으로 결장에 위치한 점액-분비 세포의 점액 과다분비 치료에 치료적 적용을 갖는다.
다른 구체예에서, TM은 면역세포에 결합하는 펩티드를 포함하거나 또는 그로 구성된다. 엡스타인 바(Epstein Barr) 바이러스 단편/표면 부분(surface feature)과 같은 리간드가 본 명세서에서 언급된다. 이러한 펩티드 TM에 대한 지침은 그의 모든 기능적 결합 단편, 변이체 및 유사체를 포함한다. 따라서, 본 구체예에 따른 TSI는 중증근무력증, 류마티스 관절염, 전신성 홍반성 루푸스, 원판상 홍반성 루푸스, 장기이식, 조직 이식, 체액(fluid) 이식, 그레이브스병, 갑상선 중독증, 자가면역성 당뇨, 용혈성 빈혈, 혈소판감소성 자반병, 호중구 감소증, 만성 자가면역 간염, 자가면역성 위염, 악성빈혈, 하시모토 갑상선염, 애디슨 병, 쇼그렌 증후군, 원발성 담즙성 간경변, 다발성근염, 피부경화증, 전신성 경화증, 심상성 천포창, 수포성 유천포창, 심근염, 류마티스 심장염, 사구체신염(굿파스처 타입), 포도막염, 고환염, 궤양성 대장염, 혈관염, 위축성 위염, 악성빈혈, 제1형 당뇨의 치료에 치료적 적용을 갖는다.
다른 구체예에서, TM은 심혈관 세포에 결합하는 펩티드를 포함하거나 또는 그로 구성된다. 트롬빈 및 TRAP(thrombin receptor agonist peptide), GP1b 표면 항원-인식 항체와 같은 심혈관 내피 세포에 결합하는 리간드가 본 명세서에서 언급된다. 이러한 펩티드 TM에 대한 지침은 그의 모든 기능적 결합 단편, 변이체 및 유사체를 포함한다. 따라서, 본 구체예에 따른 TSI는 심혈관 질환 및/또는 고혈압의 치료에 치료적 적용을 갖는다.
다른 구체예에서, TM은 골 세포에 결합하는 펩티드를 포함하거나 또는 그로 구성된다. 칼시토닌을 포함한, 골화석증 및 골다공증으로부터 선택되는 질환의 치료를 위해 조골세포에 결합하는 리간드, 및 파골세포 분화 인자(예를 들면, TRANCE, 또는 RANKL 또는 OPGL)를 포함한, 파골세포에 결합하는 리간드가 본 명세서에서 언급된다. 이러한 펩티드 TM에 대한 지침은 그의 모든 기능적 결합 단편, 변이체 및 유사체를 포함한다. 따라서, 본 구체예에 따른 TSI는 골 질환 치료에 치료적 적용을 가진다.
선형 및 고리형 인테그린 결합 서열은 본 발명의 펩티드 TM의 또 다른 그룹을 나타낸다. 다수의 인테그린이 삼중 Arg-Gly-Asp(RGD) 펩티드 서열을 인식한다(Ruoslahti, 1996). RGD 모티프는 피브로넥틴(fibronectin), 테나신(tenascin), 피브리노겐(fibrinogen) 및 비트로넥틴(vitronectin)을 포함한, 100개 이상의 단백질에서 발견된다. RGD-인테그린 상호작용은 콕사키바이러스(coxsackievirus) (Roivaninen 등, 1991) 및 아데노바이러스(adenovirus)(Mathias 등, 1994)를 포함한, 다수의 병원균에 의해 보존된 세포 침투의 메커니즘으로 이용된다. 선형 및 고리형 펩티드 서열인, PLAEIDGIEL 및 CPLAEIDGIELC 각각은 α9β1 인테그린을 발현하는 세포에서 DNA에 결합하고 내재화(internalise)시키는 것으로 확인되었다(Schneider 등, 1999). 이러한 펩티드 TM에 대한 지침은 그의 모든 기능적 결합 단편, 변이체 및 유사체를 포함한다.
본 발명의 기타 TM은 파지 디스플레이 기법에 의해 발견된 것들, 구체적으로 인간 기도 상피 세포를 표적화하고 그에 의해 내재화되는 것들을 포함한다. 이들은 선형 및 고리형 THALWHT(Jost 등, 2001); LEBP-1 (QPFMQCLCLIYDASC), LEBP-2 (RNVPPIFNDVYWIAF) 및 LEBP-3 (VFRVRPWYQSTSQS) (Wu 등, 2003); CDSAFVTVDWGRSMSLC (Florea 등, 2003); SERSMNF, YGLPHKF, PSGAARA, LPHKSMP, LQHKSMP (Writer 등, 2004); FSLSKPP, HSMQLST 및 STQAMFQ 펩티드 (Rahim 등, 2003)를 포함한다. 이러한 펩티드 TM에 대한 지침은 그의 모든 기능적 결합 단편, 변이체 및 유사체를 포함한다.
일 구체예에서, TM은 제 1 및 제 2 부분(예를 들면, 도메인)을 포함하거나 또는 그로 구성된다. 일 구체예에서, 표적화 모이어티의 제 1 및 제 2 부분은 동일한 리간드(예를 들면, 앞서 확인된 TM 리간드 중 어느 하나)로부터 유래될 수 있다. 제 1 및 제 2 부분은 동일한 수용체의 동일한 부위 또는 상이한 부위에 결합할 수 있다. 대안적으로, 제 1 및 제 2 부분은 상이한 수용체의 부위에 결합할 수 있다.
표적화 모이어티의 제 1 및 제 2 부분은 동일한 또는 상이한 수용체에 결합할 수 있는 상이한 리간드(예를 들면, 앞서 확인된 TM 리간드 중 어느 하나)로부터 유래될 수 있다. 따라서, TM은 두 개의 TM의 하이브리드(hybrid)일 수 있다. 제 1 및 제 2 부분은 동일한 수용체의 동일한 부위 또는 상이한 부위에 결합할 수 있다. 대안적으로, 제 1 및 제 2 부분은 상이한 수용체의 부위에 결합할 수 있다.
TM은 다른 TM으로부터의 제 3 및/또는 그 후속 부분(예를 들면, 앞서 확인된 TM 리간드 중 어느 하나)을 더 포함할 수 있다.
일 구체예에서, 제 1 부분(예를 들면 도메인)은 그의 표적 수용체에 유리 N-말단 부분(예를 들면, 유리 N-말단)을 통해 결합하는 리간드를 포함하거나 또는 그로 구성된다. 이러한 리간드의 예는 오피오이드 수용체에 결합하는 리간드(예를 들면, 오피오이드 펩티드와 같은, ORL1 수용체에 결합하는 리간드)이다. 오피오이드 펩티드의 다른 예는 노시셉틴, 디놀핀, 베타-엔돌핀, 및 엔케팔린을 포함한다. 기타 비-오피오이드 펩티드 TM 리간드는 BAM, 갈라닌, P 물질, GnRH, CRF, GRP, 뉴로메딘 B, 봄베신, 가스트린, CCK, SST, CST, 및 GHRH 펩티드(및 그의 절단물, 변이체, 유사체)를 포함한다.
또 다른(또는 동일한) 구체예에서, 제 2 부분(예를 들면 도메인)은 그의 표적 수용체에 유리 C-말단 부분(예를 들면, 유리 C-말단)을 통해 결합하는 리간드를 포함하거나 또는 그로 구성된다. 이러한 리간드의 예는 브래디키닌 수용체에 결합하는 리간드(예를 들면, 브래디키닌 펩티드) 또는 P 물질 수용체에 결합하는 리간드(P 물질 펩티드)이다. 기타 펩티드 TM 리간드는 BAM, 갈라닌, P 물질, GnRH, CRF, GRP, 뉴로메딘 B, 봄베신, 가스트린, CCK, SST, CST, 및 GHRH 펩티드(및 그의 절단물, 변이체, 유사체뿐만 아니라)를 포함한다.
예로서, 하이브리드 TM은 노시셉틴 펩티드를 포함하거나 또는 그로 구성되는 제 1 부분 및 브래디키닌 펩티드(또는 P 물질 펩티드)를 포함하거나 또는 그로 구성되는 제 2 부분을 포함한다. 다른 예에서, 제 1 부분은 노시셉틴 펩티드를 포함하거나 또는 그로 구성되고 제 2 부분은 BAM 펩티드, 오피오이드 펩티드, 베타-엔돌핀 펩티드, 브래디키닌 펩티드, 엔케팔린 펩티드, 디놀핀 펩티드, 갈라닌 펩티드, 및 P 물질 펩티드로부터 선택되는 펩티드를 포함하거나 또는 그로 구성된다.
또 다른 예에서, 하이브리드 TM은 디놀핀 펩티드를 포함하거나 또는 그로 구성되는 제 1 부분 및 브래디키닌 펩티드(또는 P 물질 펩티드)를 포함하거나 또는 그로 구성되는 제 2 부분을 포함한다. 다른 예에서, 제 1 부분은 디놀핀 펩티드를 포함하거나 또는 그로 구성되고 제 2 부분은 BAM 펩티드, 오피오이드 펩티드, 베타-엔돌핀 펩티드, 브래디키닌 펩티드, 엔케팔린 펩티드, 노시셉틴 펩티드, 갈라닌 펩티드, 및 P 물질 펩티드로부터 선택되는 펩티드를 포함하거나 또는 그로 구성된다.
또 다른 예에서, 하이브리드 TM은 갈라닌 펩티드를 포함하거나 또는 그로 구성되는 제 1 부분 및 브래디키닌 펩티드(또는 P 물질 펩티드)를 포함하거나 또는 그로 구성되는 제 2 부분을 포함한다. 다른 예에서, 제 1 부분은 갈라닌 펩티드를 포함하거나 또는 그로 구성되고 제 2 부분은 BAM 펩티드, 오피오이드 펩티드, 베타-엔돌핀 펩티드, 브래디키닌 펩티드, 엔케팔린 펩티드, 노시셉틴 펩티드, 디놀핀 펩티드, 및 P 물질 펩티드로부터 선택되는 펩티드를 포함하거나 또는 그로 구성된다.
또 다른 예에서, 하이브리드 TM은 BAM 펩티드를 포함하거나 또는 그로 구성되는 제 1 부분 및 브래디키닌 펩티드(또는 P 물질 펩티드)를 포함하거나 또는 그로 구성되는 제 2 부분을 포함한다. 다른 예에서, 제 1 부분은 BAM 펩티드를 포함하거나 또는 그로 구성되고 제 2 부분은 오피오이드 펩티드, 베타-엔돌핀 펩티드, 브래디키닌 펩티드, 엔케팔린 펩티드, 노시셉틴 펩티드, 디놀핀 펩티드, 갈라닌 펩티드, 및 P 물질 펩티드로부터 선택되는 펩티드를 포함하거나 또는 그로 구성된다.
또 다른 예에서, 하이브리드 TM은 베타-엔돌핀 펩티드를 포함하거나 또는 그로 구성되는 제 1 부분 및 브래디키닌 펩티드(또는 P 물질 펩티드)를 포함하거나 또는 그로 구성되는 제 2 부분을 포함한다. 다른 예에서, 제 1 부분은 베타-엔돌핀 펩티드를 포함하거나 또는 그로 구성되고 제 2 부분은 오피오이드 펩티드, BAM 펩티드, 브래디키닌 펩티드, 엔케팔린 펩티드, 노시셉틴 펩티드, 디놀핀 펩티드, 갈라닌 펩티드, 및 P 물질 펩티드로부터 선택되는 펩티드를 포함하거나 또는 그로 구성된다.
또 다른 예에서, 하이브리드 TM은 엔케팔린(예를 들면, leu- 또는 met-엔케팔린) 펩티드를 포함하거나 또는 그로 구성되는 제 1 부분 및 브래디키닌 펩티드(또는 P 물질 펩티드)를 포함하거나 또는 그로 구성되는 제 2 부분을 포함한다. 다른 예에서, 제 1 부분은 엔케팔린 펩티드를 포함하거나 또는 그로 구성되고 제 2 부분은 오피오이드 펩티드, 베타-엔돌핀 펩티드, 브래디키닌 펩티드, BAM 펩티드, 노시셉틴 펩티드, 디놀핀 펩티드, 갈라닌 펩티드, 및 P 물질 펩티드로부터 선택되는 펩티드를 포함하거나 또는 그로 구성된다.
일 구체예에서, TM은 동일한(또는 유사한) 제 1 및 제 2 부분(예를 들면, 도메인)을 포함하거나 또는 그로 구성되고, 조합되어, 표적 세포의 수용체와 효과적인 상호작용을 제공한다. 다른(예를 들면, 제 3, 및 선택적으로 추가적인 부분 등) 동일한/ 유사한 부분이 또한 포함될 수 있다. 따라서, 본 구체예에서, 본 발명의 폴리펩티드는 동일한(또는 유사한) TM의 반복되는 구조(예를 들면, TM-TM; TM-TM-TM 등)를 포함한다.
이러한 반복되는 TM 구조(예를 들면, TM-TM; TM-TM-TM 등)의 예는 오피오이드 펩티드, 베타-엔돌핀 펩티드, 브래디키닌 펩티드, BAM 펩티드, 노시셉틴 펩티드, 디놀핀 펩티드, 갈라닌 펩티드, 엔케팔린 펩티드, 물질 P 펩티드, GnRH 펩티드, CRF 펩티드, GRP 펩티드, 뉴로메딘 B 펩티드, 봄베신 펩티드, 가스트린 펩티드, CCK 펩티드, SST 펩티드, CST 펩티드, GHRH 펩티드(및 그의 절단물, 변이체 및 유사체뿐만 아니라)로부터 선택되는 TM에 의해 제공된다.
일 구체예에서, TM의 제 1 및 제 2(및/또는 그 후속) 부분은 스페이서(spacer) 서열, 예를 들면 펩티드 서열에 의해 분리된다. 일 구체예에서, 제 1 및 제 2(및/또는 그 후속) 부분은 40개 이하 또는 35개 이하 또는 30개 이하 또는 25개 이하 또는 20개 이하 또는 15개 이하 또는 10개 이하 또는 5개 이하의 아미노산 잔기의 서열에 의해 분리될 수 있다. 일 구체예에서, 제 1 및 제 2(및/또는 그 후속) 부분은 4, 3, 2, 1 또는 0개의 아미노산 잔기의 서열에 의해 분리될 수 있다.
본 발명의 융합 단백질은 상응하는 '유리' TM(즉 단리된 TM 그 자체)과 비교하면 일반적으로 표적 세포에 대해 (100배까지의 범위로) 감소된 결합 친화성을 나타낸다. 그러나, 이러한 관측에도 불구하고, 본 발명의 융합 단백질은 놀랍게도 우수한 효능을 보인다. 이는 두 가지 주요 특징에서 기인할 수 있다. 첫째, 비-세포독성 프로테아제 성분은 촉매적이다 - 따라서, 이러한 분자의 치료 효과는 표적 세포내에서 신속하게 증폭된다. 둘째, 표적 세포 상에 존재하는 수용체는 치료제의 진입을 위한 관문(gateway)로서만 작용하면 되고, 리간드-수용체 매개 약리적 반응을 달성하기 위해 요구되는 수준으로 반드시 자극될 필요가 없다. 따라서, 본 발명의 융합 단백질은 일반적으로 마이크로그램에서 밀리그램(심지어 수백 밀리그램까지)의 고용량을 투여하는, 치료 분자의 다른 타입에 이용되는 것보다 낮은 용량으로 투여될 수 있다. 대조적으로, 본 발명의 융합 단백질은 훨씬 더 낮은 용량, 일반적으로 10배 이상 낮은, 더욱 일반적으로 100배 더 낮은 용량으로 투여될 수 있다.
전위 도메인(
translocation
domain
)
본 발명의 전위 성분은 표적 세포로 비-세포독성 프로테아제(또는 그의 단편)를 전위시켜, 프로테아제 활성의 기능적 발현이 표적 세포의 세포질 내에서 일어날 수 있게 한다. 전위 성분은 바람직하게는 낮은 pH 조건하에서 지질막(예를 들면 엔도좀 막)에 이온-투과성 세공(pore)을 형성할 수 있다. 전위 성분은 미생물 단백질 소스(source), 예를 들면 박테리아 또는 바이러스 단백질 소스로부터 얻을 수 있다. 따라서, 일 구체예에서, 전위 성분은 박테리아 독소와 같은, 효소의 전위 도메인을 포함하거나 또는 그로 구성된다. 또 다른 구체예에서, 전위 도메인은 바이러스 단백질의 전위 도메인을 포함하거나 또는 그로 구성된다. 일 구체예에서, 본 발명의 전위 성분은 클로스트리디움 신경독소의 HN 도메인(또는 그의 전위 단편)과 같은 클로스트리디움 신경독소의 중쇄(H-chain) 또는 그의 단편을 포함하거나 또는 그로 구성된다.
제 1 및 제2 프로테아제 절단 부위
본 발명의 폴리펩티드는 제 1 프로테아제 절단 부위를 포함한다. 제 1 프로테아제 절단 부위는 비-세포독성 프로테아제 성분과 융합 단백질의 나머지 부분 사이의 위치에서 융합 단백질의 절단(예를 들면 제어된 절단(controlled cleavage))을 가능하게 한다. 이 절단 사건(event)은 단일-쇄 (비-세포독성 프로테아제-전위 도메인) 구조를 '활성화'하는 역할을 하고, 비-세포독성 프로테아제 성분이 융합 단백질의 나머지 부분과 공유결합으로 연결된(예를 들면 이황화-결합) '활성화된' 이중-쇄 구조의 형성을 초래한다.
본 발명의 폴리펩티드는 또한 제 2 프로테아제 절단 부위를 포함한다. 제 2 프로테아제 절단 부위는 표적화 모이어티 성분과 전위 도메인 성분 사이의 위치에서 융합 단백질의 절단을 가능하게 한다. 이 절단 사건은 단일-쇄 (TM-전위 도메인) 구조를 분리하는 역할을 하고, TM 성분이 융합 단백질의 전위 성분과 공유결합으로 연결된 (예를 들면 이황화-결합) 별개의 이중-쇄(di-chain) 구조의 형성을 초래한다. 그렇게 함으로써, TM 성분의 구조적 환경이 변화되어 N-말단 및 C-말단 부분(예를 들면 도메인) 모두가 더 이상 융합 단백질의 나머지 부분에 펩티드-결합되지 않고 따라서 각각 하나(또는 그 이상)의 수용체의 상이한 결합 도메인과 자유롭게 상호작용(예를 들면 결합)할 수 있는 형태(conformation)로 제시된다.
따라서, 제 1 또는 제 2 프로테아제 절단 부위에서 단백질 분해에 의한 절단은 단일-쇄 폴리펩티드 융합 단백질을 이중-쇄 폴리펩티드로 변환시킨다. 제 1 프로테아제 절단 부위의 절단 반응이 일어난면, 비-세포독성 프로테아제 성분은 전위 도메인 성분 및/또는 TM 성분에 공유결합(예를 들면 이황화결합)에 의해 연결된 상태를 유지한다. 상기 공유결합은, 예를 들면 그 자체가 비-세포독성 프로테아제 성분, TM 성분 및/또는 전위 성분에 연결된 하나(또는 그 이상)의 스페이서(spacer) 또는 링커(linker) 분자를 통하여, 간접적일 수 있다. 마찬가지로, 제 2 프로테아제 절단 부위에서 절단 반응이 일어나면, 전위 도메인 성분은 공유 결합(예를 들면 이황화 결합)에 의해 TM 성분에 연결된 상태를 유지한다. 상기 공유 결합은, 예를 들면 그 자체가 전위 성분 및/또는 TM에 연결된 하나(또는 그 이상)의 스페이서 또는 링커 분자를 통하여, 간접적일 수 있다.
절단 반응이 제 1 및 제 2 프로테아제 절단 부위 모두에서 발생하는 경우, 단일-쇄 폴리펩티드 융합 단백질은 삼중-쇄(tri-chain) 폴리펩티드로 변환된다.
제 1 및 제 2 프로테아제 절단 부위는 부위-지정 돌연변이유발(site-directed mutagenesis)과 같은 종래의 수단에 의해 DNA 수준에서 도입(및/또는 고유의 절단 서열이 제거)될 수 있다. 절단 서열의 존재를 확인하기 위한 스크리닝은 수동으로 또는 컴퓨터 소프트웨어(예를 들면 DNASTAR사의 MapDraw 프로그램)의 도움으로 수행될 수 있다.
임의의 프로테아제 절단 부위가 본 발명의 폴리펩티드에서 제 1 프로테아제 절단 부위로서의 용도 및/또는 제 2 프로테아제 절단 부위로서의 용도로 이용될 수 있고, 하기의 것이 바람직하다:
엔테로키나아제(Enterokinase) (DDDDK↓)
인자 Xa(Factor Xa) (IEGR↓ / IDGR↓)
TEV(Tobacco Etch virus) (ENLYFQ↓G)
트롬빈(Thrombin) (LVPR↓GS)
프리시션(PreScission) (LEVLFQ↓GP)
추가적인 비-한정적 예는 식물의 파파인 절단 부위, 및 곤충의 파파인 절단 부위, 갑각류의 파파인 절단 부위, 인간 리노바이러스(rhinovirus) 3C 프로테아제 절단 부위, 인간 엔테로바이러스(enterovirus) 3C 프로테아제 절단 부위, TEV(tobacco etch virus) 프로테아제 절단 부위, TVMV(tobacco vein mottling virus) 절단 부위, 서브틸리신(subtilisin) 절단 부위, 히드록실아민 절단 부위, 또는 카스파제(caspase) 3 절단 부위를 포함한다.
또한 용어 프로테아제 절단 부위(pretease cleavage site)는 자가-절단(self-cleaving) 서열인 인테인(intein)을 포함한다. 자가-스플라이싱(self-splicing) 반응은, 예를 들면 존재하는 환원제의 농도를 다양하게 하여 제어할 수 있다. 또한 용어 프로테아제 절단 부위는 비-세포독성 프로테아제(예를 들면 클로스트리디움 신경독소)가 작용하는 절단 서열을 포함한다. 이러한 절단 부위의 예는 SNARE 단백질 절단 부위 서열이고 - 광법위한 비-세포독성 프로테아제에 대한 원시(native) 절단 부위 인식 서열의 예는 본 상세한 설명 섹션의 말미에 제공된다.
제 1 및 제 2 절단 부위는 동일하거나 상이할 수 있다. 제 1 및 제 2 절단 부위는 (오직) 동일한 또는 (오직) 상이한 프로테아제에 의해 절단될 수 있다.
본 발명의 별개의 양태로서, 앞서-언급된 절단 부위/절단 프로테아제는 본 발명의 폴리펩티드로 통합되는 경우, "파괴성(destructive)" 절단 부위/프로테아제(후술)로서 별개로 이용될 수 있다.
일 구체예에서, 단일-쇄 폴리펩티드에서, 비-세포독성 프로테아제 성분 및 전위 도메인 성분은 이황화 결합에 의해 서로 연결된다. 따라서 제 1 프로테아제 절단 부위의 절단 후, 폴리펩티드는 이중-쇄 형태를 취하고, 이 형태에서 상기 프로테아제 및 전위 도메인 성분은 이황화 결합에 의해 서로 연결된 상태를 유지한다. 이 절단 반응은 증가된(예를 들면 최적의) 프로테아제 활성을 갖는 비-세포독성 프로테아제 성분을 초래하므로, 일반적으로 "활성화" 단계로 지칭된다.
일 구체예에서, 비-세포독성 프로테아제 성분은 융합 단백질의 전위 도메인 성분과 공유 결합을 형성한다. 예를 들면, 일 구체예에서, 공유 결합을 형성하는 프로테아제 성분의 아미노산 잔기는 프로테아제 성분의 마지막 20개, 바람직하게는 마지막 10개의 C-말단 아미노산 잔기 내에 위치한다. 유사하게, 일 구체예에서, 공유결합의 제 2 부분을 형성하는 전위 성분 내 아미노산 잔기는 전위 성분의 최초 20개, 바람직하게는 최초 10개의 N-말단 아미노산 잔기 내에 위치할 수 있다.
전술된 공유결합 배열은 프로테아제 및 전위 성분이 원시(native) 비-세포독성 프로테아제(예를 들면 원시 클로스트리디움 신경독소)에 대한 것과 유사한 방식으로 배열되는 장점을 갖는다. 비교로서, 원시 클로스트리디움 신경독소에 대한 일차 아미노산 서열을 참조하면, 개별적인 시스테인 아미노산 잔기는 8 내지 27 아미노산 잔기만큼 떨어져 있다 - Popoff, MR & Marvaud, J-C, 1999, Structural & genomic features of clostridial neurotoxins, Chapter 9, in The Comprehensive Sourcebook of Bacterial Protein Toxins. Ed. Alouf & Freer에서 발췌:
혈청형 1 | 서열 | C-C 사이의 '원시' 길이 |
BoNT/A1 | CVRGIITSKTKS----LDKGYNKALNDLC | 23 |
BoNT/A2 | CVRGIIPFKTKS----LDEGYNKALNDLC | 23 |
BoNT/B | CKSVKAPG-------------------IC | 8 |
BoNT/C | CHKAIDGRS----------LYNKTLDC | 15 |
BoNT/D | CLRLTK---------------NSRDDSTC | 12 |
BoNT/E | CKN-IVSVK----------GIRK---SIC | 13 |
BoNT/F | CKS-VIPRK----------GTKAPP-RLC | 15 |
BoNT/G | CKPVMYKNT----------GKSE----QC | 13 |
TeNT | CKKIIPPTNIRENLYNRTASLTDLGGELC | 27 |
1단백질 분해 균주만의 정보
일 구체예에서, 본 발명의 단일-쇄 융합 단백질의 비-세포독성 프로테아제 성분 및 제 1 프로테아제 절단 부위 성분은 30, 25, 20, 15, 또는 10개 이하의 아미노산 잔기에 의해 분리된다. 일 구체예에서, 상기 두 성분은 단일-쇄 융합 단백질 내에서 5, 4, 3, 2, 또는 1개 이하의 아미노산 잔기에 의해 분리된다. 또 다른 구체예에서, 상기 두 성분은 단일-쇄 융합 단백질 내에서 0개의 아미노산 잔기에 의해 분리된다.
따라서, 일 구체예에서, 비-세포독성 프로테아제와 제 1 프로테아제 절단 부위는 제 1 스페이서 서열을 이용하여 분리될 수 있고, 상기 스페이서 서열은 제 1 프로테아제 절단 부위의 N-말단 및 비-세포독성 프로테아제 성분의 C-말단에 위치한다. 일 구체예에서, 제 1 스페이서 서열은 제 1 프로테아제 절단 부위의 일부 또는 전부를 포함할 수 있거나, 비-세포독성 프로테아제 성분의 일부일 수 있다.
일 구체예에서, 단일-쇄 융합 단백질의 전위 도메인(또는 TM) 성분과 제 1 프로테아제 절단 부위 성분은 30, 25, 20, 15, 또는 10개 이하의 아미노산 잔기에 의해 분리된다. 일 구체예에서, 상기 두 성분은 단일-쇄 융합 단백질 내에서 5, 4, 3, 2, 또는 1개 이하의 아미노산 잔기에 의해 분리된다. 또 다른 구체예에서, 상기 두 성분은 단일-쇄 융합 단백질 내에서 0개의 아미노산 잔기에 의해 분리된다.
따라서, 일 구체예에서, 전위 도메인(또는 TM)과 제 1 프로테아제 절단 부위는 제 2 스페이서 서열에 의해 분리될 수 있고, 상기 제 2 스페이서 서열은 제 1 프로테아제 절단 부위의 C-말단 및 전위 도메인(또는 TM) 성분의 N-말단에 위치한다. 제 2 스페이서 서열은 비-세포독성 프로테아제와 제 1 프로테아제 절단 부위를 분리하는 제 1 스페이서 서열과 동일하거나 또는 상이할 수 있다. 일 구체예에서, 제 2 스페이서 서열은 제 2 프로테아제 절단 부위의 일부 또는 전부를 포함할 수 있거나, 또는 전위 도메인 성분의 일부일 수 있다.
일 구체예에서, 단일-쇄 융합 단백질의 전위 도메인 성분과 제 2 프로테아제 절단 부위 성분은 30, 25, 20, 15, 또는 10개 이하의 아미노산 잔기에 의해 분리된다. 일 구체예에서, 상기 두 성분은 단일-쇄 융합 단백질 내에서 5, 4, 3, 2, 또는 1개 이하의 아미노산 잔기에 의해 분리된다. 또 다른 구체예에서, 상기 두 성분은 단일-쇄 융합 단백질 내에서 0개의 아미노산 잔기에 의해 분리된다.
따라서, 일 구체예에서, 전위 도메인과 제 2 프로테아제 절단 부위는 제 3 스페이서 서열에 의해 분리될 수 있고, 상기 제 3 스페이서 서열은 전위 도메인의 N-말단 또는 C-말단에 위치한다. 제 3 스페이서 서열은 제 1 및 제 2 스페이서 서열중 하나 또는 모두와 동일(하거나 상이)할 수 있다. 일 구체예에서, 제 3 스페이서 서열은 제 2 프로테아제 절단 부위의 일부 또는 전부를 포함할 수 있거나, 또는 전위 도메인 성분의 일부일 수 있다.
일 구체예에서, 표적화 모이어티와 제 2 프로테아제 절단 부위는 30, 25, 20, 15, 또는 10개 이하의 아미노산 잔기에 의해 분리된다. 일 구체예에서, 상기 두 성분은 단일-쇄 융합 단백질 내에서 5, 4, 3, 2, 또는 1개 이하의 아미노산 잔기에 의해 분리된다. 또 다른 구체예에서, 상기 두 성분은 단일-쇄 융합 단백질 내에서 0개의 아미노산 잔기에 의해 분리된다.
따라서, 제 2 프로테아제 절단 부위에서 절단 후, 폴리펩티드에 컨쥬게이트(conjugate)의 나머지 부분으로부터 실질적으로 자유로운 N-말단 도메인 및 C-말단 도메인을 갖는 표적화 모이어티가 제공된다. 이 배열은 표적화 모이어티의 N-말단 및 C-말단 성분과 표적 세포의 결합 부위의 상호작용을 촉진한다.
일 구체예에서, 표적화 모이어티와 제 2 프로테아제 절단 부위는 제 4 스페이서 서열에 의해 분리될 수 있고, 상기 제 4 스페이서 서열은 표적화 모이어티의 N-말단 또는 C-말단에 위치한다. 제 4 스페이서 서열은 제 1, 제 2 및 제 3 스페이서 서열중 하나, 둘 또는 모두와 동일(하거나 상이)할 수 있다. 일 구체예에서, 제 4 스페이서 서열은 제 2 프로테아제 절단 부위의 일부 또는 전부를 포함할 수 있거나, 또는 전위 도메인 성분의 일부일 수 있다.
일 구체예에서, (제 1 프로테아제 절단 부위를 절단할 수 있는) 제 1 프로테아제는 (제 2 프로테아제 절단 부위를 절단할 수 있는) 제 2 프로테아제와 동일하다.
따라서, 일 구체예에서, 단일 프로테아제로 단일-쇄 폴리펩티드 융합 단백질을 처리하면 제 1 및 제 2 프로테아제 절단 부위 모두의 절단을 가져올 수 있다.
다양한 스페이서 분자가 본 발명의 융합 단백질에서 이용될 수 있다. 이러한 스페이서 분자의 예는 GS5, GS10, GS15, GS20, GS25, 및 Hx27을 포함한다.
공유 결합
본 발명의 폴리펩티드 융합 단백질은 2개의 공유 결합을 포함한다: 제 1 결합은 비-세포독성 프로테아제 성분과 융합 단백질의 나머지 부분 사이에 있고; 제 2 결합은 표적화 모이어티와 전위 도메인 사이에 있다. (각각의) 제 1 및 제 2 프로테아제 절단 부위에서 단백질 분해에 의한 절단 후, 상기 두 공유 결합은 온전한 상태로 남는다. 일 구체예에서, 공유 결합은 펩티드 결합이 아니다(즉 공유 결합은 비-펩티드 결합이다). 예를 들면, 일 구체예에서, 상기 공유 결합 중 하나 또는 둘 모두는 이황화 결합이다.
제 2 프로테아제 절단 부위에서 단백질 분해에 의한 절단 후, 공유 결합은 온전한 상태로 남는다. 제 2 프로테아제 절단 부위에서의 절단은 표적화 모이어티의 N-말단(또는 C-말단)을 노출시키는 효과를 갖는다. 따라서, 제 2 프로테아제 절단 부위에서의 절단은 유리 N-말단 및 유리 C-말단을 갖는 표적화 모이어티를 생성한다.
따라서, 제 2 프로테아제 절단 부위에서의 절단 후, 표적화 모이어티와 전위 도메인 사이의 펩티드 결합이 절단되었기 때문에 표적화 모이어티 성분은 더 이상 전위 도메인 성분과 동일한 폴리펩티드 사슬의 일부가 아니다. 그러나 표적화 모이어티는 공유 결합의 존재로 전위 도메인에 부착된 상태를 유지한다.
공유 결합은 폴리펩티드 사슬 내 두 개의 아미노산 잔기 사이에서 형성할 수 있거나 형성될 수 있는 공유 결합을 포함할 수 있다.
일 구체예에서, 공유 결합은 이황화 결합이다. 이황화 결합은 폴리펩티드에 존재하는 두 개의 티올(즉 -SH)기 사이에서 형성될 수 있다. 예로서, 이황화 결합은 폴리펩티드 사슬에 위치한 두 개의 시스테인 잔기(또는 기능적으로 동등한 그의 변이체) 사이에서 형성될 수 있다.
따라서, 일 구체예에서, 전위 도메인 성분에 위치한 시스테인 잔기는 표적화 모이어티 성분에 위치한 또 다른 시스테인 잔기와 공유 결합을 형성한다. 이러한 이황화결합은 제 2 프로테아제 절단 부위에서의 절단 후 온전한 상태로 남아있다.
공유 결합에 의해 결합(join)되는 전위 도메인 성분 및 표적화 모이어티 성분에 위치한 아미노산 잔기는 상기 성분에 자연적으로 존재할 수 있다. 따라서, 일 구체예에서, 공유 결합은 전위 도메인 성분에 자연적으로 존재하는 아미노산 잔기와 표적화 모이어티 성분에 자연적으로 존재하는 아미노산 잔기 사이에서 형성된다. 대안적으로, 상기 아미노산 잔기 중 하나 또는 모두는 전위 도메인 성분 및/또는 표적화 모이어티 성분에 도입될 수 있다. 아미노산 잔기는 치환으로 도입될 수 있다.
일 구체예에서, 공유 결합은 전위 도메인 성분에 자연적으로 존재하는 시스테인 잔기와 표적화 모이어티 성분에 자연적으로 존재하는 시스테인 잔기 사이에 형성된 이황화 결합이다. 다른 예에서, 시스테인 잔기는 이 두 성분 간의 이황화 결합의 형성을 촉진하거나 허용하기 위하여, 구체적으로 전위 도메인 또는 표적화 모이어티 중 하나, 또는 모두에 도입된다.
일 구체예에서, 하나 이상의 시스테인 잔기가 TM 및/또는 전위 도메인에 도입된다. 이 경우, 도입된 시스테인 잔기는 두 개의, 작은, 아키랄 아미노산 잔기 (예를 들면 글리신 및/또는 알라닌)에 의해 플랭크(flanked)될 수 있다. 이러한 아미노산 잔기의 이용은 직접적인 3차 구조를 피하고 이황화 결합 형성을 촉진한다. 작은, 아키랄 아미노산 잔기는 자연적으로 존재할 수 있거나, 또는 TM 및/또는 전위 도메인에 도입될 수 있다.
일 구체예에서, 공유결합 외에, 이차 폴리펩티드 구조를 제공하는 짧은 폴리펩티드(예를 들면 1-20, 또는 1-10, 또는 5-10 아미노산 잔기)가 전위 도메인과 표적화 모이어티 사이에 위치한다. 상기 이차 폴리펩티드 구조는 전위 도메인과 표적화 모이어티의 배치를 돕고, 그에 의해 (1) TM과 전위 도메인 사이의 공유 결합의 형성, 및/또는 (2) 그의 C-말단과 N-말단이 전위 성분으로부터 멀리 향하도록 하여 TM의 배치를 돕는다.
따라서, 일 구체예에서, 이차 폴리펩티드 구조는 표적화 모이어티의 일부를 상기 전위 도메인에 인접하게 배치시키는 역할을 하고, 이에 의해, 상기 공유 결합의 형성이 에너지 측면에서 더 유리하게 된다.
일 구체예에서, 앞서 기술한 것과 같은 이차 폴리펩티드 구조를 형성할 수 있는 폴리펩티드는 프롤린(proline) 잔기와 같이 하나 이상의 '부피가 큰(bulky)' 아미노산 잔기를 포함하는 폴리펩티드 서열이다.
따라서, 일 구체예에서, 하나 이상의 부피가 큰 아미노산 잔기를 포함하는 폴리펩티드가 전위 도메인과 표적화 모이어티 사이에 위치한다. 상기 부피가 큰 잔기는 폴리펩티드 사슬에서 표적화 모이어티의 일부가 부피가 그렇지 않은 경우보다 전위 도메인에 더 인접하게 배치되도록 만곡(bend) 형성을 돕는다.
비-세포독성 프로테아제 성분과 융합 단백질의 나머지 부분(예를 들면 전위 성분 및/또는 TM 성분) 사이의 상응하는 공유 결합은 앞서 전술된 전위 도메인 성분과 TM 성분 사이의 공유 결합과 동일한 방식으로 형성될 수 있다. 전술된 바와 같이, 하나 이상의 이차 구조 및/또는 하나 이상의 부피가 큰 아미노산 잔기가 도입될 수 있다.
일 구체예에서, 비-세포독성 프로테아제 성분과 융합 단백질의 나머지 부분 사이의 공유 결합은 비-세포독성 프로테아제 성분과 전위 도메인 성분 사이이다. 일 구체예에서, 비-세포독성 프로테아제 성분과 전위 도메인 성분 사이의 공유 결합은, 예를 들면 상세한 설명 섹션에서 앞서 설명한 하나 이상의 시스테인 잔기와 같은 각각의 성분에 위치한 자연-발생한(naturally-occurring) 시스테인 잔기를 이용한다. 대안적으로, 하나 이상의 적절한 시스테인 잔기가 각각의 성분에 도입될 수 있다.
융합 단백질은 프로테아제 성분의 N-말단 및/또는 전위 성분의 C-말단에 위치한 하나 이상의 정제 태그(purification tag)를 포함할 수 있다.
어떠한 정제 태그도 사용될 수 있지만, 하기의 것이 바람직하다:
His-태그 (예를 들면 6 × 히스티딘), 바람직하게는 C-말단 및/또는 N-말단 태그
MBP-태그 (maltose binding protein), 바람직하게는 N-말단 태그
GST-태그 (glutathione-S-transferase), 바람직하게는 N-말단 태그
His-MBP-태그, 바람직하게는 N-말단 태그
GST-MBP-태그, 바람직하게는 N-말단 태그
티오레독신-태그(Thioredoxin), 바람직하게는 N-말단 태그
CBD-태그 (Chitin Binding Domain), 바람직하게는 N-말단 태그.
치료적
적용(
therapeutic
application
)
TM 성분은 본 발명의 표적화된 분비 억제제(TSI) 치료 분자를 원하는 표적 세포로 향하게 한다.
예로서, 본 명세서에 기술된 TM(예를 들면 오피오이드 펩티드, 베타-엔돌핀 펩티드, 브래디키닌 펩티드, BAM 펩티드, 노시셉틴 펩티드, 디놀핀 펩티드, 갈라닌 펩티드, 엔케팔린 펩티드, P 물질 펩티드)의 용도는 본 발명의 표적화된 분비 억제제(TSI) 치료 분자를 통증-감지 세포(예를 들면 일차 구심성 신경(primary sensory afferent))로 향하게 한다. 그 결과 융합 단백질은 따라서 통증을 억제하는 치료 분자를 제공한다 - 출원인은 WO2006/059093, WO2007/138339 및 WO96/33273를 참조하고, 각각은 참조에 의해 그 전체가 본 명세서에 통합된다.
본 명세서에 기술된 TM은 본 발명의 표적화된 분비 억제제(TSI) 분자를 신경성 염증(neurogenic inflammation)을 촉진시키는 세포로 향하게 하는데 이용될 수 있다. 따라서, 본 발명의 표적화된 분비 억제제(TSI) 분자는 신경성 염증을 억제하는 치료 분자를 제공한다 - 출원인은 WO2010/138395, WO2010/138392, WO2010/138387, WO2010138382 및 WO2010/138379를 참조하고, 각각은 참조에 의해 그 전체가 본 명세서에 통합된다. 이러한 TSI 분자 및 치료제로 이용하기에 바람직한 TM은 노시셉틴 및 디놀핀과 같은 오피오이드 TM을 포함한다.
본 명세서에 기술된 TM은 본 발명의 표적화된 분비 억제제(TSI) 분자를 과민성 방광(over-active bladder)과 같은 비뇨생식기-신경학적 질환(urogenital-neurological disorder)을 촉진시키는 세포로 향하게 하는데 이용될 수 있다. 따라서, 본 발명의 표적화된 분비 억제제(TSI) 분자는 과민성 방광과 같은 비뇨생식기-신경학적 질환을 억제하는 치료 분자를 제공한다 - 출원인은 WO2010/138393, WO2010/138389, WO2010/138384, 및 WO2010/138366을 참조하고, 각각은 참조에 의해 그 전체가 본 명세서에 통합된다. 이러한 TSI 분자 및 치료제로 이용하기에 바람직한 TM은 노시셉틴 및 디놀핀과 같은 오피오이드 TM을 포함한다.
성선자극호르몬-분비 호르몬(GnRH) 펩티드, CRF 펩티드, GRP 펩티드, 뉴로메딘 B 펩티드, 봄베신 펩티드, 가스트린 펩티드, CCK 펩티드, SST 펩티드, CST 펩티드, 및 GHRH 펩티드와 같은 TM은 본 발명의 TSI 분자를 암을 촉진하는 세포 또는 실제로 암 세포 자체로 향하게 하는데 이용될 수 있다. 따라서, 본 발명의 표적화된 분비 억제제(TSI) 분자는 말단 비대증 및 쿠싱병과 같은 신경내분비 (neuroendocrine) 질환을 억제하는 치료분자 및 암(예를 들면, 폐암, 신장암, 뇌암, 유방암, 췌장암, 대장암(colorectal cancer), 부신암, 식도암, 림프종, 백혈병, 급성 백혈병, 방광암, 골암, 장암(bowel caner), 자궁경부암, 만성 림프성 백혈병, 호지킨 림프종, 간암, 피부암, 인두암(oropharyngeal cancer), 골수종, 전립선암, 위암, 고환암, 자궁암 또는 카포시 육종)을 억제하는 치료 분자를 제공한다 - 출원인은 WO2009/150489, WO2009/150470, 및 WO2010/055358을 참조하고, 각각은 참조에 의해 그 전체가 본 명세서에 통합된다. 이러한 TSI 분자 및 치료제로 이용하기에 바람직한 TM은 GHRH 펩티드, SST 펩티드 및 CST 펩티드를 포함한다.
파괴성(destructive) 절단 부위
본 발명의 폴리펩티드는 비-표적화된 영역으로의 분산과 관련된 원하지 않는 부작용을 감소시키거나 방지하기 위하여 더 변형될 수 있다. 본 구체예에 따르면, 폴리펩티드는 파괴성 절단 부위를 포함한다. 파괴성 절단 부위는 '활성화' 부위(즉 이중-쇄 형성) 및 제 2 프로테아제 절단 부위(즉, 유리 C-말단 및 N-말단 도메인을 갖는 TM의 형성)와 구별된다. 상기 파괴성 절단 부위는 제 3 프로테아제에 의해 절단될 수 있고 제 1 또는 제 2 프로테아제에 의해서는 절단되지 않는다. 또한, 제 3 프로테아제에 의해 파괴성 절단 부위에서 절단되는 경우, 본 발명의 폴리펩티드는 효능이 감소하였다(예를 들면 의도된 표적 세포에 대한 결합 능력의 감소, 전위 활성의 감소 및/또는 비-세포독성 프로테아제 활성의 감소). 예로서, 출원인은 WO 2010/094905 및, WO 02/044199를 참조하고, 각각은 참조에 의해 그 전체가 본 명세서에 통합된다.
따라서, 본 구체예에 따르면, 본 발명은 떨어진(off-site) 위치에서 제어 가능하게 불활성화 및/또는 파괴될 수 있는 폴리펩티드를 제공한다.
일 구체예에서, 파괴성 절단 부위는 순환하는 프로테아제(예를 들면, 혈청 프로테아제 또는 혈액 응고 캐스케이드의 프로테아제와 같은 세포외 프로테아제), 조직-관련 프로테아제(예를 들면 근육의 MMP와 같은 매트릭스 메탈로프로테아제(matrix metalloprotease)(MMP)), 및 세포내 프로테아제(바람직하게는 표적세포에는 없는 프로테아제)로부터 선택되는 제 3 프로테아제(즉 파괴 프로테아제)에 의해 인식되고 절단된다. 따라서, 이용에서, 본 발명의 폴리펩티드가 의도된 표적 세포로부터 멀리 분산되고 및/또는 비-표적 세포에 의해 흡수되는 경우, 폴리펩티드는 (제 3 프로테아제에 의해) 파괴성 절단 부위의 절단에 의해 불활성화될 것이다.
메트릭스 메탈로프로테아제(MMP)는 본 발명의 맥락에서 파괴성 프로테아제의 바람직한 군이다. 이 군 내에서, ADAM17(또한 TACE로 알려진 EC 3.4.24.86)이 바람직하고 세포외 도메인을 "제거(shed)"하기 위하여 다양한 막에 고정된(membrane-anchored), 세포 표면 단백질을 절단한다. 또한, 바람직한 MMP는 아다말리신(adamalysin), 세르랄리신(serralysin), 및 아스타신(astacin)을 포함한다. 바람직한 파괴 프로테아제의 또 다른 군은 트롬빈, 응고인자 VIIa, 응고인자 IXa, 응고인자 Xa, 응고인자 XIa, 응고인자 XIIa, 칼리크레인, 단백질 C, 및 MBP-관련 세린 프로테아제와 같은 포유동물의 혈액 프로테아제이다.
본 발명의 제 2 양태에 따르면, 앞서-기술한 폴리펩티드 융합 단백질을 코딩하는 핵산 서열이 제공된다.
본 발명의 바람직한 양태에서, DNA 서열은 DNA 벡터의 일부로서 제조(prepared)되고, 상기 벡터는 프로모터 및 터미네이터를 포함한다. 전술된 폴리펩티드 융합 단백질을 코팅하는 DNA 서열은 프로모터의 하류에 위치하고; 터미네이터는 핵산 서열의 하류에 위치한다.
바람직한 구체예에서, 벡터는 하기로부터 선택되는 프로모터를 갖는다:
프로모터 | 유도제 | 일반적인 유도 조건 |
tac(하이브리드) | IPTG | 0.2 mM(0.05 - 2.0mM) |
AraBAD | L-아라비노스 | 0.2%(0.002 - 0.4%) |
T7 - lac 오퍼레이터 | IPTG | 0.2 mM(0.05 - 2.0 mM) |
본 발명의 DNA 구조체(construct)는 바람직하게는 인 실리코(in silico)로 설계되고, 그 후 통상적인 DNA 합성 기법에 의해 합성된다.
앞서-언급된 DNA 서열 정보는 이용될 궁극적인 숙주 세포(예를 들면 E. coli) 발현 시스템에 따른 코돈-바이어스(codon-biasing)를 위해 선택적으로 (optionally) 변형된다.
DNA 백본(backbone)은 바람직하게는, 전사 및 번역시, 제 2 펩티드-코딩 서열에 의해 코딩되는 프로테아제 절단 부위에 상응하는 아미노산 서열을 생성할 수 있는 내재된(inherent) 핵산 서열에 대해 스크리닝된다. 이 스크리닝은 수동으로 또는 컴퓨터 소프트웨어(예를 들면 DNASTAR사의 MapDraw 프로그램)의 도움으로 수행될 수 있다.
본 발명의 또 다른 구체예에 따라, 숙주 세포에서, 앞서 기술된 융합 단백질을 코딩하는 핵산 서열, 또는 앞서 기술된 바와 같은 DNA 벡터를 발현시키는 단계를 포함하는, 앞서 기술된 바와 같은 단일-쇄 폴리펩티드 융합단백질을 제조하는 방법이 제공된다.
본 발명의 다른 구체예에 따라, 하기를 포함하는 비-세포독성 작용제(agent)를 제조하는 방법이 제공된다:
a. 본 발명의 단일-쇄 폴리펩티드 융합 단백질을 포함하는 용액을 제공하는 단계;
b. 상기 용액에 제 1 프로테아제 절단 부위를 절단할 수 있는 제 1 프로테아제 및 제 2 프로테아제 절단 부위를 절단할 수 있는 제 2 프로테아제를 첨가하는 단계;
c. 제 1 프로테아제 절단 부위 및 제 2 프로테아제 절단 부위를 절단하여, 이에 의해 삼중-쇄 융합 단백질(tri-chain) fusion protein)을 형성하는 단계.
일 구체예에서, 제 1 프로테아제 및 제 2 프로테아제는 순차적으로 첨가된다. 대안적인 구체예에서, 제 2 프로테아제는 제 1 프로테아제 전에 첨가된다. 또 다른 구체예에서, 제 1 프로테아제 및 제 2 프로테아제는 동시에 첨가된다.
본 양태는 삼중-쇄 폴리펩티드를 제공한다. 더 상세하게는, 생성된 삼중-쇄 폴리펩티드는 일반적으로:
a. 제 1 쇄는 표적 세포의 엑소사이토시스 융합 기구 단백질을 절단할 수 있는 비-세포독성 프로테아제, 또는 그의 단편을 포함하고;
b. 제 2 쇄는 엔도좀 내로부터 상기 프로테아제 또는 프로테아제 단편을 엔도좀 막을 거쳐 상기 표적 세포의 세포질 속으로 전위시킬 수 있는 전위 도메인을 포함하며;
c. 제 3 쇄는 상기 표적 세포의 결합 부위에 결합할 수 있는 표적화 모이어티를 포함하고, 상기 결합 부위는 상기 표적 세포 내 엔도좀에 통합되어 엔도사이토시스를 수행할 수 있고;
d. 상기 제 1 및 제 2 쇄는 서로 이황화 결합으로 연결되고; 및 제 2 및 제 3 도메인은 공유 결합에 의해 서로 연결되는 것인 구조를 갖는다.
폴리펩티드 전달
본 발명의 다른 양태에 따라, 질환(medical condition)의 치료, 예방 또는 개선에 사용하기 위한, 앞서 기술된 바와 같은 단일-쇄 폴리펩티드 융합 단백질, 또는 앞서 기술된 바와 같은 비-세포독성 폴리펩티드가 제공된다.
이용에서, 본 발명은 약학적으로 허용가능한 담체(carrier), 부형제(excipient), 보조제(adjuvant), 추진제(propellant) 및/또는 염으로부터 선택되는 하나 이상의 성분과 함께, 폴리펩티드를 포함하는 약학적 조성물을 이용한다.
본 발명의 폴리펩티드는 경구, 비경구(pareteral), 지속 주입(continuous infusion), 이식(implant), 흡입(inhalation) 또는 국소 적용을 위해 제형화될 수 있다. 주사에 적합한 조성물은 용액, 현탁액(suspension), 에멀젼(emulsion), 또는 사용하기 전에 적절한 비이클(vehicle)에 용해되거나 현탁되는 건조 분말의 형태일 수 있다.
국소 전달 수단은 에어로졸, 또는 기타 스프레이(예를 들면 네뷸라이저)를 포함한다. 이와 관련하여, 폴리펩티드의 에어로졸 제형은 폐 및/또는 기타 비강 및/또는 기관지 또는 기도로의 전달을 가능하게 한다. 바람직한 투여 경로는 전신(예를 들면 iv), 복강경 및/또는 국소 주사(예를 들면, 종양과 같은 표적 세포로의 직접적인 경접협동 주사(transsphenoidal injection))로부터 선택된다.
주사 제형의 경우에, 투여 부위에서 폴리펩티드의 유지를 돕거나 제거를 감소시키기 위하여 선택적으로 약학적 활성 물질을 포함한다. 이러한 약학적 활성물질의 한 예는 아드레날린 같은 혈관수축제이다. 이러한 제형은 투여 후 폴리펩티드의 체류 시간이 증가하고 따라서 그의 효과가 증가하거나 및/또는 강화되는 장점을 부여한다.
본 발명의 폴리펩티드의 투여를 위한 용량 범위는 원하는 치료 효과를 생성하는 범위이다. 요구되는 용량 범위는 폴리펩티드 또는 조성물의 정확한 속성, 투여경로, 제형의 속성, 환자의 연령, 환자 상태의 속성, 정도 또는 중증도, 존재하는 경우, 금기, 및 담당 의사의 판단에 의존하는 것으로 이해될 것이다. 이러한 용량 수준의 변화는 최적화를 위한 표준 실험 루틴을 이용하여 조정될 수 있다.
적절한 (환자의 체중당) 일일 용량은 0.0001-1 mg/kg, 바람직하게는 0.0001-0.5 mg/kg, 더 바람직하게는 0.002-0.5 mg/kg, 및 특히 바람직하게는 0.004-0.5 mg/kg의 범위이다. 단위 용량은 1 마이크로그램 미만 내지 30mg까지 다양할 수 있지만, 일반적으로 용량당 0.01 내지 1mg의 범위일 것이고, 매일 또는 바람직하게는 주별 또는 6 개월 마다와 같이 덜 빈번하게 투여될 수 있다. 특히 바람직한 투여 요법(dosing regimen)은 1X 용량인 폴리펩티드 2.5 ng을 기초로 한다. 이와 관련하여, 바람직한 용량은 1X-100X(즉 2.5-250ng)의 범위이다.
유체 투여 형태는 일반적으로 폴리펩티드 및 파이로젠(pyrogen)이 없는 멸균 비이클(vehicle)을 이용하여 제조된다. 폴리펩티드는 사용되는 비이클 및 농도에 따라, 비이클에 용해되거나 현탁될 수 있다. 용액 제조에서 폴리펩티드를 비이클에 용해시킬 수 있고, 용액을 필요한 경우 염화 나트륨을 첨가하여 등장성으로 만들고, 적절한 멸균 바이알 또는 앰플에 채우고 밀봉하기 전에 무균기법을 이용하여 멸균 필터를 통해 여과하고 멸균시킬 수 있다. 대안적으로, 용액의 안정성이 적절한 경우, 밀봉된 용기의 용액을 가압증기멸균(autoclaving)에 의해 멸균시킬 수 있다. 유리하게, 완충제, 가용화제, 안정화제, 보존제 또는 살균제, 현탁화제 또는 에멀젼화제 및/또는 국소 마취제와 이로운 첨가제를 비이클에 용해시킬 수 있다.
사용 전 적절한 비이클에 용해되거나 현탁되는, 건조 분말은 미리 멸균된 성분을 멸균 영역에서 무균 기법을 이용하여 멸균 용기에 충전하여 제조할 수 있다. 대안적으로, 성분은 멸균 영역에서 무균 기법을 이용하여 적절한 용기에 용해시킬 수 있다. 그 후 생성물을 동결 건조하고 용기를 무균 밀봉한다.
근육내 주사, 피하 주사 또는 피내 주사에 적절한 비경구 현탁액은, 멸균된 성분을 멸균 비이클에 용해하는 대신 현탁하는 것과 여과에 의해 멸균을 달성할 수 없다는 것을 제외하고는, 실질적으로 동일한 방식으로 제조된다. 성분을 멸균 상태에서 단리 할 수 있거나 대안적으로 단리 후, 예를 들면 감마선 조사에 의해 멸균할 수 있다.
유용하게는, 현탁화제, 예를 들면 폴리비닐피롤리돈(polyvinylpyrrolidone)이 성분의 균일한 분포를 가능하게 하기 위해 조성물에 포함된다.
정의 섹션
표적화 모이어티(Targeting Moiety)(TM)는 본 발명의 폴리펩티드와 표적 세포의 표면 사이에서 물리적 결합(physical association)을 유발하기 위해서 기능적으로 결합 부위(Binding Site)와 상호작용하는 화학구조를 의미한다. 용어 TM은 표적 세포의 결합 부위에 결합할 수 있는 분자(즉 천연 분자, 또는 화학적/물리적으로 변형된 그의 변이체)를 포함하고, 상기 결합부위는 내재화(internalisation)(예를 들면 엔도좀 형성) - 수용체-매개 엔도사이토시스(receptor-mediated endocytosis)라고도 지칭된다 - 될 수 있다. TM은 엔도좀 막 전위 기능을 가질 수 있고, 이 경우 본 발명의 작용제에 별개의 TM 및 전위 도메인 성분이 존재할 필요가 없다. 앞선 설명에서, 특정 TM이 기술되었다. 상기 TM에 대한 언급은 단지 예시이며, 본 발명은 예시된 TM의 기본적인 결합(즉 표적화) 능력을 유지하는 그의 모든 변이체 및 유도체를 포함한다.
앞서 언급한 바와 같이, 바람직한 TM은 항체(예를 들면 항체 단편) 및 결합 스캐폴드(scaffold); 특히, 표적 세포에 (예를 들면 특이적으로) 결합하는 것을 목적으로 설계된 상업적으로 이용가능한 항체/단편 및 스캐폴드를 포함한다.
단백질 스캐폴드는, 각각 본 발명의 TM으로 이용될 수 있는, scFv, Fab 분자, dAb(single-domain antibody), 카멜리드(camelid), 디아바디(diabody) 및 미니바디(minibody)와 같은 치료용 단클론 항체 및 유도체의 레퍼토리(repertoire) 확대를 보완하기 위한 범용 결합 구조(universal binding framework)의 새로운 세대를 대표한다. 스캐폴드 시스템은 신규한 스캐폴드의 생성 또는 공지된 단백질 결합 도메인의 변형을 통해 공지된 단백질의 인식 도메인을 만들거나 변형한다. 이러한 스캐폴드는 하기를 포함하나 이에 한정되지 않는다:
(i) 단백질 A 기반 스캐폴드 - 어피바디(affibody)(Nord, K. 등 1997 “Binding proteins selected from combinatorial libraries of an alpha-helical bacterial receptor domain". Nat Biotechnol 15, 772-777);
(ii) 리포칼린(lipocalin) 기반 스캐폴드 - 안티칼린(anticalin)(Skerra 2008 “Alternative binding proteins: anticalins - harnessing the structural plasticity of the lipocalin ligand pocket to engineer novel binding activities”. FEBS J. 275:2677-83);
(iii) 피브로넥틴(fibronectin) 기반 스캐폴드 - 애드넥틴(adnectin)(Dineen 등 2008 “The Adnectin CT-322 is a novel VEGF receptor 2 inhibitor that decreases tumor burden in an orthotopic mouse model of pancreatic cancer”. BMC Cancer 8:352);
(iv) 아비머(avimer)(Silverman 등 2005 “Multivalent avimer proteins evolved by exon shuffling of a family of human receptor domains”. Nat Biotechnol 23:1556-61);
(v) 안키린(ankyrin) 기반 스캐폴드 - 달핀(darpin)(Zahnd 등 2006 “Selection and characterization of Her2 binding-designed ankyrin repeat proteins”. J Biol Chem. 281:35167-75); 및
(vi) 센티린(centyrin) 스캐폴드 - CDR과 유사한 루프(loop)를 가진 Ig 도메인과 상당한 구조적 상동성을 갖는 단백질 폴드(protein fold)에 기반함. Ig 도메인은 인간 단백질의 공통된 모듈이고 대안적인 스캐폴드 단백질로서 널리 적용된다. 전술된 '스캐폴드' 공개문헌 각각은 참조에 의해 본 명세서에 (그 전체가) 통합된다.
결합 스캐폴드는 특정 세포 표면 단백질, 수용체 또는 당기(sugar group)와 같은 기타 세포 표면 에피토프(epitope)의 상호작용을 통해 특정 세포 타입을 표적화하는데 이용될 수 있다. 이러한 변형된 스캐폴드가 재조합 비-세포독성 프로테아제 기반 본 발명의 폴리펩티드로 조작(engineered)될 수 있다.
본 발명의 TM은 해당 표적세포에 결합(바람직하게는 특이적으로 결합)한다. 용어 "특이적으로 결합하는(specifically bind)"은 바람직하게는 주어진 TM이 106M-1 이상, 바람직하게는 107M-1 이상, 더 바람직하게는 108M- 1이상, 및 가장 바람직하게는 109M- 1이상의 결합 친화성(binding affinity)(Ka)으로 표적 세포에 결합하는 것을 의미한다.
본 명세서의 TM에 대한 지침은 해당 표적 세포에 결합하는 능력을 유지하는, 그의 단편 및 변이체를 포함한다. 예로서, 변이체는 표준(reference) TM과 80% 이상, 바람직하게는 90% 이상, 더 바람직하게는 95% 이상, 및 가장 바람직하게는 97% 이상 또는 99% 이상의 아마노산 서열 상동성을 가질 수 있다. 따라서, 변이체는 아미노산 유사체(예를 들면 자연에 없는 아미노산), 또는 치환된 결합을 하나 이상 포함할 수 있다. 또한, 예로서, TM과 관련하여 이용될 때, 용어 단편(fragment)은 10개 이상, 바람직하게는 20개 이상, 더 바람직하게는 30개 이상, 및 가장 바람직하게는 40개 이상의 표준 TM의 아미노산 잔기를 갖는 펩티드를 의미한다. 용어 단편은 또한 앞서 언급된 변이체에 관한 것이다. 따라서, 예로서, 본 발명의 단편은 10, 20, 30, 또는 40개 이상의 아미노산을 갖는 펩티드 서열을 포함할 수 있고, 상기 펩티드 서열은 표준 펩티드의 (연속적인) 아미노산의 상응하는 펩티드 서열과 80% 이상의 서열 상동성을 갖는다.
TM이 선택된 표적 세포에 결합하는 것을 확인하는 것은 통상적이다. 예를 들면, 해당 표적 세포를 대표하는 조직 또는 세포가 표지되지 않은 TM의 과량 존재에서 표지된(예를 들면, 삼중수소화(tritiated)) TM에 노출되는 것인 간단한 방사성 변위 실험이 이용될 수 있다. 이러한 실험에서, 비-특이적 및 특이적 결합의 상대적인 비율이 평가될 수 있고, 이에 의해 TM이 표적 세포에 결합하는 것을 확인할 수 있다. 선택적으로, 분석법은 하나 이상의 결합 길항제를 포함할 수 있고, 분석법은 TM 결합의 감소를 관찰하는 것을 더 포함할 수 있다. 이러한 종류의 실험의 예는 Hulme, E.C. (1990), Receptor-binding studies, a brief outline, pp. 303-311, In Receptor biochemistry, A Practical Approach, Ed. E.C. Hulme, Oxford University Press에서 찾을 수 있다.
본 발명의 맥락에서, 유사체가 상응하는 '표준(reference)' TM과 동일한 수용체에 결합하는 한, 펩티드 TM에 대한 지침은 그의 펩티드 유사체를 포함한다. 상기 유사체는 하기와 같은 합성 잔기를 포함할 수 있다:
ß-Nal = ß-나프틸알라닌(β-naphthylalanine)
ß-Pal = ß-피리딜알라닌(β-pyridylalanine)
hArg(Bu) = N-구아니디노-(부틸)-호모아르기닌(N-guanidino-(butyl)-homoarginine)
hArg(Et)2 = N,N'-구아니디노-(디메틸)-호모아르기닌(N,N'-guanidino-(dimethyl)-homoarginine)
hArg(CH2CF3)2 = N,N'-구아니디노-비스-(2,2,2,-트리플루오로에틸)-호모아르기닌(N,N'-guanidino-bis-(2,2,2,-trifluoroethyl)-homoarginine)
hArg(CH3, hexyl) = N,N'-구아니디노-(메틸, 헥실)-호모아르기닌(N,N'-guanidino-(methyl, hexyl)-homoarginine)
Lys(Me) = Ne-메틸라이신(Ne-methyllysine)
Lys(iPr) = Ne-이소프로필라이신(Ne-isopropyllysine)
AmPhe = 아미노메틸페닐알라닌(aminomethylphenylalanine)
AChxAla = 아미노사이클로헥실알라닌(aminocyclohexylalanine)
Abu = α-아미노부틸산(α-aminobutyric acid)
Tpo = 4-티아프롤린(4-thiaproline)
MeLeu = N-메틸류신(N-methylleucine)
Orn = 오르니틴(ornithine)
Nle = 노르류신(norleucine)
Nva = 노르발린(norvaline)
Trp(Br) = 5-브로모-트립토판(5-bromo-tryptophan)
Trp(F) = 5-플루오로-트립토판(5-fluoro-tryptophan)
Trp(N02) = 5-니트로-트립토판(5-nitro-tryptophan)
Gaba = γ-아미노부틸산(γ-aminobutyric acid)
Bmp = J-머캅토프로피오닐(J-mercaptopropionyl)
Ac = 아세틸(acetyl)
Pen = 페니실라민(pencillamine)
본 발명의 폴리펩티드는 클로스트리디움 신경독소의 기능적 HC 또는 HCC 도메인이 없을 수 있다. 따라서, 상기 폴리펩티드는 Shone 등. (1985) Eur. J. Biochem. 151, 75-82에서 기술한 바와 같은 결합 분석법에서 (클로스트리드움 HC 성분을 통해) 랫트(rat)의 시냅토좀 막(synaptosomal membrane)에 결합할 수 없다. 일 구체예에서, 상기 폴리펩티드는 클로스트리디움 신경독소 홀로톡신의 마지막 50개의 C-말단 아미노산이 없다. 또 다른 구체예에서, 상기 폴리펩티드는 클로스트리디움 신경독소 홀로톡신의 마지막 100, 150, 200, 250, 또는 300개의 C-말단 아미노산 잔기가 없다. 대안적으로 HC 결합 활성이 돌연변이유발(mutagenesis)에 의해 제거가 되거나 감소될 수 있다 - 예로서, 편의상 BoNT/A라고 지칭하는, 강글리오사이드 결합 포켓(binding pocket) 중 하나 또는 두 개의 아미노산 잔기의 돌연변이(W1266의 L로의 변형 및 Y1267의 F로의 변형)의 변형은 HC 영역(region)이 그의 수용체 결합 기능을 상실하게 한다. 유사한 돌연변이가 비-혈청형 A 클로스트리디움 펩티드 성분에 생성되어, 예를 들면 돌연변이 보툴리눔 B(W1262의 L로의 변이 및 Y1263의 F로의 변이) 또는 보튤리늄 E (W1224의 L로의 변이 및 Y1225의 F로의 변이)를 기반으로 한 구조체(construct)를 얻을 수 있다. 활성 부위의 다른 돌연변이는 예를 들면 보툴리눔 A형 독소의 Y1267S와 같은 HC 수용체 결합 활성 및 기타 클로스트리디움 신경독소의 그에 상응하는 고도로 보존된 잔기의 돌연변이가 동일한 제거(ablation)를 달성한다. 이 돌연변이 및 기타 돌연변이의 상세한 설명은 Rummel 등 (2004) (Molecular Microbiol. 51:631-634)에 기술되고, 이는 참조에 의해 본 명세서에 통합된다.
원시(native) 클로스트리디움 신경독소의 HC 펩티드는 약 400-440개의 아미노산 잔기를 포함하고, 각각 약 25kDa의 두 개의 기능적으로 구별되는 도메인, 즉 N-말단 영역(일반적으로 HCN 펩티드 또는 도메인으로 지칭된다) 및 C-말단 영역(일반적으로 HCC 펩티드 또는 도메인으로 지칭된다)으로 구성된다. 또한, C-말단의 160-200개의 아미노산 잔기로 구성되는 C-말단 영역(HCC)은 그의 자연 세포 수용체, 즉 신경근육 접합부(neuromuscular junction)의 신경 말단으로의 클로스트리디움 신경독소의 결합을 담당한다는 것이 잘 기록되어 있다. 따라서, 중쇄가 원시 클로스트리디움 신경독소가 결합하는 세포 표면 수용체에 결합할 수 없도록, 기능적 중쇄 HC 펩티드가 없는 클로스트리디움 중쇄에 대한 본 명세서에서의 기재는 클로스트리디움 중쇄가 단순히 기능적 HCC 펩티드가 없는 것을 의미한다. 즉, HCC 펩티드 영역은 신경근육 접합부에서 신경말단에 대한 그의 원시 결합 능력을 불활성화하기 위하여 부분적으로 또는 전체가 결손(deleted)되거나, 또는 변형된다(예를 들면 종래의 화학적 또는 단백분해적 처리를 통하여).
따라서, 일 구체예에서, 본 발명의 클로스트리디움 HN 펩티드는 클로스트리디움 신경독소의 C-말단 펩티드 부분(HCC)의 일부가 없고 따라서 원시 클로스트리디움 신경독소의 HC 결합 기능이 없다. 예로서, 일 구체예에서, C-말단 연장(C-terminally extended) 클로스트리드움 HN 펩티드는 클로스트리디움 신경독소 중쇄의 C-말단의 40개 아미노산 잔기, 또는 C-말단의 60개 아미노산 잔기, 또는 C-말단의 80개 아미노산 잔기, 또는 C-말단의 100개 아미노산 잔기, 또는 C-말단의 120개 아미노산 잔기, 또는 C-말단의 140개 아미노산 잔기, 또는 C-말단의 150개 아미노산 잔기, 또는 C-말단의 160개 아미노산 잔기가 없다. 또 다른 구체예에서, 본 발명의 클로스트리디움 HN 펩티드는 클로스트리디움 신경독소의 C-말단 펩티드 부분(HCC) 전체가 없고 따라서 원시 클로스트리디움 신경독소의 HC 결합 기능이 없다. 예로서, 일 구체예에서, 클로스트리드움 HN 펩티드는 클로스트리디움 신경독소 중쇄의 C-말단의 165개 아미노산 잔기, 또는 C-말단의 170개 아미노산 잔기, 또는 C-말단의 175개 아미노산 잔기, 또는 C-말단의 180개 아미노산 잔기, 또는 C-말단의 185개 아미노산 잔기, 또는 C-말단의 190개 아미노산 잔기, 또는 C-말단의 195개 아미노산 잔기가 없다. 추가적인 예로서, 본 발명의 클로스트리디움 HN 펩티드는 하기로 이루어진 군으로부터 선택되는 클로스트리디움 HCC 표준 서열이 없다:
보툴리눔 A형 신경독소 - 아미노산 잔기(Y1111-L1296)
보툴리눔 B형 신경독소 - 아미노산 잔기(Y1098-E1291)
보툴리눔 C형 신경독소 - 아미노산 잔기(Y1112-E1291)
보툴리눔 D형 신경독소 - 아미노산 잔기(Y1099-E1276)
보툴리눔 E형 신경독소 - 아미노산 잔기(Y1086-K1252)
보툴리눔 F형 신경독소 - 아미노산 잔기(Y1106-E1274)
보툴리눔 G형 신경독소 - 아미노산 잔기(Y1106-E1297)
파상풍 신경독소 - 아미노산 잔기 (Y1128-D1315).
아혈청형(sub-serotyep)에 따라 약간의 변화가 일어날 수 있으므로 앞서 확인된 표준 서열은 가이드로 간주되어야 한다.
본 발명의 프로테아제는 진핵세포에서 엑소사이토시스 융합 기구의 하나 이상의 단백질을 절단할 수 있는 모든 비-세포독성 프로테아제를 포함한다. 본 발명의 프로테아제는 바람직하게는 박테리아 프로테아제(또는 그의 단편)이다. 더욱 바람직하게는 박테리아 프로테아제는 클로스트리디움(Clostridium) 또는 나이세리아(Neisseria)/연쇄상구균(Streptococcus) 속(예를 들면 클로스트리디움 경쇄(L-chain), 또는 바람직하게는 임균(N. gonorrhoeae)의 나이세리아 IgA 프로테아제 또는 폐렴연쇄구균(S. pneumoniae)의 프로테아제)으로부터 선택된다.
본 발명은 또한, 프로테아제의 변이체(variant protease)가 필수적인 프로테아제 활성을 보이는 한, 비-세포독성 프로테아제의 변이체(즉 천연 프로테아제 분자의 변이체)를 포함한다. 예로서, 변이체는 표준 프로테아제 서열과 70% 이상, 바람직하게는 80% 이상, 더욱 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상 또는 98% 이상 아미노산 서열 상동성을 갖는다. 따라서, 용어 변이체(variant)는 강화된 (또는 감소된) 엔도펩티다아제(endopeptidase) 활성을 갖는 비-세포독성 프로테아제를 포함한다 - BoNT/A 돌열변이체 Q161A, E54A 및 K165L의 증가된 Kcat/Km에 대하여 구체적으로 본 명세서에서 언급되었고, 참조에 의해 통합된 Ahmed, S.A. (2008) Protein J. DOI 10.1007/s10930-007-9118-8을 참조한다. 프로테아제와 관련하여 이용될 때, 용어 단편(fragment)은 일반적으로 표준 프로테아제의 150개 이상, 바람직하게는 200개 이상, 더욱 바람직하게는 250개 이상, 및 가장 바람직하게는 300개 이상의 아미노산 잔기를 갖는 펩티드를 의미한다. (앞서 검토된) TM '단편' 성분의 경우와 같이, 본 발명의 프로테아제 '단편'은 표준 서열에 기반한 프로테아제 변이체의 단편을 포함한다.
본 발명의 프로테아제는 바람직하게는 세린 또는 메탈로프로테아제(metalloprotease) 활성(예를 들면 엔도펩티다아제 활성)을 보인다. 프로테아제는 바람직하게는 SNARE 단백질(예를 들면 SNAP-25, 시냅토브레빈/VAMP, 또는 신택신)에 대해 특이적이다.
신경독소의 프로테아제 도메인, 예를 들면 박테리아 신경독소의 프로테아제 도메인에 대하여 특히 언급한다. 따라서, 본 발명은 천연 신경독소 도메인 및 상기 천연 신경독소의 재조합 제조 버전의 이용을 포함한다. 대표 신경독소는 클로스트리디움에 의해 생성되고, 용어 클로스트리디움 신경독소(clostridial neurotoxin)는 파상풍균(C. tetani)(TeNT), 및 보툴리누스균(C. botulinum)(BoNT) 혈청형 A-G에 의해 생성된 신경독소 및 클로스트리디움 바라티(C. baratii) 및 클로스트리디움 부티리컴(C. butyricum)에 의해 생성된, 밀접하게 연관된 BoNT-유사 신경독소를 포함한다. 앞서-언급된 약어는 본 명세서 전반에 걸쳐 사용된다. 예를 들면, 명명법 BoNT/A는 신경독소의 소스를 BoNT(혈청형 A)로 표시한다.
BoNT는 50kDa 이하의 경쇄(L-chain)에 단일 이황화결합에 의해 공유 결합된 100kDa 이하의 중쇄(H-chain)로 구성되는, 150kDa 이하의 이중-쇄 단백질의, 공통 구조를 공유한다. 중쇄는 각각 50 kDa 이하인 두 개의 도메인으로 구성된다. C-말단 도메인(HC)이 높은 친화성 뉴런(neuronal) 결합을 위해 요구되고, 반면 N-말단 도메인(HN)은 막의 전위(translocation)에 관여하는 것으로 제안된다. 경쇄는 기질인 SNARE 단백질의 절단을 담당하는 아연-의존적 메탈로프로테아제이다.
용어 경쇄 단편(L-chain fragment)은 신경독소의 경쇄 성분을 의미하고, 단편은 메탈로프로테아제 활성을 나타내고 세포의 엑소사이토시스와 연관된 소포 및/또는 세포막 관련 단백질(plasma membrane associated protein)을 단백질 분해에 의해 절단할 수 있다.
적절한 프로테아제 (표준) 서열의 예는 하기를 포함한다:
보툴리눔 A형 신경독소 - 아미노산 잔기(1-448)
보툴리눔 B형 신경독소 - 아미노산 잔기(1-440)
보툴리눔 C형 신경독소 - 아미노산 잔기(1-441)
보툴리눔 D형 신경독소 - 아미노산 잔기(1-445)
보툴리눔 E형 신경독소 - 아미노산 잔기(1-422)
보툴리눔 F형 신경독소 - 아미노산 잔기(1-439)
보툴리눔 G형 신경독소 - 아미노산 잔기(1-441)
파상풍 신경독소 - 아미노산 잔기 (1-457)
IgA 프로테아제 - 아미노산 잔기(1-959)*
*Pohlner, J. 등 (1987). Nature 325, pp. 458-462, 참조에 의해 본 명세서에 통합됨.
아혈청형(sub-serotyep)에 따라 약간의 변화가 일어날 수 있으므로 앞서 확인된 표준 서열은 가이드로 간주되어야 한다. 예로서, US 2007/0166332(그의 참조에 의해 본 명세서에 통합됨)는 하기와 같이 약간 다른 클로스트리디움 서열을 인용한다:
보툴리눔 A형 신경독소 - 아미노산 잔기(M1-K448)
보툴리눔 B형 신경독소 - 아미노산 잔기(M1-K441)
보툴리눔 C형 신경독소 - 아미노산 잔기(M1-K449)
보툴리눔 D형 신경독소 - 아미노산 잔기(M1-R445)
보툴리눔 E형 신경독소 - 아미노산 잔기(M1-R422)
보툴리눔 F형 신경독소 - 아미노산 잔기(M1-K439)
보툴리눔 G형 신경독소 - 아미노산 잔기(M1-K446)
파상풍 신경독소 - 아미노산 잔기(M1-A457)
경쇄를 포함하는 다양한 클로스트리디움 독소 단편은, 이러한 경쇄 단편이 특이적으로 신경전달물질 방출 기구(neurotransmitter release apparatus)의 핵심 성분을 표적화할 수 있고 따라서 전체적인 세포 메커니즘 실행에 참여하여 클로스트리디움 독소가 기질을 단백질 분해에 의해 절단하는 것을 조건으로, 본 발명의 양태에서 유용할 수 있다. 클로스트리디움 독소의 경쇄는 길이가 약 420-460개의 아미노산이고 효소 도메인을 포함한다. 연구는 클로스트리디움 독소 경쇄의 전체 길이가 효소 도메인의 효소 활성을 위해 필요하지 않다는 것을 보여준다. 비-한정적 예로서, BoNT/A 경쇄의 최초 8개의 아미노산은 효소 활성을 위해 필요하지 않다. 또 다른 비-한정적 예로서, TeNT 경쇄의 최초 8개의 아미노산은 효소 활성을 위해 필요하지 않다. 마찬가지로, 경쇄의 카복시-말단은 활성을 위해 필요하지 않다. 비-한정적 예로서, BoNT/A 경쇄의 마지막 32개의 아미노산(잔기 417-448)은 효소 활성을 위해 필요하지 않다. 또 다른 비-한정적 예로서, TeNT 경쇄의 마지막 31개의 아미노산(잔기 427-457)은 효소 활성을 위해 필요하지 않다. 따라서, 본 구체예의 양태는 예를 들면 350개 이상의 아미노산, 375개 이상의 아미노산, 400개 이상의 아미노산, 425개 이상의 아미노산 및 450개 이상의 아미노산의 길이를 갖는 효소 도메인을 포함하는 클로스트리드움 독소 경쇄를 포함할 수 있다. 본 구체예의 다른 양태는 예를 들면 350개 이하의 아미노산, 375개 이하의 아미노산, 400개 이하의 아미노산, 425개 이하의 아미노산 및 450개 이하의 아미노산의 길이를 갖는 효소 도메인을 포함하는 클로스트리드움 독소 경쇄를 포함할 수 있다.
일 구체예에서, 비-세포독성 프로테아제는 SNAP-23 단백질과 같은 비-신경원성(non-neuronal) SNARE 단백질을 절단한다. 일 구체예에서, 비-세포독성 프로테아제는 SNAP-23을 절단할 수 있는 변형된 보툴리눔 독소 경쇄이다. 이러한 변형된 경쇄의 예는 Chen 및 Barbieri, PNAS, vol. 106, no. 23, p9180-9184, 2009에서 설명된다.
일 구체예에서, 비-세포독성 프로테아제는 BoNT/A, BoNT/C 또는 BoNT/E 프로테아제이고, 바람직한 SNARE 모티프(motif)는 SNAP(예를 들면 SNAP 25)모티프이다. 또 다른 구체예에서, 비-세포독성 프로테아제는 BoNT/B, BoNT/D, BoNT/F 또는 BoNT/G 또는 파상풍 신경독소(TeNT) 프로테아제이고, 바람직한 SNARE 모티프는 VAMP 모티프이다. 또 다른 구체예에서, 비-세포독성 프로테아제는 BoNT/C1 프로테아제이고, 바람직한 SNARE 모티프는 신택신 모티프이다.
본 발명의 폴리펩티드, 특히 그의 프로테아제 성분은 페길화(PEGylated)될 수 있다 - 이는 안정성, 예를 들면 프로테아제 성분의 작용의 지속시간(duration) 증가를 도울 수 있다. 페길화는 프로테아제가 BoNT/A, B 또는 C1 프로테아제를 포함하는 경우 특히 바람직하다. 페길화는 바람직하게는 프로테아제 성분의 N-말단으로의 PEG의 첨가를 포함한다. 예로서, 프로테아제의 N-말단은 동일하거나 상이할 수 있는 하나 이상의 아미노산(예를 들면 시스테인) 잔기로 연장될 수 있다. 하나 이상의 상기 아미노산 잔기는 그 부착된(예를 들면 공유 결합에 의해 부착된) 자신의 PEG 분자를 가질 수 있다. 이 기술의 예는 참조에 의해 그 전체가 통합된 WO2007/104567에서 설명된다.
전위 도메인은 프로테아제 활성의 기능적 발현이 표적 세포의 세포질 내에서 발생하도록 표적 세포로 프로테아제를 전위시킬 수 있는 분자이다. 분자(예를 들면 단백질 또는 펩티드)가 본 발명의 필수적인 전위 기능을 갖는지 여부는 다수의 통상적인 분석법 중 하나에 의해 확인될 수 있다.
예를 들면, Shone C. (1987)은 테스트 분자로 시험되는(challenged), 리포좀을 이용한 인 비트로(in vitro) 분석법을 기술한다. 필수적인 전위 기능의 존재는 용이하게 모니터링될 수 있는, K+ 및/또는 표지된 NAD의 리포좀으로부터 분비에 의해 확인된다[Shone C. (1987) Eur. J. Biochem; vol. 167(1): pp. 175-180 참조]. 다른 예는 평면 인지질 이중층 막을 이용하는 간단한 인 비트로 분석법을 기술하는 Blaustein R. (1987)에 의해 제공된다. 막(membrane)은 테스트 분자로 시험되고 필수적인 전위 기능은 상기 막의 전도성 증가에 의해 확인된다[Blaustein (1987) FEBS Letts; vol. 226, no. 1: pp. 115-120 참조]. 막 융합을 평가할 수 있고 따라서 본 발명에 이용하기 적절한 전위 도메인을 확인할 수 있는 추가적인 방법은 Enzymology Vol 220 and 221, Membrane Fusion Techniques, Parts A and B, Academic Press 1993의 방법에 의해 제공된다.
본 발명은 또한 도메인의 변이체(variant domain)가 필수적인 전위 활성을 보이는 한, 전위 도메인의 변이체를 포함한다. 예로서, 변이체는 표준 전위 도메인과 70% 이상, 바람직하게는 80% 이상, 더욱 바람직하게는 90% 이상, 가장 바람직하게는 95% 이상 또는 98% 이상의 아미노산 서열 상동성을 갖는다. 전위 도메인과 관련하여 이용될 때, 용어 단편(fragment)은 표준 전위 도메인의 20개 이상, 바람직하게는 40개 이상, 더욱 바람직하게는 80개 이상, 및 가장 바람직하게는 100개 이상의 아미노산 잔기를 갖는 펩티드를 의미한다. 클로스트리디움 전위 도메인의 경우, 단편은 바람직하게는 100개 이상, 바람직하게는 150개 이상, 더욱 바람직하게는 200개 이상, 및 가장 바람직하게는 250개 이상의 표준 전위 도메인(예를 들면 HN 도메인)의 아미노산 잔기를 갖는다. (앞서 검토된) TM '단편' 성분의 경우와 같이, 본 발명의 전위 '단편'은 표준 서열에 기반한 전위 도메인의 변이체의 단편을 포함한다.
박테리아 독소 분자의 특정 도메인은 이러한 세공(pore)를 형성할 수 있다는 것이 충분히 기록되어 있다. 바이러스에 의해 발현된 막 융합 단백질(virally expressed membrane fusion protein)의 특정 전위 도메인은 이러한 세공을 형성할 수 있다는 것이 또한 알려져 있다. 이러한 도메인이 본 발명에 이용될 수 있다.
전위 도메인은 HN 도메인(또는 그의 기능적 성분)과 같은 클로스트리디움 기원일 수 있다. HN은 중쇄의 아미노-말단 절반(amino-terminal half) 또는 온전한 중쇄의 단편에 상응하는 도메인과 거의 동등한 클로스트리디움 신경독소의 중쇄 부분 또는 단편을 의미한다. 이와 관련하여, HC 세포-결합 기능의 제거가 요구되는 경우, 이는 HC 또는 HCC 아미노산 서열의 결실(뉴클레아제(nuclease) 또는 프로테아제 처리(treatment)에 의해 DNA 합성 수준, 또는 후-합성 수준에서)에 의해 수행될 수 있다. 대안적으로, HC 기능은 화학적 또는 생물학적 처리에 의해 불활성화될 수 있다.
적절한 (표준) 전위 도메인의 예는 하기를 포함한다:
보툴리눔 A형 신경독소 - 아미노산 잔기(449-871)
보툴리눔 B형 신경독소 - 아미노산 잔기(441-858)
보툴리눔 C형 신경독소 - 아미노산 잔기(442-866)
보툴리눔 D형 신경독소 - 아미노산 잔기(446-862)
보툴리눔 E형 신경독소 - 아미노산 잔기(423-845)
보툴리눔 F형 신경독소 - 아미노산 잔기(440-864)
보툴리눔 G형 신경독소 - 아미노산 잔기(442-863)
파상풍 신경독소 - 아미노산 잔기 (458-879)
아혈청형(sub-serotyep)에 따라 약간의 변화가 일어날 수 있으므로 앞서 확인된 표준 서열은 가이드로 간주되어야 한다. 예로서, US 2007/0166332(참조에 의해 본 명세서에 통합됨)는 하기와 같은, 약간 다른 클로스트리디움 서열을 인용한다:
보툴리눔 A형 신경독소 - 아미노산 잔기(A449-K871)
보툴리눔 B형 신경독소 - 아미노산 잔기(A442-S858)
보툴리눔 C형 신경독소 - 아미노산 잔기(T450-N866)
보툴리눔 D형 신경독소 - 아미노산 잔기(D446-N862)
보툴리눔 E형 신경독소 - 아미노산 잔기(K423-K845)
보툴리눔 F형 신경독소 - 아미노산 잔기(A440-K864)
보툴리눔 G형 신경독소 - 아미노산 잔기(S447-S863)
파상풍 신경독소 - 아미노산 잔기(S458-V879)
본 발명의 맥락에서, 전위 도메인을 포함하는 다양한 클로스트리디움 독소 HN 영역은, 이러한 활성 단편이 세포내 소포에서 표적 세포의 세포질로 비-세포독성 프로테아제(예를 들면 클로스트리디움 경쇄)의 분비를 촉진시킬 수 있고 따라서 전체적인 세포 메커니즘 실행에 참여하여 클로스트리디움 독소가 기질을 단백질 분해에 의해 절단하는 것을 조건으로, 본 발명의 양태에서 유용할 수 있다. 클로스트리디움 독소의 중쇄에서 HN 영역은 약 410-430개의 아미노산으로 이루어진 길이이고 전위 도메인을 포함한다. 연구는 클로스트리디움 독소 중쇄에서 HN 영역의 전장는 전위 도메인의 전위 활성을 위해 필요하지 않다는 것을 보여주었다. 따라서 본 구체예의 양태는 예를 들면 350개 이상의 아미노산, 375개 이상의 아미노산, 400개 이상의 아미노산 및 425개 이상의 아미노산의 길이를 갖는 전위 도메인을 포함하는 클로스트리디움 독소 HN 영역을 포함한다. 본 구체예의 다른 양태는 예를 들면 350개 이하의 아미노산, 375개 이하의 아미노산, 400개 이하의 아미노산 및 425개 이하의 아미노산의 길이를 갖는 전위 도메인을 포함하는 클로스트리디움 독소 HN 영역을 포함할 수 있다.
클로스트리디움 보툴리눔 및 클로스트리디움 테타니에서 독소 생성의 유전적 기초에 대한 더 자세한 내용은, Henderson 등 (1997) in The Clostridia: Molecular Biology and Pathogenesis, Academic press을 참조한다. 용어 HN은 천연 신경독소 HN 부분 및 변형된 HN 부분이 앞서 언급한 전위 기능을 보여주는 한, 자연적으로 발생하지 않는 아미노산 서열 및/또는 합성 아미노산 잔기를 갖는 변형된 HN 부분을 포함한다.
대안적으로, 전위 도메인은 비-클로스트리디움 기원일 수 있다. 비-클로스트리디움 (표준) 전위 도메인 기원의 예는 디프테리아 독소의 전위 도메인[O’Keefe et al., Proc. Natl. Acad. Sci. USA (1992) 89, 6202-6206; Silverman et al., J. Biol. Chem. (1993) 269, 22524-22532; and London, E. (1992) Biochem. Biophys. Acta., 1112, pp.25-51], 슈도모나스(pseudomonas) 외독소 A형의 전위 도메인[Prior 등. Biochemistry (1992) 31, 3555-3559], 탄저병(anthrax) 독소의 전위 도메인[Blanke 등. Proc. Natl. Acad. Sci. USA (1996) 93, 8437-8442], 다양한 전위 기능의 융합성(fusogenic) 또는 소수성 펩티드[Plank et al. J. Biol. Chem. (1994) 269, 12918-12924; and Wagner et al (1992) PNAS, 89, pp.7934-7938], 및 양친매성(amphiphilic) 펩티드[Murata et al (1992) Biochem., 31, pp.1986-1992]를 포함하나, 이에 한정되지 않는다. 전위 도메인은 천연 단백질에 존재하는 전위 도메인을 반영할 수 있거나, 또는 변이가 전위 도메인의 전위 능력을 파괴하지 않는 한, 아미노산 변이체를 포함할 수 있다.
본 발명에 이용하기 적절한 바이러스 전위 도메인의 구체적인 예는 바이러스에 의해 발현된 막 융합 단백질(virally expressed membrane fusion protein)의 특정 전위 도메인을 포함한다. 예를 들면, Wagner 등 (1992) 및 Murata 등 (1992)은 인플루엔자 바이러스 헤마글루티닌(haemagglutinin)의 N-말단 부위에서 유래된 다수의 융합성(fusogenic) 및 양친매성 펩티드의 전위(즉 막 융합 및 소포형성) 기능을 설명한다. 원하는 전위 활성을 갖는 것으로 알려진, 기타 바이러스에 의해 발현된 막 융합 단백질은 셈리키 포레스트 바이러스(Semliki Forest Virus)(SFV)의 융합성 펩티드의 전위 도메인, 수포성 구내염 바이러스(vesicular stomatitis virus)(VSV) 당단백질 G의 전위 도메인, SER 바이러스 F 단백질의 전위 도메인 및 포미 바이러스(Foamy virus) 외피 당단백질의 전위 도메인이다. 바이러스에 의해 코딩된 Aspike 단백질, 예를 들면 SFV의 E1 단백질 및 VSV의 G단백질은 본 발명의 맥락에서 특정 적용을 갖는다.
(표준) 전위 도메인의 용도는 그의 서열 변이체의 용도를 포함한다. 변이체는, 변이체가 필수적인 전위 기능을 보유하는 것을 조건으로, 하나 이상의 보존적 핵산 치환 및/또는 핵산 결실 또는 삽입을 포함한다. 변이체는 또한, 변이체가 필수적인 전위 기능을 보유하는 한, 하나 이상의 아미노산 치환 및/또는 아미노산 결실 또는 삽입을 포함한다.
본 발명의 폴리펩티드는 전위 촉진 도메인을 더 포함할 수 있다. 상기 도메인은 비-세포독성 프로테아제를 표적 세포의 세포질로 전달하는 것을 촉진하고 예를 들면, WO 08/008803 및 WO 08/008805에서 설명되고, 이들 각각은 참조에 의해 본 명세서에 통합된다.
예로서, 적절한 전위 촉진 도메인은 외피보유(enveloped) 바이러스 융합성 펩티드 도메인을 포함하고, 예를 들면 적절한 융합성 펩티드 도메인은 인플루엔자 바이러스 융합성 펩티드 도메인(예를 들면, 23개 아미노산의 인플루엔자 A 바이러스 융합성 단백질 도메인), 알파바이러스 융합성 펩티드 도메인(예를 들면, 26개 아미노산의 셈리키 포레스트 바이러스 융합성 펩티드 도메인), 수포성 바이러스(vesiculovirus) 융합성 펩티드 도메인(예를 들면 21개 아미노산의 수포성 구내염 바이러스 융합성 펩티드 도메인), 레스피로바이러스(respirovirus) 융합성 펩티드 도메인(예를 들면, 25개 아미노산의 센다이(sendai) 바이러스 융합성 펩티드 도메인), 모빌리바이러스(morbiliivirus) 융합성 펩티드 도메인(예를 들면, 25개 아미노산의 개 홍역 바이러스(Canine distemper virus) 융합성 펩티드 도메인), 아불라바이러스 (avulavirus) 융합성 펩티드 도메인(예를 들면, 25개 아미노산의 뉴캐슬병 바이러스 융합성 펩티드 도메인), 헤니파바이러스(henipavirus) 융합성 펩티드 도메인(예를 들면, 25개 아미노산의 헨드라 바이러스 융합성 펩티드 도메인), 메타뉴모바이러스(metapneumovirus) 융합성 펩티드 도메인(예를 들면, 25개 아미노산의 인간 메타뉴모바이러스 융합성 펩티드 도메인) 또는 유인원 포말 바이러스(simian foamy virus) 융합성 펩티드 도메인과 같은 스푸마바이러스(spumavirus) 융합성 펩티드 도메인; 또는 그의 단편 또는 변이체를 포함한다.
추가적 예로서, 전위 촉진 도메인(translocation facilitating domain)은 클로스트리디움 독소 HCN 도메인 또는 그의 단편 또는 변이체를 포함할 수 있다. 더 자세하게는, 클로스트리디움 독소 HCN 전위 촉진 도메인은 200개 이상의 아미노산, 225개 이상의 아미노산, 250개 이상의 아미노산, 275개 이상의 아미노산의 길이를 가질 수 있다. 이와 관련하여, 클로스트리디움 독소 HCN 전위 촉진 도메인은 바람직하게는 200개 이하의 아미노산, 225개 이하의 아미노산, 250개 이하의 아미노산, 또는 275개 이하의 아미노산의 길이를 갖는다. 구체적인 (표준) 예는 하기를 포함한다:
보툴리눔 A형 신경독소 - 아미노산 잔기(872-1110)
보툴리눔 B형 신경독소 - 아미노산 잔기(859-1097)
보툴리눔 C형 신경독소 - 아미노산 잔기(867-1111)
보툴리눔 D형 신경독소 - 아미노산 잔기(863-1098)
보툴리눔 E형 신경독소 - 아미노산 잔기(846-1085)
보툴리눔 F형 신경독소 - 아미노산 잔기(865-1105)
보툴리눔 G형 신경독소 - 아미노산 잔기(864-1105)
파상풍 신경독소 - 아미노산 잔기 (880-1127)
전술된 서열 위치는 혈청형/아형에 따라 약간 변할 수 있고, 적절한 (표준) 클로스트리디움 독소 HCN 도메인의 추가적 예는 하기를 포함한다:
보툴리눔 A형 신경독소 - 아미노산 잔기(874-1110)
보툴리눔 B형 신경독소 - 아미노산 잔기(861-1097)
보툴리눔 C형 신경독소 - 아미노산 잔기(869-1111)
보툴리눔 D형 신경독소 - 아미노산 잔기(865-1098)
보툴리눔 E형 신경독소 - 아미노산 잔기(848-1085)
보툴리눔 F형 신경독소 - 아미노산 잔기(867-1105)
보툴리눔 G형 신경독소 - 아미노산 잔기(866-1105)
파상풍 신경독소 - 아미노산 잔기 (882-1127)
앞선 기술한 촉진 도메인은 앞서 기술한 본 발명에 이용하기 적합한 전위 도메인 펩티드와 조합될 수 있다. 따라서, 예로서, 비-클로스트리디움(non-clostridial) 촉진 도메인은 비-클로스트리디움 전위 도메인 펩티드 또는 클로스트리디움 전위 도메인 펩티드와 조합될 수 있다. 대안적으로, 클로스트리디움 독소 HCN 전위 촉진 도메인은 비-클로스트리디움 전위 도메인 펩티드와 조합될 수 있다. 대안적으로, 클로스트리디움 독소 HCN 촉진 도메인은 클로스트리디움 전위 도메인 펩티드와 조합될 수 있고, 그 예는 하기를 포함한다:
보툴리눔 A형 신경독소 - 아미노산 잔기(449-1110)
보툴리눔 B형 신경독소 - 아미노산 잔기(442-1097)
보툴리눔 C형 신경독소 - 아미노산 잔기(450-1111)
보툴리눔 D형 신경독소 - 아미노산 잔기(446-1098)
보툴리눔 E형 신경독소 - 아미노산 잔기(423-1085)
보툴리눔 F형 신경독소 - 아미노산 잔기(440-1105)
보툴리눔 G형 신경독소 - 아미노산 잔기(447-1105)
파상풍 신경독소 - 아미노산 잔기 (458-1127)
서열 상동성(
Sequence
homology
)
다양한 서열 정렬(alignment) 방법은, 전체적인(global) 방법, 지역적인(local) 방법 및 혼합(hybrid) 방법, 예를 들면 단편 접근법과 같은 방법을 포함하나 이에 한정되지 않는 퍼센트 동일성(percent identity)을 결정하는데 이용될 수 있다. 퍼센트 동일성을 결정하기 위한 프로토콜은 당업자의 범위 내에서 일상적인 절차이다. 전체적인 방법은 분자의 처음부터 끝까지 서열을 정렬시키고 개별 잔기 쌍의 점수를 합하고 간격(gap)에는 벌점을 부과하여 최적의 정렬을 결정한다. 비-한정적인 방법은 예를 들면, 하기를 포함한다: CLUSTAL W, 예를 들면 Julie D. Thompson 등, CLUSTAL W: Improving the Sensitivity of Progressive Multiple Sequence Alignment Through Sequence Weighting, Position- Specific Gap Penalties and Weight Matrix Choice, 22(22) Nucleic Acids Research 4673-4680 (1994) 참조; 및 반복 정제(iterative refinement), 예를 들면 Osamu Gotoh, Significant Improvement in Accuracy of Multiple Protein: Sequence Alignments by Iterative Refinement as Assessed by Reference to Structural Alignments, 264(4) J. MoI. Biol. 823-838 (1996) 참조. 지역적인 방법은 모든 입력 서열에 의해 공유되는 하나 이상의 보존된 모티프를 확인하는 것에 의해 서열을 정렬시킨다. 비-한정적인 방법은 하기를 포함한다: 매치-박스(Match-box), 예를 들면 Eric Depiereux 및 Ernest Feytmans, Match-Box: A Fundamentally New Algorithm for the Simultaneous Alignment of Several Protein Sequences, 8(5) CABIOS 501-509 (1992) 참조; 깁스 샘플링(Gibbs sampling), 예를 들면, C. E. Lawrence 등, Detecting Subtle Sequence Signals: A Gibbs Sampling Strategy for Multiple Alignment, 262(5131) Science 208-214 (1993) 참조; Align-M, 예를 들면 Ivo Van WaIIe 등, Align-M - A New Algorithm for Multiple Alignment of Highly Divergent Sequences, 20(9) Bioinformatics:1428-1435 (2004) 참조. 따라서, 퍼센트 서열 동일성은 통상적인 방법에 의해 결정된다. 예를 들면 Altschul 등, Bull . Math. Bio . 48: 603-16, 1986 및 Henikoff and Henikoff, Proc . Natl . Acad . Sci . USA 89:10915-19, 1992. 참조. 요약하면, 두 개의 아미노산 서열은 간격 열림(gap opening)에 10점 감점, 간격 확장(gap extension)에 1점 감점, 및 Henikoff 및 Henikoff의 "blosum 62" 점수 메트릭스를 이용하여 정렬 점수가 최적화되도록 정렬된다.
실질적인 상동 폴리펩티드는 하나 이상의 아미노산 치환, 결실 또는 첨가를갖는 것을 특징으로 한다. 바람직하게는, 이러한 변화, 즉, 폴리펩티드의 폴딩 또는 활성에 유의성 있게 영향을 주지 않는 보존적 아미노산 치환(하기 참조) 및 기타 치환; 일반적으로 1 내지 약 30개의 아미노산의, 짧은(small) 결실; 및 아미노-말단 메티오닌 잔기, 약 20-25 잔기까지의 짧은 링커 펩티드, 또는 친화성 태그와 같은 짧은 아미노- 또는 카르복실-말단의 연장은, 중요하지 않은 속성이다.
보존적 아미노산 치환
염기성: 아르기닌; 리신; 히스티딘
산성: 글루탐산; 아스파르트산;
극성: 글루타민; 아스파라긴
소수성: 류신; 이소류신; 발린
방향족: 페닐알라닌; 트립토판; 티로신
소형: 글리신; 알라닌; 세린; 트레오닌; 메티오닌
20개의 표준 아미노산 이외에, 비-표준 아미노산(예를 들면, 4-하이드록시프롤린, 6-N-메틸 라이신, 2-아미노이소부티르 산, 이소발린, 및 α-메틸 세린)이 본 발명의 폴리펩티드의 아미노산 잔기를 치환할 수 있다. 제한된 수의 비-보존적 아미노산, 유전자 코드에 의해 코딩되지 않는 아미노산, 자연에 없는(unnatural) 아미노산이 클로스트리디움 폴리펩티드 아미노산 잔기를 치환할 수 있다. 본 발명의 폴리펩티드는 또한 비-천연(non-naturally occurring) 아미노산 잔기를 포함할 수 있다.
비-자연발생 아미노산은 트랜스-3-메틸프롤린, 2,4-메타노-프롤린, 시스-4-하이드록시프롤린, 트랜스-4-하이드록시-프롤린, N-메틸글리신, 알로-트레오닌, 메틸-트레오닌, 하이드록시-에틸시스테인, 하이드록시에틸호모-시스테인, 니트로-글루타민, 호모글루타민, 피페콜린 산, 터트-류신(tert-leucine), 노르발린, 2-아자페닐알라닌, 3-아자페닐-알라닌, 4-아자페닐-알라닌, 및 4-플루오로페닐알라닌을 포함하나 이에 한정되지 않는다. 비-천연 아미노산 잔기를 단백질에 통합시키는 여러 방법이 당업계에 공지되어 있다. 예를 들면, 넌센스 돌연변이가 화학적으로 아미노아실화된 억제 tRNA를 이용하여 억제되는 인 비트로 시스템이 이용될 수 있다. 아미노산 합성 방법 및 tRNA 아미노아실화 방법은 당업계에 공지되어 있다. 넌센스 돌연변이를 포함하는 플라스미드의 전사 및 번역은 E. coli S30 추출물 및 상업적으로 이용가능한 효소 및 기타 시약을 포함하는 무세포 시스템(cell free system)에서 수행된다. 단백질은 크로마토그래피에 의해 정제된다. 예를 들면, Robertson 등., J. Am . Chem . Soc. 113:2722, 1991; Ellman 등, Methods Enzymol. 202:301, 1991; Chung 등, Science 259:806-9, 1993; 및 Chung 등, Proc . Natl . Acad . Sci . USA 90:10145-9, 1993 참조. 두 번째 방법에서, 번역은 돌연변이된 mRNA 및 화학적으로 아미노아실화된 억제 tRNA의 미세주입(microinjection)에 의해 발톱개구리(Xenopus)의 난자에서 수행된다(Turcatti et al., J. Biol . Chem . 271:19991-8, 1996). 세 번째 방법에서, E.coli 세포는 치환될 천연 아미노산(예를 들면 페닐알라닌)의 부재 및 원하는 비-천연 아미노산(예를 들면, 2-아자페닐알라닌, 3-아자페닐알라닌, 4-아자페닐알라닌, 또는 4-플루오로페닐알라닌)의 존재 하에 배양된다. 비-천연 아미노산은 그의 천연 대응물(counterpart) 대신 폴리펩티드로 통합된다. Koide 등, Biochem. 33:7470-6, 1994, 참조. 천연 아미노산 잔기는 인 비트로 화학적 변형에 의해 비-천연 종으로 변환될 수 있다. 치환의 범위를 더 확장하기 위하여, 화학적 변형이 부위-지정 돌연변이유발과 조합될 수 있다(Wynn 및 Richards, Protein Sci. 2:395-403, 1993).
제한된 수의 비-보존적 아미노산, 유전자 코드에 의해 코딩되지 않는 아미노산, 비-천연 아미노산, 및 자연에 없는(unnatural) 아미노산이 본 발명의 폴리펩티드의 아미노산 잔기를 치환할 수 있다.
본 발명의 폴리펩티드의 필수 아미노산은 부위-지정 돌연변이유발 또는 알라닌-스캐닝 돌연변이유발과 같은 당업계에 알려진 절차에 따라 확인될 수 있다 (Cunningham 및 Wells, Science 244: 1081-5, 1989). 생물학적 상호작용의 부위는 또한, 추정적 접촉 부위 아미노산의 돌연변이와 함께, 핵 자기 공명, 결정학, 전자 회절 또는 광친화성 표지화(photoaffinity labeling)와 같은 기법에 의해 결정되는, 구조의 물리적 분석에 의해 결정될 수 있다. 예를 들면, de Vos 등., Science 255:306-12, 1992; Smith 등, J. Mol . Biol. 224:899-904, 1992; Wlodaver 등, FEBS Lett. 309:59-64, 1992, 참조. 필수 아미노산의 실체(identity)는 또한 본 발명의 폴리펩티드의 관련 성분(예를 들면 전위 또는 프로테아제 성분)과의 상동성 분석으로부터 유추될 수 있다.
복수의 아미노산 치환이 Reidhaar-Olson 및 Sauer (Science 241:53-7, 1988) 또는 Bowie 및 Sauer (Proc . Natl . Acad . Sci . USA 86:2152-6, 1989)에 의해 개시된 것과 같은 돌연변이유발 및 스크리닝의 알려진 방법을 이용하여 이루어지고 테스트될 수 있다. 요약하면, 이러한 저자들은 폴리펩티드의 2개 이상의 위치를 동시에 랜덤화하고, 기능적 폴리펩티드를 선별하고, 및 그 후 각 위치에서 허용가능한 치환의 스펙트럼을 결정하기 위하여 돌연변이유발된 폴리펩티드의 서열을 결정하는 방법을 개시한다. 이용할 수 있는 다른 방법은 파지 디스플레이(예를 들면 Lowman 등, Biochem . 30:10832-7, 1991; Ladner 등, U.S. Patent No. 5,223,409; Huse, WIPO Publication WO 92/06204) 및 영역-지정 돌연변이유발(region-directed mutagenesis)(Derbyshire 등, Gene 46:145, 1986; Ner 등, DNA 7:127, 1988)을 포함한다.
복수의 아미노산 치환이 Reidhaar-Olson 및 Sauer (Science 241:53-7, 1988) 또는 Bowie 및 Sauer (Proc . Natl . Acad . Sci . USA 86:2152-6, 1989)에 의해 개시된 것과 같은 돌연변이유발 및 스크리닝의 알려진 방법을 이용하여 이루어지고 테스트될 수 있다. 요약하면, 이러한 저자들은 폴리펩티드의 2개 이상의 위치를 동시에 랜덤화하고, 기능적 폴리펩티드를 선별하고, 및 그 후 각 위치에서 허용가능한 치환의 스펙트럼을 결정하기 위하여 돌연변이유발된 폴리펩티드의 서열을 결정하는 방법을 개시한다. 이용할 수 있는 다른 방법은 파지 디스플레이(예를 들면 Lowman 등, Biochem . 30:10832-7, 1991; Ladner 등, U.S. Patent No. 5,223,409; Huse, WIPO Publication WO 92/06204) 및 영역-지정 돌연변이유발(region-directed mutagenesis)(Derbyshire 등, Gene 46:145, 1986; Ner 등, DNA 7:127, 1988)을 포함한다.
실시예의
요약 설명
실시예 1 HN 도메인의 C-말단에 GnRH 폴리펩티드를 통합하는 LHD 단백질의 생성
실시예 2 HN 도메인의 C-말단에 GnRH 폴리펩티드를 통합하는 LHA 단백질의 생성
실시예 3 두 개의 상이한 프로테아제 인식 부위가 통합된, HN 도메인의 C-말단에 GnRH 폴리펩티드를 통합하는 LHD 단백질의 생성
실시예 4 HN 도메인의 C-말단에 GnRH 폴리펩티드를 통합하는 LHD 단백질의 제조 방법
실시예 5 웨스턴 블랏팅에 의한, 공유 결합으로 부착된 리간드 존재의 입증
실시예 6 질량 분석법에 의한, 공유 결합으로 부착된 TM 존재의 입증
실시예 7 GnRH 폴리펩티드를 통합하는 LHD 단백질의 결합 능력 평가
실시예 8 GnRH 폴리펩티드를 통합하는 LHD 단백질의 인 비트로 기능성 평가
실시예 9 HN 도메인의 C-말단에 디놀핀 및 브래디키닌 폴리펩티드를 통합하는 LHD 단백질의 생성
실시예 10 HN 도메인의 C-말단에 베타-엔돌핀 및 브래디키닌 폴리펩티드를 통합하는 LHA 단백질의 생성
실시예 11 HN 도메인의 C-말단에 두 개의 GHRH 폴리펩티드를 통합하는 LHD 단백질의 생성
실시예 12 제 2 프로테아제 활성화 부위로부터 5개의 아미노산만큼 떨어진(spaced), HN 도메인의 C-말단에 GnRH 폴리펩티드를 통합하는 LHD 단백질의 생성
실시예 13 HN 도메인의 C-말단에 가스트린 분비 펩티드를 통합하는 LHA 단백질의 생성
실시예 14 전립선암 환자의 치료 방법
실시예 15 신경성 염증 환자의 치료 방법
실시예 16 자궁내막증 환자의 치료방법
도 1은 환원 및 비-환원 조건에서 실시예 4의 활성화된 샘플(80 mM + 250 mM의 이미다졸 분획에서 용출)의 SDS-PAGE 분석을 보여준다.
서열번호의 간단한 설명
하기의 서열번호 모두는 최초 메티오닌 아미노산 잔기(또는 그에 상응하는 N-말단 핵산 코돈/서열)를 제외할 수 있다.
서열번호 1 LHD-GnRH의 DNA 서열
서열번호 2 LHD-GnRH의 단백질 서열
서열번호 3 LHA-GnRH의 DNA 서열
서열번호 4 LHA-GnRH의 단백질 서열
서열번호 5 두 개의 상이한 프로테아제 부위를 갖는 LHD-GnRH의 DNA 서열
서열번호 6 두 개의 상이한 프로테아제 부위를 갖는 LHD-GnRH의 단백질 서열
서열번호 7 HN 도메인의 C-말단에 디놀핀 및 브래디키닌 폴리펩티드를 통합하는 LHD의 DNA 서열
서열번호 8 HN 도메인의 C-말단에 디놀핀 및 브래디키닌 폴리펩티드를 통합하는 LHD의 단백질 서열
서열번호 9 HN 도메인의 C-말단에 베타-엔돌핀 및 브래디키닌 폴리펩티드를 통합하는 LHA의 DNA 서열
서열번호 10 HN 도메인의 C-말단에 베타-엔돌핀 및 브래디키닌 폴리펩티드를 통합하는 LHA의 단백질 서열
서열번호 11 HN 도메인의 C-말단에 두 개의 GHRH 폴리펩티드를 통합하는 LHD의 DNA 서열
서열번호 12 HN 도메인의 C-말단에 두 개의 GHRH 폴리펩티드를 통합하는 LHD의 단백질 서열
서열번호 13 HN 도메인의 C-말단에 GnRH를 통합하는 LHD의 DNA 서열
서열번호 14 HN 도메인의 C-말단에 GnRH를 통합하는 LHD의 단백질 서열
서열번호 15 HN 도메인의 C-말단에 가스트린 분비 펩티드를 통합하는 LHA의 DNA 서열
서열번호 16 HN 도메인의 C-말단에 가스트린 분비 펩티드를 통합하는 LHA 단백질 서열
서열번호의 간단한 설명
하기의 서열번호 모두는 최초 메티오닌 아미노산 잔기(또는 그에 상응하는 N-말단 핵산 코돈/서열)를 제외할 수 있다.
서열번호 1 LHD-GnRH의 DNA 서열
서열번호 2 LHD-GnRH의 단백질 서열
서열번호 3 LHA-GnRH의 DNA 서열
서열번호 4 LHA-GnRH의 단백질 서열
서열번호 5 두 개의 상이한 프로테아제 부위를 갖는 LHD-GnRH의 DNA 서열
서열번호 6 두 개의 상이한 프로테아제 부위를 갖는 LHD-GnRH의 단백질 서열
서열번호 7 HN 도메인의 C-말단에 디놀핀 및 브래디키닌 폴리펩티드를 통합하는 LHD의 DNA 서열
서열번호 8 HN 도메인의 C-말단에 디놀핀 및 브래디키닌 폴리펩티드를 통합하는 LHD의 단백질 서열
서열번호 9 HN 도메인의 C-말단에 베타-엔돌핀 및 브래디키닌 폴리펩티드를 통합하는 LHA의 DNA 서열
서열번호 10 HN 도메인의 C-말단에 베타-엔돌핀 및 브래디키닌 폴리펩티드를 통합하는 LHA의 단백질 서열
서열번호 11 HN 도메인의 C-말단에 두 개의 GHRH 폴리펩티드를 통합하는 LHD의 DNA 서열
서열번호 12 HN 도메인의 C-말단에 두 개의 GHRH 폴리펩티드를 통합하는 LHD의 단백질 서열
서열번호 13 HN 도메인의 C-말단에 GnRH를 통합하는 LHD의 DNA 서열
서열번호 14 HN 도메인의 C-말단에 GnRH를 통합하는 LHD의 단백질 서열
서열번호 15 HN 도메인의 C-말단에 가스트린 분비 펩티드를 통합하는 LHA의 DNA 서열
서열번호 16 HN 도메인의 C-말단에 가스트린 분비 펩티드를 통합하는 LHA 단백질 서열
하기에 실시예에 의해 예시되는, 본 발명의 특정 구체예의 설명이 제공된다.
실시예
1
H
N
도메인의 C-말단에
GnRH
폴리펩티드를 통합하는
LHD
단백질의 생성
BoNT/D의 LHN 단편과 10개의 아미노산 펩티드 GnRH의 유전적 융합(genetic fusion)에 의해 구축된 키메라 단백질의 일차(primary) 서열을 인자 Xa의 원형의(prototypical) 인식 부위(IEGR)와 닮은 아미노산 배열(string)의 존재에 대하여 검토한다. 이러한 배열이 발견되지 않을 때, LC-HN 접합부에서 융합 단백질을 활성화하고 또한 HN과 TM(GnRH) 사이의 펩티드 결합을 절단하기 위한 프로테아제로 FXa를 이용하는 선택이 이루어진다.
N-말단에서 C-말단으로, 하기의 구조를 갖는 융합 단백질을 코딩하는, E. coli 발현에 최적화된 DNA를 Entelechon(독일)에서 상업적으로 얻는다:
● 10개의 His N-말단(10 His N-terminal) 정제 태그,
● 10개의 아스파라긴 아미노산 스페이서,
● BoNT/D의 LC,
● FXa의 기질인 테트라 펩티드 IEGR을 통합하도록 변형된, BoNT/A에서 발견되는 것과 유사한 일차 서열을 갖는 인터-도메인 링커(inter-domain linker),
● C-말단 시스테인을 통합하도록 변형된 BoNT/D의 HN
● C-말단에 IEGR 펩티드 서열을 통합하는 Gly-Gly-Gly-Gly-Ser 스페이서
● 6번 자리에 천연 글리신 대신 시스테인 잔기를 통합하도록 변형된 10개의 아미노산으로 이루어진 GnRH 펩티드(QHWSYCLRPG).
구성(construction)이 열등한(poor) 코돈 이용을 초래하지 않는다는 것을 확실하게 하기 위하여 Graphical Codon Usage Analyser (Geneart)과 같은 소프트웨어 프로그램을 참조하여 E.coli 코돈의 이용을 평가하고, 공개된 코돈 이용 테이블(codon usage table)(예를 들면 GenBank Release 143, 2004년 9월 13일)을 참조하여 %GC 함량 및 코돈 이용 비율을 평가하였다. E.coli 숙주로의 형질전환 전에 표준 클로닝 벡터, 예를 들면 pCR4에 DNA를 통합시켰다. 서열 결정에 의해 ORF DNA의 완전성(integrity)을 확인하였다. 최종 ORF는 서열번호 1로 표시되고 발현 생성물의 아미노산 서열은 서열번호 2로 표시된다.
실시예
2
H
N
도메인의 C-말단에
GnRH
폴리펩티드를 통합하는
LHA
단백질의 생성
BoNT/A의 LHN 단편과 10개의 아미노산 펩티드 GnRH의 유전적 융합에 의해 구축된 키메라 단백질의 일차 서열을 인자 Xa의 원형의 인식 부위(IEGR)와 닮은 아미노산 배열의 존재에 대하여 검토한다. 이러한 배열이 발견되지 않을 때, LC-HN 접합부에서 융합 단백질을 활성화하고 또한 HN과 TM(GnRH) 사이의 펩티드 결합을 절단하기 위한 프로테아제로 FXa를 이용하는 선택이 이루어진다.
N-말단에서 C-말단으로, 하기의 구조를 갖는 융합 단백질을 코딩하는, E. coli 발현에 최적화된 DNA는 Entelechon(독일)에서 상업적으로 얻는다:
● 10개의 His N-말단 정제 태그,
● 10개의 아스파라긴 아미노산 스페이서,
● BoNT/A의 LC,
● FXa의 기질인 테트라 펩티드 IEGR을 통합하도록 변형된, BoNT/A에서 발견되는 것과 유사한 일차 서열을 갖는 인터-도메인 링커,
● C-말단 시스테인을 통합하도록 변형된 BoNT/A의 HN,
● C-말단에 IEGR 펩티드 서열을 통합하는 Gly-Gly-Gly-Gly-Ser 스페이서
● 6번 자리에 천연 글리신 대신 시스테인 잔기를 통합하도록 변형된 10개의 아미노산으로 이루어진 GnRH 펩티드.
구성이 열등한 코돈 이용을 초래하지 않는다는 것을 확실하게 하기 위하여 Graphical Codon Usage Analyser (Geneart)과 같은 소프트웨어 프로그램을 참조하여 E.coli 코돈의 이용을 평가하고, 공개된 코돈 이용 테이블(codon usage table)(예를 들면 GenBank Release 143, 2004년 9월 13일)을 참조하여 %GC 함량 및 코돈 이용 비율을 평가하였다. E.coli 숙주로의 형질전환 전에 표준 클로닝 벡터, 예를 들면 pCR4에 DNA를 통합시켰다. 서열 결정에 의해 ORF DNA의 완전성을 확인하였다. 최종 ORF는 서열번호 3으로 표시되고 발현 생성물의 아미노산 서열은 서열번호 4로 표시된다.
실시예
3
두 개의 상이한 프로테아제 인식 부위가 통합된,
H
N
도메인의 C-말단에
GnRH
폴리펩티드를 통합하는
LHD
단백질의 생성
BoNT/D의 LHN 단편과 10개의 아미노산 펩티드 GnRH의 유전적 융합에 의해 구축된 키메라 단백질의 일차 서열을 인자 Xa 및 엔테로키나아제(DDDDK)의 원형의 인식 부위(IEGR)와 닮은 아미노산 배열의 존재에 대하여 검토한다. 이러한 배열이 발견되지 않을 때, LC-HN 접합부에서 융합 단백질을 활성화하기 위한 프로테아제 및 HN과 TM(GnRH) 사이의 펩티드 결합을 절단하기 위한 엔테로키나아제로 FXa를 이용하는 선택이 이루어진다.
N-말단에서 C-말단으로, 하기의 구조를 갖는 융합 단백질을 코딩하는, E. coli 발현에 최적화된 DNA는 Entelechon(독일)에서 상업적으로 얻는다:
● 10개의 His N-말단 정제 태그,
● 10개의 아미노산 아스파라긴 스페이서,
● BoNT/D의 LC,
● FXa의 기질인 테트라 펩티드 IEGR를 통합하도록 변형된, BoNT/A에서 발견되는 것과 유사한 일차 서열을 갖는 인터-도메인 링커,
● C-말단 시스테인을 통합하기 위해 변형된 BoNT/D의 HN,
● C-말단에 DDDDK 펩티드 서열을 통합하는 Gly-Gly-Gly-Gly-Ser 스페이서
● 6번 자리에 천연 글리신 대신 시스테인 잔기를 통합하도록 변형된 10개의 아미노산으로 이루어진 GnRH 펩티드.
구성이 열등한 코돈 이용을 초래하지 않는다는 것을 확실하게 하기 위하여 Graphical Codon Usage Analyser (Geneart)과 같은 소프트웨어 프로그램을 참조하여 E.coli 코돈의 이용을 평가하고, 공개된 코돈 이용 테이블(codon usage table)(예를 들면 GenBank Release 143, 2004년 9월 13일)을 참조하여 %GC 함량 및 코돈 이용 비율을 평가하였다. E.coli 숙주로의 형질전환 전에 표준 클로닝 벡터, 예를 들면 pCR4에 DNA를 통합시켰다. 서열 결정에 의해 ORF DNA의 완전성을 확인하였다. 최종 ORF는 서열번호 5로 표시되고 발현 생성물의 아미노산 서열은 서열번호 6으로 표시된다.
실시예
4
H
N
도메인의 C-말단에
GnRH
폴리펩티드를 통합하는
LHD
단백질의 제조 방법
실시예 1에서 생성된 ORF를 E.coli 발현 벡터(유동성(mobilisation) 결핍을 보장하기 위해 변형된 pET(Novagen) 벡터)로 클로닝하고, E.coli 숙주 균주, 가장 일반적인 BL21에 형질전환하였다.
LHD-GnRH 융합 단백질의 발현은 하기의 프로토콜을 이용하여 달성된다. LHD-GnRH 발현 균주의 단일 콜로니를 250ml 플라스크 중 0.2% 글루코오스 및 암피실린 100㎍/ml를 포함하는 변형된 TB 100ml를 접종한다. 37℃, 225rpm으로 16시간 배양물을 배양한다. 10ml의 밤새 배양한 배양물로 2x2L 플라스크에 0.2% 글루코오스 및 암피실린 100㎍/ml를 포함하는 변형된 TB 2x1L를 접종한다. 약 0.5의 OD600nm에 도달될 때까지 37℃에서 배양하고 그 시점에서 온도를 16℃까지 감소시킨다. 1시간 후 1mM IPTG로 배양물을 유도하고 16시간 더 16℃에서 배양한다. 배양물을 원심분리하여 32.5g의 세포 페이스트(paste)를 얻었다.
LHD-GnRH 융합체의 정제는 친화성 크로마토그래피에 의해 달성된다. 구체적으로, 25ml의 50mM HEPES pH 7.2, 200mM NaCl 및 약 10g의 E.coli BL21 세포 페이스트를 포함하는 팔콘 튜브를 해동한다. 샘플을 차갑게 유지하면서, 22 마이크론의 파워로 세포 페이스트를 얼음에서 30초 초음파 처리하고, 30초 쉬는 사이클을 10사이클 반복한다. 용해된 세포를 18000rpm, 4℃에서 30분간 스핀한다. 상층액을 50mM HEPES pH 7.2, 200mM NaCl로 평형화시킨 His Trap HP Chelating 컬럼(5ml 컬럼이 충분하다)에 로딩한다. 비-특이적으로 결합된 단백질을 세척하기 위해 40mM 이미다졸의 첨가 후, 80mM 이미다졸, 250mM 이미다졸, 500mM 이미다졸의 단계적 구배로 융합 단백질을 용출한다. 용출된 융합 단백질을 4℃에서 밤새 50mM HEPES pH 7.2, 200mM NaCl 5L에 대하여 투석하고 투석된 융합 단백질의 OD를 측정한다. 융합단백질 mg 당 10U의 인자 Xa를 첨가하고 25℃ 항온으로 밤새 인큐베이션한다. 50mM HEPES pH 7.2, 200mM NaCl로 평형화시킨 His Trap HP Chelating 컬럼(5ml 컬럼이 충분하다)에 로딩한다. 50mM HEPES pH 7.2, 200mM NaCl로 베이스라인(baseline)까지 컬럼을 세척한다. 10 및 40mM 이미다졸의 단계적 구배를 이용하여, 비-특이적으로 결합된 단백질을 세척하고 100mM 이미다졸로 융합 단백질을 용출한다. 용출된 융합 단백질을 4℃에서 밤새 25mM Tris, 200mM NaCl, pH 8.0의 5L에 대하여 투석하고 약 2mg/ml로 융합물을 농축하고, 샘플을 분주하고, -20℃에서 동결한다. OD, BCA 및 순도 분석을 이용하여 정제된 단백질을 테스트한다.
활성화된 단백질의 샘플은 환원 및 비-환원 조건에서 SDS-PAGE에 의해 분석된다. 80mM 및 250mM 이미다졸 부분에서 용출된 샘플을 분석한다 - 도 1 참조.
실시예
5
웨스턴
블랏팅에
의해 공유 결합으로 부착된
리간드
존재의 입증
융합 단백질 내 TM의 존재는 다양한 방법에 의해 평가될 수 있다. 한 방법은 TM에 대한 특정 항혈청을 사용하고 SDS-PAGE 및 웨스턴 블랏팅에 의해 시각화하는 것이다. TM에 대한 항체는 상업적으로 얻을 수 있거나(예를 들면 항-GnRH 항체는 Abcam(AB76560) 또는 Novus Biologicals(H00002796-B01)) 또는 상업적 서비스 제공자에 의해 특정 펩티드 서열에 특이적으로 제조될 수 있다.
이러한 기법을 이용하여, 비-환원 조건에서 수행될 때, GnRH의 존재가 전장의 활성화된 융합 단백질 내에 있는 것으로 확인되나, 환원 조건에서 수행될 때, HN 도메인상에는 존재하지 않는다.
실시예
6
질량 분석법에 의해 공유 결합으로 부착된
TM
존재의 입증
융합 단백질 내 TM의 존재는 다양한 방법에 의해 평가될 수 있다. 한 방법은 환원 전 후의 융합 단백질의 질량을 확인하는 질량 분석법을 이용하는 것이다.
실시예 4에 따라 제조된 단백질을 이용하여, 다양한 환원되지 않은 단백질 샘플 및 환원된 단백질 샘플을 SDS-PAGE로부터 추출하고 질량분석계(Intertek, Manchester)에 의해 분석했다.
비-활성화된, 환원되지 않은 융합 단백질의 예측 질량은 105271 Da이다. 샘플의 관측된 질량은 105284 Da이고, 차이는 장비의 오차 내인 13 Da에 불과하다. 따라서 비-활성화된, 환원되지 않은 융합 단백질에서 온전한(intact) GnRH의 존재가 확인된다.
환원되지 않은 샘플: | |||
이론적 질량: | 상응하는 구조: | 관측된 질량: | 질량 차이: |
105271 Da | 전장 | 105284 Da | 13 Da |
활성화된, 환원되지 않은 융합 단백질의 예측 질량은 105271 Da이다. 샘플의 관측된 질량은 105321 Da이고, 차이는 장비의 오차 내인 50 Da에 불과하다. 따라서 활성화된, 환원되지 않은 융합 단백질에서 온전한 GnRH의 존재가 확인된다.
환원되지 않은 샘플: | |||
이론적 질량: | 상응하는 구조: | 관측된 질량: | 질량 차이: |
105271 Da | 전장 | 105321 Da | 50 Da |
LC 및 HN 도메인의 환원된 샘플을 평가하는 경우, HN 도메인(HN + 스페이서 + 활성화 부위를 포함해야 한다)은 예측 질량이 49419 Da이고 관측된 질량은 49421이다. 이것은 환원된 HN 도메인은 GnRH 펩티드를 보유하지 않는다는 것을 나타낸다. 이 결과는 단백질분해 및 이황화 결합의 환원은 HN 도메인의 C-말단으로부터 GnRH 서열을 방출할 것이므로 예측과 완전히 같다.
환원된 샘플:Hn 소단위(subunit) 질량 | |||
이론적 질량: | 상응하는 구조: | 관측된 질량: | 질량 차이: |
49419 Da | 중쇄 + 스페이서 + 활성 부위 | 49421 Da | 2 Da |
이러한 데이터는 GnRH 리간드가 활성화 및 환원 전에 융합 단백질에 부착되어 있고, 환원제 없이 활성화 후 융합 단백질에 부착되어 있지만, 활성화 및 환원 후 HN 도메인으로부터 이탈된다(absent)는 것을 보여준다. 이는 융합 단백질은 정확하게 단백질분해 부위에서 활성화되고 GnRH 리간드는 조작에 의해 도입된된(engineered) 이황화 결합을 통해 HN 도메인에 부착된다는 것을 확인한다.
실시예
7
GnRH
폴리펩티드를 통합하는
LHD
단백질의 결합 능력 평가
실시예 4에 따라 제조된 단백질을 다수의 적절한 분석법 중 하나를 이용한 리간드-수용체 상호작용의 기능성에 대해 평가한다. 예를 들면 Cisbio Bioassays에 의해 공급된 성선자극호르몬-분비 호르몬 GnRHR 수용체 리간드 결합 분석법은 샘플 중 결합 활성을 정량화하는 경쟁 분석법(competition assay)이다(http://www.htrf.com/products/gpcr/binding/ligands/inserts/C1TT1GNRH.pdf). 대안적으로, 다양한, 공개적으로 이용가능한 결합 분석법이 과학 문헌에 보고되어 있다(예를 들면 Christopher E. Heise, Susan K. Sullivan 및 Paul D. Crowe, J Biomol Screen 2007 12: 235; DOI: 10.1177/1087057106297362). 이러한 분석법의 이용은 GnRH TM은 표적 수용체와 상호작용할 수 있다는 것을 나타낸다.
데이터는 GnRH TM이 표적 수용체와 상호작용할 수 있다는 것을 나타낸다.
실시예
8
GnRH
폴리펩티드를 통합하는
LHD
단백질의 인 비트로 기능성 평가
실시예 4에 따라 제조된 단백질을 표적 세포 내 SNARE 단백질을 절단하는 능력에 대해 평가한다. 요약하면, 성선자극호르몬-분비 호르몬(GnRH) 수용체를 높은 수준으로 발현하는 알파 T3-1 세포주(불멸화 성선자극세포 세포주)(immortalized gonadotroph cell line)를 본 발명의 화합물과 인큐베이션한다. 24시간 후 세포 물질을 수집하고 웨스턴 블랏팅에 의해 SNARE 단백질을 분석한다. 데이터는 GnRH TM을 포함하는 융합 단백질은 표적 수용체와 상호작용할 수 있어서, 내재화 및 세포내 SNARE 단백질의 절단을 가져온다는 것을 나타낸다.
실시예
9
H
N
도메인의 C-말단에
디놀핀
및
브래디키닌
폴리펩티드를 통합하는
LHD
단백질의 생성
BoNT/D의 LHN 단편과 디놀핀 및 브래디키닌 펩티드의 유전적 융합에 의해 구축된 키메라 단백질의 일차 서열을 인자 Xa의 원형의 인식 부위(IEGR)와 닮은 아미노산 배열의 존재에 대하여 검토한다. 이러한 배열이 발견되지 않을 때, LC-HN 접합부에서 융합 단백질을 활성화하고 또한 HN과 디놀핀 펩티드 사이의 펩티드 결합을 절단하기 위한 프로테아제로 FXa를 이용하는 선택이 이루어진다. HN으로의 이황화 결합을 촉진하기 위하여 단일 시스테인을 통합하는 11개의 아미노산으로 이루어진 스페이서를 디놀핀과 브래디키닌 펩티드 사이에 구축한다.
N-말단에서 C-말단으로, 하기의 구조를 갖는 융합 단백질을 코딩하는, E. coli 발현에 최적화된 DNA는 Entelechon(독일)에서 상업적으로 얻는다:
● 10개의 His N-말단 정제 태그,
● 10개의 아스파라긴 아미노산 스페이서,
● BoNT/D의 LC,
● FXa의 기질인 테트라 펩티드 IEGR을 통합하도록 변형된, BoNT/A에서 발견되는 것과 유사한 일차 서열을 갖는 인터-도메인 링커,
● C-말단 시스테인을 통합하도록 변형된 BoNT/D의 HN,
● C-말단에 IEGR 펩티드 서열을 통합하는 Gly-Gly-Gly-Gly-Ser 스페이서
● 17개 아미노산으로 이루어진 디놀핀 펩티드
● Gly-Gly-Gly-Gly-Ser-Cys-Gly-Gly-Gly-Gly-Ser의 11개 아미노산
● 9개 아미노산으로 이루어진 브래디키닌 펩티드.
구성이 열등한 코돈 이용을 초래하지 않는다는 것을 확실하게 하기 위하여 Graphical Codon Usage Analyser (Geneart)과 같은 소프트웨어 프로그램을 참조하여 E.coli 코돈의 이용을 평가하고, 공개된 코돈 이용 테이블(codon usage table)(예를 들면 GenBank Release 143, 2004년 9월 13일)을 참조하여 %GC 함량 및 코돈 이용 비율을 평가하였다. E.coli 숙주로의 형질전환 전에 표준 클로닝 벡터, 예를 들면 pCR4에 DNA를 통합시켰다. 서열 결정에 의해 ORF DNA의 완전성을 확인하였다. 최종 ORF는 서열번호 7로 표시되고 발현 생성물의 아미노산 서열은 서열번호 8로 표시된다.
실시예
10
H
N
도메인의 C-말단에 베타-
엔돌핀
및
브래디키닌
폴리펩티드를 통합하는
LHA
단백질의 생성
BoNT/A의 LHN 단편과 베타-엔돌핀 및 브래디키닌 펩티드의 유전적 융합에 의해 구축된 키메라 단백질의 일차 서열을 인자 Xa의 원형의 인식 부위(IEGR)와 닮은 아미노산 배열의 존재에 대하여 검토한다. 이러한 배열이 발견되지 않을 때, LC-HN 접합부에서 융합 단백질을 활성화하고 또한 HN과 베타-엔돌핀 펩티드 사이의 펩티드 결합을 절단하기 위한 프로테아제로 FXa를 이용하는 선택이 이루어진다. HN으로의 이황화 결합을 촉진하기 위하여 단일 시스테인을 통합하는 11개의 아미노산으로 이루어진 스페이서를 베타-엔돌핀과 브래디키닌 펩티드 사이에 구축된다.
N-말단에서 C-말단으로, 하기의 구조를 갖는 융합 단백질을 코딩하는, E. coli 발현에 최적화된 DNA는 Entelechon(독일)에서 상업적으로 얻는다:
● 10개의 His N-말단 정제 태그,
● 10개의 아스파라긴 아미노산 스페이서,
● BoNT/A의 LC,
● FXa의 기질인 테트라 펩티드 IEGR을 통합하도록 변형된, BoNT/A에서 발견되는 것과 유사한 일차 서열을 갖는 인터-도메인 링커,
● C-말단 시스테인을 통합하도록 변형된 BoNT/A의 HN,
● C-말단에 IEGR 펩티드 서열을 통합하는 Gly-Gly-Gly-Gly-Ser 스페이서
● 31개 아미노산으로 이루어진 베타-엔돌핀 펩티드
● Gly-Gly-Gly-Gly-Ser-Cys-Gly-Gly-Gly-Gly-Ser의 11개 아미노산
● 9개 아미노산으로 이루어진 브래디키닌 펩티드.
구성이 열등한 코돈 이용을 초래하지 않는다는 것을 확실하게 하기 위하여 Graphical Codon Usage Analyser (Geneart)과 같은 소프트웨어 프로그램을 참조하여 E.coli 코돈의 이용을 평가하고, 공개된 코돈 이용 테이블(codon usage table)(예를 들면 GenBank Release 143, 2004년 9월 13일)을 참조하여 %GC 함량 및 코돈 이용 비율을 평가하였다. E.coli 숙주로의 형질전환 전에 표준 클로닝 벡터, 예를 들면 pCR4에 DNA를 통합시켰다. 서열 결정에 의해 ORF DNA의 완전성을 확인하였다. 최종 ORF는 서열번호 9로 표시되고 발현 생성물의 아미노산 서열은 서열번호 10으로 표시된다.
실시예
11
H
N
도메인의 C-말단에 두 개의
GHRH
폴리펩티드를 통합하는
LHD
단백질의 생성
BoNT/D의 LHN 단편과 두 개의 GHRH 펩티드의 유전적 융합에 의해 구축된 키메라 단백질의 일차 서열을 인자 Xa의 원형의 인식 부위(IEGR)와 닮은 아미노산 배열의 존재에 대하여 검토한다. 이러한 배열이 발견되지 않을 때, LC-HN 접합부에서 융합 단백질을 활성화하고 또한 HN과 GHRH 펩티드 사이의 펩티드 결합을 절단하기 위한 프로테아제로 FXa를 이용하는 선택이 이루어진다. HN으로의 이황화 결합을 촉진하기 위하여 단일 시스테인을 통합하는 11개의 아미노산으로 이루어진 스페이서를 두 개의 GHRH 펩티드 사이에 구축한다.
N-말단에서 C-말단으로, 하기의 구조를 갖는 융합 단백질을 코딩하는, E. coli 발현에 최적화된 DNA는 Entelechon(독일)에서 상업적으로 얻는다:
● 10개의 His N-말단 정제 태그,
● 10개의 아미노산 아스파라긴 스페이서,
● BoNT/D의 LC,
● FXa의 기질인 테트라 펩티드 IEGR을 통합하도록 변형된, BoNT/A에서 발견되는 것과 유사한 일차 서열을 갖는 인터-도메인 링커,
● C-말단 시스테인을 통합하도록 변형된 BoNT/D의 HN,
● C-말단에 IEGR 펩티드 서열을 통합하는 Gly-Gly-Gly-Gly-Ser 스페이서
● 40개 아미노산으로 이루어진 GHRH 펩티드
● Gly-Gly-Gly-Gly-Ser-Cys-Gly-Gly-Gly-Gly-Ser의 11개 아미노산
● 40개 아미노산으로 이루어진 GHRH 펩티드.
구성이 열등한 코돈 이용을 초래하지 않는다는 것을 확실하게 하기 위하여 Graphical Codon Usage Analyser (Geneart)과 같은 소프트웨어 프로그램을 참조하여 E.coli 코돈의 이용을 평가하고, 공개된 코돈 이용 테이블(codon usage table)(예를 들면 GenBank Release 143, 2004년 9월 13일)을 참조하여 %GC 함량 및 코돈 이용 비율을 평가하였다. E.coli 숙주로의 형질전환 전에 표준 클로닝 벡터, 예를 들면 pCR4에 DNA를 통합시켰다. 서열 결정에 의해 ORF DNA의 완전성을 확인하였다. 최종 ORF는 서열번호 11로 표시되고 발현 생성물의 아미노산 서열은 서열번호 12로 표시된다.
실시예
12
제 2 프로테아제 활성화 부위로부터 5개의 아미노산만큼 떨어진, H
N
도메인의 C-말단에
GnRH
폴리펩티드를 통합하는
LHD
단백질의 생성
BoNT/D의 LHN 단편과 GnRH의 10개의 아미노산 펩티드의 유전적 융합에 의해 구축된 키메라 단백질의 일차 서열을 인자 Xa의 원형의 인식 부위(IEGR)와 닮은 아미노산 배열의 존재에 대하여 검토한다. 이러한 배열이 발견되지 않을 때, LC-HN 접합부에서 융합 단백질을 활성화하고 또한 HN과 TM(GnRH)의 N-말단의 스페이서 사이의 펩티드 결합을 절단하기 위한 프로테아제로 FXa를 이용하는 선택이 이루어진다.
N-말단에서 C-말단으로, 하기의 구조를 갖는 융합 단백질을 코딩하는, E. coli 발현에 최적화된 DNA는 Entelechon(독일)에서 상업적으로 얻는다:
● 10개의 His N-말단 정제 태그,
● 10개의 아스파라긴 아미노산 스페이서,
● BoNT/D의 LC,
● FXa의 기질인 테트라 펩티드 IEGR을 통합하도록 변형된, BoNT/A에서 발견되는 것과 유사한 일차 서열을 갖는 인터-도메인 링커,
● C-말단 시스테인을 통합하도록 변형된 BoNT/D의 HN,
● IEGR 펩티드를 통합하는 Gly-Gly-Gly-Gly-Ser-Ile-Glu-Gly-Arg-Gly-Gly-Gly-Gly-Ser 스페이서,
● 6번 자리에 천연 글리신 대신 시스테인 잔기를 통합하도록 변형된 10개의 아미노산으로 이루어진 GnRH 펩티드(QHWSYCLRPG).
구성이 열등한 코돈 이용을 초래하지 않는다는 것을 확실하게 하기 위하여 Graphical Codon Usage Analyser (Geneart)과 같은 소프트웨어 프로그램을 참조하여 E.coli 코돈의 이용을 평가하고, 공개된 코돈 이용 테이블(codon usage table)(예를 들면 GenBank Release 143, 2004년 9월 13일)을 참조하여 %GC 함량 및 코돈 이용 비율을 평가하였다. E.coli 숙주로의 형질전환 전에 표준 클로닝 벡터, 예를 들면 pCR4에 DNA를 통합시켰다. 서열 결정에 의해 ORF DNA의 완전성을 확인하였다. 최종 ORF는 서열번호 13으로 표시되고 발현 생성물의 아미노산 서열은 서열번호 14로 표시된다.
실시예
13
H
N
도메인의 C-말단에 가스트린 분비 펩티드를 통합하는
LHA
단백질의 생성
BoNT/A의 LHN 단편과 27개의 아미노산으로 이루어진 가스트린 분비 펩티드(GRP)의 유전적 융합에 의해 구축된 키메라 단백질의 일차 서열을 인자 Xa의 원형의 인식 부위(IEGR)와 닮은 아미노산 배열(string)의 존재에 대하여 검토한다. 이러한 배열이 발견되지 않을 때, LC-HN 접합부에서 융합 단백질을 활성화하고 또한 HN과 TM(GRP) 사이의 펩티드 결합을 절단하기 위한 프로테아제로 FXa를 이용하는 선택이 이루어진다.
N-말단에서 C-말단으로, 하기의 구조를 갖는 융합 단백질을 코딩하는, E. coli 발현에 최적화된 DNA는 Entelechon(독일)에서 상업적으로 얻는다:
● 10개의 His N-말단 정제 태그,
● 10개의 아스파라긴 아미노산 스페이서,
● BoNT/A의 LC,
● FXa의 기질인 테트라 펩티드 IEGR을 통합하더럭 변형된, BoNT/A에서 발견되는 것과 유사한 일차 서열을 갖는 인터-도메인 링커,
● C-말단 시스테인을 통합하도록 변형된 BoNT/A의 HN,
● C-말단에 IEGR 펩티드 서열을 통합하는 Gly-Gly-Gly-Gly-Ser 스페이서
● C-말단 아미드화에 대한 필요성을 대체하기 위해, 천연 아르기닌 대신, 17번 자리에서 시스테인 잔기 및 C-말단에 추가적인 글리신 잔기를 통합하도록 변형된 28개의 아미노산으로 이루어진 가스트린 분비 펩티드 (VPLPAGGGTVLTKMYPCGNHWAVGHLMG).
구성이 열등한 코돈 이용을 초래하지 않는다는 것을 확실하게 하기 위하여 Graphical Codon Usage Analyser (Geneart)과 같은 소프트웨어 프로그램을 참조하여 E.coli 코돈의 이용을 평가하고, 공개된 코돈 이용 테이블(codon usage table)(예를 들면 GenBank Release 143, 2004년 9월 13일)을 참조하여 %GC 함량 및 코돈 이용 비율을 평가하였다. E.coli 숙주로의 형질전환 전에 표준 클로닝 벡터, 예를 들면 pCR4에 DNA를 통합시켰다. 서열 결정에 의해 ORF DNA의 완전성을 확인하였다. 최종 ORF는 서열번호 15로 표시되고 발현 생성물의 아미노산 서열은 서열번호 16으로 표시된다.
실시예
14
전립선암 환자의 치료 방법
56세 남성이 안드로겐-차단 요법(Androgen deprivation therapy)으로 더 이상 질병을 충분히 통제할 수 없는 상황까지 진행된 전립선암을 앓고 있다. 전립선 주변에 본 발명의 TSI(본 구체적인 실시예에서, GnRH 펩티드 TM 기반 TSI)를 포함하는 조성물의 국소 투여로 상기 환자를 치료한다. 환자의 상태를 모니터링하고 치료 후 약 2개월째 의사는 본 발명의 분자를 포함하는 조성물의 성공적인 치료를 나타내는 종양크기의 감소를 지적한다.
실시예
15
신경성 염증 환자의 치료 방법
류마티스 관절염으로 진단된 62세 여성이 관절 강직과 부종을 호소한다. 의사는 관절 강직 및 부종은 만성 신경성 염증에 의한 것으로 판단한다. 질병 영역(affected area)의 주변에 본 발명의 TSI(본 실시예에서, TSI는 오피오이드 TM을 포함함 - 노시셉틴 또는 디놀핀 TM을 포함하는 TSI로 병행(parallel) 실시예를 수행함)를 포함하는 조성물의 국소 투여로 상기 환자를 치료한다. 환자의 상태를 모니터링하고 치료 후 약 1-3일 후 상기 환자는 감소된 관절 강직 및 부종을 나타낸다. 1개월째 및 3개월째 검진에서, 상기 환자는 치료받은 부위에서 지속적으로 감소된 관절 강직 및 부종을 갖는 것으로 나타난다. 만성 신경성 염증 증상의 이러한 감소는 본 발명의 분자를 포함하는 조성물의 성공적인 치료를 나타낸다.
실시예
16
자궁내막증 환자의 치료방법
39세 여성이 비스테로이드성 항 염증제(NSAID) 및 조합된 에스트로겐-프로게스테론 피임약으로 적절히 치료되지 않는 자궁내막증에 의한 골반 통증을 호소한다. 의사는 본 발명의 TSI를 포함하는 조성물을 투여한다(본 실시예에서, TSI는 오피오이드 TM을 포함함 - 노시셉틴 또는 디놀핀 TM을 포함하는 TSI로 병행 실시예를 수행함). 환자의 상태를 모니터링하고 치료 후 약 1-3일 후 상기 환자는 감소된 통증을 나타낸다. 1개월째 및 3개월째 검진에서, 상기 환자는 지속적으로 감소된 통증 및 향상된 움직임의 자유를 갖는 것으로 나타난다. 자궁내막증과 연관된 증상에서 이러한 감소는 본 발명의 분자를 포함하는 조성물의 성공적인 치료를 나타낸다.
실시예
17 과민성 방광 환자의 치료법
58세 남성이 증가된 절박뇨(urinary urgency)를 호소한다. 의사는 환자를 이상(abnormal) 뉴런 활성을 포함하는 신경학적 성분을 갖는 과민성 방광으로 진단한다. 본 발명의 TSI(본 실시예에서, TSI는 오피오이드 TM을 포함함 - 노시셉틴 또는 디놀핀 TM을 포함하는 TSI로 병행 실시예를 수행함)를 포함하는 조성물의 요도경(urethroscopically) 주사로 상기 환자를 치료한다. 이상 뉴런 활성의 위치에 따라, 예를 들면, 배뇨근, 내부 및 외부 요도 괄약근을 포함한 방광목, 삼각부, 방광 천장부(bladder dome) 또는 방광벽의 다른 부위, 및/또는 요도, 요관, 비뇨생식기 격막(urogenital diaphragm), 골반 하부 근육(lower pelvic muscle), 전립선, 구요도선(bulbourethral gland), 망울(bulb), 하퇴부(crus) 또는 음경과 같은 방광 주변의 다른 부위에 독소를 투여할 수 있다. 환자의 상태를 모니터링하고 치료로부터 약 1-3일 후, 상기 환자는 감소된 절박뇨를 가짐을 나타낸다. 1개월째 및 3개월째 검진에서, 상기 환자는 절박뇨 감소를 지속적으로 갖는 것으로 나타난다. 과민성 방광 증상에서 이러한 감소는 본 발명의 분자를 포함하는 조성물의 성공적인 치료를 나타낸다.
실시예
18
신경성 염증 환자의 치료 방법
류마티스 관절염으로 진단된 62세 여성이 관절 강직과 부종을 호소한다. 의사는 관절 강직 및 부종은 만성 신경성 염증에 의한 것으로 판단한다. 질병 영역의 주변에 본 발명의 TSI(본 실시예에서, TSI는 오피오이드 TM을 포함함 - 노시셉틴 또는 디놀핀 TM을 포함하는 TSI로 병행 실시예를 수행함)를 포함하는 조성물의 국소 투여로 상기 환자를 치료한다. 환자의 상태를 모니터링하고 치료 후 약 1-3일 후, 상기 환자는 감소된 관절 강직 및 부종을 나타낸다. 1개월째 및 3개월째 검진에서, 상기 환자는 치료받은 부위에서 지속적으로 감소된 관절 강직 및 부종을 갖는 것으로 나타난다. 만성 신경성 염증 증상에서 이러한 감소는 본 발명의 분자를 포함하는 조성물의 성공적인 치료를 나타낸다. 본 명세서에서 개시된 바와 같이 단백질의 국소 투여의 유사한 타입을 예를 들면, 골관절염, 소아특발성관절염(juvenile idiopathic arthritis), 화농성 관절염(septic arthritis), 척추관절증(spondyloarthropathy)(강직성 척추염(ankylosing spondylitis), 반응성 관절염(reactive arthritis)(라이터 증후군), 건선 관절염(psoriatic arthritis), 염증성 장질환과 연관된 장병성 관절염(enteropathic arthritis), 휘플병(Whipple disease) 또는 베체트병(Behcet disease) 포함), 활막염, 통풍, 가성통풍, 또는 스틸병(Still's Disease)과 같은 단일관절염(monoarthritis), 빈발성관절염(oligoarthritis), 또는 다발성관절염(polyarthritis) 및 윤활낭염(bursitis), 류마티스열, 또는 건초염(tenosynovitis)과 연관된 만성 신경성 염증을 앓는 환자를 치료하는데 사용할 수 있다. 또한, 전신투여가 만성 신경성 염증을 치료하기 위하여 본 발명의 분자를 포함하는 조성물을 투여하는데 또한 이용될 수 있다.
<110> Syntaxin Limited
Chaddock, John
Harper, Elaine
<120> Therapeutic fusion proteins
<130> P35972WO-MRM
<140> Not yet assigned
<141> 2012-05-16
<150> GB1108108.0
<151> 2011-05-16
<160> 16
<170> PatentIn version 3.5
<210> 1
<211> 2769
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic sequence
<400> 1
atgcatcacc atcaccatca ccatcaccat catgggagct cgaacaataa caacaataac 60
aataacaata acggatccat gacgtggcca gttaaggatt tcaactactc agatcctgta 120
aatgacaacg atattctgta ccttcgcatt ccacaaaata aactgatcac cacaccagtc 180
aaagcattca tgattactca aaacatttgg gtcattccag aacgcttttc tagtgacaca 240
aatccgagtt tatctaaacc tccgcgtccg acgtccaaat atcagagcta ttacgatccc 300
tcatatctca gtacggacga acaaaaagat actttcctta aaggtatcat taaactgttt 360
aagcgtatta atgagcgcga tatcgggaaa aagttgatta attatcttgt tgtgggttcc 420
ccgttcatgg gcgatagctc tacccccgaa gacacttttg attttacccg tcatacgaca 480
aacatcgcgg tagagaagtt tgagaacgga tcgtggaaag tcacaaacat cattacacct 540
agcgtcttaa tttttggtcc gctgccaaac atcttagatt atacagccag cctgactttg 600
caggggcaac agtcgaatcc gagtttcgaa ggttttggta ccctgagcat tctgaaagtt 660
gccccggaat ttctgctcac tttttcagat gtcaccagca accagagctc agcagtatta 720
ggaaagtcaa ttttttgcat ggacccggtt attgcactga tgcacgaact gacgcactct 780
ctgcatcaac tgtatgggat caacatcccc agtgacaaac gtattcgtcc ccaggtgtct 840
gaaggatttt tctcacagga tgggccgaac gtccagttcg aagagttgta tactttcgga 900
ggcctggacg tagagatcat tccccagatt gagcgcagtc agctgcgtga gaaggcattg 960
ggccattata aggatattgc aaaacgcctg aataacatta acaaaacgat tccatcttcg 1020
tggatctcga atattgataa atataagaaa atttttagcg agaaatataa ttttgataaa 1080
gataatacag gtaactttgt ggttaacatt gacaaattca actcccttta cagtgatttg 1140
acgaatgtaa tgagcgaagt tgtgtatagt tcccaataca acgttaagaa tcgtacccat 1200
tacttctctc gtcactacct gccggttttc gcgaacatcc ttgacgataa tatttacact 1260
attcgtgacg gctttaactt gaccaacaag ggcttcaata ttgaaaattc aggccagaac 1320
attgaacgca acccggcctt gcagaaactg tcgagtgaat ccgtggttga cctgtttacc 1380
aaagtctgcg tcgacggcat cattacctcc aaaactaaat ctctgataga aggtagaaac 1440
aaagcgctga acctgcagtg tattaaagtg aaaaacaatc ggctgcctta tgtagcagat 1500
aaagatagca ttagtcagga gattttcgaa aataaaatta tcactgacga aaccaatgtt 1560
cagaattatt cagataaatt ttcactggac gaaagcatct tagatggcca agttccgatt 1620
aacccggaaa ttgttgatcc gttactgccg aacgtgaata tggaaccgtt aaacctccct 1680
ggcgaagaga tcgtatttta tgatgacatt acgaaatatg tggactacct taattcttat 1740
tactatttgg aaagccagaa actgtccaat aacgtggaaa acattactct gaccacaagc 1800
gtggaagagg ctttaggcta ctcaaataag atttatacct tcctcccgtc gctggcggaa 1860
aaagtaaata aaggtgtgca ggctggtctg ttcctcaact gggcgaatga agttgtcgaa 1920
gactttacca cgaatattat gaaaaaggat accctggata aaatctccga cgtctcggtt 1980
attatcccat atattggccc tgcgttaaat atcggtaata gtgcgctgcg ggggaatttt 2040
aaccaggcct ttgctaccgc gggcgtcgcg ttcctcctgg agggctttcc tgaatttact 2100
atcccggcgc tcggtgtttt tacattttac tcttccatcc aggagcgtga gaaaattatc 2160
aaaaccatcg aaaactgcct ggagcagcgg gtgaaacgct ggaaagattc ttatcaatgg 2220
atggtgtcaa actggttatc tcgcatcacg acccaattca accatattaa ttaccagatg 2280
tatgatagtc tgtcgtacca agctgacgcc attaaagcca aaattgatct ggaatataaa 2340
aagtactctg gtagcgataa ggagaacatc aaaagccagg tggagaacct taagaatagt 2400
ctggatgtga aaatctctga agctatgaat aacattaaca aattcattcg tgaatgttcg 2460
gtgacgtacc tgttcaagaa tatgctgcca aaagttattg atgaactgaa taaatttgat 2520
ctgcgtacca aaaccgaact tatcaacctc atcgactccc acaacattat ccttgtgggc 2580
gaagtggatc gtctgaaggc caaagtaaac gagagctttg aaaatacgat gccgtttaat 2640
attttttcat ataccaataa ctccttgctg aaagatatca tcaatgaata tttcaatcta 2700
gaatgtggcg gtggcggtag catcgaaggt cgtcagcact ggtcctattg cctgcgccct 2760
ggttgataa 2769
<210> 2
<211> 921
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic sequence
<400> 2
Met His His His His His His His His His His Gly Ser Ser Asn Asn
1 5 10 15
Asn Asn Asn Asn Asn Asn Asn Asn Gly Ser Met Thr Trp Pro Val Lys
20 25 30
Asp Phe Asn Tyr Ser Asp Pro Val Asn Asp Asn Asp Ile Leu Tyr Leu
35 40 45
Arg Ile Pro Gln Asn Lys Leu Ile Thr Thr Pro Val Lys Ala Phe Met
50 55 60
Ile Thr Gln Asn Ile Trp Val Ile Pro Glu Arg Phe Ser Ser Asp Thr
65 70 75 80
Asn Pro Ser Leu Ser Lys Pro Pro Arg Pro Thr Ser Lys Tyr Gln Ser
85 90 95
Tyr Tyr Asp Pro Ser Tyr Leu Ser Thr Asp Glu Gln Lys Asp Thr Phe
100 105 110
Leu Lys Gly Ile Ile Lys Leu Phe Lys Arg Ile Asn Glu Arg Asp Ile
115 120 125
Gly Lys Lys Leu Ile Asn Tyr Leu Val Val Gly Ser Pro Phe Met Gly
130 135 140
Asp Ser Ser Thr Pro Glu Asp Thr Phe Asp Phe Thr Arg His Thr Thr
145 150 155 160
Asn Ile Ala Val Glu Lys Phe Glu Asn Gly Ser Trp Lys Val Thr Asn
165 170 175
Ile Ile Thr Pro Ser Val Leu Ile Phe Gly Pro Leu Pro Asn Ile Leu
180 185 190
Asp Tyr Thr Ala Ser Leu Thr Leu Gln Gly Gln Gln Ser Asn Pro Ser
195 200 205
Phe Glu Gly Phe Gly Thr Leu Ser Ile Leu Lys Val Ala Pro Glu Phe
210 215 220
Leu Leu Thr Phe Ser Asp Val Thr Ser Asn Gln Ser Ser Ala Val Leu
225 230 235 240
Gly Lys Ser Ile Phe Cys Met Asp Pro Val Ile Ala Leu Met His Glu
245 250 255
Leu Thr His Ser Leu His Gln Leu Tyr Gly Ile Asn Ile Pro Ser Asp
260 265 270
Lys Arg Ile Arg Pro Gln Val Ser Glu Gly Phe Phe Ser Gln Asp Gly
275 280 285
Pro Asn Val Gln Phe Glu Glu Leu Tyr Thr Phe Gly Gly Leu Asp Val
290 295 300
Glu Ile Ile Pro Gln Ile Glu Arg Ser Gln Leu Arg Glu Lys Ala Leu
305 310 315 320
Gly His Tyr Lys Asp Ile Ala Lys Arg Leu Asn Asn Ile Asn Lys Thr
325 330 335
Ile Pro Ser Ser Trp Ile Ser Asn Ile Asp Lys Tyr Lys Lys Ile Phe
340 345 350
Ser Glu Lys Tyr Asn Phe Asp Lys Asp Asn Thr Gly Asn Phe Val Val
355 360 365
Asn Ile Asp Lys Phe Asn Ser Leu Tyr Ser Asp Leu Thr Asn Val Met
370 375 380
Ser Glu Val Val Tyr Ser Ser Gln Tyr Asn Val Lys Asn Arg Thr His
385 390 395 400
Tyr Phe Ser Arg His Tyr Leu Pro Val Phe Ala Asn Ile Leu Asp Asp
405 410 415
Asn Ile Tyr Thr Ile Arg Asp Gly Phe Asn Leu Thr Asn Lys Gly Phe
420 425 430
Asn Ile Glu Asn Ser Gly Gln Asn Ile Glu Arg Asn Pro Ala Leu Gln
435 440 445
Lys Leu Ser Ser Glu Ser Val Val Asp Leu Phe Thr Lys Val Cys Val
450 455 460
Asp Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Ile Glu Gly Arg Asn
465 470 475 480
Lys Ala Leu Asn Leu Gln Cys Ile Lys Val Lys Asn Asn Arg Leu Pro
485 490 495
Tyr Val Ala Asp Lys Asp Ser Ile Ser Gln Glu Ile Phe Glu Asn Lys
500 505 510
Ile Ile Thr Asp Glu Thr Asn Val Gln Asn Tyr Ser Asp Lys Phe Ser
515 520 525
Leu Asp Glu Ser Ile Leu Asp Gly Gln Val Pro Ile Asn Pro Glu Ile
530 535 540
Val Asp Pro Leu Leu Pro Asn Val Asn Met Glu Pro Leu Asn Leu Pro
545 550 555 560
Gly Glu Glu Ile Val Phe Tyr Asp Asp Ile Thr Lys Tyr Val Asp Tyr
565 570 575
Leu Asn Ser Tyr Tyr Tyr Leu Glu Ser Gln Lys Leu Ser Asn Asn Val
580 585 590
Glu Asn Ile Thr Leu Thr Thr Ser Val Glu Glu Ala Leu Gly Tyr Ser
595 600 605
Asn Lys Ile Tyr Thr Phe Leu Pro Ser Leu Ala Glu Lys Val Asn Lys
610 615 620
Gly Val Gln Ala Gly Leu Phe Leu Asn Trp Ala Asn Glu Val Val Glu
625 630 635 640
Asp Phe Thr Thr Asn Ile Met Lys Lys Asp Thr Leu Asp Lys Ile Ser
645 650 655
Asp Val Ser Val Ile Ile Pro Tyr Ile Gly Pro Ala Leu Asn Ile Gly
660 665 670
Asn Ser Ala Leu Arg Gly Asn Phe Asn Gln Ala Phe Ala Thr Ala Gly
675 680 685
Val Ala Phe Leu Leu Glu Gly Phe Pro Glu Phe Thr Ile Pro Ala Leu
690 695 700
Gly Val Phe Thr Phe Tyr Ser Ser Ile Gln Glu Arg Glu Lys Ile Ile
705 710 715 720
Lys Thr Ile Glu Asn Cys Leu Glu Gln Arg Val Lys Arg Trp Lys Asp
725 730 735
Ser Tyr Gln Trp Met Val Ser Asn Trp Leu Ser Arg Ile Thr Thr Gln
740 745 750
Phe Asn His Ile Asn Tyr Gln Met Tyr Asp Ser Leu Ser Tyr Gln Ala
755 760 765
Asp Ala Ile Lys Ala Lys Ile Asp Leu Glu Tyr Lys Lys Tyr Ser Gly
770 775 780
Ser Asp Lys Glu Asn Ile Lys Ser Gln Val Glu Asn Leu Lys Asn Ser
785 790 795 800
Leu Asp Val Lys Ile Ser Glu Ala Met Asn Asn Ile Asn Lys Phe Ile
805 810 815
Arg Glu Cys Ser Val Thr Tyr Leu Phe Lys Asn Met Leu Pro Lys Val
820 825 830
Ile Asp Glu Leu Asn Lys Phe Asp Leu Arg Thr Lys Thr Glu Leu Ile
835 840 845
Asn Leu Ile Asp Ser His Asn Ile Ile Leu Val Gly Glu Val Asp Arg
850 855 860
Leu Lys Ala Lys Val Asn Glu Ser Phe Glu Asn Thr Met Pro Phe Asn
865 870 875 880
Ile Phe Ser Tyr Thr Asn Asn Ser Leu Leu Lys Asp Ile Ile Asn Glu
885 890 895
Tyr Phe Asn Leu Glu Cys Gly Gly Gly Gly Ser Ile Glu Gly Arg Gln
900 905 910
His Trp Ser Tyr Cys Leu Arg Pro Gly
915 920
<210> 3
<211> 2739
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic sequence
<400> 3
atgcatcacc atcaccatca ccatcaccat catgggagct cgaacaataa caacaataac 60
aataacaata acggatccat ggagttcgtt aacaaacagt tcaactataa agacccagtt 120
aacggtgttg acattgctta catcaaaatc ccgaacgctg gccagatgca gccggtaaag 180
gcattcaaaa tccacaacaa aatctgggtt atcccggaac gtgatacctt tactaacccg 240
gaagaaggtg acctgaaccc gccaccggaa gcgaaacagg tgccggtatc ttactatgac 300
tccacctacc tgtctaccga taacgaaaag gacaactacc tgaaaggtgt tactaaactg 360
ttcgagcgta tttactccac cgacctgggc cgtatgctgc tgactagcat cgttcgcggt 420
atcccgttct ggggcggttc taccatcgat accgaactga aagtaatcga cactaactgc 480
atcaacgtta ttcagccgga cggttcctat cgttccgaag aactgaacct ggtgatcatc 540
ggcccgtctg ctgatatcat ccagttcgag tgtaagagct ttggtcacga agttctgaac 600
ctcacccgta acggctacgg ttccactcag tacatccgtt tctctccgga cttcaccttc 660
ggttttgaag aatccctgga agtagacacg aacccactgc tgggcgctgg taaattcgca 720
actgatcctg cggttaccct ggctcacgaa ctgattcatg caggccaccg cctgtacggt 780
atcgccatca atccgaaccg tgtcttcaaa gttaacacca acgcgtatta cgagatgtcc 840
ggtctggaag ttagcttcga agaactgcgt acttttggcg gtcacgacgc taaattcatc 900
gactctctgc aagaaaacga gttccgtctg tactactata acaagttcaa agatatcgca 960
tccaccctga acaaagcgaa atccatcgtg ggtaccactg cttctctcca gtacatgaag 1020
aacgttttta aagaaaaata cctgctcagc gaagacacct ccggcaaatt ctctgtagac 1080
aagttgaaat tcgataaact ttacaaaatg ctgactgaaa tttacaccga agacaacttc 1140
gttaagttct ttaaagttct gaaccgcaaa acctatctga acttcgacaa ggcagtattc 1200
aaaatcaaca tcgtgccgaa agttaactac actatctacg atggtttcaa cctgcgtaac 1260
accaacctgg ctgctaattt taacggccag aacacggaaa tcaacaacat gaacttcaca 1320
aaactgaaaa acttcactgg tctgttcgag ttttacaagc tgctgtgcgt cgacggcatc 1380
attacctcca aaactaaatc tctgatagaa ggtagaaaca aagcgctgaa cgacctctgt 1440
atcaaggtta acaactggga tttattcttc agcccgagtg aagacaactt caccaacgac 1500
ctgaacaaag gtgaagaaat cacctcagat actaacatcg aagcagccga agaaaacatc 1560
tcgctggacc tgatccagca gtactacctg acctttaatt tcgacaacga gccggaaaac 1620
atttctatcg aaaacctgag ctctgatatc atcggccagc tggaactgat gccgaacatc 1680
gaacgtttcc caaacggtaa aaagtacgag ctggacaaat ataccatgtt ccactacctg 1740
cgcgcgcagg aatttgaaca cggcaaatcc cgtatcgcac tgactaactc cgttaacgaa 1800
gctctgctca acccgtcccg tgtatacacc ttcttctcta gcgactacgt gaaaaaggtc 1860
aacaaagcga ctgaagctgc aatgttcttg ggttgggttg aacagcttgt ttatgatttt 1920
accgacgaga cgtccgaagt atctactacc gacaaaattg cggatatcac tatcatcatc 1980
ccgtacatcg gtccggctct gaacattggc aacatgctgt acaaagacga cttcgttggc 2040
gcactgatct tctccggtgc ggtgatcctg ctggagttca tcccggaaat cgccatcccg 2100
gtactgggca cctttgctct ggtttcttac attgcaaaca aggttctgac tgtacaaacc 2160
atcgacaacg cgctgagcaa acgtaacgaa aaatgggatg aagtttacaa atatatcgtg 2220
accaactggc tggctaaggt taatactcag atcgacctca tccgcaaaaa aatgaaagaa 2280
gcactggaaa accaggcgga agctaccaag gcaatcatta actaccagta caaccagtac 2340
accgaggaag aaaaaaacaa catcaacttc aacatcgacg atctgtcctc taaactgaac 2400
gaatccatca acaaagctat gatcaacatc aacaagttcc tgaaccagtg ctctgtaagc 2460
tatctgatga actccatgat cccgtacggt gttaaacgtc tggaggactt cgatgcgtct 2520
ctgaaagacg ccctgctgaa atacatttac gacaaccgtg gcactctgat cggtcaggtt 2580
gatcgtctga aggacaaagt gaacaatacc ttatcgaccg acatcccttt tcagctcagt 2640
aaatatgtcg ataaccaacg ccttttgtcc acttgtggcg gtggcggtag catcgaaggt 2700
cgtcagcact ggtcctattg cctgcgccct ggttgataa 2739
<210> 4
<211> 911
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic sequence
<400> 4
Met His His His His His His His His His His Gly Ser Ser Asn Asn
1 5 10 15
Asn Asn Asn Asn Asn Asn Asn Asn Gly Ser Met Glu Phe Val Asn Lys
20 25 30
Gln Phe Asn Tyr Lys Asp Pro Val Asn Gly Val Asp Ile Ala Tyr Ile
35 40 45
Lys Ile Pro Asn Ala Gly Gln Met Gln Pro Val Lys Ala Phe Lys Ile
50 55 60
His Asn Lys Ile Trp Val Ile Pro Glu Arg Asp Thr Phe Thr Asn Pro
65 70 75 80
Glu Glu Gly Asp Leu Asn Pro Pro Pro Glu Ala Lys Gln Val Pro Val
85 90 95
Ser Tyr Tyr Asp Ser Thr Tyr Leu Ser Thr Asp Asn Glu Lys Asp Asn
100 105 110
Tyr Leu Lys Gly Val Thr Lys Leu Phe Glu Arg Ile Tyr Ser Thr Asp
115 120 125
Leu Gly Arg Met Leu Leu Thr Ser Ile Val Arg Gly Ile Pro Phe Trp
130 135 140
Gly Gly Ser Thr Ile Asp Thr Glu Leu Lys Val Ile Asp Thr Asn Cys
145 150 155 160
Ile Asn Val Ile Gln Pro Asp Gly Ser Tyr Arg Ser Glu Glu Leu Asn
165 170 175
Leu Val Ile Ile Gly Pro Ser Ala Asp Ile Ile Gln Phe Glu Cys Lys
180 185 190
Ser Phe Gly His Glu Val Leu Asn Leu Thr Arg Asn Gly Tyr Gly Ser
195 200 205
Thr Gln Tyr Ile Arg Phe Ser Pro Asp Phe Thr Phe Gly Phe Glu Glu
210 215 220
Ser Leu Glu Val Asp Thr Asn Pro Leu Leu Gly Ala Gly Lys Phe Ala
225 230 235 240
Thr Asp Pro Ala Val Thr Leu Ala His Glu Leu Ile His Ala Gly His
245 250 255
Arg Leu Tyr Gly Ile Ala Ile Asn Pro Asn Arg Val Phe Lys Val Asn
260 265 270
Thr Asn Ala Tyr Tyr Glu Met Ser Gly Leu Glu Val Ser Phe Glu Glu
275 280 285
Leu Arg Thr Phe Gly Gly His Asp Ala Lys Phe Ile Asp Ser Leu Gln
290 295 300
Glu Asn Glu Phe Arg Leu Tyr Tyr Tyr Asn Lys Phe Lys Asp Ile Ala
305 310 315 320
Ser Thr Leu Asn Lys Ala Lys Ser Ile Val Gly Thr Thr Ala Ser Leu
325 330 335
Gln Tyr Met Lys Asn Val Phe Lys Glu Lys Tyr Leu Leu Ser Glu Asp
340 345 350
Thr Ser Gly Lys Phe Ser Val Asp Lys Leu Lys Phe Asp Lys Leu Tyr
355 360 365
Lys Met Leu Thr Glu Ile Tyr Thr Glu Asp Asn Phe Val Lys Phe Phe
370 375 380
Lys Val Leu Asn Arg Lys Thr Tyr Leu Asn Phe Asp Lys Ala Val Phe
385 390 395 400
Lys Ile Asn Ile Val Pro Lys Val Asn Tyr Thr Ile Tyr Asp Gly Phe
405 410 415
Asn Leu Arg Asn Thr Asn Leu Ala Ala Asn Phe Asn Gly Gln Asn Thr
420 425 430
Glu Ile Asn Asn Met Asn Phe Thr Lys Leu Lys Asn Phe Thr Gly Leu
435 440 445
Phe Glu Phe Tyr Lys Leu Leu Cys Val Asp Gly Ile Ile Thr Ser Lys
450 455 460
Thr Lys Ser Leu Ile Glu Gly Arg Asn Lys Ala Leu Asn Asp Leu Cys
465 470 475 480
Ile Lys Val Asn Asn Trp Asp Leu Phe Phe Ser Pro Ser Glu Asp Asn
485 490 495
Phe Thr Asn Asp Leu Asn Lys Gly Glu Glu Ile Thr Ser Asp Thr Asn
500 505 510
Ile Glu Ala Ala Glu Glu Asn Ile Ser Leu Asp Leu Ile Gln Gln Tyr
515 520 525
Tyr Leu Thr Phe Asn Phe Asp Asn Glu Pro Glu Asn Ile Ser Ile Glu
530 535 540
Asn Leu Ser Ser Asp Ile Ile Gly Gln Leu Glu Leu Met Pro Asn Ile
545 550 555 560
Glu Arg Phe Pro Asn Gly Lys Lys Tyr Glu Leu Asp Lys Tyr Thr Met
565 570 575
Phe His Tyr Leu Arg Ala Gln Glu Phe Glu His Gly Lys Ser Arg Ile
580 585 590
Ala Leu Thr Asn Ser Val Asn Glu Ala Leu Leu Asn Pro Ser Arg Val
595 600 605
Tyr Thr Phe Phe Ser Ser Asp Tyr Val Lys Lys Val Asn Lys Ala Thr
610 615 620
Glu Ala Ala Met Phe Leu Gly Trp Val Glu Gln Leu Val Tyr Asp Phe
625 630 635 640
Thr Asp Glu Thr Ser Glu Val Ser Thr Thr Asp Lys Ile Ala Asp Ile
645 650 655
Thr Ile Ile Ile Pro Tyr Ile Gly Pro Ala Leu Asn Ile Gly Asn Met
660 665 670
Leu Tyr Lys Asp Asp Phe Val Gly Ala Leu Ile Phe Ser Gly Ala Val
675 680 685
Ile Leu Leu Glu Phe Ile Pro Glu Ile Ala Ile Pro Val Leu Gly Thr
690 695 700
Phe Ala Leu Val Ser Tyr Ile Ala Asn Lys Val Leu Thr Val Gln Thr
705 710 715 720
Ile Asp Asn Ala Leu Ser Lys Arg Asn Glu Lys Trp Asp Glu Val Tyr
725 730 735
Lys Tyr Ile Val Thr Asn Trp Leu Ala Lys Val Asn Thr Gln Ile Asp
740 745 750
Leu Ile Arg Lys Lys Met Lys Glu Ala Leu Glu Asn Gln Ala Glu Ala
755 760 765
Thr Lys Ala Ile Ile Asn Tyr Gln Tyr Asn Gln Tyr Thr Glu Glu Glu
770 775 780
Lys Asn Asn Ile Asn Phe Asn Ile Asp Asp Leu Ser Ser Lys Leu Asn
785 790 795 800
Glu Ser Ile Asn Lys Ala Met Ile Asn Ile Asn Lys Phe Leu Asn Gln
805 810 815
Cys Ser Val Ser Tyr Leu Met Asn Ser Met Ile Pro Tyr Gly Val Lys
820 825 830
Arg Leu Glu Asp Phe Asp Ala Ser Leu Lys Asp Ala Leu Leu Lys Tyr
835 840 845
Ile Tyr Asp Asn Arg Gly Thr Leu Ile Gly Gln Val Asp Arg Leu Lys
850 855 860
Asp Lys Val Asn Asn Thr Leu Ser Thr Asp Ile Pro Phe Gln Leu Ser
865 870 875 880
Lys Tyr Val Asp Asn Gln Arg Leu Leu Ser Thr Cys Gly Gly Gly Gly
885 890 895
Ser Ile Glu Gly Arg Gln His Trp Ser Tyr Cys Leu Arg Pro Gly
900 905 910
<210> 5
<211> 2772
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic sequence
<400> 5
atgcatcacc atcaccatca ccatcaccat catgggagct cgaacaataa caacaataac 60
aataacaata acggatccat gacgtggcca gttaaggatt tcaactactc agatcctgta 120
aatgacaacg atattctgta ccttcgcatt ccacaaaata aactgatcac cacaccagtc 180
aaagcattca tgattactca aaacatttgg gtcattccag aacgcttttc tagtgacaca 240
aatccgagtt tatctaaacc tccgcgtccg acgtccaaat atcagagcta ttacgatccc 300
tcatatctca gtacggacga acaaaaagat actttcctta aaggtatcat taaactgttt 360
aagcgtatta atgagcgcga tatcgggaaa aagttgatta attatcttgt tgtgggttcc 420
ccgttcatgg gcgatagctc tacccccgaa gacacttttg attttacccg tcatacgaca 480
aacatcgcgg tagagaagtt tgagaacgga tcgtggaaag tcacaaacat cattacacct 540
agcgtcttaa tttttggtcc gctgccaaac atcttagatt atacagccag cctgactttg 600
caggggcaac agtcgaatcc gagtttcgaa ggttttggta ccctgagcat tctgaaagtt 660
gccccggaat ttctgctcac tttttcagat gtcaccagca accagagctc agcagtatta 720
ggaaagtcaa ttttttgcat ggacccggtt attgcactga tgcacgaact gacgcactct 780
ctgcatcaac tgtatgggat caacatcccc agtgacaaac gtattcgtcc ccaggtgtct 840
gaaggatttt tctcacagga tgggccgaac gtccagttcg aagagttgta tactttcgga 900
ggcctggacg tagagatcat tccccagatt gagcgcagtc agctgcgtga gaaggcattg 960
ggccattata aggatattgc aaaacgcctg aataacatta acaaaacgat tccatcttcg 1020
tggatctcga atattgataa atataagaaa atttttagcg agaaatataa ttttgataaa 1080
gataatacag gtaactttgt ggttaacatt gacaaattca actcccttta cagtgatttg 1140
acgaatgtaa tgagcgaagt tgtgtatagt tcccaataca acgttaagaa tcgtacccat 1200
tacttctctc gtcactacct gccggttttc gcgaacatcc ttgacgataa tatttacact 1260
attcgtgacg gctttaactt gaccaacaag ggcttcaata ttgaaaattc aggccagaac 1320
attgaacgca acccggcctt gcagaaactg tcgagtgaat ccgtggttga cctgtttacc 1380
aaagtctgcg tcgacggcat cattacctcc aaaactaaat ctctgataga aggtagaaac 1440
aaagcgctga acctgcagtg tattaaagtg aaaaacaatc ggctgcctta tgtagcagat 1500
aaagatagca ttagtcagga gattttcgaa aataaaatta tcactgacga aaccaatgtt 1560
cagaattatt cagataaatt ttcactggac gaaagcatct tagatggcca agttccgatt 1620
aacccggaaa ttgttgatcc gttactgccg aacgtgaata tggaaccgtt aaacctccct 1680
ggcgaagaga tcgtatttta tgatgacatt acgaaatatg tggactacct taattcttat 1740
tactatttgg aaagccagaa actgtccaat aacgtggaaa acattactct gaccacaagc 1800
gtggaagagg ctttaggcta ctcaaataag atttatacct tcctcccgtc gctggcggaa 1860
aaagtaaata aaggtgtgca ggctggtctg ttcctcaact gggcgaatga agttgtcgaa 1920
gactttacca cgaatattat gaaaaaggat accctggata aaatctccga cgtctcggtt 1980
attatcccat atattggccc tgcgttaaat atcggtaata gtgcgctgcg ggggaatttt 2040
aaccaggcct ttgctaccgc gggcgtcgcg ttcctcctgg agggctttcc tgaatttact 2100
atcccggcgc tcggtgtttt tacattttac tcttccatcc aggagcgtga gaaaattatc 2160
aaaaccatcg aaaactgcct ggagcagcgg gtgaaacgct ggaaagattc ttatcaatgg 2220
atggtgtcaa actggttatc tcgcatcacg acccaattca accatattaa ttaccagatg 2280
tatgatagtc tgtcgtacca agctgacgcc attaaagcca aaattgatct ggaatataaa 2340
aagtactctg gtagcgataa ggagaacatc aaaagccagg tggagaacct taagaatagt 2400
ctggatgtga aaatctctga agctatgaat aacattaaca aattcattcg tgaatgttcg 2460
gtgacgtacc tgttcaagaa tatgctgcca aaagttattg atgaactgaa taaatttgat 2520
ctgcgtacca aaaccgaact tatcaacctc atcgactccc acaacattat ccttgtgggc 2580
gaagtggatc gtctgaaggc caaagtaaac gagagctttg aaaatacgat gccgtttaat 2640
attttttcat ataccaataa ctccttgctg aaagatatca tcaatgaata tttcaatcta 2700
gaatgtggcg gtggcggtag cgacgatgac gataaacagc actggtccta ttgcctgcgc 2760
cctggttgat aa 2772
<210> 6
<211> 922
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic sequence
<400> 6
Met His His His His His His His His His His Gly Ser Ser Asn Asn
1 5 10 15
Asn Asn Asn Asn Asn Asn Asn Asn Gly Ser Met Thr Trp Pro Val Lys
20 25 30
Asp Phe Asn Tyr Ser Asp Pro Val Asn Asp Asn Asp Ile Leu Tyr Leu
35 40 45
Arg Ile Pro Gln Asn Lys Leu Ile Thr Thr Pro Val Lys Ala Phe Met
50 55 60
Ile Thr Gln Asn Ile Trp Val Ile Pro Glu Arg Phe Ser Ser Asp Thr
65 70 75 80
Asn Pro Ser Leu Ser Lys Pro Pro Arg Pro Thr Ser Lys Tyr Gln Ser
85 90 95
Tyr Tyr Asp Pro Ser Tyr Leu Ser Thr Asp Glu Gln Lys Asp Thr Phe
100 105 110
Leu Lys Gly Ile Ile Lys Leu Phe Lys Arg Ile Asn Glu Arg Asp Ile
115 120 125
Gly Lys Lys Leu Ile Asn Tyr Leu Val Val Gly Ser Pro Phe Met Gly
130 135 140
Asp Ser Ser Thr Pro Glu Asp Thr Phe Asp Phe Thr Arg His Thr Thr
145 150 155 160
Asn Ile Ala Val Glu Lys Phe Glu Asn Gly Ser Trp Lys Val Thr Asn
165 170 175
Ile Ile Thr Pro Ser Val Leu Ile Phe Gly Pro Leu Pro Asn Ile Leu
180 185 190
Asp Tyr Thr Ala Ser Leu Thr Leu Gln Gly Gln Gln Ser Asn Pro Ser
195 200 205
Phe Glu Gly Phe Gly Thr Leu Ser Ile Leu Lys Val Ala Pro Glu Phe
210 215 220
Leu Leu Thr Phe Ser Asp Val Thr Ser Asn Gln Ser Ser Ala Val Leu
225 230 235 240
Gly Lys Ser Ile Phe Cys Met Asp Pro Val Ile Ala Leu Met His Glu
245 250 255
Leu Thr His Ser Leu His Gln Leu Tyr Gly Ile Asn Ile Pro Ser Asp
260 265 270
Lys Arg Ile Arg Pro Gln Val Ser Glu Gly Phe Phe Ser Gln Asp Gly
275 280 285
Pro Asn Val Gln Phe Glu Glu Leu Tyr Thr Phe Gly Gly Leu Asp Val
290 295 300
Glu Ile Ile Pro Gln Ile Glu Arg Ser Gln Leu Arg Glu Lys Ala Leu
305 310 315 320
Gly His Tyr Lys Asp Ile Ala Lys Arg Leu Asn Asn Ile Asn Lys Thr
325 330 335
Ile Pro Ser Ser Trp Ile Ser Asn Ile Asp Lys Tyr Lys Lys Ile Phe
340 345 350
Ser Glu Lys Tyr Asn Phe Asp Lys Asp Asn Thr Gly Asn Phe Val Val
355 360 365
Asn Ile Asp Lys Phe Asn Ser Leu Tyr Ser Asp Leu Thr Asn Val Met
370 375 380
Ser Glu Val Val Tyr Ser Ser Gln Tyr Asn Val Lys Asn Arg Thr His
385 390 395 400
Tyr Phe Ser Arg His Tyr Leu Pro Val Phe Ala Asn Ile Leu Asp Asp
405 410 415
Asn Ile Tyr Thr Ile Arg Asp Gly Phe Asn Leu Thr Asn Lys Gly Phe
420 425 430
Asn Ile Glu Asn Ser Gly Gln Asn Ile Glu Arg Asn Pro Ala Leu Gln
435 440 445
Lys Leu Ser Ser Glu Ser Val Val Asp Leu Phe Thr Lys Val Cys Val
450 455 460
Asp Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Ile Glu Gly Arg Asn
465 470 475 480
Lys Ala Leu Asn Leu Gln Cys Ile Lys Val Lys Asn Asn Arg Leu Pro
485 490 495
Tyr Val Ala Asp Lys Asp Ser Ile Ser Gln Glu Ile Phe Glu Asn Lys
500 505 510
Ile Ile Thr Asp Glu Thr Asn Val Gln Asn Tyr Ser Asp Lys Phe Ser
515 520 525
Leu Asp Glu Ser Ile Leu Asp Gly Gln Val Pro Ile Asn Pro Glu Ile
530 535 540
Val Asp Pro Leu Leu Pro Asn Val Asn Met Glu Pro Leu Asn Leu Pro
545 550 555 560
Gly Glu Glu Ile Val Phe Tyr Asp Asp Ile Thr Lys Tyr Val Asp Tyr
565 570 575
Leu Asn Ser Tyr Tyr Tyr Leu Glu Ser Gln Lys Leu Ser Asn Asn Val
580 585 590
Glu Asn Ile Thr Leu Thr Thr Ser Val Glu Glu Ala Leu Gly Tyr Ser
595 600 605
Asn Lys Ile Tyr Thr Phe Leu Pro Ser Leu Ala Glu Lys Val Asn Lys
610 615 620
Gly Val Gln Ala Gly Leu Phe Leu Asn Trp Ala Asn Glu Val Val Glu
625 630 635 640
Asp Phe Thr Thr Asn Ile Met Lys Lys Asp Thr Leu Asp Lys Ile Ser
645 650 655
Asp Val Ser Val Ile Ile Pro Tyr Ile Gly Pro Ala Leu Asn Ile Gly
660 665 670
Asn Ser Ala Leu Arg Gly Asn Phe Asn Gln Ala Phe Ala Thr Ala Gly
675 680 685
Val Ala Phe Leu Leu Glu Gly Phe Pro Glu Phe Thr Ile Pro Ala Leu
690 695 700
Gly Val Phe Thr Phe Tyr Ser Ser Ile Gln Glu Arg Glu Lys Ile Ile
705 710 715 720
Lys Thr Ile Glu Asn Cys Leu Glu Gln Arg Val Lys Arg Trp Lys Asp
725 730 735
Ser Tyr Gln Trp Met Val Ser Asn Trp Leu Ser Arg Ile Thr Thr Gln
740 745 750
Phe Asn His Ile Asn Tyr Gln Met Tyr Asp Ser Leu Ser Tyr Gln Ala
755 760 765
Asp Ala Ile Lys Ala Lys Ile Asp Leu Glu Tyr Lys Lys Tyr Ser Gly
770 775 780
Ser Asp Lys Glu Asn Ile Lys Ser Gln Val Glu Asn Leu Lys Asn Ser
785 790 795 800
Leu Asp Val Lys Ile Ser Glu Ala Met Asn Asn Ile Asn Lys Phe Ile
805 810 815
Arg Glu Cys Ser Val Thr Tyr Leu Phe Lys Asn Met Leu Pro Lys Val
820 825 830
Ile Asp Glu Leu Asn Lys Phe Asp Leu Arg Thr Lys Thr Glu Leu Ile
835 840 845
Asn Leu Ile Asp Ser His Asn Ile Ile Leu Val Gly Glu Val Asp Arg
850 855 860
Leu Lys Ala Lys Val Asn Glu Ser Phe Glu Asn Thr Met Pro Phe Asn
865 870 875 880
Ile Phe Ser Tyr Thr Asn Asn Ser Leu Leu Lys Asp Ile Ile Asn Glu
885 890 895
Tyr Phe Asn Leu Glu Cys Gly Gly Gly Gly Ser Asp Asp Asp Asp Lys
900 905 910
Gln His Trp Ser Tyr Cys Leu Arg Pro Gly
915 920
<210> 7
<211> 2850
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic sequence
<400> 7
atgcatcacc atcaccatca ccatcaccat catgggagct cgaacaataa caacaataac 60
aataacaata acggatccat gacgtggcca gttaaggatt tcaactactc agatcctgta 120
aatgacaacg atattctgta ccttcgcatt ccacaaaata aactgatcac cacaccagtc 180
aaagcattca tgattactca aaacatttgg gtcattccag aacgcttttc tagtgacaca 240
aatccgagtt tatctaaacc tccgcgtccg acgtccaaat atcagagcta ttacgatccc 300
tcatatctca gtacggacga acaaaaagat actttcctta aaggtatcat taaactgttt 360
aagcgtatta atgagcgcga tatcgggaaa aagttgatta attatcttgt tgtgggttcc 420
ccgttcatgg gcgatagctc tacccccgaa gacacttttg attttacccg tcatacgaca 480
aacatcgcgg tagagaagtt tgagaacgga tcgtggaaag tcacaaacat cattacacct 540
agcgtcttaa tttttggtcc gctgccaaac atcttagatt atacagccag cctgactttg 600
caggggcaac agtcgaatcc gagtttcgaa ggttttggta ccctgagcat tctgaaagtt 660
gccccggaat ttctgctcac tttttcagat gtcaccagca accagagctc agcagtatta 720
ggaaagtcaa ttttttgcat ggacccggtt attgcactga tgcacgaact gacgcactct 780
ctgcatcaac tgtatgggat caacatcccc agtgacaaac gtattcgtcc ccaggtgtct 840
gaaggatttt tctcacagga tgggccgaac gtccagttcg aagagttgta tactttcgga 900
ggcctggacg tagagatcat tccccagatt gagcgcagtc agctgcgtga gaaggcattg 960
ggccattata aggatattgc aaaacgcctg aataacatta acaaaacgat tccatcttcg 1020
tggatctcga atattgataa atataagaaa atttttagcg agaaatataa ttttgataaa 1080
gataatacag gtaactttgt ggttaacatt gacaaattca actcccttta cagtgatttg 1140
acgaatgtaa tgagcgaagt tgtgtatagt tcccaataca acgttaagaa tcgtacccat 1200
tacttctctc gtcactacct gccggttttc gcgaacatcc ttgacgataa tatttacact 1260
attcgtgacg gctttaactt gaccaacaag ggcttcaata ttgaaaattc aggccagaac 1320
attgaacgca acccggcctt gcagaaactg tcgagtgaat ccgtggttga cctgtttacc 1380
aaagtctgcg tcgacggcat cattacctcc aaaactaaat ctctgataga aggtagaaac 1440
aaagcgctga acctgcagtg tattaaagtg aaaaacaatc ggctgcctta tgtagcagat 1500
aaagatagca ttagtcagga gattttcgaa aataaaatta tcactgacga aaccaatgtt 1560
cagaattatt cagataaatt ttcactggac gaaagcatct tagatggcca agttccgatt 1620
aacccggaaa ttgttgatcc gttactgccg aacgtgaata tggaaccgtt aaacctccct 1680
ggcgaagaga tcgtatttta tgatgacatt acgaaatatg tggactacct taattcttat 1740
tactatttgg aaagccagaa actgtccaat aacgtggaaa acattactct gaccacaagc 1800
gtggaagagg ctttaggcta ctcaaataag atttatacct tcctcccgtc gctggcggaa 1860
aaagtaaata aaggtgtgca ggctggtctg ttcctcaact gggcgaatga agttgtcgaa 1920
gactttacca cgaatattat gaaaaaggat accctggata aaatctccga cgtctcggtt 1980
attatcccat atattggccc tgcgttaaat atcggtaata gtgcgctgcg ggggaatttt 2040
aaccaggcct ttgctaccgc gggcgtcgcg ttcctcctgg agggctttcc tgaatttact 2100
atcccggcgc tcggtgtttt tacattttac tcttccatcc aggagcgtga gaaaattatc 2160
aaaaccatcg aaaactgcct ggagcagcgg gtgaaacgct ggaaagattc ttatcaatgg 2220
atggtgtcaa actggttatc tcgcatcacg acccaattca accatattaa ttaccagatg 2280
tatgatagtc tgtcgtacca agctgacgcc attaaagcca aaattgatct ggaatataaa 2340
aagtactctg gtagcgataa ggagaacatc aaaagccagg tggagaacct taagaatagt 2400
ctggatgtga aaatctctga agctatgaat aacattaaca aattcattcg tgaatgttcg 2460
gtgacgtacc tgttcaagaa tatgctgcca aaagttattg atgaactgaa taaatttgat 2520
ctgcgtacca aaaccgaact tatcaacctc atcgactccc acaacattat ccttgtgggc 2580
gaagtggatc gtctgaaggc caaagtaaac gagagctttg aaaatacgat gccgtttaat 2640
attttttcat ataccaataa ctccttgctg aaagatatca tcaatgaata tttcaatcta 2700
gaatgtggcg gtggcggtag catcgaaggt cgttatggag gttttttgag aaggatacga 2760
ccaaaattaa agtgggataa tcaaggcggt gggggtagtt gcggcggtgg cggttcgcgt 2820
ccgccgggtt tctctccgtt ccgttgataa 2850
<210> 8
<211> 948
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic sequence
<400> 8
Met His His His His His His His His His His Gly Ser Ser Asn Asn
1 5 10 15
Asn Asn Asn Asn Asn Asn Asn Asn Gly Ser Met Thr Trp Pro Val Lys
20 25 30
Asp Phe Asn Tyr Ser Asp Pro Val Asn Asp Asn Asp Ile Leu Tyr Leu
35 40 45
Arg Ile Pro Gln Asn Lys Leu Ile Thr Thr Pro Val Lys Ala Phe Met
50 55 60
Ile Thr Gln Asn Ile Trp Val Ile Pro Glu Arg Phe Ser Ser Asp Thr
65 70 75 80
Asn Pro Ser Leu Ser Lys Pro Pro Arg Pro Thr Ser Lys Tyr Gln Ser
85 90 95
Tyr Tyr Asp Pro Ser Tyr Leu Ser Thr Asp Glu Gln Lys Asp Thr Phe
100 105 110
Leu Lys Gly Ile Ile Lys Leu Phe Lys Arg Ile Asn Glu Arg Asp Ile
115 120 125
Gly Lys Lys Leu Ile Asn Tyr Leu Val Val Gly Ser Pro Phe Met Gly
130 135 140
Asp Ser Ser Thr Pro Glu Asp Thr Phe Asp Phe Thr Arg His Thr Thr
145 150 155 160
Asn Ile Ala Val Glu Lys Phe Glu Asn Gly Ser Trp Lys Val Thr Asn
165 170 175
Ile Ile Thr Pro Ser Val Leu Ile Phe Gly Pro Leu Pro Asn Ile Leu
180 185 190
Asp Tyr Thr Ala Ser Leu Thr Leu Gln Gly Gln Gln Ser Asn Pro Ser
195 200 205
Phe Glu Gly Phe Gly Thr Leu Ser Ile Leu Lys Val Ala Pro Glu Phe
210 215 220
Leu Leu Thr Phe Ser Asp Val Thr Ser Asn Gln Ser Ser Ala Val Leu
225 230 235 240
Gly Lys Ser Ile Phe Cys Met Asp Pro Val Ile Ala Leu Met His Glu
245 250 255
Leu Thr His Ser Leu His Gln Leu Tyr Gly Ile Asn Ile Pro Ser Asp
260 265 270
Lys Arg Ile Arg Pro Gln Val Ser Glu Gly Phe Phe Ser Gln Asp Gly
275 280 285
Pro Asn Val Gln Phe Glu Glu Leu Tyr Thr Phe Gly Gly Leu Asp Val
290 295 300
Glu Ile Ile Pro Gln Ile Glu Arg Ser Gln Leu Arg Glu Lys Ala Leu
305 310 315 320
Gly His Tyr Lys Asp Ile Ala Lys Arg Leu Asn Asn Ile Asn Lys Thr
325 330 335
Ile Pro Ser Ser Trp Ile Ser Asn Ile Asp Lys Tyr Lys Lys Ile Phe
340 345 350
Ser Glu Lys Tyr Asn Phe Asp Lys Asp Asn Thr Gly Asn Phe Val Val
355 360 365
Asn Ile Asp Lys Phe Asn Ser Leu Tyr Ser Asp Leu Thr Asn Val Met
370 375 380
Ser Glu Val Val Tyr Ser Ser Gln Tyr Asn Val Lys Asn Arg Thr His
385 390 395 400
Tyr Phe Ser Arg His Tyr Leu Pro Val Phe Ala Asn Ile Leu Asp Asp
405 410 415
Asn Ile Tyr Thr Ile Arg Asp Gly Phe Asn Leu Thr Asn Lys Gly Phe
420 425 430
Asn Ile Glu Asn Ser Gly Gln Asn Ile Glu Arg Asn Pro Ala Leu Gln
435 440 445
Lys Leu Ser Ser Glu Ser Val Val Asp Leu Phe Thr Lys Val Cys Val
450 455 460
Asp Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Ile Glu Gly Arg Asn
465 470 475 480
Lys Ala Leu Asn Leu Gln Cys Ile Lys Val Lys Asn Asn Arg Leu Pro
485 490 495
Tyr Val Ala Asp Lys Asp Ser Ile Ser Gln Glu Ile Phe Glu Asn Lys
500 505 510
Ile Ile Thr Asp Glu Thr Asn Val Gln Asn Tyr Ser Asp Lys Phe Ser
515 520 525
Leu Asp Glu Ser Ile Leu Asp Gly Gln Val Pro Ile Asn Pro Glu Ile
530 535 540
Val Asp Pro Leu Leu Pro Asn Val Asn Met Glu Pro Leu Asn Leu Pro
545 550 555 560
Gly Glu Glu Ile Val Phe Tyr Asp Asp Ile Thr Lys Tyr Val Asp Tyr
565 570 575
Leu Asn Ser Tyr Tyr Tyr Leu Glu Ser Gln Lys Leu Ser Asn Asn Val
580 585 590
Glu Asn Ile Thr Leu Thr Thr Ser Val Glu Glu Ala Leu Gly Tyr Ser
595 600 605
Asn Lys Ile Tyr Thr Phe Leu Pro Ser Leu Ala Glu Lys Val Asn Lys
610 615 620
Gly Val Gln Ala Gly Leu Phe Leu Asn Trp Ala Asn Glu Val Val Glu
625 630 635 640
Asp Phe Thr Thr Asn Ile Met Lys Lys Asp Thr Leu Asp Lys Ile Ser
645 650 655
Asp Val Ser Val Ile Ile Pro Tyr Ile Gly Pro Ala Leu Asn Ile Gly
660 665 670
Asn Ser Ala Leu Arg Gly Asn Phe Asn Gln Ala Phe Ala Thr Ala Gly
675 680 685
Val Ala Phe Leu Leu Glu Gly Phe Pro Glu Phe Thr Ile Pro Ala Leu
690 695 700
Gly Val Phe Thr Phe Tyr Ser Ser Ile Gln Glu Arg Glu Lys Ile Ile
705 710 715 720
Lys Thr Ile Glu Asn Cys Leu Glu Gln Arg Val Lys Arg Trp Lys Asp
725 730 735
Ser Tyr Gln Trp Met Val Ser Asn Trp Leu Ser Arg Ile Thr Thr Gln
740 745 750
Phe Asn His Ile Asn Tyr Gln Met Tyr Asp Ser Leu Ser Tyr Gln Ala
755 760 765
Asp Ala Ile Lys Ala Lys Ile Asp Leu Glu Tyr Lys Lys Tyr Ser Gly
770 775 780
Ser Asp Lys Glu Asn Ile Lys Ser Gln Val Glu Asn Leu Lys Asn Ser
785 790 795 800
Leu Asp Val Lys Ile Ser Glu Ala Met Asn Asn Ile Asn Lys Phe Ile
805 810 815
Arg Glu Cys Ser Val Thr Tyr Leu Phe Lys Asn Met Leu Pro Lys Val
820 825 830
Ile Asp Glu Leu Asn Lys Phe Asp Leu Arg Thr Lys Thr Glu Leu Ile
835 840 845
Asn Leu Ile Asp Ser His Asn Ile Ile Leu Val Gly Glu Val Asp Arg
850 855 860
Leu Lys Ala Lys Val Asn Glu Ser Phe Glu Asn Thr Met Pro Phe Asn
865 870 875 880
Ile Phe Ser Tyr Thr Asn Asn Ser Leu Leu Lys Asp Ile Ile Asn Glu
885 890 895
Tyr Phe Asn Leu Glu Cys Gly Gly Gly Gly Ser Ile Glu Gly Arg Tyr
900 905 910
Gly Gly Phe Leu Arg Arg Ile Arg Pro Lys Leu Lys Trp Asp Asn Gln
915 920 925
Gly Gly Gly Gly Ser Cys Gly Gly Gly Gly Ser Arg Pro Pro Gly Phe
930 935 940
Ser Pro Phe Arg
945
<210> 9
<211> 2862
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic sequence
<400> 9
atgcatcacc atcaccatca ccatcaccat catgggagct cgaacaataa caacaataac 60
aataacaata acggatccat ggagttcgtt aacaaacagt tcaactataa agacccagtt 120
aacggtgttg acattgctta catcaaaatc ccgaacgctg gccagatgca gccggtaaag 180
gcattcaaaa tccacaacaa aatctgggtt atcccggaac gtgatacctt tactaacccg 240
gaagaaggtg acctgaaccc gccaccggaa gcgaaacagg tgccggtatc ttactatgac 300
tccacctacc tgtctaccga taacgaaaag gacaactacc tgaaaggtgt tactaaactg 360
ttcgagcgta tttactccac cgacctgggc cgtatgctgc tgactagcat cgttcgcggt 420
atcccgttct ggggcggttc taccatcgat accgaactga aagtaatcga cactaactgc 480
atcaacgtta ttcagccgga cggttcctat cgttccgaag aactgaacct ggtgatcatc 540
ggcccgtctg ctgatatcat ccagttcgag tgtaagagct ttggtcacga agttctgaac 600
ctcacccgta acggctacgg ttccactcag tacatccgtt tctctccgga cttcaccttc 660
ggttttgaag aatccctgga agtagacacg aacccactgc tgggcgctgg taaattcgca 720
actgatcctg cggttaccct ggctcacgaa ctgattcatg caggccaccg cctgtacggt 780
atcgccatca atccgaaccg tgtcttcaaa gttaacacca acgcgtatta cgagatgtcc 840
ggtctggaag ttagcttcga agaactgcgt acttttggcg gtcacgacgc taaattcatc 900
gactctctgc aagaaaacga gttccgtctg tactactata acaagttcaa agatatcgca 960
tccaccctga acaaagcgaa atccatcgtg ggtaccactg cttctctcca gtacatgaag 1020
aacgttttta aagaaaaata cctgctcagc gaagacacct ccggcaaatt ctctgtagac 1080
aagttgaaat tcgataaact ttacaaaatg ctgactgaaa tttacaccga agacaacttc 1140
gttaagttct ttaaagttct gaaccgcaaa acctatctga acttcgacaa ggcagtattc 1200
aaaatcaaca tcgtgccgaa agttaactac actatctacg atggtttcaa cctgcgtaac 1260
accaacctgg ctgctaattt taacggccag aacacggaaa tcaacaacat gaacttcaca 1320
aaactgaaaa acttcactgg tctgttcgag ttttacaagc tgctgtgcgt cgacggcatc 1380
attacctcca aaactaaatc tctgatagaa ggtagaaaca aagcgctgaa cgacctctgt 1440
atcaaggtta acaactggga tttattcttc agcccgagtg aagacaactt caccaacgac 1500
ctgaacaaag gtgaagaaat cacctcagat actaacatcg aagcagccga agaaaacatc 1560
tcgctggacc tgatccagca gtactacctg acctttaatt tcgacaacga gccggaaaac 1620
atttctatcg aaaacctgag ctctgatatc atcggccagc tggaactgat gccgaacatc 1680
gaacgtttcc caaacggtaa aaagtacgag ctggacaaat ataccatgtt ccactacctg 1740
cgcgcgcagg aatttgaaca cggcaaatcc cgtatcgcac tgactaactc cgttaacgaa 1800
gctctgctca acccgtcccg tgtatacacc ttcttctcta gcgactacgt gaaaaaggtc 1860
aacaaagcga ctgaagctgc aatgttcttg ggttgggttg aacagcttgt ttatgatttt 1920
accgacgaga cgtccgaagt atctactacc gacaaaattg cggatatcac tatcatcatc 1980
ccgtacatcg gtccggctct gaacattggc aacatgctgt acaaagacga cttcgttggc 2040
gcactgatct tctccggtgc ggtgatcctg ctggagttca tcccggaaat cgccatcccg 2100
gtactgggca cctttgctct ggtttcttac attgcaaaca aggttctgac tgtacaaacc 2160
atcgacaacg cgctgagcaa acgtaacgaa aaatgggatg aagtttacaa atatatcgtg 2220
accaactggc tggctaaggt taatactcag atcgacctca tccgcaaaaa aatgaaagaa 2280
gcactggaaa accaggcgga agctaccaag gcaatcatta actaccagta caaccagtac 2340
accgaggaag aaaaaaacaa catcaacttc aacatcgacg atctgtcctc taaactgaac 2400
gaatccatca acaaagctat gatcaacatc aacaagttcc tgaaccagtg ctctgtaagc 2460
tatctgatga actccatgat cccgtacggt gttaaacgtc tggaggactt cgatgcgtct 2520
ctgaaagacg ccctgctgaa atacatttac gacaaccgtg gcactctgat cggtcaggtt 2580
gatcgtctga aggacaaagt gaacaatacc ttatcgaccg acatcccttt tcagctcagt 2640
aaatatgtcg ataaccaacg ccttttgtcc acttgtggcg gtggcggtag catcgaaggt 2700
cgttacggtg gtttcatgac ctctgaaaaa tctcagaccc cgctggttac cctgttcaaa 2760
aacgctatca tcaaaaacgc ttacaaaaaa ggtgaaggcg gtgggggtag ttgcggcggt 2820
ggcggttcgc gtccgccggg tttctctccg ttccgttgat aa 2862
<210> 10
<211> 952
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic sequence
<400> 10
Met His His His His His His His His His His Gly Ser Ser Asn Asn
1 5 10 15
Asn Asn Asn Asn Asn Asn Asn Asn Gly Ser Met Glu Phe Val Asn Lys
20 25 30
Gln Phe Asn Tyr Lys Asp Pro Val Asn Gly Val Asp Ile Ala Tyr Ile
35 40 45
Lys Ile Pro Asn Ala Gly Gln Met Gln Pro Val Lys Ala Phe Lys Ile
50 55 60
His Asn Lys Ile Trp Val Ile Pro Glu Arg Asp Thr Phe Thr Asn Pro
65 70 75 80
Glu Glu Gly Asp Leu Asn Pro Pro Pro Glu Ala Lys Gln Val Pro Val
85 90 95
Ser Tyr Tyr Asp Ser Thr Tyr Leu Ser Thr Asp Asn Glu Lys Asp Asn
100 105 110
Tyr Leu Lys Gly Val Thr Lys Leu Phe Glu Arg Ile Tyr Ser Thr Asp
115 120 125
Leu Gly Arg Met Leu Leu Thr Ser Ile Val Arg Gly Ile Pro Phe Trp
130 135 140
Gly Gly Ser Thr Ile Asp Thr Glu Leu Lys Val Ile Asp Thr Asn Cys
145 150 155 160
Ile Asn Val Ile Gln Pro Asp Gly Ser Tyr Arg Ser Glu Glu Leu Asn
165 170 175
Leu Val Ile Ile Gly Pro Ser Ala Asp Ile Ile Gln Phe Glu Cys Lys
180 185 190
Ser Phe Gly His Glu Val Leu Asn Leu Thr Arg Asn Gly Tyr Gly Ser
195 200 205
Thr Gln Tyr Ile Arg Phe Ser Pro Asp Phe Thr Phe Gly Phe Glu Glu
210 215 220
Ser Leu Glu Val Asp Thr Asn Pro Leu Leu Gly Ala Gly Lys Phe Ala
225 230 235 240
Thr Asp Pro Ala Val Thr Leu Ala His Glu Leu Ile His Ala Gly His
245 250 255
Arg Leu Tyr Gly Ile Ala Ile Asn Pro Asn Arg Val Phe Lys Val Asn
260 265 270
Thr Asn Ala Tyr Tyr Glu Met Ser Gly Leu Glu Val Ser Phe Glu Glu
275 280 285
Leu Arg Thr Phe Gly Gly His Asp Ala Lys Phe Ile Asp Ser Leu Gln
290 295 300
Glu Asn Glu Phe Arg Leu Tyr Tyr Tyr Asn Lys Phe Lys Asp Ile Ala
305 310 315 320
Ser Thr Leu Asn Lys Ala Lys Ser Ile Val Gly Thr Thr Ala Ser Leu
325 330 335
Gln Tyr Met Lys Asn Val Phe Lys Glu Lys Tyr Leu Leu Ser Glu Asp
340 345 350
Thr Ser Gly Lys Phe Ser Val Asp Lys Leu Lys Phe Asp Lys Leu Tyr
355 360 365
Lys Met Leu Thr Glu Ile Tyr Thr Glu Asp Asn Phe Val Lys Phe Phe
370 375 380
Lys Val Leu Asn Arg Lys Thr Tyr Leu Asn Phe Asp Lys Ala Val Phe
385 390 395 400
Lys Ile Asn Ile Val Pro Lys Val Asn Tyr Thr Ile Tyr Asp Gly Phe
405 410 415
Asn Leu Arg Asn Thr Asn Leu Ala Ala Asn Phe Asn Gly Gln Asn Thr
420 425 430
Glu Ile Asn Asn Met Asn Phe Thr Lys Leu Lys Asn Phe Thr Gly Leu
435 440 445
Phe Glu Phe Tyr Lys Leu Leu Cys Val Asp Gly Ile Ile Thr Ser Lys
450 455 460
Thr Lys Ser Leu Ile Glu Gly Arg Asn Lys Ala Leu Asn Asp Leu Cys
465 470 475 480
Ile Lys Val Asn Asn Trp Asp Leu Phe Phe Ser Pro Ser Glu Asp Asn
485 490 495
Phe Thr Asn Asp Leu Asn Lys Gly Glu Glu Ile Thr Ser Asp Thr Asn
500 505 510
Ile Glu Ala Ala Glu Glu Asn Ile Ser Leu Asp Leu Ile Gln Gln Tyr
515 520 525
Tyr Leu Thr Phe Asn Phe Asp Asn Glu Pro Glu Asn Ile Ser Ile Glu
530 535 540
Asn Leu Ser Ser Asp Ile Ile Gly Gln Leu Glu Leu Met Pro Asn Ile
545 550 555 560
Glu Arg Phe Pro Asn Gly Lys Lys Tyr Glu Leu Asp Lys Tyr Thr Met
565 570 575
Phe His Tyr Leu Arg Ala Gln Glu Phe Glu His Gly Lys Ser Arg Ile
580 585 590
Ala Leu Thr Asn Ser Val Asn Glu Ala Leu Leu Asn Pro Ser Arg Val
595 600 605
Tyr Thr Phe Phe Ser Ser Asp Tyr Val Lys Lys Val Asn Lys Ala Thr
610 615 620
Glu Ala Ala Met Phe Leu Gly Trp Val Glu Gln Leu Val Tyr Asp Phe
625 630 635 640
Thr Asp Glu Thr Ser Glu Val Ser Thr Thr Asp Lys Ile Ala Asp Ile
645 650 655
Thr Ile Ile Ile Pro Tyr Ile Gly Pro Ala Leu Asn Ile Gly Asn Met
660 665 670
Leu Tyr Lys Asp Asp Phe Val Gly Ala Leu Ile Phe Ser Gly Ala Val
675 680 685
Ile Leu Leu Glu Phe Ile Pro Glu Ile Ala Ile Pro Val Leu Gly Thr
690 695 700
Phe Ala Leu Val Ser Tyr Ile Ala Asn Lys Val Leu Thr Val Gln Thr
705 710 715 720
Ile Asp Asn Ala Leu Ser Lys Arg Asn Glu Lys Trp Asp Glu Val Tyr
725 730 735
Lys Tyr Ile Val Thr Asn Trp Leu Ala Lys Val Asn Thr Gln Ile Asp
740 745 750
Leu Ile Arg Lys Lys Met Lys Glu Ala Leu Glu Asn Gln Ala Glu Ala
755 760 765
Thr Lys Ala Ile Ile Asn Tyr Gln Tyr Asn Gln Tyr Thr Glu Glu Glu
770 775 780
Lys Asn Asn Ile Asn Phe Asn Ile Asp Asp Leu Ser Ser Lys Leu Asn
785 790 795 800
Glu Ser Ile Asn Lys Ala Met Ile Asn Ile Asn Lys Phe Leu Asn Gln
805 810 815
Cys Ser Val Ser Tyr Leu Met Asn Ser Met Ile Pro Tyr Gly Val Lys
820 825 830
Arg Leu Glu Asp Phe Asp Ala Ser Leu Lys Asp Ala Leu Leu Lys Tyr
835 840 845
Ile Tyr Asp Asn Arg Gly Thr Leu Ile Gly Gln Val Asp Arg Leu Lys
850 855 860
Asp Lys Val Asn Asn Thr Leu Ser Thr Asp Ile Pro Phe Gln Leu Ser
865 870 875 880
Lys Tyr Val Asp Asn Gln Arg Leu Leu Ser Thr Cys Gly Gly Gly Gly
885 890 895
Ser Ile Glu Gly Arg Tyr Gly Gly Phe Met Thr Ser Glu Lys Ser Gln
900 905 910
Thr Pro Leu Val Thr Leu Phe Lys Asn Ala Ile Ile Lys Asn Ala Tyr
915 920 925
Lys Lys Gly Glu Gly Gly Gly Gly Ser Cys Gly Gly Gly Gly Ser Arg
930 935 940
Pro Pro Gly Phe Ser Pro Phe Arg
945 950
<210> 11
<211> 3012
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic sequence
<400> 11
atgcatcacc atcaccatca ccatcaccat catgggagct cgaacaataa caacaataac 60
aataacaata acggatccat gacgtggcca gttaaggatt tcaactactc agatcctgta 120
aatgacaacg atattctgta ccttcgcatt ccacaaaata aactgatcac cacaccagtc 180
aaagcattca tgattactca aaacatttgg gtcattccag aacgcttttc tagtgacaca 240
aatccgagtt tatctaaacc tccgcgtccg acgtccaaat atcagagcta ttacgatccc 300
tcatatctca gtacggacga acaaaaagat actttcctta aaggtatcat taaactgttt 360
aagcgtatta atgagcgcga tatcgggaaa aagttgatta attatcttgt tgtgggttcc 420
ccgttcatgg gcgatagctc tacccccgaa gacacttttg attttacccg tcatacgaca 480
aacatcgcgg tagagaagtt tgagaacgga tcgtggaaag tcacaaacat cattacacct 540
agcgtcttaa tttttggtcc gctgccaaac atcttagatt atacagccag cctgactttg 600
caggggcaac agtcgaatcc gagtttcgaa ggttttggta ccctgagcat tctgaaagtt 660
gccccggaat ttctgctcac tttttcagat gtcaccagca accagagctc agcagtatta 720
ggaaagtcaa ttttttgcat ggacccggtt attgcactga tgcacgaact gacgcactct 780
ctgcatcaac tgtatgggat caacatcccc agtgacaaac gtattcgtcc ccaggtgtct 840
gaaggatttt tctcacagga tgggccgaac gtccagttcg aagagttgta tactttcgga 900
ggcctggacg tagagatcat tccccagatt gagcgcagtc agctgcgtga gaaggcattg 960
ggccattata aggatattgc aaaacgcctg aataacatta acaaaacgat tccatcttcg 1020
tggatctcga atattgataa atataagaaa atttttagcg agaaatataa ttttgataaa 1080
gataatacag gtaactttgt ggttaacatt gacaaattca actcccttta cagtgatttg 1140
acgaatgtaa tgagcgaagt tgtgtatagt tcccaataca acgttaagaa tcgtacccat 1200
tacttctctc gtcactacct gccggttttc gcgaacatcc ttgacgataa tatttacact 1260
attcgtgacg gctttaactt gaccaacaag ggcttcaata ttgaaaattc aggccagaac 1320
attgaacgca acccggcctt gcagaaactg tcgagtgaat ccgtggttga cctgtttacc 1380
aaagtctgcg tcgacggcat cattacctcc aaaactaaat ctctgataga aggtagaaac 1440
aaagcgctga acctgcagtg tattaaagtg aaaaacaatc ggctgcctta tgtagcagat 1500
aaagatagca ttagtcagga gattttcgaa aataaaatta tcactgacga aaccaatgtt 1560
cagaattatt cagataaatt ttcactggac gaaagcatct tagatggcca agttccgatt 1620
aacccggaaa ttgttgatcc gttactgccg aacgtgaata tggaaccgtt aaacctccct 1680
ggcgaagaga tcgtatttta tgatgacatt acgaaatatg tggactacct taattcttat 1740
tactatttgg aaagccagaa actgtccaat aacgtggaaa acattactct gaccacaagc 1800
gtggaagagg ctttaggcta ctcaaataag atttatacct tcctcccgtc gctggcggaa 1860
aaagtaaata aaggtgtgca ggctggtctg ttcctcaact gggcgaatga agttgtcgaa 1920
gactttacca cgaatattat gaaaaaggat accctggata aaatctccga cgtctcggtt 1980
attatcccat atattggccc tgcgttaaat atcggtaata gtgcgctgcg ggggaatttt 2040
aaccaggcct ttgctaccgc gggcgtcgcg ttcctcctgg agggctttcc tgaatttact 2100
atcccggcgc tcggtgtttt tacattttac tcttccatcc aggagcgtga gaaaattatc 2160
aaaaccatcg aaaactgcct ggagcagcgg gtgaaacgct ggaaagattc ttatcaatgg 2220
atggtgtcaa actggttatc tcgcatcacg acccaattca accatattaa ttaccagatg 2280
tatgatagtc tgtcgtacca agctgacgcc attaaagcca aaattgatct ggaatataaa 2340
aagtactctg gtagcgataa ggagaacatc aaaagccagg tggagaacct taagaatagt 2400
ctggatgtga aaatctctga agctatgaat aacattaaca aattcattcg tgaatgttcg 2460
gtgacgtacc tgttcaagaa tatgctgcca aaagttattg atgaactgaa taaatttgat 2520
ctgcgtacca aaaccgaact tatcaacctc atcgactccc acaacattat ccttgtgggc 2580
gaagtggatc gtctgaaggc caaagtaaac gagagctttg aaaatacgat gccgtttaat 2640
attttttcat ataccaataa ctccttgctg aaagatatca tcaatgaata tttcaatcta 2700
gaatgtggcg gtggcggtag catcgaaggt cgtcacgtgg atgcgatctt cactcagtct 2760
taccgtaaag ttctggcgca gctgagcgct cgtaaactgc tgcaggatat cctgaaccgt 2820
cagcagggtg aacgtaacca ggaacagggc gctggcggtg ggggtagttg cggcggtggc 2880
ggttcgcacg tggatgcgat cttcactcag tcttaccgta aagttctggc gcagctgagc 2940
gctcgtaaac tgctgcagga tatcctgaac cgtcagcagg gtgaacgtaa ccaggaacag 3000
ggcgcttgat aa 3012
<210> 12
<211> 1002
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic sequence
<400> 12
Met His His His His His His His His His His Gly Ser Ser Asn Asn
1 5 10 15
Asn Asn Asn Asn Asn Asn Asn Asn Gly Ser Met Thr Trp Pro Val Lys
20 25 30
Asp Phe Asn Tyr Ser Asp Pro Val Asn Asp Asn Asp Ile Leu Tyr Leu
35 40 45
Arg Ile Pro Gln Asn Lys Leu Ile Thr Thr Pro Val Lys Ala Phe Met
50 55 60
Ile Thr Gln Asn Ile Trp Val Ile Pro Glu Arg Phe Ser Ser Asp Thr
65 70 75 80
Asn Pro Ser Leu Ser Lys Pro Pro Arg Pro Thr Ser Lys Tyr Gln Ser
85 90 95
Tyr Tyr Asp Pro Ser Tyr Leu Ser Thr Asp Glu Gln Lys Asp Thr Phe
100 105 110
Leu Lys Gly Ile Ile Lys Leu Phe Lys Arg Ile Asn Glu Arg Asp Ile
115 120 125
Gly Lys Lys Leu Ile Asn Tyr Leu Val Val Gly Ser Pro Phe Met Gly
130 135 140
Asp Ser Ser Thr Pro Glu Asp Thr Phe Asp Phe Thr Arg His Thr Thr
145 150 155 160
Asn Ile Ala Val Glu Lys Phe Glu Asn Gly Ser Trp Lys Val Thr Asn
165 170 175
Ile Ile Thr Pro Ser Val Leu Ile Phe Gly Pro Leu Pro Asn Ile Leu
180 185 190
Asp Tyr Thr Ala Ser Leu Thr Leu Gln Gly Gln Gln Ser Asn Pro Ser
195 200 205
Phe Glu Gly Phe Gly Thr Leu Ser Ile Leu Lys Val Ala Pro Glu Phe
210 215 220
Leu Leu Thr Phe Ser Asp Val Thr Ser Asn Gln Ser Ser Ala Val Leu
225 230 235 240
Gly Lys Ser Ile Phe Cys Met Asp Pro Val Ile Ala Leu Met His Glu
245 250 255
Leu Thr His Ser Leu His Gln Leu Tyr Gly Ile Asn Ile Pro Ser Asp
260 265 270
Lys Arg Ile Arg Pro Gln Val Ser Glu Gly Phe Phe Ser Gln Asp Gly
275 280 285
Pro Asn Val Gln Phe Glu Glu Leu Tyr Thr Phe Gly Gly Leu Asp Val
290 295 300
Glu Ile Ile Pro Gln Ile Glu Arg Ser Gln Leu Arg Glu Lys Ala Leu
305 310 315 320
Gly His Tyr Lys Asp Ile Ala Lys Arg Leu Asn Asn Ile Asn Lys Thr
325 330 335
Ile Pro Ser Ser Trp Ile Ser Asn Ile Asp Lys Tyr Lys Lys Ile Phe
340 345 350
Ser Glu Lys Tyr Asn Phe Asp Lys Asp Asn Thr Gly Asn Phe Val Val
355 360 365
Asn Ile Asp Lys Phe Asn Ser Leu Tyr Ser Asp Leu Thr Asn Val Met
370 375 380
Ser Glu Val Val Tyr Ser Ser Gln Tyr Asn Val Lys Asn Arg Thr His
385 390 395 400
Tyr Phe Ser Arg His Tyr Leu Pro Val Phe Ala Asn Ile Leu Asp Asp
405 410 415
Asn Ile Tyr Thr Ile Arg Asp Gly Phe Asn Leu Thr Asn Lys Gly Phe
420 425 430
Asn Ile Glu Asn Ser Gly Gln Asn Ile Glu Arg Asn Pro Ala Leu Gln
435 440 445
Lys Leu Ser Ser Glu Ser Val Val Asp Leu Phe Thr Lys Val Cys Val
450 455 460
Asp Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Ile Glu Gly Arg Asn
465 470 475 480
Lys Ala Leu Asn Leu Gln Cys Ile Lys Val Lys Asn Asn Arg Leu Pro
485 490 495
Tyr Val Ala Asp Lys Asp Ser Ile Ser Gln Glu Ile Phe Glu Asn Lys
500 505 510
Ile Ile Thr Asp Glu Thr Asn Val Gln Asn Tyr Ser Asp Lys Phe Ser
515 520 525
Leu Asp Glu Ser Ile Leu Asp Gly Gln Val Pro Ile Asn Pro Glu Ile
530 535 540
Val Asp Pro Leu Leu Pro Asn Val Asn Met Glu Pro Leu Asn Leu Pro
545 550 555 560
Gly Glu Glu Ile Val Phe Tyr Asp Asp Ile Thr Lys Tyr Val Asp Tyr
565 570 575
Leu Asn Ser Tyr Tyr Tyr Leu Glu Ser Gln Lys Leu Ser Asn Asn Val
580 585 590
Glu Asn Ile Thr Leu Thr Thr Ser Val Glu Glu Ala Leu Gly Tyr Ser
595 600 605
Asn Lys Ile Tyr Thr Phe Leu Pro Ser Leu Ala Glu Lys Val Asn Lys
610 615 620
Gly Val Gln Ala Gly Leu Phe Leu Asn Trp Ala Asn Glu Val Val Glu
625 630 635 640
Asp Phe Thr Thr Asn Ile Met Lys Lys Asp Thr Leu Asp Lys Ile Ser
645 650 655
Asp Val Ser Val Ile Ile Pro Tyr Ile Gly Pro Ala Leu Asn Ile Gly
660 665 670
Asn Ser Ala Leu Arg Gly Asn Phe Asn Gln Ala Phe Ala Thr Ala Gly
675 680 685
Val Ala Phe Leu Leu Glu Gly Phe Pro Glu Phe Thr Ile Pro Ala Leu
690 695 700
Gly Val Phe Thr Phe Tyr Ser Ser Ile Gln Glu Arg Glu Lys Ile Ile
705 710 715 720
Lys Thr Ile Glu Asn Cys Leu Glu Gln Arg Val Lys Arg Trp Lys Asp
725 730 735
Ser Tyr Gln Trp Met Val Ser Asn Trp Leu Ser Arg Ile Thr Thr Gln
740 745 750
Phe Asn His Ile Asn Tyr Gln Met Tyr Asp Ser Leu Ser Tyr Gln Ala
755 760 765
Asp Ala Ile Lys Ala Lys Ile Asp Leu Glu Tyr Lys Lys Tyr Ser Gly
770 775 780
Ser Asp Lys Glu Asn Ile Lys Ser Gln Val Glu Asn Leu Lys Asn Ser
785 790 795 800
Leu Asp Val Lys Ile Ser Glu Ala Met Asn Asn Ile Asn Lys Phe Ile
805 810 815
Arg Glu Cys Ser Val Thr Tyr Leu Phe Lys Asn Met Leu Pro Lys Val
820 825 830
Ile Asp Glu Leu Asn Lys Phe Asp Leu Arg Thr Lys Thr Glu Leu Ile
835 840 845
Asn Leu Ile Asp Ser His Asn Ile Ile Leu Val Gly Glu Val Asp Arg
850 855 860
Leu Lys Ala Lys Val Asn Glu Ser Phe Glu Asn Thr Met Pro Phe Asn
865 870 875 880
Ile Phe Ser Tyr Thr Asn Asn Ser Leu Leu Lys Asp Ile Ile Asn Glu
885 890 895
Tyr Phe Asn Leu Glu Cys Gly Gly Gly Gly Ser Ile Glu Gly Arg His
900 905 910
Val Asp Ala Ile Phe Thr Gln Ser Tyr Arg Lys Val Leu Ala Gln Leu
915 920 925
Ser Ala Arg Lys Leu Leu Gln Asp Ile Leu Asn Arg Gln Gln Gly Glu
930 935 940
Arg Asn Gln Glu Gln Gly Ala Gly Gly Gly Gly Ser Cys Gly Gly Gly
945 950 955 960
Gly Ser His Val Asp Ala Ile Phe Thr Gln Ser Tyr Arg Lys Val Leu
965 970 975
Ala Gln Leu Ser Ala Arg Lys Leu Leu Gln Asp Ile Leu Asn Arg Gln
980 985 990
Gln Gly Glu Arg Asn Gln Glu Gln Gly Ala
995 1000
<210> 13
<211> 2814
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic sequence
<400> 13
atgcatcacc atcaccatca ccatcaccat catgggagct cgaacaataa caacaataac 60
aataacaata acggatccat gacgtggcca gttaaggatt tcaactactc agatcctgta 120
aatgacaacg atattctgta ccttcgcatt ccacaaaata aactgatcac cacaccagtc 180
aaagcattca tgattactca aaacatttgg gtcattccag aacgcttttc tagtgacaca 240
aatccgagtt tatctaaacc tccgcgtccg acgtccaaat atcagagcta ttacgatccc 300
tcatatctca gtacggacga acaaaaagat actttcctta aaggtatcat taaactgttt 360
aagcgtatta atgagcgcga tatcgggaaa aagttgatta attatcttgt tgtgggttcc 420
ccgttcatgg gcgatagctc tacccccgaa gacacttttg attttacccg tcatacgaca 480
aacatcgcgg tagagaagtt tgagaacgga tcgtggaaag tcacaaacat cattacacct 540
agcgtcttaa tttttggtcc gctgccaaac atcttagatt atacagccag cctgactttg 600
caggggcaac agtcgaatcc gagtttcgaa ggttttggta ccctgagcat tctgaaagtt 660
gccccggaat ttctgctcac tttttcagat gtcaccagca accagagctc agcagtatta 720
ggaaagtcaa ttttttgcat ggacccggtt attgcactga tgcacgaact gacgcactct 780
ctgcatcaac tgtatgggat caacatcccc agtgacaaac gtattcgtcc ccaggtgtct 840
gaaggatttt tctcacagga tgggccgaac gtccagttcg aagagttgta tactttcgga 900
ggcctggacg tagagatcat tccccagatt gagcgcagtc agctgcgtga gaaggcattg 960
ggccattata aggatattgc aaaacgcctg aataacatta acaaaacgat tccatcttcg 1020
tggatctcga atattgataa atataagaaa atttttagcg agaaatataa ttttgataaa 1080
gataatacag gtaactttgt ggttaacatt gacaaattca actcccttta cagtgatttg 1140
acgaatgtaa tgagcgaagt tgtgtatagt tcccaataca acgttaagaa tcgtacccat 1200
tacttctctc gtcactacct gccggttttc gcgaacatcc ttgacgataa tatttacact 1260
attcgtgacg gctttaactt gaccaacaag ggcttcaata ttgaaaattc aggccagaac 1320
attgaacgca acccggcctt gcagaaactg tcgagtgaat ccgtggttga cctgtttacc 1380
aaagtctgcg tcgacggcat cattacctcc aaaactaaat ctctgataga aggtagaaac 1440
aaagcgctga acctgcagtg tattaaagtg aaaaacaatc ggctgcctta tgtagcagat 1500
aaagatagca ttagtcagga gattttcgaa aataaaatta tcactgacga aaccaatgtt 1560
cagaattatt cagataaatt ttcactggac gaaagcatct tagatggcca agttccgatt 1620
aacccggaaa ttgttgatcc gttactgccg aacgtgaata tggaaccgtt aaacctccct 1680
ggcgaagaga tcgtatttta tgatgacatt acgaaatatg tggactacct taattcttat 1740
tactatttgg aaagccagaa actgtccaat aacgtggaaa acattactct gaccacaagc 1800
gtggaagagg ctttaggcta ctcaaataag atttatacct tcctcccgtc gctggcggaa 1860
aaagtaaata aaggtgtgca ggctggtctg ttcctcaact gggcgaatga agttgtcgaa 1920
gactttacca cgaatattat gaaaaaggat accctggata aaatctccga cgtctcggtt 1980
attatcccat atattggccc tgcgttaaat atcggtaata gtgcgctgcg ggggaatttt 2040
aaccaggcct ttgctaccgc gggcgtcgcg ttcctcctgg agggctttcc tgaatttact 2100
atcccggcgc tcggtgtttt tacattttac tcttccatcc aggagcgtga gaaaattatc 2160
aaaaccatcg aaaactgcct ggagcagcgg gtgaaacgct ggaaagattc ttatcaatgg 2220
atggtgtcaa actggttatc tcgcatcacg acccaattca accatattaa ttaccagatg 2280
tatgatagtc tgtcgtacca agctgacgcc attaaagcca aaattgatct ggaatataaa 2340
aagtactctg gtagcgataa ggagaacatc aaaagccagg tggagaacct taagaatagt 2400
ctggatgtga aaatctctga agctatgaat aacattaaca aattcattcg tgaatgttcg 2460
gtgacgtacc tgttcaagaa tatgctgcca aaagttattg atgaactgaa taaatttgat 2520
ctgcgtacca aaaccgaact tatcaacctc atcgactccc acaacattat ccttgtgggc 2580
gaagtggatc gtctgaaggc caaagtaaac gagagctttg aaaatacgat gccgtttaat 2640
attttttcat ataccaataa ctccttgctg aaagatatca tcaatgaata tttcaatcta 2700
gaatgtggtg gcggtggctc tggtggcggc ggttctattg aaggtcgcgg tggcggtggc 2760
tctggtggcg gcggttctca gcactggtcc tattgcctgc gccctggttg ataa 2814
<210> 14
<211> 936
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic sequence
<400> 14
Met His His His His His His His His His His Gly Ser Ser Asn Asn
1 5 10 15
Asn Asn Asn Asn Asn Asn Asn Asn Gly Ser Met Thr Trp Pro Val Lys
20 25 30
Asp Phe Asn Tyr Ser Asp Pro Val Asn Asp Asn Asp Ile Leu Tyr Leu
35 40 45
Arg Ile Pro Gln Asn Lys Leu Ile Thr Thr Pro Val Lys Ala Phe Met
50 55 60
Ile Thr Gln Asn Ile Trp Val Ile Pro Glu Arg Phe Ser Ser Asp Thr
65 70 75 80
Asn Pro Ser Leu Ser Lys Pro Pro Arg Pro Thr Ser Lys Tyr Gln Ser
85 90 95
Tyr Tyr Asp Pro Ser Tyr Leu Ser Thr Asp Glu Gln Lys Asp Thr Phe
100 105 110
Leu Lys Gly Ile Ile Lys Leu Phe Lys Arg Ile Asn Glu Arg Asp Ile
115 120 125
Gly Lys Lys Leu Ile Asn Tyr Leu Val Val Gly Ser Pro Phe Met Gly
130 135 140
Asp Ser Ser Thr Pro Glu Asp Thr Phe Asp Phe Thr Arg His Thr Thr
145 150 155 160
Asn Ile Ala Val Glu Lys Phe Glu Asn Gly Ser Trp Lys Val Thr Asn
165 170 175
Ile Ile Thr Pro Ser Val Leu Ile Phe Gly Pro Leu Pro Asn Ile Leu
180 185 190
Asp Tyr Thr Ala Ser Leu Thr Leu Gln Gly Gln Gln Ser Asn Pro Ser
195 200 205
Phe Glu Gly Phe Gly Thr Leu Ser Ile Leu Lys Val Ala Pro Glu Phe
210 215 220
Leu Leu Thr Phe Ser Asp Val Thr Ser Asn Gln Ser Ser Ala Val Leu
225 230 235 240
Gly Lys Ser Ile Phe Cys Met Asp Pro Val Ile Ala Leu Met His Glu
245 250 255
Leu Thr His Ser Leu His Gln Leu Tyr Gly Ile Asn Ile Pro Ser Asp
260 265 270
Lys Arg Ile Arg Pro Gln Val Ser Glu Gly Phe Phe Ser Gln Asp Gly
275 280 285
Pro Asn Val Gln Phe Glu Glu Leu Tyr Thr Phe Gly Gly Leu Asp Val
290 295 300
Glu Ile Ile Pro Gln Ile Glu Arg Ser Gln Leu Arg Glu Lys Ala Leu
305 310 315 320
Gly His Tyr Lys Asp Ile Ala Lys Arg Leu Asn Asn Ile Asn Lys Thr
325 330 335
Ile Pro Ser Ser Trp Ile Ser Asn Ile Asp Lys Tyr Lys Lys Ile Phe
340 345 350
Ser Glu Lys Tyr Asn Phe Asp Lys Asp Asn Thr Gly Asn Phe Val Val
355 360 365
Asn Ile Asp Lys Phe Asn Ser Leu Tyr Ser Asp Leu Thr Asn Val Met
370 375 380
Ser Glu Val Val Tyr Ser Ser Gln Tyr Asn Val Lys Asn Arg Thr His
385 390 395 400
Tyr Phe Ser Arg His Tyr Leu Pro Val Phe Ala Asn Ile Leu Asp Asp
405 410 415
Asn Ile Tyr Thr Ile Arg Asp Gly Phe Asn Leu Thr Asn Lys Gly Phe
420 425 430
Asn Ile Glu Asn Ser Gly Gln Asn Ile Glu Arg Asn Pro Ala Leu Gln
435 440 445
Lys Leu Ser Ser Glu Ser Val Val Asp Leu Phe Thr Lys Val Cys Val
450 455 460
Asp Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Ile Glu Gly Arg Asn
465 470 475 480
Lys Ala Leu Asn Leu Gln Cys Ile Lys Val Lys Asn Asn Arg Leu Pro
485 490 495
Tyr Val Ala Asp Lys Asp Ser Ile Ser Gln Glu Ile Phe Glu Asn Lys
500 505 510
Ile Ile Thr Asp Glu Thr Asn Val Gln Asn Tyr Ser Asp Lys Phe Ser
515 520 525
Leu Asp Glu Ser Ile Leu Asp Gly Gln Val Pro Ile Asn Pro Glu Ile
530 535 540
Val Asp Pro Leu Leu Pro Asn Val Asn Met Glu Pro Leu Asn Leu Pro
545 550 555 560
Gly Glu Glu Ile Val Phe Tyr Asp Asp Ile Thr Lys Tyr Val Asp Tyr
565 570 575
Leu Asn Ser Tyr Tyr Tyr Leu Glu Ser Gln Lys Leu Ser Asn Asn Val
580 585 590
Glu Asn Ile Thr Leu Thr Thr Ser Val Glu Glu Ala Leu Gly Tyr Ser
595 600 605
Asn Lys Ile Tyr Thr Phe Leu Pro Ser Leu Ala Glu Lys Val Asn Lys
610 615 620
Gly Val Gln Ala Gly Leu Phe Leu Asn Trp Ala Asn Glu Val Val Glu
625 630 635 640
Asp Phe Thr Thr Asn Ile Met Lys Lys Asp Thr Leu Asp Lys Ile Ser
645 650 655
Asp Val Ser Val Ile Ile Pro Tyr Ile Gly Pro Ala Leu Asn Ile Gly
660 665 670
Asn Ser Ala Leu Arg Gly Asn Phe Asn Gln Ala Phe Ala Thr Ala Gly
675 680 685
Val Ala Phe Leu Leu Glu Gly Phe Pro Glu Phe Thr Ile Pro Ala Leu
690 695 700
Gly Val Phe Thr Phe Tyr Ser Ser Ile Gln Glu Arg Glu Lys Ile Ile
705 710 715 720
Lys Thr Ile Glu Asn Cys Leu Glu Gln Arg Val Lys Arg Trp Lys Asp
725 730 735
Ser Tyr Gln Trp Met Val Ser Asn Trp Leu Ser Arg Ile Thr Thr Gln
740 745 750
Phe Asn His Ile Asn Tyr Gln Met Tyr Asp Ser Leu Ser Tyr Gln Ala
755 760 765
Asp Ala Ile Lys Ala Lys Ile Asp Leu Glu Tyr Lys Lys Tyr Ser Gly
770 775 780
Ser Asp Lys Glu Asn Ile Lys Ser Gln Val Glu Asn Leu Lys Asn Ser
785 790 795 800
Leu Asp Val Lys Ile Ser Glu Ala Met Asn Asn Ile Asn Lys Phe Ile
805 810 815
Arg Glu Cys Ser Val Thr Tyr Leu Phe Lys Asn Met Leu Pro Lys Val
820 825 830
Ile Asp Glu Leu Asn Lys Phe Asp Leu Arg Thr Lys Thr Glu Leu Ile
835 840 845
Asn Leu Ile Asp Ser His Asn Ile Ile Leu Val Gly Glu Val Asp Arg
850 855 860
Leu Lys Ala Lys Val Asn Glu Ser Phe Glu Asn Thr Met Pro Phe Asn
865 870 875 880
Ile Phe Ser Tyr Thr Asn Asn Ser Leu Leu Lys Asp Ile Ile Asn Glu
885 890 895
Tyr Phe Asn Leu Glu Cys Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
900 905 910
Ile Glu Gly Arg Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln His
915 920 925
Trp Ser Tyr Cys Leu Arg Pro Gly
930 935
<210> 15
<211> 2793
<212> DNA
<213> Artificial Sequence
<220>
<223> Synthetic sequence
<400> 15
atgcatcacc atcaccatca ccatcaccat catgggagct cgaacaataa caacaataac 60
aataacaata acggatccat ggagttcgtt aacaaacagt tcaactataa agacccagtt 120
aacggtgttg acattgctta catcaaaatc ccgaacgctg gccagatgca gccggtaaag 180
gcattcaaaa tccacaacaa aatctgggtt atcccggaac gtgatacctt tactaacccg 240
gaagaaggtg acctgaaccc gccaccggaa gcgaaacagg tgccggtatc ttactatgac 300
tccacctacc tgtctaccga taacgaaaag gacaactacc tgaaaggtgt tactaaactg 360
ttcgagcgta tttactccac cgacctgggc cgtatgctgc tgactagcat cgttcgcggt 420
atcccgttct ggggcggttc taccatcgat accgaactga aagtaatcga cactaactgc 480
atcaacgtta ttcagccgga cggttcctat cgttccgaag aactgaacct ggtgatcatc 540
ggcccgtctg ctgatatcat ccagttcgag tgtaagagct ttggtcacga agttctgaac 600
ctcacccgta acggctacgg ttccactcag tacatccgtt tctctccgga cttcaccttc 660
ggttttgaag aatccctgga agtagacacg aacccactgc tgggcgctgg taaattcgca 720
actgatcctg cggttaccct ggctcacgaa ctgattcatg caggccaccg cctgtacggt 780
atcgccatca atccgaaccg tgtcttcaaa gttaacacca acgcgtatta cgagatgtcc 840
ggtctggaag ttagcttcga agaactgcgt acttttggcg gtcacgacgc taaattcatc 900
gactctctgc aagaaaacga gttccgtctg tactactata acaagttcaa agatatcgca 960
tccaccctga acaaagcgaa atccatcgtg ggtaccactg cttctctcca gtacatgaag 1020
aacgttttta aagaaaaata cctgctcagc gaagacacct ccggcaaatt ctctgtagac 1080
aagttgaaat tcgataaact ttacaaaatg ctgactgaaa tttacaccga agacaacttc 1140
gttaagttct ttaaagttct gaaccgcaaa acctatctga acttcgacaa ggcagtattc 1200
aaaatcaaca tcgtgccgaa agttaactac actatctacg atggtttcaa cctgcgtaac 1260
accaacctgg ctgctaattt taacggccag aacacggaaa tcaacaacat gaacttcaca 1320
aaactgaaaa acttcactgg tctgttcgag ttttacaagc tgctgtgcgt cgacggcatc 1380
attacctcca aaactaaatc tctgatagaa ggtagaaaca aagcgctgaa cgacctctgt 1440
atcaaggtta acaactggga tttattcttc agcccgagtg aagacaactt caccaacgac 1500
ctgaacaaag gtgaagaaat cacctcagat actaacatcg aagcagccga agaaaacatc 1560
tcgctggacc tgatccagca gtactacctg acctttaatt tcgacaacga gccggaaaac 1620
atttctatcg aaaacctgag ctctgatatc atcggccagc tggaactgat gccgaacatc 1680
gaacgtttcc caaacggtaa aaagtacgag ctggacaaat ataccatgtt ccactacctg 1740
cgcgcgcagg aatttgaaca cggcaaatcc cgtatcgcac tgactaactc cgttaacgaa 1800
gctctgctca acccgtcccg tgtatacacc ttcttctcta gcgactacgt gaaaaaggtc 1860
aacaaagcga ctgaagctgc aatgttcttg ggttgggttg aacagcttgt ttatgatttt 1920
accgacgaga cgtccgaagt atctactacc gacaaaattg cggatatcac tatcatcatc 1980
ccgtacatcg gtccggctct gaacattggc aacatgctgt acaaagacga cttcgttggc 2040
gcactgatct tctccggtgc ggtgatcctg ctggagttca tcccggaaat cgccatcccg 2100
gtactgggca cctttgctct ggtttcttac attgcaaaca aggttctgac tgtacaaacc 2160
atcgacaacg cgctgagcaa acgtaacgaa aaatgggatg aagtttacaa atatatcgtg 2220
accaactggc tggctaaggt taatactcag atcgacctca tccgcaaaaa aatgaaagaa 2280
gcactggaaa accaggcgga agctaccaag gcaatcatta actaccagta caaccagtac 2340
accgaggaag aaaaaaacaa catcaacttc aacatcgacg atctgtcctc taaactgaac 2400
gaatccatca acaaagctat gatcaacatc aacaagttcc tgaaccagtg ctctgtaagc 2460
tatctgatga actccatgat cccgtacggt gttaaacgtc tggaggactt cgatgcgtct 2520
ctgaaagacg ccctgctgaa atacatttac gacaaccgtg gcactctgat cggtcaggtt 2580
gatcgtctga aggacaaagt gaacaatacc ttatcgaccg acatcccttt tcagctcagt 2640
aaatatgtcg ataaccaacg ccttttgtcc acttgtggcg gtggcggtag catcgaaggt 2700
cgtgttccat taccagcagg aggaggaaca gtattgacta aaatgtatcc atgcggaaat 2760
cactgggcag tgggacatct aatgggatga taa 2793
<210> 16
<211> 929
<212> PRT
<213> Artificial Sequence
<220>
<223> Synthetic sequence
<400> 16
Met His His His His His His His His His His Gly Ser Ser Asn Asn
1 5 10 15
Asn Asn Asn Asn Asn Asn Asn Asn Gly Ser Met Glu Phe Val Asn Lys
20 25 30
Gln Phe Asn Tyr Lys Asp Pro Val Asn Gly Val Asp Ile Ala Tyr Ile
35 40 45
Lys Ile Pro Asn Ala Gly Gln Met Gln Pro Val Lys Ala Phe Lys Ile
50 55 60
His Asn Lys Ile Trp Val Ile Pro Glu Arg Asp Thr Phe Thr Asn Pro
65 70 75 80
Glu Glu Gly Asp Leu Asn Pro Pro Pro Glu Ala Lys Gln Val Pro Val
85 90 95
Ser Tyr Tyr Asp Ser Thr Tyr Leu Ser Thr Asp Asn Glu Lys Asp Asn
100 105 110
Tyr Leu Lys Gly Val Thr Lys Leu Phe Glu Arg Ile Tyr Ser Thr Asp
115 120 125
Leu Gly Arg Met Leu Leu Thr Ser Ile Val Arg Gly Ile Pro Phe Trp
130 135 140
Gly Gly Ser Thr Ile Asp Thr Glu Leu Lys Val Ile Asp Thr Asn Cys
145 150 155 160
Ile Asn Val Ile Gln Pro Asp Gly Ser Tyr Arg Ser Glu Glu Leu Asn
165 170 175
Leu Val Ile Ile Gly Pro Ser Ala Asp Ile Ile Gln Phe Glu Cys Lys
180 185 190
Ser Phe Gly His Glu Val Leu Asn Leu Thr Arg Asn Gly Tyr Gly Ser
195 200 205
Thr Gln Tyr Ile Arg Phe Ser Pro Asp Phe Thr Phe Gly Phe Glu Glu
210 215 220
Ser Leu Glu Val Asp Thr Asn Pro Leu Leu Gly Ala Gly Lys Phe Ala
225 230 235 240
Thr Asp Pro Ala Val Thr Leu Ala His Glu Leu Ile His Ala Gly His
245 250 255
Arg Leu Tyr Gly Ile Ala Ile Asn Pro Asn Arg Val Phe Lys Val Asn
260 265 270
Thr Asn Ala Tyr Tyr Glu Met Ser Gly Leu Glu Val Ser Phe Glu Glu
275 280 285
Leu Arg Thr Phe Gly Gly His Asp Ala Lys Phe Ile Asp Ser Leu Gln
290 295 300
Glu Asn Glu Phe Arg Leu Tyr Tyr Tyr Asn Lys Phe Lys Asp Ile Ala
305 310 315 320
Ser Thr Leu Asn Lys Ala Lys Ser Ile Val Gly Thr Thr Ala Ser Leu
325 330 335
Gln Tyr Met Lys Asn Val Phe Lys Glu Lys Tyr Leu Leu Ser Glu Asp
340 345 350
Thr Ser Gly Lys Phe Ser Val Asp Lys Leu Lys Phe Asp Lys Leu Tyr
355 360 365
Lys Met Leu Thr Glu Ile Tyr Thr Glu Asp Asn Phe Val Lys Phe Phe
370 375 380
Lys Val Leu Asn Arg Lys Thr Tyr Leu Asn Phe Asp Lys Ala Val Phe
385 390 395 400
Lys Ile Asn Ile Val Pro Lys Val Asn Tyr Thr Ile Tyr Asp Gly Phe
405 410 415
Asn Leu Arg Asn Thr Asn Leu Ala Ala Asn Phe Asn Gly Gln Asn Thr
420 425 430
Glu Ile Asn Asn Met Asn Phe Thr Lys Leu Lys Asn Phe Thr Gly Leu
435 440 445
Phe Glu Phe Tyr Lys Leu Leu Cys Val Asp Gly Ile Ile Thr Ser Lys
450 455 460
Thr Lys Ser Leu Ile Glu Gly Arg Asn Lys Ala Leu Asn Asp Leu Cys
465 470 475 480
Ile Lys Val Asn Asn Trp Asp Leu Phe Phe Ser Pro Ser Glu Asp Asn
485 490 495
Phe Thr Asn Asp Leu Asn Lys Gly Glu Glu Ile Thr Ser Asp Thr Asn
500 505 510
Ile Glu Ala Ala Glu Glu Asn Ile Ser Leu Asp Leu Ile Gln Gln Tyr
515 520 525
Tyr Leu Thr Phe Asn Phe Asp Asn Glu Pro Glu Asn Ile Ser Ile Glu
530 535 540
Asn Leu Ser Ser Asp Ile Ile Gly Gln Leu Glu Leu Met Pro Asn Ile
545 550 555 560
Glu Arg Phe Pro Asn Gly Lys Lys Tyr Glu Leu Asp Lys Tyr Thr Met
565 570 575
Phe His Tyr Leu Arg Ala Gln Glu Phe Glu His Gly Lys Ser Arg Ile
580 585 590
Ala Leu Thr Asn Ser Val Asn Glu Ala Leu Leu Asn Pro Ser Arg Val
595 600 605
Tyr Thr Phe Phe Ser Ser Asp Tyr Val Lys Lys Val Asn Lys Ala Thr
610 615 620
Glu Ala Ala Met Phe Leu Gly Trp Val Glu Gln Leu Val Tyr Asp Phe
625 630 635 640
Thr Asp Glu Thr Ser Glu Val Ser Thr Thr Asp Lys Ile Ala Asp Ile
645 650 655
Thr Ile Ile Ile Pro Tyr Ile Gly Pro Ala Leu Asn Ile Gly Asn Met
660 665 670
Leu Tyr Lys Asp Asp Phe Val Gly Ala Leu Ile Phe Ser Gly Ala Val
675 680 685
Ile Leu Leu Glu Phe Ile Pro Glu Ile Ala Ile Pro Val Leu Gly Thr
690 695 700
Phe Ala Leu Val Ser Tyr Ile Ala Asn Lys Val Leu Thr Val Gln Thr
705 710 715 720
Ile Asp Asn Ala Leu Ser Lys Arg Asn Glu Lys Trp Asp Glu Val Tyr
725 730 735
Lys Tyr Ile Val Thr Asn Trp Leu Ala Lys Val Asn Thr Gln Ile Asp
740 745 750
Leu Ile Arg Lys Lys Met Lys Glu Ala Leu Glu Asn Gln Ala Glu Ala
755 760 765
Thr Lys Ala Ile Ile Asn Tyr Gln Tyr Asn Gln Tyr Thr Glu Glu Glu
770 775 780
Lys Asn Asn Ile Asn Phe Asn Ile Asp Asp Leu Ser Ser Lys Leu Asn
785 790 795 800
Glu Ser Ile Asn Lys Ala Met Ile Asn Ile Asn Lys Phe Leu Asn Gln
805 810 815
Cys Ser Val Ser Tyr Leu Met Asn Ser Met Ile Pro Tyr Gly Val Lys
820 825 830
Arg Leu Glu Asp Phe Asp Ala Ser Leu Lys Asp Ala Leu Leu Lys Tyr
835 840 845
Ile Tyr Asp Asn Arg Gly Thr Leu Ile Gly Gln Val Asp Arg Leu Lys
850 855 860
Asp Lys Val Asn Asn Thr Leu Ser Thr Asp Ile Pro Phe Gln Leu Ser
865 870 875 880
Lys Tyr Val Asp Asn Gln Arg Leu Leu Ser Thr Cys Gly Gly Gly Gly
885 890 895
Ser Ile Glu Gly Arg Val Pro Leu Pro Ala Gly Gly Gly Thr Val Leu
900 905 910
Thr Lys Met Tyr Pro Cys Gly Asn His Trp Ala Val Gly His Leu Met
915 920 925
Gly
Claims (26)
- 하기를 포함하는, 단일-쇄, 폴리펩티드 융합 단백질:
(a) 표적 세포의 엑소사이토시스 융합 기구(exocytic fusion apparatus)의 단백질을 절단(cleaving)할 수 있는 비-세포독성 프로테아제(protease);
(b) 표적 세포의 결합 부위에 결합할 수 있는 표적화 모이어티(targeting moiety)로서, 상기 결합 부위는 표적 세포 내 엔도좀(endosome)에 통합되어 엔도사이토시스(endocytosis)를 수행할 수 있는 것인 표적화 모이어티;
(c) 상기 프로테아제를 엔도좀 내로부터 엔도좀 막을 거쳐 표적 세포의 세포질로 전위시킬 수 있는 전위(translocation) 도메인;
(d) 상기 융합 단백질이 제 1 프로테아제에 의해 절단되는, 제 1 프로테아제 절단 부위로서, 상기 제 1 프로테아제 절단 부위(cleavage site)는 상기 비-세포독성 프로테아제와 상기 전위 도메인 사이에 위치하는 것인 제 1 프로테아제 절단 부위;
(e) 상기 융합 단백질이 제 2 프로테아제에 의해 절단되는, 제 2 프로테아제 절단 부위로서, 상기 제 2 프로테아제 절단 부위는 상기 전위 도메인과 상기 표적화 모이어티 사이에 위치하는 것인 제 2 프로테아제 절단 부위; 및
(f) 상기 표적화 모이어티와 상기 전위 도메인 사이의 공유결합으로서, 상기 제 2 프로테아제 절단 부위에서 단백질 분해에 의한 절단 후 상기 표적화 모이어티가 공유 결합에 의해 전위 도메인에 연결된 상태를 유지하는 것인 공유 결합. - 청구항 1에 있어서, 상기 전위 도메인은 상기 비-세포독성 프로테아제와 상기 표적화 모이어티 사이에 위치하는 것인 융합 단백질.
- 청구항 1에 있어서, 상기 표적화 모이어티는 상기 비-세포독성 프로테아제와 상기 전위 도메인 사이에 위치하고; 상기 제 1 프로테아제 절단 부위는 또한 상기 비-세포독성 프로테아제와 상기 표적화 모이어티 사이에 위치하는 것인 융합 단백질.
- 선행하는 항 중 어느 한 항에 있어서, 상기 비-세포독성 프로테아제는 상기 단백질의 N-말단에 위치하는 것인 융합 단백질.
- 선행하는 항 중 어느 한 항에 있어서, 상기 공유 결합은 이황화 결합인 것인 융합 단백질.
- 선행하는 항 중 어느 한 항에 있어서, 상기 전위 도메인과 상기 표적화 모이어티 사이에 이차 폴리펩티드 구조를 제공하는 짧은 폴리펩티드가 위치하고, 및 상기 이차 폴리펩티드 구조는 상기 표적화 모이어티의 일부를 상기 전위 도메인에 인접하게 배치시키는 역할을 하고, 이에 의해, 상기 공유 결합의 형성이 에너지 측면에서 더 유리하게 되는 것인 융합 단백질.
- 선행하는 항 중 어느 한 항에 있어서, 상기 표적화 모이어티는 제 1 및 제 2 도메인을 포함하고, 및 상기 제 1 및 제 2 도메인은 10개 이하의 아미노산 잔기, 바람직하게는 5개 이하의 아미노산 잔기, 및 더욱 바람직하게는 0개의 아미노산 잔기에 의해 분리되는 것인 융합 단백질.
- 청구항 7에 있어서, 상기 표적화 모이어티의 제 1 및 제 2 도메인은 상이한 수용체의 리간드로부터 유래되는 것인 융합 단백질.
- 선행하는 항 중 어느 한 항에 있어서, 상기 표적화 모이어티는 상기 표적화 모이어티의 N-말단 도메인과 상기 결합 부위의 도메인 사이의 상호작용을 통해서 및 동시에 상기 표적화 모이어티의 C-말단 도메인과 상기 결합 부위의 도메인 사이의 상호작용을 통해 표적 세포의 결합 부위와 상호작용할 수 있는 것인 융합 단백질.
- 선행하는 항 중 어느 한 항에 있어서, 상기 표적화 모이어티는 하기의 군으로부터 선택되는 펩티드를 포함하거나 또는 그로 구성되는 것인 융합 단백질: 성선자극호르몬-분비 호르몬(gonadotropin-releasing hormone, GnRH) 펩티드, 오피오이드(opioid) 펩티드, 베타-엔돌핀(beta-endorphin) 펩티드, 브래디키닌(bradykinin) 펩티드, BAM 펩티드, 노시셉틴(nociceptin) 펩티드, 디놀핀(dynorphin) 펩티드, 갈라닌(galanin) 펩티드, 엔케팔린(enkephalin) 펩티드, P 물질(substance P) 펩티드, 코르티코트로핀-분비 인자(corticotrophin-releasing factor, CRF) 펩티드, 가스트린-분비 펩티드(gastrin-releasing peptide, GRP), 뉴로메딘 B(Neuromedin B) 펩티드, 봄베신(bombesin) 펩티드, 가스트린(gastrin) 펩티드, CCK 펩티드, 소마토스타틴(somatostatin, SST) 펩티드, 코르티스타틴(cortistatin, CST) 펩티드, 성장호르몬 분비 호르몬(growth hormone releasing hormone, GHRH) 펩티드, PAR 펩티드, 부갑상선 호르몬(parathyroid hormone, PTH) 펩티드, VIP(vasointestinal peptide), 베타2 아드레날린수용체 작용제 펩티드, 가스트린-분비 펩티드, 칼시토닌 유전자 관련 펩티드(calcitonin gene related peptide), 갑상선 자극 호르몬(thyroid stimulating hormone, TSH) 펩티드, 인슐린 펩티드, 인슐린-유사 성장 인자(insuline-like growth factor) 펩티드, 고나도렐린(gonadorelin) 펩티드, 코르티코트로핀 분비 호르몬(corticotrophin releasing hormone, CRH) 펩티드, 부신피질자극 호르몬(adrenocorticotropic hormone, ACTH) 펩티드, 뇌하수체 아데닐 사이클라제 활성화 펩티드(pituitary adenyl cyclase activating peptide, PACAP).
- 선행하는 항 중 어느 한 항에 있어서, 상기 비-세포독성 프로테아제와 제 1 프로테아제 절단 부위는 10개 이하의 아미노산 잔기, 바람직하게는 5개 이하의 아미노산 잔기, 및 더욱 바람직하게는 0개의 아미노산 잔기에 의해 분리되는 것인 융합 단백질.
- 선행하는 항 중 어느 한 항에 있어서, 상기 전위 도메인과 제 1 프로테아제 절단 부위는 10개 이하의 아미노산 잔기, 바람직하게는 5개 이하의 아미노산 잔기, 및 더욱 바람직하게는 0개의 아미노산 잔기에 의해 분리되는 것인 융합 단백질.
- 선행하는 항 중 어느 한 항에 있어서, 상기 전위 도메인과 제 2 프로테아제 절단 부위는 10개 이하의 아미노산 잔기, 바람직하게는 5개 이하의 아미노산 잔기, 및 더욱 바람직하게는 0개의 아미노산 잔기에 의해 분리되는 것인 융합 단백질.
- 선행하는 항 중 어느 한 항에 있어서, 상기 표적화 모이어티와 제 2 프로테아제 절단 부위는 10개 이하의 아미노산 잔기, 바람직하게는 5개 이하의 아미노산 잔기, 및 더욱 바람직하게는 0개의 아미노산 잔기에 의해 분리되는 것인 융합 단백질.
- 선행하는 항 중 어느 한 항에 있어서, 상기 제 1 프로테아제와 제 2 프로테아제는 동일한 것인 융합 단백질.
- 선행하는 항 중 어느 한 항에 있어서, 상기 비-세포독성 프로테아제는 클로스트리디움 신경독소 경쇄(L-chain) 또는 그의 단편인 것인 융합 단백질.
- 선행하는 항 중 어느 한 항에 있어서, 상기 전위 도메인은 클로스트리디움 신경독소 HN 도메인 또는 그의 단편인 것인 융합 단백질.
- 선행하는 항 중 어느 한 항에 있어서, 상기 융합 단백질은 정제 태그(purification tag)를 포함하는 것인 융합 단백질.
- 선행하는 항 중 어느 한 항에 따른 폴리펩티드 융합 단백질을 코딩하는 핵산 서열.
- 프로모터, 청구항 19에 따른 핵산 서열, 및 터미네이터를 포함하고; 상기 핵산 서열은 상기 프로모터의 하류에 위치하고; 상기 터미네이터는 상기 핵산 서열의 하류에 위치하는 것인 DNA 벡터.
- 청구항 19에 따른 DNA 서열의 상보적 DNA 가닥.
- 숙주세포에서, 청구항 19에 따른 핵산 서열, 또는 청구항 17에 따른 DNA 벡터를 발현시키는 단계를 포함하는, 청구항 1 내지 18 중 어느 한 항에 따른 단일-쇄 폴리펩티드 융합 단백질을 제조하는 방법.
- 하기를 포함하는, 비-세포독성 작용제(agent)의 제조 방법:
a. 본 발명의 단일-쇄 폴리펩티드 융합 단백질을 포함하는 용액을 제공하는 단계;
b. 상기 용액에 제 1 프로테아제 절단 부위를 절단할 수 있는 제 1 프로테아제 및 제 2 프로테아제 절단 부위를 절단할 수 있는 제 2 프로테아제를 첨가하는 단계; 및
c. 상기 제 1 프로테아제 절단 부위 및 상기 제 2 프로테아제 절단 부위를 절단하여, 이에 의해 삼중-쇄 융합 단백질(tri-chain fusion protein)을 형성하는 단계. - 청구항 23의 방법에 의해서 얻을 수 있는 비-세포독성 폴리펩티드로서, 상기 폴리펩티드는 삼중-쇄 폴리펩티드이고:
a. 제 1 쇄는 표적 세포의 엑소사이토시스 융합 기구의 단백질을 절단할 수 있는 비-세포독성 프로테아제를 포함하고;
b. 제 2 쇄는 엔도좀 내로부터 상기 비- 세포독성 프로테아제를 엔도좀 막을 거쳐 상기 표적 세포의 세포질 속으로 전위시킬 수 있는 전위 도메인을 포함하며;
c. 제 3 쇄는 상기 표적 세포의 결합 부위에 결합할 수 있는 표적화 모이어티를 포함하고, 상기 결합 부위는 상기 표적 세포 내 엔도좀에 통합되어 엔도사이토시스를 수행할 수 있고;
d. 상기 제 1 및 제 2 쇄는 서로 이황화 결합으로 연결되고; 및 제 2 및 제 3 도메인은 공유 결합에 의해 서로 연결되는 것인 비-세포독성 폴리펩티드. - 질병(medical condition)의 치료, 예방 또는 개선에 이용하기 위한, 청구항 1 내지 18 중 어느 한 항에 따른 단일-쇄 폴리펩티드 융합 단백질 또는 청구항 24에 따른 비-세포독성 폴리펩티드.
- 청구항 25에 있어서, 상기 의학적 상태는 통증, (만성) 신경성 염증, 과민성 방광과 같은 비뇨생식기-신경학적 상태, 전립선암, 폐암, 유방암, 또는 대장암(colorectal cancer)으로부터 선택되는 것인, 단일-쇄 폴리펩티드 융합 단백질 또는 비-세포독성 폴리펩티드.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB1108108.0 | 2011-05-16 | ||
GBGB1108108.0A GB201108108D0 (en) | 2011-05-16 | 2011-05-16 | Therapeutic fusion proteins |
PCT/GB2012/051104 WO2012156743A1 (en) | 2011-05-16 | 2012-05-16 | Therapeutic fusion proteins |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20140036239A true KR20140036239A (ko) | 2014-03-25 |
KR102032760B1 KR102032760B1 (ko) | 2019-10-16 |
Family
ID=44260550
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137033432A KR102032760B1 (ko) | 2011-05-16 | 2012-05-16 | 치료용 융합 단백질 |
Country Status (15)
Country | Link |
---|---|
US (2) | US10081803B2 (ko) |
EP (1) | EP2710129B1 (ko) |
JP (1) | JP6050330B2 (ko) |
KR (1) | KR102032760B1 (ko) |
CN (1) | CN103649317B (ko) |
AU (1) | AU2012257578B9 (ko) |
BR (1) | BR112013029525A8 (ko) |
CA (1) | CA2835285C (ko) |
ES (1) | ES2562425T3 (ko) |
GB (1) | GB201108108D0 (ko) |
HK (1) | HK1192587A1 (ko) |
MX (1) | MX348047B (ko) |
RU (1) | RU2651492C2 (ko) |
UA (1) | UA112985C2 (ko) |
WO (1) | WO2012156743A1 (ko) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160030392A (ko) * | 2013-07-09 | 2016-03-17 | 입센 바이오이노베이션 리미티드 | 가려움증 억제 |
KR20190003698A (ko) * | 2016-05-05 | 2019-01-09 | 입센 바이오팜 리미티드 | 키메라 신경독소 |
KR102174197B1 (ko) | 2019-06-12 | 2020-11-04 | 주식회사 앤씨비아이티 | 생산성이 향상된 비독성 프로테아제 |
KR20210098382A (ko) * | 2020-01-31 | 2021-08-10 | 울산대학교 산학협력단 | 인슐린유사성장인자-1 융합단백질 및 이의 용도 |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8399400B2 (en) | 2004-12-01 | 2013-03-19 | Syntaxin, Ltd. | Fusion proteins |
US8778634B2 (en) | 2004-12-01 | 2014-07-15 | Syntaxin, Ltd. | Non-cytotoxic protein conjugates |
GB0426394D0 (en) | 2004-12-01 | 2005-01-05 | Health Prot Agency | Fusion proteins |
GB0610867D0 (en) | 2006-06-01 | 2006-07-12 | Syntaxin Ltd | Treatment of pain |
AU2009259034B2 (en) | 2008-06-12 | 2013-10-31 | Ipsen Bioinnovation Limited | Suppression of cancers |
US20140056870A1 (en) | 2012-08-27 | 2014-02-27 | Allergan, Inc. | Fusion proteins |
CA2880897C (en) | 2012-11-21 | 2020-01-14 | Syntaxin Limited | Methods for the manufacture of proteolytically processed polypeptides |
GB201303108D0 (en) * | 2013-02-21 | 2013-04-10 | Syntaxin Ltd | Therapeutics for suppressing osteoporosis |
CN104098652B (zh) * | 2014-07-23 | 2016-11-09 | 国家纳米科学中心 | 一种抑制肿瘤转移的多肽和多肽复合物、其制备方法及其应用 |
US10258669B2 (en) | 2014-07-23 | 2019-04-16 | National Center For Nanoscience And Technology, China | Polypeptide and polypeptide complex for suppressing tumor metastasis and treating leukemia as well as preparation method therefor and application thereof |
TW201718627A (zh) * | 2015-06-11 | 2017-06-01 | 梅茲製藥有限兩合公司 | 重組梭菌神經毒素及其使用與形成方法、包括其之醫藥組合物及對應其之前驅物、編碼前驅物之核酸序列及其獲得方法與前驅物之形成方法、載體與包括核酸序列之重組宿主細胞 |
WO2017035507A1 (en) * | 2015-08-27 | 2017-03-02 | President And Fellows Of Harvard College | Compositions and methods for treatment of pain |
CN105567739B (zh) * | 2016-02-04 | 2019-07-12 | 郑州可尔利尔生物科技有限公司 | 病毒载体颗粒及其构建方法和应用 |
TW201814045A (zh) | 2016-09-16 | 2018-04-16 | 英商艾普森生物製藥有限公司 | 製造雙鏈梭狀芽孢桿菌神經毒素之方法 |
EP3519430A1 (en) | 2016-09-29 | 2019-08-07 | Ipsen Biopharm Limited | Hybrid neurotoxins |
EP3312290A1 (en) | 2016-10-18 | 2018-04-25 | Ipsen Biopharm Limited | Cellular vamp cleavage assay |
GB201714330D0 (en) * | 2017-09-06 | 2017-10-18 | Järver Peter | Oligonucleotides |
MX2020007596A (es) | 2018-01-29 | 2020-09-03 | Ipsen Biopharm Ltd | Neurotoxinas botulinicas para escindir una proteina de receptor de union a factor sensible a n-etilmaleimida soluble (snare) no neuronal. |
CN108611309A (zh) * | 2018-04-28 | 2018-10-02 | 中国药科大学 | 一种表达重组GnRH与GRP融合蛋白的基因工程菌的构建 |
GB201900621D0 (en) * | 2019-01-16 | 2019-03-06 | Ipsen Biopharm Ltd | Labelled polypeptides |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1998007864A1 (en) * | 1996-08-23 | 1998-02-26 | Microbiological Research Authority Camr (Centre For Applied Microbiology & Research) | Recombinant toxin fragments |
WO2005023309A2 (en) * | 2003-09-11 | 2005-03-17 | Health Protection Agency | Design of re-targeted toxin conjugates |
WO2006059093A2 (en) * | 2004-12-01 | 2006-06-08 | Health Protection Agency | Fusion proteins |
WO2007138339A2 (en) * | 2006-06-01 | 2007-12-06 | Syntaxin Limited | Treatment of pain by use of a single chain polypeptide fusion protein |
US20080187960A1 (en) * | 2004-12-01 | 2008-08-07 | Keith Foster | Non-Cytotoxic Protein Conjugates |
Family Cites Families (35)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5223409A (en) | 1988-09-02 | 1993-06-29 | Protein Engineering Corp. | Directed evolution of novel binding proteins |
IL99552A0 (en) | 1990-09-28 | 1992-08-18 | Ixsys Inc | Compositions containing procaryotic cells,a kit for the preparation of vectors useful for the coexpression of two or more dna sequences and methods for the use thereof |
US5759551A (en) * | 1993-04-27 | 1998-06-02 | United Biomedical, Inc. | Immunogenic LHRH peptide constructs and synthetic universal immune stimulators for vaccines |
GB9508204D0 (en) | 1995-04-21 | 1995-06-07 | Speywood Lab Ltd | A novel agent able to modify peripheral afferent function |
US7192596B2 (en) * | 1996-08-23 | 2007-03-20 | The Health Protection Agency Ipsen Limited | Recombinant toxin fragments |
GB9721189D0 (en) * | 1997-10-08 | 1997-12-03 | Speywood Lab The Limited | Analgesic conjugates |
US6277479B1 (en) | 1997-12-19 | 2001-08-21 | Kimberly-Clark Worldwide, Inc. | Microporous films having zoned breathability |
CN1241945C (zh) | 1998-05-13 | 2006-02-15 | 拜欧特康生化技术开发和咨询有限公司 | 用于抑制肥大细胞脱粒的杂合蛋白质及其用途 |
US7273722B2 (en) | 2000-11-29 | 2007-09-25 | Allergan, Inc. | Neurotoxins with enhanced target specificity |
US7811584B2 (en) | 2004-06-30 | 2010-10-12 | Allergan, Inc. | Multivalent clostridial toxins |
US7514088B2 (en) | 2005-03-15 | 2009-04-07 | Allergan, Inc. | Multivalent Clostridial toxin derivatives and methods of their use |
US20060024331A1 (en) | 2004-08-02 | 2006-02-02 | Ester Fernandez-Salas | Toxin compounds with enhanced membrane translocation characteristics |
US8399400B2 (en) * | 2004-12-01 | 2013-03-19 | Syntaxin, Ltd. | Fusion proteins |
US7659092B2 (en) * | 2004-12-01 | 2010-02-09 | Syntaxin, Ltd. | Fusion proteins |
ATE463506T1 (de) | 2005-09-19 | 2010-04-15 | Allergan Inc | Mit clostriedientoxin aktivierbare clostridientoxine |
EP1834962A1 (de) | 2006-03-15 | 2007-09-19 | Biotecon Therapeutics GmbH | PEGyliertes mutiertes Clostridium botulinum Toxin |
EP2041162A2 (en) | 2006-07-11 | 2009-04-01 | Allergan, Inc. | Modified clostridial toxins with enhanced translocation capability and enhanced targeting activity |
CA2657521A1 (en) | 2006-07-11 | 2008-01-17 | Allergan, Inc. | Modified clostridial toxins with enhanced translocation capabilities and altered targeting activity for non-clostridial toxin target cells |
US7993656B2 (en) | 2006-07-11 | 2011-08-09 | Allergan, Inc. | Modified clostridial toxins with enhanced translocation capabilities and altered targeting activity for clostridial toxin target cells |
KR100914958B1 (ko) | 2007-10-01 | 2009-09-02 | 구스 매뉴팩츄어링 인코포레이티드 | 의류 탈색용 지지체의 제조방법 |
GB0725321D0 (en) * | 2007-12-31 | 2008-02-06 | Syntaxin Ltd | Delivery vehicles |
US20110171191A1 (en) * | 2008-06-12 | 2011-07-14 | Syntaxin Limited | Suppression of neuroendocrine diseases |
AU2009259034B2 (en) | 2008-06-12 | 2013-10-31 | Ipsen Bioinnovation Limited | Suppression of cancers |
GB0820970D0 (en) | 2008-11-17 | 2008-12-24 | Syntaxin Ltd | Suppression of cancer |
GB0903006D0 (en) | 2009-02-23 | 2009-04-08 | Syntaxin Ltd | Modified non-cytotoxic proteases |
US20100303788A1 (en) | 2009-05-29 | 2010-12-02 | Allergan, Inc. | Methods of Treating Chronic Neurogenic Inflammation Using Galanin Retargeted Endopepidases |
US20100303794A1 (en) | 2009-05-29 | 2010-12-02 | Allergan, Inc. | Methods of Treating Urogenital-Neurological Disorders Using Glucagon Like Hormone Retargeted Endopepidases |
US20100303757A1 (en) | 2009-05-29 | 2010-12-02 | Allergan, Inc. | Methods of Treating Chronic Neurogenic Inflammation Using Interleukin Retargeted Endopepidases |
US20100303798A1 (en) | 2009-05-29 | 2010-12-02 | Allergan, Inc. | Methods of Treating Urogenital-Neurological Disorders Using Neurotrophin Retargeted Endopepidases |
US20100303791A1 (en) | 2009-05-29 | 2010-12-02 | Allergan, Inc. | Methods of Treating Chronic Neurogenic Inflammation Using Glucagon Like Hormone Retargeted Endopepidases |
US20100303783A1 (en) | 2009-05-29 | 2010-12-02 | Allergan, Inc. | Methods of Treating Urogenital-Neurological Disorders Using Tachykinin Retargeted Endopepidases |
US20100303789A1 (en) | 2009-05-29 | 2010-12-02 | Allergan, Inc. | Methods of Treating Chronic Neurogenic Inflammation Using Neurotrophin Retargeted Endopepidases |
US8198229B2 (en) | 2009-05-29 | 2012-06-12 | Allergan, Inc. | Methods of treating urogenital-neurological disorders using galanin retargeted endopepidases |
US20100303756A1 (en) | 2009-05-29 | 2010-12-02 | Allergan, Inc. | Methods of Treating Urogenital-Neurological Disorders Using Interleukin Retargeted Endopepidases |
WO2011022357A2 (en) | 2009-08-17 | 2011-02-24 | East Carolina University | Fast acting snare-cleaving enzymes |
-
2011
- 2011-05-16 GB GBGB1108108.0A patent/GB201108108D0/en not_active Ceased
-
2012
- 2012-05-16 MX MX2013013447A patent/MX348047B/es active IP Right Grant
- 2012-05-16 ES ES12722486.3T patent/ES2562425T3/es active Active
- 2012-05-16 KR KR1020137033432A patent/KR102032760B1/ko active IP Right Grant
- 2012-05-16 US US14/117,286 patent/US10081803B2/en active Active
- 2012-05-16 AU AU2012257578A patent/AU2012257578B9/en not_active Ceased
- 2012-05-16 RU RU2013155594A patent/RU2651492C2/ru active
- 2012-05-16 JP JP2014510881A patent/JP6050330B2/ja not_active Expired - Fee Related
- 2012-05-16 WO PCT/GB2012/051104 patent/WO2012156743A1/en active Application Filing
- 2012-05-16 BR BR112013029525A patent/BR112013029525A8/pt not_active IP Right Cessation
- 2012-05-16 CA CA2835285A patent/CA2835285C/en not_active Expired - Fee Related
- 2012-05-16 CN CN201280023958.1A patent/CN103649317B/zh not_active Expired - Fee Related
- 2012-05-16 UA UAA201314597A patent/UA112985C2/uk unknown
- 2012-05-16 EP EP12722486.3A patent/EP2710129B1/en active Active
-
2014
- 2014-06-20 HK HK14105926.2A patent/HK1192587A1/zh not_active IP Right Cessation
-
2018
- 2018-08-20 US US16/105,203 patent/US10704038B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1998007864A1 (en) * | 1996-08-23 | 1998-02-26 | Microbiological Research Authority Camr (Centre For Applied Microbiology & Research) | Recombinant toxin fragments |
WO2005023309A2 (en) * | 2003-09-11 | 2005-03-17 | Health Protection Agency | Design of re-targeted toxin conjugates |
WO2006059093A2 (en) * | 2004-12-01 | 2006-06-08 | Health Protection Agency | Fusion proteins |
US20080187960A1 (en) * | 2004-12-01 | 2008-08-07 | Keith Foster | Non-Cytotoxic Protein Conjugates |
WO2007138339A2 (en) * | 2006-06-01 | 2007-12-06 | Syntaxin Limited | Treatment of pain by use of a single chain polypeptide fusion protein |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160030392A (ko) * | 2013-07-09 | 2016-03-17 | 입센 바이오이노베이션 리미티드 | 가려움증 억제 |
KR20190003698A (ko) * | 2016-05-05 | 2019-01-09 | 입센 바이오팜 리미티드 | 키메라 신경독소 |
KR102174197B1 (ko) | 2019-06-12 | 2020-11-04 | 주식회사 앤씨비아이티 | 생산성이 향상된 비독성 프로테아제 |
WO2020251163A1 (ko) | 2019-06-12 | 2020-12-17 | 주식회사 앤씨비아이티 | 생산성이 향상된 비독성 프로테아제 |
KR20210098382A (ko) * | 2020-01-31 | 2021-08-10 | 울산대학교 산학협력단 | 인슐린유사성장인자-1 융합단백질 및 이의 용도 |
Also Published As
Publication number | Publication date |
---|---|
MX348047B (es) | 2017-05-25 |
KR102032760B1 (ko) | 2019-10-16 |
US10704038B2 (en) | 2020-07-07 |
JP2014516526A (ja) | 2014-07-17 |
CA2835285C (en) | 2020-08-25 |
AU2012257578B9 (en) | 2017-07-27 |
US20190062721A1 (en) | 2019-02-28 |
JP6050330B2 (ja) | 2016-12-21 |
CN103649317B (zh) | 2015-10-21 |
EP2710129B1 (en) | 2015-11-25 |
US20140147429A1 (en) | 2014-05-29 |
AU2012257578A1 (en) | 2013-11-28 |
AU2012257578B2 (en) | 2017-07-13 |
RU2651492C2 (ru) | 2018-04-19 |
US10081803B2 (en) | 2018-09-25 |
GB201108108D0 (en) | 2011-06-29 |
WO2012156743A1 (en) | 2012-11-22 |
ES2562425T3 (es) | 2016-03-04 |
EP2710129A1 (en) | 2014-03-26 |
MX2013013447A (es) | 2014-07-14 |
BR112013029525A2 (pt) | 2017-01-24 |
UA112985C2 (uk) | 2016-11-25 |
HK1192587A1 (zh) | 2014-08-22 |
RU2013155594A (ru) | 2015-06-27 |
CA2835285A1 (en) | 2012-11-22 |
BR112013029525A8 (pt) | 2018-01-02 |
CN103649317A (zh) | 2014-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10704038B2 (en) | Therapeutic fusion proteins | |
US10744190B2 (en) | Method for suppressing spasmodic torticollis | |
JP5438901B2 (ja) | 非細胞傷害性プロテアーゼ、ターゲティング部分、プロテアーゼ切断部位およびトランスロケーションドメインを含む融合タンパク質 | |
EP2326665B1 (en) | Non-cytotoxic fusion proteins comprising egf muteins | |
EP2719392B1 (en) | Fusion proteins for use in the treatment of acromegaly | |
US20190127718A1 (en) | Suppression of cancer | |
US20150353908A1 (en) | Therapeutics for suppressing osteoporosis | |
AU2015268754A1 (en) | Suppression of cancer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |