KR101861872B1 - 항암 융합 단백질 - Google Patents
항암 융합 단백질 Download PDFInfo
- Publication number
- KR101861872B1 KR101861872B1 KR1020137002118A KR20137002118A KR101861872B1 KR 101861872 B1 KR101861872 B1 KR 101861872B1 KR 1020137002118 A KR1020137002118 A KR 1020137002118A KR 20137002118 A KR20137002118 A KR 20137002118A KR 101861872 B1 KR101861872 B1 KR 101861872B1
- Authority
- KR
- South Korea
- Prior art keywords
- seq
- sequence
- domain
- protein
- fusion protein
- Prior art date
Links
- 108020001507 fusion proteins Proteins 0.000 title claims abstract description 423
- 102000037865 fusion proteins Human genes 0.000 title claims abstract description 423
- 230000001093 anti-cancer Effects 0.000 title description 11
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 330
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 239
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 235
- 210000004027 cell Anatomy 0.000 claims abstract description 133
- 150000001413 amino acids Chemical class 0.000 claims abstract description 71
- 230000001939 inductive effect Effects 0.000 claims abstract description 28
- 238000011282 treatment Methods 0.000 claims abstract description 24
- 210000004899 c-terminal region Anatomy 0.000 claims abstract description 19
- 239000013604 expression vector Substances 0.000 claims abstract description 18
- 238000000034 method Methods 0.000 claims description 206
- 241000588724 Escherichia coli Species 0.000 claims description 115
- 238000003776 cleavage reaction Methods 0.000 claims description 75
- 230000007017 scission Effects 0.000 claims description 75
- 230000014509 gene expression Effects 0.000 claims description 74
- 230000006907 apoptotic process Effects 0.000 claims description 58
- 108090000435 Urokinase-type plasminogen activator Proteins 0.000 claims description 53
- 229920000724 poly(L-arginine) polymer Polymers 0.000 claims description 40
- 108010011110 polyarginine Proteins 0.000 claims description 40
- 230000032258 transport Effects 0.000 claims description 33
- 102100021573 Bcl-2-binding component 3, isoforms 3/4 Human genes 0.000 claims description 24
- 101000971203 Homo sapiens Bcl-2-binding component 3, isoforms 1/2 Proteins 0.000 claims description 24
- 101000971209 Homo sapiens Bcl-2-binding component 3, isoforms 3/4 Proteins 0.000 claims description 24
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 claims description 21
- 230000002438 mitochondrial effect Effects 0.000 claims description 19
- 102100033189 Diablo IAP-binding mitochondrial protein Human genes 0.000 claims description 17
- 108700000707 bcl-2-Associated X Proteins 0.000 claims description 17
- 102000055102 bcl-2-Associated X Human genes 0.000 claims description 17
- 102000040430 polynucleotide Human genes 0.000 claims description 17
- 108091033319 polynucleotide Proteins 0.000 claims description 17
- 239000002157 polynucleotide Substances 0.000 claims description 17
- 239000008194 pharmaceutical composition Substances 0.000 claims description 16
- 210000004881 tumor cell Anatomy 0.000 claims description 15
- 210000002472 endoplasmic reticulum Anatomy 0.000 claims description 14
- 108050002772 E3 ubiquitin-protein ligase Mdm2 Proteins 0.000 claims description 13
- 102000012199 E3 ubiquitin-protein ligase Mdm2 Human genes 0.000 claims description 13
- 102000035195 Peptidases Human genes 0.000 claims description 13
- 108091005804 Peptidases Proteins 0.000 claims description 13
- 239000004365 Protease Substances 0.000 claims description 13
- 210000000170 cell membrane Anatomy 0.000 claims description 10
- 208000008443 pancreatic carcinoma Diseases 0.000 claims description 10
- 230000005945 translocation Effects 0.000 claims description 10
- 108700000712 BH3 Interacting Domain Death Agonist Proteins 0.000 claims description 9
- 102000055105 BH3 Interacting Domain Death Agonist Human genes 0.000 claims description 9
- 102000001398 Granzyme Human genes 0.000 claims description 9
- 108060005986 Granzyme Proteins 0.000 claims description 9
- 108700039689 bcl-2 Homologous Antagonist-Killer Proteins 0.000 claims description 9
- 102000055574 bcl-2 Homologous Antagonist-Killer Human genes 0.000 claims description 9
- 101150082208 DIABLO gene Proteins 0.000 claims description 8
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 claims description 8
- 102100040853 PRKC apoptosis WT1 regulator protein Human genes 0.000 claims description 8
- 101710162991 PRKC apoptosis WT1 regulator protein Proteins 0.000 claims description 8
- 206010009944 Colon cancer Diseases 0.000 claims description 7
- 108010052832 Cytochromes Proteins 0.000 claims description 7
- 102000018832 Cytochromes Human genes 0.000 claims description 7
- 206010058467 Lung neoplasm malignant Diseases 0.000 claims description 7
- 102100022679 Nuclear receptor subfamily 4 group A member 1 Human genes 0.000 claims description 7
- 101100405120 Xenopus laevis nr4a1 gene Proteins 0.000 claims description 7
- 208000029742 colonic neoplasm Diseases 0.000 claims description 7
- 201000005202 lung cancer Diseases 0.000 claims description 7
- 208000020816 lung neoplasm Diseases 0.000 claims description 7
- JARGNLJYKBUKSJ-KGZKBUQUSA-N (2r)-2-amino-5-[[(2r)-1-(carboxymethylamino)-3-hydroxy-1-oxopropan-2-yl]amino]-5-oxopentanoic acid;hydrobromide Chemical group Br.OC(=O)[C@H](N)CCC(=O)N[C@H](CO)C(=O)NCC(O)=O JARGNLJYKBUKSJ-KGZKBUQUSA-N 0.000 claims description 6
- 108020002230 Pancreatic Ribonuclease Proteins 0.000 claims description 6
- 206010061902 Pancreatic neoplasm Diseases 0.000 claims description 6
- 102000005891 Pancreatic ribonuclease Human genes 0.000 claims description 6
- 102000004245 Proteasome Endopeptidase Complex Human genes 0.000 claims description 6
- 108090000708 Proteasome Endopeptidase Complex Proteins 0.000 claims description 6
- 241000589517 Pseudomonas aeruginosa Species 0.000 claims description 6
- 108010044804 gamma-glutamyl-seryl-glycine Proteins 0.000 claims description 6
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 claims description 6
- 201000002528 pancreatic cancer Diseases 0.000 claims description 6
- 230000008685 targeting Effects 0.000 claims description 6
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 5
- 206010006187 Breast cancer Diseases 0.000 claims description 5
- 208000026310 Breast neoplasm Diseases 0.000 claims description 5
- 108090000301 Membrane transport proteins Proteins 0.000 claims description 5
- 102000003939 Membrane transport proteins Human genes 0.000 claims description 5
- 101100405118 Mus musculus Nr4a1 gene Proteins 0.000 claims description 5
- 206010033128 Ovarian cancer Diseases 0.000 claims description 5
- 206010061535 Ovarian neoplasm Diseases 0.000 claims description 5
- JUJWROOIHBZHMG-UHFFFAOYSA-N Pyridine Chemical compound C1=CC=NC=C1 JUJWROOIHBZHMG-UHFFFAOYSA-N 0.000 claims description 5
- 239000003112 inhibitor Substances 0.000 claims description 5
- 230000009061 membrane transport Effects 0.000 claims description 5
- 230000030648 nucleus localization Effects 0.000 claims description 5
- 206010005003 Bladder cancer Diseases 0.000 claims description 4
- 208000003174 Brain Neoplasms Diseases 0.000 claims description 4
- 108090000397 Caspase 3 Proteins 0.000 claims description 4
- 101150074164 PMAIP1 gene Proteins 0.000 claims description 4
- 206010060862 Prostate cancer Diseases 0.000 claims description 4
- 208000000236 Prostatic Neoplasms Diseases 0.000 claims description 4
- 241000589516 Pseudomonas Species 0.000 claims description 4
- KAESVJOAVNADME-UHFFFAOYSA-N Pyrrole Chemical compound C=1C=CNC=1 KAESVJOAVNADME-UHFFFAOYSA-N 0.000 claims description 4
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 claims description 4
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 claims description 4
- 102000014400 SH2 domains Human genes 0.000 claims description 4
- 108050003452 SH2 domains Proteins 0.000 claims description 4
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 claims description 4
- 239000004480 active ingredient Substances 0.000 claims description 4
- 230000005775 apoptotic pathway Effects 0.000 claims description 4
- 108010007734 bcl-Associated Death Protein Proteins 0.000 claims description 4
- 102000007348 bcl-Associated Death Protein Human genes 0.000 claims description 4
- 201000005112 urinary bladder cancer Diseases 0.000 claims description 4
- GUIBZZYABLMRRD-CQSZACIVSA-N (2r)-4,8-dimethoxy-9-methyl-2-propan-2-yl-2,3-dihydrofuro[2,3-b]quinolin-9-ium Chemical compound C[N+]1=C2C(OC)=CC=CC2=C(OC)C2=C1O[C@@H](C(C)C)C2 GUIBZZYABLMRRD-CQSZACIVSA-N 0.000 claims description 3
- 101500000018 Glycine max 2S albumin small chain Proteins 0.000 claims description 3
- 208000008839 Kidney Neoplasms Diseases 0.000 claims description 3
- 206010038389 Renal cancer Diseases 0.000 claims description 3
- 108010017324 STAT3 Transcription Factor Proteins 0.000 claims description 3
- 102000004495 STAT3 Transcription Factor Human genes 0.000 claims description 3
- 239000003937 drug carrier Substances 0.000 claims description 3
- 201000010982 kidney cancer Diseases 0.000 claims description 3
- 230000000861 pro-apoptotic effect Effects 0.000 claims description 3
- 101000727462 Homo sapiens Reticulon-3 Proteins 0.000 claims description 2
- 102000056932 human RTN3 Human genes 0.000 claims description 2
- HIIJOGIBQXHFKE-HHKYUTTNSA-N Ala-Thr-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O HIIJOGIBQXHFKE-HHKYUTTNSA-N 0.000 claims 1
- 102000003952 Caspase 3 Human genes 0.000 claims 1
- 108010039491 Ricin Proteins 0.000 claims 1
- 239000012636 effector Substances 0.000 abstract description 211
- 206010028980 Neoplasm Diseases 0.000 abstract description 60
- 201000011510 cancer Diseases 0.000 abstract description 31
- 230000030833 cell death Effects 0.000 abstract description 21
- 230000000259 anti-tumor effect Effects 0.000 abstract description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 5
- 238000004519 manufacturing process Methods 0.000 abstract description 2
- 239000002773 nucleotide Substances 0.000 abstract description 2
- 125000003729 nucleotide group Chemical group 0.000 abstract description 2
- 235000018102 proteins Nutrition 0.000 description 217
- 108091026890 Coding region Proteins 0.000 description 171
- 102000046283 TNF-Related Apoptosis-Inducing Ligand Human genes 0.000 description 155
- 108700012411 TNFSF10 Proteins 0.000 description 155
- 125000003275 alpha amino acid group Chemical group 0.000 description 144
- 101100369992 Homo sapiens TNFSF10 gene Proteins 0.000 description 141
- 230000002018 overexpression Effects 0.000 description 117
- 235000001014 amino acid Nutrition 0.000 description 67
- 239000013612 plasmid Substances 0.000 description 63
- 108020004414 DNA Proteins 0.000 description 59
- 108020004705 Codon Proteins 0.000 description 57
- 238000001962 electrophoresis Methods 0.000 description 56
- 230000000694 effects Effects 0.000 description 37
- 102000004196 processed proteins & peptides Human genes 0.000 description 35
- 108091028043 Nucleic acid sequence Proteins 0.000 description 31
- 239000000203 mixture Substances 0.000 description 30
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 25
- 241000282414 Homo sapiens Species 0.000 description 25
- 230000027455 binding Effects 0.000 description 25
- 108010062166 Lys-Asn-Asp Proteins 0.000 description 24
- 108010028188 glycyl-histidyl-serine Proteins 0.000 description 24
- 108010084525 phenylalanyl-phenylalanyl-glycine Proteins 0.000 description 23
- ZXEUFAVXODIPHC-GUBZILKMSA-N Lys-Glu-Asn Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ZXEUFAVXODIPHC-GUBZILKMSA-N 0.000 description 22
- 241000699670 Mus sp. Species 0.000 description 22
- 108010072637 phenylalanyl-arginyl-phenylalanine Proteins 0.000 description 22
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 21
- 108010005233 alanylglutamic acid Proteins 0.000 description 21
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 21
- TWLMXDWFVNEFFK-FJXKBIBVSA-N Thr-Arg-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O TWLMXDWFVNEFFK-FJXKBIBVSA-N 0.000 description 20
- AMIQZQAAYGYKOP-FXQIFTODSA-N Arg-Ser-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O AMIQZQAAYGYKOP-FXQIFTODSA-N 0.000 description 19
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 19
- XMPXVJIDADUOQB-RCOVLWMOSA-N Gly-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C([O-])=O)NC(=O)CNC(=O)C[NH3+] XMPXVJIDADUOQB-RCOVLWMOSA-N 0.000 description 19
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 19
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 19
- KNYHAWKHFQRYOX-PYJNHQTQSA-N Val-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](C(C)C)N KNYHAWKHFQRYOX-PYJNHQTQSA-N 0.000 description 19
- 230000004913 activation Effects 0.000 description 19
- 239000000872 buffer Substances 0.000 description 19
- MYCSPQIARXTUTP-SRVKXCTJSA-N Asn-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N MYCSPQIARXTUTP-SRVKXCTJSA-N 0.000 description 18
- LPCKHUXOGVNZRS-YUMQZZPRSA-N Gly-His-Ser Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O LPCKHUXOGVNZRS-YUMQZZPRSA-N 0.000 description 18
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 18
- 101000721661 Homo sapiens Cellular tumor antigen p53 Proteins 0.000 description 18
- KIQUCMUULDXTAZ-HJOGWXRNSA-N Phe-Tyr-Tyr Chemical compound N[C@@H](Cc1ccccc1)C(=O)N[C@@H](Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1ccc(O)cc1)C(O)=O KIQUCMUULDXTAZ-HJOGWXRNSA-N 0.000 description 18
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 18
- 108010078144 glutaminyl-glycine Proteins 0.000 description 18
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 description 17
- IVGJYOOGJLFKQE-AVGNSLFASA-N Glu-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N IVGJYOOGJLFKQE-AVGNSLFASA-N 0.000 description 17
- HBJZFCIVFIBNSV-DCAQKATOSA-N Leu-Arg-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O HBJZFCIVFIBNSV-DCAQKATOSA-N 0.000 description 17
- KOSWSHVQIVTVQF-ZPFDUUQYSA-N Leu-Ile-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KOSWSHVQIVTVQF-ZPFDUUQYSA-N 0.000 description 17
- BYPMOIFBQPEWOH-CIUDSAMLSA-N Lys-Asn-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N BYPMOIFBQPEWOH-CIUDSAMLSA-N 0.000 description 17
- HKCCVDWHHTVVPN-CIUDSAMLSA-N Lys-Asp-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O HKCCVDWHHTVVPN-CIUDSAMLSA-N 0.000 description 17
- YFNOUBWUIIJQHF-LPEHRKFASA-N Pro-Asp-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O YFNOUBWUIIJQHF-LPEHRKFASA-N 0.000 description 17
- SDFUZKIAHWRUCS-QEJZJMRPSA-N Ser-Trp-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N SDFUZKIAHWRUCS-QEJZJMRPSA-N 0.000 description 17
- IEWKKXZRJLTIOV-AVGNSLFASA-N Tyr-Ser-Gln Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O IEWKKXZRJLTIOV-AVGNSLFASA-N 0.000 description 17
- 230000005764 inhibitory process Effects 0.000 description 17
- 230000037361 pathway Effects 0.000 description 17
- 238000002360 preparation method Methods 0.000 description 17
- UGXYFDQFLVCDFC-CIUDSAMLSA-N Asn-Ser-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O UGXYFDQFLVCDFC-CIUDSAMLSA-N 0.000 description 16
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 16
- HAGKYCXGTRUUFI-RYUDHWBXSA-N Glu-Tyr-Gly Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCC(=O)O)N)O HAGKYCXGTRUUFI-RYUDHWBXSA-N 0.000 description 16
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 16
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 16
- CKSBRMUOQDNPKZ-SRVKXCTJSA-N Lys-Gln-Met Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O CKSBRMUOQDNPKZ-SRVKXCTJSA-N 0.000 description 16
- DRINJBAHUGXNFC-DCAQKATOSA-N Met-Asp-His Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O DRINJBAHUGXNFC-DCAQKATOSA-N 0.000 description 16
- CGUYGMFQZCYJSG-DCAQKATOSA-N Met-Lys-Ser Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O CGUYGMFQZCYJSG-DCAQKATOSA-N 0.000 description 16
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 16
- QGXCWPNQVCYJEL-NUMRIWBASA-N Thr-Asn-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QGXCWPNQVCYJEL-NUMRIWBASA-N 0.000 description 16
- XVHAUVJXBFGUPC-RPTUDFQQSA-N Thr-Tyr-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XVHAUVJXBFGUPC-RPTUDFQQSA-N 0.000 description 16
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 16
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 16
- 239000002609 medium Substances 0.000 description 16
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 15
- OFIYLHVAAJYRBC-HJWJTTGWSA-N Arg-Ile-Phe Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)CCCNC(N)=N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O OFIYLHVAAJYRBC-HJWJTTGWSA-N 0.000 description 15
- BNYNOWJESJJIOI-XUXIUFHCSA-N Arg-Lys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N BNYNOWJESJJIOI-XUXIUFHCSA-N 0.000 description 15
- VEAIMHJZTIDCIH-KKUMJFAQSA-N Arg-Phe-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O VEAIMHJZTIDCIH-KKUMJFAQSA-N 0.000 description 15
- OLGCWMNDJTWQAG-GUBZILKMSA-N Asn-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(N)=O OLGCWMNDJTWQAG-GUBZILKMSA-N 0.000 description 15
- MXOODARRORARSU-ACZMJKKPSA-N Glu-Ala-Ser Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCC(=O)O)N MXOODARRORARSU-ACZMJKKPSA-N 0.000 description 15
- VUBIPAHVHMZHCM-KKUMJFAQSA-N Leu-Tyr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 VUBIPAHVHMZHCM-KKUMJFAQSA-N 0.000 description 15
- GRRAECZXRONTEE-UBHSHLNASA-N Ser-Cys-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GRRAECZXRONTEE-UBHSHLNASA-N 0.000 description 15
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 15
- AAOPYWQQBXHINJ-DZKIICNBSA-N Val-Gln-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N AAOPYWQQBXHINJ-DZKIICNBSA-N 0.000 description 15
- RTJPAGFXOWEBAI-SRVKXCTJSA-N Val-Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RTJPAGFXOWEBAI-SRVKXCTJSA-N 0.000 description 15
- 238000002474 experimental method Methods 0.000 description 15
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 14
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 14
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 14
- GNXGAVNTVNOCLL-SIUGBPQLSA-N Ile-Tyr-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N GNXGAVNTVNOCLL-SIUGBPQLSA-N 0.000 description 14
- ZUWSVOYKBCHLRR-MGHWNKPDSA-N Ile-Tyr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZUWSVOYKBCHLRR-MGHWNKPDSA-N 0.000 description 14
- IWZRODDWOSIXPZ-IRXDYDNUSA-N Phe-Phe-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)NCC(O)=O)C1=CC=CC=C1 IWZRODDWOSIXPZ-IRXDYDNUSA-N 0.000 description 14
- CVUDMNSZAIZFAE-UHFFFAOYSA-N Val-Arg-Pro Natural products NC(N)=NCCCC(NC(=O)C(N)C(C)C)C(=O)N1CCCC1C(O)=O CVUDMNSZAIZFAE-UHFFFAOYSA-N 0.000 description 14
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 14
- 101100342977 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) leu-1 gene Proteins 0.000 description 13
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 13
- 230000015556 catabolic process Effects 0.000 description 13
- 238000006731 degradation reaction Methods 0.000 description 13
- 108010025306 histidylleucine Proteins 0.000 description 13
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 13
- 108010077051 polycysteine Proteins 0.000 description 13
- 102000005962 receptors Human genes 0.000 description 13
- 108020003175 receptors Proteins 0.000 description 13
- 102000011727 Caspases Human genes 0.000 description 12
- 108010076667 Caspases Proteins 0.000 description 12
- 241001198387 Escherichia coli BL21(DE3) Species 0.000 description 12
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 11
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical class NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 11
- 101000971171 Homo sapiens Apoptosis regulator Bcl-2 Proteins 0.000 description 11
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 11
- 239000002246 antineoplastic agent Substances 0.000 description 11
- 238000009472 formulation Methods 0.000 description 11
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Chemical compound NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 11
- 108010050848 glycylleucine Proteins 0.000 description 11
- 230000003993 interaction Effects 0.000 description 11
- 239000003446 ligand Substances 0.000 description 11
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 11
- 239000013638 trimer Substances 0.000 description 11
- 102100021569 Apoptosis regulator Bcl-2 Human genes 0.000 description 10
- 241000699666 Mus <mouse, genus> Species 0.000 description 10
- 230000037396 body weight Effects 0.000 description 10
- 230000001472 cytotoxic effect Effects 0.000 description 10
- 108010009298 lysylglutamic acid Proteins 0.000 description 10
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 9
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 9
- 101000611183 Homo sapiens Tumor necrosis factor Proteins 0.000 description 9
- 102000013535 Proto-Oncogene Proteins c-bcl-2 Human genes 0.000 description 9
- 108010090931 Proto-Oncogene Proteins c-bcl-2 Proteins 0.000 description 9
- 239000012091 fetal bovine serum Substances 0.000 description 9
- 239000011780 sodium chloride Substances 0.000 description 9
- 238000012360 testing method Methods 0.000 description 9
- 230000004614 tumor growth Effects 0.000 description 9
- HKZAAJSTFUZYTO-LURJTMIESA-N (2s)-2-[[2-[[2-[[2-[(2-aminoacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]-3-hydroxypropanoic acid Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O HKZAAJSTFUZYTO-LURJTMIESA-N 0.000 description 8
- 101710101225 Diablo IAP-binding mitochondrial protein Proteins 0.000 description 8
- 239000012981 Hank's balanced salt solution Substances 0.000 description 8
- 241000880493 Leptailurus serval Species 0.000 description 8
- 108090000190 Thrombin Proteins 0.000 description 8
- 102100040247 Tumor necrosis factor Human genes 0.000 description 8
- YMUQBRQQCPQEQN-CXTHYWKRSA-N Tyr-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N YMUQBRQQCPQEQN-CXTHYWKRSA-N 0.000 description 8
- 108010068380 arginylarginine Proteins 0.000 description 8
- 230000008859 change Effects 0.000 description 8
- 230000002401 inhibitory effect Effects 0.000 description 8
- 230000003834 intracellular effect Effects 0.000 description 8
- 230000006667 mitochondrial pathway Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 239000006228 supernatant Substances 0.000 description 8
- QVVDVENEPNODSI-BTNSXGMBSA-N (2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-amino-5-(diaminomethylideneamino)pentanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-5-(diaminomethylidene Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QVVDVENEPNODSI-BTNSXGMBSA-N 0.000 description 7
- CSCPPACGZOOCGX-UHFFFAOYSA-N Acetone Chemical compound CC(C)=O CSCPPACGZOOCGX-UHFFFAOYSA-N 0.000 description 7
- 102000051485 Bcl-2 family Human genes 0.000 description 7
- 108700038897 Bcl-2 family Proteins 0.000 description 7
- 102000004190 Enzymes Human genes 0.000 description 7
- 108090000790 Enzymes Proteins 0.000 description 7
- XTZDZAXYPDISRR-MNXVOIDGSA-N Glu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XTZDZAXYPDISRR-MNXVOIDGSA-N 0.000 description 7
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 7
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 7
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 7
- 108010062796 arginyllysine Proteins 0.000 description 7
- 229940088598 enzyme Drugs 0.000 description 7
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 7
- 210000003470 mitochondria Anatomy 0.000 description 7
- 108010026333 seryl-proline Proteins 0.000 description 7
- 229960004072 thrombin Drugs 0.000 description 7
- AOJJSUZBOXZQNB-TZSSRYMLSA-N Doxorubicin Chemical compound O([C@H]1C[C@@](O)(CC=2C(O)=C3C(=O)C=4C=CC=C(C=4C(=O)C3=C(O)C=21)OC)C(=O)CO)[C@H]1C[C@H](N)[C@H](O)[C@H](C)O1 AOJJSUZBOXZQNB-TZSSRYMLSA-N 0.000 description 6
- ZGKVPOSSTGHJAF-HJPIBITLSA-N Ile-Tyr-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CO)C(=O)O)N ZGKVPOSSTGHJAF-HJPIBITLSA-N 0.000 description 6
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 6
- IBSGMIPRBMPMHE-IHRRRGAJSA-N Leu-Met-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O IBSGMIPRBMPMHE-IHRRRGAJSA-N 0.000 description 6
- PBLLTSKBTAHDNA-KBPBESRZSA-N Lys-Gly-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PBLLTSKBTAHDNA-KBPBESRZSA-N 0.000 description 6
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 6
- FIXILCYTSAUERA-FXQIFTODSA-N Ser-Ala-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FIXILCYTSAUERA-FXQIFTODSA-N 0.000 description 6
- 108010087924 alanylproline Proteins 0.000 description 6
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 6
- 230000001640 apoptogenic effect Effects 0.000 description 6
- 230000001066 destructive effect Effects 0.000 description 6
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 6
- 108010034529 leucyl-lysine Proteins 0.000 description 6
- 238000000746 purification Methods 0.000 description 6
- 239000011347 resin Substances 0.000 description 6
- 229920005989 resin Polymers 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 239000000126 substance Substances 0.000 description 6
- WGDNWOMKBUXFHR-BQBZGAKWSA-N Ala-Gly-Arg Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N WGDNWOMKBUXFHR-BQBZGAKWSA-N 0.000 description 5
- KYQJHBWHRASMKG-ZLUOBGJFSA-N Asn-Ser-Cys Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(O)=O KYQJHBWHRASMKG-ZLUOBGJFSA-N 0.000 description 5
- HMQDRBKQMLRCCG-GMOBBJLQSA-N Asp-Arg-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HMQDRBKQMLRCCG-GMOBBJLQSA-N 0.000 description 5
- QNIACYURSSCLRP-GUBZILKMSA-N Asp-Lys-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O QNIACYURSSCLRP-GUBZILKMSA-N 0.000 description 5
- XKPACHRGOWQHFH-IRIUXVKKSA-N Gln-Thr-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XKPACHRGOWQHFH-IRIUXVKKSA-N 0.000 description 5
- OQXDUSZKISQQSS-GUBZILKMSA-N Glu-Lys-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O OQXDUSZKISQQSS-GUBZILKMSA-N 0.000 description 5
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 5
- 101000871228 Homo sapiens Diablo IAP-binding mitochondrial protein Proteins 0.000 description 5
- HDODQNPMSHDXJT-GHCJXIJMSA-N Ile-Asn-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O HDODQNPMSHDXJT-GHCJXIJMSA-N 0.000 description 5
- YKLOMBNBQUTJDT-HVTMNAMFSA-N Ile-His-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N YKLOMBNBQUTJDT-HVTMNAMFSA-N 0.000 description 5
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 5
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 5
- CNFMPVYIVQUJOO-NHCYSSNCSA-N Met-Val-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O CNFMPVYIVQUJOO-NHCYSSNCSA-N 0.000 description 5
- UNLYPPYNDXHGDG-IHRRRGAJSA-N Phe-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 UNLYPPYNDXHGDG-IHRRRGAJSA-N 0.000 description 5
- JJHVFCUWLSKADD-ONGXEEELSA-N Phe-Gly-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)NCC(=O)N[C@@H](C)C(O)=O JJHVFCUWLSKADD-ONGXEEELSA-N 0.000 description 5
- IEIFEYBAYFSRBQ-IHRRRGAJSA-N Phe-Val-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N IEIFEYBAYFSRBQ-IHRRRGAJSA-N 0.000 description 5
- 108010076504 Protein Sorting Signals Proteins 0.000 description 5
- 239000012980 RPMI-1640 medium Substances 0.000 description 5
- MQQBBLVOUUJKLH-HJPIBITLSA-N Ser-Ile-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MQQBBLVOUUJKLH-HJPIBITLSA-N 0.000 description 5
- RRVFEDGUXSYWOW-BZSNNMDCSA-N Ser-Phe-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RRVFEDGUXSYWOW-BZSNNMDCSA-N 0.000 description 5
- SIEBDTCABMZCLF-XGEHTFHBSA-N Ser-Val-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SIEBDTCABMZCLF-XGEHTFHBSA-N 0.000 description 5
- 108010000449 TNF-Related Apoptosis-Inducing Ligand Receptors Proteins 0.000 description 5
- 102000002259 TNF-Related Apoptosis-Inducing Ligand Receptors Human genes 0.000 description 5
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 5
- 108010079351 Tumor Suppressor Protein p14ARF Proteins 0.000 description 5
- RYSNTWVRSLCAJZ-RYUDHWBXSA-N Tyr-Gln-Gly Chemical compound OC(=O)CNC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 RYSNTWVRSLCAJZ-RYUDHWBXSA-N 0.000 description 5
- CNNVVEPJTFOGHI-ACRUOGEOSA-N Tyr-Lys-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CNNVVEPJTFOGHI-ACRUOGEOSA-N 0.000 description 5
- 108010069020 alanyl-prolyl-glycine Proteins 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 230000002424 anti-apoptotic effect Effects 0.000 description 5
- 108010093581 aspartyl-proline Proteins 0.000 description 5
- 230000001580 bacterial effect Effects 0.000 description 5
- 108700000711 bcl-X Proteins 0.000 description 5
- 102000055104 bcl-X Human genes 0.000 description 5
- 239000003795 chemical substances by application Substances 0.000 description 5
- 238000002983 circular dichroism Methods 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 5
- 239000003085 diluting agent Substances 0.000 description 5
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 5
- 125000003630 glycyl group Chemical group [H]N([H])C([H])([H])C(*)=O 0.000 description 5
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 5
- 230000000977 initiatory effect Effects 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 102000039446 nucleic acids Human genes 0.000 description 5
- 108020004707 nucleic acids Proteins 0.000 description 5
- 150000007523 nucleic acids Chemical class 0.000 description 5
- YBYRMVIVWMBXKQ-UHFFFAOYSA-N phenylmethanesulfonyl fluoride Chemical compound FS(=O)(=O)CC1=CC=CC=C1 YBYRMVIVWMBXKQ-UHFFFAOYSA-N 0.000 description 5
- 230000003389 potentiating effect Effects 0.000 description 5
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 230000004083 survival effect Effects 0.000 description 5
- 231100000057 systemic toxicity Toxicity 0.000 description 5
- 108010061238 threonyl-glycine Proteins 0.000 description 5
- 238000013518 transcription Methods 0.000 description 5
- 230000035897 transcription Effects 0.000 description 5
- 238000002054 transplantation Methods 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 5
- ROLXPVQSRCPVGK-XDTLVQLUSA-N Ala-Glu-Tyr Chemical compound N[C@@H](C)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O ROLXPVQSRCPVGK-XDTLVQLUSA-N 0.000 description 4
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 4
- PEEYDECOOVQKRZ-DLOVCJGASA-N Ala-Ser-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PEEYDECOOVQKRZ-DLOVCJGASA-N 0.000 description 4
- 102000010565 Apoptosis Regulatory Proteins Human genes 0.000 description 4
- 108010063104 Apoptosis Regulatory Proteins Proteins 0.000 description 4
- NONSEUUPKITYQT-BQBZGAKWSA-N Arg-Asn-Gly Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)NCC(=O)O)N)CN=C(N)N NONSEUUPKITYQT-BQBZGAKWSA-N 0.000 description 4
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 4
- BTJVOUQWFXABOI-IHRRRGAJSA-N Arg-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCNC(N)=N BTJVOUQWFXABOI-IHRRRGAJSA-N 0.000 description 4
- OGMDXNFGPOPZTK-GUBZILKMSA-N Asn-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N OGMDXNFGPOPZTK-GUBZILKMSA-N 0.000 description 4
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 4
- JBDLMLZNDRLDIX-HJGDQZAQSA-N Asn-Thr-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O JBDLMLZNDRLDIX-HJGDQZAQSA-N 0.000 description 4
- PUUPMDXIHCOPJU-HJGDQZAQSA-N Asn-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O PUUPMDXIHCOPJU-HJGDQZAQSA-N 0.000 description 4
- WWOYXVBGHAHQBG-FXQIFTODSA-N Asp-Met-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O WWOYXVBGHAHQBG-FXQIFTODSA-N 0.000 description 4
- 102000004039 Caspase-9 Human genes 0.000 description 4
- 108090000566 Caspase-9 Proteins 0.000 description 4
- SPJRFUJMDJGDRO-UBHSHLNASA-N Cys-Trp-Ser Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CS)N)C(=O)N[C@@H](CO)C(O)=O)=CNC2=C1 SPJRFUJMDJGDRO-UBHSHLNASA-N 0.000 description 4
- 102100030497 Cytochrome c Human genes 0.000 description 4
- 108010075031 Cytochromes c Proteins 0.000 description 4
- 102000004127 Cytokines Human genes 0.000 description 4
- 108090000695 Cytokines Proteins 0.000 description 4
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 4
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 4
- AKDOUBMVLRCHBD-SIUGBPQLSA-N Gln-Tyr-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AKDOUBMVLRCHBD-SIUGBPQLSA-N 0.000 description 4
- VAZZOGXDUQSVQF-NUMRIWBASA-N Glu-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)O VAZZOGXDUQSVQF-NUMRIWBASA-N 0.000 description 4
- DVLZZEPUNFEUBW-AVGNSLFASA-N Glu-His-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)O)N DVLZZEPUNFEUBW-AVGNSLFASA-N 0.000 description 4
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 4
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 4
- MZZSCEANQDPJER-ONGXEEELSA-N Gly-Ala-Phe Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MZZSCEANQDPJER-ONGXEEELSA-N 0.000 description 4
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 4
- FCKPEGOCSVZPNC-WHOFXGATSA-N Gly-Ile-Phe Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 FCKPEGOCSVZPNC-WHOFXGATSA-N 0.000 description 4
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 4
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 4
- HIAHVKLTHNOENC-HGNGGELXSA-N His-Glu-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HIAHVKLTHNOENC-HGNGGELXSA-N 0.000 description 4
- SKYULSWNBYAQMG-IHRRRGAJSA-N His-Leu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SKYULSWNBYAQMG-IHRRRGAJSA-N 0.000 description 4
- XQLGNKLSPYCRMZ-HJWJTTGWSA-N Ile-Phe-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(=O)O)N XQLGNKLSPYCRMZ-HJWJTTGWSA-N 0.000 description 4
- CSFVADKICPDRRF-KKUMJFAQSA-N Leu-His-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CN=CN1 CSFVADKICPDRRF-KKUMJFAQSA-N 0.000 description 4
- QYOXSYXPHUHOJR-GUBZILKMSA-N Lys-Asn-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYOXSYXPHUHOJR-GUBZILKMSA-N 0.000 description 4
- KYNNSEJZFVCDIV-ZPFDUUQYSA-N Lys-Ile-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O KYNNSEJZFVCDIV-ZPFDUUQYSA-N 0.000 description 4
- PPNCMJARTHYNEC-MEYUZBJRSA-N Lys-Tyr-Thr Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@H](O)C)C(O)=O)CC1=CC=C(O)C=C1 PPNCMJARTHYNEC-MEYUZBJRSA-N 0.000 description 4
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 4
- GNUCSNWOCQFMMC-UFYCRDLUSA-N Phe-Arg-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 GNUCSNWOCQFMMC-UFYCRDLUSA-N 0.000 description 4
- INHMISZWLJZQGH-ULQDDVLXSA-N Phe-Leu-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 INHMISZWLJZQGH-ULQDDVLXSA-N 0.000 description 4
- FUVBEZJCRMHWEM-FXQIFTODSA-N Pro-Asn-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O FUVBEZJCRMHWEM-FXQIFTODSA-N 0.000 description 4
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 4
- 102000006382 Ribonucleases Human genes 0.000 description 4
- 108010083644 Ribonucleases Proteins 0.000 description 4
- FIDMVVBUOCMMJG-CIUDSAMLSA-N Ser-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CO FIDMVVBUOCMMJG-CIUDSAMLSA-N 0.000 description 4
- HDBOEVPDIDDEPC-CIUDSAMLSA-N Ser-Lys-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O HDBOEVPDIDDEPC-CIUDSAMLSA-N 0.000 description 4
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 4
- JLKWJWPDXPKKHI-FXQIFTODSA-N Ser-Pro-Asn Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CC(=O)N)C(=O)O JLKWJWPDXPKKHI-FXQIFTODSA-N 0.000 description 4
- KIEIJCFVGZCUAS-MELADBBJSA-N Ser-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N)C(=O)O KIEIJCFVGZCUAS-MELADBBJSA-N 0.000 description 4
- -1 SmacDiablo Proteins 0.000 description 4
- BDGBHYCAZJPLHX-HJGDQZAQSA-N Thr-Lys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BDGBHYCAZJPLHX-HJGDQZAQSA-N 0.000 description 4
- HUPLKEHTTQBXSC-YJRXYDGGSA-N Thr-Ser-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HUPLKEHTTQBXSC-YJRXYDGGSA-N 0.000 description 4
- UDCHKDYNMRJYMI-QEJZJMRPSA-N Trp-Glu-Ser Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UDCHKDYNMRJYMI-QEJZJMRPSA-N 0.000 description 4
- WSMVEHPVOYXPAQ-XIRDDKMYSA-N Trp-Ser-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N WSMVEHPVOYXPAQ-XIRDDKMYSA-N 0.000 description 4
- 108090000631 Trypsin Proteins 0.000 description 4
- 102000004142 Trypsin Human genes 0.000 description 4
- IGXLNVIYDYONFB-UFYCRDLUSA-N Tyr-Phe-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=C(O)C=C1 IGXLNVIYDYONFB-UFYCRDLUSA-N 0.000 description 4
- QPOUERMDWKKZEG-HJPIBITLSA-N Tyr-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QPOUERMDWKKZEG-HJPIBITLSA-N 0.000 description 4
- KRXFXDCNKLANCP-CXTHYWKRSA-N Tyr-Tyr-Ile Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 KRXFXDCNKLANCP-CXTHYWKRSA-N 0.000 description 4
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 4
- PQSNETRGCRUOGP-KKHAAJSZSA-N Val-Thr-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O PQSNETRGCRUOGP-KKHAAJSZSA-N 0.000 description 4
- 230000009471 action Effects 0.000 description 4
- 108010008355 arginyl-glutamine Proteins 0.000 description 4
- 108010047857 aspartylglycine Proteins 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 229910002091 carbon monoxide Inorganic materials 0.000 description 4
- 230000000052 comparative effect Effects 0.000 description 4
- 230000006378 damage Effects 0.000 description 4
- 230000001747 exhibiting effect Effects 0.000 description 4
- 208000021045 exocrine pancreatic carcinoma Diseases 0.000 description 4
- 239000012634 fragment Substances 0.000 description 4
- 108010049041 glutamylalanine Proteins 0.000 description 4
- 239000003102 growth factor Substances 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 230000006698 induction Effects 0.000 description 4
- 238000002347 injection Methods 0.000 description 4
- 239000007924 injection Substances 0.000 description 4
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 4
- 229930027917 kanamycin Natural products 0.000 description 4
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 4
- 229960000318 kanamycin Drugs 0.000 description 4
- 229930182823 kanamycin A Natural products 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 108010005942 methionylglycine Proteins 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000010647 peptide synthesis reaction Methods 0.000 description 4
- 108010012581 phenylalanylglutamate Proteins 0.000 description 4
- 229920001223 polyethylene glycol Polymers 0.000 description 4
- 210000000278 spinal cord Anatomy 0.000 description 4
- 239000012588 trypsin Substances 0.000 description 4
- 230000004565 tumor cell growth Effects 0.000 description 4
- 108010020532 tyrosyl-proline Proteins 0.000 description 4
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 4
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 3
- QKSAZKCRVQYYGS-UWVGGRQHSA-N Arg-Gly-His Chemical compound N[C@@H](CCCN=C(N)N)C(=O)NCC(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O QKSAZKCRVQYYGS-UWVGGRQHSA-N 0.000 description 3
- JOADBFCFJGNIKF-GUBZILKMSA-N Arg-Met-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C)C(O)=O JOADBFCFJGNIKF-GUBZILKMSA-N 0.000 description 3
- PDQBXRSOSCTGKY-ACZMJKKPSA-N Asn-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N PDQBXRSOSCTGKY-ACZMJKKPSA-N 0.000 description 3
- QISZHYWZHJRDAO-CIUDSAMLSA-N Asn-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N QISZHYWZHJRDAO-CIUDSAMLSA-N 0.000 description 3
- XHTUGJCAEYOZOR-UBHSHLNASA-N Asn-Ser-Trp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O XHTUGJCAEYOZOR-UBHSHLNASA-N 0.000 description 3
- XEDQMTWEYFBOIK-ACZMJKKPSA-N Asp-Ala-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XEDQMTWEYFBOIK-ACZMJKKPSA-N 0.000 description 3
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 3
- CRNKLABLTICXDV-GUBZILKMSA-N Asp-His-Glu Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N CRNKLABLTICXDV-GUBZILKMSA-N 0.000 description 3
- MVRGBQGZSDJBSM-GMOBBJLQSA-N Asp-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)O)N MVRGBQGZSDJBSM-GMOBBJLQSA-N 0.000 description 3
- 102100029855 Caspase-3 Human genes 0.000 description 3
- 102100024458 Cyclin-dependent kinase inhibitor 2A Human genes 0.000 description 3
- 108010049207 Death Domain Receptors Proteins 0.000 description 3
- 102000009058 Death Domain Receptors Human genes 0.000 description 3
- 101710156605 Diablo homolog, mitochondrial Proteins 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- HWEINOMSWQSJDC-SRVKXCTJSA-N Gln-Leu-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HWEINOMSWQSJDC-SRVKXCTJSA-N 0.000 description 3
- IFZWDJWERARYFC-WNHJNPCNSA-N Glu-Glu-Gln-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)N)C(O)=O)=CNC2=C1 IFZWDJWERARYFC-WNHJNPCNSA-N 0.000 description 3
- NNQDRRUXFJYCCJ-NHCYSSNCSA-N Glu-Pro-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O NNQDRRUXFJYCCJ-NHCYSSNCSA-N 0.000 description 3
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 3
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 3
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 3
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 3
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 3
- WCORRBXVISTKQL-WHFBIAKZSA-N Gly-Ser-Ser Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WCORRBXVISTKQL-WHFBIAKZSA-N 0.000 description 3
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 3
- 239000004471 Glycine Substances 0.000 description 3
- BXOLYFJYQQRQDJ-MXAVVETBSA-N His-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CN=CN1)N BXOLYFJYQQRQDJ-MXAVVETBSA-N 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- 101000610604 Homo sapiens Tumor necrosis factor receptor superfamily member 10B Proteins 0.000 description 3
- CCHSQWLCOOZREA-GMOBBJLQSA-N Ile-Asp-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCSC)C(=O)O)N CCHSQWLCOOZREA-GMOBBJLQSA-N 0.000 description 3
- NZOCIWKZUVUNDW-ZKWXMUAHSA-N Ile-Gly-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O NZOCIWKZUVUNDW-ZKWXMUAHSA-N 0.000 description 3
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 3
- ODKSFYDXXFIFQN-BYPYZUCNSA-N L-arginine Chemical compound OC(=O)[C@@H](N)CCCN=C(N)N ODKSFYDXXFIFQN-BYPYZUCNSA-N 0.000 description 3
- 206010023774 Large cell lung cancer Diseases 0.000 description 3
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 3
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 3
- HKXSZKJMDBHOTG-CIUDSAMLSA-N Lys-Ser-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN HKXSZKJMDBHOTG-CIUDSAMLSA-N 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 3
- 102000018697 Membrane Proteins Human genes 0.000 description 3
- 108010052285 Membrane Proteins Proteins 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 3
- 108700020796 Oncogene Proteins 0.000 description 3
- XALFIVXGQUEGKV-JSGCOSHPSA-N Phe-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XALFIVXGQUEGKV-JSGCOSHPSA-N 0.000 description 3
- DNIAPMSPPWPWGF-UHFFFAOYSA-N Propylene glycol Chemical compound CC(O)CO DNIAPMSPPWPWGF-UHFFFAOYSA-N 0.000 description 3
- 229920002684 Sepharose Polymers 0.000 description 3
- QVOGDCQNGLBNCR-FXQIFTODSA-N Ser-Arg-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O QVOGDCQNGLBNCR-FXQIFTODSA-N 0.000 description 3
- KJMOINFQVCCSDX-XKBZYTNZSA-N Ser-Gln-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KJMOINFQVCCSDX-XKBZYTNZSA-N 0.000 description 3
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 3
- KDGARKCAKHBEDB-NKWVEPMBSA-N Ser-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CO)N)C(=O)O KDGARKCAKHBEDB-NKWVEPMBSA-N 0.000 description 3
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 3
- PPNPDKGQRFSCAC-CIUDSAMLSA-N Ser-Lys-Asp Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPNPDKGQRFSCAC-CIUDSAMLSA-N 0.000 description 3
- 206010041067 Small cell lung cancer Diseases 0.000 description 3
- 102100040113 Tumor necrosis factor receptor superfamily member 10A Human genes 0.000 description 3
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 3
- XJPXTYLVMUZGNW-IHRRRGAJSA-N Tyr-Pro-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O XJPXTYLVMUZGNW-IHRRRGAJSA-N 0.000 description 3
- 238000001042 affinity chromatography Methods 0.000 description 3
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- 108010011559 alanylphenylalanine Proteins 0.000 description 3
- 125000000539 amino acid group Chemical group 0.000 description 3
- 239000003242 anti bacterial agent Substances 0.000 description 3
- 239000003963 antioxidant agent Substances 0.000 description 3
- 108010060035 arginylproline Proteins 0.000 description 3
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 3
- 230000033228 biological regulation Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 239000000969 carrier Substances 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 210000000172 cytosol Anatomy 0.000 description 3
- 230000003013 cytotoxicity Effects 0.000 description 3
- 231100000135 cytotoxicity Toxicity 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000000502 dialysis Methods 0.000 description 3
- 229960004679 doxorubicin Drugs 0.000 description 3
- 230000009462 endogenous apoptosis Effects 0.000 description 3
- 210000002919 epithelial cell Anatomy 0.000 description 3
- 239000008103 glucose Substances 0.000 description 3
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 3
- 201000005787 hematologic cancer Diseases 0.000 description 3
- 208000024200 hematopoietic and lymphoid system neoplasm Diseases 0.000 description 3
- 238000001727 in vivo Methods 0.000 description 3
- 239000000411 inducer Substances 0.000 description 3
- 230000006882 induction of apoptosis Effects 0.000 description 3
- 238000001802 infusion Methods 0.000 description 3
- 238000001155 isoelectric focusing Methods 0.000 description 3
- 201000009546 lung large cell carcinoma Diseases 0.000 description 3
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 3
- 108010054155 lysyllysine Proteins 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 230000010534 mechanism of action Effects 0.000 description 3
- 210000004940 nucleus Anatomy 0.000 description 3
- 238000007911 parenteral administration Methods 0.000 description 3
- 239000008188 pellet Substances 0.000 description 3
- 230000010287 polarization Effects 0.000 description 3
- 229920002704 polyhistidine Polymers 0.000 description 3
- 229920001184 polypeptide Polymers 0.000 description 3
- 230000001737 promoting effect Effects 0.000 description 3
- 108010061338 ranpirnase Proteins 0.000 description 3
- 230000001105 regulatory effect Effects 0.000 description 3
- 230000019491 signal transduction Effects 0.000 description 3
- 230000011664 signaling Effects 0.000 description 3
- 208000000587 small cell lung carcinoma Diseases 0.000 description 3
- 231100000331 toxic Toxicity 0.000 description 3
- 230000002588 toxic effect Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000014616 translation Effects 0.000 description 3
- 108010038745 tryptophylglycine Proteins 0.000 description 3
- 230000003612 virological effect Effects 0.000 description 3
- 230000004580 weight loss Effects 0.000 description 3
- WXPZDDCNKXMOMC-AVGNSLFASA-N (2s)-1-[(2s)-2-[[(2s)-1-(2-aminoacetyl)pyrrolidine-2-carbonyl]amino]-5-(diaminomethylideneamino)pentanoyl]pyrrolidine-2-carboxylic acid Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1[C@H](C(O)=O)CCC1 WXPZDDCNKXMOMC-AVGNSLFASA-N 0.000 description 2
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 2
- JBFQOLHAGBKPTP-NZATWWQASA-N (2s)-2-[[(2s)-4-carboxy-2-[[3-carboxy-2-[[(2s)-2,6-diaminohexanoyl]amino]propanoyl]amino]butanoyl]amino]-4-methylpentanoic acid Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)C(CC(O)=O)NC(=O)[C@@H](N)CCCCN JBFQOLHAGBKPTP-NZATWWQASA-N 0.000 description 2
- VEEGZPWAAPPXRB-BJMVGYQFSA-N (3e)-3-(1h-imidazol-5-ylmethylidene)-1h-indol-2-one Chemical compound O=C1NC2=CC=CC=C2\C1=C/C1=CN=CN1 VEEGZPWAAPPXRB-BJMVGYQFSA-N 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- AAQGRPOPTAUUBM-ZLUOBGJFSA-N Ala-Ala-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O AAQGRPOPTAUUBM-ZLUOBGJFSA-N 0.000 description 2
- YLTKNGYYPIWKHZ-ACZMJKKPSA-N Ala-Ala-Glu Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O YLTKNGYYPIWKHZ-ACZMJKKPSA-N 0.000 description 2
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 2
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 2
- HWPXGQCMZITGFN-XVYDVKMFSA-N Ala-Cys-His Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HWPXGQCMZITGFN-XVYDVKMFSA-N 0.000 description 2
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 2
- LTSBJNNXPBBNDT-HGNGGELXSA-N Ala-His-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)O LTSBJNNXPBBNDT-HGNGGELXSA-N 0.000 description 2
- OKIKVSXTXVVFDV-MMWGEVLESA-N Ala-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N OKIKVSXTXVVFDV-MMWGEVLESA-N 0.000 description 2
- RGQCNKIDEQJEBT-CQDKDKBSSA-N Ala-Leu-Tyr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 RGQCNKIDEQJEBT-CQDKDKBSSA-N 0.000 description 2
- FFZJHQODAYHGPO-KZVJFYERSA-N Ala-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N FFZJHQODAYHGPO-KZVJFYERSA-N 0.000 description 2
- BOKLLPVAQDSLHC-FXQIFTODSA-N Ala-Val-Cys Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(=O)O)N BOKLLPVAQDSLHC-FXQIFTODSA-N 0.000 description 2
- ZCUFMRIQCPNOHZ-NRPADANISA-N Ala-Val-Gln Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N ZCUFMRIQCPNOHZ-NRPADANISA-N 0.000 description 2
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 2
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 2
- 241000024188 Andala Species 0.000 description 2
- 102000007592 Apolipoproteins Human genes 0.000 description 2
- 108010071619 Apolipoproteins Proteins 0.000 description 2
- 108010089941 Apoptosomes Proteins 0.000 description 2
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 2
- GIVATXIGCXFQQA-FXQIFTODSA-N Arg-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N GIVATXIGCXFQQA-FXQIFTODSA-N 0.000 description 2
- ZEAYJGRKRUBDOB-GARJFASQSA-N Arg-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O ZEAYJGRKRUBDOB-GARJFASQSA-N 0.000 description 2
- UFBURHXMKFQVLM-CIUDSAMLSA-N Arg-Glu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O UFBURHXMKFQVLM-CIUDSAMLSA-N 0.000 description 2
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 2
- VRZDJJWOFXMFRO-ZFWWWQNUSA-N Arg-Gly-Trp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O VRZDJJWOFXMFRO-ZFWWWQNUSA-N 0.000 description 2
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 2
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 2
- WVCJSDCHTUTONA-FXQIFTODSA-N Asn-Asp-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WVCJSDCHTUTONA-FXQIFTODSA-N 0.000 description 2
- BHQQRVARKXWXPP-ACZMJKKPSA-N Asn-Asp-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BHQQRVARKXWXPP-ACZMJKKPSA-N 0.000 description 2
- XXAOXVBAWLMTDR-ZLUOBGJFSA-N Asn-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N XXAOXVBAWLMTDR-ZLUOBGJFSA-N 0.000 description 2
- AWXDRZJQCVHCIT-DCAQKATOSA-N Asn-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O AWXDRZJQCVHCIT-DCAQKATOSA-N 0.000 description 2
- CBWCQCANJSGUOH-ZKWXMUAHSA-N Asn-Val-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O CBWCQCANJSGUOH-ZKWXMUAHSA-N 0.000 description 2
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 2
- AYFVRYXNDHBECD-YUMQZZPRSA-N Asp-Leu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AYFVRYXNDHBECD-YUMQZZPRSA-N 0.000 description 2
- MGSVBZIBCCKGCY-ZLUOBGJFSA-N Asp-Ser-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O MGSVBZIBCCKGCY-ZLUOBGJFSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 108010007337 Azurin Proteins 0.000 description 2
- 102100035656 BCL2/adenovirus E1B 19 kDa protein-interacting protein 3 Human genes 0.000 description 2
- 101150013553 CD40 gene Proteins 0.000 description 2
- 102100026548 Caspase-8 Human genes 0.000 description 2
- 108090000538 Caspase-8 Proteins 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 2
- UXUSHQYYQCZWET-WDSKDSINSA-N Cys-Glu-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O UXUSHQYYQCZWET-WDSKDSINSA-N 0.000 description 2
- LBOLGUYQEPZSKM-YUMQZZPRSA-N Cys-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CS)N LBOLGUYQEPZSKM-YUMQZZPRSA-N 0.000 description 2
- XMVZMBGFIOQONW-GARJFASQSA-N Cys-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N)C(=O)O XMVZMBGFIOQONW-GARJFASQSA-N 0.000 description 2
- IRDBEBCCTCNXGZ-AVGNSLFASA-N Cys-Tyr-Gln Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CS)N)O IRDBEBCCTCNXGZ-AVGNSLFASA-N 0.000 description 2
- 102000013888 Eosinophil-Derived Neurotoxin Human genes 0.000 description 2
- 108010050456 Eosinophil-Derived Neurotoxin Proteins 0.000 description 2
- PRBLYKYHAJEABA-SRVKXCTJSA-N Gln-Arg-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O PRBLYKYHAJEABA-SRVKXCTJSA-N 0.000 description 2
- ALUBSZXSNSPDQV-WDSKDSINSA-N Gln-Cys-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O ALUBSZXSNSPDQV-WDSKDSINSA-N 0.000 description 2
- KCJJFESQRXGTGC-BQBZGAKWSA-N Gln-Glu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O KCJJFESQRXGTGC-BQBZGAKWSA-N 0.000 description 2
- GLAPJAHOPFSLKL-SRVKXCTJSA-N Gln-His-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCC(=O)N)N GLAPJAHOPFSLKL-SRVKXCTJSA-N 0.000 description 2
- RWCBJYUPAUTWJD-NHCYSSNCSA-N Gln-Met-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](C(C)C)C(O)=O RWCBJYUPAUTWJD-NHCYSSNCSA-N 0.000 description 2
- RLZBLVSJDFHDBL-KBIXCLLPSA-N Glu-Ala-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O RLZBLVSJDFHDBL-KBIXCLLPSA-N 0.000 description 2
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 2
- CJWANNXUTOATSJ-DCAQKATOSA-N Glu-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)O)N CJWANNXUTOATSJ-DCAQKATOSA-N 0.000 description 2
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 2
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 2
- LRPXYSGPOBVBEH-IUCAKERBSA-N Glu-Gly-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O LRPXYSGPOBVBEH-IUCAKERBSA-N 0.000 description 2
- CBOVGULVQSVMPT-CIUDSAMLSA-N Glu-Pro-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O CBOVGULVQSVMPT-CIUDSAMLSA-N 0.000 description 2
- HZISRJBYZAODRV-XQXXSGGOSA-N Glu-Thr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O HZISRJBYZAODRV-XQXXSGGOSA-N 0.000 description 2
- CQGBSALYGOXQPE-HTUGSXCWSA-N Glu-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O CQGBSALYGOXQPE-HTUGSXCWSA-N 0.000 description 2
- UUTGYDAKPISJAO-JYJNAYRXSA-N Glu-Tyr-Leu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 UUTGYDAKPISJAO-JYJNAYRXSA-N 0.000 description 2
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 2
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 2
- AAHSHTLISQUZJL-QSFUFRPTSA-N Gly-Ile-Ile Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AAHSHTLISQUZJL-QSFUFRPTSA-N 0.000 description 2
- TVUWMSBGMVAHSJ-KBPBESRZSA-N Gly-Leu-Phe Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TVUWMSBGMVAHSJ-KBPBESRZSA-N 0.000 description 2
- IUKIDFVOUHZRAK-QWRGUYRKSA-N Gly-Lys-His Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 IUKIDFVOUHZRAK-QWRGUYRKSA-N 0.000 description 2
- VEPBEGNDJYANCF-QWRGUYRKSA-N Gly-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN VEPBEGNDJYANCF-QWRGUYRKSA-N 0.000 description 2
- HJARVELKOSZUEW-YUMQZZPRSA-N Gly-Pro-Gln Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJARVELKOSZUEW-YUMQZZPRSA-N 0.000 description 2
- GLACUWHUYFBSPJ-FJXKBIBVSA-N Gly-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN GLACUWHUYFBSPJ-FJXKBIBVSA-N 0.000 description 2
- JQFILXICXLDTRR-FBCQKBJTSA-N Gly-Thr-Gly Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)NCC(O)=O JQFILXICXLDTRR-FBCQKBJTSA-N 0.000 description 2
- 244000068988 Glycine max Species 0.000 description 2
- 235000010469 Glycine max Nutrition 0.000 description 2
- 102100034051 Heat shock protein HSP 90-alpha Human genes 0.000 description 2
- TVQGUFGDVODUIF-LSJOCFKGSA-N His-Arg-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CN=CN1)N TVQGUFGDVODUIF-LSJOCFKGSA-N 0.000 description 2
- ZRSJXIKQXUGKRB-TUBUOCAGSA-N His-Ile-Thr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZRSJXIKQXUGKRB-TUBUOCAGSA-N 0.000 description 2
- ZVKDCQVQTGYBQT-LSJOCFKGSA-N His-Pro-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O ZVKDCQVQTGYBQT-LSJOCFKGSA-N 0.000 description 2
- IAYPZSHNZQHQNO-KKUMJFAQSA-N His-Ser-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CC2=CN=CN2)N IAYPZSHNZQHQNO-KKUMJFAQSA-N 0.000 description 2
- VXZZUXWAOMWWJH-QTKMDUPCSA-N His-Thr-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O VXZZUXWAOMWWJH-QTKMDUPCSA-N 0.000 description 2
- 102100039869 Histone H2B type F-S Human genes 0.000 description 2
- 102000003964 Histone deacetylase Human genes 0.000 description 2
- 108090000353 Histone deacetylase Proteins 0.000 description 2
- 101000803294 Homo sapiens BCL2/adenovirus E1B 19 kDa protein-interacting protein 3 Proteins 0.000 description 2
- 101001016865 Homo sapiens Heat shock protein HSP 90-alpha Proteins 0.000 description 2
- 101001035372 Homo sapiens Histone H2B type F-S Proteins 0.000 description 2
- 101000830565 Homo sapiens Tumor necrosis factor ligand superfamily member 10 Proteins 0.000 description 2
- 101000610605 Homo sapiens Tumor necrosis factor receptor superfamily member 10A Proteins 0.000 description 2
- 101000955934 Homo sapiens Vacuolar protein sorting-associated protein 53 homolog Proteins 0.000 description 2
- YKRYHWJRQUSTKG-KBIXCLLPSA-N Ile-Ala-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKRYHWJRQUSTKG-KBIXCLLPSA-N 0.000 description 2
- HERITAGIPLEJMT-GVARAGBVSA-N Ile-Ala-Tyr Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HERITAGIPLEJMT-GVARAGBVSA-N 0.000 description 2
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 2
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 2
- YJRSIJZUIUANHO-NAKRPEOUSA-N Ile-Val-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(=O)O)N YJRSIJZUIUANHO-NAKRPEOUSA-N 0.000 description 2
- 108090001061 Insulin Proteins 0.000 description 2
- 102100023915 Insulin Human genes 0.000 description 2
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 2
- UGTHTQWIQKEDEH-BQBZGAKWSA-N L-alanyl-L-prolylglycine zwitterion Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UGTHTQWIQKEDEH-BQBZGAKWSA-N 0.000 description 2
- ZALAVHVPPOHAOL-XUXIUFHCSA-N Leu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N ZALAVHVPPOHAOL-XUXIUFHCSA-N 0.000 description 2
- DSFYPIUSAMSERP-IHRRRGAJSA-N Leu-Leu-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N DSFYPIUSAMSERP-IHRRRGAJSA-N 0.000 description 2
- JLWZLIQRYCTYBD-IHRRRGAJSA-N Leu-Lys-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JLWZLIQRYCTYBD-IHRRRGAJSA-N 0.000 description 2
- KPYAOIVPJKPIOU-KKUMJFAQSA-N Leu-Lys-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O KPYAOIVPJKPIOU-KKUMJFAQSA-N 0.000 description 2
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 2
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 2
- KZZCOWMDDXDKSS-CIUDSAMLSA-N Leu-Ser-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O KZZCOWMDDXDKSS-CIUDSAMLSA-N 0.000 description 2
- WUHBLPVELFTPQK-KKUMJFAQSA-N Leu-Tyr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O WUHBLPVELFTPQK-KKUMJFAQSA-N 0.000 description 2
- WOEDRPCHKPSFDT-MXAVVETBSA-N Lys-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCCN)N WOEDRPCHKPSFDT-MXAVVETBSA-N 0.000 description 2
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 2
- AFLBTVGQCQLOFJ-AVGNSLFASA-N Lys-Pro-Arg Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AFLBTVGQCQLOFJ-AVGNSLFASA-N 0.000 description 2
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 2
- 101710105759 Major outer membrane porin Proteins 0.000 description 2
- 101710164702 Major outer membrane protein Proteins 0.000 description 2
- 241000204031 Mycoplasma Species 0.000 description 2
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 2
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 2
- 101710163270 Nuclease Proteins 0.000 description 2
- LDSOBEJVGGVWGD-DLOVCJGASA-N Phe-Asp-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 LDSOBEJVGGVWGD-DLOVCJGASA-N 0.000 description 2
- HOYQLNNGMHXZDW-KKUMJFAQSA-N Phe-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O HOYQLNNGMHXZDW-KKUMJFAQSA-N 0.000 description 2
- FXEKNHAJIMHRFJ-ULQDDVLXSA-N Phe-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N FXEKNHAJIMHRFJ-ULQDDVLXSA-N 0.000 description 2
- APKRGYLBSCWJJP-FXQIFTODSA-N Pro-Ala-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O APKRGYLBSCWJJP-FXQIFTODSA-N 0.000 description 2
- BNBBNGZZKQUWCD-IUCAKERBSA-N Pro-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 BNBBNGZZKQUWCD-IUCAKERBSA-N 0.000 description 2
- LSIWVWRUTKPXDS-DCAQKATOSA-N Pro-Gln-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LSIWVWRUTKPXDS-DCAQKATOSA-N 0.000 description 2
- PTLOFJZJADCNCD-DCAQKATOSA-N Pro-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@@H]1CCCN1 PTLOFJZJADCNCD-DCAQKATOSA-N 0.000 description 2
- YXHYJEPDKSYPSQ-AVGNSLFASA-N Pro-Leu-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 YXHYJEPDKSYPSQ-AVGNSLFASA-N 0.000 description 2
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 2
- 229940079156 Proteasome inhibitor Drugs 0.000 description 2
- 108010029485 Protein Isoforms Proteins 0.000 description 2
- 102000001708 Protein Isoforms Human genes 0.000 description 2
- 108010079005 RDV peptide Proteins 0.000 description 2
- 241000270934 Rana catesbeiana Species 0.000 description 2
- 241000270930 Rana japonica Species 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- 102000034527 Retinoid X Receptors Human genes 0.000 description 2
- 108010038912 Retinoid X Receptors Proteins 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 2
- NRCJWSGXMAPYQX-LPEHRKFASA-N Ser-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CO)N)C(=O)O NRCJWSGXMAPYQX-LPEHRKFASA-N 0.000 description 2
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 2
- VMVNCJDKFOQOHM-GUBZILKMSA-N Ser-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CO)N VMVNCJDKFOQOHM-GUBZILKMSA-N 0.000 description 2
- PVDTYLHUWAEYGY-CIUDSAMLSA-N Ser-Glu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PVDTYLHUWAEYGY-CIUDSAMLSA-N 0.000 description 2
- IXCHOHLPHNGFTJ-YUMQZZPRSA-N Ser-Gly-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N IXCHOHLPHNGFTJ-YUMQZZPRSA-N 0.000 description 2
- RHAPJNVNWDBFQI-BQBZGAKWSA-N Ser-Pro-Gly Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O RHAPJNVNWDBFQI-BQBZGAKWSA-N 0.000 description 2
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 2
- VVKVHAOOUGNDPJ-SRVKXCTJSA-N Ser-Tyr-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O VVKVHAOOUGNDPJ-SRVKXCTJSA-N 0.000 description 2
- 102100029860 Suppressor of tumorigenicity 20 protein Human genes 0.000 description 2
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 2
- PKXHGEXFMIZSER-QTKMDUPCSA-N Thr-Arg-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O PKXHGEXFMIZSER-QTKMDUPCSA-N 0.000 description 2
- FIFDDJFLNVAVMS-RHYQMDGZSA-N Thr-Leu-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O FIFDDJFLNVAVMS-RHYQMDGZSA-N 0.000 description 2
- ZSPQUTWLWGWTPS-HJGDQZAQSA-N Thr-Lys-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O ZSPQUTWLWGWTPS-HJGDQZAQSA-N 0.000 description 2
- WRUWXBBEFUTJOU-XGEHTFHBSA-N Thr-Met-Ser Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CO)C(=O)O)N)O WRUWXBBEFUTJOU-XGEHTFHBSA-N 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- NAQBQJOGGYGCOT-QEJZJMRPSA-N Trp-Asn-Gln Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O NAQBQJOGGYGCOT-QEJZJMRPSA-N 0.000 description 2
- 108700025716 Tumor Suppressor Genes Proteins 0.000 description 2
- 102000044209 Tumor Suppressor Genes Human genes 0.000 description 2
- 102100040112 Tumor necrosis factor receptor superfamily member 10B Human genes 0.000 description 2
- 102100040245 Tumor necrosis factor receptor superfamily member 5 Human genes 0.000 description 2
- XQYHLZNPOTXRMQ-KKUMJFAQSA-N Tyr-Glu-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O XQYHLZNPOTXRMQ-KKUMJFAQSA-N 0.000 description 2
- RGYCVIZZTUBSSG-JYJNAYRXSA-N Tyr-Pro-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O RGYCVIZZTUBSSG-JYJNAYRXSA-N 0.000 description 2
- JIODCDXKCJRMEH-NHCYSSNCSA-N Val-Arg-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N JIODCDXKCJRMEH-NHCYSSNCSA-N 0.000 description 2
- COYSIHFOCOMGCF-UHFFFAOYSA-N Val-Arg-Gly Natural products CC(C)C(N)C(=O)NC(C(=O)NCC(O)=O)CCCN=C(N)N COYSIHFOCOMGCF-UHFFFAOYSA-N 0.000 description 2
- CVUDMNSZAIZFAE-TUAOUCFPSA-N Val-Arg-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N CVUDMNSZAIZFAE-TUAOUCFPSA-N 0.000 description 2
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 2
- VUTHNLMCXKLLFI-LAEOZQHASA-N Val-Asp-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N VUTHNLMCXKLLFI-LAEOZQHASA-N 0.000 description 2
- PFMAFMPJJSHNDW-ZKWXMUAHSA-N Val-Cys-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N PFMAFMPJJSHNDW-ZKWXMUAHSA-N 0.000 description 2
- DJEVQCWNMQOABE-RCOVLWMOSA-N Val-Gly-Asp Chemical compound CC(C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N DJEVQCWNMQOABE-RCOVLWMOSA-N 0.000 description 2
- CPGJELLYDQEDRK-NAKRPEOUSA-N Val-Ile-Ala Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)C(C)C)C(=O)N[C@@H](C)C(O)=O CPGJELLYDQEDRK-NAKRPEOUSA-N 0.000 description 2
- 239000012190 activator Substances 0.000 description 2
- 239000000443 aerosol Substances 0.000 description 2
- 239000000556 agonist Substances 0.000 description 2
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 2
- 108010041407 alanylaspartic acid Proteins 0.000 description 2
- 108010070944 alanylhistidine Proteins 0.000 description 2
- 238000004873 anchoring Methods 0.000 description 2
- 239000004037 angiogenesis inhibitor Substances 0.000 description 2
- 229940121369 angiogenesis inhibitor Drugs 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 229940121375 antifungal agent Drugs 0.000 description 2
- 239000003429 antifungal agent Substances 0.000 description 2
- 229940041181 antineoplastic drug Drugs 0.000 description 2
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 2
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 2
- 108010038633 aspartylglutamate Proteins 0.000 description 2
- 239000004202 carbamide Substances 0.000 description 2
- 230000020411 cell activation Effects 0.000 description 2
- 230000022131 cell cycle Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- OSASVXMJTNOKOY-UHFFFAOYSA-N chlorobutanol Chemical compound CC(C)(O)C(Cl)(Cl)Cl OSASVXMJTNOKOY-UHFFFAOYSA-N 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 238000001142 circular dichroism spectrum Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 229910052802 copper Inorganic materials 0.000 description 2
- 239000010949 copper Substances 0.000 description 2
- 239000013078 crystal Substances 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 description 2
- 210000000805 cytoplasm Anatomy 0.000 description 2
- 231100000433 cytotoxic Toxicity 0.000 description 2
- 229940127089 cytotoxic agent Drugs 0.000 description 2
- 231100000263 cytotoxicity test Toxicity 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 239000008367 deionised water Substances 0.000 description 2
- 229910021641 deionized water Inorganic materials 0.000 description 2
- 108010009297 diglycyl-histidine Proteins 0.000 description 2
- 239000002552 dosage form Substances 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 230000012202 endocytosis Effects 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 2
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 2
- 108010079413 glycyl-prolyl-glutamic acid Proteins 0.000 description 2
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- 108010092114 histidylphenylalanine Proteins 0.000 description 2
- 102000057041 human TNF Human genes 0.000 description 2
- 102000044949 human TNFSF10 Human genes 0.000 description 2
- JYGXADMDTFJGBT-VWUMJDOOSA-N hydrocortisone Chemical compound O=C1CC[C@]2(C)[C@H]3[C@@H](O)C[C@](C)([C@@](CC4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 JYGXADMDTFJGBT-VWUMJDOOSA-N 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 238000010348 incorporation Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 239000004615 ingredient Substances 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 229940125396 insulin Drugs 0.000 description 2
- 238000001990 intravenous administration Methods 0.000 description 2
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 2
- 210000004698 lymphocyte Anatomy 0.000 description 2
- 108010003700 lysyl aspartic acid Proteins 0.000 description 2
- 108010089256 lysyl-aspartyl-glutamyl-leucine Proteins 0.000 description 2
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 108010038320 lysylphenylalanine Proteins 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 108010082117 matrigel Proteins 0.000 description 2
- 108010056582 methionylglutamic acid Proteins 0.000 description 2
- 210000001700 mitochondrial membrane Anatomy 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- VMGAPWLDMVPYIA-HIDZBRGKSA-N n'-amino-n-iminomethanimidamide Chemical compound N\N=C\N=N VMGAPWLDMVPYIA-HIDZBRGKSA-N 0.000 description 2
- 231100001143 noxa Toxicity 0.000 description 2
- 230000035515 penetration Effects 0.000 description 2
- 230000008823 permeabilization Effects 0.000 description 2
- 108010025488 pinealon Proteins 0.000 description 2
- 239000003755 preservative agent Substances 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 2
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 2
- 108010004914 prolylarginine Proteins 0.000 description 2
- 108010029020 prolylglycine Proteins 0.000 description 2
- 108010015796 prolylisoleucine Proteins 0.000 description 2
- 239000003207 proteasome inhibitor Substances 0.000 description 2
- 238000001243 protein synthesis Methods 0.000 description 2
- 230000017854 proteolysis Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- BOLDJAUMGUJJKM-LSDHHAIUSA-N renifolin D Natural products CC(=C)[C@@H]1Cc2c(O)c(O)ccc2[C@H]1CC(=O)c3ccc(O)cc3O BOLDJAUMGUJJKM-LSDHHAIUSA-N 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 238000007363 ring formation reaction Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- 230000006641 stabilisation Effects 0.000 description 2
- 238000011105 stabilization Methods 0.000 description 2
- 239000003381 stabilizer Substances 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 238000007920 subcutaneous administration Methods 0.000 description 2
- 239000004094 surface-active agent Substances 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- 108010003137 tyrosyltyrosine Proteins 0.000 description 2
- NWONKYPBYAMBJT-UHFFFAOYSA-L zinc sulfate Chemical compound [Zn+2].[O-]S([O-])(=O)=O NWONKYPBYAMBJT-UHFFFAOYSA-L 0.000 description 2
- 229960001763 zinc sulfate Drugs 0.000 description 2
- 229910000368 zinc sulfate Inorganic materials 0.000 description 2
- KPDTZVSUQCBOAE-HTFCKZLJSA-N (2s)-2-[[(2s)-1-[(2s)-2-[[(2s)-2-[[(2s)-2-aminopropanoyl]amino]propanoyl]amino]propanoyl]pyrrolidine-2-carbonyl]amino]propanoic acid Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O KPDTZVSUQCBOAE-HTFCKZLJSA-N 0.000 description 1
- RUDATBOHQWOJDD-UHFFFAOYSA-N (3beta,5beta,7alpha)-3,7-Dihydroxycholan-24-oic acid Natural products OC1CC2CC(O)CCC2(C)C2C1C1CCC(C(CCC(O)=O)C)C1(C)CC2 RUDATBOHQWOJDD-UHFFFAOYSA-N 0.000 description 1
- HNCDPNILXJWUDZ-BAPDVVNWSA-N (4s)-4-[[(2s)-2-[[2-[[(2s,3s)-2-[[(2s)-2-[[(2s)-6-amino-2-[[(2s)-2-[[(2r)-2-[[(2s)-2-[[(2s)-2-[[(2s)-2-[[(2s)-6-amino-2-[[(2s)-2,6-diaminohexanoyl]amino]hexanoyl]amino]-4-methylpentanoyl]amino]-3-hydroxypropanoyl]amino]-4-carboxybutanoyl]amino]-3-sulfanyl Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN HNCDPNILXJWUDZ-BAPDVVNWSA-N 0.000 description 1
- IIZPXYDJLKNOIY-JXPKJXOSSA-N 1-palmitoyl-2-arachidonoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCC\C=C/C\C=C/C\C=C/C\C=C/CCCCC IIZPXYDJLKNOIY-JXPKJXOSSA-N 0.000 description 1
- ZHKJHQBOAJQXQR-UHFFFAOYSA-N 1H-azirine Chemical compound N1C=C1 ZHKJHQBOAJQXQR-UHFFFAOYSA-N 0.000 description 1
- FBFNMTGUOBUGFQ-UHFFFAOYSA-M 2-(2,5-diphenyltetrazol-1-ium-1-yl)-4,5-dimethyl-1,3-thiazole;bromide Chemical compound [Br-].S1C(C)=C(C)N=C1[N+]1=C(C=2C=CC=CC=2)N=NN1C1=CC=CC=C1 FBFNMTGUOBUGFQ-UHFFFAOYSA-M 0.000 description 1
- DQVAZKGVGKHQDS-UHFFFAOYSA-N 2-[[1-[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]pyrrolidine-2-carbonyl]amino]-4-methylpentanoic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(=O)NC(CC(C)C)C(O)=O DQVAZKGVGKHQDS-UHFFFAOYSA-N 0.000 description 1
- XJFPXLWGZWAWRQ-UHFFFAOYSA-N 2-[[2-[[2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(=O)NCC(O)=O XJFPXLWGZWAWRQ-UHFFFAOYSA-N 0.000 description 1
- TUMCWFMHZOUPDA-UHFFFAOYSA-N 2-ethylsulfanyl-1,3-benzothiazol-6-amine Chemical compound C1=C(N)C=C2SC(SCC)=NC2=C1 TUMCWFMHZOUPDA-UHFFFAOYSA-N 0.000 description 1
- UMCMPZBLKLEWAF-BCTGSCMUSA-N 3-[(3-cholamidopropyl)dimethylammonio]propane-1-sulfonate Chemical compound C([C@H]1C[C@H]2O)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(=O)NCCC[N+](C)(C)CCCS([O-])(=O)=O)C)[C@@]2(C)[C@@H](O)C1 UMCMPZBLKLEWAF-BCTGSCMUSA-N 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- UGLPMYSCWHTZQU-AUTRQRHGSA-N Ala-Ala-Tyr Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](C)C(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UGLPMYSCWHTZQU-AUTRQRHGSA-N 0.000 description 1
- SSSROGPPPVTHLX-FXQIFTODSA-N Ala-Arg-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SSSROGPPPVTHLX-FXQIFTODSA-N 0.000 description 1
- KVWLTGNCJYDJET-LSJOCFKGSA-N Ala-Arg-His Chemical compound C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KVWLTGNCJYDJET-LSJOCFKGSA-N 0.000 description 1
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 1
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 1
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 1
- NJIFPLAJSVUQOZ-JBDRJPRFSA-N Ala-Cys-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C)N NJIFPLAJSVUQOZ-JBDRJPRFSA-N 0.000 description 1
- UQJUGHFKNKGHFQ-VZFHVOOUSA-N Ala-Cys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UQJUGHFKNKGHFQ-VZFHVOOUSA-N 0.000 description 1
- IFTVANMRTIHKML-WDSKDSINSA-N Ala-Gln-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O IFTVANMRTIHKML-WDSKDSINSA-N 0.000 description 1
- PUBLUECXJRHTBK-ACZMJKKPSA-N Ala-Glu-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O PUBLUECXJRHTBK-ACZMJKKPSA-N 0.000 description 1
- VWEWCZSUWOEEFM-WDSKDSINSA-N Ala-Gly-Ala-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(=O)NCC(O)=O VWEWCZSUWOEEFM-WDSKDSINSA-N 0.000 description 1
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 1
- SIGTYDNEPYEXGK-ZANVPECISA-N Ala-Gly-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)CNC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 SIGTYDNEPYEXGK-ZANVPECISA-N 0.000 description 1
- NYDBKUNVSALYPX-NAKRPEOUSA-N Ala-Ile-Arg Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NYDBKUNVSALYPX-NAKRPEOUSA-N 0.000 description 1
- FOHXUHGZZKETFI-JBDRJPRFSA-N Ala-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C)N FOHXUHGZZKETFI-JBDRJPRFSA-N 0.000 description 1
- CHFFHQUVXHEGBY-GARJFASQSA-N Ala-Lys-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CHFFHQUVXHEGBY-GARJFASQSA-N 0.000 description 1
- VHEVVUZDDUCAKU-FXQIFTODSA-N Ala-Met-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O VHEVVUZDDUCAKU-FXQIFTODSA-N 0.000 description 1
- PVQLRJRPUTXFFX-CIUDSAMLSA-N Ala-Met-Gln Chemical compound CSCC[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O PVQLRJRPUTXFFX-CIUDSAMLSA-N 0.000 description 1
- ADSGHMXEAZJJNF-DCAQKATOSA-N Ala-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N ADSGHMXEAZJJNF-DCAQKATOSA-N 0.000 description 1
- YHBDGLZYNIARKJ-GUBZILKMSA-N Ala-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](C)N YHBDGLZYNIARKJ-GUBZILKMSA-N 0.000 description 1
- YYAVDNKUWLAFCV-ACZMJKKPSA-N Ala-Ser-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O YYAVDNKUWLAFCV-ACZMJKKPSA-N 0.000 description 1
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 1
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 1
- XQNRANMFRPCFFW-GCJQMDKQSA-N Ala-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C)N)O XQNRANMFRPCFFW-GCJQMDKQSA-N 0.000 description 1
- ZJLORAAXDAJLDC-CQDKDKBSSA-N Ala-Tyr-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O ZJLORAAXDAJLDC-CQDKDKBSSA-N 0.000 description 1
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 1
- 241000928106 Alain Species 0.000 description 1
- 102100022987 Angiogenin Human genes 0.000 description 1
- 102100021986 Apoptosis-stimulating of p53 protein 2 Human genes 0.000 description 1
- MCYJBCKCAPERSE-FXQIFTODSA-N Arg-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N MCYJBCKCAPERSE-FXQIFTODSA-N 0.000 description 1
- HULHGJZIZXCPLD-FXQIFTODSA-N Arg-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N HULHGJZIZXCPLD-FXQIFTODSA-N 0.000 description 1
- KWKQGHSSNHPGOW-BQBZGAKWSA-N Arg-Ala-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(=O)NCC(O)=O KWKQGHSSNHPGOW-BQBZGAKWSA-N 0.000 description 1
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 1
- XEPSCVXTCUUHDT-AVGNSLFASA-N Arg-Arg-Leu Natural products CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCN=C(N)N XEPSCVXTCUUHDT-AVGNSLFASA-N 0.000 description 1
- PVSNBTCXCQIXSE-JYJNAYRXSA-N Arg-Arg-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PVSNBTCXCQIXSE-JYJNAYRXSA-N 0.000 description 1
- USNSOPDIZILSJP-FXQIFTODSA-N Arg-Asn-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O USNSOPDIZILSJP-FXQIFTODSA-N 0.000 description 1
- QPOARHANPULOTM-GMOBBJLQSA-N Arg-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N QPOARHANPULOTM-GMOBBJLQSA-N 0.000 description 1
- BVBKBQRPOJFCQM-DCAQKATOSA-N Arg-Asn-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BVBKBQRPOJFCQM-DCAQKATOSA-N 0.000 description 1
- NTAZNGWBXRVEDJ-FXQIFTODSA-N Arg-Asp-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NTAZNGWBXRVEDJ-FXQIFTODSA-N 0.000 description 1
- KMSHNDWHPWXPEC-BQBZGAKWSA-N Arg-Asp-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KMSHNDWHPWXPEC-BQBZGAKWSA-N 0.000 description 1
- YUGFLWBWAJFGKY-BQBZGAKWSA-N Arg-Cys-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)NCC(O)=O YUGFLWBWAJFGKY-BQBZGAKWSA-N 0.000 description 1
- PNQWAUXQDBIJDY-GUBZILKMSA-N Arg-Glu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNQWAUXQDBIJDY-GUBZILKMSA-N 0.000 description 1
- NXDXECQFKHXHAM-HJGDQZAQSA-N Arg-Glu-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NXDXECQFKHXHAM-HJGDQZAQSA-N 0.000 description 1
- HQIZDMIGUJOSNI-IUCAKERBSA-N Arg-Gly-Arg Chemical compound N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQIZDMIGUJOSNI-IUCAKERBSA-N 0.000 description 1
- AUFHLLPVPSMEOG-YUMQZZPRSA-N Arg-Gly-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AUFHLLPVPSMEOG-YUMQZZPRSA-N 0.000 description 1
- YBIAYFFIVAZXPK-AVGNSLFASA-N Arg-His-Arg Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O YBIAYFFIVAZXPK-AVGNSLFASA-N 0.000 description 1
- ITHMWNNUDPJJER-ULQDDVLXSA-N Arg-His-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ITHMWNNUDPJJER-ULQDDVLXSA-N 0.000 description 1
- NVUIWHJLPSZZQC-CYDGBPFRSA-N Arg-Ile-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NVUIWHJLPSZZQC-CYDGBPFRSA-N 0.000 description 1
- JEXPNDORFYHJTM-IHRRRGAJSA-N Arg-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCN=C(N)N JEXPNDORFYHJTM-IHRRRGAJSA-N 0.000 description 1
- GIMTZGADWZTZGV-DCAQKATOSA-N Arg-Lys-Cys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GIMTZGADWZTZGV-DCAQKATOSA-N 0.000 description 1
- RIQBRKVTFBWEDY-RHYQMDGZSA-N Arg-Lys-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RIQBRKVTFBWEDY-RHYQMDGZSA-N 0.000 description 1
- OVQJAKFLFTZDNC-GUBZILKMSA-N Arg-Pro-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O OVQJAKFLFTZDNC-GUBZILKMSA-N 0.000 description 1
- XSPKAHFVDKRGRL-DCAQKATOSA-N Arg-Pro-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O XSPKAHFVDKRGRL-DCAQKATOSA-N 0.000 description 1
- 108010051330 Arg-Pro-Gly-Pro Proteins 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- YFHATWYGAAXQCF-JYJNAYRXSA-N Arg-Pro-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 YFHATWYGAAXQCF-JYJNAYRXSA-N 0.000 description 1
- OWSMKCJUBAPHED-JYJNAYRXSA-N Arg-Pro-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 OWSMKCJUBAPHED-JYJNAYRXSA-N 0.000 description 1
- VENMDXUVHSKEIN-GUBZILKMSA-N Arg-Ser-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VENMDXUVHSKEIN-GUBZILKMSA-N 0.000 description 1
- DNLQVHBBMPZUGJ-BQBZGAKWSA-N Arg-Ser-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O DNLQVHBBMPZUGJ-BQBZGAKWSA-N 0.000 description 1
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 1
- AIFHRTPABBBHKU-RCWTZXSCSA-N Arg-Thr-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O AIFHRTPABBBHKU-RCWTZXSCSA-N 0.000 description 1
- PYDIIVKGTBRIEL-SZMVWBNQSA-N Arg-Trp-Pro Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(O)=O PYDIIVKGTBRIEL-SZMVWBNQSA-N 0.000 description 1
- CGXQUULXFWRJOI-SRVKXCTJSA-N Arg-Val-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O CGXQUULXFWRJOI-SRVKXCTJSA-N 0.000 description 1
- ORXCYAFUCSTQGY-FXQIFTODSA-N Asn-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N ORXCYAFUCSTQGY-FXQIFTODSA-N 0.000 description 1
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 1
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 1
- ZWASIOHRQWRWAS-UGYAYLCHSA-N Asn-Asp-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZWASIOHRQWRWAS-UGYAYLCHSA-N 0.000 description 1
- UEONJSPBTSWKOI-CIUDSAMLSA-N Asn-Gln-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O UEONJSPBTSWKOI-CIUDSAMLSA-N 0.000 description 1
- ACKNRKFVYUVWAC-ZPFDUUQYSA-N Asn-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ACKNRKFVYUVWAC-ZPFDUUQYSA-N 0.000 description 1
- LVHMEJJWEXBMKK-GMOBBJLQSA-N Asn-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(=O)N)N LVHMEJJWEXBMKK-GMOBBJLQSA-N 0.000 description 1
- JEEFEQCRXKPQHC-KKUMJFAQSA-N Asn-Leu-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O JEEFEQCRXKPQHC-KKUMJFAQSA-N 0.000 description 1
- JLNFZLNDHONLND-GARJFASQSA-N Asn-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N JLNFZLNDHONLND-GARJFASQSA-N 0.000 description 1
- FHETWELNCBMRMG-HJGDQZAQSA-N Asn-Leu-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FHETWELNCBMRMG-HJGDQZAQSA-N 0.000 description 1
- RCFGLXMZDYNRSC-CIUDSAMLSA-N Asn-Lys-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O RCFGLXMZDYNRSC-CIUDSAMLSA-N 0.000 description 1
- NYGILGUOUOXGMJ-YUMQZZPRSA-N Asn-Lys-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O NYGILGUOUOXGMJ-YUMQZZPRSA-N 0.000 description 1
- YXVAESUIQFDBHN-SRVKXCTJSA-N Asn-Phe-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O YXVAESUIQFDBHN-SRVKXCTJSA-N 0.000 description 1
- SUIJFTJDTJKSRK-IHRRRGAJSA-N Asn-Pro-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUIJFTJDTJKSRK-IHRRRGAJSA-N 0.000 description 1
- JXMREEPBRANWBY-VEVYYDQMSA-N Asn-Thr-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JXMREEPBRANWBY-VEVYYDQMSA-N 0.000 description 1
- PIABYSIYPGLLDQ-XVSYOHENSA-N Asn-Thr-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PIABYSIYPGLLDQ-XVSYOHENSA-N 0.000 description 1
- YNQMEIJEWSHOEO-SRVKXCTJSA-N Asn-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O YNQMEIJEWSHOEO-SRVKXCTJSA-N 0.000 description 1
- CBHVAFXKOYAHOY-NHCYSSNCSA-N Asn-Val-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O CBHVAFXKOYAHOY-NHCYSSNCSA-N 0.000 description 1
- NJIKKGUVGUBICV-ZLUOBGJFSA-N Asp-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(O)=O NJIKKGUVGUBICV-ZLUOBGJFSA-N 0.000 description 1
- GVPSCJQLUGIKAM-GUBZILKMSA-N Asp-Arg-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GVPSCJQLUGIKAM-GUBZILKMSA-N 0.000 description 1
- SDHFVYLZFBDSQT-DCAQKATOSA-N Asp-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N SDHFVYLZFBDSQT-DCAQKATOSA-N 0.000 description 1
- SVFOIXMRMLROHO-SRVKXCTJSA-N Asp-Asp-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 SVFOIXMRMLROHO-SRVKXCTJSA-N 0.000 description 1
- ZRAOLTNMSCSCLN-ZLUOBGJFSA-N Asp-Cys-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)O ZRAOLTNMSCSCLN-ZLUOBGJFSA-N 0.000 description 1
- MJKBOVWWADWLHV-ZLUOBGJFSA-N Asp-Cys-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)C(=O)O MJKBOVWWADWLHV-ZLUOBGJFSA-N 0.000 description 1
- SNAWMGHSCHKSDK-GUBZILKMSA-N Asp-Gln-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)O)N SNAWMGHSCHKSDK-GUBZILKMSA-N 0.000 description 1
- POTCZYQVVNXUIG-BQBZGAKWSA-N Asp-Gly-Pro Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N1CCC[C@H]1C(O)=O POTCZYQVVNXUIG-BQBZGAKWSA-N 0.000 description 1
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 1
- UMHUHHJMEXNSIV-CIUDSAMLSA-N Asp-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UMHUHHJMEXNSIV-CIUDSAMLSA-N 0.000 description 1
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 1
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 1
- YUELDQUPTAYEGM-XIRDDKMYSA-N Asp-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC(=O)O)N YUELDQUPTAYEGM-XIRDDKMYSA-N 0.000 description 1
- USENATHVGFXRNO-SRVKXCTJSA-N Asp-Tyr-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 USENATHVGFXRNO-SRVKXCTJSA-N 0.000 description 1
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 1
- MFDPBZAFCRKYEY-LAEOZQHASA-N Asp-Val-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFDPBZAFCRKYEY-LAEOZQHASA-N 0.000 description 1
- XMKXONRMGJXCJV-LAEOZQHASA-N Asp-Val-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O XMKXONRMGJXCJV-LAEOZQHASA-N 0.000 description 1
- 108091007065 BIRCs Proteins 0.000 description 1
- 244000063299 Bacillus subtilis Species 0.000 description 1
- 235000014469 Bacillus subtilis Nutrition 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 108010077805 Bacterial Proteins Proteins 0.000 description 1
- 102100021277 Beta-secretase 2 Human genes 0.000 description 1
- 238000009010 Bradford assay Methods 0.000 description 1
- 101100111639 Caenorhabditis elegans bir-2 gene Proteins 0.000 description 1
- BHPQYMZQTOCNFJ-UHFFFAOYSA-N Calcium cation Chemical compound [Ca+2] BHPQYMZQTOCNFJ-UHFFFAOYSA-N 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108090000567 Caspase 7 Proteins 0.000 description 1
- 102100038902 Caspase-7 Human genes 0.000 description 1
- 206010057248 Cell death Diseases 0.000 description 1
- 108010035563 Chloramphenicol O-acetyltransferase Proteins 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 208000009738 Connective Tissue Neoplasms Diseases 0.000 description 1
- PKNIZMPLMSKROD-BIIVOSGPSA-N Cys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CS)N PKNIZMPLMSKROD-BIIVOSGPSA-N 0.000 description 1
- CLDCTNHPILWQCW-CIUDSAMLSA-N Cys-Arg-Glu Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N)CN=C(N)N CLDCTNHPILWQCW-CIUDSAMLSA-N 0.000 description 1
- UWXFFVQPAMBETM-ZLUOBGJFSA-N Cys-Asp-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UWXFFVQPAMBETM-ZLUOBGJFSA-N 0.000 description 1
- RWGDABDXVXRLLH-ACZMJKKPSA-N Cys-Glu-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CS)N RWGDABDXVXRLLH-ACZMJKKPSA-N 0.000 description 1
- MUZAUPFGPMMZSS-GUBZILKMSA-N Cys-Glu-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N MUZAUPFGPMMZSS-GUBZILKMSA-N 0.000 description 1
- SBORMUFGKSCGEN-XHNCKOQMSA-N Cys-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CS)N)C(=O)O SBORMUFGKSCGEN-XHNCKOQMSA-N 0.000 description 1
- ZEXHDOQQYZKOIB-ACZMJKKPSA-N Cys-Glu-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZEXHDOQQYZKOIB-ACZMJKKPSA-N 0.000 description 1
- DZLQXIFVQFTFJY-BYPYZUCNSA-N Cys-Gly-Gly Chemical compound SC[C@H](N)C(=O)NCC(=O)NCC(O)=O DZLQXIFVQFTFJY-BYPYZUCNSA-N 0.000 description 1
- LHMSYHSAAJOEBL-CIUDSAMLSA-N Cys-Lys-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O LHMSYHSAAJOEBL-CIUDSAMLSA-N 0.000 description 1
- VXLXATVURDNDCG-CIUDSAMLSA-N Cys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CS)N VXLXATVURDNDCG-CIUDSAMLSA-N 0.000 description 1
- CIVXDCMSSFGWAL-YUMQZZPRSA-N Cys-Lys-Gly Chemical compound C(CCN)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N CIVXDCMSSFGWAL-YUMQZZPRSA-N 0.000 description 1
- JUUMIGUJJRFQQR-KKUMJFAQSA-N Cys-Lys-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N)O JUUMIGUJJRFQQR-KKUMJFAQSA-N 0.000 description 1
- ZGERHCJBLPQPGV-ACZMJKKPSA-N Cys-Ser-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CS)N ZGERHCJBLPQPGV-ACZMJKKPSA-N 0.000 description 1
- NDNZRWUDUMTITL-FXQIFTODSA-N Cys-Ser-Val Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NDNZRWUDUMTITL-FXQIFTODSA-N 0.000 description 1
- BUAUGQJXGNRTQE-AAEUAGOBSA-N Cys-Trp-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CS)N BUAUGQJXGNRTQE-AAEUAGOBSA-N 0.000 description 1
- FNXOZWPPOJRBRE-XGEHTFHBSA-N Cys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CS)N)O FNXOZWPPOJRBRE-XGEHTFHBSA-N 0.000 description 1
- 108050008072 Cytochrome c oxidase subunit IV Proteins 0.000 description 1
- 102000000634 Cytochrome c oxidase subunit IV Human genes 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 230000007023 DNA restriction-modification system Effects 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 101100044298 Drosophila melanogaster fand gene Proteins 0.000 description 1
- 102100039371 ER lumen protein-retaining receptor 1 Human genes 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 241000588722 Escherichia Species 0.000 description 1
- 101150064015 FAS gene Proteins 0.000 description 1
- 102000015212 Fas Ligand Protein Human genes 0.000 description 1
- 108010039471 Fas Ligand Protein Proteins 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- YJIUYQKQBBQYHZ-ACZMJKKPSA-N Gln-Ala-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O YJIUYQKQBBQYHZ-ACZMJKKPSA-N 0.000 description 1
- WUAYFMZULZDSLB-ACZMJKKPSA-N Gln-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O WUAYFMZULZDSLB-ACZMJKKPSA-N 0.000 description 1
- OYTPNWYZORARHL-XHNCKOQMSA-N Gln-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N OYTPNWYZORARHL-XHNCKOQMSA-N 0.000 description 1
- DHNWZLGBTPUTQQ-QEJZJMRPSA-N Gln-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N DHNWZLGBTPUTQQ-QEJZJMRPSA-N 0.000 description 1
- NKCZYEDZTKOFBG-GUBZILKMSA-N Gln-Gln-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NKCZYEDZTKOFBG-GUBZILKMSA-N 0.000 description 1
- CGVWDTRDPLOMHZ-FXQIFTODSA-N Gln-Glu-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O CGVWDTRDPLOMHZ-FXQIFTODSA-N 0.000 description 1
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 1
- LFIVHGMKWFGUGK-IHRRRGAJSA-N Gln-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N LFIVHGMKWFGUGK-IHRRRGAJSA-N 0.000 description 1
- XJKAKYXMFHUIHT-AUTRQRHGSA-N Gln-Glu-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)N)N XJKAKYXMFHUIHT-AUTRQRHGSA-N 0.000 description 1
- VSXBYIJUAXPAAL-WDSKDSINSA-N Gln-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CCC(N)=O VSXBYIJUAXPAAL-WDSKDSINSA-N 0.000 description 1
- IKFZXRLDMYWNBU-YUMQZZPRSA-N Gln-Gly-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N IKFZXRLDMYWNBU-YUMQZZPRSA-N 0.000 description 1
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 1
- JRHPEMVLTRADLJ-AVGNSLFASA-N Gln-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JRHPEMVLTRADLJ-AVGNSLFASA-N 0.000 description 1
- ZEEPYMXTJWIMSN-GUBZILKMSA-N Gln-Lys-Ser Chemical compound NCCCC[C@@H](C(=O)N[C@@H](CO)C(O)=O)NC(=O)[C@@H](N)CCC(N)=O ZEEPYMXTJWIMSN-GUBZILKMSA-N 0.000 description 1
- YGNPTRVNRUKVLA-DCAQKATOSA-N Gln-Met-Met Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCC(=O)N)N YGNPTRVNRUKVLA-DCAQKATOSA-N 0.000 description 1
- WHVLABLIJYGVEK-QEWYBTABSA-N Gln-Phe-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WHVLABLIJYGVEK-QEWYBTABSA-N 0.000 description 1
- VNTGPISAOMAXRK-CIUDSAMLSA-N Gln-Pro-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O VNTGPISAOMAXRK-CIUDSAMLSA-N 0.000 description 1
- PAOHIZNRJNIXQY-XQXXSGGOSA-N Gln-Thr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PAOHIZNRJNIXQY-XQXXSGGOSA-N 0.000 description 1
- UXXIVIQGOODKQC-NUMRIWBASA-N Gln-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O UXXIVIQGOODKQC-NUMRIWBASA-N 0.000 description 1
- MKRDNSWGJWTBKZ-GVXVVHGQSA-N Gln-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N MKRDNSWGJWTBKZ-GVXVVHGQSA-N 0.000 description 1
- WOMUDRVDJMHTCV-DCAQKATOSA-N Glu-Arg-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOMUDRVDJMHTCV-DCAQKATOSA-N 0.000 description 1
- NLKVNZUFDPWPNL-YUMQZZPRSA-N Glu-Arg-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O NLKVNZUFDPWPNL-YUMQZZPRSA-N 0.000 description 1
- OJGLIOXAKGFFDW-SRVKXCTJSA-N Glu-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N OJGLIOXAKGFFDW-SRVKXCTJSA-N 0.000 description 1
- MLCPTRRNICEKIS-FXQIFTODSA-N Glu-Asn-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLCPTRRNICEKIS-FXQIFTODSA-N 0.000 description 1
- LXAUHIRMWXQRKI-XHNCKOQMSA-N Glu-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N)C(=O)O LXAUHIRMWXQRKI-XHNCKOQMSA-N 0.000 description 1
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 1
- XHWLNISLUFEWNS-CIUDSAMLSA-N Glu-Gln-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O XHWLNISLUFEWNS-CIUDSAMLSA-N 0.000 description 1
- XHUCVVHRLNPZSZ-CIUDSAMLSA-N Glu-Gln-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O XHUCVVHRLNPZSZ-CIUDSAMLSA-N 0.000 description 1
- ILGFBUGLBSAQQB-GUBZILKMSA-N Glu-Glu-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O ILGFBUGLBSAQQB-GUBZILKMSA-N 0.000 description 1
- HNVFSTLPVJWIDV-CIUDSAMLSA-N Glu-Glu-Gln Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O HNVFSTLPVJWIDV-CIUDSAMLSA-N 0.000 description 1
- BUZMZDDKFCSKOT-CIUDSAMLSA-N Glu-Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BUZMZDDKFCSKOT-CIUDSAMLSA-N 0.000 description 1
- WRNAXCVRSBBKGS-BQBZGAKWSA-N Glu-Gly-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O WRNAXCVRSBBKGS-BQBZGAKWSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- LZMQSTPFYJLVJB-GUBZILKMSA-N Glu-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N LZMQSTPFYJLVJB-GUBZILKMSA-N 0.000 description 1
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 1
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 1
- MIIGESVJEBDJMP-FHWLQOOXSA-N Glu-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 MIIGESVJEBDJMP-FHWLQOOXSA-N 0.000 description 1
- CQAHWYDHKUWYIX-YUMQZZPRSA-N Glu-Pro-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O CQAHWYDHKUWYIX-YUMQZZPRSA-N 0.000 description 1
- SWDNPSMMEWRNOH-HJGDQZAQSA-N Glu-Pro-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWDNPSMMEWRNOH-HJGDQZAQSA-N 0.000 description 1
- MRWYPDWDZSLWJM-ACZMJKKPSA-N Glu-Ser-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O MRWYPDWDZSLWJM-ACZMJKKPSA-N 0.000 description 1
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 1
- FKJQNJCQTKUBCD-XPUUQOCRSA-N Gly-Ala-His Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)O FKJQNJCQTKUBCD-XPUUQOCRSA-N 0.000 description 1
- JLXVRFDTDUGQEE-YFKPBYRVSA-N Gly-Arg Chemical compound NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N JLXVRFDTDUGQEE-YFKPBYRVSA-N 0.000 description 1
- RQZGFWKQLPJOEQ-YUMQZZPRSA-N Gly-Arg-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)CN)CN=C(N)N RQZGFWKQLPJOEQ-YUMQZZPRSA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- DTPOVRRYXPJJAZ-FJXKBIBVSA-N Gly-Arg-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N DTPOVRRYXPJJAZ-FJXKBIBVSA-N 0.000 description 1
- FUTAPPOITCCWTH-WHFBIAKZSA-N Gly-Asp-Asp Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FUTAPPOITCCWTH-WHFBIAKZSA-N 0.000 description 1
- QSTLUOIOYLYLLF-WDSKDSINSA-N Gly-Asp-Glu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QSTLUOIOYLYLLF-WDSKDSINSA-N 0.000 description 1
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 1
- TZOVVRJYUDETQG-RCOVLWMOSA-N Gly-Asp-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN TZOVVRJYUDETQG-RCOVLWMOSA-N 0.000 description 1
- CQZDZKRHFWJXDF-WDSKDSINSA-N Gly-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)CN CQZDZKRHFWJXDF-WDSKDSINSA-N 0.000 description 1
- QPDUVFSVVAOUHE-XVKPBYJWSA-N Gly-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(O)=O QPDUVFSVVAOUHE-XVKPBYJWSA-N 0.000 description 1
- FIQQRCFQXGLOSZ-WDSKDSINSA-N Gly-Glu-Asp Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O FIQQRCFQXGLOSZ-WDSKDSINSA-N 0.000 description 1
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 1
- PDAWDNVHMUKWJR-ZETCQYMHSA-N Gly-Gly-His Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 PDAWDNVHMUKWJR-ZETCQYMHSA-N 0.000 description 1
- QPCVIQJVRGXUSA-LURJTMIESA-N Gly-Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QPCVIQJVRGXUSA-LURJTMIESA-N 0.000 description 1
- ALOBJFDJTMQQPW-ONGXEEELSA-N Gly-His-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)CN ALOBJFDJTMQQPW-ONGXEEELSA-N 0.000 description 1
- COVXELOAORHTND-LSJOCFKGSA-N Gly-Ile-Val Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O COVXELOAORHTND-LSJOCFKGSA-N 0.000 description 1
- UHPAZODVFFYEEL-QWRGUYRKSA-N Gly-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)CN UHPAZODVFFYEEL-QWRGUYRKSA-N 0.000 description 1
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 1
- LXTRSHQLGYINON-DTWKUNHWSA-N Gly-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN LXTRSHQLGYINON-DTWKUNHWSA-N 0.000 description 1
- JPVGHHQGKPQYIL-KBPBESRZSA-N Gly-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 JPVGHHQGKPQYIL-KBPBESRZSA-N 0.000 description 1
- QAMMIGULQSIRCD-IRXDYDNUSA-N Gly-Phe-Tyr Chemical compound C([C@H](NC(=O)C[NH3+])C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C([O-])=O)C1=CC=CC=C1 QAMMIGULQSIRCD-IRXDYDNUSA-N 0.000 description 1
- VNNRLUNBJSWZPF-ZKWXMUAHSA-N Gly-Ser-Ile Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VNNRLUNBJSWZPF-ZKWXMUAHSA-N 0.000 description 1
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 1
- ABPRMMYHROQBLY-NKWVEPMBSA-N Gly-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)CN)C(=O)O ABPRMMYHROQBLY-NKWVEPMBSA-N 0.000 description 1
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 1
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- 241000374102 Guettarda pungens Species 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- PROLDOGUBQJNPG-RWMBFGLXSA-N His-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC2=CN=CN2)N)C(=O)O PROLDOGUBQJNPG-RWMBFGLXSA-N 0.000 description 1
- UZZXGLOJRZKYEL-DJFWLOJKSA-N His-Asn-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UZZXGLOJRZKYEL-DJFWLOJKSA-N 0.000 description 1
- QSLKWWDKIXMWJV-SRVKXCTJSA-N His-Cys-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O)N QSLKWWDKIXMWJV-SRVKXCTJSA-N 0.000 description 1
- CVEFOCIRMVGWDS-XIRDDKMYSA-N His-Cys-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CN=CN1 CVEFOCIRMVGWDS-XIRDDKMYSA-N 0.000 description 1
- JCOSMKPAOYDKRO-AVGNSLFASA-N His-Glu-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N JCOSMKPAOYDKRO-AVGNSLFASA-N 0.000 description 1
- BILZDIPAKWZFSG-PYJNHQTQSA-N His-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N BILZDIPAKWZFSG-PYJNHQTQSA-N 0.000 description 1
- FHKZHRMERJUXRJ-DCAQKATOSA-N His-Ser-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CN=CN1 FHKZHRMERJUXRJ-DCAQKATOSA-N 0.000 description 1
- CCUSLCQWVMWTIS-IXOXFDKPSA-N His-Thr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O CCUSLCQWVMWTIS-IXOXFDKPSA-N 0.000 description 1
- CSRRMQFXMBPSIL-SIXJUCDHSA-N His-Trp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CC3=CN=CN3)N CSRRMQFXMBPSIL-SIXJUCDHSA-N 0.000 description 1
- 102000017286 Histone H2A Human genes 0.000 description 1
- 108050005231 Histone H2A Proteins 0.000 description 1
- 102000006947 Histones Human genes 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 101000757236 Homo sapiens Angiogenin Proteins 0.000 description 1
- 101000752711 Homo sapiens Apoptosis-stimulating of p53 protein 2 Proteins 0.000 description 1
- 101000812437 Homo sapiens ER lumen protein-retaining receptor 1 Proteins 0.000 description 1
- 101000619708 Homo sapiens Peroxiredoxin-6 Proteins 0.000 description 1
- 101000667595 Homo sapiens Ribonuclease pancreatic Proteins 0.000 description 1
- 101000617830 Homo sapiens Sterol O-acyltransferase 1 Proteins 0.000 description 1
- 101000610602 Homo sapiens Tumor necrosis factor receptor superfamily member 10C Proteins 0.000 description 1
- 101000610609 Homo sapiens Tumor necrosis factor receptor superfamily member 10D Proteins 0.000 description 1
- 229920002153 Hydroxypropyl cellulose Polymers 0.000 description 1
- WIZPFZKOFZXDQG-HTFCKZLJSA-N Ile-Ile-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O WIZPFZKOFZXDQG-HTFCKZLJSA-N 0.000 description 1
- YNMQUIVKEFRCPH-QSFUFRPTSA-N Ile-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(=O)O)N YNMQUIVKEFRCPH-QSFUFRPTSA-N 0.000 description 1
- GLLAUPMJCGKPFY-BLMTYFJBSA-N Ile-Ile-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 GLLAUPMJCGKPFY-BLMTYFJBSA-N 0.000 description 1
- WSSGUVAKYCQSCT-XUXIUFHCSA-N Ile-Met-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)O)N WSSGUVAKYCQSCT-XUXIUFHCSA-N 0.000 description 1
- ZUPJCJINYQISSN-XUXIUFHCSA-N Ile-Met-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N ZUPJCJINYQISSN-XUXIUFHCSA-N 0.000 description 1
- SAVXZJYTTQQQDD-QEWYBTABSA-N Ile-Phe-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SAVXZJYTTQQQDD-QEWYBTABSA-N 0.000 description 1
- WYUHAXJAMDTOAU-IAVJCBSLSA-N Ile-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N WYUHAXJAMDTOAU-IAVJCBSLSA-N 0.000 description 1
- KCTIFOCXAIUQQK-QXEWZRGKSA-N Ile-Pro-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O KCTIFOCXAIUQQK-QXEWZRGKSA-N 0.000 description 1
- SAEWJTCJQVZQNZ-IUKAMOBKSA-N Ile-Thr-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SAEWJTCJQVZQNZ-IUKAMOBKSA-N 0.000 description 1
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 1
- HZVRQFKRALAMQS-SLBDDTMCSA-N Ile-Trp-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZVRQFKRALAMQS-SLBDDTMCSA-N 0.000 description 1
- JZBVBOKASHNXAD-NAKRPEOUSA-N Ile-Val-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(=O)O)N JZBVBOKASHNXAD-NAKRPEOUSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 102100027670 Islet amyloid polypeptide Human genes 0.000 description 1
- PWWVAXIEGOYWEE-UHFFFAOYSA-N Isophenergan Chemical compound C1=CC=C2N(CC(C)N(C)C)C3=CC=CC=C3SC2=C1 PWWVAXIEGOYWEE-UHFFFAOYSA-N 0.000 description 1
- 241000235058 Komagataella pastoris Species 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- 229930064664 L-arginine Natural products 0.000 description 1
- 235000014852 L-arginine Nutrition 0.000 description 1
- 229930182816 L-glutamine Natural products 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- CZCSUZMIRKFFFA-CIUDSAMLSA-N Leu-Ala-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O CZCSUZMIRKFFFA-CIUDSAMLSA-N 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- QPRQGENIBFLVEB-BJDJZHNGSA-N Leu-Ala-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O QPRQGENIBFLVEB-BJDJZHNGSA-N 0.000 description 1
- FJUKMPUELVROGK-IHRRRGAJSA-N Leu-Arg-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N FJUKMPUELVROGK-IHRRRGAJSA-N 0.000 description 1
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 1
- IIKJNQWOQIWWMR-CIUDSAMLSA-N Leu-Cys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(C)C)N IIKJNQWOQIWWMR-CIUDSAMLSA-N 0.000 description 1
- WCTCIIAGNMFYAO-DCAQKATOSA-N Leu-Cys-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](C(C)C)C(O)=O WCTCIIAGNMFYAO-DCAQKATOSA-N 0.000 description 1
- ZTLGVASZOIKNIX-DCAQKATOSA-N Leu-Gln-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZTLGVASZOIKNIX-DCAQKATOSA-N 0.000 description 1
- LOLUPZNNADDTAA-AVGNSLFASA-N Leu-Gln-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LOLUPZNNADDTAA-AVGNSLFASA-N 0.000 description 1
- GLBNEGIOFRVRHO-JYJNAYRXSA-N Leu-Gln-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GLBNEGIOFRVRHO-JYJNAYRXSA-N 0.000 description 1
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 1
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 1
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 1
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- KTOIECMYZZGVSI-BZSNNMDCSA-N Leu-Phe-His Chemical compound C([C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CC=CC=C1 KTOIECMYZZGVSI-BZSNNMDCSA-N 0.000 description 1
- ODRREERHVHMIPT-OEAJRASXSA-N Leu-Thr-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ODRREERHVHMIPT-OEAJRASXSA-N 0.000 description 1
- GZRABTMNWJXFMH-UVOCVTCTSA-N Leu-Thr-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GZRABTMNWJXFMH-UVOCVTCTSA-N 0.000 description 1
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 1
- QESXLSQLQHHTIX-RHYQMDGZSA-N Leu-Val-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QESXLSQLQHHTIX-RHYQMDGZSA-N 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 239000006142 Luria-Bertani Agar Substances 0.000 description 1
- JCFYLFOCALSNLQ-GUBZILKMSA-N Lys-Ala-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O JCFYLFOCALSNLQ-GUBZILKMSA-N 0.000 description 1
- NFLFJGGKOHYZJF-BJDJZHNGSA-N Lys-Ala-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN NFLFJGGKOHYZJF-BJDJZHNGSA-N 0.000 description 1
- WSXTWLJHTLRFLW-SRVKXCTJSA-N Lys-Ala-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O WSXTWLJHTLRFLW-SRVKXCTJSA-N 0.000 description 1
- SWWCDAGDQHTKIE-RHYQMDGZSA-N Lys-Arg-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWWCDAGDQHTKIE-RHYQMDGZSA-N 0.000 description 1
- GGAPIOORBXHMNY-ULQDDVLXSA-N Lys-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)O GGAPIOORBXHMNY-ULQDDVLXSA-N 0.000 description 1
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 1
- ZQCVMVCVPFYXHZ-SRVKXCTJSA-N Lys-Asn-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN ZQCVMVCVPFYXHZ-SRVKXCTJSA-N 0.000 description 1
- YVSHZSUKQHNDHD-KKUMJFAQSA-N Lys-Asn-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N YVSHZSUKQHNDHD-KKUMJFAQSA-N 0.000 description 1
- LZWNAOIMTLNMDW-NHCYSSNCSA-N Lys-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCCN)N LZWNAOIMTLNMDW-NHCYSSNCSA-N 0.000 description 1
- FLCMXEFCTLXBTL-DCAQKATOSA-N Lys-Asp-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N FLCMXEFCTLXBTL-DCAQKATOSA-N 0.000 description 1
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 1
- GRADYHMSAUIKPS-DCAQKATOSA-N Lys-Glu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRADYHMSAUIKPS-DCAQKATOSA-N 0.000 description 1
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 1
- GPJGFSFYBJGYRX-YUMQZZPRSA-N Lys-Gly-Asp Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O GPJGFSFYBJGYRX-YUMQZZPRSA-N 0.000 description 1
- ISHNZELVUVPCHY-ZETCQYMHSA-N Lys-Gly-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O ISHNZELVUVPCHY-ZETCQYMHSA-N 0.000 description 1
- NKKFVJRLCCUJNA-QWRGUYRKSA-N Lys-Gly-Lys Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCCN NKKFVJRLCCUJNA-QWRGUYRKSA-N 0.000 description 1
- FGMHXLULNHTPID-KKUMJFAQSA-N Lys-His-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CN=CN1 FGMHXLULNHTPID-KKUMJFAQSA-N 0.000 description 1
- PGLGNCVOWIORQE-SRVKXCTJSA-N Lys-His-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O PGLGNCVOWIORQE-SRVKXCTJSA-N 0.000 description 1
- KEPWSUPUFAPBRF-DKIMLUQUSA-N Lys-Ile-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KEPWSUPUFAPBRF-DKIMLUQUSA-N 0.000 description 1
- RBEATVHTWHTHTJ-KKUMJFAQSA-N Lys-Leu-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O RBEATVHTWHTHTJ-KKUMJFAQSA-N 0.000 description 1
- ZJWIXBZTAAJERF-IHRRRGAJSA-N Lys-Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N ZJWIXBZTAAJERF-IHRRRGAJSA-N 0.000 description 1
- UQRZFMQQXXJTTF-AVGNSLFASA-N Lys-Lys-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O UQRZFMQQXXJTTF-AVGNSLFASA-N 0.000 description 1
- JQSIGLHQNSZZRL-KKUMJFAQSA-N Lys-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N JQSIGLHQNSZZRL-KKUMJFAQSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- WBSCNDJQPKSPII-KKUMJFAQSA-N Lys-Lys-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(O)=O WBSCNDJQPKSPII-KKUMJFAQSA-N 0.000 description 1
- YDDDRTIPNTWGIG-SRVKXCTJSA-N Lys-Lys-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O YDDDRTIPNTWGIG-SRVKXCTJSA-N 0.000 description 1
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 1
- WWEWGPOLIJXGNX-XUXIUFHCSA-N Lys-Met-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCCCN)N WWEWGPOLIJXGNX-XUXIUFHCSA-N 0.000 description 1
- JPYPRVHMKRFTAT-KKUMJFAQSA-N Lys-Phe-Cys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCCCN)N JPYPRVHMKRFTAT-KKUMJFAQSA-N 0.000 description 1
- WQDKIVRHTQYJSN-DCAQKATOSA-N Lys-Ser-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WQDKIVRHTQYJSN-DCAQKATOSA-N 0.000 description 1
- JHNOXVASMSXSNB-WEDXCCLWSA-N Lys-Thr-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O JHNOXVASMSXSNB-WEDXCCLWSA-N 0.000 description 1
- CAVRAQIDHUPECU-UVOCVTCTSA-N Lys-Thr-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CAVRAQIDHUPECU-UVOCVTCTSA-N 0.000 description 1
- IMDJSVBFQKDDEQ-MGHWNKPDSA-N Lys-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CCCCN)N IMDJSVBFQKDDEQ-MGHWNKPDSA-N 0.000 description 1
- VWPJQIHBBOJWDN-DCAQKATOSA-N Lys-Val-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O VWPJQIHBBOJWDN-DCAQKATOSA-N 0.000 description 1
- GILLQRYAWOMHED-DCAQKATOSA-N Lys-Val-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN GILLQRYAWOMHED-DCAQKATOSA-N 0.000 description 1
- 102000014944 Lysosome-Associated Membrane Glycoproteins Human genes 0.000 description 1
- 108010064171 Lysosome-Associated Membrane Glycoproteins Proteins 0.000 description 1
- 231100000002 MTT assay Toxicity 0.000 description 1
- 238000000134 MTT assay Methods 0.000 description 1
- BVXXDMUMHMXFER-BPNCWPANSA-N Met-Ala-Tyr Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVXXDMUMHMXFER-BPNCWPANSA-N 0.000 description 1
- MCNGIXXCMJAURZ-VEVYYDQMSA-N Met-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCSC)N)O MCNGIXXCMJAURZ-VEVYYDQMSA-N 0.000 description 1
- FVKRQMQQFGBXHV-QXEWZRGKSA-N Met-Asp-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O FVKRQMQQFGBXHV-QXEWZRGKSA-N 0.000 description 1
- PPHLBTXVBJNKOB-FDARSICLSA-N Met-Ile-Trp Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O PPHLBTXVBJNKOB-FDARSICLSA-N 0.000 description 1
- SODXFJOPSCXOHE-IHRRRGAJSA-N Met-Leu-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O SODXFJOPSCXOHE-IHRRRGAJSA-N 0.000 description 1
- RATXDYWHIYNZLE-DCAQKATOSA-N Met-Lys-Cys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CS)C(=O)O)N RATXDYWHIYNZLE-DCAQKATOSA-N 0.000 description 1
- XIGAHPDZLAYQOS-SRVKXCTJSA-N Met-Pro-Pro Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 XIGAHPDZLAYQOS-SRVKXCTJSA-N 0.000 description 1
- HLZORBMOISUNIV-DCAQKATOSA-N Met-Ser-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C HLZORBMOISUNIV-DCAQKATOSA-N 0.000 description 1
- DBMLDOWSVHMQQN-XGEHTFHBSA-N Met-Ser-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DBMLDOWSVHMQQN-XGEHTFHBSA-N 0.000 description 1
- WXJLBSXNUHIGSS-OSUNSFLBSA-N Met-Thr-Ile Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WXJLBSXNUHIGSS-OSUNSFLBSA-N 0.000 description 1
- ZBLSZPYQQRIHQU-RCWTZXSCSA-N Met-Thr-Val Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O ZBLSZPYQQRIHQU-RCWTZXSCSA-N 0.000 description 1
- 102000005741 Metalloproteases Human genes 0.000 description 1
- 108010006035 Metalloproteases Proteins 0.000 description 1
- 241000551546 Minerva Species 0.000 description 1
- 208000003445 Mouth Neoplasms Diseases 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 101100325747 Mus musculus Bak1 gene Proteins 0.000 description 1
- 101100284354 Mus musculus Hr gene Proteins 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 1
- 102000003945 NF-kappa B Human genes 0.000 description 1
- 108010057466 NF-kappa B Proteins 0.000 description 1
- 238000011789 NOD SCID mouse Methods 0.000 description 1
- 206010067482 No adverse event Diseases 0.000 description 1
- 102000002423 Octamer Transcription Factor-6 Human genes 0.000 description 1
- 108010068113 Octamer Transcription Factor-6 Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 239000012124 Opti-MEM Substances 0.000 description 1
- 102000007981 Ornithine carbamoyltransferase Human genes 0.000 description 1
- 101710198224 Ornithine carbamoyltransferase, mitochondrial Proteins 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 229930012538 Paclitaxel Natural products 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- KHGNFPUMBJSZSM-UHFFFAOYSA-N Perforine Natural products COC1=C2CCC(O)C(CCC(C)(C)O)(OC)C2=NC2=C1C=CO2 KHGNFPUMBJSZSM-UHFFFAOYSA-N 0.000 description 1
- 102100022239 Peroxiredoxin-6 Human genes 0.000 description 1
- YYKZDTVQHTUKDW-RYUDHWBXSA-N Phe-Gly-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)NCC(=O)N[C@@H](CCC(=O)N)C(=O)O)N YYKZDTVQHTUKDW-RYUDHWBXSA-N 0.000 description 1
- ONORAGIFHNAADN-LLLHUVSDSA-N Phe-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N ONORAGIFHNAADN-LLLHUVSDSA-N 0.000 description 1
- AUJWXNGCAQWLEI-KBPBESRZSA-N Phe-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O AUJWXNGCAQWLEI-KBPBESRZSA-N 0.000 description 1
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 1
- JTKGCYOOJLUETJ-ULQDDVLXSA-N Phe-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JTKGCYOOJLUETJ-ULQDDVLXSA-N 0.000 description 1
- 206010035226 Plasma cell myeloma Diseases 0.000 description 1
- 101100335198 Pneumocystis carinii fol1 gene Proteins 0.000 description 1
- 229920001213 Polysorbate 20 Polymers 0.000 description 1
- FYQSMXKJYTZYRP-DCAQKATOSA-N Pro-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 FYQSMXKJYTZYRP-DCAQKATOSA-N 0.000 description 1
- OOLOTUZJUBOMAX-GUBZILKMSA-N Pro-Ala-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O OOLOTUZJUBOMAX-GUBZILKMSA-N 0.000 description 1
- NHDVNAKDACFHPX-GUBZILKMSA-N Pro-Arg-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O NHDVNAKDACFHPX-GUBZILKMSA-N 0.000 description 1
- KDIIENQUNVNWHR-JYJNAYRXSA-N Pro-Arg-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KDIIENQUNVNWHR-JYJNAYRXSA-N 0.000 description 1
- ORPZXBQTEHINPB-SRVKXCTJSA-N Pro-Arg-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCNC(N)=N)NC(=O)[C@@H]1CCCN1)C(O)=O ORPZXBQTEHINPB-SRVKXCTJSA-N 0.000 description 1
- AMBLXEMWFARNNQ-DCAQKATOSA-N Pro-Asn-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@@H]1CCCN1 AMBLXEMWFARNNQ-DCAQKATOSA-N 0.000 description 1
- OLTFZQIYCNOBLI-DCAQKATOSA-N Pro-Cys-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)O OLTFZQIYCNOBLI-DCAQKATOSA-N 0.000 description 1
- JFNPBBOGGNMSRX-CIUDSAMLSA-N Pro-Gln-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O JFNPBBOGGNMSRX-CIUDSAMLSA-N 0.000 description 1
- WVOXLKUUVCCCSU-ZPFDUUQYSA-N Pro-Glu-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVOXLKUUVCCCSU-ZPFDUUQYSA-N 0.000 description 1
- WFHYFCWBLSKEMS-KKUMJFAQSA-N Pro-Glu-Phe Chemical compound N([C@@H](CCC(=O)O)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 WFHYFCWBLSKEMS-KKUMJFAQSA-N 0.000 description 1
- JMVQDLDPDBXAAX-YUMQZZPRSA-N Pro-Gly-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H]1CCCN1 JMVQDLDPDBXAAX-YUMQZZPRSA-N 0.000 description 1
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 1
- AFXCXDQNRXTSBD-FJXKBIBVSA-N Pro-Gly-Thr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O AFXCXDQNRXTSBD-FJXKBIBVSA-N 0.000 description 1
- QEWBZBLXDKIQPS-STQMWFEESA-N Pro-Gly-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QEWBZBLXDKIQPS-STQMWFEESA-N 0.000 description 1
- HAEGAELAYWSUNC-WPRPVWTQSA-N Pro-Gly-Val Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O HAEGAELAYWSUNC-WPRPVWTQSA-N 0.000 description 1
- AQSMZTIEJMZQEC-DCAQKATOSA-N Pro-His-Ser Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CO)C(=O)O AQSMZTIEJMZQEC-DCAQKATOSA-N 0.000 description 1
- MCWHYUWXVNRXFV-RWMBFGLXSA-N Pro-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 MCWHYUWXVNRXFV-RWMBFGLXSA-N 0.000 description 1
- LNICFEXCAHIJOR-DCAQKATOSA-N Pro-Ser-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LNICFEXCAHIJOR-DCAQKATOSA-N 0.000 description 1
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 1
- KIDXAAQVMNLJFQ-KZVJFYERSA-N Pro-Thr-Ala Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](C)C(O)=O KIDXAAQVMNLJFQ-KZVJFYERSA-N 0.000 description 1
- DLZBBDSPTJBOOD-BPNCWPANSA-N Pro-Tyr-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O DLZBBDSPTJBOOD-BPNCWPANSA-N 0.000 description 1
- FIDNSJUXESUDOV-JYJNAYRXSA-N Pro-Tyr-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O FIDNSJUXESUDOV-JYJNAYRXSA-N 0.000 description 1
- FUOGXAQMNJMBFG-WPRPVWTQSA-N Pro-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 FUOGXAQMNJMBFG-WPRPVWTQSA-N 0.000 description 1
- DGDCSVGVWWAJRS-AVGNSLFASA-N Pro-Val-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@@H]2CCCN2 DGDCSVGVWWAJRS-AVGNSLFASA-N 0.000 description 1
- FIODMZKLZFLYQP-GUBZILKMSA-N Pro-Val-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O FIODMZKLZFLYQP-GUBZILKMSA-N 0.000 description 1
- 241000589774 Pseudomonas sp. Species 0.000 description 1
- 241000270942 Rana pipiens Species 0.000 description 1
- 101100163901 Rattus norvegicus Asic2 gene Proteins 0.000 description 1
- 239000006146 Roswell Park Memorial Institute medium Substances 0.000 description 1
- ZUGXSSFMTXKHJS-ZLUOBGJFSA-N Ser-Ala-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O ZUGXSSFMTXKHJS-ZLUOBGJFSA-N 0.000 description 1
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 1
- HQTKVSCNCDLXSX-BQBZGAKWSA-N Ser-Arg-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O HQTKVSCNCDLXSX-BQBZGAKWSA-N 0.000 description 1
- HZWAHWQZPSXNCB-BPUTZDHNSA-N Ser-Arg-Trp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O HZWAHWQZPSXNCB-BPUTZDHNSA-N 0.000 description 1
- UBRXAVQWXOWRSJ-ZLUOBGJFSA-N Ser-Asn-Asp Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CO)N)C(=O)N UBRXAVQWXOWRSJ-ZLUOBGJFSA-N 0.000 description 1
- CTRHXXXHUJTTRZ-ZLUOBGJFSA-N Ser-Asp-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O CTRHXXXHUJTTRZ-ZLUOBGJFSA-N 0.000 description 1
- FFOKMZOAVHEWET-IMJSIDKUSA-N Ser-Cys Chemical compound OC[C@H](N)C(=O)N[C@@H](CS)C(O)=O FFOKMZOAVHEWET-IMJSIDKUSA-N 0.000 description 1
- MAWSJXHRLWVJEZ-ACZMJKKPSA-N Ser-Gln-Cys Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N MAWSJXHRLWVJEZ-ACZMJKKPSA-N 0.000 description 1
- GYXVUTAOICLGKJ-ACZMJKKPSA-N Ser-Glu-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N GYXVUTAOICLGKJ-ACZMJKKPSA-N 0.000 description 1
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 1
- JEHPKECJCALLRW-CUJWVEQBSA-N Ser-His-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JEHPKECJCALLRW-CUJWVEQBSA-N 0.000 description 1
- LQESNKGTTNHZPZ-GHCJXIJMSA-N Ser-Ile-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O LQESNKGTTNHZPZ-GHCJXIJMSA-N 0.000 description 1
- UBRMZSHOOIVJPW-SRVKXCTJSA-N Ser-Leu-Lys Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O UBRMZSHOOIVJPW-SRVKXCTJSA-N 0.000 description 1
- KJKQUQXDEKMPDK-FXQIFTODSA-N Ser-Met-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O KJKQUQXDEKMPDK-FXQIFTODSA-N 0.000 description 1
- RXSWQCATLWVDLI-XGEHTFHBSA-N Ser-Met-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O RXSWQCATLWVDLI-XGEHTFHBSA-N 0.000 description 1
- QMCDMHWAKMUGJE-IHRRRGAJSA-N Ser-Phe-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O QMCDMHWAKMUGJE-IHRRRGAJSA-N 0.000 description 1
- BVLGVLWFIZFEAH-BPUTZDHNSA-N Ser-Pro-Trp Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O BVLGVLWFIZFEAH-BPUTZDHNSA-N 0.000 description 1
- WLJPJRGQRNCIQS-ZLUOBGJFSA-N Ser-Ser-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O WLJPJRGQRNCIQS-ZLUOBGJFSA-N 0.000 description 1
- ILZAUMFXKSIUEF-SRVKXCTJSA-N Ser-Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 ILZAUMFXKSIUEF-SRVKXCTJSA-N 0.000 description 1
- FLMYSKVSDVHLEW-SVSWQMSJSA-N Ser-Thr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLMYSKVSDVHLEW-SVSWQMSJSA-N 0.000 description 1
- FHXGMDRKJHKLKW-QWRGUYRKSA-N Ser-Tyr-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=C(O)C=C1 FHXGMDRKJHKLKW-QWRGUYRKSA-N 0.000 description 1
- OQSQCUWQOIHECT-YJRXYDGGSA-N Ser-Tyr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OQSQCUWQOIHECT-YJRXYDGGSA-N 0.000 description 1
- IAOHCSQDQDWRQU-GUBZILKMSA-N Ser-Val-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IAOHCSQDQDWRQU-GUBZILKMSA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 102000012479 Serine Proteases Human genes 0.000 description 1
- 108010022999 Serine Proteases Proteins 0.000 description 1
- 102100021993 Sterol O-acyltransferase 1 Human genes 0.000 description 1
- 101000697584 Streptomyces lavendulae Streptothricin acetyltransferase Proteins 0.000 description 1
- 108091007178 TNFRSF10A Proteins 0.000 description 1
- 102000002933 Thioredoxin Human genes 0.000 description 1
- LVHHEVGYAZGXDE-KDXUFGMBSA-N Thr-Ala-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(=O)O)N)O LVHHEVGYAZGXDE-KDXUFGMBSA-N 0.000 description 1
- GLQFKOVWXPPFTP-VEVYYDQMSA-N Thr-Arg-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GLQFKOVWXPPFTP-VEVYYDQMSA-N 0.000 description 1
- JTEICXDKGWKRRV-HJGDQZAQSA-N Thr-Asn-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O JTEICXDKGWKRRV-HJGDQZAQSA-N 0.000 description 1
- NLJKZUGAIIRWJN-LKXGYXEUSA-N Thr-Asp-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N)O NLJKZUGAIIRWJN-LKXGYXEUSA-N 0.000 description 1
- MMTOHPRBJKEZHT-BWBBJGPYSA-N Thr-Cys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O MMTOHPRBJKEZHT-BWBBJGPYSA-N 0.000 description 1
- OYTNZCBFDXGQGE-XQXXSGGOSA-N Thr-Gln-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](C)C(=O)O)N)O OYTNZCBFDXGQGE-XQXXSGGOSA-N 0.000 description 1
- ZQUKYJOKQBRBCS-GLLZPBPUSA-N Thr-Gln-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O ZQUKYJOKQBRBCS-GLLZPBPUSA-N 0.000 description 1
- VYEHBMMAJFVTOI-JHEQGTHGSA-N Thr-Gly-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O VYEHBMMAJFVTOI-JHEQGTHGSA-N 0.000 description 1
- MSIYNSBKKVMGFO-BHNWBGBOSA-N Thr-Gly-Pro Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N1CCC[C@@H]1C(=O)O)N)O MSIYNSBKKVMGFO-BHNWBGBOSA-N 0.000 description 1
- KBBRNEDOYWMIJP-KYNKHSRBSA-N Thr-Gly-Thr Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KBBRNEDOYWMIJP-KYNKHSRBSA-N 0.000 description 1
- XTCNBOBTROGWMW-RWRJDSDZSA-N Thr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XTCNBOBTROGWMW-RWRJDSDZSA-N 0.000 description 1
- DCRHJDRLCFMEBI-RHYQMDGZSA-N Thr-Lys-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(O)=O DCRHJDRLCFMEBI-RHYQMDGZSA-N 0.000 description 1
- DXPURPNJDFCKKO-RHYQMDGZSA-N Thr-Lys-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DXPURPNJDFCKKO-RHYQMDGZSA-N 0.000 description 1
- KDGBLMDAPJTQIW-RHYQMDGZSA-N Thr-Met-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(=O)O)N)O KDGBLMDAPJTQIW-RHYQMDGZSA-N 0.000 description 1
- PZSDPRBZINDEJV-HTUGSXCWSA-N Thr-Phe-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O PZSDPRBZINDEJV-HTUGSXCWSA-N 0.000 description 1
- HSQXHRIRJSFDOH-URLPEUOOSA-N Thr-Phe-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O HSQXHRIRJSFDOH-URLPEUOOSA-N 0.000 description 1
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 1
- PRTHQBSMXILLPC-XGEHTFHBSA-N Thr-Ser-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PRTHQBSMXILLPC-XGEHTFHBSA-N 0.000 description 1
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 1
- WKGAAMOJPMBBMC-IXOXFDKPSA-N Thr-Ser-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WKGAAMOJPMBBMC-IXOXFDKPSA-N 0.000 description 1
- ZMYCLHFLHRVOEA-HEIBUPTGSA-N Thr-Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ZMYCLHFLHRVOEA-HEIBUPTGSA-N 0.000 description 1
- 102000000887 Transcription factor STAT Human genes 0.000 description 1
- 108050007918 Transcription factor STAT Proteins 0.000 description 1
- ICNFHVUVCNWUAB-SZMVWBNQSA-N Trp-Arg-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ICNFHVUVCNWUAB-SZMVWBNQSA-N 0.000 description 1
- VMBBTANKMSRJSS-JSGCOSHPSA-N Trp-Glu-Gly Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VMBBTANKMSRJSS-JSGCOSHPSA-N 0.000 description 1
- BEWOXKJJMBKRQL-AAEUAGOBSA-N Trp-Gly-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N BEWOXKJJMBKRQL-AAEUAGOBSA-N 0.000 description 1
- SVGAWGVHFIYAEE-JSGCOSHPSA-N Trp-Gly-Gln Chemical compound C1=CC=C2C(C[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O)=CNC2=C1 SVGAWGVHFIYAEE-JSGCOSHPSA-N 0.000 description 1
- 108060005989 Tryptase Proteins 0.000 description 1
- 102000001400 Tryptase Human genes 0.000 description 1
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 1
- 108060008683 Tumor Necrosis Factor Receptor Proteins 0.000 description 1
- 102100040115 Tumor necrosis factor receptor superfamily member 10C Human genes 0.000 description 1
- 102100040110 Tumor necrosis factor receptor superfamily member 10D Human genes 0.000 description 1
- 206010054094 Tumour necrosis Diseases 0.000 description 1
- 102400000731 Tumstatin Human genes 0.000 description 1
- VTFWAGGJDRSQFG-MELADBBJSA-N Tyr-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O VTFWAGGJDRSQFG-MELADBBJSA-N 0.000 description 1
- VFJIWSJKZJTQII-SRVKXCTJSA-N Tyr-Asp-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O VFJIWSJKZJTQII-SRVKXCTJSA-N 0.000 description 1
- XBWKCYFGRXKWGO-SRVKXCTJSA-N Tyr-Cys-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O XBWKCYFGRXKWGO-SRVKXCTJSA-N 0.000 description 1
- PMDWYLVWHRTJIW-STQMWFEESA-N Tyr-Gly-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 PMDWYLVWHRTJIW-STQMWFEESA-N 0.000 description 1
- DAOREBHZAKCOEN-ULQDDVLXSA-N Tyr-Leu-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O DAOREBHZAKCOEN-ULQDDVLXSA-N 0.000 description 1
- NSGZILIDHCIZAM-KKUMJFAQSA-N Tyr-Leu-Ser Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N NSGZILIDHCIZAM-KKUMJFAQSA-N 0.000 description 1
- HSBZWINKRYZCSQ-KKUMJFAQSA-N Tyr-Lys-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O HSBZWINKRYZCSQ-KKUMJFAQSA-N 0.000 description 1
- FMXFHNSFABRVFZ-BZSNNMDCSA-N Tyr-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O FMXFHNSFABRVFZ-BZSNNMDCSA-N 0.000 description 1
- SINRIKQYQJRGDQ-MEYUZBJRSA-N Tyr-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 SINRIKQYQJRGDQ-MEYUZBJRSA-N 0.000 description 1
- MDXLPNRXCFOBTL-BZSNNMDCSA-N Tyr-Ser-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MDXLPNRXCFOBTL-BZSNNMDCSA-N 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 102000003990 Urokinase-type plasminogen activator Human genes 0.000 description 1
- 208000002495 Uterine Neoplasms Diseases 0.000 description 1
- UEOOXDLMQZBPFR-ZKWXMUAHSA-N Val-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N UEOOXDLMQZBPFR-ZKWXMUAHSA-N 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- QHFQQRKNGCXTHL-AUTRQRHGSA-N Val-Gln-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QHFQQRKNGCXTHL-AUTRQRHGSA-N 0.000 description 1
- LAYSXAOGWHKNED-XPUUQOCRSA-N Val-Gly-Ser Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O LAYSXAOGWHKNED-XPUUQOCRSA-N 0.000 description 1
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 1
- ZTKGDWOUYRRAOQ-ULQDDVLXSA-N Val-His-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N ZTKGDWOUYRRAOQ-ULQDDVLXSA-N 0.000 description 1
- MJXNDRCLGDSBBE-FHWLQOOXSA-N Val-His-Trp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)O)N MJXNDRCLGDSBBE-FHWLQOOXSA-N 0.000 description 1
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- GVJUTBOZZBTBIG-AVGNSLFASA-N Val-Lys-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N GVJUTBOZZBTBIG-AVGNSLFASA-N 0.000 description 1
- IEBGHUMBJXIXHM-AVGNSLFASA-N Val-Lys-Met Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)O)N IEBGHUMBJXIXHM-AVGNSLFASA-N 0.000 description 1
- CXWJFWAZIVWBOS-XQQFMLRXSA-N Val-Lys-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N1CCC[C@@H]1C(=O)O)N CXWJFWAZIVWBOS-XQQFMLRXSA-N 0.000 description 1
- OFQGGTGZTOTLGH-NHCYSSNCSA-N Val-Met-Gln Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N OFQGGTGZTOTLGH-NHCYSSNCSA-N 0.000 description 1
- SSYBNWFXCFNRFN-GUBZILKMSA-N Val-Pro-Ser Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O SSYBNWFXCFNRFN-GUBZILKMSA-N 0.000 description 1
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- BZDGLJPROOOUOZ-XGEHTFHBSA-N Val-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N)O BZDGLJPROOOUOZ-XGEHTFHBSA-N 0.000 description 1
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 1
- VVIZITNVZUAEMI-DLOVCJGASA-N Val-Val-Gln Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCC(N)=O VVIZITNVZUAEMI-DLOVCJGASA-N 0.000 description 1
- IOUPEELXVYPCPG-UHFFFAOYSA-N Valylglycine Chemical compound CC(C)C(N)C(=O)NCC(O)=O IOUPEELXVYPCPG-UHFFFAOYSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-N acetic acid Substances CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010045350 alanyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 108010072788 angiogenin Proteins 0.000 description 1
- 230000008485 antagonism Effects 0.000 description 1
- 230000000844 anti-bacterial effect Effects 0.000 description 1
- 230000000118 anti-neoplastic effect Effects 0.000 description 1
- 230000003078 antioxidant effect Effects 0.000 description 1
- 238000003782 apoptosis assay Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000012736 aqueous medium Substances 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 108010072041 arginyl-glycyl-aspartic acid Proteins 0.000 description 1
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 1
- 108010091092 arginyl-glycyl-proline Proteins 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 108010092854 aspartyllysine Proteins 0.000 description 1
- 238000000376 autoradiography Methods 0.000 description 1
- VSRXQHXAPYXROS-UHFFFAOYSA-N azanide;cyclobutane-1,1-dicarboxylic acid;platinum(2+) Chemical compound [NH2-].[NH2-].[Pt+2].OC(=O)C1(C(O)=O)CCC1 VSRXQHXAPYXROS-UHFFFAOYSA-N 0.000 description 1
- PXXJHWLDUBFPOL-UHFFFAOYSA-N benzamidine Chemical compound NC(=N)C1=CC=CC=C1 PXXJHWLDUBFPOL-UHFFFAOYSA-N 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 108010025307 buforin II Proteins 0.000 description 1
- OQUUTERJWTYTHP-UHFFFAOYSA-N butanedioate;1h-tetrazol-1-ium Chemical compound [NH2+]1C=NN=N1.[NH2+]1C=NN=N1.[O-]C(=O)CCC([O-])=O OQUUTERJWTYTHP-UHFFFAOYSA-N 0.000 description 1
- 229910001424 calcium ion Inorganic materials 0.000 description 1
- 229960004562 carboplatin Drugs 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 239000006143 cell culture medium Substances 0.000 description 1
- 230000025084 cell cycle arrest Effects 0.000 description 1
- 230000006721 cell death pathway Effects 0.000 description 1
- 230000011712 cell development Effects 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 230000032823 cell division Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 230000015861 cell surface binding Effects 0.000 description 1
- 239000006285 cell suspension Substances 0.000 description 1
- 230000003833 cell viability Effects 0.000 description 1
- 239000000919 ceramic Substances 0.000 description 1
- PPAWRFGIFUUSAC-XIFNGFNVSA-N chembl441321 Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](CC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CNC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CNC(=O)[C@@H](NC(=O)[C@H](CCC(N)=O)NC(=O)CN)C(C)C PPAWRFGIFUUSAC-XIFNGFNVSA-N 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 229960004926 chlorobutanol Drugs 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- AGOYDEPGAOXOCK-KCBOHYOISA-N clarithromycin Chemical compound O([C@@H]1[C@@H](C)C(=O)O[C@@H]([C@@]([C@H](O)[C@@H](C)C(=O)[C@H](C)C[C@](C)([C@H](O[C@H]2[C@@H]([C@H](C[C@@H](C)O2)N(C)C)O)[C@H]1C)OC)(C)O)CC)[C@H]1C[C@@](C)(OC)[C@@H](O)[C@H](C)O1 AGOYDEPGAOXOCK-KCBOHYOISA-N 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 238000007398 colorimetric assay Methods 0.000 description 1
- 238000002648 combination therapy Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000003636 conditioned culture medium Substances 0.000 description 1
- 201000010918 connective tissue cancer Diseases 0.000 description 1
- 238000011254 conventional chemotherapy Methods 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 230000007402 cytotoxic response Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003413 degradative effect Effects 0.000 description 1
- 230000018044 dehydration Effects 0.000 description 1
- 238000006297 dehydration reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 150000002016 disaccharides Chemical class 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 239000002612 dispersion medium Substances 0.000 description 1
- 231100000371 dose-limiting toxicity Toxicity 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 229950000317 dulanermin Drugs 0.000 description 1
- 230000005684 electric field Effects 0.000 description 1
- 239000003792 electrolyte Substances 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000011067 equilibration Methods 0.000 description 1
- BEFDCLMNVWHSGT-UHFFFAOYSA-N ethenylcyclopentane Chemical compound C=CC1CCCC1 BEFDCLMNVWHSGT-UHFFFAOYSA-N 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 230000034725 extrinsic apoptotic signaling pathway Effects 0.000 description 1
- 230000006624 extrinsic pathway Effects 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 108010071644 fragmentin Proteins 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 239000010437 gem Substances 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 1
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 1
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 1
- 108010023364 glycyl-histidyl-arginine Proteins 0.000 description 1
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 239000005090 green fluorescent protein Substances 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 230000009036 growth inhibition Effects 0.000 description 1
- 239000003966 growth inhibitor Substances 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 229960002897 heparin Drugs 0.000 description 1
- 229920000669 heparin Polymers 0.000 description 1
- 230000002440 hepatic effect Effects 0.000 description 1
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 1
- 231100000304 hepatotoxicity Toxicity 0.000 description 1
- 238000004896 high resolution mass spectrometry Methods 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 229960000890 hydrocortisone Drugs 0.000 description 1
- 239000001863 hydroxypropyl cellulose Substances 0.000 description 1
- 235000010977 hydroxypropyl cellulose Nutrition 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000002779 inactivation Effects 0.000 description 1
- 230000006662 intracellular pathway Effects 0.000 description 1
- 238000007918 intramuscular administration Methods 0.000 description 1
- 238000007912 intraperitoneal administration Methods 0.000 description 1
- 108010027338 isoleucylcysteine Proteins 0.000 description 1
- 230000002147 killing effect Effects 0.000 description 1
- 239000000787 lecithin Substances 0.000 description 1
- 235000010445 lecithin Nutrition 0.000 description 1
- 229940067606 lecithin Drugs 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 208000012987 lip and oral cavity carcinoma Diseases 0.000 description 1
- 150000002632 lipids Chemical class 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 210000005229 liver cell Anatomy 0.000 description 1
- 230000007056 liver toxicity Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 239000008176 lyophilized powder Substances 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 108020004084 membrane receptors Proteins 0.000 description 1
- 102000006240 membrane receptors Human genes 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 108010085203 methionylmethionine Proteins 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 239000002480 mineral oil Substances 0.000 description 1
- 235000010446 mineral oil Nutrition 0.000 description 1
- 239000007758 minimum essential medium Substances 0.000 description 1
- 230000004065 mitochondrial dysfunction Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- PYLWMHQQBFSUBP-UHFFFAOYSA-N monofluorobenzene Chemical compound FC1=CC=CC=C1 PYLWMHQQBFSUBP-UHFFFAOYSA-N 0.000 description 1
- 238000010172 mouse model Methods 0.000 description 1
- 201000000050 myeloid neoplasm Diseases 0.000 description 1
- 210000000822 natural killer cell Anatomy 0.000 description 1
- 230000013649 negative regulation of histone acetylation Effects 0.000 description 1
- 210000000653 nervous system Anatomy 0.000 description 1
- 229910052759 nickel Inorganic materials 0.000 description 1
- HYWYRSMBCFDLJT-UHFFFAOYSA-N nimesulide Chemical compound CS(=O)(=O)NC1=CC=C([N+]([O-])=O)C=C1OC1=CC=CC=C1 HYWYRSMBCFDLJT-UHFFFAOYSA-N 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 238000011275 oncology therapy Methods 0.000 description 1
- 210000000287 oocyte Anatomy 0.000 description 1
- 230000005693 optoelectronics Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 229960001592 paclitaxel Drugs 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 229930192851 perforin Natural products 0.000 description 1
- 230000035699 permeability Effects 0.000 description 1
- 239000000546 pharmaceutical excipient Substances 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010091829 phenylalanyl-seryl-arginyl-seryl-leucyl-histidyl-seryl-leucyl-leucine Proteins 0.000 description 1
- 108010084572 phenylalanyl-valine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 229920005862 polyol Polymers 0.000 description 1
- 150000003077 polyols Chemical class 0.000 description 1
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 1
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 229950008882 polysorbate Drugs 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 230000002335 preservative effect Effects 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000001686 pro-survival effect Effects 0.000 description 1
- 230000005522 programmed cell death Effects 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 108010077112 prolyl-proline Proteins 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 108010053725 prolylvaline Proteins 0.000 description 1
- 210000005267 prostate cell Anatomy 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 239000012460 protein solution Substances 0.000 description 1
- 239000001047 purple dye Substances 0.000 description 1
- 239000002510 pyrogen Substances 0.000 description 1
- 239000010453 quartz Substances 0.000 description 1
- 238000001959 radiotherapy Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 210000003705 ribosome Anatomy 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 239000006152 selective media Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N silicon dioxide Inorganic materials O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 238000009097 single-agent therapy Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000002195 soluble material Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 239000004334 sorbic acid Substances 0.000 description 1
- 229940075582 sorbic acid Drugs 0.000 description 1
- 235000010199 sorbic acid Nutrition 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000002798 spectrophotometry method Methods 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- RCINICONZNJXQF-MZXODVADSA-N taxol Chemical compound O([C@@H]1[C@@]2(C[C@@H](C(C)=C(C2(C)C)[C@H](C([C@]2(C)[C@@H](O)C[C@H]3OC[C@]3([C@H]21)OC(C)=O)=O)OC(=O)C)OC(=O)[C@H](O)[C@@H](NC(=O)C=1C=CC=CC=1)C=1C=CC=CC=1)O)C(=O)C1=CC=CC=C1 RCINICONZNJXQF-MZXODVADSA-N 0.000 description 1
- 125000003831 tetrazolyl group Chemical group 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- RTKIYNMVFMVABJ-UHFFFAOYSA-L thimerosal Chemical compound [Na+].CC[Hg]SC1=CC=CC=C1C([O-])=O RTKIYNMVFMVABJ-UHFFFAOYSA-L 0.000 description 1
- 229940033663 thimerosal Drugs 0.000 description 1
- 108060008226 thioredoxin Proteins 0.000 description 1
- 229940094937 thioredoxin Drugs 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 150000003626 triacylglycerols Chemical class 0.000 description 1
- YNJBWRMUSHSURL-UHFFFAOYSA-N trichloroacetic acid Chemical compound OC(=O)C(Cl)(Cl)Cl YNJBWRMUSHSURL-UHFFFAOYSA-N 0.000 description 1
- 229960004319 trichloroacetic acid Drugs 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 108010084932 tryptophyl-proline Proteins 0.000 description 1
- 102000003298 tumor necrosis factor receptor Human genes 0.000 description 1
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 1
- 238000000539 two dimensional gel electrophoresis Methods 0.000 description 1
- 108010012374 type IV collagen alpha3 chain Proteins 0.000 description 1
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 1
- 210000003606 umbilical vein Anatomy 0.000 description 1
- 229960005356 urokinase Drugs 0.000 description 1
- RUDATBOHQWOJDD-UZVSRGJWSA-N ursodeoxycholic acid Chemical compound C([C@H]1C[C@@H]2O)[C@H](O)CC[C@]1(C)[C@@H]1[C@@H]2[C@@H]2CC[C@H]([C@@H](CCC(O)=O)C)[C@@]2(C)CC1 RUDATBOHQWOJDD-UZVSRGJWSA-N 0.000 description 1
- 229960001661 ursodiol Drugs 0.000 description 1
- 206010046766 uterine cancer Diseases 0.000 description 1
- IBIDRSSEHFLGSD-UHFFFAOYSA-N valinyl-arginine Natural products CC(C)C(N)C(=O)NC(C(O)=O)CCCN=C(N)N IBIDRSSEHFLGSD-UHFFFAOYSA-N 0.000 description 1
- 108010073969 valyllysine Proteins 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 239000008158 vegetable oil Substances 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 239000012224 working solution Substances 0.000 description 1
- 238000002689 xenotransplantation Methods 0.000 description 1
- 239000011592 zinc chloride Substances 0.000 description 1
- 235000005074 zinc chloride Nutrition 0.000 description 1
- JIAARYAFYJHUJI-UHFFFAOYSA-L zinc dichloride Chemical compound [Cl-].[Cl-].[Zn+2] JIAARYAFYJHUJI-UHFFFAOYSA-L 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K19/00—Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/70575—NGF/TNF-superfamily, e.g. CD70, CD95L, CD153, CD154
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/17—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- A61K38/19—Cytokines; Lymphokines; Interferons
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/17—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- A61K38/19—Cytokines; Lymphokines; Interferons
- A61K38/191—Tumor necrosis factors [TNF], e.g. lymphotoxin [LT], i.e. TNF-beta
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P43/00—Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/4747—Apoptosis related proteins
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/52—Cytokines; Lymphokines; Interferons
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/52—Cytokines; Lymphokines; Interferons
- C07K14/525—Tumour necrosis factor [TNF]
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/795—Porphyrin- or corrin-ring-containing peptides
- C07K14/80—Cytochromes
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K7/00—Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
- C07K7/04—Linear peptides containing only normal peptide links
- C07K7/06—Linear peptides containing only normal peptide links having 5 to 11 amino acids
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K7/00—Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
- C07K7/04—Linear peptides containing only normal peptide links
- C07K7/08—Linear peptides containing only normal peptide links having 12 to 20 amino acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/62—DNA sequences coding for fusion proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/48—Hydrolases (3) acting on peptide bonds (3.4)
- C12N9/50—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
- C12N9/64—Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/17—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K38/00—Medicinal preparations containing peptides
- A61K38/16—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- A61K38/43—Enzymes; Proenzymes; Derivatives thereof
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/036—Fusion polypeptide containing a localisation/targetting motif targeting to the medium outside of the cell, e.g. type III secretion
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/04—Fusion polypeptide containing a localisation/targetting motif containing an ER retention signal such as a C-terminal HDEL motif
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/07—Fusion polypeptide containing a localisation/targetting motif containing a mitochondrial localisation signal
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/09—Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/50—Fusion polypeptide containing protease site
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biophysics (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Gastroenterology & Hepatology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Toxicology (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Animal Behavior & Ethology (AREA)
- Pharmacology & Pharmacy (AREA)
- Epidemiology (AREA)
- Cell Biology (AREA)
- General Chemical & Material Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Peptides Or Proteins (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
hTRAIL95보다 낮지 않은 위치에 있는 아미노산으로부터 시작하는 가용성 hTRAIL 단백질 서열 또는 그와 70% 이상의 상동성을 갖는 서열의 기능 분절인 도메인 (a); 및 세포사멸 유발 효과기 펩티드의 서열인 도메인 (b)를 포함하는 융합 단백질, 특히 재조합 융합 단백질로서, 여기에서 상기 도메인 (b)의 서열은 상기 도메인 (a)의 C-말단 및/또는 N-말단에 부착된다. 상기 융합 단백질은 항암 활성을 갖는다. 상기 융합 단백질을 코딩하는 뉴클레오티드 서열, 상기 융합 단백질의 제조를 위한 발현 벡터 및 숙주 세포, 암 질환의 치료를 위한 융합 단백질의 용도에 관한 것이다.
Description
본 발명은 치료학적 융합 단백질, 특히 재조합 융합 단백질 분야에 관한 것이다. 특히 더, 본 발명은 짧은 세포사멸 유발(proapoptotic) 펩티드의 서열과 조합된 가용성 인간 TRAIL 단백질 서열의 분절(fragment)을 함유하는 융합 단백질, 그를 함유하는 약제학적 조성물, 치료, 특히 항암제로서의 그의 용도, 및 융합 단백질을 코딩하는 폴리뉴클레오티드 서열, 폴리뉴클레오티드 서열을 함유하는 발현 벡터, 및 이들 발현 벡터를 함유하는 숙주 세포에 관한 것이다.
세포사멸(세포 예정사(programmed cell death))은 비정상적인 암세포의 세포사멸을 유도하는 약제를 사용함에 의한 암 예방 및 암 치료에 중요한 역할을 하는 과정이다.
세포사멸(apoptosis)에 대한 신호화는 세포 외측(외인성 또는 사멸 수용체(death receptor) 경로) 또는 세포 내측(내인성 또는 미토콘드리아 경로)에서 개시될 수 있다.
인간 암세포에서 외인성 세포사멸 경로의 활성화는 수용체를 활성화하기 위해 세포사멸 수용체에 의한 리간드의 결합이 필요하다. 리간드의 결합시, 활성화된 수용체는 세포사멸 신호를 유도한다.
미토콘드리아 경로에 의한 세포 내측에서 내인성 세포사멸의 개시는 상이한 레벨의 세포사멸 캐스케이드에서 개시되어 최종적으로 세포사멸 생성 유발(proapoptogenic) 단백질(시토크롬 c, SmacDiablo, AlF, p53, BH3 도메인 패밀리를 포함하는 Bcl2 단백질 패밀리)의 기능, 핵산 분해 또는 카스파제의 활성화를 유도 또는 복원할 수 있다.
Apo2L(Apo2-리간드)로도 알려진, 사이토카인 패밀리(리간드를 유도하는 세포사멸 연관-종양 괴사 인자)에 속하는 TRAIL 단백질은 바이러스에 의해 감염된 세포 및 종양 세포에서 세포사멸의 강력한 활성제이다. TRAIL은 체내에서 자연적으로 발생하는 리간드이다. TRAIL 단백질, 그의 아미노산 서열, 코딩 DNA 서열 및 단백질 발현 시스템은 EP0835305A1호에서 처음으로 기술되었다.
TRAIL 단백질은 세포사멸 유발 TRAIL 표면 수용체 1 및 2(TRAIL-R1/R2)에 결합 및 이들 수용체의 후속하는 활성화로 그의 항암 활성을 나타낸다. DR4 및 DR5로도 알려진 이들 수용체(사멸 수용체 4 및 사멸 수용체 5)는 TNF 수용체 패밀리에 속하며 상이한 타입의 암세포에 의해 과발현된다. 수용체의 활성화는 실행 카스파제의 활성화 및 그에 의한 핵산의 분해를 초래하는 활성화된 카스파제-8에 의해, 억제 유전자 p53으로부터 독립한 세포사멸의 외부 신호화 경로를 유도할 수 있다. TRAIL 활성화에서 방출된 카스파제-8은 또한 Bid 단백질의 방출 및 그에 의한 미토콘드리아 경로의 간접적인 활성화를 야기할 수 있으며, Bid 단백질은 미토콘드리아로 전위되고, 이것은 시토크롬 c의 방출을 자극하여, 사멸 수용체로부터 세포사멸 신호를 간접적으로 증폭시킨다.
TRAIL은 이 단백질에 내성인 건강한 세포 내에서의 세포사멸을 필수적으로 유도함이 없이 종양 세포에 선택적으로 작용한다. 그러므로, TRAIL의 엄청난 잠재력은 혈액암 및 고형 종양을 포함하는 광범위하고 상이한 타입의 종양 세포에 작용하며 동시에 정상 세포에는 영향을 주지않으며 잠재적으로 상당히 작은 부작용을 나타내는 항암제로 인식되었다.
TRAIL 단백질은 281 아미노산 길이를 갖는 타입 II 막 단백질이며 프로테아제에 의한 절단시 아미노산 잔기 114-281을 포함하는 그의 세포외 영역은 생물학적으로도 또한 활성인 20 kDa 크기의 가용성 sTRAIL 분자를 형성한다. TRAIL 및 sTRAIL 형태 양자는 표적(target) 세포 상에 존재하는 TRAIL 수용체와의 상호 작용을 통해 세포사멸을 촉발할 수 있다. TRAIL 분자의 가용성 부분의 강한 항종양 활성 및 매우 낮은 전신 독성은 세포주(cell lines) 시험을 사용하여 입증되었다. 또한, INN 둘라너민(dulanermin)으로 알려진 hTRAIL의 아미노산 114-281에 상응하는 아미노산 서열을 갖는 재조합 인간 가용성 TRAIL(rhTRAIL)에 관한 인간 임상 연구는 그의 양호한 내성 및 용량 제한 독성의 부재를 보여주었다.
최근 연구는 TRAIL 단백질이 아미노산 114-281보다 더 짧은 형태를 가질 수 있으며, 또한 이러한 형태는 DR 패밀리의 막 수용체와 결합할 수 있으며(사멸 수용체(death receptor), DR1 , DR2 , DcR1 , DcR2 및 OPG ) 이들 수용체를 통해 세포사멸을 유도할 수 있다는 것을 보여준다(F., FANG , A., WANG , S.,F., YANG , Antitumor activity of a novel recombinant mutant human tumor necrosis factor -related apoptosis-inducing ligand (신규 재조합 돌연변이 인간 종양 괴사 인자 연관 세포사멸 유도 리간의 항종양 활성), Acta Pharmacologica Sinica 2005 Nov ; 26 (11): 1373-1381).
현재 보고된 간 세포 상의 재조합 TRAIL 단백질의 독성 효과는 변형(modification), 즉 전신 독성을 나타내지 않는 태그되지 않은 TRAIL인 폴리히스티딘 태그의 존재와 연관되는 것으로 나타난다.
그러나, 추가의 연구 및 개발 중에, 많은 암세포가 TRAIL에 대한 원발성 또는 후천성 내성을 또한 보여주는 것으로 나타났다(예를 들어 WO2007/022214호 참조). TRAIL에 대한 내성의 메커니즘이 완전하게 이해되어 지진 않았지만, 세포 표면상의 수용체의 레벨로부터 신호 경로 내의 실행 카스파제까지의 범위인 상이한 레벨에서, TRAIL-유도 세포사멸 경로에 의해, 그 자체는 명백할 수 있는 것으로 믿어진다. 이러한 내성은 항암제로서의 TRAIL의 유용성을 제한한다.
더욱이, 환자에 대한 임상 실험에서 단일 요법으로서의 TRAIL의 실제 효능은 낮은 것으로 입증되었다. 이러한 TRAIL에 대한 종양의 낮은 효능 및 내성을 극복하기 위하여, 다양한 조합 요법이 방사- 및 화학 요법제로 제작되었으며, 이것은 상승적인 세포사멸 효과를 초래하였다(WO2009/002947호; A. Almasan 및 A. Ashkenazi, Cytokine Growth Factor Reviews 14(2003) 337-348; RK Srivastava, Neoplasis, Vol 3, No 6, 2001, 535-546, Soria JC 등, J. Clin. Oncology, Vol 28, No 9(2010), p.1527-1533). 선택된 통상의 화학 요법제(파클리탁셀(paclitaxel), 카르보플라틴(carboplatin)) 및 단일클론 항-VEGF 항체와의 조합에 의한 암치료를 위한 rhTRAIL의 용도는 WO2009/140469호에 기술되어 있다. 그러나, 이러한 조합은 종래의 화학 요법 또는 방사선 요법의 공지된 결함을 필수적으로 내포한다.
메탈로프로테아제 절단 부위 링커(linker)로 연결된 TRAIL 및 혈관 형성 억제제 바소스타틴의 서열을 함유하는 조립된(constructed) 융합 단백질은 A.I. Guo 등에 의해 「Chinese Journal of Biochemistry 및 Molecular Biology 2008, vol. 24(10), 925-930」에 종양 세포 내에서 세포사멸-유도 효과를 나타내는 것으로 기술되었다.
혈관 형성 억제제 툼스타틴(tumstatin)의 서열 툼스타틴183-230 및 TRAIL114-281을 함유하는 조립된 융합 단백질은 N.Ren 등에 의해 「Academic Journal of Second Military Medical University 2008, vol. 28(5), 676-478」에 췌장 암세포의 세포사멸의 유도를 나타내는 것으로 기술되었다.
US2005/244370호 및 대응하는 WO2004/035794호는 세포 표면 결합 도메인으로서 TNF 패밀리 리간드 CD40의 또 다른 멤버의 세포외 부분과 펩티드 링커에 의해 연결된 효과기(effector) 도메인으로서 TRAIL95-281의 구조물을 기술한다. 구조물의 활성화는 그의 CD40 부분의 결합을 통해서인 것으로 서술되어 있다.
더욱이, TRAIL 요법과 관련된 문제는 그의 낮은 안정성 및 투여 후 신체로부터의 신속한 제거로 입증되었다.
많은 임상학적 암 요법이 현재 유용하지만, 이들은 종종 효과가 불충분하며 공지된 많은 단점을 가지며, 이들 중, 가장 치료를 난처하게 하고 제한하는 것은 치료 동안 암세포에 대한 선택성 결여, 심한 부작용 및 원발성 또는 후천성 내성이다. 현재, 암세포에 효과적이고 동시에 선택적인 제한된 수의 항암제가 공지되어 있다. 그러므로, 이용 가능한 약제의 범위를 넓히고 더욱 효과적(세포 독성) 및 선택적인 약제를 알아내도록 할 수 있는 신규 항암제에 대한 다급하고 충족되지 않은 필요성이 남아있다. 또한, 증진된 안정성 및 개선된 약물 동태를 갖는 신규 선택적 약제에 대한 필요성이 있다.
본 발명은 TRAIL의 작용을 강화 또는 보완하는 내인성(세포 내) 또는 외인성(세포외) 세포사멸 유발 활성을 갖는 TRAIL 분절을 포함하지 않는 짧은 효과기 펩티드 도메인 및 TRAIL로부터 유도된 도메인을 함유하는 신규 융합 단백질을 제공함으로써 이 문제의 해결을 제시한다. 더욱이, 많은 경우 본 발명의 융합 단백질은 가용성 TRAIL 및 서열의 분절을 포함하는 그의 변이체보다 더 강력한 활성을 나타내며, 많은 경우 또한 TRAIL에 대한 내성을 극복하는 것으로 판명되었다. 더욱이, 효과기 펩티드의 첨가는 반감기 연장 및 종양 내에서 단백질의 보유 증가 및 최종적으로 그의 효율 증가를 초래한다.
본 발명은 지금부터 하기 도면을 참고로 하여 상세히 기술될 것이다.
도 1은 실시예 1, 실시예 2, 실시예 3, 실시예 4 및 실시예 5에 따른 본 발명의 융합 단백질의 개략적 구조를 나타낸다.
도 2는 실시예 6, 실시예 7, 실시예 8, 실시예 9 및 실시예 10에 따른 본 발명의 융합 단백질의 개략적 구조를 나타낸다.
도 3은 실시예 11, 실시예 12, 실시예 13, 실시예 14 및 실시예 15에 따른 본 발명의 융합 단백질의 개략적 구조를 나타낸다.
도 4는 실시예 16, 실시예 17, 실시예 18, 실시예 19 및 실시예 20에 따른 본 발명의 융합 단백질의 개략적 구조를 나타낸다.
도 5는 실시예 21, 실시예 22, 및 실시예 23에 따른 본 발명의 융합 단백질, 뿐만 아니라 실시예 24, 실시예 25 및 실시예 26의 비교 융합 단백질의 개략적 구조를 나타낸다.
도 6은 실시예 27, 실시예 28, 실시예 29, 실시예 30 및 실시예 31에 따른 본 발명의 융합 단백질의 개략적 구조를 나타낸다.
도 7은 실시예 32, 실시예 33, 실시예 34, 실시예 35 및 실시예 36에 따른 본 발명의 융합 단백질의 개략적 구조를 나타낸다.
도 8은 실시예 37, 실시예 38, 실시예 39, 실시예 40 및 실시예 41에 따른 본 발명의 융합 단백질의 개략적 구조를 나타낸다.
도 9는 실시예 42, 실시예 43, 실시예 44, 실시예 45 및 실시예 46에 따른 본 발명의 융합 단백질의 개략적 구조를 나타낸다.
도 10은 실시예 47, 실시예 48, 실시예 49, 실시예 50 및 실시예 51에 따른 본 발명의 융합 단백질의 개략적 구조를 나타낸다.
도 11은 실시예 52, 실시예 53, 실시예 54, 및 실시예 55에 따른 본 발명의 융합 단백질의 개략적 구조를 나타낸다.
도 12는 hTRAIL114-281과 비교된 본 발명의 융합 단백질로 처리된 대장암 Colo205이 존재하는 SCID/NOD 마우스의 시간에 따른 종양 부피 변화를 나타낸다.
도 13은 hTRAIL114-281과 비교된 실험 29일에 본 발명의 융합 단백질로 처리된 대장암 Colo205가 존재하는 마우스의 종양 성장 억제 값을 나타낸다.
도 14는 hTRAIL114-281과 비교된 본 발명의 융합 단백질로 처리된 인간 폐암 NCI-H460이 존재하는 마우스 Crl:SHO-PrkdcscidHrhr의 시간에 따른 종양 부피 변화를 나타낸다.
도 15는 hTRAIL114-281과 비교된 실험 29일에 본 발명의 융합 단백질로 처리된 인간 폐암 NCI-H460이 존재하는 마우스의 종양 성장 억제를 나타낸다.
도 16은 hTRAIL114-281과 비교된 본 발명의 융합 단백질로 처리된 인간 소세포 폐암 A549가 존재하는 마우스 Crl:SHO-PrkdcscidHrhr의 시간에 따른 종양 부피 변화를 나타낸다.
도 17은 hTRAIL114-281과 비교된 실험 34일에 본 발명의 융합 단백질로 처리된 인간 소세포 폐암 A549가 존재하는 마우스의 종양 성장 억제를 나타낸다.
도 18은 hTRAIL114-281과 비교된 본 발명의 융합 단백질로 처리된 인간 췌장 암종, 상피성(epithelial-like) 세포주 PANC-1이 존재하는 마우스Crl:SHO-PrkdcscidHrhr의 시간에 따른 종양 부피 변화를 나타낸다.
도 19는 hTRAIL114-281과 비교된 실험 43일에 본 발명의 융합 단백질로 처리된 인간 췌장 암종, 상피성 세포주 PANC-1이 존재하는 마우스의 종양 성장 억제를 나타낸다.
도 20은 특정 타원율로 나타낸 rhTRAI114-281 및 실시예 1, 실시예 2, 실시예 14, 실시예 24, 실시예 51 및 실시예 42의 융합 단백질에 대한 원편광 이색성 스펙트럼을 나타낸다.
도 1은 실시예 1, 실시예 2, 실시예 3, 실시예 4 및 실시예 5에 따른 본 발명의 융합 단백질의 개략적 구조를 나타낸다.
도 2는 실시예 6, 실시예 7, 실시예 8, 실시예 9 및 실시예 10에 따른 본 발명의 융합 단백질의 개략적 구조를 나타낸다.
도 3은 실시예 11, 실시예 12, 실시예 13, 실시예 14 및 실시예 15에 따른 본 발명의 융합 단백질의 개략적 구조를 나타낸다.
도 4는 실시예 16, 실시예 17, 실시예 18, 실시예 19 및 실시예 20에 따른 본 발명의 융합 단백질의 개략적 구조를 나타낸다.
도 5는 실시예 21, 실시예 22, 및 실시예 23에 따른 본 발명의 융합 단백질, 뿐만 아니라 실시예 24, 실시예 25 및 실시예 26의 비교 융합 단백질의 개략적 구조를 나타낸다.
도 6은 실시예 27, 실시예 28, 실시예 29, 실시예 30 및 실시예 31에 따른 본 발명의 융합 단백질의 개략적 구조를 나타낸다.
도 7은 실시예 32, 실시예 33, 실시예 34, 실시예 35 및 실시예 36에 따른 본 발명의 융합 단백질의 개략적 구조를 나타낸다.
도 8은 실시예 37, 실시예 38, 실시예 39, 실시예 40 및 실시예 41에 따른 본 발명의 융합 단백질의 개략적 구조를 나타낸다.
도 9는 실시예 42, 실시예 43, 실시예 44, 실시예 45 및 실시예 46에 따른 본 발명의 융합 단백질의 개략적 구조를 나타낸다.
도 10은 실시예 47, 실시예 48, 실시예 49, 실시예 50 및 실시예 51에 따른 본 발명의 융합 단백질의 개략적 구조를 나타낸다.
도 11은 실시예 52, 실시예 53, 실시예 54, 및 실시예 55에 따른 본 발명의 융합 단백질의 개략적 구조를 나타낸다.
도 12는 hTRAIL114-281과 비교된 본 발명의 융합 단백질로 처리된 대장암 Colo205이 존재하는 SCID/NOD 마우스의 시간에 따른 종양 부피 변화를 나타낸다.
도 13은 hTRAIL114-281과 비교된 실험 29일에 본 발명의 융합 단백질로 처리된 대장암 Colo205가 존재하는 마우스의 종양 성장 억제 값을 나타낸다.
도 14는 hTRAIL114-281과 비교된 본 발명의 융합 단백질로 처리된 인간 폐암 NCI-H460이 존재하는 마우스 Crl:SHO-PrkdcscidHrhr의 시간에 따른 종양 부피 변화를 나타낸다.
도 15는 hTRAIL114-281과 비교된 실험 29일에 본 발명의 융합 단백질로 처리된 인간 폐암 NCI-H460이 존재하는 마우스의 종양 성장 억제를 나타낸다.
도 16은 hTRAIL114-281과 비교된 본 발명의 융합 단백질로 처리된 인간 소세포 폐암 A549가 존재하는 마우스 Crl:SHO-PrkdcscidHrhr의 시간에 따른 종양 부피 변화를 나타낸다.
도 17은 hTRAIL114-281과 비교된 실험 34일에 본 발명의 융합 단백질로 처리된 인간 소세포 폐암 A549가 존재하는 마우스의 종양 성장 억제를 나타낸다.
도 18은 hTRAIL114-281과 비교된 본 발명의 융합 단백질로 처리된 인간 췌장 암종, 상피성(epithelial-like) 세포주 PANC-1이 존재하는 마우스Crl:SHO-PrkdcscidHrhr의 시간에 따른 종양 부피 변화를 나타낸다.
도 19는 hTRAIL114-281과 비교된 실험 43일에 본 발명의 융합 단백질로 처리된 인간 췌장 암종, 상피성 세포주 PANC-1이 존재하는 마우스의 종양 성장 억제를 나타낸다.
도 20은 특정 타원율로 나타낸 rhTRAI114-281 및 실시예 1, 실시예 2, 실시예 14, 실시예 24, 실시예 51 및 실시예 42의 융합 단백질에 대한 원편광 이색성 스펙트럼을 나타낸다.
발명의 상세한 설명
본 발명은 하기를 포함하는 융합 단백질에 관한 것이다:
hTRAIL95보다 낮지 않은 위치에 있는 아미노산으로부터 시작하는 분절인 가용성 hTRAIL 단백질 서열의 기능 분절인 도메인 (a), 및
내인성 세포사멸 경로를 통해 그의 세포사멸 유발 작용을 실행하는, 세포사멸 유발 효과기 펩티드의 서열인 도메인 (b), 여기에서 도메인 (b)의 서열은 도메인 (a)의 C-말단 및/또는 N-말단에 부착된다.
용어 "가용성 hTRAIL 서열의 기능 가용성 분절(the functional soluble fragment of a sequence of soluble hTRAIL)"은 세포사멸 신호를 유도할 수 있는 이러한 가용성 hTRAIL의 분절을 나타내는 것으로 이해되어야 한다.
본 발명에 따른 용어 "펩티드"는 펩티드 결합을 통해 함께 연결된 복수의 아미노산으로부터의 분자 빌트(molecule built)로 이해되어야 한다. 따라서, 본 발명에 따른 용어 "펩티드"는 올리고펩티드, 폴리펩티드 및 단백질을 포함한다.
본 발명의 융합 단백질에서 효과기 펩티드의 도메인 (b)는 hTRAIL 단백질도 아니고 hTRAIL 단백질의 일부도 아니라는 것을 이해하여야 한다.
본 발명에서 펩티드의 아미노산 서열은 펩티드의 N-말단(N-종결)에서 그의 C-말단(C-종결) 쪽으로의 방향으로 당업계에서 채택되는 통상의 방식으로 존재할 것이다. 그러므로, 임의의 서열은 왼쪽 측 상에 그의 N-말단 및 오른쪽 측 상에 C-말단을 가질 것이다.
본 발명의 융합 단백질은 도메인 (a)의 C-말단 또는 N-말단에 부착된 효과기 펩티드의 단일 도메인 (b)를 포함할 수 있다.
본 발명의 융합 단백질은 도메인 (b) 중 하나가 도메인 (a)의 C-말단에 부착되고 다른 하나는 도메인 (a)의 N-말단에 부착된, 효과기 펩티드의 두 도메인 (b)도 또한 함유할 수 있다.
본 발명의 융합 단백질이 효과기 펩티드의 두 도메인 (b)를 포함할 때, 이들 도메인은 동일하거나 상이할 수 있다. 바람직하게는, 이 경우 도메인 (b)가 상이한 것이다.
특정 실시 양태에서, 도메인 (a)는 hTRAIL114에서 hTRAIL121까지의 범위의 아미노산으로부터 시작하여, 아미노산 hTRAIL281상에서 종결하는 hTRAIL 서열의 분절, 또는 수탁 번호 제P50591호로 젠뱅크에 게재된 hTRAIL 서열의 기타 기능 분절이다.
특히, 도메인 (a)는 hTRAIL114-281(서열 번호 27), hTRAIL119-281(서열 번호 28), 및 hTRAIL121-281(서열 번호 29), hTRAIL116-281 및 hTRAIL120-281에 상응하는 서열로 이루어진 군으로부터 선택될 수 있다.
또 다른 실시 양태에서, 도메인 (a)는 서열 hTRAIL95-281일 수 있다.
내인성 세포사멸 경로(세포 내)를 통해 그의 세포사멸 활성을 나타내는 도메인 (b)의 세포사멸 유발 효과기 펩티드는 세포사멸의 미토콘드리아 경로의 신호화 캐스케이드 성분을 활성화에 의해, 또는 세포 내에서 미토콘드리아 세포사멸의 직접적인 유도에 의해 직접적으로 세포사멸을 유도할 수 있다.
본 발명의 융합 단백질의 실시 양태에서, 효과기 펩티드는 하기로 이루어진 군으로부터 선택된 내인성 세포사멸 경로를 통해 작용하는 펩티드이다: 서열 번호 30, 서열 번호 31, 서열 번호 32, 서열 번호 33, 서열 번호 34, 서열 번호 35, 서열 번호 36, 서열 번호 37, 서열 번호 38, 서열 번호 39, 서열 번호 40, 서열 번호 41, 서열 번호 42, 서열 번호 43, 서열 번호 44, 서열 번호 45, 서열 번호 46, 및 서열 번호 47, 또는 서열 번호 151, 서열 번호 152, 서열 번호 153, 서열 번호 154, 서열 번호 155, 서열 번호 156, 서열 번호 157, 서열 번호 158 서열 번호 159, 서열 번호 160, 서열 번호 161, 서열 번호 162, 서열 번호 163, 서열 번호 164, 서열 번호 165 및 서열 번호 166.
상기 군의 서열 번호 30의 효과기 펩티드는 항 세포사멸 인자를 억제하는 Bax 단백질의 BH3 도메인, 및 구체적으로 하기로 표시되는 16-아미노산 펩티드로부터 유도된 펩티드이다:
KKLSECLKRI GDELDS 서열 번호 30
Bax 단백질의 BH3 도메인의 서열을 기초로 한 펩티드는 항-세포사멸 단백질 Bcl-2 및 Bcl-XL에 효과적으로 결합할 수 있는 것으로 믿어진다.
Bcl-2 및 Bcl-XL 단백질의 항-세포사멸 활성은 세포사멸의 개시를 담당하는 인자(Bax, Bak, Bad) 내에 존재하는 BH3 도메인과의 상호작용을 근거로 한다. BH3 도메인의 결합은 이들의 천연 리간드와 단백질 Bcl-2 및 Bcl-XL의 상호작용을 방지하고 그의 활성을 억제하는 효과를 초래하며, 그에 의하여 세포사멸 촉진의 개시에 기여한다.
상기 군의 서열 번호 31의 효과기 펩티드는 하기로 표시되는 Bid 단백질의 BH3 도메인을 포함하는 15-아미노산 펩티드이다:
RNIARHLAQV GDSMD (서열 번호 31).
Bid 단백질은 Bcl-2 패밀리에 속하며 그 중에서도 세포사멸 유발 인자 Bax의 활성화에 책임이 있다. 본 발명의 융합 단백질에 혼입된 Bid 단백질의 BH3 도메인을 포함하는 16-아미노산 펩티드는 세포사멸을 효과적으로 유도할 것으로 믿어진다.
상기 군의 서열 번호 32의 효과기 펩티드는 하기로 표시되는 리보뉴클레아제 A(RNase A)의 펩티드 동족체이다:
KETA AKFERQHMDS STSAASSSNY CNQMMKSRNL TKDRCKPVNT FVHESLADVQ
AVCSQKNVAC KNGQTNCYQS YSTMSITDCR ETGSSKYPNC AYKTTQANKH
IIVACEGNPY VPVHFDASV(서열 번호 32).
리보뉴클레아제는 음으로 하전된 세포막에 결합하여 이다도시토시스(endocytosis)를 통해 세포로 들어가고, 그후 시토졸로 유출되며, 여기에서 이들은 RNA의 분해를 야기하는 효소로서 작용하는 강력한 항신생물(antineoplastic) 성질을 갖는 작은 단백질이다. 10nM의 농도에서 시작하여, 이들은 세포 주기 저지 및 세포사멸을 야기한다.
상기 기술된 군의 서열 번호 33의 효과기 펩티드는 하기로 표시되는 시토크롬 C 분자이다:
GDVEK GKKIFIMKCS QCHTVEKGGK HKTGPNLHGL FGRKTGQAPG YSYTAANKNK
GIIWGEDTLM EYLENPKKYI PGTKMIFVGI KKKEERADLI AYLKKATNE(서열 번호 33).
미토콘드리아에서 세포질로의 시토크롬 C의 방출은 소위 미토콘드리아 경로를 통한 세포사멸을 유도하는 주 신호 중의 하나이다. 단백질은 카스파제 9를 활성화하는 아포프토솜 복합체(apoptosome complex)의 부분이다.
상기 기술된 군의 서열 번호 34의 효과기 펩티드는 하기로 표시되는 그랜자임 B이다:
IIGGHVAKPH SRPYMAYLMI WDQKSLKRCG GFLIRDDFVL TAAHCWGSSINVTLGAHNIK
EQEPTQQFIP VKRAIPHPAY NPKNFSNDIM LLQLERKAKR
TRAVQPLRLP SNKAQVKPGQ TCSVAGWGQT APLGKHSHTL QEVKMTVQED
RKCESDLRHY YDSTIELCVG DPEIKKTSFK GDSGGPLVCN KVAQGIVSYG
RNNGMPPRAC TKVSSFVHWI KKTMKRY(서열 번호 34).
문헌에서 프래그멘틴(fragmentin)으로도 불리우는 그랜자임(granzyme)은 Tc 림프구 및 NK 세포의 세포 입도(granularity)를 위한 전형적인 세린 프로테아제이다. 인간에서, 현재 5의 상이한 그랜자임이 확인되었다: A, B, H, K(트립타제) 및 M(메티오니나제). 연구는 이들 효소가 표적 세포에 대하여 림프구에 의해 발휘된 세포 독성 반응의 요소인 것으로 확인되었다. 이들 효소는 세포막에 기공(pore)을 생성하고 그에 의해 세포 독성 반응을 매개하는 단백질인 퍼포린을 활성화하는 것으로 나타났다. 더욱이, 이들 효소는 표적 세포에서 세포사멸의 유도에 직접적으로 포함되는 것으로 믿어진다. 그랜자임 B는 선택된 프로카스파제를 그들의 활성 형태(예컨대 카스파제 3)로 활성화하며, 또한 단백질 분해를 통해 활성 형태의 Bid 단백질(Bcl-2 단백질 패밀리에 속하는 단백질)을 방출하고, 이것은 미토콘드리아 막으로 혼입되고 막 내에 기공을 생성하고, 이어서 세포사멸-유도 인자(시토크롬 C, 카스파제 9, Apaf)를 방출하여 세포사멸의 세포 내 경로를 개시하게 한다. 히스톤에 결합함에 의해 그랜자임 B는 또한 염색질 구조의 이완에도 참여할 수 있으며, 이것은 그의 이완을 야기하며 엔도뉴클레아제를 위한 DNA로의 접근을 증진시킨다.
상기 군의 서열 번호 35의 효과기 펩티드는 하기로 표시되는 Nur77 단백질의 분절이다:
FSRSLHSLL (서열 번호 35).
핵 수용체 Nur77은 세포사멸의 매우 강력한 유도물질(inducer)이다. 그의 작용 메커니즘 중의 하나는, 중요한 항-세포사멸 인자인 Bcl-2 단백질에 결합하는 능력이다. 이러한 상호작용은, 세포사멸의 유도물질로 전환하는 Bcl-2의 구조에서의 입체형태 변화를 야기한다. 상기에서 표시된 분절은 세포 내에서 세포사멸의 유도 및 Bcl-2의 결합 및 전환에 책임이 있는 것으로 확인된 Nur77의 서열로부터 9-아미노산 영역이다.(Kolluri 등, Cancer Cell 14: 285-298, 2008).
상기 군의 서열 번호 36의 효과기 펩티드는 하기로 표시되는 Bak 단백질의 BH3 도메인을 포함하는 15-아미노산 펩티드이다:
GQVGRQLAII GDDIN (서열 번호 36).
본 발명의 융합 단백질로 혼입되는 이러한 짧은 펩티드는 세포사멸 신호를 효과적으로 유도할 것으로 믿어진다.
상기 군의 서열 번호 37의 효과기 펩티드는 하기로 표시되는 단백질 PUMA/BBC3의 BH3 도메인이다:
EEQWAREIGA QLRRMADDLN AQYE 서열 번호 37.
PUMA/BBC3(세포사멸/Bcl-2-결합 성분 3의 p53 조절증진된 조절인자(upregulated modulator))는 Bcl-2 단백질 패밀리(BH3-만의 서브패밀리)의 멤버이다. 이것은 p53에 의존 및 독립하는 양자의 방식으로 세포사멸을 매개한다. 모든 공지의 생존 유발(pro-survival) Bcl-2 단백질과 PUMA/BBC3의 직접 상호작용은 이들의 불활성화인 미토콘드리아 기능장애를 야기하며, 따라서 세포사 및 카스파제의 활성화를 야기한다. PUMA는 또한 Bak 및 Bax와 같은 분자의 세포사멸 유발 활성의 복원에 간접적으로 영향을 준다. BH3 도메인은 생존 유발 단백질과 PUMA의 결합에 책임이 있다.
상기 군의 서열 번호 38의 효과기 펩티드는 하기로 표시되는 단백질 PUMA/BBC3이다.
ARAR QEGSSPEPVE GLARDGPRPF PLGRLVPSAV SCGLCEPGLA AAPAAPTLLP
AAYLCAPTAP PAVTAALGGS RWPGGPRSRP RGPRPDGPQP SLSLAEQHLE
SPVPSAPGAL AGGPTQAAPG VRGEEEQWAR EIGAQLRRMA DDLNAQYERR
RQEEQQRHRP SPWRVLYNLI MGLLPLPRGH RAPEMEPN(서열 번호 38).
본 발명의 융합 단백질로 혼입될 때 단백질 PUMA/BBC3 및 그의 BH3 도메인 양자가 효과적으로 세포사멸 신호를 유도할 것으로 믿어진다.
상기 군의 서열 번호 39의 효과기 펩티드는 하기로 표시되는 단백질 SMAC/Diablo의 8-아미노산 분절이다:
AVPIAQKP (서열 번호 39).
SMAC/DIABLO(Second mitochondria-derived activator of Caspase(카스파제의 제2 미토콘드리아 유도 활성제)/Direct IAP Binding Protein with Low PI(낮은 PI를 갖는 직접 IAP 결합 단백질)는 미토콘드리아로부터 방출된 카스파제의 활성제이다. 그의 N-말단 모티프는 IAP 단백질에 경쟁적으로 결합하여, 카스파제의 불활성화로부터 그들의 BIR 2 및 BIR 3 도메인을 방지한다. 본 발명의 융합 단백질로 혼입될 때 이 짧은 펩티드는 세포사멸 신호를 효과적으로 유도할 것으로 믿어진다.
상기 군의 서열 번호 40의 효과기 펩티드는 하기로 표시되는 부포린(buforin) IIb 펩티드이다:
RAGLQFPVGR LLRRLLRRLL (서열 번호 40).
부포린 IIb는 히스톤 H2A로 유도된 펩티드이며, 이것은 세포막의 독립적인 침투가 가능하며 항세균(antibacterial) 성질을 갖는다(Park 등, Biochem Biophys. Res. Commun., 244: 253-257, 1998). 항암제로서의 그의 유용성에 관한 연구는 이것이 많은 암세포에 선택적으로 결합할 수 있고, 세포에 침투하며 핵 내에 축적할 수 있어 미토콘드리아 경로를 통한 세포사멸을 유도할 수 있다는 것을 보여주었다(Lee 등, Cancer Letters, 271:47-55, 2008).
상기 군의 서열 번호 41의 효과기 펩티드는 하기로 표시되는 온코나제(onconase) 펩티드이다:
QDWLT FQKKHITNTR DVDCDNIMST NLFHCKDKNT FIYSRPEPVK AICKGIIASK
NVLTTSEFYL SDCNVTSRPC KYKLKKSTNK FCVTCENQAP VHFVGVGSC(서열 번호 41).
온코나제 또는 P-30은 개구리 라나 피피엔스(frog Rana pipiens) 난모세포의 용해물로부터 최초로 유도된 단백질이다. 이것은 12kDa의 질량을 가지며, RNase A의 구조 동족체인 단일 가닥 단백질이다. 이 단백질에 대한 연구는 종양 세포에 대한 놀라운 세포 독성 활성을 갖는 것을 보여주었다(Y Wu, SM Mikulski, W Ardelt, SM Rybak and RJ Youle, The Journal of Biological Chemistry 268, 10686-10693). 온코나제의 작용 메커니즘에 대한 연구는 내재화 과정시 세포내로 들어가고, 여기에서 단백질 합성 및 세포사의 억제를 초래하는 28S 및 18S 리보솜 rRNA의 분해 과정을 수행한다는 것을 보여주었다.
상기 군의 서열 번호 42의 효과기 펩티드는 p14ARF 단백질의 20-아미노산 N-말단 분절이며, 이것은 하기로 표시되는 생존 유발 Mdm2 단백질의 억제제이다:
VRRFLVTLRI RRACGPPRV (서열 번호 42).
P14ARF는 종양 억제 유전자 p53에 결합하고 그의 분해 및 그에 의한 형질전환된 세포의 생존 가능성에 책임이 있는 Mdm2 단백질의 활성을 조절하는 단백질이다. Mdm2에 결합함에 의해 P14ARF 단백질은 그의 p53과의 상호작용을 방지한다. p14ARF로부터 유도된 짧은 펩티드는 Mdm2 와 p53 사이의 상호 작용을 차단하기에 충분하고 후자의 분해를 방지하는 것으로 보고되었다.(Midgley 등, Oncogene 19: 2312-2323, 2000).
상기 군의 서열 번호 43의 효과기 펩티드는 하기로 표시되는 Mdm2에 결합하는 11-아미노산 펩티드이다:
PRFMDTWEGL N (서열 번호 43).
상기 펩티드는 p53 서열에 대하여 서열 상동성을 나타내며 Mdm2-p53 상호작용의 억제에 대하여 중요한 효율성을 나타내고(Bottger 등, Oncogene 13:2141-2147, 1996), 그에 의해 p53의 분해를 방지한다.
상기 군의 서열 번호 44의 효과기 펩티드는 하기로 표시되는 루나신(lunasin) 펩티드의 17-아미노산 분절이다
CEKHIMEKIQ GRGDDDD (서열 번호 44).
루나신은 강력한 항암물질로 입증된 대두(글라이신 맥스(Glycine max))로부터 유도된 43-아미노산 펩티드이다. 이 분자의 일반적 작용 메커니즘은 히스톤 아세틸화의 억제로 구성된다. 데아세틸라제(deacetylase) 활성을 갖는 분자는 또한 전사 과정에서 공동-억제 유전자(co-suppressor)로서 작용한다는 것이 공지되어 있다(Leong 등, Cancer Lett, 18: 42 - 48, 2007).
상기 군의 서열 번호 45의 효과기 펩티드는 하기로 표시되는 Bik 단백질의 BH3 도메인이다:
LALRLAC IGDEMDVS (서열 번호 45).
Bik 단백질은 생존 신호(예컨대 Bcl-2)를 개시하는 세포 및 바이러스 인자와 상호작용하고, 그에 의해 세포사멸을 촉진한다. 많은 다른 세포사멸 유발 단백질과 마찬가지로, 이것은 Bcl-2와 상호작용하기 위해 필요한 BH3 도메인을 함유한다. BH3 도메인을 포함하는 단백질로부터 유도된 펩티드는 다른 세포사멸 유발 단백질을 활성화하여 또는 항-세포사멸 단백질을 억제하여 세포사멸을 개시할 수 있다.(Del Gaizo Moore, V, 등, Blond, 111: 2300-2309, 2008).
상기 군의 서열 번호 46의 효과기 펩티드는 하기로 표시되는 합성 펩티드- 프로테아좀 억제제이다:
AGAGGGAGG AGAGGGAGGA G (서열 번호 46).
이 펩티드는 Gly 및 Ala 잔기의 반복 시리즈로 구성되며 TRAIL 수용체 DR5의 과발현 유도에 의해 TRAIL-유도 세포사멸을 강화할 수 있는 프로테아좀 억제제이다.
상기 군의 서열 번호 47의 효과기 펩티드는 하기로 표시되는 프로테아좀 S5a의 C-말단 분절의 도메인이다.
MTISQQEFG RTGLPDLSSM TEEEQIAYAM QMSLQGAEFG QAESADIDAS SAMDTSEPAK
EEDDYDVMQD PEFLQSVLEN LPGVDPNNEA IRNAMGSLAS QATKDGKKDK KEEDK(서열 번호 47).
프로테아좀 S5a 분절로부터의 이 도메인은 유비퀴틴 결합에 직접 참여하는 UIMs 모티프를 함유하며 따라서 세포사멸을 유도할 수 있는 능력을 갖는다.
상기 군의 서열 번호 151의 효과기 펩티드는 아주린(azurin) 유도된 펩티드이다.
아주린은 병원성 박테리아인 녹농균 (Psedomonas aeruginosa)에 의해 방출된 구리 함유 산화 환원 단백질이며, 많은 암 세포주에 대하여 고도로 세포독성이 있다. 이것은 시토졸에 진입하고 핵으로 이동한다. 그의 활성은 엄격히 암세포 내의 p53 활성 형태의 존재에 의존한다. 아주린은 p53과 결합하고 p53 및 Bax 레벨을 포스트-번역으로(post-translationaly) 증가시킨다. Mdm2-p53 기능 상호 작용에 대한 명백한 길항작용은 p53에 아주린의 결합이 Mdm2-p53회합으로 방해받으며 따라서 p53의 분해를 방지한다는 것을 암시한다. 결합시, 시토졸로 미토콘드리아 시토크롬 c의 방출을 촉발한다. 이 과정은 카스파제 캐스케이드(카스파제-9 및 카스파제-7 포함)을 활성화하며, 그에 의해 세포사멸 과정을 개시하게한다(Punj V, 등 Oncogene. 2004 Mar 25;23(13):2367-78, Funari G 등. J Mol Recognit. 2010 Jul Aug;23(4):343-51). 아주린 서열로부터 유도된 펩티드 활성의 상세한 분석은 효율적 세포 침투 및 세포사멸의 촉발에 책임이 있는 28 아미노산의 영역을 나타낸다(Yamada i wsp., Cell Microbiol, 7:1418-1431, 2005).
상기 군의 서열 번호 152의 효과기 펩티드는 전체 길이의 아주린 펩티드이다.
상기 군의 서열 번호 153의 효과기 펩티드는 Bax 단백질의 BH3 도메인 및 aPP 단백질로부터 제작된 펩티드이다.
aPP 단백질의 키메라 및 다시 제작된 세포사멸 유발 Bak 단백질은 인간 Bcl-2 및 Bcl-X에 대하여 매우 강력하고 특이적인 리간드로서 EP1309680호에 보고되었다(또한, Chin JW, Schepartz A. Design and evolution of a miniature Bcl-2 binding protein Angew Chem Int Ed Engl. 2001 Oct 15;40(20):3806-3809 참조).
상기 군의 서열 번호 154의 효과기 펩티드는 Bax 단백질의 BH3 도메인 및 aPP 단백질로부터 제작된 또 다른 펩티드이다.
상기 기술된 군의 서열 번호 155의 효과기 펩티드는 레티쿨론(Reticulon) RTN1-C 유도된 펩티드이다.
RTN1-C 단백질은 ER에 국지적으로 존재하는 막 단백질이며 신경 시스템에서 발현되고, 그의 생물학적 역할은 완전히 밝혀지진 않았다. 잔기 186 내지 208의 분절에 상응하는 RTN1-C의 C-말단 영역은 핵산에 결합할 수 있으며 그들의 활성을 감소시키는 히스톤 데아세틸라제(HDAC) 효소와 상호작용할 수 있다.
상기 군의 서열 번호 156의 효과기 펩티드는 전체 길이의 인간 레티쿨론 3(이소형태(isoform) a)이다. 레티쿨론(RTNs)은 다른 공지의 세포사멸-관련 도메인에 상동성을 갖지 않는 내재 막(integral membrane) 단백질의 군을 형성한다. 레티쿨론 3 이소형태 a는 종양 세포주 내에서 과발현되며, 이들을 TRAIL-매개 세포사멸에 민감하게 전환시킨다.
상기 군의 서열 번호 157의 효과기 펩티드는 구성적으로 활성인 변형된 카스파제-3(단일 사슬)이다. (Srinivasula SM, Ahmad M, MacFarlane M, Luo Z, Huang Z, Fernandes-Alnemri T, Alnemri ES. Generation of 구성적으로 active recombinant caspases-3 및 -6 by rearrangement of their subunits(서브유닛의 재배열에 의한 구성적으로 활성인 재조합 카스파제-3 및 -6의 발생). J Biol Chem. 1998 Apr 24;273(17):10107-11).
상기 군의 서열 번호 158의 효과기 펩티드는 Par-4 단백질로부터의 SAC 도메인이다. (전립선 세포사멸 반응 단백질 par-4).
Par-4는 세포사멸 유발 기능을 갖는 종양 억제 유전자 단백질이다. Par-4 잔기의 암-특이적 세포사멸 유발 작용은 그의 중심에 위치한 SAC 도메인이다. 분자의 기능은 2개의 별개의 수단에 의해 성취된다: 세포사 기구(cell-death machinery) 의 분자 성분의 활성화(플라스마 막으로 Fas 및 FasL의 전좌), 및 생존 유발 인자(NF-κB 경로)의 억제.(Zhao Y, Rangnekar VM. Par-4에 의해 부여된 세포사멸 및 종양 내성(Apoptosis and tumor resistance conferred by Para-4). Cancer Biol Ther. 2008 Dec;7(12):1867-74. Epub 2008 Dec 8. Review).
상기 군의 서열 번호 159의 효과기 펩티드는 녹사(Noxa) 단백질이다. 녹사는 단백질의 Bcl-2 패밀리의 Bcl-2 상동성 3(BH3) 단일 멤버를 코딩한다; 이 멤버는 BH3 영역을 함유하지만 다른 BH 도메인은 함유하지 않는다. 녹사는 p53-의존 세포사멸의 매개자이며 미토콘드리아에 BH3 모티프 의존 국지화가 진행되고 항-세포사멸 Bcl-2 패밀리 멤버와 상호작용하여, 카스파제-9의 활성화를 초래한다.
상기 기술된 군의 서열 번호 160의 효과기 펩티드는 미토콘드리아 위치를 위해 필요한 녹사 단백질의 10 AA(KLLNLISKLF) 분절이다(MTD-미토콘드리아 타겟팅 도메인 또는 CKP-세포를 치사하는 펩티드). 이것은 WO2006/001582호 및 Young-Woo Seo 등, 「The Journal of Biological Chemistry Vol. 278, No. 48, 11월 28일 발행, pp. 48292-48299, 2003」에 기술되어 있다.
상기 군의 서열 번호 161의 효과기 펩티드는 WO2010055929호에 기술된 짧은 하이브리드 펩티드 Antp-TPR이다. Antp-TPR은 조작된 하이브리드 펩티드 타겟팅 Hsp90이며, 이것은 Hop의 TPR2A 도메인과 Hsp90의 상호작용의 억제로 인해 암세포에 대한 선택적인 세포 독성 활성을 갖는다.
상기 기술된 군의 서열 번호 162의 효과기 펩티드는 Stat3 단백질의 SH2 도메인의 펩티드 억제제이다.
Stat 단백질의 SH2 도메인은 성장 인자 및 사이토카인에 대한 반응에서 정상 STAT 신호화를 통한 세포 성장 및 분화의 촉진을 초래하는 일련의 이벤트들에 책임이 있다.
상기 군의 서열 번호 163의 효과기 펩티드는 Bak 단백질(Bcl-2 패밀리)의 BH3 도메인으로부터 유도된 펩티드 GQVGRQLAIIGDDINR이다(Castelli M, Reiners JJ, Kessel D. 우루소데옥시콜산의 세포사멸 유발 활성에 대한 메커니즘 : Bcl-2 입체구조에 대한 효과(A mechanism for the proapoptotic activity of ursodeoxycholic acid: effects on Bcl-2conformation). Cell Death Differ. 2004 Aug;11(8):906-14). Bak 단백질은 세포사멸 개시와 연관된 Bcl-2 패밀리의 세포사멸 유발 멤버이다.
상기 군의 서열 번호 164의 효과기 펩티드는 Bad 단백질(Bcl-2 패밀리)의 BH3 도메인으로부터 유도된 펩티드 KNLWAAQRYGRELRRMSDEFEGSFKGL이다(Wang JL, Zhang ZJ, Choksi S, Shan S, Lu Z, Croce CM, Alnemri ES, Korngold R, Huang Z. 세포 투과성 Bcl-2 결합 펩티드: 종양 세포에서 세포사멸 유도로의 화학적 접근(Cell permeable Bcl-2 binding peptides: a chemical approach to apoptosis induction in tumor cells). Cancer Res. 2000 Mar 15;60(6):1498-502).
상기 군의 서열 번호 165의 효과기 펩티드는 Bfl1 단백질로부터의 펩티드 ATAP이다.
ATAP(양친매성 테일-고정 펩티드, (amphipathic tail-anchoring peptide)) (Bfl1으로부터의 잔기 147-175, 2가의 Bcl2 패밀리 단백질)는 특이적으로 미토콘드리아를 표적으로 하며 Bax 또는 Bak가 필요없는 카스파제-의존 세포사멸을 유도한다.
상기 군의 서열 번호 166의 효과기 펩티드는 Bfl1 단백질로부터의 또 다른 ATAP 펩티드이다. ATAP 단백질은 HCCS1로부터 MTS 도메인으로 융합된다.(Ko JK, Choi KH, Pan Z, Lin P, Lin P, Weisleder N, Kim CW, Ma J. Bfl1 및 HCCS1의 테일-고정 도메인은 세포사멸을 유도하기 위해 미토콘드리아 막 투과성을 표적으로 한다(The tail-anchoring domain of Bfl1 and HCCS1 targets mitochondrial membrane permeability to induce apoptosis). J Cell Sci. 2007 Aug 15;120(Pt 16):2912-23. Epub 2007 Jul 31).
상술한 바와 같이, 도메인 (b)의 세포사멸 유발 효과기 펩티드의 제1 변이체는 내인성 세포사멸 경로(세포 내)를 통해 그의 세포사멸 활성을 나타내는 펩티드일 수 있으며, 이것은 세포사멸의 미토콘드리아 경로의 신호화 캐스케이드 성분의 활성화에 의해, 또는 세포 내에서 미토콘드리아 세포사멸의 직접적인 유도에 의해 직접적으로 세포사멸을 유도한다.
제1 변이체의 한 실시 양태에서, 내인성 경로를 통한 그의 활성을 나타내는 도메인 (b)의 세포사멸 유발 효과기 펩티드의 한 군은 결합시에 항-세포사멸 단백질 Bcl-2 및 Bcl-XL과 같은 세포 내 항-세포사멸 또는 생존 유발 인자를 저해 및/또는 조절하는 펩티드일 수 있다.
상기 군의 예시적인 효과기 펩티드는 실시예 1의 융합 단백질에 존재하는 서열 번호 30, 실시예 11 및 47의 융합 단백질에 존재하는 서열 번호 37, 실시예 21의 융합 단백질에 혼입된 서열 번호 45, 실시예 42 및 43의 융합 단백질에 존재하는 서열 번호 158 및 실시예 44의 융합 단백질에 혼입된 서열 번호 159로 표시되는 펩티드이다.
이러한 제1 변이체의 또 다른 실시 양태에서, 내인성 경로를 통해 그의 활성을 나타내는 도메인 (b)의 세포사멸 유발 효과기 펩티드의 한 군은 세포 내부에서 직접적인 파괴 효과를 나타내어 세포주기를 저지하는 펩티드일 수 있다.
상기 미토콘드리아 내인성 경로의 세포 내에서의 직접적인 파괴 효과는 세포사를 이끄는 카스파제 캐스케이드의 상이한 레벨에서 효과기 펩티드에 의해 개시될 수 있다.
상기 미토콘드리아 내인성 경로의 효과기 펩티드의 직접적인 파괴 효과의 예는 핵산, 특히 전체 세포 RNA 또는 DNA의 분해 및 분해적인 뉴클레아제의 유도이다. 이러한 효과는 예를 들어 인간 췌장 RNAse을 포함하는 췌장 RNAse A, 인간 안지오제닌(리보뉴클레아제 5, hAng), 인간 호산성-유도된 신경독소(eosinophil-derived neurotoxin) (EDN) 및 소 리보뉴클레아제, 뿐만 아니라 그들의 동족체 및 변이체의 슈퍼패밀리의 리보뉴클레아제와 같은 리보뉴클레아제로 나타낼 수 있다. RNAse 동족체의 예는 황소 개구리(Rana catesbiana) 및 일본 산 개구리(Rana japonica)로부터 단리된 리보뉴클레아제인 온코나제이다.
핵산의 분해에 의해 작용하는 상기 군의 예시적인 효과기 펩티드는 실시예 3, 4 및 27의 융합 단백질에 존재하는 서열 번호 32, 실시예 16, 17 및 46의 융합 단백질에 존재하는 서열 번호 41, 및 실시예 41의 융합 단백질에 존재하는 서열 번호 157로 표시되는 펩티드이다.
상기 미토콘드리아 내인성 경로에서 효과기 펩티드의 직접적인 파괴 효과의 또 다른 예는 카스파제 활성화이다. 이러한 효과는 예를 들어 실시예 5 및 6의 융합 단백질에 존재하는 시토크롬 c(서열 번호 33), 실시예 7 및 8의 융합 단백질에 존재하는 그랜자임 B(서열 번호 34), 또는 실시예 14, 21, 33, 34 및 35의 융합 단백질에 존재하는 단백질 Smac/DIABLO(서열 번호 39)에 의해 나타낼 수 있다.
상기 미토콘드리아 내인성 경로에서 효과기 펩티드의 직접적인 파괴 효과의 또 다른 예는 p53 기능의 복원시 세포사멸 유발 단백질의 안정화의 영향으로 인한 프로테아좀 억제이다.
프로테아좀 억제에 의해 작용하는 상기 군의 예시적인 효과기 펩티드는 실시예 22의 융합 단백질에 혼입된 서열 번호 46, 및 실시예 23의 융합 단백질에 혼입된 서열 번호 47에 의해 표시되는 펩티드이다.
상기 미토콘드리아 내인성 경로에서 효과기 펩티드의 직접적인 파괴 효과의 또 다른 예는 p53 기능의 복원시 세포사멸 유발 단백질 발현의 영향을 증진함으로인한 히스톤 단백질의 조절이다.
히스톤 단백질의 조절에 의해 작용하는 상기 군의 예시적인 효과기 펩티드는 실시예 15의 융합 단백질에 혼입된 서열 번호 40으로 표시되는 부포린 IIb 및 실시예 20의 융합 단백질에 혼입된 서열 번호 44로 표시되는 루나신이다.
상기 미토콘드리아 내인성 경로에서 효과기 펩티드의 직접적인 파괴 효과의 또 다른 예는 예컨대 그의 분해 억제에 의한 p53기능의 복원이다. p-53 분해의 방지는 MDM2(murine double minute 2)와 같은 p-53의 음성 조절자의 억제에 의해 그의 음성 조절을 방해하여 성취될 수 있다. 이것은 아주린, 구리 함유 산화 환원 단백질, 세포 주기 조절자 p14ARF, 또는 SuperTIP(티오레독신 삽입 단백질, 박테리아 티오레독신 단백질의 활성 부위 루프 내의 mdm-2-결합 펩티드), 또는 이들의 분절과 같은, p-53에 결합하기 위해 MDM2와 경쟁하는, MDM2 결합 펩티드에 의해 성취될 수 있다.
p-53 기능의 복원에 의해 작용하는 상기 군의 예시적인 효과기 펩티드는 실시예 18의 융합 단백질에 혼입된 서열 번호 42, 실시예 19의 융합 단백질에 혼입된 서열 번호 43, 실시예 29, 30 및 31의 융합 단백질에 존재하는 서열 번호 151, 및 실시예 32의 융합 단백질에 혼입된 서열 번호 152로 표시되는 펩티드이다.
상기 미토콘드리아 내인성 경로에서 효과기 펩티드의 직접적인 파괴 효과의 또 다른 예는 Bcl-2 단백질 패밀리, 예컨대 단백질 Bax, Bak, Bok, Bid, Bim, Bad, Bmf, Hrk, Noxa, Puma, Bik, BNIP3 및 Spike, 특히 더 Bid, Bim, Bad, Bmf, Hrk, Noxa, Puma, Bik, BNIP3 및 Spike를 포함하는 BH3 단일 단백질 패밀리에 영향을 주는 것, 즉 활성화, 억제 또는 조절이다. 특히, Bcl-2 패밀리 멤버의 BH3 도메인의 분절은 유리한 효과기 펩티드일 것이다. 효과기 펩티드의 다른 군은 예를 들어 핵 수용체 Nur77과 같은 핵 수용체 RXR(레티노이드 X 수용체)의 패밀리의 분절이다.
Bcl-2 단백질 패밀리에 영향을 주는 것에 의해 작용하는 상기 군의 예시적인 효과기 펩티드는 실시예 1의 융합 단백질에 혼입된 서열 번호 30, 실시예 2, 4 및 8의 융합 단백질에 존재하는 서열 번호 31, 실시예 3의 융합 단백질에 혼입된 서열 번호 32, 실시예 9의 융합 단백질에 혼입된 서열 번호 35, 실시예 10의 융합 단백질에 혼입된 서열 번호 36, 실시예 11 및 47의 융합 단백질에 존재하는 서열 번호 37, 실시예 12 및 13의 융합 단백질에 존재하는 서열 번호 38, 실시예 44의 융합 단백질에 혼입된 서열 번호 159, 실시예 45의 융합 단백질에 혼입된 서열 번호 160, 실시예 51의 융합 단백질에 혼입된 서열 번호 163, 실시예 52 및 53의 융합 단백질에 존재하는 서열 번호 164, 실시예 54의 융합 단백질에 혼입된 서열 번호 165, 및 실시예 55의 융합 단백질에 혼입된 서열 번호 166으로 표시되는 펩티드이다.
상기 미토콘드리아 내인성 경로에서 효과기 펩티드의 직접적인 파괴 효과의 또 다른 예는 TRAIL 수용체에 결합하는 TRAIL에 의해, 특히 카스파제 활성화에 의해 유도된 세포사멸 신호의 수렴이다.
상기 미토콘드리아 내인성 경로에서 효과기 펩티드의 직접적인 파괴 효과의 또 다른 예는 아포프토솜(apoptosome) 형성의 촉진이다.
상기 아포프토솜 형성의 촉진에 의해 작용하는 상기 군의 예시적인 효과기 펩티드는 실시예 1의 융합 단백질에 혼입된 서열 번호 30, 실시예 2의 융합 단백질에 혼입된 서열 번호 31, 실시예 5 및 6의 융합 단백질에 존재하는 서열 번호 33, 실시예 9의 융합 단백질에 혼입된 서열 번호 35, 실시예 10의 융합 단백질에 혼입된 서열 번호 36, 실시예 47의 융합 단백질에 혼입된 서열 번호 37, 실시예 33, 34 및 35의 융합 단백질에 존재하는 서열 번호 39, 실시예 14의 융합 단백질에 혼입된 서열 번호 40, 실시예 21의 융합 단백질에 혼입된 서열 번호 45, 실시예 36 및 37의 융합 단백질에 존재하는 서열 번호 153, 실시예 38의 융합 단백질에 혼입된 서열 번호 154, 실시예 41의 융합 단백질에 혼입된 서열 번호 157, 실시예 42 및 43의 융합 단백질에 존재하는 서열 번호 158, 실시예 44의 융합 단백질에 혼입된 서열 번호 159, 실시예 45의 융합 단백질에 혼입된 서열 번호 160, 실시예 51의 융합 단백질에 혼입된 서열 번호 163, 및 실시예 52 및 53의 융합 단백질에 존재하는 서열 번호 164로 표시되는 펩티드이다.
상기 미토콘드리아 내인성 경로에서 효과기 펩티드의 직접적인 파괴 효과의 또 다른 예는 미토콘드리아에 의해 방출된 단백질이 카스파제 활성화 레벨에서 작용할 수 있도록 기인하는 미토콘드리아 외막(MOMP) 투과화(permeabilization)의 촉진이다.
MOMP 투과화의 촉진에 의해 작용하는 상기 군의 예시적인 효과기 펩티드는 실시예 1의 융합 단백질에 혼입된 서열 번호 30, 실시예 2 및 48의 융합 단백질에 존재하는 서열 번호 31, 실시예 5 및 6의 융합 단백질에 존재하는 서열 번호 33, 실시예 14, 33, 34 및 35의 융합 단백질에 존재하는 서열 번호 39, 실시예 15의 융합 단백질에 혼입된 서열 번호 40, 실시예 46의 융합 단백질에 혼입된 서열 번호 41, 및 실시예 21의 융합 단백질에 혼입된 서열 번호 45로 표시되는 펩티드이다.
상술한 바와 같이, 본 발명의 도메인 (b)의 세포사멸 유발 효과기 펩티드의 제2 변이체는 외인성 경로(세포외)를 통해 작용하는 세포사멸 유발 효과기 펩티드의 군이며, 그의 효과는 암세포의 표면상에 존재하는 수용체에 결합시 필요하다.
세포 외로 작용하는 펩티드로서의 하기 TNF-리간드(TNF-종양 괴사 인자) 또는 TNF-유사체는 비교 효과기 펩티드로서 사용되었다:
- VANPQAEGQL 데카펩티드(서열 번호 48);
- LANGVE 헥사펩티드(서열 번호 49), 또는
- 셉타펩티드 CPSEGLC(서열 번호 50).
서열 번호 48로 표시되는 데카펩티드는 JP 60,226,816호에서 TNF의 유사체/아고니스트로서 기술되어 있다.
서열 번호 49로 표시되는 헥사펩티드는 TNF에서 유도되며 DE 3,841,768호에 기술되어 있다.
서열 번호 50으로 표시되는 셉타펩티드는 사이토카인과 그의 세포 수용체와의 상호작용의 표면으로부터 유도된 TNF 사이토카인의 일부인 5-아미노산 펩티드: 두 시스테인 잔기에 의해 C-말단 및 N-말단에서 측면에 있는 TNFR55 및 TNFR75이다. 시스테인 잔기는 아미노산 사이의 황화물 브리지의 형성을 통해 펩티드 고리화를 안정화한다. 고리화의 목적은 펩티드의 안정화 및 그의 활성의 개선이다.
암세포의 표면상에 존재하는 TRAIL 수용체에 결합시, 융합 단백질은 이중효과를 나타낼 것이다. TRAIL의 기능 분절인 도메인 (a)는 그의 알려진 아고니스트 활성 - 즉 세포 표면상에서 사멸 수용체에 결합 및 세포사멸의 외인성 경로의 활성화를 나타낼 것이다. 세포 내 작용하는 세포사멸 유발 펩티드를 포함하는 융합 단백질의 엔도시토시스(endocytosis)를 통해 내재화(intenalizaion) 후, 도메인 (b)는 TRAIL 도메인의 활성에 병행하여 세포 내 작용을 강력하게 나타낼 수 있을 것이다. 이러한 방식으로, TRAIL의 항암 활성은 세포사멸의 메커니즘 및 다른 요소의 활성화에 의해 강력하게 될 것이다.
세포외에서 작용하는 세포사멸 유발 펩티드를 혼입한 비교 융합 단백질은 TRAIL 수용체 이외의 세포사멸 유발 수용체에 결합 및 활성화하여 세포사멸 경로를 강력하게 추가적으로 개시시켜야 한다.
본 발명의 한 실시 양태에서, 융합 단백질의 도메인 (a) 및 (b)는 직접적으로 서로 연결될 수 있다.
또 다른 실시 양태에서, 도메인 (a) 및 도메인 (b)는 세포 환경, 특히 종양 세포 환경에 존재하는 프로테아제에 의해 인식된 절단 부위의 서열을 포함하는 도메인 (c)에 의해 연결된다.
프로테아제 절단 부위는 하기에서 선택될 수 있다:
- 메탈로프로테아제 MMP, 특히 서열 PLGLAG(서열 번호 51), PLGIAGE(서열 번호 171) 또는 PLGLAGQ(서열 번호 173)에 의해 인식되는 서열
- 유로키나제 uPA, 특히 RVVR 서열(서열 번호 52)에 의해 인식되는 서열, 및
- 퓨린, 특히 서열 RKKR(서열 번호 53), 또는 서열 RKKRVKR(서열 번호 172) 에 의해 인식되는 서열,
및 그의 조합.
특히, 프로테아제 절단 부위는 임의의 순서로 서로 나란히 위치한, 메탈로프로테아제 MMP에 의해 인식되는 서열 및 유로키나제 uPA에 의해 인식되는 서열의 조합이다.
한 실시 양태에서, 도메인 (c)는 서열 PLGLAGRVVR인 MMP/uPA 서열 번호 51/서열 번호 52의 조합, 또는 서열 RVVRPLGLAG인 uPA/MMP 서열 번호 52/서열 번호 51의 조합물이다.
프로테아제 메탈로프로테아제 MMP, 유로키나제 및/또는 퓨린은 종양 환경에서 과발현된다. 프로테아제에 의해 인식되는 서열의 존재는 구조물의 내재화시 도메인 (b)에서 도메인 (a)의 절단, 즉 기능 도메인 (b)의 방출 및 이에 따른 그의 활성화를 할 수 있게 한다.
효과기 펩티드의 신속한 방출을 허용함에 의한 프로테아제 절단 부위의 존재는, 세포 발생에서 존재하는 프로테아제에 의해 융합 단백질의 랜덤 분해 전에, 펩티드를 그의 작용 위치에 수송하는 기회를 증진시킨다.
추가로, 본 발명의 융합 단백질의 효과기 펩티드의 도메인 (b)에 하기로 이루어진 군으로부터 선택된 수송 도메인(d)를 부착시킬 수 있다:
(d1) 소포체로 향하는 서열,
(d2) 6, 7, 8 또는 9 Arg 잔기를 포함하는 세포막을 통해 수송하는 폴리아르기닌 서열,
(d3) 녹농균(Pseudomonas aeruginosa)의 전좌 도메인(서열 번호 54),
(d4) 막 수송 도메인,
(d5) 핵 국지화 도메인, 및
(d6) 미토콘드리아 타겟팅 도메인,
및 그의 조합.
도메인(d1) (d2) 및 (d3)의 조합은, 특히 (d1)/(d2), (d1)/(d3) 또는 (d1)/(d2)/(d3)의 조합을 포함할 수 있다.
도메인 (d1), (d2), (d3), (d4), 및 (d5)의 조합은 또한 특히, (d1)/(d2), (d1)/(d3), (d1)/(d4), (d1)/(d5) 및 (d1)/(d2)/(d3), (d3)/(d5), (d2)/(d5), (d1)/(d3)/(d5), (d2)/(d3)/(d6)의 조합을 포함할 수 있다.
더욱이, 도메인 (d1), (d2), (d3), (d4), 및 (d5)의 조합은 서로 나란히 위치하며 도메인 (b)의 한 끝에 연결된 도메인 및/또는 도메인 (b)의 상이한 끝에 연결된 도메인을 포함할 수 있다.
융합 단백질이 도메인 (b)에 부착된 수송 도메인(d) 및 도메인 (a) 및 (b) 사이의 절단 부위인 도메인 (c) 양자를 가질 때, 도메인 (c)는 구조물의 절단 후, 수송 도메인(d)가 도메인 (b)에 부착되어 있도록 하는 방식으로 위치한다는 것을 이해하여야 한다. 다시 말해서, 융합 단백질이 수송 도메인(d) 및 절단 부위 도메인 (c) 양자를 함유한다면, 도메인(d)는 도메인 (b) 와 도메인 (c) 사이에 위치하거나 또는 도메인(d)의 부착 위치의 맞은편인 도메인 (b)의 끝에 위치한다. 본 발명은 구조물의 절단 후 수송 도메인이 TRAIL 도메인에 부착되어 있는 경우, 도메인(d)가 도메인 (c) 및 도메인 (a) 사이에 위치하는 변이체를 포함하지 않는다.
수송 서열은 도메인 (b)의 N-말단 또는 C-말단에 부착될 수 있다. 몇몇 실시 양태에서, 수송하는 서열은 또한 도메인 (a) 및 (b)의 부착 방식에 따라 C-말단 부분 또는 N-말단 부분과 같은 전체 구조물의 말단 부분일 수 있다.
녹농균(Pseudomonas aeruginosa)의 전좌 도메인은 리소좀 막을 통해 세포질로 전좌할 수 있으며 종양 세포 구획(compartments)에 효과기 펩티드를 도입하는데 사용될 수 있다. 녹농균의 전좌 도메인 서열은 공지되어 있으며 하기로 표시된다:
PEGGSLA ALTAHQACHL PLETFTRHRQ PRGWEQLEQC GYPVQRLVAL YLAARLSWNQ
VDQVIANALA SPGSGGDLGE AIRESPEQAR LALTLAAAES ERFVRQGTGN
DEAGAANGPA D(서열 번호 54)
소포체로 향하는 서열(d1)은 이것으로 제한되는 것은 아니지만 예컨대 KDEL, HDEL, RDEL, DDEL, ADEL, SDEL, KEDL과 같은 당업계에 공지된 소포체로 향하는 임의의 신호 서열일 수 있다. 서열(d1)은 바람직하게는 서열 KDEL(서열 번호 55) 및 KEDL(서열 번호 56)로부터 선택된다.
바람직하게는, 향하는 서열(d1)은 본 발명의 융합 단백질의 C-말단에 위치하며 그의 C-말단 부분을 형성한다.
막 수송 도메인(d4)는 이것으로 제한되는 것은 아니지만 예컨대 KPRRPY 또는 K PRRPYR과 같은 당업계에 공지된 플라스마 막을 통해 수송하는 임의의 신호 서열일 수 있다.
핵 국지화 서열(d5)는 이것으로 제한되는 것은 아니지만 예컨대 EEEAAGRKRKKRT(서열 번호 168), FFFAAGRKRKKRT, NNNAAGRKRKKRT, YYYAAGRKRKKRT, AAKKK, 또는 GR KRKKRT와 같은 당업계에서 공지된 핵으로 향하는 임의의 신호 서열일 수 있다.
미토콘드리아 타겟팅 도메인(d6)은 이것으로 제한되는 것은 아니지만 예컨대 RVSFCRPGWSAMARSRLTATSVSQVQENGFVK(서열 번호 166), 인간 시토크롬 옥시다제 서브유닛 IV의 분절 MLATRVFSLVGKRAISTSVCVR(hCOXIV1), 또는 오르니틴 트랜스카르바밀라제 선도 펩티드와 같은 당업계에서 공지된 미토콘드리아로 향하는 임의의 신호 서열일 수 있다.
융합 단백질, 수송 도메인 및 절단 부위 도메인의 주요 기능 요소 이외에도, 본 발명의 융합 단백질은 도메인(e), 즉 이것으로 제한되는 것은 아니지만 예컨대, CAACAAAC 서열(서열 번호 177) 또는 CAAECAAAC (서열 번호 178)과 같은 삼합체 안정화를 용이하게 하는 폴리시스테인 모티프를 함유할 수 있다.
더욱이, 폴리시스테인 도메인(e)는 도메인 (b)의 한 끝에 연결 및/또는 도메인 (b)의 상이한 끝에 연결될 수 있다.
융합 단백질이 도메인 (b)에 부착된 폴리시스테인 도메인(e) 및 도메인 (a) 및 (b) 사이의 절단 부위의 도메인 (c) 양자를 가질 때, 도메인 (c)는 구조물의 절단 후, 폴리시스테인 도메인(e)가 도메인 (a)에 부착되어 있도록 하는 방식으로 위치한다는 것을 이해하여야 한다. 다시 말해서, 융합 단백질이 폴리시스테인 도메인(e) 및 절단 부위 도메인 (c) 양자를 함유한다면, 도메인(e)는 도메인 (a) 와 도메인 (c) 사이에 위치하거나 또는 도메인(d)의 부착 위치의 맞은편 도메인 (a)의 끝에 위치한다. 본 발명은 구조물의 절단 후 폴리시스테인 도메인이 효과기 펩티드 도메인에 부착되어 있는, 도메인 (c) 및 도메인 (b) 사이에 도메인(e)가 위치할 수 있는 그러한 변이체는 포함하지 않는다.
융합 단백질, 수송 도메인 및 절단 부위 도메인(들)의 주요 기능 요소 외에도, 본 발명의 융합 단백질은 알라닌, 글리신, 글루타민, 시스테인, 히스티딘 및 세린 잔기를 포함하는 가요성 입체 링커(flexible steric linker)(스페이서)의 중성 서열/서열들을 함유할 수 있다. 이러한 링커/스페이서는 공지되어 있으며 문헌에 기술되어 있다. 융합 단백질의 서열로의 이들의 혼입은 숙주 세포에서 그의 과발현의 과정에 의해 생성된 단백질의 올바른 폴딩을 제공하고자 하는 것이다.
특히, 가요성 입체 링커는 GGSG(서열 번호 57), GGGS(서열 번호 58), GGGGS(서열 번호 59), GGSGG(서열 번호 60), GGGSGG(서열 번호 61), GGGSGGG(서열 번호 62), GGGSGGGS(서열 번호 63), GGGSGGGGS(서열 번호 64), ASGG(서열 번호 65), GGGSASGG(서열 번호 66) SGCGS(서열 번호 169), GGGGSGGGG(서열 번호 180),GGSHG(서열 번호 182), SGGCGGS(서열 번호 183) 및 AACAA(서열 번호 184)로 이루어진 군으로부터 선택될 수 있다.
한 실시 양태에서, 도메인 (a) 및 도메인 (b) 사이에 추가로 본 발명의 PEG 분자(PEG 링커)의 융합 단백질에 부착하기에 적당한 서열의 (f) 도메인이 있다.
이러한 링커는 서열 번호 170으로서 첨부된 서열 목록(Sequence Listing)에서 제작된 공지의 서열 AlaSerGlyCysGlyProGlu(한 글자 규정으로 ASGCGPE)일 수 있다. PEG 링커는 또한 첨부된 서열 목록에서 각각, 서열 번호 178, 서열 번호 177 및 서열 번호 179로 지정된 AlaAlaCysAlaAla(AACAA), SerGlyGlyCysGlyGlySer(SGGCGGS) i(SGCGS) 사이로부터 선택될 수 있다.
또 다른 실시 양태에서 도메인 (a) (b) (c) (d) (e) 및 (f)는 특히 글리신 및 글루타민으로 이루어진 군에서 선택된 아미노산 잔기로 형성된, 3까지의 아미노산 잔기에 의해 추가로 분리될 수 있다.
더욱이, 몇몇 실시 양태에서 융합 단백질은, 전체 구조물의 C-말단 부분으로서, 구조물로부터 그의 절단을 허용하는 서열, 유리하게는 프로테아제 절단 부위, 바람직하게는 트롬빈에 의해 인식되는 서열이 선행하는 서열 hTRAIL95-121과 같은 hTRAIL의 비-기능(non-functional) 분절을 함유할 수 있다. 이러한 hTRAIL의 작은 비-기능 분절의 혼입은 전체 구조물에 더 큰 친수성을 부여하며, 따라서 발현 과정중 단백질의 용해도를 개선한다. 정제 단계 후 hTRAIL95-121은 트롬빈에 의해 절단될 것이다. 이 경우, hTRAIL95-121은 약제학적 조성물의 제조에 사용된 융합 단백질에 존재하지 않을 것이다.
당업계에 공지된 트롬빈에 의해 인식된 임의의 서열, 특히 서열 LVPRGS (서열 번호 174)이 사용될 수 있다.
이러한 추가의 hTRAIL95-121 서열은 친유성 효과기 펩티드의 경우에, 및 도메인 (a)가 아미노산 114로 시작하고 전체 TRAIL 서열보다 높을 때 특히 유리하다.
본 발명의 융합 단백질의 특정 실시 양태는 하기로 표시되는 단백질로 이루어진 군으로부터 선택된, 세포 내 작용하는 세포사멸 유발 펩티드를 포함하는 융합 단백질이다:
서열 번호 1, 서열 번호 2, 서열 번호 3, 서열 번호 4, 서열 번호 5, 서열 번호 6, 서열 번호 7, 서열 번호 8, 서열 번호 9, 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17, 서열 번호 18, 서열 번호 19, 서열 번호 20, 서열 번호 21, 서열 번호 22, 서열 번호 23, 서열 번호 93, 서열 번호 94, 서열 번호 95, 서열 번호 96, 서열 번호 97, 서열 번호 98, 서열 번호 99, 서열 번호 100, 서열 번호 101, 서열 번호 102, 서열 번호 103, 서열 번호 104, 서열 번호 105, 서열 번호 106, 서열 번호 107, 서열 번호 108, 서열 번호 109, 서열 번호 110, 서열 번호 111, 서열 번호 112, 서열 번호 113, 서열 번호 114, 서열 번호 115, 서열 번호 116, 서열 번호 117, 서열 번호 118, 서열 번호 119, 서열 번호 120 및 서열 번호 121.
본 발명의 융합 단백질의 다른 특이적 실시 양태는 서열 번호 24, 서열 번호 25 및 서열 번호 26에 의해 표시된 단백질로 이루어진 군으로부터 선택된 세포외에서 작용하는 세포사멸 유발 펩티드를 포함하는 융합 단백질이다.
상술한 예시적인 융합 단백질 구조의 상세한 설명은 도 1 내지 5 및 9 내지 13 및 하기에 제시된 실시예이다.
본 발명에 따라, 융합 단백질에 의해, 2 이상의 단백질 또는 그의 분절을 함유하는 단일 단백질 분자는, 추가의 화학 링커 없이, 이들 각각의 펩티드 사슬 내에서 펩티드 결합을 통해 공유결합으로 연결된 것을 의미한다.
융합 단백질은 또한 대안적으로 단백질 구조물 또는 키메라 단백질로서 기술될 수 있다. 본 발명에 따라, 용어 "구조물" 또는 "키메라 단백질"은, 사용된다면, 상술한 바와 같이 융합 단백질을 언급하는 것으로 이해되어야 한다.
당업자에게 이와 같이 정의된 융합 단백질은 공지의 펩티드 및 단백질의 화학 합성 방법에 의해 합성될 수 있다는 것은 명백할 것이다.
융합 단백질은 화학 펩티드 합성 방법, 특히 캐리어로서 적당한 수지를 사용한 고체상에서의 펩티드 합성 기술을 사용하여 합성될 수 있다. 이러한 기술은 당업계에 통상적으로 공지된 것이며, 그 중에서도 특히 논문 예컨대 「보단스즈키(Bodanszky) 및 보단스즈키, 펩티드 합성의 실시(The Practice of Peptide Synthesis), 1984, Springer-Verlag, 뉴욕, Stewart 등., Solid Phase Peptide Synthesis, 2판, 1984, 피어스 케미컬 컴퍼니(Pierce Chemical Company)」에 기술되어 있다.
융합 단백질은 연속 단백질로서 펩티드의 화합 합성의 방법에 의해 합성될 수 있다. 대안적으로, 단백질의 개별 분절(도메인)은 별개로 합성하고 그 후 제2 펩티드의 카르복실 말단으로부터 한 펩티드 분절의 아미노 말단을 축합하여, 펩티드 결합을 통해 한 연속 펩티드에서 함께 조합할 수 있다. 이러한 기술은 통상적으로 공지된 것이다.
수득한 펩티드의 구조를 증명하기 위해, 펩티드의 분자량을 결정하는 고분해능 질량 분석법(high resolution mass spectrometry)과 같은 공지의 펩티드의 아미노산 조성을 분석하는 공지 방법이 사용될 수 있다. 펩티드 서열을 확인하기 위해, 순차적으로 펩티드를 분해하고 아미노산의 서열을 식별하는 단백질 서열 분석기도 또한 사용할 수 있다.
바람직하게는, 그러나, 본 발명의 융합 단백질은 숙주 세포 내의 융합 단백질을 코딩하는 폴리뉴클레오티드 서열의 유전자 발현 방법에 의해 생성된 재조합 단백질이다.
본 발명의 추가의 양상은 상술한 바와 같은 폴리뉴클레오티드 서열, 특히 융합 단백질을 코딩하는 DNA 서열이다.
바람직하게는, 상술한 바와 같이 융합 단백질을 코딩하는 본 발명에 따른 폴리뉴클레오티드 서열, 특히 DNA는 대장균(E. coli)에서의 발현에 최적화된 서열이다.
본 발명의 또 다른 양상은 또한 상술한 바와 같은 본 발명의 폴리뉴클레오티드 서열, 특히 DNA 서열을 함유하는 발현 벡터이다.
본 발명의 또 다른 양상은 상술한 바와 같은 발현 벡터를 포함하는 숙주 세포이다.
본 발명의 융합 단백질의 발현을 위한 바람직한 숙주 세포는 대장균 세포이다.
융합 단백질을 포함하는 재조합 단백질의 생성 방법은 공지되어 있다. 간단히, 이 기술은 폴리뉴클레오티드 분자의 생성, 예를 들어 표적 단백질의 아미노산 서열을 코딩하고 숙주에서 표적 단백질의 발현을 지시하는 DNA 분자를 생성하는 것으로 구성된다. 그후, 폴리뉴클레오티드 분자를 코딩하는 표적 단백질은 폴리펩티드의 효율적 발현을 보장하는 적절한 발현 벡터로 혼입된다. 재조합 발현 벡터는 그후 형질 감염(transfection)/형질 전환(transformation)을 위해 숙주 세포에 도입되고, 그 결과로서 형질 전환된 숙주 세포가 생성된다. 이것은 그후 형질 전환 세포의 배양에 의해 표적 단백질을 과발현시키고, 수득 된 단백질을 정제하며, 임의로 발현에 사용된 태그 서열을 절단하여 자르거나 또는 단백질을 정제한다.
발현 및 정제의 적당한 기술이 예를 들어 논문「Goeddel, Gene Expression Technology, Methods in Enzymology 185, Academic Press, San Diego, CA(1990), 및 A. Staron 등, Advances Mikrobiol., 2008, 47, 2, 1983-1995」에 기술되어 있다.
숙주 세포에서 DNA 서열의 도입 및 복제를 위한 발현 벡터로서 코스미드, 플라스미드 또는 변형된(modified) 바이러스가 사용될 수 있다. 전형적으로 플라스미드가 발현 벡터로서 사용된다. 적당한 플라스미드는 공지되어 있으며 상업적으로 입수 가능하다.
본 발명의 발현 벡터는 본 발명의 융합 단백질을 코딩하는 폴리뉴클레오티드 분자 및 적당한 숙주 세포에 혼입된 코딩 서열의 전사 및 번역을 위한 필수 조절 서열을 포함한다. 조절 서열의 선택은 숙주 세포의 타입에 의존되며 당업자에 의해 용이하게 수행될 수 있다. 이러한 조절 서열의 예는 전사 프로모터(promoter) 및 인핸서(enhancer) 또는 RNA 폴리머라제 결합 서열, 코딩 서열 전에 삽입된 전사 개시 신호를 함유하는 리보솜 결합 서열, 및 코딩 서열 후에 삽입된 전사 터미네이터 서열이다. 더욱이, 사용된 숙주 세포 및 벡터에 따라, 복제 개시점, 추가적인 DNA 제한 부위, 인핸서, 및 전사의 유도를 허용하는 서열과 같은 기타 서열이 발현 벡터에 도입될 수 있다.
발현 벡터는 형질전환된 세포에 명확한 표현형을 부여하고 형질전환된 세포의 특이적 선택을 할 수 있게 하는 마커 유전자(marker gene) 서열을 또한 포함한다. 더욱이, 벡터는 또한 삽입 없이 플라스미드를 취한 것으로부터 표적 단백질의 삽입된 코딩 서열을 함유하는 재조합 플라스미드로 형질전환된 세포를 구분하도록 허용하는 제2 마커 서열을 함유할 수 있다. 가장 종종, 전형적인 항생물질 내성 마커가 사용된다, 그러나 세포 내(생체 내)의 존재가 자기방사(autoradiography) 기술, 분광 광도법 또는 생체- 및 화학-루미네선스를 사용하여 용이하게 결정될 수 있는 당업계에 공지된 임의의 다른 리포터 유전자(reporter genes)도 사용될 수 있다. 예를 들어, 숙주 세포에 따라, β-갈락토시다아제, β-글룩쿠로니다제(β-gluckuronidase), 루시페라제, 클로람페니콜 아세틸트랜스퍼라제 또는 녹색 형광 단백질과 같은 리포터 유전자가 사용될 수 있다.
더욱이, 발현 벡터는 폴딩이 용이하게 되는 예컨대 페리플라스마(periplasma)인 적절한 세포 구획으로 단백질을 수송하는 신호 서열을 함유할 수 있다. 추가로 N-말단에 부착된 Histag 또는 C-말단에 부착된 GST와 같은 라벨/태그를 코딩하는 서열이 존재할 수 있으며, 이것은 니켈 컬럼 상에서 친화성 크로마토그래피를 통해, 친화성의 원리를 사용하여 생성된 단백질의 후속 정제를 용이하게한다. 추가로 숙주 세포 내에서 단백질 분해에 대하여 단백질을 보호하는 서열, 뿐만 아니라 그의 용해도를 향상시키는 서열도 또한 존재할 수 있다.
표적 단백질의 서열에 부착된 보조 요소는 그의 활성을 차단하거나, 또는 예를 들어 독성으로 인한 것과 같은 또 다른 이유 때문에 장해가 될 수 있다. 이러한 요소는 제거되어야 하는 데, 효소 또는 화학 절단에 의해 성취될 수 있다.
특히, 6-히스티딘 태그 HisTag 또는 친화성 크로마토그래피에 의해 단백질 정제를 허용하도록 부착된 이러한 타입의 다른 마커가 제거되어야 하는데 그 이유는 가용성 TRAIL 단백질의 간 독성에 대한 그의 기술된 효과 때문이다.
원핵 세포: 에스캐리키아 콜라이(Escherichia coli) 또는 바실러스 서브틸리스(Bacillus subtilis)와 같은 박테리아, 사카로마이세스 세르비시아에(Saccharomyces cervisiae) 또는 피치아 파스토리스(Pichia pastoris)와 같은 효모, 및 진핵생물 세포주(곤충, 포유류, 식물)를 포함하는 다양한 공지 숙주 세포를 기재로 하는 이형(heterologous) 발현 시스템이 사용될 수 있다.
바람직하게는, 배양 및 유전자 조작, 및 다량의 수득 생성물로 인해, 대장균(E. coli) 발현 시스템이 사용된다. 따라서, 본 발명의 융합 단백질을 코딩하는 표적 서열을 함유하는 폴리뉴클레오티드 서열이 대장균 내에서 발현을 위해 최적화될 것이다, 즉 당업계에 공지된 가능한 서열 변이체에서 선택된 대장균 내의 발현에 최적인 코돈을 코딩 서열 내에 함유할 것이다. 더욱이, 발현 벡터는 코딩 서열에 부착된 대장균에 적당한 상술한 요소를 함유할 것이다.
따라서, 본 발명의 바람직한 실시 양태에서 대장균 내의 발현을 위해 최적화된 본 발명의 융합 단백질을 코딩하는 서열을 포함하는 폴리뉴클레오티드 서열은 하기로 이루어진 폴리뉴클레오티드 서열의 군으로부터 선택된다:
서열 번호 67, 서열 번호 68, 서열 번호 69, 서열 번호 70, 서열 번호 71, 서열 번호 72, 서열 번호 73, 서열 번호 74, 서열 번호 75, 서열 번호 76, 서열 번호 77, 서열 번호 78, 서열 번호 79, 서열 번호 80, 서열 번호 81, 서열 번호 82, 서열 번호 83, 서열 번호 84, 서열 번호 85, 서열 번호 86, 서열 번호 87, 서열 번호 88), 서열 번호 89, 서열 번호 90, 서열 번호 91, 서열 번호 92, 서열 번호 122, 서열 번호 123, 서열 번호 124, 서열 번호 125, 서열 번호 126, 서열 번호 127, 서열 번호 128, 서열 번호 129, 서열 번호 130, 서열 번호 131, 서열 번호 132, 서열 번호 133, 서열 번호 134, 서열 번호 135, 서열 번호 136, 서열 번호 137, 서열 번호 138, 서열 번호 139, 서열 번호 140, 서열 번호 141, 서열 번호 142, 서열 번호 143), 서열 번호 144, 서열 번호 145, 서열 번호 146, 서열 번호 147; 서열 번호 148, 서열 번호 149, 및 서열 번호 150;
이것은 각각 하기의 아미노산 서열로 이루어진 군으로부터 선택된 아미노산 서열에 상응하는 아미노산 서열을 갖는 융합 단백질을 코딩한다:
서열 번호 1, 서열 번호 2, 서열 번호 3, 서열 번호 4, 서열 번호 5, 서열 번호 6, 서열 번호 7, 서열 번호 8, 서열 번호 9, 서열 번호 10, 서열 번호 11, 서열 번호 12, 서열 번호 13, 서열 번호 14, 서열 번호 15, 서열 번호 16, 서열 번호 17, 서열 번호 18, 서열 번호 19, 서열 번호 20, 서열 번호 21, 서열 번호 22), 서열 번호 23, 서열 번호 24, 서열 번호 25, 서열 번호 26, 서열 번호 93, 서열 번호 94, 서열 번호 95, 서열 번호 96, 서열 번호 97, 서열 번호 98, 서열 번호 99, 서열 번호 100, 서열 번호 101, 서열 번호 102, 서열 번호 103, 서열 번호 104, 서열 번호 105, 서열 번호 106, 서열 번호 107, 서열 번호 108, 서열 번호 109, 서열 번호 110, 서열 번호 111, 서열 번호 112, 서열 번호 113, 서열 번호 114, 서열 번호 115, 서열 번호 116, 서열 번호 117 및 서열 번호 118, 서열 번호 119, 서열 번호 120 및 서열 번호 121.
바람직한 실시 양태에서, 본 발명은 또한 상기 예시된 폴리뉴클레오티드 서열인 서열 번호 67 내지 서열 번호 92 및 서열 번호 122 내지 서열 번호 150의 군으로부터 선택된 폴리뉴클레오티드 서열을 포함하는 대장균의 형질 전환에 적당한 발현 벡터, 뿐만 아니라, 이러한 발현 벡터로 형질전환된 대장균 세포를 제공한다.
형질 전환, 즉 박테리아 숙주 세포, 특히 대장균으로의 DNA 서열의 도입은 예를 들어 저온(4℃)에서 칼슘 이온으로 처리하고, 그후 열 충격(37-42℃에서)을 수행하여 또는 전기천공법에 의해 DNA를 받아들일 수 있도록 제조된 컴피턴트(competent) 세포 상에서 일반적으로 수행된다. 이러한 기술은 공지되어 있으며 일반적으로 발현 시스템의 제조자에 의해 결정된다.
대장균 발현 시스템 내의 본 발명의 융합 단백질의 과발현의 절차가 하기에서 더 기술될 것이다.
본 발명은 또한 활성 성분으로서 상기 정의된 바의 본 발명의 융합 단백질 및 적당한 약제학적으로 허용가능한 담체, 희석제 및 통상의 보조 성분을 함유하는 약제학적 조성물을 제공한다.
약제학적 조성물은 담체 또는 희석제 내에 용해 또는 분산된 본 발명의 유효량의 융합 단백질 및 약제학적으로 허용 가능한 보조 성분을 함유할 것이며, 바람직하게는 단위 투약 형태로 제형화된 약제학적 조성물의 형태 또는 복수의 복용량을 함유하는 제제의 형태일 것이다.
약제학적 형태 및 그의 제형화 방법 뿐만 아니라 기타 성분, 담체 및 희석제는 당업자에게 공지되어 있으며 문헌에 기술되어 있다. 예를 들어, 이들은 논문「Remington's Pharmaceutical Sciences, ed.20, 2000, Mack Publishing Company, 이스턴, 미국」에 기술되어 있다.
용어 "약제학적으로 허용가능한 담체, 희석제, 및 보조 성분"은 당업계에 공지된 임의의 용매, 분산 매체, 계면활성제, 산화방지제, 안정화제, 방부제(예컨대 항세균제, 항진균제), 등장제를 포함한다. 본 발명의 약제학적 조성물은 선택된 투여 경로 및 원하는 투약 형태, 예컨대 액체, 고체 및 경구용 에어로졸 형태, 비경구, 흡입, 국소에 따라 다양한 타입의 담체, 희석제 및 부형제를 함유할 수 있으며, 이러한 선택된 형태는 주사(injection)와 같은 투여 경로를 위해 무균이어야 한다.
본 발명에 따른 약제학적 조성물의 바람직한 투여 경로는 정맥내, 근육내, 피하, 복강내, 종양내(intratumourous)와 같은 주사 경로, 또는 단일 또는 지속 정맥내 주입(infusion)을 포함하는 비경구이다.
한 실시 양태에서, 본 발명의 약제학적 조성물은 종양에 직접적으로 주사하여 투여될 수 있다. 또 다른 실시 양태에서, 본 발명의 약제학적 조성물은 정맥내 투여될 수 있다. 여전히 또 다른 실시 양태에서, 본 발명의 약제학적 조성물은 피하 또는 복강내로 투여될 수 있다.
비경구 투여를 위한 약제학적 조성물은, 필요하다면, 적절한 pH로 완충되고 체액으로 등삼투성(isoosmotic)인 약제학적으로 허용 가능한 수성 또는 비수성 매질 내에 용액 또는 분산액일 수 있으며, 또한 수용체의 조직 또는 혈액과 상용성이 있는 조성물을 만드는 산화 방지제, 완충액, 세균발육 저해제, 가용성 물질도 함유할 수 있다. 조성물에 포함될 수 있는 기타 성분은 예를 들어 물, 에탄올과 같은 알콜, 글리세롤, 프로필렌 글리콜, 액체 폴리에틸렌 글리콜과 같은 폴리올, 트리글리세리드와 같은 지질, 식물성 오일, 리포솜을 포함할 수 있다. 물질의 적당한 유동성 및 입자 크기는 레시틴과 같은 코팅 물질, 및 히드록시프로필셀룰로스 폴리소르베이트와 같은 계면활성제, 등에 의해 제공될 수 있다. 액체 비경구 조성물을 위한 적당한 등장제(isotoning agent)는 예를 들어 글루코스와 같은 당, 및 염화 나트륨 및 그의 조합이다.
대안적으로 주사 또는 주입 투여를 위한 약제학적 조성물은 예컨대 발열원 없는 무균수와 같은 적당한 담체 내에서 사용되기 전에 즉시 재구성을 위해 동결 건조된 분말과 같은 분말 형태일 수 있다.
비경구 투여를 위한 본 발명의 약제학적 조성물은 용액, 스프레이 또는 에어로졸을 포함하는 비내 투여의 형태도 또한 가질 수 있다. 바람직하게는 비내 투여를 위한 형태는 수용액일 것이며 코 분비물과 유사한 특성을 유지하도록 약 5.5 내지 약 6.5의 pH를 유지한 완충 또는 등장성이 될 것이다. 더욱이, 비강내 제제에서 공지된 바의 방부제 또는 안정화제를 함유할 것이다.
조성물은 하나 이상의 성분의 산화를 지연시키는 다양한 산화 방지제를 함유할 수 있다. 더욱이, 미생물의 작용을 방지하기 위해, 조성물은 이것으로 제한되는 것은 아니지만 예를 들어, 파라벤, 클로로-부탄올, 티메로살, 소르브산, 및 이러한 타입의 공지된 유사 물질을 포함하는 다양한 항세균 및 항진균제를 함유할 수 있다.
일반적으로, 본 발명의 약제학적 조성물은 예를 들어 적어도 약 0.01wt% 의 활성 성분을 포함할 수 있다. 특히 더, 조성물은 조성물 단위의 1중량% 내지 75중량%의 양으로, 또는 예를 들어 25중량% 내지 60중량%의 양으로 함유될 수 있으며, 지시된 값으로 제한되는 것은 아니다.
인간을 포함하는 환자에게 투여되는 본 발명에 따른 조성물의 실제 복용량은 체중, 상태의 심각성, 치료될 질환의 타입, 선행 또는 수반되는 치료학적 개입, 투여 환자 및 투여 경로와 같은 육체적 및 생리적 인자에 의해 결정될 것이다. 적당한 단위 복용량, 전체 복용량 및 조성물 내에서 활성 성분의 농도가 치료하는 의사에 의해 결정된다.
조성물은 예를 들어 약 1 마이크로그램/kg의 환자의 체중 내지 약 1000mg/kg의 환자의 체중의 복용량으로, 예컨대 5mg/kg의 체중 내지 100mg/kg의 체중 범위 또는 5mg/kg의 체중 내지 500mg/kg의 체중 범위로 투여될 수 있다.
융합 단백질 및 이를 함유하는 조성물은 항암 또는 항종양을 나타내며 암 질환의 치료를 위해 사용될 수 있다.
본 발명은 인간을 포함하는 포유류의 암 질환 치료를 위한 상기 정의된 바의 본 발명의 융합 단백질의 용도도 또한 제공한다.
본 발명은 이러한 치료가 필요한 대상에게 상기 정의된 바의 본 발명의 융합 단백질의 항암 유효량을, 임의로 적절한 약제학적 조성물의 형태로 투여하는 것을 포함하는 인간을 포함하는 포유류의 암 질환 치료 방법도 또한 제공한다.
본 발명의 융합 단백질은 백혈병, 육아종증(granulomatosis), 골수종(myeloma) 및 기타 혈액암과 같은 혈액암의 치료를 위해 사용될 수 있다. 융합 단백질은 또한 유방암, 비소세포성 폐암(non-small cell lung cancer)을 포함하는 폐암, 대장암, 췌장암, 난소암, 방광암, 전립선암, 신장암, 뇌종양(brain cancer), 등과 같은 고형 종양의 치료를 위해 또한 사용될 수 있다.
암의 치료에서 융합 단백질 투여의 적절한 경로는 투여 경로를 위한 적절한 형태 및 조성물의 주사 또는 주입의 형태로 본 발명의 융합 단백질을 투여하는 것으로 구성되는 특히 비경구 경로일 것이다.
본 발명은 하기의 특정 융합 단백질의 일반 절차 및 실시예에서 더 상세히 기술될 것이다.
융합 단백질의 과발현을 위한 일반적 절차
플라스미드의 제조
표적 융합 단백질의 아미노산 서열은 대장균(Escherichia coli) 내의 발현을 위해 최적화된 코돈을 포함하는, 그것을 코딩하는 DNA 서열을 생성하도록 하기 위해 템플레이트로서 사용되었다. 이러한 절차는 대장균(Escherichia coli) 내의 표적 단백질 합성의 추가 단계의 효율을 향상시키도록 허용한다. 수득한 뉴클레오티드 서열은 그 후 자동적으로 합성되었다. 추가로, 제한 효소 Ndel(선도 사슬의 5'-종결에서) 및 Xhol(선도 사슬의 3'-종결에서)의 절단 부위는 표적 단백질을 코딩하는 수득한 유전자에 첨가하였다. 이들은 벡터 pET28a(노바겐)로 유전자를 클로닝하기 위해 사용되었다. 이들은 또한 다른 벡터에 단백질을 코딩하는 유전자를 클로닝하기 위해 사용될 수 있다. 이러한 구조물로부터 발현된 표적 단백질은 트롬빈에 위해 인식된 부위에 의해 진행된 폴리히스티딘 태그(6 히스티딘)로 N-말단에 설치되며, 이것은 후속하여 친화성 크로마토그래피를 통해 정제를 위해 제공되었다. 수득한 구조물의 정확성은 효소 Ndel 및 Xhol을 사용하여 단리된 플라스미드의 제한 분석에 의해, 이어서 표적 단백질의 전체 리딩 프레임의 자동 서열화에 의해 우선적으로 확인되었다. 서열화를 위해 사용된 프라이머는 벡터 내에 존재하는 T7 프로모터(5'-TAATACGACTCACTATAGG-3') 및 T7 터미네이터(5'-GCTAGTTATTGCTCAGCGG-3')의 서열에 상보적이다.
수득한 플라스미드는 제조자의 추천에 따라 형질전환된 통상의 대장균 균주 내의 표적 융합 단백질의 과발현을 위해 사용되었다. 선택 배지(LB 한천, 카나마이신 50 ug/ml, 1% 글루코스) 상에서 수득된 콜로니는 카나마이신(50ug/ml) 및 1% 글루코스가 보충된 LB 액체 배지 내에서 밤새 배양하여 제조하기 위해 사용되었다. 진탕 배양기에서 약 15시간의 성장 후, 배양액은 적절한 배양액을 접종하기 위해 사용되었다.
융합 단백질의 과발현 및 정제 - 일반 절차 A
카나마이신(30ug/ml) 및 100uM 황산 아연이 있는 LB 배지를 밤새 배양액으로 접종하였다. 배양액은 600nm에서 광학 밀도(OD)가 0.60-0.80에 도달될 때까지 37℃에서 배양하였다. 그 후 IPTG는 0.25 -1mM 범위의 최종 농도까지 첨가하였다. 25℃에서 진탕(shaking) 하면서 배양 후(3.5-20h), 배양액은 25분간 6,000g에서 원심분리하였다.
박테리아 펠릿은 pH 7.4의 50mM KH2PO4, 0.5M NaCl, 10mM 이미다졸을 함유하는 완충액에서 재현탁 시켰다. 현탁액은 8분 동안 얼음 상에서 초음파(40% 진폭, 15-초 펄스, 10초 간격)처리하였다. 수득한 추출물은 20.000g, 4℃에서 40분 동안 원심분리하여 맑게 하였다. Ni-세파로오스(GE 헬스케어) 수지는 박테리아 세포 추출물의 제조용으로 사용된 완충액으로 평형하게 하여 전처리하였다. 수지는 그후 추출물의 원심 분리 후 상청액으로 4℃에서 밤새 배양하였다. 그후, 이것은 크로마토그래피 컬럼에 적재하고 pH 7.4의 50mM KH2PO4, 0.5M NaCl, 20mM 이미다졸 완충액 15 내지 50 부피로 세정하였다. 수득된 단백질은 pH 7.4의 0.5M NaCl이 있는 50mM KH2PO4 완충액 내에서 이미다졸 구배(gradient)를 사용하여 컬럼으로부터 용리시켰다. 수득된 분획은 SDS-PAGE로 분석하였다. 적절한 분획은 혼합하고 50mM 트리스 완충액, pH 7.2, 150mM NaCl, 500mM L-아르기닌, 0.1mM ZnSO4, 0.01% 트윈(Tween) 20에 대하여 4℃에서 밤새 투석하고 동시에 Histag는 트롬빈(1:50)으로 절단하였다. 절단 후, 트롬빈은 벤즈아미딘 세파로오스TM 수지를 사용하여 표적 융합 단백질로부터 분리하였다. 생성물의 순도는 SDS-PAGE 전기영동에 의해 분석하였다(Maniatis 등, Molecular Cloning. 콜드 스프링 하버, 뉴욕, 1982).
융합 단백질의 과발현 및 정제 - 일반 절차 B
카나마이신(30ug/ml) 및 100uM 황산 아연이 있는 LB 배지를 밤새 배양액으로 접종하였다. 배양액은 600nm에서 광학 밀도(OD)가 0.60-0.80에 도달될 때까지 37℃에서 배양하였다. 그후 IPTG는 0.5 -1mM 범위의 최종 농도까지 첨가하였다. 25℃에서 진탕 하면서 20 시간 인큐베이션 후, 배양액은 25분 동안 6,000g에서 원심분리하였다.
과발현 후 박테리아 세포는 pH 7.8의 50mM KH2PO4, 0.5M NaCl, 10mM 이미다졸, 5mM 베타-메르캅토에탄올, 0.5mM PMSF(페닐메틸술포닐 플루오라이드)를 함유하는 완충액 내에서 프렌치 프레스(French Press)로 분열시켰다. 수득한 추출물은 8.000g에서 50분 동안 원심분리하여 맑게 하였다. Ni-세파로오스 수지는 수득된 상청액으로 밤새 배양하였다. 그후 결합 단백질이 있는 수지는 크로마토그래피 컬럼에 가득 넣었다. 비결합 단백질을 함유하는 분획을 세정-제거하기 위해, 컬럼은 15 내지 50 부피의 완충액 50mM KH2PO4, 0.5M NaCl, 10mM 이미다졸, 5mM 베타-메르캅토에탄올, 0.5mM PMSF(페닐메틸술포닐 플루오라이드), pH7.8로 세정하였다. 그후, 베드와 특이적으로 결합하는 대부분의 단백질을 세정-제거하기 위해, 컬럼은 50mM KH2PO4, 0.5M NaCl, 500mM 이미다졸, 10% 글리세롤, 0,5mM PMSF를 함유하는 완충액, pH 7.5로 세정하였다. 수득된 분획은 SDS-PAGE로 분석하였다(Maniatis 등, Molecular Cloning. 콜드 스프링 하버, 뉴욕, 1982). 표적 단백질을 함유하는 분획을 합하고 트롬빈으로 절단하여(1U/4mg의 단백질, 16℃에서 8시간) 폴리히스티딘 태그를 제거하였다. 그후, 분획은 완충액 제제(500mM L-아르기닌, 50mM 트리스, 2,5mM ZnSO4, pH 7.4)에 대하여 투석되었다.
2-D 전기영동을 사용한 융합 단백질의 특징 부여
수득된 단백질을 더 특징짓고 크로마토그래피 조건을 정확하게 선택하기 위하여, 단백질의 등전점(isoelectric points)을 결정하였다. 이러한 목적을 위하여, 하기 스케쥴에 따라 2단계로 2차원 전기영동(2-D)방법을 사용하였다.
단계 1. pH 구배 및 변성 조건에서 단백질의 등전점포커싱(isoelectrofocusing).
1-2mg/ml의 농도에서 단백질 조제를 아세톤 내에서 10% 트리클로로-아세트산 및 0.07% 베타-메르캅토에탄올을 함유하는 침전 용액과 1:1비로 혼합하여 침전시켰다. 혼합물은 -20℃에서 30분 동안 배양하고 그후 15,000g 및 4℃에서 25분 동안 원심분리하였다. 상청액은 제거하고 펠릿은 0.07% 베타-메르캅토에탄올과 함께 차가운 아세톤으로 2회 세정하였다. 그후, 아세톤 잔기는 탐지 가능한 냄새가 검출되지 않을 때까지 증발시켰다. 단백질 펠릿은 후속하여 사용된 스트립에 따라, pH 3-11 또는 6-11의 프로파일로 250ml의 재수화(rehydration) 완충액 8M 우레아, 1% CHAPS, 15mM DTT, 0.5% 양쪽성 전해질(GE 헬스케어) 내에서 현탁 시켰다. 단백질 용액은 등전점포커싱을 위해 세라믹 챔버에 놓고, 이어서 적절한 pH 프로파일(3-11 또는 6-11)로 13cm 드라이스트립(DryStrip)(GE 헬스케어)하였다. 전체를 미네랄 오일 층으로 덮었다. 챔버를 Ettan IPGphor III 장치에 놓고, 여기에서 등전점포커싱은 스트립의 면적 및 pH 프로파일에 할당된 하기 프로그램에 따라 수행하였다:
20℃에서 16시간 탈수
고정된 pH 구배에서 전기장 내의 포커싱
그 후, 포커싱된 단백질을 함유하는 스트립은 탈이온수 내에서 1분간 세정하고, 쿠마시 브릴리언트(Coomassie Brilliant)로 염색하고 그후 탈색하며 단백질의 위치를 표시하기 위해 상으로 보관하였다. 변색된 스트립은 하기 조성의 완충액으로 2 x 15분 평형을 유지하였다: 50mM 트리스-HCl pH 8.8, 6M 우레아, 1% DTT, 2% SDS, 30% 글리세롤.
단계 2. SDS-PAGE에 의한 제2 방향에서의 분리.
스트립은 표준 크기에 대하여 단일 웰(single well)을 함유하는 12.5% 폴리아크릴아미드 겔 상에 놓고 그후 3시간 동안 200V의 전압에서 SDS-PAGE를 위한 장치로 분리를 수행하였다. 겔은 쿠마시 브릴리언트로 염색하고 그 후 적용 스케일로 보관하였다. 단백질은 크기의 표준을 기준으로 그의 중량을 측정하여 확인하였고, 그의 IPI는 제조자(GE 헬스케어)에 의해 제공된 곡선(애노드로 표시된 끝으로부터 스트립 길이의 %에 대한 pH의 비)을 기준으로 하여 6-11의 스케일로 판독되거나 또는 등전점포커싱 캘리브레이션 키트(GE 헬스케어)의 수단에 의해 실험으로 측정된 곡선을 기준으로 3-11의 스케일로 판독되었다 .
본 발명의 융합 단백질의 예시적인 실시예가 하기에 기술된다.
실시예 1. 서열 번호 1의 융합 단백질
서열 번호 1의 단백질은 TRAIL121-281 서열의 N-말단에서 Bax 단백질(서열 번호 30)의 BH3 도메인으로부터 유도된 16-아미노산 펩티드가 효과기 펩티드로서 부착된, 194 아미노산의 길이 및 22.7 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 16-아미노산 서열의 C-말단에 7Arg/R 잔기의 폴리아르기닌 서열이 부착된다. 폴리아르기닌 서열은 세포막의 침투 및 세포로의 융합 단백질의 수송을 돕는다. 폴리아르기닌 서열 및 TRAIL 도메인 사이에 유로키나제 uPA(서열 번호 52) 및 메탈로프로테아제 MMP(서열 번호 51)에 의해 인식되는 서열들이 서로 나란히 연속적으로 혼입되어 있으며, 이로 인해 융합 단백질의 내재화 시 효과기 펩티드가 종양 환경에서 절단될 것이다.
융합 단백질의 구조는 도 1에 도식적으로 나타내었으며 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열이 각각 서열 번호 1 및 서열 번호 67로 하기에 나타낸다.
아미노산 서열: 서열 번호 1
1 KKLSECLKRI GDELDSRRRR RRRRVVRPLG LAGRVAAHIT GTRGRSNTLS
51 SPNSKNEKAL GRKINSWESS RSGHSFLSNL HLRNGELVIH EKGFYYIYSQ
101 TYFRFQEEIK ENTKNDKQMV QYIYKYTSYP DPILLMKSAR NSCWSKDAEY
151 GLYSIYQGGI FELKENDRIF VSVTNEHLID MDHEASFFGA FLVG
DNA 서열: 서열 번호 67
1 GCCCACCAGA AATGCACCAA AAAAGCTGGC TTCATGATCC ATATCAATCA GATGTTCATT GGTCACGCTC ACAAAAATGC GATCATTTTC TTTCAGTTCA
101 AAAATGCCAC CCTGATAAAT GCTATACAGG CCATATTCTG CATCTTTGCT CCAACAGCTA TTACGTGCGC TTTTCATCAG CAGAATCGGA TCCGGATAGC
201 TGGTATATTT ATAAATGTAC TGCACCATTT GTTTATCATT TTTGGTATTT TCTTTAATTT CTTCCTGAAA GCGAAAATAG GTCTGGCTAT AAATATAATA
301 AAAGCCTTTT TCATGAATCA CCAGTTCACC ATTACGCAGA TGCAGATTGC TCAGAAAGCT ATGACCGCTA CGGCTGCTTT CCCAGCTATT AATTTTGCGA
401 CCCAGGGCTT TTTCATTTTT GCTATTCGGG CTGCTCAGGG TATTGCTACG ACCACGGGTG CCGGTAATAT GTGCTGCAAC ACGACCTGCC AGACCCAGCG
501 GACGAACAAC ACGACGACGG CGACGACGAC GACGGCTATC CAGTTCATCA CCAATACGTT TCAGGCATTC GCTCAGTTTT TT
상술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 양자가 노바겐(Novagen)으로부터 입수한 대장균 균주 BL21(DE3) 및 튜너(Tuner)(DE3) pLysS를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 2. 서열 번호 2의 융합 단백질
서열 번호 2의 융합 단백질은 121-281TRAIL 서열의 N-말단에서 Bid 단백질(서열 번호 31)로부터 유도된 16-아미노산 펩티드가 효과기 펩티드로서 부착된, 193 아미노산의 길이 및 22.5kDa의 질량을 갖는 단백질이다. 추가로, 효과기 단백질의 C-말단에 7 Arg 잔기로 이루어진 폴리아르기닌 서열이 부착된다. 폴리아르기닌 서열은 세포막의 침투 및 세포로의 융합 단백질의 수송을 돕는다. 폴리아르기닌 서열 및 TRAIL 사이에 메탈로프로테아제 MMP(서열 번호 51) 및 유로키나제 uPA(서열 번호 52)에 의해 인식되는 서열들이 서로 나란히 연속적으로 혼입되어 있으며, 이로 인해 융합 단백질의 내재화 시 효과기 펩티드가 종양 환경에서 절단될 것이다.
융합 단백질의 구조는 도 1에 도식적으로 나타내었으며 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열이 각각 서열 번호 2 및 서열 번호 68로 하기에 나타낸다.
아미노산 서열: 서열 번호 2
1 RNIARHLAQV GDSMDRRRRR RRRVVRPLGL AGRVAAHITG TRGRSNTLSS
51 PNSKNEKALG RKINSWESSR SGHSFLSNLH LRNGELVIHE KGFYYIYSQT
101 YFRFQEEIKE NTKNDKQMVQ YIYKYTSYPD PILLMKSARN SCWSKDAEYG
151 LYSIYQGGIF ELKENDRIFV SVTNEHLIDM DHEASFFGAF LVG
DNA 서열: 서열 번호 68
1 CGTAATATTG CACGTCATCT GGCACAGGTT GGTGATAGCA TGGACCGTCG TCGTCGTCGC CGTCGTCGTG TTGTTCGTCC GCTGGGTCTG GCAGGTCGTG
101 TTGCAGCACA TATTACCGGC ACCCGTGGTC GTAGCAATAC CCTGAGCAGC CCGAATAGCA AAAATGAAAA AGCCCTGGGT CGCAAAATTA ATAGCTGGGA
201 AAGCAGCCGT AGCGGTCATA GCTTTCTGAG CAATCTGCAT CTGCGTAATG GTGAACTGGT GATTCATGAA AAAGGCTTTT ATTATATTTA TAGCCAGACC
301 TATTTTCGCT TTCAGGAAGA AATTAAAGAA AATACCAAAA ATGATAAACA AATGGTGCAG TACATTTATA AATATACCAG CTATCCGGAT CCGATTCTGC
401 TGATGAAAAG CGCACGTAAT AGCTGTTGGA GCAAAGATGC AGAATATGGC CTGTATAGCA TTTATCAGGG TGGCATTTTT GAACTGAAAG AAAATGATCG
501 CATTTTTGTG AGCGTGACCA ATGAACATCT GATTGATATG GATCATGAAG CCAGCTTTTT TGGTGCATTT CTGGTGGGC
상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 BL21(DE3)를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 3. 서열 번호 3의 융합 단백질
서열 번호 3의 융합 단백질은 121-281TRAIL 서열의 C-말단에서 리보뉴클레아제 RNase A(서열 번호 32)의 동족체가 효과기 펩티드로서 부착된, 303 아미노산의 길이 및 34.2kDa의 질량을 갖는 단백질이다. 폴리아르기닌 서열 및 TRAIL의 서열 사이에 메탈로프로테아제 MMP(서열 번호 51) 및 유로키나제 uPA(서열 번호 52)에 의해 인식되는 서열들이 순차적으로 서로 나란히 혼입되어 있으며, 이로 인해 융합 단백질의 내재화 시 효과기 펩티드가 종양 환경에서 절단될 것이다.
단백질은 또한 TRAIL 도메인 서열 및 절단 부위의 서열 사이에, 가요성 글리신-세린 링커 GGSG(서열 번호 57)를 함유한다. 더욱이, 효과기 펩티드의 C-말단에서, 단백질은 전체 구조물의 C-말단 부분이기도 한, 소포체로 향하는 서열 KEDL(서열 번호 56)를 함유한다.
융합 단백질의 구조는 도 1에 도식적으로 나타내었으며 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열이 각각 서열 번호 3 및 서열 번호 69로 하기에 나타낸다.
아미노산 서열: 서열 번호 3
1 RVAAHITGTR GRSNTLSSPN SKNEKALGRK INSWESSRSG HSFLSNLHLR
51 NGELVIHEKG FYYIYSQTYF RFQEEIKENT KNDKQMVQYI YKYTSYPDPI
101 LLMKSARNSC WSKDAEYGLY SIYQGGIFEL KENDRIFVSV TNEHLIDMDH
151 EASFFGAFLV GGGSGPLGLA GRVVRKETAA AKFERQHMDS STSAASSSNY
201 CNQMMKSRNL TKDRCKPVNT FVHESLADVQ AVCSQKNVAC KNGQTNCYQS
251 YSTMSITDCR ETGSSKYPNC AYKTTQANKH IIVACEGNPY VPVHFDASVK
301 EDL
DNA 서열: 서열 번호 69
1 CGTGTTGCAG CACATATTAC CGGCACCCGT GGTCGTAGCA ATACCCTGAG CAGCCCGAAT AGCAAAAATG AAAAAGCCCT GGGTCGCAAA ATTAATAGCT
101 GGGAAAGCAG CCGTAGCGGT CATAGCTTTC TGAGCAATCT GCATCTGCGT AATGGTGAAC TGGTGATTCA TGAAAAAGGC TTTTATTATA TTTATAGCCA
201 GACCTATTTT CGCTTTCAGG AAGAAATTAA AGAAAATACC AAAAATGACA AACAAATGGT GCAGTATATC TACAAATACA CCAGCTATCC GGATCCGATT
301 CTGCTGATGA AAAGCGCACG TAATAGCTGT TGGAGCAAAG ATGCAGAATA TGGCCTGTAT AGCATTTATC AGGGTGGCAT TTTTGAACTG AAAGAAAATG
401 ATCGCATTTT TGTGAGCGTG ACCAATGAAC ATCTGATTGA TATGGATCAT GAAGCCAGCT TTTTTGGTGC ATTTCTGGTT GGTGGTGGTA GCGGTCCGCT
501 GGGTCTGGCA GGTCGTGTTG TTCGTAAAGA AACCGCAGCA GCCAAATTTG AACGTCAGCA CATGGATAGC AGCACCAGCG CAGCAAGCAG CAGCAATTAT
601 TGCAATCAGA TGATGAAAAG CCGCAATCTG ACCAAAGATC GTTGTAAACC GGTGAATACC TTTGTTCATG AAAGCCTGGC AGATGTTCAG GCAGTTTGCA
701 GCCAGAAAAA TGTGGCCTGT AAAAATGGTC AGACCAATTG CTATCAGAGC TATAGCACCA TGAGCATTAC CGATTGTCGT GAAACCGGTA GCAGCAAATA
801 TCCGAATTGC GCCTATAAAA CCACCCAGGC CAATAAACAT ATTATTGTGG CCTGTGAAGG CAATCCGTAT GTTCCGGTTC ATTTTGATGC CAGCGTGAAA
901 GAAGATCTG
상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 BL21(DE3)를 사용하여 일반 절차 B에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 4. 서열 번호 4의 융합 단백질
서열 번호 4의 단백질은 TRAIL121-281 서열의 C-말단에서 리보뉴클레아제 RNase A(서열 번호 32)의 동족체가 효과기 펩티드로서 부착된, 293 아미노산의 길이 및 33.2kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드 및 TRAIL의 서열 사이에, 가요성 글리신-세린 링커 GGGSGGGS(서열 번호 63)이 있다.
융합 단백질의 구조는 도 1에 도식적으로 나타내었으며 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열이 각각 서열 번호 4 및 서열 번호 70으로 하기에 나타낸다.
아미노산 서열: 서열 번호 4
1 RVAAHITGTR GRSNTLSSPN SKNEKALGRK INSWESSRSG HSFLSNLHLR
51 NGELVIHEKG FYYIYSQTYF RFQEEIKENT KNDKQMVQYI YKYTSYPDPI
101 LLMKSARNSC WSKDAEYGLY SIYQGGIFEL KENDRIFVSV TNEHLIDMDH
151 EASFFGAFLV GGGGSGGGSK ETAAAKFERQ HMDSSTSAAS SSNYCNQMMK
201 SRNLTKDRCK PVNTFVHESL ADVQAVCSQK NVACKNGQTN CYQSYSTMSI
251 TDCRETGSSK YPNCAYKTTQ ANKHIIVACE GNPYVPVHFD ASV
DNA 서열: 서열 번호 70
1 CGTGTTGCAG CACATATTAC CGGCACCCGT GGTCGTAGCA ATACCCTGAG CAGCCCGAAT AGCAAAAATG AAAAAGCACT GGGTCGCAAA ATTAATAGCT
101 GGGAAAGCAG CCGTAGCGGT CATAGCTTTC TGAGCAATCT GCATCTGCGT AATGGTGAAC TGGTGATTCA TGAAAAAGGC TTTTATTATA TTTATAGCCA
201 GACCTATTTT CGCTTTCAAG AAGAAATTAA AGAAAATACC AAAAATGATA AGCAGATGGT GCAGTATATC TATAAATATA CCAGCTATCC GGATCCGATT
301 CTGCTGATGA AAAGCGCACG TAATAGCTGT TGGAGCAAAG ATGCAGAATA TGGTCTGTAT AGCATTTATC AGGGTGGCAT TTTTGAACTG AAAGAAAATG
401 ATCGCATTTT TGTGAGCGTG ACCAATGAAC ATCTGATTGA TATGGATCAT GAAGCCAGCT TTTTTGGTGC ATTTCTGGTT GGTGGTGGTG GTAGCGGTGG
501 TGGTAGTAAA GAAACCGCAG CAGCAAAATT TGAACGTCAG CACATGGATA GCAGCACCAG CGCAGCAAGC AGCAGCAATT ATTGTAATCA GATGATGAAA
601 AGCCGCAATC TGACCAAAGA TCGTTGTAAA CCGGTGAATA CCTTTGTTCA TGAAAGCCTG GCAGATGTTC AGGCAGTTTG TAGCCAGAAA AATGTTGCCT
701 GTAAAAATGG TCAGACCAAT TGCTATCAGA GCTATAGCAC CATGAGCATT ACCGATTGTC GTGAAACCGG TAGCAGCAAA TATCCGAATT GTGCATATAA
801 AACCACCCAG GCCAATAAAC ATATTATTGT TGCCTGTGAA GGCAATCCGT ATGTTCCGGT TCATTTTGAT GCAAGCGTT
상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 스트라테이진(Stratagene)으로부터 입수한 대장균 균주 BL21DE3pLysSRIL 및 노바겐으로부터 입수한 튜너(DE3)를 사용하여 일반 절차 B에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 5. 서열 번호 5의 융합 단백질
서열 번호 5의 단백질은 121-281TRAIL 서열의 C-말단에서 시토크롬 C의 서열(서열 번호 33)이 효과기 펩티드로서 부착된, 283 아미노산의 길이 및 31kDa의 질량을 갖는 융합 단백질이다. TRAIL 도메인 및 효과기 단백질의 서열 사이에 메탈로프로테아제 MMP(서열 번호 51) 및 유로키나제 uPA(서열 번호 52)에 의해 인식되는 서열들이 순차적으로 서로 나란히 혼입되어 있으며, 이로 인해 융합 단백질의 내재화 시 효과기 펩티드가 종양 환경에서 절단될 것이다. 단백질은 또한 TRAIL 도메인 서열 및 절단 부위의 서열 사이에, 가요성 글리신-세린 링커 GGSG(서열 번호 57)를 함유한다. 더욱이, 효과기 펩티드의 C-말단에서, 단백질은 전체 구조물의 C-말단 부분인, 소포체로 향하는 서열 KEDL(서열 번호 56)를 함유한다.
융합 단백질의 구조는 도 1에 도식적으로 나타내었으며 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열이 각각 서열 번호 5 및 서열 번호 71로 하기에 나타낸다.
아미노산 서열: 서열 번호 5
1 RVAAHITGTR GRSNTLSSPN SKNEKALGRK INSWESSRSG HSFLSNLHLR
51 NGELVIHEKG FYYIYSQTYF RFQEEIKENT KNDKQMVQYI YKYTSYPDPI
101 LLMKSARNSC WSKDAEYGLY SIYQGGIFEL KENDRIFVSV TNEHLIDMDH
151 EASFFGAFLV GGGSGPLGLA GRVVRGDVEK GKKIFIMKCS QCHTVEKGGK
201 HKTGPNLHGL FGRKTGQAPG YSYTAANKNK GIIWGEDTLM EYLENPKKYI
251 PGTKMIFVGI KKKEERADLI AYLKKATNEK EDL
DNA 서열: 서열 번호 71
1 CAGATCTTCT TTTTCATTGG TGGCTTTTTT CAGATAGGCA ATCAGATCTG CGCGTTCTTC TTTTTTTTTA ATGCCCACAA AAATCATTTT CGTACCCGGA
101 ATATATTTTT TCGGATTTTC CAGATATTCC ATCAGGGTAT CTTCACCCCA AATAATGCCT TTGTTTTTAT TGGCTGCGGT ATAGCTATAA CCCGGTGCCT
201 GACCGGTTTT ACGACCAAAC AGACCATGCA GATTCGGACC GGTTTTATGT TTGCCACCTT TTTCAACGGT ATGACACTGG CTGCATTTCA TAATAAAAAT
301 TTTTTTGCCT TTTTCCACAT CACCACGAAC AACACGACCT GCCAGACCCA GCGGACCGCT ACCACCACCA ACCAGAAATG CACCAAAAAA GCTGGCTTCA
401 TGATCCATAT CAATCAGATG TTCATTGGTC ACGCTCACAA AAATGCGATC ATTTTCTTTC AGTTCAAAAA TGCCACCCTG ATAAATGCTA TACAGGCCAT
501 ATTCTGCATC TTTGCTCCAA CAGCTATTAC GTGCGCTTTT CATCAGCAGA ATCGGATCCG GATAGCTGGT ATATTTATAA ATGTACTGCA CCATTTGTTT
601 ATCGTTTTTG GTATTTTCTT TAATTTCTTC CTGAAAGCGA AAATAGGTCT GGCTATAAAT ATAATAAAAG CCTTTTTCAT GAATCACCAG TTCACCATTA
701 CGCAGATGCA GATTGCTCAG AAAGCTATGA CCGCTACGGC TGCTTTCCCA GCTATTAATT TTGCGACCCA GGGCTTTTTC ATTTTTGCTA TTCGGGCTGC
801 TCAGGGTATT GCTACGACCA CGGGTGCCGG TAATATGTGC TGCAACACGC AT
상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 튜너(DE3)를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 6. 서열 번호 6의 융합 단백질
서열 번호 6의 단백질은 121-281TRAIL 서열의 C-말단에서 시토크롬 C의 서열(서열 번호 33)이 효과기 펩티드로서 부착된, 407 아미노산의 길이 및 45.2kDa의 질량을 갖는 융합 단백질이다. TRAIL 도메인의 서열 및 효과기 펩티드 사이에 퓨린(서열 번호 53) 및 녹농균(Pseudomonas aeruginosa)으로부터의 전좌 도메인(서열 번호 54)에 의해 인식되는 서열이 있다. 단백질은 또한 가요성 링커를 함유한다: 퓨린에 의해 인식된 TRAIL의 서열 및 절단 부위의 서열 사이에 가요성 글리신-세린 링커 GGGS(서열 번호 58)가 있으며, 퓨린 및 녹농균(Pseudomonas aeruginosa)으로부터의 전좌 도메인에 의해 인식된 절단 부위의 서열 사이에 가요성 글리신-세린 링커 ASGG(서열 번호 65)가 있으며, 전좌 도메인의 서열 및 시토크롬 C의 서열 사이에 가요성 글리신-세린 링커 GGGSGGG(서열 번호 62)가 있다.
더욱이, 효과기 펩티드 도메인의 C-말단에서, 단백질은 전체 구조물의 C-말단 부분인, 소포체로 향하는 서열 KEDL(서열 번호 56)를 함유한다.
융합 단백질의 구조는 도 2에 도식적으로 나타내었으며 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열이 각각 서열 번호 6 및 서열 번호 72로 하기에 나타낸다.
아미노산 서열: 서열 번호 6
1 RVAAHITGTR GRSNTLSSPN SKNEKALGRK INSWESSRSG HSFLSNLHLR
51 NGELVIHEKG FYYIYSQTYF RFQEEIKENT KNDKQMVQYI YKYTSYPDPI
101 LLMKSARNSC WSKDAEYGLY SIYQGGIFEL KENDRIFVSV TNEHLIDMDH
151 EASFFGAFLV GGGGSRKKRA SGGPEGGSLA ALTAHQACHL PLETFTRHRQ
201 PRGWEQLEQC GYPVQRLVAL YLAARLSWNQ VDQVIANALA SPGSGGDLGE
251 AIRESPEQAR LALTLAAAES ERFVRQGTGN DEAGAANGPA DGGGSGGGMG
301 DVEKGKKIFI MKCSQCHTVE KGGKHKTGPN LHGLFGRKTG QAPGYSYTAA
351 NKNKGIIWGE DTLMEYLENP KKYIPGTKMI FVGIKKKEER ADLIAYLKKA
401 TNEKDEL
DNA 서열: 서열 번호 72
1 CGTGTTGCAG CACATATTAC CGGCACCCGT GGTCGTAGCA ATACCCTGAG CAGCCCGAAT AGCAAAAATG AAAAAGCACT GGGTCGCAAA ATTAATAGCT
101 GGGAAAGCAG CCGTAGCGGT CATAGCTTTC TGAGCAATCT GCATCTGCGT AATGGTGAAC TGGTGATTCA TGAAAAAGGC TTTTATTATA TTTATAGCCA
201 GACCTATTTT CGCTTTCAAG AAGAAATTAA AGAAAATACC AAAAATGACA AACAAATGGT GCAGTATATC TATAAATATA CCAGCTATCC GGATCCGATT
301 CTGCTGATGA AAAGCGCACG TAATAGCTGT TGGAGCAAAG ATGCAGAATA TGGTCTGTAT AGCATTTATC AGGGTGGCAT TTTTGAACTG AAAGAAAATG
401 ATCGCATTTT TGTGAGCGTG ACCAATGAAC ATCTGATTGA TATGGATCAT GAAGCCAGCT TTTTTGGTGC ATTTCTGGTT GGTGGTGGTG GTAGCCGTAA
501 AAAACGTGCA AGCGGTGGTC CGGAAGGTGG TAGCCTGGCA GCACTGACCG CACATCAGGC ATGTCATCTG CCGCTGGAAA CCTTTACCCG TCATCGTCAG
601 CCTCGTGGTT GGGAACAGCT GGAACAGTGT GGTTATCCGG TTCAGCGTCT GGTTGCACTG TATCTGGCAG CACGTCTGAG CTGGAATCAG GTTGATCAGG
701 TTATTGCAAA TGCACTGGCA AGTCCGGGTA GCGGTGGTGA TCTGGGTGAA GCAATTCGTG AAAGTCCGGA ACAGGCACGT CTGGCACTGA CCCTGGCAGC
상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 튜너(DE3)를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 7. 서열 번호 7의 융합 단백질
서열 번호 7의 단백질은 TRAIL114-281 서열의 N-말단에서 그랜자임 B의 서열(서열 번호 34)이 효과기 펩티드로서 부착된, 409 아미노산의 길이 및 46.1kDa의 질량을 갖는 융합 단백질이다. TRAIL 도메인의 서열 및 효과기 펩티드 그랜자임 B의 서열 사이에 부가적으로 가요성 글리신-세린 링커 GGGGS(서열 번호 59)에 의해 측면에 위치한, 퓨린 절단 부위(서열 번호 53)가 있다.
융합 단백질의 구조는 도 2에 도식적으로 나타내었으며 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열이 각각 서열 번호 7 및 서열 번호 73으로 하기에 나타낸다.
아미노산 서열: 서열 번호 7
1 IIGGHVAKPH SRPYMAYLMI WDQKSLKRCG GFLIRDDFVL TAAHCWGSSI
51 NVTLGAHNIK EQEPTQQFIP VKRAIPHPAY NPKNFSNDIM LLQLERKAKR
101 TRAVQPLRLP SNKAQVKPGQ TCSVAGWGQT APLGKHSHTL QEVKMTVQED
151 RKCESDLRHY YDSTIELCVG DPEIKKTSFK GDSGGPLVCN KVAQGIVSYG
201 RNNGMPPRAC TKVSSFVHWI KKTMKRYGGG GSRKKRGGGG SVRERGPQRV
251 AAHITGTRGR SNTLSSPNSK NEKALGRKIN SWESSRSGHS FLSNLHLRNG
301 ELVIHEKGFY YIYSQTYFRF QEEIKENTKN DKQMVQYIYK YTSYPDPILL
351 MKSARNSCWS KDAEYGLYSI YQGGIFELKE NDRIFVSVTN EHLIDMDHEA
401 SFFGAFLVG
DNA 서열: 서열 번호 73
1 CGTGTTGCAG CACATATTAC CGGCACCCGT GGTCGTAGCA ATACCCTGAG CAGCCCGAAT AGCAAAAATG AAAAAGCCCT GGGTCGTAAA ATTAATAGCT
101 GGGAAAGCAG CCGTAGCGGT CATAGCTTTC TGAGCAATCT GCATCTGCGT AATGGCGAAC TGGTGATTCA TGAAAAAGGC TTTTATTATA TTTATAGCCA
201 GACCTATTTT CGCTTTCAGG AAGAAATTAA AGAAAATACC AAAAATGATA AACAAATGGT GCAGTATATC TATAAATATA CCAGCTATCC GGATCCGATT
301 CTGCTGATGA AAAGCGCACG TAATAGCTGT TGGAGCAAAG ATGCCGAATA TGGTCTGTAT AGCATTTATC AGGGTGGCAT TTTTGAACTG AAAGAAAATG
401 ATCGCATTTT TGTGAGCGTG ACCAATGAAC ATCTGATTGA TATGGATCAT GAAGCCAGCT TTTTTGGTGC ATTTCTGGTT GGTGGTGGTG GTAGCCGTAA
501 AAAACGTGGT GGTGGCGGTT CTATTATTGG TGGTCATGTT GCAAAACCGC ATAGCCGTCC GTATATGGCA TATCTGATGA TTTGGGATCA GAAAAGCCTG
601 AAACGTTGTG GTGGCTTTCT GATTCGTGAT GATTTTGTTC TGACCGCAGC ACATTGTTGG GGTAGCAGCA TTAATGTTAC CCTGGGTGCC CATAATATTA
701 AAGAACAGGA ACCGACCCAG CAGTTTATTC CGGTTAAACG TGCAATTCCG CATCCGGCAT ATAATCCGAA AAATTTTAGC AATGATATCA TGCTGCTGCA
801 GCTGGAACGT AAAGCAAAAC GTACCCGTGC AGTTCAGCCG CTGCGTCTGC CGAGCAATAA AGCACAGGTT AAACCGGGTC AGACCTGTAG CGTTGCAGGT
901 TGGGGTCAGA CCGCACCGCT GGGTAAACAT TCTCATACCC TGCAAGAGGT TAAAATGACC GTCCAAGAGG ATCGTAAATG CGAAAGCGAT CTGCGCCATT
1001 ATTATGATAG CACCATTGAA CTGTGTGTGG GCGATCCGGA AATCAAAAAA ACCAGCTTTA AAGGTGATAG CGGTGGTCCG CTGGTTTGTA ATAAAGTTGC
1101 CCAGGGTATT GTTAGCTATG GTCGTAATAA TGGTATGCCG CCGCGTGCAT GTACCAAAGT TAGCAGCTTT GTGCATTGGA TTAAAAAAAC GATGAAACGC
1201 TATAAAGATG AACTG
상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 튜너(DE3)를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 8. 서열 번호 8의 융합 단백질
서열 번호 8의 단백질은 TRAIL121-281 서열의 C-말단에서 그랜자임 B(서열 번호 34)의 서열이 효과기 펩티드로서 부착된, 405 아미노산의 길이 및 45.7kDa의 질량을 갖는 융합 단백질이다. TRAIL의 서열 및 효과기 펩티드의 서열 사이에 추가로 각각의 가요성 글리신-세린 링커 GGGS(서열 번호 58) 및 GGGGS(서열 번호 59)로 그랜자임 B 및 TRAIL 양자의 서열로부터 분리된 퓨린 절단 부위의 서열(서열 번호 53)이 있다. 더욱이, 효과기 펩티드의 C-말단에서, 단백질은 전체 구조물의 C-말단 부분인, 소포체로 향하는 서열 KDEL을 함유한다.
융합 단백질의 구조는 도 2에 도식적으로 나타내었으며 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열이 각각 서열 번호 8 및 서열 번호 74로 하기에 나타낸다.
아미노산 서열: 서열 번호 8
1 RVAAHITGTR GRSNTLSSPN SKNEKALGRK INSWESSRSG HSFLSNLHLR
51 NGELVIHEKG FYYIYSQTYF RFQEEIKENT KNDKQMVQYI YKYTSYPDPI
101 LLMKSARNSC WSKDAEYGLY SIYQGGIFEL KENDRIFVSV TNEHLIDMDH
151 EASFFGAFLV GGGGSRKKRG GGGSIIGGHV AKPHSRPYMA YLMIWDQKSL
201 KRCGGFLIRD DFVLTAAHCW GSSINVTLGA HNIKEQEPTQ QFIPVKRAIP
251 HPAYNPKNFS NDIMLLQLER KAKRTRAVQP LRLPSNKAQV KPGQTCSVAG
301 WGQTAPLGKH SHTLQEVKMT VQEDRKCESD LRHYYDSTIE LCVGDPEIKK
351 TSFKGDSGGP LVCNKVAQGI VSYGRNNGMP PRACTKVSSF VHWIKKTMKR
401 YKDEL
DNA 서열: 서열 번호 74
1 CGTGTTGCAG CACATATTAC CGGCACCCGT GGTCGTAGCA ATACCCTGAG CAGCCCGAAT AGCAAAAATG AAAAAGCACT GGGTCGCAAA ATTAATAGCT
101 GGGAAAGCAG CCGTAGCGGT CATAGCTTTC TGAGCAATCT GCATCTGCGT AATGGTGAAC TGGTGATTCA TGAAAAAGGC TTTTATTATA TTTATAGCCA
201 GACCTATTTT CGCTTTCAAG AAGAAATTAA AGAAAACACC AAAAATGATA AACAAATGGT GCAGTATATT TACAAATATA CCAGCTATCC GGATCCGATT
301 CTGCTGATGA AAAGCGCACG TAATAGCTGT TGGAGCAAAG ATGCAGAATA TGGTCTGTAT AGCATTTATC AGGGTGGCAT TTTTGAACTG AAAGAAAATG
401 ATCGCATTTT TGTGAGCGTG ACCAATGAAC ATCTGATTGA TATGGATCAT GAAGCCAGCT TTTTTGGTGC ATTTCTGGTT GGTGGTGGTG GTAGCCGTAA
501 AAAACGTGGT GGTGGCGGTA GTATTATTGG TGGTCATGTT GCAAAACCGC ATAGCCGTCC GTATATGGCA TATCTGATGA TTTGGGATCA GAAAAGCCTG
601 AAACGTTGTG GTGGTTTTCT GATTCGTGAT GATTTTGTTC TGACCGCAGC ACATTGTTGG GGTAGCAGCA TTAATGTTAC CCTGGGTGCC CATAATATTA
701 AAGAACAAGA ACCGACCCAG CAGTTTATTC CGGTTAAACG TGCAATTCCG CATCCGGCAT ATAATCCGAA AAATTTTAGC AATGATATTA TGCTGCTGCA
801 GCTGGAACGC AAAGCAAAAC GTACCCGTGC AGTTCAGCCG CTGCGTCTGC CGAGCAATAA AGCACAGGTT AAACCGGGTC AGACCTGTAG CGTTGCAGGT
901 TGGGGTCAGA CCGCACCGCT GGGTAAACAT TCACATACCC TGCAAGAGGT GAAAATGACC GTTCAAGAGG ATCGTAAATG CGAAAGCGAT CTGCGCCATT
1001 ATTATGATAG CACCATTGAA CTGTGTGTTG GTGATCCGGA AATTAAAAAA ACCAGCTTTA AAGGCGATAG CGGTGGTCCG CTGGTTTGTA ATAAAGTTGC
1101 ACAGGGTATT GTGAGCTATG GTCGTAATAA TGGTATGCCT CCGCGTGCAT GTACCAAAGT TAGCAGCTTT GTGCATTGGA TTAAAAAAAC GATGAAACGC
1201 TATAAAGATG AACTG
상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 튜너(DE3) pLysS를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 9. 서열 번호 9의 융합 단백질
서열 번호 9의 단백질은 TRAIL121-281 서열의 N-말단에서 Nur77 단백질로부터 유도된 9-아미노산 펩티드(서열 번호 35)가 효과기 펩티드로서 부착된, 187 아미노산의 길이 및 21.9kDa의 질량을 갖는 융합 단백질이며, 효과기 펩티드의 C-말단에 추가로 7 Arg 잔기로 이루어진 폴리아르기닌 서열이 부착된다. 효과기 펩티드 및 TRAIL 서열 사이에, 메탈로프로테아제 MMP(서열 번호 51) 및 유로키나제 uPA(서열 번호 52)를 위한 절단 부위의 서열이 있다.
융합 단백질의 구조는 도 2에 도식적으로 나타내었으며 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열이 각각 서열 번호 9 및 서열 번호 75로 하기에 나타낸다.
아미노산 서열: 서열 번호 9
1 FSRSLHSLLR RRRRRRRVVR PLGLAGRVAA HITGTRGRSN TLSSPNSKNE
51 KALGRKINSW ESSRSGHSFL SNLHLRNGEL VIHEKGFYYI YSQTYFRFQE
101 EIKENTKNDK QMVQYIYKYT SYPDPILLMK SARNSCWSKD AEYGLYSIYQ
151 GGIFELKEND RIFVSVTNEH LIDMDHEASF FGAFLVG
DNA 서열: 서열 번호 75
1 TTTAGCCGTA GCCTGCATAG CCTGCTGCGT CGTCGTCGTC GCCGTCGTCG TGTTGTTCGT CCGCTGGGTC TGGCAGGTCG TGTTGCAGCA CATATTACCG
101 GCACCCGTGG TCGTAGCAAT ACCCTGAGCA GCCCGAATAG CAAAAATGAA AAAGCCCTGG GTCGCAAAAT TAATAGCTGG GAAAGCAGCC GTAGCGGTCA
201 TAGCTTTCTG AGCAATCTGC ATCTGCGTAA TGGTGAACTG GTGATTCATG AAAAAGGCTT TTATTATATT TATAGCCAGA CCTATTTTCG CTTTCAGGAA
301 GAAATTAAAG AAAATACCAA AAATGATAAA CAAATGGTGC AGTACATTTA TAAATATACC AGCTATCCGG ATCCGATTCT GCTGATGAAA AGCGCACGTA
401 ATAGCTGTTG GAGCAAAGAT GCAGAATATG GCCTGTATAG CATTTATCAG GGTGGCATTT TTGAACTGAA AGAAAATGAT CGCATTTTTG TGAGCGTGAC
501 CAATGAACAT CTGATTGATA TGGATCATGA AGCCAGCTTT TTTGGTGCAT TTCTGGTGGG C
상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 로제타(DE3)를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 10. 서열 번호 10의 융합 단백질
서열 번호 10의 단백질은 TRAIL121-281 서열의 N-말단에서 Bak 단백질의 BH3 도메인을 함유하는 16-아미노산 펩티드(서열 번호 36)가 효과기 펩티드로서 부착된, 193 아미노산의 길이 및 22.4kDa의 질량을 갖는 융합 단백질이며, 효과기 펩티드의 C-말단에 추가로 7 Arg 잔기로 이루어진 막 관통 폴리아르기닌 서열이 부착된다. 효과기 펩티드 서열 및 TRAIL 서열 사이에, 메탈로프로테아제 MMP(서열 번호 51) 및 유로키나제 uPA(서열 번호 52)를 위한 절단 부위의 서열이 있다.
융합 단백질의 구조는 도 2에 도식적으로 나타내었으며 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열이 각각 서열 번호 10 및 서열 번호 76으로 하기에 나타낸다.
아미노산 서열: 서열 번호 10
1 GQVGRQLAII GDDINRRRRR RRRVVRPLGL AGRVAAHITG TRGRSNTLSS
51 PNSKNEKALG RKINSWESSR SGHSFLSNLH LRNGELVIHE KGFYYIYSQT
101 YFRFQEEIKE NTKNDKQMVQ YIYKYTSYPD PILLMKSARN SCWSKDAEYG
151 LYSIYQGGIF ELKENDRIFV SVTNEHLIDM DHEASFFGAF LVG
DNA 서열: 서열 번호 76
1 GGTCAGGTTG GTCGTCAGCT GGCAATTATT GGTGATGATA TTAACCGTCG TCGTCGTCGC CGTCGTCGTG TTGTTCGTCC GCTGGGTCTG GCAGGTCGTG
101 TTGCAGCACA TATTACCGGC ACCCGTGGTC GTAGCAATAC CCTGAGCAGC CCGAATAGCA AAAATGAAAA AGCCCTGGGT CGCAAAATTA ATAGCTGGGA
201 AAGCAGCCGT AGCGGTCATA GCTTTCTGAG CAATCTGCAT CTGCGTAATG GTGAACTGGT GATTCATGAA AAAGGCTTTT ATTATATTTA TAGCCAGACC
301 TATTTTCGCT TTCAGGAAGA AATTAAAGAA AATACCAAAA ATGATAAACA AATGGTGCAG TACATTTATA AATATACCAG CTATCCGGAT CCGATTCTGC
401 TGATGAAAAG CGCACGTAAT AGCTGTTGGA GCAAAGATGC AGAATATGGC CTGTATAGCA TTTATCAGGG TGGCATTTTT GAACTGAAAG AAAATGATCG
501 CATTTTTGTG AGCGTGACCA ATGAACATCT GATTGATATG GATCATGAAG CCAGCTTTTT TGGTGCATTT CTGGTGGGC
상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 BL21 (DE3) 및 튜너 (DE3) pLysS를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 11. 서열 번호 11의 융합 단백질
서열 번호 11의 단백질은 TRAIL121-281 서열의 N-말단에서 PUMA/BBC3 분자의 BH3 도메인(서열 번호 37)이 효과기 펩티드로서 부착된, 204 아미노산의 길이 및 24.3kDa의 질량을 갖는 융합 단백질이며, 효과기 펩티드의 C-말단에 추가로 9 Arg 잔기를 포함하는 폴리아르기닌 서열이 부착된다. 효과기 펩티드 서열 및 TRAIL 서열 사이에, 구조물은 또한 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열을 포함한다.
융합 단백질의 구조는 도 3에 도식적으로 나타내었으며 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열이 각각 서열 번호 11 및 서열 번호 77로 하기에 나타낸다.
아미노산 서열: 서열 번호 11
1 EEQWAREIGA QLRRMADDLN AQYERRRRRR RRRRVVRPLG LAGRVAAHIT
51 GTRGRSNTLS SPNSKNEKAL GRKINSWESS RSGHSFLSNL HLRNGELVIH
101 EKGFYYIYSQ TYFRFQEEIK ENTKNDKQMV QYIYKYTSYP DPILLMKSAR
151 NSCWSKDAEY GLYSIYQGGI FELKENDRIF VSVTNEHLID MDHEASFFGA
201 FLVG
DNA 서열: 서열 번호 77
1 GAAGAACAGT GGGCACGTGA AATTGGTGCA CAGCTGCGTC GTATGGCAGA TGATCTGAAT GCACAGTATG AACGTCGTCG TCGTCGCCGT CGGCGTCGTC
101 GTGTTGTTCG TCCGCTGGGT CTGGCAGGTC GTGTTGCAGC ACATATTACC GGCACCCGTG GTCGTAGCAA TACCCTGAGC AGCCCGAATA GCAAAAATGA
201 AAAAGCACTG GGTCGCAAAA TCAATAGCTG GGAAAGCAGC CGTAGCGGTC ATAGCTTTCT GAGCAATCTG CATCTGCGTA ATGGTGAACT GGTGATTCAT
301 GAAAAAGGCT TTTATTATAT TTATAGCCAG ACCTATTTTC GCTTTCAAGA AGAGATTAAA GAAAATACCA AAAATGATAA ACAAATGGTG CAGTATATTT
401 ACAAATACAC CAGCTATCCG GACCCGATTC TGCTGATGAA AAGCGCACGT AATAGCTGTT GGAGCAAAGA TGCAGAATAT GGTCTGTATA GCATTTATCA
501 GGGTGGCATC TTTGAGCTGA AAGAAAATGA TCGCATCTTT GTTAGCGTGA CCAACGAACA TCTGATCGAT ATGGATCATG AAGCCAGCTT TTTTGGTGCA
상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 BL21 (DE3) 및 튜너 (DE3) pLysS를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 12. 서열 번호 12의 융합 단백질
서열 번호 12의 단백질은 TRAIL121-281 서열의 C-말단에서 PUMA 단백질 (서열 번호 38)이 효과기 펩티드로서 부착된, 372 아미노산의 길이 및 41kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드 서열 및 TRAIL 서열 사이에, 메탈로프로테아제 MMP (서열 번호 51) 및 유로키나제 uPA (서열 번호 52)에 의해 인식되는 절단 부위의 서열이 존재하며, 이는 추가로 가요성 글리신-세린 링커 GGSGG (서열 번호 60)에 의해 TRAIL의 서열로부터 분리된다. 더욱이, 효과기 펩티드의 C-말단에서, 효과기 펩티드는 소포체를 향하고, 전체 구조물의 C-말단 부분을 형성하는 KEDL 서열(서열 번호 56)을 포함한다.
융합 단백질의 구조는 도 3에 도식적으로 나타내었으며 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열이 각각 서열 번호 12 및 서열 번호 78로 하기에 나타낸다.
아미노산 서열: 서열 번호 12
1 RVAAHITGTR GRSNTLSSPN SKNEKALGRK INSWESSRSG HSFLSNLHLR
51 NGELVIHEKG FYYIYSQTYF RFQEEIKENT KNDKQMVQYI YKYTSYPDPI
101 LLMKSARNSC WSKDAEYGLY SIYQGGIFEL KENDRIFVSV TNEHLIDMDH
151 EASFFGAFLV GGGSGGPLGL AGRVVRARAR QEGSSPEPVE GLARDGPRPF
201 PLGRLVPSAV SCGLCEPGLA AAPAAPTLLP AAYLCAPTAP PAVTAALGGS
251 RWPGGPRSRP RGPRPDGPQP SLSLAEQHLE SPVPSAPGAL AGGPTQAAPG
301 VRGEEEQWAR EIGAQLRRMA DDLNAQYERR RQEEQQRHRP SPWRVLYNLI
351 MGLLPLPRGH RAPEMEPNKE DL
DNA 서열: 서열 번호 78
1 CGTGTTGCAG CACATATTAC CGGCACCCGT GGTCGTAGCA ATACCCTGAG CAGCCCGAAT AGCAAAAATG AAAAAGCACT GGGTCGCAAA ATCAATAGCT
101 GGGAAAGCAG CCGTAGCGGT CATAGCTTTC TGAGCAATCT GCATCTGCGT AATGGTGAAC TGGTGATTCA TGAAAAAGGC TTTTATTATA TTTATAGCCA
201 GACCTATTTT CGCTTTCAAG AAGAGATTAA AGAAAATACC AAAAATGATA AACAAATGGT GCAGTACATT TACAAATATA CCAGCTATCC GGACCCGATT
301 CTGCTGATGA AAAGCGCACG TAATAGCTGT TGGAGCAAAG ATGCAGAATA TGGTCTGTAT AGCATTTATC AGGGTGGCAT CTTTGAGCTG AAAGAAAATG
401 ATCGCATCTT TGTTAGCGTG ACCAACGAAC ATCTGATCGA TATGGATCAT GAAGCCAGCT TTTTTGGTGC ATTTCTGGTT GGTGGTGGTA GCGGTGGTCC
501 GCTGGGTCTG GCAGGTCGTG TTGTTCGTGC CCGTGCGCGT CAAGAAGGTA GCAGTCCGGA ACCGGTTGAA GGTCTGGCAC GTGATGGTCC GCGTCCGTTT
601 CCGCTGGGTC GTCTGGTTCC GAGCGCAGTT AGCTGTGGTC TGTGTGAACC GGGTCTGGCA GCCGCACCGG CAGCACCGAC ACTGCTGCCT GCAGCATATC
701 TGTGTGCACC GACCGCACCG CCTGCAGTTA CCGCAGCACT GGGTGGTAGC CGTTGGCCTG GTGGTCCGCG TAGTCGTCCG CGTGGTCCTC GTCCGGATGG
801 TCCGCAGCCG AGCCTGAGCC TGGCAGAACA GCATCTGGAA AGTCCGGTGC CGAGCGCACC GGGTGCACTG GCAGGCGGTC CTACACAGGC AGCACCGGGT
901 GTTCGTGGTG AAGAGGAACA GTGGGCACGT GAAATTGGTG CACAGCTGCG TCGTATGGCA GATGATCTGA ATGCACAGTA TGAACGTCGT CGTCAAGAAG
1001 AACAGCAGCG TCATCGTCCG AGCCCGTGGC GTGTTCTGTA TAATCTGATT ATGGGTCTGC TGCCGCTGCC TCGTGGTCAT CGTGCACCGG AAATGGAACC
1101 GAATAAAGAA GATCTG
상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 B.21 (DE3) 및 스트라테이진으로부터 입수한 i BL21DE3pLysSRIL을 사용하여 일반 절차 B에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 13. 서열 번호 13의 융합 단백질
서열 번호 13의 단백질은 121-281 TRAIL의 C-말단에서 PUMA 단백질의 서열 (서열 번호 38)이 효과기 펩티드로서 부착된, 493 아미노산의 길이 및 53.4 kDa의 질량을 갖는 융합 단백질이다. 더욱이, PUMA 단백질 서열 및 TRAIL 서열 사이에, 녹농균(Pseudomonas aeruginosa)으로부터의 전좌 도메인의 서열이 존재하며, 이는 가요성 글리신-세린 링커 GGGGS (서열 번호 59), 퓨린 절단 부위 (서열 번호 53) 및 가요성 알라닌-글리신-세린 링커 ASGG (서열 번호 65)의 연속적인 서열에 의해 TRAIL의 서열로부터 추가로 분리 및 가요성 글리신-세린 링커 GGSGG (서열 번호 60)에 의해 PUMA 단백질로부터 추가로 분리된다. 더욱이, 효과기 펩티드의 C-말단에서, 효과기 펩티드는 소포체를 향하는 KEDL 서열(서열 번호 56)을 포함하며, 이는 전체 구조물의 C-말단 부분이다.
융합 단백질의 구조는 도 3에 도식적으로 나타내었으며 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열이 각각 서열 번호 13 및 서열 번호 79로 하기에 나타낸다.
아미노산 서열: 서열 번호 13
1 RVAAHITGTR GRSNTLSSPN SKNEKALGRK INSWESSRSG HSFLSNLHLR
51 NGELVIHEKG FYYIYSQTYF RFQEEIKENT KNDKQMVQYI YKYTSYPDPI
101 LLMKSARNSC WSKDAEYGLY SIYQGGIFEL KENDRIFVSV TNEHLIDMDH
151 EASFFGAFLV GGGGSRKKRA SGGPEGGSLA ALTAHQACHL PLETFTRHRQ
201 PRGWEQLEQC GYPVQRLVAL YLAARLSWNQ VDQVIANALA SPGSGGDLGE
251 AIRESPEQAR LALTLAAAES ERFVRQGTGN DEAGAANGPA DGGSGGGARA
301 RQEGSSPEPV EGLARDGPRP FPLGRLVPSA VSCGLCEPGL AAAPAAPTLL
351 PAAYLCAPTA PPAVTAALGG SRWPGGPRSR PRGPRPDGPQ PSLSLAEQHL
401 ESPVPSAPGA LAGGPTQAAP GVRGEEEQWA REIGAQLRRM ADDLNAQYER
451 RRQEEQQRHR PSPWRVLYNL IMGLLPLPRG HRAPEMEPNK DEL
DNA 서열: 서열 번호 79
1 CGTGTTGCAG CACATATTAC CGGCACCCGT GGTCGTAGCA ATACCCTGAG CAGCCCGAAT AGCAAAAATG AAAAAGCACT GGGTCGCAAA ATTAATAGCT
101 GGGAAAGCAG CCGTAGCGGT CATAGCTTTC TGAGCAATCT GCATCTGCGT AATGGTGAAC TGGTGATTCA TGAAAAAGGC TTTTATTATA TTTATAGCCA
201 GACCTATTTT CGCTTTCAAG AAGAAATTAA AGAAAATACC AAAAATGATA AGCAGATGGT GCAGTATATC TATAAATATA CCAGCTATCC GGATCCGATT
301 CTGCTGATGA AAAGCGCACG TAATAGCTGT TGGAGCAAAG ATGCAGAATA TGGTCTGTAT AGCATTTATC AGGGTGGCAT TTTTGAACTG AAAGAAAATG
401 ATCGCATTTT TGTGAGCGTG ACCAATGAAC ATCTGATTGA TATGGATCAT GAAGCCAGCT TTTTTGGTGC ATTTCTGGTT GGTGGTGGTG GTAGCCGTAA
501 AAAACGTGCA AGCGGTGGTC CGGAAGGTGG TAGCCTGGCA GCACTGACCG CACATCAGGC ATGTCATCTG CCGCTGGAAA CCTTTACCCG TCATCGTCAG
601 CCTCGTGGTT GGGAACAGCT GGAACAGTGT GGTTATCCGG TTCAGCGTCT GGTTGCACTG TATCTGGCAG CACGTCTGAG CTGGAATCAG GTTGATCAGG
701 TTATTGCAAA TGCACTGGCA AGTCCGGGTA GCGGTGGTGA TCTGGGTGAA GCAATTCGTG AAAGTCCGGA ACAGGCACGT CTGGCACTGA CCCTGGCAGC
801 AGCAGAAAGC GAACGTTTTG TTCGTCAGGG CACCGGTAAT GATGAAGCCG GTGCAGCAAA TGGTCCGGCA GATGGTGGTA GTGGTGGTGG TGCACGTGCT
901 CGTCAAGAAG GTAGCAGTCC GGAACCGGTT GAAGGTCTGG CACGTGACGG TCCGCGTCCG TTTCCGCTGG GTCGTCTGGT TCCGAGCGCA GTTAGCTGTG
1001 GTCTGTGTGA ACCGGGTCTG GCAGCCGCAC CGGCAGCACC GACACTGCTG CCTGCAGCAT ATCTGTGTGC ACCGACCGCA CCGCCTGCAG TTACCGCAGC
1101 ACTGGGTGGT AGTCGTTGGC CTGGTGGTCC GCGTAGTCGT CCGCGTGGTC CGCGTCCGGA TGGTCCGCAG CCGAGTCTGA GCCTGGCAGA ACAGCATCTG
1201 GAAAGTCCTG TGCCGAGCGC ACCGGGTGCA CTGGCAGGCG GTCCGACACA GGCAGCACCT GGTGTTCGTG GTGAAGAAGA ACAGTGGGCA CGCGAAATTG
1301 GTGCACAGCT GCGTCGTATG GCAGATGATC TGAATGCACA GTATGAACGT CGTCGTCAAG AAGAACAGCA GCGTCATCGT CCGAGCCCGT GGCGTGTTCT
1401 GTATAATCTG ATTATGGGTC TGCTGCCGCT GCCTCGTGGT CATCGTGCAC CGGAAATGGA ACCGAATAAA GATGAACTG
상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 BL21 (DE3) 및 스트라테이진으로부터 입수한 BL21DE3pLysSRIL을 사용하여 일반 절차 B에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 14. 서열 번호 14의 융합 단백질
서열 번호 14의 단백질은 TRAIL 121-281 서열의 N-말단에서 SMAC/Diablo 단백질의 8-아미노산 분절 (서열 번호 39)이 효과기 펩티드로서 부착된, 186 아미노산의 길이 및 21.5 kDa의 질량을 갖는 융합 단백질이며, 효과기 펩티드의 C-말단에 추가로 7 Arg 잔기로 이루어진 폴리아르기닌 서열이 부착된다. 더욱이, 폴리아르기닌 서열 및 TRAIL 서열 사이에, 상기 단백질은 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열을 포함한다.
융합 단백질의 구조는 도 3에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 14 및 서열 번호 80으로 하기에 나타낸다.
아미노산 서열: 서열 번호 14
1 AVPIAQKPRR RRRRRRVVRP LGLAGRVAAH ITGTRGRSNT LSSPNSKNEK
51 ALGRKINSWE SSRSGHSFLS NLHLRNGELV IHEKGFYYIY SQTYFRFQEE
101 IKENTKNDKQ MVQYIYKYTS YPDPILLMKS ARNSCWSKDA EYGLYSIYQG
151 GIFELKENDR IFVSVTNEHL IDMDHEASFF GAFLVG
DNA 서열: 서열 번호 80
1 GCAGTTCCGA TTGCACAGAA ACCGCGTCGT CGTCGTCGCC GTCGTCGTGT TGTTCGTCCG CTGGGTCTGG CAGGTCGTGT TGCAGCACAT ATTACCGGCA
101 CCCGTGGTCG TAGCAATACC CTGAGCAGCC CGAATAGCAA AAATGAAAAA GCCCTGGGTC GCAAAATCAA TAGCTGGGAA AGCAGCCGTA GCGGTCATAG
201 CTTTCTGAGC AATCTGCATC TGCGTAATGG TGAACTGGTG ATTCATGAAA AAGGCTTTTA CTATATCTAT AGCCAGACCT ACTTCCGCTT TCAGGAAGAA
301 ATTAAAGAAA ATACCAAAAA TGATAAACAA ATGGTGCAGT ATATCTATAA ATATACCAGC TATCCGGATC CGATTCTGCT GATGAAAAGC GCACGTAATA
401 GCTGTTGGAG CAAAGATGCA GAATATGGCC TGTATAGCAT TTATCAGGGT GGCATTTTTG AACTGAAAGA AAATGATCGC ATTTTTGTGA GCGTGACCAA
501 TGAACATCTG ATTGATATGG ATCATGAAGC CAGCTTTTTT GGTGCATTTC TGGTGGGT
상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 BL21 (DE3) 또는 튜너 (DE3)를 사용하여 일반 절차 B에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 15. 서열 번호 15의 융합 단백질
서열 번호 15의 단백질은 TRAIL 121-281 서열의 N-말단에서 부포린 IIb (서열 번호 40)이 효과기 펩티드로서 부착된, 191 아미노산의 길이 및 22.2 kDa의 질량을 갖는 융합 단백질이다. 더욱이, 효과기 펩티드 및 TRAIL 서열 사이에, 상기 단백질은 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열을 포함한다.
융합 단백질의 구조는 도 3에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 15 및 서열 번호 81로 하기에 나타낸다.
아미노산 서열: 서열 번호 15
1 RAGLQFPVGR LLRRLLRRLL RVVRPLGLAG RVAAHITGTR GRSNTLSSPN
51 SKNEKALGRK INSWESSRSG HSFLSNLHLR NGELVIHEKG FYYIYSQTYF
101 RFQEEIKENT KNDKQMVQYI YKYTSYPDPI LLMKSARNSC WSKDAEYGLY
151 SIYQGGIFEL KENDRIFVSV TNEHLIDMDH EASFFGAFLV G
DNA 서열: 서열 번호 81
1 CGTGCAGGTC TGCAGTTTCC GGTTGGACGT CTGTTACGTC GCCTGCTGCG TCGTCTGCTG CGCGTTGTTC GTCCGCTGGG TCTGGCAGGT CGTGTTGCAG
101 CACATATTAC CGGCACCCGT GGTCGTAGCA ATACCCTGAG CAGCCCGAAT AGCAAAAATG AAAAAGCACT GGGTCGCAAA ATCAATAGCT GGGAAAGCAG
201 CCGTAGCGGT CATAGCTTTC TGAGCAATCT GCATCTGCGT AATGGTGAAC TGGTGATTCA TGAAAAAGGC TTTTATTATA TTTATAGCCA GACCTATTTT
301 CGCTTTCAAG AAGAGATTAA AGAAAATACC AAAAATGATA AACAAATGGT GCAGTACATT TACAAATATA CCAGCTATCC GGACCCGATT CTGCTGATGA
401 AAAGCGCACG TAATAGCTGT TGGAGCAAAG ATGCAGAATA TGGTCTGTAT AGCATTTATC AGGGTGGCAT CTTTGAGCTG AAAGAAAATG ATCGCATCTT
501 TGTTAGCGTG ACCAACGAAC ATCTGATCGA TATGGATCAT GAAGCCAGCT TTTTTGGTGC ATTTCTGGTG GGTCTGGTTC CGCGTGGTAG CGGTAGCAGC
601 CATCATCATC ATCACCATAG CAGCGGT
상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 튜너 (DE3)를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 16. 서열 번호 16의 융합 단백질
서열 번호 16의 단백질은 TRAIL 121-281 서열의 C-말단에서 단백질 온코나제 (서열 번호 41)가 효과기 펩티드로서 부착된, 279 아미노산의 길이 및 31.7 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열 및 TRAIL 서열 사이에는, 프로테아제 MMP (서열 번호 51) 및 uPA (서열 번호 52)에 의해 인식되고, 추가로 가요성 글리신-세린 링커 GGGS (서열 번호 58)에 의해 TRAIL의 서열로부터 분리되는 절단 부위의 서열이 존재한다.
융합 단백질의 구조는 도 4에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 16 및 서열 번호 82로 하기에 나타낸다.
아미노산 서열: 서열 번호 16
1 RVAAHITGTR GRSNTLSSPN SKNEKALGRK INSWESSRSG HSFLSNLHLR
51 NGELVIHEKG FYYIYSQTYF RFQEEIKENT KNDKQMVQYI YKYTSYPDPI
101 LLMKSARNSC WSKDAEYGLY SIYQGGIFEL KENDRIFVSV TNEHLIDMDH
151 EASFFGAFLV GGGSGPLGLA GRVVRQDWLT FQKKHITNTR DVDCDNIMST
201 NLFHCKDKNT FIYSRPEPVK AICKGIIASK NVLTTSEFYL SDCNVTSRPC
251 KYKLKKSTNK FCVTCENQAP VHFVGVGSC
DNA 서열: 서열 번호 82
1 CGTGTTGCAG CACATATTAC CGGCACCCGT GGTCGTAGCA ATACCCTGAG CAGCCCGAAT AGCAAAAATG AAAAAGCACT GGGTCGCAAA ATTAATAGCT
101 GGGAAAGCAG CCGTAGCGGT CATAGCTTTC TGAGCAATCT GCATCTGCGT AATGGTGAAC TGGTGATTCA TGAAAAAGGC TTTTATTATA TTTATAGCCA
201 GACCTATTTT CGCTTTCAAG AAGAAATTAA AGAAAATACC AAAAATGATA AGCAGATGGT GCAGTATATC TATAAATATA CCAGCTATCC GGATCCGATT
301 CTGCTGATGA AAAGCGCACG TAATAGCTGT TGGAGCAAAG ATGCAGAATA TGGTCTGTAT AGCATTTATC AGGGTGGCAT TTTTGAACTG AAAGAAAATG
401 ATCGCATTTT TGTGAGCGTG ACCAATGAAC ATCTGATTGA TATGGATCAT GAAGCCAGCT TTTTTGGTGC ATTTCTGGTT GGTGGTGGTA GCGGTCCGCT
501 GGGTCTGGCA GGTCGTGTTG TTCGTCAGGA TTGGCTGACC TTTCAGAAAA AACATATTAC CAATACCCGT GATGTGGATT GCGATAATAT TATGAGCACC
601 AACCTGTTTC ATTGCAAAGA TAAAAATACC TTTATTTATA GCCGTCCGGA ACCGGTTAAA GCAATTTGTA AAGGTATTAT TGCCAGCAAA AATGTGCTGA
701 CCACGAGCGA ATTCTATCTG AGCGATTGTA ATGTTACCAG CCGTCCGTGT AAATATAAAC TGAAAAAAAG CACCAATAAA TTTTGCGTGA CCTGCGAAAA
801 TCAGGCACCG GTTCATTTTG TTGGTGTTGG TAGCTGT
상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 튜너 (DE3)를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 17. 서열 번호 17의 융합 단백질
서열 번호 17의 단백질은 TRAIL 121-281 서열의 C-말단에서 단백질 온코나제 (서열 번호 41)가 효과기 펩티드로서 부착된, 274 아미노산의 길이 및 31 kDa의 질량을 갖는 융합 단백질이며, 효과기 펩티드의 서열은 가요성 글리신-세린 링커, GGGGSGGGGS (서열 번호 64)에 의해 TRAIL의 서열로부터 추가로 분리된다.
융합 단백질의 구조는 도 4에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 17 및 서열 번호 83으로 하기에 나타낸다.
아미노산 서열: 서열 번호 17
1 RVAAHITGTR GRSNTLSSPN SKNEKALGRK INSWESSRSG HSFLSNLHLR
51 NGELVIHEKG FYYIYSQTYF RFQEEIKENT KNDKQMVQYI YKYTSYPDPI
101 LLMKSARNSC WSKDAEYGLY SIYQGGIFEL KENDRIFVSV TNEHLIDMDH
151 EASFFGAFLV GGGGSGGGGS QDWLTFQKKH ITNTRDVDCD NIMSTNLFHC
201 KDKNTFIYSR PEPVKAICKG IIASKNVLTT SEFYLSDCNV TSRPCKYKLK
251 KSTNKFCVTC ENQAPVHFVG VGSC
DNA 서열: 서열 번호 83
1 CGTGTTGCAG CACATATTAC CGGCACCCGT GGTCGTAGCA ATACCCTGAG CAGCCCGAAT AGCAAAAATG AAAAAGCACT GGGTCGCAAA ATTAATAGCT
101 GGGAAAGCAG CCGTAGCGGT CATAGCTTTC TGAGCAATCT GCATCTGCGT AATGGTGAAC TGGTGATTCA TGAAAAAGGC TTTTATTATA TTTATAGCCA
201 GACCTATTTT CGCTTTCAAG AAGAAATTAA AGAAAATACC AAAAATGATA AGCAGATGGT GCAGTATATC TATAAATATA CCAGCTATCC GGATCCGATT
301 CTGCTGATGA AAAGCGCACG TAATAGCTGT TGGAGCAAAG ATGCAGAATA TGGTCTGTAT AGCATTTATC AGGGTGGCAT TTTTGAACTG AAAGAAAATG
401 ATCGCATTTT TGTGAGCGTG ACCAATGAAC ATCTGATTGA TATGGATCAT GAAGCCAGCT TTTTTGGTGC ATTTCTGGTT GGTGGTGGTG GTAGCGGTGG
501 TGGTGGCAGC CAGGATTGGC TGACCTTTCA GAAAAAACAT ATTACCAATA CCCGTGATGT GGATTGCGAT AATATTATGA GCACCAACCT GTTTCATTGC
601 AAAGATAAAA ATACCTTTAT TTATAGCCGT CCGGAACCGG TTAAAGCAAT TTGTAAAGGT ATTATTGCCA GCAAAAATGT GCTGACCACG AGCGAATTCT
701 ATCTGAGCGA TTGTAATGTT ACCAGCCGTC CGTGTAAATA TAAACTGAAA AAAAGCACCA ATAAATTTTG CGTGACCTGC GAAAATCAGG CACCGGTTCA
801 TTTTGTTGGT GTTGGTAGCT GT
상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 튜너 (DE3)를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 18. 서열 번호 18의 융합 단백질
서열 번호 18의 단백질은 TRAIL 121-281 서열의 N-말단에서 단백질 p14ARF의 N-말단 도메인을 함유하는 20-아미노산 펩티드(서열 번호 42)가 효과기 펩티드로서 부착된, 197 아미노산의 길이 및 23.2 kDa의 질량을 갖는 융합 단백질이며, 효과기 펩티드의 C-말단에 추가로 6 Arg 잔기로 이루어진 폴리아르기닌 서열이 부착된다. 더욱이, 폴리아르기닌 서열 및 TRAIL 서열 사이에, 프로테아제 절단 부위 uPA (서열 번호 52) 및 MMP (서열 번호 51)의 서열을 포함한다.
융합 단백질의 구조는 도 4에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 18 및 서열 번호 84로 하기에 나타낸다.
아미노산 서열: 서열 번호 18
1 VRRFLVTLRI RRACGPPRVR RRRRRRRVVR PLGLAGRVAA HITGTRGRSN
51 TLSSPNSKNE KALGRKINSW ESSRSGHSFL SNLHLRNGEL VIHEKGFYYI
101 YSQTYFRFQE EIKENTKNDK QMVQYIYKYT SYPDPILLMK SARNSCWSKD
151 AEYGLYSIYQ GGIFELKEND RIFVSVTNEH LIDMDHEASF FGAFLVG
DNA 서열: 서열 번호 84
1 GTTCGTCGTT TTCTGGTTAC CCTGCGTATT CGTCGTGCAT GTGGTCCTCC GCGTGTGCGT CGTCGTCGTC GCCGTCGTCG TGTTGTTCGT CCTCTGGGTC
101 TGGCAGGTCG CGTTGCAGCA CATATTACCG GCACCCGTGG TCGTAGCAAT ACCCTGAGCA GCCCGAATAG CAAAAATGAA AAAGCCCTGG GTCGCAAAAT
201 TAATAGCTGG GAAAGCAGCC GTAGCGGTCA TAGCTTTCTG AGCAATCTGC ATCTGCGTAA TGGTGAACTG GTGATTCATG AAAAAGGCTT TTATTATATT
301 TATAGCCAGA CCTATTTTCG CTTTCAGGAA GAAATTAAAG AAAATACCAA AAATGATAAA CAAATGGTGC AGTATATCTA TAAATATACC AGCTATCCGG
401 ATCCGATTCT GCTGATGAAA AGCGCACGTA ATAGCTGTTG GAGCAAAGAT GCAGAATATG GCCTGTATAG CATTTATCAG GGTGGCATTT TTGAACTGAA
501 AGAAAATGAT CGCATTTTTG TGAGCGTGAC CAATGAACAT CTGATTGATA TGGATCATGA AGCCAGCTTT TTTGGTGCAT TTCTGGTTGG T
상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 튜너 (DE3)를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 19. 서열 번호 19의 융합 단백질
서열 번호 19의 단백질은 TRAIL 121-281 서열의 N-말단에서 Mdm2에 결합하는 11-아미노산 펩티드(서열 번호 43)가 효과기 펩티드로서 부착된, 189 아미노산의 길이 및 22.3 kDa의 질량을 갖는 융합 단백질이며, 효과기 펩티드의 C-말단에 추가로 7 Arg 잔기로 이루어진 폴리아르기닌 서열이 부착된다. 더욱이, 폴리아르기닌 서열 및 TRAIL 서열 사이에, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재한다.
융합 단백질의 구조는 도 4에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 19 및 서열 번호 85로 하기에 나타낸다.
아미노산 서열: 서열 번호 19
1 PRFMDTWEGL NRRRRRRRRV VRPLGLAGRV AAHITGTRGR SNTLSSPNSK
51 NEKALGRKIN SWESSRSGHS FLSNLHLRNG ELVIHEKGFY YIYSQTYFRF
101 QEEIKENTKN DKQMVQYIYK YTSYPDPILL MKSARNSCWS KDAEYGLYSI
151 YQGGIFELKE NDRIFVSVTN EHLIDMDHEA SFFGAFLVG
DNA 서열: 서열 번호 85
1 CCTCGTTTTA TGGATACCTG GGAAGGTCTG AATCGCCGTC GGCGTCGTCG GCGTCGTGTT GTTCGTCCGC TGGGTCTGGC AGGTCGTGTT GCAGCACATA
101 TTACCGGCAC CCGTGGTCGT AGCAATACCC TGAGCAGCCC GAATAGCAAA AATGAAAAAG CACTGGGTCG CAAAATTAAT AGCTGGGAAA GCAGCCGTAG
201 CGGTCATAGC TTTCTGAGCA ATCTGCATCT GCGTAATGGT GAACTGGTGA TTCATGAAAA AGGCTTTTAT TATATTTATA GCCAGACCTA TTTTCGCTTT
301 CAGGAAGAAA TTAAAGAAAA TACCAAAAAT GATAAACAAA TGGTGCAGTA CATTTACAAA TATACCAGCT ATCCGGATCC GATTCTGCTG ATGAAAAGCG
401 CACGTAATAG CTGTTGGAGC AAAGATGCAG AATATGGTCT GTATAGCATT TATCAGGGTG GCATTTTTGA ACTGAAAGAA AATGATCGCA TTTTTGTGAG
501 CGTGACCAAT GAACATCTGA TTGATATGGA TCATGAAGCC AGCTTTTTTG GTGCATTTCT GGTTGGT
상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 BL21 (DE3) 또는 튜너 (DE3)를 사용하여 일반 절차 B에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 20. 서열 번호 20의 융합 단백질
서열 번호 20의 단백질은 TRAIL 121-281 서열의 N-말단에서 루나신으로부터 유도된 펩티드(서열 번호 44)가 효과기 펩티드로서 부착된, 195 아미노산의 길이 및 22.9 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드 및 TRAIL의 서열의 사이에는, 주어진 순서로, 7개의 Arg 잔기로 이루어진 폴리아르기닌 서열 및 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 대한 절단 부위의 서열이 존재한다.
융합 단백질의 구조는 도 4에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 20 및 서열 번호 86으로 하기에 나타낸다.
아미노산 서열: 서열 번호 20
1 CEKHIMEKIQ GRGDDDDRRR RRRRRVVRPL GLAGRVAAHI TGTRGRSNTL
51 SSPNSKNEKA LGRKINSWES SRSGHSFLSN LHLRNGELVI HEKGFYYIYS
101 QTYFRFQEEI KENTKNDKQM VQYIYKYTSY PDPILLMKSA RNSCWSKDAE
151 YGLYSIYQGG IFELKENDRI FVSVTNEHLI DMDHEASFFG AFLVG
DNA 서열: 서열 번호 86
1 TGTGAAAAAC ATATTATGGA AAAAATTCAG GGTCGCGGTG ATGATGATGA TCGCCGTCGG CGTCGTCGGC GTCGTGTTGT TCGTCCGCTG GGTCTGGCAG
101 GTCGTGTTGC AGCACATATT ACCGGCACCC GTGGTCGTAG CAATACCCTG AGCAGCCCGA ATAGCAAAAA TGAAAAAGCA CTGGGTCGCA AAATTAATAG
201 CTGGGAAAGC AGCCGTAGCG GTCATAGCTT TCTGAGCAAT CTGCATCTGC GTAATGGTGA ACTGGTGATT CATGAAAAAG GCTTTTATTA TATTTATAGC
301 CAGACCTATT TTCGCTTTCA GGAAGAAATT AAAGAAAATA CCAAAAATGA TAAACAAATG GTGCAGTACA TTTACAAATA TACCAGCTAT CCGGATCCGA
401 TTCTGCTGAT GAAAAGCGCA CGTAATAGCT GTTGGAGCAA AGATGCAGAA TATGGTCTGT ATAGCATTTA TCAGGGTGGC ATTTTTGAAC TGAAAGAAAA
501 TGATCGCATT TTTGTGAGCG TGACCAATGA ACATCTGATT GATATGGATC ATGAAGCCAG CTTTTTTGGT GCATTTCTGG TTGGT
상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 BL21 (DE3) 또는 튜너 (DE3)를 사용하여 일반 절차 B에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 21. 서열 번호 21의 융합 단백질
서열 번호 21의 단백질은, 그것의 C-말단에 7 Arg 잔기로 이루어진 폴리아르기닌 서열의 부착과 함께 TRAIL 121-281 서열의 N-말단에 효과기 펩티드로서 8-아미노산 단백질 Smac/Diablo의 분절(서열 번호 39)이 부착되어 있는, 218 아미노산의 길이 및 25.5 kDa의 질량을 갖는 융합 단백질이다. 더욱이, TRAIL 121-281 서열의 C-말단에는, Bik 단백질 (서열 번호 45)의 BH3 도메인을 포함하는 펩티드가 제2 효과기 펩티드로서 부착되어 있고, 상기 제2 효과기 펩티드는 그 N-말단에 7개의 Arg 잔기로 이루어진 폴리아르기닌 서열이 부착되어 있다. TRAIL의 서열 및 부착된 폴리아르기닌 서열을 갖는 2개의 효과기 펩티드 사이에는, 메탈로프로테아제 MMP (서열 번호 51) 및 유로키나제 uPA (서열 번호 52)에 의해 인식되는 절단 부위의 서열이 존재한다.
융합 단백질의 구조는 도 4에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 21 및 서열 번호 87로 하기에 나타낸다.
아미노산 서열: 서열 번호 21
1 AVPIAQKPRR RRRRRRVVRP LGLAGRVAAH ITGTRGRSNT LSSPNSKNEK
51 ALGRKINSWE SSRSGHSFLS NLHLRNGELV IHEKGFYYIY SQTYFRFQEE
101 IKENTKNDKQ MVQYIYKYTS YPDPILLMKS ARNSCWSKDA EYGLYSIYQG
151 GIFELKENDR IFVSVTNEHL IDMDHEASFF GAFLVGPLGL AGRVVRRRRR
201 RRRLALRLAC IGDEMDVS
DNA 서열: 서열 번호 87
1 GCAGTTCCGA TTGCACAGAA ACCGCGTCGT CGTCGTCGCC GTCGTCGTGT TGTTCGTCCT CTGGGTCTGG CAGGTCGCGT TGCAGCACAT ATTACCGGCA
101 CCCGTGGTCG TAGCAATACC CTGAGCAGCC CGAATAGCAA AAATGAAAAA GCCCTGGGTC GCAAAATTAA TAGCTGGGAA AGCAGCCGTA GCGGTCATAG
201 CTTTCTGAGC AATCTGCATC TGCGTAATGG TGAACTGGTG ATTCATGAAA AAGGCTTTTA TTATATTTAT AGCCAGACCT ATTTTCGCTT TCAGGAAGAA
301 ATTAAAGAAA ATACCAAAAA TGATAAACAA ATGGTGCAGT ATATCTATAA ATATACCAGC TATCCGGATC CGATTCTGCT GATGAAAAGC GCACGTAATA
401 GCTGTTGGAG CAAAGATGCA GAATATGGCC TGTATAGCAT TTATCAGGGT GGCATTTTTG AACTGAAAGA AAATGATCGC ATTTTTGTGA GCGTGACCAA
501 TGAACATCTG ATTGATATGG ATCATGAAGC CAGCTTTTTT GGTGCATTTC TGGTTGGTCC GCTGGGCCTG GCTGGCCGTG TGGTTCGCCG GCGCCGTCGC
601 CGTCGCCGCC TGGCACTGCG TCTGGCATGT ATTGGTGATG AAATGGATGT GAGC
상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 E.coli 균주 Rosetta (DE3)를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 22. 서열 번호 22의 융합 단백질 22
서열 번호 22의 단백질은, TRAIL 121-281 서열의 C-말단에 효과기 펩티드로서 Gly, Ala 반복으로 이루어진 합성 펩티드 서열(서열 번호 46)이 부착된, 199 아미노산의 길이 및 22.3 kDa의 질량을 갖는 융합 단백질이고, 그것의 C-말단에 또한 8개의 Arg 잔기로 이루어진 폴리아르기닌 서열이 부착되며, 후자는 또한 전체 구조물의 C-말단 부분을 형성한다. 더욱이, TRAIL의 서열 및 효과기 펩티드 사이에는, 메탈로프로테아제 MMP (서열 번호 51) 및 유로키나제 uPA (서열 번호 52)에 의해 인식되는 절단 부위의 서열이 존재한다.
융합 단백질의 구조는 도 4에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 22 및 서열 번호 88로 하기에 나타낸다.
아미노산 서열: 서열 번호 22
1 RVAAHITGTR GRSNTLSSPN SKNEKALGRK INSWESSRSG HSFLSNLHLR
51 NGELVIHEKG FYYIYSQTYF RFQEEIKENT KNDKQMVQYI YKYTSYPDPI
101 LLMKSARNSC WSKDAEYGLY SIYQGGIFEL KENDRIFVSV TNEHLIDMDH
151 EASFFGAFLV GRVVRPLGLA GAGAGGGAGG AGAGGGAGGA GRRRRRRRR
DNA 서열: 서열 번호 88
1 CGTGTTGCAG CACATATTAC CGGCACCCGT GGTCGTAGCA ATACCCTGAG CAGCCCGAAT AGCAAAAATG AAAAAGCACT GGGTCGCAAA ATTAATAGCT
101 GGGAAAGCAG CCGTAGCGGT CATAGCTTTC TGAGCAATCT GCATCTGCGT AATGGTGAAC TGGTGATTCA TGAAAAAGGC TTTTATTATA TTTATAGCCA
201 GACCTATTTT CGCTTTCAAG AAGAAATTAA AGAAAACACC AAAAATGATA AACAAATGGT GCAGTATATT TACAAATATA CCAGCTATCC GGATCCGATT
301 CTGCTGATGA AAAGCGCACG TAATAGCTGT TGGAGCAAAG ATGCAGAATA TGGTCTGTAT AGCATTTATC AGGGTGGCAT TTTTGAACTG AAAGAAAATG
401 ATCGCATTTT TGTGAGCGTG ACCAATGAAC ATCTGATTGA TATGGATCAT GAAGCCAGCT TTTTTGGTGC ATTTCTGGTT GGTGGTGGTG GTAGCGGTGG
501 TGGTCGTGTT GTTCGTCCGC TGGGTCTGGC TGGTGCCGGT GCCGGTGGTG GTGCAGGCGG TGCTGGTGCG GGTGGCGGAG CCGGTGGTGC AGGTCGTCGT
601 CGTCGCCGTC GTCGGCGT
상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 BL21 (DE3) 또는 튜너 (DE3)를 사용하여 일반 절차 B에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 23. 서열 번호 23의 융합 단백질
서열 번호 23의 단백질은 TRAIL 121-281 서열의 C-말단에 UIMs 모티프를 포함하는 프로테아좀 성분 S5a의 C-말단 도메인(서열 번호 46)이 효과기 펩티드로서 부착된, 289 아미노산의 길이 및 32.6 kDa의 질량을 갖는 융합 단백질이다. 더욱이, 효과기 펩티드 및 TRAIL의 서열의 사이에는, 가요성 글리신-세린 링커 GGGSGG (서열 번호 61)에 의해 TRAIL 서열로부터 추가로 분리된, 퓨린 절단 부위의 서열 (서열 번호 53)이 존재하고, 효과기 펩티드의 C-말단에는 소포체를 향하는 KEDL 서열(서열 번호 56)이 위치되며, 후자는 전체 구조물의 C-말단 부분이 된다.
융합 단백질의 구조는 도 8에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 23 및 서열 번호 89로 하기에 나타낸다.
아미노산 서열: 서열 번호 23
1 RVAAHITGTR GRSNTLSSPN SKNEKALGRK INSWESSRSG HSFLSNLHLR
51 NGELVIHEKG FYYIYSQTYF RFQEEIKENT KNDKQMVQYI YKYTSYPDPI
101 LLMKSARNSC WSKDAEYGLY SIYQGGIFEL KENDRIFVSV TNEHLIDMDH
151 EASFFGAFLV GGGGSGGRKK RMTISQQEFG RTGLPDLSSM TEEEQIAYAM
201 QMSLQGAEFG QAESADIDAS SAMDTSEPAK EEDDYDVMQD PEFLQSVLEN
251 LPGVDPNNEA IRNAMGSLAS QATKDGKKDK KEEDKKEDL
DNA 서열: 서열 번호 89
1 CGTGTTGCAG CACATATTAC CGGCACCCGT GGTCGTAGCA ATACCCTGAG CAGCCCGAAT AGCAAAAATG AAAAAGCACT GGGTCGCAAA ATTAATAGCT
101 GGGAAAGCAG CCGTAGCGGT CATAGCTTTC TGAGCAATCT GCATCTGCGT AATGGTGAAC TGGTGATTCA TGAAAAAGGC TTTTATTATA TTTATAGCCA
201 GACCTATTTT CGCTTTCAAG AAGAAATTAA AGAAAACACC AAAAATGATA AACAAATGGT GCAGTATATT TACAAATATA CCAGCTATCC GGATCCGATT
301 CTGCTGATGA AAAGCGCACG TAATAGCTGT TGGAGCAAAG ATGCAGAATA TGGTCTGTAT AGCATTTATC AGGGTGGCAT TTTTGAACTG AAAGAAAATG
401 ATCGCATTTT TGTGAGCGTG ACCAATGAAC ATCTGATTGA TATGGATCAT GAAGCCAGCT TTTTTGGTGC ATTTCTGGTT GGTGGTGGTG GTAGCGGTGG
501 TCGTAAAAAA CGTATGACCA TTAGCCAGCA AGAATTTGGT CGTACCGGTC TGCCGGATCT GAGCAGCATG ACCGAAGAAG AACAAATTGC CTACGCAATG
601 CAGATGAGCC TGCAGGGTGC AGAATTTGGT CAGGCAGAAA GCGCAGATAT TGATGCAAGC AGCGCAATGG ATACCAGCGA ACCGGCAAAA GAAGAAGACG
701 ATTACGACGT TATGCAGGAT CCGGAATTTC TGCAGAGCGT TCTGGAAAAT CTGCCGGGTG TTGATCCGAA TAATGAAGCA ATTCGTAATG CAATGGGTAG
801 CCTGGCAAGC CAAGCAACCA AAGATGGCAA AAAAGATAAA AAAGAGGAAG ACAAAAAAGA AGATCTG
상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 BL21 (DE3) 또는 튜너 (DE3)를 사용하여 일반 절차 B에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 24. 서열 번호 24의 융합 단백질 (비교)
서열 번호 24의 단백질은 119-281 TRAIL 서열의 N-말단에 TNF 리간드로부터 유도된 데카펩티드(서열 번호 48)가 효과기 펩티드로서 부착된, 183 아미노산의 길이 및 21 kDa의 질량을 갖는 융합 단백질이다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재한다.
융합 단백질의 구조는 도 5에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 24 및 서열 번호 90으로 하기에 나타낸다.
아미노산 서열: 서열 번호 24
1 VANPQAEGQL RVVRPLGLAG PQRVAAHITG TRGRSNTLSS PNSKNEKALG
51 RKINSWESSR SGHSFLSNLH LRNGELVIHE KGFYYIYSQT YFRFQEEIKE
101 NTKNDKQMVQ YIYKYTSYPD PILLMKSARN SCWSKDAEYG LYSIYQGGIF
151 ELKENDRIFV SVTNEHLIDM DHEASFFGAF LVG
DNA 서열: 서열 번호 90
1 GTTGCAAATC CGCAGGCAGA AGGTCAGCTG CGCGTTGTTC GTCCGCTGGG TCTGGCAGGT CCGCAGCGTG TTGCAGCACA TATTACCGGC ACCCGTGGTC
101 GTAGCAATAC CCTGAGCAGC CCGAATAGCA AAAATGAAAA AGCCCTGGGT CGTAAAATTA ATAGCTGGGA AAGCAGCCGT AGCGGTCATA GCTTTCTGAG
201 CAATCTGCAT CTGCGTAATG GCGAACTGGT GATTCATGAA AAAGGCTTTT ATTATATTTA TAGCCAGACC TATTTTCGCT TTCAGGAAGA AATTAAAGAA
301 AATACCAAAA ATGATAAACA AATGGTGCAG TATATCTATA AATATACCAG CTATCCGGAT CCGATTCTGC TGATGAAAAG CGCACGTAAT AGCTGTTGGA
401 GCAAAGATGC CGAATATGGT CTGTATAGCA TTTATCAGGG TGGCATTTTT GAACTGAAAG AAAATGATCG CATTTTTGTG AGCGTGACCA ATGAACATCT
501 GATTGATATG GATCATGAAG CCAGCTTTTT TGGTGCATTT CTGGTTGGT
상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 BL21 (DE3)을 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 25. 서열 번호 25의 융합 단백질 (비교)
서열 번호 25의 단백질은 TRAIL 119-281 서열의 N-말단에 TNF로부터 유도된 6-아미노산 펩티드(서열 번호 49)가 효과기 펩티드로서 부착된, 179 아미노산의 길이 및 20.7 kDa의 질량을 갖는 융합 단백질이다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재한다.
융합 단백질의 구조는 도 5에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 25 및 서열 번호 91로 하기에 나타낸다.
아미노산 서열: 서열 번호 25
1 LANGVERVVR PLGLAGPQRV AAHITGTRGR SNTLSSPNSK NEKALGRKIN
51 SWESSRSGHS FLSNLHLRNG ELVIHEKGFY YIYSQTYFRF QEEIKENTKN
101 DKQMVQYIYK YTSYPDPILL MKSARNSCWS KDAEYGLYSI YQGGIFELKE
151 NDRIFVSVTN EHLIDMDHEA SFFGAFLVG
DNA 서열: 서열 번호 91
1 CTGGCAAATG GTGTTGAACG TGTTGTTCGT CCGCTGGGTC TGGCAGGTCC GCAGCGTGTT GCAGCACATA TTACCGGCAC CCGTGGTCGT AGCAATACCC
101 TGAGCAGCCC GAATAGCAAA AATGAAAAAG CCCTGGGTCG TAAAATTAAT AGCTGGGAAA GCAGCCGTAG CGGTCATAGC TTTCTGAGCA ATCTGCATCT
201 GCGTAATGGC GAACTGGTGA TTCATGAAAA AGGCTTTTAT TATATTTATA GCCAGACCTA TTTTCGCTTT CAGGAAGAAA TTAAAGAAAA TACCAAAAAT
301 GATAAACAAA TGGTGCAGTA TATCTATAAA TATACCAGCT ATCCGGATCC GATTCTGCTG ATGAAAAGCG CACGTAATAG CTGTTGGAGC AAAGATGCCG
401 AATATGGTCT GTATAGCATT TATCAGGGTG GCATTTTTGA ACTGAAAGAA AATGATCGCA TTTTTGTGAG CGTGACCAAT GAACATCTGA TTGATATGGA
501 TCATGAAGCC AGCTTTTTTG GTGCATTTCT GGTTGGT
상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 튜너 (DE3)를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 26. 서열 번호 26의 융합 단백질 (비교)
서열 번호 26의 단백질은 TRAIL 119-281 서열의 N-말단에, C-말단 및 N-말단 양쪽에 추가적인 1개의 Cys 잔기를 갖는, TNF 사이토카인의 5-아미노산 분절(서열 번호 50)이 효과기 펩티드로서 부착된, 180 아미노산의 길이 및 20.8 kDa의 질량을 갖는 융합 단백질이다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재한다.
융합 단백질의 구조는 도 5에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 26 및 서열 번호 92로 하기에 나타낸다.
아미노산 서열: 서열 번호 26
1 CPSEGLCRVV RPLGLAGPQR VAAHITGTRG RSNTLSSPNS KNEKALGRKI
51 NSWESSRSGH SFLSNLHLRN GELVIHEKGF YYIYSQTYFR FQEEIKENTK
101 NDKQMVQYIY KYTSYPDPIL LMKSARNSCW SKDAEYGLYS IYQGGIFELK
151 ENDRIFVSVT NEHLIDMDHE ASFFGAFLVG
DNA 서열: 서열 번호 92
1 TGTCCGAGCG AAGGTCTGTG TCGTGTTGTT CGTCCGCTGG GTCTGGCAGG TCCGCAGCGT GTTGCAGCAC ATATTACCGG CACCCGTGGT CGTAGCAATA
101 CCCTGAGCAG CCCGAATAGC AAAAATGAAA AAGCCCTGGG TCGTAAAATT AATAGCTGGG AAAGCAGCCG TAGCGGTCAT AGCTTTCTGA GCAATCTGCA
201 TCTGCGTAAT GGCGAACTGG TGATTCATGA AAAAGGCTTT TATTATATTT ATAGCCAGAC CTATTTTCGC TTTCAGGAAG AAATTAAAGA AAATACCAAA
301 AATGATAAAC AAATGGTGCA GTATATCTAT AAATATACCA GCTATCCGGA TCCGATTCTG CTGATGAAAA GCGCACGTAA TAGCTGTTGG AGCAAAGATG
401 CCGAATATGG TCTGTATAGC ATTTATCAGG GTGGCATTTT TGAACTGAAA GAAAATGATC GCATTTTTGT GAGCGTGACC AATGAACATC TGATTGATAT
501 GGATCATGAA GCCAGCTTTT TTGGTGCATT TCTGGTTGGT
상기 나타낸 아미노산 서열은 상기 나타낸 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 균주 튜너 (DE3)를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 27. 서열 번호 93의 융합 단백질
서열 번호 93의 단백질은 TRAIL95-281 서열의 C-말단에, 소포체를 향하는 서열(KDEL)이 그것의 C-말단에서 측면에 위치되고, 그 N-말단에서 가요성 글리신-세린 링커 (서열 번호 175)가 측면에 위치된, 전체 길이의 인간 RNAse A (서열 번호 32)가 효과기 펩티드로서 부착된, 459 아미노산의 길이 및 50.4 kDa의 질량을 갖는 융합 단백질이다. 추가로, 그 삼합체 구조를 안정화하기 위하여, TRAIL의 서열은 그 N-말단에서 글리신 잔기의 측면에 위치된 폴리시스테인 링커 (서열 번호 179)를 N-말단에 부착한다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 주어진 순서로, 가요성 글리신-세린 링커 (서열 번호 59), 페길레이션을 위한 링커 (서열 번호 170), 퓨린에 의해 인식되는 절단 부위의 서열 (서열 번호 53), 가요성 글리신-세린 링커 (서열 번호 65) 및 변형된 녹농균 전좌 도메인 (헬릭스 F 결실) 이 존재한다.
융합 단백질의 구조는 도 6에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 93 및 서열 번호 122이다.
전술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 튜너 (DE3) 균주를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 28. 서열 번호 94의 융합 단백질
서열 번호 94의 단백질은 TRAIL95-281 서열의 N-말단에, Nur77 유도된 펩티드 (서열 번호 35)가 효과기 펩티드로서 부착된, 213 아미노산의 길이 및 24.7 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그 N-말단에서 7 Arg 잔기로 이루어진 폴리아르기닌 수송 도메인에 부착된다. 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 MMP (서열 번호 51) 및 uPA (서열 번호 52) 에 의해 인식되는 절단 부위의 서열이 존재한다.
융합 단백질의 구조는 도 6에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 93 및 서열 번호 122이다.
전술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 튜너 (DE3) 균주를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 29. 서열 번호 95의 융합 단백질 95
서열 번호 95의 단백질은 TRAIL116-281 서열의 N-말단에, 아주린 유도된 펩티드 (서열 번호 151)가 효과기 펩티드로서 부착된, 204 아미노산의 길이 및 23.1 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 MMP (서열 번호 51) 및 uPA (서열 번호 52) 에 의해 인식되는 절단 부위의 서열이 존재한다.
융합 단백질의 구조는 도 6에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 95 및 서열 번호 124이다.
전술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 튜너 (DE3) 균주를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 30. 서열 번호 96의 융합 단백질 96
서열 번호 96의 단백질은 TRAIL120-281 서열의 C-말단에, 아주린 유도된 펩티드 (서열 번호 151)가 효과기 펩티드로서 부착된, 205 아미노산의 길이 및 23.3 kDa의 질량을 갖는 융합 단백질이다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 퓨린 프로테아제 (서열 번호 172)에 의해 인식되고, 가요성 글리신-세린 링커 GGGS (서열 번호 58)에 의해 TRAIL 서열로부터 추가로 분리되는 절단 부위의 서열이 존재한다. 효과기 펩티드의 C-말단에는 소포체를 향하는 서열 KEDL (서열 번호 56)이 측면에 위치되며, 이는 전체 구조물의 C-말단 부분을 형성한다.
융합 단백질의 구조는 도 6에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 96 및 서열 번호 125이다.
전술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 튜너 (DE3) 균주를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 31. 서열 번호 97의 융합 단백질
서열 번호 97의 단백질은 TRAIL120-281 서열의 C-말단에, 아주린 유도된 펩티드 (서열 번호 151)가 효과기 펩티드로서 부착된, 207 아미노산의 길이 및 23.1 kDa의 질량을 갖는 융합 단백질이다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 MMP (서열 번호 51) 및 uPA (서열 번호 52)에 의해 인식되고, 가요성 글리신-세린 링커 GGGSGGG (서열 번호 62)에 의해 TRAIL 서열로부터 추가로 분리되는 절단 부위의 서열이 존재한다.
융합 단백질의 구조는 도 6에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 97 및 서열 번호 126이다.
전술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 튜너 (DE3) 균주를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 32. 서열 번호 98의 융합 단백질
서열 번호 98의 단백질은 TRAIL120-281 서열의 C-말단에, 전체 길이의 아주린 펩티드 (서열 번호 152)가 효과기 펩티드로서 부착된, 327 아미노산의 길이 및 36.2 kDa의 질량을 갖는 융합 단백질이다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 MMP (서열 번호 51) 및 uPA (서열 번호 52)에 의해 인식되고, 가요성 글리신-세린 링커 GGGSGGG (서열 번호 62)에 의해 TRAIL 서열의 서열로부터 추가로 분리되는 절단 부위의 서열이 존재한다.
융합 단백질의 구조는 도 7에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 98 및 서열 번호 127이다.
전술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 튜너 (DE3) 균주를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 33. 서열 번호 99의 융합 단백질
서열 번호 99의 단백질은 TRAIL114-281 서열의 N-말단에, Smac/DIABLO 유도된 옥타머 펩티드 (서열 번호 39)가 효과기 펩티드로서 부착된, 199 아미노산의 길이 및 22.9 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그것의 C-말단에서 7 Arg 잔기로 이루어진 폴리아르기닌 수송 도메인에 부착된다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재한다.
융합 단백질의 구조는 도 7에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 99 및 서열 번호 128이다.
전술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 튜너 (DE3) 균주를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 34. 서열 번호 100의 융합 단백질
서열 번호 100의 단백질은 TRAIL95-281 서열의 N-말단에, Smac/DIABLO 유도된 옥타머 펩티드 (서열 번호 39)가 효과기 펩티드로서 부착된, 221 아미노산의 길이 및 25.2 kDa의 질량을 갖는 융합 단백질이다. 그 삼합체 구조를 안정화하기 위하여, TRAIL의 서열은 그 N-말단에 폴리시스테인 링커 (서열 번호 177)를 부착한다. 효과기 펩티드의 서열은 그것의 C-말단에서 7 Arg 잔기로 이루어진 폴리아르기닌 수송 도메인에 부착된다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재한다.
융합 단백질의 구조는 도 7에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 100 및 서열 번호 129이다.
전술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 튜너 (DE3) 균주를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 35. 서열 번호 101의 융합 단백질
서열 번호 101의 단백질은 TRAIL95-281 서열의 N-말단에, Smac/DIABLO 유도된 옥타머 펩티드 (서열 번호 39)가 효과기 펩티드로서 부착된, 212 아미노산의 길이 및 24.5 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그것의 C-말단에서 7 Arg 잔기로 이루어진 폴리아르기닌 수송 도메인에 부착된다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재한다.
융합 단백질의 구조는 도 7에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 101 및 서열 번호 130이다.
전술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 튜너 (DE3) 균주를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 36. 서열 번호 102의 융합 단백질
서열 번호 102의 단백질은 TRAIL121-281 서열의 N-말단에, Bax 단백질 (서열 번호 153)의 BH3 도메인 및 aPP 단백질로부터 지정된 펩티드가 효과기 펩티드로서 부착된, 212 아미노산의 길이 및 24.5 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그것의 C-말단에서 6 Arg 잔기로 이루어진 폴리아르기닌 수송 도메인에 부착된다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재한다.
융합 단백질의 구조는 도 7에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 102 및 서열 번호 131이다.
전술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 튜너 (DE3) 균주를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 37. 서열 번호 103의 융합 단백질
서열 번호 103의 단백질은 TRAIL95-281 서열의 N-말단에, Bax 단백질 (서열 번호 153)의 BH3 도메인 및 aPP 단백질로부터 지정된 펩티드가 효과기 펩티드로서 부착된, 247 아미노산의 길이 및 28.1 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그것의 C-말단에서 6 Arg 잔기로 이루어진 폴리아르기닌 수송 도메인에 부착된다. 그 삼합체 구조를 안정화하기 위하여, TRAIL의 서열은 그 N-말단에 폴리시스테인 링커 (서열 번호 177)를 부착한다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재한다.
융합 단백질의 구조는 도 8에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 103 및 서열 번호 132이다.
전술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 튜너 (DE3) 균주를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 38. 서열 번호 104의 융합 단백질
서열 번호 104의 단백질은 TRAIL114-281 서열의 C-말단에, Bax 단백질 (서열 번호 153)의 BH3 도메인 및 aPP 단백질로부터 지정된 펩티드가 효과기 펩티드로서 부착된, 212 아미노산의 길이 및 24.4 kDa의 질량을 갖는 융합 단백질이다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 MMP (서열 번호 51) 및 uPA (서열 번호 52)에 의해 인식되는 절단 부위의 서열이 존재한다.
융합 단백질의 구조는 도 8에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 104 및 서열 번호 133이다.
전술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 튜너 (DE3) 균주를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 39. 서열 번호 105의 융합 단백질
서열 번호 105의 단백질은 TRAIL120-281 서열의 N-말단에, 레티쿨론 RTN1-C 유도된 펩티드 (서열 번호 155)가 효과기 펩티드로서 부착된, 221 아미노산의 길이 및 24.8 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그것의 C-말단에서 핵 국소화 서열(서열 번호 168)에 부착된다. 추가로, 그 삼합체 구조를 안정화하기 위하여, TRAIL의 서열은 그 N-말단에, 2 내지 3개의 글리신 잔기가 각각 그 N- 및 C-말단의 측면에 위치하는 폴리시스테인 링커 (서열 번호 179)를 부착한다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재한다.
융합 단백질의 구조는 도 8에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 105 및 서열 번호 134이다.
전술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 튜너 (DE3) 균주를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 40. 서열 번호 106의 융합 단백질
서열 번호 106의 단백질은 TRAIL119-281 서열의 N-말단에, 레티쿨론 RTN1-C 유도된 펩티드 (서열 번호 156)가 효과기 펩티드로서 부착된, 435 아미노산의 길이 및 48 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그것의 C-말단에서 8 Arg 잔기로 이루어진 폴리아르기닌 수송 도메인에 부착된다. 추가로, 그 삼합체 구조를 안정화하기 위하여, TRAIL의 서열은 그 N-말단에 폴리시스테인 링커 (서열 번호 178)를 부착한다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재하며, 절단 부위의 이러한 서열은 각각 그 N- 및 C-말단에 링커 서열 GGSGG (서열 번호 60)가 측면에 위치된다.
융합 단백질의 구조는 도 8에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 106 및 서열 번호 135이다.
전술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 튜너 (DE3) 균주를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 41. 서열 번호 107의 융합 단백질
서열 번호 107의 단백질은 TRAIL121-281 서열의 C-말단에, 구성적으로 활성인 카스파제-3 (단일 사슬) (서열 번호 157)이 효과기 펩티드로서 부착된, 580 아미노산의 길이 및 65 kDa의 질량을 갖는 융합 단백질이다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 슈도모나스(서열 번호 176)로부터 유도된 수송 도메인이 존재한다. 수송 도메인 및 효과기 펩티드의 서열은 가요성 링커 GGGSGGG (서열 번호 62)를 통해 연결된다. 수송 도메인은 퓨린 (서열 번호 53)에 의해 인식된 절단 부위의 서열에 의해 TRAIL의 서열로부터 분리되고, 이러한 절단 부위의 서열은 각각 그 N- 및 C-말단에 2개의 링커 서열 GGGGS (서열 번호 59) 및 ASGG (서열 번호 65)가 측면에 위치된다.
융합 단백질의 구조는 도 8에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 107 및 서열 번호 136이다.
전술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 튜너 (DE3) 균주를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 42. 서열 번호 108의 융합 단백질
서열 번호 108의 단백질은 TRAIL119-281 서열의 N-말단에, Par-4 (서열 번호 158)로부터의 SAC 도메인이 효과기 펩티드로서 부착된, 247 아미노산의 길이 및 28.5 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그것의 C-말단에서 7 Arg 잔기로 이루어진 폴리아르기닌 수송 도메인에 부착된다. 추가로, TRAIL의 서열은 그 N-말단에 가요성 글리신-세린 링커 GGSGG (서열 번호 60)를 부착한다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 173)에 의해 인식되는 절단 부위의 서열이 존재한다.
융합 단백질의 구조는 도 9에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 108 및 서열 번호 137이다.
전술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 튜너 (DE3) 균주를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 43. 서열 번호 109의 융합 단백질
서열 번호 109의 단백질은 TRAIL119-281 서열의 N-말단에, Par-4 (서열 번호 158)로부터의 SAC 도메인이 효과기 펩티드로서 부착된, 247 아미노산의 길이 및 28.5 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그것의 C-말단에서 7 Arg 잔기로 이루어진 폴리아르기닌 수송 도메인에 부착되고, 그 N-말단에서 Oct6 전사 인자로부터의 NLS(핵 국지화 신호) 서열(서열 번호 168)에 부착된다. TRAIL의 서열은 그 N-말단에 가요성 글리신-세린 링커 GGSGG (서열 번호 60)를 부착한다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 173)에 의해 인식되는 절단 부위의 서열이 존재한다.
융합 단백질의 구조는 도 9에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 109 및 서열 번호 138이다.
전술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 튜너 (DE3) 균주를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 44. 서열 번호 110의 융합 단백질
서열 번호 110의 단백질은 TRAIL95-281 서열의 C-말단에, 녹사 단백질 (서열 번호 159)이 효과기 펩티드로서 부착된, 270 아미노산의 길이 및 30.8 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그 N-말단에서 7 Arg 잔기로 이루어진 폴리아르기닌 수송 도메인에 부착된다. 추가로, 그 삼합체 구조를 안정화하기 위하여, TRAIL의 서열은 그것의 C-말단에 폴리시스테인 링커 (서열 번호 177)를 부착하고, 가요성 글리신-세린 링커 GGSG (서열 번호 57)에 의해 TRAIL의 서열로부터 분리된다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 MMP (서열 번호 51) 및 uPA (서열 번호 52)에 의해 인식되는 절단 부위의 서열이 존재한다.
융합 단백질의 구조는 도 9에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 110 및 서열 번호 139이다.
전술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 튜너 (DE3) 균주를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 45. 서열 번호 111의 융합 단백질 111
서열 번호 111의 단백질은 TRAIL114-281 서열의 C-말단에, 녹사 단백질 (서열 번호 160)로부터 유도된 MTD/CKP 펩티드가 효과기 펩티드로서 부착된, 207 아미노산의 길이 및 23.7 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그 N-말단에서 7 Arg 잔기로 이루어진 폴리아르기닌 수송 도메인에 부착된다. 그 삼합체 구조를 안정화하기 위하여, TRAIL의 서열은 그것의 C-말단에 폴리시스테인 링커 (서열 번호 177)를 부착하고, 이 링커는 가요성 글리신-세린 링커 GGSG (서열 번호 57)에 의해 TRAIL의 서열로부터 분리된다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 MMP (서열 번호 51) 및 uPA (서열 번호 52)에 의해 인식되는 절단 부위의 서열이 존재한다.
융합 단백질의 구조는 도 9에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 111 및 서열 번호 140이다.
전술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 튜너 (DE3) 균주를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 46. 서열 번호 112의 융합 단백질
서열 번호 112의 단백질은 TRAIL95-281 서열의 N-말단에, 펩티드 온코나제 (서열 번호 41)가 효과기 펩티드로서 부착된, 311 아미노산의 길이 및 35 kDa의 질량을 갖는 융합 단백질이다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되고, 2개의 가요성 글리신-세린 링커 GGGGS (서열 번호 59)에 의해 TRAIL의 서열로부터 추가로 분리되는 절단 부위의 서열이 존재한다.
융합 단백질의 구조는 도 9에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 112 및 서열 번호 141이다.
전술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 튜너 (DE3) 균주를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 47. 서열 번호 113의 융합 단백질
서열 번호 113의 단백질은 TRAIL95-281 서열의 N-말단에, PUMA 단백질 (서열 번호 37)로부터의 BH3 도메인이 효과기 펩티드로서 부착된, 230 아미노산의 길이 및 27 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그것의 C-말단에서 9 Arg 잔기로 이루어진 폴리아르기닌 수송 도메인에 부착된다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재한다.
융합 단백질의 구조는 도 10에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 113 및 서열 번호 142이다.
전술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 튜너 (DE3) 균주를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 48. 서열 번호 114의 융합 단백질
서열 번호 114의 단백질은 TRAIL95-281 서열의 C-말단에, Bid 단백질 (서열 번호 31)로부터 유도된 짧은 펩티드가 효과기 펩티드로서 부착된, 225 아미노산의 길이 및 25.7 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그것의 C-말단에서 수송 도메인 KPRRPY (서열 번호 167)에 부착된다. 그 삼합체 구조를 안정화하기 위하여, TRAIL의 서열은 그것의 C-말단에 폴리시스테인 링커 (서열 번호 177)를 부착한다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 MMP (서열 번호 51) 및 uPA (서열 번호 52)에 의해 인식되는 절단 부위의 서열이 존재한다.
융합 단백질의 구조는 도 10에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 114 및 서열 번호 143이다.
전술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 튜너 (DE3) 균주를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 49. 서열 번호 115의 융합 단백질
서열 번호 115의 단백질은 TRAIL95-281 서열의 C-말단에, 짧은 하이브리드펩티드 Antp-TPR (서열 번호 161)이 효과기 펩티드로서 부착된, 234 아미노산의 길이 및 26.7 kDa의 질량을 갖는 융합 단백질이다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 MMP (서열 번호 51) 및 uPA (서열 번호 52)에 의해 인식되고, 그 삼합체 구조를 안정화하기 위하여 폴리시스테인 링커 (서열 번호 177)에 이어, 2개의 글리신 잔기에 의해 TRAIL 서열로부터 추가로 분리된 절단 부위의 서열이 존재한다.
융합 단백질의 구조는 도 10에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 115 및 서열 번호 144이다.
전술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 튜너 (DE3) 균주를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 50. 서열 번호 116의 융합 단백질
서열 번호 116의 단백질은 TRAIL120-281 서열의 N-말단에, Stat3 단백질 (서열 번호 162)의 SH2 도메인의 펩티드 억제제가 효과기 펩티드로서 부착된, 216 아미노산의 길이 및 24.3 kDa의 질량을 갖는 융합 단백질이다. 추가로, 그 삼합체 구조를 안정화하기 위하여, TRAIL 서열의 N-말단에는 폴리시스테인 링커 (서열 번호 179)가 부착되고, 상기 링커에는 각각 그 N- 및 C-말단에 3개의 글리신 잔기 및 GSG 모티프가 측면에 위치된다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재한다.
융합 단백질의 구조는 도 10에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 116 및 서열 번호 145이다.
전술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 튜너 (DE3) 균주를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 51. 서열 번호 117의 융합 단백질
서열 번호 117의 단백질은 TRAIL121-281 서열의 N-말단에, Bak 단백질 (서열 번호 163)의 BH3 도메인으로부터 유도된 펩티드가 효과기 펩티드로서 부착된, 194 아미노산의 길이 및 22,8 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그것의 C-말단에서 7 Arg 잔기로 이루어진 폴리아르기닌 수송 도메인에 부착된다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재한다.
융합 단백질의 구조는 도 10에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 117 및 서열 번호 146이다.
전술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 튜너 (DE3) 균주를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 52. 서열 번호 118의 융합 단백질
서열 번호 118의 단백질은 TRAIL121-281 서열의 N-말단에, Bad 단백질 (서열 번호 164)의 BH3 도메인으로부터 유도된 펩티드가 효과기 펩티드로서 부착된, 257 아미노산의 길이 및 30 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그것의 C-말단에서 8 Arg 잔기로 이루어진 폴리아르기닌 수송 도메인에 부착된다. 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재한다. TRAIL121-281의 서열의 C-말단에는 가요성 링커 GGSHG (서열 번호 182)에 이어서, 트롬빈 프로테아제 (서열 번호 174)에 의해 인식되는 절단 부위의 서열과, 전체 구조물의 C-말단 부분으로서, TRAIL95-121의 서열이 존재한다.
융합 단백질의 구조는 도 11에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 118 및 서열 번호 147이다.
전술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 튜너 (DE3) 균주를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 53. 서열 번호 119의 융합 단백질
서열 번호 119의 단백질은 TRAIL95-281 서열의 C-말단에, Bad 단백질 (서열 번호 164)의 BH3 도메인으로부터 유도된 펩티드가 효과기 펩티드로서 부착된, 236 아미노산의 길이 및 27.5 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그 N-말단에서 7 Arg 잔기로 이루어진 폴리아르기닌 수송 도메인에 부착된다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 MMP (서열 번호 51) 및 uPA (서열 번호 52)에 의해 인식되는 절단 부위의 서열이 존재하고, TRAIL95-281의 서열의 C-말단은 GGS 잔기로 이루어진 링커에 의해 절단 부위의 서열로부터 추가로 분리된다.
융합 단백질의 구조는 도 11에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 119 및 서열 번호 148이다.
전술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 튜너 (DE3) 균주를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 54. 서열 번호 120의 융합 단백질
서열 번호 120의 단백질은 TRAIL121-281 서열의 C-말단에, Bfl1 단백질 (서열 번호 165)로부터의 ATAP 펩티드가 효과기 펩티드로서 부착된, 216 아미노산의 길이 및 24.7 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그 N-말단에서 막 수송 도메인 KPRRPYR (서열 번호 181)에 부착된다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 MMP (서열 번호 51) 및 uPA (서열 번호 52)에 의해 인식되는 절단 부위의 서열이 존재하고, 가요성 글리신-세린 링커 GGGGSGGGG (서열 번호 180)에 의해 TRAIL의 서열로부터 추가로 분리된다.
융합 단백질의 구조는 도 11에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 120 및 서열 번호 149이다.
전술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 튜너 (DE3) 균주를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
실시예 55. 서열 번호 121의 융합 단백질
서열 번호 121의 단백질은 TRAIL121-281 서열의 N-말단에, Bfl1 단백질 (서열 번호 165)로부터의 ATAP 펩티드가 효과기 펩티드로서 부착된, 237 아미노산의 길이 및 27 kDa의 질량을 갖는 융합 단백질이다. 효과기 펩티드의 서열은 그 N-말단에서 미토콘드리아 타겟팅 서열(서열 번호 166)에 부착된다. 더욱이, 효과기 펩티드의 서열 및 TRAIL의 서열의 사이에는, 프로테아제 uPA (서열 번호 52) 및 MMP (서열 번호 51)에 의해 인식되는 절단 부위의 서열이 존재하고, 가요성 글리신-세린 링커 GGSGG (서열 번호 60)에 의해 TRAIL의 서열로부터 추가로 분리된다.
융합 단백질의 구조는 도 11에 도식적으로 나타내었으며, 그의 아미노산 서열 및 대장균에서 발현을 위해 최적화된 코돈을 포함하는 DNA 코딩 서열은, 각각, 서열 번호 121 및 서열 번호 150이다.
전술한 구조의 아미노산 서열은 그의 코딩 DNA 서열을 생성하기 위한 템플레이트로서 사용되었다. DNA의 코딩 서열을 함유하는 플라스미드가 생성되었으며 융합 단백질의 과발현은 상기 기술된 일반 절차에 따라 수행되었다. 과발현은 노바겐으로부터 입수한 대장균 튜너 (DE3) 균주를 사용하여 일반 절차 A에 따라 수행되었다. 단백질은 상기 기술된 일반 절차에 따라 전기영동으로 분리하였다.
융합 단백질의 항암 활성의 시험
종양 세포주의 세포독성 분석으로 시험관 내 및 마우스에서 생체 내에서 융합 단백질의 항암 활성의 시험을 행하였다. 비교를 위해서, hTRAIL114-281 단백질 (이하 간단히 TRAIL로도 나타낸다)을 사용하였다.
1. 시험관 내 세포주 테스트
세포주
인간 대장암 Colo205 (ATCC # CCL-222), 소세포 폐암 A549 (ATCC # CCL-185), 췌장암 BxPC3 (ATCC # CRL-1687), 전립선암 DU145 (ATCC # HTB-81) 및 PC3 (ATCC # CRL-1435), 및 인간 대세포 폐암 NCI-H460-Luc2 (Caliper # 124316)의 세포를 10% 우태아 혈청으로 보충된 RPMI 1640 배지(Hyclone, Logan, UT, USA)에 두었다. 인간 난소암 세포 OVCAR-3 (ATCC # HTB-161)을 20% 우태아 혈청 및 0.01 mg / ml 인슐린으로 보충된 RPMI 1640 배지 (Hyclone, Logan, UT, USA)에 두었다. 방광암 세포 UM-UC-3 (ATCC # CRL-1749), 폐암 세포 SK-MES-1 (ATCC # HTB-58), 유방암 세포 MCF-7 (ATCC # HTB-22), HT1080 결합 조직 암 세포 ( ATCC # CCL-121), 간 헤파토마 HepG2 세포(ATCC # HB-8065)를 10% 우태아 혈청 (Hyclone, Logan, UT, USA)으로 보충된 MEM 배양액 배지 (Hyclone, Logan, UT, USA)에 두었다. 결합 조직 종양 세포 HT1080를 또한 실험 도중 조절된 배지 내에 유지하고, 이들 세포의 2-일 정상 배양액으로부터 얻었다. 인간 대장암 HCT-116 (ATCC # CCL-247) 및 HT-29 (HTB-38), 난소암 SK-OV-3 (ATCC # HTB-77), 자궁암 MES-SA (ATCC # CRL- 1976)의 세포 및 독소루비신에 대해 내성인 그의 클론 MES-SA/Dx5 (ATCC # CRL-1977)를 10% 우태아 혈청으로 보충된 맥코이 배지 (Hyclone, Logan, UT, USA)에 두었다. 방광 암 세포 SW780 (ATCC # CRL-2169), 유방암 세포 MDA-MB-231 (ATCC # HTB-26) 및 인간 췌장 암종 상피성 세포주 PANC-1, CLS (Cell line Service # 300228)를 10% 우태아 혈청으로 보충된 DMEM (Hyclone, Logan, UT, USA)에 두었다. 탯줄 정맥으로부터의 HUVEC 세포(ATCC # CRL-1730)를 20% 우태아 혈청, 성장 인자 0.02 mg/ml ECGS (Sigma), 0.1 mg/ml 헤파린(Sigma)으로 보충된 M199 배지 (Hyclone, Logan, UT, USA)에 두고, 이들 세포를 0.1% 젤라틴으로 코팅된 배지에서 생육하였다. MCF10A 유방 세포(ATCC # CRL-10317)를 5% 말 혈청, 0.5 mg/ml 히드로코르티손, 10 μg/ml 인슐린, 20 ng/ml 성장 인자 EGF (모두 Sigma, USA)로 보충된 DMEM: F12 (1:1) (Sigma, USA)에 두었다. 모든 배지에 2mM L-글루타민 및 항생물질 (100 U/ml 페니실린 및 100 mg/ml 스트렙토마이신 (Hyclone, Logan, UT, USA))을 추가로 보충하였다. 세포를 37℃에서 성장 배지 RPMI, MEM, McCoy 및 DMEM:F12의 경우에5% CO2/공기에, DMEM의 경우에 10% CO2/공기에 두었다. 키트 Venor®GeM 마이코플라스마 PCR 검출 키트(Minerva Biolabs, Berlin, Germany)를 사용한 PCR 기법을 사용하여 마이코플라스마의 존재에 대해 세포를 일상적으로 체크하였다.
MTT
세포독성 테스트
MTT 분석은 세포 증식, 생존능력 및 세포독성을 측정하기 위해 사용되는 비색 분석이다. 이는 미토콘드리아에 존재하는 효소 숙시네이트-테트라졸륨 환원효소에 의한 황색 테트라졸륨 염 MTT (4,5-디메틸-2-티아졸릴)-2,5-디페닐테트라졸륨 브로마이드)의 비수용성 보라색 염료 포르마잔으로의 분해로 구성된다. MTT 환원은 살아있는 세포에서만 일어난다. 데이터 분석은 단백질의, 대조군 세포 대비 처리된 모집단에서 세포 수의 50% 환원이 발생하는, IC50 농도의 측정으로 이루어진다(ng/ml로). 결과는 GraphPad Prism 5.0을 사용하여 분석하였다.
테스트는 문헌의 상세한 설명에 따라 수행하였다(Celis, JE, (1998). Cell Biology, a Laboratory Handbook, second edition, Academic Press, San Diego; Yang, Y., Koh, LW, Tsai, JH., (2004); Involvment of viral and chemical factors with oral cancer in Taiwan, Jpn J Clin Oncol, 34 (4), 176-183).
세포 배양 배지를 정해진 밀도(100 μl 당 104 - 105 세포)로 희석하였다. 이어서 100 μl의 적절하게 희석된 세포 현탁액을 96-웰 플레이트에 3번 적용하였다. 그와 같이 제조된 세포를 사용된 배지에 따라 5% 또는 10% CO2에서 24시간 동안 37℃에서 배양하고, 이어서 (100 μl의 배지 중) 상기 세포에 다양한 농도의 테스트 단백질을 함유하는 100 μl의 배지를 추가로 가하였다. 3-4회의 세포 분열에 상응하는 다음 72시간에 걸쳐 테스트 단백질과 함께 세포를 배양하고, 그 후 테스트 단백질을 갖는 배지에 MTT의 작업 용액[5 mg/ml] 20 ml를 가하고, 5% CO2에서 3시간 동안 37℃에서 배양하였다. 이어서 MTT 용액의 배지를 제거하고, 100 μl 의 DMSO를 가하여 포르마잔 결정을 용해하였다. 혼합 후, 570 nm에서 흡광도를 측정하였다(레퍼런스 필터 690 nm).
시험관 내 세포독성 테스트의 결과를 표 1, 1a, 1b 및 표 2에 IC50 값 (ng/ml)으로서 요약하였으며, IC50 값은 용매만으로 배양된 대조군 세포에 대해 50% 수준에서 융합 단백질의 세포독성 효과가 관찰되는 단백질 농도에 해당한다. 각각의 실험은 3부로 행해진 2개 이상의 독립적인 실험의 평균값을 나타낸다. 단백질 제제의 활성 결여의 기준으로는 2000 ng/ml의 IC50 한도를 적용하였다. 2000을 넘는 IC50 값을 갖는 융합 단백질은 비활성인 것으로 간주하였다.
이러한 테스트를 위한 세포는, 종래의 항암제에 대해 내성인 암 세포주로서 독소루비신 라인 MES-SA/DX5에 대해 내성인 및 TRAIL 단백질에 대해 민감한 종양 세포주, TRAIL 단백질에 대해 천연적으로 내성인 종양 세포주를 포함하도록 선택하였다(TRAIL에 대해 천연적으로 내성의 기준 : TRAIL 단백질에 대한 IC50 > 2000).
비-암세포에서 융합 단백질의 영향/독성의 평가를 위해 건강한 대조군 세포주로서 분화되지 않은 HUVEC 세포주를 사용하였다.
TRAIL에 대해 천연적으로 내성인 세포에 본 발명의 특정 융합 단백질을 투여함으로서 TRAIL에 대한 세포주의 내성 극복의 가능성을 얻어진 결과로 확인하였다. TRAIL에 대해 민감한 세포 내로 본 발명의 융합 단백질을 투여할 때, 일부의 경우 TRAIL 작용의 효능의 분명하고 강력한 강화가 관찰되었으며, TRAIL 단독에 대한 IC50과의 비교시 융합 단백질의 IC50 값의 감소가 명백하였다. 더욱이, 일부의 경우 TRAIL의 활성보다 더 강력한, 전통적인 항암제 독소루비신에 대해 내성인 세포에서 본 발명의 융합 단백질의 세포독성 활성이 얻어졌다.
비-암세포주에 대해 얻어진 2000을 넘는 IC50 값은, 건강한 세포에 대해서는 본 발명의 단백질의 사용과 관련된 독성 작용이 없음을 나타내며, 이는 단백질의 전신 독성 가능성이 낮음을 나타낸다.
[표 1a]
[표 1b]
2. 확장된 패널의 종양 세포주에 대해 선택된 단백질 제제의 세포독성 활성의 분석
표 2는 브로드한 범위의 가장 일반적인 암에 상응하는, 상이한 장기로부터의 브로드한 패널의 종양 세포에 대해 선택된 본 발명의 융합 단백질의 시험관 내 세포독성 활성의 결과를 나타낸다. 얻어진 IC50 값으로, 융합 단백질의 높은 세포독성 활성과 그에 따른 암 치료에서의 잠재적 유용성을 확인하였다.
3. 이종이식에서 생체 내 융합 단백질의 항암 효능
인간 대장암 Colo205, 인간 대세포 폐암 NCI-H460-Luc2, 인간 폐암 A549, 및 인간 췌장암 PANC-1의 마우스 모델에서 단백질 제제의 항암 활성을 테스트하였다.
세포
Colo205 세포(ATCC # CCL-222)를 10% 우태아 혈청 및 2 mM 글루타민으로 보충된 Opti-MEM ((Invitrogen, Cat.22600-134)과 1:1 비율로 혼합된 RPMI 1640 배지 (Hyclone, Logan, UT, USA)에 두었다. 마우스 이식의 당일에, 트립신(Invitrogen)으로 세포를 세척하여 서포트로부터 세포를 분리하고, 이어서 세포를 1300 rpm, 4℃에서, 8분 동안 원심분리하고, HBSS 완충액 (Hanks 배지)에 현탁하고, 28.57x106 세포/ml의 농도까지 카운트 및 희석하였다. 이어서 상기 세포에 최종 세포 농도 25x106 세포/ml까지 Matrigel(BD Biocsciences, Cat.354 248)을 가하였다.
H460-Luc2 세포를 10% 우태아 혈청 및 2 mM 글루타민으로 보충된 RPMI 1640 배지 (HyClone, Logan, UT, USA)에 두었다. 마우스 이식의 당일에, 트립신(Invitrogen)으로 세포를 세척하여 서포트로부터 세포를 분리하고, 이어서 세포를 1300 rpm, 4℃에서, 8분 동안 원심분리하고, HBSS 완충액 (Hanks 배지)에 현탁하고, 50x106 세포/ml의 농도까지 카운트 및 희석하였다.
A549 세포를 10% 우태아 혈청 및 2 mM 글루타민으로 보충된 RPMI 1640 배지 (HyClone, Logan, UT, USA)에 두었다. 마우스 이식의 당일에, 트립신(Invitrogen)으로 세포를 세척하여 서포트로부터 세포를 분리하고, 이어서 세포를 1300 rpm, 4℃에서, 8분 동안 원심분리하고, HBSS 완충액 (Hanks 배지)에 현탁하였다.
인간 췌장암 PANC-1 세포를 10% 우태아 혈청 및 2 mM 글루타민으로 보충된 DMEM 배지 (HyClone, Logan, UT, USA)에 두었다. 마우스 이식의 당일에, 트립신(Invitrogen)으로 세포를 세척하여 서포트로부터 세포를 분리하고, 이어서 세포를 1300 rpm, 4℃에서, 8분 동안 원심분리하고, HBSS 완충액 (Hanks 배지)에 현탁하였다.
마우스
본 발명의 단백질의 항암 활성의 시험은 Harlan UK Ltd.,(Shaws Farm, Bicester, UK)로부터 입수한 7-9주령 NOD SCID 마우스로 수행하였다. A549, NCI-H460-Luc2 및 PANC-1 세포의 경우에, 본 발명의 단백질의 항암 활성의 시험은 Charles River Germany로부터 입수한 4-5주령 Crl:SHO-PrkdcscidHrhr 마우스로 수행하였다. 마우스를 음식물과 탈이온수에 대한 자유로운 접근(아드리비툼)과 함께 특별한 병원체가 없는 조건 하에 두었다. 동물에 대한 모든 실험은 New York Academy of Sciences' Ad Hoc Committee on Animal Research에 의해 발행되고, IV Local Ethics Committee on Animal Experimentation in Warsaw (No. 71/2009)에 의해 승인된 가이드라인: "Interdisciplinary Principles and Guidelines for the Use of Animals in Research, Marketing and Education"에 따라 행하였다.
실험 과정 및 평가
0일에 0.5 x 25 mm의 바늘(Bogmark)을 갖는 주사기로 0.15 ml HBSS 완충액 및 0.05 ml의 Matrigel에 현탁된 5x106의 Colo205 세포를 마우스의 우측에 피하로(sc) 이식하였다. 종양이 ~ 90-140 mm3 (11일)의 크기에 도달할 때, 마우스를 임의로 추출하여 ~ 115 mm3의 그룹의 평균 종양 크기를 얻었고, 치료군으로 할당하였다. 치료군에 본 발명의 융합 단백질의 제제 및 비교로서 TRAIL114-281을 투여하였다. 11-20일에 제제를 복강내로(ip) 매일 10일 동안(qdx10) 투여하였다. 치료군의 평균 종양 크기가 ~ 2000 mm3에 도달할 때, 척수의 파괴로 마우스를 희생시켰다. 대조군은 TRAIL114-281을 받았다.
H460의 경우에, 0일에 0.5 x 25 mm의 바늘(Bogmark)을 갖는 주사기로 0.1 ml HBSS 완충액에 현탁된 5x106의 NCI-H460-Luc2 세포를 마우스의 우측에 피하로(sc) 이식하였다. 종양이 ~ 100-120 mm3 (11일)의 크기에 도달할 때, 마우스를 임의로 추출하여 치료군으로 할당하였다. 치료군에 본 발명의 융합 단백질의 제제 및 비교로서 TRAIL114-281을 투여하였다. 제제를 이틀마다 하루 6회 정맥내로(i.v.) 투여하였다. 실험 29일째에 척수의 파괴로 마우스를 희생시켰다. 대조군은 TRAIL114-281을 받았다.
A549의 경우에, 0일에 0.5 x 25 mm의 바늘(Bogmark)을 갖는 주사기로 HBSS 완충액: Martigel의 3:1 비율로 된 혼합물 0.1 ml에 현탁된 7x106의 A549 세포를 마우스의 우측에 피하로(sc) 이식하였다. 종양이 ~ 100-120 mm3 (17일)의 크기에 도달할 때, 마우스를 임의로 추출하여 치료군으로 할당하였다. 치료군에 본 발명의 융합 단백질의 제제 및 비교로서 TRAIL114-281을 투여하였다. 제제를 이틀마다 하루 6회 정맥내로(i.v.) 투여하였다. 실험 34일째에 척수의 파괴로 마우스를 희생시켰다. 대조군은 TRAIL114-281을 받았다.
PANC-1의 경우에, 0일에 0.5 x 25 mm의 바늘(Bogmark)을 갖는 주사기로 HBSS 완충액: Martigel의 3:1 비율로 된 혼합물 0.1 ml에 현탁된 7x106의 A54PANC-1 세포를 마우스의 우측에 피하로(sc) 이식하였다. 종양이 ~ 95 mm3 (27일)의 크기에 도달할 때, 마우스를 임의로 추출하여 치료군으로 할당하였다. 치료군에 본 발명의 융합 단백질의 제제 및 비교로서 TRAIL114-281을 투여하였다. 제제를 이틀마다 하루 6회 정맥내로(i.v.) 투여하였다. 실험 43일째에 척수의 파괴로 마우스를 희생시켰다. 대조군은 TRAIL114-281을 받았다.
종양 크기는 전자 캘리퍼를 사용하여 측정하였고, 종양 체적은 식 : (a2 x b)/2를 사용하여 계산하였으며, 여기서 a = 종양의 짧은 쪽 대각선(mm) 및 b = 종양의 긴 쪽 대각선(mm)이다. 종양 성장의 억제는 하기 식:
TGI [%] (종양 성장 억제) = (WT/WC) x 100 - 100%
을 사용하여 계산하였으며, 여기서 WT는 치료군에서 평균 종양 체적을 의미하고, WC는 대조군에서 평균 종양 체적을 의미한다.
실험 결과는 평균 값 ± 표준 편차(SD)로 제시된다. 모든 계산 및 그래프는 GraphPad Prism 5.0 프로그램을 사용하여 제작하였다.
실험 결과는 도 12 및 13에 본 발명의 융합 단백질 및 비교로 TRAIL114-281로 치료되는 Colo205 대장암이 존재하는 마우스 SCID/NOD에서 종양 체적 변화의 다이어그램으로 도시된다. 도 12 및 13에서 그래프로 제시된 실험 결과는, 실시예 1 및 실시예 14의 본 발명의 융합 단백질의 투여가, 실험 29일째에 대조군에 비해 각각 39% 및 32% TGI로, 종양 Colo205 성장 억제를 유발하였음을 도시한다. 참조 제제로서 사용된 TRAIL114-281에 대해서는, 9% 수준의 TGI로 대조군에 비해 종양 세포 성장에 대한 약간의 억제 효과가 얻어졌다. 따라서, 본 발명의 융합 단백질은 TRAIL에 비해 훨씬 더 강력한 효과를 발휘한다.
테스트된 융합 단백질은 마우스의 체중 감소에 의해 명백해지는 중요한 부작용을 일으키지 않았다(즉, 기준 체중의 10% 미만). 이는 단백질의 낮은 전신 독성을 보여준다.
도 14 및 15에 제시된 실험 결과는, 본 발명의 융합 단백질 및 비교로 TRAIL114-281로 치료되는 NCI-H460 인간 대세포 폐암이 존재하는 마우스 Crl:SHO-PrkdcscidHrhr에서 종양 체적 변화의 다이어그램을 도시한다. 이는 실시예 14 및 실시예 2의 본 발명의 융합 단백질의 투여에 의해, 실험 29일째에 대조군에 비해 각각 82% 및 81% TGI로, NCI-H460 종양 성장 억제를 얻었음을 볼 수 있다. 참조 제제로서 사용된 TRAIL114-281에 대해서는, 75% 수준의 TGI로 대조군에 비해 종양 세포 성장에 대한 약간의 억제 효과가 얻어졌다. 따라서, 본 발명의 융합 단백질은 TRAIL에 비해 이러한 암 세포에 대한 훨씬 더 강력한 효과를 발휘한다.
테스트된 융합 단백질은 마우스의 체중 감소에 의해 명백해지는 중요한 부작용을 일으키지 않았다(즉, 기준 체중의 10% 미만). 이는 단백질의 낮은 전신 독성을 보여준다.
도 16 및 17에 제시된 실험 결과는, 본 발명의 융합 단백질 및 비교로 TRAIL114-281로 치료되는 A549 인간 폐암이 존재하는 마우스 Crl:SHO-PrkdcscidHrhr에서 종양 체적 변화의 다이어그램을 도시한다. 이는 실시예 14 및 실시예 2의 본 발명의 융합 단백질의 투여에 의해, 실험 29일째에 대조군에 비해 각각 48% 및 45.5% TGI로, A549 종양 성장 억제를 얻었음을 볼 수 있다. 참조 제제로서 사용된 TRAIL114-281에 대해서는, 20.7% 수준의 TGI로, 대조군에 비해 종양 세포 성장에 대한 약간의 억제 효과가 얻어졌다. 따라서, 본 발명의 융합 단백질은 TRAIL에 비해 훨씬 더 강력한 효과를 발휘한다.
도 18 및 19에 제시된 실험 결과는, 본 발명의 융합 단백질 및 비교로 TRAIL114-281로 치료되는 PANC-1 인간 췌장 암종, 상피성 세포가 존재하는 마우스 Crl:SHO-PrkdcscidHrhr에서 종양 체적 변화의 다이어그램을 도시한다. 이는 실시예 14 및 실시예 2의 본 발명의 융합 단백질의 투여에 의해, 실험 43일째에 대조군에 비해 각각 41.5% 및 49.8% TGI로, PANC-1 종양 성장 억제를 얻었음을 볼 수 있다. 참조 제제로서 사용된 TRAIL114-281에 대해서는, 32% 수준의 TGI로, 대조군에 비해 종양 세포 성장에 대한 약간의 억제 효과가 얻어졌다. 따라서, 본 발명의 융합 단백질은 TRAIL에 비해 훨씬 더 강력한 효과를 발휘한다.
테스트된 융합 단백질은 마우스의 체중 감소에 의해 명백해지는 중요한 부작용을 일으키지 않았다(즉, 기준 체중의 10% 미만). 이는 단백질의 낮은 전신 독성을 보여준다.
원편광
이색성
- 본 발명의 융합 단백질 제제의 2차 구조 함량의 판정
그 구조의 관점에서 융합 단백질 제제 구조의 품질은 원편광 이색성 (CD)을 사용하여 2차 구조의 분석에 의해 판정하였다. CD 방법은 타원 편광의 외관 및 빛의 편광면 회전으로 명백해지는 단백질 구조의 광학 활성을 사용한다. 원자외선 (UV)에서 단백질의 CD 스펙트럼은 주 폴리펩티드 사슬의 입체구조에 대한 정확한 데이터를 제공한다.
실시예 1, 실시예 2, 실시예 14, 실시예 24, 실시예 51 및 실시예 42에서 제조된 단백질의 샘플을 50 mM Tris-HCl pH 8,0, 100 mM NaCl, 10% 글리세롤, 0,1 mM ZnCl2, 80 mM 이당류, 5mM DTT로 이루어진 완충액으로 제형화 후 컷 오프 12 kDa로, 투석 백(Sigma-Aldrich)에서 투석하였다. 4℃에서 몇 시간 동안, 단백질 제제와 비교하여 100배 과량 (v/v)의 완충액에 대해 교반하면서, 투석을 수행하였다. 투석을 완료한 후, 각각의 제제를 원심분리하고(25 000 rpm., 10 분, 4℃), 적절한 상청액을 수집하였다. 상기와 같이 얻어진 샘플 중 단백질 농도를 Bradford 법에 의해 판정하였다.
0.1-2.7 mg/ml 농도 범위의 단백질에 대한 원편광 이색성의 측정을, 0.2 mm 또는 1 mm의 광로를 갖는 석영 큐벳트에서 Jasco J-710 분광편광계로 수행하였다. 7 l/분의 질소의 흐름 하에서 측정을 수행하였으며, 이는 195 내지 250 nm의 파장 범위에서 측정을 행하는 것을 가능하게 한다.
측정의 파라미터 : 스펙트럼 해상도 - 1 nm; 광선의 반치폭 1 nm; 감도 20 mdeg, 1파장에 대한 평균 시간 - 8 초, 스캔 속도 10 nm/분.
3회 측정의 평균으로서 결과를 제시하였다. 실시예 1, 실시예 2, 실시예 14, 실시예 24, 실시예 51 및 실시예 42에 따른 단백질에 대한 원편광 이색성 스펙트럼을 도 20에 나타낸다.
얻어진 스펙트럼을 CDPro 팩을 사용하여 193-250 nm의 범위에서 수치로 분석하였다. 이러한 파장 범위에서 너무 낮은 신호에 기인한 노이즈 비율 때문에 광전자증배관에서의 전압이 700 V를 넘는 포인트는 생략하였다. 얻어진 데이터는 CDPro 프로그램 패키지를 사용하여, 분석된 단백질에서 특정의 2차 구조 함량의 산출을 제공한다(표 4).
대조군(rhTRAIL114-281)은 주로 β-시트 구조 타입을 갖는 단백질에 대한 특징적인 CD 스펙트럼을 나타낸다(220 nm 파장에서 최소인 급격한 윤곽의 타원률). 이것으로 2차 구조 성분의 산출이 확인되며, 이는 미미한 수의 α-헬릭스 성분을 제시한다. 얻어진 결과는 또한 TRAIL 단백질의 결정 구조로부터의 데이터와 부합하며, 그것에 의해 베타 성분은 그 조성의 절반이 넘게 구성된다. 실시예 1 및 실시예 42의 하이브리드 단백질의 경우, 이색성 스펙트럼은 파장 208 및 220 nm에서 2개의 최소값을 특징으로 하며, 이는 알파/베타 타입의 혼합된 2차 구조를 갖는 단백질에 대한 특징이다. 이는 아마도 TRAIL에 대한 도메인(예를 들어 Bax로부터의 BH3)의 부착에 기인하며, 이는 알파-헬릭스 구조를 형성하여, 분석된 키메라 단백질에서 2차 구조의 혼합된 본성이 그들의 존재를 확인할 수 있게 한다(실시예 42에 대해서 열악한 품질의 스펙트럼 때문에 이는 덜 선명함).
실시예 2, 실시예 51, 실시예 14 및 실시예 24의 제제에 대해서, 및 TRAIL 단백질에 대해서, 상당한 함량의 베타-타입 구조가 발견되었다. 이는 아마도 부착된 짧은 펩티드가 처음에 베타 구조를 갖거나 또는 구조화되지 않고, 그에 따라 그 조성에 크게 영향을 주지 않는다는 사실에 기인한다. 실시예 2의 단백질의 경우에, 알파 구조의 함량에서 약간의 증가가 또한 관찰되었다. 실시예 1의 단백질과 유사하게, 이는 좁은 범위의 파장에 기인하거나(원자외선에서 많은 양의 노이즈는 판독을 제외하였다) 또는 유사한 형태를 형성하는, BH3 도메인의 존재에 기인한 것일 수 있다. 분석된 스펙트럼의 영역에서 180-200 nm 범위의 급격한 윤곽의 결여는 α-헬릭스 구조의 과-함량을 초래할 수 있다.
SEQUENCE LISTING
<110> Adamed Sp. z o.o.
Pienkow 149, 05-152 Czosnow
Poland
Pieczykolan, Jerzy Szczepan
Pawlak, Sebastian Dominik
Zerek, Bartlomiej Maciej
Lemke, Krzysztof Kazimierz
<120> Anticancer fusion protein
<130> P069/02/PCT
<150> PL391627
<151> 2010-06-25
<160> 184
<170> PatentIn version 3.5
<210> 1
<211> 194
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 1
Lys Lys Leu Ser Glu Cys Leu Lys Arg Ile Gly Asp Glu Leu Asp Ser
1 5 10 15
Arg Arg Arg Arg Arg Arg Arg Arg Val Val Arg Pro Leu Gly Leu Ala
20 25 30
Gly Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr
35 40 45
Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile
50 55 60
Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu
65 70 75 80
His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr
85 90 95
Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn
100 105 110
Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser
115 120 125
Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp
130 135 140
Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile
145 150 155 160
Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu
165 170 175
His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu
180 185 190
Val Gly
<210> 2
<211> 193
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 2
Arg Asn Ile Ala Arg His Leu Ala Gln Val Gly Asp Ser Met Asp Arg
1 5 10 15
Arg Arg Arg Arg Arg Arg Arg Val Val Arg Pro Leu Gly Leu Ala Gly
20 25 30
Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu
35 40 45
Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn
50 55 60
Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His
65 70 75 80
Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile
85 90 95
Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr
100 105 110
Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr
115 120 125
Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser
130 135 140
Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe
145 150 155 160
Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His
165 170 175
Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val
180 185 190
Gly
<210> 3
<211> 303
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 3
Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu
1 5 10 15
Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn
20 25 30
Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His
35 40 45
Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile
50 55 60
Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr
65 70 75 80
Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr
85 90 95
Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser
100 105 110
Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe
115 120 125
Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His
130 135 140
Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val
145 150 155 160
Gly Gly Gly Ser Gly Pro Leu Gly Leu Ala Gly Arg Val Val Arg Lys
165 170 175
Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser Ser Thr
180 185 190
Ser Ala Ala Ser Ser Ser Asn Tyr Cys Asn Gln Met Met Lys Ser Arg
195 200 205
Asn Leu Thr Lys Asp Arg Cys Lys Pro Val Asn Thr Phe Val His Glu
210 215 220
Ser Leu Ala Asp Val Gln Ala Val Cys Ser Gln Lys Asn Val Ala Cys
225 230 235 240
Lys Asn Gly Gln Thr Asn Cys Tyr Gln Ser Tyr Ser Thr Met Ser Ile
245 250 255
Thr Asp Cys Arg Glu Thr Gly Ser Ser Lys Tyr Pro Asn Cys Ala Tyr
260 265 270
Lys Thr Thr Gln Ala Asn Lys His Ile Ile Val Ala Cys Glu Gly Asn
275 280 285
Pro Tyr Val Pro Val His Phe Asp Ala Ser Val Lys Glu Asp Leu
290 295 300
<210> 4
<211> 293
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 4
Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu
1 5 10 15
Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn
20 25 30
Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His
35 40 45
Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile
50 55 60
Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr
65 70 75 80
Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr
85 90 95
Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser
100 105 110
Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe
115 120 125
Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His
130 135 140
Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val
145 150 155 160
Gly Gly Gly Gly Ser Gly Gly Gly Ser Lys Glu Thr Ala Ala Ala Lys
165 170 175
Phe Glu Arg Gln His Met Asp Ser Ser Thr Ser Ala Ala Ser Ser Ser
180 185 190
Asn Tyr Cys Asn Gln Met Met Lys Ser Arg Asn Leu Thr Lys Asp Arg
195 200 205
Cys Lys Pro Val Asn Thr Phe Val His Glu Ser Leu Ala Asp Val Gln
210 215 220
Ala Val Cys Ser Gln Lys Asn Val Ala Cys Lys Asn Gly Gln Thr Asn
225 230 235 240
Cys Tyr Gln Ser Tyr Ser Thr Met Ser Ile Thr Asp Cys Arg Glu Thr
245 250 255
Gly Ser Ser Lys Tyr Pro Asn Cys Ala Tyr Lys Thr Thr Gln Ala Asn
260 265 270
Lys His Ile Ile Val Ala Cys Glu Gly Asn Pro Tyr Val Pro Val His
275 280 285
Phe Asp Ala Ser Val
290
<210> 5
<211> 283
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 5
Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu
1 5 10 15
Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn
20 25 30
Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His
35 40 45
Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile
50 55 60
Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr
65 70 75 80
Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr
85 90 95
Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser
100 105 110
Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe
115 120 125
Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His
130 135 140
Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val
145 150 155 160
Gly Gly Gly Ser Gly Pro Leu Gly Leu Ala Gly Arg Val Val Arg Gly
165 170 175
Asp Val Glu Lys Gly Lys Lys Ile Phe Ile Met Lys Cys Ser Gln Cys
180 185 190
His Thr Val Glu Lys Gly Gly Lys His Lys Thr Gly Pro Asn Leu His
195 200 205
Gly Leu Phe Gly Arg Lys Thr Gly Gln Ala Pro Gly Tyr Ser Tyr Thr
210 215 220
Ala Ala Asn Lys Asn Lys Gly Ile Ile Trp Gly Glu Asp Thr Leu Met
225 230 235 240
Glu Tyr Leu Glu Asn Pro Lys Lys Tyr Ile Pro Gly Thr Lys Met Ile
245 250 255
Phe Val Gly Ile Lys Lys Lys Glu Glu Arg Ala Asp Leu Ile Ala Tyr
260 265 270
Leu Lys Lys Ala Thr Asn Glu Lys Glu Asp Leu
275 280
<210> 6
<211> 407
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 6
Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu
1 5 10 15
Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn
20 25 30
Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His
35 40 45
Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile
50 55 60
Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr
65 70 75 80
Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr
85 90 95
Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser
100 105 110
Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe
115 120 125
Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His
130 135 140
Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val
145 150 155 160
Gly Gly Gly Gly Ser Arg Lys Lys Arg Ala Ser Gly Gly Pro Glu Gly
165 170 175
Gly Ser Leu Ala Ala Leu Thr Ala His Gln Ala Cys His Leu Pro Leu
180 185 190
Glu Thr Phe Thr Arg His Arg Gln Pro Arg Gly Trp Glu Gln Leu Glu
195 200 205
Gln Cys Gly Tyr Pro Val Gln Arg Leu Val Ala Leu Tyr Leu Ala Ala
210 215 220
Arg Leu Ser Trp Asn Gln Val Asp Gln Val Ile Ala Asn Ala Leu Ala
225 230 235 240
Ser Pro Gly Ser Gly Gly Asp Leu Gly Glu Ala Ile Arg Glu Ser Pro
245 250 255
Glu Gln Ala Arg Leu Ala Leu Thr Leu Ala Ala Ala Glu Ser Glu Arg
260 265 270
Phe Val Arg Gln Gly Thr Gly Asn Asp Glu Ala Gly Ala Ala Asn Gly
275 280 285
Pro Ala Asp Gly Gly Gly Ser Gly Gly Gly Met Gly Asp Val Glu Lys
290 295 300
Gly Lys Lys Ile Phe Ile Met Lys Cys Ser Gln Cys His Thr Val Glu
305 310 315 320
Lys Gly Gly Lys His Lys Thr Gly Pro Asn Leu His Gly Leu Phe Gly
325 330 335
Arg Lys Thr Gly Gln Ala Pro Gly Tyr Ser Tyr Thr Ala Ala Asn Lys
340 345 350
Asn Lys Gly Ile Ile Trp Gly Glu Asp Thr Leu Met Glu Tyr Leu Glu
355 360 365
Asn Pro Lys Lys Tyr Ile Pro Gly Thr Lys Met Ile Phe Val Gly Ile
370 375 380
Lys Lys Lys Glu Glu Arg Ala Asp Leu Ile Ala Tyr Leu Lys Lys Ala
385 390 395 400
Thr Asn Glu Lys Asp Glu Leu
405
<210> 7
<211> 409
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 7
Ile Ile Gly Gly His Val Ala Lys Pro His Ser Arg Pro Tyr Met Ala
1 5 10 15
Tyr Leu Met Ile Trp Asp Gln Lys Ser Leu Lys Arg Cys Gly Gly Phe
20 25 30
Leu Ile Arg Asp Asp Phe Val Leu Thr Ala Ala His Cys Trp Gly Ser
35 40 45
Ser Ile Asn Val Thr Leu Gly Ala His Asn Ile Lys Glu Gln Glu Pro
50 55 60
Thr Gln Gln Phe Ile Pro Val Lys Arg Ala Ile Pro His Pro Ala Tyr
65 70 75 80
Asn Pro Lys Asn Phe Ser Asn Asp Ile Met Leu Leu Gln Leu Glu Arg
85 90 95
Lys Ala Lys Arg Thr Arg Ala Val Gln Pro Leu Arg Leu Pro Ser Asn
100 105 110
Lys Ala Gln Val Lys Pro Gly Gln Thr Cys Ser Val Ala Gly Trp Gly
115 120 125
Gln Thr Ala Pro Leu Gly Lys His Ser His Thr Leu Gln Glu Val Lys
130 135 140
Met Thr Val Gln Glu Asp Arg Lys Cys Glu Ser Asp Leu Arg His Tyr
145 150 155 160
Tyr Asp Ser Thr Ile Glu Leu Cys Val Gly Asp Pro Glu Ile Lys Lys
165 170 175
Thr Ser Phe Lys Gly Asp Ser Gly Gly Pro Leu Val Cys Asn Lys Val
180 185 190
Ala Gln Gly Ile Val Ser Tyr Gly Arg Asn Asn Gly Met Pro Pro Arg
195 200 205
Ala Cys Thr Lys Val Ser Ser Phe Val His Trp Ile Lys Lys Thr Met
210 215 220
Lys Arg Tyr Gly Gly Gly Gly Ser Arg Lys Lys Arg Gly Gly Gly Gly
225 230 235 240
Ser Val Arg Glu Arg Gly Pro Gln Arg Val Ala Ala His Ile Thr Gly
245 250 255
Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu
260 265 270
Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly
275 280 285
His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile
290 295 300
His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe
305 310 315 320
Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln
325 330 335
Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys
340 345 350
Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr
355 360 365
Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile
370 375 380
Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His Glu Ala
385 390 395 400
Ser Phe Phe Gly Ala Phe Leu Val Gly
405
<210> 8
<211> 405
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 8
Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu
1 5 10 15
Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn
20 25 30
Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His
35 40 45
Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile
50 55 60
Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr
65 70 75 80
Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr
85 90 95
Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser
100 105 110
Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe
115 120 125
Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His
130 135 140
Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val
145 150 155 160
Gly Gly Gly Gly Ser Arg Lys Lys Arg Gly Gly Gly Gly Ser Ile Ile
165 170 175
Gly Gly His Val Ala Lys Pro His Ser Arg Pro Tyr Met Ala Tyr Leu
180 185 190
Met Ile Trp Asp Gln Lys Ser Leu Lys Arg Cys Gly Gly Phe Leu Ile
195 200 205
Arg Asp Asp Phe Val Leu Thr Ala Ala His Cys Trp Gly Ser Ser Ile
210 215 220
Asn Val Thr Leu Gly Ala His Asn Ile Lys Glu Gln Glu Pro Thr Gln
225 230 235 240
Gln Phe Ile Pro Val Lys Arg Ala Ile Pro His Pro Ala Tyr Asn Pro
245 250 255
Lys Asn Phe Ser Asn Asp Ile Met Leu Leu Gln Leu Glu Arg Lys Ala
260 265 270
Lys Arg Thr Arg Ala Val Gln Pro Leu Arg Leu Pro Ser Asn Lys Ala
275 280 285
Gln Val Lys Pro Gly Gln Thr Cys Ser Val Ala Gly Trp Gly Gln Thr
290 295 300
Ala Pro Leu Gly Lys His Ser His Thr Leu Gln Glu Val Lys Met Thr
305 310 315 320
Val Gln Glu Asp Arg Lys Cys Glu Ser Asp Leu Arg His Tyr Tyr Asp
325 330 335
Ser Thr Ile Glu Leu Cys Val Gly Asp Pro Glu Ile Lys Lys Thr Ser
340 345 350
Phe Lys Gly Asp Ser Gly Gly Pro Leu Val Cys Asn Lys Val Ala Gln
355 360 365
Gly Ile Val Ser Tyr Gly Arg Asn Asn Gly Met Pro Pro Arg Ala Cys
370 375 380
Thr Lys Val Ser Ser Phe Val His Trp Ile Lys Lys Thr Met Lys Arg
385 390 395 400
Tyr Lys Asp Glu Leu
405
<210> 9
<211> 187
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 9
Phe Ser Arg Ser Leu His Ser Leu Leu Arg Arg Arg Arg Arg Arg Arg
1 5 10 15
Arg Val Val Arg Pro Leu Gly Leu Ala Gly Arg Val Ala Ala His Ile
20 25 30
Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys
35 40 45
Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg
50 55 60
Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu
65 70 75 80
Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe
85 90 95
Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met
100 105 110
Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu
115 120 125
Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly
130 135 140
Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp
145 150 155 160
Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His
165 170 175
Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly
180 185
<210> 10
<211> 193
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 10
Gly Gln Val Gly Arg Gln Leu Ala Ile Ile Gly Asp Asp Ile Asn Arg
1 5 10 15
Arg Arg Arg Arg Arg Arg Arg Val Val Arg Pro Leu Gly Leu Ala Gly
20 25 30
Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu
35 40 45
Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn
50 55 60
Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His
65 70 75 80
Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile
85 90 95
Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr
100 105 110
Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr
115 120 125
Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser
130 135 140
Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe
145 150 155 160
Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His
165 170 175
Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val
180 185 190
Gly
<210> 11
<211> 204
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 11
Glu Glu Gln Trp Ala Arg Glu Ile Gly Ala Gln Leu Arg Arg Met Ala
1 5 10 15
Asp Asp Leu Asn Ala Gln Tyr Glu Arg Arg Arg Arg Arg Arg Arg Arg
20 25 30
Arg Arg Val Val Arg Pro Leu Gly Leu Ala Gly Arg Val Ala Ala His
35 40 45
Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser
50 55 60
Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser
65 70 75 80
Arg Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu
85 90 95
Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr
100 105 110
Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln
115 120 125
Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu
130 135 140
Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr
145 150 155 160
Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn
165 170 175
Asp Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp
180 185 190
His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly
195 200
<210> 12
<211> 372
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 12
Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu
1 5 10 15
Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn
20 25 30
Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His
35 40 45
Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile
50 55 60
Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr
65 70 75 80
Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr
85 90 95
Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser
100 105 110
Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe
115 120 125
Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His
130 135 140
Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val
145 150 155 160
Gly Gly Gly Ser Gly Gly Pro Leu Gly Leu Ala Gly Arg Val Val Arg
165 170 175
Ala Arg Ala Arg Gln Glu Gly Ser Ser Pro Glu Pro Val Glu Gly Leu
180 185 190
Ala Arg Asp Gly Pro Arg Pro Phe Pro Leu Gly Arg Leu Val Pro Ser
195 200 205
Ala Val Ser Cys Gly Leu Cys Glu Pro Gly Leu Ala Ala Ala Pro Ala
210 215 220
Ala Pro Thr Leu Leu Pro Ala Ala Tyr Leu Cys Ala Pro Thr Ala Pro
225 230 235 240
Pro Ala Val Thr Ala Ala Leu Gly Gly Ser Arg Trp Pro Gly Gly Pro
245 250 255
Arg Ser Arg Pro Arg Gly Pro Arg Pro Asp Gly Pro Gln Pro Ser Leu
260 265 270
Ser Leu Ala Glu Gln His Leu Glu Ser Pro Val Pro Ser Ala Pro Gly
275 280 285
Ala Leu Ala Gly Gly Pro Thr Gln Ala Ala Pro Gly Val Arg Gly Glu
290 295 300
Glu Glu Gln Trp Ala Arg Glu Ile Gly Ala Gln Leu Arg Arg Met Ala
305 310 315 320
Asp Asp Leu Asn Ala Gln Tyr Glu Arg Arg Arg Gln Glu Glu Gln Gln
325 330 335
Arg His Arg Pro Ser Pro Trp Arg Val Leu Tyr Asn Leu Ile Met Gly
340 345 350
Leu Leu Pro Leu Pro Arg Gly His Arg Ala Pro Glu Met Glu Pro Asn
355 360 365
Lys Glu Asp Leu
370
<210> 13
<211> 493
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 13
Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu
1 5 10 15
Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn
20 25 30
Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His
35 40 45
Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile
50 55 60
Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr
65 70 75 80
Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr
85 90 95
Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser
100 105 110
Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe
115 120 125
Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His
130 135 140
Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val
145 150 155 160
Gly Gly Gly Gly Ser Arg Lys Lys Arg Ala Ser Gly Gly Pro Glu Gly
165 170 175
Gly Ser Leu Ala Ala Leu Thr Ala His Gln Ala Cys His Leu Pro Leu
180 185 190
Glu Thr Phe Thr Arg His Arg Gln Pro Arg Gly Trp Glu Gln Leu Glu
195 200 205
Gln Cys Gly Tyr Pro Val Gln Arg Leu Val Ala Leu Tyr Leu Ala Ala
210 215 220
Arg Leu Ser Trp Asn Gln Val Asp Gln Val Ile Ala Asn Ala Leu Ala
225 230 235 240
Ser Pro Gly Ser Gly Gly Asp Leu Gly Glu Ala Ile Arg Glu Ser Pro
245 250 255
Glu Gln Ala Arg Leu Ala Leu Thr Leu Ala Ala Ala Glu Ser Glu Arg
260 265 270
Phe Val Arg Gln Gly Thr Gly Asn Asp Glu Ala Gly Ala Ala Asn Gly
275 280 285
Pro Ala Asp Gly Gly Ser Gly Gly Gly Ala Arg Ala Arg Gln Glu Gly
290 295 300
Ser Ser Pro Glu Pro Val Glu Gly Leu Ala Arg Asp Gly Pro Arg Pro
305 310 315 320
Phe Pro Leu Gly Arg Leu Val Pro Ser Ala Val Ser Cys Gly Leu Cys
325 330 335
Glu Pro Gly Leu Ala Ala Ala Pro Ala Ala Pro Thr Leu Leu Pro Ala
340 345 350
Ala Tyr Leu Cys Ala Pro Thr Ala Pro Pro Ala Val Thr Ala Ala Leu
355 360 365
Gly Gly Ser Arg Trp Pro Gly Gly Pro Arg Ser Arg Pro Arg Gly Pro
370 375 380
Arg Pro Asp Gly Pro Gln Pro Ser Leu Ser Leu Ala Glu Gln His Leu
385 390 395 400
Glu Ser Pro Val Pro Ser Ala Pro Gly Ala Leu Ala Gly Gly Pro Thr
405 410 415
Gln Ala Ala Pro Gly Val Arg Gly Glu Glu Glu Gln Trp Ala Arg Glu
420 425 430
Ile Gly Ala Gln Leu Arg Arg Met Ala Asp Asp Leu Asn Ala Gln Tyr
435 440 445
Glu Arg Arg Arg Gln Glu Glu Gln Gln Arg His Arg Pro Ser Pro Trp
450 455 460
Arg Val Leu Tyr Asn Leu Ile Met Gly Leu Leu Pro Leu Pro Arg Gly
465 470 475 480
His Arg Ala Pro Glu Met Glu Pro Asn Lys Asp Glu Leu
485 490
<210> 14
<211> 186
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 14
Ala Val Pro Ile Ala Gln Lys Pro Arg Arg Arg Arg Arg Arg Arg Arg
1 5 10 15
Val Val Arg Pro Leu Gly Leu Ala Gly Arg Val Ala Ala His Ile Thr
20 25 30
Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn
35 40 45
Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser
50 55 60
Gly His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val
65 70 75 80
Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg
85 90 95
Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val
100 105 110
Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met
115 120 125
Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu
130 135 140
Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg
145 150 155 160
Ile Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His Glu
165 170 175
Ala Ser Phe Phe Gly Ala Phe Leu Val Gly
180 185
<210> 15
<211> 191
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 15
Arg Ala Gly Leu Gln Phe Pro Val Gly Arg Leu Leu Arg Arg Leu Leu
1 5 10 15
Arg Arg Leu Leu Arg Val Val Arg Pro Leu Gly Leu Ala Gly Arg Val
20 25 30
Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser
35 40 45
Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp
50 55 60
Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg
65 70 75 80
Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser
85 90 95
Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn
100 105 110
Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp
115 120 125
Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp
130 135 140
Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu
145 150 155 160
Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile
165 170 175
Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly
180 185 190
<210> 16
<211> 279
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 16
Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu
1 5 10 15
Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn
20 25 30
Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His
35 40 45
Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile
50 55 60
Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr
65 70 75 80
Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr
85 90 95
Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser
100 105 110
Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe
115 120 125
Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His
130 135 140
Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val
145 150 155 160
Gly Gly Gly Ser Gly Pro Leu Gly Leu Ala Gly Arg Val Val Arg Gln
165 170 175
Asp Trp Leu Thr Phe Gln Lys Lys His Ile Thr Asn Thr Arg Asp Val
180 185 190
Asp Cys Asp Asn Ile Met Ser Thr Asn Leu Phe His Cys Lys Asp Lys
195 200 205
Asn Thr Phe Ile Tyr Ser Arg Pro Glu Pro Val Lys Ala Ile Cys Lys
210 215 220
Gly Ile Ile Ala Ser Lys Asn Val Leu Thr Thr Ser Glu Phe Tyr Leu
225 230 235 240
Ser Asp Cys Asn Val Thr Ser Arg Pro Cys Lys Tyr Lys Leu Lys Lys
245 250 255
Ser Thr Asn Lys Phe Cys Val Thr Cys Glu Asn Gln Ala Pro Val His
260 265 270
Phe Val Gly Val Gly Ser Cys
275
<210> 17
<211> 274
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 17
Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu
1 5 10 15
Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn
20 25 30
Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His
35 40 45
Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile
50 55 60
Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr
65 70 75 80
Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr
85 90 95
Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser
100 105 110
Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe
115 120 125
Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His
130 135 140
Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val
145 150 155 160
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gln Asp Trp Leu Thr Phe
165 170 175
Gln Lys Lys His Ile Thr Asn Thr Arg Asp Val Asp Cys Asp Asn Ile
180 185 190
Met Ser Thr Asn Leu Phe His Cys Lys Asp Lys Asn Thr Phe Ile Tyr
195 200 205
Ser Arg Pro Glu Pro Val Lys Ala Ile Cys Lys Gly Ile Ile Ala Ser
210 215 220
Lys Asn Val Leu Thr Thr Ser Glu Phe Tyr Leu Ser Asp Cys Asn Val
225 230 235 240
Thr Ser Arg Pro Cys Lys Tyr Lys Leu Lys Lys Ser Thr Asn Lys Phe
245 250 255
Cys Val Thr Cys Glu Asn Gln Ala Pro Val His Phe Val Gly Val Gly
260 265 270
Ser Cys
<210> 18
<211> 197
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 18
Val Arg Arg Phe Leu Val Thr Leu Arg Ile Arg Arg Ala Cys Gly Pro
1 5 10 15
Pro Arg Val Arg Arg Arg Arg Arg Arg Arg Arg Val Val Arg Pro Leu
20 25 30
Gly Leu Ala Gly Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg
35 40 45
Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly
50 55 60
Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu
65 70 75 80
Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly
85 90 95
Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile
100 105 110
Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys
115 120 125
Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn
130 135 140
Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln
145 150 155 160
Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val
165 170 175
Thr Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly
180 185 190
Ala Phe Leu Val Gly
195
<210> 19
<211> 189
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 19
Pro Arg Phe Met Asp Thr Trp Glu Gly Leu Asn Arg Arg Arg Arg Arg
1 5 10 15
Arg Arg Arg Val Val Arg Pro Leu Gly Leu Ala Gly Arg Val Ala Ala
20 25 30
His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn
35 40 45
Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser
50 55 60
Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly
65 70 75 80
Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr
85 90 95
Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys
100 105 110
Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile
115 120 125
Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu
130 135 140
Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu
145 150 155 160
Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met
165 170 175
Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly
180 185
<210> 20
<211> 195
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 20
Cys Glu Lys His Ile Met Glu Lys Ile Gln Gly Arg Gly Asp Asp Asp
1 5 10 15
Asp Arg Arg Arg Arg Arg Arg Arg Arg Val Val Arg Pro Leu Gly Leu
20 25 30
Ala Gly Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn
35 40 45
Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys
50 55 60
Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn
65 70 75 80
Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr
85 90 95
Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu
100 105 110
Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr
115 120 125
Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys
130 135 140
Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly
145 150 155 160
Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn
165 170 175
Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe
180 185 190
Leu Val Gly
195
<210> 21
<211> 218
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 21
Ala Val Pro Ile Ala Gln Lys Pro Arg Arg Arg Arg Arg Arg Arg Arg
1 5 10 15
Val Val Arg Pro Leu Gly Leu Ala Gly Arg Val Ala Ala His Ile Thr
20 25 30
Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn
35 40 45
Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser
50 55 60
Gly His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val
65 70 75 80
Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg
85 90 95
Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val
100 105 110
Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met
115 120 125
Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu
130 135 140
Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg
145 150 155 160
Ile Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His Glu
165 170 175
Ala Ser Phe Phe Gly Ala Phe Leu Val Gly Pro Leu Gly Leu Ala Gly
180 185 190
Arg Val Val Arg Arg Arg Arg Arg Arg Arg Arg Leu Ala Leu Arg Leu
195 200 205
Ala Cys Ile Gly Asp Glu Met Asp Val Ser
210 215
<210> 22
<211> 199
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 22
Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu
1 5 10 15
Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn
20 25 30
Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His
35 40 45
Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile
50 55 60
Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr
65 70 75 80
Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr
85 90 95
Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser
100 105 110
Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe
115 120 125
Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His
130 135 140
Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val
145 150 155 160
Gly Arg Val Val Arg Pro Leu Gly Leu Ala Gly Ala Gly Ala Gly Gly
165 170 175
Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala Gly Gly Ala Gly Arg
180 185 190
Arg Arg Arg Arg Arg Arg Arg
195
<210> 23
<211> 289
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 23
Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu
1 5 10 15
Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn
20 25 30
Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His
35 40 45
Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile
50 55 60
Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr
65 70 75 80
Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr
85 90 95
Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser
100 105 110
Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe
115 120 125
Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His
130 135 140
Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val
145 150 155 160
Gly Gly Gly Gly Ser Gly Gly Arg Lys Lys Arg Met Thr Ile Ser Gln
165 170 175
Gln Glu Phe Gly Arg Thr Gly Leu Pro Asp Leu Ser Ser Met Thr Glu
180 185 190
Glu Glu Gln Ile Ala Tyr Ala Met Gln Met Ser Leu Gln Gly Ala Glu
195 200 205
Phe Gly Gln Ala Glu Ser Ala Asp Ile Asp Ala Ser Ser Ala Met Asp
210 215 220
Thr Ser Glu Pro Ala Lys Glu Glu Asp Asp Tyr Asp Val Met Gln Asp
225 230 235 240
Pro Glu Phe Leu Gln Ser Val Leu Glu Asn Leu Pro Gly Val Asp Pro
245 250 255
Asn Asn Glu Ala Ile Arg Asn Ala Met Gly Ser Leu Ala Ser Gln Ala
260 265 270
Thr Lys Asp Gly Lys Lys Asp Lys Lys Glu Glu Asp Lys Lys Glu Asp
275 280 285
Leu
<210> 24
<211> 183
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 24
Val Ala Asn Pro Gln Ala Glu Gly Gln Leu Arg Val Val Arg Pro Leu
1 5 10 15
Gly Leu Ala Gly Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg
20 25 30
Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala
35 40 45
Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser
50 55 60
Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu
65 70 75 80
Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu
85 90 95
Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile
100 105 110
Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala
115 120 125
Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile
130 135 140
Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val
145 150 155 160
Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe
165 170 175
Phe Gly Ala Phe Leu Val Gly
180
<210> 25
<211> 179
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 25
Leu Ala Asn Gly Val Glu Arg Val Val Arg Pro Leu Gly Leu Ala Gly
1 5 10 15
Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn
20 25 30
Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys
35 40 45
Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn
50 55 60
Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr
65 70 75 80
Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu
85 90 95
Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr
100 105 110
Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys
115 120 125
Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly
130 135 140
Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn
145 150 155 160
Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe
165 170 175
Leu Val Gly
<210> 26
<211> 180
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 26
Cys Pro Ser Glu Gly Leu Cys Arg Val Val Arg Pro Leu Gly Leu Ala
1 5 10 15
Gly Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser
20 25 30
Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg
35 40 45
Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser
50 55 60
Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe
65 70 75 80
Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys
85 90 95
Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr
100 105 110
Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser
115 120 125
Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly
130 135 140
Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr
145 150 155 160
Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala
165 170 175
Phe Leu Val Gly
180
<210> 27
<211> 168
<212> PRT
<213> Homo sapiens
<300>
<308> P50591
<309> 1996-10-01
<313> (114)..(281)
<400> 27
Val Arg Glu Arg Gly Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr
1 5 10 15
Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys
20 25 30
Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His
35 40 45
Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His
50 55 60
Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln
65 70 75 80
Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr
85 90 95
Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser
100 105 110
Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser
115 120 125
Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe
130 135 140
Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser
145 150 155 160
Phe Phe Gly Ala Phe Leu Val Gly
165
<210> 28
<211> 163
<212> PRT
<213> Homo sapiens
<300>
<308> P50591
<309> 1996-10-01
<313> (119)..(281)
<400> 28
Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn
1 5 10 15
Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys
20 25 30
Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn
35 40 45
Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr
50 55 60
Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu
65 70 75 80
Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr
85 90 95
Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys
100 105 110
Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly
115 120 125
Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn
130 135 140
Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe
145 150 155 160
Leu Val Gly
<210> 29
<211> 161
<212> PRT
<213> Homo sapiens
<300>
<308> P50591
<309> 1996-10-01
<313> (121)..(281)
<400> 29
Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu
1 5 10 15
Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn
20 25 30
Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His
35 40 45
Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile
50 55 60
Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr
65 70 75 80
Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr
85 90 95
Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser
100 105 110
Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe
115 120 125
Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His
130 135 140
Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val
145 150 155 160
Gly
<210> 30
<211> 16
<212> PRT
<213> Homo sapiens
<300>
<308> GenBank/ AAF71267.1
<309> 2000-05-21
<313> (57)..(72)
<400> 30
Lys Lys Leu Ser Glu Cys Leu Lys Arg Ile Gly Asp Glu Leu Asp Ser
1 5 10 15
<210> 31
<211> 15
<212> PRT
<213> Homo sapiens
<300>
<308> GenBank/ AAH22072.2
<309> 2005-07-21
<313> (141)..(155)
<400> 31
Arg Asn Ile Ala Arg His Leu Ala Gln Val Gly Asp Ser Met Asp
1 5 10 15
<210> 32
<211> 124
<212> PRT
<213> Homo sapiens
<300>
<308> GenBank/ AAA72757.1
<309> 1993-08-30
<313> (33)..(156)
<400> 32
Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gln His Met Asp Ser Ser
1 5 10 15
Thr Ser Ala Ala Ser Ser Ser Asn Tyr Cys Asn Gln Met Met Lys Ser
20 25 30
Arg Asn Leu Thr Lys Asp Arg Cys Lys Pro Val Asn Thr Phe Val His
35 40 45
Glu Ser Leu Ala Asp Val Gln Ala Val Cys Ser Gln Lys Asn Val Ala
50 55 60
Cys Lys Asn Gly Gln Thr Asn Cys Tyr Gln Ser Tyr Ser Thr Met Ser
65 70 75 80
Ile Thr Asp Cys Arg Glu Thr Gly Ser Ser Lys Tyr Pro Asn Cys Ala
85 90 95
Tyr Lys Thr Thr Gln Ala Asn Lys His Ile Ile Val Ala Cys Glu Gly
100 105 110
Asn Pro Tyr Val Pro Val His Phe Asp Ala Ser Val
115 120
<210> 33
<211> 104
<212> PRT
<213> Homo sapiens
<300>
<308> GenBank/ AAH67222.1
<309> 2006-07-15
<313> (2)..(105)
<400> 33
Gly Asp Val Glu Lys Gly Lys Lys Ile Phe Ile Met Lys Cys Ser Gln
1 5 10 15
Cys His Thr Val Glu Lys Gly Gly Lys His Lys Thr Gly Pro Asn Leu
20 25 30
His Gly Leu Phe Gly Arg Lys Thr Gly Gln Ala Pro Gly Tyr Ser Tyr
35 40 45
Thr Ala Ala Asn Lys Asn Lys Gly Ile Ile Trp Gly Glu Asp Thr Leu
50 55 60
Met Glu Tyr Leu Glu Asn Pro Lys Lys Tyr Ile Pro Gly Thr Lys Met
65 70 75 80
Ile Phe Val Gly Ile Lys Lys Lys Glu Glu Arg Ala Asp Leu Ile Ala
85 90 95
Tyr Leu Lys Lys Ala Thr Asn Glu
100
<210> 34
<211> 227
<212> PRT
<213> Homo sapiens
<300>
<308> GenBank/ CAA01810.1
<309> 1995-10-17
<313> (1)..(227)
<400> 34
Ile Ile Gly Gly His Val Ala Lys Pro His Ser Arg Pro Tyr Met Ala
1 5 10 15
Tyr Leu Met Ile Trp Asp Gln Lys Ser Leu Lys Arg Cys Gly Gly Phe
20 25 30
Leu Ile Arg Asp Asp Phe Val Leu Thr Ala Ala His Cys Trp Gly Ser
35 40 45
Ser Ile Asn Val Thr Leu Gly Ala His Asn Ile Lys Glu Gln Glu Pro
50 55 60
Thr Gln Gln Phe Ile Pro Val Lys Arg Ala Ile Pro His Pro Ala Tyr
65 70 75 80
Asn Pro Lys Asn Phe Ser Asn Asp Ile Met Leu Leu Gln Leu Glu Arg
85 90 95
Lys Ala Lys Arg Thr Arg Ala Val Gln Pro Leu Arg Leu Pro Ser Asn
100 105 110
Lys Ala Gln Val Lys Pro Gly Gln Thr Cys Ser Val Ala Gly Trp Gly
115 120 125
Gln Thr Ala Pro Leu Gly Lys His Ser His Thr Leu Gln Glu Val Lys
130 135 140
Met Thr Val Gln Glu Asp Arg Lys Cys Glu Ser Asp Leu Arg His Tyr
145 150 155 160
Tyr Asp Ser Thr Ile Glu Leu Cys Val Gly Asp Pro Glu Ile Lys Lys
165 170 175
Thr Ser Phe Lys Gly Asp Ser Gly Gly Pro Leu Val Cys Asn Lys Val
180 185 190
Ala Gln Gly Ile Val Ser Tyr Gly Arg Asn Asn Gly Met Pro Pro Arg
195 200 205
Ala Cys Thr Lys Val Ser Ser Phe Val His Trp Ile Lys Lys Thr Met
210 215 220
Lys Arg Tyr
225
<210> 35
<211> 9
<212> PRT
<213> Homo sapiens
<300>
<308> GenBank/ EAW58223.1
<309> 2006-12-18
<313> (561)..(569)
<400> 35
Phe Ser Arg Ser Leu His Ser Leu Leu
1 5
<210> 36
<211> 15
<212> PRT
<213> Homo sapiens
<300>
<308> GenBank/ AAI10338.1
<309> 2009-03-18
<313> (72)..(86)
<400> 36
Gly Gln Val Gly Arg Gln Leu Ala Ile Ile Gly Asp Asp Ile Asn
1 5 10 15
<210> 37
<211> 24
<212> PRT
<213> Homo sapiens
<300>
<308> GenBank/ AAB51243.2
<309> 2001-09-26
<313> (130)..(153)
<400> 37
Glu Glu Gln Trp Ala Arg Glu Ile Gly Ala Gln Leu Arg Arg Met Ala
1 5 10 15
Asp Asp Leu Asn Ala Gln Tyr Glu
20
<210> 38
<211> 192
<212> PRT
<213> Homo sapiens
<300>
<308> GenBank/ AAB51243.2
<309> 2001-09-26
<313> (2)..(193)
<400> 38
Ala Arg Ala Arg Gln Glu Gly Ser Ser Pro Glu Pro Val Glu Gly Leu
1 5 10 15
Ala Arg Asp Gly Pro Arg Pro Phe Pro Leu Gly Arg Leu Val Pro Ser
20 25 30
Ala Val Ser Cys Gly Leu Cys Glu Pro Gly Leu Ala Ala Ala Pro Ala
35 40 45
Ala Pro Thr Leu Leu Pro Ala Ala Tyr Leu Cys Ala Pro Thr Ala Pro
50 55 60
Pro Ala Val Thr Ala Ala Leu Gly Gly Ser Arg Trp Pro Gly Gly Pro
65 70 75 80
Arg Ser Arg Pro Arg Gly Pro Arg Pro Asp Gly Pro Gln Pro Ser Leu
85 90 95
Ser Leu Ala Glu Gln His Leu Glu Ser Pro Val Pro Ser Ala Pro Gly
100 105 110
Ala Leu Ala Gly Gly Pro Thr Gln Ala Ala Pro Gly Val Arg Gly Glu
115 120 125
Glu Glu Gln Trp Ala Arg Glu Ile Gly Ala Gln Leu Arg Arg Met Ala
130 135 140
Asp Asp Leu Asn Ala Gln Tyr Glu Arg Arg Arg Gln Glu Glu Gln Gln
145 150 155 160
Arg His Arg Pro Ser Pro Trp Arg Val Leu Tyr Asn Leu Ile Met Gly
165 170 175
Leu Leu Pro Leu Pro Arg Gly His Arg Ala Pro Glu Met Glu Pro Asn
180 185 190
<210> 39
<211> 8
<212> PRT
<213> Homo sapiens
<300>
<308> GenBank/ EAW98311.1
<309> 2006-12-18
<313> (132)..(138)
<400> 39
Ala Val Pro Ile Ala Gln Lys Pro
1 5
<210> 40
<211> 20
<212> PRT
<213> Homo sapiens
<300>
<308> GenBank/ BAG35060.1
<309> 2008-05-24
<313> (21)..(36)
<400> 40
Arg Ala Gly Leu Gln Phe Pro Val Gly Arg Leu Leu Arg Arg Leu Leu
1 5 10 15
Arg Arg Leu Leu
20
<210> 41
<211> 104
<212> PRT
<213> Homo sapiens
<300>
<308> Swiss-Prot/ P22069.2
<309> 2010-03-02
<313> (1)..(104)
<400> 41
Gln Asp Trp Leu Thr Phe Gln Lys Lys His Ile Thr Asn Thr Arg Asp
1 5 10 15
Val Asp Cys Asp Asn Ile Met Ser Thr Asn Leu Phe His Cys Lys Asp
20 25 30
Lys Asn Thr Phe Ile Tyr Ser Arg Pro Glu Pro Val Lys Ala Ile Cys
35 40 45
Lys Gly Ile Ile Ala Ser Lys Asn Val Leu Thr Thr Ser Glu Phe Tyr
50 55 60
Leu Ser Asp Cys Asn Val Thr Ser Arg Pro Cys Lys Tyr Lys Leu Lys
65 70 75 80
Lys Ser Thr Asn Lys Phe Cys Val Thr Cys Glu Asn Gln Ala Pro Val
85 90 95
His Phe Val Gly Val Gly Ser Cys
100
<210> 42
<211> 19
<212> PRT
<213> Homo sapiens
<300>
<308> GenBank/ AAH15960.3
<309> 2008-11-30
<313> (18)..(36)
<400> 42
Val Arg Arg Phe Leu Val Thr Leu Arg Ile Arg Arg Ala Cys Gly Pro
1 5 10 15
Pro Arg Val
<210> 43
<211> 11
<212> PRT
<213> Homo sapiens
<300>
<301> B?tger
<303> Oncogene
<304> 13
<306> 2141-2147
<307> 1996
<400> 43
Pro Arg Phe Met Asp Thr Trp Glu Gly Leu Asn
1 5 10
<210> 44
<211> 17
<212> PRT
<213> Glycine max
<300>
<308> GenBank/ ACE36683.1
<309> 2008-07-10
<313> (43)..(59)
<400> 44
Cys Glu Lys His Ile Met Glu Lys Ile Gln Gly Arg Gly Asp Asp Asp
1 5 10 15
Asp
<210> 45
<211> 15
<212> PRT
<213> Homo sapiens
<300>
<308> GenBank/ EAW98311.1
<309> 2006-12-18
<313> (132)..(138)
<400> 45
Leu Ala Leu Arg Leu Ala Cys Ile Gly Asp Glu Met Asp Val Ser
1 5 10 15
<210> 46
<211> 20
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<300>
<308> GenBank/ AAY41125.1
<309> 2006-01-06
<313> (148)..(167)
<400> 46
Ala Gly Ala Gly Gly Gly Ala Gly Gly Ala Gly Ala Gly Gly Gly Ala
1 5 10 15
Gly Gly Ala Gly
20
<210> 47
<211> 114
<212> PRT
<213> Homo sapiens
<300>
<308> GenBank/ CAO72169.1
<309> 2009-01-13
<313> (79)..(191)
<400> 47
Met Thr Ile Ser Gln Gln Glu Phe Gly Arg Thr Gly Leu Pro Asp Leu
1 5 10 15
Ser Ser Met Thr Glu Glu Glu Gln Ile Ala Tyr Ala Met Gln Met Ser
20 25 30
Leu Gln Gly Ala Glu Phe Gly Gln Ala Glu Ser Ala Asp Ile Asp Ala
35 40 45
Ser Ser Ala Met Asp Thr Ser Glu Pro Ala Lys Glu Glu Asp Asp Tyr
50 55 60
Asp Val Met Gln Asp Pro Glu Phe Leu Gln Ser Val Leu Glu Asn Leu
65 70 75 80
Pro Gly Val Asp Pro Asn Asn Glu Ala Ile Arg Asn Ala Met Gly Ser
85 90 95
Leu Ala Ser Gln Ala Thr Lys Asp Gly Lys Lys Asp Lys Lys Glu Glu
100 105 110
Asp Lys
<210> 48
<211> 10
<212> PRT
<213> Homo sapiens
<300>
<308> GenBank/ AAO21132.1
<309> 2003-01-18
<313> (93)..(102)
<400> 48
Val Ala Asn Pro Gln Ala Glu Gly Gln Leu
1 5 10
<210> 49
<211> 6
<212> PRT
<213> Homo sapiens
<300>
<308> GenBank/ AAO21132.1
<309> 2003-01-18
<313> (113)..(118)
<400> 49
Leu Ala Asn Gly Val Glu
1 5
<210> 50
<211> 7
<212> PRT
<213> Homo sapiens
<300>
<308> GenBank/ AAO21132.1
<309> 2003-01-18
<313> (127)..(131)
<400> 50
Cys Pro Ser Glu Gly Leu Cys
1 5
<210> 51
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 51
Pro Leu Gly Leu Ala Gly
1 5
<210> 52
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 52
Arg Val Val Arg
1
<210> 53
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 53
Arg Lys Lys Arg
1
<210> 54
<211> 118
<212> PRT
<213> Pseudomonas aeruginosa
<400> 54
Pro Glu Gly Gly Ser Leu Ala Ala Leu Thr Ala His Gln Ala Cys His
1 5 10 15
Leu Pro Leu Glu Thr Phe Thr Arg His Arg Gln Pro Arg Gly Trp Glu
20 25 30
Gln Leu Glu Gln Cys Gly Tyr Pro Val Gln Arg Leu Val Ala Leu Tyr
35 40 45
Leu Ala Ala Arg Leu Ser Trp Asn Gln Val Asp Gln Val Ile Ala Asn
50 55 60
Ala Leu Ala Ser Pro Gly Ser Gly Gly Asp Leu Gly Glu Ala Ile Arg
65 70 75 80
Glu Ser Pro Glu Gln Ala Arg Leu Ala Leu Thr Leu Ala Ala Ala Glu
85 90 95
Ser Glu Arg Phe Val Arg Gln Gly Thr Gly Asn Asp Glu Ala Gly Ala
100 105 110
Ala Asn Gly Pro Ala Asp
115
<210> 55
<211> 4
<212> PRT
<213> Homo sapiens
<400> 55
Lys Asp Glu Leu
1
<210> 56
<211> 4
<212> PRT
<213> Homo sapiens
<400> 56
Lys Glu Asp Leu
1
<210> 57
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 57
Gly Gly Ser Gly
1
<210> 58
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 58
Gly Gly Gly Ser
1
<210> 59
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 59
Gly Gly Gly Gly Ser
1 5
<210> 60
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 60
Gly Gly Ser Gly Gly
1 5
<210> 61
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 61
Gly Gly Gly Ser Gly Gly
1 5
<210> 62
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 62
Gly Gly Gly Ser Gly Gly Gly
1 5
<210> 63
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 63
Gly Gly Gly Ser Gly Gly Gly Ser
1 5
<210> 64
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 64
Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5
<210> 65
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 65
Ala Ser Gly Gly
1
<210> 66
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> artificial
<400> 66
Gly Gly Gly Ser Ala Ser Gly Gly
1 5
<210> 67
<211> 582
<212> DNA
<213> Artificial Sequence
<220>
<223> artificial
<400> 67
gcccaccaga aatgcaccaa aaaagctggc ttcatgatcc atatcaatca gatgttcatt 60
ggtcacgctc acaaaaatgc gatcattttc tttcagttca aaaatgccac cctgataaat 120
gctatacagg ccatattctg catctttgct ccaacagcta ttacgtgcgc ttttcatcag 180
cagaatcgga tccggatagc tggtatattt ataaatgtac tgcaccattt gtttatcatt 240
tttggtattt tctttaattt cttcctgaaa gcgaaaatag gtctggctat aaatataata 300
aaagcctttt tcatgaatca ccagttcacc attacgcaga tgcagattgc tcagaaagct 360
atgaccgcta cggctgcttt cccagctatt aattttgcga cccagggctt tttcattttt 420
gctattcggg ctgctcaggg tattgctacg accacgggtg ccggtaatat gtgctgcaac 480
acgacctgcc agacccagcg gacgaacaac acgacgacgg cgacgacgac gacggctatc 540
cagttcatca ccaatacgtt tcaggcattc gctcagtttt tt 582
<210> 68
<211> 579
<212> DNA
<213> Artificial Sequence
<220>
<223> artificial
<400> 68
cgtaatattg cacgtcatct ggcacaggtt ggtgatagca tggaccgtcg tcgtcgtcgc 60
cgtcgtcgtg ttgttcgtcc gctgggtctg gcaggtcgtg ttgcagcaca tattaccggc 120
acccgtggtc gtagcaatac cctgagcagc ccgaatagca aaaatgaaaa agccctgggt 180
cgcaaaatta atagctggga aagcagccgt agcggtcata gctttctgag caatctgcat 240
ctgcgtaatg gtgaactggt gattcatgaa aaaggctttt attatattta tagccagacc 300
tattttcgct ttcaggaaga aattaaagaa aataccaaaa atgataaaca aatggtgcag 360
tacatttata aatataccag ctatccggat ccgattctgc tgatgaaaag cgcacgtaat 420
agctgttgga gcaaagatgc agaatatggc ctgtatagca tttatcaggg tggcattttt 480
gaactgaaag aaaatgatcg catttttgtg agcgtgacca atgaacatct gattgatatg 540
gatcatgaag ccagcttttt tggtgcattt ctggtgggc 579
<210> 69
<211> 909
<212> DNA
<213> Artificial Sequence
<220>
<223> artificial
<400> 69
cgtgttgcag cacatattac cggcacccgt ggtcgtagca ataccctgag cagcccgaat 60
agcaaaaatg aaaaagccct gggtcgcaaa attaatagct gggaaagcag ccgtagcggt 120
catagctttc tgagcaatct gcatctgcgt aatggtgaac tggtgattca tgaaaaaggc 180
ttttattata tttatagcca gacctatttt cgctttcagg aagaaattaa agaaaatacc 240
aaaaatgaca aacaaatggt gcagtatatc tacaaataca ccagctatcc ggatccgatt 300
ctgctgatga aaagcgcacg taatagctgt tggagcaaag atgcagaata tggcctgtat 360
agcatttatc agggtggcat ttttgaactg aaagaaaatg atcgcatttt tgtgagcgtg 420
accaatgaac atctgattga tatggatcat gaagccagct tttttggtgc atttctggtt 480
ggtggtggta gcggtccgct gggtctggca ggtcgtgttg ttcgtaaaga aaccgcagca 540
gccaaatttg aacgtcagca catggatagc agcaccagcg cagcaagcag cagcaattat 600
tgcaatcaga tgatgaaaag ccgcaatctg accaaagatc gttgtaaacc ggtgaatacc 660
tttgttcatg aaagcctggc agatgttcag gcagtttgca gccagaaaaa tgtggcctgt 720
aaaaatggtc agaccaattg ctatcagagc tatagcacca tgagcattac cgattgtcgt 780
gaaaccggta gcagcaaata tccgaattgc gcctataaaa ccacccaggc caataaacat 840
attattgtgg cctgtgaagg caatccgtat gttccggttc attttgatgc cagcgtgaaa 900
gaagatctg 909
<210> 70
<211> 879
<212> DNA
<213> Artificial Sequence
<220>
<223> artificial
<400> 70
cgtgttgcag cacatattac cggcacccgt ggtcgtagca ataccctgag cagcccgaat 60
agcaaaaatg aaaaagcact gggtcgcaaa attaatagct gggaaagcag ccgtagcggt 120
catagctttc tgagcaatct gcatctgcgt aatggtgaac tggtgattca tgaaaaaggc 180
ttttattata tttatagcca gacctatttt cgctttcaag aagaaattaa agaaaatacc 240
aaaaatgata agcagatggt gcagtatatc tataaatata ccagctatcc ggatccgatt 300
ctgctgatga aaagcgcacg taatagctgt tggagcaaag atgcagaata tggtctgtat 360
agcatttatc agggtggcat ttttgaactg aaagaaaatg atcgcatttt tgtgagcgtg 420
accaatgaac atctgattga tatggatcat gaagccagct tttttggtgc atttctggtt 480
ggtggtggtg gtagcggtgg tggtagtaaa gaaaccgcag cagcaaaatt tgaacgtcag 540
cacatggata gcagcaccag cgcagcaagc agcagcaatt attgtaatca gatgatgaaa 600
agccgcaatc tgaccaaaga tcgttgtaaa ccggtgaata cctttgttca tgaaagcctg 660
gcagatgttc aggcagtttg tagccagaaa aatgttgcct gtaaaaatgg tcagaccaat 720
tgctatcaga gctatagcac catgagcatt accgattgtc gtgaaaccgg tagcagcaaa 780
tatccgaatt gtgcatataa aaccacccag gccaataaac atattattgt tgcctgtgaa 840
ggcaatccgt atgttccggt tcattttgat gcaagcgtt 879
<210> 71
<211> 852
<212> DNA
<213> Artificial Sequence
<220>
<223> artificial
<400> 71
cagatcttct ttttcattgg tggctttttt cagataggca atcagatctg cgcgttcttc 60
ttttttttta atgcccacaa aaatcatttt cgtacccgga atatattttt tcggattttc 120
cagatattcc atcagggtat cttcacccca aataatgcct ttgtttttat tggctgcggt 180
atagctataa cccggtgcct gaccggtttt acgaccaaac agaccatgca gattcggacc 240
ggttttatgt ttgccacctt tttcaacggt atgacactgg ctgcatttca taataaaaat 300
ttttttgcct ttttccacat caccacgaac aacacgacct gccagaccca gcggaccgct 360
accaccacca accagaaatg caccaaaaaa gctggcttca tgatccatat caatcagatg 420
ttcattggtc acgctcacaa aaatgcgatc attttctttc agttcaaaaa tgccaccctg 480
ataaatgcta tacaggccat attctgcatc tttgctccaa cagctattac gtgcgctttt 540
catcagcaga atcggatccg gatagctggt atatttataa atgtactgca ccatttgttt 600
atcgtttttg gtattttctt taatttcttc ctgaaagcga aaataggtct ggctataaat 660
ataataaaag cctttttcat gaatcaccag ttcaccatta cgcagatgca gattgctcag 720
aaagctatga ccgctacggc tgctttccca gctattaatt ttgcgaccca gggctttttc 780
atttttgcta ttcgggctgc tcagggtatt gctacgacca cgggtgccgg taatatgtgc 840
tgcaacacgc at 852
<210> 72
<211> 800
<212> DNA
<213> Artificial Sequence
<220>
<223> artificial
<400> 72
cgtgttgcag cacatattac cggcacccgt ggtcgtagca ataccctgag cagcccgaat 60
agcaaaaatg aaaaagcact gggtcgcaaa attaatagct gggaaagcag ccgtagcggt 120
catagctttc tgagcaatct gcatctgcgt aatggtgaac tggtgattca tgaaaaaggc 180
ttttattata tttatagcca gacctatttt cgctttcaag aagaaattaa agaaaatacc 240
aaaaatgaca aacaaatggt gcagtatatc tataaatata ccagctatcc ggatccgatt 300
ctgctgatga aaagcgcacg taatagctgt tggagcaaag atgcagaata tggtctgtat 360
agcatttatc agggtggcat ttttgaactg aaagaaaatg atcgcatttt tgtgagcgtg 420
accaatgaac atctgattga tatggatcat gaagccagct tttttggtgc atttctggtt 480
ggtggtggtg gtagccgtaa aaaacgtgca agcggtggtc cggaaggtgg tagcctggca 540
gcactgaccg cacatcaggc atgtcatctg ccgctggaaa cctttacccg tcatcgtcag 600
cctcgtggtt gggaacagct ggaacagtgt ggttatccgg ttcagcgtct ggttgcactg 660
tatctggcag cacgtctgag ctggaatcag gttgatcagg ttattgcaaa tgcactggca 720
agtccgggta gcggtggtga tctgggtgaa gcaattcgtg aaagtccgga acaggcacgt 780
ctggcactga ccctggcagc 800
<210> 73
<211> 1215
<212> DNA
<213> Artificial Sequence
<220>
<223> artificial
<400> 73
cgtgttgcag cacatattac cggcacccgt ggtcgtagca ataccctgag cagcccgaat 60
agcaaaaatg aaaaagccct gggtcgtaaa attaatagct gggaaagcag ccgtagcggt 120
catagctttc tgagcaatct gcatctgcgt aatggcgaac tggtgattca tgaaaaaggc 180
ttttattata tttatagcca gacctatttt cgctttcagg aagaaattaa agaaaatacc 240
aaaaatgata aacaaatggt gcagtatatc tataaatata ccagctatcc ggatccgatt 300
ctgctgatga aaagcgcacg taatagctgt tggagcaaag atgccgaata tggtctgtat 360
agcatttatc agggtggcat ttttgaactg aaagaaaatg atcgcatttt tgtgagcgtg 420
accaatgaac atctgattga tatggatcat gaagccagct tttttggtgc atttctggtt 480
ggtggtggtg gtagccgtaa aaaacgtggt ggtggcggtt ctattattgg tggtcatgtt 540
gcaaaaccgc atagccgtcc gtatatggca tatctgatga tttgggatca gaaaagcctg 600
aaacgttgtg gtggctttct gattcgtgat gattttgttc tgaccgcagc acattgttgg 660
ggtagcagca ttaatgttac cctgggtgcc cataatatta aagaacagga accgacccag 720
cagtttattc cggttaaacg tgcaattccg catccggcat ataatccgaa aaattttagc 780
aatgatatca tgctgctgca gctggaacgt aaagcaaaac gtacccgtgc agttcagccg 840
ctgcgtctgc cgagcaataa agcacaggtt aaaccgggtc agacctgtag cgttgcaggt 900
tggggtcaga ccgcaccgct gggtaaacat tctcataccc tgcaagaggt taaaatgacc 960
gtccaagagg atcgtaaatg cgaaagcgat ctgcgccatt attatgatag caccattgaa 1020
ctgtgtgtgg gcgatccgga aatcaaaaaa accagcttta aaggtgatag cggtggtccg 1080
ctggtttgta ataaagttgc ccagggtatt gttagctatg gtcgtaataa tggtatgccg 1140
ccgcgtgcat gtaccaaagt tagcagcttt gtgcattgga ttaaaaaaac gatgaaacgc 1200
tataaagatg aactg 1215
<210> 74
<211> 1215
<212> DNA
<213> Artificial Sequence
<220>
<223> artificial
<400> 74
cgtgttgcag cacatattac cggcacccgt ggtcgtagca ataccctgag cagcccgaat 60
agcaaaaatg aaaaagcact gggtcgcaaa attaatagct gggaaagcag ccgtagcggt 120
catagctttc tgagcaatct gcatctgcgt aatggtgaac tggtgattca tgaaaaaggc 180
ttttattata tttatagcca gacctatttt cgctttcaag aagaaattaa agaaaacacc 240
aaaaatgata aacaaatggt gcagtatatt tacaaatata ccagctatcc ggatccgatt 300
ctgctgatga aaagcgcacg taatagctgt tggagcaaag atgcagaata tggtctgtat 360
agcatttatc agggtggcat ttttgaactg aaagaaaatg atcgcatttt tgtgagcgtg 420
accaatgaac atctgattga tatggatcat gaagccagct tttttggtgc atttctggtt 480
ggtggtggtg gtagccgtaa aaaacgtggt ggtggcggta gtattattgg tggtcatgtt 540
gcaaaaccgc atagccgtcc gtatatggca tatctgatga tttgggatca gaaaagcctg 600
aaacgttgtg gtggttttct gattcgtgat gattttgttc tgaccgcagc acattgttgg 660
ggtagcagca ttaatgttac cctgggtgcc cataatatta aagaacaaga accgacccag 720
cagtttattc cggttaaacg tgcaattccg catccggcat ataatccgaa aaattttagc 780
aatgatatta tgctgctgca gctggaacgc aaagcaaaac gtacccgtgc agttcagccg 840
ctgcgtctgc cgagcaataa agcacaggtt aaaccgggtc agacctgtag cgttgcaggt 900
tggggtcaga ccgcaccgct gggtaaacat tcacataccc tgcaagaggt gaaaatgacc 960
gttcaagagg atcgtaaatg cgaaagcgat ctgcgccatt attatgatag caccattgaa 1020
ctgtgtgttg gtgatccgga aattaaaaaa accagcttta aaggcgatag cggtggtccg 1080
ctggtttgta ataaagttgc acagggtatt gtgagctatg gtcgtaataa tggtatgcct 1140
ccgcgtgcat gtaccaaagt tagcagcttt gtgcattgga ttaaaaaaac gatgaaacgc 1200
tataaagatg aactg 1215
<210> 75
<211> 561
<212> DNA
<213> Artificial Sequence
<220>
<223> artificial
<400> 75
tttagccgta gcctgcatag cctgctgcgt cgtcgtcgtc gccgtcgtcg tgttgttcgt 60
ccgctgggtc tggcaggtcg tgttgcagca catattaccg gcacccgtgg tcgtagcaat 120
accctgagca gcccgaatag caaaaatgaa aaagccctgg gtcgcaaaat taatagctgg 180
gaaagcagcc gtagcggtca tagctttctg agcaatctgc atctgcgtaa tggtgaactg 240
gtgattcatg aaaaaggctt ttattatatt tatagccaga cctattttcg ctttcaggaa 300
gaaattaaag aaaataccaa aaatgataaa caaatggtgc agtacattta taaatatacc 360
agctatccgg atccgattct gctgatgaaa agcgcacgta atagctgttg gagcaaagat 420
gcagaatatg gcctgtatag catttatcag ggtggcattt ttgaactgaa agaaaatgat 480
cgcatttttg tgagcgtgac caatgaacat ctgattgata tggatcatga agccagcttt 540
tttggtgcat ttctggtggg c 561
<210> 76
<211> 579
<212> DNA
<213> Artificial Sequence
<220>
<223> artificial
<400> 76
ggtcaggttg gtcgtcagct ggcaattatt ggtgatgata ttaaccgtcg tcgtcgtcgc 60
cgtcgtcgtg ttgttcgtcc gctgggtctg gcaggtcgtg ttgcagcaca tattaccggc 120
acccgtggtc gtagcaatac cctgagcagc ccgaatagca aaaatgaaaa agccctgggt 180
cgcaaaatta atagctggga aagcagccgt agcggtcata gctttctgag caatctgcat 240
ctgcgtaatg gtgaactggt gattcatgaa aaaggctttt attatattta tagccagacc 300
tattttcgct ttcaggaaga aattaaagaa aataccaaaa atgataaaca aatggtgcag 360
tacatttata aatataccag ctatccggat ccgattctgc tgatgaaaag cgcacgtaat 420
agctgttgga gcaaagatgc agaatatggc ctgtatagca tttatcaggg tggcattttt 480
gaactgaaag aaaatgatcg catttttgtg agcgtgacca atgaacatct gattgatatg 540
gatcatgaag ccagcttttt tggtgcattt ctggtgggc 579
<210> 77
<211> 666
<212> DNA
<213> Artificial Sequence
<220>
<223> artificial
<400> 77
gaagaacagt gggcacgtga aattggtgca cagctgcgtc gtatggcaga tgatctgaat 60
gcacagtatg aacgtcgtcg tcgtcgccgt cggcgtcgtc gtgttgttcg tccgctgggt 120
ctggcaggtc gtgttgcagc acatattacc ggcacccgtg gtcgtagcaa taccctgagc 180
agcccgaata gcaaaaatga aaaagcactg ggtcgcaaaa tcaatagctg ggaaagcagc 240
cgtagcggtc atagctttct gagcaatctg catctgcgta atggtgaact ggtgattcat 300
gaaaaaggct tttattatat ttatagccag acctattttc gctttcaaga agagattaaa 360
gaaaatacca aaaatgataa acaaatggtg cagtatattt acaaatacac cagctatccg 420
gacccgattc tgctgatgaa aagcgcacgt aatagctgtt ggagcaaaga tgcagaatat 480
ggtctgtata gcatttatca gggtggcatc tttgagctga aagaaaatga tcgcatcttt 540
gttagcgtga ccaacgaaca tctgatcgat atggatcatg aagccagctt ttttggtgca 600
tttctggtgg gtctggttcc gcgtggtagc ggtagcagcc atcatcatca tcaccatagc 660
agcggt 666
<210> 78
<211> 1116
<212> DNA
<213> Artificial Sequence
<220>
<223> artificial
<400> 78
cgtgttgcag cacatattac cggcacccgt ggtcgtagca ataccctgag cagcccgaat 60
agcaaaaatg aaaaagcact gggtcgcaaa atcaatagct gggaaagcag ccgtagcggt 120
catagctttc tgagcaatct gcatctgcgt aatggtgaac tggtgattca tgaaaaaggc 180
ttttattata tttatagcca gacctatttt cgctttcaag aagagattaa agaaaatacc 240
aaaaatgata aacaaatggt gcagtacatt tacaaatata ccagctatcc ggacccgatt 300
ctgctgatga aaagcgcacg taatagctgt tggagcaaag atgcagaata tggtctgtat 360
agcatttatc agggtggcat ctttgagctg aaagaaaatg atcgcatctt tgttagcgtg 420
accaacgaac atctgatcga tatggatcat gaagccagct tttttggtgc atttctggtt 480
ggtggtggta gcggtggtcc gctgggtctg gcaggtcgtg ttgttcgtgc ccgtgcgcgt 540
caagaaggta gcagtccgga accggttgaa ggtctggcac gtgatggtcc gcgtccgttt 600
ccgctgggtc gtctggttcc gagcgcagtt agctgtggtc tgtgtgaacc gggtctggca 660
gccgcaccgg cagcaccgac actgctgcct gcagcatatc tgtgtgcacc gaccgcaccg 720
cctgcagtta ccgcagcact gggtggtagc cgttggcctg gtggtccgcg tagtcgtccg 780
cgtggtcctc gtccggatgg tccgcagccg agcctgagcc tggcagaaca gcatctggaa 840
agtccggtgc cgagcgcacc gggtgcactg gcaggcggtc ctacacaggc agcaccgggt 900
gttcgtggtg aagaggaaca gtgggcacgt gaaattggtg cacagctgcg tcgtatggca 960
gatgatctga atgcacagta tgaacgtcgt cgtcaagaag aacagcagcg tcatcgtccg 1020
agcccgtggc gtgttctgta taatctgatt atgggtctgc tgccgctgcc tcgtggtcat 1080
cgtgcaccgg aaatggaacc gaataaagaa gatctg 1116
<210> 79
<211> 1479
<212> DNA
<213> Artificial Sequence
<220>
<223> artificial
<400> 79
cgtgttgcag cacatattac cggcacccgt ggtcgtagca ataccctgag cagcccgaat 60
agcaaaaatg aaaaagcact gggtcgcaaa attaatagct gggaaagcag ccgtagcggt 120
catagctttc tgagcaatct gcatctgcgt aatggtgaac tggtgattca tgaaaaaggc 180
ttttattata tttatagcca gacctatttt cgctttcaag aagaaattaa agaaaatacc 240
aaaaatgata agcagatggt gcagtatatc tataaatata ccagctatcc ggatccgatt 300
ctgctgatga aaagcgcacg taatagctgt tggagcaaag atgcagaata tggtctgtat 360
agcatttatc agggtggcat ttttgaactg aaagaaaatg atcgcatttt tgtgagcgtg 420
accaatgaac atctgattga tatggatcat gaagccagct tttttggtgc atttctggtt 480
ggtggtggtg gtagccgtaa aaaacgtgca agcggtggtc cggaaggtgg tagcctggca 540
gcactgaccg cacatcaggc atgtcatctg ccgctggaaa cctttacccg tcatcgtcag 600
cctcgtggtt gggaacagct ggaacagtgt ggttatccgg ttcagcgtct ggttgcactg 660
tatctggcag cacgtctgag ctggaatcag gttgatcagg ttattgcaaa tgcactggca 720
agtccgggta gcggtggtga tctgggtgaa gcaattcgtg aaagtccgga acaggcacgt 780
ctggcactga ccctggcagc agcagaaagc gaacgttttg ttcgtcaggg caccggtaat 840
gatgaagccg gtgcagcaaa tggtccggca gatggtggta gtggtggtgg tgcacgtgct 900
cgtcaagaag gtagcagtcc ggaaccggtt gaaggtctgg cacgtgacgg tccgcgtccg 960
tttccgctgg gtcgtctggt tccgagcgca gttagctgtg gtctgtgtga accgggtctg 1020
gcagccgcac cggcagcacc gacactgctg cctgcagcat atctgtgtgc accgaccgca 1080
ccgcctgcag ttaccgcagc actgggtggt agtcgttggc ctggtggtcc gcgtagtcgt 1140
ccgcgtggtc cgcgtccgga tggtccgcag ccgagtctga gcctggcaga acagcatctg 1200
gaaagtcctg tgccgagcgc accgggtgca ctggcaggcg gtccgacaca ggcagcacct 1260
ggtgttcgtg gtgaagaaga acagtgggca cgcgaaattg gtgcacagct gcgtcgtatg 1320
gcagatgatc tgaatgcaca gtatgaacgt cgtcgtcaag aagaacagca gcgtcatcgt 1380
ccgagcccgt ggcgtgttct gtataatctg attatgggtc tgctgccgct gcctcgtggt 1440
catcgtgcac cggaaatgga accgaataaa gatgaactg 1479
<210> 80
<211> 558
<212> DNA
<213> Artificial Sequence
<220>
<223> artificial
<400> 80
gcagttccga ttgcacagaa accgcgtcgt cgtcgtcgcc gtcgtcgtgt tgttcgtccg 60
ctgggtctgg caggtcgtgt tgcagcacat attaccggca cccgtggtcg tagcaatacc 120
ctgagcagcc cgaatagcaa aaatgaaaaa gccctgggtc gcaaaatcaa tagctgggaa 180
agcagccgta gcggtcatag ctttctgagc aatctgcatc tgcgtaatgg tgaactggtg 240
attcatgaaa aaggctttta ctatatctat agccagacct acttccgctt tcaggaagaa 300
attaaagaaa ataccaaaaa tgataaacaa atggtgcagt atatctataa atataccagc 360
tatccggatc cgattctgct gatgaaaagc gcacgtaata gctgttggag caaagatgca 420
gaatatggcc tgtatagcat ttatcagggt ggcatttttg aactgaaaga aaatgatcgc 480
atttttgtga gcgtgaccaa tgaacatctg attgatatgg atcatgaagc cagctttttt 540
ggtgcatttc tggtgggt 558
<210> 81
<211> 627
<212> DNA
<213> Artificial Sequence
<220>
<223> artificial
<400> 81
cgtgcaggtc tgcagtttcc ggttggacgt ctgttacgtc gcctgctgcg tcgtctgctg 60
cgcgttgttc gtccgctggg tctggcaggt cgtgttgcag cacatattac cggcacccgt 120
ggtcgtagca ataccctgag cagcccgaat agcaaaaatg aaaaagcact gggtcgcaaa 180
atcaatagct gggaaagcag ccgtagcggt catagctttc tgagcaatct gcatctgcgt 240
aatggtgaac tggtgattca tgaaaaaggc ttttattata tttatagcca gacctatttt 300
cgctttcaag aagagattaa agaaaatacc aaaaatgata aacaaatggt gcagtacatt 360
tacaaatata ccagctatcc ggacccgatt ctgctgatga aaagcgcacg taatagctgt 420
tggagcaaag atgcagaata tggtctgtat agcatttatc agggtggcat ctttgagctg 480
aaagaaaatg atcgcatctt tgttagcgtg accaacgaac atctgatcga tatggatcat 540
gaagccagct tttttggtgc atttctggtg ggtctggttc cgcgtggtag cggtagcagc 600
catcatcatc atcaccatag cagcggt 627
<210> 82
<211> 837
<212> DNA
<213> Artificial Sequence
<220>
<223> artificial
<400> 82
cgtgttgcag cacatattac cggcacccgt ggtcgtagca ataccctgag cagcccgaat 60
agcaaaaatg aaaaagcact gggtcgcaaa attaatagct gggaaagcag ccgtagcggt 120
catagctttc tgagcaatct gcatctgcgt aatggtgaac tggtgattca tgaaaaaggc 180
ttttattata tttatagcca gacctatttt cgctttcaag aagaaattaa agaaaatacc 240
aaaaatgata agcagatggt gcagtatatc tataaatata ccagctatcc ggatccgatt 300
ctgctgatga aaagcgcacg taatagctgt tggagcaaag atgcagaata tggtctgtat 360
agcatttatc agggtggcat ttttgaactg aaagaaaatg atcgcatttt tgtgagcgtg 420
accaatgaac atctgattga tatggatcat gaagccagct tttttggtgc atttctggtt 480
ggtggtggta gcggtccgct gggtctggca ggtcgtgttg ttcgtcagga ttggctgacc 540
tttcagaaaa aacatattac caatacccgt gatgtggatt gcgataatat tatgagcacc 600
aacctgtttc attgcaaaga taaaaatacc tttatttata gccgtccgga accggttaaa 660
gcaatttgta aaggtattat tgccagcaaa aatgtgctga ccacgagcga attctatctg 720
agcgattgta atgttaccag ccgtccgtgt aaatataaac tgaaaaaaag caccaataaa 780
ttttgcgtga cctgcgaaaa tcaggcaccg gttcattttg ttggtgttgg tagctgt 837
<210> 83
<211> 822
<212> DNA
<213> Artificial Sequence
<220>
<223> artificial
<400> 83
cgtgttgcag cacatattac cggcacccgt ggtcgtagca ataccctgag cagcccgaat 60
agcaaaaatg aaaaagcact gggtcgcaaa attaatagct gggaaagcag ccgtagcggt 120
catagctttc tgagcaatct gcatctgcgt aatggtgaac tggtgattca tgaaaaaggc 180
ttttattata tttatagcca gacctatttt cgctttcaag aagaaattaa agaaaatacc 240
aaaaatgata agcagatggt gcagtatatc tataaatata ccagctatcc ggatccgatt 300
ctgctgatga aaagcgcacg taatagctgt tggagcaaag atgcagaata tggtctgtat 360
agcatttatc agggtggcat ttttgaactg aaagaaaatg atcgcatttt tgtgagcgtg 420
accaatgaac atctgattga tatggatcat gaagccagct tttttggtgc atttctggtt 480
ggtggtggtg gtagcggtgg tggtggcagc caggattggc tgacctttca gaaaaaacat 540
attaccaata cccgtgatgt ggattgcgat aatattatga gcaccaacct gtttcattgc 600
aaagataaaa atacctttat ttatagccgt ccggaaccgg ttaaagcaat ttgtaaaggt 660
attattgcca gcaaaaatgt gctgaccacg agcgaattct atctgagcga ttgtaatgtt 720
accagccgtc cgtgtaaata taaactgaaa aaaagcacca ataaattttg cgtgacctgc 780
gaaaatcagg caccggttca ttttgttggt gttggtagct gt 822
<210> 84
<211> 591
<212> DNA
<213> Artificial Sequence
<220>
<223> artificial
<400> 84
gttcgtcgtt ttctggttac cctgcgtatt cgtcgtgcat gtggtcctcc gcgtgtgcgt 60
cgtcgtcgtc gccgtcgtcg tgttgttcgt cctctgggtc tggcaggtcg cgttgcagca 120
catattaccg gcacccgtgg tcgtagcaat accctgagca gcccgaatag caaaaatgaa 180
aaagccctgg gtcgcaaaat taatagctgg gaaagcagcc gtagcggtca tagctttctg 240
agcaatctgc atctgcgtaa tggtgaactg gtgattcatg aaaaaggctt ttattatatt 300
tatagccaga cctattttcg ctttcaggaa gaaattaaag aaaataccaa aaatgataaa 360
caaatggtgc agtatatcta taaatatacc agctatccgg atccgattct gctgatgaaa 420
agcgcacgta atagctgttg gagcaaagat gcagaatatg gcctgtatag catttatcag 480
ggtggcattt ttgaactgaa agaaaatgat cgcatttttg tgagcgtgac caatgaacat 540
ctgattgata tggatcatga agccagcttt tttggtgcat ttctggttgg t 591
<210> 85
<211> 567
<212> DNA
<213> Artificial Sequence
<220>
<223> artificial
<400> 85
cctcgtttta tggatacctg ggaaggtctg aatcgccgtc ggcgtcgtcg gcgtcgtgtt 60
gttcgtccgc tgggtctggc aggtcgtgtt gcagcacata ttaccggcac ccgtggtcgt 120
agcaataccc tgagcagccc gaatagcaaa aatgaaaaag cactgggtcg caaaattaat 180
agctgggaaa gcagccgtag cggtcatagc tttctgagca atctgcatct gcgtaatggt 240
gaactggtga ttcatgaaaa aggcttttat tatatttata gccagaccta ttttcgcttt 300
caggaagaaa ttaaagaaaa taccaaaaat gataaacaaa tggtgcagta catttacaaa 360
tataccagct atccggatcc gattctgctg atgaaaagcg cacgtaatag ctgttggagc 420
aaagatgcag aatatggtct gtatagcatt tatcagggtg gcatttttga actgaaagaa 480
aatgatcgca tttttgtgag cgtgaccaat gaacatctga ttgatatgga tcatgaagcc 540
agcttttttg gtgcatttct ggttggt 567
<210> 86
<211> 585
<212> DNA
<213> Artificial Sequence
<220>
<223> artificial
<400> 86
tgtgaaaaac atattatgga aaaaattcag ggtcgcggtg atgatgatga tcgccgtcgg 60
cgtcgtcggc gtcgtgttgt tcgtccgctg ggtctggcag gtcgtgttgc agcacatatt 120
accggcaccc gtggtcgtag caataccctg agcagcccga atagcaaaaa tgaaaaagca 180
ctgggtcgca aaattaatag ctgggaaagc agccgtagcg gtcatagctt tctgagcaat 240
ctgcatctgc gtaatggtga actggtgatt catgaaaaag gcttttatta tatttatagc 300
cagacctatt ttcgctttca ggaagaaatt aaagaaaata ccaaaaatga taaacaaatg 360
gtgcagtaca tttacaaata taccagctat ccggatccga ttctgctgat gaaaagcgca 420
cgtaatagct gttggagcaa agatgcagaa tatggtctgt atagcattta tcagggtggc 480
atttttgaac tgaaagaaaa tgatcgcatt tttgtgagcg tgaccaatga acatctgatt 540
gatatggatc atgaagccag cttttttggt gcatttctgg ttggt 585
<210> 87
<211> 654
<212> DNA
<213> Artificial Sequence
<220>
<223> artificial
<400> 87
gcagttccga ttgcacagaa accgcgtcgt cgtcgtcgcc gtcgtcgtgt tgttcgtcct 60
ctgggtctgg caggtcgcgt tgcagcacat attaccggca cccgtggtcg tagcaatacc 120
ctgagcagcc cgaatagcaa aaatgaaaaa gccctgggtc gcaaaattaa tagctgggaa 180
agcagccgta gcggtcatag ctttctgagc aatctgcatc tgcgtaatgg tgaactggtg 240
attcatgaaa aaggctttta ttatatttat agccagacct attttcgctt tcaggaagaa 300
attaaagaaa ataccaaaaa tgataaacaa atggtgcagt atatctataa atataccagc 360
tatccggatc cgattctgct gatgaaaagc gcacgtaata gctgttggag caaagatgca 420
gaatatggcc tgtatagcat ttatcagggt ggcatttttg aactgaaaga aaatgatcgc 480
atttttgtga gcgtgaccaa tgaacatctg attgatatgg atcatgaagc cagctttttt 540
ggtgcatttc tggttggtcc gctgggcctg gctggccgtg tggttcgccg gcgccgtcgc 600
cgtcgccgcc tggcactgcg tctggcatgt attggtgatg aaatggatgt gagc 654
<210> 88
<211> 618
<212> DNA
<213> Artificial Sequence
<220>
<223> artificial
<400> 88
cgtgttgcag cacatattac cggcacccgt ggtcgtagca ataccctgag cagcccgaat 60
agcaaaaatg aaaaagcact gggtcgcaaa attaatagct gggaaagcag ccgtagcggt 120
catagctttc tgagcaatct gcatctgcgt aatggtgaac tggtgattca tgaaaaaggc 180
ttttattata tttatagcca gacctatttt cgctttcaag aagaaattaa agaaaacacc 240
aaaaatgata aacaaatggt gcagtatatt tacaaatata ccagctatcc ggatccgatt 300
ctgctgatga aaagcgcacg taatagctgt tggagcaaag atgcagaata tggtctgtat 360
agcatttatc agggtggcat ttttgaactg aaagaaaatg atcgcatttt tgtgagcgtg 420
accaatgaac atctgattga tatggatcat gaagccagct tttttggtgc atttctggtt 480
ggtggtggtg gtagcggtgg tggtcgtgtt gttcgtccgc tgggtctggc tggtgccggt 540
gccggtggtg gtgcaggcgg tgctggtgcg ggtggcggag ccggtggtgc aggtcgtcgt 600
cgtcgccgtc gtcggcgt 618
<210> 89
<211> 867
<212> DNA
<213> Artificial Sequence
<220>
<223> artificial
<400> 89
cgtgttgcag cacatattac cggcacccgt ggtcgtagca ataccctgag cagcccgaat 60
agcaaaaatg aaaaagcact gggtcgcaaa attaatagct gggaaagcag ccgtagcggt 120
catagctttc tgagcaatct gcatctgcgt aatggtgaac tggtgattca tgaaaaaggc 180
ttttattata tttatagcca gacctatttt cgctttcaag aagaaattaa agaaaacacc 240
aaaaatgata aacaaatggt gcagtatatt tacaaatata ccagctatcc ggatccgatt 300
ctgctgatga aaagcgcacg taatagctgt tggagcaaag atgcagaata tggtctgtat 360
agcatttatc agggtggcat ttttgaactg aaagaaaatg atcgcatttt tgtgagcgtg 420
accaatgaac atctgattga tatggatcat gaagccagct tttttggtgc atttctggtt 480
ggtggtggtg gtagcggtgg tcgtaaaaaa cgtatgacca ttagccagca agaatttggt 540
cgtaccggtc tgccggatct gagcagcatg accgaagaag aacaaattgc ctacgcaatg 600
cagatgagcc tgcagggtgc agaatttggt caggcagaaa gcgcagatat tgatgcaagc 660
agcgcaatgg ataccagcga accggcaaaa gaagaagacg attacgacgt tatgcaggat 720
ccggaatttc tgcagagcgt tctggaaaat ctgccgggtg ttgatccgaa taatgaagca 780
attcgtaatg caatgggtag cctggcaagc caagcaacca aagatggcaa aaaagataaa 840
aaagaggaag acaaaaaaga agatctg 867
<210> 90
<211> 549
<212> DNA
<213> Artificial Sequence
<220>
<223> artificial
<400> 90
gttgcaaatc cgcaggcaga aggtcagctg cgcgttgttc gtccgctggg tctggcaggt 60
ccgcagcgtg ttgcagcaca tattaccggc acccgtggtc gtagcaatac cctgagcagc 120
ccgaatagca aaaatgaaaa agccctgggt cgtaaaatta atagctggga aagcagccgt 180
agcggtcata gctttctgag caatctgcat ctgcgtaatg gcgaactggt gattcatgaa 240
aaaggctttt attatattta tagccagacc tattttcgct ttcaggaaga aattaaagaa 300
aataccaaaa atgataaaca aatggtgcag tatatctata aatataccag ctatccggat 360
ccgattctgc tgatgaaaag cgcacgtaat agctgttgga gcaaagatgc cgaatatggt 420
ctgtatagca tttatcaggg tggcattttt gaactgaaag aaaatgatcg catttttgtg 480
agcgtgacca atgaacatct gattgatatg gatcatgaag ccagcttttt tggtgcattt 540
ctggttggt 549
<210> 91
<211> 537
<212> DNA
<213> Artificial Sequence
<220>
<223> artificial
<400> 91
ctggcaaatg gtgttgaacg tgttgttcgt ccgctgggtc tggcaggtcc gcagcgtgtt 60
gcagcacata ttaccggcac ccgtggtcgt agcaataccc tgagcagccc gaatagcaaa 120
aatgaaaaag ccctgggtcg taaaattaat agctgggaaa gcagccgtag cggtcatagc 180
tttctgagca atctgcatct gcgtaatggc gaactggtga ttcatgaaaa aggcttttat 240
tatatttata gccagaccta ttttcgcttt caggaagaaa ttaaagaaaa taccaaaaat 300
gataaacaaa tggtgcagta tatctataaa tataccagct atccggatcc gattctgctg 360
atgaaaagcg cacgtaatag ctgttggagc aaagatgccg aatatggtct gtatagcatt 420
tatcagggtg gcatttttga actgaaagaa aatgatcgca tttttgtgag cgtgaccaat 480
gaacatctga ttgatatgga tcatgaagcc agcttttttg gtgcatttct ggttggt 537
<210> 92
<211> 540
<212> DNA
<213> Artificial Sequence
<220>
<223> artificial
<400> 92
tgtccgagcg aaggtctgtg tcgtgttgtt cgtccgctgg gtctggcagg tccgcagcgt 60
gttgcagcac atattaccgg cacccgtggt cgtagcaata ccctgagcag cccgaatagc 120
aaaaatgaaa aagccctggg tcgtaaaatt aatagctggg aaagcagccg tagcggtcat 180
agctttctga gcaatctgca tctgcgtaat ggcgaactgg tgattcatga aaaaggcttt 240
tattatattt atagccagac ctattttcgc tttcaggaag aaattaaaga aaataccaaa 300
aatgataaac aaatggtgca gtatatctat aaatatacca gctatccgga tccgattctg 360
ctgatgaaaa gcgcacgtaa tagctgttgg agcaaagatg ccgaatatgg tctgtatagc 420
atttatcagg gtggcatttt tgaactgaaa gaaaatgatc gcatttttgt gagcgtgacc 480
aatgaacatc tgattgatat ggatcatgaa gccagctttt ttggtgcatt tctggttggt 540
<210> 93
<211> 459
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 93
Gly Cys Ala Ala Ala Cys Ala Ala Cys Thr Ser Glu Glu Thr Ile Ser
1 5 10 15
Thr Val Gln Glu Lys Gln Gln Asn Ile Ser Pro Leu Val Arg Glu Arg
20 25 30
Gly Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser
35 40 45
Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg
50 55 60
Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser
65 70 75 80
Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe
85 90 95
Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys
100 105 110
Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr
115 120 125
Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser
130 135 140
Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly
145 150 155 160
Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr
165 170 175
Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala
180 185 190
Phe Leu Val Gly Gly Gly Gly Ser Ala Ser Gly Cys Gly Pro Glu Arg
195 200 205
Lys Lys Arg Ala Ser Gly Gly Pro Glu Gly Gly Ser Leu Ala Ala Leu
210 215 220
Thr Ala His Gln Ala Cys His Leu Pro Leu Glu Thr Phe Thr Arg His
225 230 235 240
Arg Gln Pro Arg Gly Trp Glu Gln Leu Glu Gln Cys Gly Tyr Pro Val
245 250 255
Gln Arg Leu Val Ala Leu Tyr Leu Ala Ala Arg Leu Ser Trp Asn Gln
260 265 270
Val Asp Gln Val Ile Arg Asn Ala Leu Ala Ser Pro Gly Ser Gly Gly
275 280 285
Asp Leu Gly Glu Ala Ile Arg Glu Gln Pro Glu Gln Ala Arg Leu Ala
290 295 300
Leu Thr Leu Ala Ala Ala Glu Ser Glu Arg Phe Val Arg Gln Gly Thr
305 310 315 320
Gly Asn Gly Gly Gly Gly Ser Gly Gly Gly Ser Lys Glu Thr Ala Ala
325 330 335
Ala Lys Phe Glu Arg Gln His Met Asp Ser Ser Thr Ser Ala Ala Ser
340 345 350
Ser Ser Asn Tyr Cys Asn Gln Met Met Lys Ser Arg Asn Leu Thr Lys
355 360 365
Asp Arg Cys Lys Pro Val Asn Thr Phe Val His Glu Ser Leu Ala Asp
370 375 380
Val Gln Ala Val Cys Ser Gln Lys Asn Val Ala Cys Lys Asn Gly Gln
385 390 395 400
Thr Asn Cys Tyr Gln Ser Tyr Ser Thr Met Ser Ile Thr Asp Cys Arg
405 410 415
Glu Thr Gly Ser Ser Lys Tyr Pro Asn Cys Ala Tyr Lys Thr Thr Gln
420 425 430
Ala Asn Lys His Ile Ile Val Ala Cys Glu Gly Asn Pro Tyr Val Pro
435 440 445
Val His Phe Asp Ala Ser Val Lys Asp Glu Leu
450 455
<210> 94
<211> 213
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 94
Phe Ser Arg Ser Leu His Ser Leu Leu Arg Arg Arg Arg Arg Arg Arg
1 5 10 15
Arg Val Val Arg Pro Leu Gly Leu Ala Gly Thr Ser Glu Glu Thr Ile
20 25 30
Ser Thr Val Gln Glu Lys Gln Gln Asn Ile Ser Pro Leu Val Arg Glu
35 40 45
Arg Gly Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg
50 55 60
Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly
65 70 75 80
Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu
85 90 95
Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly
100 105 110
Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile
115 120 125
Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys
130 135 140
Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn
145 150 155 160
Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln
165 170 175
Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val
180 185 190
Thr Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly
195 200 205
Ala Phe Leu Val Gly
210
<210> 95
<211> 204
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 95
Leu Ser Thr Ala Ala Asp Met Gln Gly Val Val Thr Asp Gly Met Ala
1 5 10 15
Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro Asp Asp Pro Leu Gly Leu
20 25 30
Ala Gly Arg Val Val Arg Glu Arg Gly Pro Gln Arg Val Ala Ala His
35 40 45
Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser
50 55 60
Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser
65 70 75 80
Arg Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu
85 90 95
Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr
100 105 110
Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln
115 120 125
Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu
130 135 140
Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr
145 150 155 160
Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn
165 170 175
Asp Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp
180 185 190
His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly
195 200
<210> 96
<211> 205
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 96
Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr
1 5 10 15
Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile
20 25 30
Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu
35 40 45
His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr
50 55 60
Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn
65 70 75 80
Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser
85 90 95
Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp
100 105 110
Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile
115 120 125
Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu
130 135 140
His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu
145 150 155 160
Val Gly Gly Gly Gly Ser Arg Lys Lys Arg Val Lys Arg Leu Ser Thr
165 170 175
Ala Ala Asp Met Gln Gly Val Val Thr Asp Gly Met Ala Ser Gly Leu
180 185 190
Asp Lys Asp Tyr Leu Lys Pro Asp Asp Lys Asp Glu Leu
195 200 205
<210> 97
<211> 207
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 97
Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr
1 5 10 15
Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile
20 25 30
Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu
35 40 45
His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr
50 55 60
Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn
65 70 75 80
Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser
85 90 95
Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp
100 105 110
Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile
115 120 125
Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu
130 135 140
His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu
145 150 155 160
Val Gly Gly Gly Gly Ser Gly Gly Gly Pro Leu Gly Leu Ala Gly Arg
165 170 175
Val Val Arg Leu Ser Thr Ala Ala Asp Met Gln Gly Val Val Thr Asp
180 185 190
Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro Asp Asp
195 200 205
<210> 98
<211> 327
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 98
Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr
1 5 10 15
Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile
20 25 30
Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu
35 40 45
His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr
50 55 60
Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn
65 70 75 80
Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser
85 90 95
Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp
100 105 110
Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile
115 120 125
Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu
130 135 140
His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu
145 150 155 160
Val Gly Gly Gly Gly Ser Gly Gly Gly Pro Leu Gly Leu Ala Gly Arg
165 170 175
Val Val Arg Met Leu Arg Lys Leu Ala Ala Val Ser Leu Leu Ser Leu
180 185 190
Leu Ser Ala Pro Leu Leu Ala Ala Glu Cys Ser Val Asp Ile Gln Gly
195 200 205
Asn Asp Gln Met Gln Phe Asn Thr Asn Ala Ile Thr Val Asp Lys Ser
210 215 220
Cys Lys Gln Phe Thr Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys
225 230 235 240
Asn Val Met Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln
245 250 255
Gly Val Val Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu
260 265 270
Lys Pro Asp Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser
275 280 285
Gly Glu Lys Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly
290 295 300
Glu Gln Tyr Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Met
305 310 315 320
Lys Gly Thr Leu Thr Leu Lys
325
<210> 99
<211> 193
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 99
Ala Val Pro Ile Ala Gln Lys Pro Arg Arg Arg Arg Arg Arg Arg Arg
1 5 10 15
Val Val Arg Pro Leu Gly Leu Ala Gly Val Arg Glu Arg Gly Pro Gln
20 25 30
Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu
35 40 45
Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn
50 55 60
Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His
65 70 75 80
Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile
85 90 95
Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr
100 105 110
Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr
115 120 125
Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser
130 135 140
Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe
145 150 155 160
Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His
165 170 175
Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val
180 185 190
Gly
<210> 100
<211> 221
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 100
Ala Val Pro Ile Ala Gln Lys Pro Arg Arg Arg Arg Arg Arg Arg Arg
1 5 10 15
Val Val Arg Pro Leu Gly Leu Ala Gly Gly Cys Ala Ala Ala Cys Ala
20 25 30
Ala Cys Thr Ser Glu Glu Thr Ile Ser Thr Val Gln Glu Lys Gln Gln
35 40 45
Asn Ile Ser Pro Leu Val Arg Glu Arg Gly Pro Gln Arg Cys Ala Ala
50 55 60
His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn
65 70 75 80
Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser
85 90 95
Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly
100 105 110
Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr
115 120 125
Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys
130 135 140
Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile
145 150 155 160
Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu
165 170 175
Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu
180 185 190
Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met
195 200 205
Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly
210 215 220
<210> 101
<211> 212
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 101
Ala Val Pro Ile Ala Gln Lys Pro Arg Arg Arg Arg Arg Arg Arg Arg
1 5 10 15
Val Val Arg Pro Leu Gly Leu Ala Gly Thr Ser Glu Glu Thr Ile Ser
20 25 30
Thr Val Gln Glu Lys Gln Gln Asn Ile Ser Pro Leu Val Arg Glu Arg
35 40 45
Gly Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser
50 55 60
Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg
65 70 75 80
Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser
85 90 95
Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe
100 105 110
Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys
115 120 125
Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr
130 135 140
Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser
145 150 155 160
Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly
165 170 175
Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr
180 185 190
Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala
195 200 205
Phe Leu Val Gly
210
<210> 102
<211> 212
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 102
Gly Pro Ser Gln Pro Thr Tyr Pro Gly Asp Asp Ala Pro Val Glu Asp
1 5 10 15
Leu Ile Arg Phe Val Gly Arg Leu Leu Ala Tyr Phe Gly Asp Thr Ile
20 25 30
Asn Arg Arg Arg Arg Arg Arg Arg Arg Arg Val Val Arg Pro Leu Gly
35 40 45
Leu Ala Gly Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser
50 55 60
Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg
65 70 75 80
Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser
85 90 95
Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe
100 105 110
Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys
115 120 125
Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr
130 135 140
Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser
145 150 155 160
Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly
165 170 175
Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr
180 185 190
Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala
195 200 205
Phe Leu Val Gly
210
<210> 103
<211> 247
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 103
Gly Pro Ser Gln Pro Thr Tyr Pro Gly Asp Asp Ala Pro Val Glu Asp
1 5 10 15
Leu Ile Arg Phe Val Gly Arg Leu Leu Ala Tyr Phe Gly Asp Thr Ile
20 25 30
Asn Arg Arg Arg Arg Arg Arg Arg Arg Arg Val Val Arg Pro Leu Gly
35 40 45
Leu Ala Gly Gly Cys Ala Ala Ala Cys Ala Ala Cys Thr Ser Glu Glu
50 55 60
Thr Ile Ser Thr Val Gln Glu Lys Gln Gln Asn Ile Ser Pro Leu Val
65 70 75 80
Arg Glu Arg Gly Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg
85 90 95
Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala
100 105 110
Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser
115 120 125
Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu
130 135 140
Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu
145 150 155 160
Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile
165 170 175
Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala
180 185 190
Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile
195 200 205
Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val
210 215 220
Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe
225 230 235 240
Phe Gly Ala Phe Leu Val Gly
245
<210> 104
<211> 212
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 104
Val Arg Glu Arg Gly Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr
1 5 10 15
Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys
20 25 30
Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His
35 40 45
Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His
50 55 60
Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln
65 70 75 80
Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr
85 90 95
Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser
100 105 110
Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser
115 120 125
Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe
130 135 140
Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser
145 150 155 160
Phe Phe Gly Ala Phe Leu Val Gly Pro Leu Gly Leu Ala Gly Arg Val
165 170 175
Val Arg Gly Pro Arg Arg Pro Arg Arg Pro Gly Asp Asp Ala Pro Val
180 185 190
Glu Asp Leu Ile Arg Phe Val Gly Arg Leu Leu Ala Tyr Phe Gly Asp
195 200 205
Thr Ile Asn Arg
210
<210> 105
<211> 221
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 105
Arg Thr His Ile Asn Thr Val Val Ala Lys Ile Gln Ala Lys Ile Pro
1 5 10 15
Gly Ala Lys Arg His Ala Glu Glu Glu Glu Ala Ala Gly Arg Lys Arg
20 25 30
Lys Lys Arg Thr Arg Val Val Arg Pro Leu Gly Leu Ala Gly Gly Gly
35 40 45
Cys Ala Ala Ala Cys Ala Ala Cys Gly Gly Gly Gln Arg Val Ala Ala
50 55 60
His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn
65 70 75 80
Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser
85 90 95
Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly
100 105 110
Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr
115 120 125
Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys
130 135 140
Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile
145 150 155 160
Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu
165 170 175
Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu
180 185 190
Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met
195 200 205
Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly
210 215 220
<210> 106
<211> 435
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 106
Ala Glu Pro Ser Ala Ala Thr Gln Ser His Ser Ile Ser Ser Ser Ser
1 5 10 15
Phe Gly Ala Glu Pro Ser Ala Pro Gly Gly Gly Gly Ser Pro Gly Ala
20 25 30
Cys Pro Ala Leu Gly Thr Lys Ser Cys Ser Ser Ser Cys Ala Val His
35 40 45
Asp Leu Ile Phe Trp Arg Asp Val Lys Lys Thr Gly Phe Val Phe Gly
50 55 60
Thr Thr Leu Ile Met Leu Leu Ser Leu Ala Ala Phe Ser Val Ile Ser
65 70 75 80
Val Val Ser Tyr Leu Ile Leu Ala Leu Leu Ser Val Thr Ile Ser Phe
85 90 95
Arg Ile Tyr Lys Ser Val Ile Gln Ala Val Gln Lys Ser Glu Glu Gly
100 105 110
His Pro Phe Lys Ala Tyr Leu Asp Val Asp Ile Thr Leu Ser Ser Glu
115 120 125
Ala Phe His Asn Tyr Met Asn Ala Ala Met Val His Ile Asn Arg Ala
130 135 140
Leu Lys Leu Ile Ile Arg Leu Phe Leu Val Glu Asp Leu Val Asp Ser
145 150 155 160
Leu Lys Leu Ala Val Phe Met Trp Leu Met Thr Tyr Val Gly Ala Val
165 170 175
Phe Asn Gly Ile Thr Leu Leu Ile Leu Ala Glu Leu Leu Ile Phe Ser
180 185 190
Val Pro Ile Val Tyr Glu Lys Tyr Lys Thr Gln Ile Asp His Tyr Val
195 200 205
Gly Ile Ala Arg Asp Gln Thr Lys Ser Ile Val Glu Lys Ile Gln Ala
210 215 220
Lys Leu Pro Gly Ile Ala Lys Lys Lys Ala Glu Arg Arg Arg Arg Arg
225 230 235 240
Arg Arg Arg Gly Gly Ser Gly Gly Arg Val Val Arg Pro Leu Gly Leu
245 250 255
Ala Gly Gly Gly Ser Gly Gly Cys Ala Ala Glu Cys Ala Ala Ala Cys
260 265 270
Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn
275 280 285
Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys
290 295 300
Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn
305 310 315 320
Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr
325 330 335
Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu
340 345 350
Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr
355 360 365
Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys
370 375 380
Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly
385 390 395 400
Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn
405 410 415
Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe
420 425 430
Leu Val Gly
435
<210> 107
<211> 580
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 107
Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu
1 5 10 15
Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn
20 25 30
Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His
35 40 45
Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile
50 55 60
Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr
65 70 75 80
Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr
85 90 95
Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser
100 105 110
Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe
115 120 125
Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His
130 135 140
Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val
145 150 155 160
Gly Gly Gly Gly Ser Arg Lys Lys Arg Ala Ser Gly Gly Pro Glu Gly
165 170 175
Gly Ser Leu Ala Ala Leu Thr Ala His Gln Ala Cys His Leu Pro Leu
180 185 190
Glu Thr Phe Thr Arg His Arg Gln Pro Arg Gly Trp Glu Gln Leu Glu
195 200 205
Gln Cys Gly Tyr Pro Val Gln Arg Leu Val Ala Leu Tyr Leu Ala Ala
210 215 220
Arg Leu Ser Trp Asn Gln Val Asp Gln Val Ile Ala Asn Ala Leu Ala
225 230 235 240
Ser Pro Gly Ser Gly Gly Asp Leu Gly Glu Ala Ile Arg Glu Ser Pro
245 250 255
Glu Gln Ala Arg Leu Ala Leu Thr Leu Ala Ala Ala Glu Ser Glu Arg
260 265 270
Phe Val Arg Gln Gly Thr Gly Asn Asp Glu Ala Gly Ala Ala Asn Gly
275 280 285
Pro Ala Asp Gly Gly Gly Ser Gly Gly Gly Met Ile Glu Thr Asp Ser
290 295 300
Gly Val Asp Asp Asp Met Ala Cys His Lys Ile Pro Val Asp Ala Asp
305 310 315 320
Phe Leu Tyr Ala Tyr Ser Thr Ala Pro Gly Tyr Tyr Ser Trp Arg Asn
325 330 335
Ser Lys Asp Gly Ser Trp Phe Ile Gln Ser Leu Cys Ala Met Leu Lys
340 345 350
Gln Tyr Ala Asp Lys Leu Glu Phe Met His Ile Leu Thr Arg Val Asn
355 360 365
Arg Lys Val Ala Thr Glu Phe Glu Ser Phe Ser Phe Asp Ala Thr Phe
370 375 380
His Ala Lys Lys Gln Ile Pro Cys Ile Val Ser Met Leu Thr Lys Glu
385 390 395 400
Leu Tyr Phe Tyr His Asp Val Asp Gly Met Glu Asn Thr Glu Asn Ser
405 410 415
Val Asp Ser Lys Ser Ile Lys Asn Leu Glu Pro Lys Ile Ile His Gly
420 425 430
Ser Glu Ser Met Asp Ser Gly Met Ser Trp Asp Thr Gly Tyr Lys Met
435 440 445
Asp Tyr Pro Glu Met Gly Leu Cys Ile Ile Ile Asn Asn Lys Asn Phe
450 455 460
His Lys Ser Thr Gly Met Thr Ser Arg Ser Gly Thr Asp Val Asp Ala
465 470 475 480
Ala Asn Leu Arg Glu Thr Phe Arg Asn Leu Lys Tyr Glu Val Arg Asn
485 490 495
Lys Asn Asp Leu Thr Arg Glu Glu Ile Val Glu Leu Met Arg Asp Val
500 505 510
Ser Lys Glu Asp His Ser Lys Arg Ser Ser Phe Val Cys Val Leu Leu
515 520 525
Ser His Gly Glu Glu Gly Ile Ile Phe Gly Thr Asn Gly Pro Val Asp
530 535 540
Leu Lys Lys Ile Thr Asn Phe Phe Arg Gly Asp Arg Cys Arg Ser Leu
545 550 555 560
Thr Gly Lys Pro Lys Leu Phe Ile Ile Gln Ala Cys Arg Gly Thr Glu
565 570 575
Leu Asp Cys Gly
580
<210> 108
<211> 247
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 108
Ala Arg Lys Gly Lys Gly Gln Ile Glu Lys Arg Lys Leu Arg Glu Lys
1 5 10 15
Arg Arg Ser Thr Gly Val Val Asn Ile Pro Ala Ala Glu Cys Leu Asp
20 25 30
Glu Tyr Glu Asp Asp Glu Ala Gly Gln Lys Glu Arg Lys Arg Glu Asp
35 40 45
Ala Ile Thr Gln Gln Asn Thr Ile Gln Asn Glu Ala Arg Arg Arg Arg
50 55 60
Arg Arg Arg Arg Val Val Arg Pro Leu Gly Leu Ala Gly Gln Gly Gly
65 70 75 80
Ser Gly Gly Ser Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg
85 90 95
Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala
100 105 110
Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser
115 120 125
Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu
130 135 140
Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu
145 150 155 160
Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile
165 170 175
Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala
180 185 190
Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile
195 200 205
Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val
210 215 220
Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe
225 230 235 240
Phe Gly Ala Phe Leu Val Gly
245
<210> 109
<211> 260
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 109
Glu Glu Glu Ala Ala Gly Arg Lys Arg Lys Lys Arg Thr Ala Arg Lys
1 5 10 15
Gly Lys Gly Gln Ile Glu Lys Arg Lys Leu Arg Glu Lys Arg Arg Ser
20 25 30
Thr Gly Val Val Asn Ile Pro Ala Ala Glu Cys Leu Asp Glu Tyr Glu
35 40 45
Asp Asp Glu Ala Gly Gln Lys Glu Arg Lys Arg Glu Asp Ala Ile Thr
50 55 60
Gln Gln Asn Thr Ile Gln Asn Glu Ala Arg Arg Arg Arg Arg Arg Arg
65 70 75 80
Arg Val Val Arg Pro Leu Gly Leu Ala Gly Gln Gly Gly Ser Gly Gly
85 90 95
Ser Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser
100 105 110
Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg
115 120 125
Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser
130 135 140
Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe
145 150 155 160
Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys
165 170 175
Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr
180 185 190
Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser
195 200 205
Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly
210 215 220
Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr
225 230 235 240
Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala
245 250 255
Phe Leu Val Gly
260
<210> 110
<211> 270
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 110
Thr Ser Glu Glu Thr Ile Ser Thr Val Gln Glu Lys Gln Gln Asn Ile
1 5 10 15
Ser Pro Leu Val Arg Glu Arg Gly Pro Gln Arg Val Ala Ala His Ile
20 25 30
Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys
35 40 45
Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg
50 55 60
Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu
65 70 75 80
Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe
85 90 95
Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met
100 105 110
Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu
115 120 125
Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly
130 135 140
Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp
145 150 155 160
Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His
165 170 175
Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly Gly Gly Ser Gly Cys
180 185 190
Ala Ala Cys Ala Ala Ala Cys Pro Leu Gly Leu Ala Gly Arg Val Val
195 200 205
Arg Arg Arg Arg Arg Arg Arg Arg Met Pro Gly Lys Lys Ala Arg Lys
210 215 220
Asn Ala Gln Pro Ser Pro Ala Arg Ala Pro Ala Glu Leu Glu Val Glu
225 230 235 240
Cys Ala Thr Gln Leu Arg Arg Phe Gly Asp Lys Leu Asn Phe Arg Gln
245 250 255
Lys Leu Leu Asn Leu Ile Ser Lys Leu Phe Cys Ser Gly Thr
260 265 270
<210> 111
<211> 207
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 111
Val Arg Glu Arg Gly Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr
1 5 10 15
Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys
20 25 30
Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His
35 40 45
Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His
50 55 60
Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln
65 70 75 80
Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr
85 90 95
Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser
100 105 110
Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser
115 120 125
Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe
130 135 140
Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser
145 150 155 160
Phe Phe Gly Ala Phe Leu Val Gly Gly Gly Ser Gly Cys Ala Ala Cys
165 170 175
Ala Ala Ala Cys Pro Leu Gly Leu Ala Gly Arg Val Val Arg Arg Arg
180 185 190
Arg Arg Arg Arg Arg Lys Leu Leu Asn Leu Ile Ser Lys Leu Phe
195 200 205
<210> 112
<211> 311
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 112
Gln Asp Trp Leu Thr Phe Gln Lys Lys His Ile Thr Asn Thr Arg Asp
1 5 10 15
Val Asp Cys Asp Asn Ile Met Ser Thr Asn Leu Phe His Cys Lys Asp
20 25 30
Lys Asn Thr Phe Ile Tyr Ser Arg Pro Glu Pro Val Lys Ala Ile Cys
35 40 45
Lys Gly Ile Ile Ala Ser Lys Asn Val Leu Thr Thr Ser Glu Phe Tyr
50 55 60
Leu Ser Asp Cys Asn Val Thr Ser Arg Pro Cys Lys Tyr Lys Leu Lys
65 70 75 80
Lys Ser Thr Asn Lys Phe Cys Val Thr Cys Glu Asn Gln Ala Pro Val
85 90 95
His Phe Val Gly Val Gly Ser Cys Arg Val Val Arg Pro Leu Gly Leu
100 105 110
Ala Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Thr Ser Glu Glu
115 120 125
Thr Ile Ser Thr Val Gln Glu Lys Gln Gln Asn Ile Ser Pro Leu Val
130 135 140
Arg Glu Arg Gly Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg
145 150 155 160
Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala
165 170 175
Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser
180 185 190
Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu
195 200 205
Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu
210 215 220
Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile
225 230 235 240
Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala
245 250 255
Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile
260 265 270
Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val
275 280 285
Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe
290 295 300
Phe Gly Ala Phe Leu Val Gly
305 310
<210> 113
<211> 230
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 113
Glu Glu Gln Trp Ala Arg Glu Ile Gly Ala Gln Leu Arg Arg Met Ala
1 5 10 15
Asp Asp Leu Asn Ala Gln Tyr Glu Arg Arg Arg Arg Arg Arg Arg Arg
20 25 30
Arg Arg Val Val Arg Pro Leu Gly Leu Ala Gly Thr Ser Glu Glu Thr
35 40 45
Ile Ser Thr Val Gln Glu Lys Gln Gln Asn Ile Ser Pro Leu Val Arg
50 55 60
Glu Arg Gly Pro Gln Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly
65 70 75 80
Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu
85 90 95
Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe
100 105 110
Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys
115 120 125
Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu
130 135 140
Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr
145 150 155 160
Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg
165 170 175
Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr
180 185 190
Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser
195 200 205
Val Thr Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe
210 215 220
Gly Ala Phe Leu Val Gly
225 230
<210> 114
<211> 225
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 114
Thr Ser Glu Glu Thr Ile Ser Thr Val Gln Glu Lys Gln Gln Asn Ile
1 5 10 15
Ser Pro Leu Val Arg Glu Arg Gly Pro Gln Arg Val Ala Ala His Ile
20 25 30
Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys
35 40 45
Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg
50 55 60
Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu
65 70 75 80
Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe
85 90 95
Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met
100 105 110
Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu
115 120 125
Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly
130 135 140
Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp
145 150 155 160
Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His
165 170 175
Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly Cys Ala Ala Cys Ala
180 185 190
Ala Ala Cys Pro Leu Gly Leu Ala Gly Arg Val Val Arg Asn Ile Ala
195 200 205
Arg His Leu Ala Gln Val Gly Asp Ser Met Asp Lys Pro Arg Arg Pro
210 215 220
Tyr
225
<210> 115
<211> 234
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 115
Thr Ser Glu Glu Thr Ile Ser Thr Val Gln Glu Lys Gln Gln Asn Ile
1 5 10 15
Ser Pro Leu Val Arg Glu Arg Gly Pro Gln Arg Val Ala Ala His Ile
20 25 30
Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys
35 40 45
Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg
50 55 60
Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu
65 70 75 80
Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe
85 90 95
Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met
100 105 110
Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu
115 120 125
Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly
130 135 140
Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp
145 150 155 160
Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His
165 170 175
Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly Cys Ala Ala Cys Ala
180 185 190
Ala Ala Cys Gly Gly Pro Leu Gly Leu Ala Gly Arg Val Val Arg Gln
195 200 205
Ile Lys Ile Trp Phe Gln Asn Arg Arg Met Lys Trp Lys Lys Lys Ala
210 215 220
Tyr Ala Ala Ala Gly Asn Ser Tyr Phe Lys
225 230
<210> 116
<211> 216
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 116
Phe Ile Ser Lys Glu Arg Arg Glu Arg Ala Ile Leu Ser Thr Lys Pro
1 5 10 15
Pro Gly Thr Phe Leu Leu Arg Phe Ser Glu Ser Ser Lys Arg Val Val
20 25 30
Arg Pro Leu Gly Ile Ala Gly Glu Gly Gly Gly Cys Ala Ala Ala Cys
35 40 45
Ala Ala Cys Gly Ser Gly Gln Arg Val Ala Ala His Ile Thr Gly Thr
50 55 60
Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys
65 70 75 80
Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg Ser Gly His
85 90 95
Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu Val Ile His
100 105 110
Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln
115 120 125
Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met Val Gln Tyr
130 135 140
Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser
145 150 155 160
Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser
165 170 175
Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe
180 185 190
Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His Glu Ala Ser
195 200 205
Phe Phe Gly Ala Phe Leu Val Gly
210 215
<210> 117
<211> 194
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 117
Gly Gln Val Gly Arg Gln Leu Ala Ile Ile Gly Asp Asp Ile Asn Arg
1 5 10 15
Arg Arg Arg Arg Arg Arg Arg Arg Val Val Arg Pro Leu Gly Leu Ala
20 25 30
Gly Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr
35 40 45
Leu Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile
50 55 60
Asn Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu
65 70 75 80
His Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr
85 90 95
Ile Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn
100 105 110
Thr Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser
115 120 125
Tyr Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp
130 135 140
Ser Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile
145 150 155 160
Phe Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu
165 170 175
His Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu
180 185 190
Val Gly
<210> 118
<211> 243
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 118
Lys Asn Leu Trp Ala Ala Gln Arg Tyr Gly Arg Glu Leu Arg Arg Met
1 5 10 15
Ser Asp Glu Phe Glu Gly Ser Phe Lys Gly Leu Arg Arg Arg Arg Arg
20 25 30
Arg Arg Arg Arg Val Val Arg Pro Leu Gly Leu Ala Gly Arg Val Ala
35 40 45
Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro
50 55 60
Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu
65 70 75 80
Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg Asn
85 90 95
Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln
100 105 110
Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp
115 120 125
Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro
130 135 140
Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala
145 150 155 160
Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys
165 170 175
Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile Asp
180 185 190
Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly Gly Gly
195 200 205
Ser His Gly Leu Val Pro Arg Gly Ser Thr Ser Glu Glu Thr Ile Ser
210 215 220
Thr Val Gln Glu Lys Gln Gln Asn Ile Ser Pro Leu Val Arg Glu Arg
225 230 235 240
Gly Pro Gln
<210> 119
<211> 236
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 119
Thr Ser Glu Glu Thr Ile Ser Thr Val Gln Glu Lys Gln Gln Asn Ile
1 5 10 15
Ser Pro Leu Val Arg Glu Arg Gly Pro Gln Arg Val Ala Ala His Ile
20 25 30
Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn Ser Lys
35 40 45
Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser Ser Arg
50 55 60
Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly Glu Leu
65 70 75 80
Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr Tyr Phe
85 90 95
Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys Gln Met
100 105 110
Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile Leu Leu
115 120 125
Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu Tyr Gly
130 135 140
Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu Asn Asp
145 150 155 160
Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met Asp His
165 170 175
Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly Gly Gly Ser Pro Leu
180 185 190
Gly Leu Ala Gly Cys Arg Val Val Arg Arg Arg Arg Arg Arg Arg Arg
195 200 205
Arg Lys Asn Leu Trp Ala Ala Gln Arg Tyr Gly Arg Glu Leu Arg Arg
210 215 220
Met Ser Asp Glu Phe Glu Gly Ser Phe Lys Gly Leu
225 230 235
<210> 120
<211> 216
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 120
Arg Val Ala Ala His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu
1 5 10 15
Ser Ser Pro Asn Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn
20 25 30
Ser Trp Glu Ser Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His
35 40 45
Leu Arg Asn Gly Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile
50 55 60
Tyr Ser Gln Thr Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr
65 70 75 80
Lys Asn Asp Lys Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr
85 90 95
Pro Asp Pro Ile Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser
100 105 110
Lys Asp Ala Glu Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe
115 120 125
Glu Leu Lys Glu Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His
130 135 140
Leu Ile Asp Met Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val
145 150 155 160
Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Pro Leu Gly Leu Ala Gly
165 170 175
Arg Val Val Arg Lys Phe Glu Pro Lys Ser Gly Trp Met Thr Phe Leu
180 185 190
Glu Val Thr Gly Lys Ile Cys Glu Met Leu Ser Leu Leu Lys Gln Tyr
195 200 205
Cys Lys Pro Arg Arg Pro Tyr Arg
210 215
<210> 121
<211> 237
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 121
Arg Val Ser Phe Cys Arg Pro Gly Trp Ser Ala Met Ala Arg Ser Arg
1 5 10 15
Leu Thr Ala Thr Ser Val Ser Gln Val Gln Glu Asn Gly Phe Val Lys
20 25 30
Lys Phe Glu Pro Lys Ser Gly Trp Met Thr Phe Leu Glu Val Thr Gly
35 40 45
Lys Ile Cys Glu Met Leu Ser Leu Leu Lys Gln Tyr Cys Arg Val Val
50 55 60
Arg Pro Leu Gly Leu Ala Gly Gly Gly Ser Gly Gly Arg Val Ala Ala
65 70 75 80
His Ile Thr Gly Thr Arg Gly Arg Ser Asn Thr Leu Ser Ser Pro Asn
85 90 95
Ser Lys Asn Glu Lys Ala Leu Gly Arg Lys Ile Asn Ser Trp Glu Ser
100 105 110
Ser Arg Ser Gly His Ser Phe Leu Ser Asn Leu His Leu Arg Asn Gly
115 120 125
Glu Leu Val Ile His Glu Lys Gly Phe Tyr Tyr Ile Tyr Ser Gln Thr
130 135 140
Tyr Phe Arg Phe Gln Glu Glu Ile Lys Glu Asn Thr Lys Asn Asp Lys
145 150 155 160
Gln Met Val Gln Tyr Ile Tyr Lys Tyr Thr Ser Tyr Pro Asp Pro Ile
165 170 175
Leu Leu Met Lys Ser Ala Arg Asn Ser Cys Trp Ser Lys Asp Ala Glu
180 185 190
Tyr Gly Leu Tyr Ser Ile Tyr Gln Gly Gly Ile Phe Glu Leu Lys Glu
195 200 205
Asn Asp Arg Ile Phe Val Ser Val Thr Asn Glu His Leu Ile Asp Met
210 215 220
Asp His Glu Ala Ser Phe Phe Gly Ala Phe Leu Val Gly
225 230 235
<210> 122
<211> 1377
<212> DNA
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 122
ggttgtgcag cagcatgtgc agcctgtacc agcgaagaaa ccattagcac cgttcaagaa 60
aaacagcaga atattagtcc gctggttcgt gaacgtggtc cgcagcgtgt tgcagcacat 120
attaccggca cccgtggtcg tagcaatacc ctgagcagcc cgaatagcaa aaatgaaaaa 180
gccctgggtc gcaaaattaa cagctgggaa agcagccgta gcggtcatag ctttctgagc 240
aatctgcatc tgcgtaatgg tgaactggtg attcacgaga aaggcttcta ttatatctat 300
agccagacct atttccgctt ccaagaagag atcaaagaga acaccaaaaa cgacaaacaa 360
atggtgcagt acatctataa atacaccagc tatccggatc cgattctgct gatgaaaagc 420
gcacgtaata gctgttggag caaagatgca gaatatggcc tgtatagcat ctatcagggt 480
ggcatttttg aactgaaaga aaacgatcgc atctttgtga gcgtgaccaa tgaacatctg 540
attgatatgg atcacgaagc cagctttttt ggtgcatttc tggttggtgg tggtggtagc 600
gcaagcggtt gtggtccgga acgtaaaaaa cgtgcaagcg gtggtccgga aggtggtagt 660
ctggcagcac tgaccgcaca tcaggcatgt catctgccgc tggaaacctt tacccgtcat 720
cgtcagcctc gtggttggga acagctggaa cagtgtggtt atccggttca gcgtctggtt 780
gcactgtatc tggcagctcg tctgagctgg aatcaggttg atcaggttat tcgtaatgca 840
ctggcaagtc cgggtagcgg tggcgatctg ggtgaagcaa ttcgtgaaca gccggaacag 900
gcacgtctgg cactgaccct ggcagcagca gaaagcgaac gttttgttcg tcaaggcacc 960
ggtaatggtg gtggcggtag tggtggtggt tcaaaagaaa ccgcagcagc caaatttgaa 1020
cgtcagcaca tggatagcag caccagcgca gcaagcagca gcaattattg caatcagatg 1080
atgaaaagcc gcaatctgac caaagatcgt tgtaaaccgg tgaatacctt tgttcatgaa 1140
agcctggcag atgttcaggc agtttgcagc cagaaaaatg tggcctgtaa aaatggtcag 1200
accaattgct atcagagcta tagcaccatg agcattaccg attgtcgtga aaccggtagc 1260
agcaaatatc cgaattgcgc ctataaaacc acccaggcca ataaacatat tattgtggcc 1320
tgtgaaggca atccgtatgt tccggttcat tttgatgcca gcgtgaaaga tgaactg 1377
<210> 123
<211> 639
<212> DNA
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 123
tttagccgta gcctgcatag cctgctgcgt cgtcgtcgcc gtcgtcggcg tgttgttcgt 60
ccgctgggtc tggcaggcac cagcgaagaa accattagca ccgttcaaga aaaacagcag 120
aatattagtc cgctggttcg tgaacgtggt ccgcagcgtg ttgcagcaca tattaccggc 180
acccgtggtc gtagcaatac cctgagcagc ccgaatagca aaaatgaaaa agccctgggt 240
cgcaaaatta acagctggga aagcagccgt agcggtcata gctttctgag caatctgcat 300
ctgcgtaatg gtgaactggt gattcacgag aaaggcttct attatatcta tagccagacc 360
tatttccgct tccaagaaga gatcaaagag aacaccaaaa acgacaaaca aatggtgcag 420
tacatctata aatacaccag ctatccggat ccgattctgc tgatgaaaag cgcacgtaat 480
agctgttgga gcaaagatgc agaatatggc ctgtatagca tctatcaggg tggcattttt 540
gaactgaaag aaaacgatcg catctttgtg agcgtgacca atgaacatct gattgatatg 600
gatcacgaag ccagcttttt tggtgccttt ctggttggt 639
<210> 124
<211> 612
<212> DNA
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 124
ctgtctaccg cagcagatat gcagggtgtt gttaccgatg gtatggcaag cggtctggat 60
aaagattatc tgaaaccgga tgatccgctg ggtctggcag gtcgtgttgt tcgtgaacgt 120
ggtccgcagc gtgttgcagc acatattacc ggcacccgtg gtcgtagcaa taccctgagc 180
agcccgaata gcaaaaatga aaaagccctg ggtcgcaaaa ttaatagctg ggaaagcagc 240
cgtagcggtc atagctttct gagcaatctg catctgcgta atggtgaact ggtgattcat 300
gaaaaaggct tttattatat ttatagccag acctattttc gctttcagga agaaattaaa 360
gaaaacacca aaaatgataa acaaatggtg cagtatatct ataaatatac cagctatccg 420
gatccgattc tgctgatgaa aagcgcacgt aatagctgtt ggagcaaaga tgcagaatat 480
ggcctgtata gcatttatca gggtggcatt tttgaactga aagaaaatga tcgcattttt 540
gtgagcgtga ccaatgaaca tctgattgat atggatcatg aagccagctt ttttggtgca 600
tttctggttg gt 612
<210> 125
<211> 615
<212> DNA
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 125
cagcgtgttg cagcacatat taccggcacc cgtggtcgta gcaataccct gagcagcccg 60
aatagcaaaa atgaaaaagc actgggtcgc aaaattaaca gctgggaaag cagccgtagc 120
ggtcatagct ttctgagcaa tctgcatctg cgtaatggtg aactggtgat tcatgaaaaa 180
ggcttctact atatctacag ccagacctat tttcgcttcc aagaagagat taaagaaaac 240
accaaaaacg ataaacaaat ggtgcagtac atctataaat acaccagcta tccggatccg 300
attctgctga tgaaaagcgc acgtaatagc tgttggagca aagatgcaga atatggcctg 360
tatagcattt atcagggtgg catctttgaa ctgaaagaaa acgatcgtat tttcgtgagc 420
gtgaccaatg aacatctgat cgatatggat catgaagcca gcttttttgg tgcatttctg 480
gtgggtggtg gtggtagccg taaaaaacgt gttaaacgtc tgagcaccgc agcagatatg 540
cagggtgttg ttaccgatgg tatggcaagc ggtctggata aagattatct gaaaccggat 600
gataaagatg aactg 615
<210> 126
<211> 621
<212> DNA
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 126
cagcgtgttg cagcacatat taccggcacc cgtggtcgta gcaataccct gagcagcccg 60
aatagcaaaa atgaaaaagc actgggtcgc aaaatcaata gctgggaaag cagccgtagc 120
ggtcatagct ttctgagcaa tctgcatctg cgtaatggtg aactggtgat tcatgaaaaa 180
ggcttttatt atatttatag ccagacctat tttcgctttc aagaagagat taaagaaaat 240
accaaaaatg ataaacaaat ggtgcagtac atttataaat ataccagcta tccggacccg 300
attctgctga tgaaaagcgc acgtaatagc tgttggagca aagatgcaga atatggtctg 360
tatagcattt atcagggtgg catctttgag ctgaaagaaa atgatcgcat ctttgttagc 420
gtgaccaacg aacatctgat cgatatggat catgaagcca gcttttttgg tgcatttctg 480
gttggtggtg gtggtagcgg tggtggtccg ctgggtctgg caggtcgtgt tgttcgtctg 540
agcaccgcag cagatatgca gggtgttgtt accgatggta tggcaagcgg tctggataaa 600
gattatctga aaccggatga t 621
<210> 127
<211> 981
<212> DNA
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 127
cagcgtgttg cagcacatat taccggcacc cgtggtcgta gcaataccct gagcagcccg 60
aatagcaaaa atgaaaaagc actgggtcgc aaaatcaata gctgggaaag cagccgtagc 120
ggtcatagct ttctgagcaa tctgcatctg cgtaatggtg aactggtgat tcatgaaaaa 180
ggcttttatt atatttatag ccagacctat tttcgctttc aagaagagat taaagaaaat 240
accaaaaatg ataaacaaat ggtgcagtac atttataaat ataccagcta tccggacccg 300
attctgctga tgaaaagcgc acgtaatagc tgttggagca aagatgcaga atatggtctg 360
tatagcattt atcagggtgg catctttgag ctgaaagaaa atgatcgcat ctttgttagc 420
gtgaccaacg aacatctgat cgatatggat catgaagcca gcttttttgg tgcatttctg 480
gttggtggtg gtggtagcgg tggtggtccg ctgggtctgg caggtcgtgt tgttcgtatg 540
ctgcgtaaac tggcagcagt tagcctgctg agtctgctga gcgcaccgct gctggcagca 600
gaatgtagcg ttgatattca gggtaatgat cagatgcagt ttaacaccaa tgccattacc 660
gttgacaaaa gctgtaaaca gtttaccgtg aatctgagcc atccgggtaa tctgccgaaa 720
aatgttatgg gtcataattg ggttctgagc accgcagcag atatgcaggg tgttgttacc 780
gatggtatgg caagcggtct ggataaagat tatctgaaac cggatgatag ccgtgttatt 840
gcacatacca aactgattgg tagcggtgaa aaagatagcg ttacctttga tgtgagcaaa 900
ctgaaagaag gcgagcagta tatgttcttt tgtacctttc cgggtcatag cgcactgatg 960
aaaggcaccc tgaccctgaa a 981
<210> 128
<211> 579
<212> DNA
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 128
gcagttccga ttgcacagaa accgcgtcgt cgtcgtcgcc gtcggcgtgt tgttcgtccg 60
ctgggtctgg caggcgttcg tgaacgtggt ccgcagcgtg ttgcagcaca tattaccggc 120
acccgtggtc gtagcaatac cctgagcagc ccgaatagca aaaatgaaaa agcactgggt 180
cgcaaaatca atagctggga aagcagccgt agcggtcata gctttctgag caatctgcat 240
ctgcgtaatg gtgaactggt gattcatgaa aaaggctttt attatattta tagccagacc 300
tattttcgct ttcaagaaga gattaaagaa aataccaaaa atgataaaca aatggtgcag 360
tatatctata aatataccag ctatccggac ccgattctgc tgatgaaaag cgcacgtaat 420
agctgttgga gcaaagatgc agaatatggt ctgtatagca tttatcaggg tggcatcttt 480
gagctgaaag aaaatgatcg catctttgtt agcgtgacca acgaacatct gatcgatatg 540
gatcatgaag ccagcttttt tggtgcattt ctggttggt 579
<210> 129
<211> 663
<212> DNA
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 129
gcagttccga ttgcacagaa accgcgtcgt cgtcgtcgcc gtcggcgtgt tgttcgtccg 60
ctgggtctgg caggcggttg tgcagcagca tgtgcagcct gtaccagcga agaaaccatt 120
agcaccgttc aagaaaaaca gcagaatatt agtccgctgg ttcgtgaacg tggtccgcag 180
cgttgtgcag cacatattac cggcacccgt ggtcgtagca ataccctgag cagcccgaat 240
agcaaaaatg aaaaagcact gggtcgcaaa atcaatagct gggaaagcag ccgtagcggt 300
catagctttc tgagcaatct gcatctgcgt aatggtgaac tggtgattca tgaaaaaggc 360
ttctactata tctatagcca gacctatttc cgcttccaag aagaaatcaa agaaaatacc 420
aaaaatgata aacaaatggt gcagtatatt tacaaatata ccagctatcc ggatccgatt 480
ctgctgatga aaagcgcacg taatagctgt tggagcaaag atgcagaata tggtctgtat 540
agcatttatc agggtggcat ctttgagctg aaagaaaatg atcgcatctt tgttagcgtg 600
accaacgaac atctgatcga tatggatcat gaagccagct tttttggtgc atttctggtg 660
ggt 663
<210> 130
<211> 636
<212> DNA
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 130
gcagttccga ttgcacagaa accgcgtcgt cgtcgtcgcc gtcggcgtgt tgttcgtccg 60
ctgggtctgg caggcaccag tgaagaaacc attagcaccg ttcaagaaaa acagcagaat 120
attagtccgc tggttcgtga acgtggtccg cagcgtgttg cagcacatat taccggcacc 180
cgtggtcgta gcaataccct gagcagcccg aatagcaaaa atgaaaaagc actgggtcgc 240
aaaatcaata gctgggaaag cagccgtagc ggtcatagct ttctgagcaa tctgcatctg 300
cgtaatggtg aactggtgat tcatgaaaaa ggcttctact atatctacag ccagacctat 360
tttcgcttcc aagaagaaat caaagagaac accaaaaacg acaaacaaat ggtgcagtac 420
atctacaaat ataccagcta tccggatccg attctgctga tgaaaagcgc acgtaatagc 480
tgttggagca aagatgcaga atatggtctg tatagcattt atcagggtgg catctttgag 540
ctgaaagaaa atgatcgcat ctttgttagc gtgaccaacg aacatctgat cgatatggat 600
catgaagcca gcttttttgg tgcatttctg gtgggt 636
<210> 131
<211> 636
<212> DNA
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 131
ggtccgagcc agccgaccta tccgggtgat gatgcaccgg ttgaagatct gattcgtttt 60
gttggtcgtc tgctggcata ttttggcgat accattaatc gtcgtcgtag acgtcgtcgg 120
cgtcgtgttg ttcgtccgct gggtctggca ggtcgtgttg cagcacatat taccggcacc 180
cgtggtcgta gcaataccct gagcagcccg aatagcaaaa atgaaaaagc actgggtcgc 240
aaaatcaata gctgggaaag cagccgtagc ggtcatagct ttctgagcaa tctgcatctg 300
cgtaatggtg aactggtgat tcatgaaaaa ggcttttatt atatttatag ccagacctat 360
tttcgctttc aagaagagat taaagaaaat accaaaaatg ataaacaaat ggtgcagtat 420
atctataaat ataccagcta tccggacccg attctgctga tgaaaagcgc acgtaatagc 480
tgttggagca aagatgcaga atatggtctg tatagcattt atcagggtgg catctttgag 540
ctgaaagaaa atgatcgcat ctttgttagc gtgaccaacg aacatctgat cgatatggat 600
catgaagcca gcttttttgg tgcatttctg gtgggt 636
<210> 132
<211> 741
<212> DNA
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 132
ggtccgagcc agccgaccta tccgggtgat gatgcaccgg ttgaagatct gattcgtttt 60
gttggtcgtc tgctggcata ttttggcgat accattaatc gtcgtcgtcg ccgtcgtaga 120
cgtcgtgttg ttcgtccgct gggtctggca ggcggttgtg cagcagcatg tgcagcctgt 180
accagcgaag aaaccattag caccgttcaa gaaaaacagc agaatattag tccgctggtt 240
cgtgaacgtg gtccgcagcg ttgtgcagca catattaccg gcacccgtgg tcgtagcaat 300
accctgagca gcccgaatag caaaaatgaa aaagcactgg gtcgcaaaat caatagctgg 360
gaaagcagcc gtagcggtca tagctttctg agcaatctgc atctgcgtaa tggtgaactg 420
gtgattcatg aaaaaggctt ctactatatc tatagccaga cctatttccg cttccaagaa 480
gaaatcaaag aaaataccaa aaatgataaa caaatggtgc agtatattta caaatatacc 540
agctatccgg atccgattct gctgatgaaa agcgcacgta atagctgttg gagcaaagat 600
gcagaatatg gtctgtatag catttatcag ggtggcatct ttgagctgaa agaaaatgat 660
cgcatctttg ttagcgtgac caacgaacat ctgatcgata tggatcatga agccagcttt 720
tttggtgcat ttctggtggg t 741
<210> 133
<211> 686
<212> DNA
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 133
ggtccgagcc agccgaccta tccgggtgat gatgcaccgg ttgaagatct gttcgtgaac 60
gtggtccgca gcgtgttgca gcacatatta ccggcacccg tggtcgtagc aataccctga 120
gcagcccgaa tagcaaaaat gaaaaagcac tgggtcgcaa aatcaatagc tgggaaagca 180
gccgtagcgg tcatagcttt ctgagcaatc tgcatctgcg taatggtgaa ctggtgattc 240
atgaaaaagg cttttattat atttatagcc agacctattt tcgctttcaa gaagagatta 300
aagaaaatac caaaaatgat aaacaaatgg tgcagtatat ctataaatat accagctatc 360
cggacccgat tctgctgatg aaaagcgcac gtaatagctg ttggagcaaa gatgcagaat 420
atggtctgta tagcatttat cagggtggca tctttgagct gaaagaaaat gatcgcatct 480
ttgttagcgt gaccaacgaa catctgatcg atatggatca tgaagccagc ttttttggtg 540
catttctggt tggtccgctg ggtctggcag gtcgtgttgt tcgtggtccg cgtcgtcctc 600
gtcgtccggg tgatgatgca ccggttgaag atctgattcg ttttgttggt cgtctgctgg 660
catattttgg cgataccatt aaccgc 686
<210> 134
<211> 663
<212> DNA
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 134
cgcacccata ttaacaccgt tgttgcaaaa attcaggcca aaattccggg tgcaaaacgt 60
catgccgaag aagaagaggc agcaggtcgt aaacgtaaaa aacgtacccg tgttgttcgt 120
ccgctgggtc tggcaggcgg tggttgtgca gcagcatgtg cagcctgtgg tggtggtcag 180
cgtgttgcag cacatattac cggcacccgt ggtcgtagca ataccctgag cagcccgaat 240
agcaaaaatg aaaaagcact gggtcgcaaa attaacagct gggaaagcag ccgtagcggt 300
catagctttc tgagcaatct gcatctgcgt aatggtgaac tggtgattca tgaaaaaggc 360
ttctactata tctacagcca gacctatttt cgcttccaag aagagattaa agaaaacacc 420
aaaaacgata aacaaatggt gcagtacatc tataaataca ccagctatcc ggatccgatt 480
ctgctgatga aaagcgcacg taatagctgt tggagcaaag atgcagaata tggcctgtat 540
agcatttatc agggtggcat ctttgaactg aaagaaaacg atcgtatttt cgtgagcgtg 600
accaatgaac atctgatcga tatggatcat gaagccagct tttttggtgc atttctggtg 660
ggt 663
<210> 135
<211> 1305
<212> DNA
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 135
gcagaaccga gcgcagcaac ccagagccat agcattagca gcagcagctt tggtgcagaa 60
ccgtcagcac cgggtggtgg tggtagtccg ggtgcatgtc cggcactggg caccaaaagc 120
tgtagcagca gttgtgcagt tcatgatctg attttttggc gtgacgtgaa aaaaaccggc 180
tttgtttttg gcaccaccct gattatgctg ctgagcctgg cagcatttag cgttattagc 240
gttgtgagct atctgattct ggcactgctg agcgttacca ttagctttcg tatctataaa 300
agcgttattc aggccgtgca gaaaagcgaa gaaggtcatc cgtttaaagc atatctggat 360
gttgatatta ccctgagcag cgaagcattt cacaattata tgaatgcagc catggtgcac 420
attaatcgtg ccctgaaact gattattcgt ctgtttctgg ttgaagatct ggtggatagt 480
ctgaaactgg cagtttttat gtggctgatg acctatgttg gtgccgtgtt taatggcatt 540
accctgctga tcctggccga actgctgatt tttagcgttc cgattgtgta tgaaaaatac 600
aaaacccaga tcgatcacta tgtgggtatt gcacgtgatc agaccaaaag cattgtggaa 660
aaaattcagg caaaactgcc tgggatcgca aaaaaaaaag cagaacgtcg tcgtcgccgt 720
cgtcggcgtg gtggttcagg tggtcgtgtt gttcgtccgc tgggtctggc aggcggtggt 780
agcggtggtt gtgcagcaga atgtgcagcc gcatgtccgc agcgtgttgc agcacatatt 840
accggcaccc gtggtcgtag caataccctg agtagcccga atagcaaaaa tgaaaaagca 900
ctgggtcgta aaatcaacag ctgggaaagc agccgtagcg gtcatagctt tctgagcaat 960
ctgcatctgc gtaatggtga actggtgatt catgaaaaag gcttctacta tatctacagc 1020
cagacctatt ttcgcttcca agaagagatt aaagaaaaca ccaaaaacga taaacaaatg 1080
gtgcagtaca tctataaata caccagctat ccggatccga ttctgctgat gaaaagcgca 1140
cgtaatagct gttggagcaa agatgcagaa tatggcctgt atagcattta ccagggtggt 1200
atctttgaac tgaaagaaaa cgatcgcatt tttgtgagcg tgaccaatga acatctgatc 1260
gatatggatc atgaagccag cttttttggt gcatttctgg tgggt 1305
<210> 136
<211> 1740
<212> DNA
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 136
cgtgtggcag cacatattac cggcacccgt ggtcgtagca ataccctgag cagcccgaat 60
agcaaaaatg aaaaagcact gggtcgcaaa atcaatagct gggaaagcag ccgtagcggt 120
catagctttc tgagcaatct gcatctgcgt aatggtgaac tggtgattca tgaaaaaggc 180
ttttattata tttatagcca gacctatttt cgctttcaag aagagattaa agaaaatacc 240
aaaaatgata aacaaatggt gcagtacatc tataaatata ccagctatcc ggacccgatt 300
ctgctgatga aaagcgcacg taatagctgt tggagcaaag atgcagaata tggtctgtat 360
agcatttatc agggtggcat ctttgagctg aaagaaaatg atcgcatctt tgttagcgtg 420
accaacgaac atctgatcga tatggatcat gaagccagct tttttggtgc atttctggtt 480
ggtggtggtg gtagccgtaa aaaacgtgca agcggtggtc cggaaggtgg tagcctggca 540
gcactgaccg cacatcaggc atgtcatctg ccgctggaaa cctttacccg tcatcgtcag 600
cctcgtggtt gggaacagct ggaacagtgt ggttatccgg ttcagcgtct ggttgcactg 660
tatctggcag cacgtctgag ctggaatcag gttgatcagg ttattgcaaa tgcactggca 720
agtccgggta gcggtggtga tctgggtgaa gcaattcgtg aaagtccgga acaggcacgt 780
ctggcactga ccctggcagc agcagaaagc gaacgttttg ttcgtcaggg caccggtaat 840
gatgaagccg gtgcagcaaa tggtccggca gatggtggtg gttcaggtgg tggtatgatt 900
gaaaccgata gcggtgttga tgatgatatg gcctgtcata aaattccggt tgatgccgat 960
ttcctgtatg catatagcac cgcaccgggt tattatagct ggcgtaatag caaagatggc 1020
agctggttta ttcagagcct gtgtgcaatg ctgaaacagt atgcagataa actggaattc 1080
atgcatattc tgacccgtgt taatcgtaaa gttgcaaccg aatttgagag ctttagcttt 1140
gatgcaacct tccatgccaa aaaacaaatt ccgtgcattg ttagcatgct gaccaaagaa 1200
ctgtatttct atcatgatgt ggatggcatg gaaaataccg aaaatagcgt tgatagcaaa 1260
agcattaaaa atctggaacc gaaaatcatc catggtagcg aaagcatgga tagcggtatg 1320
agctgggata ccggttataa aatggattat ccggaaatgg gcctgtgcat tatcatcaac 1380
aacaaaaact ttcataaaag caccggtatg accagccgta gtggcaccga tgttgatgca 1440
gcaaatctgc gtgaaacctt tcgcaatctg aaatatgaag tgcgcaacaa aaacgatctg 1500
acccgtgaag aaattgttga actgatgcgt gatgtgagca aagaagatca tagcaaacgt 1560
agcagctttg tttgtgttct gctgagccat ggtgaagaag gtattatttt tggcaccaat 1620
ggtccggtgg acctgaaaaa aatcaccaat ttttttcgtg gtgatcgttg tcgtagcctg 1680
accggtaaac cgaaactgtt tatcattcag gcatgtcgtg gcaccgaact ggattgtggt 1740
<210> 137
<211> 741
<212> DNA
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 137
gcacgtaaag gtaaaggcca gattgaaaaa cgtaaactgc gtgaaaaacg tcgtagcacc 60
ggtgttgtta atattccggc agcagaatgt ctggatgaat atgaagatga tgaagccggt 120
cagaaagaac gtaaacgtga agatgcaatt acccagcaga ataccattca gaatgaagca 180
cgtcgtcgtc gtcgccgtcg tcgtgttgtt cgtccgctgg gtctggcagg tcagggtggt 240
agcggtggta gtccgcagcg tgttgcagca catattaccg gcacccgtgg tcgtagcaat 300
accctgagca gcccgaatag caaaaatgaa aaagcactgg gtcgcaaaat taatagctgg 360
gaaagcagcc gtagcggtca tagctttctg agcaatctgc atctgcgtaa tggtgaactg 420
gtgattcatg aaaaaggctt ttattatatt tatagccaga cctattttcg ctttcaggaa 480
gaaattaaag aaaataccaa aaacgataaa caaatggtgc agtatatcta taaatatacc 540
agctatccgg atccgattct gctgatgaaa agcgcacgta atagctgttg gagcaaagat 600
gcagaatatg gtctgtatag catttatcag ggtggcattt ttgaactgaa agaaaatgat 660
cgcatttttg tgagcgtgac caatgaacat ctgattgata tggatcatga agccagcttt 720
tttggtgcat ttctggtggg t 741
<210> 138
<211> 780
<212> DNA
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 138
gaagaagaag cagcaggtcg taaacgtaaa aaacgtaccg cacgtaaagg taaaggccag 60
attgaaaaac gtaaactgcg tgaaaaacgc cgtagcaccg gtgttgttaa tattccggca 120
gcagaatgtc tggatgaata tgaagatgat gaagccggtc agaaagaacg caaacgtgaa 180
gatgcaatta cccagcagaa taccattcag aatgaagcac gtcgtcgtcg ccgtcgtcgg 240
cgtgttgttc gtccgctggg tctggcaggt cagggtggta gcggtggtag tccgcagcgt 300
gttgcagcac atattaccgg cacccgtggt cgtagcaata ccctgagcag cccgaatagc 360
aaaaatgaaa aagcactggg tcgcaaaatt aacagctggg aaagcagccg tagcggtcat 420
agctttctga gcaatctgca tctgcgtaat ggtgaactgg tgattcatga aaaaggcttc 480
tactatatct acagccagac ctattttcgc ttccaagaag agattaaaga aaacaccaaa 540
aacgataaac aaatggtgca gtacatctat aaatacacca gctatccgga tccgattctg 600
ctgatgaaaa gcgcacgtaa tagctgttgg agcaaagatg cagaatatgg cctgtatagc 660
atttatcagg gtggcatctt tgaactgaaa gaaaacgatc gtattttcgt gagcgtgacc 720
aatgaacatc tgatcgatat ggatcatgaa gccagctttt ttggtgcatt tctggtgggt 780
<210> 139
<211> 810
<212> DNA
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 139
accagcgaag aaaccattag caccgttcaa gaaaaacagc agaatattag tccgctggtt 60
cgtgaacgtg gtccgcagcg tgttgcagca catattaccg gcacccgtgg tcgtagcaat 120
accctgagca gcccgaatag caaaaatgaa aaagcactgg gtcgcaaaat caatagctgg 180
gaaagcagcc gtagcggtca tagctttctg agcaatctgc atctgcgtaa tggtgaactg 240
gtgattcatg aaaaaggctt ctactatatc tatagccaga cctatttccg cttccaagaa 300
gaaatcaaag aaaataccaa aaatgataaa caaatggtgc agtatattta caaatatacc 360
agctatccgg atccgattct gctgatgaaa agcgcacgta atagctgttg gagcaaagat 420
gcagaatatg gtctgtatag catttatcag ggtggcatct ttgagctgaa agaaaatgat 480
cgcatctttg ttagcgtgac caacgaacat ctgatcgata tggatcatga agccagcttt 540
tttggtgcat ttctggttgg tggtggtagc ggttgtgcag catgtgcagc cgcatgtccg 600
ctgggtctgg caggtcgtgt tgttcgtcgg cgtcgtcgcc gtcgtcgtat gcctggtaaa 660
aaagcacgta aaaatgcaca gccgagtccg gcacgtgcac cggcagaact ggaagttgaa 720
tgtgcaaccc agctgcgtcg ttttggtgat aaactgaatt ttcgtcagaa actgctgaat 780
ctgattagca aactgttttg tagcggcacc 810
<210> 140
<211> 621
<212> DNA
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 140
gttcgtgaac gtggtccgca gcgtgttgca gcacatatta ccggcacccg tggtcgtagc 60
aataccctga gcagcccgaa tagcaaaaat gaaaaagcac tgggtcgcaa aattaacagc 120
tgggaaagca gccgtagcgg tcatagcttt ctgagcaatc tgcatctgcg taatggtgaa 180
ctggtgattc atgaaaaagg cttctactat atctacagcc agacctattt tcgcttccaa 240
gaagagatta aagaaaacac caaaaacgat aaacaaatgg tgcagtacat ctataaatac 300
accagctatc cggatccgat tctgctgatg aaaagcgcac gtaatagctg ttggagcaaa 360
gatgcagaat atggcctgta tagcatttat cagggtggca tctttgaact gaaagaaaac 420
gatcgtattt tcgtgagcgt gaccaatgaa catctgatcg atatggatca tgaagccagc 480
ttttttggtg catttctggt tggtggtggt agcggttgtg cagcatgtgc agccgcatgt 540
ccgctgggtc tggcaggtcg tgttgttcgt cgtcgtcgcc gtcgtcggcg taaactgctg 600
aatctgatta gcaaactgtt t 621
<210> 141
<211> 933
<212> DNA
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 141
caggattggc tgacctttca gaaaaaacat attaccaaca cccgtgatgt ggattgcgat 60
aacattatga gcaccaacct gtttcactgc aaagataaaa acaccttcat ctatagccgt 120
ccggaaccgg ttaaagcaat ttgtaaaggt attatcgcca gcaaaaatgt tctgaccacg 180
agcgagtttt atctgagcga ttgtaatgtt accagccgtc cgtgtaaata caaactgaaa 240
aaaagcacca acaaattctg cgtgacctgt gaaaatcagg caccggttca ttttgttggt 300
gttggtagct gtcgtgttgt tcgtccgctg ggtctggcag gcggtggtgg tggtagtggt 360
ggcggtggta gcaccagcga agaaaccatt agcaccgttc aagaaaaaca gcagaatatt 420
agtccgctgg ttcgtgaacg tggtccgcag cgtgttgcag cacatattac cggtacacgt 480
ggtcgtagca ataccctgag cagcccgaat agcaaaaatg aaaaagcact gggtcgcaaa 540
atcaatagct gggaaagcag ccgtagcggt catagctttc tgagcaatct gcatctgcgt 600
aatggtgaac tggtgattca tgaaaaaggc ttctactata tctatagcca gacctatttc 660
cgcttccaag aagaaatcaa agagaacacc aaaaacgata aacaaatggt gcagtacatc 720
tataaataca ccagctatcc ggatccgatt ctgctgatga aaagcgcacg taatagctgt 780
tggagcaaag atgcagaata tggtctgtat agcatttatc agggtggcat ctttgagctg 840
aaagaaaatg atcgcatctt tgttagcgtg accaacgaac atctgatcga tatggatcat 900
gaagccagct tttttggtgc atttctggtg ggt 933
<210> 142
<211> 690
<212> DNA
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 142
gaagaacagt gggcacgtga aattggtgca cagctgcgtc gtatggcaga tgatctgaat 60
gcacagtatg aacgccgtcg tcgtcgccgt agacgtcgtc gtgttgttcg tccgctgggt 120
ctggcaggca ccagtgaaga aaccattagc accgttcaag aaaaacagca gaatattagt 180
ccgctggttc gtgaacgtgg tccgcagcgt gttgcagcac atattaccgg cacccgtggt 240
cgtagcaata ccctgagcag cccgaatagc aaaaatgaaa aagccctggg tcgcaaaatt 300
aacagctggg aaagcagccg tagcggtcat agctttctga gcaatctgca tctgcgtaat 360
ggtgaactgg tgattcacga gaaaggcttc tattatatct atagccagac ctatttccgc 420
ttccaagaag agatcaaaga gaacaccaaa aacgacaaac aaatggtgca gtacatctat 480
aaatacacca gctatccgga tccgattctg ctgatgaaaa gcgcacgtaa tagctgttgg 540
agcaaagatg cagaatatgg cctgtatagc atctatcagg gtggcatttt tgaactgaaa 600
gaaaacgatc gcatctttgt gagcgtgacc aatgaacatc tgattgatat ggatcacgaa 660
gccagctttt ttggtgcctt tctggttggt 690
<210> 143
<211> 675
<212> DNA
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 143
accagcgaag aaaccattag caccgttcaa gaaaaacagc agaatattag tccgctggtt 60
cgtgaacgtg gtccgcagcg tgttgcagca catattaccg gcacccgtgg tcgtagcaat 120
accctgagca gcccgaatag caaaaatgaa aaagcactgg gtcgcaaaat caatagctgg 180
gaaagcagcc gtagcggtca tagctttctg agcaatctgc atctgcgtaa tggtgaactg 240
gtgattcatg aaaaaggctt ctactatatc tatagccaga cctatttccg cttccaagaa 300
gaaatcaaag aaaataccaa aaatgataaa caaatggtgc agtatattta caaatatacc 360
agctatccgg atccgattct gctgatgaaa agcgcacgta atagctgttg gagcaaagat 420
gcagaatatg gtctgtatag catttatcag ggtggcatct ttgagctgaa agaaaatgat 480
cgcatctttg ttagcgtgac caacgaacat ctgatcgata tggatcatga agccagcttt 540
tttggtgcat ttctggttgg ttgtgcagca tgtgcagccg catgtccgct gggtctggca 600
ggtcgtgttg ttcgtaatat tgcacgtcat ctggcacagg ttggtgatag catggataaa 660
ccgcgtcgtc cgtat 675
<210> 144
<211> 702
<212> DNA
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 144
accagcgaag aaaccattag caccgttcaa gaaaaacagc agaatattag tccgctggtt 60
cgtgaacgtg gtccgcagcg tgttgcagca catattaccg gcacccgtgg tcgtagcaat 120
accctgagca gcccgaatag caaaaatgaa aaagcactgg gtcgcaaaat taacagctgg 180
gaaagcagcc gtagcggtca tagctttctg agcaatctgc atctgcgtaa tggtgaactg 240
gtgattcatg aaaaaggctt ctactatatc tacagccaga cctattttcg cttccaagaa 300
gagattaaag aaaacaccaa aaacgataaa caaatggtgc agtacatcta taaatacacc 360
agctatccgg atccgattct gctgatgaaa agcgcacgta atagctgttg gagcaaagat 420
gcagaatatg gcctgtatag catttatcag ggtggcatct ttgaactgaa agaaaacgat 480
cgtattttcg tgagcgtgac caatgaacat ctgatcgata tggatcatga agccagcttt 540
tttggtgcat ttctggttgg ttgtgcagca tgtgcagccg catgtggtgg tccgctgggt 600
ctggcaggtc gtgttgttcg tcagattaaa atctggtttc agaaccgtcg catgaaatgg 660
aaaaaaaaag cctatgcagc agccggtaac agctacttta aa 702
<210> 145
<211> 648
<212> DNA
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 145
ttcatcagca aagaacgtcg tgaacgtgca attctgagca ccaaaccgcc tggcaccttt 60
ctgctgcgtt ttagcgaaag cagcaaacgt gttgttcgtc cgctgggtat tgccggtgaa 120
ggtggtggtt gtgcagcagc atgtgcagcc tgtggtagcg gtcagcgtgt tgcagcacat 180
attaccggca cccgtggtcg tagcaatacc ctgagcagcc cgaatagcaa aaatgaaaaa 240
gcactgggtc gcaaaattaa cagctgggaa agcagccgta gtggtcatag ctttctgagc 300
aatctgcatc tgcgtaatgg tgaactggtg attcatgaaa aaggcttcta ctatatctac 360
agccagacct attttcgctt ccaagaagag attaaagaaa acaccaaaaa cgataaacaa 420
atggtgcagt acatctataa atacaccagc tatccggatc cgattctgct gatgaaaagc 480
gcacgtaata gctgttggag caaagatgca gaatatggcc tgtatagcat ttatcagggt 540
ggcatctttg aactgaaaga aaacgatcgt attttcgtga gcgtgaccaa tgaacatctg 600
atcgatatgg atcatgaagc cagctttttt ggtgcatttc tggtgggt 648
<210> 146
<211> 582
<212> DNA
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 146
ggacaggttg gtcgtcagct ggcaattatt ggtgatgata ttaatcgtcg tcgtcggcgt 60
cgtagacgtc gtgttgttcg tccgctgggt ctggcaggtc gtgttgcagc acatattacc 120
ggcacccgtg gtcgtagcaa taccctgagc agcccgaata gcaaaaatga aaaagcactg 180
ggtcgcaaaa tcaatagctg ggaaagcagc cgtagcggtc atagctttct gagcaatctg 240
catctgcgta atggtgaact ggtgattcat gaaaaaggct tttattatat ttatagccag 300
acctattttc gctttcaaga agagattaaa gaaaatacca aaaatgataa acaaatggtg 360
cagtacatct ataaatatac cagctatccg gacccgattc tgctgatgaa aagcgcacgt 420
aatagctgtt ggagcaaaga tgcagaatat ggtctgtata gcatttatca gggtggcatc 480
tttgagctga aagaaaatga tcgcatcttt gttagcgtga ccaacgaaca tctgatcgat 540
atggatcatg aagccagctt ttttggtgca tttctggttg gt 582
<210> 147
<211> 729
<212> DNA
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 147
aaaaatctgt gggcagcaca gcgttatggt cgtgaactgc gtcgtatgag tgatgaattt 60
gaaggtagct ttaaaggtct gcgtcgtcgt cgtcgccgtc gtcggcgtgt tgttcgtccg 120
ctgggtctgg caggtcgtgt tgcagcacat attaccggca cccgtggtcg tagcaatacc 180
ctgagcagcc cgaatagcaa aaatgaaaaa gcactgggtc gcaaaatcaa tagctgggaa 240
agcagccgta gcggtcatag ctttctgagc aatctgcatc tgcgtaatgg tgaactggtg 300
attcatgaaa aaggctttta ttatatttat agccagacct attttcgctt tcaagaagag 360
attaaagaaa ataccaaaaa tgataaacaa atggtgcagt acatctataa atataccagc 420
tatccggacc cgattctgct gatgaaaagc gcacgtaata gctgttggag caaagatgca 480
gaatatggtc tgtatagcat ttatcagggt ggcatctttg agctgaaaga aaatgatcgc 540
atctttgtta gcgtgaccaa cgaacatctg atcgatatgg atcatgaagc cagctttttt 600
ggtgcatttc tggttggtgg tggtagccat ggtctggttc cgcgtggtag caccagcgaa 660
gaaaccatta gcaccgttca agaaaaacag cagaatatta gtccgctggt tcgtgaacgt 720
ggtccgcag 729
<210> 148
<211> 708
<212> DNA
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 148
accagcgaag aaaccattag caccgttcaa gaaaaacagc agaatattag tcctctggtt 60
cgtgaacgtg gtccgcagcg tgttgcagca catattaccg gcacccgtgg tcgtagcaat 120
accctgagca gcccgaatag caaaaatgaa aaagcactgg gtcgcaaaat caatagctgg 180
gaaagcagcc gtagcggtca tagctttctg agcaatctgc atctgcgtaa tggtgaactg 240
gtgattcatg aaaaaggctt ttattatatt tatagccaga cctattttcg ctttcaagaa 300
gagattaaag aaaataccaa aaatgataaa caaatggtgc agtacatcta taaatatacc 360
agctatccgg acccgattct gctgatgaaa agcgcacgta atagctgttg gagcaaagat 420
gcagaatatg gtctgtatag catttatcag ggtggcatct ttgagctgaa agaaaatgat 480
cgcatctttg ttagcgtgac caacgaacat ctgatcgata tggatcatga agccagcttt 540
tttggtgcat ttctggttgg tggtggtagt ccgctgggtc tggcaggttg tcgtgttgtt 600
cgtcgtcgtc gccgtcgtcg gcgtcgtaaa aatctgtggg cagcacagcg ttatggtcgt 660
gaactgcgtc gtatgagtga tgaatttgaa ggtagcttta aaggcctg 708
<210> 149
<211> 648
<212> DNA
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 149
cgtgttgcag cacatattac cggcacccgt ggtcgtagca ataccctgag cagcccgaat 60
agcaaaaatg aaaaagcact gggtcgcaaa attaacagct gggaaagcag ccgtagcggt 120
catagctttc tgagcaatct gcatctgcgt aatggtgaac tggtgattca tgaaaaaggc 180
ttctactata tctacagcca gacctatttt cgcttccaag aagagattaa agaaaacacc 240
aaaaacgata aacaaatggt gcagtacatc tataaataca ccagctatcc ggatccgatt 300
ctgctgatga aaagcgcacg taatagctgt tggagcaaag atgcagaata tggcctgtat 360
agcatttatc agggtggcat ctttgaactg aaagaaaacg atcgtatttt cgtgagcgtg 420
accaatgaac atctgatcga tatggatcat gaagccagct tttttggtgc atttctggtg 480
ggtggtggtg gcggtagtgg cggtggtggt cctctgggtc tggcaggtcg tgttgttcgt 540
aaatttgaac cgaaaagcgg ttggatgacc tttctggaag ttaccggcaa aatttgtgaa 600
atgctgagcc tgctgaaaca gtattgtaaa ccgcgtcgtc cgtatcgc 648
<210> 150
<211> 711
<212> DNA
<213> Artificial Sequence
<220>
<223> fusion protein
<400> 150
cgtgttagct tttgtcgtcc gggttggagc gcaatggcac gtagccgtct gaccgcaacc 60
agcgttagcc aggttcaaga aaatggtttc gtgaaaaaat tcgaaccgaa aagcggttgg 120
atgacctttc tggaagttac cggcaaaatt tgtgaaatgc tgagcctgct gaaacagtat 180
tgtcgtgttg ttcgtccgct gggtctggca ggcggtggta gcggtggtcg tgttgcagca 240
catattaccg gcacccgtgg tcgtagcaat accctgagca gcccgaatag caaaaatgaa 300
aaagcactgg gtcgcaaaat taacagctgg gaaagcagcc gtagcggtca tagctttctg 360
agcaatctgc atctgcgtaa tggtgaactg gtgattcatg aaaaaggctt ctactatatc 420
tacagccaga cctattttcg cttccaagaa gagattaaag aaaacaccaa aaacgataaa 480
caaatggtgc agtacatcta taaatacacc agctatccgg atccgattct gctgatgaaa 540
agcgcacgta atagctgttg gagcaaagat gcagaatatg gcctgtatag catttatcag 600
ggtggcatct ttgaactgaa agaaaacgat cgtattttcg tgagcgtgac caatgaacat 660
ctgatcgata tggatcatga agccagcttt tttggtgcat ttctggtggg t 711
<210> 151
<211> 28
<212> PRT
<213> Pseudomonas aeruginosa
<300>
<308> GenBankAAA25730.1
<309> 2000-03-19
<313> (70)..(97)
<400> 151
Leu Ser Thr Ala Ala Asp Met Gln Gly Val Val Thr Asp Gly Met Ala
1 5 10 15
Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro Asp Asp
20 25
<210> 152
<211> 148
<212> PRT
<213> Pseudomonas aeruginosa
<300>
<308> GenBank/AAA25730.1
<309> 2000-03-29
<313> (1)..(148)
<400> 152
Met Leu Arg Lys Leu Ala Ala Val Ser Leu Leu Ser Leu Leu Ser Ala
1 5 10 15
Pro Leu Leu Ala Ala Glu Cys Ser Val Asp Ile Gln Gly Asn Asp Gln
20 25 30
Met Gln Phe Asn Thr Asn Ala Ile Thr Val Asp Lys Ser Cys Lys Gln
35 40 45
Phe Thr Val Asn Leu Ser His Pro Gly Asn Leu Pro Lys Asn Val Met
50 55 60
Gly His Asn Trp Val Leu Ser Thr Ala Ala Asp Met Gln Gly Val Val
65 70 75 80
Thr Asp Gly Met Ala Ser Gly Leu Asp Lys Asp Tyr Leu Lys Pro Asp
85 90 95
Asp Ser Arg Val Ile Ala His Thr Lys Leu Ile Gly Ser Gly Glu Lys
100 105 110
Asp Ser Val Thr Phe Asp Val Ser Lys Leu Lys Glu Gly Glu Gln Tyr
115 120 125
Met Phe Phe Cys Thr Phe Pro Gly His Ser Ala Leu Met Lys Gly Thr
130 135 140
Leu Thr Leu Lys
145
<210> 153
<211> 35
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein
<300>
<301> E. P. Holinger, T. Chittenden, R. J. Lutz, J.
<302> Bak BH3 peptides antagonize Bcl-xL function and induce apoptosis
through cytochrome c-independent activation of caspases.
<303> Journal of Biological Chemistry
<304> 7
<305> 274(19):
<306> 13298-304
<307> 1999-05-07
<400> 153
Gly Pro Ser Gln Pro Thr Tyr Pro Gly Asp Asp Ala Pro Val Glu Asp
1 5 10 15
Leu Ile Arg Phe Val Gly Arg Leu Leu Ala Tyr Phe Gly Asp Thr Ile
20 25 30
Asn Arg Arg
35
<210> 154
<211> 34
<212> PRT
<213> Artificial Sequence
<220>
<223> fusion protein
<300>
<301> E. P. Holinger, T. Chittenden, R. J. Lutz
<302> Bak BH3 Peptides Antagonize Bcl-xL Function and Induce Apoptosis
through Cytochrome c-independent Activation of Caspases
<303> Journal of Biological Chemistry
<304> 7
<305> 274(19)
<306> 13298-304
<307> 1999-05-07
<400> 154
Gly Pro Arg Arg Pro Arg Arg Pro Gly Asp Asp Ala Pro Val Glu Asp
1 5 10 15
Leu Ile Arg Phe Val Gly Arg Leu Leu Ala Tyr Phe Gly Asp Thr Ile
20 25 30
Asn Arg
<210> 155
<211> 23
<212> PRT
<213> Homo sapiens
<300>
<301> Nepravishta R, Bellomaria A, Polizio F, Paci M, Melino S.
<302> Reticulon RTN1-C(CT)peptide: a potential nuclease and inhibitor
of histone deacetylase enzymes
<303> Biochemistry
<304> 19
<305> 49(2)
<306> 252-8
<307> 2010-01-19
<400> 155
Arg Thr His Ile Asn Thr Val Val Ala Lys Ile Gln Ala Lys Ile Pro
1 5 10 15
Gly Ala Lys Arg His Ala Glu
20
<210> 156
<211> 235
<212> PRT
<213> Homo sapiens
<300>
<308> GenBank/NP_006045
<309> 2011-06-01
<313> (2)..(236)
<400> 156
Ala Glu Pro Ser Ala Ala Thr Gln Ser His Ser Ile Ser Ser Ser Ser
1 5 10 15
Phe Gly Ala Glu Pro Ser Ala Pro Gly Gly Gly Gly Ser Pro Gly Ala
20 25 30
Cys Pro Ala Leu Gly Thr Lys Ser Cys Ser Ser Ser Cys Ala Val His
35 40 45
Asp Leu Ile Phe Trp Arg Asp Val Lys Lys Thr Gly Phe Val Phe Gly
50 55 60
Thr Thr Leu Ile Met Leu Leu Ser Leu Ala Ala Phe Ser Val Ile Ser
65 70 75 80
Val Val Ser Tyr Leu Ile Leu Ala Leu Leu Ser Val Thr Ile Ser Phe
85 90 95
Arg Ile Tyr Lys Ser Val Ile Gln Ala Val Gln Lys Ser Glu Glu Gly
100 105 110
His Pro Phe Lys Ala Tyr Leu Asp Val Asp Ile Thr Leu Ser Ser Glu
115 120 125
Ala Phe His Asn Tyr Met Asn Ala Ala Met Val His Ile Asn Arg Ala
130 135 140
Leu Lys Leu Ile Ile Arg Leu Phe Leu Val Glu Asp Leu Val Asp Ser
145 150 155 160
Leu Lys Leu Ala Val Phe Met Trp Leu Met Thr Tyr Val Gly Ala Val
165 170 175
Phe Asn Gly Ile Thr Leu Leu Ile Leu Ala Glu Leu Leu Ile Phe Ser
180 185 190
Val Pro Ile Val Tyr Glu Lys Tyr Lys Thr Gln Ile Asp His Tyr Val
195 200 205
Gly Ile Ala Arg Asp Gln Thr Lys Ser Ile Val Glu Lys Ile Gln Ala
210 215 220
Lys Leu Pro Gly Ile Ala Lys Lys Lys Ala Glu
225 230 235
<210> 157
<211> 282
<212> PRT
<213> Homo sapiens
<300>
<301> Srinivasula SM, Ahmad M, MacFarlane M, Luo Z, Huang Z,
Fernandes-Alnemri T, Alnemri ES
<302> Generation of constitutively active recombinant caspases-3 and -6
by rearrangement of their subunits
<303> Journal of Biological Chemistry
<304> 273
<305> 17
<306> 10107-11
<307> 1998-04-24
<400> 157
Met Ile Glu Thr Asp Ser Gly Val Asp Asp Asp Met Ala Cys His Lys
1 5 10 15
Ile Pro Val Asp Ala Asp Phe Leu Tyr Ala Tyr Ser Thr Ala Pro Gly
20 25 30
Tyr Tyr Ser Trp Arg Asn Ser Lys Asp Gly Ser Trp Phe Ile Gln Ser
35 40 45
Leu Cys Ala Met Leu Lys Gln Tyr Ala Asp Lys Leu Glu Phe Met His
50 55 60
Ile Leu Thr Arg Val Asn Arg Lys Val Ala Thr Glu Phe Glu Ser Phe
65 70 75 80
Ser Phe Asp Ala Thr Phe His Ala Lys Lys Gln Ile Pro Cys Ile Val
85 90 95
Ser Met Leu Thr Lys Glu Leu Tyr Phe Tyr His Asp Val Asp Gly Met
100 105 110
Glu Asn Thr Glu Asn Ser Val Asp Ser Lys Ser Ile Lys Asn Leu Glu
115 120 125
Pro Lys Ile Ile His Gly Ser Glu Ser Met Asp Ser Gly Met Ser Trp
130 135 140
Asp Thr Gly Tyr Lys Met Asp Tyr Pro Glu Met Gly Leu Cys Ile Ile
145 150 155 160
Ile Asn Asn Lys Asn Phe His Lys Ser Thr Gly Met Thr Ser Arg Ser
165 170 175
Gly Thr Asp Val Asp Ala Ala Asn Leu Arg Glu Thr Phe Arg Asn Leu
180 185 190
Lys Tyr Glu Val Arg Asn Lys Asn Asp Leu Thr Arg Glu Glu Ile Val
195 200 205
Glu Leu Met Arg Asp Val Ser Lys Glu Asp His Ser Lys Arg Ser Ser
210 215 220
Phe Val Cys Val Leu Leu Ser His Gly Glu Glu Gly Ile Ile Phe Gly
225 230 235 240
Thr Asn Gly Pro Val Asp Leu Lys Lys Ile Thr Asn Phe Phe Arg Gly
245 250 255
Asp Arg Cys Arg Ser Leu Thr Gly Lys Pro Lys Leu Phe Ile Ile Gln
260 265 270
Ala Cys Arg Gly Thr Glu Leu Asp Cys Gly
275 280
<210> 158
<211> 60
<212> PRT
<213> Homo sapiens
<300>
<308> GenBank/AAC24947.1
<309> 1998-07-01
<313> (146)..(205)
<400> 158
Ala Arg Lys Gly Lys Gly Gln Ile Glu Lys Arg Lys Leu Arg Glu Lys
1 5 10 15
Arg Arg Ser Thr Gly Val Val Asn Ile Pro Ala Ala Glu Cys Leu Asp
20 25 30
Glu Tyr Glu Asp Asp Glu Ala Gly Gln Lys Glu Arg Lys Arg Glu Asp
35 40 45
Ala Ile Thr Gln Gln Asn Thr Ile Gln Asn Glu Ala
50 55 60
<210> 159
<211> 54
<212> PRT
<213> Homo sapiens
<300>
<308> GenBank/NP_066950
<309> 2011-06-05
<313> (1)..(54)
<400> 159
Met Pro Gly Lys Lys Ala Arg Lys Asn Ala Gln Pro Ser Pro Ala Arg
1 5 10 15
Ala Pro Ala Glu Leu Glu Val Glu Cys Ala Thr Gln Leu Arg Arg Phe
20 25 30
Gly Asp Lys Leu Asn Phe Arg Gln Lys Leu Leu Asn Leu Ile Ser Lys
35 40 45
Leu Phe Cys Ser Gly Thr
50
<210> 160
<211> 9
<212> PRT
<213> Homo sapiens
<300>
<302> CELL-KILLING PEPTIDE
<310> WO2006001582
<311> 2005-03-22
<312> 2006-01-05
<400> 160
Lys Leu Leu Asn Leu Ile Ser Lys Leu
1 5
<210> 161
<211> 27
<212> PRT
<213> Homo sapiens
<300>
<302> NOVEL HSP90-TARGETED ANTI-CANCER CHIMERIC PEPTIDE
<310> WO2010055929
<311> 2009-11-13
<312> 2010-05-20
<400> 161
Gln Ile Lys Ile Trp Phe Gln Asn Arg Arg Met Lys Trp Lys Lys Lys
1 5 10 15
Ala Tyr Ala Ala Ala Gly Asn Ser Tyr Phe Lys
20 25
<210> 162
<211> 29
<212> PRT
<213> Homo sapiens
<300>
<301> Zhao W, Jaganathan S, Turkson
<302> A cell-permeable Stat3 SH2 domain mimetic inhibits Stat3
activation and induces antitumor cell effects in vitro
<303> Journal of Biological Chemistry
<304> 285
<305> 46
<306> 35855-65.
<307> 2010-11-12
<308> genBank/NP_644805
<309> 2011-06-05
<313> (517)..(544)
<400> 162
Phe Ile Ser Lys Glu Arg Arg Glu Arg Ala Ile Leu Ser Thr Lys Pro
1 5 10 15
Pro Gly Thr Phe Leu Leu Arg Phe Ser Glu Ser Ser Lys
20 25
<210> 163
<211> 15
<212> PRT
<213> Homo sapiens
<300>
<308> GenBank/AAA74466.1
<309> 1995-08-18
<313> (72)..(86)
<400> 163
Gly Gln Val Gly Arg Gln Leu Ala Ile Ile Gly Asp Asp Ile Asn
1 5 10 15
<210> 164
<211> 27
<212> PRT
<213> Homo sapiens
<300>
<301> Wang JL, Zhang ZJ, Choksi S, Shan S, Lu Z, Croce CM, Alnemri ES,
Korngold R, Huang Z.
<302> Cell permeable Bcl-2 binding peptides: a chemical approach to
apoptosis induction in tumor cells
<303> Cancer Research
<304> 60
<305> 6
<306> 1498-502
<307> 2000-03-15
<400> 164
Lys Asn Leu Trp Ala Ala Gln Arg Tyr Gly Arg Glu Leu Arg Arg Met
1 5 10 15
Ser Asp Glu Phe Glu Gly Ser Phe Lys Gly Leu
20 25
<210> 165
<211> 29
<212> PRT
<213> Homo sapiens
<300>
<308> GenBank/CAG46760.1
<309> 2004-06-29
<313> (147)..(175)
<400> 165
Lys Phe Glu Pro Lys Ser Gly Trp Met Thr Phe Leu Glu Val Thr Gly
1 5 10 15
Lys Ile Cys Glu Met Leu Ser Leu Leu Lys Gln Tyr Cys
20 25
<210> 166
<211> 32
<212> PRT
<213> Homo sapiens
<300>
<301> Ko JK, Choi KH, Pan Z, Lin P, Weisleder N, Kim CW, Ma J.
<302> The tail-anchoring domain of Bfl1 and HCCS1 targets mitochondrial
membrane permeability to induce apoptosis
<303> J Cell Sci.
<304> 120
<305> 16
<306> 2912-23.
<307> 2007-07-31
<400> 166
Arg Val Ser Phe Cys Arg Pro Gly Trp Ser Ala Met Ala Arg Ser Arg
1 5 10 15
Leu Thr Ala Thr Ser Val Ser Gln Val Gln Glu Asn Gly Phe Val Lys
20 25 30
<210> 167
<211> 6
<212> PRT
<213> Homo sapiens
<400> 167
Lys Pro Arg Arg Pro Tyr
1 5
<210> 168
<211> 13
<212> PRT
<213> Homo sapiens
<300>
<308> NCBI Reference Sequence/NP_002690.3
<309> 2011-04-19
<313> (334)..(344)
<400> 168
Glu Glu Glu Ala Ala Gly Arg Lys Arg Lys Lys Arg Thr
1 5 10
<210> 169
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> flexible linker
<400> 169
Ser Gly Cys Gly Ser
1 5
<210> 170
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Pegylation linker
<400> 170
Ala Ser Gly Cys Gly Pro Glu
1 5
<210> 171
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> MMP protease cleavage site
<400> 171
Pro Leu Gly Ile Ala Gly Glu
1 5
<210> 172
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> Furin cleavage site
<300>
<301> chards RM, Lowy DR, Schiller JT, Day PM
<302> Cleavage of the papillomavirus minor capsid protein, L2, at a
furin consensus site is necessary for infection.
<303> Proc Natl Acad Sci U S A
<304> 103
<305> 5
<306> 1522-7
<307> 2006-01-31
<400> 172
Arg Lys Lys Arg Val Lys Arg
1 5
<210> 173
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> MMP cleavage site
<400> 173
Pro Leu Gly Leu Ala Gly Gln
1 5
<210> 174
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> Thrombin cleavage site
<400> 174
Leu Val Pro Arg Gly Ser
1 5
<210> 175
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> flexible steric linker
<400> 175
Gly Gly Gly Gly Ser Gly Gly Gly Ser
1 5
<210> 176
<211> 107
<212> PRT
<213> Pseudomonas aeruginosa
<300>
<308> GenBank/1IKQ_A
<309> 2008-08-24
<313> (251)..(357)
<400> 176
Pro Glu Gly Gly Ser Leu Ala Ala Leu Thr Ala His Gln Ala Cys His
1 5 10 15
Leu Pro Leu Glu Thr Phe Thr Arg His Arg Gln Pro Arg Gly Trp Glu
20 25 30
Gln Leu Glu Gln Cys Gly Tyr Pro Val Gln Arg Leu Val Ala Leu Tyr
35 40 45
Leu Ala Ala Arg Leu Ser Trp Asn Gln Val Asp Gln Val Ile Arg Asn
50 55 60
Ala Leu Ala Ser Pro Gly Ser Gly Gly Asp Leu Gly Glu Ala Ile Arg
65 70 75 80
Glu Gln Pro Glu Gln Ala Arg Leu Ala Leu Thr Leu Ala Ala Ala Glu
85 90 95
Ser Glu Arg Phe Val Arg Gln Gly Thr Gly Asn
100 105
<210> 177
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> trimerization domain
<400> 177
Cys Ala Ala Cys Ala Ala Ala Cys
1 5
<210> 178
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> trimerization domain
<400> 178
Cys Ala Ala Glu Cys Ala Ala Ala Cys
1 5
<210> 179
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> trimerization domain
<400> 179
Cys Ala Ala Ala Cys Ala Ala Cys
1 5
<210> 180
<211> 9
<212> PRT
<213> Artificial Sequence
<220>
<223> flexible linker
<400> 180
Gly Gly Gly Gly Ser Gly Gly Gly Gly
1 5
<210> 181
<211> 7
<212> PRT
<213> Homo sapiens
<400> 181
Lys Pro Arg Arg Pro Tyr Arg
1 5
<210> 182
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> flexible linker
<400> 182
Gly Gly Ser His Gly
1 5
<210> 183
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> flexible linker
<400> 183
Ser Gly Gly Cys Gly Gly Ser
1 5
<210> 184
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> flexible linker
<400> 184
Ala Ala Cys Ala Ala
1 5
Claims (33)
- 가용성 hTRAIL 단백질 서열의 기능 분절인 도메인 (a)로서, 상기 기능 분절은 세포사멸 신호를 유도할 수 있고, hTRAIL95에서 hTRAIL121까지의 범위의 위치에 있는 아미노산으로부터 시작하여, 아미노산 hTRAIL281로 종결하는 것인 도메인 (a); 및
내인성 세포사멸 경로를 통해 그의 세포사멸 유발 작용(pro-apoptotic action)을 실행하는, 세포사멸 유발 효과기 펩티드의 서열인 도메인 (b)
를 포함하는 융합 단백질로서, 상기 도메인 (b)는 하기로 이루어진 군으로부터 선택되고:
- 서열 번호 30의 Bax 단백질의 BH3 도메인의 분절;
- 서열 번호 31의 Bid 단백질의 분절;
- 서열 번호 32의 리보뉴클레아제 A;
- 서열 번호 33의 시토크롬 C;
- 서열 번호 34의 그랜자임 B;
- 서열 번호 35의 Nur77 단백질의 분절;
- 서열 번호 36의 Bak 단백질의 BH3 도메인;
- 서열 번호 37의 PUMA/BBC3 단백질의 BH3 도메인;
- 서열 번호 38의 PUMA/BBC3 단백질;
- 서열 번호 39의 SMAC/Diablo 단백질의 분절;
- 서열 번호 40의 부포린 A;
- 서열 번호 41의 온코나제;
- 서열 번호 42의 Mdm2 단백질의 분절;
- 서열 번호 43의 Mdm2에 대한 펩티드 결합;
- 서열 번호 44의 루나신의 분절;
- 서열 번호 45의 Bik 단백질의 BH3 도메인;
- 서열 번호 46의 프로테아좀의 펩티드 억제제;
- 서열 번호 47의 프로테아좀 결합 UIM 모티프를 포함하는 도메인;
- 서열 번호 151의 아주린 유도된 펩티드;
- 서열 번호 152의 전체 길이의 아주린 펩티드;
- 서열 번호 153의 Bax 단백질의 BH3 도메인 및 aPP 단백질로부터 지정된 펩티드;
- 서열 번호 154의 Bax 단백질의 BH3 도메인 및 aPP 단백질로부터 지정된 펩티드;
- 서열 번호 155의 레티쿨론 RTN1-C 유도된 펩티드;
- 서열 번호 156의 전체 길이의 인간 레티쿨론 3;
- 서열 번호 157의 변형된, 구성적으로 활성인 카스파제-3;
- 서열 번호 158의 Par-4 단백질로부터의 SAC 도메인;
- 서열 번호 159의 녹사(Noxa) 단백질;
- 서열 번호 160의 녹사 단백질의 MTD/CKP 분절;
- 서열 번호 161의 짧은 하이브리드 펩티드(short hybride peptide) Antp-TPR;
- 서열 번호 162의 Stat3 단백질의 SH2 도메인의 펩티드 억제제;
- 서열 번호 163의 Bak 단백질의 BH3 도메인으로부터 유도된 펩티드;
- 서열 번호 164의 Bad 단백질의 BH3 도메인으로부터 유도된 펩티드; 및
- 서열 번호 165의 Bfl1 단백질로부터의 펩티드 ATAP
상기 도메인 (b)의 서열은 상기 도메인 (a)의 C-말단 및/또는 N-말단에 부착되는 것인, 융합 단백질. - 삭제
- 청구항 1에 있어서, 상기 도메인 (a)는 hTRAIL95-281, hTRAIL114-281 (서열 번호 27), hTRAIL119-281 (서열 번호 28), hTRAIL121-281 (서열 번호 29), hTRAIL116-281 및 hTRAIL120-281로 이루어진 군으로부터 선택된 것인, 융합 단백질.
- 삭제
- 삭제
- 청구항 1에 있어서, 도메인 (a) 및 도메인 (b) 사이에, 메탈로프로테아제 MMP에 의해 인식되는 서열, 유로키나제 uPA에 의해 인식되는 서열, 퓨린에 의해 인식되는 서열, 및 그의 조합으로부터 선택된, 종양 세포 환경에 존재하는 프로테아제에 의해 인식된 프로테아제 절단 부위를 포함하는 도메인 (c)를 함유하는 융합 단백질.
- 청구항 6에 있어서, 상기 메탈로프로테아제 MMP에 의해 인식되는 서열은 서열 번호 51, 서열 번호 171 또는 서열 번호 173이고, 상기 유로키나제 uPA에 의해 인식되는 서열은 서열 번호 52이고, 상기 퓨린에 의해 인식되는 서열은 서열 번호 53 또는 서열 번호 172인 것인, 융합 단백질.
- 청구항 6 또는 청구항 7에 있어서, 상기 도메인 (c)는 서로 나란히 위치된 메탈로프로테아제 MMP 및 유로키나제 uPA에 의해 인식되는 서열의 조합인 것인, 융합 단백질.
- 청구항 6 또는 청구항 7에 있어서, 상기 도메인 (c)는 퓨린에 의해 인식되는 서열인 것인, 융합 단백질.
- 청구항 1에 있어서, 상기 도메인 (b)는:
(d1) 소포체로 향하는 서열,
(d2) 6, 7, 8 또는 9 Arg 잔기를 포함하는, 세포막을 통해 수송하는 폴리아르기닌 서열,
(d3) 서열 번호 54 또는 서열 번호 176으로부터 선택된 녹농균(Pseudomonas aeruginosa) 전좌 도메인,
(d4) 막 수송 도메인,
(d5) 핵 국지화 도메인, 및
(d6) 미토콘드리아 타겟팅 도메인,
및 그의 조합으로 이루어진 군으로부터 선택된 수송 도메인 (d)와 추가로 연결된 것인, 융합 단백질. - 청구항 10에 있어서, 상기 소포체로 향하는 서열 (d1)은 KEDL (서열 번호 55) 또는 KDEL (서열 번호 56)인 것인, 융합 단백질.
- 청구항 10 또는 청구항 11에 있어서, 상기 소포체로 향하는 서열 (d1)은 상기 융합 단백질의 C-말단에 위치되는 것인, 융합 단백질.
- 청구항 10에 있어서, 상기 폴리아르기닌 서열 (d2)는 상기 융합 단백질의 C-말단에 위치되는 것인, 융합 단백질.
- 청구항 10에 있어서, 상기 폴리아르기닌 서열 (d2)는 도메인 (b) 및 도메인 (c) 사이에 위치되는 것인, 융합 단백질.
- 청구항 10에 있어서, 상기 녹농균 전좌 도메인 (d3)은 도메인 (a) 및 도메인 (c) 사이에 위치되는 것인, 융합 단백질.
- 청구항 1에 있어서, 도메인 (a) 및 도메인 (b) 사이에 글리신-세린 가요성 입체 링커(flexible steric linker)의 도메인 (e)를 추가로 포함하는 융합 단백질.
- 청구항 16에 있어서, 상기 글리신-세린 링커는, GGSG (서열 번호 57), GGGS (서열 번호 58), GGGGS (서열 번호 59), GGSGG (서열 번호 60), GGGSGG (서열 번호 61), GGGSGGG (서열 번호 62), GGGSGGGS (서열 번호 63), GGGSGGGGS (서열 번호 64), ASGG (서열 번호 65), GGGSASGG (서열 번호 66), GGSHG (서열 번호 182), SGCGS (서열 번호 169), GGGGSGGGG (서열 번호 180), SGGCGGS(서열 번호 183) 및 AACAA (서열 번호 184)로 이루어진 군으로부터 선택된 것인, 융합 단백질.
- 청구항 1에 있어서, 서열 번호 1; 서열 번호 2; 서열 번호 3; 서열 번호 4; 서열 번호 5; 서열 번호 6; 서열 번호 7; 서열 번호 8; 서열 번호 9; 서열 번호 10; 서열 번호 11; 서열 번호 12; 서열 번호 13; 서열 번호 14; 서열 번호 15; 서열 번호 16; 서열 번호 17; 서열 번호 18; 서열 번호 19; 서열 번호 20; 서열 번호 21; 서열 번호 22; 서열 번호 23; 서열 번호 24; 서열 번호 25, 서열 번호 26, 서열 번호 93, 서열 번호 94, 서열 번호 95, 서열 번호 96, 서열 번호 97, 서열 번호 98, 서열 번호 99, 서열 번호 100, 서열 번호 101, 서열 번호 102, 서열 번호 103, 서열 번호 104, 서열 번호 105, 서열 번호 106, 서열 번호 107, 서열 번호 108, 서열 번호 109, 서열 번호 110, 서열 번호 111, 서열 번호 112, 서열 번호 113, 서열 번호 114, 서열 번호 115, 서열 번호 116, 서열 번호 117, 서열 번호 118, 서열 번호 119, 서열 번호 120 및 서열 번호 121로 이루어진 군으로부터 선택된 아미노산 서열을 포함하는, 융합 단백질.
- 청구항 1 또는 청구항 18에 있어서, 재조합 단백질인 융합 단백질.
- 청구항 1 또는 청구항 18에 있어서, 구조물로부터 그의 절단을 가능하게 하는 프로테아제 절단 부위의 서열이 선행하는, 서열 hTRAIL95-121을 그것의 C-말단 부분으로서 추가로 함유하는 융합 단백질.
- 청구항 1 또는 청구항 18에 기재된 융합 단백질을 코딩하는 폴리뉴클레오티드.
- 청구항 21에 있어서, 대장균(E. coli)에서의 유전자 발현을 위해 사용되는 폴리뉴클레오티드.
- 청구항 22에 있어서, 서열 번호 67; 서열 번호 68; 서열 번호 69; 서열 번호 70; 서열 번호 71; 서열 번호 72; 서열 번호 73; 서열 번호 74; 서열 번호 75; 서열 번호 76; 서열 번호 77; 서열 번호 78; 서열 번호 79; 서열 번호 80; 서열 번호 81; 서열 번호 82; 서열 번호 83; 서열 번호 84; 서열 번호 85; 서열 번호 86; 서열 번호 87; 서열 번호 88; 서열 번호 89; 서열 번호 122; 서열 번호 123; 서열 번호 124; 서열 번호 125; 서열 번호 126; 서열 번호 127; 서열 번호 128; 서열 번호 129; 서열 번호 130; 서열 번호 131; 서열 번호 132; 서열 번호 133; 서열 번호 134; 서열 번호 135; 서열 번호 136; 서열 번호 137; 서열 번호 138; 서열 번호 139; 서열 번호 140; 서열 번호 141; 서열 번호 142; 서열 번호 143; 서열 번호 144; 서열 번호 145; 서열 번호 146; 서열 번호 147; 서열 번호 148; 서열 번호 149; 및 서열 번호 150으로 이루어진 군으로부터 선택된 서열에 의해 표시되는 폴리뉴클레오티드.
- 청구항 21에 기재된 폴리뉴클레오티드를 포함하는 발현 벡터.
- 청구항 24에 기재된 발현 벡터를 포함하는 숙주 세포.
- 청구항 25에 있어서, 상기 숙주 세포는 대장균(E. coli) 세포인 숙주 세포.
- 약제학적으로 허용가능한 담체와 조합하여 청구항 1 또는 청구항 18에 기재된 융합 단백질을 활성 성분으로서 포함하는, 혈액암, 유방암, 폐암, 대장암, 췌장암, 난소암, 방광암, 전립선암, 신장암 또는 뇌종양(brain cancer)의 치료를 위한 약제학적 조성물.
- 삭제
- 삭제
- 청구항 6에 있어서, 도메인 (a) 및 도메인 (c), 또는 도메인 (b) 및 도메인 (c) 사이에 글리신-세린 가요성 입체 링커의 도메인 (e)를 추가로 포함하는 융합 단백질.
- 청구항 10에 있어서, 도메인 (a) 및 도메인 (b), 또는 도메인 (b) 및 도메인 (d) 사이에 글리신-세린 가요성 입체 링커의 도메인 (e)를 추가로 포함하는 융합 단백질.
- 청구항 6에 있어서, 상기 도메인 (b)는:
(d1) 소포체로 향하는 서열,
(d2) 6, 7, 8 또는 9 Arg 잔기를 포함하는, 세포막을 통해 수송하는 폴리아르기닌 서열,
(d3) 서열 번호 54 또는 서열 번호 176으로부터 선택된 녹농균(Pseudomonas aeruginosa) 전좌 도메인,
(d4) 막 수송 도메인,
(d5) 핵 국지화 도메인, 및
(d6) 미토콘드리아 타겟팅 도메인,
및 그의 조합으로 이루어진 군으로부터 선택된 수송 도메인 (d)와 추가로 연결된 것인, 융합 단백질. - 청구항 32에 있어서, 도메인 (a) 및 도메인 (c), 도메인 (b) 및 도메인 (c), 도메인 (b) 및 도메인 (d), 또는 도메인 (c) 및 도메인 (d) 사이에 글리신-세린 가요성 입체 링커의 도메인 (e)를 추가로 포함하는 융합 단백질.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PL391627A PL391627A1 (pl) | 2010-06-25 | 2010-06-25 | Przeciwnowotworowe białko fuzyjne |
PLPL391627 | 2010-06-25 | ||
PCT/EP2011/060666 WO2011161260A1 (en) | 2010-06-25 | 2011-06-24 | Anticancer fusion protein |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20130088137A KR20130088137A (ko) | 2013-08-07 |
KR101861872B1 true KR101861872B1 (ko) | 2018-05-28 |
Family
ID=44627460
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137002118A KR101861872B1 (ko) | 2010-06-25 | 2011-06-24 | 항암 융합 단백질 |
Country Status (24)
Country | Link |
---|---|
US (1) | US9102759B2 (ko) |
EP (1) | EP2585480B1 (ko) |
JP (1) | JP5911481B2 (ko) |
KR (1) | KR101861872B1 (ko) |
CN (1) | CN102958940B (ko) |
AU (1) | AU2011268876B2 (ko) |
BR (1) | BR112012032708A2 (ko) |
CA (1) | CA2800841C (ko) |
CY (1) | CY1116099T1 (ko) |
DK (1) | DK2585480T5 (ko) |
EA (1) | EA023005B1 (ko) |
ES (1) | ES2531288T3 (ko) |
HK (1) | HK1178908A1 (ko) |
HR (1) | HRP20150241T1 (ko) |
IL (1) | IL223640A (ko) |
MX (1) | MX2012015246A (ko) |
PL (2) | PL391627A1 (ko) |
PT (1) | PT2585480E (ko) |
RS (1) | RS53851B1 (ko) |
SG (1) | SG186439A1 (ko) |
SI (1) | SI2585480T1 (ko) |
UA (1) | UA111722C2 (ko) |
WO (1) | WO2011161260A1 (ko) |
ZA (1) | ZA201300677B (ko) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
PL219845B1 (pl) | 2011-01-05 | 2015-07-31 | Adamed Spółka Z Ograniczoną Odpowiedzialnością | Przeciwnowotworowe białko fuzyjne |
ES2388020B1 (es) * | 2011-03-10 | 2013-10-01 | Universitat De Girona | Proteínas recombinantes con efecto antitumoral. |
PL394618A1 (pl) * | 2011-04-19 | 2012-10-22 | Adamed Spólka Z Ograniczona Odpowiedzialnoscia | Przeciwnowotworowe bialko fuzyjne |
BR112015013135A2 (pt) * | 2012-12-05 | 2017-09-26 | Thevax Genetics Vaccine Co Ltd | proteínas de fusão para uso como potencializadores imunogênicos para induzir respostas de células t antígeno específicas |
WO2014141094A1 (en) | 2013-03-14 | 2014-09-18 | Adamed Sp. Z O.O. | Anticancer conjugate |
CN103255160A (zh) * | 2013-05-06 | 2013-08-21 | 徐霞 | 重组人可溶性肿瘤坏死因子相关的凋亡诱导配体的制备方法 |
CN103524627A (zh) * | 2013-10-14 | 2014-01-22 | 成都华创生物技术有限公司 | 一种增强trail抗肿瘤活性的双靶点融合蛋白 |
EP3114232A4 (en) * | 2014-03-03 | 2017-08-09 | Acharjee, Sujata | Chimeric dystrophin-vsv-g-protein to treat dystrophinopathies |
BR102014031185A8 (pt) * | 2014-12-12 | 2021-05-04 | Fund De Amparo A Pesquisa Do Estado De Sao Paulo Fapesp | proteína recombinante indutora da apoptose; processo de obtenção da dita proteína e o seu uso no tratamento do câncer |
MA41374A (fr) * | 2015-01-20 | 2017-11-28 | Cytomx Therapeutics Inc | Substrats clivables par métalloprotéase matricielle et clivables par sérine protéase et procédés d'utilisation de ceux-ci |
CN105985445B (zh) * | 2015-02-11 | 2020-02-04 | 四川大学华西医院 | 一种肿瘤坏死因子相关凋亡诱导配体变异体及其制备方法和用途 |
US10428132B2 (en) * | 2015-02-11 | 2019-10-01 | West China Hospital, Sichuan University | Tumor necrosis factor-related apoptosis-inducing ligand variant, as well as a preparation method and use thereof |
CN107249629A (zh) * | 2015-02-26 | 2017-10-13 | 生控基因疫苗股份有限公司 | 包含免疫原性蛋白质及组合佐剂并用以诱发抗原特异性t细胞反应的疫苗组合物 |
EP3266797B1 (en) * | 2015-03-02 | 2018-12-05 | Chengdu Huachuang Biotechnology Co., Ltd | Trail membrane-penetrating peptide-like mutant mur6, preparation method therefor, and application thereof |
EP3266796B1 (en) * | 2015-03-02 | 2018-12-19 | Chengdu Huachuang Biotechnology Co., Ltd | Trail membrane-penetrating peptide-like mutant mur5, preparation method therefor, and application thereof |
US10676723B2 (en) | 2015-05-11 | 2020-06-09 | David Gordon Bermudes | Chimeric protein toxins for expression by therapeutic bacteria |
EP3348577B1 (en) * | 2015-10-22 | 2020-02-12 | Chengdu Huachuang Biotechnology Co., Ltd | Double-target mutein mur5s4tr of trail, and preparation method and use thereof |
WO2017066963A1 (zh) * | 2015-10-22 | 2017-04-27 | 成都华创生物技术有限公司 | 一种TRAIL双靶点突变蛋白MuR6S4TR、其制备方法及其应用 |
MA55153A (fr) * | 2016-02-19 | 2021-09-29 | Immatics Biotechnologies Gmbh | Nouveaux peptides et combinaison de peptides pour une utilisation dans l'immunothérapie contre le lymphome non hodgkinien et d'autres cancers |
GB201602918D0 (en) * | 2016-02-19 | 2016-04-06 | Immatics Biotechnologies Gmbh | Novel peptides and combination of peptides for use in immunotherapy against NHL and other cancers |
US11939609B2 (en) | 2017-07-24 | 2024-03-26 | The Board Of Trustees Of The Leland Stanford Junior University | Rewiring aberrant cancer signaling to a therapeutic effector response with a synthetic two-component system |
CN111479822A (zh) * | 2017-12-13 | 2020-07-31 | 艾诺奥医药品有限公司 | 靶向lemd1的癌症疫苗和其用途 |
US20210040469A1 (en) * | 2018-01-25 | 2021-02-11 | University Of Washington | Engineered cell death-inducing enzymes and methods of use |
CN108324692B (zh) * | 2018-04-26 | 2019-09-24 | 北京爱泰浦生物医药科技有限责任公司 | Atap多肽和紫杉醇类药物共晶药及其制备方法和应用 |
JP2021526026A (ja) * | 2018-06-08 | 2021-09-30 | エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft | 翻訳後修飾が低減したペプチドリンカー |
US20210395303A1 (en) * | 2018-11-08 | 2021-12-23 | Summation Bio, Inc. | Mini-nucleosome core proteins and use in nucleic acid delivery |
CA3140430A1 (en) * | 2019-05-14 | 2020-11-19 | Harpoon Therapeutics, Inc. | Epcam binding proteins and methods of use |
JP2022552265A (ja) * | 2019-10-11 | 2022-12-15 | ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー | 調節可能な細胞局在化のための組換えポリペプチド |
CN113549143B (zh) | 2021-07-21 | 2022-05-27 | 吉林大学 | 一种抗肿瘤多肽Bax-BH3、荧光高分子纳米胶束及其制备方法和应用 |
CN113717289A (zh) * | 2021-07-23 | 2021-11-30 | 华东理工大学 | 一种sac-trail融合蛋白及其制备方法和应用 |
WO2023031215A2 (en) * | 2021-09-02 | 2023-03-09 | Umc Utrecht Holding B.V. | Pro-apoptotic construct and use thereof |
CN118201636A (zh) * | 2021-10-26 | 2024-06-14 | 萨摩亚商柏沛生医股份有限公司 | 抗癌症及感染性疾病的组合疗法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005511086A (ja) * | 2001-12-06 | 2005-04-28 | ザ リージェンツ オブ ザ ユニバーシティー オブ カリフォルニア | 新規キメラtnfリガンド |
WO2010005519A1 (en) | 2008-06-30 | 2010-01-14 | University Of Pennsylvania | Fn14/trail fusion proteins |
WO2010055929A1 (ja) | 2008-11-14 | 2010-05-20 | 国立大学法人京都大学 | Hsp90を標的にした新規抗がんキメラペプチド |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60226816A (ja) | 1984-11-16 | 1985-11-12 | Asahi Chem Ind Co Ltd | 抗腫瘍活性をもつヒト由来蛋白質 |
DE3841768A1 (de) | 1988-12-12 | 1990-06-13 | Basf Ag | Neue tnf-peptide |
US6284236B1 (en) * | 1995-06-29 | 2001-09-04 | Immunex Corporation | Cytokine that induces apoptosis |
ES2253753T3 (es) | 1995-06-29 | 2006-06-01 | Immunex Corporation | Citocina que induce apoptosis. |
US6962696B1 (en) * | 1999-10-04 | 2005-11-08 | Vion Pharmaceuticals Inc. | Compositions and methods for tumor-targeted delivery of effector molecules |
DE60118935D1 (de) | 2000-04-24 | 2006-05-24 | Univ Yale New Haven | Dna & protein bindende miniatur proteine |
DE10247755B4 (de) | 2002-10-14 | 2006-01-19 | Pfizenmaier, Klaus, Prof. Dr. | Selektive, lokale Aktivierung von Mitgliedern der TNF-Rezeptorfamilie durch systemisch inaktive nicht-Antikörper-TNF-Liganden-Fusionsproteine |
CN1257187C (zh) * | 2003-10-22 | 2006-05-24 | 上海恰尔生物技术有限公司 | 钙网蛋白-肿瘤坏死因子相关凋亡诱导配体的融合蛋白及其制法和用途 |
CN1256347C (zh) * | 2003-12-10 | 2006-05-17 | 中国人民解放军第二军医大学 | 激肽原第五结构域-肿瘤坏死因子相关凋亡诱导配体的融合蛋白及其制法和用途 |
KR100685345B1 (ko) | 2004-03-27 | 2007-02-22 | 학교법인조선대학교 | 세포사 유도 펩타이드 |
PT1915626E (pt) | 2005-08-16 | 2012-02-03 | Genentech Inc | Sensibilidade da apoptose a apo2l/trail por ensaio de expressão de galnac-t14 em células/tecidos |
CN101168742A (zh) * | 2007-03-08 | 2008-04-30 | 中山大学肿瘤防治中心 | 一种溶癌病毒及其制备方法 |
WO2009002947A2 (en) | 2007-06-22 | 2008-12-31 | Affymax, Inc. | Compounds and peptides that bind the trail receptor |
CN101157729B (zh) * | 2007-10-23 | 2011-01-12 | 南京大学 | 一种肿瘤坏死因子相关凋亡配体变体及其应用 |
WO2009140469A2 (en) | 2008-05-14 | 2009-11-19 | Genentech, Inc. | Methods of using apo2l/trail to treat cancer |
-
2010
- 2010-06-25 PL PL391627A patent/PL391627A1/pl not_active Application Discontinuation
-
2011
- 2011-06-24 ES ES11727457T patent/ES2531288T3/es active Active
- 2011-06-24 RS RS20150125A patent/RS53851B1/en unknown
- 2011-06-24 CN CN201180031414.5A patent/CN102958940B/zh not_active Expired - Fee Related
- 2011-06-24 EA EA201291362A patent/EA023005B1/ru not_active IP Right Cessation
- 2011-06-24 PT PT11727457T patent/PT2585480E/pt unknown
- 2011-06-24 CA CA2800841A patent/CA2800841C/en not_active Expired - Fee Related
- 2011-06-24 PL PL11727457T patent/PL2585480T3/pl unknown
- 2011-06-24 WO PCT/EP2011/060666 patent/WO2011161260A1/en active Application Filing
- 2011-06-24 AU AU2011268876A patent/AU2011268876B2/en not_active Ceased
- 2011-06-24 SG SG2012094660A patent/SG186439A1/en unknown
- 2011-06-24 SI SI201130372T patent/SI2585480T1/sl unknown
- 2011-06-24 BR BR112012032708A patent/BR112012032708A2/pt not_active Application Discontinuation
- 2011-06-24 JP JP2013515923A patent/JP5911481B2/ja active Active
- 2011-06-24 MX MX2012015246A patent/MX2012015246A/es active IP Right Grant
- 2011-06-24 US US13/806,072 patent/US9102759B2/en not_active Expired - Fee Related
- 2011-06-24 UA UAA201300877A patent/UA111722C2/uk unknown
- 2011-06-24 DK DK11727457.1T patent/DK2585480T5/en active
- 2011-06-24 KR KR1020137002118A patent/KR101861872B1/ko active IP Right Grant
- 2011-06-24 EP EP11727457.1A patent/EP2585480B1/en active Active
-
2012
- 2012-12-13 IL IL223640A patent/IL223640A/en active IP Right Grant
-
2013
- 2013-01-23 ZA ZA2013/00677A patent/ZA201300677B/en unknown
- 2013-05-14 HK HK13105748.9A patent/HK1178908A1/xx not_active IP Right Cessation
-
2015
- 2015-03-02 HR HRP20150241TT patent/HRP20150241T1/hr unknown
- 2015-03-10 CY CY20151100240T patent/CY1116099T1/el unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005511086A (ja) * | 2001-12-06 | 2005-04-28 | ザ リージェンツ オブ ザ ユニバーシティー オブ カリフォルニア | 新規キメラtnfリガンド |
WO2010005519A1 (en) | 2008-06-30 | 2010-01-14 | University Of Pennsylvania | Fn14/trail fusion proteins |
WO2010055929A1 (ja) | 2008-11-14 | 2010-05-20 | 国立大学法人京都大学 | Hsp90を標的にした新規抗がんキメラペプチド |
Also Published As
Publication number | Publication date |
---|---|
EA201291362A1 (ru) | 2013-06-28 |
SG186439A1 (en) | 2013-01-30 |
WO2011161260A1 (en) | 2011-12-29 |
AU2011268876B2 (en) | 2014-01-30 |
SI2585480T1 (sl) | 2015-02-27 |
CN102958940B (zh) | 2015-12-02 |
JP2013532972A (ja) | 2013-08-22 |
PT2585480E (pt) | 2015-03-02 |
UA111722C2 (uk) | 2016-06-10 |
KR20130088137A (ko) | 2013-08-07 |
DK2585480T5 (en) | 2015-06-08 |
PL2585480T3 (pl) | 2015-05-29 |
HK1178908A1 (en) | 2013-09-19 |
DK2585480T3 (en) | 2015-03-23 |
MX2012015246A (es) | 2013-02-07 |
CA2800841C (en) | 2018-07-10 |
HRP20150241T1 (en) | 2015-06-05 |
BR112012032708A2 (pt) | 2016-10-11 |
RS53851B1 (en) | 2015-08-31 |
EP2585480A1 (en) | 2013-05-01 |
IL223640A (en) | 2016-05-31 |
ES2531288T3 (es) | 2015-03-12 |
JP5911481B2 (ja) | 2016-04-27 |
CY1116099T1 (el) | 2017-02-08 |
PL391627A1 (pl) | 2012-01-02 |
AU2011268876A1 (en) | 2013-01-10 |
ZA201300677B (en) | 2013-09-25 |
US20130164254A1 (en) | 2013-06-27 |
CN102958940A (zh) | 2013-03-06 |
EA023005B1 (ru) | 2016-04-29 |
US9102759B2 (en) | 2015-08-11 |
EP2585480B1 (en) | 2014-12-10 |
CA2800841A1 (en) | 2011-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101861872B1 (ko) | 항암 융합 단백질 | |
KR101950043B1 (ko) | 항암 융합 단백질 | |
EP2797950B1 (en) | Anticancer fusion protein | |
KR101952460B1 (ko) | 항암 융합 단백질 | |
KR20140097529A (ko) | 항암 융합 단백질 | |
KR20140019828A (ko) | 항암 융합 단백질 | |
NZ617353B2 (en) | Anticancer fusion protein |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |