CN101139391A - Cd147胞外区晶体结构及应用 - Google Patents
Cd147胞外区晶体结构及应用 Download PDFInfo
- Publication number
- CN101139391A CN101139391A CNA200710018514XA CN200710018514A CN101139391A CN 101139391 A CN101139391 A CN 101139391A CN A200710018514X A CNA200710018514X A CN A200710018514XA CN 200710018514 A CN200710018514 A CN 200710018514A CN 101139391 A CN101139391 A CN 101139391A
- Authority
- CN
- China
- Prior art keywords
- extracellular region
- antibody
- molecule
- dimensional structure
- crystal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 101000798441 Homo sapiens Basigin Proteins 0.000 title claims abstract description 229
- 102100032412 Basigin Human genes 0.000 title claims abstract description 227
- 239000013078 crystal Substances 0.000 title claims abstract description 40
- 238000000034 method Methods 0.000 claims abstract description 45
- 238000003032 molecular docking Methods 0.000 claims abstract description 7
- 238000005094 computer simulation Methods 0.000 claims abstract description 5
- 239000003446 ligand Substances 0.000 claims abstract description 4
- 108090000623 proteins and genes Proteins 0.000 claims description 53
- 102000004169 proteins and genes Human genes 0.000 claims description 48
- 235000018102 proteins Nutrition 0.000 claims description 42
- 238000013461 design Methods 0.000 claims description 35
- 239000000126 substance Substances 0.000 claims description 31
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 26
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 25
- 239000012634 fragment Substances 0.000 claims description 22
- 239000000203 mixture Substances 0.000 claims description 20
- 239000000243 solution Substances 0.000 claims description 15
- 150000001875 compounds Chemical class 0.000 claims description 14
- 125000000539 amino acid group Chemical group 0.000 claims description 11
- 230000001151 other effect Effects 0.000 claims description 11
- 210000001503 joint Anatomy 0.000 claims description 10
- 238000002425 crystallisation Methods 0.000 claims description 9
- 230000008025 crystallization Effects 0.000 claims description 9
- 230000035772 mutation Effects 0.000 claims description 9
- 150000003384 small molecules Chemical class 0.000 claims description 9
- 230000004071 biological effect Effects 0.000 claims description 8
- 239000007788 liquid Substances 0.000 claims description 7
- 239000000463 material Substances 0.000 claims description 7
- 238000004458 analytical method Methods 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 claims description 6
- -1 or its homologue Substances 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 6
- 239000003153 chemical reaction reagent Substances 0.000 claims description 5
- 239000003814 drug Substances 0.000 claims description 5
- 108010064528 Basigin Proteins 0.000 claims description 4
- 230000008827 biological function Effects 0.000 claims description 4
- 125000006850 spacer group Chemical group 0.000 claims description 4
- 102000015279 Basigin Human genes 0.000 claims description 3
- 239000005557 antagonist Substances 0.000 claims description 3
- 239000007864 aqueous solution Substances 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 3
- INHCSSUBVCNVSK-UHFFFAOYSA-L lithium sulfate Inorganic materials [Li+].[Li+].[O-]S([O-])(=O)=O INHCSSUBVCNVSK-UHFFFAOYSA-L 0.000 claims description 3
- 230000009465 prokaryotic expression Effects 0.000 claims description 3
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 claims description 3
- 239000001509 sodium citrate Substances 0.000 claims description 3
- QAOWNCQODCNURD-UHFFFAOYSA-N sulfuric acid Substances OS(O)(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-N 0.000 claims description 3
- RBTVSNLYYIMMKS-UHFFFAOYSA-N tert-butyl 3-aminoazetidine-1-carboxylate;hydrochloride Chemical compound Cl.CC(C)(C)OC(=O)N1CC(N)C1 RBTVSNLYYIMMKS-UHFFFAOYSA-N 0.000 claims description 3
- 108010067902 Peptide Library Proteins 0.000 claims description 2
- 238000002288 cocrystallisation Methods 0.000 claims description 2
- RKTYLMNFRDHKIL-UHFFFAOYSA-N copper;5,10,15,20-tetraphenylporphyrin-22,24-diide Chemical compound [Cu+2].C1=CC(C(=C2C=CC([N-]2)=C(C=2C=CC=CC=2)C=2C=CC(N=2)=C(C=2C=CC=CC=2)C2=CC=C3[N-]2)C=2C=CC=CC=2)=NC1=C3C1=CC=CC=C1 RKTYLMNFRDHKIL-UHFFFAOYSA-N 0.000 claims description 2
- 230000001105 regulatory effect Effects 0.000 claims description 2
- 238000001086 yeast two-hybrid system Methods 0.000 claims description 2
- 230000010354 integration Effects 0.000 claims 2
- 101000798427 Gallus gallus Basigin Proteins 0.000 claims 1
- 229940088623 biologically active substance Drugs 0.000 claims 1
- 229940079593 drug Drugs 0.000 claims 1
- 230000004001 molecular interaction Effects 0.000 claims 1
- 238000012827 research and development Methods 0.000 claims 1
- 239000002904 solvent Substances 0.000 claims 1
- 238000002360 preparation method Methods 0.000 abstract description 4
- 238000009510 drug design Methods 0.000 abstract description 3
- 210000004027 cell Anatomy 0.000 description 19
- 230000006870 function Effects 0.000 description 15
- 230000005764 inhibitory process Effects 0.000 description 13
- 229940024606 amino acid Drugs 0.000 description 11
- 235000001014 amino acid Nutrition 0.000 description 11
- 238000011282 treatment Methods 0.000 description 11
- 238000002447 crystallographic data Methods 0.000 description 10
- 206010028980 Neoplasm Diseases 0.000 description 9
- 150000001413 amino acids Chemical class 0.000 description 9
- 108010088751 Albumins Proteins 0.000 description 8
- 102000009027 Albumins Human genes 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 238000002441 X-ray diffraction Methods 0.000 description 6
- 230000014509 gene expression Effects 0.000 description 6
- 230000004304 visual acuity Effects 0.000 description 6
- 206010061218 Inflammation Diseases 0.000 description 5
- 230000004054 inflammatory process Effects 0.000 description 5
- 201000007270 liver cancer Diseases 0.000 description 5
- 208000014018 liver neoplasm Diseases 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 102000002274 Matrix Metalloproteinases Human genes 0.000 description 4
- 108010000684 Matrix Metalloproteinases Proteins 0.000 description 4
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 4
- 230000002547 anomalous effect Effects 0.000 description 4
- 239000002299 complementary DNA Substances 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 238000006206 glycosylation reaction Methods 0.000 description 4
- 125000003729 nucleotide group Chemical group 0.000 description 4
- 210000004881 tumor cell Anatomy 0.000 description 4
- 108020004705 Codon Proteins 0.000 description 3
- 241001044073 Cypa Species 0.000 description 3
- 102000005741 Metalloproteases Human genes 0.000 description 3
- 108010006035 Metalloproteases Proteins 0.000 description 3
- 239000007983 Tris buffer Substances 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 230000013595 glycosylation Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000003834 intracellular effect Effects 0.000 description 3
- 239000002773 nucleotide Substances 0.000 description 3
- 231100000572 poisoning Toxicity 0.000 description 3
- 230000000607 poisoning effect Effects 0.000 description 3
- 238000000790 scattering method Methods 0.000 description 3
- 230000005469 synchrotron radiation Effects 0.000 description 3
- 210000001519 tissue Anatomy 0.000 description 3
- 102000035160 transmembrane proteins Human genes 0.000 description 3
- 108091005703 transmembrane proteins Proteins 0.000 description 3
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 3
- 102000007469 Actins Human genes 0.000 description 2
- 108010085238 Actins Proteins 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 2
- 241000446313 Lamella Species 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 206010027476 Metastases Diseases 0.000 description 2
- 206010061309 Neoplasm progression Diseases 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 108091036066 Three prime untranslated region Proteins 0.000 description 2
- 108700009124 Transcription Initiation Site Proteins 0.000 description 2
- 102100023935 Transmembrane glycoprotein NMB Human genes 0.000 description 2
- 206010064390 Tumour invasion Diseases 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 125000004429 atom Chemical group 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000009400 cancer invasion Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 238000002050 diffraction method Methods 0.000 description 2
- 238000009792 diffusion process Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000008175 fetal development Effects 0.000 description 2
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 230000004853 protein function Effects 0.000 description 2
- 238000003127 radioimmunoassay Methods 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 239000011780 sodium chloride Substances 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000000547 structure data Methods 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 108091007466 transmembrane glycoproteins Proteins 0.000 description 2
- 238000002054 transplantation Methods 0.000 description 2
- 230000009385 viral infection Effects 0.000 description 2
- PNDPGZBMCMUPRI-HVTJNCQCSA-N 10043-66-0 Chemical compound [131I][131I] PNDPGZBMCMUPRI-HVTJNCQCSA-N 0.000 description 1
- FVFVNNKYKYZTJU-UHFFFAOYSA-N 6-chloro-1,3,5-triazine-2,4-diamine Chemical compound NC1=NC(N)=NC(Cl)=N1 FVFVNNKYKYZTJU-UHFFFAOYSA-N 0.000 description 1
- ZCYVEMRRCGMTRW-UHFFFAOYSA-N 7553-56-2 Chemical compound [I] ZCYVEMRRCGMTRW-UHFFFAOYSA-N 0.000 description 1
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 1
- STACJSVFHSEZJV-GHCJXIJMSA-N Ala-Asn-Ile Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O STACJSVFHSEZJV-GHCJXIJMSA-N 0.000 description 1
- YSMPVONNIWLJML-FXQIFTODSA-N Ala-Asp-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(O)=O YSMPVONNIWLJML-FXQIFTODSA-N 0.000 description 1
- CFPQUJZTLUQUTJ-HTFCKZLJSA-N Ala-Ile-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@H](C)N CFPQUJZTLUQUTJ-HTFCKZLJSA-N 0.000 description 1
- XCIGOVDXZULBBV-DCAQKATOSA-N Ala-Val-Lys Chemical compound CC(C)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](CCCCN)C(O)=O XCIGOVDXZULBBV-DCAQKATOSA-N 0.000 description 1
- NAARDJBSSPUGCF-FXQIFTODSA-N Arg-Cys-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)CN=C(N)N NAARDJBSSPUGCF-FXQIFTODSA-N 0.000 description 1
- MNBHKGYCLBUIBC-UFYCRDLUSA-N Arg-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MNBHKGYCLBUIBC-UFYCRDLUSA-N 0.000 description 1
- ISJWBVIYRBAXEB-CIUDSAMLSA-N Arg-Ser-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O ISJWBVIYRBAXEB-CIUDSAMLSA-N 0.000 description 1
- WOZDCBHUGJVJPL-AVGNSLFASA-N Arg-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N WOZDCBHUGJVJPL-AVGNSLFASA-N 0.000 description 1
- HMUKKNAMNSXDBB-CIUDSAMLSA-N Asn-Met-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HMUKKNAMNSXDBB-CIUDSAMLSA-N 0.000 description 1
- FRSGNOZCTWDVFZ-ACZMJKKPSA-N Asp-Asp-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O FRSGNOZCTWDVFZ-ACZMJKKPSA-N 0.000 description 1
- XOASPVGNFAMYBD-WFBYXXMGSA-N Asp-Trp-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(O)=O XOASPVGNFAMYBD-WFBYXXMGSA-N 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 102000002734 Collagen Type VI Human genes 0.000 description 1
- 108010043741 Collagen Type VI Proteins 0.000 description 1
- 108091029523 CpG island Proteins 0.000 description 1
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 1
- 101710181478 Envelope glycoprotein GP350 Proteins 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 102000010834 Extracellular Matrix Proteins Human genes 0.000 description 1
- 108010037362 Extracellular Matrix Proteins Proteins 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- VUVKKXPCKILIBD-AVGNSLFASA-N Gln-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VUVKKXPCKILIBD-AVGNSLFASA-N 0.000 description 1
- CELXWPDNIGWCJN-WDCWCFNPSA-N Gln-Lys-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CELXWPDNIGWCJN-WDCWCFNPSA-N 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 1
- OGNJZUXUTPQVBR-BQBZGAKWSA-N Glu-Gly-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OGNJZUXUTPQVBR-BQBZGAKWSA-N 0.000 description 1
- ZIYGTCDTJJCDDP-JYJNAYRXSA-N Glu-Phe-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZIYGTCDTJJCDDP-JYJNAYRXSA-N 0.000 description 1
- WGYHAAXZWPEBDQ-IFFSRLJSSA-N Glu-Val-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O WGYHAAXZWPEBDQ-IFFSRLJSSA-N 0.000 description 1
- JLJLBWDKDRYOPA-RYUDHWBXSA-N Gly-Gln-Tyr Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JLJLBWDKDRYOPA-RYUDHWBXSA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- TVDHVLGFJSHPAX-UWVGGRQHSA-N Gly-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 TVDHVLGFJSHPAX-UWVGGRQHSA-N 0.000 description 1
- OOCFXNOVSLSHAB-IUCAKERBSA-N Gly-Pro-Pro Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OOCFXNOVSLSHAB-IUCAKERBSA-N 0.000 description 1
- POJJAZJHBGXEGM-YUMQZZPRSA-N Gly-Ser-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)CN POJJAZJHBGXEGM-YUMQZZPRSA-N 0.000 description 1
- FFALDIDGPLUDKV-ZDLURKLDSA-N Gly-Thr-Ser Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O FFALDIDGPLUDKV-ZDLURKLDSA-N 0.000 description 1
- VJJSDSNFXCWCEJ-DJFWLOJKSA-N His-Ile-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O VJJSDSNFXCWCEJ-DJFWLOJKSA-N 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 1
- YCKPUHHMCFSUMD-IUKAMOBKSA-N Ile-Thr-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YCKPUHHMCFSUMD-IUKAMOBKSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical group OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- VCSBGUACOYUIGD-CIUDSAMLSA-N Leu-Asn-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O VCSBGUACOYUIGD-CIUDSAMLSA-N 0.000 description 1
- XQXGNBFMAXWIGI-MXAVVETBSA-N Leu-His-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 XQXGNBFMAXWIGI-MXAVVETBSA-N 0.000 description 1
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 1
- TUIOUEWKFFVNLH-DCAQKATOSA-N Leu-Val-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CS)C(O)=O TUIOUEWKFFVNLH-DCAQKATOSA-N 0.000 description 1
- KCXUCYYZNZFGLL-SRVKXCTJSA-N Lys-Ala-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O KCXUCYYZNZFGLL-SRVKXCTJSA-N 0.000 description 1
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 1
- 102000018697 Membrane Proteins Human genes 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- 108090000301 Membrane transport proteins Proteins 0.000 description 1
- 102000003939 Membrane transport proteins Human genes 0.000 description 1
- ACYHZNZHIZWLQF-BQBZGAKWSA-N Met-Asn-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ACYHZNZHIZWLQF-BQBZGAKWSA-N 0.000 description 1
- SXWQMBGNFXAGAT-FJXKBIBVSA-N Met-Gly-Thr Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SXWQMBGNFXAGAT-FJXKBIBVSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 102000002151 Microfilament Proteins Human genes 0.000 description 1
- 108010040897 Microfilament Proteins Proteins 0.000 description 1
- 241000699666 Mus <mouse, genus> Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- 230000004988 N-glycosylation Effects 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- LGSANCBHSMDFDY-GARJFASQSA-N Pro-Glu-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)O)C(=O)N2CCC[C@@H]2C(=O)O LGSANCBHSMDFDY-GARJFASQSA-N 0.000 description 1
- OQSGBXGNAFQGGS-CYDGBPFRSA-N Pro-Val-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OQSGBXGNAFQGGS-CYDGBPFRSA-N 0.000 description 1
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 1
- VAIZFHMTBFYJIA-ACZMJKKPSA-N Ser-Asp-Gln Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCC(N)=O VAIZFHMTBFYJIA-ACZMJKKPSA-N 0.000 description 1
- XWCYBVBLJRWOFR-WDSKDSINSA-N Ser-Gln-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O XWCYBVBLJRWOFR-WDSKDSINSA-N 0.000 description 1
- HJEBZBMOTCQYDN-ACZMJKKPSA-N Ser-Glu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJEBZBMOTCQYDN-ACZMJKKPSA-N 0.000 description 1
- VQBCMLMPEWPUTB-ACZMJKKPSA-N Ser-Glu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O VQBCMLMPEWPUTB-ACZMJKKPSA-N 0.000 description 1
- OWCVUSJMEBGMOK-YUMQZZPRSA-N Ser-Lys-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O OWCVUSJMEBGMOK-YUMQZZPRSA-N 0.000 description 1
- GYDFRTRSSXOZCR-ACZMJKKPSA-N Ser-Ser-Glu Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O GYDFRTRSSXOZCR-ACZMJKKPSA-N 0.000 description 1
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 1
- 108020005038 Terminator Codon Proteins 0.000 description 1
- GFDUZZACIWNMPE-KZVJFYERSA-N Thr-Ala-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCSC)C(O)=O GFDUZZACIWNMPE-KZVJFYERSA-N 0.000 description 1
- MMTOHPRBJKEZHT-BWBBJGPYSA-N Thr-Cys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O MMTOHPRBJKEZHT-BWBBJGPYSA-N 0.000 description 1
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 1
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 1
- SPIFGZFZMVLPHN-UNQGMJICSA-N Thr-Val-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SPIFGZFZMVLPHN-UNQGMJICSA-N 0.000 description 1
- DZIKVMCFXIIETR-JSGCOSHPSA-N Trp-Gly-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O DZIKVMCFXIIETR-JSGCOSHPSA-N 0.000 description 1
- RRVUOLRWIZXBRQ-IHPCNDPISA-N Trp-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N RRVUOLRWIZXBRQ-IHPCNDPISA-N 0.000 description 1
- YCQKQFKXBPJXRY-PMVMPFDFSA-N Trp-Tyr-Lys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)N[C@@H](CCCCN)C(=O)O)N YCQKQFKXBPJXRY-PMVMPFDFSA-N 0.000 description 1
- 108060008682 Tumor Necrosis Factor Proteins 0.000 description 1
- 102000000852 Tumor Necrosis Factor-alpha Human genes 0.000 description 1
- KWKJGBHDYJOVCR-SRVKXCTJSA-N Tyr-Ser-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O)N)O KWKJGBHDYJOVCR-SRVKXCTJSA-N 0.000 description 1
- YODDULVCGFQRFZ-ZKWXMUAHSA-N Val-Asp-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YODDULVCGFQRFZ-ZKWXMUAHSA-N 0.000 description 1
- ROLGIBMFNMZANA-GVXVVHGQSA-N Val-Glu-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N ROLGIBMFNMZANA-GVXVVHGQSA-N 0.000 description 1
- AEMPCGRFEZTWIF-IHRRRGAJSA-N Val-Leu-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O AEMPCGRFEZTWIF-IHRRRGAJSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- 125000002252 acyl group Chemical group 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000008485 antagonism Effects 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000000975 bioactive effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000004956 cell adhesive effect Effects 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 210000004292 cytoskeleton Anatomy 0.000 description 1
- GYOZYWVXFNDGLU-XLPZGREQSA-N dTMP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 GYOZYWVXFNDGLU-XLPZGREQSA-N 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000007877 drug screening Methods 0.000 description 1
- 210000003725 endotheliocyte Anatomy 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 230000001076 estrogenic effect Effects 0.000 description 1
- 210000002744 extracellular matrix Anatomy 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 1
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 1
- 108010023364 glycyl-histidyl-arginine Proteins 0.000 description 1
- 108010010147 glycylglutamine Proteins 0.000 description 1
- 230000011132 hemopoiesis Effects 0.000 description 1
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 1
- 231100000844 hepatocellular carcinoma Toxicity 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 1
- 238000003018 immunoassay Methods 0.000 description 1
- 239000000411 inducer Substances 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000008595 infiltration Effects 0.000 description 1
- 238000001764 infiltration Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 102000006495 integrins Human genes 0.000 description 1
- 108010044426 integrins Proteins 0.000 description 1
- 229910052740 iodine Inorganic materials 0.000 description 1
- 239000011630 iodine Substances 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 238000012917 library technology Methods 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 150000002482 oligosaccharides Chemical class 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N phenylalanine group Chemical group N[C@@H](CC1=CC=CC=C1)C(=O)O COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 230000019491 signal transduction Effects 0.000 description 1
- 125000000547 substituted alkyl group Chemical group 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- 230000005909 tumor killing Effects 0.000 description 1
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/70596—Molecules with a "CD"-designation not provided for elsewhere
-
- C—CHEMISTRY; METALLURGY
- C30—CRYSTAL GROWTH
- C30B—SINGLE-CRYSTAL GROWTH; UNIDIRECTIONAL SOLIDIFICATION OF EUTECTIC MATERIAL OR UNIDIRECTIONAL DEMIXING OF EUTECTOID MATERIAL; REFINING BY ZONE-MELTING OF MATERIAL; PRODUCTION OF A HOMOGENEOUS POLYCRYSTALLINE MATERIAL WITH DEFINED STRUCTURE; SINGLE CRYSTALS OR HOMOGENEOUS POLYCRYSTALLINE MATERIAL WITH DEFINED STRUCTURE; AFTER-TREATMENT OF SINGLE CRYSTALS OR A HOMOGENEOUS POLYCRYSTALLINE MATERIAL WITH DEFINED STRUCTURE; APPARATUS THEREFOR
- C30B29/00—Single crystals or homogeneous polycrystalline material with defined structure characterised by the material or by their shape
- C30B29/54—Organic compounds
- C30B29/58—Macromolecular compounds
-
- C—CHEMISTRY; METALLURGY
- C30—CRYSTAL GROWTH
- C30B—SINGLE-CRYSTAL GROWTH; UNIDIRECTIONAL SOLIDIFICATION OF EUTECTIC MATERIAL OR UNIDIRECTIONAL DEMIXING OF EUTECTOID MATERIAL; REFINING BY ZONE-MELTING OF MATERIAL; PRODUCTION OF A HOMOGENEOUS POLYCRYSTALLINE MATERIAL WITH DEFINED STRUCTURE; SINGLE CRYSTALS OR HOMOGENEOUS POLYCRYSTALLINE MATERIAL WITH DEFINED STRUCTURE; AFTER-TREATMENT OF SINGLE CRYSTALS OR A HOMOGENEOUS POLYCRYSTALLINE MATERIAL WITH DEFINED STRUCTURE; APPARATUS THEREFOR
- C30B7/00—Single-crystal growth from solutions using solvents which are liquid at normal temperature, e.g. aqueous solutions
- C30B7/02—Single-crystal growth from solutions using solvents which are liquid at normal temperature, e.g. aqueous solutions by evaporation of the solvent
- C30B7/04—Single-crystal growth from solutions using solvents which are liquid at normal temperature, e.g. aqueous solutions by evaporation of the solvent using aqueous solvents
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/30—Drug targeting using structural data; Docking or binding prediction
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2299/00—Coordinates from 3D structures of peptides, e.g. proteins or enzymes
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2333/00—Assays involving biological materials from specific organisms or of a specific nature
- G01N2333/435—Assays involving biological materials from specific organisms or of a specific nature from animals; from humans
- G01N2333/705—Assays involving receptors, cell surface antigens or cell surface determinants
- G01N2333/70596—Molecules with a "CD"-designation not provided for elsewhere in G01N2333/705
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2500/00—Screening for compounds of potential therapeutic value
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Crystallography & Structural Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Medicinal Chemistry (AREA)
- Theoretical Computer Science (AREA)
- Biophysics (AREA)
- Pharmacology & Pharmacy (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Metallurgy (AREA)
- Materials Engineering (AREA)
- Toxicology (AREA)
- Gastroenterology & Hepatology (AREA)
- Biochemistry (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Zoology (AREA)
- Immunology (AREA)
- Cell Biology (AREA)
- Computing Systems (AREA)
- Peptides Or Proteins (AREA)
Abstract
本发明公开了CD147胞外区的晶体、三维结构以及由CD147胞外区结构得到的结构和模型。本发明还包括制备所述晶体、晶体结构和模型的方法。本发明还包括计算机模建、分子对接的方法确定CD147胞外区活性位点的方法及相应的活性位点。另外还公开了所述晶体、晶体结构和模型的用途,包括基于结构的药物设计和抗体、配体及相互作用分子的筛选和鉴定。
Description
技术领域
本发明涉及一种CD147胞外区的晶体,还涉及用结晶通过X射线衍射确定的立体结构及其用途,更具体的,涉及利用其立体结构通过计算机分子模建方法确定其与相应抗体HAb18、配体和相互作用分子复合物的三维结构和活性作用位点,以及利用计算机分子模建的方法识别能与CD147胞外区结合的蛋白、肽类物质和化学物质,包括抑制物的鉴别。还涉及鉴别CD147抑制物及其医用价值。
背景技术
CD147是一种广泛表达的细胞跨膜糖蛋白,具有广泛的生理学及病理学意义。其最主要的功能是诱导细胞外基质金属蛋白酶(EMMPRIN)的分泌、与cypA相互作用,介导炎症发生、易化病毒入侵宿主细胞等。与胚胎发育、肿瘤侵袭、转移,炎症发生、发展,病毒感染扩增等密切相关。
CD147分子广泛表达于造血及非造血细胞系,如造血细胞、上皮细胞、内皮细胞和淋巴细胞。分子量为50-60Kd的跨膜糖蛋白。HAb18G/CD147是CD147家族新成员,是一种新的肝癌相关膜抗原,为一高度糖基化的跨膜蛋白分子。利用我室制备、纯化的肝癌单抗HAb18筛选人肝癌细胞cDNA文库,克隆出其相应抗原HAb18G的cDNA片段(长度约1.6kb)。查询GenBank,发现HAb18G cDNA序列与人CD147分子碱基序列高度同源,进一步分析开放读框,表明两者由相同基因编码。在此基础上,本研究中心又从蛋白水平的不同角度证实了这两种分子的一致性。进一步研究发现,CD147是一个肿瘤细胞表面的基质金属蛋白酶诱导因子,可通过成纤维细胞刺激合成基质金属蛋白酶(Marix Metalloproteinases,MMPs)。并推测HAb18G/CD147具有CD147分子中EMMPRI N的功能。在以前的研究中,我们通过荷瘤鼠模型证明不同剂量的碘[131I]美妥昔单抗注射液有不同的抑瘤效果,中、高组剂量的肿瘤抑制率均和阴性对照组有显著性差异;随后将该单抗标记同位素131I制成碘[131I]美妥昔单抗注射液(LICARTIN)治疗原发性肝癌安全、有效。另一个临床研究表明LICARTIN可作为肝癌肝移植后的抗复发药物。随访1年后,治疗组与对照组相比的肝移植术后患者的肝癌复发率下降、生存率提高。以上研究表明,CD147分子是一个治疗肝癌等肿瘤药物的新靶点。
我们用HAb18G/CD147抗体进行广泛的组织谱鉴定,表明该分子高表达于上皮来源的癌组织(69.47%),良性瘤不表达,胚胎组织及正常组织低表达(分别为2.67%,10.62%)。是一个广谱的癌型特异性的肿瘤标志物。
人CD147是由269个氨基酸组成的蛋白质,属于I型跨膜蛋白家族,分子量估计最大为~28KD。从克隆的cDNA序列可知CD147分子的mRNA长度大约1.7Kb,在转录起始位点的相关区域未发现TATA或CAAT盒,但发现转录起始位点位于CpG岛中,尤其在-247-+6核苷酸处较多。N端起始码之前有约115个核苷酸为非编码区,编码区编码269个氨基酸,21个氨基酸为信号肽,中间185个氨基酸构成胞外结构域,从206-229共24个氨基酸为穿膜区,C端39个氨基酸为胞内结构域。胞外4个半胱氨酸形成2个二硫键构成IgSF典型的半球型结构域(C41,C87,C126,C185)。此外,胞膜外区还有三个相似的N-糖基化天冬酰氨序列,糖基化作用决定了CD147分子刺激MMP的活性,纯化的去糖基化CD147分子不能诱导MMP的活性且具有拮抗其天然分子的活性的特点,用Endo-F糖苷酶消化可使CD147分子量减少大约30KD,表明CD147分子的糖基化主要以N-连接的寡聚糖方式存在。
穿膜区的24个氨基酸残基在人、鼠、鸡中CD147分子中高度保守,提示CD147分子的跨膜片段扮演着重要的功能角色,在不同种属中体现出功能的相似性。在穿膜区的中间部位存在有带电荷的谷氨酸残基,这在其它的膜蛋白分子中是不常见的,揭示CD147分子可以与其它的跨膜蛋白相互联系。穿膜区包括3个亮氨酸残基(L206、L213、L220)和1个苯丙氨酸残基(F227),且第隔7个氨基酸残基出现一次,为典型的亮氨酸拉链结构。穿膜区的带电残基及亮氨酸拉链结构是一个潜在的蛋白相互作用基序,很可能介导CD147分子参与形成信号转导多肽链或膜转运蛋白成份。
对胞浆结构域的研究,目前尚无全面的分析,Schlosshauer-B等曾用双标记实验检测到CD147与F-肌动蛋白(actin)共同存在,发现膜表面CD147的表达与细胞骨架中微丝蛋白有关。而是否有磷酸化位点,如何传递信号等功能尚为未知。
CD147基因由8个外显子编码,总长度10.8Kb。其核苷酸及蛋白质序列如图4所示:
Exon1(aa 1~23,107bp)与Exon2(aa 2~75,154bp)被Intron1(约6.5Kb)隔开,该内含子是EMMPRIN基因中最大的内含子序列。Intron2大约700bp,是基因中第二大干扰序列。Exon3(aa 76~102,83bp)与Exon4(aa103~148,138bp)被300bp的Intron3所分隔开。Intron4大约650bp;Exon5(aa 149~240,276bp);Intron5约550bp;Exon6(aa 241~249,25bp)非常短;Intron6约250bp;Exon7(aa 250~269,69bp);Intron7约300bp,最后一个外显子是Exon8,为736bp。Exon1编码5’非翻译区(5’-UTR)和信号肽。Exon2和Exon3编码第一个Ig1结构域:Exon2编码52个密码子,约占Ig1的66%,Exon3编码27个密码子,约占Ig的34%。Exon4和Exon5编码第二个Ig结构域:Exon4编码46个密码子,约为45%,Exon5是“结合”外显子,编码剩余55%的Ig结构域,以及跨膜结构域的24氨基酸残基和一小部分胞内结构域。Exon6和7编码胞内结构域,Exon7也编码终止密码子和3’-UTR的5个核苷酸残基。Exon8编码剩余的3’-UTR。
CD147分子是一个潜在的粘附分子,CD147与N-CAM、I-CAM及其他相关IgSF亚群分子在功能上有相似的特性,参与细胞与细胞、细胞与基质的粘附。已有实验证明CD147分子可与Integrin家族α3β1、α6β1形成蛋白复合物,但关于复合物的功能目前还不清楚,可能与肿瘤细胞与细胞外基质及肿瘤细胞与间质细胞之间的粘附有关;另有实验表明:某些CD147单抗可抑制雌激素依赖的乳腺癌细胞系MCF-7及MDA-435的同型聚集,以及MCF-7细胞对IV型胶原、FN、LN的粘附。CD147分子是一个新的细胞表面粘附分子,介导细胞粘附作用。这类分子的表达及在肿瘤中的作用是目前肿瘤研究的一个重点。
蛋白质的生物学功能在很大程度上取决于其空间结构,蛋白质结构构象多样性导致了不同的生物学功能。蛋白质结构与功能关系研究是进行蛋白质功能预测及蛋白质设计的基础。蛋白质分子只有处于它自己特定的三维空间结构情况下,才能获得它特定的生物活性;三维空间结构稍有破坏,就很可能会导致蛋白质生物活性的降低甚至丧失。因为它们的特定的结构允许它们结合特定的配体分子,例如,血红蛋白和肌红蛋白与氧的结合、酶和它的底物分子、激素与受体、以及抗体与抗原等。知道了基因密码,科学家们可以推演出组成某种蛋白质的氨基酸序列,却无法绘制蛋白质空间结构。随着近年来在结构生物学方面的进展,用X射线衍射或NMR分析,使用立体结构和分子设计技术,已揭示了许多蛋白质的立体结构。对于蛋白质空间结构的了解,将有助于对蛋白质功能的确定。同时,蛋白质是药物作用的靶标,联合运用基因密码知识和蛋白质结构信息,药物设计者可以设计出小分子化合物,抑制与疾病相关的蛋白质,进而达到治疗疾病的目的。
CD147蛋白结构的阐明,在为疾病的治疗或诊断试剂的设计中具有重要作用。在本发明之前,CD147的结构及由CD147促进肿瘤进展、调节肿瘤细胞浸润转移、介导炎症发生、易化病毒入侵宿主细胞等的机制并不十分明确。因此,尽管有关于CD147的一般功能与作用的知识,但是为治疗或诊断疾病(例如肝癌)而进行的试剂开发则因为缺乏蛋白的的结构信息而受到限制。
因此,有必要阐明CD147分子的三维结构和建立其模型,有助确定CD147分子与整合素、CyPA等作用分子相互作用的活性位点,以便利用结构和模型来辅助疾病治疗策略,譬如基于结构的药物设计。
本文所用的术语“蛋白质的立体结构”指某些条件下蛋白质氨基酸序列确定的蛋白质的三维结构,即具有氨基酸序列的蛋白质在某些条件下折叠而成的三维结构。可用X射线衍射的方法或NMR确定蛋白质的结构。
发明内容
本发明涉及在正方晶系中具有空间群P41212和SEQ ID NO:1中列出的氨基酸序列的CD147胞外区结晶的三维结构,以及从CD147胞外区结构所得到的CD147胞外区与其抗体HAb18复合物的结构模型及活性作用位点,以及这些结构、模型、活性作用位点的应用。众所周知,在蛋白质晶体学领域中,要获得有足够质量的晶体用于确定蛋白质的结构是不很容易的。而且,在本发明以前,关于为解析CD147胞外区的三维结构而所需的足够质量的晶体一直未能得到。因此,在本发明以前,CD147胞外区的三维结构也无法确定,也不可能了解到CD147胞外区的活性作用位点的信息。本发明者是第一个阐明其三维结构及活性作用位点,并为针对CD147的药物设计提供三维模型。
相应地,本发明的一个目的是,为确定CD147胞外区的三维结构提供足够质量的晶体。本发明也包括培养CD147胞外区晶体的方法。
本发明的第二个目的是提供了关于CD147胞外区蛋白的三维结构、模型的信息。
关于CD147胞外区蛋白的三维结构的知识为设计和生产在动物体内(包括人)调节肿瘤发生、发展及抑制肿瘤转移等方面的抗体、肽类物质、蛋白物质、小分子物质(包括化学物质)提供了一种方式(即基于结构的药物设计)。譬如,通过各种计算机软件和模型,可以设计上述物质来抑制CD147分子的生物学活性,从而达到抑制肿瘤进展、炎症发生、病毒入侵宿主细胞等。
相应地,本发明的第三个目的是提供一种方法,其利用所获得的CD147胞外区蛋白的三维结构信息,结合计算机模建抗CD147分子的单克隆抗体HAb18的结构,利用计算机模拟、分子对接等手段确定CD147分子胞外区的一个活性位点,及由该活性位点的氨基酸序列、结构等来设计用于治疗和诊断疾病的试剂。
相应地,本发明的第四个目的是提供利用CD147胞外区蛋白的三维结构来设计、产生能与CD147胞外区结合并抑制或刺激CD147生物学活性的抗体、蛋白物质、肽类物质或小分子物质(化学物质)等。该抑制性或刺激性物质由以下几点的方法确定:(a)提供CD147胞外区的三维结构,(b)使用该结构设计抗体、蛋白物质、肽类物质或小分子物质(化学物质)等,(c)合成该种物质;及(d)评估合成的所述物质改变CD147介导的胚胎发育、肿瘤侵袭、转移,炎症发生、发展,病毒感染扩增等。
附图说明
图1为CD147胞外区晶体结构示意图。
图2为CD147与单抗HAb18复合物示意图。
图3为CD147活性结合位点示意图。
图4为CD147基因的外显子/内含子结构示意图。
具体实施方式
本发明涉及如下内容:CD147胞外区的晶体、三维结构、这种三维结构的模型、从CD147胞外区结构所得到的CD147胞外区与其抗体HAb18复合物的结构模型及活性作用位点,以及一种基于使用这种结构的药物设计方法、由这些方法确认的抗体、蛋白物质、肽类物质、小分子物质、以及这些物质在治疗诊断中的应用、以及CD147胞外区结构、模型、活性作用位点的应用。需要说明的是,本文的术语如权利要求中所述的本发明中CD147胞外区晶体的氨基酸序列的“同系物”、“片段”、“变异体”、“类似物”、“衍生物”指从本发明所提供的已形成晶体CD147胞外区氨基酸序列中取代、变异、更改、替换、删除或增加一个或多个氨基酸残基后所形成的分子,或指从本发明所提供的已形成晶体CD147胞外区氨基酸序列选取一段序列后所形成的分子。
本发明中“变异体”指添加、删除或置换野生型CD147胞外区序列或CD147胞外区序列片段中的氨基酸残基。本发明CD147胞外区晶体的氨基酸序列的变异体可能包括(1)删除序列中任意一位或多位氨基酸残基,(2)用一个或多个氨基酸残基置换序列中任意一位或多位氨基酸残基。
本发明中“同系物”指氨基酸序列上的相似性,即将本发明中CD147胞外区晶体的氨基酸序列与其它氨基酸序列进行比对,如果二者氨基酸序列间有至少70%相同,则认为二者为同系物。比对方法可单凭肉眼,也可通过计算机软件如CLUSTAL等,进行同源性比对。
本发明中“片段”指本发明所提供的CD147胞外区晶体的氨基酸序列中的任意一段,并且此段可被结晶。
本发明中“类似物”指与本发明所提供的CD147胞外区晶体的氨基酸序列相似,且不会损害氨基酸结晶能力的氨基酸置换或删除。
本发明中“衍生物”指针对本发明所提供的CD147胞外区晶体的氨基酸序列进行化学修饰后所形成的氨基酸序列,如取代烷基、酰基或氨基上的氢等。
本发明所述的CD147胞外区晶体不仅指天然存在的CD147分子晶体或用野生型CD147通过结晶所成晶体,也包括野生型CD147分子的突变体所形成的与野生型CD147分子具有相同三维结构的晶体。野生型CD147分子的突变体可为:取代野生型CD147分子中至少一个氨基酸残基、加入/删除野生型CD147分子肽链中的氨基酸或在野生型CD147分子肽链的N末端或C末端填加/删除氨基酸。
在一个实施方案中,CD147胞外区结晶可具有正方体形式的晶胞,具有晶格常数:a=126.481±0.5%,b=126.481±0.5%,c=169.926±0.5%,α=β=γ=90°。,氨基酸序列是SEQID NO:1。另外,本发明提供了一种制备CD147胞外区结晶的方法,包括以下步骤:将CD147胞外区基因序列克隆至pET21a(+)原核表达系统,表达,纯化出CD147胞外区;提供5-20mg/ml的CD147胞外区溶液,提供含有0.5M硫酸胺溶液,0.1M柠檬酸钠溶液和1.0M硫酸锂溶液的池液,pH5.6;混合CD147胞外区溶液和池液;让得到的混合物溶液放置一段预定的时间,直到CD147胞外区晶体在溶液中长到预定的大小或更大。
在另一个实施方案中,利用X-射线衍射法确定CD147胞外区晶体的三维结构,具体方法如下:结构的解析采用单波长反常散射法SAD(singlewavelength anomalous dispersion)。在同步辐射光源(Photon Factory,Japan)NW12光束线上收集天然蛋白晶体的衍射数据(2.8分辨率)和硒代蛋白晶体衍射数据(3.1分辨率)各一套并用HKL2000软件包处理。首先用硒代蛋白晶体数据获得相位信息和初始结构模型,再用天然蛋白晶体的衍射数据进行结构确定和精修
一个基本上符合权利要求1的CD147胞外区的三维结构可利用合适的计算机建模程序如WAM(Web Antibody Modeling)来模拟计算。这种模拟计算需要使用一些信息,如:(1)CD147胞外区的氨基酸序列;(2)与具有三维结构的蛋白的相关部分的氨基酸序列;(3)特定三维结构的信息。与本发明CD147胞外区的三维结构基本上相符的其它类型的CD147胞外区(CD147胞外区的突变体、片段、衍生物、变异体、类似物或同源物)的三维结构也能够用分子替代的方法进行计算,详见下述。
表1中列出了一个合适的用于模拟或计算另一个CD147胞外区蛋白的三维结构的CD147胞外区蛋白的三维结构。根据本发明,本领域的技术人员可通过该三维结构模拟或计算出与本发明所述的CD147胞外区氨基酸序列相似的CD147胞外区突变体、片段、衍生物、变异体、类似物或同源物蛋白的三维结构。这些技术是基于从CD147胞外区晶体分析得到的信息。因此,晶体CD147胞外区三维结构的公开,使得可以使用本领域的一些常规技术来衍生CD147胞外区突变体、片段、衍生物、变异体、类似物或同源物的三维结构和模型。任何CD147胞外区突变体、片段、衍生物、变异体、类似物或同源物的结构的衍生甚至可以在没有关于其晶体结构数据的情况下得以实现。而且,当某种CD147胞外区突变体、片段、衍生物、变异体、类似物或同源物的晶体结构时,使用已有的从本发明CD147胞外区结构得到的信息,可以对新的CD147胞外区突变体、片段、衍生物、变异体、类似物或同源物的三维结构的模拟进行优化。本发明的一个优点是,在没有其它CD147胞外区突变体、片段、衍生物、变异体、类似物或同源物的晶体结构数据时,考虑该CD147胞外区突变体、片段、衍生物、变异体、类似物或同源物蛋白与本发明CD147胞外区氨基酸序列的差别,就可模拟该CD147胞外区突变体、片段、衍生物、变异体、类似物或同源物蛋白的三维结构。而且,本发明的新公开使得确定CD147胞外区与抗体、整合素、CyPA及其它相互作用分子的活性位点,以及基于结构的药物设计、药物筛选变得现实起来,这样设计、筛选出来的抗体、蛋白类物质、肽类物质或小分子物质(化合物)有效地影响CD147分子的活性。
利用本发明所述的CD147胞外区晶体模型,有助于筛选CD147抗体、配体及其它相互作用分子,及相应的活性作用位点,特别是筛选CD147的抑制性分子,如抗体、肽、蛋白、化学分子等。如利用CD147胞外区与抗体、配体及其它相互作用分子共结晶方法,或将抗体、配体及其它相互作用分子溶解于CD147胞外区晶体中,或通过计算机对接CD147胞外区晶体模型和抗体、配体及其它相互作用分子晶体模型等方法进行筛选CD147配体,特别是CD147的抑制性分子,或针对CD147胞外区晶体的活性结合位点,利用计算机设计、筛选能与之结合的试剂、拮抗物及药物等。在公开本发明的三维结构前,没有任何信息可以用于以CD147胞外区蛋白结构为基础的诊断、治疗用化合物的结构开发。目前,还不能从已有的线性氨基酸序列完成这类设计。基于结构的药物设计是指用计算机模拟来预测一种抗体、肽、多肽、蛋白质、化学物质与蛋白构象的相互作用。通常,对一种能与治疗用抗体、肽类物质、蛋白物质、化学分子有效地相互作用的蛋白质而言,需要将该治疗用化合物的三维结构推想为一种相容构象以确保二者的结合。所述蛋白质的三维结构知识可保证本领域技术人员能设计出具有些类相容构象的诊断、治疗用抗体、肽类物质、蛋白物质或化学分子。如CD147胞外区与抗体HAb18结合位点的信息能使本领域技术人员设计出一种能与CD147结合的抗体、肽类、蛋白物质或化合物,且该抗体、肽类、蛋白物质或化合物能抑制CD147的生物学活性。
CD147胞外区三维结构的测定为CD147分子胞外区上可能的活性位点的确定提供了重要信息。结构信息有助于针对分子上活性位点设计CD147分子的抑制物。例如,利用计算机技术鉴定能与活性位点结合的配体,或进行药物设计,或利用X-ray晶体衍射分析鉴定并定位结合配体的结合位点。
Greer等人利用计算机模型的重复序列、蛋白-配体复合体结构和X-ray衍射方法,设计出胸腺嘧啶核苷酸抑制物。因此,CD147分子的抑制物也可通过此种方法进行设计。例如,利用本发明所提及的CD147胞外区三维结构,通过计算机模建的方法,设计可与本发明所提及的功能活性位点或是三维结构上其它位点结合的抗体、蛋白分子、肽类分子、小分子物质等,然后合成该种物质,与CD147形成复合物,再利用X射线晶体衍射的方法分析复合物,从而获得真实的结合位点。根据X射线晶体衍射分析的结果,可对配体的结构和/或功能基团进行必要的调整,直至获得最优化的物质分子。
此外,根据CD147胞外区三维结构的结果还可利用多种计算机软件进行推理性药物设计,从而设计出CD147分子的抑制物。如利用自动化的配体-受体对接软件(Jones et al.in Current Opinion in Biotechnology,Vol.6,(1995),652-656)。本方法就需要有详细准确的CD147胞外区的三维结构信息。
利用联结片段进行药物设计也需要有靶受体精确的三维结构信息。本法是为测定靶分子的多个配体的结合位点,然后构建分子支架与配体连接。因此,连接配体形成潜在的导向复合物,然后,利用iterative technique方法使之得以确定。因此,利用此种方法也可设计出CD147的抑制物。
以上所述的基于结构的药物设计方法均需要首先确定能与靶生物分子相互作用的物质。有时,此种物质是可从文献中获得。然而,大多数针对靶分子的抑制物是未知的,或是希望得到新的针对靶分子的抑制物。此时,首先要在数据库中进行筛选(如the Cambridge Structural Database)能与靶分子的活性位点或位点相互作用的化合物。在靶分子结构未知的情况下,筛选标准通常为药物代谢动力学特性,如代谢稳定性和毒性等。然而,CD147胞外区结构的确定,就可通过该分子活性位点的结构和特性进行筛选。筛选标准可为:潜在的抑制剂能否与CD147胞外区形成三维的药效结构。
本发明的一个实施方案是利用计算机辅助三维模建、分子对接技术选择及确定CD147胞外区抗体、配体及其它相互作用分子的方法,其中包括:(1)提供一种蛋白质结构,包括本发明的一种CD147胞外区三维结构或模型;并利用计算机三维模建预测可能性抗体、配体及其它作用分子的三维结构;(2)CD147胞外区三维结构和抗体、配体及其它相互作用分子三维结构的对接;(3)评估抗体、配体及其它作用分子的三维结构是否能与CD147胞外区活性位点的三维结构结合;进一步分析包括(4)CD147胞外区抗体、配体及其它作用分子与CD147生物学活性分析;(5)是否CD147胞外区抗体、配体及其它作用分子可以调节CD147的生物学功能。
本发明的另一个实施方案是基于结构的药物设计计算机辅助方法,其中包括:(1)提供一种蛋白质结构,包括本发明的一种CD147胞外区三维结构或模型;(2)用三维结构或模型设计一种抗体、肽类、蛋白物质或化合物;(3)合成该抗体、肽类、蛋白物质或化合物。
本发明的配体、相互作用分子或抑制性抗体、肽、蛋白、化学分子可通过本领域技术人员所知的各种方法鉴定。如将配体、相互作用分子或抗体、肽、蛋白、化学分子与CD147胞外区蛋白结合,或相互作用,可以在溶液中或细胞上的CD147蛋白进行确定,如免疫分析如酶联免疫吸附分析(ELISA)和放射性免疫分析(RIA)或结合分析如Biacore,酵母双杂交,噬菌体肽库或抗体库技术进行筛选、鉴定。
用下列实例更详细的描述本发明。提供这些实例是为了说明本发明,而不是为了限制本发明
实施例一、CD147胞外区晶体的生成及晶体结构的解析
1、将CD147胞外区基因序列克隆至pET21a(+)原核表达系统中,经表达,纯化出CD147胞外区。
2、所述的CD147胞外区具有如SEQ ID NO:1的序列。
3、CD147胞外区的结晶
4、晶体结构的解析
结构的解析采用单波长反常散射法SAD(single wavelength anomalousdispersion)。在同步辐射光源(Photon Factory,Japan)NW12光束线上收集天然蛋白晶体的衍射数据(2.8分辨率)和硒代蛋白晶体衍射数据(3.1分辨率)各一套并用HKL2000软件包处理。首先用硒代蛋白晶体数据获得相位信息和初始结构模型,再用天然蛋白晶体的衍射数据进行结构确定和精修。晶体的空间群(space group)属于P41212,在一个不对称单元有四个分子,晶胞参数a=126.481,b=126.481,c=169.926,α=90°,β=90°,γ=90°。
实施步骤:
1、CD147胞外区的制备及纯化
1)载体:pET21a(+),NdeI/XhoI cloning sites
2)宿主细胞:OrigamiB(DE3)
3)表达:1mM IPTG,20℃,overnight
纯化
1)HiTrap Q Hp,20mM Tris pH8.0 w/wo 1M NaCl
2)Mono Q HR 10/10,20mM Tris pH8.0 w/wo 1M NaCl
3)HiLoadTM 16/60Superdex 75prep grade,20mM Tris pH8.0,150mMNaCl
2、蛋白结晶
悬滴扩散法(hanging-drop vapor diffusion procedure)
1)蛋白浓度:5-20mg/ml
2)池液:0.5M硫酸胺溶液,0.1M柠檬酸钠溶液,1.0M硫酸锂溶液,pH5.6。
3)生长周期:3~4周,4℃。
3、结构测定
X-Ray衍射和数据收集
结构的解析采用单波长反常散射法SAD(single wavelength anomalousdispersion)。在同步辐射光源(Photon Factory,Japan)NW12光束线上收集天然蛋白晶体的衍射数据(2.8分辨率)和硒代蛋白晶体衍射数据(3.1分辨率)各一套并用HKL2000软件包处理。首先用硒代蛋白晶体数据获得相位信息和初始结构模型,再用天然蛋白晶体的衍射数据进行结构确定和精修(如表1和图1所示)。
表1CD147胞外区晶体衍射数据结果
蛋白晶体 | 硒代蛋白晶体 | |
Data collectionSpace groupCell dimensionsa,b,c(7)α,β,γ(°)Resolution()Rsym or Rmerge bI/σICompleteness(%)RedundancyRefinementResolution()No.reflectionsRwork/Rfree cNo.atomsProteinB-factorsMain chainsSide chainsR.m.s deviationsBond lengths()Bond angles(°)Ramachandran statistics | P41212126.481,126.481,169.92690,90,9050-2.80(2.90-2.80)a0.106(0.586)18.4(2.2)99.4(100)7.3(7.4)50-2.8326130.255/0.2965527552730.60329.27932.0490.0101.397 | P41212125.141,125.141,169.66090,90,9050-3.10(3.21-3.10)0.114(0.697)38.1(5.8)99.7(100%)28.5(29.6) |
Most favoured regions(%)Additionally allowed regions(%)Generously allowed regions(%)Disallowed regions(%) | 82.715.21.80.3 |
aNumbers in parentheses refer to the highest resolution shell.
bRsym(Rmerge)=∑hkl∑i|Ii(hkl)i-<I(hkl)>|/∑hkl∑iIi(hkl)
cR=∑||Fo|-|Fc||/∑|Fo|
附图1中A图描述CD147胞外区空间群,表示一个不对称单结构域,其中有四个分子,用A、D、C、D四条链表示,每个分子或说每条链又包含两个Ig样结构域。第二张图是放大显示其中一条链,同时标明两个不同类型的Ig样结构域中两个β片层的组成(分别由不同数量和走向的β片层组成)。
实施例二、CD147胞外区与抗体HAb18模建对接及CD147胞外区活性位点测定
1、、所述的CD147胞外区与其抗体复合物的结构具有以下特点:CD147胞外区与HAb18分子对接模型中含有3条肽链、即CD147胞外区和HAb18轻、重链可变区;6176个原子,形成6635个共价键;对接能量评估为:bindingenergy=101.21、docking energy=29.05、intermolecular energy=30.54、trosional energy=70.67、internal energy=-1.49。
2、所述的CD147胞外区的活性结构位点具有以下特点:CD147胞外区的活性位点位于该蛋白N端C2-set结构域远膜环区,参与表位的氨基酸残基为:28Glu、30Thr、44Asp、45Ala、46Leu、47Pro、48Gly、50Lys、52Glu。
实施步骤:
1通过WAM(Web Antibody Modeling)对HAb18进行同源模建,procheckV3.4检查G-factors Overall值为-0.21,利用DeepView/Swiss-pdbViewerV3.7,对HAb18同源模建结果进行Energy Minisation及Compute Energy(GROMOS96 43B1 parameters set)分析,确定其总能量为-5888.806KJ/mol。
2使用DeepView/Swiss-pdbViewer V3.7对HAb18和CD147复合物空间结构进行修正,加入极性和非极性氢原子、纠正原子电荷数。
3利用AutoDock V3.0.5对接HAb18和CD147胞外段,确定大致分子对接的方向,在此基础上提高精度、进行精细对接试验,确定能量评估最合理的对接模型(如图2所示)。对结果用DeepView/Swiss-pdbViewer V3.7进行Energy Minisation及Compute Energy(GROMOS96 43B1 parameters set)分析,确定HAb18和CD147胞外段复合体总能量为-15383.64KJ/mol。
4使用STING MILLENNIUM的IFR Contact分析对接模型,确定相互作用氨基酸残基位点(如图3所示)。
序列表
<110>陈志南
<120>CD147胞外区晶体结构及应用
<160>1
<210>1
<211>184
<212>protein
<213>人
<220>
<221>extracellular portion domain
<222>(1)...(184)
<400>1
Ala Ala Gly Thr Val Phe Thr Thr Val Glu Asp Leu Gly Ser Lys
1 5 10 15
Ile Leu Leu Thr Cys Ser Leu Asn Asp Ser Ala Thr Glu Val Thr
20 25 30
Gly His Arg Trp Leu Lys Gly Gly Val Val Leu Lys Glu Asp Ala
35 40 45
Leu Pro Gly Gln Lys Thr Glu Phe Lys Val Asp Ser Asp Asp Gln
50 55 60
Trp Gly Glu Tyr Ser Cys Val Glu Leu Pro Glu Pro Met Gly Thr
65 70 75
Ala Asn Ile Gln Leu His Gly Pro Pro Arg Val Lys Ala Val Lys
80 85 90
Ser Ser Glu His Ile Asn Glu Gly Glu Thr Ala Met Leu Val Cys
95 100 105
Lys Ser Glu Ser Val Pro Pro Val Ile Asp Trp Ala Trp Tyr Lys
110 115 120
Ile Thr Asp Ser Glu Asp Lys Ala Leu Met Asn Gly Ser Glu Ser
125 130 135
Arg Phe Phe Val Ser Ser Ser Gln Gly Arg Ser Glu Leu His Ile
140 145 150
Glu Asn Leu Asn Met Glu Ala Asp Pro Gly Gln Tyr Arg Cys Asn
155 160 165
Gly Thr Ser Ser Lys Gly Ser Asp Gln Ala Ile Ile Thr Leu Arg
170 175 180
Val Arg Thr His
184
Claims (25)
1.一种CD147(HAb18G/CD147、Basigin、EMMPRIN、M6、Neurothelin)胞外区的晶体及模型,其特征在于,该晶体具有正方晶系中的空间群P41212和SEQ ID NO:1中列出的氨基酸序列;所述模型具有符合表1的三维结构。
2.如权利要求1所述的CD147胞外区结晶,其特征在于,该结晶具有四方体形的晶胞,具有晶格常数:a=126.481±0.5%,b=126.481±0.5%,c=169.926±0.5%,α=β=γ=90°,在一个不对称单元有四个分子,一个分子的分子量约20±0.5kD,溶剂含量约70±1%。
3.如权利要求1,CD147胞外区晶体的三维空间结构特点:CD147胞外区晶体结构揭示其胞外区由两个Ig样结构域,其中N末端的结构域为IgC2-set,而靠近胞膜的C端结构域属于Ig I-set。
4.权利要求1所述,CD147胞外区序列来源于人。
5.权利要求1所述,CD147胞外区晶体中CD147胞外区包含序列SEQ IDNO:1,或其同系物、片段、变异体、类似物及其衍生物。
6.CD147胞外区与抗CD147抗体HAb18、整合素、配体及其它相互作用分子复合物的晶体。
7.如权利要求6,CD147胞外区与抗CD147抗体HAb18、整合素、配体及其它相互作用分子复合物的晶体中CD147胞外区符合权利要求1~5任意一项。
8.一种利用计算机分子模建对接测定CD147胞外区与抗CD147抗体HAb18接合的复合物,其具有以下特点:CD147胞外区与HAb18单抗对接模型中含有3条肽链、即CD147胞外区和HAb18VL、VH;6176个原子,形成6635个共价键;对接能量评估为:binding energy=101.21、dockingenergy=29.05、intermolecular energy=30.54、trosional energy=70.67、internal energy=-1.49。
9.测定如权利要求1~5所述的CD147胞外区晶体或如权利要求6所述的CD147胞外区与CD147分子配体复合物的晶体的三维空间结构,其中CD147胞外区为:(1)全长野生型CD147胞外区或突变体、片段、衍生物、变异体、类似物或同源物;或(2)野生型CD147胞外区的突变体、片段、衍生物、变异体、类似物或同源物。
10.如权利要求9所述,用(1)全长野生型CD147胞外区或突变体、片段、衍生物、变异体、类似物或同源物;或(2)野生型CD147胞外区的突变体、片段、衍生物、变异体、类似物或同源物的三维结构通过计算机模建方法或其它方法评估CD147胞外区的抗体、配体或相互作用分子与CD147胞外区结合的活性位点。
11.如权利要求10所述,CD147胞外区的活性位点位于该蛋白N端C2-set结构域远膜环区,参与表位的氨基酸残基为:Glu28、Thr30、Asp44、Ala45、Leu46、Pro47、Gly48、Lys50、Glu52。
12.鉴别能与CD147胞外区结合的物质的方法,包括用CD147晶体浸泡可能的小分子化合物并共结晶、以及采用测定分子间相互作用的方法,如Biacore,酵母双杂交,噬菌体肽库或抗体库筛选可能的配体或拮抗剂及通过计算机模建方法利用CD147晶体结构与可能的配体进行三维结构比对、设计、对接。
13.一种利用计算机辅助三维模建、分子对接技术选择及确定CD147胞外区抗体、配体及其它相互作用分子的方法,如下:(1)如权利要求9、10所述通过计算机三维模建CD147胞外区及可能性抗体、配体及其它作用分子的三维结构;(2)CD147胞外区三维结构和抗体、配体及其它相互作用分子三维结构的对接;(3)评估抗体、配体及其它作用分子的三维结构是否能与CD147胞外区活性位点的三维结构结合。
14.如权利要求13所述,进一步分析包括以下内容:(1)CD147胞外区抗体、配体及其它作用分子与CD147生物学活性分析;(2)是否CD147胞外区抗体、配体及其它作用分子可以调节CD147的生物学功能。
15.如权利要求14,基于CD147胞外区晶体结构设计、研发的抗体、配体及其它作用分子作为试剂、拮抗物或药物。
16.一种基于结构的生物活性物质的药物设计的计算机辅助方法,该方法包括:
a.提供一种CD147胞外区蛋白模型,其中所述模型表现为一种基本符合权利要求1的三维结构;
b.用所述模型设计一种抗体、肽类物质、蛋白类物质、小分子物质等;
c.合成所述的抗体、肽类物质、蛋白类物质、小分子物质等。
17.权利要求16的方法,其中所述方法进一步包括:评估述的合成的抗体、肽类物质、蛋白类物质、小分子物质等的生物活性。
18.权利要求16的方法,其中所述的设计步骤包括计算机筛选一个或多个化学化合物数据库,其中所述化合物的三维结构是已知的。
19.权利要求18的方法,该方法进一步包括让所述筛选步骤鉴定出的化合物与所述计算机模型相互作用。
20.权利要求16的方法,其中所述的设计步骤包括定向药物或随机药物设计。
21.权利要求16的方法,其中所述的设计步骤包括筛选出那些被预测为能够结合所述CD147胞外区三维结构的化合物。
22.权利要求16的方法,其中所述的生物活性指:与所述CD147蛋白的结合,抑制或刺激所述CD147蛋白活性。
23.用权利要求1所述的CD147胞外区晶体结构或权利要求6所述的CD147胞外区与其抗体、配体及其它作用分子复合物晶体结构来拟合CD147胞外区突变体、衍生物、片段、变异体、类似物、同源物或CD147胞外区相关蛋白复合物的晶体结构。
24.用权利要求1所述的CD147胞外区晶体结构或权利要求6所述的CD147胞外区与其抗体、配体及其它作用分子复合物晶体结构的原子座标模建与CD147胞外区结合的相关蛋白的模型。
25.权利要求1的模型,基中所述的结晶CD147蛋白由下列方法制备:将CD147胞外区基因序列克隆至pET21a(+)原核表达系统,表达,纯化出CD147胞外区;提供5-20mg/ml的CD147胞外区溶液,提供含有0.5M硫酸胺溶液,0.1M柠檬酸钠溶液和1.0M硫酸锂溶液的池液,pH5.6;混合CD147胞外区溶液和池液;让得到的混合物溶液放置一段预定的时间,直到CD147胞外区晶体在溶液中长到预定的大小或更大。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200710018514XA CN101139391B (zh) | 2007-08-21 | 2007-08-21 | Cd147胞外区晶体结构及应用 |
US12/674,150 US8338573B2 (en) | 2007-08-21 | 2007-10-24 | Crystal structure of CD147 extracellular region and use thereof |
EP07816647.7A EP2194065B1 (en) | 2007-08-21 | 2007-10-24 | Crystal structure of cd147 extracellular region and use thereof |
PCT/CN2007/003034 WO2009023995A1 (en) | 2007-08-21 | 2007-10-24 | Crystal structure of cd147 extracellular region and use thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200710018514XA CN101139391B (zh) | 2007-08-21 | 2007-08-21 | Cd147胞外区晶体结构及应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101139391A true CN101139391A (zh) | 2008-03-12 |
CN101139391B CN101139391B (zh) | 2012-07-25 |
Family
ID=39191512
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200710018514XA Active CN101139391B (zh) | 2007-08-21 | 2007-08-21 | Cd147胞外区晶体结构及应用 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8338573B2 (zh) |
EP (1) | EP2194065B1 (zh) |
CN (1) | CN101139391B (zh) |
WO (1) | WO2009023995A1 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2334330A2 (en) * | 2008-09-29 | 2011-06-22 | Centocor Ortho Biotech Inc. | Anti-cd147 antibodies, methods, and uses |
CN103204939A (zh) * | 2013-01-05 | 2013-07-17 | 陈志南 | CD147-HAb18MAb复合物晶体结构及应用 |
CN103204940A (zh) * | 2013-01-05 | 2013-07-17 | 陈志南 | CD147-5A12MAb复合物晶体结构及应用 |
CN103797368A (zh) * | 2011-06-30 | 2014-05-14 | 新加坡国立大学 | 胎儿有核红细胞的检测 |
CN109254154A (zh) * | 2018-09-13 | 2019-01-22 | 广东工业大学 | 人cd147的用途 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2833900B1 (en) | 2012-04-01 | 2018-09-19 | Technion Research & Development Foundation Limited | Extracellular matrix metalloproteinase inducer (emmprin) peptides and binding antibodies |
WO2015002860A1 (en) * | 2013-07-02 | 2015-01-08 | Epigenetx, Llc | Structure-based modeling and target-selectivity prediction |
CN111420048B (zh) * | 2020-03-11 | 2023-09-19 | 中国人民解放军第四军医大学 | 抗basigin人源化抗体用于制备治疗新型冠状病毒肺炎药物的应用 |
CN114609392A (zh) * | 2022-03-08 | 2022-06-10 | 武汉科技大学 | 一种hiv全人源广谱中和抗体筛选方法及其应用 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004509069A (ja) * | 2000-05-19 | 2004-03-25 | ジェネティックス・インスチチュート・リミテッド・ライアビリティ・カンパニー | P−セレクチン、p−およびe−セレクチン複合体の結晶構造、ならびにそれらの用途 |
ATE439378T1 (de) * | 2001-02-09 | 2009-08-15 | Genentech Inc | Verfahren zur identifizierung von indirekten igf- 1-agonisten |
CN1186445C (zh) | 2002-03-15 | 2005-01-26 | 陈志南 | 抗人肝癌单克隆抗体HAb18轻、重链可变区基因及其应用 |
GB0230177D0 (en) * | 2002-12-24 | 2003-02-05 | Karobio Ab | LXR beta crystal |
CN1749268A (zh) * | 2005-10-20 | 2006-03-22 | 陈志南 | 系列单抗作用的HAb18G/CD147功能表位氨基酸序列及其应用 |
-
2007
- 2007-08-21 CN CN200710018514XA patent/CN101139391B/zh active Active
- 2007-10-24 WO PCT/CN2007/003034 patent/WO2009023995A1/zh active Application Filing
- 2007-10-24 US US12/674,150 patent/US8338573B2/en active Active
- 2007-10-24 EP EP07816647.7A patent/EP2194065B1/en active Active
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2334330A2 (en) * | 2008-09-29 | 2011-06-22 | Centocor Ortho Biotech Inc. | Anti-cd147 antibodies, methods, and uses |
WO2010036460A3 (en) * | 2008-09-29 | 2012-07-05 | Centocor Ortho Biotech Inc. | Anti-cd147 antibodies, methods, and uses |
EP2334330A4 (en) * | 2008-09-29 | 2013-05-15 | Janssen Biotech Inc | ANTI-CD147 ANTIBODIES, METHODS, AND USES |
US8618264B2 (en) | 2008-09-29 | 2013-12-31 | Centocor Ortho Biotech Inc. | Anti-CD147 antibodies, methods and uses |
AU2009296937B2 (en) * | 2008-09-29 | 2015-02-12 | Centocor Ortho Biotech Inc. | Anti-CD147 antibodies, methods, and uses |
CN103797368A (zh) * | 2011-06-30 | 2014-05-14 | 新加坡国立大学 | 胎儿有核红细胞的检测 |
CN103204939A (zh) * | 2013-01-05 | 2013-07-17 | 陈志南 | CD147-HAb18MAb复合物晶体结构及应用 |
CN103204940A (zh) * | 2013-01-05 | 2013-07-17 | 陈志南 | CD147-5A12MAb复合物晶体结构及应用 |
CN103204940B (zh) * | 2013-01-05 | 2015-04-08 | 陈志南 | CD147-5A12MAb复合物晶体结构及应用 |
CN109254154A (zh) * | 2018-09-13 | 2019-01-22 | 广东工业大学 | 人cd147的用途 |
Also Published As
Publication number | Publication date |
---|---|
US8338573B2 (en) | 2012-12-25 |
WO2009023995A1 (en) | 2009-02-26 |
CN101139391B (zh) | 2012-07-25 |
EP2194065B1 (en) | 2014-05-07 |
US20100248974A1 (en) | 2010-09-30 |
EP2194065A1 (en) | 2010-06-09 |
EP2194065A4 (en) | 2010-09-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101139391B (zh) | Cd147胞外区晶体结构及应用 | |
Ghai et al. | C1q and its growing family | |
Chang et al. | Structure and functional properties of Norrin mimic Wnt for signalling with Frizzled4, Lrp5/6, and proteoglycan | |
US6820011B2 (en) | Three-dimensional structure of complement receptor type 2 and uses thereof | |
Muller et al. | The crystal structure of the extracellular domain of human tissue factor refined to 1.7 Å resolution | |
Itou et al. | The crystal structure of human MRP14 (S100A9), a Ca2+-dependent regulator protein in inflammatory process | |
Blanchard et al. | Structure of a calpain Ca2+-binding domain reveals a novel EF-hand and Ca2+-induced conformational changes | |
Gaboriaud et al. | The crystal structure of the globular head of complement protein C1q provides a basis for its versatile recognition properties | |
Chang et al. | Crystal structure of interleukin-19 defines a new subfamily of helical cytokines | |
Lu et al. | Crystal structure of human epidermal growth factor and its dimerization | |
US7693698B2 (en) | Method for identifying or designing a candidate agent that interacts with LINGO-1 polypeptide using a LINGO-1 three-dimensional structure | |
de Moura et al. | Crystal structure of a soluble decoy receptor IL-22BP bound to interleukin-22 | |
US7514240B2 (en) | EGR-EGFR complex | |
JP2005531485A (ja) | Rankリガンドの結晶形態および変異体 | |
CN103204939A (zh) | CD147-HAb18MAb复合物晶体结构及应用 | |
CN103204940B (zh) | CD147-5A12MAb复合物晶体结构及应用 | |
US20180141994A1 (en) | Toll-like receptor 2 binding epitope and binding member thereto | |
EP1301536B1 (en) | Modulation of tetraspanin function | |
McKinstry et al. | Structural basis for antibody discrimination between two hormones that recognize the parathyroid hormone receptor | |
US20030050223A1 (en) | Crystal forms and mutants of RANK ligand | |
US20060234293A1 (en) | Polypeptide methods and means | |
Kim et al. | The design for therapeutic agents of Leucine Rich Repeat protein using bioinformatics | |
US8084577B2 (en) | Crystal of human glycoprotein VI collagen binding domain | |
KR101467634B1 (ko) | 스네일 및 임포틴베타 단백질 복합체 3차원 결정구조 및 결정화 방법 | |
CA2300370A1 (en) | Crystal of sm3 antibody (fragment) and recognizing epitope, its preparation, encoded data storage medium containing its coordinates and its diagnostical or medical use |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20160204 Address after: 710032 Changle West Road, Shaanxi, China, No. 169, No. Patentee after: The Fourth Military Medical University of the Chinese People's Liberation Army Address before: 710032 research center of cell engineering, The Fourth Military Medical University, 17 West Changle Road, Xi'an, Shaanxi Patentee before: Chen Zhinan |