CN101139391A

CN101139391A - Cd147胞外区晶体结构及应用

Info

Publication number: CN101139391A
Application number: CNA200710018514XA
Authority: CN
Inventors: 陈志南; 余晓玲; 朱平; 杨滨; 杨向民; 张征
Original assignee: Individual
Current assignee: Fourth Military Medical University FMMU
Priority date: 2007-08-21
Filing date: 2007-08-21
Publication date: 2008-03-12
Anticipated expiration: 2027-08-21
Also published as: US8338573B2; WO2009023995A1; CN101139391B; EP2194065B1; US20100248974A1; EP2194065A1; EP2194065A4

Abstract

本发明公开了CD147胞外区的晶体、三维结构以及由CD147胞外区结构得到的结构和模型。本发明还包括制备所述晶体、晶体结构和模型的方法。本发明还包括计算机模建、分子对接的方法确定CD147胞外区活性位点的方法及相应的活性位点。另外还公开了所述晶体、晶体结构和模型的用途，包括基于结构的药物设计和抗体、配体及相互作用分子的筛选和鉴定。

Description

CD147胞外区晶体结构及应用

技术领域

本发明涉及一种CD147胞外区的晶体，还涉及用结晶通过X射线衍射确定的立体结构及其用途，更具体的，涉及利用其立体结构通过计算机分子模建方法确定其与相应抗体HAb18、配体和相互作用分子复合物的三维结构和活性作用位点，以及利用计算机分子模建的方法识别能与CD147胞外区结合的蛋白、肽类物质和化学物质，包括抑制物的鉴别。还涉及鉴别CD147抑制物及其医用价值。

背景技术

CD147是一种广泛表达的细胞跨膜糖蛋白，具有广泛的生理学及病理学意义。其最主要的功能是诱导细胞外基质金属蛋白酶(EMMPRIN)的分泌、与cypA相互作用，介导炎症发生、易化病毒入侵宿主细胞等。与胚胎发育、肿瘤侵袭、转移，炎症发生、发展，病毒感染扩增等密切相关。

CD147分子广泛表达于造血及非造血细胞系，如造血细胞、上皮细胞、内皮细胞和淋巴细胞。分子量为50-60Kd的跨膜糖蛋白。HAb18G/CD147是CD147家族新成员，是一种新的肝癌相关膜抗原，为一高度糖基化的跨膜蛋白分子。利用我室制备、纯化的肝癌单抗HAb18筛选人肝癌细胞cDNA文库，克隆出其相应抗原HAb18G的cDNA片段(长度约1.6kb)。查询GenBank，发现HAb18G cDNA序列与人CD147分子碱基序列高度同源，进一步分析开放读框，表明两者由相同基因编码。在此基础上，本研究中心又从蛋白水平的不同角度证实了这两种分子的一致性。进一步研究发现，CD147是一个肿瘤细胞表面的基质金属蛋白酶诱导因子，可通过成纤维细胞刺激合成基质金属蛋白酶(Marix Metalloproteinases，MMPs)。并推测HAb18G/CD147具有CD147分子中EMMPRI N的功能。在以前的研究中，我们通过荷瘤鼠模型证明不同剂量的碘[¹³¹I]美妥昔单抗注射液有不同的抑瘤效果，中、高组剂量的肿瘤抑制率均和阴性对照组有显著性差异；随后将该单抗标记同位素¹³¹I制成碘[¹³¹I]美妥昔单抗注射液(LICARTIN)治疗原发性肝癌安全、有效。另一个临床研究表明LICARTIN可作为肝癌肝移植后的抗复发药物。随访1年后，治疗组与对照组相比的肝移植术后患者的肝癌复发率下降、生存率提高。以上研究表明，CD147分子是一个治疗肝癌等肿瘤药物的新靶点。

我们用HAb18G/CD147抗体进行广泛的组织谱鉴定，表明该分子高表达于上皮来源的癌组织(69.47％)，良性瘤不表达，胚胎组织及正常组织低表达(分别为2.67％，10.62％)。是一个广谱的癌型特异性的肿瘤标志物。

人CD147是由269个氨基酸组成的蛋白质，属于I型跨膜蛋白家族，分子量估计最大为～28KD。从克隆的cDNA序列可知CD147分子的mRNA长度大约1.7Kb，在转录起始位点的相关区域未发现TATA或CAAT盒，但发现转录起始位点位于CpG岛中，尤其在-247-+6核苷酸处较多。N端起始码之前有约115个核苷酸为非编码区，编码区编码269个氨基酸，21个氨基酸为信号肽，中间185个氨基酸构成胞外结构域，从206-229共24个氨基酸为穿膜区，C端39个氨基酸为胞内结构域。胞外4个半胱氨酸形成2个二硫键构成IgSF典型的半球型结构域(C⁴¹，C⁸⁷，C¹²⁶，C¹⁸⁵)。此外，胞膜外区还有三个相似的N-糖基化天冬酰氨序列，糖基化作用决定了CD147分子刺激MMP的活性，纯化的去糖基化CD147分子不能诱导MMP的活性且具有拮抗其天然分子的活性的特点，用Endo-F糖苷酶消化可使CD147分子量减少大约30KD，表明CD147分子的糖基化主要以N-连接的寡聚糖方式存在。

穿膜区的24个氨基酸残基在人、鼠、鸡中CD147分子中高度保守，提示CD147分子的跨膜片段扮演着重要的功能角色，在不同种属中体现出功能的相似性。在穿膜区的中间部位存在有带电荷的谷氨酸残基，这在其它的膜蛋白分子中是不常见的，揭示CD147分子可以与其它的跨膜蛋白相互联系。穿膜区包括3个亮氨酸残基(L²⁰⁶、L²¹³、L²²⁰)和1个苯丙氨酸残基(F²²⁷)，且第隔7个氨基酸残基出现一次，为典型的亮氨酸拉链结构。穿膜区的带电残基及亮氨酸拉链结构是一个潜在的蛋白相互作用基序，很可能介导CD147分子参与形成信号转导多肽链或膜转运蛋白成份。

对胞浆结构域的研究，目前尚无全面的分析，Schlosshauer-B等曾用双标记实验检测到CD147与F-肌动蛋白(actin)共同存在，发现膜表面CD147的表达与细胞骨架中微丝蛋白有关。而是否有磷酸化位点，如何传递信号等功能尚为未知。

CD147基因由8个外显子编码，总长度10.8Kb。其核苷酸及蛋白质序列如图4所示：

Exon1(aa 1～23，107bp)与Exon2(aa 2～75，154bp)被Intron1(约6.5Kb)隔开，该内含子是EMMPRIN基因中最大的内含子序列。Intron2大约700bp，是基因中第二大干扰序列。Exon3(aa 76～102，83bp)与Exon4(aa103～148，138bp)被300bp的Intron3所分隔开。Intron4大约650bp；Exon5(aa 149～240，276bp)；Intron5约550bp；Exon6(aa 241～249，25bp)非常短；Intron6约250bp；Exon7(aa 250～269，69bp)；Intron7约300bp，最后一个外显子是Exon8，为736bp。Exon1编码5’非翻译区(5’-UTR)和信号肽。Exon2和Exon3编码第一个Ig1结构域：Exon2编码52个密码子，约占Ig1的66％，Exon3编码27个密码子，约占Ig的34％。Exon4和Exon5编码第二个Ig结构域：Exon4编码46个密码子，约为45％，Exon5是“结合”外显子，编码剩余55％的Ig结构域，以及跨膜结构域的24氨基酸残基和一小部分胞内结构域。Exon6和7编码胞内结构域，Exon7也编码终止密码子和3’-UTR的5个核苷酸残基。Exon8编码剩余的3’-UTR。

CD147分子是一个潜在的粘附分子，CD147与N-CAM、I-CAM及其他相关IgSF亚群分子在功能上有相似的特性，参与细胞与细胞、细胞与基质的粘附。已有实验证明CD147分子可与Integrin家族α3β1、α6β1形成蛋白复合物，但关于复合物的功能目前还不清楚，可能与肿瘤细胞与细胞外基质及肿瘤细胞与间质细胞之间的粘附有关；另有实验表明：某些CD147单抗可抑制雌激素依赖的乳腺癌细胞系MCF-7及MDA-435的同型聚集，以及MCF-7细胞对IV型胶原、FN、LN的粘附。CD147分子是一个新的细胞表面粘附分子，介导细胞粘附作用。这类分子的表达及在肿瘤中的作用是目前肿瘤研究的一个重点。

蛋白质的生物学功能在很大程度上取决于其空间结构，蛋白质结构构象多样性导致了不同的生物学功能。蛋白质结构与功能关系研究是进行蛋白质功能预测及蛋白质设计的基础。蛋白质分子只有处于它自己特定的三维空间结构情况下，才能获得它特定的生物活性；三维空间结构稍有破坏，就很可能会导致蛋白质生物活性的降低甚至丧失。因为它们的特定的结构允许它们结合特定的配体分子，例如，血红蛋白和肌红蛋白与氧的结合、酶和它的底物分子、激素与受体、以及抗体与抗原等。知道了基因密码，科学家们可以推演出组成某种蛋白质的氨基酸序列，却无法绘制蛋白质空间结构。随着近年来在结构生物学方面的进展，用X射线衍射或NMR分析，使用立体结构和分子设计技术，已揭示了许多蛋白质的立体结构。对于蛋白质空间结构的了解，将有助于对蛋白质功能的确定。同时，蛋白质是药物作用的靶标，联合运用基因密码知识和蛋白质结构信息，药物设计者可以设计出小分子化合物，抑制与疾病相关的蛋白质，进而达到治疗疾病的目的。

CD147蛋白结构的阐明，在为疾病的治疗或诊断试剂的设计中具有重要作用。在本发明之前，CD147的结构及由CD147促进肿瘤进展、调节肿瘤细胞浸润转移、介导炎症发生、易化病毒入侵宿主细胞等的机制并不十分明确。因此，尽管有关于CD147的一般功能与作用的知识，但是为治疗或诊断疾病(例如肝癌)而进行的试剂开发则因为缺乏蛋白的的结构信息而受到限制。

因此，有必要阐明CD147分子的三维结构和建立其模型，有助确定CD147分子与整合素、CyPA等作用分子相互作用的活性位点，以便利用结构和模型来辅助疾病治疗策略，譬如基于结构的药物设计。

本文所用的术语“蛋白质的立体结构”指某些条件下蛋白质氨基酸序列确定的蛋白质的三维结构，即具有氨基酸序列的蛋白质在某些条件下折叠而成的三维结构。可用X射线衍射的方法或NMR确定蛋白质的结构。

发明内容

本发明涉及在正方晶系中具有空间群P4₁2₁2和SEQ ID NO：1中列出的氨基酸序列的CD147胞外区结晶的三维结构，以及从CD147胞外区结构所得到的CD147胞外区与其抗体HAb18复合物的结构模型及活性作用位点，以及这些结构、模型、活性作用位点的应用。众所周知，在蛋白质晶体学领域中，要获得有足够质量的晶体用于确定蛋白质的结构是不很容易的。而且，在本发明以前，关于为解析CD147胞外区的三维结构而所需的足够质量的晶体一直未能得到。因此，在本发明以前，CD147胞外区的三维结构也无法确定，也不可能了解到CD147胞外区的活性作用位点的信息。本发明者是第一个阐明其三维结构及活性作用位点，并为针对CD147的药物设计提供三维模型。

相应地，本发明的一个目的是，为确定CD147胞外区的三维结构提供足够质量的晶体。本发明也包括培养CD147胞外区晶体的方法。

本发明的第二个目的是提供了关于CD147胞外区蛋白的三维结构、模型的信息。

关于CD147胞外区蛋白的三维结构的知识为设计和生产在动物体内(包括人)调节肿瘤发生、发展及抑制肿瘤转移等方面的抗体、肽类物质、蛋白物质、小分子物质(包括化学物质)提供了一种方式(即基于结构的药物设计)。譬如，通过各种计算机软件和模型，可以设计上述物质来抑制CD147分子的生物学活性，从而达到抑制肿瘤进展、炎症发生、病毒入侵宿主细胞等。

相应地，本发明的第三个目的是提供一种方法，其利用所获得的CD147胞外区蛋白的三维结构信息，结合计算机模建抗CD147分子的单克隆抗体HAb18的结构，利用计算机模拟、分子对接等手段确定CD147分子胞外区的一个活性位点，及由该活性位点的氨基酸序列、结构等来设计用于治疗和诊断疾病的试剂。

相应地，本发明的第四个目的是提供利用CD147胞外区蛋白的三维结构来设计、产生能与CD147胞外区结合并抑制或刺激CD147生物学活性的抗体、蛋白物质、肽类物质或小分子物质(化学物质)等。该抑制性或刺激性物质由以下几点的方法确定：(a)提供CD147胞外区的三维结构，(b)使用该结构设计抗体、蛋白物质、肽类物质或小分子物质(化学物质)等，(c)合成该种物质；及(d)评估合成的所述物质改变CD147介导的胚胎发育、肿瘤侵袭、转移，炎症发生、发展，病毒感染扩增等。

附图说明

图1为CD147胞外区晶体结构示意图。

图2为CD147与单抗HAb18复合物示意图。

图3为CD147活性结合位点示意图。

图4为CD147基因的外显子/内含子结构示意图。

具体实施方式

本发明涉及如下内容：CD147胞外区的晶体、三维结构、这种三维结构的模型、从CD147胞外区结构所得到的CD147胞外区与其抗体HAb18复合物的结构模型及活性作用位点，以及一种基于使用这种结构的药物设计方法、由这些方法确认的抗体、蛋白物质、肽类物质、小分子物质、以及这些物质在治疗诊断中的应用、以及CD147胞外区结构、模型、活性作用位点的应用。需要说明的是，本文的术语如权利要求中所述的本发明中CD147胞外区晶体的氨基酸序列的“同系物”、“片段”、“变异体”、“类似物”、“衍生物”指从本发明所提供的已形成晶体CD147胞外区氨基酸序列中取代、变异、更改、替换、删除或增加一个或多个氨基酸残基后所形成的分子，或指从本发明所提供的已形成晶体CD147胞外区氨基酸序列选取一段序列后所形成的分子。

本发明中“变异体”指添加、删除或置换野生型CD147胞外区序列或CD147胞外区序列片段中的氨基酸残基。本发明CD147胞外区晶体的氨基酸序列的变异体可能包括(1)删除序列中任意一位或多位氨基酸残基，(2)用一个或多个氨基酸残基置换序列中任意一位或多位氨基酸残基。

本发明中“同系物”指氨基酸序列上的相似性，即将本发明中CD147胞外区晶体的氨基酸序列与其它氨基酸序列进行比对，如果二者氨基酸序列间有至少70％相同，则认为二者为同系物。比对方法可单凭肉眼，也可通过计算机软件如CLUSTAL等，进行同源性比对。

本发明中“片段”指本发明所提供的CD147胞外区晶体的氨基酸序列中的任意一段，并且此段可被结晶。

本发明中“类似物”指与本发明所提供的CD147胞外区晶体的氨基酸序列相似，且不会损害氨基酸结晶能力的氨基酸置换或删除。

本发明中“衍生物”指针对本发明所提供的CD147胞外区晶体的氨基酸序列进行化学修饰后所形成的氨基酸序列，如取代烷基、酰基或氨基上的氢等。

本发明所述的CD147胞外区晶体不仅指天然存在的CD147分子晶体或用野生型CD147通过结晶所成晶体，也包括野生型CD147分子的突变体所形成的与野生型CD147分子具有相同三维结构的晶体。野生型CD147分子的突变体可为：取代野生型CD147分子中至少一个氨基酸残基、加入/删除野生型CD147分子肽链中的氨基酸或在野生型CD147分子肽链的N末端或C末端填加/删除氨基酸。

在一个实施方案中，CD147胞外区结晶可具有正方体形式的晶胞，具有晶格常数：a＝126.481±0.5％，b＝126.481±0.5％，c＝169.926±0.5％，α＝β＝γ＝90°。，氨基酸序列是SEQID NO：1。另外，本发明提供了一种制备CD147胞外区结晶的方法，包括以下步骤：将CD147胞外区基因序列克隆至pET21a(+)原核表达系统，表达，纯化出CD147胞外区；提供5-20mg/ml的CD147胞外区溶液，提供含有0.5M硫酸胺溶液，0.1M柠檬酸钠溶液和1.0M硫酸锂溶液的池液，pH5.6；混合CD147胞外区溶液和池液；让得到的混合物溶液放置一段预定的时间，直到CD147胞外区晶体在溶液中长到预定的大小或更大。

在另一个实施方案中，利用X-射线衍射法确定CD147胞外区晶体的三维结构，具体方法如下：结构的解析采用单波长反常散射法SAD(singlewavelength anomalous dispersion)。在同步辐射光源(Photon Factory，Japan)NW12光束线上收集天然蛋白晶体的衍射数据(2.8分辨率)和硒代蛋白晶体衍射数据(3.1分辨率)各一套并用HKL2000软件包处理。首先用硒代蛋白晶体数据获得相位信息和初始结构模型，再用天然蛋白晶体的衍射数据进行结构确定和精修

一个基本上符合权利要求1的CD147胞外区的三维结构可利用合适的计算机建模程序如WAM(Web Antibody Modeling)来模拟计算。这种模拟计算需要使用一些信息，如：(1)CD147胞外区的氨基酸序列；(2)与具有三维结构的蛋白的相关部分的氨基酸序列；(3)特定三维结构的信息。与本发明CD147胞外区的三维结构基本上相符的其它类型的CD147胞外区(CD147胞外区的突变体、片段、衍生物、变异体、类似物或同源物)的三维结构也能够用分子替代的方法进行计算，详见下述。

表1中列出了一个合适的用于模拟或计算另一个CD147胞外区蛋白的三维结构的CD147胞外区蛋白的三维结构。根据本发明，本领域的技术人员可通过该三维结构模拟或计算出与本发明所述的CD147胞外区氨基酸序列相似的CD147胞外区突变体、片段、衍生物、变异体、类似物或同源物蛋白的三维结构。这些技术是基于从CD147胞外区晶体分析得到的信息。因此，晶体CD147胞外区三维结构的公开，使得可以使用本领域的一些常规技术来衍生CD147胞外区突变体、片段、衍生物、变异体、类似物或同源物的三维结构和模型。任何CD147胞外区突变体、片段、衍生物、变异体、类似物或同源物的结构的衍生甚至可以在没有关于其晶体结构数据的情况下得以实现。而且，当某种CD147胞外区突变体、片段、衍生物、变异体、类似物或同源物的晶体结构时，使用已有的从本发明CD147胞外区结构得到的信息，可以对新的CD147胞外区突变体、片段、衍生物、变异体、类似物或同源物的三维结构的模拟进行优化。本发明的一个优点是，在没有其它CD147胞外区突变体、片段、衍生物、变异体、类似物或同源物的晶体结构数据时，考虑该CD147胞外区突变体、片段、衍生物、变异体、类似物或同源物蛋白与本发明CD147胞外区氨基酸序列的差别，就可模拟该CD147胞外区突变体、片段、衍生物、变异体、类似物或同源物蛋白的三维结构。而且，本发明的新公开使得确定CD147胞外区与抗体、整合素、CyPA及其它相互作用分子的活性位点，以及基于结构的药物设计、药物筛选变得现实起来，这样设计、筛选出来的抗体、蛋白类物质、肽类物质或小分子物质(化合物)有效地影响CD147分子的活性。

利用本发明所述的CD147胞外区晶体模型，有助于筛选CD147抗体、配体及其它相互作用分子，及相应的活性作用位点，特别是筛选CD147的抑制性分子，如抗体、肽、蛋白、化学分子等。如利用CD147胞外区与抗体、配体及其它相互作用分子共结晶方法，或将抗体、配体及其它相互作用分子溶解于CD147胞外区晶体中，或通过计算机对接CD147胞外区晶体模型和抗体、配体及其它相互作用分子晶体模型等方法进行筛选CD147配体，特别是CD147的抑制性分子，或针对CD147胞外区晶体的活性结合位点，利用计算机设计、筛选能与之结合的试剂、拮抗物及药物等。在公开本发明的三维结构前，没有任何信息可以用于以CD147胞外区蛋白结构为基础的诊断、治疗用化合物的结构开发。目前，还不能从已有的线性氨基酸序列完成这类设计。基于结构的药物设计是指用计算机模拟来预测一种抗体、肽、多肽、蛋白质、化学物质与蛋白构象的相互作用。通常，对一种能与治疗用抗体、肽类物质、蛋白物质、化学分子有效地相互作用的蛋白质而言，需要将该治疗用化合物的三维结构推想为一种相容构象以确保二者的结合。所述蛋白质的三维结构知识可保证本领域技术人员能设计出具有些类相容构象的诊断、治疗用抗体、肽类物质、蛋白物质或化学分子。如CD147胞外区与抗体HAb18结合位点的信息能使本领域技术人员设计出一种能与CD147结合的抗体、肽类、蛋白物质或化合物，且该抗体、肽类、蛋白物质或化合物能抑制CD147的生物学活性。

CD147胞外区三维结构的测定为CD147分子胞外区上可能的活性位点的确定提供了重要信息。结构信息有助于针对分子上活性位点设计CD147分子的抑制物。例如，利用计算机技术鉴定能与活性位点结合的配体，或进行药物设计，或利用X-ray晶体衍射分析鉴定并定位结合配体的结合位点。

Greer等人利用计算机模型的重复序列、蛋白-配体复合体结构和X-ray衍射方法，设计出胸腺嘧啶核苷酸抑制物。因此，CD147分子的抑制物也可通过此种方法进行设计。例如，利用本发明所提及的CD147胞外区三维结构，通过计算机模建的方法，设计可与本发明所提及的功能活性位点或是三维结构上其它位点结合的抗体、蛋白分子、肽类分子、小分子物质等，然后合成该种物质，与CD147形成复合物，再利用X射线晶体衍射的方法分析复合物，从而获得真实的结合位点。根据X射线晶体衍射分析的结果，可对配体的结构和/或功能基团进行必要的调整，直至获得最优化的物质分子。

此外，根据CD147胞外区三维结构的结果还可利用多种计算机软件进行推理性药物设计，从而设计出CD147分子的抑制物。如利用自动化的配体-受体对接软件(Jones et al.in Current Opinion in Biotechnology，Vol.6，(1995)，652-656)。本方法就需要有详细准确的CD147胞外区的三维结构信息。

利用联结片段进行药物设计也需要有靶受体精确的三维结构信息。本法是为测定靶分子的多个配体的结合位点，然后构建分子支架与配体连接。因此，连接配体形成潜在的导向复合物，然后，利用iterative technique方法使之得以确定。因此，利用此种方法也可设计出CD147的抑制物。

以上所述的基于结构的药物设计方法均需要首先确定能与靶生物分子相互作用的物质。有时，此种物质是可从文献中获得。然而，大多数针对靶分子的抑制物是未知的，或是希望得到新的针对靶分子的抑制物。此时，首先要在数据库中进行筛选(如the Cambridge Structural Database)能与靶分子的活性位点或位点相互作用的化合物。在靶分子结构未知的情况下，筛选标准通常为药物代谢动力学特性，如代谢稳定性和毒性等。然而，CD147胞外区结构的确定，就可通过该分子活性位点的结构和特性进行筛选。筛选标准可为：潜在的抑制剂能否与CD147胞外区形成三维的药效结构。

本发明的一个实施方案是利用计算机辅助三维模建、分子对接技术选择及确定CD147胞外区抗体、配体及其它相互作用分子的方法，其中包括：(1)提供一种蛋白质结构，包括本发明的一种CD147胞外区三维结构或模型；并利用计算机三维模建预测可能性抗体、配体及其它作用分子的三维结构；(2)CD147胞外区三维结构和抗体、配体及其它相互作用分子三维结构的对接；(3)评估抗体、配体及其它作用分子的三维结构是否能与CD147胞外区活性位点的三维结构结合；进一步分析包括(4)CD147胞外区抗体、配体及其它作用分子与CD147生物学活性分析；(5)是否CD147胞外区抗体、配体及其它作用分子可以调节CD147的生物学功能。

本发明的另一个实施方案是基于结构的药物设计计算机辅助方法，其中包括：(1)提供一种蛋白质结构，包括本发明的一种CD147胞外区三维结构或模型；(2)用三维结构或模型设计一种抗体、肽类、蛋白物质或化合物；(3)合成该抗体、肽类、蛋白物质或化合物。

本发明的配体、相互作用分子或抑制性抗体、肽、蛋白、化学分子可通过本领域技术人员所知的各种方法鉴定。如将配体、相互作用分子或抗体、肽、蛋白、化学分子与CD147胞外区蛋白结合，或相互作用，可以在溶液中或细胞上的CD147蛋白进行确定，如免疫分析如酶联免疫吸附分析(ELISA)和放射性免疫分析(RIA)或结合分析如Biacore，酵母双杂交，噬菌体肽库或抗体库技术进行筛选、鉴定。

用下列实例更详细的描述本发明。提供这些实例是为了说明本发明，而不是为了限制本发明

实施例一、CD147胞外区晶体的生成及晶体结构的解析

1、将CD147胞外区基因序列克隆至pET21a(+)原核表达系统中，经表达，纯化出CD147胞外区。

2、所述的CD147胞外区具有如SEQ ID NO：1的序列。

3、CD147胞外区的结晶

4、晶体结构的解析

结构的解析采用单波长反常散射法SAD(single wavelength anomalousdispersion)。在同步辐射光源(Photon Factory，Japan)NW12光束线上收集天然蛋白晶体的衍射数据(2.8分辨率)和硒代蛋白晶体衍射数据(3.1分辨率)各一套并用HKL2000软件包处理。首先用硒代蛋白晶体数据获得相位信息和初始结构模型，再用天然蛋白晶体的衍射数据进行结构确定和精修。晶体的空间群(space group)属于P4₁2₁2，在一个不对称单元有四个分子，晶胞参数a＝126.481，b＝126.481，c＝169.926，α＝90°，β＝90°，γ＝90°。

实施步骤：

1、CD147胞外区的制备及纯化

1)载体：pET21a(+)，NdeI/XhoI cloning sites

2)宿主细胞：OrigamiB(DE3)

3)表达：1mM IPTG，20℃，overnight

纯化

1)HiTrap Q Hp，20mM Tris pH8.0 w/wo 1M NaCl

2)Mono Q HR 10/10，20mM Tris pH8.0 w/wo 1M NaCl

3)HiLoadTM 16/60Superdex 75prep grade，20mM Tris pH8.0，150mMNaCl

2、蛋白结晶

悬滴扩散法(hanging-drop vapor diffusion procedure)

1)蛋白浓度：5-20mg/ml

2)池液：0.5M硫酸胺溶液，0.1M柠檬酸钠溶液，1.0M硫酸锂溶液，pH5.6。

3)生长周期：3～4周，4℃。

3、结构测定

X-Ray衍射和数据收集

结构的解析采用单波长反常散射法SAD(single wavelength anomalousdispersion)。在同步辐射光源(Photon Factory，Japan)NW12光束线上收集天然蛋白晶体的衍射数据(2.8分辨率)和硒代蛋白晶体衍射数据(3.1分辨率)各一套并用HKL2000软件包处理。首先用硒代蛋白晶体数据获得相位信息和初始结构模型，再用天然蛋白晶体的衍射数据进行结构确定和精修(如表1和图1所示)。

表1CD147胞外区晶体衍射数据结果

	蛋白晶体	硒代蛋白晶体
	蛋白晶体	硒代蛋白晶体	Data collectionSpace groupCell dimensionsa，b，c(7)α，β，γ(°)Resolution()R_sym or R_merge ^bI/σICompleteness(％)RedundancyRefinementResolution()No.reflectionsR_work/R_free ^cNo.atomsProteinB-factorsMain chainsSide chainsR.m.s deviationsBond lengths()Bond angles(°)Ramachandran statistics	P4₁2₁2126.481，126.481，169.92690，90，9050-2.80(2.90-2.80)^a0.106(0.586)18.4(2.2)99.4(100)7.3(7.4)50-2.8326130.255/0.2965527552730.60329.27932.0490.0101.397	P4₁2₁2125.141，125.141，169.66090，90，9050-3.10(3.21-3.10)0.114(0.697)38.1(5.8)99.7(100％)28.5(29.6)

Most favoured regions(％)Additionally allowed regions(％)Generously allowed regions(％)Disallowed regions(％)

82.715.21.80.3

^aNumbers in parentheses refer to the highest resolution shell.

^bR_sym(R_merge)＝∑_hkl∑_i|I_i(hkl)_i-<I(hkl)>|/∑_hkl∑_iIi(hkl)

^cR＝∑||F_o|-|F_c||/∑|F_o|

附图1中A图描述CD147胞外区空间群，表示一个不对称单结构域，其中有四个分子，用A、D、C、D四条链表示，每个分子或说每条链又包含两个Ig样结构域。第二张图是放大显示其中一条链，同时标明两个不同类型的Ig样结构域中两个β片层的组成(分别由不同数量和走向的β片层组成)。

实施例二、CD147胞外区与抗体HAb18模建对接及CD147胞外区活性位点测定

1、、所述的CD147胞外区与其抗体复合物的结构具有以下特点：CD147胞外区与HAb18分子对接模型中含有3条肽链、即CD147胞外区和HAb18轻、重链可变区；6176个原子，形成6635个共价键；对接能量评估为：bindingenergy＝101.21、docking energy＝29.05、intermolecular energy＝30.54、trosional energy＝70.67、internal energy＝-1.49。

2、所述的CD147胞外区的活性结构位点具有以下特点：CD147胞外区的活性位点位于该蛋白N端C2-set结构域远膜环区，参与表位的氨基酸残基为：28Glu、30Thr、44Asp、45Ala、46Leu、47Pro、48Gly、50Lys、52Glu。

实施步骤：

1通过WAM(Web Antibody Modeling)对HAb18进行同源模建，procheckV3.4检查G-factors Overall值为-0.21，利用DeepView/Swiss-pdbViewerV3.7，对HAb18同源模建结果进行Energy Minisation及Compute Energy(GROMOS96 43B1 parameters set)分析，确定其总能量为-5888.806KJ/mol。

2使用DeepView/Swiss-pdbViewer V3.7对HAb18和CD147复合物空间结构进行修正，加入极性和非极性氢原子、纠正原子电荷数。

3利用AutoDock V3.0.5对接HAb18和CD147胞外段，确定大致分子对接的方向，在此基础上提高精度、进行精细对接试验，确定能量评估最合理的对接模型(如图2所示)。对结果用DeepView/Swiss-pdbViewer V3.7进行Energy Minisation及Compute Energy(GROMOS96 43B1 parameters set)分析，确定HAb18和CD147胞外段复合体总能量为-15383.64KJ/mol。

4使用STING MILLENNIUM的IFR Contact分析对接模型，确定相互作用氨基酸残基位点(如图3所示)。

序列表

<110>陈志南

<120>CD147胞外区晶体结构及应用

<160>1

<210>1

<211>184

<212>protein

<213>人

<220>

<221>extracellular portion domain

<222>(1)...(184)

<400>1

Ala Ala Gly Thr Val Phe Thr Thr Val Glu Asp Leu Gly Ser Lys

1 5 10 15

Ile Leu Leu Thr Cys Ser Leu Asn Asp Ser Ala Thr Glu Val Thr

20 25 30

Gly His Arg Trp Leu Lys Gly Gly Val Val Leu Lys Glu Asp Ala

35 40 45

Leu Pro Gly Gln Lys Thr Glu Phe Lys Val Asp Ser Asp Asp Gln

50 55 60

Trp Gly Glu Tyr Ser Cys Val Glu Leu Pro Glu Pro Met Gly Thr

65 70 75

Ala Asn Ile Gln Leu His Gly Pro Pro Arg Val Lys Ala Val Lys

80 85 90

Ser Ser Glu His Ile Asn Glu Gly Glu Thr Ala Met Leu Val Cys

95 100 105

Lys Ser Glu Ser Val Pro Pro Val Ile Asp Trp Ala Trp Tyr Lys

110 115 120

Ile Thr Asp Ser Glu Asp Lys Ala Leu Met Asn Gly Ser Glu Ser

125 130 135

Arg Phe Phe Val Ser Ser Ser Gln Gly Arg Ser Glu Leu His Ile

140 145 150

Glu Asn Leu Asn Met Glu Ala Asp Pro Gly Gln Tyr Arg Cys Asn

155 160 165

Gly Thr Ser Ser Lys Gly Ser Asp Gln Ala Ile Ile Thr Leu Arg

170 175 180

Val Arg Thr His

184

Claims

1.一种CD147(HAb18G/CD147、Basigin、EMMPRIN、M6、Neurothelin)胞外区的晶体及模型，其特征在于，该晶体具有正方晶系中的空间群P4₁2₁2和SEQ ID NO：1中列出的氨基酸序列；所述模型具有符合表1的三维结构。

2.如权利要求1所述的CD147胞外区结晶，其特征在于，该结晶具有四方体形的晶胞，具有晶格常数：a＝126.481±0.5％，b＝126.481±0.5％，c＝169.926±0.5％，α＝β＝γ＝90°，在一个不对称单元有四个分子，一个分子的分子量约20±0.5kD，溶剂含量约70±1％。

3.如权利要求1，CD147胞外区晶体的三维空间结构特点：CD147胞外区晶体结构揭示其胞外区由两个Ig样结构域，其中N末端的结构域为IgC2-set，而靠近胞膜的C端结构域属于Ig I-set。

4.权利要求1所述，CD147胞外区序列来源于人。

5.权利要求1所述，CD147胞外区晶体中CD147胞外区包含序列SEQ IDNO：1，或其同系物、片段、变异体、类似物及其衍生物。

6.CD147胞外区与抗CD147抗体HAb18、整合素、配体及其它相互作用分子复合物的晶体。

7.如权利要求6，CD147胞外区与抗CD147抗体HAb18、整合素、配体及其它相互作用分子复合物的晶体中CD147胞外区符合权利要求1～5任意一项。

8.一种利用计算机分子模建对接测定CD147胞外区与抗CD147抗体HAb18接合的复合物，其具有以下特点：CD147胞外区与HAb18单抗对接模型中含有3条肽链、即CD147胞外区和HAb18V_L、V_H；6176个原子，形成6635个共价键；对接能量评估为：binding energy＝101.21、dockingenergy＝29.05、intermolecular energy＝30.54、trosional energy＝70.67、internal energy＝-1.49。

9.测定如权利要求1～5所述的CD147胞外区晶体或如权利要求6所述的CD147胞外区与CD147分子配体复合物的晶体的三维空间结构，其中CD147胞外区为：(1)全长野生型CD147胞外区或突变体、片段、衍生物、变异体、类似物或同源物；或(2)野生型CD147胞外区的突变体、片段、衍生物、变异体、类似物或同源物。

10.如权利要求9所述，用(1)全长野生型CD147胞外区或突变体、片段、衍生物、变异体、类似物或同源物；或(2)野生型CD147胞外区的突变体、片段、衍生物、变异体、类似物或同源物的三维结构通过计算机模建方法或其它方法评估CD147胞外区的抗体、配体或相互作用分子与CD147胞外区结合的活性位点。

11.如权利要求10所述，CD147胞外区的活性位点位于该蛋白N端C2-set结构域远膜环区，参与表位的氨基酸残基为：Glu28、Thr30、Asp44、Ala45、Leu46、Pro47、Gly48、Lys50、Glu52。

12.鉴别能与CD147胞外区结合的物质的方法，包括用CD147晶体浸泡可能的小分子化合物并共结晶、以及采用测定分子间相互作用的方法，如Biacore，酵母双杂交，噬菌体肽库或抗体库筛选可能的配体或拮抗剂及通过计算机模建方法利用CD147晶体结构与可能的配体进行三维结构比对、设计、对接。

13.一种利用计算机辅助三维模建、分子对接技术选择及确定CD147胞外区抗体、配体及其它相互作用分子的方法，如下：(1)如权利要求9、10所述通过计算机三维模建CD147胞外区及可能性抗体、配体及其它作用分子的三维结构；(2)CD147胞外区三维结构和抗体、配体及其它相互作用分子三维结构的对接；(3)评估抗体、配体及其它作用分子的三维结构是否能与CD147胞外区活性位点的三维结构结合。

14.如权利要求13所述，进一步分析包括以下内容：(1)CD147胞外区抗体、配体及其它作用分子与CD147生物学活性分析；(2)是否CD147胞外区抗体、配体及其它作用分子可以调节CD147的生物学功能。

15.如权利要求14，基于CD147胞外区晶体结构设计、研发的抗体、配体及其它作用分子作为试剂、拮抗物或药物。

16.一种基于结构的生物活性物质的药物设计的计算机辅助方法，该方法包括：

a.提供一种CD147胞外区蛋白模型，其中所述模型表现为一种基本符合权利要求1的三维结构；

b.用所述模型设计一种抗体、肽类物质、蛋白类物质、小分子物质等；

c.合成所述的抗体、肽类物质、蛋白类物质、小分子物质等。

17.权利要求16的方法，其中所述方法进一步包括：评估述的合成的抗体、肽类物质、蛋白类物质、小分子物质等的生物活性。

18.权利要求16的方法，其中所述的设计步骤包括计算机筛选一个或多个化学化合物数据库，其中所述化合物的三维结构是已知的。

19.权利要求18的方法，该方法进一步包括让所述筛选步骤鉴定出的化合物与所述计算机模型相互作用。

20.权利要求16的方法，其中所述的设计步骤包括定向药物或随机药物设计。

21.权利要求16的方法，其中所述的设计步骤包括筛选出那些被预测为能够结合所述CD147胞外区三维结构的化合物。

22.权利要求16的方法，其中所述的生物活性指：与所述CD147蛋白的结合，抑制或刺激所述CD147蛋白活性。

23.用权利要求1所述的CD147胞外区晶体结构或权利要求6所述的CD147胞外区与其抗体、配体及其它作用分子复合物晶体结构来拟合CD147胞外区突变体、衍生物、片段、变异体、类似物、同源物或CD147胞外区相关蛋白复合物的晶体结构。

24.用权利要求1所述的CD147胞外区晶体结构或权利要求6所述的CD147胞外区与其抗体、配体及其它作用分子复合物晶体结构的原子座标模建与CD147胞外区结合的相关蛋白的模型。

25.权利要求1的模型，基中所述的结晶CD147蛋白由下列方法制备：将CD147胞外区基因序列克隆至pET21a(+)原核表达系统，表达，纯化出CD147胞外区；提供5-20mg/ml的CD147胞外区溶液，提供含有0.5M硫酸胺溶液，0.1M柠檬酸钠溶液和1.0M硫酸锂溶液的池液，pH5.6；混合CD147胞外区溶液和池液；让得到的混合物溶液放置一段预定的时间，直到CD147胞外区晶体在溶液中长到预定的大小或更大。