CN101360758A - 用于登革病毒的4种血清型和其他黄病毒的预防和/或治疗性治疗的方法和蛋白质 - Google Patents

用于登革病毒的4种血清型和其他黄病毒的预防和/或治疗性治疗的方法和蛋白质 Download PDF

Info

Publication number
CN101360758A
CN101360758A CNA2006800513773A CN200680051377A CN101360758A CN 101360758 A CN101360758 A CN 101360758A CN A2006800513773 A CNA2006800513773 A CN A2006800513773A CN 200680051377 A CN200680051377 A CN 200680051377A CN 101360758 A CN101360758 A CN 101360758A
Authority
CN
China
Prior art keywords
gly
ser
thr
val
lys
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006800513773A
Other languages
English (en)
Inventor
G·奇内亚圣地亚哥
V·韦尔塔加林多
A·M·马丁邓恩
J·V·加维隆多考利
N·弗莱塔斯萨拉萨尔
O·吉罗拉克鲁斯
J·希尔巴尔德斯
A·苏卢埃塔莫拉雷斯
L·埃米达克鲁斯
M·阿亚拉阿维拉
D·冈萨雷斯罗切
R·派斯梅雷莱斯
P·G·托莱多马约拉
M·萨里亚努涅斯
A·姆萨池奥拉萨
Y·马佐拉雷埃斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Centro de Ingenieria Genetica y Biotecnologia CIGB
Original Assignee
Centro de Ingenieria Genetica y Biotecnologia CIGB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Centro de Ingenieria Genetica y Biotecnologia CIGB filed Critical Centro de Ingenieria Genetica y Biotecnologia CIGB
Publication of CN101360758A publication Critical patent/CN101360758A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • C07K14/08RNA viruses
    • C07K14/18Togaviridae; Flaviviridae
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/08Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from viruses
    • C07K16/10Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from viruses from RNA viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/555Medicinal preparations containing antigens or antibodies characterised by a specific combination antigen/adjuvant
    • A61K2039/55511Organic adjuvants
    • A61K2039/55566Emulsions, e.g. Freund's adjuvant, MF59
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/20Fusion polypeptide containing a tag with affinity for a non-protein ligand
    • C07K2319/21Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a His-tag
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/24011Flaviviridae
    • C12N2770/24022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/24011Flaviviridae
    • C12N2770/24111Flavivirus, e.g. yellow fever virus, dengue, JEV
    • C12N2770/24122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/24011Flaviviridae
    • C12N2770/24111Flavivirus, e.g. yellow fever virus, dengue, JEV
    • C12N2770/24134Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Virology (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Mycology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Epidemiology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Oncology (AREA)
  • Physics & Mathematics (AREA)
  • Communicable Diseases (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

本发明涉及制药工业领域,并且描述了E蛋白的表面的保守区域,所述保守区域可以用于开发广谱抗病毒分子以用于预防和/或治疗由登革病毒1-4和其他黄病毒引起的感染。本发明还涉及嵌合蛋白质,其用作疫苗或用于针对登革病毒的4种血清型和其他黄病毒的预防性或治疗性治疗。

Description

用于登革病毒的4种血清型和其他黄病毒的预防和/或治疗性治疗的方法和蛋白质
发明领域
本发明涉及制药工业领域,并且描述了E蛋白的表面的保守区域,所述保守区域可以用于开发广谱抗病毒分子以用于预防和/或治疗由登革病毒1-4和其他黄病毒引起的感染。本发明描述了可用于预防性或治疗性治疗登革病毒的4种血清型和备选地其他黄病毒的方法和蛋白质。
现有技术
登革病毒(DV)复合物属于黄病毒(Flaviviridae)科,并且由遗传上和抗原上相关的4种不同病毒或血清型(DV1-DV4)组成。DV通过蚊子主要是埃及伊蚊(Aedes aegypti)传播给人。感染产生各种不同的临床症状,从无症状和良性的表现例如无差别的发热性发作到更严重的表现如登革出血热(DHF)和威胁生命的登革休克综合征(DSS)。更严重的临床症状通常与2种不同血清型的顺次感染相关(Halstead,S.B.Neutralization and antibody-dependentenhancement of dengue viruses.Adv.Virus Res.60:421-67.,421-467,2003.Hammon WMc.New haemorragic fever in childrenin the Philippines and Thailand.Trans Assoc Physicians 1960;73:140-155),这个发现已被几个流行病学研究所确证(KouríGP,Guzmán MG,Bravo JR.Why dengue hemorrhagic fever in Cuba?2.An integral analysis.Trans Roy Soc Trop Med Hyg 1987;72:821-823)。这个现象已由抗体依赖性增强作用(ADE)的理论得到解释,所述理论指出,在这些情况下,由于病毒-抗体复合物进入其靶(单核细胞)的增加,因而存在病毒感染性的增加,所述进入由存在于这些细胞上的Fc受体介导(Halstead SB.Pathogenesis of dengue:challenges to molecular biology.Science 1988;239:476-481)。
包膜糖蛋白(E蛋白)是病毒包膜的最大结构蛋白。来自DEN2和DEN3病毒的E蛋白的胞外域的片段的三维结构近期已通过x射线衍射技术得到解析(Modis,Y.,Ogata,S.,Clements,D.& Harrison,S.C.A ligand-binding pocket in the dengue virus envelopeglycoprotein.Proc.Natl.Acad.Sci.U.S.A 100,6986-6991,2003.Modis,Y.,Ogata,S.,Clements,D.,和Harrison,S.C.VariableSurface Epitopes in the Crystal Structure of Dengue Virus Type3 Envelope Glycoprotein.J.Virol.79,1223 1231,2005),显示出与来自蜱传脑炎病毒的E蛋白的晶体结构具有高度的结构相似性(Rey,F.A.,Heinz,F.X.,Mand1,C.,Kunz,C.& Harrison,S.C.Theenvelope glycoprotein from tick-borne encephalitis virus at 2A resolution.Nature 375,291-298,1995)。这种结构相似性与其序列同源性、6个二硫桥的保守性和残基定位的保守性相一致,所述残基先前已在其他黄病毒中被鉴定为具有功能作用,例如作为抗原决定簇的一部分或参与减毒或逃避突变。
E蛋白由3个结构域形成:结构域I,位于序列的N-末端部分上但在3D结构中形成中央结构域;结构域II,也称为二聚化结构域,其包含有在黄病毒中高度保守的融合肽;和结构域III,具有免疫球蛋白样折叠,其参与和细胞受体的相互作用。
E蛋白是在病毒生命周期的几个阶段中起重要作用的多功能糖蛋白。这种蛋白质是中和病毒的抗体的主要靶标,介导与细胞受体的相互作用,并且是驱动病毒和细胞膜之间的融合的引擎(Heinz,F.X.,和S.L.Allison.2003.Flavivirus structure and membrane fusion.Adv.Virus Res.59:63-97.Modis,Y.,S.Ogata,D.Clements,和S.C.Harrison.2004.Structure of the dengue virus envelopeprotein after membrane fusion.Nature 427:313-319.Rey 2004.Chen,Y.,T.Maguire,R.E.Hileman,J.R.Fromm,J.D.Esko,R.J.Linhardt,和R.M.Marks.1997.Dengue virus infectivitydepends on envelope protein binding to target cell heparansulfate.Nat.Med.3:866-871.Navarro-Sanchez,E.,R.Altmeyer,A.Amara,O.Schwartz,F.Fieschi,J.L.Virelizier,F.Arenzana-Seisdedos,和P.Despres.2003.Dendritic-cell-specific ICAM3-grabbing non-integrin is essential for theproductive infection of human dendritic cells bymosquito-cell-derived dengue viruses.EMBO Rep.4:1-6.Tassaneetrithep,B.,T.H.Burgess,A.Granelli-Piperno,C.Trumpfheller,J.Finke,W.Sun,M.A.Eller,K.Pattanapanyasat,S.Sarasombath,D.L.Birx,R.M.Steinman,S.Schlesinger,和M.A.Marovich.2003.DC-SIGN(CD209)mediates dengue virusinfection of human dendritic cells.J.Exp.Med.197:823-829)。
这种蛋白质锚定至病毒膜,并且其功能与三级和四级结构中的大构象变化相关。在病毒形成的胞内阶段期间,发现E作为与preM蛋白质一起的异二聚体存在(Allison,S.L.,K.Stadler,C.W.Mand1,C.Kunz,和F.X.Heinz.1995.Synthesis and secretion ofrecombinant tick-borne encephalitis virus protein E in solubleand particulate form.J.Virol.69:5816-5820.Rice,C.M.1996.Flaviviridae:the viruses and their replication,p.931-959.In B.N.Fields,D.N.Knipe,P.M.Howley,R.M.Chanock,J.L.Melnick,T.P.Monath,B.Roizman,和S.E.Straus(编辑),Virology,第3版Lippincott-Raven,Philadelphia,Pa.)。在这个阶段期间,病毒粒子被认为是未成熟的,并且对于介导膜融合来说是有缺陷的,如当与成熟的细胞外病毒粒子相比较时其显著更低的体外感染性所证明的(Guirakhoo,F.,Heinz,F.X.,Mand1,C.W.,Holzmann,H.& Kunz,C.Fusion activity of flaviviruses:comparison of mature and immature(prM containing)tick-borneencephalitis virions.J.Gen.Virol.72,1323-1329,1991.Guirakhoo,F.,Bolin,R.A.& Roehrig,J.T.The Murray Valleyencephalitis virus prM protein confers acid resistance to virusparticles and alters the expression of epitopes within the R2domain of E glycoprotein.Virology 191,921-931,1992)。假定异二聚体的作用是在不成熟的病毒粒子穿过细胞内区室期间阻止E蛋白与膜的结合,所述细胞内区室由于其酸性pH而可能引发膜融合过程。此外,还可能的是,preM蛋白充当蛋白伴侣以用于E蛋白的折叠和装配(Lorenz,I.C.,Allison,S.L.,Heinz,F.X.& Helenius,A.Folding and dimerization of tick-borne encephalitis virusenvelope proteins prM and E in the endoplasmic reticulm.J.Virol.76,5480-5491,2002)。在病毒粒子分泌到细胞外的过程中,preM由宿主蛋白酶(弗林蛋白酶)进行酶促加工,使得E游离以结合成同二聚体并因此引发以形成成熟的病毒粒子作为结束的病毒包膜的再组织(Stadler,K.,Allison,S.L.,Schalich,J.& Heinz,F.X.Proteolytic activation of tick-borne encephalitis virusby furin.J.Virol.71,8475-8481,1997.Elshuber,S.,Allison,S.L.,Heinz,F.X.& Mandl,C.W.Cleavage of protein prM isnecessary for infection of BHK-21 cells by tick-borneencephalitis virus.J.Gen.Virol.84,183-191,2003)。成熟的病毒粒子的结构已通过电子低温显微术以
Figure A20068005137700091
的解析度进行了测定(Zhang W,Chipman PR,Corver J,Johnson PR,Zhang Y,MukhopadhyayS,Baker TS,Strauss JH,Rossmann MG,Kuhn RJ.Visualizationof membrane protein domains by cryo-electron microscopy ofdengue virus.Nat Struct Biol.2003,10:907-12.Kuhn,R.J.等人Structure of dengue virus:implications for flavivirusorganization,maturation,and fusion.Cell 108,717-725,2002),并且未成熟的病毒粒子的结构以
Figure A20068005137700092
的解析度进行了测定(Zhang,Y.等人Structures of immature flavivirus particles.EMBO J.22,2604-2613,2003)。这些病毒粒子具有T=3二十面体对称。在成熟的病毒粒子中,E蛋白二聚体位于与病毒膜平行的平面上,几乎完全覆盖其表面。成熟的病毒粒子是完全具有感染性的,并且正是以这种构象,病毒与细胞受体和由宿主引发的抗体相互作用。一旦病毒啮合在细胞受体上,它就通过受体介导的内吞作用而内在化,并最终到达内体,在那里略微酸性的pH引发E蛋白的构象变化,从而E蛋白起始膜融合过程(Allison,S.L.等人Oligomeric rearrangement oftick-borne encephalitis virus envelope proteins induced by anacidic pH.J.Virol.69,695-700,1995)。在这个过程中,该蛋白质由二聚体再组织成三聚体。E蛋白的融合后结构近期已得到测定(Modis,Y.,Ogata,S.,Clements,D.& Harrison,S.C.Structureof the dengue virus envelope protein after membrane fusion.Nature 427,313-319(2004).Bressanelli,S.等人Structure ofa flavivirus envelope glycoprotein in its low-pH-inducedmembrane fusion conformation.EMBO J.23,728-738(2004)),显示了三聚体形成涉及三级结构的重大重排,其中单体平行结合而包含融合肽的结构域II的尖端与膜相互作用。通过一起分析晶体结构和经解析的病毒粒子结构,显而易见的是,在病毒生命周期自始至终,E蛋白经历重排,其中它的三级和四级结构以及病毒粒子自身发生显著改变。
E蛋白是在病毒感染期间产生的中和抗体的主要靶标。单种血清型的感染引发长效抗体,其针对同种血清型的病毒是中和性的。在感染后第一个月期间,这些抗体还可以中和异种血清型,但这种活性缓慢降低直至其在感染后约9个月时消失(Halstead S.B.Neutralization and antibody-dependent enhancement of dengueviruses.Adv Virus Res.2003;60:421-67.Sabin,A.B.1952.Research on dengue during World War II.Am.J.Trop.Med.Hyg.1:30-50.)。
当与不同血清型的病毒相互作用时,针对一种血清型产生的抗体一般显示出减少的亲和力;这个现象在分子水平上通过DV血清型中E蛋白的氨基酸序列中的变异来解释。具有足够低的亲和力的相互作用可以导致无法中和但仍能够结合病毒表面的抗体,其量足以促进病毒内在化到携带Fc受体的细胞中(Halstead,S.B.,和E.J.O’Rourke.1977.Dengue viruses and mononuclear phagocytes.I.Infectionenhancement by non-neutralizing antibody.J.Exp.Med.146:201-217.Littaua,R.,I.Kurane,和F.A.Ennis.1990.Human IgGFc receptor II mediates antibody-dependent enhancement ofdengue virus infection.J.Immunol.144:3183-3186)。
此外,在继发感染期间,低亲和力抗体群体的滴度超过由新来的DV血清型产生的新的高亲和力抗体的滴度,这是由于当与幼稚的B细胞比较时预先存在的记忆B细胞和浆细胞的激活更快。在从继发感染中恢复的过程中抗体特性谱极大地受初次DV感染的血清型的影响,这个事实正是称为“抗原原罪(original antigenic sin)”的现象的表现(Halstead,S.B.,Rojanasuphot,S.,and Sangkawibha,N.1983.Original antigenic sin in dengue.Am.J.Trop.Med.Hyg.32:154-156)。
另一方面,已知高效中和性单克隆抗体(mAbs)在高稀释度时可以引发免疫扩增(immunoamplification)(Brandt,W.E.,J.M.McCown,M.K.Gentry,和P.K.Russell.1982.Infectionenhancement of dengue type 2 virus in the U-937 human monocytecell line by antibodies to flavivirus cross-reactivedeterminants.Infect.Immun.36:1036-1041.Halstead,S.B.,C.N.Venkateshan,M.K.Gentry,和L.K.Larsen.1984.Heterogeneity of infection enhancement of dengue 2 strains bymonoclonal antibodies.J.Immunol.132:1529-1532.Morens,D.M.,S.B.Halstead,和N.J.Marchette.1987.Profiles ofantibody-dependent enhancement of dengue virus type 2 infection.Microb.Pathog.3:231-237)。
黄病毒E蛋白的抗原结构已得到深入研究,其中使用鼠类mAb实验对象组以及一批生物化学和生物学分析,包括竞争测定法,相互作用对操作例如二硫桥的还原和SDS处理的敏感性,关于与蛋白水解片段和合成肽结合的测定法,关于病毒中和或血凝抑制的测定法,逃避突变体的产生,血清学测试等(Heinz.T.Roehrig,J.T.,Bolin,R.A.和Kelly,R.G.Monoclonal Antibody Mapping of the EnvelopeGlycoprotein of the Dengue 2 Virus,Jamaica,VIROLOGY 246,317-328,1998.Heinz,F.X.,和Roehrig,J.T.(1990).Flaviviruses.In“Immunochemistry of Viruses.II.The Basis forSerodiagnosis and Vaccines”(M.H.V.Van Regenmortel和A.R.Neurath,Eds.),第289-305页.Elsevier,Amsterdam.Mand1,C.W.,Guirakhoo,F.G.,Holzmann,H.,Heinz,F.X.,和Kunz,C.(1989).Antigenic structure of the flavivirus envelopeprotein E at the molecular level,using tick-borne encephalitisvirus as a model.J.Virol.63,564-571.I.L.Serafin and J.G.Aaskov.Identification of epitopes on the envelope(E)proteinof dengue 2 and dengue 3 viruses using monoclonal antibodies.Arch Virol(2001)146:2469-2479)。3个抗原结构域A、B和C已得到确定,它们分别相应于3个结构域II、III和I。识别特定表位的抗体通常显示出非常相似的功能特征。来自结构域A(等价于结构域II)的表位的识别被二硫桥的还原破坏,和识别这些表位的mAbs抑制血细胞凝集、中和病毒感染并抑制病毒介导的膜融合。特别地,对于登革病毒而定义的表位A1被具有群型特异性(group-typespecificity)的mAbs所识别,即它们在不同黄病毒中是高度交叉反应的。4G2(抗-DV2)和6B6C(抗-JEV)mAbs识别这个表位。与这个表位的结合在未成熟的病毒粒子中减少几个数量级,并且被成熟病毒粒子的酸性pH处理所增强(Guirakhoo,F.,R.A.Bolin,和J.T.Roehrig.1992.The Murray Valley encephalitis virus prM proteinconfers acid resistance to virus particles and alters theexpression of epitopes within the R2 domain of E glycoprotein.Virology 191:921-931)。
疫苗开发
目前没有针对DV及其最严重表现的特异疗法。灭蚊是昂贵并且不是非常有效的。尽管基于流体的适当管理以校正由DHF引起的血容量不足的临床处理已减少其死亡率,但这些处理在许多不发达国家中仍是成问题的。已估计每年30 000例死亡可归因于DHF,并且这种疾病的死亡率和相关成本相当于其他构成公共卫生费用的首要优先目标的疾病(Shepard DS,Suaya JA,Halstead SB,Nathan MB,Gubler DJ,Mahoney RT,Wang DN,Meltzer MI.Cost-effectiveness of apediatric dengue vaccine.Vaccine.2004,22(9-10):1275-80)。
针对登革病毒的几种疫苗候选物目前处于不同的开发阶段(Barrett,A.D.2001.Current status of flavivirus vaccines.Ann.N.Y.Acad.Sci.951:262 271.Chang GJ,Kuno G,PurdyDE,Davis BS.2004 Recent advancement in flavivirus vaccinedevelopment.Expert Rev Vaccines.2004 3(2):199-220)。迄今为止尝试的策略包括减毒活疫苗、嵌合病毒、质粒DNA和亚单位疫苗。通过使用用于在犬和猴的原代肾细胞中进行病毒繁殖的标准方法已开发出了来自4种血清型的减毒株(Bhamarapravati,N.,和Sutee,Y.2000.Live attenuated tetravalent dengue vaccine.Vaccine.18:44-47.Eckels,K.H.,等人2003.Modification of dengue virusstrains by passage in primary dog kidney cells:preparation ofcandidate vaccines and immunization of monkeys.Am.J.Trop.Med.Hyg.69:12-16.Innis,B.L.,和Eckels,K.H.2003.Progressin development of a live-attenuated,tetravalent dengue virusvaccine by the United States Army Medical Research and MaterielCommand.Am.J.Trop.Med.Hyg.69:1-4)。这种策略的进展已受到缺乏动物模型和关于人的减毒作用的体外标记的限制。在这个相同研究途径中,存在这样的工作,其中从4种血清型中获得cDNA克隆,然后进行处理以引入减毒突变和变异,其在理论上极大地减少回复成强毒表型的可能性(Blaney,J.E.,Jr.,Manipon,G.G.,Murphy,B.R.,和Whitehead,S.S.2003.Temperature sensitive mutationsin the genes encoding the NS1,NS2A,NS3,and NS5 nonstructuralproteins of dengue virus type 4 restrict replication in thebrains of mice.Arch.Virol.148:999-1006.Durbin,A.P.,等人2001.Attenuation and immunogenicity in humans of a livedengue virus type-4 vaccine candidate with a 30 nucleotidedeletion in its 3’-untranslated region.Am.J.Trop.Med.Hyg.65:405-413.Patent:Zeng L,Markoff L,WO0014245,1999)。
另一种策略是制备关于4种血清型的嵌合黄病毒变体,其中将来自一种登革血清型的preM和E结构蛋白质引入黄热病毒(YFV)、登革病毒或其他病毒(其贡献出核心和其他非结构蛋白质)的减毒背景内(Guirkhoo F,Arroyo J,Pugachev KV等人Construction,safety,and immunogenicity in non-human primates of a chimeric yellowfever-dengue virus tetravalent vaccine.J Virol 2001;75:7290-304.Huang CY,Butrapet S,Pierro DJ等人Chimeric denguetype 2(vaccine strain PDK-53)/dengue type 1 virus as a potentialcandidate dengue type 1 virus vaccine.J Virol 2000;74:3020-28.Markoff L,Pang X,Houng HS,等人Derivation and characterizationof a dengue 1 host-range restricted mutant virus that isattenuated and highly immunogenic in monkeys.J Virol 2002;76:3318-28.专利:Stockmair and schwan Hauesser,WO9813500,1998.专利:Clark and Elbing:WO9837911,1998.专利:Lai CJ,US6184024,1994.)。
一般而言,由于诸如回复成强毒表型、病毒干扰和基因组间重组的现象出现的可能性,关于活减毒疫苗的潜在益处始终存在多重疑问(Seligman SJ,Gould EA 2004 Live flavivirus vaccines:reasonsfor caution.Lancet.363(9426):2073-5)。基于表达重组蛋白质的质粒DNA的疫苗以及基于重组抗原的疫苗仍处于早期开发阶段(Chang,G.J.,Davis,B.S.,Hunt,A.R.,Holmes,D.A.,和Kuno,G.2001.Flavivirus DNA vaccines:current status and potential.Ann.N.Y.Acad.Sci.951:272-285.Simmons,M.,Murphy,G.S.,Kochel,T.,Raviprakash,K.,和Hayes,C.G.2001.Characterizationof antibody responses to combinations of a dengue-2 DNA anddengue-2 recombinant subunit vaccine.Am.J.Trop.Med.Hyg.65:420-426.专利:Hawaii Biotech Group,Inc;WO9906068 1998.Feighny,R.,Borrous,J.和Putnak R.Dengue type-2 virus envelopeprotein made using recombinant baculovirus protects miceagainst virus challenge.Am.J.Trop.Med.Hyg.1994.50(3).322-328;Deubel,V.,Staropoli,I.,Megret,F.,等人Affinity-purified dengue-2 virus envelope glycoprotein inducesneutralising antibodies and protective immunity in mice.Vaccine.1997.15,1946-1954)。
基于上述策略的几种疫苗候选物已在动物模型中显示出保护,和某些在临床试验的早期阶段期间已发现是安全和具有免疫原性的。
然而,关于疫苗开发的主要障碍是需要达到针对4种血清型的相等地有效的保护。承认一种登革血清型的感染在人中诱导针对相同血清型的终身免疫。然而,仅针对一种血清型的免疫接种仅达到2-9个月短时间的针对其他血清型的保护(异型免疫性)(Sabin,A.B.1952.Research on dengue during World War II.Am.J.Trop.Med.Hyg.1:30-50)。此外,针对特定血清型的亚最佳保护水平可能使经疫苗接种的人致敏,并且增加在随后感染那种血清型后出现与病理学性质的异源免疫应答相关的严重表现的危险(Rothman AL 2004 Dengue:defining protective versus pathologic immunity J.Clin.Invest.113:946-951)。然而,可用的活减毒疫苗或重组亚单位疫苗的有效的四价制剂的开发已证明是艰难的挑战,其需要使用复杂的、多剂量免疫接种程序表。
抗体:被动免疫接种
使用疫苗用于预防登革感染的一种备选方案是使用中和抗体以用于被动免疫接种。为了这个目的已获得了人源化的黑猩猩抗体,包括中和登革4的5H2(Men,R.,T.Yamashiro,A.P.Goncalvez,C.Wernly,D.J.Schofield,S.U.Emerson,R.H.Purcell,和C.J.Lai.2004.Identification of chimpanzee Fab fragments by repertoirecloning and production of a full-length humanizedimmunoglobulin G1 antibody that is highly efficient forneutralization of dengue type 4 virus.J.Virol.78:4665-4674),和针对4种血清型具有交叉中和性的1A5(Goncalvez,A.P.,R.Men,C.Wernly,R.H.Purcell,和C.J.Lai.2004.Chimpanzee Fabfragments and a derived humanized immunoglobulin G1 antibodythat efficiently cross-neutralize dengue type 1 and type 2viruses.J.Virol.78:12910-12918)。
考虑到病毒血症的水平是疾病严重度的重要预测者,被动免疫接种的使用对于预防和治疗方法都可能是有用的(Wang,W.K.D.Y.Chao,C.L.Kao,H.C.Wu,Y.C.Liu,C.M.Li,S.C.Lin,J.H.Huang,和C.C.King.2003.High levels of plasma dengueviral load during defervescence in patients with denguehaemorrhagic fever:implications for pathogenesis.Virology305:330-338.Vaughn,D.W.,Green,S.,Kalayanarooj,S.,Innis,B.L.,Nimmannitya,S.,Suntayakorn,S.,Endy,T.P.,Raengsakulrach,B.,Rothman,A.L.,Ennis,F.A.和Nisalak,A.Dengue Viremia Titer,Antibody Response Pattern,and VirusSerotype Correlate with Disease Severity.J.Infect.Dis.2000;181:2-9)。然而,抗体的施用并不是没有潜在的缺陷。根据抗体依赖性增强作用(ADE)理论,如果中和抗体的浓度减少至亚中和水平,那么病毒-抗体免疫复合物可能增强病毒进入具有Fc受体的细胞中,由此增加病毒复制的水平。因此,高抗体水平对于避免使患者遭受更严重的疾病表现的危险将是所必需的。
一种可能的解决方案是获得具有以这样的方式进行修饰的Fc的抗体分子,即使得与其受体的相互作用显著降低。在这个意义上,特别有吸引力的策略是Fc中残基的突变,所述残基直接影响与FCγR-I、FCγR-II和FCγRIII而非FCRn的相互作用,因为后者参与抗体再循环并因此在确定抗体的体内半衰期中是关键的。
另一种备选方案是鉴定不能介导ADE的中和抗体。具有这些特征的至少一种抗体已得到描述(专利:Bavarian Nordic Res.Inst.WO9915692,1998),其在体外模型中中和DV2而不介导ADE。然而,没有关于针对其他血清型的相似抗体的描述,并且没有关于在体内模型中表征这类抗体的可用数据。另外的障碍是下述事实:可用的动物模型无法如实地再现在人中感染的过程和特征。
涉及抗体使用的另一种策略是获得在抗登革抗体和抗红细胞补体受体1抗体之间的双特异性复合物。这些杂聚物将使病毒与红细胞结合,因此极大地增加从血液到组织的病毒清除率(Hahn CS,French OG,Foley P,Martin EN,Taylor RP.2001.Bispecific monoclonalantibodies mediate binding of dengue virus to erythrocytes ina monkey model of passive viremia.J Immunol.2001 166:1057-65.)。
发明详述
本发明描述了如何通过使用在黄病毒中高度保守的E蛋白(‘E’表示包膜(Envelope))的表面中的区域或表位作为关于所述分子的靶,来获得用于针对登革病毒的4种血清型和其他黄病毒的预防性和/或治疗性治疗的有效分子。当用于疫苗设计时,本发明允许产生中和性和保护性的效应,该效应对于所有4种登革病毒血清型具有相似的量级,这是通过使抗体应答限制于E蛋白的这个区域并因此消除针对这种蛋白质的更可变区域的应答来实现的,所述针对这种蛋白质的更可变区域的应答可以引发血清型或亚复合物特异性中和抗体,该中和抗体在随后感染其他血清型期间可以导致免疫扩增。因为所描述的E蛋白的区域是拓扑表位(topographic epitope),所以本发明包括设计突变和使连接稳定以保证包括前述表位的E蛋白亚结构域的正确折叠和分泌。当用于开发用于以预防性或治疗性目的进行被动免疫接种的试剂时,本发明还限定了能够结合在成熟的黄病毒病毒粒子表面上的这种表位的2个、3个或多个对称拷贝的重组分子,由于其对于干扰在病毒复制循环的早期阶段期间病毒粒子所经历的结构改变具有更高的亲合力和更好的潜力,因而所述重组分子具有优于天然抗体和/或其FAb片段的中和与保护特征。
在第一个实施方案中,本发明描述了再现上述E蛋白表位的抗原和结构特征的重组蛋白质的设计。所述重组蛋白质之一被能够中和登革病毒的所有4种血清型的小鼠单克隆抗体所识别,所述小鼠单克隆抗体还识别其他黄病毒。用这种嵌合重组蛋白质进行免疫接种诱导针对4种登革病毒血清型以及其他黄病毒来说为中和与保护性的抗体应答。本发明描述了用于以这样的方式设计嵌合重组蛋白质的方法,即使得包含共同黄病毒中和表位的E蛋白结构域正确折叠。这种表位在性质上是拓扑的(topographic),并因此它的抗原性取决于分子的3D结构。由本发明获得的分子可以用于制药工业以用于获得针对登革病毒和其他黄病毒的疫苗制剂,以及用于设计包含这些蛋白质的诊断系统。
本发明的第二个实施方案描述了其他重组蛋白质的设计,所述重组蛋白质具有针对登革病毒的4种血清型和其他黄病毒的有效中和特性谱。这些蛋白质的氨基酸序列包含结合结构域、间隔物区段和多聚化结构域。结合结构域能够与在所有黄病毒中高度保守的E蛋白表位结合,所述E蛋白表位包含在关于上述本发明的第一个目的方面所描述的蛋白质中。在这个实施方案的变化形式中,结合结构域是识别保守表位的单链抗体片段。间隔物区段是长度3-20个氨基酸的序列,富含优选亲水、极性并具有小侧链的残基,因此赋予间隔物以高度的可动性。这些间隔物一定不能干扰结合结构域和多聚化结构域的折叠,并且另外必须对经由血清蛋白酶进行的切割具有抵抗力。
本发明中描述的多聚化结构域是在其天然状态中优选地结合为二聚体或三聚体的蛋白质或蛋白质结构域,尽管不排除更高等级的结合的四级结构。这些结构域选自人血清或细胞外蛋白质,以便避免自身抗体的可能诱导。本发明中考虑的多聚化结构域的基本特性是不存在与Fc受体的任何相互作用,所述Fc受体参与登革病毒感染的抗体介导的免疫扩增过程。多聚化结构域的四级结构可能取决于共价或非共价相互作用。
在变化形式之一中,多聚化结构域基于来自人抗体的Fc片段,包括铰链区,因为它介导使二聚体结构稳定的链间二硫桥的形成。这些Fc片段缺乏碳水化合物链,通过化学或酶促去糖基化,或通过其在不使蛋白质糖基化的宿主例如大肠杆菌(Escherichia coli)中产生。非糖基化的Fc结构域还可以从高等真核生物的细胞中获得,条件是它们的序列已进行修饰以去除NXT/S基元。非糖基化的Fc结构域可以不再与FcγR受体I-III结合,所述FcγR受体I-III是体外免疫扩增的介质。然而,它们对于与FcRn受体的相互作用仍是完全胜任的,这是对于获得长的体外半衰期所需的特性。
在另一个变体中,多聚化结构域是人胞外基质蛋白的螺旋状的、形成三聚体的片段。
结合结构域和多聚化结构域通过柔性间隔物的连接允许嵌合蛋白质同时结合在黄病毒成熟病毒粒子的二十面体结构上的多个邻近E蛋白单体。这样,产生二聚体蛋白质的[结合结构域]-[间隔物]-[多聚化结构域]的序列变体将能够同时结合2个E蛋白单体。类似地,如果变体产生三聚体蛋白质,那么将同时结合3个单体。
在本发明的第二个实施方案中描述的嵌合蛋白质的中和滴度高于由FAb片段和甚至完整抗体所达到的滴度。这些重组蛋白质以更高的亲合力结合病毒粒子,并且几个E单体的同时啮合干扰在膜融合过程中四级结构的必需改变。通过实践本发明而获得的分子可以用于制药工业以用于获得针对登革病毒和其他黄病毒的预防和/或治疗剂,以及用于开发包含所述分子的诊断系统。
用于疫苗目的的嵌合蛋白质的设计
目前公认的观点是,有效的登革疫苗应当诱导针对4种登革血清型的中和抗体应答。然而,病毒包膜E糖蛋白在血清型之间是可变的。这种序列可变性导致,针对该蛋白质的总体抗体应答针对同种血清型是中和性的,但针对异种血清型则不是,这样增加了产生感染的免疫增强抗体的可能性。
本发明描述了旨在设计针对登革病毒的亚单位疫苗的方法,所述亚单位疫苗诱导针对4种血清型一致地具有中和与保护性的免疫应答。首先,该设计基于暴露于该蛋白质表面上的区域或表位的鉴定,所述区域或表位的保守性在血清型中是总体的或非常高的,并且也暴露在成熟的病毒粒子的表面上。通过对蛋白质进行残基保守性分析,可以鉴定暴露和保守的残基簇(图1和2,表1)。该簇的总表面积是属于25个残基。这个面积与相应于参与蛋白质-抗体相互作用的结合表面的典型值相当。该表位是拓扑的,包括其定位在蛋白质的一级结构上远离但在三维结构中接近的残基。
其次,本发明描述了包含保守表位的重组嵌合蛋白质的设计,使呈递给免疫系统的保守/可变残基之间的比率达到最大值,并达到表位的三维结构的稳定化,其方式与其在完整E蛋白的情况下出现的相类似。描述了2种可能的拓扑结构:
                  B-L-C和C-L-B,
其中,B是来自登革2的E糖蛋白的区段Leu237-Val252和C是区段Lys64-Thr120或来自其他血清型或其他黄病毒的同源区段,或相对于任何上述区段显示出超过80%序列同一性的相似蛋白质序列。相应于黄病毒序列的同源区段B和C通过使用序列比对计算机程序来定义,所述程序比对成对序列或多个序列,如BLAST,FASTA和CLUSTAL(Altschul,S.F.,Gish,W.,Miller,W.,Myers,E.W.& Lipman,D.J.1990,Basic local alignment search tool.J.Mol.Biol.215:403-410.Pearson WR,Lipman DJ.Improved tools for biologicalsequence comparison.Proc Natl Acad Sci U S A.1988;85:2444-8.Higgins D.,Thompson J.,Gibson T.Thompson J.D.,Higgins D.G.,Gibson T.J.1994;CLUSTAL W:improving the sensitivity ofprogressive multiple sequence alignment through sequenceweighting,position-specific gap penalties and weight matrixchoice.Nucleic Acids Res.22:4673-4680)。这些序列比对还允许定义黄病毒序列中的同源残基(也称为等价或相应残基),其相应于对于来自登革2的序列的具体情况在实施例1的表1中鉴定的高度保守的残基。
对于2种所描述的拓扑结构,L是大小通常为1-10个残基的连接体序列,其作用是在关于嵌合蛋白质的折叠并允许表位的3D结构类似于在完整E蛋白的背景中所展示的结构方面,以稳定的方式使区段B和C连接。在嵌合蛋白质的2种拓扑结构变体中,保守表位被完全包括,除去了E蛋白中更可变的其余部分。嵌合蛋白质代表了该包膜糖蛋白的结构域II的亚结构域。这个亚结构域位于结构域II的尖端,并且在结构上与彼此包装在一起的2个反向平行β折叠相符。主要的β折叠由3条β链组成(区段C),和次要的β折叠是β发夹环(区段B)。
亚结构域包含2个二硫桥,并且它通过4个点与E糖蛋白的其余部分连接,这与保守表位的拓扑性质相一致。然而,亚结构域和蛋白质的其余部分之间的接触面为这仅代表了亚结构域的总的溶剂可及表面的12%。这个事实与通过设计如上文关于2个拓扑结构变体所描述的稳定连接或连接体来达到亚结构域的正确折叠的可行性相一致。本发明包括通过残基中的突变来增加嵌合蛋白质的热力学稳定性的可能性,所述残基在病毒粒子表面上是不可接近的并因此不参与和抗体的相互作用。
本发明的首要的且新颖的想法是,即可以基于独特的蛋白质链来开发亚单位疫苗,所述独特的蛋白质链针对4种登革血清型均有效。基于重组蛋白质候选物的目前方法由使用4种重组包膜蛋白质组成,每种血清型1种,它们被组合在疫苗制剂中(专利:Hawaii BiotechGroup,Inc;WO9906068 1998)。E蛋白片段也已评估为可能的候选物,但迄今为止的努力集中于与载体蛋白质一起作为融合蛋白表达的结构域III(专利:Centro de Ingeniería Genética y Biotecnología;WO/2003/008571.Simmons M,Murphy GS,Hayes CG.Short report:Antibody responses of mice immunized with a tetravalent denguerecombinant protein subunit vaccine.Am J Trop Med Hyg.2001;65:159-61.Hermida L,Rodriguez R,Lazo L,Silva R,ZuluetaA,Chinea G,Lopez C,Guzman MG,Guillen G.A dengue-2 Envelopefragment inserted within the structure of the P64kmeningococcal protein carrier enables a functional immuneresponse against the virus in mice.J Virol Methods.2004 Jan;115(1):41-9)。结构域III能够诱导中和抗体应答,但这种应答是血清型特异性的并因此疫苗候选物应当包括来自4种血清型的序列。
本发明的实施例1的嵌合蛋白质PMEC1相应于拓扑结构B-L-C,具有来自登革2的片段B和C的序列和具有2个残基Gly-Gly的连接体序列。还描述了编码嵌合蛋白质PMEC1的基因。质粒pET-sPMEC1-His6编码在N-末端处与信号肽pelB融合和在C-末端处与编码6组氨酸的序列融合的蛋白质PMEC1(序列号12)。
以溶解在大肠杆菌的周质中的形式获得嵌合蛋白质PMEC1。基于金属螯合层析法(IMAC)开发出可容易升级的纯化方法,这允许获得适合于进一步研究的纯蛋白质制剂。纯化的蛋白质通过质谱法进行分析,并且获得的质量/z信号相应于通过假定形成2个二硫桥而由PMEC1的氨基酸序列计算出的理论值。
蛋白质PMEC1显示出被针对4种登革病毒血清型而获得的超免疫腹水和被4G2mAb强烈识别。这种识别取决于二硫桥的正确形成,暗示蛋白质PMEC1具有类似于由天然E蛋白的相应区域所采取的构象。
通过用嵌合蛋白质PMEC1免疫接种小鼠,获得了特征在于针对4种登革血清型的高滴度的中和与保护性应答。
还进行了IHA测定法并获得了针对4种血清型的阳性滴度。在体外中和测试中获得了针对4种血清型的1∶1280的滴度。最后,在小鼠中进行保护测定法,在80-90%的动物中显示出针对4种血清型的保护。
建立由4G2mAb和E蛋白形成的复合物的模型
实施例8显示了对由4G2mAb和E蛋白形成的复合物的结构进行建模。这种抗体识别并中和4种登革血清型和其他黄病毒。
使用CLUSPRO蛋白质-蛋白质对接法(http://structure.bu.edu/Projects/PPDocking/cluspro.html)来获得模型。在该研究中,4G2FAb的晶体学结构(PDB文件1uyw)以及相应于来自登革2的E蛋白的二聚体结构的PDB文件1oan和1oam用作输入文件。表8显示了相应于E蛋白-Fab界面的特征面参数的值,对于建模的复合物所计算出的值类似于对于蛋白质-抗体复合物所获得的典型值,所述蛋白质-抗体复合物的晶体学结构已被解析(表9)。
获得的模型指出,由4G2mAb所识别的表位包括在本发明中鉴定的高度保守的区域。表1显示了符合预测的结构表位的残基(与抗体接触的残基)组和属于高度保守的表面区域的那些残基。根据该模型,来自预测的结构表位的71%残基属于高度保守的区域。
随后,通过将先前预测的模型对接在通过电子低温显微术测定的登革2病毒的结构上而获得在成熟的病毒粒子背景中的复合物模型。这样,获得了一个模型,其中病毒粒子表面上由4G2mAb所识别的所有表位(180个拷贝)被FAb链占据。
相应于与E蛋白二聚体结合的那些FAbs的重链C-末端之间的原子间距离为
Figure A20068005137700231
关于与不对称单位的单体(其不结合为二聚体)结合的Fabs所计算出的相同距离为120和
Figure A20068005137700241
这些距离与IgG分子的结构的序列在立体化学上不相容,这暗示4G2mAb以单价方式与病毒结合。
这种预测得到实施例12中显示的结果的支持,所述结果指出FAb和4G2mAb具有非常相似的中和滴度。这个发现与对于其他抗病毒抗体所获得的数据相反,所述其他抗病毒抗体的二价结合引起中和能力的2-3个数量级的增加(Drew PD,Moss MT,Pasieka TJ,Grose C,Harris WJ,Porter AJ.Multimeric humanized varicella-zostervirus antibody fragments to gH neutralize virus while monomericfragments do not.J Gen Virol.2001;82:1959-63.Lantto J,Fletcher JM,Ohlin M.A divalent antibody format is requiredfor neutralization of human cytomegalovirus via antigenicdomain 2 on glycoprotein B.J Gen Virol.2002;83:2001-5)。
4G2mAb的这种性质可以是各种抗黄病毒抗体共有的,与在黑猩猩抗体1A5的情况下一样,所述黑猩猩抗体1A5识别也位于E蛋白的结构域A中的表位(Goncalvez AP,Men R,Wernly C,Purcell RH,Lai CJ.Chimpanzee Fab fragments and a derived humanizedimmunoglobulin G1 antibody that efficiently cross-neutralizedengue type 1 and type 2 viruses.J Virol.2004;78:12910-8)。一般而言,mAb及其FAb的中和能力之间的平衡取决于表位、抗体的同一性和复合物的立体化学细节。因此,识别位于结构域B上的表位的4E11mAb的中和能力是其相应的FAb的50倍(Thullier,P.,P.Lafaye,F.Megret,V.Deubel,A.Jouan,和J.C.Mazie.1999.A recombinant Fab neutralizes dengue virus in vitro.J.Biotechnol.69:183-190)。
多价中和分子的设计
本发明描述了设计和开发能够同时结合2个或3个拷贝的在病毒粒子表面上的高度保守表位的分子。病毒粒子暴露了总共180个拷贝的在本发明中描述的保守表位。它们可以分组为相应于E蛋白二聚体的90对表位,或匹配在病毒粒子的不对称单位中存在的3个拷贝的E蛋白的60个三联体。本文描述的分子能够二价或三价结合,并显示出改善的对于病毒粒子的结合亲和力和中和能力,其与识别本发明中描述的保守表位的中和抗体相比较在各种等级上是更有效的。所描述的分子中和4种登革病毒血清型和其他黄病毒,并因此可用于预防性和/或治疗性治疗登革病毒和备选地其他黄病毒。
本发明的二价或三价蛋白质分子的序列由下式描述:
             [S]-[L]-[D]或[S]-[L]-[T],
其中,[S]是单链抗体片段(scFv)的序列,其识别本发明中描述的保守表位,[L]是大小通常为3-20个氨基酸的连接体序列,[D]是形成二聚体的蛋白质或其片段的序列,和[T]是形成三聚体的蛋白质或其片段。区段[D]和[T]是不与能够介导病毒感染的免疫增强的FC受体相互作用的蛋白质或蛋白质结构域。这样,可以预防在本发明的二价或三价分子的亚中和浓度时具有FC受体的细胞的病毒感染的增强。因此,关于其不能介导ADE样效应方面,所描述的分子优于抗体。此外,这些分子相比scFvs而言具有更大的尺寸,并因此显示出更长的体内半衰期。
序列[D]和[T]相应于细胞外人蛋白质,优选地来自血清。这样可以防止诱导出将会针对细胞内和/或外源蛋白质而出现的自身抗体应答。
一般而言,如果选择允许发生多价结合的合适的连接体序列,则结构域[D]和[T]可以被能够形成更大寡聚体的多聚化结构域替换。
设计的多聚化(包括二聚化和三聚化)允许增加片段的亲合力并改善其固有的中和能力。在多个点上进行的病毒结合进一步使成熟的病毒粒子的结构稳定,这干扰与膜融合过程相关的四级结构的改变。此外,分子大小的增加引起体内半衰期的升高。这些重组蛋白质(包括抗体Fv片段)可以成为用于控制流行性爆发的有效的治疗和/或预防剂。
本发明描述了编码称为TB4G2的嵌合蛋白质的基因。质粒pET-TB4G2-LH编码在N-末端处与信号肽pelB融合和在C-末端处与编码6组氨酸的序列融合的蛋白质TB4G2(序列号16)。
嵌合蛋白质TB4G2从N-到C-末端包含下述元件:(a)4G2mAb的轻链的可变结构域(序列号25),(b)柔性的间隔物序列(序列号26),(c)4G2mAb的重链的可变结构域(序列号27),(d)15个残基的柔性的间隔物序列(序列号28),(e)人胞外基质蛋白的片段,其允许分子在溶液中三聚化(序列号51)。
嵌合蛋白质TB4G2相应于拓扑结构变体[S]-[L]-[T],其中[S]是4G2mAb的scFv片段,[L]是由GLY和SER残基组成的15个残基的间隔物序列,和[T]是人胞外基质蛋白的三聚化结构域,其形成螺旋状卷曲螺旋三聚体结构,其中α螺旋以平行形式排列(Dames SA,KammererRA,Wiltscheck R,Engel J,Alexandrescu AT.NMR structure ofa parallel homotrimeric coiled coil.Nat Struct Biol.1998;5:687-91)。
这种胞外基质蛋白片段形成通过二硫桥来稳定的共价三聚体,所述二硫桥在位于螺旋的N-末端处的半胱氨酸之间形成。信号肽pelB允许蛋白质TB4G2的周质定位,和因此允许它在体内的正确折叠,这包括结合结构域和三聚化结构域的二硫桥的正确形成。
根据在病毒粒子和4G2Fv之间形成的复合物的模型,在与不对称单位的3个E蛋白单体结合的Fv片段的重链可变区的C-末端之间测得的距离是36、58和
Figure A20068005137700261
这3个C-末端原子局限于半径为的球体中,这表明间隔物区段[L]必须采取与这种距离相容的构象。
在理论上,采取伸展构象的15个残基的区段从N-到C-末端具有
Figure A20068005137700263
的尺寸。然而,此类构象不一定是最稳定的,并且一般而言肽的结构性质由其序列确定。富含GLY和SER的肽基本上是柔性的,并且在溶液中能够采取多重构象。如实施例9中所示,使用PRELUDE(RoomanMJ,Kocher JP,Wodak SJ.Prediction of protein backboneconformation based on seven structure assignments.Influenceof local interactions.J Mol Biol.1991;221:961-79)对于肽构象进行的预测表明,对于序列[L](序列号28)所预测的最有利的构象相应于大约的N-和C-末端之间的距离。这个发现指出,嵌合蛋白质TB4G2的设计在结构上与达到同时结合在病毒粒子的不对称单位中存在的3个E蛋白单体的能力相容。
以溶解在大肠杆菌的周质中的形式获得嵌合蛋白质TB4G2。基于金属螯合层析法(IMAC)开发出可容易升级的纯化方法,这允许获得纯的蛋白质制剂。纯化的蛋白质通过SDS-PAGE电泳进行分析。事先在还原条件下处理的蛋白质TB4G2迁移至相应于单体的质量的条带,和当在非还原条件下处理时迁移至相应于三聚体的质量的条带。
最后,为了比较蛋白质TB4G2相对于4G2mAb及其FAb和(FAb’)2片段的中和能力,在BHK-21细胞中进行针对4种登革病毒血清型的中和测试。蛋白质TB4G2显示出相似的针对4种血清型的中和滴度,其有效性比该抗体及其片段高2-3个等级。
本发明描述了编码称为MA4G2的嵌合蛋白质的基因(序列号17)。嵌合蛋白质MA4G2(序列号56)从N-到C-末端包含下述元件:(a)4G2mAb的轻链的可变结构域(序列号25),(b)柔性的间隔物序列(序列号26),(c)4G2mAb的重链的可变结构域(序列号27),(d)3个残基(Gly-Gly-Gly)的柔性间隔物序列,(e)人IgG1免疫球蛋白分子的铰链、CH2和CH3结构域。在人IgG1的CH2结构域中,该蛋白质具有ASN297->GLN的突变。
嵌合蛋白质MA4G2相应于在本发明中定义的拓扑结构变体[S]-[L]-[D],其中[S]是4G2mAb的单链scFv片段,[L]是序列为GLY-GLY-GLY的3个残基的间隔物区段,和[D]是包含人IgG1免疫球蛋白分子的铰链、CH2和CH3结构域的区段。铰链区介导2条相同的蛋白质链之间的分子间二硫桥的形成,导致稳定的二聚体结构。在人IgG1的CH2结构域中的突变ASN297->GLN防止蛋白质在真核生物中的糖基化,并排除与FcγR I-III的结合。这些受体在体外介导ADE现象。这样,与4G2mAb不同,设计的嵌合蛋白质没有与在亚中和浓度时的ADE相关的危险。然而,该嵌合蛋白质保留了以与抗体分子类似的方式与FcRn受体相互作用的能力,这个性质有利于达到更长的体内半衰期。
质粒pET-MA4G2-LH(序列号20)编码在N-末端处与信号肽pelB(序列号24)融合和在C-末端处与6组氨酸尾融合的蛋白质MA4G2。信号肽pelB允许蛋白质MA4G2在周质中的定位,在那里进行分子内二硫桥(结合结构域、CH2和CH3)以及铰链区之间二硫桥(分子间二硫桥)的正确形成。组氨酸尾允许经由金属螯合层析法来纯化蛋白质。
由蛋白质MA4G2和E蛋白二聚体形成的复合物的3D模型(实施例9),以及中和测试的结果(实施例12)表明,嵌合蛋白质MA4G2在立体化学上与下述相容:同时结合在成熟的病毒粒子的结构中结合为二聚体的单体。这样,二价性导致该蛋白质的生物活性的显著增加。
本发明的一个基本方面在于下述发现:能够与本文所述的E蛋白的高度保守的表面区域结合的分子干扰这种蛋白质的生物学功能,并且此类分子构成了关于针对黄病毒的广谱抗病毒剂的潜在候选物。如实施例12中所示,4G2mAb的片段(包括scFv)显示出类似于完整4G2mAb的中和活性,这表明二价性并非抗病毒活性所必需的。这些结果还显示,所述片段的抗病毒活性取决于对于E蛋白的生物学活性的干扰,并且这种干扰通过与该蛋白质的所描述的高度保守区域的结合来介导。此外,所观察到的抗病毒活性针对黄病毒来说是广谱的。因此,用于鉴定具有这些性质的抗病毒分子的有吸引力的方法是允许鉴定与所描述的高度保守的表面区域相结合的蛋白质、肽和药物样分子的那些方法。此类方法是基于阻断那些抗体与E蛋白的结合的那些方法,所述抗体识别高度保守的表面区域,例如4G2mAb、其相应的Fab和(Fab’)2片段或本发明中描述的嵌合蛋白质。那些方法可以基于免疫酶测定法、放射免疫测定法、使用荧光染料的测定法、以及允许定量分子与E蛋白、病毒粒子或本文描述的显示出高度保守表面区域的嵌合蛋白质的结合的这些测定法。
这些测定法可以用于通过体外筛选化学化合物的文库(包括通过组合化学方法产生的那些)来鉴定有效地针对广谱黄病毒的潜在抗病毒分子。
候选物分子的鉴定可以使用计算机辅助的虚拟筛选法来进行。这些方法基于计算程序如化学化合物的分子对接。使用这些方法,可以模拟化学化合物与蛋白质的结合并定量相互作用强度或结合能,这通过评分函数而从经建模的复合物坐标中预测或计算出来。
分子对接的这些计算程序的例子是程序GOLD(Jones,G.等人,1997.Development and validation of a genetic algorithm forflexible docking.J.Mol.Biol.267,727-748)、DOCK(Kuntz,I.D.等人,1982 A geometric approach to macromolecule-ligandinteractions.J.Mol.Biol.161,269-288)和FLEXX(Olender,R.和Rosenfeld,R.,2001.A fast algorithm for searching formolecules containing a pharmacophore in very large virtualcombinatorial libraries.J.Chem.Inf.Comput.Sci.41,731-738)。这些方法允许筛选大型的分子虚拟文库如ZINC数据库(Irwing,J.J.和Scoichet,B.K.,2005.Zinc-A free Databaseof commercially available compounds for virtual screening.J.Chem.Inf.Model.45,177-182),并测定哪些分子预期结合在受体蛋白质上所选择出的活性位点。就本发明而言,结合位点是先前描述的高度保守的表面区域。在PDB数据库中可用的E蛋白的晶体学结构可以用作关于原子坐标的来源,或备选地可以使用计算模型,所述计算模型借助于诸如经由同源性进行蛋白质建模的方法而获得。
附图描述
图1.相应于黄病毒E蛋白的表面残基的保守性的图示。保守性以灰度等级基础表示,在黄病毒序列中显示出更大保守性的残基更暗。结构域II的高度保守的表面区域是用椭圆标出的。保守性值使用程序CONSURF来进行计算,其中考虑了在SWISSPROT数据库中可获得的那些黄病毒序列的多重序列比对。保守性值使用Pymol在蛋白质表面上进行作图。
图2.相应于来自登革病毒的E蛋白的表面残基的保守性的图示。保守性以灰度等级基础表示,在黄病毒序列中显示出更大保守性的残基更暗。结构域II的高度保守的表面区域是用椭圆标出的。保守性值使用程序CONSURF来进行计算,其中考虑了在SWISSPROT数据库中可获得的相应于4种登革病毒血清型的序列的多重序列比对。保守性值使用Pymol在蛋白质表面上进行作图。
图3.嵌合蛋白质PMEC1的三维结构的模型。B是登革2病毒的E糖蛋白的区段Leu237-Val252,和C是区段Lys64-Thr120。L是由2个残基组成的连接区段。该蛋白质的3D模型使用WHATIF程序包来获得,并且图形使用Pymol来制作。
图4.质粒pET-sPMEC1。
图5.质粒pET-scFv 4G2LH。
图6A.质粒pET-TB4G2LH。
图6B.质粒pET-MA4G2LH。
图7.嵌合蛋白质PMEC1-His6的物理化学表征。A:通过固定化金属亲和层析纯化的(泳道1)以及还原并脲基甲基化的(泳道2)蛋白质的SDS-PAGE电泳。B:该蛋白质的RP-C4反相层析分析,箭头标明主峰的定位。C:相应于通过反相层析收集的主峰的质谱。
图8.概括性示意图,其显示了在所进行的分子对接(使用CLUSPRO程序)的13次计算模拟中获得的结果,以便预测由4G2mAb的Fv片段和来自登革2的E蛋白形成的复合物的结构。列以灰度等级基础显示了在每次模拟中获得的前30种解决方案(簇)的结构性质。解决方案由3种性质代表。第一种性质显示,参与结合的E蛋白结构域从更亮到更暗的灰度分别相应于结构域II、I和III。2种颜色意指与2个结构域同时结合。L和T分别意指,该表位涉及使结构域I和III相连接的连接体或者E蛋白的融合肽(结构域II的尖端)。第二种性质由3种颜色代表,白色意指与病毒粒子的内表面结合,灰色是侧面结合,和黑色意指与病毒粒子的外表面结合。第三种情况是生物学上相关的,假定抗体结合不依赖于病毒粒子结构的主要结构改变。第三种性质相应于抗体互补位,灰色意指结合涉及抗体CDRs(相关解决方案),白色意指结合不涉及CDRs(无关解决方案)。与可用的实验数据相容的解决方案用箭头显示。它们的性质相应于浅灰色-黑色-灰色的颜色。位于图形顶部的前2个箭头标明了在模拟中使用的配体和受体的限定,并且包括相应于在模拟中使用的E蛋白晶体结构的PDB文件标识符。在每次模拟中使用的蛋白质-蛋白质对接程序(dot或zdock)在每一列的下方显示。
图9.建立在来自登革病毒2的成熟病毒粒子和180个拷贝的Fab4G2之间形成的复合物的模型。该模型通过使先前预测的Fab4G2-E蛋白复合物的结构对接到通过电子低温显微术获得的成熟病毒粒子的结构(1THD)中来获得。在该图中显示了,与在不对称单位中发现的3个E蛋白单体结合的Fab的重链的C-末端之间的距离。
图10.由嵌合蛋白质MA4G2和E蛋白二聚体形成的复合物的计算机模型。该图使用程序Pymol获得。
图11.相应于肽序列(GGGS)3GGG的构象子稳定性的预测。构象子的能量显示为N-和C-末端之间的距离的函数。预测使用程序PRELUDE来进行。
实施例
实施例1-嵌合蛋白质PMEC的设计。
为了鉴定在E蛋白表面上的保守区域,使用CUNSURF方法来进行保守性分析(ConSurf:identification of functional regions inproteins by surface-mapping of phylogenetic information.Glaser,F.,Pupko,T.,Paz,I.,Bell,R.E.,Bechor-Shental,D.,Martz,E.和Ben-Tal,N.;2003;Bioinformatics 19:163-164)。在结构域II的尖端上观察到高度保守的表面区域,其在4种登革病毒血清型和其他黄病毒中是保守的(图1和2)。
高度保守的表面区域定义了拓扑表位,其由与定位在三维结构中接近但在E蛋白的序列中远离的残基来定型。这个表面区域包含在位于结构域II的末端上的亚结构域上,并且它由E蛋白的2个线性区段即Leu237-Val252(区段B)和Lys64-Thr120(区段C)来定型。表1显示了该亚结构域的残基列表,所述残基位于病毒粒子的外表面上并因此对于与抗体的相互作用来说是易接近的。高度保守的残基定义了由本发明鉴定的区域或表位。
对于E蛋白的结构域II的结构的检查表明,该亚结构域呈现了类似于在结构上独立的结构域的结构特征。与该蛋白质的其余部分的接触面为
Figure A20068005137700321
这仅代表了亚结构域的总的溶剂可及表面积的12%。此外,该结构的这个部分在CATH数据库中被定义为结构域(CATH结构域1svb03,http://www.biochem.ucl.ac.uk/bsm/cath/cath.html)。
             表1.本发明的相关残基的定义,
        所述残基位于E蛋白的结构域II的末端上
             并且暴露在病毒粒子表面上。
Figure A20068005137700322
Figure A20068005137700331
AA:氨基酸。No.E DEN2:来自登革2的E蛋白的序列中的残基数目。No. PMCE1:嵌合蛋白质PMEC1的序列中的残基数目。ACC:用WHATIF计算的溶剂可及表面积(Vriend G.WHAT IF:a molecular modeling and drug designprogram.J Mol Graph.1990;8:52-6,29)。在E蛋白的原子模型上进行计算,所述原子模型通过将结构域I、II和III的3D结构(PDB文件1oan)独立地对接在成熟病毒粒子的结构(PDB文件1THD)上而获得。CONS:使用CONSURF计算出的保守性得分,其中使用两序列比对,考虑到黄病毒序列和分别来自4种登革病毒血清型的序列。负值指示更高的保守性,和斜体强调相应于被定义为高度保守的残基的值。表位:根据在实施例8中通过分子对接而获得的3D模型,与4G2Fab接触的残基。考虑了具有至少一个这样的原子的那些残基,所述原子的范德华球体与4G2Fab的原子的范德华球体相隔少于*在DEN2病毒中糖基化的ASN22。
为了获得独立地折叠的亚结构域,首先必须使唯一的多肽链中的2个区段相连接。两种可能的连接或拓扑结构是可能的:
                     B-L-C和C-L-B
其中L是连接体或间隔物区段。连接体必须在立体化学上与亚结构域的三维结构相容,并且在最佳情况下对嵌合蛋白质的热力学稳定性提供稳定化效应。残基Val252和Lys64的α碳之间的距离是
Figure A20068005137700342
因此拓扑结构B-L-C可以通过使用具有一个或多个残基的连接体来获得。在PDB数据库上进行的可能的连接转角的结构分析(搜索与锚定区段的结构相容的转角(在WHATIF程序包的DGLOOP菜单中的DGINS命令))表明,2个残基的连接比1个残基的连接更常见。在拓扑结构C-L-B的情况下,残基Thr120和Leu237的α碳之间的距离是
Figure A20068005137700344
这与3-4个残基或更多残基的连接相一致。
本发明的嵌合蛋白质PMEC1(序列14)相应于拓扑结构B-L-C,其中片段B和C相应于来自登革2病毒的序列和具有2个残基Gly-Gly的连接体序列。
作为B和C区段序列,不仅可以选择相应于DEN2病毒的序列,还可以选择来自其他黄病毒的同源序列,包括但不限于,DEN1、DEN3、DEN4、日本脑炎病毒、蜱传脑炎病毒、西尼罗病毒、墨累山谷脑炎病毒、圣·路易脑炎病毒、兰加特病毒、黄热病毒、玻瓦散病毒(序列29-42)。
此外,根据上述方法设计的嵌合蛋白质可以在一个或多个残基上进行突变,目的是增加该蛋白质的热力学稳定性或折叠过程的效率。可以突变表1中描述的那些残基,所述残基显示出在病毒粒子表面上对于与抗体的相互作用是不易接近的。可进行突变的残基是包埋在该蛋白质的3D结构中和/或位于在成熟病毒粒子中存在的E蛋白的3D/4D结构的侧面和内表面中的那些残基。
突变的蛋白质可以通过组合性的实验方法例如丝状噬菌体文库来获得。蛋白质还可以使用理论方法如FOLDX、POPMUSIC和Rosseta来进行设计。
序列43-50相应于在多个位置上进行突变的嵌合蛋白质PMEC1的类似物。这种蛋白质的三维模型显示出良好的包装和品质。在暴露的蛋白质表面上的突变也是可能的,特别是在登革病毒血清型和其他黄病毒中并非严格保守的残基上,条件是这些突变必须不影响与识别E蛋白的保守亚结构域的保护性和中和性抗体的相互作用。
实施例2-质粒pET-sPMEC1的构建
为了获得编码蛋白质PMEC1(序列号1)的重组基因,使用存在于质粒p30-VD2上的编码来自DEN2病毒(毒株1409,基因型Jamaica)的E蛋白的基因(序列号2)(Deubel V.,Kinney R.M.,Trent D.W.;″Nucleotide sequence and deduced amino acid sequence of thestructural proteins of dengue type 2 virus,Jamaica genotype″,Virology 155(2):365-377,1986)。这种基因编码序列号3中显示的蛋白质。使用Agarwal等人的方法(Agarwal KL,Büchi H,Caruthers MH,Gupta N,Khorana HG,Kumas A,Ohtsuka E,RajbhandaryUL,van de Sande JH,Sgaramella V,Weber H,Yamada T,Totalsynthesis of the Gene for an alanine transfer ribonucleic acidfrom yeast,1970,Nature 227,27-34),并从通过亚磷酰胺化学(Beaucage SL,Caruthers MH,Deoxynucleoside phosphoramidites-A new class of key intermediates for deoxypolynucleotidesynthesis.,Tetrahedron Letters,1981,22,1859)在固相上合成的寡核苷酸开始,获得编码PMEC1蛋白质的双链DNA分子(序列号4)。这种DNA分子的序列具有下述元件:1)关于Nco I限制酶的识别位点,其包含编码甲硫氨酸(M)的起始密码子,随后为编码丙氨酸(A)的密码子(序列号5);2)相应于登革病毒2毒株Jamaica 1409的E蛋白基因的第709位至第756位的序列的片段(序列号6),其编码序列号7中显示的肽序列,其反过来相应于序列号3的第237-252位;3)编码2个连续的甘氨酸的连接体区段(序列号8);4)相应于由序列号2的第190-360位所包括的序列的片段,其编码序列号9中显示的肽序列(这相应于序列号3的第64-120位),其中已引入沉默突变,所述沉默突变消除了在所述序列的第284-289中存在的Nco I限制位点(序列号10);和5)关于Xho I限制酶的识别位点,其包含分别编码亮氨酸(L)和谷氨酸(E)的2个密码子(序列号11)。这种合成的分子在由制造商指定的条件下用Nco I和Xho I限制酶(Promega Benelux b.v.,The Netherlands)进行消化,并在由制造商指定的条件下使用T4DNA连接酶(Promega Benelux,b.v.,TheNetherlands)连接至事先同样地进行消化的质粒pET22b(Novagen,Inc.,USA)。根据Sambrook等人(Sambrook J,Fritsch EF,ManiatisT.Molecular cloning:A laboratory manual.New York,USA:ColdSpring Harbor Laboratory Press;1989)所述,将反应体系转化到大肠杆菌菌株XL-1Blue(Bullock WO,Fernández JM,Short JM.XL-1Blue:A high efficiency plasmid transforming recAEscherichia coli K12 strain with beta-galactosidase selection.Biotechniques 1987;5:376-8)中,并且通过限制性分析来筛选在选择性培养基中存活的菌落之中存在的质粒。所得到的重组质粒之一命名为pET-sPMEC1(图4),并且其序列(序列号12)通过自动化Sanger测序来验证。
质粒pET-sPMEC1编码在其N-末端上与pelB前导肽融合以及在其C-末端上与编码6组氨酸的序列融合的蛋白质PMEC1(序列号13)。这种安排一方面允许这种蛋白质在宿主中通过切割前导肽进行加工和分泌至大肠杆菌周质中,在那里占优势的氧化条件有助于PMEC1的正确折叠和二硫桥的形成,并且另一方面还允许通过固定化金属亲和层析(IMAC)(Sulkowski,E.(1985)Purification of proteins byIMAC.Trends Biotechnol.3,1-7)来容易地纯化这种蛋白质。在加工和分泌至周质后被命名为PMEC1-His6的该蛋白质的最终序列显示于序列号14中。
实施例3-PMEC1-His6的表达和纯化
将质粒pET-sPMEC1转化(Sambrook J,Fritsch EF,Maniatis T.Molecular cloning:A laboratory manual.New York,USA:ColdSpring Harbor Laboratory Press;1989)到大肠杆菌菌株BL21(DE3)中(Studier,F.W.和B.A.Moffatt.“Use of bacteriophage T7RNA polymerase to direct selective high-level expression ofcloned genes.″J.Mol.Biol.189.1(1986):113-30),并且用单个分离的菌落接种补充有50μg/mL氨苄青霉素的Luria-Bertani培养基(LBA)的50mL培养物,并于30℃在350r.p.m.下生长12小时。使用这种培养物,将1L LBA培养基接种至0.05的620nm处起始光密度(OD620),其随后于28℃生长8小时直至指数期晚期。然后,这种培养物通过添加异丙基硫代半乳糖苷(IPTG)进行诱导,并且在相同条件下再生长5小时。
将如上所述获得的培养物于4℃在5000xg下离心30分钟,并且使用Ausubel等人的方法(Ausubel,F.M.,Brent,R.,Kingston,R.E.,Moore,D.D.,Seidman,J.G.,Smith,J.A.和Struhl,K(1989)Current Protocols in Molecular Biology.John Wiley & Sons,New York)从所得到的生物量中提取周质级分。通过使用具有1000Da的截止值的膜,将这种级分针对50mM磷酸盐缓冲液pH 7/20mM咪唑进行透析,并且根据制造商的说明,使用Ni-NTA琼脂糖(QiagenBenelux B.V.,The Netherlands),通过固定化金属亲和层析(Sulkowski,E.1985,Purification of proteins by IMAC.TrendsBiotechnol.3,1-7)从透析液中获得蛋白质PMEC1-His6。
实施例4-嵌合蛋白质PMEC1-His6的物理和化学表征
通过IMAC纯化的PMEC1-His6的制剂在SDS-PAGE(图7A)上显示出主要条带,其以相应于对于这种蛋白质所预期的那种的表观质量(约9500Da)进行迁移,证明了该制剂的高纯度。同一图显示,当与未还原的样品(泳道1,图7A)相比较时,相应于还原的且脲基甲基化的PMEC1-His6的条带(泳道2,图7A)具有略微减少的电泳迁移。这种行为表明,该蛋白质是经正确折叠的,其具有参与分子内二硫桥的半胱氨酸。
将80μg等分试样的PMEC1-His6在C4 4.6×250mm反相HPLC柱(J.T.Baker,USA)中进行分析。层析运行于37℃进行,使用配备有2个泵和控制器的高压层析系统。该蛋白质的洗脱通过在0.1%(v/v)三氟乙酸中的10-60%(v/v)线性乙腈梯度来完成,以0.8mL/分钟的流速,并在226nm处进行检测。层析图产生单个峰,这证实该制剂的高同质性(图7B)。
通过质谱法来分析来自RP-HPLC的峰,目的是以更高的精确度测量蛋白质的分子量,并验证二硫桥的氧化状态。在配备有Z-喷雾电雾化电离源的、具有八角形几何形状的杂合质谱仪QTOF-2TM(Micromass,UK)上获得质谱。所获得的质谱使用MassLynx版本3.5(Micromass,UK)软件来进行加工。PMEC1-His6制剂的主要种类的质谱具有9219.51Da的分子量(图7C),并且这个值与根据该基因序列的期望值仅差0.05Da。这个分析证实,该分子上的半胱氨酸残基参与形成二硫桥,并排除了不希望有的翻译后修饰例如易受影响的氨基酸的N-或C-末端降解或修饰的存在。
实施例5-PMEC1的抗原性表征
使用单克隆和多克隆鼠类抗体以及登革反应性人血清,通过斑点印迹法来表征纯化的PMEC1蛋白质(表2和3)。使用由与6组氨酸标签相融合的Den-2病毒(基因型Jamaica)的E蛋白的结构域III组成的重组蛋白质DIIIe2作为阴性对照。不同于PMEC1,DIIIe2相应于在E蛋白上的具有更高序列可变性的区域。重组结构域III被抗Den超免疫腹水(HIAF)强烈识别,所述抗Den超免疫腹水显示出对同种血清型的显著特异性并且丧失大部分对于还原这个结构域的二硫键的反应性。在抗体反应性中针对结构域III的这种血清型特异性也已在人抗体应答中发现。在该测定法中还包括3H5mab作为对照。不同于4G2mAb,3H5识别在Den-2的结构域III内的血清型特异性表位。这2种mAbs的反应性受到用还原剂进行处理的影响(Roehrig JT,VolpeKE,Squires J,Hunt AR,Davis BS,Chang GJ.Contribution ofdisulfide bridging to epitope expression of the dengue type 2virus envelope glycoprotein.J Virol.2004;78:2648-52)。
        表2.在斑点印迹法中针对PMEC1蛋白质的
            单克隆和多克隆抗体的反应性
Figure A20068005137700391
*将10微克纯化的PMEC1和DIIIe2蛋白质加载至硝酸纤维素膜上。RC:还原的且脲基甲基化的蛋白质。信号强度以+至+++的等级进行评估。
**以1∶100的稀释度使用HIAFs。以10μg/mL的浓度使用3H5和4G2mabs。
***TBE:蜱传脑炎病毒,YFV:黄热病毒,SLV:圣·路易脑炎病毒,GF:与黄病毒组交叉反应的。
PMEC1被针对Den的4种血清型而获得的HIAF以及被4G2mAb识别。在针对所评估的不同黄病毒而获得的其余HIAF中,抗SLE显示出最高的针对PMEC1的反应性,具有与对于抗-Den HIAF所获得的相似的信号强度。抗-TBE和抗-YF HIAF也识别PMEC1,尽管强度较低。不同HIAF的反应性高度依赖于PMEC1的二硫键的存在,这表明该蛋白质以与在病毒上的E蛋白的天然结构相似的构象进行正确折叠。
还在斑点印迹法中通过与人血清的反应性表征了PMEC1蛋白质,所述人血清来自在不同流行病学情况下已感染了Den的人。在该测定法中包括来自4种病毒血清型(即,Den1、Den2、Den3和Den4)的初次感染的恢复期个体的血清。还使用来自已患有Den2或Den3的继发感染的个体的血清。作为来自3个个体的血清混合物来使用人抗体,所述3个个体在相同流行病中被感染,并具有相似的临床症状和相似的血清学结果。就针对病毒抗原和PMEC1蛋白质的IgM抗体的存在来评估每种血清。
表3.在斑点印迹法中人抗体针对PMEC1蛋白质的反应性。
Figure A20068005137700401
*来自被DEN-1、DEN-2、DEN-3和DEN-4初次感染(PI)的恢复期个体的血清混合物。
**来自被DEN-2和DEN-3继发感染(SI)的恢复期个体的血清混合物。
***将10微克纯化的PMEC1和DIIIe2蛋白质加载至硝酸纤维素膜上。RC:还原的且脲基甲基化的蛋白质。信号强度以+至+++的等级进行评估。DEN Ag:4种血清型的病毒抗原的混合物。病毒抗原得自被感染的Vero细胞的上清液。
阴性对照:由未感染的Vero细胞的上清液组成的对照制剂。以1∶400的稀释度使用人血清。以10μg/mL的浓度使用3H5和4G2mabs。
来自感染了不同病毒血清型的个体的人血清以相似的强度识别PMEC1。使用来自患有继发感染的个体的血清获得了最强的信号,这与在抗病毒识别的ELISA测定法中具有更高滴度的血清相一致。
实施例6-通过用PMEC1蛋白质进行免疫接种而获得的抗体应答的表征。
一组80只Balb/c小鼠通过腹膜内(i.p)途径用20μg由弗氏佐剂乳化的纯化PMEC1进行注射。10只小鼠在第4次剂量后进行抽血,并且收集血清用于进一步的血清学分析。通过ELISA测量的抗Den抗体滴度对于该病毒的4种血清型类似地高(表4)。平行地,引发的Abs的功能性通过血细胞凝集抑制(IHA)和蚀斑减少中和试验(PRNT)来进行测量。在IHA测定法中,抗PMEC1抗体产生针对4种Den血清型的阳性滴度(表5)。还获得了针对4种病毒的1/1280的中和滴度(表6)。
表4.通过用PMEC1蛋白质进行免疫接种而获得的
          血清的抗Den抗体滴度。
6 1∶64000 1∶64000 >1∶128 000 1∶64000
7 >1∶128 000 >1∶128 000 >1∶128 000 >1∶128 000
  8   1∶128 000   1∶64000   1∶128 000   1∶128 000
  9   >1∶128 000   >1∶128 000   >1∶64 000   >1∶128 000
  10   >1∶128 000   >1∶128 000   >1∶64 000   >1∶128 000
*抗体滴度通过终点稀释度来确定。每种血清用从感染所述的每种病毒血清型的哺乳期小鼠脑中获得的病毒抗原制剂平行地进行评估(Clarke,D.M.,Casals,J.Techniques for hemaglutination andhemaglutination-inhibition with arthropode-borne viruses.American Journal of Tropical Medicine and Hygiene 1958.7:561-573)。从未接种的小鼠脑中获得的相似制剂用作阴性对照。
         表5.通过用PMEC1蛋白质进行免疫接种
             而产生的抗体的IHA滴度。
Figure A20068005137700421
*IHA滴度被定义为抑制由8个血凝病毒单位引起的鹅红细胞血凝的最大稀释度。
表6.使用来自用PMEC1蛋白质进行免疫接种的动物的血清
             来进行的病毒中和测定法
*中和滴度被定义为在BHK-21细胞中产生病毒蚀斑的50%减少的稀释度。
实施例7-保护测定法
将在抽血后所留下的用PMEC1免疫接种的动物进行分组并用于进行攻击研究。4个组(每组15只动物)通过颅内(i.c)注射来用100LD50的4种病毒血清型之一的神经适应性活毒株进行接种,并观察21天。第5组(10只动物)未接受病毒攻击。阳性对照由进行免疫接种并随后用病毒的同种血清型(即Den1、Den2、Den3和Den4)攻击的15只动物的组构成。另外的4个组(15只小鼠)各自用作实验的阴性对照;这些动物接受PBS作为免疫原并用不同的病毒血清型进行攻击。用PMEC1免疫接种的动物组显示出80%-90%的动物存活,而用PBS免疫接种的小鼠在病毒接种后7-11天发展出脑炎的症状,并在第21天前死亡(表7)。100%的来自病毒免疫接种组的动物得到保护。
表7.在用蛋白质变体免疫接种的小鼠中
对于致命Den病毒攻击的存活百分比。
  免疫原   病毒血清型  存活百分比*
  PBS   DEN-1  0
  PBS   DEN-2  0
  PBS   DEN-3  0
  PBS   DEN-4   0
  DEN-1   DEN-1   100
  DEN-2   DEN-2   100
  DEN-3   DEN-3   100
  DEN-4   DEN-4   100
  PMEC1   DEN-1   86
  PMEC1   DEN-2   80
  PMEC1   DEN-3   90
  PMEC1   DEN-4   86
*用下式计算的:(存活小鼠的#)/(小鼠的总#)。在攻击后21天收集存活小鼠数据。
实施例8-由4G2mAb和E蛋白形成的复合物的结构预测
为了建立抗原-抗体复合物的结构的模型,使用4G2mAb的Fab片段的晶体学结构(1uyw)和来自登革病毒2的包膜E蛋白的2个晶体学结构(PDB文件1oan和1oam)进行分子对接研究。CLUSPRO方法用于进行预测(http://nrc.bu.edu/cluster/,S.R.Comeau,D.W.Gatchell,S.Vajda,C.J.Camacho.ClusPro:an automateddocking and discrimination method for the prediction of proteincomplexes.(2004)Bioinformatics,20,45-50),其包括用于产生潜在复合物的结构的2种不同程序:DOT合ZDOCK(Mandell JG,Roberts VA,Pique ME,Kotlovyi V,Mitchell JC,Nelson E,Tsigelny I,Ten Eyck LF.(2001)Protein docking using continuumelectrostatics and geometric fit.Protein Eng 14:105-13.ChenR,Li L,Weng Z(2003)ZDOCK:An Initial-stage Protein-DockingAlgorithm.Proteins 52:80-87)。
总共进行了13次分子对接模拟,其中改变了下述参数:对接程序(DOT或ZDOCK)、配体和受体(Fv片段或E蛋白)的限定、E蛋白的晶体学结构(1oan或1oam)、E蛋白的四级结构(单体或二聚体)、使用限制以过滤涉及E蛋白的Fv片段或N-末端区段(残基1-120)的结合位点的解决方案(DOT中的Attract选项)。图7显示了概括模拟结果的示意图。那些复合物被视为潜在的解决方案,其预测位于E蛋白的结构域II中的表位,根据病毒粒子的结构,这个表位对于与抗体的相互作用来说是易接近的,和互补位是抗体的高变区。结构域II中的表位A1(由4G2mAb识别的表位)的定位得到实验数据的支持,并且已经确定针对相同表位的相关抗体识别由E蛋白的氨基酸1-120组成的蛋白水解片段(Roehrig,J.T.,Bolin,R.A.和Kelly,R.G.Monoclonal Antibody Mapping of the Envelope Glycoprotein of theDengue 2 Virus,Jamaica.1998,Virology 246:317-328)。
获得在结构上非常相似的6种可能的解决方案。表8显示了相应于预测的E蛋白-Fv复合物的界面参数的值,对于预测的复合物所计算出的值类似于对于其晶体学结构先前已通过实验进行了测定的蛋白质-抗体复合物所计算出的那些(表9)。
接触抗体的E蛋白的表面区域涉及该蛋白质序列的4个区段。这个发现与这样的表位的拓扑性质相一致,所述表位的识别依赖于蛋白质的正确折叠,并且易受二硫桥的还原的影响。由三维模型定义的结构表位包含在黄病毒中高度保守的区域,这与这种抗体的广泛交叉反应性和实施例5中所显示的对于嵌合蛋白质PMEC1的识别相一致。该模型还暗示,这种抗体的中和机制涉及干扰E蛋白与膜的结合和/或与融合过程相关的三聚化。
此外,由该抗体识别的表位与参与E蛋白和preM之间的相互作用的区域相一致,如从在未成熟病毒粒子的电子低温显微术研究中相应于preM的电子密度所推断的。与相互作用表面的保守性相关的进化压力可以解释E蛋白上的这个表位的高度保守性。此外,这个表面区域中逃避突变体的出现是较不可能的,因为此类突变应当通过preM的表面上的稳定化同时突变而得到补偿。事实上,针对这种抗体而获得的逃避突变体位于结构域I和II之间的铰链区中,并且突变型病毒显示出在其融合膜的能力方面被高度减弱和具有缺陷。这构成了本发明的PMEC嵌合蛋白质作为针对黄病毒的重组疫苗候选物的有利性质。
其后,我们在成熟病毒粒子的结构的背景中建立了Fab4G2和E蛋白之间的相互作用的模型。为此,将先前已建模的复合物对接到成熟病毒粒子的电子低温显微术结构中。为了获得该模型,使用:1)相应于通过电子低温显微术而获得的病毒粒子的结构的PDB文件1THD,2)由Fab4G2和E蛋白的单体形成的复合物的坐标,其先前通过分子对接进行了建模,3)将相应于文件1THD的二十面体对称操作应用于先前通过分子对接进行了建模的复合物。
这样,获得了这样的模型,其中存在于病毒粒子上的由4G2mAb识别的表位的所有拷贝(180)被Fab占据(图9)。
             表8.相应于由4G2mAb和E蛋白形成的
                 复合物的模型的界面性质。
  界面参数*   对于Fv的值   对于E的值
  界面的可接近表面   1070.14   1034.10
  界面的可接近表面%   10.60   5.20
  平面性   2.46   2.50
  长度和宽度   32.62和24.75   39.74和26.44
  长度/宽度比   0.67   0.55
  界面的残基区段   7   4
  界面的极性原子%   51.78   46.49
  界面的非极性原子%   48.20   53.50
  二级结构   Beta   Beta
  氢键   16   16
  盐桥   0   0
  二硫桥   0   0
  分离体积(Separation Volume)   4618.96   4618.96
  分离体积指数   2.20   2.20
*蛋白质-蛋白质界面参数使用下述网络服务器来进行计算:http://www.biochem.ucl.ac.uk/bsm/PP/server/。
对于Fab片段的重链C-末端残基之间的距离进行的检查表明,如果没有病毒粒子的结构中的显著改变,那么抗体二价结合是不可能的。这个观察结果与实施例12中获得的结果一致,显示等摩尔量的Fab和mAb显示出非常相似的中和滴度。这个发现与对于二价结合方式所预期的2-3个数量级的增加相反。
表9.蛋白质-抗体复合物的特征性界面性质*。
*Jones,S.和Thornton,J.M.(1996).Principles of Protein-ProteinInteractions Derived From Structural Studies PNAS.第93卷,第13-20页。http://www.biochem.ucl.ac.uk/bsm/PP/server/
实施例9-嵌合蛋白质MA4G2(二价)和TB4G2(三价)的设计。
在这个实施例中,显示了基于4G2mAb结合位点的嵌合蛋白质的设计,其可以同时结合2个或3个拷贝的在成熟病毒粒子中显示的E蛋白单体。实施例8的建模研究表明,Fabs的重链C-末端残基之间的距离分别是80、100和
Figure A20068005137700481
所述Fabs与位于病毒粒子的不对称单位中的E蛋白单体结合。这些值太大而不允许抗体与病毒粒子的二价结合(图9)。在相应于与来自不同不对称单位的E蛋白单体结合的Fabs的C-末端残基之间所计算的距离仍较大。然而,与不对称单位结合的Fv片段的重链C-末端残基之间所计算的距离分别为36、58和
Figure A20068005137700483
这3个原子局限于半径
Figure A20068005137700484
的圆中,表明通过经10-15个残基的连接体区段与三聚化结构域相融合,三价结合是可能的。
类似地,与E蛋白二聚体结合的Fv片段的重链C-末端之间的相应距离是
Figure A20068005137700485
表明通过用5-10个残基的小连接体区段与二聚化结构域相融合,二价结合是可能的。
微型抗体类型分子(二价结合)的设计
作为二价结合分子的例子,设计了嵌合蛋白质MA4G2。它的序列从N-到C-末端包含下述区段:
1-scFv,VL-连接体-VH类型(序列号25、26和27)的4G2mAb的单链Fv片段,VL是4G2mAb的轻链可变区,和VH是该抗体的重链可变区;
2-GGG,具有3个甘氨酸残基的连接体区段;
3-铰链-CH2-CH3,相应于人IgG1分子的铰链区以及恒定结构域2和3的序列,并且糖基化位点N297已突变为甘氨酸(序列号52)。
蛋白质MA4G2可以在真核生物和原核生物中进行表达,并且由于在位于铰链区的半胱氨酸残基之间的分子间二硫桥的形成,它结合为二聚体,这样在该分子的C-末端部分处展示出人FC结构域。铰链区展示出足够的间隔和柔性,并因此具有3个残基的连接体(GGG)足够作为在scFv结构域和铰链-FC区段之间的连接物。图10显示了由嵌合蛋白质MA4G2和E蛋白二聚体形成的复合物的3D结构的模型,表明了与病毒粒子二价结合的可行性。
糖基化位点处的突变的存在允许在真核生物中获得具有非糖基化的FC的分子。非糖基化的FC结构域不与FcγRI-III受体结合,所述受体FcγRI-III能够在体外介导感染免疫增强(Lund,J.,Takahashi,N.,Pound,J.D.,Goodall,M.,和Jefferis,R.1996,J.Immunol.157,4963-4969.Lund,J.,Takahashi,N.,Pound,J.D.,Goodall,M.,Nakagawa,H.,和Jefferis,R.1995,FASEB.J.9,115-119)。这样,与原始抗体分子不同,设计的蛋白质没有任何在亚中和浓度时介导ADE的危险。此外,该嵌合蛋白质保留与天然抗体相似的FcRn受体结合性质,这是展示长的体内半衰期所希望的。
嵌合三价蛋白质TB4G2
作为三价结合分子的例子,设计了嵌合蛋白质TB4G2,其序列如下:
                      scFv-连接体-T
其中,
1-scFv,VL-连接体-VH类型(序列号25、26和27)的4G2mAb的单链Fv片段,VL是4G2mAb的轻链可变区,和VH是该抗体的重链可变区;
2-连接体,其是序列为(GGGS)3GGG的连接体区段(序列号28);
3-T是人胞外基质蛋白的螺旋状的三聚化结构域(序列号51)。
胞外基质蛋白的三聚化结构域是三聚化为平行卷曲螺旋结构的α螺旋。该三聚体包括由定位于接近每个单体的N-末端的2个半胱氨酸残基所形成的6个分子间二硫桥。这种三聚螺旋状结构在50℃时是高度稳定的,dG=7kcal/mol(Wiltscheck R,Kammerer RA,Dames SA,Schulthess T,Blommers MJ,Engel J,Alexandrescu AT.Heteronuclear NMR assignments and secondary structure of thecoiled coil trimerization domain from cartilage matrix proteinin oxidized and reduced forms.Protein Sci.1997;6:1734-45)。二硫桥确保甚至在极低浓度时也能够获得共价连接的三聚四级结构,其比仅基于非共价相互作用的三聚体有利。
连接体区段由氨基酸Gly和Ser组成,并且它是非常具有柔性的。具有类似组成的氨基酸序列已在蛋白质工程中非常频繁地用作连接体序列。尽管10个残基的区段可以提供对于与病毒粒子的三价结合来说所必需的
Figure A20068005137700501
的间隔,但唯一可靠的是该区段是否采取完全伸展的构象。在溶液中,连接体区段可以展示出处于热力学平衡的多重构象,并且采取独特的伸展构象将暗示显著的熵能丧失。为了研究连接体区段的结构性质,使用程序PRELUDE进行15个残基(GGGS)3GGG序列的结构预测。这种方法基于描述局部相互作用的统计学潜能,并且它先前已用于肽结构预测。图11显示了能量值对预测的更有利构象的N-和C-末端之间的距离的图。最低能量相应于
Figure A20068005137700502
的尺寸,和最伸展的构象(超过
Figure A20068005137700503
)是非常不利的。因此,这些计算表明,被选择为连接体区段的序列对于三价结合分子的设计是适当的。
实施例10-获得编码具有来自抗体4G2的可变区的单链抗体片段(scFv 4G2)、三价分子(TB4G2)和单链微型抗体(MA4G2)的质粒。
为了获得具有来自单克隆抗体4G2的可变区的单链抗体片段、多聚蛋白质和单链微型抗体(MA4G2),使用Agarwal等人的方法(AgarwalKL,Büchi H,Caruthers MH,Gupta N,Khorana HG,Kum as A,OhtsukaE,Rajbhandary UL,van de Sande JH,Sgaramella V,Weber H,Yamada T,Total synthesis of the Gene for an alanine transferribonucleic acid from yeast,(1970),Nature 227,27-34),从通过亚磷酰胺化学(Beaucage SL,Caruthers MH,Deoxynucleosidephosphoramidites-A new class of key intermediates fordeoxypolynucleotide synthesis.,Tetrahedron Letters,(1981),22,1859)在固相上合成的寡核苷酸开始合成双链DNA分子(序列号15、序列号16和序列号17),所述双链DNA分子各自在由制造商指定的条件下用限制酶Nco I和Xho I(Promega Benelux b.v.,TheNetherlands)进行消化。随后,在由制造商指定的条件下,使用T4DNA连接酶(Promega Benelux,b.v.,The Netherlands)将每种经消化的分子连接至先前用相同酶消化的质粒pET22b(Novagen,Inc.,USA)。根据由Sambrook等人(Sambrook J,Fritsch EF,Maniatis T.Molecular cloning:A laboratory manual.New York,USA:ColdSpring Harbor Laboratory Press;1989)所描述的条件,将连接产物转化到大肠杆菌菌株XL-1Blue(Bullock WO,Fernández JM,ShortJM.XL-1Blue:A high efficiency plasmid transforming recAEscherichia coli K12 strain with beta-galactosidase selection.Biotechniques 1987;5:376-8)中,并且通过限制性分析来筛选在选择性培养基上生长的所得菌落中存在的质粒。来自每次转化的几种重组质粒的序列通过自动化Sanger测序来进行验证,并且对于每次反应选择其序列与预期序列相匹配的代表性分子。这些质粒被命名为pET-scFv 4G2LH(图5,序列号18),用于表达单链抗体片段;pET-TB4G2LH(图6A,序列号19),用于表达多聚序列;和pET-MA4G2LH(图6B,序列号20),用于表达携带来自抗体4G2的可变区的单链微型抗体。
这些质粒可以用于在大肠杆菌中通过用异丙基硫代半乳糖苷(IPTG)诱导和在T7启动子下表达由前述合成条带(序列号15、序列号16和序列号17)编码的蛋白质,所述蛋白质在其各自的未成熟的、未加工的形式(序列号21、序列号22和序列号23)时以N-至C-末端方向包含下述元件:对于未加工的蛋白质scFv 4G2LH,a)pelB信号肽(序列号24),b)由于Nco I位点的性质而引入的氨基酸M(甲硫氨酸)和A(丙氨酸),c)单克隆抗体4G2的轻链可变区(序列号25),d)柔性间隔物(连接体)(序列号26),e)单克隆抗体4G2的重链可变区(序列号27),f)由于克隆策略而引入的氨基酸L(亮氨酸)和E(谷氨酸),和g)6组氨酸的C-末端区段;对于未加工的蛋白质TB4G2LH,a)pelB信号肽(序列号24),b)由于Nco I位点的性质而引入的氨基酸M(甲硫氨酸)和A(丙氨酸),c)单克隆抗体4G2的轻链可变区(序列号25),d)柔性间隔物(连接体)(序列号26),e)单克隆抗体4G2的重链可变区(序列号27),f)柔性间隔物(连接体)(序列号28),g)赋予分子以能够在溶液中三聚化的性质的来自人胞外基质蛋白的片段(序列号51),h)由于克隆策略而引入的氨基酸L(亮氨酸)和E(谷氨酸),和e)6组氨酸的C-末端区段;和对于未加工的MA4G2LH蛋白质,a)pelB信号肽(序列号24),b)由于Nco I位点的性质而引入的氨基酸M(甲硫氨酸)和A(丙氨酸),c)单克隆抗体4G2的轻链可变区(序列号25),d)柔性间隔物(连接体)(序列号26),e)单克隆抗体4G2的重链可变区(序列号27),f)由3个连续甘氨酸(G)组成的柔性间隔物(连接体),g)包含铰链区以及CH2和CH3结构域的IgG1人免疫球蛋白的恒定区的片段,其中铰链区的氨基酸C(半胱氨酸)已通过诱变而变成S(丝氨酸),和CH2结构域的潜在糖基化位点已通过使N(天冬酰胺)突变为Q(谷氨酰胺)而被消除(序列号52),h)由于克隆策略而引入的氨基酸L(亮氨酸)和E(谷氨酸),和e)6组氨酸的C-末端区段。
这些元件允许这些蛋白质(scFv 4G2、TB4G2和MA4G2)通过前导肽切割进行加工和分泌至大肠杆菌周质中,在那里盛行的氧化条件允许其正确折叠和形成二硫桥,并且这些元件还有助于使用固定化金属亲和层析(IMAC)(Sulkowski,E.(1985)Purification of proteinsby IMAC.Trends Biotechnol.3,1-7)来纯化它们。在翻译后加工和分泌之后,scFv 4G2、TB4G2和MA4G2的最终序列显示于序列号53、序列号54和序列号55中。
实施例11-scFv 4G2、TB4G2和MA4G2的表达和纯化。
分别来自质粒pET-scFv4G2LH、pET-TB4G2LH和pET-MA4G2的scFv 4G2、TB4G2和MA4G2的纯化使用如下所述的程序:根据Sambrook等人的指导(Sambrook J,Fritsch EF,Maniatis T.Molecularcloning:A laboratory manual.New York,USA:Cold Spring HarborLaboratory Press;1989)将相应的质粒转化入大肠杆菌BL21(DE3)菌株中(Studier,F.W.和B.A.Moffatt.“Use of bacteriophageT7 RNA polymerase to direct selective high-level expression ofcloned genes.″J.Mol.Biol.189.1(1986):113-30),并且将分离的菌落用于接种补充有50μg/mL氨苄青霉素的Luria-Bertani培养基(LBA)的50mL培养物,所述培养物于30℃在350r.p.m.下生长12小时。使用这种培养物,将1L LBA培养基接种至0.05的620nm处起始光密度(OD620),其随后于28℃生长8小时直至指数期晚期。然后,这种培养物通过添加异丙基硫代半乳糖苷(IPTG)进行诱导,并且在相同条件下再生长5小时。
将如上所述获得的培养物于4℃在5000xg下离心30分钟,并且使用Ausubel等人的方法(Ausubel,F.M.,Brent,R.,Kingston,R.E.,Moore,D.D.,Seidman,J.G.,Smith,J.A.和Struhl,K(1989)Current Protocols in Molecular Biology.John Wiley & Sons,New York)从所得到的生物量中提取周质级分。通过使用具有1000Da的截止值的膜,将这种级分针对50mM磷酸盐缓冲液pH 7/20mM咪唑进行透析,并且根据制造商的说明,使用Ni-NTA琼脂糖(QiagenBenelux B.V.,The Netherlands),通过固定化金属亲和层析(Sulkowski,E.1985,Purification of proteins by IMAC.TrendsBiotechnol.3,1-7)从透析液中获得蛋白质PMEC1-His6。
实施例12-通过MAG4G2和TB4G2蛋白质来中和病毒感染。
通过在BHK-21细胞中使用蚀斑减少中和测定法来进行MA4G2和TB4G2嵌合蛋白质的生物活性的表征(表10)。使用这种相同的测定法来比较嵌合蛋白质与4G2mAb以及其片段Fab、Fab2和scFv4G2的生物活性(表10)。
Fab和Fab2片段通过用木瓜蛋白酶和胃蛋白酶消化4G2mAb来获得。在蛋白酶消化后,用固定的A蛋白通过亲和层析法将Fab和Fab2与Fc片段分离。通过离子交换层析法进一步纯化Fab和Fab2同种型。中和滴度被定义为产生病毒蚀斑数目的50%减少的该分子的稀释度。调整不同分子的稀释度以在测定法中获得等摩尔浓度。
       表10.MA4G2、TB4G2、Mab4G2以及
Mab4G2 Fab、Fab2和scFv4G2片段的病毒中和测定法。
Figure A20068005137700541
*中和滴度被定义为在BHK-21细胞中产生病毒蚀斑的50%减少的稀释度。
                               序列表
<110>Centro de Ingeniería Genética y Biotecnología
<120>用于登革病毒的4种血清型和其他黄病毒的预防和/或治疗性治疗的方法和蛋白质
<130>
<140>
<141>
<160>56
<170>PatentIn Ver.2.1
<210>1
<211>75
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:多肽序列PMEC1
<400>1
Val Thr Lys Asn His Ala Lys Lys Asp Val Val Val Gly Gly Lys Thr
  1               5                  10                  15
Asn Thr Thr Thr Ser Arg Cys Thr Gly Ser Asn Asp Lys Arg Cys Lys
             20                  25                  30
His Ser Met Val Asp Arg Gly Trp Gly Asn Gly Cys Gly Gly Lys Gly
         35                  40                  45
Gly Val Thr Cys Ala Met Thr
     50                  55
<210>2
<211>1485
<212>DNA
<213>2型登革病毒
<220>
<221>gene
<222>(1)..(1485)
<223>DEN2病毒毒株Jamaica 1409的包膜E-糖蛋白的基因。
     该基因包含在质粒p30-VD2中。
<400>2
atgcgttgca taggaatatc aaatagagac tttgtagaag gggtttcagg aggaagctgg 60
gttgacatag tcttagaaca tggaagttgt gtgacgacga tggcaaaaaa taaaccaaca 120
ttggattttg aactgataaa aacagaagcc aaacaacctg ccactctaag gaagtactgt 180
atagaagcaa agctgaccaa tacaacaaca gaatctcgtt gcccaacaca aggggaaccc 240
agtctaaatg aagagcagga caaaaggttc ctctgcaaac actccatggt agacagagga 300
tggggaaatg gatgtggatt atttggaaag ggaggcattg tgacctgtgc tatgtttaca 360
tgcaaaaaga acatggaagg aaaagtcgtg ctgccagaaa atttggaata caccatcgtg 420
ataacacctc actcaggaga agagcacgct gtaggtaatg acacaggaaa acatggcaag 480
gaaatcaaaa taacaccaca gagttccatc acagaagcag aactgacagg ctatggcact 540
gtcacgatgg agtgctctcc gagaacgggc ctcgacttca atgagatggt gctgctgcag 600
atggaagaca aagcttggct ggtgcacagg caatggttcc tagacctgcc gttaccatgg 660
ctacccggag cggacacaca aggatcaaat tggatacaga aagagacatt ggtcactttc 720
aaaaatcccc acgcgaagaa acaagatgtc gttgttttag gatctcaaga aggggccatg 780
cacacggcac tcacaggggc cacagaaatc cagatgtcat caggaaactt actgttcaca 840
ggacatctca agtgcaggct gagaatggac aaactacagc tcaaaggaat gtcatactct 900
atgtgtacag gaaagtttaa aattgtgaag gaaatagcag aaacacaaca tggaacaata 960
gttatcagag tacaatatga aggggacggc tctccatgta agatcccttt tgagataatg 1020
gatttggaaa aaagacacgt cttaggtcgc ctgattacag ttaacccgat cgtaacagaa 1080
aaagatagcc cagtcaacat agaagcagaa cctccattcg gagacagcta catcatcata 1140
ggagtagagc cgggacaatt gaaactcaac tggtttaaga aaggaagttc catcggccaa 1200
atgtttgaga caacaatgag aggagcgaag agaatggcca ttttaggtga cacagcctgg 1260
gattttggat ccctgggagg agtgtttaca tctataggaa aggctctcca ccaagttttc 1320
ggagcaatct atggggctgc ttttagtggg gtctcatgga ctatgaaaat cctcatagga 1380
gtcatcatca catggatagg aatgaattca cgtagcacct cactgtctgt gtcactagta 1440
ttggtgggag tcgtgacact gtacctggga gctatggtgc aggct                 1485
<210>3
<211>495
<212>PRT
<213>2型登革病毒
<220>
<223>多肽。DEN2病毒毒株Jamaica 1409的包膜E-糖蛋白,
     其由质粒p30-VD2的E基因编码。
<400>3
Met Arg Cys Ile Gly Ile Ser Asn Arg Asp Phe Val Glu Gly Val Ser
  1               5                  10                  15
Gly Gly Ser Trp Val Asp Ile Val Leu Glu His Gly Ser Cys Val Thr
             20                  25                  30
Thr Met Ala Lys Asn Lys Pro Thr Leu Asp Phe Glu Leu Ile Lys Thr
         35                  40                  45
Glu Ala Lys Gln Pro Ala Thr Leu Arg Lys Tyr Cys Ile Glu Ala Lys
     50                  55                  60
Leu Thr Asn Thr Thr Thr Glu Ser Arg Cys Pro Thr Gln Gly Glu Pro
 65                  70                  75                  80
Ser Leu Asn Glu Glu Gln Asp Lys Arg Phe Leu Cys Lys His Ser Met
                 85                  90                  95
Val Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly Lys Gly Gly
            100                 105                 110
Ile Val Thr Cys Ala Met Phe Thr Cys Lys Lys Asn Met Glu Gly Lys
        115                 120                 125
Val Val Leu Pro Glu Asn Leu Glu Tyr Thr Ile Val Ile Thr Pro His
    130                 135                 140
Ser Gly Glu Glu His Ala Val Gly Asn Asp Thr Gly Lys His Gly Lys
145                 150                 155                 160
Glu Ile Lys Ile Thr Pro Gln Ser Ser Ile Thr Glu Ala Glu Leu Thr
                165                 170                 175
Gly Tyr Gly Thr Val Thr Met Glu Cys Ser Pro Arg Thr Gly Leu Asp
            180                 185                 190
Phe Asn Glu Met Val Leu Leu Gln Met Glu Asp Lys Ala Trp Leu Val
        195                 200                 205
His Arg Gln Trp Phe Leu Asp Leu Pro Leu Pro Trp Leu Pro Gly Ala
    210                 215                 220
Asp Thr Gln Gly Ser Asn Trp Ile Gln Lys Glu Thr Leu Val Thr Phe
225                 230                 235                 240
Lys Asn Pro His Ala Lys Lys Gln Asp Val Val Val Leu Gly Ser Gln
                245                 250                 255
Glu Gly Ala Met His Thr Ala Leu Thr Gly Ala Thr Glu Ile Gln Met
            260                 265                 270
Ser Ser Gly Asn Leu Leu Phe Thr Gly His Leu Lys Cys Arg Leu Arg
        275                 280                 285
Met Asp Lys Leu Gln Leu Lys Gly Met Ser Tyr Ser Met Cys Thr Gly
    290                 295                 300
Lys Phe Lys Ile Val Lys Glu Ile Ala Glu Thr Gln His Gly Thr Ile
305                 310                 315                 320
Val Ile Arg Val Gln Tyr Glu Gly Asp Gly Ser Pro Cys Lys Ile Pro
                325                 330                 335
Phe Glu Ile Met Asp Leu Glu Lys Arg His Val Leu Gly Arg Leu Ile
            340                 345                 350
Thr Val Asn Pro Ile Val Thr Glu Lys Asp Ser Pro Val Asn Ile Glu
        355                 360                 365
Ala Glu Pro Pro Phe Gly Asp Ser Tyr Ile Ile Ile Gly Val Glu Pro
    370                 375                 380
Gly Gln Leu Lys Leu Asn Trp Phe Lys Lys Gly Ser Ser Ile Gly Gln
385                 390                 395                 400
Met Phe Glu Thr Thr Met Arg Gly Ala Lys Arg Met Ala Ile Leu Gly
                405                 410                 415
Asp Thr Ala Trp Asp Phe Gly Ser Leu Gly Gly Val Phe Thr Ser Ile
            420                 425                 430
Gly Lys Ala Leu His Gln Val Phe Gly Ala Ile Tyr Gly Ala Ala Phe
        435                 440                 445
Ser Gly Val Ser Trp Thr Met Lys Ile Leu Ile Gly Val Ile Ile Thr
    450                 455                 460
Trp Ile Gly Met Asn Ser Arg Ser Thr Ser Leu Ser Val Ser Leu Val
465                 470                 475                 480
Leu Val Gly Val Val Thr Leu Tyr Leu Gly Ala Met Val Gln Ala
                485                 490                 495
<210>4
<211>242
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:编码蛋白质PMEC1,包含用于克隆入DNA载体中的限制位点,
     包含破坏内部Nco I位点的沉默突变。
<220>
<223>合成的双链DNA
<400>4
ccatggcatt ggtcactttc aaaaatcccc acgcgaagaa acaagatgtc gttgttggag 60
gtggaaagct gaccaataca acaacagaat ctcgttgccc aacacaaggg gaacccagtc 120
taaatgaaga gcaggacaaa aggttcctct gcaaacactc tatggtagac agaggatggg 180
gaaatggatg tggattattt ggaaagggag gcattgtgac ctgtgctatg tttacactcg 240
ag                                                                242
<210>5
<211>7
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:包含Nco I限制位点、甲硫氨酸的ATG密码子
     和丙氨酸的GCA密码子。
<220>
<223>寡核苷酸片段
<400>5
catggca                                                           7
<210>6
<211>48
<212>DNA
<213>2型登革病毒
<220>
<223>寡核苷酸片段
<220>
<223>包含编码DEN2病毒毒株Jamaica 1409的E-蛋白的基因的709-756序列
<400>6
ttggtcactt tcaaaaatcc ccacgcgaag aaacaagatg tcgttgtt              48
<210>7
<211>16
<212>PRT
<213>2型登革病毒
<220>
<223>肽片段。相应于DEN2病毒毒株Jamaica 1409的E-蛋白的237-252片段
<400>7
Leu Val Thr Phe Lys Asn Pro His Ala Lys Lys Gln Asp Val Val Val
  1               5                  10                  15
<210>8
<211>9
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:包含编码3个连续甘氨酸的3个密码子
<220>
<223>寡核苷酸片段
<400>8
ggaggtgga                                                         9
<210>9
<211>57
<212>PRT
<213>2型登革病毒
<220>
<223>肽片段。相应于DEN2病毒毒株Jamaica 1409的E-蛋白的64-120片段
<400>9
Lys Leu Thr Asn Thr Thr Thr Glu Ser Arg Cys Pro Thr Gln Gly Glu
  1               5                  10                  15
Pro Ser Leu Asn Glu Glu Gln Asp Lys Arg Phe Leu Cys Lys His Ser
             20                  25                  30
Met Val Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly Lys Gly
         35                  40                  45
Gly Ile Val Thr Cys Ala Met Phe Thr
     50                  55
<210>10
<211>171
<212>DNA
<213>2型登革病毒
<220>
<223>寡核苷酸片段。包含编码DEN2病毒毒株Jamaica 1409的E-蛋白的基因的190-360序列。
<400>10
aagctgacca atacaacaac agaatctcgt tgcccaacac aaggggaacc cagtctaaat 60
gaagagcagg acaaaaggtt cctctgcaaa cactccatgg tagacagagg atggggaaat 120
ggatgtggat tatttggaaa gggaggcatt gtgacctgtg ctatgtttac a          171
<210>11
<211>6
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:包含Xho I限制位点,其包含亮氨酸的CTC密码子,
     和谷氨酸的GAG密码子。
<220>
<223>寡核苷酸片段
<400>11
ctcgag                                                            6
<210>12
<211>5664
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:编码在T7启动子下蛋白质sPMEC1-His6的表达
<220>
<223>质粒
<400>12
taatacgact cactataggg gaattgtgag cggataacaa ttcccctcta gaaataattt  60
tgtttaactt taagaaggag atatacatat gaaatacctg ctgccgaccg ctgctgctgg 120
tctgctgctc ctcgctgccc agccggcgat ggccatggca ttggtcactt tcaaaaatcc 180
ccacgcgaag aaacaagatg tcgttgttgg aggtaagctg accaatacaa caacagaatc 240
tcgttgccca acacaagggg aacccagtct aaatgaagag caggacaaaa ggttcctctg 300
caaacactct atggtagaca gaggatgggg aaatggatgt ggattatttg gaaagggagg 360
cattgtgacc tgtgctatgt ttacactcga gcaccaccac caccaccact gagatccggc 420
tgctaacaaa gcccgaaagg aagctgagtt ggctgctgcc accgctgagc aataactagc 480
ataacccctt ggggcctcta aacgggtctt gaggggtttt ttgctgaaag gaggaactat 540
atccggattg gcgaatggga cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 600
gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 660
ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcgggggctc 720
cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 780
gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 840
tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 900
gtctattctt ttgatttata agggattttg ccgatttcgg cctattggtt aaaaaatgag 960
ctgatttaac aaaaatttaa cgcgaatttt aacaaaatat taacgtttac aatttcaggt 1020
ggcacttttc ggggaaatgt gcgcggaacc cctatttgtt tatttttcta aatacattca 1080
aatatgtatc cgctcatgag acaataaccc tgataaatgc ttcaataata ttgaaaaagg 1140
aagagtatga gtattcaaca tttccgtgtc gcccttattc ccttttttgc ggcattttgc 1200
cttcctgttt ttgctcaccc agaaacgctg gtgaaagtaa aagatgctga agatcagttg 1260
ggtgcacgag tgggttacat cgaactggat ctcaacagcg gtaagatcct tgagagtttt 1320
cgccccgaag aacgttttcc aatgatgagc acttttaaag ttctgctatg tggcgcggta 1380
ttatcccgta ttgacgccgg gcaagagcaa ctcggtcgcc gcatacacta ttctcagaat 1440
gacttggttg agtactcacc agtcacagaa aagcatctta cggatggcat gacagtaaga 1500
gaattatgca gtgctgccat aaccatgagt gataacactg cggccaactt acttctgaca 1560
acgatcggag gaccgaagga gctaaccgct tttttgcaca acatggggga tcatgtaact 1620
cgccttgatc gttgggaacc ggagctgaat gaagccatac caaacgacga gcgtgacacc 1680
acgatgcctg cagcaatggc aacaacgttg cgcaaactat taactggcga actacttact 1740
ctagcttccc ggcaacaatt aatagactgg atggaggcgg ataaagttgc aggaccactt 1800
ctgcgctcgg cccttccggc tggctggttt attgctgata aatctggagc cggtgagcgt 1860
gggtctcgcg gtatcattgc agcactgggg ccagatggta agccctcccg tatcgtagtt 1920
atctacacga cggggagtca ggcaactatg gatgaacgaa atagacagat cgctgagata 1980
ggtgcctcac tgattaagca ttggtaactg tcagaccaag tttactcata tatactttag 2040
attgatttaa aacttcattt ttaatttaaa aggatctagg tgaagatcct ttttgataat 2100
ctcatgacca aaatccctta acgtgagttt tcgttccact gagcgtcaga ccccgtagaa 2160
aagatcaaag gatcttcttg agatcctttt tttctgcgcg taatctgctg cttgcaaaca 2220
aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc aagagctacc aactcttttt 2280
ccgaaggtaa ctggcttcag cagagcgcag ataccaaata ctgtccttct agtgtagccg 2340
tagttaggcc accacttcaa gaactctgta gcaccgccta catacctcgc tctgctaatc 2400
ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga 2460
cgatagttac cggataaggc gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc 2520
agcttggagc gaacgaccta caccgaactg agatacctac agcgtgagct atgagaaagc 2580
gccacgcttc ccgaagggag aaaggcggac aggtatccgg taagcggcag ggtcggaaca 2640
ggagagcgca cgagggagct tccaggggga aacgcctggt atctttatag tcctgtcggg 2700
tttcgccacc tctgacttga gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta 2760
tggaaaaacg ccagcaacgc ggccttttta cggttcctgg ccttttgctg gccttttgct 2820
cacatgttct ttcctgcgtt atcccctgat tctgtggata accgtattac cgcctttgag 2880
tgagctgata ccgctcgccg cagccgaacg accgagcgca gcgagtcagt gagcgaggaa 2940
gcggaagagc gcctgatgcg gtattttctc cttacgcatc tgtgcggtat ttcacaccgc 3000
atatatggtg cactctcagt acaatctgct ctgatgccgc atagttaagc cagtatacac 3060
tccgctatcg ctacgtgact gggtcatggc tgcgccccga cacccgccaa cacccgctga 3120
cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg tgaccgtctc 3180
cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga ggcagctgcg 3240
gtaaagctca tcagcgtggt cgtgaagcga ttcacagatg tctgcctgtt catccgcgtc 3300
cagctcgttg agtttctcca gaagcgttaa tgtctggctt ctgataaagc gggccatgtt 3360
aagggcggtt ttttcctgtt tggtcactga tgcctccgtg taagggggat ttctgttcat 3420
gggggtaatg ataccgatga aacgagagag gatgctcacg atacgggtta ctgatgatga 3480
acatgcccgg ttactggaac gttgtgaggg taaacaactg gcggtatgga tgcggcggga 3540
ccagagaaaa atcactcagg gtcaatgcca gcgcttcgtt aatacagatg taggtgttcc 3600
acagggtagc cagcagcatc ctgcgatgca gatccggaac ataatggtgc agggcgctga 3660
cttccgcgtt tccagacttt acgaaacacg gaaaccgaag accattcatg ttgttgctca 3720
ggtcgcagac gttttgcagc agcagtcgct tcacgttcgc tcgcgtatcg gtgattcatt 3780
ctgctaacca gtaaggcaac cccgccagcc tagccgggtc ctcaacgaca ggagcacgat 3840
catgcgcacc cgtggggccg ccatgccggc gataatggcc tgcttctcgc cgaaacgttt 3900
ggtggcggga ccagtgacga aggcttgagc gagggcgtgc aagattccga ataccgcaag 3960
cgacaggccg atcatcgtcg cgctccagcg aaagcggtcc tcgccgaaaa tgacccagag 4020
cgctgccggc acctgtccta cgagttgcat gataaagaag acagtcataa gtgcggcgac 4080
gatagtcatg ccccgcgccc accggaagga gctgactggg ttgaaggctc tcaagggcat 4140
cggtcgagat cccggtgcct aatgagtgag ctaacttaca ttaattgcgt tgcgctcact 4200
gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc 4260
ggggagaggc ggtttgcgta ttgggcgcca gggtggtttt tcttttcacc agtgagacgg 4320
gcaacagctg attgcccttc accgcctggc cctgagagag ttgcagcaag cggtccacgc 4380
tggtttgccc cagcaggcga aaatcctgtt tgatggtggt taacggcggg atataacatg 4440
agctgtcttc ggtatcgtcg tatcccacta ccgagatatc cgcaccaacg cgcagcccgg 4500
actcggtaat ggcgcgcatt gcgcccagcg ccatctgatc gttggcaacc agcatcgcag 4560
tgggaacgat gccctcattc agcatttgca tggtttgttg aaaaccggac atggcactcc 4620
agtcgccttc ccgttccgct atcggctgaa tttgattgcg agtgagatat ttatgccagc 4680
cagccagacg cagacgcgcc gagacagaac ttaatgggcc cgctaacagc gcgatttgct 4740
ggtgacccaa tgcgaccaga tgctccacgc ccagtcgcgt accgtcttca tgggagaaaa 4800
taatactgtt gatgggtgtc tggtcagaga catcaagaaa taacgccgga acattagtgc 4860
aggcagcttc cacagcaatg gcatcctggt catccagcgg atagttaatg atcagcccac 4920
tgacgcgttg cgcgagaaga ttgtgcaccg ccgctttaca ggcttcgacg ccgcttcgtt 4980
ctaccatcga caccaccacg ctggcaccca gttgatcggc gcgagattta atcgccgcga 5040
caatttgcga cggcgcgtgc agggccagac tggaggtggc aacgccaatc agcaacgact 5100
gtttgcccgc cagttgttgt gccacgcggt tgggaatgta attcagctcc gccatcgccg 5160
cttccacttt ttcccgcgtt ttcgcagaaa cgtggctggc ctggttcacc acgcgggaaa 5220
cggtctgata agagacaccg gcatactctg cgacatcgta taacgttact ggtttcacat 5280
tcaccaccct gaattgactc tcttccgggc gctatcatgc cataccgcga aaggttttgc 5340
gccattcgat ggtgtccggg atctcgacgc tctcccttat gcgactcctg cattaggaag 5400
cagcccagta gtaggttgag gccgttgagc accgccgccg caaggaatgg tgcatgcaag 5460
gagatggcgc ccaacagtcc cccggccacg gggcctgcca ccatacccac gccgaaacaa 5520
gcgctcatga gcccgaagtg gcgagcccga tcttccccat cggtgatgtc ggcgatatag 5580
gcgccagcaa ccgcacctgt ggcgccggtg atgccggcca cgatgcgtcc ggcgtagagg 5640
atcgagatct cgatcccgcg aaat                                        5664
<210>13
<211>108
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:质粒pET-PMEC1的未成熟蛋白质sPMEC1-His6,在分泌至周质中前
<220>
<223>蛋白质
<400>13
Met Lys Tyr Leu Leu Pro Thr Ala Ala Ala Gly Leu Leu Leu Leu Ala
  1               5                  10                  15
Ala Gln Pro Ala Met Ala Met Ala Leu Val Thr Phe Lys Asn Pro His
             20                  25                  30
Ala Lys Lys Gln Asp Val Val Val Gly Gly Gly Lys Leu Thr Asn Thr
         35                  40                  45
Thr Thr Glu Ser Arg Cys Pro Thr Gln Gly Glu Pro Ser Leu Asn Glu
     50                  55                  60
Glu Gln Asp Lys Arg Phe Leu Cys Lys His Ser Met Val Asp Arg Gly
 65                  70                  75                  80
Trp Gly Asn Gly Cys Gly Leu Phe Gly Lys Gly Gly Ile Val Thr Cys
                 85                  90                  95
Ala Met Phe Thr Leu Glu His His His His His His
            100                 105
<210>14
<211>83
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:这是由质粒pET-PMEC1编码的成熟蛋白质,
     在分泌至周质中并去除信号肽后
<220>
<223>蛋白质
<400>14
Leu Val Thr Phe Lys Asn Pro His Ala Lys Lys Gln Asp Val Val Val
  1               5                  10                  15
Gly Gly Lys Leu Thr Asn Thr Thr Thr Glu Ser Arg Cys Pro Thr Gln
             20                  25                  30
Gly Glu Pro Ser Leu Asn Glu Glu Gln Asp Lys Arg Phe Leu Cys Lys
         35                  40                  45
His Ser Met Val Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly
     50                  55                  60
Lys Gly Gly Ile Val Thr Cys Ala Met Phe Thr Leu Glu His His His
 65                  70                  75                  80
His His His
<210>15
<211>734
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:包含编码展示出4G2mAb的可变区的单链抗体片段的基因
<220>
<223>合成的双链DNA
<400>15
ccatggcaaa cattgtgatg acccaatctc ccaaatccat gtccatgtca gtaggagaga 60
gggtcacctt gacctgcaag gccagtgaga atgtggttac ttatgtttcc tggtatcaac 120
agaaaccaga gcagtctcct aaactgctga tatacggggc atccaaccgg tacactgggg 180
tccccgatcg cttcacaggc agtggatctg caacagattt cactctgacc atcagcagtg 240
tgcaggctga agaccttgca gattatcact gtggacaggg ttacagctat ccgtacacgt 300
tcggaggggg gaccaagctg gaaataaaag agggtaaatc ctcaggatca ggctccgaat 360
ccaaagtcga cgaggtccag ctgcaacaat ctggacctga gctggtgaag cctgggactt 420
cagtgaagat atcctgcaag acttctggat acacattcac tgaatatacc atacactggg 480
tgaagcagag ccacggaaag agccttgcgt ggattggagg tattgatcct aacagtggtg 540
gtactaacta cagcccgaac ttcaagggca aggccacatt gactgttgac aagtcctcca 600
gcacagccta catggacctc cgcagcctgt catctgagga ttctgcagtc tacttctgtg 660
caaggatcta tcattacgac ggatacttcg atgtctgggg cgcagggacc gccgtcaccg 720
tctcctcact cgag                                                   734
<210>16
<211>905
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:包含编码展示出4G2mAb的可变区和
     胞外基质蛋白的三聚化结构域的蛋白质的基因
<220>
<223>合成的多核苷酸
<400>16
ccatggcaaa cattgtgatg acccaatctc ccaaatccat gtccatgtca gtaggagaga 60
gggtcacctt gacctgcaag gccagtgaga atgtggttac ttatgtttcc tggtatcaac 120
agaaaccaga gcagtctcct aaactgctga tatacggggc atccaaccgg tacactgggg 180
tccccgatcg cttcacaggc agtggatctg caacagattt cactctgacc atcagcagtg 240
tgcaggctga agaccttgca gattatcact gtggacaggg ttacagctat ccgtacacgt 300
tcggaggggg gaccaagctg gaaataaaag agggtaaatc ctcaggatca ggctccgaat 360
ccaaagtcga cgaggtccag ctgcaacaat ctggacctga gctggtgaag cctgggactt 420
cagtgaagat atcctgcaag acttctggat acacattcac tgaatatacc atacactggg 480
tgaagcagag ccacggaaag agccttgcgt ggattggagg tattgatcct aacagtggtg 540
gtactaacta cagcccgaac ttcaagggca aggccacatt gactgttgac aagtcctcca 600
gcacagccta catggacctc cgcagcctgt catctgagga ttctgcagtc tacttctgtg 660
caaggatcta tcattacgac ggatacttcg atgtctgggg cgcagggacc gccgtcaccg 720
tctcctcagg tggtggttcc ggtggtggtt ccggtggtgg ttccggtggt ggtgaagacc 780
cgtgcgcttg cgaatccctg gttaaattcc aggctaaagt tgaaggtctg ctgcaggctc 840
tgacccgtaa actggaagct gtttccaaac gtctggctat cctggaaaac accgttgttc 900
tcgag                                                             905
<210>17
<211>1439
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:包含基因,所述基因编码展示出4G2mAb的可变区的
     单链微型抗体的合成
<220>
<223>合成的双链DNA
<400>17
ccatggcaaa cattgtgatg acccaatctc ccaaatccat gtccatgtca gtaggagaga 60
gggtcacctt gacctgcaag gccagtgaga atgtggttac ttatgtttcc tggtatcaac 120
agaaaccaga gcagtctcct aaactgctga tatacggggc atccaaccgg tacactgggg 180
tccccgatcg cttcacaggc agtggatctg caacagattt cactctgacc atcagcagtg 240
tgcaggctga agaccttgca gattatcact gtggacaggg ttacagctat ccgtacacgt 300
tcggaggggg gaccaagctg gaaataaaag agggtaaatc ctcaggatca ggctccgaat 360
ccaaagtcga cgaggtccag ctgcaacaat ctggacctga gctggtgaag cctgggactt 420
cagtgaagat atcctgcaag acttctggat acacattcac tgaatatacc atacactggg 480
tgaagcagag ccacggaaag agccttgcgt ggattggagg tattgatcct aacagtggtg 540
gtactaacta cagcccgaac ttcaagggca aggccacatt gactgttgac aagtcctcca 600
gcacagccta catggacctc cgcagcctgt catctgagga ttctgcagtc tacttctgtg 660
caaggatcta tcattacgac ggatacttcg atgtctgggg cgcagggacc gccgtcaccg 720
tctcctcagg cggtggcgag cccaaatctt ctgacaaaac tcacacatgc ccaccgtgcc 780
cagcacctga actcctgggg ggaccgtcag tcttcctctt ccccccaaaa cccaaggaca 840
ccctcatgat ctcccggacc cctgaggtca catgcgtggt ggtggacgtg agccacgaag 900
accctgaggt caagttcaac tggtacgtgg acggcgtgga ggtgcataat gccaagacaa 960
agccgcggga ggagcagtac cagagcacgt accgtgtggt cagcgtcctc accgtcctgc 1020
accaggactg gctgaatggc aaggagtaca agtgcaaggt ctccaacaaa gccctcccag 1080
cccccatcga gaaaaccatc tccaaagcca aagggcagcc ccgagaacca caggtgtaca 1140
ccctgccccc atcccgggag gagatgacca agaaccaggt cagcctgacc tgcctggtca 1200
aaggcttcta tcccagcgac atcgccgtgg agtgggagag caatgggcag ccggagaaca 1260
actacaagac cacgcctccc gtgctggact ccgacggctc cttcttcctc tatagcaagc 1320
tcaccgtgga caagagcagg tggcagcagg ggaacgtctt ctcatgctcc gtgatgcatg 1380
aggctctgca caaccactac acgcagaaga gcctctccct gtccccgggt aaactcgag  1439
<210>18
<211>6159
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:单链抗体片段的在T7启动子下的表达质粒,
     所述单链抗体片段展示出4G2mAb的可变区
<220>
<223>质粒
<400>18
ccatggcaaa cattgtgatg acccaatctc ccaaatccat gtccatgtca gtaggagaga 60
gggtcacctt gacctgcaag gccagtgaga atgtggttac ttatgtttcc tggtatcaac 120
agaaaccaga gcagtctcct aaactgctga tatacggggc atccaaccgg tacactgggg 180
tccccgatcg cttcacaggc agtggatctg caacagattt cactctgacc atcagcagtg 240
tgcaggctga agaccttgca gattatcact gtggacaggg ttacagctat ccgtacacgt 300
tcggaggggg gaccaagctg gaaataaaag agggtaaatc ctcaggatca ggctccgaat 360
ccaaagtcga cgaggtccag ctgcaacaat ctggacctga gctggtgaag cctgggactt 420
cagtgaagat atcctgcaag acttctggat acacattcac tgaatatacc atacactggg 480
tgaagcagag ccacggaaag agccttgcgt ggattggagg tattgatcct aacagtggtg 540
gtactaacta cagcccgaac ttcaagggca aggccacatt gactgttgac aagtcctcca 600
gcacagccta catggacctc cgcagcctgt catctgagga ttctgcagtc tacttctgtg 660
caaggatcta tcattacgac ggatacttcg atgtctgggg cgcagggacc gccgtcaccg 720
tctcctcact cgagcaccac caccaccacc actgagatcc ggctgctaac aaagcccgaa 780
aggaagctga gttggctgct gccaccgctg agcaataact agcataaccc cttggggcct 840
ctaaacgggt cttgaggggt tttttgctga aaggaggaac tatatccgga ttggcgaatg 900
ggacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac 960
cgctacactt gccagcgccc tagcgcccgc tcctttcgct ttcttccctt cctttctcgc 1020
cacgttcgcc ggctttcccc gtcaagctct aaatcggggg ctccctttag ggttccgatt 1080
tagtgcttta cggcacctcg accccaaaaa acttgattag ggtgatggtt cacgtagtgg 1140
gccatcgccc tgatagacgg tttttcgccc tttgacgttg gagtccacgt tctttaatag 1200
tggactcttg ttccaaactg gaacaacact caaccctatc tcggtctatt cttttgattt 1260
ataagggatt ttgccgattt cggcctattg gttaaaaaat gagctgattt aacaaaaatt 1320
taacgcgaat tttaacaaaa tattaacgtt tacaatttca ggtggcactt ttcggggaaa 1380
tgtgcgcgga acccctattt gtttattttt ctaaatacat tcaaatatgt atccgctcat 1440
gagacaataa ccctgataaa tgcttcaata atattgaaaa aggaagagta tgagtattca 1500
acatttccgt gtcgccctta ttcccttttt tgcggcattt tgccttcctg tttttgctca 1560
cccagaaacg ctggtgaaag taaaagatgc tgaagatcag ttgggtgcac gagtgggtta 1620
catcgaactg gatctcaaca gcggtaagat ccttgagagt tttcgccccg aagaacgttt 1680
tccaatgatg agcactttta aagttctgct atgtggcgcg gtattatccc gtattgacgc 1740
cgggcaagag caactcggtc gccgcataca ctattctcag aatgacttgg ttgagtactc 1800
accagtcaca gaaaagcatc ttacggatgg catgacagta agagaattat gcagtgctgc 1860
cataaccatg agtgataaca ctgcggccaa cttacttctg acaacgatcg gaggaccgaa 1920
ggagctaacc gcttttttgc acaacatggg ggatcatgta actcgccttg atcgttggga 1980
accggagctg aatgaagcca taccaaacga cgagcgtgac accacgatgc ctgcagcaat 2040
ggcaacaacg ttgcgcaaac tattaactgg cgaactactt actctagctt cccggcaaca 2100
attaatagac tggatggagg cggataaagt tgcaggacca cttctgcgct cggcccttcc 2160
ggctggctgg tttattgctg ataaatctgg agccggtgag cgtgggtctc gcggtatcat 2220
tgcagcactg gggccagatg gtaagccctc ccgtatcgta gttatctaca cgacggggag 2280
tcaggcaact atggatgaac gaaatagaca gatcgctgag ataggtgcct cactgattaa 2340
gcattggtaa ctgtcagacc aagtttactc atatatactt tagattgatt taaaacttca 2400
tttttaattt aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc 2460
ttaacgtgag ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc 2520
ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc 2580
agcggtggtt tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt 2640
cagcagagcg cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt 2700
caagaactct gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc 2760
tgccagtggc gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa 2820
ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac 2880
ctacaccgaa ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg 2940
gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga 3000
gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact 3060
tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa 3120
cgcggccttt ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc 3180
gttatcccct gattctgtgg ataaccgtat taccgccttt gagtgagctg ataccgctcg 3240
ccgcagccga acgaccgagc gcagcgagtc agtgagcgag gaagcggaag agcgcctgat 3300
gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatatatg gtgcactctc 3360
agtacaatct gctctgatgc cgcatagtta agccagtata cactccgcta tcgctacgtg 3420
actgggtcat ggctgcgccc cgacacccgc caacacccgc tgacgcgccc tgacgggctt 3480
gtctgctccc ggcatccgct tacagacaag ctgtgaccgt ctccgggagc tgcatgtgtc 3540
agaggttttc accgtcatca ccgaaacgcg cgaggcagct gcggtaaagc tcatcagcgt 3600
ggtcgtgaag cgattcacag atgtctgcct gttcatccgc gtccagctcg ttgagtttct 3660
ccagaagcgt taatgtctgg cttctgataa agcgggccat gttaagggcg gttttttcct 3720
gtttggtcac tgatgcctcc gtgtaagggg gatttctgtt catgggggta atgataccga 3780
tgaaacgaga gaggatgctc acgatacggg ttactgatga tgaacatgcc cggttactgg 3840
aacgttgtga gggtaaacaa ctggcggtat ggatgcggcg ggaccagaga aaaatcactc 3900
agggtcaatg ccagcgcttc gttaatacag atgtaggtgt tccacagggt agccagcagc 3960
atcctgcgat gcagatccgg aacataatgg tgcagggcgc tgacttccgc gtttccagac 4020
tttacgaaac acggaaaccg aagaccattc atgttgttgc tcaggtcgca gacgttttgc 4080
agcagcagtc gcttcacgtt cgctcgcgta tcggtgattc attctgctaa ccagtaaggc 4140
aaccccgcca gcctagccgg gtcctcaacg acaggagcac gatcatgcgc acccgtgggg 4200
ccgccatgcc ggcgataatg gcctgcttct cgccgaaacg tttggtggcg ggaccagtga 4260
cgaaggcttg agcgagggcg tgcaagattc cgaataccgc aagcgacagg ccgatcatcg 4320
tcgcgctcca gcgaaagcgg tcctcgccga aaatgaccca gagcgctgcc ggcacctgtc 4380
ctacgagttg catgataaag aagacagtca taagtgcggc gacgatagtc atgccccgcg 4440
cccaccggaa ggagctgact gggttgaagg ctctcaaggg catcggtcga gatcccggtg 4500
cctaatgagt gagctaactt acattaattg cgttgcgctc actgcccgct ttccagtcgg 4560
gaaacctgtc gtgccagctg cattaatgaa tcggccaacg cgcggggaga ggcggtttgc 4620
gtattgggcg ccagggtggt ttttcttttc accagtgaga cgggcaacag ctgattgccc 4680
ttcaccgcct ggccctgaga gagttgcagc aagcggtcca cgctggtttg ccccagcagg 4740
cgaaaatcct gtttgatggt ggttaacggc gggatataac atgagctgtc ttcggtatcg 4800
tcgtatccca ctaccgagat atccgcacca acgcgcagcc cggactcggt aatggcgcgc 4860
attgcgccca gcgccatctg atcgttggca accagcatcg cagtgggaac gatgccctca 4920
ttcagcattt gcatggtttg ttgaaaaccg gacatggcac tccagtcgcc ttcccgttcc 4980
gctatcggct gaatttgatt gcgagtgaga tatttatgcc agccagccag acgcagacgc 5040
gccgagacag aacttaatgg gcccgctaac agcgcgattt gctggtgacc caatgcgacc 5100
agatgctcca cgcccagtcg cgtaccgtct tcatgggaga aaataatact gttgatgggt 5160
gtctggtcag agacatcaag aaataacgcc ggaacattag tgcaggcagc ttccacagca 5220
atggcatcct ggtcatccag cggatagtta atgatcagcc cactgacgcg ttgcgcgaga 5280
agattgtgca ccgccgcttt acaggcttcg acgccgcttc gttctaccat cgacaccacc 5340
acgctggcac ccagttgatc ggcgcgagat ttaatcgccg cgacaatttg cgacggcgcg 5400
tgcagggcca gactggaggt ggcaacgcca atcagcaacg actgtttgcc cgccagttgt 5460
tgtgccacgc ggttgggaat gtaattcagc tccgccatcg ccgcttccac tttttcccgc 5520
gttttcgcag aaacgtggct ggcctggttc accacgcggg aaacggtctg ataagagaca 5580
ccggcatact ctgcgacatc gtataacgtt actggtttca cattcaccac cctgaattga 5640
ctctcttccg ggcgctatca tgccataccg cgaaaggttt tgcgccattc gatggtgtcc 5700
gggatctcga cgctctccct tatgcgactc ctgcattagg aagcagccca gtagtaggtt 5760
gaggccgttg agcaccgccg ccgcaaggaa tggtgcatgc aaggagatgg cgcccaacag 5820
tcccccggcc acggggcctg ccaccatacc cacgccgaaa caagcgctca tgagcccgaa 5880
gtggcgagcc cgatcttccc catcggtgat gtcggcgata taggcgccag caaccgcacc 5940
tgtggcgccg gtgatgccgg ccacgatgcg tccggcgtag aggatcgaga tctcgatccc 6000
gcgaaattaa tacgactcac tataggggaa ttgtgagcgg ataacaattc ccctctagaa 6060
ataattttgt ttaactttaa gaaggagata tacatatgaa atacctgctg ccgaccgctg 6120
ctgctggtct gctgctcctc gctgcccagc cggcgatgg                        6159
<210>19
<211>6330
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:蛋白质的在T7启动子下的表达质粒,
     所述蛋白质展示出4G2mAb的可变区和胞外基质蛋白的三聚化结构域
<220>
<223>质粒
<400>19
ccatggcaaa cattgtgatg acccaatctc ccaaatccat gtccatgtca gtaggagaga 60
gggtcacctt gacctgcaag gccagtgaga atgtggttac ttatgtttcc tggtatcaac 120
agaaaccaga gcagtctcct aaactgctga tatacggggc atccaaccgg tacactgggg 180
tccccgatcg cttcacaggc agtggatctg caacagattt cactctgacc atcagcagtg 240
tgcaggctga agaccttgca gattatcact gtggacaggg ttacagctat ccgtacacgt 300
tcggaggggg gaccaagctg gaaataaaag agggtaaatc ctcaggatca ggctccgaat 360
ccaaagtcga cgaggtccag ctgcaacaat ctggacctga gctggtgaag cctgggactt 420
cagtgaagat atcctgcaag acttctggat acacattcac tgaatatacc atacactggg 480
tgaagcagag ccacggaaag agccttgcgt ggattggagg tattgatcct aacagtggtg 540
gtactaacta cagcccgaac ttcaagggca aggccacatt gactgttgac aagtcctcca 600
gcacagccta catggacctc cgcagcctgt catctgagga ttctgcagtc tacttctgtg 660
caaggatcta tcattacgac ggatacttcg atgtctgggg cgcagggacc gccgtcaccg 720
tctcctcagg tggtggttcc ggtggtggtt ccggtggtgg ttccggtggt ggtgaagacc 780
cgtgcgcttg cgaatccctg gttaaattcc aggctaaagt tgaaggtctg ctgcaggctc 840
tgacccgtaa actggaagct gtttccaaac gtctggctat cctggaaaac accgttgttc 900
tcgagcacca ccaccaccac cactgagatc cggctgctaa caaagcccga aaggaagctg 960
agttggctgc tgccaccgct gagcaataac tagcataacc ccttggggcc tctaaacggg 1020
tcttgagggg ttttttgctg aaaggaggaa ctatatccgg attggcgaat gggacgcgcc 1080
ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact 1140
tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc 1200
cggctttccc cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt 1260
acggcacctc gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ggccatcgcc 1320
ctgatagacg gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt 1380
gttccaaact ggaacaacac tcaaccctat ctcggtctat tcttttgatt tataagggat 1440
tttgccgatt tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa 1500
ttttaacaaa atattaacgt ttacaatttc aggtggcact tttcggggaa atgtgcgcgg 1560
aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca tgagacaata 1620
accctgataa atgcttcaat aatattgaaa aaggaagagt atgagtattc aacatttccg 1680
tgtcgccctt attccctttt ttgcggcatt ttgccttcct gtttttgctc acccagaaac 1740
gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt acatcgaact 1800
ggatctcaac agcggtaaga tccttgagag ttttcgcccc gaagaacgtt ttccaatgat 1860
gagcactttt aaagttctgc tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga 1920
gcaactcggt cgccgcatac actattctca gaatgacttg gttgagtact caccagtcac 1980
agaaaagcat cttacggatg gcatgacagt aagagaatta tgcagtgctg ccataaccat 2040
gagtgataac actgcggcca acttacttct gacaacgatc ggaggaccga aggagctaac 2100
cgcttttttg cacaacatgg gggatcatgt aactcgcctt gatcgttggg aaccggagct 2160
gaatgaagcc ataccaaacg acgagcgtga caccacgatg cctgcagcaa tggcaacaac 2220
gttgcgcaaa ctattaactg gcgaactact tactctagct tcccggcaac aattaataga 2280
ctggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttc cggctggctg 2340
gtttattgct gataaatctg gagccggtga gcgtgggtct cgcggtatca ttgcagcact 2400
ggggccagat ggtaagccct cccgtatcgt agttatctac acgacgggga gtcaggcaac 2460
tatggatgaa cgaaatagac agatcgctga gataggtgcc tcactgatta agcattggta 2520
actgtcagac caagtttact catatatact ttagattgat ttaaaacttc atttttaatt 2580
taaaaggatc taggtgaaga tcctttttga taatctcatg accaaaatcc cttaacgtga 2640
gttttcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc 2700
tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt 2760
ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc 2820
gcagatacca aatactgtcc ttctagtgta gccgtagtta ggccaccact tcaagaactc 2880
tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg 2940
cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg 3000
gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga 3060
actgagatac ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc 3120
ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg 3180
gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg 3240
atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt 3300
tttacggttc ctggcctttt gctggccttt tgctcacatg ttctttcctg cgttatcccc 3360
tgattctgtg gataaccgta ttaccgcctt tgagtgagct gataccgctc gccgcagccg 3420
aacgaccgag cgcagcgagt cagtgagcga ggaagcggaa gagcgcctga tgcggtattt 3480
tctccttacg catctgtgcg gtatttcaca ccgcatatat ggtgcactct cagtacaatc 3540
tgctctgatg ccgcatagtt aagccagtat acactccgct atcgctacgt gactgggtca 3600
tggctgcgcc ccgacacccg ccaacacccg ctgacgcgcc ctgacgggct tgtctgctcc 3660
cggcatccgc ttacagacaa gctgtgaccg tctccgggag ctgcatgtgt cagaggtttt 3720
caccgtcatc accgaaacgc gcgaggcagc tgcggtaaag ctcatcagcg tggtcgtgaa 3780
gcgattcaca gatgtctgcc tgttcatccg cgtccagctc gttgagtttc tccagaagcg 3840
ttaatgtctg gcttctgata aagcgggcca tgttaagggc ggttttttcc tgtttggtca 3900
ctgatgcctc cgtgtaaggg ggatttctgt tcatgggggt aatgataccg atgaaacgag 3960
agaggatgct cacgatacgg gttactgatg atgaacatgc ccggttactg gaacgttgtg 4020
agggtaaaca actggcggta tggatgcggc gggaccagag aaaaatcact cagggtcaat 4080
gccagcgctt cgttaataca gatgtaggtg ttccacaggg tagccagcag catcctgcga 4140
tgcagatccg gaacataatg gtgcagggcg ctgacttccg cgtttccaga ctttacgaaa 4200
cacggaaacc gaagaccatt catgttgttg ctcaggtcgc agacgttttg cagcagcagt 4260
cgcttcacgt tcgctcgcgt atcggtgatt cattctgcta accagtaagg caaccccgcc 4320
agcctagccg ggtcctcaac gacaggagca cgatcatgcg cacccgtggg gccgccatgc 4380
cggcgataat ggcctgcttc tcgccgaaac gtttggtggc gggaccagtg acgaaggctt 4440
gagcgagggc gtgcaagatt ccgaataccg caagcgacag gccgatcatc gtcgcgctcc 4500
agcgaaagcg gtcctcgccg aaaatgaccc agagcgctgc cggcacctgt cctacgagtt 4560
gcatgataaa gaagacagtc ataagtgcgg cgacgatagt catgccccgc gcccaccgga 4620
aggagctgac tgggttgaag gctctcaagg gcatcggtcg agatcccggt gcctaatgag 4680
tgagctaact tacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt 4740
cgtgccagct gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc 4800
gccagggtgg tttttctttt caccagtgag acgggcaaca gctgattgcc cttcaccgcc 4860
tggccctgag agagttgcag caagcggtcc acgctggttt gccccagcag gcgaaaatcc 4920
tgtttgatgg tggttaacgg cgggatataa catgagctgt cttcggtatc gtcgtatccc 4980
actaccgaga tatccgcacc aacgcgcagc ccggactcgg taatggcgcg cattgcgccc 5040
agcgccatct gatcgttggc aaccagcatc gcagtgggaa cgatgccctc attcagcatt 5100
tgcatggttt gttgaaaacc ggacatggca ctccagtcgc cttcccgttc cgctatcggc 5160
tgaatttgat tgcgagtgag atatttatgc cagccagcca gacgcagacg cgccgagaca 5220
gaacttaatg ggcccgctaa cagcgcgatt tgctggtgac ccaatgcgac cagatgctcc 5280
acgcccagtc gcgtaccgtc ttcatgggag aaaataatac tgttgatggg tgtctggtca 5340
gagacatcaa gaaataacgc cggaacatta gtgcaggcag cttccacagc aatggcatcc 5400
tggtcatcca gcggatagtt aatgatcagc ccactgacgc gttgcgcgag aagattgtgc 5460
accgccgctt tacaggcttc gacgccgctt cgttctacca tcgacaccac cacgctggca 5520
cccagttgat cggcgcgaga tttaatcgcc gcgacaattt gcgacggcgc gtgcagggcc 5580
agactggagg tggcaacgcc aatcagcaac gactgtttgc ccgccagttg ttgtgccacg 5640
cggttgggaa tgtaattcag ctccgccatc gccgcttcca ctttttcccg cgttttcgca 5700
gaaacgtggc tggcctggtt caccacgcgg gaaacggtct gataagagac accggcatac 5760
tctgcgacat cgtataacgt tactggtttc acattcacca ccctgaattg actctcttcc 5820
gggcgctatc atgccatacc gcgaaaggtt ttgcgccatt cgatggtgtc cgggatctcg 5880
acgctctccc ttatgcgact cctgcattag gaagcagccc agtagtaggt tgaggccgtt 5940
gagcaccgcc gccgcaagga atggtgcatg caaggagatg gcgcccaaca gtcccccggc 6000
cacggggcct gccaccatac ccacgccgaa acaagcgctc atgagcccga agtggcgagc 6060
ccgatcttcc ccatcggtga tgtcggcgat ataggcgcca gcaaccgcac ctgtggcgcc 6120
ggtgatgccg gccacgatgc gtccggcgta gaggatcgag atctcgatcc cgcgaaatta 6180
atacgactca ctatagggga attgtgagcg gataacaatt cccctctaga aataattttg 6240
tttaacttta agaaggagat atacatatga aatacctgct gccgaccgct gctgctggtc 6300
tgctgctcct cgctgcccag ccggcgatgg                                  6330
<210>20
<211>6864
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:单链微型抗体的在T7启动子下的表达质粒,
     所述单链微型抗体展示出4G2mAb的可变区
<220>
<223>质粒
<400>20
catggcaaac attgtgatga cccaatctcc caaatccatg tccatgtcag taggagagag 60
ggtcaccttg acctgcaagg ccagtgagaa tgtggttact tatgtttcct ggtatcaaca 120
gaaaccagag cagtctccta aactgctgat atacggggca tccaaccggt acactggggt 180
ccccgatcgc ttcacaggca gtggatctgc aacagatttc actctgacca tcagcagtgt 240
gcaggctgaa gaccttgcag attatcactg tggacagggt tacagctatc cgtacacgtt 300
cggagggggg accaagctgg aaataaaaga gggtaaatcc tcaggatcag gctccgaatc 360
caaagtcgac gaggtccagc tgcaacaatc tggacctgag ctggtgaagc ctgggacttc 420
agtgaagata tcctgcaaga cttctggata cacattcact gaatatacca tacactgggt 480
gaagcagagc cacggaaaga gccttgcgtg gattggaggt attgatccta acagtggtgg 540
tactaactac agcccgaact tcaagggcaa ggccacattg actgttgaca agtcctccag 600
cacagcctac atggacctcc gcagcctgtc atctgaggat tctgcagtct acttctgtgc 660
aaggatctat cattacgacg gatacttcga tgtctggggc gcagggaccg ccgtcaccgt 720
ctcctcaggc ggtggcgagc ccaaatcttc tgacaaaact cacacatgcc caccgtgccc 780
agcacctgaa ctcctggggg gaccgtcagt cttcctcttc cccccaaaac ccaaggacac 840
cctcatgatc tcccggaccc ctgaggtcac atgcgtggtg gtggacgtga gccacgaaga 900
ccctgaggtc aagttcaact ggtacgtgga cggcgtggag gtgcataatg ccaagacaaa 960
gccgcgggag gagcagtacc agagcacgta ccgtgtggtc agcgtcctca ccgtcctgca 1020
ccaggactgg ctgaatggca aggagtacaa gtgcaaggtc tccaacaaag ccctcccagc 1080
ccccatcgag aaaaccatct ccaaagccaa agggcagccc cgagaaccac aggtgtacac 1140
cctgccccca tcccgggagg agatgaccaa gaaccaggtc agcctgacct gcctggtcaa 1200
aggcttctat cccagcgaca tcgccgtgga gtgggagagc aatgggcagc cggagaacaa 1260
ctacaagacc acgcctcccg tgctggactc cgacggctcc ttcttcctct atagcaagct 1320
caccgtggac aagagcaggt ggcagcaggg gaacgtcttc tcatgctccg tgatgcatga 1380
ggctctgcac aaccactaca cgcagaagag cctctccctg tccccgggta aactcgagca 1440
ccaccaccac caccactgag atccggctgc taacaaagcc cgaaaggaag ctgagttggc 1500
tgctgccacc gctgagcaat aactagcata accccttggg gcctctaaac gggtcttgag 1560
gggttttttg ctgaaaggag gaactatatc cggattggcg aatgggacgc gccctgtagc 1620
ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac acttgccagc 1680
gccctagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt 1740
ccccgtcaag ctctaaatcg ggggctccct ttagggttcc gatttagtgc tttacggcac 1800
ctcgacccca aaaaacttga ttagggtgat ggttcacgta gtgggccatc gccctgatag 1860
acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa 1920
actggaacaa cactcaaccc tatctcggtc tattcttttg atttataagg gattttgccg 1980
atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattttaac 2040
aaaatattaa cgtttacaat ttcaggtggc acttttcggg gaaatgtgcg cggaacccct 2100
atttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca ataaccctga 2160
taaatgcttc aataatattg aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc 2220
cttattccct tttttgcggc attttgcctt cctgtttttg ctcacccaga aacgctggtg 2280
aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg gttacatcga actggatctc 2340
aacagcggta agatccttga gagttttcgc cccgaagaac gttttccaat gatgagcact 2400
tttaaagttc tgctatgtgg cgcggtatta tcccgtattg acgccgggca agagcaactc 2460
ggtcgccgca tacactattc tcagaatgac ttggttgagt actcaccagt cacagaaaag 2520
catcttacgg atggcatgac agtaagagaa ttatgcagtg ctgccataac catgagtgat 2580
aacactgcgg ccaacttact tctgacaacg atcggaggac cgaaggagct aaccgctttt 2640
ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt gggaaccgga gctgaatgaa 2700
gccataccaa acgacgagcg tgacaccacg atgcctgcag caatggcaac aacgttgcgc 2760
aaactattaa ctggcgaact acttactcta gcttcccggc aacaattaat agactggatg 2820
gaggcggata aagttgcagg accacttctg cgctcggccc ttccggctgg ctggtttatt 2880
gctgataaat ctggagccgg tgagcgtggg tctcgcggta tcattgcagc actggggcca 2940
gatggtaagc cctcccgtat cgtagttatc tacacgacgg ggagtcaggc aactatggat 3000
gaacgaaata gacagatcgc tgagataggt gcctcactga ttaagcattg gtaactgtca 3060
gaccaagttt actcatatat actttagatt gatttaaaac ttcattttta atttaaaagg 3120
atctaggtga agatcctttt tgataatctc atgaccaaaa tcccttaacg tgagttttcg 3180
ttccactgag cgtcagaccc cgtagaaaag atcaaaggat cttcttgaga tccttttttt 3240
ctgcgcgtaa tctgctgctt gcaaacaaaa aaaccaccgc taccagcggt ggtttgtttg 3300
ccggatcaag agctaccaac tctttttccg aaggtaactg gcttcagcag agcgcagata 3360
ccaaatactg tccttctagt gtagccgtag ttaggccacc acttcaagaa ctctgtagca 3420
ccgcctacat acctcgctct gctaatcctg ttaccagtgg ctgctgccag tggcgataag 3480
tcgtgtctta ccgggttgga ctcaagacga tagttaccgg ataaggcgca gcggtcgggc 3540
tgaacggggg gttcgtgcac acagcccagc ttggagcgaa cgacctacac cgaactgaga 3600
tacctacagc gtgagctatg agaaagcgcc acgcttcccg aagggagaaa ggcggacagg 3660
tatccggtaa gcggcagggt cggaacagga gagcgcacga gggagcttcc agggggaaac 3720
gcctggtatc tttatagtcc tgtcgggttt cgccacctct gacttgagcg tcgatttttg 3780
tgatgctcgt caggggggcg gagcctatgg aaaaacgcca gcaacgcggc ctttttacgg 3840
ttcctggcct tttgctggcc ttttgctcac atgttctttc ctgcgttatc ccctgattct 3900
gtggataacc gtattaccgc ctttgagtga gctgataccg ctcgccgcag ccgaacgacc 3960
gagcgcagcg agtcagtgag cgaggaagcg gaagagcgcc tgatgcggta ttttctcctt 4020
acgcatctgt gcggtatttc acaccgcata tatggtgcac tctcagtaca atctgctctg 4080
atgccgcata gttaagccag tatacactcc gctatcgcta cgtgactggg tcatggctgc 4140
gccccgacac ccgccaacac ccgctgacgc gccctgacgg gcttgtctgc tcccggcatc 4200
cgcttacaga caagctgtga ccgtctccgg gagctgcatg tgtcagaggt tttcaccgtc 4260
atcaccgaaa cgcgcgaggc agctgcggta aagctcatca gcgtggtcgt gaagcgattc 4320
acagatgtct gcctgttcat ccgcgtccag ctcgttgagt ttctccagaa gcgtt aatgt4380
ctggcttctg ataaagcggg ccatgttaag ggcggttttt tcctgtttgg tcactgatgc 4440
ctccgtgtaa gggggatttc tgttcatggg ggtaatgata ccgatgaaac gagagaggat 4500
gctcacgata cgggttactg atgatgaaca tgcccggtta ctggaacgtt gtgagggtaa 4560
acaactggcg gtatggatgc ggcgggacca gagaaaaatc actcagggtc aatgccagcg 4620
cttcgttaat acagatgtag gtgttccaca gggtagccag cagcatcctg cgatgcagat 4680
ccggaacata atggtgcagg gcgctgactt ccgcgtttcc agactttacg aaacacggaa 4740
accgaagacc attcatgttg ttgctcaggt cgcagacgtt ttgcagcagc agtcgcttca 4800
cgttcgctcg cgtatcggtg attcattctg ctaaccagta aggcaacccc gccagcctag 4860
ccgggtcctc aacgacagga gcacgatcat gcgcacccgt ggggccgcca tgccggcgat 4920
aatggcctgc ttctcgccga aacgtttggt ggcgggacca gtgacgaagg cttgagcgag 4980
ggcgtgcaag attccgaata ccgcaagcga caggccgatc atcgtcgcgc tccagcgaaa 5040
gcggtcctcg ccgaaaatga cccagagcgc tgccggcacc tgtcctacga gttgcatgat 5100
aaagaagaca gtcataagtg cggcgacgat agtcatgccc cgcgcccacc ggaaggagct 5160
gactgggttg aaggctctca agggcatcgg tcgagatccc ggtgcctaat gagtgagcta 5220
acttacatta attgcgttgc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca 5280
gctgcattaa tgaatcggcc aacgcgcggg gagaggcggt ttgcgtattg ggcgccaggg 5340
tggtttttct tttcaccagt gagacgggca acagctgatt gcccttcacc gcctggccct 5400
gagagagttg cagcaagcgg tccacgctgg tttgccccag caggcgaaaa tcctgtttga 5460
tggtggttaa cggcgggata taacatgagc tgtcttcggt atcgtcgtat cccactaccg 5520
agatatccgc accaacgcgc agcccggact cggtaatggc gcgcattgcg cccagcgcca 5580
tctgatcgtt ggcaaccagc atcgcagtgg gaacgatgcc ctcattcagc atttgcatgg 5640
tttgttgaaa accggacatg gcactccagt cgccttcccg ttccgctatc ggctgaattt 5700
gattgcgagt gagatattta tgccagccag ccagacgcag acgcgccgag acagaactta 5760
atgggcccgc taacagcgcg atttgctggt gacccaatgc gaccagatgc tccacgccca 5820
gtcgcgtacc gtcttcatgg gagaaaataa tactgttgat gggtgtctgg tcagagacat 5880
caagaaataa cgccggaaca ttagtgcagg cagcttccac agcaatggca tcctggtcat 5940
ccagcggata gttaatgatc agcccactga cgcgttgcgc gagaagattg tgcaccgccg 6000
ctttacaggc ttcgacgccg cttcgttcta ccatcgacac caccacgctg gcacccagtt 6060
gatcggcgcg agatttaatc gccgcgacaa tttgcgacgg cgcgtgcagg gccagactgg 6120
aggtggcaac gccaatcagc aacgactgtt tgcccgccag ttgttgtgcc acgcggttgg 6180
gaatgtaatt cagctccgcc atcgccgctt ccactttttc ccgcgttttc gcagaaacgt 6240
ggctggcctg gttcaccacg cgggaaacgg tctgataaga gacaccggca tactctgcga 6300
catcgtataa cgttactggt ttcacattca ccaccctgaa ttgactctct tccgggcgct 6360
atcatgccat accgcgaaag gttttgcgcc attcgatggt gtccgggatc tcgacgctct 6420
cccttatgcg actcctgcat taggaagcag cccagtagta ggttgaggcc gttgagcacc 6480
gccgccgcaa ggaatggtgc atgcaaggag atggcgccca acagtccccc ggccacgggg 6540
cctgccacca tacccacgcc gaaacaagcg ctcatgagcc cgaagtggcg agcccgatct 6600
tccccatcgg tgatgtcggc gatataggcg ccagcaaccg cacctgtggc gccggtgatg 6660
ccggccacga tgcgtccggc gtagaggatc gagatctcga tcccgcgaaa ttaatacgac 6720
tcactatagg ggaattgtga gcggataaca attcccctct agaaataatt ttgtttaact 6780
ttaagaagga gatatacata tgaaatacct gctgccgacc gctgctgctg gtctgctgct 6840
cctcgctgcc cagccggcga tggc                                        6864
<210>21
<211>272
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:展示出4G2mAb的可变区的单链抗体片段
<220>
<223>蛋白质
<400>21
Met Lys Tyr Leu Leu Pro Thr Ala Ala Ala Gly Leu Leu Leu Leu Ala
  1               5                  10                  15
Ala Gln Pro Ala Met Ala Met Ala Asn Ile Val Met Thr Gln Ser Pro
             20                  25                  30
Lys Ser Met Ser Met Ser Val Gly Glu Arg Val Thr Leu Thr Cys Lys
         35                  40                  45
Ala Ser Glu Asn Val Val Thr Tyr Val Ser Trp Tyr Gln Gln Lys Pro
     50                  55                  60
Glu Gln Ser Pro Lys Leu Leu Ile Tyr Gly Ala Ser Asn Arg Tyr Thr
 65                  70                  75                  80
Gly Val Pro Asp Arg Phe Thr Gly Ser Gly Ser Ala Thr Asp Phe Thr
                 85                  90                  95
Leu Thr Ile Ser Ser Val Gln Ala Glu Asp Leu Ala Asp Tyr His Cys
            100                 105                 110
Gly Gln Gly Tyr Ser Tyr Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu
        115                 120                 125
Glu Ile Lys Glu Gly Lys Ser Ser Gly Ser Gly Ser Glu Ser Lys Val
    130                 135                 140
Asp Glu Val Gln Leu Gln Gln Ser Gly Pro Glu Leu Val Lys Pro Gly
145                 150                 155                 160
Thr Ser Val Lys Ile Ser Cys Lys Thr Ser Gly Tyr Thr Phe Thr Glu
                165                 170                 175
Tyr Thr Ile His Trp Val Lys Gln Ser His Gly Lys Ser Leu Ala Trp
            180                 185                 190
Ile Gly Gly Ile Asp Pro Asn Ser Gly Gly Thr Asn Tyr Ser Pro Asn
        195                 200                 205
Phe Lys Gly Lys Ala Thr Lau Thr Val Asp Lys Ser Ser Ser Thr Ala
    210                 215                 220
Tyr Met Asp Leu Arg Ser Leu Ser Ser Glu Asp Ser Ala Val Tyr Phe
225                 230                 235                 240
Cys Ala Arg Ile Tyr His Tyr Asp Gly Tyr Phe Asp Val Trp Gly Ala
                245                 250                 255
Gly Thr Ala Val Thr Val Ser Ser Leu Glu His His His His His His
            260                 265                 270
<210>22
<211>329
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:展示出4G2mAb的可变区和胞外基质蛋白的三聚化结构域的蛋白质
<220>
<223>蛋白质
<400>22
Met Lys Tyr Leu Leu Pro Thr Ala Ala Ala Gly Leu Leu Leu Leu Ala
  1               5                  10                  15
Ala Gln Pro Ala Met Ala Met Ala Asn Ile Val Met Thr Gln Ser Pro
             20                  25                  30
Lys Ser Met Ser Met Ser Val Gly Glu Arg Val Thr Leu Thr Cys Lys
         35                  40                  45
Ala Ser Glu Asn Val Val Thr Tyr Val Ser Trp Tyr Gln Gln Lys Pro
     50                  55                  60
Glu Gln Ser Pro Lys Leu Leu Ile Tyr Gly Ala Ser Asn Arg Tyr Thr
 65                  70                  75                  80
Gly Val Pro Asp Arg Phe Thr Gly Ser Gly Ser Ala Thr Asp Phe Thr
                 85                  90                  95
Leu Thr Ile Ser Ser Val Gln Ala Glu Asp Leu Ala Asp Tyr His Cys
            100                 105                 110
Gly Gln Gly Tyr Ser Tyr Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu
        115                 120                 125
Glu Ile Lys Glu Gly Lys Ser Ser Gly Ser Gly Ser Glu Ser Lys Val
    130                 135                 140
Asp Glu Val Gln Leu Gln Gln Ser Gly Pro Glu Leu Val Lys Pro Gly
145                 150                 155                 160
Thr Ser Val Lys Ile Ser Cys Lys Thr Ser Gly Tyr Thr Phe Thr Glu
                16                 5170                 175
Tyr Thr Ile His Trp Val Lys Gln Ser His Gly Lys Ser Leu Ala Trp
            180                 185                 190
Ile Gly Gly Ile Asp Pro Asn Ser Gly Gly Thr Asn Tyr Ser Pro Asn
        195                 200                 205
Phe Lys Gly Lys Ala Thr Leu Thr Val Asp Lys Ser Ser Ser Thr Ala
    210                 215                 220
Tyr Met Asp Leu Arg Ser Leu Ser Ser Glu Asp Ser Ala Val Tyr Phe
225                 230                 235                 240
Cys Ala Arg Ile Tyr His Tyr Asp Gly Tyr Phe Asp Val Trp Gly Ala
                245                 250                 255
Gly Thr Ala Val Thr Val Ser Ser Gly Gly Gly Ser Gly Gly Gly Ser
            260                 265                 270
Gly Gly Gly Ser Gly Gly Gly Glu Asp Pro Cys Ala Cys Glu Ser Leu
        275                 280                 285
Val Lys Phe Gln Ala Lys Val Glu Gly Leu Leu Gln Ala Leu Thr Arg
    290                 295                 300
Lys Leu Glu Ala Val Ser Lys Arg Leu Ala Ile Leu Glu Asn Thr Val
305                 310                 315                 320
Val Leu Glu His His His His His His
                325
<210>23
<211>507
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:展示出4G2mAb的可变区的单链微型抗体
<220>
<223>蛋白质
<400>23
Met Lys Tyr Leu Leu Pro Thr Ala Ala Ala Gly Leu Leu Leu Leu Ala
  1               5                  10                  15
Ala Gln Pro Ala Met Ala Met Ala Asn Ile Val Met Thr Gln Ser Pro
             20                  25                  30
Lys Ser Met Ser Met Ser Val Gly Glu Arg Val Thr Leu Thr Cys Lys
         35                  40                  45
Ala Ser Glu Asn Val Val Thr Tyr Val Ser Trp Tyr Gln Gln Lys Pro
     50                  55                  60
Glu Gln Ser Pro Lys Leu Leu Ile Tyr Gly Ala Ser Asn Arg Tyr Thr
 65                  70                  75                  80
Gly Val Pro Asp Arg Phe Thr Gly Ser Gly Ser Ala Thr Asp Phe Thr
                 85                  90                  95
Leu Thr Ile Ser Ser Val Gln Ala Glu Asp Leu Ala Asp Tyr His Cys
            100                 105                 110
Gly Gln Gly Tyr Ser Tyr Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu
        115                 120                 125
Glu Ile Lys Glu Gly Lys Ser Ser Gly Ser Gly Ser Glu Ser Lys Val
    130                 135                 140
Asp Glu Val Gln Leu Gln Gln Ser Gly Pro Glu Leu Val Lys Pro Gly
145                 150                 155                 160
Thr Ser Val Lys Ile Ser Cys Lys Thr Ser Gly Tyr Thr Phe Thr Glu
                165                 170                 175
Tyr Thr Ile His Trp Val Lys Gln Ser His Gly Lys Ser Leu Ala Trp
            180                 185                 190
Ile Gly Gly Ile Asp Pro Asn Ser Gly Gly Thr Asn Tyr Ser Pro Asn
        195                 200                 205
Phe Lys Gly Lys Ala Thr Leu Thr Val Asp Lys Ser Ser Ser Thr Ala
    210                 215                 220
Tyr Met Asp Leu Arg Ser Leu Ser Ser Glu Asp Ser Ala Val Tyr Phe
225                 230                 235                 240
Cys Ala Arg Ile Tyr His Tyr Asp Gly Tyr Phe Asp Val Trp Gly Ala
                245                 250                 255
Gly Thr Ala Val Thr Val Ser Ser Gly Gly Gly Glu Pro Lys Ser Ser
            260                 265                 270
Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly
        275                 280                 285
Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met
    290                 295                 300
Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His
305                 310                 315                 320
Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val
                325                 330                 335
His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Gln Ser Thr Tyr
            340                 345                 350
Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly
        355                 360                 365
Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile
    370                 375                 380
Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val
385                 390                 395                 400
Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser
                405                 410                 415
Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu
            420                 425                 430
Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro
        435                 440                 445
Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val
    450                 455                 460
Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met
465                 470                 475                 480
His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser
                485                 490                 495
Pro Gly Lys Leu Glu His His His His His His
            500                 505
<210>24
<211>22
<212>PRT
<213>胡萝卜软腐欧文氏菌
<220>
<223>信号肽
<220>
<223>pelB信号肽
<400>24
Met Lys Tyr Leu Leu Pro Thr Ala Ala Ala Gly Leu Leu Leu Leu Ala
  1               5                  10                  15
Ala Gln Pro Ala Met Ala
             20
<210>25
<211>107
<212>PRT
<213>小鼠
<220>
<223>多肽
<220>
<223>4G2mAb的轻链可变区的序列
<400>25
Asn Ile Val Met Thr Gln Ser Pro Lys Ser Met Ser Met Ser Val Gly
  1               5                  10                  15
Glu Arg Val Thr Leu Thr Cys Lys Ala Ser Glu Asn Val Val Thr Tyr
             20                  25                  30
Val Ser Trp Tyr Gln Gln Lys Pro Glu Gln Ser Pro Lys Leu Leu Ile
         35                  40                  45
Tyr Gly Ala Ser Asn Arg Tyr Thr Gly Val Pro Asp Arg Phe Thr Gly
     50                  55                  60
Ser Gly Ser Ala Thr Asp Phe Thr Leu Thr Ile Ser Ser Val Gln Ala
 65                  70                  75                  80
Glu Asp Leu Ala Asp Tyr His Cys Gly Gln Gly Tyr Ser Tyr Pro Tyr
                 85                  90                  95
Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys
            100                 105
<210>26
<211>14
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:连接scFv片段的可变区的连接体的序列
<220>
<223>肽
<400>26
Glu Gly Lys Ser Ser Gly Ser Gly Ser Glu Ser Lys Val Asp
  1               5                  10
<210>27
<211>119
<212>PRT
<213>小鼠
<220>
<223>多肽
<220>
<223>4G2mAb的重链可变区的序列
<400>27
Glu Val Gln Leu Gln Gln Ser Gly Pro Glu Leu Val Lys Pro Gly Thr
  1               5                  10                  15
Ser Val Lys Ile Ser Cys Lys Thr Ser Gly Tyr Thr Phe Thr Glu Tyr
             20                  25                  30
Thr Ile His Trp Val Lys Gln Ser His Gly Lys Ser Leu Ala Trp Ile
         35                  40                  45
Gly Gly Ile Asp Pro Asn Ser Gly Gly Thr Asn Tyr Ser Pro Asn Phe
     50                  55                  60
Lys Gly Lys Ala Thr Leu Thr Val Asp Lys Ser Ser Ser Thr Ala Tyr
 65                  70                  75                  80
Met Asp Leu Arg Ser Leu Ser Ser Glu Asp Ser Ala Val Tyr Phe Cys
                 85                  90                  95
Ala Arg Ile Tyr His Tyr Asp Gly Tyr Phe Asp Val Trp Gly Ala Gly
            100                 105                 110
Thr Ala Val Thr Val Ser Ser
        115
<210>28
<211>15
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:将胞外基质蛋白结构域连接至4G2mAb的
     重链可变结构域的连接体的序列
<220>
<223>肽片段
<400>28
Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly
  1               5                  10                  15
<210>29
<211>75
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:这是展示出来自登革2病毒的区段B和C的成熟蛋白质PMEC
<220>
<223>蛋白质
<400>29
Leu Val Thr Phe Lys Asn Pro His Ala Lys Lys Gln Asp Val Val Val
  1               5                  10                  15
Gly Gly Lys Leu Thr Asn Thr Thr Thr Glu Ser Arg Cys Pro Thr Gln
             20                  25                  30
Gly Glu Pro Ser Leu Asn Glu Glu Gln Asp Lys Arg Phe Leu Cys Lys
         35                  40                  45
His Ser Met Val Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly
     50                  55                  60
Lys Gly Gly Ile Val Thr Cys Ala Met Phe Thr
 65                  70                  75
<210>30
<211>75
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:这是展示出来自登革1病毒的区段B和C的成熟蛋白质PMEC
<220>
<223>蛋白质
<400>30
Leu Val Thr Phe Lys Thr Ala His Ala Lys Lys Gln Glu Val Val Val
  1               5                  10                  15
Gly Gly Lys Ile Ser Asn Thr Thr Thr Asp Ser Arg Cys Pro Thr Gln
             20                  25                  30
Gly Glu Ala Thr Leu Val Glu Glu Gln Asp Thr Asn Phe Val Cys Arg
         35                  40                  45
Arg Thr Phe Val Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly
     50                  55                  60
Lys Gly Ser Leu Ile Thr Cys Ala Lys Phe Lys
 65                  70                  75
<210>31
<211>75
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:这是展示出来自登革3病毒的区段B和C的成熟蛋白质PMEC
<220>
<223>蛋白质
<400>31
Leu Val Thr Phe Lys Asn Ala His Ala Lys Lys Gln Glu Val Val Val
  1               5                  10                  15
Gly Gly Lys Ile Thr Asn Ile Thr Thr Asp Ser Arg Cys Pro Thr Gln
             20                  25                  30
Gly Glu Ala Ile Leu Pro Glu Glu Gln Asp Gln Asn Tyr Val Cys Lys
         35                  40                  45
His Thr Tyr Val Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly
     50                  55                  60
Lys Gly Ser Leu Val Thr Cys Ala Lys Phe Gln
 65                  70                  75
<210>32
<211>75
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:这是展示出来自登革4病毒的区段B和C的成熟蛋白质PMEC
<220>
<223>蛋白质
<400>32
Met Val Thr Phe Lys Val Pro His Ala Lys Arg Gln Asp Val Thr Val
  1               5                  10                  15
Gly Gly Ser Ile Ser Asn Ile Thr Thr Ala Thr Arg Cys Pro Thr Gln
             20                  25                  30
Gly Glu Pro Tyr Leu Lys Glu Glu Gln Asp Gln Gln Tyr Ile Cys Arg
         35                  40                  45
Arg Asp Val Val Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly
     50                  55                  60
Lys Gly Gly Val Val Thr Cys Ala Lys Phe Ser
 65                  70                  75
<210>33
<211>75
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:这是展示出来自西尼罗病毒的区段B和C的成熟蛋白质PMEC
<220>
<223>蛋白质
<400>33
Leu Met Glu Phe Glu Glu Pro His Ala Thr Lys Gln Ser Val Val Ala
  1               5                  10                  15
Gly Gly Ser Val Ser Asp Leu Ser Thr Arg Ala Ala Cys Pro Thr Met
             20                  25                  30
Gly Glu Ala His Asn Glu Lys Arg Ala Asp Pro Ala Phe Val Cys Lys
         35                  40                  45
Gln Gly Val Val Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly
     50                  55                  60
Lys Gly Ser Ile Asp Thr Cys Ala Lys Phe Ala
 65                  70                  75
<210>34
<211>75
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:这是展示出来自日本脑炎病毒的区段B和C的成熟蛋白质PMEC
<220>
<223>蛋白质
<400>34
Leu Met Glu Phe Glu Gly Ala His Ala Thr Lys Gln Ser Val Val Ala
  1               5                  10                  15
Gly Gly Ser Val Thr Asp Ile Ser Thr Val Ala Arg Cys Pro Thr Thr
             20                  25                  30
Gly Glu Ala His Asn Glu Lys Arg Ala Asp Ser Ser Tyr Val Cys Lys
         35                  40                  45
Gln Gly Phe Thr Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly
     50                  55                  60
Lys Gly Ser Ile Asp Thr Cys Ala Lys Phe Ser
 65                  70                  75
<210>35
<211>75
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:这是展示出来自墨累山谷脑炎病毒的区段B和C的成熟蛋白质PMEC
<220>
<223>蛋白质
<400>35
Leu Val Glu Phe Glu Glu Pro His Ala Thr Lys Gln Ser Val Val Ala
  1               5                  10                  15
Gly Gly Thr Val Ser Asp Val Ser Thr Val Ser Asn Cys Pro Thr Thr
             20                  25                  30
Gly Glu Ser His Asn Thr Lys Arg Ala Asp His Asn Tyr Leu Cys Lys
         35                  40                  45
Arg Gly Val Thr Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly
     50                  55                  60
Lys Gly Ser Ile Asp Thr Cys Ala Lys Phe Thr
 65                  70                  75
<210>36
<211>75
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:这是展示出来自库京病毒的区段B和C的成熟蛋白质PMEC
<220>
<223>蛋白质
<400>36
Leu Met Glu Phe Glu Glu Pro His Ala Thr Lys Gln Ser Val Ile Ala
  1               5                  10                  15
Gly Gly Thr Val Ser Glu Leu Ser Thr Lys Ala Ala Cys Pro Thr Met
             20                  25                  30
Gly Glu Ala His Asn Asp Lys Arg Ala Asp Pro Ser Phe Val Cys Lys
         35                  40                  45
Gln Gly Val Val Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly
     50                  55                  60
Lys Gly Ser Ile Asp Thr Cys Ala Lys Phe Ala
 65                  70                  75
<210>37
<211>75
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:这是展示出来自圣·路易脑炎病毒的区段B和C的成熟蛋白质PMEC
<220>
<223>蛋白质
<400>37
Leu Val Glu Phe Glu Glu Pro His Ala Thr Lys Gln Thr Val Val Ala
  1               5                  10                  15
Gly Gly Thr Leu Asp Thr Leu Ser Thr Val Ala Arg Cys Pro Thr Thr
             20                  25                  30
Gly Glu Ala His Asn Thr Lys Arg Ser Asp Pro Thr Phe Val Cys Lys
         35                  40                  45
Arg Asp Val Val Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly
     50                  55                  60
Lys Gly Ser Ile Asp Thr Cys Ala Lys Phe Thr
 65                  70                  75
<210>38
<211>75
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:这是展示出来自黄热病毒的区段B和C的成熟蛋白质PMEC
<220>
<223>蛋白质
<400>38
Leu Val Glu Phe Glu Pro Pro His Ala Ala Thr Ile Arg Val Leu Ala
  1               5                  10                  15
Gly Gly Val Leu Thr His Val Lys Ile Asn Asp Lys Cys Pro Ser Thr
             20                  25                  30
Gly Glu Ala His Leu Ala Glu Glu Asn Glu Gly Asp Asn Ala Cys Lys
         35                  40                  45
Arg Thr Tyr Ser Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly
     50                  55                  60
Lys Gly Ser Ile Val Ala Cys Ala Lys Phe Thr
 65                  70                  75
<210>39
<211>75
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:这是展示出来自蜱传脑炎病毒的区段B和C的成熟蛋白质PMEC
<220>
<223>蛋白质
<400>39
Leu Val Glu Phe Gly Ala Pro His Ala Val Lys Met Asp Val Tyr Asn
  1               5                  10                  15
Gly Gly Lys Leu Ser Asp Thr Lys Val Ala Ala Arg Cys Pro Thr Met
             20                  25                  30
Gly Pro Ala Thr Leu Ala Glu Glu His Gln Ser Gly Thr Val Cys Lys
         35                  40                  45
Arg Asp Gln Ser Asp Arg Gly Trp Gly Asn His Cys Gly Leu Phe Gly
     50                  55                  60
Lys Gly Ser Ile Val Thr Cys Val Lys Ala Ser
 65                  70                  75
<210>40
<211>75
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:这是展示出来自兰加特病毒的区段B和C的成熟蛋白质PMEC
<220>
<223>蛋白质
<400>40
Leu Val Glu Phe Gly Thr Pro His Ala Val Lys Met Asp Val Phe Asn
  1               5                  10                  15
Gly Gly Lys Leu Thr Gly Thr Lys Val Ala Ala Arg Cys Pro Thr Met
             20                  25                  30
Gly Pro Ala Thr Leu Pro Glu Glu His Gln Ser Gly Thr Val Cys Lys
         35                  40                  45
Arg Asp Gln Ser Asp Arg Gly Trp Gly Asn His Cys Gly Leu Phe Gly
     50                  55                  60
Lys Gly Ser Ile Val Thr Cys Val Lys Phe Thr
 65                  70                  75
<210>41
<211>75
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:这是展示出来自羊跳跃病病毒的区段B和C的成熟蛋白质PMEC
<220>
<223>蛋白质
<400>41
Leu Val Glu Phe Gly Ala Pro His Ala Val Lys Met Asp Val Tyr Asn
  1               5                  10                  15
Gly Gly Lys Leu Ser Glu Thr Lys Val Ala Ala Arg Cys Pro Thr Met
             20                  25                  30
Gly Pro Ala Ala Leu Ala Glu Glu Arg Gln Ile Gly Thr Val Cys Lys
         35                  40                  45
Arg Asp Gln Ser Asp Arg Gly Trp Gly Asn His Cys Gly Leu Phe Gly
     50                  55                  60
Lys Gly Ser Ile Val Ala Cys Val Lys Ala Ala
 65                  70                  75
<210>42
<211>75
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:这是展示出来自玻瓦散病毒的区段B和C的成熟蛋白质PMEC
<220>
<223>蛋白质
<400>42
Leu Val Glu Phe Gly Pro Pro His Ala Val Lys Met Asp Val Phe Asn
  1               5                  10                  15
Gly Gly Lys Leu Thr Asn Thr Lys Val Glu Ala Arg Cys Pro Thr Thr
             20                  25                  30
Gly Pro Ala Thr Leu Pro Glu Glu His Gln Ala Asn Met Val Cys Lys
         35                  40                  45
Arg Asp Gln Ser Asp Arg Gly Trp Gly Asn His Cys Gly Phe Phe Gly
     50                  55                  60
Lys Gly Ser Ile Val Ala Cys Ala Lys Phe Glu
 65                  70                  75
<210>43
<211>75
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:这是相应于成熟PMEC蛋白质的序列,所述PMEC蛋白质
     在对于与抗体的相互作用来说不易接近的氨基酸位置处进行了突变
<220>
<223>蛋白质
<400>43
Asp Thr Val Tyr Arg Asn Glu His Asn Lys Lys His Asp Val Val Ser
  1               5                  10                  15
Ala Ser Lys Leu Thr Asn Thr Thr Thr Glu Ser Arg Cys Thr Gly Gln
             20                  25                  30
Gly Val Ala Thr Leu Asn Glu Asp Glu Asp Lys Arg Phe Asn Cys Tyr
         35                  40                  45
Leu Asp Leu Val Tyr Arg Gly Trp Gly Asn Gly Cys Gly Asp Arg Gly
     50                  55                  60
Leu Gly Phe Ile Lys Gln Cys Ser Met Lys Val
 65                  70                  75
<210>44
<211>75
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:这是相应于成熟PMEC蛋白质的序列,所述PMEC蛋白质
     在对于与抗体的相互作用来说不易接近的氨基酸位置处进行了突变
<220>
<223>蛋白质
<400>44
Asp Thr Glu Ile Tyr Asn Glu His Gly Lys Lys Thr Asp Val Val Thr
  1               5                  10                  15
Thr Ala Lys Leu Thr Asn Thr Thr Thr Glu Ser Arg Cys Pro Gly Gln
             20                  25                  30
Gly Glu Gln Thr Leu Asn Glu Asp Ala Asp Gln Arg Phe Phe Cys Val
         35                  40                  45
Lys Asp Leu Val Tyr Arg Gly Trp Gly Asn Gly Cys Gly Val Arg Gly
     50                  55                  60
Trp Gly Thr Ile Gln Gln Cys Val Met Lys Val
 65                  70                  75
<210>45
<211>75
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:这是相应于成熟PMEC蛋白质的序列,所述PMEC蛋白质
     在对于与抗体的相互作用来说不易接近的氨基酸位置处进行了突变
<220>
<223>蛋白质
<400>45
Asp Thr Val Val Arg Thr Glu His Lys Lys Lys Ile Asp Val Val Ser
  1               5                  10                  15
Ser Thr Lys Leu Thr Asn Thr Thr Thr Glu Ser Arg Cys Pro Gly Gln
             20                  25                  30
Gly Glu Ser Thr Leu Asn Glu Glu Glu Asp Glu Arg Phe Asp Cys Gln
         35                  40                  45
Gln Asp Gln Val Leu Arg Gly Trp Gly Asn Gly Cys Gly Val Pro Gly
     50                  55                  60
Trp Gly Asn Ile Lys Lys Cys Ala Met Lys Glu
 65                  70                  75
<210>46
<211>75
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:这是相应于成熟PMEC蛋白质的序列,所述PMEC蛋白质
     在对于与抗体的相互作用来说不易接近的氨基酸位置处进行了突变
<220>
<223>蛋白质
<400>46
Glu Ser Val Ser Val Asn Glu His Lys Lys Lys Asn Asp Val Val Ser
  1               5                  10                  15
Asp Thr Lys Leu Thr Asn Thr Thr Thr Glu Ser Arg Cys Pro Gly Gln
             20                  25                  30
Gly Glu Pro Thr Leu Asn Glu Glu Glu Asp Glu Arg Phe Asp Cys Gln
         35                  40                  45
Lys Asp Leu Val Tyr Arg Gly Trp Gly Asn Gly Cys Gly Val Arg Gly
     50                  55                  60
Trp Gly Trp Ile Lys Lys Cys Ala Met Lys Val
 65                  70                  75
<210>47
<211>75
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:这是相应于成熟PMEC蛋白质的序列,所述PMEC蛋白质
     在对于与抗体的相互作用来说不易接近的氨基酸位置处进行了突变
<220>
<223>蛋白质
<400>47
Lys Val Val Ser Arg Asn Glu His Arg Lys Lys Asn Asp Val Val Ser
  1               5                  10                  15
Glu Thr Lys Leu Thr Asn Thr Thr Thr Glu Ser Arg Cys Pro Asn Gln
             20                  25                  30
Gly Glu Ala Thr Leu Asn Glu Asp Glu Asp Glu Arg Phe Glu Cys Val
         35                  40                  45
Lys Asp Val Val Tyr Arg Gly Trp Gly Asn Gly Cys Gly Glu Arg Gly
     50                  55                  60
Leu Gly Thr Ile Gln Gln Cys Trp Met Asn Glu
 65                  70                  75
<210>48
<211>75
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:这是相应于成熟PMEC蛋白质的序列,所述PMEC蛋白质
     在对于与抗体的相互作用来说不易接近的氨基酸位置处进行了突变
<220>
<223>蛋白质
<400>48
Asp Asp Glu Tyr Tyr Leu Glu His Tyr Lys Lys Leu Asp Val Val Ser
  1               5                  10                  15
Arg Thr Lys Leu Thr Asn Thr Thr Thr Glu Ser Arg Cys Pro Gly Gln
             20                  25                  30
Gly Gln Ala Thr Leu Asn Glu Glu Glu Asp Glu Arg Phe Gln Cys Phe
         35                  40                  45
Val Ala Leu Val Ile Arg Gly Trp Gly Asn Gly Cys Gly Val Val Gly
     50                  55                  60
Trp Gly Ser Ile Val Val Cys Lys Met Lys Ile
 65                  70                  75
<210>49
<211>75
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:这是相应于成熟PMEC蛋白质的序列,所述PMEC蛋白质
     在对于与抗体的相互作用来说不易接近的氨基酸位置处进行了突变
<220>
<223>蛋白质
<400>49
Asp Thr Val Val Val Asn Glu His Asn Lys Lys Ile Asp Val Val Ser
  1               5                  10                  15
Thr Ser Lys Leu Thr Asn Thr Thr Thr Glu Ser Arg Cys Pro Gly Gln
             20                  25                  30
Gly Pro Ala Thr Leu Asn Glu Ala Glu Asp Glu Arg Phe Asp Cys Gln
         35                  40                  45
Phe Ser Tyr Val Tyr Arg Gly Trp Gly Asn Gly Cys Gly Lys Arg Gly
     50                  55                  60
Leu Gly Pro Ile Leu Val Cys Ala Met Lys Val
 65                  70                  75
<210>50
<211>75
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:这是相应于成熟PMEC蛋白质的序列,所述PMEC蛋白质
     在对于与抗体的相互作用来说不易接近的氨基酸位置处进行了突变
<220>
<223>蛋白质
<400>50
Asp Asn Val Val Val Asn Glu His Tyr Lys Lys Thr Asp Val Val Ser
  1               5                  10                  15
Ser Thr Lys Leu Thr Asn Thr Thr Thr Glu Ser Arg Cys Pro Gly Gln
             20                  25                  30
Gly Tyr Pro Thr Leu Asn Glu Gln Ser Asp Glu Arg Phe Val Cys Phe
         35                  40                  45
Val Asp Tyr Val Ile Arg Gly Trp Gly Asn Gly Cys Gly Val Asp Gly
     50                  55                  60
Trp Gly Pro Ile Val Val Cys Lys Met Lys Ile
 65                  70                  75
<210>51
<211>42
<212>PRT
<213>智人
<220>
<223>肽片段
<220>
<223>胞外基质蛋白的三聚化结构域的序列
<400>51
Glu Asp Pro Cys Ala Cys Glu Ser Leu Val Lys Phe Gln Ala Lys Val
  1               5                  10                  15
Glu Gly Leu Leu Gln Ala Leu Thr Arg Lys Leu Glu Ala Val Ser Lys
             20                  25                  30
Arg Leu Ala Ile Leu Glu Asn Thr Val Val
         35                  40
<210>52
<211>232
<212>PRT
<213>智人
<220>
<223>多肽
<220>
<223>具有铰链、CH2和CH3结构域的人IgG1的Fc片段的序列
<400>52
Glu Pro Lys Ser Ser Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala
  1               5                  10                  15
Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro
             20                  25                  30
Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val
         35                  40                  45
Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val
     50                  55                  60
Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln
 65                  70                  75                  80
Tyr Gln Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln
                 85                  90                  95
Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala
            100                 105                 110
Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro
        115                 120                 125
Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr
    130                 135                 140
Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser
145                 150                 155                 160
Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr
                165                 170                 175
Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr
            180                 185                 190
Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe
        195                 200                 205
Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys
    210                 215                 220
Ser Leu Ser Leu Ser Pro Gly Lys
225                 230
<210>53
<211>250
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:展示出4G2mAb的可变区的单链抗体片段的序列,
     在分泌至周质中后
<220>
<223>蛋白质
<400>53
Met Ala Asn Ile Val Met Thr Gln Ser Pro Lys Ser Met Ser Met Ser
  1               5                  10                  15
Val Gly Glu Arg Val Thr Leu Thr Cys Lys Ala Ser Glu Asn Val Val
             20                  25                  30
Thr Tyr Val Ser Trp Tyr Gln Gln Lys Pro Glu Gln Ser Pro Lys Leu
         35                  40                  45
Leu Ile Tyr Gly Ala Ser Asn Arg Tyr Thr Gly Val Pro Asp Arg Phe
     50                  55                  60
Thr Gly Ser Gly Ser Ala Thr Asp Phe Thr Leu Thr Ile Ser Ser Val
 65                  70                  75                  80
Gln Ala Glu Asp Leu Ala Asp Tyr His Cys Gly Gln Gly Tyr Ser Tyr
                 85                  90                  95
Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys Glu Gly Lys
            100                 105                 110
Ser Ser Gly Ser Gly Ser Glu Ser Lys Val Asp Glu Val Gln Leu Gln
        115                 120                 125
Gln Ser Gly Pro Glu Leu Val Lys Pro Gly Thr Ser Val Lys Ile Ser
    130                 135                 140
Cys Lys Thr Ser Gly Tyr Thr Phe Thr Glu Tyr Thr Ile His Trp Val
145                 150                 155                 160
Lys Gln Ser His Gly Lys Ser Leu Ala Trp Ile Gly Gly Ile Asp Pro
                165                 170                 175
Asn Ser Gly Gly Thr Asn Tyr Ser Pro Asn Phe Lys Gly Lys Ala Thr
            180                 185                 190
Leu Thr Val Asp Lys Ser Ser Ser Thr Ala Tyr Met Asp Leu Arg Ser
        195                 200                 205
Leu Ser Ser Glu Asp Ser Ala Val Tyr Phe Cys Ala Arg Ile Tyr His
    210                 215                 220
Tyr Asp Gly Tyr Phe Asp Val Trp Gly Ala Gly Thr Ala Val Thr Val
225                 230                 235                 240
Ser Ser Leu Glu His His His His His His
                245                 250
<210>54
<211>307
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:展示出4G2mAb的可变区和胞外基质蛋白的三聚化结构域的
     多价蛋白质的序列,在分泌至周质中后
<220>
<223>蛋白质
<400>54
Met Ala Asn Ile Val Met Thr Gln Ser Pro Lys Ser Met Ser Met Ser
  1               5                  10                  15
Val Gly Glu Arg Val Thr Leu Thr Cys Lys Ala Ser Glu Asn Val Val
             20                  25                  30
Thr Tyr Val Ser Trp Tyr Gln Gln Lys Pro Glu Gln Ser Pro Lys Leu
         35                  40                  45
Leu Ile Tyr Gly Ala Ser Asn Arg Tyr Thr Gly Val Pro Asp Arg Phe
     50                  55                  60
Thr Gly Ser Gly Ser Ala Thr Asp Phe Thr Leu Thr Ile Ser Ser Val
 65                  70                  75                  80
Gln Ala Glu Asp Leu Ala Asp Tyr His Cys Gly Gln Gly Tyr Ser Tyr
                 85                  90                  95
Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys Glu Gly Lys
            100                 105                 110
Ser Ser Gly Ser Gly Ser Glu Ser Lys Val Asp Glu Val Gln Leu Gln
        115                 120                 125
Gln Ser Gly Pro Glu Leu Val Lys Pro Gly Thr Ser Val Lys Ile Ser
    130                 135                 140
Cys Lys Thr Ser Gly Tyr Thr Phe Thr Glu Tyr Thr Ile His Trp Val
145                 150                 155                 160
Lys Gln Ser His Gly Lys Ser Leu Ala Trp Ile Gly Gly Ile Asp Pro
                165                 170                 175
Asn Ser Gly Gly Thr Asn Tyr Ser Pro Asn Phe Lys Gly Lys Ala Thr
            180                 185                 190
Leu Thr Val Asp Lys Ser Ser Ser Thr Ala Tyr Met Asp Leu Arg Ser
        195                 200                 205
Leu Ser Ser Glu Asp Ser Ala Val Tyr Phe Cys Ala Arg Ile Tyr His
    210                 215                 220
Tyr Asp Gly Tyr Phe Asp Val Trp Gly Ala Gly Thr Ala Val Thr Val
225                 230                 235                 240
Ser Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly
                245                 250                 255
Gly Glu Asp Pro Cys Ala Cys Glu Ser Leu Val Lys Phe Gln Ala Lys
            260                 265                 270
Val Glu Gly Leu Leu Gln Ala Leu Thr Arg Lys Leu Glu Ala Val Ser
        275                 280                 285
Lys Arg Leu Ala Ile Leu Glu Asn Thr Val Val Leu Glu His His His
    290                 295                 300
His His His
305
<210>55
<211>485
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:展示出4G2mAb的可变区的单链微型抗体的序列
<220>
<223>蛋白质
<400>55
Met Ala Asn Ile Val Met Thr Gln Ser Pro Lys Ser Met Ser Met Ser
  1               5                  10                  15
Val Gly Glu Arg Val Thr Leu Thr Cys Lys Ala Ser Glu Asn Val Val
             20                  25                  30
Thr Tyr Val Ser Trp Tyr Gln Gln Lys Pro Glu Gln Ser Pro Lys Leu
         35                  40                  45
Leu Ile Tyr Gly Ala Ser Asn Arg Tyr Thr Gly Val Pro Asp Arg Phe
     50                  55                  60
Thr Gly Ser Gly Ser Ala Thr Asp Phe Thr Leu Thr Ile Ser Ser Val
 65                  70                  75                  80
Gln Ala Glu Asp Leu Ala Asp Tyr His Cys Gly Gln Gly Tyr Ser Tyr
                 85                  90                  95
Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys Glu Gly Lys
            100                 105                 110
Ser Ser Gly Ser Gly Ser Glu Ser Lys Val Asp Glu Val Gln Leu Gln
        115                 120                 125
Gln Ser Gly Pro Glu Leu Val Lys Pro Gly Thr Ser Val Lys Ile Ser
    130                 135                 140
Cys Lys Thr Ser Gly Tyr Thr Phe Thr Glu Tyr Thr Ile His Trp Val
145                 150                 155                 160
Lys Gln Ser His Gly Lys Ser Leu Ala Trp Ile Gly Gly Ile Asp Pro
                165                 170                 175
Asn Ser Gly Gly Thr Asn Tyr Ser Pro Asn Phe Lys Gly Lys Ala Thr
            180                 185                 190
Leu Thr Val Asp Lys Ser Ser Ser Thr Ala Tyr Met Asp Leu Arg Ser
        195                 200                 205
Leu Ser Ser Glu Asp Ser Ala Val Tyr Phe Cys Ala Arg Ile Tyr His
    210                 215                 220
Tyr Asp Gly Tyr Phe Asp Val Trp Gly Ala Gly Thr Ala Val Thr Val
225                 230                 235                 240
Ser Ser Gly Gly Gly Glu Pro Lys Ser Ser Asp Lys Thr His Thr Cys
                245                 250                 255
Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu
            260                 265                 270
Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu
        275                 280                 285
Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys
    290                 295                 300
Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys
305                 310                 315                 320
Pro Arg Glu Glu Gln Tyr Gln Ser Thr Tyr Arg Val Val Ser Val Leu
                325                 330                 335
Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys
            340                 345                 350
Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys
        355                 360                 365
Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser
    370                 375                 380
Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys
385                 390                 395                 400
Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln
                405                 410                 415
Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly
            420                 425                 430
Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln
        435                 440                 445
Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn
    450                 455                 460
His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys Leu Glu His
465                 470                 475                 480
His His His His His
                485
<210>56
<211>479
<212>PRT
<213>人工序列
<220>
<223>人工序列的描述:展示出4G2mAb的可变区的单链微型抗体MA4G2的序列
<220>
<223>蛋白质
<400>56
Met Ala Asn Ile Val Met Thr Gln Ser Pro Lys Ser Met Ser Met Ser
  1               5                  10                  15
Val Gly Glu Arg Val Thr Leu Thr Cys Lys Ala Ser Glu Asn Val Val
             20                  25                  30
Thr Tyr Val Ser Trp Tyr Gln Gln Lys Pro Glu Gln Ser Pro Lys Leu
         35                  40                  45
Leu Ile Tyr Gly Ala Ser Asn Arg Tyr Thr Gly Val Pro Asp Arg Phe
     50                  55                  60
Thr Gly Ser Gly Ser Ala Thr Asp Phe Thr Leu Thr Ile Ser Ser Val
 65                  70                  75                  80
Gln Ala Glu Asp Leu Ala Asp Tyr His Cys Gly Gln Gly Tyr Ser Tyr
                 85                  90                  95
Pro Tyr Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys Glu Gly Lys
            100                 105                 110
Ser Ser Gly Ser Gly Ser Glu Ser Lys Val Asp Glu Val Gln Leu Gln
        115                 120                 125
Gln Ser Gly Pro Glu Leu Val Lys Pro Gly Thr Ser Val Lys Ile Ser
    130                 135                 140
Cys Lys Thr Ser Gly Tyr Thr Phe Thr Glu Tyr Thr Ile His Trp Val
145                 150                 155                 160
Lys Gln Ser His Gly Lys Ser Leu Ala Trp Ile Gly Gly Ile Asp Pro
                165                 170                 175
Asn Ser Gly Gly Thr Asn Tyr Ser Pro Asn Phe Lys Gly Lys Ala Thr
            180                 185                 190
Leu Thr Val Asp Lys Ser Ser Ser Thr Ala Tyr Met Asp Leu Arg Ser
        195                 200                 205
Leu Ser Ser Glu Asp Ser Ala Val Tyr Phe Cys Ala Arg Ile Tyr His
    210                 215                 220
Tyr Asp Gly Tyr Phe Asp Val Trp Gly Ala Gly Thr Ala Val Thr Val
225                 230                 235                 240
Ser Ser Gly Gly Gly Glu Pro Lys Ser Ser Asp Lys Thr His Thr Cys
                245                 250                 255
Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu
            260                 265                 270
Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu
        275                 280                 285
Val Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys
    290                 295                 300
Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys
305                 310                 315                 320
Pro Arg Glu Glu Gln Tyr Gln Ser Thr Tyr Arg Val Val Ser Val Leu
                325                 330                 335
Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys
            340                 345                 350
Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys
        355                 360                 365
Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser
    370                 375                 380
Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys
385                 390                 395                 400
Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln
                405                 410                 415
Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly
            420                 425                 430
Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln
        435                 440                 445
Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn
    450                 455                 460
His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys Leu Glu
465                 470                 475

Claims (40)

1.拓扑的且高度保守的区域,其特征在于,其暴露在成熟的病毒粒子上,并且其代表了黄病毒中共享的表位,可以用于开发用于预防和/或治疗由于登革病毒1-4和其他黄病毒引起的感染的广谱分子。
2.根据权利要求1的拓扑的且高度保守的区域,其中这个区域是来自黄病毒包膜的E蛋白的表位,其由来自登革病毒2的E蛋白的下述残基或来自其他黄病毒的相应残基来限定:ASN67、THR69、THR70、SER72、ARG73、CYS74、LEU82、GLU84、GLU85、ASP87、VAL97、ARG99、GLY100、TRP101、GLY102、ASN103、GLY104、CYS105、GLY106、MET118、HIS244、LYS246、LYS247、GLN248、VAL252。
3.根据权利要求1和2的拓扑的区域,其特征在于,其暴露在下述黄病毒的E蛋白的表面上:西尼罗病毒、圣·路易脑炎病毒、登革病毒1、登革病毒2、登革病毒3、登革病毒4、日本脑炎病毒、库京病毒、贾萨努尔森林热病毒、蜱传脑炎病毒、墨累山谷脑炎病毒、兰加特病毒、羊跳跃病病毒和玻瓦散病毒。
4.根据权利要求1的分子,其基于权利要求1-3中所描述的拓扑的区域而能够用于预防和/或治疗由于登革病毒1-4和其他黄病毒引起的感染,其特征在于它们在用所述分子免疫接种的个体中诱导中和抗体的应答的能力,所述中和抗体与登革病毒的4种血清型和其他黄病毒交叉反应。
5.根据权利要求4的分子,其中所述分子是具有序列标识号14和29-50的重组或合成的嵌合蛋白质或肽。
6.根据权利要求4的蛋白质分子,其一级结构由序列A-B-L-C限定,其中A是0-30个氨基酸的肽的序列,B是来自登革病毒2的E蛋白的片段Leu237-Val252的序列或者来自登革病毒1、3、4或任何其他黄病毒的同源序列,L是充当稳定化连接体的3-10个氨基酸的序列,和C是来自登革病毒2的E蛋白的片段Lys64-Thr120的序列或者来自登革病毒1、3、4或任何其他黄病毒的同源序列。
7.根据权利要求4的蛋白质分子,其一级结构由序列A-C-L-B限定,其中A是0-30个氨基酸的肽的序列,B是来自登革病毒2的E蛋白的片段Leu237-Val252的序列或者来自登革病毒1、3、4或任何其他黄病毒的同源序列,L是充当稳定化连接体的3-10个氨基酸的序列,和C是来自登革病毒2的E蛋白的片段Lys64-Thr120的序列或者来自登革病毒1、3、4或任何其他黄病毒的同源序列。
8.根据权利要求6和7的蛋白质,其中A是细菌信号肽。
9.根据权利要求6和7的蛋白质,其中A是酵母或哺乳动物信号肽。
10.合成或重组的融合蛋白,其特征在于,其由权利要求4-9中所描述的分子形成,并且在N-或C-末端与一个或多个肽或蛋白质片段相融合,所述肽或蛋白质片段增强其保护或治疗效应和/或有助于其纯化和/或检测。
11.根据权利要求10的合成或重组的融合蛋白,其中N-或C-末端融合配偶体是包含辅助T细胞表位的一个或多个肽或蛋白质片段。
12.根据权利要求10的合成或重组的融合蛋白,其中N-或C-末端融合配偶体是组氨酸标签。
13.核酸,其编码相应于权利要求4-12的蛋白质。
14.原核生物或真核生物宿主细胞,其包含根据权利要求13的核酸。
15.药物组合物,其特征在于,其包含根据权利要求4-12的一种或多种蛋白质,能够在受者生物中诱导中和和保护性抗体的免疫应答,所述中和和保护性抗体与登革病毒1-4交叉反应。
16.药物组合物,其特征在于,其包含根据权利要求4-12的一种或多种蛋白质,能够在受者生物中诱导中和和保护性抗体的免疫应答,所述中和和保护性抗体与其他黄病毒交叉反应。
17.药物组合物,其特征在于,基于包含编码权利要求4-12中所述蛋白质的基因的活载体或裸露DNA的使用,其能够在受者生物中诱导中和和保护性抗体的免疫应答,所述中和和保护性抗体与登革病毒1-4和其他黄病毒交叉反应。
18.根据权利要求5-12的合成或重组的蛋白质或肽分子,其能够用作诊断试剂以用于检测抗黄病毒抗体。
19.根据权利要求1的分子,其基于权利要求1-3中所描述的拓扑的区域而能够用于预防和/或治疗由于登革病毒1-4和其他黄病毒引起的感染,其特征在于,由于其与所述拓扑的区域相互作用而能够用于预防或减弱所述病毒感染。
20.根据权利要求19的分子,其中所述分子是人抗体或在其他物种中产生的抗体。
21.根据权利要求20的抗体,其中所述抗体与不同黄病毒交叉反应并且对于病毒感染是中和性的。
22.根据权利要求19-21的分子,其用于预防和/或治疗由于登革病毒1-4和其他黄病毒引起的感染,其中所述分子是所述抗体的重组或蛋白水解片段。
23.根据权利要求22的分子,其中所述分子是所述抗体的重组单链Fv片段(scFv)。
24.根据权利要求23的分子,其特征在于,使用或不使用间隔物将其与蛋白质序列相连接,所述蛋白质序列赋予所述分子装配成与成熟病毒粒子多价结合的分子的能力。
25.根据权利要求24的分子,其中与所述分子连接的所述蛋白质序列包含间隔物以及人免疫球蛋白的铰链、CH2和CH3区域,具有序列号55和56中指定的序列。
26.根据权利要求24的分子,其中与所述分子连接的所述蛋白质序列包含间隔物和三聚化结构域,具有序列号54中指定的序列。
27.核酸,其编码相应于权利要求18-26的蛋白质。
28.原核生物或真核生物宿主细胞,其包含根据权利要求27的核酸。
29.药物组合物,其特征在于,其包含根据权利要求18-26的一种或多种蛋白质,能够预防或减弱由于登革病毒1-4引起的感染。
30.药物组合物,其特征在于,其包含根据权利要求18-26的一种或多种蛋白质,能够预防或减弱由于其他黄病毒引起的感染。
31.根据权利要求18-26的合成或重组的蛋白质或肽分子,其能够用作诊断试剂以用于检测黄病毒。
32.能够用作针对黄病毒的广谱治疗候选物的分子,其通过这样的方法来鉴定,所述方法包括使所述分子与根据权利要求1-3的E蛋白的所述区域或保守表位接触,其中所述分子的结合表明所述分子是广谱治疗候选物。
33.根据权利要求32的分子,其中所述分子选自下述化合物类别:蛋白质、肽、拟肽和小分子。
34.根据权利要求32的方法,其中所述分子包括在化合物文库中。
35.根据权利要求34的方法,其中所述化合物文库通过组合方法来产生。
36.根据权利要求32的方法,其中所述结合通过体外测定法来测量。
37.根据权利要求36的方法,其中所述测定法通过阻断根据权利要求19-24的分子与根据权利要求1-3的保守区域的结合来进行。
38.根据权利要求36的方法,其中所述方法通过阻断根据权利要求19-24的分子与根据权利要求4-7的蛋白质分子的结合来进行。
39.根据权利要求32的方法,其中所述结合通过体内测定法来测量。
40.根据权利要求32的方法,其中所述方法是计算机辅助法,其包括:1)相应于形成根据权利要求1-3的E蛋白的所述高度保守区域的残基的原子坐标,并且所述坐标在蛋白质结构数据库上可获得或通过计算手段进行模拟或通过实验进行测定,2)分子的原子坐标,其已通过实验进行测定或通过计算手段进行模拟,3)分子对接的计算程序,其允许确定这种分子是否能够与根据权利要求1-3的高度保守区域相接触。
CNA2006800513773A 2005-11-22 2006-11-21 用于登革病毒的4种血清型和其他黄病毒的预防和/或治疗性治疗的方法和蛋白质 Pending CN101360758A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CU20050229 2005-11-22
CU20050229A CU23586A1 (es) 2005-11-22 2005-11-22 Métodos y proteínas para el tratamiento profiláctico y/o terapéutico de los cuatro serotipos del virus de dengue y otros flavivirus

Publications (1)

Publication Number Publication Date
CN101360758A true CN101360758A (zh) 2009-02-04

Family

ID=38983663

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006800513773A Pending CN101360758A (zh) 2005-11-22 2006-11-21 用于登革病毒的4种血清型和其他黄病毒的预防和/或治疗性治疗的方法和蛋白质

Country Status (13)

Country Link
US (1) US20090312190A1 (zh)
EP (1) EP1958959A2 (zh)
JP (1) JP2009524581A (zh)
KR (1) KR20080080137A (zh)
CN (1) CN101360758A (zh)
AR (1) AR058215A1 (zh)
AU (1) AU2006317350A1 (zh)
BR (1) BRPI0618865A2 (zh)
CA (1) CA2630629A1 (zh)
CU (1) CU23586A1 (zh)
RU (1) RU2008125077A (zh)
WO (1) WO2007059715A2 (zh)
ZA (1) ZA200804874B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102168058A (zh) * 2010-11-30 2011-08-31 湖南师范大学 一种抗肿瘤靶向工程菌和菌剂及其制备方法
CN102824633A (zh) * 2011-06-16 2012-12-19 中国人民解放军军事医学科学院微生物流行病研究所 一种四价登革病毒亚单位疫苗及其制备方法和应用
CN102906266A (zh) * 2010-05-21 2013-01-30 高等教育联邦系统-匹兹堡大学 登革病毒通用序列及其使用方法
CN101921310B (zh) * 2009-06-15 2014-03-12 温州医学院 登革病毒特异性hla-a2限制性表位肽及应用
CN105377893A (zh) * 2013-05-07 2016-03-02 豪夫迈·罗氏有限公司 三聚体抗原结合分子
CN106132981A (zh) * 2014-03-03 2016-11-16 遗传工程与生物技术中心 具有针对登革病毒的抗病毒特性的β‑发夹肽
CN107405392A (zh) * 2015-02-09 2017-11-28 中央研究院 用于增强对抗登革病毒的安全性及免疫力的抗原表位替换的疫苗
CN108912215A (zh) * 2012-04-02 2018-11-30 北卡罗来纳-查佩尔山大学 用于登革病毒表位的方法和组合物
CN109790217A (zh) * 2016-09-16 2019-05-21 中外制药株式会社 抗登革热病毒抗体、含有变体fc区域的多肽及使用方法
CN110007067A (zh) * 2019-03-11 2019-07-12 江苏理工学院 一种蛋白质分子对接检测装置
CN110568190A (zh) * 2019-08-30 2019-12-13 深圳国际旅行卫生保健中心 登革热病毒抗原、检测试剂、检测试纸、检测试剂盒及其使用方法
CN110734500A (zh) * 2013-06-26 2020-01-31 北卡罗来纳-查佩尔山大学 用于登革病毒疫苗的方法与组合物

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2031528A4 (en) * 2006-05-26 2009-06-17 Univ Kyoto ESTIMATING A PROTEIN-COMPOUND INTERACTION AND RATIONAL DESIGN OF A LIBRARY OF COMPOUNDS BASED ON CHEMICAL GENOMIC INFORMATION
CU20080028A6 (es) 2008-02-29 2011-02-24 Ct Ingenieria Genetica Biotech Compuestos químicos obtenidos in silico para la preparación de composiciones farmacéuticas para atenuar o inhibir la infección por virus dengue y otros flavivirus
AU2009305113B2 (en) * 2008-10-13 2015-07-16 Institute For Research In Biomedicine Dengue virus neutralizing antibodies and uses thereof
BRPI0904020B8 (pt) * 2009-10-01 2021-05-25 Fundacao Oswaldo Cruz composição vacinal contra o vírus da dengue, e, kit
US20130203655A1 (en) * 2010-02-12 2013-08-08 Margaret Kielian Methods for preventing or treating viral infection
SG10201606635SA (en) 2012-02-16 2016-10-28 Vlp Therapeutics Llc Virus like particle composition
CN104812408A (zh) * 2012-07-24 2015-07-29 赛诺菲巴斯德有限公司 用于防止登革热病毒感染的疫苗组合物
ES2859574T3 (es) * 2012-08-07 2021-10-04 Massachusetts Inst Technology Anticuerpos de antivirus del dengue y usos de los mismos
CU24188B1 (es) * 2012-12-27 2016-07-29 Ct De Ingeniería Genética Y Biotecnología Composición vacunal contra el virus dengue
CN103116022A (zh) * 2013-01-23 2013-05-22 广西壮族自治区兽医研究所 快速检测猪乙型脑炎抗体试纸条及其制备方法
US9637532B2 (en) 2013-07-12 2017-05-02 Vlp Therapeutics, Llc Virus like particle comprising PD-1 antigen or PD-1 ligand antigen
SG11201606624WA (en) 2014-02-11 2016-09-29 Visterra Inc Antibody moleules to dengue virus and uses thereof
BR112016017764A2 (pt) 2014-02-11 2017-10-10 Massachusetts Inst Technology anticorpo antidengue de amplo espectro
TWI720946B (zh) 2014-08-08 2021-03-11 美商Vlp醫療股份有限公司 包含改質套膜蛋白質e3之類病毒粒子
US10385101B2 (en) 2014-08-08 2019-08-20 Vlp Therapeutics, Llc Virus like particle comprising modified envelope protein E3
EP3188751A1 (en) 2014-09-02 2017-07-12 Sanofi Pasteur Vaccine compositions against dengue virus diseases
US10098943B2 (en) 2014-09-11 2018-10-16 Vlp Therapeutics, Llc Flavivirus virus like particle
JP6602875B2 (ja) * 2015-01-26 2019-11-06 マクロジェニクス,インコーポレーテッド Dr5結合ドメインを含む多価分子
EP3316905A1 (en) 2015-07-03 2018-05-09 Sanofi Pasteur Concomitant dengue and yellow fever vaccination
WO2017165736A1 (en) 2016-03-25 2017-09-28 Visterra, Inc. Formulation of antibody molecules to dengue virus
GB201610162D0 (en) * 2016-06-10 2016-07-27 Imp Innovations Ltd And Inst Pasteur Methods
WO2019069130A1 (en) 2017-10-05 2019-04-11 Sanofi Pasteur COMPOSITIONS FOR RECALL VACCINATION AGAINST DENGUE
CA3091047A1 (en) * 2018-02-14 2019-08-22 Yale University Compositions for modulation of a trem or treml protein and methods of use
KR102301130B1 (ko) * 2018-12-27 2021-09-15 주식회사 이뮨메드 뎅기출혈열 진단 키트

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6184024B1 (en) 1988-07-14 2001-02-06 The United States Of America As Represented By The Department Of Health And Human Services Chimeric and/or growth-restricted flaviviruses
EP0951555A2 (en) 1996-09-24 1999-10-27 Bavarian Nordic Research Institute A/S Recombinant mva virus expressing dengue virus antigens, and the use thereof in vaccines
CU22666A1 (es) * 1996-11-25 2001-04-27 Inst De Medicina Tropical Pedro Kouri Procedimiento para la expresión de genes de los virus del dengue en la levadura pichia pastoris, adns recombinantes y microorganismos transformados
JP4504464B2 (ja) 1997-02-28 2010-07-14 サノフィ パスツール バイオロジクス カンパニー キメラフラビウイルスワクチン
JP2001511459A (ja) 1997-07-31 2001-08-14 ハワイ バイオテクノロジー グループ, インコーポレイテッド フラビウイルス感染に対抗する組換え二量体エンベロープワクチン
AU754386B2 (en) 1997-09-23 2002-11-14 Bavarian Nordic A/S Dengue virus antigens and treatment of dengue fever
ATE471983T1 (de) 1998-09-02 2010-07-15 Us Gov Health & Human Serv Dengue viren, die in mosquitos nicht replizieren, zur verwendung als impfstoff
CU23245A1 (es) 2001-07-16 2007-10-17 Inst De Medicina Tropical Pedr CADENAS QUIMéRICAS CODIFICANTES PARA PROTEINAS INDUCTORAS DE EFECTOS CONTRA VIRUS. PREPARADOS UTILIZANDO PROTEINAS QUIMéRICAS
AU2003239932A1 (en) * 2002-05-31 2003-12-19 Acambis, Inc. Tetravalent dengue vaccines
WO2004052293A2 (en) * 2002-12-11 2004-06-24 Hawaii Biotech, Inc. Recombinant vaccine against flavivirus infection
WO2005002501A2 (en) * 2003-04-22 2005-01-13 Children's Medical Center Corporation Novel druggable regions in the dengue virus envelope glycoprotein and methods of using the same
BRPI0613287A2 (pt) * 2005-06-17 2010-12-28 Sanofi Pasteur cepa do vìrus da dengue-2 vivo atenuada, composição imunogênica, composição de vacina, ácido nucléico isolado, poliproteìna isolada codificadas pela seq id n .1 ou fragmentos desta e fragmento da poliproteìna

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101921310B (zh) * 2009-06-15 2014-03-12 温州医学院 登革病毒特异性hla-a2限制性表位肽及应用
CN102906266A (zh) * 2010-05-21 2013-01-30 高等教育联邦系统-匹兹堡大学 登革病毒通用序列及其使用方法
CN102168058B (zh) * 2010-11-30 2013-01-16 湖南师范大学 一种抗肿瘤靶向工程菌和菌剂及其制备方法
CN102168058A (zh) * 2010-11-30 2011-08-31 湖南师范大学 一种抗肿瘤靶向工程菌和菌剂及其制备方法
CN102824633A (zh) * 2011-06-16 2012-12-19 中国人民解放军军事医学科学院微生物流行病研究所 一种四价登革病毒亚单位疫苗及其制备方法和应用
CN108912215A (zh) * 2012-04-02 2018-11-30 北卡罗来纳-查佩尔山大学 用于登革病毒表位的方法和组合物
CN105377893A (zh) * 2013-05-07 2016-03-02 豪夫迈·罗氏有限公司 三聚体抗原结合分子
CN110734500A (zh) * 2013-06-26 2020-01-31 北卡罗来纳-查佩尔山大学 用于登革病毒疫苗的方法与组合物
CN106132981A (zh) * 2014-03-03 2016-11-16 遗传工程与生物技术中心 具有针对登革病毒的抗病毒特性的β‑发夹肽
CN106132981B (zh) * 2014-03-03 2019-11-12 遗传工程与生物技术中心 具有针对登革病毒的抗病毒特性的β-发夹肽
CN107405392A (zh) * 2015-02-09 2017-11-28 中央研究院 用于增强对抗登革病毒的安全性及免疫力的抗原表位替换的疫苗
CN109790217A (zh) * 2016-09-16 2019-05-21 中外制药株式会社 抗登革热病毒抗体、含有变体fc区域的多肽及使用方法
CN109790217B (zh) * 2016-09-16 2023-04-04 中外制药株式会社 抗登革热病毒抗体、含有变体fc区域的多肽及使用方法
CN110007067A (zh) * 2019-03-11 2019-07-12 江苏理工学院 一种蛋白质分子对接检测装置
CN110568190A (zh) * 2019-08-30 2019-12-13 深圳国际旅行卫生保健中心 登革热病毒抗原、检测试剂、检测试纸、检测试剂盒及其使用方法

Also Published As

Publication number Publication date
ZA200804874B (en) 2009-04-29
US20090312190A1 (en) 2009-12-17
KR20080080137A (ko) 2008-09-02
RU2008125077A (ru) 2009-12-27
WO2007059715A3 (es) 2007-10-18
CU23586A1 (es) 2010-10-30
EP1958959A2 (en) 2008-08-20
JP2009524581A (ja) 2009-07-02
WO2007059715A2 (es) 2007-05-31
AU2006317350A1 (en) 2007-05-31
AR058215A1 (es) 2008-01-23
BRPI0618865A2 (pt) 2011-09-13
CA2630629A1 (en) 2007-05-31
WO2007059715A8 (es) 2008-02-14

Similar Documents

Publication Publication Date Title
CN101360758A (zh) 用于登革病毒的4种血清型和其他黄病毒的预防和/或治疗性治疗的方法和蛋白质
CN110290814A (zh) 用于治疗威尔逊病的基因疗法
EA011876B1 (ru) АНТИТЕЛА К IFN-γ И СПОСОБ ПОЛУЧЕНИЯ И ПРИМЕНЕНИЯ АНТИТЕЛ
AU2017244108A1 (en) Chimeric antigen receptors targeting cancer
CN108753824A (zh) 用于治疗视网膜营养不良的病毒载体
CN102596249A (zh) Ax1和ax189 pcsk9拮抗剂和变体
CN105189543A (zh) 治疗福布斯科里病的方法和组合物
WO2023154824A1 (en) Human monoclonal antibodies that broadly target coronaviruses
CN111979240B (zh) 一种基于Type I-F CRISPR/Cas的基因表达调控方法和调控系统
JP2024506315A (ja) コロナウイルスのスパイクタンパク質を標的とする抗体
US20220218752A1 (en) Lockr-mediated recruitment of car t cells
Dejnirattisai et al. Omicron-B. 1.1. 529 leads to widespread escape from neutralizing antibody responses
KR101970428B1 (ko) 재조합 볼거리 바이러스 제릴린2계 백신
RO120919B1 (ro) Proteină hematopoietină, moleculă de acid nucleiccare o codifică, compoziţie farmaceutică şi utilizarea proteinei
JP5865002B2 (ja) 組換えプラスミドベクターおよびそれを用いたタンパク質の製造方法
CN114630909B (zh) 环状rna、包含环状rna的疫苗及用于检测新型冠状病毒中和抗体的试剂盒
Poumbourios et al. Enhanced stability of the SARS CoV-2 spike glycoprotein following modification of an alanine cavity in the protein core
CN109608547A (zh) 表达Her2的嵌合抗原受体、慢病毒表达载体及其应用
OPTIC Consortium SARS-CoV-2 Omicron-B. 1.1. 529 leads to widespread escape from neutralizing antibody responses
Purushotham et al. Cloning, expression and purification of the SRCR domains of glycoprotein 340
Carbonell et al. Insertional mutagenesis in the tailspike protein of bacteriophage P22
CN106749552B (zh) Wu多瘤病毒重组抗原及其制备方法和应用
RU2801532C1 (ru) Плазмидная генетическая конструкция pVEAL2-9E2ch-scFv, штамм рекомбинантной клеточной линии CHO-K1-9E2ch и химерное одноцепочечное антитело 9E2ch против вируса Западного Нила, продуцируемое указанным штаммом клеточной линии CHO-K1-9E2ch, обладающее высоким сродством к неонатальному рецептору FcRn
Hsu et al. Characterization of a strain-specific monoclonal antibody to hepatitis delta virus antigen
US20180221468A1 (en) Haemophilus influenzae immunogen

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20090204