CN101595127A - 用于诱导脊椎动物发生免疫应答的、包含有涵盖了单种抗原ama1的异质性的大量蛋白质变体的蛋白质组合物 - Google Patents

用于诱导脊椎动物发生免疫应答的、包含有涵盖了单种抗原ama1的异质性的大量蛋白质变体的蛋白质组合物 Download PDF

Info

Publication number
CN101595127A
CN101595127A CNA2006800567256A CN200680056725A CN101595127A CN 101595127 A CN101595127 A CN 101595127A CN A2006800567256 A CNA2006800567256 A CN A2006800567256A CN 200680056725 A CN200680056725 A CN 200680056725A CN 101595127 A CN101595127 A CN 101595127A
Authority
CN
China
Prior art keywords
lys
asn
glu
asp
ile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006800567256A
Other languages
English (en)
Other versions
CN101595127B (zh
Inventor
A·W·托马斯
C·H·M·考肯
B·W·法伯
E·J·瑞马克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Stichting Biomedical Primate Research Centre
Original Assignee
Stichting Biomedical Primate Research Centre
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Stichting Biomedical Primate Research Centre filed Critical Stichting Biomedical Primate Research Centre
Publication of CN101595127A publication Critical patent/CN101595127A/zh
Application granted granted Critical
Publication of CN101595127B publication Critical patent/CN101595127B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/002Protozoa antigens
    • A61K39/015Hemosporidia antigens, e.g. Plasmodium antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • A61P37/04Immunostimulants
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/44Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from protozoa
    • C07K14/445Plasmodium
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Organic Chemistry (AREA)
  • Immunology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Biophysics (AREA)
  • Zoology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Microbiology (AREA)
  • Mycology (AREA)
  • Epidemiology (AREA)
  • Toxicology (AREA)
  • Biochemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Engineering & Computer Science (AREA)
  • General Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)

Abstract

本发明涉及适用于诱导脊椎动物免疫应答的、包含单一抗原的2至10种蛋白质变体的蛋白质组合物,其中所述的单一抗原为疟原虫属物种的顶膜抗原1(PfAMA1或AMA1)。所述的抗原具有多个可变氨基酸位置,其中所述蛋白质变体的氨基酸序列以组合方式代表了各种氨基酸在所述的可变氨基酸位置处的发生频率,以及所述的可变氨基酸位置之间的关联,并且其中所述的发生频率在所述的单一抗原中至少为10%至20%,例如10%、11%、12%、13%……20%,并且其中所述的可变氨基酸位置之间至少75%的关联由蛋白质变体的组合来表示。

Description

用于诱导脊椎动物发生免疫应答的、包含有涵盖了单种抗原AMA1的异质性的大量蛋白质变体的蛋白质组合物
技术领域
本发明涉及用于诱导脊椎动物发生免疫应答的、包含有涵盖了单种抗原的异质性的多种蛋白质变体的蛋白质组合物。本发明进一步涉及蛋白质变体本身、编码该蛋白质变体的核酸、以及用于产生根据本发明的蛋白质变体的表达载体和宿主细胞。根据本发明的蛋白质组合物特别适用于提供针对引起疟疾的传染因子疟原虫属(例如恶性疟原虫(Plasmodium falciparum))的免疫应答。
在相当多的情况下,诸如疟原虫属或流感之类的传染因子通过改变其一种或多种免疫应答诱导因子而逃脱了之前的获得性(保护性)免疫应答。由于这种原因,之前的获得性(保护性)免疫应答(例如通过接种或之前的感染)不再能够控制传染因子的形成。
在多数情况下,所述的(保护性)免疫应答诱导因子或抗原是传染因子的一种或多种表面蛋白质,并且所述的变化涉及这些表面蛋白质中的氨基酸取代。这种经取代的蛋白质可以被称为免疫应答诱导因子或抗原的蛋白质变体或多态性蛋白质。
鉴于(保护性)免疫应答诱导蛋白质的生物学功能,氨基酸取代通常限于氨基酸位置的特定的子集。例如,如果(保护性)免疫应答诱导蛋白质的生物学功能依附于宿主细胞的外壁,则可以被取代以逃脱宿主免疫系统的氨基酸位置的子集限于不影响所述依附作用的那些氨基酸位置处。
此外,鉴于相关的生物学功能,在特定的氨基酸位置处,可行的氨基酸取代的数量也是受限的。
例如,用酸性氨基酸(例如天冬氨酸(Asp))取代极性氨基酸(例如丝氨酸(Ser))可能会影响免疫应答诱导蛋白质的功能,并且就待逃脱宿主免疫系统的传染因子而言,可能因此成为不合适的氨基酸取代。
此外,在抗原的特定位置处的某些特异性的氨基酸取代之间似乎存在关联(linkage)或相关性(correlation)。换言之,在抗原的某些位置处存在的例如丙氨酸(Ala)可以与抗原中附近的或远端的氨基酸位置处的例如甘氨酸(Gly)是关联的(linked)或相关的。
然而,虽然在(保护性)免疫应答诱导蛋白质中可行的氨基酸取代的数量受到了限制,但是这种蛋白质的可行变体的数量仍然很多。
这种蛋白质的实例为病毒传染因子流感的免疫原性血凝素(HA)表面糖蛋白。在这种糖蛋白中可行的、可取代的氨基酸的位置如此之多,使得每年都不得不对HA的最流行(区域)的蛋白质变体进行选择,从而提供仅对那一年而言是有效的流感疫苗。
另一个实例是引起疟疾的传染因子恶性疟原虫的PfAMA-1蛋白质。
估计,疟疾每年导致多至500百万的临床病例和2百万人死亡。最严重的发病率和死亡率发生在撒哈拉以南非洲地区、由恶性疟原虫在儿童和孕妇引起感染中。
已经鉴定出多种有效的(保护性)免疫应答诱导因子用于疫苗的研发,其中的一种是由单一拷贝的基因编码的恶性疟原虫顶膜抗原1(PfAMA1或AMA1)。
由啮齿类动物和非人灵长类动物疟疾模型中得到的证据显示,对AMA1产生的抗体应答能够降低感染的水平,并且针对AMA1的抗体在体外抑制无性寄生虫的增殖。
在病区(endemic area),免疫系统会响应于感染而产生抗AMA1的抗体,并且这些抗体可能与保护作用有关。
AMA-1(图1)为83kDa的蛋白质,该蛋白质包含大的N-末端胞外结构域、跨膜区域和大约50个氨基酸的C-末端细胞质尾部。所述的胞外结构域包含16个保守的半胱氨酸残基,这些半胱氨酸残基形成了限定潜在的3结构域结构的8个分子内二硫键。近期得到的AMA1的晶体结构证明这3结构域结构,但是表明在这些结构域之间存在相当大的相互作用。
针对AMA1的抗体阻断裂殖子侵入红血球、裂殖子在红血球表面上的再定位,阻断蛋白水解过程,并且缺乏AMA1的无性血内阶段的寄生虫显示是不能生存的,表明AMA1在红血球侵入过程中提供了重要的、且并非多余的生物学功能。
AMA1还存在于发育的孢子体阶段,表明使用AMA1来接种可以不仅靶向无性红血球的发育。
但是,与流感的血凝素(HA)相似,已知AMA1容易进行氨基酸取代,从而逃脱早期的获得性(保护性)免疫应答。
这可以通过在兔中的免疫应答研究来示例说明,所述研究表明,虽然从一株疟疾菌株得到的针对PfAMA1的抗体很好地抑制了同源菌株的生长,但是对其他菌株的抑制只达到可变的较低的程度。这表明PfAMA1氨基酸取代或多态性可以减少基于PfAMA1的疫苗的效力。
针对传染因子(例如流感或疟原虫属)的相当明显的疫苗策略是在一种疫苗的制备过程中包括所有已知的或者甚至所有理论可行的抗原的蛋白质变体或多态形式,从而诱导针对所有已知的以及甚至未来的传染因子的变体或多态形式的、有效(保护性)的免疫应答。
然而,这种疫苗策略是相当不切实际的,或者甚至是不可能的,这是因为涉及大量的蛋白质变体或多态形式。仅仅就恶性疟原虫而言,已经已知有AMA1蛋白质的300多种不同的蛋白质变体或多态形式。结果,仅仅有效地针对已知的恶性疟原虫多态形式的疫苗的制备就已经包括300多种蛋白质变体。
这种疫苗的制备不仅困难、费力和制造成本昂贵,甚至还使用了当前的重组DNA技术,但是它们在诱导免疫应答方面的治疗效果仍是不可靠的。当某些蛋白质变体或其部分存在于单一一种针对免疫系统的疫苗制备物中时,这些蛋白质或其部分会固有地具有更大的免疫原性,因此抑制了或甚至妨碍了针对免疫原性较小的蛋白质变体或其部分的免疫应答的发展。
此外,这种包含抗原的所有已知变体的疫苗制备物由于这种疫苗制备物的进化压力而可能不会有效地针对可能形成的传染因子的未来菌株。
因此,本发明的一个目的是提供一种适用于诱导脊椎动物针对传染因子的(保护性)免疫应答、从而避免上述缺点的蛋白质组合物或疫苗制备物。
本发明的另一个目的是提供一种适用于诱导脊椎动物有效针对(感染因子)多态性抗原的(保护性)免疫应答的蛋白质组合物或疫苗制备物。
本发明的另一个目的是提供一种可以相对容易地制备的蛋白质组合物或疫苗制备物。
本发明的另一个目的是提供一种相对便宜、并因此经济可行的蛋白质组合物或疫苗制备物。
本发明的这些目的和其他目的、以及优点可以由所附的权利要求书定义的蛋白质组合物来满足。
具体而言,本发明的这些目的和其他目的、以及优点可以由适用于诱导脊椎动物免疫应答的、包含单一抗原的2至10种蛋白质变体的蛋白质组合物来满足,其中所述抗原包含大量的可变氨基酸位置,其中所述蛋白质变体的氨基酸序列以组合方式代表了在所述的可变氨基酸位置处各种氨基酸的发生频率以及可变氨基酸位置之间的关联,并且其中在单一的抗原中所述的发生频率为至少10%至20%,并且其中可变氨基酸位置之间至少75%的关联由蛋白质变体的组合所代表。
使用上文所定义的蛋白质变体,本发明人出乎意料地发现单一的疫苗制备物可以有效地针对已知的、可行的未来(高度)多态性传染因子。
由于具有相对较少数量(即,2至10种)的蛋白质变体,所以与包含多态性传染因子的所有已知的天然蛋白质变体的蛋白质组合物或疫苗制备物相比,所述的蛋白质组合物或疫苗制备物可以更容易地制备并且更有成本效率。
此外,相对较少数量(即,2至10种)的蛋白质变体会减少或者甚至除去某些蛋白质变体或其部分的任意免疫原性结构域。
根据本发明,所述的抗原包含包含多个可变氨基酸位置。该抗原可以是传染因子(例如流感的血凝素或疟原虫属的AMA1)的任何免疫原性蛋白质,只要其包含大量的在自然界中可变的或取代的氨基酸位置即可。
虽然本发明没有具体地限定可变的或取代的氨基酸位置的特点数量,但是理论上遵循:当可变氨基酸取代的数量增多时,优选地使用本发明。这是因为可行的蛋白质变体的数量还会成比例地增加。
当可变氨基酸取代的数量至少为10、更优选的是至少为20、甚至更优选的至少为30、最优选的至少为40或更多时,本发明可优选的使用。
技术人员可以采用标准的技术来常规地测定给定抗原中可变氨基酸位置的存在情况和数量。
例如,可以采用序列之间的最大同源性来比对抗原的所有已知的天然的变体。在已知的抗原中,在相应的位置处,如果存在多于1种的氨基酸,则将该抗原中的氨基酸位置定义为可变的位置。
例如,对由500个氨基酸构成的传染因子的50种已知的免疫原性蛋白质进行的比对表明,从N-末端开始计数,氨基酸位置4、60、45、57、256、313、345、456、457、458、478、498和497可以包含不同的氨基酸,换言之,在该位置处氨基酸在自然界中可以被另一种氨基酸所取代。
如本文所用,“发生频率”被定义为一种氨基酸在天然的变体中发生的百分率。换言之,如果在天然的变体中,在氨基酸位置45处,20%为丙氨酸(Ala)、45%为甘氨酸(Gly)、35%为缬氨酸(Val),则对于位置45而言,发生频率为20%Ala、45%Gly和35%Val。
如本文所用,“可变氨基酸位置之间的关联”被定义为在可变位置处的单一氨基酸或节段氨基酸与另一个可变位置处的单一氨基酸或节段氨基酸相结合的天然变体的统计学发生率,即p<0.05。例如,如果在可变位置45、46、47和48处氨基酸序列“TEND”的发生与位置123处的氨基酸缬氨酸(Val)的发生呈统计学相关,那么前者被称为“关联的(linked)”。
如本文所用,术语“以组合方式”被定义为采用最大同源性比对的根据本发明的所有蛋白质变体的组合。
例如,用于可变氨基酸位置345处的“组合的”是指在该位置处的所有存在的氨基酸都被考虑在内。如果在蛋白质变体中,在位置345处,30%为丙氨酸(Ala)、70%为缬氨酸(Val),则用于该特定位置处的组合是指在所组合的蛋白质变体中,发生频率70%为Ala、30%为Val。
就所述的关联而言,如果这种具体的关联可以在任意的蛋白质变体中找到,则认为该关联在组合中是保守性的。换言之,所述的关联可以在至少一种蛋白质变体中找到。
如本文所用,术语“代表”用于表示在根据本发明的蛋白质变体中所反映的、在自然界中在特定位置处的氨基酸的发生频率。这并非意味着天然的发生频率还应该在根据本发明的蛋白质变体的组合中找到。
上述术语更加暗示了如果在某一可变位置处的氨基酸可以在自然界中更频繁的找到,则这种更频繁的发生(如果可能的话)还应该反映在根据本发明的蛋白质变体的组合中。
例如,如果在自然界中在位置456处,发现在60%的情况下氨基酸为缬氨酸(Val)、30%的情况下为甘氨酸(Gly)、10%的情况下为丝氨酸(Ser),假设有6个蛋白质变体用于所述的蛋白质组合,则在所述的位置处Val优选地存在于3个蛋白质变体中,Gly优选地存在于2个蛋白质变体中,Ser优选地存在于1个蛋白质变体中。
在上述情况下,其中仅使用4个蛋白质变体,则在所述的位置处Val优选地存在于2个蛋白质变体中,Gly优选地存在于1个蛋白质变体中,Ser优选地存在于1个蛋白质变体中,这反映了在大多数的情况下,在所述的位置处Val是普遍的。
在特定的蛋白质组合物或疫苗制备物中的蛋白质变体的数量取决于抗原的氨基酸可变性或者已知序列变体的数量。这种可变性表明需要使用至少2、3、4、5、6、7、8、9或10种蛋白质变体。
根据本发明,蛋白质变体的数量与抗原的可变性之间的关系可以通过所述抗原中可变氨基酸的位置(其显示了最大的可变性,即,不同氨基酸的数量)来确定。
例如,如果氨基酸位置258处通过在该位置处指明3个可行的氨基酸取代而显示出最大的可变性,则蛋白质变体的最小数量应该至少为3,从而可以反映出在蛋白质变体的组合中的这种可变性。换言之,需要至少3个代表了所述位置处3个可行的氨基酸的蛋白质变体。
如果60%的情况显示在所述位置处为Val,20%的情况显示在所述位置处为Gly或Ser,则优选的是,蛋白质变体的数量为4,其中2个蛋白质变体在位置258处为Val,1个蛋白质变体在所述位置处为Cys,1个蛋白质变体在所述位置处为Gly。
本发明人出乎意料地发现,通过利用发生频率和所述的关联,由此仅考虑在可变位置处发生频率为至少10-20%(例如至少10、11、12、13、14、15、16、17、18、19或20%)的氨基酸,并且在蛋白质变体的组合中在自然界中所发现的至少75%(例如75、80、85、90、95、99、100%)的关联是保守的,可以制备这样的蛋白质组合物,该蛋白质组合物可以使用有限量的蛋白质而能够基本上反应(高度)多态性天然蛋白质的免疫原性谱(repertoire)。
根据本发明的优选的实施方案,所述蛋白质组合物中的单种抗原为疟原虫属物种的AMA1蛋白质,其中所述的疟原虫属物种选自:恶性疟原虫、间日疟原虫、诺氏疟原虫、三日疟原虫和卵形疟原虫,其中优选的是恶性疟原虫。
如上文已经阐述的那样,疟原虫属AMA1蛋白质的已知变体的数量已经完全超过了300种。此外,在该蛋白质中,可变氨基酸位置的数量完全超过40种。
由于本发明提供了一种能够使用有限数量的蛋白质变体来在免疫原性方面涵盖所述的高度可变性的单一的蛋白质组合物,所以根据本发明的蛋白质组合物特别适用于基于AMA1蛋白质的疫苗。
在根据本发明的蛋白质组合物的特别优选的实施方案中,在所述的蛋白质组合物中,恶性疟原虫的AMA1蛋白质的可变氨基酸位置为162、167、172、173、175、187、190、196、197、200、201、204、206、207、225、230、242、243、267、282、283、285、296、300、308、332、393、404、405、407、435、439、448、451、485、493、496、503、512、544。
本发明人发现,当在研发根据本发明的蛋白质组合物中考虑了这些可变氨基酸位置时,在恶性疟原虫的天然变体中该蛋白质的基本上所有相关疫原性变体都被涵盖在内。
根据本发明的蛋白质组合物优选包含选自SEQ ID No 1至12中的至少3种蛋白质变体,更优选地包含选自SEQ ID No 1至6中的至少3种蛋白质变体,最优选地包含选自SEQ ID No 1、SEQ ID No 2和SEQ ID No 3中的至少3种蛋白质变体。
在特别优选的实施方案中,本发明的蛋白质组合物的蛋白质变体是连接的。这种连接可以采用本领域的技术人员公知的方法通过化学方法或通过重组DNA技术来形成。
例如,可以使用连接体核酸序列通过(例如)PCR或连接来连接编码不同蛋白质变体的分离的核酸序列。在将这种连接的构建体插入到合适的表达载体中之后,编码连接的蛋白质变体的构建体以单个蛋白质分子的形式表达,所述的蛋白质分子经适当的分离之后,可以并入到所述的蛋白质组合物中。
鉴于根据本发明的蛋白质组合物的发明理念,本发明还涉及选自SEQ ID No 1至12中的蛋白质变体,优选的是选自SEQ ID No 1至6中的蛋白质变体,最优选的是选自SEQ ID No 1至3中的蛋白质变体。
类似地,本发明还涉及编码上述蛋白质变体、优选的蛋白质变体、最优选的蛋白质变体、优选的SEQ ID No 12至24、更优选的SEQ ID No12至18、最优选的SEQ ID No 12至14的核酸序列。
这些核酸序列可以适当地插入、连接或者重组到表达载体中,并处于合适的调控和增殖信号(例如复制的启动子、终止子、分泌信号、增强子、复制起点,选择标记等)的控制之下,并且与这些调控和增殖信号可操作地连接。
因此,本发明还涉及包含根据本发明的DNA序列的表达载体,优选为pPicZalpha和pPIC9,从而可以在优选的甲基营养巴斯德毕赤酵母(Pichia pastoris)中表达蛋白质变体。
这种表达载体优选地被转化或转染,但是还可以预计到其整合到合适宿主细胞的基因组中,从而允许表达根据本发明的蛋白质变体。因此,本发明还涉及使用上文定义的表达载体转化或转染的宿主生物体。所述的宿主生物体优选的为巴斯德毕赤酵母。
鉴于根据本发明的蛋白质组合物的有利免疫原性,本发明还涉及根据本发明的蛋白质组合物在制备用于接种脊椎动物(优选地针对疟疾)的药物中的用途。所述的脊椎动物优选为人。
根据本发明的蛋白质组合物可以采用用于生产蛋白质组合物的方法来得到,所述的方法包括以下步骤:
a)测定抗原中可变氨基酸位置;各种氨基酸在所述的可变氨基酸位置处的发生频率;以及所述的可变氨基酸位置之间的关联;
b)测定包含不同氨基酸的最大数量X的可变氨基酸位置,其中各种不同氨基酸的发生频率至少为10-20%;
c)设计至少X种蛋白质的变体,这些变体以组合方式代表了各种氨基酸在各个可变位置处的发生频率。
在优选的实施方案中,对至少X种蛋白质变体的设计进一步以组合方式代表了可变氨基酸位置之间至少75%的关联。
在根据本发明方法的特别优选的实施方案中,步骤(c)包括设计蛋白质变体Y1至Yx,其过程如下:根据氨基酸的发生频率,向蛋白质变体Y1中的可变氨基酸位置处分配在该位置处发生频率最高的氨基酸,并向Yx分配在该位置处发生频率较低的氨基酸;向蛋白质变体Y2至Yx-1中的相应氨基酸位置处分配其余的氨基酸或相同的氨基酸,前体条件是可变氨基酸位置之间建立的关联在至少75%的情况下是保守的。
使用详细地显示本发明的优选实施方案的实施例来进一步示例说明本发明。在实施例中,参照以下附图,其中:
附图
图1为恶性疟原虫AMA1蛋白质的图示;
图2示出了恶性疟原虫AMA1蛋白质的氨基酸发生频率的概况。其指示出了氨基酸的位置、在所述位置处的氨基酸、它们的频率以及AMA1序列的数量,其中所指示的氨基酸是已经被发现的;
图3示出了从可变氨基酸位置162开始的不同的可变氨基酸位置之间的上游关联;
图4示出了从可变氨基酸位置162开始的不同的可变氨基酸位置之间的下游关联;
图5示出了DiCo1、DiCo2、DiCo3与酵母表达的HB3-AMA1、3D7-AMA1和FVO-AMA1,以及共同序列的比对,其中所述的共同序列来自从Genbank数据库得到的356种PfAMA1序列的比对;
图6示出了在结构域1至3中在毕赤酵母属表达的序列之间的差异。上部右侧:等位基因之间的总体差异;下部左侧:对于结构域的差异;
图7板A示出了经纯化的DiCo的SDS-PAGE。泳道1:Benchmark标志物;泳道2:DiCo1;泳道3:DiCo2;泳道4:DiCo3;泳道5:DiCo混合物。板B示出了用4G2作为一级抗体的Western印迹。Lane1:分子量标志物;泳道2:DiCo1;泳道3:DiCo2;泳道4:DiCo3;泳道5:DiCo混合物。样品没有被还原;
图8示出了针对多种AMA1变体的IgG抗体的水平。每种符号指示单一的兔子。在各处理组中,相同的符号代表相同的动物。圆圈:兔子1;十字叉:兔子2;三角:兔子3;四方:兔子4;菱形:兔子5;
图9示出了根据疫苗抗原和测定菌株的,对于单个兔子,生长抑制效价对比IgG浓度的情况。每种符号指示单一的兔子。在各处理组中,相同的符号代表相同的动物。圆圈:兔子1;十字叉:兔子2;三角:兔子3;四方:兔子4;菱形:兔子5;
图10示出了根据疫苗抗原和测定菌株的,对于单个兔子,生长抑制效价对比兔子的IgG浓度组的情况。空心圆圈:DiCo混合物;十字叉:DiCo 1;三角:DiCo 2;四方:DiCo 3;菱形:FVO-AMA-1。
实施例
使用恶性疟原虫AMA1进行免疫的涵盖多样性的方法;更广泛的等位基因识别和生长抑制
概述
恶性疟原虫AMA1(PfAMA1),一种候选疟疾疫苗,是多态性的。据信,这种多态性主要是在免疫选择压力下形成的,结果可能破坏了在接种方面的尝试。
将主要得自病区中寄生虫的355种PfAMA1序列进行比对和分析,其显示在等位基因之间,622个氨基酸残基中的大约10%具有发生变化的潜能(参见图2)。此外,已经鉴定了多态性残基间的关联(参见图3和4)。通过上述分析,形成了考虑了关联的、3种涵盖多样性(DiCo)的PfAMA1序列,并且当将这3种序列放在一起时,合并了所有氨基酸可变性的80%。对于这3种DiCo序列中的每一种,构建合成的基因,然后将该基因用于转化甲基营养巴斯德毕赤酵母,从而以50至100mg/L的产量进行重组表达。所有这3种DiCo蛋白质都与还原敏感性(reduction sensitive)单克隆抗体4G2具有反应性,表明DiCo具有与天然的PfAMA1相似的构造。
使用FVO菌株的PfAMA1或者使用单独的或混合的DiCo对兔进行免疫。测定抗体的效价和在体外抑制寄生虫生长的能力。当针对FVO菌株的寄生虫进行测定时,使用DiCo混合物免疫的动物的表现与使用FVO AMA1免疫的动物相似,但是当针对其他菌株进行评估时,使用DiCo混合物免疫的动物胜过使用FVO AMA1免疫的动物。将由3种DiCo的混合物诱导的生长抑制水平(70%)与FVO、3D7和HB3所诱导的生长印制水平进行比较,表明充分涵盖了变化程度相当大的AMA1。
这种情况表明基于DiCo混合方法的疫苗提供了比使用单一的等位基因进行免疫的更宽的功能免疫性。
材料和方法
涵盖多样性的AMA1序列在巴斯德毕赤酵母中的克隆
设计具有对于毕赤酵母的最佳密码子选择的合成基因用于包含DiCo1、DiCo2和DiCo3的结构域I、II和III的AMA1蛋白质(DNA2.0,San Diego)。使用引物X1(5′gcg aat tca ttg aaa ttg ttg aaa gatc3′,SEQ ID No:26)和Y1(5′ggg gta cca aca tct tat cgt aagttg g 3′,SEQ ID No:27)、X1和Y2(5′ggg gta ccg aca tgt tatcgt aag ttg gc 3′,SEQ ID No:28)、以及分别用于DiCo 1、2和3的X1和Y1来对这些序列进行PCR扩增。
将PCR产物克隆到pPicZA载体(Invitrogen,Groningen)的EcoRI-KpnI位点中,由此,该载体的atg的起始密码子(Met)用于转录起始,并将其用于转化大肠杆菌DH5细胞。在转化大肠杆菌DH5细胞之后,分离质粒,并检查所期望的限制性位点的存在情况,然后根据制造商的操作规程将其用于转化巴斯德毕赤酵母KM71H。
通过在29-30℃下、在有力的震动下,在含有10mL甘油培养基的50mL试管中培养48小时后,针对蛋白质生产来测试转化的巴斯德毕赤酵母菌落。通过离心(在2500rpm下离心5分钟,台式离心机)收获细胞,然后将所得细胞再次悬浮于4ml含有甲醇的培养基中,然后在有力的震动下在29-30℃下培养24小时。在低速离心后,收获培养物上清液,针对具有所需大小的蛋白质在SDS凝胶上对20μL进行测试。通过使用还原敏感性单克隆抗体4G2的western印迹来证实其特性。
蛋白质的产生
在3或7升的发酵罐(Applikon,Schiedam,The Netherlands)中进行几轮发酵,初始体积分别为1和2升。将巴斯德毕赤酵母克隆在30℃下,在BMGY(每升含有1%酵母提取物、2%蛋白胨、1.34%酵母氮源、1%甘油、0.4mg生物素,0.1M K磷酸盐,pH 6.0)中培养24小时。使用50ml/升的培养物接种装有低盐发酵培养基(每升培养基含有:MgSO4-7H2O,14.9克;K2SO4,,18.2克;CaCl2,0.65克;KOH,4.13克,甘油40克,26.7ml 85%H3PO4和12ml PTM1微量盐溶液)的发酵罐。
在分批阶段(batch phase)中,以1升/升初始培养基体积的量喷射空气。在整个发酵过程中,将温度恒定保持在30℃,并使用25%NH4OH和85%H3PO4将pH保持在6.0。在溶解氧水平返回至21%后,在溶解氧水平降至(几乎)0之后(通常18至24小时),开始分批补料。
随后,在20至24小时内,向培养物中以32mL/小时/升初始培养基体积的速率供入以12mL/升PTM1微量盐加强的50%甘油。在发酵的分批补料阶段过程中,用100%的氧气喷射培养基,从而将溶解氧的浓度保持在21%。最后,通过加入甲醇来诱导培养物。在第一个3小时内,速率为1mL/小时/升初始培养基体积,然后在3小时内将速率增大至3mL/小时/升初始培养基体积,随后在该速率持续大约18小时。
如观察到的,用100%的氧气将氧水平保持在21%仅仅抑制某些蛋白质的表达,在诱导阶段中,使用100%的氧气将氧水平保持在21%,但连续向所述的培养基中喷射空气(其量为1升/升初始发酵培养基)。
在诱导之后,将培养基的pH升高至pH7.8,并使用低温恒温器冷却至15℃或更低。通过离心(25分钟,5000xg,4℃)除去细胞,并用Quixstand中空纤维滤柱(GE Healthcare,Etten-Leur,TheNetherlands)将培养物的培养基过滤通过0.22μm的过滤器,从而除去所有残余的酵母细胞。
使用具有10kDa截留中空纤维柱体的Quixstand,将培养物上清液(2升或更多升)中的蛋白质浓缩至大约100mL,并用等体积的去矿物水进行稀释,然后再次浓缩。将上述过程重复4次。
然后,将所述的蛋白质结合到羟磷灰石柱(REF)上,其中所述的柱中使用1mM的磷酸钠缓冲剂(pH 8.0)进行了平衡。然后将所述的蛋白质用50mM的磷酸钠缓冲剂(pH 8.0)由所述的柱上洗脱下来。将该级份浓缩至小于1ml,随后置于Superdex 75制备型尺寸排阻色谱柱(REF)上。将含有DiCo蛋白质的级份集中在一起,然后进行浓缩,再过滤通过0.22μm的过滤器来进行除菌。
兔子的免疫
将兔子圈养,免疫,再根据国家动物福利条例(national animalwelfare regulations),由Eurogentec SA,Seraing,Belgium采集血液样品。在第0、28和56天,用毕赤酵母属表达的DiCo1(30μg)、DiCo2(30μg)或DiCo3(30μg),FV0PfAMA-I D123(30μg)或者DiCo1、DiCo2和DiCo3的混合物(每种物质10μg,共30μg)对共5组、每组5只的兔子进行免疫。使用Montanide ISA 51(SEPPIC,Paris,France)作为辅料。根据制造商提供的说明书来制备疫苗制剂(50/50质量/质量)。通过ELISA,针对反应性对在第三次免疫后2个星期(第70天)所得到的抗血清进行测试,并通过体外寄生虫抑制测定来测试功能性能力。
ELISA
根据公开的方法(Kocken 2002),在涂敷有500ng/mL经纯化的AMA1抗原的96孔平底微孔板(Greiner,Alphen a/d Rijn,TheNetherlands)中对血清样品进行一式两份的酶联免疫吸附测定(ELISA)。
第二抗体为与碱性磷酸酶缀合的抗兔IgG(Pierce,Rockford,IL)。对每一个板使用标准曲线,并通过四参数的拟合来计算未知的效价。效价可以以任意单位表示,其中1AU产生1.0的OD。因此样品的AU的量是在此量时OD达到1的稀释度倒数(reciprocal dilution)。
IgG的纯化
采用标准的方法ENRfu(8),在蛋白质A柱(Sigma,St Louis,MO)上对待用于寄生虫抑制测定的抗体进行纯化,然后使用Amicon浓缩器(截留值30kDa),交换到RPMI 1640中,再进行过滤除菌,之后在-20℃下进行储存,直到使用。使用Nanodrop ND-1000分光光度计(Nanodrop Technologies,Wilmington,DE,USA)测定IgG的浓度。
寄生虫
使用标准的恶性疟原虫培养技术,在由5%CO2,5%O2和90%N2构成的气氛中,体外培养恶性疟原虫菌株NF54、FCR3、HB3。在前导序列中,FCR 3AMA1(登记号:M34553)与FVO AMA1(登记号:AJ277646)有1个氨基酸不同。
体外寄生虫抑制的测定(PIA)
使用具有体外成熟的恶性疟原虫裂殖体的96孔平底板(Greiner),一式三份评估纯化的IgG抗体对寄生虫侵入的作用,其中所述的恶性疟原虫裂殖体的起始寄生虫血症百分率为0.2-0.4%,血细胞比容为2.0%,并且所述96孔平底板含有总体积为100μL的处于RPMI 1640中的10%正常人血清和20μg mL-1庆大霉素。
在40至42小时后,将培养物再次悬浮,并将50μL转移到200μL冰冷的PBS中。然后将培养物离心,除去上清液,冷冻所述的平板。按照之前所述(Kennedy 2002),采用pLDH测定来估测寄生虫的生长抑制。按照下式计算寄生虫的生长抑制率,并以百分率表示:
100-((Od试验-Od背景)/(Od对照-Od背景)x100)
对照IgG是从仅使用辅料免疫的兔子分离的。
统计分析
使用对数转换的IgG效价作为因变量而疫苗抗原作为自变量,采用方差分析(ANOVA)来比较IgG的效价。采用线性混合效应模型对PIA效价进行分析,从而可以在校正假重复的同时,同时比较多种IgG的浓度(Paterson等)。
将PIA效价作为因变量输入,并将对数转换的IgG总量和处理组作为自变量输入。针对各种测试的菌株拟合多种模型,并基于对数似然值选择最佳的拟合模型。
结果
AMA变体中的多态性分析
在2005年1月3日得到的所有恶性疟原虫AMA1序列(完整序列和片段)来自在Pubmed数据库(www.ncbi.nlm.nih.gov/entrez/)中的核苷酸检索。除去复制体(U84348[3D7]、AU087598[FVO]、U33274[3D7]和AF061332[KF1916]),并将用于NF7菌株的2个部分序列(U33280和M27957)结合起来。使用Excel macro比对随后的355条序列,并鉴定多态性残基。
为了减小由测序错误而导致的合并数据的风险,将多态性位置定义为这样的位置,该位置在序列之间变化使得355条序列中的2条或多条序列在所述的位置处具有相同的氨基酸取代。采用该定义,622个氨基酸位置中的64个位置被指定为是多态性的;其中前导序列中有9处(aa 1-96;9.4%)、结构域1中有33处(aa 97-315;15.1%)、结构域2中有8处(aa 316-425;7.3%)、结构域3中有11处(aa 426-545;9.2%)、跨膜区域没有(aa 546-567;0%)和细胞质尾部有3处(aa568-622;5.5%)。所述的比对还表明,在一个多态性位置处存在的特定氨基酸通常与所述蛋白质下游(参见图4)及上游(参见图3)(即,分别在C末端或N末端方向)存在的特定氨基酸相联系。
用于鉴定所述的关联而编写的软件显示在22个多态性位点处24个残基为上游关联。各下游关联基团的最N末端的成员往往在所述的位置处并非是主要的残基(在55种情况中的53种情况下),但是该残基往往与作为主要(共同)残基的下游残基关联。通常,在位置197处,2种可行的氨基酸(G和D)显示为下游关联。位置172和283例外,所述的主要的残基与下游残基关联,而在位置200处,主要的残基和次要的残基均相联系。
在22个多态性位点处,观察到有26(27)个残基为上游关联。所述关联基团的最C末端的成员往往在所述的位置处并非为主要的残基,而关联的上游残基通常为主要(共同)的残基。例外的是,在位置197处,所有的残基都显示与位置196处上游关联。在位置285处的E显示出不同寻常的上游关联,其原因在于E与非共有的L283关联,而R503与非共有的残基M496上游关联。
设计人工基因以涵盖由多样性并且合并关联
为了降低研发下游疫苗的复杂性,认为可以提供最多3种涵盖多样性的序列(DiCo)。设计这些DiCo(DiCo1、DiCo2和DiCo3)(其中每一个DiCo都包含结构域I、II和III(aa 97-545)),使得当将这些DiCo放在一起时,合并了天然残基的最大数量,前提条件是频率最低的残基相联系,因此限制了所述的序列。因此,超过80%的氨基酸存在于天然序列中的任何给定的位置处,并且在DiCo组合中可以找回大部分关联。
为了将其限制为3种DiCo,将低于10%的序列显示出变化的12个位置[残基:121(99%E)、189(92%L)、199(99%R)、224(99%M)、228(97%N)、244(92%D)、245(96%K)、269(96%K)、325(98%H)、330(91%S)、395(92%K)和505(96%F)]以及10-16%的序列显示出变化的4个位置[173(85.7%N)、175(89.6%D)、207(83.7%Y)和407(84.4%Q)]排除在外。因此,在52个多态性位置处,最多36个可变的位置(分别为结构域I、II和III中的22/33,4/8和10/11位置)被包含在DiCo蛋白质的设计中。
考虑到关联,设计3条主链。DiCo1(SEQ ID No:1和4)完全顺应下游和上游的关联。DiCo2(SEQ ID No:2和5)破坏了下游关联,其原因在于H296并非如同天然AMA1序列那样与D448关联、而是与N448关联;并且DiCo2(SEQ ID No:2和5)破坏了上游关联,其原因在于D296受到了N448的限制、同时H296被包含在内。DiCo3(SEQ ID No 3和6)至少并入了普通的氨基酸,并且两处限制的下游位置是不顺应的。
通常,E206受到了D197/D200/L201的限制,同时DiCo3并入了K206。此外,通常N225受到了L201的限制;在DiCo3中,并入了I225。两个上游关联是不顺应的:H200和F201受到了K206的限制,但是D200和L201被包含在内。
随后,根据非关联的多态性残基的发生频率,将其分别并入到DiCo1、DiCo2和DiCo3主链中。由于据信AMA1在疟原虫寄生虫中不能是糖基化的,所以改变NxS/NxT基序,从而除去潜在的N-糖基化位点(SEQ ID No:1至3)。按照之前所述改变非多态性残基(Kocken 2002)(T288->V,S373->D,N422->D,S423->K and N499->Q)。由于DiCo1和DiCo2的N162是关联的多态性残基及潜在的N-糖基化位点,所以可以将其改变成Q162,从而避免引入限制。
图5示出了在与HB3(SEQ ID NO:30)、3D7(SEQ ID No:29)和FVO(SEQ ID NO:31)菌株的AMA1以及共有序列(SEQ ID NO:25)(其来自所有355条输入序列的比对)的比对中的所有得到的DiCo序列(SEQ ID No 1至3)。这些序列之间的差异概括于图6中,其中包括了根据AMA1结构域的差异概况。DiCo1与共有序列接近(差异仅在4个位置处,所有位置都位于结构域I中);如所预计的那样,DiCo2和DiCo3明显不同于共有序列,并且整体而言,DiCo序列彼此相差相当大。
DiCo在巴斯德毕赤酵母中的表达
在小规模发酵罐中进行表达得到了纯化前40mg/L或更高的蛋白质水平。采用Ni-IMAC色谱来纯化DiCo1。虽然6-His标记也可以被并入到DiCo2和DiCo3中,但是它们不与Ni-IMAC结合,而替代以通过依次的羟磷灰石和尺寸排阻色谱法来纯化。
针对完整性、通过SDS-PAGE的纯化、和通过使用还原敏感性单克隆抗体4G2的Western印迹的抗原性来对经纯化的DiCo蛋白质进行评估(参见图7)。所有3种DiCo蛋白质的主带都以所预计的大小(50kDa)迁移,并与4G2发生反应。一定比例的DiCo1显示出更缓慢的迁移带;如之前所报道(REF)的那样,在毕赤酵母属中表达的一些AMA1分子可以发生O-糖基化。
通过具有对糖基化部分特异性的菌株进行的凝胶分析(数据未示出)表明,上述情况可以在DiCo1中发生,这种观察到的情况可以解释迁移中所观察到的异质性。
就所有3种DiCo蛋白质而言,Western印迹分析还表明了二聚化情况,这在之前的全长胞外结构域(aa 25-545)GMP产物中已经观察到了,在这种情况下没有导致效力的损失。
免疫和功能的评估
将每组5只的各组兔子都用30μg得自FVO菌株的、在毕赤酵母中表达并经纯化的AMA1,DiCo1、DiCo2、DiCo3或者3种DiCo每种的10μg混合物(DiCoMix)免疫3次。
通过ELISA测定针对免疫抗原和针对得自三种试验室菌株的AMA1的抗体水平(参见图8和9)。虽然这些DiCo序列均没有在自然界中观察到,但是整体而言,它们均被来自兔子的抗体所识别,其中所述的兔子用FVO AMA1免疫,并引发了与FVO、3D7和HB3抗原发生反应的抗体,这进一步表明它们获得了合适的构象。
使用DiCoMix免疫的兔子显示出这样的应答,其总体上与使用单一成分进行免疫而得到的应答相当。此外,就所研究的所有抗原而言,在使用DiCoMix进行免疫的组中,IgG效价的变化最小。在处理组之间,对FVO、3D7和HB3抗原所产生的应答没有明显的不同(p分别为0.27、0.48和0.35)。
就DiCo1而言,存在这样的趋势,即,FVO免疫的动物具有比DiCo1和DiCoMix组更低的效价(p=0.09)。就DiCo2而言,使用DiCo2免疫的动物往往比使用DiCoMix和DiCo1免疫的动物具有更高的效价,并且DiCo3免疫的动物比使用DiCo2免疫的动物具有更低的效价(p=0.0035)。与使用DiCo1、DiCo2和DiCoMix免疫的动物相比,使用DiCo3免疫的动物具有明显更高的DiCo3效价(p=0.002)。
为了评估抗寄生虫的效果,将从兔血清(其在最终免疫后的2个星期得到)纯化得到的IgG加入到3D7、FCR3和HB3菌株的同步无性血内阶段培养物中(参见图10)。DiCoMix总是处于3个表现最佳抗原的中,其在抑制测定中,以6mg/mL对所有3种测试菌株的抑制为约70%。此外,DiCoMix的表现与FCR3的同源(FVO)抗原几乎相同。所有单独的DiCo抗原在兔子中都引发了在抑制寄生虫生长方面具有活性的抗体。DiCo3抗原对于FCR-3不是非常有效,但是尽管对于3D7和HB3分别存在17或18个氨基酸的差异,DiCo3抗原仍诱导了针对3D7和HB3的良好的功能应答。这些观察情况再次表明所有的抗原都获得了合适的构象。
对于FCR3菌株而言,在DiCo2组中观察到了最高水平的生长抑制,然后分别是FVO、DiCoMix、DiCo1和DiCo3。对于IgG的总体水平加倍的各组而言,除了DiCo3以外的所有组中,抑制水平都增加了16%(95%CI:13%至19%),其中每次加倍IgG,抑制率的增加都明显降低[-6.3(95%CI:-10.5至-2.0)]。在DiCoMix组中,在1mg/mL的IgG下,抑制水平估测为31%(95%CI:18至45%)。对于DiCo2组而言,存在这样的趋势,在1mg/mL下抑制水平增加(16%更高95%CI:-4至35%),而在DiCo3组中,在1mg/ml的IgG下,抑制水平明显更低(-21%,95%CI-41至-2)。
对于HB3菌株而言,在DiCoMix组中观察到了最高水平的生长抑制,然后分别是DiCo3、DiCo1、FVO和DiCo2。对于总IgG加倍的各组而言,生长抑制水平增加了12%(95%CI:11至14)。就IgG对抑制的效果而言,各组之间没有明显的差异。总IgG为1mg/ml下的抑制水平估测为38%(95%CI:27至49%)。对于DiCo2和FVO组而言,存在这样趋势,即,在1mg/ml下抑制水平更低[分别为-13(95%CI:-29至3)和-14(95%CI:-30至2)]。
对于3D7菌株而言,在DiCo3与DiCoMix组中观察到了最高水平的生长抑制,然后分别是DiCo1、FVO和DiCo2。对于总IgG加倍的各组而言,抑制水平增加了11%(95%CI:10至12)。就IgG对抑制的效果而言,各组之间没有明显的差异。总IgG为1mg/ml下的抑制水平估测为46%(95%CI:37至55%)。在总IgG为1mg/ml下,DiCo2和FVO均具有明显更低的抑制[分别为-17(95%CI:-30至-4)和-17(95%CI:-30至-3)]。
讨论
基于恶性疟原虫AMA1的有效疫苗的研发是困难的,这是因为所述疫苗候选物的多态性及施加在其上的免疫选择压力。期望有效的疫苗诱导针对保守的决定因子以及最广泛等位基因特异性决定因子的应答。在涵盖在AMA1中找到的足量的等位基因特异性决定因子中的失败最有可能促进了变体的突破,并由此损害了疫苗的效力。
在目前研究中的基于AMA1的疫苗是以AMA1(BPRC,NIH,WRAIR,Pan CPII)的一种或两种天然的等位基因形式为基础,并因此不涵盖足以防止某些等位基因逃脱的变化的量。
涵盖可以通过简单地延伸所包含的等位基因的数量来改善,而且成本限制表面只有有限数量的等位基因可以被包含在内。这种情况在几种不同的疫苗候选物有待结合时甚至变得更重要,如同在疟疾疫苗中所包含的蛋白质的总数量和量也是有限的。
改善涵盖的备选方法是通过使用有限数量的、被设计为最佳地涵盖了多态性的人工变体。通过本文所列的数据,我们可以推断,可以制备涵盖多样性的序列,其中包括与所述的共有序列非常接近的序列。所述的所有蛋白质均与构象敏感性单克隆抗体发生反应。此外,由DiCo序列所产生的血清均与天然的等位基因发生反应,并且这些序列引发了抑制寄生虫生长的抗体。表明,各种单一的DiCo蛋白质在构造上均是正确的。
DiCo方法可能被认为是有些简单的,这是因为AMA1中的很多表位是具有一定构造的,并且还可以是不连续的(晶体结构文献crystalstructure papers,Thomas refs)。但是,通过合并大部分关联的残基,天然的氨基酸的节段存在于各种单一的DiCo中,因此大量的具有一定构造的表位可能是保守的。这可以从以下观察来确证,即,所有单独的DiCo序列都诱导了针对所测试的3种试验室菌株的生长抑制抗体。
所列出的数据表明3种人工等位基因的结合诱导了针对所研究的3种菌株的、一定水平的生长抑制抗体,所述的水平与由同源抗原(例如FCR3上的FVO抗原)所诱导的水平相当,从而表明通过所述的结合涵盖了相当大量的多样性。
此外,尽管DiCo3抗原与3D7和HB3抗原分别具有17和18个氨基酸的差异,但是DiCo3抗原仍产生了高水平(±70%)的、针对3D7和HB3菌株的生长抑制抗体。
DiCo蛋白质的另一方面在于它们可以结合到融合蛋白质中,从而进一步减少疟原虫疫苗中的各种成分的量。而且,这种融合蛋白质可以通过包含其他物质(优选为小的疫苗候选物)而被进一步延伸。一种此类候选物为MSP119,其与AMA1形成的融合蛋白质已经被生产。
可以制备完全合并了多种关联模式的3种DiCo。但是,本发明所采用的策略是将所观察到的普遍的、最普遍的残基分配到DiCo1中,并将最不普遍的残基分配到DiCo3中。这使得在DiCo2和3中具有大量的关联中断。
序列表
<110>Biomedical Primate Research Centre(BPRC)
<120>用于诱导脊椎动物发生免疫应答的、
包含有涵盖了单种抗原的异质性的大量蛋白质变体的蛋白质组合物
<130>4/2DB69/1
<160>31
<170>PatentIn version 3.3
<210>1
<211>449
<212>PRT
<213>人工
<220>
<223>没有糖基化位点的涵盖多样性(DiCo)的蛋白质变体1
<400>1
Ile Glu Ile Val Glu Arg Ser Asn Tyr Met Gly Asn Pro Trp Thr Glu
1               5                   10                  15
Tyr Met Ala Lys Tyr Asp Ile Glu Glu Val His Gly Ser Gly Ile Arg
            20                  25                  30
Val Asp Leu Gly Glu Asp Ala Glu Val Ala Gly Thr Gln Tyr Arg Leu
        35                  40                  45
Pro Ser Gly Lys Cys Pro Val Phe Gly Lys Gly Ile Ile Ile Glu Asn
    50                  55                  60
Ser Gln Thr Thr Phe Leu Thr Pro Val Ala Thr Glu Asn Gln Asp Leu
65                  70                  75                  80
Lys Asp Gly Gly Phe Ala Phe Pro Pro Thr Lys Pro Leu Met Ser Pro
                85                  90                  95
Met Thr Leu Asp Gln Met Arg His Phe Tyr Lys Asp Asn Glu Tyr Val
            100                 105                 110
Lys Asn Leu Asp Glu Leu Thr Leu Cys Ser Arg His Ala Gly Asn Met
        115                 120                 125
Asn Pro Asp Asn Asp Lys Asn Ser Asn Tyr Lys Tyr Pro Ala Val Tyr
    130                 135                 140
Asp Asp Lys Asp Lys Lys Cys His Ile Leu Tyr Ile Ala Ala Gln Glu
145                 150                 155                 160
Asn Asn Gly Pro Arg Tyr Cys Asn Lys Asp Glu Ser Lys Arg Asn Ser
                165                 170                 175
Met Phe Cys Phe Arg Pro Ala Lys Asp Lys Ser Phe Gln Asn Tyr Val
            180                 185                 190
Tyr Leu Ser Lys Asn Val Val Asp Asn Trp Glu Lys Val Cys Pro Arg
        195                 200                 205
Lys Asn Leu Glu Asn Ala Lys Phe Gly Leu Trp Val Asp Gly Asn Cys
    210                 215                 220
Glu Asp Ile Pro His Val Asn Glu Phe Ser Ala Asn Asp Leu Phe Glu
225                 230                 235                 240
Cys Asn Lys Leu Val Phe Glu Leu Ser Ala Ser Asp Gln Pro Lys Gln
                245                 250                 255
Tyr Glu Gln His Leu Thr Asp Tyr Glu Lys Ile Lys Glu Gly Phe Lys
            260                 265                 270
Asn Lys Asn Ala Asp Met Ile Lys Ser Ala Phe Leu Pro Thr Gly Ala
        275                 280                 285
Phe Lys Ala Asp Arg Tyr Lys Ser His Gly Lys Gly Tyr Asn Trp Gly
    290                 295                 300
Asn Tyr Asn Arg Lys Thr Gln Lys Cys Glu Ile Phe Asn Val Lys Pro
305                 310                 315                 320
Thr Cys Leu Ile Asn Asp Lys Ser Tyr Ile Ala Thr Thr Ala Leu Ser
                325                 330                 335
His Pro Ile Glu Val Glu His Asn Phe Pro Cys Ser Leu Tyr Lys Asp
            340                 345                 350
Glu Ile Lys Lys Glu Ile Glu Arg Glu Ser Lys Arg Ile Lys Leu Asn
        355                 360                 365
Asp Asn Asp Asp Glu Gly Asn Lys Lys Ile Ile Ala Pro Arg Ile Phe
    370                 375                 380
Ile Ser Asp Asp Lys Asp Ser Leu Lys Cys Pro Cys Asp Pro Glu Ile
385                 390                 395                 400
Val Ser Gln Ser Thr Cys Asn Phe Phe Val Cys Lys Cys Val Glu Lys
                405                 410                 415
Arg Ala Glu Val Thr Ser Asn Asn Glu Val Val Val Lys Glu Glu Tyr
            420                 425                 430
Lys Asp Glu Tyr Ala Asp Ile Pro Glu His Lys Pro Thr Tyr Asp Lys
        435                 440                 445
Met
<210>2
<211>449
<212>PRT
<213>人工
<220>
<223>没有糖基化位点的涵盖多样性(DiCo)的蛋白质变体2
<400>2
Ile Glu Ile Val Glu Arg Ser Asn Tyr Met Gly Asn Pro Trp Thr Glu
1               5                   10                  15
Tyr Met Ala Lys Tyr Asp Ile Glu Glu Val His Gly Ser Gly Ile Arg
            20                  25                  30
Val Asp Leu Gly Glu Asp Ala Glu Val Ala Gly Thr Gln Tyr Arg Leu
        35                  40                  45
Pro Ser Gly Lys Cys Pro Val Phe Gly Lys Gly Ile Ile Ile Glu Asn
    50                  55                  60
Ser Gln Thr Thr Phe Leu Lys Pro Val Ala Thr Gly Asn Gln Asp Leu
65                  70                  75                  80
Lys Asp Gly Gly Phe Ala Phe Pro Pro Thr Asn Pro Leu Ile Ser Pro
                85                  90                  95
Met Thr Leu Asn Gly Met Arg Asp Phe Tyr Lys Asn Asn Glu Tyr Val
            100                 105                 110
Lys Asn Leu Asp Glu Leu Thr Leu Cys Ser Arg His Ala Gly Asn Met
        115                 120                 125
Asn Pro Asp Asn Asp Glu Asn Ser Asn Tyr Lys Tyr Pro Ala Val Tyr
    130                 135                 140
Asp Tyr Asn Asp Lys Lys Cys His Ile Leu Tyr Ile Ala Ala Gln Glu
145                 150                 155                 160
Asn Asn Gly Pro Arg Tyr Cys Asn Lys Asp Glu Ser Lys Arg Asn Ser
                165                 170                 175
Met Phe Cys Phe Arg Pro Ala Lys Asp Lys Leu Phe Glu Asn Tyr Val
            180                 185                 190
Tyr Leu Ser Lys Asn Val Val His Asn Trp Glu Glu Val Cys Pro Arg
        195                 200                 205
Lys Asn Leu Glu Asn Ala Lys Phe Gly Leu Trp Val Asp Gly Asn Cys
    210                 215                 220
Glu Asp Ile Pro His Val Asn Glu Phe Ser Ala Asn Asp Leu Phe Glu
225                 230                 235                 240
Cys Asn Lys Leu Val Phe Glu Leu Ser Ala Ser Asp Gln Pro Lys Gln
                245                 250                 255
Tyr Glu Gln His Leu Thr Asp Tyr Glu Lys Ile Lys Glu Gly Phe Lys
            260                 265                 270
Asn Lys Asn Ala Asp Met Ile Lys Ser Ala Phe Leu Pro Thr Gly Ala
        275                 280                 285
Phe Lys Ala Asp Arg Tyr Lys Ser Arg Gly Lys Gly Tyr Asn Trp Gly
    290                 295                 300
Asn Tyr Asn Arg Lys Thr Gln Lys Cys Glu Ile Phe Asn Val Lys Pro
305                 310                 315                 320
Thr Cys Leu Ile Asn Asp Lys Ser Tyr Ile Ala Thr Thr Ala Leu Ser
                325                 330                 335
His Pro Ile Glu Val Glu Asn Asn Phe Pro Cys Ser Leu Tyr Lys Asn
            340                 345                 350
Glu Ile Met Lys Glu Ile Glu Arg Glu Ser Lys Arg Ile Lys Leu Asn
        355                 360                 365
Asp Asn Asp Asp Glu Gly Asn Lys Lys Ile Ile Ala Pro Arg Ile Phe
    370                 375                 380
Ile Ser Asp Asp Lys Asp Ser Leu Lys Cys Pro Cys Asp Pro Glu Met
385                 390                 395                 400
Val Ser Gln Ser Thr Cys Arg Phe Phe Val Cys Lys Cys Val Glu Arg
                405                 410                 415
Arg Ala Glu Val Thr Ser Asn Asn Glu Val Val Val Lys Glu Glu Tyr
            420                 425                 430
Lys Asp Glu Tyr Ala Asp Ile Pro Glu His Lys Pro Thr Tyr Asp Asn
        435                 440                 445
Met
<210>3
<211>449
<212>PRT
<213>人工
<220>
<223>没有糖基化位点的涵盖多样性(DiCo)的蛋白质变体3
<400>3
Ile Glu Ile Val Glu Arg Ser Asn Tyr Met Gly Asn Pro Trp Thr Glu
1               5                   10                  15
Tyr Met Ala Lys Tyr Asp Ile Glu Glu Val His Gly Ser Gly Ile Arg
            20                  25                  30
Val Asp Leu Gly Glu Asp Ala Glu Val Ala Gly Thr Gln Tyr Arg Leu
        35                  40                  45
Pro Ser Gly Lys Cys Pro Val Phe Gly Lys Gly Ile Ile Ile Glu Asn
    50                  55                  60
Ser Lys Thr Thr Phe Leu Thr Pro Val Ala Thr Glu Asn Gln Asp Leu
65                  70                  75                  80
Lys Asp Gly Gly Phe Ala Phe Pro Pro Thr Glu Pro Leu Met Ser Pro
                85                  90                  95
Met Thr Leu Asp Asp Met Arg Asp Leu Tyr Lys Asp Asn Lys Tyr Val
            100                 105                 110
Lys Asn Leu Asp Glu Leu Thr Leu Cys Ser Arg His Ala Gly Asn Met
        115                 120                 125
Ile Pro Asp Asn Asp Lys Asn Ser Asn Tyr Lys Tyr Pro Ala Val Tyr
    130                 135                 140
Asp Tyr Glu Asp Lys Lys Cys His Ile Leu Tyr Ile Ala Ala Gln Glu
145                 150                 155                 160
Asn Asn Gly Pro Arg Tyr Cys Asn Lys Asp Gln Ser Lys Arg Asn Ser
                165                 170                 175
Met Phe Cys Phe Arg Pro Ala Lys Asp Ile Ser Phe Gln Asn Tyr Val
            180                 185                 190
Tyr Leu Ser Lys Asn Val Val Asp Asn Trp Glu Lys Val Cys Pro Arg
        195                 200                 205
Lys Asn Leu Gln Asn Ala Lys Phe Gly Leu Trp Val Asp Gly Asn Cys
    210                 215                 220
Glu Asp Ile Pro His Val Asn Glu Phe Ser Ala Ile Asp Leu Phe Glu
225                 230                 235                 240
Cys Asn Lys Leu Val Phe Glu Leu Ser Ala Ser Asp Gln Pro Lys Gln
                245                 250                 255
Tyr Glu Gln His Leu Thr Asp Tyr Glu Lys Ile Lys Glu Gly Phe Lys
            260                 265                 270
Asn Lys Asn Ala Asp Met Ile Lys Ser Ala Phe Leu Pro Thr Gly Ala
        275                 280                 285
Phe Lys Ala Asp Arg Tyr Lys Ser His Gly Lys Gly Tyr Asn Trp Gly
    290                 295                 300
Asn Tyr Asn Thr Glu Thr Gln Lys Cys Glu Ile Phe Asn Val Lys Pro
305                 310                 315                 320
Thr Cys Leu Ile Asn Asp Lys Ser Tyr Ile Ala Thr Thr Ala Leu Ser
                325                 330                 335
His Pro Asn Glu Val Glu His Asn Phe Pro Cys Ser Leu Tyr Lys Asp
            340                 345                 350
Glu Ile Lys Lys Glu Ile Glu Arg Glu Ser Lys Arg Ile Lys Leu Asn
        355                 360                 365
Asp Asn Asp Asp Glu Gly Asn Lys Lys Ile Ile Ala Pro Arg Ile Phe
    370                 375                 380
Ile Ser Asp Asp Ile Asp Ser Leu Lys Cys Pro Cys Ala Pro Glu Ile
385                 390                 395                 400
Val Ser Gln Ser Thr Cys Asn Phe Phe Val Cys Lys Cys Val Glu Lys
                405                 410                 415
Arg Ala Glu Val Thr Ser Asn Asn Glu Val Val Val Lys Glu Glu Tyr
            420                 425                 430
Lys Asp Glu Tyr Ala Asp Ile Pro Glu His Lys Pro Thr Tyr Asp Lys
        435                 440                 445
Met
<210>4
<211>449
<212>PRT
<213>人工
<220>
<223>涵盖多样性(DiCo)的蛋白质变体1
<400>4
Ile Glu Ile Val Glu Arg Ser Asn Tyr Met Gly Asn Pro Trp Thr Glu
1               5                   10                  15
Tyr Met Ala Lys Tyr Asp Ile Glu Glu Val His Gly Ser Gly Ile Arg
            20                  25                  30
Val Asp Leu Gly Glu Asp Ala Glu Val Ala Gly Thr Gln Tyr Arg Leu
        35                  40                  45
Pro Ser Gly Lys Cys Pro Val Phe Gly Lys Gly Ile Ile Ile Glu Asn
    50                  55                  60
Ser Asn Thr Thr Phe Leu Thr Pro Val Ala Thr Glu Asn Gln Asp Leu
65                  70                  75                  80
Lys Asp Gly Gly Phe Ala Phe Pro Pro Thr Lys Pro Leu Met Ser Pro
                85                  90                  95
Met Thr Leu Asp Gln Met Arg His Phe Tyr Lys Asp Asn Glu Tyr Val
            100                 105                 110
Lys Asn Leu Asp Glu Leu Thr Leu Cys Ser Arg His Ala Gly Asn Met
        115                 120                 125
Asn Pro Asp Asn Asp Lys Asn Ser Asn Tyr Lys Tyr Pro Ala Val Tyr
    130                 135                 140
Asp Asp Lys Asp Lys Lys Cys His Ile Leu Tyr Ile Ala Ala Gln Glu
145                 150                 155                 160
Asn Asn Gly Pro Arg Tyr Cys Asn Lys Asp Glu Ser Lys Arg Asn Ser
                165                 170                 175
Met Phe Cys Phe Arg Pro Ala Lys Asp Lys Ser Phe Gln Asn Tyr Thr
            180                 185                 190
Tyr Leu Ser Lys Asn Val Val Asp Asn Trp Glu Lys Val Cys Pro Arg
        195                 200                 205
Lys Asn Leu Glu Asn Ala Lys Phe Gly Leu Trp Val Asp Gly Asn Cys
    210                 215                 220
Glu Asp Ile Pro His Val Asn Glu Phe Ser Ala Asn Asp Leu Phe Glu
225                 230                 235                 240
Cys Asn Lys Leu Val Phe Glu Leu Ser Ala Ser Asp Gln Pro Lys Gln
                245                 250                 255
Tyr Glu Gln His Leu Thr Asp Tyr Glu Lys Ile Lys Glu Gly Phe Lys
            260                 265                 270
Asn Lys Asn Ala Ser Met Ile Lys Ser Ala Phe Leu Pro Thr Gly Ala
        275                 280                 285
Phe Lys Ala Asp Arg Tyr Lys Ser His Gly Lys Gly Tyr Asn Trp Gly
    290                 295                 300
Asn Tyr Asn Arg Lys Thr Gln Lys Cys Glu Ile Phe Asn Val Lys Pro
305                 310                 315                 320
Thr Cys Leu Ile Asn Asn Ser Ser Tyr Ile Ala Thr Thr Ala Leu Ser
                325                 330                 335
His Pro Ile Glu Val Glu His Asn Phe Pro Cys Ser Leu Tyr Lys Asp
            340                 345                 350
Glu Ile Lys Lys Glu Ile Glu Arg Glu Ser Lys Arg Ile Lys Leu Asn
        355                 360                 365
Asp Asn Asp Asp Glu Gly Asn Lys Lys Ile Ile Ala Pro Arg Ile Phe
    370                 375                 380
Ile Ser Asp Asp Lys Asp Ser Leu Lys Cys Pro Cys Asp Pro Glu Ile
385                 390                 395                 400
Val Ser Asn Ser Thr Cys Asn Phe Phe Val Cys Lys Cys Val Glu Lys
                405                 410                 415
Arg Ala Glu Val Thr Ser Asn Asn Glu Val Val Val Lys Glu Glu Tyr
            420                 425                 430
Lys Asp Glu Tyr Ala Asp Ile Pro Glu His Lys Pro Thr Tyr Asp Lys
        435                 440                 445
Met
<210>5
<211>449
<212>PRT
<213>人工
<220>
<223>涵盖多样性(DiCo)的蛋白质变体2
<400>5
Ile Glu Ile Val Glu Arg Ser Asn Tyr Met Gly Asn Pro Trp Thr Glu
1               5                   10                  15
Tyr Met Ala Lys Tyr Asp Ile Glu Glu Val His Gly Ser Gly Ile Arg
            20                  25                  30
Val Asp Leu Gly Glu Asp Ala Glu Val Ala Gly Thr Gln Tyr Arg Leu
        35                  40                  45
Pro Ser Gly Lys Cys Pro Val Phe Gly Lys Gly Ile Ile Ile Glu Asn
    50                  55                  60
Ser Asn Thr Thr Phe Leu Lys Pro Val Ala Thr Gly Asn Gln Asp Leu
65                  70                  75                  80
Lys Asp Gly Gly Phe Ala Phe Pro Pro Thr Asn Pro Leu Ile Ser Pro
                85                  90                  95
Met Thr Leu Asn Gly Met Arg Asp Phe Tyr Lys Asn Asn Glu Tyr Val
            100                 105                 110
Lys Asn Leu Asp Glu Leu Thr Leu Cys Ser Arg His Ala Gly Asn Met
        115                 120                 125
Asn Pro Asp Asn Asp Glu Asn Ser Asn Tyr Lys Tyr Pro Ala Val Tyr
    130                 135                 140
Asp Tyr Asn Asp Lys Lys Cys His Ile Leu Tyr Ile Ala Ala Gln Glu
145                 150                 155                 160
Asn Asn Gly Pro Arg Tyr Cys Asn Lys Asp Glu Ser Lys Arg Asn Ser
                165                 170                 175
Met Phe Cys Phe Arg Pro Ala Lys Asp Lys Leu Phe Glu Asn Tyr Thr
            180                 185                 190
Tyr Leu Ser Lys Asn Val Val His Asn Trp Glu Glu Val Cys Pro Arg
        195                 200                 205
Lys Asn Leu Glu Asn Ala Lys Phe Gly Leu Trp Val Asp Gly Asn Cys
    210                 215                 220
Glu Asp Ile Pro His Val Asn Glu Phe Ser Ala Asn Asp Leu Phe Glu
225                 230                 235                 240
Cys Asn Lys Leu Val Phe Glu Leu Ser Ala Ser Asp Gln Pro Lys Gln
                245                 250                 255
Tyr Glu Gln His Leu Thr Asp Tyr Glu Lys Ile Lys Glu Gly Phe Lys
            260                 265                 270
Asn Lys Asn Ala Ser Met Ile Lys Ser Ala Phe Leu Pro Thr Gly Ala
        275                 280                 285
Phe Lys Ala Asp Arg Tyr Lys Ser Arg Gly Lys Gly Tyr Asn Trp Gly
    290                 295                 300
Asn Tyr Asn Arg Lys Thr Gln Lys Cys Glu Ile Phe Asn Val Lys Pro
305                 310                 315                 320
Thr Cys Leu Ile Asn Asn Ser Ser Tyr Ile Ala Thr Thr Ala Leu Ser
                325                 330                 335
His Pro Ile Glu Val Glu Asn Asn Phe Pro Cys Ser Leu Tyr Lys Asn
            340                 345                 350
Glu Ile Met Lys Glu Ile Glu Arg Glu Ser Lys Arg Ile Lys Leu Asn
        355                 360                 365
Asp Asn Asp Asp Glu Gly Asn Lys Lys Ile Ile Ala Pro Arg Ile Phe
    370                 375                 380
Ile Ser Asp Asp Lys Asp Ser Leu Lys Cys Pro Cys Asp Pro Glu Met
385                 390                 395                 400
Val Ser Asn Ser Thr Cys Arg Phe Phe Val Cys Lys Cys Val Glu Arg
                405                 410                 415
Arg Ala Glu Val Thr Ser Asn Asn Glu Val Val Val Lys Glu Glu Tyr
            420                 425                 430
Lys Asp Glu Tyr Ala Asp Ile Pro Glu His Lys Pro Thr Tyr Asp Asn
        435                 440                 445
Met
<210>6
<211>449
<212>PRT
<213>人工
<220>
<223>涵盖多样性(DiCo)的蛋白质变体3
<400>6
Ile Glu Ile Val Glu Arg Ser Asn Tyr Met Gly Asn Pro Trp Thr Glu
1               5                   10                  15
Tyr Met Ala Lys Tyr Asp Ile Glu Glu Val His Gly Ser Gly Ile Arg
            20                  25                  30
Val Asp Leu Gly Glu Asp Ala Glu Val Ala Gly Thr Gln Tyr Arg Leu
        35                  40                  45
Pro Ser Gly Lys Cys Pro Val Phe Gly Lys Gly Ile Ile Ile Glu Asn
    50                  55                  60
Ser Lys Thr Thr Phe Leu Thr Pro Val Ala Thr Glu Asn Gln Asp Leu
65                  70                  75                  80
Lys Asp Gly Gly Phe Ala Phe Pro Pro Thr Glu Pro Leu Met Ser Pro
                85                  90                  95
Met Thr Leu Asp Asp Met Arg Asp Leu Tyr Lys Asp Asn Lys Tyr Val
            100                 105                 110
Lys Asn Leu Asp Glu Leu Thr Leu Cys Ser Arg His Ala Gly Asn Met
        115                 120                 125
Ile Pro Asp Asn Asp Lys Asn Ser Asn Tyr Lys Tyr Pro Ala Val Tyr
    130                 135                 140
Asp Tyr Glu Asp Lys Lys Cys His Ile Leu Tyr Ile Ala Ala Gln Glu
145                 150                 155                 160
Asn Asn Gly Pro Arg Tyr Cys Asn Lys Asp Gln Ser Lys Arg Asn Ser
                165                 170                 175
Met Phe Cys Phe Arg Pro Ala Lys Asp Ile Ser Phe Gln Asn Tyr Thr
            180                 185                 190
Tyr Leu Ser Lys Asn Val Val Asp Asn Trp Glu Lys Val Cys Pro Arg
        195                 200                 205
Lys Asn Leu Gln Asn Ala Lys Phe Gly Leu Trp Val Asp Gly Asn Cys
    210                 215                 220
Glu Asp Ile Pro His Val Asn Glu Phe Ser Ala Ile Asp Leu Phe Glu
225                 230                 235                 240
Cys Asn Lys Leu Val Phe Glu Leu Ser Ala Ser Asp Gln Pro Lys Gln
                245                 250                 255
Tyr Glu Gln His Leu Thr Asp Tyr Glu Lys Ile Lys Glu Gly Phe Lys
            260                 265                 270
Asn Lys Asn Ala Ser Met Ile Lys Ser Ala Phe Leu Pro Thr Gly Ala
        275                 280                 285
Phe Lys Ala Asp Arg Tyr Lys Ser His Gly Lys Gly Tyr Asn Trp Gly
    290                 295                 300
Asn Tyr Asn Thr Glu Thr Gln Lys Cys Glu Ile Phe Asn Val Lys Pro
305                 310                 315                 320
Thr Cys Leu Ile Asn Asn Ser Ser Tyr Ile Ala Thr Thr Ala Leu Ser
                325                 330                 335
His Pro Asn Glu Val Glu His Asn Phe Pro Cys Ser Leu Tyr Lys Asp
            340                 345                 350
Glu Ile Lys Lys Glu Ile Glu Arg Glu Ser Lys Arg Ile Lys Leu Asn
        355                 360                 365
Asp Asn Asp Asp Glu Gly Asn Lys Lys Ile Ile Ala Pro Arg Ile Phe
    370                 375                 380
Ile Ser Asp Asp Ile Asp Ser Leu Lys Cys Pro Cys Ala Pro Glu Ile
385                 390                 395                 400
Val Ser Asn Ser Thr Cys Asn Phe Phe Val Cys Lys Cys Val Glu Lys
                405                 410                 415
Arg Ala Glu Val Thr Ser Asn Asn Glu Val Val Val Lys Glu Glu Tyr
            420                 425                 430
Lys Asp Glu Tyr Ala Asp Ile Pro Glu His Lys Pro Thr Tyr Asp Lys
        435                 440                 445
Met
<210>7
<211>449
<212>PRT
<213>人工
<220>
<223>没有糖基化位点的涵盖多样性(DiCo)的蛋白质变体4
<400>7
Ile Glu Ile Val Glu Arg Ser Asn Tyr Met Gly Asn Pro Trp Thr Glu
1               5                   10                  15
Tyr Met Ala Lys Tyr Asp Ile Glu Glu Val His Gly Ser Gly Ile Arg
            20                  25                  30
Val Asp Leu Gly Glu Asp Ala Glu Val Ala Gly Thr Gln Tyr Arg Leu
        35                  40                  45
Pro Ser Gly Lys Cys Pro Val Phe Gly Lys Gly Ile Ile Ile Glu Asn
    50                  55                  60
Ser Gln Thr Thr Phe Leu Thr Pro Val Ala Thr Glu Asn Gln Asp Leu
65                  70                  75                  80
Lys Asp Gly Gly Phe Ala Phe Pro Pro Thr Lys Pro Leu Met Ser Pro
                85                  90                  95
Met Thr Leu Asp Gln Met Arg His Phe Tyr Lys Asp Asn Lys Tyr Val
            100                 105                 110
Lys Asn Leu Asp Glu Leu Thr Leu Cys Ser Arg His Ala Gly Asn Met
        115                 120                 125
Ile Pro Asp Asn Asp Lys Asn Ser Asn Tyr Lys Tyr Pro Ala Val Tyr
    130                 135                 140
Asp Tyr Glu Asp Lys Lys Cys His Ile Leu Tyr Ile Ala Ala Gln Glu
145                 150                 155                 160
Asn Asn Gly Pro Arg Tyr Cys Asn Lys Asp Glu Ser Lys Arg Asn Ser
                165                 170                 175
Met Phe Cys Phe Arg Pro Ala Lys Asp Lys Ser Phe Gln Asn Tyr Val
            180                 185                 190
Tyr Leu Ser Lys Asn Val Val Asp Asn Trp Glu Lys Val Cys Pro Arg
        195                 200                 205
Lys Asn Leu Glu Asn Ala Lys Phe Gly Leu Trp Val Asp Gly Asn Cys
    210                 215                 220
Glu Asp Ile Pro His Val Asn Glu Phe Ser Ala Ile Asp Leu Phe Glu
225                 230                 235                 240
Cys Asn Lys Leu Val Phe Glu Leu Ser Ala Ser Asp Gln Pro Lys Gln
                245                 250                 255
Tyr Glu Gln His Leu Thr Asp Tyr Glu Lys Ile Lys Glu Gly Phe Lys
            260                 265                 270
Asn Lys Asn Ala Asp Met Ile Lys Ser Ala Phe Leu Pro Thr Gly Ala
        275                 280                 285
Phe Lys Ala Asp Arg Tyr Lys Ser His Gly Lys Gly Tyr Asn Trp Gly
    290                 295                 300
Asn Tyr Asn Arg Lys Thr Gln Lys Cys Glu Ile Phe Asn Val Lys Pro
305                 310                 315                 320
Thr Cys Leu Ile Asn Asp Lys Ser Tyr Ile Ala Thr Thr Ala Leu Ser
                325                 330                 335
His Pro Ile Glu Val Glu His Asn Phe Pro Cys Ser Leu Tyr Lys Asp
            340                 345                 350
Glu Ile Lys Lys Glu Ile Glu Arg Glu Ser Lys Arg Ile Lys Leu Asn
        355                 360                 365
Asp Asn Asp Asp Glu Gly Asn Lys Lys Ile Ile Ala Pro Arg Ile Phe
    370                 375                 380
Ile Ser Asp Asp Lys Asp Ser Leu Lys Cys Pro Cys Asp Pro Glu Ile
385                 390                 395                 400
Val Ser Gln Ser Thr Cys Asn Phe Phe Val Cys Lys Cys Val Glu Lys
                405                 410                 415
Arg Ala Glu Val Thr Ser Asn Asn Glu Val Val Val Lys Glu Glu Tyr
            420                 425                 430
Lys Asp Glu Tyr Ala Asp Ile Pro Glu His Lys Pro Thr Tyr Asp Lys
        435                 440                 445
Met
<210>8
<211>449
<212>PRT
<213>人工
<220>
<223>没有糖基化位点的涵盖多样性(DiCo)的蛋白质变体5
<400>8
Ile Glu Ile Val Glu Arg Ser Asn Tyr Met Gly Asn Pro Trp Thr Glu
1               5                   10                  15
Tyr Met Ala Lys Tyr Asp Ile Glu Glu Val His Gly Ser Gly Ile Arg
            20                  25                  30
Val Asp Leu Gly Glu Asp Ala Glu Val Ala Gly Thr Gln Tyr Arg Leu
        35                  40                  45
Pro Ser Gly Lys Cys Pro Val Phe Gly Lys Gly Ile Ile Ile Glu Asn
    50                  55                  60
Ser Lys Thr Thr Phe Leu Thr Pro Val Ala Thr Glu Asn Gln Asp Leu
65                  70                  75                  80
Lys Asp Gly Gly Phe Ala Phe Pro Pro Thr Glu Pro Leu Ile Ser Pro
                85                  90                  95
Met Thr Leu Asn Gly Met Arg Asp Phe Tyr Lys Asn Asn Glu Tyr Val
            100                 105                 110
Lys Asn Leu Asp Glu Leu Thr Leu Cys Ser Arg His Ala Gly Asn Met
        115                 120                 125
Asn Pro Asp Asn Asp Glu Asn Ser Asn Tyr Lys Tyr Pro Ala Val Tyr
    130                 135                 140
Asp Tyr Asn Asp Lys Lys Cys His Ile Leu Tyr Ile Ala Ala Gln Glu
145                 150                 155                 160
Asn Asn Gly Pro Arg Tyr Cys Asn Lys Asp Glu Ser Lys Arg Asn Ser
                165                 170                 175
Met Phe Cys Phe Arg Pro Ala Lys Asp Lys Leu Phe Glu Asn Tyr Val
            180                 185                 190
Tyr Leu Ser Lys Asn Val Val Asp Asn Trp Glu Lys Val Cys Pro Arg
        195                 200                 205
Lys Asn Leu Glu Asn Ala Lys Phe Gly Leu Trp Val Asp Gly Asn Cys
    210                 215                 220
Glu Asp Ile Pro His Val Asn Glu Phe Ser Ala Asn Asp Leu Phe Glu
225                 230                 235                 240
Cys Asn Lys Leu Val Phe Glu Leu Ser Ala Ser Asp Gln Pro Lys Gln
                245                 250                 255
Tyr Glu Gln His Leu Thr Asp Tyr Glu LysIle Lys Glu Gly Phe Lys
            260                 265                 270
Asn Lys Asn Ala Asp Met Ile Lys Ser Ala Phe Leu Pro Thr Gly Ala
        275                 280                 285
Phe Lys Ala Asp Arg Tyr Lys Ser His Gly Lys Gly Tyr Asn Trp Gly
    290                 295                 300
Asn Tyr Asn Arg Lys Thr Gln Lys Cys Glu Ile Phe Asn Val Lys Pro
305                 310                 315                 320
Thr Cys Leu Ile Asn Asp Lys Ser Tyr Ile Ala Thr Thr Ala Leu Ser
                325                 330                 335
His Pro Ile Glu Val Glu His Asn Phe Pro Cys Ser Leu Tyr Lys Asn
            340                 345                 350
Glu Ile Met Lys Glu Ile Glu Arg Glu Ser Lys Arg Ile Lys Leu Asn
        355                 360                 365
Asp Asn Asp Asp Glu Gly Asn Lys Lys Ile Ile Ala Pro Arg Ile Phe
    370                 375                 380
Ile Ser Asp Asp Lys Asp Ser Leu Lys Cys Pro Cys Asp Pro Glu Ile
385                 390                 395                 400
Val Ser Gln Ser Thr Cys Asn Phe Phe Val Cys Lys Cys Val Glu Lys
                405                 410                 415
Arg Ala Glu Val Thr Ser Asn Asn Glu Val Val Val Lys Glu Glu Tyr
            420                 425                 430
Lys Asp Glu Tyr Ala Asp Ile Pro Glu His Lys Pro Thr Tyr Asp Lys
        435                 440                 445
Met
<210>9
<211>449
<212>PRT
<213>人工
<220>
<223>没有糖基化位点的涵盖多样性(DiCo)的蛋白质变体6
<400>9
Ile Glu Ile Val Glu Arg Ser Asn Tyr Met Gly Asn Pro Trp Thr Glu
1               5                   10                  15
Tyr Met Ala Lys Tyr Asp Ile Glu Glu Val His Gly Ser Gly Ile Arg
            20                  25                  30
Val Asp Leu Gly Glu Asp Ala Glu Val Ala Gly Thr Gln Tyr Arg Leu
        35                  40                  45
Pro Ser Gly Lys Cys Pro Val Phe Gly Lys Gly Ile Ile Ile Glu Asn
    50                  55                  60
Ser Gln Thr Thr Phe Leu Lys Pro Val Ala Thr Gly Asn Gln Asp Leu
65                  70                  75                  80
Lys Asp Gly Gly Phe Ala Phe Pro Pro Thr Asn Pro Leu Met Ser Pro
                85                  90                  95
Met Thr Leu Asp Asp Met Arg Asp Leu Tyr Lys Asp Asn Glu Tyr Val
            100                 105                 110
Lys Asn Leu Asp Glu Leu Thr Leu Cys Ser Arg His Ala Gly Asn Met
        115                 120                 125
Asn Pro Asp Asn Asp Lys Asn Ser Asn Tyr Lys Tyr Pro Ala Val Tyr
    130                 135                 140
Asp Asp Lys Asp Lys Lys Cys His Ile Leu Tyr Ile Ala Ala Gln Glu
145                 150                 155                 160
Asn Asn Gly Pro Arg Tyr Cys Asn Lys Asp Gln Ser Lys Arg Asn Ser
                165                 170                 175
Met Phe Cys Phe Arg Pro Ala Lys Asp Ile Ser Phe Gln Asn Tyr Val
            180                 185                 190
Tyr Leu Ser Lys Asn Val Val His Asn Trp Glu Glu Val Cys Pro Arg
        195                 200                 205
Lys Asn Leu Gln Asn Ala Lys Phe Gly Leu Trp Val Asp Gly Asn Cys
    210                 215                 220
Glu Asp Ile Pro His Val Asn Glu Phe Ser Ala Asn Asp Leu Phe Glu
225                 230                 235                 240
Cys Asn Lys Leu Val Phe Glu Leu Ser Ala Ser Asp Gln Pro Lys Gln
                245                 250                 255
Tyr Glu Gln His Leu Thr Asp Tyr Glu Lys Ile Lys Glu Gly Phe Lys
            260                 265                 270
Asn Lys Asn Ala Asp Met Ile Lys Ser Ala Phe Leu Pro Thr Gly Ala
        275                 280                 285
Phe Lys Ala Asp Arg Tyr Lys Ser Arg Gly Lys Gly Tyr Asn Trp Gly
    290                 295                 300
Asn Tyr Asn Thr Glu Thr Gln Lys Cys Glu Ile Phe Asn Val Lys Pro
305                 310                 315                 320
Thr Cys Leu Ile Asn Asp Lys Ser Tyr Ile Ala Thr Thr Ala Leu Ser
                325                 330                 335
His Pro Asn Glu Val Glu Asn Asn Phe Pro Cys Ser Leu Tyr Lys Asp
            340                 345                 350
Glu Ile Lys Lys Glu Ile Glu Arg Glu Ser Lys Arg Ile Lys Leu Asn
        355                 360                 365
Asp Asn Asp Asp Glu Gly Asn Lys Lys Ile Ile Ala Pro Arg Ile Phe
    370                 375                 380
Ile Ser Asp Asp Ile Asp Ser Leu Lys Cys Pro Cys Ala Pro Glu Met
385                 390                 395                 400
Val Ser Gln Ser Thr Cys Arg Phe Phe Val Cys Lys Cys Val Glu Arg
                405                 410                 415
Arg Ala Glu Val Thr Ser Asn Asn Glu Val Val Val Lys Glu Glu Tyr
            420                 425                 430
Lys Asp Glu Tyr Ala Asp Ile Pro Glu His Lys Pro Thr Tyr Asp Asn
        435                 440                 445
Met
<210>10
<211>449
<212>PRT
<213>人工
<220>
<223>涵盖多样性(DiCo)的蛋白质变体4
<400>10
Ile Glu Ile Val Glu Arg Ser Asn Tyr Met Gly Asn Pro Trp Thr Glu
1               5                   10                  15
Tyr Met Ala Lys Tyr Asp Ile Glu Glu Val His Gly Ser Gly Ile Arg
            20                  25                  30
Val Asp Leu Gly Glu Asp Ala Glu Val Ala Gly Thr Gln Tyr Arg Leu
        35                  40                  45
Pro Ser Gly Lys Cys Pro Val Phe Gly Lys Gly Ile Ile Ile Glu Asn
    50                  55                  60
Ser Asn Thr Thr Phe Leu Thr Pro Val Ala Thr Glu Asn Gln Asp Leu
65                  70                  75                  80
Lys Asp Gly Gly Phe Ala Phe Pro Pro Thr Lys Pro Leu Met Ser Pro
                85                  90                  95
Met Thr Leu Asp Gln Met Arg His Phe Tyr Lys Asp Asn Lys Tyr Val
            100                 105                 110
Lys Asn Leu Asp Glu Leu Thr Leu Cys Ser Arg His Ala Gly Asn Met
        115                 120                 125
Ile Pro Asp Asn Asp Lys Asn Ser Asn Tyr Lys Tyr Pro Ala Val Tyr
    130                 135                 140
Asp Tyr Glu Asp Lys Lys Cys His Ile Leu Tyr Ile Ala Ala Gln Glu
145                 150                 155                 160
Asn Asn Gly Pro Arg Tyr Cys Asn Lys Asp Glu Ser Lys Arg Asn Ser
                165                 170                 175
Met Phe Cys Phe Arg Pro Ala Lys Asp Lys Ser Phe Gln Asn Tyr Thr
            180                 185                 190
Tyr Leu Ser Lys Asn Val Val Asp Asn Trp Glu Lys Val Cys Pro Arg
        195                 200                 205
Lys Asn Leu Glu Asn Ala Lys Phe Gly Leu Trp Val Asp Gly Asn Cys
    210                 215                 220
Glu Asp Ile Pro His Val Asn Glu Phe Ser Ala Ile Asp Leu Phe Glu
225                 230                 235                 240
Cys Asn Lys Leu Val Phe Glu Leu Ser Ala Ser Asp Gln Pro Lys Gln
                245                 250                 255
Tyr Glu Gln His Leu Thr Asp Tyr Glu Lys Ile Lys Glu Gly Phe Lys
            260                 265                 270
Asn Lys Asn Ala Ser Met Ile Lys Ser Ala Phe Leu Pro Thr Gly Ala
        275                 280                 285
Phe Lys Ala Asp Arg Tyr Lys Ser His Gly Lys Gly Tyr Asn Trp Gly
    290                 295                 300
Asn Tyr Asn Arg Lys Thr Gln Lys Cys Glu Ile Phe Asn Val Lys Pro
305                 310                 315                 320
Thr Cys Leu Ile Asn Asn Ser Ser Tyr Ile Ala Thr Thr Ala Leu Ser
                325                 330                 335
His Pro Ile Glu Val Glu His Asn Phe Pro Cys Ser Leu Tyr Lys Asp
            340                 345                 350
Glu Ile Lys Lys Glu Ile Glu Arg Glu Ser Lys Arg Ile Lys Leu Asn
        355                 360                 365
Asp Asn Asp Asp Glu Gly Asn Lys Lys Ile Ile Ala Pro Arg Ile Phe
    370                 375                 380
Ile Ser Asp Asp Lys Asp Ser Leu Lys Cys Pro Cys Asp Pro Glu Ile
385                 390                 395                 400
Val Ser Asn Ser Thr Cys Asn Phe Phe Val Cys Lys Cys Val Glu Lys
                405                 410                 415
Arg Ala Glu Val Thr Ser Asn Asn Glu Val Val Val Lys Glu Glu Tyr
            420                 425                 430
Lys Asp Glu Tyr Ala Asp Ile Pro Glu His Lys Pro Thr Tyr Asp Lys
        435                 440                 445
Met
<210>11
<211>449
<212>PRT
<213>人工
<220>
<223>涵盖多样性(DiCo)的蛋白质变体5
<400>11
Ile Glu Ile Val Glu Arg Ser Asn Tyr Met Gly Asn Pro Trp Thr Glu
1               5                   10                  15
Tyr Met Ala Lys Tyr Asp Ile Glu Glu Val His Gly Ser Gly Ile Arg
            20                  25                  30
Val Asp Leu Gly Glu Asp Ala Glu Val Ala Gly Thr Gln Tyr Arg Leu
        35                  40                  45
Pro Ser Gly Lys Cys Pro Val Phe Gly Lys Gly Ile Ile Ile Glu Asn
    50                  55                  60
Ser Lys Thr Thr Phe Leu Thr Pro Val Ala Thr Glu Asn Gln Asp Leu
65                  70                  75                  80
Lys Asp Gly Gly Phe Ala Phe Pro Pro Thr Glu Pro Leu Ile Ser Pro
                85                  90                  95
Met Thr Leu Asn Gly Met Arg Asp Phe Tyr Lys Asn Asn Glu Tyr Val
            100                 105                 110
Lys Asn Leu Asp Glu Leu Thr Leu Cys Ser Arg His Ala Gly Asn Met
        115                 120                 125
Asn Pro Asp Asn Asp Glu Asn Ser Asn Tyr Lys Tyr Pro Ala Val Tyr
    130                 135                 140
Asp Tyr Asn Asp Lys Lys Cys His Ile Leu Tyr Ile Ala Ala Gln Glu
145                 150                 155                 160
Asn Asn Gly Pro Arg Tyr Cys Asn Lys Asp Glu Ser Lys Arg Asn Ser
                165                 170                 175
Met Phe Cys Phe Arg Pro Ala Lys Asp Lys Leu Phe Glu Asn Tyr Thr
            180                 185                 190
Tyr Leu Ser Lys Asn Val Val Asp Asn Trp Glu Lys Val Cys Pro Arg
        195                 200                 205
Lys Asn Leu Glu Asn Ala Lys Phe Gly Leu Trp Val Asp Gly Asn Cys
    210                 215                 220
Glu Asp Ile Pro His Val Asn Glu Phe Ser Ala Asn Asp Leu Phe Glu
225                 230                 235                 240
Cys Asn Lys Leu Val Phe Glu Leu Ser Ala Ser Asp Gln Pro Lys Gln
                245                 250                 255
Tyr Glu Gln His Leu Thr Asp Tyr Glu Lys Ile Lys Glu Gly Phe Lys
            260                 265                 270
Asn Lys Asn Ala Ser Met Ile Lys Ser Ala Phe Leu Pro Thr Gly Ala
        275                 280                 285
Phe Lys Ala Asp Arg Tyr Lys Ser His Gly Lys Gly Tyr Asn Trp Gly
    290                 295                 300
Asn Tyr Asn Arg Lys Thr Gln Lys Cys Glu Ile Phe Asn Val Lys Pro
305                 310                 315                 320
Thr Cys Leu Ile Asn Asn Ser Ser Tyr Ile Ala Thr Thr Ala Leu Ser
                325                 330                 335
His Pro Ile Glu Val Glu His Asn Phe Pro Cys Ser Leu Tyr Lys Asn
            340                 345                 350
Glu Ile Met Lys Glu Ile Glu Arg Glu Ser Lys Arg Ile Lys Leu Asn
        355                 360                 365
Asp Asn Asp Asp Glu Gly Asn Lys Lys Ile Ile Ala Pro Arg Ile Phe
    370                 375                 380
Ile Ser Asp Asp Lys Asp Ser Leu Lys Cys Pro Cys Asp Pro Glu Ile
385                 390                 395                 400
Val Ser Asn Ser Thr Cys Asn Phe Phe Val Cys Lys Cys Val Glu Lys
                405                 410                 415
Arg Ala Glu Val Thr Ser Asn Asn Glu Val Val Val Lys Glu Glu Tyr
            420                 425                 430
Lys Asp Glu Tyr Ala Asp Ile Pro Glu His Lys Pro Thr Tyr Asp Lys
        435                 440                 445
Met
<210>12
<211>449
<212>PRT
<213>人工
<220>
<223>涵盖多样性(DiCo)的蛋白质变体6
<400>12
Ile Glu Ile Val Glu Arg Ser Asn Tyr Met Gly Asn Pro Trp Thr Glu
1               5                   10                  15
Tyr Met Ala Lys Tyr Asp Ile Glu Glu Val His Gly Ser Gly Ile Arg
            20                  25                  30
Val Asp Leu Gly Glu Asp Ala Glu Val Ala Gly Thr Gln Tyr Arg Leu
        35                  40                  45
Pro Ser Gly Lys Cys Pro Val Phe Gly Lys Gly Ile Ile Ile Glu Asn
    50                  55                  60
Ser Asn Thr Thr Phe Leu Lys Pro Val Ala Thr Gly Asn Gln Asp Leu
65                  70                  75                  80
Lys Asp Gly Gly Phe Ala Phe Pro Pro Thr Asn Pro Leu Met Ser Pro
                85                  90                  95
Met Thr Leu Asp Asp Met Arg Asp Leu Tyr Lys Asp Asn Glu Tyr Val
            100                 105                 110
Lys Asn Leu Asp Glu Leu Thr Leu Cys Ser Arg His Ala Gly Asn Met
        115                 120                 125
Asn Pro Asp Asn Asp Lys Asn Ser Asn Tyr Lys Tyr Pro Ala Val Tyr
    130                 135                 140
Asp Asp Lys Asp Lys Lys Cys His Ile Leu Tyr Ile Ala Ala Gln Glu
145                 150                 155                 160
Asn Asn Gly Pro Arg Tyr Cys Asn Lys Asp Gln Ser Lys Arg Asn Ser
                165                 170                 175
Met Phe Cys Phe Arg Pro Ala Lys Asp Ile Ser Phe Gln Asn Tyr Thr
            180                 185                 190
Tyr Leu Ser Lys Asn Val Val His Asn Trp Glu Glu Val Cys Pro Arg
        195                 200                 205
Lys Asn Leu Gln Asn Ala Lys Phe Gly Leu Trp Val Asp Gly Asn Cys
    210                 215                 220
Glu Asp Ile Pro His Val Asn Glu Phe Ser Ala Asn Asp Leu Phe Glu
225                 230                 235                 240
Cys Asn Lys Leu Val Phe Glu Leu Ser Ala Ser Asp Gln Pro Lys Gln
                245                 250                 255
Tyr Glu Gln His Leu Thr Asp Tyr Glu Lys Ile Lys Glu Gly Phe Lys
            260                 265                 270
Asn Lys Asn Ala Ser Met Ile Lys Ser Ala Phe Leu Pro Thr Gly Ala
        275                 280                 285
Phe Lys Ala Asp Arg Tyr Lys Ser Arg Gly Lys Gly Tyr Asn Trp Gly
    290                 295                 300
Asn Tyr Asn Thr Glu Thr Gln Lys Cys Glu Ile Phe Asn Val Lys Pro
305                 310                 315                 320
Thr Cys Leu Ile Asn Asn Ser Ser Tyr Ile Ala Thr Thr Ala Leu Ser
                325                 330                 335
His Pro Asn Glu Val Glu Asn Asn Phe Pro Cys Ser Leu Tyr Lys Asp
            340                 345                 350
Glu Ile Lys Lys Glu Ile Glu Arg Glu Ser Lys Arg Ile Lys Leu Asn
        355                 360                 365
Asp Asn Asp Asp Glu Gly Asn Lys Lys Ile Ile Ala Pro Arg Ile Phe
    370                 375                 380
Ile Ser Asp Asp Ile Asp Ser Leu Lys Cys Pro Cys Ala Pro Glu Met
385                 390                 395                 400
Val Ser Asn Ser Thr Cys Arg Phe Phe Val Cys Lys Cys Val Glu Arg
                405                 410                 415
Arg Ala Glu Val Thr Ser Asn Asn Glu Val Val Val Lys Glu Glu Tyr
            420                 425                 430
Lys Asp Glu Tyr Ala Asp Ile Pro Glu His Lys Pro Thr Tyr Asp Asn
        435                 440                 445
Met
<210>13
<211>1353
<212>DNA
<213>人工
<220>
<223>编码SEQ ID NO:1的核酸序列
<400>13
atgattgaaa ttgttgaaag atctaactac atgggtaacc catggactga atacatggct     60
aagtacgata ttgaagaagt tcatggttct ggtattagag ttgatttggg tgaagatgct    120
gaagttgctg gtactcaata cagattgcca tctggtaagt gtccagtttt tggtaagggt    180
attattattg aaaactctca aactactttt ttgactccag ttgctactga aaaccaagat    240
ttgaaggatg gtggttttgc ttttccacca actaagccat tgatgtctcc aatgactttg    300
gatcaaatga gacattttta caaggataac gaatacgtta agaacttgga tgaattgact    360
ttgtgttcta gacatgctgg taacatgaac ccagataacg ataagaactc taactacaag    420
tacccagctg tttacgatga taaggataag aagtgtcata ttttgtacat tgctgctcaa    480
gaaaacaacg gtccaagata ctgtaacaag gatgaatcta agagaaactc tatgttttgt    540
tttagaccag ctaaggataa gtcttttcaa aactacgttt acttgtctaa gaacgttgtt    600
gataactggg aaaaggtttg tccaagaaag aacttggaaa acgctaagtt tggtttgtgg    660
gttgatggta actgtgaaga tattccacat gttaacgaat tttctgctaa cgatttgttt    720
gaatgtaaca agttggtttt tgaattgtct gcttctgatc aaccaaagca atacgaacaa    780
catttgactg attacgaaaa gattaaggaa ggttttaaga acaagaacgc tgatatgatt    840
aagtctgctt ttttgccaac tggtgctttt aaggctgata gatacaagtc tcatggtaag    900
ggttacaact ggggtaacta caacagaaag actcaaaagt gtgaaatttt taacgttaag    960
ccaacttgtt tgattaacga taagtcttac attgctacta ctgctttgtc tcatccaatt   1020
gaagttgaac ataactttcc atgttctttg tacaaggatg aaattaagaa ggaaattgaa   1080
agagaatcta agagaattaa gttgaacgat aacgatgatg aaggtaacaa gaagattatt   1140
gctccaagaa tttttatttc tgatgataag gattctttga agtgtccatg tgatccagaa   1200
attgtttctc aatctacttg taactttttt gtttgtaagt gtgttgaaaa gagagctgaa   1260
gttacttcta acaacgaagt tgttgttaag gaagaataca aggatgaata cgctgatatt   1320
ccagaacata agccaactta cgataagatg taa                                1353
<210>14
<211>1350
<212>DNA
<213>人工
<220>
<223>编码SEQ ID NO:2的核酸序列
<400>14
attgaaattg ttgaaagatc taactacatg ggtaacccat ggactgaata catggctaag     60
tacgatattg aagaagttca tggttctggt attagagttg atttgggtga agatgctgaa    120
gttgctggta ctcaatacag attgccatct ggtaagtgtc cagtttttgg taagggtatt    180
attattgaaa actctcaaac tacttttttg aagccagttg ctactggtaa ccaagatttg    240
aaggatggtg gttttgcttt tccaccaact aacccattga tttctccaat gactttgaac    300
ggtatgagag atttttacaa gaacaacgaa tacgttaaga acttggatga attgactttg    360
tgttctagac atgctggtaa catgaaccca gataacgatg aaaactctaa ctacaagtac    420
ccagctgttt acgattacaa cgataagaag tgtcatattt tgtacattgc tgctcaagaa    480
aacaacggtc caagatactg taacaaggat gaatctaaga gaaactctat gttttgtttt    540
agaccagcta aggataagtt gtttgaaaac tacgtttact tgtctaagaa cgttgttcat    600
aactgggaag aagtttgtcc aagaaagaac ttggaaaacg ctaagtttgg tttgtgggtt    660
gatggtaact gtgaagatat tccacatgtt aacgaatttt ctgctaacga tttgtttgaa    720
tgtaacaagt tggtttttga attgtctgct tctgatcaac caaagcaata cgaacaacat    780
ttgactgatt acgaaaagat taaggaaggt tttaagaaca agaacgctga tatgattaag    840
tctgcttttt tgccaactgg tgcttttaag gctgatagat acaagtctag aggtaagggt    900
tacaactggg gtaactacaa cagaaagact caaaagtgtg aaatttttaa cgttaagcca    960
acttgtttga ttaacgataa gtcttacatt gctactactg ctttgtctca tccaattgaa   1020
gttgaaaaca actttccatg ttctttgtac aagaacgaaa ttatgaagga aattgaaaga   1080
gaatctaaga gaattaagtt gaacgataac gatgatgaag gtaacaagaa gattattgct   1140
ccaagaattt ttatttctga tgataaggat tctttgaagt gtccatgtga tccagaaatg    1200
gtttctcaat ctacttgtag attttttgtt tgtaagtgtg ttgaaagaag agctgaagtt    1260
acttctaaca acgaagttgt tgttaaggaa gaatacaagg atgaatacgc tgatattcca    1320
gaacataagc caacttacga taacatgtaa                                     1350
<210>15
<211>1350
<212>DNA
<213>人工
<220>
<223>编码SEQ ID NO:3的核酸序列
<400>15
attgaaattg ttgaaagatc taactacatg ggtaacccat ggactgaata catggctaag     60
tacgatattg aagaagttca tggttctggt attagagttg atttgggtga agatgctgaa    120
gttgctggta ctcaatacag attgccatct ggtaagtgtc cagtttttgg taagggtatt    180
attattgaaa actctaagac tacttttttg actccagttg ctactgaaaa ccaagatttg    240
aaggatggtg gttttgcttt tccaccaact gaaccattga tgtctccaat gactttggat    300
gatatgagag atttgtacaa ggataacaag tacgttaaga acttggatga attgactttg    360
tgttctagac atgctggtaa catgattcca gataacgata agaactctaa ctacaagtac    420
ccagctgttt acgattacga agataagaag tgtcatattt tgtacattgc tgctcaagaa    480
aacaacggtc caagatactg taacaaggat caatctaaga gaaactctat gttttgtttt    540
agaccagcta aggatatttc ttttcaaaac tacgtttact tgtctaagaa cgttgttgat    600
aactgggaaa aggtttgtcc aagaaagaac ttgcaaaacg ctaagtttgg tttgtgggtt    660
gatggtaact gtgaagatat tccacatgtt aacgaatttt ctgctattga tttgtttgaa    720
tgtaacaagt tggtttttga attgtctgct tctgatcaac caaagcaata cgaacaacat    780
ttgactgatt acgaaaagat taaggaaggt tttaagaaca agaacgctga tatgattaag     840
tctgcttttt tgccaactgg tgcttttaag gctgatagat acaagtctca tggtaagggt     900
tacaactggg gtaactacaa cactgaaact caaaagtgtg aaatttttaa cgttaagcca     960
acttgtttga ttaacgataa gtcttacatt gctactactg ctttgtctca tccaaacgaa    1020
gttgaacata actttccatg ttctttgtac aaggatgaaa ttaagaagga aattgaaaga    1080
gaatctaaga gaattaagtt gaacgataac gatgatgaag gtaacaagaa gattattgct    1140
ccaagaattt ttatttctga tgatattgat tctttgaagt gtccatgtgc tccagaaatt    1200
gtttctcaat ctacttgtaa cttttttgtt tgtaagtgtg ttgaaaagag agctgaagtt    1260
acttctaaca acgaagttgt tgttaaggaa gaatacaagg atgaatacgc tgatattcca    1320
gaacataagc caacttacga taagatgtaa                                     1350
<210>16
<211>1350
<212>DNA
<213>人工
<220>
<223>编码SEQ ID NO:4的核酸序列
<400>16
attgaaattg ttgaaagatc taactacatg ggtaacccat ggactgaata catggctaag     60
tacgatattg aagaagttca tggttctggt attagagttg atttgggtga agatgctgaa    120
gttgctggta ctcaatacag attgccatct ggtaagtgtc cagtttttgg taagggtatt    180
attattgaaa actctaacac tacttttttg actccagttg ctactgaaaa ccaagatttg    240
aaggatggtg gttttgcttt tccaccaact aagccattga tgtctccaat gactttggat    300
caaatgagac atttttacaa ggataacgaa tacgttaaga acttggatga attgactttg    360
tgttctagac atgctggtaa catgaaccca gataacgata agaactctaa ctacaagtac    420
ccagctgttt acgatgataa ggataagaag tgtcatattt tgtacattgc tgctcaagaa    480
aacaacggtc caagatactg taacaaggat gaatctaaga gaaactctat gttttgtttt    540
agaccagcta aggataagtc ttttcaaaac tacacttact tgtctaagaa cgttgttgat    600
aactgggaaa aggtttgtcc aagaaagaac ttggaaaacg ctaagtttgg tttgtgggtt    660
gatggtaact gtgaagatat tccacatgtt aacgaatttt ctgctaacga tttgtttgaa    720
tgtaacaagt tggtttttga attgtctgct tctgatcaac caaagcaata cgaacaacat    780
ttgactgatt acgaaaagat taaggaaggt tttaagaaca agaacgcttc tatgattaag    840
tctgcttttt tgccaactgg tgcttttaag gctgatagat acaagtctca tggtaagggt    900
tacaactggg gtaactacaa cagaaagact caaaagtgtg aaatttttaa cgttaagcca    960
acttgtttga ttaacaactc ttcttacatt gctactactg ctttgtctca tccaattgaa   1020
gttgaacata actttccatg ttctttgtac aaggatgaaa ttaagaagga aattgaaaga   1080
gaatctaaga gaattaagtt gaacgataac gatgatgaag gtaacaagaa gattattgct   1140
ccaagaattt ttatttctga tgataaggat tctttgaagt gtccatgtga tccagaaatt   1200
gtttctaact ctacttgtaa cttttttgtt tgtaagtgtg ttgaaaagag agctgaagtt   1260
acttctaaca acgaagttgt tgttaaggaa gaatacaagg atgaatacgc tgatattcca   1320
gaacataagc caacttacga taagatgtaa                                    1350
<210>17
<211>1350
<212>DNA
<213>人工
<220>
<223>编码SEQ ID NO:5的核酸序列
<400>17
attgaaattg ttgaaagatc taactacatg ggtaacccat ggactgaata catggctaag     60
tacgatattg aagaagttca tggttctggt attagagttg atttgggtga agatgctgaa    120
gttgctggta ctcaatacag attgccatct ggtaagtgtc cagtttttgg taagggtatt    180
attattgaaa actctaacac tacttttttg aagccagttg ctactggtaa ccaagatttg    240
aaggatggtg gttttgcttt tccaccaact aacccattga tttctccaat gactttgaac    300
ggtatgagag atttttacaa gaacaacgaa tacgttaaga acttggatga attgactttg    360
tgttctagac atgctggtaa catgaaccca gataacgatg aaaactctaa ctacaagtac    420
ccagctgttt acgattacaa cgataagaag tgtcatattt tgtacattgc tgctcaagaa    480
aacaacggtc caagatactg taacaaggat gaatctaaga gaaactctat gttttgtttt    540
agaccagcta aggataagtt gtttgaaaac tacacttact tgtctaagaa cgttgttcat    600
aactgggaag aagtttgtcc aagaaagaac ttggaaaacg ctaagtttgg tttgtgggtt    660
gatggtaact gtgaagatat tccacatgtt aacgaatttt ctgctaacga tttgtttgaa    720
tgtaacaagt tggtttttga attgtctgct tctgatcaac caaagcaata cgaacaacat    780
ttgactgatt acgaaaagat taaggaaggt tttaagaaca agaacgcttc tatgattaag    840
tctgcttttt tgccaactgg tgcttttaag gctgatagat acaagtctag aggtaagggt    900
tacaactggg gtaactacaa cagaaagact caaaagtgtg aaatttttaa cgttaagcca    960
acttgtttga ttaacaactc ttcttacatt gctactactg ctttgtctca tccaattgaa   1020
gttgaaaaca actttccatg ttctttgtac aagaacgaaa ttatgaagga aattgaaaga   1080
gaatctaaga gaattaagtt gaacgataac gatgatgaag gtaacaagaa gattattgct   1140
ccaagaattt ttatttctga tgataaggat tctttgaagt gtccatgtga tccagaaatg   1200
gtttctaact ctacttgtag attttttgtt tgtaagtgtg ttgaaagaag agctgaagtt   1260
acttctaaca acgaagttgt tgttaaggaa gaatacaagg atgaatacgc tgatattcca   1320
gaacataagc caacttacga taacatgtaa                                    1350
<210>18
<211>1350
<212>DNA
<213>人工
<220>
<223>编码SEQ ID NO:6的核酸序列
<400>18
attgaaattg ttgaaagatc taactacatg ggtaacccat ggactgaata catggctaag     60
tacgatattg aagaagttca tggttctggt attagagttg atttgggtga agatgctgaa    120
gttgctggta ctcaatacag attgccatct ggtaagtgtc cagtttttgg taagggtatt    180
attattgaaa actctaagac tacttttttg actccagttg ctactgaaaa ccaagatttg    240
aaggatggtg gttttgcttt tccaccaact gaaccattga tgtctccaat gactttggat    300
gatatgagag atttgtacaa ggataacaag tacgttaaga acttggatga attgactttg    360
tgttctagac atgctggtaa catgattcca gataacgata agaactctaa ctacaagtac    420
ccagctgttt acgattacga agataagaag tgtcatattt tgtacattgc tgctcaagaa    480
aacaacggtc caagatactg taacaaggat caatctaaga gaaactctat gttttgtttt    540
agaccagcta aggatatttc ttttcaaaac tacacttact tgtctaagaa cgttgttgat    600
aactgggaaa aggtttgtcc aagaaagaac ttgcaaaacg ctaagtttgg tttgtgggtt    660
gatggtaact gtgaagatat tccacatgtt aacgaatttt ctgctattga tttgtttgaa    720
tgtaacaagt tggtttttga attgtctgct tctgatcaac caaagcaata cgaacaacat    780
ttgactgatt acgaaaagat taaggaaggt tttaagaaca agaacgcttc tatgattaag    840
tctgcttttt tgccaactgg tgcttttaag gctgatagat acaagtctca tggtaagggt    900
tacaactggg gtaactacaa cactgaaact caaaagtgtg aaatttttaa cgttaagcca    960
acttgtttga ttaacaactc ttcttacatt gctactactg ctttgtctca tccaaacgaa   1020
gttgaacata actttccatg ttctttgtac aaggatgaaa ttaagaagga aattgaaaga    1080
gaatctaaga gaattaagtt gaacgataac gatgatgaag gtaacaagaa gattattgct    1140
ccaagaattt ttatttctga tgatattgat tctttgaagt gtccatgtgc tccagaaatt    1200
gtttctaact ctacttgtaa cttttttgtt tgtaagtgtg ttgaaaagag agctgaagtt    1260
acttctaaca acgaagttgt tgttaaggaa gaatacaagg atgaatacgc tgatattcca    1320
gaacataagc caacttacga taagatgtaa                                     1350
<210>19
<211>1350
<212>DNA
<213>人工
<220>
<223>编码SEQ ID NO:7的核酸序列
<400>19
attgaaattg ttgaaagatc taactacatg ggtaacccat ggactgaata catggctaag     60
tacgatattg aagaagttca tggttctggt attagagttg atttgggtga agatgctgaa    120
gttgctggta ctcaatacag attgccatct ggtaagtgtc cagtttttgg taagggtatt    180
attattgaaa actctcaaac tacttttttg actccagttg ctactgaaaa ccaagatttg    240
aaggatggtg gttttgcttt tccaccaact aagccattga tgtctccaat gactttggat    300
caaatgagac atttttacaa ggataacaag tacgttaaga acttggatga attgactttg    360
tgttctagac atgctggtaa catgattcca gataacgata agaactctaa ctacaagtac    420
ccagctgttt acgattacga agataagaag tgtcatattt tgtacattgc tgctcaagaa    480
aacaacggtc caagatactg taacaaggat gaatctaaga gaaactctat gttttgtttt    540
agaccagcta aggataagtc ctttcaaaac tacgtttact tgtctaagaa cgttgttgat    600
aactgggaaa aggtttgtcc aagaaagaac ttggaaaacg ctaagtttgg tttgtgggtt    660
gatggtaact gtgaagatat tccacatgtt aacgaatttt ccgctattga tttgtttgaa     720
tgtaacaagt tggtttttga attgtctgct tctgatcaac caaagcaata cgaacaacat     780
ttgactgatt acgaaaagat taaggaaggt tttaagaaca agaacgctga tatgattaag     840
tctgcttttt tgccaactgg tgcttttaag gctgatagat acaagtctca tggtaagggt     900
tacaactggg gtaactacaa cagaaagact caaaagtgtg aaatttttaa cgttaagcca     960
acttgtttga ttaacgataa gtcttacatt gctactactg ctttgtctca tccaattgaa    1020
gttgaacata actttccatg ttctttgtac aaggatgaaa ttaagaagga aattgaaaga    1080
gaatctaaga gaattaagtt gaacgataac gatgatgaag gtaacaagaa gattattgct    1140
ccaagaattt ttatttctga tgataaggat tctttgaagt gtccatgtga tccagaaatt    1200
gtttctcaat ctacttgtaa cttttttgtt tgtaagtgtg ttgaaaagag agctgaagtt    1260
acttctaaca acgaagttgt tgttaaggaa gaatacaagg atgaatacgc tgatattcca    1320
gaacataagc caacttacga taagatgtaa                                     1350
<210>20
<211>1350
<212>DNA
<213>人工
<220>
<223>编码SEQ ID NO:8的核酸序列
<400>20
attgaaattg ttgaaagatc taactacatg ggtaacccat ggactgaata catggctaag     60
tacgatattg aagaagttca tggttctggt attagagttg atttgggtga agatgctgaa    120
gttgctggta ctcaatacag attgccatct ggtaagtgtc cagtttttgg taagggtatt    180
attattgaaa actctaagac tacttttttg actccagttg ctactgaaaa ccaagatttg    240
aaggatggtg gttttgcttt tccaccaact gaaccattga tttctccaat gactttgaac    300
ggtatgagag atttttacaa gaacaacgaa tacgttaaga acttggatga attgactttg     360
tgttctagac atgctggtaa catgaaccca gataacgatg aaaactctaa ctacaagtac     420
ccagctgttt acgattacaa cgataagaag tgtcatattt tgtacattgc tgctcaagaa     480
aacaacggtc caagatactg taacaaggat gaatctaaga gaaactctat gttttgtttt     540
agaccagcta aggataagtt gtttgaaaac tacgtttact tgtctaagaa cgttgttgat     600
aactgggaaa aggtttgtcc aagaaagaac ttggaaaacg ctaagtttgg tttgtgggtt     660
gatggtaact gtgaagatat tccacatgtt aacgaatttt ccgctaacga tttgtttgaa     720
tgtaacaagt tggtttttga attgtctgct tctgatcaac caaagcaata cgaacaacat     780
ttgactgatt acgaaaagat taaggaaggt tttaagaaca agaacgctga tatgattaag     840
tctgcttttt tgccaactgg tgcttttaag gctgatagat acaagtctca tggtaagggt     900
tacaactggg gtaactacaa cagaaagact caaaagtgtg aaatttttaa cgttaagcca     960
acttgtttga ttaacgataa gtcttacatt gctactactg ctttgtctca tccaattgaa    1020
gttgaacata actttccatg ttctttgtac aagaacgaaa ttatgaagga aattgaaaga    1080
gaatctaaga gaattaagtt gaacgataac gatgatgaag gtaacaagaa gattattgct    1140
ccaagaattt ttatttctga tgataaggat tctttgaagt gtccatgtga tccagaaatt    1200
gtttctcaat ctacttgtaa cttttttgtt tgtaagtgtg ttgaaaagag agctgaagtt    1260
acttctaaca acgaagttgt tgttaaggaa gaatacaagg atgaatacgc tgatattcca    1320
gaacataagc caacttacga taagatgtaa                                     1350
<210>21
<211>1350
<212>DNA
<213>人工
<220>
<223>编码SEQ ID NO:9的核酸序列
<400>21
attgaaattg ttgaaagatc taactacatg ggtaacccat ggactgaata catggctaag     60
tacgatattg aagaagttca tggttctggt attagagttg atttgggtga agatgctgaa    120
gttgctggta ctcaatacag attgccatct ggtaagtgtc cagtttttgg taagggtatt    180
attattgaaa actctcaaac tacttttttg aagccagttg ctactggtaa ccaagatttg    240
aaggatggtg gttttgcttt tccaccaact aacccattga tgtctccaat gactttggat    300
gatatgagag atttgtacaa ggataacgaa tacgttaaga acttggatga attgactttg    360
tgttctagac atgctggtaa catgaaccca gataacgata agaactctaa ctacaagtac    420
ccagctgttt acgatgataa ggataagaag tgtcatattt tgtacattgc tgctcaagaa    480
aacaacggtc caagatactg taacaaggat caatctaaga gaaactctat gttttgtttt    540
agaccagcta aggatatttc ctttcaaaac tacgtttact tgtctaagaa cgttgttcat    600
aactgggaag aagtttgtcc aagaaagaac ttgcaaaacg ctaagtttgg tttgtgggtt    660
gatggtaact gtgaagatat tccacatgtt aacgaatttt ccgctaacga tttgtttgaa    720
tgtaacaagt tggtttttga attgtctgct tctgatcaac caaagcaata cgaacaacat    780
ttgactgatt acgaaaagat taaggaaggt tttaagaaca agaacgctga tatgattaag    840
tctgcttttt tgccaactgg tgcttttaag gctgatagat acaagtctag aggtaagggt    900
tacaactggg gtaactacaa cactgaaact caaaagtgtg aaatttttaa cgttaagcca    960
acttgtttga ttaacgataa gtcttacatt gctactactg ctttgtctca tccaaacgaa   1020
gttgaaaaca actttccatg ttctttgtac aaggatgaaa ttaagaagga aattgaaaga   1080
gaatctaaga gaattaagtt gaacgataac gatgatgaag gtaacaagaa gattattgct   1140
ccaagaattt ttatttctga tgatattgat tctttgaagt gtccatgtgc tccagaaatg   1200
gtttctcaat ctacttgtag attttttgtt tgtaagtgtg ttgaaagaag agctgaagtt   1260
acttctaaca acgaagttgt tgttaaggaa gaatacaagg atgaatacgc tgatattcca    1320
gaacataagc caacttacga taacatgtaa                                     1350
<210>22
<211>1350
<212>DNA
<213>人工
<220>
<223>编码SEQ ID NO:10的核酸序列
<400>22
attgaaattg ttgaaagatc taactacatg ggtaacccat ggactgaata catggctaag     60
tacgatattg aagaagttca tggttctggt attagagttg atttgggtga agatgctgaa    120
gttgctggta ctcaatacag attgccatct ggtaagtgtc cagtttttgg taagggtatt    180
attattgaaa actctaacac tacttttttg actccagttg ctactgaaaa ccaagatttg    240
aaggatggtg gttttgcttt tccaccaact aagccattga tgtctccaat gactttggat    300
caaatgagac atttttacaa ggataacaag tacgttaaga acttggatga attgactttg    360
tgttctagac atgctggtaa catgattcca gataacgata agaactctaa ctacaagtac    420
ccagctgttt acgattacga agataagaag tgtcatattt tgtacattgc tgctcaagaa    480
aacaacggtc caagatactg taacaaggat gaatctaaga gaaactctat gttttgtttt    540
agaccagcta aggataagtc ctttcaaaac tacacttact tgtctaagaa cgttgttgat    600
aactgggaaa aggtttgtcc aagaaagaac ttggaaaacg ctaagtttgg tttgtgggtt    660
gatggtaact gtgaagatat tccacatgtt aacgaatttt ccgctattga tttgtttgaa    720
tgtaacaagt tggtttttga attgtctgct tctgatcaac caaagcaata cgaacaacat    780
ttgactgatt acgaaaagat taaggaaggt tttaagaaca agaacgcttc catgattaag    840
tctgcttttt tgccaactgg tgcttttaag gctgatagat acaagtctca tggtaagggt    900
tacaactggg gtaactacaa cagaaagact caaaagtgtg aaatttttaa cgttaagcca     960
acttgtttga ttaacaactc ctcttacatt gctactactg ctttgtctca tccaattgaa    1020
gttgaacata actttccatg ttctttgtac aaggatgaaa ttaagaagga aattgaaaga    1080
gaatctaaga gaattaagtt gaacgataac gatgatgaag gtaacaagaa gattattgct    1140
ccaagaattt ttatttctga tgataaggat tctttgaagt gtccatgtga tccagaaatt    1200
gtttctaact ctacttgtaa cttttttgtt tgtaagtgtg ttgaaaagag agctgaagtt    1260
acttctaaca acgaagttgt tgttaaggaa gaatacaagg atgaatacgc tgatattcca    1320
gaacataagc caacttacga taagatgtaa                                     1350
<210>23
<211>1350
<212>DNA
<213>人工
<220>
<223>编码SEQ ID NO:11的核酸序列
<400>23
attgaaattg ttgaaagatc taactacatg ggtaacccat ggactgaata catggctaag     60
tacgatattg aagaagttca tggttctggt attagagttg atttgggtga agatgctgaa    120
gttgctggta ctcaatacag attgccatct ggtaagtgtc cagtttttgg taagggtatt    180
attattgaaa actctaagac tacttttttg actccagttg ctactgaaaa ccaagatttg    240
aaggatggtg gttttgcttt tccaccaact gaaccattga tttctccaat gactttgaac    300
ggtatgagag atttttacaa gaacaacgaa tacgttaaga acttggatga attgactttg    360
tgttctagac atgctggtaa catgaaccca gataacgatg aaaactctaa ctacaagtac    420
ccagctgttt acgattacaa cgataagaag tgtcatattt tgtacattgc tgctcaagaa    480
aacaacggtc caagatactg taacaaggat gaatctaaga gaaactctat gttttgtttt    540
agaccagcta aggataagtt gtttgaaaac tacacttact tgtctaagaa cgttgttgat     600
aactgggaaa aggtttgtcc aagaaagaac ttggaaaacg ctaagtttgg tttgtgggtt     660
gatggtaact gtgaagatat tccacatgtt aacgaatttt ccgctaacga tttgtttgaa     720
tgtaacaagt tggtttttga attgtctgct tctgatcaac caaagcaata cgaacaacat     780
ttgactgatt acgaaaagat taaggaaggt tttaagaaca agaacgcttc catgattaag     840
tctgcttttt tgccaactgg tgcttttaag gctgatagat acaagtctca tggtaagggt     900
tacaactggg gtaactacaa cagaaagact caaaagtgtg aaatttttaa cgttaagcca     960
acttgtttga ttaacaactc ctcttacatt gctactactg ctttgtctca tccaattgaa    1020
gttgaacata actttccatg ttctttgtac aagaacgaaa ttatgaagga aattgaaaga    1080
gaatctaaga gaattaagtt gaacgataac gatgatgaag gtaacaagaa gattattgct    1140
ccaagaattt ttatttctga tgataaggat tctttgaagt gtccatgtga tccagaaatt    1200
gtttctaact ctacttgtaa cttttttgtt tgtaagtgtg ttgaaaagag agctgaagtt    1260
acttctaaca acgaagttgt tgttaaggaa gaatacaagg atgaatacgc tgatattcca    1320
gaacataagc caacttacga taagatgtaa                                     1350
<210>24
<211>1350
<212>DNA
<213>人工
<220>
<223>编码SEQ ID NO:12的核酸序列
<400>24
attgaaattg ttgaaagatc taactacatg ggtaacccat ggactgaata catggctaag     60
tacgatattg aagaagttca tggttctggt attagagttg atttgggtga agatgctgaa    120
gttgctggta ctcaatacag attgccatct ggtaagtgtc cagtttttgg taagggtatt    180
attattgaaa actctaacac tacttttttg aagccagttg ctactggtaa ccaagatttg    240
aaggatggtg gttttgcttt tccaccaact aacccattga tgtctccaat gactttggat    300
gatatgagag atttgtacaa ggataacgaa tacgttaaga acttggatga attgactttg    360
tgttctagac atgctggtaa catgaaccca gataacgata agaactctaa ctacaagtac    420
ccagctgttt acgatgataa ggataagaag tgtcatattt tgtacattgc tgctcaagaa    480
aacaacggtc caagatactg taacaaggat caatctaaga gaaactctat gttttgtttt    540
agaccagcta aggatatttc ctttcaaaac tacacttact tgtctaagaa cgttgttcat    600
aactgggaag aagtttgtcc aagaaagaac ttgcaaaacg ctaagtttgg tttgtgggtt    660
gatggtaact gtgaagatat tccacatgtt aacgaatttt ccgctaacga tttgtttgaa    720
tgtaacaagt tggtttttga attgtctgct tctgatcaac caaagcaata cgaacaacat    780
ttgactgatt acgaaaagat taaggaaggt tttaagaaca agaacgcttc catgattaag    840
tctgcttttt tgccaactgg tgcttttaag gctgatagat acaagtctag aggtaagggt    900
tacaactggg gtaactacaa cactgaaact caaaagtgtg aaatttttaa cgttaagcca    960
acttgtttga ttaacaactc ctcttacatt gctactactg ctttgtctca tccaaacgaa   1020
gttgaaaaca actttccatg ttctttgtac aaggatgaaa ttaagaagga aattgaaaga   1080
gaatctaaga gaattaagtt gaacgataac gatgatgaag gtaacaagaa gattattgct   1140
ccaagaattt ttatttctga tgatattgat tctttgaagt gtccatgtgc tccagaaatg   1200
gtttctaact ctacttgtag attttttgtt tgtaagtgtg ttgaaagaag agctgaagtt   1260
acttctaaca acgaagttgt tgttaaggaa gaatacaagg atgaatacgc tgatattcca   1320
gaacataagc caacttacga taacatgtaa                                    1350
<210>25
<211>449
<212>PRT
<213>人工
<220>
<223>共有序列AMA1恶性疟原虫
<400>25
Ile Glu Ile Val Glu Arg Ser Asn Tyr Met Gly Asn Pro Trp Thr Glu
1               5                   10                  15
Tyr Met Ala Lys Tyr Asp Ile Glu Glu Val His Gly Ser Gly Ile Arg
            20                  25                  30
Val Asp Leu Gly Glu Asp Ala Glu Val Ala Gly Thr Gln Tyr Arg Leu
        35                  40                  45
Pro Ser Gly Lys Cys Pro Val Phe Gly Lys Gly Ile Ile Ile Glu Asn
    50                  55                  60
Ser Asn Thr Thr Phe Leu Thr Pro Val Ala Thr Glu Asn Gln Asp Leu
65                  70                  75                  80
Lys Asp Gly Gly Phe Ala Phe Pro Pro Thr Asn Pro Leu Met Ser Pro
                85                  90                  95
Met Thr Leu Asp Gln Met Arg Asp Phe Tyr Lys Asp Asn Glu Tyr Val
            100                 105                 110
Lys Asn Leu Asp Glu Leu Thr Leu Cys Ser Arg His Ala Gly Asn Met
        115                 120                 125
Asn Pro Asp Asn Asp Lys Asn Ser Asn Tyr Lys Tyr Pro Ala Val Tyr
    130                 135                 140
Asp Tyr Lys Asp Lys Lys Cys His Ile Leu Tyr Ile Ala Ala Gln Glu
145                 150                 155                 160
Asn Asn Gly Pro Arg Tyr Cys Asn Lys Asp Glu Ser Lys Arg Asn Ser
                165                 170                 175
Met Phe Cys Phe Arg Pro Ala Lys Asp Lys Ser Phe Gln Asn Tyr Thr
            180                 185                 190
Tyr Leu Ser Lys Asn Val Val Asp Asn Trp Glu Lys Val Cys Pro Arg
        195                 200                 205
Lys Asn Leu Glu Asn Ala Lys Phe Gly Leu Trp Val Asp Gly Asn Cys
    210                 215                 220
Glu Asp Ile Pro His Val Asn Glu Phe Ser Ala Asn Asp Leu Phe Glu
225                 230                 235                 240
Cys Asn Lys Leu Val Phe Glu Leu Ser Ala Ser Asp Gln Pro Lys Gln
                245                 250                 255
Tyr Glu Gln His Leu Thr Asp Tyr Glu Lys Ile Lys Glu Gly Phe Lys
            260                 265                 270
Asn Lys Asn Ala Ser Met Ile Lys Ser Ala Phe Leu Pro Thr Gly Ala
        275                 280                 285
Phe Lys Ala Asp Arg Tyr Lys Ser His Gly Lys Gly Tyr Asn Trp Gly
    290                 295                 300
Asn Tyr Asn Arg Lys Thr Gln Lys Cys Glu Ile Phe Asn Val Lys Pro
305                 310                 315                 320
Thr Cys Leu Ile Asn Asn Ser Ser Tyr Ile Ala Thr Thr Ala Leu Ser
                325                 330                 335
His Pro Ile Glu Val Glu His Asn Phe Pro Cys Ser Leu Tyr Lys Asp
            340                 345                 350
Glu Ile Lys Lys Glu Ile Glu Arg Glu Ser Lys Arg Ile Lys Leu Asn
        355                 360                 365
Asp Asn Asp Asp Glu Gly Asn Lys Lys Ile Ile Ala Pro Arg Ile Phe
    370                 375                 380
Ile Ser Asp Asp Lys Asp Ser Leu Lys Cys Pro Cys Asp Pro Glu Ile
385                 390                 395                 400
Val Ser Asn Ser Thr Cys Asn Phe Phe Val Cys Lys Cys Val Glu Lys
                405                 410                 415
Arg Ala Glu Val Thr Ser Asn Asn Glu Val Val Val Lys Glu Glu Tyr
            420                 425                 430
Lys Asp Glu Tyr Ala Asp Ile Pro Glu His Lys Pro Thr Tyr Asp Lys
        435                 440                 445
Met
<210>26
<211>28
<212>DNA
<213>人工
<220>
<223>X1引物序列
<400>26
gcgaattcat tgaaattgtt gaaagatc                                      28
<210>27
<211>28
<212>DNA
<213>人工
<220>
<223>Y1引物序列
<400>27
ggggtaccaa catcttatcg taagttgg                                      28
<210>28
<211>29
<212>DNA
<213>人工
<220>
<223>Y2引物序列
<400>28
ggggtaccga catgttatcg taagttggc                                     29
<210>29
<211>449
<212>PRT
<213>恶性疟原虫
<400>29
Ile Glu Ile Val Glu Arg Ser Asn Tyr Met Gly Asn Pro Trp Thr Glu
1               5                   10                  15
Tyr Met Ala Lys Tyr Asp Ile Glu Glu Val His Gly Ser Gly Ile Arg
            20                  25                  30
Val Asp Leu Gly Glu Asp Ala Glu Val Ala Gly Thr Gln Tyr Arg Leu
        35                  40                  45
Pro Ser Gly Lys Cys Pro Val Phe Gly Lys Gly Ile Ile Ile Glu Asn
    50                  55                  60
Ser Lys Thr Thr Phe Leu Thr Pro Val Ala Thr Gly Asn Gln Tyr Leu
65                  70                  75                  80
Lys Asp Gly Gly Phe Ala Phe Pro Pro Thr Glu Pro Leu Met Ser Pro
                85                  90                  95
Met Thr Leu Asp Glu Met Arg His Phe Tyr Lys Asp Asn Lys Tyr Val
            100                 105                 110
Lys Asn Leu Asp Glu Leu Thr Leu Cys Ser Arg His Ala Gly Asn Met
        115                 120                 125
Ile Pro Asp Asn Asp Lys Asn Ser Asn Tyr Lys Tyr Pro Ala Val Tyr
    130                 135                 140
Asp Asp Lys Asp Lys Lys Cys His Ile Leu Tyr Ile Ala Ala Gln Glu
145                 150                 155                 160
Asn Asn Gly Pro Arg Tyr Cys Asn Lys Asp Glu Ser Lys Arg Asn Ser
                165                 170                 175
Met Phe Cys Phe Arg Pro Ala Lys Asp Ile Ser Phe Gln Asn Tyr Val
            180                 185                 190
Tyr Leu Ser Lys Asn Val Val Asp Asn Trp Glu Lys Val Cys Pro Arg
        195                 200                 205
Lys Asn Leu Gln Asn Ala Lys Phe Gly Leu Trp Val Asp Gly Asn Cys
    210                 215                 220
Glu Asp Ile Pro His Val Asn Glu Phe Pro Ala Ile Asp Leu Phe Glu
225                 230                 235                 240
Cys Asn Lys Leu Val Phe Glu Leu Ser Ala Ser Asp Gln Pro Lys Gln
                245                 250                 255
Tyr Glu Gln His Leu Thr Asp Tyr Glu Lys Ile Lys Glu Gly Phe Lys
            260                 265                 270
Asn Lys Asn Ala Asp Met Ile Lys Ser Ala Phe Leu Pro Thr Gly Ala
        275                 280                 285
Phe Lys Ala Asp Arg Tyr Lys Ser His Gly Lys Gly Tyr Asn Trp Gly
    290                 295                 300
Asn Tyr Asn Thr Glu Thr Gln Lys Cys Glu Ile Phe Asn Val Lys Pro
305                 310                 315                 320
Thr Cys Leu Ile Asn Asp Lys Ser Tyr Ile Ala Thr Thr Ala Leu Ser
                325                 330                 335
His Pro Ile Glu Val Glu Asn Asn Phe Pro Cys Ser Leu Tyr Lys Asp
            340                 345                 350
Glu Ile Met Lys Glu Ile Glu Arg Glu Ser Lys Arg Ile Lys Leu Asn
        355                 360                 365
Asp Asn Asp Asp Glu Gly Asn Lys Lys Ile Ile Ala Pro Arg Ile Phe
    370                 375                 380
Ile Ser Asp Asp Lys Asp Ser Leu Lys Cys Pro Cys Asp Pro Glu Met
385                 390                 395                 400
Val Ser Gln Ser Thr Cys Arg Phe Phe Val Cys Lys Cys Val Glu Arg
                405                 410                 415
Arg Ala Glu Val Thr Ser Asn Asn Glu Val Val Val Lys Glu Glu Tyr
            420                 425                 430
Lys Asp Glu Tyr Ala Asp Ile Pro Glu His Lys Pro Thr Tyr Asp Lys
        435                 440                 445
Met
<210>30
<211>449
<212>PRT
<213>恶性疟原虫
<400>30
Ile Glu Ile Val Glu Arg Ser Asn Tyr Met Gly Asn Pro Trp Thr Glu
1               5                   10                  15
Tyr Met Ala Lys Tyr Asp Ile Glu Lys Val His Gly Ser Gly Ile Arg
            20                  25                  30
Val Asp Leu Gly Glu Asp Ala Glu Val Ala Gly Thr Gln Tyr Arg Leu
        35                  40                  45
Pro Ser Gly Lys Cys Pro Val Phe Gly Lys Gly Ile Ile Ile Glu Asn
    50                  55                  60
Ser Lys Thr Thr Phe Leu Thr Pro Val Ala Thr Glu Asn Gln Asp Leu
65                  70                  75                  80
Lys Asp Gly Gly Phe Ala Phe Pro Pro Thr Glu Pro Leu Ile Ser Pro
                85                  90                  95
Met Thr Leu Asp Gln Met Arg His Leu Tyr Lys Asp Asn Glu Tyr Val
            100                 105                 110
Lys Asn Leu Asp Glu Leu Thr Leu Cys Ser Arg His Ala Gly Asn Met
        115                 120                 125
Asn Pro Asp Asn Asp Lys Asn Ser Asn Tyr Lys Tyr Pro Ala Val Tyr
    130                 135                 140
Asp Tyr Glu Asp Lys Lys Cys His Ile Leu Tyr Ile Ala Ala Gln Glu
145                 150                 155                 160
Asn Asn Gly Pro Arg Tyr Cys Asn Lys Asp Glu Ser Lys Arg Asn Ser
                165                 170                 175
Met Phe Cys Phe Arg Pro Ala Lys Asp Lys Leu Phe Glu Asn Tyr Val
            180                 185                 190
Tyr Leu Ser Lys Asn Val Val Asp Asn Trp Glu Glu Val Cys Pro Arg
        195                 200                 205
Lys Asn Leu Glu Asn Ala Lys Phe Gly Leu Trp Val Asp Gly Asn Cys
    210                 215                 220
Glu Asp Ile Pro His Val Asn Glu Phe Ser Ala Asn Asp Leu Phe Glu
225                 230                 235                 240
Cys Asn Lys Leu Val Phe Glu Leu Ser Ala Ser Asp Gln Pro Lys Gln
                245                 250                 255
Tyr Glu Gln His Leu Thr Asp Tyr Glu Lys Ile Lys Glu Gly Phe Lys
            260                 265                 270
Asn Lys Asn Ala Asp Met Ile Lys Ser Ala Phe Leu Pro Thr Gly Ala
        275                 280                 285
Phe Lys Ala Asp Arg Tyr Lys Ser Arg Gly Lys Gly Tyr Asn Trp Gly
    290                 295                 300
Asn Tyr Asn Thr Glu Thr Gln Lys Cys Glu Ile Phe Asn Val Lys Pro
305                 310                 315                 320
Thr Cys Leu Ile Asn Asp Lys Ser Tyr Ile Ala Thr Thr Ala Leu Ser
                325                 330                 335
His Pro Asn Glu Val Glu Asn Asn Phe Pro Cys Ser Leu Tyr Lys Asp
            340                 345                 350
Glu Ile Lys Lys Glu Ile Glu Arg Glu Ser Lys Arg Ile Lys Leu Asn
        355                 360                 365
Asp Asn Asp Asp Glu Gly Asn Lys Lys Ile Ile Ala Pro Arg Ile Phe
    370                 375                 380
Ile Ser Asp Asp Lys Asp Ser Leu Lys Cys Pro Cys Asp Pro Glu Ile
385                 390                 395                 400
Val Ser Gln Ser Thr Cys Asn Phe Phe Val Cys Lys Cys Val Glu Lys
                405                 410                 415
Arg Ala Glu Val Thr Ser Asn Asn Glu Val Val Val Lys Glu Glu Tyr
            420                 425                 430
Lys Asp Glu Tyr Ala Asp Ile Pro Glu His Lys Pro Thr Tyr Asp Lys
        435                 440                 445
Met
<210>31
<211>449
<212>PRT
<213>恶性疟原虫
<400>31
Ile Glu Ile Val Glu Arg Ser Asn Tyr Met Gly Asn Pro Trp Thr Glu
1               5                   10                  15
Tyr Met Ala Lys Tyr Asp Ile Glu Glu Val His Gly Ser Gly Ile Arg
            20                  25                  30
Val Asp Leu Gly Glu Asp Ala Glu Val Ala Gly Thr Gln Tyr Arg Leu
        35                  40                  45
Pro Ser Gly Lys Cys Pro Val Phe Gly Lys Gly Ile Ile Ile Glu Asn
    50                  55                  60
Ser Lys Thr Thr Phe Leu Lys Pro Val Ala Thr Gly Asn Gln Asp Leu
65                  70                  75                  80
Lys Asp Gly Gly Phe Ala Phe Pro Pro Thr Asn Pro Leu Ile Ser Pro
                85                  90                  95
Met Thr Leu Asn Gly Met Arg Asp Phe Tyr Lys Asn Asn Glu Tyr Val
            100                 105                 110
Lys Asn Leu Asp Glu Leu Thr Leu Cys Ser Arg His Ala Gly Asn Met
        115                 120                 125
Asn Pro Asp Asn Asp Lys Asn Ser Asn Tyr Lys Tyr Pro Ala Val Tyr
    130                 135                 140
Asp Tyr Asn Asp Lys Lys Cys His Ile Leu Tyr Ile Ala Ala Gln Glu
145                 150                 155                 160
Asn Asn Gly Pro Arg Tyr Cys Asn Lys Asp Gln Ser Lys Arg Asn Ser
                165                 170                 175
Met Phe Cys Phe Arg Pro Ala Lys Asp Lys Leu Phe Glu Asn Tyr Val
            180                 185                 190
Tyr Leu Ser Lys Asn Val Val Asp Asn Trp Glu Glu Val Cys Pro Arg
        195                 200                 205
Lys Asn Leu Glu Asn Ala Lys Phe Gly Leu Trp Val Asp Gly Asn Cys
    210                 215                 220
Glu Asp Ile Pro His Val Asn Glu Phe Ser Ala Asn Asp Leu Phe Glu
225                 230                 235                 240
Cys Asn Lys Leu Val Phe Glu Leu Ser Ala Ser Asp Gln Pro Lys Gln
                245                 250                 255
Tyr Glu Gln His Leu Thr Asp Tyr Glu Lys Ile Lys Glu Gly Phe Lys
            260                 265                 270
Asn Lys Asn Ala Asp Met Ile Lys Ser Ala Phe Leu Pro Thr Gly Ala
        275                 280                 285
Phe Lys Ala Asp Arg Tyr Lys Ser His Gly Lys Gly Tyr Asn Trp Gly
    290                 295                 300
Asn Tyr Asn Arg Glu Thr Gln Lys Cys Glu Ile Phe Asn Val Lys Pro
305                 310                 315                 320
Thr Cys Leu Ile Asn Asp Lys Ser Tyr Ile Ala Thr Thr Ala Leu Ser
                325                 330                 335
His Pro Ile Glu Val Glu His Asn Phe Pro Cys Ser Leu Tyr Lys Asp
            340                 345                 350
Glu Ile Lys Lys Glu Ile Glu Arg Glu Ser Lys Arg Ile Lys Leu Asn
        355                 360                 365
Asp Asn Asp Asp Glu Gly Asn Lys Lys Ile Ile Ala Pro Arg Ile Phe
    370                 375                 380
Ile Ser Asp Asp Lys Asp Ser Leu Lys Cys Pro Cys Asp Pro Glu Met
385                 390                 395                 400
Val Ser Gln Ser Thr Cys Arg Phe Phe Val Cys Lys Cys Val Glu Arg
                405                 410                 415
Arg Ala Glu Val Thr Ser Asn Asn Glu Val Val Val Lys Glu Glu Tyr
            420                 425                 430
Lys Asp Glu Tyr Ala Asp Ile Pro Glu His Lys Pro Thr Tyr Asp Lys
        435                 440                 445
Met

Claims (22)

1.适用于诱导脊椎动物免疫应答的、包含单一抗原的2至10种蛋白质变体的蛋白质组合物,其中所述的抗原包含大量可变氨基酸位置,其中所述蛋白质变体的氨基酸序列以组合方式代表了各种氨基酸在所述的可变氨基酸位置处的发生频率,以及所述的可变氨基酸位置之间的关联,并且其中所述的发生频率在所述的单一抗原中至少为10%至20%,例如10%、11%、12%、13%......20%,并且其中所述的可变氨基酸位置之间至少75%的关联由蛋白质变体的组合来表示。
2.根据权利要求1的蛋白质组合物,其中所述的单一抗原为选自恶性疟原虫、间日疟原虫、诺氏疟原虫、三日疟原虫和卵形疟原虫中的疟原虫属物种的AMA1蛋白质。
3.根据权利要求1或权利要求2的蛋白质组合物,其中所述的可变氨基酸位置为恶性疟原虫AMA1蛋白质的氨基酸位置162、167、172、173、175、187、190、196、197、200、201、204、206、207、225、230、242、243、267、282、283、285、296、300、308、332、393、404、405、407、435、439、448、451、485、493、496、503、512、544。
4.根据权利要求1至3中任意一项的蛋白质组合物,其包含选自SEQ ID No 1至12中的至少3种蛋白质变体。
5.根据权利要求1至4中任意一项的蛋白质组合物,其包含选自SEQ ID No 1至6中的至少3种蛋白质变体。
6.根据权利要求1至5中任意一项的蛋白质组合物,其包含具有SEQ ID No 1、SEQ ID No 2和SEQ ID No 3的3种蛋白质变体。
7.根据权利要求1至6中任意一项的蛋白质组合物,其中所述的蛋白质变体是连接的。
8.选自SEQ ID No 1至12中的蛋白质变体。
9.选自SEQ ID No 1至6中的蛋白质变体。
10.选自SEQ ID No 1至3中的蛋白质变体。
11.编码根据权利要求7至10中任意一项的蛋白质变体的核酸序列。
12.根据权利要求11的核酸序列,其选自SEQ ID No 12至24。
13.包含根据权利要求11或权利要求12的核酸序列的表达载体。
14.根据权利要求13的表达载体,其中所述的表达载体为pPicZalpha或pPIC9。
15.使用根据权利要求13或权利要求14的表达载体转化或转染的宿主生物体。
16.根据权利要求15的宿主生物体,其中所述的宿主生物体为巴斯德毕赤酵母。
17.根据权利要求1至6中任意一项的蛋白质组合物在制备用于接种脊椎动物的药物中的用途。
18.根据权利要求17的用途,其中所述的接种为针对疟疾的接种。
20.根据权利要求17或权利要求18的用途,其中所述的脊椎动物为人。
21.用于生产根据权利要求1至7中任意一项的蛋白质组合物的方法,该方法包括以下步骤:
a)测定抗原中的可变氨基酸位置;各种氨基酸在所述的可变氨基酸位置处的发生频率;以及所述的可变氨基酸位置之间的关联;
b)测定包含有最大数量X的不同氨基酸的可变氨基酸位置,其中所述的各种不同氨基酸的发生频率至少为10-20%;
c)设计X种蛋白质变体,这些变体以组合方式代表了各种氨基酸在各个可变位置处的发生频率。
22.根据权利要求21的方法,其中对所述的X种蛋白质变体的设计进一步以组合方式代表了所述的可变氨基酸位置之间至少75%的关联。
23.根据权利要求21或权利要求22的方法,其中步骤(c)包括设计蛋白质变体Y1至Yx,其过程如下:根据氨基酸的发生频率,向蛋白质变体Y1中的可变氨基酸位置处分配在该位置处发生频率最高的氨基酸,并向Yx分配在该位置处发生频率较低的氨基酸;向蛋白质变体Y2至Yx-1中的相应氨基酸位置处分配其余的氨基酸或相同的氨基酸,前体条件是可变氨基酸位置之间建立的关联在至少75%的情况下是保守的。
CN2006800567256A 2006-12-21 2006-12-21 用于诱导脊椎动物发生免疫应答的、包含有涵盖了单种抗原ama1的异质性的大量蛋白质变体的蛋白质组合物 Expired - Fee Related CN101595127B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2006/012444 WO2008074356A1 (en) 2006-12-21 2006-12-21 Protein composition for inducing an immune response in a vertebrate comprising a plurality of protein variants covering the heterogeneity of a single antigen, ama1

Publications (2)

Publication Number Publication Date
CN101595127A true CN101595127A (zh) 2009-12-02
CN101595127B CN101595127B (zh) 2013-11-06

Family

ID=37806270

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800567256A Expired - Fee Related CN101595127B (zh) 2006-12-21 2006-12-21 用于诱导脊椎动物发生免疫应答的、包含有涵盖了单种抗原ama1的异质性的大量蛋白质变体的蛋白质组合物

Country Status (4)

Country Link
US (1) US8741305B2 (zh)
EP (1) EP2094724B1 (zh)
CN (1) CN101595127B (zh)
WO (1) WO2008074356A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI0905729A2 (pt) * 2008-01-18 2015-07-14 Aeras Global Tb Vaccine Found "polipeptídeo antigênico recombinante, peptídeo antigênico recombinante, ácido nucléico e método para imunizar um indivíduo contra malária"
US20110117120A1 (en) * 2009-11-13 2011-05-19 Martha Sedegah Plasmodium falciparum HLA class I restricted T-cell epitopes
US20150004631A1 (en) * 2010-11-09 2015-01-01 Martha Sedegah Plasmodium falciparum HLA class I restricted T-cell epitopes

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AUPM368994A0 (en) * 1994-02-04 1994-02-24 Saramane Pty Ltd Malaria merozoite antigen subunit vaccine
EP1346049B1 (en) * 2000-12-22 2012-08-01 Stichting Biomedical Primate Research Centre Efficient expression of plasmodium apical membrane antigen 1 in yeast cells
EP1669370A1 (en) * 2004-10-06 2006-06-14 Institut Pasteur Identification of regions of apical membrane antigen 1 of apicomplexan parasites suitable for targeting by vaccines and drugs by derivation and analysis of the three-dimensional structure

Also Published As

Publication number Publication date
US8741305B2 (en) 2014-06-03
WO2008074356A1 (en) 2008-06-26
EP2094724B1 (en) 2012-09-26
US20100172923A1 (en) 2010-07-08
EP2094724A1 (en) 2009-09-02
CN101595127B (zh) 2013-11-06

Similar Documents

Publication Publication Date Title
EP0166410B1 (en) Immunologically active peptides capable of inducing immunization against malaria and genes encoding therefor
US7968695B2 (en) Nucleic acids encoding recombinant 56 and 82 kDa antigens from gametocytes of Eimeria maxima and their uses
CA2774640C (en) Virus like particles comprising target proteins fused to plant viral coat proteins
CN101230104A (zh) 包含疟原虫msp-1的c-末端片段的重组蛋白
Bonnefoy et al. Molecular characterization of the heat shock protein 90 gene of the human malaria parasite Plasmodium falciparum
EP3122373A1 (en) Multi-component-multistage malaria vaccines
Liu et al. Protective immunity against Eimeria maxima induced by vaccines of Em14-3-3 antigen
CN101595127B (zh) 用于诱导脊椎动物发生免疫应答的、包含有涵盖了单种抗原ama1的异质性的大量蛋白质变体的蛋白质组合物
Huang et al. The molecular characterization and protective efficacy of microneme 3 of Eimeria mitis in chickens
Bonnefoy et al. Plasmodium falciparum: characterization of gene R45 encoding a trophozoite antigen containing a central block of six amino acid repeats
AU759103B2 (en) Polynucleotide molecules encoding neospora proteins
AU2002316558A1 (en) Nucleic acids encoding recombinant 56 and 82 kDa antigens from gametocytes of Eimeria maxima and their uses
US7749519B2 (en) Unique DNA and polypeptide sequences based on the circumsporozoite protein of Plasmodium vivax
EP1357128B1 (en) The preparation and usage of plasmodium fusion antigen
EP0244427A1 (en) Recombinant virus
US8501926B2 (en) Malaria vaccine
CN100457779C (zh) 用于预防利什曼病的新型手段
MXPA03009306A (es) Antigenos para aumentar una respuesta inmune contra patogenos rickettsieae y ehrlichieae.
Matsuo et al. Cellular localization of Babesia bovis rhoptry-associated protein 1 in the merozoite stage with immuno-electron microscopy
Fischer et al. LLLLGGG GGGGGGG GGG LLL GGGGGG
CN102143973A (zh) 来自疟原虫属的msp-1蛋白质制剂

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20131106

Termination date: 20191221