CN1756843B - 化脓链球菌抗原 - Google Patents

化脓链球菌抗原 Download PDF

Info

Publication number
CN1756843B
CN1756843B CN2004800056285A CN200480005628A CN1756843B CN 1756843 B CN1756843 B CN 1756843B CN 2004800056285 A CN2004800056285 A CN 2004800056285A CN 200480005628 A CN200480005628 A CN 200480005628A CN 1756843 B CN1756843 B CN 1756843B
Authority
CN
China
Prior art keywords
streptococcus pyogenes
antibody
nucleic acid
protein
fragment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2004800056285A
Other languages
English (en)
Other versions
CN1756843A (zh
Inventor
A·迈因克
E·纳吉
B·温克勒
D·格尔布曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Valneva Austria GmbH
Original Assignee
Intercell Austria AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intercell Austria AG filed Critical Intercell Austria AG
Publication of CN1756843A publication Critical patent/CN1756843A/zh
Application granted granted Critical
Publication of CN1756843B publication Critical patent/CN1756843B/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/02Bacterial antigens
    • A61K39/0208Specific bacteria not otherwise provided for
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/04Antibacterial agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P37/00Drugs for immunological or allergic disorders
    • A61P37/02Immunomodulators
    • A61P37/04Immunostimulants
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/315Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Streptococcus (G), e.g. Enterococci
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/12Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from bacteria
    • C07K16/1267Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from bacteria from Gram-positive bacteria
    • C07K16/1275Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from bacteria from Gram-positive bacteria from Streptococcus (G)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/20Immunoglobulins specific features characterized by taxonomic origin
    • C07K2317/21Immunoglobulins specific features characterized by taxonomic origin from primates, e.g. man

Abstract

本发明公开了编码超免疫血清反应性抗原或其片段的分离的核酸分子以及来自化脓链球菌的超免疫血清反应性抗原或其片段、分离所述抗原的方法和它们的特殊应用。

Description

化脓链球菌抗原
本发明涉及分离的核酸分子,它编码关于化脓链球菌(Streptococcuspyogenes)的抗原,适用于制备药物以预防和治疗由化脓链球菌引起的细菌感染。
化脓链球菌,又称为A族链球菌(GAS),是一种重要的革兰氏阳性细胞外细菌病原体且常常感染人。GAS集群于咽喉或皮肤处造成许多化脓性感染和非化脓性后遗症。它主要是儿童疾病且在人体中引起包括细菌性咽炎、猩红热、脓疱病和脓毒病在内的多种感染。数十年的流行病学研究产生了显著不同的咽喉和皮肤菌株的概念,其中某些血清型通常分别与咽喉或皮肤感染有关{Cunningham,M.,2000}。已发现GAS造成了最近在美国复苏的链球菌中毒休克综合征相关性坏死性筋膜炎{Cone,L.等,1987;Stevens,D.,1992}并被描述为侵入皮肤和软组织导致组织或肢体损伤的“食肉”细菌。
感染后人体中可出现几种链球菌后遗症,诸如急性风湿热、急性肾小球肾炎和反应性关节炎。急性风湿热和风湿性心脏病是其中最严重的自身免疫后遗症并已在世界范围内导致了儿童的残疾和死亡。化脓链球菌还可引起诸如猩红热和坏死性筋膜炎等严重的急性疾病并且已与Tourette氏综合征以及运动和注意力失调症相关。
A族链球菌是咽喉疼痛和咽炎的最常见的细菌诱因且至少占季节性依赖的普通门诊的16%{Hope-Simpson,R.,1981}。它主要侵袭5-15周岁的学龄儿童{Cunningham,M.,2000}。在例如学校等拥挤条件下所有年龄段都容易受该生物体传播的侵袭。尽管GAS不被认为是正常的菌群,但A族链球菌的咽运载现象存在时可以无临床症状。
A族链球菌可用血清学分类的Lancefield分类方案基于其碳水化合物进行区分或基于通过与盐酸一起煮沸细菌可提取的表面蛋白划分成M蛋白血清型。这样已产生了80个以上的血清型标识,它还可通过分子方法进行分型(emm基因)。化脓链球菌的某些M蛋白血清型主要与咽炎和风湿热相关,而其它的似乎主要引起了脓皮病和急性肾小球肾炎{Cunningham,M.,2000}。
此外,在引起咽炎及偶尔的中毒性休克中涉及的是C型和G型链球菌,它必须在咽喉培养后被识别出来{Hope-Simpson,R.,1981;Bisno,A.等,1987}。
目前,链球菌感染只能用抗生素疗法治疗。不过,用抗生素治疗的案例中有25-30%显示出疾病复发和/或在粘膜分泌物中流出了所述的生物体。目前尚未有预防疗法(疫苗)可供避免链球菌感染。
因此,仍然需要寻找一种有效的疗法用于预防或减轻链球菌感染。疫苗不仅能预防链球菌的感染,还可更特异地预防或改善对宿主组织的定植,从而降低咽炎和其它化脓性感染的发生率。诸如风湿热、急性肾小球肾炎、脓毒病、中毒性休克和坏死性筋膜炎等非化脓性后遗症的消除是降低该生物体急性感染和携带发生率的直接后果。显示出能起交叉保护作用以抵抗其它链球菌的疫苗也可用于预防或减轻由所有其它β-溶血性链球种引起的感染,即A、B、C和G族。
疫苗可包含全部各种不同抗原。例如,抗原的实例是被完全杀死或减毒的生物体、这些生物体/组织的亚组分、蛋白质,或者,它们最简单的形式-肽。抗原还可以糖基化的蛋白质或肽的形式被免疫系统所识别,而且还可是或者包含多糖或脂类。可以使用短肽,因为例如细胞毒性T细胞(CTL)识别通常形式短至8-11个氨基酸长的肽且与主要组织相容性复合体(MHC)结合的抗原。B-细胞可识别4-5个氨基酸短的线性表位以及三维结构(构象表位)。为了获得持续不变的抗原特异性免疫应答,需要用佐剂触发涉及所有必需的免疫系统细胞的免疫级联反应。根本上,佐剂是作用于所谓的抗原呈递细胞(APCs),但不局限于其作用形式。这些细胞通常首先遇到抗原,然后将加工过或未修饰过的抗原呈递于免疫效应器细胞上。还可涉及中间细胞类型。只有具有适当特异性的效应器细胞可在生产性免疫应答中被激活。佐剂还可局部保留抗原并与其它因子共同注射。此外,佐剂可用作其它免疫细胞的化学引诱物或可局部的和/或全身性地用作免疫系统的刺激剂。
开发A族链球菌疫苗的方法主要集中于化脓链球菌的细胞表面M蛋白{Bessen,D.等,1988;Bronze,M.等,1988}。由于存在80多种不同的化脓链球菌M血清型且新的血清型不断出现{Fischetti,V.,1989},用有限数目的血清型特异的M蛋白或M蛋白衍生肽接种将不可能起到有效抵抗所有其它M血清型的保护作用。此外,已显示M蛋白包含一段氨基酸序列,它与人的心脏组织具有免疫学交叉反应性,被认为是风湿热相关性心脏瓣膜损伤的起因{Fenderson,P.等,1989}。
疫苗开发还可考虑其它蛋白质,诸如红斑毒素、链球菌热原性外毒素A和链球菌热原性外毒素B {Lee,P.K.,1989}。对这些毒素的免疫性可能预防链球菌中毒性休克的致命症状,但可能不预防A族链球菌的定植。
利用上述蛋白质以及许多另外的候选分子作为抗原用于潜在疫苗{Ji,Y.等,1997;Guzman,C.等,1999}主要是通过基于鉴定的方便性或获得的机会进行选择决定的。需要鉴定针对化脓链球菌的有效和相关抗原。
本发明的发明人研发了一种方法用于鉴定、分离和产生来自具体病原体的超免疫血清反应性抗原,特别是来自金黄色葡萄球菌(Staphylococcusaureus)和表皮葡萄球菌(Staphylococcus epidermidis)(WO 02/059148)。不过,由于生物学特性、致病功能和遗传背景的差异,化脓链球菌与葡萄球菌菌株是显著不同的。重要的是,用于鉴定来自化脓链球菌的抗原的血清选择是与应用于金黄色葡萄球菌筛选的血清选择不同的。为此目的收集三种主要类型的人血清。首先,针对化脓链球菌的鼻咽携带,检测年龄小于45周岁且优选家庭中有幼儿的健康成人。大部分幼儿是化脓链球菌的携带者,且就其家庭成员而言他们被认为是一暴露源。基于相关资料,保护性(集群中和)抗体有可能存在于非化脓链球菌携带者的被暴露的个体中(在家庭中具有高携带率的儿童)。为了选择相应的血清来源,用细菌裂解物和培养物上清蛋白质进行检测抗化脓链球菌IgG和IgA抗体水平的一系列ELISA。在基于基因组的抗原鉴定中包括来自高效价非携带者的血清。用于人血清选择的这种方法基本上与针对金黄色葡萄球菌的方法非常不同,其中携带和非携带状态不能与抗体水平联系起来。
其次,以相同方式表征和选择来自咽炎患者的血清样品。获自患有链球菌后遗症-诸如急性风湿热和肾小球肾炎的个体的第三组血清样品主要用于确认的目的。此较后的一组帮助排除表位,它在这些患者中诱发了高水平的抗体,因为链球菌感染后疾病是与GAS所诱导的抗体有关的且具有抗诸如心肌等人组织的反应性或者涉及肾小球炎中有害的免疫复合物的形成。两个细菌种属化脓链球菌和金黄色葡萄球菌自身的基因组显示出了许多重要的差异。化脓链球菌含大约1.85Mb,而金黄色葡萄球菌含2.85Mb。它们的平均GC含量分别为38.5和33%且大约30-45%的编码基因在这两个病原体之间不是共有的。此外,这两个细菌种属繁殖需要不同的生长条件和培养基。而化脓链球菌是严格的人类病原体,金黄色葡萄球菌还被发现可感染一系列温血动物。下文中提供了可由所述的两种病原体造成的一系列重要疾病。金黄色葡萄球菌主要引起医院内的、条件性病原微生物感染:脓疱病、滤泡炎、脓肿、疖子、被感染的伤口、心内膜炎、脑膜炎、脓毒性关节炎、肺炎、骨髓炎、皮肤烫伤综合征(SSS)、中毒性休克综合征。化脓链球菌主要引起群落获得性感染:链球菌咽喉疼痛(发热、渗出性扁桃体炎、咽炎)、链球菌皮肤感染、猩红热、产褥热、败血病、丹毒、肛周蜂窝织炎、乳突炎、中耳炎、肺炎、腹膜炎、伤口感染、急性肾小球肾炎、急性风湿热、中毒性休克样综合征、坏死性筋膜炎。
关于本发明的问题是提供用于开发诸如抗化脓链球菌感染的疫苗等药物的方法。更具体而言,此问题是提供可用于所述药物制备的来自化脓链球菌的一套有效、相关和全面的核酸分子或超免疫血清反应性抗原。
因此,本发明提供了编码超免疫血清反应性抗原或其片段的分离的核酸分子,该核酸包含选自由下列各项组成的组的核酸序列:
a)与选自下列各项的核酸分子具有至少70%序列同一性的核酸分子:Seq ID No 1、4-8、10-18、20、22、24-32、34-35、38-40、43-46、49-51、53-54、57-61、63、65-71、73、75-77、81-82、88、91-94和96-150,
b)与a)的核酸分子互补的核酸分子,
c)包含a)或b)的核酸分子的至少15个连续碱基的核酸分子,
d)在严谨杂交条件下与a)、b)或c)的核酸分子退火的核酸分子,
e)若非遗传密码的简并性,可与a)、b)、c)或d)中所定义的核酸分子杂交的核酸分子。
依照本发明优选的实施方案,序列同一性至少是80%,优选至少95%,尤其是100%。
此外,本发明提供了编码超免疫血清反应性抗原或其片段的分离的核酸分子,该核酸包含选自由下列各项组成的组的核酸序列:
a)与选自Seq ID No 64的核酸分子具有至少96%的序列同一性的核酸分子,
b)与a)的核酸分子互补的核酸分子,
c)包含a)或b)的核酸分子的至少15个连续碱基的核酸分子,
d)在严谨杂交条件下与a)、b)或c)的核酸分子退火的核酸分子,
e)若非遗传密码的简并性,可与a)、b)、c)或d)中所定义的核酸杂交的核酸分子。
根据另一方面,本发明提供了包含核酸序列的分离的核酸分子,所述核酸序列选自由下列各项组成的组:
a)选自Seq ID No 3、36、47-48、55、62、72、80、84、95的核酸分子,
b)与a)的核酸互补的核酸分子,
c)若非遗传密码的简并性,可与a)、b)、c)或d)中所定义的核酸杂交的核酸分子。
优选地,核酸分子是DNA或RNA。
依照本发明的优选实施方案,核酸分子分离自基因组DNA,尤其是来自化脓链球菌的基因组DNA。
依照本发明提供了含有按照本发明任一方面的核酸分子的载体。
在优选的实施方案中,改造所述载体使其适用于由按照本发明的核酸分子编码的超免疫血清反应性抗原或其片段的重组表达。
本发明还提供了含有按照本发明的所述载体的宿主细胞。
根据另一方面,本发明进一步提供了所含氨基酸序列由按照本发明的核酸分子编码的超免疫血清反应性抗原。
在优选的实施方案中,氨基酸序列(多肽)选自:Seq ID No 151、154-158、160-168、170、172、174-182、184-185、188-190、193-196、199-201、203-204、207-211、213、215-221、223、225-227、231-232、238、241-244和246-300。
在另一优选的实施方案中,氨基酸序列(多肽)选自SEq ID No 214。
在另一优选的实施方案中,氨基酸序列(多肽)选自Seq ID No 153、186、197-198、205、212、222、230、234、245。
根据另一方面,本发明提供了超免疫血清反应性抗原的片段,其选自包含下列各项的氨基酸的肽:表1栏“预测免疫原性氨基酸”和“已鉴定的免疫原性区域的位置”的氨基酸序列、表2血清反应性表位,尤其是含以下氨基酸序列的肽:Seq ID No 151的第4-44位、57-65位、67-98位、101-107位、109-125位、131-144位、146-159位、168-173位、181-186位、191-200位、206-213位、229-245位、261-269位、288-301位、304-317位、323-328位、350-361位、374-384位、388-407位、416-425和1-114位;Seq ID No 152的第5-17位、49-64位、77-82位、87-98位、118-125位、127-140位、142-150位、153-159位、191-207位、212-218位、226-270位、274-287位、297-306位、325-331位、340-347位、352-369位、377-382位、390-395和29-226位;Seq ID No 153的第4-16位、20-26位、32-74位、76-87位、93-108位、116-141位、148-162位、165-180位、206-219位、221-228位、230-236位、239-245位、257-268位、313-328位、330-335位、353-359位、367-375位、394-403位、414-434位、437-444位、446-453位、456-464位、478-487位、526-535位、541-552位、568-575位、577-584位、589-598位、610-618位、624-643位、653-665位、667-681位、697-718位、730-748位、755-761位、773-794位、806-821位、823-831位、837-845位、862-877位、879-889位、896-919位、924-930位、935-940位、947-955位、959-964位、969-986位、991-1002位、1012-1036位、1047-1056位、1067-1073位、1079-1085位、1088-1111位、1130-1135位、1148-1164位、1166-1173位、1185-1192位、1244-1254和919-929位;Seq ID No 154的第5-44位、62-74位、78-83位、99-105位、107-113位、124-134位、161-174位、176-194位、203-211位、216-237位、241-247位、253-266位、272-299位、323-349位、353-360和145-305位;Seq ID No 155的第15-39位、52-61位、72-81位、92-97和71-81位;Seq ID No 156的第13-19位、21-31位、40-108位、115-122位、125-140位、158-180位、187-203位、210-223位、235-245和173-186位;Seq ID No 157的第5-12位、19-27位、29-39位、59-67位、71-78位、80-88位、92-104位、107-124位、129-142位、158-168位、185-191位、218-226位、230-243位、256-267位、272-277位、283-291位、307-325位、331-344位、346-352和316-331位;Seq ID No 158的第6-28位、43-53位、60-76位、93-103和21-99位;Seq ID No 159的第10-30位、120-126位、145-151位、159-169位、174-182位、191-196位、201-206位、214-220位、222-232位、254-272位、292-307位、313-323位、332-353位、361-369位、389-396位、401-415位、428-439位、465-481位、510-517位、560-568和9-264位;Seq ID No 160的第5-29位、39-45位、107-128和1-112位;Seq ID No 161的第4-38位、42-50位、54-60位、65-71位、91-102和21-56位;Seq ID No 162的第4-13位、19-25位、41-51位、54-62位、68-75位、79-89位、109-122位、130-136位、172-189位、192-198位、217-224位、262-268位、270-276位、281-298位、315-324位、333-342位、353-370位、376-391和23-39位;Seq ID No 163的第6-41位、49-58位、62-103位、117-124位、147-166位、173-194位、204-211位、221-229位、255-261位、269-284位、288-310位、319-325位、348-380位、383-389位、402-410位、424-443位、467-479位、496-517位、535-553位、555-565位、574-581位、583-591和474-489位;Seq ID No 164的第8-35位、52-57位、66-73位、81-88位、108-114位、125-131位、160-167位、174-180位、230-235位、237-249位、254-262位、278-285位、308-314位、321-326位、344-353位、358-372位、376-383位、393-411位、439-446位、453-464位、471-480位、485-492位、502-508位、523-529位、533-556位、558-563位、567-584位、589-597位、605-619位、625-645位、647-666位、671-678位、690-714位、721-728位、741-763位、766-773位、777-787位、792-802位、809-823位、849-864和37-241位、409-534位、582-604位、743-804位;Seq ID No 165的第4-17位、24-36位、38-44位、59-67位、72-90位、92-121位、126-149位、151-159位、161-175位、197-215位、217-227位、241-247位、257-264位、266-275位、277-284位、293-307位、315-321位、330-337位、345-350位、357-366位、385-416和202-337位;Seq ID No 166的第4-20位、22-46位、49-70位、80-89位、96-103位、105-119位、123-129位、153-160位、181-223位、227-233位、236-243位、248-255位、261-269位、274-279位、283-299位、305-313位、315-332位、339-344位、349-362位、365-373位、380-388位、391-397位、402-407和1-48位;Seq ID No 167的第18-37位、41-63位、100-106位、109-151位、153-167位、170-197位、199-207位、212-229位、232-253位、273-297和203-217位;Seq ID No 168的第20-26位、54-61位、80-88位、94-101位、113-119位、128-136位、138-144位、156-188位、193-201位、209-217位、221-229位、239-244位、251-257位、270-278位、281-290位、308-315位、319-332位、339-352位、370-381位、388-400位、411-417位、426-435位、468-482位、488-497位、499-506位、512-521和261-273位;Seq ID No 169的第6-12位、16-36位、50-56位、86-92位、115-125位、143-152位、163-172位、193-203位、235-244位、280-289位、302-315位、325-348位、370-379位、399-405位、411-417位、419-429位、441-449位、463-472位、482-490位、500-516位、536-543位、561-569位、587-594位、620-636位、647-653位、659-664位、677-685位、687-693位、713-719位、733-740位、746-754位、756-779位、792-799位、808-817位、822-828位、851-865位、902-908位、920-938位、946-952位、969-976位、988-1005位、1018-1027位、1045-1057位、1063-1069位、1071-1078位、1090-1099位、1101-1109位、1113-1127位、1130-1137位、1162-1174位、1211-1221位、1234-1242位、1261-1268位、1278-1284位、1312-1317位、1319-1326位、1345-1353位、1366-1378位、1382-1394位、1396-1413位、1415-1424位、1442-1457位、1467-1474位、1482-1490位、1492-1530位、1537-1549位、1559-1576位、1611-1616位、1624-1641和1-414位、443-614位、997-1392位;Seq ID No 170的第14-42位、70-75位、90-100位、158-181和1-164位;Seq ID No 171的第4-21位、30-36位、54-82位、89-97位、105-118位、138-147和126-207位;Seq IDNo 172的第4-21位、31-66位、96-104位、106-113位、131-142和180-204位;Seq ID No 173的第5-23位、31-36位、38-55位、65-74位、79-88位、101-129位、131-154位、156-165位、183-194位、225-237位、245-261位、264-271位、279-284位、287-297位、313-319位、327-336位、343-363位、380-386和11-197位、204-219位、258-372位;Seq ID No 174的第4-20位、34-41位、71-86位、100-110位、113-124位、133-143位、150-158位、160-166位、175-182位、191-197位、213-223位、233-239位、259-278位、298-322和195-289位;Seq ID No175的第4-10位、21-35位、44-52位、54-62位、67-73位、87-103位、106-135位、161-174位、177-192位、200-209位、216-223位、249-298位、304-312位、315-329和12-130位;Seq ID No 176的第10-27位、33-38位、48-55位、70-76位、96-107位、119-133位、141-147位、151-165位、183-190位、197-210位、228-236位、245-250位、266-272位、289-295位、297-306位、308-315位、323-352位、357-371位、381-390位、394-401位、404-415位、417-425位、427-462位、466-483位、485-496位、502-507位、520-529位、531-541位、553-570位、577-588位、591-596位、600-610位、619-632位、642-665位、671-692位、694-707和434-444位;Seq ID No 177的第6-14位、16-25位、36-46位、52-70位、83-111位、129-138位、140-149位、153-166位、169-181位、188-206位、212-220位、223-259位、261-269位、274-282位、286-293位、297-306位、313-319位、329-341位、343-359位、377-390位、409-415位、425-430和360-375位;Seq ID No 178的第4-26位、28-48位、54-62位、88-121位、147-162位、164-201位、203-237位、245-251和254-260位;Seq ID No 179的第12-21位、26-32位、66-72位、87-93位、98-112位、125-149位、179-203位、209-226位、233-242位、249-261位、266-271位、273-289位、293-318位、346-354位、360-371位、391-400和369-382位;Seq ID No 180的第11-38位、44-65位、70-87位、129-135位、140-163位、171-177位、225-232位、238-249位、258-266位、271-280位、284-291位、295-300位、329-337位、344-352位、405-412位、416-424位、426-434位、436-455位、462-475位、478-487和270-312位;Seq ID No 181的第5-17位、34-45位、59-69位、82-88位、117-129位、137-142位、158-165位、180-195位、201-206位、219-226位、241-260位、269-279位、292-305位、312-321位、341-347位、362-381位、396-410位、413-432位、434-445位、447-453位、482-487位、492-499位、507-516位、546-552位、556-565位、587-604和486-598位;Seq ID No182的第4-15位、17-32位、40-47位、67-78位、90-98位、101-107位、111-136位、161-171位、184-198位、208-214位、234-245位、247-254位、272-279位、288-298位、303-310位、315-320位、327-333位、338-349位、364-374和378-396位;Seq ID No 183的第5-27位、33-49位、51-57位、74-81位、95-107位、130-137位、148-157位、173-184和75-235位;Seq ID No 184的第6-23位、47-53位、57-63位、75-82位、97-105位、113-122位、124-134位、142-153位、159-164位、169-179位、181-187位、192-208位、215-243位、247-257位、285-290位、303-310和30-51位;Seq ID No 185的第17-29位、44-52位、59-73位、77-83位、86-92位、97-110位、118-153位、156-166位、173-179位、192-209位、225-231位、234-240位、245-251位、260-268位、274-279位、297-306位、328-340位、353-360位、369-382位、384-397位、414-423位、431-436位、452-465位、492-498位、500-508位、516-552位、554-560位、568-574位、580-586位、609-617位、620-626位、641-647和208-219位;Seq ID No 186的第4-26位、32-45位、58-72位、111-119位、137-143位、146-159位、187-193位、221-231位、235-242位、250-273位、290-304位、311-321位、326-339位、341-347位、354-368位、397-403位、412-419位、426-432位、487-506位、580-592位、619-628位、663-685位、707-716位、743-751位、770-776位、787-792位、850-859位、866-873位、882-888位、922-931位、957-963位、975-981位、983-989位、1000-1008位、1023-1029位、1058-1064位、1089-1099位、1107-1114位、1139-1145位、1147-1156位、1217-1226位、1276-1281位、1329-1335位、1355-1366位、1382-1394位、1410-1416位、1418-1424位、1443-1451位、1461-1469位、1483-1489位、1491-1501位、1515-1522位、1538-1544位、1549-1561位、1587-1593位、1603-1613位、1625-1630位、1636-1641位、1684-1690位、1706-1723位、1765-1771位、1787-1804位、1850-1857位、1863-1894位、1897-1910位、1926-1935位、1937-1943位、1960-1983位、1991-2005位、2008-2014位、2018-2039和396-533位、1342-1502位、1672-1920位;Seq ID No 187的第4-25位、45-50位、53-65位、79-85位、87-92位、99-109位、126-137位、141-148位、156-183位、190-203位、212-217位、221-228位、235-242位、247-277位、287-293位、300-319位、321-330位、341-361位、378-389位、394-406位、437-449位、455-461位、472-478位、482-491位、507-522位、544-554位、576-582位、587-593位、611-621位、626-632位、649-661位、679-685位、696-704位、706-716位、726-736位、740-751位、759-766位、786-792位、797-802位、810-822位、824-832位、843-852位、863-869位、874-879位、882-905和1-113位、210-232位、250-423位、536-564位;Seq ID No 188的第4-16位、33-39位、43-49位、54-85位、107-123位、131-147位、157-169位、177-187位、198-209位、220-230位、238-248位、277-286位、293-301位、303-315位、319-379位、383-393位、402-414位、426-432位、439-449位、470-478位、483-497位、502-535位、552-566位、571-582位、596-601位、608-620位、631-643位、651-656位、663-678位、680-699位、705-717位、724-732位、738-748位、756-763位、766-772位、776-791位、796-810位、819-827位、829-841位、847-861位、866-871位、876-882位、887-894位、909-934位、941-947位、957-969位、986-994位、998-1028位、1033-1070位、1073-1080位、1090-1096位、1098-1132位、1134-1159位、1164-1172位、1174-1201和617-635位;Seq ID No 189的第7-25位、30-40位、42-64位、70-77位、85-118位、120-166位、169-199位、202-213位、222-244和190-203位;SeqID No 190的第4-11位、15-53位、55-93位、95-113位、120-159位、164-200位、210-243位、250-258位、261-283位、298-319位、327-340位、356-366位、369-376位、380-386位、394-406位、409-421位、425-435位、442-454位、461-472位、480-490位、494-505位、507-514位、521-527位、533-544位、566-574和385-398位;Seq ID No 191的第5-36位、66-72位、120-127位、146-152位、159-168位、172-184位、205-210位、221-232位、234-243位、251-275位、295-305位、325-332位、367-373位、470-479位、482-487位、520-548位、592-600位、605-615位、627-642位、655-662位、664-698位、718-725位、734-763位、776-784位、798-809位、811-842位、845-852位、867-872位、879-888位、900-928位、933-940位、972-977位、982-1003和12-190位、276-283位、666-806位;Seq ID No 192的第4-38位、63-68位、100-114位、160-173位、183-192位、195-210位、212-219位、221-238位、240-256位、258-266位、274-290位、301-311位、313-319位、332-341位、357-363位、395-401位、405-410位、420-426位、435-450位、453-461位、468-475位、491-498位、510-518位、529-537位、545-552位、585-592位、602-611位、634-639位、650-664和30-80位、89-105位、111-151位;Seq ID No 193的第7-29位、31-39位、47-54位、63-74位、81-94位、97-117位、122-127位、146-157位、168-192位、195-204位、216-240位、251-259和195-203位;SeqID No 194的第5-16位、28-34位、46-65位、79-94位、98-105位、107-113位、120-134位、147-158位、163-172位、180-186位、226-233位、237-251位、253-259位、275-285位、287-294位、302-308位、315-321位、334-344位、360-371位、399-412位、420-426和32-50位;Seq ID No 195的第8-20位、30-36位、71-79位、90-96位、106-117位、125-138位、141-147位、166-174和75-90位;Seq ID No 196的第4-13位、15-33位、43-52位、63-85位、98-114位、131-139位、146-174位、186-192位、198-206位、227-233和69-88位;Seq ID No197的第4-22位、29-35位、59-68位、153-170位、213-219位、224-238位、240-246位、263-270位、285-292位、301-321位、327-346位、356-371位、389-405位、411-418位、421-427位、430-437位、450-467位、472-477位、482-487位、513-518位、531-538位、569-576位、606-614位、637-657位、662-667位、673-690位、743-753位、760-767位、770-777位、786-802和96-230位、361-491位、572-585位;SeqID No 198的第4-12位、21-36位、48-55位、74-82位、121-127位、195-203位、207-228位、247-262位、269-278位、280-289和102-210位;Seq ID No 199的第13-20位、23-31位、38-44位、78-107位、110-118位、122-144位、151-164位、176-182位、190-198位、209-216位、219-243位、251-256位、289-304位、306-313和240-248位;Seq ID No200的第5-26位、34-48位、57-77位、84-102位、116-132位、139-145位、150-162位、165-173位、176-187位、192-205位、216-221位、234-248位、250-260和182-198位;Seq ID No 201的第10-19位、26-44位、53-62位、69-87位、90-96位、121-127位、141-146位、148-158位、175-193位、204-259位、307-313位、334-348位、360-365位、370-401位、411-439位、441-450位、455-462位、467-472位、488-504和41-56位;Seq ID No 202的第5-21位、36-42位、96-116位、123-130位、138-144位、146-157位、184-201位、213-228位、252-259位、277-297位、308-313位、318-323位、327-333和202-217位;Seq ID No203的第6-26位、33-51位、72-90位、97-131位、147-154位、164-171位、187-216位、231-236位、260-269位、275-283和1-127位;Seq IDNo 204的第4-22位、24-38位、44-58位、72-88位、99-108位、110-117位、123-129位、131-137位、142-147位、167-178位、181-190位、206-214位、217-223位、271-282位、290-305位、320-327位、329-336位、343-352位、354-364位、396-402位、425-434位、451-456位、471-477位、485-491位、515-541位、544-583位、595-609位、611-626位、644-656位、660-681位、683-691位、695-718和297-458位;SeqID No 205的第5-43位、92-102位、107-116位、120-130位、137-144位、155-163位、169-174位、193-213和24-135位;Seq ID No 206的第4-25位、61-69位、73-85位、88-95位、97-109位、111-130位、135-147位、150-157位、159-179位、182-201位、206-212位、224-248位、253-260位、287-295位、314-331位、338-344位、365-376位、396-405位、413-422位、424-430位、432-449位、478-485位、487-494位、503-517位、522-536位、544-560位、564-578位、585-590位、597-613位、615-623位、629-636位、640-649位、662-671位、713-721和176-330位;Seq ID No 207的第31-37位、41-52位、58-79位、82-105位、133-179位、184-193位、199-205位、209-226位、256-277位、281-295位、297-314位、322-328位、331-337位、359-367位、379-395位、403-409位、417-432位、442-447位、451-460位、466-472和46-62位、296-341位;Seq ID No 208的第23-29位、56-63位、67-74位、96-108位、122-132位、139-146位、152-159位、167-178位、189-196位、214-231位、247-265位、274-293位、301-309位、326-332位、356-363位、378-395位、406-412位、436-442位、445-451位、465-479位、487-501位、528-555位、567-581位、583-599位、610-617位、622-629位、638-662位、681-686位、694-700位、711-716和667-684位;Seq ID No 209的第20-51位、53-59位、109-115位、140-154位、185-191位、201-209位、212-218位、234-243位、253-263位、277-290位、303-313位、327-337位、342-349位、374-382位、394-410位、436-442位、464-477位、486-499位、521-530位、536-550位、560-566位、569-583位、652-672位、680-686位、698-704位、718-746位、758-770位、774-788位、802-827位、835-842位、861-869和258-416位;Seq ID No 210的第7-25位、39-45位、59-70位、92-108位、116-127位、161-168位、202-211位、217-227位、229-239位、254-262位、271-278位、291-300和278-295位;Seq ID No 211的第4-20位、27-33位、45-51位、53-62位、66-74位、81-88位、98-111位、124-130位、136-144位、156-179位、183-191和183-195位;SeqID No 212的第12-24位、27-33位、43-49位、55-71位、77-85位、122-131位、168-177位、179-203位、209-214位、226-241和63-238位;Seq ID No 213的第4-19位、37-50位、120-126位、131-137位、139-162位、177-195位、200-209位、211-218位、233-256位、260-268位、271-283位、288-308和1-141位;Seq ID No 214的第11-17位、40-47位、57-63位、96-124位、141-162位、170-207位、223-235位、241-265位、271-277位、281-300位、312-318位、327-333位、373-379和231-368位;Seq ID No 215的第9-33位、41-48位、57-79位、97-103位、113-138位、146-157位、165-186位、195-201位、209-215位、223-229位、237-247位、277-286位、290-297位、328-342和247-260位;Seq ID No 216的第7-15位、39-45位、58-64位、79-84位、97-127位、130-141位、163-176位、195-203位、216-225位、235-247位、254-264位、271-279和64-72位;Seq ID No 217的第4-12位、26-42位、46-65位、73-80位、82-94位、116-125位、135-146位、167-173位、183-190位、232-271位、274-282位、300-306位、320-343位、351-362位、373-383位、385-391位、402-409位、414-426位、434-455位、460-466位、473-481位、485-503位、519-525位、533-542位、554-565位、599-624位、645-651位、675-693位、717-725位、751-758位、767-785位、792-797位、801-809位、819-825位、831-836位、859-869位、890-897和222-362位、756-896位;Seq ID No 218的第11-17位、22-28位、52-69位、73-83位、86-97位、123-148位、150-164位、166-177位、179-186位、188-199位、219-225位、229-243位、250-255和153-170位;Seq ID No 219的第4-61位、71-80位、83-90位、92-128位、133-153位、167-182位、184-192位、198-212和56-73位;Seq ID No 220的第4-19位、26-37位、45-52位、58-66位、71-77位、84-92位、94-101位、107-118位、120-133位、156-168位、170-179位、208-216位、228-238位、253-273位、280-296位、303-317位、326-334和298-312位;Seq ID No 221的第7-13位、27-35位、38-56位、85-108位、113-121位、123-160位、163-169位、172-183位、188-200位、206-211位、219-238位、247-254和141-157位;Seq ID No222的第23-39位、45-73位、86-103位、107-115位、125-132位、137-146位、148-158位、160-168位、172-179位、185-192位、200-207位、210-224位、233-239位、246-255位、285-334位、338-352位、355-379位、383-389位、408-417位、423-429位、446-456位、460-473位、478-503位、522-540位、553-562位、568-577位、596-602位、620-636位、640-649位、655-663和433-440位、572-593位;Seq ID No 223的第4-42位、46-58位、64-76位、118-124位、130-137位、148-156位、164-169位、175-182位、187-194位、203-218位、220-227位、241-246位、254-259位、264-270位、275-289位、296-305位、309-314位、322-334位、342-354位、398-405位、419-426位、432-443位、462-475位、522-530位、552-567位、593-607位、618-634位、636-647位、653-658位、662-670位、681-695位、698-707位、709-720位、732-742位、767-792位、794-822位、828-842位、851-866位、881-890位、895-903位、928-934位、940-963位、978-986位、1003-1025位、1027-1043位、1058-1075位、1080-1087位、1095-1109位、1116-1122位、1133-1138位、1168-1174位、1179-1186位、1207-1214位、1248-1267和17-319位、417-563位;Seq ID No 224的第6-19位、23-33位、129-138位、140-150位、153-184位、190-198位、206-219位、235-245位、267-275位、284-289位、303-310位、322-328位、354-404位、407-413位、423-446位、453-462位、467-481位、491-500和46-187位;Seq ID No 225的第4-34位、39-57位、78-86位、106-116位、141-151位、156-162位、165-172位、213-237位、252-260位、262-268位、272-279位、296-307位、332-338位、397-403位、406-416位、431-446位、448-453位、464-470位、503-515位、519-525位、534-540位、551-563位、578-593位、646-668位、693-699位、703-719位、738-744位、748-759位、771-777位、807-813位、840-847位、870-876位、897-903位、910-925位、967-976位、979-992和21-244位、381-499位、818-959位;Seq ID No 226的第19-29位、65-75位、90-109位、111-137位、155-165位、169-175和118-136位;Seq ID No227的第15-20位、30-36位、55-63位、73-79位、90-117位、120-127位、136-149位、166-188位、195-203位、211-223位、242-255位、264-269位、281-287位、325-330位、334-341位、348-366位、395-408位、423-429位、436-444位、452-465和147-155位;Seq ID No 228的第11-18位、21-53位、77-83位、91-98位、109-119位、142-163位、173-181位、193-208位、216-227位、238-255位、261-268位、274-286位、290-297位、308-315位、326-332位、352-359位、377-395位、399-406位、418-426位、428-438位、442-448位、458-465位、473-482位、488-499位、514-524位、543-553位、564-600位、623-632位、647-654位、660-669位、672-678位、710-723位、739-749位、787-793位、820-828位、838-860位、889-895位、901-907位、924-939位、956-962位、969-976位、991-999位、1012-1018位、1024-1029位、1035-1072位、1078-1091位、1142-1161和74-438位;Seq ID No229的第4-31位、41-52位、58-63位、65-73位、83-88位、102-117位、123-130位、150-172位、177-195位、207-217位、222-235位、247-253位、295-305位、315-328位、335-342位、359-365位、389-394位、404-413和156-420位;Seq ID No 230的第4-42位、56-69位、98-108位、120-125位、210-216位、225-231位、276-285位、304-310位、313-318位、322-343和79-348位;Seq ID No 231的第12-21位、24-30位、42-50位、61-67位、69-85位、90-97位、110-143位、155-168和53-70位;Seq ID No 232的第4-26位、41-54位、71-78位、88-96位、116-127位、140-149位、151-158位、161-175位、190-196位、201-208位、220-226位、240-247位、266-281位、298-305位、308-318位、321-329位、344-353位、370-378位、384-405位、418-426位、429-442位、457-463位、494-505位、514-522和183-341位;Seq ID No233的第4-27位、69-77位、79-101位、117-123位、126-142位、155-161位、171-186位、200-206位、213-231位、233-244位、258-263位、269-275位、315-331位、337-346位、349-372位、376-381位、401-410位、424-445位、447-455位、463-470位、478-484位、520-536位、546-555位、558-569位、580-597位、603-618位、628-638位、648-660位、668-683位、717-723位、765-771位、781-788位、792-806位、812-822和92-231位、618-757位;Seq ID No 234的第11-47位、63-75位、108-117位、119-128位、133-143位、171-185位、190-196位、226-232位、257-264位、278-283位、297-309位、332-338位、341-346位、351-358位、362-372和41-170位;Seq ID No 235的第6-26位、50-56位、83-89位、108-114位、123-131位、172-181位、194-200位、221-238位、241-259位、263-271位、284-292位、304-319位、321-335位、353-358位、384-391位、408-417位、424-430位、442-448位、459-466位、487-500位、514-528位、541-556位、572-578位、595-601位、605-613位、620-631位、634-648位、660-679位、686-693位、702-708位、716-725位、730-735位、749-755位、770-777位、805-811位、831-837位、843-851位、854-860位、863-869位、895-901位、904-914位、922-929位、933-938位、947-952位、956-963位、1000-1005位、1008-1014位、1021-1030位、1131-1137位、1154-1164位、1166-1174和20-487位、757-1153位;Seq ID No 236的第10-34位、67-78位、131-146位、160-175位、189-194位、201-214位、239-250位、265-271位、296-305和26-74位、91-100位、105-303位;Seq ID No 237的第9-15位、19-32位、109-122位、143-150位、171-180位、186-191位、209-217位、223-229位、260-273位、302-315位、340-346位、353-359位、377-383位、389-406位、420-426位、460-480和10-223位、231-251位、264-297位、312-336位;Seq ID No 238的第5-28位、76-81位、180-195位、203-209位、211-219位、227-234位、242-252位、271-282位、317-325位、350-356位、358-364位、394-400位、405-413位、417-424位、430-436位、443-449位、462-482位、488-498位、503-509位、525-537和22-344位;Seq ID No 239的第5-28位、42-54位、77-83位、86-93位、98-104位、120-127位、145-159位、166-176位、181-187位、189-197位、213-218位、230-237位、263-271位、285-291位、299-305位、326-346位、368-375位、390-395和1-151位;Seq ID No 240的第6-34位、48-55位、58-64位、84-101位、121-127位、143-149位、153-159位、163-170位、173-181位、216-225位、227-240位、248-254位、275-290位、349-364位、375-410位、412-418位、432-438位、445-451位、465-475位、488-496位、505-515位、558-564位、571-579位、585-595位、604-613位、626-643位、652-659位、677-686位、688-696位、702-709位、731-747位、777-795位、820-828位、836-842位、845-856位、863-868位、874-882位、900-909位、926-943位、961-976位、980-986位、992-998位、1022-1034位、1044-1074位、1085-1096位、1101-1112位、1117-1123位、1130-1147位、1181-1187位、1204-1211位、1213-1223位、1226-1239位、1242-1249位、1265-1271位、1273-1293位、1300-1308位、1361-1367位、1378-1384位、1395-1406位、1420-1428位、1439-1446位、1454-1460位、1477-1487位、1509-1520位、1526-1536位、1557-1574位、1585-1596位、1605-1617位、1621-1627位、1631-1637位、1648-1654位、1675-1689位、1692-1698位、1700-1706位、1712-1719位、1743-1756和91-263位;Seq ID No 241的第4-16位、75-90位、101-136位、138-144位、158-164位、171-177位、191-201位、214-222位、231-241位、284-290位、297-305位、311-321位、330-339位、352-369位、378-385位、403-412位、414-422位、428-435位、457-473位、503-521位、546-554位、562-568位、571-582位、589-594位、600-608位、626-635位、652-669位、687-702位、706-712位、718-724位、748-760位、770-775和261-272位;Seq ID No 242的第4-19位、30-41位、46-57位、62-68位、75-92位、126-132位、149-156位、158-168位、171-184位、187-194位、210-216位、218-238位、245-253位、306-312位、323-329位、340-351位、365-373位、384-391位、399-405位、422-432位、454-465位、471-481位、502-519位、530-541位、550-562位、566-572位、576-582位、593-599位、620-634位、637-643位、645-651位、657-664位、688-701和541-551位;Seq ID No 243的第6-11位、17-25位、53-58位、80-86位、91-99位、101-113位、123-131位、162-169位、181-188位、199-231位、245-252和84-254位;Seq ID No 244的第13-30位、71-120位、125-137位、139-145位、184-199和61-78位;Seq ID No 245的第9-30位、38-53位、63-70位、74-97位、103-150位、158-175位、183-217位、225-253位、260-268位、272-286位、290-341位、352-428位、434-450位、453-460位、469-478位、513-525位、527-534位、554-563位、586-600位、602-610位、624-640位、656-684位、707-729位、735-749位、757-763位、766-772位、779-788位、799-805位、807-815位、819-826位、831-855和568-580位;Seq ID No 246的第11-21位、29-38和5-17位;Seq ID No 247的第2-9位;Seq ID No 248的第4-10位、16-28和7-18位、26-34位;Seq ID No 249的第10-16和1-15位;Seq ID No 250的第4-11位;Seq ID No 251的第4-40位、42-51和37-53位;Seq ID No252的第4-21和22-29位;Seq ID No 253的第2-11位;9-17位、Seq IDNo 254的第32-44和1-22位;Seq ID No 255的第19-25位、27-32和15-34位;Seq ID No 256的第4-12位、15-22和11-33位;Seq ID No 257的第10-17位、24-30位、39-46位、51-70和51-61位;Seq ID No 258的第6-19位;Seq ID No 259的第6-11位、21-27位、31-54和11-29位;Seq ID No 260的第4-10位、13-45和11-35位;Seq ID No 261的第4-14位、23-32和11-35位;Seq ID No 262的第14-39位、45-51和15-29位;Seq ID No 263的第4-11位、14-28和4-17位;Seq ID No 264的第4-16和2-16位;Seq ID No 265的第4-10位、12-19位、39-50和6-22位;SeqID No 266的第2-13位;Seq ID No 267的第4-11位、22-65和3-19位;Seq ID No 268的第17-23位、30-35位、39-46位、57-62和30-49位;Seq ID No 269的第4-19和14-22位;Seq ID No 270的第2-9位;Seq IDNo 271的第7-18位、30-43和4-12位;Seq ID No 272的第4-30位、39-47和5-22位;Seq ID No 273的第6-15和14-29位;Seq ID No 274的第4-34和23-35位;Seq ID No 275的第4-36位、44-57位、65-72和14-27位;Seq ID No 276的第4-18和11-20位;Seq ID No 277的第5-19位;Seq IDNo 278的第18-36和6-20位;Seq ID No 279的第4-10位、19-34位、41-84位、96-104和50-63位;Seq ID No 280的第4-9位、19-27和8-21位;Seq ID No 281的第4-16位、18-28和22-30位;Seq ID No 282的第4-15和21-35位;Seq ID No 283的第4-17和3-13位;Seq ID No 284的第4-12和4-18位;Seq ID No 285的第4-24位、31-36和29-45位;Seq ID No 286的第12-22位、34-49和21-32位;Seq ID No 287的第4-17和22-32位;Seq ID No 288的第4-16位、25-42和7-28位;Seq ID No 289的第4-10和7-20位;Seq ID No 290的第4-11位、16-36位、39-54和28-44位;Seq ID No 291的第5-20位、29-54和14-29位;Seq ID No 292的第24-33和10-22o位;Seq ID No 293的第10-51位、54-61和43-64位;Seq ID No294的第7-13和2-17位;Seq ID No 295的第11-20和6-20位;Seq ID No296的第4-30位、34-41和19-28位;Seq ID No 297的第11-21位;Seq IDNo 298的第4-16位、21-26和9-38位;Seq ID No 299的第4-12位、15-27位、30-42位、66-72和10-24位;Seq ID No 300的第8-17和11-20位;以及Seq ID No 246的第2-19位;Seq ID No 247的第1-12位;Seq ID No248的第21-38位;Seq ID No 254的第2-22位;Seq ID No 255的第15-33位;Seq ID No 256的第11-32位;Seq ID No 259的第11-28位;Seq ID No260的第10-27位;Seq ID No 261的第9-26位;Seq ID No 263的第4-16位;Seq ID No 266的第1-18位;Seq ID No 273的第12-29位;Seq ID No276的第6-23位;Seq ID No 277的第1-21位;Seq ID No 279的第47-64位;Seq ID No 285的第28-45位;Seq ID No 287的第18-35位;Seq ID No291的第14-31位;Seq ID No 292的第7-24位;Seq ID No 299的第8-25位;Seq ID No 300的第1-20位;Seq ID No 151的第18-33位;Seq ID No151的第62-72位;Seq ID No 152的第118-131位;Seq ID No 154的第195-220位;Seq ID No 154的第215-240位;Seq ID No 154的第255-280位;Seq ID No 155的第72-81位;Seq ID No 156的第174-186位;Seq IDNo 157的第317-331位;Seq ID No 158的第35-59位;Seq ID No 158的第54-84位;Seq ID No 158的第79-104位;Seq ID No 159的第33-58位;Seq ID No 159的第81-101位;Seq ID No 159的第136-150位;Seq ID No159的第173-186位;Seq ID No 159的第231-251位;Seq ID No 161的第22-48位;Seq ID No 162的第24-39位;Seq ID No 163的第475-489位;Seq ID No 164的第38-56位;Seq ID No 164的第583-604位;Seq ID No 165的第202-223位;Seq ID No 165的第222-247位;Seq ID No 165的第242-267位;Seq ID No 165的第262-287位;Seq ID No 165的第282-307位;Seq ID No 165的第302-327位;Seq ID No 166的第25-48位;Seq IDNo 167的第204-217位;Seq ID No 168的第259-276位;Seq ID No 169的第121-139位;Seq ID No 169的第260-267位;Seq ID No 169的第215-240位;Seq ID No 170的第115-140位;Seq ID No 172的第182-204位;Seq ID No 173的第144-153位;Seq ID No 173的第205-219位;SeqID No 174的第196-206位;Seq ID No 174的第240-249位;Seq ID No 174的第272-287位;Seq ID No 174的第199-223位;Seq ID No 174的第218-237位;Seq ID No 175的第226-249位;Seq ID No 175的第287-306位;Seq ID No 176的第430-449位;Seq ID No 177的第61-375位;Seq IDNo 178的第241-260位;Seq ID No 181的第483-502位;Seq ID No 182的第379-396位;Seq ID No 184的第31-51位;Seq ID No 186的第1436-1460位;Seq ID No 186的第1455-1474位;Seq ID No 186的第1469-1487位;Seq ID No 187的第215-229位;Seq ID No 187的第534-561位;Seq ID No 187的第59-84位;Seq ID No 187的第79-104位;Seq IDNo 188的第618-635位;Seq ID No 189的第191-203位;Seq ID No 190的第386-398位;Seq ID No 191的第65-83位;Seq ID No 192的第90-105位;Seq ID No 192的第112-136位;Seq ID No 193的第290-209位;SeqID No 194的第33-50位;Seq ID No 195的第76-90位;Seq ID No 196的第70-88位;Seq ID No 197的第418-442位;Seq ID No 197的第574-585位;Seq ID No 198的第87-104位;Seq ID No 198的第124-148位;Seq IDNo 198的第141-152位;Seq ID No 199的第241-248位;Seq ID No 200的第183-198位;Seq ID No 200的第40-57位;Seq ID No 202的第202-217位;Seq ID No 203的第50-74位;Seq ID No 203的第69-93Seq ID No 203的第88-112位;Seq ID No的第203107-127位;Seq ID No 205的第74-92位;Seq ID No 206的第207-232位;Seq ID No 206的第227-252位;SeqID No 206的第247-272位;Seq ID No 207的第47-60位;Seq ID No 207的第297-305位;Seq ID No 207的第312-337位;Seq ID No 208的第667-384位;Seq ID No 210的第279-295位;Seq ID No 211的第179-198位;Seq ID No 213的第27-51位;Seq ID No 213的第46-70位;Seq ID No213的第65-89位;Seq ID No 213的第84-108位;Seq ID No 213的第112-141位;Seq ID No 215的第248-260位;Seq ID No 216的第59-78位;Seq ID No 218的第154-170位;Seq ID No 219的第57-73位;Seq ID No 220的第297-314位;Seq ID No 221的第142-157位;Seq ID No 222的第428-447位;Seq ID No 222的第573-593位;Seq ID No 223的第523-544位;Seq ID No 223的第46-70位;Seq ID No 223的第65-89位;Seq ID No223的第84-108位;Seq ID No 223的第122-151位;Seq ID No 224的第123-142位;Seq ID No 225的第903-921位;Seq ID No 226的第119-136位;Seq ID No 227的第142-161位;Seq ID No 228的第258-277位;SeqID No 228的第272-300位;Seq ID No 228的第295-322位;Seq ID No 229的第311-343位;Seq ID No 229的第278-304位;Seq ID No 230的第131-150位;Seq ID No 230的第195-218位;Seq ID No 231的第53-70位;Seq ID No 232的第184-208位;Seq ID No 232的第222-246位;Seq ID No232的第241-265位;Seq ID No 232的第260-284位;Seq ID No 232的第279-303位;Seq ID No 232的第317-341位;Seq ID No 233的第678-696位;Seq ID No 235的第88-114位;Seq ID No 235的第464-481位;Seq IDNo 236的第153-172位;Seq ID No 236的第137-155位、166-184位;Seq ID No 236的第215-228位;Seq ID No 237的第37-51位;Seq ID No 237的第53-75位;Seq ID No 237的第232-251位;Seq ID No 237的第318-336位;Seq ID No 238的第305-315位;Seq ID No 238的第131-156位;SeqID No 241的第258-275位;Seq ID No 243的第107-137位;Seq ID No 243的第138-162位;Seq ID No 243的第157-181位;Seq ID No 243的第195-227位;Seq ID No 244的第62-78位;Seq ID No 245的第567-584位。
本发明还提供了产生按照本发明的化脓链球菌超免疫血清反应性抗原或其片段的方法,包括在适当的表达系统中表达按照本发明的一个或多个核酸分子。
此外,本发明提供了用于产生表达按照本发明的化脓链球菌超免疫血清反应性抗原或其片段的细胞的方法,包括用按照本发明的载体转化或转染适当的宿主细胞。
依照本发明提供了含有本发明中所定义的超免疫血清反应性抗原或其片段或本发明中所定义的核酸分子的药物组合物,尤其是疫苗。
在优选的实施方案中,药物组合物进一步包含免疫刺激物质,优选选自包含下列各项的组:聚阳离子聚合体,尤其是聚阳离子肽;免疫刺激性脱氧核苷酸(ODNs);含至少两个赖氨酸-亮氨酸-赖氨酸基序的肽,尤其是KLKL5KLK;刺激神经组织的化合物,尤其是人生长激素;清蛋白,弗氏完全或不完全佐剂或它们的组合。
在更优选的实施方案中,免疫刺激物质是聚阳离子聚合体与免疫刺激性脱氧核苷酸的组合或含至少两个赖氨酸-亮氨酸-赖氨酸基序的肽和免疫刺激性脱氧核苷酸的组合。
在还更优选的实施方案中,聚阳离子聚合体是聚阳离子肽,尤其是多精氨酸。
依照本发明提供了按照本发明的核酸分子或按照本发明的超免疫血清反应性抗原或其片段在制备药物制剂,尤其是制备抗化脓链球菌感染的疫苗中的应用。
同此还提供了至少与按照本发明的超免疫血清反应性抗原或其片段的选择性部分结合的抗体或至少其有效部分。
在优选的实施方案中,所述抗体是单克隆抗体。
在另一优选的实施方案中,所述抗体的有效部分包含Fab片段。
在另一优选的实施方案中,所述抗体是嵌合抗体。
在更优选的实施方案中,所述抗体是人源化抗体。
本发明还提供了生产按照本发明的抗体的杂交瘤细胞系。
此外,本发明提供了生产按照本发明的抗体的方法,其特征在于以下步骤:
·按照本发明中所定义的,通过对所述动物施用超免疫血清反应性抗原或其片段在非人动物体内引发免疫应答,
·从所述动物中取出含抗体的体液,并
·通过将所述含抗体的体液进行进一步的纯化步骤生产该抗体。
此外,本发明还提供了生产按照本发明的抗体的方法,其特征在于以下步骤:
·按照本发明中所定义的,通过对所述动物施用超免疫血清反应性抗原或其片段在非人动物体内引发免疫应答,
·从所述动物体内取出脾脏或脾细胞,
·产生所述脾脏或脾细胞的杂交瘤细胞,
·选择并克隆对所述超免疫血清反应性抗原或其片段特异的杂交瘤细胞,
·通过培养所述被克隆的杂交瘤细胞和任选进一步的纯化步骤生产抗体。
依照以上方法提供或生产的抗体可用于制备治疗或预防化脓链球菌感染的药物。
依照另一方面,本发明提供了与按照本发明的超免疫血清反应性抗原或其片段结合的拮抗剂。
这样的能与按照本发明的超免疫血清反应性抗原或其片段结合的拮抗剂可用包含以下步骤的方法进行鉴定:
a)在能提供响应候选拮抗剂与所述超免疫血清反应性抗原或其片段的结合的可检测信号的组分的存在下,将按照本发明的分离的或固定的超免疫血清反应性抗原或其片段与候选的拮抗剂在允许所述候选拮抗剂结合所述超免疫血清反应性抗原或其片段的条件下结合,并
b)检测响应拮抗剂与超免疫血清反应性抗原或其片段结合所产生的信号的存在或不存在。
能降低或抑制按照本发明的超免疫血清反应性抗原或其片段与其相互作用配体之间的相互作用活性的拮抗剂可通过包含以下步骤的方法进行鉴定:
a)提供按照本发明的超免疫血清反应性抗原或其超免疫片段,
b)提供针对所述超免疫血清反应性抗原或其片段的相互作用配体,尤其是按照本发明的抗体,
c)使所述的超免疫血清反应性抗原或其片段与所述的相互作用配体相互作用形成相互作用复合物,
d)提供候选拮抗剂,
e)允许候选拮抗剂和所述的相互作用复合物之间发生竞争性反应,
f)确定候选拮抗剂是否抑制或降低了超免疫血清反应性抗原或其片段与相互作用配体之间的相互作用活性。
按照本发明的超免疫血清反应性抗原或其片段可用于分离和/或纯化和/或鉴定所述超免疫血清反应性抗原或其片段的相互作用配体。
本发明还提供了在体外诊断涉及按照本发明的超免疫血清反应性抗原或其片段的疾病的方法,包括测定编码所述的按照本发明的超免疫血清反应性抗原或片段的核酸序列的存在或按照本发明的超免疫血清反应性抗原或其片段的存在。
本发明还提供了在体外诊断细菌感染,尤其是化脓链球菌感染的方法,包括分析编码所述的按照本发明的超免疫血清反应性抗原或片段的核酸序列的存在或按照本发明的超免疫血清反应性抗原或其片段的存在。
此外,本发明提供了按照本发明的超免疫血清反应性抗原或其片段在生产结合所述超免疫血清反应性抗原或其片段的肽中的应用,其中的肽是抗促成素(anticaline)。
本发明还提供了按照本发明的超免疫血清反应性抗原或其片段在制备功能性核酸中的应用,其中的功能性核酸选自包含适体(aptamer)和spiegelmer的组。
按照本发明的核酸分子也可用于制备功能性核糖核酸,其中的功能性核糖核酸选自核酶、反义核酸和siRNA。
本发明有利地提供了一套有效、相关且全面的分离的核酸分子以及它们编码的超免疫血清反应性抗原或其片段,它们可利用来自多个人血浆库的抗体制剂和来自化脓链球菌基因组的表面表达文库从化脓链球菌中鉴定而来。因此,本发明满足了对用于制备抗体和用于鉴定有效抗化脓链球菌感染的化合物的化脓链球菌抗原、疫苗、诊断剂和产品的广泛需求。
有效的疫苗应由蛋白质或多肽组成,它们可由所有菌株表达并能诱导高亲和力的、丰富的抗化脓链球菌细胞表面组分的抗体。所述的抗体应是用于调理作用的IgG1和/或IgG3,以及用于中和粘附和毒素作用的任何IgG亚型和IgA。化学定义的疫苗必定确实优于全细胞疫苗(减毒的或灭活的),因为可除去与人组织交叉反应或抑制调理作用的化脓链球菌组分{Whitnack,E.等,1985},而且可选择诱发保护性抗体和/或保护性免疫反应的个别蛋白质。
已应用于本发明的方法是以A族链球菌蛋白质或肽与人血清中存在抗体之间的相互作用为基础的。由人免疫系统产生且存在于人血清中的抗化脓链球菌抗体是抗原性蛋白质体内表达以及它们的免疫原性的指征。此外,用预选择的血清库通过细菌表面展示表达文库鉴定的抗原性蛋白质在用单独选择或产生的血清进行的第二轮和第三轮筛选中被加工。由此本发明提供了一套有效的、相关的、全面的A族链球菌抗原作为药物组合物,尤其是预防化脓链球菌感染的疫苗。
在用于鉴定按照本发明的一组全面的抗原的抗原鉴定程序中,用数个血清库或血浆组分或含其它集合抗体的体液(抗体库)筛选了至少两个不同的细菌表面表达文库。抗体库来自血清样品集合,已针对化脓链球菌的抗原性化合物对所述集合进行了检测,诸如全细胞提取物和培养物上清蛋白质等。优选地,使用两种不同的血清集合:1.用非常稳定的抗体所有组分(repertoire):正常成人,临床健康人群,他们是非携带者且克服了先前的遭遇或目前正携带化脓链球菌但无急性疾病和症状的人群,2.由于致病生物体的存在而具有急性诱发抗体的血清集合:具不同表现的急性疾病患者(如化脓链球菌咽炎、伤口感染和菌血症)。血清必须与多个A族链球菌特异抗原反应反应,以便被认为是超免疫和因此与用于本发明的筛选方法相关。由人免疫系统产生并存在于人血清中的抗链球菌抗体是抗原性蛋白质体外表达及其免疫原性的指征。
表达文库用于本发明中时应可以表达所有潜在的抗原,例如,来自化脓链球菌所有表面蛋白质的抗原。细菌表面展示文库用于在细菌宿主膜上许多选定的外膜蛋白上展示一组(全部)A族链球菌所表达肽序列的细菌宿主重组文库代表{Georgiou,G.,1997;Etz,H.等,2001}。使用重组表达文库的优势之一在于确定的超免疫血清反应性抗原可通过表达被筛选和选择且表达超免疫血清反应性抗原的克隆的编码序列即刻产生,而无需另外的重组DNA技术或克隆步骤。
用一轮或多轮另外的筛选进一步分析根据本发明所述程序鉴定的一组全面的抗原。因此利用了抗选定的具免疫原性的肽的单个抗体制剂或抗体。依照优选的实施方案,用于第二轮筛选的单独抗体制剂来自A族链球菌急性感染患者,尤其是显示出抗体效价高于一定最低水平的患者,例如抗体效价高于被测试人(患者或健康个体)血清的80个百分点,优选高于90个百分点,尤其是高于95个百分点。在第二轮筛选中应用所述的高效价单独抗体制剂可以高选择性的鉴定来自化脓链球菌的超免疫血清反应性抗原及其片段。
在高通量的筛选步骤之后,如果不能表达于原核表达系统中则可表达为重组蛋白或体外翻译产物的选定抗原性蛋白或者已被鉴定的抗原性肽(合成产生)在第二轮筛选中用巨大的人血清集合(>100名未感染者,>50名患者血清)通过一系列ELISA和蛋白质印迹测定进行检测评估其免疫原性。
重要的是单独的抗体制剂(也可以是选定的血清)可以从来自第一轮筛选的所有有希望候选者中选择性的鉴定超免疫血清反应性抗原。因此,在第二轮筛选中应优选至少10种单独的抗体制剂(即,来自感染选定病原体的至少10名不同个体的抗体制剂(如血清))用于鉴定这些抗原。当然,还有可能利用少于10种的单独制剂,不过,利用少数单独抗体制剂得到的步骤的选择性可能不是最佳的。另一方面,如果给定的超免疫血清反应性抗原(或其抗原性片段)被至少10种单独的抗体制剂所识别,优选至少30种,尤其是至少50种单独的抗体制剂识别,超免疫血清反应性抗原鉴定的选择性对于进行正确的鉴定而言也已足够。当然,超免疫血清反应性可用尽可能多的单独制剂进行检测(如,多于100或甚至多于1000)。
因此,按照本发明方法的超免疫血清反应性抗体制剂的相关部分应优选至少10种,更优选至少30种,尤其是至少50种单独的抗体制剂。备选地(或联合的)超免疫血清反应性抗原还可用第二轮筛选中所用所有单独抗体制剂的至少20%、优选至少30%、尤其是至少40%进行鉴定。
依照本发明某一优选的实施方案,从其中制备出用于第二轮筛选的单独抗体制剂的血清(或自身被用作抗体制剂)是根据其抗化脓链球菌的效价(如,抗此病原体的制剂,诸如裂解物、细胞壁组分和重组蛋白)进行选择的。优选地,当整个生物体(总裂解物或全细胞)被用作ELISA中的抗原时,选择总IgA效价高于4000U的、尤其是高于6000U的以及/或IgG效价高于10000U、尤其是高于12000U的那些生物体(U=单位,在给定稀释度下的OD405nm读数计算而得)。
人免疫系统所产生且存在于人血清中的抗链球菌抗体是抗原性蛋白质体内表达及其免疫原性的指征。抗体对线性表位的识别可能是以短到4-5个氨基酸长的序列为基础的。当然这并不一定意味着这些短肽能在体内产生所述的给定抗体。为此进一步在动物内(主要是在小鼠内)检测所限定表位、多肽和蛋白质在体内诱发抗选定蛋白质的抗体的能力。
优选的抗原定位于细胞表面或被分泌且因而易于到达细胞外。抗细胞壁蛋白质抗体预计用于两个目的:抑制粘附并促进胞噬作用。抗被分泌蛋白质的抗体在对其毒素或毒性组分功能的中和作用中是有利的。还已知的是细菌通过分泌蛋白质相互交流。中和抗这些蛋白质的抗体可阻断链球菌种属之间或之内的生长促进交流对话。生物信息分析(信号序列、细胞壁定位信号、跨膜结构域)被证实对评估细胞表面定位或分泌作用非常有用。实验方法包括分离具相应表位的抗体和来自人血清的蛋白质,并在小鼠中产生针对通过细菌表面展示筛选所选定的(多)肽的免疫血清。然后将这些血清作为以下检测的试剂用于第三轮筛选中:在不同条件下生长的A族链球菌的细胞表面染色(FACS,显微镜观察),测定中和能力(毒素、粘附)以及促进调理作用和胞噬作用(体外胞噬作用检测)。
为此目的,细菌中的大肠杆菌克隆被直接注射入小鼠中,采集免疫血清并在相应的体外试验中检测功能性的调理或中和抗体。或者,特异的抗体可以肽或蛋白质作为底物纯化自人或小鼠血清。
宿主抗化脓链球菌的防卫性主要依赖于先天的免疫机制。通过接种疫苗诱发调理型和中和型的高亲和力抗体可帮助先天的免疫系统清除细菌和毒素。这使得按照本发明的方法成为鉴定A族链球菌抗原性蛋白质的最适工具。
皮肤和黏膜是抗链球菌入侵的强大屏障。不过,一旦皮肤或黏膜破裂,非适应性的细胞防卫第一道防线通过补体和巨噬细胞、尤其是多形核白细胞(PMNs)开始联合作用。这些细胞可被认为是清除入侵细菌的基石。由于A族链球菌起初是胞外病原体,所以主要的抗链球菌适应性反应来自免疫系统的体液防卫装备且通过三种主要的机制介导:调理作用的促进、毒素中和作用和粘附的抑制。现认为调理作用尤为重要,因为它是有效的胞噬作用所需要的。为了进行有效的调理,微生物的表面必须用抗体和补体因子包被以便PMNs通过受体识别IgG分子的Fc片段或被活化的C3b。经调理作用后,链球菌被胞噬并处死。结合细菌细胞表面特异抗原的抗体作为配体用于附着PMNs并促进胞噬作用。与粘附素和其它细胞表面蛋白结合的非常相似的抗体被预期可中和粘附作用并预防定植。本发明所提供的抗原的选择因此非常适于鉴定在动物模型或人中导致抗感染防卫作用的那些抗原。
依照本文所用的抗原鉴定方法,如下所述,特别是,本发明可令人惊讶的提供化脓链球菌的一套全面的新核酸和新的超免疫血清反应性抗原及其片段。根据某一方面,本发明特别涉及编码超免疫血清反应性抗原且具有序列表Seq ID No:1-150中所列出序列的核苷酸序列以及序列表SeqID No 151-300所列出的代表超免疫血清反应性抗原的相应编码氨基酸序列。
在本发明的优选实施方案中,提供的核酸分子其全长展示出与Seq IDNo 1,4-8,10-18,20,22,24-32,34-35,38-40,43-46,49-51,53-54,57-61,63,65-71,73,75-77,81-82,88,91-94和96-150所列核苷酸序列具有70%的同一性。最优选的核酸包含了全长与Seq ID No 1,4-8,10-18,20,22,24-32,34-35,38-40,43-46,49-51,53-54,57-61,63,65-71,73,75-77,81-82,88,91-94和96-150所列的核酸分子具有至少80%或至少85%同一性的区域。在这点上,特别优选全长与上述序列具有至少90%、91%、92%、93%、94%、95%或96%同一性的核酸分子。而且,特别优选至少具有97%同一性的那些核酸分子,尤其优选至少98%和至少99%的同一性,更优选至少99%或99.5%,特别优选100%的同一性。此外,在这方面优选的实施方案是编码超免疫血清反应性抗原或其片段(多肽)的核酸,所述的超免疫血清反应性抗原或其片段保持与由序列Seq ID No 1,4-8,10-18,20,22,24-32,34-35,38-40,43-46,49-51,53-54,57-61,63,65-71,73,75-77,81-82,88,91-94和96-150所列的所述核酸编码的成熟多肽基本上具有相同的生物学功能或活性。
正如本领域已知且此处所用的,同一性是两个或多个多肽序列或者两个或多个多核苷酸序列之间的关系,这是通过比较这些序列确定的。在本领域内,同一性也意味着多肽或多核苷酸序列之间的序列相关程度,情形可能是通过在所述序列行与行之间进行比对确定的。同一性可方便的计算。虽然存在许多方法可以检测两个多核苷酸或两个多肽序列之间的同一性,但此术语对技术熟炼人员而言是众所周知的(如,分子生物学中的序列分析Sequence Analysis in Molecular Biology,von Heinje,G.,AcademicPress,1987)。优选的测定同一性的方法是设计成能给出待测序列之间最大的匹配程度。确定同一性的方法被编成了计算机程序。测定两个序列之间同一性的优选计算机程序法包括,但不局限于,GCG软件包{Devereux,J.等,1984}、BLASTP、BLASTN和FASTA{Altschul,S.等,1990}。
依照本发明的另一方面,提供了展示出与Seq ID No 64所列出的核酸序列具有至少96%同一性的核酸分子。
依照本发明的另一方面,提出了与Seq ID No 3,36,47-48,55,62,72,80,84,95所列出的核酸序列相同的核酸分子。
按照本发明的核酸分子可作为与上文所述第一个备选核酸至少基本上互补的第二个备选的核酸分子。用于此处时,互补意味着核酸链通过Watson-Crick碱基配对原则与第二条核酸链的碱基配对。基本上互补用于此处时意味着碱基配对并非存在于各自链的所有碱基之间,而是剩余一定数目或百分比的不配对碱基或错配碱基。正确配对的碱基百分率优选至少70%,更优选至少80%,还更优选至少90%,最优选高于90%的任一百分率。应提及的是70%比例的碱基匹配时被认为是同源的且具此程度匹配碱基的杂交被认为是严谨的。此类严谨杂交的杂交条件参阅分子生物学通用方法Current Protocols in Molecular Biology(John Wiley and Sons,Inc.,1987)。更具体而言,杂交条件如下:
·例如,在5x SSPE、5x Denhardt氏试剂、0.1%SDS、100g/mL剪切DNA中于68℃进行杂交
·在0.2xSSC、0.1%SDS中于42℃进行中度严谨洗涤
·在0.1xSSC、0.1%SDS于68℃进行高严谨性洗涤。
GC含量为50%的基因组DNA的TM近似96℃。相对于1%的错配而言,TM下降约1℃。
此外,本文所述的任何别的杂交条件原则上也是适用的。
当然,编码与本发明所鉴定分子相同的多肽分子的所有核酸序列分子都可包含在给定编码序列的任何部分内,因为遗传密码的简并性是直接可应用于明确测定的且编码给定多肽分子的所有可能性核酸分子,即使所述的简并核酸分子的数目可能是高的也是如此。这还可适用于给定多肽的片段,只要该片段编码多肽适用于疫苗接种即可,如作为主动或被动疫苗。
按照本发明的核酸分子可作为第三个备选的核酸分子,它包含核酸分子的一段至少15个碱基与上述按照本发明的第一个和第二个备选核酸分子一致。优选的所述碱基形成邻近的碱基伸展段(stretch)。不过,由许多碱基分隔开的两个或多个部分组成的伸展段也在本发明的范围内。
按照本发明的核酸分子也可用作第四个备选的核酸分子,它在严谨杂交条件下与符合上述第一、第二和第三备选方案的任一本发明核酸分子退火。严谨杂交条件通常是本文所述的条件。
最后,按照本发明的核酸分子可用作第五个备选的核酸分子,若非遗传密码的简并性,可与符合上述第一、第二和第三备选方案的任一本发明核酸分子的任一核酸分子杂交。此类核酸分子是指事实,即优选按照本发明的核酸编码按照本发明的超免疫血清反应性抗原或其片段。此类核酸分子可特别用于检测按照本发明的核酸分子并从而诊断诸如化脓链球菌等相应的微生物以及涉及此类微生物的任何疾病或发病状况。优选地,杂交可在与上述第四个备选方案相关的所述严谨条件下发生或完成。
本文所用的核酸分子通常指任何核糖核酸分子或脱氧核糖核酸分子,它们可以是未修饰的RNA或DNA或修饰过的RNA或DNA。因此,例如,尤其是,本文所用的核酸分子指单链和双链DNA、作为单链和双链RNA混合物的DNA以及作为单链和双链区域混合物的RNA,含有DNA或RNA的可能是单链或更通常是双链或三链的杂合分子或单链和双链区域的混合物。此外,用于此处时核酸分子涉及包含RNA或DNA或兼有RNA和DNA二者的三链区域。在所述区域内的链可能来自同一分子或来自不同的分子。这些区域可包含所有的一个或多个分子,但更通常是只涉及某些分子的一个区域。三螺旋区域的分子之一常常是寡核苷酸。用于此处时,术语核酸分子包括含有一个或多个修饰碱基的上述DNA或RNA。因此,由于稳定性或其它原因而其骨干被修饰的DNA或RNA是本文提及术语时所指的“核酸分子”。此外,含诸如肌苷等稀有碱基或诸如三苯甲基化碱基等修饰碱基(只是其中的两个例子)的DNA或RNA是该术语用于此处时所指的核酸分子。还应理解的是为了达到许多本领域技术人员已知的有益的目的而对DNA和RNA进行了多种类型的修饰。术语核酸分子用于此处时包含化学、酶促或代谢修饰形式的核酸分子以及病毒和细胞的化学形式DNA和RNA特性,其中包括简单和复杂细胞。术语核酸分子还包含常常被称为寡核苷酸的短核酸分子。“寡核苷酸”和“核酸”或“核酸分子”在此常常交换使用。
本发明中所提供的核酸分子还包括许多单独的片段,长于和短于化脓链球菌编码区序列表中所列出的核酸分子序列都可,它们可通过标准的克隆方法产生。为了达到唯一性,片段必须有足够长度以将其与其它已知的核酸序列区分开来,通过将任何选定的化脓链球菌片段与诸如GenBank等计算机数据库中的核苷酸序列进行比较可最方便的确定。
此外,可以对本发明所包含的核酸分子和多肽进行修饰。例如,可以进行不会影响核酸所编码多肽的核苷酸替代,因此编码超免疫血清反应性抗原或其片段的任何核酸分子都包含在本发明范围内。
而且,可以利用诸如标准的克隆技术等标准技术将编码本发明所提供超免疫血清反应性抗原或其片段的任一核酸分子与预期的调控序列(无论是化脓链球菌调控序列或异源的调控序列都可)、异源前导序列、异源标记序列或异源编码序列进行功能型连接以产生融合蛋白。
本发明的核酸分子可以是通过克隆获得或通过化学合成技术产生或二者联合方法获得的诸如mRNA或cRNA等RNA形式或包括例如cDNA和基因组DNA在内的DNA形式。所述DNA可以是三链、双链或单链的。单链DNA可以是编码链,也已知为有义链,或者可以是非编码链,也称为反义链。
本发明进一步涉及本文上述核酸分子的变体,它们编码具有序列表中所列出的推断化脓链球菌的氨基酸序列的超免疫血清反应性抗原和其片段的片段、类似物及衍生物。核酸分子变体可以是天然存在的变体,诸如天然存在的等位基因变体,或者可以是未知天然存在的变体。所述的核酸分子非天然存在变体可以通过诱变技术制备,包括应用于核酸分子、细胞或生物体的那些诱变技术。
在变体中这方面的变体是通过核苷酸替代、缺失或添加而不同于上述核酸分子的变体。替代、缺失或添加可涉及一个或多个核苷酸。所述变体可以改变于编码区内或非编码区内或二者都有所改变。编码区的改造可能产生保守或非保守性氨基酸替代、缺失或添加。优选的是编码具有序列表中所提化脓链球菌序列的变体、类似物、衍生物或片段或者片段的变体、类似物或衍生物的核酸分子,其中数个、一些、5-10个、1-5个、1-3个、2个、1个或无氨基酸以任一组合形式被替代、缺失或插入。其中尤其优选沉默替代、添加和缺失,它们不改变序列表中所列化脓链球菌多肽的特征和活性。在这点上还特别优选保守性替代。
按照本发明的肽和片段还包括修饰的表位以及编码所述修饰表位的核酸序列,其中优选给定表位的一个或多个氨基酸根据上述例子中的原则被修饰或置换。
同时还清楚的是,通过提高、保留或至少不显著阻碍所述表位的T细胞活化能力的氨基酸调换来自本发明表位的表位也在按照本发明的表位范围内。因此本发明的表位还覆盖了不包含化脓链球菌来源的原始序列但触发相同的或优选提高了的T细胞应答的表位。这些表位被称为“不规则变化的”,它们需要具有对MHC/HLA分子相似的或优选更大的亲合力,还需要具有以相似或优选更强的方式将T细胞受体(TCR)定向于原始表位的能力。
不规则变化表位可通过合理的设计获得,即,如{Rammensee,H.等,1999}所述,考虑各个残基对结合MHC/HLA的贡献,联合与TCR潜在相互作用的残基的系统性交换并用被定向针对原始表位的T细胞检测所产生序列。这样的设计对于本领域技术人员而言是可能的而无需过多的实验。
另一可能性包括用定向针对原始表位的T细胞筛选肽库。优选的方式是合成肽库的定位扫描。所述方法已详述于{Hemmer,B.等,1999}和本文所给定文献中。
除了由本发明来源氨基酸序列表示的表位或不规则变化表位之外,还可应用模拟这些表位的物质,如“肽模拟物”或“反-逆-肽(retro-inverso-peptides)”。
改良表位设计的另一方面是用增加其刺激T细胞能力的物质进行它们的配制或修饰。这些包括T辅助细胞表位、脂类或脂质体或WO 01/78767中所述的优选修饰。
增加表位的T细胞刺激能力的另一方式将它们与免疫刺激物质配制在一起,例如细胞因子或趋化因子样白介素-2、-7、-12、-18,I类和II类干扰素(IFN),尤其是γ-IFN、GM-CSF、α-TNF、flt3配体及其他。
正如本文关于本发明核酸分子检测所另外论及的,例如,上述本发明核酸分子可用作针对RNA、cDNA和基因组DNA的杂交探针用于分离编码本发明多肽的全长cDNAs和基因组克隆,以及用于分离与本发明核酸分子具有高度序列相似性的其它基因的cDNA和基因组克隆。所述的探针通常包含至少15个碱基。优选地,所述探针具有至少20个、至少25个或至少30个碱基,还可能具有至少50个碱基。尤其优选的探针具有至少30个碱基,和具有50个或少于50个的碱基,诸如30、35、40、45或50个碱基。
例如,本发明核酸分子的编码区可通过用已知的DNA序列合成寡核苷酸探针筛选有关的文库而被分离。具有与本发明基因序列互补的序列的已标记寡核苷酸然后被用于筛选cDNA、基因组DNA或mRNA文库以确定探针与文库中的哪一个成员杂交。
正如本文关于核酸分子试验所进一步讨论的,其中,本发明的核酸分子和多肽可用作试剂和材料用于研发疾病,尤其是人的疾病的治疗和诊断。
寡核苷酸形式的本发明核酸分子可用于本文所述方法中,但优选用于PCR,以确定此处鉴定的化脓链球菌基因是否全部或部分存在于和/或转录于诸如血液等受感染组织中。公认的,所述序列还可用于诊断病原体已达到的感染阶段和感染类型。为此目的和其它目的,可使用至少包含按照本发明的核酸之一的阵列。
按照本发明的核酸分子可用于检测核酸分子和含这些核酸分子的生物体或样品。优选所述检测是用于诊断的,更优选用于诊断涉及或与化脓链球菌的存在或富集有关的疾病。
可用各种技术在DNA水平检测感染了化脓链球菌的真核细胞(此处也称“个体”),特别是哺乳动物,尤其是人。用于将化脓链球菌从其它生物体中辨别出来的优选候选物是可以获得的。
本发明提供了诊断化脓链球菌感染所引起疾病的方法,包括从分离或来自某一个体的样品中测定具有序列表中所列出的核酸分子序列的核酸分子表达水平的增加。核酸分子的表达可以用任何本领域已知的核酸分子定量方法进行检测,例如,PCR、RT-PCR、核糖核酸酶保护、RNA印迹、其它的杂交方法以及本文所述的阵列。
分离的用于此处是指“人为的”将其从自身的天然状态中隔离出来,即,如果它存在于自然界中,那么它已被改变或从其最初的环境中取走,或二者兼具。当该术语用于此处时,例如,在其天然状态下天然存在于活的生物体内的天然存在核酸分子或多肽不是“分离的”,但从其天然状态共存物质中隔离出来的同一核酸分子或多肽就是“分离的”。作为分离的一部分或分离后,所述核酸分子可与诸如DNA等其它核酸分子结合,例如,为了诱变形成融合蛋白,以及为了繁殖或表达于宿主中。分离的核酸分子,独自或与诸如载体等其它核酸分子结合,可引入培养物或完整生物体的宿主细胞内。该术语用于此处时,当引入培养物中或完整生物体的宿主细胞中时,所述DNA仍然是分离的,因为它们不会是处于其天然存在形式或环境中。同样的,核酸分子和多肽可存在于组合物中,诸如培养基制剂、将核酸分子或多肽引入例如细胞中的溶液、化学或酶促反应的组合物或溶液,它们不是天然存在的组合物且其中保留了该术语用于此处时所具涵义的分离的核酸分子或多肽。
按照本发明的核酸可化学合成。或者,所述核酸可用本领域技术人员已知的方法分离自化脓链球菌。
依照本发明的另一方面,用此处所述的抗原鉴定方法提供了一套全面的、新的超免疫血清反应性抗原和其片段。在优选的本发明实施方案中,提供了含有此处所述任一核酸分子编码的氨基酸序列的超免疫血清反应性抗原及其片段。在本发明的另一优选实施方案中,提供了所含氨基酸序列选自Seq ID No 151,154-158,160-168,170,172,174-182,184-185,188-190,193-196,199-201,203-204,207-211,213,215-221,223,225-227,231-232,238,241-244和246-300所表示多肽序列的一组新的超免疫血清反应性抗原及其片段。在本发明进一步优选的实施方案中,提供了所含氨基酸序列选自Seq ID No 214中所示多肽序列的超免疫血清反应性抗原及其片段。在本发明更优选的实施方案中,提供了所含氨基酸序列选自SeqID No 153,186,197-198,205,212,222,230,234,245中所示多肽序列的超免疫血清反应性抗原及其片段。
本发明中所提供的超免疫血清反应性抗原及其片段包括序列表中所列出的任何多肽以及与序列表中所提出多肽具有至少70%同一性的多肽,优选与序列表中所提出多肽具有至少80%或85%的同一性、更优选与序列表中所提出多肽具有至少90%的相似性(更优选至少90%的同一性)、还更优选与序列表中所提出多肽具有至少95%、96%、97%、98%、99%或99.5%的相似性(更优选至少95%、96%、97%、98%、99%或99.5%的同一性)的多肽,还包括具有该多肽所述部分的所述多肽部分,该多肽的所述部分通常含至少4个氨基酸,更优选至少8个,还更优选至少30个,更优选至少50个氨基酸,诸如4、8、10、20、30、35、40、45或50个氨基酸。
本发明还涉及这些超免疫血清反应性抗原及其片段的片段、类似物和衍生物。术语“片段”、“衍生物”和“类似物”在涉及其氨基酸序列列于序列表中的抗原时,指基本上保持与所述超免疫血清反应性抗原及其片段相同的生物学功能或活性的多肽。
超免疫血清反应性抗原及其片段的片段、衍生物或类似物可能是1)其中一个或多个氨基酸残基被保守或不保守氨基酸残基替代(优选保守的氨基酸残基)且所述的替代的氨基酸残基可能是或可能不是由该遗传密码编码的,或2)其中一个或多个氨基酸残基包含一替代基团,或3)其中成熟的超免疫血清反应性抗原或其片段与另一化合物融合,诸如延长超免疫血清反应性抗原及其片段半寿期的化合物(例如,聚乙二醇),或4)其中附加的氨基酸残基与成熟的超免疫血清反应性抗原或其片段融合,诸如前导序列或分泌序列或用于纯化成熟的超免疫血清反应性抗原及其片段的序列或前蛋白质序列。所述片段、衍生物和类似物被认为对本领域技术人员而言在本发明的范围内。
本发明还涉及不同化脓链球菌分离株的抗原。所述的同源物可以此处公开的核酸和氨基酸序列为基础方便的分离。迄今为止已分清的有80种以上的M蛋白血清型,且此分型是以emm基因5’端的可变区为基础进行的(参阅,例如Vitali等2002)。因此任一抗原的存在都可针对每一种M血清型来确定。此外还可能按照针对sic基因所述的确定各种M血清型中特殊抗原的可变性(Hoe等,2001)。各种M血清型对其引起疾病种类的影响总结于最近的综述中(Cunningham,2000)。具体而言,两组血清型可被区分:
1)引起咽炎和猩红热的血清型(如,M型1,3,5,6,14,18,19,24)
2)引起脓皮病和链球菌导致的皮肤感染的血清型(如,M型2,49,57,59,60,61)
这可作为鉴定用作疫苗或通常用作靶向特定疾病的药物的适合性的基础。
来自例如CDC(http://www.cdc.gov/ncidod/biotech/strep/emmtypes.htm)主页的信息给出了显示各种M血清型关系的系统树图。另外的相关文献有:Vitali等,Journal of Clinical Microbiology 40:679-681.(2002)(分子emm分型方法),Enright等,Infection and Immunity69:2416-2427.(2001)(可供选择的分子分型方法alternative molecular typing method(MLST)),Hoe等,The Journal of Infectious Diseases 183:633-639.(2001)(在许多不同的血清型中某一抗原(sic)变化的例子example for the variation of oneantigen(sic)in many different serotypes)以及Cunningham,CLINICALMICROBIOLOGY REVIEWS 13:470-511.(2000)(关于GAS发病机理的综述review on GAS pathogenesis)。所有的emm型都完整列出并可下载自上述网址。
系统树图是通过以下软件的顺序使用构建的:Wisconsin PackageVersion 10.1、Genetics Computer Group(GCG)、Madison programs Pileup,Distances和Growtree。基本上,信号序列的22个残基加83个附加N末端残基被用于包括来自数据库的选定序列在内的序列比对。选定的序列包括编号103-124的新的emm(如下表中所述)以及它们的最接近的“传统的”M蛋白匹配序列。尽管此分析局限于C末端是被任意截短的,这在将不透明因子阳性株系M序列的分支与不透明因子阴性株系M序列分隔开的系统树图中仍是一种典型的结果。
emm型/先前的命名-GenBank登录号-在哪一国家被分离-最接近的N末端M蛋白序列匹配程度(%同一性):
emm103/st2034 U74320 PNG,Bra,Egy,Mal,Nep,NZ,US M87(66%)
emm104/st2034AF056300PNG,Egy,Mal,Nep,NZ,US M66(72%)
emm105/st4529AF060227Mal,Nep,NZ,US M5(45%)
emm106/st4532AF077666Mal,Egy,Iran,Nep M27G(71%)
emm107/st4264AF163686Mal,NZ M25(52%)
emm108/st4547AF052426Mal,Bra,Egy,Ira,NZ M70(84%)
emm109/st3018 AF077667 Mal,Egy,NZ M28(74%)
emm110/st4935U92492Ind,Bul,NZ,Rus,US M13(60%)
emm111/st4973AF128960Ind,Bra,Nep,US M80(40%)
emm112/stCmuk16AF091806Thi,Bra,Rus,US M27L/77(59%)
emm113/st2267AF078068NZ,Thai,Chi M13(50%)
emm114/st2967U50338US,Can,Gam,NZ,PNG M73(80%)
emm115/st2980AF028712US,Bra,Rus M36(64%)
emm116/st2370AF156180US,Nep,NZ M52(60%)
emm117/st436AF058801US M13(59%)
emm118/st448AF058802US,Bra,Egy,Nep,NZ M49(79%)
emm119/st3365AF083874US,Br,Nep M52(59%)
emm120/st1135AF296181Egy M56(78%)
emm121/st1161AF296182Egy M64(64%)
emm122/st1432AF222860Egy,Rus,Nep M18(40%)
emm123/st6949AF213451Arg,US,NZM80(68%)
st1160/emm124AF149048and AF018178Egy,Mal,NZM2(82%)
缩写:Arg,阿根廷;Bra,巴西;Bul,保加利亚;Can,加拿大;Chi,智利;Egy,埃及;Gam,冈比亚;Ind,印度;Ira,伊朗;Mal,马来西亚;Nep,尼泊尔;NZ,新西兰;PNG,巴布亚新几内亚;Thi,泰国;Rus,俄罗斯;US,美国。%:最接近的成熟M蛋白序列与来自血清学表征Lancefield类型的预测50个成熟N末端残基相比。
emm类型和序列类型:
在许多情形中emm序列参照株系直接来自Rebecca Lancefield博士的M类型保藏中心。所述的株系被命名为RCL。
以“emm”开始的序列表明用此类型代表的分离株已经过除CDC链球菌实验室之外的数个对照实验室分析。emm94至emm124中每一“新的”emm型都是由回收自严重发病状态的多个独立分离株代表的,是用国际GAS对照实验室可获得的所有分型血清贮液都不可分型的M蛋白,并且通过在正常人血液中的繁殖证实了其体外抗噬菌细胞的特性。具有以“st”(序列类型)开始的emm序列的株系还未被所有参照实验室完全确认。
GAS遗传学:
长期以来已知针对血清不透明因子阳性(SOF+)株系的抗血清以株系特异的方式抑制OF活性。因此,从GAS不透明因子阳性株系中分析出代表至少60种单独sof基因的500-2700个碱基的sof(血清不透明因子)基因可变区(有趣的是,通常在OF阴性emm12分离株和emm/M类型12对照株中找到类似物)。已发现sof基因序列也在不同GAS株系中显著可变,尽管它们在emm类型中通常是非常保守的。因此重要的株系包括emm1,emm100,emm101,emm102,emm103,emm104,emm105,emm106,emm107,emm108,emm109,emm11,emm110,emm111,emm112,emm113,emm114,emm115,emm116,emm117,emm118,emm119,emm12,emm120,emm121,emm122,emm123,emm124,emm13L,emm14,emm15,emm17,emm18,emm19,emm2,emm22,emm23,emm24,emm25,emm26,emm27G,emm28,emm29,emm3,emm30,emm31,emm32,emm33,emm34,emm36,emm37,emm38,emm39,emm4,emm40,emm41,emm42,emm43,emm44,emm46,emm47,emm48,emm49,emm5,emm50,emm51,emm52,emm53,emm54,emm55,emm56,emm57,emm58,emm59,emm6,emm60,emm61,emm62,emm63,emm64,emm65,emm66,emm67,emm68,mm69,emm70,emm71,emm72,emm73,emm74,emm75,emm76,emm77,emm78,emm79,emm8,emm80,emm81,emm82,emm83,emm84,emm85,emm86,emm87,emm88,emm89,emm9,emm90,emm91,emm92,emm93,emm94,emm95,emm96,emm97,emm98,emm99,st1389,st1731,st1759,st1815,st1967,st1969,st1rp31,st11014,st2037,st204,st211,st213,st2147,st1207,st245,st2460,st2461,st2463,st2904,st2911,st2917,st2926,st2940,st369,st3757,st3765,st3850,st5282,st6735,st7700,st809,st833,st854,st980584,stck249,stck401,std432,std631,std633,stIL103,stIL62,stns292,stns554,sts104,stc1400,stc1741,stc36,stc3852,stc5344,stc5345,stc57,stc6979,stc74a,stc839,stg10,stg11,stg1389,stg166b,stg1750,stg2078,stg3390,stg4222,stg4545,stg480,stg4831,stg485,stg4974,stg5063,stg6,stg62647,stg643,stg652,stg653,stg663,stg840,stg93464,stg97,stL1376,stL1929和stL2764。
在本发明特别优选的实施方案中有关这方面的是序列表中列举的超免疫血清反应性抗原,其变体、类似物、衍生物和片段,以及片段的变体、类似物和衍生物。此外,含有所述超免疫血清反应性抗原、其变体、类似物、衍生物和片段以及片段的变体、类似物和衍生物的融合多肽也包括在本发明中。所述的融合多肽和蛋白质以及编码它们的核酸分子可用标准技术方便的制备,包括用于产生和表达编码融合蛋白的重组多核苷酸的标准重组技术。
优选的变体是那些通过保守氨基酸替换从参照株系改变而来的变体。所述替代是用相似特性的另一氨基酸替代多肽中给定的氨基酸。通常被看做保守替代的是脂肪族氨基酸丙氨酸、缬氨酸、亮氨酸和异亮氨酸相互间的置换,羟基残基丝氨酸和苏氨酸之间的交换,酸性残基天冬氨酸和谷氨酸之间的调换,氨基残基天冬酰胺和谷氨酰胺之间的替代,碱性残基赖氨酸和精氨酸之间的交换和芳香族残基苯丙氨酸和酪氨酸之间的置换。
在这方面更特别优选的是具有序列表中列举的任一多肽的氨基酸序列的变体、类似物、衍生物和片段以及片段的变体、类似物和衍生物,其中数个、一些、5-10个、1-5个、1-3个、2个、1个或无氨基酸残基以任何组合方式被替代、缺失或插入。其中特别优选的不改变本发明多肽特征和活性的沉默替代、插入和缺失。在这点上还特别优选的是保守性替代。最优选的是具有序列表中所列举氨基酸序列而且无替代的多肽。特别适合的氨基酸替代是按照本申请书的序列表中所公开序列的同源物中所包含的那些替代。因此本文所公开的抗原或表位的适当序列衍生物包括存在于一个或多个化脓链球菌株系或血清型中的一种或多种变异(优选以所述同源变异为基础的1、2、3、4、5、6、7、8、9或10个氨基酸交换)。所述抗原包含序列可能是天然存在序列或新产生的人造序列。这些优选的抗原变体是以所述的天然存在序列变异为基础的,例如,形成针对按照本发明的多肽抗原区的“掌控序列”。所述同源变异或交换的适当例子参阅实施例部分的表5。例如,某一给定的化脓链球菌序列可通过涉及所述的一种或多种变异被改进从而产生此给定(天然存在)抗原或表位序列的人造(即,非天然存在)的变体。
本发明的超免疫血清反应性抗原及其片段优选以分离的形式提供,且优选纯化至均一。
也属于本发明优选的实施方案的是含有具有序列表中所列举氨基酸序列的多肽片段以及序列表中所列举多肽的变体和衍生物片段的多肽。
在这方面所述片段是具有与部分而非所有上述超免疫血清反应性抗原和它的片段以及变体或衍生物、类似物及其片段完全相同的氨基酸序列的多肽。所述片段可能是“独立的”,即,并非其它氨基酸或多肽的一部分或与它们相融合,或者它们可包含于较大的多肽中形成其中的一部分或区域。在本发明的这方面还优选的是通过本发明多肽的结构或功能特性表征的片段,即,含有本发明多肽的α-螺旋和α-螺旋形成区、β-折叠和β-折叠形成区、转角和转角形成区、卷曲和卷曲形成区、亲水区、疏水区、α两性分子区、β两性分子区、可变区、表面形成区、底物结合区和高抗原性指示区的片段以及所述片段的组合。优选的区域是介导本发明的超免疫血清反应性抗原及其片段活性的那些区域。在这点上最优选的是具有本发明超免疫血清反应性抗原及其片段的化学、生物学或其它活性的片段,包括那些具有相似的活性或改良的活性或不合需要的活性有所降低的片段。尤其优选的是含酶受体或结构域的片段,所述酶具有化脓链球菌生存或在人体内引发疾病所必需的功能。更优选的多肽片段是包括或含有动物(尤其是人)中的抗原性或免疫原性决定簇的那些多肽片段。
抗原性片段被定义为经鉴定本身可作为抗原或当作为半抗原时可制备抗原的抗原片段。因此,显示出一个或(对于较长片段而言)只有一些氨基酸交换的抗原或抗原片段也能用本发明激活,条件是具有氨基酸交换的所述片段的抗原能力并未因该交换而严重受损即可,即,适于在以此抗原进行免疫接种的个体中引起恰当的免疫反应并用来自个体血清的个体抗体制剂进行鉴定。
所述超免疫血清反应性抗原片段的优选例子选自含有表1栏“预测免疫原性氨基酸”和“已鉴定的免疫原性区域的位置”的氨基酸序列、表2血清反应性表位的肽,尤其是含以下区段氨基酸序列的肽:Seq ID No 151的第4-44位、57-65位、67-98位、101-107位、109-125位、131-144位、146-159位、168-173位、181-186位、191-200位、206-213位、229-245位、261-269位、288-301位、304-317位、323-328位、350-361位、374-384位、388-407位、416-425和1-114位;Seq ID No 152的第5-17位、49-64位、77-82位、87-98位、118-125位、127-140位、142-150位、153-159位、191-207位、212-218位、226-270位、274-287位、297-306位、325-331位、340-347位、352-369位、377-382位、390-395和29-226位;Seq ID No 153的第4-16位、20-26位、32-74位、76-87位、93-108位、116-141位、148-162位、165-180位、206-219位、221-228位、230-236位、239-245位、257-268位、313-328位、330-335位、353-359位、367-375位、394-403位、414-434位、437-444位、446-453位、456-464位、478-487位、526-535位、541-552位、568-575位、577-584位、589-598位、610-618位、624-643位、653-665位、667-681位、697-718位、730-748位、755-761位、773-794位、806-821位、823-831位、837-845位、862-877位、879-889位、896-919位、924-930位、935-940位、947-955位、959-964位、969-986位、991-1002位、1012-1036位、1047-1056位、1067-1073位、1079-1085位、1088-1111位、1130-1135位、1148-1164位、1166-1173位、1185-1192位、1244-1254和919-929位;Seq ID No 154的第5-44位、62-74位、78-83位、99-105位、107-113位、124-134位、161-174位、176-194位、203-211位、216-237位、241-247位、253-266位、272-299位、323-349位、353-360和145-305位;Seq ID No 155的第15-39位、52-61位、72-81位、92-97和71-81位;Seq ID No 156的第13-19位、21-31位、40-108位、115-122位、125-140位、158-180位、187-203位、210-223位、235-245和173-186位;Seq ID No 157的第5-12位、19-27位、29-39位、59-67位、71-78位、80-88位、92-104位、107-124位、129-142位、158-168位、185-191位、218-226位、230-243位、256-267位、272-277位、283-291位、307-325位、331-344位、346-352和316-331位;Seq ID No 158的第6-28位、43-53位、60-76位、93-103和21-99位;Seq ID No 159的第10-30位、120-126位、145-151位、159-169位、174-182位、191-196位、201-206位、214-220位、222-232位、254-272位、292-307位、313-323位、332-353位、361-369位、389-396位、401-415位、428-439位、465-481位、510-517位、560-568和9-264位;Seq ID No160的第5-29位、39-45位、107-128和1-112位;Seq ID No 161的第4-38位、42-50位、54-60位、65-71位、91-102和21-56位;Seq ID No 162的第4-13位、19-25位、41-51位、54-62位、68-75位、79-89位、109-122位、130-136位、172-189位、192-198位、217-224位、262-268位、270-276位、281-298位、315-324位、333-342位、353-370位、376-391和23-39位;Seq ID No 163的第6-41位、49-58位、62-103位、117-124位、147-166位、173-194位、204-211位、221-229位、255-261位、269-284位、288-310位、319-325位、348-380位、383-389位、402-410位、424-443位、467-479位、496-517位、535-553位、555-565位、574-581位、583-591和474-489位;SeqID No 164的第8-35位、52-57位、66-73位、81-88位、108-114位、125-131位、160-167位、174-180位、230-235位、237-249位、254-262位、278-285位、308-314位、321-326位、344-353位、358-372位、376-383位、393-411位、439-446位、453-464位、471-480位、485-492位、502-508位、523-529位、533-556位、558-563位、567-584位、589-597位、605-619位、625-645位、647-666位、671-678位、690-714位、721-728位、741-763位、766-773位、777-787位、792-802位、809-823位、849-864和37-241位、409-534位、582-604位、743-804位;Seq ID No 165的第4-17位、24-36位、38-44位、59-67位、72-90位、92-121位、126-149位、151-159位、161-175位、197-215位、217-227位、241-247位、257-264位、266-275位、277-284位、293-307位、315-321位、330-337位、345-350位、357-366位、385-416和202-337位;Seq ID No 166的第4-20位、22-46位、49-70位、80-89位、96-103位、105-119位、123-129位、153-160位、181-223位、227-233位、236-243位、248-255位、261-269位、274-279位、283-299位、305-313位、315-332位、339-344位、349-362位、365-373位、380-388位、391-397位、402-407和1-48位;Seq ID No 167的第18-37位、41-63位、100-106位、109-151位、153-167位、170-197位、199-207位、212-229位、232-253位、273-297和203-217位;Seq ID No 168的第20-26位、54-61位、80-88位、94-101位、113-119位、128-136位、138-144位、156-188位、193-201位、209-217位、221-229位、239-244位、251-257位、270-278位、281-290位、308-315位、319-332位、339-352位、370-381位、388-400位、411-417位、426-435位、468-482位、488-497位、499-506位、512-521和261-273位;Seq ID No169的第6-12位、16-36位、50-56位、86-92位、115-125位、143-152位、163-172位、193-203位、235-244位、280-289位、302-315位、325-348位、370-379位、399-405位、411-417位、419-429位、441-449位、463-472位、482-490位、500-516位、536-543位、561-569位、587-594位、620-636位、647-653位、659-664位、677-685位、687-693位、713-719位、733-740位、746-754位、756-779位、792-799位、808-817位、822-828位、851-865位、902-908位、920-938位、946-952位、969-976位、988-1005位、1018-1027位、1045-1057位、1063-1069位、1071-1078位、1090-1099位、1101-1109位、1113-1127位、1130-1137位、1162-1174位、1211-1221位、1234-1242位、1261-1268位、1278-1284位、1312-1317位、1319-1326位、1345-1353位、1366-1378位、1382-1394位、1396-1413位、1415-1424位、1442-1457位、1467-1474位、1482-1490位、1492-1530位、1537-1549位、1559-1576位、1611-1616位、1624-1641和1-414位、443-614位、997-1392位;Seq ID No 170的第14-42位、70-75位、90-100位、158-181和1-164位;Seq ID No 171的第4-21位、30-36位、54-82位、89-97位、105-118位、138-147和126-207位;Seq ID No 172的第4-21位、31-66位、96-104位、106-113位、131-142和180-204位;Seq ID No 173的第5-23位、31-36位、38-55位、65-74位、79-88位、101-129位、131-154位、156-165位、183-194位、225-237位、245-261位、264-271位、279-284位、287-297位、313-319位、327-336位、343-363位、380-386和11-197位、204-219位、258-372位;Seq ID No 174的第4-20位、34-41位、71-86位、100-110位、113-124位、133-143位、150-158位、160-166位、175-182位、191-197位、213-223位、233-239位、259-278位、298-322和195-289位;Seq ID No 175的第4-10位、21-35位、44-52位、54-62位、67-73位、87-103位、106-135位、161-174位、177-192位、200-209位、216-223位、249-298位、304-312位、315-329和12-130位;Seq ID No 176的第10-27位、33-38位、48-55位、70-76位、96-107位、119-133位、141-147位、151-165位、183-190位、197-210位、228-236位、245-250位、266-272位、289-295位、297-306位、308-315位、323-352位、357-371位、381-390位、394-401位、404-415位、417-425位、427-462位、466-483位、485-496位、502-507位、520-529位、531-541位、553-570位、577-588位、591-596位、600-610位、619-632位、642-665位、671-692位、694-707和434-444位;Seq ID No 177的第6-14位、16-25位、36-46位、52-70位、83-111位、129-138位、140-149位、153-166位、169-181位、188-206位、212-220位、223-259位、261-269位、274-282位、286-293位、297-306位、313-319位、329-341位、343-359位、377-390位、409-415位、425-430和360-375位;Seq ID No 178的第4-26位、28-48位、54-62位、88-121位、147-162位、164-201位、203-237位、245-251和254-260位;Seq ID No 179的第12-21位、26-32位、66-72位、87-93位、98-112位、125-149位、179-203位、209-226位、233-242位、249-261位、266-271位、273-289位、293-318位、346-354位、360-371位、391-400和369-382位;Seq ID No 180的第11-38位、44-65位、70-87位、129-135位、140-163位、171-177位、225-232位、238-249位、258-266位、271-280位、284-291位、295-300位、329-337位、344-352位、405-412位、416-424位、426-434位、436-455位、462-475位、478-487和270-312位;Seq ID No 181的第5-17位、34-45位、59-69位、82-88位、117-129位、137-142位、158-165位、180-195位、201-206位、219-226位、241-260位、269-279位、292-305位、312-321位、341-347位、362-381位、396-410位、413-432位、434-445位、447-453位、482-487位、492-499位、507-516位、546-552位、556-565位、587-604和486-598位;Seq ID No 182的第4-15位、17-32位、40-47位、67-78位、90-98位、101-107位、111-136位、161-171位、184-198位、208-214位、234-245位、247-254位、272-279位、288-298位、303-310位、315-320位、327-333位、338-349位、364-374和378-396位;Seq ID No 183的第5-27位、33-49位、51-57位、74-81位、95-107位、130-137位、148-157位、173-184和75-235位;Seq ID No 184的第6-23位、47-53位、57-63位、75-82位、97-105位、113-122位、124-134位、142-153位、159-164位、169-179位、181-187位、192-208位、215-243位、247-257位、285-290位、303-310和30-51位;Seq IDNo 185的第17-29位、44-52位、59-73位、77-83位、86-92位、97-110位、118-153位、156-166位、173-179位、192-209位、225-231位、234-240位、245-251位、260-268位、274-279位、297-306位、328-340位、353-360位、369-382位、384-397位、414-423位、431-436位、452-465位、492-498位、500-508位、516-552位、554-560位、568-574位、580-586位、609-617位、620-626位、641-647和208-219位;SeqID No 186的第4-26位、32-45位、58-72位、111-119位、137-143位、146-159位、187-193位、221-231位、235-242位、250-273位、290-304位、311-321位、326-339位、341-347位、354-368位、397-403位、412-419位、426-432位、487-506位、580-592位、619-628位、663-685位、707-716位、743-751位、770-776位、787-792位、850-859位、866-873位、882-888位、922-931位、957-963位、975-981位、983-989位、1000-1008位、1023-1029位、1058-1064位、1089-1099位、1107-1114位、1139-1145位、1147-1156位、1217-1226位、1276-1281位、1329-1335位、1355-1366位、1382-1394位、1410-1416位、1418-1424位、1443-1451位、1461-1469位、1483-1489位、1491-1501位、1515-1522位、1538-1544位、1549-1561位、1587-1593位、1603-1613位、1625-1630位、1636-1641位、1684-1690位、1706-1723位、1765-1771位、1787-1804位、1850-1857位、1863-1894位、1897-1910位、1926-1935位、1937-1943位、1960-1983位、1991-2005位、2008-2014位、2018-2039和396-533位、1342-1502位、1672-1920位;Seq ID No 187的第4-25位、45-50位、53-65位、79-85位、87-92位、99-109位、126-137位、141-148位、156-183位、190-203位、212-217位、221-228位、235-242位、247-277位、287-293位、300-319位、321-330位、341-361位、378-389位、394-406位、437-449位、455-461位、472-478位、482-491位、507-522位、544-554位、576-582位、587-593位、611-621位、626-632位、649-661位、679-685位、696-704位、706-716位、726-736位、740-751位、759-766位、786-792位、797-802位、810-822位、824-832位、843-852位、863-869位、874-879位、882-905和1-113位、210-232位、250-423位、536-564位;Seq ID No 188的第4-16位、33-39位、43-49位、54-85位、107-123位、131-147位、157-169位、177-187位、198-209位、220-230位、238-248位、277-286位、293-301位、303-315位、319-379位、383-393位、402-414位、426-432位、439-449位、470-478位、483-497位、502-535位、552-566位、571-582位、596-601位、608-620位、631-643位、651-656位、663-678位、680-699位、705-717位、724-732位、738-748位、756-763位、766-772位、776-791位、796-810位、819-827位、829-841位、847-861位、866-871位、876-882位、887-894位、909-934位、941-947位、957-969位、986-994位、998-1028位、1033-1070位、1073-1080位、1090-1096位、1098-1132位、1134-1159位、1164-1172位、1174-1201和617-635位;Seq ID No 189的第7-25位、30-40位、42-64位、70-77位、85-118位、120-166位、169-199位、202-213位、222-244和190-203位;Seq ID No 190的第4-11位、15-53位、55-93位、95-113位、120-159位、164-200位、210-243位、250-258位、261-283位、298-319位、327-340位、356-366位、369-376位、380-386位、394-406位、409-421位、425-435位、442-454位、461-472位、480-490位、494-505位、507-514位、521-527位、533-544位、566-574和385-398位;Seq ID No 191的第5-36位、66-72位、120-127位、146-152位、159-168位、172-184位、205-210位、221-232位、234-243位、251-275位、295-305位、325-332位、367-373位、470-479位、482-487位、520-548位、592-600位、605-615位、627-642位、655-662位、664-698位、718-725位、734-763位、776-784位、798-809位、811-842位、845-852位、867-872位、879-888位、900-928位、933-940位、972-977位、982-1003和12-190位、276-283位、666-806位;Seq ID No 192的第4-38位、63-68位、100-114位、160-173位、183-192位、195-210位、212-219位、221-238位、240-256位、258-266位、274-290位、301-311位、313-319位、332-341位、357-363位、395-401位、405-410位、420-426位、435-450位、453-461位、468-475位、491-498位、510-518位、529-537位、545-552位、585-592位、602-611位、634-639位、650-664和30-80位、89-105位、111-151位;Seq ID No 193的第7-29位、31-39位、47-54位、63-74位、81-94位、97-117位、122-127位、146-157位、168-192位、195-204位、216-240位、251-259和195-203位;Seq ID No 194的第5-16位、28-34位、46-65位、79-94位、98-105位、107-113位、120-134位、147-158位、163-172位、180-186位、226-233位、237-251位、253-259位、275-285位、287-294位、302-308位、315-321位、334-344位、360-371位、399-412位、420-426和32-50位;Seq ID No 195的第8-20位、30-36位、71-79位、90-96位、106-117位、125-138位、141-147位、166-174和75-90位;Seq ID No 196的第4-13位、15-33位、43-52位、63-85位、98-114位、131-139位、146-174位、186-192位、198-206位、227-233和69-88位;Seq ID No 197的第4-22位、29-35位、59-68位、153-170位、213-219位、224-238位、240-246位、263-270位、285-292位、301-321位、327-346位、356-371位、389-405位、411-418位、421-427位、430-437位、450-467位、472-477位、482-487位、513-518位、531-538位、569-576位、606-614位、637-657位、662-667位、673-690位、743-753位、760-767位、770-777位、786-802和96-230位、361-491位、572-585位;Seq ID No 198的第4-12位、21-36位、48-55位、74-82位、121-127位、195-203位、207-228位、247-262位、269-278位、280-289和102-210位;Seq ID No 199的第13-20位、23-31位、38-44位、78-107位、110-118位、122-144位、151-164位、176-182位、190-198位、209-216位、219-243位、251-256位、289-304位、306-313和240-248位;Seq ID No 200的第5-26位、34-48位、57-77位、84-102位、116-132位、139-145位、150-162位、165-173位、176-187位、192-205位、216-221位、234-248位、250-260和182-198位;Seq ID No 201的第10-19位、26-44位、53-62位、69-87位、90-96位、121-127位、141-146位、148-158位、175-193位、204-259位、307-313位、334-348位、360-365位、370-401位、411-439位、441-450位、455-462位、467-472位、488-504和41-56位;Seq ID No202的第5-21位、36-42位、96-116位、123-130位、138-144位、146-157位、184-201位、213-228位、252-259位、277-297位、308-313位、318-323位、327-333和202-217位;Seq ID No 203的第6-26位、33-51位、72-90位、97-131位、147-154位、164-171位、187-216位、231-236位、260-269位、275-283和1-127位;Seq ID No 204的第4-22位、24-38位、44-58位、72-88位、99-108位、110-117位、123-129位、131-137位、142-147位、167-178位、181-190位、206-214位、217-223位、271-282位、290-305位、320-327位、329-336位、343-352位、354-364位、396-402位、425-434位、451-456位、471-477位、485-491位、515-541位、544-583位、595-609位、611-626位、644-656位、660-681位、683-691位、695-718和297-458位;Seq ID No 205的第5-43位、92-102位、107-116位、120-130位、137-144位、155-163位、169-174位、193-213和24-135位;Seq ID No 206的第4-25位、61-69位、73-85位、88-95位、97-109位、111-130位、135-147位、150-157位、159-179位、182-201位、206-212位、224-248位、253-260位、287-295位、314-331位、338-344位、365-376位、396-405位、413-422位、424-430位、432-449位、478-485位、487-494位、503-517位、522-536位、544-560位、564-578位、585-590位、597-613位、615-623位、629-636位、640-649位、662-671位、713-721和176-330位;Seq ID No 207的第31-37位、41-52位、58-79位、82-105位、133-179位、184-193位、199-205位、209-226位、256-277位、281-295位、297-314位、322-328位、331-337位、359-367位、379-395位、403-409位、417-432位、442-447位、451-460位、466-472和46-62位、296-341位;SeqID No 208的第23-29位、56-63位、67-74位、96-108位、122-132位、139-146位、152-159位、167-178位、189-196位、214-231位、247-265位、274-293位、301-309位、326-332位、356-363位、378-395位、406-412位、436-442位、445-451位、465-479位、487-501位、528-555位、567-581位、583-599位、610-617位、622-629位、638-662位、681-686位、694-700位、711-716和667-684位;Seq ID No 209的第20-51位、53-59位、109-115位、140-154位、185-191位、201-209位、212-218位、234-243位、253-263位、277-290位、303-313位、327-337位、342-349位、374-382位、394-410位、436-442位、464-477位、486-499位、521-530位、536-550位、560-566位、569-583位、652-672位、680-686位、698-704位、718-746位、758-770位、774-788位、802-827位、835-842位、861-869和258-416位;Seq ID No 210的第7-25位、39-45位、59-70位、92-108位、116-127位、161-168位、202-211位、217-227位、229-239位、254-262位、271-278位、291-300和278-295位;Seq ID No 211的第4-20位、27-33位、45-51位、53-62位、66-74位、81-88位、98-111位、124-130位、136-144位、156-179位、183-191和183-195位;Seq ID No 212的第12-24位、27-33位、43-49位、55-71位、77-85位、122-131位、168-177位、179-203位、209-214位、226-241和63-238位;Seq ID No 213的第4-19位、37-50位、120-126位、131-137位、139-162位、177-195位、200-209位、211-218位、233-256位、260-268位、271-283位、288-308和1-141位;Seq ID No 214的第11-17位、40-47位、57-63位、96-124位、141-162位、170-207位、223-235位、241-265位、271-277位、281-300位、312-318位、327-333位、373-379和231-368位;Seq ID No215的第9-33位、41-48位、57-79位、97-103位、113-138位、146-157位、165-186位、195-201位、209-215位、223-229位、237-247位、277-286位、290-297位、328-342和247-260位;Seq ID No 216的第7-15位、39-45位、58-64位、79-84位、97-127位、130-141位、163-176位、195-203位、216-225位、235-247位、254-264位、271-279和64-72位;Seq ID No 217的第4-12位、26-42位、46-65位、73-80位、82-94位、116-125位、135-146位、167-173位、183-190位、232-271位、274-282位、300-306位、320-343位、351-362位、373-383位、385-391位、402-409位、414-426位、434-455位、460-466位、473-481位、485-503位、519-525位、533-542位、554-565位、599-624位、645-651位、675-693位、717-725位、751-758位、767-785位、792-797位、801-809位、819-825位、831-836位、859-869位、890-897和222-362位、756-896位;Seq ID No 218的第11-17位、22-28位、52-69位、73-83位、86-97位、123-148位、150-164位、166-177位、179-186位、188-199位、219-225位、229-243位、250-255和153-170位;SeqID No 219的第4-61位、71-80位、83-90位、92-128位、133-153位、167-182位、184-192位、198-212和56-73位;Seq ID No 220的第4-19位、26-37位、45-52位、58-66位、71-77位、84-92位、94-101位、107-118位、120-133位、156-168位、170-179位、208-216位、228-238位、253-273位、280-296位、303-317位、326-334和298-312位;SeqID No 221的第7-13位、27-35位、38-56位、85-108位、113-121位、123-160位、163-169位、172-183位、188-200位、206-211位、219-238位、247-254和141-157位;Seq ID No 222的第23-39位、45-73位、86-103位、107-115位、125-132位、137-146位、148-158位、160-168位、172-179位、185-192位、200-207位、210-224位、233-239位、246-255位、285-334位、338-352位、355-379位、383-389位、408-417位、423-429位、446-456位、460-473位、478-503位、522-540位、553-562位、568-577位、596-602位、620-636位、640-649位、655-663和433-440位、572-593位;Seq ID No 223的第4-42位、46-58位、64-76位、118-124位、130-137位、148-156位、164-169位、175-182位、187-194位、203-218位、220-227位、241-246位、254-259位、264-270位、275-289位、296-305位、309-314位、322-334位、342-354位、398-405位、419-426位、432-443位、462-475位、522-530位、552-567位、593-607位、618-634位、636-647位、653-658位、662-670位、681-695位、698-707位、709-720位、732-742位、767-792位、794-822位、828-842位、851-866位、881-890位、895-903位、928-934位、940-963位、978-986位、1003-1025位、1027-1043位、1058-1075位、1080-1087位、1095-1109位、1116-1122位、1133-1138位、1168-1174位、1179-1186位、1207-1214位、1248-1267和17-319位、417-563位;Seq ID No 224的第6-19位、23-33位、129-138位、140-150位、153-184位、190-198位、206-219位、235-245位、267-275位、284-289位、303-310位、322-328位、354-404位、407-413位、423-446位、453-462位、467-481位、491-500和46-187位;Seq ID No 225的第4-34位、39-57位、78-86位、106-116位、141-151位、156-162位、165-172位、213-237位、252-260位、262-268位、272-279位、296-307位、332-338位、397-403位、406-416位、431-446位、448-453位、464-470位、503-515位、519-525位、534-540位、551-563位、578-593位、646-668位、693-699位、703-719位、738-744位、748-759位、771-777位、807-813位、840-847位、870-876位、897-903位、910-925位、967-976位、979-992和21-244位、381-499位、818-959位;Seq ID No226的第19-29位、65-75位、90-109位、111-137位、155-165位、169-175和118-136位;Seq ID No 227的第15-20位、30-36位、55-63位、73-79位、90-117位、120-127位、136-149位、166-188位、195-203位、211-223位、242-255位、264-269位、281-287位、325-330位、334-341位、348-366位、395-408位、423-429位、436-444位、452-465和147-155位;Seq ID No 228的第11-18位、21-53位、77-83位、91-98位、109-119位、142-163位、173-181位、193-208位、216-227位、238-255位、261-268位、274-286位、290-297位、308-315位、326-332位、352-359位、377-395位、399-406位、418-426位、428-438位、442-448位、458-465位、473-482位、488-499位、514-524位、543-553位、564-600位、623-632位、647-654位、660-669位、672-678位、710-723位、739-749位、787-793位、820-828位、838-860位、889-895位、901-907位、924-939位、956-962位、969-976位、991-999位、1012-1018位、1024-1029位、1035-1072位、1078-1091位、1142-1161和74-438位;Seq ID No 229的第4-31位、41-52位、58-63位、65-73位、83-88位、102-117位、123-130位、150-172位、177-195位、207-217位、222-235位、247-253位、295-305位、315-328位、335-342位、359-365位、389-394位、404-413和156-420位;Seq ID No 230的第4-42位、56-69位、98-108位、120-125位、210-216位、225-231位、276-285位、304-310位、313-318位、322-343和79-348位;Seq ID No 231的第12-21位、24-30位、42-50位、61-67位、69-85位、90-97位、110-143位、155-168和53-70位;Seq ID No 232的第4-26位、41-54位、71-78位、88-96位、116-127位、140-149位、151-158位、161-175位、190-196位、201-208位、220-226位、240-247位、266-281位、298-305位、308-318位、321-329位、344-353位、370-378位、384-405位、418-426位、429-442位、457-463位、494-505位、514-522和183-341位;SeqID No 233的第4-27位、69-77位、79-101位、117-123位、126-142位、155-161位、171-186位、200-206位、213-231位、233-244位、258-263位、269-275位、315-331位、337-346位、349-372位、376-381位、401-410位、424-445位、447-455位、463-470位、478-484位、520-536位、546-555位、558-569位、580-597位、603-618位、628-638位、648-660位、668-683位、717-723位、765-771位、781-788位、792-806位、812-822和92-231位、618-757位;Seq ID No 234的第11-47位、63-75位、108-117位、119-128位、133-143位、171-185位、190-196位、226-232位、257-264位、278-283位、297-309位、332-338位、341-346位、351-358位、362-372和41-170位;Seq ID No 235的第6-26位、50-56位、83-89位、108-114位、123-131位、172-181位、194-200位、221-238位、241-259位、263-271位、284-292位、304-319位、321-335位、353-358位、384-391位、408-417位、424-430位、442-448位、459-466位、487-500位、514-528位、541-556位、572-578位、595-601位、605-613位、620-631位、634-648位、660-679位、686-693位、702-708位、716-725位、730-735位、749-755位、770-777位、805-811位、831-837位、843-851位、854-860位、863-869位、895-901位、904-914位、922-929位、933-938位、947-952位、956-963位、1000-1005位、1008-1014位、1021-1030位、1131-1137位、1154-1164位、1166-1174和20-487位、757-1153位;Seq ID No 236的第10-34位、67-78位、131-146位、160-175位、189-194位、201-214位、239-250位、265-271位、296-305和26-74位、91-100位、105-303位;Seq IDNo 237的第9-15位、19-32位、109-122位、143-150位、171-180位、186-191位、209-217位、223-229位、260-273位、302-315位、340-346位、353-359位、377-383位、389-406位、420-426位、460-480和10-223位、231-251位、264-297位、312-336位;Seq ID No 238的第5-28位、76-81位、180-195位、203-209位、211-219位、227-234位、242-252位、271-282位、317-325位、350-356位、358-364位、394-400位、405-413位、417-424位、430-436位、443-449位、462-482位、488-498位、503-509位、525-537和22-344位;Seq ID No 239的第5-28位、42-54位、77-83位、86-93位、98-104位、120-127位、145-159位、166-176位、181-187位、189-197位、213-218位、230-237位、263-271位、285-291位、299-305位、326-346位、368-375位、390-395和1-151位;Seq ID No 240的第6-34位、48-55位、58-64位、84-101位、121-127位、143-149位、153-159位、163-170位、173-181位、216-225位、227-240位、248-254位、275-290位、349-364位、375-410位、412-418位、432-438位、445-451位、465-475位、488-496位、505-515位、558-564位、571-579位、585-595位、604-613位、626-643位、652-659位、677-686位、688-696位、702-709位、731-747位、777-795位、820-828位、836-842位、845-856位、863-868位、874-882位、900-909位、926-943位、961-976位、980-986位、992-998位、1022-1034位、1044-1074位、1085-1096位、1101-1112位、1117-1123位、1130-1147位、1181-1187位、1204-1211位、1213-1223位、1226-1239位、1242-1249位、1265-1271位、1273-1293位、1300-1308位、1361-1367位、1378-1384位、1395-1406位、1420-1428位、1439-1446位、1454-1460位、1477-1487位、1509-1520位、1526-1536位、1557-1574位、1585-1596位、1605-1617位、1621-1627位、1631-1637位、1648-1654位、1675-1689位、1692-1698位、1700-1706位、1712-1719位、1743-1756和91-263位;Seq ID No241的第4-16位、75-90位、101-136位、138-144位、158-164位、171-177位、191-201位、214-222位、231-241位、284-290位、297-305位、311-321位、330-339位、352-369位、378-385位、403-412位、414-422位、428-435位、457-473位、503-521位、546-554位、562-568位、571-582位、589-594位、600-608位、626-635位、652-669位、687-702位、706-712位、718-724位、748-760位、770-775和261-272位;Seq ID No 242的第4-19位、30-41位、46-57位、62-68位、75-92位、126-132位、149-156位、158-168位、171-184位、187-194位、210-216位、218-238位、245-253位、306-312位、323-329位、340-351位、365-373位、384-391位、399-405位、422-432位、454-465位、471-481位、502-519位、530-541位、550-562位、566-572位、576-582位、593-599位、620-634位、637-643位、645-651位、657-664位、688-701和541-551位;Seq ID No 243的第6-11位、17-25位、53-58位、80-86位、91-99位、101-113位、123-131位、162-169位、181-188位、199-231位、245-252和84-254位;Seq ID No 244的第13-30位、71-120位、125-137位、139-145位、184-199和61-78位;Seq ID No245的第9-30位、38-53位、63-70位、74-97位、103-150位、158-175位、183-217位、225-253位、260-268位、272-286位、290-341位、352-428位、434-450位、453-460位、469-478位、513-525位、527-534位、554-563位、586-600位、602-610位、624-640位、656-684位、707-729位、735-749位、757-763位、766-772位、779-788位、799-805位、807-815位、819-826位、831-855和568-580位;Seq ID No 246的第11-21位、29-38和5-17位;Seq ID No 247的第2-9位;Seq ID No248的第4-10位、16-28和7-18位、26-34位;Seq ID No 249的第10-16和1-15位;Seq ID No 250的第4-11位;Seq ID No 251的第4-40位、42-51和37-53位;Seq ID No 252的第4-21和22-29位;Seq ID No 253的第2-11位;9-17位、Seq ID No 254的第32-44和1-22位;Seq ID No 255的第19-25位、27-32和15-34位;Seq ID No 256的第4-12位、15-22和11-33位;Seq ID No 257的第10-17位、24-30位、39-46位、51-70和51-61位;Seq ID No 258的第6-19位;Seq ID No 259的第6-11位、21-27位、31-54和11-29位;Seq ID No 260的第4-10位、13-45和11-35位;Seq ID No 261的第4-14位、23-32和11-35位;Seq ID No 262的第14-39位、45-51和15-29位;Seq ID No 263的第4-11位、14-28和4-17位;Seq ID No 264的第4-16和2-16位;Seq ID No 265的第4-10位、12-19位、39-50和6-22位;Seq ID No 266的第2-13位;Seq ID No 267的第4-11位、22-65和3-19位;Seq ID No 268的第17-23位、30-35位、39-46位、57-62和30-49位;Seq ID No 269的第4-19和14-22位;Seq ID No270的第2-9位;Seq ID No 271的第7-18位、30-43和4-12位;Seq IDNo 272的第4-30位、39-47和5-22位;Seq ID No 273的第6-15和14-29位;Seq ID No 274的第4-34和23-35位;Seq ID No 275的第4-36位、44-57位、65-72和14-27位;Seq ID No 276的第4-18和11-20位;Seq IDNo 277的第5-19位;Seq ID No 278的第18-36和6-20位;Seq ID No 279的第4-10位、19-34位、41-84位、96-104和50-63位;Seq ID No 280的第4-9位、19-27和8-21位;Seq ID No 281的第4-16位、18-28和22-30位;Seq ID No 282的第4-15和21-35位;Seq ID No 283的第4-17和3-13位;Seq ID No 284的第4-12和4-18位;Seq ID No 285的第4-24位、31-36和29-45位;Seq ID No 286的第12-22位、34-49和21-32位;Seq ID No 287的第4-17和22-32位;Seq ID No 288的第4-16位、25-42和7-28位;Seq ID No 289的第4-10和7-20位;Seq ID No 290的第4-11位、16-36位、39-54和28-44位;Seq ID No 291的第5-20位、29-54和14-29位;Seq ID No 292的第24-33和10-22o位;Seq ID No 293的第10-51位、54-61和43-64位;Seq ID No 294的第7-13和2-17位;Seq IDNo 295的第11-20和6-20位;Seq ID No 296的第4-30位、34-41和19-28位;Seq ID No 297的第11-21位;Seq ID No 298的第4-16位、21-26和9-38位;Seq ID No 299的第4-12位、15-27位、30-42位、66-72和10-24位;Seq ID No 300的第8-17和11-20位;以及Seq ID No246的第2-19位;Seq ID No 247的第1-12位;Seq ID No 248的第21-38位;Seq IDNo 254的第2-22位;Seq ID No 255的第15-33位;Seq ID No 256的第11-32位;Seq ID No 259的第11-28位;Seq ID No 260的第10-27位;SeqID No 261的第9-26位;Seq ID No 263的第4-16位;Seq ID No 266的第1-18位;Seq ID No 273的第12-29位;Seq ID No 276的第6-23位;Seq IDNo 277的第1-21位;Seq ID No 279的第47-64位;Seq ID No 285的第28-45位;Seq ID No 287的第18-35位;Seq ID No 291的第14-31位;SeqID No 292的第7-24位;Seq ID No 299的第8-25位;Seq ID No 300的第1-20位;Seq ID No 151的第18-33位;Seq ID No 151的第62-72位;SeqID No 152的第118-131位;Seq ID No 154的第195-220位;Seq ID No 154的第215-240位;Seq ID No 154的第255-280位;Seq ID No 155的第72-81位;Seq ID No 156的第174-186位;Seq ID No 157的第317-331位;SeqID No 158的第35-59位;Seq ID No 158的第54-84位;Seq ID No 158的第79-104位;Seq ID No 159的第33-58位;Seq ID No 159的第81-101位;Seq ID No 159的第136-150位;Seq ID No 159的第173-186位;Seq ID No159的第231-251位;Seq ID No 161的第22-48位;Seq ID No 162的第24-39位;Seq ID No 163的第475-489位;Seq ID No 164的第38-56位;Seq ID No 164的第583-604位;Seq ID No 165的第202-223位;Seq ID No165的第222-247位;Seq ID No 165的第242-267位;Seq ID No 165的第262-287位;Seq ID No 165的第282-307位;Seq ID No 165的第302-327位;Seq ID No 166的第25-48位;Seq ID No 167的第204-217位;Seq IDNo 168的第259-276位;Seq ID No 169的第121-139位;Seq ID No 169的第260-267位;Seq ID No 169的第215-240位;Seq ID No 170的第115-140位;Seq ID No 172的第182-204位;Seq ID No 173的第144-153位;Seq ID No 173的第205-219位;Seq ID No 174的第196-206位;SeqID No 174的第240-249位;Seq ID No 174的第272-287位;Seq ID No 174的第199-223位;Seq ID No 174的第218-237位;Seq ID No 175的第226-249位;Seq ID No 175的第287-306位;Seq ID No 176的第430-449位;Seq ID No 177的第61-375位;Seq ID No 178的第241-260位;Seq IDNo 181的第483-502位;Seq ID No 182的第379-396位;Seq ID No 184的第31-51位;Seq ID No 186的第1436-1460位;Seq ID No 186的第1455-1474位;Seq ID No 186的第1469-1487位;Seq ID No 187的第215-229位;Seq ID No 187的第534-561位;Seq IDNo 187的第59-84位;Seq ID No 187的第79-104位;Seq ID No 188的第618-635位;Seq IDNo 189的第191-203位;Seq ID No 190的第386-398位;Seq ID No 191的第65-83位;Seq ID No 192的第90-105位;Seq ID No 192的第112-136位;Seq ID No 193的第290-209位;Seq ID No 194的第33-50位;Seq IDNo 195的第76-90位;Seq ID No 196的第70-88位;Seq ID No 197的第418-442位;Seq ID No 197的第574-585位;Seq ID No 198的第87-104位;Seq ID No 198的第124-148位;Seq ID No 198的第141-152位;SeqID No 199的第241-248位;Seq ID No 200的第183-198位;Seq ID No 200的第40-57位;Seq ID No 202的第202-217位;Seq ID No 203的第50-74位;Seq ID No 203的第69-93Seq ID No 203的第88-112位;Seq ID No 203的第107-127位;Seq ID No 205的第74-92位;Seq ID No 206的第207-232位;Seq ID No 206的第227-252位;Seq ID No 206的第247-272位;SeqID No 207的第47-60位;Seq ID No 207的第297-305位;Seq ID No 207的第312-337位;Seq ID No 208的第667-384位;Seq ID No 210的第279-295位;Seq ID No 211的第179-198位;Seq ID No 213的第27-51位;Seq ID No 213的第46-70位;Seq ID No 213的第65-89位;Seq ID No 213的第84-108位;Seq ID No 213的第112-141位;Seq ID No 215的第248-260位;Seq ID No 216的第59-78位;Seq ID No 218的第154-170位;Seq ID No 219的第57-73位;Seq ID No 220的第297-314位;Seq ID No 221的第142-157位;Seq ID No 222的第428-447位;Seq ID No 222的第573-593位;Seq ID No 223的第523-544位;Seq ID No 223的第46-70位;Seq ID No 223的第65-89位;Seq ID No 223的第84-108位;Seq ID No 223的第122-151位;Seq ID No 224的第123-142位;Seq ID No 225的第903-921位;Seq ID No 226的第119-136位;Seq ID No 227的第142-161位;Seq ID No 228的第258-277位;Seq ID No 228的第272-300位;SeqID No 228的第295-322位;Seq ID No 229的第311-343位;Seq ID No 229的第278-304位;Seq ID No 230的第131-150位;Seq ID No 230的第195-218位;Seq ID No 231的第53-70位;Seq ID No 232的第184-208位;Seq ID No 232的第222-246位;Seq ID No 232的第241-265位;Seq ID No232的第260-284位;Seq ID No 232的第279-303位;Seq ID No 232的第317-341位;Seq ID No 233的第678-696位;Seq ID No 235的第88-114位;Seq ID No 235的第464-481位;Seq ID No 236的第153-172位;SeqID No 236的第137-155位、166-184位;Seq ID No 236的第215-228位;Seq ID No 237的第37-51位;Seq ID No 237的第53-75位;Seq ID No 237的第232-251位;Seq ID No 237的第318-336位;Seq ID No 238的第305-315位;Seq ID No 238的第131-156位;Seq ID No 241的第258-275位;Seq ID No 243的第107-137位;Seq ID No 243的第138-162位;SeqID No 243的第157-181位;Seq ID No 243的第195-227位;Seq ID No 244的第62-78位;Seq ID No 245的第567-584位,以及含所述序列的至少6个、优选8个以上、尤其优选10个以上氨基酸的片段。所有这些片段个别的且各自独立的形成本发明的优选方面。
用一组具有至少10个氨基酸长且有1个氨基酸重叠的肽通过分析蛋白质抗原的完整序列可鉴定某一具体抗原的所有线性超免疫血清反应性片段。随后,用已表达的全长蛋白质或其结构域多肽通过分析与超免疫血清在一起的蛋白质抗原可鉴定非线性表位。假如某一蛋白质的单独结构域足以形成不依赖于其天然蛋白质的3D结构,分析与超免疫血清在一起的相应重组或合成产生的结构域多肽可鉴定多结构域蛋白质个别结构域内的构象表位。对于那些其中的结构域具有线性表位以及构象表位的抗原而言,利用对应于线性表位的肽进行的竞争性实验可用于确认构象表位的存在。
其中,应理解本发明还尤其涉及编码上述片段的核酸分子、与编码所述片段的核酸分子杂交的核酸分子、尤其是那些在严谨条件下杂交的核酸分子以及用于扩增编码所述片段的核酸分子的核酸分子,诸如PCR引物。在这些方面,如上所述,优选的核酸分子是与优选片段相应的那些核酸分子。
本发明还涉及含有本发明的一种或多种核酸分子的载体、含本发明载体的遗传改造过的宿主细胞和用重组技术生产超免疫血清反应性抗原及其片段。
多种表达载体可用于表达按照本发明的超免疫血清反应性抗原或其片段。通常,在宿主中适于维持、繁殖或表达核酸从而表达多肽的任何载体都可用于这方面的表达。依照本方面的这一方面,载体可以是,例如,质粒载体、单链或双链噬菌体载体、单链或双链RNA或DNA病毒载体。本文所公开的起始质粒可购买获得、公开获得或可通过众所周知的已发表方法的常规应用构建自有用的质粒。在某些方面,载体中优选的是用于表达本发明的核酸分子和超免疫血清反应性抗原或其片段的那些载体。宿主细胞中的核酸构建体可以常规方式用于生产由所述重组序列编码的基因产物。或者,本发明的超免疫血清反应性抗原及其片段可通过传统的肽合成仪合成产生。成熟蛋白质可在适当启动子的调控下表达于哺乳动物细胞、酵母、细菌或其它细胞中。无细胞翻译体系还可通过来自本发明DNA构建体的RNA应用于生产所述蛋白质。
宿主细胞可遗传改造以引入核酸分子并表达本发明的核酸分子。适当宿主的代表性例子包括细菌细胞,诸如链球菌、葡萄球菌、大肠杆菌、链霉菌和枯草芽孢杆菌细胞;真菌细胞,诸如酵母细胞和曲霉菌细胞;昆虫细胞,诸如果蝇S2和Spodoptera Sf9细胞;动物细胞,诸如CHO、COS、Hela、C127、3T3、BHK、293和Bowes黑素瘤细胞;和植物细胞。
本发明还提供了生产化脓链球菌超免疫血清反应性抗原及其片段的方法,包括从宿主细胞表达由本发明所提供核酸分子编码的超免疫血清反应性抗原或其片段。本发明另外提供了生产能表达化脓链球菌超免疫血清反应性抗原或其片段的细胞,包括用按照本发明的载体转化或转染合适的宿主细胞从而使被转化或转染的细胞表达由该载体中所含核酸编码的多肽。
多肽可以修饰过的形式表达,诸如融合蛋白,而且不仅可包含分泌信号,还可包含附加的异源功能区。这样,例如,某一区段的附加氨基酸,尤其是带电荷氨基酸,可加入多肽的N-或C-末端以便在纯化期间或随后的操作和储存期间提高其在宿主细胞中的稳定性和持久性。此外,某些区段可加入多肽中以方便纯化。所述的区域可在该多肽最终制备步骤前去除。其中,在多肽中添加某部分肽产生分泌物或排泄物以提高稳定性或方便纯化是本领域中熟知和常规的技术。优选的融合蛋白包含来自免疫球蛋白且对稳定或纯化多肽有效的异源区段。例如,EP-A-O 464 533(加拿大副本2045869)公开了含免疫球蛋白分子恒定区多个部分以及另一蛋白质或其部分的融合蛋白。在药物开发中,例如,为了高通量筛选检测的目的将蛋白质与抗体Fc部分融合以鉴定拮抗剂。参阅,例如,{Bennett,D.等,1995}和{Johanson,K.等,1995}。
化脓链球菌超免疫血清反应性抗原或其片段可通过众所周知的方法回收和纯化自重组细胞培养物,包括硫酸铵或乙醇沉淀、酸提取、阴离子或阳离子交换层析、磷酸纤维素层析、疏水相互作用层析、羟磷灰石层析和外源凝集素层析。
按照本发明的超免疫血清反应性抗原及其片段可通过化学合成以及生物技术手段产生。后者包括用含有按照本发明的核酸的载体转染或转化宿主细胞并在本领域技术人员已知的条件下培养已被转染或已被转化的宿主细胞。生产方法还可包括纯化步骤以纯化或分离待制备的多肽。在优选实施方案中的载体是按照本发明的载体。
按照本发明的超免疫血清反应性抗原及其片段可用于检测样品中的某种或几种生物体,所述样品含这些生物体或其来源多肽。优选这样的检测是用于诊断的,更优选用于疾病的诊断,最优选用于诊断与革兰氏阳性细菌的存在或富集相关或有联系的疾病,尤其是包括链球菌、葡萄球菌和乳酸菌在内的细菌类型。更优选地,微生物可选自无乳链球菌(Streptococcusagalactiae)、肺炎链球菌和变异链球菌(Streptococcus mutans)类型,尤其是所述微生物为化脓链球菌。
本发明还涉及诸如定量测定等诊断检测法和用于检测细胞和组织中本发明超免疫血清反应性抗原及其片段水平的诊断检测中,包括正常和异常水平的测定。因而,例如,依照本发明用于检测较正常对照组织样品而言过表达的多肽的诊断检测法可用于检测感染的存在,并识别正被感染的生物体。可用于确定宿主来源样品中多肽水平的检测技术是本领域技术人员众所周知的。这样的检测方法包括放射免疫检测法、竞争性结合检测法、蛋白质印迹分析和ELISA检测法。其中,ELISA是常常优选的。ELISA检测最初包括制备特异于所述多肽的抗体,优选单克隆抗体。此外,通常制备与所述单克隆抗体结合的报道抗体。该报道抗体与可检测试剂附着,诸如放射性试剂、荧光试剂或酶促试剂,诸如辣根过氧化物酶。
按照本发明的超免疫血清反应性抗原及其片段还可用于阵列的目的或与连同阵列使用。更具体而言,可将至少一个按照本发明的超免疫血清反应性抗原及其片段固定于支持物上。所述支持物通常包含各种超免疫血清反应性抗原及其片段,凭此通过使用一种或数种按照本发明的超免疫血清反应性抗原及其片段和/或不同的超免疫血清反应性抗原及其片段可建立多样性。所述阵列的特征性质,也是一般而言任何阵列的特征性质,是单独的多肽固定于所述支持物或其表面的单独的或预定区域或位置。因此,阵列的单独位置或区域的任一活性可能都与某一特殊的多肽相关。固定于支持物上的不同超免疫血清反应性抗原及其片段的数目可以从少到10个多到数千个不同的超免疫血清反应性抗原及其片段之间变化。在优选的实施方案中每cm2的超免疫血清反应性抗原及其片段的密度少到每cm210个肽/多肽至每cm2至少400个不同的肽/多肽且更单独的是每cm2至少1000个不同的超免疫血清反应性抗原及其片段。
所述阵列的制备是本领域技术人员已知的,例如,参阅美国专利5,744,309。阵列优选包含一个平坦、多孔或非多孔且具有至少第一个表面的固体支持物。如本文所公开的超免疫血清反应性抗原及其片段被固定于所述的表面上。其中,优选的支持物材料是玻璃或纤维素。用于本文所述任一诊断应用中的阵列也在本发明的范围内。除了按照本发明的超免疫血清反应性抗原及其片段之外,按照本发明的核酸分子也可用于上述阵列的产生中。本申请也适用于抗体构成的阵列,其中抗体优选此处所述的单克隆抗体。
另一方面,本发明涉及针对按照本发明的任一超免疫血清反应性抗原及其片段、衍生物或其片段的抗体。本发明包括,例如,单克隆和多克隆抗体,嵌合的、单链的和人源化的抗体,以及Fab片段或Fab表达文库的产物。也属于本发明范围内的是抗体可能是嵌合的,即,其不同部分来源自不同物种或至少各自的序列取自不同的物种。
针对相应于本发明序列的超免疫血清反应性抗原及其片段产生的抗体可通过将超免疫血清反应性抗原及其片段直接注射入动物中或通过将超免疫血清反应性抗原及其片段施用于动物,优选非人动物而获得。由此获得的抗体然后与超免疫血清反应性抗原及其片段自身结合。如此,即使只编码超免疫血清反应性抗原及其片段的片段的序列也可用于产生结合完整天然超免疫血清反应性抗原及其片段的抗体。所述的抗体然后可用于从表达那些超免疫血清反应性抗原及其片段的组织中分离超免疫血清反应性抗原及其片段。
为了制备单克隆抗体,本领域已知提供连续细胞系培养所产生抗体的任何技术都可使用。(如,最初在{Kohler,G.等,1975}中所述的。)
用于单链抗体产生所述的技术(美国专利文件4,946,778)可适用于生产针对按照本发明超免疫血清反应性抗原及其片段的单链抗体。此外,转基因小鼠,或诸如其它哺乳动物等其它生物体可用于表达针对按照本发明的超免疫血清反应性抗原及其片段的人源化抗体。
或者,噬菌体展示技术或核糖体展示可应用于选择对超免疫血清反应性抗原及其片段具结合活性的抗体基因,它们可来自为具有相应靶抗原而筛选的人淋巴细胞PCR扩增v-基因的全部组分或来自天然的文库{McCafferty,J.等,1990};{Marks,J.等,1992}。这些抗体的亲合力也可通过链的改组得到提高{Clackson,T.等,1991}。
如果存在两个抗原结合结构域,各结构域可直接针对不同表位-被称为“双特异性的”抗体。
上述抗体可应用于分离或鉴定表达超免疫血清反应性抗原及其片段的克隆或通过将抗体附着于固体支持物上进行亲和层析分离和/或纯化而纯化本发明的超免疫血清反应性抗原及其片段。
因此,特别地,针对本发明超免疫血清反应性抗原及其片段的抗体可应用于抑制和/或治疗感染,尤其是细菌感染,更尤其是由化脓链球菌引起的感染。
超免疫血清反应性抗原及其片段包括形成本领域特殊的一个方面的抗原性、表位性或免疫学等价衍生物。术语“抗原等价衍生物”用于此处时包含被确定抗体特异识别的超免疫血清反应性抗原及其片段或其同等物,在用按照本发明的蛋白质或超免疫血清反应性抗原及其片段接种免疫后,所述抗体干扰了病原体和哺乳动物宿主之间的相互作用。术语“免疫学等价衍生物”用于此处时包含肽或其等价物,当将它们用于适当制剂中以在脊椎动物中产生抗体时,所述抗体发挥了干扰病原体和哺乳动物宿主之间相互作用的功能。
超免疫血清反应性抗原及其片段,诸如抗原性或免疫学等价衍生物或它们的融合蛋白可用作抗原来免疫小鼠或诸如大鼠或小鸡等其它动物。融合蛋白可使超免疫血清反应性抗原及其片段具有稳定性。抗原可以通过例如偶联与例如牛血清白蛋白(BSA)或匙孔血蓝蛋白(KLH)等免疫原性载体蛋白联合。或者,包含多拷贝所述蛋白质或超免疫血清反应性抗原及其片段或抗原性或免疫学等价的超免疫血清反应性抗原及其片段的抗原性肽对于提高免疫原性而言可能已具有足够的抗原性,从而避免了载体的使用。
优选的对抗体或其衍生物进行修饰使其在个体中的免疫原性降低。例如,如果所述个体是人,则抗体可能最好被人源化,其中杂交瘤衍生抗体的互补性决定区被移植入人的单克隆抗体内,参阅{Jones,P.等,1986}或{Tempest,P.等,1991}。
本发明多核苷酸在遗传免疫中的应用优选采用合适的运送方法,诸如将质粒DNA直接注射入肌肉中、运送具特异蛋白质载体的DNA复合物、DNA与磷酸钙共沉淀、将DNA封装入各种形式的脂质体中、微粒轰击{Tang,D.等,1992},{Eisenbraun,M.等,1993}以及用克隆的逆转录病毒载体进行体内感染{Seeger,C.等,1984}。
另一方面,本发明涉及与按照本发明的任一超免疫血清反应性抗原及其片段结合的肽,以及制备所述肽的方法,由此该方法的特征在于按照本发明的超免疫血清反应性抗原及其片段的应用,而基本的步骤则是本领域技术人员所已知的。
所述肽可依照本领域不同情形下利用不同的方法产生,诸如噬菌体展示或核糖体展示。假使用噬菌体展示,基本上肽库是以噬菌体的形式产生的,且
将此类文库与靶分子(在本情形中按照本发明的超免疫血清反应性抗原及其片段)接触。随后从各自的反应液中洗下与靶分子结合的肽,优选作为与靶分子在一起的复合物被洗下。结合特征,至少一定程度上,取决于具体实行的实验安排,诸如盐浓度等等,这是本领域技术人员所已知的。在将以较高的亲和力或较大的势能与靶分子结合的那些肽从文库中未结合的成员中分隔出来后,以及任选的同样在将靶分子从靶分子和肽的复合物中取出后,可随后对相应的肽进行定性。4在定性前可任选的进行扩增,诸如,通过培养肽编码噬菌体。所述定性优选包括对靶结合肽进行测序。基本上,所述的肽不局限于其长度,不过,优选以相应的方法获得长度为大约8-20个氨基酸的肽。文库的大小可能在大约102-1018种不同的肽,优选108-1015种不同的肽,不过,并不局限于此。
结合超免疫血清反应性抗原及其片段的具体形式靶分子是德国专利申请DE 197 42 706中所述的所谓“抗促成素”。
另一方面,本发明涉及与按照本发明的任一超免疫血清反应性抗原及其片段相互作用的的功能性核酸,以及制备所述功能性核酸的方法,因此该方法的特征在于按照本发明的超免疫血清反应性抗原及其片段的应用,而基本的步骤则是本领域技术人员所已知的。功能性核酸优选为适体和spiegelmers。
适体是单链或双链且特异与靶分子相互作用的D-核酸。适体的制备和选择参阅,例如欧洲专利EP 0 533 838。基本上采用了以下步骤。首先,提供核酸的混合物,即,可能的适体,因此各核酸通常包含一区段数个、优选至少8个连续的随机核苷酸。此混合物随后与靶分子接触从而使所述核酸与靶分子结合,这是基于与候选混合物相比,该混合物对靶分子的亲和力有所增加或对其具有更大的势能。结合的核酸(一个或多个分子)随后从留下的混合物中分离出来。任选的,用例如聚合酶链式反应扩增由此获得的核酸。这些步骤可重复数次得到具有特异结合靶分子的较高比率核酸的混合物,然后任选的从中选择最终结合的核酸。这些特异结合的核酸被称为适体。显而易见在产生或鉴定单个核酸混合物的适体样品的方法的任一阶段都可用标准技术测定其序列。可通过例如引入本领域技术人员已知产生适体的预定化学基团使适体稳定,这也在本发明的范围内。这样的修饰可能,例如,位于核苷酸的糖基部分2’位置处引入一氨基。适体目前被用作治疗剂。不过,由此选择或产生的适体可用于靶分子的确认和/或用于先导物质被开发成药物,优选以小分子为基础的药物开发,这也在本发明的范围内。这事实上是通过竞争性试验完成的,其中靶分子和适体之间的相互作用被候选药物通过从靶分子和适体的复合物中置换出适体而被抑制,假设各个候选药物可特异的抑制靶分子和适体之间的相互作用,且如果相互作用是特异的,所述的候选药物就,至少在原则上,适于封闭靶分子并因此降低其在含所述靶分子的相应体系中的生物利用度或活性。由此获得的小分子可然后被进一步的衍生和修饰以使它物理、化学、生物学和/或医学特性,诸如毒性、特异性、生物降解性和生物利用度最优化。
Spiegelmer及其产生或制备是基于相似的原理。spiegelmer的制备参阅国际专利申请WO 98/08856。Spiegelmer是L型核酸,这意味着它们是由L型核苷酸而非象适体那样由D型核苷酸组成的。Spiegelmer实际上的特征在于与适体相比,它们在生物学体系中具有非常高的稳定性,特异地与它们所针对的靶分子相互作用。在spiegelmer产生过程中,建立了一组异源D-核酸,将所述的那组异源D核酸与靶分子的旋光对映体接触,在本情形中例如按照本发明的超免疫血清反应性抗原及其片段的天然存在L型对映体的D对映体。随后,分隔开不与靶分子的旋光对映体相互作用的那些D核酸。而那些与靶分子旋光对映体相互作用的那些D核酸被分离、任选的测定和/或测序并随后基于获自D核酸的核酸信息合成相应的L核酸。这些L核酸在序列形式上与跟靶分子的旋光对映体相互作用的上述D核酸相同,将特异的与天然存在的靶分子而非其旋光对映体相互作用。与适体产生方法类似,也可能数次重复多个步骤并因此富集与靶分子的旋光对映体特异相互作用的那些核酸。
另一方面,本发明涉及与按照本发明的核酸分子相互作用的功能性核酸,以及用于制备所述功能性核酸的方法,其中该方法的特征在于使用了按照本发明的核酸分子及其相应序列且基本步骤是本领域技术人员所已知的。功能性核酸优选是核酶、反义寡核苷酸和siRNA。
核酶是优选由RNA组成且基本上包含两部分的催化活性核酸。第一部分显示出催化活性,而第二部分负责与靶核酸的特异相互作用,在本情形中靶核酸是编码按照本发明的超免疫血清反应性抗原及其片段的核酸。基于靶核酸与核酶第二部分之间的相互作用,通常是通过杂交和在两条杂交链上基本上互补的碱基伸展段的Watson-Crick碱基配对,催化活性部分可被活化,即,如果所述核酶的催化活性是磷酸二酯酶活性,那么它在分子内或分子间催化靶核酸。随后,靶核酸可能进一步降解,这最后导致了靶核酸以及来源与所述靶核酸的蛋白质的降解。核酶、其用途和设计原则是本领域技术人员所已知的,可参阅{Doherty,E.等,2001}和{Lewin,A.等,2001}。
用于药物制备及作为诊断剂的反义寡核苷酸的活性和设计分别基于相似的作用模式。基本上,反义寡核苷酸基于碱基互补与靶RNA杂交,优选与mRNA杂交,从而激活RNase H。RNase H被磷酸二酯和硫代磷酸酯二者偶联的DNA激活。不过,磷酸二酯偶联的DNA被细胞核酸酶快速降解,而硫代磷酸酯偶联的DNA则不会。这些抗性、非天然存在DNA衍生物通过与RNA杂交而不抑制RNase H。换而言之,反义多核苷酸只作为DNA RNA杂交复合物有效。其中,这类反义寡核苷酸的例子参阅美国专利5,849,902和US 5,989,912。换言之,基于靶分子的核酸序列,即,在本案例中是针对按照本发明的超免疫血清反应性抗原及其片段的核酸分子,或来自相应核酸序列原则上可从中推导出来的靶蛋白,或通过同样的了解所述核酸序列,尤其是mRNA,可基于碱基互补的原则设计适当的反义寡核苷酸。
尤其优选的是具有硫代磷酸酯的短伸展段的反义寡核苷酸(3-6个碱基)。最短3个DNA碱基是细菌RNase H活化所需要的,而最短5个碱基是哺乳动物RNase H活化所需要的。在这些嵌合寡核苷酸中存在形成RNase H底物的中心区,两侧是由不会形成RNase H底物的修饰过的核苷酸组成的杂交“臂”。嵌合寡核苷酸可被诸如2′-O-甲基或2′-氟代等修饰。备选的方案是在所述的臂中使用磷酸甲酯或氨基磷酸酯键。在本发明实践中有效的反义寡核苷酸的别的实施方案是P-甲氧基寡核苷酸、部分的P-甲氧基寡脱氧核糖核苷酸或P-甲氧基寡核苷酸。
对于本发明而言特别相关和有效的是如以上提及的两个美国专利中所更具体描述的那些反义寡核苷酸。这些寡核苷酸包含非天然存在的5′→3′-连接核苷酸。更确切的说,寡核苷酸具有两种类型的核苷酸:2′-脱氧硫代磷酸酯,它激活RNase H,以及2′-修饰的核苷酸,它不激活RNaseH。2′-已修饰的核苷酸之间的键可以是磷酸二酯、硫代磷酸酯或P-乙氧基磷酸二酯。RNase H的活化是通过含3-5个2’脱氧硫代磷酸酯核苷酸的邻近RNaseH-活化区激活细菌的RNase H以及含5-10个2′-脱氧硫代磷酸酯核苷酸的邻近RNase H-活化区激活真核的、尤其是哺乳动物的RNase H而完成的。防止降解的保护作用是通过形成5′和3′末端碱基高度核酸酶抗性以及任选的通过安置3′末端封闭基团而完成。
更具体而言,所述的反义寡核苷酸包含-5′末端和-3′末端;和11-59个独立选择自2’-修饰磷酸二酯核苷酸和2’-修饰P-烷氧基磷酸三酯核苷酸的5′→3′-连接核苷酸;且其中5′-末端核苷附着于3-10个毗连硫代磷酸酯连接脱氧核糖核苷酸的RNase H-活化区,且其中所述寡核苷酸的3′-末端选自:反向的脱氧核糖核苷酸、1-3个硫代磷酸酯2’-修饰核糖核苷酸的毗连伸展段、生物素基团和P-烷氧基磷酸三酯核苷酸。
还可使用其中不是5′末端核苷附着于RNase H-活化区而是3′末端核苷如上所述附着于RNase H-活化区的反义寡核苷酸。此外,5′末端选自不同于所述寡核苷酸3′末端的特殊基团。
按照本发明的核酸以及超免疫血清反应性抗原及其片段可用作或用于制备药物组合物,尤其是疫苗。优选所述的药物组合物、优选疫苗是用于预防或治疗化脓链球菌引起、涉及或相关的疾病。在此范围内,本发明的另一方面涉及在个体、尤其是哺乳动物内引起免疫应答的方法,它包括用按照本发明的超免疫血清反应性抗原及其片段或其片段或变体接种个体,足以产生抗体以保护所述个体不受感染,尤其是链球菌感染,最具体而言是化脓链球菌感染。
本发明的另一方面涉及在个体中诱发免疫应答的方法,它包括,通过基因治疗或其它方法运送功能性编码超免疫血清反应性抗原及其片段或其片段或变体的核酸,以便在体内表达超免疫血清反应性抗原及其片段或其片段或变体,从而诱导免疫应答产生抗体或细胞介导的T细胞应答(产生细胞因子的T细胞或细胞毒性T细胞),以保护所述的个体免受疾病的侵袭,无论该疾病是已存在于个体内的或未存在其中的。施加基因的一个方式是将其包被在颗粒或其它物质上加速进入预定细胞中。
本发明的另一方面涉及免疫学组合物,所述组合物在引入能在其中诱发免疫应答的宿主时在该宿主中诱发免疫应答,其中的组合物包含编码和表达按照本发明的超免疫血清反应性抗原及其片段的抗原的重组DNA。免疫学应答可用于治疗或预防,且可采用抗体免疫性或细胞免疫性的形式,诸如由CTL或CD4+T细胞产生的免疫性。
本发明的超免疫血清反应性抗原及其片段或其片段可与辅助蛋白质融合,所述辅助蛋白质可能自身不产生抗体,但能稳定上述第一种蛋白质并产生具有免疫原性和保护特性的融合蛋白。这种融合的重组蛋白质优选进一步包含抗原性辅助蛋白,诸如谷胱甘肽-S-转移酶(GST)或β-半乳糖苷酶,稳定蛋白质并方便其产生和纯化的相对大的辅助蛋白。此外,辅助蛋白在提供免疫系统全身性刺激的意义上可用作佐剂。辅助蛋白可附着于第一种蛋白质的氨基或羧基末端。
此外,本发明提供了在化脓链球菌感染的动物模型的所述遗传免疫接种实验中使用所述的核酸分子或其特殊片段的方法。所述片段对于鉴定能引起预防或治疗免疫应答的蛋白质表位是特别有效的。此方法可随后从成功抵抗或清除感染所必需的器官内产生特殊意义的单克隆抗体,用于哺乳动物、尤其是人体内化脓链球菌预防剂或治疗方法的研发。
超免疫血清反应性抗原及其片段可作为抗原用于宿主的疫苗接种从而产生特异抗体保护宿主抵抗细菌入侵,例如,通过阻断细菌在受损伤组织的粘附。组织损伤的例子包括由例如机械、化学或热损伤或留置装置的植入造成的皮肤或结缔组织伤口,或诸如口腔、乳腺、尿道或阴道等黏膜中的伤口。
本发明还包括含与适当载体在一起的免疫原性重组蛋白质的疫苗制剂。由于蛋白质在胃中可分解,因此优选非肠道施用,包括,例如,皮下、肌肉内、静脉内或皮内施用。适于非肠道施用的制剂包括以下各项的水性和非水性无菌注射液:抗氧化剂、缓冲液、抑菌剂和使制剂与个体的体液(优选血液)等渗的溶质,以及可包含悬浮剂或增稠剂在内的水性和非水性无菌悬浮液。制剂可以单位剂量或多剂量包装出现,例如,封装在安瓿和小瓶中,且可以冻干状态储存,只需在临用前加入无菌液态载体即可。疫苗制品还可包括用于增强制品免疫原性的佐剂体系,诸如水包油体系和本领域已知的其它体系。剂量取决于疫苗的特异活性且可用常规实验方便的测定。
另一方面,本发明涉及包含了本发明所提供针对化脓链球菌而言的超免疫血清反应性抗原或其片段的药物组合物。所述药物组合物可包含抗化脓链球菌的一个或多个超免疫血清反应性抗原或其片段。任选的,所述的化脓链球菌超免疫血清反应性抗原或其片段还可与抗其它病原体的抗原组合于联合药物组合物中。优选地,所述的药物组合物是用于预防或治疗化脓链球菌和/或其它病原体引起的感染的疫苗,针对所述病原体的抗原已包含于该疫苗中。
依照另一方面,本发明涉及包含如上所鉴定针对化脓链球菌的编码超免疫血清反应性抗原或其片段的核酸分子的药物组合物。所述的药物组合物可包含编码针对化脓链球菌的超免疫血清反应性抗原或其片段的一个或多个核酸分子。任选的,所述编码超免疫血清反应性抗原或其片段的化脓链球菌核酸分子还可与编码针对其它病原体的抗原的核酸分子组合于联合型药物组合物中。优选地,所述的药物组合物是用于预防或治疗化脓链球菌和/或其它病原体引起的感染的疫苗,针对所述病原体的抗原已包含于该疫苗中。
药物组合物可包含任何适当的辅助物质,诸如缓冲物质、稳定剂或更进一步的活性成分,尤其是已知与药物组合物和/或疫苗产生有联系的成分。
对于按照本发明的超免疫血清反应性抗原、其片段或其编码核酸分子而言优选的载体和/或赋形剂是用于进一步刺激免疫应答产生超免疫血清反应性抗原、其片段或其编码核酸分子的免疫刺激化合物。优选的在按照本发明的药用制剂中的免疫刺激化合物选自聚阳离子物质,尤其是聚阳离子肽、免疫刺激核酸分子,优选免疫刺激脱氧核苷酸、明矾、弗氏完全佐剂、弗氏不完全佐剂、神经刺激化合物,尤其是人生长激素,或它们的组合。
也在本发明范围内的是,药物组合物、尤其是疫苗除了按照本发明的超免疫血清反应性抗原、其片段和/或其编码核酸分子之外还包含生物学或制药学活性的其它化合物。优选地,所述组合物包含至少一种聚阳离子肽。依照本发明使用的聚阳离子化合物可能是显示出符合WO 97/30721的特征性作用的任何聚阳离子化合物。优选的聚阳离子化合物选自碱性多肽、有机聚阳离子、碱性聚氨基酸或它们的混合物。这些聚氨基酸应具有至少4个氨基酸残基的链长(WO 97/30721)。尤其优选的是类似聚赖氨酸、聚精氨酸和多肽的物质或它们的混合物,其中在8个以上氨基酸的范围内、尤其是20个以上氨基酸残基的范围内含20%以上、尤其是50%以上碱性氨基酸。其它优选的聚阳离子和它们的药物组合物参阅WO 97/30721(例如,聚乙烯亚胺)和WO 99/38528。优选这些多肽包含20-500个之间的氨基酸残基,尤其是在30-200个残基之间。
这些聚阳离子化合物可化学或重组产生或可来自天然来源。
阳离子(多)肽还可以是具有如综述{Ganz,T.,1999}中所述的抗微生物特性。这些(多)肽可能是原核的或动物的或植物来源的或可化学或重组产生(WO 02/13857)。肽还可以属于防卫素类型(WO 02/13857)。所述肽的序列可发现于,例如,以下网址的抗微生物序列数据库:
http://www.bbcm.univ.trieste.it/~tossi/pag2.html
所述宿主防御肽或防御工具也是优选形式的按照本发明的聚阳离子聚合体。通常,允许作为优选由APC(包括树状细胞)介导的适应性免疫系统活化(或下调)终产物的化合物被用作聚阳离子聚合体。
在本发明中尤其优选用作聚阳离子物质的是cathelicidin来源抗微生物肽或其衍生物(在此收编作为参考的国际专利申请WO 02/13857),尤其是来源于哺乳类cathelicidin、优选来自人、牛或小鼠的抗微生物肽。
天然来源的聚阳离子化合物包括HIV-REV或HIV-TAT(来自阳离子肽、触角(antennapedia)肽、壳聚糖或几丁质的其它衍生物)或通过生化或重组产生的来源于这些肽或蛋白质的其它肽。其它优选的聚阳离子化合物是cathelin或cathelin的相关或衍生物质。例如,小鼠的cathelin是具有氨基酸序列NH2-RLAGLLRKGGEKIGEKLKKIGOKIKNFFQKLVPQPE-COOH的肽。相关或衍生cathelin物质包含cathelin的全部或具有至少15-20个氨基酸残基的部分。衍生可包括用不在20个标准氨基酸之内的氨基酸进行的天然氨基酸替代或修饰。此外,更多的阳离子残基可引入所述cathelin分子中。这些cathelin分子优选与抗原组合。这些cathelin分子令人惊讶的显示出也可有效的作为抗原的佐剂而无需添加另外的佐剂。因此可能利用所述cathelin分子作为疫苗制品中的有效佐剂,可以有或没有另外的免疫活化物质。
可依照本发明使用的另一优选的多阳离子物质是含有由3-7个疏水氨基酸组成的接头隔开的至少2个KLK-基序的合成肽(国际专利申请WO02/32451,结合于此作为参考)。
本发明的药物组合物可进一步包含免疫刺激核酸。免疫刺激核酸是,例如,含有核酸的中性或人造CpG,所述核酸是来自非脊椎动物的核酸短伸展段或者是在某一碱基段含非甲基化的胞嘧啶-鸟嘌呤双核苷(CpG)的短寡核苷酸形式(ODNs)(例如,参阅WO 96/02555)。或者,如WO01/93903中所述基于肌苷和胞苷的核酸或含脱氧肌苷和/或脱氧尿苷残基的脱氧核酸(参阅WO 01/93905和PCT/EP 02/05448,结合于此作为参考)也可优选用作本发明的免疫刺激核酸。优选地,不同免疫刺激核酸的混合物可依照本发明使用。
也属于本发明范围的是任一上述聚阳离子化合物与任一上述免疫刺激核酸组合。优选地,所述的组合是与结合于此作为参考的以下文献之一所述的一致的:WO 01/93905、WO 02/32451、WO 01/54720、WO 01/93903、WO 02/13857和PCT/EP 02/05448以及奥地利专利申请A 1924/2001。
另外或备选的所述疫苗组合物除了包含按照本发明的超免疫血清反应性抗原及其片段以及它们的编码核酸之外,还可包含刺激神经组织的化合物。优选地,刺激神经组织的化合物是人生长因子,如WO 01/24822中所述。同样优选的是,刺激神经组织的化合物与上述任一聚阳离子化合物和/或免疫刺激核酸组合。
本发明的另一方面涉及药物组合物。所述的药物组合物是,例如,本文所述的疫苗。药物组合物还是包含以下任一种化合物或其组合的药物组合物:按照本发明的核酸分子、按照本发明的超免疫血清反应性抗原及其片段、按照本发明的载体、按照本发明的细胞、按照本发明的抗体、按照本发明的功能性核酸以及诸如抗促成素等按照本发明的结合肽、本文所述的任何激动剂和拮抗剂。与之有关的是任一这些化合物都可与针对细胞、组织或器官的未消毒或消毒载体(一种或多种)组合使用,诸如适于施用于某受试者的药用载体。所述组合物包括,例如,培养基添加剂或治疗有效量的本发明超免疫血清反应性抗原及其片段和药用可接受载体或赋形剂。所述载体可包括,但不局限于:盐、缓冲盐、葡萄糖、水、甘油、乙醇及它们的组合。该制剂应与施用模式相配。
药物组合物可以任一有效的、方便的形式施用,其中包括,例如,局部、口、肛门、阴道、静脉内、腹膜内、肌肉内、皮下、鼻内或皮内途径施用。
在治疗中或作为预防药,活性试剂可作为可注射组合物施用于个体,例如,作为无菌水分散液,优选等渗的。
或者组合物可制备成局部应用的,例如以药膏、霜、洗液、眼膏、滴眼液、滴耳液、漱口水、浸渍敷料和缝合线和气雾剂形式,且可包含合适的常规添加剂,包括,例如,防腐剂、帮助药物渗透的溶剂以及在药膏和霜中的润肤剂。这样的局部制剂还可包含兼容的常规载体,例如霜或软膏基质、以及用于洗液的乙醇或油醇。所述的载体组成可占制剂重量的约1%-98%,更通常的是组成高达制剂重量的约80%。
除了上述治疗之外,本发明组合物通常还可用作伤口处理剂以防止细菌粘附于伤口组织中暴露的基质蛋白质上,且可作为抗生素预防疗法的另一备选方案或与其结合使用于牙科治疗的预防性应用中。
疫苗组合物便利的是以可注射形式。常规的佐剂可用于增强免疫应答。疫苗接种的适当单位剂量是0.05-5μg/kg抗原,这样的剂量优选施用1-3次且间隔1-3周。
采用指定的剂量范围,应不会观察到本发明化合物的毒理学副作用,如果有就将停止它们施用于适当个体。
在另一实施方案中,本发明涉及包含了填充有一种或多种本发明上述组合物成分的一个或多个容器的诊断和药物包裹和试剂盒。所述成分可以有效量、剂量、制剂或组合存在。与所述容器相关的是管理制药的政府机构规定形式的说明书、药品或生物产品的用途或销售,反映出制药机构同意该产品的应用或销售是针对人进行施用的。
与本发明有关且涉及本文所述用途(例如,药物组合物或疫苗的应用)的任何疾病具体而言是由链球菌、更优选化脓链球菌引起、连接或相关的疾病或疾病状况。与此有关应注意的是化脓链球菌包含本文所述那些菌株在内的数个菌株。涉及依照本发明待预防和/或治疗的细菌感染、尤其引起或与其相关的疾病除了包括细菌性咽炎之外,还包括人的猩红热、脓疱病、风湿热、坏死性筋膜炎和脓毒病。
在另一实施方案中,本发明涉及利用按照本发明的任一超免疫血清反应性抗原或核酸的筛选方法。筛选方法对于本领域技术人员而言同样是已知的,且可设计成筛选激动剂或拮抗剂的。优选在抑制或阻碍按照本发明的任一超免疫血清反应性抗原及其片段与相互作用配体的结合的情况下筛选拮抗剂。所述的相互作用配体可以是天然存在的相互作用配体或非天然存在的相互作用配体。
本发明还提供了筛选方法用于鉴定化合物是否增强(激动剂)或阻断(拮抗剂)本发明的超免疫血清反应性抗原及其片段或核酸分子的功能,诸如它们与结合分子的相互作用。筛选方法可涉及高通量。
例如,为了筛选激动剂或拮抗剂,分别按照本发明的核酸分子和核酸的相互作用配体可能是合成的反应混合物、细胞区室(诸如膜、细胞被膜或细胞壁)或它们中任一种的制剂,可从表达结合本发明的超免疫血清反应性抗原及其片段的分子的细胞中制备。在可能是激动剂或拮抗剂的候选分子缺乏或存在的条件下将所述制剂与标记好的超免疫血清反应性抗原及其片段一起温育。候选分子与结合分子结合的能力反映在被标记配体的结合有所下降。无偿结合的分子,即,不诱发超免疫血清反应性抗原及其片段的功能性作用的分子,最有可能是好的拮抗剂。可很好结合且引起与超免疫血清反应性抗原及其片段相同或非常接近的功能作用的分子是良好的激动剂。
潜在激动剂和拮抗剂功能作用可通过,例如,在候选分子与细胞或适当细胞制剂相互作用后测定报道体系的活性来检测,且将此效用与本发明超免疫血清反应性抗原及其片段或所引起作用与超免疫血清反应性抗原及其片段相同的分子的效用进行比较。这方面可用的报道体系包括但不局限于转换成产物的标记底物的比色分析、对超免疫血清反应性抗原及其片段功能活性中的变化作出响应的报道基因以及本领域已知的结合试验。
检测拮抗剂的另一例子是在适于进行竞争性抑制试验的条件下将本发明的超免疫血清反应性抗原及其片段和具有膜结合分子、重组结合分子、天然底物或配体或底物或配体模拟物的可能拮抗剂结合。超免疫血清反应性抗原及其片段可被诸如放射性或比色分析化合物标记,从而可准确测定与结合分子结合或转换成产物的超免疫血清反应性抗原及其片段的分子数目以评估可能性拮抗剂的效力。
可能性的拮抗剂包括与本发明的超免疫血清反应性抗原及其片段结合并从而抑制或消除其活性的小有机分子、肽、多肽和抗体。可能的拮抗剂还可以是结合于结合分子的同一位点且不会诱导产生本发明的超免疫血清反应性抗原及其片段的功能活性的小有机分子、肽、诸如紧密相连的蛋白质或抗体等多肽。
可能的拮抗剂包括结合并占领超免疫血清反应性抗原及其片段的结合位点因此阻碍其与细胞结合分子结合从而使正常生物学活性被抑制的小分子。小分子的例子包括但不局限于小的有机分子、肽或肽类似分子。其它的可能性拮抗剂包括反义分子。
其它的可能性拮抗剂包括反义分子(参阅{Okano,H.等,1991};作为基因表达反义抑制物的寡脱氧核苷酸OLIGODEOXYNUCLEOTIDES ASANTISENSE INHIBITORS OF GENE EXPRESSION;CRC出版社,BocaRation,FL(1988),以描述这些分子)。
优选的可能性拮抗剂包括本发明的超免疫血清反应性抗原及其片段的衍生物。
用于此处时,按照本发明的超免疫血清反应性抗原及其片段的活性是它们与其任一相互作用配体结合的性能或与自身的或任何相互作用配体结合的所述性能的程度。
在某一具体方面,本发明提供了本发明的超免疫血清反应性抗原及其片段、核酸分子或抑制剂在干预病原体和被造成感染后遗症的哺乳动物宿主之间最初的物理学相互作用中的应用。具体而言本发明的分子可用于:i)防止化脓链球菌对留置装置上的哺乳动物胞外基质蛋白质或伤口处的胞外基质蛋白质的粘附;ii)封闭通过例如启动哺乳动物酪氨酸激酶的磷酸化作用而介导哺乳动物细胞侵入的蛋白质{Rosenshine,I.等,1992};iii)阻断哺乳动物胞外基质蛋白质和介导组织损伤的细菌蛋白质之间的细菌粘附;iv)阻断除了通过留置装置植入或通过其它外科技术之外的方式引起的感染中发病的进程。
本文所提供的各个DNA编码序列可用于抗菌化合物的探索和开发中。表达后的编码蛋白质可用作抗菌药物筛选的靶目标。此外,编码所述编码蛋白质氨基末端区域的DNA序列或相应mRNA的Shine-Delgarno或其它方便翻译的序列可用于构建反义序列以控制目的编码序列的表达。
拮抗剂和激动剂可用于,例如,抑制链球菌、尤其是化脓链球菌引起的疾病,诸如脓毒病。
另一方面,本发明涉及亲和力装置,所述的亲和力装置包括至少一种支持材料和附着在支持材料上的任一按照本发明的超免疫血清反应性抗原及其片段。由于按照本发明的超免疫血清反应性抗原及其片段对其靶细胞或靶分子或其相互作用配体的特异性,如果符合结合条件,超免疫血清反应性抗原及其片段可从加到支持物的任一种样品中选择性的除去它们的相互作用配体。样品可以是生物学或医学样品,包括但不局限于,发酵液、细胞碎片、细胞制剂、器官制剂、血液、尿、淋巴液、流体等。
超免疫血清反应性抗原及其片段可以共价或非共价方式附着于基质上。适当的支持材料是本领域技术人员所已知的且可选自纤维素、硅、玻璃、铝、顺磁珠、淀粉和右旋糖苷。
通过以下图、实施例和序列表对本发明进行了进一步的描述,其中可见更多的特征、实施方案和优势。应理解这些实施例只是以例证方式给出而不是对内容的局限。
与本发明有关:
图1显示了化脓链球菌特异人血清的特性。
图2显示了来自化脓链球菌SF370/M1的小片段基因组文库LSPy-70的特性。
图3显示了用生物素化的人IgGs通过MACS选择细菌细胞。
图4显示了用已确定抗原进行基因分布研究的例子。
图5显示了用流式细胞计着色的细胞表面。
图6显示了已确定的重组化脓链球菌抗原的预防用途。
表1显示了用基因组化脓链球菌文库和人血清进行的所有筛选的概况。
表2显示了有关人血清的表位血清学。
表3显示了针对50个化脓链球菌菌株中已确定抗原的基因分布分析概况。
表4总结了用于免疫接种实验中的抗原蛋白的有关信息。
表5显示了在6个不同化脓链球菌菌株中抗原蛋白的可变性。
本说明书中可提及的图详述如下。
图1显示了用ELISA检测的人血清对化脓链球菌的鉴定。
图2显示了化脓链球菌SF370/M1小片段基因组文库LSPy-70的片段大小分布。测序后576个随机选择克隆序列被修整以消除载体残基,并对克隆数目和多种基因组片段大小作图。(B)化脓链球菌染色体上LSPy-70的同一套随机测序克隆的分布图解。蓝圈表示在+/+方向上与所注解ORF匹配的序列。红色矩形代表在+/+方向上与非编码染色体序列完全匹配的克隆。绿色菱形标出了具互补性或嵌合序列的所有克隆的位置。碱基对中的数字间隔标示于各个环形基因组上用于定位。在图的底部给出了文库中多个克隆组分配的数目和百分比。
图3A显示了用生物素化人IgG进行的MACS选择。在第一轮中用10μg、第二轮中用1μg生物素化的人血清(P4-IgG)筛选pMAL9.1中的LSPy-70文库。作为阴性对照,在用于筛选的文库细胞中不添加血清。针对各轮选择均显示了在第一和第二轮洗脱后选择的细胞数。图3B显示了通过细菌表面展示根据用人血清(P4-IgG)进行的蛋白质印迹分析而分离的特异克隆(1-52)的反应性,所述人血清以1∶3,000的稀释度供MACS选择。作为负荷对照,用1∶5,000稀释度且直接针对平台蛋白LamB的抗体分析相同的印迹。LB,来自表达LamB且无外源肽插入的克隆的提取物。
图4A显示了针对基因分布研究分析的化脓链球菌的emm类型。图4B显示了用相应寡核苷酸对基因Spy0269的基因分布进行的PCR分析。预计的PCR片段的大小是1,000bp。1-50,在A下列举的化脓链球菌菌株;N,未加入基因组DNA;P,来自化脓链球菌SF310的基因组DNA,用作文库构建的模板。
图5用流式细胞计进行的结合于A族链球菌细胞表面的特异抗体的检测。在图5A中将免疫前小鼠血清和针对化脓链球菌裂解物产生的多克隆血清与化脓链球菌菌株SF370/M1一起温育并用流式细胞计进行分析。对照代表二抗对化脓链球菌细胞表面的非特异结合水平。图5B和5C的柱状图显示分别针对两个平台蛋白LamB和FhuA而言与对照血清相比,由于抗-Spy0012(B)或抗-Spy1315和抗-Spy1798(C)抗体的特异结合而使荧光增强。
图6用3个连续剂量的重组蛋白质(50μg/剂)间隔两周分别于0、14和28天免疫NMRI小鼠。作为阴性对照,在佐剂的存在下用PBS免疫小鼠。M1蛋白(Spy2018)被用作阳性对照用于攻击实验。用5×107个化脓链球菌AP1细胞静脉注射进行细菌的攻击并对小鼠的生存状况分别观察A)18天,B)21天和C)19天。
表1:用细菌表面展示鉴定的免疫原性蛋白质。
A,用IC3-IgG(1588)鉴定的lamB中的LSPy-7文库,B,用IC3-IgA(1539)鉴定的lamB中的LSPy-7文库,C,用IC6-IgG(1173)鉴定的lamB中的LSPy-7文库,D,用P4-IgG(1138)鉴定的lamB中的LSPy-7文库,E,用P4-IgA(981)鉴定的lamB中的LSPy-7文库,F,用IC3-IgG(991)鉴定的btuB中的LSPy-150文库,G,用IC6-IgG(1036)鉴定的btuB中的LSPy-150文库,H,用P4-IgG(681)鉴定的btuB中的LSPy-150文库,I,用IC3-IgG(559)鉴定的fhuA中的LSPy-400文库,K,用IC6-IgG(543)鉴定的fhuA中的LSPy-400文库,L,用P4-IgG(20)鉴定的fhuA中的LSPy-400文库,*,长于5个氨基酸的抗原序列的预测用软件ANTIGENIC{Kolaskar,A.等,1990}进行。
表2:关于人血清的表位血清学。
显示了代表用个别人血清选定表位的个别合成肽的免疫反应性。反应性范围是图案/灰色编码;白色:-(<50U),灰色:+(50-119U),斜线:++(120-199U),对角交叉线:+++(200-1000U)以及垂直交叉:++++(>1000U)。在背景校正后从OD545nm的读数和血清稀释度计算ELISA单位(U)。得分,所有反应性的总和(所有+数目的相加);P1至P10血清来自急性咽炎患者而N1至N10血清来自健康成人。P和N用作内在对照。
肽名称:SPO0012,注释为ORF Spy0012;SPA0450,Spy0450选择性读码框架中的潜在新ORF;SPC0406,Spy0406互补链上的潜在新ORF;SPN0001,非编码区中的潜在新ORF。
表3:化脓链球菌菌株中的基因分布。
用特异于相应抗原编码基因的寡核苷酸通过PCR检测图4A中所示的50个化脓链球菌菌株。对某一选定PCR片段的PCR片段进行测序以证实正确DNA片段的扩增。*,与化脓链球菌SF370(M1)相比菌株M89中的氨基酸替代的数目。#,因为基因不存在于M89中而用于测序的备选菌株。
表4:用于NMRI小鼠中免疫接种实验的重组蛋白质。
如实验步骤中所述用重组抗原进行免疫接种以及用致病的化脓链球菌AP1攻击。A,给出了与全长蛋白质相比的用于动物免疫接种实验的重组蛋白质中所含的相应抗原的氨基酸。B,生存率的百分比表示为保护状态且圆括号中插入语描述了阴性对照(PBS免疫)的保护状态的百分比,随后是阳性对照(Spy2018)保护状态的百分比。C,由于尽管在观察结束时所有小鼠都死了,但小鼠仍显示出较好的生存状态这一事实而选择Spy0269。这通过检测如下的平均生存时间可以反映出来:14.6(Spy0269)、11.6(PBS)和19.3天(Spy2018)。
表5:来自化脓链球菌的抗原蛋白的序列变异。
针对在实验步骤下所列举的6个不同化脓链球菌中的氨基酸交换分析抗原蛋白质。残基编号指示该氨基酸在全长蛋白质中的位置。以Spy1666为例,列举了相对于肺炎链球菌TIGR4(SP0334)中同源基因的变化,因为基因在化脓链球菌以及肺炎链球菌中是高度保守的。A,来自化脓链球菌SF370的蛋白质中的氨基酸残基;B,如果不同于化脓链球菌SF370,可能存在于来自另5个化脓链球菌菌株的任一被分析基因中的氨基酸残基;C,催化活性中所涉及的Spy0416残基。预期这些残基的变化以使所述酶失活并因此在实验上用丙氨酸、丝氨酸、苏氨酸交换甘氨酸以产生酶失活的重组蛋白质。
实施例
实施例1:从人血清制备抗体
人免疫体系产生且存在人血清中的抗A族链球菌抗体是抗原蛋白质体内表达及其免疫原性的的指征。这些分子是在本发明所述方法中个别抗原的鉴定所必需的,它是以特异的抗链球菌抗体及其相应的化脓链球菌肽或蛋白质之间的相互作用为基础的。为了得到相应的抗体全部组分,从以下来源收集人血清:
I.急性化脓链球菌感染患者,诸如咽炎、伤口感染和菌血症(通过医学微生物学检测显示出化脓链球菌是病原体),
II.未感染的健康成人,由于A族链球菌感染是常见的,抗体作为天然免疫的结果存在于先前接触了链球菌的个体中。
用一系列ELISA和免疫印迹检测针对抗化脓链球菌抗体鉴定血清。数种链球菌抗原已用于显示所检测的效价不是交叉反应抗体的总和结果。为此目的使用了两种不同的抗原制剂:从过夜培养(稳定期)于THB(Todd-Hewitt肉汤)生长培养基中的化脓链球菌SF370/M1中制备全细胞提取物或培养物上清蛋白质。IgG和IgA两种抗体水平均被测定。以针对两种抗原制剂的总抗体滴度为基础通过免疫印迹选择血清以供进一步的分析。
在反应为线性的给定稀释度比较所述滴度(图1)。将血清按针对多种链球菌组分的反应性进行排列,选用那些反应性最高的血清进行进一步的免疫印迹分析。此广泛的抗体表征方法已使抗链球菌超免疫血清得以明确的鉴定。
最近,据报道不仅是IgG,还有IgA血清抗体可被PMN的FcRIII受体识别并促进调理作用{Phillips-Quagliata,J.等,2000;Shibuya,A.等,2000}。IgA抗体的首要任务是起中和作用,主要在黏膜表面。血清IgA的水平反映了二聚体分泌IgA的质量、数量和特异性。为此原因,不只分析血清集合的抗链球菌IgG,还可分析其IgA水平。在ELISA检测法中使用了高度特异的二级试剂来检测高亲和力类型的抗体,诸如IgG和IgA,而消除了IgM。IgM抗体的产生出现于初级适应性体液应答期间并产生了低亲和力抗体,而IgG和IgA抗体已经过亲和成熟且在抗击或预防疾病中更有价值。
实验步骤
肽合成
用SyroII合成仪(Multisyntech,Witten,Germany)在Rink酰胺树脂上(PepChem,Tübingen,Germany)通过标准F-moc化学法小量合成肽(4mg树脂,平行最多合成288mg)。序列装配好后,用Fmoc-ε-氨基已酸(作为接头)和生物素(Sigma,St.Louis,MO;象正常氨基酸一样被激活)延伸肽。利用93%TFA、5%三乙基硅烷和2%水作用1小时将肽从树脂上分离下来。将肽从乙腈/水(1∶1)中真空干燥并冻干三次。用质谱技术在Reflex IIIMALDI-TOF(Bruker,Bremen Germany)上证实正确质量的存在。所述的肽直接使用而无需进一步纯化。
酶联免疫检测法(ELISA).
对于血清鉴定而言:用稀释于包被缓冲液(0.1M碳酸钠pH 9.2)的5-10μg/ml总蛋白包被ELISA平板(Maxisorb,Millipore)。在PBS-BSA中制备了三种稀释度的血清(2,000X、10,000X、50,000X)。
对于肽血清学而言:依照制造商的说明书以10μg/ml的浓度将生物素标记的肽包被于链霉亲和素ELISA平板(EXICON)上。在两个稀释度检测血清,200X和1,000X。
依照制造商的建议(稀释度:1,000x)使用高特异性的辣根过氧化物酶(HRP)-偶联的抗人IgG或抗人IgA二抗(Southern Biotech)。基于自动ELISA读数仪(TECAN SUNRISE)中的OD405nm读数通过检测底物(ABTS)向显色产物的转换从而对抗原-抗体复合物进行定量。在人工包被后,用内置读数仪(GENIOS,TECAN)通过Gemini 160ELISA自动仪(TECAN)对肽平板进行处理和分析。
免疫印迹法
从体外培养的化脓链球菌SF370/M1中制备总细菌裂解产物和培养物上清样品。用BioRad Mini-Protean 3 Cell电泳体系通过SDS-PAGE分离10-25μg总蛋白/泳道并将蛋白质转到硝酸纤维素膜(ECL,AmershamPharmacia)上。在5%的牛奶中过夜封闭后,加入2,000x倍稀释的抗血清,并将HRPO标记的抗小鼠IgG用于检测。
细菌抗原提取物的制备
总细菌裂解产物:重复冻融裂解细菌:温育于干冰/乙醇混合物中直至冻结(1分钟),然后融解于37℃(5分钟);重复3次。随后超声波降解并离心收集上清(3,500rpm,15分钟,4℃)。
培养物上清液:除去细菌后,用冰冷的乙醇(100%)沉淀过夜培养的细菌培养物上清液:1份上清液/3份乙醇于-20℃放置过夜。离心收集沉淀(2,600g,15分钟)并干燥。将干的沉淀或者溶解于PBS以备ELISA,或者溶解于尿素和SDS样品缓冲液中以备SDS-PAGE和免疫印迹。用Bradford检测法检测样品的蛋白质浓度。
纯化抗体以备基因组筛选。基于筛选步骤中所用血清集合的总抗链球菌滴度选择来自患者以及未感染组的5份血清。通过将热灭活血清与所有样品中的大肠杆菌细胞(DH5α,用pHIE11转化,在与细菌表面展示同样的条件下培养)一起保温去除抗大肠杆菌蛋白质的抗体。依照制造商的说明书(UltraLink Immobilized Protein G,Pierce)通过蛋白G亲和层析从收集的缺乏血清中产生高度富集的IgG制品。IgA抗体也是通过亲和层析利用固定于链霉亲和素-琼脂糖(GIBCO BRL)上的生物素标记抗人IgA(SouthernBiotech)进行纯化。通过SDS-PAGE、蛋白质印迹、ELISA和蛋白质浓度检测检查缺失和纯化的效率。
实施例2:化脓链球菌的高度随机且框架选定的小片段基因组DNA文库的产生
实验步骤
链球菌基因组DNA的制备。将化脓链球菌SF370/M1从冻存穿刺斜面接种于50ml Todd-Hewitt Broth培养基中并在37℃通风振荡培养18小时。然后收获培养基,1,600xg离心15分钟去上清。细菌沉淀用PBS洗3次并小心重悬于0.5ml溶菌酶溶液(100mg/ml)中。加入0.1ml的10mg/ml热处理RNase A和20U的RNase T1,小心混和并将此溶液在37℃保温1小时。加入0.2ml的20%SDS溶液和0.1ml的蛋白酶K(10mg/ml)后将此试管在55℃保温过夜。然后加入1/3体积的饱和NaCl并将该溶液在4℃保温20分钟。在微量离心管中沉淀提取物(13,000rpm)并将上清转移至一新的试管中。用PhOH/CHCl3/IAA(25∶24∶1)和CHCl3/IAA(24∶1)抽提该溶液。加入0.6倍体积的异丙醇室温沉淀DNA,用消毒的巴斯德移液管从所述溶液中将DNA缠绕在上面并转移入含80%冰冻乙醇的试管中。10-12,000xg离心沉淀回收DNA,然后空气干燥并溶于ddH2O中。
小基因组DNA片段的制备。将基因组DNA片段用杯状钻头状超声波仪(装备了BB5杯状钻头的Bandelin Sonoplus UV 2200超声波仪,10秒脉冲,100%功率输出)机械切割成大小150-300bp之间的片段或通过温和的DNase I处理(Novagen)切割成大小50-70bp范围内的片段。可观察到当将DNA断裂成150-300bp大小范围内的片段时,超声波降解法产生了密集得多的片段大小分布。不过,尽管DNA广泛暴露于超声波诱导的流体力学剪切力中,并不能同时有效和重复的达到减小片段大小的目的。因此,50-70bp大小的片段通过温和的DNase I处理利用Novagen的鸟枪裂解试剂盒获得。制备试剂盒所提供的DNaseI的1∶20稀释液并在MnCl2存在的条件下于60μl的体积中在20℃消化5分钟以保证双链都被酶所切割。用2μl的0.5M EDTA终止反应且在2%TAE-琼脂糖凝胶上评估片段化效率。此处理导致基因组DNA全部断裂成近似50-70bp的片段。然后在各种dNTP各100μM存在的条件下用T4 DNA聚合酶将片段末端补平以保证末端的有效对齐。片段可立即用于连接反应或冻存于-20℃备用。
载体的描述。在pASK-IBA主链{Skerra,A.,1994}上构建载体pMAL4.31,用β-内酰胺酶(bla)基因调换卡那霉素抗性基因。此外将bla基因克隆入多克隆位点。编码成熟β-内酰胺酶的序列之前有ompA的前导序列以使其能有效分泌穿过细胞质膜。而且编码成熟β-内酰胺酶的头12个氨基酸的序列(间隔序列)接着ompA前导肽序列之后以避免序列直接在前导肽酶切割位点之后融合,因为,例如,此区域的正电荷氨基酸簇会减少或完全破坏穿越细胞质膜的迁移{Kajava,A.等,2000}。SmaI限制性位点是用于文库插入的。用于回收选定片段的上游FseI位点和下游NotI位点在SmaI位点两侧。所述的三个限制性位点在编码所述的12个氨基酸间隔序列的序列之后插入,插入方式是bla基因转录于-1阅读框架,导致在NotI位点之后15bp产生了一个终止密码子。+1bp插入恢复了bla ORF从而产生了β内酰胺酶蛋白并随之获得了氨苄青霉素抗性。
通过将lamB基因克隆入pEH1的多克隆位点构建载体pMAL9.1{Hashemzadeh-Bonehi,L.等,1998}。随后,在第154位氨基酸之后将含限制位点FseI、SmaI和NotI的序列插入lamB中。此插入的阅读框架以此方式构建,即,通过用FseI和NotI消化从质粒pMAL4.31切下框架选定的DNA片段进行转移产生了lamB的连续阅读框架以及各自的插入片段。
通过将btuB基因克隆入pEH1的多克隆位点构建载体pMAL10.1。随后,在第236位氨基酸之后将含限制位点FseI、XbaI和NotI的序列插入btuB中。此插入的阅读框架以此方式构建,即,通过用FseI和NotI消化从质粒pMAL4.31切下框架选定的DNA片段进行转移产生了btuB的连续阅读框架以及各自的插入片段。
通过将fhuA基因克隆入pEH1的多克隆位点构建载体pHIE11。随后,在第405位氨基酸之后将含限制位点FseI、XbaI和NotI的序列插入fhuA中。此插入的阅读框架以此方式选择,即,通过用FseI和NotI消化从质粒pMAL4.31切下框架选定的DNA片段进行转移产生了fhuA的连续阅读框架以及各自的插入片段。
有关框架选择的文库克隆和评估。将化脓链球菌基因组DNA片段在SmaI位点连接入载体pMAL4.31中。使重组DNA通过电穿孔进入DH10B电感受态大肠杆菌细胞(GIBCO BRL)并将转化子铺于补充了卡那霉素(50μg/ml)和氨苄青霉素(50μg/ml)的LB琼脂上。平板在37℃保温过夜并收集菌落供大量提取DNA。贮藏并保留一个有代表性的平板以便收集菌落供菌落PCR分析和大规模测序。最初用简单菌落PCR检测确定大致的片段大小分布以及插入效率。结合插入位点的完整性以及框架选择的精确性(3n+1准则)从测序资料评估片段的大小。
有关细菌表面展示的文库克隆和评估。用限制性酶FseI和NotI从pMAL4.31载体上切下含化脓链球菌文库的基因组DNA片段。然后将全部片段群转移入已用FseI和NotI消化的质粒pMAL9.1(LamB)、pMAL10.1(BtuB)或pHIE11(FhuA)。利用这两种识别8bp富GC序列的限制性酶,在各个平台载体中保持pMAL4.31载体中选定的阅读框架。然后通过电穿孔将所述质粒文库转化入大肠杆菌DH5α细胞中。细胞铺于补充了50μg/ml卡那霉素的大LB琼脂平板上并以产生清晰可见单菌落的密度在37℃培养过夜。然后将细胞从这些平板表面刮下,用新鲜LB培养基漂洗并以等份试样贮存于-80℃以备文库筛选。
结果
用于框架选择的文库。在pMAL4.31载体中产生了大小分别约为70、150和300bp的三个文库(LSPy70、LSPy150和LSPy300)。对于每个文库而言,大约1μg pMAL4.31质粒DNA和50ng片段化的基因组化脓链球菌DNA的连接和随后的转化在框架选择后产生了4×105-2×106个克隆。为了评估文库的随机性,对大约600个随机选择的LSPy70克隆进行测序。生物信息分析显示这些克隆中只有极少的克隆出现了一次以上。此外,还显示出90%的克隆大小落在大小16-61bp之间的范围内,平均大小为34bp(图2)。所有序列遵从3n+1原则,显示出所有克隆均为正确的框架选择。
细菌表面展示文库。大肠杆菌表面的肽展示要求将来自LSPy文库的插入片段从框架选择载体pMAL4.31转移至展示质粒pMAL9.1(LamB)、pMAL10.1(BtuB)或pHIE11(FhuA)。用FseI和NotI限制酶切割基因组DNA片段并将5ng插入片段与0.1μg质粒DNA连接并随后转化入DH5a细胞,产生2-5×106个克隆。将克隆从LB平板上刮下并冻存而无需进一步扩增。
实施例3:用细菌表面展示基因文库和人血清鉴定来自化脓链球菌的高免疫原性肽序列
实验步骤
MACS筛选将来自给定文库的约2.5×108个细胞在补充了50μg/ml卡那霉素的5ml LB培养基中于37℃培养2小时。通过加入1mM IPTG 30分钟诱导表达。用新鲜的LB培养基漂洗细胞两次并将大约2×107个细胞重悬于100μl LB培养基中并转移至Eppendorf管中。
将纯化自血清的10μg生物素化人IgG加入细胞中并将此悬浮液在4℃温和摇动保温过夜。加入900μl LB培养基,将悬浮液混和并随后在4℃6,000rpm离心10分钟(对于IgA筛选而言,使用了10μg的纯化IgA并用生物素化的抗人IgG二抗捕捉它们)。用1ml LB漂洗细胞一次,然后重悬于100μl LB培养基中。加入与链霉亲和素偶联的MACS微珠(MiltenyiBiotech,Germany)10μl并在4℃继续保温20分钟。之后加入900μl LB培养基并将MACS微珠细胞悬浮液加到固定于磁铁上且已平衡好的MS柱(Miltenyi Biotech,Germany)上。(所述MS柱通过用1ml 70%乙醇洗涤一次和2ml LB培养基洗涤两次被平衡。)
然后用3ml LB培养基洗柱三次。去除磁铁后,用2ml LB培养基洗脱细胞。用3ml LB培养基洗柱后,将2ml洗脱液再次加到同一根柱子上并重复洗脱步骤。第三次进行上样、洗涤和洗脱操作,产生最终的洗脱液2ml。
第二轮筛选进行如下。离心收集最终的洗脱液中的细胞并重悬于补充了50μg/ml卡那霉素的1ml LB培养基中。将培养基在37℃保温90分钟然后用1mM IPTG诱导30分钟。随后收集细胞,用1ml LB培养基洗涤一次并重悬于10μl LB培养基中。由于体积减少,加入1μg生物素化的人IgG并在悬浮液在4℃温和摇动保温过夜。所有其它步骤完全与第一轮筛选相同。将两轮筛选后的细胞铺于补充有50μg/ml卡那霉素的LB琼脂平板上并于37℃培养过夜。
通过测序和蛋白质印迹分析评估选定的克隆.将选定的克隆在37℃于补充有50μg/ml卡那霉素的3ml LB培养基中培养过夜以便用标准方法制备质粒DNA。在MWG(Germany)或与TIGR(U.S.A.)协作完成测序。
为了进行蛋白质印迹分析,用10%SDS-PAGE分离大约10-20μg总细胞蛋白并印迹至HybondC膜(Amersham Pharmacia Biotech,England)上。用大约1∶5,000稀释的人血清作为一抗和1∶5,000稀释的偶联至HRP的抗人IgG或IgA抗体作为二抗检测LamB、BtuB或FhuA融合蛋白。用ECL检测试剂盒(Amersham Pharmacia Biotech,England)完成检测。或者,用兔抗FhuA或小鼠抗LamB抗体作为一抗与偶联至HRP的相应二抗联合检测融合蛋白。
结果
使用生物素化的Igs通过磁性活化细胞分选术(MACS)筛选细菌表面展示文库。用来自患者血清或健康人血清的生物素化人IgG和IgA集合筛选pMAL9.1中的LSPy70、pMAL10.1中的LSPy150和pHIE11中的LSPy300(参阅实施例1:从人血清制备抗体)。如下实验流程所述完成选择步骤。图3A显示了用LSPy-70文库和P4-IgG进行筛选的一个代表性的例子。正如从MACS筛选的第一轮选择后的菌落数中可见的,最终回收到的细胞总数从3×107个细胞急剧下降到大约5×104个细胞,而不加入抗体进行的选择则显示下降到大约2×103个细胞(图3A)。第二轮选择后,用P4-IgG回收到相似数目的细胞,而当不加入来自人血清的IgG时回收到的细胞少于10个,清楚的证明了选择依赖于化脓链球菌特异抗体。为了评估筛选的效果,随机挑选大约50个选定的克隆并用相同的集合的血清进行蛋白质印迹分析(图3B)。此分析表明70%的选定克隆显示出对存在于相关血清中的抗体的反应性而表达LamB且无化脓链球菌特异性插入片段的对照菌株则不与同一种血清反应。通常,观察到的反应比例在35-75%范围内。菌落PCR分析显示所有的选定克隆都含有预期大小范围内的插入片段。
随后对大量随机挑选的克隆(每次筛选600-1200个克隆)进行测序,鉴定用于筛选的人血清所特异识别的基因和相应的肽或蛋白质序列。特异克隆被选择的频率至少在部分程度上反映了用于选择的血清中识别该克隆所呈递表位的特异抗体的丰度和/或亲和力。在这点上令人吃惊的是,来自某些ORF(例如Spy0433、Spy2025)的克隆被选择次数超过80次,证明了它们的高度免疫原性特性。表1总结了获自所有15个已完成筛选的资料。表1中的所有克隆已通过蛋白质印迹分析用来自单个克隆的全细胞提取物来显示与各个筛选中所用人血清集合的指征反应性而得以证实。正如从表1中可见的,已鉴定ORF的单独区域被识别为是免疫原性的,因为大小不定的蛋白质片段通过平台蛋白质展示其表面。
更值得关注的是,通过细菌表面展示筛选所鉴定的大部分基因编码附着于化脓链球菌表面和/或被分泌的蛋白质。这与化脓链球菌毒性中表面附着或分泌蛋白质的预期任务是一致的。
实施例4:高度免疫原性肽序列对个体人血清的反应性的评估。
分析中包括大约100名患者和60名健康成人。在选定克隆的生物信息分析之后,设计并合成相应的肽。如果表位长度超过28个氨基酸残基,就制备重叠肽。用N末端生物素标签合成所有的肽并将其用作链霉亲和素包被ELISA平板上的包被试剂。
分析分两步进行。首先,基于它们对个别血清的反应性选择肽,所述个别血清包括在用于制备供细菌表面展示的IgG和IgA筛选试剂的血清集合内(5个个体血清)。未呈现阳性反应的肽不包括在进一步更详细的试验中。其次,针对显示出对筛选血清具有特异的高反应性的肽检测来自急性咽炎患者或链球菌感染后疾病患者或来自健康成人和儿童的大量非预定个体血清。通过ELISA检测抗体水平并通过基于阳性血清数目和反应性程度计算的各肽得分进行比较。表2显示了代表来自20份人血清(代表5种血清的4个不同集合)的化脓链球菌表位的174个肽的血清反应性用于抗原鉴定的实例。所述的肽的范围包括高度反应性和广泛反应性的肽至弱阳性的肽。在最具有反应性的肽中包括已知的抗原,其中一些还在有关鼻咽携带的动物攻击模型中起保护作用(如C5a肽酶和M蛋白)。
实施例5:用鉴定自化脓链球菌的高度免疫原性蛋白质进行的基因分布研究。
通过PCR进行A族链球菌抗原的基因分布研究。理想的疫苗抗原应是存在于该疫苗所定向的所有或绝大部分靶生物体株系内的抗原。为了确定编码已鉴定的化脓链球菌抗原是否广泛存在于化脓链球菌菌株内,用特异于目的基因的引物对一系列独立的化脓链球菌分离株进行PCR。如图4A中所示,所获得的化脓链球菌覆盖了最频繁出现于患者中的emm类型。如果有可能覆盖所有的已鉴定免疫原性表位,就针对所有已鉴定的ORF设计作为引物的寡核苷酸序列,产生的产物大约为1,000bp。如实施例2中所述制备所有的化脓链球菌菌株的基因组DNA。按制造商的说明书(Invitrogen,The Netherlands)用Taq聚合酶(1U)、200nM dNTPs、寡核苷酸各10pMol和试剂盒在25μl反应体积内进行PCR。作为标准,进行30个循环(1x:5分钟,95℃,30x:30秒95℃,30秒56℃,30秒72℃,1x4分钟.72℃),除非条件需修改以适合个别引物对。
结果
用PCR检测编码免疫原性蛋白质的所有已鉴定基因是否存在于50个不同的化脓链球菌菌株中(图4A)。例如,图4B显示了对于Spy0269而言所有指定50个菌株的PCR反应。正如明显可见的,基因存在于所有被分析的菌株中。对来自第8号菌株(M89)的PCR片段进行测序显示,与化脓链球菌M1菌株SF310相比,917bp中只有2bp是不同的,导致这两个分离株中只有一个氨基酸的差异。
在总共96个被分析基因中,有70个存在于所有被测试的菌株中,而22个基因在被测试的50个菌株中的10个以上菌株中缺乏(表3)。数个基因(Spy0433、Spy0681)显示出大小的差异且不存在于所有的分离菌株。某些基因显示出了大小的变化,但却不同的保存于所有的被测试菌株中(如Spy1371)。对某一菌株的PCR片段进行测序并随后与M1菌株比较证实了DNA片段的正确扩增并显示了表3中所指出的序列差异程度。重要的是,所有的已鉴定抗原的序列和大小在所有菌株中都是很保守的且因此是预防A族链球菌感染的新候选疫苗。
实施例6:从来自化脓链球菌并展示于大肠杆菌表面的高度免疫原性蛋白质/肽所免疫的小鼠中获得的免疫血清的鉴定。
从小鼠中产生免疫血清
将含有编码与化脓链球菌肽融合的平台蛋白的质粒的大肠杆菌克隆在补充有50μg/ml卡那霉素的LB培养基中于37℃培养。1∶10稀释过夜培养物,培养至OD600为0.5并用0.2mM IPTG诱导2小时。将细菌细胞沉淀悬浮于PBS缓冲液中并在冰上通过超声波降解法分解,产生了粗细胞提取物。根据OD600检测值,将相当于5×107个细胞的等分试样静脉注射入NMRI小鼠中,2周后加强免疫一次。第二次注射1周后提取血清。通过肽ELISA检测表位特异的抗体水平。
抗原的体外表达
通过免疫印迹检测体外培养的化脓链球菌SF370/M1的抗原表达。测试不同的生长培养基和培养条件以便检测总裂解产物和细菌培养上清液中抗原的存在。当检测到相当于预计分子量和电泳迁移率的特殊条带时认为表达被证实了。
细胞表面染色
流式细胞术分析进行如下。细菌在根据免疫印迹显示导致抗原表达的培养条件下生长。细胞在Hanks平衡盐溶液(HBSS)中漂洗两次并将细胞密度调整到100μl HBSS,0.5%BSA中大约为1×106CFU。与50-100倍稀释的抗血清一起在4℃保温30-60分钟后,在过量HBSS,0.5%BSA中离心洗去未结合抗体。将用荧光素(FITC)特异标记的山羊抗小鼠二抗(F(ab’)2片段与细胞一起在4℃保温30-60分钟。漂洗细胞后,用2%多聚甲醛固定抗体。用Becton Dickinson FACScan流式细胞仪检测被结合的抗体并用计算机软件CELLQuest进一步分析数据。对照血清包括小鼠免疫前血清和用制备自IPTG诱导的大肠杆菌细胞的裂解产物产生的小鼠多克隆血清,所述大肠杆菌是用编码基因lamB或fhuA且无化脓链球菌基因组插入片段的质粒转化的。
调理噬菌作用检测
在以FACS为基础的检测法中检测表位特异免疫血清诱发调理噬菌作用的活性。血清被热灭活,然后通过与完整的大肠杆菌细胞(3x)一起保温去除抗大肠杆菌抗体。在2-10%免疫血清存在且以2%仓鼠血清作为补充来源的条件下预调理107个Alexa 488标记的化脓链球菌细胞,然后加入106个噬菌细胞(RAW246.7或P388.D1小鼠单核细胞系)中。将细胞混合物在37℃保温30分钟。时间、IgG浓度和细菌的补体依赖型吸收表现为用荧光活化细胞分选器检测的噬菌细胞的平均荧光强度。
杀菌(处死)试验
将小鼠巨噬细胞(RAW246.7或P388.D1)和细菌保温并通过菌落计数测定60分钟后可生存细菌的损失。简而言之,细菌用Hanks平衡盐溶液(HBSS)洗两次并将细胞密度调整到50μl HBSS中大约1×105CFU。将细菌与小鼠血清(高达25%)和豚鼠补体(高达5%)以总体积100μl于4℃保温60分钟。将预调理的细菌与巨噬细胞(小鼠细胞系RAW264.7或P388.D1;每100μl 2×106个细胞)以1∶20的比例混合并于37℃旋转摇床上500rpm保温。将各样品的等分试样稀释于无菌水中并室温保温5分钟以裂解巨噬细胞。然后将系列稀释液铺到Todd-Hewitt Broth琼脂平板上。将平板在37℃保温过夜,并用Countermat闪射计数器(IUL Instruments)对菌落进行计数。对照血清包括小鼠免疫前血清和用制备自IPTG诱导的大肠杆菌的裂解产物产生的小鼠多克隆血清,所述大肠杆菌是用含有基因lamB或fhuA而无化脓链球菌基因组插入片段的质粒转化的。
结果
体外表达和细胞表面染色。通过利用所培养的抗大肠杆菌克隆的血清在体外分析化脓链球菌SF370/M1中的抗原蛋白质的表达,所述大肠杆菌克隆含有编码与化脓链球菌肽融合的平台蛋白的质粒。为了通过FACS分析评估多肽的表面表达,将此分析作为测定蛋白质是否完全表达的第一步。预期不是所有的蛋白质都会在体外条件下表达的,但利用蛋白质印迹分析在全部细胞裂解物中检测到了数种蛋白质(例如Spy0012、Spy0112、Spy0416、Spy0437、Spy0872、Spy1032、Spy1315、Spy1798;数据未显示)。随后用基于流式细胞术的检测法证实了数种抗原蛋白质的细胞表面可接触性。将链球菌与免疫前的和抗化脓链球菌裂解产物或大肠杆菌克隆的多克隆小鼠血清一起保温,所述大肠杆菌克隆含有与化脓链球菌肽融合的平台蛋白的编码质粒,然后用荧光素标记二抗进行检测。如图5A中所示,针对化脓链球菌裂解产物培养的抗血清引起了化脓链球菌SF370/M1细胞群荧光的漂移。用针对抗原Spy0012(图5B)、Spy1315和Spy1798(图5C)的肽培养的多克隆血清观察到化脓链球菌SF370/M1细胞的相似细胞表面染色,尽管只有该细菌的一个亚群被染色,正如用两个峰的检测所指出的。这一现象可能是细菌生长期间基因产物分化表达或由其它表面分子引起的抗体结合的部分抑制作用的结果。
这些实验证实了生物信息的预测,即,这些蛋白质由于其信号肽序列而被输出且还显示出它们锚定于化脓链球菌SF370/M1的细胞表面。它们还证实了这些蛋白质可被人抗体识别并使它们成为抗A族链球菌疾病疫苗开发的有价值候选分子。
实施例7:基于重组抗原免疫接种的抗A族链球菌感染的保护性免疫应答。
实验步骤
编码抗原蛋白质的基因的克隆
用基因特异引物通过PCR扩增反应扩增来自化脓链球菌SF370基因组DNA的目的基因或DNA片段。除了基因特异序列之外,引物在5’端含有由限制性位点组成帮助扩增的PCR产物定向克隆的额外碱基。引物的基因特异序列长度范围在15-24个碱基之间。所包含的PCR产物用适当的限制性酶消化并克隆入适当的已消化pET28b(+)载体(NOVAGEN)中。重组质粒的构建被证实后,转化用作表达宿主的大肠杆菌BL21
Figure G04805628519960504D000921
细胞(INVITROGEN)。将这些细胞最优化以有效表达pET28b质粒所编码的目的基因。
大肠杆菌中的抗原表达
将含重组质粒的大肠杆菌BL21
Figure G04805628519960504D000922
细胞在补充有50μg/ml卡那霉素的LB培养基中37℃培养至对数期。一旦OD600nm达到0.8,培养物用1mM IPTG在37℃诱导3小时。离心收获这些细胞,通过冻融方法及随后通过用来自NOVAGEN的Bug-
Figure G04805628519960504D000923
试剂破坏细胞联合裂解细菌。裂解产物通过离心分离成可溶性(上清液)和不溶性(沉淀)部分。
来自大肠杆菌的重组蛋白质的纯化
根据蛋白质的定位,采取不同的纯化策略。通过在细胞被破坏后将细胞裂解产物的上清液与镍-琼脂糖珠(Ni-NTA-QIAGEN)结合来纯化可溶性组分里的蛋白质。由于在被表达蛋白质的C末端、N末端或两个末端都存在的五组氨酸(HIS),所述蛋白质与镍-琼脂糖结合而其它杂质蛋白质通过洗涤缓冲液从柱子上洗去和清除掉。用含有溶于适当缓冲液中的100mM咪唑的溶液洗脱所述蛋白质。浓缩洗脱液,用Bradford检测蛋白质浓度并通过SDS-PAGE和蛋白质印迹法进行分析。通过沉淀在含8M尿素的适当缓冲液中的增溶作用纯化不溶性部分的蛋白质。在用同一材料变性的条件下(在含8M尿素的缓冲液中)进行纯化,步骤与上述针对可溶性蛋白质的步骤一样。浓缩洗脱液并以渐进或逐步的方式透析除去所有尿素。浓缩最终的蛋白质溶液,通过SDS-PAGE进行分析并用Bradford方法进行检测。当检测到相当于预计分子量和电泳迁移率的特异条带时认为表达得以证实。对于在透析阶段由于变性试剂尿素的去除而沉淀的蛋白质而言,可将不溶性包含体漂洗数次并直接用于小鼠的免疫接种。
用重组蛋白质免疫NMRI小鼠并用化脓链球菌AP1攻击
利用NMRI小鼠和作为感染试剂的化脓链球菌菌株AP1在实验动物模型中检测蛋白质的免疫原性。用50μg/剂的重组蛋白质每2周免疫一次7-8周大的雌性NMRI小鼠,总共3次。最初施用的剂量以完全弗氏佐剂辅助,而余下的两剂用不完全弗氏佐剂辅助。免疫接种结束后将小鼠放血以检查抗体效价,随后静脉注射(i.v.)致死剂量的化脓链球菌AP1(5×107个致病菌)激发免疫。在激发免疫后对小鼠的生存状况记录18-21天。
结果
重组蛋白质的表达和纯化
在选定用于重组蛋白质表达的31种蛋白质之中,29种蛋白质在大肠杆菌中产生的水平可足以纯化。而某些蛋白质可作为可溶性蛋白质产生(见表4),某些蛋白质转变成不溶性的(如Spy416B、Spy0872)或由于透析而沉淀,它们在诸如Spy0031、Spy0292、Spy720等不溶性蛋白质的增溶作用后试图去除变性试剂尿素。在这些情形中被漂洗的包含体直接被注射入小鼠中进行免疫接种。通常,亲和纯化产生了至少85%纯度的重组蛋白质制剂。
在NMRI小鼠中用重组蛋白质免疫后的免疫应答
表4列举了那些抗原,它们在小鼠中被测试并在实验动物内显示出某种程度的保护作用。同样在动物菌血症模型中检测到但在所述实验中未显示出任何水平的保护作用的重组蛋白质在此未列举,但包括诸如Spy0012、Spy1063和Spy1494等蛋白质。当致病细菌被直接注射入血液中时,上述菌血症模型评估了针对入侵疾病的候选疫苗的保护性意义。所诱导抗体能起到针对所述A族链球菌感染的保护作用的重组蛋白质被认为是用于研发抗A族链球菌疾病的疫苗的有价值候选分子。与先前显示出提供了针对化脓链球菌攻击的保护作用的阳性对照Spy2018(M1蛋白)相比较而言,在18-21天后(表4)评估激发实验的终点时许多抗原表现出相似程度的保护作用(Spy0416、Spy1607或Spy0292)。其它的蛋白质只显示出部分的保护效果(Spy0720、Spy0872),但当与其它抗原联合时可被证实非常有效(图6)。
令人吃惊的是,抗原筛选已鉴定了主要在两种较大蛋白质Spy0416和Spy1972前半部分的免疫原性表位。因此可推断保护区还可能包含于蛋白质的N末端部分。以Spy0416为例,抗原的两部分都作为重组蛋白质(Spy0416A和Spy0416B;见表4)产生并测试于动物实验中。实验显示在动物模型中只有蛋白质Spy0416(表4;Spy0416A)的前半部分提供了保护作用,而蛋白质的后半部分(Spy0416B)根本无保护效果,明显勾画出作为候选疫苗的是蛋白质内的较小区域。对于抗原Spy1972而言,只有全长蛋白质的前半部分被作为重组蛋白质产生并在动物模型中进行测试。
实施例8:编码多种血清型化脓链球菌中抗原蛋白质的基因的可变性
实验步骤
PCR片段的测序和生物信息学分析
化脓链球菌菌株的PCR分析参阅实施例5。PCR片段的测序提供了对基因可变性的一个估计,结果概述于表3中。来自五种化脓链球菌菌株(SF370:M1;MGAS8232:M18;SSI-1:M3;MGAS315:M3;Manfredo:M5)的基因组序列的可用性使得我们可以进一步的评估所述抗原的可变性。将所有序列与来自化脓链球菌SF370的相应抗原序列和经鉴定不同于化脓链球菌SF370抗原蛋白质氨基酸残基的那些氨基酸残基进行序列比对。在某些抗原蛋白质中检测到了插入或缺失序列,但不包括在此分析中。
结果
表5显示了经鉴定在四种化脓链球菌菌株(MGAS8232:M18;SSI-1:M3;MGAS315:M3;Manfredo:M5)之一或用于PCR扩增片段测序的菌株(见表3)中指定的抗原内可变的所有位置。生物信息分析显示,一些抗原蛋白质非常保守,在6种血清型株系M1、M3、M5、M18和M89中的任一种都无单一氨基酸交换。属于此类的蛋白质包括Spy0103和Spy1536,而在较大蛋白质内的其它抗原蛋白质中的交换数目比在较小蛋白质内的要大,正如从其大小差异所预期的一样。尽管分析了各种菌株,但几乎从未观察到单个残基在其它菌株中被改变成一个以上的其它氨基酸。对更大数目不同血清型菌株中相应基因序列、临床指征或地理定位的进一步分析可肯定地确认在所列举的那些氨基酸残基或另外的残基中可能发生的变化。
通过6个基因序列比对分析的抗原蛋白质中只有一个显示出大小有相当程度的变化(Spy1357:SF370-217氨基酸;MGAS8232-245氨基酸;SSI-1-329氨基酸;MGAS315-329氨基酸;Manfredo-279氨基酸)。因此显而易见,大部分被评估的抗原在序列以及大小上是非常保守的,且为疫苗研发提供了有希望的候选对象。
参考文献
Altschul,S.,等(1990).Journal of Molecular Biology 215:403-10.
Bennett,D.,等(1995).J Mol Recognit 8:52-8.
Bessen,D.,等(1988).Infect Immun 56:2666-2672.
Bisno,A.,等(1987).Infect Immun 55:753-7.
Bronze,M.,等(1988).J Immunol 141:2767-2770.
Clackson,T.,等(1991).Nature 352:624-8.
Cone,L.,等(1987).New Engl J Med 317:146-9.
Cunningham,M.(2000).Clin Microbiol Rev 13:470-511.
Devereux,J.,等(1984).Nucleic acids research 12:387-95.
Doherty,E.,等(2001).Annu Rev Biophys Biomol Struct 30:457-475.
Eisenbraun,M.,等(1993).DNA Cell Biol 12:791-7.
Enright M.,等(2001)Inf.Immun. 69:2416-27
Etz,H.,等(2001).J Bacteriol 183:6924-35.
Fenderson,P.,等(1989).J Immunol 142:2475-2481.
Fischetti,V.(1989).Clin Microbiol Rev 2:285-314.
Ganz,T.(1999).Science 286:420-421.
Georgiou,G.(1997).Nature Biotechnology 15:29-34.
Guzman,C.,等(1999).J Infect Dis 179:901-6.
Hashemzadeh-Bonehi,L.,等(1998).Mol Microbiol 30:676-678.
Heinje,von G,(1987)e.g.分子生物学中的序列分析Sequence Analysisin Molecular Biology,Acedimic Press
Hemmer,B.,等(1999).Nat Med 5:1375-82.
Hoe N.,等(2001)J.Inf.Dis. 183:633-9
Hope-Simpson,R.(1981).J Hyg(Lond) 87:109-29.
Ji,Y.,等(1997).Infect Immun 65:2080-2087.
Johanson,K.,等(1995).J Biol Chem 270:9459-71.
Jones,P.,等(1986).Nature 321:522-5.
Kajava,A.,等(2000).J Bacteriol 182:2163-9.
Kohler,G.,等(1975).Nature 256:495-7.
Kolaskar,A.,等(1990).FEBS Lett 276:172-4.
Lee,P.K.(1989).J Clin Microbiol 27:1890-2.
Lewin,A.,等(2001).Trends Mol Med 7:221-8.
Marks,J.,等(1992).Biotechnology(NY)10:779-83.
McCafferty,J.,等(1990).Nature 348:552-4.
Okano,H.,等(1991).J Neurochem 56:560-7.
作为基因表达反义抑制物的寡脱氧核苷酸Oligodeoxynucleotides asAntisense Inhibitors of Gene Expression;CRC Press,Boca Ration,FL(1988)用来描述这些分子
Phillips-Quagliata,J.,等(2000).J Immunol 165:2544-55.
Rammensee,H.,等(1999).Immunogenetics 50:213-9.
Rosenshine,I.,等(1992).Infect Immun 60:2211-7.
Seeger,C.,等(1984).Proc Natl Acad Sci USA 81:5849-52.
Shibuya,A.,等(2000).Nature Immunology 1:441-6.
Skerra,A.(1994).Gene 151:131-5.
Stevens,D.(1992).Clin Infect Dis 14:2-11.
Tang,D.,等(1992).Nature 356:152-4.
Tempest,P.,等(1991).Biotechnology(NY) 9:266-71.
Tourdot,S.,等(2000).Eur J Immunol 30:3411-21.
Whitnack,E,等(1985).J Exp Med 162:1983-97.
Wiley,J.,等(1987)Current Protocols in Molecular Biology
Vitali,L.,等(2002)J.Clin.Microbiol 40:679-681
表1:通过细菌表面展示鉴定的免疫原性蛋白质
 化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每次ORF和筛选选定克隆的编号  已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
Spy0012 假定的蛋白质   4-44,57-65,67-98,101-107,109-125,131-144,146-159,168-173,181-186,191-200,206-213,229-245,261-269,288-301,304-317,323-328,350-361,374-384,388-407,416-425   A:12,I:5,N:2  1-114   1,151
Spy0019 推定的分泌蛋白质(细胞分裂和抗生素耐受性)   5-17,49-64,77-82,87-98,118-125,127-140,142-150,153-159,191-207,212-218,226-270,274-287,297-306,325-331,340-347,352-369,377-382,390-395   F:2,I:16,K:24,N:29,P:12  29-226   2,152
Spy0025 推定的磷酸核糖甲酰甘氨脒合酶II   4-16,20-26,32-74,76-87,93-108,116-141,148-162,165-180,206-219,221-228,230-236,239-245,257-268,313-328,330-335,353-359,367-375,394-403,414-434,   D:3  919-929   3,153
 化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每次ORF和筛选选定克隆的编号   已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
  437-444,446-453,456-464,478-487,526-535,541-552,568-575,577-584,589-598,610-618,624-643,653-665,667-681,697-718,730-748,755-761,773-794,806-821,823-831,837-845,862-877,879-889,896-919,924-930,935-940,947-955,959-964,969-986,991-1002,1012-1036,1047-1056,1067-1073,1079-1085,1088-1111,1130-1135,1148-1164,1166-1173,1185-1192,1244-1254
Spy0031 推定的胆碱结合蛋白   5-44,62-74,78-83,99-105,107-113,124-134,161-174,176-194,203-211,216-237,241-247,253-266,272-299,323-349,353-360   I:3,K;3,N:3   145-305   4,154
Spy0103   推定的感受态蛋白质   15-39,52-61,72-81,92-97   A:8   71-81   5,155
 化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每次ORF和筛选选定克隆的编号   已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
Spy0112 推定的吡咯啉羧酸盐还原酶   13-19,21-31,40-108,115-122,125-140,158-180,187-203,210-223,235-245   B:4   173-186   6,156
Spy0115 推定的谷氨酰-氨基肽酶   5-12,19-27,29-39,59-67,71-78,80-88,92-104,107-124,129-142,158-168,185-191,218-226,230-243,256-267,272-277,283-291,307-325,331-344,346-352   A:3,C:26   316-331   7,157
Spy0166 假设的蛋白质   6-28,43-53,60-76,93-103   I:22,K:7,N:17,O:31,P:5   21-99   8,158
Spy0167 链球菌溶血素O   10-30,120-126,145-151,159-169,174-182,191-196,201-206,214-220,222-232,254-272,292-307,313-323,332-353,361-369,389-396,401-415,428-439,465-481,510-517,560-568   A:118,B:14,C:18,D:37,F:141,G:79,H:92,I:97,K:123,L:5,M:21,N:225,   9-264   9,159
 化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每次ORF和筛选选定克隆的编号  已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
  O:230,P:265
Spy0168   假设的蛋白质   5-29,39-45,107-128   K:4,N:7  1-112   10,160
Spy0171   假设的蛋白质   4-38,42-50,54-60,65-71,91-102   H:2  21-56   11,161
Spy0183 推定的甘氨酸甜菜碱/脯氨酸ABC转运蛋白   4-13,19-25,41-51,54-62,68-75,79-89,109-122,130-136,172-189,192-198,217-224,262-268,270-276,281-298,315-324,333-342,353-370,376-391   C:6  23-39   12,162
Spy0230 推定的ABC转运蛋白(ATP-结合蛋白)   6-41,49-58,62-103,117-124,147-166,173-194,204-211,221-229,255-261,269-284,288-310,319-325,348-380,383-389,402-410,424-443,467-479,496-517,535-553,555-565,574-581,583-591   C:46  474-489   13,163
Spy0269 推定的表面排阻蛋白   8-35,52-57,66-73,81-88,108-114,125-131,160-167,174-180,230-235,237-249,   A:2,B:12,D:3,F:11,H:5,N:6  37-241409-534582-604   14,164
化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每次ORF和筛选选定克隆的编号   已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
  254-262,278-285,308-314,321-326,344-353,358-372,376-383,393-411,439-446,453-464,471-480,485-492,502-508,523-529,533-556,558-563,567-584,589-597,605-619,625-645,647-666,671-678,690-714,721-728,741-763,766-773,777-787,792-802,809-823,849-864   743-804
Spy0287 保守的假设蛋白质   4-17,24-36,38-44,59-67,72-90,92-121,126-149,151-159,161-175,197-215,217-227,241-247,257-264,266-275,277-284,293-307,315-321,330-337,345-350,357-366,385-416   K:1   202-337   15,165
Spy0292 青霉素结合蛋白(D-丙氨酰-D-丙胺酸car   4-20,22-46,49-70,80-89,96-103,105-119,123-129,153-160,181-223,227-233,236-243,248-255,261-269,274-279,283-299,305-313,   F:2   1-48   16,166
化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每次ORF和筛选选定克隆的编号   已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
  315-332,339-344,349-362,365-373,380-388,391-397,402-407
Spy0295 寡肽透性酶   18-37,41-63,100-106,109-151,153-167,170-197,199-207,212-229,232-253,273-297   A:3   203-217   17,167
Spy0348 推定的氨基脱氧chorismate裂合酶   20-26,54-61,80-88,94-101,113-119,128-136,138-144,156-188,193-201,209-217,221-229,239-244,251-257,270-278,281-290,308-315,319-332,339-352,370-381,388-400,411-417,426-435,468-482,488-497,499-506,512-521   D:5,I:3,M:3,P:3   261-273   18,168
Spy0416 推定的细胞外壳丝氨酸蛋白酶   6-12,16-36,50-56,86-92,115-125,143-152,163-172,193-203,235-244,280-289,302-315,325-348,370-379,399-405,411-417,419-429,441-449,463-472,482-490,   A:3,B:4,C:30,D:13,F:138,G:120,H:101,I:9,   1-414443-614997-1392   19,169
  化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**  每次ORF和筛选选定克隆的编号   已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
  500-516,536-543,561-569,587-594,620-636,647-653,659-664,677-685,687-693,713-719,733-740,746-754,756-779,792-799,808-817,822-828,851-865,902-908,920-938,946-952,969-976,988-1005,1018-1027,1045-1057,1063-1069,1071-1078,1090-1099,1101-1109,1113-1127,1130-1137,1162-1174,1211-1221,1234-1242,1261-1268,1278-1284,1312-1317,1319-1326,1345-1353,1366-1378,1382-1394,1396-1413,1415-1424,1442-1457,1467-1474,1482-1490,1492-1530,1537-1549,1559-1576,1611-1616,1624-1641  K:14,M:2,N:15,O:8,P:19
化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每次ORF和筛选选定克隆的编号   已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
Spy0430   假设的蛋白质   14-42,70-75,90-100,158-181   B:7,I:10,P:18   1-164   20,170
Spy0433 假设的蛋白质   4-21,30-36,54-82,89-97,105-118,138-147   A:138,B:8,C:67,D:11,E:13,F:35,G:10,H:5,M:8   126-207   21,171
Spy0437 假设的蛋白质   4-21,31-66,96-104,106-113,131-142   A:29,B:10,C:21,D:24,E:15   180-204   22,172
Spy0469 推定的42kDa蛋白   5-23,31-36,38-55,65-74,79-88,101-129,131-154,156-165,183-194,225-237,245-261,264-271,279-284,287-297,313-319,327-336,343-363,380-386   B:5,F:77,I:8,K:15,M:3,N:17,O:20   11-197204-219258-372   23,173
Spy0488 假设的蛋白质   4-20,34-41,71-86,100-110,113-124,133-143,150-158,160-166,175-182,191-197,213-223,233-239,259-278,   A:17,B:11,C:23,D:12,E:4,   195-289   24,174
 化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每次ORF和筛选选定克隆的编号  已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
  298-322   G:4,H:7
Spy0515 推定的糖转移酶   4-10,21-35,44-52,54-62,67-73,87-103,106-135,161-174,177-192,200-209,216-223,249-298,304-312,315-329   B:5,I:3  12-130   25,175
Spy0580 保守的假定蛋白质   10-27,33-38,48-55,70-76,96-107,119-133,141-147,151-165,183-190,197-210,228-236,245-250,266-272,289-295,297-306,308-315,323-352,357-371,381-390,394-401,404-415,417-425,427-462,466-483,485-496,502-507,520-529,531-541,553-570,577-588,591-596,600-610,619-632,642-665,671-692,694-707   C:5  434-444   26,176
Spy0621 保守的假定蛋白质   6-14,16-25,36-46,52-70,83-111,129-138,140-149,153-166,169-181,188-206,212-220,223-259,261-269,   C:3  360-375   27,177
 化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**  每次ORF和筛选选定克隆的编号  已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
  274-282,286-293,297-306,313-319,329-341,343-359,377-390,409-415,425-430
Spy0630   推定的PTS依赖型N-乙酰-半乳糖胺-IIC   4-26,28-48,54-62,88-121,147-162,164-201,203-237,245-251  C:2  254-260   28,178
Spy0681 假设的蛋白质,与噬菌体有关   12-21,26-32,66-72,87-93,98-112,125-149,179-203,209-226,233-242,249-261,266-271,273-289,293-318,346-354,360-371,391-400  A:8  369-382   29,179
Spy0683 假设的蛋白质,与噬菌体有关   11-38,44-65,70-87,129-135,140-163,171-177,225-232,238-249,258-266,271-280,284-291,295-300,329-337,344-352,405-412,416-424,426-434,436-455,462-475,478-487  B:11,D:4  270-312   30,180
Spy0702 假设的蛋白质   5-17,34-45,59-69,82-88,117-129,137-142,158-165,180-195,201-206,219-226,241-260,269-279,292-305,  L:2  486-598   31,181
Figure G04805628519960504D001081
 化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每次ORF和筛选选定克隆的编号   已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
  156-166,173-179,192-209,225-231,234-240,245-251,260-268,274-279,297-306,328-340,353-360,369-382,384-397,414-423,431-436,452-465,492-498,500-508,516-552,554-560,568-574,580-586,609-617,620-626,641-647
Spy0737 推定的胞外基质结合蛋白   4-26,32-45,58-72,111-119,137-143,146-159,187-193,221-231,235-242,250-273,290-304,311-321,326-339,341-347,354-368,397-403,412-419,426-432,487-506,580-592,619-628,663-685,707-716,743-751,770-776,787-792,850-859,866-873,882-888,922-931,957-963,975-981,983-989,1000-1008,1023-1029,1058-1064,1089-1099,1107-1114,   B:5,E:3,K:11   396-5331342-15021672-1920   36,186
 化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**  每次ORF和筛选选定克隆的编号  已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
  1139-1145,1147-1156,1217-1226,1276-1281,1329-1335,1355-1366,1382-1394,1410-1416,1418-1424,1443-1451,1461-1469,1483-1489,1491-1501,1515-1522,1538-1544,1549-1561,1587-1593,1603-1613,1625-1630,1636-1641,1684-1690,1706-1723,1765-1771,1787-1804,1850-1857,1863-1894,1897-1910,1926-1935,1937-1943,1960-1983,1991-2005,2008-2014,2018-2039
Spy0747 细胞外核酸酶   4-25,45-50,53-65,79-85,87-92,99-109,126-137,141-148,156-183,190-203,212-217,221-228,235-242,247-277,287-293,300-319,  A:72,B:17,H:6,O:3  1-113210-232250-423536-564   37,187
 化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每次ORF和筛选选定克隆的编号  已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
  321-330,341-361,378-389,394-406,437-449,455-461,472-478,482-491,507-522,544-554,576-582,587-593,611-621,626-632,649-661,679-685,696-704,706-716,726-736,740-751,759-766,786-792,797-802,810-822,824-832,843-852,863-869,874-879,882-905
Spy0777 推定的ATP-依赖型核酸外切酶,亚基A   4-16,33-39,43-49,54-85,107-123,131-147,157-169,177-187,198-209,220-230,238-248,277-286,293-301,303-315,319-379,383-393,402-414,426-432,439-449,470-478,483-497,502-535,552-566,571-582,596-601,608-620,631-643,651-656,663-678,680-699,705-717,724-732,738-748,756-763,766-772,776-791,796-810,   C:4,E:2  617-635   38,188
 化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**  每次ORF和筛选选定克隆的编号   已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
  819-827,829-841,847-861,866-871,876-882,887-894,909-934,941-947,957-969,986-994,998-1028,1033-1070,1073-1080,1090-1096,1098-1132,1134-1159,1164-1172,1174-1201
Spy0789   推定的ABC-转运蛋白(透性酶蛋白)   7-25,30-40,42-64,70-77,85-118,120-166,169-199,202-213,222-244  A:3   190-203   39,189
Spy0839 推定的甘油磷酸二酯   4-11,15-53,55-93,95-113,120-159,164-200,210-243,250-258,261-283,298-319,327-340,356-366,369-376,380-386,394-406,409-421,425-435,442-454,461-472,480-490,494-505,507-514,521-527,533-544,566-574  A:7,D:2   385-398   40,190
Spy0843 细胞表面蛋白   5-36,66-72,120-127,146-152,159-168,172-184,205-210,221-232,234-243,251-275,  A:11,B:3,C:5,D:4,F:50,   12-190276-283666-806   41,191
 化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每次ORF和筛选选定克隆的编号   已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
  295-305,325-332,367-373,470-479,482-487,520-548,592-600,605-615,627-642,655-662,664-698,718-725,734-763,776-784,798-809,811-842,845-852,867-872,879-888,900-928,933-940,972-977,982-1003   H:19,G:49,I:112,K:102,L:10,M:3,N:213,O:188,P:310
Spy0872 推定被分泌的5′-核苷酸酶   4-38,63-68,100-114,160-173,183-192,195-210,212-219,221-238,240-256,258-266,274-290,301-311,313-319,332-341,357-363,395-401,405-410,420-426,435-450,453-461,468-475,491-498,510-518,529-537,545-552,585-592,602-611,634-639,650-664   A:6,D:2,F:5,H:14,I:9,K:10,L:1,N:16,O:12   30-8089-105111-151   42,192
Spy0895 组氨酸蛋白质激酶   7-29,31-39,47-54,63-74,81-94,97-117,122-127,146-157,168-192,195-204,216-240,251-259   C:11   195-203   43,193
 化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每次ORF和筛选选定克隆的编号   已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
Spy0972 推定的末端酶大亚基-噬菌体   5-16,28-34,46-65,79-94,98-105,107-113,120-134,147-158,163-172,180-186,226-233,237-251,253-259,275-285,287-294,302-308,315-321,334-344,360-371,399-412,420-426   B:2   32-50   44,194
Spy0981 假设的蛋白质-噬菌体相关   8-20,30-36,71-79,90-96,106-117,125-138,141-147,166-174   A:7,B:2   75-90   45,195
Spy1008 链球菌外毒素H前体(speH)   4-13,15-33,43-52,63-85,98-114,131-139,146-174,186-192,198-206,227-233   C:11   69-88   46,196
Spy1032 细胞外透明质酸裂合酶   4-22,29-35,59-68,153-170,213-219,224-238,240-246,263-270,285-292,301-321,327-346,356-371,389-405,411-418,421-427,430-437,450-467,472-477,482-487,513-518,531-538,569-576,606-614,637-657,662-667,673-690,743-753,760-767,   B:3,K:3,M:5   96-230361-491572-585   47,197
 化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每次ORF和筛选选定克隆的编号   已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
  770-777,786-802
Spy1054 推定的胶原样蛋白质(SclC)   4-12,21-36,48-55,74-82,121-127,195-203,207-228,247-262,269-278,280-289   A:71,B:13,C:233,D:41,E:163,F:200,G:442,H:129,N:3   102-210   48,198
Spy1063 推定的外周-铁-结合蛋白   13-20,23-31,38-44,78-107,110-118,122-144,151-164,176-182,190-198,209-216,219-243,251-256,289-304,306-313   A:4   240-248   49,199
Spy1162 推定的核糖核酸酶HII   5-26,34-48,57-77,84-102,116-132,139-145,150-162,165-173,176-187,192-205,216-221,234-248,250-260   B:3,C:5   182-198   50,200
Spy1206 推定的ABC转运蛋白   10-19,26-44,53-62,69-87,90-96,121-127,141-146,148-158,175-193,204-259,   A:2   41-56   51,201
 化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**  每次ORF和筛选选定克隆的编号  已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
  307-313,334-348,360-365,370-401,411-439,441-450,455-462,467-472,488-504
Spy1228 推定的脂蛋白   5-21,36-42,96-116,123-130,138-144,146-157,184-201,213-228,252-259,277-297,308-313,318-323,327-333  M:33  202-217   52,202
Spy1245 推定的磷酸盐ABC转运蛋白   6-26,33-51,72-90,97-131,147-154,164-171,187-216,231-236,260-269,275-283  I:3,K:3  1-127   53,203
Spy1315 假定的蛋白质   4-22,24-38,44-58,72-88,99-108,110-117,123-129,131-137,142-147,167-178,181-190,206-214,217-223,271-282,290-305,320-327,329-336,343-352,354-364,396-402,425-434,451-456,471-477,485-491,515-541,544-583,595-609,611-626,644-656,660-681,683-691,695-718  B:4  297-458   54,204
 Spy1357   蛋白质   5-43,92-102,107-116,  G:27,H:8,   24-135   55,205
 化脓链球菌抗原蛋白 推定的功能(通过同源性)   预测的免疫原性氨基酸**  每次ORF和筛选选定克隆的编号   已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
GRAB(蛋白质G-相关α2M-结合p   120-130,137-144,155-163,169-174,193-213  K:2,N:4
SPy1361 推定的internalin A前体   4-25,61-69,73-85,88-95,97-109,111-130,135-147,150-157,159-179,182-201,206-212,224-248,253-260,287-295,314-331,338-344,365-376,396-405,413-422,424-430,432-449,478-485,487-494,503-517,522-536,544-560,564-578,585-590,597-613,615-623,629-636,640-649,662-671,713-721  F:21,G:26,H:6,K:4,N:5   176-330   56,206
Spy1371 推定的NADP-依赖型甘油醛-3-磷酸酯脱氢酶   31-37,41-52,58-79,82-105,133-179,184-193,199-205,209-226,256-277,281-295,297-314,322-328,331-337,359-367,379-395,403-409,417-432,442-447,451-460,466-472   D:14,H:3   46-62296-341   57,207
 Spy1375 推定的核苷   23-29,56-63,67-74,96-108,   A:2   667-684   58,208
 化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每次ORF和筛选选定克隆的编号  已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
  酸还原酶α-c   122-132,139-146,152-159,167-178,189-196,214-231,247-265,274-293,301-309,326-332,356-363,378-395,406-412,436-442,445-451,465-479,487-501,528-555,567-581,583-599,610-617,622-629,638-662,681-686,694-700,711-716
Spy1389 推定的丙氨酰-tRNA合成酶   20-51,53-59,109-115,140-154,185-191,201-209,212-218,234-243,253-263,277-290,303-313,327-337,342-349,374-382,394-410,436-442,464-477,486-499,521-530,536-550,560-566,569-583,652-672,680-686,698-704,718-746,758-770,774-788,802-827,835-842,861-869   B:2,P:3  258-416   59,209
Spy1390   推定的蛋白酶成熟蛋白   7-25,39-45,59-70,92-108,116-127,161-168,202-211,   A:3,B:2,D:3  278-295   60,210
 化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每次ORF和筛选选定克隆的编号   已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
  质   217-227,229-239,254-262,271-278,291-300
Spy1422 推定的重组蛋白   4-20,27-33,45-51,53-62,66-74,81-88,98-111,124-130,136-144,156-179,183-191   C:2   183-195   61,211
Spy1436 推定的脱氧核糖核酸酶   12-24,27-33,43-49,55-71,77-85,122-131,168-177,179-203,209-214,226-241   K:1   63-238   62,212
Spy1494 假定的蛋白质   4-19,37-50,120-126,131-137,139-162,177-195,200-209,211-218,233-256,260-268,271-283,288-308   G:3,I:5,K:6,M:5,N:10,O:6,P:4   1-141   63,213
Spy1523 细胞分裂蛋白   11-17,40-47,57-63,96-124,141-162,170-207,223-235,241-265,271-277,281-300,312-318,327-333,373-379   I:2   231-368   64,214
Spy1536 保守的假定蛋白质   9-33,41-48,57-79,97-103,113-138,146-157,165-186,195-201,209-215,223-229,237-247,277-286,290-297,328-342   A:19,C:3   247-260   65,215
 Spy1564   保守的假定   7-15,39-45,58-64,79-84,   C:4   64-72   66,216
 化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每次ORF和筛选选定克隆的编号   已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
  蛋白质   97-127,130-141,163-176,195-203,216-225,235-247,254-264,271-279
Spy1604 保守的假定蛋白质   4-12,26-42,46-65,73-80,82-94,116-125,135-146,167-173,183-190,232-271,274-282,300-306,320-343,351-362,373-383,385-391,402-409,414-426,434-455,460-466,473-481,485-503,519-525,533-542,554-565,599-624,645-651,675-693,717-725,751-758,767-785,792-797,801-809,819-825,831-836,859-869,890-897   B:2,K:2   222-362756-896   67,217
Spy1607 保守的假定蛋白质   11-17,22-28,52-69,73-83,86-97,123-148,150-164,166-177,179-186,188-199,219-225,229-243,250-255   D:5   153-170   68,218
Spy1615 推定的晚感受态蛋白质   4-61,71-80,83-90,92-128,133-153,167-182,184-192,198-212   C:4   56-73   69,219
 化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每次ORF和筛选选定克隆的编号   已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
Spy1666 保守的假定蛋白质   4-19,26-37,45-52,58-66,71-77,84-92,94-101,107-118,120-133,156-168,170-179,208-216,228-238,253-273,280-296,303-317,326-334   D:2   298-312   70,220
Spy1727 保守的假定蛋白质   7-13,27-35,38-56,85-108,113-121,123-160,163-169,172-183,188-200,206-211,219-238,247-254   B:5   141-157   71,221
Spy1785 推定的ATP-依赖型DNA螺旋酶   23-39,45-73,86-103,107-115,125-132,137-146,148-158,160-168,172-179,185-192,200-207,210-224,233-239,246-255,285-334,338-352,355-379,383-389,408-417,423-429,446-456,460-473,478-503,522-540,553-562,568-577,596-602,620-636,640-649,655-663   D:3   433-440572-593   72,222
Spy1798 假定的蛋白质   4-42,46-58,64-76,118-124,130-137,148-156,164-169,175-182,187-194,203-218,   A:12,I:12,K:7,N:17,O:13,P:8   17-319417-563   73,223
 化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每次ORF和筛选选定克隆的编号   已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
  220-227,241-246,254-259,264-270,275-289,296-305,309-314,322-334,342-354,398-405,419-426,432-443,462-475,522-530,552-567,593-607,618-634,636-647,653-658,662-670,681-695,698-707,709-720,732-742,767-792,794-822,828-842,851-866,881-890,895-903,928-934,940-963,978-986,1003-1025,1027-1043,1058-1075,1080-1087,1095-1109,1116-1122,1133-1138,1168-1174,1179-1186,1207-1214,1248-1267
Spy1801 免疫原性分泌蛋白质前体类似物   6-19,23-33,129-138,140-150,153-184,190-198,206-219,235-245,267-275,284-289,303-310,322-328,354-404,407-413,423-446,453-462,   H:2,I:8,K:6,N:11   46-187   74,224
  化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每次ORF和筛选选定克隆的编号   已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
  467-481,491-500
Spy1813 假定的蛋白质   4-34,39-57,78-86,106-116,141-151,156-162,165-172,213-237,252-260,262-268,272-279,296-307,332-338,397-403,406-416,431-446,448-453,464-470,503-515,519-525,534-540,551-563,578-593,646-668,693-699,703-719,738-744,748-759,771-777,807-813,840-847,870-876,897-903,910-925,967-976,979-992   I:16,K:12,N:6   21-244381-499818-959   75,225
Spy1821   推定的翻译延伸因子EF-P   19-29,65-75,90-109,111-137,155-165,169-175   C:6   118-136   76,226
Spy1916 推定的磷酸-β-D-半乳糖苷酶   15-20,30-36,55-63,73-79,90-117,120-127,136-149,166-188,195-203,211-223,242-255,264-269,281-287,325-330,334-341,348-366,395-408,423-429,436-444,   C:8   147-155   77,227
 化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每次ORF和筛选选定克隆的编号  已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
  452-465
Spy1972 支链淀粉酶   11-18,21-53,77-83,91-98,109-119,142-163,173-181,193-208,216-227,238-255,261-268,274-286,290-297,308-315,326-332,352-359,377-395,399-406,418-426,428-438,442-448,458-465,473-482,488-499,514-524,543-553,564-600,623-632,647-654,660-669,672-678,710-723,739-749,787-793,820-828,838-860,889-895,901-907,924-939,956-962,969-976,991-999,1012-1018,1024-1029,1035-1072,1078-1091,1142-1161   A:6,I:2,K:5,N:9  74-438   78,228
Spy1979 链激酶A前体   4-31,41-52,58-63,65-73,83-88,102-117,123-130,150-172,177-195,207-217,222-235,247-253,295-305,315-328,335-342,359-365,   I:6,M:3,N:10  156-420   79,229
 化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**  每次ORF和筛选选定克隆的编号   已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
  389-394,404-413
Spy1983 胶原样表面蛋白(SclD)   4-42,56-69,98-108,120-125,210-216,225-231,276-285,304-310,313-318,322-343  A:81,B:24,F:19,G:41,I:2,K:2   79-348   80,230
Spy1991 氨基苯甲酸酯合酶组分II   12-21,24-30,42-50,61-67,69-85,90-97,110-143,155-168  D:2   53-70   81,231
Spy2000 表面脂蛋白   4-26,41-54,71-78,88-96,116-127,140-149,151-158,161-175,190-196,201-208,220-226,240-247,266-281,298-305,308-318,321-329,344-353,370-378,384-405,418-426,429-442,457-463,494-505,514-522  B:3,N:2   183-341   82,232
Spy2006 假定的蛋白质   4-27,69-77,79-101,117-123,126-142,155-161,171-186,200-206,213-231,233-244,258-263,269-275,315-331,337-346,349-372,376-381,  A:15,B:9,C:5,D:3,F:18,G:25,H:5,M:10,N:5   92-231618-757   83,233
 化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每次ORF和筛选选定克隆的编号   已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
  401-410,424-445,447-455,463-470,478-484,520-536,546-555,558-569,580-597,603-618,628-638,648-660,668-683,717-723,765-771,781-788,792-806,812-822
Spy2009 假定的蛋白质   11-47,63-75,108-117,119-128,133-143,171-185,190-196,226-232,257-264,278-283,297-309,332-338,341-346,351-358,362-372   B:2,I:7,K:7,P:2   41-170   84,234
Spy2010 C5A肽酶前体   6-26,50-56,83-89,108-114,123-131,172-181,194-200,221-238,241-259,263-271,284-292,304-319,321-335,353-358,384-391,408-417,424-430,442-448,459-466,487-500,514-528,541-556,572-578,595-601,605-613,620-631,634-648,660-679,686-693,702-708,716-725,730-735,749-755,770-777,   A:47,B:10,D:3,F:48,G:20,H:4,I:6,K:13,M:5,N:10,P:6   20-487757-1153   85,235
 化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每次ORF和筛选选定克隆的编号   已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
  805-811,831-837,843-851,854-860,863-869,895-901,904-914,922-929,933-938,947-952,956-963,1000-1005,1008-1014,1021-1030,1131-1137,1154-1164,1166-1174
Spy2016 补体抑制物(Sic)   10-34,67-78,131-146,160-175,189-194,201-214,239-250,265-271,296-305   A:11,B:38,C:16,F:56,G:27,H:13,K:5,N:2,O:3,P:14   26-7491-100105-303   86,236
Spy2018 M1-蛋白质   9-15,19-32,109-122,143-150,171-180,186-191,209-217,223-229,260-273,302-315,340-346,353-359,377-383,389-406,420-426,460-480   A:316,B:26,C:107,D:12,E:49,F:88,G:118,H:6,I:7,   10-223231-251264-297312-336   87,237
 化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**  每次ORF和筛选选定克隆的编号   已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
 K:2,M:48,N:4
Spy2025 免疫原性分泌蛋白前体   5-28,76-81,180-195,203-209,211-219,227-234,242-252,271-282,317-325,350-356,358-364,394-400,405-413,417-424,430-436,443-449,462-482,488-498,503-509,525-537  F:7,G:16,H:7,K:63,L:2,N:18,O:42   22-344   88,238
Spy2039 发热产生的外毒素B   5-28,42-54,77-83,86-93,98-104,120-127,145-159,166-176,181-187,189-197,213-218,230-237,263-271,285-291,299-305,326-346,368-375,390-395  I:15,K:3,N:12   1-151   89,239
Spy2043 有丝分裂因子MF1(speF)   6-34,48-55,58-64,84-101,121-127,143-149,153-159,163-170,173-181,216-225,227-240,248-254,275-290,349-364,375-410,412-418,432-438,445-451,465-475,488-496,505-515,558-564,  K:1   91-263   90,240
 化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每次ORF和筛选选定克隆的编号   已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
  571-579,585-595,604-613,626-643,652-659,677-686,688-696,702-709,731-747,777-795,820-828,836-842,845-856,863-868,874-882,900-909,926-943,961-976,980-986,992-998,1022-1034,1044-1074,1085-1096,1101-1112,1117-1123,1130-1147,1181-1187,1204-1211,1213-1223,1226-1239,1242-1249,1265-1271,1273-1293,1300-1308,1361-1367,1378-1384,1395-1406,1420-1428,1439-1446,1454-1460,1477-1487,1509-1520,1526-1536,1557-1574,1585-1596,1605-1617,1621-1627,1631-1637,1648-1654,1675-1689,1692-1698,
 化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每次ORF和筛选选定克隆的编号   已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
  1700-1706,1712-1719,1743-1756
Spy2059 青霉素结合蛋白2a   4-16,75-90,101-136,138-144,158-164,171-177,191-201,214-222,231-241,284-290,297-305,311-321,330-339,352-369,378-385,403-412,414-422,428-435,457-473,503-521,546-554,562-568,571-582,589-594,600-608,626-635,652-669,687-702,706-712,718-724,748-760,770-775   D:2,E:2   261-272   91,241
Spy2110 推定的厌氧核糖核苷-三磷酸酯还原酶   4-19,30-41,46-57,62-68,75-92,126-132,149-156,158-168,171-184,187-194,210-216,218-238,245-253,306-312,323-329,340-351,365-373,384-391,399-405,422-432,454-465,471-481,502-519,530-541,550-562,566-572,576-582,593-599,   E:7   541-551   92,242
 化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**  每次ORF和筛选选定克隆的编号  已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
  620-634,637-643,645-651,657-664,688-701
Spy2127 假定的蛋白质   6-11,17-25,53-58,80-86,91-99,101-113,123-131,162-169,181-188,199-231,245-252  I:6,P:2  84-254   93,243
Spy2191   假定的蛋白质   13-30,71-120,125-137,139-145,184-199  C:20,E:3,M:5  61-78   94,244
Spy2211 跨膜蛋白   9-30,38-53,63-70,74-97,103-150,158-175,183-217,225-253,260-268,272-286,290-341,352-428,434-450,453-460,469-478,513-525,527-534,554-563,586-600,602-610,624-640,656-684,707-729,735-749,757-763,766-772,779-788,799-805,807-815,819-826,831-855  A:3  568-580   95,245
 ARF0450 无同源性   11-21,29-38  A:11  5-17   96,246
 ARF0569 无同源性   无  A:2  2-9   97,247
  化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每次ORF和筛选选定克隆的编号   已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
ARF0694 无同源性   4-10,16-28   B:7,D:3,M:3   7-1826-34   98,248
  ARF0700 无同源性   10-16   M:11   1-15   99,249
  ARF1007 无同源性   无   B:2   4-11   100,250
  ARF1145 无同源性   4-40,42-51   C:9   37-53   101,251
  ARF1208 无同源性   4-21   C:1   22-29   102,252
  ARF1262 无同源性   D:2   2-11   103,253
ARF1294   与SA013139%同源性(67个氨基酸蛋白质的头28个氨基酸)   9-17,32-44   D:2   1-22   104,254
  ARF1316 无同源性   19-25,27-32   E:19   15-34   105,255
ARF1352   与SA114238%同源性(358蛋白质的第265-295位氨基酸)   4-12,15-22   D:4   11-33   106,256
  ARF1481 无同源性   10-17,24-30,39-46,51-70   C:2   51-61   107,257
  ARF1557 无同源性   无   C:2   6-19   108,258
  化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**  每次ORF和筛选选定克隆的编号   已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
ARF1629   与SP0069具36%的同源性(211个氨基酸蛋白质的第139-169位)   6-11,21-27,31-54  A:4,B:6   11-29   109,259
  ARF1654 无同源性   4-10,13-45  A:2   11-35   110,260
  ARF2027 无同源性   4-14,23-32  D:2   11-35   111,261
  ARF2093   推定的延伸因子TS   14-39,45-51  C:3   15-29   112,262
ARF2207   与SP1006具38%的同源性(67个氨基酸蛋白质的第7-37位)   4-11,14-28  A:117   4-17   113,263
  CRF0038 无同源性   4-16  C:6   2-16   114,264
  CRF0122 无同源性   4-10,12-19,39-50  C:2   6-22   115,265
  CRF0406 无同源性   none  D:5,E:11   2-13   116,266
  CRF0416 无同源性   4-11,22-65  C:42   3-19   117,267
  CRF0507 无同源性   17-23,30-35,39-46,57-62  B:3,C:4   30-49   118,268
CRF054 无同源性   4-19  C:6   14-22   119,269
  化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**  每次ORF和筛选选定克隆的编号   已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
  9
  CRF0569 无同源性   无  N:35   2-9   120,270
CRF0628   与P.aeruginosa的保守假定蛋白质具34%的同源性(41个氨基酸中有14个)   7-18,30-43  A:3   4-12   121,271
CRF0727   与肺炎链球菌的转录调节子(70个氨基酸,SP0584)具40%的同源性(40个氨基酸中有16个同源)   4-30,39-47  N:6   5-22   122,272
CRF0742   与SA0422具33%的同源性(42个氨基酸蛋白质的第11-37位,作为280个氨基酸的蛋白质列出)   6-15  D:7,E:12   14-29   123,273
  化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每次ORF和筛选选定克隆的编号   已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
  CRF0784 无同源性   4-34   N:9   23-35   124,274
  CRF0854 无同源性   4-36,44-57,65-72   N:14   14-27   125,275
  CRF0875 无同源性   4-18   A:4,D:1   11-20   126,276
CRF0907   与溶酶体流通调节子LYST[人]同源   无   A:39   5-19   127,277
  CRF0979 无同源性   18-36   D:21   6-20   128,278
  CRF1068 无同源性   4-10,19-34,41-84,96-104   C:1,D:3   50-63   129,279
  CRF1152 无同源性   4-9,19-27   C:15   8-21   130,280
  CRF1203 无同源性   4-16,18-28   N:3   22-30   131,281
  CRF1225 无同源性   4-15   C:8   21-35   132,282
  CRF1236 无同源性   4-17   N:3   3-13   133,283
  CRF1362 无同源性   4-12   C:6   4-18   134,284
  CRF1524 无同源性   4-24,31-36   D:3   29-45   135,285
  CRF1525 无同源性   12-22,34-49   C:2   21-32   136,286
  CRF1527 无同源性   4-17   D:4,E:1   22-32   137,287
  化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**  每次ORF和筛选选定克隆的编号   已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
  CRF1588 无同源性   4-16,25-42  C:2   7-28   138,288
  CRF1649 无同源性   4-10  C:3   7-20   139,289
  CRF1749 无同源性   4-11,16-36,39-54  C:15   28-44   140,290
  CRF1903 无同源性   5-20,29-54  A:14   14-29   141,291
  CRF1964 无同源性   24-33  A:8   10-22   142,292
CRF2055 无同源性   10-51,54-61  B:1,F:12,H:14   43-64   143,293
  CRF2091 无同源性   7-13  C:2   2-17   144,294
  CRF2096 无同源性   11-20  C:4   6-20   145,295
  CRF2104 无同源性   4-30,34-41  C:2   19-28   146,296
  CRF2116 无同源性   未检测到   11-21   147,297
  CRF2153 无同源性   4-16,21-26  F:2   9-38   148,298
NRF0001   在寡ABC转运蛋白中的ARF(未被TIGR注释),与SA0643具33%的同源性(469个氨   4-12,15-27,30-42,66-72  A:7,B:1   10-24   149,299
  化脓链球菌抗原蛋白   推定的功能(通过同源性)   预测的免疫原性氨基酸**   每次ORF和筛选选定克隆的编号   已鉴定免疫原性区的位置(氨基酸)   序列识别号(DNA,蛋白质)
  基酸蛋白质的第107-162位)
  NRF0003 无同源性   8-17   A:23   11-20   150,300
表2-1
Figure G04805628519960504D001381
表2-2
表3:化脓链球菌菌株中的基因分布
ORF 常用名   基因分布(50的出现率)   氨基酸替代(在菌株M89中) 同源性(SP/EC)   序列ID(DNA,蛋白质)
  Spy0012   假定的蛋白质   50   3/302   SP0010-40%/无   1,151
  Spy0019   推定的分泌蛋白质(细胞分裂和抗生素耐受)   50   0/300   SP2216-44-49%/无   2,152
  Spy0025   推定的磷酸核糖甲酰甘氨脒合酶II   38   0/303   SP0045-85%/24%   3,153
  Spy0031   推定的胆碱结合蛋白   50   0/297   SP2201-42%(cbpD)/无   4,154
  Spy0103   推定的免疫蛋白质   50   0/81   SP2051-41%/无   5,155
  Spy0112   推定的吡咯啉羧酸盐还原酶   50   3/235   SP0933-32%/34%   6,156
  Spy0115   推定的谷氨酰-氨基肽酶   50   6/306   SP1865-76%/30%   7,157
  Spy0166   假定的蛋白质   50   未检测到   无/无   8,158
  Spy0167   链球菌溶血素O   50   7/300   SP1923-40%(肺炎球菌溶血素)/无   9,159
  Spy0168   假定的蛋白质   8   19/126   无/无e   10,160
  Spy0171   假定的蛋白质   18   8/95   无/无   11,161
  Spy0183   推定的苷氨酸甜菜碱/脯氨酸ABC转运蛋白   50   0/297   SP0151-39%/48%   12,162
  Spy0230   推定的ABC转运蛋白(ATP-结合蛋白)   50   1/299   SP2073-64%/32%   13,163
  Spy0269   推定的表面排阻蛋白   50   1/303   无/无   14,164
  Spy0287   保守的假定蛋白质   50   1/307   SP0868-71%/19%   15,165
  Spy0292   青霉素结合蛋白质(D-丙氨酰-D-   50   1/359   SP0872-47%/27%   16,166
  丙胺酸car
  Spy0295   寡肽透性酶   50   2/269   SP1889-69%/24%   17,167
  Spy0348   推定的氨基脱氧chorismate裂合酶   50   1/307   SP1518-47%/25%   18,168
  Spy0416   推定的细胞外壳丝氨酸蛋白酶   50   4/314   SP0641-22%/无   19,169
  Spy0430   假定的蛋白质   13   0/165#   无/无   20,170
  Spy0433   假定的蛋白质   21(27/49)1   2/174#   无/无   21,171
  Spy0437   假定的蛋白质   19(34/49)1   0/106#   无/无   22,172
  Spy0469   推定的42kDa蛋白质   50   6/313   SP2063-44%(LysM蛋白)/无   23,173
  Spy0488   假定的蛋白质   50   9/178   无/无   24,174
  Spy0515   推定的糖转移酶   50   未检测到   SP1075-26%/None   25,175
  Spy0580   保守的假定蛋白质   50   0/297   SP0908-72%/43%   26,176
  Spy0621   保守的假定蛋白质   50   未检测到   SP1290-72%/无   27,177
  Spy0630   推定的PTS依赖型N-乙酰-半乳糖胺-IIC   50   未检测到   SP0324-79%/30%   28,178
  Spy0681   假定的蛋白质,噬菌体相关   27   2/303#   无/无   29,179
  Spy0683   推定的小衣壳蛋白质,噬菌体相关   25   1/233   无/无   30,180
  Spy0702   假定的蛋白质   22   未检测到   无/无   31,181
  Spy0710   保守的假定蛋白质,噬菌体相关   32   51/286#   无/36%在313个氨基酸中的122个中   32,182
  Spy0711   发热产生的外毒素C前体,噬菌体相关(speC)   17   1/225   无/无   33,183
  Spy0720   保守的假定蛋白质   50   2/270   SP1298-60%(DHH1蛋白)/无   34,184
  Spy0727   推定的DNA旋转酶,亚基B   未检测到   未检测到   SP0806-80%/46%   35,185
  Spy0737   推定的胞外基质结合蛋白   29(48/49)1   0/466#   无/27%在421个氨基酸中的340个中   36,186
  Spy0747   细胞外核酸酶   50   0/179   无/无   37,187
  Spy0777   推定的ATP-依赖型核酸外切酶,亚基A   50   2/306   SP1152-48%/22%   38,188
  Spy0789   推定的ABC-转运蛋白(透性酶蛋白)   50   1/231   无/无   39,189
  Spy0839   推定的甘油磷酸二酯   50   1/301   SP0994-24%/31%在358个氨基酸的121个中   40,190
  Spy0843   细胞表面蛋白质   50   3/312   无/无   41,191
  Spy0872   推定的被分泌5′-核苷酸酶   50   2/309   无/27%在647个氨基酸的274个中   42,192
  Spy0895   组氨酸蛋白质激酶   50   0/244   无/无   43,193
  Spy0972   推定的末端酶,大亚基-噬菌体   28   1/314#   无/无   44,194
  Spy0981   假定的蛋白质-噬菌体相关   23   未检测到   无/无   45,195
  Spy1008   链球菌外毒素H前体(speH)   15(14/49)1   1/223#   无/无   46,196
  Spy1032   细胞外透明质酸盐裂合酶   50(175的175,Hynes2000)   3/311   SP0314-51%/无   47,197
  Spy1054   推定的胶原样蛋白(SclC)   26,(45/49)1(50的50,但重复片段的数目变化;Lukomski,2001)   未检测到   无/无   48,198
  Spy1063   推定的外周铁结合蛋白   49/50(49/49)1   2/292#   SP0243-52%,铁ABC转运蛋白/26%在348个氨基酸的161个中   49,199
  Spy1162   推定的核糖核酸酶HII  50   3/240   SP1156-67%/46%   50,200
  Spy1206   推定的ABC转运蛋白  50   1/302   SP0770-81%/30%   51,201
  Spy1228   推定的脂蛋白  49   未检测到   SP0845-57%/None   52,202
  Spy1245   推定的ABC转运蛋白  50   未检测到   SP1400-64%/None   53,203
  Spy1315   假定的蛋白质  50   4/305   SP1241-64%/32%   54,204
  Spy1357   蛋白质GRAB(蛋白质G-相关α2M-结合蛋白)  49;12个菌株中的11个(Rasmussen,1999)   9/226;28个氨基酸的插入   无/无   55,205
  Spy1361   推定的internalinA前体  50   7/295   SP1004-26%在1039个的283个中/无   56,206
  Spy1371   推定的NADP-依赖型甘油醛-3-磷酸盐脱氢酶  50   2/308   SP1119-71%/34%   57,207
  Spy1375   推定的核糖核苷酸还原酶α-c  50   4/304   SP1179-85%/49%   58,208
  Spy1389   推定的丙氨酰-tRNA合成酶  50   0/309   SP1383-74%/40%   59,209
  Spy1390   推定的蛋白酶成熟蛋白  50   0/232   SP0981-42%/无   60,210
  Spy1422   推定的重组蛋白  未检测到   未检测到   SP1672-88%/64%   61,211
  Spy1436   推定的脱氧核糖核酸酶  25   0/243#   SP1964-29%在274个氨基酸的181个中/无   62,212
  Spy1494   假定的蛋白质  50   13/282   无/无   63,213
  Spy1523   细胞分裂蛋白  49   2/329   SP0690-27%/无   64,214
  Spy1536   保守的假定蛋白质  50   9/280   SP1967-57%/无   65,215
  Spy1564   保守的假定蛋白质  39   未检测到   无/无   66,216
  Spy1604   保守的假定蛋白质  50   1/233   SP2143-47%/28%   67,217
  Spy1607   保守的假定蛋白  50   0/241   SP1902-55%/无   68,218
  质
  Spy1615   推定的晚感受蛋白   50   2/204   SP2207-41%/无   69,219
  Spy1666   保守的假定蛋白质   50   2/305   SP0334(yllC)-78%/40%   70,220
  Spy1727   保守的假定蛋白质   50   0/237   SP0549-53%/无   71,221
  Spy1785   推定的ATP-依赖型DNA螺旋酶   50   1/306   SP1697-71%/37%   72,222
  Spy1798   假定的蛋白质   50   2/128   无/无   73,223
  Spy1801   免疫原性分泌蛋白前体类似物   50   6/313;6个氨基酸的插入aa   SP2216-33%在392个氨基酸的119个中/无   74,224
  Spy1813   假定的蛋白质   46   47/433;9个氨基酸的插入,1个氨基酸的删除   无/无   75,225
  Spy1821   推定的翻译延伸因子EF-P   未检测到   未检测到   SP0435-94%/45%   76,226
  Spy1916   推定的磷酸-β-D-半乳糖苷酶   未检测到   未检测到   SP1184-91%/83%   77,227
  Spy1972   支链淀粉酶   50   1/233   SP0268-53%,SP1118-29%/25%在657个氨基酸的352个中   78,228
  Spy1979   链激酶A前体   50   309#的20.1%同一性   无/无   79,229
  Spy1983   胶原样表面蛋白(SclD)   50,(50of50,但大小变异符合Lukomski,2000   未检测到   无/无   80,230
  Spy1991   氨基苯甲酸盐和酶组分II   50   1/170   SP1816-58%/47%   81,231
  Spy2000   表面脂蛋白   50   0/307   None/27%在524个氨基酸的389个中   82,232
  Spy2006   假定的蛋白质   50  0/234   SP1003-36%,SP1174-37%,SP1004-33%,SP1175-48%/无   83,233
  Spy2009   假定的蛋白质   39(38/49)1  58/344;insertionof 36,deletion of4aa   无/无   84,234
  Spy2010   C5A肽酶前体   未检测到  未检测到   SP0641-23%在2140个氨基酸的783个中/无   85,235
  Spy2016   补体抑制物(Sic)   47;主要在M1菌株中(Reid2001)  11/269#   无/无   86,236
  Spy2018   M1-蛋白   未检测到  未检测到   无/无   87,237
  Spy2025   免疫原性分泌蛋白前体   50  3/296   SP2216-31%在392个氨基酸的138个中/无   88,238
  Spy2039   发热产生的外毒素B   未检测到  未检测到   无/无   89,239
  Spy2043   有丝分裂因子MF1(speF)   50  0/247   无/无   90,240
  Spy2059   青霉素结合蛋白2a   50  0/293   SP2010-55%(pbp2A)/30%在844个氨基酸的539个中   91,241
  Spy2110   推定的厌氧核糖核苷-三磷酸盐还原酶   50  0/311   SP0202-80%(nrdD)/50%   92,242
  Spy2127   假定的蛋白质   1  未检测到   无/无   93,243
  Spy2191   假定的蛋白质   50  1/175   无/无   94,244
  Spy2211   跨膜蛋白质   50  2/281   SP2231-43%/无   95,245
  ARF0450   假定的蛋白质   50  5/191   无/无   96,246
  ARF0569   假定的蛋白质   未检测到  未检测到   无/无   97,247
  ARF0694   假定的蛋白质   23  1/122#   无/无   98,248
  ARF0700   假定的蛋白质   未检测到  未检测到   无/无e   99,249
  ARF1007   假定的蛋白质   未检测到  未检测到   无/无   100,250
 ARF1145   假定的蛋白质   未检测到   未检测到   无/无   101,251
 ARF1208   假定的蛋白质   未检测到   未检测到   无/无   102,252
 ARF1262   假定的蛋白质   未检测到   未检测到   无/无   103,253
 ARF1294   假定的蛋白质   50   1/186   与SA0131具39%的同源性(67个氨基酸蛋白质的头28个氨基酸)   104,254
 ARF1316   假定的蛋白质   未检测到   未检测到   无/无   105,255
 ARF1352   假定的蛋白质   未检测到   未检测到   与SA1142具38%的同源性(358个氨基酸蛋白质的第265-295位氨基酸)   106,256
 ARF1481   假定的蛋白质   未检测到   未检测到   无/无   107,257
 ARF1557   假定的蛋白质   未检测到   未检测到   无/无   108,258
 ARF1629   假定的蛋白质   未检测到   未检测到   与SP0069具36%的同源性(211个氨基酸蛋白质的第139-169位氨基酸)   109,259
 ARF1654   假定的蛋白质   未检测到   未检测到   无/无   110,260
 ARF2027   假定的蛋白质   未检测到   未检测到   无/无   111,261
 ARF2093   假定的蛋白质   未检测到   未检测到   无/无   112,262
 ARF2207   假定的蛋白质   50   未检测到   与SP1006具38%的同源性(67个氨基酸蛋白质的第7-37位氨基酸)   113,263
 CRF0038   假定的蛋白质   未检测到   未检测到   无/无   114,264
 CRF0122   假定的蛋白质   未检测到   未检测到   无/无   115,265
 CRF0406   假定的蛋白质   未检测到   未检测到   无/无   116,266
 CRF0416   假定的蛋白质   未检测到   未检测到   无/无   117,267
 CRF0507   假定的蛋白质   未检测到   未检测到   无/无   118,268
 CRF0549   假定的蛋白质   未检测到   未检测到   无/无   119,269
 CRF0569   假定的蛋白质   未检测到   未检测到   无/无   120,270
 CRF0628   假定的蛋白质   未检测到   未检测到   无/无   121,271
 CRF0727   假定的蛋白质   未检测到   未检测到   与SP0584具40%的同源性(70个氨基酸蛋白质的第21-60位氨基酸)   122,272
 CRF0742   假定的蛋白质   未检测到   未检测到   与SA0422具33%的   123,273
  同源性(42个氨基酸蛋白质的第11-37位氨基酸,作为280个氨基酸的蛋白质列出)
  CRF0784   假定的蛋白质   未检测到   未检测到   无/无   124,274
  CRF0854   假定的蛋白质   未检测到   未检测到   无/无   125,275
  CRF0875   假定的蛋白质   未检测到   未检测到   无/无   126,276
  CRF0907   假定的蛋白质   未检测到   未检测到   与溶酶体流通调节子LYST[人]同源   127,277
  CRF0979   假定的蛋白质   未检测到   未检测到   无/无   128,278
  CRF1068   假定的蛋白质   50   0/148   无/无   129,279
  CRF1152   假定的蛋白质   未检测到   未检测到   无/无   130,280
  CRF1203   假定的蛋白质   未检测到   未检测到   无/无   131,281
  CRF1225   假定的蛋白质   未检测到   未检测到   无/无   132,282
  CRF1236   假定的蛋白质   未检测到   未检测到   无/无   133,283
  CRF1362   假定的蛋白质   未检测到   未检测到   无/无   134,284
  CRF1524   假定的蛋白质   未检测到   未检测到   无/无   135,285
  CRF1525   假定的蛋白质   未检测到   未检测到   无/无   136,286
  CRF1527   假定的蛋白质   未检测到   未检测到   无/无   137,287
  CRF1588   假定的蛋白质   未检测到   未检测到   无/无   138,288
  CRF1649   假定的蛋白质   未检测到   未检测到   无/无   139,289
  CRF1749   假定的蛋白质   未检测到   未检测到   无/无   140,290
  CRF1903   假定的蛋白质   50   0/140   无/无   141,291
  CRF1964   假定的蛋白质   未检测到   未检测到   无/无   142,292
  CRF2055   假定的蛋白质   未检测到   未检测到   无/无   143,293
  CRF2091   假定的蛋白质   未检测到   未检测到   无/无   144,294
  CRF2096   假定的蛋白质   未检测到   未检测到   无/无   145,295
  CRF2104   假定的蛋白质   未检测到   未检测到   无/无   146,296
  CRF2116   假定的蛋白质   未检测到   未检测到   无/无   147,297
  CRF2153   假定的蛋白质   未检测到   未检测到   无/无   148,298
  NRF0001   假定的蛋白质   50   0/130   在寡ABC转运蛋白中的ARF(未用TIGR注释),与SA0643具33%的同源性(469个氨基酸蛋白质的第107-162   149,299
 位氨基酸)
  NRF0003   假定的蛋白质   未检测到   未检测到  无/无   150,300
表4:用于NMRI小鼠中免疫接种实验的重组蛋白质。
Figure G04805628519960504D001481
表5:化脓链球菌菌株的抗原可变性。
Figure G04805628519960504D001492
Figure G04805628519960504D001501
Spy1536 215无
Figure G04805628519960504D001562
Figure G04805628519960504D001571
Figure G04805628519960504D001581
序列表
SPy0012
Seq ID 1
ATGAGAAAATTATTAGCGGCTATGTTAATGACTTTTTTTCTGACTCCTTTACCAGTGATTAGTACAGAAAAAAAACTTATATTTTCA
AAAAATGCTGTTTATCAATTGAAACAAGATGTCGTTCAATCAACACAATTCTATAATCAAATACCCTCTAATCCAAATCTTTATCAA
GAAACGTGTGCCTATAAAGACAGTGATTTAACTCTACCAGCAGGAAGATTAGGTGTAAATCAACCATTACTTATTAAATCGCTTG
TGCTTAACAAAGAATCTTTACCGGTTTTTGAGTTAGCTGATGGTACCTATGTTGAGGCTAATCGACAATTGATTTATGACGATATT
GTACTTAATCAAGTAGATATAGATAGCTATTTTTGGACACAAAAGAAACTTAGGCTTTATTCAGCCCCTTATGTTTTAGGTACGCA
AACAATTCCTTCTTCTTTTTTATTTGCTCAAAAAGTTCATGCCACTCAAATGGCACAAACAAACCATGGAACTTATTATCTTATTGA
TGATAAGGGCTGGGCATCACAAGAAGATCTAGTTCAATTTGATAACCGCATGTTAAAAGTCCAGGAAATGCTCTTACAAAAATAT
AATAACCCAAATTATTCAATTTTTGTAAAGCAACTCAACACACAAACAAGTGCTGGTATTAATGCTGATAAAAAAATGTATGCTGC
AAGTATCTCGAAGTTAGCACCACTTTATATTGTTCAAAAACAATTACAAAAAAAGAAATTAGCAGAGAATAAAACTTTGACTTATA
CTAAAGATGTTAATCATTTTTATGGAGACTATGATCCATTGGGAAGTGGTAAAATTAGTAAAATAGCTGATAATAAAGATTATCGT
GTTGAAGACCTACTGAAAGCTGTAGCACAACAATCGGATAATGTAGCAACTAATATTTTAGGTTATTATCTATGTCATCAGTATGA
TAAAGCTTTCCGCTCAGAGATAAAAGCTTTATCAGGTATCGATTGGGATATGGAGCAGCGCTTATTAACTTCTCGTTCAGCTGCA
AATATGATGGAAGCTATTTATCATCAAAAAGGCCAAATTATTTCTTACCTTTCAAATACCGAATTTGATCAACAACGTATCACAAAA
AATATTACTGTTCCAGTTGCACATAAAATTGGTGATGCTTATGATTATAAACATGACGTTGCTATTGTTTACGGTAATACTCCATTT
ATTTTGTCTATTTTTACAAATAAATCAACCTATGAAGATATTACGGCTATTGCAGATGACGTTTATGGTATTTTAAAATGA
SPy0019
Seq ID 2
ATGAAAAAAAGAATTTTATCAGCAGTTCTTGTAAGTGGTGTTACCCTCGGAGCAGCTACAACTGTAGGAGCGGAGGATTTAAGT
ACTAAGATTGCTAAGCAAGATTCTATTATCTCAAATCTGACTACAGAGCAAAAAGCTGCACAGAATCAAGTTTCAGCGTTACAGG
CTCAAGTAAGTTCACTACAATCTGAACAAGATAAACTGACCGCAAGAAATACAGAACTTGAGGCGCTTTCAAAGCGATTTGAGCA
AGAAATTAAGGCTCTAACAAGTCAAATTGTTGCTCGTAATGAAAAATTAAAAAATCAAGCTCGTAGTGCTTATAAAAACAATGAAA
CTTCTGGTTATATTAATGCACTTTTGAATTCTAAATCAATTTCTGATGTTGTAAACCGTTTAGTAGCAATTAATAGAGCTGTCTCTG
CTAACGCTAAATTGTTAGAACAACAAAAAGCTGATAAAGTTTCCCTTGAAGAAAAGCAAGCTGCTAACCAAACAGCTATTAATAC
CATTGCCGCTAATATGGCAATGGCTGAAGAAAACCAAAATACATTACGTACTCAACAAGCTAATTTGGTAGCTGCAACTGCAAAT
TTAGCTCTCCAATTAGCATCTGCTACTGAAGATAAAGCTAATTTGGTAGCTCAAAAAGAAGCTGCAGAAAAAGCTGCTGCTGAAG
CCTTAGCACAAGAACAGGCTGCTAAAGTTAAGGCACAAGAACAGGCTGCACAACAAGCAGCATCTGTTGAAGCAGCAAAATCT
GCTATTACTCCAGCACCACAAGCTACTCCGGCAGCGCAAAGTAGTAATGCTATTGAACCAGCTGCACTCACGGCTCCGGCAGC
TCCTTCTGCAGGACCACAAACATCATATGATTCTTCTAATACTTATCCAGTTGGACAATGCACATGGGGAGCTAAATCTTTAGCT
CCTTGGGCAGGAAATAATTGGGGAAATGGTGGTCAATGGGCTTATAGTGCTCAAGCAGCTGGTTATCGTACTGGTTCAACGCC
GATGGTAGGTGCGATTGCCGTTTGGAACGATGGTGGTTATGGACATGTCGCCGTTGTAGTTGAGGTTCAAAGTGCCTCAAGTAT
TCGTGTGATGGAGTCTAACTACAGTGGTAGACAGTACATTGCTGACCACCGTGGCTGGTTTAATCCAACAGGTGTTACATTTATT
TATCCACACTAA
SPy0025
Seq ID 3
ATGTCCTCCTATTTTCCAGTCGCTCCCTTGTCGGACTTGGTATCTTATATGAATAAACGTATTTTTGTTGAGAAAAAGGCTGACTT
TGGTATTAAATCGGCTAGTCTTGTGAAAGAGTTGACGCATAATCTACAACTGACCTCTTTGAAGGCTTTGCGTATTGTGCAGGTC
TATGATGTCTTCAATTTGGCTGAGGATTTGCTGGCGCGTGCTGAGAAGCATATTTTCTCTGAGCAGGTGACAGACTGTCTTTTGA
CGGAAACTGAAATCACTGCGGAGCTTGATAAGGTTGCCTTCTTTGCCATTGAGGCGCTTCCTGGTCAATTTGACCAACGTGCTG
CTAGTTCGCAAGAAGCTTTGCTATTATTTGGAAGTGACAGTCAGGTTAAGGTCAATACAGCCCAGCTATACTTGGTCAATAAGGA
TATTACAGAAGCAGAGCTTGAAGCCGTTAAGAACTATCTTTTGAACCCTGTTGATTCGCGTTTCAAGGACATTACTTTGCCGCTT
GAAGAGCAGGCTTTCTCTGTATCTGATAAGACGATCCCTAATCTTGATTTCTTTGAAACTTATCAAGCTGACGATTTTGCGACTTA
TAAGGCAGAGCAGGGCTTGGCTATGGAGGTCGATGACCTTCTCTTCATCCAAAATTATTTCAAATCAATCGGATGTGTGCCAAC
TGAGACTGAGTTGAAAGTTTTGGATACTTACTGGTCAGACCACTGCCGTCACACAACCTTTGAAACTGAATTGAAGAACATTGAT
TTTTCAGCTTCTAAATTCCAAAAACAATTGCAGACAACTTATGACAAATATATCGCCATGCGTGATGAGCTTGGTCGTTCTGAAAA
GCCACAAACACTTATGGATATGGCGACTATTTTTGGTCGTTATGAGCGTGCCAACGGTCGTCTGGACGATATGGAAGTCTCAGA
TGAAATCAATGCCTGCTCAGTTGAGATTGAAGTAGATGTTGATGGTGTGAAAGAGCCTTGGCTCCTCATGTTTAAGAACGAGAC
TCACAATCACCCAACAGAAATTGAGCCATTCGGTGGAGCGGCGACTTGTATCGGTGGTGCTATTCGTGACCCATTGTCAGGAC
GTTCATACGTTTATCAGGCTATGCGTATTTCAGGCGCAGGCGATATCACGACTCCGATTGCGGAAACACGTGCTGGTAAATTGC
CACAACAAGTTATTTCTAAAACTGCGGCGCACGGCTATTCTTCATATGGTAACCAAATTGGGCTTGCGACAACTTATGTGCGCG
AGTACTTCCACCCTGGCTTCGTAGCCAAACGTATGGAGCTTGGAGCTGTGGTTGGTGCTGCACCTAAGGAAAATGTGGTTCGT
GAAAAACCAGAAGCAGGCGATGTGGTCATCTTGCTCGGTGGTAAAACAGGTCGTGATGGTGTCGGTGGTGCGACAGGTTCATC
TAAGGTTCAAACGGTTGAATCTGTGGAAACAGCTGGCGCAGAGGTACAAAAAGGGAATGCCATTGAAGAACGTAAGATTCAAC
GTCTTTTCCGTGATGGCAATGTCACTCGTCTTATTAAGAAATCAAATGACTTCGGTGCAGGTGGTGTCTGTGTTGCCATCGGTG
AATTGGCTGACGGTCTTGAAATCGATTTGGACAAGGTGCCTCTTAAATACCAAGGTCTTAATGGTACTGAAATTGCAATCTCAGA
ATCTCAAGAGCGTATGTCAGTCGTTGTTCGTCCAAATGATGTGGATGCCTTCATCGCAGCCTGCAACAAGGAAAATATCGATGC
AGTCGTTGTTGCGACCGTTACTGAAAAACCAAATCTTGTCATGACTTGGAATGGCGAAATCATCGTTGATTTGGAACGCCGTTTC
CTTGATACCAATGGTGTCCGTGTCGTTGTTGATGCTAAAGTCGTTGACAAGGACTTGACAGTTCCAGAAGCACGCACAACATCA
GCAGAGACACTTGAAGCAGATACGCTTAAGGTCTTGTCTGACCTCAACCACGCTAGTCAAAAAGGTCTTCAAACTATCTTTGACT
CATCTGTTGGTCGTTCAACCGTTAACCACCCAATCGGTGGTCGTTACCAAATCACACCGACAGAAAGTTCTGTTCAAAAATTGCC
AGTTCAACATGGTGTGACAACAACTGCATCTGTTATGGCTCAAGGTTACAATCCTTATATTGCAGAGTGGTCACCTTATCACGGT
GCTGCCTATGCTGTCATTGAAGCGACAGCTCGCTTGGTAGCAACGGGTGCTGACTGGTCTCGTGCACGTTTCTCTTACCAAGA
GTACTTTGAGCGTATGGATAAACAGGCAGAGCGTTTTGGTCAGCCAGTATCAGCTCTTCTTGGTTCTATTGAGGCTCAGATTCA
ACTTGGTTTGCCATCAATCGGCGGTAAGGACTCTATGTCTGGTACTTTCGAAGACTTGACAGTACCACCAACCTTGGTAGCTTT
CGGCGTGACAACAGCGGACAGCCGCAAGGTTCTCTCTCCTGAGTTTAAAGCGGCTGGCGAAAACATTTACTATATCCCAGGTC
AAGCTATTTCAGAAGATATTGATTTTGACCTTATCAAGGATAACTTTAGCCAGTTTGAAGCTATTCAAGCTCAACATAAGATTACA
GCTGCCTCAGCCGCTAAATACGGTGGTGTCCTAGAAAGTCTTGCTCTCATGACTTTTGGTAACCGTATCGGTGCTTCTGTTGAA
ATTGCAGAGCTTGACAGCAGCTTGACAGCTCAACTCGGAGGTTTTGTCTTTACATCAGCTGAGGAAATTGCTGACGCGGTGAAA
ATCGGTCAAACTCAGGCAGACTTTACAGTCACTGTCAATGGAAATGACCTTGCTGGCGCTAGCCTTCTAGCAGCCTTCGAAGGC
AAATTGGAAGAGGTTTACCCAACAGAATTTGAGCAGACAGATGTTCTTGAAGAAGTTCCTGCTGTGGTATCAGATACTGTTATCA
AGGCTAAGGAAACAATTGAAAAACCAGTGGTTTACATTCCAGTCTTCCCTGGTACCAACTCAGAATACGATTCAGCTAAGGCCTT
TGAACAGGTTGGAGCTAGTGTCAACTTGGTACCATTTGTAACCTTGAATGAGGTTGCTATTGCTGAGTCAGTTGACACTATGGTT
GCTAATATTGCTAAGGCAAATATCATCTTCTTTGCTGGAGGTTTCTCAGCAGCGGATGAACCAGATGGGTCTGCTAAGTTTATCG
TCAATATCTTGCTTAACGAGAAGGTCCGCGCAGCTATTGACAGCTTCATCGAAAAAGGTGGCCTTATCATCGGTATCTGTAATG
GTTTCCAAGCCCTTGTTAAATCAGGTCTTCTTCCATACGGAAACTTCGAGGAAGCTGGTGAGACAAGTCCAACTCTCTTCTATAA
TGATGCTAATCAGCATGTTGCCAAGATGGTTGAGACTCGTATCGCAAATACCAACTCACCTTGGTTGGCAGGAGTTGAGGTCGG
CGATATTCATGCCATTCCAGTTTCACATGGTGAAGGTAAACTTGTTGTCAGCGCTTCTGAATTTGCAGAGCTAAGAGACAATGGT
CAAATCTGGAGCCAATATGTGGACTTTGACGGACAACCATCTATGGATTCTAAATACAATCCAAACGGCTCTGTCAATGCCATCG
AAGGGATTACCAGCAAGAATGGTCAAATCATCGGTAAGATGGGACACTCAGAACGCTGGGAAGACGGACTCTTCCAAAATATC
CCTGGTAACAAAGACCAAATCCTCTTTGCAAGTGCTGTAAAATACTTTACAGGGAAGTAA
SPy0031
Seq ID 4
ATGAAAAAATTTCATCGTTTTTTGGTCTCAGGAGTAATCCTTTTAGGTTTTAATGGTCTAGTACCTACTATGCCATCTACACTTATT
TCGCAACAGGAAAATCTTGTTCATGCAGCTGTTTTAGGCGATAACTATCCGAGTAAGTGGAAAAAAGGCAATGGAATCGATTCG
TGGAACATGTATATCCGCCAATGCACTTCTTTTGCAGCTTTTCGTTTAAGCTCTGCTAATGGTTTTCAGTTACCTAAAGGCTACG
GTAATGCCTGCACGTGGGGACATATCGCGAAAAATCAGGGTTATCCTGTGAATAAGACACCAAGCATAGGGGCTATCGCTTGG
TTTGATAAAAACGCTTATCAGTCAAATGCTGCTTACGGTCATGTAGCATGGGTAGCTGATATCCGTGGAGACACTGTCACTATCG
AAGAGTATAATTACAACGCTGGACAAGGCCCTGAAAGATACCATAAGCGTCAAATTCCAAAATCTCAGGTAAGTGGTTATATCCA
TTTTAAAGACTTATCATCTCAGACAAGTCATTCCTACCCAAGACAACTAAAACACATTTCTCAAGCTTCATTTGACCCCTCTGGAA
CTTATCACTTTACAACCAGATTACCAGTCAAAGGACAAACCAGTATCGATAGCCCTGATCTTGCTTACTATGAAGCAGGTCAATC
TGTTTATTACGATAAAGTCGTGACTGCTGGAGGTTATACATGGCTTAGCTACCTCAGTTTTTCTGGAAACCGACGCTATATTCCC
ATTAAAGAGCCCGCACAGTCTGTGGTTCAAAATGACAATACAAAACCTTCCATTAAGGTCGGTGATACTGTTACCTTCCCTGGC
GTTTTTCGTGTAGATCAGCTTGTTAATAATTTGATCGTTAATAAAGAATTAGCCGGAGGAGACCCAACTCCACTAAACTGGATTG
ATCCCACACCATTAGATGAAACAGATAACCAAGGAAAAGTTTTAGGAGATCAAATTCTCCGTGTGGGTGAATATTTTATCGTCAC
TGGTAGTTATAAAGTATTAAAAATTGATCAACCAAGTAATGGTATTTATGTTCAAATCGGATCTCGTGGAACATGGGTAAATGCTG
ATAAAGCTAACAAATTATAG
SPy0103
Seq ID 5
ATGATTAATCAATGGAACAACTTACGACACAAGAAGCTAAAAGGATTTACTCTTCTAGAAATGTTATTGGTGATTCTTGTCATCAG
TGTTTTGATGCTATTATTTGTGCCTAATTTAAGCAAGCAAAAAGACAGGGTTACAGAAACAGGTAATGCCGCTGTTGTTAAATTA
GTGGAGAATCAAGCAGAACTATATGAATTATCTCAAGGCTCAAAACCAAGTTTGAGCCAGTTAAAGGCAGATGGTAGTATCACT
GAGAAACAAGAAAAAGCTTATCAAGACTATTATGACAAACATAAAAATGAAAAAGCCCGTCTTAGCAATTAA
SPy0112
Seq ID 6
ATGAAAATTGGCATTATTGGTGTTGGCAAAATGGCTAGCGCTATCATCAAAGGCCTTAAACAAACACCCCATGAACTTATCATTT
CAGGATCATCTTTAGAACGGTCCAAGGAAATTGCGGAGCAGTTAGCACTGCCTTATGCTATGTCCCACCAAGACCTTATTGACC
AGGTTGATCTTGTTATTTTAGGCATCAAGCCTCAACTATTTGAAACGGTACTCAAACCGCTTCACTTCAAACAGCCTATTATATCT
ATGGCAGCAGGCATTTCCCTTCAACGACTAGCAACATTCGTAGGACAAGACCTTCCGCTGCTACGTATCATGCCAAACATGAAT
GCACAAATTCTCCAAAGCAGTACCGCTTTAACGGGAAATGCTTTGGTGTCCCAGGAATTACAAGCACGTGTTCGAGACTTAACA
GATAGCTTTGGTAGCACATTTGATATTAGTGAAAAGGATTTTGACACCTTTACCGCTTTAGCAGGGTCAAGTCCTGCCTATATTT
ATCTCTTTATTGAGGCTTTGGCTAAGGCTGGCGTCAAGAATGGCATACCTAAAGCAAAGGCGCTGGAGATTGTTACTCAAACAG
TATTGGCTAGCGCCAGCAATCTCAAGACCAGTTCTCAAAGTCCGCACGATTTCATTGACGCTATTTGTAGCCCCGGTGGCACAA
CTATTGCTGGTCTGATGGAGTTAGAACGCCTTGGCCTCACAGCTACTGTCAGCTCTGCCATTGACAAAACCATCGATAAAGCTA
AAAGCTTGTAA
SPy0115
Seq ID 7
ATGACAGACTTATTCTCAAAAATCAAAGAAGTTACCGAACTGGATGGCATTGCGGGCTATGAACATAGCGTTCGTGACTACCTA
CGCACCAAAATAACCCCGCTGGTTGACCGTGTTGAAACAGACGGGCTTGGTGGCATTTTTGGTATCAGAGATAGTAAAGCTGAA
AAAGCCCCCCGTATTTTAGTAGCTGCGCACATGGACGAAGTCGGTTTTATGGTCAGTGATATCAAAGTTGACGGAACGCTACGC
GTGGTTGGTATCGGTGGTTGGAACCCACTTGTTGTCAGTTCACAACGGTTTACCCTTTACACACGCACTGGCCAAGTTATTCCC
CTTATTTCAGGATCGGTACCTCCCCATTTTTTACGTGGGGCAAATGGCTCTGCTAGTCTACCACATATCGAAGATATTGTGTTTG
ATGGTGGCTTTACGGATAAGGCAGAAGCTGAAAGATTTGGTATTACACCGGGTGATATTATTATCCCTCAATCTGAAACGATCCT
AACAGCCAATCAAAAAAATATTATTTCAAAAGCTTGGGACAATCGCTATGGCGTTCTCATGATAACAGAAATGCTTGAAGCGTTA
AAAGGACAAGACCTTAACAACACCCTAATTGCAGGTGCTAACGTTCAAGAAGAAGTTGGTCTGCGCGGAGCCCACGTCTCAAC
CACCAAGTTCGACCCTGAACTCTTTTTCGCAGTAGATTGTTCGCCTGCTGGTGATATTTATGGCAATCCTGGAACAATCGGAGAT
GGTACCTTGTTGCGTTTCTACGACCCAGGCCATGTCATGCTCAAAGATATGCGCGACTTCTTACTGACTACTGCTGAGGAAGCT
GGTGTCAATTTCCAATACTATTGTGGCAAGGGAGGCACAGATGCAGGTGCTGCACACCTTCAAAATGGTGGTGTCCCATCAACA
ACCATCGGAGTCTGTGCACGCTACATTCACTCTCATCAAACCCTCTACGCTATGGATGATTTCGTAGAAGCCCAAGCCTTCTTAC
AAGCCATTATCAAAAAACTGGATCGCTCAACCGTTGACTTGATTAAATGTTACTAA
SPy0166
Seq ID 8
ATGGAAGATATTTCTGATCCAGAAGTTATTTTAGAGTATGGGGTTTACCCTGCTTTCATAAAAGGCTATACCCAATTGAAAGCTAA
CATCGAAGAAGCATTATTAGAAATGTCAAATAGCGGTCAAGCATTAGACATTTACCAAGCAGTTCAAACCCTAAACGCTGAAAAC
ATGTTATTAAATTATTACGAAAGCTTGCCATTTTATTTAAACCGTCAAAGCATACTAGCTAATATGACCAAAGCGTTAAAAGATGC
GCATATTAGAGAGGCTATGGCACATTACAAATTAGGAGAATTTGCTCACTATCAAGATACTATGCTTGATATGGTCGAAAGAACA
ATAAAAACATTTTAG
SPy0167
Seq ID 9
ATGTCTAATAAAAAAACATTTAAAAAATACAGTCGCGTCGCTGGGCTACTGACGGCAGCTCTTATCATTGGTAACCTTGTTACTG
CTAATGCTGAATCGAACAAACAAAACACTGCTAGTACAGAAACCACAACGACAAATGAGCAACCAAAGCCAGAAAGTAGTGAGC
TAACTACTGAAAAAGCAGGTCAGAAAACGGATGATATGCTTAACTCTAACGATATGATTAAGCTTGCTCCCAAAGAAATGCCACT
AGAATCTGCAGAAAAAGAAGAAAAAAAGTCAGAAGACAAAAAAAAGAGCGAAGAAGATCACACTGAAGAAATCAATGACAAGAT
TTATTCACTAAATTATAATGAGCTTGAAGTACTTGCTAAAAATGGTGAAACCATTGAAAATTTTGTTCCTAAAGAAGGCGTTAAGA
AAGCTGATAAATTTATTGTCATTGAAAGAAAGAAAAAAAATATCAACACTACACCAGTCGATATTTCCATTATTGACTCTGTCACT
GATAGGACCTATCCAGCAGCCCTTCAGCTGGCTAATAAAGGTTTTACCGAAAACAAACCAGACGCGGTAGTCACCAAGCGAAA
CCCACAAAAAATCCATATTGATTTACCAGGTATGGGAGACAAAGCAACGGTTGAGGTCAATGACCCTACCTATGCCAATGTTTCA
ACAGCTATTGATAATCTTGTTAACCAATGGCATGATAATTATTCTGGTGGTAATACGCTTCCTGCCAGAACACAATATACTGAATC
AATGGTATATTCTAAGTCACAGATTGAAGCAGCTCTAAATGTTAATAGCAAAATCTTAGATGGTACTTTAGGCATTGATTTCAAGT
CGATTTCAAAAGGTGAAAAGAAGGTGATGATTGCAGCATACAAGCAAATTTTTTACACCGTATCAGCAAACCTTCCTAATAATCC
TGCGGATGTGTTTGATAAATCGGTGACCTTTAAAGAGTTGCAACGAAAAGGTGTCAGCAATGAAGCTCCGCCACTCTTTGTGAG
TAACGTAGCCTATGGTCGAACTGTTTTTGTCAAACTAGAAACAAGTTCTAAAAGTAATGATGTTGAAGCGGCCTTTAGTGCAGCT
CTAAAAGGAACAGATGTTAAAACTAATGGAAAATATTCTGATATCTTAGAAAATAGCTCATTTACAGCTGTCGTTTTAGGAGGAGA
TGCTGCAGAGCACAATAAGGTAGTCACAAAAGACTTTGATGTTATTAGAAACGTTATCAAAGACAATGCTACCTTCAGTAGAAAA
AACCCAGCTTATCCTATTTCATACACCAGTGTTTTCCTTAAAAATAATAAAATTGCGGGTGTCAATAACAGAACTGAATACGTTGA
AACAACATCTACCGAGTACACTAGTGGAAAAATTAACCTGTCTCATCAAGGCGCGTATGTTGCTCAATATGAAATCCTTTGGGAT
GAAATCAATTATGATGACAAAGGAAAAGAAGTGATTACAAAACGACGTTGGGACAACAACTGGTATAGTAAGACATCACCATTTA
GCACAGTTATCCCACTAGGAGCTAATTCACGAAATATCCGTATCATGGCTAGAGAGTGCACTGGCTTAGCTTGGGAATGGTGGC
GAAAAGTGATCGACGAAAGAGATGTGAAACTGTCTAAAGAAATCAATGTCAATATCTCAGGATCAACCTTGAGCCCATATGTTC
GATTACTTATAAGTAG
SPy0168
Seq ID 10
ATGAAACAACAATCTTACCAGCCTCTACGCTTCGTCTACCTCTTGGTGGCTCTATTTGCTGCTCTGTTGCTTATAGCAAGACCTG
TTATGGCAGATGAGGGAACAAATAGTGCTGATGCGGCGTATTATAAAGGGCAAAGTGCTGGAAAAAAAGCAGGGAAAAAAGCT
GGAAAAGAAGCTACTTGGACTGATTTGACCCCAACTGTCCCAACTAATCCAGAAACACCTAGTGACATCGGAGAGACTACTAAT
AAACAGCTCTATAAAGAAGGGTATAAAGATGGGTACAAAGAGGGTTATAATGAAGGCTGGAAATCTCAGTATCCCGTTTTGACT
CCGGTCAAGGTTATATGGGATTTGATCTCTTATTGGCTACAGCGATTATTCCCCAATAATCAGTCAAGTACCGCAGCACAAAGCA
TGTCATAA
SPy0171
Seq ID 11
GTGAAAAACAAATTATTTTTAGTTGCCCTTGCGACCGTAACTGTCCTAGGGCCGTCTTTAGCAACCCCTCATCACCAGACCGTG
CATGCTAGTGATGTAACATTAACTGAGACATGTGATAAAAACGGAACAGTATGTTTTGGCTACGAAAACGTAGATGGTGAAGTAT
GTAAATTAACAGCTGACGGAAAGGGAACCATTTGTGTGGGTTACGAAAATAGAGACATAAAAGAGAGTGAAACTTCTAGCACCA
AAAATGATTGTTCTAATTGGTTTTGGTGCTTTTTAAATTATCTTTGGACTACAATAAAAAGCTGGGTTTCGTAA
SPy0183
Seq ID 12
ATGGAAACAATTTTAGAAGTCAAACATCTCAGTAAAATTTTTGGCAAAAAACAAAAAGCAGCTCTTGAGATGGTAAAGACTGGCA
AAAATAAGAGTGAGATTTTTAAGAAAACAGGCGCTACTGTAGGTGTCTATGACGCTAGTTTTGAGGTCAAAAAAGGTGAAATCTT
TGTTATTATGGGGCTATCAGGAAGTGGGAAATCAACCCTTGTCCGCATGCTAAATCGTTTGATTGAACCTTCAGCAGGATCTATC
TTGCTGGAAGGTAAAGACATCTCAACCATGTCAGCAGATCAGCTGCGTGAGGTGCGCCGCCATGACATTAACATGGTTTTCCAA
AGCTTTGCCCTCTTTCCTCATAAAACCATTTTGGAAAATACCGAATTTGGTTTGGAATTACGTGGCGTTCCCAAAGAAGAACGCC
AGCGATTGGCAGAAAAAGCCCTTGATAATTCAGGCCTATTAGATTTTAAAGACCAGTACCCAAACCAACTATCTGGTGGGATGC
AGCAGCGTGTCGGCCTAGCCCGTGCGCTAGCTAATAGCCCTAAAATTCTCTTAATGGACGAGGCATTCTCAGCGCTTGATCCTT
TGATTCGTCGTGAGATGCAAGATGAATTACTTGATTTGCAAGACAGCATGAAACAAACCATCATCTTTATCAGTCATGACTTGAA
TGAAGCCTTGCGGATTGGTGATCGGATTGCTTTGATGAAAGACGGACAAATTATGCAAATTGGTACTGGTGAGGAAATCTTGAC
TAACCCAGCCAATGACTTTGTGCGTGAATTCGTTGAGGATGTGGACCGTTCTAAAGTCTTGACAGCACAAAATATCATGATCAAA
CCGTTAACAACTACTGTTGAATTAGATGGACCTCAAGTTGCCTTGAACCGTATGCACAACGAAGAGGTGTCTATGTTGATGGCG
ACGAATCGCCGCCGCCAATTAGTCGGTAGTTTGACGGCCGATGCCGCTATAGAGGCGCGCAAAAAAGGGTTACCGCTATCAGA
AGTGATTGATCGCGATGTGAGAACTGTCTCAAAAGATACTATTATTACAGATATTTTGCCTCTTATCTATGATTCATCTGCTCCGA
TTGCAGTGACAGATGATAATAATCGTCTGTTAGGTGTCATTATTCGAGGACGAGTGATTGAAGCCTTGGCTAATATCTCAGACGA
AGACCTTAACTAA
SPy0230
Seq ID 13
ATGAAAACAGCACGTTTTTTCTGGTTTTATTTTAAACGCTATCGTTTCTCATTTACTGTCATTGCTGTTGCCGTTATCTTAGCAACT
TATTTACAAGTAAAAGCTCCTGTCTTCTTAGGAGAGTCCTTGACTGAGTTGGGAAAAATCGGTCAGGCTTATTACGTTGCTAAGA
TGAGTGGCCAGACACATTTTAGCCCTGATTTATCAGCTTTTAATGCCGTGATGTTTAAGCTTTTGATGACTTATTTCTTTACTGTT
TTAGCTAATCTAATATATAGTTTCTTACTTACACGTGTTGTCTCACATTCGACTAACCGCATGCGCAAGGGCTTATTTGGTAAATT
AGAACGTTTAACCGTCGCCTTTTTTGACCGCCATAAAGATGGGGAGATTCTTTCTCGTTTCACGAGTGATTTGGATAATATTCAA
AACTCGCTGAACCAATCCTTGATTCAAGTGGTGACTAATATTGCCCTTTACATCGGCCTGGTCTGGATGATGTTTAGGCAAGATA
GCCGTTTAGCTTTGTTAACCATCGCATCAACCCCAGTTGCTCTCATTTTTTTAGTGATTAACATCCGTTTGGCAAGAAAATACACC
AATATCCAACAGCAAGAAGTCAGTGCTTTAAATGCTTTTATGGATGAAACCATTTCAGGACAAAAGGCTATTATTGTACAAGGTG
TCCAAGAAGATACGATGACAGCCTTTTTAAAGCATAATGAAAGGGTTCGACAAGCCACCTTCAAACGCCGTCTGTTCTCAGGAC
AATTATTTCCAGTCATGAATGGAATGAGCCTTATTAACACGGCTATCGTGATTTTTGTCGGTTCAACAATTGTCCTCAGTGACAAA
TCTATGCCAGCAGCGGCAGCGCTTGGTTTAGTGGTTACTTTTGTACAATATTCCCAGCAATATTACCAACCCATGATGCAAATCG
CGTCTAGTTGGGGAGAATTGCAGCTGGCCTTTACCGGTGCTCACCGTATTCAAGAAATGTTTGATGAAACCGAAGAAGTTCGTC
CACAAAATGCACCAGCGTTCACCAGCTTAAAAGAAGCAGTGGCGATTAACCACGTCGATTTTGGGTATCTTCCTGGGCAAAAAG
TTTTATCAGATGTGTCAATCGTTGCACCCAAGGGCAAAATGATTGCCGTGGTTGGACCGACAGGTTCTGGAAAGACCACTATTA
TGAACTTGATTAACCGTTTCTACGATGTGGATGCAGGTTCGATTACCTTTGATGGCCGTGATATTCGTGACTACGATTTGGATAG
TCTTCGTCAAAAGGTAGGGATTGTGTTGCAAGAGTCAGTTCTTTTTTCAGGAACCATTACGGATAATATTCGTTTTGGTGATCAG
ACCATTAGTCAAGACATGGTTGAAACTGCTGCGCGTGCGACCCATATTCATGACTTTATCATGTCCTTACCAAAAGGGTACAATA
CCTATGTCTCAGATGATGACAATGTCTTTTCAACAGGTCAAAAGCAGTTGATTTCTATTGCTAGGACGCTACTGACTGACCCTGA
AGTGTTGATTTTGGATGAGGCCACTTCAAATGTTGATACGGTTACCGAAAGTAAAATTCAACGGGCCATGGAAGCTATCGTGGC
AGGTCGAACTAGCTTTGTCATTGCTCACCGCCTCAAAACCATTTTAAATGCCGATCACATTATTGTGTTGAAAGATGGCAAGGTC
ATTGAGCAAGGAAATCATCATGAGCTATTGCATCAAAAAGGCTTTTATGCCGAATTGTATCACAATCAATTTGTCTTTGAATAG
SPy0269
Seq ID 14
ATGGACTTAGAACAAACGAAGCCAAACCAAGTTAAGCAGAAAATTGCTTTAACCTCAACAATTGCTTTATTGAGTGCCAGTGTAG
GCGTATCTCACCAAGTCAAAGCAGATGATAGAGCCTCAGGAGAAACGAAGGCGAGTAATACTCACGACGATAGTTTACCAAAAC
CAGAAACAATTCAAGAGGCAAAGGCAACTATTGATGCAGTTGAAAAAACTCTCAGTCAACAAAAAGCAGAACTGACAGAGCTTG
CTACCGCTCTGACAAAAACTACTGCTGAAATCAACCACTTAAAAGAGCAGCAAGATAATGAACAAAAAGCTTTAACCTCTGCACA
AGAAATTTACACTAATACTCTTGCAAGTAGTGAGGAGACGCTATTAGCCCAAGGAGCCGAACATCAAAGAGAGTTAACAGCTAC
TGAAACAGAGCTTCATAATGCTCAAGCAGATCAACATTCAAAAGAGACTGCATTGTCAGAACAAAAAGCTAGCATTTCAGCAGAA
ACTACTCGAGCTCAAGATTTAGTGGAACAAGTCAAAACGTCTGAACAAAATATTGCTAAGCTCAATGCTATGATTAGCAATCCTG
ATGCTATCACTAAAGCAGCCAAACGGCTAATGATAATACAAAAGCATTAAGCTCAGAATTGGAGAAGGCTAAAGCTGACTTAGA
AAATCAAAAAGCTAAAGTTAAAAAGCAATTGACTGAAGAGTTGGCAGCTCAGAAAGCTGCTCTAGCAGAAAAAGAGGCAGAACT
TAGTCGTCTTAAATCCTCAGCTCCGTCTACTCAAGATAGCATTGTGGGTAATAATACCATGAAAGCACCGCAAGGCTATCCTCTT
GAAGAACTTAAAAAATTAGAAGCTAGTGGTTATATTGGATCAGCTAGTTACAATAATTATTACAAAGAGCATGCAGATCAAATTAT
TGCCAAAGCTAGTCCAGGTAATCAATTAAATCAATACCAAGATATTCCAGCAGATCGTAATCGCTTTGTTGATCCCGATAATTTG
ACACCAGAAGTGCAAAATGAGCTAGCGCAGTTTGCAGCTCACATGATTAATAGTGTAAGAAGACAATTAGGTCTACCACCAGTT
ACTGTTACAGCAGGATCACAAGAATTTGCAAGATTACTTAGTACCAGCTATAAGAAAACTCATGGTAATACAAGACCATCATTTG
TCTACGGACAGCCAGGGGTATCAGGGCATTATGGTGTTGGGCCTCATGATAAAACTATTATTGAAGACTCTGCCGGAGCGTCA
GGGCTCATTCGAAATGATGATAACATGTACGAGAATATCGGTGCTTTTAACGATGTGCATACTGTGAATGGTATTAAACGTGGTA
TTTATGACAGTATCAAGTATATGCTCTTTACAGATCATTTACACGGAAATACATACGGCCATGCTATTAACTTTTTACGTGTAGAT
AAACATAACCCTAATGCGCCTGTTTACCTTGGATTTTCAACCAGCAATGTAGGATCTTTGAATGAACACTTTGTAATGTTTCCAGA
GTCTAACATTGCTAACCATCAACGCTTTAATAAGACCCCTATAAAAGCCGTTGGAAGTACAAAAGATTATGCCCAAAGAGTAGGC
ACTGTATCTGATACTATTGCAGCGATCAAAGGAAAAGTAAGCTCATTAGAAAATCGTTTGTCGGCTATTCATCAAGAAGCTGATA
TTATGGCAGCCCAAGCTAAAGTAAGTCAACTTCAAGGTAAATTAGCAAGCACACTTAAGCAGTCAGACAGCTTAAATCTCCAAGT
GAGACAATTAAATGATACTAAAGGTTCTTTGAGAACAGAATTACTAGCAGCTAAAGCAAAACAAGCACAACTCGAAGCTACTCGT
GATCAATCATTAGCTAAGCTAGCATCGTTGAAAGCCGCACTGCACCAGACAGAAGCCTTAGCAGAGCAAGCCGCAGCCAGAGT
GACAGCACTGGTGGCTAAAAAAGCTCATTTGCAATATCTAAGGGACTTTAAATTGAATCCTAACCGCCTTCAAGTGATACGTGAG
CGCATTGATAATACTAAGCAAGATTTGGCTAAAACTACCTCATCTTTGTTAAATGCACAAGAAGCTTTAGCAGCCTTACAAGCTAA
ACAAAGCAGTCTAGAAGCTACTATTGCTACCACAGAACACCAGTTGACTTTGCTTAAAACCTTAGCTAACGAAAAGGAATATCGC
CACTTAGACGAAGATATAGCTACTGTGCCTGATTTGCAAGTAGCTCCACCTCTTACGGGCGTAAAACCGCTATCATATAGTAAGA
TAGATACTACTCCGCTTGTTCAAGAAATGGTTAAAGAAACGAAACAACTATTAGAAGCTTCAGCAAGATTAGCTGCTGAAAATAC
AAGTCTTGTAGCAGAAGCGCTTGTTGGCCAAACCTCTGAAATGGTAGCAAGTAATGCCATTGTGTCTAAAATCACATCTTCGATT
ACTCAGCCCTCATCTAAGACATCTTATGGCTCAGGATCTTCTACAACGAGCAATCTCATTTCTGATGTTGATGAAAGTACTCAAA
GAGCTCTTAAAGCAGGAGTCGTCATGTTGGCAGCTGTCGGCCTCACAGGATTTAGGTTCCGTAAGGAATCTAAGTGA
SPy0287
Seq ID 15
ATGACAAAAGAAAAACTAGTGGCTTTTTCGCAAGCCCACGCTGAGCCTGCTTGGCTGCAAGAACGGCGTTTAGCGGCATTAGA
AGCCATTCCAAATTTGGAATTACCAACCATCGAAAGGGTTAAATTTCACCGTTGGAATCTAGGAGATGGTACCTTAACAGAAAAT
GAAAGTCTAGCTAGTGTTCCAGATTTTATAGCTATTGGAGATAACCCAAAGCTTGTTCAGGTAGGCACGCAAACAGTCTTAGAAC
AGTTACCAATGGCGTTAATTGACAAGGGAGTTGTTTTCAGTGATTTTTATACGGCGCTTGAGGAAATCCCAGAAGTAATTGAAGC
TCATTTTGGTCAGGCATTAGCTTTTGATGAAGACAAACTAGCTGCCTACCACACTGCTTATTTTAATAGCGCAGCCGTGCTCTAC
GTTCCTGATCACTTGGAAATCACAACTCCTATTGAAGCTATTTTCTTACAAGATAGTGACAGTGACGTTCCTTTTAACAAGCATGT
TCTAGTGATTGCAGGAAAAGAAAGTAAGTTCACCTATTTAGAGCGTTTTGAATCTATTGGCAATGCCACTCAAAAGATCAGCGCT
AATATCAGTGTAGAAGTGATTGCTCAAGCAGGCAGCCAGATTAAATTCTCGGCTATCGACCGCTTAGGTCCTTCAGTGACAACC
TATATTAGCCGTCGAGGACGTTTAGAGAAGGATGCCAACATTGATTGGGCCTTAGCTGTGATGAATGAAGGCAATGTCATTGCT
GATTTTGACAGTGATTTGATTGGTCAGGGCTCACAAGCTGATTTGAAAGTTGTTGCAGCCTCAAGTGGTCGTCAGGTACAAGGT
ATTGACACGCGCGTGACCAACTATGGTCAACGTACGGTCGGTCATATTTTACAGCATGGTGTGATTTTGGAACGTGGCACCTTA
ACGTTTAACGGGATTGGTCATATTCTAAAAGACGCTAAGGGAGCTGATGCTCAACAAGAAAGCCGTGTTTTGATGCTTTCTGAC
CAAGCAAGAGCCGATGCCAATCCAATCCTCTTAATTGATGAAAATGAAGTAACAGCAGGTCATGCAGCTTCTATCGGTCAGGTT
GACCCTGAAGATATGTATTACTTGATGAGTCGAGGACTGGATCAAGAAACAGCAGAACGATTGGTTATTAGAGGATTCCTAGGA
GCGGTTATCGCTGAAATTCCTATTCCATCAGTCCGCCAAGAGATTATTAAGGTTTTAGATGAGAAATTGCTTAATCGTTAA
SPy0292
Seq ID 16
ATGATCAAACGATTAATTTCCCTAGTGGTCATCGCCTTATTTTTTGCAGCAAGCACTGTTAGCGGTGAAGAGTATTCGGTAACTG
CTAAGCATGCGATTGCCGTTGACCTTGAAAGTGGCAAAGTTTTATACGAAAAAGATGCTAAAGAAGTTGTCCCAGTCGCCTCAG
TCAGTAAGCTCTTGACAACCTATCTGGTTTACAAAGAAGTTTCTAAGGGCAAGCTAAATTGGGATAGTCCTGTAACTATTTCTAA
CTACCCTTATGAACTCACTACAAACTATACTATTAGTAACGTTCCTCTTGATAAGAGAAAATATACCGTTAAAGAACTTTTAAGTG
CGTTAGTTGTTAATAACGCCAATAGCCCCGCTATTGCTTTAGCTGAAAAAATAGGCGGAACCGAACCCAAATTTGTTGACAAAAT
GAAAAAACAATTAAGACAATGGGGCATTTCCGATGCAAAGGTCGTCAATTCAACTGGCTTAACTAACCATTTTTTAGGAGCTAAT
ACTTATCCTAATACAGAACCAGATGATGAAAATTGTTTTTGCGCCACTGATTTAGCTATTATTGCCAGGCATCTCTTATTAGAATT
TCCAGAAGTACTGAAATTATCTAGCAAATCCTCCACTATTTTTGCTGGACAAACCATTTACAGTTATAATTACATGCTTAAAGGCA
TGCCTTGTTATCGAGAAGGCGTGGATGGTCTTTTTGTTGGTTATTCTAAAAAAGCCGGTGCTTCTTTTGTAGCTACTAGTGTCGA
AAATCAAATGAGGGTTATTACAGTAGTTTTAAATGCTGATCAAAGCCACGAGGATGATTTAGCTATATTTAAAACAACCAATCAAT
TGTTGCAGTACCTTTTAATTAATTTTCAAAAAGTCCAGTTAATTGAAAATAATAAACCAGTAAAAACGTTATATGTCTTAGACAGTC
CTGAAAAAACTGTCAAACTTGTAGCCCAAAATAGTTTATTTTTTATCAAACCAATACATACAAAGACCAAAAATACCGTCCATATTA
CTAAGAAATCATCCACAATGATCGCACCTCTATCAAAGGGACAAGTCTTAGGTAGAGCAACCCTTCAAGATAAACATCTTATTGG
ACAAGGTTATCTGGATACTCCTCCTTCTATCAATCTTATCCTTCAAAAAAACATTTCTAAAAGTTTCTTTTTAAAGGTCTGGTGGAA
CCGTTTTGTGAGGTATGTCAATACCTCTTTATAG
SPy0295
Seq ID 17
ATGGAATCGATTGATAAATCTAAATTTCGATTTGTTGAGCGCGATAGTGAAGCCTCCGAAGTGATTGATACCCCTGCTTATTCTT
ACTGGAAATCAGTGTTTCGTCAGTTTTTTTCTAAAAAATCTACAGTCTTTATGCTCGTAATTTTAGTGACAGTCTTGATGATGAGC
TTTATTTATCCAATGTTTGCCAACTACGACTTTAATGACGTTAGTAATATCAATGACTTTTCAAAGCGTTATATTTGGCCAAATGCA
GAGTACTGGTTTGGAACCGACAAAAATGGGCAATCTCTGTTTGATGGTGTTTGGTATGGGGCACGTAATTCTATTTTAATCTCAG
TTATAGCGACACTAATTAATATCACCATTGGGGTAGTGTTAGGAGCCATATGGGGAGTTTCTAAAGCATTTGATAAAGTTATGAT
TGAAATTTATAACATTATCTCAAATATCCCTTCTATGCTTATTATCATTGTTTTGACCTATTCATTAGGTGCAGGATTTTGGAATTT
GATTCTAGCTTTCTGTATCACTGGATGGATTGGTGTCGCCTACTCCATCCGTGTTCAAATCTTGCGTTACCGTGATTTAGAATAC
AACCTTGCTAGTCAAACTTTGGGAACACCAATGTACAAGATTGCTGTTAAGAACCTCCTGCCTCAATTGGTTTCAGTTATCATGA
CTATGTTGTCACAAATGCTACCAGTTTATGTATCTTCTGAGGCCTTCTTATCCTTCTTTGGGATTGGTTTACCAACCACCACTCCA
AGTTTAGGACGTTTTATTGCTAATTATTCAAGCAACTTAACAACAAATGCCTACCTCTTTTGGATTCCCTTAGTAACATTGATTTTA
GTATCGTTACCACTATACATTGTCGGACAAAACTTGGCTGATGCCAGTGACCCACGTTCACATAGATAG
SPy0348
Seq ID 18
TTGGCTTTGACCGATTTTAAGGATAAAGACCAACAAGATCAGCAGCGAAGCTTTAAAGAGCAGATTCTTGCTGAGTTGGAAAAA
GCAAATCAAATCAGAAAAGAAAAAGAGGAAGAACTTTTTCAAAAAGAGTTGGAAGCTAAAGAAGCAGCTAGGAGAACGGCCCAG
CTATATGCTGAATATAAAAGACAAGATGCTTTTCAAAAAGAGTCTATAGCACATAACAATAAGACAGCTAAACACTTTCAAGCTAT
AAAAGGTGCGGTAATGACTTCAGAAGCGCTTAAACCGACTTTACTTTCTGAAAAAGAAAACTCATCTTTAAAAACGACAAATAAG
AGAGTCGTGCAGGCAAATGAGCTTCAAGAGACTGCCTCTAAAGAATCTCAAGTACCGTTAACTATTGAGAAAGGTCATTCAGTG
AGACGAAAATTAAGCAAACGCCAACAGACTGAGCGAGCTGCTAAAAAGATTTCAACCGTTTTGATTAGTTCTATTATTATAACCC
TTTTGGCTGTTACTCTAGCAGGAGCAGGCTATGTTTATAGTGCTTTAAATCCTGTTGATAAAAATAGTGATGCCTTTGTTCAAGTT
GAGATTCCATCTGGGTCAGGCAATAAATTGATTGGTCAAATTCTTCAAAAAAAAGGTTTAATCAAGAATAGCACTGTTTTTAGTTT
TTATACAAAATTTAAAAACTTTACAAATTTTCAGAGCGGGTATTATAATCTGCAAAAAAGTATGAGTCTAGAAGAAATTGCTAGTG
CTTTACAAGAAGGTGGTACAGCAGAACCTACCAAGCCATCTCTTGGGAAGATCTTGATTCCAGAAGGATACACGATTAAACAAA
TAGCTAAAGCTGTTGAGCATAATAGCAAGGGAAAGACCAAAAAAGCTAAAACACCTTTTAACGAGAAGGATTTTTTGGATTTAGT
CACGGATGAGGCTTTTATTCAAGATATGGTAAAAAGATATCCAAAATTATTAGCAACTATCCCAACTAAAGAAAAAGCTATTTACC
GTTTGGAAGGTTACCTTTTCCCAGCAACCTATAACTATTACAAAGAAACTACCATGAGAGAACTTGTAGAGGACATGCTGGCAG
CTATGGATGCTACTTTGGTACCCTATTATGATAAAATTGCTGCTAGTGGTAAGACAGTCAACGAGGTATTGACCTTGGCCTCTTT
GGTTGAAAAAGAAGGTTCAACAGACGATGACAGACGTCAAATTGCAAGTGTCTTTTATAACCGCCTTAATAGCGGAATGGCACT
ACAATCTAATATAGCTATTTTGTATGCGATGGGGAAACTTGGTGAGAAAACAACCTTGGCTGAGGATGCTACTATTGACACCACC
ATTAATTCTCCTTATAATATTTATACCAATACAGGTCTGATGCCTGGTCCAGTTGCTAGCTCGGGGGTTTCTGCAATTGAAGCAA
CCCTAAATCCAGCCTCAACGGATTATTTATACTTTGTGGCCAATGTCCATACTGGTGAAGTTTACTATGCAAAAACATTTGAAGAA
CACTCTGCAAATGTTGAAAAATATGTGAATAGTCAAATTCAGTAA
SPy0416
Seq ID 19
GTGGAGAAAAAGCAACGTTTTTCCCTTAGAAAATACAAATCAGGAACGTTTTCGGTCTTAATAGGAAGCGTTTTCTTGGTGATGA
CAACAACAGTAGCAGCAGATGAGCTAAGCACAATGAGCGAACCAACAATCACGAATCACGCTCAACAACAAGCGCAACATCTCA
CCAATACAGAGTTGAGCTCAGCTGAATCAAAATCTCAAGACACATCACAAATCACTCTCAAGACAAATCGTGAAAAAGAGCAATC
ACAAGATCTAGTCTCTGAGCCAACCACAACTGAGCTAGCTGACACAGATGCAGCATCAATGGCTAATACAGGTTCTGATGCGAC
TCAAAAAAGCGCTTCTTTACCGCCAGTCAATACAGATGTTCACGATTGGGTAAAAACCAAAGGAGCTTGGGACAAGGGATACAA
AGGACAAGGCAAGGTTGTCGCAGTTATTGACACAGGGATCGATCCGGCCCATCAAAGCATGCGCATCAGTGATGTATCAACTG
CTAAAGTAAAATCAAAAGAAGACATGCTAGCACGCCAAAAAGCCGCCGGTATTAATTATGGGAGTTGGATAAATGATAAAGTTGT
TTTTGCACATAATTATGTGGAAAATAGCGATAATATCAAAGAAAATCAATTCGAGGATTTTGATGAGGACTGGGAAAACTTTGAGT
TTGATGCAGAGGCAGAGCCAAAAGCCATCAAAAAACACAAGATCTATCGTCCCCAATCAACCCAGGCACCGAAAGAAACTGTTA
TCAAAACAGAAGAAACAGATGGTTCACATGATATTGACTGGACACAAACAGACGATGACACCAAATACGAGTCACACGGTATGC
ATGTGACAGGTATTGTAGCCGGTAATAGCAAAGAAGCCGCTGCTACTGGAGAACGCTTTTTAGGAATTGCACCAGAGGCCCAA
GTCATGTTCATGCGTGTTTTTGCCAACGACATCATGGGATCAGCTGAATCACTCTTTATCAAAGCTATCGAAGATGCCGTGGCTT
TAGGAGCAGATGTGATCAACCTGAGTCTTGGAACCGCTAATGGGGCACAGCTTAGTGGCAGCAAGCCTCTAATGGAAGCAATT
GAAAAAGCTAAAAAAGCCGGTGTATCAGTTGTTGTAGCAGCAGGAAATGAGCGCGTCTATGGATCTGACCATGATGATCCATTG
GCGACAAATCCAGACTATGGTTTGGTCGGTTCTCCCTCAACAGGTCGAACACCAACATCAGTGGCAGCTATAAACAGTAAGTGG
GTGATTCAACGTCTAATGACGGTCAAAGAATTAGAAAACCGTGCCGATTTAAACCATGGTAAAGCCATCTATTCAGAGTCTGTCG
ACTTTAAAGACATAAAAGATAGCCTAGGTTATGATAAATCGCATCAATTTGCTTATGTCAAAGAGTCAACTGATGCGGGTTATAAC
GCACAAGACGTTAAAGGTAAAATTGCTTTAATTGAACGTGATCCCAATAAAACCTATGACGAAATGATTGCTTTGGCTAAGAAAC
ATGGAGCTCTGGGAGTACTTATTTTTAATAACAAGCCTGGTCAATCAAACCGCTCAATGCGTCTAACAGCTAATGGGATGGGGA
TACCATCTGCTTTCATATCGCACGAATTTGGTAAGGCCATGTCCCAATTAAATGGCAATGGTACAGGAAGTTTAGAGTTTGACAG
TGTGGTCTCAAAAGCACCGAGTCAAAAAGGCAATGAAATGAATCATTTTTCAAATTGGGGCCTAACTTCTGATGGCTATTTAAAA
CCTGACATTACTGCACCAGGTGGCGATATCTATTCTCCTAATAACGATAACCACTATGGTAGCCAAACAGGAACAAGTATGGCC
TCTCCTCAGATTGCTGGCGCCAGCCTTTTGGTCAAACAATACCTAGAAAAGACTCAGCCAAACTTGCCAAAAGAAAAAATTGCT
GATATCGTTAAGAACCTATTGATGAGCAATGCTCAAATTCATGTTAATCCAGAGACAAAAACGACCACCTCACCGCGTCAGCAA
GGGGCAGGATTACTTAATATTGACGGAGCTGTCACTAGCGGCCTTTATGTGACAGGAAAAGACAACTATGGCAGTATATCATTA
GGCAACATCACAGATACGATGACGTTTGATGTGACTGTTCACAACCTAAGCAATAAAGACAAAACATTACGTTATGACACAGAAT
TGCTAACAGATCATGTAGACCCACAAAAGGGCCGCTTCACTTTGACTTCTCACTCCTTAAAAACGTACCAAGGAGGAGAAGTTA
CAGTCCCAGCCAATGGAAAAGTGACTGTAAGGGTTACCATGGATGTCTCACAGTTCACAAAAGAGCTAACAAAACAGATGCCAA
ATGGTTACTATCTAGAAGGTTTTGTCCGCTTTAGAGATAGTCAAGATGACCAACTAAATAGAGTAAACATTCCTTTTGTTGGTTTT
AAAGGGCAATTTGAAAACTTAGCAGTTGCAGAAGAGTCCATTTACAGATTAAAATCTCAAGGCAAAACTGGTTTTTACTTTGATG
AATCAGGTCCAAAAGACGATATCTATGTCGGTAAACACTTTACAGGACTTGTCACTCTTGGTTCAGAGACCAATGTGTCAACCAA
AACGATTTCTGACAATGGTCTACACACACTTGGCACCTTTAAAAATGCAGATGGCAAATTTATCTTAGAAAAAAATGCCCAAGGA
AACCCTGTCTTAGCCATTTCTCCAAATGGTGACAACAACCAAGATTTTGCAGCCTTCAAAGGTGTTTTCTTGAGAAAATATCAAG
GCTTAAAAGCAAGTGTCTACCATGCTAGTGACAAGGAACACAAAAATCCACTGTGGGTCAGCCCAGAAAGCTTTAAAGGAGATA
AAAACTTTAATAGTGACATTAGATTTGCAAAATCAACGACCCTGTTAGGCACAGCATTTTCTGGAAAATCGTTAACAGGAGCTGA
ATTACCAGATGGGCATTATCATTATGTGGTGTCTTATTACCCAGATGTGGTCGGTGCCAAACGTCAAGAAATGACATTTGACATG
ATTTTAGACCGACAAAAACCGGTACTATCACAAGCAACATTTGATCCTGAAACAAACCGATTCAAACCAGAACCCCTAAAAGACC
GTGGATTAGCTGGTGTTCGCAAAGACAGTGTCTTTTATCTAGAAAGAAAAGACAACAAGCCTTATACAGTTACGATAAACGATAG
CTACAAATATGTCTCAGTAGAAGACAATAAAACATTTGTGGAGCGACAAGCTGATGGCAGCTTTATCTTGCCGCTTGATAAAGCA
AAATTAGGGGATTTCTATTACATGGTCGAGGATTTTGCAGGGAACGTGGCCATCGCTAAGTTAGGAGATCACTTACCACAAACA
TTAGGTAAAACACCAATTAAACTTAAGCTTACAGACGGTAATTATCAGACCAAAGAAACGCTTAAAGATAATCTTGAAATGACACA
GTCTGACACAGGTCTAGTCACAAATCAAGCCCAGCTAGCAGTGGTGCACCGCAATCAGCCGCAAAGCCAGCTAACAAAGATGA
ATCAGGATTTCTTTATCTCACCAAACGAAGATGGGAATAAAGACTTTGTGGCCTTTAAAGGCTTGAAAAATAACGTGTATAATGA
CTTAACGGTTAACGTATACGCTAAAGATGACCACCAAAAACAAACCCCTATCTGGTCTAGTCAAGCAGGCGCTAGTGTATCCGC
TATTGAAAGTACAGCCTGGTATGGCATAACAGCCCGAGGAAGCAAGGTGATGCCAGGTGATTATCAGTATGTTGTGACCTATCG
TGACGAACATGGTAAAGAACATCAAAAGCAGTACACCATATCTGTGAATGACAAAAAACCAATGATCACTCAGGGACGTTTTGAT
ACCATTAATGGCGTTGACCACTTTACTCCTGACAAGACAAAAGCCCTTGACTCATCAGGCATTGTCCGCGAAGAAGTCTTTTACT
TGGCCAAGAAAAATGGCCGTAAATTTGATGTGACAGAAGGTAAAGATGGTATCACAGTTAGTGACAATAAGGTGTATATCCCTAA
AAATCCAGATGGTTCTTACACCATTTCAAAAAGAGATGGTGTCACACTGTCAGATTATTACTACCTTGTCGAAGATAGAGCTGGT
AATGTGTCTTTTGCTACCTTGCGTGACCTAAAAGCGGTCGGAAAAGACAAAGCAGTAGTCAATTTTGGATTAGACTTACCGGTC
CCTGAAGACAAACAAATAGTGAACTTTACCTACCTTGTGCGGGATGCAGATGGTAAACCGATTGAAAACCTAGAGTATTATAATA
ACTCAGGTAACAGTCTTATCTTGCCATACGGCAAATACACGGTCGAATTGTTGACCTATGACACCAATGCAGCCAAACTAGAGT
CAGATAAAATCGTTTCCTTTACCTTGTCAGCTGATAACAACTTCCAACAAGTTACCTTTAAGATAACGATGTTAGCAACTTCTCAA
ATAACTGCCCACTTTGATCATCTTTTGCCAGAAGGCAGTCGCGTTAGCCTTAAAACAGCTCAAGATCAGCTAATCCCGCTTGAAC
AGTCCTTGTATGTGCCTAAAGCTTATGGCAAAACCGTTCAAGAAGGCACTTACGAAGTTGTTGTCAGCCTGCCTAAAGGCTACC
GTATCGAAGGCAACACAAAGGTGAATACCCTACCAAATGAAGTGCACGAACTATCATTACGCCTTGTCAAAGTAGGAGATGCCT
CAGATTCAACTGGTGATCATAAGGTTATGTCAAAAAATAATTCACAGGCTTTGACAGCCTCTGCCACACCAACCAAGTCAACGAC
CTCAGCAACAGCAAAAGCCCTACCATCAACGGGTGAAAAAATGGGTCTCAAGTTGCGCATAGTAGGTCTTGTGTTACTCGGACT
TACTTGCGTCTTTAGCCGAAAAAAATCAACCAAAGATTGA
SPy0430
Seq ID 20
ATGAAATGGAGTGGTTTTATGAAAACAAAATCAAAACGCTTTTTAAACCTAGCAACCCTTTGCTTGGCCCTACTAGGAACAACTTT
GCTAATGGCACATCCCGTACAGGCGGAGGTGATATCAAAAAGAGACTATATGACTCGCTTCGGGTTAGGCGATTTAGAAGATGA
TTCAGCTAACTATCCTTCAAATTTAGAAGCTAGATATAAAGGATATTTAGAGGGATATGAAAAAGGCTTAAAAGGAGATGATATAC
CCGAACGGCCCAAGATTCAGGTTCCTGAGGATGTTCAGCCATCTGACCATGGCGACTATAGAGATGGTTATGAGGAAGGATTT
GGAGAAGGACAACATAAACGTGATCCATTAGAAACAGAAGCAGAAGATGATTCTCAAGGAGGACGTCAAGAAGGACGTCAAGG
ACATCAAGAAGGAGCAGATTCTAGTGATTTGAACGTTGAAGAAAGCGACGGTTTGTCTGTTATTGATGAAGTAGTTGGAGTAATT
TATCAAGCATTTAGTACTATTTGGACATACTTAAGCGGTTTGTTCTAA
SPy0433
Seq ID 21
ATGAAAAAGACATTAACTTTGCTACTGGCACTCTTTGCCATCGGGGTAACTAGTAGCGTCAGAGCGGAGGATGAACAAAGTAGT
ACACAAAAGCCAGTAAAATTTGATTTGGATGGACCTCAACAAAAAATTAAAGATTATAGTGGCAACACAATCACTCTAGAAGACT
TATATGTTGGTAGTAAAGTAGTAAAAATATATATCCCTCAAGGATGGTGGGTATATCTTTACAGACAATGTGATCATAACAGTAAA
GAACGAGGAATTTTAGCTAGTCCTATTCTCGAAAAAAATATAACAAAAACAGATCCTTATCGTCAATATTATACAGGAGTACCTTA
TATTCTTAACTTAGGAGAAGATCCTTTGAAGAAAGGAGAAAAATTAACTTTCTCATTTAAAGGAGAAGACGGATTTTATGTCGGTA
GCTATATCTATAGAGACTCTGATACTATAAAAAAAGAAAAAGAAGCTGAAGAAGCACTTCAAAAAAAGGAAGAGGAAAAGCAACA
AAAACAGCTAGAAGAAAGCATGCTAAAGCAGATAAGAGAAGAAGACCATAAACCTTGGCATCAGCGGTTAAGTGAGAGCATCCA
AGATCAGTGGTGGAACTTTAAGGGACTGTTTCAGTGA
SPy0437
Seq ID 22
ATGAAAAAAACATTAACCTTGCTACTGGCACTCTTTGCCATCGGGGTAACTAGTAGCGTCAGAGCGGAGGATGAACAGAATAAG
TTTATACTTGATGGATTACAGGAAAAAGTAAAAGAAGTTAGTGTATCAGATTTTTCTGTTGGAGAATCTAAAATCAAAGTCTGGCT
TCCTCAAGCTTGGTCGGTCAAAATTTCTAGAGAACATTCACCAAAATCAAGCATTTCTAATTCTGGAGAACAAAAACCTTTAAGCA
ATAGCTCAGAGAATAAAGAAGGTCAATTTTCTAAAAGATTACCTTATGGTACCCAACATACTATTAAATTATCATCCCAACTTACA
AAAGGTGAGAGAGTCACTTTGACATTCAGAGATGAAGATTTTTGGGGAGCAGGTTACTGCTTCTATAGAGATTCACTATCCATAA
AAGAAGACAAACAATACGAAGAAGAAATTAAGAAAATTGAGGATGACCTAGAGAGACAAGATCTTGAAAATGATGCACTAGAGA
TGTTTAAAAAACAAACCGAAAGAGAGGCTAATAAACCTTGGCATCAGCGGTTAAGCGAAAACATCCAAGATCAGTGGTGGAACT
TTAAGGGACTGTTTCAGTGA
SPy0469
Seq ID 23
ATGATTATTACTAAAAAGAGCTTATTTGTGACAAGTGTCGCTTTGTCGTTAGTACCTTTGGCGACAGCGCAGGCACAAGAGTGG
ACACCACGATCGGTTACAGAAATCAAGTCTGAACTCGTCCTAGTTGATAATGTTTTTACTTATACTGTAAAATACGGTGACACTTT
AAGCACAATTGCTGAAGCAATGGGGATTGATGTGCATGTCTTAGGAGATATTAATCATATTGCTAATATTGACCTAATTTTTCCAG
ACACGATCCTAACAGCAAACTACAATCAACACGGTCAGGCAACGAATTTGACGGTTCAAGCACCTGCTTCTAGTCCAGCTAGCG
TTAGTCATGTACCTAGCAGTGAGCCATTACCCCAAGCATCTGCCACCTCTCAACCGACTGTTCCTATGGCACCACCTGCGACAC
CATCTGATGTCCCAACGACACCATTCGCATCTGCAAAGCCAGATAGTTCTGTGACAGCGTCATCTGAGCTCACATCGTCAACGA
ATGATGTTTCGACTGAGTTGTCTAGCGAATCACAAAAGCAGCCAGAAGTACCACAAGAAGCAGTTCCAACTCCTAAAGCAGCTG
AAACGACTGAAGTCGAACCTAAGACAGACATCTCAGAAGCCCCAACTTCAGCTAATAGGCCTGTACCTAACGAGAGTGCTTCAG
AAGAAGTTTCTTCTGCGGCCCCAGCACAAGCCCCAGCAGAAAAAGAAGAAACCTCTGCGCCAGCAGCACAAAAAGCTGTAGCT
GACACCACAAGTGTTGCAACCTCAAATGGCCTTTCTTACGCTCCAAACCATGCCTACAATCCAATGAATGCAGGGCTTCAACCA
CAAACAGCAGCCTTCAAAGAAGAAGTGGCTTCTGCCTTTGGTATTACGTCATTTAGTGGTTACCGTCCAGGTGATCCAGGAGAT
CATGGTAAAGGTTTGGCCATTGATTTTATGGTGCCTGAAAATTCTGCTCTTGGTGATCAAGTTGCTCAATATGCCATTGACCATA
TGGCAGAGCGTGGTATTTCATACGTTATTTGGAAACAGCGATTCTATGCGCCATTTGCAAGTATTTACGGACCAGCCTACACAT
GGAACCCCATGCCAGATCGCGGCAGTATTACAGAAAACCATTATGATCATGTTCATGTCTCCTTTAATGCTTAA
SPy0488
Seq ID 24
TTGCGGCAGATTCAGTCCATTCGTCTGATAGACGTTTTGGAGTTGGCTTTTGGAGTTGGCTATAAGGAAGAAACAACCTCTCAG
TTTTCTTCGGATCAGCCCTCCCAAGTGGTTTTGTATCGAGGTGAGGCTAACACGGTTAGGTTTGCCTATACCAATCAGATGTCTC
TGATGAAAGATATTCGCATTGCTTTGGATGGTTCTGATAAGTCTTTGACCGCTCAGATTGTTCCTGGTATGGGTCATGTTTATGA
GGGCTTTCAAACTTCTGCTAGAGGGATTTTTACGATGTCAGGAGTTCCTGAAAGCACTGTTCCCGTTGCTAACCCTAATGTACAA
ACCAAATATATAAGGTATTTCAAAGTCATTGATGATATGCATAACACAATGTATAAAGGAACTGTTTTTCTTGTTCAACCGCAAGC
TTGGAAATACACCATGAAATCTGTTGATCAGTTACCAGTAGATGACTTGAACCATATTGGCGTTGCTGGTATTGAACGAATGACA
ACTCTCATTAAAAATGCGGGTGCCCTTTTAACCACAGGAGGTAGTGGGGCTTTCCCAGACAATATTAAAGTATCTATTAATCCAA
AGGGGAGGCAGGCCACGATTACTTATGGGGACGGCTCTACGGATATTATTCCTCCAGCAGTTTTATGGAAAAAAGGCTCCGTA
AAAGAGCCTACTGAAGCCGATCAATCTGTCGGAACACCGACTCCTGGTATTCCTGGTAAATTCAAACGAGACCAGAGCCTTAAC
GAGCATGAAGCTATGGTAAATGTCGAACCACTGTCTCATGTAGTAAAAGACAATATAAAGGTCATAGATGAAAAATCAACAGGG
CGGTTTGAGCCTTTTAGACCTAATGAAGATGAGAAGGAGAAGCCTGCCAGCGATGTTAAGGTAAGACCAGCAGAAGTTGGTAG
CTGGCTAGAACCAGCGACAGCTCTTCCTAGTGTTGAAATGAGCGCTGAGGACAGGTTAAAAAGTTAG
SPy0515
Seq ID 25
ATGAAAGTCTTATTGTATTTAGAAGCAGAAAATTATCTAAGAAAATCAGGAATTGGTCGAGCGATTAAGCATCAGGCTAAAGCCT
TGTCACTTGTTGGTCAACATTTTACGACTAATCCAAGAGAAACTTATGATTTGGTTCATCTCAATACCTATGGTTTAAAAAGTTGG
CTGCTGATGATAAAAGCACAAAAAGCTGGTAAGAAGGTTATCATGCATGGGCATTCTACAGAAGAAGATTTTAGAAATTCTTTTA
TTTTTTCAAATCTATTATCTCCTTGGTTTAAAAAATACCTTTGTCACTTTTACAATAAGGCAGATGCTATCATTACCCCTACCCTAT
ATTCTAAGTCTTTGATTGAGAGTTATGGAGTGAAGTCACCTATTTTTGCAGTGTCAAATGGGATTGATTTGGAGCAGTACGGAGC
AGATCCTAAAAAGGAAGCAGCTTTTCGTCGCTACTTTGACATTAAAGAGGGTGAAAAAGTGGTTATGGGAGCAGGATTATTTTTT
CTGAGGAAAGGAATTGATGACTTTGTCAAAGTTGCCCAAGCTATGCCAGATGTTCGTTTTATCTGGTTTGGCGAGACCAACAAAT
GGGTCATTCCTGCTCAAGTTCGCCAAATGGTCAATGGTAACCACCCGAAAAATCTTATTTTCCCAGGATACATTAAAGGGGATGT
TTATGAAGGTGCCATGACTGGTGCAGATGCCTTTTTCTTTCCAAGTCGTGAAGAAACAGAAGGCATTGTTGTCTTAGAAGCCTT G
GCCAGTCGCCAGCACCTTGTTTTACGTGATATACCAGTTTACTACGGATGGGTTGATCAAAGTAGTGCGGAATTAGCAACCGAT
ATACCAGGTTTTATAGAAGCTCTGAAAAAAGTCTTTTCTGGTGCCAGCAACAAAGTTGAAGCTGGTTACAAGGTTGCCCAGAGT
CGTCGCCTAGAAACGGTTGGCCATGCCTTAGTAGATGTCTATAAAAAAGTAATGGAGTTATAA
SPy0580
Seq ID 26
ATGGAAAATAACAATAATCACAACATTGCAGAGGCTTTGTCAGTTAGTCTCCATCAAATTGAACAGGTGCTTGCCCTAACAGCAC
AAGGCAATACCATTCCCTTTATTGCACGTTACCGTAAAGAAGTAACAGGAAATCTAGATGAAGTGGTGATTAAGTCCATTATTGA
TATGGATAAGTCTCTCACTACCCTGAATGAGCGCAAAGCAACCATTCTCGCTAAAATTGAGGAACAGGGAAAACTGACAGATCA
GTTACGAACGAGTATTGAAGCAACCGAGAAACTCGCTGATTTGGAAGAGTTGTACCTGCCTTATAAGGAAAAACGCCGTACAAA
AGCGACGATTGCGCGTGAAGCAGGCTTGTTCCCATTAGCACGTTTGATTTTACAAAATGCGCAAAACCTTGAAACAGCAGCAGA
ACCCTTTGTCACAGAAGGATTTGCCAGCCCACAAGAAGCTCTAGCAGGAGCTGTGGACATCCTTGTGGAGGCCATGTCAGAAG
ATGCTAAATTACGCTCTTGGACCTACAATGAGATTTGGCAGTACAGCCGCTTAGTATCAACGCTTAAAGATGAGCAGTTGGATG
AGAAAAAGGTTTTCCAAATCTATTACGATTTTTCTGACCAAGTGTCTAACATGCAAGGATATCGTACTTTAGCCCTTAACCGTGG
CGAAAAGTTAGGCATCTTAAAAGTGTCTTTTGAGCATAACTTGGAGAAAATGCAACGCTTTTTCAGTGTGCGGTTCAAAGAAACC
AACCCTTATATTGAAGAGGTCATCAATCAGACCATCAAAAAGAAAATTGTTCCAGCTATGGAAAGACGGGTTCGTTCAGAACTCA
GTGATGCCGCAGAAGATGGGGCTATCCACCTCTTTTCTGAAAATCTCCGTCATCTTTTGTTAGTGTCTCCTTTAAAAGGGAAAAT
GGTTCTTGGGTTTGACCCTGCCTTTCGAACAGGTGCAAAATTGGCTATCGTTGATCAGACTGGAAAATTGTTGACTACTCAGGTT
ATTTATCCCGTAGCACCAGCTAGCCAAACGAAGATTCAAGCAGCTAAAGAAACACTGACTCAGCTCATTGAGACTTACCAGATT
GATATTATTGCCATTGGAAACGGAACAGCCAGTCGGGAAAGTGAAGCCTTTGTAGCAGACGTTTTGAAAGATTTCCCAAATACG
TCCTATGTCATCGTTAACGAAAGCGGTGCTTCTGTTTATTCAGCGTCAGAGTTAGCCCGCCATGAGTTTCCAGACCTCACAGTG
GAGAAGCGCTCTGCTATTTCTATTGCTCGTCGCTTGCAAGACCCACTCGCAGAATTGGTTAAAATTGATCCTAAATCTATTGGCG
TCGGTCAGTACCAGCACGATGTGAGTCAGAAAAAGTTGAGTGAGAATCTTGGTTTTGTTGTGGATACTGTGGTTAACCAAGTCG
GTGTTAATGTGAACACGGCTAGTCCATCTTTATTAGCACATGTGTCAGGTTTGAACAAAACGATTTCAGAAAATATTGTCAAATAC
CGCGAAGAAAATGGAGCACTGACATCACGCGCTGACATCAAAAAAGTGCCGCGTTTAGGAGCCAAGGCGTTTGAGCAAGCAGC
AGGTTTTCTCAGAATTCCAGGAGCCAAAAATATTTTAGACAACACAGGAGTTCACCCCGAGTCCTACCCAGCAGTCAAAGAACT
CTTTAAGGTACTTGGTATTCAGGACTTGGACGACGCTGCCAAGGCAACTTTAGCAGCAGTTCAAGTTCCCCAAATGGCAGAAAC
ATTGGCTATTGGGCAGGAAACCCTTAAAGATATCATTGCTGATCTCCTTAAACCGGGTCGTGACCTTCGTGATGACTTTGAAGC
ACCAATCTTACGTCAAGATATCCTTGATTTGAAAGATTTGGAAATTGGCCAGAAGCTTGAAGGAACTGTGAGAAACGTCGTTGAC
TTTGGTGCTTTTGTAGACATTGGTGTTCATGAAGATGGGCTTATTCACATTTCTGAAATGAGCAAAACCTTTGTCAACCACCCTA
GTCAAGTTGTTTCAGTGGGTGACTTGGTAACTGTTTGGGTCTCTAAGATTGACTTGGACCGCCACAAGGTCAATCTCAGCCTAT
TGCCACCGCGTGACACTCACTAA
SPy0621
Seq ID 27
ATGAATGAAAAAGTATTTCGTGACCCTGTTCACAACTATATCCACATTGATAATCCATTAATTTATGACCTTATCAATACCAAAGAA
TTCCAACGCTTACGACGCATCAAACAAGTCCCTACAACAGCTTTCACCTTCCACGGCGCAGAACATAGCCGTTTTTCTCACTGC
CTAGGTGTTTACGAAATTGCCCGTCGGGTGACAGCTATTTTTGAAGAGAAATACGCTGATATCTGGAATAAAGATGAAAGTCTG
GTCACTATGACGGCTGCCCTCTTACATGACATTGGTCATGGAGCCTATTCTCATACCTTTGAGGTTCTTTTTCATACGGATCACG
AGGCCTTTACTCAGGAGATAATTACCAATCCTGAGACAGAAATCAATGCCATTTTGGTGCGTCATGCTCCTGATTTTCCAGACAA
AGTTGCCAGCGTGATTAATCATACTTATCCTAACAAGCAAGTTGTGCAACTGATTTCCAGCCAGATTGACTGCGACCGTATGGAT
TACCTTTTAAGAGATTCTTATTTTTCTGCTGCCAATTACGGTCAGTTTGATTTAATGCGCATCCTACGTGTGATTCGACCTGTTGA
AGATGGCATTGTCTTTGAACATAGTGGTATGCATGCTGTCGAGGACTATATTGTCAGTCGTTTTCAAATGTACATGCAGGTCTAT
TTTCATCCCGCCAGCCGTGCTGTTGAGCTCATCTTACAAAATCTCCTCAAAAGAGCCCAACACTTATATCCTGAGCAACAGGCTT
ATTTCCAAAAAACAGCTCCTGGACTCATCCCCTTCTTTGAAAAGAAGGCTAATTTAGCAGATTATATAGCCCTAGATGACGGAGT
CATGAATACTTACTTCCAAGTCTGGATGGCAAGCGAAGACCATATCTTATCAGATTTGGCCAGTCGCTTTATTAATCGAAAAATT
CTGAAGTCTGTTACCTTTGACCAAGATTCCCAAGGAGAGTTAGAACGCTTGCGCCAATTGGTCGAATCAGTTGGCTTTGATCCA
GATTATTACACCGGTATCCATATCAACTTCGACCTGCCTTATGATATTTATCGACCAGAGCTCGAAAATCCAAGAACTCAGATTG
AAATGATGCAAAAAGACGGGAGCCTTGCTGAATTATCTCAGTTATCTCCTATTGTCAAAGCATTAACAGGGACAACCTACGGAG
ACCGTCGCTTTTATTTTCCAAAGGAAATGTTAGAGCTCGATGACCTCTTTGCTCCTAGCAAGGAAACTTTTATGAGTTATATTTCC
AATGGGCATTTTCACTTTAGTCAGTAA
SPy0630
Seq ID 28
ATGGATATCAATTTGTTACAGGCACTTTTAATTGGTCTTTGGACAGCCTTTTGTTTCAGCGGAATGTTACTTGGCATCTACACCAA
CCGTTGTATTATTCTGTCTTTTGGTGTAGGGATTATCTTAGGTGACTTGCCAACTGCACTTAGCATGGGAGCTATCTCCGAATTA
GCTTATATGGGATTTGGAGTGGGTGCCGGTGGTACCGTTCCTCCTAATCCTATCGGCCCTGGTATCTTTGGTACCTTGATGGCT
ATTACCAGTGCTGGTAAAGTCACCCCAGAAGCGGCACTAGCCTTATCAACACCAATCGCAGTTGCCATCCAATTCCTTCAAACA
TTCGCCTATACAGCTTTTGCTGGCGCTCCCGAAACCGCTAAAAAACAATTGCAAAAAGGCAATATTAGAGGCTTCAAATTCGCTG
CCAACGGCACTATCTGGGCTTTCGCTTTTATCGGATTAGGCCTTGGTTTATTAGGTGCCTTGTCAATGGATACTCTCCTTCACTT
GGTTGATTATATCCCACCTGTCTTGCTCAATGGATTGACTGTCGCTGGTAAAATGTTACCTGCTATCGGATTTGCCATGATCTTA
TCTGTTATGGCCAAGAAAGAATTGATTCCTTTTGTACTAATTGGTTATGTTTGTGCAGCCTACCTCCAAATTCCAACCATTGGTAT
CGCCATTATTGGTATCATTTTCGCCTTGAATGAATTTTACAACAAACCTAAACAAGTCGATGCAACAACTGTCCAAGGAGGCCAA
CAAGATGACTGGATCTAA
SPy0681
Seq ID 29
TTGACCCCTCGTAGCGGAAAGACCACAGCTGGGCATTTTCGTTATGCTAGGTATCTGATTGAGTCAGAAGATGAAAATCACCTT
GTGACTGCTTATAATCAAGAACAAGCTTATCGTTTGTTTATCGACGGCGATGGTACGGGTTTGATGCATATATTTGACGGTAACT
GTGAAATAAAACACGACGAGCGTGGAGATCACTTGTTAATCACGACACCAAAAGGCAATAAGCGCGTTTATTATAAAGGCGGCG
GTAAAGTTAACAGTGTTGGTGCTATTACAGGTATGTCTTTAGGATCAGTAGTATTCTGCGAGATTAACTTACTGCACATGGATTTT
ATCCAGGAGTGTTTTAGGCGTACTTGGGCGGCTAAGCTACGTTATCATCTAGCAGATTTAAATCCCCCAGCACCTCAACATCCA
GTAATTAAAGATGTCTTTGATGTTCAGAACACGAGGTGGACTCATTGGACCATGGATGATAACCCAATACTAACCGCAGAGCGT
AAACAAAACATTATCAACAGTCTTAAAAAAAATCCATATCTATACAAACGAGATGTACTTGGACAGCGGGTCATGCCTCAGGGAG
TTATTTATGGCCTTTTTGACACGGAAAAAAATGTTTTGGATGCTTTGATTGGCGAACCAGTAGAGATGTATTTCTGTGCAGATGG
AGGTCAATCAGATGCCACCTCTATGTCTTGTAATATCGTAACAAGAGTTAGAGATAACGGTAGGATAAGCTTCAGACTTAATCGT
GTAGCTCACTACTACCACAGCGGAGCTGACACTGGCCAAGTAAAAGCTATGTCAACCTACGCTTTAGAGTTAAAAGTTTTTATAG
ACTGGTGCGTTAAAAAGTATCAGATGCGCTATACAGAGGTATTTGTGGATCCTGCCTGTAAATCTTTGAGAGAGGAGCTGCATA
AGTTAGGAGTATTTACTCTGGGAGCTCCGAACAATTCTAAAGATGTATCTAGCAAAGCAAAAGGTATTGAGGTCGGTATCGAAC
GCGGCCAAAACATTATCTCAGATGGCGCTTTTTATCTTGTTAATCATAGCGAAGAAGAGTATGACCACTACCACTTTTTAAAAGA
GATAGGGCTGTACAGTCGTGACGACAATGGCAAACCTATTGATAAAGATAACCATGCCATGGACGAGTTTAGATACAGCGTCAA
CGTGTTTGTGCATCGGTATTACAACTAA
SPy0683
Seq ID 30
ATGAAAAAGAAGCCTATTAAGTTAAATGACGAACAGCTTCTTTTGGAAGCTAGTCAGTTATCTGATATGTATCATCAGCTGACTCT
TGATTTATTTGATCAAGTGATTGAGAGGATAAAAGCCAGAGGCTCAGCGAGCTTAGCCGATAATCCTTATCTTTGGCAAGCTAAT
AAGTTACATGACGTTGGACTGCTTAATGCAGATAACATCAAGCTTATTGCAAAGTATTCTGGCATTGCGGAAGATCAACTTCGCT
ATATTATCAAGAATGAAGGATTTAAAATTTATAAAAACACGTCTGAGCAGCTAGAAGAGGCTCTAGGTAGAGAGTCTGGGGTAAA
CAGTACTATCCAAGACGACCTATCTAACTATGCTAGACAAGCTATTGATGATGTGCATAATTTGACTAACACCACCTTGCCATTTA
GTGTTATAGGAGCTTATCAAGGGATAATCCAAGACGCTGTTGCTGGTGTGGTGACAGGCTTAAAAACGCCTGACCAAGCTATCA
ATCAAACTGTGATTAAATGGTTTAAAAAGGGGTTTTATGGTTTTACAGATAAAGCTGGGAGAAAGTGGAGAGCAGACTCTTATGC
TCGTACCGTTATCAATACTACGACTTGGCGAGTCTTTAACGAAGCCAAAGAAGCCCCTGCTAGGGAGTTTGGCATTGATACCTT
CTATTACTCAAAAAAAGCTACAGCTAGAGAGATGTGTGCACCTTTGCAACATCAAATTGTCACTACTGGCGAAGCGAGAGAAGA
AGGAGGGATAAAAATCTTAGCTTTATCTGATTACGGGCATGGTGAGCCTGATGGATGCTTGGGAATCAACTGCAAGCACACTAA
AACGCCGTTTGTCGTCGGTGTGAATAGTAAGCCAGAATTGCCAGAGCATCTAAAAAATATCACTCCTGCACAAGCTAAAGCTAA
TGCGAATGCGCAAGCTAAGCAGAGGGCAATCGAGAGATCAATACGTAAGAGTAAAGAGCTACTGCACGTTGCGAAGCAATTGG
GTGATAAAGAGTTGATTAGGCAATATCAATCGGATGTTAGAAGTAAACAAGATGCACTCAATTATCTGATAAACAACAATGCCTTT
TTACATCGCAATCAAGCCAGAGAAAAGCGTTACAATAATCCTTATACCAAAACTCAAAGTGAAGTCGAAGTTAGAAAAGAAAAAG
CTAAATTAGATAAACGTAGGGATGTTGAAAGTGCTATAATAGGAGTAGAAACTAGTGAAGGGATACCGCTAAAAATAACAAAGCA
TTTAGCCGAAAGGGCGGTGCTGAGAAATATAGCACCTATTGATATTGTCGATTCTATAAAAGAACCGTTGAAGATAGCTCCTATT
AAGTACGATAACCTTGATAGACCTTCCCAGAAATACATTGGTAAGTGTGTCTCGACAGTAATAAACCCGATAGACGGAAATATTG
TTACAGTTCATGCTACTAGCACGAGAATCCGCAAAAAATATGGAGGAAATTGA
SPy0702
Seq ID 31
ATGAGCAGAGACCCAACACTTATTTTAGACGAGTCAAACCTCGTTATTGGTAAGGATGGACGTGTGCATTACACATTTACCACAG
AGGACGACAACCCAAAAGTCAGACTAGCTAGCAAGTGTCTAGGCACAGCGCATTTTAATCAGCTCATGATTGAGCGAGGAGAC
CAAGCTACTAGCTATGTTGCGCCAGTAGTAGTTGAGGGTACAGGTAATCCGACTGGACTATTTAAAGACCTCAAAGAGATTAGC
TTAGAGCTGACAGATACTGCTAATTCCCAGCTTTGGTCAAAAATCAAGCTGACTAACCGTGGTATGTTGCAGGAATACTACGAC
GGTAAGATCAAGACCGAGATAGTCAACTCCGCCAGAGGTGTCGCTACACGTATCAGCGAGGATACTGATAAAAAGCTAGCGCT
CATCAATGACACCATTGATGGTATCAGGCGTGAGTATCGAGATGCTGATAGGAAGCTATCCGCAAGCTATCAGGCAGGCATCG
AGGGGCTAAAAGCCACAATGGCCAATGATAAAATCGGTTTACAAGCTGAGATTAAAGCCTCAGCACAAGGGCTATCGCAAAAGT
ATGATGATGAGTTGCGCAAGCTATCGGCTAAGATCACAACAACCTCAAGCGGCACTACAGAGGCCTACGAGAGTAAGCTTGCG
GGCTTACGTGCTGAGTTTACTCGCTCAAATCAAGGCACGAGGACAGAGCTCGAGTCACAAATTAGCGGGCTAAGAGCGGTACA
GCAGTCAACAGCTAGCCAAATCTCTCAAGAGATTAGAGACCGTGAAGGTGCTGTCAGTCGTGTGCAGCAGAGTTTGGAGAGTT
ACCAAAGGCGGATGCAGGACGCAGAAGAAAACTATAGTAGCTTGACCCATACGGTTAGAGGGCTACAGAGCGACGTTGGATCT
CCGACTGGTAAAATCCAATCGCGCCTTACTCAACTAGCAGGACAAATTGAGCAGCGGGTTACTAGAGATGGTGTCATGAGTATT
ATTAGTGGCGCTGGAGACAGCATTAAATTAGCTATCCAAAAGGCTGGCGGCATTAATGCCAAAATGTCTGGTAATGAGATTATC
TCAGCAATTAACCTCAACTCCTACGGAGTAACAATCGCAGGTAAACACATCGCTCTCGATGGGAATACGACGGTTAATGGCACC
TTTACCACAAAAATAGCCGAGGCTATCAAGATTAGGGCTGATCAGATTATTGCAGGCACGATTGACGCTGCTAGGATTAGAGTG
ATTAACCTTAACGCAAGTAGTATCGTTGGTTTAGACGCTAACTTTATCAAAGCTAAAATTGGCTATGCTATCACTGATTTGCTCGA
GGGTAAGGTCATTAAGGCTCGTAATGGAGCGATGCTTATCGACTTAAATACAGCTAAGATGGACTTTAATAGCGATGCCACAAT
TAATTTTAATAGCAAAAACAATGCCTTAGTACGTAAAGATGGCACACATACTGCCTTTGTACATTTTAGTAATGCGACGCCCAAA
GGTTATACAGGGTCAGCGTTGTATGCATCGATCGGGATAACCTCATCTGGTGACGGTGTTAACTCGGCTTCTTCCGGTCGTTTT
GCAGGGCTAAGGTCATTTAGGTACGCTACGGGATATAATCACACTGCGGCAGTCGACCAGACTGAAATTTACGGTGATAATGTT
TTAGTTGTGGATGATTTTAATATTACTCGGGGATTTAAGTTTAGACCAGACAAGATGCAAAAAATGCTTGACATGAACGACTTGTA
TGCGGCTGTAGTAGCCTTAGGCCGCTGTTGGGGGCACTTGGCTAACGTCGGCTGGAATACTGCTCATAGCAATTTTACAAGTG
CTGTGAATAGGGAATTGAATAACTACATCACAAAAATTTAA
SPy0710
Seq ID 32
ATGACCTTTTTAGATAAAATTAAACAAGGCTGTTTAGATGGCTGGGCTAAGTACAAAATCTTGCCATCCTTGACCGCAGCACAAG
CTATCTTAGAGAGCGGGTGGGGCAAACATGCCCCACACAACGCTCTGTTTGGTATTAAGGCAGATAGCTCTTGGACTGGTAAAT
CATTTGATACCAAAACCCAAGAGGAATATCAAGCAGGTGTTGTCACGGATATTGTGGACCGATTTAGGGCGTATGATAGTTGGG
ATGAGTCGATAGCTGATCACGGACAATTTTTAGTTGATAATCCACGCTATGAGGCAGTTATTGGGGAGACTGACTATAAAAAGG
CTTGTTACGCTATTAAAGCAGCTGGATACGCTACGGCAAGTAGCTATGTCGAACTTTTAATCCAACTGATTGAGGAAAACGACTT
ACAAAGTTGGGATAGAGAAGCTCTTAAAAATAATAAGGAGGAAACGATGACAACCGCAAACGAAATTGTACAATACTGTGTTAAC
CTTGCTAATTCAGGCATGGGTGTTGACAAAGACGGTGCTCACGGGACGCAATGCTGTGACTTGCCTTGTTTTGTCGCTAAAAAT
TGGTTTGGTGTTGATCTTTGGGGCAATGCGATTGATTTATTAGACAGCGCAAGTGCGCAAGGCTGGGAAGTCCATCGTATGCCA
ACAGAGGCAAACCCAAAAGCAGGCGCTACATTTGTCCAATCAGTGCCGTATCATCAATTTGGACATACGGGAATTGTTATCGAG
GATAGTGACGGTTACACCATGCGCACTGTCGAGCAAAACATTGATGGCAATCCTGATGCTTTGTATGTCGGTGCACCAGCTCGT
TTTAACACTCGTGACTTTACTGGCGTGATAGGTTGGTTTTACCCACCATATCAAGGGGATACAGTCACGCAACCAGTCAGCACC
GAGCCGCAAACTTCTGACACTATCGTAGAGACAGCAAAAACAGGCACCTTTACCCTTGATGTTGCAGAGATCAATATCAGACGC
TGGCCAAGTCTAGCCAGCGAGGTTGTAGGTATCTACAAGCAAGGTGATACTGTCAGCTTTGATAGCGAGGGCTACGCTAATGG
CTATTATTGGATTAGCTATGTTGGAGGCTCAGGTATGCGTAACTACCTAGGTATTGGACAGACTGATAAAGATGGGAATCGCAT
CAGCCTTTGGGGTAAATTAAATTAG
SPy0711
Seq ID 33
ATGAAAAAGATTAACATCATCAAAATAGTTTTCATAATTACAGTCATACTGATTTCTACTATTTCACCTATCATCAAAAGTGACTCT
AAGAAAGACATTTCGAATGTTAAAAGTGATTTACTTTATGCATACACTATAACTCCTTATGATTATAAAAATTGCAGGGTAAATTTT
TCAACGACACACACATTAAACATTGATACTCAAAAATATAGAGGGAAAGACTATTATATTAGTTCCGAAATGTCTTATGAGGCCTC
TCAAAAATTTAAACGAGATGATCATGTAGATGTTTTTGGATTATTTTATATTCTTAATTCTCACACCGGTGAGTACATCTATGGAG
GAATTACGCCTGCTCAAAATAATAAAGTAAATCATAAATTATTGGGAAATCTATTTATTTCGGGAGAATCTCAACAGAACTTAAAT
AACAAAATTATTCTAGAAAAAGATATCGTAACTTTCCAGGAAATTGACTTTAAAATCAGAAAATACCTTATGGATAATTATAAAATT
TATGACGCTACTTCTCCTTATGTAAGCGGCAGAATCGAAATTGGCACAAAAGATGGGAAACATGAGCAAATAGACTTATTTGACT
CACCAAATGAAGGGACTAGATCAGATATTTTTGCAAAATATAAAGATAATAGAATTATCAATATGAAGAACTTTAGTCATTTCGAT
ATTTATCTTGAAAAATAA
SPy0720
Seq ID 34
ATGATAACAACTTTTGAAACAATTTTAGATAAAATAAAAGCTCACCAAACTATTATTATCCATCGCCATCAAAATCCTGACCCTGAT
GCTCTTGGTAGTCAGGCCGGCTTGAAAGAAATTATTGCACAAAATTTCCCAGACAAAAAGGTTTTGATGACTGGTTTTGATGAGC
CTAGTTTAGCTTGGATTAGCCAAATGGATCAGGTGACTGACAAAGACTATAAAGAGGCTTTGGTCATCATTACAGATACAGCGAA
TCGACCAAGGATTGATGATGAGCGCTACACACTGGGGAAGTGCTTAATTAAGATTGATCACCATCCCAACGATGATGTGTATGG
TGACTTCTATTATGTGGACACAAGCGCTTCTAGCGCAAGTGAAATCATTGCAGACTTTGCCTTTAGTCAGAATCTTACTCTCTCT
GACAAGGCTGCTAAGCTCTTATACACCGGTATCGTTGGTGATACAGGGCGATTTCTTTATGCCTCAACCACTAGTAAAACCCTTT
CCATTGCTAGCCAACTCAGACATTTCGAGTTCGACTTTGCTGCGATTTCAAGGCAAATGGATTCGTTTCCTTTGAAAATAGCAAA
GCTGCAAAGCTACGTCTTTGAGCATTTAACAATTGATGAGAGTGGGGCTGCTTATGTCCTTGTCAGCCAAGAAACCTTAAAACAT
TTTGACGTGACCCTAGCAGAAAGCTCTGCCATTGTCTGTGCTCCTGGTAAAATTGATAACGTTCAAGCTTGGGCTATTTTTGTTG
AGTTAACTGACGGCAACTACCGTGTGCGTATGCGCAGTAAAGAAAAGATTATTAATGGCATTGCTAAGCGTCACGGTGGAGGG
GGGCATCCCCTTGCTAGCGGAGCCAACTCAGCTAATTTAGAAGAAAATCAAGCTATTTTCCGAGAACTCATCGCTGTTTGCCAA
GAGATTTAG
SPy0727
Seq ID 35
ATGATTGAAGAAAATAAACATTTTGAAAAAAAAATGCAAGAATACGATGCCAGTCAAATTCAGGTTCTAGAAGGGCTGGAGGCTG
TCCGCATGCGTCCAGGGATGTATATTGGCTCGACAGCTAAAGAGGGTTTGCATCATTTAGTCTGGGAAATTGTTGACAACTCAA
TTGACGAAGCATTAGCAGGTTTTGCCTCTCATATTAAAGTCTTTATTGAAGCAGATAATTCCATTACAGTAGTAGATGATGGCCG
TGGAATTCCAGTTGATATCCAAGCCAAGACAGGACGTCCCGCCGTTGAAACAGTTTTTACAGTCTTACACGCAGGTGGTAAATT
TGGTGGAGGCGGCTATAAGGTTTCTGGAGGATTACATGGTGTAGGGTCATCTGTTGTTAATGCTTTATCAACACAATTAGATGTA
CGTGTTTATAAAAACGGCCAAATTCATTACCAAGAATTTAAACGCGGGGCTGTTGTAGCAGATCTTGAGGTCATTGGAACCACT
GATGTGACTGGCACGACCGTACACTTTACACCCGATCCAGAAATTTTTACCGAAACGACTCAGTTTGATTACAGTGTTTTAGCAA
AACGTATTCAAGAGTTAGCCTTTTTGAATCGTGGTTTAAAAATTTCCATTACAGATAAGCGCTCAGGTATGGAACAAGAAGAACA
TTTCCTTTATGAAGGTGGAATTGGTTCTTATGTTGAATTTTTAAATGATAAAAAAGATGTTATCTTTGAAACGCCCATCTATACAGA
TGGTGAATTAGAAGGTATTGCAGTTGAAGTAGCCATGCAATACACGACTAGCTATCAAGAAACAGTCATGAGTTTTGCTAATAAT
ATTCATACTCATGAAGGTGGAACGCATGAACAAGGCTTTAGAGCGGCTCTTACTCGGGTCATCAATGACTACGCTAAGAAAAAT
AAAATTCTTAAAGAAAATGAGGACAATTTGACAGGAGAAGATGTTCGTGAAGGTTTGACGGCGGTAATTTCTGTTAAGCATCCAA
ATCCTCAATTTGAAGGTCAAACCAAAACAAAATTGGGCAACTCAGAAGTGGTTAAGATCACTAATCGTCTCTTTAGTGAGGCCTT
TCAACGTTTTCTTTTGGAAAACCCACAAGTTGCTCGTAAGATTGTGGAAAAAGGGATTTTGGCTTCTAAAGCTAGAATTGCAGCT
AAGCGAGCCCGCGAAGTCACCCGCAAAAAATCAGGCTTAGAAATTTCAAACTTACCTGGAAAATTAGCAGACTGTTCGTCAAAT
GACGCTAACCAAAACGAACTTTTCATCGTCGAAGGAGATTCAGCGGGTGGGTCGGCCAAATCAGGTCGTAACCGAGAGTTTCA
AGCTATCTTGCCTATTCGCGGTAAAATTTTGAACGTGGAAAAAGCAACTATGGATAAGATTCTTGCCAACGAAGAAATTAGAAGT
CTCTTTACCGCTATGGGTACAGGTTTTGGTGCAGATTTTGACGTGTCAAAAGCTCGCTACCAAAAGCTGGTTATCATGACCGAT
GCCGATGTGGATGGCGCTCATATTAGAACCTTACTTTTAACCTTGATTTACCGCTTTATGAGACCTGTTCTAGAAGCTGGCTATG
TTTACATCGCCCAGCCACCTATTTATGGTGTTAAGGTCGGTAGTGAGATTAAAGAGTATATTCAGCCAGGTATTGATCAAGAAGA
CCAATTAAAAACAGCTCTTGAAAAATATAGTATTGGTCGTTCAAAACCAACTGTTCAACGTTATAAAGGTCTTGGGGAAATGGAT
GACCATCAACTTTGGGAAACTACTATGGATCCTGAAAATCGTTTGATGGCGCGTGTGACAGTTGATGATGCCGCAGAAGCAGAT
AAAGTATTTGATATGTTAATGGGAGATCGTGTTGAACCAAGACGTGATTTCATTGAGGAAAATGCGGTTTATAGTACACTGGATA
TTTAG
SPy0737
Seq ID 36
ATGCGTAAGGTCAAAAAAGTCTTTGTTAGTTCATGTATGCTTTTAACAGTGGGCCTCGGAGTTGCCGTACCTACTGGATTCAGCC
AATCTAATGGCGTGATGGTTGTAAAGGCTGCGGAAGTGCCGGCGACAGATTTATCACGTCAGGCGTCTGATTCGGAGAGGGTA
GATGAATCGTCTTTATTGCAGAAAGAAAACTTATCAGTAGATTCATTTAAATTAGAAAATTTAAATGGATGGGAAGCTGAAAATGA
TACAGCAGGTAATTTGGGGAAATTTAAAGATCCAGATAGTTCGGGCTATCAAAATATTTTGACATCATCTGGAAAGAATATCAGT
GTAGCTGTTGCTCCCAAAGGTTCAGGTAAAATGAACATTAAAGTAACTAAAAGATCAAATTTTCAGGGTGGATATTATGTAGGTG
GTCTTAGAACTCAAACTCCGGTATTGAAGTTAAATGATGTTTATCGATATTCTTTTACAACTAAAAAATTATCAGGAAATTCTTCA G
AGTTCAAAACGAGAGTTAAGCCCGTTGAATCTAATAATAAACTAGGGAAAGAGCTTGTTATTAGGGTGGATAATAAAAATGTATC
TACTAAGCATGATTGGCTTCCAGACATCTCTGATGGAACTCATACTGTGGACTTCACTGGTCTTGATAAAAAATTATCTGTTGCTT
TCAGATTTTCTCCAAGACAAACTTCGAATGTTGTTTACGAATTTTCTAACATAAATATAAAAAACATTAGTCCTGCATCAGTGCCG
GCTATTCCTTCGAAAGTTTTAGAGGGAACCAGCGTCTTGTCGGGTACTGCAATATCTTCTGGAGATACATTAGAAAAAAGAAAAT
CGTTTGATGGCGATATCCTAAGAGTTTATAAAGATAGCAAAATCATTGCTAGAACAGTAATAAAAGGCAATAAGTGGGATGTTAA
ACTTTCAAAGCCTCTTATTGCAGGTGAAAAATTAGATTTTGAGATTTTGCATCCGAGATCTCAAAACGTTAGTAAAAAAATTTCAA
AACAAGTCGAAGCTAAACCATTTGATCCAGCTTCCTATAAAGAAAAAGTTATAGCCAAATTAAAGCCGGTTTATGAAGCTACTAG
TGAAAAAATCACAAATGATGCTTGGTTGGATGAAAATGCGAAGGATTTGCAAAAACAAAAATTAGAAGAACAATATATTTCTGGA
AAAGTAGCGATATCAGAGGCTGGAACTAAACAAGAAGCTATAGATGCAGCATATAATAAATATTCAAGTCAAACAGATCCAGACT
CTCTTCCTAGTCAGTATAAACAAGGTAATAAAGAAAATGAACAAGAAAAAGGGCGTCAAGATTTAATCCAGACTCGTGATCTGAC
GTTGAAAGCCATTCAAGAAGACAAATGGCTAACAGAGCAGGAGAAAACAATTCAAAAAGAAGAAGCATTAAAAGCTTTTGAAACT
GGTATAGAAAGTGTTAATCAAACAGTATCATTAGAACAGTTGAAGCAACGGTTAATAGT GTATAAAGCTTCTGAAAAAGATTCAG
AGAAAAAAGAATATCCTGAGTCAATTCCTAATCAGCATATTCCAGGGAAAGAAAAAGAAGTTAAAGCTGCTAAACAAGAAGAACT
TAAAAAATTACATGACACAACTCTTGAAAAAATCAATCAAGATAAATGGTTGACGCCAGACCAACAAGCTGAACAGTTAAAACAA
GCGGAAGTTACTTTTAAAAAAGGCCAAGAAGCAATTAAAAGTGCTCAGACTTTAACTCAGCTTGAGACAGACTTAGCTGATTATG
TTTCTGAGAATGAAGGTAAGGGAAATTCTATTCCCGATAAATACAAATCTGGCAATAAAGATGATTTGGTAAATAAGGCTGAAGT
TAAACTTAAGGAAGCTCACGAAGCTACTAAACAAGCAATTGAAAAAGATCCATGGTTGAGTCCGGAACAGAAAAAAGCTCAAAA
AGAAAAAGCCAAAGCAAGACTAGATGAGGGCTTGAAAGCTCTTAAAGCTGCAGATAGTTTAGAGATTCTTAAAGTGACAGAAGA
AGCTTTCGTTGATAAAGAAAAAAATCCAGATTCAATTCCAAATCAACATAAAGCTGGAACTGCTGATCAAGCTAGAAAACAAGCT
TTAGATAGTTTAGATAAGGAGGTTCAAAAAGAGTTAGAGTCAATTGATAACGATAATACTCTAACAACTGATGAGAAAGCAGCTG
CTAAGAAAAAAGTCAATGACGCTTATGATGTAGCTAAGCAAACAGCTATGGAAGCCAATTCTTATGAAGATTTGACTACTATTAAA
GATGAGTTCTTATCTAATTTACCTCATAAACAAGGAACGCCGCTTAAAGATCAACAATCTGATGCTATTGCAGAATTAGAGAAGA
AGCAGCAAGAAATTGAAAAAGCTATTGAGGGTGATAAAACATTACCAAGAGACGAAAAAGAGAAACAAATTGCTGACTCTAAGG
AACGCTTAAAATCTGACACGCAAAAAGTTAAAGATGCTAAAAATGCTGATGCTATTAAAAAAGCATTTGAAGAAGGGAAAGTGAA
TATTCCTCAAGCACATATCCCAGGTGATTTGAACAAGGATAAAGAAAAACTTCTTGCAGAATTGAAGCAAAAAGCAGATGATACT
GAAAAAGCTATTGATGTTGATAAAACTCTGACAGAAGATGAGAAAAAAGAGCAAAAAGTCAAAACAAAAGCTGAACTTGAAAAAG
CTAAAACTGATGTTAAAAATACTCAGACACGTGAAGAACTAGATAAAAAAGTTCCAGAACTTAAGAAAGCTATTGAAGACACTCA
CGTTAAAGGTAATCTTGAAGGTGTTAAGAATAAGGCTATTGAAGATCTTAAAAAAGCTCATACTGAAACAGTTGCTAAAATAAATG
GTGATGATACCCTTGACAAAGCTACTAAAGAAGCTCAAGTGAAAGAAGCTGACAAAGCTTTGGCAGCAGGTAAAGATGCGATCA
CTAAAGCAGATGATGCTGATAAAGTAAGTACAGCTGTTACAGAGCACACACCAAAAATTAAAGCAGCACATAAAACTGGTGACC
TTAAAAAAGCTCAAGTAGATGCTAACACAGCTCTTGACAAAGCAGCTGAAAAAGAACGTGGAGAAATCAATAAAGATGCTACACT
AACGACAGAAGATAAAGCAAAACAACTGAAAGAAGTTGAGACAGCTCTTACTAAAGCTAAAGATAACGTGAAAGCTGCTAAGAC
AGCAGACGCTATCAATGACGCACGTGATAAAGGCGTAGCAACAATTGATGCCGTCCATAAAGCAGGTCAAGACTTAGGTGCTC
GTAAGTCAGGTCAAGTCGCTAAACTTGAAGAAGCAGCTAAAGCAACGAAAGACAAGATTTCAGCTGATCCAACTTTGACAAGCA
AAGAAAAAGAAGAGCAATCTAAAGCTGTTGACGCTGAACTTAAGAAAGCGATAGAAGCTGTTAACGCAGCTGACACAGCTGACA
AGGTTGACGATGCTCTTGGTGAAGGTGTTACAGACATCAAGAACCAACACAAGTCAGGTGACTCTATCGACGCTCGTCGTGAG
GCTCATGGTAAGGAACTTGATAGAGTCGCTCAAGAAACTAAAGGTGCGATTGAAAAAGACCCTACTTTGACGACTGAAGAAAAA
GCTAAACAAGTTAAAGACGTAGATGCCGCTAAAGAAAGAGGCATGGCTAAGCTTAATGAAGCTAAAGATGCTGATGCTTTAGAC
AAAGCTTACGGTGAAGGTGTTACAGACATCAAGAACCAACACAAGTCAGGTGACCCTGTCGACGCTCGTCGTGGATTACACAA
CAAGTCAATCGACGAAGTGGCGCAAGCAACTAAGGACGCTATCACAGCAGATACGACTTTGACTGAAGCTGAAAAAGAAACAC
AACGTGGCAATGTTGATAAAGAAGCAACTAAAGCTAAAGAAGAACTTGCTAAGGCTAAAGATGCTGATGCTTTAGACAAAGCGT
ACGGTGACGGTGTAACCAGCATCAAGAACCAACACAAGTCAGGTAAAGGTCTTGACGTTCGTAAAGATGAGCACAAGAAAGCT
CTTGAAGCTGTTGCTAAACGTGTCACTGCTGAAATTGAGGCTGATCCAACCTTAACACCAGAAGTGAGAGAACAACAAAAAGCA
GAGGTTCAAAAAGAGCTTGAACTTGCGACTGATAAGATTGCTGAAGCTAAAGATGCAGATGAAGCAGACAAAGCTTACGGTGAC
GGTGTCACAGCGATCGAAAATGCCCACGTTATTGGTAAAGGTATCGAAGCTCGTAAAGACCTTGCTAAGAAAGACCTTGCTGAA
GCTGCTGCTAAGACAAAAGCTCTCATTATTGAAGACAAAACGCTTACTGATGATCAACGTAAAGAACAGTTATTAGGTGTTGATA
CAGAGTATGCTAAAGGTATCGAGAATATTGATGCAGCTAAGGATGCTGCAGGTGTTGATAAAGCATATAGTGACGGTGTTCGTG
ACATCCTGGCACAGTACAAAGAAGGTCAAAACCTTAATGATCGTCGTAATGCTGCCAAAGAATTTCTTCTTAAAGAAGCAGACAA
AGTGACGAAACTAATCAATGATGATCCAACCTTGACTCATGACCAAAAAGTTGATCAAATCAACAAAGTTGAACAAGCTAAGTTA
GACGCAATCAAGTCTGTTGATGATGCTCAAACAGCTGATGCTATCAATGATGCTCTTGGTAAGGGTATTGAAAACATCAACAACC
AATACCAACATGGCGATGGCGTTGATGTTCGTAAAGCGACTGCCAAAGGCGATCTTGAAAAAGAAGCTGCTAAAGTGAAAGCTC
TTATTGCTAAGGATCCGACCTTAACTCAAGCTGATAAAGACAAACAAACAGCAGCGGTTGACGCAGCTAAGAATACAGCAATTG
CAGCGGTTGATAAAGCGACAACAACTGAAGGCATTAACCAAGAACTTGGTAAAGGCATCACAGCTATCAATAAAGCTTACCGTC
CAGGTGAAGGTGTTAAAGCACGTAAAGAAGCCGCTAAAGCTGATCTTGAAAAAGAAGCTGCTAAAGTGAAAGCTCTTATTACTA
ACGACCCAACCTTAACAAAAGCTGATAAAGCTAAACAAACAGAAGCTGTTGCTAAAGCCCTTAAAGCTGCTATCGCAGCGGTTG
ATAAAGCGACAACAGCTGAAGGCATTAACCAAGAACTTGGTAAAGGCATCACAGCTATCAATAAAGCTTACCGTCCAGGTGAAG
GTGTTAAAGCACGTAAAGAAGCCGCTAAGGCTGATCTTGAAAGAGAAGCTGCTAAGGTTCGTGAAGCTATCGCTAACGACCCAA
CCTTAACAAAAGCTGATAAAGCTAAACAAACAGAAGCTGTTGCTAAAGCTCTTAAAGCTGCTATCGCAGCGGTTGATAAAGCGA
CAACAGCTGAAGGCATTAACCAAGAACTTGGTAAAGGCATCACAGCTATCAACAAAGCTTACCGTCCAGGTGAAGGTGTTGAAG
CACATAAAGAAGCTGCTAAAGCTAATCTTGAAAAAGTAGCTAAAGAAACTAAAGCTCTTATTTCAGGAGACCGTTACTTGAGCGA
AACTGAAAAAGCAGTCCAAAAACAAGCTGTTGAGCAAGCTCTTGCGAAAGCACTTGGTCAAGTTGAGGCTGCTAAGACAGTTGA
AGCTGTTAAGTTGGCAGAAAACCTTGGTACTGTAGCTATCCGTTCAGCATATGTTGCTGGTTTAGCTAAAGATACTGATCAAGCA
ACAGCTGCTCTTAACGAAGCGAAACAAGCTGCTATTGAAGCTCTTAAACAAGCTGCGGCAGAAACACTTGCTAAGATTACAACT
GATGCTAAATTGACTGAAGCTCAAAAAGCTGAACAATCAGAAAATGTATCATTAGCGCTTAAGACGGCTATTGCGACTGTTCGTT
CAGCACAATCTATTGCGTCTGTGAAAGAAGCAAAAGATAAAGGTATTACTGCTATCCGTGCAGCCTATGTGCCTAATAAGGCAG
TCGCAAAATCATCGTCAGCGAACCATCTTCCAAAATCAGGTGATGCAAACTCAATTGTTCTTGTTGGCTTAGGAGTTATGTCTCT
TCTTTTAGGTATGGTGCTTTATAGCAAGAAAAAAGAAAGTAAAGACTAA
SPy0747
Seq ID 37
ATGATTAACAAGAAATGTATAATACCTGTTTCATTGTTGACACTAGCTATTACGCTTACTAGTGTTGAAGAAGTTACTTCACGCCA
AAATTTGACTTATGCCAATGAAATCGTAACACAAAGGCCAAAGAGAGAATCTGTTATTAGTGATAAATCGAATTTTCCCGTCATAT
CACCTTACCTAGCAAGTGTGGATTTTGGTGAGAGAAAAACACCTTTGCCAACACCTGATAAAGGAGTAAAAGTAACTACTGAACA
GTCTATTGCTCAAGTAAGAAAGGGGCCTGAAGAAAGACCCTATACTGTTACTGGCAAGATTACGAGTGTGATCAATGGCTGGGG
AGGCTATGGCTTTTATATTCAAGATAGTGAAGGTATTGGACTTTATGTTTATCCTCAAAAAGATTTAGGATACAGTAAGGGAGATA
TTGTTCAATTAACAGGTACACTTACTCGCTTTAAAGGTGATTTACAACTCCAACAGGTGACTGCACACAAAAAGTTAGAGTTATCT
TTTCCGACTTCTGTTAAAGAAGCAGTAATATCAGAATTAGAAACAACAACACCCTCAACATTAGTTAAGTTATCTCACGTGACAGT
TGGAGAATTATCAACTGATCAATATAACAACACATCTTTCCTTGTAAGGGATGATAGTGGTAAAAGTATAGTTGTTCATATAGATC
ATCGTACAGGGGTTAAAGGGGCTGATGTTGTTACTAAAATAAGTCAGGGTGATTTGATTAACCTCACAGCCATATTGTCTATTGT
TGATGGTCAATTACAATTAAGACCGTTTTCTCTTGAACAATTGGAAGTGGTTAAAAAGGTCACAAGCTCAAATAGTGATGCTTCAT
CTCGTAATATTGTGAAAATAGGCGAGATTCAAGGAGCTAGTCATACGTCGCCACTTCTCAAAAAAGCGGTCACCGTAGAACAGG
TTGTTGTCACTTATTTAGACGATTCCACTCATTTTTATGTTCAAGATCTTAATGGTGATGGTGATTTAGCGACTTCAGATGGTATT
CGTGTTTTTGCTAAAAACGCTAAGGTTCAAGTCGGCGATGTTTTGACCATTTCAGGTGAAGTGGAAGAATTCTTTGGTCGTGGTT
ATGAGGAACGTAAGCAGACTGACCTTACCATCACCCAAATTGTGGCTAAAGCAGTGACCAAAACAGGGACAGCTCAAGTTCCAT
CACCGCTTGTTTTAGGGAAAGATCGTATCGCGCCAGCCAATATTATTGATAATGATGGCTTGCGTGTGTTTGATCCAGAAGAAG
ACGCTATTGATTATTGGGAATCAATGGAAGGCATGTTAGTGGCGGTTGATGATGCTAAAATCCTTGGTCCAATGAAAAATAAAGA
AATTTATGTCTTACCTGGCTCTAGTACAAGACCGTTAAATAATTCAGGTGGAGTATTACTTCCAGCTAATTCTTATAACACAGATG
TGATTCCTGTTCTTTTCAAAAAAGGCAAACAAATTATTAAAGCAGGAGACTCTTACAAAGGAAGATTAGCTGGGCCAGTATCTTA
TAGCTATGGTAATTACAAGGTCTTTGTTGATGACAGCAAAAACATGCCAAGTTTAATGGATGGTCATCTAAAACCTGAAAAAACA
AACTTGCAAAAAGACCTTAGCAAGTTAAGCATTGCTTCTTACAATATTGAAAACTTCTCAGCCAATCCTTCTTCAACTAAAGATGA
GAAGGTCAAACGGATTGCCGAATCCTTTATTCATGATCTGAATGCTCCAGACATTATTGGATTAATTGAAGTCCAAGATAATAAT
GGGCCGACTGATGATGGGACAACGGATGCGACACAAAGCGCGCAACGCCTCATTGATGCTATTAAAAAACTAGGTGGCCCAAC
TTATCGTTATGTTGATATTGCTCCAGAAAATAATGTTGACGGAGGTCAACCAGGTGGTAATATTCGAACAGGATTCCTTTATCAA
CCAGAGCGCGTCAGCCTTTCTGATAAGCCAAAAGGCGGTGCTCGTGATGCTCTAACTTGGGTTAATGGAGAATTAAACCTTAGT
GTTGGTCGAATTGATCCAACTAACGCCGCTTGGAAAGATGTTCGTAAATCACTAGCAGCAGAATTTATCTTCCAAGGTCGTAAAG
TCGTTGTTGTTGCAAATCATTTGAACTCTAAGCGTGGGGATAATGCTCTTTATGGTTGTGTGCAACCAGTCACTTTTAAATCTGA
GCAAAGACGTCACGTCTTGGCTAATATGCTAGCACAATTTGCGAAAGAAGGGGCAAAACACCAAGCTAATATTGTGATGCTAGG
TGACTTTAATGATTTTGAATTCACAAAGACGATTCAATTAATCGAAGAAGGTGACATGGTTAACTTGGTGAGCCGACATGATATTT
CAGATCGGTATTCTTATTTTCACCAAGGCAATAATCAGACCCTTGATAATATATTAGTTTCACGCCATTTACTTGATCACTACGAA
TTTGACATGGTTCATGTGAATTCCCCATTTATGGAAGCTCACGGACGCGCATCAGATCATGATCCATTGTTACTTCAATTATCATT
TTCCAAAGAAAATGATAAGGCAGAGTCTTCTAAACAAAGTGTAAAAGCTAAAAAAACTTCAAAAGGAAAACTGTTGCCAAAAACA
GGAGATAGTCTTGTTTATGTGATAACGCTACTAGGAACGGCTAGTTTATTAGTGCCTATTTTATTATTGACTAAAGGCAAAAAGG
AATCATAG
SPy0777
Seq ID 38
GTGATTTCTTTTGCCCCATTTTTAAGCCCCGAAGCTATTAAACATTTGCAAGAAAACGAAAGGTGCAGAGATCAGTCTCAAAAAC
GCACAGCTCAACAAATTGAAGCAATTTATACTAGTGGCCAAAATATACTTGTATCAGCTTCTGCTGGTTCAGGAAAAACCTTTGT
AATGGTCGAACGCATACTTGATAAAATTTTGAGAGGTGTTTCAATTGATCGGCTTTTTATCTCAACCTTTACTGTTAAAGCAGCTA
CAGAACTGCGTGAGCGGATTGAAAACAAATTATACTCACAAATTGCTCAAACTACAGATTTTCAAATGAAAGTTTATTTAACAGAA
CAATTGCAATCTCTTTGTCAAGCTGATATTGGTACTATGGATGCTTTTGCACAGAAAGTAGTAAGTCGCTATGGTTATAGCATTG
GCATTTCATCCCAATTTCGTATCATGCAGGATAAAGCAGAACAAGATGTTTTAAAGCAAGAGGTGTTTAGCAAACTCTTTAATGA
GTTTATGAATCAAAAAGAGGCACCGGTGTTTAGGGCTCTTGTGAAAAATTTTTCTGGTAACTGTAAAGACACTTCAGCTTTTAGA
GAGTTAGTTTATACTTGTTATTCTTTTAGCCAATCGACAGAAAACCCAAAAATATGGTTGCAAGAAAATTTTCTAAGCGCTGCTAA
AACTTACCAAAGACTTGAAGATATCCCGGATCATGATATTGAACTCTTACTTTTGGCAATGCAAGACACTGCAAATCAGCTAAGA
GATGTGACTGATATGGAAGATTATGGGCAGCTGACTAAGGCAGGTAGCCGATCTGCTAAATACACTAAACACTTAACGATCATA
GAAAAGTTGTCTGATTGGGTGCGTGATTTTAAATGTTTGTATGGAAAAGCCGGATTGGATCGGTTGATCAGAGATGTGACAGGC
CTTATACCATCTGGGAATGATGTTACAGTCTCGAAGGTAAAATACCCTGTTTTTAAGACCTTGCATCAAAAATTAAAACAATTTAG
GCATTTAGAAACAATTTTAATGTATCAGAAAGACTGTTTTTCCTTATTGGAACAGTTACAAGATTTTGTGCTTGCGTTTTCAGAAG
CTTATTTAGCTGTCAAAATACAAGAAAGTGCTTTTGAATTTTCAGATATTGCACACTTTGCAATCAAAATTTTAGAGGAAAATACG
GATATTCGCCAATCCTATCAGCAACACTATCATGAGGTGATGGTTGATGAATATCAAGATAACAATCATATGCAAGAGCGACTCC
TGACCTTACTATCGAACGGTCATAATCGCTTTATGGTAGGAGATATCAAACAATCGATCTATCGATTTCGGCAAGCCGATCCTCA
GATTTTTAATCAAAAGTTTAGAGACTATCAAAAAAAACCTGAGCAGGGGAAAGTGATTTTACTCAAAGAAAACTTTCGTAGCCAAT
CAGAGGTGTTAAATGTCAGCAATGCTGTTTTTAGTCACTTAATGGACGAATCAGTAGGAGACGTCTTATACGATGAGCAACATCA
GTTAATAGCAGGTAGTCATGCTCAAACAGTCCCCTATCTAGACCGTCGTGCTCAGTTATTGCTATATAATAGCGATAAAGATGAT
GGCAACGCCCCTTCAGATAGTGAGGGTATTTCATTTAGTGAGGTTACAATTGTTGCCAAAGAAATTATTAAGCTTCACAATGATA
AGGGTGTCCCTTTTGAAGACATTACGTTACTCGTTTCTTCAAGAACAAGAAATGATATCATTTCTCATACATTCAATCAATATGGT
ATTCCTATAGCAACAGATGGTGGGCAGCAAAACTATCTTAAATCTGTTGAAGTGATGGTTATGTTAGATACATTACGCACCATTA
ATAACCCAAGAAATGATTATGCCCTTGTGGCTTTACTGCGCTCACCGATGTTTGCCTTTGATGAGGATGATTTAGCAAGAATAGC
ACTTCAAAAAGACAATGAGCTAGATAAAGATTGCCTATATGACAAGATACAAAGGGCTGTGATTGGAAGAGGTGCTCATCCTGA
ATTGATTCACGATACCTTGCTTGGCAAGTTAAATGTTTTTTTAAAGACGTTGAAAAGCTGGCGTCGATACGCTAAGCTAGGGTCG
TTGTATGACTTGATTTGGAAAATTTTTAATGATCGTTTTTATTTTGATTTTGTAGCTAGTCAAGCAAAAGCAGAACAAGCACAAGC
TAATCTATACGCATTAGCTCTACGTGCTAATCAGTTTGAAAAATCGGGCTATAAAGGGCTATACCGTTTTATTAAAATGATTGATA
AGGTACTTGAGACGCAAAATGACTTAGCTGATGTGGAAGTGGCTACTCCTAAACAAGCTGTTAATTTAATGACCATTCACAAGTC
TAAAGGTTTACAATTTCCGTATGTATTTATCCTTAATTGTGACAAGCGCTTCTCAATGACAGATATTCATAAATCATTTATTCTGAA
TCGGCAGCACGGTATCGGTATCAAGTACCTTGCAGATATCAAAGGTTTACTTGGTGAAACAACACTCAATTCTGTTAAAGTAAGC
ATGGAAACCTTACCTTATCAATTGAACAAACAAGAGTTGCGCTTAGCAACTTTATCAGAAGAAATGCGCTTACTGTATGTTGCTAT
GACACGAGCTGAAAAAAAAGTTTATTTTATTGGTAAAGCTAGTAAGAGCAAAAGTCAAGAAATCACAGATCCTAAAAAGTTAGGC
AAACTTTTGCCGCTGGCTTTACGAGAACAGTTATTGACATTCCAAGATTGGCTATTAGCAATAGCAGATATATTTTCAACTGAAGA
TCTTTATTTTGATGTTCGCTTTATTGAAGATAGTGATTTGACACAAGAGTCAGTCGGACGACTTCAAACACCACAGTTATTAAATC
CAGATGATCTTAAAGATAATCGTCAATCAGAAACAATTGCACGGGCTTTAGATATGTTAGAAGCAGTGTCTCAATTGAATGCCAA
TTATGAAGCAGCTATTCATTTGCCAACAGTTCGAACGCCTAGCCAACTTAAGGCAACTTACGAGCCTTTATTAGAACCCATTGGT
GTAGATATTATAGAGAAATCTTCTCGATCGCTATCTGATTTTACTTTGCCACATTTTTCAAAAAAAGCAAAAGTTGAAGCAAGTCA
TATTGGATCAGCTCTTCATCAGTTGATGCAGGTGCTCCCTTTGTCAAAACCGATAAATCAACAAACGCTTTTAGACGCTTTAAGA
GGAATTGATAGTAACGAAGAGGTAAAAACAGCTCTTGATCTCAAAAAAATAGAGTCGTTCTTTTGTGATACAAGCCTAGGCCAAT
TTTTTCAGACTTACCAAAAACACTTGTATCGAGAAGCGCCATTTGCTATTTTAAAACTTGACCCTATCAGTCAAGAAGAGTATGTC
CTACGTGGTATTATAGATGCCTACTTTTTGTTTGATGATCATATTGTATTAGTGGACTATAAAACAGATAAATACAAGCAGCCCAT
TGAGTTAAAAAAGCGTTACCAACAACAGTTGGAGTTATATGCAGAAGCTCTCACTCAAACGTATAAACTTCCTGTGACTAAGCGC
TATCTTGTTTTAATGGGAGGTGGAAAGCCAGAAATTGTCGAAGTTTAA
SPy0789
Seq ID 39
ATGGTAAAAACGGATTTTAAATTACGCTATCAAGGGAGCGCAATTGGCTATCTATGGTCTATCTTAAAACCGCTTATGATGTTTAC
GATTATGTACTTGGTATTTATTCGTTTTCTTCGCCTGGGTGGAAATGTACCTCATTTTCCAGTAGCGCTTTTATTGGCAAATGTCA
TCTGGTCTTTTTTTTCAGAAGCAACTAGCATGGGAATGGTATCTATTGTATCTCGGGGAGACTTGTTGCGAAAATTGAACTTTTCT
AAGCACATCATTGTTTTTTCGGCAGTGTTAGGAGCTTTAATTAATTTTCTTATTAATTTGGTTGTTGTTTTAATTTTTGCGTTGATAA
ATGGTGTGACTATATCAGGGTATGCTTATCTCTCTCTTTTTCTTTTTATAGAATTAGTTGTTTTAGTGCTTGGAATTGCATTGTTAT
TGTCGAATGTCTTTGTTTATTATCGTGACTTAGCTCAAGTCTGGGAAGTACTATTACAAGCAGGTATGTATGCCACTCCAATCATT
TATCCGATCACTTTTGTTTTAGATAGCCACCCTTTGGCGGCAAAGTTGTTGATGCTAAATCCAGTAGCACAAATGATTCAAGATTT
TCGTTATTTATTGATTGACAGGGCCAACGTAACGATTTGGCAGATGTCAACCAATTGGTTTTACATTGTTATTCCATATTTAGTAC
CATTTGTTATATTATTTATTGGCATCTTTGTCTTTAAGAAAAATGCCGATAGATTTGCGGAGATTATTTAA
SPy0839
Seq ID 40
ATGACATTTTTATCTGATTTGATATCATTAATGACAAAAATCAGATTATCTTGGGTAATAAAGGCGGGTATTTTTCAATTATTATTT
GTAACGATTGCTAATATTGTCTTATCAGAATTTTTCTATTTTATATTAGACGTTACTGGTCAATATCATTTAGATAAAGACAATGTT
GTGACTTTTTTAAAAAATCCTATAGCACTTGCTTTATTAGGTGCCTATTTATTTTTATTAGCTGCTTTTATTCACCTTGAGTTTTTTG
CTCTATATCGAATTATTGCGGATCAAGAAATTAGTTTCTATCTTTTTAGAAAACAGTTTTCTTATTACCTAAGGGGGCTTTGGAAA
ACATTTTCTGGTTACCAATTATTACTTTTTTTGCTTTATATCCTATTGACTATTCCAGTCTTACATATTGGTTTATCTTCTGTGATTA
CTCAAAAGCTTTATCTTCCAGAATTTATTGTTGGGGAATTATCAAAGATAACTAGCACAAAGTACTTGCTTTATGGCAGTCTTATT
CTTGTGTTTTACCTTAACCTAAGATTAGTATATTTTTTACCATTGATAGCAATCAACCATCGTACGGTTGCTCAAGCATGGAGAGA
GAGTTGGCAAAAGACTAAAAAGAAACATGTATTGTTATGGATGAAACTTTTTGCAATCAATGGTCTTACGATTGTAGTCTTATCGC
TAGCTATTTCCATGATTCTTATTTTTGTTGATATGTTTAATCCTAAGGGGAATAATATTATTGTTCAGCTGGGAGCTTTGACCTTTA
CATGGGAACTCATTTTTTTTACTACTATTTTTTTTAAACTCTGTTCAGCAATGATTTTAAAAGAGGCAATTGAACCACAAAAGCAAT
ATGATGAGCCAAGAAGAAGTAATAAGGCATATGTTGTAATCTTTATCGTGGTTACAGTAGGTTTTGCTTATCAATCTCTTGAACGT
TTAACTTTTTTTGACACATCTCACTCTAAGACAGTTATCGCGCATAGAGGACTTGTATCAGCAGGTGTAGAAAATTCTCTGGAAG
CCCTTGAAGGTGCTAAGAAAGCAGGAAGTGATTATGTAGAACTGGATCTAATCTTGACTAAGGATAATCACTTTGTGGTGTCTCA
TGATAATCGATTGAAGCGTTTAGCTGGAGTAAATAAGACGATTCGCAACTTAACCTTAAAAGAAGTTGAACATCTAACGAGTCAT
CAAGGACATTTTTCAGGGCGTTTTGTTTCTTTTGACACTTTTTATCAAAAGGCTAAGAAGTTGAATATGCCATTACTTATTGAACT
CAAGCCAATTGGTACAGAACCTGGAAATTATGTCGATTTGTTTTTAGAAACTTATCATCGACTTGGTATAAGCAAAGATAATAAAG
TCATGTCTTTAGATTTAGAAGTAATAGAAGCTATCAAGAAAAAAAATCCATCAATTACGACTGGTTATATCATACCAATTCAATTTG
GATTTTTTGGAGATGAATTTGTTGATTTCTATGTCATTGAAGACTTTTCTTATCGGTCTTATTTGTCGTCCCAAGCTTTTTGGAATA
ATAAAGAAATTTACGTTTGGACTATTAATGATCCCAAGCGCATAGAGCATTATCTCCTAAAGCCTATTCAGGGAATTATTACAGAC
CAACCAGCTTTAACTAATCAATTGATTAAAGACTTAAAACAAGATAATTCTTATTTTAGTCGATTAGTCAGAATTATTAGTAGTCTT
TATTAA
SPy0843
Seq ID 41
ATGAAGAAACATCTTAAAACAGTTGCCTTGACCCTCACTACAGTATCGGTAGTCACCCACAATCAGGAAGTTTTTAGTTTAGTCA
AAGAGCCAATTCTTAAACAAACTCAAGCTTCTTCATCGATTTCTGGCGCTGACTACGCAGAAAGTAGCGGTAAAAGCAAGTTAAA
GATTAATGAAACTTCTGGCCCTGTTGATGATACAGTCACTGACTTATTTTCGGATAAACGTACTACTCCTGAAAAAATAAAAGATA
ATCTTGCTAAAGGTCCGAGAGAACAAGAGTTAAAGGCAGTAACAGAGAATACAGAATCAGAAAAGCAGATCACTTCTGGATCTC
AACTAGAACAATCAAAAGAGTCTCTTTCTTTAAATAAAACAGTGCCATCAACGTCTAATTGGGAGATTTGTGATTTTATTACTAAG
GGGAATACCCTTGTTGGTCTTTCAAAATCAGGTGTTGAAAAGTTATCTCAAACTGATCATCTCGTATTGCCTAGTCAAGCAGCAG
ATGGAACTCAATTGATACAAGTAGCTAGTTTTGCTTTTACTCCAGATAAAAAGACGGCAATTGCAGAATATACCAGTAGGGCTGG
AGAAAATGGGGAAATAAGCCAACTAGATGTGGATGGAAAAGAAATTATTAACGAAGGTGAGGTTTTTAATTCTTATCTACTAAAG
AAGGTAACAATCCCAACTGGTTATAAACATATTGGTCAAGATGCTTTTGTGGACAATAAGAATATTGCTGAGGTTAATCTTCCTGA
AAGCCTCGAGACTATTTCTGACTATGCTTTTGCTCACCTAGCTTTGAAACAGATCGATTTGCCAGATAATTTAAAAGCGATTGGA
GAATTAGCTTTTTTTGATAATCAAATTACAGGTAAACTTTCTTTGCCACGTCAGTTAATGCGATTAGCAGAACGTGCTTTTAAATC
AAACCATATCAAAACAATTGAGTTTAGAGGAAATAGTCTAAAAGTGATAGGGGAAGCTAGTTTTCAAGATAATGATCTGAGTCAA
CTAATGCTACCTGACGGTCTTGAAAAAATAGAATCAGAAGCTTTTACAGGAAATCCAGGAGATGATCACTACAATAACCGTGTTG
TTTTGTGGACAAAATCTGGAAAAAATCCTTCTGGTCTTGCTACTGAAAATACCTATGTTAATCCTGATAAGTCACTATGGCAGGAA
AGTCCTGAGATTGATTATACTAAATGGTTAGAGGAAGATTTTACCTATCAAAAAAATAGTGTTACAGGTTTTTCAAATAAAGGCTT
ACAAAAAGTAAAACGTAATAAAAACTTAGAAATTCCAAAACAGCACAATGGTGTTACTATTACTGAAATTGGTGATAATGCTTTTC
GCAATGTTGATTTTCAAAATAAAACTTTACGTAAATATGATTTGGAAGAAGTAAAGCTTCCCTCAACTATTCGGAAAATAGGTGCT
TTTGCTTTTCAATCTAATAACTTGAAATCTTTTGAAGCAAGTGACGATTTAGAAGAGATTAAAGAGGGAGCCTTTATGAATAATCG
TATTGAAACCTTGGAATTAAAAGATAAATTAGTTACTATTGGTGATGCGGCTTTCCATATTAATCATATTTATGCCATTGTTCTTCC
AGAATCTGTACAAGAAATAGGGCGTTCAGCATTTCGGCAAAATGGTGCAAATAATCTTATTTTTATGGGAAGTAAGGTTAAGACC
TTAGGTGAGATGGCATTTTTATCAAATAGACTTGAACATCTGGATCTTTCTGAGCAAAAACAGTTAACAGAGATTCCTGTTCAAG
CCTTTTCAGACAATGCCTTGAAAGAAGTATTATTACCAGCATCACTGAAAACGATTCGAGAAGAAGCCTTCAAAAAGAATCATTT
AAAACAACTGGAAGTGGCATCTGCCTTGTCCCATATTGCTTTTAATGCTTTAGATGATAATGATGGTGATGAACAATTTGATAATA
AAGTGGTTGTTAAAACGCATCATAATTCCTACGCACTAGCAGATGGTGAGCATTTTATCGTTGATCCAGATAAGTTATCTTCTACA
ATAGTAGACCTTGAAAAGATTTTAAAACTAATCGAAGGTTTAGATTATTCTACATTACGTCAGACTACTCAAACTCAGTTTAGAGA
CATGACTACTGCAGGTAAAGCGTTGTTGTCAAAATCTAACCTCCGACAAGGAGAAAAACAAAAATTCCTTCAAGAAGCACAATTT
TTCCTTGGCCGCGTTGATTTGGATAAAGCCATAGCTAAAGCTGAGAAGGCTTTAGTGACCAAGAAGGCAACAAAGAATGGTCAG
TTGCTTGAAAGAAGTATTAACAAAGCGGTATTAGCTTATAATAATAGCGCTATTAAAAAAGCTAATGTTAAGCGCTTGGAAAAAGA
GTTAGACTTGCTAACAGGATTAGTTGAGGGAAAAGGACCATTAGCGCAAGCTACAATGGTACAAGGAGTTTATTTATTAAAGAC
GCCTTTGCCATTGCCAGAATATTATATCGGATTGAACGTTTATTTTGACAAGTCTGGAAAATTGATTTATGCACTTGATATGAGTG
ATACTATTGGCGAGGGACAAAAAGACGCTTATGGTAATCCTATATTAAATGTTGACGAGGATAATGAAGGTTATCATGCCTTGGC
AGTTGCCACTTTAGCTGATTATGAGGGGCTCGACATCAAAACAATTTTAAATAGTAAGCTTAGTCAATTAACATCTATTCGTCAGG
TACCGACTGCAGCCTATCATAGAGCCGGTATTTTCCAAGCTATCCAAAATGCAGCGGCAGAAGCAGAGCAGTTATTGCCTAAAC
CAGGTACGCACTCTGAGAAGTCAAGCTCAAGTGAATCTGCTAACTCTAAAGATAGAGGATTGCAATCAAACCCAAAAACGAATA
GAGGACGACACTCTGCAATATTGCCTAGGACAGGGTCAAAAGGCAGCTTTGTCTATGGAATCTTAGGTTACACTAGCGTTGCTT
TACTGTCACTAATAACTGCTATAAAAAAGAAAAAATATTAA
SPy0872
Seq ID 42
ATGAAAAAATATTTTATTTTAAAAAGTAGTGTATTGAGTATCCTGACTAGTTTTACTCTATTAGTTACAGATGTTCAAGCAGATCAA
GTTGATGTGCAATTCCTTGGCGTCAATGATTTTCACGGCGCTCTTGATAATACCGGAACAGCTTACACACCAAGTGGTAAAATAC
CAAATGCTGGGACGGCTGCTCAATTAGGTGCTTATATGGATGACGCTGAGATAGACTTCAAGCAAGCAAATCAAGACGGAACAA
GTATACGTGTTCAAGCTGGAGATATGGTCGGAGCCAGTCCTGCTAACTCTGCACTTTTACAAGATGAGCCTACTGTCAAAGTCT
TTAACAAAATGAAATTTGAATATGGCACTCTTGGTAATCATGAATTTGACGAAGGACTAGATGAATTTAACCGTATCATGACAGGT
CAAGCGCCTGATCCTGAATCAACAATTAATGATATCACCAAACAATATGAGCACGAAGCTTCGCATCAAACCATCGTCATTGCTA
ATGTTATTGATAAAAAAACCAAGGATATCCCCTATGGTTGGAAACCTTATGCTATAAAAGACATAGCCATTAATGACAAAATCGTT
AAGATTGGCTTCATTGGTGTTGTGACTACAGAGATTCCAAATCTCGTTTTAAAGCAAAACTATGAACACTATCAATTTTTAGATGT
AGCTGAAACCATTGCCAAATATGCTAAAGAACTACAAGAACAACATGTTCATGCTATT GTGGTTTTAGCTCATGTTCCTGCAACA
AGTAAAGATGGTGTTGTTGATCATGAAATGGCTACGGTTATGGAAAAAGTGAACCAAATCTATCCCGAACATAGCATTGATATTA
TTTTTGCAGGACATAATCATCAATACACTAATGGAACTATCGGTAAAACACGTATCGTTCAAGCCCTCTCTCAAGGAAAAGCTTA
TGCAGATGTCCGTGGTACGCTAGATACTGATACCAATGATTTTATTAAAACTCCATCAGCAAATGTTGTTGCTGTAGCACCAGGT
ATCAAAACAGAAAATTCAGATATCAAAGCTATAATAAATCATGCTAATGATATTGTTAAAACAGTTACTGAACGAAAAATCGGAAC
TGCAACTAATTCTTCAACTATTTCTAAAACAGAAAATATTGATAAAGAATCTCCTGTCGGTAACTTAGCAACAACGGCTCAGCTTA
CTATTGCTAAGAAAACTTTTCCAACTGTTGACTTTGCTATGACCAATAATGGTGGTATTCGAAGTGACCTAGTTGTCAAAAATGAC
CGGACCATCACCTGGGGAGCTGCACAGGCTGTACAACCATTTGGTAATATCCTTCAAGTCATTCAAATGACTGGTCAACACATT
TACGATGTCCTAAATCAGCAATACGATGAAAACCAGACCTATTTTCTTCAAATGTCAGGTTTAACATACACTTATACAGATAATGA
TCCTAAGAACTCTGATACCCCCTTCAAGATAGTTAAGGTTTATAAAGACAATGGTGAAGAAATTAACTTAACAACTACTTACACCG
TTGTTGTCAACGACTTTCTTTATGGTGGTGGTGATGGCTTTTCAGCATTTAAAAAAGCTAAATTAATCGGAGCTATTAACACAGAT
ACTGAAGCTTTCATCACATATATCACAAATTTAGAAGCATCAGGTAAAACTGTTAATGCTACTATAAAAGGGGTTAAAAATTATGT
AACTTCAAACCTTGAAAGTTCGACAAAAGTTAATAGTGCTGGTAAACACAGTATCATTAGTAAGGTTTTTAGAAATCGTGATGGC
AATACAGTGTCTAGTGAAGTCATTTCAGACCTTTTGACTTCTACTGAAAACACTAATAACAGCCTTGGCAAAAAAGAAACAACAA
CAAACAAAAATACTATCTCTAGTTCCACTCTTCCAATAACAGGGGACAATTATAAAATGTCTCCTATTATGACAATCCTTGCCTTG
ATAAGCTTAGGTGGACTAAACGCTTTTATTAAAAAAAGGAAATCCTAG
SPy0895
Seq ID 43
ATGACTAATAATCAAACACTAGACATCCTTTTGGATGTCTATGCTTATAATCACGCCTTTAGAATTGCTAAAGCCTTGCCAAATAT
CCCTAAAACTGCCCTCTATTTACTAGAGATGTTAAAAGAGCGCAGAGAATTGAACCTTGCCTTTCTAGCGGAACATGCAGCAGA
GAATCGGACCATTGAAGACCAGTATCACTGTTCATTATGGCTTAACCAATCGCTTGAAGATGAGCAGATTGCCAATTACATTTTG
GATTTAGAAGTTAAAGTAAAAAACGGTGCTATTATTGATTTCGTCAGGTCAGTGTCGCCTATTCTTTACCGACTTTTTCTCAGACT
AATCACGTCAGAAATTCCAAACTTCAAGGCTTATATTTTTGATACAAAGAATGACCAATATGATACCTGGCATTTTCAGGCCATGT
TGGAATCTGATCACGAGGTTTTCAAGGCTTACCTGTCTCAAAAGCAGTCTCGCAATGTGACGACCAAAAGCTTAGCAGACATGT
TGACGTTGACCTCCTTACCTCAGGAAATCAAGGACTTGGTTTTTTTGTTACGACATTTTGAAAAGGCTGTCCGTAATCCTCTGGC
TCATTTGATTAAGCCTTTTGATGAAGAGGAACTGCATCGCACCACTCATTTTTCTTCTCAGGCTTTTTTGGAAAACATTATCACCT
TGGCGACTTTTTCTGGTGTAATCTACCGACGTGAGCCTTTTTACTTTGATGACATGAATGCCATTATTAAAAAGGAGTTGAGCCT
TTGGAGACAATCTATTGTCTGA
SPy0972
Seq ID 44
ATGAAGACAACATCCCTGATTAAAGTAGATTTGCCATCAACAATCGGTATAGGTTATGGCGCTTTTTGGCGGTCTAGAAATTTTT
ATCGAGTAGTTAAAGGCAGCCGTGGATCTAAAAAATCTAAAACGACTGCTTTAAATTTTATCGTCAGACTGCTGAAGTACCCTTG
GGCTAACTTATTGGTCATCCGTAGATACTCAAACACTAACAAACAATCTACTTATACCGATTTTAAATGGGCGTGTAATCAATTAA
AGGTTACACACCTTTTTAAGTTTAATGAGAGTTTGCCAGAAATAACTGTAAAGGCAACGGGCCAAAAGATACTGTTCCGTGGACT
TGATGATGAGTTAAAAATCACATCTATTACTGTCGATGTTGGCGCTTTGTGCTGGGCTTGGTTTGAAGAGGCTTATCAAATTGAG
ACCGAAGATAAGTTTTCAACAGTTGTCGAATCAATCCGCGGTAGTTTAGATGCTCCTGATTTTTTTAAACAGATAACAGTCACGTT
TAACCCGTGGTCAGAAAGACATTGGCTTAAACGTGTCTTTTTTGATGAAGAAACTAAACGGGCTGATACATTTTCTGGGACTACA
ACATTTAGAGTAAACGAATGGCTTGATGATGTCGATAAAAGACGCTACGAAGATTTGTACAAGACTAATCCAAGGCGGGCTAGA
ATCGTGTGCGATGGTGAATGGGGCGTTGCTGAAGGTCTTGTTTTTGATAACTTTGAAGTCGTAGATTTTGATGTTGAAAAAACAA
TTCAACGCGTTAAAGAGACCTCGGCCGGTATGGACTTTGGGTTTACTCAAGACCCTACAACTCTTATATGTGTTGCAGTTGACCT
CGCAAACAAAGAGTTATGGCTTTACAACGAACATTATCAAAAGGCTATGTTAACAGATCATATTGTCAAAATGATAAGAGATAAAA
ACTTGCATAGGTCTTACATCGCAGGGGATAGCGCCGAAAAACGCCTCATTGCAGAAATAAAAAGTAAAGGGGTGTCTGGAATTG
TCCCGAGTATTAAAGGTAAAGGGTCAATCATGCAAGGGATTCAATTCATGCAGGGGTTTAAGATATATATTCACCCATCTTGCGA
ACACACAATAGAAGAGTTTAATACTTACACTTTTAAGCAAGACAAAGAAGGTAATTGGTTAAACGAACCGATAGATAAGAATAAC
CACGTTATTGATGCGATTAGATATGCGCTTGAAAAATACCATATCAGAAGCAACGAGTCAAATCAGTTTGAAGTTCTTAGGGCTG
GTTTTGGTTACTAG
SPy0981
Seq ID 45
ATGGCAGAAGAAACACAAACAGTTGAAACGGTTGAAGAGCAAGTGGTACCAGAAGCAAAACAACCGCAAGACGAAAAAAAGTA
CACAGATGCAGATGTGGACGCTATCATCGACAAAAAGTTTGCGAAGTGGAAGTCAGAACAAGAAGCGGAGAAATCGGAAGCTA
AAAAAATGGCTAAGATGAATGAAAAAGAGAAAGCAGACTACGAAAAGCAGAAGCTGTTAGACGAATTGCAAGAGCTAAAAAACG
ATAAGACACGCAATGAGTTAACAGCAGTAGCTCGTCAAATGTTTGCAGAATCTGAAATCAACGTCAACGATGACGTACTTGGTTT
AGTTGTGACTTTGGACGCAGAACAAACAAAAGCAAATGTAACAACGCTAGCAAACGCATTTGCTAAAGTTATCGCTGATGACCG
CAAGGCTCTTGTACGCCAGACTACTCCGTCAACAGGTGGTGGATTGAGCAAACAAACCAATTACGGTGCTAACTTGGCTAGTAA
GGCAGCACAACAAAGCACCAAACTTTTTTAG
SPy1008
Seq ID 46
ATGAGATATAATTGTCGCTACTCACATATTGATAAGAAAATCTACAGCATGATTATATGTTTGTCATTTCTTTTATATTCCAATGTT
GTTCAAGCAAATTCTTATAATACAACCAATAGACATAATCTAGAATCGCTTTATAAGCATGATTCTAACTTGATTGAAGCCGATAG
TATAAAAAATTCTCCAGATATTGTAACAAGCCATATGTTGAAATATAGTGTCAAGGATAAAAATTTGTCAGTTTTTTTTGAGAAAGA
TTGGATATCACAGGAATTCAAAGATAAAGAAGTAGATATTTATGCTCTATCTGCACAAGAGGTTTGTGAATGTCCAGGGAAAAGG
TATGAAGCGTTTGGTGGAATTACATTAACTAATTCAGAAAAAAAAGAAATTAAAGTTCCTGTAAACGTGTGGGATAAAAGTAAACA
ACAGCCGCCTATGTTTATTACAGTCAATAAACCGAAAGTAACCGCTCAGGAAGTGGATATAAAAGTTAGAAAGTTATTGATTAAG
AAATACGATATCTATAATAACCGGGAACAAAAATACTCTAAAGGAACTGTTACCTTAGATTTAAATTCAGGTAAAGATATTGTTTTT
GATTTGTATTATTTTGGCAATGGAGACTTTAATAGCATGCTAAAAATATATTCCAATAACGAGAGAATAGACTCAACTCAATTTCA
TGTAGATGTGTCAATCAGCTAA
SPy1032
Seq ID 47
GTGAATACTTATTTTTGCACACACCATAAACAATTACTACTTTATTCAAACCTATTCCTTAGCTTTGCTATGATGGGCCAAGGAAC
TGCCATTTATGCCGATACACTGACTTCAAATTCAGAACCTAATAATACTTACTTTCAAACGCAAACGCTCACTACTACAGATAGCG
AAAAAAAGGTAGTACAGCCACAACAAAAAGACTACTATACTGAATTGTTAGACCAATGGAACAGTATTATCGCAGGCAACGATGC
TTATGATAAAACCAATCCTGACATGGTCACTTTTCATAATAAAGCTGAAAAGGATGCTCAAAACATTATTAAAAGCTATCAAGGGC
CTGACCACGAAAATAGAACTTACCTTTGGGAACATGCAAAGGATTATTCCGCTTCTGCTAATATCACGAAAACTTACCGCAATAT
TGAAAAAATAGCAAAACAGATCACTAATCCTGAATCATGCTATTATCAAGATAGTAAAGCTATTGCTATTGTAAAAGACGGTATGG
CCTTCATGTATGAACACGCTTATAATCTAGATCGTGAAAATCATCAAACAACTGGAAAAGAAAACAAAGAAAATTGGTGGGTTTA
TGAAATTGGAACTCCTCGTGCTATTAATAATACCTTATCCTTGATGTATCCTTATTTTACTCAAGAAGAAATTCTTAAATACACAGC
TCCAATCGAAAAATTTGTGCCTGACCCTACTCGTTTTAGGGTTCGCGCTGCCAATTTTTCACCTTTTGAAGCCAATAGCGGAAAT
TTAATTGATATGGGGCGTGTTAAACTCATTTCCGGTATTCTTCGTAAAGATGATCTCGAAATTAGTGATACAATCAAAGCAATTGA
GAAAGTTTTCACGCTAGTTGATGAAGGAAATGGTTTTTACCAAGACGGTTCTTTAATTGATCACGTGGTTACTAACGCTCAAAGT
CCACTTTATAAAAAAGGCATTGCTTACACTGGAGCTTACGGTAATGTGCTTATAGATGGCTTATCGCAATTAATTCCTATTATTCA
AAAAACAAAGTCTCCTATAAAAGCGGATAAAATGGCTACTATCTATCATTGGATTAACCATTCTTTTTTCCCTATCATCGTTCGTG
GAGAAATGATGGATATGACTCGAGGGCGTTCTATCAGTCGTTTTAATGCCCAATCTCATGTTGCTGGCATTGAAGCACTTCGTG
CTATTTTACGTATTGCTGACATGTCTGAAGAGCCTCACCGTTTGGCACTTAAAACACGTATAAAAACACTCGTCACACAAGGGAA
TGCTTTTTACAATGTCTATGATAATTTGAAAACCTATCACGATATCAAACTTATGAAAGAACTACTAAGTGATACTTCTGTTCCAGT
CCAAAAACTTGATAGTTACGTAGCTAGTTTCAATAGTATGGATAAATTGGCACTATATAATAATAAACACGATTTTGCTTTTGGCC
TATCAATGTTTTCGAATCGAACTCAAAATTATGAAGCTATGAATAATGAAAATCTTCATGGCTGGTTTACTTCTGATGGAATGTTTT
ACCTATACAATAACGATTTAGGACACTACAGTGAAAACTATTGGGCAACGGTAAATCCCTACCGCTTACCTGGAACCACAGAAA
CTGAGCAAAAACCACTAGAGGGAACTCCTGAGAATATTAAAACGAACTATCAACAAGTTGGCATGACTGGTCTCTCTGATGACG
CTTTTGTTGCAAGTAAAAAACTTAATAACACAAGTGCTCTAGCTGCTATGACCTTCACTAATTGGAATAAAAGCCTCACCCTCAAT
AAAGGGTGGTTTATCTTAGGAAACAAAATAATCTTTGTTGGTAGCAATATCAAAAACCAATCATCTCACAAGGCGTATACAACTAT
TGAACAACGAAAAGAAAATCAAAAGTACCCTTACTGTTCTTATGTTAACAATCAACCCGTTGACTTGAATAATCAGCTAGTTGATT
TTACAAACACTAAAAGTATTTTCCTTGAAAGTGATGATCCCGCTCAAAATATTGGTTACTACTTCTTCAAGCCAACAACACTTAGC
ATAAGTAAGGCACTTCAAACAGGGAAATGGCAAAACATAAAAGCTGATGACAAATCACCAGAAGCCATCAAAGAAGTTTCAAATA
CCTTTATCACTATCATGCAAAACCATACTCAAGATGGCGATCGTTATGCCTATATGATGCTTCCAAATATGACTCGTCAAGAATTT
GAAACCTATATTAGCAAGCTTGATATCGACTTATTAGAAAACAATGACAAACTGGCCGCTGTCTACGATCATGATAGTCAACAGA
TGCACGTCATTCACTATGGAAAAAAAGCAACGATGTTTTCAAATCATAATCTTTCTCATCAAGGCTTTTATAGTTTTCCTCATCCT
GTCAGGCAAAATCAACAATAA
SPy1054
Seq ID 48
TTGCTGACCTTTGGAGGTGCAAGTGCGGTTAAGGCGGAAGAAAATGAAAAAGTAAGAGAGCAAGAAAAGCTCATACAGCAACTT
TCTGAAAAGCTAGTGGAAATTAATGACTTACAAACTTTAAATGGTGATAAAGAGAGTATACAGTCTCTCGTAGATTATCTGACTCG
AAGAGGAAAACTTGAAGAAGAATGGATGGAATATTTGAATTCTGGTATTCAACGCAAACTTTTTGTTGGTCCAAAAGGACCTGCA
GGTGAAAAAGGAGAACAAGGTCCTACTGGAAAACAAGGCGAGCGTGGTGAGACCGGCCCTGCAGGTCCACGTGGTGACAAGG
GCGAAACTGGTGACAAAGGAGCCCAGGGTCCAGTAGGTCCCGCTGGCAAGGACGGCCAAAACGGTAAAGATGGTCTTCCAGG
TAAAGACGGCAAGGACGGCCAAAACGGTAAAGATGGTCTTCCAGGTAAAGACGGCAAGGACGGCCAAGACGGTAAAGATGGC
CTCCCAGGTAAAGACGGTAAGGATGGCCAAAATGGCAAAGATGGTCTTCCAGGTAAAGACGGTCAACCAGGTAAACCAGCTCC
TAAAACACCAGAGGTCCCTCAAAACCCAGATACTGCACCACATACTCCAAAAACCCCTCGGATCCCTGGTCAATCAAAAGACGT
GACACCTGCTCCTCAAAACCCTTCTAATAGAGGTCTAAACAAACCACAAACACAAGGTGGTAATCAGCTCGCAAAAACACCGGC
AGCTCACGACACACACAGACAATTGCCAGCAACAGGCGAAACAACCAATCCATTCTTTACAGCAGCTGCTGTAGCTATCATGAC
GACAGCTGGAGTTGTAGCTGTTGCAAAACGTCAAGAAAACAACTAA
SPy1063
Seq ID 49
ATGTATATATTCTCATCGTCAAAAAAAGATAGTGCTAAAGAATTAGTTATCTTGACTCCTAATAGCCAAACTATTTTAACAGGGAC
TATTCCAGCCTTTGAGGAAAAGTATGGGGTTAAAGTAAGATTAATCCAAGGTGGGACGGGCCAACTTATTGATCAATTAGGTCG
AAAAGATAAACCATTAAACGCTGATATTTTCTTTGGTGGCAATTACACTCAATTTGAAAGCCATAAAGATTTATTTGAATCTTATGT
TTCTCCGCAGGTTTCTACTGTCATTTCAGATTACCAATTGCCTAGTCATCGCGCAACCCCATATACGATCAATGGCAGTGTACTG
ATTGTTAATAACGAATTAGCAAGAGGACTTCATATTACCAGTTATGAGGATTTGCTACAACCAGCTTTAAAAGGCAAAATTGCTTT
TGCTGATCCCAACAGTTCATCAAGTGCCTTCTCACAGCTGACTAATATATTGTTAGCTAAGGGGGGGTACACAAACGCTGACGC
TTGGGCTTACATGAAGCGCTTGTTGGTCAATATGAATTCTATTAGGGCTACGAGTTCTTCAGAAGTCTATCAATCTGTCGCTGAG
GGTAAGATGATTGTTGGGCTAACCTACGAAGATCCTTGTATCAACCTGCAAAAAAGTGGTGCCAATGTTTCCATTGTTTATCCAA
AAGAAGGAACGGTGTTTGTGCCCTCCTCTGTTGCTATTATCAAACATGCGCCAAACATGACAGAGGCTAAGCTCTTTATTAATTT
TATGTTATCACGTGATGTGCAAAATGCCTTTGGCCAATCAACCAGTAACCGACCCATTCGTCAAGATGCCCAAACCAGTCACGA
CATGAAAGCCTTAGAAACGATAGCTACTTTGAAAGAGGATTATGCTTATGTTACCAAGCACAAGAAAAAAATAGTGGCTACGTAC
AACCAGTTGCGCCAACGGTTGGAAAAAGCTAAGTAG
SPy1162
Seq ID 50
ATGCCGACTAGTATTAAAGCTATTAAAGAAAGCTTAGAGGCCGTTACTAGCCTCTTGGACCCCCTCTTTCAAGAATTGGCAACC
GACACTAGGTCAGGCGTCCAAAAAGCTCTAAAAAGCCGACAAAAGGTTATTCAGGCCGAGTTAGCAGAAGAAGAACGATTAGA
AGCCATGCTTTCTTATGAAAAAGCTCTTTATAAAAAAGGTTATAAAGCCATTGCAGGTATTGATGAGGTGGGACGTGGTCCCTTA
GCAGGTCCCGTTGTGGCAGCTTGTGTGATTTTACCTAAGTATTGTAAAATTAAAGGCCTTAATGATTCTAAAAAAATCCCTAAAG
CTAAGCATGAGACCATTTATCAGGCAGTGAAAGAAAAGGCTTTGGCTATCGGTATCGGTATTATTGACAATCAGCTTATTGATGA
GGTCAATATTTATGAAGCAACCAAACTGGCCATGCTAGAAGCCATTAAACAGTTGGAGGGCCAACTCACACAACCAGATTATCT
CTTGATTGATGCCATGACATTGGATATTGCTATTTCGCAGCAGTCTATTCTTAAAGGCGATGCCAATTCCTTGTCTATTGCAGCA
GCATCAATTGTAGCTAAGGTCACCAGAGATCAGATGATGGCTAACTATGATCGCATTTTTCCTGGTTATGACTTTGCTAAAAATG
CAGGCTATGGCACCAAAGAACATTTACAGGGATTAAAAGCTTACGGCATAACGCCTATCCATCGTAAAAGTTTTGAACCTGTTAA
ATCCATGTGCTGCGATTCAACTAATCCTTAA
SPy1206
Seq ID 51
ATGACAGTTAAGGAAGAAACGATGAGTATTTTAGAAGTTAAGCAGTTGAGTCACGGTTTTGGGGATCGGGCTATTTTTGAAAATG
TGTCATTTCGCCTCTTAAAAGGCGAACATATTGGACTAGTTGGGGCAAATGGTGAAGGAAAATCAACCTTTATGAGTATAGTCAC
AGGACATTTACAGCCTGACGAAGGAAAAGTAGAGTGGTCGAAGTATGTCACTGCAGGTTACCTGGATCAACATACAGTGTTGGA
ATCAGGACAAACCGTTCGTGATGTCTTGCGAACTGCTTTTGATGAGTTATTTAAGACCGAGAATCGTATTAATGAGATTTACGCG
TCAATGGCAGATGATAAAGCTGATATTGCTGTTTTGATGGAAGAAGTAGGTGAGCTTCAAGATCGTTTAGAAAGTCGTGATTTCT
ATACTTTGGATGCTAAGATTGATGAAGTAGCGCGTGCGCTTGGTGTTATGGATTTTGGAATGGAGTCAGATGTTACATCCTTATC
AGGTGGGCAACGAACAAAGGTTTTATTAGCCAAATTACTATTAGAAAAACCTGATATTCTGCTATTAGATGAACCAACTAACCATT
TGGATGCTGAGCATATTGAATGGTTAAAACGCTATTTACAACATTATGAAAATGCTTTTGTGTTGATTTCGCATGATATTTCTTTCT
TAAATGATGTGATTAATATTGTTTATCATGTTGAAAATCAAAGTTTAGTTCGCTATACTGGGGATTATTACCAATTTCAAGCTGTTT
ATGAGATGAAACAATCTCAACTTGAAGCAGCCTATGAACGTCAACAAAAAGAGATTGCTAACTTGCAGGATTTTGTCAACCGAAA
TAAGGCTCGGGTAGCGACACGTAACATGGCAATGTCTCGCCAAAAAAAACTTGATAAGATGGATATAATTGAACTTCAAGCTGA
GAAACCAAAACCAAATTTTGAATTTAAGCAAGCTAGAACTCCCAGTCGATTCATTTTTCAAACAAAAAATCTTGTGATTGGTTATG
ATTACCCATTGACCAAAGAACCCTTAAATATAACGTTTGAAAGAAATCAAAAAATTGCTATTGTTGGGGCCAACGGTATTGGAAA
ATCTACTTTGCTAAAAAGTTTATTAGGTGTTATTGAGCCTTTAGAAGGTCATATTGTCACAGGGGATTTTTTAGAAGTTGGCTACT
TTGAACAAGAAGTGACAGGTGTTAACCGACAAACTCCGCTAGAAGTAGTTTGGGATGCTTTTCCTGCCTTAAATCAGGCAGAAG
TTCGAGCGGCACTAGCTCGTTGCGGACTAACATCAAAACATATCGAAAGTCAAATTCAAGTACTTTCGGGTGGTGAACAAGCAA
AAGTTCGTTTTTGTTTGTTGATGAATCGTGAAAATAACGTGCTTATTTTAGACGAACCAACAAATCATCTTGATATTGATGCTAAA
AATGAGCTCAAACGTGCTTTAAAAGCATATAAGGGTTCTATTTTAATGGTTTGTCATGAACCTGATTTCTACAATGGGTGGGTAA
CCGATACTTGGGATTTTAGTAAGTTAACCTAA
SPy1228
Seq ID 52
ATGAACAAGAAATTTATTGGTCTTGGTTTAGCGTCAGTGGCTGTGCTGAGTTTAGCTGCTTGTGGTAATCGTGGTGCTTCTAAAG
GTGGGGCATCAGGAAAAACTGATTTAAAAGTTGCAATGGTTACCGATACTGGTGGTGTAGATGACAAATCATTCAACCAATCAG
CATGGGAAGGCCTGCAATCTTGGGGTAAAGAAATGGGCCTTCAAAAAGGAACAGGTTTCGATTATTTTCAATCTACAAGTGAAT
CTGAGTATGCAACTAATCTCGATACAGCAGTTTCAGGAGGGTATCAACTGATTTATGGTATCGGCTTTGCATTGAAAGATGCTAT
TGCTAAAGCAGCTGGAGATAATGAAGGAGTTAAGTTTGTTATTATCGATGATATTATCGAAGGAAAAGATAATGTAGCCAGTGTT
ACCTTTGCCGACCATGAAGCTGCTTATCTTGCAGGAATTGCAGCTGCAAAAACAACAAAAACAAAAACAGTTGGTTTCGTGGGC
GGTATGGAAGGAACTGTCATAACTCGATTTGAAAAAGGTTTTGAAGCAGGAGTTAAGTCTGTTGACGATACAATCCAAGTTAAAG
TTGATTATGCTGGATCATTTGGTGACGCTGCAAAAGGAAAAACAATCGCAGCAGCTCAGTATGCAGCAGGTGCTGATGTTATTT
ACCAGGCAGCAGGAGGCACTGGAGCAGGTGTATTTAATGAAGCAAAAGCTATTAATGAAAAACGTAGTGAAGCTGATAAAGTTT
GGGTTATTGGTGTTGACCGTGATCAAAAAGACGAAGGAAAATACACTTCTAAAGATGGCAAAGAAGCAAACTTTGTACTTGCATC
ATCAATCAAAGAAGTCGGTAAAGCTGTTCAGTTAATCAACAAGCAAGTAGCAGATAAAAAATTCCCTGGAGGAAAAACAACTGTC
TATGGTCTAAAAGATGGCGGTGTTGAAATCGCAACTACAAATGTTTCAAAAGAAGCTGTTAAAGCTATTAAAGAAGCGAAAGCAA
AAATTAAATCTGGTGACATTAAAGTTCCTGAAAAATAG
SPy1245
Seq ID 53
ATGAAAATGAAAAAAAAATTCTTTTTGTTAAGTCTTTTGGCCCTATCAACTTTCTTTTTATCCGCATGTTCTAGCTGGATTGATAAA
GGTGAGTCAATAACCGCTGTAGGATCAACAGCACTACAACCCTTAGTAGAAGCAGTAGCTGATGAATTTGGAAGCAGTAATCTA
GGCAAGACTGTCAATGTTCAAGGTGGTGGTTCAGGTACAGGGTTGTCTCAAGTTCAATCAGGAGCTGTCCAAATTGGAAATAGT
GATGTCTTTGCGGAAGAAAAAGATGGTATTGATGCTTCTAAATTAGTTGATCATCAAGTAGCTGTTGCAGGACTTGCAGTTATTG
CCAATCCTAAAGTCAAGGTTTCCAATCTCAGTAGTCAGCAGTTGCAAAAGATTTTTTCAGGAGAATATACCAATTGGAAACAAGT
TGGAGGAGAAGATCTTGCGATTTCAGTGATCAACCGAGCAGCAAGTTCTGGCTCACGAGCAACCTTTGACAGTGTTATCATGAA
AGGGGTCAACGCTAAACAAAGTCAAGAGCAAGACTCCAATGGGATGGTTAAATCGATTGTTTCACAAACACCAGGTGCCATTTC
TTACCTTTCCTTTGCCTACGTTGATTCATCTGTTAAATCTTTGCAATTAAATGGGTTTAAGGCAAATGCTAAGAACGTGGCTACAA
ATGATTGGCCAATCTGGTCCTACGAACACATGTATACCAAAGATAAACCAACAGGGTTGACCAAGGAATTTCTTGATTATATGTT
TTCAGATGAAGTACAACAGAACATTGTTACACATATGGGATATATTTCGATAAATGATATGGAAGTGGTCAAATCTCATGATGGA
AAAGTAACAAAAAGGTAA
SPy1315
Seq ID 54
ATGACGCACAAAATAAAAGTATTGCTGCTTGCGATAATGTCTATTTTTTTGACATGCAATATTGCAAGTGCTGAAACTATTGCTAT
TGTTTCAGATACAGCTTATGCCCCATTTGAATTTAAAGACTCAGATCAAATTTACAAAGGAATTGACGTTGATATTATTAATGAAG
TAGCCAAACGTCAATCTTGGGATTTCAGTATGAGTTTCCCGGGTTTTGATGCAGCTGTAAATGCTGTTCAATCTGGTCAAGCGA
GTGCTCTAATGGCCGGTACAACCATTACGAATGCTCGTAAGAAAGTCTTTCATTTCTCAGAGCCATATTACGATACCAAAATTGT
CATTGCGACACGTAAAGCCAATGCCATCAAAAAATACAGTGACTTAAAAGGAAAAACGGTCGGTGTTAAAAATGGAACAGCGGC
TCAAGCCTTTTTGAATAACTATAAAAAAAAGTATGATTATACTGTTAAAACATTTGACACAGGTGATCTTATGTATAATAGTTTATC
TGCTGGTTCTATTGCCGCTGTTATGGATGATGAGGCGGTTATCCAATACGCAATCAGCCAAAACCAAGATATTGCTATTAACATG
AAAGGAGAGCCCATTGGAAGCTTTGGGTTTGCTGTCAAAAAGGGAAGCGGATATGATTATCTAGTTAATGATTTCAATACAGCTC
TTAAAGCTATGAAAGCTGATGGTACCTACCAAGCTATCATGACCAAGTGGTTAGGCACAGATGATAAAGCTACCACCAGTCAGG
CAACGGGAAATCCATCTGCCAAAGCTACACCTACAAAGGACAGTTATAAAATTGTCTCTGATTCGTCTTTTGCACCGTTTGAATT
TCAAAATGGTAAGGGCAAATACGTTGGTATTGACATAGAATTAATCAAAGCTATTGCTAAACAACAAGGTTTCAAAATTGAAATCG
CTAATCCAGGTTTCGATGCTGCCTTAAATGCTGTGCAATCTAGCCAAGCAGATGGGGTCATTGCTGGTGCAACTATTACTGACG
CTCGTAAAGCTATCTTTGATTTTTCTGATCCTTATTATACTTCTAATATCATTTTAGCTGTTAAAGCTGGAAAAAACATCAAGAACT
ATGAAGACTTAGACAGAAAAACAGTCGGTGCTAAAAACGGCACTTCATCTTACTCTTGGTTAAAAGAAAACGCTCCTAAATATGG
TTATAATGTCAAGGCATTTGATGATGGTTCTAGCATGTATGATAGCTTAAATTCAGGTTCTGTAGATGCTATCATGGATGATGAG
GCGGTTCTTAAATACGCTATCTCTCAAGGTCGTCGCTTTGAAACACCTCTTGAGGGCATTTCTACTGGTGAAGTTGGTTTTGCTG
TCAAGAAAGGAACTAATCCAGAATTAATCGAAATGTTCAACAATGGCTTAGCTGCTCTCAAAAAATCTGGTCAGTATGATGACAT
TATAGATAAATACCTTGACTCTAAGAAAGCTGCAACTCCTTCTGAAAAAGGTGCTGATGAGTCTACTATTTCAGGCCTATTATCAA
ATAACTACAAACAACTATTGGCAGGACTTGGAACCACGCTCAGTTTAACCCTTATTTCATTTGCTATTGCTATAATTATCGGGATC
ATCTTTGGGATGATGGCCGTGTCACCAACTAAATCACTTCGACTTATTTCAACGGTCTTTGTGGACGTTGTTCGAGGGATTCCTT
TGATGATTGTGGCTGCCTTCATTTTCTGGGGAGTACCAAACCTTATCGAGAGTATGACCGGCCACCAGTCACCGATTAATGATT
TCTTAGCTGCTACAATTGCACTGTCACTTAATGGCGGAGCCTATATTGCTGAAATTGTTCGCGGTGGTATCGAAGCTGTTCCAG
CAGGGCAAATGGAAGCTAGTCGAAGTCTTGGTTTGTCTTACGGAACCACGATGAGAAAAGTAATTCTCCCACAAGCTGTGAAAC
TAATGTTACCTAACTTTATCAATCAGTTTGTTATTTCATTGAAGGATACAACAATCGTCTCAGCAATTGGTTTAGTGGAACTCTTC
CAAACAGGTAAAATCATTATTGCTAGAAATTACCAGTCGTTCCGTATGTATGCTATTTTAGCAATTATTTACCTTATCATGATTATA
CTCTTAACAAGACTTGCAAAACGTTTAGAAAAGAGGCTTAACTAA
SPy1357
Seq ID 55
ATGGGAAAAGAAATAAAAGTGAAATGCTTTTTGCGTAGATCAGCTTTTGGATTAGTTGCGGTGTCAGCATCAGTATTAGTCGGTT
CAACAGTATCTGCTGTTGACTCACCTATCGAACAGCCTCGAATTATTCCAAATGGCGGAACCTTAACTAATCTTCTTGGCAATGC
TCCAGAAAAACTGGCATTACGTAATGAAGAAAGAGCCATTGATGAATTAAAAAAACAAGCTATTGAGGATAAAGAAGCTACGACA
GCTATAGAAGCAGCAAGTTCAGATGCCTTAGAAGCATTAGCGGATCAAACAGACGCTTTACAATCAGAAGAAGCTGCGGTTGTT
AAAGCGGATAACGCTGCTAGTGACGCCTTAGAAGCATTGGCGGATCAAACAGACGCTTTACAATCAGAAGAAGCTGAAGTAGTT
CAATCAGATAACGCTGCTAGTGACGCCTGGGAAAAAGCAGCAACTCCAATCGCTTTAGATGTTAAGAAAACTAAAGATACAAAA
CCTGTAGTTAAAAAAGAAGAAAGACAAAACGTTAATACCCTTCCTACAACTGGTGAAGAGTCTAACCCATTCTTTACAGCTGCTG
CGCTTGCAATAATGGTAAGTACAGGTGTGTTAGTTGTAAGTTCAAAGTGCAAAGAAAATTAG
SPy1361
Seq ID 56
ATGAAAACGAAAAAAGTTATTATTTTAGTTGGTCTATTGTTATCATCTCAGTTGACTTTGATAGCTTGTCAATCACGAGGTAATGG
TACATATCCCATTAAAACGAAACAATCACGTAAGGGAATGACGTCAAACAAAATTAAACCGATTAAAAAAAGCAAAAAGACAAAC
AAGACTCACAAAGGTGTGGCGGGTGTCGATTTTCCTACAGATGATGGGTTTATTTTAACCAAAGACTCAAAAATCTTATCAAAAA
CAGATCAGGGAATCGTTGTTGACCATGATGGTCATTCGCATTTTATTTTTTATGCCGATTTAAAGGGAAGTCCATTTGAATACCTT
ATTCCAAAAGGAGCAAGTTTAGCTAAGCCAGCTGTTGCTCAGCGAGCAGCTAGTCAAGGGACTTCTAAAGTAGCAGATCCTCAT
CACCATTATGAATTTAACCCAGCGGATATTGTGGCTGAAGATGCTTTAGGCTACACGGTTCGCCACGATGATCACTTCCATTATA
TTTTGAAGTCAAGCTTATCAGGTCAGACACAGGCACAAGCTAAACAGGTTGCTACTCGCTTGCCACAAACCAGTAGCCTTGTTT
CAACAGCTACAGCTAATGGTATTCCAGGCTTGCATTTCCCAACCTCAGATGGTTTTCAATTTAACGGTCAAGGTATTGTTGGGGT
AACAAAAGACAGTATTTTAGTGGACCACGATGGTCACTTACATCCTATTTCTTTTGCGGACCTTCGTCAGGGTGGCTGGGCACA
TGTGGCAGATCAATACGATCCCGCTAAAAAAGCAGAAAAGCCAGCAGAAACCCATCAGACACCAGAGCTATCTGAACGTGAAAA
GGAATACCAAGAAAAATTAGCTTATTTGGCAGAAAAATTGGGGATTGATCCATCAACTATTAAACGTGTGGAAACACAAGACGGT
AAACTTGGTTTGGAATACCCTCACCATGACCACGCACACGTATTGATGTTATCTGATATTGAAATCGGAAAAGACATTCCAGATC
CACATGCTATTGAGCATGCCCGTGAATTGGAAAAACATAAGGTTGGAATGGATACCTTGCGTGCCTTAGGGTTTGATGAAGAAG
TGATTTTGGATATCGTTCGCACTCACGATGCTCCAACCCCATTCCCATCAAATGAAAAAGATCCGAATATGATGAAAGAATGGTT
AGCAACGGTTATCAAACTTGACTTGGGCAGCCGTAAAGATCCTTTGCAACGTAAAGGACTTTCACTGTTACCCAACTTAGAAACT
TTAGGAATTGGCTTTACACCAATCAAAGATATCTCACCTGTTTTGCAATTTAAAAAATTGAAACAGTTGTTAATGACAAAAACAGG
GGTGACTGATTATAGATTTTTGGATAATATGCCACAGTTAGAAGGCATTGATATTTCACAAAACAATCTCAAAGATATTAGTTTCT
TGAGCAAATATAAAAACTTAACTCTAGTAGCGGCTGCTGATAATGGTATTGAAGATATTAGGCCGCTTGGTCAATTACCAAATCT
CAAATTCCTCGTATTGAGTAACAATAAGATTTCTGATTTAAGCCCACTGGCATCGTTACATCAATTGCAAGAATTGCACATTGATA
ATAATCAGATTACAGATTTAAGCCCTGTTTCTCATAAAGAATCATTGACGGTTGTTGATTTATCAAGAAATGCTGATGTTGACTTA
GCAACACTTCAAGCACCCAAATTAGAAACGTTAATGGTCAATGATACCAAGGTTTCTCATTTGGATTTCTTGAAAAATAATCCTAA
TCTATCTAGCCTATCTATTAACCGTGCGCAATTGCAATCTCTTGAAGGTATTGAAGCAAGTAGCGTCATTGTCAGAGTAGAAGCA
GAAGGTAACCAAATTAAATCGCTTGTGCTTAAAGACAAGCAAGGGTCACTTACTTTCTTGGATGTGACAGGCAACCAGTTGACTT
CTCTAGAAGGTGTTAATAATTTTACAGCACTTGACATTTTAAGCGTGTCTAAAAACCAATTAACAAATGTCAACCTATCTAAACCC
AATAAGACAGTTACTAACATTGATATTAGTCATAACAATATCTCATTAGCAGACCTTAAATTGAACGAGCAACATATTCCAGAAGC
CATTGCGAAAAACTTCCCAGCGGTTTACGAAGGTTCTATGGTAGGTAATGGAACAGCTGAAGAAAAAGCAGCTATGGCTACTAA
GGCGAAAGAAAGTGCTCAAGAAGCATCGGAATCACATGACTACAACCATAATCATACCTATGAAGATGAAGAAGGTCATGCTCA
CGAGCACAGAGACAAAGATGATCACGACCATGAACATGAGGATGAAAATGAAGCTAAAGATGAGCAAAACCATGCTGACTAA
SPy1371
Seq ID 57
TTGGCAAAACAATATAAAAATTTAGTGAACGGTGAATGGAAACTATCAGAAAACGAGATTACCATTTACGCACCAGCAACAGGTG
AAGAGTTAGGATCAGTTCCAGCGATGACGCAGGCAGAGGTAGATGCTGTTTACGCTTCAGCTAAAAAGGCTCTATCAGATTGGC
GCGCTTTGTCTTATGTGGAACGTGCAGCTTACCTTCATAAAGCGGCTGATATTTTAGTACGTGATGCTGAAAAGATCGGCGCGA
TTCTTTCAAAAGAAGTAGCCAAAGGTCACAAGGCAGCTGTCAGTGAAGTTATTCGTACCGCTGAAATCATTAATTATGCAGCAGA
AGAAGGGCTTCGTATGGAAGGTGAAGTTCTTGAAGGTGGTAGCTTCGAAGCTGCAAGTAAGAAGAAGATTGCTATTGTTCGTCG
TGAACCAGTTGGTTTAGTTCTTGCCATCTCACCTTTTAATTATCCCGTTAACTTGGCAGGTTCTAAAATTGCTCCAGCTCTTATTG
CAGGAAATGTTGTTGCTCTTAAACCACCAACACAAGGCTCTATTTCTGGTTTGTTACTAGCAGAAGCTTTTGCAGAAGCTGGTAT
TCCAGCAGGTGTCTTTAATACCATTACAGGGCGAGGTTCTGTTATCGGTGATTATATCGTTGAGCACGAAGCGGTTAGCTTTATC
AACTTTACAGGTTCTACTCCAATTGGGGAAGGAATCGGTAAATTAGCGGGTATGCGACCAATTATGCTTGAGCTTGGCGGTAAG
GATTCTGCTATCGTTTTGGAAGATGCAGATCTTGCTTTAGCAGCGAAAAATATTGTAGCCGGTGCTTTTGGTTACTCAGGCCAAC
GTTGTACAGCGGTTAAACGTGTTCTTGTGATGGACAAGGTGGCGGATCAATTGGCGGCTGAGATTAAAACACTTGTTGAAAAAC
TAAGTGTCGGAATGCCTGAAGACGATGCTGATATTACACCATTAATTGATACATCAGCTGCTGATTTTGTTGAAGGGTTGATTAA
AGATGCAACTGATAAGGGAGCTACTGCTTTGACAGCCTTTAATCGTGAAGGCAATCTTATTTCACCCGTTCTCTTTGATCATGTG
ACAACTGACATGCGTTTGGCATGGGAAGAGCCGTTCGGCCCAGTATTACCAATTATTCGTGTAACCACTGTAGAAGAAGCCATC
AAGATTTCTAATGAGTCTGAATATGGTTTGCAAGCTTCTATTTTTACAACTAATTTCCCAAAAGCTTTTGGCATTGCTGAGCAATT
AGAAGTTGGAACTGTTCACCTTAACAATAAAACACAACGTGGAACAGATAATTTCCCATTCTTAGGCGCTAAAAAATCAGGTGCA
GGGGTACAAGGAGTTAAATATTCTATCGAAGCTATGACAACTGTTAAATCTGTTGTATTTGATATCCAGTAA
SPy1375
Seq ID 58
ATGAGTCTCAAAGATCTTGGCGATATTTCATATTTTCGCCTAAATAATGAAATTAACCGTCCTGTTAATGGTAAAATTCCACTTCA
TAAAGACAAAGAAGCTTTAAAAGCTTTTTCCGCTGAAAATGTGCTGCCAAACACCATGTCTTTTACTTCCATTACGGAAAAAATTG
AGTATTTAATCTCAAATGATTACATTGAATCAGCTTTTATTCAGAAATACCGCCCTGAATTTATTACTGAATTAGATAGCATAATCA
AATCAGAAAATTTTCGCTTTAAATCATTTATGGCAGCCTACAAGTTCTACCAGCAATACGCCTTAAAAACAAATGATGGAGAGCAT
TATTTAGAAAACCTTGAAGACCGTGTCTTGTTTAATGCTTTGTATTTTGCAGATGGTCAAGAAGACTTAGCAAAAGATTTAGCCGT
TGAAATGATTAACCAACGTTACCAACCGGCTACTCCTTCCTTTTTAAATGCTGGTCGAAGCCGTCGTGGTGAATTGGTCTCTTGT
TTCTTGATTCAAGTAACTGATGACATGAACTCTATCGGACGTTCTATCAACTCTGCTTTGCAATTATCCCGTATTGGTGGAGGAG
TTGGGATTACCTTGTCTAACCTCCGTGAAGCTGGCGCACCAATCAAAGGCTATGCTGGTGCAGCCTCAGGAGTTGTTCCTGTTA
TGAAATTATTTGAAGATAGTTTTTCTTATTCAAATCAACTTGGGCAACGTCAAGGAGCTGGTGTTGTTTACCTAAATGTTTTTCAT
CCTGATATCATTGCTTTCTTATCTACTAAAAAAGAAAATGCCGATGAAAAGGTGCGTGTTAAAACCTTGTCACTAGGGATTACCG
TTCCTGATAAATTCTACGAATTAGCTCGTAAAAACGAGGACATGTATCTCTTTAGTCCTTACAATGTTGAAAAAGAATATGGCATT
CCCTTTAACTATCTCGACATTACCAATATGTACGATGAGTTAGTGGCGAACCCTAAAATTACTAAGACTAAAATTAAAGCTCGTGA
TCTTGAAACAGAGATTTCAAAATTACAACAAGAATCTGGTTACCCTTATATCATCAATATTGATACAGCTAATAAAGCTAATCCTAT
CGATGGAAAAATCATCATGAGCAACTTGTGTTCTGAAATTTTACAAGTTCAAACACCTAGCCTTATCAATGATGCGCAAGAGTTT
GTAGAAATGGGAACTGATATTTCATGTAACTTAGGTTCCACTAATATCCTGAACATGATGACCTCACCAGACTTTGGCCGTTCTA
TTAAGACCATGACACGTGCCCTAACTTTTGTTACTGATTCATCAAGCATTGAAGCTGTTCCAACCATTAAACATGGCAATAGCCA
AGCTCATACTTTTGGCCTTGGAGCTATGGGACTACATTCTTACCTTGCTCAACATCATATTGAATATGGCAGTCCAGAATCCATC
GAGTTTACTGATATTTACTTTATGCTCCTGAATTATTGGACCTTGGTCGAATCCAATAACATCGCTCGTGAGCGCCAAACTACCT
TTGTTGGCTTTGAGAACTCTAAGTACGCTAATGGTAGTTACTTTGATAAATACGTTACAGGACACTTTGTTCCAAAATCTGATTTG
GTGAAAGATCTGTTCAAAGACCATTTTATTCCGCAAGCTTCAGATTGGGAGGCTCTTCGCGACGCCGTTCAAAAAGATGGTCTT
TATCATCAAAACCGACTAGCAGTTGCTCCAAATGGCTCTATTTCTTATATCAATGACTGCTCTGCTTCTATTCACCCAATCACACA
ACGCATCGAAGAGCGTCAAGAAAAGAAAATTGGTAAAATCTACTATCCTGCAAATGGTTTGTCTACGGATACCATTCCTTACTAT
ACATCTGCTTACGATATGGACATGCGCAAAGTTATTGATGTCTATGCCGCTGCGACCGAACATGTGGACCAAGGCTTGTCATTA
ACTCTATTCCTTCGTAGTGAGTTGCCTATGGAGCTTTATGAGTGGAAAACACAAAGCAAACAAACCACTCGTGATTTATCCATCT
TACGAAACTACGCTTTCAATAAAGGCATTAAATCTATCTACTATATCCGTACCTTTACGGATGATGGGGAAGAAGTGGGCGCAAA
CCAATGTGAATCTTGTGTCATTTAA
SPy1389
Seq ID 59
ATGAAAGAATTATCGTCTGCACAAATCCGCCAAATGTGGTTGGATTTCTGGAAATCTAAAGGACATTGCGTTGAGCCTTCAGCTA
ACTTGGTTCCTGTGAACGACCCAACGCTTCTTTGGATCAACTCAGGTGTTGCAACCTTGAAAAAATATTTTGATGGTTCAGTGAT
TCCAGAAAATCCACGTATTACCAATGCACAAAAATCAATTCGTACTAATGATATTGAAAATGTTGGTAAAACAGCACGTCACCATA
CTATGTTTGAAATGCTTGGTAACTTCTCAATTGGAGACTATTTCCGTGATGAAGCTATTGAGTGGGGATTTGAACTCTTGACAAG
TCCAGACTGGTTTGATTTCCCTAAAGACAAGCTCTACATGACTTATTACCCAGATGACAAGGATTCGTATAACCGTTGGATTGCT
TGTGGCGTTGAACCAAGTCACTTGGTGCCGATCGAGGATAACTTCTGGGAAATCGGTGCTGGTCCTTCAGGTCCAGATACGGA
GATTTTCTTCGACCGTGGTGAAGATTTCGATCCAGAAAATATCGGACTTCGCCTCTTGGCTGAAGATATCGAAAACGATCGTTAC
ATCGAAATCTGGAACATCGTTCTCTCACAATTCAATGCTGACCCAGCCGTACCACGTTCAGAATACAAAGAATTACCAAACAAAA
ACATTGATACAGGTGCTGGTCTTGAACGTCTTGCAGCTGTTATGCAAGGGGCAAAAACAAACTTTGAAACTGACCTCTTCATGC
CAATCATCCGTGAAGTAGAGAAGTTGTCAGGTAAAACTTTACGATCCAGATGGCGACAACATGAGTTTCAAGGTTATCGCTGACC
ACATCCGTGCGCTTTCATTTGCTATCGGTGATGGTGCGCTTCCTGGAAATGAAGGTCGTGGTTACGTTCTTCGTCGTCTTCTCC
GTCGTGCGGTTATGCACGGTCGCCGTCTTGGCATCAACGAAACTTTCCTTTACAAATTGGTTCCGACTGTTGGACAAATCATGG
AAAGCTACTACCCAGAAGTGCTTGAAAAACGTGATTTTATCGAGAAAATCGTTAAACGTGAGGAAGAAACATTTGCTCGTACTAT
CGATGCAGGTAGCGGTCACTTAGATTCATTGCTT GCGCAGCTTAAGGCTGAAGGTAAGGATACTCTTGAAGGTAAAGATATCTT
CAAACTTTATGATACTTATGGATTCCCGGTTGAATTGACAGAGGAATTGGCAGAAGATGCAGGCTACAAGATTGACCACGAAGG
CTTTAAGTCAGCCATGAAAGAACAACAAGACCGTGCGCGTGCAGCTGTTGTTAAGGGTGGTTCAATGGGGATGCAAAATGAAA
CCCTAGCTGGTATTGTT GAAGAATCACGATTCGAATACGACACATATAGTCTTGAATCAAGTCTTTCAGTCATCATCGCTGATAA
TGAACGTACCGAAGCTGTTTCAGAAGGTCAAGCCCTTCTTGTCTTTGCTCAAACACCATTCTATGCTGAAATGGGTGGACAGGT
TGCTGACACAGGTAGAATCAAAAATGATAAGGGTGACACAGTTGCTGAGGTTGTTGATGTTCAAAAAGCACCAAATGGTCAACC
TCTACACACTGTAAACGTTTTAGCATCACTTTCAGTTGGAACAAACTACACACTTGAAATCAACAAAGAGCGTCGTTTGGCTGTT
GAGAAAAAC CACACAGCTACTCACTTGCTCCATGCAGCTCTTCACAATGTTATCGGTGAACAC GCAACTCAGGCTGGTTCATTG
AACGAAGAAGAATTCTTGCGCTTTGATTTTACTCACTTTGAAGCAGTAAGCAATGAGGAACTTCGTCACATTGAACAAGAAGTTA
ATGAGCAAATTTGGAACGCTCTTACAATCACAACGACTGAAACTGACGTTGAAACCGCAAAAGAGATGGGAGCAATGGCGCTTT
TTGGTGAGAAATATGGTAAAGTGGTTCGTGTGGTTCAAATTGGTAATTATTCTGTTGAACTTTGTGGTGGAACTCACTTAAATAAT
TCTTCAGAAATCGGTCTCTTCAAGATTGTCAAAGAAGAAGGTATTGGTTCAGGCACTCGTCGTATTATTGCAGTTACTGGTAGAC
AAGCTTTTGAAGCTTATCGTAACCAAGAGGATGCCCTAAAAGAGATCGCTGCTACTGTAAAAGCTCCGCAATTGAAAGATGCAG
CAGCTAAAGTACAAGCTCTTAGCGACTCGCTTCGTGATCTTCAAAAAGAAAATGCAGAACTTAAAGAAAAAGCAGCAGCTGCAG
CAGCTGGTGATGTCTTTAAAGATGTTCAAGAAGCTAAGGGCGTGCGCTTCATTGCTAGTCAAGTTGATGTTGCAGATGCAGGGG
CACTTCGTACATTTGCTGATAACTGGAAACAAAAAGACTACTCTGATGTGCTTGTTCTCGTAGCAGCTATTGGTGAGAAGGTTAA
TGTCCTTGTTGCAAGCAAAACCAAAGATGTCCACGCTGGTAACATGATCAAAGAATTGGCACCAATTGTAGCAGGTCGTGGTGG
AGGTAAACCAGACATGGCTATGGCAGGTGGTAGCGATGCAAGTAAAATTGCAGAGCTGCTAGCAGCAGTTGCTGAAATAGTGT
AA
SPy1390
Seq ID 60
ATGAAAAACTCAAATAAACTCATTGCTAGTGTTGTGACATTGGCCTCAGTGATGGCTTTAGCAGCTTGTCAATCAACTAATGACA
ATACTAAGGTTATTT CGATGAAAGGTGATACAATTAGCGTTAGTGATTTTTACAATGAAACAAAAAACACAGAAGTATCGCAAAAA
GCGATGCTAAATCTGGTAATTAGTCGTGTTTTTGAAGCTCAATATGGT GATAAGGTTTCAAAAAAAGAAGTTGAAAAGGCGTATC
ATAAAACAGCTGAACAGTATGGCGCTTCATTCTCTGCTGCTTTGGCACAATCAAGCTTGACACCTGAGACTTTTAAGCGTCAGAT
CCGCTCTTCAAAATTAGTAGAATATGCGGTTAAAGAAGCAGCTAAAAAAGAATTGACAACACAAGAATATAAGAAAGCATATGAA
TCTTATACTCCAACAATGGCAGTCGAAATGATTACTTTAGATAATGAAGAGACAGCTAAATCAGTCTTA GAGGAACTAAAAGCCG
AAGGCGCAGACTTTACAGCTATTGCTAAAGAAAAAACAACAACACCTGAGAAAAAAGTGACCTATAAATTTGATTCAGGTGCGAC
AAATGTACCGACTGATGTCGTAAAAGCGGCTTCAAGTTTGAATGA GGGTGGCATATCAGACGTTATCTCGGTTTTAGATCCAACT
TCTTATCAAAAGAAGTTTTACATTGTTAAGGTGACTAAAAAAGCAGAAAAAAAATCAGATTGGCAAGAATATAAGAAACGTTTGAA
AGCTATCATTATAGCTGAAAAATCAAAAGATATGAATTTCCAAAACAAGGTTATT GCAAATGCATTGGATAAAGCTAATGTAAAAA
TTAAAGACAAAGCTTTTGCTAATATTTTGGCGCAATATGCAAATCTTGGTCAAAAAACTAAAGCTGCAAGTGAAAGTTCAACAACC
AGCGAATCATCAAAAGCTGCAGAAGAGAACCCATCAGAATCAGAGCAAACACAGACATCATCAGCTGAAGAACCAACTGAGACT
GAGGCTCAGACGCAAGAGCCAGCTGCACAATAA
SPy1422
Seq ID 61
GTGCTTTATCCAACACCCATTGCAAAGTTAATTGACAGTTACTCTAAACTTCCAGGAATTGGTATCAAGACGGCGACGAGATTAG
CCTTTTATACTATTGGAATGTCAAATGAAGATGTCAATGATTTTGCTAAAAACTTATTAGCAGCTAAAAGAGAACTGACCTATTGT
TCGATTTGTGGAAACCTTACCGATGACGATCCTTGTCACATTTGCACAGACACGAGTCGTGATCAGACGACCATTCTGGTAGTA
GAAGATGCTAAAGATGTTTCTGCCATGGAAAAAATCCAAGAGTATCATGGCTATTATCATGTGCTTCACGGCTTGATTTCGCCTA
TGAATGGTGTGGGGCCAGATGACATCAACCTTAAAAGTTTAATTACCCGTCTAATGGATGGTAAGGTGAGCGAAGTTATCGTAG
CTACCAATGCCACAGCAGATGGGGAAGCAACGTCCATGTATATTTCACGTGTCTTGAAACCAGCCGGGATTAAGGTAACTCGTT
TGGCAAGAGGTCTCGCAGTAGGTTCAGATATTGAGTATGCTGATGAAGTAACATTATTGAGAGCTATTGAGAATCGTACTGAACT
TTAA
SPy1436
Seq ID 62
ATGGATATGTCTAAATCAAATCGTCGTACTTGGCAAGGTTTAGTTGTTATTTTAATAGCTATTCTCACCACTTTTACCACAAGTAC
TGTTACGGCAGCCAGAAAAATTAGAAATTTCCCTGATACCACGGAAATTTTGTTAGGAACGAAGGCGACTGAGACACCAGGAAT
CTTACCATTCACTGGTAGCTACCAATTAGTTTTGGGCGATCTTGACAATCTGCAAAGGCCAACCTTCGCACACATCCAGCTAAAA
GATCAAGATGAGCCTAATATTAAACGAAAAGGACTTAAATTCAATCCTCCTGGCTGGCATAATTACAAATTGACTGACGCTAATG
GAAAAACAACTTGGTTAATGGACCGTGGCCATTTAGTTGGTTACCAATTTAGCGGCTTAAATGACGAGCCTAAAAACCTAGTTAC
AATGACAAAATATCTTAATACTGGCTTTAGTGACAAAAATCCTTTAGGAATGCTCTATTATGAAAATAGATTAGATAGCTGGTTAG
CTCTACACCCTAACTTCTGGCTAGACTATAAAGTTACTCCTGTTTATCATAAAAATGAGTTAGTTCCTCGCCAAGTAGTTCTACAG
TATGTTGGAATTGATGAAAATGGAGATCTACTTCAAATTAAGTTAGGTAGTGAAAAAGAAAGTGTAGACAACTTTGGAGTAACAT
CAGTTACATTAGATAACGTATCTCCTTTAGCTGAATTGGATTACCAAACAGGAATGATGCTAGATTCAACTCAAAACGAAGAAGA
TAGTAATTTAGAAACCGAAGAGTTTGAAGAAGCGGCTTAA
SPy1494
Seq ID 63
ATGACTAGTAAAAAAGCGTGTTTATCAAGCATCATTGTGTTAGCAAGTTTAACGTGTGGAAATGATACTGTTAGTGCCAATCATCT
CTCAGCAACTGGAGATAAGTTTGATGATTGCTCAACACTTGTTGAAAAAGATGTGGCCCCTAAAGATGAACTTGAGATGTTAGCA
TGGTCCTCGTCTCAAACAACTGATGATGCTGACAGAGACTATGAAGATTTTCTCGATGATGATTCTTTTATTTCTCAAAATGAAAC
TGATAAGATGTTTGAGAATTTAACTGATGATAGGTTATTAAATGAATTAGATGAATTAGATGAAGAAAATGAAGAAGATGAAGAAG
ATACAATTGAGCCAGAGCAAAATGTAATAATGCCTAGTGACGATGAGCTATTTGATTTAACTGATGCTGTTGAGACACGCCTTAC
TGTTTCTAGTGCTCCCCATTTAGAGGCTGAATTGCCGAAACCACATTTGAGGAGCCTATCAGATACAGCACTGCGGTCTGGTGA
AATTAGAGGACATTTAGATAACAAACTGGACGCTTTGTCTGTAACAGCTACAAAGTTAGCATTAACGATGGCTCAAAAATTTGATT
TGACAACGCATGTCTATTCTATAGGTGAAAGCTTTAGTGAAGTATTAGCTGCTCATTATGAAGACAGAAAAGCAGAATCAGCTTT
TTCTAAGAAAAAGAGATTTCACCTTCCTATTGCTACTCCAGATGTTGTTATAGAGGAGTTAAGGCGCCTAGTCTCTTCTATTGGA
AGTTCAAAAGAAGATGTTTCAGTTCCTTATAGTCGGAAGCTAGGTATGGCAGTTGCAAAAAGAAAAATAGCCCTGCCACAAACG
GGAGAGAGGTTCTCTTATTATCCAGTTTTACTTGGTTTAATGATATTAGGATTAACGCCGATTATGATACCAAAGAAGATAAATAA
TTAG
SPy1523
Seq ID 64
ATGGCAAAAGATAAAGAGAAACAAAGTGATGACAAGCTCGTTTTGACAGAGTGGCAAAAGCGTAACATTGAATTTTTAAAGAAAA
AGAAGCAGCAAGCTGAGGAAGAAAAAAAACTCAAAGAGAAATTATTGAGTGATAAAAAAGCGCAGCAGCAAGCTCAAAATGCTT
CTGAAGCGGTTGAGCTTAAAACTGATGAGAAAACTGATAGTCAGGAAATTGAGTCAGAAACGACGTCAAAACCTAAAAAAACCA
AAAAAGTTAGACAACCCAAGGAAAAAAGCGCGACACAAATCGCTTTTCAAAAATCCTTGCCTGTTCTTTTGGGGGCGCTCTTACT
CATGGCGGTGTCTATTTTTATGATCACTCCTTATAGCAAAAAGAAAGAGTTTTCTGTAAGAGGAAACCATCAAACGAACCTTGAC
GAATTAATCAAAGCTAGCAAAGTCAAAGCATCTGACTATTGGTTAACGCTGTTAACTTCGCCTGGTCAGTATGAACGACCGATTC
TTCGTACTATTCCATGGGTGAAATCTGTACATCTCTCTTACCAATTTCCTAATCACTTTCTATTTAACGTTATTGAATTTGAAATCA
TCGCTTATGCACAAGTTGAAAACGGTTTTCAGCCTATTTTGGAGAATGGAAAACGTGTGGACAAGGTCAGGGCATCAGAACTAC
CGAAATCTTTCTTGATTCTTAATTTAAAAGATGAGAAAGCGATCCAACAGTTAGTTAAGCAATTAACGACATTACCTAAAAAATTA
GTCAAGAATATCAAGTCAGTGTCTCTTGCAAATTCCAAAACGACAGCGGATTTACTACTTATTGAAATGCATGACGGTAATGTAG
TTAGAGTACCGCAGTCACAACTCACATTGAAACTTCCCTATTATCAAAAATTGAAAAAAAACCTTGAAAATGATAGTATAGTGGAT
ATGGAAGTGGGAATTTATACTACAACACAGGAGATTGAAAATCAACCTGAAGTTCCTCTTACGCCTGAACAAAACGCAGCTGATA
AAGAAGGAGATAAGCCTGGTGAACATCAGGAACAGACAGACAATGATTCAGAAACGCCAGCAAATCAGAGTAGTCCTCAGCAA
ACACCACCATCCCCAGAAACGGTCCTCGAACAGGCCCATGGCTAG
SPy1536
Seq ID 65
ATGAAAAGACTTAAAAAAATCAAATGGTGGTTAGTGGGTCTGCTAGCTTTAATCTCTTTGTTGCTAGCGTTATTTTTTCCGCTACC
TTATTATATTGAAATGCCTGGAGGCGCTTACGATATTCGGACTGTCTTACAAGTCAATGGCAAAGAAGACAAACGAAAAGGAGC
TTACCAGTTTGTTGCAGTGGGCATTAGTCGTGCCAGCCTCGCTCAGCTATTATATGCTTGGCTGACACCGTTTACTGAAATTAGT
ACAGCAGAAGATACAACAGGCGGATACAGCGATGCTGATTTCCTTCGAATTAATCAATTTTACATGGAAACATCACAAAATGCAG
CTATTTATCAAGCTTTATCCTTAGCTGGAAAACCAGTTACATTAGATTATAAAGGCGTATATGTTTTAGACGTAAACAACGAATCT
ACTTTTAAAGGAACGCTACACTTAGCAGATACTGTAACAGGTGTAAATGGTAAACAGTTTACTAGTTCAGCAGAACTTATTGACT
ATGTTTCTCACCTAAAACTAGGGGATGAAGTTACGGTTCAGTTTACGAGTGATAATAAGCCTAAAAAAGGAGTTGGCCGTATTAT
CAAACTGAAAAATGGGAAAAATGGGATTGGCATTGCCTTGACTGATCATACAAGTGTCAATTCAGAAGACACAGTGATCTTTAGT
ACTAAAGGAGTAGGAGGACCTAGTGCTGGTCTAATGTTTACTCTTGATATATATGATCAAATAACTAAAGAAGATTTACGCAAGG
GCCGTACAATTGCAGGTACAGGAACTATTGGCAAGGATGGCGAAGTAGGAGATATTGGTGGTGCAGGTCTTAAAGTAGTTGCA
GCAGCTGAAGCTGGTGCAGATATATTTTTTGTTCCGAATAATCCTGTTGATAAGGAAATTAAAAAAGTTAATCCAAATGCTATAAG
TAATTACGAAGAAGCCAAACGGGCAGCCAAACGACTAAAGACCAAAATGAAGATTGTTCCTGTTACGACTGTTCAAGAGGCACT
GGTTTATCTTCGCAAATAA
SPy1564
Seq ID 66
ATGTTGGAACACAAAATTGATTTTATGGTAACTCTTGAAGTGAAAGAAGCAAATGCAAATGGTGATCCCTTAAATGGAAACATGC
CTCGTACAGATGCCAAAGGATATGGTGTGATGAGTGATGTCTCCATTAAACGTAAGATTCGTAATCGTTTGCAAGATATGGGGA
AGTCTATTTTTGTGCAAGCTAATGAGCGTATTGAAGATGATTTTCGTTCACTGGAAAAACGCTTTTCGCAACATTTTACAGCTAAG
ACACCTGACAAAGAAATTGAAGAAAAAGCAAATGCATTATGGTTTGATGTTCGTGCTTTTGGACAAGTTTTTACTTATCTGAAAAA
ATCAATTGGGGTGCGTGGACCAGTTTCCATCAGTATGGCTAAGTCCTTGGAGCCAATTGTCATTTCCAGCCTTCAAATTACGCG
TAGTACCAATGGTATGGAAGCTAAGAATAATAGTGGCCGCTCTTCTGATACGATGGGGACAAAACATTTTGTAGATTATGGTGTG
TATGTACTTAAAGGTTCTATCAATGCTTATTTTGCTGAAAAGACTGGTTTTTCTCAGGAAGATGCTGAGGCTATTAAAGAAGTTTT
GGTTAGCTTGTTTGAAAATGATGCGTCGTCTGCACGTCCGGAAGGCTCTATGCGAGTTTGTGAAGTCTTTTGGTTTACGCATTC
AAGCAAATTGGGAAATGTTTCAAGTGCGCGTGTCTTTGACTTGTTAGAGTATCATCAATCAATAGAAGAAAAAAGCACTTATGAC
GCTTATCAGATTCATCTAAATCAAGAAAAATTGGCTAAATATGAAGCGAAAGGGTTAACGCTTGAAATCCTAGAAGGACTCTAG
SPy1604
Seq ID 67
ATGGCAACTAAAAAAGTACATATTATTTCACACAGTCACTGGGATCGCGAGTGGTACATGGCTTACGAACAACACCACATGCGT
CTGATTAACTTAATAGATGACCTGTTAGAAGTTTTTCAAACGGATCCTGATTTTCATAGTTTTCATTTGGATGGGCAAACCATTAT
CCTAGATGATTATTTAAAAGTACGCCCCGAACGAGAACCTGAGATTAGACAAGCCATTGCTTCGGGAAAACTCCGTATCGGACC
TTTCTATATCTTACAGGACGATTTTTTGACCAGCAGTGAATCCAATGTGCGCAATATGCTGATTGGTAAGGAAGATTGTGACAGA
TGGGGCGCTAGTGTGCCACTTGGTTATTTTCCTGATACCTTTGGAAATATGGGACAAACACCACAGCTGATGTTAAAAGCCGGC
CTACAAGCTGCTGCCTTTGGTCGTGGCATTCGTCCAACTGGATTTAACAATCAGGTGGATACCAGTGAAAAATACAGCTCCCAA
TTCTCTGAAATCAGTTGGCAAGGCCCAGATAACAGTCGTATTCTTGGACTCCTCTTCGCCAACTGGTACAGCAATGGCAATGAG
ATCCCGACAACAGAAGCTGAGGCGCGTCTTTTTTGGGATAAAAAACTTGCTGATGCCGAACGCTTCGCCTCAACCAAGCACCTT
CTGATGATGAACGGGTGTGATCATCAACCCGTACAACTTGATGTCACCAAGGCAATCGCCTTAGCCAACCAACTCTATCCTGAC
TACGAATTTGTGCATTCCTGCTTTGAAGATTACTTGGCTGATCTCGCAGATGATTTACCAGAGAACCTTTCAACCGTCCAAGGAG
AGATTACCAGTCAAGAAACCGATGGCTGGTATACCCTAGCTAACACGGCTTCTGCTCGTATTTACCTCAAACAGGCTAATACCA
GAGTCTCTCGCCAACTCGAAAACATCACCGAACCCTTAGCAGCAATGGCTTATGAGGTAACAAGTACCTACCCTCACGACCAAC
TGCGTTACGCTTGGAAAACCCTCATGCAAAATCACCCTCATGATTCTATCTGTGGTTGTAGTGTTGATAGCGTTCATCGGGAAAT
GATGACGCGCTTTGAAAAAGCCTATGAAGTCGGACACTATTTAGCAAAAGAAGCTGCTAAGCAAATTGCTGACGCCATTGATAC
CAGGGATTTTCCAATGGATAGCCAACCCTTCGTCTTATTTAATACCAGCGGCCATTCCAAAACAAGTGTTGCTGAGCTCAGCCT
GACCTGGAAAAAATATCATTTTGGCCAACGCTTTCCTAAAGAGGTTTACCAAGAAGCTCAAGAATATTTGGCAAGACTCTCCCAA
TCTTTCCAAATTATTGACACTAGTGGACAAGTGAGACCCGAAGCAGAAATTTTAGGCACAAGCATCGCTTTTGACTACGATTTGC
CCAAGAGATCCTTCCGCGAACCTTATTTCGCCATCAAAGTGAGATTACGGCTACCAATAACTCTCCCAGCCATGTCTTGGAAAA
CCTTAGCATTAAAGCTAGGAAATGAAACAACTCCTTCAGAAACCGTTTCCCTCTACGATGACAGTAATCAGTGCCTTGAAAATGG
GTTTCTAAAAGTTATGATACAAACCGATGGTCGTCTAACCATCACCGATAAACAATCTGGACTAATCTATCAAGACCTGTTGCGG
TTTGAAGATTGTGGCGATATTGGAAATGAATATATTTCTCGCCAGCCAAATCATGACCAACCTTTCTATGCGGATCAAGGGACCA
TCAAGCTTAACATCATTAGCAACACCGCTCAAGTTGCTGAACTTGAAATCCAGCAAACCTTTGCCATTCCTATCTCCGCAGATAA
GCTCTTACAGGCTGAGATGGAGGCTGTCATTGACATCACAGAACGCCAAGCAAGACGTTCACAAGAAAAGGCTGAGCTAACCT
TAACAACCCTTATCCGCATGGAGAAAAATAATCCTCGCCTCCAATTCACCACACGTTTTGATAACCAAATGACTAATCATCGCTT
GCGCGTCCTATTCCCAACGCACCTTAAAACAGACCATCATCTAGCTGACAGTATTTTTGAAACTGTCAAACGTCCAAATCATCCA
GATGCCACCTTTTGGAAGAATCCAAGTAACCCACAGCACCAAGAATGCTTTGTGAGTCTCTTTGATGGTGAAAATGGAGTCACT
ATTGGTAACTATGGCCTCAACGAATATGAGATCTTACCAGATACCAACACCATTGCCATCACTCTCTTACGTTCTGTTGGCGAAA
TGGGCGACTGGGGTTACTTCCCAACACCTGAAGCCCAGTGTCTTGGCAAACACAGCCTTTCTTATAGTTTTGAAAGCATCACTA
AGCAAACACAATTTGCCAGCTACTGGCGAGCTCAAGAAGGCCAAGTCCCTGTTATTACCACACAAACAAACCAACACGAGGGAA
CATTAGCCGCAGAATATAGCTATTTGACGGGTACAAACGACCAAGTTGCCCTCACAGCTTTCAAACGTCGCTTAGCAGACAATG
CCCTTATCACGCGCAGCTATAATCTCTCAAACGATAAAACTTGTGACTTTAGCCTAAGCCTGCCAAACTACAATGCCAAGGTCAC
TAATTTGTTAGAAAAAGACAGCAAGCAAAGCACACCCAGCCAACTTGGCAAAGCGGAAATTTTAACTCTAGCTTGGAAGAAACA
ATAA
SPy1607
Seq ID 68
ATGAAAATCACTAAAATTGAAAAGAAAAAACGCCTCTACCTTATCGAATTGGATAATGACGAATCCCTTTATGTAACAGAAGATAC
TATTGTTCGGTTTATGTTGAGTAAAGATAAAGTCCTTGACAATGATCAGCTTGAAGACATGAAACATTTTGCCCAACTGTCCTAC
GGCAAAAATTTAGCCCTTTATTTTCTTTCCTTTCAACAACGCAGCAACAAGCAAGTTGCTGATTACCTGCGCAAGCATGAGATTG
AAGAACACATTATTGCTGACATCATCACTCAACTCCAAGAAGAACAATGGATAGACGACACCAAATTGGCTGATACCTACATTCG
CCAAAATCAGTTAAATGGTGATAAAGGTCCCCAAGTCTTAAAACAAAAATTATTACAAAAAGGCATTGCAAGTCATGACATTGATC
CTATCTTATCTCAAACTGACTTTAGCCAACTCGCTCAAAAAGTAAGCCAAAAACTCTTTGACAAATATCAAGAAAAATTGCCACCA
AAAGCCTTGAAAGATAAAATCACCCAAGCATTACTGACCAAAGGCTTTTCATACGATCTAGCTAAACATAGCCTCAATCACCTTA
ATTTTGACCAAGATAATCAAGAAATAGAAGATCTTCTTGACAAAGAATTAGACAAACAATATCGTAAACTCAGTCGCAAATATGAT
GGTTATACCTTAAAGCAAAAGCTCTATCAGGCTCTCTACCGAAAAGGCTACAACAGCGACGACATTAATTGCAAGTTAAGAAATT
ATTTATAG
SPy1615
Seq ID 69
ATGATCTGTCTACTATGTCAACAAATTAGTCAAACACCAATAAGTATTACAGAAATCATCTTTTTAAGACGTATCTCTTCACCGATT
TGTCAACAATGTCAAAAAAGCTTTCAAAAGATAGGAAAAAGTGTTTGTGCGACATGTTGTGCAAACTCAGATATAATAGCTTGTC
GAGATTGTCTAAAATGGGAAAACAAAGGATACAATGTAAATCATAGAAGCTTATATTGTTATAATGCTGCTATGAAAGCATACTTC
AGTCAATATAAGTTTCAAGGAGACTATTTATTAAGAAAAGTTTTTGCAGTAGAACTTGCCGATGTTATCACCAAGTACTATAAAGG
CTATATCCCAGTCCCGGTTCCTGTAAGTCCCGGTTGTTTTCGAGAAAGACAATTTAATCAAGTGAGCGCTATTCTTGAGGCAGCT
AATGTTAGCTACCTTTCTCTTTTTGAAAAGCTAGATAATACTCACCAATCTTCCAGAACAAAAAAAGAGAGATTATTAGTAGAAAA
ATCTTATCGACTACTAAAAGTATCAAACATTCCTGATAAAATCCTTATAGTAGATGATATTTATACTACTGGTAGTACAATTATCGC
TCTTAGAAAACAATTGGCTAAAGTAGCAAATAGTGACATTAAAAGTTTGTCAATTGCACGTTAA
SPy1666
Seq ID 70
ATGAAATCCTTTTCTCTTACTTTTTCATTTCTAAACCTTTTGAAGTATGGTACAATTAAAGTTATGACAAAAGAATTTCATCACGTG
ACCGTACTCCTTCACGAAACAGTGGACATGCTTGACATAAAGCCTGATGGGATTTATGTTGATGCGACGCTAGGTGGCTCAGGC
CACTCAGCTTATTTGTTGTCCAAACTTGGTGAAGAAGGGCACCTCTATTGTTTTGACCAAGACCAAAAGGCTATTGACAATGCAC
AAGTTACCCTCAAATCTTATATTGACAAAGGACAGGTAACTTTTATTAAAGATAATTTTAGACACCTCAAAGCACGTTTAACAGCG
CTTGGAGTTGATGAAATTGATGGTATCTTATATGACCTTGGTGTTTCCAGCCCGCAATTGGATGAAAGAGAACGAGGGTTTTCTT
ATAAACAAGATGCTCCATT GGATATGCGCATGGATCGTCAGTCGCTCTTAACAGCTTACGAAGTGGTGAATACCTATCCATTCAA
TGATTTGGTTAAGATTTTTTTCAAATATGGTGAAGATAAATTCTCCAAGCAGATCGCTCGAAAAATTGAACAAGCAAGAGCTATTA
AGCCTATTGAGACAACAACAGAGTTGGCAGAATTGATTAAGGCAGCAAAGCCAGCTAAAGAGTTGAAGAAAAAAGGCCACCCT
GCTAAACAGATTTTTCAAGCTATTCGCATTGAAGTCAATGATGAATTGGGAGCGGCCGATGAATCTATTCAGGACGCTATGGAAT
TATTAGCCCTTGATGGTCGTATCTCAGTTATTACCTTCCATTCTCTGGAAGATCGCCTAACCAAGCAGTTGTTTAAAGAAGCTAG
TACGGTGGATGTGCCAAAAGGGCTTCCTCTAATTCCTGAAGATATGAAACCTAAGTTTGAACTTGTTTCACGTAAGCCGATCTTA
CCTAGTCATTCAGAGTTAACAGCTAATAAAAGGGCACACTCAGCCAAGCTACGTGTTGCCAAAAAAATTCGGAAATAA
SPy1727
Seq ID 71
GTGACAACGACGGAACAAGAACTTACCTTGACTCCCTTACGTGGGAAAAGTGGCAAAGCTTATAAAGGCACTTATCCAAATGGG
GAATGTGTCTTTATAAAATTAAATACGACCCCTATTCTACCTGCCTTAGCAAAAGAACAGATTGCGCCACAGTTACTTTGGGCCA
AACGCATGGGCAATGGTGATATGATGAGTGCCCAAGAATGGCTTAACGGCCGTACATTGACCAAAGAAGATATGAACAGTAAG
CAAATCATTCATATTCTATTGCGCCTTCACAAATCTAAAAAATTAGTCAATCAACTGCTTCAGCTCAATTATAAGATTGAAAACCCA
TACGATTTATTGGTTGATTTTGAGCAAAATGCACCCTTGCAAATTCAGCAAAATTCATACTTACAAGCTATCGTTAAAGAATTAAA
ACGGAGCTTACCAGAGTTCAAATCAGAAGTAGCAACGATTGTGCATGGAGATATTAAACATAGCAATTGGGTGATTACTACTAGT
GGTATGATTTTTTTAGTAGATTGGGATTCTGTTCGTCTAACTGATCGGATGTATGATGTTGCTTACCTGTTGAGCCACTATATTCC
ACGGTCTCGTTGGTCAGAATGGCTGTCTTATTATGGCTATAAAAATAATGACAAGGTTATGCAAAAAATTATTTGGTATGGTCAAT
TTTCTCACCTGACACAAATTCTCAAGTGTTTTGACAAGCGTGACATGGAGCATGTGAATCAGGAGATTTATGCCCTCAGAAAATT
TAGAGAAATATTTAGAAAGAAATAA
SPy1785
Seq ID 72
ATGATATTAACAGCTCCTATGTCCAACTTAAAGGGATTTGGACCAAAATCAGCAGAAAAATTTCAGAAATTAGATATTTATACAGT
AGAAGATTTACTGCTTTATTATCCGTTTCGCTATGAAGATTTTAAATCAAAATCTGTTTTTGATTTAGTGGATGGTGAAAAAGCAG
TCATTACAGGCTTAGTCGTTACTCCAGCTAATGTACAATATTATGGTTTTAAACGTAACCGTTTAAGTTTCAAATTGCGTCAAGGG
GAAGCTGTCTTAAATGTTAGTTTTTTTAATCAACCCTATTTAGCTGATAAAATAGAACTTGGTCAAGAGGTAGCTGTTTTTGGTAA
ATGGGATGCCACTAAATCGGCTATTACTGGGATGAAGGTTTTAGCTCAAGTTGAAGATGACATGCAACCTGTTTATCGCGTAGC
TCAGGGAATTTCACAGTCTACTTTGATTAAAGCTATTAAGTCAGCTTTTGAAATCGATGCGCATTTGGAATTGAAGGAAAATTTAC
CAGCTACTTTATTGGAAAAATACCGATTGATGGGTCGTAGTCAGGCTTGTTTAGCTATGCATTTCCCAAAAGATATCACAGAGTA
TAAGCAAGCGCTCCGTCGGATTAAATTTGAAGAATTATTTTACTTTCAAATGAACCTTCAAGTTTTGAAAGCCGAAAATAAATCTG
AAACAAATGGTTTGCCTATTCTTTATAGTAAACGTGCTATGGAGACAAAGATTTCCTCTTTACCTTTTATTCTAACGAATGCTCAA
AAGCGCTCTTTAGATGACATATTATCTGATATGTCATCGGGAGCTCATATGAATCGTTTATTGCAAGGAGATGTAGGATCAGGAA
AGACAGTCATTGCTGGTCTATCAATGTATGCAGCTTATACAGCAGGTTTTCAATCGGCTTTGATGGTTCCAACGGAAATCCTAGC
TGAACAACACTACATTAGTCTGCAAGAGTTATTTCCAGATTTATCAATCGCTATATTAACTTCGGGTATGAAAGCAGCTGTCAAG
CGTACGGTTTTAGCAGCTATTGCAAATGGCTCGGTTGATATGATTGTAGGAACTCATGCTCTTATCCAAGACTCGGTACAGTACC
ATAAACTGGGGCTTGTCATTACAGACGAGCAACATCGTTTTGGTGTTAAACAGCGTAGAATTTTCCGTGAAAAGGGAGAAAATC
CTGATGTTTTAATGATGACAGCCACCCCAATTCCCCGAACTCTAGCAATCACAGCTTTTGGAGAAATGGATGTTTCTATTATTGA
TGAATTACCTGCCGGTCGTAAACCTATTATGACACGCTGGGTGAAACACGAGCAGCTAGGTACTGTGTTGGAATGGGTAAAAG
GTGAATTGCAAAAAGATGCTCAAGTGTATGTCATTTCACCGTTGATTGAAGAATCAGAAGCTTTAGATTTAAAGAATGCAGTAGC
ATTGCATGCTGAATTATCTACTTATTTTGAAGGAATTGCTAAGGTTGCTCTTGTACATGGACGTATGAAAAATGATGAAAAAGATG
CTATAATGCAAGATTTCAAGGATAAAAAAAGTCATATTTTAGTATCCACAACAGTTATTGAAGTAGGGGTAAATGTCCCAAATGCA
ACGATCATGATTATTATGGATGCCGATCGTTTTGGATTAAGTCAGTTACATCAACTTCGTGGGCGTGTTGGTCGTGGATATAAAC
AATCATACGCTGTTTTAGTGGCTAATCCCAAAACTGATTCGGGGAAAAAACGAATGACAATCATGACAGAAACGACAGATGGTTT
CGTTTTAGCTGAGTCGGATTTAAAAATGCGTGGTTCTGGTGAAATCTTTGGTACTCGTCAGTCTGGAATTCCAGAATTTCAAGTA
GCTGATATCGTTGAGGATTATCCTATTTTAGAAGAAGCACGCAAAGTTTCTGCAGCGATTGTTTCTGATCCTAACTGGATATATG
AAAAACAGTGGCAATTAGTGGCACAAAATATTAGAAAAAAAGAAGTTTATGATTAA
SPy1798
Seq ID 73
ATGAAAAAAATCAGCAAATGTGCGTTTGTGGCAATATCTGCCCTTGTTCTCATTCAGGCTACTCAAACTGTAAAATCACAAGAGC
CTTTAGTTCAGTCACAACTCGTGACAACAGTAGCTTTAACTCAGGATAATCGACTTTTAGTTGAAGAGATAGGCCCTTACGCTAG
TCAATCAGCTGGAAAAGAGTATTATAAACATATTGAAAAGATTATTGTTGATAATGATGTCTATGAAAAAAGCCTGGAGGGCGAG
CGAACCTTTGATATTAACTACCAAGGGATTAAGATCAATGCTGACCTTATTAAAGACGGTAAGCATGAATTGACTATTGTTAATAA
AAAAGATGGTGATATCCTAATTACCTTTATTAAAAAGGGCGATAAAGTGACCTTTATTTCAGCTCAAAAATTAGGAACAACAGATC
ATCAGGATTCATTAAAAAAAGATGTGCTCAGTGATAAAACAGTGCCACAAAACCAAGGCACACAAAAAGTTGTTAAATCTGGGAA
AAATACTGCTAACTTGTCATTAATAACAAAATTGAGTCAAGAAGATGGTGCAATTTTATTTCCAGAAATTGATCGTTATTCTGATAA
CAAACAGATAAAAGCATTGACTCAGCAAATCACAAAGGTTACAGTCAATGGTACAGTTTATAAAGATCTTATTTCAGATTCTGTAA
AAGATACTAATGGCTGGGTCTCGAATATGACAGGGCTTCATCTTGGAACAAAAGCTTTCAAAGATGGAGAAAATACAATCGTGAT
ATCCTCAAAAGGATTTGAAGACGTTACTATTACCGTTACCAAGAAAGATGGTCAAATCCATTTTGTATCTGCCAAACAAAAACAAC
ATGTGACTGCTGAAGACAGACAATCAACAAAGTTGGATGTCACCACTTTGGAAAAAGCTATCAAAGAAGCGGATGCGATTATTG
CTAAAGAAAGCAACAAAGACGCGGTCAAAGATCTGGCTGAGAAACTTCAAGTCATCAAGGATTCTTACAAAGAAATCAAAGATA
GTAAGCTACTCGCCGATACTCATCGACTGTTAAAAGATACCATCGAGTCTTATCAAGCAGGTGAGGTTTCTATTAACAATCTCAC
AGAAGGAACCTATACGCTAAACTTTAAAGCTAATAAAGAAAACTCAGAAGAGTCCTCCATGCTTCAAGGTGCTTTTGATAAAAGA
GCCAAATTAGTGGTTAAAGCAGATGGTACAATGGAAATTTCCATGCTTAATACTGCTTTGGGACAATTTTTGATTGACTTTTCTAT
TGAAAGCAAAGGGACCTACCCAGCAGCAGTGCGTAAACAAGTTGGCCAAAAAGATATCAATGGTAGCTATATTCGAAGCGAATT
TACCATGCCTATTGATGATTTGGATAAATTACACAAAGGTGCTGTTTTGGTATCAGCCATGGGAGGTCAAGAAAGTGATTTAAAC
CACTATGACAAATACACCAAACTTGACATGACCTTTAGTAAGACCGTTACCAAAGGCTGGAGTGGTTATCAGGTAGAAACTGAT
GATAAAGAAAAAGGGGTTGGGACTGAACGTCTTGAAAAAGTTTTAGTTAAACTTGGCAAAGATTTAGACGGCGATGGTAAATTAT
CAAAAACGGAATTAGAACAGATTCGAGGCGAGTTGCGTCTAGACCATTACGAGTTAACTGATATTTCTTTATTGAAACATGCTAA
AAATATTACAGAACTACATCTGGATGGAAACCAAATTACGGAAATTCCAAAAGAGTTATTTAGTCAAATGAAGCAACTTCGATTTC
TTAACTTAAGAAGTAATCATTTAACTTATCTAGACAAAGATACATTTAAAAGCAATGCTCAATTAAGAGAACTCTACTTATCAAGTA
ACTTTATTCACTCTCTTGAAGGAGGACTATTCCAGTCGCTTCATCACCTGGAGCAACTTGATCTTTCCAAGAATCGTATTGGCCG
ACTTTGTGATAACCCATTTGAAGGATTGTCTCGTCTGACTTCATTAGGTTTCGCAGAAAATAGTCTTGAGGAGATACCTGAAAAA
GCGCTAGAGCCTCTAACATCACTTAATTTTATCGACTTATCTCAAAATAATTTAGCACTACTGCCAAAAACAATAGAAAAATTGCG
CGCCTTAAGCACTATTGTGGCAAGTAGAAATCATATTACTCGTATTGATAATATTTCATTTAAAAATCTTCCTAAATTATCTGTACT
CGATTTATCAACTAATGAAATTTCAAATCTTCCAAATGGTATATTTAAACAGAATAACCAATTAACAAAACTTGATTTTTTCAATAAC
TTGCTTACTCAGGTTGAAGAATCAGTATTTCCAGATGTTGAAACGCTTAATTTAGATGTGAAGTTCAATCAGATAAAAAGTGTGAG
TCCAAAAGTAAGAGCTCTTATCGGACAACACAAACTGACTCCACAAAAACATATTGCAAAACTTGAAGCTTCCTTAGATGGCGAA
AAAATAAAATATCATCAAGCTTTCAGTCTTTTAGATTTGTATTATTGGGAGCAAAAAACAAATTCTGCCATTGATAAAGAACTAGT
GTCTGTTGAAGAATATCAACAATTGTTACAAGAAAAAGGTTCAGATACGGTTTCTTTACTTAATGATATGCAAGTCGATTGGAGTA
TTGTGATTCAGTTGCAAAAAAAAGCTTCCAATGGACAGTATGTGACGGTTGACGAAAAGCTTCTCTCAAATGATCCGAAAGATGA
CTTAACGGGAGAGTTTTCTTTAAAAGATCCAGGTACATATCGGATTCGCAAAGCTTTAATAACAAAGAAATTTGCTACTCAAAAAG
AACATATCTATTTGACATCTAATGATATCCTTGTGGCGAAAGGACCACATTCACATCAGAAAGATTTAGTTGAGAACGGCCTTAG
AGCATTAAATCAAAAACAATTGCGTGATGGTATTTACTATTTAAATGCCAGCATGTTAAAAACTGACTTAGCATCTGAGTCCATGT
CAAACAAGGCTATTAATCATCGAGTGACTTTGGTAGTTAAAAAAGGTGTTTCCTATTTAGAAGTTGAGTTTAGAGGTATAAAGGTT
GGTAAAATGTTAGGCTACCTTGGTGAATTGAGCTATTTCGTAGATGGTTACCAAAGAGATTTAGCTGGTAAACCAGTTGGTCGAA
CAAAAAAGGCAGAGGTTGTGTCTTATTTCACGGATGTAACTGGCCTACCATTGGCAGATCGTTATGGAAAAAACTATCCAAAAGT
GCTGCGTATGAAATTGATTGAACAAGCGAAGAAAGACGGACTTGTGCCATTACAGGTCTTTGTGCCTATCATGGATGCCATTTC
AAAAGGGTCTGGCCTTCAAACCGTTTTTATGCGTTTAGACTGGGCAAGCCTTACAACAGAGAAGGCAAAGGTTGTCAAAGAAAC
TAATAATCCACAAGAAAATAGCCATCTAACTTCAACAGATCAGTTGAAAGGACCTCAAAATCGTCAACAAGAAAAAACACCTACA
AGTCCTCCTTCAGCAGCTACTGGTATTGCTAACTTAACTGATCTCCTGGCTAAAAAAGCAACCGGCCAATCAACTCAAGAAACTT
CTAAGACAGATGATACTGATAAGGCAGAGAAATTGAAGCAGTTAGTGCGTGACCATCAAACATCAATTGAAGGTAAAACAGCAA
AAGATACTAAGACTAAAAAATCTGATAAGAAACATCGTTCCAATCAACAATCAAATGGTGAAGAAAGTAGCTCTCGTTATCACTTA
ATTGCAGGTCTATCTAGCTTTATGATCGTAGCTCTGGGATTCATTATTGGTCGAAAGACATTATTTAAATAA
SPy1801
Seq ID 74
ATGAATAAAAACAAACTATTAAGAGTTGCCATGCTACTAAGTCTCTTAGCCCCGACAGCAGAAAGCATGACAGTGCTGGCTCAA
GATGTAATGCTTGAGACGCATAAAGCAACTACAAATGAAACCAGTGATTCTTCTTCAAAAGAGGAAAATAATAAAAATGCAGCAC
CTACAACATCAGATAAAACTGACCAAGGTCCCCTTGATGCTTCTGCAGAAACAAACTCTAATAGTCTTGTTAACGCGGATGATAA
AAAAAGAAGCGATTCTAGTCAGTCTGCTATAGGCTCTTCGGACAACAAGGCAGAAGCAGAAAACCAGGTAGATGATAAATCAAC
TGATCATTCGAAATCAACTGATCATTCGAAACCAACTGACCAGCCCAAACCATCACCATCTAAAGTTGATACGGCACCTGCTTCT
TCATTGTCGAAACAACTGCCAGAGGCAAGAACTCCTATTCAGTCGTTGTCCCCTTACGTATCAGATTTAGATTTGAGTGAGATAG
ATATCCCTTCTGTCAACACATACGCGGCATATGTAGAGCATTGGAGTGGTAAAAATGCCTATACCCACCATCTTTTATCTCGCCG
TTATGGTATTAAAGCTGACCAGATTGATAGTTACTTAAAATCAACAGGCATTGCCTATGACAGCACACGTATTAATGGTGAGAAG
CTATTGCAATGGGAAAAGAAAAGTGGGCTGGATGTTCGAGCTATCGTAGCTATTGCGATGTCTGAGAGTTCTTTAGGAACTCAA
GGGATTGCAACTTTGCTTGGAGCTAATATGTTTGGCTATGCAGCTTTTGATCTAGATCCGACTCAAGCAAGTAAGTTTAATGATG
ATAGTGCTATTGTCAAAATGACACAAGACACCATTATTAAAAACAAAAATAGCAATTTTGCACTTCAAGATTTAAAAGCGGCTAAG
TTTTCACGAGGTCAATTAAACTTTGCAAGTGACGGGGGTGTTTATTTTACTGATACTACTGGTAGTGGTAAACGTCGCGCACAAA
TTATGGAAGACCTGGATAAGTGGATTGATGACCATGGTGGCACACCAGCCATTCCAGCCGAATTGAAAGTGCAGTCATCAGCTA
GTTTTGCATCTGTGCCAGCAGGTTATAAGCTCTCTAAGAGTTATGATGTCTTGGGTTATCAAGCTTCGAGTTATGCTTGGGGACA
ATGCACTTGGTATGTGTATAATCGCGCCAAAGAATTGGGTTACCAATTTGATCCTTTTATGGGAAATGGTGGAGATTGGAAGTAT
AAAGTAGGGTATGCCCTTTCAAAGACTCCAAAAGTAGGTTATGCTATTTCATTTGCACCAGGGCAAGCGGGCGCTGATGGCACT
TATGGCCACGTATCAATTGTAGAAGATGTTAGAAAAGATGGGTCTATTCTTATTTCAGAGTCTAACTGTATCGGCTTAGGTAAGA
TTTCTTATCGTACCTTTACAGCTCAGCAGGCTGAACAGCTAACATATGTTATTGGCAAGAGTAAAAACTAA
SPy1813
Seq ID 75
ATGGATAAACATTTGTTGGTAAAAAGAACACTAGGGTGTGTTTGTGCTGCAACGTTGATGGGAGCTGCCTTAGCGACCCACCAT
GATTCACTCAATACTGTAAAAGCGGAGGAGAAGACTGTTCAGGTTCAGAAAGGATTACCTTCTATCGATAGCTTGCATTATCTGT
CAGAGAATAGCAAAAAAGAATTTAAAGAAGAACTCTCAAAAGCGGGGCAAGAATCTCAAAAGGTCAAAGAGATATTAGCAAAAG
CTCAGCAGGCAGATAAACAAGCTCAAGAACTTGCCAAAATGAAAATTCCTGAGAAAATACCGATGAAACCGTTACATGGTTCTCT
CTACGGTGGTTACTTTAGAACTTGGCATGACAAAACATCAGATCCAACAGAAAAAGACAAAGTTAACTCGATGGGAGAGCTTCC
TAAAGAAGTAGATCTAGCCTTTATTTTCCACGATTGGACAAAAGATTATAGCCTTTTTTGGAAAGAATTGGCCACCAAACATGTG
CCAAAGTTAAACAAGCAAGGGACACGTGTCATTCGTACCATTCCATGGCGTTTCCTAGCTGGGGGTGATAACAGTGGTATTGCA
GAAGATACCAGTAAATACCCAAATACACCAGAGGGAAATAAAGCTTTAGCCAAAGCTATTGTTGATGAATATGTTTATAAATACAA
CCTTGATGGCTTAGATGTGGATGTTGAACATGATAGTATTCCAAAAGTTGACAAAAAAGAAGATACAGCAGGCGTAGAACGCTC
TATTCAAGTGTTTGAAGAAATTGGGAAATTAATTGGACCAAAAGGTGTTGATAAATCGCGGTTATTTATTATGGATAGCACCTACA
TGGCTGATAAAAACCCATTGATTGAGCGAGGAGCTCCTTATATTAATTTATTACTGGTACAGGTCTATGGTTCACAAGGAGAGAA
AGGTGGTTGGGAGCCTGTTTCTAATCGACCTGAAAAAACAATGGAAGAACGATGGCAAGGTTATAGCAAGTATATTCGTCCTGA
ACAATACATGATTGGTTTTTCTTTCTATGAGGAAAATGCTCAAGAAGGGAATCTTTGGTATGATATTAATTCTCGCAAGGACGAG
GACAAAGCAAATGGAATTAACACTGACATAACTGGAACGCGTGCCGAACGGTATGCAAGGTGGCAACCTAAGACAGGTGGGGT
TAAGGGAGGTATCTTCTCCTACGCTATTGACCGAGATGGTGTAGCTCATCAACCTAAAAAATATGCTAAACAGAAAGAGTTTAAG
GACGCAACTGATAACATCTTCCACTCAGATTATAGTGTCTCCAAGGCATTAAAGACAGTTATGCTAAAAGATAAGTCGTATGATC
TGATTGATGAGAAAGATTTCCCAGATAAGGCTTTGCGAGAAGCTGTGATGGCGCAGGTTGGAACCAGAAAAGGTGATTTGGAA
CGTTTCAATGGCACATTACGATTGGATAATCCAGCGATTCAAAGTTTAGAAGGTCTAAATAAATTTAAAAAATTAGCTCAATTAGA
CTTGATTGGCTTATCTCGCATTACAAAGCTCGACCGTTCTGTTTTACCCGCTAATATGAAGCCAGGCAAAGATACCTTGGAAACA
GTTCTTGAAACCTATAAAAAGGATAACAAAGAAGAACCTGCTACTATCCCACCAGTATCTTTGAAGGTTTCTGGTTTAACTGGTC
TGAAAGAATTAGATTTGTCAGGTTTTGACCGTGAAACCTTGGCTGGTCTTGATGCCGCTACTCTAACGTCTTTAGAAAAAGTTGA
TATTTCTGGCAACAAACTTGATTTGGCTCCAGGAACAGAAAATCGACAAATTTTTGATACTATGCTATCAACTATCAGCAATCATG
TTGGAAGCAATGAACAAACAGTGAAATTTGACAAGCAAAAACCAACTGGGCATTACCCAGATACCTATGGGAAAACTAGTCTGC
GCTTACCAGTGGCAAATGAAAAAGTTGATTTGCAAAGCCAGCTTTTGTTTGGGACTGTGACAAATCAAGGAACCCTAATCAATAG
CGAAGCAGACTATAAGGCTTACCAAAATCATAAAATTGCTGGACGTAGCTTTGTTGATTCAAACTATCATTACAATAACTTTAAAG
TTTCTTATGAGAACTATACCGTTAAAGTAACTGATTCCACATTGGGAACCACTACTGACAAAACGCTAGCAACTGATAAAGAAGA
GACCTATAAGGTTGACTTCTTTAGCCCAGCAGATAAGACAAAAGCTGTTCATACTGCTAAAGTGATTGTTGGTGACGAAAAAACC
ATGATGGTTAATTTGGCAGAAGGCGCAACAGTTATTGGAGGAAGTGCTGATCCTGTAAATGCAAGAAAGGTATTTGATGGGCAA
CTGGGCAGTGAGACTGATAATATCTCTTTAGGATGGGATTCTAAGCAAAGTATTATATTTAAATTGAAAGAAGATGGATTAATAAA
GCATTGGCGTTTCTTCAATGATTCAGCCCGAAATCCTGAGACAACCAATAAACCTATTCAGGAAGCAAGTCTACAAATTTTTAAT
ATCAAAGATTATAATCTAGATAATTTGTTGGAAAATCCCAATAAATTTGATGATGAAAAATATTGGATTACTGTAGATACTTACAGT
GCACAAGGAGAGAGAGCTACTGCATTCAGTAATACATTAAATAATATTACTAGTAAATATTGGCGAGTTGTCTTTGATACTAAAG
GAGATAGATATAGTTCGCCAGTAGTCCCTGAACTCCAAATTTTAGGTTATCCGTTACCTAACGCCGACACTATCATGAAAACAGT
AACTACTGCTAAAGAGTTATCTCAACAAAAAGATAAGTTTTCTCAAAAGATGCTTGATGAGTTAAAAATAAAAGAGATGGCTTTAG
AAACTTCTTTGAACAGTAAGATTTTTGATGTAACTGCTATTAATGCTAATGCTGGAGTTTTGAAAGATTGTATTGAGAAAAGGCAG
CTGCTAAAAAAATAA
SPy1821
Seq ID 76
ATGATTGAAGCAAGTAAGCTTAAAGCAGGTATGACATTTGAAGCAGAAGGAAAATTAATCCGTGTCCTTGAAGCTAGCCACCAC
AAACCAGGTAAAGGAAACACTATCATGCGTATGAAACTACGTGATGTGCGTACAGGTTCTACTTTTGACACAACTTACCGCCCA
GATGAAAAATTTGAGCAAGCCATCATTGAAACTGTCCCAGCACAATACCTATACAAAATGGATGACACTGCTTACTTCATGAACA
CTGACACTTATGATCAGTACGAAATTCCAGTTGCTAACGTTGAGCAAGAATTGCTTTACATTCTTGAAAACTCAGACGTGAAAAT
CCAATTTTATGGAAGTGAAGTGATTGGGGTAACGGTTCCAACAACTGTTGAATTGACCGTTGCGGAAACACAACCATCTATTAAA
GGAGCGACAGTGACGGGTTCAGGGAAACCTGCAACTCTTGAGACAGGACTTGTTGTTAACGTTCCAGACTTTATCGAAGCTGG
CCAAAAACTAATCATTAACACTGCAGAAGGTACTTACGTTTCTCGTGCTTAA
SPy1916
Seq ID 77
ATGACTAAAACATTACCTAAAGATTTTATTTTTGGTGGTGCTACAGCTGCTTACCAGGCTGAAGGCGCTACCCACACAGATGGTA
AAGGACCAGTAGCTTGGGATAAATACTTAGAAGACAACTATTGGTACACAGCTGAGCCAGCAAGTGATTTTTATAATCGTTACCC
TGTCGATTTGAAACTTAGTGAAGAATTTGGTGTCAACGGCATCCGTATCTCTATTGCCTGGTCTCGTATTTTTCCAACAGGAAAA
GGAGAAGTTAACCCTAAAGGAGTAGAATACTACCACAATCTTTTTGCAGAGTGTCATAAGCGTCATGTTGAGCCTTTTGTTACAC
TTCACCATTTTGATACCCCAGAAGCTCTCCACTCGGATGGTGACTTCCTCAATCGTGAGAACATTGAACATTTTGTAAATTATGC
AGAATTTTGTTTTAAAGAATTCTCAGAAGTTAACTATTGGACAACATTTAACGAAATTGGGCCTATTGGTGATGGCCAATACTTAG
TTGGTAAATTCCCTCCAGGTATCCAATATGATCTTGCTAAAGTTTTCCAATCACACCATAACATGATGGTCTCTCATGCTCGTGCA
GTCAAACTCTTTAAAGATAGTGGTTATTCAGGTGAAATTGGTGTTGTCCATGCACTTCCAACTAAGTATCCATTTGACGCTAACAA
TCCTGATGATGTTAGAGCAGCTGAACTTGAAGATATCATCCATAATAAATTTATCCTTGATGCTACTTATCTTGGTAAGTATTCAG
ATAAAACAATGGAAGGTGTTAACCATATCCTTGAGGTGAATGGCGGTGAACTTGATCTTCGCGAAGAAGATTTTGCCGCACTAG
ACGCCGCAAAAGATTTGAATGATTTCCTTGGTATTAACTACTATATGAGTGATTGGATGCAAGCTTTTGATGGTGAGACTGAAAT
CATTCACAATGGCAAGGGTGAAAAAGGCAGCTCTAAATACCAAATCAAGGGTGTTGGTCGAAGAAAAGCACCCGTTGATGTTCC
AAAAACGGACTGGGACTGGATTATCTTCCCACAAGGCTTATATGATCAAATCATGCGTGTCAAAGCCGATTATCCTAATTACAAG
AAAATTTACATTACAGAGAATGGTCTTGGCTACAAAGATGAGTTTGTAGATAATACTGTCTATGATGGTGGACGTATCGATTATGT
GAAAAAACACTTAGAAGTTATTTCTGATGCTATTTCTGATGGTGCAAATGTTAAAGGATACTTTATGTGGTCACTGATGGATGTCT
TTTCATGGTCAAATGGCTATGAAAAACGTTACGGTCTCTTCTATGTTGATTTTGAAACTCAAGAACGTTATCCTAAGAAGAGTGC
CTACTGGTATAAAAAAGTAGCAGAAACTCAAGTGATTGAATGA
SPy1972
Seq ID 78
ATGAAAAAGAAAGTCAACCAAGGATCAAAGCGCTATCAATATCTGTTAAAAAAGTGGGGGATAGGTTTTGTAATCGCTGCAACTG
GGACTGTCGTGTTAGGGTGCACCCCTAGTATCTTAACACATCAAGTTGCTGCTAAAACCATTGTTGGACTAGCCCGCGATGAAG
CTCAACAAGGAGATGGCAATGCTAAATCTGGTGATGGTCTTCAATCGTCTAGCAAGGAGGCAAAACCAGTTTTAGACAGCTCGT
CAGCTAATCCTGCTAGTATTGCTGAGCATCATTTGCGTATGCATTTTAAAACATTGCCAGCTGGTGAGTCGCTAGGAAGCTTGG
GACTTTGGGTGTGGGGAGATGTGGATCAACCTTCAAAGGATTGGCCAAATGGTGCTATCACCATGACAAAAGCGAAAAAAGAT
GACTATGGCTATTATCTAGATGTGCCACTAGCAGCTAAACACCGCCAGCAAGTGTCTTATCTCATTAATAATAAAGCTGGAGAGA
ATCTTTCAAAGGACCAGCACATCTCGCTTCTCACGCCAAAAATGAATGAAGTTTGGATAGACGAGAATTACCATGCGCACGCTT
ATCGACCTTTGAAAAAAGGTTACCTTCGAATCAACTACCACAATCAATCGGGACACTACGATAACTTAGCTGTCTGGACCTTTAA
AGATGTCAAAACCCCAACGACCGACTGGCCAAATGGACTTGACTTGTCACATAAAGGGCATTATGGAGCTTATGTTGATGTCCC
CTTAAAAGAAGGAGCTAACGAAATCGGATTTTTAATCCTTGATAAAAGTAAGACAGGAGATGCTATTAAAGTGCAACCAAAAGAT
TATCTATTTAAAGAGTTAGACAATCATACTCAGGTTTTTGTCAAAGACACTGACCCAAAAGTTTACAACAATCCTTATTATATTGAT
CAGGTTAGTCTCAAAGGAGCTGAACAAACCACGCCAAATGAGATTAAAGCCATTTTTACGACCTTAGATGGGCTTGATGAAGAT
GCGGTGAAACAAAACATCAAGATCACTGACAAAGCAGGGAAAACTGTTGCAATTGATGAGTTGACACTTGACAGGGATAAGTCT
GTAATGACATTAAAGGGTGATTTTAAGGCGCAAGGTGCAGTCTACACGGTTACATTTGGAGAAGTTAGCCAAGTCGCTCGCCAA
TCCTGGCAATTAAAAGATAAACTCTATGCTTACGATGGTGAACTTGGAGCTACCCTAGCTAAGGATGGTTCTGTTGATTTAGCGC
TATGGTCTCCAAGTGCTGATACTGTTAAGGTTGTCGTTTATGATAAACAAGATCAGACAAGGGTGGTTGGTCAAGCTGATTTGAC
CAAGTCGGACAAGGGTGTTTGGAGAGCTCATCTAACTTCTGACAGTGTCAAGGGCATTAGTGATTACACAGGCTACTATTACCT
TTATGAAATCACGCGCGGTCAGGAAAAAGTCATGGTTTTGGATCCTTACGCCAAATCTCTCGCTGCCTGGAATGATGCGACTGC
TACTGATGACATCAAAACAGCAAAAGCTGCCTTTATTGATCCAAGCAAACTAGGACCAACAGGCCTTGATTTTGCCAAAATTAAC
AACTTTAAAAAGCGTGAAGACGCTATTATCTATGAAGCACATGTGCGAGATTTTACGTCAGATAAGGCTCTAGAAGGCAAGTTAA
CACACCCTTTTGGGACTTTTTCAGCTTTCGTTGAACAGCTAGACTATCTCAAAGACTTGGGGGTTACCCACGTTCAATTGCTACC
GGTTTTGAGTTATTTTTATGCCAATGAGCTGGACAAGAGCCGCTCAACAGCCTACACGTCTTCAGACAATAATTACAACTGGGGT
TATGACCCACAACACTACTTTGCCCTTTCTGGCATGTATTCGGCAAATCCTAATGACCCTGCTTTACGTATCGCAGAGCTTAAAA
ACCTTGTCAATGAGATTCACAAACGTGGTATGGGTGTTATTTTTGATGTGGTTTATAACCACACGGCTAGAACCTATCTCTTTGA
AGATTTGGAACCCAACTACTATCATTTTATGAATGCTGATGGTACAGCTAGAGAGAGTTTTGGCGGAGGTCGTCTAGGAACGAC
ACATGCCATGAGTCGTCGTATCTTGGTGGATTCGATTACTTATCTGACTCGTGAATTCAAGGTAGATGGTTTTCGTTTCGACATG
ATGGGTGACCATGATGCGGCAGCTATTGAGCAAGCCTTTAAGGCAGCCAAAGCCATTAATCCAAATACCATTATGATTGGCGAA
GGCT GGCGTACCTACCAAGGTGATGAGGGGAAAAAAGAAATTGCGGCAGATCAAGATTGGATGAAAGCAACCAATACGGTCGG
TGTTTTCTCTGATGATATCAGAAATACCCTCAAGTCAGGTTTTCCAAATGAAGGCACAGCAGCCTTTATTACTGGTGGCGCAAAA
AATCTAGAAGGTTTATTCAAAACGATCAAAGCACAGCCTGGTAACTTTGAAGCAGATGCCCCAGGAGATGTAGTGCAGTATATT
GCAGCCCATGACAACCTGACCTTACATGATGTCATTGCCAAATCCATCAATAAGGATCCTAAAGTGGCTGAAGAAGAGATTCAC
AAGCGTATTCGTCTAGGAAATACCATGATTTTAACTGCTCAAGGGACTGCCTTTATCCATTCTGGTCAGGAATATGGACGAACCA
AGCAGCTTCTAAATCCCGACTACAAGACAAAGGCGTCTGATGACAAGGTGCCAAATAAGGCGACTCTGATTGATGCTGTAGCG
CAATACCCTTACTTCATCCACGATTCTTATGATTCGTCTGATGCGGTCAATCATTTTGACTGGGCAAAGGCAACAGATTCCATAG
CTCACCCGATTAGCAACCAAACAAAAGCCTATACACAGGGACTAATTGCGTTGCGTCGCTCAACAGATGCCTTTACAAAAGCAA
CCAAAGCTGAGGTAGATCGGGATGTGACCTTGATCACCCAAGCAGGACAAGATGGTATTCAACAAGAGGACCTCATCATGGGT
TACCAAACAGTGGCATCAAATGGAGATCGCTATGCTGTCTTTGTCAATGCAGACAACAAGACCCGCAAGGTAGTTTTACCTCAA
GCCTACCGCTATTTGCTAGGAGCCCAAGTGCTTGTTGATGCTGAGCAAGCTGGTGTTACTGCCATTGCTAAGCCTAAGGGAGT
CCAGTTTACCAAAGAAGGCTTGACTATTGAAGGCCTAACTGCCCTGGTCCTCAAAGTATCCTCAAAAACGGCTAATCCCTCTCA
GCAAAAGAGTCAGACAGACAATCATCAAACCAAAACACCAGATGGCTCAAAAGACCTAGACAAATCATTAATGACTAGACCAAA
AAGAGCTAAAACAAACCAAAAGCTCCCAAAAACGGGTGAAGCCTCCTCAAAAGGCTTATTAGCAGCTGGAATAGCTCTGCTTTT
ATTGGCTATTAGCCTGTTGATGAAGCGCCAAAAAGATTAG
SPy1979
Seq ID 79
ATGAAAAATTACTTATCTATTGGAGTGATTGCACTGCTGTTTGCATTAACATTTGGAACAGTCAAGTCGGTCCAAGCTATTGCTG
GGTATGGATGGCTACCAGACCGTCCACCTATCAATAACAGCCAGTTAGTTGTTAGTATGGCCGGTATCGTTGAAGGTACCGATA
AAAAAGTTTTTATAAATTTTTTTGAAATCGATCTAACATCACAACCTGCTCACGGAGGAAAGACAGAGCAGGGCTTAAGTCCAAA
ATCAAAACCATTTGCTACAGATAATGGCGCAATGCCACATAAACTTGAAAAAGCTGACTTATTAAAAGCTATTCAAAAACAGCTG
ATCGCTAACGTTCACAGTAACGACGGCTACTTTGAGGTCATTGATTTTGCAAGCGATGCAACCATTACTGATCGAAACGGCAAG
GTCTACTTTGCTGACAAAGATGGTTCGGTAACCTTGCCGACCCAACCTGTCCAAGAATTTTTGTTAAAGGGACATGTGCGCGTT
AGACCATATAAAGAAAAACCAGTACAAAATCAAGCAAAATCTGTTGATGTAGAATATACTGTACAGTTTACTCCTTTAAACCCTGA
TGACGATTTCAGACCAGGGCTCAAAGATACTAAGCTATTGAAAACACTAGCTATCGGTGACACCATCACATCTCAAGAATTACTA
GCTCAAGCACAAAGCATTTTAAACAAAACCCACCCAGGCTATACGATTTATGAACGTGACTCCTCAATCGTCACTCATGACAATG
ACATTTTCCGTACGATTTTACCAATGGATCAAGAGTTTACTTACCATGTCAAAAATCGGGAACAAGCTTATGAGATCAATCCTAAA
ACAGGTATTAAAGAAAAAACGAACAACACTGATCTGGTCTCTGAGAAATATTACGTCCTTAAACAAGGGGAAAAGCCGTATGATC
CCTTTGATCGCAGTCACTTGAAACTGTTCACCATCAAATACGTTGATGTCAACACCAACGAATTGCTAAAAAGCGAGCAGCTCTT
AACAGCTAGCGAACGTAACTTAGACTTCAGAGATTTATACGATCCTCGTGATAAGGCTAAACTACTCTACAACAATCTCGATGCT
TTTGATATCATGGACTATACCTTAACTGGAAAAGTAGAGGATAATCACGATAAGAATAATCGTGTCGTTACAGTTTATATGGGCA
AGCGCCCTAAAGGGGCAAAGGGTAGCTATCATTTAGCTTATGATAAAGATCTCTATACCGAAGAAGAACGAAAAGCTTACAGCT
ACCTGCGTGATACAGGGACACCTATACCTGATAACCCTAAAGACAAATAA
SPy1983
Seq ID 80
ATGTTGACATCAAAGCACCATAATCTCAACAAACTAGTCTGGCGCTACGGGCTAACCTCAGCCGCTGCCGTCCTTCTAGCCTTT
GGAGGCGGGGCAAGCAGCGTTAAGGCTGAGGTTTCTTCTACGACTATGACGTCGAGTCAAAGAGAGTCAAAAATAAAAGAGAT
CGAAGAAAGTCTTAAAAAATATCCAGAAGTGTCCAATGAGAAATTTTGGGAAAGAAAGTGGTATGGAACCTATTTTAAAGAAGAA
GATTTTCAAAAGGAGCTAAAAGATTTTACTGAGAAGAGGCTTAAGGAGATTCTAGATTTAATTGGTAAATCTGGAATCAAGGGAG
ACCGTGGTGAGACTGGTCCTGCTGGCCCAGCCGGACCACAAGGTAAAACTGGTGAGAGGGGCGCCCAAGGTCCTAAAGGTGA
CCGCGGTGAGCAAGGAATCCAAGGTAAAGCTGGTGAAAAAGGTGAGCGCGGTGAAAAAGGCGACAAAGGTGAAACCGGTGAA
CGCGGTGAAAAAGGCGAAGCTGGAATCCAAGGCCCACAAGGTGAAGCTGGTAAAGATGGCGCTCCAGGTAAAGATGGAGCTC
CAGGCGAAAAGGGTGAAAAAGGTGACCGCGGTGAAACCGGAGCTCAGGGTCCAGTAGGCCCACAAGGTGAAAAAGGTGAAAC
GGGCGCCCAAGGCCCAGCAGGCCCACAAGGTGAGGCAGGCAAACCAGGTGAGCAAGGCCCAGCAGGCCCACAAGGTGAAG
CAGGCCAACCAGGCGAAAAAGCTCCAGAAAAGAGCCCAGAAGGCGAAGCAGGCCAACCAGGCGAAAAAGCTCCAGAAAAGAG
CAAAGAGGTAACTCCAGCTGCAGAAAAACCTGCTGACAAAGAAGCTAACCAAACGCCAGAACGCCGCAATGGCAATATGGCTA
AGACACCTGTAGCCAACAACCACAGACGTCTACCAGCAACTGGTGAGCAAGCCAACCCATTCTTTACAGCAGCAGCAGTAGCA
GTGATGACAACAGCTGGTGTCCTAGCCGTTACAAAACGCAAAGAAAACAACTAA
SPy1991
Seq ID 81
ATGATACTCTTAATTGATAATTACGATTCATTTACCTACAACCTCGCCCAATATTTAAGTGAATTTGACGAGACGATTGTCTTGTAT
AACCAAGACCCAAACTTATATGACATGGCCAAAAAAGCTAACGCTCTAGTCCTCTCACCTGGTCCTGGTTGGCCCAAGGAAGCC
AACCAAATGCCAAAACTCATTCAAGACTTTTACCAAACAAAACCTATCTTAGGAGTGTGTCTGGGACACCAAGCTATCGCTGAAA
CTTTAGGGGGAACCTTACGCTTGGCCAAACGCGTCATGCATGGGAGACAAAGCACCATTGAAACGCAAGGCCCTGCTAGTCTT
TTTCGCTCCCTGCCACAAGAGATCACCGTCATGCGCTACCATTCCATCGTTGTGGATCAGTTACCAAAAGGTTTTAGCGTAACC
GCTAGAGACTGTGACGATCAAGAAATCATGGCATTTGAACACCACACCCTGCCACTTTTTGGGCTACAATTTCACCCAGAAAGC
ATCGGAACTCCTGATGGCATGACCATGATTGCCAACTTCATCGCAGCCATTCCCCGTTAA
SPy2000
Seq ID 82
GTGTCAAAATACCTAAAATACTTCTCTATTATCACGTTATTTTTGACTGGGCTTATTTTAGTTGCATGTCAACAACAAAAGCCTCAA
ACAAAAGAACGTCAGCGCAAACAACGTCCAAAAGACGAACTTGTCGTTTCTATGGGGGCAAAGCTCCCTCATGAATTCGATCCA
AAGGACCGTTATGGAGTCCACAATGAAGGGAATATCACTCATAGCACTCTATTGAAACGTTCTCCTGAACTAGATATAAAAGGAG
AGCTTGCTAAAACATACCATCTCTCTGAAGATGGGCTGACTTGGTCGTTTGACTTGCATGATGATTTTAAATTCTCAAATGGTGA
GCCTGTTACTGCTGATGATGTTAAGTTTACTTATGATATGTTGAAAGCAGATGGAAAGGCTTGGGATCTAACCTTCATTAAGAAC
GTTGAAGTAGTTGGGAAAAATCAGGTCAATATCCATTTGACTGAGGCGCATTCGACATTTACAGCACAGTTGACTGAAATCCCAA
TCGTCCCTAAAAAACATTACAATGATAAGTATAAGAGCAATCCTATCGGTTCAGGACCTTACATGGTAAAAGAATATAAGGCTGG
AGAACAAGCTATTTTTGTTCGTAACCCTTATTGGCATGGGAAAAAACCATACTTTAAAAAATGGACTTGGGTCTTACTTGATGAAA
ACACAGCACTAGCAGCTTTAGAATCTGGTGATGTTGATATGATCTACGCAACGCCAGAACTTGCTGATAAAAAAGTCAAAGGCA
CCCGCCTCCTTGATATTCCATCAAATGATGTGCGCGGCTTATCATTACCTTATGTGAAAAAGGGCGTCATCACTGATTCTCCTGA
TGGTTATCCTGTAGGAAATGATGTCACTAGTGATCCAGCAATCCGAAAAGCCTTGACTATTGGTTTAAATAGGCAAAAAGTTCTC
GATACGGTTTTAAATGGTTATGGTAAACCAGCTTATTCAATTATTGATAAAACACCATTTTGGAATCCAAAAACAGCCATTAAAGA
TAATAAAGTAGCTAAAGCTAAGCAATTATTGACAAAAGCGGGATGGAAAGAACAAGCAGACGGTAGCCGTAAAAAAGGTGACCT
TGATGCAGCGTTTGATCTGTACTACCCTACTAATGATCAATTGCGAGCGAACTTAGCCGTTGAAGTAGCAGAGCAAGCCAAGGC
CCTAGGGATTACTATTAAACTCAAAGCTAGTAACTGGGATGAAATGGCAACGAAGTCACATGACTCAGCCTTACTTTATGCCGG
AGGACGTCATCACGCGCAGCAATTTTATGAATCGCATCATCCAAGCCTAGCAGGGAAAGGTTGGACCAATATTACGTTTTATAA
CAATCCTACCGTGACTAAGTACCTTGACAAAGCAATGACATCTTCTGACCTTGATAAAGCTAACGAATATTGGAAGTTAGCGCAG
TGGGATGGCAAAACAGGTGCTTCTACTCTTGGAGATTTGCCAAATGTATGGTTGGTGAGCCTTAACCATACTTATATTGGTGATA
AACGTATCAATGTAGGTAAACAAGGCGTCCACAGTCATGGTCATGATTGGTCATTATTGACTAACATTGCCGAGTGGACTTGGG
ATGAATCAACTAAGTAA
SPy2006
Seq ID 83
GTGAAGAAAACATATGGTTATATCGGCTCAGTTGCTGCTATTTTACTAGCTACTCATATTGGAAGTTACCAACTTGGTAAGCATC
ATATGGGTTCAGCAACAAAGGACAATCAAATTGCCTATATTGATGATAGCAAAGGTAAGGCAAAAGCCCCTAAAACAAACAAAAC
GATGGATCAAATCAGTGCTGAAGAAGGCATCTCTGCTGAACAGATCGTAGTCAAAATTACTGACCAAGGCTATGTGACCTCACA
TGGTGACCATTATCATTTTTACAATGGGAAAGTTCCTTATGATGCGATTATTAGTGAAGAGTTGTTGATGACGGATCCTAATTACC
GTTTTAAACAATCAGACGTTATCAATGAAATCTTAGACGGTTACGTTATTAAAGTCAATGGCAACTATTATGTTTACCTCAAGCCA
GGTAGCAAGCGCAAAAACATTCGAACCAAACAACAAATTGCTGAGCAAGTAGCCAAAGGAACTAAAGAAGCTAAAGAAAAAGGT
TTAGCTCAAGTGGCCCATCTCAGTAAAGAAGAAGTTGCGGCAGTCAATGAAGCAAAAAGACAAGGACGCTATACTACAGACGAT
GGCTATATTTTTAGTCCGACAGATATCATTGATGATTTAGGAGATGCTTATTTAGTACCTCATGGTAATCACTATCATTATATTCCT
AAAAAGGATTTGTCTCCAAGTGAGCTAGCTGCTGCACAAGCCTACTGGAGTCAAAAACAAGGTCGAGGTGCTAGACCGTCTGAT
TACCGCCCGACACCAGCCCCAGCCCCAGGTCGTAGGAAAGCCCCAATTCCTGATGTGACGCCTAACCCTGGACAAGGTCATCA
GCCAGATAACGGTGGCTATCATCCAGCGCCTCCTAGGCCAAATGATGCGTCACAAAACAAACACCAAAGAGATGAGTTTAAAG
GAAAAACCTTTAAGGAACTTTTAGATCAACTACACCGTCTTGATTTGAAATACCGTCATGTGGAAGAAGATGGGTTGATTTTTGA
ACCGACTCAAGTGATCAAATCAAACGCTTTTGGGTATGTGGTGCCTCATGGAGATCATTATCATATTATCCCAAGAAGTCAGTTA
TCACCTCTTGAAATGGAATTAGCAGATCGATACTTAGCCGGCCAAACTGAGGACGATGACTCAGGTTCAGATCACTCAAAACCA
TCAGATAAAGAAGTGACACATACCTTTCTTGGTCATCGCATCAAAGCTTACGGAAAAGGCTTAGATGGTAAACCATATGATACGA
GTGATGCTTATGTTTTTAGTAAAGAATCCATTCATTCAGTGGATAAATCAGGAGTTACAGCTAAACACGGAGATCATTTCCACTAT
ATAGGATTTGGAGAACTTGAACAATATGAGTTGGATGAGGTCGCTAACTGGGTGAAAGCAAAAGGTCAAGCTGATGAGCTTGCT
GCTGCTTTGGATCAGGAACAAGGCAAAGAAAAACCACTCTTTGACACTAAAAAAGTGAGTCGCAAAGTAACAAAAGATGGTAAA
GTGGGCTATATGATGCCAAAAGATGGCAAGGACTATTTCTATGCTCGTGATCAACTTGATTTGACTCAGATTGCCTTTGCCGAAC
AAGAACTAATGCTTAAAGATAAGAAACATTACCGTTATGACATTGTTGACACAGGTATTGAGCCACGACTTGCTGTAGATGTGTC
AAGTCTGCCGATGCATGCTGGTAATGCTACTTACGATACTGGAAGTTCGTTTGTTATCCCTCATATTGATCATATCCATGTCGTT
CCGTATTCATGGTTGACGCGCGATCAGATTGCAACAATCAAGTATGTGATGCAACACCCCGAAGTTCGTCCGGATATATGGTCT
AAGCCAGGGCATGAAGAGTCAGGTTCGGTCATTCCAAATGTTACGCCTCTTGATAAACGTGCTGGTATGCCAAACTGGCAAATT
ATCCATTCTGCTGAAGAAGTTCAAAAAGCCCTAGCAGAAGGTCGTTTTGCAACACCAGACGGCTATATTTTCGATCCACGAGAT
GTTTTGGCCAAAGAAACTTTTGTATGGAAAGATGGCTCCTTTAGCATCCCAAGAGCAGATGGCAGTTCATTGAGAACCATTAATA
AATCTGATCTATCCCAAGCTGAGTGGCAACAAGCTCAAGAGTTATTGGCAAAGAAAAACGCTGGTGATGCTACTGATACGGATA
AACCCAAAGAAAAGCAACAGGCAGATAAGAGCAATGAAAACCAACAGCCAAGTGAAGCCAGTAAAGAAGAAGAAAAAGAATCA
GATGACTTTATAGACAGTTTACCAGACTATGGTCTAGATAGAGCAACCCTAGAAGATCATATCAATCAATTAGCACAAAAAGCTA
ATATCGATCCTAAGTATCTCATTTTCCAACCAGAAGGTGTCCAATTTTATAATAAAAATGGTGAATTGGTAACTTATGATATCAAG
ACACTTCAACAAATAAACCCTTAA
SPy2009
Seq ID 84
ATGCGTAGAGCAGAAAATAACAAACACAGCCGCTATTCCATTCGCAAACTGAGCGTTGGGGTAACGAGTATAGCAATTGCGAGT
CTCTTTTTAGGAAAGGTTGCCTATGCCGTAGATGGCATCCCTCCAATCTCTCTTACTCAAAAGACTACAGCCACTACATCAGAAA
ATTGGCATCATATTGATAAGGATGGCCTTATTCCTTTAGGTATAAGCTTAGAAGCTGCCAAAGAGGAATTTAAAAAAGAAGTAGA
AGAATCACGTTTATCTGAAGCACAAAAAGAAACGTATAAACAAAAAATTAAAACTGCACCAGACAAAGATAAGCTATTATTCACGT
ATCATAGTGAGTATATGACAGCCGTTAAGGATCTTCCAGCGTCTACTGAGTCTACTACTCAGCCAGTTGAGGCACCCGTGCAGG
AGACACAGGCATCAGCTTCAGATTCGATGGTGACAGGTGATTCAACATCAGTTACGACTGATTCTCCTGAGGAAACCCCATCTT
CGGAAAGTCCAGTGGCCCCAGCTTTATCTGAGGCTCCAGCTCAACCAGCTGAGAGTGAGGAACCTTCAGTAGCAGCATCTTCT
GAGGAAACCCCATCTCCATCAACTCCAGCGGCCCCAGAAACTCCTGAAGAACCAGCAGCTCCATCTCCATCACCTGAGAGTGA
GGAACCTTCAGTAGCAGCTCCTTCTGAGGAAACCCCATCTCCAGAAACTCCTGAAGAACCAGCAGCTCCATCTCAACCAGCTGA
GAGTGAAGAATCTTCAGTAGCAGCTACGACAAGCCCGTCTCCATCAACTCCAGCTGAATCAGAGACTCAGACGCCACCAGCTG
TTACTAAAGACTCTGATAAGCCATCTTCAGCAGCTGAAAAACCAGCAGCCTCTTCACTTGTTTCAGAACAAACCGTTCAACAACC
AACTTCAAAGAGATCTTCTGATAAAAAAGAAGAGCAAGAACAGTCTTACTCTCCAAATCGCTCATTGTCAAGACAGGTTAGGGCC
CATGAGTCAGGTAAGTACTTGCCTTCAACAGGTGAAAAAGCACAGCCACTCTTTATAGCTACTATGACTTTGATGTCTCTATTTG
GCAGTCTTTTAGTCACAAAACGCCAAAAAGAAACTAAAAAATAG
SPy2010
Seq ID 85
TTGCGTAAAAAACAAAAATTACCATTTGATAAACTTGCCATTGCGCTCATGTCTACGAGCATCTTGCTCAATGCACAATCAGACAT
TAAAGCAAATACTGTGACAGAAGACACTCCTGCTACCGAACAAGCTGTAGAAACCCCACAACCAACAGCGGTTTCTGAGGAAGC
ACCATCATCAAAGGAAACCAAAACCCCACAAACTCCTGATGACGCAGAAGAAACAATAGCAGATGACGCTAATGATCTAGCCCC
TCAAGCTCCTGCTAAAACTGCTGATACACCAGCAACCTCAAAAGCGACTATTAGGGATTTGAACGACCCTTCTCAGGTCAAAAC
CCTGCAGGAAAAAGCAGGCAAAGGAGCTGGGACTGTTGTTGCAGTGATTGATGCTGGTTTTGATAAAAATCATGAAGCGTGGC
GCTTAACAGACAAAACCAAAGCACGTTACCAATCAAAAGAAGATCTTGAAAAAGCTAAAAAAGAGCACGGTATTACCTATGGCG
AGTGGGTCAATGATAAGGTTGCTTATTACCACGACTATAGTAAAGATGGTAAAACCGCTGTCGATCAAGAGCACGGCACACACG
TGTCAGGGATCTTGTCAGGAAATGCTCCATCTGAAACGAAAGAACCTTACCGCCTAGAAGGTGCGATGCCTGAGGCTCAATTG
CTTTTGATGCGTGTCGAAATTGTAAATGGACTAGCAGACTATGCTCGTAACTACGCTCAAGCTATCATAGATGCTGTCAACTTGG
GAGCTAAGGTGATTAATATGAGCTTTGGTAATGCTGCACTAGCCTATGCCAACCTTCCAGACGAAACCAAAAAAGCCTTTGACTA
TGCCAAATCAAAAGGTGTTAGCATTGTGACCTCAGCTGGTAATGATAGTAGCTTTGGGGGCAAGACCCGTCTACCTCTAGCAGA
TCATCCTGATTATGGGGTGGTTGGGACACCTGCAGCGGCAGACTCAACATTGACAGTTGCTTCTTACAGCCCAGATAAACAGCT
CACTGAAACTGCTACGGTCAAAACAGCCGATCAGCAAGATAAAGAAATGCCTGTTCTTTCAACAAACCGTTTTGAGCCAAACAA
GGCTTACGACTATGCTTATGCTAATCGTGGGATGAAAGAGGATGATTTTAAGGATGTCAAAGGTAAGATTGCCCTTATTGAACGT
GGCGATATTGATTTCAAAGATAAGATTGCAAACGCTAAAAAAGCTGGTGCTGTAGGAGTCTTGATCTATGACAATCAGGACAAG
GGCTTCCCGATTGAATTGCCAAATGTTGATCAGATGCCTGCGGCCTTTATCAGTCGAAAAGATGGTCTCTTATTAAAAGAGAATC
CCCAAAAAACCATCACCTTCAATGCGACACCTAAGGTATTGCCAACAGCAAGTGGCACCAAACTAAGCCGCTTCTCAAGCTGGG
GTCTGACAGCTGACGGCAATATTAAGCCAGATATTGCAGCACCCGGCCAAGATATTTTGTCATCAGTGGCTAACAACAAGTATG
CCAAACTTTCTGGAACTAGTATGTCTGCGCCATTAGTAGCGGGTATCATGGGACTGTTGCAAAAGCAATATGAGACACAGTATC
CTGATATGACACCATCAGAGCGTCTTGATTTAGCTAAAAAAGTATTGATGAGCTCAGCAACTGCCTTATATGATGAAGATGAAAA
AGCTTATTTTTCTCCTCGCCAACAAGGAGCAGGAGCAGTCGATGCTAAAAAAGCTTCAGCAGCAACGATGTATGTGACAGATAA
GGATAATACCTCAAGCAAGGTTCACCTGAACAATGTTTCTGATAAATTTGAAGTAACAGTAACAGTTCACAACAAATCTGATAAAC
CTCAAGAGTTGTATTACCAAGCAACTGTTCAAACAGATAAAGTAGATGGAAAACTCTTTGCCTTGGCTCCTAAAGCATTGTATGA
GACATCATGGCAAAAAATCACAATTCCAGCCAATAGCAGCAAACAAGTCACCATTCCAATCGATGTTAGTCAATTTAGCAAGGAC
TTGCTTGCCCCAATGAAAAATGGCTATTTCTTAGAAGGTTTTGTTCGTTTCAAACAAGATCCTACAAAAGAAGAGCTTATGAGTAT
TCCCTATATTGGTTTCCGAGGTGATTTTGGCAATCTGTCAGCCTTAGAAAAACCAATCTATGATAGCAAAGACGGTAGCAGCTAC
TATCATGAAGCAAATAGTGATGCCAAAGACCAATTAGATGGTGATGGATTACAGTTTTACGCTCTGAAAAATAACTTTACAGCAC
TTACTACAGAGTCTAATCCATGGACGATTATTAAAGCTGTCAAAGAAGGGGTTGAAAACATAGAGGATATCGAATCTTCAGAGAT
CACAGAAACCATTTTTGCAGGTACTTTTGCAAAACAAGACGATGATAGCCACTACTATATCCACCGTCACGCTAATGGCAAGCCA
TATGCTGCGATCTCTCCAAATGGGGACGGTAACAGAGATTATGTCCAATTCCAAGGTACTTTCTTGCGTAATGCTAAAAACCTTG
TGGCTGAAGTCTTGGACAAAGAAGGAAATGTTGTTTGGACAAGTGAGGTAACCGAGCAAGTTGTTAAAAACTACAACAATGACT
TGGCAAGCACACTTGGTTCAACCCGTTTTGAAAAAACGCGTTGGGACGGTAAAGATAAAGACGGCAAAGTTGTTGCTAACGGAA
CATACACCTATCGTGTTCGCTACACTCCGATTAGCTCAGGTGCAAAAGAACAACACACTGATTTTGATGTGATTGTAGACAATAC
GACACCTGAAGTCGCAACATCGGCAACATTCTCAACAGAAGATCGTCGTTTGACACTTGCATCTAAACCAAAAACCAGCCAACC
GGTTTACCGTGAGCGTATTGCTTACACTTATATGGATGAGGATCTGCCAACAACAGAGTATATTTCTCCAAATGAAGATGGTACC
TTTACTCTTCCTGAAGAGGCTGAAACAATGGAAGGCGCTACTGTTCCATTGAAAATGTCAGACTTTACTTATGTTGTTGAAGATA
TGGCTGGTAACATCACTTATACACCAGTGACTAAGCTATTGGAAGGCCACTCTAATAAACCAGAACAAGACGGTTCAGATCAAG
CACCAGACAAAAAACCAGAAACTAAACCAGAACAAGACGGTTCAGGTCAAGCACCAGATAAAAAACCAGAAACTAAACCAGAAC
AAGACGGTTCAGGTCAAACACCAGACAAAAAACCAGAAACTAAACCAGAACAAGACGGTTCAGGTCAAACACCAGATAAAAAAC
CAGAAACTAAACCAGAAAAAGATAGTTCAGGTCAAACACCAGGTAAAACTCCTCAAAAAGGTCAACCTTCTCGTACTCTAGAGAA
ACGATCTTCTAAGCGTGCTTTAGCTACAAAAGCATCAACAAAAGATCAGTTACCAACGACTAATGACAAGGATACAAATCGTTTA
CATCTCCTTAAGTTAGTTATGACCACTTTCTTCTTGGGATTAGTAGCTCATATCTTTAAAACAAAACGCACTGAAGATTAG
SPy2016
Seq ID 86
ATGAATATTAGAAATAAGATTGAAAATAGTAAAACACTACTATTTACATCCCTTGTAGCCGTGGCTCTACTAGGAGCTACACAACC
AGTTTCAGCCGAAACGTATACATCACGCAATTTTGACTGGTCTGGAGATGACTGGTCTGGAGATGACTGGCCTGAAGATGACTG
GTCTGGAGATGGTTTGTCTAAATATGACCGGTCTGGAGTTGGTTTGTCTCAATATGGCTGGTCTAAATATGGCTGGTCTAGCGA
TAAAGAAGAATGGCCTGAAGATTGGCCTGAAGATGACTGGTCTAGCGATAAAAAAGATGAGACAGAAGATAAAACGAGACCACC
ATATGGAGAAGCATTAGGTACAGGGTATGAAAAACGTGATGATTGGGGAGGACCTGGTACGGTGGCAACTGACCCTTACACTC
CACCATATGGAGGAGCATTAGGTACAGGGTATGAAAAACGTGATGATTGGGGAGGACCTGGTACGGTGGCAACTGACCCTTAC
ACTCCACCATATGGAGGAGCATTAGGTACAGGGTATGAAAAACGTGATGATTGGAGAGGACCTGGACATATTCCTAAACCTGAG
AACGAACAATCACCAAACCCACTTCATATTCCTGAACCTCCTCAGATTGAGTGGCCTCAGTGGAATGGCTTTGATGGATTATCAT
TTGGCCCCTCTGATTGGGGCCAATCTGAGGACACCCCTCCAAGTGAACCTCGTGTGCCAGAAAAACCGCAACATACTCCTCAA
AAAAATCCACAAGAATCAGATTTTGATAGAGGGTTTTCAGCTGGCTTGAAAGCAAAAAACTCAGGTAGAGGTATTGATTTTGAAG
GTTTCCAGTATGGTGGCTGGTCAGACGAATATAAAAAAGGTTACATGCAAGCCTTCGGTACACCATATACACCATCAGCAACGT
AA
SPy2018
Seq ID 87
ATGGCTAAAAATAACACGAATAGACACTATTCGCTTAGAAAATTAAAAACAGGAACGGCTTCAGTAGCGGTAGCTTTGACTGTTT
TAGGGGCAGGTTTTGCGAATCAAACAGAGGTTAAGGCTAACGGTGATGGTAATCCTAGGGAAGTTATAGAAGATCTTGCAGCAA
ACAATCCCGCAATACAAAATATACGTTTACGTTACGAAAACAAGGACTTAAAAGCGAGATTAGAGAATGCAATGGAAGTTGCAG
GAAGAGATTTTAAGAGAGCTGAAGAACTTGAAAAAGCAAAACAAGCCTTAGAAGACCAGCGTAAAGATTTAGAAACTAAATTAAA
AGAACTACAACAAGACTATGACTTAGCAAAGGAATCAACAAGTTGGGATAGACAAAGACTTGAAAAAGAGTTAGAAGAGAAAAA
GGAAGCTCTTGAATTAGCGATAGACCAGGCAAGTCGGGACTACCATAGAGCTACCGCTTTAGAAAAAGAGTTAGAAGAGAAAAA
GAAAGCTCTTGAATTAGCGATAGACCAAGCGAGTCAGGACTATAATAGAGCTAACGTCTTAGAAAAAGAGTTAGAAACGATTACT
AGAGAACAAGAGATTAATCGTAATCTTTTAGGCAATGCAAAACTTGAACTTGATCAACTTTCATCTGAAAAAGAGCAGCTAACGA
TCGAAAAAGCAAAACTTGAGGAAGAAAAACAAATCTCAGACGCAAGTCGTCAAAGCCTTCGTCGTGACTTGGACGCATCACGTG
AAGCTAAGAAACAGGTTGAAAAAGATTTAGCAAACTTGACTGCTGAACTTGATAAGGTTAAAGAAGACAAACAAATCTCAGACGC
AAGCCGTCAAGGCCTTCGCCGTGACTTGGACGCATCACGTGAAGCTAAGAAACAGGTTGAAAAAGATTTAGCAAACTTGACTGC
TGAACTTGATAAGGTTAAAGAAGAAAAACAAATCTCAGACGCAAGCCGTCAAGGCCTTCGCCGTGACTTGGACGCATCACGTGA
AGCTAAGAAACAAGTTGAAAAAGCTTTAGAAGAAGCAAACAGCAAATTAGCTGCTCTTGAAAAACTTAACAAAGAGCTTGAAGAA
AGCAAGAAATTAACAGAAAAAGAAAAAGCTGAACTACAAGCAAAACTTGAAGCAGAAGCAAAAGCACTCAAAGAACAATTAGCG
AAACAAGCTGAAGAACTTGCAAAACTAAGAGCTGGAAAAGCATCAGACTCACAAACCCCTGATACAAAACCAGGAAACAAAGCT
GTTCCAGGTAAAGGTCAAGCACCACAAGCAGGTACAAAACCTAACCAAAACAAAGCACCAATGAAGGAAACTAAGAGACAGTTA
CCATCAACAGGTGAAACAGCTAACCCATTCTTCACAGCGGCAGCCCTTACTGTTATGGCAACAGCTGGAGTAGCAGCAGTTGTA
AAACGCAAAGAAGAAAACTAA
SPy2025
Seq ID 88
ATGAAGAAAAGGAAATTGTTAGCAGTAACACTATTAAGTACCATACTCTTAAACAGTGCAGTGCCATTAGTTGTTGCTGATACCT
CCTTGCGTAATAGCACATCATCCACTGATCAGCCTACTACAGCAGATACTGATACGGATGACGAGAGTGAAACACCAAAAAAAG
ACAAAAAAAGCAAGGAAACAGCGTCGCAGCACGACACCCAAAAAGACCATAAGCCATCACACACTCACCCAACCCCCCCTTCA
AATGATACTAAGCAGACCGATCAGGCATCATCTGAAGCTACTGACAAACCAAATAAAGACAAAAACGACACCAAGCAACCAGAC
AGCAGTGATCAATCCACCCCATCTCCCAAAGACCAGTCGTCTCAAAAAGAGTCACAAAACAAAGACGGCCGACCTACCCCATCA
CCTGATCAGCAAAAAGATCAGACACCTGATAAAACACCAGAAAAATCAGCTGATAAAACCCCTGAAAAAGGACCAGAAAAAGCA
ACTGATAAAACACCAGAGCCAAATCGTGACGCTCCAAAACCCATCCAACCTCCTTTAGCAGCTGCTCCTGTCTTTATACCTTGGA
GAGAAAGTGACAAAGACCTGAGCAAGCTAAAACCAAGCAGTCGCTCATCAGCGGCTTACGTGAGACACTGGACAGGTGACTCT
GCCTACACTCACAACCTGTTGTCACGCCGTTATGGGATTACTGCTGAACAGCTAGATGGTTTTTTGAACAGTCTAGGTATTCACT
ATGATAAAGAACGCTTAAACGGAAAGCGTTTATTAGAATGGGAAAAACTAACAGGACTAGACGTTCGAGCTATCGTAGCTATTG
CAATGGCAGAAAGCTCACTAGGTACTCAGGGAGTTGCTAAAGAAAAAGGAGCCAATATGTTTGGTTATGGCGCCTTTGACTTCA
ACCCAAACAATGCCAAAAAATACAGCGATGAGGTTGCTATTCGTCACATGGTAGAAGACACCATCATTGCCAACAAAAACCAAA
CCTTTGAAAGACAAGACCTCAAAGCAAAAAAATGGTCACTAGGCCAGTTGGATACCTTGATTGATGGTGGGGTTTACTTTACAG
ATACAAGTGGCAGTGGGCAAAGACGAGCAGATATCATGACCAAACTAGACCAATGGATAGATGATCATGGAAGCACACCTGAG
ATTCCAGAACATCTCAAGATAACTTCCGGGACACAATTTAGCGAAGTGCCCGTAGGTTATAAAAGAAGTCAGCCACAAAACGTTT
TGACCTACAAGTCAGAGACCTACAGCTTTGGCCAATGCACTTGGTACGCCTATAATCGTGTCAAAGAGCTAGGTTATCAAGTCG
ACAGGTACATGGGTAACGGTGGCGACTGGCAGCGCAAGCCAGGTTTTGTGACCACCCATAAACCTAAAGTGGGCTATGTCGTC
TCATTTGCACCAGGCCAAGCAGGAGCAGATGCAACCTATGGTCACGTTGCTGTTGTAGAGCAAATCAAAGAAGATGGTTCTATC
TTAATTTCAGAGTCAAATGTTATGGGACTAGGCACCATTTCCTATCGGACGTTCACAGCTGAGCAGGCTAGTTTGTTGACCTATG
TCGTAGGGGACAAACTCCCAAGACCATAA
SPy2039
Seq ID 89
ATGAATAAAAAGAAATTAGGTGTCAGATTATTAAGTCTTTTAGCATTAGGTGGATTTGTTCTTGCTAACCCAGTATTTGCCGATCA
AAACTTTGCTCGTAACGAAAAAGAAGCAAAAGATAGCGCTATCACATTTATCCAAAAATCAGCAGCTATCAAAGCAGGTGCACGA
AGCGCAGAAGATATTAAGCTTGACAAAGTTAACTTAGGTGGAGAACTTTCTGGCTCTAATATGTATGTTTACAATATTTCTACTGG
AGGATTTGTTATCGTTTCAGGAGATAAACGTTCTCCAGAAATTCTAGGATACTCTACCAGCGGATCATTTGACGCTAACGGTAAA
GAAAACATTGCTTCCTTCATGGAAAGTTATGTCGAACAAATCAAAGAAAACAAAAAATTAGACACTACTTATGCTGGTACCGCTG
AGATTAAACAACCAGTTGTTAAATCTCTCCTTGATTCAAAAGGCATTCATTACAATCAAGGTAACCCTTACAACCTATTGACACCT
GTTATTGAAAAAGTAAAACCAGGTGAACAATCTTTTGTAGGTCAACATGCAGCTACAGGATGTGTTGCTACTGCAACTGCTCAAA
TTATGAAATATCATAATTACCCTAACAAAGGGTTGAAAGACTACACTTACACACTAAGCTCAAATAACCCATATTTCAACCATCCT
AAGAACTTGTTTGCAGCTATCTCTACTAGACAATACAACTGGAACAACATCTTACCTACTTATAGCGGAAGAGAATCTAACGTTC
AAAAAATGGCGATTTCAGAATTGATGGCTGATGTTGGTATTTCAGTAGACATGGATTATGGTCCATCTAGTGGTTCTGCAGGTAG
CTCTCGTGTTCAAAGAGCCTTGAAAGAAAACTTTGGCTACAACCAATCTGTTCACCAAATCAACCGTGGCGACTTTAGCAAACAA
GATTGGGAAGCACAAATTGACAAAGAATTATCTCAAAACCAACCAGTATACTACCAAGGTGTCGGTAAAGTAGGCGGACATGCC
TTTGTTATCGATGGTGCTGACGGACGTAACTTCTACCATGTTAACTGGGGTTGGGGTGGAGTCTCTGACGGCTTCTTCCGTCTT
GACGCACTAAACCCTTCAGCTCTTGGTACTGGTGGCGGCGCAGGCGGCTTCAACGGTTACCAAAGTGCTGTTGTAGGCATCAA
ACCTTAG
SPy2043
Seq ID 90
ATGAATCTACTTGGATCAAGACGGGTTTTTTCTAAAAAATGTCGGCTAGTAAAATTTTCAATGGTAGCTCTTGTATCAGCCACAAT
GGCTGTAACAACAGTCACACTTGAAAATACTGCACTGGCACGACAAACACAGGTCTCAAATGATGTTGTTCTAAATGATGGCGC
AAGCAAGTACCTAAACGAAGCATTAGCTTGGACATTCAATGACAGTCCCAACTATTACAAAACCTTAGGTACTAGTCAGATCACT
CCAGCACTCTTTCCTAAAGCAGGAGATATTCTCTATAGCAAATTAGATGAGTTAGGAAGGACGCGTACTGCTAGAGGTACATTG
ACTTATGCCAATGTTGAAGGTAGCTACGGTGTTAGACAATCTTTCGGTAAAAATCAAAACCCCGCAGGCTGGACTGGAAACCCT
AATCATGTCAAATATAAAATTGAATGGTTAAATGGTCTATCTTATGTCGGAGATTTCTGGAATAGAAGTCATCTCATTGCAGATAG
TCTCGGTGGAGATGCACTCAGAGTCAATGCCGTTACAGGGACACGTACCCAAAATGTAGGAGGTCGTGACCAAAAAGGCGGCA
TGCGCTATACCGAACAAAGAGCTCAAGAATGGTTAGAAGCAAATCGTGATGGCTATCTTTATTATGAAGCTGCTCCAATCTATAA
CGCAGACGAGTTGATTCCAAGAGCTGTCGTGGTATCAATGCAATCTTCTGATAATACCATCAACGAGAAAGTATTAGTTTACAAC
ACAGCTAATGGCTACACCATTAACTACCATAAC GGTACACCTACTCAGAAATAA
SPy2059
Seq ID 91
ATGAGATTTCTAGAACTTTTACAAAAGAAATTTTTTCCTAAAGCATATCAGGAAAAACAATTCTTAATGCATCAAAAAACGCGTTTA
ACGCCACAACACAATCAAAAGCAGTATTCGCCAAATGCCAATCATTTGGACTCATCAGCTACCAAAAACTCAGAACAAGACCCT
GCAACAGCTCTGCAACGCAGTAGAGCCTACGAAGGAAGCCCTAAAAGTCGGCCCGCTTGGTTGCAAAAGCTGGAAGCTGTTTT
GCCGTCTCCTCAACGTCCAATTCGGCGTTTTTGGCGCCGCTATCACATCGGAAAACTGCTAATGATTCTGATTGGAACTCTTGT
CTTACTCTTAGGATCATACTTGTTTTACTTATCAAAAACAGCTAAAGTATCTGATTTACAAGATGCCTTGAAGGCTACAACGGTTA
TTTATGATCACAAAGGAGAGTATGCAGGCAGTTTATCTGGTCAAAAAGGGAGTTATGTTGAGCTCAACGCTATTTCAGATGATCT
TGAGAATGCTGTTATTGCCACTGAGGATAGGACTTTTTACAGTAATAGCGGTATTAATCTTAAACGCTTCTTATTGGCGGTAGTT
ACGGCGGGCCGCTTTGGAGGTGGCTCAACGATTACACAGCAACTGGCTAAAAATGCTTATCTCTCACAAGATCAGACAATTAAA
CGAAAGGCCCGAGAGTTTTTTTTGGCGTTAGAGTTGACCAAAAAATACAGTAAAAAAGATATTCTTACTATGTACCTTAACAACTC
CTACTTTGGAAATGGAGTTTGGGGAGTTGAAGATGCCAGTCAAAAATATTTTGGAACCACAGCTGCTAACTTAACACTGGATGAA
GCTGCCACATTAGCAGGTATGCTCAAAGGACCTGAAATATATAACCCTTACCATTCTCTAAAAAATGCTACTCACCGTAGAGATA
CTGTTTTAGGAGCGATGGTTGATGCCAAAAAGATTACCCAAACAAAAGCTCAGCAAGCTAGAGCAGTAGGGCTAAAAAATCGCT
TAGCTGATACTTATGTTGGTAAGACAGATGACTACAAATACCCATCCTACTTTGATGCTGTTATTAGTGAAGCAATAGCAACTTAT
GGTCTTTCAGAAAAAGACATTGTTAATAATGGATACAAAGTTTACACTGAGCTAGATCAAAATTACCAAACTGGCATGCAGACGA
CTTTTAACAACGATGAACTATTTCCTGTTTCAGCTTATGACGGTAGCTCTGCTCAAGCAGCTAGTGTTGCTTTAGATCCTAAAACA
GGAGGTGTTAGAGGTCTGATTGGTCGTGTGAATAGTAGTGAAAATCCGACTTTCAGAAGTTTTAACTATGCGACTCAAGCAAAA
CGTAGTCCCGCATCAACAATCAAACCACTCGTGGTTTACGCGCCAGCCGTTGCTTCAGGATGGTCAATTGAAAAAGAACTACCA
AATACCGTTCAAGATTTCGATGGCTATCAGCCACATAATTATGGAAATTATGAATCAGAAGATGTTCCTATGTATCAAGCATTAGC
AAACTCTTATAATATTCCAGCAGTTTCTACATTGAACGATATCGGAATCGATAAAGCCTTTACCTATGGTAAAACATTTGGGTTAG
ATATGAGCTCTGCCAAAAAAGAGTTGGGGGTAGCTTTAGGTGGCAGCGTGACAACCAATCCATTGGAGATGGCTCAGGCATAT
GCTGCCTTTGCCAATAATGGAGTAATCCATCCTGCGCACTTGATTAACCGGATTGAAAATGCCAGGGGTGAAGTGCTTAAAACC
TTTACTGATAAGGCTAAACGTGTTGTCAGCCAGTCTGTTGCAGATAAGATGACAGCCATGATGCTAGGTACCTTTTCAAATGGAA
CAGCAGTCAATGCTAACGTATATGGCTATACACTAGCTGGTAAAACAGGGACGACAGAAACCAACTTCAATCCCGACTTAGCAG
GCGATCAGTGGGTTATTGGTTATACGCCAGATGTTGTTATTAGTCAATGGGTAGGATTTAATCAGACCGATGAAAATCATTATCT
AACGGATTCAAGTGCAGGCACGGCCTCAGCTATTTTTAGCACTCAGGCATCTTACATTTTGCCTTATACCAAGGGCAGCCAATTT
CATGTAGATAATGCCTACGCTCAAAATGGTATTTCAGCTGTTTATGGAGTCAATGAAACAGGTAATCAATCAGGAGTTGATACTC
AATCTATTATTGATGGTTTAAGAAAATCAGCACAAGAAGCTTCGCAATCACTATCAAAAGCAGTCGATCAGTCAGGGTTACGTGA
TAAAGCCCAATCTATTTGGAAAGAGATTGTTGACTATTTTAGATAG
SPy2110
Seq ID 92
ATGGTAAGTTTAGAAGAAGACAAGGTGACTGTTCAACCTGATATTAAAGTGATTAAACGAGATGGTCGCCTTGTTAATTTTGATA
GTACAAAAATCTATAGTGCTTTATTAAAAGCAAGCATGAAAGTAACTCGGATGTCGCCACTTGTTGAGGCTAAATTAGAGGCTAT
TTCTGATCGCATTATAGCAGAAATTATTGAGCGTTTTCCAACTAATATCAAAATTTATGAAATCCAAAATATTGTAGAGCATAAGCT
TCTTGCAGCTAATGAATATGCTATTGCAAAAGAATACATTAATTATCGTACTCAGCGTGACTTTGCACGTTCACAAGCAACAGATA
TCAATTTTTCTATTGATAAATTAATTAATAAAGATCAAACAGTTGTTAATGAAAATGCTAACAAAGATAGCGATGTTTTTAATACTC
AACGAGATTTAACTGCTGGAATCGTAGGGAAATCGATTGGTTTAAAAATGTTACCTTCGCATGTTGCTAATGCTCATCAAAAAGG
AGATATCCATTACCATGATTTGGATTACAGTCCTTATACACCGATGACGAACTGCTGTTTAATTGACTTTAAGGGCATGTTAGCC
AATGGCTTTAAAATTGGTAATGCTGAAGTGGAAAGTCCCAAGTCTATTCAAACTGCAACAGCTCAGATCTCACAGATTATTGCGA
ATGTAGCATCAAGTCAGTACGGCGGATGCACAGCTGATCGCATTGACGAGTTTTTAGCCCCATATGCGGAGCTTAACTTTAAAA
AACATATGGCTGATGCTAAGAAATGGATCGTTGAGACTAAGAGAGAAAGCTATGCTTTTGAAAAGACTCAAAAAGATATTTATGA
TGCGATGCAGTCTTTGGAGTATGAAATTAATACGCTCTTTACGTCTAATGGTCAAACACCATTTACTTCTTTAGGATTTGGTTTGG
GGACGTCTTGGTTTGAACGTGAGATTCAAAAAGCTATTTTGACCATTCGGATTAATGGTCTTGGTAGTGAACATCGCACGGCTAT
TTTCCCTAAATTAATTTTCACGGTTAAACGTGGCTTGAATTTAGAACCAGATTCACCAAACTATGATATTAAGACTTTGGCTTTAG
AATGTGCGACTAAGCGGATGTACCCGGATATGTTATCTTATGATAAAATTATTGATTTGACAGGATCTTTCAAATCTCCAATGGG
ATGCCGCTCTTTCCTTCAAGGCTGGAAAGATGAAAATGGGCAAGATGTGACCTCAGGCCGTATGAATCTTGGGGTTGTCACCCT
CAATTTACCTCGCATTGCCATGGAATCAAATGGCGATATGGATAAGTTTTGGGAGCTGTTTAATGAGAGGATGCTAATTAGTAAG
GATGCTTTAATTTATCGTGTCGAACGTGTCACAGAAGCAAAACCAGCAAATGCTCCTATTCTTTATCAATATGGTGCTTTTGGAAA
GCGTTTGGAGAAGACAGGGAATGTAAATGATCTCTTTAAGAATCGTCGTGCAACAGTCTCTCTTGGCTATATTGGTCTTTATGAA
GTGGCGTCTGTTTTTTATGGTGGTCAATGGGAAGGTAATCCAGATGCTAAAGCTTTTACCTTGTCAATTGTCAAGGCAATGAAAC
AGGCCTGTGAGGATTGGTCAGATGAATATGGTTATCATTTCTCTGTTTATTCGACTCCATCAGAAAGTTTGACAGATCGCTTTTG
TCGTTTAGATACGGAAAAATTTGGCATTGTGACAGATATTACGGATAAAGAATACTATACAAATTCTTTTCACTATGATGTGCGTA
AGAGTCCGACACCTTTTGAAAAATTAGATTTTGAAAAAGATTATCCAGAAGCAGGTGCTTCAGGTGGTTTTATCCACTACTGTGA
GTATCCTGTTTTGCAACAAAATCCAAAGGCCTTGGAAGCGGTTTGGGACTATGCTTATGATCGTGTGGGGTATTTGGGAACCAA
TACGCCTATTGATAAATGCTATAATTGCCAATTTGAAGGCGATTTTACCCCAACAGAACGTGGTTTTACTTGCCCAAACTGTGGC
AATAATGACCCTAAAACAGTTGATGTGGTCAAACGTACATGTGGTTACTTGGGGAATCCTCAGGCCCGCCCAATGGTTAACGGT
CGCCATAAGGAAATCTCTGCGCGTGTAAAACATATGAATGGTTCTACTATAAAATACCCAGGCCTGTAA
SPy2127
Seq ID 93
ATGAGGAGGAATTACAGTAGAGTCATTGACGAACTGCGTACTGACTACGGGCTGAATTTAGTTGCTATTGGTCAACGTTTGGGT
ACCGACCCCCGAACAGTTGGTAAATGGTGGCAGGGTAAACATAACCCGAACCAAGAAAGCAGAAAGAAACTGAATAGGCTATA
TAGAGAGGTGAAAGAAACTATGATGACACAAGTAAATATTTTTGAAGAAGCTAATGACAACACAAAGCAGGTTATGCAAGTTATT
ACAACGACAAATTTTCATGGACAACCTTTAGACATTTACGGTGATATTCAGGAGCCTTTATTTTTGGCTAGGGCAGTCGCTGAAA
TGATTGATTACACAAAAACTAGCCAAGGGTACTATGACGTACAAGCTATGCTAAGAAAAGTAGATGAGGATGAAAAGCTTAAAG
GAATGGCTTTAGAAGGTACTACGAAAAATTTTCGTAGTGGTCAAAAAGTTTGGTTTTTAACTGAGCATGGACTTTATGAAGTGCT
TATGCGTTCAAACAAACCAAAAGCCAAAGAGTTTAGAAAAGCAGTCAAAAACATTCTAAAAGAAATCCGCTTGAATGGCTATTAC
ATGCAAGGCGAATTGGTGCAAGAACTAGCTCAACCAAGCACCCAAAAACTACCAGGTATAAGTGACCTAACTTATATACTAAATA
AGCTAGCTGATTTAGTTGATATGGATAATCTAGCTGATATTTCAAATGGGATTGACCGAGTTCAGCAACTAGTGAAGCTGATCAG
CTTGTAG
SPy2191
Seq ID 94
ATGTTTAAGAAAGAAAATTTAAAACAACGTTATTTTAATTTTGGATTAGTAGCGTTAGCTCTAACAATATTAGCCATCATTTTTGCC
TTCTCAAGTAAAAATGCTGATACTAAGTCTTATGCTAAGAAGTCAGAAAGTAAAATGGTAACAATCGACAAGGCTCCAAAAAATA
ATCATGCTATTACTAAAGAAGAAAGCAAAGAAAAAGCAAAGAGCATTGCTTCGGAGCCTATTCCCACAGTAGAAAACTCTGTAGC
TCCGACAGTAACAGAGGAAGTACCGGTTGTTCAGCAAGAAGTGACTCAAACTGTTCAGCAGGTATCTTCAGTAGCCTATAATCC
AAACAATGTGGTACTTTCCAATGGAAATACTGCTGGTATTGTAGGAAGTCAAGCGGCGGCACAGATGGCAGCAGCAACAGGTG
TTCCACAATCAACTTGGGAACATATAATTGCGCGTGAATCTAATGGAAATCCTAACGCAGCTAATGCTTCTGGGGCATCAGGGT
TGTTCCAGACAATGCCAGGTTGGGGTTCTACAGCAACGGTTGAAGATCAAGTCAATGCAGCCTTGAAAGCCTATAGTGCACAAG
GTTTATCAGCTTGGGGTTACTAA
SPy2211
Seq ID 95
ATGAAAAATAATAATAAATGGATAATTGCTGGACTTGCTAGTTTTTTGTTCCCTCTTAGTATTATATTTATCATCCTTCTATCGATG
GGCATTTATTATAATAGTGATAAAACAATTCTAGCTAGTGATGCTTTTCATCAGTATGTTATTTTTGCGCAGAACTTTCGTAACATC
ATGCACGGTTCTGATAGTTTTTTTTATACCTTTACAAGCGGACTAGGGATAAATTTTTATGCTTTAATGTGTTATTATCTTGGCAGT
TTCTTTTCTCCATTACTTTTCTTTTTTAATTTAACCTCTATGCCAGATGCTATCTATTTGTTTACCTTGATAAAATTTGGGTTAATAG
GATTAGCTGCATGCTATTCTTTTCATAGATTATATCCAAAAATCAGTGCTTTCTTGATGATTTCCATCTCAGTTTTTTATAGCTTAA
TGAGCTTCTTGACAAGTCAAATGGAACTAAATTC TTGGTTAGATGTTTTCATTCTTCTTCCACTTGTTATACTTGGATTAAATAAAC
TTATCACAGAAAATAAAACCAGAACTTATTATCTTTCGATATCATTATTATTCATTCAAAATTACTACTTTGGCTACATGATTGCTCT
TTTTTGTATTCTTTACGCCTTAGTTTGTCTTTTACGTCTCAATGATTTTAACAAAATGTTTATCGCTTTTGTTAGGTTTACAGCTGT
GTCAATATGTGCTGCTTTAACAAGTGCTCTAGTAATACTTCCTACCTATCTAGATTTGTCAACTTATGGAGAGAATCTATCCCCGA
TAAAACAGTTAGTTACGAACAATGCTTGGTTTTTGGATATACCTGCTAAGCTCTCAATAGGAGTGTACGATACTACCAAGTTTAAT
GCTCTGCCTATGATTTACGTAGGATTATTTCCCCTAATGCTTAGTGTTATTTATTTTACTTTAGAAAGTATCCCTTTAAAAATAAAA
TTAGCCAATGCCTGCTTGTTAACTTTTATTATAATAAGTTTTTACCTACAGCCACTTGATCTTTTTTGGCAGGGGATGCACTCACC
AAATATGTTTTTGCATCGCTACGCTTGGTCTTTTTCCATAGTTATCCTATTACTCGCATGTGAGACTCTCTCTCGACTAAAAGAAG
TGACTCAAATAAAAGCAGGTTTTGCTTTTATTTTCCTCATTATACTGACATCTCTTCCTTATAGCTTTTCTCAACAATATAATTTTCT
ACCTTTAACTCTTTTTTTACTTAGTGTTTTTTTATTATTAGGTTATACTATTTCACTATTTTCGTTTAGAAATTCTCAAATCCCATCTA
CTTTTATTTCTGCTTTCATACTTATCTTTAGCCTTCTTGAATCAGGGTTAAACACCTACTACCAGCTTCAAGGAATTAATAAGGAG
TGGGGATTCCCATCACGACAGATATATAATAGTCAATTAAAGGATATTAACAACCTTGTCAACTCTGTGTCAAAAAATAGTCAACC
TTTTTTTAGAATGGAAAGGCTACTTCCCCAAACAGGGAACGATAGCATGAAATTTAATTATTACGGCATTTCACAATTTTCCTCTG
TAAGAAATAGACTATCTAGTTCTTTATTGGATCGATTGGGATTTCAGTCTAAAGGCACAAATTTAAACCTTAGATACCAAAACAAT
ACTATTATTATGGACAGTCTACTTGGTATAAAATATAATCTTAGCGAAGGACCTCCAAATAAATTTGGATTTACAAAACTAAAAACT
AGCGGGAATACTACTCTTTATCAAAATCACTATAGTAGCCCTTTAGCTATATTAACACGTAATGTTTACAAAGATGTCAACCTAAA
TGTCAATACCCTTGATAACCAAACCAAATTACTTAACCAACTAAGTGGGAAATCTTTAACCTATTTTAACTTACAGCCAGCTCAAC
TTATTTCTGGTGCTAATCAATTTAACGGACAAATATCTGCACAAGCTTCTGATTATCAAAACTCCGTTACCCTTAATTATCAAATTA
ACATCCCTAAACATAGTCAACTCTATGTTAGCATACCCAATATTATATTTTCAAATCCTGATGCTAAAGAGATGCGTATTCAGACA
GATAATCATAATTTCATATATACTACAGATAACGCTTACTCTTTTTTTGATTTAGGATATTTCGCCGATGCCAAAGTTGCTACATTT
TCGTTTGTTTTTCCAAAAAATAAACAAATTAGTTTTAAGGAACCTCATTTTTATAGTTTGTCTATTGAATCTTACCTTGAAGCAATG
AATAGCATTAAACAAAAAAATGTTCATACTTACGCTAAAAGTAATACGGTAATCACTGATTATAATTCAAAAACGAAAGGTTCTCTT
ATTTTTACACTTCCTTACGATAAAGGTTGGTCAGCACAAAAAGATGGGAAAAATCTTCCAGTCAAAAAAGCACAAGGAGGATTTC
TATCAGTTACTATTCCTAAAGGAAAGGGACGTGTTATCCTTACCTTTATTCCTAATGGTTTTAAATTAGGGTTATCTCTATCTTGTG
TAGGAATTATCGCTTATATGCTTTTGTATAAGTACATAGATATAAAGTCTAAATTACTTTAG
ARF0450
Seq ID 96
ttttccagatttctgcccacacggagggactattcctcgctatggtcagcctcttgtcgaaatgaacactacaactctcaacaccatcacggagttgggacggtttcgtctaagcagaatccac
gaccactt
ARF0569
Seq ID 97
tcgtttatttgggaaaaaagaaaccccgaaggtagc
ARF0694
Seq ID 98
aaggtgaggaaaagacagaagttacaaaagagaagcttttggaattggctagatggattaaagacatctcagacgataccgacgaaaagacagaagatgaggcgtactgtgacgga
gatggaacagaagaaacaacccgttg
ARF0700
Seq ID 99
ctttaccagaagaagcgattaaaaaaatcacagaggctatcaaagttgatgacatcccgtctattaaacaaagctttgatgacctcaaaaatagag
ARF1007
Seq ID 100
tttgttctacaaaaatattccttatggcaa
ARF1145
Seq ID 101
ccaataagtatgcagaaggctatccaggtaatcgctattatggtggaacagaatgtgtggatattgtcgaaacgcttgctattgaacgtgctaagaaacttttcggtgccgcatttgccaatgtt
caagcccattccggaagtcaagccaatgcagcagcttatatggcct
ARF1208
Seq ID 102
tttcggaacatcttttgtgactttagttgctgttcctcttttgtatcctgttatcaaaaacttaaaagaaaaggttacaatcggacaagcaaaaagaggtttttg
ARF1262
Seq ID 103
tgggttactgggtgtaaatggtggtttttttgc
ARF1294
Seq ID 104
ctaatgctgaaagccaagaaaaccaattcaaaactcgtaacattgtcccagccaacaaagaagttcaatcttcagaagctgttcaatcaaacgaacttgctaaaaccgttatcactatgggt
tcttcttcagactacactgtcg
ARF1316
Seq ID 105
ccccgaaatggttggggacgttttgaacgttatgaaagacttggcagaacaaggcatgaccatgttaattgttactcacgaaatgggatttgctcgccaagtagc
ARF1352
Seq ID 106
ttgatgaactgcccatcattgcacttcttgcaacccaagcacaaggaacaacctgtattaaagatgctcaagaattacgagtcaaagaaacagatcgtattcaag
ARF1481
Seq ID 107
aaaacaacgaagtgtaactacctcaaacgtcccaagctggtcgaatccagactacaaagaaccagatttagaagaatttgctctaggaagcatggacggtatagaagatggatcagga
gatttttaatttttttaacaaacaaatcaaaaaagattttggtaaaacggcgagtaaagagacttttgctaagtttgctagttactgcgccgaaggaatcgaaaaaaatggagttaagccaatttt
taattgga
ARF1557
Seq ID 108
ggcagaagactaccaccaagattacctcaagaaaaatccaaatggctactgccatat
ARF1629
Seq ID 109
ttttggtcgccaggaagcagatattttgttagggacgcaaatgattgccaaaggactggattttccaaatgtgactttagttggggtactaaatgcagatacttccttaaatttgccggattttcgag
cgtcagaaaaaacgtttcaattgttaacacaggttgctggtcgggcaggccgtgccca
ARF1654
Seq ID 110
tgcgtgccatcggtgaaatgctctattatgatccagatcaacacacctttatcaattttatttccaaatacattggtccaggctggggttatttttcgggtctatcctattggatttcccttatttttattgga
atggcagaaatcacagcag
ARF2027
Seq ID 111
tctgattattttagacatcatgctcccttccttaagtggcttagaagtgctaaaaacaattcgaaagacatcagatgtccctattattatgctaacggcattaga
ARF2093
Seq ID 112
ttactgctgctgaagcagacatcaaagctgaacttgctgctgaaggcaaaccagaaaagatctgggacaaaatcatcccaggtaaaatggaccgcttcatgcttgacaacactaaagttg
accaagcttacactcttcttgcacaagtttacatcatggacgacagcaaaactgttgaagcttaccttgactcag
ARF2207
Seq ID 113
cacctattcgtgaaagacgtttggagtacgctaaagatatgggagaggtgttccgtatgttacaagaaggtagtcaaaaagcaagaactgtggcagccaagactttatcagaag
CRF0038
Seq ID 114
ctgtacgctccacaatctctgtcaaatccttttcttgatagtattccatgtgaccag
CRF0122
Seq ID 115
aacagacgtgacttccttgacaatgtggtaaatcttatcagggtcacggagccacttggcaccagcctcgtttttgacaactttattaacagggcagcccatattaatatcaacaatatcggcct
tggtattggtttgaatgaaatcagctgcacgtttcaacccttctgcgtcaccaccaaa
CRF0406
Seq ID 116
caagcaccacttgacgatcaccataacaagccaacatattggtcagggtatctt
CRF0416
Seq ID 117
tattttctcaagaaaacacctttgaaggctgcaaaatcttggttgttgtcaccatttggagaaatggctaagacagggtttccttgggcatttttttctaagataaatttgccatctgcatttttaaaggt
gccaagtgtgtgtagaccattgtcagaaatcgttttggttgacacattggtctctgaccaagagtgacaagtcctgtaaagtgtttaccgaca
CRF0507
Seq ID 118
agcaaaaacaaaaggaacaccgataccggttgtaataacggtaaaggcagcaaaagcgtttcccataatcatagtaaaaataaccatgccaagcacataagcgagaacgccaaag
aagcggctatcagcaggtacaatctcccgaatgagagaagcaatcacatcaccaacaccagcagctgcaaaaatagctcc
CRF0549
Seq ID 119
ctttttatacatcgatcgcgtttgatattggattttctcgtaatcaatttttccttgtttgtccaaatttacgatgattttttgaatggt
CRF0569
Seq ID 120
tcgtttatttgggaaaaaagaaaccccgaaggtagc
CRF0628
Seq ID 121
atcaaacatttgacccaagcaaaacaacggatgccagtatctaaggttctagtagctaaccccttagggtctaaaggaatagctgattcaatccaattgaggatgaaacctttagctgttaag
agataccgttcatctctttcaacaagg
CRF0727
Seq ID 122
ccgcctccaccaaatttaccacctgcgtgtaagactgtaaaaactgtttcaacggcgggacgtcctgtcttggcttggatatcaactggaattccacggccatcatctactactgtaatggaatt
atctgcttcaataaagactttaata
CRF0742
Seq ID 123
gaaaacgagttcaatcagtactatcaagacgcaaaatacaagtcccataaagaacgtcttactatcaatactttcaagagacaaggttatttgagg
CRF0784
Seq ID 124
acaagggtagccccatattttccacaagccttggcaatattttctgagcctgttacattaatagcctcattcaaggcttttccttcgtcttctgctgcatcaactgccgta
CRF0854
Seq ID 125
tcaccttttacaaaatcagttttaacgccttctgcactcaaactttcttcgataaaacgtcctgtaaaaccacccaagaaccctgtcgccgtgcctagcaatgtctaaacgttgcaagatgcgact
cacattaatgcctttacctccagcaaacttatcatcactcgccatgcgattcactgacccaagatttatttggtcaattctgacaataaagtcaatagaagggtttaaggtcacggta
CRF0875
Seq ID 126
gatcacaatatttattggcattatcaactaaaattgtcacaagttcaaacaatgacttttcctccgctt
CRF0907
Seq ID 127
ccaaatctgctggaccattttctgccaaataacccgcatcaaaaccataaagcaaagctggat
CRF0979
Seq ID 128
caatgtctcataattatcaataatatcaattttcgccataataaaaacactccttcgtgtatcttgaaaagagcgtctctacatgatataatatttcatgcagaaacacttctgtgg
CRF1068
Seq ID 129
gaaaaactcttcagaacggcgcggcaacggtacaacttcaagtgggtttccaaaaagcaaatcatgggtctggtgcttatcgtttttttgaagtcccgcaacaggaatagtgagtccaagttg
tttttctatcacatctttggccacattgacttgtccaacgcctccatcaacaataatcaagttaggagcttgcagtccctcctttttcacccgactgtaccttcgaaaaagcacttctctcatactggc
ataatcatctggtcccaccactgttttaatcttaaatttacgataatctttcttactaggtttgccatcaacaaaaacaaccatagccgcaactggacttgtcccttgaatgttagaattatcaaagg
cttcaatgcgcacaggcttgtcaatcctaag
CRF1152
Seq ID 130
gataactgtcgcggatgcctctcgacgaatctcgataacaaaacgcactccttcacggctagattcgtcacgaactgctgtaataccttc
CRF1203
Seq ID 131
ataggttccataaaccaactagtgagcttcgctttagtaacaatggatgaggtaaaaacattatttaaaaccctaataactcctacttttgaggaatgc
CRF1225
Seq ID 132
taccaagtgtgtcagctgcctgagggtgttccccaactgatcgtaaacgcagaccaaacctggttttataaagcaaaaaccaagcaaagaacgaaaaagcaatggcgaagtaaccaa
CRF1236
Seq ID 133
atacttgctaaaatagaaattagccaaaaaacactcataactataataataatgcgctca
CRF1362
Seq ID 134
tttccagatgtcaatgataaggtcattgcgcgtgatagtcggtttttcggtaaagagagaacctgccttttgagcaatcgcttctgggaagtcggtgacaaaaaagttgagaccaaccccaata
atgacatcggtgat
CRF1524
Seq ID 135
aaattcaatgttacgcttttgccactctgtcaaaacgagcttgtcatcactttgtttctctttatcttttgccatttacttctccttaatcgcggagctaatatcagctctcaaaaggtcataaaagaagtc
cgg
CRF1525
Seq ID 136
gagacctctgctttgttagcagctcgcttcatacgctctgcggattctcccaaaataatcatctgcttaagtcctaaaaggtctggcaccaaatcgtcaaattcattgccacgatctagaccgcc
agcaatcaaaatcaagcgactgttatcaaaacctgataaagctttt
CRF1527
Seq ID 137
aagagactggatgattgcaccctgatattcttctggtgtatcaatttgaacacgctcaaacggttcacatttgacaccatcaatttctttgatgataacttctggacg
CRF1588
Seq ID 138
gaatggctaagtcagcaacactctcatcaatttttacatgataagcgaagctatctggataccgcatttgataaaggtaaatgtacttttcacaaaaagccagttcttcttttaaggtggtcatctta
tcttggc
CRF1649
Seq ID 139
catgaccatttgtcacatcaacaatcgttgaagcaacttggaaatcttggtctggatagtaaacataatcaccagaatgataaatattataaagagtctgctgcgcatcgggga
CRF1749
Seq ID 140
gtcatgttaaaagcaccggtcaaattgattttcaagacgcgctcaaaatcctcttccgtcattttaagcatcaatttatcattagtaatgccagcattgttaactaaaacatcaatcgaacctaaac
tttcgatagcttcattgaccatacgtttagcttctgatgcttctgaaacatccccagagatggtaacaactgtaacgccg
CRF1903
Seq ID 141
agggaattatccagatttagtagctctgcaatcctgctaaaaccactagttaaggtgcctcctaataggacaatggcacctcctaatcctccagctgctccacttcctggtattgtctgtaaatca
atggttgtttggcaaaaaacttttttagcaaagttacttgcaatt
CRF1964
Seq ID 142
gagcactttcaaccaaatcaccaaattgggcaaaaatggaaaaaagagcgaccaaaaccaacatggtcaaaaagtgatgtggcgcataaacagacctatcaatcacca
CRF2055
Seq ID 143
aaatcaaggtctttaaggacttcttcgatcacctcgtccacggttttttcctctccaactattttagtattaagcccatcacttgttaacatctgctcaggcgctttttgttgggattcgggattggcaca
ccatggacatctcaaggggcaaccttttaaaaaaacggttgtccgaataccaggaccgtca
CRF2091
Seq ID 144
cgaaatgaaatcaacacttcctctcctacgctttcttctaccaaaata
CRF2096
Seq ID 145
tgctccttagcagcttttaccaaattttcaaaatcagccattgttccaaaatcagggttgaccgccgta
CRF2104
Seq ID 146
gaggccatgtcttgccagcgttgctgttcttttttagctgactcttctttgatacgatatgatttggccaagtcctccgtggtcatagctgccatgatttttaaaatggcttggctgtcttgtggaaggag
gtgtggg
CRF2116
Seq ID 147
aatttcaaagctcgaccacctggtgttgtttcaggatttccaaacatcacaccaactttttcacgcaattggttaataaagatagcgatagtttttgttttattaatagaagctgataatttacgcatg
gcc
CRF2153
Seq ID 148
aaagagacctgccactacagccaccaacatcatgtcattttccaagccaagttcgataggaactttttgccacatccagataaaagcggacatcagaactgttccatagatggt
NRF0001
Seq ID 149
attaccctgttgaccaagcaaacgcagcaactgttcaggaagcccagtctttcaaacaatctgttgaagcatctcttggtaaagagaatgtcattgtcaatgttcttgaaacag
aaacatcaactcacgaagcccaaggcttctatgctgagaccccagaacaacaagactacgatatcatttcatcatggtggggaccagactatcaagatccacggacctac
cttgacatca
NRF0003
Seq ID 150
tcgggaagacaggattcgaacctgcgacaccttggtcccaaaccaagtactctaccaagc
SPy0012
Seq ID 151
MRKLLAAMLMTFFLTPLPVISTEKKLIFSKNAVYQLKQDVVQSTQFYNQIPSNPNLYQETCAYKDSDLTLPAGRLGVNQPLLIKSLVLNK
ESLPVFELADGTYVEANRQLIYDDIVLNQVDIDSYFWTQKKLRLYSAPYVLGTQTIPSSFLFAQKVHATQMAQTNHGTYYLIDDKGWA
SQEDLVQFDNRMLKVQEMLLQKYNNPNYSIFVKQLNTQTSAGINADKKMYAASISKLAPLYIVQKQLQKKKLAENKTLTYTKDVNHFY
GDYDPLGSGKISKIADNKDYRVEDLLKAVAQQSDNVATNILGYYLCHQYDKAFRSEIKALSGIDWDMEQRLLTSRSAANMMEAIYHQK
GQIISYLSNTEFDQQRITKNITVPVAHKIGDAYDYKHDVAIVYGNTPFILSIFTNKSTYEDITAIADDVYGILK
SPy0019
Seq ID 152
MKKRILSAVLVSGVTLGAATTVGAEDLSTKIAKQDSIISNLTTEQKAAQNQVSALQAQVSSLQSEQDKLTARNTELEALSKRFEQEIKAL
TSQIVARNEKLKNQARSAYKNNETSGYINALLNSKSISDVVNRLVAINRAVSANAKLLEQQKADKVSLEEKQAANQTAINTIAANMAMA
EENQNTLRTQQANLVAATANLALQLASATEDKANLVAQKEAAEKAAAEALAQEQAAKVKAQEQAAQQAASVEAAKSAITPAPQATPA
AQSSNAIEPAALTAPAAPSAGPQTSYDSSNTYPVGQCTWGAKSLAPWAGNNWGNGGQWAYSAQAAGYRTGSTPMVGAIAVWND
GGYGHVAVVVEVQSASSIRVMESNYSGRQYIADHRGWFNPTGVTFIYPH
SPy0025
Seq ID 153
MSSYFPVAPLSDLVSYMNKRIFVEKKADFGIKSASLVKELTHNLQLTSLKALRIVQVYDVFNLAEDLLARAEKHIFSEQVTDCLLTETEIT
AELDKVAFFAIEALPGQFDQRAASSQEALLLFGSDSQVKVNTAQLYLVNKDITEAELEAVKNYLLNPVDSRFKDITLPLEEQAFSVSDK
TIPNLDFFETYQADDFATYKAEQGLAMEVDDLLFIQNYFKSIGCVPTETELKVLDTYWSDHCRHTTFETELKNIDFSASKFQKQLQTTY
DKYIAMRDELGRSEKPQTLMDMATIFGRYERANGRLDDMEVSDEINACSVEIEVDVDGVKEPWLLMFKNETHNHPTEIEPFGGAATCI
GGAIRDPLSGRSYVYQAMRISGAGDITTPIAETRAGKLPQQVISKTAAHGYSSYGNQIGLATTYVREYFHPGFVAKRMELGAVVGAAP
KENVVREKPEAGDVVILLGGKTGRDGVGGATGSSKVQTVESVETAGAEVQKGNAIEERKIQRLFRDGNVTRLIKKSNDFGAGGVCVA
IGELADGLEIDLDKVPLKYQGLNGTEIAISESQERMSVVVRPNDVDAFIAACNKENIDAVVVATVTEKPNLVMTWNGEIIVDLERRFLDT
NGVRVVVDAKVVDKDLTVPEARTTSAETLEADTLKVLSDLNHASQKGLQTIFDSSVGRSTVNHPIGGRYQITPTESSVQKLPVQHGVT
TTASVMAQGYNPYIAEWSPYHGAAYAVIEATARLVATGADWSRARFSYQEYFERMDKQAERFGQPVSALLGSIEAQIQLGLPSIGGK
DSMSGTFEDLTVPPTLVAFGVTTADSRKVLSPEFKAAGENIYYIPGQAISEDIDFDLIKDNFSQFEAIQAQHKITAASAAKYGGVLESLAL
MTFGNRIGASVEIAELDSSLTAQLGGFVFTSAEEIADAVKIGQTQADFTVTVNGNDLAGASLLAAFEGKLEEVYPTEFEQTDVLEEVPA
VVSDTVIKAKETIEKPVVYIPVFPGTNSEYDSAKAFEQVGASVNLVPFVTLNEVAIAESVDTMVANIAKANIIFFAGGFSAADEPDGSAKF
IVNILLNEKVRAAIDSFIEKGGLIIGICNGFQALVKSGLLPYGNFEEAGETSPTLFYNDANQHVAKMVETRIANTNSPWLAGVEVGDIHAI
PVSHGEGKLVVSASEFAELRDNGQIWSQYVDFDGQPSMDSKYNPNGSVNAIEGITSKNGQIIGKMGHSERWEDGLFQNIPGNKDQIL
FASAVKYFTGK
SPy0031
Seq ID 154
MKKFHRFLVSGVILLGFNGLVPTMPSTLISQQENLVHAAVLGDNYPSKWKKGNGIDSWNMYIRQCTSFAAFRLSSANGFQLPKGYGN
ACTWGHIAKNQGYPVNKTPSIGAIAWFDKNAYQSNAAYGHVAWVADIRGDTVTIEEYNYNAGQGPERYHKRQIPKSQVSGYIHFKDL
SSQTSHSYPRQLKHISQASFDPSGTYHFTTRLPVKGQTSIDSPDLAYYEAGQSVYYDKVVTAGGYTWLSYLSFSGNRRYIPIKEPAQS
VVQNDNTKPSIKVGDTVTFPGVFRVDQLVNNLIVNKELAGGDPTPLNWIDPTPLDETDNQGKVLGDQILRVGEYFIVTGSYKVLKIDQP
SNGIYVQIGSRGTWVNADKANKL
SPy0103
Seq ID 155
MINQWNNLRHKKLKGFTLLEMLLVILVISVLMLLFVPNLSKQKDRVTETGNAAVVKLVENQAELYELSQGSKPSLSQLKADGSITEKQE
KAYQDYYDKHKNEKARLSN
SPy0112
Seq ID 156
MKIGIIGVGKMASAIIKGLKQTPHELIISGSSLERSKEIAEQLALPYAMSHQDLIDQVDLVILGIKPQLFETVLKPLHFKQPIISMAAGISLQR
LATFVGQDLPLLRIMPNMNAQILQSSTALTGNALVSQELQARVRDLTDSFGSTFDISEKDFDTFTALAGSSPAYIYLFIEALAKAGVKNG
IPKAKALEIVTQTVLASASNLKTSSQSPHDFIDAICSPGGTTIAGLMELERLGLTATVSSAIDKTIDKAKSL
SPy0115
Seq ID 157
MTDLFSKIKEVTELDGIAGYEHSVRDYLRTKITPLVDRVETDGLGGIFGIRDSKAEKAPRILVAAHMDEVGFMVSDIKVDGTLRVVGIGG
WNPLVVSSQRFTLYTRTGQVIPLISGSVPPHFLRGANGSASLPHIEDIVFDGGFTDKAEAERFGITPGDIIIPQSETILTANQKNIISKAWD
NRYGVLMITEMLEALKGQDLNNTLIAGANVQEEVGLRGAHVSTTKFDPELFFAVDCSPAGDIYGNPGTIGDGTLLRFYDPGHVMLKD
MRDFLLTTAEEAGVNFQYYCGKGGTDAGAAHLQNGGVPSTTIGVCARYIHSHQTLYAMDDFVEAQAFLQAIIKKLDRSTVDLIKCY
SPy0166
Seq ID 158
MEDISDPEVILEYGVYPAFIKGYTQLKANIEEALLEMSNSGQALDIYQAVQTLNAENMLLNYYESLPFYLNRQSILANMTKALKDAHIRE
AMAHYKLGEFAHYQDTMLDMVERTIKTF
SPy0167
Seq ID 159
MSNKKTFKKYSRVAGLLTAALIIGNLVTANAESNKQNTASTETTTTNEQPKPESSELTTEKAGQKTDDMLNSNDMIKLAPKEMPLESA
EKEEKKSEDKKKSEEDHTEEINDKIYSLNYNELEVLAKNGETIENFVPKEGVKKADKFIVIERKKKNINTTPVDISIIDSVTDRTYPAALQL
ANKGFTENKPDAVVTKRNPQKIHIDLPGMGDKATVEVNDPTYANVSTAIDNLVNQWHDNYSGGNTLPARTQYTESMVYSKSQIEAAL
NVNSKILDGTLGIDFKSISKGEKKVMIAAYKQIFYTVSANLPNNPADVFDKSVTFKELQRKGVSNEAPPLFVSNVAYGRTVFVKLETSSK
SNDVEAAFSAALKGTDVKTNGKYSDILENSSFTAVVLGGDAAEHNKVVTKDFDVIRNVIKDNATFSRKNPAYPISYTSVFLKNNKIAGV
NNRTEYVETTSTEYTSGKINLSHQGAYVAQYEILWDEINYDDKGKEVITKRRWDNNWYSKTSPFSTVIPLGANSRNIRIMARECTGLA
WEWWRKVIDERDVKLSKEINVNISGSTLSPYGSITYK
SPy0168
Seq ID 160
MKQQSYQPLRFVYLLVALFAALLLIARPVMADEGTNSADAAYYKGQSAGKKAGKKAGKEATWTDLTPTVPTNPETPSDIGETTNKQL
YKEGYKDGYKEGYNEGWKSQYPVLTPVKVIWDLISYWLQRLFPNNQSSTAAQSMS
SPy0171
Seq ID 161
VKNKLFLVALATVTVLGPSLATPHHQTVHASDVTLTETCDKNGTVCFGYENVDGEVCKLTADGKGTICVGYENRDIKESETSSTKNDC
SNWFWCFLNYLWTTIKSWVS
SPy0183
Seq ID 162
METILEVKHLSKIFGKKQKAALEMVKTGKNKSEIFKKTGATVGVYDASFEVKKGEIFVIMGLSGSGKSTLVRMLNRLIEPSAGSILLEGK
DISTMSADQLREVRRHDINMVFQSFALFPHKTILENTEFGLELRGVPKEERQRLAEKALDNSGLLDFKDQYPNQLSGGMQQRVGLAR
ALANSPKILLMDEAFSALDPLIRREMQDELLDLQDSMKQTIIFISHDLNEALRIGDRIALMKDGQIMQIGTGEEILTNPANDFVREFVEDV
DRSKVLTAQNIMIKPLTTTVELDGPQVALNRMHNEEVSMLMATNRRRQLVGSLTADAAIEARKKGLPLSEVIDRDVRTVSKDTIITDILP
LIYDSSAPIAVTDDNNRLLGVIIRGRVIEALANISDEDLN
SPy0230
Seq ID 163
MKTARFFWFYFKRYRFSFTVIAVAVILATYLQVKAPVFLGESLTELGKIGQAYYVAKMSGQTHFSPDLSAFNAVMFKLLMTYFFTVLAN
LIYSFLLTRVVSHSTNRMRKGLFGKLERLTVAFFDRHKDGEILSRFTSDLDNIQNSLNQSLIQVVTNIALYIGLVWMMFRQDSRLALLTIA
STPVALIFLVINIRLARKYTNIQQQEVSALNAFMDETISGQKAIIVQGVQEDTMTAFLKHNERVRQATFKRRLFSGQLFPVMNGMSLINT
AIVIFVGSTIVLSDKSMPAAAALGLVVTFVQYSQQYYQPMMQIASSWGELQLAFTGAHRIQEMFDETEEVRPQNAPAFTSLKEAVAIN
HVDFGYLPGQKVLSDVSIVAPKGKMIAVVGPTGSGKTTIMNLINRFYDVDAGSITFDGRDIRDYDLDSLRQKVGIVLQESVLFSGTITDN
IRFGDQTISQDMVETAARATHIHDFIMSLPKGYNTYVSDDDNVFSTGQKQLISIARTLLTDPEVLILDEATSNVDTVTESKIQRAMEAIVA
GRTSFVIAHRLKTILNADHIIVLKDGKVIEQGNHHELLHQKGFYAELYHNQFVFE
SPy0269
Seq ID 164
MDLEQTKPNQVKQKIALTSTIALLSASVGVSHQVKADDRASGETKASNTHDDSLPKPETIQEAKATIDAVEKTLSQQKAELTELATALT
KTTAEINHLKEQQDNEQKALTSAQEIYTNTLASSEETLLAQGAEHQRELTATETELHNAQADQHSKETALSEQKASISAETTRAQDLVE
QVKTSEQNIAKLNAMISNPDAITKAAQTANDNTKALSSELEKAKADLENQKAKVKKQLTEELAAQKAALAEKEAELSRLKSSAPSTQDS
IVGNNTMKAPQGYPLEELKKLEASGYIGSASYNNYYKEHADQIIAKASPGNQLNQYQDIPADRNRFVDPDNLTPEVQNELAQFAAHMI
NSVRRQLGLPPVTVTAGSQEFARLLSTSYKKTHGNTRPSFVYGQPGVSGHYGVGPHDKTIIEDSAGASGLIRNDDNMYENIGAFNDV
HTVNGIKRGIYDSIKYMLFTDHLHGNTYGHAINFLRVDKHNPNAPVYLGFSTSNVGSLNEHFVMFPESNIANHQRFNKTPIKAVGSTKD
YAQRVGTVSDTIAAIKGKVSSLENRLSAIHQEADIMAAQAKVSQLQGKLASTLKQSDSLNLQVRQLNDTKGSLRTELLAAKAKQAQLE
ATRDQSLAKLASLKAALHQTEALAEQAAARVTALVAKKAHLQYLRDFKLNPNRLQVIRERIDNTKQDLAKTTSSLLNAQEALAALQAKQ
SSLEATIATTEHQLTLLKTLANEKEYRHLDEDIATVPDLQVAPPLTGVKPLSYSKIDTTPLVQEMVKETKQLLEASARLAAE NTSLVAEA
LVGQTSEMVASNAIVSKITSSITQPSSKTSYGSGSSTTSNLISDVDESTQRALKAGVVMLAAVGLTGFRFRKESK
SPy0287
Seq ID 165
MTKEKLVAFSQAHAEPAWLQERRLAALEAIPNLELPTIERVKFHRWNLGDGTLTENESLASVPDFIAIGDNPKLVQVGTQTVLEQLPM
ALIDKGVVFSDFYTALEEIPEVIEAHFGQALAFDEDKLAAYHTAYFNSAAVLYVPDHLEITTPIEAIFLQDSDSDVPFNKHVLVIAGKESKF
TYLERFESIGNATQKISANISVEVIAQAGSQIKFSAIDRLGPSVTTYISRRGRLEKDANIDWALAVMNEGNVIADFDSDLIGQGSQADLKV
VAASSGRQVQGIDTRVTNYGQRTVGHILQHGVILERGTLTFNGIGHILKDAKGADAQQESRVLMLSDQARADANPILLIDENEVTAGH
AASIGQVDPEDMYYLMSRGLDQETAERLVIRGFLGAVIAEIPIPSVRQEIIKVLDEKLLNR
SPy0292
Seq ID 166
MIKRLISLVVIALFFAASTVSGEEYSVTAKHAIAVDLESGKVLYEKDAKEVVPVASVSKLLTTYLVYKEVSKGKLNWDSPVTISNYPYELT
TNYTISNVPLDKRKYTVKELLSALVVNNANSPAIALAEKIGGTEPKFVDKMKKQLRQWGISDAKVVNSTGLTNHFLGANTYPNTEPDD
ENCFCATDLAIIARHLLLEFPEVLKLSSKSSTIFAGQTIYSYNYMLKGMPCYREGVDGLFVGYSKKAGASFVATSVENQMRVITVVLNA
DQSHEDDLAIFKTTNQLLQYLLINFQKVQLIENNKPVKTLYVLDSPEKTVKLVAQNSLFFIKPIHTKTKNTVHITKKSSTMIAPLSKGQVLG
RATLQDKHLIGQGYLDTPPSINLILQKNISKSFFLKVWWNRFVRYVNTSL
SPy0295
Seq ID 167
MESIDKSKFRFVERDSEASEVIDTPAYSYWKSVFRQFFSKKSTVFMLVILVTVLMMSFIYPMFANYDFNDVSNINDFSKRYIWPNAEY
WFGTDKNGQSLFDGVWYGARNSILISVIATLINITIGVVLGAIWGVSKAFDKVMIEIYNIISNIPSMLIIIVLTYSLGAGFWNLILAFCITGWIG
VAYSIRVQILRYRDLEYNLASQTLGTPMYKIAVKNLLPQLVSVIMTMLSQMLPVYVSSEAFLSFFGIGLPTTTPSLGRFIANYSSNLTTNA
YLFWIPLVTLILVSLPLYIVGQNLADASDPRSHR
SPy0348
Seq ID 168
LALTDFKDKDQQDQQRSFKEQILAELEKANQIRKEKEEELFQKELEAKEAARRTAQLYAEYKRQDAFQKESIAHNNKTAKHFQAIKGA
VMTSEALKPTLLSEKENSSLKTTNKRVVQANELQETASKESQVPLTIEKGHSVRRKLSKRQQTERAAKKISTVLISSIIITLLAVTLAGAG
YVYSALNPVDKNSDAFVQVEIPSGSGNKLIGQILQKKGLIKNSTVFSFYTKFKNFTNFQSGYYNLQKSMSLEEIASALQEGGTAEPTKP
SLGKILIPEGYTIKQIAKAVEHNSKGKTKKAKTPFNEKDFLDLVTDEAFIQDMVKRYPKLLATIPTKEKAIYRLEGYLFPATYNYYKETTM
RELVEDMLAAMDATLVPYYDKIAASGKTVNEVLTLASLVEKEGSTDDDRRQIASVFYNRLNSGMALQSNIAILYAMGKLGEKTTLAEDA
TIDTTINSPYNIYTNTGLMPGPVASSGVSAIEATLNPASTDYLYFVANVHTGEVYYAKTFEEHSANVEKYVNSQIQ
SPy0416
Seq ID 169
VEKKQRFSLRKYKSGTFSVLIGSVFLVMTTTVAADELSTMSEPTITNHAQQQAQHLTNTELSSAESKSQDTSQITLKTNREKEQSQDL
VSEPTTTELADTDAASMANTGSDATQKSASLPPVNTDVHDWVKTKGAWDKGYKGQGKVVAVIDTGIDPAHQSMRISDVSTAKVKSK
EDMLARQKAAGINYGSWINDKVVFAHNYVENSDNIKENQFEDFDEDWENFEFDAEAEPKAIKKHKIYRPQSTQAPKETVIKTEETDGS
HDIDWTQTDDDTKYESHGMHVTGIVAGNSKEAAATGERFLGIAPEAQVMFMRVFANDIMGSAESLFIKAIEDAVALGADVINLSLGTA
NGAQLSGSKPLMEAIEKAKKAGVSVVVAAGNERVYGSDHDDPLATNPDYGLVGSPSTGRTPTSVAAINSKWVIQRLMTVKELENRAD
LNHGKAIYSESVDFKDIKDSLGYDKSHQFAYVKESTDAGYNAQDVKGKIALIERDPNKTYDEMIALAKKHGALGVLIFNNKPGQSNRS
MRLTANGMGIPSAFISHEFGKAMSQLNGNGTGSLEFDSVVSKAPSQKGNEMNHFSNWGLTSDGYLKPDITAPGGDIYSTYNDNHYG
SQTGTSMASPQIAGASLLVKQYLEKTQPNLPKEKIADIVKNLLMSNAQIHVNPETKTTTSPRQQGAGLLNIDGAVTSGLYVTGKDNYG
SISLGNITDTMTFDVTVHNLSNKDKTLRYDTELLTDHVDPQKGRFTLTSHSLKTYQGGEVTVPANGKVTVRVTMDVSQFTKELTKQMP
NGYYLEGFVRFRDSQDDQLNRVNIPFVGFKGQFENLAVAEESIYRLKSQGKTGFYFDESGPKDDIYVGKHFTGLVTLGSETNVSTKTI
SDNGLHTLGTFKNADGKFILEKNAQGNPVLAISPNGDNNQDFAAFKGVFLRKYQGLKASVYHASDKEHKNPLWVSPESFKGDKNFN
SDIRFAKSTTLLGTAFSGKSLTGAELPDGHYHYVVSYYPDVVGAKRQEMTFDMILDRQKPVLSQATFDPETNRFKPEPLKDRGLAGV
RKDSVFYLERKDNKPYTVTINDSYKYVSVEDNKTFVERQADGSFILPLDKAKLGDFYYMVEDFAGNVAIAKLGDHLPQTLGKTPIKLKL
TDGNYQTKETLKDNLEMTQSDTGLVTNQAQLAVVHRNQPQSQLTKMNQDFFISPNEDGNKDFVAFKGLKNNVYNDLTVNVYAKDDH
QKQTPIWSSQAGASVSAIESTAWYGITARGSKVMPGDYQYVVTYRDEHGKEHQKQYTISVNDKKPMITQGRFDTINGVDHFTPDKTK
ALDSSGIVREEVFYLAKKNGRKFDVTEGKDGITVSDNKVYIPKNPDGSYTISKRDGVTLSDYYYLVEDRAGNVSFATLRDLKAVGKDK
AVVNFGLDLPVPEDKQIVNFTYLVRDADGKPIENLEYYNNSGNSLILPYGKYTVELLTYDTNAAKLESDKIVSFTLSADNNFQQVTFKIT
MLATSQITAHFDHLLPEGSRVSLKTAQDQLIPLEQSLYVPKAYGKTVQEGTYEVVVSLPKGYRIEGNTKVNTLP NEVHELSLRLVKVGD
ASDSTGDHKVMSKNNSQALTASATPTKSTTSATAKALPSTGEKMGLKLRIVGLVLLGLTCVFSRKKSTKD
SPy0430
Seq ID 170
MKWSGFMKTKSKRFLNLATLCLALLGTTLLMAHPVQAEVISKRDYMTRFGLGDLEDDSANYPSNLEARYKGYLEGYEKGLKGDDIPE
RPKIQVPEDVQPSDHGDYRDGYEEGFGEGQHKRDPLETEAEDDSQGGRQEGRQGHQEGADSSDLNVEESDGLSVIDEVVGVIYQA
FSTIWTYLSGLF
SPy0433
Seq ID 171
MKKTLTLLLALFAIGVTSSVRAEDEQSSTQKPVKFDLDGPQQKIKDYSGNTTTLEDLYVGSKVVKIYIPQGWWVYLYRQCDHNSKERGI
LASPILEKNITKTDPYRQYYTGVPYILNLGEDPLKKGEKLTFSFKGEDGFYVGSYIYRDSDTIKKEKEAEEALQKKEEEKQQKQLEESM
LKQIREEDHKPWHQRLSESIQDQWWNFKGLFQ
SPy0437
Seq ID 172
MKKTLTLLLALFAIGVTSSVRAEDEQNKFILDGLQEKVKEVSVSDFSVGESKIKVWLPQAWSVKISREHSPKSSISNSGEQKPLSNSSE
NKEGQFSKRLPYGTQHTIKLSSQLTKGERVTLTFRDEDFWGAGYCFYRDSLSIKEDKQYEEEIKKIEDDLERQDLENDALEMFKKQTE
REANKPWHQRLSENIQDQWWNFKGLFQ
SPy0469
Seq ID 173
MIITKKSLFVTSVALSLVPLATAQAQEWTPRSVTEIKSELVLVDNVFTYTVKYGDTLSTIAEAMGIDVHVLGDINHIANIDLIFPDTILTANY
NQHGQATNLTVQAPASSPASVSHVPSSEPLPQASATSQPTVPMAPPATPSDVPTTPFASAKPDSSVTASSELTSSTNDVSTELSSES
QKQPEVPQEAVPTPKAAETTEVEPKTDISEAPTSANRPVPNESASEEVSSAAPAQAPAEKEETSAPAAQKAVADTTSVATSNGLSYA
PNHAYNPMNAGLQPQTAAFKEEVASAFGITSFSGYRPGDPGDHGKGLAIDFMVPENSALGDQVAQYAIDHMAERGISYVIWKQRFY
APFASIYGPAYTWNPMPDRGSITENHYDHVHVSFNA
SPy0488
Seq ID 174
LRQIQSIRLIDVLELAFGVGYKEETTSQFSSDQPSQVVLYRGEANTVRFAYTNQMSLMKDIRIALDGSDKSLTAQIVPGMGHVYEGFQT
SARGIFTMSGVPESTVPVANPNVQTKYIRYFKVIDDMHNTMYKGTVFLVQPQAWKYTMKSVDQLPVDDLNHIGVAGIERMTTLIKNAG
ALLTTGGSGAFPDNIKVSINPKGRQATITYGDGSTDIIPPAVLWKKGSVKEPTEADQSVGTPTPGIPGKFKRDQSLNEHEAMVNVEPLS
HVVKDNIKVIDEKSTGRFEPFRPNEDEKEKPASDVKVRPAEVGSWLEPATALPSVEMSAEDRLKS
SPy0515
Seq ID 175
MKVLLYLEAENYLRKSGIGRAIKHQAKALSLVGQHFTTNPRETYDLVHLNTYGLKSWLLMIKAQKAGKKVIMHGHSTEEDFRNSFIFSN
LLSPWFKKYLCHFYNKADAIITPTLYSKSLIESYGVKSPIFAVSNGIDLEQYGADPKKEAAFRRYFDIKEGEKVVMGAGLFFLRKGIDDF
VKVAQAMPDVRFIWFGETNKWVIPAQVRQMVNGNHPKNLIFPGYIKGDVYEGAMTGADAFFFPSREETEGIVVLEALASRQHLVLRDI
PVYYGWVDQSSAELATDIPGFIEALKKVFSGASNKVEAGYKVAQSRRLETVGHALVDVYKKVMEL
SPy0580
Seq ID 176
MENNNNHNIAEALSVSLHQIEQVLALTAQGNTIPFIARYRKEVTGNLDEVVIKSIIDMDKSLTTLNERKATILAKIEEQGKLTDQLRTSIEA
TEKLADLEELYLPYKEKRRTKATIAREAGLFPLARLILQNAQNLETAAEPFVTEGFASPQEALAGAVDILVEAMSEDAKLRSWTYNEIW
QYSRLVSTLKDEQLDEKKVFQIYYDFSDQVSNMQGYRTLALNRGEKLGILKVSFEHNLEKMQRFFSVRFKETNPYIEEVINQTIKKKIV
PAMERRVRSELSDAAEDGAIHLFSENLRHLLLVSPLKGKMVLGFDPAFRTGAKLAIVDQTGKLLTTQVIYPVAPASQTKIQAAKETLTQ
LIETYQIDIIAIGNGTASRESEAFVADVLKDFPNTSYVIVNESGASVYSASELARHEFPDLTVEKRSAISIARRLQDPLAELVKIDPKSIGV
GQYQHDVSQKKLSENLGFVVDTVVNQVGVNVNTASPSLLAHVSGLNKTISENIVKYREENGALTSRADIKKVPRLGAKAFEQAAGFLR
IPGAKNILDNTGVHPESYPAVKELFKVLGIQDLDDAAKATLAAVQVPQMAETLAIGQETLKDIIADLLKPGRDLRDDFEAPILRQDILDLK
DLEIGQKLEGTVRNVVDFGAFVDIGVHEDGLIHISEMSKTFVNHPSQVVSVGDLVTVWVSKIDLDRHKVNLSLLPPRDTH
SPy0621
Seq ID 177
MNEKVFRDPVHNYIHIDNPLIYDLINTKEFQRLRRIKQVPTTAFTFHGAEHSRFSHCLGVYEIARRVTAIFEEKYADIWNKDESLVTMTA
ALLHDIGHGAYSHTFEVLFHTDHEAFTQEIITNPETEINAILVRHAPDFPDKVASVINHTYPNKQVVQLISSQIDCDRMDYLLRDSYFSAA
NYGQFDLMRILRVIRPVEDGIVFEHSGMHAVEDYIVSRFQMYMQVYFHPASRAVELILQNLLKRAQHLYPEQQAYFQKTAPGLIPFFE
KKANLADYIALDDGVMNTYFQVWMASEDHILSDLASRFINRKILKSVTFDQDSQGELERLRQLVESVGFDPDYYTGIHINFDLPYDIYR
PELENPRTQIEMMQKDGSLAELSQLSPIVKALTGTTYGDRRFYFPKEMLELDDLFAPSKETFMSYISNGHFHFSQ
SPy0630
Seq ID 178
MDINLLQALLIGLWTAFCFSGMLLGIYTNRCIILSFGVGIILGDLPTALSMGAISELAYMGFGVGAGGTVPPNPIGPGIFGTLMAITSAGKV
TPEAALALSTPIAVAIQFLQTFAYTAFAGAPETAKKQLQKGNIRGFKFAANGTIWAFAFIGLGLGLLGALSMDTLLHLVDYIPPVLLNGLT
VAGKMLPAIGFAMILSVMAKKELIPFVLIGYVCAAYLQIPTIGIAIIGIIFALNEFYNKPKQVDATTVQGGQQDDWI
SPy0681
Seq ID 179
LTPRSGKTTAGHFRYARYLIESEDENHLVTAYNQEQAYRLFIDGDGTGLMHIFDGNCEIKHDERGDHLLITTPKGNKRVYYKGGGKVN
SVGAITGMSLGSVVFCEINLLHMDFIQECFRRTWAAKLRYHLADLNPPAPQHPVIKDVFDVQNTRWTHWTMDDNPILTAERKQNIINS
LKKNPYLYKRDVLGQRVMPQGVIYGLFDTEKNVLDALIGEPVEMYFCADGGQSDATSMSCNIVTRVRDNGRISFRLNRVAHYYHSGA
DTGQVKAMSTYALELKVFIDWCVKKYQMRYTEVFVDPACKSLREELHKLGVFTLGAPNNSKDVSSKAKGIEVGIERGQNIISDGAFYL
VNHSEEEYDHYHFLKEIGLYSRDDNGKPIDKDNHAMDEFRYSVNVFVHRYYN
SPy0683
Seq ID 180
MKKKPIKLNDEQLLLEASQLSDMYHQLTLDLFDQVIERIKARGSASLADNPYLWQANKLHDVGLLNADNIKLIAKYSGIAEAQLRYIIKNE
GFKIYKNTSEQLEEALGRESGVNSTIQDDLSNYARQAIDDVHNLTNTTLPFSVIGAYQGIIQDAVAGVVTGLKTPDQAINQTVIKWFKKG
FYGFTDKAGRKWRADSYARTVINTTTWRVFNEAKEAPAREFGIDTFYYSKKATAREMCAPLQHQIVTTGEAREEGGIKILALSDYGHG
EPDGCLGINCKHTKTPFVVGVNSKPELPEHLKNITPAQAKANANAQAKQRAIERSIRKSKELLHVAKQLGDKELIRQYQSDVRSKQDA
LNYLINNNAFLHRNQAREKRYNNPYTKTQSEVEVRKEKAKLDKRRDVESAIIGVETSEGIPLKITKHLAERAVLRNIAPIDIVDSIKEPLKI
APIKYDNLDRPSQKYIGKCVSTVINPIDGNIVTVHATSTRIRKKYGGN
SPy0702
Seq ID 181
MSRDPTLILDESNLVIGKDGRVHYTFTTEDDNPKVRLASKCLGTAHFNQLMIERGDQATSYVAPVVVEGTGNPTGLFKDLKEISLELTD
TANSQLWSKIKLTNRGMLQEYYDGKIKTEIVNSARGVATRISEDTDKKLALINDTIDGIRREYRDADRKLSASYQAGIEGLKATMANDKI
GLQAEIKASAQGLSQKYDDELRKLSAKITTTSSGTTEAYESKLAGLRAEFTRSNQGTRTELESQISGLRAVQQSTASQISQEIRDREGA
VSRVQQSLESYQRRMQDAEENYSSLTHTVRGLQSDVGSPTGKIQSRLTQLAGQIEQRVTRDGVMSIISGAGDSIKLAIQKAGGINAKM
SGNEIISAINLNSYGVTIAGKHIALDGNTTVNGTFTTKIAEAIKIRADQIIAGTIDAARIRVINLNASSIVGLDANFIKAKIGYAITDLLEGKVIK
ARNGAMLIDLNTAKMDFNSDATINFNSKNNALVRKDGTHTAFVHFSNATPKGYTGSALYASIGITSSGDGVNSASSGRFAGLRSFRYA
TGYNHTAAVDQTEIYGDNVLVVDDFNITRGFKFRPDKMQKMLDMNDLYAAVVALGRCWGHLANVGWNTAHSNFTSAVNRELNNYIT
KI
SPy0710
Seq ID 182
MTFLDKIKQGCLDGWAKYKILPSLTAAQAILESGWGKHAPHNALFGIKADSSWTGKSFDTKTQEEYQAGVVTDIVDRFRAYDSWDESI
ADHGQFLVDNPRYEAVIGETDYKKACYAIKAAGYATASSYVELLIQLIEENDLQSWDREALKNNKEETMTTANEIVQYCVNLANSGMG
VDKDGAHGTQCCDLPCFVAKNWFGVDLWGNAIDLLDSASAQGWEVHRMPTEANPKAGATFVQSVPYHQFGHTGIVIEDSDGYTMR
TVEQNIDGNPDALYVGAPARFNTRDFTGVIGWFYPPYQGDTVTQPVSTEPQTSDTIVETAKTGTFTLDVAEINIRRWPSLASEVVGIYK
QGDTVSFDSEGYANGYYWISYVGGSGMRNYLGIGQTDKDGNRISLWGKLN
SPy0711
Seq ID 183
MKKINIIKIVFIITVILISTISPIIKSDSKKDISNVKSDLLYAYTITPYDYKNCRVNFSTTHTLNIDTQKYRGKDYYISSEMSYEASQKFKRDDH
VDVFGLFYILNSHTGEYIYGGITPAQNNKVNHKLLGNLFISGESQQNLNNKIILEKDIVTFQEIDFKIRKYLMDNYKIYDATSPYVSGRIEIG
TKDGKHEQIDLFDSPNEGTRSDIFAKYKDNRIINMKNFSHFDIYLEK
SPy0720
Seq ID 184
MITTFETILDKIKAHQTIIIHRHQNPDPDALGSQAGLKEIIAQNFPDKKVLMTGFDEPSLAWISQMDQVTDKDYKEALVIITDTANRPRIDD
ERYTLGKCLIKIDHHPNDDVYGDFYYVDTSASSASEIIADFAFSQNLTLSDKAAKLLYTGIVGDTGRFLYASTTSKTLSIASQLRHFEFDF
AAISRQMDSFPLKIAKLQSYVFEHLTIDESGAAYVLVSQETLKHFDVTLAESSAIVCAPGKIDNVQAWAIFVELTDGNYRVRMRSKEKII
NGIAKRHGGGGHPLASGANSANLEENQAIFRELIAVCQEI
SPy0727
Seq ID 185
MIEENKHFEKKMQEYDASQIQVLEGLEAVRMRPGMYIGSTAKEGLHHLVWEIVDNSIDEALAGFASHIKVFIEADNSITVVDDGRGIPV
DIQAKTGRPAVETVFTVLHAGGKFGGGGYKVSGGLHGVGSSVVNALSTQLDVRVYKNGQIHYQEFKRGAVVADLEVIGTTDVTGTTV
HFTPDPEIFTETTQFDYSVLAKRIQELAFLNRGLKISITDKRSGMEQEEHFLYEGGIGSYVEFLNDKKDVIFETPIYTDGELEGIAVEVAM
QYTTSYQETVMSFANNIHTHEGGTHEQGFRAALTRVINDYAKKNKILKENEDNLTGEDVREGLTAVISVKHPNPQFEGQTKTKLGNSE
VVKITNRLFSEAFQRFLLENPQVARKIVEKGILASKARIAAKRAREVTRKKSGLEISNLPGKLADCSSNDANQNELFIVEGDSAGGSAKS
GRNREFQAILPIRGKILNVEKATMDKILANEEIRSLFTAMGTGFGADFDVSKARYQKLVIMTDADVDGAHIRTLLLTLIYRFMRPVLEAG
YVYIAQPPIYGVKVGSEIKEYIQPGIDQEDQLKTALEKYSIGRSKPTVQRYKGLGEMDDHQLWETTMDPENRLMARVTVDDAAEADKV
FDMLMGDRVEPRRDFIEENAVYSTLDI
SPy0737
Seq ID 186
MRKVKKVFVSSCMLLTVGLGVAVPTGFSQSNGVMVVKAAEVPATDLSRQASDSERVDESSLLQKENLSVDSFKLENLNGWEAENDT
AGNLGKFKDPDSSGYQNILTSSGKNISVAVAPKGSGKMNIKVTKRSNFQGGYYVGGLRTQTPVLKLNDVYRYSFTTKKLSGNSSEFK
TRVKPVESNNKLGKELVIRVDNKNVSTKHDWLPDISDGTHTVDFTGLDKKLSVAFRFSPRQTSNVVYEFSNINIKNISPASVPAIPSKVL
EGTSVLSGTAISSGDTLEKRKSFDGDILRVYKDSKIIARTVIKGNKWDVKLSKPLIAGEKLDFEILHPRSQNVSKKISKQVEAKPFDPASY
KEKVIAKLKPVYEATS EKITNDAWLDENAKDLQKQKLEEQYISGKVAISEAGTKQEAIDAAYNKYSSQTDPDSLPSQYKQGNKENEQE
KGRQDLIQTRDLTLKAIQEDKWLTEQEKTIQKEEALKAFETGIESVNQTVSLEQLKQRLIVYKASEKDSEKKEYPESIPNQHIPGKEKEV
KAAKQEELKKLHDTTLEKINQDKWLTPDQQAEQLKQAEVTFKKGQEAIKSAQTLTQLETDLADYVSENEGKGNSIPDKYKSGNKDDL
VNKAEVKLKEAHEATKQAIEKDPWLSPEQKKAQKEKAKARLDEGLKALKAADSLEILKVTEEAFVDKEKNPDSIPNQHKAGTADQARK
QALDSLDKEVQKELESIDNDNTLTTDEKAAAKKKVNDAYDVAKQTAMEANSYEDLTTIKDEFLSNLPHKQGTPLKDQQSDAIAELEKK
QQEIEKAIEGDKTLPRDEKEKQIADSKERLKSDTQKVKDAKNADAIKKAFEEGKVNIPQAHIPGDLNKDKEKLLAELKQKADDTEKAIDV
DKTLTEDEKKEQKVKTKAELEKAKTDVKNTQTREELDKKVPELKKAIEDTHVKGNLEGVKNKAIEDLKKAHTETVAKINGDDTLDKATK
EAQVKEADKALAAGKDAITKADDADKVSTAVTEHTPKIKAAHKTGDLKKAQVDANTALDKAAEKERGEINKDATLTTEDKAKQLKEVE
TALTKAKDNVKAAKTADAINDARDKGVATIDAVHKAGQDLGARKSGQVAKLEEAAKATKDKISADPTLTSKEKEEQSKAVDAELKKAIE
AVNAADTADKVDDALGEGVTDIKNQHKSGDSIDARREAHGKELDRVAQETKGAIEKDPTLTTEEKAKQVKDVDAAKERGMAKLNEAK
DADALDKAYGEGVTDIKNQHKSGDPVDARRGLHNKSIDEVAQATKDAITADTTLTEAEKETQRGNVDKEATKAKEELAKAKDADALD
KAYGDGVTSIKNQHKSGKGLDVRKDEHKKALEAVAKRVTAEIEADPTLTPEVREQQKAEVQKELELATDKIAEAKDADEADKAYGDG
VTAIENAHVIGKGIEARKDLAKKDLAEAAAKTKALIIEDKTLTDDQRKEQLLGVDTEYAKGIENIDAAKDAAGVDKAYSDGVRDILAQYKE
GQNLNDRRNAAKEFLLKEADKVTKLINDDPTLTHDQKVDQINKVEQAKLDAIKSVDDAQTADAINDALGKGIENINNQYQHGDGVDVR
KATAKGDLEKEAAKVKALIAKDPTLTQADKDKQTAAVDAAKNTAIAAVDKATTTEGINQELGKGITAINKAYRPGEGVKARKEAAKADL
EKEAAKVKALITNDPTLTKADKAKQTEAVAKALKAAIAAVDKATTAEGINQELGKGITAINKAYRPGE GVKARKEAAKADLEREAAKVR
EAIANDPTLTKADKAKQTEAVAKALKAAIAAVDKATTAEGINQELGKGITAINKAYRPGEGVEAHKEAAKANLEKVAKETKALISGDRYL
SETEKAVQKQAVEQALAKALGQVEAAKTVEAVKLAENLGTVAIRSAYVAGLAKDTDQATAALNEAKQAAIEALKQAAAETLAKITTDAK
LTEAQKAEQSENVSLALKTAIATVRSAQSIASVKEAKDKGITAIRAAYVPNKAVAKSSSANHLPKSGDANSIVLVGLGVMSLLLGMVLYS
KKKESKD
SPy0747
Seq ID 187
MINKKCIIPVSLLTLAITLTSVEEVTSRQNLTYANEIVTQRPKRESVISDKSNFPVISPYLASVDFGERKTPLPTPDKGVKVTTEQSIAQVR
KGPEERPYTVTGKITSVINGWGGYGFYIQDSEGIGLYVYPQKDLGYSKGDIVQLTGTLTRFKGDLQLQQVTAHKKLELSFPTSVKEAVI
SELETTTPSTLVKLSHVTVGELSTDQYNNTSFLVRDDSGKSIVVHIDHRTGVKGADVVTKISQGDLINLTAILSIVDGQLQLRPFSLEQLE
VVKKVTSSNSDASSRNIVKIGEIQGASHTSPLLKKAVTVEQVVVTYLDDSTHFYVQDLNGDGDLATSDGIRVFAKNAKVQVGDVLTISG
EVEEFFGRGYEERKQTDLTITQIVAKAVTKTGTAQVPSPLVLGKDRIAPANIIDNDGLRVFDPEEDAIDYWESMEGMLVAVDDAKILGP
MKNKEIYVLPGSSTRPLNNSGGVLLPANSYNTDVIPVLFKKGKQIIKAGDSYKGRLAGPVSYSYGNYKVFVDDSKNMPSLMDGHLKPE
KTNLQKDLSKLSIASYNIENFSANPSSTKDEKVKRIAESFIHDLNAPDIIGLIEVQDNNGPTDDGTTDATQSAQRLIDAIKKLGGPTYRYV
DIAPENNVDGGQPGGNIRTGFLYQPERVSLSDKPKGGARDALTWVNGELNLSVGRIDPTNAAWKDVRKSLAAEFIFQGRKVVVVAN
HLNSKRGDNALYGCVQPVTFKSEQRRHVLANMLAQFAKEGAKHQANIVMLGDFNDFEFTKTIQLIEEGDMVNLVSRHDISDRYSYFH
QGNNQTLDNILVSRHLLDHYEFDMVHVNSPFMEAHGRASDHDPLLLQLSFSKENDKAESSKQSVKAKKTSKGKLLPKTGDSLVYVITL
LGTASLLVPILLLTKGKKES
SPy0777
Seq ID 188
VISFAPFLSPEAIKHLQENERCRDQSQKRTAQQIEAIYTSGQNILVSASAGSGKTFVMVERILDKILRGVSIDRLFISTFTVKAATELRERI
ENKLYSQIAQTTDFQMKVYLTEQLQSLCQADIGTMDAFAQKVVSRYGYSIGISSQFRIMQDKAEQDVLKQEVFSKLFNEFMNQKEAPV
FRALVKNFSGNCKDTSAFRELVYTCYSFSQSTENPKIWLQENFLSAAKTYQRLEDIPDHDIELLLLAMQDTANQLRDVTDMEDYGQLT
KAGSRSAKYTKHLTIIEKLSDWVRDFKCLYGKAGLDRLIRDVTGLIPSGNDVTVSKVKYPVFKTLHQKLKQFRHLETILMYQKDCFSLLE
QLQDFVLAFSEAYLAVKIQESAFEFSDIAHFAIKILEENTDIRQSYQQHYHEVMVDEYQDNNHMQERLLTLLSNGHNRFMVGDIKQSIY
RFRQADPQIFNQKFRDYQKKPEQGKVILLKENFRSQSEVLNVSNAVFSHLMDESVGDVLYDEQHQLIAGSHAQTVPYLDRRAQLLLY
NSDKDDGNAPSDSEGISFSEVTIVAKEIIKLHNDKGVPFEDITLLVSSRTRNDIISHTFNQYGIPIATDGGQQNYLKSVEVMVMLDTLRTI
NNPRNDYALVALLRSPMFAFDEDDLARIALQKDNELDKDCLYDKIQRAVIGRGAHPELIHDTLLGKLNVFLKTLKSWRRYAKLGSLYDL
IWKIFNDRFYFDFVASQAKAEQAQANLYALALRANQFEKSGYKGLYRFIKMIDKVLETQNDLADVEVATPKQAVNLMTIHKSKGLQFPY
VFILNCDKRFSMTDIHKSFILNRQHGIGIKYLADIKGLLGETTLNSVKVSMETLPYQLNKQELRLATLSEEMRLLYVAMTRAEKKVYFIGK
ASKSKSQEITDPKKLGKLLPLALREQLLTFQDWLLAIADIFSTEDLYFDVRFIEDSDLTQESVGRLQTPQLLNPDDLKDNRQSETIARAL
DMLEAVSQLNANYEAAIHLPTVRTPSQLKATYEPLLEPIGVDIIEKSSRSLSDFTLPHFSKKAKVEASHIGSALHQLMQVLPLSKPINQQ
TLLDALRGIDSNEEVKTALDLKKIESFFCDTSLGQFFQTYQKHLYREAPFAILKLDPISQEEYVLRGIIDAYFLFDDHIVLVDYKTDKYKQP
IELKKRYQQQLELYAEALTQTYKLPVTKRYLVLMGGGKPEIVEV
SPy0789
Seq ID 189
MVKTDFKLRYQGSAIGYLWSILKPLMMFTIMYLVFIRFLRLGGNVPHFPVALLLANVIWSFFSEATSMGMVSIVSRGDLLRKLNFSKHII
VFSAVLGALINFLINLVVVLIFALINGVTISGYAYLSLFLFIELVVLVLGIALLLSNVFVYYRDLAQVWEVLLQAGMYATPIIYPITFVLDSHPL
AAKLLMLNPVAQMIQDFRYLLIDRANVTIWQMSTNWFYIVIPYLVPFVILFIGIFVFKKNADRFAEII
SPy0839
Seq ID 190
MTFLSDLISLMTKIRLSWVIKAGIFQLLFVTIANIVLSEFFYFILDVTGQYHLDKDNVVTFLKNPIALALLGAYLFLLAAFIHLEFFALYRIIAD
QEISFYLFRKQFSYYLRGLWKTFSGYQLLLFLLYILLTIPVLHIGLSSVITQKLYLPEFIVGELSKITSTKYLLYGSLILVFYLNLRLVYFLPLI
AINHRTVAQAWRESWQKTKKKHVLLWMKLFAINGLTIVVLSLAISMILIFVDMFNPKGNNIIVQLGALTFTWELIFFTTIFFKLCSAMILKE
AIEPQKQYDEPRRSNKAYVVIFIVVTVGFAYQSLERLTFFDTSHSKTVIAHRGLVSAGVENSLEALEGAKKAGSDYVELDLILTKDNHFV
VSHDNRLKRLAGVNKTIRNLTLKEVEHLTSHQGHFSGRFVSFDTFYQKAKKLNMPLLIELKPIGTEPGNYVDLFLETYHRLGISKDNKV
MSLDLEVIEAIKKKNPSITTGYIIPIQFGFFGDEFVDFYVIEDFSYRSYLSSQAFWNNKEIYVWTINDPKRIEHYLLKPIQGIITDQPALTNQ
LIKDLKQDNSYFSRLVRIISSLY
SPy0843
Seq ID 191
MKKHLKTVALTLTTVSVVTHNQEVFSLVKEPILKQTQASSSISGADYAESSGKSKLKINETSGPVDDTVTDLFSDKRTTPEKIKDNLAKG
PREQELKAVTENTESEKQITSGSQLEQSKESLSLNKTVPSTSNWEICDFITKGNTLVGLSKSGVEKLSQTDHLVLPSQAADGTQLIQVA
SFAFTPDKKTAIAEYTSRAGENGEISQLDVDGKEIINEGEVFNSYLLKKVTIPTGYKHIGQDAFVDNKNIAEVNLPESLETISDYAFAHLA
LKQIDLPDNLKAIGELAFFDNQITGKLSLPRQLMRLAERAFKSNHIKTIEFRGNSLKVIGEASFQDNDLSQLMLPDGLEKIESEAFTGNP
GDDHYNNRVVLWTKSGKNPSGLATENTYVNPDKSLWQESPEIDYTKWLEEDFTYQKNSVTGFSNKGLQKVKRNKNLEIPKQHNGVT
ITEIGDNAFRNVDFQNKTLRKYDLEEVKLPSTIRKIGAFAFQSNNLKSFEASDDLEEIKEGAFMNNRIETLELKDKLVTIGDAAFHINHIYA
IVLPESVQEIGRSAFRQNGANNLIFMGSKVKTLGEMAFLSNRLEHLDLSEQKQLTEIPVQAFSDNALKEVLLPASLKTIREEAFKKNHLK
QLEVASALSHIAFNALDDNDGDEQFDNKVVVKTHHNSYALADGEHFIVDPDKLSSTIVDLEKILKLIEGLDYSTLRQTTQTQFRDMTTA
GKALLSKSNLRQGEKQKFLQEAQFFLGRVDLDKAIAKAEKALVTKKATKNGQLLERSINKAVLAYNNSAIKKANVKRLEKELDLLTGLV
EGKGPLAQATMVQGVYLLKTPLPLPEYYIGLNVYFDKSGKLIYALDMSDTIGEGQKDAYGNPILNVDEDNEGYHALAVATLADYEGLDI
KTILNSKLSQLTSIRQVPTAAYHRAGIFQAIQNAAAEAEQLLPKPGTHSEKSSSSESANSKDRGLQSNPKTNRGRHSAILPRTGSKGSF
VYGILGYTSVALLSLITAIKKKKY
SPy0872
Seq ID 192
MKKYFILKSSVLSILTSFTLLVTDVQADQVDVQFLGVNDFHGALDNTGTAYTPSGKIPNAGTAAQLGAYMDDAEIDFKQANQDGTSIRV
QAGDMVGASPANSALLQDEPTVKVFNKMKFEYGTLGNHEFDEGLDEFNRIMTGQAPDPESTINDITKQYEHEASHQTIVIANVIDKKT
KDIPYGWKPYAIKDIAINDKIVKIGFIGVVTTEIPNLVLKQNYEHYQFLDVAETIAKYAKELQEQHVHAIVVLAHVPATSKDGVVDHEMAT
VMEKVNQIYPEHSIDIIFAGHNHQYTNGTIGKTRIVQALSQGKAYADVRGTLDTDTNDFIKTPSANVVAVAPGIKTENSDIKAIINHANDIV
KTVTERKIGTATNSSTISKTENIDKESPVGNLATTAQLTIAKKTFPTVDFAMTNNGGIRSDLVVKNDRTITWGAAQAVQPFGNILQVIQM
TGQHIYDVLNQQYDENQTYFLQMSGLTYTYTDNDPKNSDTPFKIVKVYKDNGEEINLTTTYTVVVNDFLYGGGDGFSAFKKAKLIGAIN
TDTEAFITYITNLEASGKTVNATIKGVKNYVTSNLESSTKVNSAGKHSIISKVFRNRDGNTVSSEVISDLLTSTENTNNSLGKKETTTNKN
TISSSTLPITGDNYKMSPIMTILALISLGGLNAFIKKRKS
SPy0895
Seq ID 193
MTNNQTLDILLDVYAYNHAFRIAKALPNIPKTALYLLE MLKERRELNLAFLAEHAAENRTIEDQYHCSLWLNQSLEDEQIANYILDLEVKV
KNGAIIDFVRSVSPILYRLFLRLITSEIPNFKAYIFDTKNDQYDTWHFQAMLESDHEVFKAYLSQKQSRNVTTKSLADMLTLTSLPQEIKD
LVFLLRHFEKAVRNPLAHLIKPFDEEELHRTTHFSSQAFLENIITLATFSGVIYRREPFYFDDMNAIIKKELSLWRQSIV
SPy0972
Seq ID 194
MKTTSLIKVDLPSTIGIGYGAFWRSRNFYRVVKGSRGSKKSKTTALNFIVRLLKYPWANLLVIRRYSNTNKQSTYTDFKWACNQLKVT
HLFKFNESLPEITVKATGQKILFRGLDDELKITSITVDVGALCWAWFEEAYQIETEDKFSTVVESIRGSLDAPDFFKQITVTFNPWSERH
VVLKRVFFDEETKRADTFSGTTTFRVNEWLDDVDKRRYEDLYKTNPRRARIVCDGEWGVAEGLVFDNFEVVDFDVEKTIQRVKETSA
GMDFGFTQDPTTLICVAVDLANKELWLYNEHYQKAMLTDHIVKMIRDKNLHRSYIAGDSAEKRLIAEIKSKGVSGIVPSIKGKGSIMQGI
QFMQGFKIYIHPSCEHTIEEFNTYTFKQDKEGNWLNEPIDKNNHVIDAIRYALEKYHIRSNESNQFEVLRAGFGY
SPy0981
Seq ID 195
MAEETQTVETVEEQVVPEAKQPQDEKKYTDADVDAIIDKKFAKWKSEQEAEKSEAKKMAKMNEKEKADYEKQKLLDELQELKNDKT
RNELTAVARQMFAESEINVNDDVLGLVVTLDAEQTKANVTTLANAFAKVIADDRKALVRQTTPSTGGGLSKQTNYGANLASKAAQQS
TKLF
SPy1008
Seq ID 196
MRYNCRYSHIDKKIYSMIICLSFLLYSNVVQANSYNTTNRHNLESLYKHDSNLIEADSIKNSPDIVTSHMLKYSVKDKNLSVFFEKDWIS
QEFKDKEVDIYALSAQEVCECPGKRYEAFGGITLTNSEKKEIKVPVNVWDKSKQQPPMFITVNKPKVTAQEVDIKVRKLLIKKYDIYNN
REQKYSKGTVTLDLNSGKDIVFDLYYFGNGDFNSMLKIYSNNERIDSTQFHVDVSIS
SPy1032
Seq ID 197
VNTYFCTHHKQLLLYSNLFLSFAMMGQGTAIYADTLTSNSEPNNTYFQTQTLTTTDSEKKVVQPQQKDYYTELLDQWNSIIAGNDAYD
KTNPDMVTFHNKAEKDAQNIIKSYQGPDHENRTYLWEHAKDYSASANITKTYRNIEKIAKQITNPESCYYQDSKAIAIVKDGMAFMYEH
AYNLDRENHQTTGKENKENWWVYEIGTPRAINNTLSLMYPYFTQEEILKYTAPIEKFVPDPTRFRVRAANFSPFEANSGNLIDMGRVK
LISGILRKDDLEISDTIKAIEKVFTLVDEGNGFYQDGSLIDHVVTNAQSPLYKKGIAYTGAYGNVLIDGLSQLIPIIQKTKSPIKADKMATIYH
WINHSFFPIIVRGEMMDMTRGRSISRFNAQSHVAGIEALRAILRIADMSEEPHRLALKTRIKTLVTQGNAFYNVYDNLKTYHDIKLMKEL
LSDTSVPVQKLDSYVASFNSMDKLALYNNKHDFAFGLSMFSNRTQNYEAMNNENLHGWFTSDGMFYLYNNDLGHYSENYWATVNP
YRLPGTTETEQKPLEGTPENIKTNYQQVGMTGLSDDAFVASKKLNNTSALAAMTFTNWNKSLTLNKGWFILGNKIIFVGSNIKNQSSH
KAYTTIEQRKENQKYPYCSYVNNQPVDLNNQLVDFTNTKSIFLESDDPAQNIGYYFFKPTTLSISKALQTGKWQNIKADDKSPEAIKEV
SNTFITIMQNHTQDGDRYAYMMLPNMTRQEFETYISKLDIDLLENNDKLAAVYDHDSQQMHVIHYGKKATMFSNHNLSHQGFYSFPH
PVRQNQQ
SPy1054
Seq ID 198
LLTFGGASAVKAEENEKVREQEKLIQQLSEKLVEINDLQTLNGDKESIQSLVDYLTRRGKLEEEWMEYLNSGIQRKLFVGPKGPAGEK
GEQGPTGKQGERGETGPAGPRGDKGETGDKGAQGPVGPAGKDGQNGKDGLPGKDGKDGQNGKDGLPGKDGKDGQDGKDGLP
GKDGKDGQNGKDGLPGKDGQPGKPAPKTPEVPQNPDTAPHTPKTPRIPGQSKDVTPAPQNPSNRGLNKPQTQGGNQLAKTPAAH
DTHRQLPATGETTNPFFTAAAVAIMTTAGVVAVAKRQENN
SPy1063
Seq ID 199
MYIFSSSKKDSAKELVILTPNSQTILTGTIPAFEEKYGVKVRLIQGGTGQLIDQLGRKDKPLNADIFFGGNYTQFESHKDLFESYVSPQV
STVISDYQLPSHRATPYTINGSVLIVNNELARGLHITSYEDLLQPALKGKIAFADPNSSSSAFSQLTNILLAKGGYTNADAWAYMKRLLV
NMNSIRATSSSEVYQSVAEGKMIVGLTYEDPCINLQKSGANVSIVYPKEGTVFVPSSVAIIKHAPNMTEAKLFINFMLSRDVQNAFGQS
TSNRPIRQDAQTSHDMKALETIATLKEDYAYVTKHKKKIVATYNQLRQRLEKAK
SPy1162
Seq ID 200
MPTSIKAIKESLEAVTSLLDPLFQELATDTRSGVQKALKSRQKVIQAELAEEERLEAMLSYEKALYKKGYKAIAGIDEVGRGPLAGPVVA
ACVILPKYCKIKGLNDSKKIPKAKHETIYQAVKEKALAIGIGIIDNQLIDEVNIYEATKLAMLEAIKQLEGQLTQPDYLLIDAMTLDIAISQQSI
LKGDANSLSIAAASIVAKVTRDQMMANYDRIFPGYDFAKNAGYGTKEHLQGLKAYGITPIHRKSFEPVKSMCCDSTNP
SPy1206
Seq ID 201
MTVKEETMSILEVKQLSHGFGDRAIFENVSFRLLKGEHIGLVGANGEGKSTFMSIVTGHLQPDEGKVEWSKYVTAGYLDQHTVLESG
QTVRDVLRTAFDELFKTENRINEIYASMADDKADIAVLMEEVGELQDRLESRDFYTLDAKIDEVARALGVMDFGMESDVTSLSGGQRT
KVLLAKLLLEKPDILLLDEPTNHLDAEHIEWLKRYLQHYENAFVLISHDISFLNDVINIVYHVENQSLVRYTGDYYQFQAVYEMKQSQLE
AAYERQQKEIANLQDFVNRNKARVATRNMAMSRQKKLDKMDIIELQAEKPKPNFEFKQARTPSRFIFQTKNLVIGYDYPLTKEPLNITF
ERNQKIAIVGANGIGKSTLLKSLLGVIEPLEGHIVTGDFLEVGYFEQEVTGVNRQTPLEVVWDAFPALNQAEVRAALARCGLTSKHIES
QIQVLSGGEQAKVRFCLLMNRENNVLILDEPTNHLDIDAKNELKRALKAYKGSILMVCHEPDFYNGWVTDTWDFSKLT
SPy1228
Seq ID 202
MNKKFIGLGLASVAVLSLAACGNRGASKGGASGKTDLKVAMVTDTGGVDDKSFNQSAWEGLQSWGKEMGLQKGTGFDYFQSTSE
SEYATNLDTAVSGGYQLIYGIGFALKDAIAKAAGDNEGVKFVIIDDIIEGKDNVASVTFADHEAAYLAGIAAAKTTKTKTVGFVGGMEGT
VITRFEKGFEAGVKSVDDTIQVKVDYAGSFGDAAKGKTIAAAQYAAGADVIYQAAGGTGAGVFNEAKAINEKRSEADKVWVIGVDRD
QKDEGKYTSKDGKEANFVLASSIKEVGKAVQLINKQVADKKFPGGKTTVYGLKDGGVEIATTNVSKEAVKAIKEAKAKIKSGDIKVPEK
SPy1245
Seq ID 203
MKMKKKFFLLSLLALSTFFLSACSSWIDKGESITAVGSTALQPLVEAVADEFGSSNLGKTVNVQGGGSGTGLSQVQSGAVQIGNSDV
FAEEKDGIDASKLVDHQVAVAGLAVIANPKVKVSNLSSQQLQKIFSGEYTNWKQVGGEDLAISVINRAASSGSRATFDSVIMKGVNAK
QSQEQDSNGMVKSIVSQTPGAISYLSFAYVDSSVKSLQLNGFKANAKNVATNDWPIWSYEHMYTKDKPTGLTKEFLDYMFSDEVQQ
NIVTHMGYISINDMEVVKSHDGKVTKR
SPy1315
Seq ID 204
MTHKIKVLLLAIMSIFLTCNIASAETIAIVSDTAYAPFEFKDSDQIYKGIDVDIINEVAKRQSWDFSMSFPGFDAAVNAVQSGQASALMAG
TTITNARKKVFHFSEPYYDTKIVIATRKANAIKKYSDLKGKTVGVKNGTAAQAFLNNYKKKYDYTVKTFDTGDLMYNSLSAGSIAAVMD
DEAVIQYAISQNQDIAINMKGEPIGSFGFAVKKGSGYDYLVNDFNTALKAMKADGTYQAIMTKWLGTDDKATTSQATGNPSAKATPTK
DSYKIVSDSSFAPFEFQNGKGKYVGIDIELIKAIAKQQGFKIEIANPGFDAALNAVQSSQADGVIAGATITDARKAIFDFSDPYYTSNIILA
VKAGKNIKNYEDLDRKTVGAKNGTSSYSWLKENAPKYGYNVKAFDDGSSMYDSLNSGSVDAIMDDEAVLKYAISQGRRFETPLEGIS
TGEVGFAVKKGTNPELIEMFNNGLAALKKSGQYDDIIDKYLDSKKAATPSEKGADESTISGLLSNNYKQLLAGLGTTLSLTLISFAIAIIIGI
IFGMMAVSPTKSLRLISTVFVDVVRGIPLMIVAAFIFWGVPNLIESMTGHQSPINDFLAATIALSLNGGAYIAEIVRGGIEAVPAGQMEAS
RSLGLSYGTTMRKVILPQAVKLMLPNFINQFVISLKDTTIVSAIGLVELFQTGKIIIARNYQSFRMYAILAIIYLIMIILLTRLAKRLEKRLN
SPy1357
Seq ID 205
MGKEIKVKCFLRRSAFGLVAVSASVLVGSTVSAVDSPIEQPRIIPNGGTLTNLLGNAPEKLALRNEERAIDELKKQAIEDKEATTAIEAAS
SDALEALADQTDALQSEEAAVVKADNAASDALEALADQTDALQSEEAEVVQSDNAASDAWEKAATPIALDVKKTKDTKPVVKKEERQ
NVNTLPTTGEESNPFFTAAALAIMVSTGVLVVSSKCKEN
SPy1361
Seq ID 206
MKTKKVIILVGLLLSSQLTLIACQSRGNGTYPIKTKQSRKGMTSNKIKPIKKSKKTNKTHKGVAGVDFPTDDGFILTKDSKILSKTDQGIV
VDHDGHSHFIFYADLKGSPFEYLIPKGASLAKPAVAQRAASQGTSKVADPHHHYEFNPADIVAEDALGYTVRHDDHFHYILKSSLSGQ
TQAQAKQVATRLPQTSSLVSTATANGIPGLHFPTSDGFQFNGQGIVGVTKDSILVDHDGHLHPISFADLRQGGWAHVADQYDPAKKA
EKPAETHQTPELSEREKEYQEKLAYLAEKLGIDPSTIKRVETQDGKLGLEYPHHDHAHVLMLSDIEIGKDIPDPHAIEHARELEKHKVG
MDTLRALGFDEEVILDIVRTHDAPTPFPSNEKDPNMMKEWLATVIKLDLGSRKDPLQRKGLSLLPNLETLGIGFTPIKDISPVLQFKKLK
QLLMTKTGVTDYRFLDNMPQLEGIDISQNNLKDISFLSKYKNLTLVAAADNGIEDIRPLGQLPNLKFLVLSNNKISDLSPLASLHQLQELH
IDNNQITDLSPVSHKESLTVVDLSRNADVDLATLQAPKLETLMVNDTKVSHLDFLKNNPNLSSLSINRAQLQSLEGIEASSVIVRVEAEG
NQIKSLVLKDKQGSLTFLDVTGNQLTSLEGVNNFTALDILSVSKNQLTNVNLSKPNKTVTNIDISHNNISLADLKLNEQHIPEAIAKNFPA
VYEGSMVGNGTAEEKAAMATKAKESAQEASESHDYNHNHTYEDEEGHAHEHRDKDDHDHEHEDENEAKDEQNHAD
SPy1371
Seq ID 207
LAKQYKNLVNGEWKLSENEITIYAPATGEELGSVPAMTQAEVDAVYASAKKALSDWRALSYVERAAYLHKAADILVRDAEKIGAILSKE
VAKGHKAAVSEVIRTAEIINYAAEEGLRMEGEVLEGGSFEAASKKKIAIVRREPVGLVLAISPFNYPVNLAGSKIAPALIAGNVVALKPPT
QGSISGLLLAEAFAEAGIPAGVFNTITGRGSVIGDYIVEHEAVSFINFTGSTPIGEGIGKLAGMRPIMLELGGKDSAIVLEDADLALAAKNI
VAGAFGYSGQRCTAVKRVLVMDKVADQLAAEIKTLVEKLSVGMPEDDADITPLIDTSAADFVEGLIKDATDKGATALTAFNREGNLISP
VLFDHVTTDMRLAWEEPFGPVLPIIRVTTVEEAIKISNESEYGLQASIFTTNFPKAFGIAEQLEVGTVHLNNKTQRGTDNFPFLGAKKSG
AGVQGVKYSIEAMTTVKSVVFDIQ
SPy1375
Seq ID 208
MSLKDLGDISYFRLNNEINRPVNGKIPLHKDKEALKAFSAENVLPNTMSFTSITEKIEYLISNDYIESAFIQKYRPEFITELDSIIKSENFRF
KSFMAAYKFYQQYALKTNDGEHYLENLEDRVLFNALYFADGQEDLAKDLAVEMINQRYQPATPSFLNAGRSRRGELVSCFLIQVTDD
MNSIGRSINSALQLSRIGGGVGITLSNLREAGAPIKGYAGAASGVVPVMKLFEDSFSYSNQLGQRQGAGVVYLNVFHPDIIAFLSTKKE
NADEKVRVKTLSLGITVPDKFYELARKNEDMYLFSPYNVEKEYGIPFNYLDITNMYDELVANPKITKTKIKARDLETEISKLQQESGYPYI
INIDTANKANPIDGKIIMSNLCSEILQVQTPSLINDAQEFVEMGTDISCNLGSTNILNMMTSPDFGRSIKTMTRALTFVTDSSSIEAVPTIK
HGNSQAHTFGLGAMGLHSYLAQHHIEYGSPESIEFTDIYFMLLNYWTLVESNNIARERQTTFVGFENSKYANGSYFDKYVTGHFVPKS
DLVKDLFKDHFIPQASDWEALRDAVQKDGLYHQNRLAVAPNGSISYINDCSASIHPITQRIEERQEKKIGKIYYPANGLSTDTIPYYTSA
YDMDMRKVIDVYAAATEHVDQGLSLTLFLRSELPMELYEWKTQSKQTTRDLSILRNYAFNKGIKSIYYIRTFTDDGEEVGANQCESCVI
SPy1389
Seq ID 209
MKELSSAQIRQMWLDFWKSKGHCVEPSANLVPVNDPTLLWINSGVATLKKYFDGSVIPENPRITNAQKSIRTNDIENVGKTARHHTMF
EMLGNFSIGDYFRDEAIEWGFELLTSPDWFDFPKDKLYMTYYPDDKDSYNRWIACGVEPSHLVPIEDNFWEIGAGPSGPDTEIFFDR
GEDFDPENIGLRLLAEDIENDRYIEIWNIVLSQFNADPAVPRSEYKELPNKNIDTGAGLERLAAVMQGAKTNFETDLFMPIIREVEKLSG
KTYDPDGDNMSFKVIADHIRALSFAIGDGALPGNEGRGYVLRRLLRRAVMHGRRLGINETFLYKLVPTVGQIMESYYPEVLEKRDFIEK
IVKREEETFARTIDAGSGHLDSLLAQLKAEGKDTLEGKDIFKLYDTYGFPVELTEELAEDAGYKIDHEGFKSAMKEQQDRARAAVVKG
GSMGMQNETLAGIVEESRFEYDTYSLESSLSVIIADNERTEAVSEGQALLVFAQTPFYAEMGGQVADTGRIKNDKGDTVAEVVDVQK
APNGQPLHTVNVLASLSVGTNYTLEINKERRLAVEKNHTATHLLHAALHNVIGEHATQAGSLNEEEFLRFDFTHFEAVSNEELRHIEQE
VNEQIWNALTITTTETDVETAKEMGAMALFGEKYGKVVRVVQIGNYSVELCGGTHLNNSSEIGLFKIVKEEGIGSGTRRIIAVTGRQAF
EAYRNQEDALKEIAATVKAPQLKDAAAKVQALSDSLRDLQKENAELKEKAAAAAAGDVFKDVQEAKGVRFIASQVDVADAGALRTFA
DNWKQKDYSDVLVLVAAIGEKVNVLVASKTKDVHAGNMIKELAPIVAGRGGGKPDMAMAGGSDASKIAELLAAVAEIV
SPy1390
Seq ID 210
MKNSNKLIASVVTLASVMALAACQSTNDNTKVISMKGDTISVSDFYNETKNTEVSQKAMLNLVISRVFEAQYGDKVSKKEVEKAYHKT
AEQYGASFSAALAQSSLTPETFKRQIRSSKLVEYAVKEAAKKELTTQEYKKAYESYTPTMAVEMITLDNEETAKSVLEELKAEGADFTA
IAKEKTTTPEKKVTYKFDSGATNVPTDVVKAASSLNEGGISDVISVLDPTSYQKKFYIVKVTKKAEKKSDWQEYKKRLKAIIIAEKSKDM
NFQNKVIANALDKANVKIKDKAFANILAQYANLGQKTKAASESSTTSESSKAAEENPSESEQTQTSSAEEPTETEAQTQEPAAQ
SPy1422
Seq ID 211
VLYPTPIAKLIDSYSKLPGIGIKTATRLAFYTIGMSNEDVNDFAKNLLAAKRELTYCSICGNLTDDDPCHICTDTSRDQTTILVVEDAKDV
SAMEKIQEYHGYYHVLHGLISPMNGVGPDDINLKSLITRLMDGKVSEVIVATNATADGEATSMYISRVLKPAGIKVTRLARGLAVGSDIE
YADEVTLLRAIENRTEL
SPy1436
Seq ID 212
MDMSKSNRRTWQGLVVILIAILTTFTTSTVTAARKIRNFPDTTEILLGTKATETPGILPFTGSYQLVLGDLDNLQRPTFAHIQLKDQDEPN
IKRKGLKFNPPGWHNYKLTDANGKTTWLMDRGHLVGYQFSGLNDEPKNLVTMTKYLNTGFSDKNPLGMLYYENRLDSWLALHPNF
WLDYKVTPVYHKNELVPRQVVLQYVGIDENGDLLQIKLGSEKESVDNFGVTSVTLDNVSPLAELDYQTGMMLDSTQNEEDSNLETEE
FEEAA
SPy1494
Seq ID 213
MTSKKACLSSIIVLASLTCGNDTVSANHLSATGDKFDDCSTLVEKDVAPKDELEMLAWSSSQTTDDADRDYEDFLDDDSFISQNETDK
MFENLTDDRLLNELDELDEENEEDEEDTIEPEQNVIMPSDDELFDLTDAVETRLTVSSAPHLEAELPKPHLRSLSDTALRSGEIRGHLD
NKLDALSVTATKLALTMAQKFDLTTHVYSIGESFSEVLAAHYEDRKAESAFSKKKRFHLPIATPDVVIEELRRLVSSIGSSKEDVSVPYS
RKLGMAVAKRKIALPQTGERFSYYPVLLGLMILGLTPIMIPKKINN
SPy1523
Seq ID 214
MAKDKEKQSDDKLVLTEWQKRNIEFLKKKKQQAEEEKKLKEKLLSDKKAQQQAQNASEAVELKTDEKTDSQEIESETTSKPKKTKKV
RQPKEKSATQIAFQKSLPVLLGALLLMAVSIFMITPYSKKKEFSVRGNHQTNLDELIKASKVKASDYWLTLLTSPGQYERPILRTIPWVK
SVHLSYQFPNHFLFNVIEFEIIAYAQVENGFQPILENGKRVDKVRASELPKSFLILNLKDEKAIQQLVKQLTTLPKKLVKNIKSVSLANSKT
TADLLLIEMHDGNVVRVPQSQLTLKLPYYQKLKKNLENDSIVDMEVGIYTTTQEIENQPEVPLTPEQNAADKEGDKPGEHQEQTDNDS
ETPANQSSPQQTPPSPETVLEQAHG
SPy1536
Seq ID 215
MKRLKKIKWWLVGLLALISLLLALFFPLPYYIEMPGGAYDIRTVLQVNGKEDKRKGAYQFVAVGISRASLAQLLYAWLTPFTEISTAEDT
TGGYSDADFLRINQFYMETSQNAAIYQALSLAGKPVTLDYKGVYVLDVNNESTFKGTLHLADTVTGVNGKQFTSSAELIDYVSHLKLG
DEVTVQFTSDNKPKKGVGRIIKLKNGKNGIGIALTDHTSVNSEDTVIFSTKGVGGPSAGLMFTLDIYDQITKEDLRKGRTIAGTGTIGKD
GEVGDIGGAGLKVVAAAEAGADIF FVPNNPVDKEIKKVNPNAISNYEEAKRAAKRLKTKMKIVPVTTVQEALVYLRK
SPy1564
Seq ID 216
MLEHKIDFMVTLEVKEANANGDPLNGNMPRTDAKGYGVMSDVSIKRKIRNRLQDMGKSIFVQANERIEDDFRSLEKRFSQHFTAKTP
DKEIEEKANALWFDVRAFGQVFTYLKKSIGVRGPVSISMAKSLEPIVISSLQITRSTNGMEAKNNSGRSSDTMGTKHFVDYGVYVLKG
SINAYFAEKTGFSQEDAEAIKEVLVSLFENDASSARPEGSMRVCEVFWFTHSSKLGNVSSARVFDLLEYHQSIEEKSTYDAYQIHLNQ
EKLAKYEAKGLTLEILEGL
SPY1604
Seq ID 217
MATKKVHIISHSHWDREWYMAYEQHHMRLINLIDDLLEVFQTDPDFHSFHLDGQTIILDDYLKVRPEREPEIRQAIASGKLRIGPFYILQ
DDFLTSSESNVRNMLIGKEDCDRWGASVPLGYFPDTFGNMGQTPQLMLKAGLQAAAFGRGIRPTGFNNQVDTSEKYSSQFSEISW
QGPDNSRILGLLFANWYSNGNEIPTTEAEARLFWDKKLADAERFASTKHLLMMNGCDHQPVQLDVTKAIALANQLYPDYEFVHSCFE
DYLADLADDLPENLSTVQGEITSQETDGWYTLANTASARIYLKQANTRVSRQLENITEPLAAMAYEVTSTYPHDQLRYAWKTLMQNH
PHDSICGCSVDSVHREMMTRFEKAYEVGHYLAKEAAKQIADAIDTRDFPMDSQPFVLFNTSGHSKTSVAELSLTWKKYHFGQRFPKE
VYQEAQEYLARLSQSFQIIDTSGQVRPEAEILGTSIAFDYDLPKRSFREPYFAIKVRLRLPITLPAMSWKTLALKLGNETTPSETVSLYD
DSNQCLENGFLKVMIQTDGRLTITDKQSGLIYQDLLRFEDCGDIGNEYISRQPNHDQPFYADQGTIKLNIISNTAQVAELEIQQTFAIPIS
ADKLLQAEMEAVIDITERQARRSQEKAELTLTTLIRMEKNNPRLQFTTRFDNQMTNHRLRVLFPTHLKTDHHLADSIFETVKRPNHPDA
TFWKNPSNPQHQECFVSLFDGENGVTIGNYGLNEYEILPDTNTIAITLLRSVGEMGDWGYFPTPEAQCLGKHSLSYSFESITKQTQFA
SYWRAQEGQVPVITTQTNQHEGTLAAEYSYLTGTNDQVALTAFKRRLADNALITRSYNLSNDKTCDFSLSLPNYNAKVTNLLEKDSKQ
STPSQLGKAEILTLAWKKQ
SPy1607
Seq ID 218
MKITKIEKKKRLYLIELDNDESLYVTEDTIVRFMLSKDKVLDNDQLEDMKHFAQLSYGKNLALYFLSFQQRSNKQVADYLRKHEIEEHIIA
DIITQLQEEQWIDDTKLADTYIRQNQLNGDKGPQVLKQKLLQKGIASHDIDPILSQTDFSQLAQKVSQKLFDKYQEKLPPKALKDKITQA
LLTKGFSYDLAKHSLNHLNFDQDNQEIEDLLDKELDKQYRKLSRKYDGYTLKQKLYQALYRKGYNSDDINCKLRNYL
SPy1615
Seq ID 219
MICLLCQQISQTPISITEIIFLRRISSPICQQCQKSFQKIGKSVCATCCANSDIIACRDCLKWENKGYNVNHRSLYCYNAAMKAYFSQYKF
QGDYLLRKVFAVELADVITKYYKGYIPVPVPVSPGCFRERQFNQVSAILEAANVSYLSLFEKLDNTHQSSRTKKERLLVEKSYRLLKVS
NIPDKILIVDDIYTTGSTIIALRKQLAKVANSDIKSLSIAR
SPy1666
Seq ID 220
MKSFSLTFSFLNLLKYGTIKVMTKEFHHVTVLLHETVDMLDIKPDGIYVDATLGGSGHSAYLLSKLGEEGHLYCFDQDQKAIDNAQVTL
KSYIDKGQVTFIKDNFRHLKARLTALGVDEIDGILYDLGVSSPQLDERERGFSYKQDAPLDMRMDRQSLLTAYEVVNTYPFNDLVKIFF
KYGEDKFSKQIARKIEQARAIKPIETTTELAELIKAAKPAKELKKKGHPAKQIFQAIRIEVNDELGAADESIQDAMELLALDGRISVITFHSL
EDRLTKQLFKEASTVDVPKGLPLIPEDMKPKFELVSRKPILPSHSELTANKRAHSAKLRVAKKIRK
SPy1727
Seq ID 221
VTTTEQELTLTPLRGKSGKAYKGTYPNGECVFIKLNTTPILPALAKEQIAPQLLWAKRMGNGDMMSAQEWLNGRTLTKEDMNSKQIIH
ILLRLHKSKKLVNQLLQLNYKIENPYDLLVDFEQNAPLQIQQNSYLQAIVKELKRSLPEFKSEVATIVHGDIKHSNWVITTSGMIFLVDWD
SVRLTDRMYDVAYLLSHYIPRSRWSEWLSYYGYKNNDKVMQKIIWYGQFSHLTQILKCFDKRDMEHVNQEIYALRKFREIFRKK
SPy1785
Seq ID 222
MILTAPMSNLKGFGPKSAEKFQKLDIYTVEDLLLYYPFRYEDFKSKSVFDLVDGEKAVITGLVVTPANVQYYGFKRNRLSFKLRQGEAV
LNVSFFNQPYLADKIELGQEVAVFGKWDATKSAITGMKVLAQVEDDMQPVYRVAQGISQSTLIKAIKSAFEIDAHLELKENLPATLLEKY
RLMGRSQACLAMHFPKDITEYKQALRRIKFEELFYFQMNLQVLKAENKSETNGLPILYSKRAMETKISSLPFILTNAQKRSLDDILSDMS
SGAHMNRLLQGDVGSGKTVIAGLSMYAAYTAGFQSALMVPTEILAEQHYISLQELFPDLSIAILTSGMKAAVKRTVLAAIANGSVDMIV
GTHALIQDSVQYHKLGLVITDEQHRFGVKQRRIFREKGENPDVLMMTATPIPRTLAITAFGEMDVSIIDELPAGRKPIMTRVVVKHEQLG
TVLEWVKGELQKDAQVYVISPLIEESEALDLKNAVALHAELSTYFEGIAKVALVHGRMKNDEKDAIMQDFKDKKSHILVSTTVIEVGVNV
PNATIMIIMDADRFGLSQLHQLRGRVGRGYKQSYAVLVANPKTDSGKKRMTIMTETTDGFVLAESDLKMRGSGEIFGTRQSGIPEFQV
ADIVEDYPILEEARKVSAAIVSDPNWIYEKQWQLVAQNIRKKEVYD
SPy1798
Seq ID 223
MKKISKCAFVAISALVLIQATQTVKSQEPLVQSQLVTTVALTQDNRLLVEEIGPYASQSAGKEYYKHIEKIIVDNDVYEKSLEGERTFDIN
YQGIKINADLIKDGKHELTIVNKKDGDILITFIKKGDKVTFISAQKLGTTDHQDSLKKDVLSDKTVPQNQGTQKVVKSGKNTANLSLITKL
SQEDGAILFPEIDRYSDNKQIKALTQQITKVTVNGTVYKDLISDSVKDTNGWVSNMTGLHLGTKAFKDGENTIVISSKGFEDVTITVTKK
DGQIHFVSAKQKQHVTAEDRQSTKLDVTTLEKAIKEADAIIAKESNKDAVKDLAEKLQVIKDSYKEIKDSKLLADTHRLLKDTIESYQAGE
VSINNLTEGTYTLNFKANKENSEESSMLQGAFDKRAKLVVKADGTMEISMLNTALGQFLIDFSIESKGTYPAAVRKQVGQKDINGSYIR
SEFTMPIDDLDKLHKGAVLVSAMGGQESDLNHYDKYTKLDMTFSKTVTKGWSGYQVETDDKEKGVGTERLEKVLVKLGKDLDGDGK
LSKTELEQIRGELRLDHYELTDISLLKHAKNITELHLDGNQITEIPKELFSQMKQLRFLNLRSNHLTYLDKDTFKSNAQLRELYLSSNFIH
SLEGGLFQSLHHLEQLDLSKNRIGRLCDNPFEGLSRLTSLGFAENSLEEIPEKALEPLTSLNFIDLSQNNLALLPKTIEKLRALSTIVASR
NHITRIDNISFKNLPKLSVLDLSTNEISNLPNGIFKQNNQLTKLDFFNNLLTQVEESVFPDVETLNLDVKFNQIKSVSPKVRALIGQHKLTP
QKHIAKLEASLDGEKIKYHQAFSLLDLYYWEQKTNSAIDKELVSVEEYQQLLQEKGSDTVSLLNDMQVDWSIVIQLQKKASNGQYVTV
DEKLLSNDPKDDLTGEFSLKDPGTYRIRKALITKKFATQKEHIYLTSNDILVAKGPHSHQKDLVENGLRALNQKQLRDGIYYLNASMLKT
DLASESMSNKAINHRVTLVVKKGVSYLEVEFRGIKVGKMLGYLGELSYFVDGYQRDLAGKPVGRTKKAEVVSYFTDVTGLPLADRYG
KNYPKVLRMKLIEQAKKDGLVPLQVFVPIMDAISKGSGLQTVFMRLDWASLTTEKAKVVKETNNPQENSHLTSTDQLKGPQNRQQEK
TPTSPPSAATGIANLTDLLAKKATGQSTQETSKTDDTDKAEKLKQLVRDHQTSIEGKTAKDTKTKKSDKKHRSNQQSNGEESSSRYH
LIAGLSSFMIVALGFIIGRKTLFK
SPy1801
Seq ID 224
MNKNKLLRVAMLLSLLAPTAESMTVLAQDVMLETHKATTNETSDSSSKEENNKNAAPTTSDKTDQGPLDASAETNSNSLVNADDKKR
SDSSQSAIGSSDNKAEAENQVDDKSTDHSKSTDHSKPTDQPKPSPSKVDTAPASSLSKQLPEARTPIQSLSPYVSDLDLSEIDIPSVN
TYAAYVEHWSGKNAYTHHLLSRRYGIKADQIDSYLKSTGIAYDSTRINGEKLLQWEKKSGLDVRAIVAIAMSESSLGTQGIATLLGANM
FGYAAFDLDPTQASKFNDDSAIVKMTQDTIIKNKNSNFALQDLKAAKFSRGQLNFASDGGVYFTDTTGSGKRRAQIMEDLDKWIDDH
GGTPAIPAELKVQSSASFASVPAGYKLSKSYDVLGYQASSYAWGQCTWYVYNRAKELGYQFDPFMGNGGDWKYKVGYALSKTPKV
GYAISFAPGQAGADGTYGHVSIVEDVRKDGSILISESNCIGLGKISYRTFTAQQAEQLTYVIGKSKN
SPy1813
Seq ID 225
MDKHLLVKRTLGCVCAATLMGAALATHHDSLNTVKAEEKTVQVQKGLPSIDSLHYLSENSKKEFKEELSKAGQESQKVKEILAKAQQA
DKQAQELAKMKIPEKIPMKPLHGSLYGGYFRTWHDKTSDPTEKDKVNSMGELPKEVDLAFIFHDWTKDYSLFWKELATKHVPKLNKQ
GTRVIRTIPWRFLAGGDNSGIAEDTSKYPNTPEGNKALAKAIVDEYVYKYNLDGLDVDVEHDSIPKVDKKEDTAGVERSIQVFEEIGKLI
GPKGVDKSRLFIMDSTYMADKNPLIERGAPYINLLLVQVYGSQGEKGGWEPVSNRPEKTMEERWQGYSKYIRPEQYMIGFSFYEEN
AQEGNLWYDINSRKDEDKANGINTDITGTRAERYARWQPKTGGVKGGIFSYAIDRDGVAHQPKKYAKQKEFKDATDNIFHSDYSVSK
ALKTVMLKDKSYDLIDEKDFPDKALREAVMAQVGTRKGDLERFNGTLRLDNPAIQSLEGLNKFKKLAQLDLIGLSRITKLDRSVLPANM
KPGKDTLETVLETYKKDNKEEPATIPPVSLKVSGLTGLKELDLSGFDRETLAGLDAATLTSLEKVDISGNKLDLAPGTENRQIFDTMLST
ISNHVGSNEQTVKFDKQKPTGHYPDTYGKTSLRLPVANEKVDLQSQLLFGTVTNQGTLINSEADYKAYQNHKIAGRSFVDSNYHYNN
FKVSYENYTVKVTDSTLGTTTDKTLATDKEETYKVDFFSPADKTKAVHTAKVIVGDEKTMMVNLAEGATVIGGSADPVNARKVFDGQL
GSETDNISLGWDSKQSIIFKLKEDGLIKHWRFFNDSARNPETTNKPIQEASLQIFNIKDYNLDNLLENPNKFDDEKYWITVDTYSAQGE
RATAFSNTLNNITSKYWRVVFDTKGDRYSSPVVPELQILGYPLPNADTIMKTVTTAKELSQQKDKFSQKMLDELKIKEMALETSLNSKI
FDVTAINANAGVLKDCIEKRQLLKK
SPy1821
Seq ID 226
MIEASKLKAGMTFEAEGKLIRVLEASHHKPGKGNTIMRMKLRDVRTGSTFDTTYRPDEKFEQAIIETVPAQYLYKMDDTAYFMNTDTY
DQYEIPVANVEQELLYILENSDVKIQFYGSEVIGVTVPTTVELTVAETQPSIKGATVTGSGKPATLETGLVVNVPDFIEAGQKLIINTAEG
TYVSRA
SPy1916
Seq ID 227
MTKTLPKDFIFGGATAAYQAEGATHTDGKGPVAWDKYLEDNYWYTAEPASDFYNRYPVDLKLSEEFGVNGIRISIAWSRIFPTGKGEV
NPKGVEYYHNLFAECHKRHVEPFVTLHHFDTPEALHSDGDFLNRENIEHFVNYAEFCFKEFSEVNYWTTFNEIGPIGDGQYLVGKFPP
GIQYDLAKVFQSHHNMMVSHARAVKLFKDSGYSGEIGVVHALPTKYPFDANNPDDVRAAELEDIIHNKFILDATYLGKYSDKTMEGVN
HILEVNGGELDLREEDFAALDAAKDLNDFLGINYYMSDWMQAFDGETEIIHNGKGEKGSSKYQIKGVGRRKAPVDVPKTDWDWIIFP
QGLYDQIMRVKADYPNYKKIYITENGLGYKDEFVDNTVYDGGRIDYVKKHLEVISDAISDGANVKGYFMWSLMDVFSWSNGYEKRYG
LFYVDFETQERYPKKSAYWYKKVAETQVIE
SPy1972
Seq ID 228
MKKKVNQGSKRYQYLLKKWGIGFVIAATGTVVLGCTPSILTHQVAAKTIVGLARDEAQQGDGNAKSGDGLQSSSKEAKPVLDSSSAN
PASIAEHHLRMHFKTLPAGESLGSLGLWVWGDVDQPSKDWPNGAITMTKAKKDDYGYYLDVPLAAKHRQQVSYLINNKAGENLSKD
QHISLLTPKMNEVWIDENYHAHAYRPLKKGYLRINYHNQSGHYDNLAVWTFKDVKTPTTDWPNGLDLSHKGHYGAYVDVPLKEGAN
EIGFLILDKSKTGDAIKVQPKDYLFKELDNHTQVFVKDTDPKVYNNPYYIDQVSLKGAEQTTPNEIKAIFTTLDGLDEDAVKQNIKITD KA
GKTVAIDELTLDRDKSVMTLKGDFKAQGAVYTVTFGEVSQVARQSWQLKDKLYAYDGELGATLAKDGSVDLALWSPSADTVKVVVY
DKQDQTRVVGQADLTKSDKGVWRAHLTSDSVKGISDYTGYYYLYEITRGQEKVMVLDPYAKSLAAWNDATATDDIKTAKAAFIDPSK
LGPTGLDFAKINNFKKREDAIIYEAHVRDFTSDKALEGKLTHPFGTFSAFVEQLDYLKDLGVTHVQLLPVLSYFYANELDKSRSTAYTS
SDNNYNWGYDPQHYFALSGMYSANPNDPALRIAELKNLVNEIHKRGMGVIFDVVYNHTARTYLFEDLEPNYYHFMNADGTARESFG
GGRLGTTHAMSRRILVDSITYLTREFKVDGFRFDMMGDHDAAAIEQAFKAAKAINPNTIMIGEGWRTYQGDEGKKEIAADQDWMKAT
NTVGVFSDDIRNTLKSGFPNEGTAAFITGGAKNLEGLFKTIKAQPGNFEADAPGDVVQYIAAHDNLTLHDVIAKSINKDPKVAEEEIHKR
IRLGNTMILTAQGTAFIHSGQEYGRTKQLLNPDYKTKASDDKVPNKATLIDAVAQYPYFIHDSYDSSDAVNHFDWAKATDSIAHPISNQ
TKAYTQGLIALRRSTDAFTKATKAEVDRDVTLITQAGQDGIQQEDLIMGYQTVASNGDRYAVFVNADNKTRKVVLPQAYRYLLGAQVL
VDAEQAGVTAIAKPKGVQFTKEGLTIEGLTALVLKVSSKTANPSQQKSQTDNHQTKTPDGSKDLDKSLMTRPKRAKTNQKLPKTGEA
SSKGLLAAGIALLLLAISLLMKRQKD
SPy1979
Seq ID 229
MKNYLSIGVIALLFALTFGTVKSVQAIAGYGWLPDRPPINNSQLVVSMAGIVEGTDKKVFINFFEIDLTSQPAHGGKTEQGLSPKSKPFA
TDNGAMPHKLEKADLLKAIQKQLIANVHSNDGYFEVIDFASDATITDRNGKVYFADKDGSVTLPTQPVQEFLLKGHVRVRPYKEKPVQ
NQAKSVDVEYTVQFTPLNPDDDFRPGLKDTKLLKTLAIGDTITSQELLAQAQSILNKTHPGYTIYERDSSIVTHDNDIFRTILPMDQEFTY
HVKNREQAYEINPKTGIKEKTNNTDLVSEKYYVLKQGEKPYDPFDRSHLKLFTIKYVDVNTNELLKSEQLLTASERNLDFRDLYDPRDK
AKLLYNNLDAFDIMDYTLTGKVEDNHDKNNRVVTVYMGKRPKGAKGSYHLAYDKDLYTEEERKAYSYLRDTGTPIPDNPKDK
SPy1983
Seq ID 230
MLTSKHHNLNKLVWRYGLTSAAAVLLAFGGGASSVKAEVSSTTMTSSQRESKIKEIEESLKKYPEVSNEKFWERKWYGTYFKEEDFQ
KELKDFTEKRLKEILDLIGKSGIKGDRGETGPAGPAGPQGKTGERGAQGPKGDRGEQGIQGKAGEKGERGEKGDKGETGERGEKG
EAGIQGPQGEAGKDGAPGKDGAPGEKGEKGDRGETGAQGPVGPQGEKGETGAQGPAGPQGEAGKPGEQGPAGPQGEAGQPGE
KAPEKSPEGEAGQPGEKAPEKSKEVTPAAEKPADKEANQTPERRNGNMAKTPVANNHRRLPATGEQANPFFTAAAVAVMTTAGVL
AVTKRKENN
SPy1991
Seq ID 231
MILLIDNYDSFTYNLAQYLSEFDETIVLYNQDPNLYDMAKKANALVLSPGPGWPKEANQMPKLIQDFYQTKPILGVCLGHQAIAETLGG
TLRLAKRVMHGRQSTIETQGPASLFRSLPQEITVMRYHSIVVDQLPKGFSVTARDCDDQEIMAFEHHTLPLFGLQFHPESIGTPDGMT
MIANFIAAIPR
SPy2000
Seq ID 232
VSKYLKYFSIITLFLTGLILVACQQQKPQTKERQRKQRPKDELVVSMGAKLPHEFDPKDRYGVHNEGNITHSTLLKRSPELDIKGELAK
TYHLSEDGLTWSFDLHDDFKFSNGEPVTADDVKFTYDMLKADGKAWDLTFIKNVEVVGKNQVNIHLTEAHSTFTAQLTEIPIVPKKHY
NDKYKSNPIGSGPYMVKEYKAGEQAIFVRNPYWHGKKPYFKKWTWVLLDENTALAALESGDVDMIYATPELADKKVKGTRLLDIPSN
DVRGLSLPYVKKGVITDSPDGYPVGNDVTSDPAIRKALTIGLNRQKVLDTVLNGYGKPAYSIIDKTPFWNPKTAIKDNKVAKAKQLLTK
AGWKEQADGSRKKGDLDAAFDLYYPTNDQLRANLAVEVAEQAKALGITIKLKASNWDEMATKSHDSALLYAGGRHHAQQFYESHHP
SLAGKGWTNITFYNNPTVTKYLDKAMTSSDLDKANEYWKLAQWDGKTGASTLGDLPNVWLVSLNHTYIGDKRINVGKQGVHSHGHD
WSLLTNIAEWTWDESTK
SPy2006
Seq ID 233
VKKTYGYIGSVAAILLATHIGSYQLGKHHMGSATKDNQIAYIDDSKGKAKAPKTNKTMDQISAEEGISAEQIVVKITDQGYVTSHGDHYH
FYNGKVPYDAIISEELLMTDPNYRFKQSDVINEILDGYVIKVNGNYYVYLKPGSKRKNIRTKQQIAEQVAKGTKEAKEKGLAQVAHLSK
EEVAAVNEAKRQGRYTTDDGYIFSPTDIIDDLGDAYLVPHGNHYHYIPKKDLSPSELAAAQAYWSQKQGRGARPSDYRPTPAPAPGR
RKAPIPDVTPNPGQGHQPDNGGYHPAPPRPNDASQNKHQRDEFKGKTFKELLDQLHRLDLKYRHVEEDGLIFEPTQVIKSNAFGYVV
PHGDHYHIIPRSQLSPLEMELADRYLAGQTEDDDSGSDHSKPSDKEVTHTFLGHRIKAYGKGLDGKPYDTSDAYVFSKESIHSVDKS
GVTAKHGDHFHYIGFGELEQYELDEVANWVKAKGQADELAAALDQEQGKEKPLFDTKKVSRKVTKDGKVGYMMPKDGKDYFYARD
QLDLTQIAFAEQELMLKDKKHYRYDIVDTGIEPRLAVDVSSLPMHAGNATYDTGSSFVIPHIDHIHVVPYSWLTRDQIATIKYVMQHPEV
RPDIWSKPGHEESGSVIPNVTPLDKRAGMPNWQIIHSAEEVQKALAEGRFATPDGYIFDPRDVLAKETFVWKDGSFSIPRADGSSLRT
INKSDLSQAEWQQAQELLAKKNAGDATDTDKPKEKQQADKSNENQQPSEASKEEEKESDDFIDSLPDYGLDRATLEDHINQLAQKA
NIDPKYLIFQPEGVQFYNKNGELVTYDIKTLQQINP
SPy2009
Seq ID 234
MRRAENNKHSRYSIRKLSVGVTSIAIASLFLGKVAYAVDGIPPISLTQKTTATTSENWHHIDKDGLIPLGISLEAAKEEFKKEVEESRLSE
AQKETYKQKIKTAPDKDKLLFTYHSEYMTAVKDLPASTESTTQPVEAPVQETQASASDSMVTGDSTSVTTDSPEETPSSESPVAPALS
EAPAQPAESEEPSVAASSEETPSPSTPAAPETPEEPAAPSPSPESEEPSVAAPSEETPSPETPEEPAAPSQPAESEESSVAATTSPS
PSTPAESETQTPPAVTKDSDKPSSAAEKPAASSLVSEQTVQQPTSKRSSDKKEEQEQSYSPNRSLSRQVRAHESGKYLPSTGEKAQ
PLFIATMTLMSLFGSLLVTKRQKETKK
SPy2010
Seq ID 235
LRKKQKLPFDKLAIALMSTSILLNAQSDIKANTVTEDTPATEQAVETPQPTAVSE EAPSSKETKTPQTPDDAEETIADDANDLAPQAPA
KTADTPATSKATIRDLNDPSQVKTLQEKAGKGAGTVVAVIDAGFDKNHEAWRLTDKTKARYQSKEDLEKAKKEHGITYGEWVNDKVA
YYHDYSKDGKTAVDQEHGTHVSGILSGNAPSETKEPYRLEGAMPEAQLLLMRVEIVNGLADYARNYAQAIIDAVNLGAKVINMSFGNA
ALAYANLPDETKKAFDYAKSKGVSIVTSAGNDSSFGGKTRLPLADHPDYGVVGTPAAADSTLTVASYSPDKQLTETATVKTADQQDK
EMPVLSTNRFEPNKAYDYAYANRGMKEDDFKDVKGKIALIERGDIDFKDKIANAKKAGAVGVLIYDNQDKGFPIELPNVDQMPAAFISR
KDGLLLKENPQKTITFNATPKVLPTASGTKLSRFSSWGLTADGNIKPDIAAPGQDILSSVANNKYAKLSGTSMSAPLVAGIMGLLQKQY
ETQYP DMTPSERLDLAKKVLMSSATALYDEDEKAYFSPRQQGAGAVDAKKASAATMYVTDKDNTSSKVHLNNVSDKFEVTVTVHNK
SDKPQELYYQATVQTDKVDGKLFALAPKALYETSWQKITIPANSSKQVTIPIDVSQFSKDLLAPMKNGYFLEGFVRFKQDPTKEELMSI
PYIGFRGDFGNLSALEKPIYDSKDGSSYYHEANSDAKDQLDGDGLQFYALKNNFTALTTESNPWTIIKAVKEGVENIEDIESSEITETIFA
GTFAKQDDDSHYYIHRHANGKPYAAISPNGDGNRDYVQFQGTFLRNAKNLVAEVLDKEGNVVWTSEVTEQVVKNYNNDLASTLGST
RFEKTRWDGKDKDGKVVANGTYTYRVRYTPISSGAKEQHTDFDVIVDNTTPEVATSATFSTEDRRLTLASKPKTSQPVYRERIAYTY
MDEDLPTTEYISPNEDGTFTLPEEAETMEGATVPLKMSDFTYVVEDMAGNITYTPVTKLLEGHSNKPEQDGSDQAPDKKPETKPEQD
GSGQAPDKKPETKPEQDGSGQTPDKKPETKPEQDGSGQTPDKKPETKPEKDSSGQTPGKTPQKGQPSRTLEKRSSKRALATKAST
KDQLPTTNDKDTNRLHLLKLVMTTFFLGLVAHIFKTKRTED
SPy2016
Seq ID 236
MNIRNKIENSKTLLFTSLVAVALLGATQPVSAETYTSRNFDWSGDDWSGDDWPEDDWSGDGLSKYDRSGVGLSQYGWSKYGWSS
DKEEWPEDWPEDDWSSDKKDETEDKTRPPYGEALGTGYEKRDDWGGPGTVATDPYTPPYGGALGTGYEKRDDWGGPGTVATDP
YTPPYGGALGTGYEKRDDWRGPGHIPKPENEQSPNPLHIPEPPQIEWPQWNGFDGLSFGPSDWGQSEDTPPSEPRVPEKPQHTP
QKNPQESDFDRGFSAGLKAKNSGRGIDFEGFQYGGWSDEYKKGYMQAFGTPYTPSAT
SPy2018
Seq ID 237
MAKNNTNRHYSLRKLKTGTASVAVALTVLGAGFANQTEVKANGDGNPREVIEDLAANNPAIQNIRLRYENKDLKARLENAMEVAGRD
FKRAEELEKAKQALEDQRKDLETKLKELQQDYDLAKESTSWDRQRLEKELEEKKEALELAIDQASRDYHRATALEKELEEKKKALELA
IDQASQDYNRANVLEKELETITREQEINRNLLGNAKLELDQLSSEKEQLTIEKAKLEEEKQISDASRQSLRRDLDASREAKKQVEKDLA
NLTAELDKVKEDKQISDASRQGLRRDLDASREAKKQVEKDLANLTAELDKVKEEKQISDASRQGLRRDLDASREAKKQVEKALEEAN
SKLAALEKLNKELEESKKLTEKEKAELQAKLEAEAKALKEQLAKQAEELAKLRAGKASDSQTPDTKPGNKAVPGKGQAPQAGTKPNQ
NKAPMKETKRQLPSTGETANPFFTAAALTVMATAGVAAVVKRKEEN
SPy2025
Seq ID 238
MKKRKLLAVTLLSTILLNSAVPLVVADTSLRNSTSSTDQPTTADTDTDDESETPKKDKKSKETASQHDTQKDHKPSHTHPTPPSNDTK
QTDQASSEATDKPNKDKNDTKQPDSSDQSTPSPKDQSSQKESQNKDGRPTPSPDQQKDQTPDKTPEKSADKTPEKGPEKATDKTP
EPNRDAPKPIQPPLAAAPVFIPWRESDKDLSKLKPSSRSSAAYVRHWTGDSAYTHNLLSRRYGITAEQLDGFLNSLGIHYDKERLNGK
RLLEWEKLTGLDVRAIVAIAMAESSLGTQGVAKEKGANMFGYGAFDFNPNNAKKYSDEVAIRHMVEDTIIANKNQTFERQDLKAKKW
SLGQLDTLIDGGVYFTDTSGSGQRRADIMTKLDQWIDDHGSTPEIPEHLKITSGTQFSEVPVGYKRSQPQNVLTYKSETYSFGQCTW
YAYNRVKELGYQVDRYMGNGGDWQRKPGFVTTHKPKVGYVVSFAPGQAGADATYGHVAVVEQIKEDGSILISESNVMGLGTISYRT
FTAEQASLLTYVVGDKLPRP
SPy2039
Seq ID 239
MNKKKLGVRLLSLLALGGFVLANPVFADQNFARNEKEAKDSAITFIQKSAAIKAGARSAEDIKLDKVNLGGELSGSNMYVYNISTGGFV
IVSGDKRSPEILGYSTSGSFDANGKENIASFMESYVEQIKENKKLDTTYAGTAEIKQPVVKSLLDSKGIHYNQGNPYNLLTPVIEKVKPG
EQSFVGQHAATGCVATATAQIMKYHNYPNKGLKDYTYTLSSNNPYFNHPKNLFAAISTRQYNWNNILPTYSGRESNVQKMAISELMA
DVGISVDMDYGPSSGSAGSSRVQRALKENFGYNQSVHQINRGDFSKQDWEAQIDKELSQNQPVYYQGVGKVGGHAFVIDGADGRN
FYHVNWGWGGVSDGFFRLDALNPSALGTGGGAGGFNGYQSAVVGIKP
SPy2043
Seq ID 240
MNLLGSRRVFSKKCRLVKF SMVALVSATMAVTTVTLENTALARQTQVSNDVVLNDGASKYLNEALAWTFNDSPNYYKTLGTSQITPA
LFPKAGDILYSKLDELGRTRTARGTLTYANVEGSYGVRQSFGKNQNPAGWTGNPNHVKYKIEWLNGLSYVGDFWNRSHLIADSLGG
DALRVNAVTGTRTQNVGGRDQKGGMRYTEQRAQEWLEANRDGYLYYEAAPIYNADELIPRAVVVSMQSSDNTINEKVLVYNTANGY
TINYHNGTPTQK
SPy2059
Seq ID 241
MRFLELLQKKFFPKAYQEKQFLMHQKTRLTPQHNQKQYSPNANHLDSSATKNSEQDPATALQRSRAYEGSPKSRPAWLQKLEAVLP
SPQRPIRRFWRRYHIGKLLMILIGTLVLLLGSYLFYLSKTAKVSDLQDALKATTVIYDHKGEYAGSLSGQKGSYVELNAISDDLENAVIAT
EDRTFYSNSGINLKRFLLAVVTAGRFGGGSTITQQLAKNAYLSQDQTIKRKAREFFLALELTKKYSKKDILTMYLNNSYFGNGVWGVE
DASQKYFGTTAANLTLDEAATLAGMLKGPEIYNPYHSLKNATHRRDTVLGAMVDAKKITQTKAQQARAVGLKNRLADTYVGKTDDYK
YPSYFDAVISEAIATYGLSEKDIVNNGYKVYTELDQNYQTGMQTTFNNDELFPVSAYDGSSAQAASVALDPKTGGVRGLIGRVNSSE N
PTFRSFNYATQAKRSPASTIKPLVVYAPAVASGWSIEKELPNTVQDFDGYQPHNYGNYESEDVPMYQALANSYNIPAVSTLNDIGIDK
AFTYGKTFGLDMSSAKKELGVALGGSVTTNPLEMAQAYAAFANNGVIHPAHLINRIENARGEVLKTFTDKAKRVVSQSVADKMTAMM
LGTFSNGTAVNANVYGYTLAGKTGTTETNFNPDLAGDQWVIGYTPDVVISQWVGFNQTDENHYLTDSSAGTASAIFSTQASYILPYTK
GSQFHVDNAYAQNGISAVYGVNETGNQSGVDTQSIIDGLRKSAQEASQSLSKAVDQSGLRDKAQSIWKEIVDYFR
SPy2110
Seq ID 242
MVSLEEDKVTVQPDIKVIKRDGRLVNFDSTKIYSALLKASMKVTRMSPLVEAKLEAISDRIIAEIIERFPTNIKIYEIQNIVEHKLLAANEYAI
AKEYINYRTQRDFARSQATDINFSIDKLINKDQTVVNENANKDSDVFNTQRDLTAGIVGKSIGLKMLPSHVANAHQKGDIHYHDLDYSP
YTPMTNCCLIDFKGMLANGFKIGNAEVESPKSIQTATAQISQIIANVASSQYGGCTADRIDEFLAPYAELNFKKHMADAKKWIVETKRE
SYAFEKTQKDIYDAMQSLEYEINTLFTSNGQTPFTSLGFGLGTSWFEREIQKAILTIRINGLGSEHRTAIFPKLIFTVKRGLNLEPDSPNY
DIKTLALECATKRMYPDMLSYDKIIDLTGSFKSPMGCRSFLQGWKDENGQDVTSGRMNLGVVTLNLPRIAMESNGDMDKFWELFNE
RMLISKDALIYRVERVTEAKPANAPILYQYGAFGKRLEKTGNVNDLFKNRRATVSLGYIGLYEVASVFYGGQWEGNPDAKAFTLSIVKA
MKQACEDWSDEYGYHFSVYSTPSESLTDRFCRLDTEKFGIVTDITDKEYYTNSFHYDVRKSPTPFEKLDFEKDYPEAGASGGFIHYC
EYPVLQQNPKALEAVWDYAYDRVGYLGTNTPIDKCYNCQFEGDFTPTERGFTCPNCGNNDPKTVDVVKRTCGYLGNPQARPMVNG
RHKEISARVKHMNGSTIKYPGL
SPy2127
Seq ID 243
MRRNYSRVIDELRTDYGLNLVAIGQRLGTDPRTVGKWWQGKHNPNQESRKKLNRLYREVKETMMTQVNIFEEANDNTKQVMQVITT
TNFHGQPLDIYGDIQEPLFLARAVAEMIDYTKTSQGYYDVQAMLRKVDEDEKLKGMALEGTTKNFRSGQKVWFLTEHGLYEVLMRSN
KPKAKEFRKAVKNILKEIRLNGYYMQGELVQELAQPSTQKLPGISDLTYILNKLADLVDMDNLADISNGIDRVQQLVKLISL
SPy2191
Seq ID 244
MFKKENLKQRYFNFGLVALALTILAIIFAFSSKNADTKSYAKKSESKMVTIDKAPKNNHAITKEESKEKAKSIASEPIPTVENSVAPTVTE
EVPVVQQEVTQTVQQVSSVAYNPNNVVLSNGNTAGIVGSQAAAQMAAATGVPQSTWEHIIARESNGNPNAANASGASGLFQTMPG
WGSTATVEDQVNAALKAYSAQGLSAWGY
SPy2211
Seq ID 245
MKNNNKWIIAGLASFLFPLSIIFIILLSMGIYYNSDKTILASDAFHQYVIFAQNFRNIMHGSDSFFYTFTSGLGINFYALMCYYLGSFFSPLL
FFFNLTSMPDAIYLFTLIKFGLIGLAACYSFHRLYPKISAFLMISISVFYSLMSFLTSQMELNSWLDVFILLPLVILGLNKLITENKTRTYYLS
ISLLFIQNYYFGYMIALFCILYALVCLLRLNDFNKMFIAFVRFTAVSICAALTSALVILPTYLDLSTYGENLSPIKQLVTNNAWFLDIPAKLSI
GVYDTTKFNALPMIYVGLFPLMLSVIYFTLESIPLKIKLANACLLTFIIISFYLQPLDLFWQGMHSPNMFLHRYAWSFSIVILLLACETLSRL
KEVTQIKAGFAFIFLIILTSLPYSFSQQYNFLPLTLFLLSVFLLLGYTISLFSFRNSQIPSTFISAFILIFSLLESGLNTYYQLQGINKEWGFPS
RQIYNSQLKDINNLVNSVSKNSQPFFRMERLLPQTGNDSMKFNYYGISQFSSVRNRLSSSLLDRLGFQSKGTNLNLRYQNNTIIMDSL
LGIKYNLSEGPPNKFGFTKLKTSGNTTLYQNHYSSPLAILTRNVYKDVNLNVNTLDNQTKLLNQLSGKSLTYFNLQPAQLISGANQFNG
QISAQASDYQNSVTLNYQINIPKHSQLYVSIPNIIFSNPDAKEMRIQTDNHNFIYTTDNAYSFFDLGYFADAKVATFSFVFPKNKQISFKE
PHFYSLSIESYLEAMNSIKQKNVHTYAKSNTVITDYNSKTKGSLIFTLPYDKGWSAQKDGKNLPVKKAQGGFLSVTIPKGKGRVILTFIP
NGFKLGLSLSCVGIIAYMLLYKYIDIKSKLL
ARF0450
Seq ID 246
fsrflptrrdysslwsascrnehynsqhhhgvgtvsskqnprpl
ARF0569
Seq ID 247
sfiwekmpegs
ARF0694
Seq ID 248
kgeektevtkekllelarwikdisddtdektedeayydgdgteettv
ARF0700
Seq ID 249
lyqkkrlkksqrlsklmtsrllnkalmtskie
ARF1007
Seq ID 250
fvlqkyslwq
ARF1145
Seq ID 251
pismqkaiqviaimveqnvwilskrlllnvlrnfsvphlpmfkpipevkpmqqliwp
ARF1208
Seq ID 252
frnifcdfsccssfvscyqklkrkgynrtskkrfl
ARF1262
Seq ID 253
wvtgckwwffc
ARF1294
Seq ID 254
lmlkakktnsklvtlsqptkkfnlqklfnqtnllkplslwvllqttls
ARF1316
Seq ID 255
prngwgrferyerlgrtrhdhvncysrngicspss
ARF1352
Seq ID 256
lmncpslhflqpkhkeqpvlkmlknyeskkqlvfk
ARF1481
Seq ID 257
kttkcnylkrpklvesrlqrtrfrricsrkhgryrrwirrflifltnkskkilvkrrvkrlllsllvtapkeskkmelsqflig
ARF1557
Seq ID 258
grrlpprlpqekskwllpy
ARF1629
Seq ID 259
fwspgsryfvrdandcqrtgfskcdfswgtkcryflkfagfssvrknvsivntgcwsgrpcp
ARF1654
Seq ID 260
cvpsvkcsimiqintplsilfpntlvqagvifrvypigfplfllewqksqq
ARF2027
Seq ID 261
sdyfrhhapflkwlrsaknnskdircpyyyangir
ARF2093
Seq ID 262
llllkqtsklnlllkanqkrsgtkssqvkwtasclttlkltkltlflhkftswttakllkltltq
ARF2207
Seq ID 263
hlfvkdvwstlkiwercsvcykkvvkkqelwqprlyqk
CRF0038
Seq ID 264
lyapqslsnpfldsipcdq
CRF0122
Seq ID 265
nrrdfldnvvnlirvteplgtslvfdnfinraahininniglgiglneisctfqpfcvttk
CRF0406
Seq ID 266
qaplddhhnkptywsgyl
CRF0416
Seq ID 267
yflkktplkaakswllspfgemaktgfpwaffskinlpsaflkvpsvcrplseivlvdtlvseprvtspvkclpt
CRF0507
Seq ID 268
sknkrntdtgcnngkgsksvshnhsknnhakhisenakeaaisrynlpnersnhitntsscknss
CRF0549
Seq ID 269
lfihrsrlildflvinfslfvqiyddfing
CRF0569
Seq ID 270
sfiwekrnpegs
CRF0628
Seq ID 271
ikhltqakqrmpvskvlvanplgskgiadsiqlrmkplavkryrsslstr
CRF0727
Seq ID 272
ppppnlppacktvktvstagrpvlawistgiprpssttvmelsasiktli
CRF0742
Seq ID 273
enefnqyyqdakykshkerltintfkrqgylr
CRF0784
Seq ID 274
trvapyfpqalaifsepvfliasfkafpsssaastav
CRF0854
Seq ID 275
spftksvltpsalklssikrpvkppknpvavlamskrckmrltlmplppanlsslamrftdprfiwsiltikslegfkvtv
CRF0875
Seq ID 276
dhniywhyqlklsqvqtmtfppl
CRF0907
Seq ID 277
pnlldhflpnnphqnhkakld
CRF0979
Seq ID 278
qcliiinninfrhnkntpscilkraslhdiifhaetllw
CRF1068
Seq ID 279
eklfrtarqrynfkwvskkqimglvlivflksmrnsesklffyhifghidlsnasinnnqvrslqsllfhptvpskkhfshtgiiiwshhcfnlkftiifltfainknnhsmwtcplnvriikgfnahrlvnp
k
CRF1152
Seq ID 280
dncrgcclstnldnkthsftarfvtnccntf
CRF1203
Seq ID 281
igsinqlvsfalvtmdevktlfktlitptfeec
CRF1225
Seq ID 282
yqvcqlpegvpqlivnadqtwfykaktkqrtkkqwrsnq
CRF1236
Seq ID 283
ilakieisqktlitiiimrs
CRF1362
Seq ID 284
fpdvndkviardsrffgkertcllsnrfwevgdkkvetnpnndlgd
CRF1524
Seq ID 285
kfnvtllplcqnelvitlflfifchllllnrganissqkvikevr
CRF1525
Seq ID 286
etsallaarflrsadspkiiiclspkrsgtkssnslprsrppaikikrllskpdkaf
CRF1527
Seq ID 287
krlddctliffwcinlntlkrftfdtinffddnfwt
CRF1588
Seq ID 288
ewlsqqhshqflhdkrsyldtafdkgkctfhkkpvlllrwssylg
CRF1649
Seq ID 289
hdhlshqqslkqlgnlgldskhnhqndkyykesaahrg
CRF1749
Seq ID 290
vmlkapvklifktrsksssvilsinlslvmpalltktsiepklsiasltirlasdasetspemvttvtp
CRF1903
Seq ID 291
relsrfsssaillkplvkvppnrtmappnppaaplpgivcksmvvwqktflakllai
CRF1964
Seq ID 292
ehfqpnhqigqkwkkerpkptwsksdvahkqtyqsp
CRF2055
Seq ID 293
ksrslrtssitsstvfssptilvlspslvnicsgafcwdsglahhghlkgqpfkktvvripgps
CRF2091
Seq ID 294
rneintssptlsstki
CRF2096
Seq ID 295
cslaaftkfsksalvpksgltav
CRF2104
Seq ID 296
eamscqrccsfladsslirydlakssvviaamifkmawlscgrrcg
CRF2116
Seq ID 297
nfkarppgvvsgfpnitptfsrnwllkiaivfvllieadnlrma
CRF2153
Seq ID 298
ketchyshqhhvifqakfdmflphpdksghqncsidg
NRF0001
Seq ID 299
itllfkqtqqlfrkpslsnnlikhllvkrmslsmflkqkhqltkpkasmlrpqnnkttisfhhggdqtikihgptlts
NRF0003
Seq ID 300
sgrqdsnlrhlgpkpstlps

Claims (25)

1.一种用于治疗或预防化脓链球菌感染的药物组合物,其包含至少一种抗原并且任选地包含药用载体或赋形剂,所述抗原是一种超免疫血清反应性化脓链球菌(S.pyogenes)抗原,其与来自具有化脓链球菌感染的人的血清具有免疫反应性,所述抗原包含分离的化脓链球菌肽片段,其中所述肽片段是由SEQ ID NO.215的31-345或247-260区段的氨基酸组成。
2.按照权利要求1的药物组合物,其另外包含免疫刺激物质。
3.按照权利要求2的药物组合物,其中所述免疫刺激物质是聚阳离子聚合体,免疫刺激性脱氧核苷酸(ODN),含至少两个Lys-Leu-Lys基序的肽,刺激神经组织的化合物,清蛋白,或弗氏完全或不完全佐剂。
4.按照权利要求3的药物组合物,其中所述聚阳离子聚合体是聚阳离子肽。
5.按照权利要求1的药物组合物,其为疫苗。
6.抗体或其免疫学活性片段,所述抗体对于权利要求1中所述的抗原是免疫学特异的,所述免疫学活性片段是Fab片段。
7.按照权利要求6的抗体,其为单克隆抗体。
8.按照权利要求6的抗体,其为人抗体或人源化抗体。
9.按照权利要求6,7,或8的抗体在制备用于诊断动物体内化脓链球菌感染的诊断剂中的应用,所述诊断剂与包括在所述动物的组织或样品中的包含多肽或片段的链球菌抗原反应。
10.按照权利要求1中所述的抗原在制备用于诊断动物体内化脓链球菌感染的诊断剂中的应用,所述诊断剂与在所述动物的组织或样品中的抗体反应,该抗体对于化脓链球菌抗原是免疫学特异的。
11.一种用于治疗或预防化脓链球菌感染的药物组合物,其包含一种或多种按照权利要求6,7,或8的抗体并且任选地包含药用载体或赋形剂。
12.按照权利要求11的药物组合物在制备用于治疗动物中化脓链球菌感染的药物中的应用。
13.按照权利要求5的疫苗在制备用于对动物免疫以防止化脓链球菌感染的药物中的应用。
14.按照权利要求5的疫苗在制备用于在动物中刺激针对化脓链球菌的免疫应答的药物中的应用。
15.按照权利要求13的应用,其中所述药物另外包括免疫刺激性物质。
16.权利要求15的应用,其中所述免疫刺激物质是聚阳离子聚合体,免疫刺激性脱氧核苷酸(ODN),含至少两个Lys-Leu-Lys基序的肽,刺激神经组织的化合物,清蛋白,或弗氏完全或不完全佐剂。
17.权利要求16的应用,其中所述聚阳离子聚合体是聚阳离子肽。
18.权利要求14的应用,其中所述药物另外包括免疫刺激性物质。
19.权利要求18的应用,其中所述免疫刺激物质是聚阳离子聚合体,免疫刺激性脱氧核苷酸(ODN),含至少两个Lys-Leu-Lys基序的肽,刺激神经组织的化合物,清蛋白,或弗氏完全或不完全佐剂。
20.权利要求19的应用,其中所述聚阳离子聚合体是聚阳离子肽。
21.权利要求9的应用,其中所述动物是人类。
22.权利要求10的应用,其中所述动物是人类。
23.权利要求12的应用,其中所述动物是人类。
24.权利要求13的应用,其中所述动物是人类。
25.权利要求14的应用,其中所述动物是人类。
CN2004800056285A 2003-03-04 2004-03-02 化脓链球菌抗原 Expired - Fee Related CN1756843B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP03450061 2003-03-04
EP03450061.1 2003-03-04
PCT/EP2004/002087 WO2004078907A2 (en) 2003-03-04 2004-03-02 Streptococcus pyogenes antigens

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN2012100042823A Division CN102512670A (zh) 2003-03-04 2004-03-02 化脓链球菌抗原

Publications (2)

Publication Number Publication Date
CN1756843A CN1756843A (zh) 2006-04-05
CN1756843B true CN1756843B (zh) 2012-03-21

Family

ID=32946995

Family Applications (2)

Application Number Title Priority Date Filing Date
CN2012100042823A Pending CN102512670A (zh) 2003-03-04 2004-03-02 化脓链球菌抗原
CN2004800056285A Expired - Fee Related CN1756843B (zh) 2003-03-04 2004-03-02 化脓链球菌抗原

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN2012100042823A Pending CN102512670A (zh) 2003-03-04 2004-03-02 化脓链球菌抗原

Country Status (16)

Country Link
US (3) US7638136B2 (zh)
EP (8) EP2287313A1 (zh)
JP (2) JP2006520202A (zh)
CN (2) CN102512670A (zh)
AT (1) ATE441715T1 (zh)
AU (2) AU2004218284B2 (zh)
CA (1) CA2517518A1 (zh)
CY (1) CY1109683T1 (zh)
DE (1) DE602004022923D1 (zh)
DK (1) DK1601770T3 (zh)
ES (1) ES2330334T3 (zh)
HK (1) HK1084977A1 (zh)
PL (1) PL1601770T3 (zh)
PT (1) PT1601770E (zh)
SI (1) SI1601770T1 (zh)
WO (1) WO2004078907A2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107532156A (zh) * 2015-02-12 2018-01-02 汉莎医药有限公司 半胱氨酸蛋白酶

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2277895B1 (en) * 2000-10-27 2013-08-14 Novartis Vaccines and Diagnostics S.r.l. Nucleic acids and proteins from streptococcus groups A & B
JP4281861B2 (ja) 2001-02-21 2009-06-17 アイディ・バイオメディカル・コーポレイション Streptococcus pyogenesポリペプチドおよび対応するdnaフラグメント
US20070053924A1 (en) * 2002-08-26 2007-03-08 Herve Tettelin Conserved and specific streptococcal genomes
ITRM20030376A1 (it) 2003-07-31 2005-02-01 Univ Roma Procedimento per l'isolamento e l'espansione di cellule staminali cardiache da biopsia.
EP1648500B1 (en) 2003-07-31 2014-07-09 Novartis Vaccines and Diagnostics, Inc. Immunogenic compositions for streptococcus pyogenes
US8945589B2 (en) * 2003-09-15 2015-02-03 Novartis Vaccines And Diagnostics, Srl Immunogenic compositions for Streptococcus agalactiae
EP1784211A4 (en) 2004-07-29 2010-06-30 Novartis Vaccines & Diagnostic IMMUNOGENIC COMPOSITIONS FOR GRAMPOSITIVE BACTERIA SUCH AS STREPTOCOCCUS AGALACTIAE
WO2006042027A2 (en) * 2004-10-08 2006-04-20 Novartis Vaccines And Diagnostics Inc. Immunogenic and therapeutic compositions for streptococcus pyogenes
US11660317B2 (en) 2004-11-08 2023-05-30 The Johns Hopkins University Compositions comprising cardiosphere-derived cells for use in cell therapy
JP5222134B2 (ja) 2005-06-15 2013-06-26 ザ オハイオ ステート ユニバーシティー リサーチ ファウンデーション Her−2ペプチド
PT1916903E (pt) * 2005-08-26 2010-09-03 Danisco Utilização de genes associados a crispr (cas)
DK2054431T3 (da) * 2006-06-09 2012-01-02 Novartis Ag Konformere af bakterielle adhæsiner
JP2009542196A (ja) 2006-07-07 2009-12-03 インターセル アーゲー 小型の化膿連鎖球菌抗原およびそれらの使用
EP2094297A2 (en) * 2006-10-30 2009-09-02 Novartis AG Immunogenic and therapeutic compositions for streptococcus pyogenes
BRPI0604997A (pt) 2006-11-30 2007-05-22 Fundacao Zerbini vacina contra o estreptococo beta hemolìtico do grupo a, e respectivo processo de obtenção
GB0624874D0 (en) 2006-12-13 2007-01-24 Hansa Medical Ab Treatment
CA2684570A1 (en) * 2007-04-19 2008-10-30 Molecular Detection Inc. Methods, compositions and kits for detection and analysis of antibiotic-resistant bacteria
EP2173902A4 (en) * 2007-07-03 2013-01-09 Mt Sinai Hospital THERAPEUTIC AND DIAGNOSTIC AGENTS FOR STREPTOCOCCUS OF GROUP A
AU2013203022B2 (en) * 2007-09-12 2015-09-03 Glaxosmithkline Biologicals S.A. GAS57 mutant antigens and GAS57 antibodies
WO2009034473A2 (en) 2007-09-12 2009-03-19 Novartis Ag Gas57 mutant antigens and gas57 antibodies
RU2498994C2 (ru) * 2007-12-21 2013-11-20 Новартис Аг Мутантные формы стрептолизина о
CA2728258A1 (en) * 2008-06-20 2009-12-23 Wyeth Llc Compositions and methods of use of orf 554 from beta hemolytic streptococcal strains
WO2010053986A1 (en) * 2008-11-05 2010-05-14 Wyeth Multicomponent immunogenic composition for the prevention of beta-hemolytic streptococcal (bhs) disease
US20100234283A1 (en) 2009-02-04 2010-09-16 The Ohio State University Research Foundation Immunogenic epitopes, peptidomimetics, and anti-peptide antibodies, and methods of their use
GB0918392D0 (en) * 2009-10-20 2009-12-02 Novartis Ag Diagnostic and therapeutic methods
WO2013166281A1 (en) * 2012-05-02 2013-11-07 Cedars-Sinai Medical Center Bi-functional compositions for targeting cells to diseased tissues and methods of using same
US9845457B2 (en) 2010-04-30 2017-12-19 Cedars-Sinai Medical Center Maintenance of genomic stability in cultured stem cells
US9249392B2 (en) 2010-04-30 2016-02-02 Cedars-Sinai Medical Center Methods and compositions for maintaining genomic stability in cultured stem cells
EP2861238A4 (en) 2012-06-05 2016-03-16 Capricor Inc OPTIMIZED METHODS FOR GENERATING CARDIAC STEM CELLS FROM CARDIAC TISSUE AND THEIR USE IN CARDIAC THERAPY
CA2881394A1 (en) 2012-08-13 2014-02-20 Cedars-Sinai Medical Center Exosomes and micro-ribonucleic acids for tissue regeneration
AU2014214613A1 (en) * 2013-02-11 2015-08-13 University Of Tennessee Research Foundation Group A streptococcal M-related proteins and methods of use
US11357799B2 (en) 2014-10-03 2022-06-14 Cedars-Sinai Medical Center Cardiosphere-derived cells and exosomes secreted by such cells in the treatment of muscular dystrophy
US10329601B2 (en) * 2015-12-28 2019-06-25 Ionian Technologies, Inc. Nicking and extension amplification reaction (NEAR) of Streptococcus species
US11253551B2 (en) 2016-01-11 2022-02-22 Cedars-Sinai Medical Center Cardiosphere-derived cells and exosomes secreted by such cells in the treatment of heart failure with preserved ejection fraction
US11351200B2 (en) 2016-06-03 2022-06-07 Cedars-Sinai Medical Center CDC-derived exosomes for treatment of ventricular tachyarrythmias
EP3515459A4 (en) 2016-09-20 2020-08-05 Cedars-Sinai Medical Center CELLS DERIVED FROM CARDIOSPHERES AND THEIR EXTRACELLULAR VESICLES TO DELAY OR REVERSE AGING AND AGE-RELATED DISORDERS
AU2018255346A1 (en) 2017-04-19 2019-11-07 Capricor, Inc. Methods and compositions for treating skeletal muscular dystrophy
WO2018199775A1 (en) * 2017-04-26 2018-11-01 Auckland Uniservices Analytical and therapeutic methods and compositions, and uses thereof
EP3727351A4 (en) 2017-12-20 2021-10-06 Cedars-Sinai Medical Center MODIFIED EXTRACELLULAR VESICLES FOR IMPROVED TISSUE DELIVERY
JP2020117470A (ja) * 2019-01-25 2020-08-06 公益財団法人ヒューマンサイエンス振興財団 抗体並びに劇症型溶血性レンサ球菌感染症を予防及び/又は治療するための薬剤
CN110438261B (zh) * 2019-07-29 2022-08-12 华南农业大学 用于检测f亚群禽白血病病毒的分子标记、引物、试剂盒及应用
WO2023006825A1 (en) * 2021-07-29 2023-02-02 Université de Lausanne Novel pneumococcal polypeptide antigens
CN117417427A (zh) * 2023-09-11 2024-01-19 江苏省人民医院(南京医科大学第一附属医院) 一种检测内源性自体胰岛素介导的胰岛素抗体的试剂盒

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002034771A2 (en) * 2000-10-27 2002-05-02 Chiron Srl Nucleic acids and proteins from streptococcus groups a & b

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB234771A (en) * 1924-06-02 1926-02-11 S T Leigh And Company Ltd Improved means for inserting cork discs, or the like, into caps or covers
US4946778A (en) 1987-09-21 1990-08-07 Genex Corporation Single polypeptide chain binding molecules
US5475096A (en) 1990-06-11 1995-12-12 University Research Corporation Nucleic acid ligands
EP0464533B1 (de) 1990-06-28 1998-07-29 Hoechst Aktiengesellschaft Fusionsproteine mit immunglobulinanteilen, ihre Herstellung und Verwendung
JP3516681B2 (ja) * 1991-06-24 2004-04-05 カイロン コーポレイション C型肝炎ウイルス(hcv)ポリペプチド
CA2560114A1 (en) 1994-07-15 1996-02-01 The University Of Iowa Research Foundation Immunomodulatory oligonucleotides
EA199800046A1 (ru) * 1995-06-07 1998-06-25 Байокем Вэксинс Инк. Полипептид, последовательность днк, вакцинная композиция (варианты), антитело или его фрагмент, вакцина, применения указанных полипептида, последовательности днк и антитела или его фрагмента
RS50101B (sr) 1996-02-24 2009-01-22 Boehringer Ingelheim International Gmbh., Farmaceutski preparati za imunomodulaciju
JP2001504448A (ja) 1996-08-30 2001-04-03 フュルステ,イェンス,ペーター 核酸の鏡面対称選択および進化
US5849902A (en) 1996-09-26 1998-12-15 Oligos Etc. Inc. Three component chimeric antisense oligonucleotides
US5989912A (en) 1996-11-21 1999-11-23 Oligos Etc. Inc. Three component chimeric antisense oligonucleotides
JP3515314B2 (ja) * 1997-03-25 2004-04-05 扶桑薬品工業株式会社 ストレプトコッカス・ピオゲネス菌に起因する感染症の診断用プローブ
DE19742706B4 (de) 1997-09-26 2013-07-25 Pieris Proteolab Ag Lipocalinmuteine
DE19803453A1 (de) 1998-01-30 1999-08-12 Boehringer Ingelheim Int Vakzine
CZ303675B6 (cs) * 1998-12-23 2013-02-27 Id Biomedical Corporation Of Quebec Izolovaný polynukleotid, vektor, hostitelská bunka, zpusob produkce, izolovaný polypeptid, chimérový polypeptid, vakcinacní prostredek a pouzití
AT408721B (de) 1999-10-01 2002-02-25 Cistem Biotechnologies Gmbh Pharmazeutische zusammensetzung enthaltend ein antigen
AU4300601A (en) 1999-12-30 2001-07-16 Bristol-Myers Squibb Company Novel bacterial genes and proteins that are essential for cell viability and their uses
AT409085B (de) 2000-01-28 2002-05-27 Cistem Biotechnologies Gmbh Pharmazeutische zusammensetzung zur immunmodulation und herstellung von vakzinen
EP1272215B1 (en) 2000-04-14 2007-10-10 Intercell AG Pharmaceutical preparations comprising modified peptides
RU2293573C2 (ru) 2000-06-08 2007-02-20 Интерселл Аг Иммуностимулирующие олигодезоксинуклеотиды
AT410173B (de) 2000-06-08 2003-02-25 Cistem Biotechnologies Gmbh Antigene zusammensetzung
WO2002005448A1 (en) 2000-07-10 2002-01-17 Telefonaktiebolaget Lm Ericsson (Publ) Resource management in uncoordinated frequency hopping system
CA2418854A1 (en) 2000-08-17 2002-02-21 Jorg Fritz A vaccine which comprises at least one antigen and a cathelididin derived antimicrobial peptide or a derivative thereof
AT410635B (de) 2000-10-18 2003-06-25 Cistem Biotechnologies Gmbh Vakzin-zusammensetzung
AT410798B (de) 2001-01-26 2003-07-25 Cistem Biotechnologies Gmbh Verfahren zur identifizierung, isolierung und herstellung von antigenen gegen ein spezifisches pathogen
JP4281861B2 (ja) * 2001-02-21 2009-06-17 アイディ・バイオメディカル・コーポレイション Streptococcus pyogenesポリペプチドおよび対応するdnaフラグメント
WO2002077183A2 (en) * 2001-03-21 2002-10-03 Elitra Pharmaceuticals, Inc. Identification of essential genes in microorganisms
GB0107658D0 (en) * 2001-03-27 2001-05-16 Chiron Spa Streptococcus pneumoniae
CA2443493A1 (en) * 2001-04-13 2002-10-24 Wyeth Surface proteins of streptococcus pyogenes
EP2278013A1 (en) 2001-04-16 2011-01-26 Wyeth Holdings Corporation Streptococcus pneumoniae open reading frames encoding polypeptide antigens and uses thereof
FR2824074A1 (fr) * 2001-04-26 2002-10-31 Pasteur Institut Sequence du genome streptococcus agalactiae, application au developpement de vaccins, d'outils de diagnostic, et a l'identification de cibles therapeutiques
GB0210128D0 (en) * 2002-05-02 2002-06-12 Chiron Spa Nucleic acids and proteins from streptococcus groups A & B
NZ540731A (en) * 2002-12-20 2008-04-30 Univ New Jersey Med Compositions and methods for enzymatic detachment of bacterial and fungal biofilms
EP1648500B1 (en) * 2003-07-31 2014-07-09 Novartis Vaccines and Diagnostics, Inc. Immunogenic compositions for streptococcus pyogenes
JP2009542196A (ja) * 2006-07-07 2009-12-03 インターセル アーゲー 小型の化膿連鎖球菌抗原およびそれらの使用
EP2045869A1 (de) 2007-10-02 2009-04-08 Rohde & Schwarz GmbH & Co. KG Richtkoppler

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002034771A2 (en) * 2000-10-27 2002-05-02 Chiron Srl Nucleic acids and proteins from streptococcus groups a & b

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Ferrtti JJ. et al..Complete genome sequence of an M1strain of Streptococcuspyogenes.PNAS98 8.2001,98(8),4658-4663.
Ferrtti JJ. et al..Complete genome sequence of an M1strain of Streptococcuspyogenes.PNAS98 8.2001,98(8),4658-4663. *
Smoot JC.et al..Genome sequence and comparative microarray analysis ofserotype M18 group A Streptococcus strains associated withacute rheumatic fever outbreaks.PNAS99 7.2002,99(7),4668-4673.
Smoot JC.et al..Genome sequence and comparative microarray analysis ofserotype M18 group A Streptococcus strains associated withacute rheumatic fever outbreaks.PNAS99 7.2002,99(7),4668-4673. *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107532156A (zh) * 2015-02-12 2018-01-02 汉莎医药有限公司 半胱氨酸蛋白酶

Also Published As

Publication number Publication date
US8349336B2 (en) 2013-01-08
DE602004022923D1 (de) 2009-10-15
AU2004218284A1 (en) 2004-09-16
CN1756843A (zh) 2006-04-05
EP1601770B1 (en) 2009-09-02
US20060194751A1 (en) 2006-08-31
JP2006520202A (ja) 2006-09-07
EP2290082A1 (en) 2011-03-02
US20130122047A1 (en) 2013-05-16
PT1601770E (pt) 2009-12-07
WO2004078907A2 (en) 2004-09-16
DK1601770T3 (da) 2009-11-02
PL1601770T3 (pl) 2010-02-26
EP2287311A1 (en) 2011-02-23
JP2011015689A (ja) 2011-01-27
EP2287315A1 (en) 2011-02-23
EP1601770A2 (en) 2005-12-07
HK1084977A1 (en) 2006-08-11
WO2004078907A3 (en) 2005-03-10
CN102512670A (zh) 2012-06-27
CA2517518A1 (en) 2004-09-16
EP2287313A1 (en) 2011-02-23
US7638136B2 (en) 2009-12-29
ATE441715T1 (de) 2009-09-15
AU2004218284B2 (en) 2009-07-23
AU2009230772A1 (en) 2009-11-26
US20100255034A1 (en) 2010-10-07
EP2053125A1 (en) 2009-04-29
EP2287312A1 (en) 2011-02-23
AU2009230772B2 (en) 2013-07-18
SI1601770T1 (sl) 2010-01-29
ES2330334T3 (es) 2009-12-09
EP2053125B1 (en) 2014-04-30
CY1109683T1 (el) 2014-08-13
EP2287314A1 (en) 2011-02-23

Similar Documents

Publication Publication Date Title
CN1756843B (zh) 化脓链球菌抗原
US7700738B2 (en) Therapeutic monoclonal antibodies that neutralize botulinum neurotoxins
Berghman et al. Antibodies: an alternative for antibiotics?
CN101014620A (zh) 抗艰难梭菌毒素抗体及其用途
WO2004099242A2 (en) Streptococcus agalactiae antigens i + ii
US10259864B2 (en) Anti-campylobacter jejuni antibodies and uses therefor
CN102304527A (zh) 肠球菌抗原
EP1572121B1 (en) Therapeutic monoclonal antibodies that neutralize botulinum neurotoxins
AU2013206411A1 (en) Streptococcus Pyogenes Antigens
MEINKE et al. Patent 2517518 Summary
ARBABI-GHAHROUDI et al. Patent 2889398 Summary

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1084977

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1084977

Country of ref document: HK

C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120321

Termination date: 20140302